張貴蘭,王 健,潘云濤,楊代慶
1.中國(guó)科學(xué)技術(shù)信息研究所,北京 100038;2.中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100083)
當(dāng)前,我國(guó)已經(jīng)形成以20個(gè)國(guó)家科學(xué)數(shù)據(jù)共享平臺(tái)和1個(gè)科技資源共享網(wǎng)為數(shù)據(jù)匯聚和服務(wù)主體,以國(guó)家科技基礎(chǔ)條件平臺(tái)中心為居中協(xié)調(diào)的科學(xué)數(shù)據(jù)共享運(yùn)行體系,相關(guān)制度規(guī)范體系不斷健全,數(shù)據(jù)治理能力和共享服務(wù)水平持續(xù)提升,成為我國(guó)科技創(chuàng)新的有力支撐。在我國(guó)科學(xué)數(shù)據(jù)共享快速發(fā)展的同時(shí),科學(xué)數(shù)據(jù)安全正面臨著嚴(yán)峻挑戰(zhàn)。挑戰(zhàn)既來(lái)自科學(xué)數(shù)據(jù)共享系統(tǒng)外部,包括全球范圍社會(huì)經(jīng)濟(jì)數(shù)字化發(fā)展推動(dòng)的數(shù)據(jù)安全相關(guān)立法進(jìn)程顯著提速和監(jiān)管力度不斷加強(qiáng),以及科技競(jìng)爭(zhēng)大環(huán)境下優(yōu)質(zhì)科學(xué)數(shù)據(jù)資源爭(zhēng)奪的日趨激烈,也來(lái)自系統(tǒng)內(nèi)部,包括科學(xué)數(shù)據(jù)匯交工作持續(xù)帶來(lái)的數(shù)據(jù)規(guī)模增長(zhǎng)和安全保護(hù)壓力的相應(yīng)增加,以及 “科技自立自強(qiáng)”要求下高質(zhì)量科學(xué)數(shù)據(jù)共享發(fā)展對(duì)更高水平數(shù)據(jù)安全保障的需求。
目前我國(guó)數(shù)據(jù)安全管理的護(hù)航保障能力仍然不足,在數(shù)據(jù)共享中還不同程度地存在著 “風(fēng)險(xiǎn)規(guī)避”和 “風(fēng)險(xiǎn)漠視”等極端現(xiàn)象。隨著 《科學(xué)數(shù)據(jù)管理辦法》的進(jìn)一步落實(shí)以及 《數(shù)據(jù)安全法》 《個(gè)人隱私保護(hù)法》的貫徹實(shí)施,社會(huì)范圍的數(shù)據(jù)安全意識(shí)與素養(yǎng)將不斷提升,疊加可共享科學(xué)總量和匯聚程度快速提升的中短期趨勢(shì),科學(xué)數(shù)據(jù)共享必將迎來(lái)風(fēng)險(xiǎn)水平整體升高和部分科學(xué)數(shù)據(jù)共享平臺(tái)風(fēng)險(xiǎn)水平急劇抬升的整體狀況,成為科學(xué)數(shù)據(jù)共享持續(xù)健康發(fā)展的重大隱患。
科學(xué)數(shù)據(jù)安全正日益引起學(xué)術(shù)界和科學(xué)數(shù)據(jù)共享管理領(lǐng)域的共同關(guān)注。檢索國(guó)內(nèi) “科學(xué)數(shù)據(jù)安全”主題相關(guān)的論文發(fā)表情況發(fā)現(xiàn),自2001年開始,圍繞該主題的年均發(fā)文量從不足3篇快速增加至近20篇,近3年來(lái)更進(jìn)一步上升到22篇,論文關(guān)注的主題也逐漸擴(kuò)展至科學(xué)數(shù)據(jù)安全管理和技術(shù)的各主要方面。學(xué)者以科學(xué)數(shù)據(jù)的機(jī)密性、完整性、可用性為基礎(chǔ),從不同的角度研究了科學(xué)數(shù)據(jù)安全問(wèn)題。宋筱璇等[1]系統(tǒng)梳理比較了國(guó)內(nèi)外科研數(shù)據(jù)安全管理政策,并提出相關(guān)政策。羅嬌等[2]以知識(shí)產(chǎn)權(quán)作為切入點(diǎn),分析了科學(xué)數(shù)據(jù)的產(chǎn)權(quán)、主權(quán)和共享問(wèn)題,為維護(hù)科學(xué)數(shù)據(jù)主權(quán)和規(guī)范科學(xué)數(shù)據(jù)共享提供指導(dǎo)。李善青等[3]從技術(shù)角度提出加強(qiáng)科學(xué)數(shù)據(jù)安全管理的技術(shù)舉措。盛小平等[4]從數(shù)據(jù)安全治理的視角提出加強(qiáng)立法、完善數(shù)據(jù)標(biāo)準(zhǔn)、制定相應(yīng)政策等系列舉措。陳越等[5]認(rèn)為,從科學(xué)數(shù)據(jù)安全的角度簽署數(shù)據(jù)使用協(xié)議可以同時(shí)保障科學(xué)數(shù)據(jù)提供方和使用方的權(quán)益。與此同時(shí),圍繞近年來(lái)產(chǎn)生的數(shù)據(jù)泄露危機(jī)問(wèn)題,已經(jīng)有學(xué)者開始關(guān)注并提出相應(yīng)策略,希望能夠引起公眾對(duì)數(shù)據(jù)安全問(wèn)題的足夠重視。數(shù)據(jù)安全策略是為了防止數(shù)據(jù)泄露等不安全現(xiàn)象發(fā)生而提出的手段和方式,前提建立在對(duì)某一領(lǐng)域的數(shù)據(jù)保護(hù)問(wèn)題有足夠的危機(jī)意識(shí),并且愿意發(fā)揮主觀能動(dòng)性解決問(wèn)題。趙培云[6]基于大數(shù)據(jù)環(huán)境下的數(shù)據(jù)共享過(guò)程中的安全隱患,反思大數(shù)據(jù)應(yīng)用存在的潛在安全風(fēng)險(xiǎn),并尋求相應(yīng)的安全策略。宋理國(guó)[7]立足于數(shù)據(jù)在醫(yī)院信息管理中的應(yīng)用,認(rèn)為要增強(qiáng)數(shù)據(jù)安全意識(shí),對(duì)醫(yī)院數(shù)據(jù)進(jìn)行綜合性管理,從而形成較為健全的體制化管理。李瑞軒等[8]分析了移動(dòng)云服務(wù),認(rèn)為在互聯(lián)便捷、終端靈活的同時(shí)也需要注意安全與隱私泄露問(wèn)題,并圍繞這一問(wèn)題提出保護(hù)體系結(jié)構(gòu)、安全協(xié)議認(rèn)證、訪問(wèn)控制和完整性檢驗(yàn)的保護(hù)措施。Luis[9]提出一種面向云計(jì)算服務(wù)的數(shù)據(jù)安全框架,包括數(shù)據(jù)安全需求識(shí)別、數(shù)據(jù)安全風(fēng)險(xiǎn)管理和CCS數(shù)據(jù)安全性能評(píng)估。
通過(guò)前人研究可以發(fā)現(xiàn),我國(guó)的科學(xué)數(shù)據(jù)安全規(guī)章制度和管理機(jī)制在完備性、可操作性、透明性等方面較之國(guó)外同行存在很大差距。在我國(guó)科學(xué)數(shù)據(jù)共享平臺(tái)數(shù)據(jù)安全普遍存在起步晚、管理和技術(shù)水平相對(duì)不足的情況下,如何應(yīng)對(duì)數(shù)據(jù)安全挑戰(zhàn),充分發(fā)揮數(shù)據(jù)安全管理對(duì)科學(xué)數(shù)據(jù)共享的保駕護(hù)航作用,不僅是中短期落實(shí) 《科學(xué)數(shù)據(jù)管理辦法》的緊迫要求,同時(shí)也是實(shí)現(xiàn)更大規(guī)模、更高質(zhì)量、更高效率和更富成效的高質(zhì)量科學(xué)數(shù)據(jù)共享發(fā)展的必答題。
在數(shù)字化浪潮和開放科學(xué)持續(xù)發(fā)展的大背景下,科學(xué)數(shù)據(jù)的規(guī)??偭颗c綜合價(jià)值將長(zhǎng)期處于增長(zhǎng)通道,數(shù)據(jù)安全的監(jiān)管力度也將持續(xù)提升,這些因素在客觀上決定了科學(xué)數(shù)據(jù)安全工作的重要性和緊迫性。近年來(lái),個(gè)人隱私數(shù)據(jù)泄露事件頻發(fā),新興技術(shù)、顛覆性技術(shù)異化應(yīng)用帶來(lái)多維風(fēng)險(xiǎn)與挑戰(zhàn),科學(xué)數(shù)據(jù)安全問(wèn)題日益凸顯[10]。在這種情況下,全面調(diào)查國(guó)內(nèi)外科學(xué)數(shù)據(jù)安全管理實(shí)踐,客觀分析判斷我國(guó)科學(xué)數(shù)據(jù)安全管理工作在制度、機(jī)制、技術(shù)等方面存在的優(yōu)勢(shì)和不足,有針對(duì)性地提出符合我國(guó)特色的科學(xué)數(shù)據(jù)安全能力提升建議,既是進(jìn)一步貫徹落實(shí) 《科學(xué)數(shù)據(jù)管理辦法》的內(nèi)在需要,也是科學(xué)數(shù)據(jù)共享進(jìn)一步發(fā)展的必然要求。
科學(xué)數(shù)據(jù)安全管理貫穿科學(xué)數(shù)據(jù)管理的各個(gè)階段,包括數(shù)據(jù)收集階段、數(shù)據(jù)治理階段,數(shù)據(jù)存儲(chǔ)階段、數(shù)據(jù)訪問(wèn)階段和數(shù)據(jù)分發(fā)階段。只有從全鏈條管理科學(xué)數(shù)據(jù)安全,才能將安全風(fēng)險(xiǎn)降到最低。在數(shù)據(jù)收集階段,需要對(duì)科學(xué)數(shù)據(jù)本身或研究?jī)?nèi)容的機(jī)密性進(jìn)行審查,同時(shí)分析現(xiàn)有數(shù)據(jù)納入數(shù)據(jù)庫(kù)后可能帶來(lái)的融合風(fēng)險(xiǎn);在數(shù)據(jù)治理階段,要進(jìn)行科學(xué)數(shù)據(jù)的評(píng)估,對(duì)其進(jìn)行分級(jí)分類,根據(jù)其類型制定有針對(duì)性的訪問(wèn)方式;在數(shù)據(jù)存儲(chǔ)階段,要應(yīng)對(duì)存儲(chǔ)技術(shù)風(fēng)險(xiǎn)以及數(shù)據(jù)流失可能造成的數(shù)據(jù)主權(quán)與安全風(fēng)險(xiǎn);在數(shù)據(jù)訪問(wèn)階段,根據(jù)數(shù)據(jù)的敏感性,通過(guò)自主訪問(wèn)控制、強(qiáng)制訪問(wèn)控制、基于角色訪問(wèn)控制、加密數(shù)據(jù)傳輸?shù)?,保證科學(xué)數(shù)據(jù)可以合法安全地被訪問(wèn)使用[11];在數(shù)據(jù)分發(fā)階段,要注意數(shù)據(jù)的知識(shí)產(chǎn)權(quán)以及衍生數(shù)據(jù)的再分發(fā)等安全風(fēng)險(xiǎn)。
本文圍繞如何有效提升我國(guó)科學(xué)數(shù)據(jù)安全管理能力的必然需求,并圍繞科學(xué)數(shù)據(jù)安全管理各個(gè)階段展開調(diào)查研究,通過(guò)梳理國(guó)內(nèi)外代表性科學(xué)數(shù)據(jù)共享平臺(tái)的相關(guān)經(jīng)驗(yàn)和典型做法,初步勾勒科學(xué)數(shù)據(jù)安全管理的整體樣貌,重點(diǎn)描述科學(xué)數(shù)據(jù)共享平臺(tái)數(shù)據(jù)安全管理策略的細(xì)節(jié),總結(jié)科學(xué)數(shù)據(jù)安全管理的舉措,為我國(guó)科學(xué)數(shù)據(jù)安全管理提供經(jīng)驗(yàn)借鑒。
本研究的目的是全面了解國(guó)內(nèi)外科學(xué)數(shù)據(jù)共享平臺(tái)和相關(guān)科學(xué)研究機(jī)構(gòu)的數(shù)據(jù)安全管理情況及相關(guān)舉措,為我國(guó)科學(xué)數(shù)據(jù)安全管理能力提供政策與管理建議。圍繞科學(xué)數(shù)據(jù)管理周期,主要調(diào)研各個(gè)科學(xué)數(shù)據(jù)共享平臺(tái)采取的安全管理政策、制定的相應(yīng)措施及其運(yùn)行機(jī)制。通過(guò)調(diào)研,試圖回答以下問(wèn)題:①典型科學(xué)數(shù)據(jù)共享平臺(tái)的科學(xué)數(shù)據(jù)安全管理水平;②典型科學(xué)數(shù)據(jù)共享平臺(tái)的安全管理策略;③當(dāng)前我國(guó)科學(xué)數(shù)據(jù)共享平臺(tái)與國(guó)外平臺(tái)在安全管理方面的差距。
調(diào)查以國(guó)內(nèi)外各類科學(xué)數(shù)據(jù)共享參與機(jī)構(gòu)為主體,重點(diǎn)集中于科學(xué)數(shù)據(jù)共享平臺(tái) (或類似機(jī)構(gòu))。在全面調(diào)查的基礎(chǔ)上,選擇其中的先進(jìn)、典型或有特色的單位進(jìn)行案例分析 (見表1)。遴選原則包括:①相關(guān)機(jī)構(gòu)在國(guó)家科技管理體制和科學(xué)數(shù)據(jù)安全職能與角色兩個(gè)方面具有代表性;②相關(guān)機(jī)構(gòu)具有必要的體量和影響力;③相關(guān)機(jī)構(gòu)在數(shù)據(jù)安全管理方面具有特色或較高的認(rèn)可度。同時(shí),出于對(duì)比分析目的,本研究擴(kuò)展調(diào)查了具有代表性的若干高校和學(xué)術(shù)期刊等共享參與機(jī)構(gòu)。
表1 科學(xué)數(shù)據(jù)安全管理重點(diǎn)調(diào)研對(duì)象
科學(xué)數(shù)據(jù)共享平臺(tái)在科學(xué)數(shù)據(jù)共享生態(tài)鏈中具有樞紐地位,其往往承擔(dān)著科學(xué)數(shù)據(jù)匯聚、持久存儲(chǔ)、傳播和有效利用等關(guān)鍵的共享職能,既是科學(xué)數(shù)據(jù)的匯集地,也是數(shù)據(jù)安全風(fēng)險(xiǎn)的高發(fā)點(diǎn)。伴隨著科學(xué)數(shù)據(jù)共享事業(yè)的發(fā)展,科學(xué)數(shù)據(jù)共享平臺(tái)在職能、定位和形態(tài)方面也不斷演化,產(chǎn)生了更多管理類型,也由此發(fā)展了多種不同的數(shù)據(jù)安全管理策略。
本研究系統(tǒng)調(diào)研了不同科學(xué)數(shù)據(jù)共享平臺(tái)圍繞科學(xué)數(shù)據(jù)不同管理階段采取的安全管理措施,結(jié)果如表2所示。調(diào)查發(fā)現(xiàn),盡管很多科學(xué)數(shù)據(jù)共享平臺(tái)都參考諸如OAIS (Open Archival Information System)等流程模型開展其流程設(shè)計(jì)與管理,但是在具體實(shí)施過(guò)程中,由于管理理念、目標(biāo)定位和資源投入的限制,很多科學(xué)數(shù)據(jù)共享平臺(tái)都在流程實(shí)現(xiàn)上采取了有取有舍的做法。
表2 科學(xué)數(shù)據(jù)共享平臺(tái)圍繞科學(xué)數(shù)據(jù)不同管理階段采取的管理措施
整體而言,美國(guó)[12]、英國(guó)[13]、中國(guó)[14]等國(guó)家的公共部門將數(shù)據(jù)根據(jù)風(fēng)險(xiǎn)等級(jí)大致分為3類,即開放數(shù)據(jù)、敏感數(shù)據(jù)和涉密數(shù)據(jù)。開放數(shù)據(jù)是指無(wú)任何風(fēng)險(xiǎn)隱含的可以開放共享的數(shù)據(jù);敏感數(shù)據(jù)是指數(shù)據(jù)中可能包含涉及個(gè)人隱私[15]、未授權(quán)的商業(yè)信息[16]、人類福祉、瀕危動(dòng)物、可持續(xù)發(fā)展、公共或國(guó)家安全等信息;涉密數(shù)據(jù)是指涉及國(guó)家安全、數(shù)據(jù)主權(quán)、個(gè)人隱私的保密數(shù)據(jù),這是由國(guó)家或地區(qū)的法律法規(guī)明確界定的。歐盟 《一般數(shù)據(jù)保護(hù)條例》明確指出,應(yīng)禁止處理揭示種族或民族背景、政治觀念等的個(gè)人數(shù)據(jù)、基因數(shù)據(jù)、以唯一識(shí)別自然人為目的的生物特征數(shù)據(jù)等[17]。在國(guó)內(nèi)外科學(xué)數(shù)據(jù)共享平臺(tái)的管理實(shí)踐中,均不收集涉密數(shù)據(jù),如ICPSR規(guī)定不收錄高度隱私與涉密數(shù)據(jù)。同時(shí),科學(xué)數(shù)據(jù)安全管理的主要對(duì)象是敏感數(shù)據(jù),關(guān)鍵安全風(fēng)險(xiǎn)是隱私泄露導(dǎo)致的數(shù)據(jù)主體受損以及給數(shù)據(jù)生產(chǎn)和共享者帶來(lái)的違法違規(guī)責(zé)任。因此,科學(xué)數(shù)據(jù)共享平臺(tái)安全管理的重心是防止敏感信息泄露,從而避免數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)保存與管理者以及數(shù)據(jù)使用者承擔(dān)聲譽(yù)損失甚或違規(guī)、違法責(zé)任。
數(shù)據(jù)安全管理策略是管理理念、管理目標(biāo)、管理定位和主要管理舉措的綜合,是特定科學(xué)數(shù)據(jù)共享平臺(tái)數(shù)據(jù)安全管理的原點(diǎn)與內(nèi)核。調(diào)查發(fā)現(xiàn),不同類型的科學(xué)數(shù)據(jù)共享平臺(tái)在其數(shù)據(jù)安全管理實(shí)踐中形成了三種管理策略 (見表3)。
表3 三種數(shù)據(jù)安全管理策略
(1)全保護(hù)策略,指科學(xué)數(shù)據(jù)共享平臺(tái)以科學(xué)數(shù)據(jù)價(jià)值最大化發(fā)揮為安全管理理念,綜合運(yùn)用各種高效可靠的手段支持對(duì)敏感數(shù)據(jù)的最大化利用。在具體內(nèi)容上,該策略提供對(duì)科學(xué)數(shù)據(jù)保密性、完整性、有效性和真實(shí)性的全方位保護(hù)。在數(shù)據(jù)安全的管理定位上,科學(xué)數(shù)據(jù)共享平臺(tái)是數(shù)據(jù)安全主體責(zé)任的重要分擔(dān)者,因此承擔(dān)數(shù)據(jù)安全把關(guān)人、數(shù)據(jù)安全水平提升者、數(shù)據(jù)安全存儲(chǔ)者與數(shù)據(jù)安全共享服務(wù)的責(zé)任??茖W(xué)數(shù)據(jù)共享平臺(tái)通常采取制定完善的數(shù)據(jù)安全管理政策體系、建立數(shù)據(jù)管理流程、成立專業(yè)化的數(shù)據(jù)安全管理機(jī)構(gòu)、配置和培訓(xùn)高素質(zhì)業(yè)務(wù)人員、高投入打造數(shù)據(jù)安全共享環(huán)境等多方面的舉措。
(2)技術(shù)保障策略,指科學(xué)數(shù)據(jù)共享平臺(tái)力圖以相對(duì)較小的投入盡量實(shí)現(xiàn)科學(xué)數(shù)據(jù)價(jià)值。具體到數(shù)據(jù)安全管理內(nèi)容,該策略往往以數(shù)據(jù)的完整性、有效性和真實(shí)性為管理重點(diǎn),達(dá)到一定程度的保密性管理。這種保密性的部分保護(hù)往往是考慮到相關(guān)的管理、運(yùn)行以及技術(shù)資源綜合權(quán)衡的結(jié)果。在這一意義上,此類科學(xué)數(shù)據(jù)共享平臺(tái)僅僅是數(shù)據(jù)安全責(zé)任主體的輕微分擔(dān)者。實(shí)施技術(shù)保障策略的科學(xué)數(shù)據(jù)共享平臺(tái)也可能具有數(shù)據(jù)安全管理政策、流程組織、人員培訓(xùn)和技術(shù)環(huán)境,但一般會(huì)因投入、建設(shè)和運(yùn)營(yíng)的難度與成本等問(wèn)題無(wú)法建設(shè)完整的數(shù)據(jù)安全訪問(wèn)系統(tǒng),往往以低效率的審批和線下數(shù)據(jù)傳遞的低成本方法替代。
(3)安全免除策略,指科學(xué)數(shù)據(jù)共享平臺(tái)在理念上追求最大化的數(shù)據(jù)發(fā)現(xiàn)與數(shù)據(jù)擴(kuò)散。在數(shù)據(jù)安全管理上,此類機(jī)構(gòu)采取安全回避態(tài)度,要求提交數(shù)據(jù)者以簽署協(xié)議的形式申明自負(fù)全部安全責(zé)任,機(jī)構(gòu)不負(fù)擔(dān)任何數(shù)據(jù)安全責(zé)任。此類科學(xué)數(shù)據(jù)共享平臺(tái)也通過(guò)必要的技術(shù)投入對(duì)數(shù)據(jù)的完整性和有效性提供高水平的保護(hù),但是科學(xué)數(shù)據(jù)共享平臺(tái)無(wú)法保證這種保護(hù)的可靠性。
數(shù)據(jù)安全不僅是宏觀意義上科學(xué)數(shù)據(jù)全生命周期的固有維度,同時(shí)也是貫穿各科學(xué)數(shù)據(jù)共享平臺(tái)具體管理流程的內(nèi)嵌主線。根據(jù)上述數(shù)據(jù)安全管理策略,本研究從管理模式、突出特點(diǎn)、安全保護(hù)要素等維度,將科學(xué)數(shù)據(jù)共享平臺(tái)劃分為深度安全管理、中度安全管理和淺度安全管理三種類型,不同類型對(duì)應(yīng)不同的安全管理能力和效能。圖2所示為部分調(diào)研對(duì)象的安全管理類型。
圖2 科學(xué)數(shù)據(jù)共享平臺(tái)的安全管理程度
深度安全管理科學(xué)數(shù)據(jù)共享平臺(tái)完整地實(shí)現(xiàn)了OAIS流程,同時(shí)對(duì)數(shù)據(jù)評(píng)審、數(shù)據(jù)安全訪問(wèn)等專業(yè)性較強(qiáng)的關(guān)鍵環(huán)節(jié)進(jìn)行了較大幅度的細(xì)化和增強(qiáng)。OAIS管理流程增強(qiáng)背后的驅(qū)動(dòng)主要是安全管理理念和較為充分的投入。以ICPSR為例,其管理理念是遴選高價(jià)值科學(xué)數(shù)據(jù)并進(jìn)行持久存儲(chǔ)與共享,從而實(shí)現(xiàn)科學(xué)數(shù)據(jù)價(jià)值最大化的目的。ICPSR的兩大管理目標(biāo)一是數(shù)據(jù)具有較高的質(zhì)量,二是敏感數(shù)據(jù)都能得到有效利用。這兩大管理目標(biāo)為流程增強(qiáng)提供了必要性。同時(shí),ICPSR基于聯(lián)盟會(huì)費(fèi)、政府資助和收費(fèi)服務(wù)等多渠道收入形成了較好的經(jīng)費(fèi)條件,保障了管理和技術(shù)系統(tǒng)的高強(qiáng)度投入。
深度安全管理科學(xué)數(shù)據(jù)共享平臺(tái)一般都具有較強(qiáng)的公益色彩,同時(shí)也承擔(dān)著國(guó)家層面的綜合或?qū)W科領(lǐng)域高質(zhì)量科學(xué)數(shù)據(jù)持久存儲(chǔ)和有效共享的義務(wù),事實(shí)上發(fā)揮著科學(xué)數(shù)據(jù)共享把關(guān)人的作用,是國(guó)家科學(xué)數(shù)據(jù)共享體系中的核心節(jié)點(diǎn)。具體到數(shù)據(jù)安全,此類數(shù)據(jù)中心普遍遵循下述兩條原則:①確保敏感科學(xué)數(shù)據(jù)能夠得到有效的安全化處理,包括排除本數(shù)據(jù)中心無(wú)法處理的敏感或涉密數(shù)據(jù)有效脫敏等;②在有限資源投入的情況下,支持多種形式的安全數(shù)據(jù)訪問(wèn)與使用,最大程度發(fā)揮數(shù)據(jù)的價(jià)值。
為了實(shí)現(xiàn)上述理念和原則,科學(xué)數(shù)據(jù)共享平臺(tái)主要以 “合規(guī)性”和 “合理性”作為數(shù)據(jù)安全管理的出發(fā)點(diǎn)。例如,ICPSR設(shè)置了明確的安全審核環(huán)節(jié)和審核標(biāo)準(zhǔn)以確保只收錄自己能夠處理的數(shù)據(jù)。在合規(guī)方面,ICPSR安全審核委員會(huì)在數(shù)據(jù)提交者聲明的基礎(chǔ)上進(jìn)一步核查數(shù)據(jù)本身以及數(shù)據(jù)生產(chǎn)行為是否符合聯(lián)邦政府及其所屬各部門、各州政府頒布的法律、法令、規(guī)范或其他強(qiáng)制性要求,審查重點(diǎn)是個(gè)體隱私的有效保護(hù)。在合理方面,委員會(huì)審查數(shù)據(jù)提交者的聲明、提交者所在機(jī)構(gòu)倫理委員會(huì)的批準(zhǔn)、 (部分研究的)研究參與者知情同意書等資料,參照 《赫爾辛基宣言》 《紐倫堡法則》等確定所提交數(shù)據(jù)是否合乎科學(xué)倫理。此類科學(xué)數(shù)據(jù)共享平臺(tái)同時(shí)非常關(guān)注所收錄數(shù)據(jù)的完整性與有效性,并認(rèn)為二者是科學(xué)數(shù)據(jù)有效共享的基礎(chǔ)。例如,UKDA設(shè)立了清晰的數(shù)據(jù)收錄、審核、治理、存檔以及訪問(wèn)流程,以一種類似期刊論文評(píng)審的流程化形式確保所處理的數(shù)據(jù)不會(huì)出現(xiàn)非授權(quán)篡改和損壞。UKDA同時(shí)還采用數(shù)據(jù)持久存儲(chǔ)策略、多數(shù)據(jù)備份和多系統(tǒng)備份等技術(shù)手段,確保數(shù)據(jù)本身及其相關(guān)服務(wù)、系統(tǒng)和硬件設(shè)施不會(huì)損壞或失效。特別重要的是,UKDA和ICPSR等深度安全管理機(jī)構(gòu)基于數(shù)據(jù)安全訪問(wèn)控制的五要素框架,提供安全下載、遠(yuǎn)程安全訪問(wèn)、到館安全訪問(wèn)等多種形式的數(shù)據(jù)安全訪問(wèn)環(huán)境,充分體現(xiàn)了以高投入實(shí)現(xiàn)科學(xué)數(shù)據(jù)價(jià)值最大化的理念。
從整體上看,深度治理科學(xué)數(shù)據(jù)共享平臺(tái)完整地實(shí)現(xiàn)了科學(xué)數(shù)據(jù)共享中 “安全把關(guān)人”的安全評(píng)審、安全處理與安全訪問(wèn)的全部職能。
中度安全管理科學(xué)數(shù)據(jù)共享平臺(tái)一般是規(guī)模相對(duì)較小的科學(xué)數(shù)據(jù)共享平臺(tái)。在資源相對(duì)有限的情況下,此類機(jī)構(gòu)往往以數(shù)據(jù)存檔和數(shù)據(jù)共享為主要職能,數(shù)據(jù)安全管理為輔助職能。在具體實(shí)踐中,數(shù)據(jù)安全管理往往集中在智力和管理資源投入水平相對(duì)較低的技術(shù)性質(zhì)量控制 (例如,科學(xué)數(shù)據(jù)集技術(shù)格式和元數(shù)據(jù)描述的完整性和準(zhǔn)確性等)和安全控制 (例如,檢查數(shù)據(jù)集中的敏感信息但主要依靠作者進(jìn)行脫敏和多版本制作等工作)方面。此類機(jī)構(gòu)的典型示例是DRYAD,該平臺(tái)在使用說(shuō)明中明確要求數(shù)據(jù)提交者對(duì)其數(shù)據(jù)安全負(fù)責(zé),DRYAD只進(jìn)行最低水平的數(shù)據(jù)安全審查和最低成本的安全訪問(wèn)服務(wù),如通過(guò)線下申請(qǐng)數(shù)據(jù)、控制訪問(wèn)人員和借助物理介質(zhì)傳遞數(shù)據(jù)等。
淺度安全管理科學(xué)數(shù)據(jù)共享平臺(tái)一般是各類在線且主要針對(duì)開放科學(xué)數(shù)據(jù)集提供共享或傳播的科學(xué)數(shù)據(jù)共享服務(wù)機(jī)構(gòu)。在我國(guó)科學(xué)數(shù)據(jù)開放共享以及歐美類似政策的推動(dòng)下,從2010年之后陸續(xù)涌現(xiàn)了很多專門從事科學(xué)數(shù)據(jù)共享的科學(xué)數(shù)據(jù)共享機(jī)構(gòu),一些諸如ICPSR和UKDA在內(nèi)的傳統(tǒng)數(shù)據(jù)共享平臺(tái)也先后開通了開放科學(xué)數(shù)據(jù)共享系統(tǒng)或平臺(tái),如openICPSR和Reshare。此類機(jī)構(gòu)的初衷是僅為非敏感科學(xué)數(shù)據(jù) (或開放科學(xué)數(shù)據(jù))提供在線存儲(chǔ)和開放共享服務(wù)。在數(shù)據(jù)安全方面,機(jī)構(gòu)會(huì)要求數(shù)據(jù)提交者僅提供開放數(shù)據(jù),換言之,數(shù)據(jù)提交者明確聲明對(duì)其所提交數(shù)據(jù)的安全性 (主要是數(shù)據(jù)的保密性)負(fù)全責(zé),平臺(tái)既不對(duì)數(shù)據(jù)進(jìn)行安全性審核與處理,也不負(fù)擔(dān)任何隱私泄露等安全責(zé)任。同時(shí),這類科學(xué)數(shù)據(jù)共享平臺(tái)對(duì)用戶提交數(shù)據(jù)的存儲(chǔ)安全與訪問(wèn)可靠性承擔(dān)有限責(zé)任,如CERN提出盡可能而不是確保所收儲(chǔ)數(shù)據(jù)的持久存儲(chǔ)與可靠訪問(wèn)。
(1)良好的數(shù)據(jù)安全管理是科學(xué)數(shù)據(jù)共享的保障,這種保障一方面體現(xiàn)為安全科學(xué)數(shù)據(jù)共享行為的可持續(xù)發(fā)展,同時(shí)也使得科學(xué)數(shù)據(jù)共享平臺(tái)及相關(guān)的數(shù)據(jù)提交者免于法律訴訟、國(guó)家安全等重大風(fēng)險(xiǎn)的影響。調(diào)查研究與案例分析表明,深度安全管理科學(xué)數(shù)據(jù)共享平臺(tái)設(shè)計(jì)了嚴(yán)密的安全管理制度和業(yè)務(wù)流程,同時(shí)在人員培訓(xùn)、技術(shù)保障和崗位設(shè)置方面也更加注重?cái)?shù)據(jù)安全管理。
(2)良好的科學(xué)數(shù)據(jù)共享平臺(tái)制度體系具有層次清晰、安全管理業(yè)務(wù)覆蓋完整、業(yè)務(wù)流程簡(jiǎn)潔嚴(yán)密、崗位設(shè)置合理等特點(diǎn)。這類制度體系向上銜接了國(guó)家法律/法令/法規(guī)、科學(xué)倫理、標(biāo)準(zhǔn)規(guī)范體系等不同層次的外部約束,向下指向到操作性強(qiáng)的管理政策、業(yè)務(wù)操作規(guī)程規(guī)范等,為安全的科學(xué)數(shù)據(jù)行為提供了完整、清晰和具有高度邏輯性的標(biāo)準(zhǔn)規(guī)范環(huán)境。安全管理業(yè)務(wù)覆蓋了科學(xué)數(shù)據(jù)生產(chǎn)、匯交、治理、共享/傳播、使用等主要環(huán)節(jié),并且在安全管理執(zhí)行過(guò)程中平臺(tái)設(shè)置了合理的崗位,使得科學(xué)數(shù)據(jù)安全的 “把關(guān)人”機(jī)制以一種清晰、簡(jiǎn)潔因而易于理解和執(zhí)行的方式呈現(xiàn)。
(3)針對(duì)敏感數(shù)據(jù)占比較小但風(fēng)險(xiǎn)較大的數(shù)據(jù)安全 “關(guān)鍵少數(shù)”特性,大部分科學(xué)數(shù)據(jù)共享平臺(tái)不同程度開展了數(shù)據(jù)的分級(jí)分類管理,包括制定分級(jí)分類標(biāo)準(zhǔn)、設(shè)置分級(jí)分類流程和相關(guān)崗位,以及為不同類型和級(jí)別的數(shù)據(jù)配置不同的治理流程/訪問(wèn)策略和技術(shù)措施。調(diào)查研究發(fā)現(xiàn),在分級(jí)分類的基礎(chǔ)上對(duì)所匯集數(shù)據(jù)進(jìn)行分流,使得科學(xué)數(shù)據(jù)共享平臺(tái)可以準(zhǔn)確地將高昂的安全管理成本投放到極少數(shù)需要安全保護(hù)的數(shù)據(jù)上,從而可以有效適應(yīng) “關(guān)鍵少數(shù)”的數(shù)據(jù)安全特性,實(shí)現(xiàn)數(shù)據(jù)安全投入和成效的良好平衡。
(4)科學(xué)數(shù)據(jù)安全管理的成效在很大程度上依靠具體執(zhí)行數(shù)據(jù)安全評(píng)估和分級(jí)分類的人員的專業(yè)素養(yǎng)和能力。在某種程度上,數(shù)據(jù)安全管理的制度和技術(shù)確定了安全能力的上限,具體的執(zhí)行人員的素養(yǎng)和能力決定了安全能力的下限。部分管理水平較高的數(shù)據(jù)中心在其管理制度中明確設(shè)置了數(shù)據(jù)安全評(píng)估、數(shù)據(jù)分級(jí)分類、數(shù)據(jù)安全治理和數(shù)據(jù)安全訪問(wèn)控制等多個(gè)安全專項(xiàng)崗位,同時(shí)對(duì)這些崗位的任職資格提出要求,對(duì)相關(guān)人員的入職培訓(xùn)和在崗培訓(xùn)也提出了明確的措施,這些措施有力地提升了相關(guān)業(yè)務(wù)人員的素養(yǎng)和能力,抬升了安全管理能力的下限。
(5)數(shù)據(jù)安全能力取決于源自制度規(guī)范體系的管理能力和支撐管理的技術(shù)能力。大部分科學(xué)數(shù)據(jù)共享平臺(tái)不同程度地實(shí)施了多種形式的技術(shù)措施,主要包括基于多物理備份的數(shù)據(jù)長(zhǎng)期安全存檔措施、數(shù)據(jù)訪問(wèn)服務(wù)或系統(tǒng)的高可靠運(yùn)行保障措施,以及確保數(shù)據(jù)保密性的安全訪問(wèn)控制措施等?;旧霞夹g(shù)投入與數(shù)據(jù)中心的規(guī)模和資金實(shí)力成正比,因此一般只有部分規(guī)模較大、運(yùn)行水平較高的科學(xué)數(shù)據(jù)共享平臺(tái)同時(shí)開展了上述三類技術(shù)保障措施,部分科學(xué)數(shù)據(jù)共享平臺(tái)沒(méi)有開展數(shù)據(jù)安全訪問(wèn)控制措施,大部分科學(xué)數(shù)據(jù)共享平臺(tái)僅在較低程度上開展前兩項(xiàng)技術(shù)保障措施。
一是從科技自立自強(qiáng)和數(shù)字經(jīng)濟(jì)發(fā)展的高度開展科學(xué)數(shù)據(jù)安全的頂層設(shè)計(jì)。 “十四五”規(guī)劃綱要明確提出以科技自立自強(qiáng)作為國(guó)家發(fā)展戰(zhàn)略支撐的總原則,并提出集約化建設(shè)科學(xué)大數(shù)據(jù)中心的目標(biāo);同時(shí)也提出統(tǒng)籌數(shù)據(jù)利用、隱私保護(hù)和公共安全,充分發(fā)揮數(shù)據(jù)要素潛能,推動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展的要求。為此,必須充分考慮科學(xué)數(shù)據(jù)安全管理的復(fù)雜性和系統(tǒng)性,在全球科技創(chuàng)新激烈競(jìng)爭(zhēng)的格局下,以準(zhǔn)確把握我國(guó)科技創(chuàng)新整體發(fā)展態(tài)勢(shì)及其對(duì)科學(xué)數(shù)據(jù)共享要求為基本出發(fā)點(diǎn),統(tǒng)籌考慮組織形式和運(yùn)行機(jī)制,形成一個(gè)從頂層設(shè)計(jì)到發(fā)展規(guī)劃,然后在規(guī)劃統(tǒng)領(lǐng)下組織實(shí)施的體系化保障機(jī)制,以此保證科學(xué)數(shù)據(jù)安全管理發(fā)展的正確方向和資源投入效率。
二是以數(shù)據(jù)安全管理能力評(píng)價(jià)激勵(lì)機(jī)制為切入點(diǎn),引導(dǎo)推動(dòng)國(guó)家科學(xué)數(shù)據(jù)共享平臺(tái)快速提升數(shù)據(jù)安全管理能力。歐美等國(guó)家科學(xué)數(shù)據(jù)安全管理的成功經(jīng)驗(yàn)表明,學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)中心 “安全把關(guān)人”作用的有效發(fā)揮是成功實(shí)現(xiàn)科學(xué)數(shù)據(jù)安全管理的關(guān)鍵??紤]到我國(guó)科學(xué)數(shù)據(jù)共享體系的組織結(jié)構(gòu)和運(yùn)行機(jī)制,建議在現(xiàn)有國(guó)家科學(xué)數(shù)據(jù)中心定期績(jī)效考核中增加數(shù)據(jù)安全評(píng)價(jià)內(nèi)容,并建立 “紅黃牌”和 “一票否決”等獎(jiǎng)懲機(jī)制,輔之以科學(xué)數(shù)據(jù)安全培訓(xùn)等支持性措施,引導(dǎo)推動(dòng)科學(xué)數(shù)據(jù)共享平臺(tái)快速提升數(shù)據(jù)安全意識(shí)和管理能力,在較短的時(shí)間內(nèi)盡量補(bǔ)足數(shù)據(jù)安全管理短板,最大可能消除安全管理隱患。
三是充分利用技術(shù)上的 “彎道超車”契機(jī),建設(shè)自主可控的科學(xué)數(shù)據(jù)安全共享基礎(chǔ)設(shè)施。充分利用區(qū)塊鏈等新一代信息安全技術(shù),研究與開發(fā)敏感科學(xué)數(shù)據(jù)智能化識(shí)別與脫敏技術(shù)、低成本永久存儲(chǔ)技術(shù)、去中心化的數(shù)據(jù)確權(quán)與唯一標(biāo)識(shí)技術(shù)、智能化用戶身份認(rèn)證技術(shù)、科學(xué)數(shù)據(jù)隱私計(jì)算等 “在線化”數(shù)據(jù)安全管理技術(shù),并集成為自主可控的下一代科學(xué)數(shù)據(jù)安全共享基礎(chǔ)設(shè)施,為高質(zhì)量的科學(xué)數(shù)據(jù)共享提供技術(shù)基礎(chǔ)。