国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)探索:框架與模式

2024-12-01 00:00:00王健周國(guó)民張建華許哲平劉婷婷
關(guān)鍵詞:數(shù)據(jù)保護(hù)數(shù)據(jù)安全

摘要:近年來,隨著數(shù)據(jù)安全監(jiān)管的日益收緊,科學(xué)數(shù)據(jù)管理面臨越來越嚴(yán)峻的“安全合規(guī)”挑戰(zhàn),數(shù)據(jù)分類分級(jí)保護(hù)逐漸成為學(xué)術(shù)界、數(shù)據(jù)管理實(shí)踐者和監(jiān)管機(jī)構(gòu)共同關(guān)注的議題。然而,現(xiàn)有的研究和實(shí)踐大多局限于對(duì)數(shù)據(jù)合規(guī)的解釋與反應(yīng)性應(yīng)對(duì),缺乏對(duì)科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)的系統(tǒng)性和理論性討論。這種認(rèn)知不足限制了科學(xué)數(shù)據(jù)安全管理領(lǐng)域理論框架和實(shí)用模型的發(fā)展。為形成對(duì)科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)的系統(tǒng)性理解,本研究基于對(duì)現(xiàn)有實(shí)踐的廣泛調(diào)查,提煉出科學(xué)數(shù)據(jù)的六項(xiàng)關(guān)鍵安全特征:多重規(guī)制、倫理強(qiáng)規(guī)制、學(xué)科領(lǐng)域差異性、“規(guī)模-風(fēng)險(xiǎn)”帕累托分布、公益性和動(dòng)態(tài)敏感性,以此六項(xiàng)特征為基礎(chǔ),構(gòu)建了科學(xué)數(shù)據(jù)安全分類和分級(jí)框架,并提出了全面、平衡與精簡(jiǎn)三種保護(hù)模式。研究提出了“數(shù)據(jù)合規(guī)-合規(guī)成本-數(shù)據(jù)收益”三角平衡觀點(diǎn),合理解釋了三者之間的權(quán)衡關(guān)系。文中還詳細(xì)討論了數(shù)據(jù)安全分類與安全分級(jí)的區(qū)別及其相互作用,澄清了科學(xué)數(shù)據(jù)安全分類的復(fù)雜性。該研究提出的針對(duì)科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)的理論框架為分析科學(xué)數(shù)據(jù)安全管理中的復(fù)雜問題提供了框架性工具,可為相關(guān)研究提供有價(jià)值的參考,有助于推動(dòng)科學(xué)數(shù)據(jù)安全保護(hù)實(shí)踐。

關(guān)鍵詞:科學(xué)數(shù)據(jù);數(shù)據(jù)安全;數(shù)據(jù)保護(hù);數(shù)據(jù)分類;數(shù)據(jù)分級(jí);數(shù)據(jù)倫理

1 "引言

1.1 "背景

科學(xué)數(shù)據(jù)管理正面臨數(shù)據(jù)安全監(jiān)管收緊引發(fā)的“安全合規(guī)”挑戰(zhàn)。僅就個(gè)人數(shù)據(jù)而言,歐盟、美國(guó)、中國(guó)等主要?jiǎng)?chuàng)新型國(guó)家或區(qū)域先后發(fā)布了《通用數(shù)據(jù)保護(hù)條例(GDPR)》、《加州消費(fèi)者隱私法案(CCPA)》和《個(gè)人信息保護(hù)法(PIPL)》等法規(guī),對(duì)個(gè)人數(shù)據(jù)的采集、存儲(chǔ)、傳輸、利用和再利用等進(jìn)行了更加嚴(yán)格的規(guī)制。這些法規(guī)顯著增加了生物醫(yī)學(xué)、人文社科等領(lǐng)域的研究成本[1–5],并影響了涉及歐盟的國(guó)際合作研究[6]。

作為管理層面的應(yīng)對(duì)措施,許多科學(xué)中心和數(shù)據(jù)管理機(jī)構(gòu)已引入GDPR等法規(guī),并在機(jī)構(gòu)政策和業(yè)務(wù)流程等方面進(jìn)行了相應(yīng)調(diào)整,以滿足數(shù)據(jù)合規(guī)的要求。在中國(guó),此類事件驅(qū)動(dòng)性質(zhì)的研究與管理實(shí)踐日益受到重視,尤其是在《科學(xué)數(shù)據(jù)管理辦法》 和《數(shù)據(jù)安全法》 先后提出“數(shù)據(jù)分類分級(jí)保護(hù)”要求后。目前,科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)已經(jīng)成為學(xué)術(shù)界、科學(xué)數(shù)據(jù)管理實(shí)踐領(lǐng)域和數(shù)據(jù)安全管理當(dāng)局的共識(shí),成為緊監(jiān)管環(huán)境下應(yīng)對(duì)“安全合規(guī)”挑戰(zhàn)的基本路徑。

與實(shí)踐需求形成鮮明對(duì)照的是相關(guān)研究的不足。首先是缺乏對(duì)安全視角下科學(xué)數(shù)據(jù)及其保護(hù)的復(fù)雜性關(guān)注不足??茖W(xué)數(shù)據(jù)包含個(gè)人隱私、知識(shí)產(chǎn)權(quán)以及對(duì)公共健康、社會(huì)政策和環(huán)境具有廣泛影響的多類敏感信息,是一個(gè)復(fù)雜、綜合但同時(shí)缺乏明確法律邊界的數(shù)據(jù)大類,其保護(hù)不僅需要遵守多重法律規(guī)制,而且還涉及倫理考量[7-8],需要維護(hù)科學(xué)研究的完整性(Integrity)和可重復(fù)性。其次是對(duì)科學(xué)數(shù)據(jù)保護(hù)的系統(tǒng)性理解及實(shí)踐指導(dǎo)作用相對(duì)不足。部分學(xué)者關(guān)注科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)的意義或策略等宏觀議題[9-13],其目的顯然是希望引起學(xué)術(shù)界和政策制定者的討論;部分學(xué)者關(guān)注數(shù)據(jù)安全分類分級(jí)方法[14-16]、標(biāo)準(zhǔn)規(guī)范[17-18]等實(shí)踐議題,以及空間科學(xué)[19]、高能物理[20]、冰川凍土[21]、醫(yī)學(xué)[14,22]、計(jì)量科學(xué)[23]等學(xué)科領(lǐng)域?qū)嵺`,嘗試為相關(guān)實(shí)踐提供參考。然而整體上,科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)的內(nèi)在邏輯和實(shí)現(xiàn)模式仍然缺乏系統(tǒng)性討論。這種研究現(xiàn)狀在一定程度上解釋了當(dāng)前實(shí)踐中存在的平凡引用通用或其他領(lǐng)域數(shù)據(jù)分類分級(jí)保護(hù)方案的做法,以及由此帶來的可行性和有效性問題。

科學(xué)數(shù)據(jù)保護(hù)實(shí)踐需求與研究供給之間的空白已經(jīng)成為前者發(fā)展的重要障礙。論文旨在通過提出一個(gè)分類框架和三種數(shù)據(jù)保護(hù)模式來填補(bǔ)這一空白。這些發(fā)現(xiàn)基于對(duì)相關(guān)機(jī)構(gòu)的數(shù)據(jù)保護(hù)實(shí)踐調(diào)查,其目的是建立科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)的系統(tǒng)思維框架,為學(xué)術(shù)界、科學(xué)數(shù)據(jù)管理實(shí)踐和數(shù)據(jù)安全管理當(dāng)局的政策溝通提供理論基礎(chǔ),為相關(guān)機(jī)構(gòu)的實(shí)踐提供實(shí)用工具。

1.2 "目標(biāo)

本研究的主要目標(biāo)是提供一個(gè)科學(xué)數(shù)據(jù)安全分類分級(jí)框架及與之配套的三種數(shù)據(jù)保護(hù)模式,為應(yīng)對(duì)科學(xué)數(shù)據(jù)保護(hù)相關(guān)的復(fù)雜性和挑戰(zhàn)提供理論和實(shí)踐參考,具體的目標(biāo)包括:

(1)闡明科學(xué)數(shù)據(jù)安全分類的復(fù)雜性

基于科學(xué)數(shù)據(jù)的六項(xiàng)數(shù)據(jù)安全特征對(duì)復(fù)雜性做出解釋,特別是多重規(guī)制和倫理因素的影響。這些影響導(dǎo)致許多實(shí)踐困惑,例如難以確定數(shù)據(jù)的法律或倫理規(guī)制,或者無法明確數(shù)據(jù)安全分類與安全分級(jí)的邊界。

(2)開發(fā)科學(xué)數(shù)據(jù)安全分類分級(jí)框架

基于通用的數(shù)據(jù)安全分類分級(jí)框架和科學(xué)數(shù)據(jù)的六項(xiàng)安全特征,以擴(kuò)展和細(xì)化的方式建立科學(xué)數(shù)據(jù)專用的分類分級(jí)框架,同時(shí)為各科學(xué)數(shù)據(jù)相關(guān)機(jī)構(gòu)形成更具個(gè)性化的框架提供一個(gè)系統(tǒng)性、結(jié)構(gòu)化的思考路徑。

(3)提出科學(xué)數(shù)據(jù)保護(hù)的模式

研究提出了三個(gè)科學(xué)數(shù)據(jù)保護(hù)模式:全面模式、平衡模型和簡(jiǎn)化模型。這些模式是不同機(jī)構(gòu)對(duì)數(shù)據(jù)保護(hù)平衡三要素——數(shù)據(jù)合規(guī)、合規(guī)成本和數(shù)據(jù)收益——進(jìn)行綜合權(quán)衡的結(jié)果。具有不同功能定位和不同資源投入的數(shù)據(jù)管理主體可以分別采用相應(yīng)的模式對(duì)所管理數(shù)據(jù)實(shí)施保護(hù)。

1.3 "研究意義

本研究嘗試增加學(xué)術(shù)界、科學(xué)數(shù)據(jù)管理群體和數(shù)據(jù)安全管理部門對(duì)科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)的理解,為相關(guān)數(shù)據(jù)保護(hù)實(shí)踐提供參考。在科學(xué)數(shù)據(jù)對(duì)科學(xué)發(fā)展和政策制定日益重要、數(shù)據(jù)安全監(jiān)管持續(xù)收緊的情況下,本研究對(duì)相關(guān)理論的發(fā)展和具體實(shí)踐有指導(dǎo)意義。

1.3.1 "研究方面

在科學(xué)數(shù)據(jù)安全管理方面有兩項(xiàng)貢獻(xiàn)。首先,提取出科學(xué)數(shù)據(jù)的六項(xiàng)數(shù)據(jù)安全特征,在此基礎(chǔ)上提出了科學(xué)數(shù)據(jù)安全分類分級(jí)框架。這一系統(tǒng)性的科學(xué)數(shù)據(jù)安全分類分級(jí)思考框架,在一定程度上補(bǔ)充了現(xiàn)有研究的不足。其次,提出了科學(xué)數(shù)據(jù)保護(hù)的三種模式,同時(shí)給出了如下兩項(xiàng)相關(guān)發(fā)現(xiàn):

(1)數(shù)據(jù)管理機(jī)構(gòu)在數(shù)據(jù)生態(tài)系統(tǒng)中的功能定位決定了其最適宜的數(shù)據(jù)保護(hù)模式;

(2)數(shù)據(jù)保護(hù)模式的選擇是數(shù)據(jù)管理主體對(duì)數(shù)據(jù)合規(guī)、合規(guī)成本和數(shù)據(jù)收益三個(gè)要素進(jìn)行綜合權(quán)衡的結(jié)果。

上述發(fā)現(xiàn)為相關(guān)研究提供了具有理論支撐的分析框架,同時(shí)促進(jìn)了研究人員、實(shí)踐者和政策制定者之間的持續(xù)對(duì)話。

1.3.2 "實(shí)踐方面

該研究將在如下兩方面對(duì)科學(xué)數(shù)據(jù)保護(hù)實(shí)踐做出貢獻(xiàn)。一是提出了一個(gè)科學(xué)數(shù)據(jù)安全分類和分級(jí)框架,作為系統(tǒng)性的參考和指導(dǎo);其二介紹了三種數(shù)據(jù)保護(hù)模式以及選擇或調(diào)整這些模式的原則,可指導(dǎo)機(jī)構(gòu)在數(shù)據(jù)合規(guī)、合規(guī)成本和數(shù)據(jù)收益最佳平衡的基礎(chǔ)上制定與優(yōu)化數(shù)據(jù)保護(hù)策略及其落地實(shí)施,這對(duì)于確保高效、合理的數(shù)據(jù)保護(hù)至關(guān)重要。

1.4 "論文結(jié)構(gòu)

本文共分為七個(gè)部分。第一部分概述了研究的背景、目標(biāo)及其重要性。第二部介紹了研究所采用的方法。第三部分探討了科學(xué)數(shù)據(jù)的本質(zhì),提出了六個(gè)具有數(shù)據(jù)安全意義的關(guān)鍵特征,為隨后的分類與保護(hù)模式研究奠定了基礎(chǔ)。第四部分深入分析了科學(xué)數(shù)據(jù)安全分類與分級(jí)的實(shí)踐及基本思想,構(gòu)建了相應(yīng)的框架。第五部分提出了三種科學(xué)數(shù)據(jù)保護(hù)模式,并對(duì)其理論依據(jù)與優(yōu)化策略進(jìn)行了詳細(xì)論述。第六部分闡述了本文觀點(diǎn)及應(yīng)用場(chǎng)景。第七部分總結(jié)了研究發(fā)現(xiàn),并指出了未來的研究方向。

2 "研究方法

研究采用網(wǎng)絡(luò)調(diào)查的方法搜集必要的資料,具體

包括調(diào)查設(shè)計(jì)、樣本機(jī)構(gòu)遴選、數(shù)據(jù)收集過程和數(shù)據(jù)分析四個(gè)環(huán)節(jié)。

2.1 "調(diào)查設(shè)計(jì)

調(diào)查的目的是理解樣本機(jī)構(gòu)的科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)實(shí)踐,調(diào)研內(nèi)容包括機(jī)構(gòu)政策、工作報(bào)告、標(biāo)準(zhǔn)規(guī)范以及其他反映數(shù)據(jù)管理實(shí)踐的網(wǎng)絡(luò)公開信息。必要情況下,調(diào)查還將擴(kuò)充至樣本機(jī)構(gòu)所屬監(jiān)管機(jī)構(gòu)的政策與制度。

數(shù)據(jù)收集的主要方法是人工遍歷樣本機(jī)構(gòu)的網(wǎng)站,以獲取樣本機(jī)構(gòu)的如下資料:

(1)數(shù)據(jù)安全分類信息:樣本機(jī)構(gòu)如何根據(jù)敏感性和法規(guī)要求對(duì)科學(xué)數(shù)據(jù)進(jìn)行分類。

(2)數(shù)據(jù)分級(jí)信息:樣本機(jī)構(gòu)如何為不同類型的數(shù)據(jù)分配敏感性或風(fēng)險(xiǎn)等級(jí)。

(3)數(shù)據(jù)保護(hù)實(shí)踐:為保護(hù)數(shù)據(jù)而實(shí)施的措施、政策(包括遵守法規(guī)和遵循倫理標(biāo)準(zhǔn))、規(guī)范、流程、組織、技術(shù)工具以及軟硬件基礎(chǔ)設(shè)施。

(4)數(shù)據(jù)監(jiān)管信息:樣本機(jī)構(gòu)所受數(shù)據(jù)監(jiān)管相關(guān)的政策、法律法規(guī)、標(biāo)準(zhǔn)規(guī)范、行業(yè)政策等。

2.2 "樣本機(jī)構(gòu)遴選

樣本機(jī)構(gòu)遴選力求實(shí)現(xiàn)機(jī)構(gòu)類型和地理區(qū)域的雙重代表性。在機(jī)構(gòu)類型上,調(diào)查以目標(biāo)機(jī)構(gòu)在科學(xué)數(shù)據(jù)生態(tài)系統(tǒng)中的功能定位為遴選標(biāo)準(zhǔn)選定如下三類樣本機(jī)構(gòu):

(1)數(shù)據(jù)管理者:開展科學(xué)數(shù)據(jù)生產(chǎn)、管理、共享和利用的大型綜合性研究機(jī)構(gòu),典型樣本為哈佛大學(xué)。

(2)數(shù)據(jù)托管者:為數(shù)據(jù)所有者提供數(shù)據(jù)托管及開放共享服務(wù)的各類機(jī)構(gòu),典型樣本為美國(guó)校際社會(huì)科學(xué)數(shù)據(jù)共享聯(lián)盟存儲(chǔ)庫(kù)(Inter-university Consortium for Political and Social Research,ICPSR) 等大型科學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)。

(3)數(shù)據(jù)共享服務(wù)提供者:為數(shù)據(jù)所有者提供數(shù)據(jù)共享服務(wù)的各類機(jī)構(gòu),這些機(jī)構(gòu)很少或不會(huì)提供數(shù)據(jù)管護(hù)服務(wù),典型樣本為DRYAD 或Figshare 等數(shù)據(jù)共享機(jī)構(gòu)或平臺(tái)。

(4)政府監(jiān)管部門:對(duì)樣本機(jī)構(gòu)及其政策或?qū)嵺`實(shí)施監(jiān)管或指導(dǎo)的政府部門,其政策構(gòu)成了樣本機(jī)構(gòu)數(shù)據(jù)保護(hù)實(shí)踐的制度環(huán)境和監(jiān)管背景。例如,美國(guó)國(guó)

家衛(wèi)生研究院 或中華人民共和國(guó)科學(xué)技術(shù)部 。

樣本機(jī)構(gòu)需同時(shí)符合如下三條標(biāo)準(zhǔn):

(1)高學(xué)術(shù)影響力:除政府監(jiān)管部門外,入選的樣本機(jī)構(gòu)均須在所管理數(shù)據(jù)的規(guī)模、機(jī)構(gòu)規(guī)模以及機(jī)構(gòu)的學(xué)術(shù)影響力方面具有前列(top20)。

(2)區(qū)域覆蓋:除政府監(jiān)管部門外,入選的樣本機(jī)構(gòu)需覆蓋歐洲、美國(guó)、中國(guó)和其他地域,由此實(shí)現(xiàn)區(qū)域代表性。

(3)同等條件替補(bǔ):若樣本機(jī)構(gòu)缺乏足夠的公開可用信息,則根據(jù)標(biāo)準(zhǔn)1、2遴選新機(jī)構(gòu)作為替代,確保樣本的規(guī)模和代表性。

基于上述標(biāo)準(zhǔn)共遴選了80個(gè)機(jī)構(gòu),篩除17家資料不完整的機(jī)構(gòu),最終得到了63個(gè)樣本(附表1),同時(shí)納入了相關(guān)的10個(gè)監(jiān)管部門或有影響力學(xué)協(xié)會(huì)。

2.3 "數(shù)據(jù)收集過程

(1)網(wǎng)站審查:對(duì)所選組織和相關(guān)政府部門的網(wǎng)站進(jìn)行詳細(xì)瀏覽,以收集有關(guān)數(shù)據(jù)分類、分級(jí)和保護(hù)實(shí)踐的信息,具體包括公開的文件、政策、標(biāo)準(zhǔn)規(guī)范、工作報(bào)告和其他在線可訪問的相關(guān)材料。

(2)信息采集:從所收集的資料中提取關(guān)鍵信息,重點(diǎn)是樣本機(jī)構(gòu)如何分類和分級(jí)科學(xué)數(shù)據(jù)及其采取的保護(hù)措施。此外,調(diào)查還將記錄影響這些實(shí)踐的政府政策和法規(guī)。

(3)數(shù)據(jù)驗(yàn)證:為了確保收集信息的準(zhǔn)確性,在可能的情況下進(jìn)行多方交叉驗(yàn)證。記錄下不一致或含糊之處,并在必要時(shí)進(jìn)行核查等澄清操作。

2.4 "數(shù)據(jù)分析

數(shù)據(jù)分析過程包括以下步驟:

(1)數(shù)據(jù)整理:收集的信息根據(jù)主題進(jìn)行整理和分類:數(shù)據(jù)分類、分級(jí)、保護(hù)實(shí)踐和監(jiān)管合規(guī)性。該整理有助于對(duì)不同組織的實(shí)踐進(jìn)行結(jié)構(gòu)化分析。

(2)比較分析:對(duì)三組樣本機(jī)構(gòu)及相關(guān)管理部門的數(shù)據(jù)保護(hù)實(shí)踐進(jìn)行比較分析,確定其中的異同點(diǎn),以此揭示不同類型組織和政府實(shí)體在數(shù)據(jù)管理方面的模式和趨勢(shì)。

(3)主題分析:運(yùn)用主題分析來識(shí)別調(diào)查資料中的常見主題和見解。主題是基于公開信息中反復(fù)出現(xiàn)的概念和問題發(fā)展而來的。

(4)結(jié)果整合:將比較分析和主題分析的結(jié)果整合起來,以提供對(duì)數(shù)據(jù)保護(hù)實(shí)踐的全面理解。這一整合為本文所提出的分類框架和管理模型的發(fā)展提供了信息。

3 科學(xué)數(shù)據(jù)的數(shù)據(jù)安全特征

科學(xué)數(shù)據(jù)是研究的基礎(chǔ),涵蓋了研究過程中生成的廣泛材料,包括原始數(shù)據(jù)、處理后數(shù)據(jù)和分析結(jié)果[24]。不同于商業(yè)或政府?dāng)?shù)據(jù),科學(xué)數(shù)據(jù)與知識(shí)生產(chǎn)和科學(xué)進(jìn)步緊密相關(guān),這賦予其多樣性和復(fù)雜性,給管理和保護(hù)帶來挑戰(zhàn)[25]??茖W(xué)數(shù)據(jù)源自不同學(xué)科,并應(yīng)用于各種研究背景、公共管理或企業(yè)開發(fā)等場(chǎng)景,每個(gè)生產(chǎn)和應(yīng)用環(huán)節(jié)都有特定的標(biāo)準(zhǔn)、倫理考量和監(jiān)管要求[26]。這種多樣性和復(fù)雜性決定了科學(xué)數(shù)據(jù)的安全特征,以及需要專門針對(duì)這些特征的精細(xì)化數(shù)據(jù)保護(hù)方法[27]。

3.1 "多重監(jiān)管

現(xiàn)代研究的全球性和跨學(xué)科性[28]使得科學(xué)數(shù)據(jù)必然受到多個(gè)監(jiān)管框架(包括倫理規(guī)范)的約束,每個(gè)司法管轄區(qū)和研究領(lǐng)域可能對(duì)數(shù)據(jù)保護(hù)提出各自的特定要求,導(dǎo)致研究人員需要應(yīng)對(duì)復(fù)雜的合規(guī)環(huán)境[29]。例如,在歐洲收集的個(gè)人數(shù)據(jù)必須遵守《通用數(shù)據(jù)保護(hù)條例》(GDPR)[30],而與健康相關(guān)的數(shù)據(jù)可能需要遵守美國(guó)的《健康保險(xiǎn)流通與責(zé)任法》(HIPAA) 。此外,涉及瀕危物種的研究可能受《瀕危野生動(dòng)植物種國(guó)際貿(mào)易公約》(CITES)[31]的監(jiān)管。

多重規(guī)制特征還存在另一個(gè)操作性原因,即科學(xué)數(shù)據(jù)缺乏明確的法律界定。從法律規(guī)制的角度看,科學(xué)數(shù)據(jù)是個(gè)人數(shù)據(jù)、商業(yè)數(shù)據(jù)等多個(gè)法定類型以及公共數(shù)據(jù)等非法定類型的混合,同時(shí)不同類型之間不存在互斥關(guān)系。這種具有交叉關(guān)系的類型混合必然導(dǎo)致多重規(guī)制,并在實(shí)踐中表現(xiàn)為數(shù)據(jù)歸類的模糊性和復(fù)雜性。

3.2 "倫理強(qiáng)規(guī)制

各類數(shù)據(jù)均同時(shí)接受法律和倫理的雙重規(guī)制,并且前者往往居于主導(dǎo)地位。然而,不同于商業(yè)數(shù)據(jù)、公共管理等數(shù)據(jù)大類,科學(xué)數(shù)據(jù)受到了嚴(yán)格且有力的倫理約束。尤其是在生物醫(yī)學(xué)研究或涉及兒童等弱勢(shì)群體的研究領(lǐng)域中,相關(guān)的倫理考量往往超出了法律要求[32-33]。例如,雖然法律法規(guī)可能允許某些數(shù)據(jù)處理活動(dòng),但倫理準(zhǔn)則可能會(huì)施加額外的限制,以保護(hù)參與者的權(quán)利和福祉[34]。

倫理強(qiáng)規(guī)制源于研究人員對(duì)確保其工作完好性(research integrity)以及保護(hù)其人類參與者和學(xué)術(shù)共同體的道德義務(wù)[35],其強(qiáng)制力遠(yuǎn)超商業(yè)倫理和公共數(shù)據(jù)倫理對(duì)相關(guān)數(shù)據(jù)行為的約束。對(duì)于研究人員而言,在絕大多數(shù)情況下,遵守倫理標(biāo)準(zhǔn)與遵守法律要求同等重要,甚至更為重要[36]。

3.3 "學(xué)科領(lǐng)域差異性

研究?jī)?nèi)容、研究方法、固有風(fēng)險(xiǎn)以及監(jiān)管環(huán)境存在學(xué)科、領(lǐng)域差異[37],科學(xué)數(shù)據(jù)的敏感性和保護(hù)需求在不同學(xué)科、領(lǐng)域之間必然存在顯著不同[38]。例如,涉及基因信息的生物醫(yī)學(xué)數(shù)據(jù)比涉及消費(fèi)者行為的社會(huì)科學(xué)調(diào)查數(shù)據(jù)需要更高水平的保護(hù)[39]。學(xué)科領(lǐng)域差異性強(qiáng)調(diào)了需要根據(jù)各研究領(lǐng)域的獨(dú)特風(fēng)險(xiǎn)和監(jiān)管要求制定專門的數(shù)據(jù)保護(hù)策略,凸顯了理解科學(xué)數(shù)據(jù)生成和使用的特定背景的重要性[27]。

3.4 “規(guī)模-風(fēng)險(xiǎn)”帕累托分布

科學(xué)數(shù)據(jù)在規(guī)模與其風(fēng)險(xiǎn)上呈現(xiàn)帕累托分布特征。盡管缺乏統(tǒng)計(jì)證據(jù)量化證明20%的數(shù)據(jù)帶來了80%的風(fēng)險(xiǎn),但長(zhǎng)期科學(xué)數(shù)據(jù)管理實(shí)踐可定性表明,規(guī)模占比最大的開放數(shù)據(jù)具有最小的數(shù)據(jù)風(fēng)險(xiǎn),風(fēng)險(xiǎn)較高的敏感數(shù)據(jù)規(guī)模占比遠(yuǎn)小于開放數(shù)據(jù),風(fēng)險(xiǎn)更高的重要數(shù)據(jù)和核心數(shù)據(jù)占比規(guī)模又遠(yuǎn)遠(yuǎn)小于敏感數(shù)據(jù)。

“規(guī)模-風(fēng)險(xiǎn)”帕累托分布是風(fēng)險(xiǎn)管理的基本理論[40],是科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)的理論立足點(diǎn),也是下文所述三類數(shù)據(jù)保護(hù)模式的基本出發(fā)點(diǎn)。

3.5 "公益性

科學(xué)數(shù)據(jù)往往對(duì)公共利益產(chǎn)生重大影響[41]。例如,促進(jìn)醫(yī)學(xué)進(jìn)步、環(huán)境保護(hù)或社會(huì)政策的數(shù)據(jù)可以為社會(huì)帶來深遠(yuǎn)的利益[42]。因此,確保此類數(shù)據(jù)得到保護(hù)并負(fù)責(zé)任地使用符合社會(huì)公眾的利益[36]。這種對(duì)公共利益的關(guān)注解釋了科學(xué)數(shù)據(jù)保護(hù)不僅是為了實(shí)現(xiàn)數(shù)據(jù)的法律合規(guī),還是為了推動(dòng)數(shù)據(jù)持續(xù)為公共利益做出貢獻(xiàn)[43]??茖W(xué)數(shù)據(jù)保護(hù)在很多時(shí)候是為了保護(hù)從科學(xué)探究中產(chǎn)生的公共利益。

3.6 "動(dòng)態(tài)的敏感性

科學(xué)數(shù)據(jù)的敏感性隨著時(shí)間的推移而變化[25]。曾

經(jīng)非敏感的數(shù)據(jù)可能由于新的科學(xué)發(fā)現(xiàn)、社會(huì)規(guī)范的變化或不斷發(fā)展的監(jiān)管標(biāo)準(zhǔn)而變得敏感[24]。例如,當(dāng)前匿名化的基因數(shù)據(jù)可能隨著大數(shù)據(jù)分析技術(shù)的進(jìn)步而再次關(guān)聯(lián)到特定人員,或者生命科學(xué)研究的發(fā)展使得靜脈紋理圖像[44]、心音[45]或者腦電波[46]都成為了可識(shí)別個(gè)人身份的敏感信息。

數(shù)據(jù)敏感性的動(dòng)態(tài)性要求靈活和適應(yīng)性強(qiáng)的數(shù)據(jù)保護(hù)策略[26]。研究人員和數(shù)據(jù)管理者必須準(zhǔn)備好隨著數(shù)據(jù)敏感性的變化不斷重新評(píng)估和調(diào)整其保護(hù)措施[47]。

科學(xué)數(shù)據(jù)的六個(gè)特征源于其全球性、跨學(xué)科和受倫理約束的研究本質(zhì)[24],體現(xiàn)為多重監(jiān)管、強(qiáng)倫理規(guī)制、學(xué)科差異性、公益性和動(dòng)態(tài)敏感性。這些特征相互關(guān)聯(lián),構(gòu)成復(fù)雜的數(shù)據(jù)保護(hù)環(huán)境,例如,法規(guī)合規(guī)可能受到倫理的影響[27],而動(dòng)態(tài)敏感性可能與公益性相關(guān)。理解這些特征對(duì)于制定能夠滿足科學(xué)數(shù)據(jù)獨(dú)特需求的有效數(shù)據(jù)保護(hù)策略至關(guān)重要[32]。

4 "科學(xué)數(shù)據(jù)安全分類分級(jí)

數(shù)據(jù)的安全分類與安全分級(jí)具有不同的管理意義:前者確定數(shù)據(jù)的適用規(guī)制[48],是數(shù)據(jù)安全管理專業(yè)性的體現(xiàn);后者確定數(shù)據(jù)的風(fēng)險(xiǎn)程度,是匹配數(shù)據(jù)保護(hù)措施的依據(jù);二者共同確定了給定機(jī)構(gòu)的適管數(shù)據(jù)范圍,是“數(shù)據(jù)合規(guī)、合規(guī)成本、數(shù)據(jù)收益”三角平衡的支點(diǎn)??茖W(xué)數(shù)據(jù)是通用數(shù)據(jù)安全分類分級(jí)框架的具體實(shí)現(xiàn)與擴(kuò)展。

4.1 "數(shù)據(jù)的安全分類分級(jí)

數(shù)據(jù)的安全分類分級(jí)是從安全角度對(duì)數(shù)據(jù)進(jìn)行的水平或垂直劃分。水平分類針對(duì)數(shù)據(jù)所含信息的敏感性,其依據(jù)是相關(guān)法律、倫理、標(biāo)準(zhǔn)規(guī)范和行業(yè)或機(jī)構(gòu)政策對(duì)敏感信息的界定,其意義在于明確數(shù)據(jù)的適用規(guī)制系統(tǒng)(例如,個(gè)人數(shù)據(jù)由《中華人民共和國(guó)個(gè)人信息保護(hù)法》9規(guī)制),最終實(shí)現(xiàn)敏感信息的專業(yè)化處理,即由最理解數(shù)據(jù)內(nèi)容和規(guī)制要求的專業(yè)人員識(shí)別與界定敏感信息。垂直分級(jí)針對(duì)數(shù)據(jù)相關(guān)風(fēng)險(xiǎn)的性質(zhì)和影響程度(包括數(shù)據(jù)本身的風(fēng)險(xiǎn)及數(shù)據(jù)相關(guān)行為的負(fù)外部性),其管理意義是籍由等級(jí)化的風(fēng)險(xiǎn)界定(例如,重要數(shù)據(jù)或核心數(shù)據(jù))確定必要的安全保護(hù)措施,最終實(shí)現(xiàn)“數(shù)據(jù)合規(guī)、合規(guī)成本、數(shù)據(jù)收益”三角平衡。

數(shù)據(jù)的安全分類與安全分級(jí)均由數(shù)據(jù)安全規(guī)則體系決定。其中,法律規(guī)制和倫理規(guī)制提出要求或原則,標(biāo)準(zhǔn)規(guī)范和機(jī)構(gòu)政策將之映射為各具體機(jī)構(gòu)的操作性政策或規(guī)則,同時(shí)融入機(jī)構(gòu)級(jí)數(shù)據(jù)訴求。觀察具體實(shí)踐可以發(fā)現(xiàn),盡管國(guó)內(nèi)外的數(shù)據(jù)安全制度存在較大差異,但我國(guó)和美歐等主要國(guó)家均采用了國(guó)家秘密數(shù)據(jù)、非國(guó)家秘密但受到控制的數(shù)據(jù)(以下簡(jiǎn)稱受控非密數(shù)據(jù),Unclassed controlled data, UCD)以及一般數(shù)據(jù)的三元框架(表1)。

9 https://www.gov.cn/xinwen/2021-08/20/content_5632486.htm

10 http://gongbao.court.gov.cn/Details/a1c97149796e14f585c1662b0f9099.html

11 http://www.npc.gov.cn/c2/c30834/202106/t20210610_311888.html

國(guó)家秘密數(shù)據(jù)(或者說,含有國(guó)家秘密信息的數(shù)據(jù))的規(guī)制依據(jù)是《中華人民共和國(guó)保守國(guó)家秘密法》,是指關(guān)系國(guó)家的安全和利益,依照法定程序確定,在一定時(shí)間內(nèi)只限一定范圍的人員知悉的事項(xiàng)。國(guó)家秘密在類型上包括國(guó)家事務(wù)重大決策中的秘密事項(xiàng)、國(guó)防建設(shè)和武裝力量活動(dòng)中的秘密事項(xiàng)、外交和外事活動(dòng)中的秘密事項(xiàng)以及對(duì)外承擔(dān)保密義務(wù)的秘密事項(xiàng)、國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展中的秘密事項(xiàng)、科學(xué)技術(shù)中的秘密事項(xiàng)等7個(gè)細(xì)分子類,在等級(jí)上包括絕密、機(jī)密和秘密3個(gè)等級(jí)。與我國(guó)不同,美國(guó)沒有單一的國(guó)家秘密法,而是由《信息自由法》等一系列相關(guān)的法律、法規(guī)形成的綜合性規(guī)制依據(jù),由此形成的國(guó)家秘密(Classified Information)在類型上包括軍事計(jì)劃、外國(guó)政府信息、情報(bào)活動(dòng)、外交活動(dòng)、與國(guó)家安全有關(guān)的科技事項(xiàng)等8個(gè)細(xì)分子類,同樣分為頂級(jí)機(jī)密(Top secret)、機(jī)密(secret)和秘密(confidential)3個(gè)等級(jí)。

受控非密數(shù)據(jù)是指不屬于國(guó)家秘密但需要在國(guó)家層面施予特別保護(hù)措施的數(shù)據(jù)。該類名和內(nèi)涵均借用自美國(guó)的同名數(shù)據(jù)安全類型。我國(guó)法律規(guī)制中沒有單設(shè)這一類型,但借助重要數(shù)據(jù)和核心數(shù)據(jù)形成了枚舉性界定[49]。借用UCD概念的主要考量是其在中美兩個(gè)異質(zhì)規(guī)制系統(tǒng)中的定位相似性:二者均居于國(guó)家秘密數(shù)據(jù)和一般數(shù)據(jù)之間,且三者在內(nèi)涵、外延與規(guī)制力度三方面均表現(xiàn)出梯度銜接關(guān)系。美國(guó)的受控非密數(shù)據(jù)包含了20個(gè)公共事項(xiàng)主類(包括關(guān)鍵基礎(chǔ)設(shè)施、防御、執(zhí)法、核、專利等)和125個(gè)子類。相對(duì)而言,我國(guó)沒有明確給出重要數(shù)據(jù)和核心數(shù)據(jù)的細(xì)分子類,這意味著我國(guó)的UCD在理論上可以覆蓋除國(guó)家秘密外所有的數(shù)據(jù)。此外還需要注意到,核心數(shù)據(jù)相對(duì)于重要數(shù)據(jù)而言更多體現(xiàn)了風(fēng)險(xiǎn)水平的提升而非風(fēng)險(xiǎn)內(nèi)容的差異,即二者構(gòu)成了風(fēng)險(xiǎn)高低的等級(jí)關(guān)系而非平行的類型關(guān)系。

一般數(shù)據(jù)囊括了國(guó)家秘密和受控非密數(shù)據(jù)之外的全部數(shù)據(jù),是一個(gè)兜底性質(zhì)的數(shù)據(jù)類型。歐美數(shù)據(jù)安全體系中沒有對(duì)應(yīng)類型,其在實(shí)踐中往往以“敏感數(shù)據(jù)+開放數(shù)據(jù)”的形式表達(dá)類似的含義。其中,敏感數(shù)據(jù)是含有敏感信息因而需要采取合規(guī)措施予以保護(hù)的數(shù)據(jù),其識(shí)別和規(guī)制依據(jù)包括《中華人民共和國(guó)個(gè)人信息保護(hù)法》《通用數(shù)據(jù)保護(hù)條例》《健康保險(xiǎn)可攜性與責(zé)任法案》等專業(yè)硬法,也包括《科學(xué)數(shù)據(jù)管理辦法》《紐倫堡法典》《西蒙報(bào)告》《赫爾辛基宣言》等軟法或科學(xué)倫理,以及《數(shù)據(jù)安全技術(shù) 數(shù)據(jù)分類分級(jí)規(guī)則》[49]等標(biāo)準(zhǔn)規(guī)范。國(guó)內(nèi)外一般數(shù)據(jù)的細(xì)分子類差別很大:我國(guó)的規(guī)制系統(tǒng)將一般數(shù)據(jù)分為個(gè)人數(shù)據(jù)、商業(yè)秘密數(shù)據(jù)、公共利益/秩序與公共安全相關(guān)數(shù)據(jù)和其他數(shù)據(jù)四個(gè)大類,其中個(gè)人數(shù)據(jù)具體分為26個(gè)子類[49];歐盟各成員國(guó)則不在此類型中顯式納入公共利益、秩序與安全數(shù)據(jù)和其他數(shù)據(jù)等類型。同時(shí),個(gè)人數(shù)據(jù)具體分為基本個(gè)人信息等8個(gè)大類12小類12。

整體觀察三個(gè)大的安全類型可以發(fā)現(xiàn),國(guó)家秘密數(shù)據(jù)、受控非密數(shù)據(jù)和一般數(shù)據(jù)的規(guī)制依據(jù)在多樣性和擴(kuò)展性上逐漸增加。以我國(guó)為例。國(guó)家秘密由《中華人民共和國(guó)保守國(guó)家秘密法》單一規(guī)制,具有明顯的封閉性;受控非密數(shù)據(jù)由《數(shù)據(jù)安全法》等數(shù)據(jù)安全主法及一系列相關(guān)法律和標(biāo)準(zhǔn)規(guī)范進(jìn)行規(guī)制,類型和數(shù)量較之國(guó)家秘密數(shù)據(jù)有所增多,呈現(xiàn)了一定的擴(kuò)展性;一般數(shù)據(jù)則由《個(gè)人信息保護(hù)法》等數(shù)量眾多的專業(yè)法所規(guī)制,并且隨著人類科技探索和司法實(shí)踐的發(fā)展,新的法條或倫理規(guī)則不斷加入,呈現(xiàn)了顯著的擴(kuò)展性。相對(duì)而言,由于科學(xué)研究領(lǐng)域的探索性,科學(xué)數(shù)據(jù)在“一般數(shù)據(jù)”類型中的多樣性和擴(kuò)展性更加突出。

4.2 "科學(xué)數(shù)據(jù)的安全分類

科學(xué)數(shù)據(jù)最寬泛的定義是具有科學(xué)價(jià)值的數(shù)據(jù),這一功能導(dǎo)向的界定意味著科學(xué)數(shù)據(jù)在理論上覆蓋了表1中的全部數(shù)據(jù)安全類型。畢竟僅就數(shù)據(jù)本身而言,無論是國(guó)家秘密還是受控非密數(shù)據(jù)都可以成為研究證據(jù)。然而在具體實(shí)踐中,國(guó)家秘密數(shù)據(jù)因其特殊的保護(hù)措施而不被視為科學(xué)數(shù)據(jù)的保護(hù)范圍,受控非密數(shù)據(jù)也僅僅在特殊情況下(例如,由研究活動(dòng)所收集)極小部分地被納入科學(xué)數(shù)據(jù)保護(hù)范圍。換言之,科學(xué)數(shù)據(jù)安全保護(hù)的對(duì)象基本上是表1中的一般數(shù)據(jù)。

然而,即使僅僅集中于一般數(shù)據(jù)類型,科學(xué)數(shù)據(jù)本質(zhì)及其六個(gè)安全特性也形成了數(shù)量較多的子類型,并籍由這種擴(kuò)充形成了科學(xué)數(shù)據(jù)的安全分類(表2)。

科學(xué)數(shù)據(jù)安全分類的復(fù)雜性在不同的組織機(jī)構(gòu)具有不同的表現(xiàn),主要取決于相關(guān)機(jī)構(gòu)涉及學(xué)科領(lǐng)

12 https://gdpr-info.eu/

域的全面程度。對(duì)于哈佛大學(xué)等綜合性大學(xué)而言,多學(xué)科乃至全學(xué)科覆蓋的特點(diǎn)決定了其所管理數(shù)據(jù)的分類必然是復(fù)雜的,因而很少制定全局統(tǒng)一的分類標(biāo)準(zhǔn),基本上通過不同的專業(yè)倫理委員會(huì)實(shí)施數(shù)據(jù)敏感性內(nèi)容的專業(yè)判斷。另一方面,對(duì)于大部分專業(yè)性學(xué)科領(lǐng)域數(shù)據(jù)倉(cāng)儲(chǔ)而言,由于所涉及學(xué)科領(lǐng)域數(shù)量較少且相對(duì)集中,敏感信息的類型較少,因而往往制定并執(zhí)行全局統(tǒng)一的分類標(biāo)準(zhǔn)。然而整體上,科學(xué)數(shù)據(jù)所含敏感信息基本上可歸入表2所示的類型框架。

13 部分個(gè)人生物數(shù)據(jù)歸屬個(gè)人數(shù)據(jù)類別

4.3 "科學(xué)數(shù)據(jù)的分級(jí)

科學(xué)數(shù)據(jù)分級(jí)直接關(guān)聯(lián)數(shù)據(jù)保護(hù)措施,是通用數(shù)據(jù)分級(jí)框架與方法在科學(xué)數(shù)據(jù)上的具體應(yīng)用。與此同時(shí),在科學(xué)數(shù)據(jù)盡可能開放的原則下,學(xué)術(shù)界和科學(xué)數(shù)據(jù)管理部門在合規(guī)的前提下,借助數(shù)據(jù)安全訪問模型[50]14等理論,基于數(shù)據(jù)敏感內(nèi)容的規(guī)制類型和風(fēng)險(xiǎn)程度,發(fā)展形成了多種力度不同的數(shù)據(jù)保護(hù)方法,形成了事實(shí)上的安全等級(jí)細(xì)分框架(表3)。

表3表明,實(shí)踐中的科學(xué)數(shù)據(jù)分級(jí)主要覆蓋了一般數(shù)據(jù),除極少數(shù)數(shù)據(jù)生產(chǎn)管理單位(例如,哈佛大學(xué))外,絕大部分?jǐn)?shù)據(jù)管理機(jī)構(gòu)僅處理一般數(shù)據(jù)類型。從規(guī)模的角度,絕大部分?jǐn)?shù)據(jù)在等級(jí)上隸屬開放數(shù)據(jù)、內(nèi)部數(shù)據(jù)和一般敏感數(shù)據(jù),高度和極高敏感數(shù)據(jù)占比很少。

5 "科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)模式

科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)具有不同于其他領(lǐng)域數(shù)據(jù)的管理流程與組織結(jié)構(gòu),這些管理要素的穩(wěn)定組合形成了全面、平衡和精簡(jiǎn)三個(gè)模式,其決定性因素是科學(xué)數(shù)據(jù)管理主體在科學(xué)數(shù)據(jù)生態(tài)系統(tǒng)中的功能定位。

5.1 "科學(xué)數(shù)據(jù)管理者的生態(tài)功能定位

開放科學(xué)和科學(xué)數(shù)據(jù)的大數(shù)據(jù)化正在推動(dòng)科學(xué)數(shù)

14 http://fivesafes.org/

據(jù)生態(tài)系統(tǒng)[51-52]的形成。貫穿這一生態(tài)系統(tǒng)的主干是數(shù)據(jù)“生產(chǎn)-存檔-共享-利用”的生存周期,不同的生態(tài)系統(tǒng)參與者涉及了不同周期階段或其組合,形成了各自不同的功能定位。從數(shù)據(jù)安全管理的角度,除數(shù)據(jù)用戶群體外,具有明確功能定位的主要參與者還包括科學(xué)數(shù)據(jù)生產(chǎn)管理者、科學(xué)數(shù)據(jù)受托管理者和科學(xué)數(shù)據(jù)共享服務(wù)提供者三個(gè)群體。

科學(xué)數(shù)據(jù)生產(chǎn)管理者在功能上覆蓋了數(shù)據(jù)生存周期的全部環(huán)節(jié),其數(shù)據(jù)管理的首要目的是保護(hù)并最大化自身數(shù)據(jù)的價(jià)值,其典型代表是研究型大學(xué)或中國(guó)科學(xué)院等大型綜合性研究機(jī)構(gòu)??茖W(xué)數(shù)據(jù)生產(chǎn)管理者需要同時(shí)管理自身生產(chǎn)和外部托管的數(shù)據(jù),這意味著它需要囊括自身生產(chǎn)的所有類型的數(shù)據(jù),同時(shí)還要覆蓋從數(shù)據(jù)生產(chǎn)環(huán)節(jié)開始的全部數(shù)據(jù)安全域[53],這種功能定位客觀上決定了其數(shù)據(jù)安全管理對(duì)數(shù)據(jù)安全類型、風(fēng)險(xiǎn)和數(shù)據(jù)保護(hù)的全面覆蓋。

科學(xué)數(shù)據(jù)受托管理者在功能上覆蓋了除數(shù)據(jù)生產(chǎn)之外的數(shù)據(jù)生存周期環(huán)節(jié),同時(shí)具有兩個(gè)突出特點(diǎn):其一,所管理數(shù)據(jù)均來自機(jī)構(gòu)外部委托者(主要是數(shù)據(jù)生產(chǎn)者或?qū)嶋H控制者),管理者與委托者簽訂托管協(xié)議并據(jù)此為后者提供數(shù)據(jù)管護(hù)與共享服務(wù);其二,數(shù)據(jù)管理的主要目的是在數(shù)據(jù)合規(guī)的前提下,實(shí)現(xiàn)數(shù)據(jù)共享以促進(jìn)數(shù)據(jù)價(jià)值發(fā)揮。典型的受托管理者包括ICPSR、Zenodo15、國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心16等學(xué)科領(lǐng)域或綜合性科學(xué)數(shù)據(jù)中心,以及Scientific Data17等開展數(shù)據(jù)出版的學(xué)術(shù)出版機(jī)構(gòu)。從數(shù)據(jù)安全管理的角度,受托管理者采用了一種平衡策略——即通過排除部分高規(guī)制數(shù)據(jù)(例如,通過拒稿或拒絕接收等方式排除重要數(shù)據(jù)或核心數(shù)據(jù)等需要更高數(shù)據(jù)保護(hù)措施的數(shù)據(jù)),實(shí)現(xiàn)數(shù)據(jù)合規(guī)、管理成本和數(shù)據(jù)收益的最佳平衡。

科學(xué)數(shù)據(jù)共享服務(wù)提供者僅提供數(shù)據(jù)共享功能,很多機(jī)構(gòu)甚至借助將數(shù)據(jù)存儲(chǔ)于第三方倉(cāng)儲(chǔ)的方式進(jìn)一步縮減其在生態(tài)系統(tǒng)中的功能覆蓋。典型的科學(xué)數(shù)據(jù)共享服務(wù)提供者包括Figshare、DYARD等科學(xué)數(shù)據(jù)共享中心。在實(shí)踐中,共享服務(wù)提供者普遍要求托管者基于CC BY 4.0等制式協(xié)議18——通常由數(shù)據(jù)提交者聲明承擔(dān)數(shù)據(jù)的質(zhì)量和安全責(zé)任——自助提交與發(fā)布數(shù)據(jù)。借助這種“協(xié)議+自助”的方式,數(shù)據(jù)共享服務(wù)者事實(shí)上僅接收開放數(shù)據(jù)而排除了所有需要特別保護(hù)措施的數(shù)據(jù),由此以最少投入的形式實(shí)現(xiàn)了數(shù)據(jù)合規(guī)、數(shù)據(jù)管理成本和數(shù)據(jù)共享的精簡(jiǎn)式平衡。

5.2 "全面模式:哈佛大學(xué)

全面模式覆蓋了科學(xué)數(shù)據(jù)生存周期全程及數(shù)據(jù)安全管理的全部過程域,涉及了全部的數(shù)據(jù)安全類型和等級(jí),主要由各類科學(xué)數(shù)據(jù)生產(chǎn)管理者采用。這些機(jī)構(gòu)的研究活動(dòng)規(guī)模大、類型多且覆蓋了眾多學(xué)科領(lǐng)域,涉及到大量數(shù)據(jù)的生產(chǎn)和流動(dòng)、復(fù)雜多樣的數(shù)據(jù)安全場(chǎng)景和幾乎全部的數(shù)據(jù)安全類型,使得數(shù)據(jù)合規(guī)成為其數(shù)據(jù)安全管理的嚴(yán)峻挑戰(zhàn)和首要目標(biāo),科學(xué)數(shù)據(jù)存檔與復(fù)用成為了相對(duì)次要的目標(biāo)。在三種數(shù)據(jù)保護(hù)模式中,全面模式的數(shù)據(jù)規(guī)制范圍最大、規(guī)制力度最強(qiáng)且規(guī)制成本最高。

哈佛大學(xué)的全面數(shù)據(jù)保護(hù)主要體現(xiàn)在分類分級(jí)和數(shù)據(jù)保護(hù)流程兩個(gè)方面。

15 https://zenodo.org/

16 https://www.agridata.cn/#/home

17 https://www.nature.com/sdata/

18 https://creativecommons.org/licenses/by/4.0/legalcode.zh-hans

(1)全面的數(shù)據(jù)安全分類分級(jí)方案

哈佛大學(xué)的教學(xué)研究涉及了自然科學(xué)、社會(huì)科學(xué)、人文學(xué)科等五十余個(gè)學(xué)科門類,這決定了其所管理數(shù)據(jù)(包括大學(xué)研究人員生產(chǎn)和托管的數(shù)據(jù))的內(nèi)容多樣性,形成了其復(fù)雜、全面的數(shù)據(jù)安全分類分級(jí)方案(表4、表5)。

這一方案體現(xiàn)了“管理分類、風(fēng)險(xiǎn)定級(jí)”的思想:首先根據(jù)數(shù)據(jù)所含敏感信息的專業(yè)或管理屬性確定其類型,以此實(shí)現(xiàn)數(shù)據(jù)與其處理人員的專業(yè)或管理匹配;其次,根據(jù)數(shù)據(jù)風(fēng)險(xiǎn)的性質(zhì)、發(fā)生的可能性以及相應(yīng)后果的嚴(yán)重程度,確定各類數(shù)據(jù)的安全等級(jí)并匹配以相應(yīng)的安全保護(hù)措施。

哈佛大學(xué)并未給出數(shù)據(jù)安全類型的統(tǒng)一說明——可能與敏感信息的學(xué)科領(lǐng)域差異有關(guān)——而是在數(shù)據(jù)安全分類分級(jí)管理流程(圖1)中提及了7種不同的類型。這些類型分別歸屬研究視角和管理視角兩個(gè)維度(表4)。其中,研究視角關(guān)注法律規(guī)制和倫理規(guī)范的敏感內(nèi)容,管理視角關(guān)注政策和管理層面的敏感內(nèi)容。整體上,個(gè)人數(shù)據(jù)是體量最大且最受關(guān)注的數(shù)據(jù)安全類型。

哈佛大學(xué)通過數(shù)據(jù)安全管理部門發(fā)布了具有5級(jí)數(shù)據(jù)安全等級(jí)標(biāo)準(zhǔn)(表5)。該標(biāo)準(zhǔn)覆蓋了大學(xué)自身生產(chǎn)的數(shù)據(jù)和因托管或合作等納入管理范圍的數(shù)據(jù)。數(shù)據(jù)專業(yè)機(jī)構(gòu)和校信息數(shù)據(jù)管理部門共同確定特定數(shù)據(jù)的安全等級(jí)。

(2)“學(xué)術(shù)評(píng)審+信息安全批準(zhǔn)”的兩階段數(shù)據(jù)保護(hù)流程

哈佛大學(xué)設(shè)置了兩階段的數(shù)據(jù)分類分級(jí)保護(hù)流程,并發(fā)展了配套的組織機(jī)構(gòu)與技術(shù)、工具和軟硬件基礎(chǔ)設(shè)施(圖1)。第一個(gè)階段是各類學(xué)術(shù)機(jī)構(gòu)主導(dǎo)的數(shù)據(jù)安全類型判斷與等級(jí)審定。研究項(xiàng)目負(fù)責(zé)人(PI)在研究啟動(dòng)前需要根據(jù)數(shù)據(jù)合規(guī)和科學(xué)倫理的要求及相應(yīng)標(biāo)準(zhǔn)規(guī)范,初步判斷所收集數(shù)據(jù)的安全類型及等級(jí),進(jìn)而根據(jù)數(shù)據(jù)類型,借助相應(yīng)的數(shù)據(jù)安全評(píng)審系統(tǒng)(例如,ESTR-IRB)向負(fù)責(zé)該類數(shù)據(jù)倫理審批的學(xué)術(shù)機(jī)構(gòu)(例如,IRB或COMS)報(bào)送數(shù)據(jù)安全等級(jí)(Data security level, DSL)及相應(yīng)的數(shù)據(jù)安全保護(hù)計(jì)劃(Data security plan, DSP)。審批機(jī)構(gòu)根據(jù)學(xué)校的數(shù)據(jù)安全管理政策和倫理規(guī)范審定DSL并判斷DSP的合理性與有效性。第二個(gè)階段是信息安全部門主導(dǎo)(ISR)的數(shù)據(jù)安全等級(jí)核準(zhǔn)與分級(jí)保護(hù)。在這一階段,當(dāng)數(shù)據(jù)的DSL大于三級(jí)時(shí)(表5),

19 《關(guān)于防止受關(guān)注國(guó)家獲取美國(guó)人大量敏感個(gè)人數(shù)據(jù)和美國(guó)政府相關(guān)數(shù)據(jù)的行政命令》(Executive Order on Preventing Access to Americans\" Bulk Sensitive Personal Data and United States Government-Related Data by Countries of Concern),https://www.federalregister.gov/documents/2024/03/01/2024- 04573/preventing-access-to-americans-bulk-sensitive-personal-data-and-united-states-government-related.

20 https://privsec.harvard.edu/data-classification-table

項(xiàng)目負(fù)責(zé)人需通過專有系統(tǒng)向ISR呈報(bào)第一階段已批復(fù)的DSP和DSL。只有得到ISR的最終核準(zhǔn)后,PI才能啟動(dòng)數(shù)據(jù)采集等研究工作。ISR主要由信息安全技術(shù)、管理和數(shù)據(jù)安全法務(wù)人員組成,其職責(zé)是開展數(shù)據(jù)安全合規(guī)審查與監(jiān)管。完成審批后,PI在項(xiàng)目全程均需嚴(yán)格遵循批復(fù)的DSP開展數(shù)據(jù)活動(dòng)——例如,通過與DSL等級(jí)相匹配的安全設(shè)施或系統(tǒng)進(jìn)行數(shù)據(jù)加工、傳輸、存儲(chǔ)與共享——并及時(shí)向ISR報(bào)告數(shù)據(jù)安全事項(xiàng)以接受其監(jiān)督。

在流程之外,學(xué)校還配套了ESTR-IRB、安全終端、云安全存儲(chǔ)等數(shù)據(jù)安全軟硬件系統(tǒng),以及專業(yè)性或綜合性機(jī)構(gòu)審查委員會(huì)、對(duì)外合作辦公室、數(shù)據(jù)安全審查專員等角色與責(zé)任機(jī)構(gòu),從技術(shù)和組織上保障了敏感數(shù)據(jù)(L3以上)始終流動(dòng)在受控“管道”中。

5.3 "平衡模式:ICPSR

數(shù)據(jù)分類分級(jí)保護(hù)的平衡模式是指數(shù)據(jù)管理主體采用排除高規(guī)制數(shù)據(jù)(主要是國(guó)家秘密數(shù)據(jù)和受控非密數(shù)據(jù))的方式,構(gòu)造適配自身數(shù)據(jù)管理目標(biāo)的數(shù)據(jù)類型和等級(jí)并配置必要保護(hù)措施,從而在有限投入的情況下兼顧數(shù)據(jù)合規(guī)與數(shù)據(jù)利用的管理模式。這一模式的實(shí)踐者是各類數(shù)據(jù)受托管理者:早期主要是ICPSR等學(xué)科領(lǐng)域數(shù)據(jù)中心;隨著學(xué)術(shù)出版界開始要求作者提供研究支撐性數(shù)據(jù)或直接出版數(shù)據(jù),很多學(xué)術(shù)期刊(特別是開展數(shù)據(jù)出版的期刊)也從成本和收益平衡的角度采用這一模式。

ICPSR實(shí)踐了典型的平衡模式。該數(shù)據(jù)中心面向人文社科領(lǐng)域中的教育、老齡化、刑事司法、恐怖主義等21個(gè)主題,收錄數(shù)據(jù)檔案50萬份以上,是全球最大的社科類科學(xué)數(shù)據(jù)中心,也因其數(shù)據(jù)管護(hù)的規(guī)范性和共享的廣泛性躋身于世界級(jí)的科學(xué)數(shù)據(jù)中心。ICPSR的主要做法包括數(shù)據(jù)安全分類分級(jí)方案以及分類分級(jí)保護(hù)流程兩方面。

5.3.1 "平衡性的數(shù)據(jù)安全分類分級(jí)方案

數(shù)據(jù)托管者管理的數(shù)據(jù)均來自外部,這意味著此類機(jī)構(gòu)可以根據(jù)自身的專業(yè)范圍和財(cái)務(wù)資源等因素,確定可納入管理范圍的數(shù)據(jù)安全類型與等級(jí)。例如,ICPSR主要服務(wù)人文社科領(lǐng)域研究,因此其以個(gè)人數(shù)據(jù)作為主要的數(shù)據(jù)安全類型;GBIF面向生物多樣性,因而更重視珍稀物種棲息地位置等敏感信息。需要注意的是,大多數(shù)托管者涉及的學(xué)科領(lǐng)域相對(duì)有限,數(shù)據(jù)安全類型數(shù)量少,因此往往不會(huì)給出明確的數(shù)據(jù)安全分類標(biāo)準(zhǔn)。

數(shù)據(jù)類型的縮小必然帶來安全等級(jí)的簡(jiǎn)化。大部分托管者僅設(shè)置了敏感數(shù)據(jù)(或受限訪問數(shù)據(jù)21等類似名稱)與開放數(shù)據(jù)兩個(gè)大的等級(jí),部分機(jī)構(gòu)會(huì)將歸屬法律規(guī)制的敏感數(shù)據(jù)單列為一個(gè)高度敏感數(shù)據(jù)等級(jí)22。ICPSR在其數(shù)據(jù)管理政策中明確排除了任何涉及國(guó)家秘密和國(guó)家安全相關(guān)的數(shù)據(jù),意味著其事實(shí)上僅處理一般數(shù)據(jù)(包括敏感數(shù)據(jù)和開放數(shù)據(jù))中的3個(gè)安全等級(jí)(表6)。

5.3.2 “選擇性納入與技術(shù)性定級(jí)+分級(jí)訪問”的三階段分類分級(jí)保護(hù)流程

ICPSR采用“選擇性納入+非學(xué)術(shù)定級(jí)+分級(jí)訪問”

3階段流程(圖2)?!斑x擇性納入與技術(shù)性定級(jí)”發(fā)生在數(shù)據(jù)收集環(huán)節(jié)。ICPSR在該環(huán)節(jié)設(shè)置了數(shù)據(jù)存檔適宜性評(píng)審,對(duì)數(shù)據(jù)的學(xué)術(shù)價(jià)值、存檔價(jià)值和安全風(fēng)

21 https://www.icpsr.umich.edu/web/pages/ICPSR/access/restricted/

22 https://ukdataservice.ac.uk/find-data/access-conditions/secure-application-requirements/

23 ICPSR并未在其政策中明確界定這一等級(jí)。然而在其敏感數(shù)據(jù)訪問政策和操作規(guī)程中,明確指出部分含有高度敏感信息的數(shù)據(jù)必須采用書面申請(qǐng)和到館使用等非常嚴(yán)格的訪問措施,在事實(shí)上確定了這一安全等級(jí)。

險(xiǎn)進(jìn)行評(píng)審,其中安全評(píng)審的目的是排除高規(guī)制數(shù)據(jù),同時(shí)根據(jù)數(shù)據(jù)敏感內(nèi)容的類型(主要為個(gè)人身份信息和商業(yè)秘密)和程度將其標(biāo)定為開放數(shù)據(jù)、受限使用數(shù)據(jù)和高度受限使用數(shù)據(jù)。該評(píng)審由數(shù)據(jù)管護(hù)人員而非學(xué)科領(lǐng)域?qū)<覍?shí)施。在“分級(jí)訪問”環(huán)節(jié),ICPSR的數(shù)據(jù)服務(wù)團(tuán)隊(duì)采用“請(qǐng)求-批準(zhǔn)”方式保護(hù)敏感數(shù)據(jù),具體措施包括RUD數(shù)據(jù)的安全下載、遠(yuǎn)程安全訪問終端、數(shù)據(jù)飛地24,以及專門用于高度受限使用數(shù)據(jù)的數(shù)據(jù)安全實(shí)驗(yàn)室25等。

5.4 "精簡(jiǎn)模式:DRYAD

精簡(jiǎn)模式在某種程度上是平衡模式的進(jìn)一步簡(jiǎn)化,即管理者排除了開放數(shù)據(jù)之外的所有數(shù)據(jù),意味著管理者無需進(jìn)行數(shù)據(jù)安全分類分級(jí)及其他與數(shù)據(jù)保密性有關(guān)的工作,實(shí)現(xiàn)了最小的數(shù)據(jù)合規(guī)成本。

精簡(jiǎn)模式的采用者基本上是DRYAD、Figshare等公益性或非盈利數(shù)據(jù)共享中心。DRYAD是由美國(guó)國(guó)家生態(tài)分析與合成中心和美國(guó)國(guó)家進(jìn)化合成中心主辦的科學(xué)數(shù)據(jù)倉(cāng)儲(chǔ)機(jī)構(gòu),專注于進(jìn)化生物學(xué)領(lǐng)域科學(xué)數(shù)據(jù)的管護(hù)與共享,主要借助亞馬遜云服務(wù)實(shí)現(xiàn)實(shí)驗(yàn)數(shù)據(jù)、觀測(cè)數(shù)據(jù)、模擬數(shù)據(jù)等多種生態(tài)學(xué)和進(jìn)化生物學(xué)數(shù)據(jù)的存儲(chǔ)。

DRYAD的數(shù)據(jù)保護(hù)措施集中在數(shù)據(jù)收納階段的數(shù)據(jù)篩除操作。數(shù)據(jù)管護(hù)人員對(duì)所提交的數(shù)據(jù)進(jìn)行審議以判斷其數(shù)據(jù)作者身份和數(shù)據(jù)的真實(shí)性、可靠性與可用性,同時(shí)判斷數(shù)據(jù)是否含有個(gè)人身份信息等敏感內(nèi)容,以此回避所有高規(guī)制數(shù)據(jù)。

6 "本文觀點(diǎn)及其應(yīng)用場(chǎng)景

6.1 "觀點(diǎn)

科學(xué)數(shù)據(jù)與商業(yè)數(shù)據(jù)、公共數(shù)據(jù)在分類分級(jí)保護(hù)實(shí)踐上的差異是論文的起點(diǎn)。科學(xué)數(shù)據(jù)的分類分級(jí)與其他數(shù)據(jù)類型有何異同?為何大部分科學(xué)數(shù)據(jù)管理機(jī)構(gòu)都提出了統(tǒng)一的數(shù)據(jù)安全分級(jí)方案但缺乏數(shù)據(jù)安全分類方案?為何大型學(xué)術(shù)機(jī)構(gòu)普遍借助IRB(或類似的學(xué)術(shù)機(jī)構(gòu))與信息安全管理部門共同執(zhí)行數(shù)據(jù)安全類型和等級(jí)的劃分?為何學(xué)術(shù)界發(fā)展了相對(duì)更多的敏感數(shù)據(jù)安全訪問方法與技術(shù)?這一系列源于實(shí)踐觀察的問題及其答案形成了本文的基本觀點(diǎn):

(1)科學(xué)數(shù)據(jù)安全分類分級(jí)是通用數(shù)據(jù)安全分類

24 https://www.icpsr.umich.edu/web/pages/ICPSR/access/restricted/

25 https://www.icpsr.umich.edu/web/pages/datamanagement/lifecycle/services. html

分級(jí)框架的細(xì)化與擴(kuò)展。類型細(xì)化與擴(kuò)展集中在“一般數(shù)據(jù)”,擴(kuò)展依據(jù)是科學(xué)倫理對(duì)更多敏感內(nèi)容的關(guān)注;等級(jí)細(xì)化與擴(kuò)展集中在“敏感數(shù)據(jù)”區(qū)域,體現(xiàn)了數(shù)據(jù)共享最大化、數(shù)據(jù)合規(guī)成本與數(shù)據(jù)合規(guī)要求的權(quán)衡。

(2)科學(xué)數(shù)據(jù)安全分類是基于法律規(guī)制和倫理要求對(duì)數(shù)據(jù)所含敏感內(nèi)容進(jìn)行辨識(shí)與劃分的過程。數(shù)據(jù)安全法律界定了法律規(guī)制敏感內(nèi)容,科學(xué)倫理決定了倫理規(guī)制敏感內(nèi)容??茖W(xué)研究的廣泛性和科學(xué)倫理的學(xué)科領(lǐng)域性決定了科學(xué)數(shù)據(jù)的安全特征,進(jìn)而決定了其分類與分級(jí),以及IRB等學(xué)術(shù)機(jī)構(gòu)參與數(shù)據(jù)保護(hù)的必要性。

(3)科學(xué)數(shù)據(jù)安全分級(jí)是合規(guī)導(dǎo)向的風(fēng)險(xiǎn)判斷及其等級(jí)化表示的過程。數(shù)據(jù)安全法律規(guī)制是決定性依據(jù),科學(xué)倫理的作用相對(duì)較少。這一點(diǎn)決定了信息安全或數(shù)據(jù)安全部門主導(dǎo)或獨(dú)立進(jìn)行安全分級(jí)的必然性。

(4)科學(xué)數(shù)據(jù)安全分類分級(jí)保護(hù)模式是特定機(jī)構(gòu)追求“數(shù)據(jù)合規(guī)-合規(guī)成本-數(shù)據(jù)收益”三角平衡的結(jié)果。不同機(jī)構(gòu)在數(shù)據(jù)生態(tài)系統(tǒng)中具有不同的功能定位和管理目標(biāo),決定了在三角平衡中的取舍,形成了全面、平衡和精簡(jiǎn)三種模式。

6.2 "應(yīng)用場(chǎng)景

論文形成的上述觀點(diǎn)有助于回答如下一些實(shí)踐中存在的爭(zhēng)議或困惑。

(1)科學(xué)數(shù)據(jù)安全分類的復(fù)雜性

科學(xué)數(shù)據(jù)的安全分類表現(xiàn)出較高的復(fù)雜程度,既關(guān)乎科技倫理的學(xué)科領(lǐng)域性或?qū)I(yè)性,更與其缺乏明確法律界定直接相關(guān)。數(shù)據(jù)安全的主干是合規(guī)性,具有明確的法律界定和相應(yīng)規(guī)制是降低模糊性及復(fù)雜性的前提。然而,不同于具有明確法律界定的個(gè)人數(shù)據(jù)26、商業(yè)數(shù)據(jù)27,科學(xué)數(shù)據(jù)缺乏明確的法律界定,或者說,在法律意義上,科學(xué)數(shù)據(jù)是多種類型數(shù)據(jù)的混合體——其外延既包括個(gè)人數(shù)據(jù)、商業(yè)數(shù)據(jù),同時(shí)還包括同樣缺乏明確法律界定的公共數(shù)據(jù)[54,55],并且這些數(shù)據(jù)之間不存在互斥關(guān)系。顯然,從法律層面明確界定科學(xué)數(shù)據(jù)及其重要屬性是簡(jiǎn)化其安全分類分級(jí)的可行舉措。目前,歐盟數(shù)據(jù)安全辦公室已經(jīng)從公益性科學(xué)研究的界定著手逐步明確科學(xué)數(shù)據(jù)的法律界

26 依據(jù)《個(gè)人信息保護(hù)法》以及《通用數(shù)據(jù)保護(hù)條例》中的個(gè)人數(shù)據(jù)(persona data)的界定

27 依據(jù)《中華人民共和國(guó)反不正當(dāng)競(jìng)爭(zhēng)法》的界定

定,這無疑是解決科學(xué)數(shù)據(jù)安全分類分級(jí)管理乃至數(shù)據(jù)安全保護(hù)的重要舉措。

(2)科學(xué)數(shù)據(jù)安全分類與安全分級(jí)的區(qū)別和聯(lián)系

科學(xué)數(shù)據(jù)安全的分類與分級(jí)具有不同的專業(yè)性和管理意義。安全分類是根據(jù)數(shù)據(jù)安全規(guī)則(法律、倫理、標(biāo)準(zhǔn)規(guī)范與機(jī)構(gòu)政策)識(shí)別數(shù)據(jù)所含敏感信息的過程。敏感信息的學(xué)科領(lǐng)域差異決定了科學(xué)數(shù)據(jù)安全分類的專業(yè)性,客觀上決定了科技倫理以及領(lǐng)域?qū)<一驅(qū)I(yè)性機(jī)構(gòu)審查委員會(huì)(IRB)在數(shù)據(jù)安全分類中的核心作用。由此,學(xué)科領(lǐng)域的綜合性成為數(shù)據(jù)安全分類必要性的決定性因素,綜合性越高則必要性越大。相對(duì)而言,安全分級(jí)主要評(píng)估數(shù)據(jù)風(fēng)險(xiǎn)及其后果,需要由信息安全管理專業(yè)人員而非研究人員進(jìn)行,這也是哈佛大學(xué)等機(jī)構(gòu)單獨(dú)設(shè)立信息安全部門的原因。需要說明的是,在科學(xué)數(shù)據(jù)管理實(shí)踐中,部分單位會(huì)將數(shù)據(jù)的價(jià)值、珍稀程度等也作為安全分類指標(biāo),從而將安全分類擴(kuò)展為管理性的數(shù)據(jù)分類,使得數(shù)據(jù)分類和相關(guān)管理更加復(fù)雜。

科學(xué)數(shù)據(jù)的安全分類與安全分級(jí)具有不同的作用。數(shù)據(jù)安全的基本原則是“分類管理、分級(jí)保護(hù)”,即數(shù)據(jù)安全分類的目的是實(shí)現(xiàn)數(shù)據(jù)內(nèi)容與相應(yīng)專業(yè)人員的匹配,其目的是提高管理效率;數(shù)據(jù)安全分級(jí)的目的是實(shí)現(xiàn)風(fēng)險(xiǎn)的控制與應(yīng)對(duì)。顯然,如果不考慮數(shù)據(jù)敏感內(nèi)容的專業(yè)性,則數(shù)據(jù)安全分類并不一定是必要的。事實(shí)上,很多學(xué)科領(lǐng)域數(shù)據(jù)中心往往不設(shè)置專門的數(shù)據(jù)安全分類標(biāo)準(zhǔn)及相應(yīng)的崗位或團(tuán)隊(duì)。另一方面,數(shù)據(jù)安全分類往往是數(shù)據(jù)安全分級(jí)的可選前序,后者又是后續(xù)保護(hù)措施配置的必要依據(jù)與必選前序。在這一意義上,數(shù)據(jù)安全分級(jí)顯然具有更高的必要性。

(3)科學(xué)數(shù)據(jù)安全分類分級(jí)的杠桿作用

數(shù)據(jù)安全分類分級(jí)對(duì)“數(shù)據(jù)合規(guī)-合規(guī)成本-數(shù)據(jù)收益”的平衡具有杠桿作用:寬松的分類分級(jí)標(biāo)準(zhǔn)代表著更多的開放數(shù)據(jù)與更少的規(guī)制數(shù)據(jù),意味著機(jī)構(gòu)可以在較少合規(guī)投入的情況下提供更多可共享數(shù)據(jù),實(shí)現(xiàn)更大的數(shù)據(jù)價(jià)值和學(xué)術(shù)影響力。這種杠桿作用在國(guó)家層面同樣存在:更多開放數(shù)據(jù)必然提高該國(guó)對(duì)國(guó)際科學(xué)研究的數(shù)據(jù)貢獻(xiàn),在“貢獻(xiàn)-收益”掛鉤的國(guó)際數(shù)據(jù)治理原則下[56],更高的貢獻(xiàn)無疑將鞏固、提升國(guó)家科學(xué)數(shù)據(jù)影響力和高質(zhì)量數(shù)據(jù)的吸聚能力,最終實(shí)現(xiàn)“更多開放、更好安全”的積極性科學(xué)數(shù)據(jù)安全路徑。

(4)科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)模式的內(nèi)在邏輯

科學(xué)數(shù)據(jù)安全分類分級(jí)管理實(shí)踐中涌現(xiàn)了全面、選擇性和簡(jiǎn)化三種模式,它們構(gòu)成了數(shù)據(jù)安全保護(hù)的連續(xù)統(tǒng)一,呈現(xiàn)了數(shù)據(jù)安全保護(hù)范圍、保護(hù)水平和數(shù)據(jù)合規(guī)成本三者組合的階梯型變化。這些模式背后是一個(gè)共性的管理思考:在少數(shù)高規(guī)制數(shù)據(jù)消耗大部分合規(guī)成本的情況下,如何借助限定數(shù)據(jù)安全類型和等級(jí)范圍,實(shí)現(xiàn)數(shù)據(jù)合規(guī)、合規(guī)成本和數(shù)據(jù)收益的動(dòng)態(tài)平衡。顯然,如果進(jìn)一步考慮到更先進(jìn)的管理、技術(shù)手段對(duì)整體效率提升的作用,則就模式設(shè)計(jì)、比選和優(yōu)化而言,其內(nèi)在邏輯是對(duì)兩個(gè)要素及其作用的把握:數(shù)據(jù)安全分類分級(jí)是這一平衡的關(guān)鍵支點(diǎn),更先進(jìn)的管理、技術(shù)措施是推動(dòng)三角平衡體水平提升的重要推動(dòng)力量。

7 "總結(jié)

全球性數(shù)據(jù)安全緊監(jiān)管制度環(huán)境對(duì)傳統(tǒng)科學(xué)數(shù)據(jù)管理形成了“合規(guī)沖擊”,促使學(xué)術(shù)界、科學(xué)數(shù)據(jù)管理實(shí)踐群體和數(shù)據(jù)安全管理當(dāng)局共同關(guān)注科學(xué)數(shù)據(jù)的分類分級(jí)保護(hù)。然而,相關(guān)實(shí)踐及研究整體上仍然局限于對(duì)“合規(guī)沖擊”的解讀和被動(dòng)應(yīng)對(duì),其原因主要在于缺乏對(duì)科學(xué)數(shù)據(jù)安全分類分級(jí)及分級(jí)保護(hù)的整體性理解。

本研究在實(shí)踐調(diào)查和案例分析的基礎(chǔ)上,從科學(xué)數(shù)據(jù)本質(zhì)及其六個(gè)安全特征出發(fā),同時(shí)考慮到科學(xué)數(shù)據(jù)管理主體在數(shù)據(jù)生態(tài)系統(tǒng)中的功能定位,提出了科學(xué)數(shù)據(jù)安全分類分級(jí)框架及全面、平衡和精簡(jiǎn)三種數(shù)據(jù)安全保護(hù)模式,指出了支撐模式的數(shù)據(jù)合規(guī)、合規(guī)成本與數(shù)據(jù)收益三元平衡思想。這在一定程度上補(bǔ)充了科學(xué)數(shù)據(jù)安全分類分級(jí)保護(hù)理論與實(shí)踐之間的空白,同時(shí)為相關(guān)實(shí)踐和政策制定提供了工具與參考。

科學(xué)數(shù)據(jù)規(guī)模增長(zhǎng)、價(jià)值提升、復(fù)雜度升高和外部性增強(qiáng)是其安全保護(hù)工作日益受到重視的內(nèi)在因素。在社會(huì)經(jīng)濟(jì)和科學(xué)研究持續(xù)數(shù)字化且數(shù)據(jù)安全監(jiān)管收緊的大趨勢(shì)下,這些因素將長(zhǎng)期存在并發(fā)揮作用,這使得科學(xué)數(shù)據(jù)的保護(hù)成為比肩利用的重要管理議題。由此,研究并形成系統(tǒng)性和結(jié)構(gòu)化的分類分級(jí)保護(hù)思想,探索契合開放科學(xué)精神的數(shù)據(jù)安全分類分級(jí)保護(hù)理論、方法與技術(shù),加快科學(xué)數(shù)據(jù)管理從傳統(tǒng)環(huán)境向緊監(jiān)管環(huán)境轉(zhuǎn)變,是相關(guān)實(shí)踐的需求,也是相關(guān)研究進(jìn)一步發(fā)展的動(dòng)力。

參考文獻(xiàn)

[1] PELOQUIN D, DIMAIO M, BIERER B, et al. Disruptive and avoidable: GDPR challenges to secondary research uses of data[J]. European Journal of Human Genetics, 2020, 28(6): 697-705. DOI:10.1038/ s41431-020-0596-x.

[2] CLARKE N, VALE G, REEVES E P, et al. GDPR: an impediment to research?[J]. Irish Journal of Medical Science, 2019,188(4): 1129-1135. DOI:10.1007/s11845-019-01980-2.

[3] KNOPPERS B M, BERNIER A, BOWERS S, et al. Open Data in the Era of the GDPR: Lessons from the Human Cell Atlas[J]. Annual Review of Genomics and Human Genetics, 2023, 24(1): 369-391. DOI:10.1146/annurev-genom-101322-113255.

[4] QUINN P. Research under the GDPR – a level playing field for public and private sector research?[J/OL]. Life Sciences, Society and Policy, 2021, 17(1): 4. DOI:10.1186/s40504-021-00111-z.

[5] STAUNTON C, SLOKENBERGA S, MASCALZONI D. The GDPR and the research exemption: Considerations on the necessary safeguards for research biobanks[J]. European Journal of Human Genetics, 2019, 27(8): 1159-1167. DOI:10.1038/s41431- 019-0386-5.

[6] National Research Council. Improving Access to and Confidentiality of Research Data: Report of a Workshop[M/OL]. Washington, DC: The National Academies Press,2000. https://doi.org/10.17226/9958.

[7] 胡良霖,朱艷華. 科學(xué)數(shù)據(jù)倫理關(guān)鍵問題研究[J]. 中國(guó)科技資源導(dǎo)刊, 2022(1): 11-20.

[8] 溫亮明,張麗麗,黎建輝.大數(shù)據(jù)時(shí)代科學(xué)數(shù)據(jù)共享倫理問題研究[J]. 情報(bào)資料工作, 2019, 40(2): 38-44.

[9] 廖方宇,李婧. 開放科學(xué)背景下科學(xué)數(shù)據(jù)開放共享安全挑戰(zhàn)及我國(guó)對(duì)策思考[J/OL]. 農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào), 2024, 6(2): 146-155. DOI:10. 19788/j.issn.2096-6369.000027.

[10] 嚴(yán)煒煒,謝順欣,潘靜,等. 數(shù)據(jù)分類分級(jí):研究趨勢(shì)、政策標(biāo)準(zhǔn)與實(shí)踐進(jìn)展[J]. 數(shù)字圖書館論壇, 2022(9): 2-12.

[11] 袁康,鄢浩宇.數(shù)據(jù)分類分級(jí)保護(hù)的邏輯厘定與制度構(gòu)建——以重要數(shù)據(jù)識(shí)別和管控為中心[J]. 中國(guó)科技論壇, 2022(7): 167-177.

[12] 張敏,魏偉,譚天怡,等. 數(shù)據(jù)分類分級(jí)及其發(fā)展路徑研究[J]. 網(wǎng)絡(luò)安全與數(shù)據(jù)治理, 2022, 41(7): 18-22+29.

[13] 陳兵,郭光坤. 數(shù)據(jù)分類分級(jí)制度的定位與定則——以《數(shù)據(jù)安全法》為中心的展開[J]. 中國(guó)特色社會(huì)主義研究, 2022(3): 50-60.

[14] 陳燁,王陽(yáng),徐亞蘭,等. 電子健康檔案數(shù)據(jù)分類分級(jí)研究[J]. 檔案學(xué)研究, 2024(3): 119-128.

[15] 王暢,曾亞. 煙草行業(yè)數(shù)據(jù)的分類分級(jí)及安全防護(hù)方法探討[J]. 內(nèi)蒙古科技與經(jīng)濟(jì), 2020(1): 31-32+57.

[16] 高磊,趙章界,林野麗,等. 基于《數(shù)據(jù)安全法》的數(shù)據(jù)分類分級(jí)方法研究[J]. 信息安全研究, 2021,7(10):933-940.

[17] 朱艷華,廖方宇,胡良霖,等. 科學(xué)數(shù)據(jù)安全標(biāo)準(zhǔn)規(guī)范關(guān)鍵問題探索[J]. 信息網(wǎng)絡(luò)安全, 2021, 21(11): 1-8.

[18] 廖方宇,胡良霖,王健,等. 科學(xué)數(shù)據(jù)安全標(biāo)準(zhǔn)研究與工作建議[J]. 科學(xué)通報(bào), 2024, 69(9): 1142-1148.

[19] 許琦,胡曉彥,鄒自明,等. 空間環(huán)境科學(xué)數(shù)據(jù)安全分級(jí)概念框架研究[J]. 農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào),2024, 6(2): 259-268.

[20] 王佳榮,周彩秋,苑新陽(yáng),等. 國(guó)家高能物理科學(xué)數(shù)據(jù)安全保障體系[J]. 農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào),2024,6(2): 269-277.

[21] 張耀南,張名成,康建芳. 科學(xué)數(shù)據(jù)中心安全工作實(shí)踐——以國(guó)家冰川凍土沙漠科學(xué)數(shù)據(jù)中心為例[J]. 農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào),2024,6(2): 278-285.

[22] 關(guān)健. 醫(yī)學(xué)科學(xué)數(shù)據(jù)共享與使用的倫理要求和管理規(guī)范(五)隱私分類分級(jí)的初步建議及其依據(jù)的確認(rèn)[J]. 中國(guó)醫(yī)學(xué)倫理學(xué), 2020, 33(8): 915-920.

[23] 智峰,田鋒,趙若凡. 計(jì)量科學(xué)大數(shù)據(jù)分級(jí)分類[J]. 大數(shù)據(jù), 2022, 8(1): 60-72.

[24] CHRISTINE L. BORGMAN. Big Data, Little Data, No Data: Scholarship in the Networked World[M/OL]. The MIT Press, 2015. https://doi.org/10.7551/mitpress/9963.001.0001.

[25] WILKINSON M D, DUMONTIER M, AALBERSBERG I J, et al. The FAIR Guiding Principles for scientific data management and stewardship[J]. Scientific Data, 2016, 3(1): 160018. DOI:10.1038/ sdata.2016.18.

[26] TENOPIR C, ALLARD S, DOUGLASS K, et al. Data Sharing by Scientists: Practices and Perceptions[J]. PLOS ONE, 2011, 6(6): 1-21. DOI:10.1371/journal.pone.0021101.

[27] PIWOWAR H A, VISION T J, WHITLOCK M C. Data archiving is a good investment[J]. Nature, 2011, 473(7347): 285-285. DOI:10. 1038/473285a.

[28] OECD. OECD Principles and Guidelines for Access to Research Data from Public Funding[M/OL]. OECD, 2007[2024-08-28]. https://www. oecd-ilibrary.org/science-and-technology/oecd-principles-and-guidelines-for-access-to-research-data-from-public-funding_9789264034020-en-fr. DOI:10.1787/9789264034020-en-fr.

[29] GARETT R, YOUNG S D. Ethical views on sharing digital data for public health surveillance: Analysis of survey data among patients[J/OL]. Frontiers in Big Data, 2022, 5: 871236. DOI:10.3389/ fdata.2022.871236.

[30] Regulation (EU) 2016/679 of the European Parliament and of the Council of 27 April 2016 on the protection of natural persons with regard to the processing of personal data and on the free movement of such data, and repealing Directive 95/46/EC (General Data Protection Regulation) (Text with EEA relevance)[A/OL]//Official Journal of the European Union, 2016. http://data.europa.eu/eli/reg/2016/679/oj/eng.

[31] Secretariat of the Convention on International Trade in Endangered Species of Wild Fauna and Flora (CITES). Notification to the Parties No. 2016/007[EB/OL]. https://cites.org/sites/default/files/notif/E- Notif-2016-057.pdf.

[32] RESNIK D B. The Ethics of Research with Human Subjects: Protecting People, Advancing Science, Promoting Trust[M/OL]. Springer International Publishing, 2018. http://link.springer.com/ 10.1007/978-3-319-68756-8.

[33] The World Medical Association. WMA Declaration of Helsinki-Ethical Principles for Medical Research Involving Human Subjects[EB/OL]. 2018. https://www.wma.net/policies-post/wma- declaration-of-helsinki-ethical-principles-for-medical-research-involving-human-subjects/.

[34] EMANUEL E J. What makes clinical research ethical?[J/OL]. JAMA, 2000, 283(20): 2701. DOI:10.1001/jama.283.20.2701.

[35] VARKEY B. Principles of clinical ethics and their application to practice[J]. Medical Principles and Practice, 2021, 30(1): 17-28. DOI:10.1159/000509119.

[36] Sharing publication-related data and materials: responsibilities of authorship in the life sciences[J/OL]. Plant Physiology, 2003, 132(1): 19-24. DOI:10.1104/pp.900068.

[37] STODDEN V, LEISCH F, PENG R D. Implementing Reproducible Research[M/OL]. New York: Chapman and Hall/CRC, 2018. https://www.taylorfrancis.com/books/9781315362762.DOI:10.1201/9781315373461.

[38] BORGMAN C L. The conundrum of sharing research data[J/OL]. Journal of the American Society for Information Science and Technology,2012. https://onlinelibrary.wiley.com/doi/full/10.1002/asi. 22634.

[39] TENOPIR C, TALJA S, HORSTMANN W, et al. Research data services in European Academic Research Libraries[J/OL]. Liber Quarterly, 2017, 27(1): 23-44. DOI:10.18352/lq.10180.

[40] CHARPENTIER A, FLACHAIRE E. Pareto Models for Risk Management// DUFRéNOT G, MATSUKI T. (eds) Recent Econometric Techniques for Macroeconomic and Financial Data. Dynamic Modeling and Econometrics in Economics and Finance, vol 27[M/OL]. Cham: Springer International Publishing, 2021: 355-387. https://doi.org/10.1007/ 978-3-030-54252-8_14.

[41] BORGMAN C L. Scholarship in the Digital Age: Information, Infrastructure, and the Internet[M/OL]. The MIT Press, 2007. https://www.jstor.org/stable/j.ctt5hhbk7.

[42] NIELSEN M. Reinventing Discovery: The New Era of Networked Science[M]. Princeton University Press, 2011.

[43] BEZUIDENHOUT L M, LEONELLI S, KELLY A H, et al. Beyond the digital divide: Towards a situated approach to open data[J]. Science and Public Policy, 2017, 44(4): 464-475. DOI:10.1093/scipol/ scw036.

[44] KOLIVAND H, ASADIANFAM S, AKINTOYE K A, et al. Finger vein recognition techniques: a comprehensive review[J]. Multimedia Tools and Applications, 2023, 82(22): 33541-33575. DOI:10.1007/ s11042-023-14463-5.

[45] ABBAS S N, ABO-ZAHHAD M, AHMED S M, et al. Heart-ID: human identity recognition using heart sounds based on modifying mel-frequency cepstral features[J]. IET Biometrics, 2016, 5(4): 284-296. DOI:10.1049/iet-bmt.2015.0033.

[46] DU Y, XU Y, WANG X, et al. EEG temporal–spatial transformer for person identification[J/OL]. Scientific Reports, 2022, 12(1): 14378. DOI:10.1038/s41598-022-18502-3.

[47] BORGMAN C L. The conundrum of sharing research data[J/OL]. Journal of the American Society for Information Science and Technology,2012,63(6):1059-1078. https://doi.org/10.1002/asi. 22634.

[48] CAI P, CHEN L. Demystifying data law in China: A unified regime of tomorrow[J]. International Data Privacy Law, 2022, 12(2): 75-92. DOI:10.1093/idpl/ipac004.

[49] 數(shù)據(jù)安全技術(shù) 數(shù)據(jù)分類分級(jí)規(guī)則: GB/T 43697-2024[S]. 2024.

[50] RITCHIE F. Five Safes: designing data access for research[M/OL]. 2016. DOI:10.13140/RG.2.1.3661.1604.

[51] 夏義堃,管茜. 科學(xué)研究的數(shù)據(jù)生態(tài)及其模式演進(jìn)研究[J].科學(xué)學(xué)研究,2024,42(4): 673-682.

[52] 尹海清, 王永偉, 張曉彤, 等. 材料基因工程數(shù)據(jù)生態(tài)系統(tǒng)[J]. 中國(guó)材料進(jìn)展, 2023, 42(02): 135-143.

[53] 信息安全技術(shù) 數(shù)據(jù)安全能力成熟度模型: GB/T 37988-2019[S]. 2015.

[54] 賀欣然. 公共數(shù)據(jù)開放共享法律問題研究[J/OL]. 爭(zhēng)議解決,2023, 9(6): 3269-3276. DOI:10.12677/ DS.2023.96446.

[55] 程雁雷,張林軒,張旭. 公共數(shù)據(jù)開放的邏輯意蘊(yùn):現(xiàn)狀考察、問題檢視與法治進(jìn)路[J]. 科技情報(bào)研究, 2024,6(3): 26-40.

[56] 李宜展,董璐,王東瑤,等. 國(guó)際科技組織與國(guó)際科技合作計(jì)劃中的科學(xué)數(shù)據(jù)安全治理[J]. 農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào), 2024, 6(2): 161-169. DOI:10.19788/ j.issn.2096-6369.000031.

引用格式:王健,周國(guó)民,張建華,許哲平,劉婷婷. 科學(xué)數(shù)據(jù)分類分級(jí)保護(hù)探索:框架與模式[J].農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào),2024,6(3): 307-324. DOI:10.19788/j.issn. 2096-6369.000069.

CITATION: WANG Jian, ZHOU GuoMin, ZHANG JianHua, XU ZhePing, LIU TingTing. Navigating the Distinctiveness of Research Data Protection: Framework and Mode[J]. Journal of Agricultural Big Data,2024,6(3): 307-324. DOI:10.19788/j.issn.2096-6369.000069.

Navigating the Distinctiveness of Research Data Protection: Framework and Mode

WANG Jian1,3,4, ZHOU GuoMin2,3,4, ZHANG JianHua1,3,4*, XU ZhePing5,6, LIU TingTing1,3

1. Agricultural Information Institute of Chinese Academy of Agricultural Sciences, Beijing 100081, China; 2. Nanjing Institute of Agricultural Mechanization, Ministry of Agriculture and Rural Affairs,Nanjing 210014, China; 3. National Agricultural Scientific Data Center, Beijing 100081, China; 4. Hainan National Breeding and Multiplication Institute at Sanya, Chinese Academy of Agricultural Sciences, Sanya 572024, Hainan, China; 5. National Sciences Library of Chinese Academy of Science, Beijing 100190, China; 6. School of Economics and Management, University of Chinese Academy of Sciences, Beijing 100190, China

Abstract:In recent years, increasing data security regulations have posed significant compliance challenges for scientific data management. Data classification and grading for protection has become a focal point for academia, practitioners, and regulatory bodies. However, existing research mostly focuses on compliance interpretation and reactive measures, lacking a systematic theoretical analysis of scientific data protection. This gap limits the development of frameworks and models in the field. To address this, based on an extensive survey of current practices, this paper identifies six key security characteristics of scientific data: multi-regulation, strict ethical regulation, disciplinary differences, Pareto distribution of \"scale-risk,\" public interest, and dynamic sensitivity. It proposes a classification and grading framework, along with three protection models: comprehensive, balanced, and streamlined. Additionally, the paper introduces a \"compliance-cost-benefit\" triangle to explain the trade-offs among these factors. The proposed framework clarifies the complexity of classifying scientific data, distinguishing between data classification and grading, and offering insights into their interaction. This theoretical model provides valuable reference for future research and practical tools for addressing challenges in scientific data security management.

Keywords: scientific data; data security; data protection; data classification; data grading; data ethic

猜你喜歡
數(shù)據(jù)保護(hù)數(shù)據(jù)安全
云計(jì)算中基于用戶隱私的數(shù)據(jù)安全保護(hù)方法
電子制作(2019年14期)2019-08-20 05:43:42
歐盟通用數(shù)據(jù)保護(hù)條例中的數(shù)據(jù)保護(hù)官制度
建立激勵(lì)相容機(jī)制保護(hù)數(shù)據(jù)安全
大數(shù)據(jù)云計(jì)算環(huán)境下的數(shù)據(jù)安全
電子制作(2017年20期)2017-04-26 06:57:48
TPP生物藥品數(shù)據(jù)保護(hù)條款研究
云環(huán)境中數(shù)據(jù)安全去重研究進(jìn)展
歐盟數(shù)據(jù)保護(hù)立法改革之發(fā)展趨勢(shì)分析
歐盟《一般數(shù)據(jù)保護(hù)條例》新規(guī)則評(píng)析
大數(shù)據(jù)安全搜索與共享
健全大數(shù)據(jù)安全保障體系研究
乌什县| 合江县| 调兵山市| 凯里市| 女性| 隆回县| 河南省| 舒城县| 香河县| 藁城市| 昆明市| 电白县| 定兴县| 华宁县| 九龙坡区| 渑池县| 廊坊市| 新津县| 浮山县| 和平区| 长治市| 昌黎县| 唐海县| 嘉黎县| 明星| 灯塔市| 穆棱市| 壶关县| 周至县| 万山特区| 汕头市| 闵行区| 抚宁县| 慈利县| 温州市| 玛纳斯县| 新龙县| 邯郸县| 泽州县| 涿鹿县| 无为县|