国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大學(xué)數(shù)據(jù)分級共享模式及困境分析

2024-12-04 00:00:00周秀霞張立新
新世紀(jì)圖書館 2024年10期

摘 要 在數(shù)據(jù)的經(jīng)濟(jì)價值與戰(zhàn)略價值愈發(fā)凸顯的當(dāng)下,數(shù)據(jù)分級成為強(qiáng)化數(shù)據(jù)管理、規(guī)避數(shù)據(jù)管理共享中風(fēng)險(xiǎn)的必由之路。論文從數(shù)據(jù)分級共享的國內(nèi)外現(xiàn)狀入手,透析了當(dāng)前大學(xué)中數(shù)據(jù)的特點(diǎn)及分級共享的多元化發(fā)展模式,分析了大學(xué)數(shù)據(jù)分級共享中的困境,提出了明晰數(shù)據(jù)分級共享的邊界、確定分級共享數(shù)據(jù)的權(quán)責(zé)歸屬、基于生命周期進(jìn)行數(shù)據(jù)質(zhì)量監(jiān)測、重視數(shù)據(jù)分級共享的安全防控等策略。

關(guān)鍵詞 分級共享模式;大學(xué)數(shù)據(jù);困境

分類號 G203

DOI 10.16810/j.cnki.1672-514X.2024.10.005

Analysis of the Hierarchical Sharing Mode and Dilemma of University Data

Zhou Xiuxia , Zhang Lixin

Abstract In the current era where the economic and strategic value of data is becoming increasingly prominent,, data hierarchical has become the must way to strengthen data management and avoid risks in data management and sharing. Starting from the current situation of data hierarchical sharing at home and abroad, this paper dialyses the characteristics of data in current universities and the diversified development models of hierarchical sharing, analyzes difficult positions of hierarchical sharing of university data, and proposes strategies such as clarifying the boundaries of hierarchical data sharing, determining the rights and responsibilities of hierarchical data sharing, monitoring data quality based on the life-cycle, and emphasizing the security prevention and control of hierarchical data sharing.

Keywords Hierarchical sharing mode. University data. Dilemma.

0 引言

隨著信息科技的迅速發(fā)展,社會進(jìn)入數(shù)智據(jù)時代,數(shù)據(jù)呈現(xiàn)爆發(fā)式增長態(tài)勢,據(jù)《數(shù)字化世界-從邊緣到核心》顯示,到2025年全球數(shù)據(jù)圈將增至175ZB,而且一些行業(yè)還正在迎來重新定義數(shù)據(jù)增長的新紀(jì)元[1]。各國也充分認(rèn)識到了數(shù)據(jù)之于國家發(fā)展的重要意義。郭華東院士就曾在研究中指出;一個國家擁有大數(shù)據(jù)的“體量”與國家的GDP發(fā)展成正比,誰擁有了大數(shù)據(jù),誰就擁有了未來[2]。一時間,數(shù)據(jù)共享成為各個國家與行業(yè)關(guān)注的焦點(diǎn)。數(shù)據(jù)已形成新質(zhì)生產(chǎn)力的優(yōu)質(zhì)生產(chǎn)要素,各國也?將其作為重要的基礎(chǔ)性戰(zhàn)略資源進(jìn)行綜合布局。大學(xué)作為我國科研創(chuàng)新和人才培養(yǎng)的重要陣地,擁有豐富的數(shù)據(jù)資源,其數(shù)據(jù)分享的重要性不言而喻。

與此同時,數(shù)據(jù)安全問題日益凸顯,成為數(shù)據(jù)共享實(shí)踐中必須迎面而上的挑戰(zhàn)。正如2017年年美國國家情報(bào)委員會(NIC)發(fā)布的《全球趨勢2035——進(jìn)步的悖論》預(yù)測報(bào)告描述的那樣:新興信息技術(shù)對數(shù)據(jù)的依賴性不斷升高,需要建立起明確的數(shù)據(jù)所有權(quán)界限和標(biāo)準(zhǔn)。數(shù)據(jù)隱私和保護(hù)、跨境數(shù)據(jù)流和網(wǎng)絡(luò)安全可能成為日益重要的國內(nèi)和國際政治沖突點(diǎn)[3]。

數(shù)據(jù)分級共享作為一種有效的數(shù)據(jù)管理策略,在為數(shù)據(jù)的合理流動和使用提供可能的同時,也確保了數(shù)據(jù)安全,因而受到了廣泛關(guān)注。但是,在實(shí)際應(yīng)用過程中,大學(xué)數(shù)據(jù)分級共享卻面臨著一系列挑戰(zhàn),如分級標(biāo)準(zhǔn)不一致、共享邊界模糊以及分級共享機(jī)制不完善等。面對這樣的現(xiàn)狀,文章通過梳理現(xiàn)有大學(xué)數(shù)據(jù)分級共享的實(shí)踐模式和對困境的分析,旨在提煉出一套適用于大學(xué)數(shù)據(jù)分級共享的策略,以為其后的實(shí)踐提供參考。

1 數(shù)據(jù)分級共享的現(xiàn)狀分析

分級思想在管理中的應(yīng)用由來已久,早在1970年,美國國防科學(xué)委員會就在《美國可信計(jì)算機(jī)系統(tǒng)評價標(biāo)準(zhǔn)》(Trusted Computer System Evaluation Criteria,簡稱TCSEC)中提出了安全分級的思想,其將計(jì)算機(jī)系統(tǒng)的安全分為D、C1、C2、B1、B2、B3和A七個級別[4]。2003年,美國國家標(biāo)準(zhǔn)技術(shù)研究所制定了《聯(lián)邦信息和信息系統(tǒng)安全分類標(biāo)準(zhǔn)》 (簡稱FIPS199),定義了信息和信息系統(tǒng)的三類安全目標(biāo)以及三種影響級:低、中、高;并根據(jù)信息系統(tǒng)中處理、傳輸和存儲的信息類型的重要性來確定該信息系統(tǒng)的安全類別[5]。其后,美國于2009年頒布的《國家安全保密信息》及美國國家標(biāo)準(zhǔn)技術(shù)研究所法的800-60《信息及信息系統(tǒng)安全分類映射指南》等都體現(xiàn)了安全分級管理[6]。

隨后,安全分級思想逐漸深入各個行業(yè),成為各領(lǐng)域數(shù)據(jù)共享的安全標(biāo)簽之一。2014年,國際學(xué)術(shù)界討論推出了科學(xué)數(shù)據(jù)開放共享的FAIR原則,雖沒有提及“分級”,但也強(qiáng)調(diào)了“允許在必要時進(jìn)行身份驗(yàn)證和授權(quán)”“敏感數(shù)據(jù)在一定程度上開放”等數(shù)據(jù)開放原則[7]。2016年4月,歐盟議會通過了《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulations,簡稱GDPR),提出了對敏感數(shù)據(jù)進(jìn)行識別、合理化處理和分類分級的要求[8]。2021年7月,美國國家標(biāo)準(zhǔn)與技術(shù)研究所(National Instituteof Standardsand Technology,簡稱NIST)又提出了一項(xiàng)《數(shù)據(jù)分類分級實(shí)踐——促進(jìn)以數(shù)據(jù)為中心的安全管理》的項(xiàng)目,重點(diǎn)在于關(guān)注數(shù)據(jù)管理和保護(hù)背景中的數(shù)據(jù)分類分級,以支持業(yè)務(wù)用例[9]。

分級共享的思想在我國也具有深厚的基礎(chǔ)。早在1987年,文化部就頒布了《文物藏品定級標(biāo)準(zhǔn)》,具體對文物進(jìn)行了定級劃分,其中,一級文物為具有特別重要價值的代表性文物;二級文物為具有重要價值的文物;三級文物為具有一定價值的文物[10]。2002年,中國地震局主導(dǎo)開始了國家地震科學(xué)數(shù)據(jù)共享的試點(diǎn)工作,其中就包括對科學(xué)數(shù)據(jù)分級共享的試點(diǎn)。2004年,國家環(huán)境保護(hù)部門制定了《環(huán)境科學(xué)數(shù)據(jù)的分級》等文件,將環(huán)境科學(xué)數(shù)據(jù)分為四個等級。一級數(shù)據(jù)為公益性數(shù)據(jù),二級數(shù)據(jù)為國家內(nèi)部共享數(shù)據(jù),三級數(shù)據(jù)為機(jī)構(gòu)內(nèi)部數(shù)據(jù),四級數(shù)據(jù)為保密性數(shù)據(jù)[11]。2011年,國家制定了GT/T26499《機(jī)械科學(xué)數(shù)據(jù)》國家標(biāo)準(zhǔn),明確規(guī)定了機(jī)械科學(xué)數(shù)據(jù)分級的原則、方法等,并將機(jī)械科學(xué)數(shù)據(jù)分級為7個級別[12]。2018年3月,國務(wù)院發(fā)布了《科學(xué)數(shù)據(jù)管理辦法》,提出了科學(xué)數(shù)據(jù)管理遵循分級管理、安全可控、充分利用的原則,并進(jìn)一步規(guī)定了“科學(xué)數(shù)據(jù)中心負(fù)責(zé)科學(xué)數(shù)據(jù)的分級分類、加工整理和分析挖掘;法人單位要對科學(xué)數(shù)據(jù)進(jìn)行分級分類,明確科學(xué)數(shù)據(jù)的密級和保密期限、開放條件、開放對象和審核程序等,按要求公布科學(xué)數(shù)據(jù)開放目錄,通過在線下載、離線共享或定制服務(wù)等方式向社會開放共享”[13]。2021年9月,國家發(fā)布了《中華人民共和國數(shù)據(jù)安全法》明確提出,根據(jù)數(shù)據(jù)在經(jīng)濟(jì)社會發(fā)展中的重要程度,以及一旦遭到篡改、破壞、泄露或者非法獲取、非法利用,對國家安全、公共利益或者個人、組織合法權(quán)益造成的危害程度,對數(shù)據(jù)實(shí)行分類分級保護(hù)。特別是將“關(guān)系國家安全、國民經(jīng)濟(jì)命脈、重要民生、重大公共利益等數(shù)據(jù)”列為國家核心數(shù)據(jù),實(shí)行更加嚴(yán)格的管理制度[14],提出了數(shù)據(jù)的“重要程度”和“危害程度”將是分級分類的重要依據(jù)。

2 大學(xué)數(shù)據(jù)分級共享的多元模式

大學(xué)是數(shù)據(jù)產(chǎn)生的重要場域之一,也是數(shù)據(jù)共享挖掘、創(chuàng)新應(yīng)用的主要場域之一。與其他領(lǐng)域的數(shù)據(jù)相比,大學(xué)的數(shù)據(jù)呈現(xiàn)出以下特點(diǎn)。

(1)數(shù)據(jù)量龐大。大學(xué)的數(shù)據(jù)是一個數(shù)量巨大的集合。據(jù)麥肯錫全球研究中心2009年的數(shù)據(jù)顯示,當(dāng)時美國國家教育部的某信息系統(tǒng)的數(shù)據(jù)庫就有269P字節(jié)數(shù)據(jù)[15]。也有學(xué)者統(tǒng)計(jì),上海大學(xué)每日產(chǎn)生的數(shù)據(jù)量約有100T[16]。

(2)數(shù)據(jù)類型多樣。大學(xué)數(shù)據(jù)中既有師生的個人信息、健康信息等,也有大學(xué)運(yùn)行中產(chǎn)生的各類業(yè)務(wù)數(shù)據(jù),還有教育教學(xué)、科學(xué)研究等過程中產(chǎn)生的科學(xué)數(shù)據(jù),以及學(xué)生日常生活中產(chǎn)生的各類數(shù)據(jù),這些數(shù)據(jù)維度多樣,數(shù)據(jù)類型、值、格式等各不相同。

(3)數(shù)據(jù)質(zhì)量參差不齊。因?yàn)閿?shù)據(jù)種類繁雜,數(shù)據(jù)的形成標(biāo)準(zhǔn)不統(tǒng)一,數(shù)據(jù)的質(zhì)量良莠不齊,且存在數(shù)據(jù)重復(fù)、數(shù)據(jù)失效、數(shù)據(jù)錯誤等眾多問題。

(4)數(shù)據(jù)孤島時常存在。因?yàn)榻^大多數(shù)大學(xué)沒有統(tǒng)一的數(shù)據(jù)保存機(jī)制,大學(xué)內(nèi)部不同機(jī)構(gòu)產(chǎn)生的數(shù)據(jù)多是自行管理存儲,不同的數(shù)據(jù)管理存儲系統(tǒng)導(dǎo)致了部門間數(shù)據(jù)的難互通、難共享。

很多大學(xué)認(rèn)識到了數(shù)據(jù)共享的困境,在平衡數(shù)據(jù)共享的效益與數(shù)據(jù)安全風(fēng)險(xiǎn)關(guān)系的基礎(chǔ)上,一些大學(xué)進(jìn)行了數(shù)據(jù)分級共享的嘗試,形成了一些數(shù)據(jù)分級共享方案。

2.1 基于數(shù)據(jù)敏感度的分級共享

從數(shù)據(jù)敏感度角度對數(shù)據(jù)分級共享是當(dāng)前比較普遍的一種模式。其中,比較著名的是加州大學(xué)伯克利分校的數(shù)據(jù)分級標(biāo)準(zhǔn)(UC Berkeley Data Classification Standard)。其是一個評估數(shù)據(jù)敏感度的框架[17],主要通過數(shù)據(jù)敏感度來確定數(shù)據(jù)的開放分享的程度。美國加州大學(xué)伯克利分校的數(shù)據(jù)分級標(biāo)準(zhǔn)依據(jù)電子信息最低安全標(biāo)準(zhǔn)(the Minimum Security Standardfor Electronic Information,MSSEI)、網(wǎng)絡(luò)設(shè)備最低安全標(biāo)準(zhǔn)(the Minimum Security Standardfor Networked Devices,MSSND)、研究單位和科學(xué)數(shù)據(jù)提供者之間的合同或數(shù)據(jù)使用協(xié)議(DUA)、美國健康保險(xiǎn)攜帶和責(zé)任法案(HIPAA法案)等一系列法律法規(guī),并綜合考慮了數(shù)據(jù)應(yīng)用的目的、性質(zhì)及數(shù)據(jù)的敏感度,管理數(shù)據(jù)涉及的法律、法規(guī)或數(shù)據(jù)使用協(xié)議,估計(jì)數(shù)據(jù)存儲的敏感記錄數(shù)量,如發(fā)生違規(guī)使用數(shù)據(jù)現(xiàn)象可能的后果及存在的潛在影響,如果數(shù)據(jù)丟失對研究項(xiàng)目的影響等具體因素[11],形成了加州大學(xué)伯克利分校的數(shù)據(jù)分級標(biāo)準(zhǔn),具體如表1所示。

2.2 基于數(shù)據(jù)用戶的分級共享

通過對用戶分級實(shí)現(xiàn)對數(shù)據(jù)的分級共享也是當(dāng)前數(shù)據(jù)共享比較常見的一種模式,也是比較容易實(shí)現(xiàn)一種模式。其通過對數(shù)據(jù)使用用戶的數(shù)據(jù)訪問范圍和權(quán)限限定,從用戶的角度對數(shù)據(jù)共享進(jìn)行分級。當(dāng)前,很多數(shù)據(jù)管理、存儲機(jī)構(gòu)均采用了這種數(shù)據(jù)分級模式。如麻省理工學(xué)院依賴數(shù)據(jù)倉儲平臺實(shí)現(xiàn)了用戶的分級權(quán)限管理,可以按照不同的實(shí)驗(yàn)室、工作組等為用戶賦予不同的權(quán)限,實(shí)現(xiàn)數(shù)據(jù)的分級共享。依據(jù)這個原則,麻省理工學(xué)院將用戶分為了在校/在職人員、校友、非學(xué)校學(xué)生、非學(xué)校機(jī)構(gòu)、游客、學(xué)校退休人員等六個級別[20]。中國國家海洋科學(xué)數(shù)據(jù)中心(National Marine Data Center,NMDC)將用戶劃分為普通用戶、個人認(rèn)證用戶和單位認(rèn)證用戶三個級別,并規(guī)定了各級別用戶可瀏覽、檢索和收藏下載指定海洋數(shù)據(jù)和產(chǎn)品的范圍以及單日數(shù)據(jù)訂單下載規(guī)模[21]。我國對繞月探測工程產(chǎn)生的科學(xué)數(shù)據(jù)共享也基于用戶進(jìn)行了分級,其具體分為工程研制單位、專家委員會用戶、授權(quán)用戶和普通用戶四個級別,每個級別用戶獲取數(shù)據(jù)范圍、申請數(shù)據(jù)使用方式等均不相同[22]。

2.3 基于數(shù)據(jù)研究階段的分級共享

數(shù)據(jù)分級從根本上講,是為了在盡量保證安全的前提下最大范圍的共享。為了提高數(shù)據(jù)分級共享對大學(xué)的價值。阿姆斯特丹自由大學(xué)在對數(shù)據(jù)進(jìn)行分級時,提出了需要考慮數(shù)據(jù)的三個屬性,即數(shù)據(jù)的可利用性、完整性和保密性,同時還需要考慮如果數(shù)據(jù)損害的風(fēng)險(xiǎn),這種風(fēng)險(xiǎn)既包括數(shù)據(jù)生產(chǎn)者面臨的風(fēng)險(xiǎn),也包括作為研究機(jī)構(gòu)的大學(xué)研究人員、合作者等的風(fēng)險(xiǎn)。面對這些風(fēng)險(xiǎn),在數(shù)據(jù)存儲或歸檔時就需要考慮數(shù)據(jù)的格式和載體等,對于不同階段的數(shù)據(jù)采用不同的存儲模型和格式,因此形成了針對研究的不同階段形成的數(shù)據(jù)類型分級方法,具體如表2所示。

2.4 基于數(shù)據(jù)共享范圍的分級共享

美國的芝加哥大學(xué)充分考慮了數(shù)據(jù)共享對數(shù)據(jù)安全的沖擊和影響,根據(jù)影響的程度將數(shù)據(jù)分為限制共享、內(nèi)部共享和公開共享三個級別。限制共享的數(shù)據(jù)被認(rèn)為是未經(jīng)授權(quán)的共享可能會對大學(xué)運(yùn)營、大學(xué)資產(chǎn)或個人產(chǎn)生嚴(yán)重或?yàn)?zāi)難性的不利影響,所以只有在相關(guān)數(shù)據(jù)管理員或相關(guān)大學(xué)管理機(jī)構(gòu)的指示下,才允許訪問;內(nèi)部共享的數(shù)據(jù)是需要謹(jǐn)慎關(guān)注安全和隱私保護(hù)的數(shù)據(jù),可在大學(xué)或醫(yī)學(xué)中心內(nèi)共享;公開共享的數(shù)據(jù)是共享不會對大學(xué)運(yùn)營、資產(chǎn)或個人產(chǎn)生影響的數(shù)據(jù)[24]。

2.5 基于其他視角的分級共享

除了上述的數(shù)據(jù)分級共享的視角外,還有很多其他的分級標(biāo)準(zhǔn),如我國的中科院空間中心數(shù)據(jù)網(wǎng)絡(luò)技術(shù)試驗(yàn)室和空間環(huán)境探測研究室根據(jù)數(shù)據(jù)的處理階段形成五級的數(shù)據(jù)分級標(biāo)準(zhǔn)。其中,一級為包含科學(xué)數(shù)據(jù)和工程參數(shù)的原包數(shù)據(jù);二級為經(jīng)過鑒別、選擇、分類、整理以及排列等處理的編輯數(shù)據(jù);三級為經(jīng)過標(biāo)定和質(zhì)量校核等過程的標(biāo)校數(shù)據(jù);四級為基于儀器觀測狀態(tài)進(jìn)行時空重采樣后生成的數(shù)據(jù)產(chǎn)品;五級為進(jìn)行時空網(wǎng)格轉(zhuǎn)換或深層反演生成的反演數(shù)據(jù)[25]。

3 大學(xué)數(shù)據(jù)分級共享的困境分析

雖然一些大學(xué)及大學(xué)中的科研機(jī)構(gòu)對數(shù)據(jù)的分級共享進(jìn)行了有益的嘗試,但是數(shù)據(jù)分級共享進(jìn)展緩慢,就其原因,主要存在以下困境。

3.1 數(shù)據(jù)共享邊界不清晰

大學(xué)數(shù)據(jù)是一個復(fù)雜的構(gòu)成,既包括那些大學(xué)應(yīng)該公開的公共數(shù)據(jù),譬如招生計(jì)劃、專業(yè)設(shè)置、教師基本情況等數(shù)據(jù);也包括那些完全個人所有的私人數(shù)據(jù),譬如師生個人的健康數(shù)據(jù)、運(yùn)動愛好等數(shù)據(jù);還有公共數(shù)據(jù)與私人數(shù)據(jù)交織在一起的混合數(shù)據(jù),譬如大學(xué)的財(cái)務(wù)數(shù)據(jù)、科學(xué)研究中產(chǎn)生的數(shù)據(jù)等等。不同的數(shù)據(jù)構(gòu)成劃分應(yīng)該是數(shù)據(jù)分級共享的前提,在此基礎(chǔ)上再進(jìn)行不同數(shù)據(jù)的共享邊界界定。雖然一些大學(xué)也進(jìn)行了數(shù)據(jù)構(gòu)成劃分的探索,但數(shù)據(jù)的劃分過于簡單,沒有形成一個規(guī)范性的劃分標(biāo)準(zhǔn),在此基礎(chǔ)上進(jìn)行的數(shù)據(jù)共享邊界更是模糊,且較為明顯地體現(xiàn)出了重?fù)p失輕效益的取向,數(shù)據(jù)的分級共享更關(guān)注對數(shù)據(jù)的保護(hù),對數(shù)據(jù)分級共享所帶來的價值關(guān)注不多,沒有很好地平衡數(shù)據(jù)保護(hù)與分級共享之間的關(guān)系,沒有形成積極的推動數(shù)據(jù)分級共享的措施[26]。

3.2 缺乏必要的質(zhì)量監(jiān)測

大學(xué)數(shù)據(jù)的多樣性,使得數(shù)據(jù)在獲取階段很難保持?jǐn)?shù)據(jù)定義的一致性,往往不同部門產(chǎn)生的數(shù)據(jù)采集、存儲標(biāo)準(zhǔn)等都是不同的,元數(shù)據(jù)定義的統(tǒng)一性也無法保證,這給數(shù)據(jù)共享帶來了挑戰(zhàn)[27]。尤其是,數(shù)據(jù)對“時間”有極高的要求,很多數(shù)據(jù)的“生命周期”很短,導(dǎo)致很多數(shù)據(jù)可能還沒有被采集到或者還沒有被獲取共享,就已經(jīng)“失效”了,成為滯后數(shù)據(jù)。同時,處于生命周期不同階段的數(shù)據(jù),可能具有不同的價值,其分級共享的政策也可能不同。雖然大學(xué)在一定程度上推進(jìn)了數(shù)據(jù)質(zhì)量管理體系建設(shè),但是相關(guān)的數(shù)據(jù)檢測、評價、培訓(xùn)等工作推進(jìn)緩慢;對錯誤數(shù)據(jù)、過期數(shù)據(jù)、變更數(shù)據(jù)等的控制處理,也大大滯后;對處于不同生命周期數(shù)據(jù)的分級共kEb2swZn8Ebd+DPgJECwShl50KsQXWIqhPPyxKeDIEw=享管理,也基本上處于空白狀態(tài);這些都直接影響了數(shù)據(jù)分級共享進(jìn)程的推進(jìn)。

3.3 分級共享機(jī)制不健全

數(shù)據(jù)分級共享的實(shí)現(xiàn),需要大學(xué)頂層的規(guī)劃設(shè)計(jì)、相關(guān)政策制度的完備、指導(dǎo)技術(shù)標(biāo)準(zhǔn)的統(tǒng)一和充足的思想認(rèn)識等等。當(dāng)前,大學(xué)普遍認(rèn)識到了數(shù)據(jù)分級共享的重要性,一些大學(xué)還出臺了一些相關(guān)政策要求。如上海大學(xué),就推出了學(xué)校關(guān)于數(shù)據(jù)采集、歸集、整合、開放、應(yīng)用、共享等的標(biāo)準(zhǔn)、流程及管理規(guī)范,對約20個大類、近百個系統(tǒng)業(yè)務(wù)的數(shù)據(jù)構(gòu)建統(tǒng)一數(shù)據(jù)管理平臺,實(shí)現(xiàn)了大學(xué)多維度教育數(shù)據(jù)的精準(zhǔn)梳理和集中管理,為教育評價、學(xué)科建設(shè)、卓越績效考核、資源配置等提供基于客觀事實(shí)數(shù)據(jù)的決策支持[28]。但還遠(yuǎn)遠(yuǎn)沒有達(dá)到認(rèn)識一致、制度完備、技術(shù)成熟、標(biāo)準(zhǔn)統(tǒng)一等程度。尤其是涉及到具有知識產(chǎn)權(quán)或個人利益的數(shù)據(jù),如調(diào)研數(shù)據(jù)、科學(xué)數(shù)據(jù)等,相關(guān)的支持、激勵、規(guī)范制度等還沒形成體系,數(shù)據(jù)生產(chǎn)者或擁有者共享數(shù)據(jù)的意愿還不強(qiáng)烈,還沒有形成數(shù)據(jù)共享的自愿機(jī)制和氛圍。

4 大學(xué)數(shù)據(jù)分級共享策略

綜上可以看出,數(shù)據(jù)的分級共享看似簡單,實(shí)際上是一項(xiàng)系統(tǒng)性的工程,需要突破數(shù)據(jù)共享的困境,統(tǒng)一考慮多方因素。

4.1 明晰數(shù)據(jù)分級共享的邊界

數(shù)據(jù)共享雖然是大勢所趨,但也要考慮數(shù)據(jù)共享與數(shù)據(jù)保護(hù)之間的關(guān)系,數(shù)據(jù)應(yīng)該共享,但也應(yīng)有界限。從根本上講,數(shù)據(jù)分級共享就是在數(shù)據(jù)共享與數(shù)據(jù)保護(hù)的平衡中尋求更多的共享可能性。對于數(shù)據(jù)分級共享的邊界,不同的大學(xué)從不同的角度進(jìn)行了定義,既可以從國家所屬、機(jī)構(gòu)所屬等角度分類,也可以數(shù)據(jù)產(chǎn)生的分工、數(shù)據(jù)的性質(zhì)等角度分工。如上文麻省理工學(xué)院就是從用戶的角度,將數(shù)據(jù)分級共享依據(jù)用戶的范圍分成了在校/在職人員、校友、非學(xué)校學(xué)生、非學(xué)校機(jī)構(gòu)、游客、學(xué)校退休人員六個級別,對于每個級別的用戶擁有不同的數(shù)據(jù)共享權(quán)限。

事實(shí)上,數(shù)據(jù)分級共享邊界的確定非常復(fù)雜,既要從數(shù)據(jù)性質(zhì)角度考慮共享的可能性,包括確認(rèn)數(shù)據(jù)是公共數(shù)據(jù)、私有數(shù)據(jù)、還是二者的混合,公共數(shù)據(jù)、私有數(shù)據(jù)實(shí)現(xiàn)共享的可行性方案,混合數(shù)據(jù)中公共數(shù)據(jù)與私有數(shù)據(jù)的拆分及共享策略等;還要從數(shù)據(jù)共享的效益角度,通過對共享利用效益的評估監(jiān)測和對用戶的評價等,實(shí)施不同的數(shù)據(jù)分級共享策略。前者是數(shù)據(jù)分級共享的基礎(chǔ),后者卻能大大推進(jìn)分級共享的進(jìn)程。

對共享利用效益的評估監(jiān)測和對用戶的評價等能更好地平衡數(shù)據(jù)保護(hù)與數(shù)據(jù)共享的之間關(guān)系,促進(jìn)數(shù)據(jù)更大范圍上的共享。這種評估監(jiān)測的指標(biāo)可以包括但不限于對申請使用的數(shù)據(jù)主題領(lǐng)域、數(shù)據(jù)使用的目的、申請用戶身份、申請用戶是否有可信的團(tuán)隊(duì)、數(shù)據(jù)是否適宜向此類用戶提供服務(wù)等。如英國國家統(tǒng)計(jì)局開發(fā)設(shè)計(jì)的Five Safes數(shù)據(jù)安全框架就從五個維度細(xì)化指標(biāo)對數(shù)據(jù)共享使用進(jìn)行了評估(見表3),大學(xué)數(shù)據(jù)的分級共享可以參考借鑒。

4.2 確定分級共享數(shù)據(jù)的權(quán)責(zé)歸屬

大學(xué)科學(xué)數(shù)據(jù)的分級共享是以科學(xué)數(shù)據(jù)使用的合法、合規(guī)和安全為基礎(chǔ)的,這就要求數(shù)據(jù)共享不僅要依從相關(guān)的法律法規(guī)要求,還要在共享前明確數(shù)據(jù)的一系列權(quán)責(zé)和權(quán)屬,實(shí)現(xiàn)數(shù)據(jù)的確權(quán),使得數(shù)據(jù)的生產(chǎn)者、擁有者、共享者、利用者等對數(shù)據(jù)共享過程中的各個關(guān)鍵環(huán)節(jié)有明確、清晰的行為依據(jù),幫助其消除因權(quán)責(zé)不確定而產(chǎn)生的顧慮。除了公共數(shù)據(jù)外,一般的數(shù)據(jù)共享都要進(jìn)行確權(quán),尤其是涉及到個人隱私的數(shù)據(jù),在明確權(quán)責(zé)歸屬后,還需要進(jìn)行相關(guān)的脫敏處理等。共享協(xié)議是最主要的一種確權(quán)形式,其可以分為許可共享協(xié)議、合同共享協(xié)議、聲明共享協(xié)議、援引共享協(xié)議等幾種形式[14]。

之所以要進(jìn)行數(shù)據(jù)權(quán)責(zé)歸屬的確定,是因?yàn)樵跀?shù)據(jù)共享中,不同的群體對數(shù)據(jù)共享表現(xiàn)出不同的態(tài)度。如學(xué)者Tenopir在調(diào)查中就發(fā)現(xiàn),被調(diào)查的96%的環(huán)境科學(xué)家和生態(tài)學(xué)家都愿意分享數(shù)據(jù),簽署共享許可協(xié)議;相比之下,心理學(xué)家和教育研究人員分享數(shù)據(jù)的頻率較低,被調(diào)查的科學(xué)家中只有不到一半的人真正將數(shù)據(jù)授權(quán)開放共享[31]。當(dāng)前大學(xué)數(shù)據(jù)的分級共享仍是呈現(xiàn)部分?jǐn)?shù)據(jù)開放共享、部分封閉的情況,還需要通過明確數(shù)據(jù)的權(quán)責(zé)歸屬,增加數(shù)據(jù)的生產(chǎn)者、擁有者等數(shù)據(jù)共享的信心,進(jìn)而推進(jìn)數(shù)據(jù)分級共享的進(jìn)程。

4.3 基于生命周期對數(shù)據(jù)進(jìn)行質(zhì)量監(jiān)測

數(shù)據(jù)質(zhì)量是數(shù)據(jù)分級共享的基石,在進(jìn)行數(shù)據(jù)分級共享的各個環(huán)節(jié),都應(yīng)該嵌入數(shù)據(jù)質(zhì)量監(jiān)測的程序,對數(shù)據(jù)獲取的途徑、數(shù)據(jù)可訪問性、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)的一致性和完整性等進(jìn)行評估,以保證數(shù)據(jù)的共享可用性。同時,因?yàn)閿?shù)據(jù)的巨大價值在于其不是靜態(tài)的、一成不變的,而是在循環(huán)的創(chuàng)造、保護(hù)、共享、遷移、歸檔、銷毀的過程中,不斷產(chǎn)生新的數(shù)據(jù),形成巨大的數(shù)據(jù)效應(yīng)。在此過程中,數(shù)據(jù)將經(jīng)歷生成、保護(hù)、獲取、活躍、衰退、遷移、再次激活、歸檔、銷毀等一系列周期過程。每個過程中,數(shù)據(jù)的敏感性、重要性等都會產(chǎn)生新的變化,進(jìn)而會影響數(shù)據(jù)分級共享。因此,還應(yīng)基于數(shù)據(jù)的生命周期對數(shù)據(jù)進(jìn)行質(zhì)量監(jiān)測評估,并根據(jù)評估的結(jié)果,綜合考慮數(shù)據(jù)的分級共享邊界、分級權(quán)責(zé)歸屬、數(shù)據(jù)敏感性、數(shù)據(jù)重要性、損失的影響等諸多因素,最終確定數(shù)據(jù)分級共享的標(biāo)準(zhǔn)。且需要根據(jù)數(shù)據(jù)所處生命周期階段的不同,動態(tài)調(diào)整數(shù)據(jù)分級共享的標(biāo)準(zhǔn);有時可能還需要對數(shù)據(jù)分級共享進(jìn)行重新規(guī)劃,畢竟如果某些數(shù)據(jù)集發(fā)生了變化,可能影響相應(yīng)范圍內(nèi)數(shù)據(jù)的分級共享策略、流程等,這就需要對較大范圍內(nèi)的數(shù)據(jù)分級共享策略進(jìn)行整體調(diào)整。

對數(shù)據(jù)生命周期的時長,有學(xué)者進(jìn)行了研究,不同的領(lǐng)域呈現(xiàn)出了不同的時間長度。尤其是科學(xué)研究產(chǎn)生的數(shù)據(jù)。如英國生物技術(shù)與生物科學(xué)研究理事會規(guī)定項(xiàng)目結(jié)束后的數(shù)據(jù)至少需要保留10年,美國國立衛(wèi)生研究院規(guī)定數(shù)據(jù)研究項(xiàng)目結(jié)束后最少保留3年[32]。同時,還要關(guān)注數(shù)據(jù)中的“睡美人”現(xiàn)象,尤其是在科學(xué)數(shù)據(jù)中。據(jù)2015年《美國科學(xué)院院刊》(PNAS)上的一篇文章顯示,科學(xué)論文的“睡美人”現(xiàn)象非常普遍,如菲利普·華萊士(Philip Wallace)1947年就發(fā)表了計(jì)算單層石墨即石墨烯的能帶結(jié)構(gòu),但這篇論文發(fā)表后未引起關(guān)注,直到2003年,海姆(Andrei Geim)和諾沃肖洛夫(Konstantin Novoselov)發(fā)現(xiàn)了如何在實(shí)驗(yàn)室制造這種石墨層,并于2010年因此發(fā)現(xiàn)獲得了諾貝爾物理學(xué)獎,才引發(fā)了人們對石墨烯的高度關(guān)注,并至今未消退[33]。因此,對于長期沉睡未顯現(xiàn)價值的“睡美人”數(shù)據(jù),要在合理合規(guī)的前提下,延長數(shù)據(jù)歸檔期,同時實(shí)施最優(yōu)的分級共享策略,以實(shí)現(xiàn)數(shù)據(jù)的最大范圍共享。這對數(shù)據(jù)質(zhì)量監(jiān)測評估提出了更高的要求,對不同的數(shù)據(jù)生命周期管理也要更為科學(xué)準(zhǔn)確;加之?dāng)?shù)據(jù)本身就是一個復(fù)雜的構(gòu)成,有領(lǐng)域、格式、數(shù)量、權(quán)屬等眾多的不同,因此,基于數(shù)據(jù)生命周期的質(zhì)量監(jiān)測管理,對于數(shù)據(jù)分級共享來說,是一項(xiàng)挑戰(zhàn)。

雖如此,但也不能一味追求分級共享數(shù)據(jù)的質(zhì)量,也要考慮各類支撐數(shù)據(jù)分級共享資源的最佳利用,即在數(shù)據(jù)分級共享時,既要考慮數(shù)據(jù)的安全共享,還要考慮實(shí)施成本,在之間找到最佳的平衡點(diǎn)。畢竟在進(jìn)行數(shù)據(jù)分級共享、實(shí)施數(shù)據(jù)訪問控制和訪問管理,防止數(shù)據(jù)丟失等項(xiàng)目時都需要資金、技術(shù)等的資源支持,需要通過確定不同類型數(shù)據(jù)的價值及支持資源的付出,確定最佳的配置,以保證支持資源的最佳利用。

4.4 重視數(shù)據(jù)分級共享的安全防控

在數(shù)據(jù)分級共享的實(shí)踐中,重視安全防控至關(guān)重要。首要必要遵守有關(guān)的法律規(guī)定。包括管理數(shù)據(jù)涉及到的法律、法規(guī)或數(shù)據(jù)使用協(xié)議內(nèi)容,數(shù)據(jù)的提供者和來源的某些限定等等。

大學(xué)在推進(jìn)數(shù)據(jù)分級共享時,還必須綜合考慮數(shù)據(jù)的敏感性問題,即要考慮數(shù)據(jù)中是否含有國家機(jī)密、企業(yè)或社會機(jī)構(gòu)秘密、個人隱私等信息,以及含有這些信息的數(shù)量、程度等,來確定數(shù)據(jù)是否共享、共享的范圍、共享的程序等。這是數(shù)據(jù)分級共享考必須考慮的因素之一,不同的大學(xué)在數(shù)據(jù)分級共享時基本都將其作為最基本的因素予以考慮。

同時,數(shù)據(jù)的重要性也是不可忽視的,其對國家、科研機(jī)構(gòu)、個人等的影響和重要程度必然是數(shù)據(jù)分級的重要依據(jù)。在《中華人民共和國數(shù)據(jù)安全法》中,就明確規(guī)定了“根據(jù)數(shù)據(jù)在經(jīng)濟(jì)社會發(fā)展中的重要程度……對數(shù)據(jù)實(shí)行分類分級保護(hù)[34]?!泵芪鞲砉ご髮W(xué)在對其數(shù)據(jù)進(jìn)行分級時,也提出:數(shù)據(jù)需按其敏感性、重要性和相關(guān)風(fēng)險(xiǎn)進(jìn)行分級,數(shù)據(jù)分級對于確定安全、保護(hù)數(shù)據(jù)至關(guān)重要[35]。大學(xué)在對數(shù)據(jù)分級時必然要考慮數(shù)據(jù)的重要程度。

此外,數(shù)據(jù)若遭受損失的影響同樣需要評估,考慮其如果遭受到破壞、泄露或者被不合規(guī)利用等,給國家、社會、機(jī)構(gòu)或者是個人帶來的損失或危害程度。如加州大學(xué)伯克利分校在進(jìn)行數(shù)據(jù)分級時,會綜合考慮科學(xué)研究的性質(zhì);了解發(fā)生違規(guī)時可能存在的通知要求以及這些要求的潛在影響;如果數(shù)據(jù)丟失,估計(jì)對研究項(xiàng)目的影響等因素以及對大學(xué)造成經(jīng)濟(jì)或名譽(yù)上的損害等[36]。

5 結(jié)語

數(shù)據(jù)共享已經(jīng)成為各個領(lǐng)域的大勢所趨,而數(shù)據(jù)分級是數(shù)據(jù)共享中的必備環(huán)節(jié),是強(qiáng)化數(shù)據(jù)管理、規(guī)避數(shù)據(jù)管理共享中風(fēng)險(xiǎn)的必由之路。數(shù)據(jù)分級共享的目的是在兼顧合法性的前提下更大范圍內(nèi)共享數(shù)據(jù),更好地實(shí)現(xiàn)數(shù)據(jù)的價值,這是數(shù)據(jù)分級共享的本真目標(biāo)。基于這一目標(biāo),本研究通過深入探討大學(xué)數(shù)據(jù)分級共享的多元模式,分析其在實(shí)踐中所遭遇的挑戰(zhàn),全面闡釋了影響數(shù)據(jù)分級共享的多維因素;在此基礎(chǔ)上,提出了應(yīng)明晰數(shù)據(jù)分級共享的邊界、確定分級共享數(shù)據(jù)的權(quán)責(zé)歸屬、基于生命周期進(jìn)行數(shù)據(jù)質(zhì)量監(jiān)測、重視數(shù)據(jù)分級共享的安全防控等一系列解決策略,以推進(jìn)大學(xué)數(shù)據(jù)差異化分級共享的進(jìn)程,優(yōu)化分級共享資源的配置,全面提升數(shù)據(jù)分級共享的效益。

參考文獻(xiàn):

IDC:2025年全球數(shù)據(jù)將有30%實(shí)時數(shù)據(jù)[EB/OL].(2018-11-27)[2022-03-30].https://baijiahao. baidu.com/s?id=1618273544122956838&wfr=spider&for=pc.

科學(xué)數(shù)據(jù)帶你領(lǐng)略世界風(fēng)云[EB/OL].(2019-01-22)[2022-03-30].http://www.casx.gov.cn/content/2019-01/22/content_9220460.htm.

未來20年六大領(lǐng)域創(chuàng)新趨勢:美國國家情報(bào)委員會《全球趨勢2035——進(jìn)步的悖論》報(bào)告 摘譯[EB/OL].(2017-04-11)[2022-03-30].https:// www.sohu.com/a/133352429_297710.

TCSEC[EB/OL].(2019-01-29)[2022-03-30].https://baike.baidu.com/item/TCSEC/8878477?fr=aladdin.

美國的信息系統(tǒng)分級[EB/OL].(2016-02-23)[2022-03-30].http://www.doczj.com/doc/986662573.html.

《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例》系列解讀之重要數(shù)據(jù)篇[EB/OL].(2022-01-22)[2022-03-30].http://www.ipforefront.com/m_article_show.asp?id=1493&BigClass=%E8%B5%84%E8%AE%AF.

邢文明,郭安琪,秦順,等.科學(xué)數(shù)據(jù)管理與共享的FAIR原則:背景、內(nèi)容與實(shí)施[J].信息資源管理學(xué)報(bào),2021,11(2):60-68, 84.

General Data Protection Regulation[EB/OL].(2016-04-05)[2022-03-30].https://gdpr-info.eu/.

數(shù)據(jù)分類分級實(shí)踐:促進(jìn)以數(shù)據(jù)為中心的安全管理[EB/OL].(2018-01-15)[2022-03-30].http://www.topsec.com.cn/pdf/2021/nist.pdf.

劉萬國,周秀霞,黃穎.數(shù)字學(xué)術(shù)資源的分級保存模型構(gòu)建研究[J].情報(bào)資料工作,2018(2):43-47.

楊翼,劉書明,路文海,等.我國海洋環(huán)境監(jiān)測數(shù)據(jù)信息等級劃分研究[J].環(huán)境與可持續(xù)發(fā)展,2014,39(6):112-116.

GT/T26499《機(jī)械科學(xué)數(shù)據(jù)》[EB/OL].(2011-05-12)[2022-03-30].https://www.docin.com/p-1785092427.html.

國務(wù)院辦公廳關(guān)于印發(fā)科學(xué)數(shù)據(jù)管理辦法的通知[EB/OL].(2018-04-02)[2022-03-30].http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm.

中華人民共和國數(shù)據(jù)安全法[EB/OL].(2021-09-01)[2022-03-30].http://www.npc.gov.cn/npc/c30834/202106/7c9af12f51334a73b56d7938f99a788a.shtml.

大數(shù)據(jù)在高校的應(yīng)用與思考[EB/OL].(2022-02-03)[2022-03-30].https://www.atenyun.com/newsdetails-ac-06-bco-01-co-000010.html.

汪小帆.面對每天產(chǎn)生的超過圖書館藏書量的100T數(shù)據(jù),大學(xué)數(shù)字化轉(zhuǎn)型該如何破題?[EB/OL].(2022-03-11)[2022-03-30].https://baijiahao.baidu.com/s?id=1726966945472074642&wfr=spider&for=pc.

How is research data classified?[EB/OL].(2022-04-01)[2022-05-29].https://security.berkeley.edu/education-awareness/best-practices-how-tos/how-classify-research-data.

Steps for classifying research data[EB/OL].(2022-04-01)[2022-05-29].https://security.berkeley.edu/education-awareness/best-practices-how-tos/how-classify-research-data.

袁紅衛(wèi),黃松,劉嫣.麻省理工學(xué)院科學(xué)數(shù)據(jù)管理與共享平臺調(diào)研及啟示[J].圖書館學(xué)研究,2019(13):95-101, 82.

曹喬卓然,陳祖剛,李國慶,等.科學(xué)數(shù)據(jù)中心資源和用戶訪問控制體系[J].大數(shù)據(jù),2022,8(1):98-112.

科學(xué)數(shù)據(jù)分類及用戶權(quán)限[EB/OL].(2021-01-02)[2022-05-29].http://www.sastind.gov.cn/n132/n230/n18108/c41146/content.html.

Research Data Management[EB/OL].(2021-04-23)[2022-05-29].https://libguides.vu.nl/researchdata/data-classification.

Data Classification Guide[EB/OL].(2021-04-23)[2022-05-29].https://its.uchicago.edu/data-classification-guideline/.

胡曉彥,閆振中,鄒自明.空間天氣衛(wèi)星探測數(shù)據(jù)分級標(biāo)準(zhǔn)及應(yīng)用現(xiàn)狀[C]//.第31屆中國氣象學(xué)會年會S14 空間天氣觀測數(shù)據(jù)融合應(yīng)用與模式研究, 2014: 5.

宗威,吳鋒.大數(shù)據(jù)時代下數(shù)據(jù)質(zhì)量的挑戰(zhàn)[J].西安交通大學(xué)學(xué)報(bào)(社會科學(xué)版), 2013, 33(5):38-43.

歐曉鐘.人工智能時代高校數(shù)據(jù)治理的現(xiàn)實(shí)困境及對策[J].武漢冶金管理干部學(xué)院學(xué)報(bào),2021,31(4):14-16.

陳之騰.上海大學(xué):大數(shù)據(jù)賦能 打造“數(shù)治”新范式[J].上海教育,2022(Z3):59.

周秀霞,劉萬國,隋會民,等.Five Safes安全框架及其對我國圖書館領(lǐng)域敏感數(shù)據(jù)安全訪問的啟示[J].情報(bào)理論與實(shí)踐,2020,43(3):85-90.

陳異凡,閆燊,楊亞超,等.我國農(nóng)業(yè)科學(xué)數(shù)據(jù)共享協(xié)議[J].大數(shù)據(jù),2022,8(1):46-59.

胡曉彥,閆振中,鄒自明.空間天氣衛(wèi)星探測數(shù)據(jù)分級標(biāo)準(zhǔn)及應(yīng)用現(xiàn)狀[C]//第31屆中國氣象學(xué)會年會S14 空間天氣觀測數(shù)據(jù)融合應(yīng)用與模式研究, 2014:5.

GABRIEL POPKIN.Data sharing and how it can benefit your scientific career[J].Nature,2019 , 569(7756):445-447.

文雙春.做科學(xué),要睡美人還是要甜妞?[N].湖南大學(xué)報(bào), 2015-06-22(P2).

Data Classification and Protection Standards[EB/OL].(2021-08-15)[2022-05-29].https://www.mtu.edu/it/security/policies-procedures-guidelines/information-security-program/data-classification-protection-standards/.

Steps for classifying research data[EB/OL].(2021-08-15)[2022-05-29].https://security.berkeley.edu/resources/how-classify-research-data.

夏義堃,管茜.基于生命周期的生命科學(xué)數(shù)據(jù)質(zhì)量控制體系研究[J].圖書與情報(bào),2021(3):23-34.

周秀霞 東北師范大學(xué)圖書館研究館員,東北師范大學(xué)教育博士生。 吉林長春,130024。

張立新 長春工業(yè)大學(xué)圖書館館員。 吉林長春,130012。

(收稿日期:2023-12-05 編校:劉 明)

西平县| 屯昌县| 新干县| 新化县| 惠水县| 万安县| 霍林郭勒市| 颍上县| 天峻县| 临清市| 景宁| 郴州市| 喀喇| 永善县| 青冈县| 松潘县| 广元市| 普宁市| 格尔木市| 颍上县| 新干县| 秀山| 琼海市| 金乡县| 上高县| 正镶白旗| 北安市| 温州市| 图们市| 汉源县| 安吉县| 观塘区| 广安市| 铁岭县| 西充县| 临颍县| 天镇县| 东阳市| 惠安县| 布拖县| 延长县|