翟軍 梁佳佳 呂夢雪 林巖
摘? ?要:歐盟在開放科學(xué)數(shù)據(jù)和開放政府?dāng)?shù)據(jù)領(lǐng)域全面采納FAIR原則并取得顯著效果,對于我國公共領(lǐng)域的政府及科學(xué)數(shù)據(jù)開放共享的政策制定具有參考和借鑒價值。文章采用網(wǎng)絡(luò)調(diào)查和文獻(xiàn)分析方法,介紹了歐盟開放科學(xué)數(shù)據(jù)的FAIR 原則的內(nèi)容、實(shí)施框架和實(shí)施進(jìn)展情況。隨后分析了我國公共數(shù)據(jù)開放相對于FAIR原則的不足,提出應(yīng)借鑒歐盟的先進(jìn)經(jīng)驗(yàn)和做法,包括統(tǒng)籌政府?dāng)?shù)據(jù)開放與科學(xué)數(shù)據(jù)開放,在"新基建"中重視數(shù)據(jù)基礎(chǔ)設(shè)施的互聯(lián)互通,及加強(qiáng)科學(xué)數(shù)據(jù)開放共享的國際合作。
關(guān)鍵詞:開放科學(xué)數(shù)據(jù);開放政府?dāng)?shù)據(jù); FAIR原則;公共數(shù)據(jù);開放科學(xué)
Abstract The EU fully adopts FAIR principle in the fields of Open Scientific Data and Open Government Data, and has achieved remarkable results, which has reference value for China's public data open sharing policy formulation. Using Web survey and literature analysis methods, the content, implementation framework and progress of the FAIR principles in EU was systematically introduced in this paper. Then, the shortcomings of the public data opening in China were analyzed in comparison with the FAIR principle. Drawing on the advanced experience of the European Union, it is believed that China should coordinate the opening of government data and scientific data, attach importance to the interoperability of data infrastructure in the "new infrastructure", and strengthen international cooperation for the open sharing of science data.
Key words open science data; open government data; FAIR data principles; public data; open science
歐盟的“開放科學(xué)數(shù)據(jù)”(Open Science Data,OSD)已走在全球前列,且呈現(xiàn)出與“開放政府?dāng)?shù)據(jù)”(Open Government Data,OGD)相互融合、協(xié)調(diào)發(fā)展的趨勢。2019年7月16日,歐盟開始實(shí)施新的《開放數(shù)據(jù)和公共部門信息再利用指令》,公共資助的科學(xué)研究數(shù)據(jù)被納入指令范疇,同時明確了開放數(shù)據(jù)的“默認(rèn)開放原則”(Open by Default)和FAIR原則[1]。為使歐盟成為數(shù)據(jù)驅(qū)動社會的領(lǐng)導(dǎo)者及建立數(shù)字單一市場,2020年2月19日,歐盟委員會頒布新的《數(shù)據(jù)戰(zhàn)略》(Data Strategy)提出未來五年推動數(shù)據(jù)經(jīng)濟(jì)發(fā)展的政策措施和投資戰(zhàn)略,包括加強(qiáng)公共領(lǐng)域和工業(yè)領(lǐng)域的數(shù)據(jù)開放共享和開發(fā)利用[2]。
在國家大數(shù)據(jù)戰(zhàn)略和數(shù)字經(jīng)濟(jì)戰(zhàn)略的引領(lǐng)下,我國正在穩(wěn)步推進(jìn)政府?dāng)?shù)據(jù)的開放共享工作。近兩年,上海、浙江和哈爾濱等省市政府先后出臺《公共數(shù)據(jù)開放管理辦法》,確立了“需求導(dǎo)向、安全可控、統(tǒng)一標(biāo)準(zhǔn)”等工作原則[3]。但總體上,我國政府?dāng)?shù)據(jù)、科學(xué)數(shù)據(jù)等公共數(shù)據(jù)的開放共享水平還落后于發(fā)達(dá)國家,主要原因之一是數(shù)據(jù)開放共享的制度保障體系有待健全,及在指導(dǎo)政策和法規(guī)制定的原則上尚未達(dá)成共識。
相對照的是,F(xiàn)AIR原則已成為歐盟制定數(shù)據(jù)戰(zhàn)略、政策和法規(guī)的重要指導(dǎo)原則之一,在保障開放數(shù)據(jù)的可持續(xù)發(fā)展上發(fā)揮著積極作用[4],其先進(jìn)經(jīng)驗(yàn)與做法可為我國提供切實(shí)可行的借鑒和參考。本文介紹歐盟開放數(shù)據(jù)的FAIR 原則的內(nèi)容、實(shí)施框架和進(jìn)展情況,分析我國公共數(shù)據(jù)開放的不足,給出改進(jìn)的對策建議。
1? ?FAIR 數(shù)據(jù)原則
在數(shù)據(jù)密集型科研和開放科學(xué)環(huán)境下,跨學(xué)科、跨機(jī)構(gòu)的數(shù)據(jù)共享和重用的需求日益強(qiáng)烈,對“科學(xué)數(shù)據(jù)管理”提出了新的挑戰(zhàn)。應(yīng)對挑戰(zhàn),人們認(rèn)識到首要任務(wù)是確立一組共同認(rèn)可的簡潔、可度量的指導(dǎo)原則[5]。2014年1月,在荷蘭萊頓的研討會上,借鑒2007年的OECD科學(xué)數(shù)據(jù)獲取原則[6]和2013年的G8科技部長關(guān)于開放科學(xué)數(shù)據(jù)的聲明[7],“FAIR 數(shù)據(jù)原則”(FAIR Data Principles,簡稱“FAIR原則”或“公平原則”)被首次提出,經(jīng)FORCE11工作組(www.force11.org)修改完善后,于2016年3月正式發(fā)表在Nature Research旗下的《Scientific Data》上[5]。
為確保能同時被人和機(jī)器所使用,F(xiàn)AIR原則闡明了“數(shù)據(jù)對象”(Data Object,見圖1)應(yīng)具有的基本屬性,即可發(fā)現(xiàn)(Findable)、可獲?。ˋccessible)、互操作(Interoperable)和可重用(Re-usable),每個屬性下又有子屬性(見表1)。
隨后,F(xiàn)AIR原則的主要貢獻(xiàn)者們又指出,該原則不僅適用于數(shù)據(jù)及其元數(shù)據(jù),也適用于其他科研產(chǎn)出和資源,對數(shù)據(jù)服務(wù)和科研基礎(chǔ)設(shè)施(如云設(shè)施等)的建設(shè)也具有指導(dǎo)意義[8]。在補(bǔ)充實(shí)現(xiàn)細(xì)節(jié)后FAIR原則已日趨完善,如選擇DOI(Digital Object Identifier)作為對象的PID,采用HTTP通信協(xié)議、OWL(Web Ontology Language)語言和CC0數(shù)據(jù)許可等[9]。目前,F(xiàn)AIR原則已在美國、澳大利亞、歐洲、亞洲、拉丁美洲和非洲得到關(guān)注和應(yīng)用,涉及生命科學(xué)、醫(yī)療衛(wèi)生、核能、氣候變化、海洋研究和人文科學(xué)等領(lǐng)域[10]。
2? ?歐盟FAIR 原則的相關(guān)政策和實(shí)施框架
歐盟是在開放科學(xué)戰(zhàn)略中最早全面采納FAIR原則并取得顯著成效的機(jī)構(gòu)之一[8,10]。根據(jù)普華永道于2018年3月做出的評估,由于使用了FAIR數(shù)據(jù),每年可為歐盟節(jié)約成本約100億歐元[11]。
早在2014年1月啟動的“地平線2020”(Horizon 2020)科技計劃中,歐盟研究委員會就啟動了“開放研究數(shù)據(jù)試點(diǎn)”項目,要求Horizon 2020資助項目的數(shù)據(jù)管理遵循FAIR原則[12]。2016年2月,各國參與制定的《歐盟開放科學(xué)議程》確立的五項行動之一是“建設(shè)支持開放科學(xué)的基礎(chǔ)設(shè)施”,其目標(biāo)是通過實(shí)施FAIR原則,到2020年全面實(shí)現(xiàn)歐盟范圍的跨學(xué)科、跨機(jī)構(gòu)的科學(xué)數(shù)據(jù)訪問、共享和重用[13]。2020年2月,歐盟委員會新的《數(shù)據(jù)戰(zhàn)略》的四項核心內(nèi)容之一是“數(shù)據(jù)訪問和使用的跨部門治理框架”,首要任務(wù)是在2020年第四季度建立歐洲共同數(shù)據(jù)空間治理的立法框架,F(xiàn)AIR原則仍然是應(yīng)遵循的基本原則之一[2]。
為支持開放科學(xué)的研究和創(chuàng)新政策制定,歐盟委員會于2016年8月成立“FAIR數(shù)據(jù)專家組”(Expert Group on FAIR Data,以下簡稱“專家組”),專門負(fù)責(zé)[14]:①提出FAIR原則的實(shí)施建議;②構(gòu)建評估指標(biāo);③指導(dǎo)制定歐洲開放科學(xué)云的FAIR行動計劃;④開發(fā)和評估Horizon 2020的FAIR數(shù)據(jù)管理計劃(Data Management Plan,DMP)的模板和指南;⑤評估數(shù)據(jù)管理活動的財務(wù)和支出情況。
經(jīng)過深入研究和科技界的廣泛咨詢后,專家組于2018年11月完成研究報告《將FAIR變?yōu)楝F(xiàn)實(shí)》,在定義FAIR概念和模型、文化建設(shè)和生態(tài)系統(tǒng)等六個方面提出27項實(shí)施建議[15],形成了FAIR 原則的實(shí)施框架(見表2)。
擴(kuò)展原有的“數(shù)據(jù)對象”,專家組建立了“FAIR數(shù)字對象”(FAIR Digital Objects,F(xiàn)DO)模型(見圖2),處于核心位置的“數(shù)字對象”可以是數(shù)據(jù)、算法、代碼和軟件等科研產(chǎn)出,也可以是科研的相關(guān)資源,如工具、工作流程、協(xié)議、標(biāo)準(zhǔn)和服務(wù)等。圍繞FDO的管理和使用,提出FAIR生態(tài)系統(tǒng)的結(jié)構(gòu)(見圖3),含有政策、標(biāo)準(zhǔn)、DMP和存儲庫等要素,利益相關(guān)者包括政府和研究資助者、大學(xué)和科研機(jī)構(gòu)、圖書館、出版商、科研人員、數(shù)據(jù)管理員和數(shù)據(jù)服務(wù)提供者等,其核心是提供存儲等服務(wù)的云平臺。進(jìn)而,形成實(shí)現(xiàn)FAIR原則的技術(shù)框架,依次是基礎(chǔ)設(shè)施層、存儲層、數(shù)據(jù)層和應(yīng)用層(見圖4)。
3? ?歐盟FAIR 原則的實(shí)施進(jìn)展情況
“歐洲開放科學(xué)云”(European Open Science Cloud,EOSC)為FAIR生態(tài)系統(tǒng)提供了云服務(wù)和數(shù)據(jù)基礎(chǔ)設(shè)施,推動著FAIR原則在歐盟的“落地生根”。
3.1? ? EOSC計劃的FAIR行動
EOSC是歐盟委員會2016年提出的“歐洲云計劃”的主要內(nèi)容,目標(biāo)是聯(lián)合現(xiàn)有的分布式數(shù)據(jù)基礎(chǔ)設(shè)施,打造一個開放、無縫訪問的虛擬環(huán)境,為170萬科研人員及7000萬專業(yè)人士提供數(shù)據(jù)的存儲、管理、分析與再利用服務(wù),促進(jìn)科研數(shù)據(jù)的跨境、跨學(xué)科開放共享,確保歐盟開放科學(xué)在全球的領(lǐng)先地位[16]。
2017年10月通過、得到70多個機(jī)構(gòu)認(rèn)可的《EOSC宣言》將“實(shí)施FAIR行動計劃、建設(shè)FAIR數(shù)據(jù)文化”確立為三個行動指南之首[17]。2018年3月頒布的《EOSC實(shí)施路線圖》描述了六條行動路線[16],依次是體系結(jié)構(gòu)、數(shù)據(jù)、服務(wù)、訪問/接口、規(guī)則和治理。其中,“數(shù)據(jù)行動路線”建設(shè)支持FAIR數(shù)據(jù)管理的工具/服務(wù)、數(shù)據(jù)目錄、標(biāo)準(zhǔn)和規(guī)范等,其財政資金來自Horizon 2020計劃劃撥的3億歐元。2018年11月23日,EOSC網(wǎng)站(www.eosc-portal.eu)上線運(yùn)行,標(biāo)志著云平臺及服務(wù)的正式啟動,工作重心也轉(zhuǎn)為建立EOSC的治理結(jié)構(gòu),相應(yīng)地成立了“治理委員會”和“執(zhí)行委員會”。2019年6月,執(zhí)行委員會發(fā)布《EOSC戰(zhàn)略實(shí)施計劃》,說明2019-2020年的行動路線和時間表,及相關(guān)的Horizon 2020項目,目標(biāo)是到2020年底將“歐洲制造的數(shù)據(jù)”(Data Made in Europe)打造為FAIR數(shù)據(jù)[18]。
在歐盟委員會FAIR數(shù)據(jù)專家組的指導(dǎo)下,EOSC執(zhí)行委員會下設(shè)的“FAIR工作組”(FAIR Working Group)負(fù)責(zé)“FAIR行動計劃”的編制和執(zhí)行工作[19](見表3)。這些工作與相關(guān)的Horizon 2020項目(見表4)一起,為FAIR生態(tài)系統(tǒng)的形成打下了良好基礎(chǔ)。如截至2020年9月底,F(xiàn)AIRSharing項目的網(wǎng)站已收集了1454個標(biāo)準(zhǔn)、1595個數(shù)據(jù)存儲庫和134個數(shù)據(jù)政策,經(jīng)過評估后推薦給生態(tài)系統(tǒng)的利益相關(guān)者在數(shù)據(jù)管理實(shí)踐中使用[20],其中包括FAIR4Health項目從文化、倫理、法律和技術(shù)等方面提出的歐盟衛(wèi)生研究機(jī)構(gòu)的FAIR數(shù)據(jù)政策指南[21]。
3.2? ? 科學(xué)歐洲的研究數(shù)據(jù)管理實(shí)踐指南
隨著EOSC云平臺的推出和治理工作的深入,更多的利益相關(guān)者參與到EOSC的推廣應(yīng)用中。由歐盟27個國家的36個研究資助和執(zhí)行機(jī)構(gòu)組成的“科學(xué)歐洲”(Science Europe,SE)聯(lián)盟,每年掌管的科研基金達(dá)180億歐元,是歐洲科技政策制定的關(guān)鍵利益相關(guān)者,也是EOSC執(zhí)行委員會的成員之一。多年來,SE一直是歐盟開放科學(xué)戰(zhàn)略的積極推動者和參與者,最新的工作是依托EOSC開展的,目標(biāo)是保持各成員機(jī)構(gòu)在“研究數(shù)據(jù)管理”(Research Data Management,RDM)政策上的一致性,以適應(yīng)“地平線2020”(Horizon 2020,2014-2020)和“地平線歐洲”(Horizon Europe,2021-2027)研究框架計劃對科研項目數(shù)據(jù)管理的要求。
2019年1月,在總結(jié)FAIR原則的實(shí)施經(jīng)驗(yàn)基礎(chǔ)上,SE專家組完成《RDM實(shí)踐指南》[22],給出了編制“數(shù)據(jù)管理計劃”(DMP)的15點(diǎn)要求和選擇數(shù)據(jù)存儲庫的15條標(biāo)準(zhǔn)(見表5)。
一年來,已至少有七個SE的成員機(jī)構(gòu)依據(jù)《RDM實(shí)踐指南》完善了各自的RDM政策或指南[23],包括法國國家科研署、愛爾蘭健康研究委員會、瑞典研究理事會和荷蘭研究理事會等。如2020年1月1日,荷蘭研究理事會更新了數(shù)據(jù)管理政策,要求在其資助的科研項目中采用新的DMP模板,以完全符合《RDM實(shí)踐指南》和FAIR原則[24]。
3.3? ? 各科學(xué)領(lǐng)域的FAIR實(shí)踐
在EOSC計劃的帶動下,歐洲的各類科學(xué)組織和機(jī)構(gòu)認(rèn)識到FAIR原則對“數(shù)據(jù)密集型科學(xué)”(Data-intensive Science,DIS)的重要推動作用[25],開展了相關(guān)的實(shí)踐活動。
在人文社會科學(xué)領(lǐng)域,歐洲社會科學(xué)數(shù)據(jù)檔案委員會(Consortium of European Social Science Data Archives,CESSDA)參照歐盟的FAIR實(shí)施框架進(jìn)行了自評估[26],發(fā)現(xiàn)在FAIR文化和生態(tài)建設(shè)上的不足,在開發(fā)數(shù)據(jù)目錄服務(wù)(datacatalogue.cessda.eu)時,以FAIR原則指導(dǎo)平臺的功能和結(jié)構(gòu)設(shè)計。由75個跨學(xué)科團(tuán)隊參加的記錄瀕危語言的項目DOBES收集了約120種瀕危語言的文獻(xiàn)資料,在建設(shè)資料存儲庫(dobes.mpi.nl)時引入PID服務(wù)和OAI-PMH元數(shù)據(jù)收集標(biāo)準(zhǔn),提升了存儲庫的FAIR水平[25]。得到Horizon 2020計劃資助的25個機(jī)構(gòu)參與建設(shè)的“通用語言資源和技術(shù)基礎(chǔ)設(shè)施”(Common Language Resources and Technology Infrastructure,CLARIN)已實(shí)現(xiàn)與EOSC的連接,其愿景是實(shí)現(xiàn)歐洲范圍內(nèi)數(shù)字語言數(shù)據(jù)、資源和工具的統(tǒng)一訪問[27]。CLARIN正努力提升“數(shù)據(jù)體系結(jié)構(gòu)”的FAIR水平,采取了一些有力措施(見表6)。
在環(huán)境科學(xué)領(lǐng)域,由德國氣候計算中心托管的“世界氣候數(shù)據(jù)中心”(World Data Center for Climate,WDCC)的工作重心是開發(fā)和實(shí)施地球系統(tǒng)數(shù)據(jù)管理的最佳實(shí)踐方法,收集、存儲和傳播有關(guān)氣候研究的數(shù)據(jù)。為更好地對接地球觀測、氣象、海洋學(xué)和環(huán)境科學(xué)的數(shù)據(jù)中心,WDCC重視FAIR原則的應(yīng)用[25],包括通過OAI-PMH和HTTP協(xié)議訪問數(shù)據(jù)和元數(shù)據(jù)、采用氣候數(shù)據(jù)標(biāo)準(zhǔn)CF-netCDF 和使用CC-by 4.0數(shù)據(jù)許可等。
在生命科學(xué)和生物信息學(xué)領(lǐng)域,聯(lián)合了220多個研究機(jī)構(gòu)的政府間組織ELIXIR(www.elixir-europe.org)的目標(biāo)是匯集和協(xié)調(diào)來自歐洲各地的生命科學(xué)資源:數(shù)據(jù)庫、軟件、云存儲和超級計算機(jī)等,建設(shè)統(tǒng)一的研究基礎(chǔ)設(shè)施,使科學(xué)家更容易找到和共享數(shù)據(jù)、交換專業(yè)知識和協(xié)商最佳做法。在EOSC FAIRSharing項目的支持下,ELIXIR正在建設(shè)互操作平臺,包括FAIR服務(wù)基礎(chǔ)設(shè)施[28]。以此為基礎(chǔ),開展了“農(nóng)作物大規(guī)?;蚍中蛿?shù)據(jù)集”的FAIR化(FAIR-ification)研究工作,將確保與分布式機(jī)構(gòu)存儲庫中的表型數(shù)據(jù)的互操作連接,為作物育種提供數(shù)據(jù)支撐。作為ELIXIR的成員之一,荷蘭生命科學(xué)技術(shù)中心(Dutch Techcentre for Life Sciences,DTL)認(rèn)識到專業(yè)的FAIR數(shù)據(jù)管理崗位和人員的重要性,開發(fā)了生命科學(xué)研究項目的“數(shù)據(jù)管家”(Data Stewards)指南[29]。于2020年2月啟動的、由22個國家的29個研究機(jī)構(gòu)參與的ELIXIR-CONVERGE項目[30],將用三年的時間完成:①開發(fā)跨國的生命科學(xué)數(shù)據(jù)管理支持模型;②構(gòu)建數(shù)據(jù)管家的綜合培訓(xùn)方案,加強(qiáng)歐洲的數(shù)據(jù)管理能力;③開發(fā)數(shù)據(jù)管理標(biāo)準(zhǔn)和服務(wù)的工具包等。
4? ?對我國的啟示
根據(jù)復(fù)旦大學(xué)數(shù)字與移動治理實(shí)驗(yàn)室的《中國地方政府?dāng)?shù)據(jù)開放報告》,截至2020年4月底,我國已有130個省級、副省級和地級政府上線了開放數(shù)據(jù)平臺[31]。隨著開放范圍的不斷擴(kuò)大,越來越多的科學(xué)數(shù)據(jù)被發(fā)布出來,涵蓋氣象、地理、交通和城市管理等領(lǐng)域(見表7)。但相對于FAIR原則,這些數(shù)據(jù)及其元數(shù)據(jù)還存在很多不足(見表8),妨礙了數(shù)據(jù)的大范圍搜索、流動、整合與分析。因此,我國應(yīng)著重從以下三方面借鑒歐盟的先進(jìn)經(jīng)驗(yàn),加強(qiáng)和改善各領(lǐng)域公共數(shù)據(jù)的開放共享。
4.1? ? 統(tǒng)籌政府?dāng)?shù)據(jù)開放與科學(xué)數(shù)據(jù)開放、實(shí)現(xiàn)統(tǒng)一開放
FAIR數(shù)據(jù)原則與開放數(shù)據(jù)原則(如G8開放數(shù)據(jù)憲章等)是互補(bǔ)的關(guān)系(見圖5),分別指導(dǎo)著各國的開放科學(xué)數(shù)據(jù)(OSD)和開放政府?dāng)?shù)據(jù)(OGD)的政策/法規(guī)制定和實(shí)踐發(fā)展[8,15]。近年來,兩個原則呈現(xiàn)出相互融合的趨勢,推動著OSD與OGD的統(tǒng)一、協(xié)調(diào)發(fā)展,這在《歐盟開放科學(xué)議程》和新的《開放數(shù)據(jù)和公共部門信息再利用指令》上表現(xiàn)特別突出[1,13],2019年5月發(fā)布的歐盟衛(wèi)生研究機(jī)構(gòu)數(shù)據(jù)政策指南更是FAIR原則與開放數(shù)據(jù)原則相結(jié)合的典型成果[21]。類似地,美國在第四輪(2019-2021年)《開放政府合作組織國家行動計劃》中也增加了開放科學(xué)數(shù)據(jù)的內(nèi)容[32],美國政府開放數(shù)據(jù)網(wǎng)站Data.GOV(www.data.gov)增設(shè)了“科學(xué)與研究”主題,已發(fā)布20個科學(xué)數(shù)據(jù)集,分別來自美國宇航局(NASA)、能源部(DOE)和國立衛(wèi)生研究院(NIH)等。
2020年4月9日,中共中央、國務(wù)院印發(fā)《關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見》,提出加快培育數(shù)據(jù)要素市場、推進(jìn)政府?dāng)?shù)據(jù)開放共享[33]。政府是公共數(shù)據(jù)資源的最大擁有者,為使我國的政府網(wǎng)站,特別是政府開放數(shù)據(jù)網(wǎng)站成為各類公共數(shù)據(jù)的最具權(quán)威的可靠來源,我國的開放數(shù)據(jù)政策在支持“默認(rèn)開放”的同時,也應(yīng)引入FAIR原則的思想,關(guān)注科學(xué)數(shù)據(jù)開放共享的特殊性(如對元數(shù)據(jù)的要求),打通政府?dāng)?shù)據(jù)開放與科學(xué)數(shù)據(jù)開放的通道,改變政府部門與科技部門各自為政的局面,實(shí)現(xiàn)各類公共數(shù)據(jù)的統(tǒng)一開放。
4.2? ? 重視各個領(lǐng)域數(shù)據(jù)基礎(chǔ)設(shè)施的互聯(lián)互通、實(shí)現(xiàn)數(shù)據(jù)的互操作
歐盟通過實(shí)施EOSC計劃和FAIR行動,已初步實(shí)現(xiàn)各領(lǐng)域數(shù)據(jù)基礎(chǔ)設(shè)施的互聯(lián)互通,為歐盟范圍內(nèi)的數(shù)據(jù)開放共享打下了堅實(shí)基礎(chǔ)。
2020年3月4日的中央政治局會議指出,要加快5G網(wǎng)絡(luò)、數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施建設(shè)進(jìn)度。在“新基建”中,各類數(shù)據(jù)中心(如科學(xué)數(shù)據(jù)中心、政府?dāng)?shù)據(jù)中心等)等數(shù)據(jù)基礎(chǔ)設(shè)施是投資的重點(diǎn)之一。在建設(shè)中,應(yīng)重視各個領(lǐng)域數(shù)據(jù)基礎(chǔ)設(shè)施的互聯(lián)互通,打破“數(shù)據(jù)孤島”,實(shí)現(xiàn)數(shù)據(jù)資源之間的互操作。
我國各地開放數(shù)據(jù)平臺發(fā)布的數(shù)據(jù)在字段的個數(shù)、名稱和類型上存在“異構(gòu)”問題,元數(shù)據(jù)也差異較大,數(shù)據(jù)互操作程度低,而根本的解決之道則是實(shí)現(xiàn)各地政府大數(shù)據(jù)資源管理中心的互聯(lián)互通,并進(jìn)一步實(shí)現(xiàn)各類科學(xué)數(shù)據(jù)中心與政府?dāng)?shù)據(jù)中心的互聯(lián)互通。
4.3? ? 以FAIR原則促進(jìn)科學(xué)數(shù)據(jù)開放共享的國際合作
科學(xué)數(shù)據(jù)重用問題可能給全世界帶來每年約1000億歐元的損失,以FAIR原則促進(jìn)科學(xué)數(shù)據(jù)共享的國際合作,歐盟是最積極的推動者之一[34]。EOSC計劃承諾向全世界開放云平臺,以努力打造“FAIR數(shù)據(jù)和服務(wù)的互聯(lián)網(wǎng)”(Internet of FAIR Data and Services,IFDS)[5,9]。荷蘭生命科學(xué)技術(shù)中心(DTL)依托EOSC發(fā)起“GO FAIR倡議”(www.go-fair.org),在文化、教育和數(shù)據(jù)基礎(chǔ)設(shè)施三方面推動生命科學(xué)等領(lǐng)域FAIR行動的國際合作[35]。美國在開放科學(xué)中心建設(shè)中也重視國際交流與合作[36]。歐盟的“FAIR數(shù)字對象”已經(jīng)被美國國家科學(xué)基金會、國立衛(wèi)生研究院和更多的CODATA(國際數(shù)據(jù)委員會)成員所認(rèn)可,有望成為國際科學(xué)云平臺互操作的基礎(chǔ)協(xié)議[37]。
依據(jù)FAIR原則,數(shù)據(jù)開放共享的路線圖應(yīng)是,將“數(shù)據(jù)”包裝成“FAIR數(shù)字對象”,存儲到支持FAIR原則的存儲庫或數(shù)據(jù)中心,然后將FAIR元數(shù)據(jù)發(fā)布到開放共享網(wǎng)站。FAIR原則強(qiáng)調(diào)“機(jī)器到機(jī)器”的數(shù)據(jù)流動、互操作和再利用,而這正是我國數(shù)據(jù)開放共享的短板之一。因此,吸收FAIR原則的核心思想,在科學(xué)數(shù)據(jù)開放共享的國際合作中應(yīng)用FAIR原則,積極參與IFDS的倡議和活動,是我們需要面對的重要課題。
5? ?結(jié)語
數(shù)據(jù)是數(shù)字化轉(zhuǎn)型的核心,它塑造了我們生產(chǎn)、生活、社會治理和科學(xué)研究的方式。在歐盟,F(xiàn)AIR數(shù)據(jù)原則已滲透到開放科學(xué)的各個層面和各個領(lǐng)域,也是政府?dāng)?shù)據(jù)開放的指導(dǎo)原則之一,促進(jìn)了歐盟數(shù)據(jù)生態(tài)系統(tǒng)、數(shù)據(jù)文化和數(shù)字單一市場的形成,也保障了公共數(shù)據(jù)的開放共享、流通和使用。
當(dāng)前,我國公共數(shù)據(jù)的開放共享,在數(shù)量、質(zhì)量、互操作性和應(yīng)用水平及國際合作上,都有很大的發(fā)展空間和緊迫的現(xiàn)實(shí)需求。完善科學(xué)數(shù)據(jù)管理和政府?dāng)?shù)據(jù)開放的相關(guān)政策,帶動開放科學(xué)和政府?dāng)?shù)據(jù)治理水平的提高,推動“新基建”中數(shù)據(jù)基礎(chǔ)設(shè)施的互聯(lián)互通,應(yīng)是正當(dāng)其時。
參考文獻(xiàn):
[1]? European Commission.European Legislation on Open Data and the Re-use of Public Sector Information[EB/OL].[2020-09-22].https://ec.europa.eu/digital-single-market/en/european-legislation-reuse-public-sector- information.
[2]? European Commission.The European Data Strategy[EB/OL].[2020-09-22].https://ec.europa.eu/commission/presscorner/detail/en/fs_20_283.
[3]? 上海市公共數(shù)據(jù)開放暫行辦法[EB/OL].[2020-09-22].http://www.sh.gov.cn/nw2/nw2314/nw2319/nw12344/u26aw62638.html.
[4]? European Data Portal(EDP).Sustainability of(Open)Data Portal Infrastructures:Dataset Reuse:A Method for Transforming Principles into Practice[EB/OL].[2020-09-22].https://www.europeandataportal.eu/sites/default/files/sustainability-data-portal-infrastructure_3_dataset-reuse.pdf.
[5]? M D Wilkinson,M Dumontier,I J Aalbersberg,et al.The FAIR Guiding Principles for Scientific Data Management and Stewardship[J/OL].[2020-09-22]Scientific Data,2016(3),doi:https://doi.org/10.1038/sdata.2016.18.
[6]? OECD.Principles and Guidelines for Access to Research Data from Public Funding[EB/OL].[2020-09-22].https://doi.org/10.1787/9789264034020-en-fr.https://www.oecd-ilibrary.org/science-and-technology/oecd-principles-and-guidelines-for-access-to-research-data-from-public-funding_9789264034020-en-fr.
[7]? Foreign & Commonwealth Office.G8 Science Ministers Statement[EB/OL].[2020-09-22].https://www.gov.uk/government/news/g8-science-ministers-statement.
[8]? B Mons,C Neylond,J Velterop,et al.Cloudy,Increasingly FAIR; Revisiting the FAIR Data Guiding Principles for the European Open Science Cloud[J].Information Services & Use,2017,37(1):49-56.
[9]? A Jacobsen,R De Miranda Azevedo,N Juty,et al.FAIR Principles:Interpretations and Implementation Considerations[J].Data Intelligence,2020,2(1-2):10-29.
[10]? B Mons,E Schultes,F(xiàn) H Liu,et al.The FAIR Principles:First Generation Implementation Choices and Challenges[J].Data Intelligence,2020,2(1-2):1-9.
[11]? European Commission.Cost-benefit Analysis for FAIR Research Data[EB/OL].[2020-09-22].https://op.europa.eu/en/publication-detail/-/publication/d375368c-1a0a-11e9-8d04-01aa75 ed71a1/language-en.
[12]? European Commission.H2020 Programme Guidelines on FAIR Data Management in Horizon 2020[EB/OL].[2020-09-23].https://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf.
[13]? European Commission.New Trends in Open Science[EB/OL].[2020-09-22].https://ec.europa.eu/digital-single-market/en/news/open-science-focus.
[14]? European Commission.FAIR Data Expert Group Call for Contributions[EB/OL].[2020-09-22].https://ec.europa.eu/research/openscience/pdf/fair_eg.pdf.
[15]? European Commission Expert Group on FAIR Data.Turning FAIR into Reality[EB/OL].[2020-09-22].https://op.europa.eu/en/publication-detail/-/publication/7769a148-f1f6-11e8-9982-01aa75 ed71a1/language-en/format-PDF/source-80611283.
[16]? European Commission.Overview of the EOSC Strategic Implementation Roadmap[EB/OL].[2020-09-22].https://ec.europa.eu/research/openscience/index.cfm?pg=open-science-cloud.
[17]? European Commission.EOSC Declaration[EB/OL].[2020-09-22].https://ec.europa.eu/research/openscience/pdf/eosc_declaration.pdf.
[18]? European Commission.European Open Science Cloud(EOSC)Strategic Implementation Plan[EB/OL].[2020-09-22].https://op.europa.eu/en/publication-detail/-/publication/78ae5276-ae8e-11e9-9d01-01aa75 ed71a1/language-en/format-PDF/source-121451011.
[19]? EOSC.The FAIR Working Group[EB/OL].[2020-09-22].https://www.eoscsecretariat.eu/working-groups/fair-working-group.
[20]? Sansone S A,McQuilton P,Rocca-Serra P,et al.FAIRsharing as a Community Approach to Standards,Repositories and Policies[J].Nature Biotechnology,2019,37(4):358-367.
[21]? Fair4health.Guidelines for Implementing FAIR Open Data Policy in Health Research[EB/OL].[2020-09-22].https://www.fair4health.eu/storage/files/Resource/15/D23%20Guidelines%20for%20implementing%20FAIR%20Open%20Data%20policy%20in%20health%20research.pdf.
[22]? Science Europe.Practical Guide to the International Alignment of Research Data Management[EB/OL].[2020-09-22].https://www.scienceeurope.org/our-resources/practical-guide-to-the-international-alignment-of-research-data-management/.
[23]? Science Europe.Implementing Research Data Management Policies Across Europe:Experiences from Science Europe Member Organisations[EB/OL].[2020-09-22].https://www.scienceeurope.org/our-resources/implementing-research-data-management-policies-across-europe/.
[24]? NWO.NWO to Update Its Data Management Protocol in January 2020[EB/OL].[2020-09-23].https://www.nwo.nl/en/news-and-events/news/2019/12/nwo-to-update-its-data-management-protocol-in-january-2020.html.
[25]? P Wittenburg,M Lautenschlager,H Thiemann,et al.FAIR Practices in Europe[J].Data Intelligence,2020,(1-2):257-263.
[26]? R Dekker.Social Data:CESSDA Best Practices[J].Data Intelligence,2020,2(1-2):220-229.
[27]? Franciska De Jong,Maegaard B,De Smedt K,et al.CLARIN:Towards FAIR and Responsible Data Science Using Language Resources[C].Proceedings of the Eleventh International Conference on Language Resources and Evaluation(LREC 2018),2018:3259-3264.
[28]? ELIXIR.Interoperability Platform[EB/OL].[2020-09-22].https://elixir-europe.org/platforms/interoperability.
[29]? DTL.Towards a Community-endorsed Data Steward Profession Description for Life Science Research[EB/OL].[2020-09-22].https://zenodo.org/communities/nl-ds-pd-ls?page=1&size=20.
[30]? ELIXIR.ELIXIR-CONVERGE[EB/OL].[2020-09-22].https://elixir-europe.org/about-us/how-funded/eu-projects/converge.
[31]? 復(fù)旦大學(xué)移動與數(shù)字治理實(shí)驗(yàn)室.中國地方政府?dāng)?shù)據(jù)開放報告(2020上半年)[R/OL].[2020-09-23].http://ifopendata.fudan.edu.cn/report.
[32]? OGP.United States Action Plan 2019-2021[EB/OL].[2020-09-23].https://www.opengovpartnership.org/documents/united-states-action-plan-2019-2021/.
[33]? 中共中央國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見[EB/OL].[2020-09-23].http://www.gov.cn/zhengce/2020-04/09/content_5500622.htm.
[34]? Barend Mons.Invest 5% of Research Funds in Ensuring Data are Reusable[J].Nature,2020(578):491.
[35]? DTL.GO FAIR Initiative[EB/OL].[2020-09-23].https://www.dtls.nl/fair-data/go-fair/.
[36]? 黃雨婷,賴彤.美國開放科學(xué)中心:實(shí)踐進(jìn)展、特點(diǎn)與啟示[J].圖書與情報,2019(3):105-113.
[37]? EOSC.EOSC and International Initiatives[EB/OL].[2020-09-23].https://www.eoscsecretariat.eu/eosc-and-international-initiatives.
作者簡介:翟軍,男,大連海事大學(xué)航運(yùn)經(jīng)濟(jì)與管理學(xué)院教授,博士生導(dǎo)師,研究方向:開放數(shù)據(jù)、信息管理;梁佳佳,女,大連海事大學(xué)航運(yùn)經(jīng)濟(jì)與管理學(xué)院碩士研究生,研究方向:開放數(shù)據(jù);呂夢雪,女,大連海事大學(xué)航運(yùn)經(jīng)濟(jì)與管理學(xué)院碩士研究生,研究方向:開放數(shù)據(jù);林巖,男,大連海事大學(xué)航運(yùn)經(jīng)濟(jì)與管理學(xué)院教授,博士生導(dǎo)師,研究方向:社交媒體、知識管理。