謝艷秋 錢鵬
國外科學(xué)數(shù)據(jù)共享政策的發(fā)展研究*
謝艷秋 錢鵬
真正實(shí)現(xiàn)科學(xué)數(shù)據(jù)的共享服務(wù),必須制定一系列的共享政策法規(guī),充分發(fā)揮政策法規(guī)在調(diào)整科學(xué)數(shù)據(jù)共享領(lǐng)域中相關(guān)利益人(包括數(shù)據(jù)的提供方、數(shù)據(jù)的保管方、數(shù)據(jù)的使用方等)的重要作用。論文通過網(wǎng)站訪問和文獻(xiàn)研究對美國、英國、新西蘭、澳大利亞等國外科學(xué)數(shù)據(jù)庫的數(shù)據(jù)共享政策建設(shè)情況,進(jìn)行了調(diào)查分析,并試圖從科學(xué)數(shù)據(jù)相關(guān)利益人與數(shù)據(jù)共享領(lǐng)域兩個角度出發(fā),了解其發(fā)展現(xiàn)狀與態(tài)勢。
科學(xué)數(shù)據(jù)數(shù)據(jù)共享共享政策
長期以來,在科研人員群體中,科學(xué)數(shù)據(jù)共享已經(jīng)成為科研活動過程中不可或缺的組成部分。筆者通過網(wǎng)站訪問和文獻(xiàn)研究對國外科學(xué)數(shù)據(jù)庫的數(shù)據(jù)共享政策建設(shè)情況,進(jìn)行調(diào)查分析,并試圖從科學(xué)數(shù)據(jù)相關(guān)利益人與數(shù)據(jù)共享領(lǐng)域兩個角度出發(fā),了解其發(fā)展現(xiàn)狀與態(tài)勢。
國際科學(xué)數(shù)據(jù)共建共享始于1957年,在國際科學(xué)聯(lián)合會組織領(lǐng)導(dǎo)下,先后成立了WDC(World Data center,世界數(shù)據(jù)中心)和CODATA(Committee on Data for Science and Technology,國際科技數(shù)據(jù)委員會)[1]。此后,為促進(jìn)科學(xué)數(shù)據(jù)更好地共享和交換,國際組織、各國政府、眾多科研資助機(jī)構(gòu)等都廣泛展開科學(xué)數(shù)據(jù)的共享服務(wù)與實(shí)踐。如,BBSRC[2](Biotechnology and Biological Sciences Research Council,英國生物技術(shù)與生物科學(xué)研究理事會)、IMOS[3](Integrated Marine Observing System,澳大利亞綜合海洋觀測系統(tǒng))以及NASA[4](National Aeronautics and Space Administration,美國國家航空航天局)分別于于2010年6月、2011年6月、2012年3月制定發(fā)布了一整套數(shù)據(jù)共享政策。
根據(jù)實(shí)踐經(jīng)驗(yàn),科學(xué)數(shù)據(jù)共享活動中有數(shù)據(jù)產(chǎn)生與匯交、數(shù)據(jù)保管與使用、數(shù)據(jù)共享評估與監(jiān)督、數(shù)據(jù)共享保障四個領(lǐng)域[5],相應(yīng)地,需要針對這四個領(lǐng)域出臺不同的政策規(guī)范,規(guī)范科學(xué)數(shù)據(jù)共享領(lǐng)域的社會關(guān)系。
1.1 數(shù)據(jù)產(chǎn)生與匯交
數(shù)據(jù)產(chǎn)生與匯交是數(shù)據(jù)共享的第一步,將多源、多項(xiàng)目的科學(xué)數(shù)據(jù)集成于一體,形成研究型科學(xué)數(shù)據(jù)庫群,便于進(jìn)行科學(xué)數(shù)據(jù)的綜合管理(包括重組、融合和增值加工)和共享使用,提高科技創(chuàng)新的支撐能力。數(shù)據(jù)匯交制度典型的有NIH(National Institutes of Health,美國國立衛(wèi)生研究院)、NSF(National Science Foundation,美國自然科學(xué)基金會)、OpenTopography以及政府?dāng)?shù)據(jù)網(wǎng)站等制定的相關(guān)政策。
NIH于2003年3月公布了《NIH數(shù)據(jù)共享政策和執(zhí)行規(guī)范》,規(guī)定了項(xiàng)目數(shù)據(jù)匯交的范圍和執(zhí)行細(xì)則。NIH規(guī)定,除了關(guān)系到國家安全等領(lǐng)域的數(shù)據(jù),都必須進(jìn)行匯交,對全社會共享。這其中就出現(xiàn)過利用某些研究型數(shù)據(jù)成功開發(fā)出新產(chǎn)品的例子[6]。NSF(National Science Foundation,美國國家科學(xué)基金會)則于2010年1月發(fā)布的項(xiàng)目管理指南(NSF Award and Administration G uide,January2010,V I.D.4)[7]中明確提出了研究成果共享傳播的要求。另外,NIH要求在2003年10月1日以后,申請經(jīng)費(fèi)每年超過50萬美元的項(xiàng)目,必須提供數(shù)據(jù)共享計劃。NSF也規(guī)定,從2011年1月18日開始,所有提交到NSF的項(xiàng)目申請書必須包含一份不超過兩頁的“數(shù)據(jù)管理計劃”的補(bǔ)充文檔,這個補(bǔ)充文檔的提議應(yīng)該符合NSF研究成果共享傳播政策。另外,BBSRC等英國的眾多機(jī)構(gòu)也宣布將數(shù)據(jù)管理和共享計劃作為項(xiàng)目申請的一部分。
OpenTopography[8]規(guī)定了數(shù)據(jù)匯交的最低要求,數(shù)據(jù)的優(yōu)先級是由OpenTopography用戶群體的反饋和咨詢委員會共同決定的。2012年1月,由研究人員和出版商組成的“BioSharing行動計劃”啟動了“調(diào)查-研究-分析共享空間”(Investigation-Study-Assay Commons,ISA共享空間),有望優(yōu)化不同數(shù)據(jù)庫之間的數(shù)據(jù)共享。為了更好地促進(jìn)政府信息公開,美國、英國以及澳大利亞等政府先后發(fā)布政府?dāng)?shù)據(jù)網(wǎng)站,為公眾查找、獲取和再利用各級政府?dāng)?shù)據(jù)集提供一站式便捷服務(wù),同時讓各部分的信息能通過網(wǎng)絡(luò)鏈接整合起來,充分挖掘信息的價值[9]。
數(shù)據(jù)匯交時要遵守標(biāo)準(zhǔn)化政策,分為指導(dǎo)標(biāo)準(zhǔn)、通用標(biāo)準(zhǔn)、專用標(biāo)準(zhǔn)。如生物學(xué)各領(lǐng)域科學(xué)數(shù)據(jù)管理、整合及共享的標(biāo)準(zhǔn)——ISA Commons[10]。另外,數(shù)據(jù)匯交時要按照數(shù)據(jù)分類體系對數(shù)據(jù)進(jìn)行歸類,不同的機(jī)構(gòu)有不同的數(shù)據(jù)分類體系,至今尚未統(tǒng)一。如SES(Social&Economic Sciences)的數(shù)據(jù)大類分類準(zhǔn)則[11],政府?dāng)?shù)據(jù)網(wǎng)站根據(jù)主題機(jī)構(gòu)進(jìn)行的數(shù)據(jù)分類體系:英國data.gov.uk按照發(fā)布機(jī)構(gòu),分成23大類,780個小類;美國data.gov的兩級類目體系,即一級分類(原始數(shù)據(jù)地理數(shù)據(jù)和網(wǎng)絡(luò)應(yīng)用服務(wù))和二級分類(以所屬領(lǐng)域,分成農(nóng)業(yè)、教育等45類;以機(jī)構(gòu),分為財政部、國防部、白宮等170多個小類),從宏觀和微觀兩個層面對數(shù)據(jù)資源進(jìn)行了分類[12]。數(shù)據(jù)分類體系不僅使數(shù)據(jù)的呈現(xiàn)方式更加清晰,而且為數(shù)據(jù)發(fā)現(xiàn)和利用提供了便利支持,從而提高了門戶數(shù)據(jù)管理的質(zhì)量,促進(jìn)了數(shù)據(jù)的高效利用。
大數(shù)據(jù)時代越來越注重高質(zhì)量的數(shù)據(jù)匯交,從各研究機(jī)構(gòu)紛紛制定的數(shù)據(jù)質(zhì)量框架中凸顯了數(shù)據(jù)質(zhì)量的重要性。一直以來,數(shù)據(jù)質(zhì)量框架是粗粒度研究數(shù)據(jù)質(zhì)量問題和解決方案的重要內(nèi)容和方向,如國際貨幣基金組織的數(shù)據(jù)質(zhì)量評估框架DQAF(Data Quality Assessment Framework),OECD(Organization for Economic Co-operation and Development,經(jīng)濟(jì)合作與發(fā)展組織)的數(shù)據(jù)質(zhì)量框架體系[13]等。
1.2 數(shù)據(jù)保管與使用
數(shù)據(jù)保管與使用涉及到科學(xué)數(shù)據(jù)共享的主要環(huán)節(jié)和主要內(nèi)容,是對具體數(shù)據(jù)對象進(jìn)行持續(xù)維護(hù),以確保其在硬件技術(shù)變革后仍能被讀取和理解的活動,它從技術(shù)層面確保數(shù)據(jù)的可持續(xù)性。其主要內(nèi)容包括價格政策、保密政策、國際交流與合作政策、發(fā)布制度、保管制度、共享服務(wù)及科學(xué)數(shù)據(jù)中心工作制度等方面[5]。
在數(shù)據(jù)發(fā)布方面,越來越多的基金機(jī)構(gòu)要求其資助的研究項(xiàng)目發(fā)布研究數(shù)據(jù)。如,NIH從2003年起要求年度預(yù)算達(dá)到50萬美元的項(xiàng)目在申請時必須制定數(shù)據(jù)共享方案。AADC規(guī)定,除非特殊情況,數(shù)據(jù)提交到AADC后通常在一個適當(dāng)?shù)慕d期將被公之于眾。特殊情況下,為防止數(shù)據(jù)的及時發(fā)布,應(yīng)提交給AADC管理人員[14]。
在價格方面,大多數(shù)研究機(jī)構(gòu)的大多數(shù)數(shù)據(jù)是免費(fèi)提供的,但并不是所有的數(shù)據(jù)都可以被無限制免費(fèi)使用,各研究機(jī)構(gòu)遵循自身的原則要求發(fā)布共享數(shù)據(jù)。如歐洲國家主要采取成本回收模式;DANS遵循“盡可能地開放,必要的保護(hù)”原則[15];OECD遵循以最具成本效益的原則,最大限度地利用在線網(wǎng)絡(luò)發(fā)布統(tǒng)計數(shù)據(jù)。另外,還有一些研究機(jī)構(gòu)對不同的數(shù)據(jù)使用方實(shí)施不同的價格政策,如ICPSR(Inter-university Consortium for Political and Social Research校際政治及社會研究聯(lián)盟)的大部分的數(shù)據(jù)設(shè)有一定的訪問限制,只有交納了年費(fèi)的機(jī)構(gòu)會員的用戶才能免費(fèi)獲取數(shù)據(jù);非機(jī)構(gòu)會員的用戶則需交納一定的費(fèi)用獲取數(shù)據(jù)[16]。
在保密政策方面,幾乎所有的科學(xué)數(shù)據(jù)庫都要求數(shù)據(jù)提供方以及使用方簽訂隱私保護(hù)協(xié)議。如NSF規(guī)定涉密信息的共享應(yīng)注意對其所關(guān)聯(lián)的個體和主題進(jìn)行隱私保護(hù);NIH對于那些敏感數(shù)據(jù)可以通過Data Enclave實(shí)現(xiàn)共享,Data Enclave是一個受控的安全環(huán)境,在那里資深研究者可以利用和分析那些受限數(shù)據(jù)資源[6];ENA(European Nucleotide Archive,歐洲核苷酸檔案館)的部分應(yīng)數(shù)據(jù)提供者要求,在數(shù)據(jù)公開發(fā)表在出版物上之前保密的數(shù)據(jù)將不提前在平臺上發(fā)布[17]。
在國際交流與合作方面,絕大多數(shù)科學(xué)數(shù)據(jù)庫都積極展開國際交流與合作,很多項(xiàng)目都是各國各機(jī)構(gòu)組織合作完成。OECD主張最大限度地與其他國家和國際組織的數(shù)據(jù)提供者進(jìn)行合作,特別是要考慮所有國家政府(包括統(tǒng)計局)和有互惠協(xié)議的國際組織免費(fèi)提供所有統(tǒng)計產(chǎn)品[18]。
在數(shù)據(jù)保管與使用方面,OpenTopography鼓勵將數(shù)據(jù)注冊在社區(qū)貢獻(xiàn)數(shù)據(jù)目錄中以供用戶查找[8];DANS數(shù)據(jù)提供者需要簽署數(shù)據(jù)合同,數(shù)據(jù)合同的目的在于保證數(shù)據(jù)的可獲取以及進(jìn)一步研究的數(shù)字化持久性[15]。
1.3 數(shù)據(jù)共享評估與監(jiān)督
數(shù)據(jù)共享評估與監(jiān)督包括數(shù)據(jù)質(zhì)量控制、共享評價與監(jiān)督。高質(zhì)量的數(shù)據(jù)是保障高質(zhì)量共享服務(wù)的基礎(chǔ),共享數(shù)據(jù)的評價與監(jiān)督是保障共享數(shù)據(jù)的準(zhǔn)確性、真實(shí)性與完整性,促進(jìn)共享服務(wù)的可持續(xù)發(fā)展。
在數(shù)據(jù)質(zhì)量控制方面,質(zhì)量良好的共享數(shù)據(jù)可以使用戶更方便、準(zhǔn)確地獲取與使用共享數(shù)據(jù)服務(wù)。BBSRC[2]意識到數(shù)據(jù)質(zhì)量的重要性,認(rèn)為數(shù)據(jù)應(yīng)當(dāng)附加相應(yīng)的背景信息或元數(shù)據(jù)記錄,使數(shù)據(jù)使用方能夠了解數(shù)據(jù)來源或處理過程中的細(xì)節(jié),防止數(shù)據(jù)的誤用、誤解或混淆。為了保證數(shù)據(jù)的時效性價值,NIH要求盡快公開和共享數(shù)據(jù),至少不晚于基于最終數(shù)據(jù)集的主要研究成果被出版物錄用的時間。具體時間段還要受數(shù)據(jù)收集特征的影響,小研究項(xiàng)目的數(shù)據(jù)可以更快地分析并提交出版;如果數(shù)據(jù)是有關(guān)大型流行病或追蹤性研究,通過幾個離散的時間段搜集而來,數(shù)據(jù)的公開和共享可以推遲,以保證數(shù)據(jù)的可靠性和準(zhǔn)確性[6]。
在數(shù)據(jù)共享評價與監(jiān)督方面,數(shù)據(jù)評價是為確保數(shù)據(jù)的準(zhǔn)確性與真實(shí)性的有效辦法,而數(shù)據(jù)監(jiān)督是為了確保數(shù)據(jù)當(dāng)前使用目的,并能用于未來再發(fā)現(xiàn)及再利用,從數(shù)據(jù)產(chǎn)生伊始即對其進(jìn)行管理和完善的活動[19],而不是單純對這些數(shù)據(jù)進(jìn)行存儲,有利于確保數(shù)據(jù)的完整性。對于動態(tài)數(shù)據(jù)集而言,數(shù)據(jù)監(jiān)督意味著需進(jìn)行持續(xù)性補(bǔ)充和更新,使數(shù)據(jù)集更加完整以滿足用戶需求。數(shù)據(jù)評價與監(jiān)督對更好地發(fā)揮科學(xué)數(shù)據(jù)的作用,推動科學(xué)研究具有重要意義。
對此,美國的伊利諾伊大學(xué)在2006年開始數(shù)據(jù)監(jiān)督教育計劃,培養(yǎng)數(shù)據(jù)監(jiān)督人員[20]。政府?dāng)?shù)據(jù)網(wǎng)站的交流機(jī)制充分發(fā)揮了數(shù)據(jù)共享評價與監(jiān)督作用,如澳大利亞政府?dāng)?shù)據(jù)網(wǎng)站通過提供評分模塊,對數(shù)據(jù)質(zhì)量格式和有用性進(jìn)行打分;同時提供用戶評論接口,供用戶在線提交評論。BBSRC堅持通過最終報告的評估過程,確定受資助的研究項(xiàng)目是否遵守了其提出的數(shù)據(jù)管理和共享政策,并將此評估結(jié)果作為將來項(xiàng)目申請建議的申請追蹤記錄[2]。NSF項(xiàng)目管理過程中將在適當(dāng)?shù)臅r機(jī),通過同行評審、批準(zhǔn)建議等項(xiàng)目管理環(huán)節(jié),同時,規(guī)定數(shù)據(jù)提供者必須在出版物、網(wǎng)絡(luò)以及新聞媒體采訪時承認(rèn)NSF給予的物資資助行為[7]。OpenTopography社區(qū)成員或其他數(shù)據(jù)提供者必須明確說明其資助或資金來源,要求強(qiáng)制執(zhí)行免責(zé)聲明等以避免不必要的法律糾紛[9]。
1.4 數(shù)據(jù)共享保障
不管是科學(xué)數(shù)據(jù)的產(chǎn)生、匯交與管理,還是數(shù)據(jù)的共享服務(wù),都需要有穩(wěn)定的數(shù)據(jù)共享保障政策和措施來支撐。數(shù)據(jù)共享保障主要包括濃厚的科學(xué)數(shù)據(jù)共享氛圍、充足的設(shè)備資金支持、數(shù)據(jù)共享組織機(jī)構(gòu)的成立、各種獎項(xiàng)的設(shè)置、人員的培訓(xùn)教育等諸多方面。
在科學(xué)數(shù)據(jù)共享氛圍方面,通過共享數(shù)據(jù)的分級分類管理,搭建合適的共享平臺,建立合理的數(shù)據(jù)交匯、數(shù)據(jù)管理、數(shù)據(jù)共享體系,營造良好的共享氛圍,推進(jìn)全球科技創(chuàng)新。AADC正努力創(chuàng)建一個不斷完善基礎(chǔ)科學(xué)數(shù)字化數(shù)據(jù)庫和數(shù)據(jù)產(chǎn)品的良好環(huán)境,支持AAp(Australian Antarctic Program,澳大利亞南極計劃)研究人員的工作[14]。
在設(shè)備資金的支持方面,長期忽視小型科學(xué)的數(shù)據(jù)是非常不合理的,對此BBSRC發(fā)布的數(shù)據(jù)政策中包括提供資金支持(制定數(shù)據(jù)共享的標(biāo)準(zhǔn)和開發(fā)數(shù)據(jù)共享的軟件工具;專業(yè)機(jī)構(gòu)庫和設(shè)施建設(shè);數(shù)據(jù)共享活動是項(xiàng)目成本的一部分)[2]。2012年美國宣布的“大數(shù)據(jù)的研究和發(fā)展計劃”提供2億美元的投資,提高從大量數(shù)字?jǐn)?shù)據(jù)中訪問、組織、收集發(fā)現(xiàn)信息的工具和技術(shù)水平[21]。NSF為“DataNet聯(lián)合委員會”提供五年近800萬美金資助,以研制并部署一套國家級數(shù)據(jù)管理基礎(chǔ)實(shí)施原型[22]。
在數(shù)據(jù)共享組織機(jī)構(gòu)的成立方面,2012年11月8日NSF宣布資助倫斯勒理工學(xué)院250萬美元,以支持其創(chuàng)建和參與一個旨在促進(jìn)全球科學(xué)家研究數(shù)據(jù)共享的國際組織——研究數(shù)據(jù)聯(lián)盟。目前,已有120多個來自美國和世界其它國家的參與者致力于倡導(dǎo)“研究數(shù)據(jù)聯(lián)盟”的概念,并推廣其最初的行動。研究數(shù)據(jù)聯(lián)盟符合全世界對數(shù)據(jù)共享的需求,有利于加速基于數(shù)據(jù)的創(chuàng)新[23]。
在各種獎項(xiàng)的設(shè)置方面,主要包括CODATA設(shè)置的CODATA獎,新西蘭3TU.Datacentrum和DANS聯(lián)合倡導(dǎo)設(shè)立的荷蘭數(shù)據(jù)獎等。CODATA獎是國際科學(xué)數(shù)據(jù)領(lǐng)域的最高獎項(xiàng);荷蘭數(shù)據(jù)獎是獎勵致力于采集和詳細(xì)記錄科學(xué)數(shù)據(jù)以使其可公開獲取的研究人員的一個獎項(xiàng)[24]。各種獎項(xiàng)的設(shè)置是對致力于促進(jìn)科學(xué)數(shù)據(jù)共享的人員的一種肯定方式,也促使擔(dān)當(dāng)“數(shù)據(jù)館員”身份的研究人員更好地采集數(shù)據(jù)、管理與共享數(shù)據(jù)。
在人員的培訓(xùn)教育方面,作為基礎(chǔ)性、公益性、長期性的科學(xué)數(shù)據(jù)共享工作,應(yīng)當(dāng)建設(shè)一支穩(wěn)定的人才隊(duì)伍。ICPSR為了方便數(shù)據(jù)的傳播、分析和利用,提供關(guān)于數(shù)據(jù)集特征、分析技術(shù)和方法方面的咨詢和培訓(xùn),來促進(jìn)用戶對其數(shù)據(jù)資源的有效利用[16]。BBSRC[3]和OpenTopography[8]發(fā)布的數(shù)據(jù)政策中也包括提供相關(guān)的培訓(xùn)活動。歐盟科學(xué)數(shù)據(jù)領(lǐng)域高級別專家組報告建議成員締約國在他們的中等學(xué)校教育中增加數(shù)據(jù)管理相關(guān)課程,培養(yǎng)新一代數(shù)據(jù)科學(xué)家,擴(kuò)展公眾的認(rèn)知理解力[25];伊利諾伊大學(xué)實(shí)施的數(shù)據(jù)監(jiān)督教育計劃等。
結(jié)合各組織機(jī)構(gòu)在不同數(shù)據(jù)共享領(lǐng)域?qū)嵭械恼叽胧?,可以得知科學(xué)數(shù)據(jù)相關(guān)利益人與數(shù)據(jù)共享領(lǐng)域的聯(lián)系,具體見表1。
表1 科學(xué)數(shù)據(jù)相關(guān)利益人與數(shù)據(jù)共享領(lǐng)域的聯(lián)系
從表1可見,在科學(xué)數(shù)據(jù)共享的不同領(lǐng)域,賦予了科學(xué)數(shù)據(jù)相關(guān)利益人不同的職能和權(quán)利,每一個環(huán)節(jié)都是相互銜接、密不可分的??茖W(xué)數(shù)據(jù)相關(guān)利益人在各司其職的同時,要求通力合作,共同促進(jìn)科學(xué)數(shù)據(jù)的共享。
科學(xué)數(shù)據(jù)共享是一個復(fù)雜的系統(tǒng)工程,科學(xué)數(shù)據(jù)共享政策的建立與實(shí)施亦任重而道遠(yuǎn),需要利益各方的配合與支持。多年來隨著科學(xué)數(shù)據(jù)共享活動的開展與實(shí)踐,在國際范圍內(nèi),實(shí)施科學(xué)數(shù)據(jù)共享的局面已經(jīng)形成。美國、歐盟(包括英國、法國、德國、新西蘭等)、加拿大、澳大利亞、日本等眾多國家政府或研究資助機(jī)構(gòu)已經(jīng)初步建立了自己的科學(xué)數(shù)據(jù)共享政策體系,在數(shù)據(jù)共享方面取得了很大的突破。但是,因經(jīng)濟(jì)發(fā)展水平和科學(xué)技術(shù)等因素的制約,很多國家和地區(qū)在數(shù)據(jù)共享方面進(jìn)展緩慢,因此,科學(xué)數(shù)據(jù)共享的地域化差異明顯,總體水平不高。在目前數(shù)據(jù)推動的大科學(xué)時代,不斷增加的數(shù)據(jù)共享是科學(xué)進(jìn)步的核心,并吸引著來自各方的關(guān)注。而且,科學(xué)數(shù)據(jù)共享領(lǐng)域也出現(xiàn)一些新的態(tài)勢。
一是科學(xué)數(shù)據(jù)共享的氛圍更加濃厚。全球范圍內(nèi)越來越多的國家開始關(guān)注科學(xué)數(shù)據(jù)共享,轉(zhuǎn)變數(shù)據(jù)資源自有自用、共享不利的觀念,營造全球數(shù)據(jù)共享的氛圍,并制定相關(guān)政策措施,努力促進(jìn)科學(xué)數(shù)據(jù)的共享與利用。
二是科學(xué)數(shù)據(jù)共享政策日臻完善。隨著數(shù)據(jù)共享實(shí)踐的不斷發(fā)展,越來越多的科研資助機(jī)構(gòu)開始制定適合自己的科學(xué)數(shù)據(jù)共享政策。BBSRC、MIOS、NASA、AODN等分別制定并發(fā)布了一整套數(shù)據(jù)共享政策,并在實(shí)施政策的過程中不斷修訂,使政策體系更加完善、更有利于數(shù)據(jù)的共享服務(wù)。
三是更加注重高質(zhì)量的數(shù)據(jù)匯交。數(shù)據(jù)資源是提供數(shù)據(jù)共享服務(wù)的基礎(chǔ),沒有大規(guī)模的完整的數(shù)據(jù)資源,數(shù)據(jù)共享服務(wù)就是“無米之炊”,而高質(zhì)量的數(shù)據(jù)是保障高質(zhì)量共享服務(wù)的基礎(chǔ)和關(guān)鍵。大數(shù)據(jù)時代越來越注重高質(zhì)量的數(shù)據(jù)匯交,對數(shù)據(jù)質(zhì)量進(jìn)行把關(guān),從各研究機(jī)構(gòu)紛紛制定的數(shù)據(jù)質(zhì)量框架中凸顯了數(shù)據(jù)質(zhì)量的重要性。
四是數(shù)據(jù)共享人才隊(duì)伍更加強(qiáng)大。人才隊(duì)伍中需要領(lǐng)域?qū)<医缍ūWC數(shù)據(jù)資源質(zhì)量,容納管理人才統(tǒng)籌管理數(shù)據(jù)資源,配備網(wǎng)絡(luò)技術(shù)人才保障數(shù)據(jù)平臺正常運(yùn)作,法律人才提供法律政策援助等。在大數(shù)據(jù)、大科學(xué)時代,數(shù)據(jù)科學(xué)已經(jīng)成為一門獨(dú)立的學(xué)科,數(shù)據(jù)科學(xué)家的不斷出現(xiàn)為科學(xué)數(shù)據(jù)共享服務(wù)提供了智力支持。國外對新一代數(shù)據(jù)科學(xué)家,包括數(shù)據(jù)監(jiān)督人員的培養(yǎng),已經(jīng)在高校中得以實(shí)施。
國際組織、各國政府、眾多科研資助機(jī)構(gòu)等圍繞科學(xué)數(shù)據(jù)的共享展開的各項(xiàng)服務(wù)與實(shí)踐,都為我們提供了有益的共享經(jīng)驗(yàn)和教訓(xùn),值得我們學(xué)習(xí)和借鑒。總結(jié)國外的數(shù)據(jù)共享建設(shè)經(jīng)驗(yàn)和教訓(xùn),結(jié)合我國實(shí)際情況,在滿足國家戰(zhàn)略需求和世界科技發(fā)展前沿的高度上,因地制宜地構(gòu)建科學(xué)數(shù)據(jù)共享法規(guī)政策體系,構(gòu)建科學(xué)數(shù)據(jù)共享服務(wù)體系,并有原則、有步驟、有重點(diǎn)地實(shí)施,促進(jìn)科學(xué)數(shù)據(jù)資源的共享利用。另外,科學(xué)數(shù)據(jù)的共享與利用還與一個國家或地區(qū)的組織機(jī)構(gòu)、文化機(jī)制和行為模式等因素密切相關(guān),研究人員對研究成果的開放意識、接受程度等因素在推動科學(xué)數(shù)據(jù)共享過程中起關(guān)鍵作用。沒有共享意識,再完備的硬件設(shè)施、再先進(jìn)的技術(shù)條件都形同虛設(shè)。因此,要深刻認(rèn)識到科學(xué)數(shù)據(jù)共享與利用對國家科技進(jìn)步和技術(shù)創(chuàng)新的重要戰(zhàn)略意義,注重提高研究人員的共享意識,打破“數(shù)據(jù)壁壘”,通過制定實(shí)施相關(guān)的支持政策與法規(guī),建立利益相關(guān)者協(xié)調(diào)機(jī)制,加強(qiáng)合作,共同面對并解決共享過程中遇到的困難和挑戰(zhàn),推進(jìn)科學(xué)數(shù)據(jù)共享戰(zhàn)略進(jìn)程。
[1]曾小紅,王強(qiáng),方佳.科學(xué)數(shù)據(jù)共建共享模式探討[J].安徽農(nóng)業(yè)科學(xué),2009(29):14496~14498,14501.
[2]Data sharing policy[EB/OL].[2013-06-01].http://www. bbsrc.ac.uk/organisation/policies/position/policy/datasharing-policy.aspx.
[3]IMOS Policy Framework[EB/OL].[2013-06-01].http:// imos.org.au/imospolicy.html.
[4]NASA Data Sharing Policy Overview[EB/OL].[2013-06-01].http://www.nasa.gov/centers/johnson/slsd/innovation/connect.html.
[5]路鵬,苗良田,莫紀(jì)宏,等.科學(xué)數(shù)據(jù)共享領(lǐng)域的政策規(guī)范和法律規(guī)范[J].國際地震動態(tài),2008(4):35-42.
[6]NIH Data Sharing Policy and Implementation Gui dance[EB/OL].[2013-06-01].http://grants1.nih.gov/ grants/policy/data_sharing/data_sharing_guidance.htm #ex.com.
[7]Award and Administration Guide[EB/OL].[2013-06-01].http://www.nsf.gov/pubs/policydocs/pappguide/nsf 13001/aag_6.jsp#VID4.
[8]OpenTopography Data Hosting Policy[EB/OL].[2013-06-01].http://www.opentopography.org/index.php/about/ data_hosting.
[9]司莉,邢文明.國外科學(xué)數(shù)據(jù)管理與共享政策調(diào)查及對我國的啟示[J].情報資料工作,2013(1):61-66.
[10]生物科學(xué)數(shù)據(jù)的公開與共享成為發(fā)展新趨勢,眾科學(xué)家共建數(shù)據(jù)標(biāo)準(zhǔn)[EB/OL].[2013-06-01].http://www. ebiotrade.com/newsf/2012-2/201227173602757.htm.
[11]Data Archiving Policy[EB/OL].[2013-06-01].http://www. nsf.gov/sbe/ses/common/archive.jsp.
[12]周志峰,黃如花.國外政府開放數(shù)據(jù)門戶服務(wù)功能探析[J].情報雜志,2013(3):144-147,165.
[13]國際組織和外國機(jī)構(gòu)的數(shù)據(jù)質(zhì)量保證框架[EB/OL]. [2013-06-01].http://www.stats.gov.cn/tjshujia/dysj/t20 120907_402834337.htm.
[14]The Australian Antarctic program data policy[EB/ OL].[2013-06-01].https://data.aad.gov.au/aadc/about/ data_policy.cfm#Policy.
[15]Data Archiving Policy[EB/OL].[2013-06-01].http:// www.dans.knaw.nl/en/content/data-archiv.
[16]ICPSR Access Policy Framework[EB/OL].[2013-06-01].http://www.icpsr.umich.edu/icpsrweb/content/dataman agement/preservation/policies/accesspolicy-fram ework.html.
[17]Data availability policy[EB/OL].[2013-06-01].http:// www.ebi.ac.uk/ena/about/data_availability_policy.
[18]OECD統(tǒng)計發(fā)展戰(zhàn)略[EB/OL]].[2013-06-01].http:// wenku.bai-du.com/view/851695fb910ef12d2af9e79f. html.
[19]楊鶴林.數(shù)據(jù)監(jiān)護(hù):美國高校圖書館的新探索[J].大學(xué)圖書館學(xué)報,2011(2):18-21,41.
[20]張秋彥.高??茖W(xué)數(shù)據(jù)監(jiān)護(hù)研究[J].情報科學(xué),2013(5):42-45.
[21]美國政府大數(shù)據(jù)計劃[EB/OL].[2013-06-01].http:// wenku.baidu.com/view/83344048852458fb770b56e2. html.
[22]NSF提供800萬美元資助國家數(shù)據(jù)管理基礎(chǔ)設(shè)施研究[EB/OL].[2013-06-01].http://www.ecas.cn/xxkw/ kbcd/201115_83725/ml/xxhjsyjcss/201111/t20111117 _3397828.html.
[23]美國國家科學(xué)基金會支持研究數(shù)據(jù)共享[EB/OL]. [2013-06-01].http://www.most.gov.cn/gnwkjdt/201212/ t20121213_98503.htm.
[24]Dutch Data Prize 2012[EB/OL].[2013-06-01].http:// datacentrum.3tu.nl/en/about-3tudatacentrum/data-award/.
[25]弄潮:歐洲如何從日益興起的科學(xué)數(shù)據(jù)浪潮中獲益:歐盟科學(xué)數(shù)據(jù)領(lǐng)域高級別專家組報告,2010,12[EB/OL]. [2013-06-01].http://www.codata.cn/.
謝艷秋東南大學(xué)2012級碩士研究生。江蘇南京,211189。
錢鵬東南大學(xué)圖書館研究館員。江蘇南京,211189。
Research on the Development of the Sharing Policy of the Scientific Data Abroad
Xie Yanqiu,Qian Peng
To really share the scientific data,we must establish a series of the sharing policy and regulations,which can play an important role in the stakeholders of the sharing of scientific data(consist of data providers,safekeeping and users party)in this area.This paper investigates the constructed situation of scientific data sharing policy making in foreign countries,such as the United States,the European Union,the United Kingdom,New Zealand,and Australia via accessing their websites and literature review.It puts an emphasis on the analysis of the current situation and tendency from two angles of the stakeholders and the scientific data sharing area perspective.
Scientific data.Data sharing.Sharing policy.
G253
2013-08-06編校:劉勇定)
*本文系2010年教育部人文社科基金項(xiàng)目“高??茖W(xué)數(shù)據(jù)的組織與服務(wù)研究”(項(xiàng)目編號:10YJC870029)的研究成果。