李志芳
(河南理工大學(xué)工商管理學(xué)院 河南焦作 454000)
科學(xué)數(shù)據(jù)是國家科技創(chuàng)新和經(jīng)濟社會發(fā)展的重要基礎(chǔ)性戰(zhàn)略資源,早在20世紀(jì)70年代,美國就開始注重數(shù)據(jù)共享和科學(xué)數(shù)據(jù)平臺的建立。我國在20世紀(jì)末也建立了一些數(shù)據(jù)中心的試點,但是直到2008年才要求匯交國家項目產(chǎn)生的科學(xué)數(shù)據(jù)[1]。我國的科學(xué)數(shù)據(jù)平臺以專業(yè)部門為主,科研院所為補充,但是資源類型單一,側(cè)重于自然科學(xué)和工程技術(shù)科學(xué)等領(lǐng)域,而在科研數(shù)據(jù)管理(Research Data Management,RDM)方面卻比較薄弱。筆者依據(jù)2018年更新的QS世界大學(xué)綜合排名,調(diào)查了我國排名前20的高校,發(fā)現(xiàn)截至2018年8月,只有4所高校開展了科研數(shù)據(jù)管理服務(wù),分別是北京大學(xué)、復(fù)旦大學(xué)、武漢大學(xué)和同濟大學(xué)。在數(shù)字化學(xué)術(shù)、開放科學(xué)及數(shù)據(jù)密集型科學(xué)興起的背景下,以及國家資助機構(gòu)政策的要求和各組織機構(gòu)數(shù)據(jù)意識提高的相互作用下,開展對科研數(shù)據(jù)管理的研究和實踐成為高校圖書館工作的必然趨勢,因此其致力于發(fā)展科研數(shù)據(jù)管理服務(wù),希望能夠抓住機遇真正成為研究的合作者,而不再被看作一個“貨物的倉庫”[2]。在國際數(shù)據(jù)組織以及一些圖書館聯(lián)盟的推動下,國外學(xué)術(shù)圖書館在發(fā)展RDM服務(wù)方面取得了顯著成績,其實踐模式值得我們借鑒。文章調(diào)查了英、美以及我國QS排名前20的高校,共計60所高校圖書館的RDM服務(wù),從細節(jié)上系統(tǒng)分析英美高校圖書館的RDM服務(wù),包括導(dǎo)航路徑、數(shù)據(jù)管理計劃(DMP)、數(shù)據(jù)管理的指導(dǎo)(組織數(shù)據(jù)、存儲數(shù)據(jù)、保存數(shù)據(jù)、共享數(shù)據(jù))、科研數(shù)據(jù)管理政策,科研數(shù)據(jù)管理培訓(xùn)以及數(shù)據(jù)館員的配置等方面,積極探索適合我國RDM的實踐模式。
國外高校圖書館科研數(shù)據(jù)管理的發(fā)展得到了國家和相關(guān)組織機構(gòu)的高度重視,主要表現(xiàn)在國家數(shù)據(jù)管理和共享政策的完善、資金資助機構(gòu)政策的強制性要求、高??蒲袛?shù)據(jù)管理政策的規(guī)范以及圖書館相關(guān)組織的推動等,多方面的因素使得國外高校圖書館的科研數(shù)據(jù)管理服務(wù)的普及性及完善性都顯著高于我國。2007年,美國國家科學(xué)基金會(NSF)啟動了DataNet計劃,明確提出以圖書館為主體實施科學(xué)數(shù)據(jù)管理[3]。美國圖書館協(xié)會(ALA)和美國研究圖書館協(xié)會(ARL)積極推動圖書館在數(shù)據(jù)管理方面的發(fā)展,指出數(shù)字化技術(shù)的發(fā)展和對信息基礎(chǔ)設(shè)施的投資從根本上改變了科學(xué)的進行方式,這種轉(zhuǎn)變的核心是科學(xué)數(shù)據(jù)。國外學(xué)者的研究注重數(shù)據(jù)管理的實踐,內(nèi)容側(cè)重于以下幾個方面:①案例分析高校圖書館科研數(shù)據(jù)管理的實踐經(jīng)驗。Searle S[4]采用案例分析的方法,介紹了澳大利亞兩所高?;趫鼍暗年P(guān)于科研數(shù)據(jù)管理的小組學(xué)習(xí)活動;Henderson M E[5]介紹了基于高校圖書館的科研數(shù)據(jù)管理的一個項目,即美國弗吉尼亞州立大學(xué)(VCU)圖書館聘請了一個科研數(shù)據(jù)管理的主管,在圖書館管理的配合下,提出與VCU教師、研究人員、學(xué)生、服務(wù)和資源提供者建立關(guān)系的計劃,參與數(shù)據(jù)管理計劃編寫和研究數(shù)據(jù)管理。②研究者對科研數(shù)據(jù)管理服務(wù)的需求分析。Naum A[6]通過讓圖書館嵌入到科研者之中,對研究人員進行訪談,明確研究者對澳大利亞阿得雷德大學(xué)(Adelaide)的數(shù)據(jù)倉儲和元數(shù)據(jù)存儲的需求,強調(diào)了需要為阿得雷德大學(xué)的研究群體開發(fā)一個科研數(shù)據(jù)倉庫和給元數(shù)據(jù)存儲提供解決方案。Mattern E[7]采用參與式設(shè)計和視覺敘事的方法研究科研人員在他們自己的學(xué)科中遇到的有關(guān)科研數(shù)據(jù)的挑戰(zhàn),及他們對圖書館RDMS服務(wù)的建議。③與數(shù)據(jù)出版相關(guān)的研究。數(shù)據(jù)共享和重用的一個挑戰(zhàn)就是數(shù)據(jù)的出版和數(shù)據(jù)的引用,需要相應(yīng)的期刊政策來支持。Sturges P[8]調(diào)查了利益相關(guān)者的觀點和實踐,確定了期刊數(shù)據(jù)共享政策的現(xiàn)狀,開發(fā)了一種利益相關(guān)者驅(qū)動的期刊政策模型。④圖書館的角色定位問題。高校圖書館作為RDM服務(wù)的主體和實施者,其作用和職責(zé)需要明確。Searle S[9]從實踐出發(fā)研究了圖書館的角色定位問題。從相關(guān)研究來看,國外的研究更注重實踐性。
目前,我國高校圖書館開展RDM服務(wù)的并不多,周力虹、段欣余和宋雅倩[10]調(diào)查了我國高校圖書館RDM服務(wù)的情況,選取了112所“211工程”的大學(xué),僅有4所高校明確開設(shè)了RDM服務(wù),分別是北京大學(xué)、復(fù)旦大學(xué)、武漢大學(xué)和上海外國語大學(xué),但并不是都以圖書館為核心提供此服務(wù)的,且館員咨詢內(nèi)容有限,缺乏數(shù)據(jù)管理計劃和相關(guān)服務(wù)的咨詢和指導(dǎo)。但是國內(nèi)學(xué)者已經(jīng)意識到高校圖書館開展RDM服務(wù)對科研工作發(fā)展的重要意義,很多學(xué)者對國外高校開展科研數(shù)據(jù)管理的經(jīng)驗進行調(diào)查總結(jié),為國內(nèi)高校圖書館開展RDM服務(wù)提供借鑒和參考。國外RDM服務(wù)實踐較早且有成效的國家包括美國、加拿大、英國、澳大利亞、德國及新加坡等。研究內(nèi)容側(cè)重于以下幾個方面:①國外高校圖書館的具體實踐經(jīng)驗總結(jié)。例如彭建波[11]歸納了北美人文社會科學(xué)數(shù)據(jù)管理的實踐,從制度、規(guī)劃、機構(gòu)合作、建設(shè)和服務(wù)、技術(shù)、人才和培養(yǎng)六個方面,提出了建議;唐燕花[12]探索了國內(nèi)外高校開展RDM服務(wù)實踐的主要構(gòu)成要素,提出了國內(nèi)開展RDM服務(wù)的建議和措施。②國外科研數(shù)據(jù)管理政策研究。例如司莉、邢文明[13]調(diào)查了美國、英國和澳大利亞三個國家的高校數(shù)據(jù)管理政策及政府制定的數(shù)據(jù)公開政策。③國外科研數(shù)據(jù)管理平臺研究。例如,覃丹[14]對英美兩國一流高校所構(gòu)建的5個數(shù)據(jù)管理平臺進行分析,為我國數(shù)據(jù)管理平臺建設(shè)提供借鑒和啟示;劉茲恒和曾麗瑩[15]分析了我國高校科研數(shù)據(jù)管理與共享平臺的現(xiàn)狀、特點和發(fā)展模式,指出我國高??蒲袛?shù)據(jù)管理與共享平臺的模式主要有院所主導(dǎo)建立、以調(diào)查數(shù)據(jù)庫為基礎(chǔ)演變和國家資金資助建成三種。④圖書館的角色定位及圖書館員的能力培養(yǎng)。高校圖書館作為科研數(shù)據(jù)管理的服務(wù)主體,其角色定位成為國內(nèi)外學(xué)者們研究的熱點,樊俊豪[16]研究了圖書館在科學(xué)數(shù)據(jù)管理中的角色定位,他認(rèn)為圖書館扮演著嵌入式科學(xué)數(shù)據(jù)管理專家、基于過程的科學(xué)數(shù)據(jù)監(jiān)護機構(gòu)、科學(xué)數(shù)據(jù)存檔與長期保存機構(gòu)、數(shù)據(jù)素養(yǎng)的教育機構(gòu)等角色。RDM服務(wù)的興起使高校圖書館需要培養(yǎng)或引進一個新的職業(yè),即數(shù)據(jù)館員。因此數(shù)據(jù)館員的能力培養(yǎng)成為RDM服務(wù)實施的關(guān)鍵。國內(nèi)學(xué)者胡紹君[17]探討了高校RDM服務(wù)對學(xué)科館員的能力要求,明確學(xué)科館員在RDM服務(wù)中的角色。從國內(nèi)學(xué)者對科研數(shù)據(jù)管理的研究來看,整體上我國科研數(shù)據(jù)管理研究起步晚,目前高校圖書館缺乏科研數(shù)據(jù)管理的咨詢和指導(dǎo),缺乏相關(guān)政策的支持和相關(guān)機構(gòu)的推動,但是也形成了一些特色的科研數(shù)據(jù)管理平臺,并且中國圖書館學(xué)會每年會舉行“數(shù)據(jù)館員”的培訓(xùn),表明我國的一些相關(guān)機構(gòu)從未停止探索適合我國高校圖書館RDM服務(wù)的模式。
依據(jù)2018年最新更新的QS世界大學(xué)綜合排名,分別選取美國、英國和我國排名前20的高校進行調(diào)研。采用文獻調(diào)研法和網(wǎng)絡(luò)調(diào)查法,訪問每所高校圖書館的RDM服務(wù)頁面,從其導(dǎo)航設(shè)置、RDM服務(wù)內(nèi)容和館員配置三個方面展開分析。
圖書館的導(dǎo)航設(shè)置一定程度上反映了圖書館的服務(wù)方式。文章分析了英美國家及我國排名前20的高校圖書館科研數(shù)據(jù)管理的路徑設(shè)置,其中英美高校圖書館,其研究數(shù)據(jù)管理服務(wù)的路徑有以下四條:①研究支持導(dǎo)航下。傳統(tǒng)的高校圖書館導(dǎo)航一般分為資源和服務(wù)兩種,資源目錄下提供的是館藏資源或數(shù)字資源檢索,而服務(wù)導(dǎo)航下提供的是圖書館的借閱、咨詢培訓(xùn)、座位管理、文獻傳遞等服務(wù)。英美國家的很多高校圖書館除了資源和服務(wù)之外,將研究或教學(xué)支持獨立成為一項服務(wù),單獨作為主導(dǎo)航,為本校研究者和教師提供研究支持和教學(xué)支持。②服務(wù)導(dǎo)航下。受調(diào)查的英美國家的高校圖書館有一部分將研究數(shù)據(jù)管理服務(wù)依然設(shè)置在圖書館服務(wù)導(dǎo)航下,不過有些圖書館在服務(wù)導(dǎo)航下設(shè)置了研究支持目錄,并將研究數(shù)據(jù)管理設(shè)置在研究支持目錄下。③數(shù)字化學(xué)術(shù)或?qū)W術(shù)交流導(dǎo)航下。一部分美國高校圖書館將研究數(shù)據(jù)管理設(shè)置在數(shù)字化學(xué)術(shù)或?qū)W術(shù)交流導(dǎo)航下。例如美國的芝加哥大學(xué)圖書館、普林斯頓大學(xué)圖書館和賓西法尼亞大學(xué)圖書館。④員工目錄下。受調(diào)查的英國高校圖書館中有部分將研究數(shù)據(jù)管理設(shè)置在員工目錄下,在員工目錄下設(shè)置研究支持目錄,并將研究數(shù)據(jù)管理設(shè)置在研究支持目錄下。從英美國家高校圖書館研究數(shù)據(jù)管理的路徑設(shè)置來看,英美國家的高校圖書館非常重視研究支持服務(wù),所有被調(diào)查的英美國家的高校圖書館都設(shè)置了研究支持的導(dǎo)航,主要服務(wù)于本校教師、學(xué)生的學(xué)術(shù)研究。另一方面,英美國家的高校圖書館在具體的導(dǎo)航設(shè)置上略有不同,例如,被調(diào)查的部分美國高校圖書館將數(shù)據(jù)管理服務(wù)設(shè)置在數(shù)字化學(xué)術(shù)或?qū)W術(shù)交流目錄下,而被調(diào)查的部分英國高校圖書館將研究數(shù)據(jù)管理設(shè)置在了員工目錄下。在導(dǎo)航設(shè)置上英美國家的高校圖書館還體現(xiàn)出三個特點,一是英美國家的高校圖書館都有研究支持的導(dǎo)航,一部分與資源和服務(wù)一起作為主導(dǎo)航,一部分是在服務(wù)導(dǎo)航下另設(shè)研究支持的目錄。說明英美國家的高校圖書館非常重視對研究者的科研支持,Corrall S[18]認(rèn)為學(xué)術(shù)圖書館在研究支持方面起著越來越重要的作用,認(rèn)為文獻計量學(xué)和RDM服務(wù)是圖書館研究支持的新趨勢;二是RDM服務(wù)可以多個路徑到達;三是很多圖書館借助于LibGuides平臺,將RDM服務(wù)以學(xué)科服務(wù)的形式開展,例如美國的加利福尼亞學(xué)院圖書館,英國的南安普頓大學(xué)圖書館。
英美國家高校圖書館開展的RDM服務(wù)的具體內(nèi)容相似,但組織的方式和工具略有不同。美國高校圖書館的RDM服務(wù)按照數(shù)據(jù)管理生命周期開展,而英國高校圖書館的RDM服務(wù)很多是按照項目前中后的方式來組織。另一方面,在數(shù)據(jù)管理計劃工具的選擇上,美國使用的是DMPTool,而英國使用的是DMPOnline,這兩個工具都是幫助研究者撰寫數(shù)據(jù)管理計劃的,只是開發(fā)者不一樣而已,DMPTool是加利福尼亞大學(xué)加州數(shù)字圖書館中心開發(fā)的,DMPOnline是由數(shù)字化監(jiān)護中心(Digital Curation Center,DCC)開發(fā)的。被調(diào)查的美國20所高校都是DMPTool的成員,而英國的20所高校都是DMPOnline的成員。文章依據(jù)調(diào)查結(jié)果,發(fā)現(xiàn)RDM服務(wù)的核心內(nèi)容包括:數(shù)據(jù)管理計劃(DMP)的書寫,數(shù)據(jù)管理的指導(dǎo),科研數(shù)據(jù)管理政策,科研數(shù)據(jù)管理培訓(xùn)。
2.2.1 數(shù)據(jù)管理計劃
被調(diào)查的英美國家的40所高校圖書館的RDM服務(wù)內(nèi)容都包含了指導(dǎo)研究者如何書寫數(shù)據(jù)管理計劃,它是RDM服務(wù)的核心內(nèi)容。數(shù)據(jù)管理計劃是一個書面文檔,它描述了研究者如何管理、描述、分析和存儲科研數(shù)據(jù),以及在項目結(jié)束時使用什么機制來共享和保存數(shù)據(jù)[19]。DMP是動態(tài)的,需要持續(xù)規(guī)范地監(jiān)護它。為了實現(xiàn)研究數(shù)據(jù)的開放獲取,許多資助機構(gòu)要求產(chǎn)生的研究數(shù)據(jù)能夠被公開獲取作為資助項目的一部分。許多機構(gòu)已經(jīng)制定了數(shù)據(jù)共享和正式數(shù)據(jù)管理計劃的要求[20],例如國家科學(xué)基金會(NSF:National Science Foundation),國家衛(wèi)生研究院(NIH:National Institutes of Health),國家人文科學(xué)基金會(NEH:National Endowment for the Humanities)都要求將數(shù)據(jù)管理計劃作為資助申請和獎勵的一部分。因此,研究者需要了解如何書寫科研數(shù)據(jù)管理計劃,調(diào)查的英美國家的高校圖書館提供了數(shù)據(jù)管理計劃的咨詢和指導(dǎo),并提供了豐富的資源,具體服務(wù)包括:
(1)資助機構(gòu)關(guān)于科研數(shù)據(jù)管理的資助政策。在書寫科研數(shù)據(jù)管理計劃之前,研究者需要明確項目的資助機構(gòu)對科研數(shù)據(jù)管理計劃的要求。例如,麻省理工學(xué)院圖書館[21]關(guān)于數(shù)據(jù)管理計劃的說明,就提供了很多資助機構(gòu)對研究者進行科研數(shù)據(jù)管理計劃指導(dǎo)的鏈接列表,根據(jù)這個列表,研究者可以輕易獲取各資助機構(gòu)提供計劃的指導(dǎo)。
(2)提供數(shù)據(jù)管理計劃的樣例和模版。很多高校圖書館的RDM服務(wù)中會提供相應(yīng)模版資源的鏈接,同時各個資助機構(gòu)的網(wǎng)站也會提供數(shù)據(jù)管理計劃的樣例和模版。DCC提供的數(shù)據(jù)管理計劃工具DMPOnline給出了各個資助機構(gòu)需要的數(shù)據(jù)管理計劃的模版[22],共包括來自不同國家和地區(qū)的17個資助機構(gòu)。其中,美國的NSF提供了一個通用模版,這個模版與DCC提供的樣式相似,每個部分都包含了需要描述的內(nèi)容、指導(dǎo)和需要考慮的問題,在具體回答的問題方面存在差異。NSF的通用模版需要描述清楚五個部分,分別是數(shù)據(jù)類型、數(shù)據(jù)和元數(shù)據(jù)標(biāo)準(zhǔn)、獲取和共享政策、重用和再分配政策、歸檔和保存計劃。DCC數(shù)據(jù)管理計劃的模版,需要回答七個方面問題,分別是數(shù)據(jù)收集、元數(shù)據(jù)、倫理和法律約束、存儲和備份、選擇和保存、數(shù)據(jù)共享、責(zé)任與資源。有些圖書館還會提供本校的數(shù)據(jù)管理計劃模版,例如劍橋大學(xué)圖書館的數(shù)據(jù)管理計劃模版[23]。如果資助者沒有提供數(shù)據(jù)管理計劃方面的指導(dǎo),劍橋大學(xué)圖書館會為他們的研究者提供一個簡單的數(shù)據(jù)管理計劃的模版作為參考。
2.2.2 RDM指導(dǎo)服務(wù)
RDM服務(wù)提供數(shù)據(jù)管理方面的指導(dǎo),有兩種方式:一種是依據(jù)數(shù)據(jù)管理的生命周期來提供相應(yīng)的指導(dǎo)服務(wù),另一種是按照項目開始、項目中和項目結(jié)束的方式來展開數(shù)據(jù)管理的指導(dǎo)。項目開始之前需要寫數(shù)據(jù)管理計劃以及RDM預(yù)算。項目中,需要安全存儲數(shù)據(jù),明確描述數(shù)據(jù),清楚數(shù)據(jù)版本,保證數(shù)據(jù)命名和結(jié)構(gòu)的邏輯性,恰當(dāng)應(yīng)用數(shù)據(jù),遵守倫理、法律、商業(yè)義務(wù)。項目結(jié)束時,決定哪些數(shù)據(jù)持續(xù)保存,格式化數(shù)據(jù),考慮將數(shù)據(jù)存儲在一個合適的存儲庫,使用持久性標(biāo)識符,確保數(shù)據(jù)長時間可訪問。按照“項目開始—項目中—項目結(jié)束”的方式進行RDM服務(wù)的指導(dǎo),實質(zhì)上也是遵循了數(shù)據(jù)管理的生命周期,因此文章遵循數(shù)據(jù)管理的生命周期展開RDM服務(wù)指導(dǎo)內(nèi)容的細節(jié),包括組織數(shù)據(jù)、存儲數(shù)據(jù)、保存數(shù)據(jù)、共享數(shù)據(jù)、數(shù)據(jù)政策和科研數(shù)據(jù)管理的培訓(xùn)。存儲數(shù)據(jù)發(fā)生在項目進行時,研究者考慮如何存儲數(shù)據(jù);保存數(shù)據(jù)發(fā)生在項目結(jié)束時,研究者考慮將數(shù)據(jù)保存在合適的數(shù)據(jù)存儲庫。
(1)組織和存儲數(shù)據(jù)。研究者合理組織數(shù)據(jù)對將來理解數(shù)據(jù)非常有意義。RDM服務(wù)中需要指導(dǎo)研究者有效地組織和存儲個人科研數(shù)據(jù),需要考慮文件的命名規(guī)則、文件格式、數(shù)據(jù)版本和質(zhì)量的控制、元數(shù)據(jù)的創(chuàng)建和使用。跟蹤科研數(shù)據(jù)的文檔和記錄是非常重要的,所以在項目開始時就需要花費時間制訂文件及文件夾的命名規(guī)則,保持統(tǒng)一標(biāo)準(zhǔn)的命名規(guī)則有助于將來能更好地理解和重用數(shù)據(jù)。文件的命名應(yīng)該具有一致性和描述性,具有一個清晰的目錄結(jié)構(gòu)。文件的格式直接影響將來打開這些文件以及其他人訪問這些文件的能力。要采用開放的文件格式,如果需要以專有格式來保存文件的話,可以寫一個Read文件,記錄產(chǎn)生文件的軟件名稱和版本以及制作該軟件的公司。國會圖書館出版了一個推薦格式聲明,格式最好選擇:未加密的、非專利的、未壓縮的、研究共同體普遍使用的、遵守公開的文件標(biāo)準(zhǔn)。研究團隊協(xié)作時,要注意控制數(shù)據(jù)的版本,調(diào)查的很多高校都提供了版本控制指南和控制工具,例如斯坦福大學(xué)提供了兩個簡單的版本控制軟件:Google Drive和Stanford Box,還有更高級的版本控制軟件gitHub。另外,還要注重元數(shù)據(jù)的選擇和創(chuàng)建,元數(shù)據(jù)能夠使其他研究者更詳細地了解并正確使用和引用數(shù)據(jù)。在研究項目開始時甚至在數(shù)據(jù)收集開始之前就應(yīng)該考慮記錄數(shù)據(jù),研究人員可以在各種元數(shù)據(jù)標(biāo)準(zhǔn)中進行選擇,這些標(biāo)準(zhǔn)通常適用于特定的文件格式或規(guī)程。存儲數(shù)據(jù)需要考慮在項目進行期間如何存儲自己的數(shù)據(jù),如何管理敏感數(shù)據(jù),如何備份數(shù)據(jù)等。高校圖書館的RDM服務(wù)會提供數(shù)據(jù)備份的指導(dǎo),提供數(shù)據(jù)備份的可選項以及如何保證數(shù)據(jù)安全的技巧,一般情況下,英美國家的高校圖書館會建議使用3-2-1的備份策略,即3個備份,2種存儲媒介,1份離線存儲。國外非常重視個人信息的保護,因此如果涉及敏感數(shù)據(jù),研究者要考慮是否需要保密,是否需要獲得同意以及敏感數(shù)據(jù)如何被使用等問題。
(2)保存和共享數(shù)據(jù)。保存數(shù)據(jù)要求研究者要為共享的數(shù)據(jù)選擇一個合適的數(shù)據(jù)存儲庫,一般的數(shù)據(jù)存儲庫包括幾種類型:一種是存儲在學(xué)科的數(shù)據(jù)存儲庫,例如Dryad、Protein Data Bank等;一種是存儲在通用的數(shù)據(jù)存儲庫,例如FigShare、Harvard DataVerse、Zenodo等;一種是存儲在本校的數(shù)據(jù)機構(gòu)庫中,被調(diào)查的所有英美的高校圖書館都有本機構(gòu)的數(shù)據(jù)存儲庫,都提供了詳細指導(dǎo)和說明如何選擇合適的數(shù)據(jù)存儲庫,以及需要考慮哪些問題。共享數(shù)據(jù)需要考慮如何出版數(shù)據(jù),如何發(fā)現(xiàn)、獲取和引用現(xiàn)有數(shù)據(jù),如何管理版權(quán)和知識產(chǎn)權(quán)等問題。
(3)數(shù)據(jù)政策方面的指導(dǎo)。被調(diào)查的英美國家高校圖書館的RDM服務(wù)中提供有相關(guān)的科研數(shù)據(jù)管理政策的說明和咨詢。大多數(shù)的資助機構(gòu)包括研究理事會、基金會、慈善機構(gòu)等已經(jīng)出臺了科研數(shù)據(jù)管理政策,他們期望公共資助的科研數(shù)據(jù)是公共物品,應(yīng)該盡可能少地限制其公開使用。資助機構(gòu)都有各自的數(shù)據(jù)政策,為研究者提供如何處理科研數(shù)據(jù)的指導(dǎo)。2012年5月,RCUK要求所有受資助的大學(xué)都要有一個數(shù)據(jù)管理政策。因此,被調(diào)查的英美國家高校大部分都有各自的科研數(shù)據(jù)管理政策,而沒有科研數(shù)據(jù)管理政策的高校也會有與數(shù)據(jù)管理或數(shù)據(jù)開放獲取相關(guān)的政策。劍橋大學(xué)圖書館[24]在RDM服務(wù)中提供了20個高校主要資助機構(gòu)的科研數(shù)據(jù)管理政策的概要和鏈接,幫助研究者理解資助機構(gòu)的政策要求。DCC也提供了資助者及機構(gòu)的數(shù)據(jù)政策,其中資助者的數(shù)據(jù)政策包括RCUK的資助者以及非RCUK的資助者的政策,共計10個; 機構(gòu)的數(shù)據(jù)政策[25]主要是高校發(fā)布的數(shù)據(jù)政策,共計57家機構(gòu),最早是伯明翰大學(xué)于2009年10月發(fā)布的研究數(shù)據(jù)管理政策。高校圖書館開展RDM服務(wù),需要包含國家、基金資助機構(gòu)和學(xué)校本身的科研數(shù)據(jù)管理政策的說明和咨詢,以幫助研究者理解并滿足他們的需求,促使研究者更好地開展數(shù)據(jù)管理實踐。
(4)被調(diào)查的英美高校圖書館提供的RDM服務(wù)中會包含科研數(shù)據(jù)管理的培訓(xùn),主要包括3種形式:①在線培訓(xùn),提供了豐富的在線培訓(xùn)資源。②舉辦研討會或講座。③為研究團隊提供專門的培訓(xùn)或講座。培訓(xùn)的內(nèi)容主要是與RDM服務(wù)相關(guān)的主題,例如開放科學(xué)、如何書寫科研數(shù)據(jù)管理計劃、數(shù)據(jù)管理和共享的最佳實踐等。各個高校圖書館的RDM服務(wù)提供了非常多的培訓(xùn)資源的鏈接,例如DCC提供的數(shù)字策展課程[26],包括面向所有人的培訓(xùn)和個體組織請求的私有培訓(xùn),內(nèi)容包含開放科學(xué)、數(shù)據(jù)管理計劃、數(shù)據(jù)保存、基金需求等,還有面向圖書館員的科研數(shù)據(jù)管理,涉及的內(nèi)容包括科研數(shù)據(jù)和科研數(shù)據(jù)管理、數(shù)據(jù)管理計劃、數(shù)據(jù)共享、技能等。英國愛丁堡大學(xué)圖書館管理的MANTRA[27],提供與科研數(shù)據(jù)管理有關(guān)的培訓(xùn)和免費在線課程,如果需要證書,還可以報名參加為期5周的流動課程,這個平臺還提供了研究數(shù)據(jù)管理和共享的MOOC。除此以外,還有很多數(shù)據(jù)管理的免費課程,例如新英格蘭合作數(shù)據(jù)管理課程(NECDMC)項目[28],美國NSF的DataONE項目,提供關(guān)于數(shù)據(jù)管理的教育,包括概述數(shù)據(jù)管理的最佳實踐,提供教育材料方便研究人員使用,以及鏈接到DataONE及其合作伙伴提供的工具和資源。科研數(shù)據(jù)管理培訓(xùn)的資源如此豐富,高校的研究者和圖書館員可以有效應(yīng)用這些資源,提高數(shù)據(jù)管理能力。
數(shù)據(jù)密集型科學(xué)的興起及科學(xué)研究范式的轉(zhuǎn)變產(chǎn)生了以數(shù)據(jù)為驅(qū)動的研究模式,促使新的知識需求產(chǎn)生,新興了很多與數(shù)據(jù)有關(guān)的行業(yè),例如數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師等。圖書情報學(xué)術(shù)界也公認(rèn)在圖書館應(yīng)該有一個新的職業(yè),即數(shù)據(jù)館員。顧立平[29]認(rèn)為數(shù)據(jù)館員是為科研數(shù)據(jù)管理而服務(wù)的,它是圖書館員職業(yè)生涯的一個發(fā)展方向,而不單指具體的崗位名稱,它可以是數(shù)據(jù)管理專員、數(shù)據(jù)支持人員、數(shù)據(jù)管理規(guī)劃顧問、科研數(shù)據(jù)管理項目專員、RDM服務(wù)開發(fā)人員、數(shù)字研究圖書館員、科研數(shù)據(jù)管理協(xié)調(diào)員等。數(shù)據(jù)館員在科研數(shù)據(jù)管理的服務(wù)中扮演著非常重要的角色。被調(diào)查的英美國家高校圖書館,負(fù)責(zé)RDM服務(wù)的館員主要分為兩種形式:①組建了專門的科研數(shù)據(jù)管理團隊(RDM Team)。例如美國的加利福尼亞學(xué)院圖書館,由專門的學(xué)術(shù)交流館員、學(xué)術(shù)和數(shù)據(jù)館員、元數(shù)據(jù)館員等,負(fù)責(zé)科研數(shù)據(jù)管理的相關(guān)服務(wù);美國的普林斯頓大學(xué)圖書館設(shè)立了學(xué)術(shù)交流館員;美國的西北大學(xué)圖書館提供了專門的數(shù)據(jù)管理館員,負(fù)責(zé)回答與數(shù)據(jù)管理和數(shù)據(jù)管理最佳實踐相關(guān)的問題,并提供課堂演示和個人培訓(xùn)課程。英國的華威大學(xué)也設(shè)立了學(xué)術(shù)支持館員,包括電子倉儲助理、研究數(shù)據(jù)負(fù)責(zé)人、學(xué)術(shù)交流負(fù)責(zé)人等。②以學(xué)科服務(wù)的形式開展,由學(xué)科館員負(fù)責(zé)。例如,美國的紐約大學(xué)圖書館就是由其中的一名學(xué)科館員負(fù)責(zé)數(shù)據(jù)服務(wù)。其聯(lián)系方式基本一致,可以單獨預(yù)約,也可以通過在線咨詢、電話或郵箱聯(lián)系。
科研數(shù)據(jù)管理服務(wù)在我國還處于起步階段,如何更好地促進該服務(wù)在我國的發(fā)展,文章的調(diào)查給了我們以下幾點啟示:
通過文獻調(diào)研,可以發(fā)現(xiàn)我國缺乏相應(yīng)的科研數(shù)據(jù)管理政策的引導(dǎo)。英美國家高校圖書館開展RDM服務(wù)之所以如此系統(tǒng)和豐富,離不開國家、政府和相關(guān)組織機構(gòu)的高度重視,例如美國政府要求公開獲取政府信息、出版物和聯(lián)邦資助研究產(chǎn)生的數(shù)據(jù),同時政府尊重這些數(shù)據(jù)的隱私和保密問題,呼吁在現(xiàn)有的信息共享法律限制內(nèi)公開獲取數(shù)據(jù)。美國的科研資助機構(gòu)強制性要求資助申請中必須包括如何管理和共享研究數(shù)據(jù)的計劃。英國成立的數(shù)據(jù)管理中心DCC,一直致力于數(shù)據(jù)管理服務(wù),提供了豐富的科研數(shù)據(jù)管理的相關(guān)服務(wù)、培訓(xùn)和工具;英國的RCUK要求所有受資助的大學(xué)都要有一個數(shù)據(jù)管理政策。我國目前缺乏政策性的指導(dǎo)和支持,不過在2018年3月,國務(wù)院辦公廳印發(fā)了《科學(xué)數(shù)據(jù)管理辦法》,該辦法的出臺對科技工作者及國內(nèi)致力于科研數(shù)據(jù)共享的研究者來說是極大的鼓舞。另外,在政策的引導(dǎo)方面,需要多個機構(gòu)相互協(xié)作,共同推進科研數(shù)據(jù)管理實踐。RDM服務(wù)的開展并不是單個機構(gòu)就能促成和推進的,需要國家、政府、資助機構(gòu)、高校、圖書館、出版商等多個利益相關(guān)者的共同努力和推進。圖書館在開展RDM服務(wù)時,需要積極發(fā)揮其核心力量的作用,主動協(xié)同多方利益主體共同參與,整合各機構(gòu)的業(yè)務(wù)優(yōu)勢,促進科研數(shù)據(jù)資源的高速運轉(zhuǎn),使科研數(shù)據(jù)的生產(chǎn)、采集、管理與利用實現(xiàn)良性循環(huán)[30]。
調(diào)查中的部分英美高校圖書館,在開展RDM服務(wù)之前,會對本校的研究者做一個需求調(diào)查和分析,調(diào)查研究人員如何管理數(shù)據(jù),并幫助確定研究人員對數(shù)據(jù)存儲、保存和共享的需求。例如美國的西北大學(xué)在2013年的時候進行了一項調(diào)查,來支持自己的RDM服務(wù),結(jié)果表明研究人員最關(guān)注的問題是數(shù)據(jù)的存儲和管理,尤其是長期的數(shù)據(jù)存儲和管理,而且研究人員需要有關(guān)數(shù)據(jù)管理的援助和教育[31]。英國的諾丁漢大學(xué)也做過一項類似的調(diào)查[32],結(jié)果表明,數(shù)據(jù)的類型復(fù)雜多樣,研究者很少共享數(shù)據(jù)給團隊以外的人;研究者對培訓(xùn)也非常感興趣,尤其是數(shù)據(jù)管理計劃的書寫、對元數(shù)據(jù)和存儲數(shù)據(jù)以及資助機構(gòu)的需求。這表明,研究者對RDM服務(wù)是有需求的,高校圖書館在RDM服務(wù)方面有發(fā)揮作用的空間。但是我國研究人員數(shù)據(jù)管理和數(shù)據(jù)共享的意識整體上處于低水平,我們需要去了解他們的需求同時讓研究者更多地了解RDMS的重要性,才能更好地開展相應(yīng)的服務(wù)。Renwick S[33]研究了發(fā)展中國家學(xué)術(shù)圖書館的科研數(shù)據(jù)管理現(xiàn)狀,發(fā)現(xiàn)雖然很多研究人員擁有數(shù)據(jù),但他們幾乎沒有知識和經(jīng)驗去管理。因此,做好服務(wù)開展前的需求調(diào)查和分析非常有意義,可幫助研究者了解科研數(shù)據(jù)管理這項服務(wù),消除他們的疑慮。
圖書館服務(wù)的核心是人,RDM服務(wù)的開展需要具備數(shù)據(jù)管理專業(yè)知識的人,因此引進具有數(shù)據(jù)服務(wù)能力的人才以及對圖書館員開展數(shù)據(jù)教育和培訓(xùn)顯得非常重要。調(diào)查發(fā)現(xiàn),高校圖書館一般采用引進專業(yè)數(shù)據(jù)人才和對現(xiàn)有館員進行培訓(xùn)兩種方式培養(yǎng)數(shù)據(jù)館員來開展RDM服務(wù)。中國圖書館學(xué)會專業(yè)圖書館分會和中國科學(xué)文獻情報中心每年也會舉行“數(shù)據(jù)館員研討班”, 從理論、方法、技術(shù)、政策、實踐層面,持續(xù)、系統(tǒng)地推進圖書館開展數(shù)據(jù)管理與服務(wù)的實踐[34]。國外很多高校開設(shè)了數(shù)據(jù)管理的課程,Harris-Pierce R L和Liu Y Q[35]調(diào)查了北美圖書館情報學(xué)的數(shù)據(jù)管理教育開設(shè)情況,在北美有52個圖書館和信息科學(xué)(LIS)的學(xué)校網(wǎng)站,以及16個相關(guān)機構(gòu)提供了數(shù)據(jù)管理課程。美國RDA(Research Data Alliance)中描述了關(guān)于科研數(shù)據(jù),圖書館應(yīng)該做的23件事情[36],涉及十個部分,分別是:學(xué)習(xí)資源、數(shù)據(jù)參考與推廣、數(shù)據(jù)管理計劃、數(shù)據(jù)素養(yǎng)、元數(shù)據(jù)、引用數(shù)據(jù)、數(shù)據(jù)授權(quán)與隱私、數(shù)據(jù)保存、數(shù)據(jù)倉儲、實踐社區(qū)。這十個方面詳細闡釋了圖書館應(yīng)該怎么做,圖書館員應(yīng)該學(xué)習(xí)哪些知識,具備哪些能力才能開展RDM服務(wù)。對我國高校圖書館員來說,培訓(xùn)的途徑包括[37]:繼續(xù)專業(yè)化教育,取得相關(guān)的數(shù)據(jù)管理學(xué)位;參加經(jīng)過專業(yè)認(rèn)證的相關(guān)數(shù)據(jù)管理的課程和培訓(xùn);與國內(nèi)高校的信息管理學(xué)院合作,進行專業(yè)系統(tǒng)的數(shù)據(jù)管理教育。
由于政策環(huán)境的差異及我國的資助機構(gòu)并沒有強制要求提交科研數(shù)據(jù)管理計劃,目前我國高校圖書館并沒有普遍開展RDM服務(wù),但科研數(shù)據(jù)管理計劃的框架和思維可指導(dǎo)研究者更有效地管理個人數(shù)據(jù)。很多調(diào)查顯示目前研究者主要是將個人數(shù)據(jù)存儲在自己的存儲設(shè)備上,經(jīng)常會出現(xiàn)數(shù)據(jù)丟失或在將來發(fā)生數(shù)據(jù)不可理解的情況。因此,我們可以借鑒國外高校圖書館數(shù)據(jù)管理的方法和思維,指導(dǎo)研究者更有效地組織數(shù)據(jù),例如文件命名格式、文件夾組織結(jié)構(gòu)的制定、書寫一份Read文件、描述數(shù)據(jù)等。另一方面,我們要形成自己的特色。2015年,北京大學(xué)圖書館聯(lián)合國家自然科學(xué)基金-北京大學(xué)管理科學(xué)數(shù)據(jù)中心、北京大學(xué)科研部、北京大學(xué)社科部推出“北京大學(xué)開放研究數(shù)據(jù)平臺”, 平臺為研究者提供研究數(shù)據(jù)的管理、發(fā)布和存儲服務(wù),鼓勵研究者開放和共享數(shù)據(jù);為數(shù)據(jù)用戶提供研究數(shù)據(jù)的瀏覽、檢索和下載等服務(wù),促進研究數(shù)據(jù)的傳播、重用和規(guī)范引用[38]。這個平臺并不像國外的RDM服務(wù)從指導(dǎo)研究者如何書寫研究數(shù)據(jù)管理計劃和保存共享自己的數(shù)據(jù)開始,而是先收錄北京大學(xué)擁有的一些具有極高影響力的精品調(diào)查數(shù)據(jù),然后開展一屆“全國高校數(shù)據(jù)驅(qū)動創(chuàng)新大賽”,鼓勵大家利用這些數(shù)據(jù)創(chuàng)造出新的研究成果,并通過這次競賽收到很多創(chuàng)造性的研究成果。這種實踐模式從數(shù)據(jù)的利用開始,使這些數(shù)據(jù)創(chuàng)造出了價值,然后,鼓勵研究者自行提交,從而形成良性循環(huán),值得借鑒。同時,在“雙一流”的背景下,我國很多高校引進了ESI數(shù)據(jù)庫來支持本校的學(xué)科分析和規(guī)劃,形成研究報告之前會產(chǎn)生很多數(shù)據(jù),這些數(shù)據(jù)的保存可有效梳理高校的學(xué)科發(fā)展,可以按照科研數(shù)據(jù)管理的框架來組織和保存這些數(shù)據(jù)。
調(diào)查發(fā)現(xiàn),RDM服務(wù)的一個重要內(nèi)容就是如何有效地保存和共享研究者的數(shù)據(jù)。在這個階段,圖書館的數(shù)據(jù)館員需要提供可存儲數(shù)據(jù)的數(shù)據(jù)倉庫,研究者有很多選項,可以選擇面向全球的一些通用數(shù)據(jù)存儲庫,也可以選擇學(xué)科數(shù)據(jù)存儲庫,但通過調(diào)查可以發(fā)現(xiàn)英美很多高校都為研究者提供了自建的本機構(gòu)的數(shù)據(jù)存儲庫,也叫數(shù)據(jù)機構(gòu)庫。而我國高校也非常重視數(shù)據(jù)機構(gòu)庫的建設(shè),2016年,為促進全國高校機構(gòu)知識庫快速、健康發(fā)展,中國高等教育文獻保障系統(tǒng)(CALIS)管理中心聯(lián)合16家高校圖書館共同發(fā)起成立“中國高校機構(gòu)知識庫聯(lián)盟(Confederation of China Academic Institutional Repository, CHAIR)”,其宗旨是推進全國高校機構(gòu)知識庫的建立,推動學(xué)術(shù)成果的開放獲取,促進學(xué)術(shù)廣泛應(yīng)用[39]。目前聯(lián)盟共有50家會員,元數(shù)據(jù)總量達到2 812 320條。被調(diào)查的我國20所高校中有13所為聯(lián)盟成員,即這13所高校都建設(shè)了本校的機構(gòu)知識庫,用來收集和保存本??蒲腥藛T的學(xué)術(shù)與智力成果,但與成果相關(guān)的數(shù)據(jù)保存非常少。如果要開展RDM服務(wù),可以利用已建的機構(gòu)庫來保存研究者的數(shù)據(jù)成果。
(來稿時間:2018年12月)