摘要通過調(diào)研國內(nèi)外數(shù)據(jù)驅(qū)動研究現(xiàn)狀、趨勢和用戶需求,分析研究數(shù)據(jù)管理服務(wù)的國內(nèi)外發(fā)展情況,研究提出高校研究數(shù)據(jù)管理服務(wù)體系,并介紹北京大學(xué)研究數(shù)據(jù)管理服務(wù)的研究成果、框架設(shè)計、構(gòu)建經(jīng)驗(yàn)與服務(wù)效果,為高校建設(shè)一流研究數(shù)據(jù)管理服務(wù)、支持用戶數(shù)據(jù)驅(qū)動研究范式需求,提供研究與實(shí)踐經(jīng)驗(yàn)。以促進(jìn)數(shù)據(jù)驅(qū)動研究,推動開放科學(xué)。
關(guān)鍵詞數(shù)據(jù)驅(qū)動研究研究數(shù)據(jù)管理數(shù)據(jù)服務(wù)體系數(shù)據(jù)服務(wù)數(shù)據(jù)政策
分類號G251
DOI10.16603/j.issn1002-1027.2019.02.008
1引言
隨著云計算、移動互聯(lián)網(wǎng)的應(yīng)用普及,以及可穿戴智能設(shè)備的出現(xiàn),一場全新的、以大規(guī)模數(shù)據(jù)生產(chǎn)、分享、使用為代表的技術(shù)革命正在發(fā)生,數(shù)據(jù)成為寶貴的資源、資產(chǎn)和生產(chǎn)要素。對海量數(shù)據(jù)及其隱含信息、知識的收集、分析、挖掘、有效整合,將為科學(xué)研究、社會經(jīng)濟(jì)發(fā)展帶來巨大的紅利。大數(shù)據(jù)的廣泛應(yīng)用開啟了一個全新的智能時代[1]。2017年,以谷歌阿爾法狗(AlphaGo)和阿爾法元(AlphaZero)為代表,深度學(xué)習(xí)技術(shù)取得突破,標(biāo)志著人工智能元年到來。大數(shù)據(jù)和人工智能時代,世界各國對數(shù)據(jù)的依賴快速上升,搶占大數(shù)據(jù)發(fā)展先機(jī),已成為國家戰(zhàn)略。美國、日本、韓國、中國、歐盟等國家和地區(qū)紛紛將大數(shù)據(jù)利用上升為國家戰(zhàn)略,積極推進(jìn)數(shù)據(jù)政策,希望利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)研究和產(chǎn)業(yè)領(lǐng)域的突破[2]。
數(shù)據(jù)科學(xué)已經(jīng)成為全球高校發(fā)展最快的專業(yè)。數(shù)據(jù)科學(xué)社區(qū)(Data science Community)的數(shù)據(jù)顯示,截至2018年12月,全球共有26個國家的361所高校開設(shè)了597個數(shù)據(jù)科學(xué)相關(guān)學(xué)位專業(yè),其中美國高校開設(shè)的數(shù)據(jù)科學(xué)專業(yè)數(shù)量最多。全美有247所高校共設(shè)置461個數(shù)據(jù)科學(xué)學(xué)位專業(yè),占全球總量的77%[3]。在中國,2016年2月,北京大學(xué)、對外經(jīng)濟(jì)貿(mào)易大學(xué)、中南大學(xué)首次成功申請到“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”本科新專業(yè)。2017年3月,第二批32所高校獲批。2018年3月,教育部公布的高校新增專業(yè)名單中,有248所學(xué)校獲批,是過去兩次審批通過額度的近8倍[4]。
2017年11月24日至2018年4月3日,由北京大學(xué)圖書館和北京大學(xué)信息管理系發(fā)起與組織,多家機(jī)構(gòu)合作,成功舉辦了“首屆全國高校數(shù)據(jù)驅(qū)動創(chuàng)新研究大賽”(以下簡稱大賽)。大賽吸引了全國眾多高校學(xué)生積極參與。比賽期間,有近4萬用戶訪問大賽主頁,共吸引來自北京大學(xué)等全國169所高校的1892名同學(xué)報名參賽,共有593組隊伍,涉及56個一級學(xué)科。最終,來自121所高校的968人(共289支隊伍)成功提交了參賽作品,涉及45個一級學(xué)科。成功提交作品最多的前20個一級學(xué)科中,圖書館、情報和檔案學(xué)科隊伍最多,達(dá)到59組,其次是應(yīng)用經(jīng)濟(jì)學(xué)、社會學(xué)、管理科學(xué)與工程、計算機(jī)科學(xué)、統(tǒng)計學(xué)也分別達(dá)到達(dá)50組、27組、23組、19組、19組。在通過形式審核的233篇論文中,有103篇論文使用平臺已有數(shù)據(jù),135篇論文使用自產(chǎn)的原創(chuàng)性數(shù)據(jù),同時使用平臺已有數(shù)據(jù)和自己原創(chuàng)數(shù)據(jù)的共有5篇。參賽隊伍使用數(shù)據(jù)情況與筆者前期調(diào)研情況表明:數(shù)據(jù)已是絕大多數(shù)學(xué)科研究的基礎(chǔ),研究者需要高質(zhì)量的大數(shù)據(jù)提交、發(fā)布和研究服務(wù)平臺;高質(zhì)量調(diào)查數(shù)據(jù)、招聘數(shù)據(jù)與社交媒體數(shù)據(jù)仍是人文社科經(jīng)濟(jì)學(xué)領(lǐng)域研究者重點(diǎn)關(guān)注的研究數(shù)據(jù)。
隨著數(shù)據(jù)量與數(shù)據(jù)需求的飛速增長,大數(shù)據(jù)和海量數(shù)據(jù)的管理、共享、發(fā)布和保存面臨著巨大的成本與效率考驗(yàn)。研究數(shù)據(jù)的存儲形式、存儲容量與存儲效率制約著研究使用數(shù)據(jù)規(guī)模與利用形式,成為研究數(shù)據(jù)管理的挑戰(zhàn)。重視與發(fā)展研究數(shù)據(jù)的管理與服務(wù),已成為國家層面與科研機(jī)構(gòu)未來提升學(xué)術(shù)競爭力和影響力的重要發(fā)展戰(zhàn)略之一。2018年4月2日,國務(wù)院國務(wù)院辦公廳關(guān)于印發(fā)科學(xué)數(shù)據(jù)管理辦法的通知,以研究數(shù)據(jù)全生命周期為中心,加強(qiáng)和規(guī)范研究數(shù)據(jù)的管理,推動開放共享[5]。順應(yīng)教學(xué)和研究需求,建設(shè)一流的研究數(shù)據(jù)管理服務(wù)體系,提供研究數(shù)據(jù)支撐服務(wù),成為全球研究型圖書館的必然選擇。
本文將調(diào)研國內(nèi)外研究數(shù)據(jù)管理服務(wù)的發(fā)展情況,提出建設(shè)研究數(shù)據(jù)管理服務(wù)體系的建議。并以北京大學(xué)研究數(shù)據(jù)管理服務(wù)體系的建設(shè)經(jīng)驗(yàn)為例,為圖書館推動研究數(shù)據(jù)管理服務(wù)提供參考。
一流高校研究數(shù)據(jù)管理服務(wù)體系的研究與建設(shè)/崔海媛,羅鵬程,李國俊,朱玲
Research and Implementation on Research Data Management Services Supporting the Data Driven Research Demand/Cui Haiyuan,Luo Pengcheng,Li Guojun,Zhu Ling
一流高校研究數(shù)據(jù)管理服務(wù)體系的研究與建設(shè)/崔海媛,羅鵬程,李國俊,朱玲
Research and Implementation on Research Data Management Services Supporting the Data Driven Research Demand/Cui Haiyuan,Luo Pengcheng,Li Guojun,Zhu Ling
2研究綜述
原中國科學(xué)院圖書館館長張曉林指出,在全學(xué)科數(shù)據(jù)驅(qū)動研究成為趨勢的時代,圖書館需要重新定義服務(wù)目標(biāo)、內(nèi)容、方式和能力,在大數(shù)據(jù)的基礎(chǔ)上,基于新技術(shù)和方法,提供全新知識服務(wù)。美國麻省理工學(xué)院、美國國家醫(yī)學(xué)圖書館和英國大英圖書館等都已經(jīng)調(diào)整戰(zhàn)略,融匯數(shù)據(jù)資源,重構(gòu)知識服務(wù)的平臺、機(jī)制[6]。原上海圖書館館長吳建中通過對20年來全球知識開放運(yùn)動的梳理和分析,提出研究數(shù)據(jù)管理對推進(jìn)知識開放和共享的重要意義,并提出4點(diǎn)建議:①加大宣傳力度,增強(qiáng)開放共享意識;②制定相關(guān)政策,推進(jìn)開放科學(xué)發(fā)展;③整合各類資源,建設(shè)數(shù)字基礎(chǔ)設(shè)施;④培育專業(yè)人才,提升數(shù)據(jù)管理水平[7]。
國際上,研究數(shù)據(jù)作為科學(xué)研究的重要成果受到國際學(xué)術(shù)界和出版界越來越多的重視。2009年以來,美國、英國、澳大利亞、歐盟等國家和地區(qū)紛紛出臺開放數(shù)據(jù)政策。2011年,美國自然科學(xué)基金委要求項(xiàng)目申請書必須包含“數(shù)據(jù)管理計劃”[8],美國多個資助機(jī)構(gòu)的數(shù)據(jù)管理政策陸續(xù)發(fā)布。歐盟與歐洲資助機(jī)構(gòu)出臺一系列數(shù)據(jù)政策。2011年,英國聯(lián)合信息系統(tǒng)委員會(Joint Information Systems Committee)和電子科學(xué)核心計劃(EScience Core Programme)聯(lián)合組建的“國家數(shù)據(jù)監(jiān)管中心(National Digital Curation Center)”發(fā)布《制定數(shù)據(jù)管理與共享計劃》[9]。英國皇家學(xué)會(Royal Society)于2012 年7 月發(fā)布報告《科學(xué)是開放事業(yè)》(Science as an Open Enterprise),確立共享和開放科學(xué)數(shù)據(jù)的基本原則、機(jī)遇與面臨的挑戰(zhàn)[10]。歐盟2020計劃規(guī)定,2017年開始全面實(shí)施科研數(shù)據(jù)開放制度,推動“開放科學(xué)”戰(zhàn)略[11]。截至2018年6月,在資助機(jī)構(gòu)開放獲取政策查詢數(shù)據(jù)庫SHERPA/JULIET中,144個資助機(jī)構(gòu),41個資助機(jī)構(gòu)政策中要求必須開放研究數(shù)據(jù),19個機(jī)構(gòu)鼓勵開放[12]。
在各種政策驅(qū)動下,研究數(shù)據(jù)管理倉儲發(fā)展迅速。截至2018年12月,根據(jù)國際研究數(shù)據(jù)倉儲注冊組織(Registry of Research Data Repositories)的統(tǒng)計,全世界至少有2250多個研究數(shù)據(jù)倉儲[13]。哈佛大學(xué)等世界頂尖高校均建立了自己的數(shù)據(jù)倉儲??茖W(xué)數(shù)據(jù)出版期刊不斷涌現(xiàn),2011年2月,美國《科學(xué)》(Science)刊登“數(shù)據(jù)處理(Dealing with Data)”專題[14],Wiley公司于2012年推出了期刊《地球科學(xué)數(shù)據(jù)》(Geoscience Data Journal)[15],自然集團(tuán)在2014年推出期刊《科學(xué)數(shù)據(jù)》(Scientific Data)[16],中國科學(xué)院也于2016年推出期刊《中國科學(xué)數(shù)據(jù)》[17],研究數(shù)據(jù)逐漸成為出版領(lǐng)域搶占的制高點(diǎn)。數(shù)據(jù)引用及引文數(shù)據(jù)庫也得到越來越多的應(yīng)用,原湯森路透公司于2012年在Web of Science中推出了“數(shù)據(jù)引用索引”(Data Citation Index),用于數(shù)據(jù)的檢索和引用跟蹤。
國家、基金會和機(jī)構(gòu)數(shù)據(jù)政策推動數(shù)據(jù)管理服務(wù)需求,研究數(shù)據(jù)管理(Research Data Management, RDM)成為研究型圖書館的重要服務(wù),相關(guān)研究與實(shí)踐發(fā)展迅速。
卡羅·泰諾普(Carol Tenopir)等在2016年2月向333個歐洲大學(xué)圖書館發(fā)送郵件調(diào)查研究數(shù)據(jù)管理服務(wù)的開展情況,共有119個圖書館回復(fù)郵件。90%以上的圖書館都已經(jīng)開展或計劃開展研究數(shù)據(jù)的管理計劃制定、培訓(xùn)、開發(fā)等服務(wù),319%的圖書館已經(jīng)參與到研究項(xiàng)目中,提供數(shù)據(jù)服務(wù)[18]。 阿楊尹(Ayoung Yoon)等在2015年10月-12月期間,對185個美國研究型大學(xué)圖書館的網(wǎng)站進(jìn)行調(diào)查分析后,發(fā)現(xiàn)美國研究型圖書館開展的研究數(shù)據(jù)管理服務(wù)主要包括:咨詢幫助(help/ask librarians,795%)、數(shù)據(jù)管理(Data deposit,60%)、研究數(shù)據(jù)管理計劃(Data management planning,411%)、數(shù)據(jù)咨詢(Data consultation,384%)、數(shù)據(jù)出版和共享(data publishing and sharing,276%)、數(shù)據(jù)方法(data methodology,157%)[19]。
2017年3月,美國聯(lián)機(jī)計算機(jī)圖書館中心(Online Computer Library Center,OCLC)發(fā)布“研究數(shù)據(jù)管理現(xiàn)實(shí)”系列報告,報告以12個北美、歐洲和澳大利亞的圖書館的研究為基礎(chǔ),重點(diǎn)對愛丁堡大學(xué)(英國)、伊利諾伊大學(xué)厄巴納-香檳分校(美國)、蒙納士大學(xué)(澳大利亞)和瓦赫寧根大學(xué)(荷蘭)等4所大學(xué)的服務(wù)進(jìn)行案例分析, 研究這些機(jī)構(gòu)的研究數(shù)據(jù)管理能力,總結(jié)研究數(shù)據(jù)管理服務(wù)為三大領(lǐng)域:教育類、解決方案類和長期保存類[20]。
澳大利亞國際數(shù)據(jù)服務(wù)中心(The Australian National Data Service)提出數(shù)據(jù)管理能力的5個要素:政策和流程、信息架構(gòu)、服務(wù)能力、元數(shù)據(jù)管理和研究數(shù)據(jù)管理。并給出五個發(fā)展階段的成熟度[21]。伊蓮·馬?。‥laine R. Martin)提出基于圖書館以用戶為中心開展數(shù)據(jù)管理服務(wù)的框架,主要涵蓋:數(shù)據(jù)服務(wù)、數(shù)據(jù)管理實(shí)踐指導(dǎo)、信息素養(yǎng)、存檔保存和政策服務(wù)[22]。英國的數(shù)字策管中心(The Digital Curation Centre)根據(jù)研究生命周期,提出研究數(shù)據(jù)管理支持服務(wù)框架應(yīng)涵蓋:政策和規(guī)劃、可持續(xù)性發(fā)展、研究數(shù)據(jù)管理計劃、元數(shù)據(jù)管理、數(shù)據(jù)存儲、數(shù)據(jù)存檔策略、數(shù)據(jù)管理、培訓(xùn)指南等[23]。于飛(Fei YU)等(2017年)介紹了澳大利亞昆士蘭大學(xué)在對大學(xué)用戶進(jìn)行調(diào)查后,設(shè)計與開展基于生命周期的研究數(shù)據(jù)管理服務(wù)內(nèi)容包括:①研究數(shù)據(jù)管理計劃和準(zhǔn)備(數(shù)據(jù)指南、數(shù)據(jù)培訓(xùn)、研究數(shù)據(jù)管理計劃等);②研究過程支持服務(wù)(數(shù)據(jù)工具、管理和分析、培訓(xùn)等);③數(shù)據(jù)保存、出版和傳播(數(shù)據(jù)發(fā)布平臺、長期保存和數(shù)據(jù)出版等)。見圖1[24]。
3研究數(shù)據(jù)管理服務(wù)體系的設(shè)計與建設(shè)
2015年,北京大學(xué)圖書館制定2018行動計劃,調(diào)整組織機(jī)構(gòu),重新組織與設(shè)計服務(wù),將原系統(tǒng)部更名為信息化與數(shù)據(jù)中心,設(shè)置數(shù)據(jù)管理與服務(wù)崗位,全面開展研究數(shù)據(jù)管理平臺、工具和服務(wù)建設(shè),設(shè)計數(shù)據(jù)管理服務(wù)框架。另外組建研究支持中心,設(shè)置數(shù)據(jù)館員,開展信息素養(yǎng)和數(shù)據(jù)咨詢等服務(wù)。數(shù)據(jù)資源成為資源建設(shè)的重要組成部分。2015年12月25日,北京大學(xué)圖書館正式發(fā)布開放研究數(shù)據(jù)服務(wù)平臺(以下簡稱“開放數(shù)據(jù)平臺”)、機(jī)構(gòu)知識庫、開放出版-期刊網(wǎng)和學(xué)者主頁,構(gòu)建新型學(xué)術(shù)交流生態(tài)系統(tǒng),推動開放獲取與研究數(shù)據(jù)管理服務(wù),成為國內(nèi)高校相關(guān)建設(shè)的引領(lǐng)者。并在開放數(shù)據(jù)平臺的基礎(chǔ)上,開展平臺、服務(wù)、培訓(xùn)、政策制定與推進(jìn)等一系列研究和服務(wù)工作,推動北京大學(xué)建設(shè)成為研究數(shù)據(jù)匯集、管理與服務(wù)的引領(lǐng)者。
3.1需求調(diào)研
2013年起,筆者團(tuán)隊從調(diào)研開始,定位研究者需求,掌握國際發(fā)展動態(tài),開發(fā)數(shù)據(jù)服務(wù)平臺,全面推廣服務(wù),完成北京大學(xué)研究數(shù)據(jù)管理服務(wù)框架的初步構(gòu)建,為未來研究和服務(wù)奠定基礎(chǔ)。圖2列出北京大學(xué)研究數(shù)據(jù)管理服務(wù)的建設(shè)歷程。
2014年,筆者團(tuán)隊對校內(nèi)教師進(jìn)行問卷調(diào)查,獲取50份教師的反饋,并對26名教師進(jìn)行一對一需求訪談。調(diào)研發(fā)現(xiàn):高達(dá)87.5%的受訪者愿意在一定條件下開放研究數(shù)據(jù),開放的最大動機(jī)是通過開放數(shù)據(jù),提升數(shù)據(jù)價值、提高成果引用率與增強(qiáng)數(shù)據(jù)曝光度。開放的最大疑慮是他人利用數(shù)據(jù)搶先發(fā)表成果。開放條件中,受訪者最需要“審核使用者身份和數(shù)據(jù)使用用途后提供”功能。通過調(diào)研,準(zhǔn)確定位研究者對研究數(shù)據(jù)管理服務(wù)的實(shí)際需求。
一對一訪談發(fā)現(xiàn):①數(shù)據(jù)開放程度與學(xué)科特點(diǎn)密切。對于數(shù)據(jù)驅(qū)動、數(shù)據(jù)密集特征明顯的學(xué)科,數(shù)據(jù)開放比較標(biāo)準(zhǔn)和規(guī)范,可以推進(jìn)到原始數(shù)據(jù)的程度,例如社會調(diào)查學(xué)科和生物信息學(xué)科。在生物信息學(xué)科,發(fā)表期刊時發(fā)表數(shù)據(jù)已經(jīng)是趨勢,大多向期刊指定數(shù)據(jù)庫提交,或者自己建立數(shù)據(jù)庫。對于其他學(xué)科,數(shù)據(jù)開放也存在,但向大多數(shù)同行開放的僅是整理后的成果數(shù)據(jù),原始數(shù)據(jù)只與直接合作者共享。②數(shù)據(jù)開放具有明顯的時滯期。幾乎所有的學(xué)者都強(qiáng)調(diào),數(shù)據(jù)必須在自己的成果發(fā)表之后,才考慮開放。這與學(xué)者對“數(shù)據(jù)被他人搶先發(fā)表成果”的擔(dān)心是一致的。③研究數(shù)據(jù)開放行為多為學(xué)者自發(fā),缺乏政策激勵機(jī)制和維護(hù)更新平臺,缺乏基于數(shù)據(jù)引用、認(rèn)可和學(xué)術(shù)聲譽(yù)的良性反饋,亟需規(guī)范的數(shù)據(jù)服務(wù)平臺。
2017年,筆者對校內(nèi)本科生與研究生的課程調(diào)研發(fā)現(xiàn):全校約26個院系開設(shè)數(shù)據(jù)驅(qū)動研究的研究生課程約有56門,本科生課程有85門,不僅分布于理工學(xué)部,也分布于人文與社會科學(xué)學(xué)部。對9名課程教師進(jìn)行訪談,調(diào)研發(fā)現(xiàn):教師課程教學(xué)急需高質(zhì)量開放研究數(shù)據(jù)平臺。教師獲取數(shù)據(jù)的難度遠(yuǎn)遠(yuǎn)超過獲取文獻(xiàn)。
2018年,筆者對國外27所大學(xué)(美國12所、英國11所和澳大利亞4所)的研究數(shù)據(jù)管理服務(wù)主頁進(jìn)行調(diào)研,梳理國內(nèi)外研究機(jī)構(gòu)和大學(xué)的研究數(shù)據(jù)管理服務(wù)內(nèi)容。調(diào)研結(jié)果見表1,可以發(fā)現(xiàn)研究數(shù)據(jù)管理服務(wù)內(nèi)容主要包括:數(shù)據(jù)管理計劃、數(shù)據(jù)服務(wù)、數(shù)據(jù)素養(yǎng)、數(shù)據(jù)管理、長期保存和數(shù)據(jù)政策幾部分。圍繞研究和研究數(shù)據(jù)生命周期,提供全流程的數(shù)據(jù)管理服務(wù)。
3.3建設(shè)過程
(1)數(shù)據(jù)建設(shè)
在數(shù)據(jù)建設(shè)方面,截至2018年12月,開放數(shù)據(jù)平臺發(fā)布數(shù)據(jù)空間37個、數(shù)據(jù)集236個、數(shù)據(jù)文件1096個,收錄中國家庭追蹤調(diào)查、中國健康與養(yǎng)老追蹤調(diào)查、綜合型語言知識庫、中國歷代人物傳記資料庫等多個高質(zhì)量、具有國際影響力的數(shù)據(jù)集。
(2)比較與分析不同研究數(shù)據(jù)發(fā)布平臺,推出符合北京大學(xué)需求的開放數(shù)據(jù)平臺
在調(diào)研與測試多個軟件平臺與工具的基礎(chǔ)上,確定應(yīng)用開源軟件Dataverse建設(shè)北京大學(xué)研究數(shù)據(jù)開放服務(wù)平臺,開發(fā)實(shí)現(xiàn)中英雙語界面、校統(tǒng)一認(rèn)證、用戶審核管理、DOI注冊、數(shù)據(jù)統(tǒng)計等新功能,滿足數(shù)據(jù)提交、管理與服務(wù)需求。實(shí)現(xiàn)數(shù)據(jù)成果交互與揭示,數(shù)據(jù)平臺與機(jī)構(gòu)知識庫實(shí)現(xiàn)互操作,將基于平臺數(shù)據(jù)集的研究成果通過機(jī)構(gòu)知識庫進(jìn)行保存與服務(wù)。推動國際平臺交互與揭示,數(shù)據(jù)平臺與國際數(shù)據(jù)倉儲Re3data、國際數(shù)據(jù)引用索引平臺(Data Citation Index)實(shí)現(xiàn)數(shù)據(jù)交互、收錄與揭示,提高數(shù)據(jù)平臺國際可見度。
建設(shè)云存儲、云筆記、唯一標(biāo)識符管理系統(tǒng)、長期保存框架等相關(guān)平臺和服務(wù)。在提供開放數(shù)據(jù)服務(wù)的基礎(chǔ)上,研究與應(yīng)用項(xiàng)目管理工具、平臺服務(wù)。
(3)全面開展北京大學(xué)研究數(shù)據(jù)管理服務(wù)
以合作促發(fā)展,通過建立校內(nèi)多部門、多院系合作機(jī)制,為課程、項(xiàng)目與教師提供持續(xù)服務(wù),并與院系、教師課題組、政府、企業(yè)建立數(shù)據(jù)合作關(guān)系,立足高校實(shí)際需求,與國際同步發(fā)展,建立良性、可持續(xù)發(fā)展機(jī)制。
(4)推動建設(shè)北京大學(xué)研究數(shù)據(jù)長期保存與共享服務(wù)機(jī)制
調(diào)研研究數(shù)據(jù)管理服務(wù)政策、長期保存與共享服務(wù)機(jī)制,將數(shù)據(jù)政策研究納入到北京大學(xué)開放獲取政策推動項(xiàng)目中。推出北京大學(xué)數(shù)據(jù)唯一標(biāo)識符服務(wù),提供數(shù)據(jù)的長期保存與國際數(shù)據(jù)中心互操作服務(wù)。
(5)服務(wù)營銷
在中國研究數(shù)據(jù)相關(guān)政策滯后于國際的情況下,如何讓更多研究者了解、參與和受益于研究數(shù)據(jù)管理服務(wù),成為一項(xiàng)挑戰(zhàn)。筆者團(tuán)隊通過策劃多種方案,推動研究數(shù)據(jù)管理服務(wù)建設(shè)。
首先,通過營銷提升影響力。
對開放數(shù)據(jù)平臺進(jìn)行搜索引擎優(yōu)化(Search Engine Optimization),改進(jìn)與提高搜索引擎排名,優(yōu)化后,平臺搜索進(jìn)入百度和谷歌搜索結(jié)果第一。在北京大學(xué)主頁科學(xué)研究欄目下發(fā)布開放數(shù)據(jù)平臺鏈接,增加平臺入口。通過北京大學(xué)37個院系圖書館分館發(fā)放研究數(shù)據(jù)管理宣傳冊,并在校圖書館管理委員會年度會議、科研秘書年度會議和在國內(nèi)外學(xué)術(shù)會議上廣泛宣傳北京大學(xué)研究數(shù)據(jù)管理服務(wù)。與國際數(shù)據(jù)倉儲Re3data和國際數(shù)據(jù)引用索引平臺Data Citation Index合作,將平臺數(shù)據(jù)在國際平臺上收錄與揭示,增強(qiáng)國際可見度,擴(kuò)大數(shù)據(jù)的國際影響力。
其次,服務(wù)營銷案例-首屆全國高校數(shù)據(jù)驅(qū)動研究大賽。
為廣泛宣傳研究數(shù)據(jù)管理服務(wù),2016年11月7日至12月16日,北京大學(xué)圖書館舉辦第三屆搜索達(dá)人大賽——“開放數(shù)據(jù)”篇。大賽共吸引300多名師生參與,幫助師生拓展開放數(shù)據(jù)視野,提高開放數(shù)據(jù)搜索和分析的實(shí)踐技能,激發(fā)利用開放數(shù)據(jù)進(jìn)行教學(xué)科研的熱情,以更好地開展科學(xué)數(shù)據(jù)管理與利用相關(guān)服務(wù)、助力教學(xué)科研、推動科學(xué)數(shù)據(jù)開放共享。
2017年12月至2018年4月,由北京大學(xué)圖書館發(fā)起,聯(lián)合校內(nèi)外機(jī)構(gòu),成功舉辦“全國高校數(shù)據(jù)驅(qū)動創(chuàng)新研究大賽”。大賽吸引全國高校萬余人的關(guān)注,在報名階段,共吸引來自全國160多所高校近600支隊伍(近2000名選手)參賽報名。最終由來自全國120余所高校的289支隊伍(近1000人)成功提交參賽作品。評選出13支現(xiàn)場答辯隊伍和120支優(yōu)秀隊伍。2018年4月3日下午,答辯活動在北京大學(xué)舉行,現(xiàn)場評選出特等獎、一等獎、二等獎和三等獎共計十三項(xiàng)大獎。大賽得到廣泛關(guān)注,全國數(shù)十個高校發(fā)布相關(guān)信息,主流媒體進(jìn)行報道,參賽者對大賽極為重視,提交的高質(zhì)量、有創(chuàng)新研究成果的參賽作品,得到評審專家們的充分肯定。
大賽達(dá)到了營銷開放數(shù)據(jù)平臺的目標(biāo)。在大賽舉辦之前,平臺的日均訪客數(shù)為52人,大賽宣傳報名期間開放數(shù)據(jù)平臺日均訪客數(shù)為753人,大賽結(jié)束后日均訪客數(shù)為477人。通過大賽,平臺日均訪問量增加了近10倍,大賽期間,數(shù)據(jù)下載量達(dá)到過去兩年總和的5倍,新增用戶數(shù)量達(dá)到過去兩年總和的4倍。
34未來規(guī)劃
抓住大數(shù)據(jù)發(fā)展機(jī)遇,將北京大學(xué)建設(shè)成為研究數(shù)據(jù)匯集、管理與服務(wù)的世界一流引領(lǐng)者,已成為北京大學(xué)圖書館的重要發(fā)展目標(biāo)之一。北京大學(xué)圖書館未來將在以下方面推進(jìn)研究數(shù)據(jù)管理:加強(qiáng)在數(shù)據(jù)工具、軟件、管理與服務(wù)等方面的研究與應(yīng)用,以數(shù)據(jù)服務(wù)為凝聚力,建設(shè)持續(xù)匯集國內(nèi)外高質(zhì)量研究數(shù)據(jù)的研究數(shù)據(jù)平臺,提供基于數(shù)據(jù)的教學(xué)與研究的支撐平臺;開展數(shù)據(jù)創(chuàng)新研究、教學(xué)與產(chǎn)業(yè)孵化活動與比賽;與校外數(shù)據(jù)資源豐富的政府、企事業(yè)單位合作,尋求互補(bǔ)共贏的合作模式;推動數(shù)據(jù)教學(xué)與科研創(chuàng)新。
在數(shù)據(jù)服務(wù)和數(shù)據(jù)管理平臺建設(shè)方面,將通過以下方式加快發(fā)展:
為教學(xué)提供支撐服務(wù),促進(jìn)與課程相關(guān)的數(shù)據(jù)和論文的保存、積累。
融入教師的科研過程,通過數(shù)據(jù)館員與教師展開深入合作,推進(jìn)研究數(shù)據(jù)的全生命周期管理。
推動北京大學(xué)制定研究數(shù)據(jù)管理與服務(wù)政策,推動研究數(shù)據(jù)的收集、保存、管理和共享。
優(yōu)化平臺性能與功能,發(fā)展為國際一流數(shù)據(jù)平臺。
提升平臺的數(shù)據(jù)量承載能力,構(gòu)建基于大數(shù)據(jù)、高并發(fā)的數(shù)據(jù)管理系統(tǒng),促進(jìn)平臺對生物、醫(yī)學(xué)、社會科學(xué)等學(xué)科大數(shù)據(jù)的支撐。
提高數(shù)據(jù)平臺與其他系統(tǒng)的互操作性,促進(jìn)數(shù)據(jù)與論文成果、學(xué)者主頁、項(xiàng)目成果的關(guān)聯(lián),加速數(shù)據(jù)的流動和共享。
4結(jié)語
在大數(shù)據(jù)和人工智能環(huán)境下,研究數(shù)據(jù)呈指數(shù)級增長,數(shù)據(jù)驅(qū)動研究成為全學(xué)科研究態(tài)勢,數(shù)據(jù)管理和服務(wù)的需求日益迫切。2018年12月2日—4日,在第14屆開放獲取柏林會議上,中國國家自然科學(xué)基金委、國家科技圖書文獻(xiàn)中心、中科院文獻(xiàn)情報中心代表在會議上發(fā)布立場聲明,明確表示中國支持歐盟倡議的OA2020和開放獲取S計劃,支持公共資助項(xiàng)目研究論文立即開放獲取[25]。S計劃包括研究數(shù)據(jù)的開放獲取,此聲明意味著中國的開放數(shù)據(jù)政策可能也即將出臺。對研究型圖書館來說,這既是挑戰(zhàn),也是機(jī)遇。圖書館應(yīng)重視研究數(shù)據(jù)管理服務(wù),助力中國高等教育的“雙一流”建設(shè),把握研究數(shù)據(jù)管理服務(wù)發(fā)展契機(jī),加快研究與實(shí)踐,成為研究數(shù)據(jù)匯集、管理與服務(wù)的引領(lǐng)者。
參考文獻(xiàn)
1黃曉艷, 馬珉. 大數(shù)據(jù)開啟智能時代——訪中國科學(xué)院院士鄂維南 [J]. 高科技與產(chǎn)業(yè)化, 2017, (6): 36-41.
2張影強(qiáng), 張大璐, 梁鵬. 發(fā)達(dá)國家如何布局大數(shù)據(jù)戰(zhàn)略 [J]. 中國經(jīng)濟(jì)報告, 2018, (1): 87-89.
3College & university data science degrees[EB/OL]. [2018-12-20]. http://datascience.community/colleges.
4283所高校獲批數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)[EB/OL]. [2018-05-10]. http://36kr.com/p/5125134.html.
5國務(wù)院辦公廳關(guān)于印發(fā)科學(xué)數(shù)據(jù)管理辦法的通知[EB/OL]. [2018-05-01]. http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm.
6張曉林. 顛覆性變革與后圖書館時代——推動知識服務(wù)的供給側(cè)結(jié)構(gòu)性改革 [J]. 中國圖書館學(xué)報, 2018, 44(1): 4-16.
7吳建中. 推進(jìn)開放數(shù)據(jù) 助力開放科學(xué) [J]. 圖書館雜志, 2018, 37(2): 4-10.
8Nsf data sharing policy[EB/OL]. [2018-10-01]. https://www.nsf.gov/bfa/dias/policy/dmp.jsp.
9陳大慶. 英國科研資助機(jī)構(gòu)的數(shù)據(jù)管理與共享政策調(diào)查及啟示 [J]. 圖書情報工作, 2013(8): 5-11.
10Science as an open enterprise[EB/OL]. [2018-12-02]. https://royalsociety.org/topicspolicy/projects/sciencepublicenterprise/report/.
11COMMISSION E. Open access & data management[EB/OL]. [2018-07-10]. http://ec.europa.eu/research/participants/docs/h2020fundingguide/crosscuttingissues/openaccessdissemination_en.htm.
12Research funders open access policies[EB/OL]. [2018-05-31]. http://v2.sherpa.ac.uk/juliet/.
13Re3data.Org[EB/OL]. [2018-12-20]. https://www.re3data.org/.
14Special online collection: Dealing with data[EB/OL]. [2018-06-19]. http://www.sciencemag.org/site/special/data/#opennewwindow.
15Geoscience data journal [EB/OL]. [2018-06-19]. https://rmets.onlinelibrary.wiley.com/journal/20496060.
16Welcome, scientific data[EB/OL]. [2018-06-19]. https://www.nature.com/news/welcomescientificdata1.15293.
17中國科學(xué)數(shù)據(jù)[EB/OL]. [2018-06-19]. http://www.csdata.org/p/static/33/.
18Tenopir C, Talja S, Horstmann W, et al. Research data services in european academic research libraries [J]. Liber Quarterly, 2017, 27(1): 23-44.
19Yoon A, Schultz T. Research data management services in academic libraries in the us: A content analysis of libraries websites [J]. College & Research Libraries, 2017, 78(7): 920-933.
20Bryant R, Lavoie B, Malpas C, et al. A tour of the research data management (rdm) service space. The realities of research data management, part 1 [J]. 2017,
21Creating a data management framework[EB/OL]. [2018-06-07]. https://www.ands.org.au/guides/creatingadatamanagementframework.
22Martin E R. The role of librarians in data science: a call to action [J]. Journal of eScience Librarianship, 2016, 4(2): 7-9.
23How to develop rdm services—a guide for heis[EB/OL]. [2018-05-01]. http://www.dcc.ac.uk/resources/howguides/howdeveloprdmservices.
24Yu F, Deuble R, Morgan H. Designing research data management services based on the research lifecycle–a consultative leadership approach [J]. Journal of the Australian Library and Information Association, 2017, 66(3): 287-298.
25張曉林. 讓所有科研論文免費(fèi)閱讀,中國機(jī)構(gòu)明確力挺開放獲取[EB/OL]. [2018-12-20]. http://zhishifenzi.com/depth/depth/4778.html.
作者單位:北京大學(xué)圖書館,北京,100871
收稿日期:2018年7月7日