涂志芳
(中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心 北京 100190)
科學(xué)數(shù)據(jù)(Scientific Data)或研究數(shù)據(jù)(Research Data)是指產(chǎn)生或收集后有待進(jìn)一步檢查并作為推理、討論或計(jì)算基礎(chǔ)的信息,尤其是事實(shí)或數(shù)字信息,如統(tǒng)計(jì)數(shù)據(jù)、實(shí)驗(yàn)結(jié)果、測(cè)量結(jié)果、實(shí)地觀察記錄、調(diào)查結(jié)果、訪談?dòng)涗浐蛨D像等[1]??茖W(xué)數(shù)據(jù)是學(xué)術(shù)資源開放存取的重要組成部分,也是大數(shù)據(jù)時(shí)代數(shù)據(jù)開放共享的重要內(nèi)容,科學(xué)數(shù)據(jù)開放共享能夠?yàn)樯鐣?huì)帶來巨大的利益和回報(bào)[2]。在國(guó)內(nèi)外學(xué)術(shù)社群對(duì)科學(xué)數(shù)據(jù)開放存取的闡釋、聲明或倡議下[3-9],在各類組織機(jī)構(gòu)數(shù)據(jù)開放政策的制定、實(shí)施中[10-12],數(shù)據(jù)共享已然成為科技界、出版界、圖書館界等的普遍共識(shí)和行動(dòng),而數(shù)據(jù)出版(Data Publishing)是規(guī)范數(shù)據(jù)共享方式、提高數(shù)據(jù)共享質(zhì)量的有效途徑。
近年來,國(guó)內(nèi)外關(guān)于數(shù)據(jù)出版的研究不斷涌現(xiàn),已有相當(dāng)?shù)奈墨I(xiàn)對(duì)科學(xué)數(shù)據(jù)出版問題的多個(gè)方面進(jìn)行了思考與探究;但數(shù)據(jù)出版實(shí)踐仍有許多問題和困難需要進(jìn)一步探索和克服。文章旨在對(duì)數(shù)據(jù)出版相關(guān)的基礎(chǔ)研究問題進(jìn)行系統(tǒng)性梳理和歸納,并在梳理過程中識(shí)別出數(shù)據(jù)出版現(xiàn)有研究與實(shí)踐的關(guān)鍵問題與熱點(diǎn)議題,了解研究與實(shí)踐的重點(diǎn)、難點(diǎn)和局限,為未來研究方向提供參考和啟示。
為了盡可能全面系統(tǒng)地收集與科學(xué)數(shù)據(jù)出版相關(guān)的文獻(xiàn),文章利用了多種工具和方式進(jìn)行檢索并在文獻(xiàn)收集過程中不斷進(jìn)行檢索詞的調(diào)整和細(xì)化,主要數(shù)據(jù)來源與獲取途徑包括:一是以中國(guó)知網(wǎng)(CNKI)、維普、萬方、百度學(xué)術(shù)等為數(shù)據(jù)來源,以“數(shù)據(jù)出版”“數(shù)據(jù)開放出版”“科學(xué)數(shù)據(jù)出版”“數(shù)據(jù)期刊”“數(shù)據(jù)論文”等為主題進(jìn)行多次檢索和人工篩選,獲得高度相關(guān)的中文文獻(xiàn)30余篇。二是以Web of Science、Google Scholar、百度學(xué)術(shù)等為數(shù)據(jù)來源,以“data publishing”“scientific data publishing”“research data publishing”“data paper”“data journal”“data repository”“data review”“data citation”等為主題進(jìn)行多次檢索和人工篩選,獲得高度相關(guān)的英文文獻(xiàn)40余篇。三是利用Google作為搜索引擎,以“data publishing”“scientific data publishing”“research data publishing”等為檢索詞,補(bǔ)充性地訪問了若干數(shù)據(jù)出版相關(guān)組織機(jī)構(gòu)的官網(wǎng)、博客等內(nèi)容并獲得部分政策文件、年度報(bào)告等網(wǎng)絡(luò)資料。四是在特定機(jī)構(gòu)知識(shí)庫(kù)中進(jìn)行檢索,如“中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心機(jī)構(gòu)知識(shí)庫(kù)”“北京大學(xué)機(jī)構(gòu)知識(shí)庫(kù)”,獲得部分相關(guān)研究報(bào)告、演示報(bào)告等資料。
在學(xué)術(shù)傳播語境下,科學(xué)數(shù)據(jù)出版通常被認(rèn)為是與科學(xué)研究產(chǎn)生的數(shù)據(jù)出版有關(guān)的活動(dòng)[13]。數(shù)據(jù)出版是科學(xué)數(shù)據(jù)與開放出版領(lǐng)域一個(gè)相對(duì)新興的議題,相關(guān)研究對(duì)科學(xué)數(shù)據(jù)出版概念及其相關(guān)概念進(jìn)行了釋義或辨析,主要角度包括:
首先,從出版語義的角度強(qiáng)調(diào)數(shù)據(jù)出版與一般的數(shù)據(jù)開放、共享的差別。數(shù)據(jù)“出版”與傳統(tǒng)“出版”不同,數(shù)據(jù)的“publish”(小寫字母p)和“Publish”(大寫字母P)也有所區(qū)別,前者將數(shù)據(jù)文件上傳于網(wǎng)絡(luò)使數(shù)據(jù)得以開放,但數(shù)據(jù)文件沒有任何長(zhǎng)期存在、不被損壞、相關(guān)信息描述等的保障[14];而后者是正式的數(shù)據(jù)出版,不僅可揭示數(shù)據(jù)集的科學(xué)質(zhì)量和重要性,也能為數(shù)據(jù)生產(chǎn)者帶來聲譽(yù),同時(shí)還意味著對(duì)數(shù)據(jù)長(zhǎng)期保存的承諾和面向數(shù)據(jù)消費(fèi)者的數(shù)據(jù)增值。
其次,從出版過程的角度闡釋數(shù)據(jù)出版的功用。數(shù)據(jù)出版不是單純將數(shù)據(jù)傳至互聯(lián)網(wǎng)進(jìn)行共享,而是將數(shù)據(jù)上載到網(wǎng)絡(luò)上使得除作者以外的人和組織也能夠下載、分析、重用和引用數(shù)據(jù)[15],是學(xué)術(shù)共同體中的學(xué)術(shù)期刊、學(xué)術(shù)機(jī)構(gòu)或?qū)W術(shù)社群等主體從科學(xué)研究的角度對(duì)研究人員產(chǎn)生的科學(xué)數(shù)據(jù)及相關(guān)信息進(jìn)行同行評(píng)審、編輯加工,使之符合一定規(guī)范和標(biāo)準(zhǔn)并能為學(xué)術(shù)界方便獲取及再利用和引用的過程[15-16]。
再者,對(duì)數(shù)據(jù)出版及其相關(guān)概念進(jìn)行辨析以突出數(shù)據(jù)出版的特點(diǎn)。其中,數(shù)據(jù)發(fā)表[17]是將數(shù)據(jù)發(fā)布在網(wǎng)絡(luò)或其它媒介上,在遵循版權(quán)協(xié)議的前提下,供他人引用、下載、分析和重用,與數(shù)據(jù)出版含義基本相同;數(shù)據(jù)發(fā)布(Data Release)則側(cè)重于將數(shù)據(jù)公布在互聯(lián)網(wǎng)上,但缺乏永久保存、同行評(píng)審等環(huán)節(jié)。數(shù)據(jù)開放存取和數(shù)據(jù)開放共享強(qiáng)調(diào)數(shù)據(jù)面向一定范圍公開并共享;數(shù)據(jù)開放出版則是在數(shù)據(jù)開放、共享的基礎(chǔ)上,以“出版”的標(biāo)準(zhǔn)對(duì)開放數(shù)據(jù)進(jìn)行規(guī)范處理、質(zhì)量控制和版權(quán)保護(hù),是開放存取模式的數(shù)據(jù)出版。廣義的數(shù)據(jù)管理包含數(shù)據(jù)出版,狹義的數(shù)據(jù)管理是對(duì)數(shù)據(jù)進(jìn)行收集、存檔、保存、維護(hù)等的一系列管理性活動(dòng),而數(shù)據(jù)出版是在數(shù)據(jù)管理的基礎(chǔ)上進(jìn)一步規(guī)范形式、提升質(zhì)量并明確知識(shí)產(chǎn)權(quán)的傳播性活動(dòng)。
可見,數(shù)據(jù)出版是使科學(xué)數(shù)據(jù)獲得“來源可靠”“質(zhì)量可信”“公開發(fā)布”“公共利用”“唯一標(biāo)識(shí)”“知識(shí)產(chǎn)權(quán)清晰”“可正式引用”等特征的一系列活動(dòng)和過程。
數(shù)據(jù)出版的作用是有目共睹的,國(guó)內(nèi)外研究者均高度肯定數(shù)據(jù)出版的積極作用。數(shù)據(jù)出版對(duì)研究人員、社會(huì)公眾、數(shù)據(jù)本身、學(xué)術(shù)出版及科學(xué)事業(yè)的發(fā)展都能產(chǎn)生作用,具體而言:
一是作為一種全新的數(shù)據(jù)共享機(jī)制,數(shù)據(jù)出版能夠協(xié)調(diào)數(shù)據(jù)的知識(shí)產(chǎn)權(quán)問題,保障科學(xué)數(shù)據(jù)創(chuàng)建者和管理者相應(yīng)的學(xué)術(shù)信譽(yù)與權(quán)益,從而提高研究人員數(shù)據(jù)共享的積極性[16];二是數(shù)據(jù)出版便利于作為數(shù)據(jù)用戶的社會(huì)公眾發(fā)現(xiàn)、獲取、利用數(shù)據(jù)[18],其中的同行評(píng)議環(huán)節(jié)是面向研究資助者和數(shù)據(jù)消費(fèi)者的一種數(shù)據(jù)質(zhì)量保證,數(shù)據(jù)出版還能夠彰顯科學(xué)研究過程的透明度并改善公眾問責(zé)制度和環(huán)境[18];三是數(shù)據(jù)出版能夠確保數(shù)據(jù)集上傳到受信任的存儲(chǔ)庫(kù)并得到正確存檔和監(jiān)護(hù)[18],而且數(shù)據(jù)出版物與其他相關(guān)資源進(jìn)行關(guān)聯(lián)后形成完整的價(jià)值鏈也讓數(shù)據(jù)變得更有價(jià)值[19];四是數(shù)據(jù)出版是一種規(guī)范的數(shù)據(jù)開放共享方式,能夠?yàn)閷W(xué)術(shù)評(píng)價(jià)、學(xué)術(shù)規(guī)范和學(xué)術(shù)質(zhì)量控制提供基礎(chǔ),是科學(xué)數(shù)據(jù)管理及其可持續(xù)發(fā)展的必然結(jié)果和最終環(huán)節(jié),是推動(dòng)科學(xué)數(shù)據(jù)共享的最根本途徑[20]。
可見,數(shù)據(jù)開放出版不僅擁有數(shù)據(jù)開放、共享的全部功能,還能在此基礎(chǔ)上極大解決數(shù)據(jù)知識(shí)產(chǎn)權(quán)的問題,提升研究者的數(shù)據(jù)共享意愿,保障科學(xué)數(shù)據(jù)的質(zhì)量,提高數(shù)據(jù)重用的價(jià)值。
數(shù)據(jù)出版模式(Data Publishing Model),又被稱為數(shù)據(jù)出版途徑、形態(tài)、機(jī)制等,現(xiàn)有研究主要從出版物客體和出版物主體兩個(gè)不同視角對(duì)數(shù)據(jù)出版模式進(jìn)行劃分和歸納。
就數(shù)據(jù)出版客體而言,學(xué)者們對(duì)數(shù)據(jù)出版/發(fā)表模式的劃分有三種[21]、四種[22]、五種[23]等不同說法,但以“三種模式”的劃分居多。Lawrence等[23]較早提出數(shù)據(jù)出版的“五種模式”,分別為獨(dú)立數(shù)據(jù)出版、學(xué)術(shù)論文輔助數(shù)據(jù)出版、附錄數(shù)據(jù)出版、期刊數(shù)據(jù)檔案出版、數(shù)據(jù)論文出版,后來國(guó)內(nèi)外研究者大多以此為基礎(chǔ)進(jìn)行數(shù)據(jù)出版模式劃分的討論。例如,王丹丹[24]、顧立平[25]、張小強(qiáng)和李欣[13]、何琳和常穎聰[26]等進(jìn)一步將數(shù)據(jù)出版模式歸為“獨(dú)立的數(shù)據(jù)出版”“作為論文附件的數(shù)據(jù)出版”“數(shù)據(jù)論文出版”等三種,其中“數(shù)據(jù)論文出版”有時(shí)又被稱為“數(shù)據(jù)集獨(dú)立出版”[27],而“作為論文附件的數(shù)據(jù)出版”有時(shí)又被稱為“科學(xué)數(shù)據(jù)合作出版”[28]。歸根到底可總結(jié)為:獨(dú)立數(shù)據(jù)出版,該模式將數(shù)據(jù)作為獨(dú)立的信息對(duì)象提交到具有合作關(guān)系的開放存取數(shù)據(jù)知識(shí)庫(kù);作為論文附件的數(shù)據(jù)出版,數(shù)據(jù)往往作為論文的附件、附錄而出版或存儲(chǔ)到期刊指定的數(shù)據(jù)知識(shí)庫(kù)并建立論文和數(shù)據(jù)的關(guān)聯(lián);數(shù)據(jù)論文出版,將科學(xué)數(shù)據(jù)作為一種文本文獻(xiàn)進(jìn)行出版,包括專門數(shù)據(jù)期刊的數(shù)據(jù)論文出版和綜合性期刊的數(shù)據(jù)論文出版。
就數(shù)據(jù)出版主體而言,一方面從數(shù)據(jù)管理與出版動(dòng)力視角可總結(jié)為三種模式:自上而下模式,通常由政府、資助機(jī)構(gòu)等制定政策并提出強(qiáng)制性數(shù)據(jù)開放要求,相應(yīng)的機(jī)構(gòu)或人員遵照?qǐng)?zhí)行;橫縱聯(lián)合模式,數(shù)據(jù)在國(guó)際、區(qū)域、跨部門和部門內(nèi)部之間進(jìn)行數(shù)據(jù)多元合作開放;自下而上模式,多立足于激勵(lì)措施的非強(qiáng)制性科學(xué)數(shù)據(jù)開放,如部分期刊、數(shù)據(jù)知識(shí)庫(kù)的數(shù)據(jù)提交、存儲(chǔ)與管理規(guī)定[29]。另一方面,從數(shù)據(jù)管理與存儲(chǔ)主體視角可分為四種模式:出版機(jī)構(gòu)控制模式,即期刊出版單位控制數(shù)據(jù)和數(shù)據(jù)論文出版;非出版機(jī)構(gòu)獨(dú)立控制模式,主要由研究資助機(jī)構(gòu)、教育科研機(jī)構(gòu)等建立專門的數(shù)據(jù)倉(cāng)儲(chǔ)并進(jìn)行數(shù)據(jù)出版;混合模式,由出版機(jī)構(gòu)和數(shù)據(jù)存儲(chǔ)機(jī)構(gòu)分工合作進(jìn)行數(shù)據(jù)出版;“二次出版”模式,基于海量數(shù)據(jù)信息和大規(guī)模數(shù)據(jù)出版而建立數(shù)據(jù)出版物的監(jiān)護(hù)、索引、發(fā)現(xiàn)系統(tǒng)從而提高其可發(fā)現(xiàn)性和被利用的可能[13]。
綜上可知,主客體兩種視角的劃分具有相互映射的關(guān)系,同一視角下的劃分有不同的說法,反映了當(dāng)前人們對(duì)數(shù)據(jù)出版的認(rèn)識(shí)還處于探索階段,也說明數(shù)據(jù)出版實(shí)踐具有復(fù)雜性。
“獨(dú)立數(shù)據(jù)出版”模式是將數(shù)據(jù)提交、存儲(chǔ)至開放存取數(shù)據(jù)知識(shí)庫(kù)并提供公共利用,數(shù)據(jù)知識(shí)庫(kù)(Data Repository)又被稱為數(shù)據(jù)倉(cāng)儲(chǔ)、數(shù)據(jù)中心、數(shù)據(jù)平臺(tái)等,是為有研究?jī)r(jià)值的數(shù)字對(duì)象提供長(zhǎng)期管理的存檔服務(wù)[30],也指專門用于存儲(chǔ)、管理、出版、利用開放數(shù)據(jù)的平臺(tái)。科學(xué)、技術(shù)、醫(yī)學(xué)等自然科學(xué)領(lǐng)域和社會(huì)學(xué)、經(jīng)濟(jì)學(xué)等人文社會(huì)科學(xué)領(lǐng)域的數(shù)據(jù)出版情況存在較大差別,數(shù)據(jù)知識(shí)庫(kù)也通常被劃分為通用型和學(xué)科型,研究中常用數(shù)據(jù)知識(shí)庫(kù)案例包括Dryad、Figshare、Dataverse、Zenodo、GenBank 等。
目前,學(xué)者們主要通過對(duì)國(guó)內(nèi)外開放數(shù)據(jù)知識(shí)庫(kù)進(jìn)行調(diào)查分析的方式研究數(shù)據(jù)知識(shí)庫(kù)的平臺(tái)建設(shè)與數(shù)據(jù)出版。例如,Aalbersberg等[31]以國(guó)際知名出版機(jī)構(gòu)Elsevier為例,介紹了作者貼標(biāo)簽、自動(dòng)鏈接和數(shù)據(jù)鏈接應(yīng)用程序等三種鏈接學(xué)術(shù)論文與對(duì)應(yīng)數(shù)據(jù)知識(shí)庫(kù)的方 法; Assante等[32]選 取 Zenodo、Dryad、CSIRODAP等五個(gè)數(shù)據(jù)知識(shí)庫(kù)為調(diào)研對(duì)象,從數(shù)據(jù)出版的數(shù)據(jù)集格式、文檔、許可、出版成本、驗(yàn)證、可用性、發(fā)現(xiàn)和獲取、引用等八個(gè)要素研究基于數(shù)據(jù)知識(shí)庫(kù)的數(shù)據(jù)出版,并認(rèn)為數(shù)據(jù)知識(shí)庫(kù)還不能完全滿足數(shù)據(jù)集資源的管理和使用需求。黃永文等[33]選擇Figshare、Dryad、PANGAEA三個(gè)數(shù)據(jù)知識(shí)庫(kù)進(jìn)行學(xué)科領(lǐng)域、數(shù)據(jù)內(nèi)容類型、數(shù)據(jù)唯一標(biāo)識(shí)符、數(shù)據(jù)質(zhì)量管理等方面的比較分析;朱玲等[34]從需求與定位分析、平臺(tái)建設(shè)實(shí)踐、平臺(tái)應(yīng)用效果三方面剖析北京大學(xué)開放研究數(shù)據(jù)平臺(tái)的建設(shè)過程與經(jīng)驗(yàn)。
期刊出版商通過制定數(shù)據(jù)共享政策,從數(shù)據(jù)提交、數(shù)據(jù)審查、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)服務(wù)、數(shù)據(jù)權(quán)益管理等方面對(duì)作為論文附件的數(shù)據(jù)出版加以控制和規(guī)范,以實(shí)現(xiàn)論文和數(shù)據(jù)的關(guān)聯(lián)出版,其中影響范圍和影響力度較大的包括美國(guó)科學(xué)促進(jìn)會(huì)(AAAS)、施普林格·自然出版集團(tuán)(Springer Nature)、美國(guó)科學(xué)公共圖書館(PLOS)等的數(shù)據(jù)政策。國(guó)內(nèi)外學(xué)者大多通過調(diào)查一種或多種學(xué)科領(lǐng)域期刊的數(shù)據(jù)政策內(nèi)容以了解作為論文附件的數(shù)據(jù)出版情況:
一方面,對(duì)特定學(xué)科領(lǐng)域期刊的數(shù)據(jù)政策進(jìn)行研究。例如,Zenk-M?ltgen等[35]選取140種社會(huì)學(xué)期刊作為調(diào)研對(duì)象,調(diào)查發(fā)現(xiàn)較少期刊有明確的數(shù)據(jù)政策,大多數(shù)期刊參考其所屬出版商對(duì)科學(xué)數(shù)據(jù)的相關(guān)規(guī)定;陳秀娟、吳鳴[36]以美國(guó)化學(xué)學(xué)會(huì)出版的49種期刊為例,其中47種將科研數(shù)據(jù)作為支撐信息并對(duì)數(shù)據(jù)類型、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)獲取等加以規(guī)定;雷秋雨、馬建玲[37]從數(shù)據(jù)存繳方式、數(shù)據(jù)格式、存儲(chǔ)位置、數(shù)據(jù)質(zhì)量控制、開放性與權(quán)益等角度對(duì)JCR收錄的46種進(jìn)化生物學(xué)核心期刊的數(shù)據(jù)政策進(jìn)行分析。
另一方面,對(duì)多種學(xué)科領(lǐng)域的期刊數(shù)據(jù)政策進(jìn)行綜合研究。例如,Sturges等[38]調(diào)查分析了371種覆蓋自然科學(xué)與人文社會(huì)科學(xué)領(lǐng)域的期刊數(shù)據(jù)政策,從存儲(chǔ)內(nèi)容、存儲(chǔ)地點(diǎn)、存儲(chǔ)時(shí)間、共享期望四個(gè)方面總結(jié)數(shù)據(jù)政策的主要內(nèi)容,并為期刊數(shù)據(jù)政策設(shè)計(jì)了包含21個(gè)元素的框架模型;傅天珍、陳妙貞[39]調(diào)查發(fā)現(xiàn)我國(guó)學(xué)術(shù)期刊數(shù)據(jù)出版政策數(shù)量較少且以鼓勵(lì)性政策為主,政策學(xué)科分布不均衡并且政策內(nèi)容各異;吳蓉等[40]從數(shù)據(jù)提交政策、審查政策、權(quán)益政策三方面對(duì)PLOS的數(shù)據(jù)政策進(jìn)行調(diào)研分析。
數(shù)據(jù)論文(Data Paper)是一種新興的出版物形態(tài),與傳統(tǒng)學(xué)術(shù)論文最大的不同在于數(shù)據(jù)論文重點(diǎn)描述科學(xué)數(shù)據(jù)本身而不是描述基于科學(xué)假設(shè)和科學(xué)問題的研究結(jié)果[27],通常發(fā)表在專門的數(shù)據(jù)期刊(Data Journal)或綜合期刊的相關(guān)板塊。對(duì)數(shù)據(jù)論文的研究覆蓋其概念、要素、作用、類型、形式、結(jié)構(gòu)、同行評(píng)審、案例等議題及其綜述:
(1)數(shù)據(jù)論文概念與作用:數(shù)據(jù)論文是按照學(xué)術(shù)出版標(biāo)準(zhǔn)、以機(jī)構(gòu)化且人可讀的形式描述一個(gè)或一組特定數(shù)據(jù)集的元數(shù)據(jù)文檔[41]。作為可引用的期刊出版物,數(shù)據(jù)論文不僅揭示了數(shù)據(jù)的內(nèi)容、價(jià)值、功用等關(guān)鍵信息,還能為數(shù)據(jù)作者、出版商帶來相應(yīng)的學(xué)術(shù)認(rèn)可與聲譽(yù),同時(shí)在廣泛傳播的過程中進(jìn)一步引起學(xué)術(shù)界對(duì)科學(xué)數(shù)據(jù)的關(guān)注。完整的數(shù)據(jù)論文出版包括數(shù)據(jù)類型、發(fā)布時(shí)間、共享規(guī)范、作者聲譽(yù)、同行評(píng)審、錯(cuò)誤糾正等要素[27]。
(2)數(shù)據(jù)論文形式與內(nèi)容:數(shù)據(jù)論文形式與名稱多樣,如數(shù)據(jù)文章、數(shù)據(jù)集論文、數(shù)據(jù)原創(chuàng)文章、數(shù)據(jù)庫(kù)論文、數(shù)據(jù)注釋[42]、簡(jiǎn)要數(shù)據(jù)、數(shù)據(jù)說明[43]等;數(shù)據(jù)論文內(nèi)容應(yīng)盡可能詳細(xì)地描述數(shù)據(jù)集信息,即“是什么”“在哪里”“為什么”“怎么樣”“誰”(“4W1H”)等問題,具體包括數(shù)據(jù)來源、處理方法、覆蓋范圍、數(shù)據(jù)格式、數(shù)據(jù)內(nèi)容、數(shù)據(jù)質(zhì)量、數(shù)據(jù)重用、數(shù)據(jù)許可、作者貢獻(xiàn)等要素[14]。
(3)數(shù)據(jù)論文出版實(shí)踐案例與綜合議題:關(guān)于數(shù)據(jù)論文出版案例,如英國(guó)全國(guó)環(huán)境研究委員會(huì)(NERC)環(huán)境科學(xué)數(shù)據(jù)中心將對(duì)數(shù)據(jù)集的描述作為數(shù)據(jù)論文進(jìn)行出版,并為數(shù)據(jù)論文分配數(shù)字對(duì)象唯一標(biāo)識(shí)符(DOI)[14];關(guān)于數(shù)據(jù)論文出版綜合議題,如包括數(shù)據(jù)論文的概念及相關(guān)概念、出版流程、標(biāo)準(zhǔn)要求,研究者、出版商、研究與資助機(jī)構(gòu)等利益相關(guān)者及權(quán)益機(jī)制,同行評(píng)審方式與內(nèi)容等[43-44]。
在文獻(xiàn)收集與閱讀的基礎(chǔ)上,在對(duì)數(shù)據(jù)出版概念、作用及模式等基礎(chǔ)問題進(jìn)行綜述的過程中發(fā)現(xiàn),完整的數(shù)據(jù)出版具有復(fù)雜性,需要政策、標(biāo)準(zhǔn)、技術(shù)、平臺(tái)、工具、人員、資金等多個(gè)要素的協(xié)調(diào)與配合。如前所述,較之于一般的數(shù)據(jù)開放共享,數(shù)據(jù)出版有著“來源可靠”“質(zhì)量可信”“唯一標(biāo)識(shí)”“知識(shí)產(chǎn)權(quán)清晰”“可正式引用”等特點(diǎn),能夠在數(shù)據(jù)開放共享的基礎(chǔ)上進(jìn)一步規(guī)范數(shù)據(jù)引用、明確數(shù)據(jù)知識(shí)產(chǎn)權(quán)、減少數(shù)據(jù)共享障礙,從而提高研究者的數(shù)據(jù)共享意愿和數(shù)據(jù)重用價(jià)值。因此,從數(shù)據(jù)出版生命周期考慮,筆者認(rèn)為數(shù)據(jù)標(biāo)識(shí)、數(shù)據(jù)引用(數(shù)據(jù)知識(shí)產(chǎn)權(quán))、數(shù)據(jù)評(píng)審(數(shù)據(jù)質(zhì)量控制)等是使數(shù)據(jù)出版區(qū)別于一般數(shù)據(jù)共享的幾個(gè)關(guān)鍵問題,也是關(guān)乎數(shù)據(jù)出版可持續(xù)發(fā)展的熱點(diǎn)議題。
長(zhǎng)久以來,數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施的缺乏使得獨(dú)立出版和引用數(shù)據(jù)非常困難,因此科學(xué)數(shù)據(jù)也一直未曾得到和科學(xué)論文同等的學(xué)術(shù)認(rèn)可[45],數(shù)據(jù)標(biāo)識(shí)符在這樣的需求下應(yīng)運(yùn)而生。數(shù)字對(duì)象標(biāo)識(shí)符(Digital Object Identifier,DOI)、統(tǒng)一資源名稱(URN)、開放鏈接(OpenURL)、句柄系統(tǒng)(Handles)等是目前應(yīng)用較多的數(shù)字標(biāo)識(shí)符,其中尤以DOI的應(yīng)用和研究最為廣泛。
DOI是用于識(shí)別數(shù)字環(huán)境下對(duì)象的知識(shí)產(chǎn)權(quán)的字符串[46],自1998年成立且于2012年成為國(guó)際標(biāo)準(zhǔn)化組織(International Standard Organization,ISO)“信息與文獻(xiàn)”領(lǐng)域的一項(xiàng)標(biāo)準(zhǔn)以來,廣泛應(yīng)用于數(shù)字化圖書、期刊、數(shù)據(jù)等內(nèi)容類型的學(xué)術(shù)出版。DOI具有唯一且永久標(biāo)識(shí)、永久定位、出版源頭注冊(cè)、點(diǎn)擊即鏈接、動(dòng)態(tài)更新、版本更迭[47]等特點(diǎn),在科學(xué)數(shù)據(jù)出版中具有跟蹤、引用、集成、關(guān)聯(lián)等的多重價(jià)值,便于實(shí)現(xiàn)對(duì)數(shù)據(jù)出版物的原文獲取、引文鏈接、數(shù)字版權(quán)管理及永久標(biāo)識(shí)等功能,解決數(shù)據(jù)多重鏈接和知識(shí)產(chǎn)權(quán)問題[48]。
數(shù)據(jù)出版所需DOI由注冊(cè)代理機(jī)構(gòu)及其成員單位負(fù)責(zé)分配,目前共有覆蓋歐盟、中國(guó)、日本、韓國(guó)等地域范圍的10個(gè)代理機(jī)構(gòu)(截至2017年8月16日),如歐盟出版物辦公室(Publications Office of the European Union)、中國(guó)知網(wǎng)(CNKI)、韓國(guó)科技信息研究所(KISTI)、Crossref、DataCite[49]等。現(xiàn)有文獻(xiàn)大多聚焦于對(duì)DataCite進(jìn)行研究,如DataCite的發(fā)起者與發(fā)展歷史[50]、DataCite成員單位及其地域覆蓋[51]、DataCite數(shù)據(jù)出版元數(shù)據(jù)方案[52]等。
數(shù)據(jù)引用是數(shù)據(jù)出版的關(guān)鍵環(huán)節(jié)之一,是保障數(shù)據(jù)作者與管理者數(shù)據(jù)權(quán)益的一種有效方式,引起了廣泛的研究與關(guān)注。完整的數(shù)據(jù)引用涉及“如何引用”“引用什么”“何時(shí)引用”[25]等環(huán)節(jié),包含對(duì)數(shù)據(jù)引用標(biāo)準(zhǔn)、數(shù)據(jù)引用技術(shù)、數(shù)據(jù)引用行為等關(guān)鍵內(nèi)容的討論。
目前,國(guó)內(nèi)外研究數(shù)據(jù)引用尚無一致的標(biāo)準(zhǔn),不同的數(shù)據(jù)知識(shí)庫(kù)、數(shù)據(jù)論文通常有不同的數(shù)據(jù)引用標(biāo)準(zhǔn)并相應(yīng)推薦不同的數(shù)據(jù)引用格式。其中,哈佛大學(xué)定量社會(huì)研究中心的Micah Altman和Gary King提出的“定量數(shù)據(jù)學(xué)術(shù)引用的建議標(biāo)準(zhǔn)”(2007年)[53]、經(jīng)濟(jì)合作與發(fā)展組織(OECD)發(fā)布的白皮書“我們需要數(shù)據(jù)集和數(shù)據(jù)表的出版標(biāo)準(zhǔn)”(2009年)[54]、FORCE11(The Future of Research Communications and e-Scholarship)聯(lián)合其他多個(gè)數(shù)據(jù)引用工作組發(fā)布的“數(shù)據(jù)引用原則聯(lián)合聲明”(2014年)[55]、DataCite發(fā)布的“研究數(shù)據(jù)出版與引用元數(shù)據(jù)方案(3.1版本)”(2015年)[56]等是認(rèn)可度相對(duì)廣泛的標(biāo)準(zhǔn)和原則,在數(shù)據(jù)引用實(shí)踐中起到重要的參考和指導(dǎo)作用。
數(shù)據(jù)引用技術(shù)是實(shí)現(xiàn)數(shù)據(jù)規(guī)范引用的技術(shù)基礎(chǔ),前文所述的DOI便是目前實(shí)現(xiàn)數(shù)據(jù)引用而廣泛采用的一種技術(shù),另外數(shù)據(jù)指紋(Universal Numeric Fingerprints,UNF)也是數(shù)據(jù)引用的一種有效技術(shù)。其中,DOI所具有的唯一標(biāo)識(shí)、永久定位、動(dòng)態(tài)更新的特點(diǎn),一方面使得數(shù)據(jù)引用能夠?qū)崿F(xiàn)數(shù)據(jù)版本的動(dòng)態(tài)更迭、數(shù)據(jù)地址的動(dòng)態(tài)更新,不必頻繁更改地址便能實(shí)現(xiàn)“從一而終”的資源指示與數(shù)據(jù)引用;另一方面,DOI有助于維護(hù)數(shù)據(jù)創(chuàng)建者作為一項(xiàng)必不可少的元數(shù)據(jù)元素,保障作者數(shù)據(jù)署名權(quán)并承認(rèn)作者的貢獻(xiàn)。UNF是一種加密的數(shù)字簽名,可用于數(shù)據(jù)集及其子集(版本)的唯一標(biāo)識(shí),數(shù)據(jù)本身的元素不同UNF也不同,UNF可驗(yàn)證不同文獻(xiàn)是否引用了同一個(gè)數(shù)據(jù),也可與DOI一起使用形成對(duì)版本化數(shù)據(jù)集的持續(xù)引用[57]。
國(guó)內(nèi)外圖書情報(bào)機(jī)構(gòu)或數(shù)據(jù)中心已經(jīng)開始了數(shù)據(jù)引用的實(shí)踐,而學(xué)術(shù)界也開始了對(duì)數(shù)據(jù)引用行為的研究。對(duì)施引文獻(xiàn)及其作者而言,引用數(shù)據(jù)是為了說明數(shù)據(jù)來源并達(dá)到一定的學(xué)術(shù)規(guī)范,數(shù)據(jù)引用情況取決于數(shù)據(jù)用途和數(shù)據(jù)來源,數(shù)據(jù)用途即數(shù)據(jù)是否能夠解釋問題、數(shù)據(jù)是否有效支撐論文結(jié)果或結(jié)論、數(shù)據(jù)是否作為論文補(bǔ)充材料等,而數(shù)據(jù)來源指數(shù)據(jù)是否作為論文附件、數(shù)據(jù)是否存儲(chǔ)在數(shù)字倉(cāng)儲(chǔ)、數(shù)據(jù)是否以數(shù)據(jù)論文形式出版等。
從文獻(xiàn)研究現(xiàn)狀看,數(shù)據(jù)引用標(biāo)準(zhǔn)、數(shù)據(jù)引用技術(shù)和數(shù)據(jù)引用行為等話題是當(dāng)下數(shù)據(jù)出版領(lǐng)域的熱點(diǎn)話題,也是未來研究和實(shí)踐需要進(jìn)一步突破的難點(diǎn)問題。
數(shù)據(jù)評(píng)審是一種重要而有效的數(shù)據(jù)出版質(zhì)量控制方法,主要指采取必要措施對(duì)數(shù)據(jù)及文檔、代碼等相關(guān)文件進(jìn)行評(píng)估,確保文件可被獨(dú)立地理解以便重用的有效過程[58]。與學(xué)術(shù)論文出版過程中的同行評(píng)審環(huán)節(jié)相似,數(shù)據(jù)出版也將數(shù)據(jù)評(píng)審作為數(shù)據(jù)質(zhì)量控制的重要一環(huán);數(shù)據(jù)評(píng)審至今尚未有相對(duì)統(tǒng)一的程序,甚至數(shù)據(jù)能否被“評(píng)審”以及“數(shù)據(jù)評(píng)審”這一術(shù)語本身也存有疑問[59],但數(shù)據(jù)評(píng)審仍在研究和實(shí)踐中取得了一定的進(jìn)展[58]。完整的數(shù)據(jù)評(píng)審包含 “評(píng)審什么”“怎么評(píng)審”“誰來評(píng)審”等組成部分,涉及對(duì)數(shù)據(jù)評(píng)審內(nèi)容與維度、數(shù)據(jù)評(píng)審方法與程序、數(shù)據(jù)評(píng)審主體等話題及其綜合議題的探討。
結(jié)合對(duì)數(shù)據(jù)評(píng)審含義的理解,數(shù)據(jù)評(píng)審包含較為廣泛的內(nèi)容范疇及評(píng)估流程,是一項(xiàng)復(fù)雜的活動(dòng),如從數(shù)據(jù)計(jì)算與分析結(jié)果的準(zhǔn)確性的雙盲評(píng)審、數(shù)據(jù)文件與文檔的充分性的同行評(píng)審到元數(shù)據(jù)的準(zhǔn)確性的技術(shù)性審查[60]。數(shù)據(jù)評(píng)審以數(shù)據(jù)質(zhì)量及其標(biāo)準(zhǔn)為依據(jù),數(shù)據(jù)評(píng)審內(nèi)容包括研究計(jì)劃評(píng)審、數(shù)據(jù)管理計(jì)劃評(píng)審、元數(shù)據(jù)評(píng)審、數(shù)據(jù)附件評(píng)審、數(shù)據(jù)知識(shí)庫(kù)數(shù)據(jù)評(píng)審、數(shù)據(jù)論文評(píng)審等,這些內(nèi)容可以歸納為“數(shù)據(jù)內(nèi)容”“數(shù)據(jù)形式與元數(shù)據(jù)”“語境信息和/或其他相關(guān)文檔”三個(gè)類別[14],分別對(duì)應(yīng)科學(xué)性評(píng)審(Scientific Review)、技術(shù)性評(píng)審(Technical Review)和監(jiān)護(hù)性評(píng)審(Curatorial Review)三個(gè)維度[60],但在數(shù)據(jù)出版實(shí)踐中數(shù)據(jù)評(píng)審?fù)ǔH诤狭巳齻€(gè)維度的內(nèi)容與方法,并對(duì)數(shù)據(jù)進(jìn)行綜合的評(píng)審和全面的質(zhì)量控制。
其中,科學(xué)性評(píng)審是對(duì)數(shù)據(jù)內(nèi)容的各類科學(xué)性特征進(jìn)行評(píng)審,以保障數(shù)據(jù)的科學(xué)性質(zhì)量(Scientific Quality),表現(xiàn)為完整性、真實(shí)性、準(zhǔn)確性、可靠性、有用性等特征,通常由同行專家或高級(jí)編輯進(jìn)行評(píng)審。技術(shù)性評(píng)審是對(duì)數(shù)據(jù)形式及元數(shù)據(jù)相關(guān)的各類技術(shù)性特點(diǎn)與細(xì)節(jié)進(jìn)行評(píng)審,以保證數(shù)據(jù)的技術(shù)性質(zhì)量(Technical Quality),表現(xiàn)為數(shù)據(jù)格式的標(biāo)準(zhǔn)化、兼容性及元數(shù)據(jù)的完整性、準(zhǔn)確性、真實(shí)性等特征,一般而言論文中的數(shù)據(jù)由編輯或同行專家進(jìn)行評(píng)審,而存入到數(shù)據(jù)庫(kù)的數(shù)據(jù)(集)由學(xué)科領(lǐng)域內(nèi)的數(shù)據(jù)專家或?qū)iT數(shù)據(jù)管理人員進(jìn)行評(píng)審。審監(jiān)護(hù)性評(píng)審是對(duì)數(shù)據(jù)內(nèi)容、數(shù)據(jù)格式、元數(shù)據(jù)以外的上下文/語境信息、數(shù)據(jù)相關(guān)文檔、代碼等進(jìn)行管理性的檢查和審核,評(píng)審內(nèi)容及其標(biāo)準(zhǔn)包括但不限于文檔的相關(guān)性、充分性,數(shù)據(jù)來源、數(shù)據(jù)環(huán)境、數(shù)據(jù)收集/處理/分析方法等文檔的完備性,文檔版本控制及相關(guān)文檔信息更迭的及時(shí)性,數(shù)據(jù)與其他文檔關(guān)系的協(xié)調(diào)性(如對(duì)相關(guān)政策、標(biāo)準(zhǔn)的遵循)等。
當(dāng)然,數(shù)據(jù)標(biāo)識(shí)、數(shù)據(jù)引用、數(shù)據(jù)評(píng)審領(lǐng)域的研究與實(shí)踐都已經(jīng)進(jìn)行,但作為數(shù)據(jù)出版的關(guān)鍵問題與熱點(diǎn)議題,對(duì)數(shù)據(jù)標(biāo)識(shí)、數(shù)據(jù)引用、數(shù)據(jù)評(píng)審的探索研究在可預(yù)見的未來還將繼續(xù)深入而廣泛地進(jìn)行。
盡管數(shù)據(jù)出版研究已經(jīng)較為全面地展開,而數(shù)據(jù)出版實(shí)踐也已經(jīng)在國(guó)內(nèi)外大范圍內(nèi)進(jìn)行,但作為學(xué)術(shù)交流、傳播與出版領(lǐng)域相對(duì)新興的議題,數(shù)據(jù)出版在標(biāo)準(zhǔn)、規(guī)范、技術(shù)、政策、機(jī)制等方面仍存在不少困難和問題需要克服。例如,Hense和Quadt[61]認(rèn)為數(shù)據(jù)出版面臨的挑戰(zhàn)存在于格式、內(nèi)容、科學(xué)質(zhì)量控制、格式質(zhì)量控制、技術(shù)質(zhì)量控制、瀏覽與檢索、存儲(chǔ)等多方面;張小強(qiáng)、李欣[13]認(rèn)為當(dāng)前數(shù)據(jù)出版的主要障礙是倫理規(guī)范與標(biāo)準(zhǔn)的缺失,包括數(shù)據(jù)出版體系中獎(jiǎng)懲功能的缺失、數(shù)據(jù)出版復(fù)雜性導(dǎo)致的短期內(nèi)標(biāo)準(zhǔn)規(guī)范的缺失,數(shù)據(jù)出版用稿規(guī)范、數(shù)據(jù)引用規(guī)范、元數(shù)據(jù)標(biāo)準(zhǔn)等的不完善;何琳、常穎聰[26]認(rèn)為科學(xué)數(shù)據(jù)的元數(shù)據(jù)、隱私保護(hù)、組織技術(shù)、知識(shí)產(chǎn)權(quán)保護(hù)、出版激勵(lì)機(jī)制是數(shù)據(jù)出版待解決的關(guān)鍵問題;張麗麗[62]認(rèn)為,相較于傳統(tǒng)學(xué)術(shù)出版,數(shù)據(jù)出版的學(xué)術(shù)地位和行業(yè)認(rèn)可度、運(yùn)營(yíng)模式的可持續(xù)性、數(shù)據(jù)開放與版權(quán)保護(hù)等方面仍有待發(fā)展。
綜合而言,國(guó)外數(shù)據(jù)出版理論研究與實(shí)踐工作齊頭并進(jìn),國(guó)內(nèi)相關(guān)研究經(jīng)歷了翻譯推介、案例分析、原創(chuàng)性思考探索等漸進(jìn)過程,研究先于實(shí)踐而進(jìn)行但目前已經(jīng)開始了數(shù)據(jù)出版的實(shí)踐探索。具體而言,近年來國(guó)內(nèi)外科學(xué)數(shù)據(jù)開放出版研究呈現(xiàn)以下特點(diǎn):
首先,概念理解與辨析是基本問題,對(duì)數(shù)據(jù)出版概念及其相關(guān)概念的理解與辨析是研究數(shù)據(jù)出版的首要基本問題,也是突出數(shù)據(jù)出版作用的必要支撐條件。其次,不同出版模式的劃分、對(duì)比是研究重點(diǎn),大部分研究都對(duì)數(shù)據(jù)出版模式進(jìn)行劃分和比較以便盡可能全面而清晰地呈現(xiàn)數(shù)據(jù)出版的真實(shí)形態(tài),同時(shí)也便于分門別類地對(duì)數(shù)據(jù)出版相關(guān)的其他問題進(jìn)行闡述。最后,對(duì)數(shù)據(jù)創(chuàng)建者、管理者、使用者對(duì)數(shù)據(jù)出版的認(rèn)知、態(tài)度與需求等進(jìn)行調(diào)查有其必要性,也可作為數(shù)據(jù)出版實(shí)踐方向的一種事實(shí)依據(jù)和導(dǎo)向。再者,數(shù)據(jù)出版相關(guān)標(biāo)準(zhǔn)、規(guī)范的缺失或不完善是急需研究和亟待解決的問題:數(shù)據(jù)出版需盡可能達(dá)到數(shù)據(jù)格式、數(shù)據(jù)類型、數(shù)據(jù)倫理等標(biāo)準(zhǔn)規(guī)范的統(tǒng)一或兼容,標(biāo)準(zhǔn)、規(guī)范是目前較為薄弱的環(huán)節(jié),也是需要克服的問題與困難。
綜上所述,筆者認(rèn)為未來可能的研究趨勢(shì)與展望包括:第一,由于目前數(shù)據(jù)出版領(lǐng)域存在的標(biāo)準(zhǔn)、規(guī)范、技術(shù)等的不完善問題,數(shù)據(jù)出版標(biāo)準(zhǔn)、規(guī)范及其技術(shù)實(shí)現(xiàn)將成為未來研究與實(shí)踐的一大重點(diǎn);第二,在大數(shù)據(jù)時(shí)代背景下,隨著科學(xué)數(shù)據(jù)開放廣度與深度的發(fā)展,數(shù)據(jù)數(shù)量呈倍數(shù)增長(zhǎng)使得數(shù)據(jù)質(zhì)量控制的重要性日益凸顯,數(shù)據(jù)質(zhì)量控制是未來可能的又一研究重點(diǎn);第三,目前研究與實(shí)踐中存在的局限也意味著國(guó)內(nèi)外圖書情報(bào)機(jī)構(gòu)在數(shù)據(jù)出版標(biāo)準(zhǔn)、規(guī)范的制定與實(shí)施及數(shù)據(jù)質(zhì)量控制等方面有較大的發(fā)揮空間和發(fā)展機(jī)會(huì)。
(來稿時(shí)間:2017年9月)
1.European Commission.Horizon 2020[EB/OL].[2017-01-01].http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf.
2.OPEN RESEARCH DATA IN HORIZON 2020[EB/OL].[2017-01-01].http://ec.europa.eu/research/press/2016/pdf/opendata-infographic_072016.pdf#view=fit&pagemode=none.
3.Open Access at the Max Planck Society.Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities[EB/OL].[2017-06-20].https://openaccess.mpg.de/Berlin-Declaration.
4.IFLA.IFLA Statement on Open Access to Scholarly Literature and Research Documentation[EB/OL].[2017-06-20].http://www.ifla.org/publications/ifla-statement-on-open-accessto-scholarly-literature-and-research-documentation.
5.IFLA.IFLA Statement on open access-clarifying IFLA’s position and strategy[EB/OL].[2017-06-20].http://www.ifla.org/files/assets/hq/news/documents/ifla-statement-on-open-access.pdf.
6.UNESCO.Policy Guidelines for the Development and Promotion of Open Access[EB/OL].[2017-06-20].http://unesdoc.unesco.org/images/0021/002158/215863e.pdf.
7.European Commission.Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020[EB/OL].[2017-06-21].http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf.
8.NIH.Final NIH Statement on Sharing Research Data[EB/OL].[2017-06-21].https://grants.nih.gov/grants/guide/notice-files/NOT-OD-03-032.html.
9.OECD.OECD Principles and Guidelines for Access to Research Data from Public Funding[EB/OL].[2017-06-21].http://www.oecd.org/science/sci-tech/38500813.pdf.
10.NSF.NSF’S Public Access Plan: Today’s Data, Tomorrow’s Discoveries[EB/OL].[2017-06-22].https://www.nsf.gov/pubs/2015/nsf15052/nsf15052.pdf.
11.University of Cambridge.Research Data Management Policy Framework[EB/OL].[2017-06-22].http://www.data.cam.ac.uk/university-policy.
12.The University of Hong Kong.Research Data and Records Management[EB/OL].[2017-06-22].http://www.rss.hku.hk/integrity/research-data-records-management.
13.張小強(qiáng),李欣.數(shù)據(jù)出版理論與實(shí)踐關(guān)鍵問題[J].中國(guó)科技期刊研究,2015,26(8):813-821.
14.Callaghan S, Donegan S, Pepler S, et al.Making Data a First Class Scientific Output: Data Citation and Publication by NERC’s Environmental Data Centres[J].International Journal of Digital Curation, 2012, 7(1):107-113.
15.Penev L, Chavan V, Hagedorn G, et al.Pensoft Data Publishing Policies and Guidelines for Biodiversity Data[EB/OL].[2017-08-02].http://pensoft.net/J_FILES/Pensoft_Data_Publishing_Policies_and_Guidelines.pdf.
16.吳立宗,王亮緒,南卓銅,等.科學(xué)數(shù)據(jù)出版現(xiàn)狀及其體系框架[J].遙感技術(shù)與應(yīng)用,2013,28(3):383-390.
17.劉鳳紅,崔金鐘,韓芳橋,等.數(shù)據(jù)論文:大數(shù)據(jù)時(shí)代新興學(xué)術(shù)論文出版類型探討[J].中國(guó)科技期刊研究,2014,25(12):1451-1456.
18.Murphy F.Transforming Research Communication:Knowledge Management and Data Publishing[EB/OL].[2017-01-09].https://ams.confex.com/ams/93Annual/webprogram/Paper217112.html.
19.Borgman C L.Data, disciplines, and scholarly publishing[J].Learned Publishing, 2008, 21(1):29-38.
20.袁曦臨.E-science環(huán)境下學(xué)術(shù)規(guī)范的新領(lǐng)域:科學(xué)數(shù)據(jù)[J].甘肅社會(huì)科學(xué),2014(3):85-88.
21.孔麗華.科學(xué)數(shù)據(jù)質(zhì)量同行評(píng)議現(xiàn)狀[R/OL]//2015中國(guó)開放獲取推介周.[2017-08-14].http://ir.las.ac.cn/handle/12502/7968.
22.張靜蓓, 任樹懷.科研數(shù)據(jù)出版模式、流程及引用策略研究[J].圖書情報(bào)工作, 2015(9):21-27.
23.Lawrence B, Jones C, Matthews B, et al.Citation and Peer Review of Data: Moving Towards Formal Data Publication [J].International Journal of Digital Curation, 2011, 6(2):4-37.
24.王丹丹.科學(xué)數(shù)據(jù)出版過程中的數(shù)據(jù)質(zhì)量控制[J].圖書情報(bào)工作,2015(23):124-129.
25.顧立平.科學(xué)數(shù)據(jù)權(quán)益分析的基本框架[J].圖書情報(bào)知識(shí), 2014(1):34-51.
26.何琳,常穎聰.國(guó)內(nèi)外科學(xué)數(shù)據(jù)出版研究進(jìn)展[J].圖書情報(bào)工作,2014,58(5):104-110.
27.王丹丹.數(shù)據(jù)論文:數(shù)據(jù)集獨(dú)立出版與共享模式研究[J].情報(bào)資料工作, 2015, 36(5):94-97.
28.梁子裕.國(guó)外科研數(shù)據(jù)出版模式研究[J].出版發(fā)行研究, 2017(3):82-85.
29.張麗麗,黎建輝.科研數(shù)據(jù)的開放:進(jìn)展、模式與新探索 [J].大數(shù)據(jù),2016, 2(6):25-33.
30.Research Data Canada.Data repository[EB/OL].[2017-08-14].https://www.rdc-drc.ca/glossary/original-rdc-glossary/.
31.Aalbersberg I J, Dunham J, Koers H.Connecting Scientific Articles with Research Data: New Directions in Online Scholarly Publishing[J].Data Science Journal, 2013(12):235-242.
32.Candela L, Assante M, Tani A, et al.Are Scientific Data Repositories Coping with Research Data Publishing?[J].Data Science Journal, 2016, 15(6):1-24.
33.黃永文,張建勇,黃金霞,等.國(guó)外開放科學(xué)數(shù)據(jù)研究綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2013(5):21-27.
34.朱玲,聶華,崔海媛,等.北京大學(xué)開放研究數(shù)據(jù)平臺(tái)建設(shè):探索與實(shí)踐[J].圖書情報(bào)工作,2016,60(4):44-51.
35.Zenk-M?ltgen W, Lepthien G.Data sharing in sociology journals[J].Online Information Review, 2014, 38(6):709-722.
36.陳秀娟,吳鳴.學(xué)科領(lǐng)域期刊科研數(shù)據(jù)發(fā)表政策剖析——以美國(guó)化學(xué)學(xué)會(huì)期刊為例[J].中國(guó)科技期刊研究,2015, 26(8):800-807.
37.雷秋雨,馬建玲.學(xué)術(shù)期刊數(shù)據(jù)出版政策研究綜述——以JCR中進(jìn)化生物學(xué)領(lǐng)域期刊為例[J].圖書館理論與實(shí)踐,2016(1):30-34.
38.Sturges P, Bamkin M, Anders, Jane H.S, et al.Research data sharing: Developing a stakeholder-driven model for journal policies[J].Journal of the Association for Information Science &Technology, 2016, 66(12):2445-2455.
39.傅天珍,陳妙貞.我國(guó)學(xué)術(shù)期刊數(shù)據(jù)出版政策分析及建議[J].中國(guó)出版,2014(23):31-34.
40.吳蓉,顧立平,劉晶晶.國(guó)外學(xué)術(shù)期刊數(shù)據(jù)政策的調(diào)研與分析[J].圖書情報(bào)工作,2015, 59(7):99-105.
41.Chavan V, Penev L.The data paper: a mechanism to incentivize data publishing in biodiversity science[J].BMC Bioinformatics, 2011, 12(15):2399-2405.
42.屈寶強(qiáng),王凱.數(shù)據(jù)論文的出現(xiàn)與發(fā)展[J].圖書與情報(bào),2015(5):1-8.
43.劉傳璽.數(shù)據(jù)論文概念辨析及其同行評(píng)審研究[J].圖書館雜志,2016(9):76-80, 93.
44.伏安娜,張計(jì)龍,殷沈琴.數(shù)據(jù)論文國(guó)內(nèi)外發(fā)展研究綜述[J].圖書情報(bào)工作,2015(24):131-138.
45.Neumann J, Brase J.DataCite and DOI names for research data[J].Journal of Computer-Aided Molecular Design, 2014, 28(10):1035-1041.
46.Chandrakar R.Digital object identifier system: an overview[J].The Electronic Library, 2006, 24(4):445-452.
47.涂勇,彭潔.數(shù)字對(duì)象唯一標(biāo)識(shí)在中國(guó)科學(xué)數(shù)據(jù)領(lǐng)域中的應(yīng)用研究[J].數(shù)字圖書館論壇,2013(8):31-36.
48.吳立宗, 王亮緒, 南卓銅,等.DOI在數(shù)據(jù)引用中的應(yīng)用:問題與建議[J].遙感技術(shù)與應(yīng)用, 2013, 28(3):377-382.
49.DOI Registration Agencies[EB/OL].[2017-08-16].http://www.doi.org/registration_agencies.html.
50.Brase J, Lautenschlager M, Sens I.The Tenth Anniversary of Assigning DOI Names to Scientific Data and a Five Year History of DataCite[J].D-Lib Magazine, 2015.
51.Loesch F M.DataCite[J].Technical Services Quarterly,2016(33):91-92.
52.Starr J, Ammann N, Ashton J, et al.DataCite Metadata Schema for the Publication and Citation of Research Data[EB/OL].[2017-08-16].http://schema.datacite.org/meta/kernel-2.2/doc/DataCite-MetadataKernel_v2.2.pdf.
53.Micah Altman, Gary King.A Proposed Standard for the Scholarly Citation of Quantitative Data [EB/OL].[2017-09-18].http://www.dlib.org/dlib/march07/altman/03altman.html.
54.Green T.We Need Publishing Standards for Datasets and Data Tables [EB/OL].[2017-09-13].http://www.unece.org/fileadmin/DAM/stats/documents/ece/ces/ge.40/2010/wp.8.e.pdf.
55.Data Citation Synthesis Group.Joint Declaration of Data Citation Principles[EB/OL].[2017-04-18].https://www.force11.org/group/joint-declaration-data-citation-principles-final.
56.DataCite Metadata Working Group.DataCite Metadata Schema for the Publication and Citation of Research Data[EB/OL].[2017-09-18].http://schema.datacite.org/meta/kernel-3/doc/DataCite-MetadataKernel_v3.1.pdf.
57.Thomas Leeper, Micah Altman.UNF: Tools for Creating Universal Numeric Fingerprints for data[EB/OL].[2017-09-20].https://cran.r-project.org/web/packages/UNF/index.html.
58.Peer L, Green A.Research Data Review is Gaining Ground[EB/OL].[2017-08-12].http://isps.yale.edu/news/blog/2015/03/ research-data-review-is-gaining-ground.
59.Shaklee P, Cousijn H.Can data be peer-reviewed?[EB/OL].[2017-08-12].https://www.elsevier.com/connect/can-data-bepeer-reviewed.
60.Austin C C, Bloom T, Dallmeier-Tiessen S, et al.Key components of data publishing: using current best practices to develop a reference model for data publishing [J].International Journal on Digital Libraries, 2010:1-16.
61.Hense A, Quadt F.Acquiring High Quality Research Data[J].D-Lib Magazine, 2011, 17(1-2):1-7.
62.張麗麗.科學(xué)數(shù)據(jù)共享治理:模式選擇與情景分析[J].中國(guó)圖書館學(xué)報(bào),2017, 43(2):54-65.