田稷,陳琿夏
?
數(shù)據(jù)期刊及數(shù)據(jù)論文定量分析與思考
田稷,陳琿夏
摘要文章在比較數(shù)據(jù)期刊、數(shù)據(jù)論文與傳統(tǒng)學(xué)術(shù)期刊、學(xué)術(shù)論文異同的基礎(chǔ)上,定量分析當(dāng)前幾種具有代表性數(shù)據(jù)期刊及數(shù)據(jù)論文情況,并對(duì)高校圖書(shū)館的相關(guān)工作提出建議。
關(guān)鍵詞數(shù)據(jù)數(shù)據(jù)期刊數(shù)據(jù)論文
引用本文格式田稷,陳琿夏.數(shù)據(jù)期刊及數(shù)據(jù)論文定量分析與思考[J].圖書(shū)館論壇,2016(3):42- 48.
Quantitative Analysis and Study on Data Journal and Data Paper
TIAN Ji,CHEN Hui- xia
Abstract Comparing the similarities and differences between data journals,data papers and traditional academic journals and academic papers,this paper analyzes quantitatively the current situation of the data papers from several representative data journals,and puts forward some suggestions on the relevant work of university libraries. Keywords data;data journal;data paper
大數(shù)據(jù)時(shí)代的來(lái)臨促成了以數(shù)據(jù)密集型計(jì)算為基礎(chǔ)的科學(xué)研究第四范式[1]的誕生。新范式下的學(xué)術(shù)研究與交流需要相關(guān)的科學(xué)數(shù)據(jù)和文獻(xiàn)實(shí)現(xiàn)互操作,讓人們閱讀論文的同時(shí)還可以找到論文的原始數(shù)據(jù),重復(fù)作者所做的實(shí)驗(yàn)與分析,或者能夠從數(shù)據(jù)出發(fā)找到與其相關(guān)文獻(xiàn)。在此環(huán)境下,科學(xué)研究不再單純地由科學(xué)問(wèn)題或假設(shè)驅(qū)動(dòng),科學(xué)數(shù)據(jù)本身成為重要的研究對(duì)象,數(shù)據(jù)共享問(wèn)題引起廣泛關(guān)注。
谷歌的Peter Norvig曾說(shuō),科學(xué)是收集事實(shí)和發(fā)展理論的結(jié)合。在科學(xué)研究過(guò)程中,廣大科研人員在收集事實(shí)數(shù)據(jù)方面投入了大量的時(shí)間、精力與經(jīng)費(fèi),他們不僅希望能收集、研究、歸檔產(chǎn)生的數(shù)據(jù),還希望能合法地使用他人產(chǎn)生的數(shù)據(jù),特別是支撐關(guān)鍵發(fā)現(xiàn)的數(shù)據(jù)。之前,機(jī)構(gòu)知識(shí)庫(kù)、科學(xué)數(shù)據(jù)管理平臺(tái)等陸續(xù)出現(xiàn),數(shù)據(jù)的歸檔和檢索有了許多解決方案,但科學(xué)數(shù)據(jù)推廣利用的深度、廣度和速度遠(yuǎn)遠(yuǎn)不能滿足新的科研范式的需求。在此背景下,Nature、Wiley等相繼推出了以在線方式發(fā)行的數(shù)據(jù)期刊,專門(mén)刊載符合相關(guān)學(xué)術(shù)規(guī)范的數(shù)據(jù)論文,但目前這一發(fā)行和發(fā)文方式對(duì)國(guó)內(nèi)大多數(shù)科研人員和圖書(shū)館館員來(lái)說(shuō)是一個(gè)相對(duì)陌生的事物。本文在比較數(shù)據(jù)期刊、數(shù)據(jù)論文與傳統(tǒng)學(xué)術(shù)期刊、學(xué)術(shù)論文異同的基礎(chǔ)上,定量分析目前幾個(gè)主要的數(shù)據(jù)期刊及數(shù)據(jù)論文情況,并對(duì)高校圖書(shū)館的相關(guān)工作提出一些建議,以期讓更多的國(guó)內(nèi)科研人員和同行了解并利用。
傳統(tǒng)的學(xué)術(shù)論文是某一學(xué)術(shù)課題在實(shí)驗(yàn)性、理論性或預(yù)測(cè)性上具有新的科學(xué)研究成果或創(chuàng)新見(jiàn)解和知識(shí)的科學(xué)記錄,或是某種已知原理應(yīng)用于實(shí)踐上取得新進(jìn)展的科學(xué)總結(jié),用以提供學(xué)術(shù)會(huì)議上宣讀、交流、討論或?qū)W術(shù)刊物上發(fā)表,或用作其他用途的書(shū)面文件。數(shù)據(jù)論文則是一種特殊類型的學(xué)術(shù)論文,用于展示研究相關(guān)的關(guān)鍵數(shù)據(jù)集,包括描述數(shù)據(jù)內(nèi)容、數(shù)據(jù)產(chǎn)生背景、數(shù)據(jù)質(zhì)量和結(jié)構(gòu)的元數(shù)據(jù)文件。它遵從學(xué)術(shù)發(fā)表規(guī)范,接受?chē)?yán)格的同行評(píng)議,也是一種正式的學(xué)術(shù)論文,其引用也可以被用于科研評(píng)價(jià)體系,從而激勵(lì)科學(xué)家更多地分享科研數(shù)據(jù)。數(shù)據(jù)論文與其描述的公開(kāi)發(fā)布的數(shù)據(jù)相鏈接,這個(gè)鏈接包含在文章內(nèi)部,它是對(duì)在線數(shù)據(jù)集或一組數(shù)據(jù)集進(jìn)行描述的元數(shù)據(jù)文檔,遵循一定的數(shù)據(jù)標(biāo)準(zhǔn),計(jì)算機(jī)可讀、可檢索[2]。數(shù)據(jù)論文與傳統(tǒng)學(xué)術(shù)論文在內(nèi)容上最大的區(qū)別在于它并不重點(diǎn)報(bào)道基于科學(xué)假設(shè)和科學(xué)問(wèn)題的研究結(jié)果,而是重點(diǎn)描述科學(xué)數(shù)據(jù)本身。數(shù)據(jù)論文在形式上一般包括摘要、背景介紹、數(shù)據(jù)方法、數(shù)據(jù)集、數(shù)據(jù)說(shuō)明、附加信息六大塊內(nèi)容。與傳統(tǒng)學(xué)術(shù)論文在形式上最大的不同在于其包括數(shù)據(jù)方法、指向數(shù)據(jù)集的鏈接及相關(guān)的數(shù)據(jù)集。
傳統(tǒng)的學(xué)術(shù)期刊產(chǎn)生至今已有340多年的歷史,充分發(fā)揮了刊載科研成果、開(kāi)展學(xué)術(shù)交流、培養(yǎng)學(xué)術(shù)人才、促進(jìn)知識(shí)積累與創(chuàng)新的重要作用。學(xué)術(shù)期刊是一種經(jīng)過(guò)同行評(píng)審的期刊,發(fā)表在學(xué)術(shù)期刊上的文章通常涉及特定的學(xué)科,它展示了研究領(lǐng)域的成果,并起到了公示的作用,其內(nèi)容主要以原創(chuàng)研究、綜述文章、書(shū)評(píng)等形式的文獻(xiàn)為主[3]。學(xué)術(shù)期刊的產(chǎn)生與一定的經(jīng)濟(jì)、政治、科技、文化的發(fā)展有關(guān),也與人們對(duì)學(xué)術(shù)信息的需求息息相關(guān)。數(shù)據(jù)期刊的產(chǎn)生也是信息需求發(fā)展的結(jié)果,是主要發(fā)表數(shù)據(jù)論文的期刊,是互聯(lián)網(wǎng)和大數(shù)據(jù)環(huán)境下產(chǎn)生的一種新型的期刊出版模式。與傳統(tǒng)學(xué)術(shù)期刊相同的是,它也是一種學(xué)術(shù)期刊,有著學(xué)術(shù)期刊屬性,也有同行評(píng)議、公開(kāi)發(fā)表,也會(huì)被相關(guān)的數(shù)據(jù)庫(kù)收錄,其上發(fā)表的文章也會(huì)被他人引用等。但與傳統(tǒng)學(xué)術(shù)期刊不同的是:在內(nèi)容上,數(shù)據(jù)期刊主要描述科學(xué)實(shí)驗(yàn)數(shù)據(jù)和觀察數(shù)據(jù),并進(jìn)行有效整合,力求在最大程度上促進(jìn)數(shù)據(jù)重用,幫助用戶了解和使用相關(guān)數(shù)據(jù);在形式上,傳統(tǒng)的學(xué)術(shù)期刊本身就包括文獻(xiàn)所有內(nèi)容,而數(shù)據(jù)期刊的原始數(shù)據(jù)則大多存儲(chǔ)在另外的數(shù)據(jù)平臺(tái),數(shù)據(jù)論文本身總是與其公開(kāi)發(fā)布的數(shù)據(jù)集連接(通過(guò)URL或DOI)。
2.1代表性數(shù)據(jù)期刊概述
正式的數(shù)據(jù)期刊與數(shù)據(jù)論文出現(xiàn)至今不過(guò)3年時(shí)間,但已引起了廣泛關(guān)注,已有學(xué)者陸續(xù)在數(shù)據(jù)期刊上發(fā)表論文,并產(chǎn)生了引用。本文選取3種具有代表性的數(shù)據(jù)期刊,對(duì)其所刊登的數(shù)據(jù)論文進(jìn)行定量分析。3種代表性的數(shù)據(jù)期刊分別是由Nature出版集團(tuán)出版的Scientific Data(SD)、由Wiley出版集團(tuán)出版的Geoscience Data Journal (GDJ)和由Pensoft出版社出版的Biodiversity Data Journal(BDJ)。
Nature出版集團(tuán)是集紙本和電子出版為一體的科學(xué)和醫(yī)學(xué)信息的出版公司,旗下有多種高影響力期刊,如《科學(xué)美國(guó)人》《自然神經(jīng)科學(xué)》《自然生物學(xué)技術(shù)》等,其中最為著名的便是《自然》。Nature出版集團(tuán)于2013年4月公布其將在2014年春發(fā)行數(shù)據(jù)期刊Scientific Data,以最大化地重用、搜索、鏈接和挖掘數(shù)據(jù)[4]。Scientific Data(在線ISSN:2052- 4463)是一種開(kāi)放獲取、在線出版、同行評(píng)議的期刊,刊登自然科學(xué)學(xué)科相關(guān)論文,但不限定特定領(lǐng)域。篩選論文的六個(gè)關(guān)鍵原則為信用(Credit)、重用(Reuse)、質(zhì)量(Quality)、發(fā)現(xiàn)(Discovery)、開(kāi)放(Open)和服務(wù)(Service)。該刊設(shè)有在線投稿和追蹤系統(tǒng);發(fā)表數(shù)據(jù)論文時(shí),作者需支付一定費(fèi)用。Scientific Data遵循知識(shí)共享署名許可協(xié)議(Creative Commons Licence),以促進(jìn)科學(xué)數(shù)據(jù)的開(kāi)放獲取[5]。
John Wiley & Sons,Inc. (Wiley)創(chuàng)建于1807年,是一家全球?qū)W術(shù)出版公司,涉及科學(xué)、技術(shù)、醫(yī)學(xué)等領(lǐng)域,并在各專業(yè)領(lǐng)域與800余家學(xué)會(huì)開(kāi)展了合作[6]。Wiley在2014年6月出版第一期Geoscience Data Journal (在線ISSN:2049- 6060),是一種開(kāi)放獲取、同行評(píng)議的期刊,主要針對(duì)地球科學(xué)領(lǐng)域。該刊遵照知識(shí)共享署名許可協(xié)議(the Creative Commons Attribution License(CC- BY)),所刊登的數(shù)據(jù)論文描述相關(guān)數(shù)據(jù)集合的收集、處理過(guò)程及數(shù)據(jù)文件的格式,并給出相關(guān)數(shù)據(jù)集合的鏈接,但不涉及任何數(shù)據(jù)集合的科學(xué)分析或從數(shù)據(jù)中獲得任何結(jié)論。發(fā)表論文時(shí),作者需支付一定的費(fèi)用[7]。
Pensoft出版公司1992年成立于保加利亞,是一家獨(dú)立的學(xué)術(shù)出版公司,最初專注于圖書(shū)出版,目前已發(fā)展成為一家開(kāi)放存取雜志出版商,在生物多樣性領(lǐng)域出版多種開(kāi)放存取期刊,如ZooKeys、Biodiversity Data Journal(BDJ)、phytokeys、mycokeys等[8]。Biodiversity Data Journal(在線ISSN:1314- 2828)于2013年9月16日正式上線,它也是一種同行評(píng)議、開(kāi)放獲取的刊物,目前已被Medline數(shù)據(jù)庫(kù)收錄。它針對(duì)生物多樣性學(xué)科,遵照知識(shí)共享署名許可協(xié)議(Creative Commons Attribution License(CCBY4.0)),在恰當(dāng)引用的情況下,任何人都可以復(fù)制、傳播、利用文章。BDJ發(fā)表標(biāo)準(zhǔn)為獨(dú)創(chuàng)性、數(shù)據(jù)完整發(fā)布(數(shù)據(jù)論文所有的支持?jǐn)?shù)據(jù)必須公開(kāi)發(fā)表)、論文結(jié)構(gòu)、前期研究(是否完整準(zhǔn)確引用)以及發(fā)表數(shù)據(jù)的機(jī)器可讀性等。BDJ的網(wǎng)上投稿系統(tǒng)集成了投稿、同行評(píng)議、發(fā)表、傳播的整個(gè)流程。目前作者在BDJ上發(fā)表論文是免費(fèi)的[9]。
不同數(shù)據(jù)期刊的數(shù)據(jù)論文內(nèi)容編排略有不同,詳見(jiàn)表1。
高科學(xué)價(jià)值的數(shù)據(jù)集是數(shù)據(jù)論文的核心所在,每一篇數(shù)據(jù)論文的發(fā)表前提是數(shù)據(jù)集必須向公眾公開(kāi),數(shù)據(jù)論文僅提供數(shù)據(jù)集的鏈接。由于數(shù)據(jù)期刊自身并不持有相關(guān)數(shù)據(jù),因此作者需要將數(shù)據(jù)論文完整的數(shù)據(jù)集保存在一個(gè)或多個(gè)公共數(shù)據(jù)存儲(chǔ)庫(kù)中。為便于數(shù)據(jù)的再利用,所有數(shù)據(jù)需保持其未經(jīng)加工的原始狀態(tài)。需要提交的數(shù)據(jù)包括計(jì)算數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)、實(shí)驗(yàn)或觀測(cè)程序中產(chǎn)生的數(shù)據(jù)等。
在同行評(píng)議階段,編輯、編委會(huì)成員、評(píng)審將會(huì)對(duì)作者所提交的數(shù)據(jù)存儲(chǔ)庫(kù)進(jìn)行評(píng)估。Scientific Data和Geoscience Data Journal列出了推薦的數(shù)據(jù)存儲(chǔ)庫(kù)或數(shù)據(jù)中心。Scientific Data提出了可信的數(shù)據(jù)存儲(chǔ)庫(kù)需要滿足的一般標(biāo)準(zhǔn):在專業(yè)領(lǐng)域得到廣泛的支持和認(rèn)可;確保數(shù)據(jù)集的長(zhǎng)期保存,維持與發(fā)表時(shí)一致的狀態(tài);提供專業(yè)管理;執(zhí)行相關(guān)的、專業(yè)認(rèn)可的報(bào)告要求;為提交的數(shù)據(jù)集提供機(jī)密審查;為提交的數(shù)據(jù)集提供穩(wěn)定的標(biāo)識(shí)符;允許公眾對(duì)數(shù)據(jù)的訪問(wèn)不受不必要的限制[10]。Geoscience Data Journal數(shù)據(jù)存儲(chǔ)庫(kù)的推薦標(biāo)準(zhǔn)為在專業(yè)領(lǐng)域廣泛使用、擁有正式的數(shù)據(jù)管理策略、為數(shù)據(jù)集提供DOI或穩(wěn)定的URL及唯一的標(biāo)識(shí)符[11]。
表1數(shù)據(jù)論文編排形式
在數(shù)據(jù)長(zhǎng)期保存方面,研究者、機(jī)構(gòu)、期刊和數(shù)據(jù)存儲(chǔ)庫(kù)承擔(dān)共同的責(zé)任。數(shù)據(jù)論文中描述的數(shù)據(jù)集必須保持永久可用。數(shù)據(jù)論文發(fā)表后,作者必須承諾在自己的實(shí)驗(yàn)室或機(jī)構(gòu)服務(wù)器上保存相關(guān)數(shù)據(jù)集至少5年。在這段時(shí)間內(nèi),若原先提交的數(shù)據(jù)存儲(chǔ)庫(kù)消失或數(shù)據(jù)丟失,數(shù)據(jù)期刊可要求作者將數(shù)據(jù)集上傳至另一個(gè)數(shù)據(jù)存儲(chǔ)庫(kù)中,并在數(shù)據(jù)論文中作出更正和更新。若作者從公共數(shù)據(jù)存儲(chǔ)庫(kù)中移除了數(shù)據(jù)集或更改了訪問(wèn)標(biāo)準(zhǔn),數(shù)據(jù)期刊可要求作者更正其數(shù)據(jù)論文,甚至在極端情況下,撤回該數(shù)據(jù)論文[12]。
2.2對(duì)比分析
2.2.1發(fā)文量及學(xué)科分布
Scientific Data每半月更新一次,2014年3 月11日至2015年3月31日共發(fā)表68篇論文,其中數(shù)據(jù)論文62篇(占91.18%)。由于自然科學(xué)所有學(xué)科相關(guān)的數(shù)據(jù)論文均可在Scientific Data上發(fā)表,相比其他限定某一領(lǐng)域的數(shù)據(jù)期刊而言,它包含的主題更為全面。
Geoscience Data Journal分別于2014年6月和2014年11月出版了兩期期刊,共有17篇論文,其中數(shù)據(jù)論文14篇(占82.4%)。該刊論文主要針對(duì)地球科學(xué)領(lǐng)域,包括但不限于天氣和氣候、海洋學(xué)、大氣和海洋化學(xué)、冰凍層、生物圈、地表和地質(zhì)學(xué)、水文地理學(xué)、地球化學(xué)、地球物理學(xué)、行星及空間學(xué)等。
2013年9月16日至2015年3月20日,Biodiversity Data Journal不定期更新,共發(fā)表163篇論文,其中數(shù)據(jù)論文18篇(占11.04%)。該刊論文主要針對(duì)生物多樣性學(xué)科。
3種數(shù)據(jù)期刊發(fā)表的數(shù)據(jù)論文所涉學(xué)科分布見(jiàn)表2。
表2數(shù)據(jù)論文學(xué)科分布
從表2可見(jiàn),Scientific Data收錄論文學(xué)科范圍最廣,且生物、醫(yī)學(xué)占據(jù)絕大部分。同時(shí)還表明,數(shù)據(jù)論文多產(chǎn)生于生物、醫(yī)學(xué)、地球科學(xué)等實(shí)驗(yàn)觀測(cè)數(shù)據(jù)量較大的學(xué)科。
2.2.2接收—錄用—發(fā)表周期
論文從接收到發(fā)表的時(shí)間周期對(duì)作者投稿具有參考指導(dǎo)作用。根據(jù)每一篇數(shù)據(jù)論文的接收(received)日期、錄用(accepted)日期和發(fā)表(published)日期,計(jì)算每一種數(shù)據(jù)期刊數(shù)據(jù)論文的平均接收—錄用周期(從接收到錄用所需天數(shù)的平均值)、平均錄用—發(fā)表周期(從錄用到發(fā)表所需天數(shù)的平均值)和平均接收—發(fā)表周期(從接收到發(fā)表所需天數(shù)的平均值),結(jié)果如表3所示??梢?jiàn),由于數(shù)據(jù)論文要經(jīng)過(guò)投稿、同行評(píng)議、修改、錄用直至發(fā)表的整個(gè)流程,因此需要一定的論文審閱處理時(shí)間。不同數(shù)據(jù)期刊的論文審閱處理時(shí)間差異較大,其中Biodiversity Data Journal的接收—錄用—發(fā)表周期最短。
2.2.3作者國(guó)籍及國(guó)際合作
作為代表一種新興科學(xué)研究范式的數(shù)據(jù)期刊和數(shù)據(jù)論文,論文作者數(shù)反映了成果的合作程度,作者的國(guó)籍從一定程度上反映了該國(guó)科技發(fā)展的領(lǐng)先程度。3種期刊的論文作者數(shù)及第一作者國(guó)籍情況詳見(jiàn)表4。
表3數(shù)據(jù)論文平均接收-錄用周期、平均錄用-發(fā)表周期、平均接收-發(fā)表周期
Scientific Data刊登的數(shù)據(jù)論文中,平均每篇論文有12.15名作者,美國(guó)、英國(guó)、瑞士三國(guó)作者較多。在數(shù)據(jù)論文中,所有的作者來(lái)自同一國(guó)家的有34篇(占54.84%),國(guó)際合作論文為28 篇(占45.16%)。
Geoscience Data Journal刊登的數(shù)據(jù)論文中,平均每篇論文有7名作者,英國(guó)、美國(guó)、荷蘭三國(guó)作者發(fā)表了較多的數(shù)據(jù)論文。在數(shù)據(jù)論文中,所有的作者來(lái)自同一國(guó)家的有8篇(占57.14%),國(guó)際合作論文為6篇(占42.86%)。
Biodiversity Data Journal刊登的數(shù)據(jù)論文中,平均每篇論文有9.44名作者。由于樣本數(shù)較少,各國(guó)作者發(fā)表論文差異不大,法國(guó)、英國(guó)、希臘、巴西四國(guó)作者發(fā)表了較多的數(shù)據(jù)論文。在數(shù)據(jù)論文中,所有的作者來(lái)自同一國(guó)家的有11 篇(占61.11% ),國(guó)際合作論文為7篇(占38.89%)。
表4數(shù)據(jù)論文作者數(shù)及第一作者國(guó)籍
統(tǒng)計(jì)結(jié)果表明,由于科學(xué)數(shù)據(jù)的產(chǎn)生需要大量的觀察、實(shí)驗(yàn)工作,因此需要眾多科學(xué)研究者互相合作。3種數(shù)據(jù)期刊的平均作者數(shù)統(tǒng)計(jì)見(jiàn)表5。從表5可見(jiàn),數(shù)據(jù)論文的作者數(shù)較多,而其中國(guó)際合作的比例達(dá)到了40%左右。
2.2.4作者機(jī)構(gòu)類型及跨機(jī)構(gòu)合作
論文作者的機(jī)構(gòu)類型反映出這一新型科學(xué)研究范式最先影響并得以接受的行業(yè)范圍。Scientific Data刊登的數(shù)據(jù)論文中,作者來(lái)自同一機(jī)構(gòu)的為15篇(占24.19% ),跨機(jī)構(gòu)合作(數(shù)據(jù)論文的作者來(lái)自不同機(jī)構(gòu))有47篇(占75.81% )。Scientific Data的作者機(jī)構(gòu)可劃分為高校、科研院所、企業(yè)等3類。數(shù)據(jù)論文的作者來(lái)源于單一機(jī)構(gòu)類型的有33篇(占53.23%),作者來(lái)源于多種機(jī)構(gòu)類型的有29篇(占46.77%)。其中涉及到產(chǎn)學(xué)研合作(企業(yè)與科研院所、高等學(xué)校之間的合作)的數(shù)據(jù)論文有7篇,占論文總數(shù)的11.29%。
表5數(shù)據(jù)論文平均論文作者數(shù)及國(guó)際合作論文比例
Geoscience Data Journal刊登的數(shù)據(jù)論文中,作者來(lái)源同一機(jī)構(gòu)的為6篇(占42.86%),跨機(jī)構(gòu)合作的為8篇(占57.14%)。數(shù)據(jù)論文的作者來(lái)源于單一機(jī)構(gòu)類型的有10篇(占71.43%),作者來(lái)源于多種機(jī)構(gòu)類型的有4篇(占28.57%)。
Biodiversity Data Journal刊登的數(shù)據(jù)論文中,作者來(lái)源同一機(jī)構(gòu)的為5篇(占27.78%),跨機(jī)構(gòu)合作的為13篇(占72.22%)。數(shù)據(jù)論文的作者來(lái)源于單一機(jī)構(gòu)類型的有7篇(占38.89%),作者來(lái)源于多種機(jī)構(gòu)類型的有11篇(占61.11%)。
表6數(shù)據(jù)論文作者機(jī)構(gòu)類型分布
綜上,可知Scientific Data和Biodiversity Data Journal的跨機(jī)構(gòu)合作比例較高,均超過(guò)70%。Scientific Data由于所覆蓋的學(xué)科范圍較廣,其機(jī)構(gòu)類型也較為豐富,有11.29%的論文屬于產(chǎn)學(xué)研合作。Biodiversity Data Journal的特點(diǎn)是超過(guò)60%的數(shù)據(jù)論文作者都來(lái)源于不同的機(jī)構(gòu)類型。
從上述定量分析可以看出,數(shù)據(jù)期刊與數(shù)據(jù)論文正在迅速發(fā)展,相關(guān)的規(guī)范與標(biāo)準(zhǔn)仍在完善之中。隨著越來(lái)越多科學(xué)數(shù)據(jù)的產(chǎn)生、存儲(chǔ)與共享,以數(shù)據(jù)密集型計(jì)算為基礎(chǔ)的科學(xué)研究的第四范式對(duì)科研模式的影響范圍越來(lái)越大,相信數(shù)據(jù)論文將會(huì)得到更快的發(fā)展。由于數(shù)據(jù)期刊與機(jī)構(gòu)知識(shí)庫(kù)同科學(xué)數(shù)據(jù)管理平臺(tái)相比,它既擁有傳統(tǒng)學(xué)術(shù)期刊的優(yōu)勢(shì),在傳播的廣度、深度和速度上又更勝一籌,作者還能得到更好的交流、認(rèn)可與回報(bào)。因此,可以預(yù)測(cè)數(shù)據(jù)期刊將會(huì)在很大程度上彌補(bǔ)機(jī)構(gòu)知識(shí)庫(kù)、科學(xué)數(shù)據(jù)管理平臺(tái)數(shù)據(jù)來(lái)源被動(dòng)的缺陷,將會(huì)得到越來(lái)越多的科研人員關(guān)注、認(rèn)可、利用與投稿。
同時(shí),從以上數(shù)據(jù)可以看到,目前數(shù)據(jù)期刊和數(shù)據(jù)論文都以發(fā)達(dá)國(guó)家為主,我國(guó)目前尚沒(méi)有真正意義上的數(shù)據(jù)期刊,我國(guó)科研人員在數(shù)據(jù)期刊上發(fā)表的數(shù)據(jù)論文也非常少,這與我國(guó)的科學(xué)研究與學(xué)術(shù)期刊的歷史不長(zhǎng)、本身存在較多問(wèn)題有關(guān)。但在互聯(lián)網(wǎng)時(shí)代,中國(guó)期刊不應(yīng)忽視新環(huán)境帶來(lái)的新的發(fā)展機(jī)遇,需要奮起直追,不能重蹈?jìng)鹘y(tǒng)期刊的覆轍,仍落后于發(fā)達(dá)國(guó)家。
無(wú)論是數(shù)據(jù)期刊還是數(shù)據(jù)論文,都是大數(shù)據(jù)時(shí)代新生的出版類型,它們的興起與發(fā)展,將對(duì)出版業(yè)、圖書(shū)館、數(shù)據(jù)倉(cāng)儲(chǔ)機(jī)構(gòu)等產(chǎn)生深遠(yuǎn)的影響,甚至發(fā)展到一定的階段將會(huì)引發(fā)科技政策和科研評(píng)價(jià)方法的變革。因此,出版社、圖書(shū)館、數(shù)據(jù)倉(cāng)儲(chǔ)機(jī)構(gòu)、科研管理相關(guān)部門(mén)都應(yīng)該積極應(yīng)對(duì),盡早布局。對(duì)圖書(shū)館界而言,應(yīng)該發(fā)揮自己的優(yōu)勢(shì),至少可以在如下五個(gè)方面發(fā)揮作用:
(1)數(shù)據(jù)期刊與數(shù)據(jù)論文的收集、整合與揭示。由于目前數(shù)據(jù)期刊大都為在線OA模式,圖書(shū)館有責(zé)任對(duì)此新型文獻(xiàn)進(jìn)行收集、整理并揭示給自己的用戶,讓讀者能夠及時(shí)了解和利用這些科研數(shù)據(jù)。
(2)數(shù)據(jù)期刊與數(shù)據(jù)論文特征分析與咨詢指導(dǎo)。由于數(shù)據(jù)期刊與數(shù)據(jù)論文對(duì)大多數(shù)科研人員來(lái)講都是一種新的文獻(xiàn)類型,圖書(shū)館員可以在充分學(xué)習(xí)與了解的基礎(chǔ)之上,對(duì)數(shù)據(jù)期刊的投稿方法、數(shù)據(jù)論文的撰寫(xiě)規(guī)范等向相關(guān)科研人員提供指導(dǎo)。
(3)參與數(shù)據(jù)論文規(guī)范與標(biāo)準(zhǔn)的制定。以中文數(shù)據(jù)論文為例,目前中文數(shù)據(jù)論文存在的問(wèn)題主要包括:沒(méi)有專業(yè)的數(shù)據(jù)存儲(chǔ)平臺(tái),沒(méi)有對(duì)數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)定和說(shuō)明,對(duì)數(shù)據(jù)的管理僅停留在論文附屬資料的簡(jiǎn)單層面;沒(méi)有對(duì)數(shù)據(jù)共享、傳播、重用、演繹等作明確說(shuō)明,或者沒(méi)有對(duì)數(shù)據(jù)引用格式作詳細(xì)說(shuō)明。因此,圖書(shū)館應(yīng)充分發(fā)揮圖書(shū)編目工作中積累的元數(shù)據(jù)標(biāo)準(zhǔn)制定經(jīng)驗(yàn)的優(yōu)勢(shì),積極參與到相關(guān)規(guī)范與標(biāo)準(zhǔn)的制定過(guò)程中,在這種新型學(xué)術(shù)生態(tài)的生態(tài)鏈中發(fā)揮更為積極、主動(dòng)的作用。
(4)為數(shù)據(jù)論文的存儲(chǔ)提供解決空間與方案。在目前數(shù)據(jù)期刊的數(shù)據(jù)存儲(chǔ)解決方案中,數(shù)據(jù)論文的原始數(shù)據(jù)大多存儲(chǔ)在另外的存儲(chǔ)平臺(tái)。在“數(shù)據(jù)為王”的時(shí)代,我國(guó)高?;蛳嚓P(guān)的研究機(jī)構(gòu)必須進(jìn)行相應(yīng)的前瞻性規(guī)劃,對(duì)自己的科研數(shù)據(jù)進(jìn)行系統(tǒng)性收集、規(guī)范、整合,圖書(shū)館作為信息收集、保存與揭示的機(jī)構(gòu),理應(yīng)擔(dān)此重任,及早籌謀。
(5)建立集數(shù)據(jù)和文獻(xiàn)于一體的新型數(shù)字圖書(shū)館,形成數(shù)據(jù)與信息融合的互操作架構(gòu)。高校圖書(shū)館的主要任務(wù)是為教學(xué)和科研提供文獻(xiàn)信息服務(wù),當(dāng)傳統(tǒng)的科研范式發(fā)生巨大變革時(shí),圖書(shū)館也應(yīng)跟進(jìn),在原有數(shù)字圖書(shū)館的基礎(chǔ)之上,打造新型數(shù)字圖書(shū)館,以使科學(xué)研究的整個(gè)過(guò)程都可以在數(shù)字圖書(shū)館環(huán)境中進(jìn)行,使科學(xué)研究的素材、思路、過(guò)程和結(jié)論都能夠得到有效傳播、共享和利用。
參考文獻(xiàn)
[1] Hey T,Tansley S,Tolle K. The fourth paradigm:data- intensive scientific discovery [EB/OL]. [2015- 09-03]. http://research.microsoft.com/en- us/collaboration/ fourthparadigm/.
[2]劉鳳紅,崔金鐘,韓芳橋,等.數(shù)據(jù)論文:大數(shù)據(jù)時(shí)代新興學(xué)術(shù)論文出版類型探討[J].科技期刊研究,2014,25(12):1451- 1456.
[3]學(xué)術(shù)期刊[EB/OL]. [2015- 08- 09]. http://baike.baidu. com/view/848379.htm.
[4] Nature Publishing Group.Press release archive[EB/OL]. [2015- 09- 03]. http:// www.nature.com/press_releases/ scientificdata.html.
[5] Scientific Data. About[EB/OL].[2015- 08- 06]. http:// www.nature.com/sdata/about.
[6] Wiley. Corporate Information[EB/OL].[2015- 09- 03]. http://as.wiley.com/ WileyCDA/ Section/id- 301695. html.
[7] WileyOnline Library.Overview[EB/OL].[2015- 08- 06]. http://onlinelibrary.wiley.com/journal/10.1002/(ISSN)2049- 6060/homepage/ProductInformation.html.
[8] Pensoft. About Pensoft[EB/OL].[2015- 09- 03]. http:// www.pensoft.net/about.php.
[9] Biodiversity Data Journal.About[EB/OL].[2015- 08- 06]. http://biodiversitydatajournal.com/about.
[10] [12]Nature Publishing Group. Data policies [EB/OL]. [2015- 09- 03]. http:// www.nature.com/sdata/ data- policies.
[11] Wiley Online Library. Author Guidelines [EB/OL]. [2015- 09- 03]. http://onlinelibrary.wiley.com/journal/ 10.1002/(ISSN)2049- 6060/homepage/ForAuthors. html#dataset_submission.
收稿日期2015- 08- 21
作者簡(jiǎn)介田稷,女,碩士,副研究館員,浙江大學(xué)圖書(shū)館副館長(zhǎng);陳琿夏,女,碩士,浙江大學(xué)圖書(shū)館助理館員。