国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)論文:大數(shù)據(jù)時(shí)代新興學(xué)術(shù)論文出版類型探討

2014-03-26 01:07劉鳳紅崔金鐘韓芳橋劉國(guó)俊
中國(guó)科技期刊研究 2014年12期
關(guān)鍵詞:論文期刊科學(xué)

■劉鳳紅 崔金鐘 韓芳橋 劉國(guó)俊

中國(guó)科學(xué)院植物研究所文獻(xiàn)與信息管理中心,北京市海淀區(qū)香山南辛村20號(hào) 100093,E-mail:fenghong@ibcas.ac.cn

1 引言

信息技術(shù)的發(fā)展和普及催生了數(shù)據(jù)的爆炸式增長(zhǎng),將人類社會(huì)帶入了大數(shù)據(jù)(big data)時(shí)代。對(duì)數(shù)據(jù)的識(shí)別、管理、計(jì)算和應(yīng)用正前所未有地改變著人類生產(chǎn)和生活的諸多方面,科學(xué)研究也概莫能外?!按髷?shù)據(jù)”引起了研究模式的革命性變化,促成了數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)即科學(xué)研究第四范式的誕生。在這種研究模式下,科學(xué)研究不再單純地依靠科學(xué)問題或假設(shè)驅(qū)動(dòng),而是轉(zhuǎn)而探究科學(xué)數(shù)據(jù)本身[1]。大數(shù)據(jù)引發(fā)了對(duì)數(shù)據(jù)共享的廣泛關(guān)注和討論[2-7],對(duì)數(shù)據(jù)共享的需求也日趨強(qiáng)烈,在這種背景下,數(shù)據(jù)論文(data paper)應(yīng)運(yùn)而生。數(shù)據(jù)論文采用規(guī)范的出版形式,但與常規(guī)學(xué)術(shù)論文有很大不同:數(shù)據(jù)不是支持學(xué)術(shù)觀點(diǎn)的輔助性材料,而是論文主體。自從20世紀(jì)末生態(tài)學(xué)領(lǐng)域經(jīng)典學(xué)術(shù)期刊Ecology首次刊發(fā)數(shù)據(jù)論文以來,伴隨“大數(shù)據(jù)”的浪潮,其已引起了科技期刊出版界和科研群體的廣泛關(guān)注,得到了長(zhǎng)足而迅速的發(fā)展。目前,國(guó)際上不僅有期刊開通了數(shù)據(jù)論文發(fā)表通道(如Ecology,BMC Research Notes和International Journal of Robotics Research等),數(shù)據(jù)期刊(data journal)業(yè)已正式出版發(fā)行(如自然出版集團(tuán)(Nature Publishing Group)的《科學(xué)數(shù)據(jù)》(Scientific Data),Pensoft出版社的《生物多樣性數(shù)據(jù)期刊》(Biodiversity Data Journal,BDJ)等。有關(guān)數(shù)據(jù)論文的概念探討也開始見諸于專業(yè)科技期刊。在出版實(shí)踐上,數(shù)據(jù)論文的出版流程也在不斷完善和規(guī)范??梢哉f,數(shù)據(jù)論文的出現(xiàn)和發(fā)展,不僅有益于科學(xué)數(shù)據(jù)的共享和積累,也是對(duì)論文出版類型的一種全新的嘗試。然而,其在國(guó)內(nèi)卻未受到相應(yīng)重視,對(duì)絕大多數(shù)期刊和科研群體而言,數(shù)據(jù)論文仍然是一個(gè)相對(duì)陌生的概念。基于此,本文詳細(xì)介紹了數(shù)據(jù)論文產(chǎn)生的背景、概念以及國(guó)內(nèi)外出版實(shí)踐,以期為國(guó)內(nèi)同行了解相關(guān)信息提供翔實(shí)的參考資料,并提出了在我國(guó)開設(shè)數(shù)據(jù)論文發(fā)表通道的建議。

2 數(shù)據(jù)論文及其相關(guān)概念

要準(zhǔn)確地闡釋數(shù)據(jù)論文,首先需要將其與數(shù)據(jù)發(fā)表、論文數(shù)據(jù)資料等概念和形式區(qū)分開來。

2.1 數(shù)據(jù)發(fā)表(data publication)

數(shù)據(jù)發(fā)表是將數(shù)據(jù)發(fā)布在網(wǎng)絡(luò)或其它媒介上,在遵循版權(quán)協(xié)議的前提下,他人可以引用、下載、分析和重用。廣義上講,任何將數(shù)據(jù)上載到網(wǎng)絡(luò)或其它媒介并允許他人使用的行為都可以稱為“數(shù)據(jù)發(fā)表”[8]。目前國(guó)際上有很多存儲(chǔ)專業(yè)數(shù)據(jù)的平臺(tái),這些平臺(tái)的數(shù)據(jù)格式遵循國(guó)際標(biāo)準(zhǔn),保了上載的數(shù)據(jù)能夠被清晰描述,并為數(shù)據(jù)共享和重用奠定了基礎(chǔ)。如,存儲(chǔ)生物多樣性、物種分類和描述數(shù)據(jù)的全球生物多樣性網(wǎng)絡(luò)(GBIF),存儲(chǔ)基因數(shù)據(jù)的Genbank和生命條碼數(shù)據(jù)系統(tǒng)(Barcode of Life Data Systems,BOLD),存儲(chǔ)轉(zhuǎn)錄組數(shù)據(jù)的基因表達(dá)數(shù)據(jù)庫(Gene Expression Omnibus,GEO),存儲(chǔ)系統(tǒng)發(fā)育數(shù)據(jù)的TreeBASE等??蒲泄ぷ髡邔?shù)據(jù)上載到這些存儲(chǔ)平臺(tái)上,就屬于數(shù)據(jù)發(fā)表行為。

2.2 數(shù)據(jù)資料(data materials)

數(shù)據(jù)資料作為支撐論文學(xué)術(shù)思想的佐證,是論文本身需要展示的不可或缺的部分。目前主要有兩種形式,一種是限于版面和出版成本,數(shù)據(jù)不在正文中出現(xiàn),而以附件形式存在。這種形式早已有之,較為普遍;另一種形式是期刊出版機(jī)構(gòu)和科研群體基于對(duì)科學(xué)數(shù)據(jù)公開、重用、共享以及對(duì)論文原始數(shù)據(jù)真實(shí)性和重復(fù)性[9-10]的考慮,鼓勵(lì)作者將論文涉及的數(shù)據(jù)存儲(chǔ)在專業(yè)數(shù)據(jù)庫或出版機(jī)構(gòu)網(wǎng)站上,推行這一舉措的包括Nature、American Naturalist、Ecology、Evolution、Heredity、Biological Journal of the Linnaean Society等國(guó)際知名期刊。在上述兩種形式中,數(shù)據(jù)資料不是論文本身要描述的主體,而是起支撐論文學(xué)術(shù)思想的作用。

2.3 數(shù)據(jù)論文(data paper)

數(shù)據(jù)論文是正式的學(xué)術(shù)論文,遵從學(xué)術(shù)發(fā)表規(guī)范,要接受嚴(yán)格的同行評(píng)議(peer-review)。它與常規(guī)學(xué)術(shù)論文最大的不同之處在于,并不重點(diǎn)報(bào)道基于科學(xué)假設(shè)和科學(xué)問題的研究結(jié)果,而是重點(diǎn)描述科學(xué)數(shù)據(jù)本身。實(shí)際上,數(shù)據(jù)論文的概念早已有之。早在2000年,美國(guó)生態(tài)學(xué)會(huì)(Ecological Society of America,ESA)就在投稿須知中對(duì)其進(jìn)行了闡釋:數(shù)據(jù)論文是一種特殊類型的論文,用于展示大型或豐富的數(shù)據(jù)集,包括描述數(shù)據(jù)內(nèi)容、數(shù)據(jù)產(chǎn)生背景、數(shù)據(jù)質(zhì)量和結(jié)構(gòu)的元數(shù)據(jù)文件。ESA明確提出發(fā)表數(shù)據(jù)論文的目的是重用數(shù)據(jù),讓數(shù)據(jù)發(fā)揮更多潛在的科研價(jià)值[11]。隨著數(shù)據(jù)共享理念的發(fā)展和在線共享方式的普及,Chavan和 Penev(2011)將其概念發(fā)展為:數(shù)據(jù)論文應(yīng)該總是與其描述的公開發(fā)布的數(shù)據(jù)集鏈接,這個(gè)鏈接(可以是URL,最好是數(shù)據(jù)存儲(chǔ)庫自動(dòng)分配的DOI)包含在文章內(nèi)部[12]。概言之,數(shù)據(jù)論文是對(duì)在線數(shù)據(jù)集(dataset)或一組數(shù)據(jù)集進(jìn)行描述的元數(shù)據(jù)文檔,遵循一定的數(shù)據(jù)標(biāo)準(zhǔn),計(jì) 算 機(jī) 可 讀、 可 檢 索[13-15]。Ecology、Phytokeys、Zookyes、BMC Research Notes和International Journal of Robotics Research等期刊都發(fā)表數(shù)據(jù)論文。

2.4 數(shù)據(jù)期刊(data journal)

除部分期刊開設(shè)數(shù)據(jù)論文欄目外,近來還涌現(xiàn)了專門發(fā)表數(shù)據(jù)論文的數(shù)據(jù)期刊(data journal)。這方面非常典型的例子是:自然出版集團(tuán)(Nature Publishing Group)出版的《科學(xué)數(shù)據(jù)》和Pensoft出版社的《生物多樣性數(shù)據(jù)期刊》?!犊茖W(xué)數(shù)據(jù)》重在描述實(shí)驗(yàn)和觀察數(shù)據(jù),并有效整合傳統(tǒng)學(xué)術(shù)發(fā)表內(nèi)容和結(jié)構(gòu)信息,力求在最大程度上促進(jìn)數(shù)據(jù)重用,幫助用戶進(jìn)行檢索和信息挖掘[20]?!渡锒鄻有詳?shù)據(jù)期刊》則采用一套完整的在線平臺(tái),集中整合了論文寫作、投稿、審稿和編輯,再到出版和傳播的全部流程,是具有開創(chuàng)性的新興期刊出版模式。

3 數(shù)據(jù)論文的出版實(shí)踐

3.1 出版流程

同概念一樣,數(shù)據(jù)論文的出版實(shí)踐可追溯至20世紀(jì)末,也產(chǎn)生于生態(tài)學(xué)領(lǐng)域。生態(tài)學(xué)的學(xué)科屬性決定了數(shù)據(jù)整合和協(xié)同研究的重要性,所以對(duì)開放數(shù)據(jù)的要求尤為突出[6-7]。過去十五年來,生態(tài)學(xué)領(lǐng)域國(guó)際頂級(jí)學(xué)術(shù)期刊Ecology上刊發(fā)的數(shù)據(jù)論文的數(shù)量不斷上升(圖1),一定程度上反映了科學(xué)數(shù)據(jù)越來越受到重視。

圖1 Ecology歷年發(fā)表數(shù)據(jù)論文的數(shù)量

美國(guó)生態(tài)學(xué)會(huì)對(duì)數(shù)據(jù)論文的要求非常嚴(yán)格,對(duì)內(nèi)容、數(shù)據(jù)格式、出版流程、數(shù)據(jù)存儲(chǔ)方式以及數(shù)據(jù)質(zhì)量和審稿規(guī)范都做了詳細(xì)規(guī)定,并明確要求作者不得對(duì)數(shù)據(jù)進(jìn)行保護(hù)性處理,以確保讀者能無障礙獲取數(shù)據(jù)[11]。Ecology Archives平臺(tái)為每篇論文及數(shù)據(jù)提供長(zhǎng)期保存和維護(hù)服務(wù)。Ecology數(shù)據(jù)論文的格式非常工整,包含標(biāo)題、版權(quán)聲明、Ecology Archives賦予的ID號(hào)以及摘要、作者、數(shù)據(jù)文件(及其鏈接)和元數(shù)據(jù)[16]。每個(gè)元數(shù)據(jù)文件分別包含數(shù)據(jù)集(data set descriptor)、研究動(dòng)因(research origin descriptors)、數(shù)據(jù)狀態(tài)和獲取方式(data set status and accessibility)、數(shù)據(jù)結(jié)構(gòu)(data structural descriptors)和附屬描述資料(supplemental descriptors)5 個(gè)部分。

依賴于日趨龐大的數(shù)據(jù)存儲(chǔ)庫和不斷創(chuàng)新的軟件工具,數(shù)據(jù)論文的創(chuàng)作過程不斷規(guī)范。日前,世界最大的生物多樣性信息服務(wù)機(jī)構(gòu)——全球生物多樣性信息網(wǎng)絡(luò)(Global Biodiversity Information Facility,GBIF)聯(lián)合Pensoft出版社,啟動(dòng)了數(shù)據(jù)論文示范項(xiàng)目。這個(gè)項(xiàng)目探索了從數(shù)據(jù)存儲(chǔ)、論文創(chuàng)作、投稿、同行評(píng)議、論文修改、投遞修改稿再到最后正式發(fā)表的全套流程,并推出了GBIF整合發(fā)表工具(Integrated Publishing Toolkit,IPT)。 基于在GBIF中存儲(chǔ)的數(shù)據(jù),IPT元數(shù)據(jù)編輯器可以幫助作者方便快捷地創(chuàng)作遵從 GBIF元數(shù)據(jù)規(guī)范(GBIF Metadata Profile,GMP)的數(shù)據(jù)論文(圖2)。 這些論文經(jīng)過同行評(píng)議后,最終可在 Pensoft出版社的Zookeys、Phytokeys、MycoKeys、BioRisk、NeoBiota、Nature Conservation等期刊發(fā)表。IPT工具的使用不僅為作者提供了極大便利,而且實(shí)現(xiàn)了數(shù)據(jù)的結(jié)構(gòu)化,使數(shù)據(jù)符合特定標(biāo)準(zhǔn)和規(guī)范,便于數(shù)據(jù)擴(kuò)展和整合。具體出版流程如下[12]:

a)數(shù)據(jù)發(fā)布者(data publisher)使用IPT為數(shù)據(jù)集創(chuàng)建元數(shù)據(jù),IPT自動(dòng)分配給元數(shù)據(jù)一個(gè)永久ID。

b)元數(shù)據(jù)完成后,數(shù)據(jù)論文自動(dòng)產(chǎn)生。

c)作者自查并將論文上傳到期刊在線投稿系統(tǒng)。

d)同行評(píng)議后,初稿連同審稿意見返回給作者。

e)作者根據(jù)審稿意見修改論文。

f)同 b),標(biāo)記的修改版再一次自動(dòng)轉(zhuǎn)換成論文。

g)論文被接受,進(jìn)入校樣(proof)階段,加上投稿日期、修改日期和接受日期,并獲得DOI號(hào)。

h)數(shù)據(jù)論文經(jīng)過校對(duì)最終確認(rèn)后,將以4種形式發(fā)表:打印版、與打印版一致的PDF格式、語義增強(qiáng)HTML格式和XML格式,多種格式并存有利于日后對(duì)文章進(jìn)行深度數(shù)據(jù)挖掘。

圖2 全球生物多樣性信息網(wǎng)絡(luò)(GBIF)與Pensoft出版社期刊數(shù)據(jù)論文出版流程示意圖[12]

i)數(shù)據(jù)論文發(fā)表后,論文DOI號(hào)與在GBIF注冊(cè)表(GBIF Registry)上注冊(cè)的元數(shù)據(jù)文檔ID相互鏈接。

j)數(shù)據(jù)論文收錄進(jìn)檢索系統(tǒng),供讀者使用。

3.2 質(zhì)量控制

為有效控制數(shù)據(jù)論文的質(zhì)量,Pensoft對(duì)同行評(píng)審標(biāo)準(zhǔn)做了嚴(yán)格詳細(xì)的規(guī)定,審稿人要評(píng)估元數(shù)據(jù)的完整性、數(shù)據(jù)質(zhì)量以及發(fā)表價(jià)值(publication value of data),以及在數(shù)據(jù)采集、管理和審核過程中采用的方法是否有效和標(biāo)準(zhǔn)是否一致。具體而言,審稿人要審核稿件質(zhì)量、數(shù)據(jù)質(zhì)量和以及內(nèi)容和元數(shù)據(jù)一致性等三個(gè)方面的問題[8]。

Pensoft投稿指南對(duì)三者分別做了詳細(xì)說明。論文質(zhì)量審核包括:標(biāo)題、摘要和關(guān)鍵詞是否精確反映了內(nèi)容?論文組織得是否合理,語言是否正確標(biāo)準(zhǔn)?非文本(如圖、表、視頻、音頻文件等)使用是否得當(dāng)?縮寫和符號(hào)是否定義正確?是否涉及到版權(quán)沖突等。數(shù)據(jù)質(zhì)量審核包括:數(shù)據(jù)是否完整和統(tǒng)一?數(shù)據(jù)資源是否包含了重要的科學(xué)內(nèi)容,涵蓋范圍是否足夠大,時(shí)間段和(或)分類群是否值得單獨(dú)發(fā)表?數(shù)據(jù)標(biāo)準(zhǔn)是否一致?是否完整記錄了原始數(shù)據(jù)分析和使用方法,是否可復(fù)用?數(shù)據(jù)是否合理?數(shù)據(jù)存儲(chǔ)庫是否合適?論文和數(shù)據(jù)一致性審核包括:是否對(duì)數(shù)據(jù)及數(shù)據(jù)獲取方法進(jìn)行了精確描述?數(shù)據(jù)產(chǎn)生方法是否描述得足夠詳細(xì)?數(shù)據(jù)是否足夠?使用案例是否與數(shù)據(jù)一致?是否明確指出了可能導(dǎo)致數(shù)據(jù)錯(cuò)誤的原因等[8]。美國(guó)生態(tài)學(xué)會(huì)也制定了專門的審稿標(biāo)準(zhǔn),除了對(duì)保密、審稿時(shí)限、規(guī)避利益沖突等一般性規(guī)定外,還要求審稿人必須給出詳細(xì)的審稿意見:審稿人必需要明確告訴作者其論文的主要貢獻(xiàn)、優(yōu)缺點(diǎn)和是否適合發(fā)表的原因,包括一般性意見和具體意見[11]。這些規(guī)定都旨在通過制定合理而嚴(yán)格的標(biāo)準(zhǔn)提高數(shù)據(jù)論文的質(zhì)量,為數(shù)據(jù)重用提供保障。

3.3 權(quán)益管理

數(shù)據(jù)論文屬于開放知識(shí)(open knowledge)范疇,是開放理念(這里數(shù)據(jù)也被看作是知識(shí)體系的一部分)的產(chǎn)物。在遵循版權(quán)共享協(xié)議的前提下,可被重用、演繹和重新發(fā)布。政府、基金資助組織、科研機(jī)構(gòu)和期刊出版界近年來陸續(xù)研究和制定了科學(xué)數(shù)據(jù)的管理和共享政策,以促進(jìn)科學(xué)數(shù)據(jù)的保存和開放獲取[17]。目前,絕大多數(shù)出版社和期刊都鼓勵(lì)甚至強(qiáng)制規(guī)定作者采用知識(shí)共享-署名協(xié)議(CCBY)。

Pensoft出版社采用開放數(shù)據(jù)共享署名(Open Data Commons Attribution License,ODC-BY)作為數(shù)據(jù)發(fā)表的首要和默認(rèn)協(xié)議,這意味著只要以引用或致謝的方式給原作者署名,數(shù)據(jù)就可以被自由共享、演繹和使用。署名可給數(shù)據(jù)創(chuàng)作者帶來學(xué)術(shù)信譽(yù)(基于此,數(shù)據(jù)論文的推出被認(rèn)為是促進(jìn)數(shù)據(jù)開放和共享的有效機(jī)制,前文有述)[8]。此外,Pensoft期刊也強(qiáng)烈推薦作者采用知識(shí)共享豁免(Commons CC0,CC-Zero)和開放數(shù)據(jù)共享公有領(lǐng)域的貢獻(xiàn)與許可(Open Data Commons Public Domain Dedication and Licence,PDDL)協(xié)議,該協(xié)議可有效避免“署名堆積(attribution stacking)”。

因?yàn)橥瑫r(shí)涉及數(shù)據(jù)和論文引用,所以對(duì)數(shù)據(jù)論文的引用與傳統(tǒng)的文獻(xiàn)引用有所不同。通常情況下,被引數(shù)據(jù)和數(shù)據(jù)論文都需要在文中和文后參考文獻(xiàn)目錄中有所體現(xiàn)。根據(jù)數(shù)據(jù)引用元數(shù)據(jù)核心(DataCite Metadata Kernel)的規(guī)定,Pensoft期刊文中和文后數(shù)據(jù)和論文引用標(biāo)準(zhǔn)示例為[8]:

正文引用:“這篇文章使用了來自“數(shù)據(jù)存儲(chǔ)平臺(tái)”的數(shù)據(jù),網(wǎng)址是:http://dx.doi.org/*****(Jones et al.2008a),該數(shù)據(jù)首次刊發(fā)于Jones etal.2008b一文 ”。

目錄引用格式為:數(shù)據(jù)引用:“Jones A,Bloggs B,Smith C(2008a).數(shù)據(jù)標(biāo)題.數(shù)據(jù)存儲(chǔ)平臺(tái)名稱.標(biāo)識(shí)符:*****.”。論文引用:“Jones A,Saul D,Smith C(2008b).論文標(biāo)題.刊名.卷:頁碼.

.”。

4 推動(dòng)數(shù)據(jù)論文的意義

“數(shù)據(jù)洪流(data deluge)的時(shí)代已經(jīng)來臨”[15]。要真正有效利用龐大的科學(xué)數(shù)據(jù)支持科學(xué)研究,踐行數(shù)據(jù)共享理念是必然之路。實(shí)際上,數(shù)據(jù)共享并不是一個(gè)嶄新的話題[14]。近年來,很多基金資助組織、科研機(jī)構(gòu)和學(xué)者都在積極呼吁科學(xué)數(shù)據(jù)共享。美國(guó)國(guó)家自然科學(xué)基金委員會(huì)(NSF)建議受資助的科研人員共享數(shù)據(jù)和實(shí)驗(yàn)材料[18],基金申請(qǐng)人員除了提交項(xiàng)目申請(qǐng)書外,還需要提交數(shù)據(jù)管理計(jì)劃,這份計(jì)劃作為申請(qǐng)書的一部分,也要接受同行評(píng)審。中國(guó)也在積極采取措施促進(jìn)數(shù)據(jù)資源的公開,近年來,國(guó)家也支持了相應(yīng)的大型項(xiàng)目,如科技部和財(cái)政部資助的中國(guó)科技資源共享平臺(tái)項(xiàng)目。

Borgman(2013)對(duì)數(shù)據(jù)共享的原因和由此帶來的益處做了總結(jié):公開數(shù)據(jù)方便同行驗(yàn)證和開展重復(fù)實(shí)驗(yàn);公共基金資助的研究結(jié)果理應(yīng)服務(wù)于公眾;數(shù)據(jù)被同行和不同行業(yè)的人使用后促使新科學(xué)問題的提出;提升科研總體創(chuàng)新水平[15]。然而,令人遺憾的是很多數(shù)據(jù)并沒有被合理共享[19-22],反對(duì)數(shù)據(jù)共享的聲音也不絕于耳[23]。在有些科學(xué)家看來,數(shù)據(jù)公開可能導(dǎo)致研究成果被他人使用,且對(duì)數(shù)據(jù)貢獻(xiàn)者沒有顯著回饋,不能幫助科研人員或數(shù)據(jù)擁有者提高學(xué)術(shù)信譽(yù)。數(shù)據(jù)論文的出現(xiàn)恰好可以有效彌補(bǔ)這一不足。首先,其是正式出版的學(xué)術(shù)論文,可被引用,能為數(shù)據(jù)發(fā)布者帶來學(xué)術(shù)信譽(yù);其次,其采用結(jié)構(gòu)化數(shù)據(jù),遵循通用數(shù)據(jù)標(biāo)準(zhǔn),便于整合和擴(kuò)展;再次,其經(jīng)過同行評(píng)議,在質(zhì)量上有嚴(yán)格保證[24]。數(shù)據(jù)論文還可以有效鼓勵(lì)數(shù)據(jù)擁有機(jī)構(gòu)和人員公開歷史久遠(yuǎn)的原始數(shù)據(jù)。比如,單就生物多樣性領(lǐng)域而言,在過去的250年時(shí)間里,世界范圍內(nèi)6500家自然歷史博物館大概記錄了3億條數(shù)據(jù)[25-26],被發(fā)現(xiàn)和公開發(fā)布的僅僅是其中的很小一部分,黑色數(shù)據(jù)(沒被發(fā)現(xiàn)和公開的數(shù)據(jù))仍然占據(jù)主體,它們的產(chǎn)生鮮有計(jì)劃,數(shù)據(jù)質(zhì)量缺乏審核,發(fā)現(xiàn)和獲取尤為困難,面臨極大的丟失風(fēng)險(xiǎn),而這些數(shù)據(jù)可能擁有極其重要的價(jià)值[26]。數(shù)據(jù)論文的推出極有可能成為發(fā)現(xiàn)和保存這些數(shù)據(jù)的有效機(jī)制[12]。

5 推動(dòng)中文數(shù)據(jù)論文的一點(diǎn)思考

科技期刊在數(shù)據(jù)管理方面發(fā)揮的作用日益重要。如上文所述,國(guó)際上已有一些有影響力的大型出版社參與數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)發(fā)表。反觀國(guó)內(nèi)科技期刊出版界,雖然有關(guān)開放獲取的探討很多,但到目前為止,還未針對(duì)科學(xué)數(shù)據(jù)公開發(fā)布真正采取切實(shí)有效的措施。近來,生物學(xué)類核心期刊《生物多樣性》開設(shè)了生物編目欄目,該欄目刊發(fā)生物多樣性熱點(diǎn)地區(qū)、調(diào)查空白地區(qū)的物種編目以及中國(guó)和世界重要生物類群的編目[27]。自2011年以來,該刊已刊發(fā)17篇生物編目類論文?!吨参锷鷳B(tài)學(xué)報(bào)》開辟了資料論文專欄,旨在刊發(fā)特定尺度上(如群落、景觀或區(qū)域)植物群落的樣方數(shù)據(jù)[28]。這兩類文章是國(guó)內(nèi)期刊對(duì)數(shù)據(jù)論文的開創(chuàng)性嘗試,它們具備數(shù)據(jù)論文的基本特點(diǎn):是正式的學(xué)術(shù)論文,對(duì)文章的科學(xué)假設(shè)和科學(xué)問題不做必然要求,重點(diǎn)關(guān)注數(shù)據(jù)本身,論文和數(shù)據(jù)本身都經(jīng)過嚴(yán)格的同行評(píng)審。但相較于國(guó)際上比較成熟的數(shù)據(jù)論文,還存在非常明顯的差距。如,沒有專業(yè)的數(shù)據(jù)存儲(chǔ)平臺(tái),更沒有對(duì)數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)定和說明,對(duì)數(shù)據(jù)的管理僅僅停留在論文附屬資料的簡(jiǎn)單層面;沒有對(duì)數(shù)據(jù)共享、傳播、重用、演繹等權(quán)益做明確說明,或者沒有開放這些權(quán)益;沒有對(duì)數(shù)據(jù)引用格式做詳細(xì)說明。究其根本,造成這些差距的主要原因在于國(guó)內(nèi)對(duì)科學(xué)數(shù)據(jù)的認(rèn)識(shí)不夠深入,重視程度不足。

在開放理念日益盛行的今天,作為激勵(lì)科研人員共享科學(xué)數(shù)據(jù)的有效機(jī)制,數(shù)據(jù)論文模式有必要在國(guó)內(nèi)科技期刊出版界推廣。當(dāng)然,這需要科研群體、數(shù)據(jù)保存機(jī)構(gòu)、科技期刊和基金資助組織共同推動(dòng)。數(shù)據(jù)論文的核心是數(shù)據(jù),這首先牽涉到數(shù)據(jù)保存問題。目前國(guó)內(nèi)尚缺乏有廣泛影響的成熟的科學(xué)數(shù)據(jù)存儲(chǔ)平臺(tái)。因此,要建立成熟完善的中文數(shù)據(jù)論文發(fā)表通道,首先需要從數(shù)據(jù)存儲(chǔ)平臺(tái)建設(shè)上做起。可以考慮以區(qū)域節(jié)點(diǎn)方式參與國(guó)際數(shù)據(jù)存儲(chǔ)平臺(tái)建設(shè),快速移植國(guó)外平臺(tái)的框架、體系規(guī)范、數(shù)據(jù)標(biāo)準(zhǔn)和管理模式。數(shù)據(jù)存儲(chǔ)也便于作者和期刊管理和重用數(shù)據(jù)。建議國(guó)內(nèi)科技期刊與數(shù)據(jù)存儲(chǔ)平臺(tái)通力合作,積極鼓勵(lì)作者采用國(guó)際標(biāo)準(zhǔn)存儲(chǔ)數(shù)據(jù)。此外,國(guó)內(nèi)期刊對(duì)數(shù)據(jù)共享和傳播應(yīng)該采取更為開放的態(tài)度,限制數(shù)據(jù)重用有違數(shù)據(jù)論文的核心理念,也會(huì)阻礙數(shù)據(jù)論文的持續(xù)性發(fā)展,因此建議國(guó)內(nèi)期刊盡可能采用開放程度大的數(shù)據(jù)共享協(xié)議,如CC-BY(知識(shí)共享-署名)協(xié)議。

當(dāng)然,科技期刊的發(fā)表通道再順暢,出版流程再專業(yè),如果沒有科研群體貢獻(xiàn)科學(xué)數(shù)據(jù),都只能是無米之炊、無水之源。因此,筆者呼吁基金資助組織鼓勵(lì)科研群體將公益資金資助的數(shù)據(jù)共享,唯此方能從源頭上保障我國(guó)數(shù)據(jù)論文的發(fā)展。

參考文獻(xiàn)

1 鄧仲華,李志芳.科學(xué)研究范式的演化——大數(shù)據(jù)時(shí)代的科學(xué)研究第四范式.情報(bào)資料工作,2013,20(4):19-23

2 Vision TJ.Open data and the social contract of scientific publishing.Bioscience, 2010, 60(5): 330-331

3 Huang XL,Qiao G.Biodiversity databases should gain support from journals.Trends in Ecology&Evolution, 2011, 26(8): 377-378

4 Molloy JC.The open knowledge foundation:Open datameansbetter science.Plos Biology, 2011, 9(12): e1001195

5 Whitlock MC.Data archiving in ecology and evolution:best practices.Trends in Ecology&Evolution, 2011, 26(2): 61-65

6 Reichman OJ, Jones MB, Schildhauer MP.Challenges and opportunities of open data in ecology.Science, 2011, 331(6018):703-705

7 Hampton SE,Strasser CA,Tewksbury JJ et al.Big data and the future of ecology.Frontiers in Ecology and the Environment, 2013,11(3): 156-162

8 Pensoft data publishing policies and guidelines for biodiversity data.[EB/OL] [2014-06-20].http://www.pensoft.net/J_FILES/Pensoft_Data_Publishing_Policies_and_Guidelines.pdf

9 Cassey P,Blackburn TM.Reproducibility and repeatability in ecology.Bioscience, 2006, 56(12): 958-959

10 Giles J.The trouble with replication.Nature, 2006, 442(7101):344-347

11 Instruction for data paper of ESA.[EB/OL] [2014-06-20].http://www.esapubs.org/archive/instruct_d.htm

12 Chavan V, Penev L.The data paper: a mechanism to incentivize data publishing in biodiversity science.BMC Bioinformatics, 2011,12:S2

13 Newman P,Corke P.Data papers-peer reviewed publication of high quality data sets.International Journal of Robotics Research, 2009,28(5): 587-587

14 Huang XL, Hawkins BA, Qiao GX.Biodiversity data sharing: will peer-reviewed data paperswork?Bioscience, 2013, 63(1): 5-6

15 Borgman CL.科研數(shù)據(jù)共享的挑戰(zhàn).現(xiàn)代圖書情報(bào)與技術(shù),2013, 34(5): 1-20

16 Exlore ecologcal archives.[EB/OL] [2014-06-20].http://esapubs.org/archive/search.php?journal=E&year=2014&firstAuthor=&isDP=1

17 黃永文,張建勇,黃金霞等.國(guó)外開放科學(xué)數(shù)據(jù)研究綜述.現(xiàn)代圖書情報(bào)技術(shù).2013,34(5):21-27

18 Policy DS.National Science Foundation.[EB/OL] [2014-06-20].http: //www.nsf.gov/pubs/policydocs/pappguide/nsf11001/aag_6.jsp

19 About scientifc data.[EB/OL] [2014-06-20].http://www.nature.com/scientificdata/about/

20 Yesson C,Brewer PW,Sutton T,et al.How global is the global biodiversity information facility?Plos One, 2007, 2(11): e1124

21 Alsheikh-Ali AA, Qureshi W, Al-Mallah MH, et al.Public availability of published research data in high-impact journals.Plos One, 2011, 6(9): e24357

22 Vines TH, Albert AYK, Andrew L, et al.The availability of research data declines rapidly with article age.Current Biology,2014, 24(1): 94-97

23 Tenopir C, Allard S, Douglass K,et al.Data sharing by scientists:practices and perceptions.Plos One, 2011, 6(6): e21101

24 Costello MJ, Michener WK, Gahegan M, et al.Biodiversity data should be published, cited,and peer reviewed.Trends in Ecology&Evolution, 2013, 28(8): 454-461

25 Chavan VS,Ingwersen P.Towards a data publishing framework for primary biodiversity data:challenges and potentials for the biodiversity informatics community.BMC Bioinformatics, 2009, 10(Suppl 14): S2

26 Heidorn P.Shedding light on the dark data in the long tail of science.Library Trends, 2008, 57(2): 280-299

27 生物多樣性投稿簡(jiǎn)則.[EB/OL] [2014-09-20].http://www.biodiversity-science.net/CN/column/column16.shtml

28 植物生態(tài)學(xué)報(bào)投稿簡(jiǎn)則.[EB/OL] [2014-09-20].http://www.plant-ecology.com/CN/column/column106.shtml

猜你喜歡
論文期刊科學(xué)
期刊更名啟事
期刊簡(jiǎn)介
期刊問答
點(diǎn)擊科學(xué)
科學(xué)大爆炸
科學(xué)拔牙
下期論文摘要預(yù)登
下期論文摘要預(yù)登
下期論文摘要預(yù)登
2013年5—12月最佳論文
太和县| 桦甸市| 高青县| 新沂市| 南和县| 襄城县| 微博| 长乐市| 水富县| 红桥区| 浦江县| 绥宁县| 永胜县| 永仁县| 秦安县| 屯门区| 西宁市| 曲水县| 普定县| 临沂市| 如皋市| 运城市| 兰州市| 咸丰县| 瑞金市| 山阳县| 肥西县| 香格里拉县| 隆回县| 宜兰市| 汝州市| 洛南县| 界首市| 西和县| 定襄县| 民县| 汶川县| 堆龙德庆县| 镶黄旗| 广平县| 东乌珠穆沁旗|