文/ 傅天珍 陳妙貞
數(shù)據(jù)是科學(xué)研究和發(fā)現(xiàn)的基礎(chǔ)。出版與論文相關(guān)的科學(xué)數(shù)據(jù)更具再驗證、可挖掘和重復(fù)利用的學(xué)術(shù)價值。隨著科學(xué)數(shù)據(jù)共享和可獲取呼聲的高漲,國際上越來越多的期刊開始重視科學(xué)數(shù)據(jù)的存繳和出版,紛紛制定相關(guān)政策,要求作者在發(fā)表論文時公開相關(guān)原始數(shù)據(jù),將數(shù)據(jù)存儲到公共數(shù)據(jù)倉儲庫或者以補充文件形式遞交,實現(xiàn)論文與數(shù)據(jù)的實時關(guān)聯(lián)和集成出版。[1]美國生態(tài)學(xué)會(ESA)創(chuàng)辦的期刊自2000年起,便要求作者將論文相關(guān)的數(shù)據(jù)在學(xué)會數(shù)據(jù)庫中注冊;Nature(《自然》)則按數(shù)據(jù)類型、學(xué)科以及作者反饋制定了詳細、規(guī)范的數(shù)據(jù)出版框架和流程。國外還開展了多項定量或定性的政策效果研究,一致發(fā)現(xiàn)強有力的數(shù)據(jù)出版政策能顯著提高論文的引用率和數(shù)據(jù)的可用性,有效推動科研人員進行科學(xué)數(shù)據(jù)共享。[2-4]從廣義上講,數(shù)字時代的數(shù)據(jù)出版是任何在互聯(lián)網(wǎng)或數(shù)據(jù)庫中公開數(shù)據(jù)的行為。吳立宗等則認(rèn)為科學(xué)數(shù)據(jù)出版指將數(shù)據(jù)作為一種重要的科研成果,從科學(xué)研究的角度對科學(xué)數(shù)據(jù)進行同行審議和公開公布,并創(chuàng)建標(biāo)準(zhǔn)和永久的數(shù)據(jù)引用信息,供其他研究性文章引證。[5]當(dāng)前,我國學(xué)術(shù)期刊正努力朝國際化發(fā)展,如何應(yīng)對科學(xué)數(shù)據(jù)共享的全球化訴求將成為今后出版界的關(guān)注焦點。為進一步提高學(xué)術(shù)論文質(zhì)量、增強論文相關(guān)數(shù)據(jù)的再利用,提升期刊的國際影響力,我國學(xué)術(shù)期刊亟須重視對數(shù)據(jù)共享意識和行為的政策引導(dǎo),合理制定并完善數(shù)據(jù)出版政策。
我國是科技期刊大國,但在質(zhì)量上與國際平均水平還存在較大差距,開放獲取理念和對科學(xué)數(shù)據(jù)的重視程度也相對較弱。為更直觀和有效地分析我國學(xué)術(shù)期刊出版政策的制定情況,本文以中國學(xué)術(shù)期刊(光盤版)電子雜志社、清華大學(xué)圖書館、中國學(xué)術(shù)文獻國際評價研究中心遴選出的“2013中國最具國際影響力學(xué)術(shù)期刊”為調(diào)查對象,[6]包括自然科學(xué)與工程技術(shù)期刊175種,人文社會科學(xué)期刊56種,于2014年7~8月開展網(wǎng)絡(luò)調(diào)研。通過查看編輯部網(wǎng)頁中的“作者須知”“投稿須知”“投稿指南”,統(tǒng)計分析期刊數(shù)據(jù)出版政策的有無、強弱、學(xué)科和影響因子分布等。
表1顯示,即使在我國最具國際影響力的期刊中,擁有數(shù)據(jù)出版政策的期刊數(shù)量仍非常有限,且主要集中在自然科學(xué)與工程技術(shù)類期刊。其中,被SCI收錄的期刊中具有數(shù)據(jù)出版政策的比例是34.7%,而非SCI期刊擁有數(shù)據(jù)出版政策的比例僅為7.8%,SCI期刊是非SCI期刊的4.5倍;英文期刊中已制定數(shù)據(jù)出版政策的比例是36.5%,中文期刊比例為10%,英文期刊是中文期刊的3.7倍。數(shù)據(jù)表明,被SCI收錄的期刊和英文語種期刊的優(yōu)勢較明顯。人文社會科學(xué)期刊中僅1種被SSCI收錄,具有數(shù)據(jù)出版政策的期刊數(shù)量僅占總數(shù)的8.9%。從政策的強度來看,要求在稿件遞交前將論文相關(guān)數(shù)據(jù)遞交到指定數(shù)據(jù)倉儲庫,或明確表示若不附數(shù)據(jù)則視稿件不合格的期刊較少,占具有數(shù)據(jù)出版政策期刊總數(shù)的28.9%。大部分期刊以鼓勵性政策為主,僅在補充文件或者支持材料中提及,而且限制文件的大小。
表1 2013年中國最具影響力學(xué)術(shù)期刊的數(shù)據(jù)出版政策
不同學(xué)科領(lǐng)域的研究對象、研究方法以及共享理念存在差異,直接導(dǎo)致期刊對科學(xué)數(shù)據(jù)重視程度的不同。調(diào)查發(fā)現(xiàn),我國具有數(shù)據(jù)出版政策的學(xué)術(shù)期刊主要集中在生物學(xué)、醫(yī)藥學(xué)和化學(xué)領(lǐng)域,分別占總數(shù)的27%、16%和13%。其次依次為材料、地質(zhì)、物理、環(huán)境和心理學(xué)等,具體見圖1。其中,生物學(xué)科,包括植物、動物和昆蟲類學(xué)術(shù)期刊大都制定了詳細并嚴(yán)格的科學(xué)數(shù)據(jù)存繳政策,較強政策的期刊數(shù)占所有具數(shù)據(jù)出版政策生物學(xué)期刊的66.7%。對數(shù)據(jù)有嚴(yán)格要求的還包括Nano Research(《納米研究》)、Chinese journal of Integrative Medicine(《中國結(jié)合醫(yī)學(xué)雜志》)以及地質(zhì)學(xué)的《巖石學(xué)報》《地質(zhì)學(xué)報》和Acta Geologica Sinica(English Edition)(《地質(zhì)學(xué)報》英文版)。
圖1 我國具有數(shù)據(jù)出版政策的學(xué)術(shù)期刊學(xué)科分布
“2013中國最具國際影響力學(xué)術(shù)期刊”通過“國際影響力指數(shù)”“國際他引總被引頻次”“國際他引影響因子”三個維度來評價期刊的國際影響力。通過SPSS統(tǒng)計發(fā)現(xiàn),具有數(shù)據(jù)出版政策的期刊數(shù)量與這三個指標(biāo)呈正相關(guān)。已制定數(shù)據(jù)出版政策的自然科學(xué)與工程技術(shù)期刊中,該三個指標(biāo)的中值分別為171.76、913.5、0.99,而無相關(guān)政策期刊的指標(biāo)中值分別為90.24、696、0.31。此外,具有數(shù)據(jù)出版政策的期刊大多與國際知名出版商合作,如自然出版集團(Nature)、德國施普林格(Springer)以及牛津大學(xué)出版社(Oxford University Press)等。
數(shù)據(jù)出版具有完整的生命周期,包括數(shù)據(jù)的生產(chǎn)和遞交、審議和發(fā)布、保存和共享、引用和評價。[7]完善的期刊數(shù)據(jù)出版政策能夠有效引導(dǎo)作者遞交并共享科學(xué)數(shù)據(jù),促進國內(nèi)外學(xué)術(shù)交流。綜合來看,我國學(xué)術(shù)期刊的數(shù)據(jù)出版還處于萌芽狀態(tài),政策內(nèi)容參差不齊,大致可分成動機和后果描述、數(shù)據(jù)的存繳方式、質(zhì)量控制以及隱私保護三部分。
一些期刊在數(shù)據(jù)出版政策中,首先聲明要求遞交數(shù)據(jù)的動機。內(nèi)容涵蓋解釋數(shù)據(jù)共享能促進科學(xué)進步、有利于讀者理解和再利用、能提高論文質(zhì)量、協(xié)助專家進行同行評審以及表明期刊對開放獲取運動的支持等。明確并合理的動機描述不僅體現(xiàn)對作者勞動成果的尊重,更能增強其數(shù)據(jù)共享意識,提高作者數(shù)據(jù)存繳的主動性和積極性。我國已有部分期刊對數(shù)據(jù)存繳的動機做出簡單解釋,但內(nèi)容較單一。如,Nano Research、Advances in Atmospheric Sciences(《大 氣科學(xué)進展》英文版)等指出保存科學(xué)數(shù)據(jù)能方便審稿人訪問;Cellular &Molecular Immunology(《中國免疫學(xué)雜志》英文版)、Particuology(《顆粒學(xué)報》英文版)等表明數(shù)據(jù)是論文不可缺少的一部分,對專業(yè)讀者有潛在價值;《化學(xué)學(xué)報》表示存檔數(shù)據(jù)能為將來的研究工作建立重要的實驗和計算機檔案。
后果描述是指對不遵守期刊數(shù)據(jù)遞交原則的情況采取一定的措施,對作者遞交與論文相關(guān)的數(shù)據(jù)起到強有力的約束和監(jiān)管作用。這類描述一般存在強制性政策中,期刊在明確“必須”遞交科學(xué)數(shù)據(jù)后,附加“如果在出版前不遞交數(shù)據(jù),將取消發(fā)表權(quán)”“如果在遞交稿件時未保存數(shù)據(jù),將不接收”等語句,以進一步強化其立場和原則。我國期刊非常欠缺這方面的約束,僅少數(shù)期刊提及后果,如《地質(zhì)學(xué)報》、Acta Geologica Sinica(English Edition)表示“不附地質(zhì)圖者,均視為稿件不合格”。
數(shù)據(jù)的存繳方式和路徑是期刊出版政策中的核心內(nèi)容,目前主要有以下幾種:①指定幾個數(shù)據(jù)倉儲庫,并要求提供注冊號或檢索地址。這種數(shù)據(jù)存繳方式一般體現(xiàn)在具有較完善學(xué)科數(shù)據(jù)倉儲庫的生物、化學(xué)等領(lǐng)域,要求也相對嚴(yán)格。Journal of Integrative Plant Biology(《植物學(xué)報》英文版)、Insect Science(《昆蟲科學(xué)》)等要求新核苷酸序列必須存放到日本DDBJ(日本DNA數(shù)據(jù)庫)、歐洲EMBL(由歐洲分子生物實驗室建立的DNA數(shù)據(jù)庫)或美國的GenBank〔由美國國家生物技術(shù)信息中心(NCBI)建立的DNA數(shù)據(jù)庫〕數(shù)據(jù)庫中,并將獲取的登錄號寫入稿件中;Protein &Cell(《蛋白質(zhì)與細胞前沿》英文版)則要求與生物分子結(jié)構(gòu)、原子坐標(biāo)相關(guān)的數(shù)據(jù)必須存儲到全球蛋白質(zhì)數(shù)據(jù)銀行。②存入學(xué)科領(lǐng)域公認(rèn)的開放獲取數(shù)據(jù)平臺或網(wǎng)站門戶。如,Journal of Integrative Plant Biology在網(wǎng)站首頁便明確要求與擬南芥基因相關(guān)的數(shù)據(jù)必須提交到擬南芥信息資源庫(TAIR)。③以輔助材料或補充文件形式直接發(fā)送給編輯部,并與論文以電子形式集成發(fā)表。我國大部分期刊支持這種形式,一般在作者自己要求上傳,或者由于文章篇幅受限及動畫、視頻等格式無法在印刷版上發(fā)表等情況下使用。④少數(shù)刊物要求作者承諾按需提供。《管理世界》要求作者能夠配合編輯部以及讀者的要求,提供與論文相關(guān)的研究數(shù)據(jù)。
數(shù)據(jù)的質(zhì)量控制涉及數(shù)據(jù)的格式、內(nèi)容與注釋的完整性、同行評議等。精確、規(guī)范的數(shù)據(jù)是保證論文以及期刊質(zhì)量的先決條件。我國學(xué)術(shù)期刊大多歡迎作者提供可編輯的原始數(shù)據(jù),但并未建立嚴(yán)格的科學(xué)數(shù)據(jù)審查機制,要求作者負(fù)責(zé)數(shù)據(jù)內(nèi)容的準(zhǔn)確性和完整性。對于存儲在公共數(shù)據(jù)倉儲庫的數(shù)據(jù),遵循不同數(shù)據(jù)倉儲庫的存繳、出版和共享政策;對于以補充文件上傳的數(shù)據(jù),則有文件格式、數(shù)量和大小的限制,并要求作者對數(shù)據(jù)集進行描述,以提高數(shù)據(jù)的可用性。一些期刊如Nano Research、《無機化學(xué)學(xué)報》還表示愿意幫助作者獲取數(shù)據(jù)注冊號,且提供數(shù)據(jù)保存指引。
隱私保護也是科學(xué)數(shù)據(jù)出版過程中必須考慮的環(huán)節(jié)。醫(yī)學(xué)、心理學(xué)等學(xué)科在數(shù)據(jù)獲取過程涉及被試驗者的個人隱私和倫理道德,不能完全公開研究數(shù)據(jù)。對涉及商業(yè)、政治機密或?qū)⒅魏罄m(xù)研究的科學(xué)數(shù)據(jù),也需要制定支持隱私的例外政策。我國學(xué)術(shù)期刊對延遲遞交或無法提供數(shù)據(jù)的情況,一般告知通過聯(lián)系編輯協(xié)商解決,尚未針對各類隱私保護制定數(shù)據(jù)遞交的具體要求。
學(xué)術(shù)期刊的數(shù)據(jù)出版是指除發(fā)表學(xué)術(shù)論文外,直接出版原始數(shù)據(jù),使之達到可引用和追溯的狀態(tài)。理想的數(shù)據(jù)出版是為原始數(shù)據(jù)提供標(biāo)準(zhǔn)、結(jié)構(gòu)化的數(shù)據(jù)格式,通過唯一標(biāo)識符能永久訪問、下載和再利用。它將有效打破信息壁壘,實現(xiàn)學(xué)術(shù)論文和科學(xué)數(shù)據(jù)的實時關(guān)聯(lián),對提高論文質(zhì)量、期刊的學(xué)術(shù)影響力以及促進國內(nèi)外學(xué)術(shù)交流有重要的意義。然而,數(shù)據(jù)出版在我國學(xué)術(shù)界尚屬一個全新的領(lǐng)域,學(xué)術(shù)期刊在促進數(shù)據(jù)共享方面缺乏重視、經(jīng)驗和制度支持,亟須探索發(fā)展之路。
期刊是國內(nèi)外學(xué)術(shù)交流和傳播的主要媒介,有責(zé)任倡導(dǎo)科研人員公開論文相關(guān)的科學(xué)數(shù)據(jù),并負(fù)責(zé)數(shù)據(jù)的監(jiān)管和出版。國外研究表明,期刊政策的導(dǎo)向和實施力度直接影響作者的實際共享行為。期刊的數(shù)據(jù)存繳政策和可用性聲明越強,在相應(yīng)數(shù)據(jù)倉儲庫中存儲的數(shù)據(jù)也越多。曾經(jīng)在開放獲取期刊發(fā)表過論文或者有數(shù)據(jù)共享經(jīng)驗者,更愿意共享數(shù)據(jù)。[8]可見,完善和嚴(yán)格的期刊數(shù)據(jù)出版政策能有效增強作者的共享意識,實現(xiàn)數(shù)據(jù)助力科學(xué)的美好愿景。我國數(shù)據(jù)共享研究起步較晚,雖然很多期刊支持開放獲取,但對論文相關(guān)科學(xué)數(shù)據(jù)的重視程度還遠遠不夠。學(xué)術(shù)期刊應(yīng)首先加強編輯隊伍的科學(xué)數(shù)據(jù)共享意識,重視期刊數(shù)據(jù)出版政策的制定和完善,探索學(xué)術(shù)論文與科學(xué)數(shù)據(jù)集成出版的新模式。
數(shù)據(jù)驅(qū)動科學(xué)的時代,科學(xué)數(shù)據(jù)共享的趨勢已勢不可擋。以Nature、PLOS ONE《公共科學(xué)圖書館:綜合》為代表的國際高影響力期刊已經(jīng)制定了全面、規(guī)范的數(shù)據(jù)出版政策。Nature還專門建立了論文與科學(xué)數(shù)據(jù)集成出版平臺。通過數(shù)據(jù)描述符,實現(xiàn)傳統(tǒng)期刊論文與不同數(shù)據(jù)倉儲庫數(shù)據(jù)集的實時關(guān)聯(lián),聚焦論文相關(guān)數(shù)據(jù)的來源、質(zhì)量信度、引用情況,最大限度提高數(shù)據(jù)可用性。為更有效地揭示多種格式和類型的科學(xué)數(shù)據(jù),生物、地球科學(xué)、化學(xué)等領(lǐng)域還出現(xiàn)了數(shù)據(jù)期刊。如2013年,Pensoft(歐洲一家專注于生物多樣性和自然歷史的出版商)出版集團推出的Biodiversity Data Journal(《生物多樣性數(shù)據(jù)期刊》),創(chuàng)建了一種基于同行評議、開放獲取、自動導(dǎo)航的聯(lián)機出版平臺[8]。我國學(xué)術(shù)期刊迫切需要及時關(guān)注并跟蹤國際數(shù)據(jù)出版動態(tài),引進成功經(jīng)驗,并且根據(jù)學(xué)科和辦刊特色,通盤考慮數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)發(fā)布、同行評議、永久保存、數(shù)據(jù)引用以及評價環(huán)節(jié),構(gòu)建特色化的數(shù)據(jù)出版體系,為今后大數(shù)據(jù)環(huán)境下的數(shù)據(jù)密集型研究奠定基礎(chǔ)。
數(shù)據(jù)出版是一項復(fù)雜工程,涉及元數(shù)據(jù)描述、數(shù)據(jù)集成和二次加工、數(shù)據(jù)永久存儲以及知識產(chǎn)權(quán)保護等問題。學(xué)術(shù)期刊一般缺乏數(shù)據(jù)管理、共享以及長期存儲經(jīng)驗,需要聯(lián)合數(shù)據(jù)中心、出版集團以及相關(guān)政府機構(gòu),建立聯(lián)合互動的數(shù)據(jù)管理和出版機制。目前,國際上已經(jīng)建立一些成熟的數(shù)據(jù)中心,如美國的Dryad、Figshare、英國的GenBank等。這些數(shù)據(jù)倉儲庫在各自學(xué)科已形成較大的影響力,大量數(shù)據(jù)在其中注冊并永久保存。學(xué)術(shù)期刊可以與之合作,通過采用聯(lián)合數(shù)據(jù)存繳政策,不僅解決技術(shù)問題,也能減少重復(fù)鏈接和不必要的浪費,共同提升數(shù)據(jù)出版品質(zhì)。同時,爭取與國際著名出版集團合作也將推動我國學(xué)術(shù)期刊的數(shù)據(jù)出版。Nature、Springer等出版商引領(lǐng)國際前沿,將提供更多的數(shù)據(jù)共享信息和出版策略指導(dǎo)。此外,國家層面也應(yīng)立足長遠,從數(shù)據(jù)出版角度提供相關(guān)制度支持,協(xié)調(diào)數(shù)據(jù)共享與知識產(chǎn)權(quán)保護之間的矛盾,并促進數(shù)據(jù)中心與出版社之間的合作。
雖然國內(nèi)外很多學(xué)術(shù)期刊紛紛制定數(shù)據(jù)出版政策,但執(zhí)行效果并不理想。由于缺乏規(guī)范的科學(xué)數(shù)據(jù)引用和評價機制,科學(xué)家們擔(dān)心數(shù)據(jù)被盜用、數(shù)據(jù)質(zhì)量無法保證、數(shù)據(jù)共享無法體現(xiàn)學(xué)術(shù)水平等,在數(shù)據(jù)共享和出版過程中顧慮重重。因此,要建立無障礙的數(shù)據(jù)出版體系,必須鼓勵作者引用科學(xué)數(shù)據(jù),嘗試建立科學(xué)數(shù)據(jù)評價體系。首先,學(xué)術(shù)期刊必須允許并鼓勵作者對科學(xué)數(shù)據(jù)的引用,并與審稿專家、數(shù)據(jù)中心等共同制定規(guī)范的數(shù)據(jù)引用格式。其次,期刊需制定明確的數(shù)據(jù)引用說明和評審原則,要求評審專家在審稿過程中進行嚴(yán)格審查,將引用的規(guī)范程度和數(shù)據(jù)的質(zhì)量作為論文質(zhì)量的重要考核指標(biāo)。最后,結(jié)合傳統(tǒng)論文的評價方法,探索學(xué)術(shù)界承認(rèn)并能廣泛接受的科學(xué)數(shù)據(jù)評價機制,將數(shù)據(jù)出版納入我國科研成果的評價體系中,從根本上激發(fā)科研人員的數(shù)據(jù)共享和出版的積極性。
[1]Heather A.Piwowar,Wendy W.Chapman.A Review of Journal Policies for Sharing Research Data[A].In:Proceedings ELPUB 2008 Conference on Electronic Publishing[C].Toronto,Canada,2008
[2]Alawi A.Alsheikh-Ali,Waqas Qureshi,Mouaz H.Al-Mallah,et al.Public Availability of Published Research Data in High-Impact Journals[J].PLoS ONE,2011,6(9):e24357.doi:10.1371/journal.pone.0024357
[3]何琳,常穎聰.國內(nèi)外科學(xué)數(shù)據(jù)出版研究進展[J].圖書情報工作,2014,58(5)
[4]Timothy H.Vines,Rose L.Andrew,Dan G.Bock,et al.Mandated data archiving greatly improves access to research data[J].The FASEB Journal,2013,(27)
[5][7]吳立宗,王亮緒,南卓銅,等.科學(xué)數(shù)據(jù)出版現(xiàn)狀及其體系框架[J].遙感技術(shù)與應(yīng)用,2013,28(3)
[6]章紅雨.2013中國最具國際影響力學(xué)術(shù)期刊[N].中國新聞出版報,2013-12-30
[8]馬建玲,曹月珍,王思麗,等.學(xué)術(shù)論文與科學(xué)數(shù)據(jù)集成出版研究[J].情報資料工作,2014,(2)