秦長(zhǎng)江 吳思潔 王丹丹
[摘 要] 選取國(guó)外兩大著名期刊出版機(jī)構(gòu)愛(ài)思唯爾(Elsevier)、威利(Wiley)為研究主體,采用網(wǎng)絡(luò)調(diào)研法,以兩大出版機(jī)構(gòu)相關(guān)數(shù)據(jù)政策文本、指南為藍(lán)本,詳細(xì)解析其科研數(shù)據(jù)政策類型、科研數(shù)據(jù)管理各個(gè)流程、具體實(shí)施措施等。結(jié)果表明兩大出版機(jī)構(gòu)都有一系列完備的多層次的數(shù)據(jù)政策,政策內(nèi)容均涵蓋數(shù)據(jù)出版的全流程,包含研究數(shù)據(jù)的存儲(chǔ)、評(píng)審、共享、引用等,且大部分流程的標(biāo)準(zhǔn)高度相似。
[關(guān)鍵詞] 學(xué)術(shù)期刊 科研數(shù)據(jù) 出版機(jī)構(gòu) 數(shù)據(jù)管理 數(shù)據(jù)共享
[中圖分類號(hào)] G255.2[文獻(xiàn)標(biāo)識(shí)碼] A[文章編號(hào)] 1009-5853 (2021) 06-0046-09
[Abstract] This article selects the two famous foreign journal publishing institutions Elsevier and Wiley as the research subjects. Based on the relevant data policy texts and guidelines of the official websites of the two major publishing institutions, the network research method was used to analyze the types of research data policies, various processes of research data management, and specific implementation measures of the two major publishing institutions in detail. The result shows that the two major publishing organizations have a complete series of multi-level data policies. The content of the data policies covers the entire process of data publishing, including the storage, review, sharing, and citation of research data, and most of the process standards highly similar.
[Key words] Academic journals Scientific research data Publishing agency Data manage-ment Data sharing
近些年學(xué)術(shù)期刊出版機(jī)構(gòu)在促進(jìn)、實(shí)施和執(zhí)行相對(duì)標(biāo)準(zhǔn)和統(tǒng)一的科研數(shù)據(jù)政策實(shí)踐中發(fā)揮著越來(lái)越重要的作用,學(xué)術(shù)期刊出版機(jī)構(gòu)通過(guò)積極制定標(biāo)準(zhǔn)化的科研數(shù)據(jù)政策框架,指導(dǎo)所屬期刊制定自己的科研數(shù)據(jù)政策,以此促進(jìn)科研數(shù)據(jù)的共享和重用[1]。本文選取了在全球范圍內(nèi)學(xué)術(shù)影響力大且具有很好示范引領(lǐng)作用的兩大國(guó)際著名出版集團(tuán)愛(ài)思唯爾(Elsevier)和威利(Wiley),對(duì)其科研數(shù)據(jù)政策框架制定體系和其政策的實(shí)踐情況進(jìn)行調(diào)查分析,以期為我國(guó)出版機(jī)構(gòu)等相關(guān)部門(mén)科研數(shù)據(jù)政策的制定和實(shí)施提供借鑒。
1 愛(ài)思唯爾的數(shù)據(jù)政策框架
1.1 概況
愛(ài)思唯爾作為全世界最大的出版集團(tuán)之一,共出版2500余種數(shù)字化期刊,發(fā)表了全球18%的科技成果,引用占比高達(dá)25%。愛(ài)思唯爾認(rèn)為科研數(shù)據(jù)是科研論文的基礎(chǔ)和支撐,對(duì)科研數(shù)據(jù)進(jìn)行良好的管理和共享有利于其他研究人員重用實(shí)驗(yàn)結(jié)果,并在已有研究成果的基礎(chǔ)上進(jìn)行探索創(chuàng)新,支持研究的透明性和可重復(fù)性,從而使研究更加高效。愛(ài)思唯爾在滿足研究人員存儲(chǔ)、共享、發(fā)現(xiàn)和重用數(shù)據(jù)的需求中發(fā)揮著關(guān)鍵作用,它通過(guò)與其他利益相關(guān)者積極的合作來(lái)更好地提高數(shù)據(jù)的使用效率[2]。
目前科研數(shù)據(jù)主要通過(guò)期刊論文進(jìn)行傳播與共享,但一些并未通過(guò)期刊發(fā)表的隱藏?cái)?shù)據(jù)給科研數(shù)據(jù)的獲取與共享帶來(lái)了挑戰(zhàn),因此愛(ài)思唯爾作為發(fā)表和傳播科研數(shù)據(jù)關(guān)鍵環(huán)節(jié)的出版機(jī)構(gòu),在2015年提出了較為詳細(xì)全面的科研數(shù)據(jù)政策框架。愛(ài)思唯爾出版集團(tuán)旗下的期刊、圖書(shū)等均可在該科研數(shù)據(jù)政策框架下,結(jié)合自身的特色和需求制定最為適宜自身特色的科研數(shù)據(jù)政策,以此來(lái)較好地解決科研數(shù)據(jù)的獲取與共享問(wèn)題[3]。
1.2 內(nèi)容解析
科研數(shù)據(jù)是出版物的核心,愛(ài)思唯爾鼓勵(lì)或要求研究人員共享其在研究過(guò)程中產(chǎn)生的科研數(shù)據(jù),使其可訪問(wèn)、可發(fā)現(xiàn)并便于其他研究者重復(fù)使用。愛(ài)思唯爾認(rèn)為,從廣義上講,科研數(shù)據(jù)指的是證實(shí)作者研究發(fā)現(xiàn)的結(jié)果且尚未作為期刊論文一部分發(fā)表的觀察或?qū)嶒?yàn)的結(jié)果??蒲袛?shù)據(jù)可包括但不限于:原始數(shù)據(jù),處理后的數(shù)據(jù)、軟件、算法、協(xié)議、方法、材料。表現(xiàn)形式可以通過(guò)音頻、圖像、電子表格等形式呈現(xiàn)。
如表1所示,針對(duì)不同期刊和學(xué)科的差異,愛(ài)思唯爾提出了五種政策強(qiáng)度不同的指導(dǎo)方針,期刊可以根據(jù)其學(xué)科的特點(diǎn)進(jìn)行相應(yīng)的調(diào)整,為自己選擇適合的數(shù)據(jù)政策類型;隸屬不同學(xué)科領(lǐng)域的科研人員都可以在了解各種期刊聲明中的數(shù)據(jù)政策后,對(duì)在何處以及如何進(jìn)行數(shù)據(jù)發(fā)布做出明智的選擇[4]。
愛(ài)思唯爾的科研數(shù)據(jù)政策適用于所有期刊,它為期刊如何鼓勵(lì)和支持科研人員提供科研數(shù)據(jù)提供了數(shù)據(jù)政策框架。愛(ài)思唯爾科研數(shù)據(jù)政策框架提出后,所屬絕大部分期刊都根據(jù)科研數(shù)據(jù)政策框架制定了較為規(guī)范的數(shù)據(jù)政策,政策中對(duì)出版道德、利益聲明、作者貢獻(xiàn)、開(kāi)放獲取、雙盲審查、同行評(píng)審、參考文獻(xiàn)、版權(quán)、數(shù)據(jù)可視化、科研數(shù)據(jù)等都進(jìn)行了規(guī)定和聲明。
大部分期刊的數(shù)據(jù)政策都基本采用了愛(ài)思唯爾科研數(shù)據(jù)政策框架中的數(shù)據(jù)政策內(nèi)容和要求,少數(shù)期刊根據(jù)自身情況對(duì)科研數(shù)據(jù)政策框架進(jìn)行了調(diào)整,如Heliyon在愛(ài)思唯爾原有數(shù)據(jù)政策的基礎(chǔ)上在版權(quán)與引用許可方面,特別提出兩個(gè)可供作者選擇的許可協(xié)議,來(lái)確定數(shù)據(jù)的知識(shí)共享屬性,反映了愛(ài)思唯爾科研數(shù)據(jù)政策框架應(yīng)用的靈活性。以愛(ài)思唯爾所屬的社會(huì)科學(xué)類期刊為例,經(jīng)統(tǒng)計(jì)截止到2020年12月,愛(ài)思唯爾社會(huì)科學(xué)類263本期刊中擁有明確數(shù)據(jù)政策的期刊有254本(占96.6%),可見(jiàn)愛(ài)思唯爾的科研數(shù)據(jù)政策框架應(yīng)用的廣泛性和可行性,這些期刊鼓勵(lì)作者提供數(shù)據(jù)以及數(shù)據(jù)簡(jiǎn)介、數(shù)據(jù)鏈接、數(shù)據(jù)可用聲明等。
愛(ài)思唯爾在科研數(shù)據(jù)政策實(shí)施過(guò)程中要求各實(shí)施主體積極響應(yīng)并完善科研數(shù)據(jù)共享政策的具體實(shí)施細(xì)節(jié)。期刊、出版機(jī)構(gòu)以及科研機(jī)構(gòu)、圖書(shū)館等利益相關(guān)方應(yīng)該做到:制定數(shù)據(jù)指南并將指南標(biāo)準(zhǔn)化,使數(shù)據(jù)生產(chǎn)者知道如何存儲(chǔ)和共享數(shù)據(jù),并根據(jù)科研人員遇到的問(wèn)題和需求及時(shí)調(diào)整以實(shí)現(xiàn)最佳的數(shù)據(jù)獲取和共享;提供有效管理數(shù)據(jù)所需的結(jié)構(gòu)、工作流程和技術(shù),使研究更加高效,避免重復(fù)勞動(dòng);關(guān)注工具的開(kāi)發(fā)和政策的制定,鼓勵(lì)實(shí)踐并作示范,獲得科研人員信任;建立審查和評(píng)審機(jī)制,對(duì)共享的科研數(shù)據(jù)進(jìn)行審查,確保其正確性、有效性和可重用性;加強(qiáng)和其他相關(guān)機(jī)構(gòu)的合作,并不斷改進(jìn)以促進(jìn)科學(xué)發(fā)展,使數(shù)據(jù)的價(jià)值最大化[5]。同時(shí)要充分保障數(shù)據(jù)生產(chǎn)者擁有自己數(shù)據(jù)的最大控制權(quán)??蒲腥藛T在提交數(shù)據(jù)的同時(shí),提供一份數(shù)據(jù)可用性聲明來(lái)把控?cái)?shù)據(jù)使用者訪問(wèn)和使用自己所有數(shù)據(jù)的方法和時(shí)間。數(shù)據(jù)使用者應(yīng)當(dāng)認(rèn)可和重視數(shù)據(jù)生產(chǎn)者的貢獻(xiàn),若引用他人數(shù)據(jù)來(lái)支撐自己的研究,應(yīng)當(dāng)將引用的數(shù)據(jù)標(biāo)注出來(lái)??蒲袛?shù)據(jù)共享應(yīng)借助科學(xué)規(guī)范的平臺(tái)進(jìn)行,數(shù)據(jù)使用者應(yīng)嚴(yán)格按照平臺(tái)的作者數(shù)據(jù)指南,在遵循數(shù)據(jù)管理要求的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行良好的管理,從而實(shí)現(xiàn)最佳訪問(wèn)和重用。
愛(ài)思唯爾在提出科研數(shù)據(jù)政策標(biāo)準(zhǔn)框架后,又提出數(shù)據(jù)管理流程路線圖,主要目的是考慮所有利益相關(guān)者,并以最佳方式來(lái)優(yōu)化數(shù)據(jù)重用,使數(shù)據(jù)能夠最大化利用。方法是通過(guò)調(diào)整以下10個(gè)方面來(lái)優(yōu)化數(shù)據(jù)重用。如圖1,這個(gè)金字塔以馬斯洛的人類需求層次為模型,可以看作是公平數(shù)據(jù)原則(FAIR)的擴(kuò)展(數(shù)據(jù)應(yīng)該是可找到的、可訪問(wèn)的、可互操作的和可重用的),也可以作為在整個(gè)數(shù)據(jù)生命周期中開(kāi)發(fā)更好的數(shù)據(jù)管理流程和系統(tǒng)的路線圖。
1.2.1 科研數(shù)據(jù)的存儲(chǔ)
科研數(shù)據(jù)需求層次結(jié)構(gòu)中的第一步是需要存儲(chǔ)已獲取的數(shù)據(jù)。許多研究團(tuán)隊(duì)在研究之前都沒(méi)有明確要將其數(shù)據(jù)存儲(chǔ)在什么地方,這使得該團(tuán)隊(duì)內(nèi)部和外部的研究人員都難以將數(shù)據(jù)重復(fù)使用,因此愛(ài)思唯爾引入了數(shù)據(jù)管理計(jì)劃,以確保研究團(tuán)隊(duì)在研究之前就確定存儲(chǔ)數(shù)據(jù)集的方式。通過(guò)電子實(shí)驗(yàn)室筆記本、通用數(shù)據(jù)存儲(chǔ)庫(kù)和特定領(lǐng)域數(shù)據(jù)庫(kù)等系統(tǒng),允許研究人員在不公開(kāi)數(shù)據(jù)的情況下存儲(chǔ)其數(shù)據(jù),為研究人員在研究項(xiàng)目期間存儲(chǔ)數(shù)據(jù)提供了幫助。
1.2.2 科研數(shù)據(jù)的保存
數(shù)據(jù)需要進(jìn)行長(zhǎng)期保存。一旦存儲(chǔ)了研究數(shù)據(jù),就需要以獨(dú)立格式的方式保存,否則數(shù)據(jù)就會(huì)過(guò)時(shí)。只有當(dāng)數(shù)據(jù)以研究人員可以使用的格式存在時(shí),它才有價(jià)值,但是很少有研究人員有時(shí)間去翻閱舊研究檔案對(duì)數(shù)據(jù)進(jìn)行恢復(fù)、重新處理和數(shù)字化,因此確保研究數(shù)據(jù)的正確存檔和長(zhǎng)期保存是非常重要的。愛(ài)思唯爾提供了有關(guān)數(shù)據(jù)保存的方式和數(shù)據(jù)保存的基礎(chǔ)設(shè)施等相關(guān)實(shí)踐范例。如荷蘭的數(shù)據(jù)歸檔和網(wǎng)絡(luò)服務(wù)(DANS),提供了有關(guān)數(shù)據(jù)保存的做法和數(shù)據(jù)保存的基礎(chǔ)設(shè)施等相關(guān)實(shí)踐范例。此外,數(shù)據(jù)存儲(chǔ)庫(kù)也可以發(fā)揮重要的作用,特別是當(dāng)它們有可靠的深色存檔(solid dark archives)時(shí),這保證了即使數(shù)據(jù)存儲(chǔ)庫(kù)不再存在,數(shù)據(jù)也不會(huì)丟失。
1.2.3 科研數(shù)據(jù)的可訪問(wèn)
即使存儲(chǔ)并保存了數(shù)據(jù),也不一定意味著可以自動(dòng)訪問(wèn)。越來(lái)越多的出版機(jī)構(gòu)或資助者都要求研究人員提供他們的數(shù)據(jù),但沒(méi)有要求數(shù)據(jù)儲(chǔ)存和保存在哪里。目前研究人員一般是將數(shù)據(jù)存儲(chǔ)在公共存儲(chǔ)庫(kù)中或使用諸如Mendeley Data之類數(shù)據(jù)共享系統(tǒng)來(lái)完成。最近愛(ài)思唯爾推出了開(kāi)放數(shù)據(jù)試點(diǎn)項(xiàng)目,將原始研究數(shù)據(jù)(與文章一起提交)與文章一起開(kāi)放供任何網(wǎng)絡(luò)用戶訪問(wèn),此功能涵蓋了存儲(chǔ),保存,可訪問(wèn)性和可發(fā)現(xiàn)性。研究人員可以提交他們的原始研究數(shù)據(jù)作為補(bǔ)充文件,該文件將在CC-BY許可下提供。這幾乎不需要作者做額外的工作,是使數(shù)據(jù)可訪問(wèn)的一種簡(jiǎn)便方法。
1.2.4 科研數(shù)據(jù)的可發(fā)現(xiàn)
即使數(shù)據(jù)被存儲(chǔ)、保存并原則上可以訪問(wèn),但是如果數(shù)據(jù)不能被其他研究人員發(fā)現(xiàn),則會(huì)事倍功半。目前查找學(xué)術(shù)論文非常簡(jiǎn)單,但想要輕松快速查找到研究數(shù)據(jù)卻極為困難。數(shù)據(jù)的可發(fā)現(xiàn)性可以通過(guò)學(xué)術(shù)論文來(lái)增強(qiáng),也可以獨(dú)立進(jìn)行。愛(ài)思唯爾和其他出版機(jī)構(gòu)均支持將學(xué)術(shù)論文鏈接到這些論文所基于的數(shù)據(jù)集來(lái)增強(qiáng)數(shù)據(jù)的可發(fā)現(xiàn)性,通過(guò)包含數(shù)據(jù)DOI或數(shù)據(jù)訪問(wèn)賬號(hào),自動(dòng)鏈接到公共數(shù)據(jù)庫(kù)中的相關(guān)數(shù)據(jù)。如果在論文發(fā)表時(shí)尚不知道數(shù)據(jù)位置,愛(ài)思唯爾將與外部數(shù)據(jù)存儲(chǔ)庫(kù)協(xié)作,在發(fā)表的論文旁邊自動(dòng)添加數(shù)據(jù)庫(kù)的徽標(biāo),該徽標(biāo)可作為數(shù)據(jù)集的深層鏈接(由論文作者或數(shù)據(jù)管理員保存)。最近有資助機(jī)構(gòu)提議鼓勵(lì)數(shù)據(jù)搜索引擎來(lái)做這項(xiàng)有意義的工作,使研究人員能夠以更便捷更科學(xué)的方式來(lái)訪問(wèn)和查詢從論文中提取的數(shù)據(jù)以及從研究數(shù)據(jù)庫(kù)中導(dǎo)入的表格內(nèi)容,完成科研數(shù)據(jù)的獨(dú)立搜索。
1.2.5 科研數(shù)據(jù)的引用
數(shù)據(jù)引用提供了一種跟蹤、記錄和報(bào)告數(shù)據(jù)提交和重用的方法,并且確保了研究人員的工作獲得認(rèn)可。數(shù)據(jù)共享的障礙之一是,它要求研究人員付出額外的努力,而獲得的回報(bào)卻很少。數(shù)據(jù)引用有可能改變這一點(diǎn),因?yàn)閿?shù)據(jù)引用可以很容易地納入當(dāng)前基于文章引用的獎(jiǎng)勵(lì)系統(tǒng)。因此,研究人員應(yīng)考慮為數(shù)據(jù)提供唯一、持久且可解析的ID。在某些情況下可以使用登錄號(hào)(Accession Numbers),而唯一的持久標(biāo)識(shí)符的最佳示例是數(shù)字對(duì)象標(biāo)識(shí)符(Digital Object Identifier,DOI),文章和數(shù)據(jù)都可以通過(guò)它進(jìn)行標(biāo)識(shí)。另外,F(xiàn)ORCE 11已經(jīng)制定了一套原則來(lái)描述應(yīng)如何引用數(shù)據(jù)。
1.2.6 科研數(shù)據(jù)的可理解
為了使數(shù)據(jù)可以重用,需要明確使用哪些度量單位、參數(shù)和縮寫(xiě)等,如何收集數(shù)據(jù)。因此數(shù)據(jù)來(lái)源對(duì)于理解數(shù)據(jù)至關(guān)重要。最佳方案是在存儲(chǔ)數(shù)據(jù)時(shí)添加適當(dāng)?shù)脑獢?shù)據(jù)。需要添加哪些元數(shù)據(jù)會(huì)因規(guī)程的不同而有差異,但是元數(shù)據(jù)越詳細(xì),其可理解性就越強(qiáng)。出版機(jī)構(gòu)可以在這方面提供幫助,現(xiàn)在有幾家出版機(jī)構(gòu)出版了專門(mén)的數(shù)據(jù)期刊,例如愛(ài)思唯爾的數(shù)據(jù)簡(jiǎn)介(Data in Brief)。在這些數(shù)據(jù)期刊中,科研人員可以提供對(duì)其數(shù)據(jù)集的全面描述,這使其他研究人員更容易理解數(shù)據(jù),捕獲數(shù)據(jù)的過(guò)程,以及數(shù)據(jù)的重新使用者應(yīng)注意的數(shù)據(jù)異常(或捕獲過(guò)程中的異常),以支持適當(dāng)?shù)臄?shù)據(jù)重用。對(duì)于論文中發(fā)布的數(shù)據(jù),愛(ài)思唯爾開(kāi)發(fā)了一套工具來(lái)提高對(duì)科研數(shù)據(jù)的理解,比如論文中的數(shù)據(jù)可視化,比如交互式繪圖。愛(ài)思唯爾將作者提交的數(shù)據(jù)呈現(xiàn)為一個(gè)繪圖,讀者可以將鼠標(biāo)懸停在繪圖上查看數(shù)據(jù)點(diǎn)的值,或者從圖形視圖切換到表格視圖,從而更詳細(xì)地檢查數(shù)據(jù)。
1.2.7 科研數(shù)據(jù)的審查
雖然對(duì)研究論文進(jìn)行同行評(píng)審是學(xué)術(shù)界的普遍而嚴(yán)格的規(guī)則,但對(duì)于科研數(shù)據(jù)的審查卻還很少見(jiàn)??蒲袛?shù)據(jù)的審查是數(shù)據(jù)質(zhì)量控制和數(shù)據(jù)可信賴性的重要保證。出版機(jī)構(gòu)也可以發(fā)揮重要作用,因?yàn)槌霭鏅C(jī)構(gòu)有適當(dāng)和有力的程序來(lái)執(zhí)行審查。同行評(píng)審可以區(qū)分剛剛發(fā)布的數(shù)據(jù)和已發(fā)布的數(shù)據(jù)(因此可以被信任)。在許多情況下,數(shù)據(jù)集通過(guò)網(wǎng)絡(luò)發(fā)布來(lái)共享,但是經(jīng)過(guò)同行評(píng)審過(guò)程的數(shù)據(jù)可以出版。當(dāng)前愛(ài)思唯爾部分出版機(jī)構(gòu)對(duì)科研數(shù)據(jù)進(jìn)行不同程度的同行評(píng)審。有些機(jī)構(gòu)在將數(shù)據(jù)集納入到數(shù)據(jù)存儲(chǔ)庫(kù)中之前,根據(jù)特定學(xué)科的標(biāo)準(zhǔn)手動(dòng)檢查數(shù)據(jù)集的格式是否正確。也有些機(jī)構(gòu)在圖像數(shù)據(jù)整合在論文中之前,自動(dòng)檢查以進(jìn)行審查操作。還有一些機(jī)構(gòu)會(huì)驗(yàn)證數(shù)據(jù)是否有適當(dāng)?shù)拿枋鲎鳛樵獢?shù)據(jù)附加—有了元數(shù)據(jù),數(shù)據(jù)就可以被充分理解和重用。愛(ài)思唯爾的開(kāi)放數(shù)據(jù)試點(diǎn)項(xiàng)目“開(kāi)放數(shù)據(jù)試驗(yàn)”,要求審閱者檢查提交的文件是否是可解析的原始數(shù)據(jù),是否在相關(guān)領(lǐng)域中普遍使用;對(duì)于數(shù)據(jù)期刊,針對(duì)數(shù)據(jù)的審查將更加嚴(yán)格。
1.2.8 科研數(shù)據(jù)的可復(fù)制
研究結(jié)果的可重復(fù)性是科學(xué)界的重大關(guān)切。為了提高研究結(jié)果的可信度,愛(ài)思唯爾引入了“可復(fù)制性計(jì)劃”,通過(guò)獨(dú)立復(fù)制來(lái)驗(yàn)證(收費(fèi))關(guān)鍵實(shí)驗(yàn)結(jié)果。不可再現(xiàn)性往往源于研究數(shù)據(jù)的缺失,而這些缺失的要素是實(shí)現(xiàn)驗(yàn)證相同研究結(jié)果所必需的。例如,生物醫(yī)學(xué)文獻(xiàn)中報(bào)告的資源(例如抗體,模型生物和軟件)通常缺乏足夠的細(xì)節(jié)以實(shí)現(xiàn)可再現(xiàn)性或重用性。學(xué)術(shù)界非常重視這一點(diǎn),并創(chuàng)造各種條件來(lái)幫助解決這一需求。愛(ài)思唯爾為FORCE11資源識(shí)別計(jì)劃做出的巨大貢獻(xiàn)得到學(xué)術(shù)界的認(rèn)可和肯定。該計(jì)劃在生物醫(yī)學(xué)文獻(xiàn)中實(shí)現(xiàn)資源識(shí)別,促進(jìn)唯一研究資源標(biāo)識(shí)符(RRID)的使用。研究數(shù)據(jù)聯(lián)盟(RDA)也成立了一個(gè)關(guān)注可再現(xiàn)性的機(jī)構(gòu)。
1.2.9 科研數(shù)據(jù)的可重用
對(duì)于學(xué)術(shù)界而言,共享研究數(shù)據(jù)的最大益處是可重復(fù)使用這些數(shù)據(jù)。只有當(dāng)研究數(shù)據(jù)具有足夠的可信度和可復(fù)制性時(shí),研究人員才會(huì)重新使用這些數(shù)據(jù)。因此,愛(ài)思唯爾建議在數(shù)據(jù)共享的第一步(即存儲(chǔ)和保存時(shí))允許將用戶許可證附加到數(shù)據(jù)集。這將使任何用戶都能清楚地了解他們?cè)谑褂脭?shù)據(jù)時(shí)能和不能做什么,更有助于確保給予研究人員和數(shù)據(jù)創(chuàng)建者足夠的信任。目前有各種各樣的用戶許可證可用,其中最常見(jiàn)的是知識(shí)共享。本節(jié)描述的愛(ài)思唯爾所有的步驟和舉措最終都指向這個(gè)目標(biāo):促進(jìn)重用,使研究更具可重復(fù)性和效率。
1.2.10 科研數(shù)據(jù)的整合
愛(ài)思唯爾認(rèn)為,數(shù)據(jù)重用最重要的是整合以上9個(gè)“高效研究數(shù)據(jù)”的流程。但在構(gòu)建數(shù)據(jù)重用或數(shù)據(jù)引用的系統(tǒng)時(shí),還需要考慮當(dāng)前的存儲(chǔ)和共享數(shù)據(jù)系統(tǒng)。愛(ài)思唯爾以上9個(gè)流程和第10個(gè)集成步驟作為愛(ài)思唯爾的指導(dǎo)原則,對(duì)研究數(shù)據(jù)管理實(shí)踐進(jìn)行排序和檢查。
2 威利的數(shù)據(jù)政策框架
2.1 概況
威利是1807年創(chuàng)立于美國(guó)的全球歷史最悠久﹑最知名的學(xué)術(shù)出版機(jī)構(gòu)之一,是世界第一大獨(dú)立的學(xué)術(shù)圖書(shū)出版機(jī)構(gòu)和第三大學(xué)術(shù)期刊出版機(jī)構(gòu)。威利發(fā)現(xiàn)目前許多資助者都要求研究人員發(fā)布數(shù)據(jù),造成研究人員共享和存檔數(shù)據(jù)的壓力越來(lái)越大。威利認(rèn)為數(shù)據(jù)共享可使其他研究者重用實(shí)驗(yàn)結(jié)果,在他人先前研究的基礎(chǔ)上繼續(xù)創(chuàng)新研究,提高研究效率并提升科研數(shù)據(jù)的透明度和可重復(fù)性。因此,威利致力于提升科學(xué)研究的開(kāi)放性、透明度和可重復(fù)性,以營(yíng)造更公平,更高效和負(fù)責(zé)的研究環(huán)境。威利認(rèn)為科研過(guò)程中產(chǎn)生的數(shù)據(jù)與已發(fā)表的論文一樣重要,當(dāng)數(shù)據(jù)是FAIR(可查找、可訪問(wèn)、可互操作、可重用)時(shí),研究人員可以訪問(wèn)和分析已有的研究成果,并在此基礎(chǔ)上進(jìn)行新的研究,這將使研究變得更加高效。為了建立更開(kāi)放的研究環(huán)境,威利于2017年9月推出了完善的數(shù)據(jù)共享和引用政策,鼓勵(lì)、期望或要求作者共享科研數(shù)據(jù),該政策框架適用于威利所屬的所有期刊[6]。
2.2 內(nèi)容解析
2.2.1 數(shù)據(jù)共享政策
威利鼓勵(lì)在期刊上發(fā)表論文的作者分享他們的科研數(shù)據(jù),認(rèn)為科研數(shù)據(jù)的定義因?qū)W科而異,“數(shù)據(jù)”包括為分析目的而收集,觀察或創(chuàng)建的研究輸出,科研數(shù)據(jù)可以包括(但不限于):原始數(shù)據(jù)、處理后的數(shù)據(jù)、軟件、算法、協(xié)議、方法、材料、照片、樣本等。這些數(shù)據(jù)是研究論文中研究結(jié)果的基礎(chǔ)和支撐。
可重現(xiàn)研究的基礎(chǔ)是存在易于訪問(wèn)并易于發(fā)現(xiàn)支撐研究成果的數(shù)據(jù),這需要依托強(qiáng)大而通用的數(shù)據(jù)框架來(lái)實(shí)現(xiàn)。2015年威利就提出了完善的科研數(shù)據(jù)政策,鼓勵(lì)科學(xué)研究應(yīng)保持開(kāi)放性和透明性[7]。研究人員可訪問(wèn)威利的論文作者所使用的合規(guī)工具來(lái)選擇期刊名稱,了解其具體的數(shù)據(jù)期刊政策。政策框架具體內(nèi)容如下。
(1)政策類型1—鼓勵(lì)數(shù)據(jù)共享
期刊出版機(jī)構(gòu)鼓勵(lì)作者在適當(dāng)?shù)墓泊鎯?chǔ)庫(kù)中存檔數(shù)據(jù)和其他附件來(lái)支持論文中的研究成果。作者可以提供包括可跳轉(zhuǎn)到存儲(chǔ)數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)庫(kù)鏈接的數(shù)據(jù)可用性聲明,并將該數(shù)據(jù)可用性聲明發(fā)布在論文中,便于其他研究人員引用該數(shù)據(jù),可用性聲明可以自己起草,也可以使用威利提供的標(biāo)準(zhǔn)模板。所有論文作者都可以選擇性發(fā)布數(shù)據(jù)可用性聲明,以確認(rèn)是否存在共享數(shù)據(jù)。如果作者選擇共享數(shù)據(jù),則數(shù)據(jù)可用性聲明將描述如何訪問(wèn)數(shù)據(jù),包括來(lái)自共享數(shù)據(jù)存儲(chǔ)庫(kù)所提供的數(shù)據(jù)永久性標(biāo)識(shí)符(例如,數(shù)據(jù)的DOI或登錄號(hào))。
(2)政策類型2—期望數(shù)據(jù)共享
期刊出版機(jī)構(gòu)希望作者將支撐論文研究結(jié)果的數(shù)據(jù)存儲(chǔ)在適當(dāng)?shù)墓泊鎯?chǔ)庫(kù)中,并提供數(shù)據(jù)可用性聲明,以描述共享數(shù)據(jù)的可用性或缺失。作者愿意共享數(shù)據(jù)時(shí),要求作者在其數(shù)據(jù)可用性聲明中描述已使用的存儲(chǔ)庫(kù)的鏈接,同時(shí)用于論文所述分析的腳本和其他附件也應(yīng)該盡可能地公開(kāi)存檔。如果共享數(shù)據(jù)違反了道德標(biāo)準(zhǔn)或法律要求,數(shù)據(jù)將不允許共享。作者可以參閱威利網(wǎng)站“作者使用的標(biāo)準(zhǔn)模板”部分,為數(shù)據(jù)集選擇適當(dāng)?shù)臄?shù)據(jù)可用性聲明。
(3)政策類型3—強(qiáng)制要求數(shù)據(jù)共享
期刊出版機(jī)構(gòu)要求作者應(yīng)將其數(shù)據(jù)存儲(chǔ)在適當(dāng)?shù)墓泊鎯?chǔ)庫(kù)中,將支撐論文結(jié)果的數(shù)據(jù)作為發(fā)表的必要條件。作者必須提供數(shù)據(jù)可用性聲明,包括指向所使用的數(shù)據(jù)存儲(chǔ)庫(kù)的鏈接,并引用已共享的數(shù)據(jù),用于論文所述分析的腳本和其他附件也應(yīng)該盡可能地公開(kāi)存檔。如果作者無(wú)法共享數(shù)據(jù)(例如,如果共享數(shù)據(jù)違反了道德標(biāo)準(zhǔn)或法律要求),則不需要作者共享數(shù)據(jù),但必須在其數(shù)據(jù)可用性聲明中描述數(shù)據(jù)使用限制。作者可以參閱威利網(wǎng)站“作者使用的標(biāo)準(zhǔn)模板”部分,為數(shù)據(jù)集選擇適當(dāng)?shù)臄?shù)據(jù)可用性聲明。
(4)政策類型4—強(qiáng)制要求數(shù)據(jù)共享和同行評(píng)審數(shù)據(jù)
期刊出版機(jī)構(gòu)要求必須對(duì)論文中支撐研究結(jié)果的數(shù)據(jù)進(jìn)行同行評(píng)審,來(lái)確認(rèn)共享數(shù)據(jù)的質(zhì)量以及確認(rèn)數(shù)據(jù)能否再現(xiàn)論文中的研究結(jié)果。威利強(qiáng)制要求作者提交論文結(jié)果中的數(shù)據(jù),將其數(shù)據(jù)存儲(chǔ)在適當(dāng)?shù)墓泊鎯?chǔ)庫(kù)中。作者必須提供數(shù)據(jù)可用性聲明,包括指向所使用的存儲(chǔ)庫(kù)的鏈接,并引用已共享的數(shù)據(jù)。用于論文所述分析的腳本和其他附件也應(yīng)該盡可能地公開(kāi)存檔。如果共享數(shù)據(jù)違反了道德標(biāo)準(zhǔn)或法律要求,則無(wú)需作者共享。
研究者可參閱表2以了解各種標(biāo)準(zhǔn)化數(shù)據(jù)共享策略類別。
說(shuō)明:a數(shù)據(jù)可用性聲明確認(rèn)共享數(shù)據(jù)的存在或不存在。
b檢查數(shù)據(jù)可用性聲明中的數(shù)據(jù)鏈接,以確保鏈接作者想要的數(shù)據(jù)。如果數(shù)據(jù)已在數(shù)據(jù)存儲(chǔ)庫(kù)中共享,則數(shù)據(jù)可用性聲明將包含指向該數(shù)據(jù)的永久鏈接。
c對(duì)鏈接數(shù)據(jù)的質(zhì)量和/或可復(fù)制性進(jìn)行同行評(píng)審。根據(jù)期刊的不同,一種方法是通過(guò)論文中的結(jié)果與存儲(chǔ)庫(kù)中的數(shù)據(jù)對(duì)應(yīng)(例如,樣本量和變量匹配)來(lái)確保同行評(píng)審數(shù)據(jù)的質(zhì)量,另一種是同行評(píng)審數(shù)據(jù)的可復(fù)制性,以確保期刊論文中提出的聲明有效且可復(fù)制。
不同類型措施的最低要求是鼓勵(lì)數(shù)據(jù)共享。其中“期望數(shù)據(jù)共享”措施的期刊在每篇已發(fā)表的論文中都要求有數(shù)據(jù)可用性聲明。但威利指出“期望”并不強(qiáng)制要求研究人員共享數(shù)據(jù),相反它需要作者在每篇論文中都聲明以確認(rèn)是否存在共享數(shù)據(jù)?!捌谕钡拇胧┦窃S多威利期刊的理想之選,只有那些采用最強(qiáng)數(shù)據(jù)共享政策水平的期刊才要求對(duì)每篇論文進(jìn)行數(shù)據(jù)共享。強(qiáng)制的數(shù)據(jù)政策不僅要對(duì)作者數(shù)據(jù)共享核驗(yàn),而且要求作者提供數(shù)據(jù)可用性聲明。作者可以在“作者合規(guī)性工具”中訪問(wèn)期刊列表及其支持的措施。
2.2.2 數(shù)據(jù)可用性聲明
數(shù)據(jù)可訪問(wèn)性聲明提供能在何處找到支撐論文成果的科研數(shù)據(jù)和其他附件的有關(guān)信息,還包括指向公共數(shù)據(jù)集的存儲(chǔ)庫(kù)鏈接。威利的數(shù)據(jù)共享措施建議或要求(取決于期刊所選擇的數(shù)據(jù)政策類型)將數(shù)據(jù)可訪問(wèn)性聲明包括在論文中。表3是可供作者使用的數(shù)據(jù)可用性聲明標(biāo)準(zhǔn)文本模板,聲明是給遵循“期望數(shù)據(jù)”或“強(qiáng)制數(shù)據(jù)”措施的期刊制定的準(zhǔn)則[8]。
2.2.3 數(shù)據(jù)引用政策
數(shù)據(jù)引用原則的適用范圍包括期刊等出版機(jī)構(gòu)和通用存儲(chǔ)庫(kù)中的數(shù)據(jù)。數(shù)據(jù)引用并不是取代如GenBank登錄代碼的在線引用(in-line citation of GenBank accession codes)等現(xiàn)有引用標(biāo)準(zhǔn)。在引用數(shù)據(jù)時(shí),作者應(yīng)參考相關(guān)要求,在參考文獻(xiàn)中提供對(duì)數(shù)據(jù)的正式引文。威利建議采用FORCE11數(shù)據(jù)引用原則《數(shù)據(jù)引用原則聯(lián)合聲明》提出的格式[9]:
[數(shù)據(jù)集]作者;年; 數(shù)據(jù)集標(biāo)題;數(shù)據(jù)存儲(chǔ)庫(kù)或檔案;版本(如果有);永久標(biāo)識(shí)符(例如,DOI)
在引用之前添加[dataset],以便正確地將其標(biāo)識(shí)為數(shù)據(jù)引用。[數(shù)據(jù)集]標(biāo)識(shí)符將會(huì)在論文發(fā)表前被刪除,不會(huì)出現(xiàn)在作者發(fā)表的論文中。
威利鼓勵(lì)作者在相關(guān)且適當(dāng)?shù)那闆r下引用數(shù)據(jù),規(guī)定引用數(shù)據(jù)必須與引用論文、圖書(shū)和網(wǎng)絡(luò)的引用方式相同,且要求作者將數(shù)據(jù)引用作為其參考列表的一部分,并對(duì)生產(chǎn)和發(fā)布系統(tǒng)做出相應(yīng)的改動(dòng)來(lái)處理數(shù)據(jù)引用[10]。
威利建議的引用格式中,作者需要在共享數(shù)據(jù)之前訪問(wèn)作者合規(guī)工具以檢查其選擇的期刊或資助機(jī)構(gòu)的數(shù)據(jù)共享政策,或訪問(wèn)re3data.org或fairsharing.org,為科研數(shù)據(jù)選擇與主題領(lǐng)域相關(guān)的注冊(cè)和認(rèn)證數(shù)據(jù)存儲(chǔ)庫(kù)。通常,研究數(shù)據(jù)應(yīng)盡可能提交給特定學(xué)科的、社區(qū)認(rèn)可的存儲(chǔ)庫(kù),如果沒(méi)有合適的社區(qū)存儲(chǔ)庫(kù)可用,則應(yīng)提交給通用存儲(chǔ)庫(kù)。如果目標(biāo)期刊沒(méi)有特定的數(shù)據(jù)存儲(chǔ)庫(kù)建議,那么各個(gè)學(xué)科的研究人員都可以考慮使用通用存儲(chǔ)庫(kù)如Dryad,figShare或Zenodo。數(shù)據(jù)所在的存儲(chǔ)庫(kù)將為科研數(shù)據(jù)分配一個(gè)永久性標(biāo)識(shí)符,使其他研究人員可以引用該數(shù)據(jù)以及作者發(fā)表的研究論文,能輕松鏈接到論文引用的數(shù)據(jù)位置,通過(guò)直接鏈接快速訪問(wèn)參考資料。參考列表中的正式引文支持可重復(fù)性,有助于跟蹤數(shù)據(jù)重用,認(rèn)可或贊揚(yáng)個(gè)人對(duì)研究的貢獻(xiàn),以及個(gè)人在收集、管理和歸檔數(shù)據(jù)方面所做的貢獻(xiàn)。
3 結(jié) 語(yǔ)
愛(ài)思唯爾和威利這兩大學(xué)術(shù)期刊出版機(jī)構(gòu)的科研數(shù)據(jù)政策具有一定的趨同性。主要體現(xiàn)在以下方面。
(1)兩大機(jī)構(gòu)都根據(jù)所屬期刊的不同需求推出了一系列多層次的數(shù)據(jù)政策,政策范圍同樣都是從鼓勵(lì)數(shù)據(jù)共享到強(qiáng)烈鼓勵(lì)再到強(qiáng)制性數(shù)據(jù)共享,所屬期刊均可根據(jù)自身需求選擇不同共享程度的數(shù)據(jù)政策類型。這種多層次分級(jí)的科研數(shù)據(jù)政策不僅使政策通用框架更易于理解和實(shí)踐,同時(shí)也充分尊重了各期刊的差異化發(fā)展。
(2)兩大機(jī)構(gòu)的數(shù)據(jù)政策內(nèi)容均涵蓋數(shù)據(jù)出版的全流程,包含研究數(shù)據(jù)的存儲(chǔ)、評(píng)審、共享、引用等,且大部分流程的標(biāo)準(zhǔn)高度相似,如均推薦作者選擇符合FAIR原則的數(shù)據(jù)存儲(chǔ)庫(kù),使用類型相似的數(shù)據(jù)可用性聲明進(jìn)行說(shuō)明等。
(3)兩大機(jī)構(gòu)都遵守《數(shù)據(jù)引用原則聯(lián)合聲明》,對(duì)數(shù)據(jù)引用提出了新的要求,且都在其參考格式部分提供文字引用和數(shù)據(jù)集參考的示例。
本文通過(guò)對(duì)兩大國(guó)際著名出版集團(tuán)愛(ài)思唯爾和威利科研數(shù)據(jù)政策框架的詳細(xì)分析,以期有助于我國(guó)學(xué)術(shù)期刊出版機(jī)構(gòu)等相關(guān)部門(mén)數(shù)據(jù)政策的制定,有效推進(jìn)我國(guó)科學(xué)科研數(shù)據(jù)共享和重用,使開(kāi)放科學(xué)數(shù)據(jù)更具可操作性。
注 釋
[1]Home to the worlds most influential journals [EB/OL]. [2021-02-12]. https://www.springernature.com/gp/products/journals
[2]Fast facts about Elsevier [EB/OL]. [2021-02-12]. https://www.elsevier.com/__data/assets/pdf_file/0005/1095953/Fast-Facts-2020-12-04.pdf
[3]Sharing Research Data [EB/OL]. [2021-02-12].https://www.elsevier.com/authors/tools-and-resources/research-data
[4]Research Data Guidelines [EB/OL]. [2021-02-12].https://www.elsevier.com/authors/tools-and-resources/research-data/data-guidelines
[5]FAIR data with Mendeley Data [EB/OL]. [2021-02-12]. https://www.elsevier.com/solutions/mendeley-data-platform/fair
[6]Find the right journal to publish your research [EB/OL]. [2021-02-12]. https://authorservices.wiley.com/author-resources/Journal-Authors/open-access/author-compliance-tool.html
[7]Wileys Data Sharing Policies [EB/OL]. [2021-02-12].https://authorservices.wiley.com/author-resources/Journal-Authors/open-access/data-sharing-citation/data-sharing-policy.html
[8]Wileys Data availability statement [EB/OL]. [2021-02-12].https://authorservices.wiley.com/author-resources/Journal-Authors/open-access/data-sharing-citation/data-sharing-policy.html
[9][10]Sharing and Citing your Research Data [EB/OL]. [2021-02-12]. https://authorservices.wiley.com/author-resources/Journal-Authors/open-access/data-sharing-citation/index.html
(收稿日期:2021-08-20)