賈麗瓊,郭 慧,吳 軒,李丹丹,孟 潔
(1.中國地質(zhì)調(diào)查局發(fā)展研究中心,北京 100037;2.全國地質(zhì)資料館,北京 100037)
信息技術(shù)與網(wǎng)絡(luò)技術(shù)的不斷飛速發(fā)展產(chǎn)生了大量的科學(xué)數(shù)據(jù)資源?!按髷?shù)據(jù)”時代,各種各樣的科學(xué)數(shù)據(jù)成為了經(jīng)濟社會重要的新型戰(zhàn)略資源,是科技創(chuàng)新與發(fā)展的重要保證之一。然而除了極少數(shù)以學(xué)術(shù)論文和圖書等形式發(fā)布的科學(xué)數(shù)據(jù)外,大多數(shù)科學(xué)數(shù)據(jù)仍然被保存于科學(xué)家個人和科研團隊手中或數(shù)據(jù)生產(chǎn)單位中。隨著時間推移,或因為技術(shù)原因,或因為個人主觀原因,大量科學(xué)數(shù)據(jù)被遺忘或損壞從而無法繼續(xù)使用,造成了數(shù)據(jù)資源的極大浪費。這種情況在地學(xué)界也普遍存在。為了解決科學(xué)數(shù)據(jù)的存儲、共享和再利用,一種新型的出版形式——科學(xué)數(shù)據(jù)出版應(yīng)運而生。國內(nèi)外基于科學(xué)數(shù)據(jù)管理、共享、出版及知識產(chǎn)權(quán)保護等領(lǐng)域的研究眾多[1-8],然而針對我國地質(zhì)科學(xué)領(lǐng)域的數(shù)據(jù)出版及其知識產(chǎn)權(quán)保護擇鮮有研究。本文對全國地質(zhì)資料館開展的地質(zhì)科學(xué)數(shù)據(jù)出版工作及數(shù)據(jù)出版的知識產(chǎn)權(quán)問題進行了探討,以期讓更多地質(zhì)工作者了解科學(xué)數(shù)據(jù)出版,共同推進地質(zhì)科學(xué)數(shù)據(jù)共享。
全國地質(zhì)資料館(以下簡稱“全國館”)是我國館藏數(shù)量最多、內(nèi)容最全的國家級地質(zhì)資料館藏機構(gòu)[9]。經(jīng)過多年努力,全國館已實現(xiàn)館藏地質(zhì)資料數(shù)據(jù)的全數(shù)字化,2005年后匯交至全國館的地質(zhì)資料全部為矢量化地質(zhì)數(shù)據(jù)[10]。截止到2018年8月31日,全國館館藏資料總計144 814檔,涵蓋礦產(chǎn)勘查(88 072檔)、區(qū)域調(diào)查(10 641檔)、水工環(huán)勘查(12 886檔)、物化遙勘查(13 327檔)、海洋地質(zhì)調(diào)查(316檔)、地質(zhì)科學(xué)研究(17 499檔)、技術(shù)方法研究(1 746檔)和其他地質(zhì)資料數(shù)據(jù)(327檔)。在這些海量數(shù)據(jù)的支撐下,全國館完成了多個不同比例尺的矢量化地質(zhì)數(shù)據(jù)庫建庫工作。目前全國館共有三十多個全國性數(shù)據(jù)庫,三千多個區(qū)域與專題性數(shù)據(jù)庫及數(shù)萬個點源性數(shù)據(jù)庫[11],其他各類地質(zhì)科學(xué)數(shù)據(jù)更是不計其數(shù)。為了使館藏的地質(zhì)科學(xué)數(shù)據(jù)能夠被高效利用,推動地質(zhì)科學(xué)數(shù)據(jù)共享的同時保護數(shù)據(jù)作者的知識產(chǎn)權(quán),增加地質(zhì)科技工作的創(chuàng)新產(chǎn)出,提高我國地質(zhì)工作的國際化水平,全國館經(jīng)過多年的政策解讀與技術(shù)研究實踐,開展了地質(zhì)科學(xué)的數(shù)據(jù)出版工作。
科學(xué)數(shù)據(jù)是指在各種科技科研工作(實驗、觀測、探測、調(diào)查等)或通過其他方式獲取的反映客觀世界的本質(zhì)、特征、變化規(guī)律等的原始基本數(shù)據(jù),以及通過加工整理后獲得的各類數(shù)據(jù)集[12]。地質(zhì)數(shù)據(jù)是非常重要的科學(xué)數(shù)據(jù),是一種時空大數(shù)據(jù),是與地球空間位置相關(guān),揭示地球,尤其是地殼物質(zhì)組成、結(jié)構(gòu)及演化過程狀態(tài)屬性的數(shù)據(jù),產(chǎn)生于各種地質(zhì)調(diào)查、勘探、觀測和相應(yīng)的地質(zhì)科學(xué)研究工作中。地質(zhì)科學(xué)數(shù)據(jù)具有形成成本高、應(yīng)用范圍廣、難以重復(fù)獲取、可以反復(fù)利用等特點[9]。地質(zhì)科學(xué)的研究對象是復(fù)雜的地球系統(tǒng),這就決定地質(zhì)科學(xué)的研究需要海量、多樣化的試驗、調(diào)查、觀測、探測數(shù)據(jù),需要多學(xué)科、多來源、多類型、綜合性地質(zhì)數(shù)據(jù)的支撐。
地質(zhì)科學(xué)數(shù)據(jù)出版是地質(zhì)工作者按照地質(zhì)調(diào)查勘查工作規(guī)范的質(zhì)量管理和控制流程,通過互聯(lián)網(wǎng)公開發(fā)布其觀察、實驗、計算分析等科研過程中所產(chǎn)生的原始地質(zhì)數(shù)據(jù),或者是通過對已有的地質(zhì)數(shù)據(jù)進行系統(tǒng)的收集、整理和再加工后形成的地質(zhì)數(shù)據(jù)產(chǎn)品,使得其他地質(zhì)工作者能夠便捷地發(fā)現(xiàn)、獲取、理解和再分析利用,并且可以在地質(zhì)科研論文及相關(guān)的地質(zhì)科研成果中引用[13]。
與普通的學(xué)術(shù)論文出版不同,地質(zhì)科學(xué)數(shù)據(jù)出版既包括了數(shù)據(jù)論文,也包含實體地質(zhì)科學(xué)數(shù)據(jù)兩個部分。數(shù)據(jù)論文是描述實體數(shù)據(jù)及其元數(shù)據(jù)信息,實體數(shù)據(jù)則包括各種地理地質(zhì)信息、地質(zhì)圖和數(shù)據(jù)庫、數(shù)據(jù)表格、工作過程記錄形成的文獻、檔案,以及各種以數(shù)據(jù)為中心的應(yīng)用、數(shù)據(jù)庫接口和專題服務(wù)等[11]。
作者將撰寫好的數(shù)據(jù)論文和處理好的實體數(shù)據(jù)提交至全國館。目前實體數(shù)據(jù)主要來源于兩部分,一是由地質(zhì)工作者投稿的階段性地質(zhì)工作形成的科學(xué)數(shù)據(jù);二是根據(jù)每期的主題,從全國館豐富的館藏中篩選成果數(shù)據(jù)進行出版。
實體數(shù)據(jù)是否可公開是地質(zhì)科學(xué)數(shù)據(jù)能否順利出版的關(guān)鍵環(huán)節(jié)。地質(zhì)科學(xué)數(shù)據(jù)是國家戰(zhàn)略性的信息資源,所包含的信息與國家的經(jīng)濟發(fā)展、能源資源安全和社會公共安全密切相關(guān)[9]。數(shù)據(jù)論文和實體數(shù)據(jù)必須是經(jīng)數(shù)據(jù)作者所在單位保密審核通過后方可投稿。全國館經(jīng)過多年研究與實踐,形成了保密主管部門認(rèn)可的比較完善的定密、解密和公開化處理機制與方法[14],對收到的稿件進行二次保密審查,確保數(shù)據(jù)確實可公開發(fā)表。
編輯對收到的數(shù)據(jù)論文和實體數(shù)據(jù)進行初步審查,主要審查數(shù)據(jù)論文結(jié)構(gòu)及內(nèi)容是否完整清楚,圖表是否合乎規(guī)范,實體數(shù)據(jù)是否完整,誤差范圍是否準(zhǔn)確等。初審若不通過則反饋給作者進行修改;若初審?fù)ㄟ^則進行同行評議。
同行專家評議包括數(shù)據(jù)論文和實體數(shù)據(jù)的評審。同行專家對數(shù)據(jù)論文和實體數(shù)據(jù)的完整性、科學(xué)性、質(zhì)量、應(yīng)用價值、可重用性等方面進行審議。
作者根據(jù)同行評議對數(shù)據(jù)論文和實體數(shù)據(jù)進行修改后返回至全國館,由責(zé)任主編確定該數(shù)據(jù)論文和實體數(shù)據(jù)能否出版和發(fā)布,若能發(fā)布,數(shù)據(jù)論文將以實體期刊和網(wǎng)絡(luò)在線的形式同步出版發(fā)行,實體數(shù)據(jù)則發(fā)布在地質(zhì)科學(xué)數(shù)據(jù)出版中心(http:∥geodb.cgs.gov.cn/)。
地質(zhì)科學(xué)數(shù)據(jù)出版中心是一個可以長期穩(wěn)定運行的數(shù)據(jù)中心,即使實體數(shù)據(jù)的物理地址發(fā)生改變,也可以通過再解析的方式使得數(shù)據(jù)的邏輯地址不變,以保證用戶可以長期訪問和追溯數(shù)據(jù)。
數(shù)據(jù)論文和實體數(shù)據(jù)通過唯一標(biāo)識符(DOI)和數(shù)據(jù)URL等屬性鏈接起來,同時在數(shù)據(jù)論文的正文或者腳注等位置,標(biāo)注實體數(shù)據(jù)的引用格式。2018年7月1日正式實施的中華人民共和國國家標(biāo)準(zhǔn)《信息技術(shù)科學(xué)數(shù)據(jù)引用》(GB/T 35294—2017)[15]規(guī)定了科學(xué)數(shù)據(jù)的通用引用格式為:作者.名稱(版本).創(chuàng)建機構(gòu)[創(chuàng)建機構(gòu)],創(chuàng)建時間.傳播機構(gòu)[傳播機構(gòu)],傳播時間.唯一標(biāo)識符;解析地址。這一標(biāo)準(zhǔn)的發(fā)布實施,對于科學(xué)數(shù)據(jù)的規(guī)范化引用非常重要。
3.8數(shù)據(jù)論文和實體數(shù)據(jù)評價
評價機制是評判地質(zhì)科學(xué)數(shù)據(jù)的共享成效和重用價值的重要標(biāo)準(zhǔn)??茖W(xué)數(shù)據(jù)的評價可以從兩個方面體現(xiàn):①地質(zhì)科學(xué)數(shù)據(jù)出版中心的數(shù)據(jù)訪問量、下載量指標(biāo),以及通過DOI的唯一永久標(biāo)識作用追蹤科學(xué)數(shù)據(jù)的引用量指標(biāo);②將地質(zhì)科學(xué)數(shù)據(jù)出版納入科研成果評價體系中,促進科學(xué)數(shù)據(jù)的規(guī)范評價,激勵地質(zhì)工作者積極公開地質(zhì)科研數(shù)據(jù),從根本上推動地質(zhì)科學(xué)數(shù)據(jù)的共享。
長期以來,地質(zhì)科學(xué)數(shù)據(jù)開放共享廣為科研人員及國家政府部門、科研資助機構(gòu)、出版機構(gòu)和社會公眾所認(rèn)同,然而對于廣大地質(zhì)科研工作者而言,困擾地質(zhì)科學(xué)數(shù)據(jù)開放共享的重要因素是科學(xué)家的科研貢獻和學(xué)術(shù)評價機制沒有發(fā)生改變,科學(xué)數(shù)據(jù)作者的學(xué)術(shù)權(quán)益無法得到有效保護,即科學(xué)數(shù)據(jù)的知識產(chǎn)權(quán)保護機制不夠完善,這從根本上影響了科學(xué)數(shù)據(jù)的共享。從全國館的實際工作來看,由于目前地質(zhì)工作經(jīng)費來源多樣,部分?jǐn)?shù)據(jù)作者出于自身學(xué)術(shù)權(quán)益的考慮不愿意將具有創(chuàng)新性的地質(zhì)科研數(shù)據(jù)成果完整匯交至全國館,因此存在地質(zhì)科學(xué)數(shù)據(jù)少交漏交的情況發(fā)生。對于數(shù)據(jù)作者的學(xué)術(shù)權(quán)益保護問題,目前科技界公認(rèn),以及我們通過長期研究和前期實踐都證明,在數(shù)字對象唯一標(biāo)識符(DOI)技術(shù)支撐下的數(shù)據(jù)出版是一個可持續(xù)發(fā)展的解決途徑。
DOI是美國出版協(xié)會于1998年提出的用于標(biāo)識網(wǎng)絡(luò)環(huán)境下的任何數(shù)字化對象,以便有效管理數(shù)字出版物,保護數(shù)字出版物的知識產(chǎn)權(quán)的一套應(yīng)用體系[16-20]。2005年德國國家科技圖書館申請成立了國際首個科學(xué)數(shù)據(jù)DOI注冊機構(gòu),后又在此基礎(chǔ)上建立了Data Cite系統(tǒng)[21]。DOI由命名系統(tǒng)、注冊管理和維護系統(tǒng)、解析系統(tǒng)三部分組成[22-23]。命名系統(tǒng)規(guī)定了DOI遵守的統(tǒng)一命名規(guī)范,保證了DOI的唯一性;注冊管理和維護系統(tǒng)通過元數(shù)據(jù)對數(shù)字對象進行描述,實現(xiàn)對數(shù)據(jù)物理地址的實時維護,保證DOI的解析地址永久有效;解析系統(tǒng)負責(zé)將DOI轉(zhuǎn)換為相應(yīng)的網(wǎng)絡(luò)地址,讓用戶可以通過DOI直接搜索到相關(guān)資源[23]。通過DOI保護地質(zhì)科學(xué)數(shù)據(jù)作者的知識產(chǎn)權(quán),主要是通過要求地質(zhì)科學(xué)數(shù)據(jù)使用者在使用數(shù)據(jù)的同時要對實體數(shù)據(jù)本身進行引用,也要對與實體數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)論文進行引用,因為DOI提供了標(biāo)準(zhǔn)化的引用格式供用戶進行參考。同行評議過程中,審稿專家也應(yīng)該要求作者對所使用的地質(zhì)科學(xué)數(shù)據(jù)進行引用,從而共同推進地質(zhì)科學(xué)數(shù)據(jù)的標(biāo)準(zhǔn)化規(guī)范化引用。對地質(zhì)科學(xué)數(shù)據(jù)進行引用,一方面保護了數(shù)據(jù)生產(chǎn)者的智力產(chǎn)出與知識產(chǎn)權(quán),另一方面也能更好的追蹤地質(zhì)科學(xué)數(shù)據(jù)的使用情況,驗證并評價數(shù)據(jù)作者的研究成果。
全國地質(zhì)資料館基于豐富的館藏地質(zhì)科學(xué)數(shù)據(jù)和多年的政策解讀與技術(shù)研究實踐,開展了地質(zhì)科學(xué)的數(shù)據(jù)出版工作。地質(zhì)科學(xué)數(shù)據(jù)出版包括數(shù)據(jù)論文出版和實體數(shù)據(jù)出版兩個部分。數(shù)據(jù)出版對于地質(zhì)科學(xué)數(shù)據(jù)的管理、共享、出版及知識產(chǎn)權(quán)保護具有很好的推動作用。地質(zhì)科學(xué)數(shù)據(jù)出版包括提交數(shù)據(jù)論文和實體數(shù)據(jù)、對實體數(shù)據(jù)進行公開化審查、編輯進行初審、同行評議、實體數(shù)據(jù)的永久存儲、實體數(shù)據(jù)引用以及對數(shù)據(jù)論文和實體數(shù)據(jù)進行評價八個環(huán)節(jié)。在對于數(shù)據(jù)作者的學(xué)術(shù)權(quán)益保護方面,目前公認(rèn)DOI技術(shù)支撐下的數(shù)據(jù)出版是一個可持續(xù)發(fā)展的解決途徑,既能保護數(shù)據(jù)生產(chǎn)者的智力產(chǎn)出與知識產(chǎn)權(quán),也能更好的追蹤地質(zhì)科學(xué)數(shù)據(jù)的使用情況,以此來評價數(shù)據(jù)作者的研究成效。