許艷蘋
(廈門大學(xué) 近海海洋環(huán)境科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,福建 廈門 361102)
國(guó)際海洋觀測(cè)計(jì)劃,始于20世紀(jì)60年代,約每10年開展一次。1956—1959年的國(guó)際地球物理年,是海洋觀測(cè)史上第一次大規(guī)模的國(guó)際聯(lián)合行動(dòng)。1971—1980年的國(guó)際海洋考察十年,經(jīng)歷 1980—1985年間的中型計(jì)劃,發(fā)展為1985—1990年的全球變化。物理海洋學(xué)觀測(cè)計(jì)劃,經(jīng)歷中大洋動(dòng)力學(xué)實(shí)驗(yàn),發(fā)展為世界大洋環(huán)流實(shí)驗(yàn)(WOCE)計(jì)劃。生物地球化學(xué)海洋學(xué)觀測(cè)計(jì)劃,經(jīng)歷海洋地球化學(xué)斷面研究(Geochemical Ocean Sections,GEOSECS)計(jì)劃,發(fā)展為全球聯(lián)合海洋通量研究(JGOFS)計(jì)劃[1]。在20世紀(jì)60—70年代,船測(cè)的科學(xué)數(shù)據(jù)和資料主要通過出版研究圖集的形式公開,如 GEOSECS 計(jì)劃。隨著全球變化計(jì)劃的蓬勃發(fā)展,獲取了海量高分辨率的觀測(cè)數(shù)據(jù),完善而有效的數(shù)據(jù)管理方案尤為重要,如何讓這些數(shù)據(jù)具有長(zhǎng)久的使用性和可傳承性,國(guó)際計(jì)劃如何管理數(shù)據(jù),哪些經(jīng)驗(yàn)值得借鑒?
本研究選取世界大洋環(huán)流實(shí)驗(yàn)(World Ocean Circulation Experiment,WOCE)、全球聯(lián)合海洋通量研究(Joint Global Ocean Flux Study,JGOFS)、全球海洋船基水文調(diào)查計(jì)劃(Global Ocean Ship-based Hydrographic Investigations Program,GO-SHIP)和痕量元素及同位素海洋生物地球化學(xué)循環(huán)國(guó)際研究(An International Study of the Marine Biogeochemical Cycles of Trace Elements and Isotopes,GEOTRACES)四個(gè)海洋學(xué)科領(lǐng)域的國(guó)際計(jì)劃,包含物理海洋、海洋化學(xué)、海洋生物與生態(tài)、海洋氣象、光學(xué)等不同的學(xué)科方向,對(duì)其數(shù)據(jù)管理流程和管理政策進(jìn)行分析和總結(jié),借鑒國(guó)際海洋觀測(cè)計(jì)劃數(shù)據(jù)管理規(guī)范化理念和共享經(jīng)驗(yàn),探討建立適合我國(guó)的數(shù)據(jù)管理方案。
WOCE(1988—1998年)是世界氣候研究計(jì)劃的主要組成部分,是規(guī)模最大的國(guó)際海洋學(xué)合作計(jì)劃之一。該計(jì)劃為全球海洋觀測(cè)提供了前所未有的全球海洋觀測(cè)數(shù)據(jù),數(shù)據(jù)量大,覆蓋海域廣,包含 350多種示蹤劑分布,>18 500個(gè)站位的高精度溫鹽深儀(Conductivity-Temperature-Depth,CTD)數(shù)據(jù),>17 400個(gè)站位的瓶采數(shù)據(jù)(包含水文、營(yíng)養(yǎng)鹽和示蹤劑),540個(gè)航次的船載聲學(xué)多普勒流速剖面儀(Acoustic Doppler Current Profile,ADCP)流速數(shù)據(jù)等。這些數(shù)據(jù)以電子圖集(Electronic Atlas of WOCE Data,eWOCE)的形式發(fā)布[2],eWOCE是WOCE計(jì)劃數(shù)據(jù)集發(fā)布的一部分,收錄在DVD2[3]中。
WOCE中國(guó)計(jì)劃,原國(guó)家海洋局依托“向陽紅5號(hào)”于1991年11—12月在西太平洋實(shí)施首次WOCE中國(guó)海上多學(xué)科綜合考察,歷時(shí)45 天,共完成10條斷面的現(xiàn)場(chǎng)作業(yè)。其中有 4條完整的 WOCE斷面(P27-P30,即 PR21-PR24),兩條為 WOCE斷面的一部分(P8和P9,即PR1和PR3)[4]。首航共完成CTD測(cè)站82個(gè),拋棄式溫深儀(XBT)147個(gè),收集各種水化學(xué)樣品6 100多個(gè),進(jìn)行了全剖面觀測(cè),這些資料全部匯入國(guó)際WOCE資料集。
JGOFS(1989—2000年)是一個(gè)包含水文、生物、化學(xué)、光學(xué)等多學(xué)科的國(guó)際研究計(jì)劃,研究區(qū)域包含太平洋、大西洋、印度洋、南大洋等海盆,來自美國(guó)、德國(guó)、英國(guó)、法國(guó)等26個(gè)國(guó)家的科學(xué)家參與其中。中國(guó)是最早參入國(guó)際 JGOFS計(jì)劃活動(dòng)的國(guó)家之一,在1989年2月JGOFS中國(guó)委員會(huì)在青島成立,制定了 JOGFS在中國(guó)實(shí)施的基本要點(diǎn),即黃河和長(zhǎng)江與具有寬廣陸架的中國(guó)邊緣海間的通量,為全球陸海間的通量研究提供重要的數(shù)據(jù)支撐。1991年國(guó)家自然科學(xué)基金委員會(huì)啟動(dòng)重點(diǎn)項(xiàng)目“東海陸架邊緣海洋通量研究”(1991—1994年),開啟了全球陸架邊緣海洋通量研究的序幕[5]。中國(guó)于 1990—1999年在臺(tái)灣海峽、東海、西菲律賓海等海域共實(shí)施80多個(gè)航次的研究工作,均納入了國(guó)際JGOFS計(jì)劃[6]。
GO-SHIP由國(guó)際海洋碳協(xié)調(diào)項(xiàng)目(The International Ocean Carbon Coordination Project,IOCCP)與氣候和海洋項(xiàng)目(Climate and Ocean: Variability,Predictability and Change,CLIVAR),于2007年聯(lián)合成立[7]。旨在進(jìn)行海岸到海岸、海岸到冰區(qū)的持續(xù)重復(fù)的水文學(xué)斷面調(diào)查計(jì)劃,于2012—2023年計(jì)劃55條核心斷面(包含WOCE計(jì)劃的重復(fù)斷面),截止2020年 1月已完成80%的斷面調(diào)查,仍有11%斷面還沒有列入調(diào)查計(jì)劃。GO-SHIP計(jì)劃匯集物理海洋學(xué)、碳循環(huán)、海洋生物地球化學(xué)、生態(tài)系統(tǒng)等觀測(cè),是全球氣候觀測(cè)系統(tǒng)/全球海洋觀測(cè)系統(tǒng)(Global Ocean/Climate Observing System)的一部分。
GEOTRACES于2010年由國(guó)際海洋研究委員會(huì)啟動(dòng),是國(guó)際海洋學(xué)界的一項(xiàng)全球尺度的重大研究計(jì)劃。來自美國(guó)、英國(guó)、德國(guó)、法國(guó)等30多個(gè)國(guó)家的科學(xué)家參與其中,航跡遍布太平洋、大西洋、印度洋和極地海洋,中國(guó)是首批成員國(guó)之一。目前已實(shí)施130多個(gè)航次,其中僅2017年發(fā)布的數(shù)據(jù)產(chǎn)品包含了來自25個(gè)國(guó)家的326名科學(xué)家于2007—2014年實(shí)施的39個(gè)航次的數(shù)據(jù)集,總計(jì)1 810個(gè)站位,458種參數(shù),590張斷面圖、130多個(gè)3D動(dòng)畫場(chǎng)景[8]。下一期數(shù)據(jù)產(chǎn)品預(yù)期于2021年發(fā)布。
其中有關(guān)痕量元素及其同位素的海洋生物地球化學(xué)及生態(tài)氣候效應(yīng)的研究,受潔凈采樣與分析技術(shù)的限制,被視為各國(guó)海洋科學(xué)研究實(shí)力的體現(xiàn)。第一個(gè) GEOTRACES中國(guó)斷面調(diào)查航次—GP09斷面調(diào)查航次,于2019年4—6月由廈門大學(xué)牽頭依托廈門大學(xué)“嘉庚號(hào)”科考船執(zhí)行。
WOCE、JGOFS、GO-SHIP和GEOTRACES計(jì)劃都制定了數(shù)據(jù)標(biāo)準(zhǔn),實(shí)施科學(xué)數(shù)據(jù)規(guī)范化。規(guī)范化的科研數(shù)據(jù)包含元數(shù)據(jù)和實(shí)體數(shù)據(jù),元數(shù)據(jù)是對(duì)樣品的采集、測(cè)試、質(zhì)控步驟及每個(gè)步驟的操作人、參照標(biāo)準(zhǔn)等的詳細(xì)描述。元數(shù)據(jù)如同實(shí)體數(shù)據(jù)的說明書,在數(shù)據(jù)使用過程中對(duì)任何一個(gè)步驟產(chǎn)生疑問、遇到問題都可以溯源,對(duì)數(shù)據(jù)的歷史版本、版本的更新內(nèi)容及解釋也可以溯源。實(shí)體數(shù)據(jù)是數(shù)據(jù)集實(shí)體,通常包含采樣日期及時(shí)間、站位名稱、緯度、經(jīng)度、水深、采樣深度、布放cast號(hào)(即所在站位科研儀器下水順序)、采樣瓶號(hào)和具體參數(shù)名稱,需要對(duì)數(shù)據(jù)集的每項(xiàng)內(nèi)容如參數(shù)名稱進(jìn)行解釋,對(duì)參數(shù)單位等進(jìn)行統(tǒng)一規(guī)定。
WOCE、JGOFS、GO-SHIP和GEOTRACES計(jì)劃對(duì)元數(shù)據(jù)都有規(guī)定的模板內(nèi)容,包含航次時(shí)間、調(diào)查船、首席科學(xué)家、調(diào)查海域、參數(shù)采集的流程、分析步驟、質(zhì)控措施、參照標(biāo)準(zhǔn)等。具體而言,WOCE的元數(shù)據(jù)文檔,包含航次時(shí)間、調(diào)查船、調(diào)查斷面/航次名稱、首席科學(xué)家、航次實(shí)施的國(guó)家、調(diào)查區(qū)域經(jīng)緯度范圍、調(diào)查參數(shù)采樣和分析信息、數(shù)據(jù)結(jié)果的不確定性等。GO-SHIP作為WOCE歷史斷面的重復(fù)調(diào)查,元數(shù)據(jù)文檔大部分與 WOCE是相同的,增加了數(shù)據(jù)/數(shù)據(jù)集發(fā)表情況。
JGOFS的元數(shù)據(jù)模板,又稱采樣和分析方法的說明文檔,是ASCII文本文件,包含采樣流程、分析步驟、設(shè)備校驗(yàn)、數(shù)據(jù)處理技術(shù)等,采樣方法可以引用參考文獻(xiàn)。
GEOTRACES的元數(shù)據(jù)模板,是Excel文件,除了共同信息外,增加“質(zhì)控標(biāo)簽”,不同機(jī)構(gòu)和項(xiàng)目通常采用不同的質(zhì)控標(biāo)簽標(biāo)準(zhǔn)。同樣都是 GEOTRACES的數(shù)據(jù)產(chǎn)品(GEOTRACES Intermediate Data Product,IDP),不同 IDP版本,標(biāo)準(zhǔn)也是不同的。如 IDP2014和 IDP2017,采用的是國(guó)際海洋學(xué)數(shù)據(jù)與信息交流(International Oceanographic Data and Information Exchange,IODE)的質(zhì)控標(biāo)簽; 而即將發(fā)布的 IDP2021,采用的 SeaDataNet(Pan-European Infrastructure for Ocean & Marine Data Management)的質(zhì)控標(biāo)簽。質(zhì)控標(biāo)簽是對(duì)數(shù)據(jù)進(jìn)行質(zhì)控后的數(shù)據(jù)質(zhì)量評(píng)估,如IODE的質(zhì)控標(biāo)簽有5個(gè),分別為: 1代表數(shù)據(jù)質(zhì)量好(good quality),2代表數(shù)據(jù)質(zhì)量不確定(not evaluated,not available or unknown quality),3代表數(shù)據(jù)質(zhì)量存疑(questionable/suspect quality),4代表數(shù)據(jù)質(zhì)量不好(bad quality),9代表數(shù)據(jù)丟失(missing data)。隨著分析檢測(cè)方法和技術(shù)的提高,數(shù)據(jù)說明文件逐漸被規(guī)范化,對(duì)數(shù)據(jù)的說明越來越詳細(xì),質(zhì)控標(biāo)簽的個(gè)數(shù)也不斷增多,如 SeaDataNet增加了低于儀器檢測(cè)限(value below detection)、內(nèi)插值(interpolated value,即從項(xiàng)目的其他數(shù)據(jù)中衍生得出的值)等。
為了保持整個(gè)項(xiàng)目參數(shù)的一致性,需要對(duì)項(xiàng)目的實(shí)體數(shù)據(jù)參數(shù)名稱、單位等進(jìn)行統(tǒng)一規(guī)定,即數(shù)據(jù)庫(kù)框架,也稱數(shù)據(jù)目錄。已有的數(shù)據(jù)管理經(jīng)驗(yàn)表明,隨著研究的深入,開展的參數(shù)不斷增加,參數(shù)列表需要實(shí)時(shí)更新,每個(gè)項(xiàng)目的參數(shù)列表都記錄著更新的版本日期。
2.2.1 建立數(shù)據(jù)目錄
WOCE的參數(shù)分類包括海氣通量、水文、海洋表層溫度/鹽度、聲學(xué)多普勒流速剖面儀(ADCP)、海流計(jì)(Current Meters)、漂浮浮標(biāo)(Drifters)、次表層浮標(biāo)(Subsurface Floats)、剖面浮標(biāo)(Profiling Floats)、海平面/海表高度數(shù)據(jù)(Sea Level Data)、海洋氣象等。
JGOFS的參數(shù)分類包括物理海洋、海洋化學(xué)、痕量元素、有機(jī)化合物、生物學(xué)-生物豐度/生物量、生物學(xué)-生產(chǎn)力/吸收/呼吸、同位素和光學(xué)等。
GO-SHIP的參數(shù)分類包含CTD和基于CTD采集的參數(shù)、碳數(shù)據(jù)、船載聲學(xué)多普勒流速剖面儀數(shù)據(jù)、投放式聲學(xué)多普勒流速剖面儀數(shù)據(jù)、海洋氣象數(shù)據(jù)和走航數(shù)據(jù)。
GEOTRACES的參數(shù)分類借助參數(shù)樹探索工具(Parameter Tree Exploration Tool)和參數(shù)搜索工具(Parameter Search Tool)拓展,兩者可以相互轉(zhuǎn)換。分為8大方向: 氣溶膠、生物、溶解態(tài)痕量金屬、水文和生物地球化學(xué)、木質(zhì)素、顆粒態(tài)痕量金屬、極地、沉降。在每個(gè)方向中再按照采樣系統(tǒng)/采樣方式分為若干類,如痕量潔凈CTD、常規(guī)CTD、原位大體積泵、拖魚、自動(dòng)收集的雨水、分粒級(jí)的顆粒物、船舶的走航采樣等,共計(jì)11 000多種參數(shù)。GEOTRACES的參數(shù)樹按字母排序,如同詞匯表,便于查找的同時(shí),也方便后續(xù)參數(shù)的添加,是很好的參數(shù)樹框架范例。
2.2.2 參數(shù)名稱和單位
四大計(jì)劃都對(duì)參數(shù)的名稱、縮寫進(jìn)行定義; 在參數(shù)目錄下,可檢索每項(xiàng)參數(shù)的名稱、解釋和單位。對(duì)參數(shù)列表中沒有包含的參數(shù),也都提供了命名方式的參考依據(jù)。
2.2.3 文件格式及內(nèi)容
WOCE的實(shí)體數(shù)據(jù),綜合網(wǎng)頁公開發(fā)布的DVD和數(shù)據(jù)中心網(wǎng)站,數(shù)據(jù)格式包含 NetCDF、ASCII和Excel。
JGOFS的數(shù)據(jù)管理系統(tǒng),可讀取任何格式的數(shù)據(jù)。對(duì)提交的實(shí)體數(shù)據(jù)的內(nèi)容有以下3點(diǎn)要求: (1) 記錄航次的事件編號(hào),(2) 從CTD中采集的樣品,記錄cast號(hào)和采樣瓶號(hào),(3) 數(shù)據(jù)記錄不能為空白,須標(biāo)明理由,如壞的數(shù)據(jù)標(biāo)記為“nd”,低于檢測(cè)限標(biāo)記為“zero”。
GO-SHIP的實(shí)體數(shù)據(jù),綜合不同的數(shù)據(jù)中心,數(shù)據(jù)格式包含NetCDF、Csv、Excel等。
GEOTRACES的實(shí)體數(shù)據(jù),在公開發(fā)布的 IDP數(shù)據(jù)頁面包含 4種格式: ODV、ASCII、Excel和NetCDF。
1980年末,時(shí)值WOCE計(jì)劃啟動(dòng)伊始,國(guó)際海洋學(xué)界尚沒有一個(gè)數(shù)據(jù)系統(tǒng)能滿足WOCE計(jì)劃的數(shù)據(jù)管理。為此,該計(jì)劃建立了一系列的數(shù)據(jù)整合中心(Data Assembly Center,DAC)和特殊分析中心(Special Analysis Centers),這些中心分布在各實(shí)驗(yàn)室和研究院校,每個(gè)數(shù)據(jù)中心只處理一個(gè)數(shù)據(jù)流,需要具備一定的專業(yè)知識(shí)來確保數(shù)據(jù)質(zhì)量[9]。
GO-SHIP計(jì)劃參照 WOCE計(jì)劃的數(shù)據(jù)管理方式,依托不同的數(shù)據(jù)中心存儲(chǔ)不同參數(shù)。修訂了1994年WOCE水文項(xiàng)目手冊(cè),于2010年初發(fā)表。新手冊(cè)規(guī)定了每個(gè)參數(shù)從產(chǎn)生到質(zhì)控的細(xì)節(jié),還規(guī)定了使用認(rèn)證的參考物質(zhì)/標(biāo)準(zhǔn)物質(zhì)(Certified Reference Materials,CRMs),航次及測(cè)定期間盡可能頻繁地使用,以確保不同航次相同斷面的數(shù)據(jù)具有可比性。
JOGFS計(jì)劃,各個(gè)國(guó)家相繼建立JGOFS項(xiàng)目數(shù)據(jù)管理辦公室,負(fù)責(zé)數(shù)據(jù)質(zhì)量的把關(guān)。
GEOTRACES計(jì)劃設(shè)有國(guó)際計(jì)劃的數(shù)據(jù)中心—GEOTRACES國(guó)際數(shù)據(jù)中心(GEOTRACES International Data Assembly Centre,GDAC),依托英國(guó)國(guó)家海洋數(shù)據(jù)中心(British Oceanographic Data Centre,BODC)。數(shù)據(jù)中心建立后,由專家組成數(shù)據(jù)管理委員會(huì),制定了詳細(xì)的數(shù)據(jù)質(zhì)量控制流程。開展不同實(shí)驗(yàn)室之間的國(guó)際互校; 對(duì)同一海域不同國(guó)家執(zhí)行航次的校驗(yàn),即在同一地理位置設(shè)置互校站位; 提供鐵等痕量元素的標(biāo)準(zhǔn)樣品等。
每個(gè)大計(jì)劃都產(chǎn)生了大量高質(zhì)量、高分辨率的多學(xué)科參數(shù),科學(xué)家們普遍的愿望是全面公開船測(cè)資料,為了平衡整個(gè)大計(jì)劃對(duì)數(shù)據(jù)的集成需求及科學(xué)家們的數(shù)據(jù)知識(shí)產(chǎn)權(quán)之間的矛盾,各大計(jì)劃相繼制定了數(shù)據(jù)共享與引用政策,規(guī)定了數(shù)據(jù)的公開時(shí)間、公開方式等。
3.2.1 數(shù)據(jù)保護(hù)期
WOCE計(jì)劃規(guī)定數(shù)據(jù)產(chǎn)生 2年后公開,科學(xué)家可以在這段時(shí)間分析和發(fā)表數(shù)據(jù),同時(shí)確保大計(jì)劃對(duì)全球數(shù)據(jù)的收集。
美國(guó) JGOFS項(xiàng)目的大部分?jǐn)?shù)據(jù)是在線公開,如過程研究項(xiàng)目中的北大西洋藻華實(shí)驗(yàn)(North Atlantic Bloom Experiment,NABE)、阿拉伯海過程研究(Arabian Sea Process Study)、赤道太平洋過程研究(Equatorial Pacific Process Study),BATS和HOTS時(shí)間序列站數(shù)據(jù),CO2調(diào)查數(shù)據(jù),遙感數(shù)據(jù)等[10]。只有過程研究中的南極環(huán)境與南大洋過程研究(Antarctic Environment and Southern Ocean Process Study,AESOPS)項(xiàng)目對(duì)數(shù)據(jù)設(shè)置為期 2年的數(shù)據(jù)保護(hù)期。法國(guó) JGOFS項(xiàng)目對(duì)數(shù)據(jù)設(shè)有 2—4年的保護(hù)期。日本JGOFS項(xiàng)目對(duì)數(shù)據(jù)設(shè)有3年的保護(hù)期。
GO-SHIP計(jì)劃要求各項(xiàng)參數(shù)依托數(shù)據(jù)中心公開,依據(jù)航次的類型和參數(shù)的分類,規(guī)定航次結(jié)束后6周公開初步數(shù)據(jù),6個(gè)月公開質(zhì)控?cái)?shù)據(jù),2年內(nèi)公開所有數(shù)據(jù)。
國(guó)際GEOTRACES計(jì)劃要求所有參與國(guó)家在數(shù)據(jù)產(chǎn)生兩年后公開。其中美國(guó)GEOTRACES項(xiàng)目要求2年內(nèi)(自樣品收集時(shí)間計(jì)算)公開所有數(shù)據(jù)集、元數(shù)據(jù)文件、衍生的數(shù)據(jù)產(chǎn)品如模型結(jié)果等。加拿大GEOTRACES項(xiàng)目要求在項(xiàng)目結(jié)束 3年后,公開所有數(shù)據(jù)。
3.2.2 數(shù)據(jù)公開發(fā)布方式
四大計(jì)劃數(shù)據(jù)都公開發(fā)布數(shù)據(jù)產(chǎn)品,包含數(shù)據(jù)集和圖集,發(fā)布方式略有不同。
WOCE計(jì)劃數(shù)據(jù)的公開發(fā)布方式是DVD(WOCE Data DVD[11])和數(shù)據(jù)中心網(wǎng)站。GO-SHIP計(jì)劃數(shù)據(jù)的公開方式有兩部分: (1) 項(xiàng)目網(wǎng)站公開航次調(diào)查計(jì)劃及完成情況,(2) 數(shù)據(jù)中心網(wǎng)站公開數(shù)據(jù)。作為WOCE斷面的重復(fù)計(jì)劃,部分航次數(shù)據(jù)同時(shí)公開在 WOCE項(xiàng)目的數(shù)據(jù)網(wǎng)站。
JGOFS計(jì)劃的數(shù)據(jù)產(chǎn)品“國(guó)際JGOFS數(shù)據(jù)集,第 1卷: 離散數(shù)據(jù)集(1989—2000)”,于 2003年 5月召開的JGOFS開放科學(xué)會(huì)議,首次以DVD的形式公開發(fā)布[12]。為了實(shí)現(xiàn)長(zhǎng)期存儲(chǔ)和在線訪問,2003年秋季由世界海洋環(huán)境科學(xué)數(shù)據(jù)中心(World Data Centre for Marine Environmental Sciences,WDC-MARE,Germany)負(fù)責(zé)整合國(guó)際 JGOFS數(shù)據(jù)集,出版了“國(guó)際 JGOFS數(shù)據(jù)集,第2卷: 集成數(shù)據(jù)集”及對(duì)應(yīng)的數(shù)據(jù)報(bào)告; 近40 000個(gè)數(shù)據(jù)記錄可以在PANGAEA數(shù)據(jù)庫(kù)里實(shí)現(xiàn)在線檢索[12]。JGOFS數(shù)據(jù)產(chǎn)品的發(fā)布經(jīng)歷了每個(gè)國(guó)家單獨(dú)發(fā)布其數(shù)據(jù)產(chǎn)品,而后集成發(fā)布,期刊公開發(fā)表和網(wǎng)站發(fā)布相結(jié)合。
GEOTRACES計(jì)劃在實(shí)施的第四年公開發(fā)布第一個(gè)數(shù)據(jù)產(chǎn)品,即 IDP2014[13],包含兩部分: (1) 實(shí)測(cè)數(shù)據(jù)集,(2) 電子圖集(eGEOTRACES),eGEOTRACES基于實(shí)測(cè)數(shù)據(jù)集,展示方式包含斷面圖和3維動(dòng)畫場(chǎng)景。3年后又發(fā)布了第二個(gè)數(shù)據(jù)產(chǎn)品IDP2017[8,14],數(shù)據(jù)量增加了一倍,數(shù)據(jù)質(zhì)量和展示形式上也有所創(chuàng)新。目前正在準(zhǔn)備第三個(gè)數(shù)據(jù)產(chǎn)品IDP2021。IDP的特點(diǎn)是以航次為連接,將來自不同國(guó)家科學(xué)家的數(shù)據(jù)進(jìn)行集成,以期刊的形式公開發(fā)表,結(jié)合網(wǎng)站發(fā)布。
四個(gè)大計(jì)劃都制定了數(shù)據(jù)共享政策,以保護(hù)知識(shí)產(chǎn)權(quán)。對(duì)還沒有公開/發(fā)表的數(shù)據(jù),未經(jīng)提供數(shù)據(jù)的科學(xué)家同意不得傳遞和使用。已公開公布的數(shù)據(jù),采用科學(xué)引用的方式使用。如WOCE的數(shù)據(jù)引用公開的DVD和eWOCE。JGOFS計(jì)劃制定了引用政策,國(guó)際計(jì)劃匯編來自各個(gè)國(guó)家的單個(gè)數(shù)據(jù)集,引用格式: 責(zé)任科學(xué)家姓名+數(shù)據(jù)集名稱+CD-ROM 名稱,每個(gè)國(guó)家的格式略有不同[15]。GO-SHIP的數(shù)據(jù)使用,需致謝“全球海洋船基水文調(diào)查計(jì)劃(GO-SHIP)”,并引用氣候和海洋項(xiàng)目與碳水文數(shù)據(jù)辦公室發(fā)布的數(shù)據(jù)集等。GEOTRACES的數(shù)據(jù)和圖集引用公開發(fā)表的 IDP[8,13]和 eGEOTRACES。
WOCE計(jì)劃設(shè)立國(guó)際項(xiàng)目辦公室,最初位于英國(guó)伍姆利的海洋科學(xué)研究所執(zhí)事實(shí)驗(yàn)室(Institute of Oceanographic Sciences Deacon Laboratory,Wormley,U.K),1995年夏季搬到英國(guó)南安普敦大學(xué)南安普敦海洋學(xué)中心。項(xiàng)目辦公室的主要任務(wù)是獲取、評(píng)估和傳播科學(xué)家們參與 WOCE領(lǐng)域的活動(dòng),數(shù)據(jù)分析和建模方案等。WOCE的數(shù)據(jù)集存儲(chǔ)在美國(guó)國(guó)家海洋數(shù)據(jù)中心(US National Oceanographic Data Centre,NODC)。
JGOFS計(jì)劃設(shè)立JGOFS國(guó)際項(xiàng)目辦公室,位于挪威卑爾根大學(xué)。沒有國(guó)際計(jì)劃的數(shù)據(jù)中心,數(shù)據(jù)管理依托各參與國(guó)家建立的項(xiàng)目數(shù)據(jù)管理辦公室。
JGOFS美國(guó)建立JGOFS美國(guó)數(shù)據(jù)管理辦公室,位于伍茲霍爾海洋學(xué)研究所(Woods Hole Oceanographic Institution,WHOI),負(fù)責(zé)JGOFS美國(guó)的數(shù)據(jù)收集、存儲(chǔ)與管理。JGOFS德國(guó)數(shù)據(jù)中心設(shè)在德國(guó)基爾海洋科學(xué)研究所(Institut für Mereeskunde,Kiel,Germany),有數(shù)據(jù)系統(tǒng)網(wǎng)站,可以檢索航次信息、參數(shù)及負(fù)責(zé)責(zé)任科學(xué)家、數(shù)據(jù)可用性。數(shù)據(jù)申請(qǐng)和使用時(shí),需要郵件聯(lián)系責(zé)任科學(xué)家得到許可。JGOFS英國(guó)數(shù)據(jù)中心設(shè)在BODC,負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)、共享與發(fā)布,其中得到授權(quán)的用戶可以在在線系統(tǒng)中提取數(shù)據(jù)。JGOFS法國(guó)數(shù)據(jù)中心設(shè)在法國(guó)自由城海洋觀測(cè)站(Villefranche Oceanographic Observatory,France),負(fù)責(zé)JGOFS法國(guó)數(shù)據(jù)的收集和存儲(chǔ),并維護(hù)數(shù)據(jù)庫(kù)網(wǎng)站。JGOFS日本設(shè)有數(shù)據(jù)管理辦公室,數(shù)據(jù)存儲(chǔ)在日本海洋數(shù)據(jù)中心(Japan Oceanographic Data Center,JODC); 數(shù)據(jù)中心的網(wǎng)站由名古屋大學(xué)維護(hù)。JGOFS加拿大數(shù)據(jù)中心設(shè)有專門的數(shù)據(jù)管理網(wǎng)站,與加拿大的國(guó)家海洋數(shù)據(jù)中心—加拿大海洋環(huán)境數(shù)據(jù)服務(wù)(Marine Environment Data Service,MEDS)相連接,存儲(chǔ) JGOFS加拿大項(xiàng)目的數(shù)據(jù)和相關(guān)事件文件集; 通過MEDS的離線數(shù)據(jù)申請(qǐng)系統(tǒng)申請(qǐng)數(shù)據(jù)。JGOFS印度數(shù)據(jù)存儲(chǔ)在印度的國(guó)家海洋數(shù)據(jù)中心(Indian National Oceanographic Data Centre,NODC),負(fù)責(zé)數(shù)據(jù)的收集和存儲(chǔ)[10]。
GO-SHIP計(jì)劃,依托不同的數(shù)據(jù)中心對(duì)數(shù)據(jù)進(jìn)行收集、存儲(chǔ)與發(fā)布[8]: (1) 氣候和海洋項(xiàng)目與碳水文數(shù)據(jù)辦公室(CLIVAR and Carbon Hydrographic Data Office,CCHDO),負(fù)責(zé)CTD和瓶采參數(shù); (2) 海洋碳數(shù)據(jù)系統(tǒng)(Ocean Carbon Data System,OCADS,former CDIAC),負(fù)責(zé)碳數(shù)據(jù); (3) 夏威夷聯(lián)合存儲(chǔ)船載ADCP(Hawaii Joint Archive for Shipboard ADCP)和全球海洋表面航行數(shù)據(jù)項(xiàng)目(The Global Ocean Surface Underway Data Project,GOSUD),負(fù)責(zé)船載聲學(xué)多普勒流速剖面儀數(shù)據(jù); (4) 夏威夷大學(xué)海流組(Hawaii Joint Archive for Shipboard ADCP),負(fù)責(zé)投放式聲學(xué)多普勒流速剖面儀數(shù)據(jù); (5) 上層海洋氣象數(shù)據(jù)整合中心(Surface Marine Meteorological Data Assembly Center,COAPS,FSU),負(fù)責(zé)海洋氣象數(shù)據(jù); (6) 全球海表走航數(shù)據(jù)項(xiàng)目(The Global Ocean Surface Underway Data Project,GOSUD),負(fù)責(zé)走航數(shù)據(jù)。
GEOTRACES計(jì)劃設(shè)有國(guó)際計(jì)劃數(shù)據(jù)中心GDAC,由英國(guó)國(guó)家海洋數(shù)據(jù)中心管理,由海洋研究科學(xué)委員會(huì)、美國(guó)國(guó)家科學(xué)基金會(huì)和英國(guó)自然環(huán)境研究中心共同資助。
GEOTRACES美國(guó)項(xiàng)目數(shù)據(jù)中心設(shè)在生物化學(xué)海洋學(xué)數(shù)據(jù)管理辦公室(Biological and Chemical Oceanography Data Management Office,BCO-DMO),負(fù)責(zé)數(shù)據(jù)的收集、存儲(chǔ)與發(fā)布。GEOTRACES加拿大項(xiàng)目數(shù)據(jù)中心設(shè)在加拿大的國(guó)家極地?cái)?shù)據(jù)中心—極地?cái)?shù)據(jù)目錄(Polar Data Catalogue),由加拿大國(guó)際極地年(The Canadian International Polar Year,IPY)計(jì)劃提名,加拿大卓越中心網(wǎng)(ArcticNet)和加拿大冰凍圈信息網(wǎng)(CCIN)聯(lián)合開發(fā),項(xiàng)目辦公室設(shè)在滑鐵盧大學(xué)和魁北克市拉瓦爾大學(xué)。GEOTRACES德國(guó)項(xiàng)目數(shù)據(jù)中心設(shè)在德國(guó)的國(guó)家極地?cái)?shù)據(jù)中心—PANGAEA,負(fù)責(zé)數(shù)據(jù)的收集、存儲(chǔ)與發(fā)布。GEOTRACES瑞典項(xiàng)目數(shù)據(jù)中心設(shè)在瑞典氣象水文研究所(SMHI),負(fù)責(zé)數(shù)據(jù)的收集、存儲(chǔ)與發(fā)布。GEOTRACES日本項(xiàng)目數(shù)據(jù)中心設(shè)在日本海洋數(shù)據(jù)中心 JODC,負(fù)責(zé)收集和管理所有海洋學(xué)數(shù)據(jù),并負(fù)責(zé)數(shù)據(jù)的質(zhì)量控制。GEOTRACES法國(guó)項(xiàng)目數(shù)據(jù)中心設(shè)在法國(guó)自由城海洋觀測(cè)站,負(fù)責(zé)數(shù)據(jù)的收集、存儲(chǔ)與發(fā)布。GEOTRACES荷蘭項(xiàng)目數(shù)據(jù)中心設(shè)在荷蘭皇家海洋研究所(Royal Netherlands Institute for Sea Research,NIOZ),負(fù)責(zé)數(shù)據(jù)的收集、存儲(chǔ)與發(fā)布。GEOTRACES中國(guó)項(xiàng)目數(shù)據(jù)中心設(shè)在廈門大學(xué),負(fù)責(zé)數(shù)據(jù)的收集、存儲(chǔ)與發(fā)布。
綜合WOCE、JGOFS、GO-SHIP和GEOTRACES四個(gè)國(guó)際海洋觀測(cè)計(jì)劃,項(xiàng)目的執(zhí)行期都超過10年,研究區(qū)域遍布全球大洋,多個(gè)國(guó)家的科學(xué)家共同參與,均依托國(guó)家數(shù)據(jù)中心/大型數(shù)據(jù)中心,依次為美國(guó)國(guó)家海洋數(shù)據(jù)中心(NODC)、地球與環(huán)境科學(xué)數(shù)據(jù)發(fā)布(PANGAEA)、氣候和海洋項(xiàng)目與碳水文數(shù)據(jù)辦公室(CCHDO)、GEOTRACES國(guó)際數(shù)據(jù)中心(GDAC)等。在數(shù)據(jù)管理方面都制定了數(shù)據(jù)規(guī)范化存儲(chǔ)、數(shù)據(jù)質(zhì)量控制措施、數(shù)據(jù)保護(hù)期,在數(shù)據(jù)的公開發(fā)布方式、共享與引用、數(shù)據(jù)的下載使用等方面略有不同。
四大計(jì)劃的不同之處,對(duì)比如下:
實(shí)體數(shù)據(jù)內(nèi)容: 四個(gè)計(jì)劃只有 JGOFS計(jì)劃要求提供cast號(hào)和采水瓶號(hào),同一站位不同cast號(hào),可能一個(gè)采自白天,一個(gè)采自夜晚; 這兩個(gè)參數(shù)決定了各參數(shù)是否是采自同一水團(tuán),對(duì)過程研究非常重要。
數(shù)據(jù)質(zhì)量保證: WOCE和JGOFS計(jì)劃的數(shù)據(jù)質(zhì)量保證依靠各數(shù)據(jù)中心和項(xiàng)目數(shù)據(jù)管理辦公室,沒有統(tǒng)一的質(zhì)控措施和標(biāo)準(zhǔn)。GO-SHIP計(jì)劃在WOCE計(jì)劃的基礎(chǔ)上,修改制定了新的操作手冊(cè),統(tǒng)一了從采樣到質(zhì)控的流程,規(guī)定了樣品測(cè)定過程中使用標(biāo)準(zhǔn)物質(zhì)進(jìn)行質(zhì)量控制。GEOTRACES計(jì)劃建立國(guó)際數(shù)據(jù)中心,成立數(shù)據(jù)管理委員會(huì),規(guī)定對(duì)于不同國(guó)家/研究團(tuán)隊(duì)實(shí)施的不同航次需設(shè)定互校站位,各實(shí)驗(yàn)室參與國(guó)際比對(duì)等措施,對(duì)各參與國(guó)家的數(shù)據(jù)質(zhì)量進(jìn)行統(tǒng)一把關(guān)。
數(shù)據(jù)產(chǎn)品發(fā)布: GEOTRACES計(jì)劃在執(zhí)行期間,每隔3—4年更新發(fā)布一次數(shù)據(jù)產(chǎn)品,采用數(shù)據(jù)圖集和實(shí)體數(shù)據(jù)相結(jié)合,期刊發(fā)布和網(wǎng)站發(fā)布相結(jié)合的方式,能夠更快地促進(jìn)學(xué)科間的交流及數(shù)據(jù)的共享。而WOCE和JGOFS計(jì)劃都是項(xiàng)目結(jié)束后再組織發(fā)布數(shù)據(jù)產(chǎn)品。GO-SHIP計(jì)劃仍在執(zhí)行期,還沒有發(fā)布整合的數(shù)據(jù)產(chǎn)品,依托數(shù)據(jù)中心發(fā)布數(shù)據(jù)集。
數(shù)據(jù)申請(qǐng)與共享: WOCE、GO-SHIP和 JGOFS計(jì)劃,打開數(shù)據(jù)中心網(wǎng)址選擇需要的斷面/航次/參數(shù),可以直接下載實(shí)體數(shù)據(jù)[16,17,12]; GEOTRACES計(jì)劃,打開數(shù)據(jù)中心網(wǎng)址先注冊(cè)賬號(hào)選擇數(shù)據(jù)使用用途,可以下載不同格式的實(shí)體數(shù)據(jù)和圖集[14]。
國(guó)際計(jì)劃的數(shù)據(jù)管理經(jīng)歷了WOCE時(shí)代從剛開始沒有數(shù)據(jù)中心可用,到建立各種組合和處理數(shù)據(jù)中心管理數(shù)據(jù); JGOFS計(jì)劃依托各國(guó)家建立的項(xiàng)目數(shù)據(jù)管理辦公室管理數(shù)據(jù); GO-SHIP依托不同的數(shù)據(jù)中心管理不同類型的數(shù)據(jù); 到 GEOTRACES計(jì)劃建立國(guó)際計(jì)劃數(shù)據(jù)中心并依托各國(guó)家的國(guó)家數(shù)據(jù)中心。數(shù)據(jù)管理方面從數(shù)據(jù)規(guī)范化內(nèi)容、數(shù)據(jù)質(zhì)量控制方案、數(shù)據(jù)發(fā)布與引用方式、共享政策等都在不斷發(fā)展完善。
其中數(shù)據(jù)的發(fā)布和引用方式,從WOCE和JGOFS計(jì)劃的 CD-ROM,GO-SHIP計(jì)劃的航次數(shù)據(jù)集,到GEOTRACES計(jì)劃的IDP,目的都是讓數(shù)據(jù)能獨(dú)立于文章單獨(dú)發(fā)表/發(fā)布。數(shù)字對(duì)象標(biāo)識(shí)符(digital object identifiers,doi)的應(yīng)用,解決了數(shù)據(jù)要與文章捆綁發(fā)表的困局,確保數(shù)據(jù)知識(shí)產(chǎn)權(quán)的同時(shí)能夠最大程度地使用數(shù)據(jù),是全球大數(shù)據(jù)時(shí)代海洋科學(xué)發(fā)展的重大機(jī)遇。建立規(guī)范的數(shù)據(jù)倉(cāng)儲(chǔ)中心,必定能推進(jìn)數(shù)據(jù)共享與使用。
國(guó)際計(jì)劃數(shù)據(jù)共享與管理的成功經(jīng)驗(yàn),得益于他們所依托的科學(xué)數(shù)據(jù)中心。我們選取了其中四家海洋學(xué)數(shù)據(jù)中心,分析其功能與特點(diǎn),匯總在表1。
表1 四個(gè)科學(xué)數(shù)據(jù)中心的功能與特點(diǎn)匯總Tab.1 Summary of functions and characteristics from four scientific data centers
BODC成立于 1988年,起初負(fù)責(zé)北海項(xiàng)目的數(shù)據(jù)管理,如今已發(fā)展成為具有成熟的樣本框架數(shù)據(jù)庫(kù),負(fù)責(zé)管理大型多學(xué)科研究項(xiàng)目的數(shù)據(jù),如 JGOFS英國(guó)、GEOTRACES英國(guó)和國(guó)際計(jì)劃的數(shù)據(jù)管理。除了項(xiàng)目數(shù)據(jù)庫(kù)管理,BODC的數(shù)據(jù)庫(kù)設(shè)計(jì)還兼具其他三大功能: 關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)、國(guó)家海洋學(xué)數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)數(shù)據(jù)庫(kù)[18]。
BODC還是一個(gè)巨大的數(shù)據(jù)存儲(chǔ)中心,接收全球海洋環(huán)境領(lǐng)域數(shù)據(jù)的存儲(chǔ)。存儲(chǔ)在BODC的數(shù)據(jù),會(huì)配備doi。doi是用于永久和穩(wěn)定地標(biāo)識(shí)(通常是數(shù)字)對(duì)象的代碼,提供了一種用于檢索有關(guān)對(duì)象的元數(shù)據(jù)的標(biāo)準(zhǔn)機(jī)制,且通常提供一種訪問數(shù)據(jù)對(duì)象本身的方法。
對(duì)數(shù)據(jù)知識(shí)產(chǎn)權(quán)的保護(hù),除發(fā)表文章之外,將其存儲(chǔ)在數(shù)據(jù)倉(cāng)儲(chǔ)/數(shù)據(jù)中心以獲取 doi,儼然已經(jīng)成為保護(hù)其知識(shí)產(chǎn)權(quán)的最好辦法。
BCO-DMO 于2006年由前 JGOFS美國(guó)項(xiàng)目辦公室和前全球海洋生態(tài)系統(tǒng)動(dòng)力學(xué)(GLOBal Ocean ECosystems Dynamics,GLOBEC)美國(guó)項(xiàng)目辦公室合并成立。位于 WHOI,目前也負(fù)責(zé) GEOTRACES美國(guó)的數(shù)據(jù)管理,由美國(guó)國(guó)家科學(xué)基金會(huì)資助[19]。
BCO-DMO目前只接收美國(guó)國(guó)家科學(xué)基金會(huì)海洋科學(xué)部的生物和化學(xué)海洋學(xué)部門以及極地項(xiàng)目部的南極生物和生態(tài)系統(tǒng)項(xiàng)目,提供數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)管理服務(wù)。其他來源的數(shù)據(jù)存儲(chǔ)需要付費(fèi)。
PANGAEA成立于1995年,是地球與環(huán)境科學(xué)數(shù)據(jù)發(fā)布信息系統(tǒng),支持全球的科學(xué)家使用、存儲(chǔ)和發(fā)布數(shù)據(jù)。可以使用doi來標(biāo)識(shí)、共享、發(fā)布和引用每個(gè)數(shù)據(jù)集[20]。由阿爾弗雷德·韋格納研究所,亥姆霍茲極地和海洋研究中心(the Alfred Wegener Institute,Helmholtz Center for Polar and Marine Research,AWI)和不來梅大學(xué)海洋環(huán)境科學(xué)中心(the Center for Marine Environmental Sciences,University of Bremen,MARUM)主辦。
JODC成立于 1965年,是日本的海洋綜合數(shù)據(jù)庫(kù),收集和管理日本政府機(jī)構(gòu)、大學(xué)和其他海洋研究機(jī)構(gòu)觀測(cè)到的海洋數(shù)據(jù)[21]。負(fù)責(zé)管理日本的國(guó)際項(xiàng)目數(shù)據(jù),如JGOFS,GEOTRACES,PICES(North Pacific Marine Science Organization)等。
自1995年,海洋數(shù)據(jù)服務(wù)系統(tǒng)實(shí)現(xiàn)互聯(lián)網(wǎng)在線使用功能,用戶可以使用多個(gè)關(guān)鍵字在線檢索數(shù)據(jù),并下載。不支持其他來源的數(shù)據(jù)存儲(chǔ)。
基于以上對(duì)比分析,在開展綜合性項(xiàng)目數(shù)據(jù)管理工作時(shí),為了讓數(shù)據(jù)具備長(zhǎng)久的使用性和可傳承性,平衡項(xiàng)目對(duì)數(shù)據(jù)的集成需求和科學(xué)家對(duì)數(shù)據(jù)的共享需求。建議項(xiàng)目啟動(dòng)時(shí),建立項(xiàng)目/數(shù)據(jù)管理辦公室,制定科研數(shù)據(jù)標(biāo)準(zhǔn)化規(guī)范。針對(duì)項(xiàng)目研究?jī)?nèi)容和目標(biāo),制定出一套完整的項(xiàng)目的實(shí)體參數(shù)目錄,統(tǒng)一數(shù)據(jù)名稱、單位、分類及內(nèi)容,制定元數(shù)據(jù)模板,根據(jù)數(shù)據(jù)系統(tǒng)功能設(shè)定可接收的數(shù)據(jù)格式。數(shù)據(jù)管理辦公室要具備存儲(chǔ)、共享與發(fā)布數(shù)據(jù)的功能。在項(xiàng)目成員內(nèi)部就數(shù)據(jù)質(zhì)量的保證措施、數(shù)據(jù)共享和使用等管理規(guī)定達(dá)成共識(shí)。
針對(duì)項(xiàng)目的關(guān)鍵科學(xué)問題、主要研究目標(biāo)和預(yù)期目標(biāo)等,結(jié)合責(zé)任科學(xué)家的研究方向和項(xiàng)目的課題設(shè)置,制定出實(shí)施參數(shù)與責(zé)任科學(xué)家一一對(duì)應(yīng)的項(xiàng)目計(jì)劃實(shí)施參數(shù)匯總表,依照航次執(zhí)行情況實(shí)時(shí)更新。
所謂數(shù)據(jù)標(biāo)準(zhǔn)化,即制定數(shù)據(jù)規(guī)范化標(biāo)準(zhǔn),包含元數(shù)據(jù)和實(shí)體數(shù)據(jù),規(guī)定其具體內(nèi)容,同時(shí)預(yù)留新增學(xué)科數(shù)據(jù)的空間。
7.2.1 元數(shù)據(jù)
需要建立元數(shù)據(jù)模板,包含所有與科學(xué)數(shù)據(jù)產(chǎn)生相關(guān)的基本信息,做到每個(gè)步驟細(xì)節(jié)可溯源,如航次基本信息,參數(shù)的采樣、測(cè)樣、分析流程及質(zhì)控措施等相關(guān)流程和操作人等。
7.2.2 實(shí)體數(shù)據(jù)
(1) 參數(shù)名稱和單位,同一個(gè)參數(shù)在不同的研究機(jī)構(gòu)和不同的科學(xué)家的筆下,常常有不同的名稱。參數(shù)名稱需要標(biāo)準(zhǔn)化,第一步是匯總同一參數(shù)盡可能多的名稱,第二步要求參數(shù)名稱歸一化?;蛘咧贫ǔ鲞m合項(xiàng)目參數(shù)的命名規(guī)則,并統(tǒng)一參數(shù)的單位。
(2) 文件模板和格式,根據(jù)數(shù)據(jù)庫(kù)設(shè)計(jì)的功能,規(guī)定實(shí)體數(shù)據(jù)的內(nèi)容和提交格式。
(3) 數(shù)據(jù)質(zhì)量的保證方案和質(zhì)控標(biāo)簽
數(shù)據(jù)質(zhì)量的保證方案,盡可能詳細(xì)具體。比如規(guī)定各參數(shù)從采樣、分析測(cè)定到質(zhì)量控制每個(gè)步驟的操作規(guī)范,使用統(tǒng)一的標(biāo)準(zhǔn)物質(zhì),設(shè)置共同的互校站位(每個(gè)海域設(shè)置一個(gè)站位或者一條斷面),在國(guó)內(nèi)開展各實(shí)驗(yàn)室之間的比對(duì),參與國(guó)際互校等工作方案。
質(zhì)控標(biāo)簽,可以創(chuàng)立項(xiàng)目/數(shù)據(jù)中心的質(zhì)控標(biāo)簽,也可以直接采用國(guó)際上已有的質(zhì)控標(biāo)簽。
(4) 參數(shù)分類,根據(jù)計(jì)劃參數(shù)的特點(diǎn),建立項(xiàng)目/數(shù)據(jù)中心的參數(shù)分類體系,創(chuàng)建“參數(shù)字典表”,便于在數(shù)據(jù)庫(kù)中檢索查找; 預(yù)留新增數(shù)據(jù)的空間。
數(shù)據(jù)提交時(shí)間要視項(xiàng)目研究特點(diǎn),依據(jù)數(shù)據(jù)生產(chǎn)周期,可以設(shè)置不同的時(shí)間節(jié)點(diǎn)提交數(shù)據(jù)。比如在船上能夠完成測(cè)定的參數(shù),可以設(shè)置1—6個(gè)月提交原始數(shù)據(jù)、質(zhì)控?cái)?shù)據(jù)和相關(guān)報(bào)告。測(cè)定周期比較長(zhǎng)的數(shù)據(jù)如同位素等可以設(shè)置1—2年提交。國(guó)際慣例一般要求在航次結(jié)束后兩年/數(shù)據(jù)產(chǎn)生后兩年完成提交并公開,公開時(shí)間同樣需要視項(xiàng)目研究特點(diǎn),在項(xiàng)目成員內(nèi)部達(dá)成共識(shí)。
數(shù)據(jù)共享管理政策,盡可能詳細(xì)具體。比如: 數(shù)據(jù)未公開前,(1) 在期刊論文中使用未發(fā)表數(shù)據(jù),投稿前需要聯(lián)系數(shù)據(jù)提供人征得同意,并商討數(shù)據(jù)的具體使用方式。(2) 不得將申請(qǐng)到的數(shù)據(jù)提供給第三方等。
綜合性項(xiàng)目的特點(diǎn)強(qiáng)調(diào)多學(xué)科交叉,如何既能滿足學(xué)科交叉對(duì)數(shù)據(jù)共享交流的需求,又能保證科學(xué)家的知識(shí)產(chǎn)權(quán),除了項(xiàng)目成員共同遵守學(xué)術(shù)道德規(guī)范,還需出臺(tái)法律/政策規(guī)范進(jìn)行保障和限制[22]。
數(shù)據(jù)要集成,各學(xué)科要進(jìn)行充分的共享交流,促進(jìn)項(xiàng)目的成果產(chǎn)出,必須建立/依托數(shù)據(jù)共享平臺(tái),同時(shí)配備共享平臺(tái)的開發(fā)小組和共享管理的業(yè)務(wù)小組,共同合作運(yùn)營(yíng)。同時(shí)為數(shù)據(jù)按時(shí)提交如期公開提供技術(shù)支撐與保障。數(shù)據(jù)共享平臺(tái),可以是分布式國(guó)家級(jí)數(shù)據(jù)中心群[23],可以是與國(guó)際接軌的數(shù)據(jù)倉(cāng)儲(chǔ)中心群,數(shù)據(jù)集提交到數(shù)據(jù)倉(cāng)儲(chǔ)/數(shù)據(jù)中心獲得 doi,使用該數(shù)據(jù)集,必須引用doi。
本文介紹了 WOCE、JGOFS、GO-SHIP和GETRACES四個(gè)國(guó)際海洋觀測(cè)計(jì)劃對(duì)數(shù)據(jù)管理的一整套流程。數(shù)據(jù)在管理方式上都制定了數(shù)據(jù)規(guī)范化、數(shù)據(jù)質(zhì)量控制措施、數(shù)據(jù)保護(hù)期、數(shù)據(jù)公開發(fā)布、共享與引用政策。
全球海洋觀測(cè)計(jì)劃的數(shù)據(jù)管理經(jīng)歷了近30年的發(fā)展,WOCE計(jì)劃由剛開始沒有數(shù)據(jù)中心可用,到建立各種組合和處理數(shù)據(jù)中心管理數(shù)據(jù); JGOFS計(jì)劃依托各國(guó)家建立的項(xiàng)目數(shù)據(jù)管理辦公室管理數(shù)據(jù);GO-SHIP依托不同數(shù)據(jù)中心存儲(chǔ)和管理不同類型的數(shù)據(jù); GEOTRACES計(jì)劃建立國(guó)際計(jì)劃數(shù)據(jù)中心并依托各國(guó)家的國(guó)家數(shù)據(jù)中心,數(shù)據(jù)管理從數(shù)據(jù)規(guī)范化內(nèi)容、數(shù)據(jù)發(fā)布與引用方式、共享政策都在不斷發(fā)展完善。在此基礎(chǔ)上對(duì)比了美國(guó) BCO-DMO、英國(guó)BODC、德國(guó)PANGAEA和日本JODC四個(gè)國(guó)家的國(guó)家海洋數(shù)據(jù)中心的功能與特點(diǎn),探討了建立數(shù)據(jù)中心和數(shù)據(jù)倉(cāng)儲(chǔ)對(duì)推行數(shù)據(jù)規(guī)范化存儲(chǔ)與管理和推進(jìn)數(shù)據(jù)共享的重要性。
借鑒國(guó)際海洋觀測(cè)計(jì)劃數(shù)據(jù)管理形式和各國(guó)的數(shù)據(jù)共享經(jīng)驗(yàn),探討建立一套適合我國(guó)的數(shù)據(jù)管理方案。項(xiàng)目啟動(dòng)時(shí),依托數(shù)據(jù)中心,建立項(xiàng)目/數(shù)據(jù)管理辦公室,制定科研數(shù)據(jù)標(biāo)準(zhǔn)化規(guī)范。針對(duì)項(xiàng)目研究?jī)?nèi)容和目標(biāo),制定出一套完整的項(xiàng)目的實(shí)體參數(shù)目錄,統(tǒng)一數(shù)據(jù)名稱、單位、分類及內(nèi)容,制定元數(shù)據(jù)模板,根據(jù)數(shù)據(jù)系統(tǒng)功能設(shè)定可接收的數(shù)據(jù)格式。數(shù)據(jù)管理辦公室要具備存儲(chǔ)、共享與發(fā)布數(shù)據(jù)的功能。在項(xiàng)目成員內(nèi)部就數(shù)據(jù)質(zhì)量的保證措施、數(shù)據(jù)共享和引用等管理規(guī)定達(dá)成共識(shí)。本研究可以為我國(guó)的海洋觀測(cè)計(jì)劃制定數(shù)據(jù)管理方案提供參考和借鑒。
致謝:感謝廈門大學(xué)戴民漢教授的指導(dǎo)與建議,感謝廈門大學(xué)蔡毅華教授、楊進(jìn)宇助理教授、李驍麟教授、郭香會(huì)副教授、林宏陽副教授和集美大學(xué)何碧煙教授在論文修改過程中提出的建議,感謝兩位評(píng)審專家對(duì)論文提出的評(píng)審建議。