郭學(xué)兵 蘇 文 唐新齋 張 黎 何洪林
(中國(guó)科學(xué)院地理科學(xué)與資源研究所生態(tài)系統(tǒng)網(wǎng)絡(luò)觀測(cè)與模擬重點(diǎn)實(shí)驗(yàn)室,北京 100101)
生態(tài)系統(tǒng)長(zhǎng)期觀測(cè)(Long term observation for ecosystem,EcoLTO)是指按統(tǒng)一規(guī)范對(duì)主要農(nóng)田、森林、草地、荒漠、沼澤、湖泊和海灣生態(tài)系統(tǒng)的主要環(huán)境因子和生物群落及其基本生態(tài)過(guò)程進(jìn)行長(zhǎng)期監(jiān)測(cè),定期提供主要類型生態(tài)系統(tǒng)的動(dòng)態(tài)信息[1]。EcoLTO是中國(guó)生態(tài)系統(tǒng)研究網(wǎng)絡(luò)(Chinese Ecosystem Research Network, CERN)數(shù)據(jù)中心、國(guó)家生態(tài)科學(xué)數(shù)據(jù)中心(National Ecosystem Science Data Center,NESDC)管理的非常重要的科學(xué)數(shù)據(jù)專類。它的建設(shè)和運(yùn)行是一項(xiàng)基礎(chǔ)性系統(tǒng)工程。
EcoLTO數(shù)據(jù)具有多樣性、復(fù)雜性、專業(yè)性、長(zhǎng)期性、繼承性、公益性以及責(zé)任主體分離性等特點(diǎn)。具體表現(xiàn)是:EcoLTO包括水分、土壤、大氣、生物等方面多樣化、數(shù)百個(gè)觀測(cè)指標(biāo),這些指標(biāo)獲取處理方法相異復(fù)雜,且需具備專業(yè)的技能和知識(shí)來(lái)保證獲取高質(zhì)量數(shù)據(jù),如果缺乏規(guī)范化管理會(huì)降低EcoLTO數(shù)據(jù)質(zhì)量;EcoLTO觀測(cè)數(shù)據(jù)經(jīng)常歷經(jīng)若干代監(jiān)測(cè)及管理人員的更迭,且數(shù)據(jù)以公益性方式支撐第三方科研人員使用,如果缺乏標(biāo)準(zhǔn)規(guī)范指導(dǎo),EcoLTO數(shù)據(jù)價(jià)值將會(huì)貶損;EcoLTO數(shù)據(jù)涉及數(shù)據(jù)獲取、質(zhì)控、存儲(chǔ)、發(fā)布、管理、共享服務(wù)等全生命周期各環(huán)節(jié),其相關(guān)責(zé)任主體(產(chǎn)生者、管理者、使用者)機(jī)構(gòu)分離、地域分離、視角分離,各方主體基于規(guī)范建立合理的數(shù)據(jù)合作治理關(guān)系對(duì)于數(shù)據(jù)有序管理與共享至關(guān)重要。
因此,本文主要概述了國(guó)際國(guó)內(nèi)數(shù)據(jù)產(chǎn)品化發(fā)展情況,在CERN經(jīng)過(guò)“EcoLTO統(tǒng)一監(jiān)測(cè)”“EcoLTO統(tǒng)一數(shù)據(jù)管理”兩個(gè)階段后,進(jìn)一步提出“EcoLTO統(tǒng)一數(shù)據(jù)產(chǎn)品管理”理念,以及產(chǎn)品化對(duì)于EcoLTO數(shù)據(jù)管理與共享的重要意義,并概要介紹了數(shù)據(jù)產(chǎn)品標(biāo)準(zhǔn)規(guī)范的組成內(nèi)容及其對(duì)“統(tǒng)一產(chǎn)品管理”的指導(dǎo)作用,以及數(shù)據(jù)產(chǎn)品標(biāo)準(zhǔn)規(guī)范在國(guó)家生態(tài)科學(xué)數(shù)據(jù)中心(NESDC)建設(shè)“生態(tài)網(wǎng)絡(luò)云”系統(tǒng)中的應(yīng)用實(shí)踐,以期對(duì)我國(guó)長(zhǎng)期生態(tài)監(jiān)測(cè)數(shù)據(jù)管理與共享帶來(lái)啟發(fā)。
在地理信息領(lǐng)域,國(guó)際標(biāo)準(zhǔn)化組織ISO早在2003年提出Geographic Information-Metadata,ISO 19115:2003(地理信息元數(shù)據(jù)),2007年又提出地理信息產(chǎn)品規(guī)范ISO 19131:2007[2]。國(guó)際海道測(cè)量組織(International Hydrographic Organization,IHO)發(fā)布了與此相關(guān)的不同版本的電子海圖、水深表面等產(chǎn)品規(guī)范[3-4]。
在生態(tài)領(lǐng)域,美國(guó)于2006年提出NEON(National Ecosystem Observation Network)項(xiàng) 目啟動(dòng)計(jì)劃,2011年獲得美國(guó)NSF經(jīng)費(fèi)資助,2019年NEON項(xiàng)目完成建設(shè)任務(wù),并進(jìn)入操作運(yùn)行階段。NEON項(xiàng)目始終把提供標(biāo)準(zhǔn)化、質(zhì)量保證的數(shù)據(jù)產(chǎn)品作為NEON的必要使命,整個(gè)設(shè)計(jì)與建設(shè)過(guò)程始終秉持了產(chǎn)品分級(jí)、產(chǎn)品生產(chǎn)、產(chǎn)品開(kāi)放共享的理念。
NEON產(chǎn)品分級(jí)明確了NEON為社會(huì)提供的產(chǎn)品譜系。譜系包括從原始獲取的0級(jí)數(shù)據(jù)到經(jīng)過(guò)質(zhì)量控制和轉(zhuǎn)換后形成的具有科學(xué)意義的1級(jí)數(shù)據(jù),再到融合了基礎(chǔ)指標(biāo)數(shù)據(jù)和科學(xué)理論獲取的4級(jí)數(shù)據(jù)(例如從地表水水位及水位—流量觀測(cè)曲線計(jì)算徑流量,從高頻風(fēng)和氣體濃度指標(biāo)衍生出的地表和大氣層之間的二氧化碳交換量數(shù)據(jù))。
目前,NEON建成了81個(gè)野外臺(tái)站,通過(guò)應(yīng)用自動(dòng)觀測(cè)系統(tǒng)、野外采樣系統(tǒng)、空中遙感觀測(cè)調(diào)查獲取一套生物物理化學(xué)等生態(tài)特征指標(biāo),獲取數(shù)據(jù)匯聚到NEON總部進(jìn)行生產(chǎn),發(fā)布數(shù)據(jù)產(chǎn)品供用戶使用。為此,NEON編制了數(shù)據(jù)產(chǎn)品體系及數(shù)據(jù)產(chǎn)品生產(chǎn)加工的各項(xiàng)規(guī)程、文檔,其產(chǎn)品目錄、支撐元數(shù)據(jù)、科學(xué)設(shè)計(jì)、數(shù)據(jù)采集和數(shù)據(jù)處理文檔均可通過(guò)共享門(mén)戶(http://data.neonscience.org/home)被公眾訪問(wèn),這些開(kāi)放數(shù)據(jù)有力支撐了美國(guó)區(qū)域及大陸尺度的復(fù)雜生態(tài)過(guò)程的科學(xué)研究。
自2016年以來(lái),國(guó)際數(shù)據(jù)出版風(fēng)潮凸現(xiàn),期刊、出版社、數(shù)據(jù)管理機(jī)構(gòu)等以數(shù)據(jù)出版形式發(fā)表數(shù)據(jù)集。例如,地球觀測(cè)數(shù)據(jù)共享網(wǎng)(DataONE)整合了全球44家知名機(jī)構(gòu)進(jìn)行分布式數(shù)據(jù)產(chǎn)品發(fā)布(http://www.dataone.org)。
在地理信息領(lǐng)域,全國(guó)地理信息標(biāo)準(zhǔn)化技術(shù)委員會(huì)(SAC/TC 230)2010年提出了GB/T 25528—2010地理信息產(chǎn)品規(guī)范,規(guī)范等同于ISO 19131:2007,規(guī)范化了地理信息數(shù)據(jù)產(chǎn)品的獲取及衍生數(shù)據(jù)產(chǎn)品等的描述方法[5]等,引領(lǐng)了不同領(lǐng)域的地理信息產(chǎn)品規(guī)范的編制和應(yīng)用。國(guó)內(nèi)機(jī)構(gòu)紛紛解讀國(guó)際電子海圖、水深表面等產(chǎn)品規(guī)范內(nèi)容,并應(yīng)用于國(guó)際數(shù)據(jù)交換和服務(wù)航海等應(yīng)用[2-3]。
在遙感觀測(cè)領(lǐng)域,中國(guó)科學(xué)院遙感與數(shù)字地球研究所于2017年發(fā)表論文,公布了以遙感觀測(cè)數(shù)據(jù)產(chǎn)品為導(dǎo)向發(fā)展多源協(xié)同遙感觀測(cè)與分析處理方法,推動(dòng)遙感從觀測(cè)數(shù)據(jù)到數(shù)據(jù)產(chǎn)品的處理方法向標(biāo)準(zhǔn)化、結(jié)構(gòu)化轉(zhuǎn)變[6]。國(guó)家衛(wèi)星氣象中心自1978 年開(kāi)始接收、處理各類衛(wèi)星數(shù)據(jù)以來(lái),自主研發(fā)和處理生成的大氣和地球表面環(huán)境監(jiān)測(cè)多源氣象衛(wèi)星圖像產(chǎn)品、定量產(chǎn)品和分析產(chǎn)品(包含大氣、陸表、海表等多種產(chǎn)品)已達(dá)數(shù)十種,多種衛(wèi)星數(shù)據(jù)產(chǎn)品在氣象、海洋、農(nóng)業(yè)、林業(yè)、水利、航空、航海、環(huán)境保護(hù)等諸多方面得到綜合運(yùn)用,取得了良好的社會(huì)和經(jīng)濟(jì)效益[7]。
在生態(tài)與環(huán)境觀測(cè)領(lǐng)域,江蘇省常州環(huán)境監(jiān)測(cè)中心分析了新時(shí)期環(huán)境監(jiān)測(cè)數(shù)據(jù)產(chǎn)品內(nèi)涵,分析了數(shù)據(jù)產(chǎn)品在信息化程度、深度開(kāi)發(fā)、數(shù)據(jù)質(zhì)量和信息公開(kāi)等方面存在的問(wèn)題[8]。CERN早在1988年就開(kāi)展生態(tài)系統(tǒng)長(zhǎng)期觀測(cè)[1,9],歷經(jīng)“統(tǒng)一監(jiān)測(cè)管理”“統(tǒng)一數(shù)據(jù)管理”階段,目前正向“統(tǒng)一數(shù)據(jù)產(chǎn)品管理”邁進(jìn)。產(chǎn)品化可使數(shù)據(jù)管理精細(xì)化、流程化、固定化,而產(chǎn)品標(biāo)準(zhǔn)規(guī)范是產(chǎn)品化的重要支撐,通過(guò)產(chǎn)品標(biāo)準(zhǔn)規(guī)范的研制和實(shí)施,可以發(fā)揮長(zhǎng)期監(jiān)測(cè)數(shù)據(jù)的更大價(jià)值,更好地服務(wù)于生態(tài)學(xué)研究和國(guó)家社會(huì)經(jīng)濟(jì)建設(shè)。
(1)EcoLTO“統(tǒng)一監(jiān)測(cè)管理”
中國(guó)科學(xué)院開(kāi)展生態(tài)系統(tǒng)監(jiān)測(cè)工作較早,特別 是1988年CERN成 立 以來(lái),1996年、2006年、2012年先后3次編制了3套不同生態(tài)系統(tǒng)的長(zhǎng)期觀測(cè)規(guī)范[10-14],制定了統(tǒng)一監(jiān)測(cè)指標(biāo)體系和監(jiān)測(cè)規(guī)范,建立了包括《中國(guó)生態(tài)系統(tǒng)研究網(wǎng)絡(luò)考核與評(píng)估辦法(暫行)》在內(nèi)的綜合評(píng)估與考核體系,長(zhǎng)期生態(tài)系統(tǒng)觀測(cè)成為CERN的使命之一,來(lái)自40多個(gè)野外生態(tài)站已經(jīng)開(kāi)展了近30年的連續(xù)觀測(cè)。CERN成為與美國(guó)LTER、英國(guó)ECN齊名的三大國(guó)家生態(tài)系統(tǒng)研究網(wǎng)絡(luò),實(shí)現(xiàn)了統(tǒng)一觀測(cè)指標(biāo)體系、統(tǒng)一觀測(cè)規(guī)范、統(tǒng)一技術(shù)體系的“統(tǒng)一監(jiān)測(cè)管理”。
(2)EcoLTO“統(tǒng)一數(shù)據(jù)管理”
2002年,CERN發(fā)布了《CERN數(shù)據(jù)共享與管理?xiàng)l例》,明確和強(qiáng)化了CERN生態(tài)站—分中心—綜合中心“三級(jí)”數(shù)據(jù)管理與共享服務(wù)體系,推動(dòng)CERN數(shù)據(jù)共享和管理工作。
根據(jù)EcoLTO數(shù)據(jù)的觀測(cè)規(guī)范,制定了統(tǒng)一的數(shù)據(jù)報(bào)表格式和數(shù)據(jù)報(bào)送規(guī)范等,建立了生態(tài)站—分中心—綜合中心三級(jí)協(xié)同管理模式,建成了最具特色、系統(tǒng)化、規(guī)范化的數(shù)據(jù)庫(kù)[15],CERN綜合中心積累了20年大約2 000萬(wàn)條數(shù)據(jù)記錄,實(shí)現(xiàn)了統(tǒng)一數(shù)據(jù)管理。
CERN制定了包括GB/T 20533-2006《生態(tài)科學(xué)數(shù)據(jù)元數(shù)據(jù)》在內(nèi)的一系列標(biāo)準(zhǔn),并應(yīng)用于生態(tài)網(wǎng)絡(luò)云平臺(tái)[16-17]建設(shè)過(guò)程中,實(shí)現(xiàn)了基于生態(tài)科學(xué)元數(shù)據(jù)的統(tǒng)一數(shù)據(jù)管理與共享。
迄今為止,CERN為大量用戶提供數(shù)據(jù)共享服務(wù),支撐了用戶開(kāi)展遙感產(chǎn)品地面驗(yàn)證、生態(tài)模型數(shù)據(jù)驅(qū)動(dòng)、典型生態(tài)系統(tǒng)趨勢(shì)變化分析、大數(shù)據(jù)分析等應(yīng)用,這部分應(yīng)用案例眾多,為國(guó)家科技創(chuàng)新發(fā)揮了重要的支撐作用。
(3)從數(shù)據(jù)到產(chǎn)品的轉(zhuǎn)變
2011年,國(guó)家生態(tài)系統(tǒng)觀測(cè)研究網(wǎng)絡(luò)(CNERN)暨中國(guó)生態(tài)系統(tǒng)研究網(wǎng)絡(luò)率先以數(shù)據(jù)專著形式出版了《中國(guó)生態(tài)系統(tǒng)定位觀測(cè)與研究數(shù)據(jù)集》叢書(shū)(共4卷51冊(cè)),相應(yīng)的數(shù)據(jù)產(chǎn)品在生態(tài)網(wǎng)絡(luò)云平臺(tái)上予以發(fā)布。2017年以來(lái),CERN數(shù)次與《中國(guó)科學(xué)》合作推出“中國(guó)生態(tài)系統(tǒng)研究網(wǎng)絡(luò)(CERN)專題”等數(shù)據(jù)論文專輯,數(shù)據(jù)開(kāi)發(fā)人員不斷挖掘數(shù)據(jù)產(chǎn)品并予以發(fā)表[18-21]等。
數(shù)據(jù)產(chǎn)品的加工整理及出版,促進(jìn)了數(shù)據(jù)質(zhì)量提高、促進(jìn)了數(shù)據(jù)產(chǎn)權(quán)的清晰化,改善了數(shù)據(jù)用戶的使用體驗(yàn)等。在實(shí)踐中,提出EcoLTO數(shù)據(jù)產(chǎn)品化,加強(qiáng)數(shù)據(jù)產(chǎn)品標(biāo)準(zhǔn)規(guī)范。通過(guò)產(chǎn)品標(biāo)準(zhǔn)規(guī)范化建設(shè),促使CERN“統(tǒng)一數(shù)據(jù)管理”向“統(tǒng)一數(shù)據(jù)產(chǎn)品管理”的轉(zhuǎn)變,實(shí)現(xiàn)從數(shù)據(jù)庫(kù)服務(wù)向數(shù)據(jù)產(chǎn)品服務(wù)的轉(zhuǎn)變,以規(guī)范化的產(chǎn)品體系作為觀測(cè)管理、數(shù)據(jù)管理的最終成果。
早期的“統(tǒng)一監(jiān)測(cè)管理”保證了數(shù)據(jù)獲取方法的可比性和一致性。“統(tǒng)一數(shù)據(jù)管理”則基于生態(tài)科學(xué)元數(shù)據(jù)標(biāo)準(zhǔn),以關(guān)系型數(shù)據(jù)庫(kù)管理技術(shù)為手段,通過(guò)采用Java數(shù)據(jù)庫(kù)連接(JDBC)方式動(dòng)態(tài)提取庫(kù)表數(shù)據(jù)為用戶提供數(shù)據(jù)共享服務(wù),實(shí)現(xiàn)了基于生態(tài)科學(xué)元數(shù)據(jù)的統(tǒng)一數(shù)據(jù)管理與共享。
由于一個(gè)庫(kù)表存儲(chǔ)了眾多生態(tài)站獲取的持續(xù)動(dòng)態(tài)更新的、不同級(jí)別的觀測(cè)數(shù)據(jù)(例如,喬木生物量數(shù)據(jù)集把每木調(diào)查數(shù)據(jù)、生物量等不同計(jì)算層級(jí)的數(shù)據(jù)混合存儲(chǔ)),這種管理模式導(dǎo)致庫(kù)表的數(shù)據(jù)產(chǎn)權(quán)分割不清、數(shù)據(jù)質(zhì)量參差不齊。對(duì)數(shù)據(jù)生產(chǎn)者、管理者、使用者而言,體現(xiàn)出產(chǎn)權(quán)不清、質(zhì)量難控、使用不便的缺點(diǎn),從而影響了數(shù)據(jù)共享的質(zhì)量和效率,也影響了數(shù)據(jù)的可持續(xù)生產(chǎn)。
近年來(lái),以知識(shí)產(chǎn)權(quán)保護(hù)為最終目標(biāo)的數(shù)字對(duì)象標(biāo)識(shí)技術(shù),如國(guó)際上,數(shù)字對(duì)象唯一標(biāo)識(shí)符(Digital Object Identifier,DOI)技術(shù)已發(fā)展成熟,國(guó)內(nèi)也成立了中文DOI注冊(cè)中心來(lái)開(kāi)展DOI命名、申請(qǐng)、注冊(cè)、變更、解析等服務(wù),實(shí)現(xiàn)了國(guó)內(nèi)數(shù)據(jù)的標(biāo)識(shí)唯一性、存儲(chǔ)永久性、動(dòng)態(tài)更新性等,有力支撐了數(shù)據(jù)的確權(quán)和標(biāo)識(shí)。同時(shí),國(guó)際通行的知識(shí)共享許可協(xié)議,即CC協(xié)議(A Creative Commons License)可作為數(shù)據(jù)產(chǎn)品的共享協(xié)議。這些技術(shù)的發(fā)展為數(shù)據(jù)產(chǎn)品化及建立數(shù)據(jù)產(chǎn)品開(kāi)放共享的有序機(jī)制提供了良好的外部基礎(chǔ)環(huán)境。
EcoLTO數(shù)據(jù)是CERN的重要數(shù)據(jù)資源,可被視為數(shù)據(jù)資產(chǎn),通過(guò)從不同維度、不同層級(jí)對(duì)EcoLTO數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行質(zhì)量提升、集成整合,開(kāi)展不同層級(jí)的數(shù)據(jù)挖掘(初級(jí)計(jì)算、簡(jiǎn)單計(jì)算、融合復(fù)雜知識(shí)和復(fù)雜模型的計(jì)算),形成高質(zhì)量的產(chǎn)品譜系,并按照產(chǎn)品規(guī)范要求包裝數(shù)據(jù),使得數(shù)據(jù)達(dá)到可發(fā)現(xiàn)、可訪問(wèn)、可理解、可重用(即FAIR)的產(chǎn)品級(jí)標(biāo)準(zhǔn)。以原始或基礎(chǔ)層級(jí)的數(shù)據(jù)產(chǎn)品為基礎(chǔ),逐步凝聚越來(lái)越多的數(shù)據(jù)開(kāi)發(fā)人員或科學(xué)家著力開(kāi)發(fā)更高層級(jí)的、融合專業(yè)理論或知識(shí)的數(shù)據(jù)產(chǎn)品,并持續(xù)加入到EcoLTO產(chǎn)品庫(kù)中。圍繞EcoLTO數(shù)據(jù),將形成數(shù)量不斷增長(zhǎng)、價(jià)值不斷提升的數(shù)據(jù)產(chǎn)品群,從而將EcoLTO數(shù)據(jù)資產(chǎn)價(jià)值最大化,實(shí)現(xiàn)從結(jié)構(gòu)固定不變的數(shù)據(jù)庫(kù)到內(nèi)容豐富、靈活多樣、動(dòng)態(tài)擴(kuò)展的產(chǎn)品庫(kù)的轉(zhuǎn)變。
面向出版與共享服務(wù)的EcoLTO數(shù)據(jù)產(chǎn)品均有全球唯一標(biāo)識(shí)(如DOI等),可支撐形成數(shù)據(jù)互聯(lián),且有助于數(shù)據(jù)生產(chǎn)者、使用者規(guī)范各自的行為,體現(xiàn)對(duì)知識(shí)產(chǎn)權(quán)的尊重,支撐安全有序的數(shù)據(jù)共享秩序的建立,為形成更好的共享環(huán)境和文化提供技術(shù)支撐手段。
通過(guò)進(jìn)一步研究整合生態(tài)學(xué)領(lǐng)域的專業(yè)知識(shí)體系,利用數(shù)據(jù)標(biāo)簽、知識(shí)圖譜等技術(shù)進(jìn)行基于內(nèi)容的產(chǎn)品庫(kù)管理,可提供數(shù)據(jù)關(guān)聯(lián)發(fā)現(xiàn)等智慧服務(wù),實(shí)現(xiàn)數(shù)據(jù)服務(wù)向知識(shí)服務(wù)的提升,為宏系統(tǒng)生態(tài)學(xué)發(fā)展提供數(shù)據(jù)支撐。
在GB/T 25528—2010地理信息數(shù)據(jù)產(chǎn)品規(guī)范中,給出了數(shù)據(jù)產(chǎn)品的定義為“與數(shù)據(jù)產(chǎn)品規(guī)范一致的數(shù)據(jù)集或數(shù)據(jù)集系列,是具有規(guī)范的組織管理形式,可被他人理解和使用的數(shù)據(jù)集或數(shù)據(jù)集系列”;數(shù)據(jù)產(chǎn)品規(guī)范是“對(duì)數(shù)據(jù)集或數(shù)據(jù)集系列及其他信息的詳細(xì)描述,適用于數(shù)據(jù)集或數(shù)據(jù)集系列的生產(chǎn)、提供和其他方使用”。
在研究確定EcoLTO數(shù)據(jù)產(chǎn)品的概念時(shí),NESDC綜合考慮了EcoLTO數(shù)據(jù)獲取和加工生產(chǎn)的特點(diǎn),并參考GB/T 25528—2010地理信息數(shù)據(jù)產(chǎn)品規(guī)范,同時(shí)借鑒了NEON數(shù)據(jù)產(chǎn)品分級(jí)思想、生態(tài)科學(xué)元數(shù)據(jù)等相關(guān)標(biāo)準(zhǔn),最終將EcoLTO數(shù)據(jù)產(chǎn)品概念定義為:“針對(duì)生態(tài)系統(tǒng)長(zhǎng)期觀測(cè)所獲取的原始數(shù)據(jù),開(kāi)展規(guī)范化加工處理,以及規(guī)范化質(zhì)量控制過(guò)程后而衍生的不同級(jí)別的實(shí)體數(shù)據(jù),且包含與數(shù)據(jù)產(chǎn)品規(guī)范相一致的詳細(xì)描述信息的數(shù)據(jù)集或數(shù)據(jù)集系列。
數(shù)據(jù)產(chǎn)品具有以下特征:一是數(shù)據(jù)產(chǎn)品有明確的分類分級(jí)體系,產(chǎn)品的知識(shí)產(chǎn)權(quán)明晰、生產(chǎn)主體責(zé)任方明確,可形成層級(jí)清晰、生產(chǎn)主體明確的產(chǎn)品譜系;二是針對(duì)產(chǎn)品譜系的產(chǎn)品,具有明確的數(shù)據(jù)處理、質(zhì)量控制方法規(guī)程,保證嚴(yán)格的數(shù)據(jù)質(zhì)量控制、高質(zhì)量的數(shù)據(jù)生產(chǎn);三是數(shù)據(jù)產(chǎn)品必須建立規(guī)范化的詳細(xì)描述文檔,方便生產(chǎn)者、管理者、使用者共同遵守或知曉,實(shí)現(xiàn)可發(fā)現(xiàn)、可訪問(wèn)、可理解、可再利用;四是數(shù)據(jù)產(chǎn)品具有唯一標(biāo)識(shí),特別是面向最終出版與共享服務(wù)的數(shù)據(jù)產(chǎn)品均有全球唯一標(biāo)識(shí)(DOI、CSTR等)。
數(shù)據(jù)產(chǎn)品是數(shù)據(jù)服務(wù)的基礎(chǔ)。圍繞數(shù)據(jù)產(chǎn)品,可以制定不同的共享服務(wù)模式,用來(lái)規(guī)定獲取到數(shù)據(jù)產(chǎn)品的用戶,在其成果中反映提供共享數(shù)據(jù)產(chǎn)品的相關(guān)方的知識(shí)產(chǎn)權(quán)利益。如國(guó)際通用的CC 4.0規(guī)定了數(shù)據(jù)共享許可協(xié)議的模式框架,如果模式涉及商業(yè)情形,則需要進(jìn)一步規(guī)定有償共享、按比例分成等商業(yè)模式。NESDC發(fā)布共享的EcoLTO數(shù)據(jù)產(chǎn)品則使用CC BY 4.0協(xié)議(即署名許可協(xié)議),均為無(wú)償共享方式,目前不涉及有償共享。無(wú)論是最基本的署名許可協(xié)議,還是其他模式的共享許可協(xié)議,都離不開(kāi)產(chǎn)權(quán)清晰、標(biāo)識(shí)唯一的數(shù)據(jù)產(chǎn)品這一核心對(duì)象做技術(shù)支撐。
數(shù)據(jù)產(chǎn)品標(biāo)準(zhǔn)規(guī)范是基于數(shù)據(jù)產(chǎn)品進(jìn)行研制的。數(shù)據(jù)產(chǎn)品標(biāo)準(zhǔn)規(guī)范是建立高質(zhì)量、規(guī)范化、數(shù)據(jù)產(chǎn)權(quán)明晰的數(shù)據(jù)產(chǎn)品的抓手,可作為開(kāi)展產(chǎn)品整體籌劃、產(chǎn)品規(guī)范化生產(chǎn)的指導(dǎo)思想和工作基礎(chǔ)。
EcoLTO數(shù)據(jù)產(chǎn)品標(biāo)準(zhǔn)規(guī)范包括以下3個(gè)規(guī)范:一是“生態(tài)系統(tǒng)長(zhǎng)期觀測(cè)數(shù)據(jù)產(chǎn)品分類分級(jí)”(規(guī)范1)。它主要從生態(tài)系統(tǒng)過(guò)程與功能的長(zhǎng)期觀測(cè)指標(biāo)出發(fā),對(duì)數(shù)據(jù)產(chǎn)品進(jìn)行3級(jí)分類;進(jìn)一步結(jié)合長(zhǎng)期觀測(cè)指標(biāo)的全生命周期的各級(jí)數(shù)據(jù)產(chǎn)品的生產(chǎn)加工過(guò)程進(jìn)行分級(jí)。依據(jù)該規(guī)范可提出EcoLTO產(chǎn)品譜系,為制定產(chǎn)品生產(chǎn)計(jì)劃提供指導(dǎo),同時(shí)為生態(tài)長(zhǎng)期觀測(cè)數(shù)據(jù)產(chǎn)品生產(chǎn)、管理與服務(wù)中的分類分級(jí)奠定基礎(chǔ)。例如,產(chǎn)品譜系中的一大類“水環(huán)境要素觀測(cè)數(shù)據(jù)產(chǎn)品”包括水文要素觀測(cè)數(shù)據(jù)產(chǎn)品(土壤水分含量、地表徑流量、穿透降水量等)、水物理要素觀測(cè)數(shù)據(jù)產(chǎn)品(水深、水溫等)、水化學(xué)要素觀測(cè)數(shù)據(jù)產(chǎn)品(雨水水質(zhì)、靜止地表水水質(zhì)等)。二是“生態(tài)系統(tǒng)要素長(zhǎng)期觀測(cè)數(shù)據(jù)產(chǎn)品規(guī)范”(規(guī)范2)。它規(guī)定了EcoLTO產(chǎn)品的描述規(guī)范,定義了生態(tài)系統(tǒng)長(zhǎng)期觀測(cè)數(shù)據(jù)產(chǎn)品的概述信息、基本描述信息、實(shí)體數(shù)據(jù)文件結(jié)構(gòu)和內(nèi)容信息、場(chǎng)地信息、采集方法信息、數(shù)據(jù)處理與質(zhì)量控制方法信息、質(zhì)量信息、分發(fā)信息等方面的一套概念模式。它是數(shù)據(jù)產(chǎn)品生產(chǎn)者、管理者開(kāi)展規(guī)范化的數(shù)據(jù)產(chǎn)品生產(chǎn)、管理與服務(wù)以及數(shù)據(jù)使用者合理合規(guī)使用數(shù)據(jù)產(chǎn)品的共同約定,是實(shí)現(xiàn)數(shù)據(jù)產(chǎn)品的可發(fā)現(xiàn)、可訪問(wèn)、可理解、可再利用,保證數(shù)據(jù)產(chǎn)品管理規(guī)范科學(xué)、數(shù)據(jù)開(kāi)放共享安全高效高質(zhì)的指導(dǎo)性文件。三是“生態(tài)系統(tǒng)長(zhǎng)期觀測(cè)數(shù)據(jù)產(chǎn)品生產(chǎn)與質(zhì)量控制”(規(guī)范3)。它規(guī)定了生態(tài)系統(tǒng)長(zhǎng)期觀測(cè)數(shù)據(jù)處理和質(zhì)量控制的一般要求、流程、內(nèi)容和方法。針對(duì)各項(xiàng)關(guān)鍵指標(biāo),從野外站觀測(cè)數(shù)據(jù)的檢查、審核、質(zhì)量標(biāo)識(shí)到加工形成數(shù)據(jù)產(chǎn)品的一系列過(guò)程,側(cè)重于對(duì)數(shù)據(jù)本身的質(zhì)量檢查、處理和評(píng)估,不涉及野外觀測(cè)、調(diào)查和實(shí)驗(yàn)室分析過(guò)程的質(zhì)量管理和控制。同時(shí)開(kāi)展質(zhì)量評(píng)價(jià),提高數(shù)據(jù)質(zhì)量。
這3個(gè)規(guī)范之間的內(nèi)在關(guān)系如圖1所示,各個(gè)規(guī)范的詳細(xì)內(nèi)容不在本文詳述。
圖1 數(shù)據(jù)產(chǎn)品標(biāo)準(zhǔn)規(guī)范關(guān)系圖
上述產(chǎn)品標(biāo)準(zhǔn)規(guī)范已經(jīng)在“國(guó)家生態(tài)網(wǎng)絡(luò)云(EcoCloud 2.0)”系統(tǒng)的建設(shè)過(guò)程中得到應(yīng)用,EcoCloud 2.0系 統(tǒng)(http://www.nesdc.org.cn)界面如圖2所示。
圖2 生態(tài)網(wǎng)絡(luò)云平臺(tái)EcoCloud 2.0主界面
依據(jù)規(guī)范2,建立了國(guó)家生態(tài)系統(tǒng)野外科學(xué)觀測(cè)研究站(含36個(gè)CERN生態(tài)站)2008年之前的生態(tài)系統(tǒng)長(zhǎng)期觀測(cè)數(shù)據(jù)產(chǎn)品,覆蓋了農(nóng)田、森林、草地、荒漠、湖泊、海灣等生態(tài)系統(tǒng)類型,50個(gè)野外站點(diǎn)在水分、土壤、大氣、生物等學(xué)科方面的人工觀測(cè)調(diào)查數(shù)據(jù)、自動(dòng)觀測(cè)系統(tǒng)數(shù)據(jù)、采樣檢測(cè)分析數(shù)據(jù),共計(jì)305個(gè)數(shù)據(jù)產(chǎn)品。
按照規(guī)范2,建立了各數(shù)據(jù)產(chǎn)品的基本描述信息元數(shù)據(jù)庫(kù),提出了學(xué)科類目、主題類目、關(guān)鍵詞等多層級(jí)多角度分類方法,支撐了EcoCloud 2.0系統(tǒng)的推薦檢索、關(guān)聯(lián)檢索等功能的實(shí)現(xiàn),實(shí)現(xiàn)數(shù)據(jù)的可發(fā)現(xiàn)、可訪問(wèn)。
按照規(guī)范2要求編制的規(guī)范化文檔詳細(xì)描述了EcoLTO產(chǎn)品信息,使得用戶可以全面了解數(shù)據(jù)產(chǎn)品并合理合規(guī)使用數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的可理解、可重用,建立了滿足FAIR要求的EcoLTO數(shù)據(jù)存儲(chǔ)庫(kù)。
規(guī)范2要求建立產(chǎn)品確權(quán)標(biāo)識(shí)(DOI、CSTR等),并與國(guó)內(nèi)DOI、CSTR等注冊(cè)機(jī)構(gòu)進(jìn)行互聯(lián)互通,實(shí)現(xiàn)了數(shù)據(jù)產(chǎn)品注冊(cè)和解析服務(wù),支持了數(shù)據(jù)使用者在發(fā)表成果中對(duì)數(shù)據(jù)產(chǎn)品的DOI、CSTR等的規(guī)范化引用,為培育良好的共享環(huán)境奠定基礎(chǔ)。
在規(guī)范1的指導(dǎo)下,逐步建立起完整的EcoLTO產(chǎn)品譜系,2009年之后的EcoLTO數(shù)據(jù)產(chǎn)品正在開(kāi)發(fā)過(guò)程中,將逐步發(fā)布共享。
規(guī)范3制定了譜系中各產(chǎn)品的生產(chǎn)和質(zhì)量控制規(guī)范,規(guī)范了數(shù)據(jù)產(chǎn)品的詳細(xì)生產(chǎn)過(guò)程,特別是加強(qiáng)數(shù)據(jù)質(zhì)量控制、規(guī)范化數(shù)據(jù)產(chǎn)品加工的處理步驟。今后,規(guī)范3可作為建立數(shù)據(jù)產(chǎn)品加工處理和挖掘分析平臺(tái)的重要基礎(chǔ)規(guī)范,進(jìn)一步提升數(shù)據(jù)產(chǎn)品生產(chǎn)自動(dòng)化過(guò)程和生產(chǎn)效率。
通過(guò)借鑒其他相關(guān)領(lǐng)域(如地理信息、遙感衛(wèi)星)及生態(tài)領(lǐng)域(如NEON)以數(shù)據(jù)產(chǎn)品形式提供多樣化數(shù)據(jù)產(chǎn)品服務(wù)的活動(dòng),并結(jié)合多年來(lái)CERN EcoLTO數(shù)據(jù)管理與共享的實(shí)踐經(jīng)驗(yàn),筆者及NESDC團(tuán)隊(duì)人員發(fā)現(xiàn)進(jìn)一步強(qiáng)化數(shù)據(jù)到數(shù)據(jù)產(chǎn)品轉(zhuǎn)化的重要性。本文明確了EcoLTO數(shù)據(jù)產(chǎn)品化發(fā)展思想,系統(tǒng)性地提出了EcoLTO數(shù)據(jù)產(chǎn)品的基本概念及其標(biāo)準(zhǔn)規(guī)范。在充分調(diào)研國(guó)內(nèi)外相關(guān)數(shù)據(jù)產(chǎn)品標(biāo)準(zhǔn)的基礎(chǔ)上,研制了“生態(tài)系統(tǒng)長(zhǎng)期觀測(cè)數(shù)據(jù)產(chǎn)品分類分級(jí)”“生態(tài)系統(tǒng)長(zhǎng)期觀測(cè)數(shù)據(jù)產(chǎn)品規(guī)范”“生態(tài)系統(tǒng)長(zhǎng)期觀測(cè)數(shù)據(jù)產(chǎn)品生產(chǎn)與質(zhì)量控制”等3項(xiàng)標(biāo)準(zhǔn)規(guī)范,為加強(qiáng)數(shù)據(jù)產(chǎn)品開(kāi)發(fā),實(shí)現(xiàn)數(shù)據(jù)庫(kù)服務(wù)向數(shù)據(jù)產(chǎn)品服務(wù)的轉(zhuǎn)變奠定基礎(chǔ)。研制的標(biāo)準(zhǔn)規(guī)范在國(guó)家生態(tài)網(wǎng)絡(luò)云EcoCloud 2.0系統(tǒng)建設(shè)過(guò)程中順利應(yīng)用,驗(yàn)證了其適用性和有效性。標(biāo)準(zhǔn)規(guī)范已經(jīng)向中國(guó)信息協(xié)會(huì)科學(xué)數(shù)據(jù)專業(yè)委員會(huì)提出立項(xiàng)申請(qǐng)。3項(xiàng)標(biāo)準(zhǔn)規(guī)范是實(shí)現(xiàn)EcoLTO數(shù)據(jù)管理從“統(tǒng)一監(jiān)測(cè)管理”“統(tǒng)一數(shù)據(jù)管理”到“統(tǒng)一數(shù)據(jù)產(chǎn)品管理”跨越提升的重要基礎(chǔ)性工作。
生態(tài)文明建設(shè)是重大國(guó)家需求,而生態(tài)環(huán)境監(jiān)測(cè)是生態(tài)文明建設(shè)的重要支撐,國(guó)家已發(fā)布了《生態(tài)環(huán)境監(jiān)測(cè)規(guī)劃綱要(2020—2035)》,生態(tài)環(huán)境部、國(guó)家氣象局、國(guó)土資源管理部、國(guó)家林業(yè)和草原局、農(nóng)業(yè)農(nóng)村部等均在推進(jìn)生態(tài)環(huán)境監(jiān)測(cè)體系與監(jiān)測(cè)能力建設(shè)工作。本文的標(biāo)準(zhǔn)規(guī)范可為我國(guó)相關(guān)行業(yè)、機(jī)構(gòu)開(kāi)展長(zhǎng)期觀測(cè)數(shù)據(jù)產(chǎn)品體系建設(shè)和數(shù)據(jù)產(chǎn)品開(kāi)發(fā)提供依據(jù)和參考,為全面提升長(zhǎng)期觀測(cè)數(shù)據(jù)的管控與應(yīng)用能力、發(fā)揮數(shù)據(jù)資產(chǎn)價(jià)值、促進(jìn)生態(tài)觀測(cè)數(shù)據(jù)管理與共享創(chuàng)新發(fā)展提供有益借鑒。