孫葉華 劉桂鋒,2 陳帥印
(1. 江蘇大學(xué)科技信息研究所,鎮(zhèn)江 212013;2. 江蘇大學(xué)圖書館,鎮(zhèn)江 212013)
科學(xué)數(shù)據(jù)是指人類社會科技活動所產(chǎn)生的基本數(shù)據(jù),以及按照不同需求而系統(tǒng)加工的數(shù)據(jù)產(chǎn)品和相關(guān)信息[1],其價值的實現(xiàn)主要體現(xiàn)在對科學(xué)數(shù)據(jù)資源的深度挖掘和廣泛應(yīng)用上。隨著科研活動的多樣性以及科學(xué)數(shù)據(jù)的重要性發(fā)展,科技創(chuàng)新越來越依賴數(shù)據(jù),科學(xué)數(shù)據(jù)的開放、共享也逐漸成為國內(nèi)外相關(guān)學(xué)者及機(jī)構(gòu)的研究重點。例如,Science Europe在面對海量的科學(xué)數(shù)據(jù)時,選擇將FAIR原則作為管理和共享科研數(shù)據(jù)的基礎(chǔ)[2]。
我國自2001年底正式啟動“科學(xué)數(shù)據(jù)共享工程”以來,為了充分發(fā)揮我國科技數(shù)據(jù)資源的作用,在資源環(huán)境、農(nóng)業(yè)、人口與健康等領(lǐng)域的24個部門開展科學(xué)數(shù)據(jù)共享工作,啟動9個科學(xué)數(shù)據(jù)共享試點[3]。2011年,23個科技平臺被認(rèn)定為國家首批科技基礎(chǔ)條件平臺,進(jìn)一步推動我國科技資源的整合共享與高效利用。2014年,正式發(fā)布《科技平臺標(biāo)準(zhǔn)化工作指南》《科技平臺元數(shù)據(jù)標(biāo)準(zhǔn)化基本原則與方法》《科技平臺元數(shù)據(jù)注冊與管理》《科技平臺資源核心元數(shù)據(jù)》,從元數(shù)據(jù)等方面對科技平臺的數(shù)據(jù)進(jìn)行統(tǒng)一的管理,使得科學(xué)數(shù)據(jù)在開放共享以及應(yīng)用的過程中更加規(guī)范化、標(biāo)準(zhǔn)化。2015年,“十三五規(guī)劃”中首次提出“實施國家大數(shù)據(jù)戰(zhàn)略,推進(jìn)數(shù)據(jù)資源開放共享”[4]。2018年,科技部、財政部正式發(fā)布《國家科技資源共享服務(wù)平臺管理辦法》,強(qiáng)調(diào)利用科學(xué)數(shù)據(jù)等科技資源在國家層面設(shè)立專業(yè)化、綜合性公共服務(wù)平臺的必要性。同年,國務(wù)院辦公廳頒布的《科學(xué)數(shù)據(jù)管理辦法》確立了科學(xué)數(shù)據(jù)“開放為常態(tài)、不開放為例外”的共享原則,明確了要加強(qiáng)對科學(xué)數(shù)據(jù)的開放共享和管理使用[5]。
科學(xué)數(shù)據(jù)共享通過提供可靠且可信賴的數(shù)據(jù)來顯著改善科研過程,已成為數(shù)據(jù)驅(qū)動科學(xué)的基本服務(wù)[6]。目前,我國科學(xué)數(shù)據(jù)共享平臺存在以分散、凌亂、孤立為特點的“數(shù)據(jù)孤島”現(xiàn)實問題。其中,國家科學(xué)數(shù)據(jù)中心是由國家按照統(tǒng)一標(biāo)準(zhǔn)和規(guī)劃設(shè)立的大型數(shù)據(jù)管理設(shè)施,承擔(dān)著我國科學(xué)數(shù)據(jù)管理共享、應(yīng)用和支撐關(guān)聯(lián)學(xué)科發(fā)展的重任,具有領(lǐng)域代表性、行業(yè)領(lǐng)導(dǎo)性、技術(shù)先進(jìn)性和數(shù)據(jù)公開性,能夠體現(xiàn)出我國科學(xué)數(shù)據(jù)共享平臺的較高水平,因此選擇國家科學(xué)數(shù)據(jù)中心進(jìn)行關(guān)聯(lián)研究,以期促進(jìn)科學(xué)數(shù)據(jù)的開放與共享。
國內(nèi)外不同學(xué)者主要從科研領(lǐng)域的元數(shù)據(jù)標(biāo)準(zhǔn)、元數(shù)據(jù)體系、元數(shù)據(jù)應(yīng)用、元數(shù)據(jù)關(guān)聯(lián)及互操作等方面開展科學(xué)數(shù)據(jù)元數(shù)據(jù)的相關(guān)研究。Qin等[7]探討科學(xué)數(shù)據(jù)元數(shù)據(jù)的功能和架構(gòu)需求,以支持?jǐn)?shù)據(jù)管理、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)發(fā)現(xiàn)和數(shù)據(jù)使用;劉峰等[8]分析了當(dāng)前科研領(lǐng)域6種典型的元數(shù)據(jù)標(biāo)準(zhǔn),在統(tǒng)計的基礎(chǔ)上設(shè)計并構(gòu)建科學(xué)數(shù)據(jù)通用元數(shù)據(jù)規(guī)范;司莉等[9]以美國開放政府?dāng)?shù)據(jù)網(wǎng)站Data.gov中的元數(shù)據(jù)標(biāo)準(zhǔn)為例,分析其元數(shù)據(jù)的體系及具體標(biāo)準(zhǔn),歸納總結(jié)美國開放政府?dāng)?shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)的體系結(jié)構(gòu);Si等[10]調(diào)查研究在USA News排位世界前100名的大學(xué)圖書館科學(xué)數(shù)據(jù)服務(wù)內(nèi)容,發(fā)現(xiàn)28.7%的高校圖書館提供了科學(xué)數(shù)據(jù)的元數(shù)據(jù)相關(guān)服務(wù),包括元數(shù)據(jù)的簡介以及創(chuàng)建等;黃文碧[11]詳細(xì)闡述元數(shù)據(jù)關(guān)聯(lián)在館藏資源聚合研究中的重要性,從元數(shù)據(jù)倉庫構(gòu)建、元數(shù)據(jù)映射和元數(shù)據(jù)關(guān)聯(lián)等方面進(jìn)行分析與應(yīng)用;賈歡[12]選取地球科學(xué)相關(guān)領(lǐng)域的科學(xué)數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn),研究元數(shù)據(jù)之間的互操作方法,通過本體實現(xiàn)科學(xué)數(shù)據(jù)元數(shù)據(jù)之間的語義互操作。
科學(xué)數(shù)據(jù)的關(guān)聯(lián)與融合是科學(xué)數(shù)據(jù)在科研全過程中達(dá)到互操作、互利用的必要過程。目前科學(xué)數(shù)據(jù)關(guān)聯(lián)與融合相關(guān)研究主要圍繞關(guān)聯(lián)數(shù)據(jù)、文獻(xiàn)數(shù)據(jù)與科學(xué)數(shù)據(jù)的融合等方向進(jìn)行。Kauppinen[13]在2011年發(fā)起建立linked-science.org,提出關(guān)聯(lián)科學(xué)(Linked Science),將科學(xué)數(shù)據(jù)進(jìn)行關(guān)聯(lián),實現(xiàn)數(shù)據(jù)的透明化;游毅等[14]構(gòu)建基于關(guān)聯(lián)數(shù)據(jù)的科研數(shù)據(jù)資源共享模式,包括科研關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建發(fā)布和科研共享數(shù)據(jù)網(wǎng)絡(luò)的構(gòu)建;莊倩等[15]在關(guān)聯(lián)數(shù)據(jù)概念模型的基礎(chǔ)上,提出了科學(xué)數(shù)據(jù)組織模式,該模式利用RDF描述特征,通過本體映射和互操作來實現(xiàn)語義互聯(lián)關(guān)系的搭建,從而進(jìn)一步確立了科學(xué)數(shù)據(jù)關(guān)聯(lián)融合的新方向;陸穎等[16]從圖書館服務(wù)研究的角度,基于多個層面對文獻(xiàn)數(shù)據(jù)與科學(xué)數(shù)據(jù)融合進(jìn)行調(diào)研,針對各文獻(xiàn)數(shù)據(jù)與科學(xué)數(shù)據(jù)融合服務(wù)中的用戶與學(xué)科服務(wù)之間關(guān)系,提出了合作、支撐、服務(wù)以及共享互動的關(guān)系網(wǎng)絡(luò);張曉霞[17]對科學(xué)文獻(xiàn)中生物本體間的情感關(guān)系表達(dá)、潛在關(guān)系抽取以及異源異構(gòu)數(shù)據(jù)融合三方面進(jìn)行研究,使異源異構(gòu)數(shù)據(jù)能實現(xiàn)集成信息服務(wù),達(dá)到跨異構(gòu)庫知識發(fā)現(xiàn)的研究目的。
科學(xué)數(shù)據(jù)的關(guān)聯(lián)融合研究推動了科學(xué)數(shù)據(jù)的開放、共享進(jìn)展,而科學(xué)數(shù)據(jù)共享中心的出現(xiàn)是科學(xué)數(shù)據(jù)相關(guān)研究不斷推進(jìn)的結(jié)果。許多國家都頒布了多項科學(xué)數(shù)據(jù)共享政策法規(guī),用以促進(jìn)與規(guī)范科學(xué)數(shù)據(jù)的共享[18]。目前有許多學(xué)者對科學(xué)數(shù)據(jù)共享平臺進(jìn)行調(diào)研,其研究內(nèi)容側(cè)重于科學(xué)數(shù)據(jù)共享平臺建設(shè)、科學(xué)數(shù)據(jù)組織、科學(xué)數(shù)據(jù)管理與共享等方面。Plantin等[19]講述數(shù)據(jù)存儲、共享和管理平臺案例研究,科學(xué)數(shù)據(jù)共享平臺正在逐步取代和重新配置傳統(tǒng)學(xué)術(shù)交流的基礎(chǔ)規(guī)范與技術(shù);黃銘瑞等[20]梳理美、英及中國的國家科學(xué)數(shù)據(jù)中心的建設(shè)布局,歸納并提出其管理模式與評價方式,通過對比分析提出我國科學(xué)數(shù)據(jù)中心的發(fā)展演化模式;盧逸航等[21]調(diào)研各種科學(xué)數(shù)據(jù)互操作模式與技術(shù)適用條件,結(jié)合我國科學(xué)數(shù)據(jù)中心的特點,提出7種科學(xué)數(shù)據(jù)中心間互操作的模式。Curtis等[22]研究制定一個系統(tǒng)框架,評估科學(xué)數(shù)據(jù)共享平臺的社會影響;司莉等[23]調(diào)查6個國家科學(xué)數(shù)據(jù)中心,了解各平臺數(shù)據(jù)的學(xué)科分布與數(shù)據(jù)量,從數(shù)據(jù)組織方式、數(shù)據(jù)描述、數(shù)據(jù)檢索3個方面分析平臺數(shù)據(jù)組織現(xiàn)狀,發(fā)現(xiàn)其中不足,從而提出平臺優(yōu)化建議;劉小宇等[24]以國家科技基礎(chǔ)條件平臺為例,分析科學(xué)數(shù)據(jù)共享平臺的被引用狀況,發(fā)現(xiàn)在平臺建設(shè)和科學(xué)數(shù)據(jù)引用方面存在的問題,以期能規(guī)范化建設(shè)平臺和標(biāo)準(zhǔn)化引用科學(xué)數(shù)據(jù);Thomas等[25]詳細(xì)介紹用戶如何使用SPARK平臺共享數(shù)據(jù),以及如何利用平臺數(shù)據(jù)來建立假設(shè);李曉萍[26]以農(nóng)業(yè)科學(xué)數(shù)據(jù)共享平臺為例,對農(nóng)業(yè)科學(xué)數(shù)據(jù)共享平臺現(xiàn)狀進(jìn)行闡述,并結(jié)合多種研究方法對影響用戶持續(xù)使用農(nóng)業(yè)科學(xué)數(shù)據(jù)共享平臺的主要因素進(jìn)行了研究,從而基于用戶的使用影響因素提出完善農(nóng)業(yè)科學(xué)數(shù)據(jù)共享平臺的建議。
目前,科學(xué)數(shù)據(jù)元數(shù)據(jù)、科學(xué)數(shù)據(jù)的管理與關(guān)聯(lián)融合、科學(xué)數(shù)據(jù)共享平臺的理論研究較為豐富,但是實踐應(yīng)用方面還較為薄弱。由于我國國家層面的科學(xué)數(shù)據(jù)共享平臺標(biāo)準(zhǔn)頒布較晚,而在此之前各數(shù)據(jù)平臺已經(jīng)結(jié)合自身數(shù)據(jù)特征制定了一系列標(biāo)準(zhǔn),導(dǎo)致缺乏數(shù)據(jù)標(biāo)準(zhǔn)的通用性,因此出現(xiàn)大量的獨立“數(shù)據(jù)煙囪”的狀況。與此同時,不同領(lǐng)域的科學(xué)數(shù)據(jù)共享平臺之間缺乏協(xié)調(diào),難以實現(xiàn)不同科學(xué)數(shù)據(jù)之間的互操作,如各平臺采用各自的學(xué)科元數(shù)據(jù)標(biāo)準(zhǔn)、平臺間元數(shù)據(jù)字段不盡相同、通用的核心字段較少等。這不僅會影響數(shù)據(jù)質(zhì)量,也會給不同平臺之間數(shù)據(jù)的流通與整合造成不便。
因此,本文將關(guān)聯(lián)數(shù)據(jù)技術(shù)的思想引入科學(xué)數(shù)據(jù)研究中,基于黃河流域生態(tài)保護(hù)和高質(zhì)量發(fā)展跨平臺專題數(shù)據(jù),設(shè)計關(guān)聯(lián)元數(shù)據(jù),對國家科學(xué)數(shù)據(jù)中心的科學(xué)數(shù)據(jù)集元數(shù)據(jù)進(jìn)行關(guān)聯(lián)研究,從而構(gòu)建國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)模型,探究不同領(lǐng)域科學(xué)數(shù)據(jù)的互操作性、互相關(guān)性,有助于促進(jìn)科學(xué)數(shù)據(jù)之間的協(xié)調(diào)性、增進(jìn)數(shù)據(jù)流通的通用性,從而達(dá)到科學(xué)數(shù)據(jù)在科研過程中的應(yīng)用性、在科研成果中的可轉(zhuǎn)化性以及在不同科學(xué)數(shù)據(jù)中心之間的可流通性。
本研究的數(shù)據(jù)來源于國家科技基礎(chǔ)條件平臺上的國家科學(xué)數(shù)據(jù)中心。前期采用網(wǎng)絡(luò)調(diào)研法,對20個國家科學(xué)數(shù)據(jù)中心的平臺建設(shè)、數(shù)據(jù)資源、數(shù)據(jù)服務(wù)等基本情況進(jìn)行調(diào)查。調(diào)查發(fā)現(xiàn),物理、生態(tài)、農(nóng)業(yè)、林業(yè)、氣象等多個領(lǐng)域建設(shè)了國家科學(xué)數(shù)據(jù)中心,覆蓋范圍廣泛,數(shù)據(jù)資源豐富,數(shù)據(jù)量龐大,中心還提供數(shù)據(jù)檢索、數(shù)據(jù)專題、數(shù)據(jù)匯交、數(shù)據(jù)共享等多種數(shù)據(jù)服務(wù)。但這些數(shù)據(jù)中心成立時間不一,發(fā)展成熟度也有區(qū)別,同時存在數(shù)據(jù)分散、數(shù)據(jù)標(biāo)準(zhǔn)格式不一致、數(shù)據(jù)通用性差、數(shù)據(jù)利用率較低等問題。
在研究各個國家科學(xué)數(shù)據(jù)中心科學(xué)數(shù)據(jù)時,發(fā)現(xiàn)國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心、國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心、國家林業(yè)和草原科學(xué)數(shù)據(jù)中心、國家氣象科學(xué)數(shù)據(jù)中心合作共建了黃河流域生態(tài)保護(hù)和高質(zhì)量發(fā)展跨平臺專題(以下簡稱“黃河流域?qū)n}”),其元數(shù)據(jù)通用性強(qiáng),可擴(kuò)展性好,故選擇該專題數(shù)據(jù)為突破口進(jìn)行國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)研究。
黨的十八大以來,以習(xí)近平同志為核心的黨中央,對于人類文明在不斷發(fā)展的過程中形成的規(guī)律進(jìn)行了深刻總結(jié),在我們國家的社會主義建設(shè)的總體布局中,加入生態(tài)文明建設(shè)[27]。習(xí)近平總書記多次實地考察黃河流域生態(tài)保護(hù)情況,并作出重要批示。國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心、國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心、國家林業(yè)和草原科學(xué)數(shù)據(jù)中心、國家氣象科學(xué)數(shù)據(jù)中心積極響應(yīng)并落實《中共中央關(guān)于制定國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和二〇三五年遠(yuǎn)景目標(biāo)的建議》,聯(lián)合開展黃河流域“三生”(生態(tài)-生產(chǎn)-生活)協(xié)同發(fā)展研究,建立黃河流域生態(tài)保護(hù)與高質(zhì)量發(fā)展專題庫,為促進(jìn)黃河流域生態(tài)保護(hù)與高質(zhì)量發(fā)展國家戰(zhàn)略實施、保障黃河長治久安提供全方位科技支撐具有重要意義[28]。截至2022年7月,黃河流域?qū)n}共擁有3884個科學(xué)數(shù)據(jù)集,可按主題分為林業(yè)、農(nóng)業(yè)、氣象氣候、地理、環(huán)境、生態(tài)、對地觀測、資源、地質(zhì)九大類型,主要集中在林業(yè)和地理兩大主題(數(shù)據(jù)集數(shù)量分別為1882個和1083個);從數(shù)據(jù)集所屬數(shù)據(jù)中心看,絕大部分的科學(xué)數(shù)據(jù)集由國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心、國家林業(yè)和草原科學(xué)數(shù)據(jù)中心提供,來源較為單一,且大部分的氣象氣候數(shù)據(jù)以及地理、環(huán)境、生態(tài)、對地觀測、資源、地質(zhì)6種主題科學(xué)數(shù)據(jù)均由國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心提供,究其原因,可能是由于國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心涵蓋大氣圈、水圈、巖石圈、陸地表層等18個一級學(xué)科資源,涉及領(lǐng)域廣泛。
經(jīng)調(diào)查研究發(fā)現(xiàn),國家生態(tài)科學(xué)數(shù)據(jù)中心和國家對地觀測數(shù)據(jù)中心的科學(xué)數(shù)據(jù)集里可供關(guān)聯(lián)的元數(shù)據(jù)較多,且元數(shù)據(jù)具備典型特色,可以為黃河流域?qū)n}提供良好的數(shù)據(jù)服務(wù)。因此,本研究基于黃河流域?qū)n}數(shù)據(jù),以其元數(shù)據(jù)為切入點,增加國家生態(tài)科學(xué)數(shù)據(jù)中心和國家對地觀測數(shù)據(jù)中心相關(guān)數(shù)據(jù),研究國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心、國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心、國家林業(yè)和草原科學(xué)數(shù)據(jù)中心、國家氣象科學(xué)數(shù)據(jù)中心、國家生態(tài)科學(xué)數(shù)據(jù)中心和國家對地觀測數(shù)據(jù)中心之間的關(guān)聯(lián)關(guān)系,共同構(gòu)建國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)模型,擴(kuò)大科學(xué)數(shù)據(jù)的流通與共享,豐富黃河流域?qū)n}數(shù)據(jù)的來源與類型,有助于從不同視角完善黃河流域相關(guān)科學(xué)數(shù)據(jù),有利于促進(jìn)黃河流域生態(tài)保護(hù)和高質(zhì)量發(fā)展。
構(gòu)建國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)模型,其核心在于實現(xiàn)數(shù)據(jù)中心之間的數(shù)據(jù)關(guān)聯(lián)和共享,首先基于黃河流域?qū)n}數(shù)據(jù)的元數(shù)據(jù)確定關(guān)聯(lián)元數(shù)據(jù)元素,然后利用關(guān)聯(lián)元數(shù)據(jù)元素實現(xiàn)6個國家科學(xué)數(shù)據(jù)中心科學(xué)數(shù)據(jù)的關(guān)聯(lián)。
經(jīng)調(diào)查,黃河流域?qū)n}數(shù)據(jù)元數(shù)據(jù)分別包括數(shù)據(jù)集名稱、CSTR、主題詞、數(shù)據(jù)覆蓋范圍、數(shù)據(jù)貢獻(xiàn)者、所屬國家科學(xué)數(shù)據(jù)中心、數(shù)據(jù)摘要、質(zhì)量控制信息。元數(shù)據(jù)元素,是元數(shù)據(jù)最基本的信息單元,采用一定的元數(shù)據(jù)標(biāo)準(zhǔn)來描述數(shù)據(jù)的組織結(jié)構(gòu)和內(nèi)容特征,從而實現(xiàn)對大量數(shù)據(jù)的高效管理。元數(shù)據(jù)元素設(shè)計應(yīng)遵循復(fù)用性、可擴(kuò)展性、互操作性等元數(shù)據(jù)設(shè)計的一般原則,以保證元數(shù)據(jù)的結(jié)構(gòu)合理、元素可用,保證經(jīng)描述的數(shù)據(jù)資源可共享。本研究根據(jù)這些元數(shù)據(jù)轉(zhuǎn)化設(shè)計關(guān)聯(lián)元數(shù)據(jù)元素依次為題名、資源標(biāo)識、主題、覆蓋范圍、創(chuàng)作者、資源來源、資源描述、數(shù)據(jù)質(zhì)量。以關(guān)聯(lián)元數(shù)據(jù)元素為媒介,將6個國家科學(xué)數(shù)據(jù)中心的元數(shù)據(jù)進(jìn)行關(guān)聯(lián)得到6個國家科學(xué)數(shù)據(jù)中心的元數(shù)據(jù)的關(guān)聯(lián)關(guān)系(見表1)。其中,題名、資源標(biāo)識、主題、覆蓋范圍、創(chuàng)作者、資源來源、資源描述復(fù)用的是DC元數(shù)據(jù)標(biāo)準(zhǔn),其元數(shù)據(jù)簡單、通用、可擴(kuò)展性強(qiáng);數(shù)據(jù)質(zhì)量是參考《林業(yè)科學(xué)數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)》中的數(shù)據(jù)質(zhì)量信息與《氣象數(shù)據(jù)集核心元數(shù)據(jù)》的數(shù)據(jù)質(zhì)量描述后自定義的元數(shù)據(jù)。
表1 6個國家科學(xué)數(shù)據(jù)中心的元數(shù)據(jù)關(guān)聯(lián)關(guān)系
同時,將這6個國家科學(xué)數(shù)據(jù)中心涵蓋的元數(shù)據(jù)元素以此劃分為通用元數(shù)據(jù)元素和專門元數(shù)據(jù)元素(見表2)。
表2 6個國家科學(xué)數(shù)據(jù)中心的元數(shù)據(jù)元素
根據(jù)設(shè)計的元數(shù)據(jù)元素,首先確定核心類為黃河流域科學(xué)數(shù)據(jù)集與國家科學(xué)數(shù)據(jù)中心,其元數(shù)據(jù)為子類,同時增加流域范圍和主題類型為核心類,豐富關(guān)聯(lián)模型,其分類類型為自己的子類;其次,以元數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系確定類與類、類與子類、子類與子類之間的對象屬性,關(guān)聯(lián)元數(shù)據(jù)中的覆蓋范圍子類與流域范圍類關(guān)聯(lián),資源來源子類與國家科學(xué)數(shù)據(jù)中心類關(guān)聯(lián),9種主題科學(xué)數(shù)據(jù)與其所屬的國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián);最后,利用Protégé本體編輯工具對其進(jìn)行關(guān)聯(lián)模型的可視化呈現(xiàn)。
圖1是基于黃河流域?qū)n}數(shù)據(jù)構(gòu)建的6個國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)模型。其中,虛線框內(nèi)是原先實際聯(lián)合建設(shè)黃河流域?qū)n}的4家平臺,即國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心、國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心、國家林業(yè)和草原科學(xué)數(shù)據(jù)中心、國家氣象科學(xué)數(shù)據(jù)中心。流域范圍數(shù)據(jù)集包括黃河全流域、黃河上游、黃河中上游、黃河中游、黃河中下游的數(shù)據(jù)以及分省數(shù)據(jù)。主題類型中農(nóng)業(yè)科學(xué)數(shù)據(jù)關(guān)聯(lián)至國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心,林業(yè)科學(xué)數(shù)據(jù)關(guān)聯(lián)至國家林業(yè)和草原科學(xué)數(shù)據(jù)中心,氣象氣候數(shù)據(jù)關(guān)聯(lián)國家氣象科學(xué)數(shù)據(jù)中心和國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心,對地觀測數(shù)據(jù)關(guān)聯(lián)至國家對地觀測科學(xué)數(shù)據(jù)中心,生態(tài)科學(xué)數(shù)據(jù)關(guān)聯(lián)至國家生態(tài)科學(xué)數(shù)據(jù)中心,其余地理、地質(zhì)、資源、環(huán)境等科學(xué)數(shù)據(jù)關(guān)聯(lián)至國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心。
圖1 6個國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)模型
原先國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心對黃河流域?qū)n}的數(shù)據(jù)支撐壓力較大,各國家科學(xué)數(shù)據(jù)中心的專門元數(shù)據(jù)也較少。在增加2個國家科學(xué)數(shù)據(jù)中心后構(gòu)建的關(guān)聯(lián)模型中,黃河流域?qū)n}的數(shù)據(jù)來源與涉及的學(xué)科領(lǐng)域更加豐富,能夠調(diào)動更多數(shù)據(jù)資源,擴(kuò)充了時間和空間分辨率、儀器名稱、數(shù)據(jù)投影信息等特色鮮明的專門元數(shù)據(jù),可以有效減輕國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心的數(shù)據(jù)壓力。此外,國家對地觀測科學(xué)數(shù)據(jù)中心匯集大量遙感衛(wèi)星數(shù)據(jù),支持遙感數(shù)據(jù)治理和服務(wù);國家生態(tài)科學(xué)數(shù)據(jù)中心擁有實時同化預(yù)測系統(tǒng)、國家生態(tài)系統(tǒng)評估綜合集成平臺、中國陸地生態(tài)系統(tǒng)碳源匯模擬平臺等一系列生態(tài)系統(tǒng)科學(xué)數(shù)據(jù)公共服務(wù)與分析平臺,以及獨有的全國野外站監(jiān)測數(shù)字系統(tǒng),能夠展現(xiàn)更多實時數(shù)據(jù),有助于從不同視角完善黃河流域相關(guān)科學(xué)數(shù)據(jù)資源,更好地實現(xiàn)跨平臺、跨學(xué)科的數(shù)據(jù)流通,提供更多數(shù)據(jù)應(yīng)用與分析服務(wù)。
黃河流域生態(tài)保護(hù)與治理作為推進(jìn)我國生態(tài)文明建設(shè)的重要方面,事關(guān)沿黃人民的切身利益和我國經(jīng)濟(jì)社會發(fā)展全局?;谠獢?shù)據(jù)的國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)模型,充分匯聚整合多源數(shù)據(jù)資源,可實際應(yīng)用于黃河流域的生態(tài)保護(hù)與修復(fù),通過完善自然資源監(jiān)測數(shù)據(jù)、提升流域內(nèi)災(zāi)害防控與應(yīng)急能力、助力生態(tài)修復(fù)工程實施、建立一體化生態(tài)環(huán)境智能監(jiān)測系統(tǒng)4個方面,為其生態(tài)治理與修復(fù)提供數(shù)據(jù)支持,從治理與防控兩個角度綜合解決黃河流域的生態(tài)問題,提高黃河流域治理的科學(xué)性和有效性。
黃河是我國的第二長河,流經(jīng)青海、四川、甘肅、寧夏、內(nèi)蒙古、山西、陜西、河南、山東9個?。ㄗ灾螀^(qū)),覆蓋面積廣闊,流域內(nèi)資源豐富,若要進(jìn)行流域生態(tài)保護(hù)和治理先要了解流域范圍內(nèi)自然資源的分布情況。利用國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心的資源科學(xué)數(shù)據(jù)(如水資源、農(nóng)業(yè)資源、生物資源、基礎(chǔ)地理數(shù)據(jù)、地形地貌數(shù)據(jù)等),國家林業(yè)和草原科學(xué)數(shù)據(jù)中心的濕地分布、土地資源、植被資源等數(shù)據(jù)集,疊加國家對地觀測科學(xué)數(shù)據(jù)中心的全球生態(tài)環(huán)境遙感監(jiān)測系統(tǒng)實時數(shù)據(jù),進(jìn)一步明確黃河流域灘區(qū)邊界,摸清流域內(nèi)林草、濕地、荒漠等自然資源空間分布情況,完善黃河流域自然資源三維立體“一張圖”,精準(zhǔn)確定林草等自然資源保護(hù)和監(jiān)測范圍邊界(見圖2)。
圖2 自然資源監(jiān)測數(shù)據(jù)關(guān)聯(lián)可視化
以基礎(chǔ)地理數(shù)據(jù)為例,完善該類數(shù)據(jù)可關(guān)聯(lián)至國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心,如黃河下游河道1∶10萬基礎(chǔ)地理數(shù)據(jù)集,該數(shù)據(jù)集包含黃河下游區(qū)域的基礎(chǔ)地理要素,包括鐵路、公路和大車路等道路要素,河流、渠道、大堤、生產(chǎn)堤、工程險工、大斷面等線狀地物,水域和居民地等面狀要素,省界與縣市界,閘門、虹吸、提灌站、公里樁等水利建筑設(shè)施。國家對地觀測科學(xué)數(shù)據(jù)中心也提供基礎(chǔ)地理數(shù)據(jù),如2020年黃河流域矢量范圍數(shù)據(jù),通過流域邊界的提取,可以劃定土壤侵蝕及非點源污染的遷移范圍,可用于黃河流域土壤風(fēng)蝕時空動態(tài)評價、生態(tài)環(huán)境質(zhì)量評價等方面研究。此外,可針對林草、水文等重要資源持續(xù)開展專題監(jiān)測,形成季度監(jiān)測成果,及時掌握自然資源動態(tài)變化情況,完善黃河流域自然資源綜合監(jiān)測體系,為黃河流域的資源空間規(guī)劃、生態(tài)治理和修復(fù)等工程提供基礎(chǔ)數(shù)據(jù)支持。
黃河流域生態(tài)環(huán)境脆弱,災(zāi)害頻發(fā)。做好黃河流域內(nèi)洪水、森林火災(zāi)等災(zāi)害的防控應(yīng)急措施工作,可以有效遏制流域生態(tài)的急劇惡化。充分調(diào)動國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心的自然災(zāi)害數(shù)據(jù)、大氣質(zhì)量數(shù)據(jù)、山洪風(fēng)險專題等數(shù)據(jù),同時可依據(jù)災(zāi)害主題關(guān)聯(lián)專題相關(guān)數(shù)據(jù)集,如國家林業(yè)和草原科學(xué)數(shù)據(jù)中心擁有各地森林火災(zāi)數(shù)據(jù)庫、國家對地觀測科學(xué)數(shù)據(jù)中心提供夏季中國洪澇災(zāi)害數(shù)據(jù)專題服務(wù)等。同時諸多數(shù)據(jù)中心提供“防災(zāi)減災(zāi)”數(shù)據(jù)服務(wù),如國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心的抗旱減災(zāi)保產(chǎn)實驗數(shù)據(jù)、新品種抗旱試驗數(shù)據(jù)庫等,可為抗旱減災(zāi)工作提供數(shù)據(jù)支持。國家氣象科學(xué)數(shù)據(jù)中心提供一系列氣象專題,如暴雨、干旱、臺風(fēng)等氣象災(zāi)害專題數(shù)據(jù),可以了解黃河流域歷年來多發(fā)的災(zāi)害類型、時間、地點、原因及影響等,以此為依據(jù)有針對性地制定災(zāi)害防控與應(yīng)急措施。國家氣象科學(xué)數(shù)據(jù)中心擁有的氣象預(yù)警專題,基于WebGIS,發(fā)布大風(fēng)、雷電、寒潮、干早、冰雹等近20種自然災(zāi)害,同時,預(yù)警展示中結(jié)合了實況預(yù)報數(shù)據(jù),對預(yù)警相關(guān)氣象要素的動態(tài)進(jìn)行綜合展示,便于有關(guān)部門提前布置災(zāi)害防控措施,有效降低災(zāi)害產(chǎn)生的惡劣影響,減少損失。國家對地觀測科學(xué)數(shù)據(jù)中心具有全生命周期的遙感數(shù)據(jù)治理和服務(wù)技術(shù)體系,可充分利用其建設(shè)的對地觀測科學(xué)數(shù)據(jù)共享資源庫中環(huán)境減災(zāi)遙感衛(wèi)星資源,提升災(zāi)害風(fēng)險預(yù)警能力,加強(qiáng)災(zāi)害風(fēng)險評估和隱患排查治理,提高災(zāi)害應(yīng)急能力。
以預(yù)防洪澇災(zāi)害為例,國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心設(shè)立了山洪風(fēng)險專題、中國2020年夏季洪澇救災(zāi)專題,國家對地觀測科學(xué)數(shù)據(jù)中心收集了2000—2020年黃河流域1千米降水?dāng)?shù)據(jù)、2021年河南特大暴雨災(zāi)害數(shù)據(jù),同時提供2022年夏季中國洪澇災(zāi)害數(shù)據(jù)專題服務(wù),國家氣象科學(xué)數(shù)據(jù)中心集齊暴雨災(zāi)害專題數(shù)據(jù)、中國近百年降水專題數(shù)據(jù)集,可以此分析降水年際變化,確定洪澇多發(fā)地區(qū)與時間,再結(jié)合其中心可視化平臺的降水實況資料和氣象衛(wèi)星遙感數(shù)據(jù),精準(zhǔn)開展高風(fēng)險、高影響地區(qū)的綜合監(jiān)測和災(zāi)害預(yù)警,提升洪澇災(zāi)害預(yù)警的準(zhǔn)確性以及時效性。
隨著國家生態(tài)文明建設(shè)的發(fā)展,一系列重大生態(tài)保護(hù)修復(fù)工程陸續(xù)實施。科學(xué)實施生態(tài)修復(fù),有助于提高我國生態(tài)系統(tǒng)的質(zhì)量與穩(wěn)定性,筑牢國家生態(tài)安全。可結(jié)合國家生態(tài)科學(xué)數(shù)據(jù)中心建設(shè)的國家生態(tài)系統(tǒng)評估綜合集成平臺、生態(tài)水文數(shù)據(jù)、生態(tài)系統(tǒng)功能數(shù)據(jù)等,國家對地觀測科學(xué)數(shù)據(jù)中心的土壤風(fēng)蝕、水土流失、土地利用等數(shù)據(jù),國家林業(yè)和草原科學(xué)數(shù)據(jù)中心的植被數(shù)據(jù)和退耕還林工程數(shù)據(jù),排查重要水系阻隔、水土流失、濕地退化等問題,梳理當(dāng)前黃河流域生態(tài)治理的現(xiàn)狀。還可利用國家生態(tài)科學(xué)數(shù)據(jù)中心的全國野外站監(jiān)測數(shù)字大屏展示系統(tǒng)來實時瀏覽各生態(tài)站監(jiān)測活動、獲取監(jiān)測指標(biāo)數(shù)據(jù),及時發(fā)現(xiàn)污染水質(zhì)、破壞岸線、侵占河道等行為。又能借鑒國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心的環(huán)境退化及保護(hù)數(shù)據(jù)、環(huán)境污染及治理數(shù)據(jù)、黃河口濕地微地形修復(fù)實驗數(shù)據(jù)等對生態(tài)修復(fù)有啟示作用的數(shù)據(jù)集可分流域、分省市有針對性地制定生態(tài)保護(hù)和修復(fù)方案,并及時跟蹤后續(xù)修復(fù)進(jìn)程及效果。
生態(tài)環(huán)境保護(hù)的數(shù)字化轉(zhuǎn)型需要綜合管理數(shù)據(jù)資源,推動跨平臺、跨學(xué)科、跨領(lǐng)域協(xié)同合作,全面提升生態(tài)資源服務(wù)數(shù)字化、智能化水平,充分釋放數(shù)據(jù)要素價值。國家地球系統(tǒng)科學(xué)數(shù)據(jù)中心整合了衛(wèi)星影像、雷達(dá)影像、地物波譜等遙感數(shù)據(jù);國家氣象科學(xué)數(shù)據(jù)中心的氣象衛(wèi)星遙感數(shù)據(jù)和氣象預(yù)警專題可提供氣象實況資料;國家對地觀測科學(xué)數(shù)據(jù)中心具有全生命周期的遙感數(shù)據(jù)治理和服務(wù)技術(shù)體系、中國遙感衛(wèi)星數(shù)據(jù)統(tǒng)一檢索平臺;國家生態(tài)科學(xué)數(shù)據(jù)中心擁有全國野外站監(jiān)測數(shù)字大屏展示系統(tǒng),同時建成先進(jìn)的生態(tài)系統(tǒng)科學(xué)數(shù)據(jù)公共服務(wù)與分析平臺,如實時同化預(yù)測系統(tǒng)、國家生態(tài)系統(tǒng)評估綜合集成平臺、中國陸地生態(tài)系統(tǒng)碳源匯模擬平臺;國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心建設(shè)有國家農(nóng)業(yè)科學(xué)觀測數(shù)據(jù)可視化平臺;國家林業(yè)和草原科學(xué)數(shù)據(jù)中心提供空間數(shù)據(jù)展示服務(wù)、生態(tài)站定位觀測數(shù)據(jù)服務(wù)系統(tǒng)。國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)模型整合多源數(shù)據(jù)資源,支持構(gòu)建一體化生態(tài)環(huán)境智能監(jiān)測平臺,打造生態(tài)環(huán)境綜合管理數(shù)字平臺,致力于相關(guān)數(shù)據(jù)資源的全局規(guī)劃、智能檢索、高效共享和協(xié)同服務(wù)建設(shè),可實現(xiàn)數(shù)據(jù)監(jiān)測一體化、數(shù)據(jù)服務(wù)一站式,提供生態(tài)系統(tǒng)科學(xué)數(shù)據(jù)共享、分析應(yīng)用等服務(wù),充分發(fā)揮我國長期生態(tài)監(jiān)測數(shù)據(jù)價值。
科學(xué)數(shù)據(jù)作為國家戰(zhàn)略科技資源,在支撐創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略實施,推動經(jīng)濟(jì)體系優(yōu)化升級和促進(jìn)產(chǎn)業(yè)融合,抗擊疫情保障民生和推進(jìn)生態(tài)文明建設(shè)等方面的作用更加凸顯[29]。國家科學(xué)數(shù)據(jù)中心作為我國科學(xué)數(shù)據(jù)管理與應(yīng)用、開放與共享的重要載體,為相關(guān)學(xué)科領(lǐng)域發(fā)展、團(tuán)體研究、項目實施等提供科學(xué)數(shù)據(jù)資源與服務(wù)。
黃河流域是我國重要的生態(tài)屏障和重要的經(jīng)濟(jì)地帶,在我國經(jīng)濟(jì)社會發(fā)展和生態(tài)安全方面占據(jù)十分重要的地位。本文以黃河流域?qū)n}數(shù)據(jù)為基礎(chǔ),以元數(shù)據(jù)為切入點,探尋各國家科學(xué)數(shù)據(jù)中心間的關(guān)聯(lián)關(guān)系,通過構(gòu)建國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)模型,為黃河流域生態(tài)保護(hù)與高質(zhì)量發(fā)展提供數(shù)據(jù)支持。最后將理論研究應(yīng)用到實踐探索中,運用關(guān)聯(lián)模型從完善自然資源監(jiān)測數(shù)據(jù)、提升流域內(nèi)災(zāi)害防控與應(yīng)急能力、助力生態(tài)修復(fù)工程實施、建立一體化生態(tài)環(huán)境智能監(jiān)測系統(tǒng)4個方面解決黃河流域的生態(tài)保護(hù)與治理修復(fù)問題,有助于保障黃河長治久安、促進(jìn)全流域高質(zhì)量發(fā)展。同時,為科研人員高效利用國家科學(xué)數(shù)據(jù)共享平臺提供理論范式和實踐參考,著力解決當(dāng)前各國家科學(xué)數(shù)據(jù)中心間數(shù)據(jù)資源存在的通用性低、互操作差等問題。
本文在國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)模型構(gòu)建研究過程中,以黃河流域?qū)n}數(shù)據(jù)為基礎(chǔ),只選取了6個與其密切相關(guān)的國家科學(xué)數(shù)據(jù)中心,通過專題已有的8個元數(shù)據(jù)進(jìn)行關(guān)聯(lián)模型構(gòu)建,或許存在一定不足,但也有進(jìn)一步提升的可能性。國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)模型研究未來可以從以下幾個方面進(jìn)一步深入。第一,國家科技基礎(chǔ)條件平臺建設(shè)有20個國家科學(xué)數(shù)據(jù)中心,數(shù)據(jù)資源豐富,涉及學(xué)科領(lǐng)域廣泛,可以繼續(xù)關(guān)聯(lián)更多數(shù)據(jù)中心,如國家冰川凍土沙漠科學(xué)數(shù)據(jù)中心、國家微生物科學(xué)數(shù)據(jù)中心等。除此以外,一些科研機(jī)構(gòu)、高校建立的數(shù)據(jù)中心或數(shù)據(jù)庫也可納入統(tǒng)一考慮的范疇,進(jìn)一步拓展數(shù)據(jù)資源。第二,還要擴(kuò)展更多的關(guān)聯(lián)元數(shù)據(jù),豐富元數(shù)據(jù)種類,編制核心元數(shù)據(jù)目錄,區(qū)分通用核心元數(shù)據(jù)和專題擴(kuò)展元數(shù)據(jù),規(guī)范數(shù)據(jù)中心元數(shù)據(jù)標(biāo)準(zhǔn),提高關(guān)聯(lián)模型的適用性和擴(kuò)展性,更好地解決科學(xué)數(shù)據(jù)中心間數(shù)據(jù)資源存在的通用性低、互操作差的問題。第三,國家科學(xué)數(shù)據(jù)中心關(guān)聯(lián)模型,需要創(chuàng)新數(shù)據(jù)管理機(jī)制、深化數(shù)據(jù)高效共享、促進(jìn)數(shù)據(jù)有序開發(fā)利用,不斷完善開放共享的數(shù)據(jù)資源體系,真正實現(xiàn)跨機(jī)構(gòu)、跨學(xué)科、跨領(lǐng)域的互通共享,充分挖掘科學(xué)數(shù)據(jù)的潛在價值,推動科技創(chuàng)新發(fā)展。