王宏智 楊雅萍
(中國(guó)科學(xué)院地理科學(xué)與資源研究所,北京 100101)
資源是指在一定地區(qū)內(nèi)擁有的物力、財(cái)力、人力等各種物質(zhì)要素的總稱(chēng)。環(huán)境既包括以大氣、水、土壤、植物、動(dòng)物、微生物等為內(nèi)容的物質(zhì)因素,也包括以觀(guān)念、制度、行為準(zhǔn)則等為內(nèi)容的非物質(zhì)因素。從學(xué)科角度來(lái)講,資源環(huán)境科學(xué)是一門(mén)從生態(tài)觀(guān)點(diǎn)出發(fā),將資源的合理利用和環(huán)境保護(hù)運(yùn)用到生產(chǎn)和環(huán)境建設(shè)領(lǐng)域的綜合性學(xué)科。資源環(huán)境數(shù)據(jù)是一種具有時(shí)空特性的科學(xué)數(shù)據(jù)[1]。資源環(huán)境科學(xué)內(nèi)容十分豐富,涵蓋了資源、環(huán)境、大氣、土壤以及社會(huì)文化資源等方面,鑒于資源環(huán)境科學(xué)數(shù)據(jù)的復(fù)雜性,只有利用科學(xué)的方式對(duì)其進(jìn)行管理,才能有利于數(shù)據(jù)的集成和利用。
近年來(lái),國(guó)家為加快科技發(fā)展,提高自主創(chuàng)新能力,資助開(kāi)展了許多科技計(jì)劃、專(zhuān)項(xiàng),例如973計(jì)劃、863計(jì)劃、國(guó)家科技重大專(zhuān)項(xiàng)、科技基礎(chǔ)性專(zhuān)項(xiàng)等。這些專(zhuān)項(xiàng)的開(kāi)展提高了我國(guó)的科研實(shí)力以及自主創(chuàng)新能力,帶動(dòng)了我國(guó)高科技的技術(shù)以及產(chǎn)業(yè)的發(fā)展,取得了豐碩的成果。其中,科技基礎(chǔ)性工作專(zhuān)項(xiàng)是通過(guò)科學(xué)考察、調(diào)查、資料制備、整編等過(guò)程,對(duì)基礎(chǔ)科學(xué)數(shù)據(jù)、資料進(jìn)行系統(tǒng)采集、收集和綜合分析工作,同時(shí)也產(chǎn)生了豐富的數(shù)據(jù)資源。目前,該專(zhuān)項(xiàng)對(duì)產(chǎn)生的數(shù)據(jù)資源以項(xiàng)目名稱(chēng)方式進(jìn)行管理,以元數(shù)據(jù)方式對(duì)數(shù)據(jù)進(jìn)行共享,但尚未形成系統(tǒng)的分類(lèi)體系。
數(shù)據(jù)分類(lèi)是數(shù)據(jù)管理中非常重要的一個(gè)環(huán)節(jié)。由于基礎(chǔ)性專(zhuān)項(xiàng)所產(chǎn)生的數(shù)據(jù)資源的復(fù)雜性及用戶(hù)需求的多樣性,一直以來(lái)缺乏有效的數(shù)據(jù)資源分類(lèi)體系,難以滿(mǎn)足用戶(hù)多維度數(shù)據(jù)查找的需求。所以,有必要建立一個(gè)科學(xué)完整的資源環(huán)境科學(xué)數(shù)據(jù)分類(lèi)體系。
自1999年科技部啟動(dòng)科技基礎(chǔ)性工作專(zhuān)項(xiàng)以來(lái),設(shè)置了500多個(gè)項(xiàng)目,投資總經(jīng)費(fèi)約10多億元,囊括了地球科學(xué)、生物學(xué)、氣象、農(nóng)業(yè)、林業(yè)、環(huán)境、材料、醫(yī)學(xué)等學(xué)科領(lǐng)域,產(chǎn)生了一批重要的科學(xué)數(shù)據(jù)、自然科技資源、文獻(xiàn)資料、圖集典籍、標(biāo)準(zhǔn)規(guī)范等。科技基礎(chǔ)性工作是科技發(fā)展的重要基礎(chǔ),是體現(xiàn)國(guó)家整體科技水平的重要方面,對(duì)于科技進(jìn)步、經(jīng)濟(jì)與社會(huì)發(fā)展和國(guó)家安全具有不可替代的作用[2]。專(zhuān)項(xiàng)開(kāi)展以來(lái)產(chǎn)生的數(shù)據(jù)大部分都是通過(guò)實(shí)地考察、監(jiān)測(cè)而來(lái),具有開(kāi)展時(shí)間長(zhǎng)、數(shù)據(jù)量大的特點(diǎn)。豐富的資源環(huán)境領(lǐng)域數(shù)據(jù)有助于資源環(huán)境科學(xué)數(shù)據(jù)分類(lèi)體系的研究。
目前,科技基礎(chǔ)性工作專(zhuān)項(xiàng)項(xiàng)目所產(chǎn)出的科學(xué)數(shù)據(jù)分類(lèi)體系參考的是學(xué)科分類(lèi)《GB/T13745-2009》。在該學(xué)科分類(lèi)體系中,地球科學(xué)、環(huán)境科學(xué)技術(shù)及資源科學(xué)技術(shù)類(lèi)別的分類(lèi)不夠細(xì)致,缺少三級(jí)分類(lèi),從而限制了資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)的有效管理與便捷共享。因此,本文擬在科技基礎(chǔ)性工作專(zhuān)項(xiàng)中資源環(huán)境領(lǐng)域豐富的數(shù)據(jù)成果的基礎(chǔ)上,遵守國(guó)家標(biāo)準(zhǔn)學(xué)科分類(lèi)體系,借鑒該領(lǐng)域各學(xué)科中心數(shù)據(jù)的分類(lèi),采用按學(xué)科分類(lèi)體系與數(shù)據(jù)本身屬性相結(jié)合的方式以及構(gòu)建數(shù)據(jù)關(guān)鍵詞表的方式對(duì)資源環(huán)境科學(xué)數(shù)據(jù)分類(lèi)體系進(jìn)行研究,探討形成一個(gè)既能方便數(shù)據(jù)管理又能滿(mǎn)足數(shù)據(jù)后續(xù)集成需要的數(shù)據(jù)分類(lèi)體系,以便對(duì)資源環(huán)領(lǐng)域科技基礎(chǔ)性專(zhuān)項(xiàng)工作所產(chǎn)生的數(shù)據(jù)資源進(jìn)行更好的規(guī)劃、建設(shè)、管理與共享。
資源環(huán)境領(lǐng)域科技基礎(chǔ)性工作專(zhuān)項(xiàng)所產(chǎn)生的數(shù)據(jù)資源具有覆蓋面廣、類(lèi)型復(fù)雜、學(xué)科交叉性與綜合性等基本特點(diǎn),而科學(xué)數(shù)據(jù)分類(lèi)應(yīng)遵循科學(xué)性、系統(tǒng)性、完整性、層次性、可擴(kuò)展性、實(shí)用性、兼容性及排他性等原則[2]。因此,為了保持學(xué)科完整性和系統(tǒng)性,按學(xué)科分類(lèi)便于數(shù)據(jù)查找,基于數(shù)據(jù)資源本身的現(xiàn)狀從數(shù)據(jù)資源聚集度的角度分類(lèi)便于數(shù)據(jù)資源的查找利用。本文將采用一二級(jí)按學(xué)科、三級(jí)按關(guān)鍵詞分類(lèi)的分類(lèi)體系。一二級(jí)分類(lèi)遵守國(guó)標(biāo)學(xué)科分類(lèi)體系,三級(jí)分類(lèi)則采用關(guān)鍵詞拓展法。同時(shí),本文所擬定的分類(lèi)體系具有可擴(kuò)展性,以便整合后續(xù)驗(yàn)收項(xiàng)目數(shù)據(jù)資源時(shí)對(duì)分類(lèi)體系進(jìn)行補(bǔ)充完善。
(1)按學(xué)科體系分類(lèi)與數(shù)據(jù)本身屬性相結(jié)合的方式分類(lèi)。學(xué)科分類(lèi)是一套非常完整全面的分類(lèi)體系,在適合學(xué)科分類(lèi)的方面值得參考和借鑒,但是不能完全照搬。例如,地球科學(xué)史、天文學(xué)史等沒(méi)有相對(duì)應(yīng)的科學(xué)數(shù)據(jù)的學(xué)科不會(huì)在分類(lèi)體系中出現(xiàn)。交叉或者綜合學(xué)科(例如土壤地理學(xué)),沒(méi)有特定的要素對(duì)象,一般也不適合作為數(shù)據(jù)分類(lèi)項(xiàng)。僅僅依靠學(xué)科分類(lèi)是非常單薄的,也不適合整個(gè)分類(lèi)體系的建設(shè),因此要結(jié)合數(shù)據(jù)本身屬性進(jìn)行分類(lèi)。本文參考資源環(huán)境領(lǐng)域科技基礎(chǔ)性工作專(zhuān)項(xiàng)科學(xué)數(shù)據(jù)的二級(jí)學(xué)科類(lèi)別以及國(guó)家學(xué)科分類(lèi)體系,嚴(yán)格按照科學(xué)數(shù)據(jù)分類(lèi)原則對(duì)資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)一級(jí)類(lèi)與二級(jí)類(lèi)進(jìn)行劃分。
(2)按數(shù)據(jù)關(guān)鍵詞分類(lèi)。關(guān)鍵詞解析分類(lèi)法是反映數(shù)據(jù)資源現(xiàn)狀,通過(guò)數(shù)據(jù)資源本身特點(diǎn)進(jìn)行的一種聚集分類(lèi)。首先通過(guò)學(xué)科分類(lèi)體系,進(jìn)行自上而下的引導(dǎo)分類(lèi);再通過(guò)關(guān)鍵詞聚類(lèi),進(jìn)行自下而上的聚集分類(lèi)。這是解決體系完整和反映數(shù)據(jù)資源真實(shí)現(xiàn)狀的一種完美結(jié)合。而缺乏大量數(shù)據(jù)基礎(chǔ)的分類(lèi)研究往往是不全面的。本文收集整理了資源環(huán)境領(lǐng)域科技基礎(chǔ)性工作專(zhuān)項(xiàng)共計(jì)108個(gè)項(xiàng)目的科學(xué)數(shù)據(jù),對(duì)項(xiàng)目?jī)?nèi)的科學(xué)數(shù)據(jù)集名稱(chēng)、數(shù)據(jù)要素進(jìn)行關(guān)鍵詞解析,解析過(guò)程主要是對(duì)資源環(huán)境領(lǐng)域科技基礎(chǔ)性工作專(zhuān)項(xiàng)所產(chǎn)出的科學(xué)數(shù)據(jù)的元數(shù)據(jù)表中的數(shù)據(jù)集名稱(chēng)、數(shù)據(jù)要素和數(shù)據(jù)詳細(xì)描述進(jìn)行關(guān)鍵詞提取工作,得到1000余項(xiàng)關(guān)鍵詞,然后對(duì)類(lèi)別重復(fù)的關(guān)鍵詞進(jìn)行篩減,再對(duì)未涉及的關(guān)鍵詞進(jìn)行擴(kuò)展,形成資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)三級(jí)分類(lèi)。
表1 資源環(huán)境領(lǐng)域基礎(chǔ)性工作專(zhuān)項(xiàng)科學(xué)數(shù)據(jù)二級(jí)學(xué)科
本文在國(guó)家學(xué)科分類(lèi)的基礎(chǔ)上,再根據(jù)數(shù)據(jù)本身屬性進(jìn)行調(diào)整,得到資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)的一、二級(jí)分類(lèi)??萍蓟A(chǔ)性工作專(zhuān)項(xiàng)中資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)的二級(jí)學(xué)科(表1)對(duì)資源環(huán)境科學(xué)數(shù)據(jù)分類(lèi)提供參考,可以更為有效地建立數(shù)據(jù)分類(lèi)體系[3]。
統(tǒng)計(jì)1999一2012年資源環(huán)境領(lǐng)域科技基礎(chǔ)性工作專(zhuān)項(xiàng)產(chǎn)生科學(xué)數(shù)據(jù)的學(xué)科類(lèi)別,二級(jí)學(xué)科共計(jì)23類(lèi),但有些學(xué)科并不適合直接應(yīng)用于資源環(huán)境科學(xué)數(shù)據(jù)的分類(lèi),應(yīng)對(duì)其進(jìn)行適當(dāng)調(diào)整,保證分類(lèi)體系的科學(xué)性與兼容性。例如地圖學(xué)的數(shù)據(jù)大都以空間數(shù)據(jù)為主,可以根據(jù)其本身數(shù)據(jù)要素屬性,分類(lèi)到其他學(xué)科類(lèi)別中;經(jīng)濟(jì)地理學(xué)是交叉學(xué)科,不作為要素對(duì)象劃分依據(jù),所以將其數(shù)據(jù)屬性劃歸為社會(huì)經(jīng)濟(jì)數(shù)據(jù)、基礎(chǔ)地理數(shù)據(jù)或者其他類(lèi)別中;動(dòng)物、植物、微生物學(xué)作為一級(jí)分類(lèi)過(guò)于單一,可作為二級(jí)類(lèi)進(jìn)行劃分;中國(guó)民間文學(xué)、文化人類(lèi)學(xué)與民族學(xué)數(shù)據(jù)也可結(jié)合其他數(shù)據(jù)合并為文化資源[4-5]。
只是結(jié)合資源環(huán)境領(lǐng)域科技基礎(chǔ)性工作專(zhuān)項(xiàng)科學(xué)數(shù)據(jù)的二級(jí)學(xué)科來(lái)分類(lèi)并不嚴(yán)謹(jǐn)也不夠完善,需要參考國(guó)家學(xué)科分類(lèi)與科學(xué)數(shù)據(jù)本身屬性進(jìn)行一級(jí)類(lèi)和二級(jí)類(lèi)的劃分。據(jù)此可以劃分為14個(gè)一級(jí)類(lèi),67個(gè)二級(jí)類(lèi)。一級(jí)類(lèi)和二級(jí)類(lèi)的劃分便于數(shù)據(jù)的快速查找以及新數(shù)據(jù)的快速歸類(lèi),使數(shù)據(jù)管理更加科學(xué)方便。表2是資源環(huán)境科學(xué)數(shù)據(jù)一級(jí)及二級(jí)分類(lèi)表。
表2 資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)一級(jí)與二級(jí)分類(lèi)表
表3 資源環(huán)境領(lǐng)域基礎(chǔ)性工作科學(xué)數(shù)據(jù)三級(jí)分類(lèi)表
資源環(huán)境科學(xué)數(shù)據(jù)一級(jí)與二級(jí)類(lèi)已可以保證資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)的科學(xué)管理,但對(duì)于進(jìn)一步的數(shù)據(jù)集成與數(shù)據(jù)建庫(kù)來(lái)看,顯得有些不足。數(shù)據(jù)的分科分類(lèi)大多對(duì)應(yīng)的是一個(gè)特定領(lǐng)域或?qū)W科,這對(duì)于數(shù)據(jù)分類(lèi)來(lái)說(shuō)粒度還是過(guò)大,難以區(qū)分領(lǐng)域下不同的數(shù)據(jù)要素,不便于數(shù)據(jù)的查找、發(fā)現(xiàn)與利用。如:自然地理學(xué),從地理要素和對(duì)象的角度來(lái)看,其又包括地形地貌、河流湖泊、冰川、凍土等。所以,必須借助關(guān)鍵詞,進(jìn)一步對(duì)數(shù)據(jù)資源進(jìn)行聚類(lèi)導(dǎo)航。本文在基于資源環(huán)境科學(xué)數(shù)據(jù)一級(jí)與二級(jí)類(lèi)的基礎(chǔ)上,結(jié)合資源環(huán)境領(lǐng)域科技基礎(chǔ)性工作科學(xué)數(shù)據(jù),對(duì)其進(jìn)行關(guān)鍵詞與數(shù)據(jù)要素的解析,對(duì)同類(lèi)關(guān)鍵詞或者要素進(jìn)行合并,并對(duì)其進(jìn)行拓展。最終初步建立資源環(huán)境科學(xué)數(shù)據(jù)三級(jí)分類(lèi)表[6-10],共劃分為435類(lèi),具體分類(lèi)如表3所示。三級(jí)分類(lèi)表具體用途表現(xiàn)為
兩個(gè)方面:一是用于數(shù)據(jù)集成過(guò)程,數(shù)據(jù)集成過(guò)程中可以直接按照三級(jí)分類(lèi)詞進(jìn)行集成;二是在建立數(shù)據(jù)庫(kù)的過(guò)程中可以按照三級(jí)分類(lèi)進(jìn)行層級(jí)數(shù)據(jù)庫(kù)的建立,便于數(shù)據(jù)庫(kù)的關(guān)聯(lián)分析。
續(xù)表
基于上文所提到的學(xué)科分類(lèi)與關(guān)鍵詞分類(lèi)的資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)三級(jí)分類(lèi)體系,特舉例說(shuō)明,如表4所示,9類(lèi)數(shù)據(jù)集通過(guò)學(xué)科分類(lèi)均屬于自然資源中的生物資源,而在進(jìn)行關(guān)鍵詞解析、整合與拓展之后,得到了森林資源、草地資源、微生物資源等17項(xiàng)三級(jí)類(lèi)。因此,盡管這些數(shù)據(jù)同屬于一個(gè)學(xué)科分類(lèi),但通過(guò)關(guān)鍵詞分類(lèi),可以精準(zhǔn)地對(duì)它們進(jìn)行進(jìn)一步分類(lèi),以便于數(shù)據(jù)的查找、定位和使用。
表4 部分關(guān)鍵詞解析拓展表
本文立足國(guó)家開(kāi)展的科技基礎(chǔ)性工作專(zhuān)項(xiàng)中資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)管理以及集成等缺少統(tǒng)一的分類(lèi)體系這一問(wèn)題,參考國(guó)家學(xué)科分類(lèi)體系和我國(guó)數(shù)據(jù)共享各學(xué)科的分類(lèi)體系,基于資源環(huán)境領(lǐng)域科技基礎(chǔ)性工作專(zhuān)項(xiàng)科學(xué)數(shù)據(jù)的學(xué)科類(lèi)型以及數(shù)據(jù)本身屬性類(lèi)別,初步建立了資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)一級(jí)和二級(jí)分類(lèi),繼而在一級(jí)和二級(jí)類(lèi)的基礎(chǔ)上,對(duì)資源環(huán)境領(lǐng)域基礎(chǔ)性科學(xué)數(shù)據(jù)關(guān)鍵詞進(jìn)行解析、整合和拓展,形成資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)三級(jí)類(lèi)。
通過(guò)前文分析可知,目前資源環(huán)境領(lǐng)域科技基礎(chǔ)性工作專(zhuān)項(xiàng)所產(chǎn)生的科學(xué)數(shù)據(jù)在分類(lèi)體系上存在不夠精準(zhǔn)實(shí)用的缺陷,限制了數(shù)據(jù)的便捷共享,不能滿(mǎn)足用戶(hù)的多維度與精準(zhǔn)查詢(xún)的需求。本研究證明,利用分類(lèi)層級(jí)進(jìn)行數(shù)據(jù)管理可以使數(shù)據(jù)管理更為方便,同時(shí)也使數(shù)據(jù)查找更為快捷。分類(lèi)體系的建立打破了各項(xiàng)目之間的壁壘,三級(jí)分類(lèi)體系可用于科學(xué)數(shù)據(jù)的分類(lèi)集成,避免形成數(shù)據(jù)“孤島”,從而為數(shù)據(jù)庫(kù)的建立提供支撐。
本文建立的分類(lèi)體系是以1999一2012年科技基礎(chǔ)性工作專(zhuān)項(xiàng)資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)為依托進(jìn)行研究的,可直接用于科技基礎(chǔ)性工作專(zhuān)項(xiàng)資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)中,也可應(yīng)用于其他科技專(zhuān)項(xiàng)的資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)。但是每個(gè)專(zhuān)項(xiàng)產(chǎn)生的資源環(huán)境科學(xué)數(shù)據(jù)范圍可能并不一致,所以在應(yīng)用時(shí)可根據(jù)數(shù)據(jù)情況對(duì)分類(lèi)體系進(jìn)行適當(dāng)調(diào)整,避免出現(xiàn)有類(lèi)別無(wú)數(shù)據(jù)的情況。
由于目前資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)的復(fù)雜性及有限性,本文制定的分類(lèi)體系可能沒(méi)有涵蓋資源環(huán)境領(lǐng)域科學(xué)數(shù)據(jù)的所有方面,但隨著資源環(huán)境領(lǐng)域項(xiàng)目的不斷開(kāi)展、數(shù)據(jù)資源的不斷增加,科學(xué)數(shù)據(jù)分類(lèi)體系也將不斷被修改與完善。
[1]中華人民共和國(guó)科技部.國(guó)家”十五”科技基礎(chǔ)性工作專(zhuān)項(xiàng)實(shí)施意見(jiàn)[J].中國(guó)基礎(chǔ)科學(xué), 2001(8): 31-34.
[2]孫九林, 孫曉華.自然資源信息分類(lèi)體系[J].資源科學(xué), 1989(2): 62-69.
[3]廖順寶, 蔣林.地球系統(tǒng)科學(xué)數(shù)據(jù)分類(lèi)體系研究[J].地理科學(xué)進(jìn)展, 2005, 24(6): 93-98.
[4]王卷樂(lè), 林海, 冉盈盈, 等.面向數(shù)據(jù)共享的地球系統(tǒng)科學(xué)數(shù)據(jù)分類(lèi)探討[J].地球科學(xué)進(jìn)展, 2014, 29(2):265-274.
[5]國(guó)家標(biāo)準(zhǔn)化管理委員會(huì).GB/T 13745-92 學(xué)科分類(lèi)與代碼[S].2009.
[6]國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)共享服務(wù)平臺(tái)[DB/OL].[2016-12-11].http: //www.geodata.cn/index.html.
[7]海洋科學(xué)數(shù)據(jù)中心.海洋學(xué)科分類(lèi)[DB/OL].[2017-01-22].http: //msdc.qdio.ac.cn/.
[8]中國(guó)科技資源共享網(wǎng)[DB/OL].[2017-02-06].http: //www.escience.gov.cn/.
[9]中國(guó)南北極數(shù)據(jù)中心[DB/OL].[2017-03-25].http: //www.chinare.org.cn/index/.
[10]中國(guó)氣象數(shù)據(jù)網(wǎng)[DB/OL].[2017-04-24].http: //data.cma.cn/site/index.html.