劉榮梅,張明華,王永志,余海龍,任 偉
1. 中國地質(zhì)調(diào)查局 發(fā)展研究中心,北京 100037;2. 吉林大學(xué) 地球探測科學(xué)與技術(shù)學(xué)院,長春 130061
隨著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)在地學(xué)領(lǐng)域的應(yīng)用(何文娜等,2013;2019),地質(zhì)云為各類用戶提供了大量的多專業(yè)地學(xué)數(shù)據(jù)與信息產(chǎn)品(王永志等,2018;何文娜等,2019)。決策者、研究人員、數(shù)據(jù)科學(xué)家和開發(fā)人員等使用的大量地學(xué)空間數(shù)據(jù)廣泛存在跨部門、跨行業(yè)、跨區(qū)域的需求(譚永杰,2017),對地學(xué)數(shù)據(jù)的集成與共享提出了挑戰(zhàn)。國際組織、各國地質(zhì)調(diào)查機(jī)構(gòu)開展了一系列基于開放地理空間聯(lián)盟OGC(Open Geospatial Consortium)標(biāo)準(zhǔn)的地學(xué)數(shù)據(jù)集成與共享工作,以破解全球化進(jìn)程中地學(xué)數(shù)據(jù)應(yīng)用遇到的壁壘,來源不同、格式多樣的地學(xué)數(shù)據(jù)在統(tǒng)一標(biāo)準(zhǔn)下進(jìn)行數(shù)據(jù)交換,以完成跨地域、跨語言、跨專業(yè)的在線交互。國際地質(zhì)科學(xué)聯(lián)合會(huì)IUGS(International Union of Geological Sciences)的地學(xué)信息管理與應(yīng)用委員會(huì)(簡稱“國際地學(xué)信息委員會(huì)”)CGI(Commission for the Management and Application of Geoscience Information)開發(fā)的地球科學(xué)標(biāo)記語 言GeoSciML(Geoscience Markup Language)已在國際地學(xué)數(shù)據(jù)交換應(yīng)用中初見成效(Laxton et al., 2010; Lombardo, et al., 2018)。國際地質(zhì)科學(xué)聯(lián)合會(huì)發(fā)起的“地質(zhì)一張圖(OneGeology)”使用GeoSciML作為數(shù)據(jù)標(biāo)準(zhǔn)(Simons et al.,2012),實(shí)現(xiàn)了包括中國在內(nèi)的全球120多個(gè)國家的一張地質(zhì)圖的數(shù)據(jù)共享(Komac M,2015);支持歐洲空間信息基礎(chǔ)設(shè)施建設(shè)計(jì)劃INSPIRE(Infrastructure for Spatial Information in Europe)實(shí)現(xiàn)歐盟成員國之間的地學(xué)信息交換(https://inspire.ec.europa.eu),美國地球科學(xué)信息網(wǎng)絡(luò)USGN(US Geoscience Information Network) 提供政府、教育和私人機(jī)構(gòu)之間的地質(zhì)數(shù)據(jù)共享(http://usgin.org/page/how-usgin-works); 加 拿大地下水信息網(wǎng)CGIN(Canadian Groundwater Information Network)正在使用GroundwaterML整合多個(gè)區(qū)域的水井信息,澳大利亞地球科學(xué)信息網(wǎng)AGIN(Australian Geoscience Information Network)等項(xiàng)目采用GeoSciML從澳大利亞州及相關(guān)機(jī)構(gòu)為社會(huì)提供鉆孔數(shù)據(jù)服務(wù)(http://portal.geoscience.gov.au);非—?dú)W地學(xué)資源觀測系 統(tǒng)AEGOS(African-European Georesources Observation System)項(xiàng)目也在促進(jìn)將GeoSciML作為整個(gè)非洲地球科學(xué)數(shù)據(jù)交換的標(biāo)準(zhǔn)(http://www.aegos-project.org/index.php)。中 國 地 質(zhì)調(diào)查局一直積極探索國際地學(xué)數(shù)據(jù)共享標(biāo)準(zhǔn)的應(yīng)用,研究了基于GeoSciML、地球資源標(biāo)記語 言EarthResourceML(Earth Resource Markup Language)等相關(guān)國際地學(xué)數(shù)據(jù)交換標(biāo)準(zhǔn),翻譯的GeoSciML 4.1中文版被OGC采納并提供在線服 務(wù)( http://www.geosciml.org/doc/geosciml/4.1/documentation/ogc_spec_translations/16-008_OGC_Geoscience_Markup_Language_GSML4.1-CN2018.08.18.docx. 2020-06-17.)。CGI制 定的EarthResourceML等標(biāo)準(zhǔn)及地學(xué)專業(yè)術(shù)語Geoscience Terminology已在全球范圍內(nèi)得到廣泛使用(http://earthresourceml.org)。
CGI是IUGS下設(shè)的6個(gè)分會(huì)之一,負(fù)責(zé)牽頭開展國際地學(xué)信息領(lǐng)域的協(xié)作與培訓(xùn),研究地學(xué)信息相關(guān)標(biāo)準(zhǔn)的編制及全球推廣應(yīng)用,以促進(jìn)地球科學(xué)數(shù)據(jù)的互操作和信息交換。CGI倡導(dǎo)的數(shù)據(jù)互操作涉及異構(gòu)數(shù)據(jù)的交換和理解、與其他領(lǐng)域的空間數(shù)據(jù)集成、語義一致性理解與應(yīng)用三個(gè)主要層次。
截止2020年6月,CGI已有來自全球78個(gè)國家的注冊會(huì)員500多名。CGI的業(yè)務(wù)工作由其委員會(huì)牽頭開展,11位委員會(huì)成員來自法國、中國、澳大利亞、美國、加拿大、納米比亞等10個(gè)國家。CGI下設(shè)地球科學(xué)標(biāo)記語言、地球資源標(biāo)記語言、地球科學(xué)術(shù)語和地學(xué)領(lǐng)域(Geoscience Domain)四個(gè)技術(shù)工作組和一個(gè)區(qū)域工作組(Regional Groups)(圖1):(1)地球科學(xué)標(biāo)記語言技術(shù)工作組負(fù)責(zé)地學(xué)數(shù)據(jù)交換標(biāo)準(zhǔn)的研究與推廣使用;(2)地球資源標(biāo)記語言技術(shù)工作組負(fù)責(zé)礦產(chǎn)資源數(shù)據(jù)交換標(biāo)準(zhǔn)的研究與推廣應(yīng)用;(3)地球科學(xué)術(shù)語技術(shù)工作組負(fù)責(zé)地球科學(xué)領(lǐng)域?qū)S眯g(shù)語庫(多語種)的建設(shè)與應(yīng)用;(4)地學(xué)領(lǐng)域合作工作組由CGI與OGC共同組建,主要開展地學(xué)領(lǐng)域與城市、交通、工農(nóng)業(yè)等以及三維空間應(yīng)用的相關(guān)地學(xué)數(shù)據(jù)互操作標(biāo)準(zhǔn)研建與應(yīng)用,地下水及水文地質(zhì)領(lǐng)域數(shù)據(jù)交換標(biāo)準(zhǔn)GroundwaterML(Groundwater Markup Language)為重要內(nèi)容之一,不同行業(yè)鉆井?dāng)?shù)據(jù)之間互操作試驗(yàn)標(biāo)準(zhǔn)BoreHole-IE(BoreHole Interoperability Experiment)的研建與示范(https://www.ogc.org/projects/initiatives/boreholeie);(5)區(qū)域工作組負(fù)責(zé)亞洲、非洲、歐洲、北美、南美、大洋洲等不同區(qū)域的協(xié)調(diào)與合作。
圖1 CGI組織結(jié)構(gòu)Fig. 1 Organization structure of CGI
地球科學(xué)標(biāo)記語言GeoSciML是一個(gè)基于可擴(kuò)展標(biāo)記語言XML(eXtensible Markup Language)、地理標(biāo)記語 言GML(Geography Markup Language)的數(shù)字地質(zhì)科學(xué)信息交換的數(shù)據(jù)標(biāo)準(zhǔn)(http://geosciml.org;http://www.opengis.net/doc/geosciml/4.1. 2020-07-08),其開發(fā)主要受到前期北美地質(zhì)圖數(shù)據(jù)模型NADM(North American Data Model)、勘探與挖掘標(biāo)記語言XMML(eXploration and Mining Markup Language)及私營公司在英國地質(zhì)調(diào)查工作等一系列項(xiàng)目影響。
2003年英國地質(zhì)調(diào)查局和澳大利亞地質(zhì)調(diào)查局提出建設(shè)GeoSciML倡議,其目的是建立地學(xué)領(lǐng)域通用的數(shù)據(jù)交換標(biāo)準(zhǔn),通過開發(fā)不依賴軟件平臺、具有通用數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)內(nèi)容的地學(xué)數(shù)據(jù)概念模型,將模型映射到通用的交換數(shù)據(jù)格式后,用戶可采用WFS、WMS、WCS等格式的數(shù)據(jù)服務(wù)實(shí)現(xiàn)地學(xué)數(shù)據(jù)有機(jī)集成。
標(biāo)準(zhǔn)研制主要包括研發(fā)數(shù)據(jù)模型與應(yīng)用模式、開發(fā)測試模式(驗(yàn)證交換格式)、術(shù)語庫建設(shè)等任務(wù)。2006年,CGI發(fā)布了GeoSciML 1.0。2009年CGI發(fā)布的GeoSciML 2.1被全球一張地質(zhì)圖門戶采納,用于組織多國發(fā)布數(shù)據(jù)構(gòu)成全球地質(zhì)一張圖(http://www.onegeology.org)。該地質(zhì)數(shù)據(jù)交換標(biāo)準(zhǔn)2012年被澳大利亞和新西蘭地質(zhì)調(diào)查機(jī)構(gòu)采納使用。2010年更新版本成為INSPIRE和USGIN的數(shù)據(jù)交換標(biāo)準(zhǔn),另有19個(gè)國家地質(zhì)調(diào)查局發(fā)布了基于GeoSciML的WFS服務(wù)。2012~2015年根據(jù)用戶需求不斷完善調(diào)整,分別發(fā)布了GeoSciML 3.0、3.2、4.0等系列版本。2016年發(fā)布了GeoSciML 4.1版本,該版本經(jīng)OGC領(lǐng)域國際專家無記名投票表決,于2017年3月正式成為OGC標(biāo)準(zhǔn)。
在成為OGC標(biāo)準(zhǔn)之前,GeoSciML研究與完善經(jīng)歷了十幾年發(fā)展。最初主要由CGI技術(shù)工作組負(fù)責(zé),2011年以后的GeoSciML更新由OGC和CGI-IUGS共同開展。不同版本的GeoSciML在地質(zhì)模型內(nèi)容、表達(dá)模式等方面變化較大。隨著相關(guān)國際地理信息標(biāo)準(zhǔn)的更新和新用戶的需求變化,GeoSciML將吸收其他標(biāo)準(zhǔn)與模型的優(yōu)點(diǎn)不斷升級。
GeoSciML采用統(tǒng)一建模語言UML(Unified Markup Language)表達(dá),UML的面向?qū)ο筇匦钥伸`活表達(dá)GeoSciML模型中的繼承、多態(tài)等特征,以及包、類、基數(shù)、類關(guān)系。
圖2采用GeoSciML的高層模型體現(xiàn)了通過繼承可方便實(shí)現(xiàn)擴(kuò)展,抽象地質(zhì)要素(GeologicFeature)可衍生出抽象的地質(zhì)構(gòu)造(GeologicStructure)、地質(zhì)單元(GeologicUnit)、其他地質(zhì)要素,地質(zhì)構(gòu)造還可進(jìn)一步衍生出擴(kuò)展 的 地 質(zhì) 構(gòu) 造(Extended Geologic Structure)。GeoSciML數(shù)據(jù)結(jié)構(gòu)采用XML模式表達(dá),包括基本數(shù)據(jù)類型、實(shí)體(類)、簡單要素、復(fù)雜要素、枚舉等數(shù)據(jù)結(jié)構(gòu),可實(shí)現(xiàn)各種空間數(shù)據(jù)、屬性數(shù)據(jù)等復(fù)雜的數(shù)據(jù)結(jié)構(gòu)。
圖3展示了UML格式的數(shù)據(jù)結(jié)構(gòu),它體現(xiàn)了地質(zhì)單元視圖類(GeologicUnitView)與繪圖要素(MappedFeature)、巖性單元(Lithologic Unit)、地質(zhì)單元之間的使用關(guān)系,即在創(chuàng)建地質(zhì)單元視圖對象時(shí),其某個(gè)屬性可能是繪圖要素、巖性單元或地質(zhì)單元類型。圖4給出了基礎(chǔ)地質(zhì)要素發(fā)布成WFS格式服務(wù)后返回的XML格式數(shù)據(jù),從中可清晰地看出符合GeoSciML標(biāo)準(zhǔn)的屬性值(目的、地質(zhì)事件、地質(zhì)單元類型、值域等)、外部鏈接資源(xlink)等。
圖2 GeoSciML高層模型(引自O(shè)GC Geoscience Markup Language 4.1)Fig. 2 High-level model of GeoSciML
圖3 GeoSciML數(shù)據(jù)結(jié)構(gòu)表達(dá)(UML)Fig. 3 UML representation example of GeoSciML data structure
圖4 數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)(XML片斷)Fig. 4 Partial XML format data of GeoSciML data structure
GeoSciML主要目標(biāo)是構(gòu)建描述和表達(dá)地質(zhì)圖、數(shù)據(jù)庫等關(guān)鍵元素的語義、模式和編碼的語法,使信息系統(tǒng)能與這些數(shù)據(jù)進(jìn)行互操作,為實(shí)現(xiàn)地學(xué)數(shù)據(jù)互操作而專門開發(fā)的地學(xué)數(shù)據(jù)模型和數(shù)據(jù)轉(zhuǎn)換標(biāo)準(zhǔn)。GeoSciML充分發(fā)揮面向?qū)ο蟮睦^承特性,采用XML模式定義XSD(XML Schema Definition)確定數(shù)據(jù)模型、數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)約束、類型變換等,實(shí)現(xiàn)其利用已有數(shù)據(jù)、發(fā)現(xiàn)信息資源、自動(dòng)生成和發(fā)布服務(wù)的目的,以滿足從基礎(chǔ)圖件數(shù)據(jù)到復(fù)雜的關(guān)系型地質(zhì)數(shù)據(jù)庫的管理。GeoSciML覆蓋地球物質(zhì)組成、地層學(xué)、地質(zhì)單元、地質(zhì)年代、地質(zhì)構(gòu)造、地貌學(xué)和地球化學(xué)等領(lǐng)域,以及地質(zhì)調(diào)查野外采樣涉及的鉆孔和地質(zhì)樣品等內(nèi)容。GeoSciML 4.1主要包括基礎(chǔ)包、擴(kuò)展包、地質(zhì)年代包、鉆孔包、實(shí)驗(yàn)分析與樣品包和輕量包等6個(gè)包(如圖5):(1)基礎(chǔ)包(GeoSciML Basic):涵蓋核心地質(zhì)要素集,與INSPIRE的地質(zhì)數(shù)據(jù)規(guī)范一致;(2)擴(kuò)展包(GeoSciML Extension):根據(jù)不同的業(yè)務(wù)需求,在基礎(chǔ)包上增加新的特性和關(guān)聯(lián),繼承擴(kuò)展成基礎(chǔ)要素的詳細(xì)描述;(3)地質(zhì)年代包(GeoSciML Time):使用國際地層學(xué)術(shù)委員會(huì)認(rèn)可的地質(zhì)年代表達(dá)模型;(4)鉆孔包(Borehole):包括地質(zhì)測井、鉆探詳情和其他工程信息的鉆孔模型;(5)實(shí)驗(yàn)分析與樣品包(LaboratoryAnalysis-Specimen):體現(xiàn)實(shí)驗(yàn)室分析的元數(shù)據(jù)、地質(zhì)采樣、樣品以及同位素測年觀察結(jié)果的模型;(6)輕量包(GeoSciML Lite):地質(zhì)圖表達(dá)的簡化實(shí)現(xiàn)模型。
每個(gè)應(yīng)用包對應(yīng)目標(biāo)實(shí)現(xiàn)(邏輯模型、編碼和數(shù)據(jù)實(shí)例)至少包括一個(gè)要求類(符合模塊化的規(guī)范)的主題,更多目標(biāo)實(shí)現(xiàn)可發(fā)布成獨(dú)立的文檔?;A(chǔ)包提供了一個(gè)類集合,用于表示基礎(chǔ)地質(zhì)、地貌特征(單位、構(gòu)造和事件)、地球物質(zhì)、地質(zhì)時(shí)代和它們之間關(guān)系。它限制描述屬性的數(shù)量,以保證與重要用例相匹配。圖6顯示了GeoSciML基礎(chǔ)包與其他包的依賴關(guān)系,基礎(chǔ)包在運(yùn)行時(shí)需要導(dǎo)入常用要素實(shí)例(General Feature Instance)、SWE通用數(shù)據(jù)模型2.0(SWE Common Data Model 2.0、采 樣 要 素(samplingFeature)、空間模式(Spatial Schema)和概念模式語言(Conceptual schema language)等多個(gè)包。
圖5 GeoSciML 4.1 包(OGC Geoscience Markup Language 4.1)Fig. 5 Package diagram of GeoSciML 4.1
圖6 GeoSciML基礎(chǔ)包的依賴關(guān)系(OGC Geoscience Markup Language 4.1)Fig. 6 Dependency relationship diagram of GeoSciML Basic package
GeoSciML將地質(zhì)圖描述成一個(gè)地質(zhì)數(shù)據(jù)集,一個(gè)地質(zhì)數(shù)據(jù)集包括多個(gè)地質(zhì)要素,空間可視化的地質(zhì)要素可使用編圖要素。編圖要素能表示包括地質(zhì)要素在內(nèi)的任何要素,它使用其“規(guī)范”關(guān)系來標(biāo)識要表達(dá)的內(nèi)容。地質(zhì)要素可進(jìn)一步細(xì)分成地質(zhì)單元、地質(zhì)構(gòu)造、地貌要素和地質(zhì)事件。地質(zhì)基礎(chǔ)重點(diǎn)定義基礎(chǔ)地質(zhì)圖要素類、要素類之間的關(guān)系擴(kuò)展包則擴(kuò)展基礎(chǔ)包中的抽象描述,引入新的地質(zhì)構(gòu)造要素和多個(gè)類,加強(qiáng)對基礎(chǔ)類的描述。
2.4.1 地質(zhì)單元
GeoSciML的地質(zhì)單元是一個(gè)地球物質(zhì)包(通常是巖石),同時(shí)它亦指地球上某個(gè)范圍的地質(zhì)體或用于表征地球上某些物質(zhì),它包括標(biāo)準(zhǔn)地層單位、非標(biāo)準(zhǔn)地層單位和未命名的地質(zhì)單元(如圖7)。
圖7 地質(zhì)單元語境圖(OGC Geoscience Markup Language 4.1)Fig. 7 Context diagram of GeologicUnit
2.4.2 地質(zhì)構(gòu)造
GeoSciML中的地質(zhì)構(gòu)造(GeologicStructure)是一個(gè)描述現(xiàn)實(shí)世界地質(zhì)構(gòu)造的類包,用以描述地球物質(zhì)的不均勻性、模式或斷裂等性質(zhì)。地質(zhì)構(gòu)造的尺度規(guī)??蓮奈⒂^到宏觀,其不均勻性包括斷裂、礦物顆粒邊界和具有不同顆粒幾何(紋理)或成分的巖石邊界。地質(zhì)構(gòu)造體現(xiàn)巖石的不同部分或巖體間擠圧關(guān)系,但獨(dú)立于物質(zhì)和物質(zhì)結(jié)構(gòu)。固體物質(zhì)中比非固體物質(zhì)更易發(fā)現(xiàn)地質(zhì)構(gòu)造,且地質(zhì)構(gòu)造更持久。圖8展示了地質(zhì)構(gòu)造類之間的關(guān)系,地質(zhì)構(gòu)造是一個(gè)繼承自地質(zhì)要素的抽象類,通過對其繼承可產(chǎn)生褶皺(Fold)、褶皺體系(FoldSystem)、接觸關(guān)系(Contact)、剪切位移構(gòu)造(ShearDisplacementStructure)等更具體的要素類。
2.4.3 地貌要素
地形可由天然地球過程(河道、海岸、冰磧或山巒等)形成,亦可通過人類(人為的)活動(dòng)創(chuàng)建(挖掘通道、改造土地、礦山尾礦庫等)。GeoSciML地貌學(xué)子包描述了構(gòu)成地球地表的性質(zhì)和形狀(如地形)要素,其中的地貌要素是一種描述地球的地表形狀和性質(zhì)的地質(zhì)要素,它被建模成一個(gè)與組成地質(zhì)單元相關(guān)的要素(如圖9)。從圖中可顯見,地貌要素繼承自地質(zhì)要素、依賴于地質(zhì)單元,且可擴(kuò)展形成自然地形要素、人工地形要素,此外還包括地形單元抽象描述、天然/人工要素類型術(shù)語等。
2.4.4 地質(zhì)事件(GeologicEvent)
地質(zhì)事件(GeologicEvent)是一個(gè)包括多個(gè)事件類的包(如圖10),用于描述與改變地質(zhì)實(shí)體有關(guān)的一或多個(gè)地質(zhì)過程活動(dòng)中的事件。地質(zhì)歷史是地質(zhì)事件對象的有序集合,每一個(gè)地質(zhì)事件對象均有相關(guān)的地質(zhì)年代、地質(zhì)環(huán)境和一或多個(gè)地質(zhì)過程(EventProcessTerms)、地質(zhì)事件描述(GeologicEventDescription)等。年齡是特定地質(zhì)事件或要素的屬性,用絕對年齡、區(qū)間年齡(NumericAgeRange)和地質(zhì)年代表中的年代名稱(GeochronologicEraTerms)表達(dá)。
(1)GeoSciML地質(zhì)年代包:使用國際地層學(xué)術(shù)委員會(huì)認(rèn)可的地質(zhì)年代表達(dá)模型。包括IUGS的國際地層委員會(huì)定義的全球年代地層單位界線層型剖面和點(diǎn)位GSSP(Global Stratotype Section and Point)、ISO19108時(shí)態(tài)模式的擴(kuò)展內(nèi)容和地質(zhì)年代表。
(2)GeoSciML鉆孔包:包括地質(zhì)鉆孔、鉆孔詳細(xì)描述和其他工程信息的鉆孔模型,它將鉆孔描述成對地下地質(zhì)單元進(jìn)行采樣的方法模型。
圖8 地質(zhì)構(gòu)造概要圖(OGC Geoscience Markup Language 4.1)Fig. 8 Summary diagram of geologic structures
圖9 地貌要素概要圖(OGC Geoscience Markup Language 4.1)Fig. 9 Geomorphologic feature summary diagram
(3)GeoSciML實(shí)驗(yàn)與分析包:包括描述實(shí)驗(yàn)室用儀器完成的、與地質(zhì)樣本分析相關(guān)的過程和結(jié)果的類,涵蓋采樣信息、觀測結(jié)果質(zhì)量、觀測參數(shù)、分析儀器、分析任務(wù)、分析過程、分析方法以及形成的圖片等信息。
地球資源標(biāo)記語言EarthResourceML(Earth Resource Markup Language,簡 稱ERML)是CGI主持研制的以礦產(chǎn)資源為主的涵蓋全礦業(yè)領(lǐng)域的數(shù)據(jù)交換標(biāo)準(zhǔn)。主要應(yīng)用于礦點(diǎn)、礦山和采礦活動(dòng)。標(biāo)準(zhǔn)內(nèi)容包括礦產(chǎn)資源的地質(zhì)特征、賦存環(huán)境、礦產(chǎn)品及其礦產(chǎn)資源和儲(chǔ)量、礦山和采礦活動(dòng)、精礦、精煉產(chǎn)品和廢料生產(chǎn)等。其與礦床有關(guān)的地質(zhì)特征參照GeoSciML標(biāo)準(zhǔn)執(zhí)行。
圖10 地質(zhì)事件概要圖(OGC Geoscience Markup Language 4.1)Fig. 10 Summary diagram of Geologic Events
ERML最早由澳大利亞政府地球科學(xué)信息委員會(huì)于2004~2008年研究建設(shè),CGI互操作工作組于2009年發(fā)布EarthResourceML 1.1版本。為了適應(yīng)INSPIRE的需求不斷完善,當(dāng)前版本為2013年10月發(fā)布的EarthResourceML 2.0,其標(biāo)準(zhǔn)編制的建模方法、數(shù)據(jù)結(jié)構(gòu)與GeoSciML一脈相承。ERML通過導(dǎo)入GeoSciML核心包、模式語言包(Schema Language)、空間模式包(Spatial Schema)、時(shí)空模式包(Temporal Schema)、元數(shù)據(jù)包(Metadata)、GML包、地球物理包等構(gòu)建(如圖11)。
礦床數(shù)據(jù)包由采礦活動(dòng)有關(guān)的數(shù)據(jù)組成,即將礦產(chǎn)原材料加工成礦業(yè)產(chǎn)品的過程。礦業(yè)產(chǎn)品與礦點(diǎn)相關(guān),即礦產(chǎn)經(jīng)濟(jì)資源的地質(zhì)描述。由礦床基本信息、開礦活動(dòng)、成礦物質(zhì)組分、礦業(yè)廢物、礦產(chǎn)品等要素信息(圖12)。圖12顯示了采掘要素(MiningFeature)派生出采礦活動(dòng)(MiningActivity)、采礦廢料(MiningWaste)、礦山(Mine)等,以及 采 礦 廢 料 測 量(MiningWasteMeasure)、礦山狀態(tài)值(MineStatusValue)、原材料角色值(RawMaterialRoleValue)等相關(guān)支持類。
礦點(diǎn)數(shù)據(jù)包涵蓋了礦產(chǎn)資源數(shù)據(jù)庫中的要素屬性,部分與采礦活動(dòng)有關(guān)。側(cè)重于描述獨(dú)立于相關(guān)人類活動(dòng)(如采礦)的礦產(chǎn)資源、礦床類型、成礦模型、成礦過程及表生地質(zhì)作用過程(如圖13)。礦點(diǎn)從地質(zhì)資源類派生而成,它擁有探測活動(dòng)(ExplorationActivity)、地球資源物 質(zhì)(EarthResourceMaterial)、采 掘 活 動(dòng)、礦床模 型(MineralDepositModel)、礦 物 質(zhì)系 統(tǒng)(MineralSystem)等類型的屬性。
為地球科學(xué)領(lǐng)域構(gòu)建多語種語義的地學(xué)術(shù)語庫也是CGI技術(shù)標(biāo)準(zhǔn)工作之一,已確定的100多個(gè)地球科學(xué)詞匯表為GeoSciML和EarthResourceML等數(shù)據(jù)交換標(biāo)準(zhǔn)提供全面支撐,其中50多個(gè)詞匯表被廣泛編譯和采用。2019年又被IUGS深時(shí)數(shù)字地球大科學(xué)計(jì)劃DDE(Deep-time Digital Earth)用作知識體系術(shù)語的主要來源庫。
圖11 EarthResourceML數(shù)據(jù)包依賴關(guān)系圖(引自EarthResourceML 2.0)Fig. 11 Package dependencies diagram of EarthResourceML
圖12 礦床數(shù)據(jù)類關(guān)系圖(EarthResourceML 2.0,2013)Fig. 12 Class diagram of Mine package
CGI制定地學(xué)專業(yè)術(shù)語的名稱、下屬詞等內(nèi)容,為每個(gè)術(shù)語和下屬詞給出了詳細(xì)的定義、參考來源、類型、狹義或廣義的意義、上屬詞以及每個(gè)詞條的變更過程,提供htmljson df ext tlxml等多種格式的服務(wù),既可滿足用戶在線查詢,亦可直接用于機(jī)器理解。所有下屬詞通過URI方式與發(fā)布的地學(xué)數(shù)據(jù)屬性關(guān)聯(lián),實(shí)現(xiàn)了數(shù)據(jù)與標(biāo)準(zhǔn)的深度融合。表1按字母順序列出了GeoSciML術(shù)語類型,表2按字母順序列出了EarthResourceML術(shù)語類型。
圖13 礦點(diǎn)類圖(EarthResourceML 2.0,2013)Fig. 13 Class diagram of MineralOccurence package
桌面版地質(zhì)圖的圖層一般均已建好,屬性列難以通過關(guān)聯(lián)方式隨意構(gòu)建(特別是MapGIS圖件),很難與多個(gè)數(shù)據(jù)庫中的若干個(gè)圖層形成新表、新圖層、新事件等。但實(shí)際工作中,以某個(gè)圖層為主、與一個(gè)或多個(gè)結(jié)構(gòu)化表關(guān)聯(lián)生成新圖層的需求很常見,基于GeoSciML數(shù)據(jù)標(biāo)準(zhǔn)可以滿足上述要求。
地質(zhì)體是地質(zhì)圖中最重要的組成內(nèi)容,它一般保存在空間數(shù)據(jù)庫中,也可存于單個(gè)Shapefile文件中。與其關(guān)聯(lián)的數(shù)據(jù)可存于相同數(shù)據(jù)庫中,或其他數(shù)據(jù)庫中(PostgreSQL/MySQL/SQL Server/Oracle等)。在地質(zhì)圖發(fā)布前,地質(zhì)單元圖層可包括所有屬性或部分重要屬性(如幾何類型、要素編號等),而其他屬性可以保存在關(guān)系表中(如地質(zhì)體名稱、標(biāo)志、類型、地質(zhì)年代、巖石類型等)。發(fā)布前要準(zhǔn)備好模式及映射文件。在發(fā)布OGC服務(wù)(WFS、WMS等)時(shí),通過映射及關(guān)聯(lián)發(fā)布成多個(gè)具有不同屬性的組合要素,其中地質(zhì)單元描述、接觸關(guān)系等既可以用字符串,亦可使用鏈接。發(fā)布成WFS、WMS服務(wù)后,基于WebGIS的各類應(yīng)用可訪問地質(zhì)體的空間要素。地質(zhì)體屬性可通過統(tǒng)一資源標(biāo)識符URI(Uniform Resource Identifier)鏈接至CGI地學(xué)術(shù)語庫(Bibliotheca, 2017;http://geosciml.org/resource),可同時(shí)使用多國語言的術(shù)語,亦可通過查找方法在地質(zhì)單元屬性中搜索匹配的地質(zhì)術(shù)語。
圖14示意性展示了基于GeoSciML的北京市地質(zhì)界線,以及吉林省空間分布的地質(zhì)體要素的發(fā)布及應(yīng)用。吉林省地質(zhì)體(Jilin_Geobody)面要素類繼承自地質(zhì)要素類,它增加了要素編號(Feature_ID)、地質(zhì)體名稱(Geobody_Name)等屬性,通過要素編號與保存在關(guān)系型數(shù)據(jù)庫中的地質(zhì)體屬性類(GeobodyProperty)一對一關(guān)聯(lián)?;贕eoSciML標(biāo)準(zhǔn),通過地質(zhì)要素類屬性、新增屬性、地質(zhì)體屬性類中的字段配置,可生成并發(fā)布成WFS格式的新要素。地質(zhì)體屬性類還可與地質(zhì)時(shí)代(Geobody_Era)、地質(zhì)體資源(Geobody_URI)等關(guān)聯(lián)。發(fā)布的吉林省地質(zhì)體面要素(Jilin_Geobody_R)、北京市地質(zhì)界線(Beijing_Geoline_L)可顯示在WebGIS應(yīng)用中顯示或參與計(jì)算。
表1 GeoSciML術(shù)語分類列表(按字母順序排列)Table1 GeoSciML Vocabularies(In alphabetical order)
表2 EarthResourceML術(shù)語分類列表(按字母順序排列)Table 2 EarthResourceML Vocabularies(In alphabetical order)
采礦權(quán)是礦業(yè)權(quán)(探礦權(quán)、采礦權(quán))的一個(gè)最重要的組成部分。它可進(jìn)行地上、地下、地上/地下開采,與采礦活動(dòng)非常密切,覆蓋從礦山設(shè)計(jì)、礦石采掘到運(yùn)輸、礦業(yè)產(chǎn)品生產(chǎn)等全過程。在地學(xué)空間數(shù)據(jù)管理中,具有很多空間數(shù)據(jù)、屬性數(shù)據(jù),甚至其他結(jié)構(gòu)化和非常結(jié)構(gòu)化數(shù)據(jù)。在數(shù)據(jù)共享與應(yīng)用中,主要有采礦權(quán)空間范圍(采礦權(quán)要素)、屬性數(shù)據(jù)等。屬性數(shù)據(jù)一般保存在其他關(guān)系型屬性表內(nèi)(如礦床狀態(tài)、采礦活動(dòng)、儲(chǔ)量等),而通用的礦種、開采方法等數(shù)據(jù)以字典形式保存。圖15用UML圖展示了采礦權(quán)的動(dòng)態(tài)映射模型。采礦權(quán)要素(MiningRightsFeature)繼承自EarthResourceML的采掘要素(MiningFeature),它與采礦權(quán)屬性(MiningRightsProperty)一對一關(guān)聯(lián),采礦權(quán)屬性與項(xiàng)目類型(ProjectType)、礦種(Mineral)、開采方法(MiningRightsMethod)等具有一對多的關(guān)聯(lián)關(guān)系。通過模式匹配和設(shè)置后,可在地圖服務(wù)器上發(fā)布WFS格式的采礦權(quán)要素?cái)?shù)據(jù)服務(wù)(MiningRightsFeatureWFS)。
圖14 基于GeoSciML的地質(zhì)體應(yīng)用模式圖Fig.14 Application diagram for geobody based on GeoSciML
圖15 采礦權(quán)映射圖Fig. 15 Generalization diagram for MiningRights
CGI-IUGS在國際地學(xué)信息領(lǐng)域開展了重要和權(quán)威的數(shù)據(jù)標(biāo)準(zhǔn)研建與推廣工作,取得了顯著的應(yīng)用成效。CGI國際標(biāo)準(zhǔn)GeoSciML、EarthResourceML等采用了面向?qū)ο蟮撵`活可擴(kuò)展表達(dá)方式,所有類均可縱向、橫向的無限制自由擴(kuò)展,以滿足不同領(lǐng)域、不同層次、不同角度的需求。目前已在OneGeology、INSPIRE、USGIN、AuScope計(jì)劃等重大國際地學(xué)數(shù)據(jù)共享中得到廣泛應(yīng)用,重點(diǎn)解決了不同國家多元異構(gòu)數(shù)據(jù)的共享與語義融合問題。原始數(shù)據(jù)基于GeoSciML、EarthResourceML等發(fā)布成WFS、WMS地圖服務(wù),以滿足同一語義框架下的地圖可視化、數(shù)據(jù)集成與共享。
CGI標(biāo)準(zhǔn)能實(shí)現(xiàn)簡單要素、復(fù)雜要素的各類地學(xué)數(shù)據(jù),以及復(fù)雜關(guān)系的對象集合應(yīng)用;基于GeoSciML按需進(jìn)行數(shù)據(jù)交換模型的靈活擴(kuò)展,設(shè)計(jì)并映射成開放的信息模型,有利于后續(xù)諸多地學(xué)信息領(lǐng)域的重用。
我國地學(xué)相關(guān)領(lǐng)域當(dāng)前及未來的地質(zhì)大數(shù)據(jù)資源建設(shè)(如地質(zhì)云、DDE等)(Zhang et al., 2017;http://ddeworld.org),尤其涉及國際化及多行業(yè)部門之間數(shù)據(jù)交換的應(yīng)用,可重點(diǎn)借鑒或參考CGI標(biāo)準(zhǔn) (Zhang et al.,2019);對已有數(shù)據(jù)盡量采用該國際標(biāo)準(zhǔn)進(jìn)行轉(zhuǎn)換應(yīng)用,以達(dá)到統(tǒng)一標(biāo)準(zhǔn)和國際化應(yīng)用目的。
GeoSciML的擴(kuò)展特性確實(shí)為靈活設(shè)計(jì)數(shù)據(jù)模型帶來了好處,但生成的大量XML格式數(shù)據(jù)對網(wǎng)絡(luò)傳輸與用戶體驗(yàn)造成一定影響,建議盡量采用GeoJSON格式數(shù)據(jù)。同時(shí),在應(yīng)用國際地學(xué)標(biāo)準(zhǔn)時(shí),要深入把握需求及標(biāo)準(zhǔn)的適用性。