劉 煒
1. 中國(guó)地質(zhì)圖書(shū)館,北京 100083;
2. 自然資源綜合調(diào)查指揮中心, 北京 100055
科學(xué)數(shù)據(jù)是國(guó)家重要戰(zhàn)略資源,數(shù)據(jù)共享是這種資源有效開(kāi)發(fā)利用的手段之一,也是當(dāng)今科學(xué)研究范式向數(shù)據(jù)密集型轉(zhuǎn)變的重要基礎(chǔ)?,F(xiàn)代化的勘查方法、勘探裝備和信息技術(shù)的融合發(fā)展使得勘查研究和生產(chǎn)過(guò)程中產(chǎn)生的數(shù)據(jù)表現(xiàn)出新的特點(diǎn),即多結(jié)構(gòu)、大規(guī)模與高速性,特別是多結(jié)構(gòu)數(shù)據(jù)的大量產(chǎn)生使得地質(zhì)調(diào)查勘探從“海量數(shù)據(jù)(Massive Data)”時(shí)代急速推向“大數(shù)據(jù)(Big Data)”時(shí)代,以大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算等前沿技術(shù)為依托,已發(fā)展形成“信息找礦”新理論的雛形,“地質(zhì)大數(shù)據(jù)”在成礦規(guī)律、成礦系列、礦產(chǎn)預(yù)測(cè)等方面研究工作中的應(yīng)用已逐漸顯現(xiàn)優(yōu)勢(shì)(王登紅等,2015)。
以美國(guó)為首的世界上各主要發(fā)達(dá)國(guó)家,較早認(rèn)識(shí)到了這個(gè)問(wèn)題,大多采用政府承擔(dān)或?yàn)槭椎男问?,在多種公共領(lǐng)域內(nèi)推行大數(shù)據(jù)規(guī)劃及管理,同時(shí)也鼓勵(lì)企業(yè)的加入。如美國(guó)在2012年3月推出《大數(shù)據(jù)研究和發(fā)展計(jì)劃(Big Data Research and Development Initiative)》(http://www. whitehouse.gov,2020),涉及美國(guó)國(guó)家科學(xué)基金會(huì)、國(guó)家衛(wèi)生研究院、國(guó)防部、能源部、國(guó)防部高級(jí)研究局、美國(guó)地質(zhì)調(diào)查局(United States Geological Survey,USGS)六大部門(mén),形成包含數(shù)學(xué)、統(tǒng)計(jì)基礎(chǔ)和計(jì)算機(jī)算法的專(zhuān)門(mén)學(xué)科。在該計(jì)劃發(fā)布以后,美國(guó)多部門(mén)啟動(dòng)了82個(gè)大數(shù)據(jù)相關(guān)項(xiàng)目,涵蓋國(guó)防、國(guó)家安全等多個(gè)方面,包括USGS開(kāi)展的能源、地質(zhì)勘查等地質(zhì)科學(xué)領(lǐng)域的大數(shù)據(jù)項(xiàng)目。USGS公布的大多數(shù)研究項(xiàng)目重視數(shù)據(jù)工程應(yīng)用而不是數(shù)據(jù)科學(xué)方法的研究,主要重視大數(shù)據(jù)分析算法和系統(tǒng)效率的提高方面。USGS隨后在6月發(fā)布《美國(guó)地質(zhì)調(diào)查局核心科學(xué)體系科學(xué)戰(zhàn)略(Science Strategy for Core Science Systems in the U.S. Geological Survey)2013-2023》(https://pubs.er. usgs.gov, 2012),作為十年內(nèi)核心科學(xué)研究的綱領(lǐng)。
歐盟在大數(shù)據(jù)方面的活動(dòng)主要涉及四個(gè)方面的內(nèi)容:研究數(shù)據(jù)價(jià)值鏈戰(zhàn)略因素、資助“大數(shù)據(jù)”和“開(kāi)放數(shù)據(jù)”領(lǐng)域的研究和創(chuàng)新活動(dòng)、實(shí)施開(kāi)放數(shù)據(jù)政策、促進(jìn)公共資助科研試驗(yàn)成果和數(shù)據(jù)的使用及再利用。2014年起歐盟執(zhí)行了一項(xiàng)最大的科研資助計(jì)劃《地平線(xiàn)2020(Horizon 2020)》(https:// ec.europa.eu,2020),連續(xù)七年支持開(kāi)放數(shù)據(jù)戰(zhàn)略的實(shí)施。歐盟同時(shí)在數(shù)據(jù)基礎(chǔ)設(shè)施發(fā)展戰(zhàn)略方面也做了大量工作,歐盟空間信息基礎(chǔ)建設(shè)(Infrastructure for Spatial Information in the European Community)(http://www.eugris. info, 2019)就是歐洲地學(xué)信息基礎(chǔ)設(shè)施建設(shè)和服務(wù)的一個(gè)代表。
2013年10月底,英國(guó)發(fā)布《把握數(shù)據(jù)帶來(lái)的機(jī)遇:英國(guó)數(shù)據(jù)能力戰(zhàn)略》(https:// www.gov.uk,2013),重在體現(xiàn)對(duì)高校、研究機(jī)構(gòu)的資金扶持和合作平臺(tái)搭建。同時(shí)英國(guó)從《Horizon 2020》中獲得最大的受益,并于2017年開(kāi)放交通運(yùn)輸、天氣和健康方面的核心公共數(shù)據(jù)庫(kù),在接下來(lái)的五年內(nèi)建立開(kāi)放數(shù)據(jù)研究所。英國(guó)研究理事會(huì)將建立一個(gè)公眾可以通過(guò)網(wǎng)絡(luò)檢索查詢(xún)的科研門(mén)戶(hù)網(wǎng)站。2019年6月,英國(guó)政府發(fā)布最新年度計(jì)劃——《交付計(jì)劃(the Delivery Plan)2019》,強(qiáng)調(diào)研發(fā)是成功實(shí)現(xiàn)英國(guó)《產(chǎn)業(yè)戰(zhàn)略》目標(biāo)的關(guān)鍵,該戰(zhàn)略旨在使英國(guó)在應(yīng)對(duì)全球共同面臨的人工智能和大數(shù)據(jù)等四大挑戰(zhàn)時(shí),保持未來(lái)產(chǎn)業(yè)的領(lǐng)先發(fā)展。英國(guó)政府將研發(fā)定位于產(chǎn)業(yè)戰(zhàn)略的核心,承諾到2021年—2022年再增加70億歐元,到2027年將研發(fā)總投資增加到GDP的2.4%(https://tech.sina.com.cn, 2019)。
2012年,法國(guó)發(fā)布《數(shù)字化路線(xiàn)圖(the Digital Road Map)》,表示將大力支持大數(shù)據(jù)在內(nèi)的戰(zhàn)略性高新技術(shù),法國(guó)政府以培養(yǎng)新興企業(yè)、軟件開(kāi)發(fā)、信息系統(tǒng)設(shè)計(jì)等為目標(biāo),開(kāi)展一系列投資計(jì)劃,促進(jìn)大數(shù)據(jù)領(lǐng)域的發(fā)展。2012年10月,澳大利亞政府發(fā)布《澳大利亞公共服務(wù)信息與通信技術(shù)戰(zhàn)略(Australian Public Service In formation and Communication Technology Strategy)2012-2015》(https://trove. nla.gov.au, 2012),強(qiáng)調(diào)應(yīng)增強(qiáng)政府機(jī)構(gòu)的數(shù)據(jù)分析能力,從而促進(jìn)更好的服務(wù)傳遞和更科學(xué)的政策制定,并將制定一份大數(shù)據(jù)戰(zhàn)略確定為戰(zhàn)略執(zhí)行計(jì)劃之一。2013年2月,澳大利亞政府信息管理辦公室(the Australian Government Information Mana-gement Office,AGIMO)成立了跨部門(mén)工作組——“大數(shù)據(jù)工作組”,啟動(dòng)了《公共服務(wù)大數(shù)據(jù)戰(zhàn)略(the Australian Public Service Big Data Strategy)》(https:// docplayer.net,2020)制定工作,并于2013年8月正式對(duì)外發(fā)布。澳大利亞地質(zhì)調(diào)查局( Australian Geological Survey Organi-zation,AGSO)數(shù)據(jù)戰(zhàn)略計(jì)劃(2018~2021)目標(biāo)為:數(shù)據(jù)潛力最大化,提供開(kāi)放數(shù)據(jù),提供可獲取、可檢索、可重用、可控、可信的數(shù)據(jù)。此計(jì)劃可分為三個(gè)主要戰(zhàn)略重點(diǎn)領(lǐng)域:信息和通信技術(shù)、數(shù)據(jù)保管以及數(shù)據(jù)管理。AGSO已經(jīng)開(kāi)始著手實(shí)施數(shù)據(jù)戰(zhàn)略計(jì)劃中數(shù)據(jù)管理領(lǐng)域的一些重要構(gòu)建模塊的實(shí)現(xiàn)。
日本啟動(dòng)“創(chuàng)建最尖端IT國(guó)家計(jì)劃”,2013~2020以開(kāi)放公共數(shù)據(jù)和大數(shù)據(jù)為核心,應(yīng)對(duì)抗災(zāi)救災(zāi)和核電站事故等社會(huì)性問(wèn)題。加拿大自然資源地質(zhì)科學(xué)部(Natural Resources Canada,NRCan)開(kāi)展并實(shí)施了“能源和礦產(chǎn)資源填圖計(jì)劃(Geomapping for Energy and Minerals,GEM)”(http://publiccations.gc.ca, 2020)。
資源建設(shè)和開(kāi)放準(zhǔn)入是世界各國(guó)政府大數(shù)據(jù)建設(shè)和管理的核心原則,各國(guó)的國(guó)家級(jí)架構(gòu)有:國(guó)際數(shù)據(jù)共享計(jì)劃——如美國(guó)地球科學(xué)信息網(wǎng)絡(luò)(The United States Geological Information Net,USGIN);歐洲聯(lián)盟(歐盟)環(huán)境信息空間數(shù)據(jù)基礎(chǔ)設(shè)施;澳大利亞合作項(xiàng)目——如澳大利亞國(guó)家數(shù)據(jù)服務(wù)、國(guó)家計(jì)劃,等等。
隨著這一系列的大數(shù)據(jù)規(guī)劃及管理計(jì)劃的推行頒布,各國(guó)在地質(zhì)科學(xué)數(shù)據(jù)驅(qū)動(dòng)地質(zhì)科學(xué)研究上有著長(zhǎng)足的發(fā)展,產(chǎn)生的大數(shù)據(jù)在其各自地調(diào)機(jī)構(gòu)發(fā)布或牽頭的項(xiàng)目所屬的數(shù)據(jù)庫(kù)中有著規(guī)范的組織和存儲(chǔ)。如美國(guó)地質(zhì)調(diào)查局(USGS)的礦產(chǎn)資源在線(xiàn)空間數(shù)據(jù)平臺(tái)(Mineral Resources Online Spatial Data,MRData)和美國(guó)國(guó)家物候網(wǎng)(USA National Phenology Network,NPN)是USGS當(dāng)前重要的大數(shù)據(jù)應(yīng)用平臺(tái)之一,前者是礦產(chǎn)資源數(shù)據(jù)管理工具,后者在全美物候觀測(cè)研究中起著重要的作用。英國(guó)地質(zhì)調(diào)查局(British Geological Survey,BGS)的開(kāi)放地學(xué)(OpenGeoscience)計(jì)劃是數(shù)據(jù)庫(kù)類(lèi)服務(wù)平臺(tái),提出了一個(gè)全球性的地學(xué)數(shù)據(jù)倉(cāng)庫(kù)概念,通過(guò)此平臺(tái)達(dá)到地質(zhì)信息共享的目的。澳大利亞地質(zhì)調(diào)查局(AGSO)在大數(shù)據(jù)管理方面出臺(tái)了一些國(guó)家層面上的政策,如數(shù)據(jù)戰(zhàn)略計(jì)劃、2020數(shù)字連續(xù)性政策等,澳大利亞海洋空間信息系統(tǒng)、澳大利亞地層單位數(shù)據(jù)庫(kù)等是其具體應(yīng)用。加拿大自然資源地質(zhì)科學(xué)部(NRCan)的國(guó)家能源利用數(shù)據(jù)庫(kù)、NRCan地質(zhì)圖像掃描數(shù)據(jù)庫(kù)等是在加拿大政府開(kāi)放數(shù)據(jù)項(xiàng)目(Government of Canada-Open Data)下的數(shù)據(jù)庫(kù)。
美國(guó)、英國(guó)、澳大利亞、加拿大等發(fā)達(dá)國(guó)家的地質(zhì)調(diào)查機(jī)構(gòu),一向重視提升地質(zhì)調(diào)查在促進(jìn)經(jīng)濟(jì)發(fā)展和社會(huì)變革、解決重大地球科學(xué)問(wèn)題等方面的重要作用(唐金榮等,2011),當(dāng)前更是把大數(shù)據(jù)應(yīng)用能力提升作為新的發(fā)展機(jī)遇,積極推動(dòng)地質(zhì)調(diào)查實(shí)現(xiàn)更高水平的創(chuàng)新和發(fā)展(鄭人瑞等,2019)。近年來(lái),世界各主要發(fā)達(dá)國(guó)家的地質(zhì)大數(shù)據(jù)管理有了新的進(jìn)展,其主要表現(xiàn)集中于以下幾個(gè)方面:(1)數(shù)據(jù)管理范圍的擴(kuò)大,如USGS職責(zé)范圍增加了核心科學(xué)體系作為第七個(gè)也是最重要的一個(gè)方面;(2)數(shù)據(jù)管理計(jì)劃等紛紛出臺(tái),如BGS的開(kāi)放數(shù)據(jù)計(jì)劃—開(kāi)放地學(xué)計(jì)劃致力于更大范圍內(nèi)提升地質(zhì)信息共享,USGS的科學(xué)數(shù)據(jù)目錄定義標(biāo)準(zhǔn)化數(shù)據(jù),可在多應(yīng)用領(lǐng)域內(nèi)實(shí)現(xiàn)數(shù)據(jù)解析和分析;(3)地學(xué)領(lǐng)域數(shù)據(jù)管理工具和數(shù)據(jù)庫(kù)在各國(guó)都得到了極大的發(fā)展,等等。圍繞這幾個(gè)方面,本文對(duì)美、英、澳、加四國(guó)地調(diào)機(jī)構(gòu)在大數(shù)據(jù)管理方面的現(xiàn)狀進(jìn)行了介紹與分析,以期對(duì)中國(guó)地調(diào)機(jī)構(gòu)在大數(shù)據(jù)管理工作方面的發(fā)展提供借鑒與啟示。
USGS于1879年通過(guò)美國(guó)國(guó)會(huì)法案創(chuàng)建,在隨后的140年中將人才、知識(shí)與科學(xué)技術(shù)進(jìn)步相結(jié)合,不斷發(fā)展。USGS是美國(guó)內(nèi)政部的唯一科學(xué)機(jī)構(gòu),提供專(zhuān)業(yè)的自然科學(xué)知識(shí)和廣泛的地球生物數(shù)據(jù)資源,主要職責(zé)包括地下水、生態(tài)系統(tǒng)、環(huán)境資源、自然災(zāi)害、氣候和土地利用變化、核心科學(xué)體系等七個(gè)方面,包括兩個(gè)交叉的學(xué)科方向:數(shù)據(jù)集成和新技術(shù)的發(fā)展,涌現(xiàn)很多研究成果。
2.1.1 USGS數(shù)據(jù)管理范圍
USGS對(duì)其支持和產(chǎn)生的所有科研及計(jì)劃項(xiàng)目的數(shù)據(jù)擁有主權(quán)并行使管理權(quán),這些科研范圍包括生物學(xué)與生態(tài)系統(tǒng)、國(guó)土資源、海岸、能源、環(huán)境、地質(zhì)、測(cè)繪等多個(gè)方面(表1),基于數(shù)據(jù)開(kāi)放戰(zhàn)略,它們的進(jìn)展以出版物、地圖、軟件、新聞、圖像、視頻、多媒體等形式提供公開(kāi)檢索。
表1 USGS數(shù)據(jù)管理范圍表Table 1 USGS data management scope
2.1.2 USGS科學(xué)數(shù)據(jù)目錄
USGS采用標(biāo)準(zhǔn)化數(shù)據(jù),這些數(shù)據(jù)可以直接導(dǎo)入相應(yīng)的軟件進(jìn)行應(yīng)用及分析,用于需要進(jìn)行大數(shù)據(jù)收集處理的科學(xué)、工程或商業(yè)環(huán)境中。USGS收集的數(shù)據(jù)和使用的技術(shù)應(yīng)符合或參考國(guó)家和國(guó)際標(biāo)準(zhǔn)及協(xié)議。對(duì)于給定類(lèi)型的數(shù)據(jù)集,如果存在國(guó)家或國(guó)際元數(shù)據(jù)標(biāo)準(zhǔn),則使用元數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行索引,以便于訪問(wèn)和集成。
USGS采用的SDC(Science Data Catalog)工具,由SAS(STATISTICAL ANALYSIS SYSTEM私營(yíng)公司)和ORNL(Oak Ridge National Laboratory,橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室)合作開(kāi)發(fā),對(duì)公眾開(kāi)放(表2),通過(guò)基于文本、關(guān)鍵字、任務(wù)區(qū)域、數(shù)據(jù)源和科學(xué)家方面的搜索以及基于GIS的搜索機(jī)制發(fā)現(xiàn)公共USGS數(shù)據(jù)集。
表2 SDC所含部分開(kāi)放數(shù)據(jù)Table 2 Some open data contained in SDC
2.1.3 數(shù)據(jù)管理工具
數(shù)據(jù)管理工具:良好的數(shù)據(jù)管理能夠使數(shù)據(jù)的定位、共享和重用變得容易,并能減少數(shù)據(jù)冗余,有效減少了時(shí)間和經(jīng)濟(jì)方面的成本,還可以幫助滿(mǎn)足開(kāi)放式數(shù)據(jù)需求,使數(shù)據(jù)更易于訪問(wèn)和發(fā)現(xiàn)。近兩年發(fā)布的工具如表3所示。
表3 USGS發(fā)布數(shù)據(jù)管理工具(部分)Table 3 USGS release data management tool (part)
2.1.4 USGS數(shù)據(jù)庫(kù)
USGS資助建立的數(shù)據(jù)庫(kù)有多個(gè),范圍涵蓋廣泛,部分?jǐn)?shù)據(jù)庫(kù)如表4所示。
表4 USGS數(shù)據(jù)庫(kù)(部分)Table 4 USGS database (part)
BGS前身是成立于1835年的地質(zhì)軍械調(diào)查所,側(cè)重于政府的公益科學(xué),進(jìn)行地球和環(huán)境過(guò)程的研究,它是英國(guó)首屈一指的權(quán)威地球科學(xué)數(shù)據(jù)、信息和知識(shí)的提供者,范圍包括管理自然資源的合理開(kāi)發(fā)和利用、管理環(huán)境變化以及抵御環(huán)境危害。擁有國(guó)家地球科學(xué)數(shù)據(jù)中心、國(guó)家地質(zhì)資源庫(kù)(NGR)、地球科學(xué)設(shè)施(NERC),為國(guó)家及公眾提供多種數(shù)據(jù)服務(wù)。
2.2.1 BGS數(shù)據(jù)管理范圍
BGS的研究范疇包括地球自然災(zāi)害、能源、工程地質(zhì)、地球分析建模、地質(zhì)學(xué)和區(qū)域地球物理學(xué)、地下水、海洋地球科學(xué)、礦物和廢棄物處理等,這些都屬于BGS的數(shù)據(jù)管理范圍(表5),產(chǎn)生的各種數(shù)據(jù)產(chǎn)品通常是在全國(guó)范圍內(nèi)開(kāi)發(fā)的,并且廣泛應(yīng)用于學(xué)術(shù)界、行業(yè)內(nèi)及購(gòu)房者和決策者在內(nèi)的最終用戶(hù),越來(lái)越多的數(shù)據(jù)可以查看下載。
表5 BGS數(shù)據(jù)管理范圍表Table 5 The BGS Data Management Scope
2.2.2 開(kāi)放數(shù)據(jù)計(jì)劃—開(kāi)放地學(xué)計(jì)劃
(OpenGeoscience)(http://www.bgs.ac. uk,2020)
BGS對(duì)數(shù)據(jù)管理十分看重,OpenGeoscience是數(shù)據(jù)庫(kù)類(lèi)服務(wù)平臺(tái),它是傳統(tǒng)的數(shù)據(jù)供給模型,與各種具有地學(xué)數(shù)據(jù)的組織建立合作伙伴關(guān)系,該計(jì)劃提出了一個(gè)全球性的地學(xué)數(shù)據(jù)倉(cāng)庫(kù)概念,通過(guò)該平臺(tái)達(dá)到地質(zhì)信息共享的目的,可以免費(fèi)查看地圖、應(yīng)用程序,下載數(shù)據(jù)、掃描、照片和其他信息。OpenGeoscience可用的主要服務(wù)包括:通過(guò)英國(guó)地質(zhì)地圖窗口和網(wǎng)絡(luò)地圖服務(wù)(Web Map Services,WMS)查看地表地質(zhì)數(shù)據(jù)、3D地質(zhì)模型、鉆孔掃描、地震時(shí)間表的瀏覽查看,能夠全方位地從地圖上查看數(shù)據(jù),最大比例尺為1:625 000;從GeoScenic地質(zhì)照片檔案庫(kù)中搜索和下載照片;查看BGS從1832年至2014年出版的紙質(zhì)地圖和1835年至今的部分出版物。OpenGeoscience免費(fèi)提供的主要信息內(nèi)容如表6所示。
AGSO的歷史可追溯到1946年,工作范疇包括幾個(gè)關(guān)鍵的戰(zhàn)略領(lǐng)域:礦產(chǎn)和能源資源、自然災(zāi)害防御、水資源、海洋陸地(延伸至澳大利亞管轄的海洋范圍)、環(huán)境可持續(xù)利用、基本地理信息、地球科學(xué)知識(shí)及能力等(孫海雪等,2018)。其職權(quán)范圍已超出了澳大利亞對(duì)資源開(kāi)發(fā)的歷史重點(diǎn),涵蓋了諸如海嘯和地震等自然災(zāi)害,包括氣候變化影響在內(nèi)的環(huán)境問(wèn)題,地下水研究,海洋和沿海研究,碳捕集與封存、植被等各種問(wèn)題,地質(zhì)信息覆蓋面廣,各類(lèi)信息所產(chǎn)生的海量數(shù)據(jù)結(jié)合大數(shù)據(jù)采集與獲取、存儲(chǔ)與管理、處理、信息提取、知識(shí)挖掘等技術(shù)最終以不同的產(chǎn)品服務(wù)于公眾。
2.3.1 AGSO數(shù)據(jù)管理范圍
AGSO的數(shù)據(jù)管理范圍包括能源、天文等多個(gè)方面(表7),相關(guān)的部分研究進(jìn)展及基于開(kāi)放戰(zhàn)略的數(shù)據(jù)等可以在AGSO的官方網(wǎng)站上獲得。
表7 AGSO數(shù)據(jù)管理范圍表Table 7 Scope of the AGSO Data Management
2.3.2 數(shù)據(jù)計(jì)劃
AGSO在大數(shù)據(jù)管理方面出臺(tái)了一些國(guó)家層面上的政策。
AGSO數(shù)據(jù)戰(zhàn)略計(jì)劃AGSO制定了2018~2021年數(shù)據(jù)戰(zhàn)略計(jì)劃,目標(biāo)是使數(shù)據(jù)潛力最大化,提供開(kāi)放的、可獲取、可檢索、可重用、可控、可信的數(shù)據(jù)。這里的數(shù)據(jù)定義為由AGSO獲取、創(chuàng)建及維護(hù)的結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù),包括離散數(shù)據(jù)、流式數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)。澳大利亞政府開(kāi)放數(shù)據(jù)地址為data.gov.au。
2020數(shù)字連續(xù)性政策(Digital Continuity 2020 Policy)2020數(shù)字連續(xù)性政策在支持澳大利亞政府的數(shù)字化轉(zhuǎn)型計(jì)劃和推動(dòng)電子政務(wù)方面發(fā)揮著關(guān)鍵作用,將信息治理原則和實(shí)踐整合到機(jī)構(gòu)的工作及治理安排中,以?xún)?yōu)化政府計(jì)劃和服務(wù)的交付,使信息重用于經(jīng)濟(jì)和社會(huì)利益,保護(hù)本國(guó)的權(quán)益。該政策使得澳大利亞政府內(nèi)部以及各個(gè)機(jī)構(gòu)內(nèi)部對(duì)信息管理采取一致的方法,適用于政府信息、數(shù)據(jù)、記錄、系統(tǒng)、服務(wù)和過(guò)程,由澳大利亞國(guó)家檔案館牽頭實(shí)施。
2.3.3 數(shù)據(jù)和出版物檢索(Data and Publi-cations Search)
數(shù)據(jù)與出版物查詢(xún)系統(tǒng)是AGSO研發(fā)的綜合性查詢(xún)系統(tǒng),包括AGSO發(fā)布的數(shù)據(jù)、出版物、在線(xiàn)工具、地圖和多媒體等的目錄,近期新發(fā)布的產(chǎn)品可以在新品發(fā)布服務(wù)系統(tǒng)中查詢(xún)。
數(shù)據(jù)庫(kù)/地圖集AGSO有多種數(shù)據(jù),包括澳大利亞礦業(yè)地圖集、澳大利亞地層單位數(shù)據(jù)庫(kù)、實(shí)時(shí)地磁數(shù)據(jù)、衛(wèi)星圖像、地震活動(dòng)等,部分?jǐn)?shù)據(jù)庫(kù)如表8所示。
表8 AGSO數(shù)據(jù)庫(kù)(部分)Table 8 AGSO Database (Part)
數(shù)據(jù)工具AGSO所使用的部分?jǐn)?shù)據(jù)工具如表9所示。
表9 AGSO數(shù)據(jù)工具(部分)Table 9 AGSO Data Tools (Part)
NRCan的歷史可追溯到1842年,隨著加拿大的發(fā)展,它的職權(quán)在許多政府機(jī)構(gòu)中被分割,直到1995年由現(xiàn)已解散的加拿大能源、礦產(chǎn)資源和林業(yè)部門(mén)合并而來(lái),是加拿大政府負(fù)責(zé)自然資源、能源、礦產(chǎn)和金屬、森林、地球科學(xué)、測(cè)繪和遙感的部門(mén)。
2.4.1 NRCan數(shù)據(jù)管理范圍
加拿大自然資源地質(zhì)科學(xué)部(NRCan)的科研活動(dòng)包括能源、礦產(chǎn)、森林、地球科學(xué)、災(zāi)害、氣候變化等范圍,產(chǎn)生的數(shù)據(jù)構(gòu)成了NRCan的主要數(shù)據(jù)管理范圍(表10)。
表10 NRCan數(shù)據(jù)管理范圍表Table 10 NRCan Data Management Scope
2.4.2 加拿大政府開(kāi)放數(shù)據(jù)項(xiàng)目
加拿大政府開(kāi)放數(shù)據(jù)項(xiàng)目(Government of Canada—Open Data)包括經(jīng)濟(jì)、健康、教育等各方面的政府公開(kāi)數(shù)據(jù)。用戶(hù)可以搜索與加拿大相關(guān)的超過(guò)80000個(gè)開(kāi)放的數(shù)據(jù)和信息資產(chǎn),了解如何使用數(shù)據(jù)集、瀏覽信息摘要并使用ATIP在線(xiàn)工具發(fā)出數(shù)據(jù)請(qǐng)求、查看加拿大全國(guó)范圍內(nèi)對(duì)開(kāi)放數(shù)據(jù)所做的工作??梢酝ㄟ^(guò)開(kāi)放數(shù)據(jù)門(mén)戶(hù)網(wǎng)站(open.canada.ca)檢索,也可以按主題瀏覽,涵蓋加拿大政府多個(gè)部門(mén),包括NRCan。加拿大政府制定的《2018~2020 國(guó)家行動(dòng)計(jì)劃》涵蓋了提高開(kāi)放數(shù)據(jù)獲取門(mén)戶(hù)上的可用開(kāi)放數(shù)據(jù)質(zhì)量的目標(biāo):(1)到2019年6月,制定并發(fā)布數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn);(2)到2020年6月,開(kāi)發(fā)完成新的數(shù)據(jù)質(zhì)量評(píng)估系統(tǒng)來(lái)補(bǔ)充當(dāng)前的“評(píng)估數(shù)據(jù)集”功能,并且該系統(tǒng)可在open.canada.ca上線(xiàn);(3)到2020年6月,審查完成200個(gè)常用數(shù)據(jù)集的數(shù)據(jù)質(zhì)量,提供標(biāo)準(zhǔn)化、完整的元數(shù)據(jù);(4)到2020年6月,使用NRCan的聯(lián)邦地理空間平臺(tái)(FGP)數(shù)據(jù)質(zhì)量評(píng)估標(biāo)準(zhǔn)審查500多個(gè)地理空間數(shù)據(jù)集。
2.4.3 數(shù)據(jù)庫(kù)
NRCan的部分?jǐn)?shù)據(jù)庫(kù)如表11所示。
表11 NRCan數(shù)據(jù)庫(kù)(部分)Table 11 NRCan Databases (part)
美、英、澳、加四國(guó)地調(diào)局的大數(shù)據(jù)管理的范圍(表12)就是他們各自的科研方向及政策、項(xiàng)目資助的傾斜方向。四國(guó)機(jī)構(gòu)雖然同屬地調(diào)機(jī)構(gòu),大部分涵蓋的管理范圍相同,但是也有著各自的特點(diǎn),如加拿大靠近北極,對(duì)地磁、極光、太空氣候等展開(kāi)研究,對(duì)新能源/再生能源非常重視,并且因?yàn)榫硟?nèi)有著廣大的森林,對(duì)森林的研究和數(shù)據(jù)管理也比較重視;英國(guó)作為島國(guó)對(duì)近海陸架等很關(guān)注,美、英、澳作為長(zhǎng)海岸線(xiàn)國(guó)家都對(duì)海洋的研究尤為關(guān)注,都作為地調(diào)局工作范圍的一部分;英國(guó)境內(nèi)多古堡,專(zhuān)門(mén)有石料數(shù)據(jù)管理,能精確地知道每一座古堡的石料數(shù)據(jù);美國(guó)的研究范圍最全面,等等。共性是四國(guó)的地調(diào)機(jī)構(gòu)的研究和數(shù)據(jù)管理范圍都不局限于傳統(tǒng)的地質(zhì)領(lǐng)域,而是向交叉領(lǐng)域擴(kuò)展。USGS將任務(wù)領(lǐng)域劃分為七個(gè)部分:核心科學(xué)體系、生態(tài)系統(tǒng)、能源礦產(chǎn)、環(huán)境衛(wèi)生、土地資源、自然災(zāi)害及水資源,比較完整地涵蓋了整個(gè)自能系統(tǒng)。
表12 四國(guó)地調(diào)數(shù)據(jù)管理大致范圍Table 12 General Scope of Data Management among the Four Countries’ Geological Surveys
在推進(jìn)數(shù)據(jù)管理及科學(xué)共享相關(guān)建設(shè)方面,歐美發(fā)達(dá)國(guó)家都有著較完善的科學(xué)數(shù)據(jù)共享法律體系和政策基礎(chǔ)。全局性、長(zhǎng)遠(yuǎn)性布局科學(xué)數(shù)據(jù)的共享已經(jīng)成為各國(guó)的共識(shí),各國(guó)地調(diào)局在根據(jù)本國(guó)實(shí)際制定相關(guān)政策后,在實(shí)踐過(guò)程中不斷修訂完善,趨于成熟,在科學(xué)數(shù)據(jù)類(lèi)型與標(biāo)準(zhǔn)、數(shù)據(jù)匯交、科學(xué)數(shù)據(jù)保存、數(shù)據(jù)共享利用、數(shù)據(jù)安全以及數(shù)據(jù)產(chǎn)權(quán)等方面提出了不同的規(guī)定和要求,同時(shí),在包括信息自由法、版權(quán)和知識(shí)產(chǎn)權(quán)、隱私法,以及規(guī)定信息服務(wù)的對(duì)象、內(nèi)容、定價(jià)、信息發(fā)布、客戶(hù)關(guān)系及服務(wù)質(zhì)量等方面也或多或少制定了相應(yīng)的政策。這些政策的大致關(guān)注點(diǎn)可以劃分為以下幾類(lèi)(表13)。
表13 四國(guó)地調(diào)數(shù)據(jù)管理政策大致關(guān)注點(diǎn)Table 13 General Concerns of Data Management Policies of the Four Countries’ Geological Survey
數(shù)據(jù)已經(jīng)成為各國(guó)發(fā)展與創(chuàng)新科技的重點(diǎn),對(duì)數(shù)據(jù)的整合、管理、共享具有重要的意義,各國(guó)地調(diào)機(jī)構(gòu)對(duì)數(shù)據(jù)的管理和應(yīng)用均提出了國(guó)家層面上的政策,如USGS的《USGS核心科學(xué)體系科學(xué)戰(zhàn)略(2013~2023)》,關(guān)鍵要素就是通過(guò)信息學(xué)和計(jì)算機(jī)技術(shù)實(shí)現(xiàn)數(shù)據(jù)信息的管理和存檔,促進(jìn)交叉學(xué)科的發(fā)展,以解決復(fù)雜的科學(xué)和社會(huì)問(wèn)題。BGS 的開(kāi)放數(shù)據(jù)計(jì)劃(OpenGeoscience)提出一個(gè)全球性的地學(xué)數(shù)據(jù)倉(cāng)庫(kù)概念,與世界上其他國(guó)家地學(xué)機(jī)構(gòu)聯(lián)合,達(dá)到地質(zhì)信息共享的目的。AGSO的地球科學(xué)數(shù)據(jù)管理構(gòu)建的三個(gè)主要戰(zhàn)略重點(diǎn)領(lǐng)域包含了數(shù)據(jù)保存和數(shù)據(jù)管理??v觀這些國(guó)家的數(shù)據(jù)戰(zhàn)略,既有相同點(diǎn)又有相異點(diǎn)(表14)。
表14 各國(guó)地調(diào)數(shù)據(jù)管理政策異同點(diǎn)比較Table 14 Comparison of the Similarities and Differences of Data Management Policies in Different Countries
從美、英、澳、加四國(guó)地調(diào)局?jǐn)?shù)據(jù)管理的范圍可以看出其內(nèi)容非常豐富,涉及的領(lǐng)域眾多,這也決定了數(shù)據(jù)庫(kù)的種類(lèi)眾多、不同數(shù)據(jù)庫(kù)差異較大、且所應(yīng)用的數(shù)據(jù)管理工具多種多樣。同時(shí)各國(guó)地理位置及自然情況不同,側(cè)重及關(guān)注點(diǎn)也是有所差別,但是差異中又存在一些共性,這些共性構(gòu)成了各國(guó)地調(diào)局覆蓋關(guān)注點(diǎn)范圍,代表著國(guó)際上相關(guān)領(lǐng)域的研究方向。
3.3.1 政府開(kāi)放基礎(chǔ)類(lèi)數(shù)據(jù)庫(kù)面向公眾,促進(jìn)數(shù)據(jù)信息共享
本文搜集了四國(guó)地調(diào)局的部分?jǐn)?shù)據(jù)庫(kù),其中關(guān)于地圖類(lèi)、地球物理/地球化學(xué)、能源類(lèi)等的數(shù)據(jù)庫(kù)是所有國(guó)家共有的且都提供查看服務(wù),比如美國(guó)國(guó)家地質(zhì)地圖數(shù)據(jù)庫(kù);BGS提供地質(zhì)類(lèi)、災(zāi)害類(lèi)、地下水類(lèi)、地球化學(xué)類(lèi)、地球物理類(lèi)、能源類(lèi)等多種細(xì)分地圖供查看和下載;澳大利亞的國(guó)家地圖、礦業(yè)地圖集、地形圖索引、交互地圖、地球物理地圖、飛行線(xiàn)圖庫(kù)等;加拿大的地圖系列包含湖河冰川水文圖、加拿大行政邊界圖、大陸高程圖、地名數(shù)據(jù)庫(kù)、地形數(shù)據(jù)圖、人為建筑地圖、自然景觀地圖、礦石、能源、通訊網(wǎng)絡(luò)地圖等。數(shù)據(jù)庫(kù)可以在各國(guó)地調(diào)局網(wǎng)站或其鏈接上進(jìn)行查看,部分提供下載,BGS的OpenGeoscience提供全面的檢索服務(wù),NRCan可鏈接到加拿大政府開(kāi)放數(shù)據(jù)項(xiàng)目,這里不僅提供NRCan的數(shù)據(jù)庫(kù),還提供經(jīng)濟(jì)、健康、教育等各方面的政府公開(kāi)數(shù)據(jù)。
3.3.2 政府資助多種科研項(xiàng)目,開(kāi)放數(shù)據(jù)管理類(lèi)工具
各國(guó)政府資助的多種科研項(xiàng)目產(chǎn)生豐富的成果,并提供一些數(shù)據(jù)管理類(lèi)工具供下載使用。如USGS整合了全美地區(qū)的最新研究成果,不定期發(fā)布階段性成果,包括一些數(shù)據(jù)管理類(lèi)的工具,2018年可檢索到RSQA等8個(gè),2019年截至9月份檢索到5個(gè)。BGS的Groundhog Desktop用于顯示地質(zhì)和地理空間信息,澳大利亞的AUSPOS是在線(xiàn)GPS數(shù)據(jù)處理工具,EarthSci數(shù)字地球儀能夠可視化3D地球科學(xué)數(shù)據(jù),查看大多數(shù)標(biāo)準(zhǔn)的GIS柵格和矢量格式等。這些工具的開(kāi)放不僅能使公眾了解到相關(guān)領(lǐng)域最新進(jìn)展,還能下載和使用部分工具,上傳自己的數(shù)據(jù),從而豐富相關(guān)數(shù)據(jù)庫(kù)、減少重復(fù)工作、促進(jìn)研究進(jìn)展。
中國(guó)大數(shù)據(jù)管理雖然起步較晚,但是近年來(lái)國(guó)家給予了足夠的重視,作為國(guó)家戰(zhàn)略,從政策層面出臺(tái)了一系列的規(guī)劃。2015年十八屆五中全會(huì)公報(bào)提出要實(shí)施“國(guó)家大數(shù)據(jù)戰(zhàn)略”。2017年出臺(tái)的《十三五國(guó)家科技創(chuàng)新基地專(zhuān)項(xiàng)規(guī)劃》上,提出要結(jié)合國(guó)家大數(shù)據(jù)戰(zhàn)略的實(shí)施,加強(qiáng)科學(xué)數(shù)據(jù)庫(kù)建設(shè),強(qiáng)化科學(xué)數(shù)據(jù)的匯集、更新和深度挖掘,形成一批有國(guó)際影響力的國(guó)家科學(xué)數(shù)據(jù)中心,為國(guó)家重大戰(zhàn)略需求提供科學(xué)數(shù)據(jù)支撐服務(wù)。當(dāng)年,工信部還出臺(tái)了《促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016~2020年)》。2020年十九屆五中全會(huì)指出要加快數(shù)字化發(fā)展。
在這樣的背景下,為了消除數(shù)字鴻溝,整合共享地學(xué)數(shù)據(jù)資源,中國(guó)地質(zhì)調(diào)查局建設(shè)了“地質(zhì)云”平臺(tái),以實(shí)現(xiàn)地質(zhì)調(diào)查信息高效共享和精準(zhǔn)服務(wù),實(shí)現(xiàn)地質(zhì)調(diào)查主流程信息化和智能化工作模式,實(shí)現(xiàn)地質(zhì)調(diào)查管理業(yè)務(wù)一體化和協(xié)同化,支撐國(guó)內(nèi)外地學(xué)科研信息交流與多方協(xié)同。目前,地質(zhì)云2.0已經(jīng)上線(xiàn)并經(jīng)歷了穩(wěn)定運(yùn)行,2020年圍繞調(diào)查(科研)、管理、共享、服務(wù)不同類(lèi)型的用戶(hù)需求,以地質(zhì)大數(shù)據(jù)中心建設(shè)為核心,以地質(zhì)調(diào)查“在線(xiàn)化”、“智能化”為目標(biāo),三位一體推進(jìn)地質(zhì)云、大數(shù)據(jù)與智能化建設(shè),目前地質(zhì)云3.0正在抓緊建設(shè)中。
地質(zhì)云2.0已建成覆蓋局屬29家單位、9個(gè)行業(yè)地勘單位和院校的分布式節(jié)點(diǎn)體系,包括 20個(gè)物理節(jié)點(diǎn),19個(gè)虛擬節(jié)點(diǎn),其信息技術(shù)框架實(shí)現(xiàn)了用戶(hù)權(quán)限、云上數(shù)據(jù)、應(yīng)用、軟件的集成、統(tǒng)一調(diào)度、統(tǒng)一服務(wù)等內(nèi)容。業(yè)務(wù)范圍分為地質(zhì)調(diào)查、自然資源調(diào)查、業(yè)務(wù)管理和戰(zhàn)略研究幾大類(lèi),包括基礎(chǔ)地質(zhì)與區(qū)域地質(zhì)數(shù)據(jù)庫(kù)、礦產(chǎn)地質(zhì)數(shù)據(jù)庫(kù)、能源地質(zhì)調(diào)查數(shù)據(jù)庫(kù)、地球化學(xué)數(shù)據(jù)庫(kù)、遙感地質(zhì)數(shù)據(jù)庫(kù)等12大類(lèi)數(shù)據(jù)庫(kù)(表15),已完成其中22個(gè),基本完成23個(gè),建設(shè)中25個(gè),規(guī)劃中14個(gè)。地質(zhì)調(diào)查方面已經(jīng)幾乎覆蓋了所有能上云的數(shù)據(jù),自然資源調(diào)查方面也取得了可喜的進(jìn)展。
表15 地質(zhì)云數(shù)據(jù)庫(kù)(部分)Table 15 GeoCloud Database(Part)
本文對(duì)美、英、澳、加四國(guó)地質(zhì)調(diào)查局的數(shù)據(jù)管理工作做了調(diào)查,從數(shù)據(jù)管理范圍、數(shù)據(jù)政策、戰(zhàn)略計(jì)劃、部分?jǐn)?shù)據(jù)庫(kù)及數(shù)據(jù)工具等方面進(jìn)行了介紹并作了分析,同時(shí)對(duì)中國(guó)地質(zhì)調(diào)查局的數(shù)據(jù)管理工作的最新進(jìn)展做了介紹,從中得出一些啟示。首先,各國(guó)均認(rèn)識(shí)到大數(shù)據(jù)的核心價(jià)值,開(kāi)發(fā)程度較高,以美國(guó)為最高、英國(guó)次之,澳、加緊隨其后,中國(guó)尚遜一籌。其次,各國(guó)出臺(tái)的數(shù)據(jù)管理政策深淺不一,有的頒布了針對(duì)地調(diào)領(lǐng)域的政策,有的沒(méi)有,中國(guó)在這方面還需完善。第三,數(shù)據(jù)開(kāi)放融合是未來(lái)趨勢(shì),中國(guó)在這方面的開(kāi)放程度有待進(jìn)一步提高。第四,數(shù)據(jù)綜合服務(wù)開(kāi)放平臺(tái)的建設(shè)尚處于起步階段,和發(fā)達(dá)國(guó)家相比還具有較大的差距。最后,發(fā)達(dá)國(guó)家由于起步早、數(shù)據(jù)基礎(chǔ)深厚,在數(shù)據(jù)管理規(guī)則的制定上具有領(lǐng)先優(yōu)勢(shì),歐盟、非盟等以組織的形式也提出了符合各自利益的主張,中國(guó)需要采取措施進(jìn)一步提高國(guó)際話(huà)語(yǔ)權(quán)。綜合以上分析與啟示,對(duì)中國(guó)地質(zhì)調(diào)查行業(yè)數(shù)據(jù)管理工作方面提出幾點(diǎn)建議。
縱覽四國(guó)數(shù)據(jù)管理工作方面,可以發(fā)現(xiàn)都是由政府部門(mén)制定發(fā)布相關(guān)政策的,且具有國(guó)家牽頭、多部委聯(lián)動(dòng)制定、政策時(shí)間跨度大、深入程度深等特點(diǎn)。USGS更是建立核心科學(xué)體系,把七大任務(wù)都包括了進(jìn)來(lái),形成完整深刻的整個(gè)研究體系。這種建設(shè)方法要求必須采用頂層設(shè)計(jì)、向下逐層實(shí)施,再由底層向上執(zhí)行和反饋的方式,從而提供完善的科學(xué)數(shù)據(jù)共享法律體系和政策基礎(chǔ),便于全局性、長(zhǎng)遠(yuǎn)性布局科學(xué)數(shù)據(jù)。
四國(guó)都建立了各自的數(shù)據(jù)開(kāi)放平臺(tái),BGS更是走在了世界前列,提出了全球性的地學(xué)數(shù)據(jù)倉(cāng)庫(kù)概念,希望通過(guò)OpenGeo-science平臺(tái)達(dá)到地質(zhì)信息共享的目的。我國(guó)從2017年地質(zhì)云1.0版上線(xiàn)到2018年2.0版升級(jí),已經(jīng)在數(shù)據(jù)開(kāi)放共享方面做出了可喜的進(jìn)步,但是仍然和發(fā)達(dá)國(guó)家的開(kāi)放共享程度有著一定差距。哪些數(shù)據(jù)可以開(kāi)放、哪些數(shù)據(jù)需要逐步開(kāi)放等需要制定一個(gè)行之有效的計(jì)劃,以推進(jìn)相關(guān)方面工作的進(jìn)展。
地質(zhì)云的建設(shè)任重而道遠(yuǎn),目前在服務(wù)窗口上存在著服務(wù)針對(duì)性不強(qiáng)、易用性不足的弱點(diǎn);在內(nèi)容支撐上,應(yīng)將目前以人工組織為主的形式向數(shù)據(jù)規(guī)范化管理、產(chǎn)品高效自動(dòng)發(fā)布的方向轉(zhuǎn)變;基礎(chǔ)設(shè)施建設(shè)上高性能計(jì)算能力還需進(jìn)一步提高;局部技術(shù)上,在內(nèi)容服務(wù)水平、數(shù)據(jù)技術(shù)、網(wǎng)絡(luò)安全技術(shù)等方面還有較大的提升空間;數(shù)據(jù)量上,應(yīng)該采取深挖細(xì)挖地質(zhì)調(diào)查大數(shù)據(jù),加速加深自然資源數(shù)據(jù)的獲取,并在未來(lái)將數(shù)據(jù)積累為主轉(zhuǎn)型為深挖關(guān)聯(lián),結(jié)合人工智能和云計(jì)算技術(shù),三位一體實(shí)現(xiàn)真正的大數(shù)據(jù)治理。
中國(guó)在“云計(jì)算”、“物聯(lián)網(wǎng)”、“大數(shù)據(jù)”等新興技術(shù)方面的研究已經(jīng)取得快速發(fā)展,大數(shù)據(jù)應(yīng)用領(lǐng)域正在走向世界前列。這些成果可以應(yīng)用在地質(zhì)調(diào)查行業(yè)數(shù)據(jù)基礎(chǔ)設(shè)施的建設(shè)中,開(kāi)發(fā)數(shù)據(jù)處理工具,拓展數(shù)據(jù)平臺(tái)的計(jì)算、分析、可視化處理和數(shù)據(jù)挖掘能力,加入國(guó)際數(shù)據(jù)治理、共享的平臺(tái),積極參與國(guó)際數(shù)據(jù)標(biāo)準(zhǔn)、技術(shù)規(guī)范的制定,通過(guò)參與國(guó)際治理爭(zhēng)取拿到更多的話(huà)語(yǔ)權(quán)。
本文對(duì)美、英、澳、加四國(guó)地質(zhì)調(diào)查局的數(shù)據(jù)管理工作方面做了調(diào)查,從數(shù)據(jù)管理范圍、數(shù)據(jù)政策、戰(zhàn)略計(jì)劃、重要數(shù)據(jù)庫(kù)及主要數(shù)據(jù)工具等方面的現(xiàn)狀進(jìn)行了介紹與分析,并結(jié)合中國(guó)地質(zhì)調(diào)查數(shù)據(jù)管理工作的進(jìn)展,得出一些啟示與建議。雖然中國(guó)在大數(shù)據(jù)管理上起步較晚、上升空間尚大,但是在規(guī)劃明確、配套政策支持下,具有很大的發(fā)展?jié)摿Α?/p>