文 蝶,黃 浩,史宇坤*,楊孫容,楊 嬌,王 媛,侯旭東,樊雋軒,3
1. 南京大學 地球科學與工程學院,南京 210023;2. 中國地質(zhì)科學院 地質(zhì)研究所,北京 100037;3. 內(nèi)生金屬礦床成礦機制研究國家重點實驗室 南京大學,南京 210023
進入21世紀,隨著越來越多的大型科學裝置的建設和重大科學實驗的開展,科學研究進入到一個前所未有的大數(shù)據(jù)時代(黎建輝等,2017)??茖W大數(shù)據(jù)驅(qū)動科學研究,開始進入數(shù)據(jù)密集型科學發(fā)現(xiàn)范式的全新階段(郭華東等,2014)。在地球科學領域,研究人員掌握了來自軌道衛(wèi)星、氣象監(jiān)測儀器、生態(tài)觀測站、地震觀測站等持續(xù)監(jiān)測獲得的海量數(shù)據(jù)(Sellars et al., 2013),也積累了大量從各類科學實驗、調(diào)查研究中獲取的數(shù)據(jù)。對于這些數(shù)據(jù),使用傳統(tǒng)的地學資料管理方式,已經(jīng)越來越難以滿足研究人員甚至公眾對地學資料的高質(zhì)量、高精度,以及獲取的高效率等多元化需求(趙偉等,2013)。同時,傳統(tǒng)模式也大大制約了數(shù)據(jù)的傳遞和共享,成為數(shù)據(jù)高效使用的屏障。建立更加合理高效的地學數(shù)據(jù)管理模式和共享方式,是在地球科學領域建立數(shù)據(jù)密集型科學發(fā)現(xiàn)范式的迫切需求?;谫Y料數(shù)字化基礎之上的數(shù)據(jù)庫管理和基于互聯(lián)網(wǎng)的信息共享,是已被普遍采用的數(shù)據(jù)管理和共享方式,如何加深、拓展這一模式,使之可以滿足海量數(shù)據(jù)管理、展示和傳輸?shù)囊螅堑厍蚩茖W工作者需要深入思考的問題。英國地質(zhì)調(diào)查局在這一領域走在了世界最前列。20世紀九十年代以來,該局成功將其近200年來積累的海量地學數(shù)據(jù)進行了全方位的數(shù)字化,包括地質(zhì)文本、圖件、實體標本、實驗測試和地質(zhì)調(diào)查數(shù)據(jù)等,建立了相對完整的數(shù)據(jù)管理和共享機制。因此本文將其作為實踐地學大數(shù)據(jù)管理與共享的典范,綜合介紹該局的數(shù)據(jù)資源情況、數(shù)據(jù)管理模式和數(shù)據(jù)共享方式,以期為我國地學大數(shù)據(jù)的未來發(fā)展提供可借鑒的經(jīng)驗。
英國地質(zhì)調(diào)查局(British Geological Survey, 簡稱BGS)是由英國政府于1835年出資建造,為全球首個國家地質(zhì)調(diào)查局,目前是隸屬于英國自然環(huán)境研究理事會(Natural Environment Research Council,簡稱NERC)的一個公益機構(gòu)。地質(zhì)調(diào)查局總部設在諾丁漢附近的基沃思,并在愛丁堡、瓦林福德、倫敦和卡迪夫設有地區(qū)辦事處。英國地質(zhì)調(diào)查局一直以來的工作重點緊密圍繞國家的戰(zhàn)略需求。它目前的戰(zhàn)略計劃包括三大部分:核心戰(zhàn)略科學計劃、合作伙伴計劃和委托計劃(王立偉等,2019)。其中核心戰(zhàn)略計劃處于首要地位,主要內(nèi)容是實施基礎性、公益性的地質(zhì)調(diào)查任務,獲取具有重要戰(zhàn)略意義地區(qū)的環(huán)境數(shù)據(jù),進行分析,提供適當?shù)墓蚕恚ㄌ平饦s等,2016)。
該局前身是伴隨著工業(yè)革命的進程而成立的英國地形地質(zhì)調(diào)查局(Geological Ordnance Survey)。建設初期,其任務是進行系統(tǒng)的地質(zhì)填圖,尋找足夠的礦產(chǎn)資源來支撐當時工農(nóng)業(yè)的發(fā)展。之后,地形地質(zhì)調(diào)查局經(jīng)歷了一系列的改革、調(diào)整與創(chuàng)新,在1984年更名為英國地質(zhì)調(diào)查局,工作重點從地質(zhì)填圖逐漸轉(zhuǎn)向綜合的地球科學信息資源管理和共享,具體內(nèi)容包括:提供高分辨率的地質(zhì)圖;解釋和運用地質(zhì)數(shù)據(jù),協(xié)助政府制定相關政策;幫助公眾了解如何合理使用自然資源,應對環(huán)境的變化并減少對環(huán)境的破壞等。他們的科學研究方法,也從單一的地質(zhì)調(diào)查轉(zhuǎn)變?yōu)榻Y(jié)合各種新技術和手段,通過跨學科的調(diào)查、監(jiān)測和研究來增進對固體地球系統(tǒng)的結(jié)構(gòu)、性質(zhì)和演化過程的理解。如今英國地調(diào)局的主要任務是對英國的大陸及大陸架區(qū)域進行系統(tǒng)測量、檢驗和研究,拓展英國的地學知識儲備,為英國政府提供地球科學方面的相關信息,并在地學相關產(chǎn)業(yè)和學術問題方面為英國政府、工業(yè)界、學術界和公眾提供客觀的建議。
進入大數(shù)據(jù)時代,英國地調(diào)局迅速將多年積累的豐富地學數(shù)據(jù)與先進的大數(shù)據(jù)理念和信息化技術緊密結(jié)合,快速實現(xiàn)了轉(zhuǎn)型。通過近年來系統(tǒng)、高效的數(shù)字化工作,該局地學數(shù)據(jù)已經(jīng)大部分實現(xiàn)了數(shù)字化,并且向全球用戶免費開放共享。地調(diào)局基本實現(xiàn)了從傳統(tǒng)地形地質(zhì)填圖機構(gòu)向更加關注數(shù)據(jù)管理和應用的應用型現(xiàn)代化地學機構(gòu)的轉(zhuǎn)型(張明超等,2017),成為了英國地球科學數(shù)據(jù)、信息和知識的權威提供者。
英國地調(diào)局可以稱作是“英國地球科學數(shù)據(jù)的管理員”,保管著各種重要的、在許多情況下不可替代的實物資產(chǎn)和電子數(shù)據(jù)資源。針對這些資源,他們總體采取了“分散保管、集中服務”的地質(zhì)資料管理方式(許百泉等,2013),即實物資產(chǎn)分散存儲,電子數(shù)據(jù)資源統(tǒng)一集成。其中,實物資產(chǎn)包括有各種原始的紙質(zhì)檔案記錄、巖芯、巖石和化石樣品等,分散存儲在7個地點的41個倉庫中,合計占據(jù)了超過13000 m2的建筑面積和82000 m3的存儲空間,總重量超過5000 t。雖然在2010年,英國地調(diào)局將愛丁堡吉爾默頓的海洋巖芯轉(zhuǎn)移到了基沃思的英國地質(zhì)資源庫(National Geological Repository, 簡稱NGR),但許多采集資料仍然高度分散。
該局絕大多數(shù)的電子數(shù)據(jù)資源,則由英國地調(diào)局經(jīng)營的英國地球科學數(shù)據(jù)中心(National Geoscience Data Centre, 簡稱NGDC)進行收集和保存,統(tǒng)一集成在地調(diào)局的門戶網(wǎng)站中。迄今為止,英國地調(diào)局內(nèi)的數(shù)據(jù)集已經(jīng)超過400個,涵蓋了地球科學的各個方面,包括環(huán)境監(jiān)測數(shù)據(jù),各類地質(zhì)學數(shù)據(jù)、檔案和照片等。這些數(shù)據(jù)集中的絕大部分可以在“開放地學”(OpenGeoscience, https://www.bgs.ac.uk/opengeoscience/home.html.)中免費檢索、瀏覽和下載?!伴_放地學”是英國地調(diào)局免費的數(shù)據(jù)共享與信息服務網(wǎng)站,開放于2009年12月,由九大模塊構(gòu)成:網(wǎng)絡地圖查看器(View maps)、移動端應用(Apps)、地圖數(shù)據(jù)下載(Map data downloads)、地質(zhì)體影像(Photos and images)、出版物(Publications)、巖芯和地圖掃描影像(Scanned records)、數(shù)據(jù)集(Data collections)、網(wǎng)絡服務(Web services)、相關專業(yè)軟件(Software)。其中,上文提到的實體樣品的電子數(shù)據(jù)資源,包括照片、出版物、相關數(shù)據(jù),分別保存在地質(zhì)體影像、出版物、掃描影像和數(shù)據(jù)集幾個模塊中。此外,英國地調(diào)局還廣泛與國內(nèi)外地學機構(gòu)合作,為其他機構(gòu)建設和管理電子數(shù)據(jù),這些數(shù)據(jù)托管于英國地調(diào)局的網(wǎng)站,也是英國地調(diào)局的重要數(shù)據(jù)資源之一。本部分將重點介紹“開放地學”中的自主在線數(shù)據(jù)庫、和合作機構(gòu)共建的數(shù)據(jù)庫、地圖數(shù)據(jù)資源、地質(zhì)影像照片庫GeoScenic以及實時監(jiān)測數(shù)據(jù)。
英國地調(diào)局的古生物、巖石礦物、地球化學標本的采集歷史悠久,僅在英國全境,即已收集了超過一千萬份的標本。英國地調(diào)局結(jié)合專業(yè)知識和數(shù)據(jù),圍繞地質(zhì)、地球物理、地球化學、水文地質(zhì)學、古生物學、巖石學、礦物學等方面建立了多個數(shù)據(jù)庫(Lumsden and Haworth, 1986)。由于篇幅限制,本節(jié)將介紹巖石、鉆孔、古生物三個完善的基礎類型數(shù)據(jù)庫,這些數(shù)據(jù)庫可在“開放地學”的數(shù)據(jù)集模塊里查看。
2.1.1 巖石數(shù)據(jù)庫BGS Rock collections
現(xiàn)今的巖石實物資料庫里,巖石樣品以及相關的紙質(zhì)記錄超過了一百萬份,分別保存在基沃思總部和愛丁堡分部。英國地調(diào)局中的巖石數(shù)據(jù)庫BGS Rock collections(mineralogy and petrology collection database),用于對巖石樣品的基本信息、礦物學和巖石學信息等的存儲和管理,如編號、捐贈人、巖石名稱、采集層位和產(chǎn)地,以及標本和薄片圖像信息等等。
此數(shù)據(jù)庫所包含的條目現(xiàn)已超過20萬條,可通過關鍵詞(如編號、巖石或所含礦物名稱、采集點等)檢索,或在1:5萬的地質(zhì)圖上通過位置檢索,還可以利用GeoIndex進行檢索。GeoIndex是英國地調(diào)局開發(fā)的基于地圖的數(shù)據(jù)檢索工具,后文將詳細介紹。其中通過關鍵詞檢索的方式最為常見,例如,在數(shù)據(jù)庫中檢索編號S1234,可得到其樣品相關信息如圖1,樣品捐贈人是A. Macconachie,樣品名稱為石英角閃石黑云母玢巖(Quartz hornblende biotite porphyrite),實物資料中除了玢巖之外還附著有黑云母閃長巖(Biotite diorite)的樣品碎片,采集地點位于Dalbeattie以西兩英里的Barskeogh山,在1:5萬的Kirkcudbrihgt圖幅中可以查看產(chǎn)地的地質(zhì)情況。較為特別的是,數(shù)據(jù)庫中提供巖石薄片從平面偏光至正交偏光轉(zhuǎn)換過程中的系列高清照片,模擬顯微鏡下真實觀察薄片的情景,幫助準確判斷薄片中的礦物種類、含量等信息。
圖1 巖石數(shù)據(jù)庫樣品檢索結(jié)果樣例Fig. 1 A sample search from the Rock collections
2.1.2 陸地和海洋巖芯數(shù)據(jù)庫
鉆孔數(shù)據(jù)是地質(zhì)技術人員在野外鉆探現(xiàn)場記錄并整理的第一手技術資料,通常包含鉆孔名稱、編號、位置、類型、礦區(qū)名稱、孔口高程、終孔深度和終孔日期等基礎信息。英國地質(zhì)調(diào)查局內(nèi)的鉆孔數(shù)據(jù)主要分為陸地(Onshore)和海洋(Offshore)兩部分,數(shù)據(jù)庫也相應分為兩個。
陸地鉆孔資料的實物主要是巖芯和巖屑,巖芯有不連續(xù)巖芯、連續(xù)巖芯和代表性巖芯樣品,巖屑有水洗干燥巖屑和未水洗巖屑,大部分保存在基沃思。陸地鉆孔數(shù)據(jù)庫(British onshore borehole collection database)中共有超過15000條記錄,主要提供鉆孔名稱、鉆孔類型和終孔深度三類鉆孔的基礎信息,可提供鉆孔名進行簡單檢索或者使用GeoIndex檢索。
海洋鉆孔指的是通過英國大陸架(United Kingdom Continental Shelf,簡 稱UKCS)油 氣井采集的鉆孔資料,這部分數(shù)據(jù)由英國能源與氣候變化部(Department of Energy and Climate Change, 簡稱DECC)提供。實物有超過300公里的鉆芯和450萬份巖屑,目前保存在基沃思。海洋鉆孔數(shù)據(jù)庫(UKCS offshore hydrocarbon well collection)數(shù)據(jù)包括鉆孔名稱、鉆孔編號、鉆孔位置、鉆芯照片、鉆孔類型和終孔深度等,現(xiàn)擁有8000多口海洋油氣井記錄,13萬張高分辨率巖芯照片。巖芯照片分辨率為7216×5412像素,是長1 m寬0.6 m的巖芯托盤全尺寸進行200 dpi像素分辨率拍攝形成。數(shù)據(jù)庫提供井名、鉆井公司等關鍵詞檢索方式,也支持GeoIndex方式檢索。如檢索井名110/02-6,可得知該鉆井工程由Spirit energy公司執(zhí)行,獲得鉆孔位置坐標、鉆孔深度、存放地點以及所有的巖芯信息。其中1號巖芯,深度從959.51 m(3148英尺)到942.41 m(3088英尺),分置在11個托盤里,并保存有每個巖芯托盤的高清照片。
2.1.3 古生物標本數(shù)據(jù)庫PalaeoSaurus online collections database
英國地調(diào)局收藏的古生物標本超過500萬件,包括大量珍貴的模式標本,目前已經(jīng)有超過15萬件的信息被收入了古生物標本數(shù)據(jù)庫PalaeoSaurus。該數(shù)據(jù)庫中包含英國寒武紀至早白堊世絕大多數(shù)的重要標本數(shù)據(jù),包括標本入庫編號、模式標本信息、鑒定名稱、產(chǎn)地、所在的地圖幅編號、地層和地質(zhì)時代信息等。該數(shù)據(jù)庫支持輸入化石名稱、產(chǎn)地等相關信息進行簡單檢索。
網(wǎng)站上還特別提供了對標本數(shù)據(jù)的用戶建議功能。網(wǎng)站注明,由于庫中所保存的標本信息來自一百多年前,且來源多樣,鑒定標準陳舊,因此數(shù)據(jù)可能存在與現(xiàn)有標準不一致的地方。用戶對有關內(nèi)容有任何建議和意見,都可以直接點擊鏈接,反饋信息。這一功能的設計,可有力保障對于化石屬種分類、地質(zhì)時代等信息的動態(tài)更新。
英國地調(diào)局還通過與其他大學、研究所、地質(zhì)調(diào)查和工業(yè)機構(gòu)合作,共同管理數(shù)據(jù),來強化科學研究。GB3D化石模式標本數(shù)據(jù)庫(GB3D Type Fossils,http://www.3d-fossils.ac.uk/)就是其中的合作典范。
該數(shù)據(jù)庫是由聯(lián)合信息系統(tǒng)委員會(Joint Information Systems Committee, 簡稱JISC)資助建立的英國館藏式化石標本數(shù)據(jù)庫,由英國地調(diào)局進行管理,其中涵蓋了英國館藏的以及在英國發(fā)現(xiàn)的化石模式標本數(shù)據(jù)。數(shù)據(jù)庫中的化石數(shù)據(jù)來自分散保存在22個合作博物館和機構(gòu)中的化石標本,其中貢獻最多的博物館和機構(gòu)有塞奇威克地球科學博物館、牛津大學自然歷史博物館、威爾士國家博物館、地質(zhì)館員協(xié)會(The Geological Curator’s Group)和英國地調(diào)局。截止2014年9月22日,該數(shù)據(jù)庫中共存儲了精選的16400個化石標本的28000多張圖片和1800多個3D掃描圖像,包含的化石門類有頭足類、雙殼類、腕足類、節(jié)肢類、刺胞動物、棘皮類、有孔蟲、介形蟲、植物等。 “模式標本”是用來定義化石物種的一個或一組實物化石標本,保存有此物種的典型形態(tài)特征,通常在物種命名時指定。根據(jù)命名時的具體情況,模式標本有不同的類型,這在GB3D中也有詳細的注明。例如正模(Holotype)是指在命名化石時被明確指定的唯一標本;副模(Paratype)是除正模之外對形態(tài)特征可以進行補充的其他標本;新模(Neotype)是原正?;瘉G失后新添加的同種標本等等。對無法確定或者未加定義類型的模式標本,GB3D中以不確定型(Undifferentiated Type)、未定義(Not available)注明。
在面向用戶方面,GB3D數(shù)據(jù)庫提供的數(shù)據(jù)信息包括化石的3D數(shù)字模型、高分辨率照片、立體照片和化石元數(shù)據(jù)(位置、年代、分類標識、注冊號等)。在數(shù)據(jù)庫中,用戶可以通過化石所在的地質(zhì)年代、巖石單元、分類系統(tǒng)和化石發(fā)現(xiàn)國家、位置、研究機構(gòu)和注冊號等關鍵詞進行搜索。用戶也可以根據(jù)是否包括化石的圖像數(shù)據(jù)(2D、3D或立體照片等)進行篩選,并且可以選擇清單、表格或可導出的文字三種不同形式來呈現(xiàn)搜索結(jié)果,同時支持圖片、3D模型的在線展示及下載功能(包括2000分辨率的JPEG格式圖片和obj、ply格式的3D模型)。例如,搜索編號13488(圖2)的化石,得到的結(jié)果顯示化石名稱為Procerites twinhoensisArkell,屬于動物界,軟體動物門,頭足綱,菊石目。該化石是副模標本,實物由T.R.Fry在1923年采自英國威洛巴斯的Twinhoe綠色采石場,現(xiàn)保存在布里斯托大學地質(zhì)收藏庫中。標本產(chǎn)自距今166.1~168.3 Ma的侏羅紀巴通階含鐵鮞粒灰?guī)r中(Bathonian: Twinhoe Ironshot Oolite)。
英國地質(zhì)調(diào)查局的制圖能力全球領先,在超過一個半世紀里發(fā)布了種類繁多的地圖,并建立了不同的數(shù)據(jù)庫,來增強其地圖有關的知識管理和交流(Howard et al., 2009)。這些地圖以不同的采集形式分類,收入兩個獨立的數(shù)據(jù)庫中,即紙質(zhì)掃描地圖數(shù)據(jù)庫(BGS maps portal)及可下載的地圖數(shù)據(jù)庫(Map data downloads),前者存儲2014年之前發(fā)表的紙質(zhì)掃描地圖,后者存儲數(shù)字地圖。這兩者的數(shù)據(jù)庫架構(gòu)和數(shù)據(jù)訪問方式均存在差異,將分別予以介紹。如果用戶需要絕版紙質(zhì)地圖,還可以到網(wǎng)站的在線商店購買打印件。
圖2 GB3D中編號13488的化石Procerites twinhoensis展示頁面Fig. 2 The display results of specimen catalogued as 13488, Procerites twinhoensis in GB3D
2.3.1 紙質(zhì)掃描地圖BGS maps portal
BGS地圖站點(BGS maps portal)的紙質(zhì)掃描地圖保存在“開放地學”的巖芯和地圖掃描影像模塊中。站點存儲了英國地調(diào)局從1832年至2014年出版的超過6000份地圖和剖面圖的高分辨率掃描件,包括英格蘭、威爾士以及蘇格蘭的全部中小比例尺(1:63360/1:50000)重要地圖。所有的圖件可以按照地區(qū)或者學科主題瀏覽,學科主題分類包括地質(zhì)圖、地質(zhì)剖面圖、地球物理地圖、地球化學地圖、水文地質(zhì)圖和其他主題小比例尺地圖。在最為常用的地質(zhì)圖類中,有英國以及周圍大陸架地區(qū)1:25萬的地質(zhì)圖、英國地質(zhì)經(jīng)典區(qū)域的1:2.5萬地質(zhì)圖、英格蘭和威爾士的1:63360地質(zhì)圖、1:5萬地質(zhì)圖、以及各區(qū)域的1:253440地質(zhì)圖等等。這些圖件可直接下載或購買打印版,進行普通的瀏覽和使用。
2.3.2 數(shù)字地圖數(shù)據(jù)Map data downloads
與紙質(zhì)地圖相比,數(shù)字地圖功能強大,用戶可下載數(shù)字地圖數(shù)據(jù)至自己的系統(tǒng)中編輯使用?!伴_放地學”中的數(shù)字地圖數(shù)據(jù)集按照主題分為地質(zhì)學、地質(zhì)災害、地下水、能源、地球化學和地球物理六個板塊,數(shù)據(jù)可以按照ESRI Shapefile、MapInfo和KML等常用的GIS格式被用戶下載,亦可根據(jù)用戶需求提供其他格式。
地質(zhì)學部分有五個可下載數(shù)據(jù)集,分別是英國地質(zhì)圖數(shù)據(jù)集、鉆孔數(shù)據(jù)集、土壤母質(zhì)模型(Soil parent material model)數(shù)據(jù)集、英國國家基巖柵狀圖(National bedrock fence diagram)數(shù)據(jù)集和英國地表沉積物厚度模型(Superficial deposits thickness model)數(shù)據(jù)集。其中非常特別的是地質(zhì)圖數(shù)據(jù)集和基巖柵狀圖數(shù)據(jù)集。英國地質(zhì)圖數(shù)據(jù)集存儲了英國數(shù)字地質(zhì)圖項目(DiGMapGB)完成的英格蘭、威爾士和蘇格蘭地區(qū)的1:62.5萬、1:25萬、1:5萬和1:1萬比例地質(zhì)圖的數(shù)據(jù)集,包含基巖、巖脈、地表沉積物等的性質(zhì),以及構(gòu)造斷層等常用信息。其中1:62.5萬的可免費使用,1:5萬對商業(yè)使用收費,其他比例尺的均為有償使用。柵狀圖是認識地質(zhì)結(jié)構(gòu)和構(gòu)造的一種重要手段,可用于建立三維地質(zhì)模型(曾閩山等,2006)。英國國家基巖柵狀圖是在全英國范圍內(nèi)建立的三維柵格狀地質(zhì)截面網(wǎng)絡,可以構(gòu)建起三維的地質(zhì)圖(3D geology for the United Kingdom,UK3D)。這個柵狀圖分布有超過20000 km的剖面線,覆蓋了整個英國的陸地,并向海洋區(qū)域延伸出20 km,剖面向下延伸最深處為地面以下6 km。剖面線的數(shù)據(jù)由一系列的鉆孔數(shù)據(jù)以及其他單剖面數(shù)據(jù)組成,通過地質(zhì)建模軟件GSI3D構(gòu)建出柵格狀地質(zhì)截面,形成柵狀圖。其中的鉆孔數(shù)據(jù)、單剖面數(shù)據(jù)以及構(gòu)建完成的柵狀地質(zhì)截面數(shù)據(jù)均可免費下載,并且單剖面數(shù)據(jù)格式還與谷歌地球匹配,便于用戶使用。通過柵狀圖構(gòu)建的英國區(qū)域地質(zhì)三維模型以pdf文檔的形式供用戶下載,文檔中的三維模型可以多角度、多比例自由查看,高程比例可以調(diào)節(jié),并且所有的地層單元、地形、地表沉積物、鉆孔位置等都可以自由選擇顯示(圖3)。
地質(zhì)災害圖數(shù)據(jù)集有四個部分,分別是5 km六角網(wǎng)格形式的描述六種自然災害可能性的GeoSure、1 km六角網(wǎng)格形式的采礦災害數(shù)據(jù)集、放射性元素氡的分布圖集以及全球的地震數(shù)據(jù)集。
數(shù)字地圖數(shù)據(jù)部分的其余四個板塊包括1:62.5萬的水文地質(zhì)學的數(shù)據(jù)集、英國陸上煤炭資源的潛力能源數(shù)據(jù)集、不列顛群島自然地球化學基線以及重力和磁力數(shù)據(jù)集。
圖3 倫敦及泰晤士地區(qū)三維地質(zhì)圖Fig. 33D geological map for London and Thames Valley
GeoScenic是英國地調(diào)局建設的一個存儲和共享地球科學高質(zhì)量照片的數(shù)據(jù)庫,目前包含了6萬余張照片,均來自于英國地質(zhì)照片國家檔案館(National Archive of Geological Photographs),可免費用于非商業(yè)用途。該數(shù)據(jù)庫中的照片均支持原尺寸觀看,并可免費下載。這些照片均以地球科學某學科為主題,地球科學研究對象為主體呈現(xiàn),涵蓋的主題包括巖石學、古生物學、地層學、經(jīng)濟地質(zhì)學、地質(zhì)災害、地表景觀等等。GeoScenic保存了照片相關信息,如照片類型、拍攝地點、拍攝時間、像素分辨率以及照片內(nèi)容的文字描述等(圖4)。GeoScenic支持使用主題詞檢索照片,并且照片同時在GeoIndex中,可通過其在地圖上的位置直接找到。
圖4 GeoScenic數(shù)據(jù)庫中編號為P006749的展示不整合接觸關系的野外露頭照片F(xiàn)ig. 4 The outcrop photo catalogued P006749 in GeoScenic database displaying the unconformity contact
通過氣象站等高精度的監(jiān)測傳感器,并配合自動數(shù)據(jù)采集系統(tǒng)(automated data acquisition system,簡稱ADAS)進行自動化遙測,可以實時、高效地采集高精度信息,獲取實時監(jiān)測數(shù)據(jù)(韓子夜和薛星橋,2005)。英國地調(diào)局在“開放地學”的數(shù)據(jù)集模塊建設了實時監(jiān)測(Instrumenting the Earth)功能,收集來自英國各地以及其他國家的傳感器數(shù)據(jù),以獲取諸如地下水溫度和水位、大氣壓力和地熱等信息。
英國地調(diào)局目前接收的數(shù)據(jù)主要來自他們的地能觀測項目、滑坡監(jiān)測項目、環(huán)境基線監(jiān)測項目等等。其中支持在線實時訪問數(shù)據(jù)的監(jiān)測點有四個,即瓦林福德河監(jiān)測點,蘭開夏郡環(huán)境基線監(jiān)測點,卡迪夫地源熱泵(Ground Source Heat Pump,簡稱GSHP)監(jiān)測點和約克郡環(huán)境基線監(jiān)測點。這些監(jiān)測點獲得的數(shù)據(jù)被實時傳輸?shù)降卣{(diào)局的中央數(shù)據(jù)存儲器中,在其中進行清洗和標準化后發(fā)布給用戶查看和使用。英國地調(diào)局對于實時監(jiān)測數(shù)據(jù)的獲取和管理還在不斷地測試中,網(wǎng)站表明后續(xù)也將開放更多的實時監(jiān)測數(shù)據(jù)。
英國地調(diào)局的數(shù)據(jù)共享已有15年之久,近年來,該局致力于實現(xiàn)不同數(shù)據(jù)集的融合和共享?!伴_放地學”通過各種在線查看器、應用程序、軟件和網(wǎng)絡服務,將各種數(shù)據(jù)集有機鏈接在一起,使得數(shù)據(jù)獲取和使用快捷、方便。這些共享服務包括有地圖查看器View maps;移動應用英國地質(zhì)iGeology、農(nóng)業(yè)土壤MySoil和火山災害MyVolcano;虛擬鉆孔和剖面創(chuàng)建軟件Groundhog和地質(zhì)制圖集成包BGS·SIGMA等。
此模塊中包含了可以查看最近十余年制作的各類數(shù)字化地圖,主要有四類:面向大眾的英國地質(zhì)圖(Geology of Britain)、適用于專業(yè)人員的地質(zhì)索引圖(GeoIndex,分為陸地和海洋兩個獨立的入口)、地下水位變化圖(Groundwater levels timeline)、英國土壤信息站(UK soil observatory,UKSO)。
3.1.1 英國地質(zhì)圖查看器Geology of Britain viewer
查看器中提供二維和三維兩個版本的英國地質(zhì)圖,二維版本中可在線查看1:5萬至1:62.5萬的數(shù)字地質(zhì)圖,有地表地質(zhì)、3D模型、鉆孔和地震年表四個不同的數(shù)據(jù)模式。其中,地表地質(zhì)數(shù)據(jù)展示的是地面以上地質(zhì)體的基本屬性,可以查看2.6 Ma以來的地表沉積物(Superficial)和基巖(Bedrock)的情況,也就是我們通常意義的地質(zhì)圖。網(wǎng)站使用地形圖和地質(zhì)圖的疊加顯示方式,可以調(diào)整地質(zhì)圖圖層的透明度,實現(xiàn)地質(zhì)體圖層和地形圖層之間的不同疊加效果,對室內(nèi)外工作提供了極大的便利。
3D模型模式提供英格堡、伊普斯威奇、懷特島、瑟羅克、約克、海德公園和溫莎七個地點部分或全部區(qū)域的3D地質(zhì)模型,可在這些區(qū)域內(nèi)的任意地點形成虛擬鉆孔圖(virtual borehole)、水平切面地質(zhì)圖(horizontal section)以及任意兩點之間的地質(zhì)剖面圖(cross section)。以約克地區(qū)為例,網(wǎng)站提供的3D地質(zhì)模型覆蓋了約克以北和東部的50 km2的區(qū)域,是英國地調(diào)局于2005年根據(jù)針對Selby和York地區(qū)進行的1:1000綜合調(diào)查和模型構(gòu)建計劃而建立的。模型綜合了區(qū)域內(nèi)可用的鉆孔數(shù)據(jù),可提供直至地下約50 m深度的地質(zhì)信息。在該區(qū)域內(nèi)點擊任意點都可以形成以該點為孔心的虛擬鉆孔剖面(圖5),并附上巖性圖例。點擊圖例中的巖石地層單位,可進一步顯示地層單元的更多詳細信息。
鉆孔模式顯示英國的陸地鉆孔分布,用戶可點擊任意鉆孔,獲得在線的鉆孔掃描文件。網(wǎng)站加載了超過一百萬條的陸地鉆孔、井眼、井筒和井的數(shù)據(jù)。地震年表模式顯示英國1956年至今每年的地震信息,包含了震中、震幅和震時,由英國地震監(jiān)測機構(gòu)實時提供。
英國地質(zhì)查看器的三維版本尚處于測試階段,提供可見地下基巖分布的3D瀏覽模式、僅見地表覆蓋與地上巖石的地球儀瀏覽模式以及二維瀏覽模式,每種模式下都可點擊了解任意一點的地質(zhì)信息。同樣也提供地質(zhì)、鉆孔分布、地震年表三種數(shù)據(jù)模式。
3.1.2 地質(zhì)索引GeoIndex
GeoIndex是基于地圖的數(shù)據(jù)集檢索工具,它以地圖作為檢索基底,用戶可自行在上添加開放地學上的各類數(shù)據(jù)集。GeoIndex按照地理范圍分為兩個相對獨立的部分,陸地(Onshore,圖6a)和海洋(Offshore,圖6b)兩者各自都可引用數(shù)十個數(shù)據(jù)集,包括各類地學信息,如鉆孔、地震、滑坡、化石、水文地質(zhì)、巖石樣本、地球化學和地球物理等,其中的數(shù)據(jù)每月都在更新。在網(wǎng)頁界面上,用戶可以輸入地點后導航到感興趣的地區(qū),添加需要的數(shù)據(jù)集,查看地區(qū)內(nèi)的數(shù)據(jù)集信息,通過調(diào)節(jié)數(shù)據(jù)集圖層的顯示透明度,可將數(shù)據(jù)集信息進行不同程度的疊加,生成定制化的地學信息圖,在“打印”欄形成地學索引報告(GeoIndex report)方式的文檔。用戶還可以進一步框定感興趣的區(qū)域,查看、下載該區(qū)域的數(shù)據(jù),或者與之前的信息圖一起形成更為詳盡的報告。
3.1.3 地下水位變化圖Groundwater levels timeline
地下水位變化圖可查看從1970年至今英國不同地區(qū)每月的地下水水位情況,從極高到極低分成7個等級,分別用不同顏色的圓點標識,還可以點擊圓點查看具體的水位數(shù)據(jù)。圖上還重點提供了1976年以來的幾次重大干旱與洪水時期的地下水位視圖,所顯示的觀測點數(shù)據(jù)比其他時間要豐富。此項功能可以在移動端上使用。
3.1.4 英國土壤信息站UK soil observatory
圖5 英國地質(zhì)圖查看器二維版及其3D模型數(shù)據(jù)模式(圖a為約克地區(qū)內(nèi)的3D模型數(shù)據(jù)模式展示區(qū)域,紅色點為虛擬鉆孔孔心;圖b為形成的虛擬鉆孔)Fig. 5 Geology of Britain viewer under 3D model mode (a) and an example of a virtual borehole in York area (b)
英國土壤信息站是一個獨立的數(shù)據(jù)網(wǎng)站,匯集了九個研究所提供的英國土壤類型信息,整體由英國地調(diào)局開發(fā)和支持,在“開放地學”上提供的鏈接是它的地圖檢索網(wǎng)頁(UKSO Map viewer),支持在移動設備上使用。這個數(shù)據(jù)網(wǎng)站以托管的形式存在于英國地調(diào)局網(wǎng)站中。網(wǎng)頁也有2D和3D兩種版本,提供6種底圖,分別是地形圖(Topographic)、街道地圖(Streets)、開放街道地圖(OpenStreetMap)、有標注的衛(wèi)星圖像地圖(Imagery with Labels)、有標注的地形圖(Terrain with Labels)和空白地圖(Light Gray)。在底圖上通過加載不同信息的圖層,如英國農(nóng)業(yè)信息、英格蘭地區(qū)作物信息、土壤多樣性等等,可以得到各種與土壤信息有關的數(shù)據(jù)分布,并且還可以按照需求自行添加外部圖層。用戶還可以對數(shù)據(jù)進行補充和修改,通過單擊“添加土壤數(shù)據(jù)”,填寫相關信息并提供支撐材料,管理人員驗證之后,更新的數(shù)據(jù)就可以在網(wǎng)站上顯示。
圖6 GeoIndex平臺界面Fig. 6 The interface of GeoIndex.
iGeology是英國地質(zhì)調(diào)查局開發(fā)的一款智能手機應用程序,可以在手機上訪問英國地質(zhì)調(diào)查局內(nèi)的地圖和尋找其他的地質(zhì)信息,該程序支持iOS系統(tǒng), Android系統(tǒng)和Kindle Fire平板。自2010年底推出以來,iGeology已經(jīng)被來自56個國家的用戶下載了6萬多次,并在2010年9月成為iTunes上排名第一的免費教育應用。2011年7月,在圣地亞哥舉行的ESRI國際會議上,iGeology榮獲最受社區(qū)歡迎應用獎(Community Favorite Award Best Mobile App)和最佳應用第三名(Third-Place Best Mobile App)。iGeology相當于移動端的英國地質(zhì)圖,它有三種地質(zhì)圖層可進行選擇,包括基巖和地表沉積相結(jié)合、僅基巖或僅地表沉積的圖層。選擇了圖層后,可疊加鉆孔信息層、線性特征層等。鉆孔信息層包括超過一百萬條的陸地鉆孔、井眼、井筒和井的數(shù)據(jù);線性特征層包括特殊的地質(zhì)特征、構(gòu)造或者邊界,例如,斷層和褶皺軸。添加相應的圖層之后,用戶可以輸入或點擊研究地點以獲取數(shù)據(jù)和信息。此外,iGeology在用戶互動方面極具亮點,地學專業(yè)人員可以貢獻自己的地質(zhì)觀察資料,經(jīng)過專家勘驗后能在地圖上對有關信息進行修訂。其他業(yè)余愛好者也可以向iGeology提交相關照片。在注冊賬號之后,用戶可以保存下載和曾提交的信息。
除iGeology以外,英國地調(diào)局還與生態(tài)與水文中心、歐盟委員會聯(lián)合研究中心和英國氣象局合作開發(fā)了mySoil,為農(nóng)民、園丁和土地使用規(guī)劃者提供更好的土壤信息。應用程序mySoil提供整個歐洲的土壤屬性圖,與英國土壤觀測站一樣,主要包括溫度、PH值和優(yōu)勢作物信息。他們與美國著名的史密森博物館(Smithsonian Institution)共同開發(fā)的MyVolcano,是一個面向公眾的應用程序,用戶可以上傳火山的相關照片和描述,可以用于共同監(jiān)測全球可能的火山災害。MyVolcano現(xiàn)有1553個火山點數(shù)據(jù)和179個相關描述。
英國地調(diào)局開發(fā)了許多軟件工具,通過建立地學方面的模型,來更加深入地理解地球系統(tǒng)的運作。開放地學的軟件模塊包括四部分,地下水位時間序列模擬模型AquiMod,地下水流量模擬模型GISgroundwater,地質(zhì)制圖集成包BGS·SIGMA和虛擬鉆孔和剖面創(chuàng)建軟件Groundhog。其中,BGS·SIGMA是一個制作數(shù)字化地圖的集成工具包,該軟件通過使用定制的數(shù)據(jù)模型和預定義的詞典,以標準化格式收集數(shù)據(jù)。并通過使用定制的數(shù)據(jù)輸入表格,收集各種地質(zhì)信息、照片、草圖和注釋,并且可以將所有數(shù)據(jù)都鏈接到地圖上的相應數(shù)據(jù)點位。BGS·SIGMA有移動端(Mobile)和桌面端(Desktop)。用戶可在野外使用移動端,標定現(xiàn)場點位并鏈接捕獲的數(shù)據(jù),回到室內(nèi),將數(shù)據(jù)上傳數(shù)據(jù)庫中,用于繪制地圖。隨著BGS·SIGMA的不斷發(fā)展,采集的數(shù)據(jù)不僅可以用于繪制地圖,還可以3D可視化軟件(例如,GeoVisionary)和Groundhog繪制虛擬鉆孔和剖面。虛擬鉆孔和剖面創(chuàng)建軟件Groundhog主要提供3D地質(zhì)模型展示,目前暫停服務。
網(wǎng)絡服務技術是基于標準的開放互操作技術,標準是實現(xiàn)跨系統(tǒng)、跨平臺互操作的靈魂,其思路是共同制定一系列相關標準。這些標準并不規(guī)定各單位如何存儲他們的數(shù)據(jù)(每個單位都可選擇最適合自己單位需求的方式),而是規(guī)定標準的外部接口(姜作勤,2007)。英國地調(diào)局內(nèi)的網(wǎng)絡服務主要由三部分組成,網(wǎng)絡目錄服務(Catalogue Wervice for the Web,簡稱CSW),網(wǎng)絡地圖查看服務(Web Map Service,簡稱WMS),網(wǎng)絡要素下載服務(Web Feature Service,簡稱WFS)。這幾類網(wǎng)絡服務技術的標準是由開放地理空間信息聯(lián)盟(Open Geospatial Consortium, 簡稱OGC)制定。這些網(wǎng)絡服務技術也有助于英國地調(diào)局滿足歐盟的INSPIRE指令。INSPIRE是加強歐盟各部門之間環(huán)境空間數(shù)據(jù)共享的一項法案。
CSW提供基于標準的界面,以發(fā)現(xiàn)、瀏覽和查詢有關英國地調(diào)局的數(shù)據(jù)集和元數(shù)據(jù)。WMS是從地理信息中動態(tài)產(chǎn)生具有地理空間位置數(shù)據(jù)的地圖。WMS產(chǎn)生的地圖一般以圖像格式提供,如PNG、GIF 或JPEG;或按SVG(Scalable Vector Graphics)或WebCGM(Web Computer Graphics Metafile)格式提供基于矢量的圖形元素。WFS為瀏覽器提供經(jīng)過地理標記語言(GML)格式封裝的地理空間數(shù)據(jù),支持對地理要素數(shù)據(jù)的插人、更新、刪除、查詢和發(fā)現(xiàn)等操作。用戶可以利用標準的網(wǎng)絡服務技術,將數(shù)據(jù)通過混搭的方式集成到自己的GIS系統(tǒng)中。
英國地調(diào)局內(nèi)支持鏈接到WMS的網(wǎng)站上進行使用的地圖相關數(shù)據(jù)集一共有九類,分別是1∶5萬的英國陸地地質(zhì)數(shù)字數(shù)字地圖,1∶62.5萬的英國陸上和海上基巖和表面沉積物地質(zhì)圖,1∶25萬比例的近海地質(zhì)圖,1∶5萬的高分辨率地面穩(wěn)定性數(shù)據(jù)樣本,土壤特征數(shù)據(jù),英格蘭和威爾士土壤地球化學圖集,康沃爾郡以及德文郡和薩默塞特郡部分地區(qū)的地球物理數(shù)據(jù),英格蘭北部地區(qū)的地球物理數(shù)據(jù),GeoIndex的數(shù)據(jù)集,英國土壤數(shù)據(jù)中污染物濃度數(shù)據(jù),放射性元素氡的分布圖數(shù)據(jù)集。用戶可以通過WMS的網(wǎng)站將這些數(shù)據(jù)集加載到自己的制圖軟件(GIS系統(tǒng))中,從而可以對來自不同提供商的數(shù)據(jù)進行空間可視化和比較。
用戶可以鏈接到WFS的網(wǎng)站進行使用的地圖相關數(shù)據(jù)集目前有兩個,分別是1∶100萬的OneGeology世界范圍內(nèi)動態(tài)數(shù)字地質(zhì)地圖數(shù)據(jù)和1∶62.5萬的英國陸地基巖數(shù)字地圖數(shù)據(jù)(Jackson, 2009)。
英國地質(zhì)調(diào)查局悠久的數(shù)據(jù)采集歷史為其建設地學大數(shù)據(jù)奠定了良好的基礎,而同時他們在科技和數(shù)據(jù)管理方面及時接納新理念才是形成開放地學的根本。數(shù)字化工作同時也為他們與國際眾多地學機構(gòu)和大數(shù)據(jù)研究機構(gòu)之間創(chuàng)造了廣泛的合作機會,也開啟了建立全球地球科學數(shù)據(jù)共享網(wǎng)絡的進程。如今人類逐步步入大數(shù)據(jù)時代,也經(jīng)歷著類似的數(shù)字化變革,而英國地調(diào)局的數(shù)字化工作正是其他地學機構(gòu)可以取用的他山之石。他們的工作是“深時數(shù)字地球”(Deep-time Digital Earth,DDE)國際科學計劃的重要參考,是建立一站式全球地球科學數(shù)據(jù)匯集、服務、應用平臺的良好模板(Normile, 2019)。
英國地調(diào)局的優(yōu)質(zhì)數(shù)字化經(jīng)驗可總結(jié)如下:
(1)在數(shù)據(jù)管理方面,線下的地質(zhì)資料庫和線上的地球科學數(shù)據(jù)中心相輔相成,共同管理實物資料和數(shù)據(jù)資源。在此基礎之上,做到資料庫的數(shù)據(jù)資源均入庫管理,并入統(tǒng)一的數(shù)據(jù)資源平臺——開放地學中。
(2)在數(shù)據(jù)共享方面,所有數(shù)據(jù)資源匯集到開放地學之后,還通過不同的共享和信息服務方式,例如在線查看器、應用程序、軟件和網(wǎng)絡服務等等,將所有的數(shù)據(jù)集有機鏈接在一起。最為重要的是,網(wǎng)站的所有數(shù)據(jù)集均可以在地圖上展示,并形成定制的地學信息圖。三維模型的使用,使得數(shù)據(jù)得到更高效的擴展,形成數(shù)據(jù)+模型的體系,提供了全新的地質(zhì)圖展示方式,更加全面、精準地表達了地質(zhì)體信息。
“深時數(shù)字地球”國際計劃旨在建立全球地學大數(shù)據(jù)的集成,有效促進知識共享,開展數(shù)據(jù)驅(qū)動下的新型地球科學研究。此計劃將實現(xiàn)在三維地質(zhì)體信息的基礎上,加載高精度時間軸,以更高維度的方式展示深時地球演化歷史,為廣大地學科研人員深入探索地學奧秘提供新的視角。 英國地調(diào)局國際一流的地學大數(shù)據(jù)管理和共享經(jīng)驗,為我國在國際舞臺引領“深時數(shù)字地球”國際科學計劃提供了可貴的學習案例。
致謝:本文系“深時數(shù)字地球”(Deep-time Digital Earth)大科學計劃系列成果之一。