張 蕾,鐘瀚霆 ,2*,陳安清 ,2,趙應(yīng)權(quán),2,黃可可,2,李鳳杰,2,黃 虎 ,2,劉 宇,2,曹海洋 ,2,祝圣賢,穆財能 ,侯明才,2,JAMES G.Ogg,3
1.成都理工大學沉積地質(zhì)研究院,成都610059;2.油氣藏地質(zhì)及開發(fā)工程國家重點實驗室(成都理工大學),成都610059;3.普渡大學大氣與行星科學學院,西拉斐特47907
數(shù)據(jù)已滲透到社會生產(chǎn)和生活的各個領(lǐng)域(翟明國等,2018),成為重要的生產(chǎn)要素和戰(zhàn)略資源(懷進鵬,2013)。人們對海量數(shù)據(jù)的挖掘(Che et al.,2013)和利用,帶來了產(chǎn)業(yè)結(jié)構(gòu)的變革及科學研究范式的創(chuàng)新(Hey et al.,2009;Kitchin,2014;張旗和周永章,2017)。地球科學作為典型的數(shù)據(jù)密集型學科,同樣面臨著前所未有的挑戰(zhàn)與機遇。通過與大數(shù)據(jù)思維相結(jié)合,地球科學不僅可以極大拓展認知空間,提升獲取新信息新知識的能力,同時還可為能源礦產(chǎn)調(diào)查、環(huán)境資源利用以及防災(zāi)減災(zāi)等社會生產(chǎn)和公共服務(wù)提供創(chuàng)新活力。隨著地學大數(shù)據(jù)不斷爆發(fā)式增長,如何將大數(shù)據(jù)與地球科學更深入更全面地結(jié)合,讓不斷產(chǎn)生的海量地學數(shù)據(jù)更好地為地球科學服務(wù),成為業(yè)內(nèi)必需面對的問題。
在這樣的時代背景下,由中國科學家發(fā)起和主導(dǎo),并由國際最大的地學學術(shù)組織——國際地質(zhì)科學聯(lián)合會(IUGS)批準的第一個國際大科學計劃——“深時數(shù)字地球”(Deep-time Digital Earth,DDE),應(yīng)運而生。DDE計劃以整合地球演化的全球數(shù)據(jù)、共享全球地學知識為使命,力求推動地球科學研究范式的變革。該計劃將以固體地球為對象,運用大數(shù)據(jù)研究的科學范式,聚焦于數(shù)十億年地球演化、生命起源、礦產(chǎn)成礦與油氣富集機制等核心基礎(chǔ)科學問題,重建精確的地球演化歷史,構(gòu)建全球地質(zhì)構(gòu)造與工程地質(zhì)條件,精準識別全球資源與能源礦產(chǎn)的宏觀分布規(guī)律,更加準確地預(yù)測全球氣候變化與人類的未來,實現(xiàn)地球系統(tǒng)科學的重大突破(Wang et al.,2019)。
古地理學作為地質(zhì)學的重要分支,著眼于研究地質(zhì)歷史時期地球表面的地理、生物、氣候面貌及其演化規(guī)律,范圍涉及大地構(gòu)造學、古地磁學、巖石學、沉積學、古海洋學、古生物學、古氣候?qū)W等多學科,對還原構(gòu)造沉積歷史、識別礦產(chǎn)能源分布、預(yù)測生物氣候演變具有重要指導(dǎo)意義(陳洪德等,2017;Hou et al.,2018)。在大數(shù)據(jù)時代,隨著海量數(shù)據(jù)的不斷積累與新技術(shù)的相繼誕生,古地理學又該如何把握機遇,實現(xiàn)新的突破?
為回答這一問題,本文通過系統(tǒng)介紹、剖析國內(nèi)外已有的部分古地理相關(guān)數(shù)據(jù)庫及研究團隊,提出在大數(shù)據(jù)驅(qū)動下進行標準化、智能化數(shù)字古地理重建的思路與面臨的挑戰(zhàn),為未來DDE計劃整合全球海量古地理數(shù)據(jù)、建設(shè)相關(guān)數(shù)據(jù)平臺提供經(jīng)驗。
國際上以歐美科學家為主導(dǎo)已經(jīng)實施了若干項與地球科學相關(guān)的重大科學計劃。國際科聯(lián)(ISC)、國際地科聯(lián)(IUGS)均已將“數(shù)字技術(shù)革命”納入戰(zhàn)略目標。美國國家科學基金會(NSF)在2017年正式建立專項基金,用于投資“影響美國未來領(lǐng)導(dǎo)力的十大思想”,第三項即為“抓住數(shù)據(jù)革命時機”。NSF計算機信息科學工程學部和地球科學學部聯(lián)合發(fā)起地球科學領(lǐng)域的EarthCube計劃,其使命為構(gòu)建地球科學數(shù)據(jù)的先進平臺,提高地球科學家獲取、共享、分析地球科學數(shù)據(jù)及相關(guān)資源的能力,進而理解并預(yù)測復(fù)雜演化的地球系統(tǒng)。此外,各類學會和組織發(fā)起的地球科學大數(shù)據(jù)平臺建設(shè)也如火如荼,如GEOROC、EarthChem、Auscope、Macrostrat、One geology等。
近年來,各類與古地理相關(guān)的數(shù)據(jù)庫及平臺也相繼建立,如個人或團隊開發(fā)的PALEOMAP、CEED、EarthByte、TSCreator、Deep Time Maps等;各類商業(yè)公司數(shù)據(jù)庫如IHSMarkit、Neftex、Frogtech、CGG等;以及各國政府或官方學術(shù)組織建立的包含大量古地理信息的各類綜合數(shù)據(jù)庫?,F(xiàn)介紹部分具有代表性的古地理相關(guān)數(shù)據(jù)庫。
PALEOMAP Project (http://www.scotese.com)由現(xiàn)兼職于美國西北大學的Christopher R.Scotese教授領(lǐng)銜,相關(guān)古地理重建工作始于20世紀70年代,其網(wǎng)站被美國科學教師聯(lián)合會和科學美國人等評為全球最有影響力的科學網(wǎng)站之一。
PALEOMAP Project的核心目標是闡明洋盆和大陸的板塊構(gòu)造演化,以及過去11億年來陸地和海洋的分布變化(Chatterjee et al.,2013)。其基本方法包括兩部分:(1)利用古地磁數(shù)據(jù)、線性磁異常數(shù)據(jù)、古生物地理學、古氣候?qū)W、區(qū)域地質(zhì)構(gòu)造史重建板塊構(gòu)造模型;(2)綜合多種古地理古氣候記錄,確定關(guān)鍵造山帶、海岸線等地貌地理單元,根據(jù)地貌的基本原理和規(guī)律,作合理的近似推斷,進而重建山脈、平原、淺海和洋盆的分布與變遷(圖1)。
PALEOMAP Project是最早利用計算機技術(shù)開展古地理重建的項目之一,開發(fā)了基于地理信息系統(tǒng)(GIS)的古地理重建軟件ESH-GIS1.0(ArcView)(第一個地球歷史地理信息系統(tǒng)),以及面向公眾的手機APP軟件ESH-GIS 2.0(ArcView)(具有46個時間斷面,帶有免費的、重建的空間資料開放格式)。此外,PALEOMAP Project和Earth in Motion Technologies共同開發(fā)了可在ArcView 3.0下運行的Paleo-GIS程序,能夠演示全球范圍從前寒武紀(750 Ma)到現(xiàn)代的板塊構(gòu)造重建。通過近40年的積累,PALEOMAP Project面向公眾的具體產(chǎn)品是非常多元化的,主要包括:
圖1 板塊構(gòu)造重建的十項證據(jù)(據(jù)Scotese,2017修改)Fig.1 The ten lines of evidence that are used to make plate tectonic reconstructions(revised after Scotese,2017)
(1)地球歷史(Earth History)和氣候歷史(Climate History)圖集
地球歷史圖集是一系列顯示古山脈、古海岸線、活動板塊邊界以及古氣候帶范圍的全彩色古地理圖??梢罁?jù)選擇的時間段呈現(xiàn)不同時期地球的面貌;
氣候歷史圖集討論了地球氣候為什么以及如何隨時間變化??梢罁?jù)選擇的時間段呈現(xiàn)不同時期的全球氣候分布圖;或通過氣候動畫展示地球的氣候帶是如何隨著時間而變化的。
(2)ipad及iphone應(yīng)用——古代地球:盤古大陸的裂解(Ancient Earth:Breakup of Pangea)
用戶可通過訪問網(wǎng)站www.ancient-earth.com或從App Store搜索古代地球(Ancient earth),體驗一個可擴展、可旋轉(zhuǎn)、完全交互式的古地球動畫系統(tǒng),用以探索板塊構(gòu)造和地球歷史。
(3)三維可移動古地球儀(3D movable Paleoglobes)
用戶可選擇不同地球歷史時期,以多角度旋轉(zhuǎn)并查看交互式3D虛擬地球。目前可供選擇的時間段包括:現(xiàn)代、20 Ma、65 Ma、80 Ma、120 Ma、140 Ma、200 Ma和280 Ma。
(4)三維古地理動畫(3D Paleogeographic Animations)
提供了白堊紀末期、白堊紀、早二疊世和中泥盆世的三維地形和水深模型可視化樣本。
(5)未來地圖集(Future Maps)
可依據(jù)選擇的時間段呈現(xiàn)對未來大陸分布的預(yù)測,包括“終極盤古大陸”(推測形成于250 Ma以后)的形成(圖2)。
CEED(The Centre for Earth Evolution and Dynamics, https://www.mn.uio.no/ceed/english/) 地球演化及動力學中心是由挪威奧斯陸大學數(shù)學與自然科學學院創(chuàng)建的一個跨學科研究中心,其核心組成包括Trond H.Torsvik領(lǐng)銜的Earth Dynamics團隊,匯集了板塊構(gòu)造、地幔動力學、古地理重建、古地磁和行星科學等多學科背景的科學家。
CEED的愿景是通過研究板塊動力學、大規(guī)模火山活動的起源、氣候演變以及生物大滅絕等事件,生成一個全新的地球模型,該模型將解釋地幔活動如何與板塊構(gòu)造相互作用,并在整個地球歷史時期引發(fā)大規(guī)模的火山作用以及相關(guān)的環(huán)境和氣候變化。
圖2 250Ma后的“似盤古大陸”(據(jù)PlatetectonicmapsandContinentaldriftanimationsbyC.R.Scotese,PALEOMAPProject.www.scotese.com改)Fig.2 +250Millionyearsinthefuture—“PangeaProxima”(revisedafterPlatetectonicmapsandContinentaldriftanimationsbyC.R.Scotese,PALEOMAPProject.www.scotese.com)
CEED的研究主要集中于六個主題,具體包括:
(1)深部地球:物質(zhì)、構(gòu)造、動力學
地球動力學過程影響了地球的演變(圖3)。CEED將探索地表的火山活動及其變形,以及地幔與地核之間的聯(lián)系機制。
該主題的目的是在地幔系統(tǒng)中探索板塊運動模型(Torsvik et al.,2008),該模型考慮了550 Ma以來地幔中俯沖物質(zhì)的積累,以及在超級地幔柱(LLSVP)邊緣形成的羽狀流模型,從而進一步探討地幔和地核的演化、結(jié)構(gòu)和動力學,以及它們在整個地幔邊界上的相互作用。
(2)動態(tài)地球:板塊運動和地球歷史
固體地球的上層是不斷運動的巖石圈,深地幔的活動可改變巖石圈,還可影響地球上的氣候和生命。地表的歷史可以通過研究威爾遜旋回來揭示。CEED力求檢驗的主要假設(shè)是地球上構(gòu)造板塊的運動與地幔動力學密切相關(guān),而地幔—巖石圈活動驅(qū)動著地球生命的重大變化。此外,CEED還將探索火山事件、陸地和海洋的分布及地球的自轉(zhuǎn),以找出它們隨著時間影響氣候的規(guī)律(圖4)。
(3)地球危機:大火成巖省、生物大滅絕、環(huán)境變化
在整個地質(zhì)歷史中,地球曾多次面臨大氣中溫室氣體濃度過高的時期,這些時期與大火成巖省的發(fā)育時期一致。CEED探索火山作用對全球氣候快速變化和生物大規(guī)模滅絕的影響。
圖3 深部地球模型(據(jù)Reidar,2010修改)Fig.3 Deep Earth model(revised after Reidar,2010)
圖4 二疊紀—三疊紀界線時期(約2.5億年前)陸地、陸架、淺水和深海盆地的全球分布(據(jù)https://www.mn.uio.no/ceed/english/)Fig.4 Global distribution of land masses,shelf area,shallow water and deep oceanic basins at the Permian-Triassic boundary time(ca.250 million years ago)(revised after https://www.mn.uio.no/ceed/english/)
CEED旨在開展研究,以彌合地質(zhì)過程、數(shù)據(jù)指標和過去環(huán)境危機后果之間的鴻溝。CEED重點關(guān)注諸如巖漿環(huán)境、巖漿通量、LIP的年齡和持續(xù)時間以及相關(guān)邊界事件等參數(shù),也研究LIP和環(huán)境變化之間的聯(lián)系,且會探索為什么有些LIP顯然與邊界事件不相關(guān)的原因。CEED致力于研究的問題包括:大火成巖省、全球變暖、滅絕機制、地球化學旋回和古環(huán)境。
(4)地球與其他:比較行星學
大陸碰撞、火山活動和大型海洋盆地的形成等是地球進化史中的典型事件。CEED具有地形觀測、行星磁場、重力及隕石相關(guān)的知識。CEED想要了解地球和其他類地行星之間的異同點。CEED需要檢驗的主要假設(shè)是,可以在相同的框架內(nèi),使用不同的參數(shù)來理解地球和行星的動力學過程。一個基本的問題是,為什么地球似乎是唯一具有板塊構(gòu)造的類地行星。CEED從大量的隕石坑數(shù)據(jù),統(tǒng)計并完善行星演化的時間范圍,通過修改地球模型來探索與內(nèi)部過程相關(guān)的行星表面演化。
(5)地球建模:地球動力學的數(shù)值模型
數(shù)值模擬是研究地球演化和動力學的主要工具。CEED研究人員利用代碼、程序和數(shù)據(jù)庫,執(zhí)行從簡單的二維軸對稱研究到大規(guī)模并行的四維全球模擬的數(shù)值模型,其首要任務(wù)是將構(gòu)造板塊重建整合到全球四維地球動力學和氣候模型中。CEED旨在開發(fā)經(jīng)濟高效的建模和可視化平臺,用以重建地球。
(6)地球?qū)嶒炇遥汗诺卮偶皫r石磁學
古地磁學是地球物理學的一門學科,通過測量巖石中保存的剩余磁性來研究地球磁場的歷史。古地磁在很大程度上依賴于巖石磁學的發(fā)展,巖石磁學研究了巖石的磁特性和剩磁的過程。隨著地磁的變化,古地磁數(shù)據(jù)使研究人員能夠估計在地核液體中產(chǎn)生的主磁場的方向、強度和磁極,因為它隨地質(zhì)時間的變化而變化。該記錄主要用于約束遠古地質(zhì)時期的古地理、板塊運動和極地漂移。CEED旨在利用古地磁學作為研究工具,以整合古地理構(gòu)造并建立板塊運動的參考框架。
EarthByte (https://www.earthbyte.org/) 于 2002年在悉尼大學地球科學學院成立,是一個由多所澳大利亞大學、國際卓越中心和企業(yè)合作形成的國際領(lǐng)先的數(shù)字地球科學聯(lián)盟,由悉尼大學的R.Dietmar Mülle教授領(lǐng)銜,包括軟件開發(fā)小組、動力地形小組、古氣候小組、板塊重建小組和深部過程小組。其基本目標是綜合地質(zhì)時空數(shù)據(jù),將不同的地質(zhì)與地球物理數(shù)據(jù)融合為包括構(gòu)造、地球動力和地表過程在內(nèi)的四維地球模型。
EarthByte的主要內(nèi)容包括板塊運動學、全球和區(qū)域地球動力學、構(gòu)造地質(zhì)學、太古代地球動力學、古氣候模擬、盆地演化和地表過程與構(gòu)造的聯(lián)系、地球空間信息科學。開發(fā)了目前應(yīng)用最為廣泛的古地理重建開源軟件Gplates(Müller et al.,2018)。該軟件是一款交互式的可視化桌面軟件,結(jié)合了板塊構(gòu)造重建(Scotese et al.,1988)、地理信息系統(tǒng)(GIS)功能和光柵數(shù)據(jù)可視化。Gplates可以在Windows、Linux和MacOS X上運行。通過Gplates門戶可下載軟件、教程、兼容的數(shù)據(jù)文件和光柵文件,用戶免費使用只需注明引用。數(shù)據(jù)文件包括:旋轉(zhuǎn)模型、海岸線、大陸形態(tài)、洋-陸邊界、流徑線、熱點、巖漿巖和火山巖分布、古地磁數(shù)據(jù)、洋脊擴張等;光柵文件包括:全球地貌、重力異常、垂直重力梯度、磁性異常、地質(zhì)圖、地殼厚度等。
自2008年以來,地質(zhì)數(shù)據(jù)通過開源和跨平臺的GPlates軟件(圖5)構(gòu)建起靈活開放的板塊構(gòu)造和古地理重建系統(tǒng),新的數(shù)字地球模型覆蓋了10多億年來的地球歷史。重要的是,利用CitcomS等工具將古地理重建與地幔流動的數(shù)值模型聯(lián)系起來,這提高了板塊重建場景的可測試性。這些時間演化的4D地球模型也為板塊—地幔系統(tǒng)在超大陸周期中的演化提供了啟示。基于GPlates軟件的古地理重建還可以探討全球變化問題,如洋中脊生成和大洋板塊俯沖進入地幔的再循環(huán)過程如何驅(qū)動全球尺度地表地形和海平面變化等。
EarthByte的數(shù)字模型資源中與古地理相關(guān)的數(shù)據(jù)集包括:
(1) The Intracontinental basin(ICONS) 地圖集(Heine et al.,2008)。ICONS圖集是240多個陸內(nèi)沉積盆地的數(shù)據(jù)集合,顯示了地殼結(jié)構(gòu)數(shù)據(jù),計算的延伸因子和構(gòu)造沉降網(wǎng)格及其衍生物以及給定盆地的動態(tài)地形演化;
(2)中新世古地貌和古地理測量數(shù)據(jù)集(Herold et al.,2008)。該數(shù)據(jù)集包括有模型調(diào)整和無模型調(diào)整部分;
(3)全球古生物學數(shù)據(jù)庫和顯生宙板塊運動模型(Wright et al.,2013);
(4) Paleoshoreline 數(shù) 據(jù) 集 (Heine et al.,2015)。地圖表示地質(zhì)歷史時期陸地和海洋的分布,為評估非構(gòu)造垂直地殼運動(如地幔對流驅(qū)動的動態(tài)地形)對大陸平臺洪水歷史的貢獻提供了極好的解釋。到目前為止,這些數(shù)據(jù)尚未面向全球提供;
(5) Paleo Atlas for GPlates (Scotese et al.,2016)。用于GPlates的Paleo Atlas由91張古地理地圖組成,這些地圖在時間尺度上跨越晚新元古代至顯生宙;
(6) 古地理數(shù)據(jù)集 (Cao et al.,2017)。以shapefile、GPML和GeoTiff格式提供,這些文件格式可以在GPlates中可視化;
(7)古數(shù)字高程模型(PaleoDEM)資源數(shù)據(jù)集(Scotese and Wright,2018)。PaleoDEM是古地理和古生態(tài)測量的數(shù)字表示,其已被“重建”回時間上,可被用來制作詳細的古地理圖。
此外,EarthByte還有動態(tài)地形、全球和區(qū)域板塊運動模型(Müller et al.,2019)、板塊構(gòu)造和古地磁等方面的數(shù)據(jù)資源可供用戶下載。Earth-Byte團隊是當前古地理重建的創(chuàng)新模范,提倡數(shù)據(jù)共享、軟件開源和數(shù)字地球可視化等先進理念,在卓越的學術(shù)研究、廣泛的合作精神和軟件基礎(chǔ)設(shè)施開發(fā)方面獲得了廣泛認同。
圖5 板塊運動模型(據(jù)Müller et al.,2019修改)Fig.5 Plate motion model(revised after Müller et al.,2019)
TSCreator(Time Scale Creator, https://timescalecreator.org/index/index.php)是由美國普渡大學James George Ogg教授開發(fā)的一個基于JAVA可視化軟件包的地球時間標尺數(shù)據(jù)庫和可視化圖表系統(tǒng)。它能夠從地球歷史時期的全球或區(qū)域事件中探索和創(chuàng)建任意地質(zhì)時間尺度的圖表。除了具有交互式彈出窗口的屏幕顯示外,TSCreator還可以導(dǎo)出PDF、SVG、PNG或JPEG格式的圖表。TSCreator已開發(fā)出可視化接口和數(shù)據(jù)端口,在與學術(shù)界和工業(yè)界的地層學家、古生物學家以及國際地層學委員會的多次地質(zhì)調(diào)查合作中不斷得到完善。
TSCreator的內(nèi)部數(shù)據(jù)庫主要涵蓋顯生宙以來5.5億年的地球歷史時期,其數(shù)據(jù)庫包括超過300個地層柱和50000多個關(guān)于海平面、穩(wěn)定同位素、生物、地磁和地球歷史及其他方面(包括月球和火星)的事件或數(shù)據(jù)點。除了這些內(nèi)部數(shù)據(jù)集之外,用戶還可以下載與合并24個專業(yè)數(shù)據(jù)包中的任何一個(例如,由澳大利亞地球科學編纂的所有澳大利亞盆地的生物地層和地質(zhì)歷史,或一套中國的綜合地層柱)。在支持的數(shù)據(jù)庫中,事件的地質(zhì)年齡和地球歷史圖通過它們間的相互關(guān)系和標準化的地質(zhì)時間標尺模型來校準(目前為GTS2016,計劃在2020年推出GTS2020)。
TSCreator的主要功能包括:(1)屏幕顯示(圖6)。用戶可選擇時間跨度和地質(zhì)時間尺度信息(古生物、古地磁、海平面、地球化學、其他行星等),可以更改選中的列的垂直比例、列寬、字體、顏色、標題、排序、范圍等圖表選項和許多其他功能。鼠標激活的彈出窗口提供有關(guān)列和事件的其他信息。(2)保存。將最終圖形保存為SVG(可縮放矢量圖形)或PDF文件,以便直接導(dǎo)入Adobe Illustrator或其他常用繪圖軟件。還可以保存“設(shè)置”以在屏幕上重新創(chuàng)建圖表。(3)上傳額外的數(shù)據(jù)包、區(qū)域地質(zhì)和樣帶、高分辨率同位素,古代文化事件等;另外,還能創(chuàng)建并上傳自己的數(shù)據(jù)集。在上傳此類數(shù)據(jù)包之后,Pro版本允許保存關(guān)聯(lián)的圖形文件,并重新保存合并的數(shù)據(jù)集。
IHS Markit(https://ihsmarkit.com/index.html)于2014年1月16日注冊成立,總部位于英國倫敦,包括5000多名分析師、數(shù)據(jù)科學家、財務(wù)專家和行業(yè)專家,是全球具有領(lǐng)先地位的關(guān)鍵信息、產(chǎn)品、解決方案和服務(wù)供應(yīng)商,客戶遍布全球100多個國家和地區(qū)。IHS數(shù)據(jù)訪問工具和系統(tǒng)為用戶的IHS數(shù)據(jù)訂閱提供基于web和桌面的訪問,幫助用戶推進關(guān)鍵工作流程,選擇、檢索、整合和可視化相關(guān)數(shù)據(jù),及時做出業(yè)務(wù)決策。IHS Markit的Energy&Natural Resource部門提供電力/天然氣/煤炭/可再生能源數(shù)據(jù)服務(wù)和解決方案,特別是提供石油和天然氣數(shù)據(jù)庫和軟件、能源供需預(yù)測以及全球和區(qū)域市場交易的全面數(shù)據(jù)(https://ihsmarkit.com/industry/energy.html)。它具有當前最大的盆地和油井商業(yè)數(shù)據(jù)庫,是全球數(shù)字古地理重建潛在的基礎(chǔ)數(shù)據(jù)合作伙伴。
圖6 TSCreator的默認地層信息列表(包括年代地層、磁性地層、生物地層的國際標準劃分)及全球重建Fig.6 Default set of stratigraphic information(including international divisions on chronostratigraphy,magnetostratigraphy and biostratigraphy) and global paleogeographic reconstructions
IHS Markit的油藏和盆地服務(wù)提供世界上最有效的油藏和盆地的商業(yè)潛力直接分析。盆地數(shù)據(jù)模塊是一個囊括全球5080多個地質(zhì)省和527個盆地的地質(zhì)數(shù)據(jù)庫,獲取盆地研究和相關(guān)地質(zhì)數(shù)據(jù),用于全球石油系統(tǒng)和油氣遠景分析,幫助用戶在油藏尺度開展風險分析,具體包括分析現(xiàn)有儲量、確定未來的探索潛力、了解每個盆地的地層、巖相和演化特征等。IHS Markit美國油井數(shù)據(jù)庫是美國最大、最全面的油井數(shù)據(jù)庫,幾乎涵蓋了1859年以來的每口鉆井和生產(chǎn)井。美國油井數(shù)據(jù)來源于監(jiān)管機構(gòu),有時直接來源于運營商。IHS Markit的國際油井數(shù)據(jù)庫是一個國際化的勘探與生產(chǎn)數(shù)據(jù)庫模塊,包括73.9萬多口國際油井,油井數(shù)據(jù)可以追溯到19世紀初,對于所有目前活躍的油井都會及時定期更新。
Neftex (https://www.landmark.solutions/Neftex-Insights)成立于2001年,是英國的一家石油研究顧問公司。2014年6月,Halliburton業(yè)務(wù)部門Landmark Software and Services收購了Neftex。Neftex通過提供地球科學產(chǎn)品、咨詢服務(wù)和數(shù)據(jù)管理,協(xié)助領(lǐng)先的石油、天然氣公司進行勘探工作。Neftex的產(chǎn)品提供了全球地球構(gòu)造地層歷史和相關(guān)資源潛力的視圖,以及一些關(guān)于構(gòu)造地層分析和盆地篩選等方面的解決方案,這些解決方案提供了對地球上每個潛在盆地的區(qū)域地質(zhì)和石油系統(tǒng)的詳細數(shù)據(jù),為新風險勘探提供了關(guān)鍵工具。
Neftex是全球搜索領(lǐng)域的專家,以發(fā)現(xiàn)和解釋地球科學信息為主。集成的Neftex全球產(chǎn)品組合可提供數(shù)據(jù)、知識和建議,以幫助客戶降低其勘探和投資活動中的地質(zhì)風險。自成立以來,Landmark已成為集成勘探與生產(chǎn)軟件和服務(wù)的領(lǐng)先供應(yīng)商;建立了第一個交互式3D地震解釋工作站。
在Neftex中,按學科瀏覽可分為地球科學、地質(zhì)力學、巖石物理學等,也能查看深水、非常規(guī)天然氣等資料和區(qū)域地球模型等內(nèi)容。Neftex還提供了有關(guān)層序地層學、分析與決策方面的信息,具體包括:
(1)層序地層學
Neftex的工作流程和解決方案以專有的全球?qū)有虻貙幽P蜑榛A(chǔ),通過識別與海平面升降變化相關(guān)的特定表面(一種替代更模糊的巖石地層單位的方法),可以在全球范圍內(nèi)對地層進行關(guān)聯(lián),并獲得新的時間分辨率。
(2)更完整的分析
Neftex通過使用全球一致的模型,集成已發(fā)布的地球科學信息,可以將多個不同的數(shù)據(jù)集放在一個公共的參考框架中,并提供精確的時間上下限。數(shù)據(jù)集之間的交接意味著分析可以包含更完整的可用數(shù)據(jù)視圖,有助于增加可信度、減少不確定性,并提高對地下風險的理解程度。
(3)集成決策空間
Neftex集成決策空間(Decision Space)模塊,將如今行業(yè)領(lǐng)先的內(nèi)容以Decision Space Geosciences的格式提供。Neftex在3D環(huán)境中分析、解釋大量的地圖、鉆井和剖面,并快速集成專有數(shù)據(jù),從而在一個平臺上有效地管理數(shù)據(jù)和交換知識。
Neftex被Landmark收購為子公司,利用板塊建模的力量深入了解石油系統(tǒng)的生態(tài),利用全面的、行業(yè)領(lǐng)先的地球動力學模型,重建地質(zhì)數(shù)據(jù)集。重建了前寒武紀到顯生宙 (595 Ma至今)每隔100萬年的古地理,及52個關(guān)鍵時段的沉積環(huán)境和數(shù)字古高程圖,可以在QuickPlates、Paleo GIS或Gplates應(yīng)用。
除了學術(shù)團體、個人和商業(yè)組織建立的各類型專業(yè)數(shù)據(jù)庫外,各國地質(zhì)調(diào)查機構(gòu)在開展地質(zhì)調(diào)查工作的過程中也積攢匯集了大量與古地理重建密切相關(guān)的大地構(gòu)造、古地磁、巖石、沉積、古海洋、古生物、古氣候等信息,并且致力于為公眾提供公開共享服務(wù)。作者調(diào)研了世界GDP排名前30的國家及地區(qū)的官方(地調(diào)局或類似機構(gòu))地質(zhì)數(shù)據(jù)庫,并對其中部分與古地理相關(guān)的數(shù)據(jù)庫作簡要介紹:
(1)NGMD
由美國內(nèi)政部和國家合作地質(zhì)測繪計劃支持的美國聯(lián)邦地質(zhì)圖數(shù)據(jù)庫NGMD(The National GeologicMapDatabase,https://ngmdb.usgs.gov/Geolex/search)旨在開發(fā)標準化地質(zhì)科學信息檔案,具有來自600多個出版商的90000多個數(shù)據(jù)和地質(zhì)圖、地形圖等地質(zhì)資料。
(2)中國巖石地層名稱基礎(chǔ)數(shù)據(jù)的共享服務(wù)系統(tǒng)
中國巖石地層名稱基礎(chǔ)數(shù)據(jù)共享服務(wù)系統(tǒng)(http://geodata.geoscience.cn/ysdc/ysdc.action) 包 括巖石地層單位(群、組等)的定義、層型剖面、劃分沿革、頂?shù)捉缇€、內(nèi)部劃分及同物異名、異物同名等內(nèi)容,共收集超過13000條數(shù)據(jù)。
(3)GSJ
日本地質(zhì)調(diào)查局GSJ(GeologicalSurveyofJapan,https://www.gsj.jp/en/database/index.html)的數(shù)據(jù)庫中主要可以檢索按地質(zhì)圖編碼排列的全日本地層名稱,可通過直接點擊具有詳細說明的日本地圖查看或進入地層單元查看。
(4)BGS
英國地質(zhì)調(diào)查局BGS(British Geological Survey,http://www.bgs.ac.uk/lexicon/home.cfm)作為公共部門組織,負責向英國政府提供有關(guān)地球科學各個方面的建議,并為學術(shù)界和公眾等提供地質(zhì)建議,在該數(shù)據(jù)庫中可免費獲取超過100萬個鉆孔記錄,也可查看英格蘭和威爾士境內(nèi)超過130000份井、鉆孔等的分類記錄。
(5)NRC
加拿大自然資源NRC(Natrural Resources Canada, https://weblex.nrcan.gc.ca/weblexnet4/weblex_e.aspx)數(shù)據(jù)庫提供了有關(guān)加拿大超過16000個已發(fā)布的、多源的地質(zhì)名稱信息,分為巖性單元和年代單元兩部分,前者按名稱、作者、年代、區(qū)域檢索;后者按名稱、年代檢索。
(6)GDI
印度尼西亞地質(zhì)數(shù)據(jù)庫GDI(Geology Database of Indonisia, https://psg.geologi.esdm.go.id/search/go)主要分為印尼地質(zhì)數(shù)據(jù)庫和印尼地層詞典兩部分,其詞典的主要來源是地質(zhì)調(diào)查中心(formerly Geological Reseach and Development Center/GRDC)制作的239張系統(tǒng)地質(zhì)圖,覆蓋了Jawa和Madura,科學信息部分包括地質(zhì)遺產(chǎn)、地層詞典、沉積盆地和地質(zhì)圖四大模塊。
總體而言,近年來各類古地理相關(guān)數(shù)據(jù)庫及平臺在數(shù)據(jù)收集、整理、分析以及成果展示等方面均做出了大量開拓性的嘗試,取得了長足進步,然而仍存在很多不足。如個人或團隊建立的數(shù)據(jù)庫往往圍繞較為明確的科學問題,專業(yè)性較強,特點鮮明,卻通常因為機構(gòu)組織等原因,缺乏持續(xù)性與足夠的體量,生命力不強,難以滿足大數(shù)據(jù)時代對數(shù)據(jù)量爆發(fā)式增長的需求;商業(yè)數(shù)據(jù)庫雖然能動性較高,客戶整體體驗優(yōu)良,但數(shù)據(jù)類型相對局限,且大量核心信息往往需要付費獲得,并不能實現(xiàn)數(shù)據(jù)的完全開放、共享;各國政府與官方學術(shù)組織的綜合數(shù)據(jù)庫一般具有相對較大的數(shù)據(jù)量,然而往往在界面語言、檢索方式、產(chǎn)品呈現(xiàn)等人機交互方面做得不夠理想,且因為數(shù)據(jù)來源較多,類型不一,缺乏標準性與統(tǒng)一性,導(dǎo)致數(shù)據(jù)移植性較差,利用效率不高。另外,相比生命科學、材料科學、計算機科學等領(lǐng)域,古地理學乃至整個地球科學領(lǐng)域的數(shù)據(jù)庫智能化程度也整體較低。
古地理(Paleogeography或Palinspastic)的概念最早來自Sterry(Hunt,1873),被定義為利用古植物學和古動物學系統(tǒng)研究地質(zhì)歷史時期的地理學科。隨后,又被定義為古生物地理學(Paleobiogeography)(Willis,1910)。早期的古地理概念著重強調(diào)古環(huán)境,直到Wegener(1912)提出著名的大陸漂移學說后,古地理才具有了真正的活動含義。長期以來,國際古地理重建工作主要是在板塊構(gòu)造理論指導(dǎo)下,重建地史時期的大陸位置、板塊邊界、海陸分布;而國內(nèi)則主要側(cè)重于以礦產(chǎn)資源勘探服務(wù)為導(dǎo)向的不同尺度的盆內(nèi)巖相古地理研究及編圖(馮增昭,2003;陳洪德等,2017;Hou et al.,2018)。隨著數(shù)據(jù)獲取與分析技術(shù)的提高,大量多元化地質(zhì)數(shù)據(jù)迅速積累,將釋放出更多信息。另一方面,可視化技術(shù)的迅猛發(fā)展及人工智能技術(shù)在固體地球科學建模中的廣泛應(yīng)用,也將共同促使古地理重建走向標準化與智能化 (Zhao et al.,2019;Ogg et al.,2019;Zahirovic et al.,2019)。
本文認為,構(gòu)建全球性的開放互動的古地理綜合數(shù)據(jù)平臺,全面搜集、整合、利用數(shù)據(jù),最終實現(xiàn)基于數(shù)據(jù)平臺的任意時間地區(qū)的古地理重現(xiàn)及未來地理預(yù)測,并為能源勘探(何登發(fā)等,2015)、地災(zāi)預(yù)測、生命演化、氣候變化等提供理論、技術(shù)及數(shù)據(jù)支撐,或許將是古地理重建新的歷史使命。其核心過程將包括:(1)建立包括巖相古地理、生物古地理、氣候古地理在內(nèi)的標準化的古地理學知識體系,作為學者與學者、學者與數(shù)據(jù)庫、數(shù)據(jù)庫與數(shù)據(jù)庫溝通的紐帶;(2)建立開放互動的古地理數(shù)據(jù)庫,充分與現(xiàn)有各數(shù)據(jù)庫合作共享,并利用機器閱讀技術(shù)等拓展數(shù)據(jù)來源;(3)由古地理學家和數(shù)據(jù)工程師共同建立古地理學數(shù)據(jù)質(zhì)量控制體系;(4)以大量現(xiàn)有地質(zhì)數(shù)據(jù)為訓練藍本,利用機器學習(Elshawi et al.,2018;Norman,2019;羅建民等,2019)技術(shù)建立各類型古地理重建模型(Gil and Song,2016),深度挖掘數(shù)據(jù)(Bergen et al.,2019;周永章等,2018);(5)以可實時更新的智能數(shù)字地圖集或多維動畫形式輸出多元化成果。在整個過程中,重點需要注意以下幾方面。
2.1.1 古地理學知識體系建設(shè)
知識體系(Liu et al.,2016)是學科研究的骨架,由學科的各種重要概念、方法、標準組成,以知識圖譜(James,1992)的形式展示(Auer et al.,2018;王昊奮等,2019)。古地理學知識體系建設(shè)需要最大限度細分研究對象(如各類沉積相、亞相、微相),最大限度羅列研究指標及其填寫方法(如礦物、巖性、沉積構(gòu)造、古生物等判別指標),從而才能夠最大范圍覆蓋數(shù)據(jù)來源,即各類前人研究成果。古地理學知識體系的整理過程也是對學科內(nèi)容的統(tǒng)一化過程。對于學科重要概念的解釋、重要分類的參考標準等,必須采用國際主流標準。一個完善的古地理學知識體系可以避免對古地理數(shù)據(jù)解釋的混亂,同時也是未來標準化、智能化古地理數(shù)據(jù)庫與其他已有的各類專業(yè)數(shù)據(jù)庫對接的重要基礎(chǔ),可用于指導(dǎo)數(shù)據(jù)平臺內(nèi)核和大數(shù)據(jù)(郭安林等,2004)分析邏輯的開發(fā),將成為學科專家間、數(shù)據(jù)庫間以及學科專家與數(shù)據(jù)庫間相互交流的重要紐帶。
2.1.2 數(shù)據(jù)收集與管理
古地理大數(shù)據(jù)平臺的基礎(chǔ)數(shù)據(jù)具有多來源、多形式及多用途的特征,因此如何對古地理數(shù)據(jù)進行有效的收集與管理是該平臺的一項重要內(nèi)容。古地理大數(shù)據(jù)的主要獲取來源包括各國地質(zhì)調(diào)查局和國際學術(shù)組織的官方數(shù)據(jù)庫、個人或?qū)W術(shù)團隊的專業(yè)數(shù)據(jù)庫、商業(yè)組織的盈利式數(shù)據(jù)庫、各大型出版商以及其他各類可借助機器閱讀智能獲取的公開數(shù)據(jù)。從學科來講,主要包括大地構(gòu)造、古地磁、巖石、沉積、古海洋、古生物、古氣候等。這些基礎(chǔ)資料在時間、空間及所屬上都極為分散,需要古地理數(shù)據(jù)平臺與各組織開展廣泛深入的合作,實現(xiàn)資源共享與共建,同時也需要開發(fā)特有的數(shù)據(jù)管理模塊對信息進行聚合。從數(shù)據(jù)的形式來看,大部分基礎(chǔ)數(shù)據(jù)為定性的描述內(nèi)容,少部分為半定量或定量的測試數(shù)據(jù)。從原始數(shù)據(jù)的存儲方式來看,主要包括Excel、Access、SQL Server及Oracle等類型,甚至不同類型的數(shù)據(jù)體還可構(gòu)架成數(shù)據(jù)倉庫。在構(gòu)建大數(shù)據(jù)平臺之前,這些數(shù)據(jù)都需要整合成一致的操作接口。此外,數(shù)據(jù)的交互性、使用權(quán)限及安全保障,也是古地理大數(shù)據(jù)平臺數(shù)據(jù)管理中的一個核心問題。
2.1.3 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘(Ruppert,2004)是古地理大數(shù)據(jù)平臺最為關(guān)鍵的數(shù)據(jù)分析功能模塊之一。大數(shù)據(jù)分析的特點是將所有樣本數(shù)據(jù)納入數(shù)據(jù)計算分析過程,最大限度避免零散信息的源頭遺失,從而盡可能的從這些低價值密度的數(shù)據(jù)中提取出關(guān)鍵地質(zhì)信息(Reidar,2010)。數(shù)據(jù)挖掘的功能模塊主要由分類 (Classification)、估計(Estimation)、預(yù)測(Prediction)、相關(guān)性分組或關(guān)聯(lián)規(guī)則(Affinity grouping or association rules)、聚類 (Clustering)、復(fù)雜數(shù)據(jù)類型挖掘(Text、Web、圖像、音頻、視頻等)構(gòu)成(Davies et al.,2006;周永章等,2018),這些數(shù)據(jù)分析模塊并非單一的存在,在實際使用過程中往往需要多個模塊有機組合在一起。智能識別中,人工智能與簡單的線性判別孰優(yōu)孰劣還需要結(jié)合具體的實例具體分析(Norman,2019)。對于一些未知的規(guī)律,或許還要從頻譜或者其他數(shù)學方法入手,需要開發(fā)出更多更新的數(shù)據(jù)挖掘方法來對高維的地質(zhì)信息進行深入挖掘。
2.1.4 可視化
古地理大數(shù)據(jù)平臺中的可視化主要包括兩部分:一部分是人機操作界面,良好的用戶體驗是任何一個軟件或平臺生存及發(fā)展壯大的基礎(chǔ)。古地理大數(shù)據(jù)平臺需要持續(xù)發(fā)展,必然要從良好的人機交互界面入手,對于不同類型的圖形、文字等要嚴格參照相應(yīng)的國際標準制定;另一部分是平臺成果的可視化。傳統(tǒng)的古地理圖通常是靜態(tài)、斷代的,是按年或版發(fā)行的,大數(shù)據(jù)驅(qū)動下的古地理重建以實時數(shù)據(jù)庫為依托,從愿景來講,隨著信息的不斷錄入與反饋,是可以實時更新的,可智能生成時代連續(xù)的古地理圖集或動畫。此外,古地理大數(shù)據(jù)平臺還需持續(xù)探索更加多元、直觀、美化的成果展示形式。
目前國際上已有多個團隊在數(shù)字古地理重建方面開展了卓有成效的創(chuàng)新工作。然而,古地理學是一門綜合性非常強的學科,數(shù)字古地理重建需要綜合多學科知識體系,收集和分析多種來源、多種類型的不同數(shù)據(jù);另一方面,數(shù)據(jù)收集、挖掘、可視化等也在很大程度上依賴于計算機技術(shù)的發(fā)展。因此,在古地理大數(shù)據(jù)平臺建設(shè)中必不可少的會面臨一些難點。
2.2.1 沉積相逆向判定
地質(zhì)歷史時期沉積的各套地層,其沉積物質(zhì)與沉積環(huán)境是對應(yīng)的,因而現(xiàn)今地質(zhì)分析中沉積相類型的判識結(jié)果應(yīng)該具有唯一性。但因不同時期收集到的原始地質(zhì)資料有限,分析過程中又忽略掉了部分信息,加之不同研究人員采用的原理及方法可能不同,使得不同學者對相同地層的沉積相認識往往存在一定的差異,這種差異直接導(dǎo)致了沉積相類型判定的不確定性。同樣,不同沉積環(huán)境下的沉積地層在巖性、沉積構(gòu)造、古生物、古地磁、地球化學等屬性方面都可能存在相同,這在逆向判定沉積相的過程中往往帶來相同的判別結(jié)果;此外,判別指標的多少、判別方法的不同及計算容差線的細微差異都可能引起計算結(jié)果的跳變,從而最終導(dǎo)致沉積相判定結(jié)果的不穩(wěn)定。
針對該難點,一直以來的解決思路都是由古地理學家在“地質(zhì)證據(jù)—沉積相”這一因果模型中對各項地質(zhì)證據(jù)的判別權(quán)重進行優(yōu)化調(diào)整;隨著海量多維度數(shù)據(jù)的不斷積累和深度學習技術(shù)的發(fā)展,利用“強相關(guān)性”取代“因果性”,將已確定“沉積相—地質(zhì)證據(jù)”關(guān)系的大量已有資料作為訓練藍本,讓AI進行深度學習,最終獲得由AI生成的智能判別模型,或許將是未來的研究方向。
2.2.2 描述信息定量化
古地理大數(shù)據(jù)平臺的數(shù)據(jù)挖掘模塊通常以定量數(shù)據(jù)(Cai and Zhu,2015)為處理對象,而作為入口參數(shù)端的古地理基礎(chǔ)數(shù)據(jù)很多來源于定性或半定量資料,因而在數(shù)據(jù)分析之前需要對這些定性或半定量數(shù)據(jù)進行定量化表征(Jianping et al.,2016;羅建民等,2019)。由于表征方式不同,數(shù)據(jù)挖掘計算的維度、計算量的大小及計算過程的穩(wěn)定性也將存在較大差異,并且會制約成果解釋的實時性與可靠性。如沉積學中對碎屑巖粒度的描述包括“好、中、差”等,到底是簡單的用數(shù)字如“1、2、3”與之一一對應(yīng),還是結(jié)合地質(zhì)背景,將其定量成高維的數(shù)字向量更為合適?科學全面的解決這類定量化表征問題將需要古地理學科專家與計算機工程師深度協(xié)作,建立多背景下的信息定量化模型體系,并根據(jù)表征結(jié)果反復(fù)優(yōu)化定量化模型(圖7)。
2.2.3 有效數(shù)據(jù)篩選
圖7 古地理描述信息定量表征流程圖(據(jù)Zhao et al.,2019修改)Fig.7 Flowchart of quantitatively characterizing descriptive information in Paleogeography(revised after Zhao et al.,2019)
古地理大數(shù)據(jù)分析是對涉及目標區(qū)塊、目標地層的所有地質(zhì)資料進行綜合處理。為了盡可能挖掘出更多信息,大數(shù)據(jù)分析時需將所有有關(guān)數(shù)據(jù)都引入計算過程。這些不同來源的地質(zhì)數(shù)據(jù)并不一定都對最后的古地理判識起有益作用,加之同一來源的原始地質(zhì)信息也可能本身就存在錯誤,這些有誤的地質(zhì)數(shù)據(jù)很容易造成計算結(jié)果的失真,從而引發(fā)判斷結(jié)果的錯誤。因而在數(shù)據(jù)分析前需要從多源數(shù)據(jù)中篩選出有效的地質(zhì)基礎(chǔ)數(shù)據(jù)。鑒于地質(zhì)數(shù)據(jù)的海量、多源、多維、異構(gòu)等特點(趙鵬大,2019),目前很難建立起統(tǒng)一的數(shù)據(jù)篩選準則,這將是古地理大數(shù)據(jù)平臺建設(shè)需要長期跟進的難點之一。未來古地理大數(shù)據(jù)平臺可考慮加強與4D(Deep-Time Data-Driven Discovery)團隊等具有較強數(shù)據(jù)處理能力的學術(shù)團隊和平臺合作,制定多情景下標準化的數(shù)據(jù)篩選、挖掘流程。
2.2.4 資料缺失區(qū)填充
地球的演化并非均一的,受各種特殊地理環(huán)境限制,可被搜集的古地理基礎(chǔ)數(shù)據(jù)在不同時代不同空間也是分布不均的,不可避免的會出現(xiàn)諸多古地理分析的資料缺失區(qū)。在將今論古的大前提下,以現(xiàn)代沉積為參考,利用瓦爾特沉積相律進行沉積相判定是傳統(tǒng)古地理研究中的常用手段,可在很大程度上解決資料留白區(qū)的沉積相類型的界定問題。在基于大數(shù)據(jù)的標準化、智能化古地理重建過程中,設(shè)定何種準則指導(dǎo)監(jiān)督古地理大數(shù)據(jù)平臺進行資料缺失區(qū)重建,是值得深入探究的問題,需要古地理學家與計算機科學家的協(xié)作努力。
大數(shù)據(jù)正在深刻改變著人類認識和研究世界的思維方式。地球科學與信息科學的融合發(fā)展,處于一個非常重要的時間、空間窗口期,中國的地質(zhì)學家需要抓住這稍縱即逝的窗口期,改變傳統(tǒng)的思維模式,改進傳統(tǒng)的研究方法,直面挑戰(zhàn),擁抱大數(shù)據(jù)時代的到來。
建議古地理學者與信息專家共同協(xié)作,充分總結(jié)現(xiàn)今已有的各類古地理相關(guān)數(shù)據(jù)庫及平臺的先進經(jīng)驗與不足,在深時數(shù)字地球(DDE)計劃搭建的開放、共享、統(tǒng)一的數(shù)據(jù)平臺上,圍繞古地理學重大科學問題,完善古地理數(shù)據(jù)收集、整合、挖掘、可視化等流程,實現(xiàn)標準化、智能化數(shù)字古地理重建。