吳沖龍,張夏林,周 琦,田宜平,張志庭,李俊杰,李 巖,徐 凱
(1.中國(guó)地質(zhì)大學(xué)(武漢)地質(zhì)信息科技研究所,武漢 430074;2.自然資源部基巖區(qū)礦產(chǎn)資源勘查工程技術(shù)創(chuàng)新中心,貴陽(yáng) 550081;3.武漢地大坤迪科技有限公司,武漢 430205)
數(shù)字化是一種歷史潮流。20世紀(jì)80年代,人類進(jìn)入了信息化時(shí)代;21世紀(jì)10年代,人類進(jìn)入了大數(shù)據(jù)時(shí)代;21世紀(jì)20年代之后,人類將邁向智能化時(shí)代。數(shù)字化、信息化、智慧化的理念已深入人心,也成為了地礦勘查行業(yè)創(chuàng)新和發(fā)展的方向。然而,與商業(yè)和制造業(yè)相比較,地礦勘查行業(yè)在業(yè)務(wù)內(nèi)容和服務(wù)對(duì)象上有許多顯著的差異。社會(huì)上所謂企業(yè)“數(shù)字化轉(zhuǎn)型”,主要是指企業(yè)經(jīng)營(yíng)管理和商業(yè)運(yùn)作信息的數(shù)字化表達(dá),而地質(zhì)礦產(chǎn)勘查行業(yè)本身是一種特殊的信息行業(yè)(吳沖龍 等,2005a),其業(yè)務(wù)工作包含專業(yè)探測(cè)和經(jīng)營(yíng)管理兩個(gè)方面,前者就是指地礦數(shù)據(jù)的采集、整理、管理、處理和服務(wù),其產(chǎn)品是地礦數(shù)據(jù)和信息。因此,地礦勘查行業(yè)的數(shù)字化轉(zhuǎn)型需同時(shí)考慮并解決專業(yè)探測(cè)和經(jīng)營(yíng)管理的需求。這兩方面的信息系統(tǒng)建設(shè)和應(yīng)用,既有密切聯(lián)系又是相互獨(dú)立的。
在《自然資源部信息化建設(shè)總體方案》(2019)中提出的“推進(jìn)智能化地質(zhì)礦產(chǎn)調(diào)查,探索智慧探礦新模式,到2025年要形成對(duì)自然資源動(dòng)態(tài)監(jiān)測(cè)和態(tài)勢(shì)感知能力,建成以自然資源‘一張圖’為基礎(chǔ)的自然資源大數(shù)據(jù)體系”,實(shí)際上是指專業(yè)探測(cè)方面的信息化,反映了地礦行業(yè)數(shù)字化轉(zhuǎn)型的國(guó)家目標(biāo)。在本次貴州省重點(diǎn)礦產(chǎn)資源大精查中開(kāi)展數(shù)字勘查,正是對(duì)這個(gè)“方案”的積極響應(yīng)。數(shù)字勘查的科學(xué)目標(biāo),是在地質(zhì)信息科學(xué)理論和方法論框架下,運(yùn)用集成化的地質(zhì)信息技術(shù),建立完善的數(shù)據(jù)資源體系,使數(shù)據(jù)流轉(zhuǎn)順暢、充分共享,進(jìn)而打通勘查、設(shè)計(jì)、開(kāi)采、選冶和管理、決策等各個(gè)環(huán)節(jié),為實(shí)現(xiàn)探采一體化和智能化奠定基礎(chǔ)。顯然,數(shù)字勘查的目標(biāo)應(yīng)是國(guó)家目標(biāo)和科學(xué)目標(biāo)的有機(jī)結(jié)合。
為了加速推進(jìn)地礦行業(yè)的數(shù)字化轉(zhuǎn)型,相關(guān)的頂層設(shè)計(jì)和計(jì)劃安排,首先應(yīng)當(dāng)從實(shí)際出發(fā),即從現(xiàn)有的基礎(chǔ)和現(xiàn)實(shí)需求出發(fā),清理貴州省地礦局經(jīng)過(guò)多年努力已經(jīng)完成和正在建設(shè)的各類數(shù)據(jù)庫(kù),并且總結(jié)已研發(fā)并采用的軟件成果和已實(shí)現(xiàn)計(jì)算機(jī)輔助化的作業(yè)流程,加強(qiáng)對(duì)年輕的技術(shù)骨干的培養(yǎng),并充分調(diào)動(dòng)他們的積極性。其次,應(yīng)當(dāng)從數(shù)字勘查在地礦行業(yè)數(shù)字化-信息化轉(zhuǎn)型的全局定位出發(fā),以數(shù)字勘查為基礎(chǔ)、以地勘單位為主體,著重研究并解決相關(guān)的大數(shù)據(jù)管理問(wèn)題、技術(shù)研發(fā)問(wèn)題、工作效率問(wèn)題、經(jīng)濟(jì)效益問(wèn)題、管理體制問(wèn)題、思想觀念問(wèn)題、作業(yè)習(xí)慣問(wèn)題、流程改造問(wèn)題,等等。
在實(shí)際數(shù)字化轉(zhuǎn)型的過(guò)程中,既要目標(biāo)高遠(yuǎn)而又要循序漸進(jìn),腳踏實(shí)地,經(jīng)由數(shù)字化到信息化,再到智能化;既要顧及方方面面,又要突出重點(diǎn),統(tǒng)籌兼顧,注重統(tǒng)一的數(shù)據(jù)中心、數(shù)據(jù)中臺(tái)和分布式的邊緣數(shù)據(jù)中心、業(yè)務(wù)中臺(tái)建設(shè)。地礦勘查信息化的基礎(chǔ)在于數(shù)字化,因此應(yīng)當(dāng)以數(shù)據(jù)庫(kù)建設(shè)為支點(diǎn),著重加強(qiáng)大數(shù)據(jù)資源體系建設(shè),開(kāi)展數(shù)據(jù)治理。為了使地礦勘查數(shù)據(jù)在各個(gè)工序和各個(gè)環(huán)節(jié)流轉(zhuǎn)順暢,充分共享,應(yīng)當(dāng)在實(shí)施數(shù)字勘查過(guò)程中開(kāi)展主流程改造,建立軌道約束體制;同時(shí),還需要同步解決規(guī)范、標(biāo)準(zhǔn)體系和數(shù)據(jù)安全體系的建設(shè)問(wèn)題,以便為地礦勘查行業(yè)數(shù)字化轉(zhuǎn)型的順利實(shí)現(xiàn),提供強(qiáng)有力的保障體系。
經(jīng)過(guò)多年來(lái)的建設(shè)和實(shí)踐,各基層地勘單位已經(jīng)建立了許多各種類型的數(shù)據(jù)庫(kù),形成了多源多類異質(zhì)異構(gòu)的電子化數(shù)據(jù)資源,并且在若干環(huán)節(jié)采用了數(shù)字化作業(yè)和網(wǎng)絡(luò)作業(yè)方式。然而,由于缺乏系統(tǒng)性、整體性和完整性,并未實(shí)現(xiàn)勘查工作的整體信息化轉(zhuǎn)型。所謂缺乏系統(tǒng)性,是指各個(gè)作業(yè)環(huán)節(jié)的計(jì)算機(jī)應(yīng)用并非密切聯(lián)系、互相依存的,而是各自獨(dú)立的,缺乏層次支承性和橫向協(xié)同性,未能形成首尾相接的作業(yè)流水線,數(shù)據(jù)未能在勘查和管理主流程中順暢流轉(zhuǎn);所謂缺乏整體性,是指各作業(yè)環(huán)節(jié)的計(jì)算機(jī)應(yīng)用缺乏統(tǒng)一規(guī)劃、部署,相互間不具一致性和協(xié)調(diào)性,未形成統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)鏈,因而出現(xiàn)一系列信息孤島;所謂缺乏完整性,是未進(jìn)行地質(zhì)大數(shù)據(jù)資源體系建設(shè),大量歷史數(shù)據(jù)還沒(méi)有入庫(kù),更沒(méi)有建設(shè)完整的地質(zhì)信息系統(tǒng)和統(tǒng)一的數(shù)據(jù)中心、數(shù)據(jù)中臺(tái)、業(yè)務(wù)中臺(tái)和數(shù)據(jù)利用、挖掘的技術(shù)體系,而且各個(gè)業(yè)務(wù)環(huán)節(jié)的計(jì)算機(jī)應(yīng)用基礎(chǔ)設(shè)施和硬軟件配置也不齊備。
地礦勘查工作信息化的內(nèi)涵可歸納為:采用信息系統(tǒng)對(duì)傳統(tǒng)的地礦勘查工作主流程進(jìn)行了充分改造,實(shí)現(xiàn)了全程計(jì)算機(jī)輔助化,數(shù)據(jù)在各道工序間流轉(zhuǎn)順暢、充分共享(吳沖龍 等,2005a,b)。在地礦勘查工作各環(huán)節(jié)應(yīng)用上計(jì)算機(jī)技術(shù),只是地礦勘查行業(yè)數(shù)字化-信息化轉(zhuǎn)型的開(kāi)端,而非地礦勘查行業(yè)數(shù)字化-信息化轉(zhuǎn)型的完成。這是一項(xiàng)復(fù)雜的系統(tǒng)工程,而且地質(zhì)礦產(chǎn)勘查對(duì)象和數(shù)據(jù)極其復(fù)雜,為了迅速趕上歷史發(fā)展步伐,貴州省地礦局及其所屬的各單位,需要在已有基礎(chǔ)上,探索并選擇正確的途徑,從實(shí)際出發(fā),整體設(shè)計(jì),分步實(shí)施,通過(guò)本次大精查來(lái)推進(jìn)勘查工作的信息化轉(zhuǎn)型。
根據(jù)上述基本認(rèn)識(shí),地勘單位的勘查工作信息化包含如下三項(xiàng)密切聯(lián)系且相輔相成的內(nèi)容(吳沖龍 等,2005b):①建立以主題式點(diǎn)源地質(zhì)數(shù)據(jù)庫(kù)為基礎(chǔ)的共用數(shù)據(jù)平臺(tái),避免系統(tǒng)內(nèi)出現(xiàn)大量數(shù)據(jù)冗余,并實(shí)現(xiàn)了多源多類異質(zhì)異構(gòu)空間數(shù)據(jù)和屬性數(shù)據(jù)的一體化存儲(chǔ)和管理;②采用“多S”技術(shù)并進(jìn)行技術(shù)集成、網(wǎng)絡(luò)集成、數(shù)據(jù)集成和應(yīng)用集成,使各種技術(shù)方法與應(yīng)用模型有機(jī)地結(jié)合起來(lái),形成完整的地質(zhì)信息系統(tǒng),數(shù)據(jù)在其中流轉(zhuǎn)順暢、充分共享,并且實(shí)現(xiàn)三維可視化;③利用地質(zhì)信息系統(tǒng)對(duì)地礦勘查工作主流程進(jìn)行充分改造,實(shí)現(xiàn)從資源預(yù)測(cè)、靶區(qū)選擇,到野外數(shù)據(jù)采集、室內(nèi)綜合整理、編圖、三維建模、儲(chǔ)量估算、專題研究,再?gòu)某晒4?、管理、使用到資源評(píng)價(jià)、決策的全程計(jì)算機(jī)輔助化。
地質(zhì)礦產(chǎn)勘查工作信息化建設(shè)與應(yīng)用是一個(gè)系統(tǒng)工程,需要從多個(gè)方面著手進(jìn)行,同時(shí)也需多方面的密切的配合,并努力追求整體的最優(yōu)化。目前,貴州省地質(zhì)礦產(chǎn)勘查開(kāi)發(fā)局的勘查工作數(shù)字化轉(zhuǎn)型,著重從四個(gè)方面強(qiáng)力推進(jìn)。
(1)開(kāi)展省域數(shù)據(jù)資源體系建設(shè) 在限期完成全局各單位全部歷史勘查報(bào)告和成果圖件的清理、編目并載入Web3D系統(tǒng)之后,進(jìn)行掃描存儲(chǔ),然后選擇其中的重要者進(jìn)行矢量化轉(zhuǎn)換。在此基礎(chǔ)上,采用集中式與分布式結(jié)合的策略,構(gòu)建局級(jí)大數(shù)據(jù)中心和隊(duì)院級(jí)邊緣數(shù)據(jù)中心,并利用數(shù)據(jù)湖能以自然格式存放和配置數(shù)據(jù)的優(yōu)勢(shì)(Wikipedia Foundation,2018)對(duì)多源多類異質(zhì)異構(gòu)數(shù)據(jù)庫(kù)和數(shù)據(jù)文件集群進(jìn)行管理、調(diào)度和服務(wù)。
(2)有計(jì)劃地全面開(kāi)展數(shù)字勘查 在實(shí)施的貴州省重點(diǎn)礦產(chǎn)資源大精查項(xiàng)目中,率先在7個(gè)礦床開(kāi)展了數(shù)字勘查試點(diǎn)。通過(guò)制定統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),采用以點(diǎn)源主題式數(shù)據(jù)庫(kù)為核心的成熟地質(zhì)信息系統(tǒng)軟件——QuantyPES,并根據(jù)源自系統(tǒng)分析的邏輯結(jié)構(gòu)對(duì)勘查作業(yè)流程進(jìn)行改造,實(shí)現(xiàn)了從巖心編錄到圖件編繪、礦床三維地質(zhì)建模和資源儲(chǔ)量估算的全過(guò)程計(jì)算機(jī)輔助化和數(shù)字化。隨后,推廣到所有礦產(chǎn)勘查項(xiàng)目中。
(3)構(gòu)建全省域多尺度玻璃國(guó)土 采用具有快速、動(dòng)態(tài)、精細(xì)、全息三維地質(zhì)建模功能的成熟軟件——QuantyPES,開(kāi)展全省域多尺度、多要素的三維地質(zhì)建模,使之成為地質(zhì)大數(shù)據(jù)的最佳載體。在自然資源廳支持下,已經(jīng)完成了全省域1∶50萬(wàn)玻璃國(guó)土建設(shè),實(shí)現(xiàn)了海拔-2500m以淺17.6萬(wàn)平方千米國(guó)土的透明化。目前正在進(jìn)行若干片區(qū)1∶25萬(wàn)、若干整裝勘查區(qū)1∶5萬(wàn)和若干超大型礦床1∶5千三維地質(zhì)模型的構(gòu)建。
(4)開(kāi)展基于大數(shù)據(jù)的資源預(yù)測(cè) 以黔東北大塘坡式隱伏錳礦床和黔西南卡林型隱伏金礦床為例,基于所獲取的全體地物化遙數(shù)據(jù),以尋找相關(guān)關(guān)系為基本目標(biāo),把無(wú)模型與有模型分析結(jié)合起來(lái),采用數(shù)據(jù)密集型計(jì)算方式進(jìn)行成礦預(yù)測(cè)實(shí)驗(yàn)。通過(guò)這項(xiàng)工作,在總結(jié)相關(guān)地勘單位多年來(lái)的工作成果和實(shí)踐經(jīng)驗(yàn)的基礎(chǔ)上,以“復(fù)盤”方式探索并驗(yàn)證了利用大數(shù)據(jù)和機(jī)器學(xué)習(xí)法進(jìn)行成礦預(yù)測(cè)的途徑,取得了顯著效果。
本次數(shù)字勘查實(shí)驗(yàn)的主打軟件QuantyPES,具有“多S”結(jié)合與集成特征,其中包含有DBS、DWS、GIS、CADS、3dMS、RS、GPS、DPS、MIS、DSS、OAS、ANNS和ES等多個(gè)系統(tǒng)的成分,由數(shù)據(jù)采集、數(shù)據(jù)管理、圖件編繪、三維建模、儲(chǔ)量估算、綜合評(píng)價(jià)和成礦預(yù)測(cè)等7個(gè)功能子系統(tǒng)和數(shù)百個(gè)功能模塊組合而成,是一個(gè)龐大的地礦信息系統(tǒng)技術(shù)平臺(tái)。其架構(gòu)為技術(shù)方法與應(yīng)用模型的層疊式復(fù)合結(jié)構(gòu)(圖1),由下而上、由里到外為數(shù)據(jù)采集層、數(shù)據(jù)管理層、技術(shù)方法層和功能應(yīng)用層。其邏輯結(jié)構(gòu)如圖2所示。
圖1 以地質(zhì)大數(shù)據(jù)資源體系為核心的地質(zhì)信息系統(tǒng)結(jié)構(gòu) (據(jù)吳沖龍 等,2005a,修改)Fig.1 Structure of Geological Information System with Geological Big Data Resource System as the core(modified by Wu Chong et al.,2005a)
在該應(yīng)用架構(gòu)中,由下而上可分為數(shù)據(jù)采集層、數(shù)據(jù)管理層、技術(shù)方法層和功能應(yīng)用層等4個(gè)層次。其中,數(shù)據(jù)采集層包括支持地物化遙數(shù)據(jù)采集的各類臺(tái)式、手持式、移動(dòng)式工具;數(shù)據(jù)管理層由一系列異構(gòu)數(shù)據(jù)庫(kù)和數(shù)據(jù)文件集群,以及海量的多源多類異質(zhì)數(shù)據(jù)構(gòu)成,采用數(shù)據(jù)湖的思路、方法和技術(shù)來(lái)管理、索引和調(diào)度;技術(shù)方法層由一系列數(shù)據(jù)分析、數(shù)據(jù)挖掘、智能計(jì)算、三維可視化功能模塊,以及各種模型庫(kù)、方法庫(kù)和知識(shí)庫(kù)構(gòu)成;功能應(yīng)用層以業(yè)務(wù)中臺(tái)為依托,包含數(shù)據(jù)綜合整理、資源勘查評(píng)價(jià)和決策支持3個(gè)部分。其中,資源勘查評(píng)價(jià)部分包括常規(guī)勘查工作中的圖件編繪、三維建模、儲(chǔ)量估算、專題研究和成礦預(yù)測(cè)等。決策支持部分提供資源預(yù)測(cè)和勘查開(kāi)發(fā)決策的分析模型。為了實(shí)現(xiàn)數(shù)據(jù)順暢流轉(zhuǎn)和充分共享,除了數(shù)據(jù)中臺(tái)和業(yè)務(wù)中臺(tái)之外,還應(yīng)進(jìn)行基于微服務(wù)架構(gòu)的云平臺(tái)研究和建設(shè)。
為了“推進(jìn)智能化地質(zhì)礦產(chǎn)調(diào)查,完善并推廣地質(zhì)調(diào)查智能化技術(shù),整合一站式地質(zhì)調(diào)查業(yè)務(wù)管理系統(tǒng),探索智慧探礦新模式”(自然資源部,2019),需要在推進(jìn)省域地礦勘查工作數(shù)字化-信息化轉(zhuǎn)型的同時(shí),根據(jù)信息系統(tǒng)的邏輯結(jié)構(gòu),對(duì)工作主流程進(jìn)行改造,同時(shí)采用物聯(lián)網(wǎng)、云技術(shù)和5G技術(shù),構(gòu)建天空地深一體化地礦勘查數(shù)據(jù)鏈(圖3,4)。只有這樣才能溝通各道工序、聯(lián)結(jié)各個(gè)環(huán)節(jié),形成完整的信息反饋回環(huán),實(shí)現(xiàn)地質(zhì)大數(shù)據(jù)的高效匯聚、調(diào)度、融合、和同化,為未來(lái)的智能化和探采一體化奠定基礎(chǔ)。
圖2 基于多S結(jié)合與集成的QuantyPES數(shù)字勘查系統(tǒng)集成的層次體系
圖3 地礦勘查大數(shù)據(jù)鏈和信息回環(huán)的形成Fig.3 Formation of big data chain and information loop in geological mine exploration
在這個(gè)地礦勘查大數(shù)據(jù)鏈和信息回環(huán)中(圖4),基于問(wèn)題驅(qū)動(dòng)的數(shù)據(jù)采集,是野外工作的主要業(yè)務(wù)內(nèi)容;基于模型驅(qū)動(dòng)的數(shù)據(jù)融合,是資料綜合和圖件編繪的主要業(yè)務(wù)內(nèi)容;基于知識(shí)驅(qū)動(dòng)的數(shù)據(jù)分析,是礦床特征和控礦因素研究的主要業(yè)務(wù)內(nèi)容;基于應(yīng)用驅(qū)動(dòng)的數(shù)據(jù)同化,是成礦作用和成礦過(guò)程模擬的主要業(yè)務(wù)內(nèi)容;而基于數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)挖掘則是成礦預(yù)測(cè)和知識(shí)創(chuàng)新的主要業(yè)務(wù)內(nèi)容。在這樣的數(shù)據(jù)鏈條中,各作業(yè)環(huán)節(jié)承接有序、相輔相成,將支撐地礦勘查工作的數(shù)字化轉(zhuǎn)型及對(duì)智慧探礦新模式的探索(吳沖龍 等,2016)。
圖4 地質(zhì)資源環(huán)境時(shí)空數(shù)據(jù)匯聚與大數(shù)據(jù)鏈組織
數(shù)字勘查所涉及的地質(zhì)信息技術(shù),包括數(shù)據(jù)采集、數(shù)據(jù)傳輸、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)挖掘、圖件編繪、三維建模、儲(chǔ)量估算、過(guò)程模擬、資源預(yù)測(cè)評(píng)價(jià)等。限于篇幅,本文僅對(duì)數(shù)據(jù)采集、數(shù)據(jù)挖掘、圖件編繪、三維建模、儲(chǔ)量估算和資源預(yù)測(cè)等做些介紹和探討。
地質(zhì)數(shù)據(jù)來(lái)源包括:野外露頭地質(zhì)觀測(cè)、鉆探巖心編錄、地球物理勘探與遙感、地球化學(xué)勘探、室內(nèi)巖礦分析測(cè)試和圖形編繪。其采集方式的數(shù)字化,是實(shí)現(xiàn)地礦勘查數(shù)字化轉(zhuǎn)型的關(guān)鍵一步。由于類型繁多、結(jié)構(gòu)復(fù)雜,其采集方式不可能劃一。
目前,各種數(shù)字化采集技術(shù)得到快速發(fā)展,其中包括數(shù)字化的物探技術(shù)、化探技術(shù)、遙感技術(shù)、測(cè)井技術(shù)、巖礦鑒定技術(shù)、化學(xué)成分測(cè)試技術(shù),以及數(shù)字化的素描、攝影、錄像、錄音等多媒體技術(shù),等等。針對(duì)野外地質(zhì)露頭和鉆孔巖心編錄是本次貴州省重點(diǎn)礦產(chǎn)資源大精查項(xiàng)目的主要地質(zhì)數(shù)據(jù)來(lái)源,研發(fā)并應(yīng)用集成RDBS、GIS、RS和GPS于一體的平板電腦的數(shù)據(jù)采集系統(tǒng)(張夏林 等,2020)。這一措施,也是改變野外露頭巖心編錄手工作業(yè)落后面貌的第一步。隨著5G時(shí)代的來(lái)臨,人工智能技術(shù)和云服務(wù)技術(shù)將會(huì)被逐步應(yīng)用于智能化的地質(zhì)數(shù)據(jù)采集中去,甚至可能成為野外地質(zhì)數(shù)據(jù)采集的主流技術(shù)(陳根深 等,2019)。由于硬件性能快速增強(qiáng),傳感器趨向多樣化,測(cè)量精度不斷提升,所采集的野外地質(zhì)數(shù)據(jù)將會(huì)更加豐富、全面。將智能感知和識(shí)別技術(shù)、時(shí)空信息處理技術(shù)、SQLite數(shù)據(jù)庫(kù)技術(shù)和圖形圖像處理技術(shù),引入野外數(shù)據(jù)采集設(shè)備中,對(duì)于提高地質(zhì)資源和地質(zhì)環(huán)境勘查的信息化水平,有重要的現(xiàn)實(shí)意義。
與此同時(shí),需要著力進(jìn)行數(shù)據(jù)采集內(nèi)容的標(biāo)準(zhǔn)化、代碼化,提高數(shù)據(jù)模式的通用性,利用傳感器輔助編錄、語(yǔ)音識(shí)別輔助編錄、可定制字典輔助編錄、界面自定義、地質(zhì)分類詞庫(kù)匹配和語(yǔ)音控制記錄,以及實(shí)時(shí)平、剖面圖編繪的數(shù)據(jù)采集方法,能夠在人機(jī)交互技術(shù)支持下,輔助進(jìn)行野外地質(zhì)數(shù)據(jù)的快捷、智能化采集工作,并且實(shí)現(xiàn)數(shù)據(jù)的現(xiàn)場(chǎng)制圖及可視化表達(dá),大大提高野外地質(zhì)數(shù)據(jù)采集的效率。
地質(zhì)數(shù)據(jù)計(jì)算機(jī)處理的內(nèi)容,包括物探方法模型的正、反演計(jì)算、化探及地質(zhì)編錄數(shù)據(jù)的統(tǒng)計(jì)分析、地質(zhì)特征的空間分析、礦產(chǎn)儲(chǔ)量的估算、工程和水文數(shù)據(jù)分析、鉆孔設(shè)計(jì)和孔斜校正等。近期,隨著大數(shù)據(jù)方法的興起,通過(guò)數(shù)據(jù)挖掘直接在大數(shù)據(jù)中發(fā)現(xiàn)知識(shí)的方式,成為重要的數(shù)據(jù)處理新方法(Han et al.,2012)。大數(shù)據(jù)方法以數(shù)據(jù)為中心,采用全體數(shù)據(jù)和多類數(shù)據(jù)而非抽樣數(shù)據(jù)和單一數(shù)據(jù),可突破樣本空間狹小、僅憑少量隨機(jī)抽樣觀測(cè)數(shù)據(jù)和模式進(jìn)行判斷的限制,更具客觀性(吳沖龍 等,2019,2020)。
4.2.1 地質(zhì)大數(shù)據(jù)挖掘的任務(wù)和內(nèi)容
地質(zhì)大數(shù)據(jù)挖掘的基本任務(wù),是在不同的概念層次中挖掘出各種類型的知識(shí),并用相應(yīng)的知識(shí)模型來(lái)表示,然后根據(jù)所采用的知識(shí)表示方法設(shè)計(jì)出推理模型,為不同領(lǐng)域、不同層次和不同需求的用戶提供行之有效的輔助決策支持(李德仁 等,2013)。常用的知識(shí)表示法為:基于規(guī)則、基于邏輯、基于關(guān)系、基于模型、基于本體、面向過(guò)程、面向?qū)ο?,以及語(yǔ)義網(wǎng)絡(luò)、腳本和模擬,等等。簡(jiǎn)言之,就是直接從數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖中發(fā)現(xiàn)知識(shí),并提供科學(xué)認(rèn)知和決策支持。地質(zhì)大數(shù)據(jù)挖掘的主要內(nèi)容,是可能發(fā)現(xiàn)的地質(zhì)知識(shí)類型(吳沖龍 等,2016),其中包括地質(zhì)特征關(guān)聯(lián)規(guī)則、地質(zhì)特征分布規(guī)則、地質(zhì)異常規(guī)則、地質(zhì)趨勢(shì)變化規(guī)則、地質(zhì)時(shí)空定位規(guī)則、地質(zhì)時(shí)空分類規(guī)則、地質(zhì)時(shí)空關(guān)聯(lián)規(guī)則、地質(zhì)時(shí)空演化規(guī)則等,用于進(jìn)行礦產(chǎn)資源預(yù)測(cè)和礦產(chǎn)資源勘查開(kāi)發(fā)決策。
4.2.2 地質(zhì)數(shù)據(jù)挖掘的基本方法
地質(zhì)數(shù)據(jù)挖掘的理論基礎(chǔ)涉及:確定集合論、擴(kuò)展集合論、機(jī)器學(xué)習(xí)、仿生學(xué)、可視化和文本挖掘等六類(李德仁 等,2013)。其中,利用機(jī)器學(xué)習(xí)進(jìn)行地質(zhì)大數(shù)據(jù)挖掘,是當(dāng)前的研究熱點(diǎn)。機(jī)器學(xué)習(xí)是一種數(shù)據(jù)驅(qū)動(dòng)的模型訓(xùn)練過(guò)程,是人工智能的核心內(nèi)容——通常用仿生學(xué)的人工神經(jīng)網(wǎng)絡(luò)(循環(huán)神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)及其組合)算法來(lái)實(shí)現(xiàn)深度學(xué)習(xí),即通過(guò)構(gòu)建多隱層的機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù)來(lái)進(jìn)行學(xué)習(xí),提升分類或預(yù)測(cè)的準(zhǔn)確性(Hinton et al.,2012;Schmidhuber,2015)。目前,基于機(jī)器深度學(xué)習(xí)的地質(zhì)大數(shù)據(jù)挖掘研究和應(yīng)用,主要集中于巖石、礦物和巖相的識(shí)別和分類(張強(qiáng) 等,2015;Adrielle and Irineu,2015),以及利用地球化學(xué)和遙感地球化學(xué)數(shù)據(jù)等進(jìn)行異常信息提取和成礦預(yù)測(cè)(劉艷鵬 等,2018;徐凱 等,2020)。此外,常用于機(jī)器學(xué)習(xí)的算法還有主成分分析法(PCA)、決策樹(shù)(DT)、支持向量機(jī)(SVM)、聯(lián)合/集成分類器(CC)、隨機(jī)森林法(PRF)、蟻群算法(ACA)、遺傳算法(GA)等。實(shí)踐結(jié)果表明,基于大數(shù)據(jù)的地質(zhì)知識(shí)發(fā)現(xiàn)是個(gè)復(fù)雜的過(guò)程,單靠數(shù)學(xué)方法和挖掘算法難以解決地質(zhì)體、地質(zhì)現(xiàn)象和地質(zhì)過(guò)程認(rèn)知和礦產(chǎn)資源預(yù)測(cè)問(wèn)題,關(guān)鍵在于如何在認(rèn)知規(guī)律的導(dǎo)引下進(jìn)行算法建模和數(shù)據(jù)組織(吳沖龍 等,2020)。
4.2.3 地質(zhì)大數(shù)據(jù)挖掘的算法建模問(wèn)題
通過(guò)大數(shù)據(jù)挖掘進(jìn)行知識(shí)發(fā)現(xiàn),是一個(gè)多源多類異質(zhì)異構(gòu)跨界數(shù)據(jù)廣度聚聯(lián)和深度挖掘的復(fù)雜過(guò)程,即融合地利用地物化遙數(shù)據(jù)的地質(zhì)認(rèn)知過(guò)程。一般認(rèn)為,實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)的數(shù)據(jù)挖掘是一種無(wú)模型挖掘(Mayer-Svh nberger and CuKier,2013)。實(shí)際上,無(wú)模型挖掘是指不給定目標(biāo)知識(shí)模型和先驗(yàn)評(píng)判模型,但有兩種模型是必要的,即研究領(lǐng)域長(zhǎng)期以來(lái)形成的背景知識(shí)模型和數(shù)據(jù)挖掘的算法模型。前者是數(shù)據(jù)挖掘的必要知識(shí)基礎(chǔ),后者是數(shù)據(jù)挖掘必要的方法基礎(chǔ)。由此而論,在開(kāi)展地質(zhì)大數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)之前,首先要準(zhǔn)備背景知識(shí)模型并進(jìn)行系列算法模型構(gòu)建,即無(wú)模型與有模型相結(jié)合。
研究領(lǐng)域的背景知識(shí)模型是指由基礎(chǔ)地質(zhì)理論模型、礦床學(xué)一般理論模型、礦床基本成因模型和礦床基本預(yù)測(cè)模型;系列算法模型包括:地質(zhì)對(duì)象認(rèn)知模型、地質(zhì)數(shù)據(jù)感知模型、地質(zhì)數(shù)據(jù)挖掘模型,以及礦產(chǎn)資源和勘查決策計(jì)算模型,等等。其中,地質(zhì)數(shù)據(jù)挖掘的算法模型,通常以研究主題為導(dǎo)向,按一定工作流程進(jìn)行構(gòu)建。以固體礦產(chǎn)勘查開(kāi)發(fā)大數(shù)據(jù)挖掘?yàn)槔?,其無(wú)模型與有模型結(jié)合的工作流程如圖5所示。
應(yīng)用計(jì)算機(jī)輔助設(shè)計(jì)技術(shù)來(lái)編制地質(zhì)圖件,既能保證質(zhì)量,減少編圖、制圖和修編的工序和時(shí)間,還有利于圖形的存貯、保管和使用,保證實(shí)現(xiàn)圖形數(shù)據(jù)共享。國(guó)內(nèi)、外在這方面都進(jìn)行了許多研究和開(kāi)發(fā)并取得進(jìn)展,所涌現(xiàn)的許多應(yīng)用軟件進(jìn)入了地礦勘查工作的主流程。在這次大精查中采用的QuantyPES軟件,所含有的主要編圖模塊有:鉆孔(井)綜合柱狀圖、實(shí)測(cè)地質(zhì)剖面圖、勘探剖面圖、儲(chǔ)量估算圖、資源預(yù)測(cè)評(píng)價(jià)圖、構(gòu)造綱要圖及各種綜合地質(zhì)圖。在本次貴州省重點(diǎn)礦產(chǎn)資源大精查中,所采用的地礦圖件計(jì)算機(jī)輔助編繪子系統(tǒng),著力在若干技術(shù)的發(fā)展方面進(jìn)行了研發(fā)。其一,是分專業(yè)、分礦種構(gòu)建多種完善的標(biāo)準(zhǔn)圖式、圖例、花紋庫(kù)和色標(biāo)庫(kù),以滿足不同專業(yè)、不同礦種的編圖需求;其二,是以數(shù)據(jù)中臺(tái)和業(yè)務(wù)中臺(tái)為依托,提高了數(shù)據(jù)和軟件的共享性;其三,是與三維圖示技術(shù)結(jié)合,特別是圖切剖面的制作,實(shí)現(xiàn)了與三維礦床地質(zhì)模型的構(gòu)建一體化;其四是與智能計(jì)算和機(jī)器學(xué)習(xí)技術(shù)相結(jié)合,提高地礦信息提取、轉(zhuǎn)換和成圖的自動(dòng)化、智能化程度。
深埋于地下的地質(zhì)體和地質(zhì)現(xiàn)象,不同程度地存在著結(jié)構(gòu)信息不全、參數(shù)信息不全、關(guān)系信息不全和演化信息不全的情況。地質(zhì)學(xué)本質(zhì)上是一種三維科學(xué)(Diepolder,2011),開(kāi)展多源數(shù)據(jù)融合,實(shí)施精細(xì)、全息的三維可視化建模,可以在三維虛擬地質(zhì)環(huán)境中,讓地質(zhì)技術(shù)人員直觀地理解復(fù)雜的地質(zhì)結(jié)構(gòu),提高洞察力和分析判斷力,深入進(jìn)行礦床地質(zhì)分析和成礦系統(tǒng)分析,有助于直觀地感知和理解成礦機(jī)理和過(guò)程,構(gòu)建成礦預(yù)測(cè)模型(圖6)。從而可在新的高度上支撐礦產(chǎn)勘查信息化,有助于感知和發(fā)現(xiàn)隱伏礦床。
顯然,開(kāi)展礦床三維地質(zhì)建模不是為了好看,而是為了好用,應(yīng)使它成為三維可視化地質(zhì)信息系統(tǒng)和地質(zhì)大數(shù)據(jù)的最佳載體。換言之,礦床三維地質(zhì)模型不僅要表達(dá)研究區(qū)精細(xì)的構(gòu)造-地層格架建模,還要凝聚海量的多源多類多主題多要素屬性信息,反映地質(zhì)對(duì)象精細(xì)的非連續(xù)、非均質(zhì)特征。它必須具備支持三維可視化表達(dá)、三維可視化分析、三維可視化設(shè)計(jì)、三維可視化仿真和三維可視化決策的能力(吳沖龍 等,2011;田宜平 等,2020)。這也正是開(kāi)展快速、動(dòng)態(tài)、精細(xì)、全息的礦床三維地質(zhì)建模,被列為本次重點(diǎn)礦產(chǎn)資源大精查重要內(nèi)容的原因。所謂快速,是指能夠在較短時(shí)間內(nèi)完成;所謂動(dòng)態(tài),是指能夠隨時(shí)進(jìn)行局部更新而不必推到重來(lái);所謂精細(xì),是指能夠描述地層細(xì)節(jié)及其非均質(zhì)性;所謂全息,是指能夠凝聚和賦存所獲取的全部空間和屬性特征(吳沖龍 等,2019)。
圖6 三維可視化的礦床地質(zhì)模型示意
在這次重點(diǎn)礦產(chǎn)資源大精查中,礦床三維地質(zhì)建模采用1∶0.5萬(wàn)的比例尺和精度進(jìn)行構(gòu)建。它是多尺度多要素多層級(jí)的省域“玻璃國(guó)土”的基本組分。具體構(gòu)建時(shí),采用了基于數(shù)據(jù)倉(cāng)庫(kù)(集市)的地下-地上、地質(zhì)-地理、結(jié)構(gòu)-屬性一體化建模方式(吳沖龍 等,2019;張夏林 等,2020b)。在所采用的QuantyPES中,精細(xì)的構(gòu)造-地層格架建模,采用基于地質(zhì)知識(shí)驅(qū)動(dòng)和系列勘查剖面拓?fù)渫评硐嘟Y(jié)合方法(何珍文,2008);而精細(xì)的非連續(xù)、非均質(zhì)特征建模,采用多點(diǎn)克里格隨機(jī)模擬方法(陳麒玉,2018)。
采用多方法資源儲(chǔ)量動(dòng)態(tài)估算技術(shù),是數(shù)字勘查的重要組成部分。針對(duì)傳統(tǒng)幾何法資源儲(chǔ)量動(dòng)態(tài)估算存在的可視化及分析程度和精度較低的問(wèn)題,運(yùn)用三維可視化技術(shù)對(duì)其實(shí)現(xiàn)方式、方法進(jìn)行改造,以真實(shí)的三維地質(zhì)幾何模型取代抽象的規(guī)則幾何體,開(kāi)發(fā)出符合中國(guó)資源勘查及儲(chǔ)量分類特點(diǎn)的三維可視化動(dòng)態(tài)估算子系統(tǒng)。主要模塊包括:二維傳統(tǒng)幾何法儲(chǔ)量估算、三維傳統(tǒng)幾何法儲(chǔ)量估算和三維多種克里格儲(chǔ)量估算。在利用各種方法進(jìn)行儲(chǔ)量估算時(shí),均要求實(shí)現(xiàn)計(jì)算和編圖一體化,實(shí)現(xiàn)各種底圖繪制、巖性花紋填充、樣品自動(dòng)組合與標(biāo)注、礦體邊界交互圈定、面積及平均品位自動(dòng)計(jì)算、儲(chǔ)量自動(dòng)匯總輸出、儲(chǔ)量計(jì)算相關(guān)圖件及報(bào)表快速編制輸出等功能。
其中,二維傳統(tǒng)幾何法儲(chǔ)量估算模塊,要實(shí)現(xiàn)地質(zhì)塊段法和剖面法兩種傳統(tǒng)估算方法,可輸出符合規(guī)范的成果圖件及報(bào)表;三維傳統(tǒng)法儲(chǔ)量估算模塊,可在三維可視化環(huán)境中集地質(zhì)圖件編制、三維地質(zhì)建模、動(dòng)態(tài)儲(chǔ)量估算于一體,又以真實(shí)的三維地質(zhì)模型取代抽象的規(guī)則幾何模型,提高資源儲(chǔ)量的估算精度和可靠性,并解決在勘查和開(kāi)采進(jìn)程中的儲(chǔ)量動(dòng)態(tài)估算問(wèn)題(李章林 等,2020)。三維地質(zhì)統(tǒng)計(jì)學(xué)儲(chǔ)量估算模塊,要針對(duì)不同礦床和礦體形態(tài)及空間分布特征,提供普通克里格、泛克里格、對(duì)數(shù)克里格、指示克里格等多種克里格儲(chǔ)量估算模塊,以供選擇使用。對(duì)比結(jié)果表明:本儲(chǔ)量估算子系統(tǒng)各個(gè)模塊的儲(chǔ)量估算結(jié)果,與傳統(tǒng)的手工計(jì)算誤差在1%以下,具有較高的精確性和可靠性,而且做到了方便、快捷和可視化。
本儲(chǔ)量估算子系統(tǒng)的一個(gè)特色功能,是能夠?qū)崿F(xiàn)基于規(guī)則的通用型多金屬礦產(chǎn)資源儲(chǔ)量估算(圖7),能很好地解決多金屬礦床的多礦石類型、變體重計(jì)算、夾石及采空區(qū)扣除等問(wèn)題(陳國(guó)旭 等,2012),對(duì)支持復(fù)雜多金屬礦床的資源儲(chǔ)量估算有重要的現(xiàn)實(shí)意義。
圖7 基于規(guī)則的支持多金屬的礦產(chǎn)資源儲(chǔ)量估算系統(tǒng)實(shí)現(xiàn)方法(陳國(guó)旭 等,2012)Fig.7 Implementation Method of Multi-Metal Mineral Resource Reserve Estimation System Based on Rules(Chen Guoxu et al.,2012)
這是地礦勘查數(shù)字化轉(zhuǎn)型的高級(jí)形態(tài)之一。由于地質(zhì)對(duì)象的極端復(fù)雜性,對(duì)地質(zhì)現(xiàn)象的識(shí)別、地質(zhì)資料的分析和地質(zhì)過(guò)程的認(rèn)知,在很大程度上依賴專家的知識(shí)和經(jīng)驗(yàn)。人工智能技術(shù)可以充分發(fā)揮專家的作用,能使一般地質(zhì)人員象專家那樣進(jìn)行工作,從而提高找礦和勘探效果。因此,這個(gè)領(lǐng)域的研究一直十分活躍。經(jīng)過(guò)多年的研發(fā),涌現(xiàn)了一批基于已有成礦理論和成礦模式建立智能預(yù)測(cè)評(píng)價(jià)軟件系統(tǒng)。
然而,已有成礦理論和成礦模式本身并不完善,基于這些理論和模式建立的成礦預(yù)測(cè)系統(tǒng)的有效性和命中率有限。大數(shù)據(jù)思路與方法的引進(jìn),使得我們有可能采用數(shù)據(jù)密集型工作方式,對(duì)所獲取的全部地物化遙勘查數(shù)據(jù)進(jìn)行挖掘。但僅依靠簡(jiǎn)單的數(shù)據(jù)挖掘方法,并不能完成礦產(chǎn)資源的智能預(yù)測(cè),還需要借鑒地質(zhì)異常分析(趙鵬大,1999)的思路,探索并解決如何從致礦地質(zhì)異?!鷮俚刭|(zhì)異?!C合地質(zhì)異?!V床地質(zhì)異?!V體地質(zhì)異常逐步深入;以及如何從成礦可能地段→找礦可行地段→找礦有利地段→潛在資源地段→遠(yuǎn)景礦體地段逐步聚焦。也就是在大數(shù)據(jù)和第四范式支配下,如何把數(shù)據(jù)挖掘技術(shù)與地質(zhì)學(xué)、礦床學(xué)、勘查學(xué)、物化探技術(shù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù)等緊密結(jié)合起來(lái),采用“廣度聚聯(lián)”和“深度挖掘”的策略和方法,從區(qū)域到點(diǎn)位、從淺層到深層,從單態(tài)到多態(tài)的系統(tǒng)挖掘過(guò)程,再由單一參數(shù)的挖掘,轉(zhuǎn)向多源多類異質(zhì)異構(gòu)數(shù)據(jù)的聚合、融合與挖掘。
在本次重點(diǎn)礦產(chǎn)資源大精查中,研發(fā)團(tuán)隊(duì)以黔東北“大塘坡式”錳礦整裝勘查區(qū)為例,采用數(shù)據(jù)驅(qū)動(dòng)方式把無(wú)模型和有模型結(jié)合起來(lái),成功地進(jìn)行成礦預(yù)測(cè)過(guò)程的“復(fù)盤”和深部控礦條件的追索,證明了基于大數(shù)據(jù)的成礦預(yù)測(cè)是可行的(吳沖龍 等,2020)。
綜上所述,貴州省數(shù)字勘查取得的初步成功,證明所采用的設(shè)計(jì)思路和解決方案切實(shí)可行,所研發(fā)的多項(xiàng)關(guān)鍵技術(shù)應(yīng)用價(jià)值顯著。數(shù)字勘查與全省域玻璃國(guó)土工程、歷史勘查數(shù)據(jù)搶救工程和大數(shù)據(jù)成礦預(yù)測(cè)研究,既是實(shí)現(xiàn)地礦勘查行業(yè)數(shù)字化轉(zhuǎn)型及其與大數(shù)據(jù)深度融合的四項(xiàng)基礎(chǔ),也是地質(zhì)信息科技的重要組成(吳沖龍 等,2014)。
未來(lái)發(fā)展除了不斷完善、優(yōu)化和升級(jí)應(yīng)用軟件系統(tǒng)外,還需要進(jìn)一步加強(qiáng)大數(shù)據(jù)資源體系建設(shè)并考慮智能化轉(zhuǎn)型問(wèn)題,即采用5G技術(shù)賦能,實(shí)現(xiàn)露頭觀測(cè)、巖心編錄、剖面實(shí)測(cè)和礦區(qū)填圖的智能化。其中包括構(gòu)建礦物、巖性、巖相、沉積相、巖漿相、變質(zhì)相、古生物化石、生物痕跡、結(jié)構(gòu)、構(gòu)造的龐大知識(shí)圖譜和知識(shí)庫(kù),以及采用智能算法和機(jī)器學(xué)習(xí)方法,進(jìn)行系統(tǒng)訓(xùn)練和自動(dòng)計(jì)算、識(shí)別,實(shí)現(xiàn)野外地質(zhì)現(xiàn)象觀測(cè)、識(shí)別和測(cè)量的智慧化。
數(shù)字勘查的進(jìn)一步發(fā)展,還將涉及實(shí)現(xiàn)信息感知的橫向數(shù)據(jù)融合和縱向?qū)哟螀f(xié)同,因此應(yīng)當(dāng)兼顧探測(cè)業(yè)務(wù)與經(jīng)營(yíng)管理的信息化轉(zhuǎn)型。前者需要建立跨領(lǐng)域數(shù)據(jù)與多學(xué)科知識(shí)的同層面橫向融合機(jī)制,實(shí)現(xiàn)針對(duì)同一研究主題的數(shù)據(jù)能在多學(xué)科分析中快速流轉(zhuǎn),促進(jìn)理論認(rèn)識(shí)不斷迭代升華。后者需要解決跨層次數(shù)據(jù)與多目標(biāo)管理的協(xié)同機(jī)制,實(shí)現(xiàn)針對(duì)同一研究對(duì)象的數(shù)據(jù)能在多目標(biāo)決策中實(shí)時(shí)流轉(zhuǎn),促進(jìn)實(shí)際效益持續(xù)增量?jī)?yōu)化。因此,經(jīng)營(yíng)管理信息化也應(yīng)當(dāng)是地礦勘查數(shù)字化轉(zhuǎn)型需要關(guān)注的重要內(nèi)容。
在產(chǎn)學(xué)研結(jié)合的體制下,只要勇于實(shí)踐并認(rèn)真總結(jié),定能探索并建立一套切合實(shí)際情況和需要的省域地勘工作數(shù)字化轉(zhuǎn)型的理論、方法和技術(shù)體系。