国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

卷積神經網絡在礦區(qū)預測中的研究與應用

2021-01-04 05:52:36袁傳新賈東寧周生輝
工程科學學報 2020年12期
關鍵詞:結殼海山卷積

袁傳新,賈東寧?,周生輝

1) 中國海洋大學信息科學與工程學院,青島 266000 2) 青島海洋科學與技術試點國家實驗室高性能科學計算與系統(tǒng)仿真平臺,青島266000

富鈷結殼是繼大洋多金屬結核之后發(fā)現(xiàn)的又一深海固體礦產資源,堆積在海底巖石和巖屑表面,主要由氫氧化物和鐵錳氧化物組成.結殼除了鈷元素外,還富含稀土元素和其他的許多金屬,例如鐵、鎂、鎳、銅、鋅等,具有非常高的開采價值[1].富鈷結殼的形成和其他礦產資源一樣,是非常緩慢的自然生成過程,每100萬年只能產生1至6 mm的結殼.礦床主要分布于碳酸鹽補償深度(CCD)以上、最低含氧層以下水深 500~3500 m的平頂海山、海臺頂部和斜坡的表面[2-4].海洋里有諸多海山,僅僅在太平洋區(qū)域廣義海山有約50000多座,高度大于1000 m的海山就有約8000多座[5].富鈷結殼礦床有非常高的經濟價值,估計潛在資源量達10億噸[6].富鈷結殼是海洋中典型的水成成因的礦產資源,由于形成于古海洋和古沉積環(huán)境,除了資源本身的經濟價值,富鈷結殼還記錄了海洋和氣候的演化歷史,具有非常高的環(huán)境研究價值[7].正是由于具有巨大的經濟價值和環(huán)境價值,鈷結殼資源一直是海洋調查的重點.我國富鈷結殼資源的調查開展的比較晚,90年代末才系統(tǒng)的開展起來,投入巨資開展了若干綜合航次調查,至今20多年的時間也僅僅調查了幾十座海山.1997~2002年的航次主要是選擇靶區(qū)的偵察性調查,使用多波束、淺剖、重磁、海底攝像和溫鹽探儀(CTD)等的環(huán)境勘測和使用抓斗、拖網等的地質取樣調查.2002年以后的航次對部分調查過的海山進行加密采樣,調查方法增加了可視抓斗、可視淺剖等[7].無論是初始偵察點的選擇還是之后對整個礦區(qū)的圈定,都需要對大范圍的諸多海域進行大規(guī)模的海山結殼資源調查.科考船需要對未知的區(qū)域進行隨機靶點調查,且對于確定的結殼礦區(qū)的邊界的界定還需要進行大量的勘察工作,這些都將耗費大量的人力、物力和時間.

科考船對不同海域多年的普查工作積累了大量的寶貴資料和數(shù)據(jù),并且這些數(shù)據(jù)正在以指數(shù)級的形式增長.如何把這些數(shù)據(jù)合理的運用起來,促進海洋地質的研究進展,成為了科研工作者關注的熱點問題.作為大數(shù)據(jù)分析和處理的重要技術手段,機器學習方法在找礦領域也得到了廣泛應用.研究發(fā)現(xiàn),地形是結殼富集的一個重要因素,富鈷結殼富集區(qū)具有坡度、平整度等明顯的地形特征.隨著遙感等技術的進步,海拔高度的獲取更加精確,利用密集采點的海拔高度矩陣作為區(qū)域地形特征,具有較高的區(qū)分度.機器學習的分支深度學習善于處理多維數(shù)據(jù)錯綜復雜的關系,運用大量的輸入和輸出得出映射關系[8].其中卷積神經網絡從復雜數(shù)據(jù)中提取特征表現(xiàn)突出,在諸多領域被廣泛應用,特別是圖像分類領域取得了非常好的效果[9].卷積神經網絡結構與數(shù)值矩陣能夠更好吻合,自動完成特征提取,其權重共享機制可以降低網絡復雜性,適合本文基于數(shù)值矩陣的地形特征區(qū)分類找礦任務.

本文從結殼礦區(qū)的地形特征出發(fā),利用卷積神經網絡對大量的數(shù)值矩陣訓練學習得到預測模型,對礦區(qū)靶點進行預測.另外,對本文方法的應用及后序研究工作進行了展望.

1 研究現(xiàn)狀

自1959年國內就開始出現(xiàn)了找礦靶區(qū)的相關研究,隨著研究的深入,出現(xiàn)越來越多與“找礦靶區(qū)”相關的關鍵詞[10].找礦使用的方法一般有經驗類比法、綜合信息法和數(shù)學模型法等,逐漸從經驗找礦向理論和科學找礦過渡.如,劉泉清等提出利用經驗法和化學普查相結合的方法[11],楊恒書等創(chuàng)用濃度級次值特征對比模型和相近率線性模型[12],中國科學院地質與地球物理研究所總結提出“三場異?;ハ嗉s束”預測新理論[13],張慶華等提出物探、化探與遙感相結合的方法[14].隨著科學技術的發(fā)展與研究的不斷深入,諸多新技術、新方法被應用到找礦中來.智能找礦方法是在地質類比法和模型法應用的基礎上,結合計算機技術,將已有的專家經驗和一定的礦床模型輸入計算機,建立起預測模型系統(tǒng),將研究區(qū)的有關資料輸入,在此基礎上進行評判.如,王世稱主導的綜合信息礦產預測系統(tǒng)[15],趙鵬大的大比例尺礦床統(tǒng)計預測專家系統(tǒng)[16]等.深度學習和機器學習迅猛發(fā)展,硬件技術的進步,簡潔的python語言、完善的深度學習框架Tensorflow以及基于Theano/Tensorflow更簡單易上手的高階框架Keras,推動了智能找礦發(fā)展.已有許多學者投入到機器學習與找礦以及成礦預測的研究中來,如徐述騰和周永章以吉林夾皮溝金礦和河北石湖金礦的黃鐵礦、黃銅礦等為例,設計了Unet卷積神經網絡模型,實現(xiàn)了鏡下礦石礦物識別分類[17];劉艷鵬等通過卷積神經網絡算法挖掘Pb分布特征與礦體地下就位空間的耦合相關性進行礦產資源預測[18],肖壯等提出基于深度學習的礦區(qū)韌性剪切帶找礦研究[19]等.然而,大部分研究是以陸地礦為基礎的,海洋底部礦區(qū)的找礦工作要復雜許多,迫切需要在找礦靶區(qū)的選取方面進行改進,增加成功找到礦區(qū)的可能性,減少時間和人力、物力成本.

2 地形特征與理論方法

2.1 海山富鈷結殼礦區(qū)地形特征

結殼的形成及其豐度變化受控于諸多因素,經緯度、區(qū)域地質構造、水深、地形和水文等都會對結殼的生長產生重要影響[20].例如,海山經緯度位置決定了海山洋流速度以及流向,進而決定了結殼的附著程度、豐度以及類型;大量的研究成果以及統(tǒng)計數(shù)據(jù)表明,水深影響結殼的生長和富集,結殼大部分分布在水深1000~3000 m范圍內;結殼的產生來源于海水中的微生物和鈣質粒子,水文環(huán)境也是一個重要因素.研究認為,結殼分布與海山的地形特征具有一定的關系,控制作用效果也比較明顯[21].結殼產生于各大洋區(qū)的水下高地,海山和島嶼斜坡是主要富集區(qū),海山對結殼成礦具有重要意義.三大洋中,太平洋海山富鈷結殼礦點的分布比例占到了73.3%.在空間上,海山山頂區(qū)一般為微結核發(fā)育區(qū),在海山的局部高地會有結殼生長成礦[22].海山分為尖頂海山和平頂海山兩大類,尖頂海山山頂、邊緣、上部斜坡及中部斜坡區(qū)山脊部位最容易成礦,平頂海山邊緣和除陡崖外的上部斜坡區(qū)成礦率也較高[23].

圖1表征了本文數(shù)值矩陣反應的地形特征,橫縱坐標表示各海拔取值點相對于第一個點的水平方向距離d1和d2,豎坐標軸表示各取點海拔高度h,均以米為單位.從形態(tài)學上講,海山的形態(tài)要素主要包括海山坡度、海山表面平整度[24],因此要考慮的因素主要有坡度和海山微地貌特征.地形坡度太小,海水中的物質不容易沉積;在地形坡度較大的地方,結殼生長過程中容易塌落[25].坡度較大和坡度較小都不利于結殼的形成.根據(jù)礦物質沉積理論,顆粒最容易在凸起的部分聚集,山坡上的裸露巖石成為結殼生長有利位置.對本文獲得的數(shù)值矩陣計算坡度值得表1,坡度大部分處在8°~12°范圍內,坡度較陡的地形較少.

圖1 局部海山地形Fig.1 Local seamount terrain

表1 地形坡度統(tǒng)計Table 1 Topographic slope statistics

分析認為,富鈷結殼在一定范圍內的坡度和平整度的海山區(qū)域容易生長富集,具備明顯的分類特征,可以作為找礦靶點的依據(jù).運用容易獲得的海拔高度矩陣作為地形特征,并采集大量的正負樣本,使用在分類問題上表現(xiàn)優(yōu)異的卷積神經網絡進行二分類,進而成為富鈷結殼礦區(qū)和結殼富集海山選定的參考依據(jù),具有現(xiàn)實意義.

2.2 數(shù)據(jù)處理方法

2.2.1 數(shù)據(jù)標準化

數(shù)據(jù)標準化(歸一化)的目標是突出主要特征的作用,弱化次要特征的影響.富鈷結殼在不同海拔高度位置均有站點,地形矩陣數(shù)值分布在-4000~-800 m之間,跟前文提及富鈷結殼主要分布在1000~3000 m范圍內基本一致.不同的矩陣數(shù)值的平均高度差別很大,而需要考慮的主要因素是整個矩陣反應的地形特征,高度數(shù)值的大小屬于次要因素,因此要處理高度之間的差別.

常用的兩種數(shù)據(jù)標準化的方法是min-max和Z-cores.min-max標準化對原始數(shù)據(jù)進行變換,把結果值范圍映射到0~1之間,函數(shù)為(1),min和max分別為最小值和最大值.Z-cores標準化處理數(shù)據(jù)使之符合標準正態(tài)分布,函數(shù)為公式(2),μ和σ分別為樣本均值和方差.本文對min-max標準化方法做了改變,首先計算所有矩陣的max與min之差,取差值的最大值MAX,然后將公式(1)中分母部分替換為MAX,函數(shù)為公式(3),目的在于防止崎嶇地形與平緩地形混淆.

2.2.2 插值算法

雙線性插值算法根據(jù)插值點最接近的4個點的像素值進行計算.設(i+u,j+v)為坐標變換后浮點坐標,f(i,j)為坐標(i,j)位置的像素值,f(i+u,j+v)即為坐標變換后的像素值,其中i、j為整數(shù)部分,u、v為小數(shù)部分[25].則這個像素值可由公式(4)得出.該算法保證了插值曲線的平滑性,彌補了最近鄰算法的不足,是插值效果和運算速度相對較優(yōu)的算法,也是使用最廣泛的.

2.3 模型結構

本文的數(shù)值矩陣代表的是礦區(qū)地形,每一個數(shù)值都有空間位置關系,相當于圖像中的像素點.因此,與特征提取和支持向量機(SVM)、隨機森林等傳統(tǒng)統(tǒng)計方法結合相比,使用更適合圖像處理的卷積神經網絡.卷積神經網絡與傳統(tǒng)深層神經網絡相比,可以明顯降低模型規(guī)模,并且識別性能最好,泛化能力最強[26].

針對數(shù)據(jù)集特性,搭建了適合本文區(qū)分類找礦研究的Conv-3模型.圖2給出了Conv-3模型的結構圖,該卷積神經網絡網絡共包含7層:一個輸入層,三個卷積層C1、C2和C3,兩個全連接層F4和F5,一個輸出層.在該模型中,輸入層的輸入為50×50的數(shù)值矩陣,卷積層均使用16個5×5的卷積核,全連接層分別使用2048和128個神經元,輸出層使用softmax函數(shù)進行分類.

VGGNet16是一種深度卷積神經網絡結構,通過不斷深化網絡結構提高性能[27],在此結構中卷積層均使用3×3的卷積核,池化層使用的是Maxpooling.為了滿足實驗要求,本文使用插值算法對輸入的數(shù)值矩陣進行擴充,修改兩層全連接層神經元個數(shù)為2048、512,又分別采用(1)更改池化層為Max-pooling和(2)更改卷積層卷積核為3×3進行對比實驗.

3 實驗過程

本文使用已知的富鈷結殼站點的坐標和未知區(qū)域坐標數(shù)據(jù)提取了網格型數(shù)值矩陣,對數(shù)據(jù)進行調整后,分別使用Conv-3、VGGNet 16和兩個修改后的VGGNet 16結構進行對比實驗.

3.1 數(shù)據(jù)來源

正樣本原始數(shù)據(jù)來源于國際海底管理局(ISA)的富鈷結殼主量元素標準數(shù)據(jù)集,由國家海洋科學數(shù)據(jù)共享服務平臺提供.數(shù)據(jù)量共計1203站,3286個樣品,空間范圍覆蓋全球大部分海域(-180°~180°E,-64.18°~56.17°N).剔除一些坐標分布較密集區(qū)域的坐標,實際使用1100個站點用來作為提取數(shù)值矩陣正樣本的基準數(shù)據(jù).調用Google Earth軟件的API,在全球以100 km為步長提取共計12萬坐標以及海拔高度信息,從中隨機均勻選取15200個海拔高度在-4000~-800 m之間的坐標信息作為原始數(shù)據(jù)的負樣本的基準坐標數(shù)據(jù).在負樣本中有一定的存在噪聲的可能性(即可能為富鈷結殼礦區(qū)),因為可能性非常小,可以認為有較高的可信度.

正負樣本基準地理坐標信息被存儲為26份文本,分布于26臺計算機上.在每一臺電腦上運行Google Earth和在Visual Studio上基于C++的數(shù)據(jù)提取程序.程序自動讀取文本文件的每一個坐標(A,B),以(A,B)為中心點,以C為步長的度數(shù)表示,在 0.8~1 km2范圍內從經度A-25×C到A+25×C、緯度B-25×C到B+25×C調用Google Earth軟件的API提取50×50的海拔高度數(shù)值矩陣.

本文最終獲得了共計16200個存儲海拔高度數(shù)值矩陣的文本,其中正樣本1100個,負樣本15200個.因為正樣本數(shù)據(jù)量過小,而地型特征具有旋轉、翻轉的不變性,利用這些特性將正樣本的數(shù)據(jù)擴充為原來的8倍,得到8000個正樣本,最終使用正負樣本共計24000個地形數(shù)據(jù).

3.2 數(shù)據(jù)處理及算法實現(xiàn)

圖2 Conv-3 結構圖Fig.2 Conv-3 schematic

對于正負樣本的數(shù)據(jù),使用文件名作為標簽的標注,在程序中使用OS模塊讀取文件名,將正負樣本分別標注為1和0.使用Numpy數(shù)值計算庫以矩陣的形式讀取每一個文本,對矩陣的每一個數(shù)值x1,更新數(shù)值x1= (x1-min)/MAX,更新后的數(shù)據(jù)如圖3所示.

圖3 處理后的數(shù)據(jù)示例Fig.3 Example terrain of processed data

此種做法針對本文實驗數(shù)據(jù)存在兩點優(yōu)點,一是如前文所述,計算所有矩陣最大值與最小值差值,取最大差值MAX為分母,解決了使用原始方法平地和崎嶇地形分不開問題;二是取得每一個矩陣的最大值max1和最小值min1,使用MAX和(max1-min1)的最大值Max為分母,防止對于新數(shù)據(jù)處理后出現(xiàn)矩陣大于1的情況.如圖4所示,橙色表示使用min-max方法數(shù)據(jù)標準化的結果,任何矩陣都被拉伸至范圍0~1,會混淆平地和陡坡,影響各矩陣相對坡度特征;藍色表示使用統(tǒng)一參數(shù)MAX標準化的結果,保留了各矩陣原有的相對坡度特征不變.

另外,VGGnet 16要求數(shù)值矩陣的大小至少為48×48,且必須為3通道.為了網絡模型的要求,并保證原始矩陣反應的地形特征不變,在進行對比實驗時本文使用雙線性插值將數(shù)值矩陣擴大為112×112,使用opencv的cvtColor函數(shù)將單通道數(shù)值矩陣轉換為3通道.

圖4 同一陡坡矩陣的兩種標準化結果Fig.4 Example of processed data

本文算法的實現(xiàn)基于python語言,使用Numpy數(shù)值計算庫和Opencv計算機視覺庫進行數(shù)據(jù)讀入和預處理,基于深度學習高階API Keras搭建了4種神經網絡結構,實驗結果的展示使用python的Matplotlib模塊.

3.3 實驗結果與分析

對24000個地形矩陣數(shù)值矩陣進行區(qū)分類,19200個作為訓練集,4800個作為測試集,其中訓練集劃分20%作為驗證集.本文使用多種網絡結構對訓練集進行訓練,并對幾種取得較好結果的模型效果圖進行展示.

從圖5來看,左圖訓練集和驗證集的Loss值逐漸下降,右圖訓練集和驗證機Accuracy逐漸上升,且兩圖曲線均呈收斂態(tài)勢,說明Conv-3訓練模型對已有數(shù)據(jù)是有效的.從Loss曲線可以看出在訓練到65輪后驗證集Loss開始高于訓練集Loss且差值有擴大的趨勢,產生過擬合,說明在65輪時模型取得最好效果,此時準確率為0.8246,Loss為0.415.

圖5 Conv-3的損失曲線(a)和準確率(b)Fig.5 Conv-3 loss (a) and accuracy (b)

圖6、圖7和圖8是使用VGGNet 16及其變式運用控制變量法進行的對比實驗.和前面的Conv-3模型的結果一樣,三種模型在訓練集和驗證集的Loss曲線和Accuracy曲線均收斂,充分證明了本文獲取的地形特征數(shù)值矩陣數(shù)據(jù)集是可訓練的.另外,圖6和圖7可以得出,VGGNet 16使用5×5和使用3×3的卷積核相比在模型準確率上更高,且收斂性更好.由圖7和圖8可以得出,在本文的研究中圖8使用的Mean-pooling和圖7使用Max-pooling相比,準確率上有所提高,模型的收斂和穩(wěn)定性也較好.

使用訓練得到的4種模型,在4800個測試集上進行預測,表2是預測得到的準確率的結果.可以得出,4種模型可靠性都比較高,使用VGGNet 16(5×5,Mean-pooling)上的準確率為 0.8346,分類效果最好.

圖6 VGGNet 16 損失曲線(a)和準確率(b)Fig.6 VGGNet 16 loss (a) and accuracy (b)

圖7 VGGNet 16(5×5,Max-pooling)損失曲線(a)和準確率(b)Fig.7 VGGNet 16 (5×5, Max-pooling) loss (a) and accuracy (b)

圖8 VGGNet 16(5×5,Mean-pooling)損失曲線(a)和準確率(b)Fig.8 VGGNet 16 (5×5, Mean-pooling) loss (a) and accuracy (b)

表2 實驗結果Table 2 Results of experiments

從實驗結果可以得到:本文從富鈷結殼礦區(qū)地形特征出發(fā),利用卷積神經網絡對海拔數(shù)值矩陣訓練得到預測模型.相對于已有的數(shù)據(jù),對找礦靶點進行預測是可行的.

4 結論

(1)傳統(tǒng)的預測方法通過一定的規(guī)則集合將專家觀點、地質背景、成礦類型等因素綜合考慮,影響找礦預測成果的最大因素是找礦者的先驗知識.以富鈷結殼礦區(qū)地形特征為出發(fā)點,運用目前非常熱門的卷積神經網絡模型學習特征,進行結殼礦區(qū)預測的初步研究,VGGNet 16(5×5,Meanpooling)在本文的富鈷結殼地形數(shù)據(jù)集中實現(xiàn)較好的預測效果.

(2)通過實驗結果可以得出,利用地形特征進行富鈷結殼礦區(qū)進行找礦靶點預測切實可行,在準確率方面仍有提升空間.

(3)富鈷結殼礦區(qū)分布受諸多因素影響.相信在不久的將來,隨著數(shù)據(jù)量和精度的增加以及更深入的研究,可以把更多的影響因素放入深度學習模型當中,得到更精確的預測,可以普遍應用于勘探找礦生產環(huán)境中.

猜你喜歡
結殼海山卷積
西太平洋鐵錳結殼中兩類不同成因磷酸鹽的元素特征、形成機制及指示意義
基于3D-Winograd的快速卷積算法設計及FPGA實現(xiàn)
On the heating mechanism of electron cyclotron resonance thruster immerged in a non-uniform magnetic field
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
我就是我,富鈷結殼
夢里鮮花開放
37°女人(2019年4期)2019-04-20 02:17:42
基于傅里葉域卷積表示的目標跟蹤算法
佐藤海山的詩
作品(2016年10期)2016-12-06 10:41:54
迎春花
大江南北(2016年3期)2016-11-22 07:37:20
全球三大洋海山鈷結殼資源量估算
海洋學報(2015年1期)2015-10-24 07:00:03
乌拉特前旗| 永州市| 颍上县| 建始县| 茶陵县| 乐安县| 冀州市| 天等县| 常州市| 广南县| 海城市| 称多县| 邢台县| 新邵县| 韶山市| 巫山县| 巴楚县| 保德县| 四平市| 柘荣县| 昭通市| 湘乡市| 松溪县| 都昌县| 清水河县| 林甸县| 达孜县| 潜山县| 奎屯市| 大冶市| 常熟市| 台山市| 南陵县| 肥乡县| 婺源县| 喀什市| 漳州市| 陕西省| 永靖县| 岐山县| 修文县|