国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機器學習方法的數(shù)字巖芯電導率預測

2020-07-15 05:04:04晨,陳
計算機技術(shù)與發(fā)展 2020年7期
關(guān)鍵詞:電導率巖石機器

郭 晨,陳 龍

(長安大學 信息工程學院,陜西 西安 710064)

0 引 言

數(shù)字巖石物理(digital rock physics,DRP)是近些年興起的一種計算巖石物理的方法。通過CT掃描技術(shù)對巖石樣本進行三維成像,建立能模擬巖石孔隙空間分布的數(shù)字化巖芯數(shù)據(jù),在此基礎(chǔ)上進行數(shù)值模擬,計算巖石等效物理參數(shù)[1]。數(shù)字巖石物理包含數(shù)字巖芯模型建立和等效物理場模擬兩個大的部分,其數(shù)字巖芯微觀結(jié)構(gòu)可見,微觀影響因素可控,能進行多物理場模擬,相比較實驗巖石物理而言,這種分析方法較為精確且效率高[2]。數(shù)字巖石物理可廣泛應用在模擬流動性[3]、滲透性[4]、電特性[2]、聲學[5]及彈性[6]等領(lǐng)域。其中巖芯的電特性對于確定巖性,劃分油水層、確定油水飽和度等物理參數(shù)具有重要參考作用。然而在實際應用中,由于CT掃描得到的巖芯三維數(shù)據(jù)龐大,對其進行精確物理場數(shù)值計算時耗費資源巨大。為了提高數(shù)字化分析方法的效率,本研究將機器學習方法創(chuàng)新性地應用到了數(shù)字巖石物理之中。機器學習就是通過編碼使得計算機具有像人一樣的學習能力,進而對新的數(shù)據(jù)進行預測[7]。本研究的目標為:通過機器學習模型對標定電導率的巖芯數(shù)據(jù)進行特征化學習,最終免去復雜耗時的物理場數(shù)值計算,直接通過巖芯數(shù)據(jù)預測其電導率。傳統(tǒng)的機器學習算法有K近鄰算法、決策樹、線性回歸、支持向量機、樸素貝葉斯分類器和邏輯回歸等,而神經(jīng)網(wǎng)絡是一種特殊的機器學習方法,被廣泛應用于圖像分類、目標檢測、語音識別、圖像和語音生成等方面[8]。目前神經(jīng)網(wǎng)絡相較于傳統(tǒng)機器學習方法而言,其性能最優(yōu),但它也需要更多的數(shù)據(jù),可解釋性差,且計算成本高,因此兩者是各有所長。在本研究中傳統(tǒng)的機器學習方法和神經(jīng)網(wǎng)絡都被應用到巖芯電導率預測方面,通過學習巖石的幾何特征、圖像空間分布與電特性的映射關(guān)系等,最終達到優(yōu)化預測效果、降低計算開銷的目的。

1 數(shù)據(jù)處理

在研究中使用了400×400×400體素的貝雷亞砂巖巖芯(Berea Sandstone)。巖芯圖像是三維二進制數(shù)據(jù),在三維空間中,單個位置的數(shù)值為1或0,分別代表巖石固體或空隙。為了獲得足夠多的實驗巖芯樣本,實驗中對數(shù)字巖芯圖像進行子樣截取。由于考慮到巖芯的幾何特性和計算資源,該實驗采用64×64×64作為截取尺寸。研究使用了一個“移動立方體取樣器”的方法對原始圖像進行子取樣[9]。以貝雷亞砂巖巖芯圖像上沿著XYZ各個正方向每次移動24個單位進行子樣截取,子樣與子樣之間可能會有重合部分。最終實驗共獲得了3 375個體素64×64×64尺寸的巖芯樣本。取樣后使用有限元的方法計算出每個巖芯樣本的電導率,用電導率作為機器學習的目標。

2 特征提取

2.1 Minkowski泛函

Minkowski泛函是幾何形態(tài)特征的統(tǒng)計量。對于n維空間,有n+1個的Minkowski測量量。3維圖像具有4個Minkowski測量量,分別是體積(V)、表面積(S)、平均積分曲率(平均寬度)(M)和歐拉特性(X)[10]。歐拉特性又常稱作高斯曲率積分,公式如下:

V=V(y)

其中,r1(s)表示表面上的最大曲率,r2(s)表示表面上的最小曲率。Minkowski泛函可以綜合反映巖石幾何參數(shù),如孔隙度、比表面積、顆粒的圓度等[11]。巖芯幾何特性直接影響到巖芯的電特性。因此使用Minkowski泛函在預測巖芯電導率上展示出更好的優(yōu)勢。為了更直觀地表現(xiàn)巖芯樣本的幾何特征,將體積轉(zhuǎn)為孔隙率(空隙體積/總體積),表面積轉(zhuǎn)換為比表面積(面積/體積)。實驗中巖芯樣本的孔隙率、比表面積、平均曲率積分和歐拉特性是由三維二元分割圖像中直接計算獲得。

2.2 三維二元分割圖像

三維二元分割巖芯圖像作為卷積神經(jīng)網(wǎng)絡的輸入。實驗巖芯的體素為64×64×64,單個空間位置上的數(shù)值為1或0。實驗中將原為0到1的數(shù)值區(qū)間投影到-1到1的區(qū)間。具體操作是將原來圖像上的0替換成-1。

3 方 法

3.1 機器學習

機器學習(machine learning,ML)是通過算法使得計算機具有學習能力,從歷史數(shù)據(jù)中學習規(guī)律,進而預測新的數(shù)據(jù)。機器學習的步驟主要分為選擇數(shù)據(jù)、搭建模型、驗證模型、測試模型、使用模型、優(yōu)化模型。

3.2 集成學習

集成學習(ensemble learning)是一種學習算法,它構(gòu)造一組分類器,通過對預測進行(加權(quán))表決來對新的數(shù)據(jù)進行分類[12]。常見的集成技術(shù)有Bagging、Boosting和Stacking。

3.2.1 加權(quán)平均法

加權(quán)平均法:

加權(quán)平均法是一種集成策略。通過模型訓練可以得到多個不同的學習器,加權(quán)平均法是對每個使用的學習器的結(jié)果賦予不同的權(quán)值,實現(xiàn)結(jié)果的融合。對于驗證結(jié)果較好的學習器賦高權(quán)值,而驗證結(jié)果較差的學習器賦低權(quán)值,在賦值的同時保證總權(quán)值為1[13]。

3.2.2 堆疊法

Stacking不使用瑣碎的函數(shù)(如硬投票,加權(quán)平均)執(zhí)行集成,而是訓練一個學習器來執(zhí)行這個集成的過程。在Stacking中個體學習器被稱為初級學習器,而用于結(jié)合的學習器稱為次級學習器。Stacking先從初始數(shù)據(jù)集訓練出初級學習器,將初級學習器的輸出當作特征構(gòu)成新數(shù)據(jù)集,利用新數(shù)據(jù)集再訓練次級學習器[14]。Stacking使用的初級學習器可以是同一種算法,也可以是不同的算法。

3.3 多層神經(jīng)網(wǎng)絡(MNN)

多層神經(jīng)網(wǎng)絡包含輸入層、隱含層和輸出層,結(jié)構(gòu)如圖1所示。每一層的神經(jīng)元與下一層神經(jīng)元都相互連接,同層神經(jīng)元不連接。對于多層神經(jīng)網(wǎng)絡一般采用誤差逆?zhèn)鞑砀聶?quán)值[15]。

圖1 神經(jīng)網(wǎng)絡結(jié)構(gòu)

3.4 3D卷積神經(jīng)網(wǎng)絡(3DCNN)

3D卷積神經(jīng)網(wǎng)絡是一種深度神經(jīng)網(wǎng)絡,主要包括卷積層、子采樣層和全連接層。在卷積層中實現(xiàn)卷積操作。使用卷積核進行卷積運算,卷積核的大小是遠小于圖像矩陣的。具體操作是對于圖像矩陣的每一個像素計算它周圍像素與卷積核的乘積。為了避免維數(shù)災難,通常在卷積層之后用一個子采樣層來降低特征維數(shù)。全連接層是一種下一層的每一個神經(jīng)元都與上一層的每個神經(jīng)元相連接的網(wǎng)絡結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡通過卷積層、子采樣層和全連接層組合的框架降低計算成本,防止過擬合,且提高了圖像識別的準確性。

三維卷積如圖2所示。

圖2 三維卷積

4 模型搭建與訓練

4.1 集成學習基礎(chǔ)學習器算法選取

本研究按4∶1的比例將數(shù)據(jù)劃分成訓練數(shù)據(jù)和測試數(shù)據(jù)。訓練數(shù)據(jù)用于訓練模型,測試數(shù)據(jù)用于最后測試模型性能。在訓練中,以歸一化后Minkowski參數(shù)作為輸入特征,以巖芯電導率為輸出目標,按不同的機器學習算法訓練多個學習器。同時,用五折疊交叉驗證來驗證模型性能。該實驗使用了線性回歸(LinearRegression)、嶺回歸(RidgeRegression)、Lasso回歸(Lasso)、隨機森林回歸(RandomForestRegressor)、梯度提升回歸(GradientBoostingRegressor)、支持向量回歸機(SVR)、線性支持向量回歸機(LinearSVR)、彈性網(wǎng)絡(ElasticNet)、隨機梯度下降回歸(SGDRegressor)、貝葉斯嶺回歸(BayesianRidge)、核嶺回歸(KernelRidge)、極端隨機森林回歸(ExtraTreesRegressor)、極限梯度提高回歸(XGBRegressor)等算法來搭建基礎(chǔ)學習器。

4.2 加權(quán)平均模型集成

表1給出了不同算法搭建出的學習器的性能對比,最終選定了按LinearRegression、GradientBoostingRegressor、KernelRidge、XGBRegressor算法搭建的模型為基礎(chǔ)學習器。接著對各個模型進行參數(shù)調(diào)優(yōu),以求得更好的性能。最后按0.2,0.2,0.3和0.3的權(quán)值賦予各個學習器,進行加權(quán)平均,集成一個新的學習器。

表1 各機器學習方法性能對比

4.3 Stacking模型集成

在Stacking的策略中,仍使用LinearRegression、GradientBoostingRegressor、KernelRidge、XGBRegressor算法搭建初級學習器,選擇了LinearRegression算法搭建次級學習器。訓練中用初始訓練數(shù)據(jù)集訓練第一層初級學習器,產(chǎn)生新的數(shù)據(jù)集訓練第二層的次級學習器,第一層初級學習器的輸出是第二層次級學習器的輸入特征,同時原始標簽仍被作為新數(shù)據(jù)集的標簽。

4.4 多層神經(jīng)網(wǎng)絡(MNN)和三維卷積神經(jīng)網(wǎng)絡(3DCNN)搭建訓練

以Minkowski參數(shù)為輸入特征搭建多層神經(jīng)網(wǎng)絡,以三維二值分割圖像為輸入特征搭建一個三維卷積神經(jīng)網(wǎng)絡。兩個模型都使用均方根誤差(RMSE)作為損失函數(shù),Adam作為優(yōu)化器來進行模型訓練。實驗將數(shù)據(jù)按3∶1∶1將數(shù)據(jù)集劃分成訓練集,驗證集和測試集。訓練集用于模型權(quán)重更新,驗證集用于驗證模型效果和提早結(jié)束訓練,防止過度擬合,測試集用于評估最終模型效果。

5 結(jié)果與分析

表2總結(jié)了不同學習模型訓練集和測試集的平均絕對百分比誤差(MAPE)。如預期一致,一般情況下學習模型訓練集上的MAPE小于測試集上的MAPE。兩種集成方式加權(quán)平均模型和Stacking模型均在預測效果上比單一機器學習方法有提升。對于多層神經(jīng)網(wǎng)絡而言,其預測效果與傳統(tǒng)的機器學習方法效果并無大異。使用三維圖像的3DCNN比使用幾何參數(shù)的學習模型預測效果要好,這表明卷積操作比幾何參數(shù)更好地捕獲到巖芯的特征。

表2 各模型測試性能對比

6 結(jié)束語

文中提出了機器學習的方法在實驗巖芯電導率的預測,其預測結(jié)果達到了較好的準確性。研究結(jié)果證明機器學習在巖石物理領(lǐng)域的強大潛力,為數(shù)字巖芯電導率的研究提供了可供參考的新方法。同時實驗對比表明卷積神經(jīng)網(wǎng)絡比幾何參數(shù)學習模型對數(shù)字巖芯電導率預測效果更優(yōu)。計劃在下一步研究中采用更深更復雜的卷積網(wǎng)絡結(jié)構(gòu)以謀求更好的效果,但幾何參數(shù)仍然具有潛力,將添加更多的幾何參數(shù)。在研究中初始樣本只有一個巖芯樣本,子采樣的方式可能會導致圖像和圖像之間關(guān)聯(lián)度強,造成實驗誤差。為了解決該問題,可能會采用對抗生成網(wǎng)絡生成樣本或者收集更多的巖芯樣本。

猜你喜歡
電導率巖石機器
機器狗
機器狗
第五章 巖石小專家
3深源巖石
一種叫做煤炭的巖石
海藻與巖石之間
未來機器城
電影(2018年8期)2018-09-21 08:00:06
基于比較測量法的冷卻循環(huán)水系統(tǒng)電導率檢測儀研究
低溫脅迫葡萄新梢電導率和LT50值的研究
無敵機器蛛
英山县| 军事| 郓城县| 汝阳县| 射阳县| 武隆县| 景泰县| 海门市| 石嘴山市| 柳州市| 乌鲁木齐县| 区。| 桐柏县| 古浪县| 吉林市| 松溪县| 百色市| 加查县| 屯昌县| 平塘县| 于田县| 江安县| 衡东县| 平武县| 镇江市| 昌吉市| 天峨县| 开原市| 德钦县| 宜兴市| 陆川县| 调兵山市| 旬邑县| 石门县| 蓝田县| 平泉县| 金寨县| 靖西县| 沁阳市| 阳谷县| 清镇市|