基于機(jī)器學(xué)習(xí)算法的頁(yè)巖氣評(píng)價(jià)參數(shù)計(jì)算模型研究

2022-01-16 08:27王崇敬顧炎午

錄井工程 2021年4期

唐誠(chéng) 王崇敬梁波顧炎午李柯

(①中石化經(jīng)緯有限公司西南錄井分公司；②中石化西南油氣分公司石油工程監(jiān)督中心)

0 引言

四川盆地及周緣地區(qū)的海相頁(yè)巖氣勘探開發(fā)已取得重大突破[1-2]，在頁(yè)巖氣解釋評(píng)價(jià)方面也取得了重要成果。當(dāng)前普遍認(rèn)為含氣頁(yè)巖儲(chǔ)層的典型響應(yīng)特征具有高自然伽馬、高有機(jī)碳、低巖石密度的特征,并廣泛應(yīng)用密度、中子、伽馬能譜、電阻率等測(cè)井項(xiàng)目來(lái)評(píng)價(jià)地層孔隙度、含氣飽和度、有機(jī)碳含量、獲取鏡質(zhì)體反射率Ro、計(jì)算礦物組分體積含量等[3-4]。但是，頁(yè)巖氣開發(fā)的降本增效壓力大，且普遍采用水平井施工，由于水平井段長(zhǎng)，絕大部分水平井大幅度減少測(cè)井項(xiàng)目，部分工區(qū)的開發(fā)井甚至取消了測(cè)井項(xiàng)目，也不開展巖石熱解錄井，僅依靠隨鉆伽馬測(cè)井資料與氣測(cè)錄井資料開展儲(chǔ)層評(píng)價(jià)等工作，導(dǎo)致測(cè)試選層時(shí)缺乏可靠的評(píng)價(jià)依據(jù)。因此，亟需依托錄井?dāng)?shù)據(jù)開展頁(yè)巖氣評(píng)價(jià)參數(shù)的計(jì)算方法研究，為頁(yè)巖氣井的儲(chǔ)層評(píng)價(jià)、測(cè)試選層提供可靠的依據(jù)，滿足頁(yè)巖氣開發(fā)的需要。

1 研究現(xiàn)狀

川南地區(qū)頁(yè)巖氣目的層為五峰組-龍馬溪組一段，自下而上細(xì)劃分為①-⑨號(hào)層，其中①-④號(hào)層具有高TOC、高脆性礦物、低黏土、低密度的特征，為主要的開發(fā)層系，為了確保開發(fā)效益，主要采用水平井進(jìn)行鉆探[1]。

1.1 解釋評(píng)價(jià)現(xiàn)狀

由于頁(yè)巖氣儲(chǔ)層的巖性、物性、含氣性等特征與常規(guī)油氣藏相比有明顯的不同，難以通過(guò)常規(guī)手段來(lái)描述、評(píng)價(jià)頁(yè)巖氣?？碧匠跗谠诔Ｒ?guī)測(cè)井的基礎(chǔ)上，大量開展了ECS、Litho Scanner特殊測(cè)井技術(shù)的應(yīng)用，并輔以巖心含氣量測(cè)量、電鏡掃描、全巖分析等分析化驗(yàn)手段，形成了頁(yè)巖氣“六性”關(guān)系評(píng)價(jià)方法，巖石組分、總有機(jī)碳、巖石密度等均是重要的評(píng)價(jià)參數(shù)，并在解釋評(píng)價(jià)過(guò)程中廣泛應(yīng)用[1-3,5-6]，頁(yè)巖氣隨鉆評(píng)價(jià)方法則以錄井評(píng)價(jià)為主。趙紅燕等[7]應(yīng)用鉆時(shí)比值、烴對(duì)比系數(shù)、巖石熱解等方法，開展頁(yè)巖儲(chǔ)層地化特征和含氣性綜合評(píng)價(jià)。隨著特殊錄井技術(shù)的推廣應(yīng)用，唐謝等[8]通過(guò)巖石熱解、元素錄井、氣測(cè)與工程錄井、巖屑自然伽馬能譜錄井建立了長(zhǎng)寧地區(qū)的頁(yè)巖錄井隨鉆解釋評(píng)價(jià)方法。顧炎午等[9]應(yīng)用逐步回歸方法，基于元素?cái)?shù)據(jù)開展了頁(yè)巖氣評(píng)價(jià)參數(shù)的隨鉆計(jì)算研究，建立了巖石組分、巖石密度、孔隙度等參數(shù)的錄井計(jì)算模型。這些研究為頁(yè)巖氣的解釋評(píng)價(jià)技術(shù)發(fā)展起到了積極推動(dòng)作用。

1.2 存在的主要問(wèn)題

1.2.1 大量開發(fā)井壓縮了測(cè)井項(xiàng)目甚至不測(cè)井

測(cè)井項(xiàng)目在頁(yè)巖氣解釋評(píng)價(jià)過(guò)程中發(fā)揮了重要的作用，特別是巖石密度測(cè)井是評(píng)價(jià)頁(yè)巖氣甜點(diǎn)的關(guān)鍵參數(shù)[5-6]。但是頁(yè)巖氣開發(fā)井基本為水平井，因長(zhǎng)水平段條件下測(cè)井風(fēng)險(xiǎn)大，相當(dāng)部分的頁(yè)巖氣區(qū)塊取消了放射性測(cè)井項(xiàng)目。同時(shí)由于頁(yè)巖氣開發(fā)的降本增效壓力大，大量的開發(fā)井已經(jīng)完全取消了測(cè)井項(xiàng)目，導(dǎo)致完井后沒有測(cè)井資料可以采用，缺少測(cè)井評(píng)價(jià)參數(shù)。

1.2.2 水平井工況限制了常規(guī)錄井解釋方法應(yīng)用

頁(yè)巖氣水平井以油基鉆井液為主，氣測(cè)背景值高，為了防止井壁坍塌，鉆井液密度相對(duì)較高，導(dǎo)致鉆遇油氣時(shí)氣測(cè)顯示變化并不明顯，故水平段基本不使用巖石熱解錄井，巖屑伽馬能譜錄井在中石化區(qū)塊內(nèi)沒有得到推廣應(yīng)用。由于鉆時(shí)受鉆井工況的影響較大，使用旋轉(zhuǎn)導(dǎo)向工具鉆進(jìn)時(shí)鉆時(shí)很低，而使用LWD工具滑動(dòng)鉆進(jìn)時(shí)鉆時(shí)普遍較高，常規(guī)錄井解釋方法受到了極大的限制，缺乏有效的錄井解釋評(píng)價(jià)參數(shù)。

1.2.3 現(xiàn)有方法的計(jì)算精度不能完全滿足需求

唐謝、顧炎午等[8-9]研究了利用錄井?dāng)?shù)據(jù)計(jì)算頁(yè)巖評(píng)價(jià)參數(shù)的計(jì)算模型，取得了積極進(jìn)展，但采用的方法以單參數(shù)擬合、多參數(shù)線性回歸為主。已發(fā)表的文獻(xiàn)表明，計(jì)算鈣質(zhì)、硅質(zhì)含量的相關(guān)系數(shù)僅為0.57～0.71，表明評(píng)價(jià)參數(shù)之間存在復(fù)雜的非線性關(guān)系，常規(guī)的線性計(jì)算模型不能完全滿足需求。

2 計(jì)算模型研究

基于元素?cái)?shù)據(jù)開展巖石組分及評(píng)價(jià)參數(shù)的計(jì)算方法研究，能為解釋評(píng)價(jià)提供依據(jù)[9]，但目前計(jì)算的準(zhǔn)確性還有提升的空間。機(jī)器學(xué)習(xí)算法能夠從大量的數(shù)據(jù)中學(xué)習(xí)到相關(guān)的規(guī)律和邏輯，利用學(xué)習(xí)獲取的規(guī)律預(yù)測(cè)未知事物，在工業(yè)界得到了廣泛的應(yīng)用[10]，因此有必要基于機(jī)器學(xué)習(xí)算法建立計(jì)算模型，提高計(jì)算的準(zhǔn)確性。由于巖石組分是脆性評(píng)價(jià)的關(guān)鍵，而巖石密度、總有機(jī)碳是含氣性評(píng)價(jià)的重點(diǎn)[5-6,11]，本文針對(duì)巖石組分、巖石密度、總有機(jī)碳三個(gè)參數(shù)研究計(jì)算模型。

2.1 建立模型的流程

機(jī)器學(xué)習(xí)算法眾多，算法性能高度依賴于調(diào)優(yōu)參數(shù)(超參數(shù))的選擇，因此調(diào)優(yōu)參數(shù)的設(shè)定是重要的步驟。通常采用交叉驗(yàn)證(CV)來(lái)進(jìn)行模型的訓(xùn)練，把原始數(shù)據(jù)分組，一部分為訓(xùn)練集，另一部分為驗(yàn)證集，首先用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練，再利用驗(yàn)證集來(lái)測(cè)試訓(xùn)練得到的模型，根據(jù)擬合度(r2)對(duì)模型進(jìn)行評(píng)價(jià)，r2越接近1，說(shuō)明擬合度越好[10]。

計(jì)算模型的建立流程確定如下：根據(jù)擬合對(duì)象選擇合適的錄井?dāng)?shù)據(jù)，構(gòu)成訓(xùn)練數(shù)據(jù)集；選擇不同的機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練，利用CV交叉驗(yàn)證的方法進(jìn)行調(diào)優(yōu)參數(shù)的優(yōu)選，根據(jù)擬合度(r2)從訓(xùn)練結(jié)果中優(yōu)選出最佳模型。

2.2 算法優(yōu)選與模型訓(xùn)練

機(jī)器學(xué)習(xí)是人工智能的核心，是通過(guò)利用數(shù)據(jù)，訓(xùn)練出模型，然后使用模型預(yù)測(cè)的一種方法，主要有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)三種類型[12]。它們各有不同的適應(yīng)范圍，在不同的機(jī)器學(xué)習(xí)類型里，又有非常多的算法，不同的算法對(duì)最終的分析結(jié)果有明顯影響。因此，需要針對(duì)不同的應(yīng)用場(chǎng)景與應(yīng)用目的，開展算法分析與優(yōu)選。

本次研究的重點(diǎn)是頁(yè)巖氣評(píng)價(jià)參數(shù)的計(jì)算或預(yù)測(cè)，主要用到的是監(jiān)督學(xué)習(xí)中的回歸算法。線性回歸與邏輯回歸應(yīng)用非常廣泛，模型易于理解，實(shí)現(xiàn)簡(jiǎn)單，但泛化能力弱，對(duì)于非線性問(wèn)題擬合較差；決策樹、隨機(jī)森林算法在決策與分類方面效果顯著，但在應(yīng)用于回歸中時(shí)預(yù)測(cè)能力有限；支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、多元自適應(yīng)回歸樣條通常在應(yīng)用于回歸問(wèn)題時(shí)，其非線性映射能力較強(qiáng)，具有良好的擬合及預(yù)測(cè)能力，泛化能力較強(qiáng)[10,12]。因此，本文選擇支持向量機(jī)、多元自適應(yīng)回歸樣條、神經(jīng)網(wǎng)絡(luò)三種算法來(lái)開展頁(yè)巖氣評(píng)價(jià)參數(shù)模型的研究。

2.2.1 支持向量機(jī)算法

支持向量機(jī)(SVM)算法主要取決于核函數(shù)的選擇，徑向基核函數(shù)(RBF)應(yīng)用最廣，需要確定的參數(shù)少，可以減少應(yīng)用過(guò)程中的復(fù)雜程度。兩項(xiàng)調(diào)優(yōu)參數(shù)分別為RBF核函數(shù)參數(shù)的解析估計(jì)值Sigma和代價(jià)參數(shù)C。其中C表示對(duì)誤差的寬容度，C值高容易過(guò)擬合，C值低容易欠擬合。Sigma會(huì)影響每個(gè)支持向量對(duì)應(yīng)的RBF的作用范圍：如果Sigma過(guò)大，那么此時(shí)支持向量的輻射范圍就非常小，對(duì)于未知樣本分類效果很差，存在訓(xùn)練準(zhǔn)確率可以很高，而測(cè)試準(zhǔn)確率不高的可能；若Sigma 過(guò)小，將使模型受限制太多，被選定的支持向量的輻射范圍很大，則會(huì)造成平滑效應(yīng)太大，無(wú)法在訓(xùn)練集上得到特別高的準(zhǔn)確率，也會(huì)影響測(cè)試集的準(zhǔn)確率，從而影響泛化性能[10,12]。模型訓(xùn)練流程及驗(yàn)證結(jié)果如圖1所示。訓(xùn)練結(jié)果表明，硅質(zhì)礦物的效果最差，r2為0.88，DEN與黏土礦物效果最佳，r2均達(dá)到0.95。

圖1 基于支持向量機(jī)算法的模型訓(xùn)練過(guò)程及調(diào)優(yōu)參數(shù)的確定結(jié)果

2.2.2 多元自適應(yīng)回歸樣條算法

多元自適應(yīng)回歸樣條(MARS)能自適應(yīng)處理高維數(shù)據(jù)。該方法的本質(zhì)是將每一個(gè)預(yù)測(cè)變量(輸入?yún)?shù))設(shè)定一個(gè)切分點(diǎn)拆成兩組，然后在每一組中建立預(yù)測(cè)變量與結(jié)果變量的關(guān)系，形成一對(duì)鉸鏈函數(shù)。針對(duì)每一個(gè)變量形成鉸鏈函數(shù)，建立分段線性模型，每個(gè)鉸鏈函數(shù)擬合原始數(shù)據(jù)的一部分，且相互不發(fā)生影響。通過(guò)反復(fù)的窮舉搜索，尋找擬合最好的切分點(diǎn)，完成全部預(yù)測(cè)變量的擬合后，移除其中對(duì)模型沒有顯著貢獻(xiàn)的變量，優(yōu)選出最合適的模型。MARS方法需要設(shè)定兩個(gè)調(diào)優(yōu)參數(shù)，為預(yù)測(cè)變量的階數(shù)degree和保留特征的項(xiàng)數(shù)nprune。degree為大于或等于1的整數(shù)，較高的階數(shù)會(huì)導(dǎo)致計(jì)算量大幅度增加，并導(dǎo)致數(shù)值大幅度膨脹或縮小，不適宜取值過(guò)大；nprune一般取值大于或等于2，當(dāng)變量數(shù)小于10個(gè)時(shí)，其上限建議為20[12-13]。通過(guò)模型訓(xùn)練，獲得的調(diào)優(yōu)參數(shù)見表1。從表1中可以看出，硅質(zhì)礦物的效果最差，r2僅為0.80，TOC和黏土礦物相對(duì)較好，r2達(dá)到0.92。

表1 基于多元自適應(yīng)回歸樣條算法的模型調(diào)優(yōu)參數(shù)

2.2.3 神經(jīng)網(wǎng)絡(luò)算法

神經(jīng)網(wǎng)絡(luò)算法(NN)非常多，其中前饋神經(jīng)網(wǎng)絡(luò)算法最常用。前饋神經(jīng)網(wǎng)絡(luò)中各個(gè)神經(jīng)元按接收信息的先后分為不同的組，每一組可以看作一個(gè)神經(jīng)層。每一層中的神經(jīng)元接收前一層神經(jīng)元的輸出，并輸出到下一層神經(jīng)元，整個(gè)網(wǎng)絡(luò)中的信息是朝一個(gè)方向傳播，沒有反向的信息傳播。前饋神經(jīng)網(wǎng)絡(luò)可以看作是一個(gè)函數(shù)，通過(guò)簡(jiǎn)單非線性函數(shù)的多次復(fù)合，實(shí)現(xiàn)輸入空間到輸出空間的復(fù)雜映射。這種網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單，易于實(shí)現(xiàn)[10,12]?？紤]到時(shí)效性，本次研究采用3層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，如圖2所示。圖2中：前饋神經(jīng)網(wǎng)絡(luò)算法里，I1，I2，…,I8為輸入層，代表各個(gè)元素?cái)?shù)據(jù)；H1，H2，H3，H4為隱藏層；O1為輸出層；B1和B2為各層的系數(shù)。

圖2 基于神經(jīng)網(wǎng)絡(luò)算法的三層結(jié)構(gòu)示意

設(shè)定初始隨機(jī)數(shù)權(quán)值和最大迭代次數(shù)后，需要確定調(diào)優(yōu)參數(shù)為隱蔽單元個(gè)數(shù)(size)和權(quán)值衰減參數(shù)(decay)[10,12]，通過(guò)訓(xùn)練后得到的最佳參數(shù)如表2所示。整體而言，神經(jīng)網(wǎng)絡(luò)算法效果較好，r2介于0.88～0.95之間。

表2 基于神經(jīng)網(wǎng)絡(luò)算法的模型調(diào)優(yōu)參數(shù)

2.3 算法效果對(duì)比

三種算法的擬合度(r2)對(duì)比如表3所示。三種機(jī)器學(xué)習(xí)算法獲得的結(jié)果均明顯高于常規(guī)方法，效果最差的為硅質(zhì)礦物，r2為0.80～0.88，MARS算法計(jì)算的DEN的r2也不高(為0.85)，其他參數(shù)的擬合度均高于0.90。比較而言，MARS算法的整體效果均略低于其他兩種算法，SVM算法獲得的DEN和TOC效果最佳，而SVM算法和NN算法獲得的黏土礦物、硅質(zhì)礦物、碳酸鹽礦物效果一致。這表明，整體而言SVM算法效果最佳，是首選的機(jī)器學(xué)習(xí)算法。

表3 三種算法的擬合度(r2)對(duì)比

3 應(yīng)用效果

將本文建立的參數(shù)計(jì)算模型在威遠(yuǎn)、永川工區(qū)共28口井進(jìn)行了應(yīng)用，下面以A 9井為例分析應(yīng)用效果。

A 9井是部署在川西南坳陷白馬鎮(zhèn)向斜的一口開發(fā)評(píng)價(jià)井，應(yīng)用基于支持向量機(jī)算法的相關(guān)模型，計(jì)算得到黏土礦物、碳酸鹽礦物、硅質(zhì)礦物、TOC和DEN參數(shù)，將計(jì)算結(jié)果與特殊測(cè)井等同類參數(shù)進(jìn)行對(duì)比，如圖3所示。標(biāo)注SVM的圖道是本次研究建立的模型計(jì)算結(jié)果，未標(biāo)注的是其他方法獲取的同類參數(shù)，其中TOC來(lái)源于巖石熱解錄井，DEN來(lái)源于常規(guī)測(cè)井，黏土礦物、碳酸鹽礦物、硅質(zhì)礦物數(shù)據(jù)來(lái)源于斯倫貝謝Litho Scanner測(cè)井。

從圖3可以看出，大部分井段應(yīng)用SVM算法計(jì)算的DEN、TOC與其他方法獲得的結(jié)果趨勢(shì)基本一致，兩者整體相關(guān)性較好，r2均為0.85。部分井段計(jì)算值與實(shí)測(cè)值有一定誤差，如3 676.00～3 694.50 m井段DEN實(shí)測(cè)平均值2.503 g/cm3、計(jì)算平均值2.500 g/cm3,TOC實(shí)測(cè)平均值3.755%、計(jì)算平均值3.422%，計(jì)算值略小于實(shí)測(cè)值，但絕對(duì)值相差較小。在3 696.10 m等井深實(shí)測(cè)DEN、TOC曲線表現(xiàn)為小尖峰，但計(jì)算的DEN和TOC由于元素錄井采樣間隔較大，這一特征并不明顯。在巖石成分方面，計(jì)算的黏土礦物與實(shí)測(cè)黏土礦物差別不大，僅少部分井段有所差異，r2達(dá)到0.86。碳酸鹽礦物整體也基本一致，r2可達(dá)到0.83，個(gè)別井段有差別,如在3 668.50～3 670.50 m井段實(shí)測(cè)碳酸鹽礦物有所升高，但其計(jì)算值未體現(xiàn)這一特征。計(jì)算的硅質(zhì)礦物在上部井段整體要大于實(shí)測(cè)硅質(zhì)礦物，且該段計(jì)算的硅質(zhì)礦物值變化不大，較實(shí)測(cè)值有所差異，導(dǎo)致硅質(zhì)礦物的相關(guān)性要略低于前兩種礦物。在下部井段，即水平鉆井的目的層段，計(jì)算的硅質(zhì)礦物與實(shí)測(cè)吻合度有所提高，r2為0.81。

圖3 A 9井計(jì)算參數(shù)與實(shí)測(cè)對(duì)比圖

由于受到巖屑代表性的影響，以及不同的元素分析儀器導(dǎo)致測(cè)量精度存在一定的差異，基于機(jī)器學(xué)習(xí)算法建立的計(jì)算模型，在應(yīng)用過(guò)程中相關(guān)性有所降低，但r2也達(dá)到了0.81～0.86，應(yīng)用效果較好。

4 認(rèn)識(shí)與建議

(1)通過(guò)分析主要機(jī)器學(xué)習(xí)算法的原理與適用場(chǎng)景，優(yōu)選并建立了基于支持向量機(jī)、多元自適應(yīng)回歸樣條、神經(jīng)網(wǎng)絡(luò)算法的參數(shù)計(jì)算模型，其中支持向量機(jī)算法效果更佳。

(2)應(yīng)用基于機(jī)器學(xué)習(xí)算法建立的模型，計(jì)算準(zhǔn)確性較好，可解決頁(yè)巖氣井隨鉆評(píng)價(jià)參數(shù)匱缺的問(wèn)題，為頁(yè)巖氣隨鉆分析與評(píng)價(jià)提供技術(shù)手段。

(3)機(jī)器學(xué)習(xí)算法在解決非線性、復(fù)雜模型的建模過(guò)程中具有明顯優(yōu)勢(shì)，但部分參數(shù)的計(jì)算精度還有提升空間，因而有必要進(jìn)一步加強(qiáng)研究，挖掘更多錄井?dāng)?shù)據(jù)的價(jià)值，擴(kuò)展到含氣量、孔隙度、巖石力學(xué)等其他參數(shù)，更好地支撐頁(yè)巖氣的快速評(píng)價(jià)與壓裂測(cè)試選層。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡