唐 誠(chéng) 王崇敬 梁 波 顧炎午 李 柯
(①中石化經(jīng)緯有限公司西南錄井分公司;②中石化西南油氣分公司石油工程監(jiān)督中心)
四川盆地及周緣地區(qū)的海相頁(yè)巖氣勘探開發(fā)已取得重大突破[1-2],在頁(yè)巖氣解釋評(píng)價(jià)方面也取得了重要成果。當(dāng)前普遍認(rèn)為含氣頁(yè)巖儲(chǔ)層的典型響應(yīng)特征具有高自然伽馬、高有機(jī)碳、低巖石密度的特征,并廣泛應(yīng)用密度、中子、伽馬能譜、電阻率等測(cè)井項(xiàng)目來(lái)評(píng)價(jià)地層孔隙度、含氣飽和度、有機(jī)碳含量、獲取鏡質(zhì)體反射率Ro、計(jì)算礦物組分體積含量等[3-4]。但是,頁(yè)巖氣開發(fā)的降本增效壓力大,且普遍采用水平井施工,由于水平井段長(zhǎng),絕大部分水平井大幅度減少測(cè)井項(xiàng)目,部分工區(qū)的開發(fā)井甚至取消了測(cè)井項(xiàng)目,也不開展巖石熱解錄井,僅依靠隨鉆伽馬測(cè)井資料與氣測(cè)錄井資料開展儲(chǔ)層評(píng)價(jià)等工作,導(dǎo)致測(cè)試選層時(shí)缺乏可靠的評(píng)價(jià)依據(jù)。因此,亟需依托錄井?dāng)?shù)據(jù)開展頁(yè)巖氣評(píng)價(jià)參數(shù)的計(jì)算方法研究,為頁(yè)巖氣井的儲(chǔ)層評(píng)價(jià)、測(cè)試選層提供可靠的依據(jù),滿足頁(yè)巖氣開發(fā)的需要。
川南地區(qū)頁(yè)巖氣目的層為五峰組-龍馬溪組一段,自下而上細(xì)劃分為①-⑨號(hào)層,其中①-④號(hào)層具有高TOC、高脆性礦物、低黏土、低密度的特征,為主要的開發(fā)層系,為了確保開發(fā)效益,主要采用水平井進(jìn)行鉆探[1]。
由于頁(yè)巖氣儲(chǔ)層的巖性、物性、含氣性等特征與常規(guī)油氣藏相比有明顯的不同,難以通過(guò)常規(guī)手段來(lái)描述、評(píng)價(jià)頁(yè)巖氣??碧匠跗谠诔R?guī)測(cè)井的基礎(chǔ)上,大量開展了ECS、Litho Scanner特殊測(cè)井技術(shù)的應(yīng)用,并輔以巖心含氣量測(cè)量、電鏡掃描、全巖分析等分析化驗(yàn)手段,形成了頁(yè)巖氣“六性”關(guān)系評(píng)價(jià)方法,巖石組分、總有機(jī)碳、巖石密度等均是重要的評(píng)價(jià)參數(shù),并在解釋評(píng)價(jià)過(guò)程中廣泛應(yīng)用[1-3,5-6],頁(yè)巖氣隨鉆評(píng)價(jià)方法則以錄井評(píng)價(jià)為主。趙紅燕等[7]應(yīng)用鉆時(shí)比值、烴對(duì)比系數(shù)、巖石熱解等方法,開展頁(yè)巖儲(chǔ)層地化特征和含氣性綜合評(píng)價(jià)。隨著特殊錄井技術(shù)的推廣應(yīng)用,唐謝等[8]通過(guò)巖石熱解、元素錄井、氣測(cè)與工程錄井、巖屑自然伽馬能譜錄井建立了長(zhǎng)寧地區(qū)的頁(yè)巖錄井隨鉆解釋評(píng)價(jià)方法。顧炎午等[9]應(yīng)用逐步回歸方法,基于元素?cái)?shù)據(jù)開展了頁(yè)巖氣評(píng)價(jià)參數(shù)的隨鉆計(jì)算研究,建立了巖石組分、巖石密度、孔隙度等參數(shù)的錄井計(jì)算模型。這些研究為頁(yè)巖氣的解釋評(píng)價(jià)技術(shù)發(fā)展起到了積極推動(dòng)作用。
1.2.1 大量開發(fā)井壓縮了測(cè)井項(xiàng)目甚至不測(cè)井
測(cè)井項(xiàng)目在頁(yè)巖氣解釋評(píng)價(jià)過(guò)程中發(fā)揮了重要的作用,特別是巖石密度測(cè)井是評(píng)價(jià)頁(yè)巖氣甜點(diǎn)的關(guān)鍵參數(shù)[5-6]。但是頁(yè)巖氣開發(fā)井基本為水平井,因長(zhǎng)水平段條件下測(cè)井風(fēng)險(xiǎn)大,相當(dāng)部分的頁(yè)巖氣區(qū)塊取消了放射性測(cè)井項(xiàng)目。同時(shí)由于頁(yè)巖氣開發(fā)的降本增效壓力大,大量的開發(fā)井已經(jīng)完全取消了測(cè)井項(xiàng)目,導(dǎo)致完井后沒有測(cè)井資料可以采用,缺少測(cè)井評(píng)價(jià)參數(shù)。
1.2.2 水平井工況限制了常規(guī)錄井解釋方法應(yīng)用
頁(yè)巖氣水平井以油基鉆井液為主,氣測(cè)背景值高,為了防止井壁坍塌,鉆井液密度相對(duì)較高,導(dǎo)致鉆遇油氣時(shí)氣測(cè)顯示變化并不明顯,故水平段基本不使用巖石熱解錄井,巖屑伽馬能譜錄井在中石化區(qū)塊內(nèi)沒有得到推廣應(yīng)用。由于鉆時(shí)受鉆井工況的影響較大,使用旋轉(zhuǎn)導(dǎo)向工具鉆進(jìn)時(shí)鉆時(shí)很低,而使用LWD工具滑動(dòng)鉆進(jìn)時(shí)鉆時(shí)普遍較高,常規(guī)錄井解釋方法受到了極大的限制,缺乏有效的錄井解釋評(píng)價(jià)參數(shù)。
1.2.3 現(xiàn)有方法的計(jì)算精度不能完全滿足需求
唐謝、顧炎午等[8-9]研究了利用錄井?dāng)?shù)據(jù)計(jì)算頁(yè)巖評(píng)價(jià)參數(shù)的計(jì)算模型,取得了積極進(jìn)展,但采用的方法以單參數(shù)擬合、多參數(shù)線性回歸為主。已發(fā)表的文獻(xiàn)表明,計(jì)算鈣質(zhì)、硅質(zhì)含量的相關(guān)系數(shù)僅為0.57~0.71,表明評(píng)價(jià)參數(shù)之間存在復(fù)雜的非線性關(guān)系,常規(guī)的線性計(jì)算模型不能完全滿足需求。
基于元素?cái)?shù)據(jù)開展巖石組分及評(píng)價(jià)參數(shù)的計(jì)算方法研究,能為解釋評(píng)價(jià)提供依據(jù)[9],但目前計(jì)算的準(zhǔn)確性還有提升的空間。機(jī)器學(xué)習(xí)算法能夠從大量的數(shù)據(jù)中學(xué)習(xí)到相關(guān)的規(guī)律和邏輯,利用學(xué)習(xí)獲取的規(guī)律預(yù)測(cè)未知事物,在工業(yè)界得到了廣泛的應(yīng)用[10],因此有必要基于機(jī)器學(xué)習(xí)算法建立計(jì)算模型,提高計(jì)算的準(zhǔn)確性。由于巖石組分是脆性評(píng)價(jià)的關(guān)鍵,而巖石密度、總有機(jī)碳是含氣性評(píng)價(jià)的重點(diǎn)[5-6,11],本文針對(duì)巖石組分、巖石密度、總有機(jī)碳三個(gè)參數(shù)研究計(jì)算模型。
機(jī)器學(xué)習(xí)算法眾多,算法性能高度依賴于調(diào)優(yōu)參數(shù)(超參數(shù))的選擇,因此調(diào)優(yōu)參數(shù)的設(shè)定是重要的步驟。通常采用交叉驗(yàn)證(CV)來(lái)進(jìn)行模型的訓(xùn)練,把原始數(shù)據(jù)分組,一部分為訓(xùn)練集,另一部分為驗(yàn)證集,首先用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練,再利用驗(yàn)證集來(lái)測(cè)試訓(xùn)練得到的模型,根據(jù)擬合度(r2)對(duì)模型進(jìn)行評(píng)價(jià),r2越接近1,說(shuō)明擬合度越好[10]。
計(jì)算模型的建立流程確定如下:根據(jù)擬合對(duì)象選擇合適的錄井?dāng)?shù)據(jù),構(gòu)成訓(xùn)練數(shù)據(jù)集;選擇不同的機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,利用CV交叉驗(yàn)證的方法進(jìn)行調(diào)優(yōu)參數(shù)的優(yōu)選,根據(jù)擬合度(r2)從訓(xùn)練結(jié)果中優(yōu)選出最佳模型。
機(jī)器學(xué)習(xí)是人工智能的核心,是通過(guò)利用數(shù)據(jù),訓(xùn)練出模型,然后使用模型預(yù)測(cè)的一種方法,主要有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)三種類型[12]。它們各有不同的適應(yīng)范圍,在不同的機(jī)器學(xué)習(xí)類型里,又有非常多的算法,不同的算法對(duì)最終的分析結(jié)果有明顯影響。因此,需要針對(duì)不同的應(yīng)用場(chǎng)景與應(yīng)用目的,開展算法分析與優(yōu)選。
本次研究的重點(diǎn)是頁(yè)巖氣評(píng)價(jià)參數(shù)的計(jì)算或預(yù)測(cè),主要用到的是監(jiān)督學(xué)習(xí)中的回歸算法。線性回歸與邏輯回歸應(yīng)用非常廣泛,模型易于理解,實(shí)現(xiàn)簡(jiǎn)單,但泛化能力弱,對(duì)于非線性問(wèn)題擬合較差;決策樹、隨機(jī)森林算法在決策與分類方面效果顯著,但在應(yīng)用于回歸中時(shí)預(yù)測(cè)能力有限;支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、多元自適應(yīng)回歸樣條通常在應(yīng)用于回歸問(wèn)題時(shí),其非線性映射能力較強(qiáng),具有良好的擬合及預(yù)測(cè)能力,泛化能力較強(qiáng)[10,12]。因此,本文選擇支持向量機(jī)、多元自適應(yīng)回歸樣條、神經(jīng)網(wǎng)絡(luò)三種算法來(lái)開展頁(yè)巖氣評(píng)價(jià)參數(shù)模型的研究。
2.2.1 支持向量機(jī)算法
支持向量機(jī)(SVM)算法主要取決于核函數(shù)的選擇,徑向基核函數(shù)(RBF)應(yīng)用最廣,需要確定的參數(shù)少,可以減少應(yīng)用過(guò)程中的復(fù)雜程度。兩項(xiàng)調(diào)優(yōu)參數(shù)分別為RBF核函數(shù)參數(shù)的解析估計(jì)值Sigma和代價(jià)參數(shù)C。其中C表示對(duì)誤差的寬容度,C值高容易過(guò)擬合,C值低容易欠擬合。Sigma會(huì)影響每個(gè)支持向量對(duì)應(yīng)的RBF的作用范圍:如果Sigma過(guò)大,那么此時(shí)支持向量的輻射范圍就非常小,對(duì)于未知樣本分類效果很差,存在訓(xùn)練準(zhǔn)確率可以很高,而測(cè)試準(zhǔn)確率不高的可能;若Sigma 過(guò)小,將使模型受限制太多,被選定的支持向量的輻射范圍很大,則會(huì)造成平滑效應(yīng)太大,無(wú)法在訓(xùn)練集上得到特別高的準(zhǔn)確率,也會(huì)影響測(cè)試集的準(zhǔn)確率,從而影響泛化性能[10,12]。模型訓(xùn)練流程及驗(yàn)證結(jié)果如圖1所示。訓(xùn)練結(jié)果表明,硅質(zhì)礦物的效果最差,r2為0.88,DEN與黏土礦物效果最佳,r2均達(dá)到0.95。
圖1 基于支持向量機(jī)算法的模型訓(xùn)練過(guò)程及調(diào)優(yōu)參數(shù)的確定結(jié)果
2.2.2 多元自適應(yīng)回歸樣條算法
多元自適應(yīng)回歸樣條(MARS)能自適應(yīng)處理高維數(shù)據(jù)。該方法的本質(zhì)是將每一個(gè)預(yù)測(cè)變量(輸入?yún)?shù))設(shè)定一個(gè)切分點(diǎn)拆成兩組,然后在每一組中建立預(yù)測(cè)變量與結(jié)果變量的關(guān)系,形成一對(duì)鉸鏈函數(shù)。針對(duì)每一個(gè)變量形成鉸鏈函數(shù),建立分段線性模型,每個(gè)鉸鏈函數(shù)擬合原始數(shù)據(jù)的一部分,且相互不發(fā)生影響。通過(guò)反復(fù)的窮舉搜索,尋找擬合最好的切分點(diǎn),完成全部預(yù)測(cè)變量的擬合后,移除其中對(duì)模型沒有顯著貢獻(xiàn)的變量,優(yōu)選出最合適的模型。MARS方法需要設(shè)定兩個(gè)調(diào)優(yōu)參數(shù),為預(yù)測(cè)變量的階數(shù)degree和保留特征的項(xiàng)數(shù)nprune。degree為大于或等于1的整數(shù),較高的階數(shù)會(huì)導(dǎo)致計(jì)算量大幅度增加,并導(dǎo)致數(shù)值大幅度膨脹或縮小,不適宜取值過(guò)大;nprune一般取值大于或等于2,當(dāng)變量數(shù)小于10個(gè)時(shí),其上限建議為20[12-13]。通過(guò)模型訓(xùn)練,獲得的調(diào)優(yōu)參數(shù)見表1。從表1中可以看出,硅質(zhì)礦物的效果最差,r2僅為0.80,TOC和黏土礦物相對(duì)較好,r2達(dá)到0.92。
表1 基于多元自適應(yīng)回歸樣條算法的模型調(diào)優(yōu)參數(shù)
2.2.3 神經(jīng)網(wǎng)絡(luò)算法
神經(jīng)網(wǎng)絡(luò)算法(NN)非常多,其中前饋神經(jīng)網(wǎng)絡(luò)算法最常用。前饋神經(jīng)網(wǎng)絡(luò)中各個(gè)神經(jīng)元按接收信息的先后分為不同的組,每一組可以看作一個(gè)神經(jīng)層。每一層中的神經(jīng)元接收前一層神經(jīng)元的輸出,并輸出到下一層神經(jīng)元,整個(gè)網(wǎng)絡(luò)中的信息是朝一個(gè)方向傳播,沒有反向的信息傳播。前饋神經(jīng)網(wǎng)絡(luò)可以看作是一個(gè)函數(shù),通過(guò)簡(jiǎn)單非線性函數(shù)的多次復(fù)合,實(shí)現(xiàn)輸入空間到輸出空間的復(fù)雜映射。這種網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,易于實(shí)現(xiàn)[10,12]??紤]到時(shí)效性,本次研究采用3層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖2所示。圖2中:前饋神經(jīng)網(wǎng)絡(luò)算法里,I1,I2,…,I8為輸入層,代表各個(gè)元素?cái)?shù)據(jù);H1,H2,H3,H4為隱藏層;O1為輸出層;B1和B2為各層的系數(shù)。
圖2 基于神經(jīng)網(wǎng)絡(luò)算法的三層結(jié)構(gòu)示意
設(shè)定初始隨機(jī)數(shù)權(quán)值和最大迭代次數(shù)后,需要確定調(diào)優(yōu)參數(shù)為隱蔽單元個(gè)數(shù)(size)和權(quán)值衰減參數(shù)(decay)[10,12],通過(guò)訓(xùn)練后得到的最佳參數(shù)如表2所示。整體而言,神經(jīng)網(wǎng)絡(luò)算法效果較好,r2介于0.88~0.95之間。
表2 基于神經(jīng)網(wǎng)絡(luò)算法的模型調(diào)優(yōu)參數(shù)
三種算法的擬合度(r2)對(duì)比如表3所示。三種機(jī)器學(xué)習(xí)算法獲得的結(jié)果均明顯高于常規(guī)方法,效果最差的為硅質(zhì)礦物,r2為0.80~0.88,MARS算法計(jì)算的DEN的r2也不高(為0.85),其他參數(shù)的擬合度均高于0.90。比較而言,MARS算法的整體效果均略低于其他兩種算法,SVM算法獲得的DEN和TOC效果最佳,而SVM算法和NN算法獲得的黏土礦物、硅質(zhì)礦物、碳酸鹽礦物效果一致。這表明,整體而言SVM算法效果最佳,是首選的機(jī)器學(xué)習(xí)算法。
表3 三種算法的擬合度(r2)對(duì)比
將本文建立的參數(shù)計(jì)算模型在威遠(yuǎn)、永川工區(qū)共28口井進(jìn)行了應(yīng)用,下面以A 9井為例分析應(yīng)用效果。
A 9井是部署在川西南坳陷白馬鎮(zhèn)向斜的一口開發(fā)評(píng)價(jià)井,應(yīng)用基于支持向量機(jī)算法的相關(guān)模型,計(jì)算得到黏土礦物、碳酸鹽礦物、硅質(zhì)礦物、TOC和DEN參數(shù),將計(jì)算結(jié)果與特殊測(cè)井等同類參數(shù)進(jìn)行對(duì)比,如圖3所示。標(biāo)注SVM的圖道是本次研究建立的模型計(jì)算結(jié)果,未標(biāo)注的是其他方法獲取的同類參數(shù),其中TOC來(lái)源于巖石熱解錄井,DEN來(lái)源于常規(guī)測(cè)井,黏土礦物、碳酸鹽礦物、硅質(zhì)礦物數(shù)據(jù)來(lái)源于斯倫貝謝Litho Scanner測(cè)井。
從圖3可以看出,大部分井段應(yīng)用SVM算法計(jì)算的DEN、TOC與其他方法獲得的結(jié)果趨勢(shì)基本一致,兩者整體相關(guān)性較好,r2均為0.85。部分井段計(jì)算值與實(shí)測(cè)值有一定誤差,如3 676.00~3 694.50 m井段DEN實(shí)測(cè)平均值2.503 g/cm3、計(jì)算平均值2.500 g/cm3,TOC實(shí)測(cè)平均值3.755%、計(jì)算平均值3.422%,計(jì)算值略小于實(shí)測(cè)值,但絕對(duì)值相差較小。在3 696.10 m等井深實(shí)測(cè)DEN、TOC曲線表現(xiàn)為小尖峰,但計(jì)算的DEN和TOC由于元素錄井采樣間隔較大,這一特征并不明顯。在巖石成分方面,計(jì)算的黏土礦物與實(shí)測(cè)黏土礦物差別不大,僅少部分井段有所差異,r2達(dá)到0.86。碳酸鹽礦物整體也基本一致,r2可達(dá)到0.83,個(gè)別井段有差別,如在3 668.50~3 670.50 m井段實(shí)測(cè)碳酸鹽礦物有所升高,但其計(jì)算值未體現(xiàn)這一特征。計(jì)算的硅質(zhì)礦物在上部井段整體要大于實(shí)測(cè)硅質(zhì)礦物,且該段計(jì)算的硅質(zhì)礦物值變化不大,較實(shí)測(cè)值有所差異,導(dǎo)致硅質(zhì)礦物的相關(guān)性要略低于前兩種礦物。在下部井段,即水平鉆井的目的層段,計(jì)算的硅質(zhì)礦物與實(shí)測(cè)吻合度有所提高,r2為0.81。
圖3 A 9井計(jì)算參數(shù)與實(shí)測(cè)對(duì)比圖
由于受到巖屑代表性的影響,以及不同的元素分析儀器導(dǎo)致測(cè)量精度存在一定的差異,基于機(jī)器學(xué)習(xí)算法建立的計(jì)算模型,在應(yīng)用過(guò)程中相關(guān)性有所降低,但r2也達(dá)到了0.81~0.86,應(yīng)用效果較好。
(1)通過(guò)分析主要機(jī)器學(xué)習(xí)算法的原理與適用場(chǎng)景,優(yōu)選并建立了基于支持向量機(jī)、多元自適應(yīng)回歸樣條、神經(jīng)網(wǎng)絡(luò)算法的參數(shù)計(jì)算模型,其中支持向量機(jī)算法效果更佳。
(2)應(yīng)用基于機(jī)器學(xué)習(xí)算法建立的模型,計(jì)算準(zhǔn)確性較好,可解決頁(yè)巖氣井隨鉆評(píng)價(jià)參數(shù)匱缺的問(wèn)題,為頁(yè)巖氣隨鉆分析與評(píng)價(jià)提供技術(shù)手段。
(3)機(jī)器學(xué)習(xí)算法在解決非線性、復(fù)雜模型的建模過(guò)程中具有明顯優(yōu)勢(shì),但部分參數(shù)的計(jì)算精度還有提升空間,因而有必要進(jìn)一步加強(qiáng)研究,挖掘更多錄井?dāng)?shù)據(jù)的價(jià)值,擴(kuò)展到含氣量、孔隙度、巖石力學(xué)等其他參數(shù),更好地支撐頁(yè)巖氣的快速評(píng)價(jià)與壓裂測(cè)試選層。