張亞男,張 沖,孫 康,楊旺旺,汪明銳
(1.長江大學油氣資源與勘探技術教育部重點實驗室,湖北 武漢 430100;2.長江大學地球物理與石油資源學院,湖北 武漢 430100)
中東油氣藏的勘探與開發(fā)一直是中國各大石油公司關注的研究熱點。伊拉克H 油田M 層組巨厚型碳酸鹽巖油氣藏受成巖、沉積作用影響,巖石結構復雜,孔隙類型多樣,表現(xiàn)出非均質(zhì)性強的特點,導致該區(qū)塊儲層參數(shù)評價困難。而滲透率是油氣田產(chǎn)能預測和高效開發(fā)過程中十分關鍵的參數(shù)之一,如何利用測井資料準確評價該類型儲層滲透率是一項重要的工作,也是目前研究的難點[1-5]。
目前利用測井資料計算滲透率主要包括3種思路:①依據(jù)經(jīng)驗公式計算滲透率,如滲透率與孔隙度、自然伽馬相對值[6]的關系統(tǒng)計模型,但該類方法具有區(qū)域限制性,難以推廣使用。②通過巖石物理模型建立滲透率評價模型,傳統(tǒng)的巖石物理模型是基于均質(zhì)孔隙介質(zhì)提出,對于強非均質(zhì)碳酸鹽巖其適用性有待進一步研究[7-9]。③通過機器學習進行滲透率評價。近年來,不乏學者將機器學習應用于儲層物性參數(shù)預測,具有代表性的是BP 神經(jīng)網(wǎng)絡[10],BP 神經(jīng)網(wǎng)絡有一定的容錯性,在特定的條件下也能夠表現(xiàn)出較好的學習能力與預測能力[11];但該方法網(wǎng)絡結構簡單,解決復雜的非線性問題能力有限,泛化能力弱且網(wǎng)絡結構難以優(yōu)化。隨著機器學習的發(fā)展,相比淺層神經(jīng)網(wǎng)絡,深度學習能夠挖掘樣本之間的更加本質(zhì)的聯(lián)系,相關學者在該方面進行了較多的研究。SUBASI 等利用改進的梯度決策樹進行常規(guī)油氣儲層的滲透率計算[12]。谷宇峰等結合PSO 對梯度決策樹參數(shù)優(yōu)化后對滲透率進行預測[13]。王興龍等利用C5.0 決策樹對碳酸鹽巖儲層滲透率進行評價[14]。RF 作為基于分類決策樹與回歸樹提出的機器學習算法,相比于神經(jīng)網(wǎng)絡與決策樹而言,有較好的抗噪性,對異常值具有很好的容忍性[15-16],且該方法在儲層預測[17]、巖性識別[18]等方面取得了良好的應用效果。為此,本文提出了基于地球物理測井資料響應及其衍生參數(shù)的RF 儲層滲透率評價模型,同時利用SA-GA 對RF 中的超參數(shù)進行尋優(yōu)處理,該尋優(yōu)模式比粒子群(PSO)、遺傳(GA)等尋優(yōu)算法能夠求取全局最優(yōu)解且收斂速度快,可以充分發(fā)揮RF的性能。
中東伊拉克H 油田M 層組巨厚型碳酸鹽巖儲層發(fā)育規(guī)模大,平面及縱向連通性好,受成巖作用影響大,孔隙度與滲透率的分布隨機性強,滲透率分布范圍廣,與中國碳酸鹽巖存在明顯差異[19-20]。研究區(qū)受縫洞干擾較小,由于成巖、沉積作用造成該地區(qū)巖石結構復雜、孔隙類型多樣,孔隙類型主要為溶蝕孔、鑄???、化石內(nèi)孔、粒間孔、粒內(nèi)孔、基質(zhì)微孔等,導致該類型儲層具有極強的非均質(zhì)性[21]。儲層主要為石灰?guī)r,巖石組分由生物碎屑與方解石及少部分黏土結晶組成,發(fā)育有生物碎屑泥粒石灰?guī)r、生物碎屑粒泥灰?guī)r、生物碎屑顆粒灰?guī)r,粒狀灰?guī)r等。
孔隙類型對儲層的滲透能力具有不同程度的影響。粒間孔對于巖石儲集能力一般表現(xiàn)為較高的滲透率,孔滲關系較好;鑄???、粒內(nèi)孔、遮蔽孔和體腔孔易表現(xiàn)為高孔低滲透;當巖石存在基質(zhì)微孔,或粒間孔的喉道連通性差時,常見低滲透率[22-24]。圖1a與1b中盡管二者可視孔隙發(fā)育,但由于存在晶體膠結作用,滲透率存在較大的差異。圖1c 與1d 微孔發(fā)育,孔隙度不高,滲透率較低。分析研究區(qū)的巖心物性資料(圖2)表明,孔隙度與滲透率相關性不明顯。
因此在研究區(qū)孔隙結構復雜、儲層強非均質(zhì)性的情況下,建立能夠充分表征儲層特性、考慮非均質(zhì)性影響的滲透率評價模型。
圖1 伊拉克H油田M層組鑄體薄片F(xiàn)ig.1 Thin sections from M Formation of H Oilfield in Iraq
圖2 巖心孔滲關系Fig.2 Core porosity-permeability relationship
RF 由BREIMAN 于2001 年提出,是由bagging算法與決策樹為框架的集成算法,在分類、預測和缺失值檢測等方面得到廣泛應用[25-26]。利用每棵決策樹對袋外數(shù)據(jù)的輸入矩陣進行預測,將各決策樹預測結果均值作為最終預測輸出結果,將該算法運用于滲透率評價的主要步驟包括:
Boostrap 采樣 將具有M個特征向量Ns個樣本的數(shù)據(jù)進行隨機有放回抽取,未被抽中的數(shù)據(jù)稱為袋外數(shù)據(jù)。其中,袋外數(shù)據(jù)可以評估模型的好壞以防止過擬合。
生長 隨機抽取m(m 生成決策樹 重復k次上述的過程生成k個訓練集,對應可生成k個決策樹,k個決策樹構成隨機森林。當k趨于無窮大時滿足(2)式和(3)式。 θk為第k個決策樹對應的隨機向量,當回歸樹之間的相關性越低,回歸森林的泛化誤差越小同時當k趨于無窮大時,模型泛化誤差收斂趨于定值。 預測 根據(jù)構建的RF 進行帶預測樣本的預測,最終的預測結果為所有決策樹回歸樹預測結果的均值。 RF 中不同參數(shù)對RF 模型具有不同程度的影響,決策樹個數(shù)(number estimators)過大導致模型過擬合,相反過小則欠擬合。最大特征數(shù)(max fea?tures)越大,模型的表現(xiàn)能力越好,但并不是特征數(shù)最大時,模型達到最優(yōu)。為解決RF 的決策樹個數(shù)與特征分裂數(shù)二者對于模型的影響,利用SA-GA 進行參數(shù)尋求。模擬退火算法(SA)能夠跳出局部值,尋找全局最優(yōu)解;遺傳算法(GA)具有收斂快,不易過擬合的特性。SA-GA 算法是將兩種算法結合,彌補GA 收斂過快出現(xiàn)局部自優(yōu)和SA 收斂速度慢、容易產(chǎn)生震蕩的缺點,能夠充分發(fā)揮各自的優(yōu)勢[27-28]。具體步驟包括: ①初始化相關參數(shù)。選取輸入、輸出參數(shù),進行初始化,隨機產(chǎn)生n個個體為初始化種群,即RF的決策樹個數(shù)和特征分裂數(shù),設置最大迭代次數(shù)為Mmax,規(guī)定退火過程的初始溫度與截止溫度。 ②適應度函數(shù)。適應度函數(shù)決定種群中的個體是否能夠保留,適應度函數(shù)為RF 誤差評價函數(shù),表達式為: ③選擇、交叉、變異操作。選擇、交叉、變異的目的是對種群進行操作,保留優(yōu)秀的個體,依據(jù)個體的適應度選擇當前優(yōu)秀個體。本文中的選擇操作為“輪盤賭法”,即個體成為父代,其表達式為: 交叉、變異操作的目的是產(chǎn)生新的子代,按照一定的隨機概率選擇個體進行交叉、變異操作,從而產(chǎn)生可行的個體。 ④模擬退火算法進行局部更新。對交叉、變異后產(chǎn)生的新的個體與父代進行模擬退火操作,在此進行模擬時采用Metropolis準則,其表達式為: 若P小于隨機產(chǎn)生的個體,則保留子代個體,如不滿足上述條件則保留父代個體繼續(xù)進行種群中的最優(yōu)檢測。 ⑤迭代結束。重復步驟①—④,達到最大迭代次數(shù)則尋優(yōu)結束。 研究區(qū)巖石結構復雜,儲集空間具有多樣性,多種孔隙類型發(fā)育,地層縱向非均質(zhì)性強。孔隙類型多樣導致儲層滲流能力差異大,滲透率分布區(qū)間較廣,巖心孔滲關系復雜。當?shù)叵履骋簧疃葍有再|(zhì)發(fā)生變化時,其測井響應特征值也會受到影響。利用RF 中重復采樣的原理能夠解決該部分數(shù)據(jù)分布不均帶來的干擾,進而有效克服孔隙結構復雜及儲層強非均質(zhì)性帶來的影響。 文中構建的滲透率評價模型主要包括數(shù)據(jù)預處理、參數(shù)尋優(yōu)、RF 搭建、預測(圖3)。其中預處理包括常規(guī)測井曲線的響應特征分析,并優(yōu)選相應的衍生參數(shù),對其進行敏感性分析,優(yōu)選輸入特征向量。在此以巖性樣本深度點對應的測井值為序列數(shù)據(jù),用巖心數(shù)據(jù)標定全井段。RF為該網(wǎng)絡的核心部分,其輸入層即為預處理確定的輸入特征向量,然后利用SA-GA 尋優(yōu)模型進行RF 的參數(shù)尋優(yōu),通過產(chǎn)生不同參數(shù)組合序列,計算不同組合下的適應度函數(shù),進行多次迭代,直到收斂,將尋優(yōu)結果作為參數(shù)的最優(yōu)解輸入RF 進行滲透率預測,形成最終的滲透率評價模型。 巨厚型碳酸鹽巖儲層孔隙類型復雜,非均質(zhì)性強,測井響應特征不明確,為更好表征該區(qū)碳酸鹽巖復雜孔隙結構,選用衍生參數(shù)放大油層響應特征,提高滲透率計算精度[29]。分別計算三孔隙、三孔隙度差值、三孔隙度比值5個衍生參數(shù),其計算公式分別為: 根據(jù)常規(guī)測井曲線及衍生曲線在不同流體中響應特征差異,對10條測井曲線與滲透率進行了相關性分析(圖4)。通過密度孔隙度(?d)、中子孔隙度(?n)、聲波孔隙度(?s)計算可得,滲透率(K)與三孔隙度比值(B)和三孔隙度差值(C)具有極弱的相關性,與?d,?n,?s,密度曲線(DEN),中子曲線(CNL),自然伽馬曲線(GR),聲波時差曲線(DT),自然電位對數(shù)曲線(lnRT)存在一定的相關性,但密度曲線、中子曲線、聲波時差曲線存在強相關性,去除高度共線性的曲線,最終優(yōu)選常規(guī)測井曲線自然伽馬、電阻率,衍生曲線密度孔隙度、中子孔隙度、聲波孔隙度為輸入?yún)?shù)組合,進行滲透率計算。 圖4 測井曲線與儲層參數(shù)相關性檢測結果Fig.4 Test results of correlation between logging curves and reservoir parameters 確定輸入?yún)?shù)后,對異常數(shù)據(jù)進行清洗,消除輸入特征參數(shù)量綱差異帶來的影響。選取約80%樣本作為訓練集,20%樣本作為測試集進行模型訓練,即508 個樣本為訓練集,146 個樣本為測試集。表1展示了部分訓練樣本與測試樣本。 表1 滲透率模型計算的部分訓練樣本與測試樣本分析結果Table1 Results of some training samples and test samples calculated by permeability model 對決策樹個數(shù)與分裂特征數(shù)進行步長為1的精細傳統(tǒng)網(wǎng)格尋優(yōu)和SA-GA 尋優(yōu)(圖5,圖6)。傳統(tǒng)網(wǎng)格尋優(yōu)與SA-GA 尋優(yōu)中的相關參數(shù)設置與尋優(yōu)結果參見表2,通過對比,表2 與圖5 表明傳統(tǒng)網(wǎng)格尋優(yōu)能夠得到絕對全局最優(yōu)解(決策樹個數(shù)為178,分裂特征數(shù)為1),但耗時較長,不具有時效性;圖6表明SA-GA 尋優(yōu)過程中在決策樹個數(shù)為191,分裂特征數(shù)為1 時達到收斂,在該過程中耗時相比傳統(tǒng)網(wǎng)格尋優(yōu)極大的縮短,且尋優(yōu)的結果也接近于全局最優(yōu)解。 圖5 傳統(tǒng)網(wǎng)格尋優(yōu)結果Fig.5 Results of searching for optimal solution of traditional grids 圖6 SA-GA尋優(yōu)結果Fig.6 Sketch map of SA-GA iteration 表2 模型參數(shù)設置和參數(shù)優(yōu)化結果Table2 Parameters setting and optimization results of model 利用測試集對SA-GA 尋優(yōu)結果進行驗證,SAGA-RF 尋優(yōu)的滲透率評價模型效果,由SA-GA-RF模型的預測結果(圖7a)可知,巖心滲透率與預測滲透率的相關系數(shù)(R2)達到0.83,平均絕對誤差(MAE)為0.29。相比隨機參數(shù)所建立的RF 模型(圖7b),其R2提高了0.15,MAE提高了0.12。綜上認為,SAGA-RF 滲透率評價模型能夠在不損失模型精度的情況下發(fā)揮模型的最大性能。為驗證該模型的外推能力,對全部樣本進行十折交叉驗證,結果如圖8所示,在進行的十折交叉驗證中SA-GA-RF 模型的誤差函數(shù)值的平均值為0.19,說明該模型具有一定的泛化能力和有效性,能高精度的完成預測任務。 圖7 滲透率評價模型預測結果Fig.7 Prediction results of permeability evaluation model 圖8 十折交叉驗證Fig.8 10-fold cross-validation 將建立的SA-GA-RF滲透率評價模型及RF和SA-GA-BP 應用于研究區(qū),從實際應用效果分析驗證模型的可靠性。為保證分析結果的準確性,SAGA-RF,RF 及SA-GA-BP 均采用相同的建模樣本集及預測樣本集,其中將BP 進行SA-GA 尋優(yōu)是為了確定BP 的最優(yōu)相關參數(shù)。從應用效果(圖9)來看,3 種滲透率評價模型均能反映滲透率隨深度變化趨勢,但預測精度有明顯差異,SA-GA-BP滲透率評價模型中滲透率低值與高值存在明顯偏差。RF在中高滲透儲層計算效果較好。SA-GA-RF 滲透率評價模型在全井段應用效果較好,誤差較小,優(yōu)于其他2種模型,特別是在低滲透率區(qū)間,優(yōu)勢更加明顯。利用MAE和R2對上述結論進行定量評價,MAE越小,R2越大,其預測值與真實值的誤差越小,以上3 種方法中SA-GA-RF 的誤差明顯小于其余2種滲透率評價模型,其中SA-GA-RF 的MAE與R2分別 達0.17 和0.9。而RF 與SA-GA-BP 的MAE分 別為0.45和0.74,R2分別為0.53和0.42。 圖9 A井滲透率評價模型應用結果分析Fig.9 Application results of permeability evaluation model in Well A SA-GA-RF 滲透率評價模型能充分反映測井響應特征差異,模型穩(wěn)定性強,計算結果精度高,更適用于孔隙結構復雜、儲層非均質(zhì)性強的碳酸鹽巖儲層滲透率評價。 針對中東地區(qū)碳酸鹽巖儲層參數(shù)評價,提出了SA-GA-RF 的滲透率評價模型。首先對滲透率的測井響應曲線進行優(yōu)選,確定自然伽馬、電阻率,衍生曲線密度孔隙度、中子孔隙度、聲波孔隙度為輸入特征向量,利用SA-GA 對RF 中重要參數(shù)決策樹個數(shù)和分裂特征數(shù)進行尋優(yōu),最終確定當決策樹個數(shù)為191 和分裂特征數(shù)為1 時的最優(yōu)參數(shù)組合,建立了最優(yōu)參數(shù)組合下的滲透率評價模型。SA-GARF 解決了參數(shù)對模型精確度的影響,同時基于RF自身能夠解決數(shù)據(jù)分布不均且泛化能力強等特點,將該方法用于中東H 油田M 層組的強非均質(zhì)碳酸鹽巖儲層評價中,模型精確度得到提高,相比于RF和SA-GA-BP 這2 種滲透率評價模型,其平均絕對誤差分別降低了0.28和0.57。 符號解釋2.2 基于SA-GA參數(shù)尋優(yōu)
2.3 SA-GA-RF滲透率評價模型構建流程
3 滲透率評價模型建立及應用
3.1 輸入特征參數(shù)優(yōu)選
3.2 模型訓練
3.3 模型驗證
4 模型應用與對比
5 結論