孔強(qiáng)夫,楊 才,李 浩,耿 超,鄧 健
(1.中國(guó)石化 石油勘探開發(fā)研究院,北京 100083; 2.中國(guó)石油集團(tuán) 長(zhǎng)城鉆探工程有限公司 國(guó)際測(cè)井公司,北京 100083; 3.中國(guó)石油 西南油氣田分公司 蜀南氣礦,四川 瀘州 646000; 4.中國(guó)石油 華北油田公司 勘探開發(fā)研究院,河北 任丘 062552)
雷口坡組是四川盆地重要的勘探層系之一,具有廣闊的勘探前景[1-6]。由于川西海相碳酸鹽巖地層埋藏深度大,巖性變化快,巖性的準(zhǔn)確識(shí)別是碳酸鹽巖儲(chǔ)層評(píng)價(jià)中的一個(gè)關(guān)鍵難題。巖性識(shí)別對(duì)于儲(chǔ)層評(píng)價(jià)及流體識(shí)別至關(guān)重要,目前測(cè)井巖性識(shí)別方法主要有交會(huì)圖法[7-9]、數(shù)據(jù)挖掘識(shí)別法(主成分分析、Fisher判別、神經(jīng)網(wǎng)絡(luò)及支持向量機(jī))[10-13]和測(cè)井新技術(shù)識(shí)別法(成像測(cè)井及元素測(cè)井)等[14-18]。其中交會(huì)圖方法應(yīng)用最為廣泛,但該類方法反映的巖性信息有限,識(shí)別精度有待進(jìn)一步提高。數(shù)據(jù)挖掘方法相對(duì)交會(huì)圖法識(shí)別精度高,但其適用性很大程度上取決于樣本的代表性。測(cè)井新技術(shù)識(shí)別方法能夠大幅度提高測(cè)井巖性識(shí)別的解釋精度,但該類方法由于成本較高難以普及。
圖論聚類(MRGC)是一種新型的機(jī)器學(xué)習(xí)方法,該方法基于最小臨近算法(K-Nearest Neighbor,KNN)和圖形數(shù)據(jù)表示的多維點(diǎn)陣圖形識(shí)別,由于KNN較其他方法更適合類域的交叉或重疊較多的樣本集[19-23],因此本文首先針對(duì)川西雷口坡組碳酸鹽巖儲(chǔ)層巖性常規(guī)測(cè)井識(shí)別難度大的問題引入有監(jiān)督MRGC機(jī)制,對(duì)已知定名巖性進(jìn)行聚類生成訓(xùn)練模型,然后結(jié)合最小臨近算法進(jìn)行外推,對(duì)其他未取心井巖性進(jìn)行全井段預(yù)測(cè),從而實(shí)現(xiàn)碳酸鹽巖巖性精確識(shí)別。
基于4類選樣原則:①剔除井眼條件或鉆井液質(zhì)量差的樣本;②盡量選擇巖心歸位好,巖性相對(duì)穩(wěn)定,井眼相對(duì)平滑段的樣本點(diǎn);③盡量避免選擇薄層和層界面處的樣本;④部分巖心破碎結(jié)合丟失的樣本點(diǎn)需重新歸位。依據(jù)巖性成分結(jié)構(gòu)特征,薄片和巖心鑒定等資料,將雷口坡組碳酸鹽巖巖性歸為藻粘結(jié)白云巖、粉晶白云巖、泥晶白云巖、灰質(zhì)白云巖、白云質(zhì)灰?guī)r、灰?guī)r、膏質(zhì)白云巖和石膏共8大類。
巖性對(duì)物性有明顯的控制作用,白云質(zhì)含量的多少(膏質(zhì)白云巖除外)基本決定了儲(chǔ)層質(zhì)量的好與差。其中粉晶白云巖和藻粘結(jié)白云巖物性最好,該類巖性孔隙度大部分大于5%,滲透率大于0.1×10-3μm2,且最容易發(fā)育溶蝕孔和裂縫。泥晶白云巖和灰質(zhì)白云巖孔隙度小于5%,幾乎不發(fā)育溶蝕孔,部分儲(chǔ)層發(fā)育裂縫;白云質(zhì)灰?guī)r、灰?guī)r、膏質(zhì)白云巖和石膏物性最差,不發(fā)育溶蝕孔,有少量?jī)?chǔ)層發(fā)育裂縫,孔隙度大部分小于2%,滲透率小于0.1×10-3μm2(圖1a)。
絕大部分的藻粘結(jié)白云巖、大部分泥晶白云巖和部分粉晶白云巖、灰質(zhì)白云巖深側(cè)向電阻率(RD)值小于2 000 Ω·m,中子孔隙度(CNL)值介于6%~14%;大部分粉晶白云巖和部分灰質(zhì)白云巖、少量的泥晶白云巖和藻粘結(jié)白云巖深側(cè)向電阻率(RD)值介于7 000~20 000 Ω·m,中子孔隙度(CNL)值介于5%~11%;白云質(zhì)灰?guī)r、灰?guī)r、膏質(zhì)白云巖和石膏深側(cè)向電阻率(RD)值大于7 000 Ω·m,中子孔隙度(CNL)值小于6%(圖1b)。絕大部分藻粘結(jié)白云巖和粉晶白云巖伽馬(GR)值介于35~70 API,聲波時(shí)差值(AC)大于49 μs/ft;大部分泥晶白云巖和部分藻粘結(jié)白云巖伽馬(GR)值大于70 API,聲波時(shí)差(AC)值小于50 μs/ft;白云質(zhì)灰?guī)r、石膏和部分膏質(zhì)白云巖伽馬(GR)值小于35 API,聲波時(shí)差(AC)值大于50 μs/ft(圖1c)。
圖1 川西雷口坡組8類巖性常規(guī)測(cè)井響應(yīng)特征Fig.1 Response characteristics of eight lithologic facies in the Leikoupo Formation of western Sichuan Basin during conventional logging a.孔隙度-滲透率交會(huì)圖;b. CNL-RD交會(huì)圖;c. GR-AC交會(huì)圖
MRGC方法是一種新型的機(jī)器學(xué)習(xí)方法,該方法采用向量空間模型,將優(yōu)選的模型曲線和預(yù)測(cè)曲線轉(zhuǎn)化為由若干個(gè)特征組成空間形式(t1,t2,…,tk),再將各個(gè)特征樣本在曲線數(shù)據(jù)上賦予的數(shù)值填充到向量空間中。最終一個(gè)樣本數(shù)據(jù)dj的數(shù)學(xué)表示形式為:wj(w1j,w2j,…,wkj,…,w|T |j),其中wkj表示特征tk在樣本數(shù)據(jù)dj上的值,|T|表示特征向量的維數(shù)[16]。
設(shè)有2個(gè)特征向量X=(x1,x2,…,x|T|)和Y=(y1,y2,…,y|T |) ,則2個(gè)樣本數(shù)據(jù)之間的相似度采用歐幾里德距離來(lái)表示,如公式(1)所示:
(1)
利用高斯函數(shù)將公式(1)中計(jì)算的距離轉(zhuǎn)換為權(quán)重,根據(jù)距離的遠(yuǎn)近對(duì)預(yù)測(cè)結(jié)果進(jìn)行貢獻(xiàn)值補(bǔ)償,再通過每個(gè)最近鄰乘以相應(yīng)權(quán)重,然后將所得到的結(jié)果累加,并除以所有權(quán)重值的和,如公式(2)所示:
(2)
式中:P為最終的預(yù)測(cè)結(jié)果;Si為k個(gè)最近鄰中的第i個(gè);wi為Si對(duì)應(yīng)的權(quán)重值。
最小臨近算法(KNN)是理論上比較成熟的方法,該方法思路是如果1個(gè)樣本在特征空間中的k個(gè)最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別。計(jì)算這個(gè)點(diǎn)與其它所有點(diǎn)之間的距離,取出與該點(diǎn)最近的k個(gè)點(diǎn),然后統(tǒng)計(jì)這k個(gè)點(diǎn)里面所屬比例最大的,則這點(diǎn)屬于該分類。通過KNN算法,可以建立識(shí)別巖性聚類圖版和測(cè)井曲線的聯(lián)系。
本文引入機(jī)器學(xué)習(xí)的思想,先利用已知準(zhǔn)確巖性定名的樣本點(diǎn)進(jìn)行監(jiān)督,輸入測(cè)井曲線作為訓(xùn)練數(shù)據(jù),利用MRGC對(duì)樣本數(shù)據(jù)進(jìn)行聚類分析生成訓(xùn)練模型,得到不同巖性的聚類圖版。為了實(shí)現(xiàn)未取心井全井段巖性識(shí)別,還需引入KNN算法對(duì)按照聚類圖版的原則進(jìn)行巖性預(yù)測(cè)。圖2給出了巖性識(shí)別的技術(shù)流程。
圖2 巖性識(shí)別技術(shù)流程Fig.2 Flow chart of lithology identification
圖3給出了不同巖性常規(guī)測(cè)井值分布,可以看出不同巖性的測(cè)井響應(yīng)具有一定的差異這為巖性識(shí)別提供了可靠的依據(jù)。因此優(yōu)選了GR,DEN,CNL和RD 4條巖性敏感曲線作為訓(xùn)練數(shù)據(jù),利用MRGC方法建立訓(xùn)練模型如圖4所示,圖5為訓(xùn)練模型得到的巖性識(shí)別圖版。
圖3 川西雷口坡組8類巖性常規(guī)測(cè)井值分布范圍Fig.3 Distribution ranges of conventional log values of eight lithologic facies in the Leikoupo Formation,western Sichuan Basin
圖5 川西雷口坡組8類巖性聚類圖版Fig.5 Clustering chart of eight lighologic facies in the Leikoupo Formation in western Sichuan Basin
圖4 川西雷口坡組8類巖性MRGC訓(xùn)練模型Fig.4 MRGC training model for eight lithologic facies of the Leikoupo Formation in western Sichuan Basin
基于同刻度分析(將巖性轉(zhuǎn)換為相應(yīng)的代碼符號(hào)),利用KNN算法對(duì)識(shí)別圖版進(jìn)行學(xué)習(xí)。分別對(duì)川西雷口坡組彭州1井、羊深1井、鴨深1井、彭州103井和彭州115井5口井260個(gè)樣本點(diǎn)進(jìn)行了單井驗(yàn)證,整體符合率91.3%(表1)證明了該方法的可行性。對(duì)于巖性相對(duì)穩(wěn)定,無(wú)明顯擴(kuò)徑層段,測(cè)井識(shí)別巖性與薄片定名一致,如圖6倒數(shù)第三道為藻粘結(jié)白云巖(5 785~5 789 m)和粉晶白云巖(5 793~5 798 m)典型鏡下照片,倒數(shù)第二道(EFAC)為測(cè)井識(shí)別巖性代號(hào),最后一道(DM)為薄片定名巖性代號(hào),從識(shí)別效果來(lái)看,整體一致性較好。但在薄片定名樣本點(diǎn)少,井況條件差的情況下識(shí)別效果較差,如彭州115井6 328.4 m樣本點(diǎn)測(cè)井識(shí)別為灰質(zhì)白云巖(DM=4),薄片定名為藻粘結(jié)白云巖(圖7)。整體來(lái)看,白云巖類(藻粘結(jié)白云巖、粉晶白云巖、泥晶白云巖和灰質(zhì)白云巖)的識(shí)別符合率較灰?guī)r類(白云質(zhì)灰?guī)r和灰?guī)r)較高(表1)。
表1 測(cè)井巖性識(shí)別與薄片定名符合率(部分?jǐn)?shù)據(jù))Table 1 Coincidence rate between logging lithology identification and slice naming(part of data)
圖7 川西雷口坡組彭州115井(6 310~6 420 m)測(cè)井巖性識(shí)別與薄片定名對(duì)比Fig.7 Comparison of logging lithology identification and thin slice naming in Well Pengzhou 115 (6 310-6 420 m) in the Leikoupo Formation,western Sichuan Basin
圖6 川西雷口坡組鴨深1井(5 770~5 800 m)測(cè)井巖性識(shí)別與薄片定名對(duì)比Fig.6 Comparison of logging lithology identification and thin slice naming in Well Yashen 1 (5 770-5 800 m) in the Leikoupo Formation,western Sichuan Basin
1) 巖性與物性、電性和含氣性之間關(guān)系密切,巖性的準(zhǔn)確識(shí)別是儲(chǔ)層參數(shù)評(píng)價(jià)及流體識(shí)別的基礎(chǔ)。
2) 白云巖中的藻粘結(jié)白云巖和粉晶白云巖物性相對(duì)較好,灰?guī)r的物性相對(duì)較差,石膏為非儲(chǔ)層,中子、密度、電阻率和伽馬對(duì)不同巖性具有一定的敏感性。
3) 5口井的測(cè)井巖性識(shí)別與薄片定名對(duì)比效果表明,MRGC聚類分析結(jié)合KNN方法在碳酸鹽巖復(fù)雜巖性識(shí)別中具有一定的可行性。