廖廣志 ,李遠征 ,肖立志 ,秦志軍,胡向陽,胡法龍
1 中國石油大學(北京)油氣資源與探測國家重點實驗室,北京 102249 2 中國石油大學(北京)教育部非常規(guī)油氣國際合作聯(lián)合實驗室,北京 102249 3 中國石油大學(北京)地球探測與信息技術(shù)北京市重點實驗室,北京 102249 4 中國石油新疆油田勘探開發(fā)研究院,克拉瑪依 834000 5 中海石油(中國)有限公司湛江分公司,湛江 524057 6 中國石油勘探開發(fā)研究院測井與遙感技術(shù)研究所,北京 100083
在中低滲油氣藏中,毛管壓力是油氣自吸的主要作用力,也是油氣排驅(qū)的主要阻力,并在很多油氣藏中影響著油氣的分布。而影響毛管壓力的一個主要因素是儲層的孔隙結(jié)構(gòu)[1-2]。由于儲層孔隙結(jié)構(gòu)的差異,孔滲條件相同的中低滲油氣藏的烴飽和特性可能完全不同[3]。儲層孔隙結(jié)構(gòu)表征與預(yù)測對地質(zhì)作用分析與油氣分布等方面的新認識具有重要意義。造成儲層孔隙結(jié)構(gòu)差異的因素較多,比如巖石類型、分選、粒度等。成巖作用對儲層的微觀孔隙結(jié)構(gòu)有著正反兩方面的影響。壓實作用減小了一些原生孔隙,而由膠結(jié)作用形成的膠結(jié)物使得孔隙結(jié)構(gòu)變得更加復(fù)雜;溶蝕作用可以形成均質(zhì)性較好的次生孔;由地質(zhì)構(gòu)造作用產(chǎn)生的下降和隆升使地層受到沉陷和剝蝕,亦能部分重構(gòu)儲層的孔隙結(jié)構(gòu)[4-6]。
壓汞毛管壓力數(shù)據(jù)(MICP)是間接識別儲層孔隙結(jié)構(gòu)的常用數(shù)據(jù)之一。目前在實驗室有許多關(guān)于儲層巖石孔隙結(jié)構(gòu)的研究方法,如使用巖心切片和MICP數(shù)據(jù)對巖心數(shù)據(jù)進行統(tǒng)計分析[7],利用核磁T2譜擬合擬毛管壓力曲線來表征微觀孔隙結(jié)構(gòu)[8],利用巖心CT和數(shù)字巖心相結(jié)合的多維成像技術(shù)來指示宏觀參數(shù)和微觀參數(shù)之間的關(guān)系等[9-12]。這些方法對孔隙結(jié)構(gòu)的表征在響應(yīng)機理、分辨率、響應(yīng)范圍等方面各不相同,存在較大差異,有時候甚至存在矛盾之處。目前,大部分方法只能通過巖心取樣在實驗室進行測量分析,由于成本原因難以在井下推廣應(yīng)用。儲層微觀孔隙結(jié)構(gòu)表征和預(yù)測的主要重點是:1)如何正確認識儲層不同的孔隙結(jié)構(gòu)以及不同的孔隙結(jié)構(gòu)對油氣分布的控制作用;2)如何建立一個經(jīng)濟有效的孔隙結(jié)構(gòu)分類方法;3)如何構(gòu)建微觀孔隙結(jié)構(gòu)與宏觀表征參數(shù)之間的關(guān)系。
以數(shù)據(jù)為驅(qū)動的深度學習算法可以充分整合不同類型數(shù)據(jù)中的有效信息,對多源數(shù)據(jù)進行特征描述[12]。深度學習技術(shù)可以自主學習特征,避免復(fù)雜的前期預(yù)處理,根據(jù)學習模型獲得無序的、非線性的調(diào)節(jié),使其無限逼近目標[13-14]。本研究以新疆某地區(qū)砂礫巖地層為例,在深入分析MICP數(shù)據(jù)特征的基礎(chǔ)上,提取11個特征參數(shù)中的敏感性參數(shù)來表征儲層孔隙結(jié)構(gòu)。利用灰色關(guān)聯(lián)分析、主成分分析、因子分析和智能聚類等數(shù)據(jù)挖掘技術(shù)解決數(shù)據(jù)之間的共線問題和孔隙結(jié)構(gòu)分類問題,然后將常規(guī)測井資料作為輸入層,提出了一種應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)預(yù)測儲層微觀孔隙結(jié)構(gòu)的方法。
利用MICP數(shù)據(jù)特征可以表征不同的孔隙結(jié)構(gòu)參數(shù),如孔喉半徑、分選、孔喉分布的均勻性、連通性等[15-16]??紫督Y(jié)構(gòu)參數(shù)可以用分布函數(shù)模型來計算。表1為計算得到的孔隙結(jié)構(gòu)參數(shù)及其物理意義。
表中,Pd為排驅(qū)壓力,Di為進汞飽和度為i時所對應(yīng)的喉道半徑,Smax為最大進汞飽和度,Vk為孔隙體積,Vh為喉道體積,R為平均孔隙半徑,P50為進汞飽和度為50%時的壓力。
灰色關(guān)聯(lián)分析是一種多因素統(tǒng)計分析方法,是根據(jù)因素之間發(fā)展趨勢的相似或相異程度,即灰色關(guān)聯(lián)度,作為衡量因素間關(guān)聯(lián)程度的一種方法[17-18]。這里將巖心滲透率作為灰色關(guān)聯(lián)分析中的參考數(shù)列,各個孔隙結(jié)構(gòu)參數(shù)作為比較數(shù)列,進而確定孔隙結(jié)構(gòu)的敏感性參數(shù)。
灰色關(guān)聯(lián)分析的結(jié)果如表2所示,選取關(guān)聯(lián)度較大的Ra、Dm、We、Kp、Skp、K和α為孔隙結(jié)構(gòu)的敏感性參數(shù),所選參數(shù)具有很強的相關(guān)性,為解決參數(shù)間的共線性問題,需對所選參數(shù)做進一步的分析。
主成分分析和因子分析是高維數(shù)據(jù)降維的兩種常用方法,將兩種方法用于孔隙結(jié)構(gòu)參數(shù)的壓縮,解決共性線問題。表3是主成分分析的結(jié)果,第一列是提取的主成分,第二列每個主成分對應(yīng)的特征值,其大小表示包含原始變量各主成分的能力,第三列和第四列表示每個主成分的貢獻率及累計貢獻率。從表中可以看出,前3個主成分包含原始數(shù)據(jù)90%以上的信息,提取前3個主成分可達到數(shù)據(jù)壓縮的效果。由主分析分析的碎石圖(圖1)的結(jié)果也可以看到,前3個主成分所對應(yīng)的平臺陡峭,包含原始數(shù)據(jù)的大部分信息。
表1 孔隙結(jié)構(gòu)參數(shù)及物理意義Table 1 Pore structure parameters and physical significance
表2 灰色關(guān)聯(lián)分析Table 2 Grey relational analysis
主成分分析主要用于數(shù)據(jù)壓縮,消除共線性,但難以解釋每個主成分的實際意義,基于參數(shù)矩陣的因子分析可以對提取的因子做因子旋轉(zhuǎn),使得因子與組分之間的關(guān)系得到重新分布,從而使孔隙結(jié)構(gòu)類型更易于解釋[18]。圖2為提取的主因子與孔隙結(jié)構(gòu)參數(shù)的三維交匯圖,表4是因子旋轉(zhuǎn)之后的結(jié)果。由表可知,Skp、Kp和α的因子1的得分分別為0.962、-0.783和0.612,說明因子1主要反映的而是孔喉分選及分布的信息。We和K的因子2的得分分別為0.880和-0.979,說明因子2主要反映孔喉滲流及連通性的信息。而Ra和Dm因子3的因子得分分別為0.983和0.910,說明因子3主要反映孔喉大小信息。由此推斷出孔隙結(jié)構(gòu)可以從孔喉分選及分布、孔喉滲流及連通、孔喉大小三方面來描述。
表3 主成分分析Table 3 Principal component analysis
對經(jīng)過主成分分析之后的孔隙結(jié)構(gòu)數(shù)據(jù)進行聚類分析,以確定孔隙結(jié)構(gòu)的類型。首先引入層次聚類的方法。層次聚類試圖在不同層次上對數(shù)據(jù)集進行劃分,從而形成樹形的聚類結(jié)構(gòu)。有“自底向上”的聚合策略,也有“自頂向下”的分拆策略。“自底向上”聚合策略首先將每個對象作為一個簇,然后合并這些簇為越來越大的簇,直到所有的對象都在一個簇中。計算簇與簇之間距離的方法有三種,包括最短距離法,最長距離法,類平均法[19]。
圖1 主成分分析碎石圖Fig. 1 Scree plot of principal component analysis
圖2 孔隙結(jié)構(gòu)參數(shù)因子分析得分圖Fig. 2 Factor analysis score chart of pore structure parameters
表4 因子分析旋轉(zhuǎn)成分矩陣Table 4 Factor analysis rotation component matrix
原始孔隙結(jié)構(gòu)數(shù)據(jù)經(jīng)過主成分分析之后,每個樣本得到3個主成分,將這3個主成分組成三維向量進行凝聚層次聚類分析。采用類平均法計算兩個簇中的每個數(shù)據(jù)點與其它簇中所有數(shù)據(jù)點的距離,然后將所有距離的均值作為兩個簇間的距離。其綜合考慮到了所有的數(shù)據(jù)點,結(jié)果較最短距離法和最長距離法更為合理。圖3是凝聚層次聚類的結(jié)果示意圖。
由凝聚層次聚類結(jié)果可知,以1.0作為類間距離劃分的標準值,孔隙結(jié)構(gòu)可以分為5類。同時引入K均值聚類的方法和譜聚類的方法進行對比分析。
圖3 凝聚層次聚類結(jié)果Fig. 3 The results of aggregation hierarchical clustering
圖4 K均值聚類流程Fig. 4 K-means clustering process
表5 K值聚類的聚類中心Table 5 The center of the K-means clustering
原始孔隙結(jié)構(gòu)數(shù)據(jù)經(jīng)過主成分分析之后,每個樣本得到3個主成分,將這3個主成分組成三維向量,進行K均值聚類分析,由凝聚層次聚類的結(jié)果可知,孔隙結(jié)構(gòu)可以分成5類,故進行K均值聚類分析時,隨機選擇5個聚類中心,其聚類流程如圖4所示,最終得到的5類孔隙結(jié)構(gòu),聚類中心如表5所示。
譜聚類是一種基于圖論的聚類方法,通過對樣本數(shù)據(jù)的拉普拉斯特征向量進行聚類,從而達到對樣本數(shù)據(jù)進行聚類的目的[20]。將每個樣本的3個主成分組成三維向量,依次計算樣本數(shù)據(jù)的相似度矩陣、度矩陣、拉普拉斯矩陣,然后對拉普拉斯矩陣進行標準化,計算特征值,最后進行聚類,其算法流程如圖5所示。
綜合凝聚層次聚類、K均值聚類、譜聚類的聚類結(jié)果,結(jié)合孔隙結(jié)構(gòu)特征參數(shù),最終孔隙結(jié)構(gòu)的分類如表6所示。
根據(jù)孔隙結(jié)構(gòu)的最終分類結(jié)果,分別繪制5類毛管壓力曲線,如圖6所示。
由各類毛管壓力曲線形態(tài)可知,第一類毛管壓力曲線對應(yīng)的孔隙結(jié)構(gòu)最好,第五類毛管壓力曲線對應(yīng)的孔隙結(jié)構(gòu)最差。同時將提取的主成分與各類孔隙結(jié)構(gòu)做三維交匯圖(圖7)。
圖5 譜聚類流程Fig. 5 Spectral clustering process
從三維分布上(圖7)看,第一類孔隙結(jié)構(gòu)的第一主成分主要分布范圍為0.91~4.55,第二主成分主要分布范圍為0.81~1.07,第三主成分主要分布范圍為-0.64~1.19;第二類孔隙結(jié)構(gòu)的第一主成分主要分布范圍為-0.78~0.75,第二主成分主要分布范圍為0.22~1.06,第三主成分主要分布范圍為-1.23~-0.09;第三類孔隙結(jié)構(gòu)的第一主成分主要分布范圍為-1.52~0.05,第二主成分主要分布范圍為0.08~0.35,第三主成分主要分布范圍為0.76~1.31;第四類孔隙結(jié)構(gòu)的第一主成分主要分布范圍為-1.86~-0.35,第二主成分主要分布范圍為-1.36~-0.06,第三主成分主要分布范圍為-1.07~0.21;第五類孔隙結(jié)構(gòu)的第一主成分主要分布范圍為-1.89~0.13,第二主成分主要分布范圍為-4.38~-2.07,第三主成分主要分布范圍為-0.74~-0.52;各類孔隙結(jié)構(gòu)與提取的主成分之間有比較明顯的界限,說明孔隙結(jié)構(gòu)數(shù)據(jù)經(jīng)過挖掘之后,其分類是有效的。
測井資料能夠反映儲層孔隙結(jié)構(gòu)信息,但在實際應(yīng)用中存在較大困難,原因是孔隙結(jié)構(gòu)與測井資料的定量關(guān)系是一個十分復(fù)雜的非線性系統(tǒng)。用常規(guī)的物理模型難以準確表達兩者之間的定量關(guān)系??紫督Y(jié)構(gòu)類型的預(yù)測需要提取特征,解決MICP數(shù)據(jù)與測井資料之間的尺度問題。
表6 部分樣本孔隙分類結(jié)果Table 6 Part of pore structure classification results
人工神經(jīng)網(wǎng)絡(luò)雖然具有良好的智能特性,但不具備自主地學習特征。卷積神經(jīng)網(wǎng)絡(luò)(CNN)是近年來快速發(fā)展的一種高效模式識別方法。該網(wǎng)絡(luò)避免了復(fù)雜的前期預(yù)處理,可以直接輸入原始信息[21]。其示意圖如圖8所示。
圖6 各類孔隙結(jié)構(gòu)毛管壓力曲線Fig. 6 Capillary pressure curves of various pore structures
相比于人工神經(jīng)網(wǎng)絡(luò),CNN具有以下優(yōu)勢:
1)局部感知:每個神經(jīng)元不是對全部測井曲線進行感知,而是對局部信息進行感知,然后在更高層將局部信息綜合起來獲得全局信息。從而有效地減少訓(xùn)練參數(shù),降低網(wǎng)絡(luò)規(guī)模,如圖9所示。
2)權(quán)值共享:將卷積操作看成是與位置無關(guān)的特征提取方式,測井曲線的一部分統(tǒng)計特性與其他部分是一樣的,這意味著學習的某一部分也能用在另一部分上。所以對于這條曲線上的所有位置,都能使用同樣的學習特征。這將減少網(wǎng)絡(luò)各層之間的連接,同時又降低過擬合的風險。
圖7 各類孔隙結(jié)構(gòu)與主成分三維交匯圖Fig. 7 Three-dimensional intersection diagrams of various pore structures and principal components
圖8 卷積神經(jīng)網(wǎng)絡(luò)示意圖Fig. 8 Schematic diagram of convolutional neural network
3)子采樣:子采樣也叫做池化,池化層夾在連續(xù)的卷積層中間,用于壓縮數(shù)據(jù)和參數(shù)的量,減小過擬合(圖10)。
孔隙結(jié)構(gòu)類型預(yù)測問題與大部分分類預(yù)測問題相似,是通過監(jiān)督學習的方法訓(xùn)練模型來預(yù)測未知數(shù)據(jù)。然而,測井數(shù)據(jù)不同于常規(guī)的圖像、文字等數(shù)據(jù),其特征難以用深度學習的方法進行表達。這里將測井數(shù)據(jù)模擬成圖片的像素點數(shù)據(jù),將前文聚類分析得到的孔隙結(jié)構(gòu)類別作為標簽,利用卷積神經(jīng)網(wǎng)絡(luò)良好的特征學習能力自主訓(xùn)練儲層特征,基于此設(shè)計了單層卷積神經(jīng)網(wǎng)絡(luò)模型和雙層卷積神經(jīng)網(wǎng)絡(luò)模型。
單層卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)結(jié)構(gòu)如圖11所示。
單層卷積神經(jīng)網(wǎng)絡(luò)模型由4部分組成,分別為測井信息輸入層、卷積特征層、池化層、全連接層。輸入層為自然伽馬、自然電位、井徑、三電阻率、聲波、中子、密度9種測井數(shù)據(jù)模擬成的3×3像素點,卷積特征層由4個卷積核組成,大小為2×2×1,步長為1,池化層采用的是2×2最大值池化,步長為1,接著連接兩個全連接層,網(wǎng)絡(luò)的輸出層后加上一個softmax層,將網(wǎng)絡(luò)輸出的得分值轉(zhuǎn)化為各個孔隙結(jié)構(gòu)的概率分布,權(quán)重初始化采用高斯初始化,偏置用0.1初始化。激活函數(shù)采用relu激活函數(shù),損失函數(shù)采用交叉熵損失函數(shù)。采用梯度下降法進行批量訓(xùn)練,每4個樣本組成一個batch,所有batch完成一次訓(xùn)練為一次迭代過程,訓(xùn)練過程使損失函數(shù)不斷減小,直到到達設(shè)定的閾值或迭代次數(shù)達到設(shè)定的次數(shù),完成訓(xùn)練后,保存權(quán)重和偏置參數(shù),得到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型。
圖9 神經(jīng)元局部連接Fig. 9 Local connection of neurons
圖10 池化過程Fig. 10 Pooling process
網(wǎng)絡(luò)在訓(xùn)練10 000次左右達到收斂,在訓(xùn)練集上能達到85%左右的準確率,在測試集上的準確率為78.6%,如圖12所示。
雙層卷積網(wǎng)絡(luò)模型如圖13所示,將常規(guī)測井數(shù)據(jù)模擬成9×9的像素矩陣作為網(wǎng)絡(luò)的輸入,第一層卷積采用4個卷積核,大小為3×3×1,步長為1;池化層采用的是2×2最大值池化,步長為1;第二層卷積采用8個卷積核,大小為3×3×4,步長為1,最后采用兩個全連接層。網(wǎng)絡(luò)的輸出層后加上一個softmax層,將網(wǎng)絡(luò)輸出的得分值轉(zhuǎn)化為各個孔隙結(jié)構(gòu)的概率分布,權(quán)重初始化采用高斯初始化,偏置用0.1初始化。激活函數(shù)采用relu激活函數(shù),損失函數(shù)采用交叉熵損失函數(shù)。采用梯度下降法進行批量訓(xùn)練,每4個樣本組成一個batch,所有batch完成一次訓(xùn)練為一次迭代過程,訓(xùn)練過程使損失函數(shù)不斷減小,直到到達設(shè)定的閾值或迭代次數(shù)達到設(shè)定的次數(shù),完成訓(xùn)練后,保存權(quán)重和偏置參數(shù),得到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型。
雙層卷積神經(jīng)網(wǎng)絡(luò)在迭代10 000次左右就收斂了,如圖14所示,在訓(xùn)練集上,其訓(xùn)練的準確率可以達到90%,而在測試集上,最終預(yù)測的準確率的可達到82.1%,比單層卷積神經(jīng)網(wǎng)絡(luò)模型的準確率提升3.5%。這是因為原始數(shù)據(jù)經(jīng)過兩次卷積操作后,其特征被一步步抽象化,由低維到高維,最終送入全連接層的是一些相對很純凈的特征。測試集上的預(yù)測結(jié)果如圖15所示,左圖中勾表示預(yù)測正確,叉表示預(yù)測錯誤,右圖中最后一道為測試結(jié)果。從圖15可以看到,雙層卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測準確性較高。
圖11 單層卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 11 The structure of single-layer convolutional neural network
圖12 單層卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練和測試誤差曲線Fig. 12 Training and test error curves of single layer convolutional neural network
圖13 雙層卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 13 The structure of double-layer convolutional neural network
圖14 雙層卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練和測試誤差曲線Fig. 14 Training and testing error curves of double-layer convolutional neural network
圖15 雙層卷積神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果Fig. 15 Prediction results of double-layer convolutional neural network
將單層卷積神經(jīng)網(wǎng)絡(luò)模型和雙層卷積神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于未取心井,其應(yīng)用效果如圖16所示,表7為測井資料綜合解釋成果表。
可以看到,單層和雙層卷積神經(jīng)網(wǎng)絡(luò)在油層和干層的預(yù)測結(jié)果差異不大,但在差油層和含油層,雙層卷積神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果比單層卷積神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果相比,與測井解釋結(jié)果更相符。
圖16 模型的實際應(yīng)用Fig. 16 Practical application of the model
表7 測試井測井資料綜合解釋成果表Table 7 Results of comprehensive interpretation of test well logging data
深度學習作為一種快速發(fā)展人工智能技術(shù)在各個領(lǐng)域都開始了廣泛的應(yīng)用,圍繞深度神經(jīng)網(wǎng)絡(luò)的研究也與日俱增,然而目前深度學習在油氣儲層預(yù)測中的應(yīng)用研究還較少。本研究基于巖心毛管壓力數(shù)據(jù),利用灰色關(guān)聯(lián)分析、主成分分析、因子分析和智能聚類等數(shù)據(jù)挖掘技術(shù),選取孔隙結(jié)構(gòu)敏感性參數(shù),解決數(shù)據(jù)之間的共線問題,利用智能聚類技術(shù)對孔隙結(jié)構(gòu)進行聚類分析,確定儲層孔隙結(jié)構(gòu)的分類;在借鑒卷積神經(jīng)網(wǎng)絡(luò)在圖像識別和音頻分析領(lǐng)域應(yīng)用方法的基礎(chǔ)上,將其用于儲層微觀孔隙結(jié)構(gòu)預(yù)測;提出了測井曲線單層卷積模型和雙層卷積模型,將常規(guī)測井數(shù)據(jù)模擬成圖像像素點作為網(wǎng)絡(luò)的輸入,以便更好地表達儲層特征。研究結(jié)果表明:卷積神經(jīng)網(wǎng)絡(luò)可用于儲層微觀孔隙結(jié)構(gòu)預(yù)測,且預(yù)測精度較高;同時雙層卷積神經(jīng)網(wǎng)絡(luò)不僅可以達到更好的預(yù)測效果,而且通過卷積運算可以提取更深層次、更抽象的儲層特征,為測井資料綜合解釋提供重要的支持。