周雪 張珊珊 李祿勝 李玉蓉 柳偉明 趙曉亮 董鵬
1. 延長油田股份有限公司志丹采油廠;2. 中國石油大學(北京)油氣資源與探測國家重點實驗室
實際油藏非均質性強,油藏產能主控因素較難確定,因此也造成優(yōu)勢儲層難以判別[1]。目前,對于優(yōu)勢儲層的評價需要基于地震資料及測井資料等的深入研究[2-4],以及基于儲層巖心實驗[5],難以推廣到預測整個油藏中優(yōu)勢儲層的平面分布[6],且不能兼顧井的實際生產情況,導致預測精度較低。
隨著算法以及算力的提升,應用機器學習自動進行優(yōu)勢儲層判別成為可能。目前,主要以有監(jiān)督的機器學習算法來進行自動優(yōu)勢儲層判別。該方法使用地震數據、測井數據、巖性數據等,通過人工識別出優(yōu)勢儲層數據作為樣本來訓練機器學習模型[1,7-9]。
然而,該方法首先需要人工為數據集標定標簽,提高了應用門檻。此外,這些方法一般基于單井剖面進行優(yōu)勢儲層評價,無法確定全區(qū)的優(yōu)勢儲層分布。因此,筆者提出一種基于單分類支持向量機(OCSVM)[10]的全區(qū)儲層評價方法,該方法所使用的數據為三維地質模型數據體。由于單分類支持向量機屬于無監(jiān)督算法,在實際訓練過程中,無需專業(yè)人員對地震、測井等數據進行優(yōu)勢儲層的標簽標定,僅需人為指定出高產井,并使用該井井周的三維地質模型數據作為訓練樣本。模型訓練完成后,即可在全區(qū)范圍內檢測高產區(qū)域,為后續(xù)井位部署及調整、油藏開發(fā)方案設計提供明確的參考標準。
在實際油田開發(fā)過程中,高產井數量較少,如何利用高產井所處的地質信息來尋找出油藏中類似的區(qū)域分布對布井及開發(fā)有重要現實意義。該問題可看作只有一類樣本的新穎性檢測問題。將高產井近井地質信息作為正樣本,通過檢測油藏中是否有類似特點的儲層以獲得較高的產量。本文使用單類支持向量機對儲層的地質信息進行檢測,以獲得可能為高產區(qū)的優(yōu)質區(qū)域平面分布來確定優(yōu)勢儲層。OCSVM是一種無監(jiān)督算法[11],已廣泛用于異常檢測及入侵檢測領域[12-14]。它學習一個決策函數來進行新穎性檢測,將新數據分類為與訓練集相似或不同的數據。該算法尋找一個超平面使得正例盡可能遠離原點,預測則是用這個超平面做決策,該超平面被稱為決策邊界。若樣本落在決策邊界正方向,即認為是正樣本,反之為負樣本,如圖1。
圖1 OCSVM分類問題Fig. 1 Classification of OCSVM
OCSVM的目標函數為
為求解該問題,首先引入拉格朗日函數
式中,xi為樣本數據;v為平衡參數,是一待優(yōu)化超參數;ξi為松弛變量,用于控制模型的擬合程度,其值越大,模型越傾向于欠擬合;Ns為樣本個數; Φ為向特征空間映射的函數;w和 ρ分別為特征空間超平面法向量和偏移量;α ,β為拉格朗日因子。
Φ(x)可 以使用核函數K(xi1,xi2)計算內積
令Lp對w,ξ,ρ的偏導分別為0并代入式 (1),并將Φ(x)的內積寫為核函數形式,可對原問題的對偶形式化簡為
求得α,即可確定OCSVM模型。
由此,可通過決策函數判斷樣本是否屬于正例,如式(5),
若f(x)>0,則表示該樣本落在決策邊界正方向,判定為正例,反之為負例。可以看出,決策函數值表征了樣本在投影空間到原點的距離,其值越大,表明該樣本越接近正例樣本。
本文中,所使用的核函數為高斯核函數,如式(6)。
式中,σ為徑向基半徑,其值大小表示樣本對其他樣本的影響程度,為待優(yōu)化超參數。
假設某區(qū)塊有生產井Ns口,該區(qū)小層數Nl層,地質屬性特征Nf個,則樣本集可表示為
在輸入OCSVM模型之前,對樣本集數據進行歸一化
其中
最后,在特征維度按層對樣本張量進行拼接后獲得二維輸入數據
式中,上標i表示第i口井,上標j表示第j個地質屬性,下標k表示第k小層。
對于式(4)的優(yōu)化問題,同時求解出所有 α是較為困難的,因此,Platt提出了序列最小優(yōu)化算法SMO算法[15]來高效求解式(4)。SMO算法采用了一種啟發(fā)式的方法,其基本思想是每次選出兩個α進行優(yōu)化并固定其他的 α值。重復此過程,直到達到終止條件即可得到優(yōu)化結果。
為了評價模型質量并優(yōu)選模型,構建了決策函數值與產量的相關性系數作為評價指標,如式(10)所示。
式中,f(xi) 為 樣本i的決策函數值,(xi)為樣本決策函數值的均值,QCi為樣本i的累積產量,QˉCi為樣本平均累積產量。
Cor越接近1,表示決策函數值與累積產量越正相關,這表明隨著累積產量的增加,決策函數值將相應地增加,其相關性越強,所訓練的模型越能更好地將正樣本分離;Cor越接近?1,表示決策函數值與累積產量越負相關,表明模型學習到了錯誤的特征,無法使得正樣本遠離投影空間原點;Cor越接近0,表示決策函數值與累積產量越無關。為確定最優(yōu)模型,可使用相關性系數Cor作為評價指標,對模型超參數,如徑向基半徑和平衡參數進行優(yōu)化。通過調整超參數,獲得使相關性系數Cor最大的模型作為最優(yōu)模型,進而對全區(qū)地質特征樣本的決策函數進行計算來確定優(yōu)勢儲層區(qū)位,圖2為本文中優(yōu)勢儲層評價流程。
圖2 基于單分類支持向量機的優(yōu)勢儲層評價流程Fig. 2 Favorable reservoir evaluation process based on OCSVM
一非均質黑油油藏數值模型如圖3所示,模型網格維度為26×26×5。生產井受平面非均質性和縱向非均質性的影響。
圖3 案例數值模型Fig. 3 Numerical model of the case
本文選區(qū)的地質屬性特征為滲透率對數、飽和度和孔隙度,即Nf=3。小層數為5,即Nl=5。每小層的屬性如圖4所示。生產井20年累積產量如圖5所示,可以看出PR1、PR9、PR7產量顯著較低,因此將其從樣本集中剔除。使用其余井的數據對模型進行訓練,即Ns=6。從圖5中井周地質特征可以看出,對于非均質儲層,僅通過對比地質特征平均值不能有效地篩選出高產區(qū)域,應當結合地質屬性的分布特征進行綜合判斷?;趩畏诸愔С窒蛄繖C的優(yōu)勢儲層評價方法,可以對地質屬性的分布特征進行有效利用,提高了優(yōu)勢儲層判別準確度及速度。
圖4 案例數值模型小層地質屬性平面分布圖Fig. 4 Distribution plane of subzone geological attributes in the numerical model of the case
圖5 生產井累積產量及近井地質特征分布柱狀圖Fig. 5 Cumulative production of production well and distribution column of geological characteristics near the well
為了確定最優(yōu)OCSVM模型以對全區(qū)儲層進行評價,使用相關性系數Cor作為OCSVM模型得分指標,對模型超參數徑向基半徑和平衡參數進行優(yōu)化。由圖6可以看出,最優(yōu)徑向基半徑為0.01,最優(yōu)平衡參數為0.1?;谧顑?yōu)OCSVM模型,使用式(5)計算樣本的決策函數值后,繪制其與產量的散點圖,如圖7所示,使用式(10)計算其相關性為0.9764,說明決策函數通過地質信息可以較好地反映產量大小。
圖6 OCSVM模型超參數優(yōu)化結果Fig. 6 Optimization result of super parameters of OCSVM model
圖7 累產量與決策函數關系圖Fig. 7 Relationship between cumulative production and decision function
基于訓練好的OCSVM模型對整個儲層進行評價,將平面上每個網格作為一個樣本,因此,該模型一共可產生26×26=676個樣本。為每個樣本計算決策函數值,并繪制等高線,如圖8所示。
圖8 決策函數等高線Fig. 8 Contour of decision function
為了進一步測試模型的可靠性,沿模型的對角線選取3個典型樣本進行日產量對比,如圖9所示,可以看出在決策函數等高線較大的位置,井的產量也較高。表1總結了井點處樣本和測試樣本的決策函數值。
圖9 測試樣本日產量圖Fig. 9 Daily production of test samples
表1 樣本的決策函數值Table 1 Decision function value of samples
(1)基于高產井的井周地質特征,采用單類支持向量機模型對其學習并使用決策函數來評價全區(qū)的地質模型數據,獲得優(yōu)勢儲層平面展布圖。結果表明,展布圖與產量有著明顯的相關性,證明該評價方法的有效性。
(2)建立了基于單類支持向量機模型的優(yōu)勢儲層評價方法,該方法由于無需人為給定標簽,使得該方法兼顧了易用性與準確性,為確定全區(qū)高產區(qū)域分布提供了有力工具。