陳現(xiàn)軍 劉 洪 王碩亮 趙朝文 周 璟
(1.西南石油大學(xué)石油工程學(xué)院, 成都 610500; 2.中法渤海地質(zhì)服務(wù)有限公司, 天津 300452;3.重慶科技學(xué)院科研處, 重慶 401331; 4.中國(guó)地質(zhì)大學(xué), 北京 100083; 5.中國(guó)石油西南油氣田分公司, 重慶 400021)
油田產(chǎn)量變化受地質(zhì)因素、流體性質(zhì)、開(kāi)采方式、井網(wǎng)形式、增產(chǎn)措施和管理水平等諸多因素控制,既有確定性又有隨機(jī)性。目前,油田產(chǎn)量預(yù)測(cè)方法有經(jīng)驗(yàn)統(tǒng)計(jì)法和數(shù)值模擬法。實(shí)踐證明,這2種方法對(duì)油田開(kāi)發(fā)過(guò)程中的時(shí)變性和各種隨機(jī)干擾因素具有較大的不適應(yīng)性[1]。因此,本文探索一種將油田產(chǎn)量的歷史數(shù)據(jù)看成是時(shí)間序列,并利用時(shí)間序列分析法對(duì)油田產(chǎn)量進(jìn)行建模及預(yù)測(cè)的方法,實(shí)踐證明,該方法能夠獲得較高的預(yù)測(cè)精度。
目前利用時(shí)間序列方法預(yù)測(cè)油田開(kāi)發(fā)數(shù)據(jù)的研究較少,普遍采用的方法是利用單一變量時(shí)間序列構(gòu)造預(yù)測(cè)模型。油田實(shí)際生產(chǎn)過(guò)程中,壓力與產(chǎn)量有著密切的關(guān)系,僅利用單一變量時(shí)間序列模型,無(wú)法反映壓力與產(chǎn)量之間的關(guān)系。
本文首次將多變量時(shí)間序列與支持向量機(jī)方法相結(jié)合,充分挖掘油田產(chǎn)量和壓力之間的關(guān)系,構(gòu)建了一種新型的油田開(kāi)發(fā)數(shù)據(jù)預(yù)測(cè)模型。
對(duì)于一個(gè)復(fù)雜系統(tǒng),由于實(shí)測(cè)時(shí)序是一維的,不能完整地反映系統(tǒng)隨時(shí)間的演化過(guò)程和系統(tǒng)內(nèi)在的本質(zhì)特征。為了能夠從時(shí)序中得到系統(tǒng)的幾何結(jié)構(gòu),Packand等人采用時(shí)間延滯技術(shù),把一維時(shí)間序列嵌入m維空間中:
X(t)=(x(t),x(t+τ),x(t+2τ),…,x(t+(m-1)τ))T
(1)
式中:X(t) —t時(shí)刻系統(tǒng)的狀態(tài);m— 嵌入空間中點(diǎn)集的維數(shù)。
Vn=(x1,n,x1,n-τ1,…,x1,n-(m1-1)τ1;x2,n,x2,n-τ2,…,x2,n-(m21-1)τ2,…,xM,n,xM,n-τM,…,x1,M-(mM-1)τM)T
(2)
根據(jù)Takens定理,當(dāng)系統(tǒng)嵌入維數(shù)m或mi足夠大(m=m1+m2+…+mM>2D,D為吸引子維數(shù))時(shí),則存在確定性映射F:Rm→Rm使:V(n+1)=F(Vn)或者得到某一函數(shù)滿足:Xi,n+1=fi(Vn),(i=1,2,3,…,M)。此時(shí),狀態(tài)空間Vn→Vn+1的演化反映了原未知系統(tǒng)的演化,這意味著原系統(tǒng)吸引的幾何特征等價(jià)于重構(gòu)的m維狀態(tài)空間中吸引的幾何特征。因此,原系統(tǒng)中任何微分或拓?fù)洳蛔兞靠梢栽谥貥?gòu)的狀態(tài)空間中計(jì)算。
本文構(gòu)建的m維空間包括地層壓力、月產(chǎn)油量和月產(chǎn)水量,這3個(gè)指標(biāo)是油田開(kāi)發(fā)的基本指標(biāo),可以全面反映油田開(kāi)發(fā)系統(tǒng)的實(shí)際狀況。且3個(gè)指標(biāo)間既相互關(guān)聯(lián)又相互影響,本文采用多變量時(shí)間序列的預(yù)測(cè)方法,較單變量時(shí)間序列預(yù)測(cè)結(jié)果更為合理準(zhǔn)確。
1.2.1 延遲時(shí)間的求取
已知時(shí)間序列
X={xi|i=1,2,…,N}
將{xi}歸一化,即
(3)
計(jì)算概率P(xi):
(4)
經(jīng)過(guò)延遲后形成序列Y={yj|j=1,2,…,N-τ}={xj+τ|j=1,2,…,N-τ}
利用式(4)計(jì)算聯(lián)合概率P(xi,yi):
(5)
對(duì)于不同的延遲參數(shù)τ,計(jì)算互信息I(τ):
(τ) =H(X)+H(Y)-H(X,Y)
繪制τ-|(τ)曲線,將曲線第一次降到極小值時(shí),對(duì)應(yīng)的延遲時(shí)間τmin即為最佳延遲時(shí)間。
1.2.2 嵌入維數(shù)的選取
研究者提出了一種利用偽近鄰法確定最佳嵌入維數(shù)的方法。假設(shè)已有時(shí)間序列X={xi|i=1,2,…,N},則在d維相空間中重構(gòu)的時(shí)間延遲向量為{yi(d)}:
yi(d)=(xi,xi+τ,…,xi+(d-1)r)
i=1,2,…,N-(d-1)
式中:d— 嵌入維數(shù);τ— 延遲時(shí)間;yi(d) —d維嵌入空間中的第i個(gè)重構(gòu)向量。
定義:
(6)
i=1,2,…,N-dτ
式中:yi(d+1) —d+1維嵌入空間中的第i個(gè)重構(gòu)向量,即:
設(shè)a(i,d)的均值為
(7)
為了考察a(i,d)從d維重構(gòu)相空間到d+1維重構(gòu)相空間的變化情況,定義如下變量:
(8)
分析表明,如果時(shí)間序列產(chǎn)生于某個(gè)吸引子,則當(dāng)嵌入維數(shù)d大于某值do時(shí),E1(d)將停止變化,則可將do+1作為最佳嵌入維數(shù)。
為了更有效的進(jìn)行預(yù)測(cè)模型建模,首先對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,去除一些明顯異常的點(diǎn),然后對(duì)時(shí)間序列進(jìn)行相空間重構(gòu),將一維的時(shí)間序列轉(zhuǎn)化為矩陣形式,獲得數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,以挖掘到盡可能多的信息量。給定恰當(dāng)?shù)那度刖S數(shù)m后,經(jīng)過(guò)變換,得到用于支持向量機(jī)預(yù)測(cè)的學(xué)習(xí)樣本:
(9)
確定了支持向量機(jī)預(yù)測(cè)器的拓?fù)浣Y(jié)構(gòu),利用支持向量機(jī)對(duì)學(xué)習(xí)樣本進(jìn)行訓(xùn)練,回歸函數(shù)為:
(10)
式中:t=m+1,…,ntr。
則預(yù)測(cè)模型為:
(11)
得到預(yù)測(cè)模型為:
(12)
選取渤海油田某生產(chǎn)時(shí)間較長(zhǎng)的生產(chǎn)井的月產(chǎn)油量、含水率、井底流壓等數(shù)據(jù),檢驗(yàn)本文提出方法的準(zhǔn)確性。選取原始數(shù)據(jù)的前90%的數(shù)據(jù)點(diǎn)作為學(xué)習(xí)樣本,后10%的數(shù)據(jù)點(diǎn)作為檢測(cè)樣本。
(1)數(shù)據(jù)的預(yù)處理
在將實(shí)際數(shù)據(jù)輸入時(shí)間序列模型之前,必須對(duì)其進(jìn)行預(yù)處理,數(shù)據(jù)的預(yù)處理主要針對(duì)兩種情況,一是異常數(shù)據(jù)點(diǎn);二是關(guān)井情況。
對(duì)于異常數(shù)據(jù)點(diǎn),需要手動(dòng)將其刪除,然后根據(jù)前后數(shù)據(jù),對(duì)異常數(shù)據(jù)點(diǎn)對(duì)應(yīng)的時(shí)間進(jìn)行線性插值;對(duì)于關(guān)井情況,首先將關(guān)井的時(shí)間段內(nèi)的數(shù)據(jù)刪除,然后依據(jù)前后時(shí)間點(diǎn)的數(shù)據(jù)進(jìn)行線性插值。
經(jīng)過(guò)這樣處理后的原始數(shù)據(jù)更加光滑,同時(shí)排除了人為因素的干擾,使預(yù)測(cè)模型得到更好的擬合精度與預(yù)測(cè)精度。
(2)相空間重構(gòu)
選取月產(chǎn)油量、含水率、地層壓力3個(gè)變量作為多變量時(shí)間序列預(yù)測(cè)的因變量。根據(jù)文中所述的參數(shù)選取方法,計(jì)算所得的延遲時(shí)間為3,嵌入維數(shù)為3。并進(jìn)行三維變量的相空間重構(gòu)。
(3)預(yù)測(cè)結(jié)果
分別用單變量時(shí)間序列法和多變量時(shí)間序列法對(duì)這口井的月產(chǎn)油量、含水率和地層壓力進(jìn)行了預(yù)測(cè),預(yù)測(cè)結(jié)果分別如圖1 — 圖3所示。
圖1 月產(chǎn)油量預(yù)測(cè)結(jié)果圖
圖2 含水率預(yù)測(cè)結(jié)果圖
圖3 地層壓力預(yù)測(cè)結(jié)果圖
多變量時(shí)間序列由于綜合考慮了壓力、產(chǎn)油量、產(chǎn)水量之間的相互關(guān)系,在長(zhǎng)期變化趨勢(shì)的預(yù)測(cè)方面要優(yōu)于單變量時(shí)間序列預(yù)測(cè)方法。
統(tǒng)計(jì)預(yù)測(cè)5個(gè)時(shí)間步的預(yù)測(cè)結(jié)果,如表1所示。
表1 月產(chǎn)油量預(yù)測(cè)結(jié)果統(tǒng)計(jì)表
表2 含水率預(yù)測(cè)結(jié)果統(tǒng)計(jì)表
表3 壓力預(yù)測(cè)結(jié)果統(tǒng)計(jì)表
從近5個(gè)時(shí)間點(diǎn)的預(yù)測(cè)結(jié)果看,用單變量時(shí)間序列方法和多變量時(shí)間序列方法對(duì)地層壓力的預(yù)測(cè)準(zhǔn)確性都較高,對(duì)月產(chǎn)油量的預(yù)測(cè)精度普遍偏低??傮w來(lái)看,多變量時(shí)間序列預(yù)測(cè)結(jié)果好于單變量時(shí)間序列預(yù)測(cè)結(jié)果。
針對(duì)目前利用時(shí)間序列預(yù)測(cè)油田開(kāi)發(fā)數(shù)據(jù)時(shí)存在的不足,提出利用多變量相空間重構(gòu)技術(shù)預(yù)測(cè)油田開(kāi)發(fā)數(shù)據(jù)的新方法。該方法克服了以往方法只單純考慮單指標(biāo)的變化規(guī)律,而未綜合考慮系統(tǒng)內(nèi)各指標(biāo)相互影響的不足。經(jīng)過(guò)實(shí)際計(jì)算驗(yàn)證,該方法無(wú)論從長(zhǎng)期的變化趨勢(shì)還是短期的精度預(yù)測(cè),都優(yōu)于單變量時(shí)間序列方法。
[1] 任寶生,趙明,劉志斌,等.油田開(kāi)發(fā)動(dòng)態(tài)指標(biāo)的支持向量機(jī)預(yù)測(cè)[J].石油規(guī)劃設(shè)計(jì),2008,19(6):12-15.
[2] Michael Small.Applied Nonlinear Time Series Analysis:Applications in Physics, Physiology and Finance[J].World Scientific Series on Nonlinear Science Series A,2005,52:149-176.
[3] 鐘儀華,杜志敏.特高含水油田開(kāi)發(fā)規(guī)劃動(dòng)態(tài)預(yù)測(cè)方法研究[D].成都:西南石油大學(xué),2008.
[4] 李小剛,楊兆中,伍曉妮,等.油井水力壓裂后產(chǎn)量變化的混沌特征分析[J].斷塊油氣田,2009(01):63-65.