韓 珊,車明光,2,蘇 旺,肖毓祥,吳忠寶,陳建陽(yáng),汪莉彬
(1.中國(guó)石油勘探開發(fā)研究院,北京 100083;2.中國(guó)科學(xué)技術(shù)大學(xué),安徽 合肥 230027)
近年來(lái),得益于理論的創(chuàng)新突破與技術(shù)的快速進(jìn)步,中國(guó)頁(yè)巖氣勘探開發(fā)取得了跨越式發(fā)展。為了準(zhǔn)確計(jì)算頁(yè)巖氣單井可采儲(chǔ)量,科學(xué)開展頁(yè)巖氣井產(chǎn)能規(guī)劃和投資決策,明確影響頁(yè)巖氣產(chǎn)量的主控因素及優(yōu)選適用于頁(yè)巖氣產(chǎn)量預(yù)測(cè)方法顯得尤為重要。頁(yè)巖氣藏資源潛力巨大[1],產(chǎn)能評(píng)價(jià)較為復(fù)雜。常規(guī)的頁(yè)巖氣產(chǎn)量預(yù)測(cè)方法主要為數(shù)值模擬方法和公式推導(dǎo)法,2種方法可對(duì)單井可采儲(chǔ)量(EUR)及日產(chǎn)量進(jìn)行預(yù)測(cè)。龐進(jìn)等[2]通過(guò)流態(tài)劃分得到不同地層流動(dòng)階段的預(yù)測(cè)產(chǎn)量,認(rèn)為復(fù)合線性流之后預(yù)測(cè)效果最好。劉傳斌等[3]利用數(shù)值模擬方法對(duì)SEPD模型、Duong模型和YM-SEPD模型進(jìn)行分析,認(rèn)為組合模型預(yù)測(cè)日產(chǎn)量精度更高。李海濤等[4]提出基于裂縫流主導(dǎo)的產(chǎn)量遞減預(yù)測(cè)新方法預(yù)測(cè)EUR。然而,前人對(duì)于頁(yè)巖氣單井首年累計(jì)產(chǎn)量的預(yù)測(cè)研究較少。
近年來(lái),機(jī)器學(xué)習(xí)方法已經(jīng)應(yīng)用于石油工業(yè)中的多個(gè)領(lǐng)域,并初步取得了良好效果。位云生等[5]、彭成勇等[6]利用機(jī)器學(xué)習(xí)方法開展了壓裂選井評(píng)層研究。孫東生等[7]、馬志國(guó)等[8]利用人工神經(jīng)網(wǎng)絡(luò)法對(duì)水力壓裂效果進(jìn)行了評(píng)價(jià)。嚴(yán)禛等[9]將機(jī)器學(xué)習(xí)方法應(yīng)用于油田產(chǎn)量預(yù)測(cè)工作中。機(jī)器學(xué)習(xí)方法可以實(shí)現(xiàn)在有限數(shù)據(jù)量的條件下對(duì)復(fù)雜問(wèn)題進(jìn)行建模、優(yōu)化及預(yù)測(cè)。
目前,四川盆地威遠(yuǎn)區(qū)塊頁(yè)巖氣勘探開發(fā)正處于大規(guī)模發(fā)展階段,其優(yōu)越的地質(zhì)條件為頁(yè)巖氣賦存與富集提供了良好的條件。以四川盆地威遠(yuǎn)區(qū)塊頁(yè)巖氣田為研究對(duì)象,基于132口投產(chǎn)1 a以上氣井的地質(zhì)與工程數(shù)據(jù)及動(dòng)態(tài)生產(chǎn)數(shù)據(jù),采用灰色關(guān)聯(lián)法研究影響產(chǎn)量的主控因素,在此基礎(chǔ)上使用支持向量機(jī)與BP神經(jīng)網(wǎng)絡(luò)方法預(yù)測(cè)該氣田單井首年累計(jì)產(chǎn)量及初期產(chǎn)量,并對(duì)上述方法進(jìn)行對(duì)比及應(yīng)用效果分析,進(jìn)而優(yōu)選出適用于頁(yè)巖氣產(chǎn)量預(yù)測(cè)的機(jī)器學(xué)習(xí)方法。對(duì)單井首年累計(jì)產(chǎn)量及初期產(chǎn)量進(jìn)行預(yù)測(cè),可為新開采井進(jìn)一步預(yù)測(cè)單井EUR工作提供更準(zhǔn)確的基礎(chǔ)數(shù)據(jù),進(jìn)而可有效地調(diào)整現(xiàn)場(chǎng)開發(fā)方案,對(duì)頁(yè)巖氣田的產(chǎn)能規(guī)劃和快速開發(fā)起到積極作用,對(duì)頁(yè)巖氣田的后續(xù)開發(fā)具有指導(dǎo)性意義。
支持向量機(jī)(Support Vector Machine,SVM)是機(jī)器學(xué)習(xí)方法中的一種,最早由數(shù)學(xué)家Vapnik提出。支持向量機(jī)可以實(shí)現(xiàn)分類和回歸2種功能,此次研究使用支持向量機(jī)回歸法(SVR)對(duì)頁(yè)巖氣井首年累計(jì)產(chǎn)量進(jìn)行預(yù)測(cè)。支持向量機(jī)在樣本數(shù)量較少的情況下能夠保證一定的預(yù)測(cè)精度,在壓裂效果預(yù)測(cè)及增油量預(yù)測(cè)中可發(fā)揮一定的優(yōu)勢(shì)[10]。對(duì)于線性問(wèn)題,首先使用線性回歸函數(shù),將給定樣本數(shù)據(jù)進(jìn)行擬合。
f(x)=wx+b
(1)
式中:w為斜率;b為截距;x為樣本數(shù)據(jù);f(x)為樣本數(shù)據(jù)的擬合函數(shù)。
式(2)為支持向量機(jī)回歸的目標(biāo)函數(shù),其可以提高模型的泛化能力,避免出現(xiàn)過(guò)度擬合的問(wèn)題。式(3)用于減少模型誤差[11]。
(2)
(3)
引入拉格朗日乘子以及對(duì)偶變量對(duì)模型進(jìn)行優(yōu)化,將式(2)、(3)轉(zhuǎn)化為式(4)、(5)。
(4)
(5)
由于該研究的氣井產(chǎn)量預(yù)測(cè)問(wèn)題為非線性問(wèn)題,需通過(guò)核函數(shù)將樣本數(shù)據(jù)映射到高維空間中進(jìn)行線性回歸。為此,引入RBF(Radial Basis Function)核函數(shù),通過(guò)調(diào)整RBF核函數(shù)參數(shù)以適用于所用樣本集[12]。
k(x,xp)=exp(-g‖x-xp‖2)
(6)
式中:k(x,xp)為核函數(shù);g為超參數(shù)。
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)為機(jī)器學(xué)習(xí)方法中應(yīng)用較為廣泛的方法,其可以處理大量的非線性數(shù)據(jù),通過(guò)模擬大腦神經(jīng)網(wǎng)絡(luò)處理信息的方式,將輸入的樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)處理、訓(xùn)練學(xué)習(xí)。在頁(yè)巖氣田單井首年累計(jì)產(chǎn)量預(yù)測(cè)工作中,BP神經(jīng)網(wǎng)絡(luò)法可僅通過(guò)輸入靜態(tài)數(shù)據(jù),得到誤差較小、精度較高的預(yù)測(cè)結(jié)果,適用于壓裂后產(chǎn)氣量預(yù)測(cè)工作[13]。BP神經(jīng)網(wǎng)絡(luò)主要為3層前饋網(wǎng)絡(luò),包括輸入層、隱含層及輸出層。該方法的核心是“誤差反向傳播”學(xué)習(xí)算法,即當(dāng)正向傳播中樣本輸出結(jié)果與預(yù)期不同時(shí),轉(zhuǎn)為反向傳播進(jìn)行學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程為2個(gè)傳播過(guò)程周期循環(huán)[14]。神經(jīng)元輸出值的計(jì)算公式為。
(7)
式中:h為連接神經(jīng)元的權(quán)重值;a為基礎(chǔ)值。
(8)
建立BP神經(jīng)網(wǎng)絡(luò)模型,并利用式(9)計(jì)算誤差E。當(dāng)誤差足夠小或達(dá)到迭代步數(shù)時(shí),停止該算法計(jì)算[15]。
(9)
(10)
式中:E為誤差;Ep為中間誤差;L為迭代步數(shù);di為期望輸出值;zi為實(shí)際輸出值。
四川盆地威遠(yuǎn)區(qū)塊頁(yè)巖氣田地質(zhì)條件優(yōu)越,資源豐富,儲(chǔ)層連續(xù)性好且相對(duì)穩(wěn)定,開發(fā)潛力大。以威遠(yuǎn)區(qū)塊132口投產(chǎn)1 a以上氣井的地質(zhì)、工程及生產(chǎn)數(shù)據(jù)作為樣本數(shù)據(jù),建立單井產(chǎn)氣量預(yù)測(cè)模型;采用該區(qū)塊投產(chǎn)首年氣井累計(jì)產(chǎn)量及初期產(chǎn)量為目標(biāo)屬性分別開展模型預(yù)測(cè)工作。
前期研究表明,影響頁(yè)巖氣產(chǎn)量的因素眾多,包括地質(zhì)、工程等多方面因素。通過(guò)系統(tǒng)梳理,統(tǒng)計(jì)了該氣田132口氣井的基礎(chǔ)數(shù)據(jù),包括水平井垂深的中值(m)、孔隙度(%)、總有機(jī)碳含量(%)、壓力系數(shù)、水平段長(zhǎng)度(m)、壓裂段長(zhǎng)度(m)、壓裂改造段數(shù)、平均簇間距(m)、壓裂液量(m3)、支撐劑量(m3)、石英砂用量(t)、平均砂比(%)、施工排量(m3/min)、平均段長(zhǎng)(m)、加砂強(qiáng)度(t/m)、用液強(qiáng)度(m3/段),共計(jì)16項(xiàng)參數(shù)。其中,壓裂液均為滑溜水,支撐劑均為70/140目石英砂和40/70目陶粒。上述影響因素之間存在著一定的相關(guān)性,單個(gè)因素的改變會(huì)對(duì)其他因素產(chǎn)生不同程度的正相關(guān)或負(fù)相關(guān)影響。因此,通過(guò)單因素?cái)M合分析來(lái)預(yù)測(cè)產(chǎn)氣量的方法并不準(zhǔn)確可靠,局限性較大。在預(yù)測(cè)產(chǎn)量時(shí),需要綜合考慮多因素的復(fù)雜情況,而機(jī)器學(xué)習(xí)方法能夠更好地將問(wèn)題簡(jiǎn)單化,從而快速準(zhǔn)確地預(yù)測(cè)目標(biāo)屬性。
為了明確影響頁(yè)巖氣單井產(chǎn)量的主控因素,采用灰色關(guān)聯(lián)法[16]對(duì)上述16個(gè)因素按影響氣井產(chǎn)量的強(qiáng)弱程度排序。灰色關(guān)聯(lián)評(píng)價(jià)方法的主要步驟如下。
(11)
(2) 對(duì)序列進(jìn)行無(wú)量綱化處理。使用初始值方法,將整個(gè)序列值除以序列中的第一個(gè)值,得到新的序列。
新形成的序列為:
(12)
式中:Xi=[X1(1),X2(2),X3(3),…,Xi(n)],i=0、1、2…m。
運(yùn)用式(12)對(duì)初始值進(jìn)行無(wú)量綱化:
(13)
式中:k*=1,2,…,n。
(3) 對(duì)序列進(jìn)行求差。將矩陣(12)中的第一列與其他各列求取對(duì)應(yīng)的絕對(duì)差列,形成絕對(duì)差值矩陣:
矩陣中的最大值(MAX)和最小值(MIN)即為最大差和最小差。
Δ0i(k*)=|x0(k*)-xi(k*)|
(14)
(15)
(4) 計(jì)算關(guān)聯(lián)系數(shù)。將矩陣(14)中的數(shù)據(jù)用式(16)進(jìn)行變換,得到如下矩陣。
(16)
式中:ξ0i(k*)為關(guān)聯(lián)系數(shù)。
分辨系數(shù)ρ在(0,1)內(nèi)取值,ρ值越小,表明各系數(shù)之間的差異越大。關(guān)聯(lián)系數(shù)ξ0i(k*)是不超過(guò)1的正數(shù),Δ0i(k*)值越小,ξ0i(k*)值越大。當(dāng)Δ0i(k*)=0時(shí),ξ0i(k*)=1,這說(shuō)明第i個(gè)比較序列Xi與參考序列X0在第k*期值相同。
(5) 關(guān)聯(lián)度計(jì)算。由于得出的每個(gè)關(guān)聯(lián)系數(shù)所反映的信息比較分散,將n個(gè)關(guān)聯(lián)系數(shù)取平均值即可得到關(guān)聯(lián)度,可以反映各因素對(duì)于因變量的影響程度。
(17)
式中:r0i為關(guān)聯(lián)度。
(6) 關(guān)聯(lián)度排序。對(duì)各比較序列與參考序列的關(guān)聯(lián)度進(jìn)行從大到小的排序,當(dāng)關(guān)聯(lián)度越大時(shí),說(shuō)明比較序列和參考序列的變化趨勢(shì)越趨于一致。通過(guò)關(guān)聯(lián)度可以判斷比較序列和參考序列的曲線相似度。當(dāng)2個(gè)序列曲線趨勢(shì)越接近時(shí),表示兩者關(guān)聯(lián)度越大;反之,則關(guān)聯(lián)度越小。
通過(guò)上述方法,得到關(guān)聯(lián)程度排序前8位的影響氣井產(chǎn)量的主控因素(表1),即支撐劑量、壓裂改造段數(shù)、水平井垂深的中值、壓裂段長(zhǎng)度、壓裂液量、孔隙度、壓力系數(shù)、加砂強(qiáng)度。
表1 影響氣井產(chǎn)量的各因素關(guān)聯(lián)度及權(quán)重大小Table 1 The correlation degree and weight of factors affecting gas well production
基于灰色關(guān)聯(lián)法分析所得出的影響產(chǎn)量的主控因素,設(shè)定Xi為目標(biāo)區(qū)塊氣井的特征向量。目標(biāo)屬性為預(yù)測(cè)氣井生產(chǎn)首年的累計(jì)產(chǎn)量。選取目標(biāo)區(qū)塊132口井基礎(chǔ)數(shù)據(jù)作為樣本數(shù)據(jù)集。抽取一定的樣本數(shù)據(jù)作為訓(xùn)練集,剩余樣本數(shù)據(jù)作為測(cè)試集。
為了評(píng)價(jià)模型的穩(wěn)定性及預(yù)測(cè)精度,采用線性回歸決定系數(shù)(R2)和均方誤差(mse)這2個(gè)評(píng)價(jià)指標(biāo)。線性回歸決定系數(shù)表示擬合優(yōu)度,能夠反映訓(xùn)練集擬合結(jié)果的好壞。
R2=SSR/SST=1-SSE/SST
(18)
SST=SSR+SSE
(19)
式中:SST為總平方和;SSR為回歸平方和;SSE為殘差平方和。
mse表示參數(shù)預(yù)測(cè)值與真實(shí)值之差平方的期望值,其值越小,越表明模型具有更好的精確度。
(20)
使用MATLAB軟件實(shí)現(xiàn)算法。首先導(dǎo)入樣本數(shù)據(jù)集,將訓(xùn)練集數(shù)量初始值設(shè)定為100,測(cè)試集數(shù)量為32,通過(guò)學(xué)習(xí)訓(xùn)練在樣本數(shù)據(jù)集中隨機(jī)產(chǎn)生訓(xùn)練集和測(cè)試集。創(chuàng)建支持向量機(jī)(SVM)預(yù)測(cè)模型,將SVM類型設(shè)置為e-SVR,其中,損失函數(shù)p值設(shè)為0.1,核函數(shù)類型設(shè)置為RBF核函數(shù)。
創(chuàng)建BP神經(jīng)網(wǎng)絡(luò)模型,將學(xué)習(xí)速率設(shè)定為0.1,訓(xùn)練的最大次數(shù)定為1 000,顯示中間結(jié)果周期設(shè)定為10,全局最小誤差定為0.000 1。
分別對(duì)上述2個(gè)模型的訓(xùn)練集進(jìn)行學(xué)習(xí)訓(xùn)練,模型訓(xùn)練結(jié)束后對(duì)測(cè)試集進(jìn)行驗(yàn)證,返回均方誤差和線性回歸決定系數(shù)2個(gè)評(píng)價(jià)參數(shù)值。不同的訓(xùn)練集數(shù)量會(huì)對(duì)模型預(yù)測(cè)精度產(chǎn)生一定的影響,因此,需要對(duì)訓(xùn)練集數(shù)量不斷調(diào)整,將訓(xùn)練集數(shù)量從100逐一遞增至122進(jìn)行模型訓(xùn)練,將返回的mse與R2值進(jìn)行統(tǒng)計(jì)分析比較,具體結(jié)果如圖1所示。
由圖1可知:支持向量機(jī)模型的大部分R2數(shù)據(jù)點(diǎn)在BP神經(jīng)網(wǎng)絡(luò)模型之上,表明支持向量機(jī)訓(xùn)練擬合程度要更高、更穩(wěn)定。在訓(xùn)練樣本數(shù)量為117時(shí),支持向量機(jī)模型的線性回歸決定系數(shù)達(dá)到最高點(diǎn),R2最大值為0.951;在訓(xùn)練樣本數(shù)量為113時(shí),BP神經(jīng)網(wǎng)絡(luò)模型的線性回歸決定系數(shù)達(dá)到最高點(diǎn),R2最大值為0.912。
圖1 不同訓(xùn)練樣本數(shù)量下的SVM與BP神經(jīng)網(wǎng)絡(luò) 預(yù)測(cè)模型的評(píng)價(jià)參數(shù)值Fig.1 The evaluation parameters of SVM and BP neural network prediction models with different number of training samples
從預(yù)測(cè)誤差來(lái)看,支持向量機(jī)模型的mse值基本處于較低的范圍內(nèi),對(duì)比而言,BP神經(jīng)網(wǎng)絡(luò)的mse值波動(dòng)幅度較大且數(shù)值較高。在訓(xùn)練樣本數(shù)量為121時(shí),支持向量機(jī)模型的mse值最低,mse最小值為0.003;在訓(xùn)練樣本數(shù)量為118時(shí),BP神經(jīng)網(wǎng)絡(luò)模型的mse值最低,mse最小值為0.007。
對(duì)比圖1中2個(gè)評(píng)價(jià)參數(shù)曲線可知,支持向量機(jī)模型的R2值基本在BP神經(jīng)網(wǎng)絡(luò)模型之上,而mse值相反,因此,支持向量機(jī)模型的穩(wěn)定性和精確度都要優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型。綜合考慮mse和R22個(gè)評(píng)價(jià)指標(biāo),選用mse值較小且R2值較大的模型為最優(yōu)模型。對(duì)于支持向量機(jī)模型來(lái)說(shuō),優(yōu)選出訓(xùn)練樣本數(shù)量為118,測(cè)試樣本數(shù)量為14,此時(shí)模型訓(xùn)練集擬合結(jié)果中R2為0.925,mse值為0.004;對(duì)于BP神經(jīng)網(wǎng)絡(luò)模型,優(yōu)選出訓(xùn)練樣本數(shù)量為121,測(cè)試樣本數(shù)量為11,此時(shí)模型訓(xùn)練集擬合結(jié)果中R2為0.892,mse值為0.009。
利用上述優(yōu)選的支持向量機(jī)模型,預(yù)測(cè)目標(biāo)區(qū)塊氣井首年累計(jì)產(chǎn)量,通過(guò)對(duì)比實(shí)際產(chǎn)量值,支持向量機(jī)預(yù)測(cè)模型的測(cè)試集擬合結(jié)果的R2為0.927,mse為0.005。根據(jù)SVM產(chǎn)量預(yù)測(cè)模型結(jié)果可知:在訓(xùn)練集中,預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)點(diǎn)基本重合,訓(xùn)練效果擬合較好(圖2);在測(cè)試集中,模型在預(yù)測(cè)產(chǎn)量上表現(xiàn)出較高的擬合精度,與實(shí)際產(chǎn)量趨勢(shì)線基本一致,數(shù)值也較為接近(圖3)。
圖2 SVM預(yù)測(cè)模型的訓(xùn)練集擬合結(jié)果Fig.2 The fitting results of training set of SVM prediction model
圖3 SVM預(yù)測(cè)模型的測(cè)試集中預(yù)測(cè)值與實(shí)際值對(duì)比 (mse=0.005,R2=0.927)Fig.3 The comparison between predicted and actual values in the test set of SVM prediction model (mse=0.005, R2=0.927)
利用上述優(yōu)選的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,預(yù)測(cè)目標(biāo)區(qū)塊氣井首年累計(jì)產(chǎn)量,通過(guò)對(duì)比實(shí)際產(chǎn)量值表明,BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的測(cè)試集擬合結(jié)果的R2為0.892,mse為0.009。根據(jù)BP神經(jīng)網(wǎng)絡(luò)產(chǎn)量預(yù)測(cè)模型返回的數(shù)據(jù)可以看出,在訓(xùn)練集中,實(shí)際產(chǎn)量與預(yù)測(cè)產(chǎn)量較為吻合,但存在一定的誤差(圖4);在測(cè)試集中,模型在預(yù)測(cè)產(chǎn)量時(shí)與真實(shí)值趨勢(shì)基本一致,數(shù)值較為接近(圖5)。
圖4 BP預(yù)測(cè)模型的訓(xùn)練集擬合結(jié)果Fig.4 The fitting results of training set of BP prediction model
圖5 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的測(cè)試集中預(yù)測(cè)值與實(shí)際值 對(duì)比(mse=0.009,R2=0.892)Fig.5 The comparison between predicted and actual values in test set of BP neural network prediction model (mse=0.009, R2=0.892)
根據(jù)研究區(qū)的單井實(shí)際資料,由經(jīng)驗(yàn)法擬合的氣井首年平均日產(chǎn)量與測(cè)試產(chǎn)量的相關(guān)系數(shù)為0.746,產(chǎn)量預(yù)測(cè)模型公式如式(23)所示,擬合曲線如圖6所示。
圖6 研究區(qū)氣井首年平均日產(chǎn)量與測(cè)試產(chǎn)量關(guān)系Fig.6 The relationship between average daily production and test production of gas wells in study area in the first year
Y=0.4499Xa
(21)
式中:Y為首年平均日產(chǎn)量,104m3/d;Xa為測(cè)試日產(chǎn)量,104m3/d。
由式(23)可預(yù)測(cè)研究區(qū)單井首年累計(jì)產(chǎn)量,將其與實(shí)際首年累計(jì)產(chǎn)量數(shù)據(jù)進(jìn)行可視化對(duì)比處理(圖7)。圖7可知,由經(jīng)驗(yàn)公式所預(yù)測(cè)的首年累計(jì)產(chǎn)量與實(shí)際產(chǎn)量之間存在一定偏差,R2為0.805,mse為0.025。
圖7 經(jīng)驗(yàn)擬合法實(shí)際值與預(yù)測(cè)結(jié)果對(duì)比 (mse=0.025,R2=0.805)Fig.7 The comparison between the actual value of empirical fitting method and the predicted result (mse=0.025, R2=0.805)
通過(guò)上述3個(gè)模型的預(yù)測(cè)結(jié)果對(duì)比分析表明(表2),SVM模型的預(yù)測(cè)結(jié)果與實(shí)際累計(jì)產(chǎn)量的趨勢(shì)基本一致,均方誤差結(jié)果最小,線性回歸決定系數(shù)最大,比BP神經(jīng)網(wǎng)絡(luò)模型和傳統(tǒng)經(jīng)驗(yàn)公式法預(yù)測(cè)得更為準(zhǔn)確。采用經(jīng)驗(yàn)公式求得的首年累計(jì)產(chǎn)量預(yù)測(cè)值的均方誤差較大,線性回歸決定系數(shù)較小,較上述2個(gè)機(jī)器學(xué)習(xí)模型來(lái)說(shuō)預(yù)測(cè)精度較低。總體來(lái)看,SVM模型對(duì)于研究區(qū)首年氣井累計(jì)產(chǎn)量的預(yù)測(cè)效果較好,精度較高。
表2 SVM、BP神經(jīng)網(wǎng)絡(luò)及經(jīng)驗(yàn)公式預(yù)測(cè)結(jié)果指標(biāo)對(duì)比Table 2 The comparison of prediction result indicators of SVM, BP neural network and empirical formula
利用支持向量機(jī)模型預(yù)測(cè)研究區(qū)氣井初期產(chǎn)量(前期產(chǎn)量穩(wěn)定后30 d平均日產(chǎn)量),通過(guò)對(duì)比實(shí)際產(chǎn)量值,支持向量機(jī)預(yù)測(cè)模型的測(cè)試集擬合結(jié)果的R2為0.883,mse為0.010。根據(jù)SVM產(chǎn)量預(yù)測(cè)模型結(jié)果可知,在訓(xùn)練集中,預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)點(diǎn)基本重合,訓(xùn)練效果擬合較好(圖8);在測(cè)試集中,模型在預(yù)測(cè)產(chǎn)量上表現(xiàn)出較高的擬合精度,與實(shí)際初期產(chǎn)量趨勢(shì)線基本一致,數(shù)值也較為接近(圖9)。
圖8 SVM預(yù)測(cè)模型的訓(xùn)練集擬合結(jié)果Fig.8 The fitting results of training set of SVM prediction model
圖9 SVM預(yù)測(cè)模型的測(cè)試集中預(yù)測(cè)值與實(shí)際值對(duì)比 (mse=0.012,R2=0.863)Fig.9 The comparison between predicted and actual values in the test set of SVM prediction model (mse=0.012, R2=0.863)
利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型預(yù)測(cè)研究區(qū)氣井初期產(chǎn)量,通過(guò)對(duì)比實(shí)際產(chǎn)量值得到,BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的測(cè)試集擬合結(jié)果的R2為0.863,mse為0.012。根據(jù)BP神經(jīng)網(wǎng)絡(luò)產(chǎn)量預(yù)測(cè)模型上返回的數(shù)據(jù)可以看出,在訓(xùn)練集中,實(shí)際產(chǎn)量與預(yù)測(cè)產(chǎn)量較為吻合,但有一定的誤差存在(圖10);在測(cè)試集中,模型在預(yù)測(cè)產(chǎn)量時(shí)與真實(shí)值趨勢(shì)基本一致,數(shù)值較為接近(圖11)。
圖10 BP預(yù)測(cè)模型的訓(xùn)練集擬合結(jié)果Fig.10 The fitting results of training set of BP prediction model
圖11 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的測(cè)試集中預(yù)測(cè)值與實(shí)際值 對(duì)比(mse=0.140,R2=0.900)Fig.11 The comparison between predicted and actual values in test set of BP neural network prediction model (mse=0.140, R2=0.900)
通過(guò)上述2個(gè)模型的預(yù)測(cè)結(jié)果對(duì)比分析結(jié)果可以看出(表3),SVM模型的預(yù)測(cè)結(jié)果與實(shí)際初期產(chǎn)量的趨勢(shì)基本一致,均方誤差結(jié)果最小,線性回歸決定系數(shù)最大,其預(yù)測(cè)結(jié)果較BP神經(jīng)網(wǎng)絡(luò)模型和傳統(tǒng)經(jīng)驗(yàn)公式法預(yù)測(cè)得更為準(zhǔn)確??傮w來(lái)看,SVM模型對(duì)于研究區(qū)初期產(chǎn)量的預(yù)測(cè)效果較好,精度較高。
表3 SVM、BP神經(jīng)網(wǎng)絡(luò)及經(jīng)驗(yàn)公式預(yù)測(cè)結(jié)果指標(biāo)對(duì)比Table 3 The comparison of prediction result indicators of SVM, BP neural network and empirical formula
利用支持向量機(jī)模型預(yù)測(cè)目標(biāo)區(qū)塊氣井采出程度,通過(guò)對(duì)比遞減法計(jì)算的采出程度,支持向量機(jī)預(yù)測(cè)模型預(yù)測(cè)的平均誤差為4.14%(表4)。根據(jù)SVM采出程度預(yù)測(cè)結(jié)果,與遞減法計(jì)算的采出程度基本一致。
表4 遞減法計(jì)算及SVM預(yù)測(cè)采出程度結(jié)果指標(biāo)對(duì)比Table 4 Comparison of results and indicators of the recursive calculation and SVM prediction of recovery percent
(1) 采用灰色關(guān)聯(lián)法,考慮了地質(zhì)因素、工程因素及生產(chǎn)數(shù)據(jù),影響產(chǎn)量的主控因素為水平井垂深的中值、孔隙度、壓力系數(shù)、壓裂段長(zhǎng)度、壓裂改造段數(shù)等因素。應(yīng)用SVM和BP神經(jīng)網(wǎng)絡(luò)法建立了產(chǎn)量預(yù)測(cè)模型,SVM模型更適用于研究區(qū)。
(2) SVM實(shí)現(xiàn)了基于數(shù)據(jù)分析方法的頁(yè)巖氣井首年累計(jì)產(chǎn)量及初期產(chǎn)量的準(zhǔn)確預(yù)測(cè)。與BP神經(jīng)網(wǎng)絡(luò)、傳統(tǒng)經(jīng)驗(yàn)公式預(yù)測(cè)方法相比,SVM顯示出了良好的預(yù)測(cè)能力和較小的誤差,能夠快速分析并準(zhǔn)確預(yù)測(cè)氣井的首年累計(jì)產(chǎn)量。與傳統(tǒng)數(shù)值模擬軟件相比,SVM模型不需要建立物理模型,基于有限的靜態(tài)數(shù)據(jù),就能夠快速得到精度較高的產(chǎn)量預(yù)測(cè)結(jié)果。SVM模型可以進(jìn)一步對(duì)壓裂參數(shù)進(jìn)行優(yōu)化設(shè)計(jì),為后期評(píng)價(jià)氣井遞減規(guī)律、計(jì)算氣井單井可采儲(chǔ)量提供可靠的數(shù)據(jù),對(duì)其他頁(yè)巖氣區(qū)塊的開發(fā)和產(chǎn)能評(píng)價(jià)也有著重要的借鑒指導(dǎo)意義。