国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于注意力機(jī)制的CNN-GRU 煤層氣產(chǎn)能預(yù)測(cè)方法研究

2023-12-29 08:25趙海峰諸立凱劉長(zhǎng)松張先凡
煤礦安全 2023年12期
關(guān)鍵詞:液面氣量煤層氣

趙海峰 ,諸立凱 ,劉長(zhǎng)松 ,張先凡

(中國(guó)石油大學(xué)(北京) 石油工程學(xué)院,北京 102249)

煤層氣生產(chǎn)數(shù)據(jù)包含煤層氣井的生產(chǎn)特征動(dòng)態(tài)變化規(guī)律,通過對(duì)這些規(guī)律的研究,可以從煤層氣井歷史生產(chǎn)里得到新的認(rèn)識(shí),這對(duì)將來煤層氣井的指導(dǎo)生產(chǎn)具有重要意義[1-3]。煤層氣數(shù)據(jù)量繁多復(fù)雜,其中包含許多類型,具有多種數(shù)據(jù)維度,再加上原始數(shù)據(jù)均來自排采現(xiàn)場(chǎng),難免會(huì)出現(xiàn)數(shù)據(jù)丟失和不相關(guān)的數(shù)據(jù),這意味著生產(chǎn)數(shù)據(jù)的處理及挖掘數(shù)據(jù)間的關(guān)聯(lián)性至關(guān)重要[4]。目前,大多數(shù)學(xué)者在研究煤層氣產(chǎn)量主控因素問題上,都傾向于對(duì)地質(zhì)因素進(jìn)行分析;運(yùn)用滲流理論和吸附解吸理論等方面的知識(shí)來開展數(shù)值模擬研究[5-7]。然而,這種方法往往只適合理論研究,難以應(yīng)用到實(shí)際現(xiàn)場(chǎng)。許多學(xué)者提出了人工智能神經(jīng)網(wǎng)絡(luò)算法模型來進(jìn)行處理[8-12],取得不錯(cuò)效果,為神經(jīng)網(wǎng)絡(luò)在煤層氣產(chǎn)能預(yù)測(cè)領(lǐng)域的后續(xù)發(fā)展提供借鑒。由于煤層氣產(chǎn)能變化具有時(shí)序性,排采參數(shù)間存在一定特征性,歷史序列過長(zhǎng)時(shí)模型訓(xùn)練過程中容易丟失關(guān)鍵歷史信息。為解決這一問題,以韓城區(qū)塊的煤層氣井?dāng)?shù)據(jù)作為依托,通過隨機(jī)森林特征重要性方法對(duì)排采參數(shù)與日產(chǎn)氣間的重要性進(jìn)行分析;在此基礎(chǔ)上建立一種基于Attention 機(jī)制的卷積門控循環(huán)單元網(wǎng)絡(luò)組合模型CNN-GRUA,利用CNN 模型所具備的局部特性感知能力來提取輸入數(shù)據(jù)間的高層特征;GRU 模型按照時(shí)序順序接收由CNN 模型處理后的數(shù)據(jù)特征的時(shí)間信息,加入 Attention 機(jī)制給予輸入特征不同的概率權(quán)重,提高關(guān)鍵信息對(duì)煤層氣產(chǎn)能的影響,實(shí)現(xiàn)對(duì)煤層氣產(chǎn)氣量的預(yù)測(cè)。

1 算法原理與模型

1.1 卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)包含卷積層和池化層[13]。卷積層負(fù)責(zé)提取輸入序列參數(shù)特征傳入池化層,再通過全連接層得到最終結(jié)果。在時(shí)間序列問題的研究上,常采用一維結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1。

1.2 GRU 原理結(jié)構(gòu)

LSTM 用于分析時(shí)間序列數(shù)據(jù),解決了RNN處理長(zhǎng)周期數(shù)據(jù)出現(xiàn)梯度爆炸和梯度消失的問題。GRU 對(duì)LSTM 結(jié)構(gòu)改進(jìn),只包含重置門和更新門[14]。兩者預(yù)測(cè)精度差距不大,但GRU 模型收斂速度快,運(yùn)行成本低。重置門負(fù)責(zé)將當(dāng)下輸入信息與過去信息相結(jié)合,更新門通過設(shè)置時(shí)間步來保存記憶信息。GRU 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2。

圖2 GRU 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 Structure diagram of GRU neural network

計(jì)算公式如下:

1.3 Attention 機(jī)制原理

Attention 作為資源分配機(jī)制,主要提高對(duì)關(guān)鍵信息關(guān)注,降低無關(guān)信息干擾,類似于人類大腦的注意力分配功能[15]。通過賦予不同時(shí)刻輸入序列隱藏層向量相應(yīng)的權(quán)重,考慮關(guān)鍵信息作用提高模型預(yù)測(cè)精度。Attention 機(jī)制結(jié)構(gòu)圖如圖3。

圖3 Attention 機(jī)制結(jié)構(gòu)圖Fig.3 Attention mechanism structure diagram

圖中:xi為輸入值;hi為GRU 隱層狀態(tài)輸出;βi為注意力權(quán)重值;y為輸出;i為數(shù)據(jù)數(shù)。

2 參數(shù)優(yōu)選及模型構(gòu)建

煤層氣開采具有間歇性和不穩(wěn)定性的特點(diǎn),排采數(shù)據(jù)以天為單位隨時(shí)間變化,是時(shí)間序列數(shù)據(jù)。在煤層氣產(chǎn)能預(yù)測(cè)中,排采數(shù)據(jù)包含煤層氣生產(chǎn)特點(diǎn)和動(dòng)態(tài)數(shù)據(jù)變化規(guī)律。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)方法難以考慮到歷史排采序列前后關(guān)聯(lián)性及其內(nèi)在規(guī)律。CNN 通過卷積層和池化層提取數(shù)據(jù)間高層特征,提高模型預(yù)測(cè)精度。GRU 針對(duì)煤層氣開采不穩(wěn)定的特點(diǎn),用于處理數(shù)據(jù)動(dòng)態(tài)變化,從中挖掘煤層氣生產(chǎn)規(guī)律。但煤層氣開采周期較長(zhǎng),導(dǎo)致GRU 網(wǎng)絡(luò)會(huì)出現(xiàn)丟失信息的狀況。因此,引入Attention 機(jī)制通過賦予不同時(shí)刻輸入序列相應(yīng)的權(quán)重,提高模型對(duì)關(guān)鍵信息的學(xué)習(xí),避免關(guān)鍵信息丟失?;谏鲜龇治?,提出一種基于Attention 機(jī)制的卷積門控單元網(wǎng)絡(luò)CNN-GRUA。

以韓城區(qū)塊某煤層氣井排采數(shù)據(jù)為例進(jìn)行分析,包括井底流壓、套壓、動(dòng)液面高度、日產(chǎn)水量、沖次、泵效、泵徑等,將這些特征因素代入模型訓(xùn)練之前,利用隨機(jī)森林算法進(jìn)行優(yōu)選挑選,提高神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果,防止過擬合。

2.1 基于隨機(jī)森林排采參數(shù)優(yōu)選

隨機(jī)森林是一種集成算法[16],由許多決策樹按照特定方式相互連接組成。決策樹數(shù)據(jù)由當(dāng)前數(shù)據(jù)序列隨機(jī)劃分,最終結(jié)果由各決策樹結(jié)果決定?;谶@種方式,會(huì)產(chǎn)生未被決策樹劃分的數(shù)據(jù),稱作袋外樣本(OOB),而特征序列重要性判定由袋外樣本決定[17]。計(jì)算公式如下:

式中:V IM為特征重要性;errOOB1 為每棵樹的袋外樣本誤差;errOOB2 為加入噪聲數(shù)據(jù)后重新計(jì)算的樣本誤差;N為決策樹個(gè)數(shù)。

選取排采過程中井底流壓、套壓、動(dòng)液面高度、日產(chǎn)水量、沖次、泵效、泵徑等因素作為輸入特征,日產(chǎn)氣量作為目標(biāo)值,利用隨機(jī)森林算法對(duì)排采過程中7 個(gè)參數(shù)進(jìn)行特征重要性評(píng)價(jià)。各排采參數(shù)的重要性如圖4。

圖4 各排采參數(shù)的重要性Fig.4 Importance of each drainage parameter

從中選出靠前的5 個(gè)因素分析其與日產(chǎn)氣之間的關(guān)系,同時(shí)也將這5 種因素序列作為后續(xù)模型建立訓(xùn)練的輸入端,分別為:井底流壓、套壓、動(dòng)液面高度、日產(chǎn)水量、沖次。

2.2 日產(chǎn)氣量與排采參數(shù)間相關(guān)性分析

基于上述隨機(jī)森林特征重要性分析可知井底流壓、套壓、液柱高度、日產(chǎn)水量、沖次等排采參數(shù)與日產(chǎn)氣量相關(guān)性較高,通過皮爾遜相關(guān)系數(shù)進(jìn)行相關(guān)系數(shù)運(yùn)算,計(jì)算公式如下:

排采參數(shù)之間相關(guān)系數(shù)熱度圖如圖5。

圖5 排采參數(shù)之間相關(guān)系數(shù)熱度圖Fig.5 Heat map of correlation coefficients between drainage parameters

由圖5,日產(chǎn)氣量與各排采參數(shù)間的關(guān)系主要表現(xiàn)為:日產(chǎn)氣量與沖次呈現(xiàn)正相關(guān)性,日產(chǎn)氣量與井底流壓、套壓、日產(chǎn)水、動(dòng)液面呈現(xiàn)負(fù)相關(guān)性。

煤層氣生產(chǎn)井通過調(diào)節(jié)氣井沖次控制排采速度(產(chǎn)氣、產(chǎn)水)。當(dāng)進(jìn)入氣水兩相流階段時(shí),氣井沖次越高,產(chǎn)氣量越高。因此,在考慮煤儲(chǔ)層排采過程中的速敏、應(yīng)力敏感性條件下,沖次與日產(chǎn)氣存在正相關(guān)關(guān)系。

動(dòng)液面高度變化體現(xiàn)排采強(qiáng)度,隨著液柱高度降低,儲(chǔ)層壓力減小,煤層氣產(chǎn)量增大,產(chǎn)氣量與液面深之間呈負(fù)相關(guān)關(guān)系。造成上述現(xiàn)象的原因,主要在于套壓和液面深之間存在正相關(guān)關(guān)系,液面深度受套壓控制,致使液面深與產(chǎn)氣量的關(guān)系受控于產(chǎn)氣量與套壓的關(guān)系,因此產(chǎn)氣量與液面深之間呈負(fù)相關(guān)關(guān)系。

煤層氣井投產(chǎn)初期,煤層氣井進(jìn)入飽和水單相流階段,通過控制產(chǎn)水速度,降低井底壓力及壓降范圍。當(dāng)井底壓力降低到臨界解吸壓力以下,煤層氣井進(jìn)入初始產(chǎn)氣階段,一般井底流力下降幅度越大,產(chǎn)氣量越高,兩者存在負(fù)相關(guān)關(guān)系。

套壓值可反映煤層氣的產(chǎn)出狀況,“見壓放氣”也是煤層氣井生產(chǎn)常用的技術(shù)手段。當(dāng)煤層氣井進(jìn)入飽和水單相流階段時(shí),套壓值為0。氣水兩相流及單相氣流動(dòng)階段,兩者關(guān)系存在多重性,但總體趨勢(shì)為在保證穩(wěn)定產(chǎn)氣的前提下,套壓值降低時(shí),產(chǎn)氣量上升,兩者存在負(fù)相關(guān)關(guān)系。

煤層氣井不同排采階段產(chǎn)水量及產(chǎn)氣量的關(guān)系具有多重性。在飽和水單相流階段,井底流壓未降低到臨界解吸壓力以下,產(chǎn)氣量為0。在氣水兩相流階段,保證連續(xù)性生產(chǎn)條件且產(chǎn)水量充足條件下,水相滲透率下降,氣相滲透率上升,兩者存在負(fù)相關(guān)關(guān)系。

2.3 模型構(gòu)建及運(yùn)算過程

歷史序列是日產(chǎn)氣量變化的表現(xiàn),它包含了日產(chǎn)氣預(yù)測(cè)規(guī)律的重要信息。CNN 模型作為組合模型的上層,其卷積層最先接收到影響煤層氣產(chǎn)能的各排采數(shù)據(jù)參數(shù)。作為卷積層可以充分提取輸入序列數(shù)據(jù)間的高層特征,再通過池化層篩選提取較為主要的數(shù)據(jù)特征,減少計(jì)算量。GRU 模型作為組合模型的下層,可以按照時(shí)序順序接收由CNN 模型處理后的重要排采數(shù)據(jù)特征的時(shí)間信息,由于其門結(jié)構(gòu)的構(gòu)造,可以考慮前后數(shù)據(jù)之間的關(guān)聯(lián)性。Attention 機(jī)制通過賦予不同特征向量相應(yīng)的概率,對(duì)權(quán)重參數(shù)矩陣實(shí)現(xiàn)不斷更新。CNN-GRUA 模型預(yù)測(cè)流程圖如圖6。

圖6 CNN-GRUA 模型預(yù)測(cè)流程圖Fig.6 Flow chart of CNN-GRUA model prediction

2.4 評(píng)價(jià)指標(biāo)

性能評(píng)價(jià)標(biāo)準(zhǔn)用來衡量模型的預(yù)測(cè)效果。選取2 種評(píng)價(jià)標(biāo)準(zhǔn):均方根誤差(RMSE)、平均絕對(duì)誤差百分比(MAPE)。其計(jì)算公式如下:

式中:y(i)為 實(shí)際值;y′(i)為 預(yù)測(cè)值;N為y(i)的個(gè)數(shù)。

3 算例分析

3.1 數(shù)據(jù)選擇及歸一化

韓城區(qū)塊主要開采山西組3 號(hào)煤和太原組5 號(hào)、11 號(hào)煤層,以11 號(hào)煤層為研究對(duì)象,埋深738~835 m,平均埋深865 m,煤層厚度3~7 m,鏡質(zhì)組反射率為1.81%~3.09%,為無煙煤。煤層含氣量4.75~19.73 m3/t,煤巖孔隙度1%~8%,煤層滲透率介于0.05×10-3~12×10-3μm2,綜合分析表明,11 號(hào)煤層孔隙未被礦物充填,對(duì)煤層氣儲(chǔ)集有利,煤巖孔隙結(jié)構(gòu)中,以大中孔隙為主,外生裂隙相當(dāng)發(fā)育,孔、縫間連通性好,有利于煤層氣的儲(chǔ)集和開發(fā)[18]。

為驗(yàn)證所提煤層氣產(chǎn)能預(yù)測(cè)方法的精確性和有效性,利用某井區(qū)的某井?dāng)?shù)據(jù)進(jìn)行驗(yàn)證。選取2012 年4 月至2016 年8 月共1 600 d 的煤層氣排采數(shù)據(jù)作為數(shù)據(jù)集,將其劃分為訓(xùn)練集與測(cè)試集,其中訓(xùn)練集1 440 d,測(cè)試集160 d。數(shù)據(jù)每日采集1 次,模型輸入特征維度為5 維,分別為:沖次、套壓、井底流壓、日產(chǎn)水、動(dòng)液面高度,輸出特征維度為1 維的日產(chǎn)氣量。

為加速訓(xùn)練及提高模型預(yù)測(cè)的精度,對(duì)數(shù)據(jù)進(jìn)行歸一化處理。

3.2 模型結(jié)構(gòu)參數(shù)確定及訓(xùn)練

根據(jù)確定的煤層氣排采參數(shù)與日產(chǎn)氣量所構(gòu)成的訓(xùn)練集,基于Adam[19]優(yōu)化學(xué)習(xí)算法,對(duì)CNN-GRU 神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,初始狀況下經(jīng)過不斷實(shí)驗(yàn)調(diào)試,CNN 模塊參數(shù)設(shè)計(jì)結(jié)果對(duì)比見表1,GRU 模塊參數(shù)設(shè)計(jì)結(jié)果對(duì)比見表2。

表1 CNN 模塊參數(shù)設(shè)計(jì)結(jié)果對(duì)比Table 1 Comparison of CNN module parameters design results

表2 GRU 模塊參數(shù)設(shè)計(jì)結(jié)果對(duì)比Table 2 Comparison of GRU module parameters design results

由表1、表2 數(shù)據(jù)最終確定模型最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)置具體如下:CNN 卷積層層數(shù)為2,第1 層和第2 層卷積核個(gè)數(shù)分別為32 和64,大小為3,取Relu 激活函數(shù)激活,池化層池化方法采用最大池化,GRU 層數(shù)為2,隱藏神經(jīng)元個(gè)數(shù)分別為64 和128,訓(xùn)練次數(shù)epochs 設(shè)置為300,防止訓(xùn)練過程中出現(xiàn)過擬合現(xiàn)象,在每層門控循環(huán)單元網(wǎng)絡(luò)后采用Dropout 方法,大小設(shè)置為0.25。

將排采數(shù)據(jù)代入所設(shè)計(jì)的組合模型CNN-GRU進(jìn)行歷史日產(chǎn)氣量擬合,日產(chǎn)氣量預(yù)測(cè)值與日產(chǎn)氣量實(shí)際值對(duì)比如圖7,兩者結(jié)果非常接近說明模型在訓(xùn)練過程中并沒有出現(xiàn)過擬合或者欠擬合的狀況,具有較好的泛化能力,可以應(yīng)用解決煤層氣產(chǎn)能預(yù)測(cè)問題。

圖7 日產(chǎn)氣量預(yù)測(cè)值與日產(chǎn)氣量實(shí)際值對(duì)比Fig.7 Comparison of predicted daily gas volume and actual daily gas volume

3.3 煤層氣產(chǎn)能預(yù)測(cè)對(duì)比

在訓(xùn)練效果最優(yōu)的CNN-GRU 神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上,引入Attention 機(jī)制進(jìn)行優(yōu)化,對(duì)未來160 d 的產(chǎn)氣量進(jìn)行預(yù)測(cè),與煤層氣日產(chǎn)氣量實(shí)際值相比較,預(yù)測(cè)值的平均絕對(duì)誤差百分比為1.72%,預(yù)測(cè)值與實(shí)際值基本一致,最優(yōu)模型獲得的評(píng)價(jià)指標(biāo)結(jié)果見表3,不同模型日產(chǎn)氣預(yù)測(cè)值與實(shí)際值比較如圖8。

表3 最優(yōu)模型獲得的評(píng)價(jià)指標(biāo)結(jié)果Table 3 Evaluation index results obtained by the optimal model

圖8 不同模型日產(chǎn)氣預(yù)測(cè)值與實(shí)際值比較Fig.8 Comparison of predicted and actual daily gas output from different models

由表3 和圖8 可以看出:在RMSE 和MAPE這2 種模型評(píng)估標(biāo)準(zhǔn)下,引入注意力機(jī)制的模型CNN-GRUA 的預(yù)測(cè)效果最好,BP 模型的預(yù)測(cè)效果最差;從數(shù)據(jù)上來看,RMSE 分別下降了80.71%、49.84%、41.95%、12.11%;MAPE 分別下降了82.32%、52.34%、44.87%、15.27%。可以看出,本文所提出的方法相對(duì)于其他方法在這2 種評(píng)估標(biāo)準(zhǔn)下有較大提升,能對(duì)煤層氣井產(chǎn)氣量進(jìn)行精準(zhǔn)預(yù)測(cè)。

為了驗(yàn)證模型的適用性,選取了該地區(qū)平均日產(chǎn)量不同的5 口井進(jìn)行實(shí)驗(yàn),其中平均日產(chǎn)氣量在500~1 000 m3的井記作L-1,平均日產(chǎn)氣量在1 000~2 000 m3的井記作L-2、L-3,平均日產(chǎn)其量在2 000 m3以上的井記作L-4 和L-5,來預(yù)測(cè)未來160 d 的日產(chǎn)氣量情況。煤層氣井實(shí)際產(chǎn)量與模型預(yù)測(cè)產(chǎn)量見表4。

表4 煤層氣井實(shí)際產(chǎn)量與模型預(yù)測(cè)產(chǎn)量Table 4 Actual coalbed methane well production and model forecast production

由表4 可以發(fā)現(xiàn),CNN-GRUA 模型的預(yù)測(cè)結(jié)果與實(shí)測(cè)值的誤差平均值都小于10%,證明本文所提的模型具有較強(qiáng)適應(yīng)性。

4 結(jié) 語(yǔ)

1)基于隨機(jī)森林特征重要性判斷方法從排采參數(shù)中選出影響煤層氣日產(chǎn)氣量的主要因素,解決了模型構(gòu)建過程中原始數(shù)據(jù)維度復(fù)雜的問題,避免了無關(guān)因素的干擾,提高了模型預(yù)測(cè)的精確性,節(jié)約了時(shí)間成本。

2)利用CNN 網(wǎng)絡(luò)善于提取數(shù)據(jù)間高層特征的特性,避免了人工選取數(shù)據(jù)特征的局限性,利用GRU 網(wǎng)絡(luò)善于學(xué)習(xí)長(zhǎng)時(shí)間歷史數(shù)據(jù)前后關(guān)系的特性,解決了長(zhǎng)時(shí)間學(xué)習(xí)造成的梯度爆炸問題,利用Attention 機(jī)制提高模型對(duì)關(guān)鍵信息的關(guān)注,避免出現(xiàn)重要信息丟失,實(shí)現(xiàn)對(duì)排采數(shù)據(jù)的充分挖掘。

3)針對(duì)煤層氣開采現(xiàn)狀,將本文所提出的CNN-GRUA 網(wǎng)絡(luò)模型應(yīng)用到煤層氣產(chǎn)能預(yù)測(cè)問題上。結(jié)果表明:該模型預(yù)測(cè)效果好,預(yù)測(cè)精度高,具有一定應(yīng)用潛力。

猜你喜歡
液面氣量煤層氣
頁(yè)巖超臨界態(tài)吸附氣量計(jì)算模型
氣量可以學(xué)習(xí)嗎
2019年《中國(guó)煤層氣》征訂單
煤層氣吸附-解吸機(jī)理再認(rèn)識(shí)
吸管“喝”水的秘密
基于DCS自動(dòng)控制循環(huán)水液面的改造
大港油田穩(wěn)步提高產(chǎn)氣量 提前4個(gè)月完成全年指標(biāo)
氣量三層次
DFS-C02V煤層氣井高產(chǎn)因素簡(jiǎn)析
解堵性二次壓裂在樊莊煤層氣井的應(yīng)用