樊冬艷 楊燦 孫海 姚軍 張磊 付帥師 羅飛
摘要:頁巖氣井單變量產(chǎn)量預測存在較強的不確定性,而現(xiàn)場生產(chǎn)動態(tài)數(shù)據(jù)同時包括多個相關指標,針對如何選取合理的多變量數(shù)據(jù)對頁巖氣井產(chǎn)量進行預測,在保證計算效率的情況下提高預測精度。頁巖氣井的生產(chǎn)動態(tài)數(shù)據(jù)集包括日產(chǎn)氣量、日產(chǎn)水量、套壓、油壓、油嘴直徑、開井時間和溫度等,采用歐式距離和動態(tài)時間彎曲距離對生產(chǎn)動態(tài)數(shù)據(jù)時間序列進行相似性度量,依據(jù)與日產(chǎn)氣量的相關度,把數(shù)據(jù)分為強相關時間序列和弱相關時間序列;其次,基于卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡、長短期記憶網(wǎng)絡和門控神經(jīng)網(wǎng)絡分別對全時間序列、強相關序列、弱相關序列和單變量序列進行頁巖氣井產(chǎn)量預測;最后,以平均絕對誤差、均方根誤差和決定系數(shù)作為評價指標,得到不同序列的誤差由小到大排序為強相關序列、全時間序列、弱相關序列、單變量序列,優(yōu)選的機器學習方法為門控神經(jīng)網(wǎng)絡和長短期記憶網(wǎng)絡。結果表明,采用機器學習方法結合頁巖氣井強相關性序列(日產(chǎn)氣量、套壓、油壓、日產(chǎn)水量)能有效降低預測誤差,提高頁巖氣井產(chǎn)量預測效果。
關鍵詞:頁巖氣井; 機器學習; 相似性; 時間序列; 產(chǎn)量預測
中圖分類號:TE 312?? 文獻標志碼:A
文章編號:1673-5005(2024)03-0119-08?? doi:10.3969/j.issn.1673-5005.2024.03.013
Shale gas well production forecasting based on time sequence similarity and machine learning methods
FAN Dongyan1,2, YANG Can1, SUN Hai1,2, YAO Jun1,2, ZHANG Lei1,2, FU Shuaishi1,2, LUO Fei1
(1.State Key Laboratory of Deep Oil and Gas, China University of Petroleum(East China), Qingdao 266580, China;2.School of Petroleum Engineering in China University of Petroleum(East China), Qingdao 266580, China)
Abstract: Production data from shale gas wells contains multiple different dynamic variables during on-site collection, and there is uncertainty for production forecasting if only a single variable is used. It is important to choose reasonable multi-variable data to predict the output of shale gas wells, and ensure the precision accuracy and computing efficiency. In this study, a new method was proposed. Firstly, a dynamic data set can be comprehensively collected, including daily gas rate, water rate, well pressure, oil choke size, well opening time and fluid temperature. Euclidean distance and dynamic time warping were used to perform similarity testing of the production dynamic data time sequences. Based on the correlation with daily gas rate, the production data were divided into strong related time series and weak related time sequences. Secondly, based on convolutional neural network, recurrent neural network, long and short-term memory network (LSTM)and gate recurrent units (GRU), the shale gas well production was predicted for full-time sequences, strong related sequences, weak related sequences and univariate sequences, respectively. Evaluation indicators were used to verify the methods, including average absolute error, root mean squared error and decision coefficient. The results indicate that the order of error from small to large for different sequences is the strong related sequence, the full time sequence, the weak related sequence, the univariate sequence. The preferred machine learning methods are the GRU and LSTM models. The strong correlation sequence can be used to improve the accuracy and reduce errors in shale gas well forecasting.
Keywords: shale gas well; machine learning; similarity; time series; productivity prediction
產(chǎn)量的準確預測在油氣井高效開發(fā)和開采過程中至關重要,涉及整個生產(chǎn)開發(fā)歷程,包括早期資源評價、中期技術調(diào)整以及后期提高采收率措施[1]。目前產(chǎn)量預測方法主要包括解析方法[2-3]、數(shù)值計算方法[4-5]、經(jīng)驗遞減方法[6-7]和機器學習方法4類[8-9]。近年來,隨著人工智能方法快速發(fā)展,以及油田現(xiàn)場大數(shù)據(jù)收集技術的提升,為機器學習在油田現(xiàn)場的產(chǎn)量預測提供了重要基礎,機器學習方法的油氣井產(chǎn)量預測也受到了越來越多的學者關注。吳新根等[10]在1994年首次利用ANN進行油田產(chǎn)量預測,證明了機器學習方法在油田產(chǎn)量預測領域的可行性。近年來,大量學者采用不同的機器學習方法對油氣井產(chǎn)量進行預測,以及方法之間的對比優(yōu)選[11-15]。為了提高預測模型的精度及穩(wěn)定性,一方面采用機器學習方法與其他方法進行耦合,例如將遺傳算法(GA)[12]、粒子群算法(PSO)[13]和帝國競爭算法(ICA)[15]與機器學習方法相結合,以優(yōu)化神經(jīng)網(wǎng)絡模型的超參數(shù)提高模型的準確性;另一方面采用多變量輸入增加數(shù)據(jù)本身的信息量,例如Hamzeh等[16]將日產(chǎn)氣量、油壓和溫度作為輸入變量,基于循環(huán)神經(jīng)網(wǎng)絡對多變量氣井產(chǎn)量進行預測。以及以上兩種方法的結合,如Fan等[17]將ARIMA與長短期記憶網(wǎng)絡(LSTM)方法相結合,考慮人工操作的情況下對頁巖氣井的產(chǎn)量進行預測。Cuthbert等[18]將PSO與支持向量機(SVR)、反饋神經(jīng)網(wǎng)絡(FNN)以及循環(huán)神經(jīng)網(wǎng)絡(RNN),采用多變量輸入對油井產(chǎn)量進行預測。為了進一步挖掘輸入數(shù)據(jù)與目標值的相關關系,在初期產(chǎn)量預測中進行主控因素排序及主成分分析[19-20]。劉合等[21]基于多變量時間序列模型對高含水油藏產(chǎn)量預測進行了研究,筆者基于收集的現(xiàn)場多維生產(chǎn)動態(tài)數(shù)據(jù),應用時間序列相似性分析方法,將輸入數(shù)據(jù)分為強相關和弱相關序列,采用不同的機器學習方法對頁巖氣井產(chǎn)量進行預測,建立一種基于時間序列相似性與機器學習方法相結合的產(chǎn)能預測方法,為現(xiàn)場頁巖氣井的高效開發(fā)提供指導。
1 頁巖氣井多時間序列的相似性分析
針對頁巖氣井生產(chǎn)動態(tài)多維數(shù)據(jù)之間存在內(nèi)部相關的特點,采用歐式距離和動態(tài)時間彎曲距離,對不同的生產(chǎn)時間序列與日產(chǎn)氣量進行相似性度量,依據(jù)相似度把不同生產(chǎn)動態(tài)數(shù)據(jù)分為強相關時間序列和弱相關時間序列,為下一步基于機器學習方法對頁巖氣產(chǎn)量預測提供多變量數(shù)據(jù)集。
1.1 頁巖氣井時間序列特點
選取頁巖氣井X1井生產(chǎn)動態(tài)數(shù)據(jù)進行分析,包括日產(chǎn)氣量、日產(chǎn)水量、套壓、油壓、油嘴直徑、開井時間和溫度,繪制成動態(tài)曲線,如圖1所示。X1井的生產(chǎn)時間為691 d,從曲線形態(tài)可見,部分曲線之間存在較明顯的相關關系,氣井產(chǎn)量發(fā)生波動時,部分曲線也出現(xiàn)了不同程度的數(shù)值變化,例如在400~500 d,頁巖氣井出現(xiàn)了較長時間關井操作,產(chǎn)氣產(chǎn)水量為0,套壓、油壓出現(xiàn)不同程度的壓力恢復,而溫度、開井時間和油嘴直徑變化不明顯,因此有必要對生產(chǎn)動態(tài)數(shù)據(jù)集進行相關性分析,為下一步多變量產(chǎn)量預測的變量選擇提供有力支撐。
1.2 時間序列相似性分析方法
相似性度量作為時間序列間相互依賴關系的重要衡量指標,若兩個序列的距離函數(shù)值小于規(guī)定的誤差閾值,則判定兩個序列相似,同時距離函數(shù)計算結果越小,則相似度越高。在頁巖氣井生產(chǎn)時間序列相似性分析中,分別選取鎖步度量[22]的歐式距離法[23]對時間序列進行一對一的比較;同時選取彈性度量[24]的動態(tài)時間規(guī)整方法[25],允許時間序列一對多的進行比較。
1.2.1 歐式距離
歐式距離(euclidean distance, ED)[23]可度量維數(shù)相等的時間序列相似性,將節(jié)點為n的時間序列視為n維向量,例如目標序列P=(p1,p2,…,pn)與比較序列Q=(q1,q2,…,qn)的維度(長度)相等,對歐式距離dED進行計算為
dED=∑ni=1(pi-qi)2.(1)
式中,pi為目標序列中的第i個值;qi為比較序列中的第i個值。
對于任意兩個時間序列,規(guī)定相似度為ε,若序列P和Q有D(P,Q)≤ε,則兩個時間序列相似,如圖2所示。
歐式距離是一種簡單的距離計算方法,易于理解、計算量小且效率高,能較好地反映兩個序列的相似關系,是普遍首選的相似性度量方法。但需要保證相似性度量的兩個序列長度一致,靈活度不高,不具有在時間軸上彎曲伸縮的能力,因此難以捕捉時間序列的變形特征,所以需要結合動態(tài)時間彎曲距離方法。
1.2.2 動態(tài)時間彎曲距離
動態(tài)時間規(guī)整[25]方法允許序列在時間軸方向彎曲,使不等長的時間序列在彎曲時能夠通過相似波形進行最優(yōu)相似匹配的度量方法。動態(tài)時間彎曲(dynamic time warping, DTW) 距離在兩個時間序列之間進行匹配(圖3),避免了時間不同步問題。若給定兩個時間序列P=(p1,p2,…,pm)和Q=(q1,q2,…,qn),其長度分別為m和n(m≥n),則兩個序列的動態(tài)時間彎曲距離可以表示為
D(P,Q)=minp∑mk-1d(pk).(2)
式中,d(pk)為點pk與某個點q的距離。為了得到動態(tài)時間彎曲距離,通過構造網(wǎng)格矩陣(圖4),查找一條最佳規(guī)整路徑,使其經(jīng)過的距離累積最小。
該方法不要求兩個序列的長度相等,可以很好地捕捉時間序列在計算過程中產(chǎn)生的伸縮、變形等問題,相對于歐式距離其距離衡量更精確,同時計算量也較大,耗時較長,且對噪聲非常敏感。綜上所述,為了達到相似性分析更準確及驗證對比的目的,同時選用歐式距離和時間動態(tài)彎曲距離對頁巖氣井多維動態(tài)數(shù)據(jù)進行相似性度量。
1.3 多時間序列相似性分析
對頁巖氣井的動態(tài)生產(chǎn)數(shù)據(jù)集進行預處理,主要包括異常值檢測、缺失值處理和數(shù)據(jù)的歸一化。由于數(shù)據(jù)集中不同變量的量級差別較大,為提高序列相似性計算的準確性,采用極差法對數(shù)據(jù)進行歸一化處理,
si(k)=xi(k)-min xi(k)max xi(k)-min xi(k), k=1,2,…,n.(3)
式中,xi(k)和si(k)分別為第k時刻歸一化前和歸一化后時間序列對應值。
其次確定目標序列和比較序列,目標序列為氣井日產(chǎn)氣量,比較序列包括日產(chǎn)水量、開井時間、油嘴直徑、套壓、油壓和溫度。分別采用歐式距離和動態(tài)時間彎曲距離計算不同比較序列與目標序列的相似性度量值,如表1所示。
由表1可得:頁巖氣X1井的歐式距離和動態(tài)時間彎曲距離由小到大排序都為日產(chǎn)水量、套壓、油壓、溫度、油嘴直徑、開井時間,說明不同度量方法計算相似度的正確性。結果表明:日產(chǎn)水量、套壓、油壓與日產(chǎn)氣量的相似距離較小,而溫度、油嘴直徑和開井時間相對而言,與氣井日產(chǎn)氣量的相似距離較大,其中日產(chǎn)水量和套壓與氣井產(chǎn)量相似度距離最小,相關關系最強。為了對比不同相關序列對氣井產(chǎn)量預測的影響,本文中把比較序列與目標序列組合分為3類進行對比分析:①全時間序列,日產(chǎn)氣量、套壓、油壓、日產(chǎn)水量、油嘴直徑、開井時間、溫度;②強相關時間序列,日產(chǎn)氣量、套壓、油壓、日產(chǎn)水量;③弱相關時間序列,日產(chǎn)氣量、油嘴直徑、開井時間、溫度。
2 基于相似性分析機器學習方法的產(chǎn)量預測
為了對比以上3類不同時間序列組合對頁巖氣井產(chǎn)量預測的影響,采用機器學習方法對多變量輸入序列進行產(chǎn)量預測,運用卷積神經(jīng)網(wǎng)絡[26](CNN)、循環(huán)神經(jīng)網(wǎng)絡[27](RNN)、長短期記憶網(wǎng)絡[28](LSTM)和門控神經(jīng)網(wǎng)絡[29](GRU)4種常用的時間序列預測方法,構建相應的頁巖氣井產(chǎn)量預測模型,評價指標包括平均絕對誤差(δr)、均方根誤差(δRMSE)和決定系數(shù)(R2)。
2.1 輸入序列構成及標準化處理
對3類不同相關序列數(shù)據(jù)(全時間序列、強相關時間序列和弱相關時間序列)進行整理,補充完善缺失數(shù)據(jù),數(shù)據(jù)集的前90%作為訓練集,后10%作為測試集,其中每個訓練和測試單元為一個短的時間序列包括前n個時間步的輸入信息和輸出信息,在此采用滑動窗口的方式對n值進行選取,如圖5所示,取n值為3[30],即選用前面的3個時間步長預測下一個時間步長,即
xt,pre=f(xt-1,xt-2,xt-3).(4)
式中,xt,pre 為t時刻時間序列預測值;xt-1、xt-2、xt-3為前3步相關的輸入值。
為了更好地擬合并防止機器學習過程的訓練發(fā)散問題,需要對輸入的不同序列集數(shù)據(jù)進行標準化處理,標準化公式為
Xt,N=xt-δstd(x), Yt,N=yt-δstd(y) .(5)
式中,Xt,N和Yt,N分別為標準化后的輸入數(shù)據(jù)及日產(chǎn)氣量輸出數(shù)據(jù);xt和yt分別為原輸入數(shù)據(jù)及日產(chǎn)氣量數(shù)據(jù);t和t分別為輸入及日產(chǎn)氣量數(shù)據(jù)平均值;δstd(x)和δstd(y)分別為輸入及日產(chǎn)氣量數(shù)據(jù)標準方差。
2.2 機器學習產(chǎn)能預測模型構建
對不同序列數(shù)據(jù)集進行氣井的產(chǎn)量預測,分別基于CNN、RNN、LSTM和GRU神經(jīng)網(wǎng)絡構建多步預測模型,如圖6所示,主要包括考慮相似性序列的生成、不同相關序列的數(shù)據(jù)標準化、網(wǎng)絡的初始化參數(shù)設置、不同的神經(jīng)網(wǎng)絡訓練模型構建及訓練、訓練模型評價、測試數(shù)據(jù)的對比評價、產(chǎn)量預測結果。
2.2.1 卷積神經(jīng)網(wǎng)絡
卷積神經(jīng)網(wǎng)絡[26](convolutional neural network,CNN)是一種具有卷積操作的前向神經(jīng)網(wǎng)絡,它主要包括輸入層、卷積層、池化層、全連接層和輸出層,一般采用多個卷積+池化進行輸入信號多個特征的提取,其核心是卷積運算。在CNN的訓練過程中,首先進行前向傳播,目標數(shù)據(jù)通過輸入層輸入網(wǎng)絡,然后通過卷積運算、池化等過程提取隱藏在輸入數(shù)據(jù)中的特征信息,并利用反向傳播算法優(yōu)化網(wǎng)絡參數(shù),當滿足條件時結束網(wǎng)絡的訓練過程,利用該網(wǎng)絡模型可以實現(xiàn)對未知輸入的預測。
2.2.2 循環(huán)神經(jīng)網(wǎng)絡
循環(huán)神經(jīng)網(wǎng)絡[27](recurrent neural network,RNN)是一種具有記憶功能的神經(jīng)網(wǎng)絡。RNN由輸入層、隱藏層和輸出層3層構成。RNN是采用遞歸計算將所有神經(jīng)元通過鏈式連接,將神經(jīng)元的計算結果以一定的權重比例傳輸給新的神經(jīng)元。在模型隱藏層中,神經(jīng)元之間存在著自連接和互連接的關系,構成了一種傳遞延遲信號的矩陣,使得該模型能夠獲得短暫的記憶特性。利用隱藏層將上一層輸出和下一刻狀態(tài)結合起來,實現(xiàn)了神經(jīng)元間的信息交換,形成反饋網(wǎng)絡結構。
2.2.3 長短期神經(jīng)網(wǎng)絡
長短期神經(jīng)網(wǎng)絡[28](long short-term memory,LSTM)是循環(huán)神經(jīng)網(wǎng)絡模型的一種改進,包含輸入層、隱藏層和輸出層。LSTM神經(jīng)網(wǎng)絡模型最大的特點是在每個神經(jīng)元中都添加了3個控制門,分別是輸入門、輸出門和遺忘門。這3個門可以對接收到的信息進行選擇性地記憶并不斷地修改參數(shù),進而緩解了在模型擬合時產(chǎn)生的梯度爆炸或者消失。
2.2.4 門控神經(jīng)網(wǎng)絡
門控神經(jīng)網(wǎng)絡[29](gate recurrent units,GRU)是循環(huán)神經(jīng)網(wǎng)絡的改進形式,也屬于LSTM的變體,門控循環(huán)神經(jīng)單元采用了門控機制,由LSTM的3種門縮減到2種門,包含更新門和重置門,去掉了類似于LSTM的輸出門,且不存在LSTM中的細胞狀態(tài)。GRU的重置門決定了歷史信息被遺忘的程度。更新門主要決定將多少過去的信息保存到當前時間步。該模型減少了門的數(shù)量,精簡了門的結構,縮減了模型參數(shù),使GRU運算比LSTM簡單,大大減少運算量。
2.3 模型評價指標
模型評價指標是在測試集上對預測模型進行泛化能力評價,表征本文模型的產(chǎn)量預測結果的準確程度。所選擇的模型評價指標包含平均絕對誤差δr、均方根誤差δRMSE和決定系數(shù)R2,計算公式分別為
δr=1N∑Ni=1qi,pred-qi,realqi,real ,(6)
δRMSE=1N∑Ni=1(qi,pred-qi,real)2 ,(7)
R2=1-∑Ni=1(qi,pred-qi,real)2∑Ni=1(qi,pred-q-)2 .(8)
式中,N為時間序列的散點個數(shù);qi,real和qi,pred分別為在任一時間點的產(chǎn)量的預測值和實際值,t/d。
綜上,平均絕對誤差在±5%表示達到了較好的預測效果,且與均方根誤差值同理,值越小說明預測效果越好。決定系數(shù)取值為[0,1],結果為0表示模型預測效果很差;結果是1,表示預測結果為函數(shù)關系;結果在0~1之間,數(shù)值越大表示模型預測效果越好。因此采用以上3種模型評價指標來全面地考察數(shù)據(jù)結果,較為理性客觀地評價數(shù)據(jù)誤差。
3 結果對比及分析
基于頁巖氣井X1井的現(xiàn)場生產(chǎn)數(shù)據(jù),采用相似性分析得到全時間序列、強相關時間序列和弱相關時間序列,在此運用CNN、RNN、LSTM和GRU網(wǎng)絡模型對不同的多變量時間序列和單變量時間序列進行X1氣井的產(chǎn)量預測,并分別對不同序列和網(wǎng)絡模型進行結果分析。
3.1 網(wǎng)絡模型的超參數(shù)設置
將日產(chǎn)氣量作為目標序列,日產(chǎn)水量、油嘴直徑、開井時間、油管壓力、套管壓力和溫度作為比較時間序列。采用CNN、RNN、LSTM和GRU神經(jīng)網(wǎng)絡模型分別進行單變量序列、弱相關序列、強相關序列和全時間序列的機器學習方法產(chǎn)量預測。通過對網(wǎng)絡模型超參數(shù)進行不斷優(yōu)化,本文中的神經(jīng)網(wǎng)絡的基本超參數(shù)如表2所示,其次所有神經(jīng)網(wǎng)絡的學習率均為0.005,隨機失活層刪除率為0.2。
3.2 不同相關序列的結果
針對不同時間序列(全時間序列、強相關序列、弱相關序列、單變量序列)采用不同的神經(jīng)網(wǎng)絡模型進行預測,得到不同模型下的預測結果,如圖7和表3所示??梢钥闯觯孩倏紤]多變量產(chǎn)量預測時,產(chǎn)量預測結果隨著實際產(chǎn)量的波動,預測曲線都出現(xiàn)了不同程度變化,說明多變量產(chǎn)量預測的有效性;②全時間序列和強相關序列,相對于弱相關序列的預測效果更好,曲線的波動變化更符合實際效果,特別是LSTM和GRU模型表現(xiàn)更為明顯;③由表3可見,采用不同的網(wǎng)絡模型對氣井進行產(chǎn)量預測,其中絕對誤差δr和均方根誤差δRMSE由小到大的排序為強相關序列、全時間序列、弱相關序列、單變量序列,且與決定系數(shù)R2的結果一致。說明強相關序列的構建進一步提高了產(chǎn)量預測的精度,全時間序列中弱相關序列的加入,相比于強相關性序列在一定程度上減低了產(chǎn)量預測的精度,由此可見,在多變量產(chǎn)量預測過程中進行序列的相似性分析至關重要,可以提取出有效數(shù)據(jù),排除干擾影響,提高預測精度。
基于上述計算結果可知:①不同相關性的多變量預測中,采用不同評價標準對氣井產(chǎn)量預測結果進行評價,GRU和LSTM網(wǎng)絡具有較好的預測效果,誤差較小,絕對系數(shù)較大;②弱相關序列和單變量序列預測結果相對誤差較大,弱相關序列不同網(wǎng)絡模型的誤差由小到大的排序為LSTM、GRU、RNN、CNN;單變量序列δRMSE和δr由小到大的排序為GRU、LSTM、RNN、CNN,R2的誤差由小到大的排序為GRU、RNN、LSTM、CNN;強相關序列和全時間序列預測誤差由小到大的排序為GRU、LSTM、CNN、RNN??傮w而言,頁巖氣井X1井預測網(wǎng)絡模型優(yōu)選為GRU和LSTM,優(yōu)選的預測序列為強相關序列。
4 結 論
(1)依據(jù)歐式距離和DTW距離由小到大排序為日產(chǎn)水量、套壓、油壓、溫度、油嘴直徑、開井時間,將時間序列分為3類,全時間序列、強相關時間序列(日產(chǎn)氣量、套壓、油壓、日產(chǎn)水量)和弱相關時間序列(日產(chǎn)氣量、油嘴直徑、開井時間、溫度)。
(2)不同序列的氣井產(chǎn)量預測,基于不同評價指標得到的誤差(平均絕對誤差δr、均方根誤差δRMSE和決定系數(shù)R2)由小到大的排序為強相關序列、全時間序列、弱相關序列、單變量序列,即強相關序列預測效果好于全時間序列、弱相關序列和單變量序列,故在多變量產(chǎn)量預測過程中進行序列的相似性分析非常有必要。
(3) GRU和LSTM網(wǎng)絡具有較好的預測效果,誤差較小,絕對系數(shù)較大,故總體而言頁巖氣井X1井預測機器學習網(wǎng)絡模型優(yōu)選為GRU和LSTM,優(yōu)選的相關序列為強相關序列。
參考文獻:
[1] KYUNGBOOK L, JUNGTEK L, DAEUNG Y, et al. Prediction of shale-gas production at Duvernay formation using deep-learning algorithm[J]. SPE Journal, 2019,24(6):2423-2437.
[2] JI J H, YAO Y D, HUANG S, et al. Analytical model for production performance analysis of multi-fractured horizontal well in tight oil reservoirs[J]. Journal of Petroleum Science and Engineering, 2017,158:380-397.
[3] MOHAMMAD B, MORTEZA D, SOHRAB Z. Semi-analytical solution for productivity evaluation of a multi-fractured horizontal well in a bounded dual-porosity reservoir[J]. Journal of Hydrology, 2020,581:124288.
[4] KAZEMI H, MERRILL L S, PORTERFIELD K L, et al. Numerical simulation of water-oil flow in naturally fractured reservoirs[J]. SPE Journal, 1976,16(6):317-326.
[5] MOHAMMAD M, VATANI A, MAJID S, et al. Parallel processing of numerical simulation of two-phase flow in fractured reservoirs considering the effect of natural flow barriers using the streamline simulation method[J]. International Journal of Heat and Mass Transfer, 2019,131(1):574-583.
[6] HENRIK W, LINNEA L, KJELL A, et al. Production decline curves of tight oil wells in eagle ford shale[J]. Natural Resources Research, 2017,26(3):365-378.
[7] ZHANG H, DEAN R, ADAM C, et al. Extended exponential decline curve analysis[J]. Journal of Natural Gas Science and Engineering, 2016,36(1): 402-413.
[8] 李淑霞,于笑,吳伏波,等.基于神經(jīng)網(wǎng)絡的水合物藏降壓開采產(chǎn)能預測及參數(shù)優(yōu)化[J].中國石油大學學報(自然科學版),2023,47(1):89-97.
LI Shuxia, YU Xiao, WU Fubo, et al. Prediction and parameter optimization of depressurization productivity of natural gas hydrate reservoirs based on neural network[J]. Journal of China University of Petroleum (Edition of Natural Science),2023,47(1):89-97.
[9] AMIRMASOUD K D, SHAHAB M, SOODABEH E. Coupling numerical simulation and machine learning to model shale gas production at different time resolutions[J]. Journal of Natural Gas Science and Engineering, 2015,25(1):380-392.
[10] 吳新根,葛家理.應用人工神經(jīng)網(wǎng)絡預測油田產(chǎn)量[J].石油勘探與開發(fā),1994,21(3):75-78,131.
WU Xingen, GE Jiali. Application of artificial neural networks in predicting oilfield production[J]. Petroleum Exploration and Development, 1994,21(3):75-78,131.
[11] SUN J, MA X, KAZI M. Comparison of decline curve analysis DCA with recursive neural networks RNN for production forecast of multiple wells[R]. SPE 190104-MS, 2018.
[12] SAGHEER A, MOSTAFA K. Time series forecasting of petroleum production using deep LSTM recurrent networks[J]. Neurocomputing,2019,323(1):203-213.
[13] 丁帥偉,席怡,劉騫,等.基于粒子群算法的低滲油藏CO2驅油與封存自動優(yōu)化[J].中國石油大學學報(自然科學版),2022,46(4):109-115.
DING Shuaiwei, XI Yi, LIU Qian, et al. An automatic optimization method of CO2 injection for enhanced oil recovery and storage in low permeability reservoirs based on particle swarm optimization algorithm[J]. Journal of China University of Petroleum(Edition of Natural Science),2022,46(4):109-115.
[14] 陳建華,晏慶輝,駱逸婷,等.基于歷史生產(chǎn)數(shù)據(jù)的多層合采井產(chǎn)量劈分新方法[J].中國海上油氣,2022,34(1):110-116.
CHEN Jianhua, YAN Qinghui, LUO Yiting, et al. A historical production data based method for production splitting of multi-layer commingled gas wells[J]. China Offshore Oil and Gas,2022,34(1):110-116.
[15] 高亞軍,唐力輝,王振鵬,等.基于循環(huán)神經(jīng)網(wǎng)絡和數(shù)據(jù)差分處理的油田產(chǎn)量預測方法[J].中國海上油氣,2023,35(3):126-136.
GAO Yajun, TANG Lihui, WANG Zhenpeng, et al. A method for oilfield production prediction based on recurrent neural network and data differential processing[J].China Offshore Oil and Gas,2023,35(3):126-136.
[16] HAMZEH A, HAMID R, NANCY C. Multivariate time series modelling approach for production forecasting in unconventional resources[R]. SPE 201571-MS,2020.
[17] FAN D, SUN H, YAO J, et al. Well production forecasting based on ARIMA-LSTM model considering manual operations[J]. Energy, 2021,220:119708.
[18] CUTHBERT S W N G, ASHKAN J G, MENAD N A. Well production forecast in volve field: application of rigorous machine learning techniques and metaheuristic algorithm[J]. Journal of Petroleum Science and Engineering, 2022,208:109468.
[19] 曹沖,程林松,張向陽,等.基于多變量小樣本的滲流代理模型及產(chǎn)量預測方法[J].力學學報,2021,53(8):2345-2354.
CAO Chong, CHENG Linsong, ZHANG Xiangyang, et al. Permeability surrogate model and production forecasting method based on multivariate small samples[J]. Journal of Mechanics, 2021,53(8):2345-2354.
[20] 韓珊,車明光,蘇旺,等.四川盆地威遠區(qū)塊頁巖氣單井產(chǎn)量預測方法及應用[J].特種油氣藏,2022,29(6):141-149.
HAN Shan, CHE Mingguang, SU Wang, et al. Production forecasting method and application for single well shale gas in Weiyuan block, Sichuan Basin[J] Special Oil and Gas Reservoirs, 2022,29(6):141-149.
[21] 劉合,李艷春,杜慶龍,等.基于多變量時間序列模型的高含水期產(chǎn)量預測方法[J].中國石油大學學報(自然科學版),2023,47(5):103-114.
LIU He, LI Yanchun, DU Qinglong, et al. Prediction of production during high water-cut period based on multivariate time series model[J]. Journal of China University of Petroleum (Edition of Natural Science),2023,47(5):103-114.
[22] AGRAWAL R, IMIELINSKI T, SWAMI A. Mining assocation rules between sets of items in large databases[J]. Acm Sigmod Record, 1993,22(2):207-216.
[23] BREU H, GIL J, KIRKPATRICK D, et al. Linear time euclidean distance algorithms[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 1995, 17(5):529-533.
[24] ORSENIGO C, VERCELLIS C. Dimensionality reduction via isomap with lock-step and elastic measures for time series gene expression classification: Proc of the European Conference on Evolutionary Computation, Machine Learning and Data Mining in Bioinformatics[C].Berlin Heidelberg: Springer, 2013.
[25] 王成成,谷建偉,劉衛(wèi)華,等.基于DTW算法的井間動態(tài)連通性評價[J].中國科技論文,2021,16(5):482-486.
WANG Chengcheng, GU Jianwei, LIU Weihua, et al. Evaluation of dynamic connectivity between wells based on DTW algorithm[J]. Chinese Science and Technology Papers, 2021,16(5):482-486.
[26] YANN L, LEON B, YOSHUA B, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998,86(11):2278-2324.
[27] SCHUSTER M, PALIWAL K K. Bidirectional recurrent neural networks[J]. IEEE Transactions on Signal Processing, 1997,45(11):2673-2681.
[28] GRAVES A. Generating sequences with recurrent neural networks[J]. Ar Xiv,2013:1308.0850.
[29] 夏瑜潞.循環(huán)神經(jīng)網(wǎng)絡的發(fā)展綜述[J].電腦知識與技術,2019,15(21):182-184.
XIA Yulu. A review of the development of recurrent neural networks[J]. Computer Knowledge and Technology, 2019,15(21):182-184.
[30] LI X, XIAO K, LI X, et al. A well rate prediction method based on LSTM algorithm considering manual operations[J]. Journal of Petroleum Science and Engineering, 2022,210:110047.
(編輯 李志芬)
基金項目:山東省自然科學基金項目(ZR2022JQ23);國家自然科學基金優(yōu)秀青年科學基金項目(52122402);國家自然科學基金重大項目(42090024)
第一作者:樊冬艷(1985-),女,副教授,博士,研究方向為非常規(guī)油氣試井及動態(tài)分析方法。E-mail:fandongyan2010@126.com。
通信作者:孫海(1984-),男,教授,博士,博士生導師,研究方向為非常規(guī)油氣滲流理論及流動機制。E-mail:sunhai@upc.edu.cn。
引用格式:樊冬艷,楊燦,孫海,等. 基于時間序列相似性與機器學習方法的頁巖氣井產(chǎn)量預測[J].中國石油大學學報(自然科學版),2024,48(3):119-126.
FAN Dongyan, YANG Can, SUN Hai,et al. Shale gas well production forecasting based on time sequence similarity and machine learning methods[J].Journal of China University of Petroleum(Edition of Natural Science),2024,48(3):119-126.