夏欽鋒
(中石化重慶涪陵頁巖氣勘探開發(fā)有限公司,重慶408014)
近年來,隨著我國頁巖氣勘探開發(fā)的快速推進,我國已經(jīng)成為繼美國和加拿大之后全球第三個開展頁巖氣商業(yè)開發(fā)的國家[1-2]。目前國內(nèi)外學者根據(jù)翁氏模型理論基礎(chǔ),結(jié)合多元線性回歸系數(shù)求解法,對實際頁巖氣生產(chǎn)井進行產(chǎn)能預(yù)測,分析頁巖氣井產(chǎn)量變化規(guī)律[3];謝維楊[4]結(jié)合頁巖氣藏水平井壓裂后產(chǎn)生水力壓裂縫這一情況,建立水力壓裂縫導流的頁巖氣藏水平井后期穩(wěn)定開采的滲流模型;任俊杰等人[5]綜合考慮頁巖氣解吸、擴散和滲流特征,建立頁巖氣藏壓裂水平井產(chǎn)能模型??傮w而言,目前國內(nèi)外學者在研究頁巖氣井產(chǎn)能時,一般采用經(jīng)驗法、解析法和數(shù)值模擬三種方法來預(yù)測頁巖氣井生產(chǎn)規(guī)律,可靠性都不高,不能依據(jù)已有的歷史生產(chǎn)數(shù)據(jù)進行準確的壓力預(yù)測。
在調(diào)產(chǎn)過程中產(chǎn)量發(fā)生變化時,壓力也隨之變化。生產(chǎn)過程中采集的大量數(shù)據(jù)蘊含信息豐富,根據(jù)歷史生產(chǎn)數(shù)據(jù)對氣井的生產(chǎn)壓力進行預(yù)測,對后期持續(xù)開發(fā)和利用有著促進作用。然而調(diào)產(chǎn)過程中產(chǎn)量變化梯度多、調(diào)產(chǎn)周期波動大、歷史數(shù)據(jù)不平衡、生產(chǎn)數(shù)據(jù)具有強非線性[6]、強耦合等特點,導致生產(chǎn)壓力難以預(yù)測。在調(diào)產(chǎn)井中,壓力的遞減趨勢隨產(chǎn)量的變化而發(fā)生改變,不能通過一般模型進行建模[9-10]。
針對上述問題,本文采用FCM 方法對調(diào)產(chǎn)井生產(chǎn)數(shù)據(jù)進行自適應(yīng)聚類,保證數(shù)據(jù)的準確性;再運用Kendall 秩相關(guān)系數(shù)分析法對生產(chǎn)數(shù)據(jù)進行相關(guān)性分析,以確定用于遞歸神經(jīng)網(wǎng)絡(luò)建模的輸入變量;最后分別對每一類數(shù)據(jù)進行建模,形成多模型庫。在壓力預(yù)測時,輸入需要預(yù)測的產(chǎn)量以及歷史數(shù)據(jù),系統(tǒng)將自動識別并調(diào)用其對應(yīng)的模型進行壓力預(yù)測,實現(xiàn)不同產(chǎn)量下的壓力預(yù)測。
通過對原始生產(chǎn)數(shù)據(jù)進行相關(guān)性分析,找出數(shù)據(jù)之間的隱藏特性,從而挖掘出有用的數(shù)據(jù)進行進一步分析。其主要相互影響的參數(shù)有:產(chǎn)量、壓力、水。進行相關(guān)性分析主要分為以下兩個部分:
(1)評價數(shù)據(jù)質(zhì)量的可靠性,包含產(chǎn)量、壓力、水等重要指標。
(2)數(shù)據(jù)相關(guān)性檢驗。依據(jù)典型氣井的生產(chǎn)數(shù)據(jù)分析可知,壓力、產(chǎn)量、水之間有較強的相關(guān)性,通過提取幾組生產(chǎn)數(shù)據(jù)進行相關(guān)性檢驗,其中包括產(chǎn)量-壓力、產(chǎn)量-時間和壓力-時間。
圖1 壓力預(yù)測流程圖
使用Spearman 相關(guān)性分析對生產(chǎn)數(shù)據(jù)進行分析[11],它是利用數(shù)據(jù)的秩進行計算,適用于有序數(shù)據(jù)或不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù),關(guān)聯(lián)值范圍在[-1,1],絕對是越大,表明相關(guān)性越強。先對原始變量的數(shù)據(jù)排秩,根據(jù)秩使用Spearman 相關(guān)系數(shù)公式進行計算,相關(guān)系數(shù)符號表示相關(guān)方向。其計算公式為:
式中,αi是第i 個x 值的秩,βi是第i 個y 值的秩。αˉ、βˉ分別是αi和βi的平均值。
選取涪陵焦石壩區(qū)塊的以下典型井生產(chǎn)數(shù)據(jù),通過上面方法進行數(shù)據(jù)相關(guān)性,其原始生產(chǎn)數(shù)據(jù)如圖2、圖3 所示。
圖2 焦頁24-1HF數(shù)據(jù)圖
圖3 焦頁37-3HF數(shù)據(jù)圖
表1 焦頁24-1HF 相關(guān)性分析結(jié)果
表2 焦頁37-3HF 相關(guān)性分析結(jié)果
根據(jù)圖2、3 和表1、2 可以說明產(chǎn)水量明顯變化時,壓力也發(fā)生變化,壓力變化與產(chǎn)水量之間有著良好的負相關(guān)。該氣井水主要由產(chǎn)氣攜液得到,其水量與得到的氣體是有正相關(guān)性,說明產(chǎn)氣越豐富,得到的水就越多。由于地層存儲豐富,所以產(chǎn)氣量較為豐富,得到的水量也較為充足,從而致使壓力遞減速度比較慢。
模糊C 均值聚類算法(FCM)是用隸屬度確定每個數(shù)據(jù)點屬于某個聚類的程度的一種聚類算法。FCM 把n 個向量xi(i=1,2,…,n)分為c 個模糊組,并求每組的聚類中心,使得非相似性指標的價值函數(shù)達到最小。FCM 用模糊劃分,使得每個給定數(shù)據(jù)點用值在[ ]0,1間的隸屬度來確定其屬于各個組的程度。與引入模糊劃分相適應(yīng),隸屬矩陣U 允許有取值在[ ]0,1 間的元素。不過,規(guī)定一個數(shù)據(jù)集的隸屬度的和總等于1。
那么,F(xiàn)CM 的價值函數(shù)(或目標函數(shù))就是:
這里uij介于[0 ,1] 之間;ci為模糊組I 的聚類中心,dij=‖ ci-xj‖為第i 個聚類中心與第j 個數(shù)據(jù)點間的歐幾里德距離,且m ∈[1,∞)是一個加權(quán)指數(shù)。
構(gòu)造如下新的目標函數(shù),使公式(2)達到最小值的必要條件:
這里λj( j= 1,…,n )是公式(2)的n 個約束式的拉格朗日乘子,對所有輸入?yún)⒘壳髮?,使公式?)達到最小的必要條件為:
和:
由上述兩個必要條件,F(xiàn)CM 算法是一個簡單的迭代過程。在批處理方式運行時,F(xiàn)CM 用下列步驟確定聚類中心ci和隸屬矩陣U:
步驟1:用值在[0 ,1] 間的隨機數(shù)初始化隸屬矩陣U,使其滿足公式(2)中的約束條件;
步 驟 2:用 公 式(5)計 算 c 個 聚 類 中心ci(i=1,2,…,c);
步驟3:根據(jù)公式(3)計算價值函數(shù)。如果它小于某個確定的閾值,或它相對上次價值,函數(shù)值的改變量小于某個閾值,則算法停止;
步驟4:用公式(6)計算新的U 矩陣。返回步驟2。
通過FCM 算法對原始數(shù)據(jù)進行聚類分析,然后把原始數(shù)據(jù)分為我們想要的幾種情況,具體結(jié)果如圖4、圖5 所示,首先根據(jù)每口調(diào)產(chǎn)井產(chǎn)量類型大致設(shè)置需要分類的數(shù)量。
圖4 焦頁24-1HF分類結(jié)果圖(設(shè)置為3類)
圖5 焦頁37-3HF分類結(jié)果圖(設(shè)置為4類)
通過圖4 可以看出,把焦頁24-1HF 井中的產(chǎn)量分為三類,能夠良好地顯示出產(chǎn)量的梯度,從而更好地進行預(yù)測分析。圖5 中焦頁24-1HF 井的數(shù)據(jù)結(jié)構(gòu)較為復(fù)雜,把它分為三類,能夠良好地分出其梯度。
根據(jù)不同的劃分標準,神經(jīng)網(wǎng)絡(luò)可劃分成不同的種類。按連接方式來分主要有兩種:前向神經(jīng)網(wǎng)絡(luò)和反饋(遞歸)神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)以其自身的自組織、自適應(yīng)和自學習的特點,被廣泛應(yīng)用于各個領(lǐng)域,在控制領(lǐng)域?qū)Ψ蔷€性系統(tǒng)的建模與控制的應(yīng)用也發(fā)揮越來大的作用。不過一般采用的前向網(wǎng)絡(luò)所建立的輸入/輸出之間的關(guān)系式往往是靜態(tài)的,而實際應(yīng)用中的被控對象通常都是時變的。因此采用靜態(tài)神經(jīng)網(wǎng)絡(luò)建模就不能準確地描述系統(tǒng)的動態(tài)性能[7]。而Elman 神經(jīng)網(wǎng)絡(luò)不僅可以反映系統(tǒng)動態(tài)特性而且可以存儲信息。網(wǎng)絡(luò)中存在信息的延時,并且具有延時信息的反饋。遞歸網(wǎng)絡(luò)存儲信息的特性來源于網(wǎng)絡(luò)信號的反饋,信號遞歸使得網(wǎng)絡(luò)在某時刻k 的出入狀態(tài)不僅與k時刻的輸入狀態(tài)有關(guān),而且還與k 時刻以前的信號有關(guān),這充分的表現(xiàn)了網(wǎng)絡(luò)系統(tǒng)的動態(tài)性能,非常適用于具有時序性的頁巖氣生產(chǎn)數(shù)據(jù)的建模與預(yù)測[8]。其各層關(guān)系式為:
輸入層:
隱含層:
關(guān)聯(lián)層:
輸出層:
最終采用Elman 神經(jīng)網(wǎng)絡(luò)多模型建模,考慮到每口頁巖氣井整體都有一個下降趨勢,針對這種情況我們不僅對分類結(jié)果分別建立模型,還把所有歷史數(shù)據(jù)也建立了模型,并且將建模結(jié)果保存在數(shù)組中,以便后期預(yù)測使用,如圖6 所示。
圖6 神經(jīng)網(wǎng)絡(luò)建立模型(37-3HF分為4和5類)
其中,Net 表示整體數(shù)據(jù)建立的模型,net 中有4個神經(jīng)網(wǎng)絡(luò)模型,分別對應(yīng)于產(chǎn)量不同的分類結(jié)果建立的模型,最后根據(jù)需要預(yù)測的產(chǎn)量自動調(diào)用模型進行預(yù)測。
設(shè)置需要預(yù)測的產(chǎn)量,以及輸入當前產(chǎn)量下對應(yīng)壓力的歷史數(shù)據(jù),通過識別需要預(yù)測的產(chǎn)量,對應(yīng)找到最符合設(shè)置的產(chǎn)量的模型,調(diào)用模型進行預(yù)測。首先設(shè)置自行選擇預(yù)測天數(shù)功能,操作人員可根據(jù)實際情況選擇需要預(yù)測的天數(shù),并且填入哪種產(chǎn)量下的壓力預(yù)測,導入幾天歷史數(shù)據(jù)方可預(yù)測。在建模時以及預(yù)測時,不僅考慮了氣井壓力整體下降趨勢(對整體建立模型,將預(yù)測結(jié)果作為局部模型的輸入)以及各生產(chǎn)因素之間的相互影響,而且充分考慮當天生產(chǎn)壓力與歷史生產(chǎn)壓力的關(guān)系(歷史4 天預(yù)測第五天)。當輸入產(chǎn)量為100000 時(37-3HF),需要預(yù)測的天數(shù)設(shè)置為5,分類數(shù)設(shè)置為5 時,選取為經(jīng)過訓練的歷史真實數(shù)據(jù)如表3。
表3 37-3HF 真實值與預(yù)測值對比表
從表3 可以看出,采用Spearman 相關(guān)性分析對歷史數(shù)據(jù)之間進行相關(guān)性分析后,在運用FCM 算法分類得到的幾類歷史數(shù)據(jù),分別建立Elman 模型,針對不同產(chǎn)量下,預(yù)測得到的值非常接近真實值,有良好的預(yù)測結(jié)果,可供工作人員在后續(xù)調(diào)產(chǎn)中提供可靠的依據(jù)。
從圖7 可以看出,調(diào)產(chǎn)井37-3HF 在不同類別和不同產(chǎn)量的情況下,采用Elman 神經(jīng)網(wǎng)絡(luò)針對每一類的局部模型進行預(yù)測時,通過對預(yù)測輸出值與當天真實數(shù)據(jù)對比可以看出,預(yù)測精度可以達到預(yù)期效果。而BP 神經(jīng)網(wǎng)絡(luò)不能通過擬合歷史數(shù)據(jù)得到良好的模型進行預(yù)測,誤差較大,僅適用于定產(chǎn)井的預(yù)測。
當輸入產(chǎn)量為100000 時(24-1HF),需要預(yù)測的天數(shù)設(shè)置為5,分類數(shù)設(shè)置為3 時,選取為經(jīng)過訓練的歷史真實數(shù)據(jù)如表4。
表4 24-1HF 真實值與預(yù)測值對比表
圖7 Elman神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果及誤差(37-3HF)
圖8 Elman神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果及誤差(24-1HF)
從表4 可以看出,采用Spearman 相關(guān)性分析對歷史數(shù)據(jù)之間進行相關(guān)性分析后,在運用FCM 算法分類得到的幾類歷史數(shù)據(jù),分別建立Elman 模型,針對不同產(chǎn)量下,預(yù)測得到的值非常接近真實值,有良好的預(yù)測結(jié)果,可供工作人員在后續(xù)調(diào)產(chǎn)中提供可靠的依據(jù)。
從圖8 可以看出,調(diào)產(chǎn)井24-1HF 在不同分類、產(chǎn)量的情況下,利用Elman 神經(jīng)網(wǎng)絡(luò)每一類的局部模型進行預(yù)測時,通過對神經(jīng)網(wǎng)絡(luò)預(yù)測輸出與實際數(shù)據(jù)對比可以看出,預(yù)測精度可以達到預(yù)期的效果。而BP 神經(jīng)網(wǎng)絡(luò)不能通過擬合歷史數(shù)據(jù)得到良好的模型進行預(yù)測,誤差較大,僅適用于定產(chǎn)井的預(yù)測。
本文提出了一種適用于頁巖氣調(diào)產(chǎn)井生產(chǎn)數(shù)據(jù)預(yù)處理的方法,通過FCM 算法把不同產(chǎn)量進行了分類,消除了異常數(shù)據(jù)對Elman 神經(jīng)網(wǎng)絡(luò)建模的影響;從而構(gòu)造良好的神經(jīng)網(wǎng)絡(luò)模型進行預(yù)測,與傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)相比,提高了預(yù)測精度;但在網(wǎng)絡(luò)收斂速度上仍有改進空間。
本文方法適用于涪陵焦石壩頁巖氣調(diào)產(chǎn)井,在模型精度優(yōu)化上,還需要對神經(jīng)網(wǎng)絡(luò)建模做進一步改進,仍需要考慮到頁巖氣生產(chǎn)壓力受多種因素影響,開發(fā)實踐中,需要充分考慮產(chǎn)量、水、油壓、套壓等各方面的影響,同時盡量保證數(shù)據(jù)的準確性與真實性,這樣方可建立相對準確的生產(chǎn)壓力模型,以提高評價精度。