曹勝昌,邢蘭昌,魏 偉2,韓維峰2,牛佳樂
(1.中國石油大學(華東)控制科學與工程學院,山東 青島 266580)(2.中國石油勘探開發(fā)研究院新能源研究所,河北 廊坊 065007)
天然氣水合物又稱為“可燃冰”,是一種新型優(yōu)質的潛在能源,是在低溫、高壓等條件下形成的一種類冰狀、具有籠形結構的固態(tài)化合物[1-2],通常分布在大陸永久凍土帶和海洋沉積物中,具有非常巨大的能源和經濟價值[3-4]。天然氣水合物飽和度是水合物儲層評價的主要參數之一,為認識水合物富集成藏規(guī)律、估算水合物資源量提供了必要的基礎參數[5-7]。
水合物飽和度是含水合物沉積物電學特性的直接影響因素之一。周錫唐等[8]研究了甲烷水合物生成與分解過程中電導性的變化,實驗結果表明電阻隨石英砂中水合物生成量的增加而增大,隨水合物的分解而急速減小,通過參考溫度和壓力的同步變化特征證明了使用電導性來監(jiān)測甲烷水合物生成與分解過程的可靠性。陳玉鳳等[9-10]研究了南海沉積物中甲烷水合物飽和度與電阻率的關系,發(fā)現(xiàn)在水合物生成過程中,其電阻率會隨著水合物飽和度的增加而增大,而且含水合物沉積物存在非阿爾奇現(xiàn)象,其飽和度指數隨水合物飽和度的增加而增加。
基于電學特性參數計算含水合物飽和度的模型主要有阿爾奇公式、含泥質修正的阿爾奇公式、印度尼西亞公式和雙水模型等,其中阿爾奇公式和含泥質修正的阿爾奇公式被廣泛應用[11-13]。Riedel等[14]通過分析不同地區(qū)的測井數據,得到了不同的阿爾奇公式經驗參數并估算了水合物的飽和度,指出不同地區(qū)阿爾奇公式經驗參數的差異會導致水合物飽和度預測結果的不同。Spangenberg等[15-17]首先從理論上研究了水合物含量對體系電阻率性質的影響,之后采用溶解氣在均勻玻璃珠內開展了甲烷水合物生成實驗,測量結果顯示電阻率增大系數與含水飽和度之間的關系不能用恒定飽和度指數的阿爾奇公式來描述。含水合物沉積物的電學性質受到沉積物孔隙結構、孔隙水化學成分及濃度、孔隙度、飽和度、溫度等多種因素的影響,水合物飽和度與電學性質參數呈現(xiàn)出顯著的復雜非線性、多值對應關系,以阿爾奇公式為代表的經驗公式的適用性受到極大局限。
神經網絡具有強大的處理復雜非線性問題的能力以及高度自學習和自適應的能力,運用神經網絡來建立預測模型成為一種有潛力的水合物飽和度計算方法。呂琳[18]等人在使用地球物理測井數據預測儲量參數方法的基礎上,選用中子測井、密度測井等8種測井數據作為BP神經網絡的輸入量,預測了天然氣水合物的儲量參數(孔隙度、飽和度),結果表明該模型計算結果的精度高于傳統(tǒng)的經驗公式。陸敬安[19]等利用神狐海域某井的電阻率測井數據作為樣本訓練并建立了徑向基神經網絡模型,利用該模型計算出另一口井的水合物飽和度,其計算結果與現(xiàn)場孔隙水分析得到的飽和度值相吻合?,F(xiàn)有的研究存在以下問題:(1)僅僅利用單個神經網絡建立天然氣水合物飽和度的計算模型,模型的可靠性有待進一步驗證與提高;(2)神經網絡的輸入參數缺少必要的預處理,導致神經網絡模型的準確度受到限制。
本文提出基于集成神經網絡方法建立一種以電阻抗譜特性參數為特征向量的水合物飽和度軟測量模型,即將不同頻率的阻抗模值作為單個BP神經網絡的輸入,通過對不同位置傳感器所對應的子網絡輸出進行集成,建立基于集成BP神經網絡的水合物飽和度計算模型。
采用了自主設計的天然氣水合物電學探測實驗裝置開展實驗工作。實驗裝置的總體結構如圖1所示,該裝置分為環(huán)境模擬部分和測試部分。環(huán)境模擬部分包括耐高壓反應釜、低溫冷卻系統(tǒng)、天然氣氣瓶、中間儲氣罐、軸壓系統(tǒng)等,可以模擬出天然氣水合物的生成分解所需的溫度和壓力條件、提供充足的氣源以及必要的存儲空間等;測試部分主要包括電學傳感器、溫度傳感器、壓力傳感器、電學測試單元、溫度測試單元、壓力測試單元、工控機及測試軟件,能夠實時獲取反映水合物生成分解過程動態(tài)變化的實驗數據。
圖1 實驗裝置總體結構
天然氣水合物在反應釜內呈現(xiàn)出空間不均勻分布的特性,為了獲取水合物的空間分布信息,將電學傳感器分為上下兩層均勻安置在反應釜壁,每一層安裝8個傳感器(如圖2所示),采用分時輪流工作模式控制各傳感器的工作狀態(tài)。
圖2 單層傳感器排列方式圖
利用上述裝置開展了甲烷水合物生成分解模擬實驗,分析了多孔介質(粒徑50~180 μm的天然海沙)中甲烷水合物生成和分解過程中電學特性的變化規(guī)律,以及水合物飽和度對含水合物的多孔介質的電學特性影響,在此基礎上利用阻抗模值等特征參數建立起特征參數與飽和度之間的軟測量模型。
實驗獲得的阻抗譜包括了從1 Hz~10 MHz范圍內的22個頻率點,但由于系統(tǒng)誤差、環(huán)境干擾等因素影響,其中一些頻率點的數據會出現(xiàn)較大的無規(guī)律波動和明顯偏差,經過篩選、剔除等步驟對數據進行選擇。最終選擇出5 Hz、10 Hz、20 Hz、100 Hz、200 Hz、500 Hz、1 kHz、2 kHz、4 kHz、10 kHz、20 kHz、40 kHz等12個頻率點作為特征頻率點,以這些測試頻率點的阻抗模值作為備選的特征參數。
上述特征頻率點的原始數據中往往存在噪聲值、缺失值以及離群點等情況,不能直接用于軟測量模型的建立與測試,因此需要對原始數據進行預處理。數據預處理主要針對數據在數值上的各種異常情況進行處理。本文中數據預處理所采用的步驟為:數據離群點修正處理、數據去噪處理和數據歸一化處理。
數據離群點修正處理針對原始數據中遠離一般水平的極端大值和極端小值,采用均值插補修正法,根據數據曲線的整體趨勢對數據進行估計值的修改,即用異常值數據所處位置左右相鄰兩個數據的平均值來替代異常值。本文采用小波去噪和滑動平均濾波去噪相結合的方式對數據進行去噪處理,以便獲得更好的去噪效果。數據歸一化處理將原始數據映射到0~1范圍之內,如式(1):
(1)
確定特征頻率點后,需要針對每組傳感器對在多頻率下的阻抗模值進行特征提取,即降維處理。通常神經網絡輸入為多維數據,計算復雜度隨著數據維數的增大成指數增加[20],數據維數過大會導致網絡訓練時間大大增加,也會導致訓練后的神經網絡性能變差。
本文采用主成分分析法(PCA)進行降維處理,消除不同頻率間阻抗模值之間的相關性,降低網絡輸入的維數、精簡網絡的結構,采用累計貢獻度達到99%的主成分作為神經網絡的輸入。
2.3.1 水合物飽和度計算
在甲烷水合物模擬實驗中,基于耗氣量原理計算水合物飽和度,即利用實時采集的反應釜內溫度和壓力數據并結合式(2)進行計算:
(2)
式中,Sh為水合物飽和度;P1為反應釜內初始壓力;P2為水合物生成分解過程中反應釜內壓力;T1為反應釜內初始溫度,T2為水合物生成分解過程中反應釜內溫度;Z1和Z2為對應壓力溫度條件下的氣體壓縮因子;Vg為反應釜氣相體積;Mh為水合物摩爾質量,122.02 g/mol;R為氣體常數,8.314 J/(mol·K);ρh為水合物的密度,0.91 g/mL;Vp為多孔介質孔隙的體積。圖3為一輪典型實驗中水合物生成分解過程中溫度、壓力以及水合物飽和度的變化曲線。
在水合物生成分解過程中,上層1-5傳感器對在部分特征頻率點(20 Hz、200 Hz、2 kHz、20 kHz)下的阻抗模值隨水合物飽和度變化的關系如圖4所示。通過分析阻抗模值參數與飽和度參數之間的關系可以發(fā)現(xiàn),阻抗模值隨著飽和度的增加逐漸增大,呈現(xiàn)出顯著的非線性。
圖4 特征頻率點下阻抗模值隨水合物飽和度的變化圖
2.3.2 劃分樣本集
為了得到高效的神經網絡模型,使之能夠有效地逼近訓練樣本所蘊含的內在規(guī)律,需要將數據集劃分為訓練集和測試集。本文采用2/3的樣本作為訓練樣本來訓練網絡,1/3的樣本作為測試樣本來測試網絡,采用等間隔的方式從總樣本集中取出。
本文基于BP神經網絡建立水合物飽和度軟測量模型。設計步驟如下:1)確定BP子神經網絡最優(yōu)隱含層節(jié)點數,進而確定最優(yōu)網絡結構和訓練參數;2)訓練并測試子神經網絡,根據多種誤差指標評價網絡性能;3)采用平均法集成策略,建立集成BP神經網絡的水合物飽和度軟測量模型。
神經網絡理論證明,一個三層結構的BP網絡可實現(xiàn)任意m維到n維的映射,并且通過調整隱含層神經元的個數來調節(jié)網絡的精度[21]。因此,本文選用三層BP神經網絡。網絡的輸入為一組傳感器對在不同測試頻率下的阻抗模值,輸出為水合物飽和度。隱含層節(jié)點數的確定過程中參考式(3):
(3)
式中,L為隱含層節(jié)點數,n為輸入層節(jié)點數,m為輸出層節(jié)點數,a為1~10內的常數。
在分析評價網絡的性能時采用以下4種誤差指標[22]:相對誤差(RE)反映測量結果偏離真值的實際大??;平均相對誤差(MRE)反映誤差的相對值,效果直觀;平均絕對誤差(MAE)反映預測值誤差的實際情況;均方根誤差(RMSE)反映網絡預測值相對于實際值的平均離散程度。通過分析比較以上誤差,可以確定更加合理地隱含層節(jié)點數。
在網絡訓練時,本文中隱含層的激活函數采用正切Sigmoid函數(tansig),其輸入值可取任意值,輸出值在-1~+1之間;輸出層的激活函數采用線性函數(purelin),其輸入值與輸出值可取任意值;網絡學習方法采用動量梯度下降法(traingdm),該方法不但具有較高收斂速度,而且通過引入一個動量項可以避免局部極小問題。
以上層1-5傳感器對為例(參見圖2),將隱含層節(jié)點數L取值由4增加到13,分別對不同隱含層節(jié)點數的網絡進行500次訓練和測試,通過分析比較網絡誤差來獲得最優(yōu)隱含層節(jié)點數。表1所示為500次測試誤差的平均結果,各種誤差指標的整體趨勢為先減小后增大,普遍存在一個最小值。當L=9時,平均相對誤差和均方根誤差兩項指標達到最優(yōu)值,雖然沒有實現(xiàn)全部指標都達到最優(yōu)值,但此時指標取值與最優(yōu)值相差較小。綜合考慮,隱含層節(jié)點數設為9,從而獲得針對上層1-5傳感器對的水合物飽和度計算模型。采用同樣的方法,根據表2、表3和表4的網絡測試誤差來確定針對2-6、3-7、4-8等傳感器對的網絡模型最優(yōu)隱含層節(jié)點數,分別為9、10和10。
表1 上層1-5傳感器對不同隱含層節(jié)點數網絡測試誤差表
表2 上層2-6傳感器對不同隱含層節(jié)點數網絡測試誤差表
表3 上層3-7傳感器對不同隱含層節(jié)點數網絡測試誤差表
表4 上層4-8傳感器對不同隱含層節(jié)點數網絡測試誤差表
將訓練樣本和測試樣本分別輸入上文所建立的具有最優(yōu)結構和最佳性能的4個網絡模型,進行訓練和測試后得到如5所示的測試結果,誤差統(tǒng)計列于表5。4個網絡模型的平均相對誤差|RE|<6%,平均絕對誤差MAE<0.004,均方根誤差RMSE<13%。
圖5 4個子網絡模型的輸出值與實際值比較
表5 各個子網絡測試誤差統(tǒng)計
集成學習是指使用多個學習器對同一個問題進行學習,再使用某種策略將各個學習器進行集合,從而獲得更優(yōu)學習效果的機器學習方法。本文將以上所建立的4個子網絡進行集成,以期獲得性能更優(yōu)的軟測量模型。
當集成神經網絡用于回歸估計時,集成的輸出通常由各網絡的輸出通過簡單平均或者加權平均產生[25],即對各個學習器的輸出結果求平均值,進而得到最終的預測結果,但是由于采用加權平均可能會導致過度擬合,從而使集成網絡模型的泛化能力降低,因此本文選用簡單平均法作為集成策略。圖6中,ZTi表示通過不同傳感器對測量得到的阻抗模值,BP-Ti表示對應不同傳感器對的子網絡。
圖6 集成網絡模型結構示意圖
圖7和圖8所示為集成網絡模型的測試結果。與獨立的子網絡相比(表5所示),利用集成網絡模型對飽和度進行預測時誤差更小。集成神經網絡的平均相對誤差MRE為3.33%、平均絕對誤差MAE為0.001 4、均方根誤差RMSE為6.56%,三項誤差指標均低于各個子網絡的預測誤差。集成神經網絡的輸入包含了通過4對傳感器(位于4個測量方位)所獲得的阻抗值,更多的信息量以及有效的集成策略對于提升預測模型的預測準確度提供了前提。
圖7 集成網絡模型預測輸出
圖8 集成網絡預測值相對誤差
針對沉積物中含天然氣水合物飽和度的計算問題,提出了一種基于電阻抗特性參數和集成神經網絡的軟測量模型建立方法。開展了甲烷水合物模擬實驗并獲取了電阻抗譜、溫度和壓力數據,在對電阻抗譜數據進行預處理、特征參數提取和選擇之后形成了樣本集,針對4對傳感器分別設計了BP神經網絡,繼而將4個BP網絡作為子網絡進行集成得到集成網絡模型。模型測試結果表明:通過集成網絡模型計算得到的含水合物飽和度值平均相對誤差3.33%、平均絕對誤差0.001 4、均方根誤差為6.56%,三項誤差指標均低于各個子網絡的計算誤差。
通過在寬頻范圍內對含水合物沉積物進行電阻抗譜測試,能夠獲得沉積物的頻率響應特性以及特性描述參數(如不同頻率條件下的阻抗模值),從而能夠為神經網絡模型提供大量的輸入信息。利用集成神經網絡能夠綜合應用位于不同測量方位的多個傳感器的測量數據,通過采用適合的集成策略能夠克服水合物空間分布不均勻對飽和度計算準確度的不利影響。
基于集成神經網絡的軟測量模型能夠接受多維度、豐富的輸入信息,非常適合于解決復雜沉積物中含水合物飽和度的評價問題,下一步將在擴大飽和度范圍的基礎上,聯(lián)合應用聲學特征參數和電學特征參數作為模型的輸入,以期獲得更加可靠、精確的飽和度評價結果。