王 維 強(qiáng)
(1.自然資源部 地?zé)崤c干熱巖勘查開發(fā)技術(shù)創(chuàng)新中心,河北 石家莊 050061; 2.中國(guó)地質(zhì)科學(xué)院 水文地質(zhì)環(huán)境地質(zhì)研究所,河北 石家莊 050061)
在油氣勘探開發(fā)中,利用地震和測(cè)井資料對(duì)儲(chǔ)層參數(shù)進(jìn)行準(zhǔn)確預(yù)測(cè)是非常關(guān)鍵的。人工產(chǎn)生的地震波通過地下傳播,且在地面接收的地震數(shù)據(jù)中包含了油氣儲(chǔ)層的物性參數(shù)、流體性質(zhì)等特征信息,將地震數(shù)據(jù)中的這些特征信息通過地震屬性提取出來,并通過數(shù)學(xué)或統(tǒng)計(jì)學(xué)方法,計(jì)算出兩者之間存在的線性或非線性關(guān)系[1],為儲(chǔ)層預(yù)測(cè)與評(píng)價(jià)提供科學(xué)依據(jù)。由于地震屬性的種類繁多,需要通過屬性優(yōu)化技術(shù)優(yōu)選出盡可能少的對(duì)儲(chǔ)層巖性及儲(chǔ)層參數(shù)最敏感的屬性組合[2]。目前的屬性優(yōu)化技術(shù)[3-5]主要包括主成分分析法、綜合參數(shù)法、獨(dú)立分量分析法(ICA)等。其中,在ICA理論基礎(chǔ)上發(fā)展出一種新的非線性結(jié)構(gòu)的核獨(dú)立分量分析(KICA)技術(shù)[6],該技術(shù)構(gòu)建了一種非線性函數(shù)空間,并在非線性函數(shù)空間中利用Mercer再生核方法,能從高斯及非高斯混合信號(hào)中提取出反映獨(dú)立源信息的高階統(tǒng)計(jì)特性信息,故利用KICA技術(shù),能從大量的屬性數(shù)據(jù)中有效提取出與儲(chǔ)層物性參數(shù)、流體性質(zhì)等相關(guān)的特征源信息。
目前常利用逐步回歸分析、移動(dòng)平滑法、灰色系統(tǒng)模型法、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等技術(shù)[7],將地震屬性及測(cè)井?dāng)?shù)據(jù)作為輸入,對(duì)儲(chǔ)層參數(shù)進(jìn)行預(yù)測(cè)與評(píng)價(jià)。其中,支持向量機(jī)技術(shù)能夠克服其他方法對(duì)于樣本數(shù)目的限制,對(duì)于樣本數(shù)目少、多維度、局部最小的非線性及線性系統(tǒng)均能很好適應(yīng)。因此,本文綜合兩者的優(yōu)點(diǎn),通過KICA技術(shù)優(yōu)選出與儲(chǔ)層參數(shù)最敏感的屬性組合,并利用少量已知井資料,通過支持向量機(jī)技術(shù)預(yù)測(cè)出整個(gè)研究區(qū)的儲(chǔ)層參數(shù)特征。
ICA技術(shù)[8]能從獨(dú)立源信號(hào)線性混合的多維觀測(cè)信號(hào)中分離出源信號(hào),該技術(shù)利用線性變換后的非高斯型最大化來實(shí)現(xiàn)盲源分離,數(shù)學(xué)模型為x=As,其中x是觀測(cè)向量,A是一個(gè)非奇異的混合矩陣,s是N維的源信號(hào)。ICA技術(shù)要解決的問題是尋找潛在分離矩陣B,該分離矩陣通過關(guān)系y=Bx,使得估計(jì)出的信號(hào)之間相互統(tǒng)計(jì)獨(dú)立最大化,其中y為源信號(hào)s的最優(yōu)估計(jì)[9]。
ICA技術(shù)是一種線性變換技術(shù),且使用前提是混合信號(hào)中最多包含一個(gè)高斯分布的源信號(hào),因此在該技術(shù)基礎(chǔ)上,發(fā)展了KICA技術(shù),該技術(shù)通過構(gòu)建一個(gè)非線性函數(shù)空間,并使用Mercer再生核方法[10],不僅能夠適應(yīng)高斯及非高斯分布等多種信號(hào)混合情況,而且能夠更好地適用于復(fù)雜的非線性結(jié)構(gòu)的盲源分離。以下為KICA技術(shù)的基本思路[11]:
1)輸入原始m維數(shù)據(jù)信號(hào)t1,t2,…,tm,并給出核函數(shù)k(t,s);
2)對(duì)輸入的信號(hào)做均值化及球化處理;
3)求出初始獨(dú)立分量s1,s2,…,sn的Gram核矩陣,且si=Kti;
4)定義γ(G1,G2,…,Gm)為下列方程的最大特征值:
(1)
支持向量機(jī)基于統(tǒng)計(jì)學(xué)理論——VC維理論[12],該技術(shù)還采用了結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則[13],能夠不受神經(jīng)網(wǎng)絡(luò)對(duì)于樣本數(shù)目的約束,對(duì)于樣本數(shù)目少、多維度、局部最小的非線性及線性系統(tǒng)均能很好適應(yīng),下面對(duì)最小二乘支持向量機(jī)(LS_SVM)技術(shù)的基本原理介紹如下。
假設(shè)輸入數(shù)據(jù){(ui,pi)|ui∈Rn,pi∈Rn,i=1,2,…,n}。通過φ(u)將輸入數(shù)據(jù)轉(zhuǎn)換為高維特征空間,然后在高維特征空間設(shè)置如下函數(shù):
p=wTφ(u)+h,
(2)
利用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,通過引進(jìn)松弛變量ei,得出優(yōu)化等式,最后通過相匹配的拉格朗日函數(shù),對(duì)其求最小值,得出如下線性方程組:
(3)
式中:p=[p1…pn]T;In∈RN;Ω=K(ui,uj),為核函數(shù)。從而LS_SVM的估計(jì)函數(shù)為:
(4)
研究表明地下儲(chǔ)層結(jié)構(gòu)及構(gòu)造、儲(chǔ)層流體及參數(shù)等特征可作為盲源分離的獨(dú)立源信號(hào),由地面接收的地震信號(hào)中的振幅、相位、頻率等屬性信息就是這些獨(dú)立源信號(hào)的線性或非線性組合。基于上述前提,本文儲(chǔ)層參數(shù)預(yù)測(cè)技術(shù)的實(shí)現(xiàn)原理如下:提取與目標(biāo)儲(chǔ)層可能相關(guān)的沿層地震屬性集,將地震屬性集與儲(chǔ)層參數(shù)進(jìn)行相關(guān)性分析,去除冗余的地震屬性;再利用極差標(biāo)準(zhǔn)化技術(shù)對(duì)地震屬性數(shù)據(jù)作標(biāo)準(zhǔn)化處理,利用中值濾波技術(shù)去除地震屬性數(shù)據(jù)中的異常噪聲,利用主成分分析法對(duì)地震屬性數(shù)據(jù)進(jìn)行降維處理,分離出地震屬性集的幾個(gè)主成分,進(jìn)一步去除屬性間冗余相關(guān)的部分,最后利用ICA及KICA技術(shù)對(duì)降維后的地震屬性進(jìn)行屬性優(yōu)化,提取出相互統(tǒng)計(jì)獨(dú)立的與儲(chǔ)層物性參數(shù)、流體性質(zhì)等相關(guān)的特征源信息,為下一步儲(chǔ)層參數(shù)預(yù)測(cè)提供有效的屬性體集合。
經(jīng)ICA及KICA屬性優(yōu)化后的數(shù)據(jù)體與儲(chǔ)層參數(shù)存在直接的復(fù)雜關(guān)系[14],可利用機(jī)器學(xué)習(xí)算法,再結(jié)合工作區(qū)已有的石油井中的儲(chǔ)層物性信息,建立二者之間的定量關(guān)系,進(jìn)而預(yù)測(cè)出整個(gè)工作區(qū)的儲(chǔ)層物性參數(shù)特征。本研究分別通過徑向基神經(jīng)網(wǎng)絡(luò)與最小二乘支持向量機(jī)經(jīng)過模型試算及實(shí)例分析進(jìn)行儲(chǔ)層預(yù)測(cè)研究。圖1為基于地震屬性的儲(chǔ)層參數(shù)預(yù)測(cè)技術(shù)流程(預(yù)處理中的屬性壓縮采用主成分分析法)。
圖2為一個(gè)儲(chǔ)層厚度和速度參數(shù)在橫向上變化的丘狀體地質(zhì)模型。圖3為該丘狀體模型的正演地震記錄(共計(jì)200道)。首先進(jìn)行屬性提取工作,提取出與丘狀體儲(chǔ)層參數(shù)(厚度、速度)最相關(guān)的地震屬性集合(對(duì)屬性經(jīng)相關(guān)性分析后,初步確定6種地震屬性),主要包括:反射強(qiáng)度屬性、L2模、自相關(guān)函數(shù)主瓣面積之比屬性、波形正半周面積、均方根振幅屬性、全譜平均頻率屬性。然后對(duì)該屬性集做預(yù)處理工作:分別利用極差規(guī)范化及主成分分析進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化及數(shù)據(jù)降維。再通過ICA與KICA對(duì)降維后的屬性體開展屬性優(yōu)化,以得到直接反映儲(chǔ)層的獨(dú)立源信息。
圖2 丘狀體地質(zhì)模型 圖3 丘狀體地質(zhì)模型的合成地震記錄 Fig.2 Geological model of domal bodies Fig.3 Synthetic seismogram of domal bodies
將先驗(yàn)信息即儲(chǔ)層厚度、速度及ICA與KICA優(yōu)化后的屬性體作為學(xué)習(xí)樣本,其中儲(chǔ)層厚度的學(xué)習(xí)樣本采用地震記錄第1、21、41、61、81、101、121、141、161、181、200道處的厚度樣本分別為132.45、145.65、174.85、212.1、242.45、280、277.4、229.5、178.25、126、92.45 m,對(duì)應(yīng)的速度樣本分別為5 300、5 300、5 300、5 300、5 000、5 000、5 000、5 400、5 400、5 600、5 600 m/s,優(yōu)化后得到兩組優(yōu)化屬性作為地震屬性學(xué)習(xí)樣本,分別為[0.0735、-0.2355、-0.5382、-0.8533、-1.2067、-1.5378、-1.8762、-2.2171、-2.5824、-3.0326、-3.2275],[-1.9519、-2.7686、-3.7203、-4.4063、-4.2635、-4.6002、-4.7815、-4.9069、-4.5093、-2.2766、-1.8109],優(yōu)化后的屬性無具體量綱。
分別利用徑向基神經(jīng)網(wǎng)絡(luò)及最小二乘支持向量機(jī)技術(shù),學(xué)習(xí)出屬性數(shù)據(jù)與儲(chǔ)層參數(shù)之間的非線性關(guān)系,最終預(yù)測(cè)出整個(gè)研究區(qū)的儲(chǔ)層厚度與速度的分布情況,如圖4、5、6、7所示。
圖4 經(jīng)ICA屬性優(yōu)化及神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的儲(chǔ)層厚度(a)與速度(b)Fig.4 Prediction of reservoir thickness(a) and velocity(b) based on ICA attribute optimization and neural network
圖5 經(jīng)KICA屬性優(yōu)化及神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的儲(chǔ)層厚度(a)與速度(b)Fig.5 Prediction of reservoir thickness(a) and velocity(b) based on KICA attribute optimization and neural network
圖6 經(jīng)ICA屬性優(yōu)化及支持向量機(jī)預(yù)測(cè)的儲(chǔ)層厚度(a)與速度(b)Fig.6 Prediction of reservoir thickness(a) and velocity(b) based on ICA attribute optimization and SVM
圖7 經(jīng)KICA屬性優(yōu)化及支持向量機(jī)預(yù)測(cè)的儲(chǔ)層厚度(a)與速度(b)Fig.7 Prediction of reservoir thickness(a) and velocity(b) based on KICA attribute optimization and SVM
通過模型試算得出,本研究中的屬性優(yōu)化技術(shù)及機(jī)器算法均能較好地?cái)M合出儲(chǔ)層的厚度、速度參數(shù)。其中,對(duì)于屬性優(yōu)化技術(shù),KICA要好于ICA的最終儲(chǔ)層速度與厚度擬合精度;對(duì)于儲(chǔ)層參數(shù)預(yù)測(cè)的機(jī)器算法,最小二乘支持向量機(jī)要優(yōu)于神經(jīng)網(wǎng)絡(luò)的儲(chǔ)層速度與厚度擬合精度;且經(jīng)KICA屬性優(yōu)化及最小二乘支持向量機(jī)擬合精度最高,符合預(yù)期效果。同時(shí), 支持向量機(jī)基于統(tǒng)計(jì)學(xué)的VC維理論,且采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則 ,不受神經(jīng)網(wǎng)絡(luò)對(duì)于樣本數(shù)目的約束,適用于已知資料較少的區(qū)域,下節(jié)將通過實(shí)例以驗(yàn)證其實(shí)際應(yīng)用效果。
運(yùn)用屬性優(yōu)化的LS_SVM方法對(duì)某研究區(qū)侏羅系的地震資料開展了儲(chǔ)層孔隙度參數(shù)預(yù)測(cè)。研究區(qū)位于階梯狀斷裂的構(gòu)造帶上,油氣藏類型為侏羅系礁灘型油氣藏(以氣藏為主),目的層主要為碳酸鹽巖(以生物礁灰?guī)r為主),該儲(chǔ)層的儲(chǔ)集性能好,灰?guī)r骨架空隙、顆粒溶孔發(fā)育,且儲(chǔ)層的厚度普遍發(fā)育較厚,由于儲(chǔ)層的速度與孔隙度之間存在直接的聯(lián)系,因此,利用本研究的儲(chǔ)層參數(shù)預(yù)測(cè)技術(shù)來預(yù)測(cè)儲(chǔ)層的孔隙度。
首先沿該目的儲(chǔ)層提取與孔隙度相關(guān)的地震屬性共計(jì)6個(gè),具體為均方根振幅屬性、平均反射強(qiáng)度屬性、主頻、全譜平均頻率屬性、平均瞬時(shí)頻率屬性、能量半時(shí)屬性。然后對(duì)提取的屬性進(jìn)行預(yù)處理,分別對(duì)屬性利用極差規(guī)范化及主成分分析進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化及數(shù)據(jù)降維處理,降維后屬性體為3個(gè),對(duì)降維后的屬性體通過屬性優(yōu)化技術(shù)提取出直接反映地下儲(chǔ)層特征的獨(dú)立源信息。優(yōu)化后得出3個(gè)屬性分量,文中只顯示其中有意義的2個(gè)分量,再根據(jù)已知地質(zhì)資料,通過優(yōu)化后的屬性幫助解釋人員進(jìn)行生物礁儲(chǔ)層預(yù)測(cè)工作(如圖8、9所示),屬性分量1反映的是生物礁灰?guī)r儲(chǔ)層特征,屬性分量2反映的是非礁體儲(chǔ)層特征。對(duì)比結(jié)果可見,兩種屬性優(yōu)化方法得出的分量1都較好地反映出了生物礁儲(chǔ)層的展布特征,且KICA屬性優(yōu)化結(jié)果對(duì)生物礁的展布更加清晰、準(zhǔn)確,經(jīng)ICA屬性優(yōu)化的儲(chǔ)層特征中并沒有預(yù)測(cè)出23井周圍的生物礁體,而經(jīng)KICA屬性優(yōu)化的儲(chǔ)層特征中,不僅清楚反映出23井處的生物礁體形態(tài)特征,而且也精確且更加細(xì)致地預(yù)測(cè)出了21井、22井周圍的生物礁儲(chǔ)層展布特征。
a—屬性分量1;b—屬性分量2a—attribute component 1;b—attribute component 2圖8 經(jīng)ICA屬性優(yōu)化的儲(chǔ)層特征Fig.8 Reservoir characteristics optimized by ICA attributes
a—屬性分量1;b—屬性分量2a—attribute component 1;b—attribute component 2圖9 經(jīng)KICA屬性優(yōu)化的儲(chǔ)層特征Fig.9 Reservoir characteristics optimized by KICA attributes
表1為研究區(qū)中已知的10口井中目的層處的平均孔隙度值。通過已知孔隙度及相應(yīng)井旁道處優(yōu)化的地震屬性,利用機(jī)器學(xué)習(xí)技術(shù),建立優(yōu)化屬性體及孔隙度之間的定量關(guān)系,并利用該關(guān)系對(duì)全區(qū)進(jìn)行平均孔隙度預(yù)測(cè)。然而研究區(qū)中已知井?dāng)?shù)量有限,這里將III-1及21號(hào)作為驗(yàn)證井,其他井為學(xué)習(xí)井。最終儲(chǔ)層平均孔隙度預(yù)測(cè)情況如表2所示。
表1 已知井位的孔隙度值
表2 平均孔隙度預(yù)測(cè)結(jié)果
從平均孔隙度預(yù)測(cè)結(jié)果可以看出,由于井的數(shù)量太少,神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的誤差較大。而LS_SVM技術(shù)則具有較高預(yù)測(cè)精度,表明LS_SVM技術(shù)能夠解決少井的情況,神經(jīng)網(wǎng)絡(luò)技術(shù)則依賴于足夠的訓(xùn)練井,否則會(huì)造成較大的誤差。
圖10、11為不同方法預(yù)測(cè)的整個(gè)研究區(qū)內(nèi)平均孔隙度分布情況,可以看出,幾種方法均能較好顯示儲(chǔ)層的孔隙度分布情況,其中基于KICA屬性優(yōu)化的LS_SVM預(yù)測(cè)的結(jié)果對(duì)孔隙度分布的描述更加細(xì)致、準(zhǔn)確,而神經(jīng)網(wǎng)絡(luò)方法由于訓(xùn)練井?dāng)?shù)目少的問題,其預(yù)測(cè)結(jié)果變化范圍大,表現(xiàn)出較大的誤差。
圖10 基于ICA優(yōu)化的神經(jīng)網(wǎng)絡(luò)孔隙度預(yù)測(cè)結(jié)果Fig.10 Porosity prediction based on ICA optimization and neural network
圖11 基于KICA優(yōu)化的支持向量機(jī)孔隙度預(yù)測(cè)結(jié)果Fig.11 Porosity prediction based on KICA optimization and SVM
本文主要研究了經(jīng)屬性優(yōu)化的機(jī)器學(xué)習(xí)儲(chǔ)層參數(shù)預(yù)測(cè)技術(shù),經(jīng)過模型仿真與實(shí)例驗(yàn)證,對(duì)ICA與KICA屬性優(yōu)化技術(shù)、神經(jīng)網(wǎng)絡(luò)與LS_SVM儲(chǔ)層參數(shù)預(yù)測(cè)技術(shù)進(jìn)行了系統(tǒng)研究,得出如下結(jié)論:
1)在礁灘型等海相碳酸鹽巖儲(chǔ)層預(yù)測(cè)中,KICA及ICA屬性優(yōu)化均取得了較好的儲(chǔ)層預(yù)測(cè)效果,而KICA技術(shù)對(duì)礁灘型儲(chǔ)層特征展布更加清晰、準(zhǔn)確,因此這種基于核函數(shù)的非線性回歸方法適用于復(fù)雜的海相碳酸鹽巖儲(chǔ)層預(yù)測(cè)工作,效果遠(yuǎn)好于線性方法,同時(shí)要注意核函數(shù)的選取,不同目標(biāo)儲(chǔ)層要選擇不同的核函數(shù)進(jìn)行效果對(duì)比以尋求最優(yōu)解。
2)最小二乘支持向量機(jī)儲(chǔ)層參數(shù)預(yù)測(cè)的泛化性要好于神經(jīng)網(wǎng)絡(luò)類算法,能夠較好地解決訓(xùn)練樣本數(shù)據(jù)較少的問題,預(yù)測(cè)精度較高,在地震勘探中具有重要的實(shí)用意義,其中核函數(shù)的選取對(duì)其泛化性具有較大影響,可作為下一步研究的方向。