李艷芳,王 成
(中煤科工集團(tuán) 西安研究院,陜西 西安 710077)
為了減少地震屬性解釋的多解性,提高構(gòu)造解釋和巖性預(yù)測(cè)精度,常用多種優(yōu)化屬性聯(lián)合分析,用以提高預(yù)測(cè)精度、降低勘探開發(fā)風(fēng)險(xiǎn)。隨著地震屬性技術(shù)的發(fā)展,地震屬性的種類數(shù)量增多,因此必須優(yōu)選地震屬性。地震屬性優(yōu)化就是優(yōu)選出對(duì)求解問題最敏感、最有效、最有代表性的屬性[1],選出適于工區(qū)情況的最佳屬性組合。屬性優(yōu)化的方法可分三類:基于模型正演的屬性優(yōu)選、基于數(shù)理統(tǒng)計(jì)的屬性優(yōu)選、基于人工智能的屬性優(yōu)選。
地震模型正演是在假定已知地下介質(zhì)的結(jié)構(gòu)模型和相應(yīng)物理參數(shù)的情況下,模擬地震波在地下各介質(zhì)中的傳播規(guī)律,并計(jì)算在地面或地下各觀測(cè)點(diǎn)所觀測(cè)到的數(shù)值地震記錄的一種地震模擬方法,分為物理模擬和數(shù)值模擬。地震模型正演技術(shù)在地震數(shù)據(jù)采集、處理、解釋領(lǐng)域有著廣泛應(yīng)用。在地震數(shù)據(jù)采集方面,模型正演有助于合理選擇地震采集參數(shù)和優(yōu)化觀測(cè)系統(tǒng)設(shè)計(jì),從而獲得高質(zhì)量的采集資料。在地震數(shù)據(jù)處理方面,模型正演可幫助選擇處理參數(shù),改善處理質(zhì)量。在地震資料解釋方面,模型正演能驗(yàn)證解釋結(jié)果,提高解釋成果精度。在地震屬性分析中,除了根據(jù)以往經(jīng)驗(yàn)可做出定性的判斷外,可在很大程度上依靠地震模型正演的測(cè)試結(jié)果。因已知的地質(zhì)資料畢竟有限,地震模型可視為能替代鉆孔的已知資料,地震數(shù)學(xué)模型正演模擬對(duì)屬性參數(shù)的優(yōu)選、組合、以及后續(xù)的屬性靈敏度分析等,都很重要[2]。
數(shù)理統(tǒng)計(jì)法是利用數(shù)學(xué)方法優(yōu)選一些屬性進(jìn)行儲(chǔ)層預(yù)測(cè),例如相關(guān)法、粗集、依據(jù)井旁地震屬性值與測(cè)井特征值計(jì)算地震屬性的有效性等,它是直接利用數(shù)學(xué)方法選出一些理想的屬性、然后分析,刪除一些認(rèn)為不合理的屬性,最后利用剩下的一些屬性進(jìn)行預(yù)測(cè)。其優(yōu)點(diǎn)是:減少了解釋人員的工作量,不要求對(duì)工區(qū)和地震屬性含義進(jìn)行深入理解,比較客觀;缺點(diǎn)是可信度不高,優(yōu)選的地震屬性有時(shí)沒有明確地質(zhì)意義。
1)直方圖分析。屬性提取后,不能盲目分析屬性數(shù)據(jù),需對(duì)各個(gè)屬性統(tǒng)計(jì)分析,以便了解各屬性數(shù)據(jù)的大致情況(包括:直方圖分布、相關(guān)統(tǒng)計(jì)信息、采樣點(diǎn)個(gè)數(shù)、最大值、最小值、均值、協(xié)方差等)。圖1為某工區(qū)異常值刪除前后的屬性直方圖,對(duì)其明顯的尖峰,通過研究發(fā)現(xiàn):該工區(qū)為不規(guī)則形狀;并在屬性提取時(shí),對(duì)Inline和Crosslink插值后,范圍為矩形;圖中的尖峰為0值的樣點(diǎn)數(shù),代表了矩形范圍外的0值,可認(rèn)為是區(qū)域背景;如果不對(duì)此加以處理,將使工區(qū)內(nèi)的局部異常淹沒在區(qū)域背景中。
2)相關(guān)分析。它是描述兩個(gè)或兩個(gè)以上變量間關(guān)系密切程度的統(tǒng)計(jì)方法,變量間關(guān)系的密切程度常以一個(gè)數(shù)量性指標(biāo)相關(guān)系數(shù)描述,它是社會(huì)學(xué)中常用的分析方法。相關(guān)分析可分類為:直線相關(guān)、非直線相關(guān)。并可進(jìn)一步根據(jù)變量層次和數(shù)目分類。相關(guān)分析可直觀地排除接近正相關(guān)或負(fù)相關(guān)的屬性。
圖1 異常值刪除前后的屬性直方圖
3)聚類分析(Cluster Analysis)又稱群分析:它是對(duì)樣品或指標(biāo)分類的一種多元統(tǒng)計(jì)分析方法,它的對(duì)象是大量樣品,要求合理地按各自的特性進(jìn)行分類,即在沒有先驗(yàn)知識(shí)的情況下進(jìn)行分類。聚類是將數(shù)據(jù)分類到不同的類或簇的過程,同一簇的對(duì)象有很大相似性,不同簇間的對(duì)象有很大相異性。聚類分析的目標(biāo)是在相似的基礎(chǔ)上收集數(shù)據(jù)分類。若將聚類分析和其它方法(例如判別分析、主成分分析、回歸分析等)聯(lián)合起來使用效果更好。
4)主成分分析(Principal Component Analysis ,PCA)也稱主分量分析:旨在利用降維思想,在損失很少信息的前提下,把多指標(biāo)轉(zhuǎn)化為少數(shù)綜合指標(biāo),即主成分;這些主成分要能反映原始變量的絕大部分信息,通常為原始變量的線性組合;各主成分之間互不相關(guān)、且按照方差依次遞減的順序排列。主成分分析的計(jì)算過程依次為:計(jì)算相關(guān)系數(shù)矩陣、計(jì)算特征值與特征向量、計(jì)算主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率、計(jì)算主成分載荷[3]。
傳統(tǒng)的地震屬性優(yōu)選方法是在某種單一屬性與儲(chǔ)層參數(shù)之間建立關(guān)系,例如圖2是儲(chǔ)層孔隙度參數(shù)(porosity)與某種地震屬性的交會(huì)圖,采用線性關(guān)系優(yōu)選屬性的方法簡(jiǎn)單,但預(yù)測(cè)精度低,圖中的擬合精度只有29.8%;此考慮非線性優(yōu)選。Schultz、Ronen、Hattori、Corbett、謝雄舉等提出了地震多屬性非線性優(yōu)選的思路方法[4]。運(yùn)用人工智能進(jìn)行屬性優(yōu)選的關(guān)鍵問題是:如何從n種屬性中選出m種最優(yōu)屬性,常用的方法有[4]:①窮盡搜索。希望從n種屬性中選出m種屬性,測(cè)試所有m種屬性的組合,在所有組合中預(yù)測(cè)誤差最低的就是所求解;若從25種屬性中選出5種最好組合,將會(huì)有53130種組合,運(yùn)算量大,耗時(shí)長(zhǎng)。②單步尋優(yōu)算法。雖不是最優(yōu)化,但運(yùn)算速度快;其理論假設(shè)是:已知最好的m種屬性組合,那么最好的m+1種屬性組合一定包含這m種屬性的最優(yōu)組合,當(dāng)然以前計(jì)算的系數(shù)必須被重新計(jì)算。具體的實(shí)現(xiàn)步驟為:設(shè)有多種屬性,第一步通過窮盡搜索找出最好的一種屬性,稱為屬性1;第二步在所有與屬性1組合的屬性中通過求取最小預(yù)測(cè)誤差找出最好的一對(duì)屬性,稱為屬性2;然后依次類推。利用這種方法運(yùn)行時(shí)間大大短于窮盡搜索。
圖2 屬性交會(huì)圖
人工神經(jīng)網(wǎng)絡(luò) (Artificial Neural Network,ANN)是模擬生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能的人工系統(tǒng)。人工神經(jīng)網(wǎng)絡(luò)算法在確定兩個(gè)測(cè)量變量之間的非線性函數(shù)關(guān)系,特別是未知非線性函數(shù)關(guān)系方面,具有速度快、誤差小的優(yōu)點(diǎn);作為多學(xué)科的交叉科學(xué),神經(jīng)網(wǎng)絡(luò)的并行處理能力、自組織自學(xué)習(xí)能力、高度的計(jì)算能力,引起人們的普遍興趣[4]。目前,在地震、重力、電磁法、磁法等方面都進(jìn)行了應(yīng)用探索。1986年Rumelhart提出了反向傳播(Back Propagation)學(xué)習(xí)算法(BP算法),目前應(yīng)用最廣模型之一。BP網(wǎng)絡(luò)能學(xué)習(xí)和存貯大量的輸入-輸出模式映射關(guān)系,它的學(xué)習(xí)規(guī)則是用最速下降法,通過反向傳播調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小。運(yùn)用神經(jīng)網(wǎng)絡(luò)進(jìn)行多屬性優(yōu)選,以較大的訓(xùn)練樣本量為基礎(chǔ),但隨著樣本數(shù)量的增加,有可能相關(guān)性反而降低,出現(xiàn)“過擬合”現(xiàn)象(見圖3)。
圖3 訓(xùn)練數(shù)據(jù)過擬合圖
支持向量機(jī) (Support Vector Machines,SVM)是Corinna Cortes和Vapnik等于1995年提出,以最小化錯(cuò)誤率的理論界限為思想,以統(tǒng)計(jì)學(xué)習(xí)理論(Statistical Learning Theory,SLT)為基礎(chǔ),服務(wù)于小樣本統(tǒng)計(jì)估計(jì)和預(yù)測(cè)學(xué)習(xí)的一種新的機(jī)器學(xué)習(xí)方法。它能根據(jù)有限樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,提高模型的泛化能力,得到全局最優(yōu)解,又不存在“過擬合”問題,較好地解決了小樣本的學(xué)習(xí)問題。支持向量回歸是用一個(gè)非線性映射將訓(xùn)練數(shù)據(jù)集非線性映射到一個(gè)高維特征空(Hilbert空間),并在此空間中構(gòu)造最優(yōu)分類超平面,以求最優(yōu)解的實(shí)現(xiàn)過程[5]。針對(duì)地震勘探中已知樣本數(shù)目偏少的實(shí)際情況,可用基于SVM方法進(jìn)行多屬性的非線性優(yōu)選。圖4為某工區(qū)運(yùn)用已知孔插值形成的預(yù)測(cè)圖,圖5為運(yùn)用基于SVM的屬性優(yōu)選后的預(yù)測(cè)圖。
圖4 已知孔插值形成的預(yù)測(cè)圖
圖5 SVM預(yù)測(cè)圖
本文從模型正演、數(shù)理統(tǒng)計(jì)、人工智能方面討論了地震多屬性的優(yōu)選技術(shù);闡述了運(yùn)用相關(guān)分析、聚類分析、主成分分析、神經(jīng)網(wǎng)絡(luò)進(jìn)行地震屬性的優(yōu)選方法;重點(diǎn)闡述了基于小樣本的支持向量機(jī)優(yōu)選屬性方法,并將SVM方法和多屬性優(yōu)選方法應(yīng)用于煤層氣預(yù)測(cè)中。實(shí)際資料應(yīng)用結(jié)果表明,針對(duì)地震勘探中已知鉆孔較少的情況,基于SVM的屬性優(yōu)選方法是一種較為有效的方法。
[1]印興耀,周靜毅.地震屬性優(yōu)化方法綜述[J].石油地球物理勘探,2005,40(4):284-289.
[2]蔣先藝,劉賢功,宋葵.復(fù)雜構(gòu)造模型正演模擬[M].北京:石油工業(yè)出版社,2004.
[3]印興耀,孔國(guó)英,張廣智.基于核主成分分析的地震屬性優(yōu)化方法及應(yīng)用[J].石油地球物理勘探,2008,43(2):179-183.
[4]謝雄舉,季玉新.優(yōu)選地震屬性預(yù)測(cè)儲(chǔ)層參數(shù)的方法及其應(yīng)用[J].石油物探,2004,43(S):127-131.
[5]遵德.儲(chǔ)層地震屬性優(yōu)化方法[M].北京:石油工業(yè)出版社,1998.