聶小燕,陳瀟瀟,羅凱,陳紅
(1.電子科技大學(xué)成都學(xué)院,成都 611731; 2.中國(guó)測(cè)試技術(shù)研究院,成都 610066)
地質(zhì)剖面圖的結(jié)構(gòu)特征被稱(chēng)為同相軸[1]。在地震勘探資料處理解釋中,準(zhǔn)確的同相軸信息能夠?yàn)榈卣鹳Y料處理和解釋工作提供更好的約束條件和指導(dǎo)作用,使結(jié)果更精細(xì)、可靠[2]。同相軸的識(shí)別和追蹤的準(zhǔn)確度會(huì)直接影響到地質(zhì)結(jié)構(gòu)特征的判斷。
同相軸的構(gòu)成是在同一個(gè)地震勘探數(shù)據(jù)中,擁有相同的振動(dòng)相位并且位于相鄰兩列的波峰與波峰(或者波谷與波谷)的連線[3]。能夠相連的波峰、波谷應(yīng)該是有規(guī)律出現(xiàn)的,基本上包含了絕大部分的地質(zhì)結(jié)構(gòu)特征信息。同相軸數(shù)據(jù)用來(lái)作為地震數(shù)據(jù)處理的約束條件[4],最終輸出的結(jié)構(gòu)特征可視化圖像會(huì)更加可靠,更有利于幫助專(zhuān)業(yè)人員完成地質(zhì)資源的標(biāo)點(diǎn)定位工作。
針對(duì)地震剖面的結(jié)構(gòu)特征問(wèn)題,趙靜等[5]基于疊前及疊后資料的同相軸提取方法,提出一種適用于地震同相軸拾取的數(shù)學(xué)形態(tài)學(xué)方法。算法識(shí)別效率高,但在信噪比稍大一點(diǎn)的情況下拾取效果不是很好。謝瑋等[6]針對(duì)縫洞型油藏的地震識(shí)別,提出了從常規(guī)反射波數(shù)據(jù)中分離出繞射波數(shù)據(jù),利用地震波場(chǎng)中的繞射信息對(duì)斷裂和裂縫地質(zhì)體進(jìn)行識(shí)別。余為維等[7]結(jié)合同相軸反射特征統(tǒng)計(jì)序列分析、灰度共生矩陣紋理屬性、Hu不變矩參數(shù)方法,從內(nèi)部結(jié)構(gòu)與外部特征角度提出一種地震相綜合數(shù)字表征方法,以期實(shí)現(xiàn)地震相的精確數(shù)字化表征。
隨著人工智能與機(jī)器學(xué)習(xí)的發(fā)展和進(jìn)步,越來(lái)越多的智能方法被提出來(lái)。田高鵬等[8]設(shè)計(jì)自組織神經(jīng)網(wǎng)絡(luò),通過(guò)聚類(lèi)分析優(yōu)選出地震屬性,對(duì)優(yōu)選優(yōu)化后的屬性進(jìn)行多波復(fù)合運(yùn)算提取油氣特征信息。該方法具有良好的自組織學(xué)習(xí)能力、自組織分類(lèi)等特點(diǎn),但需要大量計(jì)算神經(jīng)元與樣本的距離以確定最佳匹配單元,且不適用于稀疏數(shù)據(jù)場(chǎng)景。
余里輝[9]從地震振幅體數(shù)據(jù)出發(fā),提出了一種全卷積網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)斷層端到端的識(shí)別。提取得到斷層二值數(shù)據(jù)體后,考慮到斷層分布與空間形態(tài)的復(fù)雜性,采用先提取斷層骨架再對(duì)斷層點(diǎn)云直接重建斷層曲面的算法。該方法對(duì)山地高陡地質(zhì)模型識(shí)別率低,且小斷層無(wú)法識(shí)別。
張子良等[10]提出基于改進(jìn)DNA算法的地震層位拾取技術(shù),提出復(fù)式五點(diǎn)采樣的方法建立基因庫(kù),減少人為干預(yù)。地震DNA算法是一種較新的辦法,在地震數(shù)據(jù)特征選取上有一定的優(yōu)勢(shì),但是針對(duì)山地高陡復(fù)雜地質(zhì)構(gòu)造,結(jié)構(gòu)特征交疊、不連續(xù)的情況較為明顯。
由于地質(zhì)構(gòu)造是極其復(fù)雜的,地質(zhì)結(jié)構(gòu)的多樣性導(dǎo)致了地震數(shù)據(jù)解釋的不確定性[11]。上述方法的結(jié)果好壞與所選取的地震資料屬性以及屬性計(jì)算方法有關(guān)。
現(xiàn)針對(duì)山地高陡復(fù)雜地質(zhì)構(gòu)造,為了更大程度地提高地震數(shù)據(jù)可視化效率以及更充分地挖掘山地高陡地震數(shù)據(jù)的結(jié)構(gòu)信息,提出一種基于結(jié)構(gòu)特征的地震剖面二維可視化方法。主要是從數(shù)據(jù)預(yù)處理方法、結(jié)構(gòu)特征提取方法和二維可視化方法這三部分進(jìn)行研究。提出領(lǐng)域加權(quán)平均濾波算法、特征選擇的正切值過(guò)濾算法和方差過(guò)濾算法、結(jié)構(gòu)特征提取的相關(guān)算法、可視化的雙線性插值算法和顏色映射算法。將文獻(xiàn)[10]和所提出的方法應(yīng)用到地質(zhì)模型數(shù)據(jù)中,對(duì)兩者的實(shí)驗(yàn)結(jié)果進(jìn)行比較分析。
地震勘探數(shù)據(jù)中會(huì)有斷層、裂縫等地層邊緣成分,而這些邊緣成分?jǐn)?shù)據(jù)化時(shí)會(huì)包含較多的高頻分量,也就是噪聲[12]。在鄰域平均濾波法的基礎(chǔ)上,加入了鄰域內(nèi)各數(shù)據(jù)的權(quán)重,能夠有效降低噪聲,提高數(shù)據(jù)的信噪比。
首先,根據(jù)圖像數(shù)據(jù)的特點(diǎn)來(lái)確定一個(gè)鄰域S的窗口大小為M×N,即鄰域S中有M列N行個(gè)圖像像素點(diǎn),通常鄰域S呈正方形,大小取為3×3或者5×5鄰域;M與N的值一般為奇數(shù),這樣方便確定鄰域中心像素點(diǎn)的位置。
(1)
式(1)中:zi為以(x,y)為中心的領(lǐng)域像素值;wi為每個(gè)像素值對(duì)應(yīng)的權(quán)重。
這種方法可以幫助降低噪聲,但同時(shí)也會(huì)降低圖像的分辨率,并且鄰域窗口越大,圖像就會(huì)越模糊,窗口越小,圖像的去噪效果就越差。因此鄰域平均濾波法既具有使用簡(jiǎn)便、運(yùn)行時(shí)間短等優(yōu)點(diǎn),但同時(shí)也存在以破壞圖像細(xì)節(jié)和圖像模糊為代價(jià)的缺點(diǎn)。鄰域平均濾波法的所有像素點(diǎn)的權(quán)重都一樣,但鄰域加權(quán)平均濾波法是在鄰域S內(nèi),像素點(diǎn)的權(quán)重會(huì)發(fā)生改變,中心點(diǎn)的權(quán)重值最大,離中心點(diǎn)越遠(yuǎn)的坐標(biāo)點(diǎn)與中心點(diǎn)的相關(guān)性越低,所以權(quán)重值越小。
傳統(tǒng)的平均過(guò)濾的方式會(huì)讓邊緣斷點(diǎn)信號(hào)受到統(tǒng)計(jì)平均效應(yīng)的影響,從而導(dǎo)致嚴(yán)重的畸變,通過(guò)加權(quán)平均的方式,可以同時(shí)兼顧數(shù)據(jù)的去噪效果和圖像分辨率問(wèn)題。
為了能夠提取數(shù)據(jù)中的同相軸,首先需要提取每列數(shù)據(jù)中的波峰、波谷。為了縮小由于數(shù)據(jù)的坐標(biāo)值和數(shù)據(jù)值量級(jí)差距過(guò)大的影響,選擇線性歸一化的方法,按比例放縮,保證數(shù)據(jù)點(diǎn)之間的關(guān)系。
線性歸一化公式為
(2)
式(2)中:xmax為序列中的最大值;xmin為序列中的最小值,屬于原數(shù)據(jù)等比例放縮。
地質(zhì)結(jié)構(gòu)特征是由振幅較強(qiáng)的波峰、波谷表現(xiàn)出來(lái)的,所以可以用找到的波峰波谷序列通過(guò)方差或正切值過(guò)濾法進(jìn)行序列優(yōu)化,得到最優(yōu)化的波峰、波谷序列。
1.2.1 方差過(guò)濾
通過(guò)數(shù)據(jù)點(diǎn)的方差判斷與樣本之間的特征關(guān)系。
定義總體標(biāo)準(zhǔn)偏差公式為
(3)
在上述步驟中所提取出來(lái)的波峰、波谷序列里,對(duì)每一個(gè)極值點(diǎn)相對(duì)于樣本的方差進(jìn)行過(guò)濾。
方差過(guò)濾中閾值的確定會(huì)影響特征組合的有效性,如果閾值很小,大部分具有結(jié)構(gòu)特征的數(shù)據(jù)點(diǎn)將不會(huì)被過(guò)濾;如果閾值比較大,將會(huì)有很多數(shù)據(jù)點(diǎn)被過(guò)濾掉,而被過(guò)濾掉的數(shù)據(jù)點(diǎn)可能很多都是有效特征數(shù)據(jù)點(diǎn),所以閾值的大小對(duì)過(guò)濾效果至關(guān)重要。
1.2.2 正切值過(guò)濾
因?yàn)檎穹鶑?qiáng)的極值一般會(huì)出現(xiàn)在與上下地層差別較大的地方,而含有油氣的地層與其相鄰地層會(huì)反射較大的傾斜角。所以也可以使用正切值過(guò)濾的方法,這種方法可以直接按每個(gè)極值點(diǎn)與兩邊鄰接極值的斜率來(lái)判斷振幅的強(qiáng)弱,正切值的絕對(duì)值越大,說(shuō)明這個(gè)極值對(duì)于左右兩邊的振幅越強(qiáng),那么這個(gè)極值點(diǎn)的特征性更強(qiáng)。
斜率計(jì)算公式為
(4)
式(4)中:y1和y2為采樣點(diǎn)數(shù)據(jù)值;x1和x2為采樣點(diǎn)的時(shí)間序號(hào)。
地質(zhì)勘探人員會(huì)使用科學(xué)方法收集用來(lái)描述地質(zhì)信息的離散數(shù)據(jù),但由于單個(gè)離散數(shù)據(jù)值中所蘊(yùn)含的地質(zhì)特征信息太少[13],所以需要通過(guò)分析所有的離散數(shù)據(jù)之間的聯(lián)系,從中找出能夠代表地質(zhì)結(jié)構(gòu)特征的數(shù)據(jù)序列。
相關(guān)算法是以數(shù)據(jù)中相鄰兩列的極值點(diǎn)作為計(jì)算對(duì)象。相關(guān)算法最重要的目的就是要找到每一個(gè)極大值點(diǎn)或者極小值點(diǎn)對(duì)應(yīng)右邊列中極大值點(diǎn)(或者極小值點(diǎn))的相關(guān)系數(shù),然后再根據(jù)相關(guān)系數(shù)來(lái)判斷兩個(gè)極大值點(diǎn)(或兩個(gè)極小值點(diǎn))之間相關(guān)性的強(qiáng)弱。在分析經(jīng)過(guò)特征選取后的極值序列時(shí),極大值點(diǎn)和極小值點(diǎn)不會(huì)一起求解相關(guān)系數(shù),而是需要將每一列的極大值點(diǎn)序列和極小值點(diǎn)序列分開(kāi)計(jì)算,極值點(diǎn)之間的相似性就通過(guò)相關(guān)值的大小來(lái)衡量。而相關(guān)系數(shù)是根據(jù)兩個(gè)極值點(diǎn)得出兩組相關(guān)系數(shù)求解序列,滑動(dòng)窗口的大小決定求解序列的大小,然后這兩組數(shù)據(jù)按相關(guān)公式計(jì)算得出。相關(guān)系數(shù)有正負(fù)之分,取值為-1~1,若相關(guān)系數(shù)的值等于最大時(shí),就說(shuō)明這兩個(gè)極值點(diǎn)在滑動(dòng)窗口大小內(nèi)的相位相同;若相關(guān)系數(shù)的值等于最小時(shí),就說(shuō)明這兩個(gè)極值點(diǎn)在滑動(dòng)窗口大小內(nèi)的相位完全相反。相關(guān)系數(shù)的絕對(duì)值越大,則這兩組數(shù)據(jù)呈線性關(guān)系,此時(shí)這兩個(gè)極大值點(diǎn)(或者波谷)相關(guān)性越強(qiáng),可以作為結(jié)構(gòu)特征序列;若相關(guān)系數(shù)的絕對(duì)值越小,則這兩個(gè)極大值點(diǎn)(或者波谷)相關(guān)性越弱,當(dāng)相關(guān)系數(shù)絕對(duì)值沒(méi)有達(dá)到閾值,就不會(huì)加入到結(jié)構(gòu)特征序列。
相關(guān)系數(shù)計(jì)算公式為
(5)
式(5)中:Cov(X,Y)為協(xié)方差,計(jì)算公式為
(6)
現(xiàn)有的地震數(shù)據(jù)剖面可視化通常被當(dāng)作一個(gè)單純的計(jì)算機(jī)問(wèn)題。如圖1所示,信號(hào)的強(qiáng)弱反映了地層結(jié)構(gòu)的變化。由于地層存在起伏和傾角,在等時(shí)或等深界面上不同道上的信號(hào)相位不同。可視化的目的是最大程度保持原有信號(hào)反映的結(jié)構(gòu)特征?,F(xiàn)有的可視化渲染方法忽略了信號(hào)特征的約束,導(dǎo)致地震剖面可視化圖像的分辨率和連續(xù)性較差。所提出的結(jié)構(gòu)特征約束的可視化渲染方法可以提高可視化效果的保真度。
圖1 地震剖面信號(hào)Fig.1 Seismic profile signal
地震勘探數(shù)據(jù)屬于時(shí)空數(shù)據(jù)[14]。時(shí)空數(shù)據(jù)用圖像表示的時(shí)候,可以利用數(shù)據(jù)的各個(gè)屬性來(lái)簡(jiǎn)化可視化設(shè)計(jì),根據(jù)數(shù)據(jù)中各數(shù)據(jù)點(diǎn)的坐標(biāo)位置,劃分成不同維度的目標(biāo)圖像。
雙線性插值是以二維坐標(biāo)為基礎(chǔ)的,相當(dāng)于在兩個(gè)方向使用三次單線性插值。常用的有兩種計(jì)算方式:第一種是先在y軸方向求兩次,然后在x軸方向求一次;第二種方式是先在x軸方向求兩次,然后在y軸方向求一次,如圖2所示。兩種方式計(jì)算結(jié)果相同。由于不規(guī)則四邊形有兩條邊是平行于y軸的,所以采用第二種方式更適合。
圖2 規(guī)則的雙線性插值示意圖Fig.2 Schematic diagram of regular bilinear interpolation
兩次x軸方向單線性插值計(jì)算公式如下。
(1)點(diǎn)R1的函數(shù)值。
(7)
(2)點(diǎn)R2的函數(shù)值。
(8)
一次y軸方向單線性插值計(jì)算公式如下。
點(diǎn)P0的函數(shù)值公式為
(9)
根據(jù)處理的輸入數(shù)據(jù)特點(diǎn),采用不規(guī)則雙線性插值方法。
四邊形的4個(gè)頂點(diǎn)取原數(shù)組中相鄰的4個(gè)數(shù)據(jù)點(diǎn),兩個(gè)在第i列,另外兩個(gè)在第i+1列,由于4個(gè)點(diǎn)只涉及兩列數(shù)據(jù)的范圍,則由這4個(gè)點(diǎn)組成的四邊形中兩條邊是與y軸平行的,但是其他兩條邊不一定與x軸平行,所以這里的四邊形是不規(guī)則的(如圖3所示)。點(diǎn)P0的函數(shù)值計(jì)算公式為
圖3 不規(guī)則雙線性插值示意圖Fig.3 Schematic diagram of irregular bilinear interpolation
(10)
相對(duì)于規(guī)則的雙線性插值,不規(guī)則四邊形在y方向的插值對(duì)應(yīng)數(shù)值應(yīng)為點(diǎn)R1和點(diǎn)R2的y坐標(biāo)值。
采用平面型二維數(shù)據(jù)可視化方法中的坐標(biāo)映射法和顏色映射法,可以通過(guò)數(shù)據(jù)點(diǎn)在目標(biāo)圖像中的位置映射,調(diào)節(jié)不同的顏色以及顏色的亮度、色標(biāo)等方式傳達(dá)圖像的結(jié)構(gòu)特征信息,通過(guò)顏色的差別可以更直觀地突顯地質(zhì)特征。
輸入的數(shù)據(jù)是一個(gè)二維數(shù)組,為了映射更方便,若a和b是小數(shù),則向下取整,分別記為[a]和[b],目標(biāo)圖像的空白邊緣橫向大小為(M/m)余數(shù)的一半,再向下取整,記為a1;空白邊緣縱向大小為(N/n)余數(shù)的一半,再向下取整,記為b1,剩余空白像素點(diǎn)向后移。此時(shí)原圖像的點(diǎn)(x,y)對(duì)應(yīng)目標(biāo)圖像的點(diǎn)(a1+xa,b1+yb)。坐標(biāo)映射原理如圖4所示。
圖4 坐標(biāo)映射方法Fig.4 Coordinate mapping method
顏色映射法可以分為兩步,第一步需要確定一個(gè)顏色映射表,顏色映射表中的顏色都需要指定對(duì)應(yīng)的顏色值。第二步將標(biāo)量數(shù)據(jù)對(duì)應(yīng)到顏色表中的顏色值上。采用漸變色或混合色時(shí),可以自定義顏色值的范圍來(lái)適應(yīng)標(biāo)量數(shù)據(jù)值的范圍,也可以直接指定某一標(biāo)量值對(duì)應(yīng)某一個(gè)顏色值。
如圖5所示是混合色顏色表中的其中一種,左邊顏色對(duì)應(yīng)標(biāo)量最小值,右邊顏色對(duì)應(yīng)標(biāo)量最大值。顏色表的顏色值范圍是[0,255],所以顏色值為0對(duì)應(yīng)標(biāo)量的最小值,顏色值為255對(duì)應(yīng)標(biāo)量的最大值,然后所有標(biāo)量按比例對(duì)應(yīng)在[0,255]區(qū)間。
圖5 顏色映射表Fig.5 Color mapping table
采用python作為開(kāi)發(fā)語(yǔ)言,使用pycharm作為開(kāi)發(fā)平臺(tái)進(jìn)行軟件設(shè)計(jì)。測(cè)試環(huán)境為Intel(R) Core(TM) i5-2450M CPU @ 2.50 GHz,8.00 GB內(nèi)存,NVIDIA GeForce GTX750,64位 Windows7旗艦版操作系統(tǒng)。
以反映地質(zhì)信息的數(shù)據(jù)集作為本文的輸入數(shù)據(jù)源,選擇所提出的數(shù)據(jù)預(yù)處理方法對(duì)采集的數(shù)據(jù)做預(yù)處理,流程如圖6所示。
圖6 數(shù)據(jù)預(yù)處理流程圖Fig.6 Data preprocessing flow chart
然后根據(jù)結(jié)構(gòu)特征提取方法來(lái)尋找數(shù)據(jù)中隱含的結(jié)構(gòu)特征。地質(zhì)結(jié)構(gòu)特征提取的過(guò)程是根據(jù)描述地質(zhì)信息的數(shù)據(jù),尋找隱含結(jié)構(gòu)特征的數(shù)據(jù)點(diǎn)作為地層的分界面[15],提取流程如圖7所示,最后輸出能夠表現(xiàn)地質(zhì)特征的數(shù)據(jù)序列。
圖7 結(jié)構(gòu)特征提取流程圖Fig.7 Flow chart of structural feature extraction
如圖8所示是實(shí)驗(yàn)中部分?jǐn)?shù)據(jù)點(diǎn)形成的波形圖,把數(shù)組中每列數(shù)據(jù)抽象成一個(gè)波形線(藍(lán)色波線),紅色點(diǎn)是每列數(shù)據(jù)點(diǎn)中的極大值點(diǎn),黃色點(diǎn)是每列數(shù)據(jù)點(diǎn)中的極小值點(diǎn)。相關(guān)性較強(qiáng)的極大值點(diǎn)(或極小值點(diǎn))之間的連線,就是本文方法拾取的結(jié)構(gòu)特征序列。
圖8 結(jié)構(gòu)特征序列波形圖Fig.8 Structural feature sequence waveform
為了進(jìn)一步驗(yàn)證本文方法的有效性,下面分別采用所提出的方法和文獻(xiàn)[10]的方法進(jìn)行結(jié)構(gòu)特征拾取測(cè)試實(shí)驗(yàn)。
如圖9所示,用文獻(xiàn)[10]的方法得到的結(jié)構(gòu)特征提取的同相軸很多不光滑,折點(diǎn)處較多,連續(xù)性較差。因?yàn)榈卣餌NA算法雖然是一種新的同相軸自動(dòng)提取算法,但是因其匹配出符合條件的地震特征較多,且層位劃分不夠明顯,很難區(qū)分所找到的地震波是否屬于同一個(gè)地震層位,所以拾取到的地震層位連續(xù)性較差。
圖10是用本文方法得到的結(jié)果。與圖9比較可以看出結(jié)構(gòu)特征連續(xù)性更強(qiáng),比較有規(guī)律,也不會(huì)出現(xiàn)過(guò)度曲折和兩條同相軸交疊的現(xiàn)象,更加符合地質(zhì)結(jié)構(gòu)的實(shí)際情況。通過(guò)兩種方法結(jié)果的比較,本文方法效果更好。
圖9 文獻(xiàn)[10]方法的結(jié)構(gòu)特征圖Fig.9 Structural characteristic diagram of reference[10] method
圖10 本文方法結(jié)構(gòu)特征圖Fig.10 The structural characteristic diagram of this method
最后,以上述得到的結(jié)構(gòu)特征序列為約束條件,在渤海灣某工區(qū)數(shù)據(jù)集上進(jìn)行二維渲染,最終輸出一個(gè)結(jié)構(gòu)特征較為明顯的可視化圖像如圖11所示。
圖12是圖11結(jié)構(gòu)特征的局部放大,線條就是本文提取的結(jié)構(gòu)特征序列,疊加在原數(shù)據(jù)的可視化圖像上??梢院苊黠@地看出結(jié)構(gòu)特征序列與大部分地質(zhì)信息是相符合的,連續(xù)性更好,與文獻(xiàn)[10]方法相比實(shí)現(xiàn)了更準(zhǔn)確的地質(zhì)結(jié)構(gòu)可視化效果。
圖11 渤海灣某工區(qū)二維可視化圖像Fig.11 Two dimensional visualization image based on structural features
圖12 結(jié)構(gòu)特征局部放大Fig.12 Amplification of structural characteristics
地震勘探數(shù)據(jù)中每個(gè)數(shù)據(jù)點(diǎn)只含有很少的地質(zhì)結(jié)構(gòu)信息,專(zhuān)業(yè)人員需要快速、準(zhǔn)確地從大量數(shù)據(jù)中找出數(shù)據(jù)反映的結(jié)構(gòu)特征信息,為專(zhuān)業(yè)人員提供更能真實(shí)反映地質(zhì)結(jié)構(gòu)特征的圖像來(lái)幫助判斷油氣在地下儲(chǔ)藏的位置。
針對(duì)山地高陡復(fù)雜地質(zhì)構(gòu)造,實(shí)現(xiàn)了對(duì)數(shù)據(jù)中隱含的結(jié)構(gòu)特征的可視化顯示。與傳統(tǒng)的方法對(duì)比,實(shí)驗(yàn)測(cè)試結(jié)果驗(yàn)證了獲取的結(jié)構(gòu)特征序列的準(zhǔn)確性更高,連續(xù)性更好。以結(jié)構(gòu)特征序列為約束條件而輸出的可視化圖像效果也符合預(yù)期目標(biāo)。但在結(jié)構(gòu)特征拾取的過(guò)程中,未具體討論閾值確定問(wèn)題,這是今后需要進(jìn)一步研究和探討的問(wèn)題。