杜睿山,劉文豪,孟令東,付曉飛
(東北石油大學(xué) a.計(jì)算機(jī)與信息技術(shù)學(xué)院;b.黑龍江省油氣藏及地下儲(chǔ)庫(kù)完整性評(píng)價(jià)重點(diǎn)實(shí)驗(yàn)室,黑龍江 大慶 163318)
隨著油氣勘探的精細(xì)化進(jìn)程不斷深入,人們對(duì)地震數(shù)據(jù)的處理質(zhì)量要求越來(lái)越高,并引起地質(zhì)學(xué)家對(duì)小尺度地質(zhì)構(gòu)造和油氣分布的再認(rèn)識(shí),因此,地震數(shù)據(jù)隨機(jī)噪聲壓制在地震資料解釋中十分重要。地震噪聲主要包括相干噪聲和隨機(jī)噪聲。隨機(jī)噪聲是指沒(méi)有規(guī)律可循的環(huán)境噪聲和次生散射噪聲等[1]。針對(duì)隨機(jī)噪聲壓制問(wèn)題,常用的算法主要有K-L(Karhunen-Loeve)變換濾波[2]、F-X域預(yù)測(cè)濾波[3]、自適應(yīng)濾波[4]、Radon變換[5]、Curvelet變換[6]、徑向預(yù)測(cè)濾波[7]、小波變換[8-9]、奇異值分解[10]和傾角導(dǎo)向中值濾波[11-12]等。但以上方法在實(shí)際應(yīng)用中仍存在模糊有效但不連續(xù)的信息,從而對(duì)后續(xù)的地震屬性分析,特別是地質(zhì)不連續(xù)性分析帶來(lái)影響[1,13-15]。通常只能采取人工解釋斷層位置后,再進(jìn)行非斷層區(qū)噪聲壓制以保證斷層信息不受損失,工作效率低,效果受人工解釋精度的影響較大[1]。不同工區(qū)存在參數(shù)優(yōu)化與適應(yīng)性問(wèn)題等。
自AlexNet[16]獲得ImageNet冠軍后,卷積神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于油氣勘探領(lǐng)域,在全波形反演[17]、地震波場(chǎng)分離[18-19]、地震數(shù)據(jù)噪聲壓制[20-23]、地震相分類(lèi)[24-25]、頁(yè)巖總有機(jī)碳含量的預(yù)測(cè)[26]、巖石相分類(lèi)[27]、自動(dòng)斷層檢測(cè)[28-31]和河道檢測(cè)[32]等方面產(chǎn)生了許多成果。
基于上述基礎(chǔ),筆者構(gòu)建一種適合于地震隨機(jī)噪聲壓制的深度卷積神經(jīng)網(wǎng)絡(luò)模型,該模型利用非線性特征學(xué)習(xí)能力,實(shí)現(xiàn)自動(dòng)且高效抑制地震數(shù)據(jù)的隨機(jī)噪聲,減少地震資料解釋的誤差。
深度學(xué)習(xí)模型,又稱(chēng)深度神經(jīng)網(wǎng)絡(luò),泛指具有多隱藏層的人工神經(jīng)網(wǎng)絡(luò),利用許多自然信號(hào)是組合層次結(jié)構(gòu)的特性,通過(guò)構(gòu)建參數(shù)化、層級(jí)化的結(jié)構(gòu)體系,組合低級(jí)特征獲取高級(jí)特征完成學(xué)習(xí)任務(wù)[33]。卷積神經(jīng)網(wǎng)絡(luò)使用卷積作為線性濾波算法,這種設(shè)計(jì)使其在表征結(jié)構(gòu)化數(shù)據(jù)(如圖像等)時(shí)性能優(yōu)越。而地震剖面也是一種結(jié)構(gòu)化數(shù)據(jù),因此對(duì)地震數(shù)據(jù)的深度學(xué)習(xí)采用的卷積神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示。卷積神經(jīng)網(wǎng)絡(luò)的典型拓?fù)浣Y(jié)構(gòu)通常包括輸入層、卷積層、池化層、全連接層及輸出層等。待處理數(shù)據(jù)作為網(wǎng)絡(luò)的輸入層;卷積層作為特征提取層,每個(gè)神經(jīng)元的輸入與前一層的局部感受野相連接,并提取局部特征,從而確定該局部特征與其他特征間的位置關(guān)系;池化層作為特征映射層,每個(gè)特征映射為一個(gè)平面,上面每個(gè)神經(jīng)單元的權(quán)重相同;全連接層將每個(gè)局部特征進(jìn)行組合,從而得到全局特征;輸出層則需根據(jù)網(wǎng)絡(luò)的具體用途和網(wǎng)絡(luò)結(jié)構(gòu)確定[13]。
圖1 卷積神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)Fig.1 The topology of convolutional neural network
假設(shè)地震剖面由地震信號(hào)與隨機(jī)噪聲組成,噪聲壓制是從含噪地層中盡量去除隨機(jī)噪聲,恢復(fù)原始地層數(shù)據(jù),提高后續(xù)地震資料解釋準(zhǔn)確性。地層隨機(jī)噪聲壓制的最終目的是獲得原始地層數(shù)據(jù)的一個(gè)估計(jì)Y0,且Y0=Y。深度學(xué)習(xí)的基本思想是通過(guò)
Y=NNet(X;{W,b})
(1)
構(gòu)建X和Y之間的映射關(guān)系。其中NNet為構(gòu)建的基于深度學(xué)習(xí)的地震數(shù)據(jù)噪聲壓制的網(wǎng)絡(luò),W為訓(xùn)練權(quán)重,b為偏置。根據(jù)卷積神經(jīng)網(wǎng)絡(luò)原理,可將噪聲壓制后的數(shù)據(jù)作為網(wǎng)絡(luò)的輸出
Y=X-V=NNet(X;{W,b})
(2)
其中X為含噪地層數(shù)據(jù),Y為不含噪原始地層數(shù)據(jù),V為所含的隨機(jī)噪聲,這里假設(shè)V為高斯白噪聲。在對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),選擇了均方誤差(MSE:Mean Squared Error)作為代價(jià)函數(shù)。該代價(jià)函數(shù)定義如下
(3)
其中θ={ω,b},ω為權(quán)重,b為權(quán)重,i為樣本數(shù)。R(θ)為正則懲罰函數(shù),λ為懲罰系數(shù)。懲罰函數(shù)能使從地震相圖像中學(xué)習(xí)到重要特征。L2正則表達(dá)式是通用的正則懲罰函數(shù),但它不包含稀疏屬性,L1正則表達(dá)式可以誘導(dǎo)稀疏。函數(shù)表達(dá)如下
R(θ)=‖ω‖1
(4)
筆者采用自適應(yīng)矩估計(jì)算法[34]優(yōu)化代價(jià)函數(shù)。但在隱含層較多的神經(jīng)網(wǎng)絡(luò)中,數(shù)據(jù)通過(guò)一定層數(shù)的計(jì)算處理后,會(huì)出現(xiàn)模型數(shù)據(jù)的分布偏移。批量歸一化(BN:Batch Normalization,BBN)方法可解決深度神經(jīng)網(wǎng)絡(luò)內(nèi)部的協(xié)方差偏移問(wèn)題,加快卷積網(wǎng)絡(luò)的訓(xùn)練速度[35]。
筆者在卷積層與激活層之間引入該方法,其算法如下。
輸入:批處理(mini-batch)輸入x∶={x1,…,xm};
輸出:規(guī)范化后的網(wǎng)絡(luò)響應(yīng){yi=BBNγ,β(xi)}。
Step 1 計(jì)算批處理數(shù)據(jù)均值
μ
(5)
Step 2 計(jì)算批處理數(shù)據(jù)方差
(6)
Step 3 規(guī)范化
(7)
Step 4 尺度變化和偏移
(8)
Step 5 返回學(xué)習(xí)的參數(shù)γ和β。
筆者構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)充分考慮了含有噪聲地震數(shù)據(jù)與人工解釋無(wú)噪聲地震數(shù)據(jù)之間的關(guān)系,卷積神經(jīng)網(wǎng)絡(luò)模型如圖2所示。Conv1將3×3的卷積核運(yùn)算后得到64個(gè)特征映射,利用激活函數(shù)ReLU處理地震數(shù)據(jù)。Conv2-Conv16中引入BN層,將偏移后的數(shù)據(jù)映射到均值和方差統(tǒng)一的分布中,使模型避免出現(xiàn)梯度爆炸或消失等狀況,提升噪聲壓制性能[32]。Conv17卷積運(yùn)算后得到輸出數(shù)據(jù)。
圖2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 The structure of convolutional neural network
為驗(yàn)證基于卷積神經(jīng)網(wǎng)絡(luò)的地震隨機(jī)噪聲壓制方法的有效性,筆者借助第三方工具Pytorch訓(xùn)練模型,并使用圖形處理單元(GPU:Graphic Processing Unit)提高訓(xùn)練速度。深度學(xué)習(xí)模型訓(xùn)練階段,使用已有的樣本和標(biāo)簽,優(yōu)化模型參數(shù),訓(xùn)練一個(gè)從樣本到標(biāo)簽的近似映射;測(cè)試階段,將目標(biāo)數(shù)據(jù)輸入模型,得到的輸出作為測(cè)試結(jié)果。
圖3 模型訓(xùn)練曲線Fig.3 The curve of model training
筆者以已解釋工區(qū)的地震體作為研究對(duì)象,根據(jù)切割的1 200個(gè)地震剖面圖和解釋資料,在剖面圖中切割出1 200個(gè)大小為112像素×112像素的地震數(shù)據(jù)。該段數(shù)據(jù)共180道,單道含510個(gè)采樣點(diǎn)。將數(shù)據(jù)加入均值為0、加性高斯白噪聲分別為數(shù)據(jù)幅值10%,20%和25%,其中噪聲水平數(shù)據(jù)幅值為10%的數(shù)據(jù)集用于驗(yàn)證數(shù)據(jù)樣本數(shù)量對(duì)筆者算法噪聲壓制的影響。設(shè)置兩種數(shù)據(jù)集劃分方法訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò),均經(jīng)過(guò)50個(gè)epoch:采用全部的1 200條地震數(shù)據(jù)作為訓(xùn)練樣本訓(xùn)練深度殘差網(wǎng)絡(luò);采用600條地震數(shù)據(jù)為訓(xùn)練樣本訓(xùn)練深度參數(shù)網(wǎng)絡(luò)。兩種方案的PSNR如圖3所示。從圖3可看出,方案1的峰值信噪比更高,隨機(jī)噪聲壓制的性能優(yōu)于方案2,表明訓(xùn)練樣本增加會(huì)使噪聲壓制效果更優(yōu)。但在實(shí)際應(yīng)用中地震解釋和地震數(shù)據(jù)獲取較困難,并且訓(xùn)練速度會(huì)隨著樣本數(shù)量的增加而減慢,所以筆者采用方案1且訓(xùn)練樣本選定為1 200個(gè)地震剖面。數(shù)據(jù)集包含crossLine切割600條地震剖面、按照inLine切割600條地震剖面圖,每個(gè)地震剖面大小為950像素×460像素,如圖4a為inline100地震剖面部分剖面圖,圖4b為crossLine1246地震剖面部分剖面圖。
圖4 地震剖面數(shù)據(jù)集Fig.4 The dataset of seismic sections
根據(jù)上述構(gòu)建的訓(xùn)練數(shù)據(jù)集,即將在剖面圖中切割得到的1 200個(gè)大小為112 px×112 px的地震數(shù)據(jù)作為訓(xùn)練樣本,筆者采用反向傳播算法[28]訓(xùn)練模型,使用小批量梯度下降算法迭代求解網(wǎng)絡(luò)中的參數(shù),即在訓(xùn)練過(guò)程中,把整個(gè)訓(xùn)練數(shù)據(jù)隨機(jī)分為若干個(gè)批次,每次迭代僅使用其中的一個(gè)批次的樣本參與參數(shù)優(yōu)化。分別給每個(gè)地震數(shù)據(jù)樣本加上均值為0、噪聲水平分別為數(shù)據(jù)幅值10%,20%,25%加性高斯白噪聲,依據(jù)式(3)計(jì)算,在訓(xùn)練數(shù)據(jù)集循環(huán)50次后模型收斂。深度卷積神經(jīng)網(wǎng)絡(luò)的峰值信噪比和損失比如圖5所示。模型收斂后部分?jǐn)?shù)據(jù)集數(shù)據(jù)與對(duì)應(yīng)的噪聲壓制后的去噪效果如圖6所示。
圖5 深度卷積神經(jīng)網(wǎng)絡(luò)的峰值信噪比和損失率Fig.5 The PSNR and loss rate ofdeepconvolutional neural network
圖6 理論地震數(shù)據(jù)去噪效果對(duì)比Fig.6 Comparison of theoretical seismic data denoising effect
將訓(xùn)練好的模型對(duì)新的含噪聲地震數(shù)據(jù)進(jìn)行噪聲壓制,并與中值濾波算法和均值濾波算法進(jìn)行對(duì)比。在預(yù)測(cè)數(shù)據(jù)中添加均值為0、加性高斯白噪聲分別為幅值15%、20%和25%,訓(xùn)練時(shí)間分別為0.22 s、0.07 s、941.32 s。含20%噪聲地震剖面如圖7a所示,中值濾波算法對(duì)應(yīng)的地震剖面如圖7b所示,可見(jiàn)地震剖面中殘留的噪聲更多,而且損失了某些局部信息。均值濾波算法對(duì)應(yīng)地震剖面如圖7c所示,可見(jiàn)地震剖面分辨率低,同相軸不清晰。筆者算法對(duì)應(yīng)的地震剖面如圖7d所示,可見(jiàn)筆者算法噪聲壓制后結(jié)果含有更豐富的局部信息,無(wú)明顯噪聲殘留,同相軸清晰連續(xù)。
圖7 不同去噪方法對(duì)應(yīng)的地震數(shù)據(jù)剖面Fig.7 Seismic data corresponding to different algorithms
含20%噪聲熱力圖剖面如圖8a所示,中值濾波算法和均值濾波算法對(duì)應(yīng)的剖面熱力圖如圖8b、圖8c所示。可以看出,均值濾波算法和中值濾波算法在熱力圖剖面上明顯失真,有明顯丟失有效信號(hào)的痕跡,因此這兩種傳統(tǒng)算法在噪聲壓制的同時(shí)損失了部分有效信號(hào)。而筆者算法對(duì)應(yīng)的熱力圖剖面如圖8d所示,具有明顯的有效信號(hào)的痕跡,表明筆者算法在處理地震剖面是具有良好的保幅特性。
圖8 不同去噪方法對(duì)應(yīng)的地震數(shù)據(jù)剖面熱力圖Fig.8 The heat map of seismic data corresponding to different algorithms
不同算法在不同噪聲水平下的壓制能力如表1所示。由表1可見(jiàn),筆者提出的算法峰值信噪比最大,噪聲壓制能力最強(qiáng)。
表1 不同算法噪聲壓制結(jié)果評(píng)價(jià)指標(biāo)對(duì)比Tab.1 Comparison of evaluation indexes of denoising results by different methods
為驗(yàn)證筆者提出方法的噪聲壓制效果,將該算法應(yīng)用于實(shí)際的含有隨機(jī)噪聲的地震剖面中,如圖9所示。該地震數(shù)據(jù)共450道地震道,單道含200個(gè)采樣數(shù),采樣間隔為1 ms。由圖9a可看出,該地震數(shù)據(jù)含有曲線同相軸以及構(gòu)造,但受噪聲干擾嚴(yán)重,同相軸連續(xù)性比較差,弱信號(hào)識(shí)別困難。圖9b為筆者算法去噪效果,由圖9b可看出,噪聲壓制后的地震剖面含有更豐富的局部細(xì)節(jié),無(wú)明顯噪聲殘留,同相軸清晰連續(xù),具有良好的保幅特性。
圖9 實(shí)際地震數(shù)據(jù)噪聲壓制效果對(duì)比Fig.9 Comparison of actual seismic data denoising effect
為更有效地去除地震數(shù)據(jù)的隨機(jī)噪聲,筆者提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的高性能地震數(shù)據(jù)噪聲壓制方法,通過(guò)模型的先驗(yàn)訓(xùn)練完成參數(shù)自動(dòng)調(diào)整。該算法的關(guān)鍵在于構(gòu)建一個(gè)適合于地震數(shù)據(jù)壓制的卷積神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)由輸入層、卷積層、激活層、歸一化層和 輸出層等構(gòu)成,采用殘差學(xué)習(xí),輔以ReLU函數(shù)和Batch Normalization 歸一化,使筆者算法模型的訓(xùn)練的精度較高,保留了更多的原始數(shù)據(jù)細(xì)節(jié)。該方法與常用的濾波算法相比,具有更好的噪聲壓制性能。下一步的研究將針對(duì)數(shù)據(jù)噪聲壓制后的地震數(shù)據(jù),提高斷層自動(dòng)識(shí)別的計(jì)算效率。