徐彥凱 劉曾梅* 薛亞茹 曹思遠(yuǎn)
(①中國石油大學(xué)(北京)信息科學(xué)與工程學(xué)院,北京 102249;②中國石油大學(xué)(北京)地球物理學(xué)院,北京 102249)
地震資料不可避免地受到不同類型噪聲的影響,嚴(yán)重影響有效信號的識別,因此壓制隨機(jī)噪聲是地震資料處理的重要步驟之一[1]。地震資料噪聲壓制方法主要分為三類:第一類是空間域?yàn)V波方法,如中值濾波[2]和均值濾波[3];第二類是變換域?yàn)V波方法,包括小波變換[4-6]、Curvelet變換[7-8]、FX域反褶積[9]等,其主要思想是對地震數(shù)據(jù)進(jìn)行變換,然后在變換域設(shè)置閾值分離信號與噪聲,最后通過反變換將地震數(shù)據(jù)轉(zhuǎn)換到原始空間域,以此實(shí)現(xiàn)噪聲的去除;第三類是基于矩陣降秩的稀疏表示去噪方法,如奇異值分解(SVD)[10-11],是對地震數(shù)據(jù)進(jìn)行稀疏表示,將較大的系數(shù)視為有效信號,較小的系數(shù)視為噪聲,通過抑制較小的系數(shù)可以有效去除噪聲,提高地震資料的信噪比。
上述方法雖然在隨機(jī)噪聲壓制上均能取得一定的效果,但難以保證在去噪的同時不損傷有效信號,且效率低。為此,需要將其他領(lǐng)域的新方法引入地震資料的噪聲壓制。
近年來,深度學(xué)習(xí)方法在圖像去噪領(lǐng)域得到了快速發(fā)展,其中卷積神經(jīng)網(wǎng)絡(luò)(CNN)[12]是目前最流行并被廣泛使用的算法之一。Jain等[13]使用CNN抑制圖像噪聲,該方法采用逐層訓(xùn)練的方式,收斂較快,去噪效果優(yōu)于小波變換。Burger等[14]將多層感知器(MLP)應(yīng)用于圖像噪聲壓制,對特定噪聲水平的圖像去噪效果較好。王琪琪等[15]將MLP用于去除地震數(shù)據(jù)中的隨機(jī)噪聲,相比曲波方法能更充分地保護(hù)細(xì)節(jié)信息。Xie等[16]首次運(yùn)用編解碼技術(shù)和堆疊式自動編碼器(SSDA)去除高斯噪聲,達(dá)到了學(xué)習(xí)稀疏特征的目的,具有較高的訓(xùn)練精度。Zhang等[17]提出了去噪卷積神經(jīng)網(wǎng)絡(luò)(DnCNN),對于一般圖像具有較好的去噪效果。韓衛(wèi)雪等[18]和Wang等[19]將DnCNN應(yīng)用于地震數(shù)據(jù)的隨機(jī)噪聲壓制,去噪后的同相軸清晰連貫,克服了傳統(tǒng)去噪方法導(dǎo)致的偽影問題;Dong等[20]引入高階統(tǒng)計量優(yōu)化DnCNN的參數(shù),使之適用于壓制沙漠地震資料中的低頻噪聲。針對ReLU函數(shù)導(dǎo)致有效信息丟失的問題,Yang等[21]在迭代過程中使用ELU激活函數(shù)增強(qiáng)網(wǎng)絡(luò)的魯棒性,有效抑制了地震數(shù)據(jù)中各種強(qiáng)度的隨機(jī)噪聲。Zheng等[22]應(yīng)用基于DnCNN的去噪方法衰減一維微地震數(shù)據(jù)的隨機(jī)噪聲;李海山等[23]借鑒深度殘差網(wǎng)絡(luò)原理設(shè)計了一種深層網(wǎng)絡(luò),有效壓制了疊前地震記錄中的隨機(jī)噪聲;Yang等[24]提出自適應(yīng)CNN,更加有效地衰減隨機(jī)噪聲并重建地震波形。
但是地震資料中包含地質(zhì)結(jié)構(gòu)和巖性信息,而以上網(wǎng)絡(luò)均采用單一的卷積核尺寸,不能充分有效地利用地震信號鄰域信息,僅能夠提取數(shù)據(jù)中有限的局部特征信息,容易造成邊緣部分紋理細(xì)節(jié)的損失。針對這一問題,本文提出一種雙通道卷積神經(jīng)網(wǎng)絡(luò)壓制地震資料中的隨機(jī)噪聲。該網(wǎng)絡(luò)通過兩個不同結(jié)構(gòu)的子網(wǎng)絡(luò)提取更豐富的特征,同時通過引入空洞卷積(Dilated Convolution,DConv)的方式,增大感受野,從而捕捉到更豐富的地震信號鄰域信息,在去噪的同時不損傷有效信號。
一般來說,不同的網(wǎng)絡(luò)結(jié)構(gòu)可以提取到不同的特征[25],若能將不同網(wǎng)絡(luò)提取的不同特征應(yīng)用于噪聲壓制,能夠提升最終去噪效果。Tian[26]等采用雙通道策略在圖像去噪方面取得了不錯的效果。因此,本文設(shè)計了一種包含兩個不同子網(wǎng)絡(luò)的雙通道卷積神經(jīng)網(wǎng)絡(luò)(SDC-CNN),如圖1所示。
圖1 雙通道卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
SDC-CNN中的兩個子網(wǎng)絡(luò)均包含卷積(Conv)、批量歸一化(BN)和Swish激活函數(shù)單元。其中,BN單元可以有效解決內(nèi)部協(xié)變量偏移問題,有效防止網(wǎng)絡(luò)深而導(dǎo)致的梯度消失或梯度爆炸。Swish激活函數(shù)單元用于向神經(jīng)網(wǎng)絡(luò)中加入非線性因素,提高模型的表達(dá)能力。上通道子網(wǎng)絡(luò)的深度為8層,第1層由Conv和Swish單元組成。第2~第6層在Conv與Swish單元間加入了BN單元。第7層和第8層只包含Conv單元。該子網(wǎng)絡(luò)每一層的卷積核尺寸都是3×3。下通道子網(wǎng)絡(luò)的深度也為8層,與上通道子網(wǎng)絡(luò)不同的是,該子網(wǎng)絡(luò)引入了DConv。由于簡單疊加相同擴(kuò)張率的DConv會帶來棋盤效應(yīng),本文將不同擴(kuò)張率的DConv組合使用,從而學(xué)習(xí)到更多的鄰域信息。該子網(wǎng)絡(luò)每一層的卷積核尺寸也都為3×3,第1層由1-DConv(擴(kuò)張率為1的DConv)和Swish單元組成。第2~第6層分別由擴(kuò)張率為2、3、4、3、2的DConv(相當(dāng)于尺寸分別為5×5、7×7、9×9、7×7、5×5的卷積核)、BN和Swish單元組成。第7層和第8層與上通道子網(wǎng)絡(luò)一樣,只包含卷積單元,且擴(kuò)張率為1,相當(dāng)于尺寸為3×3的標(biāo)準(zhǔn)卷積。
此外,在本文所提出的SDC-CNN網(wǎng)絡(luò)中,使用殘差學(xué)習(xí)的思想學(xué)習(xí)原始含噪地震數(shù)據(jù)與經(jīng)過網(wǎng)絡(luò)處理后的“干凈”數(shù)據(jù)之間的殘差,將兩個子網(wǎng)絡(luò)的輸出進(jìn)行特征融合(Concatenate),即圖1中的Concat層,然后將原始輸入減去融合后的殘差,從而得到壓制噪聲后的地震數(shù)據(jù)。這種殘差學(xué)習(xí)策略可以解決網(wǎng)絡(luò)深度增加導(dǎo)致的訓(xùn)練精度下降問題,并能加快網(wǎng)絡(luò)的收斂。
使用標(biāo)準(zhǔn)卷積時,第l層感受野尺寸的計算公式為
Rl=(Rl-1-1)Sl+kl
(1)
式中:Rl為第l層的感受野尺寸;Sl為第l層卷積核的移動步長;kl表示第l層的卷積核尺寸。與標(biāo)準(zhǔn)卷積有所區(qū)別,DConv多了一個超參數(shù)——“擴(kuò)張率(Dilation Rate)”,該參數(shù)表示卷積核處理數(shù)據(jù)時各值的間距。DConv擴(kuò)大感受野的本質(zhì)是它在原始卷積核中使用了零填充操作,而這些零元素并不參與卷積運(yùn)算。因此,引入DConv后第l層等效的普通卷積核尺寸Kl與原始卷積核尺寸kl之間的關(guān)系為
Kl=(kl-1)(d-1)+kl
(2)
(3)
圖2 卷積核尺寸與感受野的關(guān)系示意圖
圖2a和圖2b分別是擴(kuò)張率為1的標(biāo)準(zhǔn)卷積和擴(kuò)張率為2的DConv感受野的關(guān)系示意圖,其中圖2b的紅色部分為DConv參與計算的像素。根據(jù)式(2),當(dāng)d=1時,原始卷積核的尺寸為3×3(圖2a黑色矩形框),相當(dāng)于標(biāo)準(zhǔn)卷積。當(dāng)d=2時,等效的普通卷積核尺寸為5×5(圖2b黑色矩形框),根據(jù)式(3)可得到對應(yīng)的感受野尺寸為7×7(圖2b藍(lán)色區(qū)域)。由式(1)可知,在第三層才能得到7×7的感受野。因此,DConv可以在不增加參數(shù)的情況下擴(kuò)大感受野,捕獲上下文的多尺度信息。而且地震資料中道與道之間的有效信號具有相似性,若能夠充分利用鄰域信息,神經(jīng)網(wǎng)絡(luò)則可以更精確地區(qū)分地震資料中的有效信號與噪聲,有利于保護(hù)有效信號。
在一定程度上,網(wǎng)絡(luò)的表達(dá)能力與其深度成正比,而隨著網(wǎng)絡(luò)深度的增加,網(wǎng)絡(luò)訓(xùn)練的效率會降低,帶來梯度彌散、梯度爆炸等與網(wǎng)絡(luò)優(yōu)化相關(guān)的問題。為此,He等[27]提出了殘差網(wǎng)絡(luò)。
含有隨機(jī)噪聲的地震數(shù)據(jù)可表示為
d=s+n
(4)
(5)
式中:N為含噪地震圖像塊的數(shù)量;θ為網(wǎng)絡(luò)模型參數(shù)集;r(·)表示網(wǎng)絡(luò)預(yù)測的殘差;d-s為期望的殘差。在本文的雙通道卷積神經(jīng)網(wǎng)絡(luò)中,將兩個子網(wǎng)絡(luò)的輸出進(jìn)行特征融合,然后將原始輸入減去融合后的殘差,從而得到壓制噪聲后的地震數(shù)據(jù)。
Swish[28]是一種新的激活函數(shù),定義為
g(z)=zσ(βz)
(6)
式中:σ(z)=(1+e-z)-1為Sigmoid函數(shù),其中z為Swish激活函數(shù)的輸入;β是一個可訓(xùn)練的參數(shù)。ReLU激活函數(shù)具有稀疏性的特點(diǎn),能夠解決反向傳播過程中可能出現(xiàn)的梯度消失問題,被多次使用在深度學(xué)習(xí)中。但是,ReLU函數(shù)的輸出值和梯度值在z<0的區(qū)域內(nèi)恒等于0(圖3a),可能導(dǎo)致權(quán)重?zé)o法更新,即出現(xiàn)神經(jīng)元“死亡”現(xiàn)象。而Swish激活函數(shù)在負(fù)半軸的輸出值無限逼近零但不會等于零(圖3b),并且 Swish激活函數(shù)具有平滑和非單調(diào)的特點(diǎn),可以有效克服網(wǎng)絡(luò)訓(xùn)練時產(chǎn)生的神經(jīng)元“死亡”現(xiàn)象,提高網(wǎng)絡(luò)的性能。
圖3 RelU激活函數(shù)(a)和Swish激活函數(shù)(b)的對比
分別對加入不同強(qiáng)度高斯隨機(jī)噪聲的地震數(shù)據(jù)進(jìn)行訓(xùn)練,保存訓(xùn)練好的網(wǎng)絡(luò)模型,并對含有不同噪聲強(qiáng)度的地震數(shù)據(jù)進(jìn)行測試。采用自適應(yīng)矩估計(Adam)優(yōu)化模型參數(shù),初始學(xué)習(xí)率設(shè)置為0.001,迭代30次。
將本文提出的SDC-CNN應(yīng)用于模擬地震數(shù)據(jù)和實(shí)際地震資料,并與FX域反褶積、Curvelet變換、U-Net方法、DnCNN方法以及本文網(wǎng)絡(luò)模型中的下通道子網(wǎng)絡(luò)進(jìn)行對比。使用信噪比(SNR)、峰值信噪比(PSNR)以及均方根誤差(RMSE)三個指標(biāo)評估不同方法去噪效果。SNR和PSNR的表達(dá)式為
(7)
(8)
式中:MAX2(s)表示無噪圖像最大值的平方;MSE為原始數(shù)據(jù)與處理后的數(shù)據(jù)的均方誤差
(9)
式中I、J分別為地震數(shù)據(jù)的道數(shù)和樣點(diǎn)數(shù)。則均方根誤差為
(10)
應(yīng)用Ricker子波通過Matlab平臺模擬四個反射界面的CMP道集,每個道集200道,時間采樣間隔為4ms。四個界面的初始零炮檢距雙程旅行時分別為0.10、0.40、0.65、0.90s,對應(yīng)的均方根速度分別為950、1000、1100、1200m/s。各界面零炮檢距雙程旅行時的最大浮動量為0.1s,均方根速度的最大浮動量為100m/s,Ricker子波峰值頻率在20~35Hz變化,共合成500個道集,其中400個道集作為訓(xùn)練集,其余100個道集作為測試集。為提取更豐富的細(xì)節(jié)特征,將訓(xùn)練集中的地震數(shù)據(jù)進(jìn)行隨機(jī)翻轉(zhuǎn)、任意角度旋轉(zhuǎn)等操作,按照尺寸為40×40、移動步長為10的方式進(jìn)行裁剪,最終得到71.04萬個40×40的數(shù)據(jù)塊。
對于圖4a所示的合成CMP道集,加入強(qiáng)度為15的高斯隨機(jī)噪聲后如圖4b所示。圖5為圖4b數(shù)據(jù)不同方法的噪聲壓制結(jié)果,圖6為對應(yīng)的殘差剖面。FX域反褶積在壓制隨機(jī)噪聲的同時,衰減了同相軸的能量(圖5a、圖6a);Curvelet變換的去噪結(jié)果的同相軸附近出現(xiàn)較多偽影,其殘差含部分有效信號(圖5b、圖6b);與傳統(tǒng)算法相比,U-Net卷積神經(jīng)網(wǎng)絡(luò)濾波效果較好,但同相軸的能量有較大損失(圖5c、圖6c)。DnCNN方法(圖5d)、本文的下通道子網(wǎng)絡(luò)(圖5e)以及本文方法(圖5f)對噪聲的壓制更徹底,由殘差剖面可以看出,本文方法比DnCNN方法保留了更多的有效信息(圖6d、圖6f)。由表1可以看出,本文方法噪聲壓制結(jié)果的PSNR、SNR和RMSE均優(yōu)于其他方法。
圖4 合成原始數(shù)據(jù)(a)及其加噪結(jié)果(b)
圖5 合成數(shù)據(jù)不同算法去噪結(jié)果
圖6 合成數(shù)據(jù)不同算法去噪結(jié)果與原始數(shù)據(jù)的殘差對比
表1 不同算法對加入噪聲強(qiáng)度為15的CMP道集噪聲壓制結(jié)果統(tǒng)計
對于噪聲強(qiáng)度分別為15、25、35、45和55的CMP道集,上述六種算法壓制結(jié)果的信噪比統(tǒng)計如表2所示??梢钥闯觯瑹o論噪聲強(qiáng)度大小,本文方法的信噪比最高、壓制效果最好。
表2 不同算法對加入不同噪聲強(qiáng)度的CMP道集噪聲壓制后信噪比 dB
2.2.1 預(yù)處理后的實(shí)際地震資料
為進(jìn)一步驗(yàn)證本文算法的適用性,將以上去噪算法應(yīng)用到SEG官網(wǎng)公開的實(shí)際地震資料。將該數(shù)據(jù)進(jìn)行裁剪得到1001個切片數(shù)據(jù),每個切片數(shù)據(jù)有120道,時間采樣間隔為4ms,樣點(diǎn)數(shù)為240。將其中801個切片數(shù)據(jù)以相同方式進(jìn)行翻轉(zhuǎn)、旋轉(zhuǎn)等操作,再裁剪得到38.1276萬個40×40的數(shù)據(jù)塊作為訓(xùn)練集,將剩下的200個切片數(shù)據(jù)作為測試集。
圖7a為不含噪聲的原始道集,圖7b為加入強(qiáng)度為15的高斯隨機(jī)噪聲后的結(jié)果,可見弱信號幾乎被噪聲淹沒。圖8為上述六種方法對圖7b數(shù)據(jù)的噪聲壓制結(jié)果,圖9為對應(yīng)的殘差剖面。由圖可見:FX域反褶積(圖8a)和Curvelet變換方法(圖8b)去噪結(jié)果中出現(xiàn)明顯的偽影,去除噪聲不充分,且丟失了較多的有效信息(圖9a、圖9b);U-Net卷積神經(jīng)網(wǎng)絡(luò)對隨機(jī)噪聲的壓制更徹底(圖8c),但在一定程度上損傷了有效信號(圖9c);DnCNN方法更具優(yōu)勢(圖8d),但在殘差剖面仍可以看見部分有效信息(圖9d);而本文方法的去噪結(jié)果更加接近原始地震資料,且殘差剖面中幾乎不包含有效信號,從圖8f和圖9f中的紅色矩形框區(qū)域可以看出本文方法對弱信號恢復(fù)得較好;本文的下通道子網(wǎng)絡(luò)也取得不錯的去噪效果,但是在部分微弱信號區(qū)域(圖8e和圖9e紅色矩形框區(qū)域),從去噪結(jié)果和去噪殘差可見丟失了一些有效信息,說明雙通道卷積神經(jīng)網(wǎng)絡(luò)(本文方法)可以學(xué)習(xí)到更充分的有效信息。
圖7 預(yù)處理后實(shí)際地震數(shù)據(jù)(a)及其加噪結(jié)果(b)
圖8 預(yù)處理后實(shí)際地震數(shù)據(jù)不同算法去噪結(jié)果對比
圖9 預(yù)處理后實(shí)際地震數(shù)據(jù)不同算法去噪結(jié)果與原始數(shù)據(jù)的殘差對比
表3列出了不同算法對加入強(qiáng)度為15的噪聲的實(shí)際地震資料去噪結(jié)果的指標(biāo)對比,可見本文方法去噪結(jié)果的PSNR、SNR和RMSE三個指標(biāo)均優(yōu)于其他算法。與傳統(tǒng)算法和DnCNN方法相比,本文方法在壓制地震資料隨機(jī)噪聲和保護(hù)微弱有效信號方面均展現(xiàn)出更好的效果。
表3 不同算法對加入強(qiáng)度為15噪聲的實(shí)際地震資料去噪結(jié)果統(tǒng)計
對加入強(qiáng)度分別為15、25、35、45和55的高斯隨機(jī)噪聲后的實(shí)際地震資料,不同算法噪聲壓制后的SNR統(tǒng)計如表4所示,可見:無論噪聲強(qiáng)度大小,本文方法噪聲壓制結(jié)果的SNR均最高;與僅使用下通道子網(wǎng)絡(luò)去噪相比,本文雙通道網(wǎng)絡(luò)改善了去噪效果。
表4 不同算法對加入不同強(qiáng)度噪聲的實(shí)際資料噪聲壓制后信噪比 dB
2.2.2 實(shí)際原始疊前地震資料
截取的部分實(shí)際地震資料(圖10)共128道,每道128個樣點(diǎn),采樣間隔為4ms。受到隨機(jī)噪聲的干擾,原始道集同相軸不清晰、不連續(xù),能量較弱的有效信號難以識別。圖11為上述六種方法的去噪結(jié)果,圖12為對應(yīng)的殘差剖面。
圖10 實(shí)際原始疊前地震道集
從圖11、圖12可以看出:FX域反褶積法去噪結(jié)果中仍包含較多噪聲,噪聲壓制不明顯,且丟失了較多有效信息(圖11a、圖12b);經(jīng)Curvelet變換處理后,去除了大部分噪聲,但殘差剖面含有較多有效信號(圖11b、圖12b);U-Net卷積神經(jīng)網(wǎng)絡(luò)對隨機(jī)噪聲的壓制相對傳統(tǒng)方法更好,但在一定程度上損傷有效信號尤其是紅色方框內(nèi)的弱信號(圖11c、圖12c);經(jīng)DnCNN方法壓制噪聲后,隨機(jī)噪聲得到有效去除,有效信號也得到了更充分保留,但從去噪結(jié)果和殘差剖面可觀察到,紅色框內(nèi)的弱有效信號與隨機(jī)噪聲一同被壓制(圖11d、圖12d);本文下通道子網(wǎng)絡(luò)方法和本文方法對隨機(jī)噪聲去除得更徹底,紋理細(xì)節(jié)部分也得到保護(hù),但在紅色標(biāo)記區(qū)域內(nèi),本文方法結(jié)果的同相軸更連續(xù)(圖11e、圖11f),殘差道集上有效信息更少,有利于對弱信號的保護(hù)(圖12e、圖12f)。
圖11 實(shí)際原始疊前地震資料不同算法去噪結(jié)果對比
圖12 實(shí)際原始疊前地震資料不同算法去噪殘差對比
因此,與其他方法相比,本文方法在對地震資料隨機(jī)噪聲的壓制和有效細(xì)節(jié)信息的保護(hù)方面更具優(yōu)勢。
本文提出了一種雙通道卷積神經(jīng)網(wǎng)絡(luò)用于地震資料隨機(jī)噪聲壓制。該網(wǎng)絡(luò)采用增加寬度的策略,構(gòu)造兩個不同的子網(wǎng)絡(luò)學(xué)習(xí)數(shù)據(jù)中的互補(bǔ)信息;在下通道子網(wǎng)絡(luò)中引入空洞卷積,使特征圖中包含更多的鄰域信息,并結(jié)合殘差學(xué)習(xí)的優(yōu)勢,在去除噪聲的同時保留了更豐富的細(xì)節(jié)信息,提高了信、噪有效分離能力。模型CMP數(shù)據(jù)和實(shí)際地震資料處理結(jié)果均表明,本文提出的雙通道卷積神經(jīng)網(wǎng)絡(luò)方法對隨機(jī)噪聲的壓制更徹底,保留的細(xì)節(jié)信息更豐富。