高新成,杜功鑫,王莉利,李 強,柯 璇
(1.東北石油大學(xué) 現(xiàn)代教育技術(shù)中心,黑龍江 大慶 163318;2.東北石油大學(xué) 計算機與信息技術(shù)學(xué)院,黑龍江 大慶 163318;3.東北石油大學(xué) 地球科學(xué)學(xué)院,黑龍江 大慶 163318)
靜校正是地震勘探過程中至關(guān)重要的一部分,而初至波的拾取效果決定了靜校正的好壞[1]。傳統(tǒng)初至拾取方法主要包括能量比法(孫淑琴等,2009;Coppens等,2010;秦寧等,2014;陳金煥等,2015;張凱等,2018)、小波振幅比法(王國富等,2015)、地震道瞬時強度比法(張偉等,2009)、分形法(Boschettiet等,1996;曾富英等,2002;左國平等,2006)、沿地震道分形維法(張琪等,2019)、互相關(guān)估計地震道相對時差法(林凡生等,2017)以及能量比迭代法(許銀波等,2015)等。但是這些傳統(tǒng)方法都存在明顯缺陷,如在高信噪比或非水平地層情況下,這些方法的拾取效果不佳。
隨著人工智能技術(shù)的迅速發(fā)展,計算機硬件不斷提高,使得深度學(xué)習(xí)再次受到人們的追捧和探索,嘗試將深度學(xué)習(xí)算法應(yīng)用到各行各業(yè)。該文通過深入研究當前基于深度學(xué)習(xí)算法的地震初至拾取方法,對比分析常用深度學(xué)習(xí)算法在地震初至拾取中的應(yīng)用效果,討論總結(jié)深度學(xué)習(xí)在地震初至波拾取中存在問題和應(yīng)用前景,為提高初至波拾取的效率與精度提供一些嶄新的方向。
STA/LTA法,又稱能量比法,是通過計算短時間窗口和長時間窗口內(nèi)的能量信號平均值之比(即噪聲信號和地震信息振幅差異)進行初至拾取[2],見圖1(a)。Ambuter等[3](1976)提出簡單識別地震震相;Allen(1978)提出長短時均值比法,此后Alle[4](1982)又提出以特征函數(shù)作為STA/LTA法的輸入,提高對幅度和頻率變化的靈敏度;張軍華等[5]提出將小波變換和能量比法相結(jié)合來拾取初至?xí)r間;葉根喜[6](2008)提出運用時間窗均值比法進行初至拾取。STA/LTA法計算簡單、計算速度快,但依賴依據(jù)人為經(jīng)驗預(yù)先設(shè)定的閾值,以及在低信噪比情況下拾取效果不佳。
(a)長短時均值法
AIC方法,又稱統(tǒng)計學(xué)方法,是根據(jù)極大似然原理和信息論推導(dǎo)出的一種初至拾取方法,見圖1(b)。在地震數(shù)據(jù)資料中,地震信號和噪聲信號的特性差異性較大,導(dǎo)致在微地震信號和噪聲交界點處,兩種信號的擬合度最差(最小平方統(tǒng)計),此時求得的AIC值最小,即對應(yīng)地震信號初至?xí)r刻[7]。Maeda等[8](1985)利用上述原理創(chuàng)新提出不利用AR模型得到AIC值方法;張軍華等(2002)將AIC法和小波分解相結(jié)合,極大地提高了對低信噪比信號的拾取效率,有效地壓制了噪聲信號;王洪超等[9](2017)簡化了AIC法的計算公式,提高拾取速度。但是,AIC法依賴時窗的選取,只有當選取合適時窗時才能得到好的拾取結(jié)果。
地震能量信號一般可表示為三分量,即x,y,z。因為地震信號和噪聲信號的運動軌跡有著巨大的差異,可以由此對其三分量進行分析計算以達到拾取的目的[10]。1965年,F(xiàn)linn等[11](1965)首先提出在偏振分析中加入?yún)f(xié)方差矩陣;Moriya等[12](1996)提出通過對地震信號三分量數(shù)據(jù)進行傅里葉變換來拾取初至;Du等[13](2000)嘗試使用多階窗函數(shù)解決地震信號時間頻域的局部矛盾,朱衛(wèi)星等[14](2010)改良了該理論,實現(xiàn)自適應(yīng)極化濾波,改善了拾取效果;李健等[15](2014)為提高偏振分析質(zhì)量,改善方位角估算的準確性,在偏振分析的基礎(chǔ)上增加信號檢測頻帶。但是,偏振分析法在低信噪比情況下拾取效果不佳。
2.1.1 殘差神經(jīng)網(wǎng)絡(luò)(ResNet)
為了提高初至拾取的效率和精度,帥威、王君等[16](2019)提出基于殘差神經(jīng)網(wǎng)絡(luò)的地震初至拾取方法,對不同地表的地震初至數(shù)據(jù)進行訓(xùn)練,建立初至拾取網(wǎng)絡(luò)模型。浦義濤等[17](2019)提出將殘差神經(jīng)網(wǎng)絡(luò)應(yīng)用于地震初至拾取,以不同地形、不同震源類型的地震數(shù)據(jù)為數(shù)據(jù)集,進行標簽化處理,識別學(xué)習(xí)不同標簽的訓(xùn)練集,逐步提高網(wǎng)絡(luò)對初至波的識別能力和網(wǎng)絡(luò)的泛化能力,并對比分析傳統(tǒng)初至拾取方法。此外,借鑒ResNet在圖像去噪中的應(yīng)用,陳沅忠等[18](2020)以U-Net為主體框架,并引入殘差網(wǎng)絡(luò)結(jié)構(gòu)用以提高網(wǎng)絡(luò)的抗噪能力。
對于具有兩寬一高、面積大特點的地震數(shù)據(jù),基于ResNet的拾取方法在拾取精度上達到90%以上(除個別異常點),拾取效率和準確度優(yōu)于STA/LTA法和傳統(tǒng)神經(jīng)網(wǎng)絡(luò),并且可以提升網(wǎng)絡(luò)抗噪能力。但還存在一定不足,比如網(wǎng)絡(luò)模型層數(shù)非常深、對原始數(shù)據(jù)集需進行復(fù)雜的預(yù)處理等問題,具有較大的改進空間,可以考慮和其他網(wǎng)絡(luò)結(jié)構(gòu)(如U-Net、GAN等)進行優(yōu)點結(jié)合,形成新的網(wǎng)絡(luò),該方法具有較高的研究意義和研究價值。
2.1.2 全卷積神經(jīng)網(wǎng)絡(luò)(FCN)
李輝峰等[19](2006)和牛沛琛等[20](2007)提出一種基于邊緣檢測的拾取方法,將地震數(shù)據(jù)先灰度處理,再二值化處理,最后在對獲得的二值圖像進行邊緣檢測。在此基礎(chǔ)上,劉佳楠等[21](2018)結(jié)合初至波的特點,將初至波看成二分類問題,運用FCN拾取初至波。通過對地震勘探資料進行解析獲得地震共炮數(shù)據(jù)集并對數(shù)據(jù)進行標注歸一化處理,將訓(xùn)練集放入FCN中進行訓(xùn)練學(xué)習(xí),對比分析不同層數(shù)的FCN,獲得性能最佳的FCN結(jié)構(gòu)(4layer)。再對比分析基于FCN(4layer)與市場地震數(shù)據(jù)處理軟件TomoPlus的拾取效果。
基于二值圖像邊緣檢測的初至拾取方法與傳統(tǒng)方法相比計算量小,抗噪能力強,提高了檢測效率,但是當初至波與背景噪聲的邊界很模糊時,拾取的效果就很差,而且圖像處理技術(shù)對于二值化閾值的要求很高。在此基礎(chǔ)上,基于FCN的初至拾取方法在高噪聲情況下拾取率方面比商業(yè)軟件TomoPlus效果更好,并且在低噪聲情況下在擬合度方面比商業(yè)軟件TomoPlus效果更好。但是,目前國內(nèi)研究者較少,參考文獻較少,更多的是研究基于FCN延伸出的U-Net的拾取方法。
2.1.3 U型完全卷積網(wǎng)絡(luò)(U-Net)
為克服在復(fù)雜近地表條件下地震初至波數(shù)據(jù)所具有的能量弱、信噪比低、相位變化劇烈等問題,Hu等[22](2019)提出基于U-Net的初至波到時拾取,將其描述為二值分割問題,利用一組地震波形數(shù)據(jù)及其對應(yīng)的初至?xí)r間對U-Net進行訓(xùn)練,利用訓(xùn)練后的模型對一個合成數(shù)據(jù)集和三個低質(zhì)量的野外數(shù)據(jù)集進行驗證。張逸倫等[23](2020)提出基于U-Net的多道聯(lián)合微地震震相初至拾取方法,利用深度學(xué)習(xí)自動特征提取能力,根據(jù)井中微地震數(shù)據(jù)特點,構(gòu)建U-Net網(wǎng)絡(luò)進行初至拾取。該方法不僅可以學(xué)習(xí)單道內(nèi)的數(shù)據(jù)特征,還可以自適應(yīng)地學(xué)習(xí)道間震相的波形相似特征。丁建群等[24](2020)提出基于U-Net的初至波拾取方法,引入常規(guī)卷積與孔洞卷積的交錯的方法,實現(xiàn)初至波的分割與準確定位方法,并且在學(xué)習(xí)前進行高斯去噪等一系列數(shù)據(jù)處理,降低深度學(xué)習(xí)的特征識別難度。吳雨鑫[25](2020)將初至拾取看作圖像分割問題,并使用U-Net網(wǎng)絡(luò)作為訓(xùn)練框架,合成需要的帶標簽的初至拾取訓(xùn)集,并對損失函數(shù)做了修改,結(jié)合圖像梯度,增大了初至部分的權(quán)重,使模型的訓(xùn)練更聚焦于初至的部分。
通過對U-Net網(wǎng)絡(luò)結(jié)構(gòu)進行優(yōu)化或與其他結(jié)構(gòu)特點結(jié)合,提高網(wǎng)絡(luò)的訓(xùn)練效率。如楊雙瑜等[26](2020)利用Dense Block優(yōu)化U-Net網(wǎng)絡(luò)層深,構(gòu)建MS-Net。此網(wǎng)絡(luò)既具備U-Net全卷積網(wǎng)絡(luò)“端對端”精細化識別的能力,能夠?qū)θ我馕⒌卣疠斎胄盘栐诒A糨斎肟臻g位置信息的同時實現(xiàn)逐采樣點地“端對端”精細化輸出;又保留Dense-Net網(wǎng)絡(luò)對深層特征的捕獲能力,更好地實現(xiàn)低信噪比微地震信號信噪可辨。李薇薇等[27](2021)通過改進U-Net結(jié)構(gòu)(U-Net++),提出一種基于U-Net++的初至波拾取方法。將原始地震數(shù)據(jù)及少量初至?xí)r間的標簽數(shù)據(jù)放入U-Net++進行監(jiān)督學(xué)習(xí),用西部某工區(qū)地震數(shù)據(jù)對建立的U-Net++進行測試,將其拾取結(jié)果與目前主流商業(yè)軟件以及基于U-Net模型拾取結(jié)果進行對比分析。張逸倫等[28](2021)基于深度學(xué)習(xí)技術(shù)的自動特征提取能力,并根據(jù)井中微地震觀測系統(tǒng)的多道數(shù)據(jù)源特點,提出基于U-Net的多道聯(lián)合震相識別和初至拾取方法(MT-Net)。該方法以具有不同信號特征的多道微地震監(jiān)測記錄作為輸入,以P波、S波及噪聲的概率分布標簽作為輸出,采用具有“逐采樣點”識別能力的U-Net模型,設(shè)置二維卷積操作使得道內(nèi)與道間的波形信息同時被自適應(yīng)地學(xué)習(xí)。
此外,為了解決基于U-Net的初至拾取方法中制作標簽耗時費力、數(shù)據(jù)預(yù)處理過程繁瑣、網(wǎng)絡(luò)結(jié)構(gòu)過于復(fù)雜等問題,陳德武、楊午陽等[29](2020)結(jié)合U-Net與SegNet網(wǎng)絡(luò)的優(yōu)點,提出一種新的網(wǎng)絡(luò)模型U-SegNet,并且運用到初至拾取中。U-SegNet模型中的上采樣過程是參考U-Net模型,用反池化層代替反卷積層,加快模型收斂速度;參考SegNet模型,在其解碼器網(wǎng)絡(luò)的反卷積層之前加入跳躍連接信息,提高模型性能。最后選取最優(yōu)U-SegNet結(jié)構(gòu)層數(shù),對比分析最優(yōu)層U-SegNet和商業(yè)軟件的拾取效果。除此之外,陳德武、楊午陽等[30](2021)還針對傳統(tǒng)的地震波初至拾取方法對低信噪比資料拾取精度較低、算法的魯棒性較差等缺點,對U-Net網(wǎng)絡(luò)結(jié)構(gòu)進行改進,將U-Net網(wǎng)絡(luò)結(jié)構(gòu)中的跳躍連接改為包含多個卷積塊的殘差連接,減小了網(wǎng)絡(luò)結(jié)構(gòu)中融合的兩個圖像特征的差異,并使用自動拾取的小尺寸訓(xùn)練和測試樣本,并對比分析了改進的U-Net網(wǎng)絡(luò)模型(ResConnU-Net)和商業(yè)軟件的拾取效果。
基于U-Net的初至拾取方法只需少量標記數(shù)據(jù)進行學(xué)習(xí),就能自適應(yīng)地識別不同的初至?xí)r間,無論是在初至峰值還是在初至低谷,可以克服能量弱、信噪比低、相位變化劇烈等問題。但根據(jù)不同情況,人們又考慮可不可以對U-Net網(wǎng)絡(luò)結(jié)構(gòu)進行優(yōu)化或與其他結(jié)構(gòu)特點結(jié)合,更好地提高不同震源下的初至波拾取準確率。于是就有了MS-Net、U-Net++、MT-Uet、U-SegNet、ResConnU-Net等模型出現(xiàn),并且都取得了不錯的成果?;赨-Net及其優(yōu)化模型的拾取方法,目前國內(nèi)研究者居多,可以與很多模型進行優(yōu)點結(jié)合,具有很好的研究意義。
為解決微弱信號在低信噪比中拾取準確率低的問題,鄭晶等[31](2018)提出基于S變換和深度信念神經(jīng)網(wǎng)絡(luò)的地震波到時拾取方法,對原始數(shù)據(jù)進行S變換,提高小樣本的識別效率,將經(jīng)過S變換的數(shù)據(jù)放入受限玻爾茲曼機進行無監(jiān)督預(yù)訓(xùn)練,得到網(wǎng)絡(luò)模型參數(shù)的初值,通過誤差反向傳播來微調(diào)網(wǎng)絡(luò)參數(shù),構(gòu)建最終的深度信念神經(jīng)網(wǎng)絡(luò)模型。利用測試數(shù)據(jù)對訓(xùn)練之后的DBN與STA/LTA法進行對比分析,對DBN網(wǎng)絡(luò)的準確率進行大樣本測試,獲取準確率的統(tǒng)計分析結(jié)果。
基于DBN的初至拾取方法,模型結(jié)構(gòu)設(shè)計簡單,實現(xiàn)便捷,拾取效率高于STA/LTA法。對于含噪數(shù)據(jù),該方法的拾取準確率可以達到90%以上,具有較好的拾取精度和魯棒性。此外,通過利用S變換對原始數(shù)據(jù)進行預(yù)處理,可以豐富時域原始信號時頻特征,有效的提高DBN網(wǎng)絡(luò)預(yù)測的精度,但是,該方法的參考文獻很少,當遇到無方向可選時,可以考慮選擇此方法。
地震記錄初至拾取質(zhì)量往往受限于地震數(shù)據(jù)的復(fù)雜性,在陸地和淺海地震數(shù)據(jù)中尤為明顯。為了更高效地拾取初至波,周創(chuàng)、居興國等[32](2020)構(gòu)建了一種適用于地震數(shù)據(jù)初至拾取的深度卷積對抗神經(jīng)網(wǎng)絡(luò)(DCGAN),在對地震數(shù)據(jù)進行能量均衡等預(yù)處理后,選取初至?xí)r刻后含波峰的半波長數(shù)據(jù)作為初至特征加入訓(xùn)練,將預(yù)處理后的地震數(shù)據(jù)與初至數(shù)據(jù)用于生成器與判別器的訓(xùn)練,直到得到網(wǎng)絡(luò)結(jié)構(gòu)的最優(yōu)參數(shù)。用山地地震數(shù)據(jù)進行初至拾取實驗與STA/LTA法、AIC法進行對比分析,驗證該方法的有效性。薛東等[33](2021)提出基于現(xiàn)有地震初至波拾取方法和成果,生成地震訓(xùn)練數(shù)據(jù)樣本,通過機器學(xué)習(xí)算法優(yōu)化組合、自主特征學(xué)習(xí),建立適合吉林探區(qū)地質(zhì)特征的地震初至波拾取的深度學(xué)習(xí)方法和模型,使用對抗神經(jīng)網(wǎng)絡(luò)異常初至修正算法,生成對抗網(wǎng)絡(luò)包括生成器和判別器,將原始數(shù)據(jù)作為輸入,訓(xùn)練生成器生成初至,再訓(xùn)練判別器,對生成的初至進行判別準確與否,交替訓(xùn)練兩個GAN網(wǎng)絡(luò)直至生成的初至被判別器認為是準確的初至,智能地自動識別和修正異常初至,有效提高了拾取初至的準確度和效率。
基于GAN的拾取方法具有一定可行性,可以利用GAN網(wǎng)絡(luò)智能地識別和修正異常初至,能保證較高的精度,比傳統(tǒng)方法拾取效果好,滿足生產(chǎn)需要。因此,該方法有著很高的研究意義和研究價值。
對于不同信噪比的地震資料數(shù)據(jù),傳統(tǒng)的拾取算法的拾取效率和精度低并且無法避免人工修改參數(shù),為解決該問題,Jing Zheng等[34](2018)提出基于深度遞歸神經(jīng)網(wǎng)絡(luò)的初至拾取算法,為獲得不同信噪比的數(shù)據(jù)集,在原始數(shù)據(jù)集中隨機加入噪聲,將到達選擇任務(wù)轉(zhuǎn)換為序列標記任務(wù),通過時間誤差反向傳播算法對模型進行訓(xùn)練以更新權(quán)重參數(shù),然后用梯度下降法對整個網(wǎng)絡(luò)參數(shù)進行優(yōu)化,并用RNN建立一個串行注釋模型,最后將原始波形信號輸入到一個線性網(wǎng)絡(luò)模型中,模型輸出一個初至?xí)r間明顯的特征向量。并對比分析RNN模型與STA/LTA方法。余楊等[35](2019)針對波形初至拾取任務(wù),充分利用地震數(shù)據(jù)的序列性,借助序列標注的思想,提出了一個基于深度遞歸神經(jīng)網(wǎng)絡(luò)的拾取模型。以序列數(shù)據(jù)為輸入,對序列數(shù)據(jù)實現(xiàn)降維并利用序列標注得到波形初至的大致到時,利用大致波形初至到時切分波形,并將傳統(tǒng)拾取方法應(yīng)用于切分出的波形數(shù)據(jù),從而精確拾取波形初至到時。郭銳等[36](2019)針對實際采集的井中微地震三份量信號,在設(shè)計訓(xùn)練樣本集的基礎(chǔ)上,最終采用卷積層與循環(huán)神經(jīng)網(wǎng)絡(luò)相結(jié)合的混合網(wǎng)絡(luò)模型。引入循環(huán)神經(jīng)網(wǎng)絡(luò),提高了各接收器到時拾取的相關(guān)性,通過將約束引入訓(xùn)練目標,進一步降低了到時拾取的誤差。張全敏[37](2021)為解決低信噪比微震初至波的自動拾取問題,提出基于長短時記憶網(wǎng)絡(luò)(LSTM)的微震初至拾取算法。利用卷積運算對原始振幅數(shù)據(jù)提取相關(guān)特征,然后將其輸入到長短時記憶網(wǎng)絡(luò)中進行訓(xùn)練,利用長短時記憶網(wǎng)絡(luò)完成對時序數(shù)據(jù)關(guān)系的學(xué)習(xí),接著用Softmax層完成各點的分類,生成一個與輸入數(shù)據(jù)等長的標注序列,首次出現(xiàn)標簽1的采樣點即為P波初至到時點。
基于RNN的拾取方法通過引入RNN,提高各接收器的相關(guān)性,結(jié)合地震數(shù)據(jù)的序列性,提高拾取精度,具有較高的選擇精度和魯棒性。此外,還可以結(jié)合一種特殊的RNN模型——LSTM,完成對時序數(shù)據(jù)關(guān)系的學(xué)習(xí),通過分類得到初至點。該方法基于RNN,隨著RNN的快速發(fā)展和大量運用,也具有較好的研究價值。
隨著人工智能時代的到來,地震研究學(xué)者不斷探索利用先進的機器學(xué)習(xí)方法推動地震勘探的發(fā)展,逐步開展將深度學(xué)習(xí)技術(shù)與地震初至波拾取應(yīng)用相結(jié)合研究,該文通過對比分析深度學(xué)習(xí)中CNN、DBN、GAN和RNN等網(wǎng)絡(luò)模型在地震初至波拾取中的應(yīng)用效果,大致討論了各個方法的存在問題和研究意義。對于未來的研究方向,個人意見如下:
(1)基于CNN的拾取方法中,U-Net具有最大的研究價值,只需少量的標記數(shù)據(jù)進行學(xué)習(xí),就能自適應(yīng)地識別不同的初至?xí)r間,并且可以考慮的方向很多,比如對U-Net本身做改進、和其他網(wǎng)絡(luò)結(jié)構(gòu)(如SegNet、ResNet等)優(yōu)點結(jié)合以及和地震數(shù)據(jù)特點結(jié)合做改進等。ResNet和FCN也可作為考慮對象,尤其是ResNet可以提高網(wǎng)絡(luò)的抗噪能力,但也存在一定的局限性。
(2)基于DBN、GAN、RNN的拾取方法中,GAN和RNN具有較大的研究意義,使用GAN修正異常初至,使用RNN提高各接收器的相關(guān)性,并且還可以充分考慮結(jié)合數(shù)據(jù)的序列性,有效提高拾取精度和效率。至于基于DBN的方法運用較少,僅提供一種思路。
(3)基于深度學(xué)習(xí)的地震初至拾取方法可以有效解決地震初至波數(shù)據(jù)所具有的能量弱、信噪比低、相位變化劇烈、傳統(tǒng)的拾取算法的拾取效率和精度低等一系列問題,提高拾取效率和精度,增強抗噪能力。