賈漯昭 孟令媛 閆睿
摘要:對深度學習的方法原理及主流的前饋神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡、Transformer網(wǎng)絡、自編碼器、生成對抗網(wǎng)絡以及深度強化學習網(wǎng)絡等進行了介紹,討論了不同網(wǎng)絡的適用領(lǐng)域。從震相拾取、震相關(guān)聯(lián)、地震定位與事件檢測,地震信號和地震事件的分類,地震預測預報等方面對近年來深度學習方法的應用技術(shù)進行了提煉總結(jié),綜述了深度學習方法的應用進展,討論了當前常見深度學習方法在地震監(jiān)測預報領(lǐng)域中的主要應用方式、優(yōu)勢特點及解決的主要問題。總結(jié)了現(xiàn)階段深度學習方法在地震監(jiān)測預報領(lǐng)域中存在的應用局限性以及后續(xù)發(fā)展方向。
關(guān)鍵詞:深度學習;監(jiān)測預報;地震檢測;地震定位;地震預測
中圖分類號:P315.72文獻標識碼:A文章編號:1000-0666(2024)03-0336-14
doi:10.20015/j.cnki.ISSN1000-0666.2024.0037
0引言
近年來,隨著人工智能相關(guān)技術(shù)的高速發(fā)展,以深度學習為代表的機器學習相關(guān)技術(shù)在地震學領(lǐng)域的應用迅速增加。深度學習已被廣泛應用于地震事件自動檢測和識別(Lomax et al,2019;Perol et al,2018)、地震事件分類器(Chen et al,2020;Jia et al,2022;隗永剛等,2019;Aden-Antoniow et al,2022;Linville et al,2019)、地震預測(Jasperson et al,2021;Shreedharan et al,2021;Rouet-Leduc et al,2017;石耀霖等,2022;Ma et al,2022)等,并且取得了一定的成果。
事實證明,深度學習相關(guān)算法在地震學中的應用非常理想,一方面是長期的地震觀測業(yè)務工作中積累了大量的標記數(shù)據(jù)集(Mousavi et al,2022b;Linville et al,2019),比如由專業(yè)的地震編目人員精心標注而成的地震目錄,這些目錄不僅包含準確的地震坐標,還包含地震事件類型等參數(shù)。這些數(shù)據(jù)為監(jiān)督學習方法提供了前提條件,也為無監(jiān)督學習方法提供了必要的測試要素。另一方面,許多地震數(shù)據(jù)都有明確的格式和組織方式,例如地震震相報告、地震事件波形、連續(xù)地震觀測波形等。地震學的重要任務之一就是從這些數(shù)據(jù)中提取特征總結(jié)規(guī)律。特征提取的過程一般是計算密集型任務。深度學習算法中采用的反向傳播算法,模型訓練時常用的卷積操作等(Goodfellow et al,2016)都要耗費巨大的算力,這些計算密集型任務隨著圖形處理器(GPU)在計算領(lǐng)域的高速發(fā)展,使原本需要耗費大量時間和資源才能完成的計算任務變得簡單。
Bergen 等(2019)的研究展示了機器學習在地球物理數(shù)據(jù)上的發(fā)展和應用潛力,認為機器學習可以用于地震數(shù)據(jù)自動化處理、建模和反演、發(fā)現(xiàn)地震數(shù)據(jù)固有規(guī)律等方面的研究,通過機器學習可以幫助研究者更好地理解地球動力學過程。Yu和Ma(2021)總結(jié)了深度學習在不同的地球物理任務中的應用,如地球物理勘探、地震數(shù)據(jù)處理、地震數(shù)據(jù)成像、地震資料解釋與分析,指出使用半監(jiān)督和無監(jiān)督學習、遷移學習、多模態(tài)深度學習等深度學習方法在地震學中的應用具有潛力。近年來基于深度學習技術(shù)的地震學研究正在快速增長,Mousavi等(2022a)在《科學》雜志研究指出近幾年深度學習在數(shù)據(jù)處理,正演問題,反演問題、數(shù)據(jù)分析等方面取得了巨大的進展,但作為科學發(fā)現(xiàn)的通用工具,深度學習仍處于起步階段,基于物理且可解釋的深度學習是未來的發(fā)展方向。
1方法概述
深度學習(Deep Learning,DL)是機器學習(Alpaydin,2020;Jordan,Mitchell,2015;Hinton,Salakhutdinov,2006)領(lǐng)域的一個分支,是一種能夠從數(shù)據(jù)中自動學習任務表征的機器學習方法,按照其應用方法可以分為有監(jiān)督學習和無監(jiān)督學習兩大類,有監(jiān)督學習通過有標注的訓練數(shù)據(jù)對模型進行指導解決具體問題,無監(jiān)督學習則是在沒有標注數(shù)據(jù)的情況下,通過尋找數(shù)據(jù)中內(nèi)在結(jié)構(gòu)和特征來學習數(shù)據(jù)規(guī)律。
深度學習方法核心原理是通過多層非線性變換來逐層提取數(shù)據(jù)的高級抽象特征,通過構(gòu)建深層神經(jīng)網(wǎng)絡來學習數(shù)據(jù)的內(nèi)在特征(LeCun et al,2015;Goodfellow et al,2016)。通常深度學習神經(jīng)網(wǎng)絡由多個層次的神經(jīng)元組成,每個神經(jīng)元接收來自上一層的輸入,通過非線性的激活函數(shù)對輸入進行變換,而后將變換后的結(jié)果傳遞給下一層。每一層神經(jīng)元都可以學習到不同的特征表示,而深層網(wǎng)絡可以通過組合這些特征來學習到更加復雜和抽象的特征,從而實現(xiàn)對復雜模式的建模和預測。
在深度學習訓練過程中通常使用梯度下降算法來最小化預測結(jié)果與真實結(jié)果之間的誤差。通過反向傳播算法計算每個神經(jīng)元對誤差的貢獻,并根據(jù)貢獻的大小來更新神經(jīng)元的權(quán)重,從而逐步優(yōu)化網(wǎng)絡的性能。
深度學習可以用于地震數(shù)據(jù)處理和分析。傳統(tǒng)的地震數(shù)據(jù)處理方法通常需要人工干預和專業(yè)知識,而深度學習可以通過自動學習和特征提取減少人工干預,在一定程度上提高數(shù)據(jù)處理效率。深度學習的準確性受模型結(jié)構(gòu)、訓練數(shù)據(jù)、算法優(yōu)化等因素的影響。在實際應用中,需根據(jù)具體問題選擇合適的深度學習方法,并對模型進行調(diào)參和優(yōu)化,以提高其準確性和魯棒性。在應用深度學習時,地震專家仍然需要參與到數(shù)據(jù)的處理和分析過程中,以保證數(shù)據(jù)處理過程正確。深度學習與傳統(tǒng)的機器學習方法,如邏輯回歸、決策樹、支持向量機等相比,具有特征提取不需要手動設(shè)計,處理大規(guī)模數(shù)據(jù)更容易,非線性擬合能力更強、擴展性更高等優(yōu)點(Goodfellow et al,2009,2016)。
深度學習中常用的基本網(wǎng)絡結(jié)構(gòu)包括前饋神經(jīng)網(wǎng)絡(Feedforward Neural Network,F(xiàn)NN)、卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)(圖1)。此外,還有自編碼器(Autoencoder,AE)、生成對抗網(wǎng)絡(Generative Adversarial Network,GAN)、Transformer等網(wǎng)絡結(jié)構(gòu),它們可以使用FNN、CNN、RNN等基本結(jié)構(gòu)來構(gòu)建。另外,強化學習(Deep Reinforcement Learning,DRL)也是一種與深度學習結(jié)合廣泛的方法,以下分別介紹。
前饋神經(jīng)網(wǎng)絡(FNN)是深度學習方法的最初版本,由Rosenblatt(1958)提出,其網(wǎng)絡從輸入層直接映射到輸出層,前一層的輸入連接到下一層的每個單元,不進行反向反饋。只包含多個全連接層的前饋神經(jīng)網(wǎng)絡稱為多層感知器(Multilayer Perceptron,MLP),是最常用的前饋神經(jīng)網(wǎng)絡類型。FNN常用于分類、回歸等任務中。
卷積神經(jīng)網(wǎng)絡(CNN)早期主要用于處理圖像和視頻等數(shù)據(jù)(LeCun et al,2015),其包含卷積層、池化層和全連接層等,是深度學習使用最廣泛的網(wǎng)絡結(jié)構(gòu)。CNN通過卷積操作在輸入數(shù)據(jù)上提取特定的特征信息,池化操作減少數(shù)據(jù)維度,通過反向傳播算法和梯度下降等優(yōu)化方法以及最小化損失函數(shù)來學習模型參數(shù)。在這個過程中實現(xiàn)自動化提取數(shù)據(jù)中的特征和模式,實現(xiàn)分類、回歸等任務。在地震監(jiān)測中,CNN常用于處理地震波形數(shù)據(jù),用以提取波形特征。其特點是可以通過卷積層對地震數(shù)據(jù)進行降維,自動提取特征,有效提升這類任務的效率和準確率。
循環(huán)神經(jīng)網(wǎng)絡(RNN)用于處理時序數(shù)據(jù)的神經(jīng)網(wǎng)絡(Elman,1990),在不同時間片段間傳遞信息,網(wǎng)絡的輸出或隱藏狀態(tài)被用作循環(huán)中的輸入,在語音識別和自然語言處理等領(lǐng)域應用廣泛。作為循環(huán)神經(jīng)網(wǎng)絡的一種變體,長短時記憶網(wǎng)絡也取得了較大的影響(Long Short-Term Memory,LSTM)(Hochreiter,Schmidhuber,1997),它是一種特殊的循環(huán)神經(jīng)網(wǎng)絡,能夠在處理長序列時避免梯度消失和爆炸問題,使得模型能夠更好地保留長期記憶。在地震學中,RNN可以用于處理地震事件序列數(shù)據(jù),并建立時間上的關(guān)聯(lián)性。
Transformer網(wǎng)絡是針對數(shù)據(jù)序列建模的神經(jīng)網(wǎng)絡模型其主要特點是引入了自注意力機制(Self-Attention Mechanism)來建模輸入序列中的長距離依賴關(guān)系,避免了傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(RNN)中梯度消失等問題。近年來,Transformer在機器翻譯、文本生成、自然語言處理等方面成果顯著,如最近自然語言處理領(lǐng)域大獲成功的ChatGPT(Brown et al,2020)。在地震學中,已經(jīng)證明其可以應用于地震事件檢測,震相提取等工作(Mousavi et al,2020a)。
自編碼器(AE)是一種應用于無監(jiān)督學習的神經(jīng)網(wǎng)絡模型(Hinton,Salakhutdinov,2006),通過對數(shù)據(jù)進行壓縮和解壓縮,學習數(shù)據(jù)中的主要特征,對數(shù)據(jù)降維后用于回歸或者分類任務,常見于圖像、音頻和視頻信號的降噪和壓縮編碼。可以用于降維和特征提取。在地震學中,AE可以用來對高維地震數(shù)據(jù)進行降維和特征提取。
生成對抗網(wǎng)絡(GAN)是由一個生成器和一個判別器組成的神經(jīng)網(wǎng)絡模型(Goodfellow et al,2014),使用低維隨機向量從生成器生成樣本,然后由鑒別器將樣本分類為真或假。一般用于生成逼真的虛擬數(shù)據(jù),如圖像、視頻等,近年也用于提取特征,從而進行分類或者目標檢測。在地震學中,GAN可以用于生成、合成地震波形數(shù)據(jù)或增加其他類型的樣本數(shù)據(jù)。
深度強化學習(DRL)結(jié)合了深度學習和強化學習的方法,使用深度學習網(wǎng)絡進行特征提取,加入獎勵機制從而影響神經(jīng)網(wǎng)絡整體決策,在未知環(huán)境中實現(xiàn)端到端的學習和控制,常用于游戲、機器人控制等領(lǐng)域(Mnih et al,2015)。Google旗下DeepMind公司的Alpha Go(Silver et al,2016)和Alpha Zero(Silver et al,2017)在圍棋領(lǐng)域取得突破,戰(zhàn)勝人類頂尖圍棋選手即使用類似技術(shù)。這一機制,在地震學中可用于地震預報等相關(guān)工作。
除了以上常見的深度學習網(wǎng)絡結(jié)構(gòu)以外,另外一些神經(jīng)網(wǎng)絡結(jié)構(gòu)變體也在深度學習領(lǐng)域中取得了很好的應用效果。比如Variational Auto-Encoders(VAE)被應用于地震震源譜的生成方面(Ma et al,2022)。Graph Neural Networks(GNN)能夠處理處理非規(guī)則化數(shù)據(jù),在地震波形反演,地震事件分類識別方面都有進展(Bilal et al,2022;Zhang et al,2022)。不同種類的深度學習方法適用于不同的任務和數(shù)據(jù)類型,恰當?shù)姆椒蛇M一步提高模型性能。
2應用與發(fā)展
目前我國地震監(jiān)測預報工作包括地震速報編目和地震預報等。隨著深度學習方法的有效實施,這些領(lǐng)域都取得了飛速發(fā)展。
2.1地震速報編目
在基于深度學習的地震監(jiān)測工作流程中,通常先通過相關(guān)深度學習算法進行地震震相的識別檢出,再通過震相關(guān)聯(lián)算法把震相聯(lián)合到一個地震事件上,對地震定位處理形成自動化的地震目錄。在這個過程中,涉及震相拾取、震相關(guān)聯(lián)、地震定位與事件檢測、地震波形分類等工作。
(1)震相拾取
基于深度學習的地震初至波識別檢測發(fā)展方法較多,深度學習到時拾取算法可以克服傳統(tǒng)方法的一些缺點。這類方法通常首先檢測出初至P波或S波,Mousavi等(2019b)、Withers 等(1998)、Yoon 等(2015)、Zhu和Beroza(2019)都提出了很好的初至波提取方案。
Zhao 等(2019)、Zhou 等(2019)在使用足夠大訓練集的條件下,已經(jīng)實現(xiàn)比STA/LTA更高的準確性和分類精度。同時進行震相拾取和地震事件檢測可以進一步提高兩個任務的準確性(Mousavi et al,2020a;Zhou et al,2019)。其他學者如Perol等(2018)、Hu 等(2019)、Wang等(2021)、張逸倫等(2021)、李輝峰等(2006)的研究也取得了很好的應用效果。
Ross等(2018)開發(fā)了用于自動P波拾取和初動識別的卷積神經(jīng)網(wǎng)絡(CNN),并使用美國南加州地震臺網(wǎng)(SCSN)2000—2017年的地震數(shù)據(jù)進行了檢測(圖2),震相識別精度達到了專業(yè)人員水平,這也是地震震相拾取的典型網(wǎng)絡結(jié)構(gòu)。
Zhu和Beroza(2019)基于U-Net神經(jīng)網(wǎng)絡提出了到時震相拾取方法PhaseNet,該方法使用三分量地震波形作為輸入,輸出為P、S波到時以及噪聲概率。PhaseNet在設(shè)計和訓練過程中以地震事件為中心,可以在單一地震波段完成震相到時拾取,但在連續(xù)波形上進行震相識別時需要進行窗口截取等操作。趙明等(2019)將PhaseNet震相拾取模型用于連續(xù)波形。尹欣欣等(2022)將PhaseNet模型應用于2013年岷縣MS6.6余震檢測中,在微震檢測上對比了人工方法和深度學習方法,證明深度學習方法在中小地震事件檢測中具有較強的魯棒性。
Wang 等(2019)基于殘差網(wǎng)絡設(shè)計了深度學習方法PickNet來自動拾取更多的局部地震的P波和S波到達時間,并給出了參考應用,說明其結(jié)果可以直接用于地震層析成像。對PickNet少量改動即可應用于其它震相(如PmP、SmS和PKiKP)的拾取。Mousavi等(2020a)提出了用于同時進行地震事件檢測和震相拾取的全局深度學習模型EQTransformer,它由一個非常深的編碼器和三個單獨的解碼器組成,通過使用分層注意力機制檢測地震信號,并在近震(<300 km)記錄中拾取首個P和S震相(圖3)。它與PhaseNet,PickNet有相似的功能,在震相拾取方面各有千秋。
Zhou等(2019)將地震波形看作有前后關(guān)聯(lián)的時間序列數(shù)據(jù),利用循環(huán)神經(jīng)網(wǎng)絡(RNN)對時間序列不同階段變化作出預測,并根據(jù)每段開始的時間拾取震相。李薇薇等(2021)通過U-Net深度神經(jīng)網(wǎng)絡,將震相拾取問題轉(zhuǎn)換為二值分類問題。陳德武等(2020,2021)通過使用多個卷積塊的殘差連接替代跳躍連接的方式,改進U-Net網(wǎng)絡結(jié)構(gòu),使用多道觀測數(shù)據(jù)解決微弱信號在低信噪比中震相拾取準確率低的問題。鄭晶等(2018)提出基于 S 變換和深度信念神經(jīng)網(wǎng)絡的地震波到時拾取方法,對原始數(shù)據(jù)進行 S 變換,提高小數(shù)據(jù)量樣本的識別效率。周創(chuàng)等(2020)使用深度卷積對抗神經(jīng)網(wǎng)絡(DCGAN),選取初至時刻后含波峰的半波長數(shù)據(jù)作為初至特征加入訓練,將噪聲數(shù)據(jù)與含初至震相的數(shù)據(jù)輸入生成器與判別器進行訓練。Zheng 等(2018)提出基于深度遞歸神經(jīng)網(wǎng)絡的初至拾取算法,通過在原始數(shù)據(jù)集中加入隨機噪聲的方式達選擇任務轉(zhuǎn)換為序列標記任務。劉芳等(2020)基于U-Net網(wǎng)絡提出了識別P波和S波的震相拾取方法(APP)應用于地震臺陣。李健等(2020)使用震相拾取的多任務卷積神經(jīng)網(wǎng)絡結(jié)構(gòu),利用美國南加州地震臺網(wǎng)的200萬條震相和噪聲數(shù)據(jù)進行訓練,利用遷移學習和數(shù)據(jù)增強將訓練模型應用于東北地區(qū)地震臺網(wǎng),震相識別率達84.5%。
(2)震相關(guān)聯(lián)
震相關(guān)聯(lián)是地震事件自動檢測的關(guān)鍵流程,它將不同地震臺站記錄到的同一個地震的震相聯(lián)系在一起從而確定地震事件,是形成地震目錄的基礎(chǔ)。Ross等(2019)基于遞歸神經(jīng)網(wǎng)絡(RNN)提出了一種無網(wǎng)格震相關(guān)聯(lián)的深度學習方法(PhaseLink)。一旦確定震源,該方法就可以對附近的所有震相進行快速反向投影,從而關(guān)聯(lián)到該事件的識別震相。在震相關(guān)聯(lián)中使用深度學習方法可以高精度、高召回率地利用其特征提取能力,結(jié)合大量標記好的數(shù)據(jù)集,提高地震事件檢測的準確性和效率(Draelos et al,2015;Yeck et al,2019;Zhang et al,2019;Zhu et al,2022a)。
(3)地震定位與事件檢測
許多中小地震甚至微震事件,可能體現(xiàn)更多的地震活動規(guī)律,但傳統(tǒng)的地震檢測手段對微震事件檢出率相對較低。使用深度學習方法,可以提高對小地震事件的檢測能力。對歷史地震連續(xù)波形使用深度學習方法地震事件檢測可以為研究地震活動規(guī)律提供更多有價值的信息。
深度學習應用于地震事件的自動檢測和定位,可減輕使用傳統(tǒng)的人工地震定位方法(孔韓東等,2017)開展地震速報和編目的負擔。近幾年基于深度學習方法的地震定位方法發(fā)展較快,比如Perol等(2018)開發(fā)了卷積定位網(wǎng)絡(ConvNetQuake),使用監(jiān)督學習的方法將地震定位轉(zhuǎn)化為分類問題,并在美國俄克拉荷馬州進行地震定位以及地震活動性研究,其模型的地震事件檢出準確率為74.5%。Lomax等(2019)改進了其方法(ConvNetQuake_INGV),使該卷積神經(jīng)網(wǎng)絡的地震事件檢出準確率提升至87%。
一些學者利用深度學習方法對地震事件進行自動檢測和定位,提高了檢測和定位的準確性,如Wiszniowski等(2014)開發(fā)了一種使用遞歸神經(jīng)網(wǎng)絡(RNN)的實時地震檢測算法。Perol等(2018)、Wu 等(2017,2018)、Zhu和Beroza(2019)使用深度學習的不同網(wǎng)絡架構(gòu)應用于自動地震事件檢測和震相拾取。Mosher和Audet(2020)、Xiao等(2021)、Feng 等(2022)結(jié)合Transformer網(wǎng)絡架構(gòu)(Saad et al,2021),級聯(lián)神經(jīng)網(wǎng)絡架構(gòu)(DCNN)[KG0](Majstorovic et al,2021)及遷移學習(Lapins et al,2021)改進了深度學習地震監(jiān)測方法,進一步提高了深度學習地震檢測的魯棒性和泛化能力,同時減少了需要的數(shù)據(jù)樣本量。
Kriegerowski等(2019)直接使用多臺站的三分量地震波形數(shù)據(jù)訓練卷積神經(jīng)網(wǎng)絡,應用于地震定位。Kail等(2021)將循環(huán)神經(jīng)網(wǎng)絡與卷積神經(jīng)網(wǎng)絡相結(jié)合設(shè)計了地震定位的新方法應用于日本地區(qū)。Janbakhsh等(2019)將循環(huán)神經(jīng)網(wǎng)絡(RNN)、自編碼器(AE)與卷積神經(jīng)網(wǎng)絡(CNN)相結(jié)合,提出 CNN+AE+RNN 的方法,完成了地震檢測、震級預測和震中距測定工作。
Mousavi和Beroza和(2020a)提出了由兩個深度貝葉斯神經(jīng)網(wǎng)絡組成的地震定位方法,其中一個網(wǎng)絡用于預測P波走時和震中距,另一個網(wǎng)絡用于預測反方位角,結(jié)果都取得了較高精度。
傳統(tǒng)的地震定位很大程度上依賴于速度模型,容易受到震相拾取不準確的影響(孔韓東等,2017)。Zhang 等(2020)開發(fā)了一種方法,使用多個地震臺站的全波形進行輸入,適用于中小地震(ML<3.0)直接輸出定位結(jié)果,該方法對信噪比要求較低。
趙明等(2021)應用震相識別和震相關(guān)聯(lián)技術(shù)對2019年6月17日四川長寧MS6.0地震震中附近21個地震臺站震前半個月的連續(xù)波形進行處理,獲得的地震目錄數(shù)量是人工地震目錄的8倍以上,同時監(jiān)測能力下限也提升至ML1.0左右,揭示了長寧 MS6.0主震所發(fā)生的區(qū)域震前異常頻繁的微震活動以及與區(qū)域內(nèi)鹽礦注水井的關(guān)聯(lián)性。
Mousavi等(2019c)基于深度神經(jīng)網(wǎng)絡的CNN和RNN的組合設(shè)計了地震檢測器(CRED),使用卷積層和雙向長短時記憶單元的組合結(jié)構(gòu),在殘差結(jié)構(gòu)中進行檢測,其檢測到的最小地震低至ML1.3。
Chen(2022)將深度學習震相檢測器EQTransformer(Mousavi et al,2020a)應用于海底地震儀(OBS)的觀測數(shù)據(jù),并使用快速地震關(guān)聯(lián)和定位(REAL)算法關(guān)聯(lián)檢測到的震相(Zhang et al,2019),再通過反演(Klein,2002)和HypoDD程序完善震源位置(Waldhauser,Ellsworth,2000),發(fā)現(xiàn)了超過1 975次地震,從而對馬里亞納海溝最南端深處的構(gòu)造結(jié)構(gòu)有了新的認識。作者還對比了EQTransformer與PhaseNet(Zhu,Beroza,2019)在震相拾取上的優(yōu)缺點。
Cianetti等(2021)和Münchmeyer等(2022)比較了Generalized Phase Detection(GPD)和EQTransformer等常見模型識別地震事件的能力,展現(xiàn)了不同場景下的算法表現(xiàn),并特別測試了他們在訓練集之外數(shù)據(jù)的泛化能力,給出了各種模型的應用要點。
Zhou等(2022)基于深度學習方法開發(fā)了一種地震檢測和地震定位的方法(Phasepicking,Association,Location,and Matchedfilter,PALM),可直接快速生成高質(zhì)量的地震目錄。另外,深度學習還可以幫助單臺信號估算地震位置和震級(Mousavi,Beroza,2020a,b)。Zhu等(2022b)開發(fā)了用于聯(lián)合震相選擇和關(guān)聯(lián)的端到端架構(gòu)識別P和S波到時,之后通過聚合多個測震站點提取到的波形特征關(guān)聯(lián)和監(jiān)測地震事件。其算法在斯坦福地震數(shù)據(jù)集(STEAD)和2019年加州里奇克雷斯特地震序列上進行了評估。
Yoon等(2015)、Bergen和Beroza(2018)、Rong 等(2018)采用無監(jiān)督模式挖掘方法進行地震檢測,使用快速相似性算法搜索連續(xù)波形數(shù)據(jù)中的相似或重復的地震信號。這類方法支持多個測震站點,并可處理長達10年的連續(xù)數(shù)據(jù)。蘇金波等(2021)使用深度學習方法進行了高分辨率地震目錄生成。Dahmen等(2022)基于深度學習網(wǎng)絡提出了用于檢測火星地震和去除噪聲的檢測器。他們的方法基于三分量地震數(shù)據(jù)進行自動事件檢測和去噪,可以檢測到大約60%手動編目未發(fā)現(xiàn)的地震事件。
(4)地震信號與事件分類
采用深度學習方法在地震信號和事件識別分類中也表現(xiàn)出優(yōu)于經(jīng)典方法的能力,包括從爆炸和其他來源中區(qū)分地震、從背景噪聲中分離地震信號、地震事件聚類等等。
Magaa-Zook和Ruppert(2017)使用長短期記憶(LSTM)網(wǎng)絡,區(qū)分自然地震活動與爆炸。Li等(2018)在地震預警系統(tǒng)中使用美國南加州和日本的30萬個地震波形生成對抗網(wǎng)絡(GAN)獲取地震波的P波特征,在此基礎(chǔ)上使用隨機森林分類器將地震事件區(qū)分為地震信號或是噪聲。Meier等(2019)使用深度卷積網(wǎng)絡識別噪聲與信號,精度可達99%以上。Mousavi等(2019b)開發(fā)了在強噪聲環(huán)境下區(qū)分地震信號的方法。
陳潤航等(2018)對原始地震波形劃分窗口提取梅爾頻率倒譜系數(shù)作為特征構(gòu)建神經(jīng)網(wǎng)絡進行地震事件的分類識別。隗永剛等(2019)基于深度學習技術(shù)中的殘差網(wǎng)絡模型,提出了爆破識別方法。Chen等(2022)使用無監(jiān)督模糊聚類方法將連續(xù)波形分為波形點和非波形點,證明了其方法在中等強度噪聲的條件下優(yōu)于長短期平均(STA/LTA)方法。Kim等(2021)對比了使用隨機森林和卷積神經(jīng)網(wǎng)絡中有監(jiān)督的分類方法和無監(jiān)督分類的K-Medoids聚類方法在微震數(shù)據(jù)集的應用,達到了同級別的準確率。Linville等(2019)在三分量和單通道傳感器90秒事件頻譜圖上使用RNN和CNN來區(qū)分工業(yè)爆破活動(例如采礦或采石爆炸)和天然構(gòu)造地震,探討了不同的特征提取方法對分類器性能的影響。Chen 等(2019)提出了高噪聲環(huán)境下的CNN架構(gòu)用于地震事件波形分類方法和一種將CNN與k-means聚類(CNN-KC)相結(jié)合的到時拾取方法,證明CNN模型的性能比MLP表現(xiàn)更好,而CNN-KC在到時拾取方面也優(yōu)于k-means聚類,特別是對于噪聲水平較高的微震數(shù)據(jù)。
Jia 等(2022)設(shè)計了3種深度學習分類器對地震事件進行實時分類(圖4),將地震事件實時分類為地震、爆破、塌陷等。并詳細對比了串聯(lián)、并聯(lián)以及殘差深度學習網(wǎng)絡在使用上的優(yōu)缺點,其設(shè)計的深度學習分類器在中國區(qū)域地震臺網(wǎng)實驗精度均超過90%。
2.2地震預測
地震預測是地震監(jiān)測預報領(lǐng)域的重要工作,也是深度學習方法在地震學中的重要應用領(lǐng)域。深度學習方法將不同類型的地球物理觀測數(shù)據(jù)和地震活動聯(lián)合分析,結(jié)合已知的地球物理約束,可以提高地震預測的準確性和可靠性,也可以幫助地震學家更好地理解和描述不同類型的地震事件的震源特征。Mignan和Broaardo(2020)指出,近年來在地震監(jiān)測預報領(lǐng)域?qū)⑸疃葘W習網(wǎng)絡應用于地震預測的研究逐漸大幅增加,并且用于地震預測的深度學習神經(jīng)網(wǎng)絡結(jié)構(gòu)逐年愈加復雜。
目前我國的地震預測工作劃分為長、中、短臨不同的預測時段,短臨階段的地震預測減災效果最大,地震短臨異常也是地預測預報是否成功的關(guān)鍵(張肇誠,張煒,2016)。在1975年2月4日海城地震中,主震發(fā)生前幾個月至幾小時的前震活動,被認為是可信的測震學異常前兆(Wyss,1997)。
在地震預測方面,深度學習方法結(jié)合地震目錄的完整時空結(jié)構(gòu),利用深度卷積的自動特征提取能力及其學習動態(tài)數(shù)據(jù)的潛力為地震可預測性提供新的認識,一些例子已經(jīng)說明其方法有效性高于傳統(tǒng)的經(jīng)驗方法。
在實驗室地震預測方面,F(xiàn)ieseler等(2022)將無監(jiān)督稀疏回歸模型應用于對與不同開裂機制相關(guān)的聲發(fā)射信號進行分類,并建議使用重建精度作為分類指標。通過將神經(jīng)網(wǎng)絡的注意力集中在具體特征、斷裂載荷模式(Song et al,2022)和斷裂飽和度(Nolte,Pyrak-Nolte,2022)方面,成功實現(xiàn)了實驗室地震的預測(Jasperson et al,2021;Shreedharan et al,2021)。
Panakkat和Adeli(2007)在十幾年前就構(gòu)建了一個人工神經(jīng)網(wǎng)絡(ANN)系統(tǒng),根據(jù)地震活動性指標(如自上次事件以來經(jīng)過的時間、過去事件釋放的能量以及古登堡-里克特關(guān)系的參數(shù))預測未來幾個月的大地震事件。該系統(tǒng)在美國南加州和舊金山灣地區(qū)的地震活動中得到了一定程度的成功應用。
Panakkat和Adeli(2009)基于循環(huán)神經(jīng)網(wǎng)絡(RNN)的方法提出了預測震中位置和發(fā)震時刻的方法,其將研究地區(qū)細分為多個小區(qū)域,用記錄到的地震事件數(shù)據(jù)訓練循環(huán)神經(jīng)網(wǎng)絡,使得網(wǎng)絡具備預測地震位置的能力。Mirrashid(2014)使用了3種ANFIS算法(網(wǎng)格劃分、子活動聚類和模糊C-均值)來預測伊朗的地震并獲得了大約0.95的相關(guān)系數(shù),預報效能極高,但作者使用了1 958個數(shù)據(jù)樣本進行模型訓練,可能存在數(shù)據(jù)過擬合,泛化能力低的問題。Last等(2016)使用機器學習相關(guān)技術(shù)來預測最大地震事件的震級,使用ROC曲線進行評估,其AUC值為0.7。說明該方法在地震預測上具備一定的預測效能。
Asencio-Cortés等(2017a)使用主成分分析(PCA)來降低地震目錄特征維度,并成功應用于地震預測。作者還對比了人工神經(jīng)網(wǎng)絡,樸素貝葉斯,支持向量機,決策樹、隨機森林、K近鄰等方法,在實驗中人工神經(jīng)網(wǎng)絡取得了最佳的預報效能。Asencio-Cortés等(2017b)又提出了一種基于人工神經(jīng)網(wǎng)絡的方法(EQP-ANN)的地震預測器,將地震震級預測轉(zhuǎn)化為適合建立基于機器學習的比較的分類問題,并應用于預測東京中大型地震震級,這說明了基于神經(jīng)網(wǎng)絡的地震預測方法適合地震預報工作。
Field等(2017)基于概率預測提出了長短時間自洽的UCERF3地震預報模型,Shcherbakov等(2019)將貝葉斯網(wǎng)絡與極值理論相結(jié)合,通過研究過去的地震活動來計算大震的預測分布,評估發(fā)震概率。石耀霖等(2022)運用機器學習方法中的長短時記憶神經(jīng)網(wǎng)絡(LSTM)對川滇地區(qū)進行了地震中期預報,準確率為70.2%。
Seydoux等(2020)使用無監(jiān)督深度學習方法識別數(shù)據(jù)中的模式,并應用于地震波形數(shù)據(jù),揭示了2017年格陵蘭島大規(guī)模破壞性滑坡和海嘯之前的前兆信號。Ida和Ishida(2022)使用無監(jiān)督學習的AI技術(shù)-自組織圖(SOM)分析了地震活動的時間和空間分布,以日本北部、中部東北地區(qū)和關(guān)東地區(qū)適當劃分的空間段的地震目錄進行測試,從地震目錄的分布中找出大地震和較小地震之間的關(guān)系,證明了此類機器學習方法是提取地震狀態(tài)隱藏規(guī)律的有力工具,適用于地震預測。
DeVries等(2018)采用深度學習方法,使用超過13萬個主、余震對,訓練神經(jīng)網(wǎng)絡用于預測余震位置,預測效能達到0.849,且其方法具有較好的可解釋性。Ma等(2022)使用深度變分自編碼無監(jiān)督機器學習方法,推導了來自3 675個MW>5.5全球地震的震源譜,表明深度變分自編碼方法可能揭示大型和高維地震數(shù)據(jù)的隱藏特征。
Zhu等(2021)設(shè)計了一種用于強化學習的神經(jīng)嵌入時空網(wǎng)絡(NEST),對比了ETAS算法模型(Ogata,2017),并使用美國密蘇里州新馬德里發(fā)生的4次地震及其余震作為研究對象,說明了離散地震事件作為訓練數(shù)據(jù)和模型生成數(shù)據(jù)之間的經(jīng)驗分布之間的差異。證明了基于強化學習的神經(jīng)網(wǎng)絡方法在捕捉空間信息,呈現(xiàn)復雜的空間相關(guān)性、可解釋性和計算效率方面的優(yōu)勢。這些例子說明了以深度學習為代表的相關(guān)數(shù)據(jù)分析技術(shù)在地震預報領(lǐng)域中的潛力,也說明新一代的精細化地震目錄為地震預報工作帶來了新的轉(zhuǎn)機。但使用機器學習相關(guān)方法預測地震需要考慮訓練樣本數(shù)據(jù)量以及當?shù)氐刭|(zhì)結(jié)構(gòu)特點。不能盲目迷信高準確度,避免陷入過擬合與低泛化或者無法泛化的陷阱中。
2.3其它應用
深度學習方法已經(jīng)在地震監(jiān)測預報各個方面都取得了較好的進展。有學者使用深度學習方法改進地殼接收函數(shù)計算效率等方面(Wang et al,2022;李志強等,2021;楊庭威等,2022;甘露等,2021)。在地震矩張量反演(Steinberg et al,2021)、層析成像(Araya-Polo et al,2018)中都取得了良好的效果。
3討論與結(jié)論
本文介紹了深度學習方法背景和常見深度學習網(wǎng)絡結(jié)構(gòu),概述了近年來利用深度學習方法在地震監(jiān)測預報領(lǐng)域的發(fā)展及研究成果,討論并總結(jié)了深度學習方法值得注意的方面與應用展望
(1)深度學習方法在地震監(jiān)測預報領(lǐng)域的應用已經(jīng)得到了廣泛的關(guān)注和研究,已有的深度學習在地震監(jiān)測預報方面的應用,為地震學家處理高維、海量、復雜的大規(guī)模地震觀測數(shù)據(jù)提供了新的思路和方法。通過深度學習的高效計算和特征提取能力,也將幫助人們更好地理解地球內(nèi)部結(jié)構(gòu)和物理過程,并提高對自然災害的預警和響應能力。
(2)隨著深度學習方法與地震監(jiān)測預報的深度融合,未來在地震信號識別、發(fā)震機理探索,地震預測預報、地震數(shù)據(jù)解釋等方面可能會取得進一步的發(fā)展?;谏疃葘W習的地震學方法已被證明比傳統(tǒng)方法更有效和準確(Qin et al,2022;Zou et al,2022)。
雖然深度學習已取得一定研究進度,但在地震監(jiān)測預報領(lǐng)域仍然存在以下需要解決的問題:
(1)在數(shù)據(jù)過擬合方面,處理復雜地質(zhì)結(jié)構(gòu)和非線性效應時,深度學習模型可能會出現(xiàn)過擬合或欠擬合等問題(Li et al,2023)。尤其是深度學習網(wǎng)絡過于龐大時,網(wǎng)絡參數(shù)數(shù)量甚至遠遠大于訓練樣本數(shù)量,這將不可避免地帶來模型過擬合,泛化能力差等問題(Jia et al,2022)。需要進一步研究和發(fā)展新的算法和技術(shù)來克服這些挑戰(zhàn)。
(2)在數(shù)據(jù)方面,深度學習模型通常需要大量的訓練數(shù)據(jù)進行擬合和優(yōu)化,而通常有標注的地震數(shù)據(jù)有限,而且有些數(shù)據(jù)受到觀測環(huán)境干擾,數(shù)據(jù)質(zhì)量不達標。這就需要對地震數(shù)據(jù)進行精細化標注和數(shù)據(jù)預處理,這將耗費大量的人力物力。
(3)隨著網(wǎng)絡結(jié)構(gòu)的增加,深度學習算法在訓練和優(yōu)化方面需要大量的數(shù)據(jù)和計算資源支持,這也是目前深度學習在地震學應用中受到限制的一個重要因素。深度學習通常需要多路并行的高性能圖形處理單元,價格昂貴??茖W家需要更好地利用現(xiàn)有資源,開發(fā)出更高效、更精確、更可靠的深度學習算法來解決這些問題。
展望未來,深度學習技術(shù)在地震監(jiān)測預報領(lǐng)域?qū)玫礁訌V泛和深入的應用,產(chǎn)出更有實際價值的產(chǎn)品。但是,深度學習技術(shù)在地震監(jiān)測預報領(lǐng)域仍處于初級階段,尚存在許多亟待解決的問題,需要進一步完善和優(yōu)化。地震工作者還需繼續(xù)研究和探索深度學習技術(shù)方法,更好地為地震監(jiān)測預報工作服務,為社會服務。
評審專家和本文編輯提出了諸多指導建議,對稿件質(zhì)量提升幫助很大,在此表示感謝。
參考文獻:
陳德武,楊午陽,魏新建,等.2020.基于混合網(wǎng)絡 U-SegNet 的地震初至自動拾?。跩].石油地球物理勘探,55(6):1188-1201.Chen D W,Yang W Y,Wei X J,et al.2020.Automatic picking of seismic first arrivals based on hybrid network U-SegNet[J].Oil Geophysical Prospecting,55(6):1188-1201.(in Chinese)
陳德武,楊午陽,魏新建,等.2021.一種基于改進的 U-Net 網(wǎng)絡的初至自動拾取研究[J].地球物理學進展,36(4):1493-1503.Chen D W,Yang W Y,Wei X J,et al.2021.Research on first-break automatic picking based on an improved U-Net network[J].Progress in Geophysics,36(4):1493-1503.(in Chinese)
陳潤航,黃漢明,柴慧敏.2018.地震和爆破事件源波形信號的卷積神經(jīng)網(wǎng)絡分類研究[J].地球物理學進展,33(4):1331-1338.Chen R H,Huang H M,Chai H M.2018.Study on the discrimination of seismic waveform signals between earthquake and explosion events by convolutional neural network[J].Progress in Geophysics,33(4):1331-1338.(in Chinese)
甘露,吳慶舉,黃清華,等.2021.卷積神經(jīng)網(wǎng)絡快速挑選接收函數(shù)[J].地球物理學報,64(7):2394-2404.Gan L,Wu Q J,Huang Q H,et al.2021.Quick selection of receiver function based on convolutional neural network[J].Chinese Journal of Geophysics,64(7):2394-2404.(in Chinese)
孔韓東,邊銀菊,劉瑞豐,等.2017.地震定位方法研究進展[J].地震地磁觀測與研究,38(4):81-92.Kong H D,Bian Y J,Liu R F,et al.2017.Review of seismic location study[J].38(4):81-92.(in Chinese)
李輝峰,鄒強,金文昱.2006.基于邊緣檢測的初至波自動拾取方法[J].石油地球物理勘探,41(2):150-155,159.Li H F,Zou Q,Jin W Y.2006.Method of automatic first breaks pick-up based on edge detection[J].Oil Geophysical Prospecting,41(2):150-155,159.(in Chinese)
李健,王曉明,張英海,等.2020.基于深度卷積神經(jīng)網(wǎng)絡的地震震相拾取方法研究[J].地球物理學報,63(4):1591-1606.Li J,Wang X M,Zhang Y H,et al.2020.Research on the seismic phase picking method based on the deep convolution neural network[J].Chinese Journal of Geophysics,63(4):1591-1606.(in Chinese)
李薇薇,龔仁彬,周相廣,等.2021.基于深度學習 UNet++網(wǎng)絡的初至波拾取方法[J].地球物理學進展,36(1):187-194.Li W W,Gong R B,Zhou X G,et al.2021.UNet++:a deep-neural-network-based seismic arrival time picking method[J].Progress in Geophysics,36(1):187-194.(in Chinese)
李志強,田有,趙鵬飛,等.2021.基于深度學習的接收函數(shù)自動挑選方法[J].地球物理學報,64(5):1632-1642.Li Z Q,Tian Y,Zhao P F,et al.2021.Receiver functions auto-picking method on the basis of deep learning[J].Chinese Journal of Geophysics,64(5):1632-1642.(in Chinese)
劉芳,蔣一然,寧杰遠,等.2020.結(jié)合臺陣策略的震相拾取深度學習方法[J].科學通報,65(11):1016-1026.Liu F,Jiang Y R,Ning J Y,et al.2020.An array-assisted deep learning approach to seismic phase-picking[J].Chin Sci Bull,65(11):1016-1026.(in Chinese)
石耀霖,李林芳,程術(shù).2022.運用LSTM神經(jīng)網(wǎng)絡對川滇地區(qū)的地震中期預報——回溯性預測2008年汶川MS8.0地震的探索[J].中國科學院大學學報,39(1):1-12.Shi Y L,Li L F,Cheng S,et al.2022.Application of LSTM neural network for intermediate-term earthquake prediction:retrospective prediction of 2008 Wenchuan MS8.0 Earthquake[J].Journal of University of Chinese Academy of Sciences,39(1):1-12.(in Chinese)
蘇金波,劉敏,張云鵬,等.2021.基于深度學習構(gòu)建2021年5月21日云南漾濞MS6.4地震序列高分辨率地震目錄[J].地球物理學報,64(8):2647-2656.Su J B,Liu M,Zhang Y P,et al.2021.High resolution earthquake catalog building for the 21 May 2021 Yangbi,Yunnan,MS6.4 earthquake sequence using deep-learning phase picker.Chinese Journal of Geophysics[J].Chinese Journal of Geophysics,64(8):2647-2656.(in Chinese)
隗永剛,楊千里,王婷婷,等.2019.基于深度學習殘差網(wǎng)絡模型的地震和爆破識別[J].地震學報,41(5):646-657.Wei Y G,Yang Q L,Wang T T,et al.2019.Earthquake and explosion identification based on deep learning residual network model[J].Acta Seismologica Sinica,41(5):646-657.(in Chinese)
楊庭威,曹丹平,杜南樵,等.2022.基于深度學習的接收函數(shù)橫波速度預測[J].地球物理學報,65(1):214-226.Yang T W,Cao D P,Du N Q,et al.2022.Prediction of shear-wave velocity using receiver functions based on the deep learning method[J].Chinese Journal of Geophysics,65(1):214-226.(in Chinese)
尹欣欣,楊曉鵬,蔡潤,等.2022.基于PhaseNet的地震信號自動處理方法準確性分析[J].大地測量與地球動力學,42(8):870-873.Yi X X,Yang X P,Cai R,et al.2022.Accuracy analysis of automatic seismic signal processing method based on PhaseNet[J].Journal of Geodesy and Geodynamics,42(8):870-873.(in Chinese)
張逸倫,喻志超,胡天躍,等.2021.基于 U-Net 的井中多道聯(lián)合微地震震相識別和初至拾取方法[J].地球物理學報,64(6):2073-2085.Zhang Y L,Yu Z C,Hu T Y,et al.2021.Multi-trace joint downhole microseismic phase detection and arrival picking method based on U-Net[J].Chinese Journal of Geophysics,64(6):2073-2085.(in Chinese)
張肇誠,張煒.2016.地震預報可行性的科學與實踐問題討論[J].地震學報,38(4):564-579.Zhang Z C,Zhang W.2016.Discussion on scientific and practical problems of feasibility of earthquake prediction[J].Acta Seismologica Sinica,38(4):564-579.(in Chinese)
趙明,陳石,房立華,等.2019.基于U形卷積神經(jīng)網(wǎng)絡的震相識別與到時拾取方法研究[J].地球物理學報,62(8):3034-3042.Zhao M,Chen S,F(xiàn)ang L H,et al.2019.Earthquake phase arrival auto-picking based on U-shaped convolutional neural network[J].Chinese Journal of Geophysics,62(8):3034-3042.(in Chinese)
趙明,唐淋,陳石,等.2021.基于深度學習到時拾取自動構(gòu)建長寧地震前震目錄[J].地球物理學報,64(1):54-66.Zhao M,Tang L,Chen S,et al.2021.Machine learning based automatic foreshock catalog building for the 2019 MS6.0 Changning,Sichuan earthquake[J].Chinese Journal of Geophysics,64(1):54-66.(in Chinese)
鄭晶,曹子原,姜天琪,等.2018.基于深度信念神經(jīng)網(wǎng)絡的微震波到時拾取方法[J].礦業(yè)科學學報,3(6):521-526.Zheng J,Cao Z Y,Jiang T Q,et al.2018.Deep belief neural network based arrival picking for microseismic data[J].Journal of Mining Science and Technology,3(6):521-526.(in Chinese)
周創(chuàng),居興國,李子昂,等.2020.基于深度卷積生成對抗網(wǎng)絡的地震初至拾取[J].石油物探,59(5):795-803.Zhou C,Ju X G,Li Z A,et al.2020.A deep convolutional generative adversarial network for first-arrival pickup from seismic data[J].Geophysical Prospecting for Petroleum,59(5):795-803.(in Chinese)
Aden-Antoniów F,F(xiàn)rank W B,Seydoux L.2022.An adaptable random forest model for the declustering of earthquake catalogs[J].Journal of Geophysical Research:Solid Earth,127(2):e2021JB023254.
Alpaydin E.2020.Introduction to machine learning[M].Cambridge,MA:MIT Press.
Araya-Polo M,Jennings J,Adler A,et al.2018.Deep-learning tomography[J].The Leading Edge,37(1):58-66.
Asencio-Cortés G,Martínez-álvarez F,Morales-Esteban A,et al.2017a.Using principal component analysis to improve earthquake magnitude prediction in Japan[J].Logic Journal of the IGPL,25(6),949-966.
Asencio-Cortés G,Martínez-álvarez F,Troncoso A,et al.2017b.Medium-large earthquake magnitude prediction in Tokyo with artificial neural networks[J].Neural Computing and Applications,28(5):1043-1055.
Bergen K J,Beroza G C.2018.Detecting earthquakes over a seismic network using single-station similarity measures[J].Geophysical Journal International,213(3):1984-1998.
Bergen K J,Johnson P A,de Hoop M V,et al.2019.Machine learning for data-driven discovery in solid Earth geoscience[J].Science,363(6433):eaau0323.
Bilal M A,Ji Y,Wang Y,et al.2022.Early earthquake detection using Batch Normalization Graph Convolutional Neural Network(BNGCNN)[J].Applied Sciences,12(15):7548.
Brown T,Mann B,Ryder N,et al.2006.Language models are few-shot learners[C]//NIPS'20: Proceedings of the 34th international conference on neural information processing systems.New York:1877-1901.
Chen H,Yang H,Zhu G,et al.2022.Deep outer-rise faults in the southern mariana subduction zone indicated by a machine-learning-based high-resolution earthquake catalog[J].Geophysical Research Letters,49(12):e2022GL097779.
Chen Y,Zhang G,Bai M,et al.2019 Automatic waveform classification and arrival picking based on convolutional neural network[J].Earth and Space Science,6(7):1244-1261.
Chen Y.2020.Automatic microseismic event picking via unsupervised machine learning.Geophysical Journal International,222(3):1750-1764.
Cianetti S,Bruni R,Gaviano S,et al.2021.Comparison of deep learning techniques for the investigation of a seismic sequence:An application to the 2019,Mw 4.5 Mugello(Italy)earthquake[J].Journal of Geophysical Research:Solid Earth,126(12):e2021JB023405.
Dahmen N L,Clinton J F,Meier M A,et al.2022.MarsQuakeNet:A more complete marsquake catalog obtained by deep learning techniques[J].Journal of Geophysical Research:Planets,127(11):e2022JE007503.
DeVries P M R,Viégas F,Wattenberg M,et al.2018.Deep learning of aftershock patterns following large earthquakes[J].Nature,560(7720):632-634.
Draelos T J,Ballard S,Young C J,et al.2015.A new method for producing automated seismic Bulletins:Probabilistic event detection,association,and location[J].Bulletin of the Seismological Society of America,105(5):2453-2467.
Elman J L.1990.Finding structure in time[J].Cognitive science,14(2):179-211.
Feng T,Mohanna S,Meng L,et al.2022.Edgephase:A deep learning model for multi-station seismic phase picking[J].Geochemistry,Geophysics,Geosystems,23(11):e2022GC010453.
Field E H,Jordan T H,Page M T,et al.2017.A synoptic view of the third Uniform California Earthquake Rupture Forecast(UCERF3)[J].Seismological Research Letters,88(5):1259-1267.
Fieseler C,Mitchell C A,Pyrak-Nolte L J,et al.2022.Characterization of acoustic emissions from analogue rocks using sparse regression-DMDC[J].Journal of Geophysical Research:Solid Earth,127(7):e2022JB024144.
Goodfellow I,Bengio Y,Courville A.2016.Deep learning[M].Cambridge,MA:MIT Press.
Goodfellow I J,Le Q V,Saxe A M,et al.2009.Measuring invariances in deep networks[C]// Curran Associates Inc.Proceedings of 23rd annual conference on neural information processing systems 2009:Advances in neural information processing systems 22.Vancouver:646-654.
Goodfellow I J,Pouget-Abadie J,Mirza M,et al.2014.Generative adversarial nets[C]// NIPS'14:Proceedings of the 27th international conference on neural information processing systems——Volume 2:Advances in neural information processing systems.Cambridge,MA:MIT Press,2672-2680.
Hinton G E,Salakhutdinov R R.2006.Reducing the dimensionality of data with neural networks[J].Science,313(5786):504-507.
Hochreiter S,Schmidhuber J.1997.Long short-term memory[J].Neural Computation,9(8):1735-1780.
Hu L,Zheng X,Duan Y,et al.2019.First-arrival picking with a U-net convolutional network[J].Geophysics,84(6):U45-U57.
Ida Y,Ishida M.2022.Analysis of seismic activity using self-organizing map:implications for earthquake prediction[J].Pure and Applied Geophysics,179(1):1-9.
Janbakhsh P,Pysklywec R,Shahnas M H.2019.Earthquake magnitude,distance,first motion polarity,and noise/event determination using AE,CNN1D,RNN Networks[C]//AGU Fall Meeting Abstracts.
Jasperson H,Bolton D C,Johnson P,et al.2021.Attention network forecasts time-to-failure in laboratory shear experiments[J].Journal of Geophysical Research:Solid Earth,126(11):e2021JB022195.
Jia L Z,Chen H F,Xing K.2022.Rapid classification of local seismic events using machine learning[J].Journal of Seismology,26(5):897-912.
Jordan M I,Mitchell T M.2015.Machine learning:Trends,perspectives,and prospects[J].Science,349(6245):255-260.
Kail R,Burnaev E,Zaytsev A.2021.Recurrent convolutional neural networks help to predict location of earthquakes[J].IEEE Geoscience and Remote Sensing Letters,19:1-5.
Kim S,Yoon B,Lim J T,et al.2021.Data-driven signal-noise classification for microseismic data using machine learning[J].Energies,14(5):1499.
Klein F W.2002.Users guide to HYPOINVERSE-2000,a Fortran program to solve for earthquake locations and magnitudes[R].US Geological Survey.
Kriegerowski M,Petersen G M,Vasyura-Bathke H,et al.2019.A deep convolutional neural network for localization of clustered earthquakes based on multistation full waveforms[J].Seismological Research Letters,90(2A):510-516.
Lapins S,Goitom B,Kendall J M,et al.2021.A little data goes a long way:Automating seismic phase arrival picking at Nabro volcano with transfer learning[J].Journal of Geophysical Research:Solid Earth,126(7):e2021JB021910.
Last M,Rabinowitz N,Leonard G.2016.Predicting the maximum earthquake magnitude from seismic data in Israel and its neighboring countries[J].PloS One,11(1):e0146101.
LeCun Y,Bengio Y,Hinton G.2015.Deep learning[J].Nature,521(7553):436-444.
Li Y E,OMalley D,Beroza G,et al.2023.Machine Learning Developments and Applications in Solid-Earth Geosciences:Fad or Future?[J].Journal of Geophysical Research:Solid Earth,128(1):e2022JB026310.
Li Z F,Meier M A,Hauksson E,et al.2018.Machine learning seismic wave discrimination:Application to earthquake early warning[J].Geophysical Research Letters,45(10):4773-4779.
Linville L,Pankow K,Draelos,et al.2019.Deep learning models augment analyst decisions for event discrimination[J].Geophysical Research Letters,46(7):3643-3651.
Lomax A,Michelini A,Jozinovi D.2019.An investigation of rapid earthquake characterization using single-station waveforms and a convolutional neural network[J].Seismological Research Letters,90(2A):517-529.
Ma S,Li Z,Wang W.2022.Machine learning of source spectra for large earthquakes[J].Geophysical Journal International,231(1):692-702.
Magaa-Zook S A,Ruppert S D.2017.Explosion monitoring with machine learning:A LSTM approach to seismic event discrimination[C]//AGU Fall Meeting Abstracts.S43A-0834.
MajstoroviAc'1 J,Giffard-Roisin S,Poli P.2021.Designing convolutional neural network pipeline for near-fault earthquake catalog extension using single-station waveforms[J].Journal of Geophysical Research:Solid Earth,126(7):e2020JB021566.
Meier M A,Ross Z E,Ramachandran A,et al.2019.Reliable real-time seismic signal/noise discrimination with machine learning[J].Journal of Geophysical Research:Solid Earth,124(1):788-800.
Mignan A,Broccardo M.2020.Neural network applications in earthquake prediction(1994-2019):Meta-analytic and statistical insights on their limitations[J].Seismological Research Letters,91(4):2330-2342.
Mirrashid M.2014.Earthquake magnitude prediction by adaptive neuro-fuzzy inference system(ANFIS)based on fuzzy C-means algorithm[J].Natural Hazards,74(3):1577-1593.
Mnih V,Kavukcuoglu K,Silver,D,et al.2015.Human-level control through deep reinforcement learning[J].Nature,518(7540):529-533.
Mosher S G,Audet P.2020.Automatic detection and location of seismic events from time-delay projection mapping and neural network classification[J].Journal of Geophysical Research:Solid Earth,125(10):e2020JB019426.
Mousavi S M,Beroza G C.2020b.A machine-learning approach for earthquake magnitude estimation[J].Geophysical Research Letters,47(1):e2019GL085976.
Mousavi S M,Beroza G C.2022a.Deep-learning seismology[J].Science,377(6607),doi:10.1126/science.abm4470.
Mousavi S M,Beroza G.2022b.A dataset of published journal papers using neural networks for seismological tasks[J/OL].(2022-03-26)[2023-02-15].https://explore.openaire.eu/search/dataset?
pid=10.5281%2Fzenodo.6386952.
Mousavi S M,Ellsworth W L,Zhu W,et al.2020a.Earthquake transformer-an attentive deep-learning model for simultaneous earthquake detection and phase picking[J].Nature Communications,11(1):3952.
Mousavi S M,Sheng Y,Zhu W,et al.2019a.Stanford earthquake dataset(STEAD):A global data set of seismic signals for AI[J].IEEE Access,7:179464-179476.
Mousavi S M,Zhu W,Ellsworth W,et al.2019b.Unsupervised clustering of seismic signals using deep convolutional autoencoders[J].IEEE Geoscience and Remote Sensing Letters,16(11):1693-1697.
Mousavi S M,Zhu W,Sheng Y,et al.2019c.CRED:A deep residual network of convolutional and recurrent units for earthquake signal detection[J].Scientific Reports,9(1):1-14.
Mousavi S M,Beroza,G C.2020c.Bayesian-deep-learning estimation of earthquake location from single-station observations[J].IEEE Transactions on Geoscience and Remote Sensing,58(11):8211-8224.
Münchmeyer J,Woollam J,Rietbrock A,et al.2022.Which picker fits my data? A quantitative evaluation of deep learning based seismic pickers[J].Journal of Geophysical Research:Solid Earth,127(1):e2021JB023499.
Nolte D D,Pyrak-Nolte L J.2022.Monitoring fracture saturation with internal seismic sources and twin neural networks[J].Journal of Geophysical Research:Solid Earth,127(2):e2021JB023005.
Ogata Y.2017.Statistics of earthquake activity:Models and methods for earthquake predictability studies[J].Annual Review of Earth and Planetary Sciences,45:497-527.
Panakkat A,Adeli H.2007.Neural network models for earthquake magnitude prediction using multiple seismicity indicators[J].International Journal of Neural Systems,17:13-33.
Panakkat A,Adeli H.2009.Recurrent neural network for approximate earthquake time and location prediction using multiple seismicity indicators[J].Computer-Aided Civil and Infrastructure Engineering,24(4):280-292.
Perol T,Gharbi M,Denolle M.2018.Convolutional neural network for earthquake detection and location[J].Science Advances,4(2):e1700578.
Qin B,Huang F,Huang S,et al.2022.Machine learning investigation of clinopyroxene compositions to evaluate and predict mantle metasomatism worldwide[J].Journal of Geophysical Research:Solid Earth,127(5):e2021JB023614.
Radford A,Wu J,Child R,et al.2019.Language models are unsupervised multitask learners[J/OL].(2019)[2023-02-15].https://cdn.openai.com/better-language- models/language_models_are_unsupervised_multitask_learners.pdf
Rong K,Yoon C E,Bergen K J,et al.2018.Locality-sensitive hashing for earthquake detection:A case study of scaling data-driven science[J/OL].(2018-07-24)[2023-02-15].https://arxiv.org/abs/1803.09835v1.
Rosenblatt F.1958.The perceptron:A probabilistic model for information storage and organization in the brain[J].Psychological review,65(6):386-408.
Ross Z E,Meier M-A,Hauksson E.2018.P wave arrival picking and first-motion polarity determination with deep learning[J].Journal of Geophysical Research:Solid Earth,123(6):5120-5129.
Ross Z E,Yue Y S,Meier M A,et al.2019.Phaselink:A deep learning approach to seismic phase association[J].Journal of Geophysical Research:Solid Earth,124(1):856-869.
Rouet-Leduc B,Hulbert C,Lubbers N,et al.2017.Machine learning predicts laboratory earthquakes[J].Geophysical Research Letters,44(18):9276-9282.
Saad O M,Huang G,Chen Y,et al.2021.Scalodeep:A highly generalized deep learning framework for real-time earthquake detection[J].Journal of Geophysical Research:Solid Earth,126(4):e2020JB021473.
Seydoux L,Balestriero R,Poli P,et al.2020.Clustering earthquake signals and background noises in continuous seismic data with unsupervised deep learning[J].Nature communications,11(1):3972.
Shcherbakov R,Zhuang J,Zller G,et al.2019.Forecasting the magnitude of the largest expected earthquake[J].Nature Communications,10(1):1-11.
Shreedharan S,Bolton D C,Rivière J,et al.2021.Machine learning predicts the timing and shear stress evolution of lab earthquakes using active seismic monitoring of fault zone processes[J].Journal of Geophysical Research:Solid Earth,126(7):e2020JB021588.
Silver D,Huang A,Maddison C J,et al.2016.Mastering the game of Go with deep neural networks and tree search[J].Nature,529(7587):484-489.
Silver D,Schrittwieser J,Simonyan K,et al.2017.Mastering the game of go without human knowledge[J].Nature,550(7676):354-359.
Song Z,Zhang Z,Zhang G,et al.2022.Identifying the types of loading mode for rock fracture via convolutional neural networks[J].Journal of geophysical research:solid Earth,127(2):e2021JB022532.
Steinberg A,Vasyura-Bathke H,Gaebler P,et al.2021.Estimation of seismic moment tensors using variational inference machine learning[J].Journal of Geophysical Research:Solid Earth,126(10):e2021JB022685.
Waldhauser F,Ellsworth W L.2000.A double-difference earthquake location algorithm:Method and application to the northern Hayward fault,California[J].Bulletin of the Seismological Society of America,90(6):1353-1368.
Wang F,Song X,Li J.2022.Deep learning-based h-κ method(HKNET)for estimating crustal thickness and vp/vs ratio from receiver functions[J].Journal of Geophysical Research:Solid Earth,127(6):e2022JB023944.
Wang J,Xiao Z,Liu C,et al.2019.Deep learning for picking seismic arrival times[J].Journal of Geophysical Research:Solid Earth,124(7):6612-6624.
Wiszniowski J,Plesiewicz B M,Trojanowski J.2014.Application of real time recurrent neural network for detection of small natural earthquakes in Poland[J].Acta Geophysica,62:469-485.
Withers M,Aster R,Young C,et al.1998.A comparison of select trigger algorithms for automated global seismic phase and event detection[J].Bulletin of the Seismological Society of America,88(1):95-106.
Wu Y,Lin Y,Zhou Z,et al.2017.Cascaded region-based densely connected network for event detection:A seismic application[J/OL].(2017-11-29)[2023-02-15].https://arxiv.org/abs/1709.07943.
Wu Y,Lin Y,Zhou Z,et al.2018.Seismic-net:A deep densely connected neural network to detect seismic events[J/OL].(2018-01-17)[2023-02-15].https://doi.org/10.48550/arXiv.1802.02241.
Wyss M.1997.Second round of evaluations of proposed earthquake precursors[J].Pure and Applied Geophysics,149:3-16.
Xiao Z,Wang J,Liu C,et al.2021.Siamese earthquake transformer:A pair-input deep-learning model for earthquake detection and phase picking on a seismic array[J].Journal of Geophysical Research:Solid Earth,126(5):e2020JB021444.
Yeck W L,Patton J M,Johnson C E,et al.2019.GLASS3:A standalone multiscale seismic detection associator[J].Bulletin of the Seismological Society of America,109(4):1469-1478.
Yoon C E,OReilly O,Bergen K J,et al.2015.Earthquake detection through computationally efficient similarity search[J].Science advances,1(11):e1501057.
Yu S,Ma J.2021.Deep learning for geophysics:Current and future trends[J].Reviews of Geophysics,59(3):e2021RG000742.
Zhang M,Ellsworth W L,Beroza G C.2019.Rapid earthquake association and location[J].Seismological Research Letters,90(6):2276-2284.
Zhang X,Reichard-Flynn W,Zhang M,et al.2022.Spatiotemporal graph convolutional networks for earthquake source characterization[J].Journal of Geophysical Research:Solid Earth,127(11):e2022JB024401.
Zhang X,Zhang J,Yuan C,et al.2020.Locating induced earthquakes with a network of seismic stations in Oklahoma via a deep learning method[J].Scientific Reports,10(1):1941.
Zhao M,Chen S,F(xiàn)ang L,et al.2019.Earthquake phase arrival auto-picking based on U-shaped convolutional neural network[J].Chinese Journal of Geophysics,62(8):3034-3042.
Zheng J,Lu J,Peng S,et al.2018.An automatic microseismicor acoustic emission arrival identification scheme with deep recurrent neural networks[J].Geophysical Journal International,212(2):1389-1397.
Zhou Y,Yue H,F(xiàn)ang L,et al.2022.An earthquake detection and location architecture for continuous seismograms:Phase picking,association,location,and matched filter(PALM)[J].Seismological Research Letters,93(1):413-425.
Zhou Y,Yue H,Kong Q,et al.2019.Hybrid event detection and phase-picking algorithm using convolutional and recurrent neural networks[J].Seismological Research Letters,90(3):1079-1087.
Zhu S,Li S,Peng Z,et al.2021.Imitation learning of neural spatio-temporal point processes[J].IEEE Transactions on Knowledge and Data Engineering,34(11):5391-5402.
Zhu W,Beroza G C.2019.PhaseNet:A deep-neural-network-based seismic arrival-time picking method[J].Geophysical Journal International,216(1):261-273.
Zhu W,McBrearty I W,Mousavi S M,et al.2022a.Earthquake phase association using a Bayesian Gaussian mixture model[J].Journal of Geophysical Research:Solid Earth,127(5):e2021JB023249.
Zhu W,Tai K S,Mousavi S M,et al.2022b.An end-to-end earthquake detection method for joint phase picking and association using deep learning[J].Journal of Geophysical Research:Solid Earth,127(3):e2021JB023283.
Zou S,Chen X,Brzozowski M J,et al.2022.Application of machine learning to characterizing magma fertility in porphyry Cu deposits[J].Journal of Geophysical Research:Solid Earth,127(8):e2022JB024584.
Advancements of Deep Learning in Seismic Monitoring and Prediction
JIA Luozhao1,MENG Lingyuan2,YAN Rui1
(1.Henan Earthquake Agency,Zhengzhou 450018,Henan,China)(2.China Earthquake Networks Center,Beijing 100045,China)
Abstract
This article provides an overview of deep learning methods and their application in earthquake monitoring and prediction.It introduces mainstream methods such as feedforward neural networks,convolutional neural networks,recurrent neural networks,transformer networks,autoencoders,generative adversarial networks,and deep reinforcement learning networks.The article summarizes their application in phase picking,phase correlation,event detection,earthquake location,signal and event classification,and earthquake prediction.It also discusses the progress,advantages,challenges,and future directions of deep learning in earthquake monitoring and prediction.This summary serves as a valuable reference for applying deep learning in earthquake monitoring and prediction.
Keywords:deep learning;seismic monitoring and prediction;earthquake detection;earthquake location;seismic forecasting
*收稿日期:2023-05-09.
基金項目:國家重點研發(fā)計劃(2021YFC3000705);中國地震局震情跟蹤定向工作任務(2023010111).
第一作者簡介:賈漯昭(1982-),高級工程師,主要從事數(shù)字地震學和數(shù)值分析研究.E-mail:123@eqha.gov.cn.
通信作者簡介:孟令媛(1983-),研究員,博士,主要從事地震活動性和地震危險性研究.E-mail:meng.lingyuan@hotmail.com.
賈漯昭,孟令媛,閆睿.2024.深度學習在地震監(jiān)測預報中的應用進展[J].地震研究,47(3):336-349,doi:10.20015/j.cnki.ISSN1000-0666.2024.0037.
Jia L Z,Meng L Y,Yan R.2024.Advancements of deep learning in seismic monitoring and prediction[J].Journal of Seismological Research,47(3):336-349,doi:10.20015/j.cnki.ISSN1000-0666.2024.0037.