高永國 尹欣欣 李少華
1 甘肅省地震局,蘭州市東崗西路450號,730000 2 中國地震局蘭州巖土地震研究所,蘭州市東崗西路450號,730000
在日常地震監(jiān)測工作中,由于爆破、塌陷等事件記錄的波形與天然地震類似,傳統(tǒng)的地震類型判別方法需要花費大量時間進行人工識別與排除,并且高度依賴震相分析人員的經驗與理論水平,分類識別結果具有主觀性。傳統(tǒng)區(qū)分非天然地震的方法一般主要依據(jù)爆破事件的波形震相特征、初動方向、振幅比、尾波衰減特征等進行綜合判斷,表1為不同類型事件的初動方向、P/S譜比值、Pm/Pc、Pm/Sm、Pc/Sm、Pm/Tc、Sm/Tc(Pm、Pc、Sm、Tc分別表示P波最大振幅、P波初動、S波最大振幅、尾波持續(xù)時間)等典型判別指標,其中滑坡和塌陷的部分判別指標尚不明確[1-3]。
表1 不同地震類型的相關參數(shù)判別指標
為解決人工識別效率低、誤差較大、主觀性強的問題,近年來眾多學者對天然地震與爆破、塌陷等非天然地震事件的波形特征展開深入研究[4-8]。深度學習技術在地震震相分類、識別及定位方面的應用發(fā)展迅速。Perol等[9]應用卷積神經網(wǎng)絡模型ConvNetQuake對美國俄克拉荷馬地區(qū)的連續(xù)記錄波形進行識別與定位,檢測到的地震事件數(shù)量明顯比已記錄的地震事件數(shù)量多,且算法計算速度更快;Ross等[10]基于美國南加州地區(qū)大量人工標記P 波到時和極性的地震圖訓練CNN模型,從而實現(xiàn)P 波震相到時和初動極性的自動化識別。趙明等[11]對選自中國地震臺網(wǎng)的441個臺站8 d的連續(xù)波形數(shù)據(jù)進行識別和到時拾取,同時與參考地震目錄進行關聯(lián),證明CNN網(wǎng)絡對于不同類型的地震和噪聲樣本具有較好的泛化能力。劉芳等[12]結合臺陣策略設計單獨識別P波和S波的長時窗震相拾取深度學習模型PP(phase picker)及其訓練方式,且將該方法運用到中國內蒙古地區(qū)臺網(wǎng)的觀測數(shù)據(jù)中,可檢測到人工目錄中98.1%的地震, 地震拾取總數(shù)為人工目錄數(shù)量的30倍。
深度學習強調模型的深度和訓練的重要性,利用大數(shù)據(jù)訓練來學習特征,具有更好的表達豐富信息特征的能力[13]。由于地震事件的復雜性,不同地區(qū)的地層構造、儀器類型參數(shù)、背景噪聲等存在差異,記錄的事件波形特征可能呈現(xiàn)多種形態(tài)。收集制作不同地震事件類型(如天然地震、爆破、塌陷、滑坡等)樣本數(shù)量充足的數(shù)據(jù)集,利用卷積神經網(wǎng)絡的特征提取及自學習能力,學習天然地震、爆破等波形的深度特征,建立能識別非天然地震事件的神經網(wǎng)絡模型,應用到地震監(jiān)測、地震災害防治及公共服務領域,可進一步提高工作效率,及時回應社會關切,減輕災害損失[14]。
本文以甘肅省及周邊地區(qū)為研究區(qū)域(92°~108°E, 32°~42°N),以2009-01-01~2016-12-31甘肅測震臺網(wǎng)記錄的80個地震事件和20個爆破事件作為研究數(shù)據(jù)。其中,天然地震震級為M2.0~6.0,爆破事件震級為M1.0~3.5,天然地震和爆破事件主要分布在甘肅省內及周邊鄰近地區(qū)。
本文所使用的數(shù)據(jù)來自甘肅測震臺網(wǎng),臺站總數(shù)84個,包含47個甘肅省內測震臺和37個周邊省份測震臺。在獲取2009-01-01~2016-12-31甘肅測震臺網(wǎng)的震相數(shù)據(jù)和原始波形數(shù)據(jù)后,首先依據(jù)甘肅測震臺網(wǎng)記錄的該時間段編目報告(包括發(fā)震時刻、震中經緯度、震源深度、震級、地震類型等)人工選擇地震事件,然后利用地震數(shù)據(jù)處理程序CNNdatamake,根據(jù)震相到時截取每條記錄60 s垂直分量波形數(shù)據(jù),進行濾波和歸一化等預處理,生成地震事件波形數(shù)據(jù)。由于地震信號的采樣率為100,因此選擇6 000個采樣點為最大地震波形截取長度。為盡可能減小波形事件程序篩選產生的誤差,提高數(shù)據(jù)集質量,采用人工方法對事件原始波形及圖片進行辨別分析,既通過波形震相特征、初動方向等進行分析判斷,同時以天然地震時頻表示圖(圖1(a))及爆破事件時頻表示圖(圖1(b))作為輔助參考因素選擇數(shù)據(jù)集原始事件條目。時頻圖顯示天然地震P波的高能量密度區(qū)頻率比爆破事件高;天然地震的高能量密度區(qū)分布較為離散,而爆破事件則較為集中。去除噪聲過多及事件重疊的波形數(shù)據(jù),最終選取5 000條地震波形(垂直分量),其中天然地震事件地震波形4 000 條,爆破事件地震波形1 000條;同時人工標注每條記錄相應的標簽,生成一個10分類的標簽文件。然后從有效波形文件中選取前4 500條記錄作為訓練波形數(shù)據(jù)集,后500條記錄作為測試波形數(shù)據(jù)集。爆破事件的震源深度通常為0 km,為避免爆破與天然地震之間的模糊性,本文僅選取甘肅測震臺網(wǎng)地震目錄中震源深度小于10 km 的非天然地震。
圖1 不同類型地震波形時頻表示圖
在機器學習中,卷積神經網(wǎng)絡是一種深度前饋人工神經網(wǎng)絡,廣泛應用于圖像識別。卷積神經網(wǎng)絡包括卷積層、池化層、全連接層以及Softmax 層,卷積過程可表示為:
(1)
卷積是指神經網(wǎng)絡對圖片中每一小塊像素區(qū)域(局部感受野)進行加權,區(qū)域權值稱為卷積核。圖像經過卷積運算后加上偏置值,再通過激活函數(shù)可得到特征圖。卷積有助于找到特定的局部圖像特征(如邊緣),從而可加深神經網(wǎng)絡對圖片的理解。
原始圖像經過池化層可實現(xiàn)特征降維,壓縮數(shù)據(jù)和參數(shù)數(shù)量,減少過擬合現(xiàn)象,同時可提高模型的容錯性。池化過程可表示為:
(2)
式中,down()表示下采樣,可構成新特征圖。池化操作通常分為最大池化與平均池化,最大池化可提取圖片紋理,平均池化可保留圖片背景。
Softmax 層在多分類過程中將多個神經元的輸出映射到(0,1)區(qū)間內, 并且約束各節(jié)點輸出值之和為1,滿足概率性質。Softmax 函數(shù)可表示為:
(3)
式中,Sj表示第j個神經元的輸出,輸出向量為各個分類的概率。
為提高本文中學習模型的識別率,并比較其與目前經典訓練模型計算效率及泛化能力的差異,利用GoogLeNET神經網(wǎng)絡模型Inception V1進行訓練,同時采用自主設計的seismic phase classification CNN訓練模型進行計算與對比分析,兩種模型中Softmax 層均設計為10分類輸出。
1.3.1 Inception V1
增加模型的深度(層數(shù))或寬度可獲得高質量模型,但這種設計思路會導致參與計算的參數(shù)過多,容易引起過擬合和網(wǎng)絡退化問題。Inception是 GoogLeNET團隊提出的經典CNN分類模型之一[15],該模型通過改進神經網(wǎng)絡結構,在有效保留圖像特征的同時減少計算量。Inception V1模型在同一層網(wǎng)絡中使用不同尺寸的卷積核,可提取不同尺寸特征,通過設定少于輸入特征圖深度的1×1卷積核個數(shù),減少輸出特征圖深度和參數(shù)量,從而提高模型感知力。本文中Inception V1訓練模型為10層,ReLu 函數(shù)作為激活函數(shù),交叉熵作為損失函數(shù),優(yōu)化器算法選擇Adam。
1.3.2 Seismic phase classification CNN
模型2為5層CNN網(wǎng)絡結構,命名為震相分類神經網(wǎng)絡(seismic phase classification CNN, 簡稱SPCCNN)。該模型由4個卷積層C和3個池化層M交替組成,然后再連接1個全連接層,最后一層作為卷積神經網(wǎng)絡的輸出層。該網(wǎng)絡使用5×5像素的內核進行卷積,以2為步長進行下采樣。使用交叉熵作為損失函數(shù),優(yōu)化器算法選擇Adam。每個卷積層均利用Batch Normalization(BN)操作實現(xiàn)正則化以防止過擬合。最后經過全連接層,使用Softmax激活函數(shù)計算分類概率,將不同類型地震波形特征對應的輸出向量與該類型地震波形的標簽進行比較,確定其地震類型。
利用5 000條地震波形(垂直分量)構建實驗數(shù)據(jù)集,分為訓練集和測試集,包括天然地震、爆破等目標樣本。利用基于CNN 的Inception V1模型和SPCCNN模型分別對訓練集中的波形圖像特征進行抽象與學習,得到優(yōu)化后的網(wǎng)絡模型,然后利用測試數(shù)據(jù)集得到目標測試結果。兩種模型訓練過程的準確度和損失函數(shù)曲線分別見圖2(a)和2(b),表2為最終訓練模型的損失率與準確率結果。
從圖2和表2可以看出,隨著迭代次數(shù)的增加,訓練集準確率保持在96%左右,測試集準確率超過90%,表明兩種模型的收斂性良好,泛化能力較好。
表2 兩種訓練模型損失率與準確率結果
本文利用Inception V1模型和SPCCNN模型將天然地震事件和爆破事件等目標樣本進行自動分類。從訓練結果來看,不同訓練模型在識別效果上具有一定差異,隨著訓練時長的增加,不同模型對數(shù)據(jù)的泛化能力大致趨同。分析兩種模型的計算過程發(fā)現(xiàn),Inception V1模型耗時略大,識別率更高;SPCCNN模型耗時較少,識別率相對略低。結果表明,Inception V1模型作為同時具有深度和寬度的神經網(wǎng)絡,其效果更優(yōu),能更好地克服地震波形特征的復雜性,該模型對于地震波形分類具有較好的應用前景,可以考慮在此基礎上改造和應用最新的Inception V4等模型,開發(fā)更優(yōu)的地震事件分類模型。
實驗結果表明,兩種分類模型均能從訓練集中學習不同地震波形的深度特征,Inception V1模型和SPCCNN模型總體識別率分別為92.3%和90.1%,說明卷積神經網(wǎng)絡具有較好的分類識別能力。同時由于爆破類地震事件樣本數(shù)較少,訓練數(shù)據(jù)不夠,存在過擬合問題。對于爆破等非天然地震事件,建立樣本數(shù)量充足的大型數(shù)據(jù)集難度較大,需要持續(xù)收集來自不同區(qū)域、不同構造的真實非天然地震事件樣本,才有可能使卷積神經網(wǎng)絡模型具備更強的泛化能力和更高的分類識別準確率。由于訓練過程中數(shù)據(jù)計算量較大,本研究僅使用每條記錄的垂直分量波形,且在訓練輸入神經網(wǎng)絡時對60 s時長的6 000個采樣點數(shù)據(jù)以6為步長間隔進行降采樣,后續(xù)研究中可考慮同時使用地震事件的三分量波形且使用全量數(shù)據(jù),從而不斷提高訓練模型的分類識別能力。
致謝:感謝甘肅數(shù)字地震臺網(wǎng)提供地震觀測數(shù)據(jù)以及甘肅地震臺提供地震數(shù)據(jù)處理程序CNNdatamake。