位棟梁 王延偉 王自法 廖吉安 趙登科
1) 中國(guó)河南開(kāi)封 475004 河南大學(xué)土木建筑學(xué)院
2) 中國(guó)廣西桂林 541004 桂林理工大學(xué)土木與建筑工程學(xué)院
3) 中國(guó)廣東韶關(guān) 512026 中震科建(廣東)防災(zāi)減災(zāi)研究院
4) 中國(guó)哈爾濱 150080 中國(guó)地震局工程力學(xué)研究所
地震是一種極具破壞性的自然災(zāi)害,準(zhǔn)確預(yù)測(cè)地震的發(fā)生目前還是一個(gè)尚未解決的科學(xué)難題(Geller,1997;Penget al,2017),因此地震預(yù)警(earthquake early warning,縮寫(xiě)為EEW)作為一種新型防災(zāi)技術(shù)近年來(lái)愈加受到重視.地震預(yù)警的基本任務(wù)是利用震源區(qū)附近臺(tái)站監(jiān)測(cè)到的地震波早期信息估算出該地震的震級(jí)、位置、深度等震源參數(shù),并快速評(píng)估出目標(biāo)預(yù)警區(qū)域潛在的地震破壞,及時(shí)發(fā)布地震警報(bào)信息(Allenet al,2009;Minsonet al,2018),目前已有多個(gè)國(guó)家開(kāi)發(fā)出地震預(yù)警系統(tǒng)并成功運(yùn)行(Wu,Teng,2002;Hoshibaet al,2008;Espinosa-Arandaet al,2009),我國(guó)也在2008年之后啟動(dòng)了“國(guó)家地震烈度速報(bào)與預(yù)警工程”項(xiàng)目建設(shè),目前該項(xiàng)目已經(jīng)進(jìn)入最后的建設(shè)階段(李山有,2018).
地震預(yù)警系統(tǒng)中準(zhǔn)確快速地估算震級(jí)大小是最核心的關(guān)鍵問(wèn)題.地震震級(jí)的快速估算有多種方法,傳統(tǒng)方法是從初始地震動(dòng)信息中提取關(guān)鍵指標(biāo)作為特征參數(shù),然后利用特征參數(shù)與震級(jí)之間的經(jīng)驗(yàn)公式來(lái)估算地震震級(jí)的大小,其中特征參數(shù)有很多種選擇,可以利用初始地震動(dòng)的峰值、周期(頻率)、能量及其組合等信息來(lái)建立.基于初至P波的頻域信息與震級(jí)之間比較強(qiáng)的相關(guān)性,提出了一系列特征頻率類參數(shù),如最大卓越周期(Allen,Kanamori,2003)、平均卓越周期τc(Wu,Zhao,2006)等.Wolfe (2006)認(rèn)為利用估算震級(jí)的穩(wěn)定性值得懷疑,其研究結(jié)果顯示該參數(shù)實(shí)際上是譜幅值和頻率的非線性函數(shù),因此在震級(jí)估計(jì)時(shí)會(huì)受到振幅譜和相位譜的共同作用因而造成較大估算誤差.Lockman和Allen(2005)等在日本Hi-net (high sensitivity seismograph network)臺(tái)陣記錄上使用估計(jì)震級(jí),其結(jié)果表明該參數(shù)受區(qū)域特性影響較大,在低密度臺(tái)站地區(qū)需要聯(lián)合多臺(tái)站記錄以提高精度,因此時(shí)效性得不到保障.王延偉等(2020)利用日本KiK-net臺(tái)網(wǎng)井下基巖強(qiáng)震數(shù)據(jù)研究的結(jié)果顯示,τc受加速度積分運(yùn)算影響較大,該過(guò)程會(huì)引入長(zhǎng)周期成分致使震級(jí)估算偏大.除特征頻率類參數(shù)外,初至P波的位移(Pd)、速度(Pv)或加速度(Pa)的峰值也被證明與震級(jí)有關(guān),也可用于震級(jí)估算,此類方法被稱為特征幅值類參數(shù)法(Wu,Kanamor,2005;Zolloet al,2006;Melgaret al,2015).這類方法中,Pd參數(shù)方法的結(jié)果表現(xiàn)最優(yōu)(馬強(qiáng),2008),該方法受場(chǎng)地條件影響較小,對(duì)地區(qū)差異性不敏感,但當(dāng)震級(jí)M≥6.5時(shí),利用初始P波信息計(jì)算出的Pd參數(shù)與震級(jí)之間的關(guān)系存在震級(jí)飽和效應(yīng).,τc和Pd等基于特征參數(shù)的傳統(tǒng)方法,需要提前定義特征參數(shù),之后仍然需要依賴特征參數(shù)與震級(jí)之間的經(jīng)驗(yàn)關(guān)系,所以在震級(jí)估算的精度和時(shí)效性方面難免存在弊端.因此,能否放棄人為定義的特征參數(shù)和震級(jí)估算經(jīng)驗(yàn)公式,利用深度學(xué)習(xí)方法直接從地震記錄數(shù)據(jù)中學(xué)習(xí)到震級(jí)的相關(guān)特征從而直接估算出地震震級(jí)成為一個(gè)值得期待的新的研究方向.
大數(shù)據(jù)的深度學(xué)習(xí)方法很多,其中卷積神經(jīng)網(wǎng)絡(luò)算法(convolutional neural network,縮寫(xiě)為CNN)因其能夠自主進(jìn)行標(biāo)簽特征的提取,再加上對(duì)復(fù)雜非線性行為具有良好的分析能力,被應(yīng)用于地震預(yù)警領(lǐng)域的研究(于子葉等,2018;Dokhtet al,2019;Zhu,Beroza,2019;Wanget al,2021).近些年,CNN方法也被用來(lái)解決傳統(tǒng)參數(shù)在震級(jí)估算中存在的問(wèn)題,但在精度和時(shí)效性方面仍然存在較大的改進(jìn)空間.Lomax等(2019)提出的ConvNetQuake_INGV深度卷積模型,將單臺(tái)站記錄的三分量加速度時(shí)程數(shù)據(jù)作為第一卷積層的輸入數(shù)據(jù),對(duì)三分量波段中的加速度峰值進(jìn)行歸一化處理,并將歸一化值作為全連接層的輔助輸入?yún)?shù).利用上述兩部分?jǐn)?shù)據(jù)對(duì)模型進(jìn)行迭代訓(xùn)練,以達(dá)到自動(dòng)化檢測(cè)并快速表征地震震級(jí)的目的,但其不足之處在于該方法截取波段為P波到時(shí)前5 s和到時(shí)后45 s的長(zhǎng)時(shí)窗加速度時(shí)程數(shù)據(jù),時(shí)效性較差,無(wú)法在實(shí)際地震預(yù)警應(yīng)用中給公眾預(yù)留足夠的行動(dòng)時(shí)間.此外,ConvNetQuake_INGV模型僅能對(duì)中等震級(jí)范圍內(nèi)的地震事件進(jìn)行估算,誤差較大,且該研究中的CNN模型會(huì)出現(xiàn)一定程度的過(guò)擬合現(xiàn)象.Saad等(2020)構(gòu)建了一個(gè)CNN深度網(wǎng)絡(luò)分類器,選擇地震到達(dá)時(shí)間差小于6 s的三個(gè)臺(tái)站,將各個(gè)臺(tái)站P波到時(shí)前6 s和到時(shí)后2 s的加速度垂直分量數(shù)據(jù)聯(lián)合組成3×800的二維矩陣,以此作為訓(xùn)練數(shù)據(jù)集對(duì)CNN模型進(jìn)行訓(xùn)練,從而對(duì)地震事件的震級(jí)、深度、位置和發(fā)震時(shí)間進(jìn)行分類預(yù)測(cè).測(cè)試結(jié)果表明該分類器的分類準(zhǔn)確性較高,但就震級(jí)而言因分類標(biāo)準(zhǔn)寬泛,僅能區(qū)分震級(jí)是否在MW2.0—3.49,MW3.5—4.5或MW≥4.5,這樣的分類標(biāo)準(zhǔn)容易導(dǎo)致震級(jí)預(yù)警誤差偏大,減弱地震預(yù)警的效果,并且訓(xùn)練數(shù)據(jù)由三個(gè)臺(tái)站聯(lián)合構(gòu)建,時(shí)效性上略遜于單臺(tái)站震級(jí)估算法.Mousavi和Beroza (2020)嘗試使用將CNN與長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory neural networks,縮寫(xiě)為L(zhǎng)STM)拼接的復(fù)合模型,利用單臺(tái)站P波到時(shí)后30 s的三分量加速度時(shí)程信息進(jìn)行震級(jí)估算,得到了較高的震級(jí)回歸相關(guān)系數(shù),但同樣存在截取時(shí)窗尺度過(guò)長(zhǎng)、時(shí)效性無(wú)法確保的問(wèn)題.總之,上述幾種利用卷積神經(jīng)網(wǎng)絡(luò)估算震級(jí)的方法在時(shí)效性和震級(jí)精度方面無(wú)法較好地滿足地震預(yù)警的需求.
鑒于此,本文提出一種基于多層全連接卷積網(wǎng)絡(luò)架構(gòu)的深度學(xué)習(xí)方法,利用P波到達(dá)后3 s至9 s內(nèi)的地震頻域數(shù)據(jù)、震中距、震源深度和vS30等信息直接進(jìn)行震級(jí)估算,以提高地震預(yù)警中震級(jí)估算的精度和時(shí)效性,為未來(lái)利用多臺(tái)站記錄進(jìn)一步提高震級(jí)估算精度提供參考.
數(shù)據(jù)質(zhì)量是決定人工智能神經(jīng)網(wǎng)絡(luò)模型能否學(xué)習(xí)到各輸入特征之間隱式關(guān)系的關(guān)鍵因素,因此有必要預(yù)先對(duì)地震記錄數(shù)據(jù)進(jìn)行處理.
本文所用數(shù)據(jù)來(lái)自KiK-net和K-NET臺(tái)網(wǎng),從日本防災(zāi)科學(xué)技術(shù)研究所的強(qiáng)震動(dòng)數(shù)據(jù)庫(kù)中獲?。∟ational Research Institute for Earth Science and Disaster Resilience,2020).收集1997年10月8日至2019年3月11日期間的地表地震動(dòng)記錄,每組數(shù)據(jù)包括各臺(tái)站對(duì)應(yīng)的三分量地震波信息,此次研究?jī)H使用垂直分量加速度數(shù)據(jù).數(shù)據(jù)預(yù)處理前需對(duì)地震記錄按照以下原則進(jìn)行篩選:① 日本氣象廳震級(jí)MJMA≥4.0;② 震源距介于25 km與200 km之間,這樣一方面能保證所篩選的地震記錄至少有3 s初至P波信息,另一方面200 km的震源距上限可包含破壞性的日本近海地震(王延偉等,2020);③ 三分量井上地震波合成后的地震動(dòng)峰值加速度大于等于2 cm/s2;④ 信噪比(signal noise ration,簡(jiǎn)寫(xiě)為SNR)大于等于20 dB.篩選后的地震事件震級(jí)、所選測(cè)站的震源距及場(chǎng)地條件分布情況見(jiàn)圖1,場(chǎng)地分類見(jiàn)表1.
表1 場(chǎng)地條件分類(引自Zeynalov et al,2013)Table 1 Site condition classification(after Zeynalov et al,2013)
圖1 震級(jí)、場(chǎng)地剪切波速及記錄數(shù)隨震源距的變化Fig. 1 Distribution of magnitude,site shear wave velocity and event counts with hypocentral distance
經(jīng)篩選后的井上地震動(dòng)記錄格式不統(tǒng)一,且含有冗雜信息,因此數(shù)據(jù)在輸入神經(jīng)網(wǎng)絡(luò)前要經(jīng)過(guò)凈化流程處理,具體步驟如下:① 對(duì)加速度垂直分量數(shù)據(jù)進(jìn)行基線校正,同時(shí)為確保全部臺(tái)站在相同時(shí)間尺度下的采樣點(diǎn)數(shù)一致,將采樣頻率統(tǒng)一至100 Hz;② 采用長(zhǎng)短時(shí)平均方法(short term averaging/long term averaging,縮寫(xiě)為STA/LTA)結(jié)合赤池信息量準(zhǔn)則(Akaike information criterion,縮寫(xiě)為AIC)震相到時(shí)估算法對(duì)加速度時(shí)程記錄中的P波進(jìn)行初步拾??;③ 人工選波并剔除P波拾取異常的地震記錄;④ 對(duì)加速度記錄時(shí)程進(jìn)行快速傅里葉變換得到對(duì)應(yīng)的頻譜記錄;⑤ 將頻譜記錄取對(duì)數(shù)后的結(jié)果與震中距、震源深度以及vS30合并保存,作為模型分析的最終輸入數(shù)據(jù).
加速度時(shí)程數(shù)據(jù)經(jīng)以上過(guò)程篩選并整理后,最終得到3 065次地震的16萬(wàn)4 547條垂直分量加速度記錄的頻譜信息.考慮到地震發(fā)生時(shí)間的序列性,選用1997年至2014年所記錄到的12萬(wàn)4 955條加速度頻譜信息作為模型訓(xùn)練數(shù)據(jù)集(不包含2011年3月11日地震記錄),將2015年至2019年所記錄到的3萬(wàn)9 592條加速度頻譜信息作為模型測(cè)試數(shù)據(jù)集(包含2011年3月11日地震記錄).按照時(shí)間劃分?jǐn)?shù)據(jù)集,一方面確保訓(xùn)練集與測(cè)試集的地震數(shù)目大致符合深度學(xué)習(xí)領(lǐng)域的八二開(kāi)原則,另一方面又確保地震事件的完全獨(dú)立性,即同一地震事件的不同臺(tái)站記錄不會(huì)混雜于訓(xùn)練集和測(cè)試集中,具體分布見(jiàn)圖2.另外,此次研究將2011年3月11日所獲的24條特大型地震記錄全部放進(jìn)測(cè)試集,以測(cè)試本文所提出的模型在面對(duì)超災(zāi)難性地震事件發(fā)生時(shí)的表現(xiàn).
圖2 訓(xùn)練集與測(cè)試集分布情況對(duì)比圖Fig. 2 Distribution of training and test datasets
本研究編譯環(huán)境選擇基于數(shù)據(jù)流圖的機(jī)器學(xué)習(xí)框架tensorflow-gpu 1.13.1,編程語(yǔ)言是python 3.7.構(gòu)建CNN模型時(shí)使用keras提供的函數(shù)式模型定義法,以便有效地避免傳統(tǒng)序列模型缺乏自由度的問(wèn)題.
模型體系架構(gòu)由輸入?yún)^(qū)、卷積區(qū)、全連接區(qū)三部分組成,如圖3所示.
圖3 CNN模型架構(gòu)圖Fig. 3 Architecture of CNN model proposed in this study
1) 輸入?yún)^(qū).分為主輸入?yún)^(qū)和輔助輸入?yún)^(qū).加速度垂直分量的頻域信息作為主輸入?yún)^(qū)的輸入數(shù)據(jù)設(shè)置在卷積池化層前,震中距、震源深度和vS30作為輔助輸入?yún)?shù)附加到后置全連接層的第一層中.這樣分區(qū)設(shè)置輸入?yún)?shù)的優(yōu)勢(shì)在于頻譜數(shù)據(jù)經(jīng)過(guò)卷積池化層自動(dòng)提取震級(jí)特征圖后,可以結(jié)合全連接層引入的震中距、震源深度和vS30等信息,使模型進(jìn)行震級(jí)估算時(shí)將地震動(dòng)在不同路徑上的衰減效應(yīng)考慮在內(nèi),從而獲得更準(zhǔn)確的結(jié)果.
2) 卷積區(qū).前置八層為卷積池化層,最后一層為全連接層.前兩個(gè)卷積層的濾波器設(shè)置為64個(gè),后兩個(gè)卷積層的濾波器設(shè)置為128個(gè),四個(gè)卷積層的濾波器尺寸統(tǒng)一取2,移動(dòng)步長(zhǎng)統(tǒng)一取1.每個(gè)卷積層后都連接同參數(shù)池化(下采樣)層,選用最大池化(max pooling)操作進(jìn)行層間數(shù)據(jù)處理,并規(guī)定池化層濾波器尺寸和移動(dòng)步長(zhǎng)均取2.另外,選擇相同填充(same padding)作為全部卷積池化層中的填充屬性(padding),使數(shù)據(jù)經(jīng)過(guò)某一隱含層前后的維度保持一致.全連接結(jié)構(gòu)實(shí)際上是對(duì)最后一個(gè)池化層提取出的局部特征圖進(jìn)行展開(kāi)(flatten)處理,實(shí)現(xiàn)數(shù)據(jù)一維化.這樣將卷積池化層學(xué)習(xí)到的分布式特征整合并輸出為特征值,空間結(jié)構(gòu)特性則可忽略,從而減少特征位置對(duì)輸出結(jié)果的影響.
3) 全連接區(qū).設(shè)置4個(gè)全連接層,相應(yīng)的神經(jīng)元節(jié)點(diǎn)分別設(shè)置為259,64,16,1個(gè).實(shí)際上在構(gòu)建全連接區(qū)第一層時(shí)僅設(shè)置了256個(gè)節(jié)點(diǎn),但為了將震中距、震源深度和vS30這三個(gè)參數(shù)引入,額外設(shè)置了僅包含三個(gè)節(jié)點(diǎn)的全連接層與之拼接.整體采用λ=0.001的L2正則化方法在損失函數(shù)中添加懲罰項(xiàng),防止模型過(guò)擬合.卷積網(wǎng)絡(luò)后拼接多層全連接網(wǎng)絡(luò)的目的是為了更好地?cái)M合特征值、輔助參數(shù)與輸出目標(biāo)之間的非線性關(guān)系.
在整體的網(wǎng)絡(luò)設(shè)置中,除最后輸出節(jié)點(diǎn)外,Relu非線性激活函數(shù)應(yīng)用于每一個(gè)卷積和全連接層的輸出.
本文在配置訓(xùn)練方法時(shí)選擇Adam隨機(jī)梯度下降優(yōu)化器(η=0.001)并采用均方誤差公式(1)作為模型的損失函數(shù),平均絕對(duì)誤差公式(2)作為模型性能評(píng)估指標(biāo).
式中,n為樣本數(shù),為預(yù)測(cè)震級(jí),Yi為真實(shí)震級(jí),文中所用震級(jí)均采用MJMA.
模型訓(xùn)練采取五折交叉驗(yàn)證的方式來(lái)實(shí)現(xiàn)模型內(nèi)部參數(shù)的權(quán)重更新,具體過(guò)程為:將全部訓(xùn)練數(shù)據(jù)集隨機(jī)劃分成五個(gè)數(shù)量相等但不重復(fù)的子集,每次訓(xùn)練把其中一個(gè)子集作為另外四個(gè)子集訓(xùn)練的測(cè)試集,通過(guò)迭代訓(xùn)練完成神經(jīng)網(wǎng)絡(luò)中的權(quán)重值更新,流程如圖4所示.每批輸入2 048組數(shù)據(jù),設(shè)置100輪訓(xùn)練并配備早停機(jī)制,當(dāng)連續(xù)10輪驗(yàn)證損失不再下降時(shí)停止訓(xùn)練.整個(gè)過(guò)程所使用的算力來(lái)自于Nvidia GTX 2080Ti,每輪訓(xùn)練平均耗時(shí)3分鐘.
圖4 模型訓(xùn)練五折交叉驗(yàn)證示意圖Fig. 4 Schematic diagram of five-fold cross-validation in model training
確定時(shí)窗長(zhǎng)度為3 s,根據(jù)已選時(shí)窗長(zhǎng)對(duì)訓(xùn)練測(cè)試數(shù)據(jù)進(jìn)行截取,獲得300個(gè)樣本數(shù)據(jù)點(diǎn),截取后的訓(xùn)練數(shù)據(jù)用于卷積模型內(nèi)部超參數(shù)的確定,測(cè)試集用于模型性能測(cè)定.鑒于測(cè)試集和訓(xùn)練集中的地震事件完全獨(dú)立,并且測(cè)試數(shù)據(jù)集不參與任何訓(xùn)練過(guò)程,因此基于測(cè)試集的模型預(yù)測(cè)結(jié)果評(píng)估比較合理,具有代表性.
震級(jí)預(yù)測(cè)值與真實(shí)值之間關(guān)系如圖5所示.假定容錯(cuò)范圍為±0.5 (陳運(yùn)泰,2009),那么容錯(cuò)范圍內(nèi)包含的樣本為3萬(wàn)5 602個(gè),占總測(cè)試集樣本的比例為89.92%,誤差分布如圖6所示,可見(jiàn):3 s時(shí)窗下估算震級(jí)的絕對(duì)平均誤差為0.255 0,標(biāo)準(zhǔn)差為0.244 3.基于特征參數(shù)預(yù)測(cè)地震震級(jí)的相關(guān)研究(王延偉等,2020)表明,Pd參數(shù)的預(yù)警震級(jí)估計(jì)結(jié)果表現(xiàn)出的準(zhǔn)確率總體優(yōu)于其它參數(shù),且在Pd與震級(jí)之間的經(jīng)驗(yàn)公式的擬合過(guò)程中使用了震源距參數(shù),與本文模型的特征參數(shù)選取具有共同因子,故本研究與利用基于Pd預(yù)警參數(shù)計(jì)算結(jié)果進(jìn)行對(duì)比研究,以評(píng)估本文提出的模型在震級(jí)估算的精度上相較于傳統(tǒng)特征參數(shù)算法是否有提升.如圖6所示,利用Pd參數(shù)估算震級(jí),有2萬(wàn)4 168個(gè)樣本在誤差允許區(qū)間內(nèi),所占比例為62.18%,對(duì)應(yīng)誤差分布如圖6中黑邊條帶所示,3 s時(shí)窗下Pd估算震級(jí)的絕對(duì)平均誤差為0.456 0,標(biāo)準(zhǔn)差為0.361 9.兩者對(duì)比表明,本文提出的估算震級(jí)方法相較于利用參數(shù)Pd估算震級(jí)的方法,其震級(jí)估算誤差小、離散度低,具有更高的震級(jí)預(yù)測(cè)精度.需要指出的是,兩種方法在估算震級(jí)大于MJMA6.5的地震事件時(shí)均存在震級(jí)低估現(xiàn)象,但本文模型的誤差均值略小于Pd參數(shù)方法,對(duì)預(yù)測(cè)結(jié)果具有一定的改善,詳細(xì)的原因待下文探討.
圖5 3 s時(shí)窗下CNN估算震級(jí)(a)、Pd估算震級(jí)(b)與實(shí)際震級(jí)的比較分析Fig. 5 Comparison of the estimated magnitude by CNN (a) and by Pd (b) with actual magnitude for the time window of 3 s
圖6 3 s時(shí)窗下震級(jí)估算的誤差分布(a)和誤差均值圖(b)Fig. 6 Error distribution (a) and error mean (b) of CNN and P d magnitude estimation with 3 s time window
在實(shí)際的地震預(yù)警應(yīng)用中,臺(tái)站采集樣本點(diǎn)的數(shù)據(jù)量隨時(shí)窗增長(zhǎng)而增加.為了深入探究本文模型是否能夠隨可用數(shù)據(jù)的增加而提高地震震級(jí)的預(yù)測(cè)精度,本文將P波觸發(fā)后4—9 s各個(gè)時(shí)窗長(zhǎng)度下的震級(jí)預(yù)估結(jié)果與同條件下的Pd參數(shù)方法結(jié)果進(jìn)行對(duì)比分析,具體數(shù)據(jù)列于表2,其中5 s,7 s和9 s的樣本預(yù)測(cè)結(jié)果與實(shí)際震級(jí)的對(duì)比結(jié)果如圖7所示.
圖7 不同時(shí)間窗長(zhǎng)t下CNN (上)與Pd (下)估算震級(jí)與實(shí)際震級(jí)的比較分析Fig. 7 Comparison of the estimated magnitude by CNN (upper) and Pd (lower)with actual ones for different time windows
從表2可以看出,當(dāng)時(shí)窗長(zhǎng)度從4 s增加至9 s時(shí),模型估算震級(jí)的準(zhǔn)確率從92.46%提高至96.08%,增幅為3.62%,估算誤差標(biāo)準(zhǔn)差從0.234 0降低至0.164 6,均值從0.224 4降低至0.191 3,這表明本文所提出的模型存在隨著地震記錄數(shù)據(jù)的增加震級(jí)估算結(jié)果愈加接近真實(shí)震級(jí)的趨勢(shì).同樣,Pd參數(shù)方法也存在相同趨勢(shì),但其震級(jí)估算的精度明顯低于本文提出的CNN模型,例如,當(dāng)t=9 s時(shí)Pd震級(jí)估計(jì)準(zhǔn)確率僅為75.52%,甚至小于3 s時(shí)窗下本文模型估計(jì)的準(zhǔn)確率89.92%.
表2 神經(jīng)網(wǎng)絡(luò)(CNN)模型和Pd參數(shù)方法在不同時(shí)窗下的預(yù)測(cè)結(jié)果統(tǒng)計(jì)Table 2 Prediction result statistics of neural network model (CNN) and Pd with different time windows
從圖7可以觀察到,隨時(shí)窗長(zhǎng)度增加,MJMA>6.5地震事件的模型預(yù)測(cè)誤差散點(diǎn)逐步接近1 ∶ 1回歸線,即估算誤差逐步減小,說(shuō)明震級(jí)低估現(xiàn)象有一定程度的改善.特別是針對(duì)2011年3月11日的MJMA9地震事件,隨時(shí)窗從3 s增大到9 s時(shí),模型對(duì)24條記錄的震級(jí)預(yù)估結(jié)果的誤差均值從最初3.417減小至2.271,雖然預(yù)測(cè)誤差減小了很多,但是模型對(duì)巨大地震的預(yù)測(cè)精度仍未達(dá)到要求.
本研究提出的基于深度學(xué)習(xí)估算震級(jí)的方法在震級(jí)估算的準(zhǔn)確性方面顯著優(yōu)于傳統(tǒng)的基于特征參數(shù)的Pd參數(shù)方法.究其原因,其一是因?yàn)榫矸e全連接網(wǎng)絡(luò)處理地震頻域數(shù)據(jù)的過(guò)程完全由模型內(nèi)部算法運(yùn)行(Hinton,Salakhutdinov,2006),有效規(guī)避了人為定義的特征參數(shù)和震級(jí)估算經(jīng)驗(yàn)公式,直接由模型內(nèi)置卷積池化層從地震記錄數(shù)據(jù)中自動(dòng)提取特征圖后通過(guò)多層全連接層能更好地?cái)M合上層特征圖、輔助輸入?yún)?shù)與輸出標(biāo)簽震級(jí)之間的非線性關(guān)系;其二是在使用數(shù)據(jù)方面,本文模型較Pd參數(shù)額外考慮了vS30場(chǎng)地信息,一定程度上也有助于模型擬合不同場(chǎng)地條件下的地震記錄特征,使其在震級(jí)估算中的表現(xiàn)更優(yōu).
雖然模型在各震級(jí)區(qū)間的誤差均小于Pd參數(shù)方法,但當(dāng)震級(jí)超過(guò)MJMA6.5時(shí),模型估算震級(jí)明顯低于實(shí)際的震級(jí),其原因有三:一是大地震的斷層破裂時(shí)間長(zhǎng),需要更長(zhǎng)時(shí)段的波形數(shù)據(jù);二是大地震的樣本較少,沒(méi)有足夠的訓(xùn)練和檢測(cè)數(shù)據(jù);三是大震中的斷層破裂情況極其復(fù)雜,需引入更多的地震特征參數(shù)進(jìn)行信息補(bǔ)充.例如:對(duì)于2011年3月11日的東日本MJMA9大地震而言,其地震破裂是在多個(gè)斷層多次發(fā)生,Asano和Iwata (2012)認(rèn)為是由四次破裂疊加而成,雖然模型可隨地震持續(xù)時(shí)間的增長(zhǎng)來(lái)提取更多有效信息進(jìn)行內(nèi)部超參數(shù)的權(quán)重值更新,以此獲取更高精度的震級(jí)估算結(jié)果,但是對(duì)于大地震的預(yù)測(cè)結(jié)果仍有較大的提升空間,這方面的改進(jìn)尚需更多大地震數(shù)據(jù)的積累,同時(shí)需要融合地震破裂的一些物理規(guī)律,或是引入額外的諸如GPS數(shù)據(jù)等.
時(shí)效性方面,同樣是采用深度學(xué)習(xí)方法,相較于Lomax等(2019)以及Mousavi和Beroza(2020)等需要幾十秒的地震波形數(shù)據(jù),而本研究的模型只需前幾秒(3—9 s)的數(shù)據(jù),所以本文模型的時(shí)效性好,更能滿足地震預(yù)警快速及時(shí)的要求.
數(shù)據(jù)方面,按年份制作的KiK-net和K-NET訓(xùn)練測(cè)試數(shù)據(jù)集雖然在時(shí)序順序上保證了事件的獨(dú)立性和合理性,但是本研究只選取KiK-net和K-NET的井上地表記錄.相比于井下臺(tái)站記錄來(lái)說(shuō),井上的數(shù)據(jù)保有量多,但數(shù)據(jù)噪聲大,質(zhì)量相對(duì)較差.后期計(jì)劃加入井下的數(shù)據(jù)進(jìn)行相關(guān)對(duì)比分析.另外,本研究?jī)H基于單臺(tái)的垂直分量加速度的頻域信息開(kāi)展相關(guān)研究,未來(lái)將加入其余兩分量信息并同時(shí)考慮多臺(tái)站聯(lián)合分析,期望能進(jìn)一步提高本模型的震級(jí)預(yù)測(cè)精度.
本文采用深度學(xué)習(xí)方法建立了一種基于地震動(dòng)頻域信息的多層全連接的卷積神經(jīng)網(wǎng)絡(luò),通過(guò)由KiK-net和K-NET臺(tái)網(wǎng)16萬(wàn)4 547條地震動(dòng)記錄制作的數(shù)據(jù)集開(kāi)展訓(xùn)練和測(cè)試,并與傳統(tǒng)Pd預(yù)警參數(shù)法的計(jì)算結(jié)果進(jìn)行了對(duì)比,得出如下結(jié)論:
1) 將CNN深度學(xué)習(xí)回歸模型應(yīng)用于地震頻域數(shù)據(jù)集,并輔助以震源信息和場(chǎng)地vS30信息,能取得較好的震級(jí)估算結(jié)果.
2) 本文基于單臺(tái)站豎向地震動(dòng)頻域信息所提出的深度學(xué)習(xí)方法,不依賴人為定義的特征參數(shù)和經(jīng)驗(yàn)公式,能夠?qū)崿F(xiàn)端到端的震級(jí)估算,較基于特征參數(shù)Pd的傳統(tǒng)地震震級(jí)估算方法具有更高的精度.
3) 本文所提出的模型只需要3 s的地震動(dòng)數(shù)據(jù)就可以達(dá)到89.92%的估算精度,并且隨著P波數(shù)據(jù)的增加,能穩(wěn)步提升準(zhǔn)確率.
4) 對(duì)于MJMA>6.5地震事件,模型的震級(jí)估算結(jié)果雖然優(yōu)于Pd方法的結(jié)果,精度也隨著時(shí)窗尺度的增大而不斷提高,但是明顯存在著低估的趨勢(shì),這是未來(lái)需要研究解決的重點(diǎn).
日本防災(zāi)科學(xué)技術(shù)研究所提供強(qiáng)震數(shù)據(jù)下載服務(wù),在此表示感謝.