石耀霖,李林芳,程術(shù)
(中國科學院大學地球與行星科學學院 中國科學院計算地球動力學重點實驗室, 北京 100049) (2021年3月24日收稿; 2021年4月14日收修改稿)
地震預(yù)報長期以來是一個世界科學熱點和難題。1906年舊金山大地震之后,研究該大地震的地質(zhì)學家Gilbert于1909年在《Science》發(fā)表題為《地震預(yù)報》的文章,期望對地震從“只有占星家和甲骨文對它有神秘的預(yù)測”,變?yōu)椤暗卣饘W家能興奮地宣布,科學預(yù)測地震的時代已經(jīng)到來。”[1]。但在此后的半個世紀內(nèi),地震預(yù)報并無實質(zhì)性進展。直到1960年代,地震預(yù)報才再次引起科學界的關(guān)注。1963年中國科學家傅承義[2]在《科學通報》發(fā)表《有關(guān)地震預(yù)報的幾個問題》。特別在1960年代,1960年5月智利發(fā)生9.5級大地震,1964年3月美國阿拉斯加9.2級大地震,1964年6月日本新潟MS7.5地震,1966年3月中國邢臺6.8和7.2級大地震,以及1966年4月前蘇聯(lián)烏茲別克首府塔什干地震(震級雖然只有5.5級,但震源很淺,摧毀了城市80%的房屋)。在這一系列破壞性地震的震撼下,美國[3]、日本[4]、前蘇聯(lián)[5]和仍處于文化大革命動亂中的中國[6]都積極推進地震預(yù)報研究,有的還制定了國家級的規(guī)劃。1971年中國成立國家地震局,地震預(yù)報被作為一項日常任務(wù)。
1960年代在學術(shù)界對地震預(yù)報充滿了樂觀的情緒,開始實施了一系列的預(yù)報實踐。1977年批準的美國國家地震減災(zāi)計劃中,3 000萬美元的預(yù)算中有將近一半留給了預(yù)測研究[7]。在其后的二三十年時間內(nèi),1975年海城地震被中國成功預(yù)報[8],但是1976年7月28日的唐山地震卻未能實現(xiàn)短臨預(yù)報。美國曾對San Andreas 斷層的Parkfield段進行了預(yù)報研究。該區(qū)地震記錄可以回溯到1857年。這些記錄顯示,平均每(21.9±3.1) a就會重復(fù)發(fā)生6級左右地震。據(jù)此在1985年對Parkfield進行了地震預(yù)報試驗[9],認為1993年之前發(fā)生6級地震的可能性為95%。鑒于1934年和1966年主震前都發(fā)生過5級左右前震,所以1992年10月19日Parkfield實驗場發(fā)生4.7級地震導(dǎo)致了美國歷史上第一次官方發(fā)布72 h的公共A級警告[10],認為發(fā)生6級地震的可能性為37%。但是預(yù)期的6級地震卻姍姍來遲,直到距離1966年地震38 a后的2004年才在沒有事先觀察到前兆的情況下發(fā)生。
一系列地震預(yù)報的失敗導(dǎo)致了研究者對前兆現(xiàn)象可靠性的懷疑,頗具代表性的是Geller等[11]1997年在《Science》發(fā)文《地震不能預(yù)報》。在西方國家,特別是美國,占主導(dǎo)地位的觀點變?yōu)榈卣鸩荒艽_定性地預(yù)報(predict),只能概率性地預(yù)報(forecast)(注:有人建議把predict翻譯為預(yù)報,forecast翻譯為預(yù)測)。沿著這個學術(shù)思路,在加州發(fā)展了USERF3的地震預(yù)測研究。但在上述背景下的20世紀90年代到21世紀初的十幾年里,地震預(yù)報的研究明顯難以獲得資助。2004年蘇門答臘發(fā)生了大地震和海嘯,2011年3月11日發(fā)生日本東海大地震,這些造成巨大災(zāi)害的地震警示著人們,對地震的預(yù)測研究不容被忽視,學術(shù)探討又重新活躍起來。
在地震預(yù)報中,基于前兆的經(jīng)驗預(yù)報在很長一段時間占主導(dǎo)地位。研究者特別希望找到既有物理依據(jù)又有預(yù)報效果的前兆,但在前兆的確切定義、識別和預(yù)測效果方面一直沒有取得突破性進展。利用地震活動性特征開展統(tǒng)計預(yù)測是另一個、但更可行的重要研究方向。例如Vere-Jones[12]提出應(yīng)力釋放模型,Ogata[13]提出ETAS模型等。Gelfand等[14]在20世紀70—80年代就試圖將當時剛剛興起的人工智能圖像識別技術(shù)應(yīng)用于地震預(yù)報研究。隨后的90年代,Keilis-Borok和Kossobokov[15]基于模式識別手段提出M8-Msc算法。利用M8算法,Keilis-Borok竟然在2003年對2個地震的時間、地點和震級進行了成功預(yù)報。當年6月他預(yù)報9個月內(nèi)在加州 San Simeon發(fā)生6.4級以上地震,實際在12月22日發(fā)生了6.5級地震;7月預(yù)報北海道將在6個月內(nèi)發(fā)生 7級以上地震,實際9月25日發(fā)生了 8.1級地震。鑒于此,當他在2004年1月預(yù)測將在9月4日之前在南加州莫哈韋沙漠東南及南部地區(qū)可能發(fā)生里氏震級6.4或更高的地震時,引起了社會的廣泛關(guān)注。美國地質(zhì)調(diào)查局不得不表態(tài):“該團隊提出的地震預(yù)測方法是經(jīng)規(guī)范的工作途徑提出的,但預(yù)測需要通過實際檢驗后,才能證明它是否有效以及效果如何。”加州地震預(yù)測評估委員會認為:“迄今為止,尚無證據(jù)表明這些或相關(guān)方法可提供有用的中期預(yù)測。”但最終在該預(yù)測期間預(yù)報區(qū)內(nèi)并沒有發(fā)生預(yù)測的地震。早在1981年,Keilis-Borok曾和當時34歲的青年科學家Allan Lichtman合作,將尚無法完全成功預(yù)測地震的類似算法應(yīng)用于美國總統(tǒng)選舉等預(yù)測[16]。2012年Keilis-Borok去世后,Lichtman繼續(xù)依據(jù)13個關(guān)鍵預(yù)測因子(keys)進行預(yù)測實踐,已經(jīng)成功預(yù)測了10次美國總統(tǒng)的選舉結(jié)果,尤其是獨排眾議預(yù)測了特朗普2016年的當選,以及特朗普2020年的敗選。地震預(yù)報雖然比總統(tǒng)選舉預(yù)測更困難,但應(yīng)用機器學習的方向顯然值得持續(xù)研究和深入探索。
近年來人工智能及大數(shù)據(jù)研究和應(yīng)用迅速發(fā)展,并在許多領(lǐng)域里得到了關(guān)注。國內(nèi)外學者應(yīng)用機器學習方法對地震預(yù)測進行了多方面的探索嘗試[17-23]。許多從事人工智能研究的學者也涉足地震預(yù)報領(lǐng)域,為地震學研究開拓了新的視角、引入了新的方法,有力地促進了地震預(yù)報研究的進步。但是在數(shù)據(jù)質(zhì)量檢測、預(yù)報方法實用化等方面,仍需要地震學基礎(chǔ)和經(jīng)驗。
中國地震學家長期以來積累了大量地震預(yù)報經(jīng)驗,提出了長、中、短、臨震前4階段的漸進式預(yù)報方法[24-25]。本文在這些經(jīng)驗的基礎(chǔ)上,選擇中國地震科研實驗場所在的川滇地區(qū),利用1970年以來的地震目錄資料,基于長短時記憶(long short-term memory,LSTM)神經(jīng)網(wǎng)絡(luò)方法,嘗試建立一年尺度的中期預(yù)報模型,在該區(qū)域進行回溯性地震預(yù)報,并對預(yù)報模型的穩(wěn)定性和可重復(fù)性進行考察。
川滇地區(qū)是中國地震活躍的地區(qū),我們選擇其中部分地區(qū)作為研究區(qū)域(圖1),采用LSTM神經(jīng)網(wǎng)絡(luò)進行對未來一年研究區(qū)域可能發(fā)生的最大地震震級進行中期預(yù)測。
圖1 川滇地區(qū)區(qū)域構(gòu)造簡圖(根據(jù)Li et al.[26]修改)
在川滇地區(qū),尤其是圖1中標注“區(qū)1”的粉色區(qū)域內(nèi),1970年1月1日至2019年12月31日間地震目錄中的3級以上地震基本完備。這些數(shù)據(jù)將用于本文研究。在地震預(yù)報中,區(qū)內(nèi)大地震尤其值得關(guān)注。表1列出研究區(qū)中7級以上地震,其中標注“*”的為發(fā)生在較小范圍的區(qū)1內(nèi)。
表1 1970年以來發(fā)生在研究區(qū)內(nèi)的7級以上地震
這次嘗試是“以震報震”,即基于地震目錄反映的地震活動性特征的變化,進行預(yù)測嘗試。我們選擇16個地震預(yù)報因子進行地震預(yù)報(表2)。包括地震頻度N,最大地震震級Mmax,基于Giternberg-Richter關(guān)系的最小二乘b值(b1)和a值,描述最小二乘偏差特征的最小二乘G-R擬合時的均方差σG-R和最大震級欠缺ΔM,最大似然b值(b2),平均震級Mmean,地震總能量的平方根等9個地震預(yù)測研究中經(jīng)常用到的參量,還新引入Latmean、σLat、Lonmean、σLon、K、LatE、LonE共7個表征地震空間位置的特征因子。它們反映了地震活動空間位置、地震成團或成帶分布情況,能量釋放中心的空間位置等。這些參量在某種程度上與中國經(jīng)驗預(yù)報中的地震條帶、空區(qū)等空間分布特征有關(guān)。在這16個因子中,平均震級Mmean與最大似然b值之間、最小二乘b值與最大似然b值間、最大震級Mmax與地震能量平方根間等都有不同程度的相關(guān),但我們在地震預(yù)報因子的選取中有意保持了適度的冗余,雖然可以在后續(xù)研究中剔除,但在早期試驗中有必要考慮。
表2 基于地震目錄的預(yù)報因子
首先選取數(shù)據(jù)時間窗口。根據(jù)地震預(yù)報經(jīng)驗,一般認為7級以上大地震前兆會有半年至幾年的持續(xù)時間[27],我們將輸入目錄的時間窗口取為2 a。
預(yù)報因子中有些量,例如最小二乘a和b值等的計算,要求在時空窗口內(nèi)的地震達到一定的數(shù)目,如果太少,計算的值將誤差極大而不可靠。本文使用本地區(qū)1970年以來3級以上完備的地震目錄。在時間窗口取為2 a的情況下,為保證任何一個時空窗口中的地震數(shù)目都在30個以上,空間窗口則需要經(jīng)度6°×緯度 6°的面積。
為增加數(shù)據(jù)的使用效率,并適應(yīng)地震部門往往每個月都需要會商震情的實際工作需要,做到每個月都能夠補充最新資料和更新分析結(jié)果,因此將時間窗口和空間窗口都進行滑動。時間窗口每次滑動一個月,空間窗口(6°×6°)從研究區(qū)西北角開始向東滑移一格(1°),到區(qū)域邊緣后再向南一格開始新一行的滑移,在8°×8°的區(qū)1(圖1)范圍內(nèi),可以劃分為9個空間區(qū)塊。
LSTM模型輸出9個區(qū)塊各自下一年的最大震級,即輸出層有9個節(jié)點。輸入包括9個區(qū)塊在特定時刻前2 a時間窗口內(nèi)的16個預(yù)報因子,再加上上一時刻輸出的下一年最大震級的預(yù)報,即輸入層共9×17=153個節(jié)點。模型經(jīng)過多次優(yōu)化,最終將隱藏層層數(shù)設(shè)置為1層,隱藏層內(nèi)神經(jīng)元數(shù)量設(shè)置為64,學習率設(shè)定為0.001,最大訓練迭代次數(shù)設(shè)定為100。經(jīng)過學習訓練和檢驗,獲得了較滿意的結(jié)果。
利用1970年開始在區(qū)1內(nèi)的地震進行LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測模型的建立。為驗證LSTM對大地震的預(yù)報效果,設(shè)置了2個模型。
模型1:訓練集時段與驗證集時段之比為8∶2,訓練集可預(yù)報起始時間窗口為1972年1月至2009年6月,驗證集預(yù)報起始時間窗口為2009年7月至2018年11月。
模型2:由于2008年汶川大地震在模型1內(nèi)位于訓練集,為了測試方法對汶川地震能否回溯性預(yù)報,另設(shè)置訓練集與驗證集大小之比為7∶3的模型2。這樣訓練集預(yù)報起始時間窗口為1972年1月至2004年10月,驗證集預(yù)報起始時間窗口為2004年11月至2018年11月,2008年汶川MS8.0地震位于驗證集內(nèi),可以在驗證集內(nèi)回溯性檢測其能否對汶川地震進行預(yù)報。
模型1、2中期地震預(yù)報的結(jié)果如圖2所示。通常認為預(yù)報震級位于真實震級±0.5級范圍內(nèi)為準確預(yù)報[28],預(yù)報震級大于實際震級0.5級以上定義為虛報,預(yù)報震級小于實際震級0.5級以上定義為漏報。模型1測試集預(yù)報地震事件時空窗口共1 017個,準確預(yù)報地震事件797次,準確預(yù)報率為78.4%;虛報127次,虛報率為12.59%;漏報93次,漏報率為9.1%;模型2測試集中預(yù)報地震事件的時空窗口共1 521個,準確預(yù)報地震事件1 068次,準確預(yù)報率為70.2%;虛報285次,虛報率為18.7%;漏報168次,漏報率為11.1%。利用更多資料數(shù)據(jù)訓練的模型1表現(xiàn)優(yōu)于模型2;但即使是模型2,也能夠回溯性地預(yù)報2008年汶川MS8.0地震。表3給出驗證集中均方誤差(mean square error,MSE)、平均絕對誤差(mean absolute error,MAE)和均方根誤差(root mean square error,RMSE)這3種神經(jīng)網(wǎng)絡(luò)中常用的評價指標。所有這些評估都表明具有更長時間資料進行學習訓練的模型1明顯優(yōu)于模型2。
圖2 真實情況與LSTM(a)模型1和(b)模型2預(yù)報結(jié)果比較
表3 不同模型預(yù)報效果評價指標
中國地震局在年度預(yù)測評估中往往采用R評分[29],即地震預(yù)報成功率減去虛報率。該評分的變化范圍為[-1,1]。完全成功預(yù)報而無虛報漏報,R評分為1;完全隨機預(yù)報,R評分預(yù)期值為0;完全顛倒的“烏鴉嘴”,即預(yù)報有震卻無震、預(yù)報無震卻有震,R評分為-1。我們對LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果也進行了R評分。模型1在6°×6°空間窗口上6級及以上地震預(yù)測的R值評分為0.61,7級以上地震預(yù)測的R評分為0.50。中國地震局年度預(yù)報一般在1°×1°空間窗口進行,因此我們也進行了1°×1°空間的預(yù)測[28]。此時6級以上地震預(yù)報的R值評分為0.41,略高于全國年度會商2000—2016年R的平均值0.35。
在地震預(yù)測研究中,回溯性檢驗對模型的發(fā)展和改進至關(guān)重要[30]。一個8級地震釋放能量是6級地震的1 000倍,因此我們特別關(guān)注LSTM模型對2008年汶川大地震能否進行回溯性預(yù)測。模型2盡管訓練數(shù)據(jù)時間較短,但由于汶川地震位于測試集內(nèi),作為我們考察的重點。回溯性預(yù)報結(jié)果如圖3所示。汶川地震(31° N,103.4° E)位于西北部、北部、東北部、西部、中部、東部共6個空間窗口內(nèi)。在2007年6月(至2008年5月)首次出現(xiàn)對汶川地震中期預(yù)報的窗口。除南部和東南部區(qū)域外,其余區(qū)域的地震危險性急劇升高,其中西北部、北部、東北部、西部4個區(qū)域預(yù)報震級升至7.5~8級之間。到2007年9月(預(yù)報窗口到2008年8月)時,增加到西北部、北部、東北部、西部、中部、西南部6個區(qū)域預(yù)報可能發(fā)生7.5~8級地震。雖然在1970年到2004年的訓練數(shù)據(jù)內(nèi)并沒有發(fā)生過8級以上地震,但LSTM方法還是能夠成功回溯性預(yù)報MS8.0汶川地震(圖3)。此外,模型2也能夠成功回溯性預(yù)報研究區(qū)2010年以后發(fā)生的6.0級以上地震,包括2013年4月四川省蘆山縣7.0級地震、2014年8月云南省魯?shù)榭h6.5級地震、2014年11月四川省康定縣6.3級地震及2019年6月四川省長寧縣6.0級地震。
圖3 模型2對研究區(qū)2005年以來6級以上地震回溯性檢驗
中國具有每年年終對下一年地震風險進行預(yù)測的傳統(tǒng)[29],為此我們嘗試把LSTM神經(jīng)網(wǎng)絡(luò)的研究成果應(yīng)用到日常實際預(yù)測中去。
由于模型1預(yù)報效果更好,應(yīng)用該模型每月補充新的地震目錄資料延伸預(yù)報曲線(本文成稿截止到2021年2月底前地震目錄),據(jù)此對2020年1月起到2022年2月底前可能發(fā)生的地震進行了逐月更新的預(yù)測,其結(jié)果如圖4所示。該圖顯示,川滇研究區(qū)域內(nèi)覆蓋了2020-01—2021-12時段的預(yù)測地震最大震級開始不超過5.9級、后來甚至降到5.4級以下。由此看來,對于該地區(qū)來說,這是地震活動低于平均水平的2年。目前已經(jīng)過去的2020年到2021年3月中旬中,的確僅發(fā)生了2020年2月3日四川青白江M5.0地震、5月18日云南昭通巧家M5.0地震,以及落在研究區(qū)外約100 km的統(tǒng)計中不會被計入的2020年4月1日四川石渠M5.8地震。我們將繼續(xù)關(guān)注今后預(yù)報震級和實際震情的變化。
圖4 LSTM神經(jīng)網(wǎng)絡(luò)2021年中期預(yù)報結(jié)果
一個預(yù)測模型、特別是物理意義尚不明確的預(yù)測模型,其表現(xiàn)是否穩(wěn)定、是否具有可重復(fù)性是一個重要的問題。
我們曾經(jīng)使用過幾種神經(jīng)網(wǎng)絡(luò)方法,調(diào)節(jié)各種參數(shù),對研究區(qū)域進行預(yù)報研究,結(jié)果都沒能取得理想結(jié)果,圖5是全連接神經(jīng)網(wǎng)絡(luò)對同樣數(shù)據(jù)處理得到的典型預(yù)測檢驗結(jié)果??梢钥闯鲱A(yù)測的6級以上地震均為虛報,而真實的6~8級的大地震幾乎百分之百地漏報。與圖2的LSTM方法預(yù)測結(jié)果差別明顯。這是由于LSTM的記憶功能使其在處理時間序列時可以有更好的表現(xiàn),這一特點在與時間相關(guān)的序列語音或視頻輸入分析中都得到驗證[31]。地震預(yù)報的經(jīng)驗表明,地震前兆有一個發(fā)展過程,不能僅僅根據(jù)一個時刻的某個預(yù)報因子值(例如b值)進行預(yù)報,而是要考慮該值隨時空的變化圖像進行預(yù)測[32]。LSTM模型能更好地反映這種物理過程和特征,它在地震預(yù)報中的優(yōu)異表現(xiàn)(圖2)應(yīng)該不是偶然的。
圖5 全連接神經(jīng)網(wǎng)絡(luò)測試集預(yù)報結(jié)果與真實情況比較
圖6 LSTM神經(jīng)網(wǎng)絡(luò)以未來一年M4震級為擬合目標時全部數(shù)據(jù)預(yù)報結(jié)果與真實情況比較
在地震預(yù)報中,對未來大地震震級的估計十分重要。從科學上來講,一個8級地震能量相當于1 000個6級地震的能量。從社會需求上來講,大地震造成重大的人員傷亡和經(jīng)濟損失。例如1976年唐山MS7.8地震死亡24萬余人,2008年汶川MS8.0地震死亡和失蹤8萬7千余人。目前雖然有些定量化尋找異常指標的方法,但從發(fā)現(xiàn)的指標異常到預(yù)報的震級之間仍受主觀判斷影響,所得結(jié)果具有明顯的不確定性,這是地震預(yù)報中最大的困難。LSTM方法直接提供未來最大震級的預(yù)報,也可估計其誤差。對預(yù)報的均方差有所了解,可以為地震部門實用化預(yù)測提供便利。
圖7顯示模型3的預(yù)測結(jié)果與實際情況的偏差圖。橫軸的序號為時空窗口按時間和空間區(qū)塊的排序,基本上反映了時間的先后,在同一時間段則反映空間區(qū)塊排序的先后;縱軸為預(yù)報值減去實際值。“°”表示預(yù)測值與實際值相差在0.5級以內(nèi)的準確預(yù)報,“+”表示預(yù)測值低于實際值0.5級以上的漏報,“×”表示預(yù)測值高于實際值0.5級以上的虛報。圖8是預(yù)報偏差統(tǒng)計的柱狀圖。全部預(yù)報的均值為0.007 4,均方差為0.27。對于6級以上地震,均值-0.058,均方差為0.25;對于7級以上地震,均值為-0.090,均方差值為0.32。對中、小地震的震級預(yù)測大體是無偏的,誤差在0.4級以下。對6~7級大地震預(yù)測可能會略有低估,但不超過0.1級,偏差在0.3~0.4級左右。隨著數(shù)據(jù)的增多,或采用滾動交叉驗證方法可以對不同時段預(yù)測誤差進行更詳細的估計。
窗口的序號從小到大基本反映了時間的從前到后,在同一時刻則各區(qū)塊按空間順序排序
圖8 模型3不同震級預(yù)測值與實際值偏差的分布
對不同地區(qū)進行測試研究可以更好地檢驗LSTM方法用于地震預(yù)報的穩(wěn)定性。但川滇地區(qū)資料更全、地震更多,故此我們?nèi)岳么ǖ岬貐^(qū)已有地震目錄,但將研究區(qū)域從原來的8°× 8°范圍(區(qū)1)擴大到8°× 12°范圍的區(qū)2(見圖1)。雖然研究區(qū)域僅擴大50%,但空間滑動區(qū)塊數(shù)從9個增加到21個。仍利用2 a資料對下一年進行中期預(yù)報,所得模型稱為模型4。
圖9顯示采用訓練集與驗證集之比為5∶1時,全部時空區(qū)塊預(yù)測和真實發(fā)生的最大地震震級比較結(jié)果。準確率為86.8%,漏報率為5.3%,虛報率為7.9%。在6°× 6°區(qū)塊上6級以上地震預(yù)測的R評分為0.77,7級以上地震預(yù)報的R評分是0.79(表3)。這顯示在研究區(qū)域擴大50%的情況下,LSTM神經(jīng)網(wǎng)絡(luò)的方法依然穩(wěn)定有效,也顯示了空間滑動窗口的方法在處理更大區(qū)域數(shù)據(jù)時的可行性。
圖9 模型4 LSTM神經(jīng)網(wǎng)絡(luò)訓練集和測試集全部數(shù)據(jù)預(yù)報結(jié)果與真實情況比較
2008年汶川大地震后中國地震局組織的總結(jié)與反思中提到,“當今的地震預(yù)報仍處于經(jīng)驗性預(yù)報階段,……參加過1966—1976年地震活躍期地震預(yù)測預(yù)報工作的絕大部分同志已經(jīng)退出了工作崗位?,F(xiàn)在的地震預(yù)測預(yù)報工作骨干多數(shù)沒有經(jīng)歷7級、甚至6級地震預(yù)報,經(jīng)驗明顯不足,‘經(jīng)驗’出現(xiàn)了斷層?!边@反映了非定量化的經(jīng)驗預(yù)報方法在傳承和可重復(fù)性方面出現(xiàn)的問題。LSTM預(yù)測模型是一種定量化的預(yù)測模型,比起非定量化的檢驗預(yù)測容易推廣和傳承。但在該預(yù)測中,也有一些問題需要明確。
神經(jīng)網(wǎng)絡(luò)類似一個黑匣子,輸入地震活動性相關(guān)的預(yù)報因子就能輸出未來一年最大震級的預(yù)測。本文計算顯示,神經(jīng)網(wǎng)絡(luò)從大量數(shù)據(jù)中識別出了大地震前包含某種規(guī)律性的圖像,但我們并不了解是什么圖像,以及什么物理過程形成了這種圖像。盡管如此,神經(jīng)網(wǎng)絡(luò)預(yù)報還是能提供一些線索和啟發(fā),有助于我們?nèi)ヌ剿黝A(yù)測的物理背景。
圖3中的預(yù)測曲線隨時間變化,有時是緩慢漸變的,但很多情況下是突變的。一類突變是大地震之后預(yù)測震級突然降低,大震后16個因子都會有較大變化,這將影響后繼的地震活動性,這符合應(yīng)力釋放后需要一段時間應(yīng)力積累才能發(fā)生新的大地震這一物理機理。汶川、姚安地震后預(yù)測震級一降到位,而魯?shù)榈卣鸷笾唤盗艘粋€臺階,直到康定地震后才降到位,這種地震活動性的差異值得返回去仔細研究挖掘它們對應(yīng)的應(yīng)力釋放過程及其影響。
另一類突變是預(yù)測震級突然升高,這也是最值得重視的一類突變,與對大地震的預(yù)報息息相關(guān)。從2007年5月到6月預(yù)測曲線發(fā)生了躍變,這啟示我們需要對所依據(jù)的截止到5月的研究區(qū)域內(nèi)地震活動進行細致分析,甚至考慮研究區(qū)域之外特大地震的影響。這方面還有許多工作有待仔細研究。
由上可見,LSTM模型本身雖然不能告訴我們預(yù)測的物理依據(jù),但提供的線索啟示我們?nèi)ヌ綄りP(guān)鍵預(yù)報因子發(fā)生的變化及其背后的物理機制。模型的產(chǎn)生不是研究的終點,而是從物理上理解大震前地震活動性特征圖像的新起點。必要時甚至可以把時間窗的滑動減小為一周,那時關(guān)注預(yù)報曲線隨時間變化也許可以給我們更多啟示。
還需要指出,目前基于特定地區(qū)(8°× 8°的小區(qū)域或擴大到8°× 12°的大區(qū)域)、特定的時段(1970—2019年)數(shù)據(jù),發(fā)現(xiàn)了前期地震活動性與后面一年大震的發(fā)生存在一定的相關(guān)關(guān)系,但并不能輕言就是物理上一定有因果聯(lián)系。如同莊建倉等[33]展示的,2003—2015年,中國油價和大地震發(fā)生存在很好的相關(guān)關(guān)系,并能通過各種統(tǒng)計檢驗,但我們很難認可今后把油價作為地震預(yù)報的依據(jù)。只有在更多地區(qū)、利用更長時間段的數(shù)據(jù)進行了驗證之后,才能確認物理上的因果關(guān)系。
基于對與大震前地震活動特征圖像關(guān)聯(lián)性的分析,可以了解現(xiàn)有預(yù)報因子在預(yù)報中的作用,然后據(jù)此除去那些沒有作用或作用不大的因子、增添可能有用的新預(yù)報因子。對于現(xiàn)有的16個預(yù)報因子,特別是那些具有冗余信息的預(yù)報因子,可以嘗試多種方法研究它們在預(yù)測中究竟各自做出了多大貢獻,是否可以刪減?在前人M8算法模型、AMR加速力矩釋放模型[34]等研究中,是否可以概括出有用的預(yù)報因子加入我們的模型?長期經(jīng)驗預(yù)報中還有哪些顯示了預(yù)報價值的參量可以歸納出新的預(yù)報因子?這些都是值得深入研究的問題。
目前我們開展的是一年中期預(yù)報。這么做一方面是客觀需要。因為從物理上說,孕震有一個過程,大地震在1 a或更長的時間內(nèi)孕育,從過去2 a的資料可以對活動趨勢有所覺察,根據(jù)它強化年度內(nèi)的監(jiān)測工作。另外也是受當前數(shù)據(jù)所限。從技術(shù)上來說,如果使用2 a的資料做輸入直接做1個月的短期預(yù)報,那么在本研究的5 148個時空窗口中,包含6.0級以上大地震的時空窗口就只有203個,占比4%。在此情況下,神經(jīng)網(wǎng)絡(luò)很難達到完美識別大震前圖像和預(yù)測大地震的效果。而在12個月的中期預(yù)報中,全部5 076個窗口中有1 575個出現(xiàn)6.0級以上地震,占比31%,技術(shù)上更容易訓練出中期預(yù)報的神經(jīng)網(wǎng)絡(luò)。但是目前的為期1年、涉及數(shù)十萬km2面積的中期預(yù)報即使成功,也難以滿足社會抗震減災(zāi)的實際需求,大地震的短期預(yù)報和臨震預(yù)報是必須面對的研究課題。
短臨預(yù)報應(yīng)該關(guān)注幾個月、幾周、甚至幾天的震情和前兆變化,為此輸入不能再采用中期預(yù)報的2 a為時間窗口。為了在更短時空窗口中包含足夠的地震數(shù)量,必須要以包含更多小震的完備的地震目錄為前提。幸好中國川滇地區(qū)從2000年以來已經(jīng)能夠完備記錄區(qū)域內(nèi)1.7級以上的地震,為采取以震報震的神經(jīng)網(wǎng)絡(luò)提供了條件。今后要在中期預(yù)報的基礎(chǔ)上,探索機器學習方法在漸進式短臨預(yù)報中的應(yīng)用。
本文目前的LSTM神經(jīng)網(wǎng)絡(luò)仍是“以震報震”,僅僅使用地震目錄反映的地震活動性特征進行預(yù)報。但是把地震活動性和形變、應(yīng)力、電磁、地下水等前兆手段集成起來開展綜合預(yù)報是中國地震學界的共識。原則上,在LSTM神經(jīng)網(wǎng)絡(luò)方法中不難加入前兆手段觀測值為附加的新預(yù)測因子,但所面臨的主要技術(shù)困難是,早期前兆觀測點有限,資料匱乏,高質(zhì)量持續(xù)觀測的前兆數(shù)據(jù)缺乏且空間覆蓋不全。因此,在未來的研究中需要針對前兆資料時空分布不均衡性這一困難找出對策。
川滇地區(qū)是中國地震活動區(qū),具有1970年來3級以上地震基本完備的地震目錄,非常適于開展地震預(yù)報實驗研究。通過對該區(qū)進行初步LSTM神經(jīng)網(wǎng)絡(luò)預(yù)報模型研究,發(fā)現(xiàn)LSTM神經(jīng)網(wǎng)絡(luò)在地震預(yù)測方面應(yīng)用是可行的,并獲得了令人滿意的初步結(jié)果,結(jié)果具有明顯的穩(wěn)定性和可重復(fù)性,具有在地震預(yù)報中實用化的潛力。我們對該區(qū)未來一年的地震活動性進行了預(yù)測,這些預(yù)測結(jié)果正接受著川滇地區(qū)地震活動的實際檢驗。
LSTM神經(jīng)網(wǎng)絡(luò)在川滇地區(qū)能夠回溯性預(yù)測大地震、特別是2008年MS8.0汶川大震的初步結(jié)果是具有積極意義的。比如,在2008年前,如果我們掌握了LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測模型,那么利用1970—2007年的地震目錄,僅僅憑借“以震報震”,也是有可能預(yù)報汶川地震的。所以實現(xiàn)這種回溯性的預(yù)報,對今后地震預(yù)報研究的科學思路,會有很大的啟發(fā)。
目前的成果表明,機器學習有可能發(fā)揮計算機處理大數(shù)據(jù)的優(yōu)勢,發(fā)現(xiàn)人工難以找到的大地震前的某些活動圖式,從而能夠比人類更敏感地覺察和預(yù)報。但是,目前的機器學習是一個黑匣子,并沒有說明其間的物理聯(lián)系,因此,仍需要進一步深入研究各個預(yù)報因子的作用,找出它們影響的大小和物理原因,深入開展物理預(yù)報;也還需要在更多地區(qū)、更長時段、對更多震例進行大量研究。在這些研究和實踐過程中,隨著預(yù)報模型的不斷更新,有望實現(xiàn)預(yù)報方法的實用化。
感謝劉杰研究員和地震臺網(wǎng)中心幫助提供地震目錄資料。感謝劉杰、吳忠良和張永仙對本研究的建議和幫助。