施佳朋 黃漢明 薛思敏 黎炳君
(廣西師范大學(xué)計(jì)算機(jī)科學(xué)與信息工程學(xué)院 桂林 541004)
完整的地震目錄對強(qiáng)震預(yù)測和地震學(xué)的研究有著重要的意義,快速準(zhǔn)確地對天然地震和人工爆破也是地震速報(bào)中的一項(xiàng)重要工作,人工爆破所產(chǎn)生的地震信號(hào),如果不能及時(shí)剔除,會(huì)影響往后地震學(xué)的研究[1]。故對天然地震與人工爆破的分類識(shí)別的研究是很有必要的。
多年來,在對天然地震信號(hào)的分類識(shí)別領(lǐng)域中,國內(nèi)外許多學(xué)者對地震信號(hào)進(jìn)行了廣泛的研究工作,如基于小波特征研究和經(jīng)驗(yàn)?zāi)B(tài)分解的研究[2~3],基于集成算法和廣義S變換的研究[4~5],運(yùn)用BP神經(jīng)網(wǎng)絡(luò)研究[6~7],首都圈地區(qū)爆破、礦塌和天然地震的識(shí)別研究[8],使用各種機(jī)器學(xué)習(xí)方法對地震信號(hào)處理[9~10],利用深度學(xué)習(xí)對地震信號(hào)研究[11~15]等工作,均取得了不錯(cuò)的效果,這些研究者們都提供了許多研究方向啟示。本文嘗試以小波包分解的奇異值熵分量為特征,基于PSO-SVM模型,來對天然地震信號(hào)分類識(shí)別進(jìn)行研究。
支持向量機(jī)在各個(gè)領(lǐng)域都有著廣泛的應(yīng)用,地震信號(hào)領(lǐng)域的學(xué)者們也嘗試使用基于支持向量機(jī)方法來研究地震[16~17],但是SVM分類性能受到懲罰參數(shù)c和核函數(shù)參數(shù)g的選擇影響,故本文使用引入尋優(yōu)算法來對參數(shù)進(jìn)行優(yōu)化以獲得最優(yōu)參數(shù)值,避免對參數(shù)的盲目選擇,經(jīng)過實(shí)驗(yàn),構(gòu)建的PSO-SVM模型,表現(xiàn)出了良好的效果。
小波包分解是小波變換的擴(kuò)展,與傳統(tǒng)方法相比,小波包分解能提高信號(hào)的時(shí)頻分辨率,盡可能保留有效信號(hào)不丟失,實(shí)現(xiàn)對非平穩(wěn)信號(hào)更加精細(xì)的分析[18]。就識(shí)別的角度來看待,小波包分解得到的有效信息具有很好的一致性,小波包分解得到的小波包樹中,最頂層的信號(hào)時(shí)間分辨率比較高,但是頻率分辨率較低,小波包分解樹從上往下的節(jié)點(diǎn),頻率分辨率越來越低,時(shí)間分辨率也相對變低,其中的每個(gè)小波包系數(shù)向量對應(yīng)了特定的信號(hào)和特定的小波基。
小波包分解的實(shí)質(zhì)是每次分解時(shí),可以用一系列低通和高通濾波器來表示,將待分解的信號(hào)通過高、低組合濾波器組,分解到高頻和低頻兩個(gè)通道上,可以簡單有如式(1)定義:
式(1)中的h0和h1為長度2N的低通和高通濾波器。分解時(shí)候,得到了一顆類似樹形結(jié)構(gòu),圖1為6層分解的小波包樹結(jié)構(gòu)展示。本文實(shí)驗(yàn)使用了6層分解,得到的是6層小波包樹,每個(gè)節(jié)點(diǎn)都有一個(gè)波形系數(shù),其中圖2為一個(gè)地震波形信號(hào)分解得到的[6,2]節(jié)點(diǎn)。
圖1 小波包分解樹
圖2 [6,2]波形節(jié)點(diǎn)系數(shù)
得到小波包樹后,對要重構(gòu)的層,有如下重構(gòu)公式:
為第G層小波包分解的第i個(gè)節(jié)點(diǎn);i=2m,…,0;和為小波包重構(gòu)濾波器組系數(shù)。
可以得到若假設(shè)地震信號(hào)經(jīng)過G層小波包分解后,令m=2G,原始地震信號(hào)長度為n,則利用了m個(gè)節(jié)點(diǎn),按照根節(jié)點(diǎn)順序依次排列,按照式(2),可以構(gòu)建出式(3)m*n階的小波包系數(shù)矩陣A。
文中矩陣,每一行代表了由一個(gè)節(jié)點(diǎn)重構(gòu)得到的信號(hào),里面的aij中表示第i個(gè)節(jié)點(diǎn)上的第j個(gè)采樣點(diǎn)。
奇異值分解(Singular Value Decomposition,SVD)是線性代數(shù)中一種重要的矩陣分解,通過一系列線性變換,將矩陣轉(zhuǎn)到一個(gè)新的坐標(biāo),在信號(hào)去噪和信號(hào)特征提取方面有重要的應(yīng)用[19]。對于m*n階的小波包系數(shù)矩陣A,其奇異值分解為
公式中:U為m*m階正交矩;V為n*n階正交矩陣;D為Dm*n=diag(σ1,σ2,…,σk)(k=min(n,m))的矩陣A的奇異值構(gòu)成的對角陣。分解時(shí)候得到的奇異值越大,對應(yīng)的特征向量在重構(gòu)的信號(hào)矩陣A中所占的份量越大。
Shannon信息熵理論在數(shù)學(xué)上指出,對于任意一個(gè)隨機(jī)變量X,它的熵定義如下:
信號(hào)奇異值的每個(gè)熵值,能夠表現(xiàn)出奇異值大小的分布情況,地震信號(hào)奇異值熵越大,奇異值熵能量分布越不均勻,而相反,奇異值熵越小,則越均勻,而熵是由每個(gè)熵分量求和所得,熵分量包含了有用信息,受此啟發(fā),選取了求奇異值熵分量來作為識(shí)別特征。其中計(jì)算每個(gè)奇異值的熵分量值的計(jì)算公式為
由上述式(6),就可以得到每個(gè)奇異值熵分量值,其中公式中,σi和M分別為奇異值和奇異值的個(gè)數(shù),本文實(shí)驗(yàn)中,只選取了前20個(gè)較大的奇異值熵分量。
粒子群優(yōu)化算法(Particle Swarm Optimization,PSO),是一種基于群體智能演變并行搜索計(jì)算技術(shù),其思想源于鳥群捕食行為的研究,通過群體中個(gè)體之間協(xié)作和信息共享來尋找最優(yōu)解[20]。在相關(guān)文獻(xiàn)中也有學(xué)者基于了PSO算法基礎(chǔ)上來對地震信號(hào)進(jìn)行研究[21],得到了不錯(cuò)的實(shí)驗(yàn)結(jié)果。
支持向量機(jī)(Support Vector Machine,SVM)是建立在統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上,具有較強(qiáng)的高緯樣本處理能力,SVM的分類結(jié)果受懲罰參數(shù)c和核函數(shù)參數(shù)g影響,實(shí)驗(yàn)中使用粒子群優(yōu)化算法來尋找最優(yōu)的影響參數(shù),構(gòu)成PSO-SVM模型。
圖3 尋優(yōu)適應(yīng)度圖
本文使用粒子群優(yōu)化算法對SVM進(jìn)行優(yōu)化時(shí)候,根據(jù)輸入奇異值熵分量特征向量數(shù)據(jù)來尋優(yōu)選擇參數(shù),不同的數(shù)據(jù)量,就有不同的尋優(yōu)值。在實(shí)驗(yàn)測試中,在實(shí)驗(yàn)中畫出尋優(yōu)過程的適應(yīng)度變化曲線,得到如圖3所示的尋優(yōu)適應(yīng)度圖,可以直觀看出粒子群優(yōu)化算法對SVM優(yōu)化。
本文所使用的數(shù)據(jù)來源于國家地震科學(xué)數(shù)據(jù)共享中心(http://data.earthquake.cn/),天然地震事件來源于中心首都圈數(shù)據(jù),人工爆破事件為門頭溝地區(qū)數(shù)據(jù),這些事件發(fā)生時(shí)間于2010年~2016年間,共使用了255個(gè)事件做實(shí)驗(yàn),天然地震共120個(gè),人工爆破共135個(gè)。其中的65個(gè)記錄的震動(dòng)信號(hào)波形數(shù)據(jù)事件用來做以波形為分類單元實(shí)驗(yàn),包含了天然地震事件30個(gè),人工爆破事件40個(gè),每個(gè)事件經(jīng)過程序選擇后,有幾份至幾十份不等的有效波形。而在以事件為分類單元的實(shí)驗(yàn)中,另外取了不同于波形分類單元實(shí)驗(yàn)的185個(gè)震動(dòng)事件,包含了天然地震90個(gè),人工爆破95個(gè)。
表1 以波形為分類單元的實(shí)驗(yàn)數(shù)據(jù)
事件中有許多個(gè)臺(tái)站記錄了波形數(shù)據(jù),每個(gè)臺(tái)站觀測到的信號(hào)波形有垂直向、水平東西向、水平南北向三個(gè)分量的波形,一個(gè)地震信號(hào)記錄的事件中有多個(gè)臺(tái)站記錄了下來的波形數(shù)據(jù)會(huì)存在差異,而且其中有的臺(tái)站會(huì)記錄了一些如等值線、趨勢線、純噪聲的地震波形數(shù)據(jù),本文研究只使用了其中的垂直分量方向的信號(hào)波形,去除了很明顯是無效信號(hào)的波形數(shù)據(jù)。
本文以波形為分類單元實(shí)驗(yàn)流程圖如圖4所示。
輸入地震信號(hào)后,先對波形進(jìn)行選擇處理,在程序中設(shè)置滑動(dòng)窗口長度和滑動(dòng)步長,對波形一段一段的滑動(dòng)檢測處理。首先從整個(gè)地震信號(hào)波形的最大波峰處向兩邊進(jìn)行窗口滑動(dòng),并且把滑動(dòng)過程中的每個(gè)窗口的波形信號(hào)最大波峰值記錄下來,若如果存在多個(gè)窗口波形中的最大波峰值大于預(yù)先設(shè)置的閾值,則判定認(rèn)為該波形被噪聲淹沒,視為無效波形數(shù)據(jù),對其舍棄;反之,若不存在則判定歸為有效波形數(shù)據(jù)。
對波形數(shù)據(jù)進(jìn)行選擇后,下一步是對振幅的歸一化和濾波消噪處理,天然地震信號(hào)和人工爆破信號(hào)能量大小不同,在數(shù)字波形記錄中會(huì)有較大差異性,另外還受到了外界物理?xiàng)l件的影響,一些臺(tái)站記錄下來的波形數(shù)據(jù)有漂移現(xiàn)象,記錄的波形信號(hào)偏離了零點(diǎn),這時(shí)候需要對其進(jìn)行歸一化處理,以消除這些影響。而去噪可以得到了一個(gè)相對原始信號(hào)更清晰的波形信號(hào),減少干擾。
圖4 以波形為分類單元框架流程圖
然后接著對波形信號(hào)進(jìn)行小波包分解,構(gòu)建出小波包系數(shù)矩陣,使用SVD對系數(shù)矩陣分解,基于小波包系數(shù)矩陣SVD分解的地震信號(hào)特征向量提取具體步驟如下。
1)對輸入的地震信號(hào)進(jìn)行6層小波包分解,得到了64個(gè)頻帶上的小波包系數(shù),利用各個(gè)頻帶上的小波包系數(shù),重新構(gòu)式(3)所示的小波包系數(shù)矩陣A。
2)對小波包系數(shù)矩陣A進(jìn)行奇異值分解,得到矩陣A的奇異值,實(shí)驗(yàn)中得到了64個(gè)奇異值,由這些個(gè)奇異值來求它們的奇異值熵分量,并且只取了前20個(gè)最大的奇異值熵分量作為特征向量。
對上述求得的奇異值熵分量作為特征向量,一共有1941*20的特征向量矩陣數(shù)據(jù),分別設(shè)置天然地震事件的標(biāo)簽為0,爆破事件的標(biāo)簽為1,將訓(xùn)練集和測試集按4:1劃分實(shí)驗(yàn)。1552份波形求得的組合特征向量作為訓(xùn)練樣本輸入到粒子群優(yōu)化算法優(yōu)化SVM中,構(gòu)建出了對這些波形數(shù)據(jù)較好分類識(shí)別的PSO-SVM,利用了粒子群優(yōu)化算法的尋優(yōu)特性,找到合適的SVM懲罰參數(shù)c和核函數(shù)參數(shù)g,剩下358份特征向量作為測試集,最后得出分類識(shí)別的結(jié)果,結(jié)果如表2所示。
表2 以波形為分類單元實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)中還以相同流程步驟,但是以事件為單元進(jìn)行分類識(shí)別,另取185個(gè)地震事件,其中天然地震事件90個(gè),爆破事件95個(gè),訓(xùn)練集和測試集按3∶1劃分,每個(gè)事件中都有許多個(gè)波形數(shù)據(jù),對每個(gè)波形數(shù)據(jù)進(jìn)行上述波形實(shí)驗(yàn)流程求出組合特征向量后,假設(shè)如果一個(gè)事件中的所有波形數(shù)據(jù)假設(shè)為天然地震,依次對每一條波形數(shù)據(jù)進(jìn)行波形分類識(shí)別判斷,若總的分類識(shí)別率達(dá)到了一半以上時(shí)候,則判定該事件為天然地震事件,否則判定為爆破事件,實(shí)驗(yàn)中,得到了表3所示的結(jié)果。
表3 以事件為分類單元的實(shí)驗(yàn)結(jié)果
地震信號(hào)的分類識(shí)別研究在地震信號(hào)處理領(lǐng)域有著重要的意義,本文為了實(shí)現(xiàn)對地震信號(hào)的分類識(shí)別目的,由熵值得到啟發(fā),利用更為細(xì)致的有用信息熵分量作為特征,基于粒子群優(yōu)化算法的尋優(yōu)能力,可以根據(jù)輸入的地震信號(hào)波形數(shù)據(jù)樣本量進(jìn)行調(diào)整參數(shù),解決了SVM人工選擇懲罰因子c和核函數(shù)參數(shù)g的困難,有著更好的適應(yīng)性。最終構(gòu)建出的PSO-SVM模型,經(jīng)過仿真實(shí)驗(yàn)測試分析,以小波包分解得到的小波包系數(shù)矩陣,經(jīng)過求出的奇異值熵分量作為特征輸入模型,能夠快速準(zhǔn)確地對天然地震與人工爆破進(jìn)行分類識(shí)別。