鞠東豪,李 宇,張萬達(dá),張春華
(1. 中國(guó)科學(xué)院聲學(xué)研究所,北京100190;2. 中國(guó)科學(xué)院大學(xué),北京100039;3. 中國(guó)科學(xué)院先進(jìn)水下信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京100190;4. 中國(guó)船舶工業(yè)系統(tǒng)工程研究院,北京100036)
近年來,隨著各類航行器的發(fā)展以及各類傳感器的更新迭代,海洋航行和探測(cè)識(shí)別領(lǐng)域取得了很大的進(jìn)步。目標(biāo)分類識(shí)別算法是水下探測(cè)技術(shù)的關(guān)鍵一環(huán),也是聲吶的一項(xiàng)重大任務(wù),傳統(tǒng)的目標(biāo)識(shí)別技術(shù)往往依賴于聲吶兵的經(jīng)驗(yàn)進(jìn)行判斷,但是隨著探測(cè)技術(shù)的發(fā)展和傳感器數(shù)目大量增加,以及各類無人航行器的發(fā)展,人工識(shí)別漸漸被淘汰。
目標(biāo)識(shí)別可以分為兩部分進(jìn)行,其一是對(duì)目標(biāo)進(jìn)行特征提取,即對(duì)接收數(shù)據(jù)使用信號(hào)處理手段突出其代表性特征。其二是分類器設(shè)計(jì),即對(duì)目標(biāo)特征進(jìn)行學(xué)習(xí)和分類。其中特征提取算法的優(yōu)劣往往直接決定了目標(biāo)識(shí)別的成功率,因此特征提取是水聲被動(dòng)目標(biāo)識(shí)別的關(guān)鍵任務(wù)。1997年章新華等將目標(biāo)特征提取和小波分析和功率譜分析結(jié)合,使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類[1],取得了較好的分類效果。2002年李亞安等利用水下噪聲信號(hào)的混沌現(xiàn)象提取其混沌特征[2]。此外,還有學(xué)者受人耳識(shí)別的啟發(fā),利用梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstral Coefficient, MFCC)特征進(jìn)行目標(biāo)的識(shí)別[3],同樣有較好的效果。
1998年,黃鍔提出了希爾伯特-黃變換(Hilbert-Huang Transform, HHT)[4],該變換被稱為經(jīng)驗(yàn)?zāi)B(tài)分解算法(Empirical Mode Decomposition, EMD)。這是一種檢測(cè)并且將信號(hào)分解為各階模態(tài)的方法。這一方法依賴對(duì)信號(hào)極值點(diǎn)的尋找、極值點(diǎn)的插值以及停止準(zhǔn)則,且該方法缺乏數(shù)學(xué)理論的支撐,綜上幾點(diǎn)原因該方法的魯棒性還有待提高。EMD算法雖然存在一些弊端,但是影響十分廣泛,在醫(yī)學(xué)、生物學(xué)等多個(gè)領(lǐng)域均有應(yīng)用。2007年王鋒等將HHT方法引入水聲信號(hào)處理中[5],對(duì)四類目標(biāo)進(jìn)行分類實(shí)驗(yàn),達(dá)到了 90%以上的識(shí)別正確率。另外針對(duì)EMD算法存在的模態(tài)混疊問題,有學(xué)者將集合經(jīng)驗(yàn)?zāi)B(tài)分解算法(Ensemble Empirical Mode Decomposition, EEMD)和希爾伯特邊際譜相結(jié)合[6],一定程度上解決EMD分解時(shí)出現(xiàn)的模態(tài)混疊問題。Dragomiretskiy等于 2014年提出了變分模態(tài)分解(Variational Mode Decomposition, VMD)算法,該方法自適應(yīng)地切割信號(hào)頻段,有效解決了傳統(tǒng)EMD算法中模態(tài)混疊的問題[7]。
為了提升目標(biāo)識(shí)別的效率,本文將VMD引入水聲目標(biāo)分類當(dāng)中,結(jié)合希爾伯特變換算法形成21維特征向量,通過對(duì)比多類分類器實(shí)驗(yàn),結(jié)果表明VMD-HT聯(lián)合處理算法具有更高的分類正確率。
傳統(tǒng) EMD算法的本征模函數(shù)(Intrinsic Mode Function, IMF)被定義為一個(gè)局部極值和過零點(diǎn)個(gè)數(shù)最多相差1的信號(hào)。VMD算法對(duì)IMF的定義稍做改動(dòng),VMD算法認(rèn)為 IMF是調(diào)幅調(diào)頻信號(hào)(AM-FM)[7],記為
式中:uk(t)為第k階MF分量,其中第k階MF分量的相角是一個(gè)非遞減函數(shù),即,第k階MF分量的幅值是非負(fù)的函數(shù)為時(shí)間。在足夠長(zhǎng)的時(shí)間段模態(tài)uk( t)可以被視為是一個(gè)振幅為Ak( t)、瞬時(shí)頻率為φk′(t ) 的純諧波信號(hào)。不難發(fā)現(xiàn),上述這一定義比最原始的IMF定義更加嚴(yán)格。
VMD分解的目的是將原始輸入信號(hào) f分解為多個(gè)符合上述模型的 IMF分量uk。假設(shè)每一個(gè)IMF分量uk是圍繞著某一個(gè)中心頻率ωk振動(dòng)產(chǎn)生的,而這一中心頻率是在分解過程中確定的。對(duì)每一個(gè)IMF uk( t)進(jìn)行希爾伯特變換,利用指數(shù)修正得到K個(gè)模態(tài)函數(shù),將模態(tài)函數(shù)頻譜修正到估算的中心頻率,利用高斯平滑計(jì)算出模態(tài)分量的帶寬[7]:
使用乘法算子交替算法(Alternating Direction Method of Multipliers, ADMM)求式(3)的鞍點(diǎn),更新uk如式(4)所示:
式中:α為懲罰因子;λ為拉格朗日乘子;X為f和uk所在的函數(shù)空間。使用 Parseval/Plancherel傅里葉等距變換,將式(4)轉(zhuǎn)換到頻域,如式(5)所示:
該算法在分解信號(hào)的過程中不斷自適應(yīng)的更新每個(gè)IMF分量的中心頻率,可以有效地避免傳統(tǒng)EMD分解算法中的模態(tài)混疊現(xiàn)象,減少無效分解數(shù)量,且不同于EMD算法的是,該方法具有詳細(xì)完整的數(shù)學(xué)推導(dǎo)過程。
水聲被動(dòng)目標(biāo)識(shí)別過程如圖1所示。
圖1 水聲被動(dòng)目標(biāo)識(shí)別算法流程圖Fig.1 Flow chart of the classification algorithm for ship radiation noise
如1.1節(jié)所述,對(duì)信號(hào)進(jìn)行VMD分解后,為了更好地反映數(shù)據(jù)的瞬時(shí)性,對(duì)分解后的各個(gè)分量進(jìn)行Hilbert變換處理,可以得到各個(gè)分量的瞬時(shí)振幅和瞬時(shí)頻率,如式(9)所示:
由信號(hào)的瞬時(shí)相位可以求得其瞬時(shí)頻率如式(12)所示:
由經(jīng)過希爾伯特變換的IMF分量的瞬時(shí)頻率、邊際譜以及幅值等特征經(jīng)過組合構(gòu)成 VMD-HT特征。仿真數(shù)據(jù)的時(shí)域信號(hào)如圖2所示。
將圖2所示的時(shí)域信號(hào)分別進(jìn)行短時(shí)傅里葉變換和VMD-HT變換后的時(shí)頻圖,如圖3所示。
圖2 仿真數(shù)據(jù)時(shí)域信號(hào)Fig.2 Time domain signal of simulation data
圖3 仿真數(shù)據(jù)短時(shí)傅里葉變換以及VMD-HT的時(shí)頻圖Fig.3 The time-frequency diagrams of short-time Fourier transform of simulation data and VMD-HT
由圖3不難看出,VMD-HT算法所繪制的時(shí)頻譜圖相比于短時(shí)傅里葉變換時(shí)頻譜可以更好地描述信號(hào)的隨機(jī)擾動(dòng)。
VMD各階模態(tài)中是否存在干擾模態(tài)以及如何將干擾模態(tài)剔除是十分值得研究的問題。干擾模態(tài)不僅增加特征維數(shù),影響分類器效率,很大程度上也容易混淆目標(biāo)特征,從而影響對(duì)目標(biāo)的分類,所以需要在特征提取之前將干擾模態(tài)剔除。本文使用相關(guān)性作為區(qū)分依據(jù)進(jìn)行干擾模態(tài)的剔除。以漁船噪聲為例,漁船噪聲的原始時(shí)域信號(hào)以及VMD分解結(jié)果如圖4所示。對(duì)圖4中的各階IMF分別計(jì)算其與原信號(hào)的相關(guān)系數(shù)結(jié)果如圖5所示。通過將每一階 IMF和原始信號(hào)的相關(guān)系數(shù)與閾值(本文設(shè)定為0.1)對(duì)比,不難看出,對(duì)于圖4中的漁船數(shù)據(jù)而言,應(yīng)當(dāng)保留1~3階IMF進(jìn)行特征提取,而4~10階IMF則被視為干擾模態(tài)被剔除。使用這一方法能夠一定程度上提高特征提取算法的效率和分類器的分類正確率。
圖4 漁船噪聲原始時(shí)域信號(hào)以及VMD分解結(jié)果Fig.4 Original time domain signal and VMD decomposition result of fishing boat noise
圖5 漁船噪聲各階本征模函數(shù)(IMF)與原始信號(hào)相關(guān)系數(shù)Fig.5 Correlation coefficients between each order of IMF and original signal of fishing boat noise
水下目標(biāo)分類常用的分類器算法有:K最近鄰(K-Nearst Neighbor, KNN) 算法、隨機(jī)森林(Random Forest, RF) 算法、樸素貝葉斯(Naive Bayes, NB)算法、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)算法以及支持向量機(jī)(Support Vector Machine,SVM)算法。水聲目標(biāo)分類由于樣本數(shù)量有限的原因容易出現(xiàn)過學(xué)習(xí)和欠學(xué)習(xí)的現(xiàn)象。支持向量機(jī)算法所構(gòu)建的分類規(guī)則能夠很好地平衡算法的性能和推廣能力,既能適應(yīng)復(fù)雜多變的水下環(huán)境,又能夠保證較好的分類效果,所以本文應(yīng)用支持向量機(jī)算法對(duì)目標(biāo)進(jìn)行分類。
支持向量機(jī)源于結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論,首先利用核方法將輸入空間樣本經(jīng)過非線性變換映射到高維空間中,然后在從高維空間中尋找最優(yōu)超平面進(jìn)行分類,這一過程可以將一個(gè)復(fù)雜的分類問題極大簡(jiǎn)化。所謂最優(yōu)超平面就是要求該超平面不僅可以將兩類數(shù)據(jù)分開而且分類間隔最大,這種具有最大分類邊界的分類算法具有更好的泛化能力。
式中:x是輸入向量,w是可調(diào)權(quán)值向量,b是偏置。由式(13)可以寫出:
對(duì)于給定的w和b,決策曲面與最近數(shù)據(jù)點(diǎn)之間的間距被稱為分離邊緣ρ。支持向量機(jī)算法核心在于如何尋找分離邊緣ρ最大的決策曲面,決策曲面被稱為最優(yōu)超平面。通過上述原則可以構(gòu)造出線性支持向量機(jī)的最優(yōu)化問題:
可以通過求解上述凸二次規(guī)劃問題得到目標(biāo)支持向量機(jī)額最優(yōu)權(quán)值w*和偏置b*。
對(duì)于線性可分的樣本,很容易確定最優(yōu)超平面,但是當(dāng)樣本類別以非線性的形式分散時(shí),線性邊界就變得不再適用。可以使用某種映射函數(shù)將輸入向量投影到可線性分類的高維的特征空間中,從而解決這一非線性分類問題。這種映射函數(shù)被稱為核函數(shù),核函數(shù)的選取需要滿足Mercer定理,在這里列舉三類常用核函數(shù)作為例子[8],如表1所示。
表1 支持向量機(jī)(SVM)常用核函數(shù)Table 1 Common kernel functions for SVM
本文提取多類基于VMD分解的數(shù)據(jù)特征,特征類型及對(duì)應(yīng)向量維數(shù),如表2所示。
表2 特征類型及對(duì)應(yīng)向量維數(shù)表Table 2 Feature types and corresponding vector dimensions
使用某航次數(shù)據(jù)作為數(shù)據(jù)集。該數(shù)據(jù)集中包括三類不同型號(hào)的艦船目標(biāo)輻射噪聲,分別提取目標(biāo)信號(hào)EMD-HT、EEMD-HT以及VMD-HT三種類別特征作為分類器輸入,分別使用K近鄰分類器、隨機(jī)森林分類器、樸素貝葉斯分類器以及由一對(duì)一法構(gòu)建的支持向量機(jī)多分類器共四種分類器進(jìn)行對(duì)比分析,結(jié)果如表3~5所示。
表3 不同分類器基于EMD-HT特征分類結(jié)果(某一航次數(shù)據(jù))Table 3 Classification results of different classifiers based on EMD-HT features (data from a certain voyage)
表4 不同分類器基于EEMD-HT特征分類結(jié)果(某一航次數(shù)據(jù))Table 4 Classification results of different classifiers based on EEMD-HT features (data from a certain voyage)
表5 不同分類器基于VMD-HT特征分類結(jié)果(某一航次數(shù)據(jù))Table 5 Classification results of different classifiers based on VMD-HT features (data from a certain voyage)
為了更好地驗(yàn)證 VMD-HT算法的魯棒性,選取同次海試不同航次的數(shù)據(jù)作為測(cè)試集,分類結(jié)果如表6~8所示。
表6 不同分類器基于EMD-HT特征分類結(jié)果(另一航次數(shù)據(jù))Table 6 Classification results of different classifiers based on EMD-HT features (data from another voyage)
表7 不同分類器基于EEMD-HT特征分類結(jié)果(另一航次數(shù)據(jù))Table 7 Classification results of different classifiers based on EEMD-HT features (data from another voyage)
表8 不同分類器基于VMD-HT特征分類結(jié)果(另一航次數(shù)據(jù))Table 8 Classification results of different classifiers based on VMD-HT features (data from another voyage)
由上述對(duì)比分析結(jié)果可見,VMD-HT算法對(duì)各類目標(biāo)的分類準(zhǔn)確率比EMD-HT以及EEMD-HT算法都有一定的程度的提高。EEMD一定程度上避免了模態(tài)混疊問題,識(shí)別正確率有了一定的提升;而 VMD-HT算法一方面解決了模態(tài)混疊的問題,同時(shí)也保證了 IMF信號(hào)的完整性。綜上所述,VMD-HT算法對(duì)各類目標(biāo)的分類正確率都高于其他幾類分類算法。因此使用VMD算法進(jìn)行水下目標(biāo)的分類,可以有效提升對(duì)水下目標(biāo)的分類效果。此外,由對(duì)比分析還可見,SVM分類器在分類準(zhǔn)確度方面要高于KNN、RF以及NB三類分類器。
本文使用變分模態(tài)分解算法結(jié)合希爾伯特變換來構(gòu)造目標(biāo)信號(hào)特征集,基于分解后的干擾信號(hào)數(shù)據(jù),采用設(shè)定相關(guān)系數(shù)閾值剔除干擾模態(tài)的方法,對(duì)比KNN、隨機(jī)森林、樸素貝葉斯以及SVM四種分類器的對(duì)EMD-HT、EEMD-HT和VMD-HT三種特征集的分類效果表明,其中 VMD-HT算法提取的特征分類正確率最高,此外還針對(duì)訓(xùn)練出的分類模型使用不同的航次數(shù)據(jù)進(jìn)行了驗(yàn)證,得到了相同的結(jié)論,可見本文 VMD-HT特征集用于水下目標(biāo)被動(dòng)分類具有良好的應(yīng)用前景。