丘愷彬,李建良
(南京理工大學(xué) 理學(xué)院,南京 210094)
無(wú)人機(jī)技術(shù)快速發(fā)展,在環(huán)境監(jiān)測(cè)、通訊中繼、大氣取樣及軍事等領(lǐng)域得到廣泛應(yīng)用,但多地民用機(jī)場(chǎng)等凈空保護(hù)區(qū)近期隨之不斷出現(xiàn)的“黑飛”事件給低空領(lǐng)域的管理、軍民飛行安全等帶來(lái)了極大麻煩。除出臺(tái)各種無(wú)人機(jī)生產(chǎn)銷售管控方法外,快速、有效偵測(cè)出無(wú)人機(jī)的黑飛過(guò)程具明確實(shí)用意義。目前無(wú)人機(jī)偵測(cè)常用的工具主要有雷達(dá)、調(diào)頻無(wú)線電以及視頻攝像等,國(guó)內(nèi)外已經(jīng)研發(fā)了一些專用裝備,但由于無(wú)人機(jī)目標(biāo)小且在低空慢飛行,這些裝備可能受到諸如電子干擾、實(shí)物遮擋、盲區(qū)或能見(jiàn)度等影響而具有局限性。
鑒此本文基于被動(dòng)的音頻采集處理原理,將聲音感知的目標(biāo)識(shí)別技術(shù)作為無(wú)人機(jī)偵測(cè)的補(bǔ)充手段。事實(shí)上已有文獻(xiàn)報(bào)道國(guó)外企業(yè)正在開(kāi)展基于此原理的反無(wú)人機(jī)商業(yè)開(kāi)發(fā)。采用聲音感知技術(shù)進(jìn)行無(wú)人機(jī)偵測(cè),本質(zhì)上是利用無(wú)人機(jī)工作時(shí)不可避免出現(xiàn)的音頻信號(hào),通過(guò)多點(diǎn)布局的音頻傳感器采集、去噪,提取無(wú)人機(jī)自身獨(dú)有的音頻特征實(shí)現(xiàn)識(shí)別分類,進(jìn)而可望基于音頻傳感器布局坐標(biāo)進(jìn)行定位跟蹤。由于無(wú)人機(jī)的機(jī)動(dòng)水平較強(qiáng),其音頻信號(hào)具有時(shí)間短、噪聲強(qiáng)、非線性、不平穩(wěn)、無(wú)先驗(yàn)信息的特點(diǎn),傳統(tǒng)音頻處理的Fourier分析方法不能準(zhǔn)確反映非平穩(wěn)信號(hào)的時(shí)變特征,因此尋找適用于無(wú)人機(jī)的非平穩(wěn)過(guò)程的音頻信號(hào)處理方法將是出發(fā)點(diǎn)。本文采用基于EMD的能量比的特征提取方法,結(jié)合傳統(tǒng)的MFCC特征提取方法,將兩種特征用PCA降維處理后構(gòu)成無(wú)人機(jī)聲信號(hào)的綜合特征向量,最后以VQ作為分類器實(shí)現(xiàn)不同型號(hào)的無(wú)人機(jī)聲信號(hào)分類和識(shí)別。
EMD的實(shí)質(zhì)是依不同時(shí)間尺度特征將多分量信號(hào)分解成一系列單分量信號(hào)[1],即本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF),并提取出該復(fù)雜信號(hào)的趨勢(shì)項(xiàng),從而使得信號(hào)的瞬時(shí)頻率具有物理意義,其分解步驟如下[2-4]:
(1)將信號(hào)x(t)所有局部極大值點(diǎn)和局部極小值點(diǎn)分別用3次樣條曲線連接起來(lái)構(gòu)成x(t)的上下包絡(luò)線,兩條曲線間包含所有的信號(hào)。計(jì)算其平均值曲線m1(t),進(jìn)而得
將h1(t)作為待處理信號(hào),重復(fù)上述求包絡(luò)均值和差值的計(jì)算,得到
直到h1k(t)符合IMF分量的特征,從原信號(hào)中分解得到了第1個(gè)IMF,記為
(2)從原信號(hào)中減去c1(t),得到第1階剩余信號(hào)r1(t)
把r1(t)作為新的信號(hào)重復(fù)步驟(1),將第2、第3直到第n-1個(gè)IMF分量若第N階IMF分量或其余量小于預(yù)先設(shè)定的值或變成1個(gè)單調(diào)函數(shù)時(shí),篩選結(jié)束。這樣原始音頻數(shù)據(jù)可表示為有限個(gè)IMF和1個(gè)余項(xiàng)的和
IMF反映了原信號(hào)中不同的頻率成分,且n個(gè)IMF的頻率從大到小排列,余項(xiàng)變?yōu)楹艿皖l率的脈動(dòng)即趨勢(shì)項(xiàng)。以大疆兩種型號(hào)無(wú)人機(jī)精靈Phantom 3和悟Inspire工作時(shí)音頻信號(hào)為例,進(jìn)行EMD分解如圖1所示,文中數(shù)值實(shí)驗(yàn)均是在Windows 10環(huán)境下用MATLAB 2011實(shí)現(xiàn)的。
從圖1(a)和圖1(b)中從上到下分依次為兩種不同型號(hào)無(wú)人機(jī)的聲信號(hào)、n階IMF分量和余項(xiàng)??梢钥闯鼍`Phantom 3聲信號(hào)經(jīng)由EMD分解后得到12個(gè)IMF分量,悟Inspire聲信號(hào)經(jīng)由EMD分解后得到11個(gè)IMF分量。EMD分解可以突出信號(hào)的某些局部特征,且余項(xiàng)反映了原信號(hào)的趨勢(shì)特征,有利于研究信號(hào)的變化趨勢(shì)。
圖1 不同型號(hào)無(wú)人機(jī)聲信號(hào)及EMD分解的時(shí)域波形
信號(hào)經(jīng)EMD分解后得到有限個(gè)IMF分量,每個(gè)分量均代表機(jī)動(dòng)目標(biāo)內(nèi)部某一部件的頻率,因此各個(gè)分量的頻域能量可能存在某種關(guān)系。據(jù)此提出基于EMD的IMF能量比的特征提取算法,過(guò)程如下[5-6]。
對(duì)任一信號(hào),定義第i階IMF的能量為
以各個(gè)IMF分量的能量(Ei)相對(duì)于原信號(hào)能量(E)的能量比作為特征向量,即
精靈Phantom 3和悟Inspire兩種無(wú)人機(jī)聲信號(hào)提取IMF能量比特征如圖2所示。
從圖2中可以看出,兩種類型的無(wú)人機(jī)信號(hào)分解得到的IMF分量的個(gè)數(shù)不同,在同一頻段下,不同類的信號(hào)能量也有比較明顯的區(qū)別,說(shuō)明IMF可用于不同類目標(biāo)的分類判別。
以基于EMD的IMF能量比作為特征對(duì)無(wú)人機(jī)類型進(jìn)行識(shí)別,實(shí)驗(yàn)對(duì)象選取市場(chǎng)上常見(jiàn)的3種不同型號(hào)的無(wú)人機(jī)包括大疆精靈Phantom3、大疆精靈Phantom4以及大疆悟Inspire。由于Phantom3與Phantom4在形狀、大小上較為相似容易混淆,可以更好地檢驗(yàn)方法的有效性。
各取3型號(hào)無(wú)人機(jī)的35個(gè)聲信號(hào)作為訓(xùn)練樣本,采樣頻率為44.1 kHz,并將信噪比為5、10、20的3種不同程度的高斯白噪聲加入原始聲信號(hào)中得到帶噪音頻,。提取EMD特征時(shí)以最大特征向量維數(shù)為基準(zhǔn),在其他向量尾部加0,使得3種類型無(wú)人機(jī)的特征向量維數(shù)相同。以3種類型的無(wú)人機(jī)包括所有訓(xùn)練樣本在內(nèi)的各60個(gè)聲信號(hào)作為測(cè)試樣本,使用VQ作為分類器對(duì)EMD特征向量進(jìn)行分類與識(shí)別實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表1所示。
表1 3種型號(hào)無(wú)人機(jī)的EMD特征識(shí)別率/(%)
從表1可以看出,對(duì)于不同的信噪比,精靈Phantom 4的正確識(shí)別率不如其它兩種無(wú)人機(jī),由于精靈Phantom4與精靈Phantom3外形相似,導(dǎo)致精靈Phantom4的識(shí)別率較低。在沒(méi)有噪聲干擾的情況下,3種無(wú)人機(jī)的識(shí)別結(jié)果較好,但是在噪聲環(huán)境下,整體的識(shí)別率較低,因?yàn)楫a(chǎn)品要最終應(yīng)用到實(shí)際中,所以考慮一種廣泛用于語(yǔ)音識(shí)別的特征提取算法—MFCC。
MFCC是一種傳統(tǒng)且非常重要的特征提取算法,它模擬了人耳的聽(tīng)覺(jué)感知特性來(lái)分析音頻的頻譜。根據(jù)實(shí)驗(yàn)結(jié)果,人的主觀感知頻域的劃定并不是線性的,有下面的公式
其中:Fmel是以美爾(Mel)為單位的感知頻率;f是以Hz為單位的實(shí)際頻率。
MFCC特征提取的實(shí)質(zhì)是將時(shí)域內(nèi)的頻譜通過(guò)非線性的頻譜進(jìn)行轉(zhuǎn)化,通過(guò)離散余弦變換得到MFCC倒譜。其計(jì)算流程如圖3所示。
圖2 不同型號(hào)無(wú)人機(jī)的IMF能量比特征
圖3 MFCC計(jì)算流程圖
將Phantom 3分別和Phantom 4、Inspire之間的MFCC參數(shù)進(jìn)行比較,并選擇其中幾幀,如圖4所示。橫坐標(biāo)是Phantom 3的MFCC參數(shù),縱坐標(biāo)是Phantom 4或Inspire的MFCC參數(shù),如果某1階的特征相似,則系數(shù)分布應(yīng)在虛線附近。
對(duì)3種無(wú)人機(jī)的聲信號(hào)提取16階MFCC參數(shù),同樣在原信號(hào)中加入信噪比為5、10、20 3種不同程度的高斯白噪聲,識(shí)別結(jié)果如表2所示。
表2 3種型號(hào)無(wú)人機(jī)的MFCC特征識(shí)別率/(%)
對(duì)比表1和表2發(fā)現(xiàn),對(duì)于Phantom 4,MFCC的識(shí)別效果要好于EMD,對(duì)于Phantom 3的識(shí)別,MFCC的效果又稍差于EMD,而對(duì)于Inspire,兩種方法的識(shí)別效果相近。所以考慮將以上兩種特征融合為一個(gè)新的特征。
由上述實(shí)驗(yàn)可知兩個(gè)特征表現(xiàn)互有好壞,所以考慮將兩個(gè)特征融合得到一個(gè)新的特征。但如果只是簡(jiǎn)單地將兩個(gè)特征結(jié)合,則會(huì)得到一個(gè)高維特征,也意味著計(jì)算復(fù)雜度的增加。本文利用主成分分析的最優(yōu)降維性質(zhì),在特征降維的同時(shí),還能保證系統(tǒng)的識(shí)別性能。主成分分析(Primary Component Analysis,PCA)是一種在均方誤差最小意義上最優(yōu)的線性降維方法,通過(guò)PCA變換,特征向量中的主要成分能夠被保留下來(lái)[7]。
設(shè)X為p維向量,且X的協(xié)方差存在,令λi為X的特征值(這里的i代表從大到小的第i個(gè)位置),φi為λi對(duì)應(yīng)的特征向量,X向量的第i個(gè)主成分因子則定義成
這里所有γi構(gòu)成了特征空間一個(gè)正交基,它們之間不存在冗余。則γi的方差貢獻(xiàn)率為
將訓(xùn)練集、測(cè)試集合分類器設(shè)置成與上一組實(shí)驗(yàn)相同,然后應(yīng)用PCA對(duì)兩種特征進(jìn)行降維處理,得到16維的新的特征向量,其中包括7階EMD分量和9階MFCC分量,其他實(shí)驗(yàn)變量的設(shè)置與前兩個(gè)實(shí)驗(yàn)相同,分類結(jié)果如表3所示。
對(duì)比表1、表2和表3的分類結(jié)果可以看出,融合后的特征比使用單一特征具有更高的識(shí)別率,所以對(duì)于這種復(fù)雜的機(jī)動(dòng)目標(biāo)來(lái)說(shuō),選擇多種特征能更全面地表現(xiàn)不同類型無(wú)人機(jī)聲信號(hào)的特征。
圖4 不同型號(hào)無(wú)人機(jī)的MFCC參數(shù)比較
表3 3種型號(hào)無(wú)人機(jī)的EMD+MFCC特征識(shí)別率/(%)
本文從無(wú)人機(jī)噪聲的產(chǎn)生機(jī)理出發(fā),使用PCA綜合了兩種特征提取技術(shù)對(duì)不同類型的無(wú)人機(jī)聲信號(hào)進(jìn)行特征提?。篗FCC以及基于EMD和能量比的特征提取算法。最后使用VQ作為分類器對(duì)兩種單一的特征和結(jié)合后的特征進(jìn)行分類與識(shí)別實(shí)驗(yàn),可以看出,在單一特征的表現(xiàn)上,MFCC的識(shí)別率要略高于EMD,而將兩種特征融合后比起單一的特征分類效果更顯著,識(shí)別率更高。實(shí)驗(yàn)證明了利用聲音感知技術(shù)來(lái)識(shí)別與監(jiān)管無(wú)人機(jī)的可行性。
參考文獻(xiàn):
[1]NORDEN E HUANG,ZHENG SHEN,STEVEN R LONG.The empirical mode decomposition and the hilbert spectrum for nonlinear and non-stationayr time series analysis[C].Proceedings of the Royal Society London,1998(454):903-995.
[2]呂艷新.基于EMD和能量比的戰(zhàn)場(chǎng)聲目標(biāo)分類與識(shí)別[J]. 振動(dòng)與沖擊,2008,27(11):51-55.
[3]BOUDRAAAO,CEXUS J C,SAIDI Z.EMD-based signal filtering[J].IEEE Transactions on Instrumentation and Measurement,2007,56(6):2196-2202.
[4]趙知?jiǎng)?,黃艷波.基于經(jīng)驗(yàn)?zāi)B(tài)分解的單通道盲源分離算法[J].計(jì)算機(jī)應(yīng)用研究,2017,34(10):3010-3012.
[5]趙天青,梁旭斌,許學(xué)忠,等.EMD在目標(biāo)聲信號(hào)特征提取中的應(yīng)用研究[J].南京大學(xué)學(xué)報(bào)(自然科學(xué)版),2015(S1):102-106.
[6]徐可君,秦海勤,江龍平.基于EMD和HHT的航空發(fā)動(dòng)機(jī)轉(zhuǎn)子-機(jī)匣振動(dòng)信號(hào)分析[J].振動(dòng)與沖擊,2011,30(7):237-240.
[7]ASTON JOHN A D,CHIOU JENG-MIN,EVANS JONATHANP,et al.Linguistic pitch analysis using functional principal component mixed effect models[J].Journal of the Royal Statistical Society Series CApplied Statistics,2010,59(2):297-317.