李成娟,易 強(qiáng),李寶清,王國輝
(1.中國科學(xué)院 上海微系統(tǒng)與信息技術(shù)研究所 微系統(tǒng)技術(shù)重點(diǎn)實(shí)驗(yàn)室,上海 201800; 2.中國科學(xué)院大學(xué),北京 100049)
無線傳感器網(wǎng)絡(luò)憑借其通信能力強(qiáng)大、記錄信息全面、無需人工值守等優(yōu)點(diǎn),廣泛應(yīng)用于軍事、農(nóng)業(yè)、商業(yè)等各個(gè)領(lǐng)域[1-2]。無線傳感器網(wǎng)絡(luò)通常由圖像、聲音、紅外、震動傳感器等幾種類型的傳感器構(gòu)成[3]。聲音傳感器有不易被察覺、便于布設(shè)、不易受地形影響的優(yōu)點(diǎn),被廣泛使用。
根據(jù)車輛行進(jìn)過程中采集的聲音信號,對野外車輛目標(biāo)進(jìn)行識別,一般分為2個(gè)步驟:1)提取聲音傳感器采集的聲信號特征;2)設(shè)計(jì)分類器得到判別結(jié)果。目前常用的特征有基于小波包變換提取的特征,線性預(yù)測倒譜系數(shù)[4],梅爾倒譜系數(shù)(MFCC, mel-frequency cepstral coefficient)[5],基于經(jīng)驗(yàn)?zāi)B(tài)分解提取的特征[6-7]等。其中,MFCC較常見,被廣泛用于語種識別、說話人識別、聲紋識別等領(lǐng)域,近年來被成功應(yīng)用于車輛目標(biāo)分類識別[8-10]。但由于MFCC對噪聲敏感[11-13],在車輛識別領(lǐng)域的應(yīng)用場景受限。
為提高特征抗噪能力,增強(qiáng)特征穩(wěn)健性,能夠體現(xiàn)野外車輛信號自身特征,提出一種改進(jìn)的MFCC特征。根據(jù)車輛目標(biāo)信號的頻譜特征,自適應(yīng)增加車輛基頻信息在特征中的比重。然后進(jìn)行F比加權(quán),以降低同種車輛類別特征間的區(qū)分度,增大不同車輛類別特征之間的差別,從而提高特征在野外環(huán)境下的魯棒性。使用高斯混合模型(GMM, gaussian mixture model)作為分類器,檢驗(yàn)識別效果。提取傳統(tǒng)MFCC特征,基頻自適應(yīng)MFCC特征,加權(quán)基頻自適應(yīng)MFCC特征作對比試驗(yàn),期望獲得更高的識別準(zhǔn)確率,為野外環(huán)境的車輛識別,提供一種魯棒特征提取方法。
人耳對聲音信號的感知,與頻率呈非線性關(guān)系。隨著聲音信號的頻率降低,人耳接收信號的能力愈發(fā)敏感[14]。為使人耳對信號敏感程度與信號頻率呈現(xiàn)線性關(guān)系,MFCC參數(shù)將信號頻譜作映射處理,映射后的刻度稱作梅爾刻度。映射函數(shù)的表達(dá)式如下
(1)
式中:M(f)為梅爾頻率;f為頻率。
第一步,提取車輛目標(biāo)聲信號的MFCC,首先需要在時(shí)域尺度對其進(jìn)行分幀、加窗、預(yù)加重等預(yù)處理。為減小頻譜泄漏,窗函數(shù)選取旁瓣衰減較大的漢明窗。預(yù)加重,實(shí)際是讓信號通過一個(gè)高通濾波器,目的是濾除車輛聲音信號中的低頻干擾成分,增加高頻成分的比重[15]。
第二步,為了將信號從時(shí)域尺度轉(zhuǎn)換為頻域尺度,作快速傅里葉變換,且計(jì)算每幀信號的能量譜。
第三步,對能量譜進(jìn)行三角濾波。梅爾三角濾波器由公式(2)計(jì)算得出。
(2)
式中:Hi(k)表示濾波器參數(shù);fi表示三角濾波器的中心頻率。濾波后取對數(shù),得到對數(shù)能量。
最后,進(jìn)行離散余弦變換,得到MFCC。為了獲取動態(tài)信息,提取語音信號的MFCC特征時(shí),通常包含動態(tài)差分步驟。與語音信號相比,車輛聲音信號頻帶窄,周期性強(qiáng),沒有必要獲取動態(tài)特性,因此特征提取算法省略動態(tài)差分步驟。
傳統(tǒng)的MFCC在識別純凈聲音信號時(shí),可得到很好識別結(jié)果,但對噪聲的敏感度很高,當(dāng)采集的實(shí)際聲音信號包含噪聲信息時(shí),識別效果易受干擾,難以預(yù)測識別效果是否符合實(shí)際需求。而且,當(dāng)風(fēng)力等級變化時(shí),很容易造成訓(xùn)練樣本集與測試樣本集不匹配。為降低噪聲對識別效果的干擾,減少應(yīng)用場景的限制,對傳統(tǒng)MFCC特征提取算法進(jìn)行改進(jìn)。
由于不同車型的傳動系統(tǒng)、排氣系統(tǒng)、發(fā)動機(jī)及其氣缸數(shù)不同,不同車輛聲信號的頻域特性存在差異。不同車輛聲信號頻譜圖如圖1所示。 從圖中可看出不同車型車輛聲音信號的基頻是不同的,因此車輛聲音信號的基頻可以作為車輛目標(biāo)識別特征。將車輛聲音信號的MFCC參數(shù)與基頻特征結(jié)合,得到基頻自適應(yīng)梅爾倒譜系數(shù)。
圖1 不同車輛聲信號頻譜圖Fig. 1 Different vehicles’ spectrograms
提取傳統(tǒng)的MFCC時(shí),梅爾三角濾波器組中心頻率根據(jù)梅爾刻度獲得,隨著頻率提升,中心頻率的密度逐漸降低。在野外情況風(fēng)噪較大時(shí),信號頻譜中含有較多干擾頻率,傳統(tǒng)梅爾三角濾波器組有可能削弱基頻在頻譜中的比重,加大無關(guān)頻率的干擾。為了更好體現(xiàn)車輛自身信號的頻譜特征,在傳統(tǒng)的濾波器組中,增添一個(gè)三角濾波器。該濾波器的中心頻率為車輛信號的基頻,通過此方法提取出來的特征稱為基頻自適應(yīng)梅爾倒譜系數(shù)。改進(jìn)的MFCC提取過程如圖2所示。
圖2 改進(jìn)MFCC特征提取算法框圖Fig. 2 Flowchart of improved MFCC
自適應(yīng)的梅爾三角濾波器組具體設(shè)計(jì)方法如下。假設(shè)傳統(tǒng)梅爾三角濾波器組包含N個(gè)濾波器,其中心頻率組成向量F=(f1,f2,…,fN)。提取車輛信號的基頻fb,將fb與三角濾波器組的中心頻率按升序排列,組合構(gòu)成新的向量Fb=(f1,f2,…,fb,…,fN+1)。將Fb向量的各維分量作為濾波器的中心頻率,代入式(2),即可得到自適應(yīng)的三角濾波器組。傳統(tǒng)梅爾三角濾波器組與基頻自適應(yīng)的三角濾波器組如圖3所示。
圖3 三角濾波器組Fig. 3 Triangular filter-bank
為了得到基頻自適應(yīng)梅爾濾波器組,進(jìn)一步獲得基頻自適應(yīng)梅爾倒譜系數(shù),需要選擇合適的基頻提取方法,準(zhǔn)確提取車輛聲音信號的基頻。
自相關(guān)函數(shù)法提取單基頻時(shí),為了降低共振峰干擾,需要先對信號進(jìn)行帶通濾波。然后對信號進(jìn)行加窗、分幀,計(jì)算短時(shí)自相關(guān)函數(shù)。設(shè)車輛聲音信號第i幀的時(shí)間序列為datai(m),其短時(shí)自相關(guān)函數(shù)Ri(k)由式(3)得到
(3)
由于信號短時(shí)自相關(guān)函數(shù)周期與信號周期相同,因此基因周期可以取短時(shí)自相關(guān)函數(shù)的最大延遲量。對基因周期曲線進(jìn)行平滑處理,使之通過中值和線性組合濾波,得到車輛的單基頻信息。
圖4 譜減法流程圖Fig. 4 Flowchart of spectral subtraction
為了進(jìn)一步滿足野外環(huán)境的實(shí)際應(yīng)用需求,將單基頻提取算法改進(jìn)為多基頻提取算法。運(yùn)動目標(biāo)在行駛過程中生成的聲信號,可由其發(fā)聲主要部件產(chǎn)生的聲信號表示,其余部件產(chǎn)生的聲信號比較微弱,可忽略不計(jì)。履帶車產(chǎn)生聲信號的主要部件為履帶和引擎,輕型輪式車和輪式裝甲車產(chǎn)生聲信號的主要部件是排氣系統(tǒng)和引擎,因此車輛運(yùn)動過程中的聲信號可由2個(gè)主要成分表示,每個(gè)主要成分產(chǎn)生一條基頻。下面簡要介紹多基頻提取算法。
首先提取車輛聲信號的2條基頻,可參照單基頻提取方法。然后,將車輛的2個(gè)基頻進(jìn)行融合,得到一個(gè)新的基頻fbnew(t)。設(shè)某條車輛聲信號第t幀的2個(gè)基頻,其中較大的數(shù)值為fb1(t)、較小的數(shù)值為fb2(t),則fbnew(t)可由式(4)得到[18]
(4)
MFCC的每一維分量對表征特征的貢獻(xiàn)率不同,為增加不同車型特征之間差距,使同一車型的特征更為緊湊,在基頻自適應(yīng)梅爾倒譜特征基礎(chǔ)上,進(jìn)行F比加權(quán)。F比參數(shù),是在Fisher準(zhǔn)則基礎(chǔ)上提出的[19],由類間離散度與類內(nèi)離散度之比得到,可定量分析特征向量每一維分量有效性。設(shè)數(shù)據(jù)集包含M種車輛類別的車輛聲音信號,其中第i個(gè)類型包含Ni條樣本信號,則特征參數(shù)第k維特征分量的F比具體計(jì)算公式如下
(5)
特征參數(shù)中某維分量的F比參數(shù)數(shù)值越小,表明該特征分量在同類目標(biāo)之間方差較大,在不同類目標(biāo)之間方差較小,對表征信號特征的貢獻(xiàn)率也越低。以F比為權(quán)重,對特征向量的每一維分量加權(quán),能夠削弱貢獻(xiàn)率較低的特征分量干擾,提高貢獻(xiàn)率較高分量的作用,從而提取更能體現(xiàn)不同車輛類別間差異的特征。
實(shí)驗(yàn)采用MATLAB R2015b平臺仿真,樣本信號采用ICS40720傳聲器設(shè)備進(jìn)行采集,采樣率為8 192 Hz。外場實(shí)驗(yàn)場景如圖5所示,目標(biāo)車輛從起始位置行駛到終止位置,麥克風(fēng)便采集到一條完整的樣本。
圖5 實(shí)驗(yàn)場景圖Fig. 5 Experimental scenario
仿真實(shí)驗(yàn)?zāi)康氖歉鶕?jù)野外無線傳感器網(wǎng)絡(luò)中聲音傳感器采集的信號,檢驗(yàn)不同特征提取方法對車輛識別效果的影響。為了更貼近無線傳感器網(wǎng)絡(luò)的實(shí)際應(yīng)用場景,聲音傳感器布設(shè)位置,距離道路中心不超過50 m,起始位置到終止位置的車輛行駛總長度限制在800 m以內(nèi)。當(dāng)野外風(fēng)噪聲非常大時(shí),無線傳感器網(wǎng)絡(luò)中識別車型主要通過圖像和震動傳感器,聲音傳感器難以采集到有效車輛聲音信號。因此去掉數(shù)據(jù)集中風(fēng)力級在6級以上采集的聲音信號,保留數(shù)據(jù)對應(yīng)的風(fēng)力級主要集中在1~5級。
為驗(yàn)證改進(jìn)的特征提取算法的實(shí)際識別效果,共采集硬土路、砂石路、水泥路及草地4種不同路面的車輛聲音信號作為樣本。車輛類型包含一種小型車,兩種大型車,不同車型的行駛速度范圍不同。小型車運(yùn)動速度為25~60 km/h,代表車型為輕型輪式車,如卡車。大型車運(yùn)動速度為10~20 km/h,代表車型為重型輪式車、履帶車,如坦克。按照實(shí)際需求以及聲音信號的特征,在實(shí)驗(yàn)中將車輛分為履帶車、輪式裝甲車和輕型輪式車3種類型。樣本集中每種車輛類別樣本數(shù)和總幀數(shù)如表1所示, 將樣本數(shù)按照70%和30%的比例隨機(jī)分為訓(xùn)練集和測試集,用于仿真實(shí)驗(yàn)。
表1 野外車輛樣本數(shù)
采集數(shù)據(jù)后進(jìn)行手工裁剪或拼接,由于存在人工誤差,樣本殘留了部分噪聲段。為獲得更準(zhǔn)確實(shí)驗(yàn)數(shù)據(jù),對信號進(jìn)行端點(diǎn)檢測,得到有效運(yùn)動目標(biāo)數(shù)據(jù)后,再進(jìn)行特征提取和分類識別。譜熵是聲音信號的一種特征參數(shù),對噪聲不敏感,具有較好穩(wěn)健性,因此,采用能熵比法對車輛信號進(jìn)行端點(diǎn)檢測。
檢測到有效數(shù)據(jù)段后,首先提取維度為23的MFCC特征,然后提取維度為24的基頻自適應(yīng)梅爾倒譜特征,最后對其進(jìn)行F比加權(quán)。
表2 野外車輛識別結(jié)果
F比加權(quán)的基頻自適應(yīng)梅爾倒譜參數(shù)與傳統(tǒng)的MFCC相比,識別準(zhǔn)確率提高7.10%,漏警率降低7.10%,相對值降低56.62%,虛警率降低3.93%,相對值降低61.70%,有更高的魯棒性,更適用于野外環(huán)境中車輛識別。
雖然F比加權(quán)的梅爾倒譜特征具有較好魯棒性,但在進(jìn)行特征提取之前,對野外采集的信號進(jìn)行增強(qiáng)并降噪也非常重要。如何有效去除運(yùn)動目標(biāo)聲信號中包含的噪聲,將是下一步研究的重點(diǎn)內(nèi)容。