国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多尺度子帶能量集特征的膛口波識別方法

2018-11-07 01:27謝萌蕤趙兆李陽許志勇
兵工學報 2018年10期
關鍵詞:子帶槍聲分類器

謝萌蕤, 趙兆, 李陽, 許志勇

(南京理工大學 電子工程與光電技術學院, 江蘇 南京 210094)

0 引言

近年來,槍聲探測裝備因在國際反恐和維和行動中戰(zhàn)果顯著而獲得越來越廣泛的關注,相關技術研究對軍事國防、公共安全、野生動物保護等多個領域具有重要意義[1]。隨著聲信號處理和人工智能技術的快速發(fā)展,槍聲識別技術在槍聲探測領域變得越來越重要,能否從實際復雜背景噪聲中快速、準確地識別出隨機發(fā)生且又短暫、微弱的槍聲信號,是實現(xiàn)高精度射擊點方向估計[2]以及更進一步估計射擊點距離[3]的必要前提。

有關槍聲識別的研究方法主要通過槍聲錄音樣本提取特征,將其輸入特定的識別分類器以獲得識別結果。在槍聲特征研究方面,有離散小波變換系數(shù)[4]、梅爾頻率倒譜系數(shù)(MFCC)[5]、短時能量[6]等各種特征提取技術。由于槍聲信號是快速時變的瞬時沖激脈沖,采用多尺度特征是自然合理的選擇。離散小波變換系數(shù)是最常用的多尺度特征,具有優(yōu)良的沖激聲信號識別性能[4,7-8]。但現(xiàn)有槍聲識別研究中采用的離散小波系數(shù)特征常常維數(shù)很高,實時實現(xiàn)的難度較大。

此外,受試驗條件限制,早期槍聲識別研究采用的槍聲樣本相對簡單,例如影視節(jié)目中截取的槍聲片段[9]、較理想的純凈槍聲數(shù)據(jù)等。近幾年來,真實環(huán)境下的槍聲識別技術倍受重視,但錄制槍聲信號的地形和氣象環(huán)境大多相對簡單,背景噪聲和反射干擾一般較弱,而且實際錄制的槍聲信號樣本數(shù)量也非常有限。為能盡量模擬實際應用場景和增加樣本數(shù)量,許多學者采用在少量較純凈槍聲樣本的基礎上疊加各種背景噪聲或進行特殊濾波處理的方式獲得所需的足量合成數(shù)據(jù)樣本[5,10-11]。盡管這些研究可獲得很高的理論槍聲識別率,但理想純凈或人工合成的槍聲樣本難以全面反映真實環(huán)境中地形起伏、環(huán)境噪聲、地表建筑以及氣候變化等復雜因素[12]的綜合影響,相關成果的實際應用效果難以可靠預測。

針對上述問題,本文面向實際應用,采用大量外場實錄的包含有復雜環(huán)境噪聲干擾和地面墻面反射的真實槍聲數(shù)據(jù),以槍聲中的膛口波信號為識別對象,提出了一種更具針對性的多尺度子帶能量集特征。相比常用的離散小波系數(shù)特征,特征向量維數(shù)和識別處理復雜度顯著降低,但膛口波識別性能相當,因此更符合實時應用需求。

1 槍聲信號特性

槍聲信號屬于沖激型脈沖信號,具有持續(xù)時間短、能量集中和快速時變的特點。超音速彈頭的槍聲信號主要包括馬赫波和膛口波兩種,圖1(a)和圖1(b)所示分別為外場實錄槍聲數(shù)據(jù)中的馬赫波和膛口波時域波形,圖1(c)為圖1(b)中截取的4 ms膛口波脈沖頻譜,包括完整的膛口波周期和一段能量較大的殘余震蕩,圖1(d)為圖1(b)的時頻譜圖。

馬赫波是彈頭以超音速飛行時急速擠壓前方空氣而產生的超寬帶激波脈沖,以脈沖起始端和結尾端均陡峭上升為顯著特征,形狀類似“N”,也稱作N形波[13]。馬赫波以彈頭為頂點呈圓錐面(馬赫錐)向外傳播,脈沖波形的持續(xù)時間與彈頭形狀有關,一般為200~500 μs. 馬赫波用于槍聲探測時存在兩個實際難題:一是容易被空氣吸收,在嘈雜環(huán)境下常常無法被距離彈道數(shù)十米外的聲探測系統(tǒng)捕獲到;二是作用范圍受馬赫錐影響,不能被位于馬赫錐作用范圍之外的聲探測系統(tǒng)檢測到[3]。

膛口波是在膛內高溫、高壓火藥燃氣推進作用下,彈頭離開膛口后迅速展開的沖擊波[14]所產生的聲波信號,在膛口處呈球形向四周擴散,波形對應一個非平穩(wěn)時變脈沖,持續(xù)時間約1~5 ms,主要能量集中在低頻部分[3]。膛口波傳播距離遠,作用范圍廣,是一種其他自然現(xiàn)象和人工手段難以復現(xiàn)和模仿的獨特聲波,并且只要槍支射擊都會產生,因此常被用作識別槍聲的主要聲學信號(本文暫不考慮使用消音器的情況)。

2 膛口波識別方法

為提高實際復雜環(huán)境下對膛口波的實時識別能力,本文針對膛口波信號的時頻分布,提出了一種多尺度子帶能量集特征,相應的膛口波識別流程圖如圖2所示。圖2中kNN和 SVM分別為k近鄰和支持向量機兩種分類器。

2.1 數(shù)據(jù)樣本選取

數(shù)據(jù)樣本全部取自南京理工大學湯山軍工試驗中心某中小口徑步槍多次外場實彈射擊試驗的現(xiàn)場錄音,每段錄音只包含一次射擊的槍聲信號,同時還可能包含槍聲的多次反射信號和現(xiàn)場的說話聲、風聲、警報聲等非槍聲信號。外場錄音的采樣頻率為32 kHz,采樣精度為16 bit.

對于每次射擊試驗,彈頭在飛行80 m后其彈道將會緊貼一側山體護墻,二者幾乎平行,相距不足10 m. 槍聲數(shù)據(jù)采集系統(tǒng)在彈道另一側,隨機安放在多個采集點,距離彈道5~50 m,距離射擊點50~200 m,多數(shù)采集點靠近平房外墻或山體護墻,因此這些外場錄制的槍聲信號受地形、地物等環(huán)境因素影響較大。圖3(a)是其中一段典型的槍聲信號錄音數(shù)據(jù),圖中顯示,首先采集到的是馬赫波,緊隨其后的是因地面和墻體作用而產生的一串馬赫波反射,之后膛口波也被采集到。但膛口波因傳播距離遠而衰減很大,幾乎被淹沒在反射波之中,其波形也因各種實際因素影響而會發(fā)生畸變,參見圖1(b)。

本文從2013年4月至5月間的多次射擊試驗中一共選取372段錄音,從中截取372個膛口波樣本和499個非膛口波樣本,總共871個數(shù)據(jù)樣本用于識別研究,每個樣本長度約為21 ms. 其中,非膛口波樣本包括馬赫波31個,現(xiàn)場說話聲、風聲、警報聲等非槍聲信號樣本468個。以射擊試驗次數(shù)較多的2013年4月19日和5月3日為例,表1列出了兩天采集的膛口波樣本信息,表中脈寬為完整的膛口波周期,不含其后的殘余震蕩;幅值單位采用滿量程分貝值(dBFS)[15],即以滿量程為0 dB的相對幅值。由于天氣狀況、多徑干擾、樣本數(shù)量等試驗條件不同,兩天的膛口波峰值統(tǒng)計量差異較大,相關原因需在后續(xù)研究中進行更細致地分析,但暫未發(fā)現(xiàn)這種差異對膛口波的獨特時頻特征尤其是低頻特征有明顯影響。

表1 部分膛口波樣本信息

2.2 多尺度子帶濾波與起點搜索

圖3(b)是對應圖3(a)所示外場實錄槍聲信號的時頻譜圖,從圖中可以清晰地看出,膛口波的頻譜分布特征與馬赫波、馬赫波反射以及其他聲音的頻譜分布特征明顯不同,雖在起始階段存在較豐富的高頻成分,但其能量主要集中在低頻部分。因此,通過一組適當選取的子帶濾波器可以增強膛口波的低頻分量,同時抑制馬赫波和其他非槍聲信號。

觀察圖1(c)和圖1(d)所示頻譜分布可知,膛口波低頻能量大致集中在300 Hz、900 Hz和1.5 kHz附近,在2.0~3.5 kHz之間也有相對較高的能量分布。因此,本文選用300 Hz、900 Hz、1.5 kHz和3.0 kHz作為4個低頻子帶濾波器的中心頻率。若記第i個數(shù)據(jù)樣本為Xi,0,則子帶濾波后得到的4個子帶分量分別記為Xi,j,j=1~4. 為敘述方便,后文中原始樣本Xi,0也被稱為第0個子帶分量。

由于膛口波是一種發(fā)生突然而后又迅速趨緩的沖激信號,持續(xù)時間短且起始上升沿極為陡峭,為保證膛口波識別性能,有必要確定膛口波在數(shù)據(jù)樣本及其各子帶分量中的起點位置。起點位置搜索包括膛口波檢測和波峰搜索兩步,前者通過能量門限檢測判斷候選膛口波信號及其起始點的搜索范圍,后者在此范圍內搜索第1個強波峰以確定候選膛口波起始點的具體位置。

膛口波檢測在波形相對平滑的第1子帶分量Xi,1中進行,借用常規(guī)語音端點檢測方法(VAD)[16]對膛口波出現(xiàn)的位置范圍進行判斷。將Xi,1做分幀處理,幀長0.5 ms,幀間交迭50%,然后計算每幀數(shù)據(jù)的短時能量。記第l幀數(shù)據(jù)的短時能量為εl,則自適應門限設定為

Th=min (εl)+ch(max (εl)-min (εl)),

(1)

式中:min (·)和max (·)分別表示最小值和最大值;ch為常數(shù),本文通過實驗設定為0.016,以確保在所有膛口波樣本內不會出現(xiàn)過多的檢測虛警。若檢測到連續(xù)3幀的短時能量超過門限Th,則將其中第1幀的起始位置減去第1個子帶的濾波延時后,得到候選膛口波起始點的搜索位置錨點ta.

將ta之前0.25 ms到之后0.50 ms的時間范圍作為起始點搜索范圍,對數(shù)據(jù)樣本Xi,0進行幅值波峰搜索,找到第1個強波峰位置記為候選膛口波起始點,令該起始點的樣點序號為m0. 將m0分別加上各子帶的濾波延時,得到4個子帶分量的候選膛口波起始點樣點序號mj.

2.3 多尺度子帶能量集特征提取

參見圖3,膛口波信號是非平穩(wěn)快速時變的信號,起始階段急速上升,波形陡峭,高頻成分較為豐富,隨后波形變化迅速趨緩,高頻成分急劇減少,到后半周期只剩低頻成分。針對這一特征,采用變尺度子帶能量集來構造膛口波的特征向量。

具體而言,對于第i個樣本的第j個子帶分量Xi,j,以嵌套方式對候選膛口波信號截取5個長度不等的變尺度數(shù)據(jù)片段,每個數(shù)據(jù)片段的起點都是該子帶分量中候選膛口波的起始點mj, 5個子帶分量共截取25個數(shù)據(jù)片段。根據(jù)所截取的膛口波樣本,在50~200 m距離范圍內,膛口波上升峰時間通常在0.1~0.2 ms之間,并且在完整的膛口波周期后面還有一段明顯的殘余震蕩,較強能量持續(xù)時間通??蛇_4 ms左右,如圖1(b)和圖1(d)所示。因此,本文取最短和最長數(shù)據(jù)片段長度分別為0.125 ms和3.875 ms,然后在二者之間按2n-1(n為數(shù)據(jù)片段序號)的規(guī)律另選3個數(shù)據(jù)片段長度,即每個子帶分量中5個嵌套數(shù)據(jù)片段的長度分別設為0.125 ms、0.375 ms、0.875 ms、1.875 ms、3.875 ms.

對上述25個數(shù)據(jù)片段分別計算短時能量作為特征。令第j個子帶第n個數(shù)據(jù)片段的短時能量為ej,n,j=0~4,n=1~5,則第n段數(shù)據(jù)的短時能量特征向量為

en=[e0,n,e1,n,e2,n,e3,n,e4,n]T.

(2)

采用短時能量作為特征可以有效分辨出沖激信號,但卻無法有效區(qū)分同屬于沖激信號的馬赫波和膛口波。考慮到槍聲信號中馬赫波和膛口波的時頻譜分布差異明顯,因此可進一步提取各子帶分量與原始數(shù)據(jù)樣本之間的短時能量比特征。第n個數(shù)據(jù)片段的短時能量特征比向量為

rn=[e1,n,e2,n,e3,n,e4,n]T/e0,n.

(3)

由此可得第i個數(shù)據(jù)樣本中候選膛口波的多尺度子帶能量集特征向量:

(4)

特征向量維數(shù)為9×5=45.

2.4 識別算法

考慮到膛口波和非膛口波識別屬于二分類問題,且樣本數(shù)量有限,本文選擇kNN和SVM兩種常用分類器驗證多尺度子帶能量集特征的識別性能。

kNN是常用的有監(jiān)督學習方法,主要通過測量不同特征值之間的距離進行分類[4]。對給定測試樣本,找到訓練集中與其距離最近的前k個樣本,若這k個樣本中出現(xiàn)頻率最高的類別為膛口波,則該樣本屬于膛口波,反之亦然。其中,k值的選擇對算法結果影響較大,本文采用交叉驗證方法選擇k=3.

SVM廣泛應用于文本分類、人臉識別和音頻事件分類等領域,是一種穩(wěn)健的有監(jiān)督學習方法,在有限樣本、非線性和高維度的情況下,可以取得良好的分類效果[8]。SVM的分類基本思想是基于訓練集在樣本空間中找到一個最優(yōu)超平面,使得訓練集中的樣本點與該超平面的距離盡可能遠,進而將不同類型的樣本分開。本文利用C++中的libsvm庫建模SVM,選擇C-支持向量分類(C-SVC)進行二分類,使用徑向基函數(shù)(RBF)[8]作為核函數(shù),其他參數(shù)值均采用默認設置。

3 數(shù)值實驗及結果分析

根據(jù)第2節(jié)所述方法分別從871個數(shù)據(jù)樣本中提取多尺度子帶能量集特征,每個樣本由45維特征向量構成。在采用kNN和SVM進行分類識別實驗時,每次實驗中隨機選擇60%樣本構成訓練集,其余40%樣本構成測試集。

由于離散小波系數(shù)特征[4, 7-8]是一種廣泛應用于爆炸聲識別且性能優(yōu)良的傳統(tǒng)多尺度特征,本文采用離散小波方法進行對比實驗。離散小波方法選擇Daubechies小波基(db4)對數(shù)據(jù)樣本進行離散小波變換,然后采用Mallat分解算法進行5層分解得到近似系數(shù)作為特征。每個數(shù)據(jù)樣本對應的特征向量維數(shù)為666,遠高于本文所提特征的45維。

為定量評價實驗結果,采用了4種常用的識別性能評價指標[8,11]:查準率、查全率、基于查準率和查全率的加權調和平均(F1度量)和受試者工作特征曲線的線下面積(AUC)。

根據(jù)上述實驗設計進行了100次隨機對比實驗,兩種方法經過100次隨機實驗后的平均查準率、查全率和F1度量的對比結果如表2所示。

表2 100次隨機實驗的膛口波識別性能平均指標

從表2可以看出,在SVM的識別結果中:離散小波方法的查全率為97.6%,優(yōu)于本文方法的94.0%;但從查準率的角度分析,本文方法的查準率為98.0%,而離散小波方法的查準率僅為85.0%,二者相差13%. 考慮到查準率與虛警相關,查準率偏低意味著膛口波識別的虛警上升、可信度下降。而根據(jù)查準率和查全率的綜合性能評估指標F1度量和AUC指標,本文方法的膛口波識別性能更有優(yōu)勢,其F1度量和AUC指標分別為0.959和0.992,而離散小波方法分別為0.909和0.968.

然而,kNN的識別結果卻與SVM有所不同,離散小波方法的查準率雖然達到96.7%,但是查全率卻僅為78.9%. 考慮到查全率與漏警相關,查全率偏低意味著膛口波識別的漏警增加、實用性不足。比較而言,本文方法的查準率和查全率分別為95.7%和96.9%,兩個指標都比較高且更為均衡。不僅如此,本文方法的F1度量和AUC指標分別為0.963和0.938,均明顯高于離散小波方法。

圖4給出的是兩種膛口波識別方法經過100次隨機實驗所對應的F1度量箱線圖。從圖4中可以清晰地看出,本文方法在兩種分類器下的最大值和最小值結果相近,其范圍均在0.90~0.96之間,表明多尺度子帶能量集特征對分類器敏感度較低,識別性能穩(wěn)定性較好。而離散小波方法在兩種分類器下的箱線差異非常明顯,雖然在SVM分類器下的識別性能略低于本文方法,但在kNN下的識別性能則明顯不佳,多次實驗結果的分布散度較大且結果偏低。

為進一步判別兩種膛口波識別方法是否具有明顯差異,利用統(tǒng)計軟件SPSS進行了Wilcoxon檢驗[17]。其中,用于判斷是否具有顯著性差異的置信度指標α設置為0.05,當相關評估值p<α時,認定比較對象之間存在顯著差異。一方面,本文方法對SVM和kNN的評估值p=0.6,遠大于0.05,表明在兩種分類器下的識別結果無顯著性差異,而離散小波方法則與之相反,對SVM和kNN的評估值p=0.005,小于0.05,表明在兩種分類器下的識別結果存在明顯差異,即膛口波的識別性能與分類器選擇相關;另一方面,兩種膛口波識別方法在SVM分類器下和在kNN分類器下的一致性評估值均為p=0.005,表明兩種方法在采用同一分類器條件下的識別結果差異明顯。

表3 子帶濾波器中心頻率參數(shù)調整對膛口波識別性能的影響

在現(xiàn)有子帶濾波器中心頻率附近另外選取兩組中心頻率參數(shù),分別為{250 Hz,750 Hz,1.25 kHz,2.50 kHz}和{350 Hz,1.05 kHz,1.75 kHz,3.50 kHz},它們的膛口波識別性能指標對100次隨機實驗的平均值由表3列出。對比表2可以看出,3組子帶濾波器對應的指標數(shù)值差異較小,表明在膛口波低頻能量聚集區(qū)附近,子帶濾波器組的中心頻率參數(shù)調整對膛口波識別效果影響不大。

表4給出的是兩種膛口波識別方法分別在特征提取階段和膛口波識別階段所用的處理時間,表中數(shù)據(jù)是對100次隨機獨立實驗結果的平均值,所有實驗均在一臺配備1.70 GHz主頻英特爾(R)酷睿i5-3317U處理器、4 GB內存和Windows 7旗艦版64位操作系統(tǒng)的計算機上進行。表4中顯示,本文方法在特征提取和識別階段的計算耗時均顯著低于離散小波方法,表明本文方法處理復雜度低,更加符合實時槍聲探測應用需求。

4 結論

本文針對槍聲膛口波持續(xù)時間短、起始上升沿陡峭、快速時變和低頻能量集中的特點,通過確定候選膛口波起始位置,并從起始位置開始以嵌套方式對候選膛口波及其多個低頻子帶分量進行多尺度數(shù)據(jù)片段截取,獲取了不同時間尺度的膛口波時頻特征。從這些數(shù)據(jù)片段中提取短時能量和能量比信息構成多尺度子帶能量集特征,并基于kNN和SVM獲得膛口波識別結果。得出主要結論如下:

表4 100次隨機實驗的膛口波識別處理時間對比

1)針對372段外場實彈射擊錄音中截取的871個有聲數(shù)據(jù)樣本,采用kNN和SVM兩種分類器進行膛口波和非膛口波識別,本文方法的查全率、查準率均高于93%,F(xiàn)1度量高于0.95.

2)本文方法特征相比于常用的離散小波系數(shù)特征,在膛口波識別性能相當?shù)那疤嵯?,特征向量維數(shù)和處理復雜度顯著下降,并且在不同分類器下的識別結果無顯著性差異。

3)本文提出的多尺度子帶能量集特征在實際復雜環(huán)境下能獲得良好的槍聲膛口波快速識別性能,比現(xiàn)有方案更符合實時槍聲探測應用需求。

猜你喜歡
子帶槍聲分類器
水禽耳邊有槍聲
超高分辨率星載SAR系統(tǒng)多子帶信號處理技術研究
學貫中西(6):闡述ML分類器的工作流程
基于樸素Bayes組合的簡易集成分類器①
基于動態(tài)分類器集成系統(tǒng)的卷煙感官質量預測方法
子帶編碼在圖像壓縮編碼中的應用
紅六軍團的正義槍聲
一種自適應子融合集成多分類器方法
高分辨率機載SAR多子帶合成誤差補償方法
改進的DWT?MFCC特征提取算法