朱知萌,郭 育,王 冠,章佳榮
?
水下蛙人呼吸聲Mel倒譜特征的實驗研究
朱知萌,郭 育,王 冠,章佳榮
(中國船舶工業(yè)系統(tǒng)工程研究院,北京100094)
為提高水下蛙人呼吸聲識別的準確度,提出一種基于Mel頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient,MFCC)的蛙人呼吸聲信號特征匹配方法。計算呼吸聲信號之間、信號與環(huán)境噪聲及艦船輻射噪聲的MFCC夾角和MFCC距離并進行匹配比較,以進行分類識別。某湖試驗數(shù)據(jù)的處理結果表明:蛙人呼吸聲與艦船輻射噪聲及環(huán)境噪聲的MFCC參數(shù)有著明顯的差異,能夠對蛙人呼吸聲信號與干擾噪聲進行區(qū)分,證明了基于MFCC特征算法的有效性,對發(fā)展港口、碼頭等近海海域附近的水下蛙人探測聲吶和預警系統(tǒng)具有實際意義。
被動聲吶;水下小目標;Mel頻率倒譜系數(shù);特征匹配
近年來,蛙人對各國海軍及海事安全構成的威脅逐年加劇,各國紛紛加大了針對蛙人的探測和識別研究。通常,在重要的港口、碼頭等近海海域以某種陣列布放傳感器,形成一道或多道警戒線,對入侵的目標進行探測和識別。
國內外關于主動法探測蛙人已開展了較多研究,Sarangapani[1]等人基于傅里葉映射法(Fourier Modal Method,F(xiàn)MM)構建了蛙人目標強度模型;Hollet[2]等人計算得到特定頻率的開式和閉式呼吸器的目標強度;Zampolli[3]等人利用軟殼柱狀空氣腔和硬殼柱狀空氣腔來模擬蛙人的肺部組織和呼吸器的鋼瓶,并通過實驗得到了不同頻率和散射方向的蛙人目標強度;姜衛(wèi)[4]等人用動物的肺部組織來模擬蛙人肺部組織,并用比較法測量其目標強度,其平均目標強度在20~40 kHz頻率范圍內約為-25.3 dB;張波[5]等人對影響蛙人目標強度的因素進行了探究,通過理論仿真和實驗,發(fā)現(xiàn)蛙人呼吸時產(chǎn)生的大量氣泡對回波信號做出了主要貢獻,是影響蛙人目標強度的最大因素,其次是蛙人攜帶的開式或閉式呼吸器,而蛙人的身體組織對目標強度的影響則微乎其微。
國內外基于被動方式探測蛙人的研究工作較少。美國斯蒂文森理工學院和荷蘭防御應用科學研究院對蛙人輻射噪聲進行了相關研究[6-12],并研制出了相應的SPADES和Delphinus水下被動探測系統(tǒng),后者的最遠探測距離可達350 m。國內張偉豪[13]等人對蛙人呼吸聲信號的時頻域特征進行了研究,并基于帶通濾波法和匹配濾波法,對蛙人呼吸聲信號提取了四種譜特征量,實驗結果顯示,匹配濾波法在蛙人運動到距離聲吶40 m過程中的檢測概率可達90%。
蛙人不同于水下安靜目標,其具有較為規(guī)律的聲輻射特性。蛙人吸氣時,壓縮空氣在高壓調節(jié)器及其管道中擴散,閥套產(chǎn)生的結構振動以及呼氣氣泡在上升過程中的破裂,都會向周圍環(huán)境產(chǎn)生聲輻射,其輻射的過程即為蛙人呼吸聲信號向外傳播的過程,利用被動聲吶接收呼吸聲信號,可對蛙人進行被動探測。蛙人的活動范圍為近海海域,通常有較多艦船停靠或活動,被動聲吶接收到的信號常常混有艦船輻射噪聲和環(huán)境噪聲,這些噪聲則成為主要的背景干擾。對蛙人呼吸聲信號和噪聲信號進行特征提取,并對提取結果做進一步處理進而區(qū)分它們的類型,是蛙人被動探測的主要內容。
人耳的聽覺系統(tǒng)具有較高的靈敏度和動態(tài)范圍,能夠在嘈雜環(huán)境中辨別出各種不同的聲音信號。將人耳的這種優(yōu)勢應用到蛙人的探測中,能夠較好地區(qū)分蛙人呼吸聲信號與干擾噪聲。在語音信號處理中,Mel頻率倒譜系數(shù)結合了非線性信號中的倒譜分析技術與人耳的高分辨率特性而被廣泛應用。本文通過提取信號的MFCC特征參量,利用呼吸聲信號與噪聲信號之間的MFCC夾角和MFCC距離進行匹配,找出蛙人呼吸聲信號與噪聲信號的差異,為水下蛙人的被動探測提供一種有效的方法。
信號的倒譜是在對非線性信號進行同態(tài)處理過程中產(chǎn)生的物理量,旨在將非線性信號轉換為線性信號進行處理。
設()為水聲信道響應,則被動聲吶接收到的信號()是由信號()和信道響應()卷積而成的卷積信號:
信號()將通過同態(tài)處理系統(tǒng)[]變換后可得到一個經(jīng)過處理的卷積信號():
圖1 同態(tài)系統(tǒng)分解
Fig.1 Decomposition of the homomorphic system
對式(6)取對數(shù):
()即為信號()的倒譜(Cepstrum),稱之為倒頻率(Quefrency)。
Mel頻率倒譜系數(shù)(MFCC)是一種基于人耳聽覺感知機理所提取的特征參量。耳蝸是人耳辨別語音信號最關鍵的部位,具有多分辨率特性,理論上可等效為一個濾波器組,能對不同頻率的信號產(chǎn)生不同的響應。根據(jù)Stevens和Volkman早年的研究[15],耳蝸的感知頻率與信號的頻率有如下關系:
MFCC特征參數(shù)的提取步驟如圖2所示,包括預處理、快速傅里葉變換、計算譜線能量、計算Mel濾波器能量和計算離散余弦變換(Discrete Cosine Transform, DCT)倒譜。
圖2 MFCC參數(shù)特征提取流程
2.2.1 預處理
預處理是計算信號MFCC參數(shù)的基礎,其主要包括信號分幀和加窗函數(shù)兩個步驟。
2.2.2 快速傅里葉變
2.2.3 計算譜線能量
計算經(jīng)過FFT變換后每一幀信號的譜線能量:
式中:表示第幀信號;表示頻域上的第條譜線。
2.2.4 Mel濾波
2.2.5 求DCT倒譜
與傳統(tǒng)傅里葉變換相比,DCT具有功率譜分量更加豐富、能量更加集中且不需要對信號的相位進行估算,減少了計算量和計算誤差等優(yōu)點,信號()的DCT如下[16]:
式中,()為正交因子,它為保證矩陣變換的規(guī)范性而存在,具體表示如下:
將式(15)計算出的Mel濾波器組的能量取對數(shù)后計算其DCT,即得到了信號的MFCC參量:
2014年9月在某湖進行湖上實驗,用標準水聽器采集了蛙人呼吸聲信號、環(huán)境噪聲和艦船輻射噪聲,實驗布放見圖3。標準水聽器位于水下6 m深處,蛙人位于水下3 m深處,在水中處于相對靜止狀態(tài)并保持均勻節(jié)奏呼吸,蛙人與標準水聽器的水平距離為10 m;實驗當天晴朗無風,氣象條件良好。
實驗所用的標準水聽器型號為8104,靈敏度為-207 dB;測量放大器采用B&K2610型,放大倍數(shù)為-60 dB,實驗設備如圖4和圖5所示。
圖3 實驗布放示意圖
圖4 標準水聽器8104
圖5 測量放大器B&K2610
蛙人由一名身體素質良好、具有多年潛水經(jīng)驗的潛水教練員擔任,并攜帶開式呼吸器進行水下任務,在湖面上用紅色救生圈標記其水下的相對位置。如圖6和圖7所示。
圖6 蛙人下潛
圖7 潛水設備
對湖試數(shù)據(jù)進行處理,分別對蛙人呼吸聲信號、艦船輻射噪聲和環(huán)境噪聲提取MFCC特征,并對相鄰周期呼吸聲信號之間、相隔周期呼吸聲信號之間、呼吸聲信號與環(huán)境噪聲之間及呼吸聲信號與艦船輻射噪聲之間的MFCC參量進行特征匹配,計算其MFCC夾角和MFCC距離。
本文截取接收到的蛙人呼吸聲信號前7個周期進行處理,將每個周期的呼吸聲信號與噪聲信號都分為20幀,對140幀信號的MFCC參量進行統(tǒng)計平均。將兩類信號的MFCC數(shù)值分別作為橫坐標和縱坐標,坐標點為特征符號,特征符號的分布即為匹配結果:
對相鄰周期呼吸聲信號、相隔周期呼吸聲信號、呼吸聲信號與艦船輻射噪聲、呼吸聲信號與環(huán)境噪聲的MFCC參量進行匹配,如圖8~11所示。
在圖8~11中,斜線為45°線,是MFCC參數(shù)匹配的準線,信號的MFCC特征越接近,則匹配情況越佳,特征符號應越靠近準線分布。從圖中的結果可以看出,圖8中蛙人相鄰周期呼吸聲信號之間和圖9中相隔周期呼吸聲信號之間的特征符號主要沿準線附近分布,呼吸聲信號與環(huán)境噪聲及艦船輻射噪聲之間的特征符號在圖中分布得較為分散。匹配結果表明:(1) 蛙人呼吸聲信號彼此間的特性相近,周期不會改變蛙人呼吸聲之間的相似性;(2) 蛙人呼吸聲與噪聲的特性存在巨大差異,MFCC是一種能夠區(qū)分蛙人呼吸聲與噪聲的有效特征。值得注意的是,呼吸聲信號與噪聲之間的匹配結果雖然不在準線沿線分布,但其分布仍有一定規(guī)律性,為量化分析其中的差異,本文計算了其MFCC夾角與MFCC距離。
圖8 相鄰周期呼吸聲信號MFCC參數(shù)匹配結果
圖9 相隔周期呼吸聲信號MFCC參數(shù)匹配結果
圖10 呼吸聲信號與艦船輻射噪聲MFCC參數(shù)匹配結果
3.2.1 MFCC夾角
圖11 呼吸聲信號與環(huán)境噪聲MFCC參數(shù)匹配結果
圖12 MFCC特征擬合直線
表1 MFCC夾角
3.2.2 MFCC距離
從表2~4的計算結果可得出如下結論:(1) 相鄰周期呼吸聲信號之間的MFCC距離最小,其平均距離較為穩(wěn)定,都在10上下浮動;而相隔周期呼吸聲信號之間的MFCC距離與相鄰周期呼吸聲信號的MFCC距離沒有明顯差別,這個結果充分說明蛙人呼吸聲信號的特性比較穩(wěn)定,無論是否相鄰,呼吸聲信號都能夠較好地進行MFCC參數(shù)匹配;(2) 呼吸聲信號與艦船輻射噪聲的MFCC距離最大,其平均距離較穩(wěn)定地分布在30左右,這說明呼吸聲信號與艦船輻射噪聲信號之間的差異較為明顯,通過這個數(shù)值可以有效地區(qū)分呼吸聲信號與艦船輻射噪聲;(3) 呼吸聲信號與環(huán)境噪聲的MFCC距離的平均值分布在16~18左右,該值域大于呼吸聲信號之間的平均距離?,F(xiàn)繪制各信號之間的MFCC參數(shù)平均距離曲線,如圖13所示。
表2 不同周期的呼吸聲信號之間的MFCC距離
表3 呼吸聲信號與艦船輻射噪聲之間的MFCC距離
表4 呼吸聲信號與環(huán)境噪聲之間的MFCC距離
圖13 各類信號間MFCC參數(shù)平均距離
從圖13中可以看出,呼吸聲信號之間、呼吸聲信號與艦船輻射噪聲及呼吸聲信號與環(huán)境噪聲的MFCC平均距離曲線分布于不重疊的區(qū)域,能夠較好地將蛙人呼吸聲信號、艦船輻射噪聲及環(huán)境噪聲進行區(qū)分。圖中根據(jù)平均距離的分布值,可設置30和15兩個檢測閾值,當平均距離大于30時,可將接收信號判定為艦船輻射噪聲;當平均距離介于15和20之間時,可將接收信號判定為環(huán)境噪聲;當平均距離小于15時,則可判定接收信號為蛙人呼吸聲信號,從而實現(xiàn)對水下蛙人的探測和識別。
本文介紹了信號的倒譜分析模型和MFCC特征提取方法。結合湖試數(shù)據(jù),提取了蛙人呼吸聲、艦船輻射噪聲和環(huán)境噪聲的MFCC參量,得到了匹配蛙人不同周期呼吸聲之間、呼吸聲與艦船輻射噪聲之間和呼吸聲與環(huán)境噪聲之間的MFCC參數(shù)的分布圖。從參數(shù)分布線性擬合的MFCC輻射角和MFCC距離中得到的MFCC參量匹配結果能夠反映不同信號的特征,可以作為辨別蛙人呼吸聲與噪聲的依據(jù),并有如下結論:
(1) 匹配不同時段蛙人呼吸聲的MFCC參數(shù),分布有序,擬合直線輻射角接近45°,對于蛙人呼吸聲與艦船噪聲、蛙人呼吸聲和環(huán)境噪聲的MFCC參數(shù),則分布散亂,擬合直線輻射角接近0°,體現(xiàn)了蛙人呼吸聲信號與船艦干擾信號及環(huán)境噪聲的顯著差異;
(2) 從不同聲信號的MFCC參數(shù)之間的距離計算得到,不同時段蛙人呼吸聲信號MFCC距離為10左右,不具有顯著差異;而呼吸聲信號與艦船輻射噪聲之間,以及呼吸聲信號與環(huán)境噪聲之間的MFCC距離分別為30左右和16~18左右,都具有顯著差異。實驗結果為有效改進蛙人的探測性能提供了重要依據(jù)。
[1] Sarangapani S, Miller J H, Potty G R, et al. Measurements and modeling of the target strength of divers[C]//6th Biennial Conference on Engneering Systems of Design and Analysis, vol. 2, Brest, France, 2005.
[2] Hollet R D, Kessel R T, Pinto M. At-sea measurements of diver target strengths at 100 kHz: measure technique and first results[R]. Hamburg, Germany: Undersea Defence Technology Conference and Exhibition 2006.
[3] Zampolli M, Jensen F, Tesei A. Review of target strength informat ion for waterside security applications[C]//Proceedings of the 1st Int. Conf. on Waterside Security (WSS 2008), Copenhagen, Denmark, August 2008.
[4] 姜衛(wèi), 范軍, 胡碰. 聲納頻段內動物體肺部組織目標強度的水下測量[J]. 聲學技術. 2007, 26(5): 45-47. JIANG Wei, FAN Jun, HU Peng. The underwater measurement of the target strengths of animal lung tissue at the sonar frequency[J]. Technical Acoustics, 2007, 26(5): 45-47
[5] 張波, 馬忠成. 蛙人目標強度的水下測量[J]. 聲學技術, 2009, 28(5): 303-304. ZHANG Bo, MA Zhongcheng. Underwater measurement of target strength of diver[J]. Technical Acoustics. 2009, 28(5): 303-304.
[6] Borowski B, Sutin A, Roh H S, et al. Passive acoustic threat detection in estuarine environments[J]. Proc. SPIE, 2008, 6945: 694513- 694524.
[7] Stolkin R, Radhakrishnan S, Sutin A, et al. Passive acoustic detection of modulated underwater sounds from biological and anthropogenic sources[J]. oceans 2007, Sept. 29, 2007-Oct. 4, 2007: 1-8.
[8] CHEN X, WANG R, Tureli U. Passive acoustic detection of divers under strong interference[C]//MTS/IEEE Oceans 06, Boston, USA, 2006.
[9] Stolkin R, Sutin A, Radhakrishnan S, et al. Feature based passive acoustic detection of a diver[C]//SPIE Defense and Security Symposium, 2006.
[10] Kil W Chung, Hongbin Li, Sutin A. A frequency-domain multi-band matched-filter approach to passive diver detection. signals, systems and computers[C]//ACSSC 2007. Conference Record of the Forty-First Asilomar Conference on (11 April 2008), pp. 1252-1256.
[11] Stolkin R a, Florescu J.Probabilistic analysis of a passive acoustic diver detection system for optimal sensor placement and extensions to localization and tracking[C]//Oceans 2007 MTS/IEEE Conference, Vancouver, BC, 29 September October 2007.
[12] CHEN X, Tureli U. Passive acoustic detection of divers using single hydrophone[C]//40th Asilomar Conference on Signals, Systems, and Computers, ACSSC '06, Pacific Grove, CA, 29 October -1 November 2006.
[13] 張偉豪, 許楓. 水下蛙人被動探測技術實驗研究[J]. 聲學學報, 2012, 37(3): 301-307. ZHANG Weihao, XU Feng. Experiment and study of passive acoustic detection of underwater divers[J]. Acta Acustica, 2012, 37(3): 301-307.
[14] Herrera P, Peeters G, Dubnov S. Automatic classificatiton of musical instrument sounds[J]. Journal of New Music Research, 2003, 32(1): 3-21.
[15] Stevens S S, Volkman J, Newman E B. A scale for the measurement of the psychological magnitude of pitch[J]. J. Acoust. Soc. Am., 1937, 8(3): 185-190.
[16] 王娜, 陳克安. 基于人耳聽覺特性的水下目標識別研究[C]//中國聲學學會2006年全國聲學學術會議論文集. 北京, 2006: 413-414. WANG Na, CHEN Kean. Investigation on underwater target recognition based on auditory characteristics[C]//Proceeding of ASC 2006 Chinese Acoustic Academy Conference, Beijing, 2006: 413-414.
Experimental research on Mel cepstrum feature of the underwater diver breathing-signal
ZHU Zhi-meng, GUO Yu, WANG Guan, ZHANG Jia-rong
(System Engineering Research Institute, Beijing 100094, China)
In order to improve the accuracy of the diver breathing-signal recognition, this paper presents a method of matching underwater diver breathing-signal based on MFCC. Breathing-signal of the underwater diver is obtained during the trial in Songhua River, Jilin province, and the MFCC angle and MFCC distance between breathing-signal, ship-radiated noise and ambient noise are calculated and matched. The results show that there is an obvious difference of the MFCC parameter between diver breathing-signal and noise, the validity of the MFCC based feature algorithm is verified, which has a reference value for the development of underwater diver sonar and early warning system in offshore areas.
passive sonar; underwater small target; Mel Frequency Cepstrum Coefficient (MFCC); feature matching
TB556
A
1000-3630(2017)-03-0286-07
10.16300/j.cnki.1000-3630.2017.03.016
2016-09-21;
2016-12-09
朱知萌(1990-), 男, 黑龍江哈爾濱人, 碩士, 工程師, 研究方向為水下小目標探測與識別、水聲信號處理。
朱知萌, E-mail: zhuzhimeng@hrbeu.edu.cn。