国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Mel頻率倒譜系數(shù)的光纜聲音信號特征提取方法研究

2013-04-24 05:12李一芳
計量技術(shù) 2013年7期
關(guān)鍵詞:特征參數(shù)特征向量光纜

李一芳

(南京航空航天大學(xué)經(jīng)濟(jì)與管理學(xué)院,南京 210016)

0 引言

隨著通信事業(yè)的快速發(fā)展,對于通信網(wǎng)絡(luò)的建設(shè)與管理提出了更高的要求。光纜是現(xiàn)代大容量通信的重要組成部分,對于光纜的保護(hù)也隨之提出了更高的要求。

聲音作為目標(biāo)活動時發(fā)出的一種固有信號,必然攜帶著目標(biāo)本身的結(jié)構(gòu)信息和運行狀態(tài)信息。利用聲音傳感器可以實現(xiàn)對通信光纜鋪設(shè)區(qū)域進(jìn)行全天候不間斷的監(jiān)測,通過光纖傳感器拾取目標(biāo)活動時產(chǎn)生的聲振動信號,提取其中的特征,可以對目標(biāo)進(jìn)行探測、識別和分類。將獲取的信息傳輸給通信網(wǎng)絡(luò)控制臺或指揮中心,可以使指揮人員及時準(zhǔn)確的了解和掌握監(jiān)測區(qū)域的情況,從而及時有效的對通信光纜進(jìn)行巡查和維護(hù),切實保障通信網(wǎng)絡(luò)的可靠性和安全性。針對通信光纜的破壞事件諸如鏟車,電鉆以及施工等,需要采取一種切實可行的方式來進(jìn)行實時識別,以便采取及時的保護(hù)措施,保證光網(wǎng)絡(luò)的通信質(zhì)量。

本文旨在研究基于Mel頻率倒譜系數(shù)提取光纜聲音信號特征的提取方法,為通信網(wǎng)絡(luò)實時監(jiān)控提供一種有效的手段。

1 Mel頻率倒譜系數(shù)

1.1 聲音識別系統(tǒng)

聲音識別系統(tǒng)的基本原理是:通過訓(xùn)練樣本的量化,提取特征參數(shù)來建立樣本文件,保存在聲音樣本數(shù)據(jù)庫中;通過采集被識別的聲音,提取特征參數(shù)后通過匹配算法與樣本數(shù)據(jù)庫中的樣本進(jìn)行匹配,并輸出識別結(jié)果。典型的聲音識別系統(tǒng)基本模型如圖1所示。

圖1 聲音識別系統(tǒng)基本模型

由于特征參數(shù)能夠有效地體現(xiàn)該聲音所包含的區(qū)別于其他聲音的不同特點,它在整個識別過程中起著至關(guān)重要的作用。目前,在識別研究領(lǐng)域使用較多的有Mel頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient,MFCC)[1-2]、線性預(yù)測倒譜系數(shù)(Linear Predictive Cepstrum Coefficients,LPCC)、線性倒譜對(Linear Spectrum Pair,LSP)等。已有的研究表明MFCC在識別系統(tǒng)中具有很高的識別性能以及噪聲魯棒性。

1.2 低頻頻譜識別

MFCC主要描述信號在頻率域上的能量分布,它能夠較好地模擬人耳聽覺系統(tǒng)的感知能力。MFCC使用一串在低頻區(qū)域交叉重疊排列的三角型濾波器(如圖2所示),捕獲聲音的頻譜信息。由于Hz-Mel頻率非線性的對應(yīng)關(guān)系,使得在低頻區(qū)域使用的濾波器數(shù)量較多,分布密集;而在高頻區(qū)域使用的濾波器數(shù)量較少,分布稀疏。由于光纜的破壞事件的頻譜大致都位于低頻區(qū)域,所以采用MFCC能夠獲得很好的識別效果。本文所呈現(xiàn)的實驗結(jié)果表明,采用該特征參數(shù)對于破壞事件的識別率,獲得了比較好的結(jié)果。

圖2 三角濾波器分布

2 聲音特征參數(shù)的提取

MFCC參數(shù)是研究人的聽覺系統(tǒng)的基礎(chǔ)上而得出的聲學(xué)特征[3-4]。對于人的聽覺機(jī)理研究發(fā)現(xiàn),當(dāng)兩個頻率相近的音調(diào)同時發(fā)出時,人只能聽到一個聲調(diào)。臨界帶寬指的就是這樣一種令人主觀感覺發(fā)生突變的帶寬邊界。當(dāng)兩個音調(diào)的頻率小于臨界帶寬時,人們就把兩個音調(diào)聽成一個,這就是所謂的掩蔽效應(yīng)。Mel刻度就是對這個臨界帶寬的度量方法之一。根據(jù)已有的研究工作表明,臨界頻帶寬隨著頻率的變化而變化,并與Mel頻率的增長一致。采用Mel頻率模擬人耳的聽覺,它與聲音頻率的大概關(guān)系近似表示為:在1000Hz以下,大致呈線性分布,帶寬為100Hz左右;在1000Hz以上呈對數(shù)增長。頻率f與Mel頻率Mel(f)之間的轉(zhuǎn)換關(guān)系為:

Mel(f)=2595lg(1+f/ 700)

MFCC特征參數(shù)提取過程是:首先將聲音信號進(jìn)行FFT變換到頻域,通過Mel尺度的濾波器陣列后進(jìn)行離散余弦變換,得到特征參數(shù),如圖3。

圖3 MFCC提取流程

MFCC參數(shù)具體提取過程如下:

1)預(yù)加重,對每一幀信號減少尖銳噪聲影響,提升高頻信號[5]。預(yù)加重的定義式如下所示:

Sn=Sn-aSn-10.9≤a≤1.0

Sn為原始信號(系統(tǒng)中采用25k采樣率,32bits采樣精度,參數(shù)a通常取0.9725)。

2)窗長40ms,窗移20ms,因此,每幀有1000個采樣點。對信號加窗以避免短時聲音信號段邊緣的影響。加窗的定義如下:

Sw(n)=Sn×w(n) (Sw(n)是加窗后的信號)

其中w(n)為窗函數(shù):

3)對Sw(n)進(jìn)行快速傅里葉變換[6-7]:由于聲音信號在時域上的變化快速而且不穩(wěn)定,所以通常都將它轉(zhuǎn)換到頻域上來觀察[8],此時它的頻譜會隨著時間作緩慢的變化。所以通常將加窗后的幀經(jīng)過FFT變換,求出每幀的頻譜參數(shù)。

4)把上一步變換得到的頻譜系數(shù)用序列三角濾波器進(jìn)行濾波處理,得到一組系數(shù)c1,c2,…。濾波器組中每個三角濾波器的跨度在Mel刻度上是相等的。所有的濾波器總體上覆蓋從0Hz到奈奎斯特頻率,即采樣頻率的二分之一。

計算ci的公式如下:

ci=ln[X(k)×Hi(k)]

其中:

f[i]是三角濾波器的中心頻率,滿足:

Mel(f[i+1])-Mel(f[i])=Mel(f[i])-
Mel(f[i-1])

5)利用離散余弦變換求得倒譜系數(shù)。其中P是三角濾波器的個數(shù)。倒譜系數(shù)的個數(shù)為24,由下式得出:

通過上述步驟,即可以得到24維MFCC特征參數(shù)。但是,這并不意味著系統(tǒng)最后選取的特征參數(shù)就是24維的,因為其中可能存在對于識別系統(tǒng)沒有貢獻(xiàn)的分量。MFCC特征系數(shù)的低階及高階部分對于識別系統(tǒng)的貢獻(xiàn)仍然未知。已有的研究表明,高階與低階的MFCC特征參數(shù)在不同的識別環(huán)境下會體現(xiàn)出不同的識別性能和噪聲魯棒性。所以,在下一步的實驗仿真過程中,通過不同維度特征參數(shù)的對比來選擇最適合的特征分量組合。

3 實驗仿真

仿真過程中對樣本聲音信號采用了25k采樣率,32bits量化長度,每一幀信號長度為40ms,幀移20ms,并利用漢明窗進(jìn)行短時分析。對采集的鏟車、電鉆以及施工事件的聲音信號,采用基于時域短時能量和短時過零率的雙門限端點檢測法,去掉其中部分冗余信息,確保所提取的聲音信號的有效性。實驗過程中選取預(yù)處理后聲音樣本的100幀作為聲音訓(xùn)練樣本,100幀作為測試樣本。

利用支持向量機(jī)(Support Vector Machine,SVM)對三種聲音信號兩兩之間進(jìn)行訓(xùn)練、預(yù)測以及分析結(jié)果。SVM[9-10]方法是在統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小原理基礎(chǔ)上發(fā)展起來的一種新的機(jī)器學(xué)習(xí)方法,根據(jù)有限的樣本信息在模型的復(fù)雜性(即對特定訓(xùn)練樣本的學(xué)習(xí)精度)和學(xué)習(xí)能力(即無錯誤地識別任意樣本的能力)之間尋求最佳折衷。它能夠克服基于規(guī)則的層次分類方法的缺點,并且不需要選定閾值。

實驗仿真中采用5倍交叉驗證方法進(jìn)行評判[11],即將5次實驗的平均識別率作為最終的實驗結(jié)果。另外,為了選取最佳的特征組合,同時也是為了滿足識別系統(tǒng)的實時性要求,需要將特征數(shù)據(jù)降維,提高系統(tǒng)的處理效率。仿真選擇其中最能代表聲音信號的維度作為最終系統(tǒng)選用的特征。因此,同時還選擇了8維聲音特征向量來仿真識別的效果。識別結(jié)果如表1所示。

表1 不同維數(shù)特征向量實驗識別率(%)

實驗過程中采用徑向基函數(shù)(Radial Basis Function,RBF)作為核函數(shù)。從實驗結(jié)果可以看出,不論是24維特征向量還是8維特征向量,都具有令人比較滿意的識別率。這說明,采用MFCC作為該識別系統(tǒng)的特征參數(shù),能夠獲得比較好的識別效果。同時,系統(tǒng)采用8維特征向量與采用24維特征向量的識別效果相當(dāng),這也從一定程度上表明特征向量的降維對于實際識別系統(tǒng)的可行性。

4 結(jié)論

作為主流識別領(lǐng)域的MFCC在識別中能較好地模擬人耳聽覺系統(tǒng)的感知能力,在識別系統(tǒng)中具有很高的識別性能以及噪聲魯棒性,對低頻聲音信號有著很好的計算精度[12]。MFCC特征參數(shù)的高低維部分對于不同識別環(huán)境表現(xiàn)出不同的識別性能和噪聲魯棒性。

通信光纜周邊環(huán)境中的各種破壞事件所產(chǎn)生的聲音的頻率主要位于500Hz以下低頻部分,根據(jù)MFCC的良好特性,采用MFCC作為該聲音識別系統(tǒng)的特征參數(shù),且主要是選擇MFCC的低維部分作為該系統(tǒng)的特征參數(shù)。實驗仿真結(jié)果表明,采用低維MFCC特征參數(shù)能夠得到比較滿意的識別效果。這就為下一步系統(tǒng)的建立奠定了堅實的基礎(chǔ)。下一步,通過采集更多的不同的事件聲音樣本信號,通過兩類或者三類樣本之間的組合來進(jìn)行識別,仿真尋找更加優(yōu)化的特征維度組合,提高識別的速度和精度。

[1] 江星華,李應(yīng).一種基于MFCC 的音頻數(shù)據(jù)檢索方法[J].計算機(jī)與數(shù)字工程,2008(9)

[2] 葉慶云,蔣佳.基于語音MFCC 特征的改進(jìn)算法[J].武漢理工大學(xué)學(xué)報,2007(5)

[3] 張震,化清.語音信號特征提取中Mel倒譜系MFCC 的改進(jìn)算法[J].計算機(jī)工程與應(yīng)用,2008,44(22)

[4] 韓一,王國胤,楊勇.基于MFCC 的語音情感識別[J].重慶郵電大學(xué)學(xué)報,2008(5)

[5] 白靜,張雪英.基于支持向量機(jī)的抗噪語音識別[J].太原理工大學(xué)學(xué)報,2009(1)

[6] 楊行峻,遲惠生,等.語音信號數(shù)字處理.北京:電子工業(yè)出版社,1995

[7] Rabiner L,Juang B H.Fundamental of Speech Recognition.New York:Prentice Hall,1993

[8] Furui S.Speaker Independent Isolated Word Recognition Using Dynamic Feature of Speech Spectrum.IEEE Trans on Acoustics,Speech,Signal Processing,1986,34(1):52-59

[9] Seneff S.A Joint Synchrony/mean-rate Model of Auditory Speech Processing.Journal of Phonetics,1998, 16:55-76

[10] Atal B S.Automatic Recognition of Speakers from Their Voices.Proceeding of IEEE,1976,64(4):460-475

[11] Reynolds D A.Experimental Evaluation of Features for Robust Speaker Identification.IEEE Trans on Speech and Audio Processing.1994,2(4):639-643

[12] Kanedera N,Arai T,Hermansky H,et al.0n the Importance of Various Modulation Frequencies for Speech Recognition.In:Proceedings of EUR0SPEECH,1997,Rodos,Greece

猜你喜歡
特征參數(shù)特征向量光纜
二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計——以特征值和特征向量為例
克羅內(nèi)克積的特征向量
故障診斷中信號特征參數(shù)擇取方法
基于特征參數(shù)化的木工CAD/CAM系統(tǒng)
鋪條長長的海底光纜
一類特殊矩陣特征向量的求法
基于PSO-VMD的齒輪特征參數(shù)提取方法研究
EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗上的應(yīng)用
氣吹法光纜敷設(shè)
無鹵阻燃光纜及防蟻光纜