鄭丹
摘 要:近年來,小波理論發(fā)展迅速,實際應用也非常廣泛,運用小波去噪的方法對噪聲進行抑制,以提高說話人系統(tǒng)在噪聲壞境下的頑健性,使說話人識別系統(tǒng)的成果走出實驗室,得到實際應用,本文簡單說明基于小波變換的噪聲抑制的思想和方法,以提高語音識別系統(tǒng)實用性能,這也是未來說話人識別系統(tǒng)研究的重要方向之一。
關(guān)鍵詞:小波變換;語音識別;信噪分離
中圖分類號: O422.8 文獻標識碼: A 文章編號: 1673-1069(2017)06-164-2
引言
尋找并利用有效的去噪方法是提高系統(tǒng)實用性能的關(guān)鍵技術(shù),但在一般的實驗室,其特定的系統(tǒng)卻幾乎不曾把噪聲考慮到整個實驗當中??稍诂F(xiàn)實生活中,噪聲卻是處處存在。再說,在實驗室進行研究的過程中,說話人系統(tǒng)的集合一般都在可控范圍內(nèi),而且都是比較小的。反之,在現(xiàn)實生活中,說話人的集合卻被要求盡可能地放大。由此看來,系統(tǒng)的執(zhí)行效率和識別率會隨著說話人集合的擴大而下降,而且下降的速度與說話人集合的大小形成正比。綜上所述,研究小波去噪以提高語音識別系統(tǒng)在變化環(huán)境下的系統(tǒng)性能具有重要意義。
1 小波去燥的理論基礎(chǔ)
噪聲和信號在其各自的頻帶(即尺度)上的小波譜均有著不一樣的表現(xiàn)。根據(jù)這個特點,便可根據(jù)各頻帶上的小波譜的分量,確定哪些小波譜是由噪聲產(chǎn)生,哪些噪聲小波譜在整個頻帶上起著主導作用。同時,綜合上述的判別方法,去掉這部分小波譜,就能把原信號的小波譜保留下來。我們可以把這個過程稱作小波譜的重構(gòu)或者還原,也是小波去燥的理論基礎(chǔ)。與此同時,參照小波變換重構(gòu)的算法,便可還原出原信號??梢姡绾斡行⒃肼暜a(chǎn)生的小波譜分量過濾掉是小波去燥的關(guān)鍵所在。
一般來說,傳統(tǒng)的線性濾波方法難以兼顧在保護信號局部特征的同時,也能有效抑制噪聲。為此,可利用小波變換時頻局部化和選擇靈活化的兩大特點,制作出解決傳統(tǒng)的線性濾波方法的局限性的有效工具。而利用閾值的小波域語音增強算法便是其中一個較具潛力的算法。由此可知,小波去噪便是簡單地利用小波系數(shù)的閾值,并在此基礎(chǔ)上加以延伸的。舉個例子,若是把噪聲的小波系數(shù)和其他目標信號均框定在小波閾值的范圍內(nèi),則難以分辨出清音段中的語音和噪音。若是使用相同的閾值處理所有的噪聲,在這種特定的環(huán)境下,則會把附加的噪聲也一并壓縮了。同時,也使得像清音一類的語音被壓縮了。在此過程中過濾掉的語音在感知上和質(zhì)量上都會大打折扣。從上述可知,有效結(jié)合小波變換和其他信號處理方法,是提高系統(tǒng)魯棒性的有效途徑。
2 不同信噪比下語音加噪
取40dB、30dB、25dB、15dB、10dB五種信噪比下對原始語音進行加噪。
2.1 驗證性程序
load ('路徑')
s=awgn(s,SNR);
2.2 仿真分析
以信噪比SNR為25dB時為例,進行仿真,繪制信號波形圖見圖1。
3 不同小波對語音去噪
分別采用小波db1、db7、sym2、db5對加噪語音進行去噪。
說話人集合由20個說話人組成,其中包括男10人,女10人,語音在安靜的室內(nèi)環(huán)境下,用Matlab程序錄制,每個說話人包含2個四字成語,總共八個字,語音長度3.6s,每人錄制相同八字詞語兩遍,分別存放在文件夾train和文件夾test中,用于訓練和識別。然后在不同信噪比下對原始語音進行加噪處理,再對加噪語音采用不同的小波去噪處理,產(chǎn)生一系列的語音。
訓練與測試的驗證性程序為:
traindir=('路徑');
testdir=('路徑');
n=20;
code=train(traindir,n);
test(testdir,n,code)
①訓練語音:原始語音train,測試語音:原始語音test,程序運行結(jié)果為20人的訓練與測試語音均匹配,表明原始語音的誤識別率為0%。
②訓練語音:原始語音train,測試語音:不同信噪比下(信噪比分別為40dB、30dB、25dB、15dB、10dB)加噪語音test。
例如:當加噪語音信噪比為40dB時,程序運行結(jié)果為20人的訓練與測試語音中,5人匹配,15人不匹配,可得誤識別率為75%。
用同樣的方法可仿真出其他幾種信噪比(30dB、25dB、15dB、10dB)下的識別結(jié)果,得到誤識別率都為95%。
結(jié)果分析:當語音未增強時,誤識別率較高。語音增強后,隨著信噪比減少,誤識別率上升,但當信噪比為30dB、25dB、15dB及10dB時,它們的識別率沒有較大區(qū)別,誤識別率都很高。這說明在低信噪比下,系統(tǒng)誤識別率很高,噪聲對系統(tǒng)的識別率影響很大。
③訓練語音:去噪語音train,測試語音:不同小波(db1、db7、sym2、db5)去噪后的(信噪比分別為40dB、30dB、25dB、15dB、10dB)去噪語音test。
例如:當用小波db1對信噪比為40dB的加噪語音去噪時,程序運行結(jié)果為20人的訓練與測試語音均匹配,可得誤識別率為0%。
用同樣的方法可仿真出其它幾種小波去噪后的識別結(jié)果,列出表格見表1。
結(jié)果分析:用小波去噪的語音,當加噪去噪時取用較高的信噪比,識別率較好,隨著信噪比的降低,誤識別率在升高。語音增強后的測試結(jié)果比干凈語音的測試結(jié)果差。各種小波去噪的效果不是很好,相比較而言,采用小波db1去噪效果稍微更好,但效果也不是很顯著。
實驗結(jié)果分析:在理想的純凈語音環(huán)境下對話語進行識別(特征參數(shù)為MFCC),其識別率可高達100%,當訓練語音為原始語音,測試語音為加噪語音時,測試結(jié)果誤識別率較高。當訓練語音與測試語音都為去噪語音時,當信噪比為40dB時,誤識別率較低,隨著信噪比的減少,誤識別率明顯升高。由此看來,我們提出的小波去噪的方法對提高識別率并沒有起到較大的作用。不過,現(xiàn)實生活中噪聲無處不在,但卻能通過上述方法有效去噪??梢姡鋵嵱脙r值不容忽視。
實驗結(jié)論顯示,與此前傳統(tǒng)的去噪方法相比,就如何有效增強語音,小波變換有著以下的優(yōu)勢:①將小波變換應用于低信噪比的去噪,其效果較能得到體現(xiàn)。同時,去噪后,不但能夠提高語音的識別率,也為實際的應用帶來了更大的便利。②對于消除時變信號和突變信號的噪聲,小波變換便是最理想的方法之一。同時,與傳統(tǒng)的去噪方法相較之下,這種去噪方法的實用性較高,是傳統(tǒng)的去噪方法所不能相提并論的。
4 總結(jié)
綜合上述的論述,小波變換作為濾波一種新方法,能將語音信號中非平穩(wěn)的信號得以有效過濾。同時,隨著對小波去燥的不斷深入實踐探究,對其理論的完善和實際的應用也有著很大的幫助。最后,結(jié)合實踐探究得出的結(jié)論,便可將小波去燥廣泛應用到生活當中。
參 考 文 獻
[1] 胡航.語音信號處理[M].哈爾濱工業(yè)大學出版社,2002年5月第二版.