劉金剛+周翊+馬永保+劉宏清
摘 要:針對語音識別系統(tǒng)在噪聲環(huán)境下不能保持很好魯棒性的問題,提出了一種切換語音功率譜估計算法。該算法假設語音的幅度譜服從Chi分布,提出了一種改進的基于最小均方誤差(MMSE)的語音功率譜估計算法。然后,結合語音存在的概率(SPP),推導出改進的基于語音存在概率的MMSE估計器。接下來,將改進的MSME估計器與傳統(tǒng)的維納濾波器結合。在噪聲干擾比較大時,使用改進的MMSE估計器來估計純凈語音的功率譜,當噪聲干擾較小時,改用傳統(tǒng)的維納濾波器以減少計算量,最終得到用于識別系統(tǒng)的切換語音功率譜估計算法。實驗結果表明,所提算法相比傳統(tǒng)的瑞利分布下的MMSE估計器在各種噪聲的情況下識別率平均提高在8個百分點左右,在去除噪聲干擾、提高識別系統(tǒng)魯棒性的同時,減小了語音識別系統(tǒng)的功耗。
關鍵詞:自動語音識別系統(tǒng);魯棒性;最小均方誤差;語音存在概率;功率譜估計;維納濾波器
中圖分類號: TN912.35
文獻標志碼:A
文章編號:1001-9081(2016)12-3369-05