任永梅
【摘 要】為了進一步減少傳統(tǒng)子空間語音增強方法增強的語音中的殘留噪聲,提出一種改進的子空間語音增強算法。新算法首先對帶噪語音進行KL(Karhunen-Loeve Transform)變換,得到帶噪語音的特征值;接著用遞歸最小二乘算法(RLS)估計出噪聲特征值,對傳統(tǒng)子空間算法容易引起的特征值估計偏差問題進行修正;最后用帶噪語音特征值減去RLS方法估計出的噪聲特征值并由KL逆變換還原出純凈語音。仿真結果表明,在高斯白噪聲背景下,與傳統(tǒng)子空間語音增強算法相比,新算法提高了增強語音的信噪比,減少了語音失真。
【關鍵詞】語音增強;子空間;遞歸最小二乘算法;SNR
New Improved Subspace Method of Speech Enhancement
REN Yong-mei1,2
(1.School of Electrical and Information Engineering, Hunan Institute of Technology, Hengyang Hunan 421002, China;
2.Key Laboratory of Signal & Information Processing, Hunan Institute of Technology, Hengyang Hunan 421002, China)
【Abstract】In order to reduce the residual noise in enhanced speech that by using the traditional subspace speech enhancement method,this paper proposed the new improved subspace method of speech enhancement. The new algorithm firstly does Karhunen Loeve Transform to noisy speech and gets its eigenvalues, then it uses the Recursive least squares algorithm (RLS) to estimate noise characteristic value, which fixes the problem that the traditional subspace speech enhancement algorithm causes speech feature value estimation deviation; finally it uses the noisy speech eigenvalues to minus the noise characteristic value and the clean speech is gained by KL reverse transformation. Simulation experimental results show that comparing with subspace speech enhancement method, the new proposed algorithm improves the signal-to-noise ratio(SNR) of the enhanced speech and reduces the distortion of the speech in white Gaussian noise background.
【Key words】Speech enhancement; Subspace; RLS; SNR
0 引言
語音增強技術是語音信號處理技術中的一個重要分支,它可以有效去除數(shù)字通信系統(tǒng)中的噪聲,因此,人們越來越重視語音增強在語音處理方面的作用。近年來,子空間方法在語音增強研究中已有了較大發(fā)展[1-2]。該方法的基本思想是將帶噪語音信號映射到疊加噪聲的信號子空間與噪聲子空間中,再將噪聲子空間消除掉,在疊加噪聲的信號子空間中估計原始信號[3-4]。傳統(tǒng)的子空間算法不能濾除整個噪聲子空間,所以在估計語音特征值時很容易引起偏差,致使增強的語音信號中有失真,因此本文提出一種改進的子空間語音增強算法。新算法先對帶噪語音做KL變換并計算其特征值;接著利用RLS方法估計出噪聲特征值,以修正傳統(tǒng)方法中僅用無聲段的方差平均值來估計噪聲特征值;最后用帶噪語音特征值減去估計出的噪聲特征值,并做KL逆變換以得到增強語音。實驗結果表明新算法在高斯白噪聲背景下能夠更好地去除噪聲,減少了語音失真。
1 改進的子空間語音增強算法
1.1 遞歸最小二乘算法的原理
遞歸最小二乘算法(RLS)是自適應濾波器[5]中通常采用的一種自適應方法,其本質(zhì)是一種有限長單位脈沖響應維納濾波器的時間遞推算法,并嚴格以最小二乘法準則為依據(jù)[6]。自適應濾波器的原理圖如圖1所示。
結合圖1,對RLS算法的具體原理描述如下:
④自適應更新過程
1.2 改進的子空間語音增強算法
傳統(tǒng)的子空間語音增強算法僅僅用無聲段(一般為前3000個采樣點)的方差平均值估計噪聲特征值,會對語音特征值的估計出現(xiàn)偏差,引起語音失真。鑒于此,提出改進的子空間語音增強算法,其流程圖如圖2所示。由圖2可知新算法步驟如下:
①對輸入的噪聲語音做KL變換,得出其在子空間域的特征值?撰Y和特征向量;
②通過RLS遞歸更新方法估計出噪聲并計算其特征值?撰N,實現(xiàn)對傳統(tǒng)方法中的噪聲特征值的修正,達到減少語音失真的目的。
③計算純凈語音的特征值?撰S,即用?撰Y減去?撰N;
④由KL逆變換得到增強語音。
圖2 改進的子空間語音增強算法流程圖
2 仿真實驗與分析
用MATLAB軟件對新算法進行了仿真實驗,并和傳統(tǒng)子空間方法進行了對比,驗證了算法的有效性。在實驗中,純凈語音資料為NOIZEUS語音庫中的英語男聲短句“The birch canoe slid on the smooth planks.”,噪聲來源于Noisex-92數(shù)據(jù)庫的高斯白噪聲,語音和噪聲的采樣率均為8kHz,依照實驗結果最優(yōu)的原則,設置幀長為40個采樣點,幀移為一半。圖3是信噪比為5dB的高斯白噪聲背景下兩種算法得到的增強語音的時域波形圖。
圖3 高斯白噪聲背景下兩種算法增強語音時域波形圖
從圖3可以看出,傳統(tǒng)子空間語音增強方法增強的語音仍有很多殘留噪聲;而新算法增強的語音的時域波形圖最接近于原始語音的時域波形圖,減少了語音失真。
本文采用信噪比來測評增強后的語音性能,仿真結果如表1。
表1 兩種算法增強的語音的信噪比/dB
從表1可看出,在輸入信噪比相同的情況下,新算法增強語音的信噪比值要比傳統(tǒng)算法增強語音的信噪比值高,尤其在0dB和5dB時提高的幅度更大,在15dB時,信噪比值稍微有降低,但這并不影響該算法的整體優(yōu)越性。
3 結束語
本文提出的改進的子空間語音增強算法,利用RLS方法對傳統(tǒng)子空間語音增強算法中的噪聲特征值作了修正,進一步改善了傳統(tǒng)子空間語音增強算法的增強效果;實驗結果表明,新算法可以更多的抑制噪聲,減少語音失真。
【參考文獻】
[1]Ephraim Y, Van Trees H L.A signal subspace approach for speech enhancement[J]. IEEE Trans Speech and Audio Process-ing, 1995,3(4):251-266.
[2]吳北平,李輝,戴蓓倩,等.基于子空間域噪聲特征值估計的語音增強方法[J].信號處理,2009,25(3):460-463.
[3]牛銅.基于子空間的語音增強算法研究[D].鄭州:解放軍信息工程大學,2009.
[4]曹玉萍.基于信號子空間的語音增強方法[J].電子測試,2012(6):54-57.
[5]肖哲.基于Matlab的RLS自適應語音噪聲對消系統(tǒng)的設計與實現(xiàn)[J].長沙大學學報,2006,20(2):83-86.
[6]羅文超,張友純.在MATLAB中采用RLS算法實現(xiàn)FIR自適應濾波器[J].軟件導刊,2008,7(1):107-108.
[責任編輯:湯靜]