曹玉萍
(蘭州交通大學電子與信息工程學院,蘭州 730070)
在現(xiàn)實中,語音信號都是含有噪聲的,這阻礙了語音的可懂性,甚至有時嚴重影響了信號的質(zhì)量,因此解決噪聲污染就非常有必要。語音增強是解決噪聲污染的一種有效方法,它的思想是從帶噪語音信號中提取盡可能純凈的原始語音。
就目前來說,語音增強的方法可分成兩大類:時域方法,如子空間法等;頻域方法,如譜減法和維納濾波法等。這兩種方法各有優(yōu)缺點。子空間的方法提供了一種在語音信號失真和殘留噪聲之間進行控制的機制,但是計算量較大,但頻域方法的計算量較小,但是在信號失真和殘留噪聲的控制上還沒有一個理論機制[1-2]。
在文獻[3]中, 作者構(gòu)建了一個在時域里進行語音增強的新途徑——子空間的框架理論。 然而,最初的工作只是對白噪聲而言的, 對于有色噪聲,作者建議采用附加的預處理,使有色噪聲白化。在文獻[4]中,作者雖然將這種方法擴展到有色噪聲的處理中,但采用了各種假定,因此不是最優(yōu)的方法。
本文研究的是在白噪聲和粉紅色噪聲下,利用對語音信號和噪聲協(xié)方差矩陣同時對角變換的條件下的一種語音增強算法。粉紅噪音是自然界最常見的噪音,它的頻率分量功率主要分布在中低頻段,從波形角度看,粉紅噪音是分形的,在一定的范圍內(nèi)與音頻數(shù)據(jù)具有相同或類似的能量;從功率或能量的角度來看,粉紅噪音的能量從低頻向高頻不斷衰減。利用粉紅噪音可以模擬出比如瀑布或者下雨的聲音。
基于信號子空間方法的基本思想是將帶噪語音信號投影到兩個子空間中,一個是語音信號子空間,另一個是噪聲子空間。通過去除掉噪聲子空間,由語音信號子空間可以重構(gòu)語音信號。將空間分解為兩個子空間的方法,可以采用奇異值分解方法,或是特征值分解方法[5]。
在線性信號模型中,假定純凈的語音信號S為:
其中,RΨ為矢量Ψ的協(xié)方差矩陣,Rs的秩為N。
在以上的信號模型中,假定噪聲為加性的,且與語音信號相互獨立,因此,帶噪語音信號可表示為:
其中,εs和εd分別表示語音信號的失真和殘留噪聲。相應的能量分別為:
因此,求解下面時域約束條件的方程,就可以得到優(yōu)化的線性估計器。
在式(7)條件下:
該方法以頻域約束估計器(SDC)為基礎,要求在把噪聲約束在一門限值下的同時,盡量減少語音信號的失真[7],其核心思想是將信號幀分為語音幀和噪聲幀兩類。若為語音幀,就采用的特征向量作為信號空間的基向量求解 SDC 估計器;否則,采用的特征向量作為信號空間的基向量求解 SDC 估計器[8]。
算法流程如下:
步驟1:對帶噪語音幀采用下式進行分類
其中,SNR為幀內(nèi)信噪比,Ry為帶噪語音信號的協(xié)方差矩陣,Rd為噪聲的協(xié)方差矩陣。若式(10)成立,則判定為語音幀,否則為噪聲幀。
步驟2:若為語音幀,則可以將問題轉(zhuǎn)化為求解約束方程
步驟3:若為噪聲幀,則可以將問題轉(zhuǎn)化為求解約束方程
實驗所采用的信號均是采樣率為8kHz,采樣大小16位的PCM量化的單聲道音頻信號。語音增強算法仿真圖中的橫坐標為時間(單位:s),縱坐標為幅度。仿真實驗是在MATLAB R2007a軟件中進行的。
當帶噪語音信噪比為-13.597 6 dB時,仿真結(jié)果如圖1所示。
對帶有粉紅噪聲的語音信號用本文方法進行處理,得到如下的結(jié)果:原始語音信號的信噪比為-13.597 6,經(jīng)過處理后的語音信號的信噪比為-9.658 9,由此可以看出, 帶有粉紅噪聲的語音信號,經(jīng)過處理后,在信噪比上得到明顯的提高。
圖1 SNR=-13.597 6 dB的粉紅噪聲環(huán)境下的語音增強算法仿真圖
根據(jù)以上的討論和分析,給出了一種對混有粉紅噪聲的信號子空間的語音增強方法,實際上它對加性白噪聲也適用。該方法的核心思想就是將帶噪語音信號映射到信號子空間和噪聲子空間中,并在信號子空間中估計原始信號。它與傳統(tǒng)的語音增強算法相比較,語音失真較小,增強效果較好,能夠在極大限度地抑制背景噪聲的同時減少頻譜失真和殘余噪聲。
由于該方法在運用于語音信號處理中還是一個較新的研究途徑,盡管能取得較好的效果,但在含音樂噪聲的語音信號的增強效果并不理想,因此這將有待于今后進一步的討論研究。
[1] M Dendrinos,S Bakamidis,G Garayannis.Speech enhancement from noise:A regenerative approach[J].Speech Communication,1991,10(2):45-57.
[2] Jensen S H,Hansenn P C,Hansen S D,Sorensen J A.Reduction of broad-band noise in speech by truncated QSVD [J].IEEE Trans on Speech Audio Processing,1995,3(6):439-448.
[3] Yariv Ephraim,Harry L Van Trees.A Signal Subspace Approach for Speech Enhancement[J].IEEE Transactions on Speech and Audio Processing,1995,3(4):251-266.
[4] Y Ephraim,D Malah.Speech enhancement using a minimum mean-square error shorttime spectral amplitude estimator[J].IEEE Trans Acoust Speech Signal Processi ng,1984,32(4):1109-1121.
[5] 崔秀美.基于子空間語音增強方法的研究[J].數(shù)理醫(yī)藥學,2008,21(3):265-267.
[6] Mittal U,Phamdo N.Signal/noise KLT approach for enhancing speech degraded by colored noise [J].IEEE Trans on Speech and Audio Processing,2000,8(3):159-167.
[7] M.Hawkes,A.Nehorai,P.Stoica.Performance breakdown of subspace-based method: Prediction and cure[J]. Proc. IEEE Int.on Acousts,Speech,Signal Processing,2001,6: 4005-4008.
[8] 牛銅.基于子空間的語音增強算法研究[D].鄭州:解放軍信息工程大學,2009:7-15.