田玉靜 左紅偉 王 超
語聲是人類通過發(fā)聲器官發(fā)出[1]、具有特定意義、用來進(jìn)行信息交換的聲音,是人類相互溝通最重要的工具。信息交換往往需要遠(yuǎn)距離傳輸,信號在傳輸過程中信道彌散造成碼間串?dāng)_(Inter-symbol Interference, ISI),同時(shí)受到噪聲污染。自適應(yīng)均衡技術(shù)[2]能消除ISI,進(jìn)行噪聲控制,有效提高信號質(zhì)量,但在語聲通信系統(tǒng)應(yīng)用中要預(yù)先得到期望信號,對系統(tǒng)進(jìn)行訓(xùn)練,這是不切實(shí)際的,所以不得不采用盲均衡[3]。自適應(yīng)盲均衡算法能在信道畸變相當(dāng)嚴(yán)重的條件下不借助訓(xùn)練信號序列,僅根據(jù)信道輸出信號序列統(tǒng)計(jì)特性來獲得信道響應(yīng)信息,補(bǔ)償期望響應(yīng)序列信息,通過自適應(yīng)均衡算法消除ISI 和噪聲。自適應(yīng)盲均衡技術(shù)研究在語聲通信、數(shù)字通信、無線通信系統(tǒng)中具有深遠(yuǎn)意義。
自適應(yīng)盲均衡算法能有效消除ISI 補(bǔ)償信號畸變,但其噪聲控制效果不佳。小波包分析能利用聽覺掩蔽特性,降低噪聲,擬合聽覺感知,恢復(fù)語聲細(xì)節(jié)信息,有效提高語聲通信保真度。本文將自適應(yīng)盲均衡技術(shù)引入語聲通信系統(tǒng)與小波包掩蔽閾值降噪算法聯(lián)合使用,形成了一種語聲通信基帶噪聲控制新方法。文中分析了兩種自適應(yīng)盲均衡算法。常數(shù)模(Constant modulus algorithm, CMA)盲均衡算法算法簡單、收斂性好,得到了廣泛應(yīng)用,但其在干擾噪聲嚴(yán)重的傳輸情況下均衡信號失真嚴(yán)重。改進(jìn)算法降低了穩(wěn)態(tài)誤差,在最小化均方誤差(Mean squared error, MSE)下,獲得ISI 與噪聲抑制間的最佳平衡;在強(qiáng)干擾噪聲下,有效提高誤碼率,減少信號失真,算法的有效性和穩(wěn)健性都有所增強(qiáng)。仿真研究表明,在語聲信號ISI和畸變嚴(yán)重情況下,該方法在白噪聲及有色噪聲的不同噪聲環(huán)境中都具有穩(wěn)定的降噪能力,消噪同時(shí)可獲得漢語普通話良好的聽覺效果。
自適應(yīng)盲均衡濾波器結(jié)構(gòu)見圖1虛線框部分。自適應(yīng)盲均衡算法[4]如下:設(shè)an為輸入序列,信道系統(tǒng)函數(shù)為h(n),均衡器系數(shù)初始估計(jì)值為c(n),假定信道和均衡器脈沖響應(yīng)的卷積分解為
其中,hISI(n)是產(chǎn)生ISI的分量,均衡器輸出為
其中,hISI(n)?an是ISI 殘留;c(n)?v(n)為附加噪聲,通過運(yùn)用中心限定定理,卷積噪聲(n)可用高斯白噪聲模擬,且an與(n)是統(tǒng)計(jì)獨(dú)立的,則an的最小MSE估計(jì)z(n)為
圖1 語聲通信系統(tǒng)降噪新方法Fig.1 A new method of noise reduction in speech communication system
由于an是非高斯分布,?y(n)為非線性函數(shù),則先驗(yàn)誤差為
式(5)為均衡輸出。由此導(dǎo)出盲均衡的先驗(yàn)隨機(jī)梯度算法:其中,μ為自適應(yīng)步長。根據(jù)MSE 原則或強(qiáng)制零原則,算法性能取決于c(n)接近最佳值c0的程度。如果c(0)近似于c0,ISI 就會大大減少,即眼圖是張開的,判決設(shè)備會以低錯誤率得出正確判別,算法會收斂于c0;相反若c(0)離c0較遠(yuǎn),碼眼閉合,誤差曲面是多模的。式(4)~式(6)就是最小均方(Least mean square, LMS)型盲均衡算法。下面從成本函數(shù)重新推導(dǎo)式(6),得到
其中:
求非線性函數(shù)φ的導(dǎo)數(shù):
φ的非線性導(dǎo)致成本函數(shù)對于(n)和an的高階統(tǒng)計(jì)量依賴性。式(7)不需要輸入序列an,反映當(dāng)前ISI 的大小,為均衡參數(shù)的二次非凸函數(shù),其最小值對應(yīng)ISI 或MSE 的最小值。非線性函數(shù)的不同選擇就會產(chǎn)生各種盲均衡算法。
正交振幅調(diào)制(Quadrature amplitude modulation, QAM)信號星座圖算法(Godard算法)[5]
其中,p為正整數(shù);Rp為正實(shí)常數(shù),
其中,Rp即為p階散射。p=2時(shí),Godard算法即轉(zhuǎn)變?yōu)镃MA算法[6],成本函數(shù)為
式(12)取最小值時(shí)的系數(shù)值接近MSE最小值。
CMA 自適應(yīng)算法簡單,能獨(dú)立于載波恢復(fù)系統(tǒng)與其同時(shí)運(yùn)行,其性能依靠輸入信號的二階統(tǒng)計(jì)量平穩(wěn)度。當(dāng)存在信道噪聲v(n)時(shí),理想均衡不可能實(shí)現(xiàn),通過研究高階統(tǒng)計(jì)量,致力于尋求在最小化MSE 下,獲得ISI 與噪聲抑制間的最佳平衡。改進(jìn)的盲均衡自適應(yīng)算法[7]如下:
其中,TB為字符時(shí)長,當(dāng)t=nTB/2時(shí),其離散信號x(n)為
其中,hr(n)為等價(jià)離散沖擊響應(yīng),v(n)為等價(jià)高斯白噪聲,定義(M+L-1)×M階信道均衡輸出為
其中,cek=c2k,c0k=c2k+1,xe(n)=x(2n),x0(n)=x(2n+1)。
從發(fā)送字符an,到輸出?y(n)的復(fù)合脈沖響應(yīng)(n)的時(shí)域表達(dá)式為
定義信道矩陣為He, 子均衡矢量?[Ce0Ce1···CeM?1]T,相應(yīng)的矩陣為H0和C0;利用矩陣形式表達(dá)式(21)的卷積,有=Hc,其中。若無噪聲v(n)且滿足δn0=HC?[0···010···0]T, 系統(tǒng)就會免于ISI,實(shí)現(xiàn)理想均衡。當(dāng)信道噪聲v(n)存在,延遲n0滿足0 ≤n0≤M+L-1,最小化數(shù)據(jù)字符誤差率見式(22):
定義an?[anan?1···an?(M+L?1)]T,V(n)=[v(n-1)···v(n-2L+2)]T均衡輸出可得
差錯率e(n)的均方值為
用線性MSE估計(jì),推導(dǎo)出相對于?C的最小化MSE:
通過對式(26)矩陣對角元素求最小值,可得到最佳值。
自適應(yīng)盲均衡算法能有效去除語聲傳輸系統(tǒng)的ISI,但輸出信號對語聲細(xì)節(jié)信息處理欠佳,殘留噪聲比較嚴(yán)重。為了獲得更好的語聲通信效果,實(shí)驗(yàn)對盲均衡濾波輸出的基帶語聲信號做二次增強(qiáng)處理,進(jìn)一步消除均衡濾波增強(qiáng)語聲信號中的殘余噪聲。
小波分析算法簡單,其能利用人耳聽覺掩蔽特性擬合聲道發(fā)聲[8],選其作為語聲增強(qiáng)二級處理算法,詳細(xì)算法見參考文獻(xiàn)[9-10]。簡述算法如下:將含噪信號小波包五級分解,得到二尺度方程,推廣二尺度方程,得到前后兩個(gè)尺度之間的子波系數(shù)關(guān)系,見式(27):
含噪語聲經(jīng)小波包分解化為
根據(jù)人耳聽覺感知特性[11],對結(jié)點(diǎn)劃分不同Bark子帶,將臨界帶中每層小波變換后的系數(shù)由小到大排列,構(gòu)成向量P,求各子帶風(fēng)險(xiǎn)序列,找到風(fēng)險(xiǎn)最小值:
計(jì)算風(fēng)險(xiǎn)向量R= [γ1,γ2,··· ,γN],以R元素中最小作為風(fēng)險(xiǎn)值求出對應(yīng)的Pi。
估計(jì)子代噪聲的方差δ2n:
其中,di為子代分解細(xì)節(jié)信號,=mean(di)。
計(jì)算每個(gè)小波包樹終端結(jié)點(diǎn)k處的噪聲標(biāo)準(zhǔn)差σ2nk:
其中,[MAD]k,j是小波包樹終端結(jié)點(diǎn)k處在尺度j上小波系數(shù)中值絕對值。
計(jì)算閾值T:
其中,γmin為γi的最小值。
通過子代噪聲方差估計(jì),設(shè)置參數(shù)λ,實(shí)時(shí)跟蹤各尺度噪聲水平,自適應(yīng)調(diào)整閾值T,重構(gòu)各尺度的剩余系數(shù),經(jīng)小波反變換重建信號,盡可能在抑制殘留噪聲的同時(shí),保留語聲高頻信號和弱特征分量,減小語聲失真。
語聲通信的信息處理速度日益提高,碼速率越高,ISI問題越嚴(yán)重,加之信道干擾的突變隨機(jī)性,常規(guī)增強(qiáng)算法已無力處理復(fù)雜干擾。本文引入了自適應(yīng)盲均衡技術(shù)來消除ISI 和信號畸變,考慮到自適應(yīng)盲均衡技術(shù)在噪聲控制方面能力有限,將自適應(yīng)盲均衡技術(shù)與小波包掩蔽閾值降噪算法聯(lián)合使用,形成一種語聲通信系統(tǒng)基帶消噪新方法,該方法的完整系統(tǒng)模型見圖1。傳輸函數(shù)模擬信道,混入加性噪聲v(n),混噪信號通過自適應(yīng)盲均衡濾波,去除ISI 和畸變,過濾部分噪聲,再用小波包聽覺掩蔽閾值做二次增強(qiáng)。純凈語聲信號選用16QAM調(diào)制[12](16QAM 每符號4 bit 信息,相同碼元速率下,QAM的傳輸效率高,在通信新技術(shù)中廣泛應(yīng)用)。通過提取信號二階及高階統(tǒng)計(jì)量多算法融合,接收端信號盲處理,實(shí)驗(yàn)驗(yàn)證算法可對語聲通信系統(tǒng)噪聲有效穩(wěn)健去除。
首先測試盲均衡算法的抗干擾能力。用16QAM 調(diào)制模塊建立仿真,仿真16QAM 數(shù)據(jù)傳輸系統(tǒng),模擬圖1中的自適應(yīng)盲均衡系統(tǒng),信道系統(tǒng)函數(shù)為H(Z)= 0.2+0.5Z?1+Z?2-0.1Z?3,信道背景噪聲為高斯白噪聲,輸入信噪比設(shè)定SNR=0 dB,均衡器M=8。
自適應(yīng)盲均衡算法收斂后星座圖對比見圖2。圖2(a)為盲均衡器輸入端接收到的信道噪聲附加信號的星座圖,很明顯ISI 和噪聲的復(fù)合影響使得信號質(zhì)量惡劣,幾乎無法檢測;圖2(b)為CMA自適應(yīng)算法下盲均衡輸出端的信號星座圖;圖2(c)為改進(jìn)自適應(yīng)算法下盲均衡輸出端的信號星座圖,對比可見采用改進(jìn)自適應(yīng)盲均衡算法有很強(qiáng)的去除ISI能力。
自適應(yīng)盲均衡技術(shù)對信道噪聲和大量ISI 都能有效抑制,算法收斂穩(wěn)定,對采樣相位不敏感,在嚴(yán)重噪聲干擾的情況下自適應(yīng)均衡性能良好。CMA算法迭代5000 至12000 次左右收斂,改進(jìn)算法迭代8000 至20000 次左右收斂,收斂速度取決于輸入信號的平穩(wěn)性。CMA算法均衡速度快,實(shí)現(xiàn)復(fù)雜度低,改進(jìn)算法復(fù)雜度稍高。仿真結(jié)果顯示,采用自適應(yīng)盲均衡技術(shù)可以降低均方誤差,使得星座圖變得清晰而緊湊,有效消除ISI,提高通信系統(tǒng)性能。由星座圖呈現(xiàn)效果可見改進(jìn)算法對ISI 的抑制能力更強(qiáng),工程實(shí)際應(yīng)用時(shí)可按需選擇。
圖2 自適應(yīng)盲均衡算法收斂后星座圖對比Fig.2 Comparison of constellations after convergence of adaptive blind equalization algorithm
利用如圖1所示的語聲消噪方法,進(jìn)行基帶語聲通信系統(tǒng)語聲消噪仿真研究。噪聲數(shù)據(jù)取自The Signal Processing Information Base (SPIB)數(shù)據(jù)庫,選取白噪聲(White Noise)、餐廳內(nèi)嘈雜噪聲(Speech Babble)、粉紅噪聲(Pink Noise)、工廠車間噪聲(Factory Floor Noise)、高頻信道噪聲(HF Channel Noise)。實(shí)驗(yàn)語聲來自LibriSpeech 學(xué)術(shù)語聲數(shù)據(jù)庫,播音員男聲標(biāo)準(zhǔn)普通話朗讀宋詞“赤壁懷古”語料,仿真實(shí)驗(yàn)語聲時(shí)長1.6 s。信號的采樣率為8 kHz,幀長L= 256 (32 ms)。自適應(yīng)盲均衡輸入端信噪比為0 dB、5 dB、10 dB、20 dB。
圖3為信道輸出混高斯白噪聲、自適應(yīng)盲均衡濾波輸入端信噪比均為0 dB 條件下,算法噪聲消除性能語聲波形對比圖。圖3(a)是純凈語聲信號波形圖;圖3(b)為混高斯白噪聲,混噪波形;圖3(c)為白噪聲下CMA盲均衡算法自適應(yīng)濾波輸出波形;圖3(d)為白噪聲下改進(jìn)盲均衡算法自適應(yīng)濾波輸出波形;圖3(e)是白噪聲下小波包二次增強(qiáng)輸出。
圖4為同一語聲信號混合噪聲換成餐廳內(nèi)嘈雜噪聲時(shí),算法噪聲消除性能語聲波形對比圖。圖4(a)是純凈語聲信號波形圖;圖4(b)為混Speech Babble 噪聲,混噪波形;圖4(c)為Speech Babble 噪聲下,CMA 盲均衡算法自適應(yīng)濾波輸出波形;圖4(d)為Speech Babble 噪聲下改進(jìn)盲均衡算法自適應(yīng)濾波輸出波形;圖4(e)是Speech Babble 噪聲下小波包二次增強(qiáng)輸出。
由波形圖可以直觀看出CMA 盲均衡算法在高斯白噪聲下性能尚可,但其在非高斯噪聲下,語聲波形失真嚴(yán)重。改進(jìn)盲均衡算法在高斯白噪聲及非高斯噪聲下,算法的有效性和穩(wěn)健性都有所增強(qiáng)。小波包二次增強(qiáng)能有效恢復(fù)語聲細(xì)節(jié)信息。
對仿真實(shí)驗(yàn)結(jié)果進(jìn)行量化客觀性能[13]評價(jià):
(1)分段信噪比(SNRseg)[14]:計(jì)算語聲信號每一幀信噪比,取其平均值,SNRseg越大,則消噪效果越好。定義形式為
其中,f(m,n)為純凈語聲信號幅值,f∧(m,n)為消噪后的信號幅值,m為幀號,N為幀長,m= 1,2,··· ,N,n= 0,1,2,··· ,N -1,M為總幀數(shù)。算法增強(qiáng)后的語聲SNRseg結(jié)果比較見表1。
圖3 混白噪聲輸入信噪比為0 dB 時(shí)算法噪聲消除語聲波形對比Fig.3 Comparison of speech waveforms when the input SNR of mixed White Noise is 0 dB
圖4 混Speech Babble 噪聲輸入信噪比為0 dB 時(shí)算法噪聲消除語聲波形對比Fig.4 Comparison of speech waveforms when the input SNR of mixed Speech Babble noise is 0 dB
(2)語聲質(zhì)量感知評估(Perceptual evaluation of speech quality, PESQ)[15]:采用ITU-TP.862 標(biāo)準(zhǔn),可評價(jià)降噪輸出語聲的聽覺效果。該分值為4.5~-0.5之間,得分越高則輸出語聲音質(zhì)越好。算法增強(qiáng)后的語聲PESQ得分結(jié)果比較見表2。
通過分段信噪比數(shù)值和算法增強(qiáng)后的語聲PESQ 分值,可以看出CMA 盲均衡算法濾波輸出殘留噪聲嚴(yán)重,聽覺效果差;改進(jìn)的盲均衡算法自適應(yīng)濾波輸出信噪比有所提高,但在人耳聽覺效果方面仍有待提高;通過小波包二次增強(qiáng),信噪比有效提升,語聲聽覺清晰度和可懂度進(jìn)一步改善,獲得良好的聽覺效果。將自適應(yīng)盲均衡技術(shù)引入語聲通信系統(tǒng)與小波包掩蔽閾值算法結(jié)合進(jìn)行噪聲控制,研究表明該方法在語聲信號ISI和畸變嚴(yán)重情況下,在白噪聲及有色噪聲的不同噪聲環(huán)境中都具有穩(wěn)定的降噪能力,消噪同時(shí)可獲得漢語普通話良好的聽覺效果。
表1 不同算法SNRseg 比較Table 1 SNRseg comparison of different algorithms(單位:dB)
表2 不同算法PESQ 比較Table 2 PESQ comparison of different algorithms
通信系統(tǒng)中信號通過傳輸,ISI 和信號畸變嚴(yán)重,自適應(yīng)盲均衡技術(shù)能有效去除ISI,提高通信系統(tǒng)性能。本文分析了兩種自適應(yīng)盲均衡算法:CMA盲均衡算法和改進(jìn)盲均衡算法,在語聲通信系統(tǒng)中引入自適應(yīng)盲均衡技術(shù)能有效對語聲信道失真進(jìn)行補(bǔ)償,減小ISI,由于自適應(yīng)盲均衡技術(shù)在語聲噪聲控制方面能力有限,本文將自適應(yīng)盲均衡技術(shù)與小波包掩蔽閾值降噪算法聯(lián)合使用,形成一種基帶語聲增強(qiáng)新方法。采用小波包掩蔽閾值聽覺擬合二次增強(qiáng),恢復(fù)語聲細(xì)節(jié)信息,有效提高語聲通信保真度。仿真研究證實(shí)該方法在語聲通信ISI和信號畸變嚴(yán)重情況下,在白噪聲和有色噪聲的不同噪聲環(huán)境中都具有穩(wěn)定的消噪能力。其在語聲通信、無線通信、數(shù)據(jù)通信等領(lǐng)域具有實(shí)際應(yīng)用價(jià)值。