王賢波 李盛 張緩緩
摘要:在語(yǔ)音通信中,常常會(huì)受到外界環(huán)境干擾,傳統(tǒng)的譜減法雖可抑制噪聲,但信號(hào)處理的過(guò)程中伴隨著音頻噪聲。背景很強(qiáng)的機(jī)械噪聲采用譜減法會(huì)產(chǎn)生很強(qiáng)的音樂(lè)噪聲。文章基于DSP實(shí)現(xiàn)的多頻段譜減法,結(jié)果表明,利用DSP實(shí)現(xiàn)多頻段譜減法的語(yǔ)音增強(qiáng)系統(tǒng)能夠減少背景很強(qiáng)的機(jī)械噪聲產(chǎn)生的音樂(lè)噪聲。
關(guān)鍵詞:語(yǔ)音增強(qiáng);多頻段;譜減法;DSP
隨著數(shù)字信號(hào)處理的發(fā)展,語(yǔ)音信號(hào)處理領(lǐng)域越來(lái)越受到關(guān)注,語(yǔ)音信號(hào)處理是實(shí)現(xiàn)人機(jī)交互和通信技術(shù)的必要方法[1]。但語(yǔ)音通信過(guò)程中噪聲的污染是不可避免的,尤其是在一些強(qiáng)的噪聲環(huán)境中,語(yǔ)音識(shí)別系統(tǒng)的識(shí)別率將會(huì)受到嚴(yán)重影響。譜減法是語(yǔ)音增強(qiáng)去噪的主要方法之一,它是通過(guò)從含噪的功率譜中直接減去噪聲功率譜,來(lái)估計(jì)純凈功率譜。譜減法雖然可以成功地衰減原始帶噪語(yǔ)音中的噪聲,但由于噪聲是有色的,并且不會(huì)在整個(gè)頻譜均勻地影響語(yǔ)音信號(hào),因此,帶來(lái)“音樂(lè)噪聲”,且有可能聽(tīng)者會(huì)發(fā)現(xiàn)處理后的比原始信號(hào)中的噪聲更為清晰[2]。因此,這里提出了基于多頻帶的譜減法,譜減法及其改進(jìn)算法是一種基于短時(shí)譜估計(jì)的語(yǔ)音增強(qiáng)算法,它的運(yùn)算量相對(duì)較小,容易實(shí)時(shí)實(shí)現(xiàn),而且增強(qiáng)的效果明顯,是最常用的語(yǔ)音增強(qiáng)算法。本文采用TMS320VC5509 DSP和TLV320AIC23組成實(shí)時(shí)系統(tǒng),實(shí)時(shí)實(shí)現(xiàn)了多頻段譜減法的語(yǔ)音增強(qiáng)。
1 多頻帶譜減法
譜減法的原理是基于假設(shè)信號(hào)中附加性噪聲是固定的。令y(n)是嘈雜的語(yǔ)音信號(hào),則它是由純凈的語(yǔ)音信號(hào)x(n)和噪聲信號(hào)d(n)的相加。
即:y(n)=x(n)+d(n)(1)
大多數(shù)的減法型算法有不同的變化,允許靈活的光譜減法的變化。Berouti提出的廣義譜減法方案如下:當(dāng)α>1是超減法因子[3],這是由于信噪比的作用。β(0<β<1)則是光頻譜段,y是指數(shù)取決于過(guò)度清晰度。取γ=2,β=0.002。多頻段譜減法是將帶噪語(yǔ)音、估計(jì)的噪聲信號(hào)按頻率劃分Ⅳ個(gè)互不相交的頻帶,然后根據(jù)每個(gè)頻帶內(nèi)帶噪語(yǔ)音與估計(jì)噪聲信號(hào)的信噪比,來(lái)確定該頻帶噪聲的譜減參數(shù)[4-5]。語(yǔ)音頻譜被劃分為N個(gè)無(wú)重疊帶,而譜減法在每個(gè)頻帶中獨(dú)立執(zhí)行。因此,第i波段的清潔語(yǔ)音頻譜的估計(jì)是:
因此,多頻段譜減法的系統(tǒng)結(jié)構(gòu)框如圖1所示。
2 多頻段譜減法的DSP實(shí)現(xiàn)
本文采用TMS320VC559 DSP和TLV320AIC23 Codec組成實(shí)時(shí)系統(tǒng),實(shí)現(xiàn)了多頻段譜減法的語(yǔ)音增強(qiáng)系統(tǒng),系統(tǒng)的結(jié)構(gòu)框如圖2所示。
本系統(tǒng)所述硬件系統(tǒng)有:帶噪音音頻輸入,增強(qiáng)后音頻輸出,電源模塊,TLV320AI23,TMS320VC5509芯片,利用TLV320AIC23完成信號(hào)的A/D,D/A轉(zhuǎn)換,并利用TMS320VC5509中的多通道緩沖串口MCBSPI與DMA通道配合時(shí)鐘工作,從而完成TLV320AI23與TMS320VC5509串口收發(fā)數(shù)據(jù)的同步。同時(shí)再利用TMS320VC5509進(jìn)行對(duì)TLV320AI23端口的配置。系統(tǒng)使用配套套電源模塊對(duì)整個(gè)系統(tǒng)供電,簡(jiǎn)化了電源模塊的設(shè)計(jì)。電源模塊帶有電壓監(jiān)控芯片,當(dāng)供電不足時(shí)可自動(dòng)進(jìn)行操作,使系統(tǒng)能夠應(yīng)對(duì)各種突發(fā)事件。
3 系統(tǒng)的軟件設(shè)計(jì)
在本系統(tǒng)中,語(yǔ)音是按Bark頻帶劃分5個(gè)頻段(60~300 Hz,300~1 kHz,1~2 kHz,2-3kHz,3~5 kHz)。然后根據(jù)譜減參數(shù)的確定方法,逐幀逐頻帶進(jìn)行參數(shù)確定和譜減,最后結(jié)合含噪語(yǔ)音的相位,得到輸出語(yǔ)音。軟件算法框如圖3所示。
4 實(shí)驗(yàn)結(jié)果及分析
實(shí)驗(yàn)所用的純潔語(yǔ)音信號(hào)來(lái)自普通話訓(xùn)練學(xué)習(xí)庫(kù),噪聲取自機(jī)械噪聲,含噪語(yǔ)音信號(hào)采樣頻率均為16 kHz,程序中窗口選取漢明窗,每幀取512個(gè)點(diǎn),機(jī)械背景噪聲的仿真,以及DSP多頻段譜減法系統(tǒng)處理后刻錄語(yǔ)音的波形如圖4-5所示。
通過(guò)對(duì)比機(jī)械背景噪聲下多頻帶MATLAB語(yǔ)音信號(hào)的仿真圖和DSP多頻帶增強(qiáng)系統(tǒng)處理后波形,發(fā)現(xiàn)波形基本一致,采用主觀評(píng)價(jià)方法,將刻錄的DSP多帶增強(qiáng)系統(tǒng)處理后的波形,播放給聽(tīng)眾,并讓聽(tīng)眾復(fù)述播放的內(nèi)容,以聽(tīng)眾復(fù)述的字的個(gè)數(shù)統(tǒng)計(jì),發(fā)現(xiàn)DSP多頻帶系統(tǒng)處理后聽(tīng)眾的復(fù)述正確率達(dá)到90.93%。表明DSP多頻段譜減法的語(yǔ)音增強(qiáng)系統(tǒng)能夠減少背景很強(qiáng)的機(jī)械噪聲產(chǎn)生的音樂(lè)噪聲。
[參考文獻(xiàn)]
[1]楊毅,李澤偉語(yǔ)音信號(hào)處理的實(shí)驗(yàn)的改革實(shí)踐[J].實(shí)驗(yàn)室研究與探索,2014 (4):123-126.
[2]王龍基于DSP的語(yǔ)音增強(qiáng)系統(tǒng)的研究與設(shè)計(jì)[D]上海:華東大學(xué),2011
[3]李圓,趙振東,楊超基于多帶譜相減的語(yǔ)音端點(diǎn)檢測(cè)算法[J].通信技術(shù),2007 (11):353-356
[4]BEROUTI M, SCHWARTZ R, MAKHOUL J.Enhancement of speech corrupted by acoustic noise[Cl.Washington: Acoustics, Speech,and Signal Processing IEEE International Conference on ICASSP. IEEE Xplore, 1979: 208-211[5]SHENG L, MING N, JIANQI W,et al.Enhancement of non-air con-duct speech based on muki-band spectral subtraction method[C].Washington: Processing IEEE International Conference on Image and Signal Processing, 2008: 338-341