文昊翔,樂彥杰
(1.韶關(guān)學(xué)院 物理與機(jī)電工程學(xué)院,廣東韶關(guān)512005;2.國網(wǎng)浙江省電力公司舟山供電公司,浙江 舟山316021)
針對回聲消除應(yīng)用的自適應(yīng)算法評價(jià)標(biāo)準(zhǔn)研究
文昊翔1,樂彥杰2
(1.韶關(guān)學(xué)院 物理與機(jī)電工程學(xué)院,廣東韶關(guān)512005;2.國網(wǎng)浙江省電力公司舟山供電公司,浙江 舟山316021)
摘要:為確定一種較優(yōu)的自適應(yīng)算法評價(jià)標(biāo)準(zhǔn),以回聲消除應(yīng)用為背景,對殘余噪聲(RN)、回聲返回?fù)p耗(ERL)與失調(diào)(MIS)3種評價(jià)標(biāo)準(zhǔn)進(jìn)行比較分析.指出RN、ERL只考慮殘余噪聲功率,忽略了自適應(yīng)算法的辨識精度,當(dāng)殘余噪聲存在頻域起伏等缺陷時,RN、ERL無法反映該缺陷,并以子帶分解算法為例對各評價(jià)標(biāo)準(zhǔn)進(jìn)行系統(tǒng)仿真.結(jié)果表明失調(diào)可有效反映子帶分解算法辨識精度低的缺陷.最后提出與RN、ERL相比較,失調(diào)應(yīng)為更嚴(yán)謹(jǐn)?shù)脑u價(jià)標(biāo)準(zhǔn).
關(guān)鍵詞:自適應(yīng)算法;評價(jià)標(biāo)準(zhǔn);殘余噪聲;回聲返回?fù)p耗;失調(diào)
通信回聲現(xiàn)象嚴(yán)重影響通話質(zhì)量,應(yīng)在通信設(shè)備中內(nèi)置回聲消除(Echo Cance11ation,EC)系統(tǒng)以抑制回聲能量,提高通信質(zhì)量[1].
通信回聲的產(chǎn)生和消除原理為∶遠(yuǎn)端語音信號X(k)與回聲路徑Wo卷積,卷積結(jié)果受近端噪聲v(k)干擾,形成回聲信號d(k)[2].為消除d(k),用濾波器W(k).通過自適應(yīng)算法辨識回聲路徑Wo,以X(k)與W(k)的卷積結(jié)果作為d(k)的估計(jì)值,兩者相減以抑制回聲能量[3].
EC系統(tǒng)的核心是自適應(yīng)算法.EC系統(tǒng)的實(shí)現(xiàn)可歸納為自適應(yīng)理論中的系統(tǒng)辨識問題.為提高EC系統(tǒng)的效率,對自適應(yīng)算法進(jìn)行改進(jìn)后,必然要對新算法的性能,如收斂速度與辨識精度進(jìn)行評價(jià).
現(xiàn)有的評價(jià)標(biāo)準(zhǔn)主要有殘余噪聲(Residua1Noise,RN)[4]、回聲返回?fù)p耗(Echo Return Loss,ERL)[5]與失調(diào)(Misa1ignment,MIS)[6]等.利用不同的標(biāo)準(zhǔn)對自適應(yīng)算法進(jìn)行評價(jià)的結(jié)果往往存在矛盾之處,多種標(biāo)準(zhǔn)并存的現(xiàn)狀為自適應(yīng)算法的評價(jià)引入極大的混亂.
以歸一化子帶自適應(yīng)算法(Norma1ized subband adaPtive fi1ters,NSAF)為例,討論RN、ERL與失調(diào)3種評價(jià)標(biāo)準(zhǔn)[7].NSAF算法在嚴(yán)格抽取條件下,其殘余噪聲在頻域?qū)⒊霈F(xiàn)較大的起伏;從人聽覺角度,頻域起伏的噪聲即為令人生厭的音樂噪聲[8];從自適應(yīng)算法角度,則表現(xiàn)為濾波器未能精確辨識回聲路徑.
通過理論研究與實(shí)驗(yàn)仿真,得出結(jié)論∶RN,ERL只以EC系統(tǒng)最后的殘余噪聲輸出功率作為評價(jià)標(biāo)準(zhǔn),忽略了自適應(yīng)濾波器的辨識精度,未能發(fā)現(xiàn)NSAF算法導(dǎo)致音樂噪聲的嚴(yán)重缺陷.與RN、ERL相比較,失調(diào)應(yīng)為更嚴(yán)格的自適應(yīng)算法評價(jià)指標(biāo).
自適應(yīng)算法的評價(jià)標(biāo)準(zhǔn)主要有RN,ERL與失調(diào).以dB為單位,3者分別定義如下∶
式(1)~(3)中的k表示迭代次數(shù).以k為自變量,繪制評價(jià)標(biāo)準(zhǔn)隨迭代次數(shù)的變化關(guān)系,可得自適應(yīng)算法的收斂曲線.因殘余噪聲包含大量隨機(jī)噪聲,使得根據(jù)RN,ERL繪制的收斂曲線受隨機(jī)噪聲干擾,難以分辨自適應(yīng)算法的收斂速度與穩(wěn)態(tài)失調(diào).因此需使e2(k)、d2(k)通過一個低通濾波器,濾除寬頻噪聲干擾,獲得e(k)、d(k)的功率估計(jì)最后式(1)、(2)分別修正為∶
用于獲得功率估計(jì)的低通濾波器,若截止頻率設(shè)置過高將導(dǎo)致無法有效濾除寬頻噪聲中的高頻分量;截止頻率設(shè)置過低將導(dǎo)致功率估計(jì)精度下降,不能靈敏反映功率變化.實(shí)際應(yīng)用中常用的功率估計(jì)低通濾波器有1/(0.99+0.01Z-1)與N點(diǎn)求平均(N為濾波器長度)[9].
失調(diào)曲線本身已足夠平滑,無需經(jīng)過低通濾波器處理.
以NSAF為例能清晰地反映RN,ERL、失調(diào)3種評價(jià)標(biāo)準(zhǔn)的優(yōu)劣,此處先簡要介紹NSAF算法.
NSAF的核心思想是利用子帶分解[9],通過濾波器組將輸入信號、期望信號在頻域進(jìn)行分割,形成子帶信號,然后自適應(yīng)算法在子帶進(jìn)行.最后子帶信號通過重構(gòu)濾波器組合成為期望信號的估計(jì)值.
子帶分解原理為[10]∶輸入信號先通過分解濾波器組Hi(Z)(0
理想的子帶分解濾波器組,是在頻域?qū)π盘栠M(jìn)行M等分.當(dāng)輸入信號為有色噪聲或強(qiáng)相關(guān)的語音信號時,每個子帶的信號頻譜比初始的全頻段信號更接近高斯白噪聲,因此理論上可提高自適應(yīng)算法收斂速度.
分解、重構(gòu)濾波器組的設(shè)計(jì)方法主要是先設(shè)計(jì)一個線性相位的低通原型濾波器.然后對原型濾波器進(jìn)行余弦調(diào)制,擴(kuò)展為分解、重構(gòu)濾波器組[11].
設(shè)原型濾波器沖激響應(yīng)序列為f(n)(0 當(dāng)M>2時,常用余弦調(diào)制設(shè)計(jì)濾波器組.記第i頻段的分解濾波器組沖激響應(yīng)序列為hi(n),重構(gòu)濾波器組為gi(n),則其計(jì)算公式如下[13]∶ 當(dāng)子帶個數(shù)與降采樣間隔相等時稱為嚴(yán)格抽?。–ritica1 SamP1ing).此時既可無失真地重構(gòu)輸入信號,且抽取后的信號與原輸入信號數(shù)據(jù)量相等,無信息冗余.本文僅針對嚴(yán)格抽取條件進(jìn)行研究. 將子帶分解與自適應(yīng)算法相結(jié)合,有NSAF算法提出.NSAF算法的原理見圖1.其系數(shù)更新方程為∶ 式(10)的μ為全局收斂步長,取值范圍為0<μ<2. 圖1 NSAF算法結(jié)構(gòu)圖 本節(jié)以Mat1ab對歸一化最小均方 (Norma1ized Least MeanSquare,NLMS)算法與NSAF算法(M=2、M=8)進(jìn)行仿真,比較RN、ERL、失調(diào)3種評價(jià)標(biāo)準(zhǔn)的有效性.NLMS算法的系數(shù)更新方程為∶ 式(11)的δ為正則化參數(shù),取δ=0;μN(yùn)為NLMS算法的收斂步長,NSAF與NLMS算法的收斂步長均設(shè)為μ=μN(yùn)=0.5. 對于NSAF算法,當(dāng)M=2、M=8時,原型濾波器沖激響應(yīng)序列分別為[0.009 387 15,-0.070 651 83, 0.069 428 27,0.489 980 8,0.489 980 8,0.069 428 27,-0.070 651 83,0.009 387 15][14]、[0,0,0,0,0,0.018 4, 0.032 9,0.051 3,0.070 4,0.085 4,0.094 0,0.097 9,0.099 6,0.099 6,0.097 9,0.094 0,0.085 4,0.070 4,0.051 3, 0.032 9,0.018 4,0,0,0,0,0][15]. EC系統(tǒng)參數(shù)設(shè)置如下∶回聲路徑Wo已知,長度為512.激勵信號X(k)為一段真實(shí)語音信號,采樣頻率8k Hz,平均功率(k)=0.565.X(k)與Wo的卷積作為回聲信號y(k),功率約為(k)=0.002 1,以高斯白噪聲模擬背景噪聲v(k),y(k)、v(k)信噪比為SNR=20 dB.各算法的濾波器長度均為N=512. 3.1算法殘余噪聲頻譜分析 子帶分解算法的主要缺陷是EC系統(tǒng)的殘余回聲存在令人生厭的音樂噪聲現(xiàn)象,嚴(yán)重影響降噪效果.因子帶分解算法存在明顯缺陷,在實(shí)現(xiàn)EC系統(tǒng)時,使用NLMS比使用子帶分解算法更普遍. 音樂噪聲產(chǎn)生的原因是信號在頻域存在起伏.對于子帶分解算法,輸入信號必須通過分解濾波器組Hi (Z)分為不同頻段的子帶信號.因?yàn)V波器組通帶與阻帶間不可避免存在過渡帶,兩個相鄰的濾波器,其過渡帶存在重疊部分,該重疊部分將導(dǎo)致輸入信號經(jīng)過分解、重構(gòu)后在頻域存在起伏.通過改進(jìn)濾波器組或原型濾波器的設(shè)計(jì)并不能避免該缺陷,改進(jìn)的唯一方法是減小子帶信號重采樣的間隔[16],但又將導(dǎo)致數(shù)據(jù)量與計(jì)算復(fù)雜度的大幅增加.3種算法收斂后殘余噪聲功率(k)的頻譜圖見圖2~圖4. 頻域起伏的峰谷數(shù)量與子帶分解數(shù)成正比.子帶分解數(shù)量越多,音樂噪聲特征越明顯.當(dāng)M=2時用戶已能覺察到音樂噪聲,但尚能忍受.當(dāng)M=8時受音樂噪聲干擾,通信已無法繼續(xù)進(jìn)行. 3.2評價(jià)標(biāo)準(zhǔn)研究 計(jì)算RN、ERL時使e2(k)、d2(k)通過1/(0.99+0.01Z-1)低通濾波器獲得功率估計(jì)σ2 e(k)、σ2 d(k).三種算法的RN、ERL、失調(diào)隨時間變化關(guān)系見圖5~圖7.為更清晰地顯示3種指標(biāo)的特點(diǎn),圖中的橫坐標(biāo)量程不一致.由3圖可得,根據(jù)不同標(biāo)準(zhǔn),各算法性能按優(yōu)劣排序并不一致. 以RN作為評價(jià)標(biāo)準(zhǔn)(見圖5),無論是收斂速度還是穩(wěn)態(tài)失調(diào),均有NSAF(M=8)優(yōu)于NSAF(M=2)優(yōu)于NLMS.以ERL為評價(jià)標(biāo)準(zhǔn)(見圖6),有NSAF(M=8)與NSAF(M=2)性能相似,二者優(yōu)于NLMS算法.以失調(diào)為標(biāo)準(zhǔn)(見圖7),則評價(jià)更為復(fù)雜,NSAF(M=8、M=2)前期收斂速度明顯快于NLMS,但收斂后NSAF的穩(wěn)態(tài)失調(diào)高于NLMS. 圖2 NLMS算法殘余噪聲頻譜圖 圖3 NSAF(M=2)算法殘余噪聲頻譜圖 圖4 NSAF(M=8)算法殘余噪聲頻譜圖 圖7 各算法失調(diào)對比圖 殘余噪聲在頻域存在起伏,其時域表現(xiàn)則為自適應(yīng)濾波器未能精確辨識回聲路徑.失調(diào)作為評價(jià)標(biāo)準(zhǔn),可靈敏地反映NSAF辨識精度低的缺陷,而RN、ERL僅以殘余噪聲輸出功率作為評價(jià)標(biāo)準(zhǔn),未能反映NSAF算法辨識精度低的缺陷. 綜合上述,與RN、ERL相比,失調(diào)應(yīng)為更嚴(yán)謹(jǐn)?shù)淖赃m應(yīng)算法評價(jià)標(biāo)準(zhǔn),原因有3個方面. (1)失調(diào)以濾波器與回聲路徑向量差的二次范數(shù)為評價(jià)標(biāo)準(zhǔn),因多點(diǎn)求和,無需引入低通濾波器,可避免由此額外引入的誤差. (2)因自適應(yīng)濾波器與回聲路徑誤差部分峰谷相互抵消,在濾波器尚未精確辨識系統(tǒng)前,誤差信號e(k)已先行收斂,圖5~7的橫坐標(biāo)充分表明該特點(diǎn).用于反映自適應(yīng)算法所處的收斂狀態(tài)時,RN、ERL并不是嚴(yán)謹(jǐn)?shù)脑u價(jià)標(biāo)準(zhǔn). (3)在自適應(yīng)算法辨識精度極低的條件下,算法仍可獲得較低的殘余噪聲功率.對于RN、ERL,低的殘余噪聲功率掩蓋了算法辨識精度低的現(xiàn)象,導(dǎo)致未能發(fā)現(xiàn)音樂噪聲等嚴(yán)重降低通信質(zhì)量的缺陷,而失調(diào)則能敏銳地捕捉到該缺陷. 使用失調(diào)作為自適應(yīng)算法評價(jià)標(biāo)準(zhǔn)的主要實(shí)現(xiàn)難點(diǎn)是需要獲得回聲路徑的先驗(yàn)信息,而在EC系統(tǒng)的實(shí)際應(yīng)用時,是無法獲得回聲路徑的.但在進(jìn)行算法仿真時,回聲路徑通常是已知的,此時可用失調(diào)作為標(biāo)準(zhǔn),更嚴(yán)格地評估算法的性能. 本文介紹3種自適應(yīng)算法的評價(jià)標(biāo)準(zhǔn)RN、ERL、失調(diào).并以NSAF算法與NLMS算法為例比較3種評價(jià)標(biāo)準(zhǔn).因RN、ERL只注重殘余噪聲功率,而低的殘余噪聲功率掩蓋自適應(yīng)濾波器辨識精度低的缺陷,導(dǎo)致RN、ERL無法發(fā)現(xiàn)音樂噪聲等嚴(yán)重影響通信質(zhì)量的現(xiàn)象. 失調(diào)的計(jì)算方式為濾波器向量與回聲路徑向量之差的二次范數(shù),以辨識精度作為評價(jià)指標(biāo),與RN、ERL相比,失調(diào)應(yīng)為更嚴(yán)謹(jǐn)?shù)淖赃m應(yīng)算法評價(jià)標(biāo)準(zhǔn). 參考文獻(xiàn): [1]文昊翔,陳隆道,蔡忠法.解相關(guān)仿射投影算法及應(yīng)用[J].浙江大學(xué)學(xué)報(bào)∶工學(xué)版,2014,48(1)∶136-140. [2]徐茂.基于IPNLMS算法的回聲抵消器的設(shè)計(jì)[J].電聲技術(shù),2014,38(6)∶35-43. [3]TogamiM,Kawaguchi Y.Simu1taneous OPtimization of Acoustic Echo Reduction,SPeech Dereverberation,and Noise Reduction againstMutua1Interference[J].IEEE Transactions on Audio,SPeech and Language Processing,2014,22(11)∶1612-1623. [4]Shimauchi S,Ohmuro H.Accurate adaPtive fi1tering in square-root Hann windowed short-time fourier transform domain[C]. 2014 IEEE Internationa1Conference on Acoustic,SPeech and Signa1Processing,2014∶1305-1309. [5]Contan C,ToPa M.Variab1e steP size adaPtive non1inear echo cance11er[C].2012 10th Internationa1SymPosium on E1ectronics and Te1ecommunications,2012∶267-270. [6]Bekrani M,Khong A W H,Lotfizad M.A 1inear neura1 network-based aPProach to stereoPhonic acoustic echo cance11ation[J]. IEEE Transactions on Audio,SPeech and Language Processing,2011,19(6)∶1743-1753. [7]倪錦根,商慧亮,李鋒.歸一化子帶自適應(yīng)濾波器步長控制[J].電子與信息學(xué)報(bào),2009,31(11)∶2606-2609. [8]Gi11oire A.ExPerimentswith sub-band acoustic echo cance11ers for te1econferencing[C].1987 IEEE Internationa1Conference on Acoustic,SPeech and Signa1Processing,1987∶2141-2144. [9]Nesta F,Wada T S,Biing-Hwang J.Batch-on1ine Semi-B1ind source seParation aPP1ied to mu1ti-channe1 acoustic echo cance11ation[J].IEEE Transactions on Audio,SPeech and Language Processing,2011,19(3)∶583-599. [10]王俠,梁瑞宇,王青云,等.應(yīng)用于助聽器反饋抑制系統(tǒng)的變步長歸一化子帶自適應(yīng)濾波算法[J].東南大學(xué)學(xué)報(bào):自然科學(xué)版, 2015,45(3)∶417-422. [11]趙越,越曉軍,董婧.基于子帶分解的自適應(yīng)回聲抵消算法[J].吉林大學(xué)學(xué)報(bào)∶工學(xué)報(bào),2009,39(1)∶198-203. [12]譚方青,張?zhí)祢U,黃烈超,等.基于QPSO的兩通道正交鏡像濾波器組的優(yōu)化設(shè)計(jì)[J].計(jì)算機(jī)應(yīng)用研究,2011,28(9)∶3432-3442. [13]趙艷,羅勝恩,萬堅(jiān).余弦調(diào)制子帶濾波器組迭代設(shè)計(jì)的改進(jìn)算法[J].數(shù)據(jù)采集與處理,2013,28(1)∶110-116. [14]Johnston J.A fi1ter fami1y designed foruse in quadraturemirror fi1ter banks[C].1980 IEEE Internationa1Conferenceon Acoustic, SPeech and Signa1Processing,1980∶291-294. [15]Yuan-Pei L,Vaidyanathan P P.Linear Phase cosinemodu1ated maxima11y decimated fi1ter banks with Perfect reconstruction [J].IEEE Transactions on Signa1Processing,1995,42(11)∶2525-2539. (責(zé)任編輯∶歐愷) 中圖分類號:TM714 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-5348(2015)10-0021-05 [收稿日期]2015-09-07 [基金項(xiàng)目]廣東省教育廳科技創(chuàng)新項(xiàng)目(2013KJCX0169);廣東省自然科學(xué)基金項(xiàng)目(2015A030310510);韶關(guān)學(xué)院科研項(xiàng)目(314-140682). [作者簡介]文昊翔(1984-),男,廣東韶關(guān)人,韶關(guān)學(xué)院物理與機(jī)電工程學(xué)院講師,博士;研究方向∶自適應(yīng)算法,有源噪聲控制. Research on AdaPtlve A lgorlthm Evaluatlon Standards for Echo Cancellatlon WEN Hao-xiang1,YUE Yan-jie2 Abstract∶Three eva1uation standards for adaPtive a1gorithm,Residua1Noise(RN),Echo Return Loss(ERL)and Misa1ignment(MIS)were studied theoretica11y to ascertain a Positive one.RN and ERL were found to be disadvantageous since they on1y focused on the residua1 noise Power instead of identification Precision. Consequent1y,they cou1d not ref1ect the serious defect of sPectra1 Peaks concea1ed in residua1 echo.Then various standards were simu1ated with sub-band adaPtive a1gorithm.The simu1ation resu1t demonstrated that MIS cou1d effective1y revea1 the 1ow identification Precision of sub-band adaPtive a1gorithm.ComPared with RN and ERL,MISwas found to be a rigorous eva1uation standard. Key words∶adaPtive a1gorithm;eva1uation standard;residua1noise;echo return 1oss;misa1ignment3 實(shí)驗(yàn)仿真與理論分析
4 結(jié)語
(1.Co11ege of Physics and Mechanica1&E1ectrica1Engineering,Shaoguan University,Shaoguan 512005, Guangdong;2.State Grid Zhoushan Power SuPP1y ComPany,Zhoushan 316021,Zhejiang,China)