李 娜 陸曉明 陳盛云
(昆明理工大學信息與自動化學院,昆明 650051)
19世紀70年代至今,通信領域發(fā)生了翻天覆地的變化.傳輸方式上由最初的無線電報發(fā)展到后來的電話網,再到如今的移動通信網絡;傳輸媒介由最初的無線電波,發(fā)展到同軸電纜,甚至光纖;交換技術也從電路交換的方式發(fā)展為現(xiàn)在的分組交換.人們在享受通信帶來的便捷生活時,也一直受到回聲現(xiàn)象的困擾,對于回聲消除的研究一直以來都是科學家和技術家們探討的課題.隨著無線電話的廣泛應用以及無線運營商之間的競爭,話音傳輸質量和客戶服務成為用戶評價運營商網絡的關鍵因素.因此看來,對回聲消除進行研究不僅具有理論意義,還能產生巨大的經濟效益.
在學術研究上,國內外很多大學和研究機構都致力于自適應算法和濾波器結構的研究,并取得了很多成果.其中子帶自適應濾波是當前研究的一個熱點[1-2].Hallack[3]等人驗證了子帶方法應用在回聲消除中較之全帶方法能減少計算量、提高收斂速率;向賽輝[4]等人基于組合濾波器提出的組合算法實現(xiàn)兩路回聲的消除,合理分配了有限的資源;作者[5]基于小波變換提出的WL-APNLMS算法提高了收斂速率,計算復雜度較低.但是上述算法各有缺點,基于組合濾波器的組合算法收斂速率較慢,而基于小波變換的WL-APNLMS算法又要面臨選擇小波基的問題.近年來經驗模態(tài)分解(EMD)已被引入自適應濾波器[6-7],EMD先對自適應濾波器的輸入進行正交變換[8],減小了自適應濾波器輸入向量自相關陣特征值的分散程度,大大增加了算法的收斂步長,提高收斂速度.較之于小波變換,EMD是一種采用自適應基的時頻局部化分析方法,克服了小波變換需要選擇小波基的問題.信號經EMD分解后每個IMF所包含的頻率成分不僅與采樣率有關,而且更為重要的是它還隨著信號本身的變化而變化.因此,EMD是一種自適應的時頻局部化分析方法,比小波變換更適用于回聲這種非平穩(wěn)信號的處理[9].
聲學回聲是由于揚聲器與麥克風之間的耦合形成的,如圖1所示.在無線電話,有線電話,以及揚聲器電話的免提設備中都會出現(xiàn)聲學回聲.這些問題是由低質量的手機、周圍環(huán)境中的回聲(例如在汽車、旅館或工廠中)或者電話聽筒串話造成的.甚至高質量的手機也會出現(xiàn)聲學回聲,因為話音信號會通過用戶的臉頰反射回麥克風.
圖1 聲學回聲的產生
聲學回聲消除的原理如圖2所示,圖中的回聲估計器和加法器是自適應濾波器的兩個組成部分.h為回聲路徑的單位脈沖響應向量,輸入信號x(n)在傳輸過程中產生回聲信號d(n)為
圖2 聲學回聲消除的原理
y(n)是模擬回聲路徑產生的回聲信號,其表達式為
式中,x(n)=[x(n),x(n-1),x(n-2),…,x(n-M+1)]T表示n時刻的輸入信號矢量,由最近M個信號采樣值構成,w(n)=[w0(n),w1(n),…,wM-1(n)]T表示n時刻自適應濾波器的系數(shù)矢量估值.
模擬的回聲信號y(n)與真實的回聲信號d(n)之差記為e(n):
若自適應濾波器的單位脈沖響應向量h能很好地模擬回聲通道的傳遞函數(shù)時,殘留的回聲信號e(n)就能達到最小,此時的聲學回聲就被抵消了.
因為語音信號是相關性很強的信號,很多實踐證明用NLMS算法進行回聲消除時,收斂速率較慢[10],而基于子帶自適應濾波器的回聲消除器設計則成為當前解決聲學回聲消除問題的主流方向.
子帶自適應濾波器的原理是將輸入信號被濾波器組劃分成若干個子帶,這些子帶具有不同的頻段[11],最后的誤差信號是各個子帶的回聲誤差信號的累加.圖3是子帶自適應濾波器的結構圖.
圖3 子帶自適應濾波器的結構圖
如圖 3所示,H0、H1、…、HM-1構成子帶分析濾波器組;G0、G1、…、GM-1構成子帶合成濾波器組;F0、F1、…、FM-1構成自適應濾波器組;子帶的個數(shù)為 M,抽取因子為D,D<M.
子帶自適應濾波相對于全帶自適應濾波的好處有以下幾點:(1)在各個子帶的自適應濾波過程中,濾波器長度是減少的,這使得子帶濾波比全帶濾波具有更大的計算效率.(2)由于在子帶內語音信號的譜動態(tài)范圍減少了,因而子帶濾波將獲得更大的收斂速率.(3)這種獨立的結構使得所有的子帶處理都能夠并行實現(xiàn),使系統(tǒng)性能更優(yōu).基于以上所提出的優(yōu)點,本文提出的新算法也采用子帶自適應濾波器用于消除回聲.
該算法將語音信號分成5個頻率段,H0(n)部分包含0~1000 Hz,H1(n)部分包含 1000~2000 Hz,H2(n)部分包含2000~3000Hz,H3(n)部分包含3000~ 4000 Hz,H4(n)部分包含 4000~ 8000 Hz,分段進行自適應回聲消除,結構中用到3個分析濾波器組,在每個濾波器組的每個通道中進行了抽樣,并在兩路回聲路徑中分別加入了40dB的噪聲,結構框圖如圖4所示.
圖4 基于組合濾波器的組合算法的結構圖
將輸入信號進行小波分解重構成低頻(a5)和高頻(d1~ d5)部分,再對 a5、d5 、d4 應用 APA 算法,而針對相對而言的高頻部分d3、d2、d1則使用NLMS算法.最后將處理后的不同頻段的信號相加即可得最終處理的結果.該算法的總體設計圖如圖5所示.
回聲抵消效果一般采用回聲返回衰減增益(ERLE)來評價[12],其定義如下:
圖5 基于小波變換的WL-APNLMS算法在回聲消除中的總體設計
ERLE值越大,則表明e(n)越小,回聲抵消效果越好,收斂快,一般要求ERLE>6dB.
(1)輸入信號波形.本文所采用的輸入信號是用音頻軟件cool edit截取的一段wav格式的語音信號.信號長度N=5000,其波形如圖6所示.
圖6 輸入的語音信號
(2)組合算法 、WL-APNLMS 、NLMS 、FAP 算法收斂速率的比較.仿真中,回聲路徑用式(5)脈沖響應來模擬,其中長度L=64,r(n)為幅度在-0.5~0.5之間均勻分布的隨機向量,其值為rand(L,1)-0.5.
針對圖6中的輸入信號分別采用組合算法、NLMS、FAP算法,得到 ERLE曲線如圖7所示.從圖7可以看出,組合算法的收斂速率雖然已經達到了FAP算法的收斂速率,但較之WL-APNLMS算法則速率較低.WL-APNLMS算法雖然收斂速率較快,但它面臨選擇小波基的麻煩.這是因為小波分析是通過選擇小波基進行分解的,其分解結果與所選的小波基密切相關.經驗模態(tài)分解是一種采用自適應基的方法,可以避免選擇小波基的麻煩,因此基于經驗模態(tài)分解的自適應算法具有一定的優(yōu)勢.
圖7 組合算法、NLMS、FAP算法 ERLE性能比較
如圖8所示,將輸入信號進行EMD分解為低頻c1(n)、c2(n)、c3(n)、c4(n)、c5(n)、c6(n)和高頻 c7(n)、c8(n)、c9(n)、c10(n)、c11(n)、res(n)部分.信號的頻率高,采樣率則低,導致采樣點數(shù)少,算法的計算量就少.反之,信號的頻率低,采樣率則高,采樣點數(shù)就多,計算量則大.為了降低算法的計算復雜度,本文對于不同的頻段子帶信號采用不同的自適應算法.為此,對于計算量少的較高頻信號c1(n)、c2(n)、c3(n)、c4(n)、c5(n)、c6(n)采用計算復雜但收斂快的APA算法;對于計算量多的較高頻信號c7(n)、c8(n)、c9(n)、c10(n)、c11(n)、res(n)采用計算簡單但收斂慢的NLMS算法.那么整個處理過程中相對單獨使用APA、NLMS算法,計算量較低.
圖8 新算法(EMD-APNLMS)在回聲消除中的總體設計
(1)將圖6中的語音信號用經驗模態(tài)分解.如圖9 所示 .其中 c1(n)、c2(n)、c3(n)、c4(n)、c5(n)、c6(n)頻率較高 ,c7(n)、c8(n)、c9(n)、c10(n)、c11(n)、res(n)頻率較低.
圖9 經驗模態(tài)分解信號
(2)EMD-APNLMS算法的ERLE特性.
根據(jù)結構圖圖 8,對 c1(n)、c2(n)、c3(n)、c4(n)、c5(n)、c6(n)子帶信號采用APA 算法;對c7(n)、c8(n)、c9(n)、c10(n)、c11(n)、res(n)子帶信號采用 APA 算法.其中抽樣因子D=8.仿真結果如圖10所示.
圖10 EMD-APNLMS算法ERLE性能
(3)EMD-APNLMS、WL-APNLMS 、組合算法的ERLE特性比較,仿真結果如圖11所示.由此可見,提出的EMD-APNLMS算法的收斂速率在0~1500時刻快于WL-APNLMS算法,1500時刻以后,與WL-APNLMS算法相當,又避免了 WL-APNLMS算法選擇小波基的麻煩;新算法的收斂速率高于組合算法,克服了組合算法收斂較慢的缺點.
圖11 EMD-APNLMS、WL-APNLMS、組合算法的ERLE特性比較
基于經驗模態(tài)分解(EMD)的子帶自適應濾波算法-EMD-APNLMS,實現(xiàn)了回聲的良好消除,克服了NLMS遇到語音信號收斂速率慢的缺點,體現(xiàn)了子帶濾波算法的優(yōu)勢.該算法較之組合算法有更好的收斂速率,并且該算法克服了WL-APNLMS算法選擇小波函數(shù)的麻煩.
[1]M ayyas T,Aboulnasr T.A Fast Exact Weighted Subband Adaptive Algorithm and Its Application to Mono and Stereo Acoustic Echo Cancellation[J].Journal of The Franklin Institute,2005,342:235-253.
[2]Myllyla V.Residual Echo Filter for Enhanced Acoustic Echo Control[J].Signal Processing,2006,86:1193-1205.
[3]Hallack F S,Petraglia M R.Performance Comparison of Adaptive Algorithms Applied to Acoustic Echo Canceling[C].IEEE International Symposium on Industrial Electronics,2003(2):1147-1150.
[4]向賽輝.電話會議系統(tǒng)中多路回聲消除理論與應用研究[D].昆明:昆明理工大學,2008:12.
[5]李 娜,陳盛云,馬 濤.一種新的基于小波變換的自適應算法在聲學回聲消除中的應用[J].四川師范大學學報:自然科學版,2009,32(1):32-34.
[6]孔國杰,張培林,徐龍?zhí)玫?基于經驗模態(tài)分解的自適應濾波算法及其應用[J].信號處理,2009,25(6):958-962.
[7]錢 勇,黃成軍,戚 偉.基于經驗模態(tài)分解的自適應濾波算法在局部放電窄帶干擾抑制中的應用[J].繼電器,2006,34(22):27-31.
[8]萬 建.基于HHT語音識別技術研究[D].哈爾濱:哈爾濱工程大學,2006.
[9]徐 雙,劉增力,丁 銳.基于希爾伯特黃變換方法的非平穩(wěn)信號仿真與分析[J].昆明理工大學學報:理工版,2009,34(1):108-112.
[10]Breining C,Drescitcl P,Hansler E,et al.Acoustic Echo Control:An Application of Very-High-Order Adaptive Filters[M].IEEE Signal Processing Magazine,1999:42-69.
[11]Sheila S,Hemami,Robert M.Gray.Subband Filters Optimized for Lost Coefficient Reconstroction[J].IEEE Trans on Signal Processing,1997,45(3):10-14.
[12]Gansler T,Gays L,Sondhi M,et al.Doubletalk Robust Fast Converging Algorithms for Network Echo Cancellation[J].IEEE Trans.On Speech and Audio Processing,2000,8(6):656-663.