張永棠
(廣東東軟學院計算機科學與技術系,廣東 佛山 528225)
一種多徑環(huán)境下麥克風陣列時延估計算法★
張永棠
(廣東東軟學院計算機科學與技術系,廣東 佛山 528225)
針對多徑環(huán)境下麥克風陣列時延估計問題,將歸一化最小均方誤差法(NLMS)與互關聯(lián)法(CR)相結合,提出了NLMS-CR算法。對該算法的結構和原理進行了詳細的分析,并將其與傳統(tǒng)的相位變換廣義互相關法 (GCC-PHAT)和NLMS進行了比較;同時,在不同的信噪比 (SNR)與聲源環(huán)境下驗證了該算法的效能。仿真結果表明:在較嚴重的多徑環(huán)境下,NLMS-CR的性能優(yōu)于其他傳統(tǒng)的算法;當信噪比較高且接收信號相關性較低時,NLMS-CR具有很高的時延估計準確率。
多徑環(huán)境;麥克風陣列;時延估計;算法;通信性能
聲源時延估計是一種通信系統(tǒng)中常見的時延估計方法。但是,由于實際地面和周圍障礙物的反射影響,發(fā)射信號都是經(jīng)過多條不同的路徑,以不同的時刻到達麥克風陣列的,這樣會形成多徑效應(也被稱為混響)[1],從而影響聲源時延估計的準確率。為此,本文對多徑環(huán)境下麥克風陣列時延估計問題進行了研究。
最初的時延估計方法為互相關 (CC:Cross-Correlation)法,該方法通過計算麥克風對接收信號間的互相關函數(shù)的最大峰值所對應的時間偏置來估計時延;Knapp[1]和Carter[2]對CC法做了推廣,提出了相位變換廣義互相關法[3](GCCPHAT:Phase Transform Generalized CC),對接收信號作相位加權濾波后再進行互相關處理,使主瓣更加尖銳,同時抑制旁瓣;另一種常見的時延估計法為最小均方誤差 (NLMS:Normalized Least Mean Square)自適應算法,其根據(jù)當前輸入信號自適應地調整濾波器權系數(shù),使輸出誤差信號達到最小,收斂時權矢量的峰值時偏即為所求得的時延估計。
上述算法均是基于理想的單通道傳播模型進行的,在多徑環(huán)境下,這些算法的性能急劇地下降。為此,借鑒SIMO系統(tǒng)的盲辨識技術,文獻 [1]提出了自適應特征分解 (AED:Adaptive Eigenvalue Decomposition)算法,該方法直接求取聲源到雙麥克風間的傳播聲信道沖激響應,并以兩者峰間時差作為估計的時延,從而可用于解決多徑環(huán)境下的時延估計問題,但特征值分解的計算量較大,當多徑?jīng)_激的響應長度過大時,無法實時處理。受AED算法的啟發(fā),將NLMS與不同信道間的相互關聯(lián)性(CR:Cross Relation)相結合,文獻 [2]提出了NLMS-CR算法。本文在此基礎上,考慮負時延的情況,對算法的推導和驗證做出了優(yōu)化與完善。
1NLMS-CR時延估計算法
考慮多徑環(huán)境下的雙麥克風陣列接收模型。聲源信號以平行波方式傳向麥克風陣列,令波達方向為θ,麥克風1的輸出為x1(n),麥克風2的輸出為x2(n),則麥克風1相對于2的時延采樣值為:
式 (1)中:D——雙麥克風陣列陣元間距;
fs——該數(shù)字系統(tǒng)模型的采樣率;
c——聲信號在空氣中的傳播速度。
nτ若為負值則表示超前。當接收端不存在加性噪聲時,該麥克風陣列陣元接收信號可表示如下:
式 (2)中:s(n)——源信號相對直達波信號的歸一化信號;
h1(n),h2(n)——兩麥克風聲傳播信道的沖激響應;
γm,i,m=1,2——兩麥克風信道上各個采樣點的離散幅值;
L——2條信道長度的較大值[2]。
由信道間的相互關聯(lián)性及線性卷積的交換律[2],同時考慮存在超前的可能,可得:
將上式展開,得:
當接收端存在噪聲時,(3)式兩端不嚴格相等,存在誤差,定義誤差函數(shù)為:
將 (5)式改寫為矢量形式得:
為了保證收斂,μ的取值應滿足0<μ<2;ε是小正常數(shù),以防止除數(shù)為零。
由 (7)式可得,NLMS-CR的系統(tǒng)框圖如圖1所示:
式 (6)中:
y1(n)=[x1(n-η-1),…,x1(n-η-L+1)]T;
y2(n)=[x2(n), …, x2(n-η-L+1)]T;
g1=[h1(-η), …, h1(0), …, h1(L-1)]T;
g2=[h2(1), …, h2(L-1)]T。
令 u (n) =[gT1, -gT2]T, y(n) =[yT2(n),[yT1(n)]T,得到NLMS算法迭代方程為:
圖1 NLMS-CR的系統(tǒng)框圖
在NLMS-CR時延估計算法中,h1(n)在-η~η之間的最大峰值位移表示估計的時延,根據(jù)SIMO盲信道辨識理論,欲保證麥克風陣列多徑聲傳播信道的可辨識性,須滿足如下條件[4]。
a)多徑聲傳播信道的沖激響應具有互異的零點。
b)聲源信號是不相關或弱相關的,即其短時自相關矩陣滿秩。
為了驗證所提算法的性能,我們做了大量的仿真。實驗在模擬房間中進行,房間尺寸為1.5×1.5× 3,聲源s的坐標為 [1,1.2,1.7]T,2個全向接收麥克風 r1、 r2的坐標分別為 [0.2, 0.4, 0.6]T、[0.5,0.4,0.6]T,所有的尺寸及坐標的單位均為m;房間天花板、地面和四周墻壁的吸收系數(shù)均為0.4。由鏡像法[5]產(chǎn)生的2條室內多徑聲傳播信道沖激響應h1(n)、h2(n)如圖2所示,混響時間約為
62.5ms,多徑聲傳播信道1與2的直達波間的時間約差6個采樣點。
聲源信號采用高斯白噪聲,采樣率為16 kHz,接收端信噪比 (SNR:Signal-to-Noise Ratio)為50 dB。為了便于比較,給出上述強多徑環(huán)境下GCCPHAT、NLMS和本文所提算法NLMS-CR的仿真結果,如圖3-5所示。由圖3-5可以看出,SNR為50 dB時,GCC-PHAT和NLMS的估計誤差很大,而NLMS-CR的估計結果與實際值相同。但這只是一次仿真的結果,我們需要研究大量的實驗情況下的仿真結果。為此,我們分別在不同的SNR條件下對NLMS-CR算法進行1 000次仿真;同時,將上述高斯白信號通過沖激響應為H(z)=
0.0272+0.046 2z-1+0.046 2z-2+0.027 2z-3的濾波器產(chǎn)生一個有色信號,對該信號作同樣的仿真實驗。綜合研究白色與有色信號情況下算法的時延估計性能,得到時延估值的正確率如表1所示。
圖3 GCC-PHAT估計結果
圖4 NLMS估計結果
圖5 NLMS-CR估計結果
表1 白信號和有色信號時延估計的正確率表
由表1的第二列可以看出,SNR的高低對NLMS-CR的估計性能有很大的影響,SNR較高時,算法性能很好,估計準確率很高;但當SNR下降到25 dB時,估計性能就開始惡化。
比較表1的第二、三列可以看出,當聲源信號變?yōu)橛猩盘枙r,算法的估計性能出現(xiàn)了明顯的惡化。這是因為,雙麥克風接收信號間的相關性增強了,使得算法迭代過程中可能收斂到局部最優(yōu)解,而沒有收斂到真實的時延位置,以致于產(chǎn)生錯誤的估計結果,造成算法性能的下降。實際中用到的強相關時間序列可能使算法的性能完全失效,需要我們在后續(xù)工作中通過對接收信號的預濾波解進行相關處理來加強算法在實際應用中的魯棒性。
在強多徑環(huán)境下,傳統(tǒng)的GCC-PHAT、NLMS等時延估計算法已不再適用。為此,本文提出了NLMS-CR算法,并詳細地分析了算法的推導與實現(xiàn)過程。仿真結果表明:相比于傳統(tǒng)的方法,在強多徑環(huán)境及較高SNR的條件下,NLMS-CR能保證較高的時延估計準確率,體現(xiàn)了較強的魯棒性;當SNR小于25 dB時,估計性能開始惡化;同時,由仿真結果還可以看出,采用有色信號時,接收端信號間的相關性增強,算法的性能下降。在實際環(huán)境中,我們處理的信號往往是非白的,研究對接收信號的預處理,以便于有效地去除信號間的相關性是我們今后的工作中需要解決的問題。
[1]BENESTY J.Adaptive eigenvalue decomposition algorithm for passive acoustic source localization [J].Acoustical Society of America,2012,107(1):384-391.
[2]許志勇,趙兆.寬間距麥克風陣列實時無模糊多聲源被動測向 [J].電子與信息學報,2011,33(9):2056-2061.
[3]KNAPP C H,CARTER G C.The generalized correlation method for estimation of time delay[J].IEEE Transactions on Acoustics,Speech,and Signal Processing,1976,24(4):320-327.
[4]XU H.A least-squares approach to blind channel identification[J].IEEE Transactions on signal processing,2010,43(12):2982–2993.
[5]ALLEN J B,BERKLEY D A.Image method for efficiently simulating small-room acoustics[J].Acoustical Society of America,2013,65(4):943-950.
[6]房玉琢,許志勇.基于自適應盲辨識的麥克風陣列直達波方向估計 [J].南京理工大學學報 (自然科學版),2014,38(2):264-270.
[7]周楊,張?zhí)祢U,錢文瑞.多徑環(huán)境下TDDM-BOC信號偽碼周期估計 [J].電訊技術,2015,55(6):651-657.
[8]涂鵬,梁玉英,韓壯志.低空目標雷達跟蹤中多徑效應仿真 [J].計算機仿真,2015,32(8):18-21.
[9]張永棠.一種改進的LZ77無損數(shù)據(jù)壓縮算法設計 [J].佛山科學技術學院學報 (自然科學版),2016,34(1):57-61.
[10]樊昌信,曹麗娜.通信原理 (第7版) [M].北京:國防工業(yè)出版社,2012.
[11]高西全.數(shù)字信號處理 (第三版) [M].西安:西安電子科技大學出版社,2008.
[12]樓順天.基于MATLAB7.X的系統(tǒng)分析與設計——信號處理 (第二版) [M].西安:西安電子科技大學出版社,2015.
A Time Delay Estimation Algorithm for Microphone Array in Multipath Environment
ZHANG Yongtang
(Department of Computer Science and Technology,Guangdong Neusoft Institute,F(xiàn)ushan 528225,China)
An algorithm named NLMS-CR,combining the normalized least mean square(NLMS)with the cross relation(CR),is presented to cope with the problem of time delay estimation for microphone arrays in multipath environment.The structure and principle of the algorithm are analyzed in detail, and then it is compared with the traditional phase transform generalized cross-correlation(GCC-PHAT)and NLMS.Simultaneously,the performance of the algorithm is verified under different SNR conditions and in different acoustic source environment. Simulation results show that NLMS-CR is superior to other conventional algorithms in severe multipath environment.And when SNR is high and the correlation of the received signals is low,NLMS-CR has a very high accuracy rate of time delay estimation.
multipath environment;microphone arrays; time delay estimation; algorithm;communication performance
TB 114.3;TP 391.99
:A
:1672-5468(2017)01-0023-04
10.3969/j.issn.1672-5468.2017.01.005
江西省科學技術創(chuàng)新項目 (NO.GJJ12255),廣東省普通高校特色創(chuàng)新項目 (NO.2014KTSCX212)資助
2016-06-07
張永棠 (1981-),男,江西南昌人,廣東東軟學院副教授,碩士,主要從事光通信與無線傳感器網(wǎng)絡應用方面的教學和研究工作。