石超宇,王志強
(上海大學 通信與信息工程學院,上海 200444)
到達方向(Direction of Arrival,DOA)估計是聲學應用中非常重要的部分。高效、準確的DOA估計有助于在聲學場景特別是實時場景進行信號的分析和處理。聲矢量傳感器可以同時測量某處的聲壓和粒子速度,且憑借其體積小、適用范圍廣等優(yōu)點逐漸成為研究人員和市場青睞的產(chǎn)品,使得針對傳統(tǒng)全向麥克風陣列信號的DOA 估計方法也擴展到了矢量信號。Hawkes 將最小方差無失真響應(Minimum Variance Distortionless Response,MVDR)應用于矢量聲信號[1],并且也擴展到在多個聲矢量傳感器構建成的線性陣列中使用MVDR[2];適用于矢量信號的多重信號分類(Multiple Signal Classification,MUSIC)算法[3]和基于旋轉不變技術的信號參數(shù)估計(Estimating Signal Parameter via Rotational Invariance Techniques,ESPRIT)算法[4]等超分辨率算法在估計精度方面明顯優(yōu)于MVDR 和到達時間差(Time Difference of Arrival,TDOA)等方法;針對單聲源場景對矢量聲信號可以使用聲密度矢量區(qū)分直達聲和漫射聲,并估計直達聲方向[5]。為了在時間敏感的應用場景中保證一定估計精度的情況下及時獲取DOA 信息,本文提出了適用于矢量聲信號的實值EB-ESPRIT 算法。
以Ylm(φ,θ)表示復值球諧函數(shù):
其中l(wèi)≥0 和|m|≤l分別表示階數(shù)和模,Plm表示階數(shù)和模分別為l和m的勒讓德函數(shù)。定義球麥克風陣列的接收聲壓信號:
其中,k表示波數(shù),r為球陣列半徑,模式強度bl(kr)=il·ρl(kr),ρl(kr)是l階球貝塞爾函數(shù)??紤]球諧函數(shù)與AVS 通道的相關性,如圖1 所示,將l的最大值限定為一階,在限定階數(shù)與模的條件下,對AVS 信號轉化為球諧域信號,從而使用適用于球麥克風陣列的DOA 估計方法[6]。
實值球諧函數(shù)Rlm(φ,θ)可以表示為:
其中i2=-1。令Ω=(φ,θ),定義:
L表示球諧域最高階數(shù),則:
UL為(L+1)2階酉矩陣。將信號空間展為{y*(Ω1),y*(Ω2),…,y*(ΩM)},則M個最大的特征值滿足條件:
Q為M×M可逆矩陣。對于每個聲源所對應的DOA 向量Γ(Ωm),有:
使用以下遞推關系[7]:
其中:
定義實值矢量信號X?和實值功率譜密度
Q?為M×M實數(shù)矩陣。通過式(10)及遞推關系(11),可以得到:
將實驗場景分為單聲源場景和雙聲源場景,混響時長分別設置為0 ms、300 ms、600 ms,接收信噪比為5 dB,每組實驗選取10組不同方位取平均值。實驗中將MUSIC 算法與實值EB-ESPRIT 算法的性能進行比較,另外在雙聲源場景中加入了與Habets算法[8]的比較,實驗結果如圖2~圖5 所示。
實驗結果表明,在單聲源場景下,相比于MUSIC 算法,R-EB-ESPRIT 算法可以在估計精度基本一致的情況下降低計算開銷,計算開銷的降幅達到20%左右。在雙聲源場景下,R-EB-ESPRIT算法的估計精度相比于MUSIC 算法有所下降,但在計算開銷上仍有一定的降低。此外,相比于Habets算法,R-EB-ESPRIT 算法雖然在計算開銷上超過前者,但在估計精度上遠高于Habets 算法。
針對特征空間算法的計算復雜度較高的問題,結合聲矢量傳感器的陣列特性,將球諧域DOA 估計方法EB-ESPRIT 應用于矢量聲信號。實驗結果顯示,該方法可以在保證一定估計精度的情況下,相比于MUSIC 算法降低約20%的計算開銷。