莊啟雷, 黃青華
(上海大學(xué)通信與信息工程學(xué)院,上海 200072)
基于三線交點球麥克風(fēng)陣列的遠(yuǎn)場多聲源定位
莊啟雷, 黃青華
(上海大學(xué)通信與信息工程學(xué)院,上海 200072)
設(shè)計一種三線交點球麥克風(fēng)陣列,利用該陣列進(jìn)行球面聲壓采樣,實現(xiàn)了基于平面波分解的三維空間遠(yuǎn)場多聲源定位.聲源定位對比實驗結(jié)果表明,采用 98元的三線交點球麥克風(fēng)陣列進(jìn)行遠(yuǎn)場多聲源定位,可以提高聲源定位的精度和空間分辨率,且對環(huán)境噪聲具有良好的魯棒性.
聲源定位;平面波分解;三線交點球麥克風(fēng)陣列
假設(shè)函數(shù) f(θ,φ)在單位球面上是平方可積的,則其球傅里葉變換對可以表示為
式中,S2為單位球面,(·)*表示取共軛,Ymn為球諧函數(shù),其定義為
式中,Pm
n為聯(lián)合勒讓德函數(shù)[12].
球諧函數(shù)是正交的基底函數(shù),故
式 (4)為球諧函數(shù)的連續(xù)正交性表示,而球麥克風(fēng)陣列是對球面上連續(xù)函數(shù)的空間采樣.對于一個確定的球麥克風(fēng)陣列,有 L個麥克風(fēng)被分別固定在陣列球體表面的 (θl,φl)處 ,則有
式中,wl為采樣點的權(quán)值,N為該陣列滿足球諧正交性的最高階數(shù)[13].可以將式 (5)看作球諧函數(shù)正交性的離散形式,同時又是采樣點權(quán)值的線性方程組.因此,可以借助式 (5)來求解各個采樣點的權(quán)值.
聲源定位是根據(jù)球麥克風(fēng)陣列采集到的球面聲壓值來估計聲源空間方位信息的過程.本研究使用球麥克風(fēng)陣列實現(xiàn)含噪環(huán)境下的遠(yuǎn)場多聲源的定位,因此首先要建立含噪環(huán)境下遠(yuǎn)場聲源的球面聲壓模型,并利用得到的聲壓值進(jìn)行聲源定位.
2.1 含噪環(huán)境下遠(yuǎn)場聲源的球面聲壓模型
假設(shè)空間中一個遠(yuǎn)場聲源 S,產(chǎn)生一束波數(shù)向量為 k的平面波,以 (?,φ)方向入射到半徑為 a的剛性球麥克風(fēng)陣列表面,定義觀察方向為 r=(r,θ,φ).該平面波入射模型如圖 1所示.
圖 1 平面波入射模型Fig.1 Planar wave front imp inging on a spher ical aper ture
單位幅度的平面波在觀察點 r處的入射聲壓可用球諧函數(shù)表示為
式中,hn(kr)為 n階的第一類球漢開爾函數(shù).入射聲場與散射聲場發(fā)生疊加,因此,剛性球面聲壓應(yīng)為入射聲壓與散射聲壓的代數(shù)和,即
基于式 (6)~(8),本研究建立了含噪環(huán)境下遠(yuǎn)場多聲源的球面聲壓模型.假設(shè)空間中有 T個遠(yuǎn)場聲源,分別產(chǎn)生幅度為 At的平面波從 (?t,φt)方向入射到剛性球面,與球面周圍的環(huán)境噪聲ε(θ,φ)疊加形成混疊聲場,得到的球面聲壓可以表示為
2.2 三維空間遠(yuǎn)場多聲源定位
根據(jù)建立的含噪環(huán)境下遠(yuǎn)場聲源的球面聲壓模型可知,球面聲場是由一定數(shù)目的遠(yuǎn)場聲源與球面周圍的環(huán)境噪聲疊加形成的混疊聲場,此混疊聲場可表示為無窮多的平面波的疊加,即
球面聲壓 p(kr,θ,φ)的球傅里葉變換 pnm為
則球面上入射平面波的幅值可表示為
在實際情況中不可能獲取空間中每一點的聲壓,只能通過球麥克風(fēng)陣列進(jìn)行球面聲壓的采樣.假設(shè)所使用的球麥克風(fēng)陣列上麥克風(fēng)的數(shù)目為 L,陣列的階數(shù)為 N,則有
式中,wl為第 l個麥克風(fēng)對應(yīng)的權(quán)值,p(θl,φl)為第l個麥克風(fēng)采集到的聲壓值.由于使用的球麥克風(fēng)陣列的階數(shù)為 N,因此需對式 (13)中的球傅里葉反變換進(jìn)行 N階截斷,得到球面上入射平面波的幅值為
聲源直射方向的入射平面波幅值必定會大于非聲源直射方向,因此,在聲源直射方向會出現(xiàn)入射平面波幅值的峰值點.只要在球面空間中搜索該極大值,其對應(yīng)的球面位置坐標(biāo)即為遠(yuǎn)場聲源的來波方向,從而可獲得遠(yuǎn)場聲源的空間方位信息.
將入射平面波幅值的精確表達(dá)式 (13)與經(jīng)球麥克風(fēng)陣列離散采樣得到的截斷近似表達(dá)式 (15)進(jìn)行對比,可以得到:空間中遠(yuǎn)場聲源定位的精度主要受到球傅里葉反變換中截斷階數(shù)大小的影響,該截斷階數(shù)即為所使用的球麥克風(fēng)陣列的階數(shù).因此,在利用球麥克風(fēng)陣列進(jìn)行空間多聲源定位時,可以通過提高球麥克風(fēng)陣列的階數(shù)來提高定位的精度.球麥克風(fēng)陣列的階數(shù)取決于陣列的空間結(jié)構(gòu)以及陣列上麥克風(fēng)數(shù)目的多少[15].雖然可以通過增加麥克風(fēng)的數(shù)目來提高陣列的階數(shù),但也同時增加了信號采集的路數(shù),必然會導(dǎo)致定位算法計算復(fù)雜度的增加.而通過優(yōu)化陣列的空間結(jié)構(gòu)可以在不增加麥克風(fēng)數(shù)目的情況下提高陣列的階數(shù),這顯然是一個更優(yōu)的選擇.因此,本研究設(shè)計了一種低陣列冗余度的三線交點球麥克風(fēng)陣列對空間聲場進(jìn)行采樣,并利用該采樣信號進(jìn)行空間多聲源定位,以期提高空間聲源定位的精度.
根據(jù)聲源定位應(yīng)用中對球麥克風(fēng)陣列的要求,本研究提出了一種三線交點球麥克風(fēng)陣列的設(shè)計方法.為了描述方便,以球麥克風(fēng)陣列承載球體的球心為坐標(biāo)原點,建立空間直角坐標(biāo)系.直角坐標(biāo)與球坐標(biāo)之間的對應(yīng)關(guān)系如圖 1所示,即
分別以空間直角坐標(biāo)系的 3條坐標(biāo)軸為軸線,在承載球體表面上作 3組等夾角的大圓.這 3組大圓數(shù)目相等,均為 K個,并且滿足 K=2k,k=1,2,…,此 3組大圓分別表示如下:
①關(guān)于 z軸旋轉(zhuǎn)對稱的一組大圓可表示為
②關(guān)于 x軸旋轉(zhuǎn)對稱的一組大圓可表示為
此 3組大圓相交所得到的 3個大圓的共交點即為三線交點球麥克風(fēng)陣列上麥克風(fēng)的位置點.每個麥克風(fēng)都位于 3個大圓的共交點處,因此,可以通過解 3個大圓組成的方程組得到每個麥克風(fēng)的位置坐標(biāo).
對于不同的 K值,可以得到不同的三線交點數(shù)目.根據(jù)三線交點球麥克風(fēng)陣列的結(jié)構(gòu),可以得到陣列上麥克風(fēng)的數(shù)目滿足以下規(guī)律:
為了展現(xiàn)三線交點球麥克風(fēng)陣列高空間分辨率的性能優(yōu)勢,將三線交點球麥克風(fēng)陣列與其他類型的球麥克風(fēng)陣列進(jìn)行仿真對比實驗.為了更具說服力,應(yīng)選取麥克風(fēng)數(shù)目近似相等的球麥克風(fēng)陣列進(jìn)行對比,故選取K=8時對應(yīng)的98元三線交點球麥克風(fēng)陣列與 100元等角度分布的球麥克風(fēng)陣列進(jìn)行對比分析.文獻(xiàn)[15]對等角度分布的球麥克風(fēng)陣列的空間結(jié)構(gòu)進(jìn)行了詳細(xì)描述.98元三線交點球麥克風(fēng)陣列的結(jié)構(gòu)如圖 2所示.
圖 2 98元三線交點球麥克風(fēng)陣列結(jié)構(gòu)Fig.2 Structure of 98-element tr ijunctional spher ical m icrophone array
可以看出,98元三線交點球麥克風(fēng)陣列關(guān)于坐標(biāo)系的 3條坐標(biāo)軸都旋轉(zhuǎn)對稱.由于對稱點具有相等的權(quán)值,因此,該陣列僅有 6個不等的權(quán)值.根據(jù)球諧函數(shù)的離散正交性表示式 (5)可得到權(quán)值的線性方程組,即
求解該線性方程組,可得到 6個不相等的權(quán)值,分別為w1=0.154 0,w2=0.107 1,w3=0.114 4,w4=0.142 8,w5=0.135 4,w6=0.115 1.
只要得到 98元三線交點球麥克風(fēng)陣列的每個麥克風(fēng)的位置坐標(biāo)及其對應(yīng)的權(quán)值,即可利用該陣列進(jìn)行球面聲壓采樣,并利用此采樣信號實現(xiàn)三維空間遠(yuǎn)場多聲源定位.
4.1 無噪環(huán)境下的多聲源定位
仿真實驗環(huán)境如下:在無噪的環(huán)境下,空間中有3個單位幅度的遠(yuǎn)場聲源,球面的入射方向 (?,φ)分別為 (66°,99°),(113°,238°),(96°,293°).使用球半徑為 10 cm的 98元三線交點球麥克風(fēng)陣列對球面聲場進(jìn)行離散采樣,根據(jù)此采樣信號估計聲源的方位.同時使用球半徑為 10 cm的 100元等角度分布的剛性球麥克風(fēng)陣列進(jìn)行對比實驗,得到的仿真實驗結(jié)果如圖 3所示,圖中,△為真實聲源方位,·為估計方位.
圖 3 無噪環(huán)境下遠(yuǎn)場多聲源定位Fig.3 L ocalization of m ultiple far-f ield sound sources in the noise-free environment
由仿真實驗結(jié)果可知,利用 98元三線交點球麥克風(fēng)陣列進(jìn)行聲源定位實驗時,估計得到的聲源方位為 (65°,98°),(113°,238°),(95°,295°),3個聲源的方位估計誤差分別為 (1°,1°),(0°,0°),(1°,2°),此時的聲源定位誤差非常小.然而利用 100元等角度分布的球麥克風(fēng)陣列進(jìn)行聲源定位實驗時,估計得到的聲源方位為 (70°,102°),(108°,275°),出現(xiàn)了聲源混疊的現(xiàn)象,導(dǎo)致對聲源個數(shù)的錯誤估計.
陣列的空間分辨率是衡量球麥克風(fēng)陣列性能的一個重要參數(shù),為球麥克風(fēng)陣列單位平面波響應(yīng)的第一零值夾角寬度的 1/2[11].球麥克風(fēng)陣列的階數(shù)決定了球麥克風(fēng)陣列的空間分辨率.100元等角度分布的球麥克風(fēng)陣列和 98元三線交點球麥克風(fēng)陣列的空間分辨率對比如圖 4所示.
可以看出,雖然兩個陣列擁有近似相等的麥克風(fēng)數(shù)目,但 98元三線交點球麥克風(fēng)陣列的空間分辨率要遠(yuǎn)遠(yuǎn)優(yōu)于100元等角度分布的球麥克風(fēng)陣列.正是由于陣列空間分辨率的差異造成了聲源定位實驗結(jié)果的差異.
圖 4 陣列空間分辨率對比Fig.4 Compar ing of the array spatial resolution
4.2 含噪環(huán)境下的多聲源定位
為分析環(huán)境噪聲對聲源定位的影響,本研究在不同信噪比 (signal-to-noise ratio,SNR)環(huán)境下分別進(jìn)行聲源定位實驗.仿真實驗環(huán)境設(shè)置如下:空間中有 3個單位幅度的遠(yuǎn)場聲源,其坐標(biāo)分別位于球面入射方向 (?,φ)的 (66°,99°),(113°,238°),(96°,293°);球麥克風(fēng)陣列周圍的環(huán)境噪聲分別設(shè)定為信噪比 rSN=10,1,0,-1,-5,-10 dB.使用球半徑為10 cm的 98元三線交點球麥克風(fēng)陣列對球面聲場進(jìn)行離散采樣,根據(jù)此采樣信號來估計聲源的方位,得到的仿真實驗結(jié)果如圖 5所示,圖中,△為真實聲源方位,·為估計方位.
將不同信噪比環(huán)境下進(jìn)行聲源定位實驗得到的聲源估計方位與聲源真實方位進(jìn)行比較,即可得到聲源方位的估計誤差如表1所示.可以看出,在不同信噪比環(huán)境下,使用本研究方法均能夠得到準(zhǔn)確的定位結(jié)果,環(huán)境噪聲對定位結(jié)果沒有造成明顯的影響,這表明本聲源定位方法對環(huán)境噪聲具有良好的魯棒性.
本研究使用球麥克風(fēng)陣列實現(xiàn)基于平面波分解的三維空間遠(yuǎn)場多聲源定位,并對該方法進(jìn)行了理論和實驗分析,得到以下結(jié)論:
(1)本聲源定位方法的定位精度和空間分辨率主要取決于定位中所使用的球麥克風(fēng)陣列階數(shù)的大小,使用的球麥克風(fēng)陣列的空間分辨率不足可導(dǎo)致聲源的混疊,造成對聲源個數(shù)的錯誤估計;
圖 5 含噪環(huán)境下遠(yuǎn)場多聲源定位Fig.5 L ocalization of multiple far-f ield sound sources in the noisy environm ent
表1 不同信噪比環(huán)境下遠(yuǎn)場多聲源定位結(jié)果比較Table 1 Compar ison of localizing results of multiple far-f ield sound sources under the environment of d ifferent SNR
(2)通過優(yōu)化陣列的空間結(jié)構(gòu)可以實現(xiàn)在不增加麥克風(fēng)數(shù)目的情況下提高定位的精度,因此,低冗余度空間結(jié)構(gòu)的球麥克風(fēng)陣列的設(shè)計對該聲源定位方法非常重要;
(3)基于平面波分解的聲源定位方法對環(huán)境噪聲具有良好的魯棒性.
[1] ZHANG C,FLORENCIO D,BA D E,et al.Maximum likelihood sound source localization and beamforming fordirectional microphone arrays in distributed meetings[J].IEEE TransMultimedia,2008,10(3):538-548.
[2] CHO Y,YOOK D,CHANG S,et al.Sound source localization for robot auditory systems[J].IEEE Trans Consumer Electron,2009,55(3):1663-1668.
[3] BRANDSTEIN M S,WARD E D B.M icrophone arrays:signal processing techniques and applications[M].Berlin:Springer-Verlag,2001:157-180.
[4] 崔瑋瑋,曹志剛,魏建強(qiáng).聲源定位中的時延估計技術(shù)[J].數(shù)據(jù)采集與處理,2007,22(1):90-99.
[5] MUKWEVHO T,JORDAAN J,NOEL G.Advanced beamforming techniques for acoustic source localization[C]∥IEEEAFRICON 2009.2009:1-6.
[6] ARGENTIERI S,DANES P.Broadband variations of the MUSIC high-resolution method for sound source localization in robotics[C]∥Proceedings of the 2007 IEEE/RSJ International Conference on Intelligent Robots and Systems.2007:2009-2014.
[7] TEUTSCH H, KELLERMANN W. Detection and localization of multiple wideband acoustic sources based on wavefield decomposition using spherical apertures[C]∥Proceedings of the 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing.2008:5276-5279.
[8] 林志斌,徐柏齡.基于球麥克風(fēng)陣列的三維空間多聲源定位 [J].南京大學(xué)學(xué)報:自然科學(xué)版,2006,42(4):384-394.
[9] MEYER J,ELKO GW.A sphericalmicrophone array for spatial sound recording[J].J Acoust Soc Am,2002,111(5):2346-2346.
[10] L I Z Y,DURA ISWAM IR.Flexible and op timal design of sphericalmicrophone arrays for beamforming[J].IEEE Trans Audio Speech Lang Process,2007,15(2):702-714.
[11] PARK M,RAFAELY B.Sound-field analysis by planewave decomposition using spherical microphone array[J].JAcoust Soc Am,2005,118(5):3094-3103.
[12] DRISCOLL J R,HEALY D M.Computing Fourier transforms and convolutions on the 2-sphere[J].Adv App l Math,1994,15(2):202-250.
[13] W ILL IAMS E G.Fourier acoustics:sound radiation and nearfield acoustical holography [M]. New York:Academic Press,1999:183-234.
[14] RAFAELY B.Plane-wave decomposition of the sound field on a sphere by spherical convolution[J].JAcoust Soc Am,2004,116(4):2149-2157.
[15] RAFAELY B. Analysis and design of spherical microphone arrays[J]. IEEE Trans Speech Audio Process,2005,13(1):135-143.
L oca liza tion of M ultiple Sound Sources in Far F ield UsingTr ijunctiona l Spher ica l M icrophone Array
ZHUANG Q i-lei, HUANG Q ing-hua
( School of Communication and Information Engineering, Shanghai University, Shanghai 200072, China)
A trijunctional spherical m icrophone array is designed to samp le the sound field. A multip lesound sources localization algorithm is realized by p lane-wave decomposition in the three-dimensionalspaces w ith this array. Experimental results show that, using 98-element trijunctional sphericalm icrophone array to locate multip le far-field sound sources can imp rove the accuracy and spatialresolution of the sound source localization. In addition, this method is robust to the environmental noise.
sound source localization; p lane-wave decomposition; trijunctional spherical m icrophone array
TN912.35
A
1007-2861(2011)02-0125-07
10.3969/j.issn.1007-2861.2011.02.004
2010-04-06
國家自然科學(xué)基金資助項目 (61001160);上海市科委自然科學(xué)基金資助項目 (08ZR1408300);教育部博士點基金資助項目(20093108120018)
黃青華 (1978~),女,講師,博士,研究方向為 3D音頻信號處理、盲信號處理.E-mail:qinghua@shu.edu.cn
(編輯:丁嘉羽)
近年來,聲源定位因其在視頻會議、智能機(jī)器人以及語音增強(qiáng)等領(lǐng)域的廣泛應(yīng)用前景而日益成為研究的熱點[1-2].基于麥克風(fēng)陣列的聲源定位是利用一定空間結(jié)構(gòu)的麥克風(fēng)陣列采集空間聲場信號,通過對多路聲場信號進(jìn)行分析和處理,來獲取聲源的空間方位信息.目前已出現(xiàn)了多種基于麥克風(fēng)陣列的聲源定位方法,這些方法主要可分為 3類[3]:①基于時延估計的聲源定位方法,該方法具有計算量小、易于實現(xiàn)的優(yōu)點,但只適用于單聲源的定位,對多聲源定位的效果較差[4];②基于最大輸出功率的可控波束形成技術(shù)的定位方法,該方法可用于多聲源的定位,但需要聲源和背景噪聲的先驗知識,而在實際應(yīng)用中往往很難獲得這種先驗知識[5];③基于高分辨率譜估計技術(shù)的定位方法,該方法理論上能夠?qū)β曉捶较蜻M(jìn)行有效估計,但計算復(fù)雜度非常高,且不適用于寬帶聲源的定位[6].
傳統(tǒng)的聲源定位方法都是通過直接對麥克風(fēng)陣列采集的聲場信號進(jìn)行分析和處理,來獲取聲源的空間方位信息,而聲源和環(huán)境噪聲在陣列表面的散射混疊必定會對定位造成很大的干擾,進(jìn)而影響定位的精度和準(zhǔn)確性.基于平面波分解的三維空間多聲源定位方法,不直接對麥克風(fēng)采集到的信號進(jìn)行分析,而是先將聲場正交分解到球諧域中[7],進(jìn)而獲取直射聲場的聲壓,并利用此直射聲場進(jìn)行空間聲源的定位,從而可消除聲場在陣列表面散射對聲源定位產(chǎn)生的影響[8].此外,球麥克風(fēng)陣列由于具有三維空間旋轉(zhuǎn)對稱的空間結(jié)構(gòu),可廣泛應(yīng)用于聲場采集、波束形成以及空間聲場分析等領(lǐng)域[9-11].基于此,本研究設(shè)計了一種三線交點球麥克風(fēng)陣列,并利用該陣列進(jìn)行三維空間遠(yuǎn)場多聲源的定位.