王順利 洪強(qiáng) 夏長(zhǎng)春
摘 要 麥克風(fēng)陣列信號(hào)處理是數(shù)字信號(hào)處理領(lǐng)域的一個(gè)熱點(diǎn)問(wèn)題,對(duì)麥克風(fēng)陣列接收到的信息量,根據(jù)各個(gè)陣列之間信息的相關(guān)性,可以使用融合處理的方式實(shí)現(xiàn)對(duì)參數(shù)的估計(jì),這種融合不僅可以在時(shí)間域處理,也可以在頻域處理。麥克風(fēng)陣列信號(hào)處理技術(shù)能夠在統(tǒng)計(jì)意義上得到測(cè)量數(shù)據(jù),該技術(shù)已應(yīng)用在無(wú)線通信,雷達(dá),聲納與工業(yè)控制等場(chǎng)合得到了廣泛的應(yīng)用。
關(guān)鍵詞 聲源定位 麥克風(fēng)陣列 數(shù)字信號(hào)處理 三維空間 可控波束
中圖分類號(hào):TB51 文獻(xiàn)標(biāo)識(shí)碼:A
1麥克風(fēng)陣列系統(tǒng)的聲源定位技術(shù)研究意義
輸入的信息只有兩個(gè)方向難以確定聲源的位置,人類的聽(tīng)覺(jué)系統(tǒng)主要取決于頭和外耳氣壓差聲波實(shí)現(xiàn)聲源定位。假使沒(méi)有這個(gè)壓力差,只能定位在平面上聲源的位置,但就無(wú)法知道聲音是從前面,或從后面?zhèn)鱽?lái)的。因此,由人的聽(tīng)覺(jué)系統(tǒng),科技研發(fā)人員得到了靈感,使用多個(gè)麥克風(fēng)系統(tǒng)可以實(shí)現(xiàn)在三維空間中的聲源位置的定位,麥克風(fēng)的數(shù)量越多,所接收到的信息量也越多。
聲源的聲源定位和聲源增強(qiáng)是實(shí)現(xiàn)智能處理的兩個(gè)關(guān)鍵問(wèn)題,而聲源定位是實(shí)現(xiàn)語(yǔ)音增強(qiáng)的前提和基礎(chǔ)。一個(gè)麥克風(fēng)的信息量較少,使得聲源定位所需的信息缺乏,而麥克風(fēng)陣列克服了上述缺點(diǎn),充分利用每個(gè)麥克風(fēng)信號(hào)之間的數(shù)據(jù)相關(guān)性,并加以融合,可以實(shí)現(xiàn)聲源定位。
麥克風(fēng)陣列系統(tǒng)已廣泛應(yīng)用于許多領(lǐng)域的基礎(chǔ)上,一些典型的應(yīng)用:
(1)視頻會(huì)議
傳統(tǒng)的視頻會(huì)議和大型會(huì)議,如果只在一個(gè)固定的位置放置一個(gè)麥克風(fēng),揚(yáng)聲器遠(yuǎn)離麥克風(fēng),語(yǔ)音信號(hào)的質(zhì)量收集很差,為了得到增強(qiáng)的語(yǔ)音信號(hào),有兩種選擇,一種是誰(shuí)講麥克風(fēng)傳給誰(shuí),這是最常用的方法,其成本低,但使用不方便。另一個(gè)方法是對(duì)每個(gè)人都配置麥克風(fēng),這種方法容易在參與者的數(shù)量較少的情況下實(shí)現(xiàn),但其成本太高,不太現(xiàn)實(shí)?;邴溈孙L(fēng)陣列的系統(tǒng)不僅成本適中,安裝方便,使用者還可以自動(dòng)將提高揚(yáng)聲器的聲音,和周圍環(huán)境的噪聲抑制。
在視頻會(huì)議和視頻監(jiān)控,自動(dòng)聲源定位系統(tǒng)的麥克風(fēng)陣列方向擾動(dòng)攝像頭的熱點(diǎn)區(qū)域,以獲得更好的圖像和聲音,大大地節(jié)省了人力。
(2)移動(dòng)電話系統(tǒng)
當(dāng)車輛在高速運(yùn)行狀態(tài)時(shí),如果用手拿移動(dòng)電話,可能會(huì)導(dǎo)致安全問(wèn)題,免提電話由此應(yīng)運(yùn)而生。然而,當(dāng)一些人在汽車中高聲談?wù)撌虑闀r(shí)以及和當(dāng)車輛高速運(yùn)行時(shí)產(chǎn)生噪聲的情況下,使用免提電話就比較困難。如果駕駛員位置使用麥克風(fēng)陣列定位,加強(qiáng)在這個(gè)位置上的聲音,消除其他方向上的干擾聲音,通話效果就會(huì)有明顯改善。
(3)故障診斷
故障診斷的第一步是確定故障的位置,在故障診斷中的聲源定位是一種使用音頻信號(hào)來(lái)實(shí)現(xiàn)無(wú)源探測(cè)定位的技術(shù)。聲源定位系統(tǒng)采用被動(dòng)方式工作,電磁輻射具有很強(qiáng)的隱蔽性,聲源定位故障檢測(cè)是在軍事領(lǐng)域和民用領(lǐng)域得到了廣泛的應(yīng)用。
2麥克風(fēng)陣列系統(tǒng)的聲源定位技術(shù)的各種算法
(1)可控波束法
可控波束的方法首次應(yīng)用在雷達(dá),聲納和通信,軍事和經(jīng)濟(jì)領(lǐng)域,在這些應(yīng)用領(lǐng)域中,聲源模型是遠(yuǎn)場(chǎng)模型,目標(biāo)是得到聲源的方向角。一種最簡(jiǎn)單的可控波束的聲源定位方法是基于延遲求和波束形成方法。麥克風(fēng)的信號(hào)傳播延遲的方法,用于麥克風(fēng)延遲聲源的補(bǔ)償,這些信號(hào)通過(guò)時(shí)間延遲疊加后形成混合信號(hào),每個(gè)信號(hào)補(bǔ)償后,在時(shí)間上基本相同,而疊加信號(hào)輸出能量是最大的。對(duì)麥克風(fēng)求產(chǎn)生的信號(hào)求和來(lái)得到波束,然后通過(guò)搜索聲源的位置來(lái)引導(dǎo)波束,最大輸出能量的波束點(diǎn)就是聲源位置。
波束形成的基本思想是信號(hào)加權(quán)后每個(gè)數(shù)組元素集合的總和,利用麥克風(fēng)陣列來(lái)調(diào)整最大輸出功率的權(quán)重。在傳統(tǒng)的可控波束的形式中,權(quán)值的確定取決于各陣元信號(hào)之間的延遲,而相位延遲與時(shí)延遲和到達(dá)方向有關(guān)系,所以它也被稱為延遲求和波束形成器。在現(xiàn)代的波束形成器中,權(quán)值可以突破限制,根據(jù)調(diào)整權(quán)值的依據(jù)來(lái)獲得相應(yīng)的波速形成器,常用的依據(jù)為最小均方誤差準(zhǔn)則。一般來(lái)說(shuō),信號(hào)的加權(quán)求和過(guò)程可以被看作是過(guò)濾過(guò)程。所以稱這種波束形成為濾波器求和波束形成器。
(2)TDOA算法
TDOA定位算法是一種對(duì)TOA算法的改進(jìn)版本,他不能直接使用信號(hào)來(lái)到達(dá)時(shí)間,必須要與多個(gè)基站接收以確定移動(dòng)站的信號(hào)位置,與TOA算法相比,不需要加入專門的時(shí)間戳,定位精度提高。2種TDOA值的采集:
第一種形式是移動(dòng)站到2個(gè)基站的時(shí)間,使用差值來(lái)獲得,此時(shí)還需要基站的時(shí)間嚴(yán)格的同步,但是當(dāng)基站移動(dòng)信道特性相似時(shí),可以降低由多徑效應(yīng)引起的誤差,如圖1所示。
到達(dá)時(shí)間差的方法分為兩個(gè)步驟,首先計(jì)算出聲源在每個(gè)麥克風(fēng)的相對(duì)時(shí)間差,再結(jié)合麥克風(fēng)陣列的物理結(jié)構(gòu),得到聲源的位置。時(shí)延估計(jì)中的第一步準(zhǔn)確與否直接決定第二步定位精度。
參考文獻(xiàn)
[1] 肖華.麥克風(fēng)陣列的校正方法研究[D]. 電子科技大學(xué),2008.
[2] 崔瑋瑋.基于麥克風(fēng)陣列的聲源定位與語(yǔ)音增強(qiáng)方法研究[D]. 清華大學(xué),2009.