国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于TDOA 算法的分布式陣列麥克風(fēng)定位研究

2020-10-27 01:33:01艾炎
中國電氣工程學(xué)報 2020年5期
關(guān)鍵詞:遠(yuǎn)場麥克風(fēng)聲源

艾炎

語音是人類進(jìn)行交流溝通最主要的方式之一,他能方便快捷的承載這巨大的信息。隨著社會的迅速發(fā)展,進(jìn)入了高度信息化,語音也室作為重要的信息載體之一,語音數(shù)據(jù)處理的整個過程可以分為兩個部分:A/D轉(zhuǎn)換,即把原始聲音的模擬輸入轉(zhuǎn)化為數(shù)字化信息;D/A轉(zhuǎn)換,即把數(shù)字信息轉(zhuǎn)化為模擬數(shù)據(jù)。他的傳送、存儲、識別、合成和增強(qiáng)室現(xiàn)代信息數(shù)字化中非常重要、基礎(chǔ)的組成部分之一。而現(xiàn)在人工智能技術(shù)的發(fā)展,尤其是自然語言處理技術(shù)的高速發(fā)展,語音處理已經(jīng)成為現(xiàn)在智能家居、交通、辦公、通信等新興領(lǐng)域中的核心技術(shù)之一。尤其像現(xiàn)在線上教育、云會議等方式的流行,語音信號處理是一個非常具有價值及必要的研究技術(shù)。

麥克風(fēng)陣列(Microphone Array),從字面上,指的是麥克風(fēng)的排列。也就是說由一定數(shù)目的聲學(xué)傳感器(一般是麥克風(fēng))組成,用來對聲場的空間特性進(jìn)行采樣并處理的系統(tǒng)。麥克風(fēng)按照指定要求排列后,加上相應(yīng)的算法(排列+算法)就可以解決很多房間聲學(xué)問題,比如聲源定位、去混響、語音增強(qiáng)、盲源分離等。語音增強(qiáng)是指當(dāng)語音信號被各種各樣的噪聲(包括語音)干擾甚至淹沒后,從含噪聲的語音信號中提取出純凈語音的過程。聲源定位技術(shù)是指使用麥克風(fēng)陣列來計算目標(biāo)說話人的角度和距離,從而實現(xiàn)對目標(biāo)說話人的跟蹤以及后續(xù)的語音定向拾取,是人機(jī)交互、音視頻會議等領(lǐng)域非常重要的前處理技術(shù)。去混響技術(shù)能很好的對房間的混響情況進(jìn)行自適應(yīng)的估計,從而很好的進(jìn)行純凈信號的還原,顯著的提升了語音聽感和識別效果。聲源信號的提取就是從多個聲音信號中提取出目標(biāo)信號,聲源信號分離技術(shù)則是將需要將多個混合聲音全部提取出來。

近場模型和遠(yuǎn)場模型

根據(jù)聲源和麥克風(fēng)陣列距離的遠(yuǎn)近,可將聲場模型分為兩種:近場模型和遠(yuǎn)場模型。近場模型將聲波看成球面波,它考慮麥克風(fēng)陣元接收信號間的幅度差;遠(yuǎn)場模型則將聲波看成平面波,它忽略各陣元接收信號間的幅度差,近似認(rèn)為各接收信號之間是簡單的時延關(guān)系。顯然遠(yuǎn)場模型是對實際模型的簡化,極大地簡化了處理難度。一般語音增強(qiáng)方法就是基于遠(yuǎn)場模型。

近場模型和遠(yuǎn)場模型的劃分沒有絕對的標(biāo)準(zhǔn),一般認(rèn)為聲源離麥克風(fēng)陣列中心參考點的距離遠(yuǎn)大于信號波長時為遠(yuǎn)場;反之,則為近場。設(shè)均勻線性陣列相鄰陣元之間的距離(又稱陣列孔徑)為d,聲源最高頻率語音的波長(即聲源的最小波長)為λmin,如果聲源到陣列中心的距離大于2d2/λmin,為遠(yuǎn)場模型,否則為近場模型,示意圖如下圖1所示。

麥克風(fēng)陣列的拓?fù)浣Y(jié)構(gòu)

麥克風(fēng)陣列的拓?fù)浣Y(jié)構(gòu)可以分為線性拓?fù)?、平面拓?fù)?,還有三維拓?fù)?,如下圖2麥克風(fēng)的三種拓?fù)浣Y(jié)構(gòu),其中線性陣列的結(jié)構(gòu)簡單、容易分析、算法復(fù)雜度相對較低,但是他的估計有效性估計是一維的,只能定位信號源的方向角度。平面陣列中常見的是均勻圓陣,如下圖3京東公司推出的叮咚mini的就是4顆麥克風(fēng)均勻按圓形排列。

圖3京東叮咚mini的麥克風(fēng)均勻圓陣

定位原理

TDOA定位是一種利用時間差進(jìn)行定位的方法。通過測量信號到達(dá)監(jiān)測站的時間,可以確定信號源的距離。利用信號源到各個監(jiān)測站的距離(以監(jiān)測站為中心,距離為半徑作圓),就能確定信號的位置。但是絕對時間一般比較難測量,通過比較信號到達(dá)各個監(jiān)測站的絕對時間差,就能作出以監(jiān)測站為焦點,距離差為長軸的雙曲線,雙曲線的交點就是信號的位置。

假設(shè)測得聲源到第n個麥克風(fēng)接收到聲源所發(fā)出的聲音信號的時刻分別為ti(i=1,2,3,4...n),且假設(shè)標(biāo)簽到第n個基站的距離為ri(i=1,2,3,4...n)如下圖4聲源到麥克風(fēng)的傳輸示意圖。

.

在基站之間完全同步的情況下,得出定位標(biāo)簽相對于四組定位基站(假設(shè)1#、2#為第一組,2#、3#為第二組,3#、4#為第三組,4#、1#為第四組)的距離差di12~di14為:

假設(shè)空間布有N個基站,同時利用多個TDOA 測量值可以構(gòu)成關(guān)于標(biāo)簽位置的雙曲線方程組,求解此方程組即可得到標(biāo)簽坐標(biāo)。

TDOA估值進(jìn)行聲源定位,三顆麥克風(fēng)陣列可以確定空間聲源位置,增加麥克風(fēng)會增高數(shù)據(jù)精度。定位的方法有MLE最大似然估計,最小方差,球形差值和線性相交等,TDOA相對來講應(yīng)用廣泛,定位精度高,且計算量最小,實時性好,可用于實時跟蹤,在目前大部分的智能定位產(chǎn)品中均采用TDOA技術(shù)作為定位技術(shù)。

廣州大學(xué)華軟軟件學(xué)院省級“創(chuàng)新強(qiáng)校工程”科研項目《基于人工智能的自然語言交互設(shè)備研究》(2017KQNCX274)

參考文獻(xiàn):

[1]張芳.基于STM32的麥克風(fēng)陣列聲源定位系統(tǒng)研究[D].河北:燕山大學(xué),2014.

[2]鄧承韻.基于麥克風(fēng)陣列的語音分離算法研究[D].北京:北京郵電大學(xué),2019.

[3]高健; 陸陽; 李慶巧; 衛(wèi)星.采用三次通信的TOF與TDOA聯(lián)合定位算法[D].安徽:電子測量與儀器學(xué)報,2020.

[4]郝張紅; 段羽浩; 韓彬彬.基于TDOA的聲源定位算法研究及實現(xiàn)[D].安徽:信息系統(tǒng)工程,2020.

[5]高健;陸陽;李慶巧;衛(wèi)星.基于UWB技術(shù)的無人機(jī)室內(nèi)飛行測試平臺設(shè)計[D].湖南:傳感器與微系統(tǒng),2019.

猜你喜歡
遠(yuǎn)場麥克風(fēng)聲源
虛擬聲源定位的等效源近場聲全息算法
Binaural Rendering based on Linear Differential Microphone Array and Ambisonic Reproduction
基于GCC-nearest時延估計的室內(nèi)聲源定位
電子制作(2019年23期)2019-02-23 13:21:12
基于數(shù)字麥克風(fēng)的WIFI語音發(fā)射機(jī)
電子測試(2018年23期)2018-12-29 11:11:24
基于仿真與實測的列車遠(yuǎn)場氣動噪聲分析
麥克風(fēng)的藝術(shù)
運用內(nèi)積相關(guān)性結(jié)合迭代相減識別兩點聲源
某種陣列雷達(dá)發(fā)射通道遠(yuǎn)場校準(zhǔn)簡易方法
麥克風(fēng)
力-聲互易在水下聲源強(qiáng)度測量中的應(yīng)用
茂名市| 鄂州市| 亚东县| 交口县| 迁安市| 潮安县| 丰县| 马龙县| 太康县| 西昌市| 霍林郭勒市| 荆州市| 华池县| 涟水县| 淄博市| 武隆县| 田东县| 东兰县| 普兰店市| 广平县| 且末县| 财经| 沧源| 大理市| 闽侯县| 土默特左旗| 乌兰察布市| 彭阳县| 怀远县| 延安市| 永兴县| 三原县| 东丰县| 原阳县| 西宁市| 繁峙县| 平阳县| 寿宁县| 固安县| 道真| 靖边县|