国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多層感知機(jī)與無(wú)網(wǎng)格策略的三維空間聲源識(shí)別

2023-09-19 06:13:10賀銀芝楊現(xiàn)暉劉永銘楊志剛龐加斌
關(guān)鍵詞:麥克風(fēng)聲源波束

賀銀芝, 楊現(xiàn)暉, 劉永銘, 楊志剛, 龐加斌

(1. 同濟(jì)大學(xué) 汽車學(xué)院,上海 201804;2. 同濟(jì)大學(xué) 上海地面交通工具風(fēng)洞中心,上海 201804;3. 同濟(jì)大學(xué) 上海地面交通工具空氣動(dòng)力與熱環(huán)境模擬重點(diǎn)實(shí)驗(yàn)室,上海 201804)

波束形成作為一種聲場(chǎng)可視化技術(shù),常用于聲源定位。常用的波束形成算法主要包括傳統(tǒng)互譜算法及其增強(qiáng)、解卷積算法等。傳統(tǒng)互譜算法原理簡(jiǎn)單,運(yùn)算速度快,具有較強(qiáng)的魯棒性,然而它的主要缺點(diǎn)包括低頻時(shí)較差的空間分辨率以及由于旁瓣效應(yīng)造成的較差的動(dòng)態(tài)范圍。常用的解卷積算法包括CLEAN[1]、CLEAN-SC[2]、DAMAS[3]等算法,相比于傳統(tǒng)互譜算法,有更好的空間分辨率和動(dòng)態(tài)范圍。但基于相控麥克風(fēng)陣列的波束形成算法仍存在兩方面不足:一是無(wú)法同時(shí)滿足高效率和高性能;二是在傳遞矢量未知的復(fù)雜流動(dòng)環(huán)境中使用相控麥克風(fēng)陣列時(shí),由于傳遞矢量的不確定性,相控麥克風(fēng)陣列識(shí)別精度會(huì)很差[4]。

在經(jīng)典假設(shè)(非相干聲源、單極子傳播、無(wú)混響環(huán)境、均勻介質(zhì))不成立的情況下,機(jī)器學(xué)習(xí)的應(yīng)用前景廣闊。深度學(xué)習(xí)作為一種特殊的機(jī)器學(xué)習(xí),通過(guò)使用反向傳播算法,能夠從大量的數(shù)據(jù)中,找到輸入與輸出數(shù)據(jù)間的關(guān)系。近年來(lái),隨著深度學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的發(fā)展,很多學(xué)者嘗試將深度學(xué)習(xí)應(yīng)用于聲源識(shí)別,這些工作大多集中在獲取聲源的到達(dá)方向(direction of arrival,DOA)。最近幾年,有一些學(xué)者開(kāi)始使用深度學(xué)習(xí)方法研究如何確定聲源的具體位置與強(qiáng)度。

2018 年,Ma 等[4]構(gòu)造了七層卷積神經(jīng)網(wǎng)絡(luò),并應(yīng)用于麥克風(fēng)陣列聲源定位,他們將麥克風(fēng)陣列采集到的信號(hào)所構(gòu)成的互譜矩陣轉(zhuǎn)換為圖像作為輸入,將各個(gè)網(wǎng)格點(diǎn)上的聲源強(qiáng)度作為輸出,通過(guò)大量的數(shù)據(jù)訓(xùn)練,發(fā)現(xiàn)在一定頻率和網(wǎng)格密度情況下,對(duì)于多點(diǎn)等強(qiáng)度聲源,卷積神經(jīng)網(wǎng)絡(luò)能夠較為準(zhǔn)確地識(shí)別聲源位置,并且計(jì)算速度明顯快于DAMAS 算法。但是,由于其網(wǎng)格劃分僅為160 mm×160 mm,故結(jié)果不切實(shí)際。在Ma 等[4]的基礎(chǔ)上,宋章辰等[5]構(gòu)造了相似的卷積神經(jīng)網(wǎng)絡(luò),探討了空間分辨率與網(wǎng)格間距的比值對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練精度的影響。

基于網(wǎng)格點(diǎn)的策略限制了神經(jīng)網(wǎng)絡(luò)出色的非線性建模能力,也限制了聲源識(shí)別的空間分辨率,因此本文采用無(wú)網(wǎng)格策略。所謂無(wú)網(wǎng)格策略即不將聲源區(qū)域劃分成若干網(wǎng)格,可以大大增加聲源識(shí)別的空間分辨率。Castellini 等[6-7]在2021 年提出一種基于多層感知機(jī)的無(wú)網(wǎng)格聲源定位方法,將互譜矩陣重新排列成一維列向量作為輸入,輸出是多個(gè)聲源的位置及強(qiáng)度。文獻(xiàn)[8-9]中均使用了一種基于殘差網(wǎng)絡(luò)的聲源定位方法,同樣基于無(wú)網(wǎng)格策略,輸入的是傳統(tǒng)互譜算法得到的聲源分布圖,輸出的是聲源位置及強(qiáng)度,能夠定位任意頻率的單聲源,并且精度高于傳統(tǒng)互譜算法,在聲源強(qiáng)度方面也有較高精度。

三維空間聲源定位在實(shí)際應(yīng)用中具有非常重要的意義,比如對(duì)復(fù)雜的機(jī)械部件、發(fā)動(dòng)機(jī)和一些氣動(dòng)聲源等噪聲源的定位。有兩種方法實(shí)現(xiàn)三維波束形成:第一種方法是將聲源潛在的三維空間劃分為多個(gè)有一定間距的、平行于麥克風(fēng)陣列的聲平面,然后用二維平面麥克風(fēng)陣列逐一掃描,尋找聲源。這種方法應(yīng)用簡(jiǎn)單,對(duì)麥克風(fēng)陣列設(shè)備要求不高,缺點(diǎn)是單一平面麥克風(fēng)陣列在垂直陣列方向上的空間分辨率較差[10-11]。第二種方法是構(gòu)造三維麥克風(fēng)陣列。2006 年,Meyer 和D?bler[12]利用GFai公司設(shè)計(jì)開(kāi)發(fā)的球形麥克風(fēng)陣列重構(gòu)了車內(nèi)聲場(chǎng),球形麥克風(fēng)陣列后來(lái)也被廣泛應(yīng)用于復(fù)雜三維物體表面的聲源定位。2009年,Maffei 和Bianco[13]在Pininfarina 風(fēng)洞的頂部和側(cè)壁各安裝了一個(gè)麥克風(fēng)陣列,分別由78和66個(gè)麥克風(fēng)組成,結(jié)合光學(xué)掃描系統(tǒng)測(cè)得的車輛幾何形狀,很好地識(shí)別了車輛表面的氣動(dòng)噪聲源。2013年,Padois等[14]在風(fēng)洞兩側(cè)安裝了4個(gè)麥克風(fēng)陣列,每個(gè)陣列由48個(gè)麥克風(fēng)構(gòu)成,用來(lái)識(shí)別三維單極子聲源和偶極子聲源。2014 年,Porteous等[15]在Adelaide大學(xué)風(fēng)洞內(nèi)利用兩個(gè)正交麥克風(fēng)陣列來(lái)實(shí)現(xiàn)三維聲源的定位。2016年,D?bler 等[16]在保時(shí)捷風(fēng)洞用三個(gè)麥克風(fēng)陣列識(shí)別了汽車表面的氣動(dòng)噪聲源,麥克風(fēng)陣列分別被布置在車輛的頂部和左右兩側(cè)。2018年,Ocker和Paul[17]在保時(shí)捷風(fēng)洞中用三個(gè)麥克風(fēng)陣列結(jié)合激光掃描系統(tǒng)進(jìn)行了類似的工作。

本文在Castellini 等[6-7]工作的基礎(chǔ)上,使用多層感知機(jī)神經(jīng)網(wǎng)絡(luò),并基于無(wú)網(wǎng)格策略,將二維平面聲源定位拓展到三維空間聲源定位。針對(duì)等強(qiáng)度雙聲源的位置和強(qiáng)度進(jìn)行了預(yù)測(cè),并與波束形成算法的結(jié)果進(jìn)行了對(duì)比,探討訓(xùn)練數(shù)據(jù)數(shù)量以及聲源頻率對(duì)多層感知機(jī)、波束形成算法的影響。

1 算法原理

1.1 傳統(tǒng)互譜算法

對(duì)于xs處一個(gè)強(qiáng)度為q的聲源,第i個(gè)麥克風(fēng)上測(cè)到的聲壓為

其中g(shù)(xi,xs)是xs處的聲源到xi處麥克風(fēng)的傳遞矢量,對(duì)于無(wú)來(lái)流時(shí)的單極子聲源,其傳遞矢量為

式中:ω是角頻率; R=xi-xs為聲源到麥克風(fēng)之間的距離矢量為單極子聲源在流體中的傳播時(shí)間,其中c為聲速。對(duì)各個(gè)麥克風(fēng)測(cè)到的聲壓信號(hào)進(jìn)行加權(quán),在聲源區(qū)域任意一點(diǎn)xt上計(jì)算到的聲壓為

式中:p 是所有麥克風(fēng)測(cè)到的聲壓;H 是共軛轉(zhuǎn)置;h(xt)稱為導(dǎo)向矢量[18],本文選用

式中:g 是傳遞矢量;N 是麥克風(fēng)數(shù)量。將加權(quán)后的聲壓信號(hào)做自功率譜計(jì):

式中:E是期望算子;“*”是復(fù)共軛;C是互譜矩陣。

導(dǎo)向矢量公式(4)能夠準(zhǔn)確地計(jì)算聲源位置,但是會(huì)錯(cuò)誤計(jì)算聲源強(qiáng)度,因此需要幅值校正。因?yàn)槭褂迷搶?dǎo)向矢量公式時(shí),對(duì)二維平面沒(méi)有問(wèn)題,但對(duì)于三維空間來(lái)說(shuō),波束形成算法會(huì)引入空間相關(guān)的“陣列增益”,這個(gè)“陣列增益”將放大靠近麥克風(fēng)陣列中心的信號(hào),縮小遠(yuǎn)離麥克風(fēng)陣列中心的信號(hào)。這個(gè)增益理論上可以用式(5)計(jì)算出來(lái)的聲源強(qiáng)度除以一個(gè)修正系數(shù)rcor來(lái)消除,則正確的聲源強(qiáng)度Btrue為

結(jié)合Sarradj 等[10]的工作,可推導(dǎo)出對(duì)于單極子聲源,其修正系數(shù)為

1.2 多層感知機(jī)神經(jīng)網(wǎng)絡(luò)

本文提出的神經(jīng)網(wǎng)絡(luò)模型是針對(duì)回歸的多層感知機(jī)(MLP)方法,給定一組輸入-輸出連續(xù)變量,該模型的任務(wù)是在給定新的統(tǒng)計(jì)獨(dú)立的輸入數(shù)據(jù)的情況下預(yù)測(cè)新的連續(xù)輸出。多層感知機(jī)是一種特定的前饋人工神經(jīng)網(wǎng)絡(luò)(ANNs),它有一個(gè)輸入層,一個(gè)或多個(gè)隱藏層和一個(gè)輸出層,可以根據(jù)任務(wù)(即分類或回歸)進(jìn)行模型構(gòu)建,本文提出的模型是基于六層隱藏層的MLP 架構(gòu),具有整流線性單元(ReLU)和線性激活函數(shù)。而且網(wǎng)絡(luò)參數(shù)數(shù)量要滿足以下條件4×S×M?參數(shù)數(shù)量[6-7],例如在本文中200 萬(wàn)數(shù)據(jù)(M)、2個(gè)點(diǎn)生源(S),參數(shù)數(shù)量為1 296滿足此條件。

將互譜矩陣展開(kāi)成一維向量作為輸入[6-7],將聲源的三維坐標(biāo)以及強(qiáng)度作為輸出,互譜矩陣的大小取決于麥克風(fēng)數(shù)量。本文所用36 通道麥克風(fēng)分布在XZ平面上,如圖 1a所示。潛在聲源區(qū)域中心(0,0,1)到麥克風(fēng)陣列所在平面的距離是1 m,潛在聲源區(qū)域是一個(gè)0.5 m×0.5 m×0.5 m 的三維空間,聲源在潛在聲源區(qū)域中隨機(jī)分布,所用的雙點(diǎn)等強(qiáng)度聲源的位置和強(qiáng)度隨機(jī)生成,聲源強(qiáng)度范圍為80~100 dB,如圖1b所示。

圖1 36通道麥克風(fēng)的位置與聲源區(qū)域和麥克風(fēng)陣列的空間布局Fig. 1 Location of 36-channel microphone with sound source area and spatial layout of microphone array

為了便于訓(xùn)練,將聲源位置和強(qiáng)度分開(kāi),分別建立兩個(gè)模型,一個(gè)輸出預(yù)測(cè)聲源的位置,另一個(gè)輸出預(yù)測(cè)聲源的強(qiáng)度。模型的參數(shù)和結(jié)構(gòu)見(jiàn)表1和表2,可訓(xùn)練參數(shù)分別為285 633和285 591。對(duì)于三維空間的聲源定位比二維平面多了一個(gè)坐標(biāo)值,在預(yù)測(cè)聲源位置時(shí),輸出層增加了一個(gè)神經(jīng)元。

表1 多層感知機(jī)神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)參數(shù) (用于聲源位置預(yù)測(cè))Tab. 1 Infrastructure parameters of multi-layer perceptron neural network model (for sound source localization prediction)

表2 多層感知機(jī)神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)參數(shù)(用于聲源強(qiáng)度預(yù)測(cè))Tab. 2 Infrastructure parameters of multi-layer perceptron neural network model (for sound source intensity prediction)

對(duì)于神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),收集大量數(shù)據(jù)用于模型的訓(xùn)練、驗(yàn)證和最終測(cè)試是很重要的。本文通過(guò)隨機(jī)仿真生成的方法獲得大量數(shù)據(jù):加載麥克風(fēng)陣列中各麥克風(fēng)的位置;隨機(jī)生成大量不同位置不同強(qiáng)度的雙點(diǎn)等強(qiáng)度聲源;根據(jù)式(5)生成所采用麥克風(fēng)陣列的互譜矩陣。在訓(xùn)練過(guò)程中,將生成的數(shù)據(jù)集按8:1:1劃分,分別作為訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)和測(cè)試數(shù)據(jù)。

多層感知機(jī)預(yù)測(cè)聲源具體的位置和強(qiáng)度,屬于一個(gè)回歸問(wèn)題,因此選用均方誤差作為損失函數(shù),來(lái)衡量預(yù)測(cè)值和真實(shí)值之間的誤差:

式中:L為模型預(yù)測(cè)的聲源位置數(shù)量或強(qiáng)度數(shù)量為真實(shí)的聲源位置或強(qiáng)度;xi為預(yù)測(cè)的聲源位置或強(qiáng)度。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中,通過(guò)調(diào)整權(quán)重參數(shù)和偏置來(lái)降低損失函數(shù)。這里選用Adam優(yōu)化器來(lái)更新權(quán)重參數(shù)和偏置。學(xué)習(xí)率設(shè)為0.001,批處理參數(shù)(batch size)設(shè)為5 000,迭代100 步。使用的電腦CPU速度為2.10 GHz,顯卡型號(hào)為1070ti。

2 結(jié)果分析

2.1 多層感知機(jī)與波束形成算法仿真性能對(duì)比

選用5 000 Hz時(shí)1萬(wàn)組隨機(jī)分布的聲源作為測(cè)試對(duì)象,選取0.005 m的網(wǎng)格長(zhǎng)度,得到的聲源位置誤差和強(qiáng)度誤差如圖2所示。

圖2 基于傳統(tǒng)互譜算法得到的聲源1的位置誤差與強(qiáng)度誤差分布(5 000 Hz)Fig. 2 Position error and intensity error distribution of sound source 1 based on conventional cross-spectrum algorithm (5 000 Hz)

圖2中縱軸的頻次等于頻數(shù)除以總數(shù)??梢钥闯?,聲源1在X、Z方向的位置誤差近似關(guān)于0對(duì)稱,主要集中在0附近,但是還存在小部分極大的誤差(遠(yuǎn)大于網(wǎng)格長(zhǎng)度,稱這部分誤差為極端誤差)。Y方向的誤差,大部分分布在0附近,但是極端誤差卻全部集中在負(fù)半軸,這是因?yàn)閷?duì)于三維波束形成,在使用了導(dǎo)向矢量后,會(huì)放大靠近麥克風(fēng)陣列的信號(hào),縮小遠(yuǎn)離麥克風(fēng)陣列的信號(hào);對(duì)于等強(qiáng)度雙點(diǎn)聲源,當(dāng)兩聲源近似垂直于XZ平面時(shí),只能精確計(jì)算靠近麥克風(fēng)陣列的那個(gè)聲源的位置與強(qiáng)度,并且由于靠近麥克風(fēng)陣列的信號(hào)被放大,故會(huì)在靠近麥克風(fēng)陣列的某個(gè)位置出現(xiàn)第二個(gè)極大值。三維波束形成算法會(huì)將其識(shí)別成第二個(gè)聲源,因此計(jì)算得到的Y值減小,Y方向出現(xiàn)位置誤差,并且為負(fù)值。至于聲源強(qiáng)度,靠近麥克風(fēng)陣列的那個(gè)聲源強(qiáng)度經(jīng)過(guò)幅值校正后,強(qiáng)度準(zhǔn)確,但是遠(yuǎn)離陣列的那個(gè)聲源強(qiáng)度會(huì)被減弱,并且會(huì)在靠近麥克風(fēng)陣列附近產(chǎn)生一個(gè)“偽聲源”,強(qiáng)度低于第二個(gè)聲源強(qiáng)度。

相比于傳統(tǒng)互譜算法,基于解卷積的CLEAN-SC算法性能更好,且不受陣列點(diǎn)傳播函數(shù)的影響。圖3所示為使用CLEAN-SC得到的位置誤差以及強(qiáng)度誤差分布圖。從圖3可看出,CLEAN-SC得到的位置誤差遠(yuǎn)小于傳統(tǒng)互譜算法,在X、Z方向上的誤差主要集中在一個(gè)網(wǎng)格長(zhǎng)度范圍內(nèi),在Y方向上的誤差主要集中在三個(gè)網(wǎng)格長(zhǎng)度范圍內(nèi),表明平面麥克風(fēng)陣列在垂直陣列方向上的位置誤差要大一些。但是強(qiáng)度誤差方面,CLEAN-SC極端誤差的值和出現(xiàn)的頻次都要更大一些。

圖3 網(wǎng)格邊長(zhǎng)為0.005 m得到的雙聲源位置誤差與強(qiáng)度誤差分布(5 000 Hz)Fig. 3 Position error and intensity error distribution of dual sound sources with a mesh side length of 0.005 m (5 000 Hz)

對(duì)隨機(jī)分布的等強(qiáng)度雙點(diǎn)聲源,保持頻率為5 000 Hz,用160萬(wàn)訓(xùn)練數(shù)據(jù)去訓(xùn)練多層感知機(jī),得到的損失曲線如圖4所示??梢钥闯觯曉次恢煤蛷?qiáng)度的均方誤差很快就變得很小且趨于不變,說(shuō)明多層感知機(jī)收斂很快。圖5為識(shí)別的聲源位置誤差和強(qiáng)度誤差(多層感知機(jī),160萬(wàn)訓(xùn)練數(shù)據(jù)),發(fā)現(xiàn)基于多層感知機(jī)得到的雙點(diǎn)聲源三個(gè)方向上的位置誤差均優(yōu)于基于傳統(tǒng)互譜算法的結(jié)果(圖2),并且消除了極端誤差,在Y方向上的空間分辨率也很好。值得說(shuō)明的是,基于多層感知機(jī)的強(qiáng)度誤差較小,優(yōu)于各種波束形成算法。

圖4 基于160萬(wàn)訓(xùn)練數(shù)據(jù)得到的雙聲源的位置與強(qiáng)度損失曲線(5 000 Hz)Fig. 4 Position and intensity loss curves of dual sound sources based on a training data of 1.6 million (5 000 Hz)

圖5 基于160萬(wàn)訓(xùn)練數(shù)據(jù)得到的聲源1的位置誤差與強(qiáng)度誤差分布(5 000 Hz)Fig. 5 Position error and intensity error distribution of sound source 1 based on training data of 1.6 million(5 000 Hz)

2.2 訓(xùn)練數(shù)據(jù)量的影響

對(duì)于隨機(jī)分布的等強(qiáng)度雙點(diǎn)單極子聲源,保持頻率為5 000 Hz,分別用40萬(wàn)、80萬(wàn)、160萬(wàn)的數(shù)據(jù)訓(xùn)練多層感知機(jī),發(fā)現(xiàn)隨著訓(xùn)練數(shù)據(jù)的增大,多層感知機(jī)逐漸充分學(xué)習(xí)到數(shù)據(jù)中隱藏的規(guī)律,位置誤差和強(qiáng)度誤差不斷減小。

2.3 頻率的影響

在聲源定位過(guò)程中,聲源頻率是最重要的考慮因素之一。下面探討聲源頻率對(duì)多層感知機(jī)與波束形成算法的影響。圖6、圖7分別為2 000、8 000 Hz頻率下,基于CLEAN算法得到的聲源1的位置誤差及強(qiáng)度誤差(網(wǎng)格邊長(zhǎng)0.005 m)??梢园l(fā)現(xiàn)隨著聲源頻率增大,聲源位置的極端誤差減小,強(qiáng)度誤差也有所改善。圖8、圖9分別為2 000、8 000 Hz頻率下,基于160萬(wàn)訓(xùn)練數(shù)據(jù)得到的點(diǎn)聲源1的位置誤差與強(qiáng)度誤差。

圖6 基于CLEAN得到的聲源1的位置誤差與強(qiáng)度誤差分布(2 000 Hz)Fig. 6 Position error and intensity error distribution of sound source 1 based on CLEAN (2 000 Hz)

圖7 基于CLEAN得到的聲源1的位置誤差與強(qiáng)度誤差分布(8 000 Hz)Fig. 7 Position error and intensity error distribution of sound source 1 based on CLEAN (8 000 Hz)

圖8 基于160萬(wàn)訓(xùn)練數(shù)據(jù)得到的聲源1的位置誤差與強(qiáng)度誤差分布(2 000 Hz)Fig. 8 Position error and intensity error distribution of sound source 1 based on training data of 1.6 million

圖9 基于160萬(wàn)訓(xùn)練數(shù)據(jù)得到的聲源1的位置誤差與強(qiáng)度誤差分布(8 000 Hz)Fig. 9 Position error and intensity error distribution of sound source 1 based on training data of 1.6 million(8 000 Hz)

可以發(fā)現(xiàn),隨著聲源頻率的增大,位置誤差和強(qiáng)度誤差略有增大。相比基于CLEAN算法計(jì)算的聲源位置誤差及強(qiáng)度誤差,在低頻時(shí),多層感知機(jī)的位置誤差更??;高頻時(shí),多層感知機(jī)的位置誤差偏大。聲源強(qiáng)度方面,多層感知機(jī)的強(qiáng)度誤差遠(yuǎn)小于波束形成算法得到的強(qiáng)度誤差。

3 結(jié)論

多層感知機(jī)算法與傳統(tǒng)互譜算法、解卷積算法等波束形成算法有著明顯區(qū)別。首先,多層感知機(jī)算法不需要預(yù)先得到聲傳播方程,即傳遞矢量,而傳遞矢量是波束形成算法的先決條件;其二是多層感知機(jī)算法甚至不需要預(yù)先知道麥克風(fēng)在陣列中的位置,這也是波束形成算法的先決條件。第一個(gè)區(qū)別使得多層感知機(jī)算法有一個(gè)巨大優(yōu)勢(shì),即可以在很多復(fù)雜場(chǎng)景中使用。在這些場(chǎng)景中,因傳遞矢量未知而無(wú)法使用波束形成算法。第二個(gè)區(qū)別使得多層感知機(jī)算法具有另一個(gè)優(yōu)勢(shì),即可以避免麥克風(fēng)在安裝過(guò)程中由位置偏差引起的誤差。但是,這些優(yōu)勢(shì)的前提是多層感知機(jī)算法可以準(zhǔn)確地從互譜矩陣中計(jì)算到聲源位置以及強(qiáng)度。

本文使用了具有Tensorflow 后端的keras 框架來(lái)搭建多層感知機(jī)神經(jīng)網(wǎng)絡(luò),通過(guò)Matlab 產(chǎn)生了大量仿真數(shù)據(jù)。通過(guò)訓(xùn)練后,對(duì)雙點(diǎn)等強(qiáng)度聲源的位置以及強(qiáng)度進(jìn)行了預(yù)測(cè),并與波束形成算法進(jìn)行了對(duì)比,得到以下主要結(jié)論:

(1) 多層感知機(jī)訓(xùn)練過(guò)程需要幾個(gè)甚至十幾個(gè)小時(shí),訓(xùn)練數(shù)據(jù)越多所需要的時(shí)間越久,消耗的計(jì)算資源越多,但是訓(xùn)練完成后的計(jì)算速度非???。如果有大量數(shù)據(jù)需要處理,可以考慮使用多層感知機(jī)。隨著訓(xùn)練數(shù)據(jù)的增加,多層感知機(jī)逐漸充分學(xué)習(xí)到數(shù)據(jù)中隱藏的規(guī)律,位置誤差和強(qiáng)度誤差均在減小。

(2) 相較于傳統(tǒng)互譜算法,CLEAN等解卷積算法計(jì)算到的雙點(diǎn)聲源的位置誤差大大減少了,但是強(qiáng)度方面,極端誤差的值和出現(xiàn)的頻次都要更大一些。波束形成算法強(qiáng)度誤差較大,且主要集中在負(fù)半軸。多層感知機(jī)采用無(wú)網(wǎng)格策略,位置誤差與強(qiáng)度誤差與網(wǎng)格間距無(wú)關(guān)。

(3) 多層感知機(jī)在三個(gè)方向的位置誤差、特別是Y 方向的位置誤差,遠(yuǎn)小于傳統(tǒng)互譜算法的位置誤差,但是性能不及CLEAN算法。在強(qiáng)度方面,多層感知機(jī)的性能好于各種波束形成算法。

(4) 隨著聲源頻率的增大,波束形成算法計(jì)算到的聲源位置的極端誤差在減小,強(qiáng)度誤差也有所改善;而多層感知機(jī)預(yù)測(cè)的位置誤差和強(qiáng)度誤差略有增大。多層感知機(jī)在低頻時(shí)性能優(yōu)于波束形成算法,可用來(lái)彌補(bǔ)波束形成算法在低頻時(shí)空間分辨率性能不佳的局限性。

作者貢獻(xiàn)聲明:

賀銀芝:思路設(shè)計(jì)、文章撰寫(xiě)及修改。

楊現(xiàn)暉:數(shù)據(jù)處理及初稿撰寫(xiě)。

劉永銘:文獻(xiàn)查閱及圖表繪制。

楊志剛:提出修改建議。

龐加斌:提出修改建議。

猜你喜歡
麥克風(fēng)聲源波束
虛擬聲源定位的等效源近場(chǎng)聲全息算法
Binaural Rendering based on Linear Differential Microphone Array and Ambisonic Reproduction
毫米波大規(guī)模陣列天線波束掃描研究*
基于GCC-nearest時(shí)延估計(jì)的室內(nèi)聲源定位
電子制作(2019年23期)2019-02-23 13:21:12
基于數(shù)字麥克風(fēng)的WIFI語(yǔ)音發(fā)射機(jī)
圓陣多波束測(cè)角探究
Helix陣匹配場(chǎng)三維波束形成
麥克風(fēng)的藝術(shù)
運(yùn)用內(nèi)積相關(guān)性結(jié)合迭代相減識(shí)別兩點(diǎn)聲源
麥克風(fēng)
长海县| 邯郸县| 沂南县| 临武县| 无棣县| 漠河县| 离岛区| 阆中市| 钟祥市| 呼伦贝尔市| 双城市| 台湾省| 丰镇市| 宁阳县| 循化| 邵阳市| 忻州市| 西乌珠穆沁旗| 上蔡县| 潮安县| 叶城县| 镇宁| 横山县| 棋牌| 玉树县| 南宫市| 武邑县| 尼玛县| 林州市| 上杭县| 建平县| 泸州市| 盐池县| 肥西县| 剑河县| 忻州市| 宝丰县| 日喀则市| 凌源市| 五台县| 曲阳县|