李 悟 王 玫 宋浠瑜 羅麗燕 覃虹菱
(1 桂林電子科技大學(xué) 認(rèn)知無線電與信息處理省部共建教育部重點(diǎn)實(shí)驗(yàn)室 桂林 541004)
(2 桂林理工大學(xué)信息科學(xué)與工程學(xué)院 桂林 541004)
在室內(nèi)聲源定位的過程中,由于復(fù)雜的室內(nèi)環(huán)境造成的混響會(huì)干擾對聲源位置的判斷,很難僅僅通過傳聲器陣列對聲源進(jìn)行準(zhǔn)確定位。近年來對聲源定位的一系列研究表明,在已知室內(nèi)空間結(jié)構(gòu)的前提下,可以建立更加準(zhǔn)確的室內(nèi)混響模型,有效分離反射信號(hào)和直達(dá)信號(hào),實(shí)現(xiàn)更加精準(zhǔn)的聲源定位。如文獻(xiàn)[1–2]提出:在進(jìn)行聲源定位之前,利用定向聲源估計(jì)地板、天花板和墻的位置對于輔助聲源定位具有重要的作用;文獻(xiàn)[3]同時(shí)提出:利用有限元分析法建立的室內(nèi)聲場模型可以輔助多聲源同時(shí)定位。
在研究室內(nèi)空間結(jié)構(gòu)重構(gòu)方面,聲信號(hào)易于收發(fā)處理被視為實(shí)現(xiàn)室內(nèi)結(jié)構(gòu)重構(gòu)的理想信號(hào)。關(guān)于這方面的研究,不少學(xué)者也做出了很多杰出的工作。Dokmani? 等[4]在2011年提出了基于聲源傳聲器一體的方案,借助image 模型利用一階、二階反射信號(hào)到達(dá)時(shí)間,通過矩陣變換確定房間結(jié)構(gòu);文獻(xiàn)[5]提出利用脈沖信號(hào)的反射到達(dá)時(shí)間和遺傳算法估計(jì)矩形或者L 形房間的幾何結(jié)構(gòu);文獻(xiàn)[6]提出將傳聲器和聲源假設(shè)為橢圓的兩個(gè)焦點(diǎn),通過尋找公切線的方式確定墻壁位置;文獻(xiàn)[7]利用墻面反射系數(shù)、各墻之間的距離、方位角、房間高度建立房間沖激響應(yīng)模型,通過L1 正則化成本函數(shù)來求解以上數(shù)值重建出房間結(jié)構(gòu);Dokmani? 等在文獻(xiàn)[8]中改善了他們的方案,利用歐式距離陣(Euclidean distance matrices,EDM)特性分類一階反射信號(hào)到達(dá)時(shí)間,借助image模型重構(gòu)出房間結(jié)構(gòu)。
以上方法雖然在一定程度上解決了房間幾何重構(gòu)的問題,但是每一種方法都有其局限性。文獻(xiàn)[4]提出的方法利用了二階反射信號(hào),但是,由于二階信號(hào)十分微弱,不能保證每次實(shí)驗(yàn)都能接收到完整的二階信號(hào),缺乏實(shí)用性;文獻(xiàn)[5]提出的方法需要找到一個(gè)合適的物理模型才能說明其理論的正確性;文獻(xiàn)[6]提出的方法利用了一階、二階反射信號(hào)的第一到達(dá)時(shí)間,但是該時(shí)間無法通過沖激響應(yīng)直接判斷;文獻(xiàn)[7]提出的方法需要處理一個(gè)非常復(fù)雜的矩陣,對建圖效率有很大影響;文獻(xiàn)[8]提出的方法引入了歐氏距離陣,但是這種方法在收發(fā)存在時(shí)間延遲的情況下誤差很大,時(shí)間延遲來源于信號(hào)收發(fā)處理時(shí)間、信號(hào)響應(yīng)時(shí)間和介質(zhì)中傳輸?shù)臅r(shí)間,尤其是介質(zhì)中傳輸?shù)臅r(shí)間在室內(nèi)這種復(fù)雜的多徑環(huán)境下很難精確測定,無法直接去除。本文針對文獻(xiàn)[8]方法中引入的信號(hào)傳播距離存在誤差的問題,提出了一種基于到達(dá)時(shí)間差(Time difference of arrival,TDOA)最小二乘誤差的室內(nèi)建圖方案,利用到達(dá)時(shí)間做差的方法消除時(shí)間延遲,通過最小二乘誤差判斷一階反射信號(hào),并實(shí)現(xiàn)待測房間幾何結(jié)構(gòu)的推測。
image 模型是由Allen 等[9]提出的一種描述小房間混響的聲學(xué)模型。文中假設(shè)聲源發(fā)出的信號(hào)一部分沿直線傳播直接被傳聲器所接收,另一部分經(jīng)過墻面或者障礙物反射被傳聲器接收,反射符合鏡面反射規(guī)律,入射角等于反射角。該方法利用反射階數(shù)(聲波經(jīng)過墻壁、地板、天花板反射的次數(shù))和房間維數(shù)表示房間混響,適用于具有規(guī)則幾何結(jié)構(gòu)的房間。聲音在房間內(nèi)傳播模型類似于一個(gè)多徑信道,描述房間信道情況可以用以下公式表示:
式(1)中,h(t)代表房間時(shí)域沖激響應(yīng),ai代表每一個(gè)信道的增益,τi代表每一個(gè)信道的時(shí)延。image模型如圖1所示。
圖1 image 模型下的一階鏡像源和二階鏡像源Fig.1 Image source model for first-and secondorder echoes
根據(jù)image模型:一階鏡像聲源(經(jīng)過一次墻面反射的鏡像聲源)坐標(biāo)和聲源坐標(biāo)關(guān)于每一面反射面(墻、天花板、地板)軸對稱,而鏡像源和傳聲器的連線與反射面的交點(diǎn)為反射點(diǎn)。聲源坐標(biāo)定義為s,鏡像聲源坐標(biāo)定義為si,聲源一階鏡像聲源點(diǎn)連線與墻線交點(diǎn)坐標(biāo)定義為pi,ni定義為與實(shí)聲源一階鏡像聲源連線共線的指向鏡像聲源的單位向量,pi ?s指聲源指向pi點(diǎn)的向量,指兩個(gè)向量的內(nèi)積也就是聲源點(diǎn)s到pi的距離,一階鏡像聲源si可以表示為[8]
一階鏡像聲源點(diǎn)二階鏡像聲源點(diǎn)連線與墻線交點(diǎn)坐標(biāo)定義為pj,nj定義為與一階鏡像聲源二階鏡像聲源連線共線的指向二階鏡像聲源的單位向量,pj ?si指一階鏡像聲源指向pj的向量,?pj ?si,nj?指兩個(gè)向量的內(nèi)積也就是一階鏡像聲源點(diǎn)si到pj的距離,二階鏡像聲源和一階鏡像聲源關(guān)于另一面墻軸對稱用sij表示,sij可以表示為[8]
實(shí)際上,實(shí)聲源和一階鏡像聲源連線的中垂面就代表了房間的墻面、天花板、地板所在的位置,得到了實(shí)聲源的坐標(biāo)和所有一階鏡像聲源的坐標(biāo)相當(dāng)于得到了房間的幾何構(gòu)型,求解實(shí)聲源和一階鏡像聲源的位置就是實(shí)現(xiàn)室內(nèi)構(gòu)圖的途徑。
由以上內(nèi)容可知,為了求解實(shí)聲源和一階鏡像聲源坐標(biāo),根據(jù)聲信號(hào)到達(dá)時(shí)間公式:
式(4)中,c代表聲信號(hào)在空氣中的傳播速度,r代表傳聲器的位置,∥si ?r∥代表聲源到傳聲器的歐式距離。ti可以利用室內(nèi)沖激響應(yīng)來得到,傳聲器陣列r的位置已知。要求解聲源si還需要解決以下幾個(gè)關(guān)鍵問題。
1.2.1 反射信號(hào)到達(dá)傳聲器次序不一致
TOA(Time of arrival)代表到達(dá)時(shí)間值。對于直達(dá)信號(hào)來說,信號(hào)到達(dá)的先后順序代表聲源到傳聲器位置的遠(yuǎn)近,由此可以很容易判斷每一個(gè)信號(hào)來自哪一個(gè)傳聲器。但是對于一階反射信號(hào)來說,先收到的反射信號(hào)不一定來自同一反射面,反射信號(hào)受到聲源傳聲器反射面三者位置關(guān)系的共同影響,有時(shí)會(huì)出現(xiàn)反射次序顛倒的問題,如圖2[8]所示同一個(gè)聲源發(fā)出的信號(hào)傳聲器1先收到藍(lán)色面反射的,而傳聲器2 先收到紅色面反射的。因此不能認(rèn)為反射信號(hào)都是以同一次序到達(dá)的。無法判斷反射信號(hào)的來源,定位聲源坐標(biāo)也就無從談起。
圖2 反射信號(hào)到達(dá)次序不一致Fig.2 Echo swapping
1.2.2 高階反射信號(hào)干擾
由于二階及其以上反射信號(hào)非常微弱,不能保證每次實(shí)驗(yàn)接收到完整的二階信號(hào),對于建圖來說,高階信號(hào)是不需要的成分,需要將其視為干擾進(jìn)行去除。如圖3所示,橫軸代表到達(dá)時(shí)間,縱軸代表時(shí)間域房間沖激響應(yīng)(Room impulse response,RIR)。
圖3 高階反射信號(hào)干擾Fig.3 Inference by higher-order echoes
針對1.2.1 節(jié)提出的反射信號(hào)到達(dá)次序不一致的問題,最早研究利用聲信號(hào)進(jìn)行房間重構(gòu)的Dokmani? 等在經(jīng)典文獻(xiàn)[8]中提出了利用歐式距離陣特性為反射信號(hào)歸類的方法。
歐式距離陣指的是假設(shè)歐幾里得空間X中存在N個(gè)點(diǎn),
X中任意兩點(diǎn)之間的歐式距離的平方可以表示為
展開式(6)得到
所有歐式距離平方可以構(gòu)成歐式距離陣D= [dij],定義為
其中,diag 代表對角陣,1 代表所有元素都為1 的向量,EDM包含完整的節(jié)點(diǎn)信息,而且形式易于處理,利用EDM可以重建這N個(gè)點(diǎn)的位置。
首先,將傳聲器之間的歐式距離作為矩陣的一部分元素建立歐氏距離陣,另一部分元素來源于根據(jù)沖激響應(yīng)測得的反射信號(hào)到達(dá)時(shí)間轉(zhuǎn)換成的傳播距離,這部分距離作為擴(kuò)展與原矩陣組成增廣矩陣,如圖4所示。
圖4 基于歐式距離陣的反射信號(hào)歸類法Fig.4 Process of echo sorting by EDM
多維尺度分析法(Multidimensional scaling,MDS)是一種對EDM 經(jīng)過變換來反推出符合約束條件的聲源位置以及傳聲器位置的方法。假設(shè)X為待求的聲源位置與傳聲器位置的坐標(biāo),x1坐標(biāo)為原點(diǎn),MDS可以表示為
于是,
其中,d1=De1,解算XTX可得
由于XTX為方陣,利用特征值分解可以得到
其中,Λ= diag(λ1,··· ,λn),Λ為以XTX特征值為元素的對角陣,U是正交化特征向量。求解X,可以得到
為了優(yōu)化重構(gòu)結(jié)果,這里引入了s-stress 的概念。s-stress 用來計(jì)算重構(gòu)出的點(diǎn)組成的EDM 與原EDM 之間的差距,可以衡量重構(gòu)的準(zhǔn)確性,計(jì)算公式如下:
具體算法過程如下:
(1)分別計(jì)算各傳聲器得到的房間沖激響應(yīng)。
(2)從各沖激響應(yīng)里隨機(jī)選取到達(dá)時(shí)間,通過公式(4)轉(zhuǎn)換為傳播距離。
(3)計(jì)算各傳播距離的平方與原EDM 組成的增廣矩陣。
(4)利用MDS 算法重構(gòu)出組成矩陣的各點(diǎn)的坐標(biāo)。
(5)計(jì)算出重建點(diǎn)的EDM與原EDM之間的差距s。
(6)重復(fù)以上步驟(2)~步驟(5),直至遍歷所有到達(dá)時(shí)間值。比較s的大小,其中令s最小的一組的到達(dá)時(shí)間可以被歸為一類。
(7)當(dāng)歸類好一組到達(dá)時(shí)間,去除該組到達(dá)時(shí)間值繼續(xù)分類直到結(jié)束為止。
利用歐氏距離陣分類反射信號(hào)是一種經(jīng)典算法。最重要的是,這種方法借用了s-stress 的思想,重建結(jié)果是否符合預(yù)期的標(biāo)準(zhǔn)在于EDM 中的每一個(gè)距離元素是否是準(zhǔn)確有效的,只有真實(shí)的一組來自于同一鏡像聲源的信號(hào)才是符合傳播規(guī)律的使s值最小,因此才能成功為反射信號(hào)分類。但是,隨著后期關(guān)于歐式距離法研究的深入,這種方法的不足之處也逐漸顯現(xiàn)了出來。最重要的一點(diǎn)在于上文提到的分類的成功與否完全取決于距離元素的準(zhǔn)確性?;赥OA 分類算法最大的弊端在于發(fā)射端和接收端之間存在的延遲很難處理,這些延遲包括信號(hào)處理收發(fā)的時(shí)間、信號(hào)響應(yīng)時(shí)間和介質(zhì)中傳輸?shù)臅r(shí)間,介質(zhì)傳輸?shù)臅r(shí)間受溫度以及室內(nèi)環(huán)境影響很大。因此,這些延遲不是精確已知的,是隨著時(shí)間而變化的變量。相當(dāng)于實(shí)際得到的到達(dá)時(shí)間為
其中,R代表實(shí)際距離,c代表聲速,?代表收發(fā)存在的延遲,β代表測量誤差。為了在室內(nèi)達(dá)到10 cm的精度,假設(shè)在20?C 的常溫條件下聲速為343 m/s,那么延遲不能大于0.3 ms。而在實(shí)際測試中,由于溫度、線路、編碼解碼速度的影響,信號(hào)會(huì)出現(xiàn)2~3 ms 的浮動(dòng)誤差,利用帶有較大誤差的距離進(jìn)行重建顯然會(huì)嚴(yán)重影響對反射信號(hào)歸類的判斷,而且還會(huì)影響求解出的聲源位置的精度。
1.3.1 基于到達(dá)時(shí)間差的聲源定位法
現(xiàn)有的利用到達(dá)時(shí)間差進(jìn)行定位的方法叫做到達(dá)時(shí)間差(TDOA)法,又稱為雙曲線定位法,TDOA 法的最大優(yōu)點(diǎn)在于能夠通過TOA 之間做差消除常量時(shí)延項(xiàng)?。在三維空間中需要至少四個(gè)傳聲器才能進(jìn)行定位。待測聲源發(fā)出的信號(hào)達(dá)到其中兩個(gè)傳聲器之間的時(shí)間差形成以這兩個(gè)傳聲器為焦點(diǎn)的雙曲面,四個(gè)傳聲器可以形成三對雙曲面,其中每兩個(gè)單邊雙曲面相交于一條線,這兩條線的交點(diǎn)就是聲源的位置。
為了得到更加準(zhǔn)確的定位結(jié)果,一般使用基于最小二乘誤差的迭代方法來求解目標(biāo)聲源坐標(biāo),這種方法首先定義成本函數(shù),表示聲源目標(biāo)定位精度,成本函數(shù)定義為[10]
其中,wi是權(quán)重,c是聲速,是第i個(gè)傳聲器到達(dá)時(shí)間和基準(zhǔn)傳聲器到達(dá)時(shí)間差的估計(jì),di是待測目標(biāo)與第i個(gè)傳聲器之間的距離值。假設(shè)目標(biāo)聲源的位置估計(jì)為
令成本函數(shù)公式(16)最小,可以得到聲源坐標(biāo)為
牛頓法、梯度下降法、高斯牛頓法、萊溫伯格-馬夸特法都可以用來結(jié)合公式(18)求解聲源坐標(biāo),這里不再贅述具體算法。
1.3.2 基于最小二乘誤差的匹配算法
為反射信號(hào)分類的思想實(shí)際還是聲源定位的過程,一組反射信號(hào)能夠分為一類是因?yàn)樗鼈兇嬖谝粋€(gè)共同的鏡像聲源點(diǎn)。那么只要選取一組到達(dá)時(shí)間,將它們轉(zhuǎn)換為傳播距離,檢驗(yàn)符合傳播的條件下是否存在一個(gè)共同的交點(diǎn)即可。注意到兩個(gè)傳播距離做差可以表示為一組雙曲線,那么取其中一個(gè)傳播距離分別與其他n個(gè)傳播距離做差就可以形成n條雙曲線。如果n條雙曲線可以確定唯一的一個(gè)交點(diǎn),這個(gè)點(diǎn)就是可能的一個(gè)聲源坐標(biāo),這組距離匹配成功。否則,如果不存在交點(diǎn),這組距離匹配失敗,原理如圖5所示。
圖5 利用雙曲線法進(jìn)行匹配的過程Fig.5 Matching echoes by TDOA method
圖6 反射信號(hào)遍歷的過程Fig.6 Matching TOAs by the least square method combing TDOA method
算法過程如下:
(1)假設(shè)存在k個(gè)傳聲器,分別計(jì)算各傳聲器得到的房間沖激響應(yīng)。
(2)從各沖激響應(yīng)里得到信號(hào)到達(dá)時(shí)間t,第1個(gè)小標(biāo)代表傳聲器序號(hào),第2 個(gè)小標(biāo)代表接收到信號(hào)的次序,例如t23代表第2 個(gè)傳聲器收到的第3 個(gè)反射信號(hào)。
(3)首先,令i= 1,l= 1,m= 1,···,r= 1,ε= +∞,p= (0,0,0),i < n。e為待求最小二乘誤差,o為待求鏡像聲源坐標(biāo)。
(4)以傳聲器1 為基準(zhǔn)傳聲器,取t1i與t2l,t3m,···,tkr組成一組1× k維數(shù)組進(jìn)行最小二乘誤差匹配求解e(x,y,z)和坐標(biāo)o。
(5)如果滿足e < ε,則令ε=e,p=o。如果不滿足轉(zhuǎn)入第(6)步。
(6)令r=r+1,檢驗(yàn)t1i ?τ < tkr < t1i+τ是否成立。如果成立,轉(zhuǎn)入第(4)步;如果不成立,令k ?1=k,r=1。
(7)檢驗(yàn)t1i ?τ ······ (8)檢驗(yàn)t1i ?τ < tlr < t1i+τ是否成立。如果成立,轉(zhuǎn)入第(4)步;如果不成立,輸出坐標(biāo)p,此時(shí)使ε最小的一組到達(dá)時(shí)間t1i,t2l,···,tkr被分類成功。 (9)令i=i+1,l= 1,m= 1,···,r= 1,ε=+∞,p=(0,0,0)。 (10)檢驗(yàn)i > n是否成立。如果成立,結(jié)束程序;如果不成立,轉(zhuǎn)入第(4)步。 針對第(6)步不等式需要說明的是,考慮到優(yōu)化算法的復(fù)雜度,不需要對每一個(gè)TOA 值都進(jìn)行匹配,根據(jù)三角形原理,兩邊之差小于第三邊,經(jīng)過同一墻面反射到達(dá)傳聲器陣列的信號(hào)之間的波程差小于陣列兩個(gè)陣元之間距離的最大值,因此在匹配的過程中設(shè)置t1i ?τ ~t1i+τ,τ=dmax/c的搜索門限就可以大大提高匹配效率。上述算法流程可以用圖7表示。 1.3.3 關(guān)于信號(hào)TOA的修正 通常情況下,在確定信號(hào)到達(dá)時(shí)間時(shí),普遍采用選擇信號(hào)沖激響應(yīng)的最高峰當(dāng)作信號(hào)到達(dá)時(shí)間。實(shí)際上,由于傳聲器陣列無法做到完全的同步,再加上人為測量誤差的影響,選擇最高峰作為信號(hào)到達(dá)時(shí)間是不準(zhǔn)確的,在遠(yuǎn)場定位情況下這種誤差會(huì)被放大,從而影響對實(shí)際聲源和鏡像聲源的判斷。假設(shè)在44.1 kHz的采樣頻率下,一個(gè)沖激響應(yīng)由10個(gè)采樣點(diǎn)組成,如果信號(hào)到達(dá)時(shí)間分別位于第1 個(gè)采樣點(diǎn)和第10個(gè)采樣點(diǎn),此時(shí)依然采用最高峰到達(dá)時(shí)間的話就會(huì)引入7 cm 的誤差。由于直達(dá)信號(hào)易于分離,本文采用利用直達(dá)信號(hào)對反射TOA進(jìn)行修正。 圖7 算法流程圖Fig.7 Algorithm flow chart 圖8 利用直達(dá)信號(hào)修正反射波TOAFig.8 Illustration of amending reflective TOAs by matching direct signals 如圖8所示,取完整直達(dá)信號(hào)峰值內(nèi)的幾個(gè)采樣點(diǎn)(如圖8紅線內(nèi))分別進(jìn)行最小二乘匹配,找到實(shí)際代表信號(hào)到達(dá)時(shí)間的位置,計(jì)算出最佳采樣點(diǎn)位置與峰值的差距τ,在后面進(jìn)行反射信號(hào)匹配時(shí)分別以tnm±τ來代替反射信號(hào)到達(dá)時(shí)間tnm,可以起到修正不同步的作用,實(shí)驗(yàn)證明利用這種方法進(jìn)行修正可以消除4~5 cm誤差。 上述方法實(shí)現(xiàn)了信號(hào)的歸類以及鏡像聲源的求解,解決了1.2.1 節(jié)的問題。對于1.2.2 節(jié)高階干擾的問題,考慮將其轉(zhuǎn)換為高階鏡像聲源來去除。按照匹配的步驟從先到達(dá)的TOA 匹配到后到達(dá)的TOA,先求出鏡像聲源坐標(biāo)可以認(rèn)為是低階鏡像聲源,后求出的為高階鏡像聲源??紤]到二階及其以上的聲源滿足圖1幾何關(guān)系,在這里規(guī)定,如果新求出的聲源與已有的聲源滿足如下規(guī)律, 那么就認(rèn)為新求出的聲源坐標(biāo)是一個(gè)二階及其以上階的聲源。其中,s1、s2分別代表已有的聲源和新求出的聲源,公式(19)來源于公式(3),公式(20)中的p2代表新舊聲源連線的中點(diǎn),公式(21)中的n2代表已有聲源指向新聲源的單位向量。去除高階干擾后再結(jié)合待測房間結(jié)構(gòu)去除不合理的鏡像聲源就可以得到真正的一階墻面鏡像聲源,從而通過幾何關(guān)系得到房間的幾何構(gòu)型以及尺寸。 實(shí)驗(yàn)場景選擇在桂林電子科技大學(xué)第七教學(xué)樓實(shí)驗(yàn)室走廊進(jìn)行,走廊是寬為2.3 m、高度為2.37 m 的狹長結(jié)構(gòu),前后沒有墻壁遮擋,大小合適,中間也沒有其他障礙物阻擋傳播路徑,是理想的實(shí)驗(yàn)場景。實(shí)驗(yàn)?zāi)康氖沁€原出左右兩面墻和天花板以及地板的位置,也就是實(shí)驗(yàn)場景的正面輪廓。傳聲器選用Behringer ECM 8000 全向型傳聲器4 個(gè),聲源選用哈曼卡頓aura studio 音響,外置聲卡選用M-AUDIO M-TRACK QUAD 4 通道聲卡,另外利用一臺(tái)惠普筆記本發(fā)射、采集和處理數(shù)據(jù)。為了便于去除直達(dá)信號(hào)和防止共振帶來的干擾,將聲源設(shè)置在距離傳聲器陣列較遠(yuǎn)的地方,聲源距傳聲器陣列中心2 m,同時(shí)為了區(qū)分出左右墻的區(qū)別,聲源設(shè)置在距離右邊墻壁0.36 m、左邊墻0.94 m 的地方,高度為0.82 m。傳聲器陣列采用4 個(gè)傳聲器設(shè)置成常見的十字形陣列,這種結(jié)構(gòu)能夠保證不管聲源在任何位置都能處于陣列的開口方向。傳聲器之間的間距為0.6 m,M1~M4 高度均為1.31 m。傳聲器陣列和聲源與外置聲卡相連,利用筆記本電腦上的abode audition 2018 采集傳聲器陣列接收到的信號(hào),利用MATLAB進(jìn)行后期處理。實(shí)驗(yàn)場景俯視圖和正面實(shí)景圖如圖9所示。 圖9 實(shí)驗(yàn)場景俯視圖和正面實(shí)景圖Fig.9 Arrangement of experimental equipment and picture of the corridor 本文選擇函數(shù)形式如下的正弦掃頻信號(hào)作為激勵(lì)信號(hào)[11]: 根據(jù)文獻(xiàn)[11],這種信號(hào)比較適合于求解系統(tǒng)沖激響應(yīng)信號(hào)。根據(jù)頻率響應(yīng),設(shè)定w1為500 Hz,w2為5000 Hz,T為信號(hào)時(shí)長,設(shè)置為0.01 s。 設(shè)置采樣率為44.1 kHz,利用頻域接收信號(hào)Y(ω)和頻域發(fā)射信號(hào)S(ω)經(jīng)過公式(23)計(jì)算得到的四個(gè)通道沖激響應(yīng),經(jīng)過傅里葉逆變換得到的時(shí)域沖激響應(yīng)如圖10所示。 從圖10 可以看出,率先到達(dá)的峰對應(yīng)直達(dá)信號(hào),隨后反射信號(hào)依次到達(dá)。以傳聲器正中心靠近地面的位置為坐標(biāo)原點(diǎn),以走廊通行方向?yàn)閥軸,以垂直兩墻壁方向?yàn)閤軸,以地板到天花板的垂直方向?yàn)閦軸,利用四個(gè)直達(dá)信號(hào)的TOA得到聲源坐標(biāo)為(0.76 m,2.01 m,0.70 m)。在直達(dá)波到達(dá)后50 ms內(nèi)進(jìn)行搜尋,分別利用設(shè)置閾值的方式挑選出直達(dá)波后的10 個(gè)到達(dá)信號(hào),選擇這10 個(gè)的到達(dá)時(shí)間組成10×4 的一組數(shù)據(jù),經(jīng)過匹配算法分別求得聲源坐標(biāo)為(1.46 m,2.02 m,0.72 m)、(?3.05 m,1.96 m,0.82 m)、(0.83 m,1.97 m,3.45 m)、(0.77 m,2.03 m,?0.94 m)、(0.40 m,1.95 m,1.13 m)、(0.94 m,1.39 m,?1.46 m)、(1.09 m,?0.42 m,?2.03 m)(由于后3 個(gè)峰值到達(dá)時(shí)間不滿足間隔小于陣列最大間距所對應(yīng)的時(shí)間值,因此沒有產(chǎn)生聲源坐標(biāo))。繪制以上坐標(biāo)在x、z方向的投影如圖11所示。 圖11 中五角星代表實(shí)際聲源,×坐標(biāo)經(jīng)過公式(19)~(21)檢驗(yàn)不符合二階聲源定義,(0.40 m,1.95 m,1.13 m)離實(shí)聲源太近顯然不是符合鏡像聲源常理,(0.94 m,1.39 m,?1.46 m)、(1.09 m,?0.42 m,?2.03 m)這兩個(gè)坐標(biāo)y軸偏差太大,也可以排除。因此它們代表由噪聲產(chǎn)生的錯(cuò)誤聲源,圓圈代表一階鏡像聲源。利用真實(shí)聲源和鏡像聲源,作它們連線的垂直平分線可以得到圖12。 圖10 四個(gè)通道測得的房間沖激響應(yīng)Fig.10 RIRs measured by a 4-element microphone array 圖11 利用TDOA 最小二乘誤差法得到的鏡像源坐標(biāo)Fig.11 Illustration of mirror source coordinate 圖12 利用TDOA 最小二乘誤差法得到的走廊結(jié)構(gòu)與實(shí)際走廊結(jié)構(gòu)的對比Fig.12 Comparison of measured corridor structure by the least squares of TDOA and real corridor structure 圖12 對應(yīng)代表利用最小二乘法求出的走廊左右墻面、天花板、地面的位置以及與真實(shí)值的對比。從表1可以讀出聲源到各個(gè)墻面距離的誤差分別為0.01 m、0.02 m、0.05 m、0.12 m,x軸方向平均誤差為0.03 m,z軸方向平均誤差為0.17 m,整體平均誤差為0.05 m。在一定誤差范圍內(nèi)實(shí)現(xiàn)了對走廊的幾何重構(gòu)。 作為對比,利用歐式距離法得到走廊結(jié)構(gòu)以及與實(shí)際情況的對比如圖13、表2所示。 表2可以得到聲源到各個(gè)墻面距離的誤差分別為0.20 m、0.28 m、0.10 m、0.45 m,x軸方向平均誤差為0.48 m,z軸方向平均誤差為0.55 m,整體平均誤差為0.26 m??梢悦黠@看出,本文提出的方法是優(yōu)于歐式距離法的。 圖13 利用歐氏距離法得到的走廊結(jié)構(gòu)與實(shí)際走廊結(jié)構(gòu)的對比Fig.13 Comparison of measured corridor structure by EDM and real corridor structure 綜上所述,本文的貢獻(xiàn)在于:(1)由于現(xiàn)有的建圖算法基本都借助于室內(nèi)沖激響應(yīng)或者信號(hào)相關(guān)來得到信號(hào)傳播距離,但是由信號(hào)收發(fā)編碼解碼的時(shí)間、線路耗材傳輸?shù)臅r(shí)間等造成的時(shí)延會(huì)引入較大誤差造成圖像的嚴(yán)重失真,本文提出的方案通過信號(hào)TOA 做差消除系統(tǒng)時(shí)延帶來的影響,利用最小二乘誤差為信號(hào)歸類,實(shí)現(xiàn)了較好的建圖效果。(2)本方法在算法上可以實(shí)現(xiàn)合二為一,在進(jìn)行匹配的過程中同時(shí)可以完成鏡像源坐標(biāo)的定位,針對歐氏距離法先匹配歸類再計(jì)算坐標(biāo)的方法在復(fù)雜度方面進(jìn)行了優(yōu)化。 表1 測試結(jié)果與實(shí)際情況的對比Table1 Comparison of measured data by the least squares of TDOA and real data 表2 測試結(jié)果與實(shí)際情況的對比Table2 comparison of measured data by EDM and real data 本文提出了一種依托image 模型,利用到達(dá)時(shí)間差最小二乘法為一階反射波進(jìn)行分類,之后利用室內(nèi)聲場模型實(shí)現(xiàn)室內(nèi)空間結(jié)構(gòu)重構(gòu)的算法。相比于其他室內(nèi)空間建圖的方法,這種方法原理簡單,利于實(shí)現(xiàn),而且不需要額外的專業(yè)器材,只需要利用常見的傳聲器組成的傳聲器陣列和普通全向音響就可以實(shí)現(xiàn)較好的效果。在此基礎(chǔ)上,為了進(jìn)一步提高室內(nèi)建圖的精度,今后可以考慮以下方案做出改進(jìn):(1)采用全向性更好的12 面體聲源;(2)增加傳聲器陣元的數(shù)量以及利用更有效的三維陣型;(3)利用TDOA和其他定位算法的結(jié)合實(shí)現(xiàn)更加精準(zhǔn)的遠(yuǎn)場定位。本文實(shí)現(xiàn)了具有規(guī)則幾何圖形的重建,考慮到后期復(fù)雜場景的重建,可以考慮引入移動(dòng)機(jī)器人測量的方法,將非直線墻(例如,折線或曲線)分為一個(gè)個(gè)小的直線,每隔一段時(shí)間發(fā)射信號(hào)并接收來探測繪制墻線。這將是未來實(shí)現(xiàn)復(fù)雜室內(nèi)構(gòu)圖的一個(gè)發(fā)展方向。1.4 建立室內(nèi)圖形
2 實(shí)驗(yàn)結(jié)果
2.1 實(shí)驗(yàn)場景
2.2 實(shí)驗(yàn)步驟
2.3 實(shí)驗(yàn)結(jié)果與對比
3 結(jié)論