馮 雨
(西安航空職業(yè)技術(shù)學(xué)院 通用航空學(xué)院,西安 710000)
隨著人工智能、 自動駕駛等技術(shù)的興起與發(fā)展,目標(biāo)跟蹤算法的研究越來越受到更多學(xué)者的關(guān)注與探索[1],目前已被廣泛應(yīng)用于安防監(jiān)控[2]、無人車追蹤[3]、機(jī)器人導(dǎo)航[4]等諸多領(lǐng)域。 對于機(jī)動目標(biāo),跟蹤最大的挑戰(zhàn)是目標(biāo)發(fā)生機(jī)動時,其運(yùn)動模型與前一時刻會發(fā)生較大的偏差,因此,通常很難用單一的模型來表示機(jī)動目標(biāo)的運(yùn)動[5]。一種常用的方法是采用基于多模型的方法對機(jī)動目標(biāo)進(jìn)行跟蹤[6]。這些方法中的模型并行運(yùn)行,從而描述目標(biāo)運(yùn)動的不同方面。其中,交互式多模型(interacting multiple model,IMM)算法被廣泛認(rèn)為是最有效的動態(tài)方法之一[7]。 它使用一組不同的運(yùn)動模型,并假定模型集中包含了目標(biāo)可能的真實(shí)運(yùn)動模型。 該算法基于跳變馬爾可夫系統(tǒng)框架并采用了一個轉(zhuǎn)移概率已知的馬爾可夫鏈,來完成運(yùn)動模型的切換[8]。 現(xiàn)已經(jīng)被證明能以較低的復(fù)雜度實(shí)現(xiàn)高精度的機(jī)動目標(biāo)跟蹤[9]。
此外,為了進(jìn)一步提高目標(biāo)的跟蹤精度,多傳感器融合跟蹤由于其能充分各個傳感器的有效信息,可實(shí)現(xiàn)更準(zhǔn)確、可靠的目標(biāo)狀態(tài)估計[10]。 對于分布式融合算法具有低通信需求以及高的可靠性等特點(diǎn)。 但與集中式方法相比,它也更具挑戰(zhàn)性[11]。 例如不同傳感器共同的過程噪聲、 先驗(yàn)信息等原因,導(dǎo)致了局部估計誤差的互相關(guān)性。 而計算局部估計之間的相關(guān)性,往往具有較高的計算代價[12]。為了解決該問題,相關(guān)性未知的協(xié)方差交叉算法通過擴(kuò)大局部估計協(xié)方差,來避免復(fù)雜的相關(guān)性的計算[13]。另外,還可以采用信息去相關(guān)方法來解決局部估計之間的相關(guān)性問題[14]。 但這些方法大多是針對非機(jī)動目標(biāo)的融合跟蹤情況。
基于以上討論,本文提出了一種新的基于IMM的自適應(yīng)分布式融合算法,實(shí)行了狀態(tài)估計與量測信息的融合。 首先,利用多個模型估計本地傳感器測量的累積信息,然后將這些累積信息與遠(yuǎn)端傳感器的目標(biāo)狀態(tài)估計進(jìn)行融合,并利用去相關(guān)算法來處理局部估計之間的相關(guān)性,從而實(shí)現(xiàn)機(jī)動目標(biāo)的融合跟蹤。 最后通過仿真實(shí)驗(yàn)對比并驗(yàn)證了提出算法的有效性。
目前單傳感器和多傳感器跟蹤與融合已經(jīng)得到了廣泛的研究。 根據(jù)傳感器個數(shù),以及信號的處理方式的不同,文獻(xiàn)[15]總結(jié)了目標(biāo)跟蹤過程中實(shí)現(xiàn)融合的3 種方式:
(1)不同傳感器間航跡到航跡的融合;
(2)不同傳感器間同步的量測到量測的融合;
(3)集中式的異步量測融合。
本文主要研究并提出了另一種更符合實(shí)際應(yīng)用的融合方式,即遠(yuǎn)端傳感器獲得的航跡與本地傳感器測量信息的融合。 如圖1 所示,其中遠(yuǎn)端傳感器R 和本地傳感器L 分別提供目標(biāo)狀態(tài)估計和本地量測信息。 傳感器R 獲得的航跡由IMM 估計器生成,傳輸?shù)絃 傳感器的信息是每個時間周期的最終狀態(tài)及其誤差協(xié)方差。
圖1 狀態(tài)估計與量測信息融合框架Fig.1 State estimation and measurement information fusion framework
對于局部狀態(tài)估計和量測信息的融合,提出采用信息去相關(guān)方法進(jìn)行實(shí)現(xiàn)。 由于當(dāng)前時間的遠(yuǎn)端傳感器S 的測量信息目標(biāo)的狀態(tài)估計無關(guān)。 因此,可將進(jìn)行了去相關(guān)的遠(yuǎn)端傳感器的新信息與本地傳感器的測量數(shù)據(jù)融合。 在時刻tk(k 為遠(yuǎn)端傳感器R 估計的時間索引),進(jìn)行解相關(guān)信息狀態(tài)向量和相信的協(xié)方差矩陣可通過如下公式計算:
其中:
式中:f[·]為狀態(tài)轉(zhuǎn)移函數(shù);F[·]為f[·]的雅可比矩陣;Q[·]為過程噪聲的協(xié)方差。 可以看出解相關(guān)需要在式(3)和式(4)中從時間tk-1到tk的預(yù)測步驟。 當(dāng)遠(yuǎn)端傳感器S 中使用單模型卡爾曼濾波器且狀態(tài)轉(zhuǎn)移函數(shù)已知時,信息去相關(guān)效果較好。
當(dāng)傳感器R 獲得的狀態(tài)估計在傳感器L 的tk時刻被接收到時,它應(yīng)該被所有在tk之前,傳感器L獲得量測數(shù)據(jù)進(jìn)行更新,以便所有來自傳感器L 的量測信息都可以用于融合航跡的生成。 但顯然這是不切實(shí)際的,因?yàn)殡S著時間的積累,傳感器網(wǎng)絡(luò)往往無法存儲所有過去的測量信息。 因此,需要將截至?xí)r間tk-1的傳感器L 測量值的累積信息進(jìn)行計算,并將其標(biāo)記為(tk-1)。 當(dāng)收到傳感器R 的狀態(tài)估計(tk|tk)時,先用累積信息(tk-1)(表示從開始到時間tk-1的傳感器L 的測量值信息)更新,再用新得到的傳感器L 獲得的測量值ZL(tk,1),…,ZL(tk,nk)更新,假設(shè)從時間tk-1到tk的測量的數(shù)量為nk。融合處理完成后,進(jìn)行信息去相關(guān)處理,計算傳感器L測量值的累積信息(tk)(將在下一個時間周期中使用)。 去相關(guān)可通過如下公式進(jìn)行計算:
其中:
分別是最終融合的信息矩陣和向量。 并且:
分別為傳感器R 獲得的狀態(tài)信息矩陣和狀態(tài)向量。
在這一節(jié),將上述融合方法擴(kuò)展到多個模型,從而實(shí)現(xiàn)多傳感器的自適應(yīng)機(jī)動目標(biāo)融合跟蹤。 其數(shù)據(jù)處理框架如圖2 所示。
圖2 機(jī)動目標(biāo)跟蹤數(shù)據(jù)處理框架Fig.2 Data processing framework for maneuvering target tracking
式中:j 為模型指標(biāo);f[·]和h[·]分別為狀態(tài)轉(zhuǎn)移函數(shù)和量測函數(shù);t 為當(dāng)前時間;v(·)和w(·)為均值為零的高斯白噪聲,其相應(yīng)的協(xié)方差分別為Q(·)和R(·)。 這些模型可以與傳感器R 中IMM 估計器中使用的模型相同,也可以不同。
結(jié)合圖2,本文提出的基于多模型的局部狀態(tài)估計與量測信息的融合算法的基本流程如下:
(1)本地傳感器L 中不同模型累計信息(即開始到tk-1時刻的信息)的混合。首先,將模型j=1,…,m 的信息轉(zhuǎn)化為狀態(tài)空間對應(yīng)的狀態(tài)估計即相應(yīng)的協(xié)方差,其計算公式如下:
根據(jù)標(biāo)準(zhǔn)IMM 混合算法的基礎(chǔ)上對各個模型的狀態(tài)估計和協(xié)方差進(jìn)行混合。 混合后,相應(yīng)的狀態(tài)及其誤差協(xié)方差分別為其中j=1,…,m。
為了便于后續(xù)的融合,將混合狀態(tài)重新轉(zhuǎn)換為信息空間,其相應(yīng)的表達(dá)式如下:
(2)將通過式(1)獲得的傳感器L 的累積測量信息與傳感器R 的狀態(tài)估計進(jìn)行融合。 首先,基于模型j,將由傳感器R 獲得的目標(biāo)局部狀態(tài)估計及其誤差協(xié)方差逆推到前一時刻,即tk-1,其逆推公式如下:
將上述逆推的狀態(tài)與傳感器L 在tk-1時刻的混合累積信息融合,即:
其中:
并將融合后的信息轉(zhuǎn)換為狀態(tài)空間為
然后根據(jù)運(yùn)動模型,預(yù)測當(dāng)前時刻即tk時刻的融合狀態(tài)以及相應(yīng)的協(xié)方差:
(3)將上述獲得的預(yù)測的狀態(tài)估計和協(xié)方差與傳感器L 獲得量測信息ZL(tk,i)進(jìn)行融合,并獲得更新的模型概率μj(tk,i)。 然后將基于模型的融合狀態(tài)及其誤差協(xié)方差和模態(tài)概率賦值為
然后將所有基于模型的狀態(tài)進(jìn)行組合,組合過程與標(biāo)準(zhǔn)IMM 濾波器的組合方式相同。組合后狀態(tài)k)及其誤差協(xié)方差PF(tk)是當(dāng)前時刻的最終輸出。
(4)計算模型j=1,…,m 時,在tk時刻傳感器L的測量值的累計信息,其表達(dá)式如下:
式中:IR(tk|tk)和tk|tk)分別是PR(tk|tk)和tk|tk)對應(yīng)的信息矩陣和向量分別是和對應(yīng)的信息矩陣和狀態(tài)向量。為了方便將上述提出的方法記為基于交互式多模型的自適應(yīng)融合(IMM-AF)。
為了驗(yàn)證本文提出算法的有效性,在Matlab 平臺上進(jìn)行仿真實(shí)驗(yàn)。 并將本文提出的方法與單傳感器R 以及文獻(xiàn)[15]提出的航跡到航跡的融合(T2TF)方法進(jìn)行對比。 目標(biāo)運(yùn)動的真實(shí)軌跡如圖3 所示。
圖3 目標(biāo)真實(shí)軌跡Fig.3 Real target trajectory
真實(shí)速度為75 m/s 的目標(biāo)在起始位置為(100 m,100 m)處沿正東方向45°的方向做勻速運(yùn)動,持續(xù)45 s 后以4°/s 的速度做勻速圓周運(yùn)動,并持續(xù)30 s,最后又按照勻速運(yùn)動運(yùn)行45 s。 遠(yuǎn)端傳感器R 和本地傳感器L 的位置坐標(biāo)分別為:(-2000 m,-1000 m),(4000 m,0 m)。 通過300 次的蒙特卡洛實(shí)驗(yàn)獲得3種方法的位置和速度的均方根誤差,分別如圖4 和圖5 所示。
圖4 位置均方根誤差Fig.4 Root mean square error of position
圖5 速度均方根誤差Fig.5 Root mean square error of velocity
由圖4 可知,在跟蹤的位置誤差方面,當(dāng)目標(biāo)發(fā)生機(jī)動時,誤差會出現(xiàn)短時間的增加,這是由于目標(biāo)機(jī)動時,目標(biāo)運(yùn)動模型發(fā)生變化所導(dǎo)致,隨著IMM 算法中模型概率自適應(yīng)的變化,其誤差會迅速下降,這說明了IMM 算法的有效性。此外,在跟蹤的整個過程中, 可以明顯看出本文提出的IMM-AF 方法明顯優(yōu)于單傳感器以及T2TM 方法。
由圖5 可知,在跟蹤速度誤差方面,當(dāng)在目標(biāo)發(fā)生機(jī)動的較短的時間內(nèi),本文提出的方法與T2TM方法性能類似,但能夠更快速地收斂,并明顯優(yōu)于其他兩種算法。 由此也證明了本文提出算法的有效性。
本文主要研究了多傳感器機(jī)動目標(biāo)的融合跟蹤問題,并提出了一種基于IMM 的自適應(yīng)融合跟蹤算法,即IMM-AF。該方法使用多個模型的累積測量信息來融合遠(yuǎn)端傳感器通過IMM 濾波器獲得的狀態(tài)估計以及和本地傳感器的累計量測信息。 這兩個傳感器中使用的多個模型可以相同,也可以不同。 在過程中,利用信息去相關(guān)的方法消除傳感器之間的相關(guān)性。 仿真結(jié)果表明,本文提出的方法能夠顯著提高目標(biāo)跟蹤的精度。