齊美彬, 胡晶晶,*, 程佩琳, 靳學(xué)明
(1. 合肥工業(yè)大學(xué)計(jì)算機(jī)與信息學(xué)院, 安徽 合肥 230009; 2. 中國電子科技集團(tuán)第38研究所, 安徽 合肥 230088)
多目標(biāo)跟蹤的任務(wù)是利用傳感器提供的量測(cè)數(shù)據(jù)聯(lián)合估計(jì)目標(biāo)數(shù)量及其狀態(tài),而這些量測(cè)數(shù)據(jù)通常受到雜波(噪聲)、漏檢、虛警等因素的影響,為多目標(biāo)跟蹤的實(shí)現(xiàn)帶來巨大挑戰(zhàn)。目前實(shí)現(xiàn)多目標(biāo)跟蹤的方法主要分為:聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)(joint probabilistic data association,JPDA)[1-3]、多假設(shè)跟蹤(multiple hypothesis tracking,MHT)[4-6]和隨機(jī)有限集(random finite set,RFS)[7]。其中RFS方法可以避免執(zhí)行傳統(tǒng)多目標(biāo)跟蹤方法所需的數(shù)據(jù)關(guān)聯(lián),成為當(dāng)前解決多目標(biāo)跟蹤問題的研究熱點(diǎn)。其核心是貝葉斯多目標(biāo)濾波器,采用預(yù)測(cè)和更新循環(huán)迭代計(jì)算目標(biāo)的真實(shí)狀態(tài),其三大近似算法分別是概率假設(shè)密度(probability hypothesis density,PHD)、勢(shì)PHD(cardinalized PHD,CPHD)和多目標(biāo)多伯努利(multi-target multi-Bernoulli,MeMBer)濾波器。然而都不能嚴(yán)格地稱為多目標(biāo)濾波器,因?yàn)槠涞玫降哪繕?biāo)是無標(biāo)簽的,仍不可區(qū)分。文獻(xiàn)[8-11]引入標(biāo)簽隨機(jī)有限集的概念解決目標(biāo)軌跡及唯一性的問題,提出廣義標(biāo)簽多伯努利(generalized labeled multi-Bernoulli,GLMB)濾波器及其快速實(shí)現(xiàn)(δ-GLMB),并得到廣泛應(yīng)用[12-14]。
隨后很多研究學(xué)者提出δ-GLMB濾波器的改進(jìn)算法。這些改進(jìn)的多目標(biāo)跟蹤方法假設(shè)量測(cè)噪聲協(xié)方差先驗(yàn)信息是已知的,但是在很多場(chǎng)景中量測(cè)噪聲協(xié)方差是未知且時(shí)刻變化的。針對(duì)這個(gè)問題,研究者引入了變分貝葉斯(variational Bayesian, VB)方法[15]。文獻(xiàn)[15]通過定義未知噪聲方差參數(shù)的共軛先驗(yàn)分布,用VB近似方法分解固定形式分布和構(gòu)造遞歸表達(dá)式來逼近線性高斯系統(tǒng)的狀態(tài)估計(jì),解決未知量測(cè)噪聲協(xié)方差的問題。文獻(xiàn)[16-17]針對(duì)量測(cè)噪聲協(xié)方差未知的多目標(biāo)跟蹤模型,提出了一種基于VB近似的自適應(yīng)噪聲協(xié)方差PHD濾波。文獻(xiàn)[18]基于基數(shù)平衡多目標(biāo)多伯努利濾波和VB逼近技術(shù)提出了一種VB近似的自適應(yīng)噪聲協(xié)方差勢(shì)均衡MeMBer(cardinality balanced MeMBer,CBMeMBer)濾波。文獻(xiàn)[19]在δ-GLMB濾波框架中引入VB近似方法,所提自適應(yīng)VB-δ-GLMB濾波算法針對(duì)未知量測(cè)噪聲場(chǎng)景下的多目標(biāo)跟蹤具有很強(qiáng)魯棒性。
上述方法采用高斯混合方式實(shí)現(xiàn),適用于線性運(yùn)動(dòng)模型的多目標(biāo)跟蹤,在非線性場(chǎng)景下跟蹤性能較低。針對(duì)這個(gè)問題,本文提出一種適用于非線性模型的臨近點(diǎn)容積卡爾曼VB-δ-GLMB濾波算法(簡稱為PCKF-VB-δ-GLMB)。該算法以高斯實(shí)現(xiàn)的VB-δ-GLMB濾波器為基礎(chǔ),將量測(cè)噪聲和目標(biāo)狀態(tài)分布表示為逆伽馬和高斯乘積混合形式,結(jié)合基于臨近點(diǎn)算法和VB的迭代優(yōu)化與容積卡爾曼濾波提出一種迭代優(yōu)化容積卡爾曼方法(簡稱為PCKF-VB),并用該方法對(duì)高斯參量進(jìn)行預(yù)測(cè)更新,最后為提高濾波精度進(jìn)行變分貝葉斯容積RTS(VB cubature Rauch-Tung-Striebel)平滑。仿真結(jié)果表明本文算法能有效實(shí)現(xiàn)非線性系統(tǒng)下多目標(biāo)跟蹤,其性能與現(xiàn)有VB-δ-GLMB跟蹤算法相比有明顯提高。
對(duì)于量測(cè)噪聲協(xié)方差未知的非線性目標(biāo)跟蹤系統(tǒng),目標(biāo)狀態(tài)方程和量測(cè)方程為
xk=f(xk-1)+wk-1
(1)
zk=h(xk)+vk
(2)
式中:xk和zk表示目標(biāo)狀態(tài)和量測(cè)值;f(·)和h(·)表示狀態(tài)轉(zhuǎn)移和非線性量測(cè)函數(shù);過程噪聲wk~N(0,Qk);量測(cè)噪聲vk~N(0,Rk)。假設(shè)目標(biāo)狀態(tài)xk和量測(cè)噪聲協(xié)方差Rk模型相互獨(dú)立,則預(yù)測(cè)和更新后驗(yàn)密度函數(shù)分別由Chapman-Kolmogorov方程和貝葉斯規(guī)則給出:
(3)
(4)
式中:Z1:k={z1,z2,…,zk},由于Rk未知,式(4)無法得到解析解,因此引入VB近似來逼近后驗(yàn)密度函數(shù)[20],更新聯(lián)合后驗(yàn)密度可以近似為
p(xk,Rk|Z1:k)≈Qx(xk)QR(Rk)
(5)
通過最小化近似后驗(yàn)密度和真實(shí)后驗(yàn)密度之間的KL(Kullback-Leibler)散度來確定近似后驗(yàn)密度:
(6)
當(dāng)假設(shè)目標(biāo)狀態(tài)為高斯分布,噪聲協(xié)方差為逆伽馬分布[15]時(shí),近似后驗(yàn)密度為
Qx(xk)=N(xk;mk,Pk)
(7)
(8)
αk|k-1,i=ρiαk-1,i
(9)
βk|k-1,i=ρiβk-1,i
(10)
退化因子ρi∈(0,1],參數(shù)更新估計(jì)通過定點(diǎn)迭代法[20]獲得
(11)
(12)
式中:符號(hào)(·)i和(·)ii的含義是向量的第i個(gè)元素和矩陣的第i個(gè)對(duì)角元素;Hk為雅克比矩陣。量測(cè)噪聲協(xié)方差Rk的估計(jì)表示為
隨機(jī)有限集是元素和元素的個(gè)數(shù)均為隨機(jī)變量的集合,集合中元素的個(gè)數(shù)稱為集合的勢(shì)。標(biāo)簽RFS在RFS的基礎(chǔ)上為集合中的每個(gè)元素x∈X都被分配了相應(yīng)的標(biāo)簽l∈L,即每個(gè)目標(biāo)狀態(tài)用(x,l)表示,其中l(wèi)=(k,i),索引i可以區(qū)分同一時(shí)刻不同目標(biāo)。
(13)
標(biāo)準(zhǔn)δ-GLMB多目標(biāo)密度先驗(yàn)分布有如下形式:
(14)
步驟 1預(yù)測(cè)
(15)
式中:
L+=L∪B
式中:B為新生標(biāo)簽空間;f(x|·,l)為轉(zhuǎn)移密度函數(shù);pB(x,l)為新生目標(biāo)的狀態(tài)空間密度函數(shù);pS(·,l)為目標(biāo)存活概率。
步驟 2更新
(16)
式中:
式中:Z為量測(cè)集合;θ表示目標(biāo)軌跡到量測(cè)的映射關(guān)系:L→Z,所有映射關(guān)系的集合Θ稱為關(guān)聯(lián)映射空間;pD(x,l)為檢測(cè)概率,g(z|x,l)為量測(cè)似然函數(shù);κ表示量測(cè)生成過程中的雜波密度。
為解決未知量測(cè)噪聲協(xié)方差的問題,高斯混合實(shí)現(xiàn)的VB-δ-GLMB算法提出用VB近似迭代估計(jì)量測(cè)噪聲協(xié)方差和多目標(biāo)狀態(tài)聯(lián)合后驗(yàn)密度。但是該算法僅適用于線性模型的多目標(biāo)跟蹤場(chǎng)景,在非線性場(chǎng)景下跟蹤性能較低,因此可以將高斯混合實(shí)現(xiàn)的VB-δ-GLMB算法與非線性濾波器結(jié)合來實(shí)現(xiàn)非線性模型下多目標(biāo)跟蹤。
用VB方法處理非線性濾波問題[21]時(shí),可以將后驗(yàn)概率密度p(xk|zk)用一個(gè)易于計(jì)算的概率密度q(xk|θk)來近似。二者間差異可以用KL散度來度量,KL散度越小表示越接近,KL散度表示為
(17)
式中:q(xk|θk)為假設(shè)的高斯分布,其參數(shù)θk=(xk|k,Pk|k)。L(θk)為變分證據(jù)下界(evidence lower bound, ELBO):
(18)
(19)
(20)
(21)
(22)
在過程噪聲和量測(cè)噪聲為高斯假設(shè)時(shí),維數(shù)同為d的變分分布q(xk|θk)~N(xk|xk|k,Pk|k)和p(xk)~N(xk|xk|k-1,Pk|k-1),因此式(18)展開為
(23)
(24)
(25)
本文將基于臨近點(diǎn)算法和VB的迭代優(yōu)化與容積卡爾曼濾波(cubature Kalman filtering, CKF)結(jié)合,提出變分逼近的PCKF算法。該算法在傳統(tǒng)CKF[25]的更新步驟中結(jié)合臨近點(diǎn)算法與VB近似進(jìn)行迭代優(yōu)化,具體步驟如下。
步驟 1輸入初始狀態(tài)x0和初始協(xié)方差矩陣P0。
步驟 2時(shí)間更新
(26)
(27)
(28)
量測(cè)噪聲動(dòng)態(tài)模型參數(shù)預(yù)測(cè)值由式(9)和式(10)得出。
步驟 3量測(cè)更新
(29)
(30)
(31)
(32)
(33)
(34)
(35)
(36)
(37)
因此為解決非線性場(chǎng)景下多目標(biāo)跟蹤問題,可以將非線性濾波方法PCKF-VB與VB-δ-GLMB結(jié)合,形成PCKF-VB-δ-GLMB多目標(biāo)跟蹤算法。
針對(duì)非線性高斯多目標(biāo)模型預(yù)測(cè)與更新步驟中帶有有限集積分運(yùn)算而無法求得解析解的問題[26],PCKF-VB-δ-GLMB濾波算法用多個(gè)高斯項(xiàng)加權(quán)求和的方式,代替?zhèn)鬟f的伯努利參數(shù)來獲得閉合解。新生目標(biāo)為標(biāo)簽多伯努利模型,概率密度函數(shù)如下所示:
(38)
式中:J(ξ)為高斯項(xiàng)個(gè)數(shù)。則基于PCKF-VB-δ-GLMB濾波算法的高斯混合(Gaussian mixture,GM)[27]實(shí)現(xiàn)具體步驟如下。
步驟 1預(yù)測(cè)
假設(shè)多目標(biāo)密度函數(shù)π(X)如式(14)形式,其中用高斯和逆伽馬積混合形式表示單目標(biāo)密度p(ξ),表示如下:
(39)
則預(yù)測(cè)多目標(biāo)密度π+(X)如式(15)形式,其中預(yù)測(cè)單目標(biāo)密度函數(shù)為
(40)
步驟 2更新
假設(shè)多目標(biāo)預(yù)測(cè)密度π+(X)如式(15)形式,其中單目標(biāo)密度函數(shù)為
綜上所述,分析英美文學(xué)在英語教學(xué)的重要性是非常必要的。世界間的交際來往愈來愈多,英語也越發(fā)重要,而將英美文學(xué)引入課堂中可以有效地促進(jìn)學(xué)生的英語學(xué)習(xí)效率,使其能接觸到最地道的英語,還能體會(huì)到當(dāng)時(shí)當(dāng)?shù)氐娘L(fēng)俗文化。英語教學(xué)模式應(yīng)如何引入文學(xué)教學(xué)有待進(jìn)一步的探討。希望本文能為當(dāng)前的相關(guān)研究起到借鑒作用。
(41)
量測(cè)為Z,則多目標(biāo)更新密度如式(16)所示,其中單目標(biāo)密度函數(shù)為
(42)
步驟 3修剪和截?cái)?/p>
對(duì)于預(yù)測(cè)更新步驟得到的高斯-逆伽馬分量,設(shè)置剪枝閾值;修剪權(quán)重低于指定剪枝閾值的分量,并將高斯總個(gè)數(shù)控制在最大限度內(nèi)。
步驟 4目標(biāo)個(gè)數(shù)及目標(biāo)狀態(tài)估計(jì)
目標(biāo)個(gè)數(shù)從勢(shì)分布中由最大后驗(yàn)估計(jì)方法得出;通過最佳基數(shù)提取狀態(tài)估計(jì),從具有與映射基數(shù)估計(jì)相同基數(shù)的所有分量中選取最高權(quán)重分量,提取其標(biāo)簽和均值。
為了改善濾波效果,可通過平滑對(duì)狀態(tài)向量做進(jìn)一步處理,以此提高精度。CRTS平滑算法基于三階球面-徑向容積規(guī)則,是高斯平滑范疇內(nèi)的一種平滑算法[28-29],由前向?yàn)V波和逆向平滑兩部分組成。對(duì)于一般的CRTS平滑算法,量測(cè)噪聲協(xié)方差為常數(shù),不適應(yīng)實(shí)際情況。對(duì)于上述非線性模型,結(jié)合CRTS平滑算法和VB估計(jì)方法,采用VB-CRTS平滑算法實(shí)現(xiàn)量測(cè)噪聲協(xié)方差的自適應(yīng)估計(jì)。式(21)和式(22)、式(26)~式(37)組成VB-CRTS前向?yàn)V波過程,逆向平滑過程算法如下。
(43)
(2) 平滑增益:
Gk=Dk(Pk|k-1)-1
(44)
(3) 平滑后均值與協(xié)方差:
(45)
(46)
為更好地仿真機(jī)動(dòng)目標(biāo)運(yùn)動(dòng)狀態(tài),本實(shí)驗(yàn)采用勻速直線(constant velocity,CV)運(yùn)動(dòng)模型和協(xié)同轉(zhuǎn)彎(cooperative turning,CT)運(yùn)動(dòng)模型來對(duì)目標(biāo)進(jìn)行建模。在該場(chǎng)景下,我們采用VB-δ-GLMB、本文提出的PCKF-VB-δ-GLMB及其二者分別通過VB-CRTS平滑得到的4種濾波器來實(shí)現(xiàn)多目標(biāo)跟蹤,并綜合比較性能。
表1 不同目標(biāo)初始狀態(tài)及起始結(jié)束時(shí)刻
仿真中目標(biāo)的運(yùn)動(dòng)方程如式(1)和式(2)所示,其中:
仿真共設(shè)置10個(gè)目標(biāo),目標(biāo)真實(shí)運(yùn)動(dòng)軌跡和估計(jì)軌跡如圖1所示,○和△分別表示起始位置和結(jié)束位置,x軸和y軸分別為二維平面內(nèi)的水平位置和豎直位置。圖1中黑色軌跡為機(jī)動(dòng)目標(biāo)真實(shí)運(yùn)動(dòng)軌跡,從圖中可以看出目標(biāo)軌跡出現(xiàn)交叉,目標(biāo)量測(cè)混合會(huì)導(dǎo)致難以區(qū)分。本文算法對(duì)機(jī)動(dòng)目標(biāo)的跟蹤效果如圖1中紅色軌跡所示,圖中目標(biāo)估計(jì)軌跡與目標(biāo)真實(shí)運(yùn)動(dòng)軌跡幾乎重合,因此本文提出濾波器的能準(zhǔn)確地實(shí)現(xiàn)多目標(biāo)運(yùn)動(dòng)軌跡的估計(jì)。
圖1 真實(shí)運(yùn)動(dòng)軌跡與估計(jì)軌跡Fig.1 Target tracks and estimated tracks
圖2表示上述4種濾波算法的單次勢(shì)估計(jì)與平均勢(shì)估計(jì)。圖2(a)為隨機(jī)抽取的單次蒙特卡羅實(shí)驗(yàn)的勢(shì)估計(jì),從圖中可以看出本文提出算法估計(jì)的目標(biāo)數(shù)目更加接近實(shí)際目標(biāo)數(shù)目。單次實(shí)驗(yàn)計(jì)算量小,減少目標(biāo)跟蹤的時(shí)間,但是不能消除數(shù)據(jù)隨機(jī)性。圖2(b)為100次蒙特卡羅實(shí)驗(yàn)的平均勢(shì)估計(jì)。
圖2 勢(shì)估計(jì)Fig.2 Cardinality estimation
本實(shí)驗(yàn)采用最優(yōu)子模式分配(optimal subpattern assignment,OSPA)距離[30]作為評(píng)價(jià)算法性能的準(zhǔn)則指標(biāo)。OSPA距離綜合考慮目標(biāo)數(shù)目估計(jì)和目標(biāo)位置估計(jì),其值越大表明算法的綜合精度越差,維數(shù)分別為m、n的集合X和Y之間的OSPA距離定義為
(47)
實(shí)驗(yàn)中設(shè)置距離敏感參數(shù)p=2,水平調(diào)節(jié)參數(shù)c=100。圖3為4種濾波算法對(duì)多目標(biāo)估計(jì)的OSPA距離(見圖3(a))和OSPA勢(shì)估計(jì)分量(見圖3(b))。觀察圖3(a)和圖3(b)可以看出k=0,10,20時(shí)刻OSPA距離和OSPA勢(shì)估計(jì)出現(xiàn)峰值,這是由于目標(biāo)新生時(shí)刻存在概率低,算法不能立刻跟蹤到目標(biāo);k=80,90時(shí)刻OSPA距離和OSPA勢(shì)估計(jì)較大,這是因?yàn)槟繕?biāo)數(shù)目發(fā)生變化的時(shí)刻算法反應(yīng)速度延遲時(shí)間較長。
圖3 OSPA距離與OSPA勢(shì)估計(jì)Fig.3 OSPA distance and cardinality estimation
為減少數(shù)據(jù)隨機(jī)性,本文進(jìn)行100次蒙特卡羅仿真實(shí)驗(yàn),4種濾波器OSPA距離和OSPA勢(shì)估計(jì)如表2所示(重復(fù)5組實(shí)驗(yàn)取均值,結(jié)果保留4位有效數(shù)字)。從表2中數(shù)據(jù)可以看出,對(duì)比現(xiàn)有的VB-δ-GLMB算法,本文提出的PCKF-VB-δ-GLMB算法在OSPA距離和OSPA勢(shì)估計(jì)上都有顯著改進(jìn)。其中OSPA距離減少了13.59%,OSPA勢(shì)估計(jì)減少了12.34%,驗(yàn)證了本文提出算法采用PCKF-VB進(jìn)行預(yù)測(cè)更新,可以更好地適應(yīng)非線性多目標(biāo)跟蹤場(chǎng)景。此外,加入VB-CRTS平滑之后,VB-δ-GLMB算法在OSPA距離和OSPA勢(shì)估計(jì)上分別減少了40.96%和12.97%,PCKF-VB-δ-GLMB算法在OSPA距離和OSPA勢(shì)估計(jì)上分別減少了38.74%和16.18%。仿真結(jié)果表明VB-CRTS平滑對(duì)不同濾波算法均帶來了顯著改進(jìn)。
表2 100次仿真的平均性能
為進(jìn)一步驗(yàn)證本文提出算法的有效性,在不同雜波數(shù)條件下進(jìn)行100次蒙特卡羅實(shí)驗(yàn),綜合比較4種濾波算法的OSPA距離和OSPA勢(shì)估計(jì)。分析圖4可以得到以下結(jié)論:首先,隨著雜波數(shù)增多,上述4種濾波算法的OSPA距離和OSPA勢(shì)估計(jì)都隨之增大,目標(biāo)跟蹤性能降低;其次,在相同的雜波密度條件下,本文所提算法的OSPA距離和OSPA勢(shì)估計(jì)均小于現(xiàn)有的VB-δ-GLMB算法。
針對(duì)高斯實(shí)現(xiàn)的VB-δ-GLMB算法在非線性場(chǎng)景下跟蹤性能較低的問題,本文提出一種適用于非線性系統(tǒng)的PCKF-VB-δ-GLMB濾波算法。該算法將聯(lián)合后驗(yàn)分布表示為高斯-逆伽馬混合分布,利用PCKF-VB方法對(duì)VB-δ-GLMB濾波算法中的高斯參量進(jìn)行預(yù)測(cè)更新,最后進(jìn)行VB-CRTS平滑。仿真結(jié)果表明對(duì)量測(cè)噪聲未知的非線性系統(tǒng),該算法能準(zhǔn)確估計(jì)目標(biāo)運(yùn)動(dòng)狀態(tài)與軌跡,多目標(biāo)跟蹤精度得到顯著提高。