孫翌晨 李軍
摘 要:針對(duì)粒子濾波存在的樣本貧化現(xiàn)象,提出了一種優(yōu)化重選樣本粒子的粒子濾波算法。這種方法在引入最新量測(cè)后將狀態(tài)后驗(yàn)概率密度逼近為一個(gè)高斯分布,在粒子貧化問(wèn)題逐漸凸顯后,通過(guò)該分布重新采集粒子后再進(jìn)行運(yùn)算,有效緩解了傳統(tǒng)方法在粒子貧化后出現(xiàn)的濾波精度下降的問(wèn)題。仿真結(jié)果表明,新的粒子濾波算法有更高的濾波精度和運(yùn)行效率。
關(guān)鍵詞:粒子濾波;后驗(yàn)概率;粒子貧化;重新選取
近年來(lái),粒子濾波在目標(biāo)跟蹤領(lǐng)域得到了越來(lái)越廣泛的應(yīng)用。常見(jiàn)的非線性濾波方法,如擴(kuò)展卡爾曼濾波(Extended Kalman Filter,EKF),無(wú)跡卡爾曼濾波(Unscented Kalman Filter,UKF)都是針對(duì)非線性系統(tǒng)的線性卡爾曼濾波方法的變形與改進(jìn),因此使用條件也受到卡爾曼濾波算法的條件限制[1]。而粒子濾波算法通過(guò)蒙特卡羅仿真手段產(chǎn)生大量粒子,隨著采樣粒子數(shù)不斷增大,其散布情況將逐漸逼近狀態(tài)的后驗(yàn)概率密度。粒子濾波在解決非高斯分布系統(tǒng)問(wèn)題上具有明顯的優(yōu)勢(shì),可以說(shuō)它是目前非高斯非線性系統(tǒng)狀態(tài)估計(jì)的“最優(yōu)”濾波器[2]。但是,隨著時(shí)間的遞推,會(huì)出現(xiàn)粒子的退化問(wèn)題。通常,有兩種方法可以減輕粒子退化問(wèn)題:一是增加重采樣環(huán)節(jié);二是選擇合適的重要密度函數(shù)進(jìn)行更有效的采樣[3-5]。常規(guī)的重采樣方法隨著迭代次數(shù)的增加,會(huì)出現(xiàn)粒子貧化問(wèn)題,為此,人們提出了許多不同的方法來(lái)解決這個(gè)問(wèn)題,如高斯粒子濾波算法(Gaussian particle filter),重采樣粒子移動(dòng)算法(Resample-Move Alogrithm)[6],增加馬爾可夫鏈蒙特卡羅(Markov Chain Monte Carlo)移動(dòng)步驟[7-9],對(duì)粒子進(jìn)行正則(Regula—rization)重采樣[10]。
筆者將標(biāo)準(zhǔn)粒子濾波算法和高斯粒子濾波相結(jié)合,引入一個(gè)重新選擇粒子的過(guò)程,即粒子優(yōu)化重選粒子濾波(Optimized Repicking Particle Filter)。當(dāng)粒子貧化問(wèn)題出現(xiàn)時(shí),通過(guò)由當(dāng)前濾波值和方差生成的高斯密度函數(shù)來(lái)逼近后驗(yàn)概率分布,重新采樣后再進(jìn)行運(yùn)算。由于引入粒子優(yōu)化重選的過(guò)程,緩解了粒子的退化與貧化問(wèn)題,所以濾波精度要高于標(biāo)準(zhǔn)算法。最后的仿真結(jié)果也證明了這一點(diǎn)。
1 高斯粒子濾波算法
GPF通過(guò)由高斯密度函數(shù)來(lái)逼近后驗(yàn)概率分布,其基本思想是利用描述k時(shí)刻目標(biāo)狀態(tài)xk的后驗(yàn)概率分布 ,是對(duì)應(yīng)權(quán)值為的粒子集,其中是0到k時(shí)刻的狀態(tài)集。權(quán)值被歸一化為 。由此,k時(shí)刻的后驗(yàn)概率密度可表示為
根據(jù)文獻(xiàn)[11],選擇=為IDF可使權(quán)值的方差最小化,但通常情況下很難求得的表達(dá)式,因此一種簡(jiǎn)單常用的替代方案是選擇先驗(yàn)作為重要密度函數(shù)。因此,可將重要性權(quán)值寫(xiě)為:
1.1 量測(cè)更新
當(dāng)接受到第k個(gè)觀測(cè)值z(mì)k之后,可以利用樣本及其權(quán)值來(lái)計(jì)算濾波值和方差pk,將狀態(tài)后驗(yàn)概率密度逼近為一個(gè)高斯分布,可表示為
其中
1.2 時(shí)間更新
由于已經(jīng)將近似為高斯函數(shù),故可將狀態(tài)預(yù)測(cè)概率密度近似為:
其蒙特卡羅逼近為
式中,是從 采樣得到的粒子,狀態(tài)預(yù)測(cè)概率密度函數(shù)的均值和方差可表示為
2 樣本優(yōu)化重選粒子濾波
與一般的粒子濾波相比,GPF不需要對(duì)粒子進(jìn)行重采樣,降低了計(jì)算量和復(fù)雜度,但是濾波精度較之一般的粒子濾波稍差,因而考慮將兩者結(jié)合。
由此,引入樣本優(yōu)化重選粒子濾波算法ORPF。在粒子貧化問(wèn)題出現(xiàn)后,引入高斯粒子濾波的思想將后驗(yàn)概率密度逼近為一個(gè)高斯分布。由通過(guò)蒙特卡羅仿真得到粒子集各個(gè)粒子的權(quán)值為1/N。進(jìn)而,在的基礎(chǔ)上通過(guò)狀態(tài)方程產(chǎn)生新的粒子集 進(jìn)行K+1時(shí)刻的計(jì)算。這樣,后一時(shí)刻的粒子根據(jù)前一時(shí)刻的新采樣的粒子集更新而來(lái),這樣就可以保留粒子的多樣性。所以,當(dāng)在出現(xiàn)粒子貧化問(wèn)題時(shí),可以采用這種方法來(lái)解決這個(gè)問(wèn)題。
新算法的描述如下:
(1)由p(x0)得到N個(gè)采樣點(diǎn) 。
(2)計(jì)算權(quán)值 并對(duì)其歸一化,得到
(3)輸出K時(shí)刻的狀態(tài)估計(jì)為:
方差為
(4)判斷是否需要重采樣:計(jì)算的值,如果Neff (5)進(jìn)行重采樣,將原來(lái)的帶權(quán)樣本映射為等權(quán)樣本 (6)判斷是否要重新采集粒子,設(shè)重采樣后被復(fù)制次最多的粒子繁殖出了a個(gè)子代,當(dāng)a>0.2N時(shí)則認(rèn)為粒子多樣性喪失,此時(shí)進(jìn)入步驟(7),否則,跳入步驟(8)。 (7)根據(jù)通過(guò)蒙特卡羅采樣得到粒子集 (8)通過(guò)狀態(tài)方程產(chǎn)生新粒子集 (9)重復(fù)步驟(2)~(8)。 3 實(shí)驗(yàn)仿真結(jié)果及分析 3.1 仿真一 選用單變量非靜態(tài)增長(zhǎng)模型(UNGM),仿真對(duì)象的過(guò)程模型和量測(cè)模型如下。 過(guò)程模型: 量測(cè)模型: 式中,ω(t)和v(t)為零均值高斯噪聲。仿真取噪聲方差Q為10,量測(cè)噪聲方差R為1。分別用增加馬爾可夫鏈蒙特卡羅粒子濾波(MCMCPF)和樣本優(yōu)化重選粒子濾波算法(ORPF)來(lái)對(duì)這樣的非線性系統(tǒng)進(jìn)行狀態(tài)估計(jì)和跟蹤。時(shí)間步長(zhǎng)50次。 其中均方根誤差 具體數(shù)據(jù)如表1所示: 狀態(tài)估計(jì)曲線如圖1、2所示: 如表1所示,過(guò)程噪聲方差Q=10、量測(cè)噪聲方差R=1時(shí)。在N=100,MCMCPF的誤差均值為3.6946,而ORPF為3.5602;MCMCPF的RMSE為5.2191,而ORPF為4.0066;在狀態(tài)估計(jì)時(shí)間上,MCMCPF為0.009502s,而ORPF為0.010143s。在N=500時(shí),MCMCPF的誤差均值為2.6765,而ORPF為2.4154;MCMCPF的RMSE為3.6747,而ORPF為3.2293;在時(shí)間估計(jì)上,MCMCPF為0.085130s,而ORPF為0.028229s。由此,說(shuō)明ORPF的估計(jì)精度比MCMCPF略高,在粒子數(shù)較少時(shí),兩種算法的估計(jì)時(shí)間相差不大,但隨著粒子數(shù)的增加,MCMCPF的估計(jì)時(shí)間急劇上升,遠(yuǎn)超ORPF。
如圖1、2、3、4所示,ORPF算法的估計(jì)誤差是略小于MCMCPF的,濾波精度是略優(yōu)于MCMCPF的。
綜上,可以得出,在高度非線性模型下,ORPF在濾波精度上略優(yōu)于MCMCPF,在實(shí)時(shí)性上要優(yōu)于MCMCPF。
3.2 仿真二
選用被動(dòng)定位系統(tǒng)中二維純方位目標(biāo)跟蹤模型,仿真對(duì)象的過(guò)程模型和量測(cè)模型如下:
過(guò)程模型:
量測(cè)模型:
其中為系統(tǒng)k時(shí)刻的狀態(tài)值,即目標(biāo)在x和y軸上的位置和速度,為k-1時(shí)刻x,y方向的系統(tǒng)噪聲,為k時(shí)刻的觀測(cè)噪聲。為k時(shí)刻的觀測(cè)角度。
如圖5、6所示,ORPF在X軸方向和Y軸方向上的估計(jì)誤差都小于PF的估計(jì)誤差,說(shuō)明ORPF的估計(jì)精度高于PF。圖7展示了2種算法的狀態(tài)估計(jì)曲線,顯然ORPF的跟蹤精度要好。
4 結(jié)束語(yǔ)
本文提出了一種基于GPF的加入了粒子優(yōu)化重選步驟的新的粒子濾波。傳統(tǒng)的重采樣方法中權(quán)值較大的粒子會(huì)被多次復(fù)制,造成粒子的貧化。在貧化問(wèn)題出現(xiàn)時(shí),利用當(dāng)前時(shí)刻的估計(jì)值和方差構(gòu)建高斯密度函數(shù)來(lái)逼近后驗(yàn)概率分布,從中重新采樣并更新粒子。該方法能夠有效的緩解粒子貧化帶來(lái)的問(wèn)題。仿真結(jié)果表明,提出的ORPF在估計(jì)性能上要好于傳統(tǒng)的PF。
[參考文獻(xiàn)]
[1]占榮輝,張軍.非線性濾波理論與目標(biāo)跟蹤應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2013:108-167.
[2]朱志宇.粒子濾波算法及其應(yīng)用[M].北京:科學(xué)出版社,2010.
[3]胡士強(qiáng),敬忠良.粒子濾波算法綜述[J].2005,20(4):361-365.
[4]楊小軍,潘泉,王睿,等.粒子濾波進(jìn)展與展望[J].控制理論與應(yīng)用, 2006,23(2):261-267.
[5]張俊根.粒子濾波及其在目標(biāo)跟蹤中的應(yīng)用研究[D].西安電子科技大學(xué),2011.
[6]Gilks W R,Berzuini C.Following a moving target—Monte Carlo inference for dynamic Bayesian models[J].Journal of the Royal Statistical Society:Series B (Statistical Methodology), 2001,63(1):127-146.
[7]Fearnhead P.Markov chain Monte Carlo,sufficient statistics, and particle filters[J].Journal of Computational and Graphical Statistics,2002,11(4):848-862.
[8]Carlin B P,Polson N G,Stoffer D S.A Monte Carlo approach to nonnormal and nonlinear state-space modeling[J].Journal of the American Statistical Association,1992,87(418):493-500.
[9]Berzuini C,Best N G,Gilks W R,et al.Dynamic conditional independence models and Markov chain Monte Carlo methods[J]. Journal of the American Statistical Association,1997, 92(440): 1403-1412.
[10]Sarkar P.Sequential Monte Carlo Methods in Practice[J]. Technometrics,2003,45(1):106-106.
[11]Sanjeev Arulampalam M,Maskell S,Gordon N,et al.A tutorial on particle filters for online nonlinear/non-Gaussian Bayesian tracking[J].Signal Processing,IEEE Transactions on, 2002,50(2):174-188.