劉鳳霞,宮先儀
(1.浙江大學信息與電子工程系,浙江杭州310027;2.杭州應用聲學研究所,浙江杭州310012)
很多科學和工程問題涉及的為動態(tài)系統(tǒng),系統(tǒng)狀態(tài)是隨時間變化的。對于動態(tài)系統(tǒng)做分析,需要利用狀態(tài)—空間模型對系統(tǒng)進行表征[1]。在很多應用中,為了精確地建模動態(tài)系統(tǒng),需要采用非線性/非高斯狀態(tài)—空間模型。序貫貝葉斯濾波為Bayesian濾波的遞歸實現(xiàn),它對數(shù)據(jù)進行序貫處理,而不是批處理,即隨著新數(shù)據(jù)的到來更新前面的濾波結(jié)果便可獲得當前時刻狀態(tài)的估計,不需要重新處理前面時刻的數(shù)據(jù),為系統(tǒng)狀態(tài)的在線跟蹤提供了一個合理的框架。在線性高斯狀態(tài)—空間模型下,最佳序貫貝葉斯濾波為卡爾曼濾波,在非線性/非高斯狀態(tài)—空間模型下,最佳序貫貝葉斯濾波不存在通用的解析解,只能采用近似理論,基于卡爾曼濾波的方法和質(zhì)點濾波方法,是兩類比較常用的近似方法。擴展卡爾曼濾波、Unscented卡爾曼濾波等基于卡爾曼濾波的方法用高斯分布來近似后驗密度;序貫重要性采樣、序貫重要性重采樣等質(zhì)點濾波方法通過一系列的隨機采樣點和相應的權(quán)值來表征后驗密度。基于卡爾曼濾波的方法和質(zhì)點濾波方法各有各的優(yōu)勢,是相互補充的。本文采用擴展卡爾曼和序貫重要性重采樣對兩個非線性/非高斯系統(tǒng)的狀態(tài)進行跟蹤,來說明擴展卡爾曼和序貫重要性重采樣的特點和適用范圍。
狀態(tài)方程(狀態(tài)過程演化):
測量方程(觀察過程演化):
序貫貝葉斯濾波是基于狀態(tài)—空間模型的,狀態(tài)—空間模型包括兩個方程:狀態(tài)方程和測量方程,狀態(tài)方程表征系統(tǒng)狀態(tài)隨時間的演化關系,測量方程表征測量數(shù)據(jù)和系統(tǒng)狀態(tài)的關系?;跔顟B(tài)方程和測量方程可以遞歸得到濾波后驗密度。在線性高斯狀態(tài)—空間模型下,卡爾曼濾波為最佳序貫貝葉斯濾波,由于它的高斯特性,遞歸過程只需傳遞均值和協(xié)方差,容易實現(xiàn)。但是線性高斯假設約束性太強,很多實際應用中狀態(tài)—空間模型為非線性/非高斯的。在非線性/非高斯狀態(tài)空間模型下,最佳序貫貝葉斯濾波不存在解析解,只能采用近似理論,基于卡爾曼濾波的方法和質(zhì)點濾波方法,是兩類主要的近似方法。
基于卡爾曼濾波的方法,后驗密度采用高斯近似,序貫濾波過程只需遞歸傳遞均值和協(xié)方差,計算量低,但是這種高斯化在后驗密度非高斯化比較嚴重時不能很好地描述后驗密度(如多模或重拖尾)。
擴展卡爾曼將狀態(tài)方程和測量方程通過一階泰勒展開進行局部線性化,假定先驗分布、過程噪聲和測量噪聲為高斯分布,后驗密度便近似為高斯分布。擴展卡爾曼不具有最佳性,它的性能取決于線性化的精度。UKF利用UT變換來進行均值和協(xié)方差的傳遞。在UT變換中,精心挑選的一些加權(quán)sigma點代表狀態(tài)變量經(jīng)過非線性變換得到下一時刻的sigma點,用sigma點來捕捉狀態(tài)變量的均值和協(xié)方差[2]。
質(zhì)點濾波方法通過一系列的隨機采樣點和相應的權(quán)值離散加權(quán)表示后驗密度,基于這些采樣點和相應的權(quán)值進行狀態(tài)的估計。隨著采樣數(shù)目的增多,后驗密度的離散加權(quán)表征等效于真實的后驗密度。
序貫重要性采樣算法,隨著測量數(shù)據(jù)的獲得,遞歸傳播采樣點和權(quán)值,得到每時刻后驗密度的離散加權(quán)表示。它是質(zhì)點濾波的基本形式,其余形式的質(zhì)點濾波可認為是它的特例。序貫重要性采樣質(zhì)點濾波存在褪化問題,褪化問題是指經(jīng)過許多輪的迭代后,幾乎所有采樣點的權(quán)值都接近于0,只有少數(shù)幾個采樣點的權(quán)值具有較大的值。解決這個問題有兩種方法:一種是選擇好的重要性密度,另一種是當褪化問題嚴重到一定程度時進行重采樣[3]。重采樣的基本思想為舍掉權(quán)值小的采樣點,對權(quán)值大的采樣點進行復制。在序貫重要性采樣算法的更新步驟后加入重采樣過程即為序貫重要性重采樣算法。
舉兩個仿真的例子,來比較擴展卡爾曼算法和序貫重要性重采樣算法的性能。第一個例子是單變量一階Markov過程,第二個例子是一個實際的問題——純方位目標跟蹤。
xk為系統(tǒng)狀態(tài),zk為測量數(shù)據(jù)。實現(xiàn)步數(shù)為30次,質(zhì)點數(shù)目為300個,Monte Carlo仿真次數(shù)為200次。序貫重要性重采樣算法對系統(tǒng)狀態(tài)進行估計時采用MMSE準則。真實的狀態(tài)值和擴展卡爾曼和序貫重要性重采樣估計值如圖1所示。系統(tǒng)狀態(tài)擴展卡爾曼和序貫重要性重采樣估計均方根誤差(RMS)如圖2所示。由仿真可以看出擴展卡爾曼和序貫重要性重采樣的性能相近。
純方位跟蹤討論的是對目標的方位和距離的跟蹤。因目標的運動具有一定的規(guī)律性,將這個規(guī)律性知識給利用上,利用方位信息便可以實現(xiàn)目標的純方位跟蹤。這里假設目標為恒速運動模型,狀態(tài)方程對目標的運動規(guī)律進行了表征。x、y為目標的笛卡爾坐標,vx、vy為目標的速度。ak代表x和y方向的加速度,用來表征可能的速度變化。測量方程表征了測量方位和狀態(tài)向量的關系,觀測點固定于原點處,測量數(shù)據(jù)為目標的方位。
圖1 狀態(tài)真值和估計值
圖2 狀態(tài)的均方根誤差
目標位置擴展卡爾曼和序貫重要性重采樣估計均方根誤差(RMS)如圖3、4所示。目標速度擴展卡爾曼和序貫重要性重采樣估計的均方根誤差(RMS)如圖5、6所示。由仿真結(jié)果可以看出序貫重要性重采樣性能明顯優(yōu)于擴展卡爾曼。
圖3 x坐標的均方根誤差
圖4 y坐標的均方根誤差
圖5 vx的均方根誤差
圖6 vy的均方根誤差
第一個仿真例子非線性/非高斯不嚴重,高斯分布可以較好的近似真實的后驗分布,所以擴展卡爾曼和序貫重要性重采樣性能相近,但是由于擴展卡爾曼計算量低,所以選擇擴展卡爾曼比較合適,第二個例子非線性/非高斯情況比較嚴重,高斯分布不能很好的近似真實的后驗分布,序貫重要性重采樣性能明顯優(yōu)于擴展卡爾曼,采用序貫重要性重采樣算法比較合適。
本文對非線性/非高斯序貫貝葉斯濾波理論進行了總結(jié),主要討論了基于卡爾曼濾波的方法和質(zhì)點濾波方法?;诳柭鼮V波的方法,后驗密度采用高斯近似,計算量低,但是這種高斯化在后驗密度非高斯化比較嚴重時不能很好地描述后驗密度。質(zhì)點濾波是一種寬容性的方法,一切情況的非線性/非高斯情況都可以處理,但是計算量比較大。它們各有各的優(yōu)勢,是相互補充的。
本文采用擴展卡爾曼和序貫重要性重采樣對兩個非線性/非高斯系統(tǒng)的狀態(tài)進行跟蹤,仿真表明系統(tǒng)非線性/非高斯不嚴重時采用擴展卡爾曼和序貫重要性重采樣性能相近,但是擴展卡爾曼計算量低,采用擴展卡爾曼算法比較合適;非線性/非高斯較嚴重時采用序貫重要性重采樣性能明顯優(yōu)于擴展卡爾曼,采用序貫重要性重采樣比較合適。
[1]Gordon N J,Salmond D J,Smith A F M.Novel approach to nonlinear/non-Gaussian Bayesian state estimation[J].IEEE Proceedings-F,1993,140(2):107-113.
[2]Yardim Caglar,Michalopoulou Zoi-Heleni,Gerstoft Peter.Peer-Reviewed Technical Communication-An Overview of Sequential Bayesian Filtering in Ocean Acoustics[J].IEEE Journal of Oceanic Engneering,2011,36(1):107-113.
[3]Arulampalam M S,Maskell S,Gordon N,etal.A tutorial on particle filters for online Nonlinear/Non-Gaussian Bayesian Tracking[J].IEEE Transactions on Signal Processing,2002,50(2):174-188.
[4]Carpenter J,Clifford P,F(xiàn)earnhead P.Improved particle filter for non-linear problems[J].IEEE Radar Sonar and Navigation,1999,146(1):2-7
[5]Candy Jmes V.Bootstrap particle filtering[J].IEEE Transactions on Signal Processing,2007,24(4):73-85.