金 瑤 蔡之華 梁丁文
(中國地質(zhì)大學(武漢)計算機學院 武漢 430074)
在離散時間隨機動態(tài)系統(tǒng)狀態(tài)估計問題中,應用了大量的濾波技術(shù)。線性系統(tǒng)中一般是用貝葉斯遞推關系計算條件狀態(tài)的概率密度函數(shù),從概率密度函數(shù)中獲取詳細的系統(tǒng)狀態(tài)估計信息,從而進行準確的估計[1]。其中最著名的是Kalman濾波——線性高斯系統(tǒng)下的最優(yōu)濾波。而非線性濾波系統(tǒng)的狀態(tài)估計一般采取次優(yōu)的近似方法。一種方法是將非線性環(huán)節(jié)線性化處理,對高階項逼近或截斷,其中最常用的是擴展卡爾曼濾波(Extended Kalman Filter, EKF)[2]。另一種方法是用采樣方法近似非線性函數(shù)的概率密度分布,常用的有粒子濾波器(Partial Filter, PF)[3]、無跡卡爾曼濾波(Unscented Kalman Filter, UKF)[4]。
EKF將非線性函數(shù)的 Taylor展開式中高階項截斷,但是截斷的高階項必然會造成誤差。此外,EKF計算過程中需要計算非線性函數(shù)的 Jacobi矩陣,計算過程復雜且可能無解,這些問題限制了EKF的應用。PF使用參考分布,隨機產(chǎn)生大量粒子,由系統(tǒng)定義的非線性函數(shù)將這些粒子轉(zhuǎn)換后通過策略統(tǒng)計組合得到系統(tǒng)估值,PF雖然克服了EKF的缺點但近似過程需要生成數(shù)量龐大的粒子,在高維問題中計算量很大;此外粒子在迭代后產(chǎn)生退化問題,也影響了濾波精度[5]。UKF與PF一樣也應用采樣策略近似非線性分布的方法,不同之處在于UKF用無跡變換(Unscented Transformation, UT)進行確定性采樣而非隨機采樣。UT通過一組能夠伸縮且確定數(shù)目的Sigma點,計算其均值與協(xié)方差近似系統(tǒng)狀態(tài)。UKF的計算量基本與EKF相當,但性能優(yōu)于EKF;由于采用的是確定性采樣,也避免了PF的粒子退化問題[5]。
由于 UKF在解決某些應用問題時性能要明顯優(yōu)于EKF與PF,對UKF算法的研究與改進也一直是非線性隨機動態(tài)系統(tǒng)狀態(tài)估計研究的熱點。文獻[6]對Sigma點采樣策略進行改進,減少了Sigma點數(shù)量,在高維問題計算中能顯著提高計算效率。文獻[7]對 UKF噪聲處理方式進行改進,提出了增廣UKF,將系統(tǒng)噪聲與觀測噪聲加到狀態(tài)變量的協(xié)方差中,擴維后經(jīng)過UT過程能處理非累加性噪聲,提高濾波精度。文獻[8]由新息和殘差的正交性原理估計過程噪聲協(xié)方差的實時變化,利用協(xié)方差匹配原則修正噪聲理論協(xié)方差以逼近真實噪聲,提出一種基于新息和殘差序列在線估計噪聲統(tǒng)計特性的自適應UKF。文獻[9]根據(jù)極大后驗估計原理,推導出一種次優(yōu)無偏極大后驗估計常值噪聲統(tǒng)計估計器;采用指數(shù)加權(quán)的方法給出時變噪聲統(tǒng)計估計器遞推公式得到帶噪聲統(tǒng)計估計器的自適應UKF。
對UKF算法的改進很多,但主要集中在應用研究,對UT變換的理論分析研究與創(chuàng)新相對較少。UT變換最明顯的特點是具有縮放能力的采樣點,縮放參數(shù)控制采樣點的分布并影響近似準確性。雖然UT變換對非線性狀態(tài)后驗分布近似達到二階,但同時也引進了額外的高階項,若選擇合適的縮放參數(shù)可以使這些高階項更加近似真實情況;相反不合適的縮放參數(shù)會大幅降低UKF精度甚至發(fā)散,即縮放參數(shù)的選擇增加了UKF性能的不確定性[10]。文獻[6]給出了常規(guī)的縮放參數(shù)選擇方法,但實際應用時效果并不理想,仍需要使用者根據(jù)實際問題設定才能獲得理想的濾波精度。目前針對UKF縮放參數(shù)的討論并不多,因此本文將主要討論縮放參數(shù)選擇方法,并結(jié)合差分演化算法對其進行優(yōu)化,提出基于差分演化算法的自適應縮放參數(shù)的UKF。本文第2節(jié)介紹無跡變換;第3節(jié)對一些縮放參數(shù)自適應方法進行分析;第4節(jié)提出基于差分演化算法的自適應縮放參數(shù)的UKF算法并進行仿真實驗;第5節(jié)進行總結(jié)。
一個非線性動態(tài)系統(tǒng)可以描述為
UKF通過一組帶有權(quán)重的 Sigma點近似模擬非線性函數(shù)隨機變量分布,Sigma點計算方法就是通過 UT變換。UT變換在給定采樣均值與協(xié)方差后,通過特定方法生成一組Sigma點并賦予權(quán)重,將所有Sigma點通過非線性轉(zhuǎn)換,將轉(zhuǎn)換后的統(tǒng)計值作為估計值。
Sigma點計算方法為
其中i=1,…,n,x0為中心Sigma點,xi是以x0為中心對稱分布的Sigma點,為Sigma點均值,px為協(xié)方差,n為狀態(tài)變量維數(shù),wm為Sigma點權(quán)重,κ為縮放參數(shù)。UT變換共生成2n+1個Sigma點,權(quán)重和為1。將Sigma點通過非線性函數(shù)yi=h(xi)轉(zhuǎn)換,計算轉(zhuǎn)換后的統(tǒng)計特征。
UT變換過程中Sigma點采樣策略非常重要,決定了非線性函數(shù)近似的效果。在對稱采樣式(3)-式(5)中,縮放參數(shù)κ決定了Sigma點的個數(shù)、大小與權(quán)重,調(diào)節(jié)Sigma點與均值點的距離,下面討論幾種κ取值方法。
文獻[4]就κ值的選擇進行了分析,κ變化僅影響二階之后高階矩帶來的偏差,對于高斯分布,κ取值滿足n+κ=3 時可使近似誤差控制在四階矩;當系統(tǒng)維數(shù)大于 3時,κ為負值可能導致協(xié)方差失去正定性,式(4),式(5)無法求取平方根導致濾波發(fā)散[10]。由此給出了一種κ值選擇框架。
當系統(tǒng)維數(shù)小于3時,Sigma點分布范圍與權(quán)重方式固定。當系統(tǒng)維數(shù)大于3時,κ只有0一種取值方法,Sigma點分布范圍隨系統(tǒng)維數(shù)增加而擴大相應權(quán)重減小。這種取值方法簡單被廣泛應用,κ為整數(shù)由系統(tǒng)維數(shù)決定。常規(guī)方法實際效果如何,κ取值對濾波精度有怎樣的影響,下面通過實驗來說明。以Bearings-Only Tracking(BOT)[12]模型為例,用不同κ值的 UKF對其進行濾波處理對比誤差。BOT模型定義為
表 1列出了κ取 13個參數(shù)進行 100次試驗后MSE計算結(jié)果。從表1結(jié)果看,常規(guī)取值方法κ=1時濾波精度并不理想,κ>1時濾波精度提高,在本次試驗中κ=3.5時濾波精度最高。另隨機抽取 10組單次試驗數(shù)據(jù)分析發(fā)現(xiàn),13個參數(shù)都有可能取得較高的濾波精度MSE小于2,也有可能使濾波發(fā)散MSE大于20,并且κ變化會引起濾波MSE很大的波動,說明κ對濾波精度有較大影響,濾波精度對κ選擇非常敏感。將上述BOT模型擴展到4維,進行同樣的實驗也得到了類似的結(jié)果。表2列出了在4維系統(tǒng)中不同κ取值的濾波MSE。實驗結(jié)果顯示在4維系統(tǒng)中UKF精度要明顯低于2維系統(tǒng),由常規(guī)方法κ=0得到的濾波誤差較大,當κ大于2后濾波精度提高。由此可見按照常規(guī)方法選擇的κ效果并不理想,κ設置更大值時可能提高濾波精度。由于UT變換過程中引進了額外的高階項, 3n+κ=的條件只是在保證四階矩近似誤差最小情況下獲得,并不能保證UT變換對高于四階矩的近似誤差最小[10]。這種取值方法限制了Sigma點的分布與權(quán)重可能降低非線性近似效果,實驗也證明當κ增大時,擴大Sigma點分布范圍有利于提高非線性函數(shù)概率密度分布的近似度。
通過上述2維及4維BOT系統(tǒng)應用不同κ進行UKF的實驗,可以得出結(jié)論:κ設置對UKF精度有較大影響,κ=3-n的固定取值方法并不合適。在κ≥0保證協(xié)方差正定性前提下,κ應根據(jù)當前時刻估計均值與協(xié)方差適時調(diào)整才能有效提高濾波精度。另外,κ變化幅度對濾波精度也有較大影響,很小的變化可能導致濾波誤差增大甚至發(fā)散,濾波精度對κ設置非常敏感。因此需要研究一種新的參數(shù)取值方法動態(tài)調(diào)節(jié)κ,降低濾波誤差并避免發(fā)散。
為了提高κ的自適應調(diào)整能力,文獻[13]通過實驗表明κ取值變化比率與UKF精度有較大聯(lián)系,提出了一種判別式學習方法。通過一組先驗實驗數(shù)據(jù)用判別學習方法訓練κ,判別方法是以濾波精度是否提高對κ進行定量增減處理。這種學習判別方法原理簡單便于實現(xiàn),但缺點也很明顯。首先必須準備大量與模型對應的準確的先驗數(shù)據(jù)作為判別標準,κ優(yōu)化效果取決于訓練數(shù)據(jù)規(guī)模。當模型參數(shù)變化后又需要新的訓練數(shù)據(jù),應用時很不方便。此外濾波精度對κ變化十分敏感,κ變化幅度難以控制。學習判別過程需要花費大量時間,算法效率不高不便廣泛應用。
表1 2維系統(tǒng)κ不同取值UKF MSE計算結(jié)果
表2 4維系統(tǒng)κ不同取值UKF MSE計算結(jié)果
文獻[1]通過對 UKF誤差分析得出結(jié)論,κ=3-n是用縮放參數(shù)消除四階項和最直接的方式,但實際上UT過程中引入的高階項可能產(chǎn)生更大的誤差,這僅是一種先驗參考方法[1]。然后提出了一種自適應取值方法,定義以κ為參數(shù)的每時刻狀態(tài)預測估計的近似似然函數(shù)為
由觀測值zk計算最合適的κ值:
似然函數(shù)由高斯概率密度函數(shù)近似獲得。應用網(wǎng)格方法或隨機搜索的方法對κ進行選擇,指定范圍κ∈[0,9n]。κ最大值為9n是為了使非中心的Sigma點權(quán)重和最小為0.1,避免這些Sigma點因權(quán)重太小被忽略[1]。
這種方法要優(yōu)于文獻[13]提出的判別式學習方法。使用釋然函數(shù)作為κ選擇標準無需先驗數(shù)據(jù)具有較強實用性。但應用網(wǎng)格搜索方法并未解決κ難以調(diào)節(jié)的問題,且效率不高。網(wǎng)格法與文獻[13]的定量變化方法類似,κ取值范圍與網(wǎng)格密度相關,在有限個數(shù)的候選解中擇優(yōu)選擇。濾波精度提升只是當前網(wǎng)格密度下最優(yōu)。網(wǎng)格稀疏時κ候選解較少,濾波精度提升有限;網(wǎng)格密集時κ候選解過多,則計算耗時更長。如何平衡網(wǎng)格密度與濾波精度又成為新的問題。此外這種方法只能對κ一個參數(shù)進行優(yōu)化,僅適用于常規(guī)的UKF,無法處理需要3個參數(shù)的Scaled UKF。
上述介紹的兩種優(yōu)化方法中κ變化幅度人為指定,這限制了κ取值精度,而且κ的選擇方法效率不高。觀察整個UKF過程,可以將κ選擇看作一個參數(shù)優(yōu)化問題,優(yōu)化評價標準為濾波精度。這樣便可以使用啟發(fā)式優(yōu)化方法對κ優(yōu)化選擇達到自適應的效果。差分演化算法(Differential Evolution,DE)[14]正是這樣一種基于種群中樣本差異的全局優(yōu)化算法,具有算法簡單、收斂速度快、魯棒性高、參數(shù)易設置等特點,在約束優(yōu)化計算、聚類計算、非線性優(yōu)化控制、神經(jīng)網(wǎng)絡優(yōu)化、濾波器設計等其它方面得到廣泛應用[14]。
DE采用實數(shù)編碼,其原理與遺傳算法相似,在給定值域內(nèi)生成NP個隨機樣本,對種群內(nèi)各個樣本進行變異、交叉、選擇操作。變異操作通過隨機選取種群兩個不同個體,利用個體間差分向量對個體進行擾動,實現(xiàn)個體變異[15]。DE利用群體分布特性使其具有優(yōu)秀的搜索能力,迅速確定目標優(yōu)化值域;交叉操作使個體基因延續(xù)至下一代,保持種群多樣性;選擇操作采用貪婪算法選擇更優(yōu)秀的個體進入下一代種群,使優(yōu)化對象不斷改善[16]。用 DE對κ進行優(yōu)化,相當于在給定范圍內(nèi)κ有無限個候選解。而 DE優(yōu)秀的搜索能力使κ調(diào)節(jié)更自由,能夠解決濾波精度對κ選擇敏感的問題。
本文將DE與UKF結(jié)合,提出一種基于差分演化的UKF縮放參數(shù)自適應策略,并應用到濾波計算中。用DE優(yōu)化UKF的縮放參數(shù)κ,利用DE高效的勘探與開采能力,在給定κ值范圍內(nèi)進行尋優(yōu)處理,以濾波MSE作為DE評價函數(shù),選擇使濾波誤差最小的κ。在每次濾波計算中根據(jù)當前時刻Sigma點均值與協(xié)方差對κ進行獨立的 DE操作得到經(jīng)優(yōu)化選擇的κ,其濾波值作為當前時刻濾波結(jié)果。將每次濾波計算視為單獨的優(yōu)化問題,貫穿整個濾波過程?;诓罘盅莼淖赃m應縮放參數(shù)UKF的計算步驟為:
步驟 2 由DE對k時刻的UKF的Sigma點縮放參數(shù)進行差分演化計算,在給定縮放參數(shù)范圍內(nèi)進行種群初始化、變異、交叉、選擇操作,完成G代演化過程或到達到中止條件后中止演化。將演化得到最優(yōu)κk的濾波計算結(jié)果作為當前時刻濾波結(jié)果。
步驟 3k=k+1,重復步驟2,直到濾波過程結(jié)束。
本文提出的自適應策略與文獻[1]提出的方法相比,前者用每時刻最小濾波誤差作為κ的評價標準比后者用每時刻測量值的近似似然函數(shù)為評價標準對濾波精度提升更直接。DE全局隨機搜索能力比網(wǎng)格法更強,κ選擇更自由有助于提升濾波精度。此外提出新策略不受參數(shù)個數(shù)的限制,能處理縮放UKF算法。
表3給出了兩種方法在2維,4維系統(tǒng)中濾波MSE與Vc結(jié)果,基于DE的自適應UKF精度比使用固定縮放參數(shù)的UKF有大幅提升,在4維系統(tǒng)中更為明顯。圖 1為κ取定值與自適應時濾波誤差對比,用 DE選擇κ后每時刻濾波誤差均不同程度降低,表明這種策略是有效的。在使用固定κ時,Sigma點分布范圍與權(quán)重固定,可能在某時刻因為誤差引起濾波發(fā)散降低濾波精度。圖2為在2維系統(tǒng)單次試驗中的X1模擬效果,固定參數(shù)UKF出現(xiàn)了濾波發(fā)散的現(xiàn)象。而基于DE的自適應UKF由于κ實時調(diào)整,濾波值能始終貼近真實值濾波沒有發(fā)散。
圖 3為這種自適應策略優(yōu)化后縮放參數(shù)κ隨時間變化的分布圖。κ在整個值域內(nèi)都有分布,在極值兩端區(qū)域分布較密集。圖3結(jié)果表明在非線性濾波狀態(tài)估計這樣的動態(tài)系統(tǒng)中,使用固定的參數(shù)并不合適,需要實時調(diào)節(jié)才能提高濾波精度并避免發(fā)散,但κ整體分布隨意且毫無規(guī)律,難以用數(shù)學公式進行描述。將κ取值范圍擴大設κ∈[0,30]進行實驗,優(yōu)化后κ分布也是同樣的現(xiàn)象,值域內(nèi)分布隨意兩端密集。但濾波MSE略微增大,因為更大的值域使κ有更多的選擇,但增加了 DE的負荷,可能在設定的最大演化代數(shù)結(jié)束時還未收斂而影響濾波精度。
縮放UKF應用SUT,應用比例修正的方法需要3個參數(shù),文獻[5]介紹了一種SUT伸縮參數(shù)取值方法:α∈[0,1],β=2,κ=3-n或0。用DE分別對3個參數(shù)進行組合優(yōu)化,并與固定縮放參數(shù)縮放UKF進行對比。在2維BOT系統(tǒng)中進行100次獨立試驗結(jié)果如表4。
表4說明在縮放UKF自適應策略同樣有效,濾波精度提升明顯,并且優(yōu)化后縮放UKF精度略高于單參數(shù)的UKF。觀察對3個參數(shù)組合優(yōu)化后的結(jié)果,當β=2時對α,κ優(yōu)化后濾波誤差最小,濾波精度高于其它單個或多個參數(shù)組合優(yōu)化的結(jié)果。說明在等比例采樣方式中β=2是合適的設定,驗證了文獻[11]提出的高斯分布時β=2是 SUT最佳設定的結(jié)論。單獨對另兩個參數(shù)優(yōu)化結(jié)果顯示對α優(yōu)化后MSE低于對κ優(yōu)化后的MSE,優(yōu)先對α優(yōu)化對濾波提升更明顯。因此設β=2,對α和κ優(yōu)化或只對α優(yōu)化是最佳組合且能提高效率。在上述實驗中固定參數(shù)的縮放UKF也出現(xiàn)了隨機發(fā)散現(xiàn)象,而自適應縮放UKF則未發(fā)散。
本文介紹并討論了無跡變換Sigma點縮放參數(shù)的取值問題,結(jié)合差分演化思想提出了一種基于差分演化算法的自適應縮放參數(shù)取值策略:利用 DE調(diào)整無跡變換縮放參數(shù),優(yōu)化Sigma點分布以提高非線性近似效果,并應用到UKF計算中。通過實驗表明新策略使用后,不僅有效提高了UKF精度,而且能避免UKF隨機波動。但這種后驗優(yōu)化方式無法解釋縮放參數(shù)選擇的依據(jù),優(yōu)化后的縮放參數(shù)分布具有很強隨機性難以總結(jié)規(guī)律。對UKF縮放參數(shù)取值方法還需進行深入的研究,下一步考慮引入支持向量回歸技術(shù),將濾波估計均值、協(xié)方差,新息等內(nèi)容作為變量因素,用DE優(yōu)化后的縮放參數(shù)作為訓練數(shù)據(jù),用支持向量回歸技術(shù)指導UKF縮放參數(shù)取值。
表3 固定參數(shù)UKF與本文提出的自適應UKF的MSE與Vc對比
圖1 固定參數(shù)與自適應參數(shù)MSE對比
圖2 X1模擬圖
圖3 基于DE的自適應縮放參數(shù)分布
表4 縮放UKF自適應參數(shù)與固定參數(shù)MSE與Vc對比
[1]Dunik J, Simandl M, and Straka O. Unscented Kalman Filter:aspects and adaptive setting of scaling parameter[J].IEEE Transactions on Automatic Control, 2012, 57(9): 2411-2416.
[2]Gustafsson F and Hendeby G. Some relations between extended and unscented Kalman filters[J].IEEE Transactions on Signal Processing, 2012, 60(2): 545-555.
[3]Wu Xin-jie and Huang Guo-xing. Application of particle filter algorithm in nonlinear constraint optimization problems[C].2012 8th International Conference on Natural Computation,Chongqing, 2012: 822-826.
[4]Julier S J, Uhlmann J K, and Durrant-White H F. A new method for the nonlinear transformation of means and covariance in filters and estimators[J].IEEE Transactions on Automatic Control, 2000, 45(3): 477-482.
[5]潘泉, 楊峰, 葉亮, 等. 一類非線性濾波器—UKF綜述[J]. 控制與決策, 2005, 20(5): 481-489.
Pan Quan, Yang Feng, Ye Liang,et al.. Survey of a kind of nonlinear filters— UKF[J].Control and Decision, 2005, 20(5):481-489.
[6]Julier S J and Uhlmann J K. Reduced sigma point filters for the propagation of means and covariances through nonlinear transformations[C]. American Control Conference, Alaska,2002: 887-892.
[7]Wu Yuan-xin, Hu De-wen, Wu Mei-ping,et al.. Unscented Kalman filtering for additive noise case: augmented versus no augmented[J].IEEE Signal Processing Letters, 2005, 12(5):357-360.
[8]周衛(wèi)東, 喬相偉, 吉宇人, 等. 基于新息和殘差的自適應UKF算法[J]. 宇航學報, 2010, 31(7): 1798-1804.
Zhou Wei-dong, Qiao Xiang-wei, Ji Yu-ren,et al.. An innovation and residual-based adaptive UKF algorithm[J].Journal of Astronautics, 2010, 31(7): 1798-1804.
[9]趙琳, 王小旭, 孫明, 等. 基于極大后驗估計和指數(shù)加權(quán)的自適應UKF濾波算法[J]. 自動化學報, 2010, 36(7): 1007-1019.
Zhao Lin, Wang Xiao-xu, Sun Ming,et al.. Adaptive UKF filtering algorithm based on maximum a posterior estimation and exponential weighting[J].Acta Automatica Sinica, 2010,36(7): 1007-1019.
[10]王小旭, 潘泉, 黃鶴, 等. 非線性系統(tǒng)確定采樣型濾波算法綜述[J]. 控制與決策, 2012, 27(6): 801-812.
Wang Xiao-xu, Pan Quan, Huang He,et al.. Overview of deterministic sampling filtering algorithms for nonlinear system[J].Control and Decision, 2012, 27(6): 801-812.
[11]Julie S J. The scaled unscented transformation[C]. American Control Conference, Alaska, American, 2002, 6: 4555-4559.
[12]Su Xiao-jing, Yan Jin, and Yan She-feng. A UKF algorithm with two arrays in bearings-only tracking [C]. 2011 4th International Congress on Image and Signal Processing,Shanghai, 2011, 5: 2709-2712.
[13]Sakai A and Kuroda Y. Discriminatively trained unscented Kalman filter for mobile robot localization[J].Journal of Advanced Research in Mechanical Engineering, 2002, 1(3):153-161.
[14]Chakraborty U K. Advances in Differential Evolution[M].Berlin: Heidelberg, Springer-Verlag, 2008: 1-27.
[15]楊啟文, 蔡亮, 薛云燦. 差分進化算法綜述[J]. 模式識別與人工智能, 2008, 21(4): 506-511.
Yang Qi-wen, Cai Liang, and Xue Yun-can. A survey of differential evolution algorithms[J].Pattern Recognition and Artificial Intelligence, 2008, 21(4): 506-511.
[16]李紅偉, 王俊, 王海濤. 一種基于差分演化的粒子濾波算法[J].電子與信息學報, 2011, 33(7): 1639-1643.
Li Hong-wei, Wang Jun, and Wang Hai-tao. A new particle filter based on differential evolution method[J].Journal of Electronics&Information Technogy, 2011, 33(7): 1639-1643.