崔博鑫,許蘊(yùn)山
(空軍工程大學(xué)航空航天工程學(xué)院,西安 710038)
傳感器管理就是對一組傳感器進(jìn)行自動(dòng)控制的系統(tǒng)或過程。其目的是選擇恰當(dāng)?shù)膫鞲衅鳌鞲衅鞴ぷ髂J胶蛡鞲衅魉阉鞣绞揭詢?yōu)化數(shù)據(jù)融合系統(tǒng)完成指定目標(biāo)任務(wù)的性能[1]。信息的變化可用于描述目標(biāo)的檢測、跟蹤和分類等的不確定性。在統(tǒng)計(jì)模型和運(yùn)動(dòng)模型下,Kruger等[2-4]給出了利用Shannon信息熵信息增量對傳感器資源進(jìn)行分配的算法。最近,基于Renyi熵的新理論開始廣泛應(yīng)用[5-6],Santamaria[7]首次把Renyi熵作為代價(jià)函數(shù)用到常數(shù)模算法中,使得收斂速度顯著提高而計(jì)算量卻增加很少。
在系統(tǒng)狀態(tài)估計(jì)中,大部分系統(tǒng)都具有一定的非線性問題,Bar-Shalom[8]提出了遞推濾波算法,包括擴(kuò)展卡爾曼濾波(EKF)、修正增益的推廣卡爾曼濾波(MGEKF)等。但EKF和MGEKF只適用于濾波誤差和預(yù)測誤差都比較小的情況,否則,收斂精度、收斂時(shí)間及穩(wěn)定性等會(huì)降低,濾波不穩(wěn)定甚至發(fā)散[9-10]。本文針對非線性系統(tǒng)中高機(jī)動(dòng)的情形,運(yùn)用無跡卡爾曼濾波(UKF)進(jìn)行狀態(tài)估計(jì),減少濾波誤差與預(yù)測誤差。用Renyi熵度量在濾波過程中產(chǎn)生的信息不確定性,以Renyi信息差異作為傳感器分配的代價(jià)函數(shù),合理分配傳感器資源。
Shannon熵是對信源輸出信息的隨機(jī)性的度量,當(dāng)所有狀態(tài)出現(xiàn)的概率都相等時(shí),熵最大,這時(shí)系統(tǒng)的隨機(jī)程度也最高。Renyi熵進(jìn)一步擴(kuò)展了Shannon熵的概念,反映了系統(tǒng)信息的高階特性。
對一個(gè)具有概率密度函數(shù)PX(x)的連續(xù)分布的隨機(jī)變量X的α階Renyi信息熵的定義為
當(dāng)α→1時(shí),α階的Renyi熵趨近于Shannon熵,即
當(dāng)α=2時(shí)
上式稱為二次Renyi熵,對應(yīng)于二項(xiàng)概率分布。Kapur[11]指出這種交替定義的Renyi熵等價(jià)于基于最大化熵的Shannon熵。
由于Renyi信息熵的計(jì)算需要對概率密度函數(shù)進(jìn)行非線性運(yùn)算,必須采用窗函數(shù)來獲得對概率密度函數(shù)的近似估計(jì)。Koenderink[12]指出連續(xù)變量的二次Renyi熵可以通過非參數(shù)法即帶核函數(shù)的Parzen窗來估計(jì),文獻(xiàn)[13]中證明了當(dāng)二次Renyi熵度量結(jié)合使用高斯核的Parzen窗時(shí)能大大節(jié)省計(jì)算量。
假設(shè)已知隨機(jī)變量X的樣本數(shù)據(jù)集為:{xi,i=1,2,…,N},采用Parzen窗估計(jì)X的概率密度函數(shù)PX(x)的算式為
由于系統(tǒng)為高斯分布,采用高斯核函數(shù):
利用Parzen窗函數(shù)及高斯核函數(shù),得到高斯分布下的Renyi熵為
將兩種Renyi熵的差值作為Renyi信息增量,用來表征信息不確定性的變化量
從上式可以看出,高斯分布下的信息不確定性的差異僅跟分布中的方差有關(guān),Renyi熵的信息增量在一定程度上收斂于Shannon熵的信息增量。
無跡卡爾曼濾波(UKF)是在無跡變換[14]的基礎(chǔ)上發(fā)展起來的,不需要對非線性狀態(tài)和量測模型進(jìn)行線性化,而是對狀態(tài)向量的概率密度函數(shù)進(jìn)行近似化,近似化后的概率密度函數(shù)仍然是高斯的,但它表現(xiàn)為一系列的采樣點(diǎn)。
設(shè)如下非線性模型
式中:Xk∈Rn為系統(tǒng)狀態(tài);f(·)為n維向量函數(shù);h(·)為m維向量函數(shù);Wk為n維系統(tǒng)過程噪聲;Vk為m維系統(tǒng)觀測噪聲。則無跡Kalman濾波計(jì)算過程如下。
1)初始化。
式中:Xa為系統(tǒng)的增廣狀態(tài)變量;RW和RV為過程噪聲和觀測噪聲協(xié)方差矩陣;E表示期望運(yùn)算。
2)U變換。
選取Sigma點(diǎn)
且
3)時(shí)間更新。
4)量測更新。
在U變換中,
式中:α為采樣點(diǎn)的散布程度,α>0,它可以調(diào)節(jié)粒子的分布距離,降低高階矩的影響,減少預(yù)測誤差;β為先驗(yàn)分布信息,β≥0,可以提高方差的精度,控制估計(jì)狀態(tài)的峰值誤差;nx為系統(tǒng)維數(shù);k為影響分布的尺度因子,多維系統(tǒng)選擇k=3-n可以使均方誤差最小;W(m)和W(c)分別是一階統(tǒng)計(jì)特性的權(quán)系數(shù)和二階統(tǒng)計(jì)特性的權(quán)系數(shù)。
在Renyi熵的基礎(chǔ)上,Renyi信息增量反映預(yù)測誤差和濾波誤差中信息不確定性的變化量,得到代價(jià)函數(shù)
設(shè)目標(biāo)有m個(gè),傳感器有n種,由傳感器組成的偽傳感器(即傳感器組合)共有2n-1種。考慮目標(biāo)威脅度[15],影響因素包括目標(biāo)類型、目標(biāo)速度、目標(biāo)高度、距掩護(hù)對象的距離、航路捷徑及電子干擾能力。結(jié)合目標(biāo)優(yōu)先級,即威脅度,將代價(jià)函數(shù)J與威脅度w結(jié)合,得到效能函數(shù)
式中:wi代表目標(biāo)i的威脅度;λ為威脅度的權(quán)系數(shù)。
在一個(gè)多傳感器系統(tǒng)中,優(yōu)化的目的是使傳感器分配給目標(biāo)后所取得的效能最大,由最優(yōu)線性分配思想,得到傳感器分配方案。
約束條件為
式中:xij≥0,對所有i,j均成立;τk表示第k個(gè)傳感器所能跟蹤目標(biāo)的最大個(gè)數(shù);S(k)為包含傳感器k的所有偽傳感器構(gòu)成的集合。在線性優(yōu)化中,xij為1或者0,等于1時(shí),表示第i個(gè)傳感器被分配給第j個(gè)目標(biāo)。
威脅度為0.87。
在UKF濾波中,U變換的各項(xiàng)系數(shù)α取0.01,β取2,κ取-1,λ=-3.9997。
根據(jù)UKF中的預(yù)測誤差協(xié)方差和濾波誤差協(xié)方差,用Renyi信息增量度量代價(jià)函數(shù),結(jié)合目標(biāo)威脅度,計(jì)算效能函數(shù),最后獲得傳感器管理分配方案。圖1表示目標(biāo)真實(shí)運(yùn)動(dòng)軌跡與基于Renyi熵的管理方案跟蹤軌跡,圖2表示在跟蹤過程中,3個(gè)目標(biāo)產(chǎn)生的Renyi熵信息增量。
圖1 目標(biāo)運(yùn)動(dòng)軌跡與Renyi熵跟蹤軌跡Fig.1 Motion track of target and Renyi entropy
圖2 3個(gè)目標(biāo)的Renyi熵信息增量Fig.2 Renyi entropy information gain of three targets
從圖1中可以看出,3個(gè)目標(biāo)經(jīng)過Renyi熵信息增量的分配方法,跟蹤效果較好。圖2中,在迭代的初期,由于目標(biāo)不確定性極大,故Renyi熵信息增量也在不斷增大,隨著迭代次數(shù)的增加,濾波、分配效果逐漸明顯,Renyi熵信息增量不斷降低。其中,目標(biāo)3由于其大機(jī)動(dòng)、變加速的特點(diǎn),濾波誤差較大,Renyi熵信息增量也相應(yīng)提高,給予更多的傳感器資源,但在迭代后期,Renyi熵信息增量仍比其他兩種目標(biāo)大,符合實(shí)際情況,說明本算法有效。
為了進(jìn)行對比,參照順序分配方法,得到Renyi熵分配方法與順序分配方法的誤差,圖3~圖5分別為3個(gè)目標(biāo)在兩種算法下的均方誤差。
由圖3~圖5可以看出,基于Renyi熵信息增量的傳感器分配方法能有效反映目標(biāo)跟蹤過程中的不確定性,合理分配傳感器資源,增強(qiáng)跟蹤效果。針對勻速、勻加/減速、變加速大機(jī)動(dòng)目標(biāo),其均方誤差小于順序分配方法,證明該算法有效。
圖3 目標(biāo)1的均方誤差Fig.3 Mean square error of target 1
圖4 目標(biāo)2的均方誤差Fig.4 Mean square error of target 2
圖5 目標(biāo)3的均方誤差Fig.5 Mean square error of target 3
當(dāng)系統(tǒng)資源無法滿足目標(biāo)的精度要求時(shí),會(huì)直接導(dǎo)致分配算法無解,無法形成有效的分配方案??梢圆扇煞N方法:1)調(diào)整目標(biāo)的威脅度,即給予高威脅目標(biāo)優(yōu)先打擊,例如本例中目標(biāo)3為變加速大機(jī)動(dòng)模型,可以適當(dāng)提高威脅度,而目標(biāo)1為勻速運(yùn)動(dòng)模型,降低其威脅度;2)等比例降低目標(biāo)的精度要求,即將3個(gè)目標(biāo)的Renyi熵信息增量乘以衰減因子,使得系統(tǒng)資源滿足精度要求,從而得到有效解。
本文利用Renyi熵結(jié)合Parzen窗函數(shù),準(zhǔn)確地度量了UKF過程中信息的不確定性,以Renyi熵信息差異為代價(jià)函數(shù),與目標(biāo)威脅度構(gòu)成了效能函數(shù),合理地分配傳感器資源。仿真結(jié)果表明,與順序分配方法相比,Renyi熵分配方法能夠增強(qiáng)跟蹤效果,對于變加速、大機(jī)動(dòng)目標(biāo)分配更多資源,該算法合理有效。
[1]MUSICK S,MALHOTRA R.Chasing the elusive sensor management[C]//Proceedings of the IEEE NAECON,New Jersey:IEEE,1994:606-613.
[2]KRUGER A B.Integrated tracking and sensor management based on expected information gain[C]∥Proceedings of SPIESignal Processing,Sensor Fusion,and Target Recognition,2007,6567:65670C1-C11.
[3]KREUCHER CM,HERO A O,KASTELLA K D,et al.An information-based approach to sensor management in large dynamic networks[J].Proceedings of IEEE,2007,95(5):978-999.
[4]周林,劉先省,金勇.一種非線性融合系統(tǒng)中的傳感器管理方法[J].系統(tǒng)工程與電子技術(shù),2006,28(7):1064-1066.
[5]HILD K E,ERDOGMUSE D,TORKKOLA K,et al.Feature extraction using information theoretic learning[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,28(9):1385-1392.
[6]BONEV B,CAZORLAM E F.Feature selection,mutual information,and the classification of high-dimensional patterns[J].Pattern Analysis and Applications,2008,11(3/4):309-319.
[7]SANTAMARIA I,PANTALEON C,VIELV A L,et al.Fast algorithm for adaptive blind equalization using order——a Renyi's entropy[C]//ICASSP IEEE,13-17 May 1520-6149,0-7803-7402-9,2002,3:Ⅲ-2657-Ⅲ-2660.
[8]BAR-SHALOM Y,LI X R.Estimation and tracking:Principles,techniques and software[M].Artech House,Boston,MA,1993.
[9]申石磊,劉先省,潘泉.基于運(yùn)動(dòng)模型的一類傳感器管理方法[J].電子學(xué)報(bào),2002,30(2):201-204.
[10]PACHTER M,CHANDLER P R.Universal linearization concept for extended Kalman filters[J].IEEE Transaction on Aerospace and Electronic Systems,1993,29(3):946-961.
[11]KAPUR JN.Measures of information and their applications[M].New York:Wiley-Interscience,1994.
[12]OENDERINK JJ,VAN DOORN A J.Surface shape and curvature scales[J].Image and Vision Computing,1992,10(8):557-565.
[13]WU Zhaohui,WANG Yueming.3D face recognition using local shape map[C]//ICIP 2004:IEEE International Conference on Image Processing.Washington,DC:IEEE Press,2004:2003-2006.
[14]JULIER S,UHLMANN J K.A general method for approximating nonlinear transformations of probability distributions[R].Technical Report,1994.
[15]范春彥.基于最大隸屬度的目標(biāo)威脅評估與排序法[J].系統(tǒng)工程與電子技術(shù),2003,25(1):47-48.