牛彪 魏永強
摘 要 在大多數(shù)目標(biāo)跟蹤情景中,傳感器可以被控制,以執(zhí)行各種可能對測量的質(zhì)量和信息內(nèi)容產(chǎn)生重大影響的動作。這些動作也會影響跟蹤系統(tǒng)的估計性能。通常,這些行為可能包括更改傳感器平臺的位置,方向或運動,從而影響傳感器檢測,跟蹤和識別場景中物體的能力。這些控制決策是由人工干預(yù)或某種確定性控制策略驅(qū)動的,這種策略不能保證最優(yōu)性。本文我們選擇柯西-施瓦茲散度作為控制目標(biāo)函數(shù)。
關(guān)鍵詞 隨機有限集 多傳感器管理 柯西-施瓦茲散度
中圖分類號:Q945.3 文獻標(biāo)識碼:A
1背景:多目標(biāo)傳感器控制
通常這種類型的控制問題可以表述為一個部分可觀察的馬爾可夫決策過程(POMDP),在POMDP中,多目標(biāo)動力學(xué)被建模為馬爾科夫過程,但僅限于此多目標(biāo)狀態(tài)的后驗概率密度函數(shù)(pdf)是已知的(以過去的測量為條件),并且真實的基礎(chǔ)狀態(tài)是未知。每當(dāng)需要做出決定時,目標(biāo)都是找到最大化該反饋函數(shù)的控制行為。
另一方面,基于信息的優(yōu)化,它努力量化從執(zhí)行控制行動獲得的整體信息,因此它不會遭受競爭目標(biāo)的問題。雖然信息理論控制可能不會導(dǎo)致針對任何特定任務(wù)的最佳決策,但是跨多個任務(wù)目標(biāo)的整體效益很可能是優(yōu)越的。一般 ,R閚yi分歧已經(jīng)被提出用于單目標(biāo)和多目標(biāo)的傳感器管理跟蹤問題。在這樣的問題中,最佳控制行為就是預(yù)期的分歧或計算先驗和后驗?zāi)繕?biāo)密度之間的信息增益并將其用作選擇的依據(jù)。而KL和R閚yi分歧基于技術(shù)的技術(shù)已被證明是有用的,但其主要限制是其顯著的計算成本。特別是,除了某些特殊情況外,這些差異不能通過分析計算,因此需要昂貴的近似值,通?;诿商乜澹∕C)方法。由Fisher信息矩陣的概念激發(fā)的其他控制算法也已被提出,例如,在諸如傳感器波形選擇和軌跡規(guī)劃。另一種信息散度測量是Cauchy-Schwarz(CS)散度。
在本文中,我們考慮通過標(biāo)記隨機有限集(RFS)進行多目標(biāo)跟蹤的傳感器控制問題。尤其是,我們使用稱為廣義標(biāo)記多伯努利(GLMB)濾波器的跟蹤算法,其中的結(jié)果不能直接應(yīng)用。本文的關(guān)鍵創(chuàng)新是Cauchy-Schwarz的解析表達式兩個GLMB密度之間的分歧,用于構(gòu)建基于POMDP的傳感器的反饋函數(shù)控制方案。
我們在此描述。在多目標(biāo)跟蹤中,我們將多目標(biāo)狀態(tài)表示為每個時刻k的單個目標(biāo)狀態(tài)的有限集合。多物體狀態(tài)X k X和多物體觀測Z k Z被建模為隨機有限集合,F(xiàn)ISST是一個基于與點過程理論相一致的集成/密度概念與RFS一起工作的框架。多對象后驗密度可以使用貝葉斯遞歸來計算。
2傳感器管理
問題仍然是,當(dāng)我們希望執(zhí)行控制行動時,我們并不知道采取該行動會產(chǎn)生后驗概率密度。由于真正的信息分歧不可用,所以使用信息分歧的預(yù)期值與可能的所有未來測量有關(guān),更精確地說,讓我們從定義下面的符號開始:
(1) k是時間為k的多對象GLMB后驗概率密度。
(2) Ck是在時間k的允許控制動作的集合。
(3) H是計算反饋的地平線長度。
(4) (1:k+ H)是從時間k到k + H的多目標(biāo)GLMB預(yù)測。
(5)如果在時間k執(zhí)行控制動作c∈Ck,則Zk + 1:k + H(c)是從時間k + 1直到k + H時刻之間的測量集合的集合。
(6)最佳控制行為通過最大化反饋函數(shù)Rk + H的期望值這里給出一組允許行為:
Copt = arg maxc∈Ck E [Rk+H (c)]
反饋函數(shù)由預(yù)測和后驗多目標(biāo)密度之間的某種形式的信息散度Dcs給出。
3 Cauchy-Schwarz(CS)散度
最常用的信息獲取措施是Kullback-Leibler分歧,更一般地說,是R閚yi分歧。在本節(jié)中,我們證明Cauchy-Schwarz散度有一個更適合封閉形式的數(shù)學(xué)解決方案,并且特別地,在單個目標(biāo)密度是高斯混合的情況下,可以獲得GLMB密度的封閉形式。
3.1基于RFS的柯西-施瓦茨分歧
為了確定基于RFS的Cauchy-Schwarz(CS)散度,我們需要求助于Lebesque積分?;赗FS的概率密度可以由給出的參考測量u來定義,度量 類似于狀態(tài)空間X上的Lebesgue度量(事實上,當(dāng)狀態(tài)空間X有界時,它是單位強度為u = 1K的泊松點過程的非標(biāo)準(zhǔn)化分布)。
此外,它表明,對于參考量度的這種選擇,函數(shù)f的Lebesgue積分:F(X)→R,使用Lebesque積分我們可以定義內(nèi)積:這種內(nèi)環(huán)增益和規(guī)范的形式是明確的,因為密度f和g以及參考度量 都是無法計算的。令 和 表示各個點過程的FISST密度。 FISST密度與Radon-Nikodym導(dǎo)數(shù)之間的關(guān)系,相應(yīng)的概率密度(相對于參考測量 ),Cauchy-Schwarz散度可以用如下集合積分來表示,
4結(jié)論
本文對多目標(biāo)跟蹤階段中的傳感器管理問題進行了重點研究,建立了基于柯西施瓦茨距離最大化的傳感器管理調(diào)度模型,所提模型能夠有效解決目標(biāo)識別階段的多傳感器管理問題,獲得了較好的識別結(jié)果,提高了多傳感器識別系統(tǒng)的整體性能。
參考文獻
[1] CHHEIAS,M.&A.PAPANDREOU-SUPPAP-POLA.Sensor; resource allocation for tracking using out-er approximation[J].IEEE Signal Processing Letters,2007,14(03) :213-216.