国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

空中目標(biāo)傳感器管理方法綜述

2018-10-30 11:50閆濤韓崇昭張光華
航空學(xué)報(bào) 2018年10期
關(guān)鍵詞:傳感器優(yōu)化目標(biāo)

閆濤,韓崇昭,張光華

1. 西安交通大學(xué) 電信學(xué)院 綜合自動(dòng)化研究所,西安 710049 2. 西安交通大學(xué) 智能網(wǎng)絡(luò)與網(wǎng)絡(luò)安全教育部重點(diǎn)實(shí)驗(yàn)室,西安 710049

在20世紀(jì)的最后十多年里,傳感器技術(shù)在全球范圍內(nèi)迎來了革命性的發(fā)展和進(jìn)步。這直接引發(fā)了具有高可控自由度的感知設(shè)備的大量出現(xiàn)。傳統(tǒng)的傳感器信號傳輸屬性,如中心頻率、帶寬、波束調(diào)制、采樣率等一系列與傳感器管理有關(guān)的參數(shù)和工作模式都可以通過軟件的形式進(jìn)行操控。在同一時(shí)期內(nèi),傳感器網(wǎng)絡(luò)方面的相關(guān)技術(shù)也取得了非常大的進(jìn)步,出現(xiàn)了具有各種先進(jìn)傳感器以及交互式網(wǎng)絡(luò)的可部署自動(dòng)/半自動(dòng)的無人機(jī)/無人車系統(tǒng)。這說明可自動(dòng)配置的網(wǎng)絡(luò)感知系統(tǒng)是信息融合領(lǐng)域的一個(gè)新興的發(fā)展方向,能夠解決工程應(yīng)用中的許多實(shí)際問題。

隨著近年來合成孔徑雷達(dá)(Synthetic Aperture Radar, SAR)、相控陣?yán)走_(dá)(Phased Array Radar, PAR)、敵我識別器(Identification Friend of Foe, IFF)、前視紅外雷達(dá)(Forward Looking Infrared Radar, FLIR)、電子支持測量(Electronic warfare Support Measures, ESM)等各種先進(jìn)傳感器以及新型作戰(zhàn)飛機(jī)、預(yù)警機(jī)、無人機(jī)等平臺的不斷發(fā)展,現(xiàn)代戰(zhàn)場環(huán)境變得日益復(fù)雜,傳感器管理任務(wù)也面臨重大需求和挑戰(zhàn),亟需進(jìn)一步深入研究。在軍用領(lǐng)域,傳感器管理方法可用于彈道導(dǎo)彈防御、空防預(yù)警、超視距多目標(biāo)探測、戰(zhàn)場區(qū)域監(jiān)視、態(tài)勢評估等方面;在民用領(lǐng)域,可用于空中交通管制、交通導(dǎo)航、智能車輛系統(tǒng)、機(jī)器人視覺等領(lǐng)域。同時(shí),傳感器管理與多目標(biāo)意圖推斷、威脅估計(jì)等其他高層信息融合處理過程也具有重要的耦合關(guān)系。這就需要有針對性地采用某種策略來對多傳感器進(jìn)行優(yōu)化配置,以發(fā)揮其最大效用。

所謂的“傳感器管理”總體而言是指對傳感器系統(tǒng)的自由度進(jìn)行控制,以滿足實(shí)際的約束條件并實(shí)現(xiàn)既定的任務(wù)目標(biāo)。為了達(dá)到這一目的,需要在跟蹤過程的每一時(shí)刻,在約束條件下根據(jù)已經(jīng)得到的量測集合和當(dāng)前可用的傳感器資源確定最優(yōu)的傳感器配置方案。因此傳感器管理的核心思想在于優(yōu)化方法,并且與控制論、信息論、統(tǒng)計(jì)方法、信號處理等數(shù)學(xué)、計(jì)算科學(xué)與工程方法密切相關(guān)。同時(shí),傳感器管理可同時(shí)應(yīng)用于區(qū)域目標(biāo)監(jiān)視、多目標(biāo)跟蹤等各種軍用和民用領(lǐng)域。本文重點(diǎn)針對空中目標(biāo)傳感器管理問題的內(nèi)涵、產(chǎn)生和發(fā)展進(jìn)程,以及近年來主要傳感器管理方法的任務(wù)目標(biāo)、約束條件、感知模式、動(dòng)態(tài)模型等問題進(jìn)行綜述和討論。這些相關(guān)的方法實(shí)際上具有更廣闊的適用范圍,而并不局限于本文所涉及到的內(nèi)容。

本文旨在對傳感器管理的相關(guān)研究脈絡(luò)和最新進(jìn)展進(jìn)行較為全面的分析和總結(jié)。由于傳感器管理屬于信息融合領(lǐng)域的一個(gè)分支,該領(lǐng)域內(nèi)與其關(guān)聯(lián)的問題較多,因此部分與傳感器管理相關(guān)的研究內(nèi)容并不在本文的討論范圍之內(nèi)。這其中包括自適應(yīng)搜索方法、啟發(fā)式傳感器管理方法等,還有人工智能和人機(jī)交互系統(tǒng)的部分相關(guān)內(nèi)容,包括機(jī)器視覺、自動(dòng)導(dǎo)航、壓縮感知等方法也不在本文討論之列。另外,由于空中目標(biāo)具有機(jī)動(dòng)性高、運(yùn)動(dòng)軌跡和跟蹤環(huán)境復(fù)雜多變等特點(diǎn),因此一直以來都是傳感器管理方面的重點(diǎn)研究對象。本文以此為基礎(chǔ)展開論述,其中涉及到的方法具有一般性,并不局限于空中目標(biāo)。該領(lǐng)域的研究還包括但不限于針對地面運(yùn)動(dòng)目標(biāo)檢測(Ground Moving Target Indication, GMTI)等傳感器管理方法,在此不再專門討論。參考文獻(xiàn)列舉了本文所涉及到的全部相關(guān)學(xué)術(shù)研究工作。

在傳感器管理方面最早發(fā)表的綜述性論文是Monahan于1982年發(fā)表的文章[1],該文在傳感器管理概念尚未建立的時(shí)候就給出了針對部分能觀馬爾可夫決策過程(Partially Observed Markov Decision Process, POMDP)的理論和方法。其后是1998年Cassandra發(fā)表的文章[2],該文并未直接討論傳感器管理問題,而是主要研究了在傳感器管理與調(diào)度任務(wù)中的一些應(yīng)用實(shí)例,并分析了POMDP與傳感器管理之間的聯(lián)系。Ng G W和Ng K H于2000年則從傳感器融合的角度對傳感器管理方法進(jìn)行了總結(jié)[3]。Hero等于2008年出版的論著《Foundations and applications of sensor management》分章節(jié)闡述了傳感器管理的主要方法[4]。該領(lǐng)域其他的綜述性文章還有Cochran[5]于1995年發(fā)表的文章以及Liu等[6]于2002年發(fā)表的文章。

近年來國內(nèi)外有關(guān)傳感器管理的博士學(xué)位論文也有許多。其中國外有Kreucher[7]、Rangrajan[8]、Blatt[9]、Williams[10]、Huber[11]和Jenkins[12]等;國內(nèi)先后有劉先省[13]、周文輝[14]、劉嚴(yán)巖[15]、盧建斌[16]和劉欽[17]等對傳感器管理問題做過深入的研究。

本文后續(xù)內(nèi)容按以下結(jié)構(gòu)組織:第1節(jié)給出了傳感器管理系統(tǒng)的概念定義和基本目標(biāo);第2節(jié)重點(diǎn)介紹了過去隨著傳感器管理的產(chǎn)生和發(fā)展而出現(xiàn)的經(jīng)典方法和技術(shù),并概述和分析了近年來最新的一些傳感器管理方法;第3節(jié)展望了傳感器管理在未來所面臨的挑戰(zhàn)與機(jī)遇;最后部分對全文進(jìn)行了總結(jié)。

1 傳感器管理的定義

通過綜合參考文獻(xiàn)[4-17],能夠得出傳感器管理(也稱傳感器控制)的具體定義:利用有限的傳感器資源完成對多個(gè)目標(biāo)的檢測、跟蹤與識別任務(wù),以得到各目標(biāo)具體特性的最優(yōu)度量值(如檢測概率、截獲概率、傳感器發(fā)射能力、網(wǎng)絡(luò)能耗、航跡精度和丟失概率等),并根據(jù)最優(yōu)準(zhǔn)則對目標(biāo)函數(shù)進(jìn)行優(yōu)化,進(jìn)而實(shí)現(xiàn)對傳感器資源科學(xué)合理地分配與調(diào)度。在進(jìn)行測量跟蹤過程的每一時(shí)刻,系統(tǒng)從一組可選傳感器集合中動(dòng)態(tài)地選擇合適的傳感器對單目標(biāo)或多目標(biāo)進(jìn)行掃描跟蹤,從而達(dá)到優(yōu)化傳感器網(wǎng)絡(luò)各項(xiàng)性能的目的。一般將時(shí)間離散化為等長的時(shí)間段,一個(gè)傳感器在任一時(shí)間段內(nèi)可能被選擇和調(diào)度,因此該問題屬于離散時(shí)間問題。這里的傳感器管理系統(tǒng)通常是指閉環(huán)系統(tǒng),下一時(shí)刻傳感器選擇調(diào)度的結(jié)果是根據(jù)當(dāng)前時(shí)刻傳感器的量測集得出的。而傳感器調(diào)度則是用于進(jìn)行傳感器選擇的前饋結(jié)構(gòu),在部分文獻(xiàn)里這兩個(gè)概念是混用的[18]。

傳感器管理方法能夠根據(jù)一定的最優(yōu)準(zhǔn)則對傳感器部署位置、目標(biāo)分配、工作模式及工作參數(shù)等進(jìn)行控制,從而優(yōu)化傳感器網(wǎng)絡(luò)整體性能。該方法能夠提高對特定目標(biāo)或監(jiān)視區(qū)域的感知能力,同時(shí)減小應(yīng)對時(shí)的工作負(fù)荷,因此在整個(gè)信息融合系統(tǒng)中占據(jù)更高層級的位置,并如前所述與系統(tǒng)其他部分緊密關(guān)聯(lián),如圖1所示。其中:L0~L4分別表示信息融合系統(tǒng)由低到高的5個(gè)不同層級。

在傳感器管理的相關(guān)應(yīng)用方面,可以用于管理調(diào)度的傳感器一般都是指虛擬傳感器,表示實(shí)際物理設(shè)備的相關(guān)參數(shù)設(shè)置以及傳感器器件、傳感器平臺等工作模式選擇,還包括傳感器子系統(tǒng)數(shù)據(jù)處理方式和相互之間數(shù)據(jù)通信方式的設(shè)置。因此,對傳感器進(jìn)行管理就意味著確定傳感器系統(tǒng)的可控自由度數(shù)值應(yīng)如何設(shè)定。

圖2展示了一個(gè)閉環(huán)傳感器管理系統(tǒng)的基本結(jié)構(gòu)。當(dāng)S1~S3中的某個(gè)傳感器被系統(tǒng)選擇并對目標(biāo)進(jìn)行了探測時(shí),被掃描對象的信息就能從傳感器數(shù)據(jù)中被系統(tǒng)提取出來。這一過程涉及到將不同來源、不同類型的傳感器數(shù)據(jù)進(jìn)行異類信息融合,以及將當(dāng)前時(shí)刻所獲得的信息與之前的傳感器量測信息進(jìn)行進(jìn)一步融合。該閉環(huán)系統(tǒng)在信息融合與信號處理過程中有可能產(chǎn)生部分附加信息,例如目標(biāo)航跡和目標(biāo)種類信息等,可以在傳感器管理過程中充分利用這些信息來提高系統(tǒng)感知能力。

為了達(dá)到傳感器管理的目的,需要對每一時(shí)刻可能的傳感器選擇結(jié)果進(jìn)行量化分析。該量化分析可以采用多種形式,包括基于信息增益或者期望風(fēng)險(xiǎn)的統(tǒng)計(jì)方法,以及啟發(fā)式方法。從這個(gè)角度來看,傳感器管理又可以理解成是對下一時(shí)刻掃描探測所使用的傳感器進(jìn)行選擇的一個(gè)決策優(yōu)化過程。

關(guān)于信息狀態(tài),需要保證其能夠表示所需要感知場景下的全部信息,或者至少是與目標(biāo)相關(guān)的全部信息。通常情況下,這些信息包括傳感器系統(tǒng)自身的物理狀態(tài)(如搭載了傳感器的飛行器的位置與方位角),通過這些信息的約束可以得到傳感器系統(tǒng)下一步可能的動(dòng)作以及下一時(shí)刻可選擇參加任務(wù)的傳感器。傳感器系統(tǒng)自身的先驗(yàn)物理信息對傳感器管理而言非常重要,因此部分文獻(xiàn)將其物理狀態(tài)與信息狀態(tài)區(qū)別對待并分別建模,如圖3所示。

圖1 多傳感器信息融合系統(tǒng)閉環(huán)模型Fig.1 Multi-sensor information fusion system in close-loop model

圖2 傳感器管理系統(tǒng)結(jié)構(gòu)Fig.2 Architecture of sensor management system

圖3 控制論角度下的傳感器管理模型Fig.3 Sensor management model in view of control theory

圖3表明傳感器管理與反饋控制在很多方面都具有極大的相似性,而控制理論本身就是目前傳感器管理相關(guān)理論的重要組成部分。但二者在一些具體性質(zhì)方面卻又有所區(qū)別。在傳統(tǒng)的反饋控制理論方面,傳感器用來確定某一動(dòng)態(tài)目標(biāo)的狀態(tài)信息。該信息表征了外部施加的控制動(dòng)作是如何根據(jù)控制原理或者控制規(guī)則來不斷改變系統(tǒng)狀態(tài);而在傳感器管理方面,控制動(dòng)作會更為直接地影響目標(biāo)的信息狀態(tài),與其說反饋的目的是幫助系統(tǒng)判斷應(yīng)該執(zhí)行哪種控制動(dòng)作,不如說反饋感知行為本身即是一種控制動(dòng)作。

2 方法概述

針對空中目標(biāo)的傳感器管理技術(shù)是現(xiàn)代戰(zhàn)爭,尤其是C4ISR(Command, Control, Communication, Computer, Intelligence, Surveillance, Reconnaissance)系統(tǒng)和其基礎(chǔ)上的全域作戰(zhàn)不可或缺的組成部分。目前主要應(yīng)用于空中區(qū)域目標(biāo)監(jiān)視、彈道導(dǎo)彈攔截、防空預(yù)警、飛行導(dǎo)航等方面。而由于傳感器管理技術(shù)在眾多軍用和民用領(lǐng)域均具有非常重要的戰(zhàn)略意義和應(yīng)用價(jià)值,因此世界各國都在積極開展相關(guān)研究工作,其中以美國在該領(lǐng)域的研究水平最為先進(jìn)。國內(nèi)對傳感器管理問題的研究始于20世紀(jì)末,雖然起步較晚,但也得到了一系列成果。

2.1 方法的起源與發(fā)展

早在20世紀(jì)上半頁“傳感器管理”的概念出現(xiàn)以前,F(xiàn)isher為了解決數(shù)據(jù)統(tǒng)計(jì)過程中的樣本選取問題改進(jìn)了統(tǒng)計(jì)實(shí)驗(yàn)的設(shè)計(jì)方法[19]。到了20世紀(jì)80年代,統(tǒng)計(jì)學(xué)的相關(guān)學(xué)者開始在統(tǒng)計(jì)實(shí)驗(yàn)設(shè)計(jì)中引入序貫和閉環(huán)反饋的思想,并且證明了在序貫統(tǒng)計(jì)實(shí)驗(yàn)中樣本的數(shù)量和組成不該是固定不變的,應(yīng)隨量測函數(shù)變化[20]。Meier等于1967年給出了在動(dòng)態(tài)模型中使用閉環(huán)結(jié)構(gòu)解決量測自適應(yīng)問題的數(shù)據(jù)統(tǒng)計(jì)和采集方法[21]。Fedorov在其1972年的著作中給出了序貫統(tǒng)計(jì)實(shí)驗(yàn)設(shè)計(jì)中的優(yōu)化方法[22]。這些統(tǒng)計(jì)方法的提出都為傳感器管理奠定了數(shù)學(xué)統(tǒng)計(jì)方面的理論基礎(chǔ)。

1977年,Nash率先采用線性規(guī)劃方法研究了單平臺多傳感器多目標(biāo)跟蹤過程中傳感器資源的最優(yōu)分配問題[23]。而“傳感器管理”這一文字性的具體概念則最早出現(xiàn)于1988年在美國舉辦的IEEE全國宇航電子學(xué)會會議上,即NAECON(National Aerospace and Electronics CONference)有關(guān)軍用飛行器上的傳感器系統(tǒng)自動(dòng)控制方法的討論中[24]。

在此之后,Castanon[25]首先使用POMDP來解決真正的多傳感器管理問題。但該方法的計(jì)算復(fù)雜度過高,尤其是那些預(yù)測步超過一步的改進(jìn)型方法,導(dǎo)致其在工程實(shí)踐中難以使用。Ktishnamurthy[26]率先將解決多臂賭博機(jī)(Multi-Armed Bandit, MAB)問題的思路引入傳感器管理方法,并考慮到可以通過啟發(fā)式方法減小POMDP問題的計(jì)算復(fù)雜度。但該方法無法同時(shí)對多個(gè)目標(biāo)進(jìn)行跟蹤,并且在量測滿足一定的能觀性條件下才能得到目標(biāo)狀態(tài)的解析解。Kreucher等[27]使用粒子濾波方法解決了目標(biāo)運(yùn)動(dòng)模型非線性且環(huán)境隨時(shí)間動(dòng)態(tài)變化情況下多目標(biāo)跟蹤中的傳感器管理問題,且對交叉航跡能進(jìn)行正確跟蹤。然而該方法在非線性條件下需要使用大量的粒子進(jìn)行計(jì)算,從而帶來巨大的計(jì)算代價(jià),且該方法在多目標(biāo)對象較為密集或航跡交叉時(shí)容易出現(xiàn)誤關(guān)聯(lián)。Tharmarasa等[28]使用多層分布式融合中心的傳感器網(wǎng)絡(luò)結(jié)構(gòu)解決了大規(guī)模多傳感器多目標(biāo)的跟蹤問題以及傳感器管理問題。然而該方法不適用于分布式融合中心移動(dòng)的場景中,無法通過移動(dòng)融合中心來得到優(yōu)化的跟蹤結(jié)果,且該方法在實(shí)時(shí)條件下無法保證得到傳感器管理的全局最優(yōu)結(jié)果。

2.2 傳感器管理方法研究現(xiàn)狀

近幾年來,在傳感器管理方面又出現(xiàn)了很多新的學(xué)術(shù)成果。這些成果主要可以分為兩大類:一類是基于信息指標(biāo)優(yōu)化的傳感器管理方法;另一類是基于決策過程優(yōu)化的傳感器管理方法。其中,前者在當(dāng)前的研究成果中占多數(shù),后者占少數(shù)。當(dāng)前傳感器管理方法從其他角度來看還有各種不同的分類方式,本節(jié)后續(xù)部分僅依據(jù)上述分類方式對各種具體方法分別進(jìn)行討論和分析。

從另一個(gè)方面來看,當(dāng)前各種主要的傳感器管理方法大都以短時(shí)間尺度下的傳感器調(diào)度管理為主要目標(biāo),即此類方法在第k時(shí)刻僅能得出第k+1時(shí)刻的傳感器調(diào)度方案。而長時(shí)間尺度下的傳感器管理方法,即在第k時(shí)刻能夠得出第k+n時(shí)刻(n>1)的傳感器調(diào)度方案,由于其問題描述更為復(fù)雜,需要使用線性規(guī)劃等其他數(shù)學(xué)工具進(jìn)行處理,因此當(dāng)前的研究中鮮有涉及。同時(shí),由于估計(jì)濾波算法帶來的高計(jì)算復(fù)雜度、目標(biāo)及其周圍環(huán)境所存在的不確定性、傳感器固有的系統(tǒng)偏差等各種因素綜合作用,導(dǎo)致許多傳感器管理方法僅能通過仿真實(shí)驗(yàn)驗(yàn)證其有效性和具體性能,而無法滿足工程實(shí)際中實(shí)時(shí)在線的傳感器管理需求。

2.3 基于信息指標(biāo)優(yōu)化的傳感器管理方法

將傳感器管理作為信息評價(jià)指標(biāo)進(jìn)行優(yōu)化的一類方法,其實(shí)質(zhì)在于在任一時(shí)刻k,在一定約束條件下以某種目標(biāo)相對于傳感器的信息評價(jià)指標(biāo)為優(yōu)化對象,進(jìn)而實(shí)現(xiàn)傳感器資源的最優(yōu)分配和調(diào)度,以提高融合系統(tǒng)對單/多目標(biāo)、動(dòng)/靜目標(biāo)的整體跟蹤精度。在某些情況下還能同時(shí)提高融合系統(tǒng)對目標(biāo)的檢測概率和識別能力。該類傳感器管理方法近年來主要有以下幾種具體方法。

Ristic和Vo[29]使用Rényi信息增益作為回報(bào)函數(shù)來進(jìn)行POMDP框架下的多目標(biāo)Bayes濾波傳感器控制,并引入獨(dú)立同分布的隨機(jī)有限集來進(jìn)行多目標(biāo)的狀態(tài)預(yù)測和更新。但該方法的計(jì)算復(fù)雜度過高,且僅考慮了集中式的融合結(jié)構(gòu)。

Gostar等[30]利用多伯努利濾波器以及基于估計(jì)誤差的損失函數(shù)最小化方法來選擇傳感器進(jìn)行多目標(biāo)狀態(tài)估計(jì)。該方法對多目標(biāo)個(gè)數(shù)和狀態(tài)估計(jì)結(jié)果一體化考慮,且計(jì)算時(shí)間和魯棒性都令人滿意。但該方法未考慮較為復(fù)雜的非高斯噪聲場景問題。

Wang等[31]于1999年提出了多傳感器數(shù)據(jù)融合系統(tǒng)中的自適應(yīng)傳感器管理方法。該方法基于模糊集理論和證據(jù)理論,由于避免了積分運(yùn)算而簡化了計(jì)算復(fù)雜度。

何友等[32]將動(dòng)態(tài)規(guī)劃思想和有限集合理論引入了傳感器管理方法,并提出了一種基于信息熵的傳感器管理方法。但該方法在使用有限集理論方面只局限于對理論框架的討論,并未涉及具體的傳感器管理方案。

楊小軍等[33]嘗試使用條件后驗(yàn)克拉美羅下界(Conditional Posterior Cramér-Rao Lower Bound, CPCRLB)指標(biāo)選擇并激活傳感器節(jié)點(diǎn),并使用粒子濾波對目標(biāo)進(jìn)行跟蹤。但該方法在量測來源不確定的情況下無法進(jìn)行傳感器選擇。

劉欣怡等[34]提出了一種基于Rényi信息增益的多傳感器管理方法,該方法利用交互式多模型(Interactive Multiple Model, IMM)和容積卡爾曼濾波(Cubature Kalman Filter, CKF)算法解決了高斯非線性條件下的系統(tǒng)狀態(tài)估計(jì)問題。然而在傳感器和目標(biāo)數(shù)目較多的情況下,該方法無法保證模型求解的時(shí)效性。

黎子芬等[35]設(shè)計(jì)了一種基于跟蹤精度控制的多傳感器多目標(biāo)分配方法,通過使用協(xié)方差控制、偽量測異步融合、IMM算法以及蟻群算法實(shí)現(xiàn)對多目標(biāo)跟蹤精度的控制。但該方法只能針對目標(biāo)個(gè)數(shù)已知且確定的情況進(jìn)行處理,無法解決目標(biāo)個(gè)數(shù)隨時(shí)間變化的傳感器管理問題。

申屠晗等[36]提出一種基于反饋式多傳感器結(jié)構(gòu)和概率假設(shè)密度(Probability Hypothesis Density, PHD)濾波器的融合跟蹤框架,并使用GM-PHD(Gaussian Mixture PHD)濾波器實(shí)現(xiàn)了多種多目標(biāo)跟蹤方法,提高了對多目標(biāo)的跟蹤精度。但該方法沒有研究不同形式多傳感器后驗(yàn)PHD融合方法的理論性能,也并未從傳感器管理的角度出發(fā),考慮如何進(jìn)一步提高多傳感器對多目標(biāo)的跟蹤性能和效率。

筆者[37]使用后驗(yàn)克拉美羅下界(Posterior Cramér-Rao Lower Bound, PCRLB)指標(biāo)結(jié)合粒子群優(yōu)化技術(shù)實(shí)現(xiàn)了多傳感器多目標(biāo)聯(lián)合檢測跟蹤任務(wù)中的傳感器管理方法。該方法能有效提高傳感器網(wǎng)絡(luò)對多機(jī)動(dòng)目標(biāo)的整體感知能力與跟蹤精度,但未考慮復(fù)雜的多目標(biāo)數(shù)據(jù)關(guān)聯(lián)問題,也未討論非線性非高斯條件下相應(yīng)的傳感器管理方法。

除此以外,筆者[38-39]還給出了用于解決復(fù)雜的群目標(biāo)和擴(kuò)展目標(biāo)跟蹤問題的傳感器控制策略。吳巍等[40]提出了基于輻射控制的機(jī)載多傳感器系統(tǒng)協(xié)同跟蹤方法,該方法有助于提高作戰(zhàn)飛機(jī)的抗偵察、抗干擾能力和整體生存能力。童俊和單甘霖[41]提出了一種基于目標(biāo)跟蹤精度Cramér-Rao下界的多傳感器跟蹤資源協(xié)同分配方法。葉繼坤等[42]提出了一種基于幾何關(guān)系的多導(dǎo)彈協(xié)同跟蹤方法。張華睿等[43-44]提出了基于Fisher信息距離的傳感器管理方法。孟迪等[45-46]提出面向空中目標(biāo)跟蹤、搜索與成像任務(wù)的雷達(dá)資源優(yōu)化調(diào)度方法。

2.4 基于決策過程優(yōu)化的傳感器管理方法

將傳感器管理作為決策過程進(jìn)行優(yōu)化的一類方法,其實(shí)質(zhì)在于在任一時(shí)刻k,在一定約束條件下根據(jù)傳感器得到的目標(biāo)量測信息Zk(經(jīng)常還包括歷史量測信息Z1:k),使基于某種特定控制策略或任務(wù)生成的回報(bào)函數(shù)最大化,或者使風(fēng)險(xiǎn)函數(shù)最小化,并以此為依據(jù)在該時(shí)刻對傳感器(或者傳感器平臺)進(jìn)行控制和調(diào)度。該類傳感器管理方法近年來主要有以下幾種具體方法。

Wang等[47]提出一種使用帶標(biāo)簽的多伯努利(Labeled Multi-Bernoulli, LMB)濾波器和優(yōu)化控制策略實(shí)現(xiàn)多傳感靜/動(dòng)平臺控制的傳感器管理方法。該方法有效降低了傳感器管理的時(shí)間復(fù)雜度,但與實(shí)時(shí)在線計(jì)算仍有較大距離。且該方法僅能對目標(biāo)之間距離較近的非機(jī)動(dòng)/機(jī)動(dòng)群目標(biāo)進(jìn)行有效跟蹤。

Gostar等[48]以LMB濾波器為工具,以最優(yōu)次模式分配(Optimal Sub-Pattern Assignment, OSPA)距離為優(yōu)化指標(biāo),實(shí)現(xiàn)了最優(yōu)傳感器控制動(dòng)作下的多目標(biāo)狀態(tài)估計(jì)信任度最大化。該方法能明顯提高單傳感器動(dòng)平臺對多目標(biāo)的整體跟蹤性能,但未涉及多傳感器對多目標(biāo)跟蹤場景下的情況

Hoang和Vo[49]通過將多目標(biāo)狀態(tài)建模為多伯努利隨機(jī)有限集,同時(shí)實(shí)現(xiàn)了目標(biāo)數(shù)方差后驗(yàn)期望的最小化以及預(yù)測與更新概率密度函數(shù)之間Rényi距離期望的最大化,即完成了目標(biāo)個(gè)數(shù)的確定以及估計(jì)新息的最大化。但該方法只局限于特定場景,不具有普遍性,且未能解釋目標(biāo)對象能觀性如何影響傳感器控制策略。

Katsilieris等[50]提出了一種基于威脅度的傳感器管理方法。該方法主要針對多目標(biāo)威脅度中的不確定性進(jìn)行最小化處理,可應(yīng)用于目標(biāo)區(qū)域監(jiān)視與空中交通管制。其缺點(diǎn)在于無法用威脅度函數(shù)表征一些不可測量所包含的信息,且只能在較短時(shí)間尺度內(nèi)進(jìn)行傳感器優(yōu)化調(diào)度。

Gostar等[51]對多目標(biāo)狀態(tài)的預(yù)測與更新概率密度函數(shù)之間的Cauchy-Schwarz距離進(jìn)行最大化處理,從而得到該距離在多伯努利濾波器下的閉合形式解,實(shí)現(xiàn)優(yōu)化傳感器控制策略的目標(biāo)。而該方法的缺點(diǎn)同樣是只能得到傳感器單步的最優(yōu)控制結(jié)果,無法得到多步全局最優(yōu)結(jié)果。

通過對上述國內(nèi)外研究現(xiàn)狀的梳理可以發(fā)現(xiàn),與目標(biāo)跟蹤、數(shù)據(jù)關(guān)聯(lián)以及時(shí)空配準(zhǔn)等傳統(tǒng)信息融合研究方向相比,傳感器管理這一重要研究方向目前的研究成果還相對較少,且仍存在許多尚未解決的重要問題。

2.5 現(xiàn)存問題及分析

決策過程理論為研究傳感器管理方法提供了一個(gè)潛在的統(tǒng)一框架。一個(gè)決策過程指的是關(guān)于量測的時(shí)間序列以及相應(yīng)的控制動(dòng)作,而每個(gè)控制動(dòng)作是由上一時(shí)刻控制動(dòng)作影響下得到的該時(shí)刻的量測決定的。因此,最優(yōu)的傳感器管理方案本質(zhì)上是一個(gè)使回報(bào)期望最大化的決策過程??v觀過去和近年來的各種傳感器管理方法,發(fā)現(xiàn)可以從決策過程的角度來研究傳感器管理方法。

為了簡化傳感器管理中的優(yōu)化策略,通常假設(shè)決策過程具有Markov性,即當(dāng)前時(shí)刻的決策僅由該時(shí)刻的量測值決定,而與之前的量測集無關(guān)。當(dāng)待估計(jì)的目標(biāo)狀態(tài)能夠完全通過量測進(jìn)行估計(jì)時(shí),將該決策過程稱為Markov決策過程(Markov Decision Process, MDP);否則,稱之為部分能觀Markov決策過程(Partially Observed MDP, POMDP)。根據(jù)Bellman公式[4],可以通過線性規(guī)劃得到MDP和POMDP問題的最優(yōu)解。而前述的MAB問題實(shí)質(zhì)上是一個(gè)資源分配的時(shí)間序列模型,在該模型中多臂所對應(yīng)的多種資源由控制器分配給多個(gè)任務(wù)。當(dāng)某時(shí)刻對一種資源進(jìn)行分配時(shí),MAB就轉(zhuǎn)換到另一個(gè)隨機(jī)狀態(tài),并同時(shí)得到由該狀態(tài)確定的一個(gè)回報(bào)。當(dāng)MAB下的控制動(dòng)作和狀態(tài)序列滿足Markov性時(shí),則該MAB問題就成為了MDP或POMDP的一個(gè)特例。

用于傳感器管理的MDP、POMDP和MAB方法都會面臨多步前向搜索問題。而要確定這一搜索策略,需要先對每一時(shí)刻可供選擇的各種控制動(dòng)作及其執(zhí)行后所帶來的回報(bào)進(jìn)行評價(jià)。現(xiàn)有的研究成果主要集中于短時(shí)間尺度下的貪婪方法,因其方法的計(jì)算復(fù)雜度較低而易于實(shí)現(xiàn)。這類方法一般只根據(jù)當(dāng)前時(shí)刻計(jì)算出下一步的回報(bào)期望來尋找當(dāng)前最優(yōu)的控制動(dòng)作,而不考慮多步的最優(yōu)問題,因此其方法性能相較于多步優(yōu)化方法有所降低,有時(shí)甚至?xí)酗@著差異。

基于信息論的各種方法已經(jīng)被大量用于傳感器管理。在選取優(yōu)化指標(biāo)時(shí),通常使用的是信息增益而非具體任務(wù)所對應(yīng)的回報(bào)函數(shù),這是因?yàn)樾畔⒃鲆孀鳛槎攘磕繕?biāo)對象的一個(gè)指標(biāo)更能反映本質(zhì)。例如,許多回報(bào)函數(shù)都與所用的濾波或檢測方法相關(guān),但其中所蘊(yùn)含的互信息卻不會隨著數(shù)據(jù)的轉(zhuǎn)換而變化。這一性質(zhì)使得單步優(yōu)化方法在犧牲系統(tǒng)性能的條件下能夠保證其在遇到對應(yīng)模型失配、系統(tǒng)目標(biāo)動(dòng)態(tài)變化(檢測與跟蹤)等不利因素的情況下仍具有足夠的魯棒性。

起初,多數(shù)基于信息論的傳感器管理方法重點(diǎn)關(guān)注的是在單模式下以簡單的被動(dòng)方式對多目標(biāo)進(jìn)行跟蹤。但近些年來,信息增益被更多地用于建立模型及傳感器管理任務(wù),例如基于通訊損失函數(shù)下的動(dòng)態(tài)協(xié)同感知[52]、多傳感信息融合[53]、機(jī)器路徑規(guī)劃[54]以及利用互信息進(jìn)行目標(biāo)識別與跟蹤[55]等方面。

3 展 望

盡管自2000年以來,尤其是最近十年內(nèi),相關(guān)領(lǐng)域?qū)W者在空中目標(biāo)傳感器管理方面做了許多研究工作[56-69],但其目前在實(shí)際系統(tǒng)設(shè)計(jì)和性能評價(jià)方法上仍缺乏有效的指導(dǎo)原則。同時(shí),該領(lǐng)域未來有以下幾個(gè)潛在發(fā)展方向值得關(guān)注:

1) 在該技術(shù)應(yīng)用于大規(guī)模傳感器系統(tǒng)時(shí),其中一個(gè)核心問題就是當(dāng)多傳感器系統(tǒng)的可調(diào)參數(shù)過多時(shí)或者時(shí)間約束條件較為苛刻時(shí)抑或只能使用多步優(yōu)化方法時(shí),現(xiàn)有傳感器管理方法的計(jì)算復(fù)雜度均會急劇上升。解決這一困境的其中一個(gè)潛在方向就是使用稀疏凸優(yōu)化方法。因?yàn)樵谝幌盗锌赡艿目刂苿?dòng)作中選取最優(yōu)的控制動(dòng)作,這一思路本身與壓縮感知以及稀疏回歸中的變量選取思路非常相似。所以可以沿此思路進(jìn)一步深入研究,以期解決更多諸如多步優(yōu)化之類的復(fù)雜傳感器管理問題。

2) 另一個(gè)應(yīng)對傳感器管理高計(jì)算復(fù)雜度問題的方向在于使用統(tǒng)計(jì)理論與機(jī)器學(xué)習(xí)中的一些方法。通常面對某個(gè)領(lǐng)域中令人感到棘手的問題,可以將其等價(jià)的轉(zhuǎn)換到另一個(gè)領(lǐng)域中使用該領(lǐng)域已有的方法將其簡化并予以解決。例如,F(xiàn)reund和Schapire所提出的加速最優(yōu)分類器學(xué)習(xí)方法即是受到了最優(yōu)MAB策略的啟發(fā)[70];而相對的,Blatt等通過將最優(yōu)POMDP策略的離線學(xué)習(xí)方法等價(jià)轉(zhuǎn)換為最優(yōu)分類器學(xué)習(xí)方法,提出了應(yīng)用于雷達(dá)的最優(yōu)傳感器管理快速學(xué)習(xí)方法[71]。

3) 此外,非合作條件下的傳感器管理方法也是該領(lǐng)域未來的一個(gè)重要發(fā)展方向,即對方能夠通過控制目標(biāo)場景中的一些條件來阻撓我方實(shí)現(xiàn)自己的傳感器管理目標(biāo)的情況。目前的主要研究方向在于引入博弈論等其他相關(guān)方法。近年來有關(guān)POMDP用于智能目標(biāo)的方法就是實(shí)例[72]。所謂智能目標(biāo)指的是在感知到自己被對方探測到時(shí)能夠做出相應(yīng)反應(yīng)的目標(biāo)[73]。但是整體上而言,這一研究方向還比較新穎,因此相關(guān)成果還非常少,需要繼續(xù)研究。

總體而言,未來作戰(zhàn)概念在空中目標(biāo)傳感器管理領(lǐng)域內(nèi)集中體現(xiàn)在安全防御區(qū)域監(jiān)視系統(tǒng)上。其發(fā)展趨勢表現(xiàn)為各類自主或半自主平臺上會出現(xiàn)越來越多的網(wǎng)絡(luò)化分布式傳感器。這些傳感器通過傳感器管理子系統(tǒng)能夠提供比傳統(tǒng)目標(biāo)跟蹤與發(fā)射源定位等任務(wù)更高層級的多/群目標(biāo)與復(fù)雜環(huán)境感知信息??梢云诖S著該領(lǐng)域的進(jìn)一步研究和發(fā)展能夠逐漸實(shí)現(xiàn)這一愿景。

4 結(jié) 論

本文圍繞空中目標(biāo)傳感器管理方法這一核心問題對一些過去代表性的經(jīng)典方法和近年來新提出的方法進(jìn)行了較為全面的綜述、分析和比較。

1) 回顧了傳感器管理方法的誕生與研究發(fā)展進(jìn)程,同時(shí)按時(shí)間發(fā)展順序重點(diǎn)研究了一些具體的傳感器管理方法。

2) 對傳感器管理方法當(dāng)前的國內(nèi)外研究進(jìn)展以及未來的發(fā)展方向進(jìn)行了進(jìn)一步闡述,并對這些方法各自的思想與優(yōu)缺點(diǎn)進(jìn)行了深入剖析。

3) 指出了現(xiàn)有空中目標(biāo)傳感器管理方法存在的改進(jìn)空間,以及解決該領(lǐng)域現(xiàn)存困難的一些可行出路,并展望了該領(lǐng)域未來的發(fā)展方向。

猜你喜歡
傳感器優(yōu)化目標(biāo)
超限高層建筑結(jié)構(gòu)設(shè)計(jì)與優(yōu)化思考
康奈爾大學(xué)制造出可拉伸傳感器
民用建筑防煙排煙設(shè)計(jì)優(yōu)化探討
關(guān)于優(yōu)化消防安全告知承諾的一些思考
一道優(yōu)化題的幾何解法
氧傳感器的基本檢測
簡述傳感器在物聯(lián)網(wǎng)中的應(yīng)用
跟蹤導(dǎo)練(三)2
新目標(biāo)七年級(下)Unit?。尘毩?xí)(一)
新目標(biāo)七年級(下)Unit?。淳毩?xí)(一)
大名县| 浦江县| 屯昌县| 呈贡县| 延津县| 呼和浩特市| 乌鲁木齐县| 宣威市| 威宁| 宜阳县| 荔波县| 双城市| 电白县| 陕西省| 酒泉市| 临西县| 玛曲县| 静宁县| 册亨县| 淅川县| 葫芦岛市| 台中县| 桂平市| 分宜县| 娱乐| 阿坝县| 新蔡县| 平陆县| 略阳县| 温州市| 长宁县| 枞阳县| 陇西县| 邢台市| 长乐市| 赤壁市| 绿春县| 巴中市| 东兴市| 卫辉市| 商河县|