韋道知,李俊偉,李 琦,謝家豪,劉 丹
(1.空軍工程大學防空反導學院,陜西 西安 710051;2.航天工程大學,北京 101400)
在研究傳感器分配管理時,一般將重點放在靜態(tài)決策上,而對傳感器探測聯(lián)盟組建后的執(zhí)行調度過程研究較少。實際作戰(zhàn)環(huán)境瞬息萬變,而前后兩種探測聯(lián)盟方案沒有關聯(lián)且多數(shù)傳感器管理方法只追求傳感器網(wǎng)絡效能最大化,沒有針對實際需求來對傳感器進行優(yōu)化,沒有考慮實戰(zhàn)條件,造成傳感器資源浪費。文獻[1]針對以上問題提出了多傳感器交叉提示技術并給出了其定義、作用以及目的。
而針對交叉提示問題的求解歸屬于協(xié)同任務規(guī)劃范疇,其算法有很多,如:雙邊組合拍賣算法[2]、模糊控制算法[3]、利用禁忌表進行求解[4-5]、粒子群算法[6]、博弈論算法[7]。
本文介紹了交叉提示的基本理論,并深入研究交叉提示技術在探測、跟蹤目標和目標交接中的應用,而后提出一種基于閃電搜索(LSA)的交叉提示算法,并將該算法和基于人工蜂群算法以及博弈論算法進行了對比。
傳感器網(wǎng)絡,是由部署在多維空間中通過各種通信協(xié)議連接而成,可以實現(xiàn)探測目標的各種類傳感器組成的系統(tǒng)。傳感器網(wǎng)絡節(jié)點經常使用光電傳感器,通常有衛(wèi)星、飛機、艦艇或地面雷達等,而網(wǎng)絡邊緣由能夠實現(xiàn)互相通信的傳感器節(jié)點相連完成[8-9]。
傳感器組網(wǎng)多數(shù)分為三級,分別是以天基傳感器(高段)、空基傳感器(中段)以及地(海)基傳感器(低段)三級組成的網(wǎng)絡。天基傳感器主要有導航衛(wèi)星(北斗衛(wèi)星導航系統(tǒng))、通信衛(wèi)星以及國際尖端技術的紅外預警衛(wèi)星等;空基傳感器有各種類預警機,以及近年新興起的臨空飛行器等;地(海)基傳感器主要由各種類雷達系統(tǒng)組成[9]。
對于傳感器的部署,不可能是所有探測區(qū)域“一碗水端平”同等部署,而是采取重要區(qū)域重點部署的策略,如重要城市、軍事基地等重要地域周邊應當部署較多雷達,同時雷達之間發(fā)生交叉提示的頻率也應較高,以此避免傳感器資源的浪費。綜上所述,傳感器網(wǎng)絡顯然是具有社區(qū)性的,所以建立的傳感器網(wǎng)絡模型應當是基于社區(qū)網(wǎng)絡模型的,如圖1所示。
圖1 傳感器網(wǎng)絡結構Fig.1 Sensor network structure
各種類的傳感器有不同的特點、部署成本以及實際作戰(zhàn)環(huán)境,在重要地域周邊部署地(海)基雷達,中、高段部署的傳感器主要目的是增大傳感器網(wǎng)絡探測覆蓋面積,從而對目標實現(xiàn)快速探測以及“無縫”交接目標。
從地理位置上看,傳感器在實際作戰(zhàn)環(huán)境的分布同時具有“集中性”和“分散性”,前者指的是傳感器均以信息融合中心為載體集中分布,并且受所屬信息融合中心的控制管理[10];后者指的是傳感器分布在立體空間中的不同段,占據(jù)的空間范圍大,通過內部信息網(wǎng)連接成龐大的立體探測網(wǎng)絡?;诙郃gent代理技術的傳感器分布式管理結構如圖2所示。
圖2 多傳感器分布式管理結構示意圖Fig.2 Schematic diagram of multi-sensor distributed management structure
圖2中,信息融合中心采用了兩種Agent:傳感器管理Agent與成員Agent。前者多由信息融合中心的指揮控制系統(tǒng)充當,主要有兩個“責任”:1) 根據(jù)指揮控制信息融合中心傳感器管理的指令和其他基礎信息融合中心的傳感器管理Agent進行交互,實現(xiàn)各個基礎信息融合中心之間的任務協(xié)同與交叉提示;2) 對各個基礎信息融合中心的傳感器成員進行指令分配,同時監(jiān)控所屬傳感器成員對指令的執(zhí)行以及作為不同基礎信息融合中心的個體傳感器進行交互的中間“橋梁”。后者可以是單個傳感器,也可以是傳感器組合,主要是執(zhí)行傳感器管理Agent分配的指令,它們之間也可以通過通信與協(xié)調實現(xiàn)基礎信息融合中心內的任務協(xié)同與交叉提示。信息融合及處理模型如圖3所示。
圖3 信息融合處理模型Fig.3 Information fusion processing model
自動觸發(fā)交叉提示[11]的內容是關于目標綜合信息等內容,主要包括:1) 執(zhí)行的具體任務;2) 發(fā)出提示信息的傳感器位置信息;3) 傳感器探測到的可疑目標或區(qū)域信息。
而傳感器自動開始進行提示,需要滿足交叉提示的條件,交叉提示的條件描述了傳感器網(wǎng)絡什么時機需要各傳感器進行提示,可以概括為,當網(wǎng)絡中的某一傳感器捕捉到了潛在目標時,信息融合中心會根據(jù)目前所獲得的目標信息進行綜合研判:1) 是否滿足信息融合中心先前設置的期望性能指標;2) 當前傳感器對目標的探測、目標的跟蹤還在不在范圍內,從而確定需不需要對該目標進行交接,交接需滿足① 該目標將脫離當前傳感器探測范圍,② 出現(xiàn)優(yōu)先級更高的目標在當前傳感器探測范圍內且該傳感器同時只能探測、跟蹤一個目標,③ 當前傳感器出現(xiàn)故障警告或者受到敵方武器威脅即不能正常工作時。
綜上所述,如果信息量沒有達到期望性能指標以及目標交接條件時,各傳感器之間就需要交叉提示以此獲取更詳盡的信息去正確探測目標、提高識別準確度以及跟蹤精度。
假設某網(wǎng)絡中一共有m個傳感器{a1,a2,a3,…,am},同時對n個目標{b1,b2,b3,…,bn}進行探測,傳感器與目標配對矩陣為P,元素為pij,
若pij=1,那么傳感器ai取得的效能為
eij=αrij+βcij,
(1)
式(1)中,α、β為加權系數(shù),且滿足α+β=1;eij為ai的效能;rij為探測收益,當傳感器對目標檢測時,rij為探測概率rdij,當傳感器對目標進行跟蹤時,rij為跟蹤精確度rlij;cij為能耗。
當網(wǎng)絡中的傳感器探測到目標后,會先對目標進行檢測。假設同時有M個傳感器對目標nj的協(xié)同檢測概率為
rdkj=1-(1-r1j)·(1-r2j)·…·(1-rMj),
(1≤k≤M)。
(2)
此時,傳感器對目標的探測概率為M個傳感器同一時間對目標的協(xié)同探測概率rdkj。
對目標進行探測時,網(wǎng)絡對目標的探測概率Pt≥Δ時(Δ為門限值取0.85),那么就認為網(wǎng)絡可以準確地判別目標的敵我身份。
當完成對目標的探測后,若判定為具有攻擊性的目標,則網(wǎng)絡將會繼續(xù)對該目標進行跟蹤從而進一步判斷是否為虛假目標,若是虛假目標則網(wǎng)絡會放棄對該目標的繼續(xù)跟蹤。本文中定義跟蹤精度為位置精度衰減因子的負數(shù),公式為
(3)
式(3)中,tr為求跡運算符號,P(k|k)為k時刻的目標估計誤差協(xié)方差矩陣(covariance matrix)。
對目標nj跟蹤時,精度計算模型應當分為兩種情況:1) 僅有一個傳感器對目標進行跟蹤;2) 多個傳感器同時對目標進行跟蹤。本文中是以多傳感器為基礎,因此討論第2種情況。
多個傳感器同時對目標進行跟蹤即多傳感器信息融合問題。假設有M個傳感器在同一時間對目標nj進行跟蹤,給出各個傳感器對此目標的測量方程:
(4)
設
(5)
則有
Ck=TXk+Zk。
(6)
而在跟蹤目標中,使用拓展Kalman濾波方式估計目標狀態(tài)[12],傳感器對目標的探測概率為rdkj,則修正Kalman濾波迭代式為
(7)
這時,傳感器ai對目標nj的跟蹤精度為M個傳感器同時探測目標的協(xié)同跟蹤精度rlkj。
目標在移動過程中,一旦要脫離某傳感器探測區(qū)域時,就會請求“任務提示”,提醒其他的傳感器繼續(xù)對該目標進行探測,從而達到交接目標的目的。
假設在某k時刻,目標和ax的距離為dx(k),和ay的距離為dy(k);在k+1時刻,目標和ax的距離為dx(k+1),和ay的距離為dy(k+1)。
ax對目標進行探測時,滿足式(8),將會請求“任務提示”。
(8)
ay滿足式(9)時,表示有接替ax從而繼續(xù)對目標進行探測的能力。
(9)
式(9)中,Ax,Ay分別為ax,ay的探測區(qū)域。
3.1.1放電體的梯級先導傳播
在閃電搜索算法[13-14]中,放電體定義為:源于雷電自然現(xiàn)象,并基于梯級先導傳播機制的閃電快速粒子。其概念與PSO算法中的“粒子”和GSA算法中的“個體”等類似。
假設每個放電體包含一個梯級先導和一個獨有通道,則有表1所示對應關系。
表1 閃電放電體與優(yōu)化算法的對應關系Tab.1 Correspondence between lightning discharge body and optimization algorithm
3.1.2放電體特性
通常條件下,穿過大氣的放電體與空氣中的分子與原子發(fā)生彈性碰撞時將會失去其動能,放電體的速度可表示為
(10)
式(10)中,vp和v0分別表示當前速度和初速度,c和Fi分別表示光速和恒定電離速率,m和s分別表示放電體質量和放電體所行進的路徑長度。
式(10)清晰地表示了速度是梯級先導頂端位置能量和放電體質量的函數(shù),即質量小或行進路徑長時,放電體基本上不會電離或者擁有探測大空間的潛質,只能夠電離或者開發(fā)附近的空間。綜上,LSA算法可以通過使用梯級先導的相對能量來控制算法的探測與開發(fā)能力。
梯級先導者還有一個重要特性是分岔,即同時出現(xiàn)兩個對稱的分支。在此期間創(chuàng)建的任意通道都會使得放電體的數(shù)量增加一個,因而就會增加群體的大小。LSA算法中可以通過兩種方法實現(xiàn)分岔。
1) 創(chuàng)建對稱通道,使用式(11)實現(xiàn)兩個相對的放電體碰撞。
(11)
2) 第二類的分岔中,由于在多次傳播試驗后最不成功的引導者能量會再分配,即可以假定通道出現(xiàn)在成功的梯級先導者頂端。通道時間定義為允許的最大試驗次數(shù),這樣就可以實現(xiàn)重新分配不成功的先導者。這種情況下,階梯先導的種群規(guī)模不會增加。
兩種分岔方式中,本文采取第2種分岔方式。
3.1.3建模以及梯級先導移動
(12)
式(12)中,xt為可提供候選解即梯級先導si的初始頂端能量Esi的隨機數(shù),c和d分別為解空間的邊界范圍。
(13)
(14)
式(14)中,exprand是一個指數(shù)隨機數(shù)。
3) 引導放電體。利用具有形狀參數(shù)μ和尺度參數(shù)σ的標準正態(tài)分布生成的隨機數(shù)進行建模,它的正態(tài)概率密度函數(shù)f(xL)表述為
(15)
式(15)表述了隨機生成的放電體可以從形狀參數(shù)定義的當前位置搜索所有方向。這個放電體還擁有由尺度參數(shù)定義的開發(fā)能力。在LSA中,用于引導放電體pL的μL被視為pL,且尺度參數(shù)σL隨著它的朝向地球方向的進程或找到最好的解從而以指數(shù)規(guī)律減小。這樣,pL在t+1次迭代中位置可寫為
(16)
圖4 閃電搜索算法的實現(xiàn)流程圖Fig.4 Flow chart of lightning search algorithm implementation
假設我方軍事基地坐標為(1 900,1 900),網(wǎng)絡中的傳感器特性在表2呈現(xiàn)。若某一時刻網(wǎng)絡中出現(xiàn)了5個目標,分別為敵方偵察機、預警機、轟炸機、殲擊機以及虛假目標,初始位置分別是(100,550),(450,450),(650,200),(700,150),速度分別為720,800,1 100,2 000 km/h,速度方向都是由初始位置直接指向我方軍事基地,位置示意如圖5所示。
表2 傳感器特性以及部署坐標Tab.2 Sensor characteristics and deployment coordinates
圖5 敵我作戰(zhàn)態(tài)勢Fig.5 Combat situation between us and enemy
各傳感器對不同目標的探測概率為
(17)
式(17)中,第i行第j列元素rdij是傳感器ai對目標bj的探測概率。
當k=0時探測情況如表3,將分布式和集中式算法[15]進行對比,分布式算法使用并行計算方法,求解的速度快,但是單個傳感器只能掌握局部信息,解的質量比集中式求解要低,所以本文采用的算法同時對比分布式算法求解速度和集中式算法的求解質量[16]。網(wǎng)絡對每個目標建立聯(lián)盟分別探測,同時本文將閃電搜索算法、人工蜂群算法以及博弈論算法求解探測聯(lián)盟方案[17],進行了100次Monte Carlo實驗,網(wǎng)絡效能與迭代次數(shù)的變化關系如圖6所示。
表3 傳感器分配情況Tab.3 Sensor distribution
圖6 面向探測目標任務的算法對比Fig.6 Comparison of algorithms for target detection task
由圖6可知,當α=0.85,β=0.15時,閃電算法與博弈論算法和人工蜂群算法相比,閃電算法求解質量比較高,同時收斂速度最快。探測聯(lián)盟求解如表4,網(wǎng)絡效能為10.826 9。
表4 傳感器分配情況Tab.4 Sensor distribution
當α=0.90,β=0.10時,閃電算法與博弈論算法和人工蜂群算法相比,閃電算法求解質量比較高,同時收斂速度最快。探測聯(lián)盟求解如表5,網(wǎng)絡效能為9.578 7。
表5 傳感器分配情況Tab.5 Sensor distribution
將兩種情況對比后,可知通過適當減小α和增大β,可以提高傳感器網(wǎng)絡效能同時探測概率沒有較大變化。
假設目標飛行0.1 h即k=0.1,此時對所有的目標探測完畢即虛假目標已被放棄,從而進入跟蹤狀態(tài),傳感器探測情況如表6。
表6 傳感器分配情況Tab.6 Sensor distribution
網(wǎng)絡對每個目標組建探測聯(lián)盟進行跟蹤,本文分別用閃電算法、人工蜂群算法以及博弈論算法求解聯(lián)盟方案,進行100次Monte Carlo實驗,網(wǎng)絡效能與迭代次數(shù)的變化關系如圖7所示。
圖7 面向跟蹤目標的算法對比Fig.7 Comparison of target-oriented algorithms
由圖7可知,當α=0.85,β=0.15時,3種算法對比,閃電算法求解質量高且收斂速度最快,能更好地適應實際作戰(zhàn)環(huán)境。
當α=0.85,β=0.15時,閃電算法穩(wěn)定后,跟蹤敵方偵察機的傳感器是a5,a7,跟蹤精度為-22.68;跟蹤敵方預警機的傳感器為a4,a5,跟蹤精度為-11.43;跟蹤敵方轟炸機的傳感器為a6,a7,跟蹤精度為-7.08;跟蹤敵方殲擊機的傳感器為a5,a6,a8,跟蹤精度為-9.89。傳感器網(wǎng)絡效能為-11.542 2。
當α=0.90,β=0.10時,算法穩(wěn)定后,跟蹤敵方偵察機的傳感器是a5,a7,a8,跟蹤精度為-8.78;跟蹤敵方預警機的傳感器為a4,a5,a7,跟蹤精度為-7.43;跟蹤敵方轟炸機的傳感器為a4,a6,a7,跟蹤精度為-7.08;跟蹤敵方殲擊機的傳感器為a4,a5,a6,a8,跟蹤精度為-6.19。傳感器網(wǎng)絡效能為-10.864 6。
兩種情況相比較后得到,可通過適當減小α和增大β提高對目標探測的精度。
當k=1 h,敵方偵察機的位置為(820,1 270),跟蹤該目標的傳感器a7,經過1 h,a7與目標的距離為912 km,符合交接條件,此時a7發(fā)出請求,而滿足情況的傳感器為a4,a5,a6。
計算網(wǎng)絡效能,綜上取α=0.85,β=0.15,對該傳感器同樣進行100次Monte Carlo實驗,效能與迭代次數(shù)關系如圖8。
圖8 面向目標交接的傳感器分配Fig.8 Sensor assignment for target handover
算法穩(wěn)定后,對敵方偵察機進行跟蹤的是a5傳感器,網(wǎng)絡效能為-3.9,精度為-33.23,最終方案決定后,傳感器a7不再對敵方偵察機進行跟蹤,從而實現(xiàn)目標交接。
本文針對幾類典型飛機目標的探測問題,提出了基于閃電搜索的多傳感器交叉提示算法。首先建立了基于Agent技術的MAT的交叉提示結構,提出有社區(qū)性的傳感器網(wǎng)絡結構,給出交叉提示發(fā)生的條件以及網(wǎng)絡效能評價函數(shù),探究交叉提示在目標探測、跟蹤以及交接的應用,設計了基于LSA的多傳感器交叉提示算法,通過仿真實驗驗證閃電算法性能優(yōu)于博弈論算法和人工蟻群算法,有較好的求解質量以及較快的收斂速度。