朱黔,許諾,黃蓓,李強(qiáng),周銳
(1.中國(guó)運(yùn)載火箭技術(shù)研究院 戰(zhàn)術(shù)武器事業(yè)部,北京100076; 2.北京航空航天大學(xué) 航空科學(xué)與工程學(xué)院,北京100083;3.北京航空航天大學(xué) 自動(dòng)化科學(xué)與電氣工程學(xué)院,北京100083)
區(qū)域搜索是情報(bào)偵察的重要手段,比較單架無(wú)人機(jī),多無(wú)人機(jī)協(xié)同搜索能夠盡可能覆蓋任務(wù)區(qū)域并提高搜索效率,獲取更為準(zhǔn)確的目標(biāo)信息。
針對(duì)多無(wú)人機(jī)協(xié)同區(qū)域搜索問(wèn)題,目前國(guó)內(nèi)外的研究主要分為2個(gè)方向:①以傳統(tǒng)的搜索論為基礎(chǔ),主要針對(duì)靜態(tài)目標(biāo)的搜索,以最大化目標(biāo)發(fā)現(xiàn)概率為目標(biāo),設(shè)定能夠完全覆蓋任務(wù)區(qū)域的固定搜索航線,如Zomboni搜索、Spiral搜索等;②考慮目標(biāo)搜索的動(dòng)態(tài)過(guò)程,根據(jù)傳感器獲取的探測(cè)信息,通過(guò)在線規(guī)劃實(shí)現(xiàn)無(wú)人機(jī)運(yùn)動(dòng)控制,主要基于不同的搜索圖,如概率圖[1-3]、信息素圖[4-5]、收益圖[6-7]等。
針對(duì)多無(wú)人機(jī)協(xié)同區(qū)域搜索,通常將待搜索區(qū)域劃分成大小相等的若干網(wǎng)格,以目標(biāo)在網(wǎng)格內(nèi)的存在概率及無(wú)人機(jī)對(duì)網(wǎng)格狀態(tài)的確定程度來(lái)描述待搜索的目標(biāo)信息。目前,多無(wú)人機(jī)協(xié)同區(qū)域搜索問(wèn)題已經(jīng)取得了很多豐碩成果,但是考慮遠(yuǎn)程指揮控制和實(shí)時(shí)態(tài)勢(shì)感知,存在地面站需要實(shí)時(shí)數(shù)據(jù)回傳的研究剛剛起步,而這卻廣泛存在于災(zāi)難救援、區(qū)域監(jiān)視、遠(yuǎn)程感知等[8-11]。
在多無(wú)人機(jī)協(xié)同區(qū)域搜索過(guò)程中,隨著搜索任務(wù)的展開(kāi),各無(wú)人機(jī)對(duì)不同區(qū)域進(jìn)行搜索,由于通信范圍有限,網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)會(huì)不斷發(fā)生變化,相應(yīng)地,無(wú)人機(jī)在網(wǎng)絡(luò)中的重要程度和對(duì)協(xié)同搜索任務(wù)的作用也隨之動(dòng)態(tài)變化。考慮無(wú)人機(jī)有限的通信能力,實(shí)時(shí)搜索信息需通過(guò)多跳網(wǎng)絡(luò)回傳給地面站,以實(shí)現(xiàn)遠(yuǎn)程指揮控制和態(tài)勢(shì)感知。因此,本文充分考慮搜索區(qū)域完全覆蓋和通信拓?fù)鋭?dòng)態(tài)變化,建立準(zhǔn)確有效的無(wú)人機(jī)節(jié)點(diǎn)重要性評(píng)估方法并設(shè)計(jì)合理的任務(wù)分配機(jī)制,對(duì)實(shí)現(xiàn)協(xié)同區(qū)域搜索任務(wù)與網(wǎng)絡(luò)連通性的動(dòng)態(tài)平衡具有重要的研究意義。
假設(shè)所有無(wú)人機(jī)都在同一高度并忽略風(fēng)干擾,僅考慮二維平面上的控制律設(shè)計(jì),對(duì)應(yīng)的無(wú)人機(jī)運(yùn)動(dòng)學(xué)模型如下:
式中:x=(x,y,ψ,v,ω)T為無(wú)人機(jī)狀態(tài)向量,(x,y)為慣性坐標(biāo)系下的位置,ψ、v、ω分別為無(wú)人機(jī)的航向角、速度、偏航角速度;(τv,τω)為時(shí)間常數(shù),用于表征執(zhí)行器時(shí)延;u=(uv,uω)T為無(wú)人機(jī)控制向量,uv為速度控制命令,uω為偏航角速度控制指令,需要滿足如下約束[12-13]:
其中:無(wú)人機(jī)的巡航速度為v0,速度和偏航角速度的最大變化范圍分別為vmax和ωmax。
在協(xié)同區(qū)域搜索過(guò)程中,通常采用簡(jiǎn)單的傳感器模型,如探測(cè)圓[6-7],而實(shí)際應(yīng)用中部分傳感器可能存在視線角約束,并且二值覆蓋函數(shù)很難有效表示探測(cè)能力。文獻(xiàn)[14]基于真實(shí)傳感器,考慮探測(cè)距離、角度、可視性等要素,提出概率傳感器模型。將其引入多機(jī)協(xié)同區(qū)域搜索中,采用覆蓋概率作為評(píng)價(jià)指標(biāo),用于表征概率傳感器對(duì)各個(gè)網(wǎng)格的探測(cè)能力差異,相應(yīng)的覆蓋概率函數(shù)由距離、方位角、俯仰角及可視性函數(shù)構(gòu)成。
式中:si=(pi,θi,ξi)為四元組,表示第i架無(wú)人機(jī)傳感器配置信息,由位置pi、方位角θi及俯仰角ξi構(gòu)成;q為待搜索區(qū)域網(wǎng)格中心點(diǎn)的位置坐標(biāo)。本文不考慮傳感器視線遮擋,則覆蓋概率函數(shù)可改為如下形式:
相應(yīng)地,距離、方位角及俯仰角函數(shù)表示如下:
式中:γi=∠p(q-pi)-θi;ζi=∠t(q-pi)-ξi;參數(shù)t、β用于調(diào)整S函數(shù)的寬度和邊界斜率,對(duì)應(yīng)調(diào)整這2個(gè)參數(shù)即可改變概率傳感器探測(cè)能力。
假設(shè)待搜索區(qū)域Ω為一個(gè)LX×LY的二維矩形平面,其被均勻分成NX×NY個(gè)網(wǎng)格,為簡(jiǎn)便計(jì)算,每個(gè)網(wǎng)格都用對(duì)應(yīng)的中心點(diǎn)位置坐標(biāo)進(jìn)行表示。選取NU架同構(gòu)無(wú)人機(jī)執(zhí)行協(xié)同區(qū)域搜索任務(wù),其對(duì)應(yīng)集合為U={U1,U2,…,UNU}。假設(shè)有NT個(gè)目標(biāo)隨機(jī)分布在該未知區(qū)域,相應(yīng)的,其對(duì)應(yīng)的集合可表示為T(mén)={T1,T2,…,TNT},為不失一般性,目標(biāo)的分布概率均滿足正態(tài)分布。
在協(xié)同搜索過(guò)程中,無(wú)人機(jī)能夠?qū)ζ涓怕蕚鞲衅魉采w的網(wǎng)格進(jìn)行獨(dú)立探測(cè),并且通信范圍內(nèi)的無(wú)人機(jī)彼此能夠交換探測(cè)信息。以覆蓋概率作為網(wǎng)格探測(cè)程度的評(píng)價(jià)指標(biāo),設(shè)定固定的覆蓋閾值ps,當(dāng)該網(wǎng)格的覆蓋概率超過(guò)固定閾值時(shí),則認(rèn)為當(dāng)前網(wǎng)格能夠被無(wú)人機(jī)有效探測(cè),反之不能。定義為無(wú)人機(jī)m通過(guò)單次探測(cè)能夠發(fā)現(xiàn)目標(biāo)j∈T的概率,在tk時(shí)刻無(wú)人機(jī)m對(duì)網(wǎng)格q探測(cè)的次數(shù)記為lm(q,tk)。因此,截止到tk時(shí)刻,無(wú)人機(jī)m對(duì)網(wǎng)格q在各時(shí)間點(diǎn)的探測(cè)次數(shù)可表示為hm(q,tk)={lm(q,t1),lm(q,t2),…,lm(q,tk)}。如式(8)所示,截止到tk時(shí)刻無(wú)人機(jī)m對(duì)網(wǎng)格q的總探測(cè)次數(shù)即為各個(gè)時(shí)間點(diǎn)的探測(cè)次數(shù)之和[6]。
考慮通信時(shí)延,各架無(wú)人機(jī)需要保存接收到所有無(wú)人機(jī)的最新探測(cè)信息。在tk時(shí)刻,無(wú)人機(jī)m接收到無(wú)人機(jī)n對(duì)于網(wǎng)格q的總探測(cè)次數(shù)可表示為hm,n(q,tk-τn,m),τn,m為隨機(jī)有界的通信時(shí)延。而無(wú)人機(jī)m獲得所有無(wú)人機(jī)的總探測(cè)次數(shù)信息可表示如下:
在tk時(shí)刻,依據(jù)接收到的最新探測(cè)信息,計(jì)算目標(biāo)j在網(wǎng)格q中的發(fā)現(xiàn)概率如下:
如果無(wú)人機(jī)m對(duì)網(wǎng)格q執(zhí)行一次新的探測(cè),則無(wú)人機(jī)m對(duì)于網(wǎng)格q的總探測(cè)次數(shù)將變?yōu)?q,tk)=Lm(q,tk)+1。因此,當(dāng)無(wú)人機(jī)m對(duì)網(wǎng)格q執(zhí)行一次新的探測(cè),目標(biāo)j在網(wǎng)格q中的發(fā)現(xiàn)概率估計(jì)值可計(jì)算如下:
式(10)表示tk時(shí)刻目標(biāo)j在網(wǎng)格q中的發(fā)現(xiàn)概率,而式(11)則表示無(wú)人機(jī)m對(duì)網(wǎng)格q執(zhí)行一次新的探測(cè)后,目標(biāo)j在網(wǎng)格q中的發(fā)現(xiàn)概率估計(jì)值。由此可估算出,當(dāng)無(wú)人機(jī)m對(duì)網(wǎng)格q執(zhí)行一次新的探測(cè),其對(duì)在網(wǎng)格q內(nèi)的目標(biāo)j的發(fā)現(xiàn)概率增量可計(jì)算如下:
假設(shè)目標(biāo)j在網(wǎng)格q內(nèi)的先驗(yàn)概率為pj(q),因先驗(yàn)信息一致,對(duì)所有無(wú)人機(jī)有(q)=pj(q),因此可估算出無(wú)人機(jī)m對(duì)網(wǎng)格q執(zhí)行一次新的探測(cè)對(duì)應(yīng)的搜索收益增加值為
如式(14)所示,截止到tk時(shí)刻,整個(gè)機(jī)群的協(xié)同搜索收益可定義為目標(biāo)存在先驗(yàn)概率與發(fā)現(xiàn)概率的乘積。
由式(11)~式(14)可以看出,整個(gè)搜索過(guò)程中,無(wú)人機(jī)間僅需要共享對(duì)每個(gè)網(wǎng)格的總探測(cè)次數(shù)。在每個(gè)探測(cè)周期內(nèi),各架無(wú)人機(jī)依據(jù)鄰居無(wú)人機(jī)共享信息對(duì)所存儲(chǔ)的各無(wú)人機(jī)總探測(cè)次數(shù)進(jìn)行更新,對(duì)應(yīng)更新原則如下:
當(dāng)無(wú)人機(jī)m對(duì)網(wǎng)格q執(zhí)行一次新的探測(cè),其增加的搜索收益主要由目標(biāo)存在概率、歷史搜索信息及通信時(shí)延共同決定。對(duì)應(yīng)的,總的搜索收益增加值可用如下公式進(jìn)行估算:
若只考慮無(wú)人機(jī)單步運(yùn)動(dòng)規(guī)劃,則可通過(guò)式(17)計(jì)算得到無(wú)人機(jī)m的最優(yōu)控制輸入:
針對(duì)多無(wú)人機(jī)協(xié)同區(qū)域搜索,在保持通信網(wǎng)絡(luò)拓?fù)溥B通的前提下,需要在短時(shí)間內(nèi)最大化搜索收益。利用無(wú)向圖表示地面站和無(wú)人機(jī)共同構(gòu)成的拓?fù)渚W(wǎng)絡(luò),定義其為G=(V,E),V為n個(gè)頂點(diǎn)集合,E為節(jié)點(diǎn)邊集。設(shè)Ni為節(jié)點(diǎn)vi的鄰居集合,則整個(gè)連通圖的鄰接矩陣可表示如下:
整個(gè)連通圖的拉普拉斯矩陣表示如下:
定義λi(L)為拉普拉斯矩陣的第i小特征值,滿足0=λ1(L)≤λ2(L)≤…≤λn(L)。其中,λ2(L)為拉普拉斯矩陣的第二小特征值,也稱(chēng)作費(fèi)德勒值,其表示網(wǎng)絡(luò)拓?fù)涞膸缀芜B通性。而無(wú)向圖是否連通的充分必要條件[15]可以表示如下:
在協(xié)同區(qū)域搜索任務(wù)中,隨著搜索范圍的逐漸擴(kuò)大,無(wú)人機(jī)群逐漸遠(yuǎn)離地面站的通信覆蓋范圍,為保證實(shí)時(shí)信息能夠及時(shí)回傳給地面站,考慮有限通信能力需要部分無(wú)人機(jī)充當(dāng)中繼無(wú)人機(jī)提供通信服務(wù),確保整個(gè)搜索任務(wù)的順利執(zhí)行。
考慮存在地面站的多無(wú)人機(jī)協(xié)同區(qū)域搜索,由于無(wú)人機(jī)平臺(tái)的通信能力有限,為實(shí)現(xiàn)遠(yuǎn)程指揮控制和實(shí)時(shí)態(tài)勢(shì)感知,如圖1所示,需要在地面站和遠(yuǎn)端搜索無(wú)人機(jī)間建立可靠的通信連接。
圖1 存在地面站的多無(wú)人機(jī)協(xié)同區(qū)域搜索Fig.1 Multi-UAV cooperative surveillance with ground station
結(jié)合區(qū)域搜索任務(wù)特點(diǎn),本文參考文獻(xiàn)[16]提出了3種不同的無(wú)人機(jī)任務(wù)角色,用于實(shí)現(xiàn)協(xié)同搜索收益和網(wǎng)絡(luò)連通性保持之間的平衡與折中。3種無(wú)人機(jī)角色分別為中繼無(wú)人機(jī)、關(guān)節(jié)無(wú)人機(jī)、搜索無(wú)人機(jī),相應(yīng)的角色功能和任務(wù)目標(biāo)如表1所示,具體各個(gè)角色之間的切換關(guān)系如圖2所示。
表1 協(xié)同區(qū)域搜索任務(wù)中無(wú)人機(jī)角色信息Table 1 UAV roles in cooperative sur veillance
圖2 協(xié)同區(qū)域搜索任務(wù)中無(wú)人機(jī)角色切換關(guān)系Fig.2 Role switch relationship among UAVs in cooperative surveillance
在協(xié)同搜索過(guò)程中,整個(gè)通信拓?fù)淇梢砸暈橐粋€(gè)復(fù)雜網(wǎng)絡(luò),而各架無(wú)人機(jī)可以視為復(fù)雜網(wǎng)絡(luò)中的節(jié)點(diǎn)。節(jié)點(diǎn)重要性評(píng)估[17]是復(fù)雜網(wǎng)絡(luò)的一個(gè)重要研究?jī)?nèi)容,目前國(guó)內(nèi)外學(xué)者針對(duì)節(jié)點(diǎn)重要性評(píng)估提出了很多描述重要性的要素,如度中心性、介數(shù)中心性、接近中心性、特征向量中心性等[18-21]。然而針對(duì)存在地面站的多無(wú)人機(jī)協(xié)同區(qū)域搜索,為保持通信拓?fù)溥B接和協(xié)同區(qū)域搜索任務(wù)的動(dòng)態(tài)平衡,顯然越靠近地面站的無(wú)人機(jī)節(jié)點(diǎn)的重要程度越高,反之亦然。因此,現(xiàn)有描述節(jié)點(diǎn)重要性的要素并不能直接應(yīng)用,需要提煉出能夠準(zhǔn)確反映無(wú)人機(jī)節(jié)點(diǎn)重要性差異的評(píng)價(jià)要素。
首先,頻繁的角色切換不利于任務(wù)的連續(xù)性,需要設(shè)置不同的重要程度表征任務(wù)角色。其次,參照?qǐng)D論中最短路徑,當(dāng)前無(wú)人機(jī)到地面站的最小跳數(shù)通道可以最大限度降低探測(cè)信息傳輸時(shí)延并提高信息傳輸?shù)目煽啃裕?2];類(lèi)比圖論中通過(guò)某一固定節(jié)點(diǎn)的全部最短路徑,當(dāng)前無(wú)人機(jī)在所有無(wú)人機(jī)與地面站最小跳數(shù)通道上的比值能夠表征當(dāng)前無(wú)人機(jī)對(duì)其他無(wú)人機(jī)通信的影響程度。針對(duì)某些特定場(chǎng)景,以上3個(gè)要素不足以完全區(qū)分無(wú)人機(jī)的重點(diǎn)程度,將當(dāng)前無(wú)人機(jī)距離地面站實(shí)際距離作為補(bǔ)充要素用于描述節(jié)點(diǎn)的重要程度。
式中:i∈U為無(wú)人機(jī)序號(hào);式(19)表示各個(gè)搜索任務(wù)角色(RV)對(duì)應(yīng)的價(jià)值,考慮搜索信息的實(shí)時(shí)回傳,認(rèn)為網(wǎng)絡(luò)連通性最為重要,設(shè)定各個(gè)角色價(jià)值關(guān)系為:中繼無(wú)人機(jī)>關(guān)節(jié)無(wú)人機(jī)>搜索無(wú)人機(jī);式(20)表示當(dāng)前無(wú)人機(jī)與地面站通信所需的最小跳數(shù)(MH),chani表示無(wú)人機(jī)i與地面站間的通信通道,L(chani)表示通道chani的跳數(shù)值,而Ωi為無(wú)人機(jī)i與地面站之間所有的通信信道集合;式(21)代表無(wú)人機(jī)i的最短路徑通過(guò)比(RMH),Lji為無(wú)人機(jī)j與地面站之間具有最小跳數(shù)且經(jīng)過(guò)無(wú)人機(jī)i的通道數(shù)量,Lj為無(wú)人機(jī)j與地面站間具有最小跳數(shù)的通道數(shù)量;式(22)表示無(wú)人機(jī)i與地面站間的實(shí)際距離(AD),(xb,yb)為地面站的點(diǎn)位坐標(biāo)。
逼近理想解排序法是一種基于多屬性決策問(wèn)題中的理想解和負(fù)理想解,對(duì)多屬性決策問(wèn)題的供選方案進(jìn)行排序的方法。基于2.1節(jié)描述的4種無(wú)人機(jī)節(jié)點(diǎn)重要性評(píng)估要素,可以構(gòu)建無(wú)人機(jī)節(jié)點(diǎn)的屬性矩陣如下:
需要強(qiáng)調(diào)的是,最小跳數(shù)和真實(shí)距離值越小,其節(jié)點(diǎn)重要性越高。因此,需要進(jìn)行取反處理,隨后代入屬性矩陣,完成后續(xù)運(yùn)算。式中,xij為第i架無(wú)人機(jī)的第j個(gè)屬性值,并對(duì)屬性矩陣標(biāo)準(zhǔn)化,具體計(jì)算公式如下:
考慮評(píng)估要素作用差異,采用方根法計(jì)算權(quán)向量為ωV=(0.520 5,0.201,0.201,0.077 5)。對(duì)應(yīng)的加權(quán)標(biāo)準(zhǔn)化矩陣為
依據(jù)加權(quán)標(biāo)準(zhǔn)化矩陣,可以計(jì)算得出對(duì)應(yīng)的理想解和負(fù)理想解。
式中:A*和A-分別為理想解和負(fù)理想解。
目標(biāo)i與理想解和負(fù)理想解之間的距離可以用式(25)進(jìn)行計(jì)算:
為增加距離公式的區(qū)分度,將相對(duì)熵[23-24]代入式(25),可獲得改進(jìn)距離計(jì)算公式:
可計(jì)算出各節(jié)點(diǎn)距離理想解的接近度:
接近度作為無(wú)人機(jī)節(jié)點(diǎn)重要性評(píng)估的最終評(píng)估指標(biāo),顯然,若C*i越大,對(duì)應(yīng)節(jié)點(diǎn)重要性越高,反之亦然,即=0對(duì)應(yīng)最不重要的節(jié)點(diǎn),=1對(duì)應(yīng)最重要的節(jié)點(diǎn)。因此接近度越大,節(jié)點(diǎn)重要性越高,而對(duì)接近度進(jìn)行排序,即可確定NU個(gè)備選方案的最優(yōu)排序。
依據(jù)改進(jìn)的逼近理想解排序法,可以獲得無(wú)人機(jī)節(jié)點(diǎn)重要程度序列VSeq。依據(jù)無(wú)人機(jī)節(jié)點(diǎn)重要程度序列,提出協(xié)同區(qū)域搜索角色切換策略實(shí)現(xiàn)網(wǎng)絡(luò)連通性和協(xié)同搜索收益的平衡。
協(xié)同搜索任務(wù)中,設(shè)當(dāng)前所需中繼無(wú)人機(jī)數(shù)目為NR,其最大值為NU-2。為簡(jiǎn)化計(jì)算,假設(shè)同一時(shí)刻只對(duì)最遠(yuǎn)端中繼無(wú)人機(jī)的角色進(jìn)行調(diào)整,即增加或減少中繼無(wú)人機(jī),從而實(shí)現(xiàn)對(duì)搜索區(qū)域的動(dòng)態(tài)調(diào)整。定義序列VSeq中第n重要的無(wú)人機(jī)為nth無(wú)人機(jī),其與無(wú)人機(jī)的ID并不一一對(duì)應(yīng),定義nth無(wú)人機(jī)節(jié)點(diǎn)為Vn,用V*n表示無(wú)人機(jī)的信息集,包含任務(wù)角色,當(dāng)前位置,重要程度最高的前繼、后繼無(wú)人機(jī)節(jié)點(diǎn)序號(hào),盤(pán)旋點(diǎn)位置,依次表示為{R,Pos,P,S,PC},其中盤(pán)旋點(diǎn)是固定翼無(wú)人機(jī)充當(dāng)中繼時(shí)的盤(pán)旋圓圓心。
無(wú)人機(jī)角色切換由2個(gè)階段構(gòu)成:角色分配和角色調(diào)整。在角色分配階段,需要先對(duì)無(wú)人機(jī)節(jié)點(diǎn)重要性進(jìn)行評(píng)估,獲得重要程度序列VSeq。1st~無(wú)人機(jī)被指定為中繼無(wú)人機(jī),第(NR+1)th無(wú)人機(jī)作為關(guān)節(jié)無(wú)人機(jī)連接中繼無(wú)人機(jī)和搜索無(wú)人機(jī)群,而剩余的無(wú)人機(jī)則作為搜索無(wú)人機(jī)繼續(xù)執(zhí)行搜索任務(wù)。由于在協(xié)同區(qū)域搜索任務(wù)中為擴(kuò)大搜索范圍,在通信保持的前提下顯然增補(bǔ)中繼無(wú)人機(jī)比移除中繼無(wú)人機(jī)更重要,在角色調(diào)整階段,依據(jù)搜索無(wú)人機(jī)群、關(guān)節(jié)無(wú)人機(jī)及第個(gè)中繼無(wú)人機(jī)彼此位置關(guān)系,優(yōu)先考慮增補(bǔ)中繼無(wú)人機(jī)。完成無(wú)人機(jī)角色調(diào)整。
如圖3所示,rcomm為無(wú)人機(jī)通信距離。設(shè)定2個(gè)距離閾值用于判斷無(wú)人機(jī)彼此的位置關(guān)系,其中rstr為搜索無(wú)人機(jī)遠(yuǎn)離時(shí)需要增補(bǔ)中繼無(wú)人機(jī)的距離閾值,rrts則對(duì)應(yīng)需要移除中繼無(wú)人機(jī)時(shí)的距離閾值,而zbuffer={x:rrts≤x-xu≤rstr}作為角色切換緩沖區(qū),能夠防止無(wú)人機(jī)角色頻繁切換。
圖3 角色調(diào)整階段無(wú)人機(jī)相對(duì)位置關(guān)系Fig.3 Geometry relationship among different UAVs in role conversion stage
首先考慮搜索無(wú)人機(jī)群是否遠(yuǎn)離關(guān)節(jié)無(wú)人機(jī)。如果沒(méi)有搜索無(wú)人機(jī)在關(guān)節(jié)無(wú)人機(jī)(NR+1)th的圓域z1={x:x-xu≤rstr}中,則表明搜索無(wú)人機(jī)群正在遠(yuǎn)離中繼無(wú)人機(jī),網(wǎng)絡(luò)拓?fù)淇赡艹霈F(xiàn)中斷。因此,關(guān)節(jié)無(wú)人機(jī)需要切換為中繼無(wú)人機(jī)防止通信中斷,通過(guò)增加中繼無(wú)人機(jī)來(lái)擴(kuò)展通信范圍,選取(NR+2)th無(wú)人機(jī)作為新的關(guān)節(jié)無(wú)人機(jī)。
如果沒(méi)有增補(bǔ)中繼無(wú)人機(jī),則應(yīng)該考慮是否需要移除中繼無(wú)人機(jī)。如果在第架中繼無(wú)人機(jī),即距離地面站最遠(yuǎn)端的中繼無(wú)人機(jī)的圓區(qū)域z2={x:x-xu≤rrts}中存在至少一架無(wú)人機(jī),則表示第架無(wú)人機(jī)附近存在其他無(wú)人機(jī),其沒(méi)有必要繼續(xù)充當(dāng)中繼無(wú)人機(jī)。此時(shí)需要調(diào)整中繼無(wú)人機(jī)的數(shù)目為(NR-1),而第個(gè)無(wú)人機(jī)切換為新的關(guān)節(jié)無(wú)人機(jī),原先的關(guān)節(jié)無(wú)人機(jī)變?yōu)樗阉鳠o(wú)人機(jī),用于擴(kuò)大區(qū)域搜索范圍。
考慮無(wú)人機(jī)最小轉(zhuǎn)彎半徑約束,為保持網(wǎng)絡(luò)連通性,固定翼無(wú)人機(jī)需要在指定的盤(pán)旋點(diǎn)附近進(jìn)行盤(pán)旋確保通信連接。本文不考慮地面障礙物遮擋的影響,因此中繼無(wú)人機(jī)的盤(pán)旋點(diǎn)可按照等間隔分布在地面站和搜索無(wú)人機(jī)群的質(zhì)心之間,相鄰盤(pán)旋點(diǎn)的間隔設(shè)定為rstr。相應(yīng)地,定義和分別代表第nth無(wú)人機(jī)的圓區(qū)域z1、z2內(nèi)無(wú)人機(jī)數(shù)量,相應(yīng)的角色切換策略偽代碼如下。
輸出:所有無(wú)人機(jī)的角色VRi和盤(pán)旋點(diǎn),i=1,2,…,NU。
//角色分配階段
1.計(jì)算RV、MH、RMH、AD值(見(jiàn)式(19)~式(22))。
2.計(jì)算無(wú)人機(jī)節(jié)點(diǎn)重要程度序列VSeq(見(jiàn)式(23)~式(27))。
//角色調(diào)整階段
6.else
9.endif
10.endif
11.計(jì)算盤(pán)旋點(diǎn)VPCi,i=1,2,…,NR。
在協(xié)同區(qū)域搜索任務(wù)中,考慮無(wú)人機(jī)運(yùn)動(dòng)學(xué)、通信保持及機(jī)間防撞等約束,基于鄰居信息和當(dāng)前無(wú)人機(jī)任務(wù)角色,通過(guò)分布式滾動(dòng)時(shí)域優(yōu)化[25]實(shí)現(xiàn)每架無(wú)人機(jī)在線運(yùn)動(dòng)規(guī)劃。依據(jù)式(1),無(wú)人機(jī)運(yùn)動(dòng)學(xué)模型的離散形式可表示如下:
式中:xk為無(wú)人機(jī)的狀態(tài)向量;uk為控制輸入;TS為計(jì)算步長(zhǎng)。假設(shè)規(guī)劃時(shí)域長(zhǎng)度為N,相應(yīng)地,滾動(dòng)時(shí)域控制序列為uk=[,,…,-1]。依據(jù)協(xié)同區(qū)域搜索任務(wù)角色設(shè)置,各架無(wú)人機(jī)的優(yōu)化指標(biāo)存在一定的差異。對(duì)于搜索無(wú)人機(jī)和關(guān)節(jié)無(wú)人機(jī),其優(yōu)化目標(biāo)是最大化協(xié)同區(qū)域搜索收益值,對(duì)應(yīng)的目標(biāo)函數(shù)可以表示如下:
對(duì)于中繼無(wú)人機(jī),其首要任務(wù)是在指定位置附近進(jìn)行盤(pán)旋確保網(wǎng)絡(luò)通信連通。相應(yīng)地,優(yōu)化目標(biāo)函數(shù)可以表示如下:
考慮通信保持和機(jī)間防撞約束,在滾動(dòng)時(shí)域優(yōu)化過(guò)程中設(shè)計(jì)懲罰函數(shù)用來(lái)表征可能導(dǎo)致碰撞或網(wǎng)絡(luò)中斷的無(wú)人機(jī)運(yùn)動(dòng)規(guī)劃結(jié)果,相應(yīng)的懲罰函數(shù)可以表示如下:
考慮通信保持、無(wú)人機(jī)運(yùn)動(dòng)學(xué)及機(jī)間防撞等約束,對(duì)于所有無(wú)人機(jī)m∈U,在每個(gè)預(yù)測(cè)時(shí)刻,即對(duì)于?i=1,2,…,N,應(yīng)滿足如下約束:
將懲罰函數(shù)(31)代入到各無(wú)人機(jī)的目標(biāo)函數(shù)中,相應(yīng)的改進(jìn)目標(biāo)函數(shù)如下:
在每一個(gè)采樣時(shí)刻,結(jié)合局部信息及當(dāng)前無(wú)人機(jī)任務(wù)角色,通過(guò)分布式滾動(dòng)時(shí)域控制優(yōu)化每架無(wú)人機(jī)的最優(yōu)控制序列。
對(duì)基于角色切換策略的多無(wú)人機(jī)協(xié)同區(qū)域搜索方法進(jìn)行仿真驗(yàn)證,指派8架同構(gòu)無(wú)人機(jī)對(duì)一個(gè)5 000 m×5 000 m的矩形區(qū)域進(jìn)行協(xié)同搜索,目標(biāo)搜索信息通過(guò)機(jī)間數(shù)據(jù)鏈實(shí)時(shí)回傳至地面站用于戰(zhàn)場(chǎng)態(tài)勢(shì)感知。假設(shè)區(qū)域內(nèi)隨機(jī)分布著10個(gè)未知目標(biāo),滿足以目標(biāo)所在位置為中心,均值為0,標(biāo)準(zhǔn)差為250 m的正態(tài)分布。整個(gè)區(qū)域均分為50×50個(gè)等面積網(wǎng)格,任一無(wú)人機(jī)m∈U通過(guò)一次探測(cè)對(duì)于在網(wǎng)格q內(nèi)目標(biāo)j∈T的發(fā)現(xiàn)概率為=0.5。設(shè)定多無(wú)人機(jī)協(xié)同區(qū)域搜索的仿真步數(shù)為400,采樣時(shí)間為0.5 s,滾動(dòng)時(shí)域優(yōu)化的時(shí)域長(zhǎng)度為4。性能參數(shù)v0、vmax、ωmax、rcomm、rsafe分別為80 m/s、20 m/s、0.8 rad/s、1 000 m、50 m。在角色切換策略中,切換為中繼無(wú)人機(jī)的閾值距離為rstr=700 m,而切換為搜索無(wú)人機(jī)的閾值距離為rrts=400 m。為確保通信連接,搜索無(wú)人機(jī)和中繼無(wú)人機(jī)的通信懲罰距離分別設(shè)置為900 m、650 m,而機(jī)間防撞懲罰距離設(shè)置為200 m。
圖4為各架無(wú)人機(jī)的搜索軌跡,圖中顏色較深的網(wǎng)格區(qū)域代表目標(biāo)存在區(qū)域。初始時(shí)刻各架無(wú)人機(jī)以200 m的等間隔從未知區(qū)域下方開(kāi)始進(jìn)行搜索,由搜索軌跡可以看出,隨著搜索任務(wù)的進(jìn)行,機(jī)群對(duì)所有的潛在目標(biāo)都進(jìn)行探測(cè)搜索,各架無(wú)人機(jī)通過(guò)合理有效的角色切換,盡可能擴(kuò)大搜索區(qū)域范圍,這也體現(xiàn)出基于角色切換策略的多機(jī)協(xié)同區(qū)域搜索的可行性和有效性。
圖4 多無(wú)人機(jī)協(xié)同區(qū)域搜索軌跡Fig.4 Multi-UAV cooperative surveillance trajectories
由圖5的協(xié)同搜索收益曲線可以看出,隨著搜索范圍的擴(kuò)大,發(fā)現(xiàn)目標(biāo)數(shù)量和協(xié)同搜索收益都逐漸增加。但由于目標(biāo)隨機(jī)分布,以及機(jī)群需要與地面站保持通信連接,致使不同時(shí)段內(nèi)獲得的協(xié)同搜索收益存在差異。但隨著搜索任務(wù)的執(zhí)行,所有潛在目標(biāo)均被發(fā)現(xiàn),這也反映出角色切換策略在協(xié)同區(qū)域搜索任務(wù)中的可行性和有效性。
圖5 多無(wú)人機(jī)協(xié)同區(qū)域搜索收益Fig.5 Payoff in multi-UAV cooperative surveillance
由圖6可以看出,λ2>0始終滿足,這表明在整個(gè)搜索過(guò)程中,隨著無(wú)人機(jī)的相對(duì)運(yùn)動(dòng)和角色切換,通信拓?fù)涫冀K保持動(dòng)態(tài)連接以適應(yīng)搜索任務(wù)的需求。在任務(wù)初始階段,λ2值較大,這是由于多架無(wú)人機(jī)從距離地面站較近的初始位置出發(fā),網(wǎng)絡(luò)連通度較高。隨著無(wú)人機(jī)逐漸遠(yuǎn)離地面站,部分無(wú)人機(jī)切換為中繼無(wú)人機(jī),搜索范圍擴(kuò)展的同時(shí)網(wǎng)絡(luò)連通度逐漸下降,λ2值逐漸減小。
圖6 拉普拉斯矩陣第二小特征值Fig.6 The second smallest eigenvalue of Laplacian matrices
圖7為協(xié)同區(qū)域搜索任務(wù)中不同時(shí)刻對(duì)應(yīng)的各無(wú)人機(jī)拓?fù)溥B通。在任務(wù)初始階段,多架無(wú)人機(jī)處于地面站通信范圍內(nèi),此時(shí)所有無(wú)人機(jī)均為搜索無(wú)人機(jī)。隨著搜索范圍的逐漸擴(kuò)大,為確保通信連接,部分無(wú)人機(jī)需要切換角色變?yōu)橹欣^無(wú)人機(jī),在地面站和搜索無(wú)人機(jī)群之間建立動(dòng)態(tài)通信連接。在tk=30 s時(shí),無(wú)人機(jī)節(jié)點(diǎn)重要性序列為VSeq={3,2,1,6,5,4,7,8},所需的中繼無(wú)人機(jī)數(shù)目為NR=2。基于角色切換策略,無(wú)人機(jī)3、2被指派為中繼無(wú)人機(jī),而無(wú)人機(jī)1作為關(guān)節(jié)無(wú)人機(jī)連接搜索無(wú)人機(jī)群6、5、4、7、8和中繼無(wú)人機(jī)2。較比tk=20 s,隨著搜索無(wú)人機(jī)群逐漸遠(yuǎn)離地面站,無(wú)人機(jī)2已由關(guān)節(jié)無(wú)人機(jī)切換為中繼無(wú)人機(jī),在確保通信的前提下,使得搜索區(qū)域范圍得以擴(kuò)大。由tk=75 s和tk=160 s的瞬時(shí)拓?fù)淇梢钥闯?,在每個(gè)采樣時(shí)刻,地面站依據(jù)各架無(wú)人機(jī)的瞬時(shí)信息,計(jì)算出各架無(wú)人機(jī)的重要程度,并為其分配不同的任務(wù)角色,隨著角色的有序切換,實(shí)現(xiàn)協(xié)同區(qū)域搜索任務(wù)和網(wǎng)絡(luò)拓?fù)溥B通性的平衡。
圖7 多無(wú)人機(jī)協(xié)同區(qū)域搜索中無(wú)人機(jī)角色切換Fig.7 UAV role switch in multi-UAV cooperative surveillance
圖8反映了區(qū)域搜索過(guò)程中各架無(wú)人機(jī)間的距離信息。其中,圖8(a)中的紅色實(shí)線表示為保持必要通信連接,各架無(wú)人機(jī)與其最小鄰居無(wú)人機(jī)集合間的最大機(jī)間距離,而藍(lán)色虛線則代表整個(gè)無(wú)人機(jī)編隊(duì)內(nèi)最近2架無(wú)人機(jī)間的相對(duì)距離。圖8(a)中,上下2條虛線分別為無(wú)人機(jī)有效通信距離和最小安全距離,可以看出整個(gè)搜索過(guò)程中,2條機(jī)間距離曲線都在指定區(qū)間內(nèi)且具有一定安全閾值,這也體現(xiàn)出在滾動(dòng)時(shí)域優(yōu)化中引入懲罰函數(shù)對(duì)通信保持和機(jī)間防撞的有效性。
圖8 相對(duì)距離曲線Fig.8 Relative distance curves
通過(guò)調(diào)整距離、方位角和俯仰角參數(shù)體現(xiàn)概率傳感器探測(cè)能力差異,針對(duì)每種探測(cè)能力均重復(fù)10次仿真,對(duì)應(yīng)的平均協(xié)同搜索收益曲線如圖9所示??紤]不同探測(cè)能力、協(xié)同搜索收益隨任務(wù)進(jìn)行而快速增加,這表明角色切換策略對(duì)擴(kuò)大搜索范圍的有效性,通過(guò)曲線對(duì)比可以看出,傳感器性能提升有助于協(xié)同搜索收益的增加。然而,僅單方面提升傳感器性能并不能確保協(xié)同搜索收益一直保持快速增加,這主要受限于無(wú)人機(jī)的有限機(jī)動(dòng)能力,如最大飛行速度。
圖9 不同傳感器能力下的協(xié)同搜索收益Fig.9 Cooperative search payoff under different sensor capacities
考慮常用的評(píng)價(jià)指標(biāo),如發(fā)現(xiàn)目標(biāo)數(shù)目、網(wǎng)格探測(cè)比例等,搭載不同傳感器的協(xié)同搜索對(duì)比結(jié)果如表2所示,其中平均最小完成任務(wù)時(shí)間是指所有潛在目標(biāo)均被發(fā)現(xiàn)所需要的時(shí)間??梢钥闯?,傳感器性能改善能有效提高協(xié)同搜索收益,但隨著傳感器能力提高,協(xié)同搜索收益增長(zhǎng)率會(huì)逐漸下降,而這與之前分析結(jié)果一致。
表2 不同傳感器能力下的多無(wú)人機(jī)協(xié)同區(qū)域搜索結(jié)果Table 2 Multi-UAV cooperative surveillance results under different sensor capacities
顯然,不同的搜索策略會(huì)對(duì)協(xié)同搜索產(chǎn)生不同影響。采用Zamboni策略[26]與將角色切換策略進(jìn)行對(duì)比,其是一種通過(guò)預(yù)先規(guī)劃指定搜索路徑的確定性策略。此外,不考慮地面站和角色切換策略,設(shè)計(jì)僅考慮搜索機(jī)群的拓?fù)溥B通性和搜索收益最大化的簡(jiǎn)單策略。
針對(duì)不同策略均進(jìn)行10次重復(fù)仿真,仿真結(jié)果如圖10所示。比較Zamboni和搜索收益最大化策略,角色切換策略能夠獲得最大協(xié)同搜索收益,Zamboni策略因預(yù)先規(guī)劃路徑確保能夠覆蓋整個(gè)區(qū)域,但受到隨機(jī)目標(biāo)分布影響,其最后完成搜索任務(wù)。作為一種簡(jiǎn)單搜索策略,搜索收益最大化策略不考慮與地面站保持通信,能夠最先完成搜索任務(wù),但其與Zamboni策略一樣不能始終保持與地面站的通信連接,而角色切換策略在保持通信連通的前提下,能夠在較短時(shí)間內(nèi)完成搜索任務(wù),這也體現(xiàn)出基于角色切換策略的多無(wú)人機(jī)協(xié)同區(qū)域搜索方法的可行性和有效性。
圖10 不同搜索策略下的協(xié)同搜索收益Fig.10 Cooperative search payoff under different search strategies
本文針對(duì)熱點(diǎn)區(qū)域未知目標(biāo)的多無(wú)人機(jī)協(xié)同快速搜索問(wèn)題開(kāi)展相關(guān)研究。
1)考慮無(wú)人機(jī)有限的通信范圍和探測(cè)信息的實(shí)時(shí)回傳,提出了一種基于角色切換策略的多無(wú)人機(jī)協(xié)同區(qū)域搜索方法,基于各無(wú)人機(jī)平臺(tái)的歷史搜索信息和協(xié)同搜索收益,構(gòu)建了多無(wú)人機(jī)協(xié)同區(qū)域搜索模型。
2)通過(guò)改進(jìn)逼近理想解排序法實(shí)現(xiàn)節(jié)點(diǎn)重要性評(píng)估,動(dòng)態(tài)調(diào)整各無(wú)人機(jī)在協(xié)同區(qū)域搜索中的任務(wù)角色,考慮無(wú)人機(jī)數(shù)目變化對(duì)通信拓?fù)涞挠绊?,?shí)現(xiàn)了協(xié)同區(qū)域搜索任務(wù)與網(wǎng)絡(luò)連通性的平衡,仿真結(jié)果表明,無(wú)人機(jī)在保持與地面站通信的前提下,可在150 s內(nèi)完成10個(gè)隨機(jī)分布目標(biāo)的協(xié)同區(qū)域搜索任務(wù)。
3)考慮無(wú)人機(jī)運(yùn)動(dòng)學(xué)約束、通信保持、機(jī)間防撞等約束,依據(jù)任務(wù)角色和鄰居信息,各架無(wú)人機(jī)通過(guò)分布式滾動(dòng)時(shí)域控制完成在線運(yùn)動(dòng)規(guī)劃,確保多無(wú)人機(jī)協(xié)同區(qū)域搜索的可靠飛行控制。
本文中提及的角色切換策略需要整個(gè)搜索集群的相關(guān)信息,實(shí)質(zhì)上是一種集中式的求解方法,而僅依靠鄰居信息建立分布式角色切換策略必然能夠提高協(xié)同搜索的可靠性和執(zhí)行效率,這也是筆者后續(xù)的研究方向。