摘" 要:
面向復(fù)雜城市環(huán)境中的運(yùn)動(dòng)目標(biāo)搜索與打擊任務(wù),單域無人平臺受視野范圍和運(yùn)動(dòng)能力等限制,易出現(xiàn)目標(biāo)遺漏和任務(wù)完成率低的問題。針對這些問題,提出一種面向動(dòng)態(tài)目標(biāo)搜索與打擊的空地協(xié)同自主任務(wù)分配方法,通過結(jié)合無人機(jī)視野范圍廣以及無人車機(jī)動(dòng)性強(qiáng)的特點(diǎn),提升空地?zé)o人系統(tǒng)的任務(wù)執(zhí)行效率和區(qū)域覆蓋率。一方面,針對未知運(yùn)動(dòng)目標(biāo),提出一種基于數(shù)字信息素的目標(biāo)搜索模型,以平臺協(xié)同收益和區(qū)域覆蓋率為優(yōu)化指標(biāo),保證在盡可能短的時(shí)間周期內(nèi)發(fā)現(xiàn)區(qū)域中的所有目標(biāo)。另一方面,面向動(dòng)態(tài)到達(dá)的打擊任務(wù),構(gòu)建基于可行路徑規(guī)劃的任務(wù)分配模型,以平臺能耗和任務(wù)完成時(shí)間為目標(biāo)函數(shù),在保證任務(wù)完成率的同時(shí),提高空地協(xié)同系統(tǒng)的資源利用率。與現(xiàn)有方法相比,所提方法能夠在最短的時(shí)間內(nèi)發(fā)現(xiàn)所有目標(biāo),區(qū)域覆蓋率達(dá)到55%以上,且資源利用率為84.4%。實(shí)驗(yàn)結(jié)果表明,所提方法具備較好的目標(biāo)搜索和任務(wù)執(zhí)行能力。
關(guān)鍵詞:
空地協(xié)同; 數(shù)字信息素; 目標(biāo)搜索; 任務(wù)分配; 路徑規(guī)劃
中圖分類號:
TP 391.9
文獻(xiàn)標(biāo)志碼: A""" DOI:10.12305/j.issn.1001-506X.2024.07.17
Air-ground cooperative autonomous task allocation method for
dynamic target search and strike
FEI Bowen, BAO Weidong*, LIU Daqian, ZHU Xiaomin
(College of Systems Engineering, National University of Defense Technology, Changsha 410073, China)
Abstract:
For the task of moving target search and strike in a complicated urban environment, the single-domain unmanned platform is limited by its field of vision and movement capability, which is easy to cause problems of the target omission and the low task completion rate. To solve these problems, an air-ground cooperative autonomous task allocation method for dynamic target search and strike is proposed. It aims to improve the efficiency of task execution and regional coverage of air-ground unmanned systems by combining the characteristics of the wide field of vision of unmanned aerial vehicles and the strong mobility of unmanned ground vehicles. For unknown moving targets, a target search model based on digital pheromones is proposed, which takes platform cooperation income and regional coverage as optimization metrics to ensure that all targets in the region can be found in the shortest possible time period. In addition, for the dynamic arrival strike task, a task allocation model based on feasible path planning is proposed, which takes the platform energy consumption and task completion time as the objective function to ensure the task completion rate and improve the resource utilization of the air-ground cooperative system. Compared with the existing methods, the proposed method can find all targets in the shortest time. The regional coverage rate can reach more than 55%. And the resource utilization rate is 84.4%. Experimental results show that the proposed method has excellent capabilities for target search and task execution.
Keywords:
air-ground cooperation; digital pheromone; target search; task allocation; path planning
0" 引" 言
隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的持續(xù)發(fā)展,自主性和智能性已經(jīng)成為無人系統(tǒng)研發(fā)的重要趨勢,同時(shí)也是系統(tǒng)研究成果落地的重要指標(biāo)[1]。由于在軍事和民用領(lǐng)域具有廣闊的應(yīng)用前景,智能自主無人系統(tǒng)的研發(fā)受到世界各國的高度重視,特別是在軍事領(lǐng)域中,無人系統(tǒng)被視為未來智能化戰(zhàn)爭的主力軍[2]。在不確定環(huán)境下將多種異構(gòu)、離散的無人資源高效組織、協(xié)同規(guī)劃構(gòu)成一個(gè)有效的閉合環(huán)路,對于自主無人系統(tǒng)的構(gòu)建至關(guān)重要,是推進(jìn)無人系統(tǒng)自主能力發(fā)展的重要一環(huán)。因此,近年來基于多無人平臺協(xié)同優(yōu)化的任務(wù)分配、路徑規(guī)劃方法層出不窮,成為學(xué)者研究的熱點(diǎn)問題之一[34]。
在單域多平臺協(xié)同優(yōu)化方面,余婧等人[5]綜合考慮任務(wù)規(guī)劃的優(yōu)化需求,研究面向多無人機(jī)協(xié)同對地攻擊的雙層任務(wù)規(guī)劃方法。Yao等人[6]提出分布式任務(wù)規(guī)劃框架,以提高分布式多無人機(jī)應(yīng)用中任務(wù)分配和路徑規(guī)劃的性能。各無人機(jī)能夠在路徑規(guī)劃的過程中評估與任務(wù)的匹配度,并對匹配度低的任務(wù)進(jìn)行重規(guī)劃,在獲得更好規(guī)劃結(jié)果的同時(shí),消耗更少的計(jì)算資源。Ye等人[7]研究異構(gòu)無人機(jī)對地面目標(biāo)進(jìn)行防空壓制的協(xié)同多任務(wù)分配問題,提出一種改進(jìn)的遺傳算法(genetic algorithm, GA)與多類型基因染色體編碼策略,提高了多機(jī)協(xié)同任務(wù)分配的效率。Chen等人[8]針對多無人機(jī)協(xié)同任務(wù)分配與航跡規(guī)劃問題,提出基于自適應(yīng)參數(shù)調(diào)整和雙向搜索的蟻群優(yōu)化算法。同時(shí),設(shè)計(jì)了一種預(yù)測交會點(diǎn)的方法解決運(yùn)動(dòng)點(diǎn)不能作為航跡規(guī)劃算法目標(biāo)點(diǎn)的問題。該方法不僅能有效規(guī)劃無人機(jī)的航跡,還進(jìn)一步提升了多無人機(jī)協(xié)同任務(wù)執(zhí)行能力。Wei等人[9]將機(jī)器人團(tuán)隊(duì)的總成本和工作負(fù)載作為優(yōu)化函數(shù),提出一種多目標(biāo)粒子群優(yōu)化(particle swarm optimization, PSO)方法求解多機(jī)器人協(xié)同任務(wù)分配問題,保證了多機(jī)協(xié)同任務(wù)分配的時(shí)效性。Chen等人[10]針對無人機(jī)集群中的動(dòng)態(tài)任務(wù)分配問題,提出基于競標(biāo)拍賣的分配機(jī)制,在保證實(shí)時(shí)任務(wù)高效分配的前提下,改善了算法在不同參數(shù)條件下的適應(yīng)性。Duan等人[11]提出了一種動(dòng)態(tài)離散鴿群優(yōu)化算法規(guī)劃多無人機(jī)協(xié)同搜索、打擊目標(biāo)的軌跡。該算法利用貝葉斯公式構(gòu)造并更新概率圖來指導(dǎo)后續(xù)搜索運(yùn)動(dòng),并在執(zhí)行打擊任務(wù)時(shí)采用響應(yīng)閾值Sigmoid模型進(jìn)行目標(biāo)分配,提高了無人機(jī)編隊(duì)的搜索效率。李翰等人[12]針對城市區(qū)域多無人機(jī)協(xié)同物流任務(wù)分配問題,綜合考慮經(jīng)濟(jì)成本、時(shí)間損失等指標(biāo),提出多無人機(jī)協(xié)同物流任務(wù)分配模型,并引入量子粒子群算法進(jìn)行模型求解。然而,單域無人平臺受視野范圍、地形地貌等因素的影響,易導(dǎo)致區(qū)域不可達(dá)和目標(biāo)遺漏問題。
在跨域異構(gòu)多平臺協(xié)同優(yōu)化方面,考慮到異構(gòu)無人機(jī)和無人車的不同動(dòng)力學(xué)特性,Luo等人[13]提出一種改進(jìn)的人工物理方法,針對不同任務(wù)類型協(xié)調(diào)無人機(jī)和無人車到達(dá)不同目標(biāo)區(qū)域,提高了任務(wù)分配的完成率。Ni等人[14]圍繞無人機(jī)/無人車協(xié)同遂行多任務(wù)問題,提出一種階段集成的機(jī)制,將多無人平臺協(xié)同控制分為多個(gè)子階段,從而完成空地協(xié)同任務(wù)分配過程。在此基礎(chǔ)上,Ni等人[15]基于改進(jìn)的蜻蜓算法(dragonfly algorithm, DA),建立多機(jī)器人三維動(dòng)態(tài)運(yùn)動(dòng)模型,并根據(jù)仿生神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的活動(dòng)優(yōu)化機(jī)器人的運(yùn)動(dòng),提出了面向異構(gòu)多機(jī)器人的實(shí)時(shí)路徑規(guī)劃方法。面向指定區(qū)域覆蓋問題,Wu等人[16]提出基于空地協(xié)同的路徑規(guī)劃方法,將任務(wù)完成時(shí)間和行進(jìn)距離作為目標(biāo)函數(shù),并設(shè)計(jì)基于分布估計(jì)算法(estimation of distribution algorithm, EDA)和GA的混合算法進(jìn)行求解。仿真結(jié)果證明混合EDA-GA算法能夠極大地提高求解質(zhì)量。梁星星等人[17]構(gòu)建面向海上移動(dòng)目標(biāo)的空天協(xié)同連續(xù)觀測模型,并對衛(wèi)星規(guī)劃、無人機(jī)路徑規(guī)劃等多個(gè)子問題進(jìn)行建模求解,該模型能夠有效降低目標(biāo)的平均觀測周期。另一方面,Li等人[18]將執(zhí)行任務(wù)的總體時(shí)間作為優(yōu)化指標(biāo),提出一種兩級文化基因算法求解無人平臺的路徑規(guī)劃問題。該算法在非法城市建筑探測任務(wù)方面取得了較好的路徑規(guī)劃結(jié)果。為了提高空天觀測資源協(xié)同觀測能力,李夏苗等人[19]提出一種兩階段迭代優(yōu)化方法,并結(jié)合禁忌表策略對任務(wù)分配方案進(jìn)行迭代調(diào)整和更新。該方法在任務(wù)收益率方面具有較大優(yōu)勢,能夠有效解決觀測資源協(xié)同任務(wù)規(guī)劃問題。
綜上所述,現(xiàn)有的研究方法在跨域異構(gòu)多平臺組織協(xié)同方面均取得了較好的任務(wù)完成率。 然而,在現(xiàn)實(shí)城市環(huán)境中,仍然存在以下問題急需解決:① 當(dāng)目標(biāo)位置動(dòng)態(tài)變化且運(yùn)動(dòng)狀態(tài)、軌跡未知時(shí),如何組織異構(gòu)無人平臺進(jìn)行協(xié)同搜索,避免目標(biāo)遺漏。② 由于跨域無人平臺的異構(gòu)性,如何根據(jù)平臺的特點(diǎn)設(shè)置最優(yōu)分配方式,在保證任務(wù)完成率的同時(shí),提升平臺之間的協(xié)同效率。針對上述問題,本文提出了面向動(dòng)態(tài)目標(biāo)搜索與打擊的空地協(xié)同自主任務(wù)分配(air-ground cooperative autonomous task allocation, AGENTS)方法。具體而言,考慮跨域無人平臺視野覆蓋優(yōu)勢和區(qū)域監(jiān)視能力,提出一種改進(jìn)的基于數(shù)字信息素圖的目標(biāo)搜索模型,提高多平臺協(xié)同目標(biāo)搜索能力。在此基礎(chǔ)上,鑒于異構(gòu)無人平臺的特點(diǎn),建立面向系統(tǒng)能耗和任務(wù)時(shí)效雙重指標(biāo)的空地協(xié)同任務(wù)分配模型,提升平臺協(xié)同任務(wù)執(zhí)行能力。同時(shí),為了發(fā)揮空地?zé)o人系統(tǒng)的機(jī)動(dòng)性,本文設(shè)定無人機(jī)和無人車均進(jìn)行變速運(yùn)動(dòng),以滿足未知目標(biāo)的動(dòng)態(tài)變化,保證各平臺能夠完成被分配的實(shí)時(shí)任務(wù)。
本文的創(chuàng)新之處如下:
(1) 針對無人平臺異構(gòu)性、目標(biāo)任務(wù)多樣性的問題,建立面向動(dòng)態(tài)任務(wù)的空地協(xié)同組織架構(gòu),綜合考慮任務(wù)需求、平臺狀態(tài)等因素,旨在增強(qiáng)異構(gòu)平臺與任務(wù)間的匹配度,從而提高多平臺協(xié)同遂行任務(wù)的效率。
(2) 面向未知環(huán)境中的動(dòng)態(tài)目標(biāo),提出基于信息素圖的協(xié)同搜索模型,將多平臺的協(xié)同收益和區(qū)域覆蓋率作為優(yōu)化指標(biāo),提升空地協(xié)同編隊(duì)的目標(biāo)搜索能力。
(3) 針對多無人平臺任務(wù)分配問題,提出面向動(dòng)態(tài)任務(wù)的組織分配模型,以平臺能耗和最短任務(wù)完成時(shí)間為目標(biāo),在保證任務(wù)完成率的同時(shí),提高各平臺的資源利用率。
1" 系統(tǒng)架構(gòu)與模型基礎(chǔ)
在本節(jié)中,首先對建立的空地協(xié)同組織架構(gòu)進(jìn)行描述,然后分別對架構(gòu)中的城市環(huán)境模型、運(yùn)動(dòng)目標(biāo)模型以及無人平臺模型進(jìn)行詳細(xì)說明。
1.1 "系統(tǒng)架構(gòu)
面向指定區(qū)域的目標(biāo)打擊任務(wù),動(dòng)態(tài)任務(wù)分配系統(tǒng)要求盡可能多地找出區(qū)域內(nèi)的運(yùn)動(dòng)目標(biāo),并根據(jù)空地?zé)o人平臺的性能,組織編隊(duì)對目標(biāo)進(jìn)行合力打擊。針對單域平臺受視野范圍等因素的影響,提出基于空地協(xié)同的協(xié)同組織架構(gòu),以提高多平臺協(xié)同遂行任務(wù)的效率,該架構(gòu)的組織結(jié)構(gòu)如圖1所示。
該架構(gòu)的主要功能模塊包括:
(1) 目標(biāo)搜索模塊。未知城市區(qū)域中目標(biāo)的位置和數(shù)量通常無法獲知,因此目標(biāo)搜索是協(xié)同打擊的前提。本文利用數(shù)字信息素圖組織空地?zé)o人平臺進(jìn)行目標(biāo)搜索。為了在有效時(shí)間內(nèi)發(fā)現(xiàn)區(qū)域內(nèi)的所有目標(biāo),以基于信息素圖的平臺協(xié)同收益和基于多平臺檢測范圍的區(qū)域覆蓋率為優(yōu)化指標(biāo),提升空地?zé)o人系統(tǒng)的協(xié)同搜索能力。
(2) 任務(wù)分配模塊。當(dāng)無人平臺發(fā)現(xiàn)目標(biāo)后,收集目標(biāo)位置及打擊目標(biāo)載彈量需求等信息,以平臺能耗和最短任務(wù)完成時(shí)間為目標(biāo)函數(shù),建立面向動(dòng)態(tài)任務(wù)的優(yōu)化模型。具體而言,首先計(jì)算各無打擊任務(wù)的平臺與目標(biāo)間的可行路徑距離,然后以最大行進(jìn)速度為依據(jù)計(jì)算平臺的最短到達(dá)時(shí)間,最后在滿足打擊任務(wù)約束的前提下選擇最優(yōu)數(shù)量的平臺參與打擊,提高各無人平臺的資源利用率。
1.2" 城市環(huán)境模型
本文以城市環(huán)境為背景,利用NUAV架無人機(jī)和NUGV輛無人車組成編隊(duì)對未知區(qū)域Ω執(zhí)行目標(biāo)搜索和打擊任務(wù)。假定該區(qū)域中包含M個(gè)運(yùn)動(dòng)目標(biāo)。為了更加貼近實(shí)際城市環(huán)境,本文在區(qū)域中設(shè)置了建筑物、城建區(qū)域以及街道等約束限制,增加對無人平臺的運(yùn)動(dòng)和感知約束。一方面,這些約束限制了無人平臺的運(yùn)動(dòng)范圍、減少了平臺的可行路徑,從而增加目標(biāo)搜索和打擊任務(wù)的難度。另一方面,這些約束限制了平臺的感知能力,對于依靠視覺捕獲目標(biāo)的無人平臺而言,當(dāng)攝像頭與目標(biāo)連線上出現(xiàn)障礙物時(shí),平臺因目標(biāo)部分特征消失而無法感知到目標(biāo)。
為了便于描述目標(biāo)搜索與打擊過程,對區(qū)域Ω進(jìn)行柵格化等分處理,分割為NL×NW個(gè)柵格,柵格地圖如圖2所示。在圖2中,假設(shè)該區(qū)域的長和寬分別為L和W,每個(gè)柵格g的大小為Δl×Δw。藍(lán)色長方體表示城市建筑物,其占地面積為9個(gè)柵格,白色矩形框?yàn)槌墙▍^(qū)域,同樣占據(jù)9個(gè)柵格。與此同時(shí),為了簡化目標(biāo)識別過程,設(shè)定無人機(jī)編隊(duì)均等高飛行,且搭載的目標(biāo)檢測攝像頭均垂直向下,其發(fā)現(xiàn)范圍為9個(gè)柵格(圖2中的淺藍(lán)色區(qū)域)。相應(yīng)地,橘黃色柵格表示地面無人車的發(fā)現(xiàn)范圍,即僅有發(fā)現(xiàn)前方一個(gè)柵格內(nèi)的目標(biāo)。由柵格的可達(dá)性,每個(gè)柵格g(m,n)可賦值為
g(m,n)=0, g(m,n)∈可達(dá)區(qū)域
1, 其他(1)
式中:(m,n)為柵格g(m,n)在地圖中的編號索引(m∈[1,NL],n∈[1,NW])。
1.3" 運(yùn)動(dòng)目標(biāo)模型
為了增加目標(biāo)搜索和打擊任務(wù)的挑戰(zhàn)性,本文參考文獻(xiàn)[20]在區(qū)域Ω中設(shè)置了不同運(yùn)動(dòng)狀態(tài)的目標(biāo),并將目標(biāo)模型的結(jié)構(gòu)體定義為
Targeti={type,movingdirection,trackset(),
foundflag,strikeflag},i∈[1,M](2)
式中:type為目標(biāo)類型;movingdirection表示目標(biāo)的運(yùn)動(dòng)方向,在基于柵格化的路徑規(guī)劃過程中,目標(biāo)只能在道路上運(yùn)動(dòng),不能穿過建筑物和城建區(qū)域,將目標(biāo)在相鄰時(shí)刻的行進(jìn)方向表示如圖3所示。具體標(biāo)號含義如下:“0”表示向前;“1”表示向右;“2”表示向后;“3”表示向左。 trackset()為目標(biāo)運(yùn)動(dòng)軌跡,記錄目標(biāo)走過的位置坐標(biāo);foundflag為被發(fā)現(xiàn)標(biāo)志,記錄目標(biāo)被發(fā)現(xiàn)的時(shí)間周期;strikeflag為被打擊標(biāo)志,記錄目標(biāo)被打擊的時(shí)間。
1.4" 無人平臺模型
假設(shè)每一時(shí)刻同一柵格最多只存在一個(gè)目標(biāo),每個(gè)無人平臺利用機(jī)載攝像頭對區(qū)域Ω中的各柵格執(zhí)行搜索與打擊任務(wù),其行進(jìn)軌跡由轉(zhuǎn)彎半徑和速度所決定[2122],即
UVi(t)=[xi(t),yi(t),di(t)](3)
式中:xi(t)、yi(t)表示第t時(shí)刻第i個(gè)平臺在區(qū)域Ω中的二維位置坐標(biāo);di(t)表示轉(zhuǎn)動(dòng)方向。需要指出的是,無人機(jī)能夠穿過城建區(qū)域,但僅遇到建筑物則需要繞行,因此在相鄰時(shí)刻的航行方向設(shè)置為八鏈碼方向。而無人車則無論遇到城建區(qū)域還是建筑物均需要繞行,因此其在相鄰時(shí)刻的行進(jìn)方向設(shè)置與目標(biāo)相同,為4個(gè)方向,具體表示如圖3所示。無人平臺的運(yùn)動(dòng)狀態(tài)表達(dá)式為
xi(t+1)=xi(t)+vΔtsin θ
yi(t+1)=yi(t)+vΔtcos θ
d(t+1)=d(t)+Δd(4)
式中:v為無人平臺的行進(jìn)速度;θ為轉(zhuǎn)向角,(無人機(jī)轉(zhuǎn)向角θUAV∈[-180°,-135°,-90°,45°,0°,45°,90°,135°],無人車轉(zhuǎn)向角θUGV∈[-180°,-90°,0°,90°])。因此,無人平臺的模型結(jié)構(gòu)可表示為
UVi={type,movingdirection,sign,bombload,
trackset(),foundflag,strikenum},i∈[1,NUAV+NUGV](5)
式中:type為平臺類型,即無人機(jī)或無人車;movingdirection表示平臺的運(yùn)動(dòng)方向;sign表示平臺的任務(wù)類型,具體分為搜索任務(wù)、監(jiān)視任務(wù)和打擊任務(wù);bombload為平臺載彈量, 若載彈量為0,則該平臺只能執(zhí)行搜索和監(jiān)視任務(wù);trackset()為平臺運(yùn)動(dòng)軌跡,記錄走過的位置坐標(biāo);foundnum記錄該平臺進(jìn)行搜索發(fā)現(xiàn)的目標(biāo)編號序列;strikenum記錄該平臺進(jìn)行打擊任務(wù)的目標(biāo)編號序列。
2 "目標(biāo)搜索建模
根據(jù)建立的柵格化地圖,本文通過賦予柵格各類數(shù)字信息素濃度引導(dǎo)無人平臺進(jìn)行目標(biāo)搜索任務(wù)。假設(shè)動(dòng)態(tài)目標(biāo)如果出現(xiàn)在無人平臺的視野覆蓋區(qū)域內(nèi),則認(rèn)定該平臺發(fā)現(xiàn)了這個(gè)目標(biāo)。因此,在目標(biāo)搜索的過程中,算法旨在引導(dǎo)空地?zé)o人平臺在有限時(shí)間內(nèi)盡可能多地找到運(yùn)動(dòng)目標(biāo),同時(shí)使平臺的柵格覆蓋率最大,以更好地掌握該城市區(qū)域的路況信息。
2.1" 數(shù)字信息素
基于數(shù)字信息素的搜索算法首先構(gòu)造初始人工勢場,引導(dǎo)控制無人平臺的行進(jìn)方向。然后,隨著搜索任務(wù)的深入,無人平臺會在地圖上釋放信息素,以不斷更新初始數(shù)字信息素圖。該算法的特點(diǎn)是能夠根據(jù)吸引信息素濃度,引導(dǎo)無人平臺快速覆蓋城市區(qū)域,且根據(jù)排斥信息素濃度促使各平臺的路徑盡可能不重復(fù),“不走冤枉路”的特點(diǎn)。與此同時(shí),根據(jù)設(shè)定的優(yōu)化指標(biāo)引導(dǎo)無人平臺規(guī)劃航路和協(xié)同決策,高效地完成目標(biāo)搜索過程。
(1) 吸引信息素
為降低任務(wù)區(qū)域Ω的不確定度,引入吸引信息素概念[2324]。假設(shè)Sa(k)=(sa(m,n,k))L×W為第k個(gè)預(yù)測周期的吸引信息素矩陣,其中sa(m,n,k)表示柵格g的吸引信息素濃度,其初始值為常數(shù)。吸引信息素的更新規(guī)則為
Sa(k)=(1-Ea)((1-Ga)[Sa(k-1)+
da(E-V)]+GPa(k))(6)
式中:Ea和Ga分別代表吸引信息素的揮發(fā)系數(shù)和傳播系數(shù);da是吸引信息素釋放的常數(shù);GPa(k)是吸引信息素的傳播矩陣;E為單位矩陣;V=(vmn)L×W是一個(gè)特殊的二值矩陣,其元素均等于0或1。 當(dāng)且僅當(dāng)上一個(gè)預(yù)測周期內(nèi)至少任意一個(gè)無人機(jī)搜索g時(shí),vmn=0。GPa(k)=(gpa(m,n,k))L×W是在(k-1,k]時(shí)段從相鄰柵格到g的信息濃度,gpa(m,n,k)的計(jì)算公式為
gpa(m,n,k)=Ga1Lmn∑gmn∈Usa(x,y,k-1)+da(7)
式中: U是g的相鄰柵格集合;gmn∈U是該柵格的相鄰柵格之一;Lmn是相鄰柵格的總數(shù)。吸引信息素僅在無人平臺未搜索的柵格中釋放。通過吸引信息素,平臺能夠被引導(dǎo)到未經(jīng)搜索的柵格中。
(2) 排斥信息素
為避免平臺間重復(fù)搜索已搜索過的柵格, 引入排斥信息素,其更新規(guī)則與吸引信息素相對應(yīng),即設(shè)定Sr(k)=(sr(m,n,k))L×W為第k個(gè)預(yù)測周期的排斥信息素矩陣,其中sr(m,n,k)在第k個(gè)周期的排斥信息素濃度,其更新規(guī)則為
Sr(k)=(1-Er)((1-Gr)[Sr(k-1)+drV]+GPr(k))(8)
式中:Er和Gr代表排斥信息素的揮發(fā)系數(shù)和傳播系數(shù);dr是吸引信息素釋放的常數(shù);GPr(k)是傳播矩陣。GPr(k)=(gpr(m,n,k))L×W是在(k-1,k]時(shí)段從相鄰柵格到g的信息濃度,gpr(m,n,k)的計(jì)算公式為
gpr(m,n,k)=Gr1Lmn∑gmn∈Usr(x,y,k-1)+dr(9)
需要指出的是,排斥信息素只在上一個(gè)預(yù)測周期訪問的柵格中釋放,利用排斥信息素能夠避免重復(fù)搜索柵格。兩種信息素的傳播示例如圖4 所示,藍(lán)色框表示建筑物,其信息素值始終為0。 從圖4可以看出,兩種信息素互斥,在吸引信息素中無人平臺未走過的區(qū)域均為黃色,置信度最高(其值為1),而走過的區(qū)域則置信度較低,說明其信息素濃度低,對平臺的吸引力相對較低。相反地,在排斥信息素中未走過的區(qū)域均為淺綠色,置信度均在0.6左右,而平臺走過的區(qū)域呈黃色,即當(dāng)前預(yù)測周期將不會考慮這些柵格。
2.2" 優(yōu)化指標(biāo)
利用第2.1節(jié)建立的數(shù)字信息素,綜合考慮多平臺間的協(xié)同能力和區(qū)域覆蓋能力,建立基于平臺協(xié)同收益和區(qū)域覆蓋率的優(yōu)化指標(biāo),具體描述如下。
(1) 平臺協(xié)同收益
基于數(shù)字信息素圖中吸引信息素和排斥信息素的釋放與稀釋,平臺間的協(xié)同收益性能指標(biāo)Jc(k)定義如下:
Jc(q)=∑Nk=1[e1-kN(sa(q+k)-sr(q+k))](10)
式中:N是預(yù)測總步長;sa(q+k)和sr(q+k)分別代表了q時(shí)刻各平臺在第k個(gè)預(yù)測周期下所處柵格的吸引信息素和排斥信息素值。Jc(q)中吸引信息素可引導(dǎo)平臺搜索未知柵格,排斥信息素可避免重復(fù)搜索歷史柵格,在這兩種信息素的作用下,多無人平臺可盡量不重復(fù)地搜索柵格,從而高效搜索任務(wù)區(qū)域。
(2) 區(qū)域覆蓋率
在限定的時(shí)間周期內(nèi),為了更好地掌握城市區(qū)域的結(jié)構(gòu)信息,空地協(xié)同搜索應(yīng)保證每一時(shí)刻平臺的整體區(qū)域覆蓋率最大化,即盡可能多地探測區(qū)域信息。平臺間的區(qū)域覆蓋率指標(biāo)Jo(q)定義如下:
Jo(q)=∑Nk=1(N-k+1)2N·∑NUAVi=1R′i+∑NUGVj=1R′jNUAVRUAV+NUGVRUGV(11)
式中:(N-k+1)2/N為預(yù)測時(shí)間域的動(dòng)態(tài)系數(shù), 由于目標(biāo)動(dòng)態(tài)性,預(yù)測周期越長則區(qū)域覆蓋利用度越低,因此使用動(dòng)態(tài)系數(shù)平衡計(jì)算覆蓋利用率受預(yù)測周期長度的影響。NUAV表示無人機(jī)總數(shù)量,NUGV表示無人車總數(shù)量,NUAV+NUGV=N;RUAV示理想情況下無人機(jī)的區(qū)域覆蓋面積,R′i表示在當(dāng)前周期下第i個(gè)無人機(jī)UAVi去除建筑物遮擋后的實(shí)際區(qū)域覆蓋面積。相應(yīng)地,RUGV理想情況下無人車的區(qū)域覆蓋面積,R′j表示在當(dāng)前周期下第j個(gè)無人車UGVj去除與無人機(jī)發(fā)生重復(fù)覆蓋后的實(shí)際覆蓋面積。
max Js(q)=max[λ1Jc(q)+λ2Jo(q)](12)
式中:λ1和λ2分別是協(xié)同收益和覆蓋率的歸一化權(quán)重系數(shù)。Js體現(xiàn)了當(dāng)前周期下多平臺的整體性能優(yōu)劣,基于加深迭代策略,每次迭代Js都會有不同程度的提高,待迭代結(jié)果穩(wěn)定后的取值即為當(dāng)前預(yù)測周期的最優(yōu)解。
3" 任務(wù)分配建模
當(dāng)無人平臺發(fā)現(xiàn)目標(biāo)后,根據(jù)實(shí)時(shí)收集的目標(biāo)信息,建立空地協(xié)同優(yōu)化模型進(jìn)行任務(wù)分配。在任務(wù)分配的過程中,假設(shè)一旦目標(biāo)被無人平臺發(fā)現(xiàn),則該目標(biāo)將不再運(yùn)動(dòng),從而根據(jù)目標(biāo)的位置和載彈量要求,以平臺能耗和最短任務(wù)完成時(shí)間為目標(biāo),建立面向動(dòng)態(tài)任務(wù)的優(yōu)化模型,實(shí)現(xiàn)對目標(biāo)的精準(zhǔn)打擊。在此基礎(chǔ)上,利用A*算法[2526]動(dòng)態(tài)規(guī)劃各無人平臺達(dá)到目標(biāo)點(diǎn)的行進(jìn)路徑,確保打擊路徑的可行性。
3.1" 目標(biāo)函數(shù)
在任務(wù)分配的模型中,設(shè)定平臺能耗和最短任務(wù)完成時(shí)間為目標(biāo)函數(shù),具體定義如下。
(1) 平臺能耗
由于機(jī)載電池的限制,追求更低的行進(jìn)成本是空地?zé)o人平臺遂行任務(wù)的首要目標(biāo),決定著精準(zhǔn)打擊任務(wù)的成敗。平臺能耗是指面向動(dòng)態(tài)到達(dá)的任務(wù),無人平臺由起止點(diǎn)達(dá)到目的地的過程中產(chǎn)生的能量消耗,包括電池能耗、機(jī)電損耗等方面[27],平臺能耗的定義為
C1=∑NUAVi=1ηiDisigni+∑NUGVj=1ηjDjsignj(13)
式中:ηi表示UAVi在單位飛行距離的能量消耗;ηj表示UGVj的單位能耗;D為無人平臺的行進(jìn)距離;sign為分配決策變量,其表達(dá)式為
signi=1, i∈搜索任務(wù)
2, i∈監(jiān)視任務(wù)
3, i∈打擊任務(wù)(14)
式中:“1”表示當(dāng)前平臺在執(zhí)行搜索任務(wù),能夠被分配打擊任務(wù);“2”表示當(dāng)前平臺由于機(jī)載彈量不滿足打擊要求,處于目標(biāo)監(jiān)視狀態(tài),等待其他平臺輔助打擊,此時(shí)該平臺不能參與其他打擊任務(wù);“3”表示當(dāng)前平臺在執(zhí)行打擊任務(wù),不能參與其他打擊任務(wù)。因此,只有當(dāng)signi=1時(shí),當(dāng)前無人機(jī)才能夠參與任務(wù)分配, 作為優(yōu)化模型的輸入。
(2) 最短任務(wù)完成時(shí)間
執(zhí)行時(shí)效性是動(dòng)態(tài)任務(wù)分配模型必須要考慮的因素,特別是面向動(dòng)態(tài)目標(biāo)的打擊任務(wù),一旦錯(cuò)失最佳打擊時(shí)間,后果將不堪設(shè)想。因此, 在本文的動(dòng)態(tài)任務(wù)分配過程中,希望到達(dá)的實(shí)時(shí)任務(wù)能夠在盡可能短的時(shí)間內(nèi)完成,從而保證任務(wù)的時(shí)效性要求。最短任務(wù)完成時(shí)間的定義為
C2=∑NUAVi=1DisignivmaxUAV+∑NUGVj=1DjsignjvmaxUGV(15)
式中:vmaxUAV和vmaxUGV分別表示無人機(jī)和無人車的最大行進(jìn)速度。綜合考慮上述兩種優(yōu)化指標(biāo),動(dòng)態(tài)任務(wù)分配的目標(biāo)函數(shù)C可表示為
min C=min(α1C1+α2C2)(16)
式中:α1和α2為歸一化權(quán)重系數(shù),α1+α2=1。
3.2" 約束條件
在空地協(xié)同執(zhí)行任務(wù)的過程中,應(yīng)對平臺間的安全距離、載彈量以及區(qū)域環(huán)境進(jìn)行約束判斷,避免發(fā)生路徑不可達(dá)、平臺損毀等問題。這3項(xiàng)約束的具體表達(dá)式如下。
(1) 安全距離約束
在空地協(xié)同執(zhí)行任務(wù)過程中,為了避免同域(空域或地域)平臺發(fā)生碰撞,對多機(jī)和多車之間的距離要求是十分必要的[2829]。為了簡化對無人平臺間的安全距離統(tǒng)計(jì)的描述,將所有無人機(jī)和無人車進(jìn)行數(shù)字標(biāo)號,并按升序依次計(jì)算兩平臺間的距離,具體計(jì)算公式如下:
UAVΔxi,k=(xi,t-xk,t)2
Δyi,k=(yi,t-yk,t)2
Δxi,k+Δyi,k≥dminUAVi=1,2,…,NUAV-1
k=i+1,i+2,…,NUAV(17)
UGVΔxj,k=(xj,t-xk,t)2
Δyj,k=(yj,t-yk,t)2
Δxj,k+Δyj,k≥dminUGVj=1,2,…,NUGV-1
k=j+1,j+2,…,NUGV(18)
式中:UAV和UGV分別表示針對無人機(jī)和無人車的安全距離統(tǒng)計(jì);dminUAV和dminUGV均為常數(shù),分別表示無人機(jī)和無人車編隊(duì)的最小安全距離。
(2) 不可達(dá)區(qū)域約束
在城市環(huán)境中,不可達(dá)區(qū)域是十分重要的問題,直接決定著優(yōu)化模型的實(shí)用性。在本文中, 無人機(jī)主要設(shè)定的不可達(dá)區(qū)域?yàn)榻ㄖ?,即無人機(jī)在執(zhí)行任務(wù)時(shí)必須繞過建筑物。而無人車的不可達(dá)區(qū)域?yàn)榻ㄖ锖统墙▍^(qū)域,即僅能在街道上行進(jìn)。因此,不可達(dá)區(qū)域的表達(dá)式為
(xUAVi,t,yUAVi,t)建筑物, i=1,2,…,NUAV
(xUGVj,t,yUGVj,t)∈街道, j=1,2,…,NUGV
(19)
(3) 載彈量約束
在動(dòng)態(tài)任務(wù)分配過程中,本文主要面向打擊任務(wù),因此平臺載彈量是十分必要的前提。若平臺的載彈量為0,則該平臺不能參與任務(wù)分配, 只能執(zhí)行目標(biāo)搜索和監(jiān)視任務(wù)。在此基礎(chǔ)上,被安排執(zhí)行打擊任務(wù)的多平臺還應(yīng)滿足以下約束條件:
∑NUAVi=1strikei,t+∑NUGVj=1strikej,t≥striketarget(20)
式中:strikei,t為無人平臺i在第t時(shí)刻的載彈量;striketarget為被發(fā)現(xiàn)目標(biāo)所需的打擊量。
3.3 "協(xié)同優(yōu)化模型
基于上述對目標(biāo)模型和約束條件的描述,整合得到面向動(dòng)態(tài)任務(wù)的協(xié)同優(yōu)化模型如下:
min C=min(α1C1+α2C2)
s.t. Δxi,k+Δyi,k≥dminUAV
Δxj,k+Δyj,k≥dminUGV
(xUAVi,t,yUAVi,t)建筑物
(xUGVj,t,yUGVj,t)∈街道
∑NUAVi=1strikei,t+∑NUGVj=1strikej,t≥striketarget(21)
當(dāng)動(dòng)態(tài)打擊任務(wù)到達(dá)時(shí),載彈量和任務(wù)類型是首要考慮的問題,若平臺載彈量為0或任務(wù)類型不為搜索任務(wù),則不參與本次分配。求解上述優(yōu)化模型的關(guān)鍵是計(jì)算各無人平臺到達(dá)目標(biāo)點(diǎn)的可行路徑,為了滿足任務(wù)分配的時(shí)效性,本文利用A*算法計(jì)算各平臺的可行路徑,通過平臺的當(dāng)前位置(起點(diǎn))、目標(biāo)位置(終點(diǎn))以及經(jīng)過目標(biāo)搜索建立的城市路障信息進(jìn)行解算,從而得到各平臺的可行路徑。
4" 算法實(shí)現(xiàn)
在本節(jié)中,首先對城市環(huán)境中的動(dòng)態(tài)目標(biāo)搜索和任務(wù)分配算法進(jìn)行介紹,并給出相應(yīng)的算法步驟說明。
4.1" 目標(biāo)搜索算法
本文引入數(shù)字信息素圖對未知城市區(qū)域進(jìn)行動(dòng)態(tài)目標(biāo)搜索,具體實(shí)現(xiàn)流程如算法1所示。
算法 1" 目標(biāo)搜索算法
1初始化信息素參數(shù);
2初始化平臺和目標(biāo)的運(yùn)動(dòng)狀態(tài)及屬性;
3foundt←0;
4while foundtlt;M do
5" for i=1 to NUAV+NUGV do
6" if UVi.tasktype==1 then
7""" all_path←get_path(UVi,N);
8""" Js←0;
9""" (xi,t-1,yi,t-1)=(xi,t,yi,t);
10""" UVi.strackset()←(xi,t-1,yi,t-1);
11""" 判斷UVi檢測范圍內(nèi)是否包含目標(biāo);
12""" if UVi.foundnum==1 then
13"""" foundt=foundt+1;
14""" end if
15""" 共享UVi檢測信息;
16" else
17""" 任務(wù)分配算法();
18" end if
19" end for
20" 利用式(6)和式(8)更新Sa和Sr;
21" for i=1 to NUAV+NUGV do
22" for k=1 to N do
23"""" 利用式(4)規(guī)劃下一時(shí)刻平臺UVi的可行位置點(diǎn);
24"""" 利用式(12)計(jì)算Js(k);
25"""" get_path(UVi,N)←Js(k);
26" end for
27" (xi,t,yi,t)←max Js;
28" end for
29end while
在算法1中,首先初始化數(shù)字信息素參數(shù)以及無人平臺和目標(biāo)的運(yùn)動(dòng)狀態(tài)。其次,設(shè)置初始發(fā)現(xiàn)目標(biāo)數(shù)foundt為0,開始目標(biāo)搜索任務(wù)。在初始搜索中, 將UVi在t-1時(shí)刻的位置進(jìn)行賦值,并加入到運(yùn)動(dòng)軌跡序列UVi.strackset()中。根據(jù)無人機(jī)和無人車的不同檢測范圍(見圖2),判斷UVi檢測范圍內(nèi)是否包含目標(biāo)。若包含運(yùn)動(dòng)目標(biāo),則將UVi.foundnum的值賦為1,同時(shí)更新發(fā)現(xiàn)目標(biāo)數(shù),即foundt=foundt+1。然后,在全局?jǐn)?shù)字地圖上共享UVi檢測信息。在此基礎(chǔ)上,利用所有平臺的位置信息通過式(6)和式(8)分別更新吸引信息素Sa和排斥信息素Sr。在平臺UVi的位置更新方面,利用基于平臺協(xié)同收益和區(qū)域覆蓋率的雙重指標(biāo)進(jìn)行優(yōu)化計(jì)算。設(shè)置平臺的位移步長為N,利用式(4)計(jì)算UVi的所有相鄰可行位置點(diǎn)組合(除去不可達(dá)區(qū)域),通過式(12)計(jì)算各個(gè)組合的指標(biāo)值。最后,將具有最優(yōu)指標(biāo)值的可行位置點(diǎn)賦值于UVi。反復(fù)上述過程,直至所有運(yùn)動(dòng)目標(biāo)被找到,完成空地?zé)o人平臺的搜索任務(wù)。
4.2" 任務(wù)分配算法
當(dāng)無人平臺發(fā)現(xiàn)目標(biāo)后,任務(wù)分配算法被觸發(fā),整合無人資源對目標(biāo)進(jìn)行打擊操作,該算法的具體實(shí)現(xiàn)流程如算法2所示。
算法 2" 任務(wù)分配算法
1確定目標(biāo)位置及打擊量;
2AP()←[];
3for i=1 to NUAV+NUGV do
4if UVi.bombloadlt;1 or UVi.tasktype!=1 do
5" continue;
6" else
7" 利用A*計(jì)算UVi到達(dá)目標(biāo)點(diǎn)的可行路徑APi();
8" end if
9end for
10根據(jù)路徑的距離對AP()進(jìn)行降序排列;
11計(jì)算滿足式(21)的最少平臺數(shù)量num;
12保存相應(yīng)的type、ID、AP();
13for inum=1 to num do
14" if typeinum==UAV then
15"" tstrike(inum)=AP()/vmaxUAV;
16" else
17"" tstrike(inum)=AP()/vmaxUGV;
18" end if
19end for
20for i=1 to NUAV+NUGV do
21" if ID==i then
22" if UVi.taskflag==2 and UVi.bombloadlt;1 then
23"""" twait=min(tstrike);
24"""" if twaitgt;0 then
25""""" (xi,t-1,yi,t-1)=(xi,t,yi,t);
26""""" UVi.strackset()←(xi,t-1,yi,t-1);
27""""" twait=twait-1;
28"""" else
29""""" UVi.taskflag=1
30"""" end if
31" elif UVi.taskflag==2 and UVi.bombload≥1 then
32"""" twait=max(tstrike);
33"""" if twait≥1 then
34""""" (xi,t-1,yi,t-1)=(xi,t,yi,t);
35""""" UVi.strackset()←(xi,t-1,yi,t-1);
36""""" twait=twait-1;
37"""" else
38""""" UVi.taskflag=1
39"""" end if
40" else
41"""" twait=max(tstrike);
42"""" while twait≥1 do
43""""" if AP()==[] then
44""""" (xi,t-1,yi,t-1)=(xi,t,yi,t);
45"""""" UVi.strackset()←(xi,t-1,yi,t-1);
46""""" else
47""""" (xi,t,yi,t)←AP(1);
48"""""" AP(1)←AP(1+vmaxUV);
49""""" (xi,t-1,yi,t-1)=(xi,t,yi,t);
50"""""" UVi.strackset()←(xi,t-1,yi,t-1);
51""""" end if
52""""" twait=twait-1;
53"""" end while
54"""" UVi.taskflag=1;
55" end if
56" end if
57end for
在任務(wù)分配執(zhí)行前,利用搜索算法確定目標(biāo)的實(shí)時(shí)位置和打擊量。在分配算法中,首先對所有平臺進(jìn)行遍歷,若平臺的載彈量為0或已分配其他打擊任務(wù)(UVi.tasktype !=1),則在本次分配中刪去該平臺,增加任務(wù)的執(zhí)行效率。其次,利用A*算法對剩余的無人平臺進(jìn)行路徑規(guī)劃,并記錄各平臺的可行軌跡點(diǎn)集AP()。將記錄的軌跡點(diǎn)集進(jìn)行降序排列,利用建立的優(yōu)化函數(shù)進(jìn)行優(yōu)化求解,得到滿足目標(biāo)打擊量的平臺屬性。然后,根據(jù)選用無人平臺的type計(jì)算達(dá)到目標(biāo)點(diǎn)所需要的時(shí)間。對于被選中的平臺UVi,若UVi.taskflag==2并且UVi.bombloadlt;1,這說明該平臺無法進(jìn)行打擊任務(wù),因此該平臺負(fù)責(zé)監(jiān)視目標(biāo),實(shí)時(shí)報(bào)告目標(biāo)的位置,待其他平臺趕到目標(biāo)點(diǎn)時(shí)(等待時(shí)間twait=min(tstrike)),該平臺將任務(wù)類型轉(zhuǎn)換為搜索任務(wù),退出本次打擊任務(wù)。若該平臺的載彈量滿足UVi.bombload≥1時(shí),仍需對目標(biāo)的打擊量進(jìn)行判斷。若twaitlt;1,說明該平臺能夠獨(dú)立完成打擊,則實(shí)施打擊操作,待完成后將平臺狀態(tài)轉(zhuǎn)換為搜索任務(wù)。若twait≥1, 說明該平臺的打擊力不夠,需要其他平臺支援打擊,則twait=max(tstrike)。此外,當(dāng)任務(wù)狀態(tài)為3時(shí),說明該平臺被選用為協(xié)助打擊平臺,待打擊任務(wù)完成后任務(wù)類型也將轉(zhuǎn)換為搜索任務(wù),從而完成當(dāng)前動(dòng)態(tài)到達(dá)的目標(biāo)打擊任務(wù)。
5" 實(shí)驗(yàn)結(jié)果與分析
空地?zé)o人平臺和目標(biāo)的初始參數(shù)以及數(shù)字信息素圖的初始參數(shù)是本文方法的重要組成部分,因此本節(jié)首先對這些參數(shù)進(jìn)行描述。為了說明AGENTS的先進(jìn)性,本節(jié)還設(shè)計(jì)了多組與現(xiàn)有方法的對比實(shí)驗(yàn),從定性和定量角度分析說明優(yōu)化模型的有效性。最后,為了體現(xiàn)算法的全面性,對所使用的無人平臺數(shù)量、城市區(qū)域面積進(jìn)行了擴(kuò)展性討論,分析AGENTS的實(shí)際可行性。
5.1" 實(shí)驗(yàn)參數(shù)設(shè)置
本文利用柵格對城市區(qū)域Ω進(jìn)行等比例劃分,共有82×82個(gè)柵格,每個(gè)柵格的實(shí)際邊長為10 m。為了增加目標(biāo)搜索和路徑規(guī)劃的難度, 在區(qū)域Ω中共設(shè)置了59個(gè)建筑物和341個(gè)城建區(qū)域,每個(gè)建筑物或城建區(qū)域均占用9個(gè)柵格, 且十分密集,從而更好地模擬復(fù)雜城市壞境。本文實(shí)驗(yàn)選用8架無人機(jī)和8輛無人車組成空地協(xié)同編隊(duì)進(jìn)行搜索和打擊任務(wù),這些無人機(jī)和無人車的基本參數(shù)分別如表1和表2所示。同時(shí),參考文獻(xiàn)[20],在此區(qū)域中分別設(shè)置了9個(gè)3類運(yùn)動(dòng)狀態(tài)的目標(biāo),其初始運(yùn)動(dòng)狀態(tài)如表3所示。
同時(shí),本文設(shè)定無人機(jī)編隊(duì)的最小安全距離dminUAV=20 m,無人車編隊(duì)的最小安全距離dminUGV=10 m;無人機(jī)和無人車在單位行進(jìn)距離下的能耗分別為0.005 W和0.006 W。此外,數(shù)字信息素[20,24]是計(jì)算搜索模型的協(xié)同編隊(duì)收益的重要指標(biāo),直接決定著目標(biāo)搜索及打擊任務(wù)的成敗。因此,本節(jié)對其主要參數(shù)設(shè)置進(jìn)行說明。① 吸引信息素:揮發(fā)系數(shù)Ga=0.3,傳播系數(shù)Ea=0.4,釋放常數(shù)da=1;② 排斥信息素:揮發(fā)系數(shù)Gr=0.3,傳播系數(shù)Er=0.4,釋放常數(shù)dr=10;③ 系數(shù)常量:預(yù)測步長N=3,協(xié)同收益權(quán)重λ1=0.5,區(qū)域覆蓋率權(quán)重λ2=0.5。
5.2" 實(shí)驗(yàn)對比分析
為了驗(yàn)證本文提出的動(dòng)態(tài)任務(wù)分配方法的先進(jìn)性,選用文獻(xiàn)[24]分布式模型預(yù)測控制(distributed model predictive control, DMPC)和文獻(xiàn)[30]局部粒子群優(yōu)化(local particle swarm optimization, LPSO)兩種現(xiàn)有流行方法進(jìn)行對比,考察打擊目標(biāo)數(shù)、路徑覆蓋率、整體運(yùn)行時(shí)間等主要指標(biāo),分析3種方法的優(yōu)越性。
DMPC方法是基于貝葉斯理論對目標(biāo)的運(yùn)動(dòng)狀態(tài)進(jìn)行估計(jì),并在原有數(shù)字信息素的基礎(chǔ)上設(shè)計(jì)了調(diào)度信息素,從而保證了多平臺協(xié)同搜索目標(biāo)的能力。由于此方法不包含任務(wù)分配功能,因此本文加入簡單的任務(wù)分配模式, 即到達(dá)任務(wù)及時(shí)處理的機(jī)制,采用空閑平臺執(zhí)行打擊任務(wù)。由于DMPC方法也采用數(shù)字信息素進(jìn)行目標(biāo)搜索,為了保證實(shí)驗(yàn)的公平性,該方法的吸引和排斥信息素參數(shù)設(shè)置與AGENTS相同,而調(diào)度信息素的釋放常量dd=5。
LPSO方法將搜索區(qū)域分為大小相等的單元,每個(gè)單元與目標(biāo)發(fā)生概率和無人機(jī)接收到的命中數(shù)相關(guān)聯(lián)。基于合作和競爭PSO算法,構(gòu)建分布式協(xié)同模型,從而提高多平臺的目標(biāo)搜索能力。與DMPC方法相同,此方法同樣不包含任務(wù)分配功能,為了體現(xiàn)算法對比的公平性,將本文設(shè)計(jì)的任務(wù)分配機(jī)制加入到此方法中。LPSO方法的主要參數(shù)設(shè)置為:控制個(gè)體“認(rèn)知”的c1和決定群體“社交”的c2均為2;個(gè)體和群體權(quán)重系數(shù)分別為0.5和0.5;目標(biāo)識別閾值B=0.99。
3種方法的目標(biāo)搜索與打擊結(jié)果分別如圖5~圖8所示。圖5顯示了空地?zé)o人平臺應(yīng)用這3種方法的三維行進(jìn)路線,本文假設(shè)無人機(jī)在等高平臺飛行,不同顏色的點(diǎn)表示各無人平臺的路徑點(diǎn)。圖6和圖7分別顯示了3種方法在空域和地域的平臺分布情況,其中無人機(jī)的行進(jìn)方向?yàn)?個(gè),無人車的則為4個(gè)。圖8顯示了各方法的目標(biāo)發(fā)現(xiàn)數(shù)與區(qū)域覆蓋率的數(shù)據(jù)圖。
從圖5可以看出,3種方法均能較好地完成目標(biāo)搜索與打擊任務(wù),且各無人平臺均能分布在城市的各個(gè)角落,具有較強(qiáng)的目標(biāo)搜索能力。AGENTS和LPSO的任務(wù)分配能力強(qiáng)于DMPC,各平臺的行進(jìn)路徑更少,所執(zhí)行的時(shí)間周期更短。為了清晰地顯示各平臺的行進(jìn)路線,圖6和圖7分別顯示了各域的行進(jìn)軌跡??梢钥闯觯珹GENTS的協(xié)同能力更強(qiáng),無人機(jī)與無人車的路徑覆蓋形成了互補(bǔ),在無人機(jī)未涉及的區(qū)域,無人車能夠及時(shí)補(bǔ)充,協(xié)同完成目標(biāo)搜索與打擊任務(wù)。與DMPC相比,AGENTS采用了相同的目標(biāo)搜索機(jī)制,更好地實(shí)現(xiàn)了動(dòng)態(tài)任務(wù)分配。AGENTS利用能耗和最短距離作為優(yōu)化指標(biāo),促使各平臺能夠在更短的時(shí)間內(nèi)打擊目標(biāo),從而繼續(xù)進(jìn)行區(qū)域搜索任務(wù),既保證了任務(wù)的完成率,也提高了多平臺動(dòng)態(tài)目標(biāo)搜索效率。與LPSO相比,AGENTS利用信息素圖的方法進(jìn)行區(qū)域搜索,有效避免路徑重復(fù)的問題。綜上所述,AGENTS使得無人機(jī)與無人車之間的重復(fù)路徑更少,無人機(jī)主要分布在城市區(qū)域的中央位置,無人車更多地分布在區(qū)域四周,因此相同周期下的區(qū)域覆蓋率更高,目標(biāo)搜索能力更強(qiáng)。
為了更加清晰直觀地對比3種方法的性能, 圖8展示了3種方法在目標(biāo)發(fā)現(xiàn)數(shù)量和區(qū)域覆蓋率方面的對比結(jié)果。從圖8可以看出,AGENTS的時(shí)間周期更短,在相同時(shí)間內(nèi)目標(biāo)發(fā)現(xiàn)數(shù)量最多,區(qū)域覆蓋率最高。具體而言,AGENTS在163個(gè)時(shí)間周期內(nèi)完成目標(biāo)搜索與打擊任務(wù),而LPSO在259個(gè)周期內(nèi)完成任務(wù),DMPC耗時(shí)最長,在533個(gè)周期內(nèi)才能發(fā)現(xiàn)并打擊目標(biāo)。需要指出的是,AGENTS與DMPC的目標(biāo)搜索能力較強(qiáng),均能夠在60個(gè)周期內(nèi)發(fā)現(xiàn)7個(gè)目標(biāo),而LPSO則需要120個(gè)周期才能發(fā)現(xiàn)同等數(shù)量的目標(biāo),這進(jìn)一步證明了采用數(shù)字信息素圖的方式是行之有效的。另一方面,與DMPC相比,AGENTS的打擊任務(wù)分配效率更高,能夠在發(fā)現(xiàn)目標(biāo)后及時(shí)分配平臺進(jìn)行目標(biāo)打擊,而DMPC則需要花費(fèi)500個(gè)周期才能完成目標(biāo)打擊任務(wù),這也證明了本文提出的動(dòng)態(tài)任務(wù)分配模型的有效性,采用最短任務(wù)完成時(shí)間作為優(yōu)化指標(biāo),對整個(gè)系統(tǒng)進(jìn)行任務(wù)規(guī)劃,提升了任務(wù)執(zhí)行效率。
為了進(jìn)一步定量分析3種方法的性能,本節(jié)對不同時(shí)間周期下的目標(biāo)發(fā)現(xiàn)數(shù)、打擊數(shù)、區(qū)域覆蓋率以及運(yùn)行時(shí)間進(jìn)行了對比分析??紤]實(shí)驗(yàn)的公平性,本文對3種方法分別進(jìn)行10次獨(dú)立運(yùn)行,并取平均結(jié)果作為最終的數(shù)據(jù)統(tǒng)計(jì)結(jié)果。3種方法在不同周期下的定量對比如表4所示。
在表4中,由于AGENTS和LPSO方法在300個(gè)時(shí)間周期內(nèi)即可找出全部目標(biāo),因此本文僅統(tǒng)計(jì)了300個(gè)時(shí)間周期下的定量數(shù)據(jù)。從表4中的數(shù)據(jù)可以看出,本文提出的AGENTS具有協(xié)同優(yōu)勢。在100個(gè)時(shí)間周期內(nèi),3種方法的區(qū)域覆蓋率達(dá)到30%以上,AGENTS能夠發(fā)現(xiàn)7個(gè)目標(biāo),并成功打擊其中的6個(gè)。LPSO在此周期內(nèi)僅能發(fā)現(xiàn)并打擊4個(gè)運(yùn)動(dòng)目標(biāo),DMPC的發(fā)現(xiàn)目標(biāo)數(shù)為6,但也僅能打擊其中的4個(gè)目標(biāo)。 隨著任務(wù)的不斷深入,AGENTS的優(yōu)勢愈發(fā)體現(xiàn),例如在200個(gè)周期內(nèi)能夠找出并打擊所有目標(biāo),而其他兩種方法僅能有效打擊6個(gè)目標(biāo)。
與LPSO方法相比,AGENTS不僅在限定時(shí)間能夠打擊更多的目標(biāo),且運(yùn)行時(shí)間也優(yōu)于其他兩種方法,在200個(gè)周期內(nèi)將算法運(yùn)行時(shí)間減少了25 s,這說明利用數(shù)字信息素對運(yùn)動(dòng)目標(biāo)搜索是十分有效的,而粒子群優(yōu)化算法在復(fù)雜城市環(huán)境中易陷入局部最優(yōu),且周期較長。另一方面,DMPC方法在100個(gè)周期內(nèi)的運(yùn)行時(shí)間比AGENTS節(jié)約了1.5 s。但隨著時(shí)間持續(xù)進(jìn)行,由于AGENTS能夠在170個(gè)周期內(nèi)快速打擊所有目標(biāo), 其他時(shí)間僅進(jìn)行搜索任務(wù),因此在200個(gè)周期時(shí),最終執(zhí)行時(shí)間比DMPC減少了15 s,這進(jìn)一步證明了任務(wù)分配模型的有效性。本文以最小完成時(shí)間為指標(biāo),在提升了目標(biāo)打擊效率的同時(shí),縮短了算法的整體運(yùn)行時(shí)間。
5.3" 模型擴(kuò)展性評估
本節(jié)列舉并分析了平臺數(shù)量和平臺載彈量對任務(wù)分配模型的影響,進(jìn)而體現(xiàn)AGENTS的實(shí)用性和模型可擴(kuò)展性。
(1) 無人平臺數(shù)量對任務(wù)分配結(jié)果的影響
在空地協(xié)同任務(wù)分配模型中,無人平臺的數(shù)量直接影響了遂行任務(wù)的結(jié)果。本節(jié)僅對平臺的數(shù)量進(jìn)行考核,假設(shè)平臺的其他參數(shù)(載彈量、速度區(qū)間)均不變,平臺數(shù)量由原來的16個(gè)依次增加到20、24個(gè),評估提出模型的可擴(kuò)展性。為了體現(xiàn)均衡性,增加的4個(gè)平臺中包含2架無人機(jī)和2輛無人車。圖9展示了不同平臺數(shù)量下的區(qū)域覆蓋率和運(yùn)行時(shí)間結(jié)果。
圖9中的統(tǒng)計(jì)數(shù)據(jù)均為運(yùn)行了10次后的平均統(tǒng)計(jì)結(jié)果。從圖9可以看出,隨著平臺數(shù)量的不斷增加,城市區(qū)域的覆蓋率也隨之增加,但算法的整體運(yùn)行時(shí)間卻在不斷減小。這種現(xiàn)象的原因是:一方面由于平臺數(shù)量的增加,執(zhí)行目標(biāo)搜索的平臺將不斷地在城市區(qū)域中穿梭,因此隨著平臺的增加,探測的區(qū)域?qū)㈦S之?dāng)U大。另一方面,在任務(wù)分配的過程中,當(dāng)平臺數(shù)量充足的情況下,模型僅需要找到離目標(biāo)點(diǎn)最近的平臺完成打擊任務(wù)即可,且等待打擊時(shí)間也有所降低,因此計(jì)算時(shí)長將被縮短,當(dāng)平臺數(shù)量達(dá)到24時(shí), AGENTS的整體算法運(yùn)行時(shí)間僅為109 s,且能夠在138個(gè)時(shí)間周期即可完成目標(biāo)搜索和動(dòng)態(tài)打擊任務(wù)。
(2) 平臺載彈量對任務(wù)分配結(jié)果的影響
平臺載彈量是另一個(gè)影響任務(wù)分配結(jié)果的重要指標(biāo),因此本節(jié)同樣對其進(jìn)行實(shí)驗(yàn)評估,設(shè)定平臺數(shù)量和速度區(qū)間均不變,由于本文設(shè)定的目標(biāo)打擊量最大為4,即表明若無人平臺的載彈量能夠達(dá)到4時(shí),該平臺能夠獨(dú)立完成對所有目標(biāo)的打擊任務(wù),因此平臺載彈量由原來的2個(gè)依次增加到3、4個(gè),從而評估任務(wù)分配模型的可擴(kuò)展性。圖10展示了不同載彈量下的區(qū)域覆蓋率和運(yùn)行時(shí)間結(jié)果。
在圖10中,隨著平臺載彈量的增加,AGENTS的區(qū)域覆蓋率也隨之增加。這是因?yàn)樵诖驌裟繕?biāo)時(shí),大部分平臺能夠獨(dú)立完成打擊任務(wù),而無需等待其他平臺輔助,其他平臺則能夠繼續(xù)執(zhí)行目標(biāo)搜索任務(wù),從而擴(kuò)大空地協(xié)同搜索范圍,從而增加了城市區(qū)域的覆蓋率。在算法運(yùn)行時(shí)間方面,平臺載彈量同樣有著重要的影響,當(dāng)載彈量達(dá)到4時(shí),AGENTS僅需120 s即可完成打擊任務(wù),由于每個(gè)平臺均能獨(dú)立完成打擊任務(wù),減少了平臺等待和其他無人平臺路徑規(guī)劃的時(shí)間,與載彈量為2時(shí)相比算法計(jì)算時(shí)間減少了13 s。
6" 結(jié)束語
針對復(fù)雜城市環(huán)境中的未知?jiǎng)討B(tài)目標(biāo)打擊問題,提出了面向動(dòng)態(tài)目標(biāo)搜索與打擊的空地協(xié)同自主任務(wù)分配方法,旨在提高目標(biāo)打擊成功率和城市區(qū)域覆蓋率。具體而言,針對區(qū)域中的未知運(yùn)動(dòng)目標(biāo),提出一種改進(jìn)的基于數(shù)字信息素的目標(biāo)搜索方法,構(gòu)建了面向多平臺協(xié)同收益和區(qū)域覆蓋率的雙重優(yōu)化指標(biāo),從而提升目標(biāo)的發(fā)現(xiàn)率和城市區(qū)域的覆蓋率。在此基礎(chǔ)上,面向動(dòng)態(tài)到達(dá)的目標(biāo)打擊任務(wù),以平臺能耗和最短任務(wù)完成時(shí)間為目標(biāo)函數(shù),提出多任務(wù)組織分配優(yōu)化模型,規(guī)劃出平臺的最優(yōu)可行路徑,從而保證任務(wù)的完成率。與當(dāng)前流行的方法相比,本文提出的AGENTS在區(qū)域覆蓋率和發(fā)現(xiàn)目標(biāo)數(shù)方面均具備較大優(yōu)勢,特別是在相同的時(shí)間周期內(nèi),AGENTS的目標(biāo)打擊能力更強(qiáng),且算法的運(yùn)行時(shí)間最短。實(shí)驗(yàn)結(jié)果表明,AGENTS在保證動(dòng)態(tài)任務(wù)執(zhí)行率的同時(shí),增強(qiáng)了對復(fù)雜城市環(huán)境的區(qū)域覆蓋能力。
目前,空地多平臺協(xié)同遂行任務(wù)所面臨的最大難題為通信鏈路不穩(wěn)定問題,特別是在復(fù)雜城市環(huán)境中,由于障礙物和建筑物的干擾易導(dǎo)致原有的通信鏈路不可達(dá)。未來的研究工作將從空中無人機(jī)和地面無人車的實(shí)際通信能力角度出發(fā),重點(diǎn)突破局部通信條件下的空地協(xié)同優(yōu)化問題,充分考慮地面與空中通信鏈路的動(dòng)態(tài)連接與斷開問題,使得設(shè)計(jì)的空地協(xié)同優(yōu)化模型能夠在實(shí)際城市環(huán)境中發(fā)揮作用,更好地完成目標(biāo)搜索與打擊任務(wù)。
參考文獻(xiàn)
[1] SANTOSO F, GARRATT M, ANAVATTI S. State-of-the-art integrated guidance and control systems in unmanned vehicles: a review[J]. IEEE Systems Journal, 2021, 15(3): 33123323.
[2] 張婷婷, 藍(lán)羽石, 宋愛國. 無人集群系統(tǒng)自主協(xié)同技術(shù)綜述[J]. 指揮與控制學(xué)報(bào), 2021, 7(2): 127136.
ZHANG T T, LAN Y S, SONG A G. An overview of autonomous collaboration technologies for unmanned swarm systems[J]. Journal of Command and Control, 2021, 7(2): 127136.
[3] LIU D Q, BAO W D, ZHU X M, et al. Cooperative path optimization for multiple UAVs surveillance in uncertain environment[J]. IEEE Internet of Things Journal, 2022, 9(13): 1067610692.
[4] ZHU L H, WANG Y, WU Z Q. An adaptive priority allocation for formation UAVs in complex context[J]. IEEE Trans.on Aerospace and Electronic Systems, 2021, 57(2): 10021015.
[5] 余婧, 雍恩米, 陳漢洋, 等. 面向多無人機(jī)協(xié)同對地攻擊的雙層任務(wù)規(guī)劃方法[J]. 系統(tǒng)工程與電子技術(shù), 2022, 44(9): 28492857.
YU J, YONG E M, CHEN H Y, et al. Bi-level mission planning framework for multi-cooperative UAV air-to-ground attack[J]. Systems Engineering and Electronics, 2022, 44(9): 28492857.
[6] YAO W R, QI N M, WAN N, et al. An iterative strategy for task assignment and path planning of distributed multiple unmanned aerial vehicles[J]. Aerospace Science and Technology, 2019, 86: 455464.
[7] YE F, CHEN J, TIAN Y, et al. Cooperative multiple task assignment of heterogeneous UAVs using a modified genetic algorithm with multi-type-gene chromosome encoding strategy[J]. Journal of Intelligent amp; Robotic Systems, 2020, 100(2): 615627.
[8] CHEN X, LIU Y T, YIN L Y, et al. Cooperative task assignment and track planning for multi-UAV attack mobile targets[J]. Journal of Intelligent amp; Robotic Systems, 2020, 100(3): 13831400.
[9] WEI C Y, JI Z, CAI B L. Particle swarm optimization for cooperative multi-robot task allocation: a multi-objective approach[J]. IEEE Robotics and Automation Letters, 2020, 5(2): 25302537.
[10] CHEN C, BAO W D, MEN T, et al. NECTAR-an agent-based dynamic task allocation algorithm in the UAV swarm[J]. Complexity, 2020: 6747985.
[11] DUAN H B, ZHAO J X, DENG Y M, et al. Dynamic discrete pigeon-inspired optimization for multi-UAV cooperative search-attack mission planning[J]. IEEE Trans.on Aerospace and Electronic Systems, 2021, 57(1): 706720.
[12] 李翰, 張洪海, 張連東, 等. 城市區(qū)域多物流無人機(jī)協(xié)同任務(wù)分配[J]. 系統(tǒng)工程與電子技術(shù), 2021, 43(12): 35943602.
LI H, ZHANG H H, ZHANG L D, et al. Multiple logistics unmanned aerial vehicle collaborative task allocation in urban areas[J]. Systems Engineering and Electronics, 2021, 43(12): 35943602.
[13] LUO Q N, DUAN H B. An improved artificial physics approach to multiple UAVs/UGVs heterogeneous coordination[J]. Science China Technological Sciences, 2013, 56(10): 24732479.
[14] NI J J, TANG M, CHEN Y N, et al. An improved cooperative control method for hybrid unmanned aerial-ground system in multitasks[J]. International Journal of Aerospace Engineering, 2020, 2020: 114.
[15] NI J J, WANG X T, TANG M, et al. An improved real-time path planning method based on dragonfly algorithm for heterogeneous multi-robot system[J]. IEEE Access, 2020, 8: 140558140568.
[16] WU Y, WU S B, HU X T. Cooperative path planning of UAVs amp; UGVs for a persistent surveillance task in urban environments[J]. IEEE Internet of Things Journal, 2021, 8(6): 49064919.
[17] 梁星星, 修保新, 范長俊, 等. 面向海上移動(dòng)目標(biāo)的空天協(xié)同連續(xù)觀測模型[J]. 系統(tǒng)工程理論與實(shí)踐, 2018, 38(1): 229240.
LIANG X X, XIU B X, FAN C J, et al. The aerospace coope-rative planning model for maritime moving target continuation observation[J]. Systems Engineering-Theory amp; Practice, 2018, 38(1): 229240.
[18] LI J Q, SUN T, HUANG X P, et al. A memetic path planning algorithm for unmanned air/ground vehicle cooperative detection systems[J]. IEEE Trans.on Automation Science and Engineering, 2022, 19(4): 27242737.
[19] 李夏苗, 廖文昆, 伍國華, 等. 基于兩階段迭代優(yōu)化的空天觀測資源協(xié)同任務(wù)規(guī)劃方法[J]. 控制與決策, 2021, 36(5): 11471156.
LI X M, LIAO W K, WU G H, et al. A two-stage iterative optimazation method for the coordinated task planning of space and air observation resources[J]. Control and Decision, 2021, 36(5): 11471156.
[20] MEN T, LIU D Q, ZHU X M, et al. Cooperative target search for UAVs in urban environment[C]∥Proc.of the IEEE International Conference on Smart City and Informatization, 2021: 814.
[21] YAO P, WANG H L, JI H X. Multi-UAVs tracking target in urban environment by model predictive control and improved grey wolf optimizer[J]. Aerospace Science and Technology, 2016, 55: 131143.
[22] JUANG C F, YEH Y T. Multi-objective evolution of biped robot gaits using advanced continuous ant-colony optimized recurrent neural networks[J]. IEEE Trans.on Cybernetics, 2018, 48(6): 19101922.
[23] LIU Z, GAO X G, FU X W. A cooperative search and cove-rage algorithm with controllable revisit and connectivity maintenance for multiple unmanned aerial vehicles[J]. Sensors, 2018, 18(5): 1472.
[24] 肖東, 江駒, 周俊, 等. 通信受限下多無人機(jī)協(xié)同運(yùn)動(dòng)目標(biāo)搜索[J]. 哈爾濱工程大學(xué)學(xué)報(bào), 2018, 39(11): 18231829.
XIAO D, JIANG J, ZHOU J, et al. Multi-UAV cooperation search for moving targets under limited communication[J]. Journal of Harbin Engineering University, 2018, 39(11): 18231829.
[25] 基于A星算法求解路徑規(guī)劃問題[EB/OL]. [20211125].https:∥blog.csdn.net/qq_59747472/article/details/121547551.
Solving Path Planning Problems Based on A-Star Algorithm[EB/OL]. [20211125].https:∥blog.csdn.net/qq_59747472/article/details/121547551.
[26] A星算法(基于matlab)[EB/OL]. [20190410]. http:∥blog.csdn.net/lmq_zzz/article/details/88999480.
A-Star Algorithm (Based on matlab)[EB/OL]. [20190410]. http:∥blog.csdn.net/lmq_zzz/article/details/88999480.
[27] RAMIREZ-ATENCIA C, BELLO-ORGAZ G, R-MORENO M, et al. Solving complex multi-UAV mission planning problems using multi-objective genetic algorithms[J]. Soft Computing, 2017, 21: 48834900.
[28] ROBIN C, LACROIX S. Multi-robot target detection and tracking: taxonomy and survey[J]. Autonomous Robots, 2016, 40(4): 729760.
[29] FEI B W, BAO W D, ZHU X M, et al. Autonomous cooperative search model for multi-UAV with limited communication network[J]. IEEE Internet of Things Journal, 2022, 9(19): 1934619361.
[30] SAADAOUI H, BOUANANI F E. Information sharing based on local PSO for UAVs cooperative search of unmoved targets[C]∥Proc.of the International Conference on Advanced Communication Technologies and Networking, 2018.
作者簡介
費(fèi)博雯(1991—),女,博士后,主要研究方向?yàn)闊o人系統(tǒng)資源組織協(xié)同與優(yōu)化。
包衛(wèi)東(1971—),男,教授,博士,主要研究方向?yàn)橹笓]信息系統(tǒng)、復(fù)雜網(wǎng)絡(luò)。
劉大千(1992—),男,博士后,主要研究方向?yàn)橹悄軣o人系統(tǒng)、目標(biāo)檢測與跟蹤。
朱曉敏(1979—),男,教授,博士,主要研究方向?yàn)榉植际絽f(xié)同與群體智能。