樊 嬌,雷 濤,董南江,王 銳
(1.陜西科技大學(xué)電子信息與人工智能學(xué)院,西安 710021;2.國防科技大學(xué)系統(tǒng)工程學(xué)院,長沙 410073)
無人機路徑規(guī)劃通常需要同時優(yōu)化多個指標(biāo),如最小化路徑長度、威脅等。多個指標(biāo)之間通常互相沖突,給優(yōu)化求解帶來了較大的挑戰(zhàn)。為有效處理多個優(yōu)化指標(biāo),大多傳統(tǒng)方法將多個指標(biāo)通過加權(quán)和方法轉(zhuǎn)換為一個優(yōu)化指標(biāo)。這類方法雖然簡單直觀,但權(quán)重設(shè)置較難,并且一次優(yōu)化只能找到一條路徑,很難滿足決策者的多樣化需求。進化多目標(biāo)優(yōu)化算法可以同時對多個指標(biāo)(目標(biāo)函數(shù))進行優(yōu)化,找出一組非支配(Pareto 最優(yōu))解,在無人機路徑規(guī)劃中得到越來越多的應(yīng)用。
Ganguli 等人在無人機機翼的設(shè)計中采用NSGA-II 算法對空氣動力學(xué)和結(jié)構(gòu)兩個目標(biāo)函數(shù)進行優(yōu)化,在沖突目標(biāo)間進行折衷,為設(shè)計人員提供多種設(shè)計可能性。Conesamunoz 等人在群機器人從事農(nóng)業(yè)任務(wù)的路徑規(guī)劃中,考慮到既要使成本最小化又要覆蓋整個領(lǐng)域,采用了NSGA-II 算法對時間成本和費用成本兩個目標(biāo)進行優(yōu)化,并在異質(zhì)條件下進行大量實驗得到最佳路徑計劃。周德云等人采用改進的CO-NSGA-II 算法,對多無人機的多個性能指標(biāo)同時進行優(yōu)化,將各無人機的航跡規(guī)劃看作一個子種群,在子種群內(nèi)部進行獨立的非支配排序,種群間采用協(xié)同進化策略進行合作,并用時間空間協(xié)同系數(shù)代替NSGA-II 中的擁擠度,有效地實現(xiàn)了多無人機的協(xié)同航跡規(guī)劃。王瑛等人在三維多目標(biāo)航跡規(guī)劃中以航跡最短、角度改變量最小等4 個代價作為規(guī)劃目標(biāo),引入飛行規(guī)則約束,采用NSGA-II 算法進行模型求解,得到了多組具有不同屬性的可行航跡。
針對中大型固定翼無人機路徑規(guī)劃問題,結(jié)合進化多目標(biāo)優(yōu)化算法的優(yōu)勢,本文提出一種基于改進NSGA-II 算法的多目標(biāo)無人機路徑規(guī)劃方法。
多目標(biāo)優(yōu)化是指在一定約束條件下,對多個指標(biāo)(目標(biāo)函數(shù))同時進行優(yōu)化,求得一組Pareto最優(yōu)解。通常,一個多目標(biāo)優(yōu)化問題中的各個目標(biāo)是相互沖突的,即改善一個目標(biāo)的性能會導(dǎo)致其他目標(biāo)的性能降低。典型的多目標(biāo)優(yōu)化問題,如式(1)所述:
定義2:Pareto 最優(yōu)解。不被任何一個解支配的解,稱為Pareto 最優(yōu)解。
定義3:Pareto 最優(yōu)解集。決策空間中Pareto 最優(yōu)解的集合。
定義4:Pareto 前沿。所有最優(yōu)解對應(yīng)的目標(biāo)函數(shù)構(gòu)成Pareto 前沿,也即Pareto 最優(yōu)集在目標(biāo)空間的像。
NSGA-II 是當(dāng)前應(yīng)用最為廣泛的一個進化多目標(biāo)優(yōu)化算法。它的基本思想如下:首先采用非支配排序,即基于Pareto 支配的關(guān)系,對個體進行分層排序;然后引入擁擠距離保持種群個體的多樣性,即同一非支配層中的個體,擁擠距離越大越好;最后,算法通過()的精英保留策略,提高優(yōu)化搜索效率,即個子代種群個體與個父代種群個體通過競爭,選擇出個較好的個體作為下一代的父代種群。
無人機路徑規(guī)劃的基礎(chǔ)是環(huán)境建模,通常包括地形建模、障礙物及威脅區(qū)建模等。
地形建模中,在不影響路徑規(guī)劃實用性的前提下,假設(shè)無人機的飛行高度、速度始終保持一致,將三維路徑規(guī)劃簡化為二維環(huán)境。
威脅區(qū)一般指雷達探測區(qū)域、導(dǎo)彈打擊區(qū)域、禁飛區(qū)區(qū)域等,這里主要考慮因信號干擾帶來的威脅。為簡化起見,將威脅簡化為圓形區(qū)域,具體模型表述如下:
用上述方法對航跡規(guī)劃空間進行建模,結(jié)果如圖1 所示。
圖1 路徑規(guī)劃環(huán)境建模示意圖
START和GOAL 分別為起始點和目標(biāo)點,圓環(huán)區(qū)域為信號干擾威脅區(qū)。其中,實線區(qū)域內(nèi)部為威脅重災(zāi)區(qū),屬于硬約束,要求無人機必須繞開此類區(qū)域;虛線和實線之間的部分為威脅干擾波及區(qū)域,屬于軟約束,無人機可以通過此類區(qū)域,但是會面臨一定的威脅。假定威脅程度與無人機靠近圓心的距離呈反比,無人機距離威脅中心越遠,所受干擾越弱;無人機距離威脅中心越近,所受干擾越強。
路徑代價的計算是無人機路徑規(guī)劃的核心。通常路徑代價包括路徑長度、路徑威脅等,兩個指標(biāo)在多數(shù)情況下是相互沖突的,即路徑短的往往受威脅較大,受威脅小的路徑又較長,傳統(tǒng)路徑規(guī)劃通過加權(quán)法將多個目標(biāo)轉(zhuǎn)換為單個目標(biāo)進行優(yōu)化,為了避免加權(quán)法中權(quán)重設(shè)置的難題,亦可采用進化多目標(biāo)優(yōu)化算法,先找出一組Pareto 最優(yōu)的路徑,然后根據(jù)需要(或決策者的偏好信息)選擇其中的某一條路徑。因此,本文以路徑長度和路徑威脅兩個目標(biāo)作為路徑評價的標(biāo)準(zhǔn)。
3.1.1 路徑長度代價
路徑長度是多個航跡段的距離總和,一般情況下受無人機裝載油量的限制,為了減少油耗、節(jié)省時間,要求路徑長度盡可能短。路徑長度代價如式(2):
3.1.2 路徑威脅代價
威脅代價需要綜合考慮雷達威脅、導(dǎo)彈威脅、信號干擾、禁飛區(qū)等約束條件。為簡化處理,本文將各類威脅表述為圓形區(qū)域,并設(shè)置相關(guān)的威脅干擾區(qū)和重災(zāi)區(qū)。威脅區(qū)域主要用信號干擾威脅程度來衡量,如式(4):
其中,var 是航跡點數(shù),是威脅區(qū)個數(shù),r是第個威脅區(qū)的半徑,dis表示每條路徑中第個航跡點到第個威脅區(qū)的距離。路徑總威脅值等于該條路徑中各航跡點威脅的總和,無人機在當(dāng)前航跡點的威脅值與無人機和威脅源之間的距離成反比。距離越小,所受威脅干擾越大。當(dāng)威脅干擾大于給定值時,則需要增加其路徑代價,以有效避開硬威脅區(qū)域。
除了考慮路徑長度和威脅值,在路徑規(guī)劃中,還需考慮一些約束條件,包括最小航跡段長度約束、最大航跡長度約束和最大拐彎角約束。
目標(biāo)函數(shù)的構(gòu)造如式(5):
氣焰赫赫的風(fēng)云八虎,不到一年,三虎死于非命,均被烈焰焚燒而死,死狀極慘。一般人提及此事,皆心有余悸;茍活于世的三虎,以及他們的后臺德公公,此后寢無眠,食無味,惶惶不可終日。
無人機的路徑可以看作是一系列坐標(biāo)點連接成的線段,本文采用實數(shù)編碼方式對路徑進行編碼,路徑以坐標(biāo)點的形式儲存,具體編碼結(jié)構(gòu)如下:
隨機生成條路徑作為初始化種群。具體每條路徑中的路徑點,即坐標(biāo)和坐標(biāo)值隨機初始化生成。為便于計算,將路徑點用元胞存儲。一個元胞內(nèi)所有的路徑點構(gòu)成一個路徑個體,其中起始點坐標(biāo)和目標(biāo)點坐標(biāo)固定,中間路徑點隨機生成。
下面闡述無人機路徑規(guī)劃算法中進化算子的設(shè)計。
1)環(huán)境選擇算子:選擇算子建立在種群中適應(yīng)度的評估上,采用錦標(biāo)賽選擇法,每次從種群中隨機選擇2 個個體,對每個個體的適應(yīng)度值進行比較,選出適應(yīng)度值高的個體進入下一代,重復(fù)選擇至下一代種群達到原來的種群規(guī)模。
圖2 交叉操作
3)變異算子:從交叉后的種群中隨機選擇一個個體,以的概率對中間航跡點進行高斯變異操作,用均值為交叉后的航跡點坐標(biāo)值、方差為10的正態(tài)分布的隨機數(shù)來替換交叉后的航跡點,以搜索到原個體附近的某個局部區(qū)域。然后引入最大拐彎角約束,對超過拐彎角最大值的路徑進行平滑。這種變異方法結(jié)合最大拐彎角約束,能夠有效避免航跡點發(fā)生突變。
4)擾動算子:對航跡點進行微小的擾動,采用高斯擾動的方法,用均值為變異后的航跡點坐標(biāo)值、方差為0.5 的正態(tài)分布的隨機數(shù)數(shù)組來替換變異后的航跡點,并對擾動后的航跡點坐標(biāo)進行越界處理,使產(chǎn)生的航跡能夠在預(yù)定的范圍內(nèi)。
5)增加刪除算子:對每一個航跡點,比較其與下一航跡點連成的航跡段到威脅區(qū)域中心的距離與威脅區(qū)半徑的大小。如圖3(a)~圖3(c)所示:>,則航跡段不受威脅;<且兩個航跡點均在威脅區(qū)外,則航跡段不受威脅;<且過威脅區(qū),則找兩點與威脅區(qū)的切點node1、node2(如圖3(d)所示),并將這兩點加入路徑中;其他情況下,如第個路徑點在威脅區(qū)外,第+1 個路徑點在威脅區(qū)內(nèi),則尋找下一個在威脅區(qū)外的路徑點,并刪去第+1 個路徑點。
圖3 距離與威脅區(qū)半徑的大小比較圖
6)平滑算子:無人機改變航向的過程中需要相應(yīng)時間和轉(zhuǎn)彎角度的限制,轉(zhuǎn)彎角度太小,航跡實際無法飛行,為了使無人機實際可飛并且與威脅保持一定距離,采用3 次樣條插值法,對路徑中的拐角進行平滑,使其產(chǎn)生平滑軌跡。
采用NSGA-II 算法中經(jīng)典的非支配分層策略對個體進行排序。首先,找出種群中位于Pareto 前沿第1 層的個體,即不被任何其他個體Pareto 支配的個體;其次去除位于第1 層級的個體,在剩余的個體中采用同樣的方法,找出不被其他任何個體Pareto 支配的個體,這些個體記為Pareto 第2 層;以此類推,將所有個體分配至對應(yīng)的非支配層。位于Pareto 非支配層(即第1 層)的個體為當(dāng)前最優(yōu)解集。
為保證種群的多樣性,針對同一非支配層的個體,算法更傾向于選擇密度較大的個體。為了提高無人機路徑的多樣性,本文使用改進的擁擠距離算子來衡量個體密度。改進的算子同時考慮個體在決策空間和目標(biāo)空間個體的擁擠度,以二者的平均值作為個體最終的擁擠距離。
目標(biāo)空間中個體的擁擠距離計算如式(6)所示:
決策空間中個體的擁擠距離計算如下:
1)按照航跡點順序,找出路徑上每個點到路徑的最短距離(a,b),求和并除以路徑的總點數(shù)作為路徑到路徑的距離(,)。計算公式如下:
2)按照1)的方法求得所有路徑間的距離并得到一個距離矩陣。
3)根據(jù)該距離矩陣及非支配排序中得到的排序等級計算每個個體的距離密度。
最后將目標(biāo)空間個體的擁擠距離和決策空間個體的距離密度的平均值作為最終的擁擠距離。
本文所提出的基于改進NSGA-II 算法的步驟如下:
1)初始化參數(shù),隨機生成個個體作為初始父代種群;
2)計算路徑規(guī)劃模型的目標(biāo)函數(shù)值;
3)執(zhí)行選擇、交叉、變異及增加刪除算子操作,生成新的個子代個體;
4)計算新生成個體種群的目標(biāo)值;
5)合并父代和子代種群;
6)對合并后的種群進行非支配排序,并計算個體的擁擠距離;
7)根據(jù)非支配排序和擁擠距離,在合并種群中選出較好的個體作為新的父代種群;
8)判斷算法終止條件,若未達到最大進化代數(shù)maxgen 則跳轉(zhuǎn)3),否則算法運行結(jié)束,輸出最優(yōu)結(jié)果。無人機路徑規(guī)劃的改進NSGA-II 算法流程圖,如圖4 所示。
圖4 無人機路徑規(guī)劃的改進NSGA-II 算法流程圖
假定在某次偵察行動中,要求多架無人機從同一區(qū)域起飛,前往某一指定目的地。將飛行區(qū)域簡化為50 km×50 km 的二維空間,假設(shè)在該區(qū)域存在7 個信號干擾威脅源,每個威脅的波及區(qū)域半徑是絕對威脅半徑的2 倍,如表1 所示。無人機的最大航跡長度為500 km,最小航跡段為0.2 km,最大拐彎角不超過60°。
表1 信號干擾威脅參數(shù)
設(shè)定種群大小為80,單條路徑由17 點組成(起點、終點和15 個中間航跡點),最大進化代數(shù)為60;交叉概率取0.85,變異概率取0.1。采用改進的NSGA-II 算法求解模型,為了克服隨機性帶來的影響,將算法在所規(guī)劃的二維環(huán)境下運行20 次,每次運行60 代,從仿真得到的多組結(jié)果中選取最具有代表性的路徑作為Pareto 解集的逼近解集。結(jié)果如圖5 所示。
圖5 基于改進NSGA-II 算法的Pareto 最優(yōu)路徑效果圖
從圖5 的仿真結(jié)果可以看出,改進的NSGA-II算法找到了一組具有多樣性的Pareto 最優(yōu)路徑,即有些路徑雖然長,但是路過的威脅區(qū)域少;有些雖然路徑短,但是需經(jīng)過威脅區(qū)域。不存在路徑又短且受威脅又小的絕對最優(yōu)解。如下頁表2 所示,路徑7 的飛行距離最短,但受威脅程度最大;路徑5的威脅程度最小,但其飛行距離卻最長。同時,所找到的路徑均有效避開了威脅重災(zāi)區(qū)。
具體各條路徑的目標(biāo)函數(shù)值(信息)如表2 所示。
表2 路徑屬性
為進一步驗證所提算法的有效性,本文實驗對比改進的NSGA-II、NSGA-II和基本GA 算法。其中,GA 算法采用加權(quán)和的方法處理兩個目標(biāo)值,3個算法在同一環(huán)境下分別獨立運行20 次。圖6和圖7 分別給出了基于NSGA-II和GA 算法的求解結(jié)果。算法運行時間如表3 所示。
表3 3 種算法的平均耗時(運行20 次)對比結(jié)果
圖7 基于GA 算法的最優(yōu)路徑效果圖
對比3 種進化算法的運行結(jié)果發(fā)現(xiàn),基于GA算法產(chǎn)生的路徑平均長度為77.41,耗時約31.58,雖然平均耗時比改進的NSGA-II 算法短,但是僅能獲取一條路徑。NSGA-II 算法和改進的NSGA-II 算法均能產(chǎn)生多條非支配路徑,但是通過對比圖5和圖6 可以發(fā)現(xiàn),NSGA-II 算法找到的解多樣性較差,路徑呈明顯的簇狀分布。而改進的NSGA-II 算法產(chǎn)生的路徑更分散、多樣性更高,更有利于輔助決策者根據(jù)實際需求選擇合適路徑。
圖6 基于NSGA-II 算法的最優(yōu)路徑效果圖
路徑規(guī)劃是實現(xiàn)無人機自主化、智能化的關(guān)鍵技術(shù)之一,本文以路徑長度和威脅程度為優(yōu)化目標(biāo),構(gòu)建了無人機路徑規(guī)劃的兩目標(biāo)優(yōu)化模型。為有效求解該模型,提出了改進的NSGA-II 算法,該方法在傳統(tǒng)NSGA-II 的基礎(chǔ)上,引入了適用于路徑規(guī)劃問題的交叉、變異以及增加刪除算子,引入了混合目標(biāo)空間和決策空間信息的新型擁擠距離算子,并通過最大拐彎角約束緩解變異操作帶來的航路突變問題。仿真算例表明,改進的NSGA-II 算法能有效找出一組多樣性較好的Pareto 最優(yōu)路徑,其求解效果明顯優(yōu)于傳統(tǒng)的NSGA-II 算法。值得指出的是,本文僅考慮了二維環(huán)境下的靜態(tài)路徑規(guī)劃,尚沒有考慮多無人機之間的協(xié)同。今后,將在此基礎(chǔ)上進一步研究三維空間下的靜態(tài)、動態(tài)多無人機的路徑規(guī)劃,并充分考慮環(huán)境的不確定性等因素對路徑規(guī)劃帶來的影響。