張曉敏, 馬培蓓, 紀(jì) 軍, 朱良明
(1.中國(guó)飛行試驗(yàn)研究院,西安 710089; 2.海軍航空工程學(xué)院,山東 煙臺(tái) 264001)
戰(zhàn)場(chǎng)環(huán)境下多無(wú)人機(jī)協(xié)同航跡規(guī)劃可實(shí)現(xiàn)多無(wú)人機(jī)從不同地點(diǎn)、不同方向?qū)δ繕?biāo)發(fā)動(dòng)協(xié)同攻擊,到達(dá)目標(biāo)的時(shí)間并不完全相同,有時(shí)甚至差距很大,這主要是由于無(wú)人機(jī)和目標(biāo)分布比較分散,并且在飛行過(guò)程中需要繞過(guò)不同的威脅區(qū)和禁飛區(qū)造成的,從而極大影響無(wú)人機(jī)的突防概率和整體作戰(zhàn)效能[1-2]。在執(zhí)行軍事任務(wù)中,必須綜合考慮無(wú)人機(jī)航程大小、無(wú)人機(jī)發(fā)射點(diǎn)位置與目標(biāo)位置的關(guān)系、禁飛區(qū)與威脅區(qū)位置等因素,研究具有時(shí)間約束的多無(wú)人機(jī)協(xié)同航跡控制算法,選取一個(gè)最佳的無(wú)人機(jī)到達(dá)目標(biāo)時(shí)間,據(jù)此反算出各無(wú)人機(jī)的發(fā)射時(shí)刻和發(fā)射位置。文獻(xiàn)[3]通過(guò)增加或減少航跡的長(zhǎng)度來(lái)實(shí)現(xiàn)對(duì)飛行時(shí)間的控制;文獻(xiàn)[4]研究具有時(shí)間約束的協(xié)同航跡規(guī)劃方法,提出協(xié)同變量與協(xié)同函數(shù)的概念;文獻(xiàn)[5]將編隊(duì)協(xié)同中的資源分配、軌跡優(yōu)化結(jié)合起來(lái)進(jìn)行計(jì)算并實(shí)現(xiàn)相互通訊,采用分布式控制方法進(jìn)行快速解算,通過(guò)集中式控制方法以減小任務(wù)完成的時(shí)間;文獻(xiàn)[6]提出了隨種群進(jìn)化而變化的時(shí)間協(xié)同度評(píng)價(jià)策略,探討了多平臺(tái)反艦導(dǎo)彈協(xié)同航跡規(guī)劃算法的分解使導(dǎo)彈實(shí)現(xiàn)協(xié)同攻擊;文獻(xiàn)[7]指出時(shí)間控制對(duì)無(wú)人飛行器編隊(duì),尤其對(duì)于執(zhí)行協(xié)同搜索、協(xié)同攻擊以及對(duì)敵方防御系統(tǒng)的協(xié)同干擾極為重要,并進(jìn)行了相關(guān)的實(shí)驗(yàn)。
本文主要研究多級(jí)分布式協(xié)調(diào)策略下具有時(shí)間約束的多無(wú)人機(jī)協(xié)同航跡控制方法,實(shí)現(xiàn)多無(wú)人機(jī)以指定飛行時(shí)間到達(dá)目標(biāo)或同時(shí)到達(dá)目標(biāo),并對(duì)目標(biāo)實(shí)施協(xié)同攻擊。
多無(wú)人機(jī)的協(xié)同控制取決于所處的環(huán)境,令Xi為第i 架無(wú)人機(jī)所處的狀態(tài)空間,xi∈Xi為第i 架無(wú)人機(jī)的狀態(tài),此狀態(tài)空間包含了無(wú)人機(jī)、目標(biāo)、禁飛區(qū)和威脅區(qū)的狀態(tài);Ui(xi)為第i 架無(wú)人機(jī)的狀態(tài),是xi時(shí)決策變量的集合,ui∈Ui(xi)為第i 架無(wú)人機(jī)的決策變量,決策變量由一組航跡點(diǎn)及相應(yīng)的飛行速度表示;協(xié)同目標(biāo)Jobjective是指在回避禁飛區(qū)和威脅區(qū)的基礎(chǔ)上同時(shí)到達(dá)目標(biāo),并要求航跡代價(jià)最小。協(xié)同約束Jconstraint指所有無(wú)人機(jī)同時(shí)到達(dá)目標(biāo)的過(guò)程中需滿足的約束條件,協(xié)同約束是一個(gè)正定的映射Jconstraint(x1,u1,x2,u2,…,xN,uN),當(dāng)協(xié)同完成時(shí),其值為零。
完成協(xié)同所需要的最小共享信息稱(chēng)為協(xié)同變量,通常用θ 表示,在協(xié)同空間IRc中協(xié)同變量是一個(gè)向量,如果每架無(wú)人機(jī)都知道協(xié)同變量并做出適當(dāng)反應(yīng),則協(xié)同能夠?qū)崿F(xiàn)。以協(xié)同時(shí)間為研究對(duì)象,協(xié)同變量就是無(wú)人機(jī)預(yù)計(jì)到達(dá)目標(biāo)的時(shí)間,它是由綜合環(huán)境狀態(tài)和決策變量集合中提取的最小量信息,如果用fi:Xi×Ui→IRc表示從環(huán)境狀態(tài)空間和決策變量集合到協(xié)同空間的映射,則第i 架無(wú)人機(jī)的協(xié)同變量可表示為
只要ui指定航跡點(diǎn)和速度就能確定唯一的協(xié)同變量值θi(xi)=fi(xi,ui)∈Θi(xi),則協(xié)同時(shí)間約束即可表示為
若fi(xi,ui)=fj(xj,uj),則Jconstraint=0,即多架無(wú)人機(jī)同時(shí)到達(dá)目標(biāo);若fi(xi,ui)- fj(xj,uj)<ε,即Jconstraint<ε,則多無(wú)人機(jī)完成了ε 協(xié)同。假設(shè)存在fi的逆向映射,即,如果戰(zhàn)場(chǎng)狀態(tài)空間與協(xié)同變量一致,則決策變量是唯一的,在協(xié)同時(shí)間問(wèn)題中可以理解為,如果協(xié)同變量確定,則每架無(wú)人機(jī)滿足此協(xié)同變量的航跡點(diǎn)和速度就確定了。
協(xié)同函數(shù)指參數(shù)表示協(xié)同變量對(duì)性能指標(biāo)的影響,協(xié)同函數(shù)描述了無(wú)人機(jī)的協(xié)同目標(biāo)如何隨著協(xié)同變量的變化而變化,此性能指標(biāo)取決于戰(zhàn)場(chǎng)狀態(tài)空間和決策變量集合。
對(duì)第i 架無(wú)人機(jī)來(lái)說(shuō),此性能指標(biāo)表示為函數(shù)的形式Ji:Xi×Ui→IR。由于對(duì)每一個(gè)θ∈Θi(xi),都有fi(xi,f-1i (xi,θ))=θ,則此性能指標(biāo)可表示為協(xié)同變量的函數(shù)
式中,Jcf,i為第i 架無(wú)人機(jī)的協(xié)同函數(shù)。對(duì)于協(xié)同時(shí)間問(wèn)題,協(xié)同函數(shù)指在規(guī)避威脅的情況下,使無(wú)人機(jī)的燃油代價(jià)與威脅代價(jià)盡可能地小。而多無(wú)人機(jī)的協(xié)同目標(biāo)為各無(wú)人機(jī)的協(xié)同函數(shù)之和,即
協(xié)同問(wèn)題可以看作是求多無(wú)人機(jī)整體目標(biāo)函數(shù)的最優(yōu)化問(wèn)題,而總體目標(biāo)函數(shù)又是單個(gè)目標(biāo)函數(shù)的函數(shù),可用JT:IRN→IR 定義整體目標(biāo)函數(shù)。此最優(yōu)化問(wèn)題中存在大量的狀態(tài)變量和決策變量,隨著參與作戰(zhàn)無(wú)人機(jī)數(shù)量的增加,計(jì)算將會(huì)越來(lái)越困難。使用協(xié)同變量和協(xié)同函數(shù)可以將最優(yōu)化問(wèn)題分解,提取對(duì)協(xié)同來(lái)說(shuō)重要的信息,可以表示為
協(xié)同時(shí)間問(wèn)題上,最優(yōu)解不僅要滿足時(shí)間約束,而且要使總體航跡代價(jià)最小,總體最優(yōu)的協(xié)同變量θ*確定后,各無(wú)人機(jī)的決策量能確定,即
在基于多級(jí)分布式的協(xié)調(diào)策略中(見(jiàn)圖1),領(lǐng)機(jī)可看作一個(gè)集中式協(xié)調(diào)單元,可與其他僚機(jī)交互信息,而僚機(jī)只與相鄰的僚機(jī)存在信息交互。
圖1 多級(jí)分布式協(xié)調(diào)策略Fig.1 Multi-level distributed coordinated strategy
首先各僚機(jī)的協(xié)調(diào)單元生成自己的協(xié)同變量值θi,然后根據(jù)相鄰僚機(jī)的協(xié)同變量值θj不斷修正自己的協(xié)同變量值,此算法為協(xié)調(diào)一致算法,即第i 個(gè)僚機(jī)的決策變量為,因?yàn)閒-1i 是連續(xù)的,當(dāng)時(shí),有。因此,不管僚機(jī)之間的通訊存在噪聲還是時(shí)變的,協(xié)調(diào)一致算法的目標(biāo)是確保針對(duì)每個(gè)i,j,都有θi→θj。
然后將協(xié)調(diào)好的協(xié)同變量值送給集中式協(xié)調(diào)單元,該單元在實(shí)現(xiàn)總體協(xié)同目標(biāo)Jobjective最小的情況下,通過(guò)在合理范圍內(nèi)預(yù)估協(xié)同變量θ*,然后把預(yù)估的協(xié)同變量θ*按相關(guān)性傳送到相應(yīng)的僚機(jī)協(xié)同管理器,各僚機(jī)根據(jù)協(xié)同變量值θ*產(chǎn)生響應(yīng),使整個(gè)系統(tǒng)的協(xié)同得以實(shí)現(xiàn)。通常最初預(yù)估的θ*,其對(duì)應(yīng)的Jobjective不一定是最小值,因此必須多次預(yù)估,重復(fù)優(yōu)化求解過(guò)程,最終總可以找到θ*∈Θ,并使Jobjective最小,整個(gè)求解過(guò)程是一個(gè)逐步校正協(xié)同變量的過(guò)程。
在多級(jí)分布式協(xié)調(diào)策略中,領(lǐng)機(jī)作為集中式協(xié)調(diào)單元處于核心位置,可獲得全局信息,而各僚機(jī)可以獲得相鄰僚機(jī)的信息,既加快了多機(jī)系統(tǒng)的反應(yīng)速度,又提高了系統(tǒng)的可靠性和魯棒性。
1)在每架無(wú)人機(jī)的航跡規(guī)劃層計(jì)算各無(wú)人機(jī)的最優(yōu)航跡,無(wú)人機(jī)飛行速度vmax≥vi≥vmin,每條航跡有對(duì)應(yīng)的航跡代價(jià)Ji和到達(dá)目標(biāo)的時(shí)間范圍TTOT,i,將每架無(wú)人機(jī)的最優(yōu)航跡傳遞給領(lǐng)機(jī)的協(xié)調(diào)單元。
2)領(lǐng)機(jī)的協(xié)調(diào)單元求出各無(wú)人機(jī)到達(dá)目標(biāo)時(shí)間的交集作為協(xié)同變量T*TOT取值區(qū)間S,如果S 是空集轉(zhuǎn)到步驟3);否則T*TOT在區(qū)間取最小值,這樣可以使得領(lǐng)機(jī)的協(xié)調(diào)單元在最小的基礎(chǔ)上求出各無(wú)人機(jī)同時(shí)到達(dá)目標(biāo)的時(shí)間T*TOT,然后領(lǐng)機(jī)的協(xié)調(diào)單元將T*TOT傳給各僚機(jī),在航跡規(guī)劃層每架無(wú)人機(jī)根據(jù)獲得的T*TOT選擇出各自的航跡和速度。
3)如果各無(wú)人機(jī)按各自的最優(yōu)航跡計(jì)算出來(lái)的到達(dá)目標(biāo)的時(shí)間范圍沒(méi)有交集,則無(wú)人機(jī)的協(xié)同管理層從飛行航跡代價(jià)最小的無(wú)人機(jī)開(kāi)始,依次選擇次優(yōu)或更次優(yōu)的航跡計(jì)算Ji和TTOT,i,重復(fù)步驟2),3),直到各無(wú)人機(jī)到達(dá)目標(biāo)時(shí)間范圍有交集為止,再次將此時(shí)的T*TOT傳給各無(wú)人機(jī),各無(wú)人機(jī)根據(jù)重新計(jì)算的選擇相應(yīng)的協(xié)同飛行航跡。
以4 架無(wú)人機(jī)協(xié)同攻擊同一個(gè)目標(biāo)為例,要求同時(shí)抵達(dá)目標(biāo)。環(huán)境狀態(tài)空間Xi包括無(wú)人機(jī)位置向量PUAVs、目標(biāo)的位置向量PTargets、禁飛區(qū)的位置向量PNofly_zones和威脅區(qū)的位置向量PThreats,即
式中:
上述所有矩陣中第一行為位置向量的橫坐標(biāo),第二行為位置向量的縱坐標(biāo);設(shè)禁飛區(qū)的區(qū)域半徑均為10 km;
設(shè)威脅區(qū)的區(qū)域半徑分別為30 km,30 km,5 km,10 km,10 km,10 km,威脅度分別為0.8,0.8,0.7,0.5,0.8,0.8。
假設(shè)各無(wú)人機(jī)類(lèi)型相同,最小速度vmin為238 m/s,最大速度vmax為340 m/s,其航跡長(zhǎng)度分別為L(zhǎng)(Wi),則從環(huán)境狀態(tài)空間和決策變量到協(xié)同空間的映射為fi(xi,ui)=L(Wi)/vi,最 小 和 最 大 的TOT(Time Over Target)分別為
多無(wú)人機(jī)系統(tǒng)中最優(yōu)的到達(dá)目標(biāo)時(shí)間為T(mén)*TOT,即
式中,T*TOT為協(xié)同變量,可滿足同時(shí)到達(dá)的要求,即
對(duì)于每個(gè)環(huán)境狀態(tài)xi,每條候選航跡ui∈Ui(xi),不僅對(duì)應(yīng)一個(gè)協(xié)同變量T*TOT,同時(shí)也對(duì)應(yīng)代價(jià)函數(shù)Ji(xi,ui),通過(guò)下面航跡代價(jià)最小的最優(yōu)問(wèn)題確定ui,即
式中:k 為系數(shù);Jthreat(T*TOT)表示各無(wú)人機(jī)同時(shí)到達(dá)目標(biāo)需付出的威脅代價(jià);Jfuel(T*TOT)表示各無(wú)人機(jī)需付出的燃油代價(jià)。
實(shí)驗(yàn)要求4 架無(wú)人機(jī)同時(shí)發(fā)射,并且同時(shí)到達(dá)目標(biāo)。相應(yīng)的數(shù)據(jù)見(jiàn)表1,確定協(xié)同變量見(jiàn)圖2 所示。
表1 4 架無(wú)人機(jī)同時(shí)到達(dá)目標(biāo)相關(guān)數(shù)據(jù)Table 1 Data about four UAVs arriving at the targets at the same time
圖2 確定協(xié)同變量Fig.2 Coordination variable determination
由圖2 知,在[645 s,818 s]的時(shí)間范圍內(nèi),4 架無(wú)人機(jī)都可以同時(shí)到達(dá)目標(biāo),但為了滿足最優(yōu)性,由領(lǐng)機(jī)的協(xié)調(diào)單元確定最優(yōu)到達(dá)時(shí)間T*TOT即協(xié)同變量為645 s。
假設(shè)共有4 架無(wú)人機(jī)(“◇”形狀)參與作戰(zhàn),攻擊敵方的1 個(gè)目標(biāo)(“×”形狀),需要有效繞過(guò)6 個(gè)不同的威脅體(紅色的虛線區(qū)域)和6 個(gè)禁飛區(qū)(填充黑色的實(shí)體區(qū)域)。未采用時(shí)間約束前,多無(wú)人機(jī)的航跡規(guī)劃如圖3a 所示,4 條最優(yōu)航跡相應(yīng)到達(dá)目標(biāo)的時(shí)間分別為607 s,612 s,639 s,649 s,最長(zhǎng)與最短飛行時(shí)間相差43 s。采用具有時(shí)間約束的基于協(xié)同變量/協(xié)同函數(shù)的多級(jí)分布式控制方法后,協(xié)同航跡如圖3b 所示,協(xié)同時(shí)間為645 s。為實(shí)現(xiàn)時(shí)間的協(xié)同,各無(wú)人機(jī)的飛行時(shí)間都有相應(yīng)的調(diào)整,分別為38 s,33 s,6 s,-5 s,航跡代價(jià)也有一定程度的改變,達(dá)到了同時(shí)到達(dá)目標(biāo)的目的。在實(shí)際作戰(zhàn)過(guò)程中,可實(shí)現(xiàn)對(duì)目標(biāo)的協(xié)同攻擊,成倍地提高無(wú)人機(jī)的作戰(zhàn)效能,因此以延長(zhǎng)一定的飛行時(shí)間為代價(jià)也是值得的。
圖3 時(shí)間約束前后的協(xié)同航跡比較Fig.3 Comparisons of cooperative paths before and after time constraints
但在許多情況下也難以得到滿意的協(xié)調(diào)結(jié)果,尤其針對(duì)多無(wú)人機(jī)攻擊多目標(biāo)的情況,因?yàn)闊o(wú)人機(jī)和目標(biāo)的位置太分散,致使有些無(wú)人機(jī)的攻擊時(shí)間遠(yuǎn)遠(yuǎn)滯后于其他無(wú)人機(jī),此時(shí)如果要求其他無(wú)人機(jī)增加航跡長(zhǎng)度以延長(zhǎng)飛行時(shí)間去等待某架無(wú)人機(jī)而嚴(yán)重影響到整個(gè)系統(tǒng)的作戰(zhàn)效能是不合理的。此時(shí)更合理的方式有兩種:一種情況是將飛行時(shí)間差距比較大的無(wú)人機(jī)分為兩組,分波次對(duì)目標(biāo)進(jìn)行攻擊;另一種情況是充分利用威脅回避是軟約束的特點(diǎn),使時(shí)間滯后的無(wú)人機(jī)以一定的概率穿越某些威脅,縮短其航跡長(zhǎng)度以彌補(bǔ)時(shí)間差異。同樣以上述仿真環(huán)境為例,重新規(guī)劃多無(wú)人機(jī)航跡得到的結(jié)果如圖4 所示。
圖4 部分航跡穿越威脅Fig.4 Partial paths through the threats
圖4 中,無(wú)人機(jī)3 與無(wú)人機(jī)4 航跡發(fā)生變更,部分穿越了威脅1,有效減少了飛行時(shí)間,實(shí)現(xiàn)了與無(wú)人機(jī)1 和無(wú)人機(jī)2 的協(xié)同,其協(xié)同飛行時(shí)間分別為606.7 s,612.0 s,611.6 s,602.8 s,以無(wú)人機(jī)4 為基準(zhǔn),其他無(wú)人機(jī)與無(wú)人機(jī)4 的時(shí)間差分別為3.9 s,9.4 s,8.8 s,此時(shí)間差對(duì)于中遠(yuǎn)程飛行的無(wú)人機(jī)來(lái)說(shuō)影響不大,同樣可實(shí)現(xiàn)對(duì)目標(biāo)的協(xié)同攻擊。因此在實(shí)際作戰(zhàn)過(guò)程中,需要在距離代價(jià)與威脅代價(jià)之間進(jìn)行權(quán)衡,并根據(jù)實(shí)際情況確定戰(zhàn)術(shù)配合方案,規(guī)劃出滿足時(shí)間協(xié)同要求的最優(yōu)航跡。
研究了基于協(xié)同變量和協(xié)同函數(shù)的多級(jí)分布式協(xié)同控制策略,并將其應(yīng)用于多無(wú)人機(jī)協(xié)同時(shí)間方面,從而實(shí)現(xiàn)多無(wú)人機(jī)以指定飛行時(shí)間到達(dá)目標(biāo)或同時(shí)到達(dá)目標(biāo),并對(duì)目標(biāo)實(shí)施協(xié)同攻擊。進(jìn)一步對(duì)具有時(shí)間約束的多無(wú)人機(jī)協(xié)同航跡控制算法,通過(guò)仿真進(jìn)行了驗(yàn)證分析,并證明了算法的有效性。下一步工作需要研究多無(wú)人機(jī)對(duì)多目標(biāo)進(jìn)行協(xié)同攻擊情形下,具有時(shí)間約束的多無(wú)人機(jī)動(dòng)態(tài)航跡控制問(wèn)題。
[1] SHIMAT,RASMUSSENS. 無(wú)人機(jī)協(xié)同決策與控制[M]. 劉忠,彭鵬菲,陳偉強(qiáng),等譯. 北京:國(guó)防工業(yè)出版社,2012. (SHIMA T,RASMUSSEN S. UAV cooperative decision and control challenges[M]. Translated by LIU Z,PENG P F,CHEN W Q,et al. Beijing:National Defense Industry Press,2012.)
[2] TSOURDOS A,WHITE B,SHANMUGAVEL M. 無(wú)人機(jī)協(xié)同路徑規(guī)劃[M]. 祝小平,周洲,王懌,譯. 北京:國(guó)防工業(yè)出版社,2013. (TSOURDOS A,WHITE B,SHANMUGAVEL M. Cooperative path planning of unmanned aerial vehicles[M]. Translated by ZHU X P,ZHOU Z,WANG Y. Beijing:National Defense Industry Press,2013.)
[3] MCLAIN T,BEARD R. Cooperative rendezvous of multiple unmanned air vehicles[C]//Proceedings of Guidance,Navigation and Control Conference,AIAA,Denver,CO,2000,4369:2309-2314.
[4] BORTOFF S A. Path planning for UAVs[C]//Proceedings of American Control Conference,2000:364-368.
[5] SASTRY S,MEYER G,TOMLIN C,et al. Hybrid control in air traffic management systems[C]//Proceedings of the 34th IEEE Conference in Decision and Control,New Orleans,LA,1995:1478-1483.
[6] 沈建鋒,劉興明,吳凌華,等. 多平臺(tái)反艦導(dǎo)彈協(xié)同航跡規(guī)劃[J].戰(zhàn)術(shù)導(dǎo)彈技術(shù),2009(2):62-66. (SHEN J F,LIU X M,WU L H,et al.Cooperative route planning of anti-ship missiles from multiple platforms[J]. Tactical Missiles Technology,2009(2):62-66.)
[7] BELLINGHAM J,KUWATA Y.Stable receding horizon trajectory control for complex environments[C]//AIAA Guidance,Navigation,and Control Conference and Exhibit,Austin,Texas,AIAA 2003,5635:1-11.