韓 統(tǒng),崔明朗,2,張 偉,陳國(guó)明,王驍飛
(1.空軍工程大學(xué) 航空工程學(xué)院, 西安 710038;2.中國(guó)人民解放軍94019部隊(duì);3.空軍工程大學(xué) 航空機(jī)務(wù)士官學(xué)校, 河南 信陽(yáng) 464000)
隨著無(wú)人機(jī)技術(shù)的不斷發(fā)展,無(wú)人作戰(zhàn)飛行器(UCAV)的作用與地位也在不斷升高,在戰(zhàn)場(chǎng)上的意義越來(lái)越重要;在未來(lái)與有人機(jī)進(jìn)行空中對(duì)抗時(shí),由于UCAV的造價(jià)較低且機(jī)動(dòng)性強(qiáng),必然可以對(duì)有人機(jī)形成數(shù)量上的優(yōu)勢(shì),而多機(jī)空戰(zhàn)協(xié)同攻擊技術(shù)則是實(shí)現(xiàn)多UCAV自主空戰(zhàn)的核心問題,國(guó)內(nèi)外許多學(xué)者也對(duì)此進(jìn)行了研究:文獻(xiàn)[1]提出了使用威脅評(píng)估模型建立多機(jī)空戰(zhàn)模型,文獻(xiàn)[2]等使用優(yōu)化算法對(duì)協(xié)同任務(wù)分配進(jìn)行建模并求解,文獻(xiàn)[5]從協(xié)同制導(dǎo)的角度分析了多機(jī)空戰(zhàn)的決策方法,文獻(xiàn)[6]通過強(qiáng)化學(xué)習(xí)的方法研究了多機(jī)空戰(zhàn)決策問題。
綜合分析上述文獻(xiàn)可以發(fā)現(xiàn),多機(jī)空戰(zhàn)決策的核心在于目標(biāo)分配,現(xiàn)有成果中也通過不同方法對(duì)此進(jìn)行了深刻研究并得到了很多較為成熟的目標(biāo)分配模型。在目標(biāo)分配模型中一般會(huì)存在對(duì)戰(zhàn)機(jī)的態(tài)勢(shì)評(píng)估,然而考察這些態(tài)勢(shì)評(píng)估模型以及目標(biāo)分配結(jié)束后進(jìn)行機(jī)動(dòng)決策的模型時(shí)卻發(fā)現(xiàn),這些模型大都沿用了一對(duì)一空戰(zhàn)時(shí)的態(tài)勢(shì)評(píng)估及決策方法,但在多機(jī)空戰(zhàn)中卻會(huì)經(jīng)常出現(xiàn)局部一對(duì)多或多對(duì)一的情形;對(duì)于有人機(jī)而言這樣的差別還可以接受,因?yàn)轱w行員可以在接收到目標(biāo)分配指令后綜合考慮友機(jī)位置進(jìn)行最終決策,而對(duì)于自主攻擊的無(wú)人機(jī)而言,如果建模過程中不考慮協(xié)同機(jī)制, UCAV將依然按照一對(duì)一空戰(zhàn)時(shí)的決策方法進(jìn)行決策,不會(huì)主動(dòng)配合友方進(jìn)行協(xié)同攻擊。故本文以二對(duì)一空戰(zhàn)為背景,詳細(xì)分析了在協(xié)同攻擊環(huán)境下態(tài)勢(shì)關(guān)系與一對(duì)一空戰(zhàn)時(shí)的區(qū)別,建立了協(xié)同威脅指數(shù)模型,應(yīng)用基于多目標(biāo)優(yōu)化與強(qiáng)化學(xué)習(xí)的機(jī)動(dòng)決策方法[7]進(jìn)行了局部二對(duì)一情形下的空戰(zhàn)態(tài)勢(shì)評(píng)估與決策。
在對(duì)UCAV近距空戰(zhàn)進(jìn)行機(jī)動(dòng)決策與仿真時(shí),采用三自由度質(zhì)點(diǎn)模型描述UCAV的運(yùn)動(dòng)狀態(tài),模型參數(shù)定義見圖1。
圖1 UCAV三自由度模型示意圖
1.1.1模型假設(shè)
為了便于分析,對(duì)建立UCAV運(yùn)動(dòng)、動(dòng)力學(xué)模型作如下假設(shè):
1) 假設(shè)UCAV為一個(gè)剛體,且發(fā)動(dòng)機(jī)非推力矢量控制類型,并假設(shè)其推力方向固定為機(jī)身縱軸線方向;
2) 假設(shè)地球?yàn)閼T性坐標(biāo)系(將地面坐標(biāo)系看作慣性坐標(biāo),忽略地球自轉(zhuǎn)及公轉(zhuǎn)影響);
3) 忽略地球曲率;
4) 在模擬雙方飛行軌跡時(shí),忽略控制系統(tǒng)的延遲。
1.1.2UCAV質(zhì)點(diǎn)模型
為了簡(jiǎn)化計(jì)算,當(dāng)考察UCAV的運(yùn)動(dòng)軌跡時(shí),可將其看作質(zhì)點(diǎn);在慣性坐標(biāo)系下,其運(yùn)動(dòng)方程為
(1)
相同慣性坐標(biāo)系下,UCAV的動(dòng)力學(xué)方程為
(2)
以上兩式中,vu表示速度,γ表示航跡傾角,ψ表示航向角,μ表示滾轉(zhuǎn)角,α表示攻角,m表示質(zhì)量,T表示發(fā)動(dòng)機(jī)推力,D表示空氣阻力,L表示升力,g表示重力加速度。
飛行過程中,UCAV所受升力L與空氣阻力D計(jì)算公式如下:
(3)
式(3)中:ρ表示空氣密度,S為UCAV參考橫截面積,CL與CD分別為升力和阻力系數(shù)。
發(fā)動(dòng)機(jī)推力T計(jì)算公式如下:
T=δTmax
(4)
式(4)中:Tmax表示發(fā)動(dòng)機(jī)最大推力;δ表示油門,取值范圍為[0,1]。
為便于進(jìn)行仿真,在進(jìn)行機(jī)動(dòng)決策時(shí),采用攻角α、油門δ、滾轉(zhuǎn)角μ三個(gè)控制量作為決策量并控制UCAV進(jìn)行機(jī)動(dòng)。
文獻(xiàn)[7]將多目標(biāo)優(yōu)化方法與Actor-Critic強(qiáng)化學(xué)習(xí)方法[8]的結(jié)構(gòu)相結(jié)合,構(gòu)建了一種新的空戰(zhàn)機(jī)動(dòng)決策模型,模型總體構(gòu)架如圖2所示。
圖2 空戰(zhàn)機(jī)動(dòng)決策模型
基于多目標(biāo)優(yōu)化與強(qiáng)化學(xué)習(xí)的機(jī)動(dòng)決策模型在實(shí)際應(yīng)用中具有較好的可拓展性,故本文將以此模型作為一對(duì)一空戰(zhàn)決策的基礎(chǔ),仍采用原文中的態(tài)勢(shì)參數(shù)ηA與能量參數(shù)ηw作為優(yōu)化目標(biāo),分析并構(gòu)建多UCAV協(xié)同攻擊的機(jī)動(dòng)決策模型。
二對(duì)一空戰(zhàn)是多機(jī)協(xié)同攻擊中最基礎(chǔ)也是最具代表性的空戰(zhàn)情形,本節(jié)以二對(duì)一空戰(zhàn)為背景,定義協(xié)同威脅指數(shù)并分析多UCAV協(xié)同攻擊決策方法。
以往關(guān)于多機(jī)空戰(zhàn)目標(biāo)分配以及決策的研究成果中,在評(píng)估態(tài)勢(shì)時(shí)采用的仍是一對(duì)一時(shí)的態(tài)勢(shì)評(píng)估方法,而沒考慮協(xié)同情形下對(duì)態(tài)勢(shì)評(píng)估值的影響,本節(jié)將分析考慮協(xié)同威脅的必要性。
考慮基于多目標(biāo)優(yōu)化與強(qiáng)化學(xué)習(xí)的空戰(zhàn)決策模型在討論一對(duì)一空戰(zhàn)機(jī)動(dòng)決策時(shí),使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練出了一對(duì)一空戰(zhàn)時(shí)的輔助決策網(wǎng)絡(luò),文獻(xiàn)[7]仿真驗(yàn)證了該網(wǎng)絡(luò)具備原Actor-Critic框架中Critic模塊的作用,可以針對(duì)相對(duì)態(tài)勢(shì)量輸出一個(gè)獲勝期望,從某種程度上來(lái)說,該網(wǎng)絡(luò)的輸出也是對(duì)一對(duì)一情形下對(duì)雙方態(tài)勢(shì)的一個(gè)評(píng)估值,并且由于該網(wǎng)絡(luò)是在各態(tài)勢(shì)優(yōu)化函數(shù)的基礎(chǔ)上通過強(qiáng)化學(xué)習(xí)訓(xùn)練得出的,相對(duì)于將這些態(tài)勢(shì)優(yōu)化函數(shù)加權(quán)整合出來(lái)的態(tài)勢(shì)評(píng)估值,相較于一般的加權(quán)方法無(wú)疑是更具有說服力的。故本節(jié)將應(yīng)用該網(wǎng)絡(luò)計(jì)算一對(duì)一情形下的態(tài)勢(shì)關(guān)系值,并將該態(tài)勢(shì)值記作η1-1(u→e),由于該態(tài)勢(shì)值的本質(zhì)是獲勝期望,故在計(jì)算敵機(jī)對(duì)我機(jī)的態(tài)勢(shì)值時(shí)可以直接使用下式:
η1-1(e→u)=1-η1-1(u→e)
(5)
在兩機(jī)同時(shí)攻擊一個(gè)目標(biāo)時(shí),被攻擊方針對(duì)任意一架飛機(jī)的機(jī)動(dòng)都會(huì)受到另一架飛機(jī)的限制,無(wú)法同時(shí)取到在一對(duì)一情形與兩機(jī)對(duì)抗時(shí)的最優(yōu)態(tài)勢(shì)值;即從某種程度上來(lái)說,雙機(jī)一方的態(tài)勢(shì)評(píng)估值隨著友方的存在被“升高”了,這個(gè)“升高”量會(huì)受到3架飛機(jī)相對(duì)位置的影響,雖然有大有小但確是普遍存在的,所以若要對(duì)二對(duì)一情形下的空戰(zhàn)態(tài)勢(shì)進(jìn)行有效評(píng)估,必須要對(duì)這個(gè)“升高”量進(jìn)行計(jì)算,而在進(jìn)行二對(duì)一機(jī)動(dòng)決策時(shí),也要充分利用這個(gè)“升高”量。
二對(duì)一空戰(zhàn)情形下雙機(jī)一方的態(tài)勢(shì)威脅值會(huì)因?yàn)橛逊降拇嬖诙?,為了更為可靠地進(jìn)行多機(jī)目標(biāo)分配以及二對(duì)一情形下的機(jī)動(dòng)決策,建立二對(duì)一空戰(zhàn)情形下的態(tài)勢(shì)評(píng)估模型是十分必要的。結(jié)合多機(jī)空戰(zhàn)決策時(shí)的實(shí)際需求,對(duì)二對(duì)一情形下的態(tài)勢(shì)評(píng)估模型的建立做以下分析:
1) 二對(duì)一情形下雙方態(tài)勢(shì)關(guān)系較為復(fù)雜,難以使用公式直接進(jìn)行計(jì)算,故最為可行的計(jì)算方法時(shí)仍是仿照輔助決策網(wǎng)絡(luò)的訓(xùn)練方法構(gòu)建神經(jīng)網(wǎng)絡(luò)進(jìn)行擬合;
2) 二對(duì)一空戰(zhàn)的雙機(jī)一方雖然是兩架飛機(jī)協(xié)同攻擊,但任何機(jī)動(dòng)占位以及武器發(fā)射仍是以單機(jī)為基礎(chǔ):即對(duì)于任一架飛機(jī)而言,友方的存在可以限制敵方的機(jī)動(dòng)范圍,卻并不能幫助自己完成機(jī)動(dòng)動(dòng)作或者發(fā)射武器;所以一對(duì)一情形下的態(tài)勢(shì)評(píng)估值仍會(huì)直接影響二對(duì)一的態(tài)勢(shì)評(píng)估結(jié)果。不失一般性,為了減少態(tài)勢(shì)評(píng)估模型的計(jì)算量,模型可以只計(jì)算二對(duì)一情形下友方產(chǎn)生的態(tài)勢(shì)量增幅,并結(jié)合一對(duì)一的態(tài)勢(shì)評(píng)估值得出最終態(tài)勢(shì)評(píng)估結(jié)果;
3) 空戰(zhàn)機(jī)動(dòng)決策一般發(fā)生在近距空戰(zhàn)時(shí),對(duì)決策時(shí)間具有較高要求,且考慮復(fù)雜電磁環(huán)境下友方之間的通信會(huì)受到干擾,故多機(jī)情形下的機(jī)動(dòng)決策并不適合采用多機(jī)聯(lián)合在線決策的方式,最可行的方式應(yīng)當(dāng)是以單機(jī)為決策單位,在考慮與友軍配合的前提單獨(dú)決策;所以,在評(píng)估雙機(jī)一方的態(tài)勢(shì)值時(shí)也應(yīng)當(dāng)針對(duì)每一架飛機(jī)分別給出評(píng)估結(jié)果。
綜上所述,為了對(duì)二對(duì)一空戰(zhàn)情形進(jìn)行準(zhǔn)確的態(tài)勢(shì)評(píng)估,定義協(xié)同威脅指數(shù)ηco(u(ua)→e)用于描述二對(duì)一空戰(zhàn)中友機(jī)帶來(lái)的態(tài)勢(shì)指數(shù)增幅(式中u的ua與并不等價(jià)),具體定義式如下:
ηco(u(ua)→e)=f({ε(u→e)},
η1-1(ua→e), {ε(u,ua→e)})
(6)
其中:ua表示友方飛機(jī);e表示敵機(jī);ε表示兩者的相對(duì)態(tài)勢(shì)關(guān)系,描述態(tài)勢(shì)關(guān)系采用的具體參量將在下文建立ηco的訓(xùn)練模型時(shí)給出。
結(jié)合協(xié)同威脅指數(shù),二對(duì)一情形下的態(tài)勢(shì)評(píng)估模型如圖3所示,且二對(duì)一態(tài)勢(shì)下的態(tài)勢(shì)評(píng)估值計(jì)算如下:
η2-1(u(ua)→e)=η1-1(u→e)*ηco(u(ua)→e)
(7)
與一對(duì)一時(shí)的態(tài)勢(shì)評(píng)估值相同,該評(píng)估值的本質(zhì)也是獲勝期望,故在評(píng)估單機(jī)一方的態(tài)勢(shì)值時(shí)同樣有:
(8)
圖3 二對(duì)一態(tài)勢(shì)評(píng)估模型
應(yīng)用前文描述的基于多目標(biāo)優(yōu)化與強(qiáng)化學(xué)習(xí)的模型時(shí),結(jié)合協(xié)同威脅指數(shù)的定義構(gòu)建二對(duì)一空戰(zhàn)機(jī)動(dòng)決策模型。
2.3.1二對(duì)一情形下的輔助決策模塊
在二對(duì)一空戰(zhàn)中,輔助決策模塊依然需要對(duì)多目標(biāo)優(yōu)化決策集進(jìn)行評(píng)估并選出最終決策量,但由于評(píng)估對(duì)象時(shí)二對(duì)一的空戰(zhàn)態(tài)勢(shì),結(jié)合上一節(jié)對(duì)協(xié)同威脅指數(shù)的定義,在原先一對(duì)一輔助決策網(wǎng)絡(luò)的基礎(chǔ)上還需添加協(xié)同威脅指數(shù)的計(jì)算網(wǎng)絡(luò),并將兩個(gè)網(wǎng)絡(luò)的輸出相乘作為輔助決策模塊對(duì)于輸入狀態(tài)的最終輸出結(jié)果。
二對(duì)一情形下戰(zhàn)場(chǎng)中有三架飛機(jī),不妨設(shè)己方為雙機(jī)一方,其態(tài)勢(shì)如圖4所示,其中下標(biāo)u代表己方進(jìn)行態(tài)勢(shì)評(píng)估的UCAV參數(shù),下標(biāo)f代表己方另一架UCAV參數(shù),下標(biāo)e代表敵機(jī)參數(shù),φe-(u, f)表示己方兩架UCAV與敵機(jī)之間形成的夾角;可以看出描述三架飛機(jī)的完整態(tài)勢(shì)需要18個(gè)維度的輸入量。
圖4 二對(duì)一空戰(zhàn)態(tài)勢(shì)示意圖
然而進(jìn)行目標(biāo)分配時(shí)需要進(jìn)行大量的二對(duì)一態(tài)勢(shì)評(píng)估,計(jì)算協(xié)同指數(shù)時(shí)的效率至關(guān)重要;故本文在使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)[9]擬合協(xié)同威脅指數(shù)時(shí),依舊對(duì)網(wǎng)絡(luò)輸入的維度進(jìn)行了簡(jiǎn)化,BP網(wǎng)絡(luò)具體設(shè)置如下:
在上述的輸入維度簡(jiǎn)化中,丟失了本機(jī)的絕對(duì)位置信息(例如以敵機(jī)機(jī)身線為對(duì)稱軸,當(dāng)我機(jī)處于關(guān)于該軸對(duì)稱的兩個(gè)位置時(shí),網(wǎng)絡(luò)關(guān)于我機(jī)的位置輸入相同),但多目標(biāo)決策模塊的輸入是絕對(duì)位置,從而彌補(bǔ)了這一信息損失帶來(lái)的后果;此外由于僅輸入了友機(jī)的態(tài)勢(shì)評(píng)估值,友機(jī)的位置信息全部丟失,但該協(xié)同威脅指數(shù)僅用于進(jìn)行本機(jī)的機(jī)動(dòng)決策,在進(jìn)行友機(jī)的機(jī)動(dòng)決策時(shí)需要重新計(jì)算本機(jī)對(duì)友機(jī)的協(xié)同威脅指數(shù)值,故該信息的丟失并不會(huì)影響到最終的決策結(jié)果。
2) 網(wǎng)絡(luò)輸出為在友方UCAV(下標(biāo)f)的協(xié)同下,待評(píng)估的己方UCAV(下標(biāo)u)攻擊敵機(jī)(下標(biāo)e)時(shí)獲得的協(xié)同威脅指數(shù)ηco(u(f)→e);
3) 確定隱層節(jié)點(diǎn)時(shí)參考如下經(jīng)驗(yàn)公式:
(9)
其中:l0為隱層節(jié)點(diǎn)數(shù);no和mo分別為輸入輸出節(jié)點(diǎn)數(shù);ao為1~10之間的調(diào)節(jié)常數(shù)。結(jié)合實(shí)際仿真效果確定隱層數(shù)為14;
4) 在計(jì)算BP誤差(即強(qiáng)化學(xué)習(xí)的獎(jiǎng)賞)時(shí),使用時(shí)序差分方法[10]中計(jì)算獎(jiǎng)賞的公式如下:
(10)
其中:αRL為學(xué)習(xí)率,隨訓(xùn)練次數(shù)的增加而減??;γRL為折扣率,本文取γRL=0.4;r為獎(jiǎng)賞值,n為本次仿真經(jīng)歷的總步數(shù),i為當(dāng)前狀態(tài)步數(shù);由于網(wǎng)絡(luò)的評(píng)價(jià)目標(biāo)是獲勝期望而非瞬時(shí)態(tài)勢(shì)優(yōu)勢(shì),r值由仿真結(jié)果rend給出,其中關(guān)于rend的取值如表1所示。
表1 rend取值表
此外,由于協(xié)同威脅指數(shù)網(wǎng)絡(luò)的訓(xùn)練必須在二對(duì)一空戰(zhàn)環(huán)境下進(jìn)行,為避免同時(shí)訓(xùn)練兩個(gè)網(wǎng)絡(luò)帶來(lái)的麻煩,在二對(duì)一空戰(zhàn)環(huán)境下進(jìn)行強(qiáng)化學(xué)習(xí)時(shí)默認(rèn)使用已經(jīng)訓(xùn)練完成的一對(duì)一輔助決策網(wǎng)絡(luò)(即先在一對(duì)一環(huán)境下訓(xùn)練輔助決策網(wǎng)絡(luò),完成后再在二對(duì)一環(huán)境下進(jìn)行協(xié)同威脅指數(shù)網(wǎng)絡(luò)的訓(xùn)練)。
2.3.2決策模型
在復(fù)雜電磁環(huán)境下進(jìn)行近距格斗時(shí),為了避免通信被干擾帶來(lái)的影響,各UCAV應(yīng)當(dāng)在考慮到配合友方的前提下單獨(dú)進(jìn)行決策;以下將結(jié)合輔助決策模塊,給出雙UCAV協(xié)同攻擊敵機(jī)時(shí)的機(jī)動(dòng)決策模型:
UCAV在機(jī)動(dòng)決策時(shí)采用多目標(biāo)優(yōu)化與強(qiáng)化學(xué)習(xí)相結(jié)合的機(jī)動(dòng)決策模型,其多目標(biāo)優(yōu)化模塊的模型如下:
(11)
多目標(biāo)優(yōu)化模塊得出的決策集通過輔助決策模塊得出最終決策,整個(gè)決策模型如圖5所示。
圖5 二對(duì)一機(jī)動(dòng)決策模型
與一對(duì)一空戰(zhàn)時(shí)輔助決策網(wǎng)絡(luò)的訓(xùn)練方法類似,圖7的模型同時(shí)也是協(xié)同威脅指數(shù)網(wǎng)絡(luò)的訓(xùn)練模型,具體訓(xùn)練步驟如下:
步驟1初始化協(xié)同威脅指數(shù)網(wǎng)絡(luò),引入一對(duì)一態(tài)勢(shì)下的輔助決策網(wǎng)絡(luò);
步驟2隨機(jī)產(chǎn)生敵我三架飛機(jī)的初始位置狀態(tài),開始仿真模擬;
步驟4預(yù)測(cè)每種決策后敵我態(tài)勢(shì)關(guān)系,進(jìn)而通過整個(gè)輔助決策網(wǎng)絡(luò)(協(xié)同指數(shù)與一對(duì)一輔助網(wǎng)絡(luò)串聯(lián))得出對(duì)應(yīng)的獲勝期望{v1,v2,…,vn};
步驟5采用softmax策略[10]從決策集中隨機(jī)選取出最終執(zhí)行的決策,每種決策的被選取概率為
(12)
步驟6執(zhí)行決策后判斷是否達(dá)到空戰(zhàn)結(jié)束條件,若未達(dá)到,返回步驟3;若已達(dá)到,進(jìn)入步驟7;
為了更加直觀體現(xiàn)增加協(xié)同威脅指數(shù)之后輔助決策模型的效果,設(shè)置了兩組典型的我方雙機(jī)對(duì)敵單機(jī)的空戰(zhàn)初始條件,分別使用增加協(xié)同威脅指數(shù)前后的輔助決策模型進(jìn)行機(jī)動(dòng)決策,仿真參數(shù)設(shè)置如下:
第1組初始條件如下(坐標(biāo)系均為以敵機(jī)在地面投影位置為坐標(biāo)原點(diǎn)的東北天坐標(biāo)系,單位為m):
敵機(jī)初始位置(0,0,4 000),初速度大小為220.7 m/s,初始ψ=144.7°,γ=0°;
己方1號(hào)飛機(jī)初始位置(-37,1 907.3,4 462.7),初速度大小為281.9 m/s,初始ψ=248.4°,γ=0°;
己方2號(hào)飛機(jī)初始位置(425,2 602.2,4 492.6),初速度大小為281.9 m/s,初始ψ=248.4°,γ=0°。
圖6分別記錄了使用協(xié)同威脅指數(shù)前后的模擬空戰(zhàn)情況,圖7~圖8分別給出了雙方相互攻擊判定條件(視線角與距離)。
圖6 空戰(zhàn)仿真結(jié)果
圖7 相互攻擊判定(未使用協(xié)同威脅指數(shù))
仿真結(jié)果中,我方初始位于相對(duì)有利的位置,敵機(jī)向內(nèi)側(cè)轉(zhuǎn)彎做機(jī)動(dòng)規(guī)避,但由于我方UCAV初始速度大于敵機(jī),轉(zhuǎn)彎半徑也會(huì)大于敵機(jī),這就使得敵機(jī)擁有了調(diào)整自己方位角的機(jī)會(huì)。在不使用協(xié)同威脅指數(shù)時(shí),由于我方雙機(jī)與敵機(jī)的相對(duì)態(tài)勢(shì)基本相同,兩架UCAV的決策模型所得結(jié)果也基本一致,結(jié)果被敵機(jī)通過S型機(jī)動(dòng)將被尾追的劣勢(shì)態(tài)勢(shì)轉(zhuǎn)化成迎頭搶攻的均勢(shì)態(tài)勢(shì),而在迎頭搶攻的情形下,我方雙機(jī)由于距離過近反而相互限制了對(duì)方的機(jī)動(dòng)范圍,使得敵機(jī)反而在29 s時(shí)對(duì)我方二號(hào)UCAV率先形成了有效的攻擊判定。
在使用了協(xié)同威脅指數(shù)之后,我方二號(hào)UCAV一開始時(shí)就通過異面機(jī)動(dòng)減速獲得了更小的轉(zhuǎn)彎半徑,并成功與一號(hào)UCAV對(duì)敵機(jī)形成了夾擊的態(tài)勢(shì),并于第18 s對(duì)敵機(jī)形成了有效的攻擊判定;事實(shí)上,如果不考慮一號(hào)UCAV的位置,在二號(hào)UCAV減速的過程中,敵機(jī)通過向外加速轉(zhuǎn)向可以直接脫離二號(hào)UCAV的追擊,但外側(cè)一號(hào)UCAV的存在完全限制了敵機(jī)向外的機(jī)動(dòng)范圍,使得二號(hào)UCAV可以順利完成攻擊;
第2組初始條件如下:
敵機(jī)初始位置(0,0,4 000),初速度大小為290.4 m/s,初始ψ=313.3°,γ=0°;
己方1號(hào)飛機(jī)初始位置(-1 613.2,7 019.5,3 549.7),初速度大小為276.5 m/s,初始ψ=15.5°,γ=0°;
己方2號(hào)飛機(jī)初始位置(-2 956.1,620 6.2,4 389.6),初速度大小為276.5 m/s,初始ψ=15.5°,γ=0°;
圖9分別記錄了使用協(xié)同威脅指數(shù)前后的模擬空戰(zhàn)情況,圖10~圖11分別給出兩次空戰(zhàn)中雙方相互攻擊判定條件(視線角與距離)。
圖9 空戰(zhàn)仿真結(jié)果
圖10 相互攻擊判定(未使用協(xié)同威脅指數(shù))
圖11 相互攻擊判定(使用協(xié)同威脅指數(shù))
仿真結(jié)果中,我方UCAV初始處于不利的態(tài)勢(shì),尤其是一號(hào)UCAV劣勢(shì)較為明顯,在未使用協(xié)同威脅指數(shù)時(shí),敵機(jī)選擇直接追擊我方一號(hào)UCAV,我方一號(hào)UCAV雖然進(jìn)行了機(jī)動(dòng)規(guī)避,但由于劣勢(shì)較大,于第25 s被敵機(jī)形成了有效的攻擊判定,而二號(hào)UCAV雖然通過轉(zhuǎn)彎調(diào)整了自己與敵機(jī)的態(tài)勢(shì)關(guān)系,但并沒有干擾到敵機(jī)追擊一號(hào)UCAV的過程,在整個(gè)空戰(zhàn)中幾乎處于“游離”的狀態(tài)。
使用協(xié)同威脅指數(shù)后,我方二號(hào)UCAV選擇了類似于“斜筋斗”的機(jī)動(dòng)策略,由于敵機(jī)追擊我方一號(hào)UCAV進(jìn)行了加速,導(dǎo)致其在15 s時(shí)直接沖到了二號(hào)UCAV前方有效射程,敵機(jī)為了規(guī)避二號(hào)UCAV被迫放棄對(duì)一號(hào)UCAV的追擊并準(zhǔn)備轉(zhuǎn)向,卻被趁機(jī)完成態(tài)勢(shì)調(diào)整的一號(hào)UCAV夾擊,一號(hào)UCAV于26 s對(duì)敵機(jī)形成了有效的攻擊判定;事實(shí)上,二號(hào)UCAV與敵機(jī)的初始距離較遠(yuǎn),敵機(jī)完全有時(shí)間通過機(jī)動(dòng)減速以避免在二號(hào)UCAV的“斜筋斗”機(jī)動(dòng)中沖前,而此時(shí)消耗掉大量能量的二號(hào)UCAV將處于十分危險(xiǎn)的態(tài)勢(shì),但由于一號(hào)UCAV的初始劣勢(shì)太大,幾乎無(wú)法規(guī)避敵機(jī)的加速追擊,二號(hào)UCAV采用這樣較為“極端”的策略反而使敵機(jī)陷入了兩難的境地。
通過引入?yún)f(xié)同威脅指數(shù),仿真對(duì)比了兩組典型的二對(duì)一空戰(zhàn)仿真實(shí)驗(yàn),在使用了協(xié)同威脅指數(shù)之后,二對(duì)一空戰(zhàn)輔助決策網(wǎng)絡(luò)可以引導(dǎo)己方UCAV綜合考慮三架飛機(jī)的態(tài)勢(shì)關(guān)系,從而與友方UCAV配合并進(jìn)行協(xié)同攻擊,能夠較敵機(jī)更早形成攻擊判定。本文給出的決策模型雖然是基于二對(duì)一空戰(zhàn)的,但協(xié)同威脅指數(shù)可以作為一個(gè)優(yōu)化參數(shù)加入到各類目標(biāo)分配模型中,從而更為合理地將多機(jī)空戰(zhàn)分解成多個(gè)局部一對(duì)一或多對(duì)一的情形,并結(jié)合本文的決策模型進(jìn)行最終決策。如何通過協(xié)同威脅指數(shù)構(gòu)建更為合理地多機(jī)空戰(zhàn)模型也是本文下一步研究的主要目標(biāo)。