丁一波,毛 偉,王小剛, 崔乃剛
(1. 哈爾濱工業(yè)大學(xué)航天學(xué)院,哈爾濱 150001;2. 試驗物理與計算數(shù)學(xué)國家重點實驗室,北京 100076)
為了應(yīng)對日趨完善的導(dǎo)彈防御系統(tǒng),進攻彈頭在發(fā)射的同時會伴隨一枚防衛(wèi)彈頭,對來襲攔截彈進行主動攔截,掩護彈頭突防。這對導(dǎo)彈攔截提出了巨大挑戰(zhàn)。因此,近年來,設(shè)計三體飛行器的追蹤-逃逸場景備受關(guān)注,為了應(yīng)對這種場景,為攔截彈設(shè)計一種可行的新型制導(dǎo)律迫在眉睫。三體攻防博弈場景主要涉及3個對象飛行器:進攻彈、防衛(wèi)彈和攔截彈,如圖1所示。
圖1 三體攻防博弈作戰(zhàn)場景示意圖Fig.1 Engagement scenario of conflict for three players
李博文[1]以一對一攔截制導(dǎo)問題為背景,將博弈末制導(dǎo)問題轉(zhuǎn)化為博弈論中的二人競爭博弈模型。Horie等[2]利用數(shù)值方法和帶有非線性規(guī)劃的半主動分配方法求解一對一追逃博弈問題。孫傳鵬[3]利用模型預(yù)測控制的思想,求解一對一攔截問題動態(tài)博弈模型的均衡解。Talebi等[4]研究了多枚攔截彈與一枚進攻彈博弈對抗的作戰(zhàn)場景,并分析了3種不同的攔截博弈策略:第1種考慮多枚攔截彈協(xié)同編隊實施攔截;第2種考慮多枚攔截彈不合作單獨攔截;第3種考慮多枚攔截彈各自獨立作戰(zhàn),并且互相競爭攔截。韓冰[5]、Sun等[6]考慮多彈協(xié)同問題,進攻彈與防衛(wèi)彈相互協(xié)作與攔截彈實施博弈,輔助進攻彈突防,提升進攻彈生存能力。Qi等[7]通過全面分析三體攻防博弈中的多種作戰(zhàn)情況與作戰(zhàn)策略,劃分攔截彈可攔截區(qū)域,并以此為依據(jù),為進攻彈設(shè)計有效的突防制導(dǎo)律。Liu等[8]針對攔截彈提出一種基于模糊評估與納什均衡的分布式在線任務(wù)規(guī)劃算法。Sun等[9]考慮了四體問題,即一枚進攻彈、一枚攔截彈與兩枚防衛(wèi)彈的攻防作戰(zhàn)博弈問題。通過設(shè)計兩枚防衛(wèi)彈相互協(xié)作,高效輔助進攻彈實施突防。
本文以三體攻防博弈對抗為研究對象,針對不同的攻防對抗初始作戰(zhàn)條件進行分析,并為攔截彈提出新型制導(dǎo)律,實現(xiàn)對防衛(wèi)彈的躲避以及對進攻彈的成功攔截。
三體攻防博弈任務(wù)圖如圖2所示。在三體攻防博弈下,進攻彈(T)的作戰(zhàn)任務(wù)是規(guī)避攔截彈;防衛(wèi)彈(D)的任務(wù)是追擊攔截彈,掩護進攻彈突防;攔截彈(A)的任務(wù)是躲避防衛(wèi)彈,追蹤進攻彈,成功實施攔截。作戰(zhàn)平面如圖3所示。
圖2 三體攻防博弈任務(wù)圖Fig.2 Task of conflict for three players
圖3 作戰(zhàn)平面Fig.3 Engagement plane
其中,VA、VD和VT分別為攔截彈、防衛(wèi)彈和進攻彈的速度。γA、γD和γT分別為攔截彈、防衛(wèi)彈和進攻彈的飛行路徑角。λAT為AT之間視線角,λAD為AD之間視線角。RAT為AT之間相對距離,RAD為AD之間相對距離。aA、aT和aD分別為攔截彈、進攻彈和防衛(wèi)彈的機動加速度。
動力學(xué)方程如下:
(1)
(2)
(3)
(4)
將碰撞三角形附近的飛行運動在LOS0周圍線性化,下標(biāo)0表示初始狀態(tài)。A與T之間垂直于LOSAT0的位移表示為yAT,A與D之間垂直于LOSAD0的位移表示為yAD。
定義A垂直于視線AT的加速度為uA,T垂直于視線AT的加速度為uT,D垂直于視線AD的加速度為uD。其滿足如下條件
(5)
選擇如下狀態(tài)變量
(6)
狀態(tài)方程給出如下[10]:
(7)
狀態(tài)方程整合如下:
(8)
其中,
(9)
式中,下標(biāo)0表示作戰(zhàn)初始狀態(tài)。由于防衛(wèi)彈的作戰(zhàn)任務(wù)是掩護進攻彈,所以要求AD之間作戰(zhàn)時間必須小于AT作戰(zhàn)時間。即
(10)
定義零控脫靶量為導(dǎo)彈與目標(biāo)在無控狀態(tài)下,在預(yù)測命中時刻相對于當(dāng)前視線方向的側(cè)向位移,符號ZAT(t)與ZAD(t)分別表示AT、AD之間的零控脫靶量。
(11)
其滿足如下動力學(xué)方程:
(12)
式中ZAT與yAT的正負符號定義如圖4所示。
圖4 ZAT與yAT 的正負符號定義Fig.4 Definitions of signs for ZAT and yAT
選定如下性能指標(biāo):
(13)
求解最優(yōu)問題可以得到攔截彈與防衛(wèi)彈之間作戰(zhàn)的最優(yōu)制導(dǎo)律如下[11]:
(14)
攔截彈與進攻彈之間作戰(zhàn)的最優(yōu)制導(dǎo)律如下:
(15)
(16)
ZAD(t)=ZAD(t=0)+
(17)
(18)
假定在AD作戰(zhàn)中,A與D均應(yīng)用式(14)的最優(yōu)機動策略,則若ZAD位于兩條邊界圍成的區(qū)域內(nèi),攔截彈將會被防衛(wèi)彈攔截;若ZAD位于兩條邊界圍成的區(qū)域外,攔截彈可以成功躲避防衛(wèi)彈。
(19)
ZAT(t)=ZAT(t=0)+
(20)
(21)
假定在AT作戰(zhàn)中,A與T均應(yīng)用式(15)的最優(yōu)機動策略,則若ZAT位于兩條邊界圍成的區(qū)域內(nèi),攔截彈可以成功攔截進攻彈;若ZAT位于兩條邊界圍成的區(qū)域外,攔截彈無法攔截進攻彈。
求解可得對于攔截彈,實現(xiàn)成功攔截的初始最大允許脫靶量如下:
(22)
下面將三體攻防對抗作戰(zhàn)場景劃分為2種情況:ZAT(t=0)與ZAD(t=0)的符號相反,ZAT(t=0)與ZAD(t=0)的符號相同。其中第2種情況分為3種條件:1)ZAD(t=0)屬于較大正數(shù);2)ZAD(t=0)屬于較小正數(shù); 3)ZAD(t=0)不滿足條件1)與條件2)。(本文僅討論ZAD(t=0)為正數(shù)的情況,對于ZAD(t=0)為負數(shù)的情況,結(jié)論與正數(shù)情況下相對稱,因此不再贅述。)
第1種情況下,ZAT(t=0)與ZAD(t=0)的符號相反,分析制導(dǎo)律式(14)與式(15),此種情況下,攔截彈實現(xiàn)最優(yōu)躲避與最優(yōu)追蹤的控制方向相同。因此,攔截彈可以在對進攻彈執(zhí)行最優(yōu)追蹤的同時,實現(xiàn)對于防衛(wèi)彈的最優(yōu)躲避。圖5給出情況1下的零控脫靶量初始條件。
圖 5 情況1下零控脫靶量初始條件Fig.5 Initial condition of ZEM(Zero-effort-miss) for case 1
第2種情況下,ZAT(t=0)與ZAD(t=0)的符號相同,分析制導(dǎo)律式(14)與式(15),此種情況下,攔截彈實現(xiàn)最優(yōu)躲避與最優(yōu)追蹤的控制方向相反。因此,攔截彈相對于進攻彈執(zhí)行最優(yōu)追蹤的同時,相對于防衛(wèi)彈執(zhí)行的則是最壞躲避。圖6給出情況2下的零控脫靶量初始條件。
圖6 情況2下零控脫靶量初始條件Fig.6 Initial condition of ZEM for case 2
本小節(jié)對這種情況下AD作戰(zhàn)結(jié)果進行研究,分析攔截彈成功躲避防衛(wèi)彈的所需條件。下面將所需條件分3類進行討論。
(1)條件1
在第1種條件下,ZAD(t=0)屬于較大正數(shù)。圖7給出第1種條件下的零控脫靶量初始條件。
圖7 條件1下零控脫靶量初始條件Fig.7 Initial condition of ZEM for condition 1
(23)
求解可得:
ZAD(t=0)≥dD+
(24)
結(jié)合式(22)與式(24)可以得到保證攔截彈贏得三體攻防博弈的ZAD(t=0)與ZAT(t=0)初始條件:
(25)
(2)條件2
在第2種條件下,ZAD(t=0)屬于較小正數(shù)。圖8給出第2種條件下的零控脫靶量初始條件。
圖8 條件2下零控脫靶量初始條件Fig.8 Initial condition of ZEM for condition 2
同樣類比條件1,可得到如下方程:
(26)
(27)
結(jié)合式(22)與式(27)可以得到保證攔截彈完成三體攻防博弈的ZAD(t=0)與ZAT(t=0)的初始條件:
(28)
(3)條件3
(29)
(30)
在這種條件下,若ZAT(t=0)滿足式(30),則應(yīng)用本文提出的新型制導(dǎo)律可以保證攔截彈在成功躲避防衛(wèi)彈的同時命中進攻彈,贏得三體攻防博弈對抗。
結(jié)合式(15)與式(29)可得最終的攔截彈制導(dǎo)律:
(31)
其中:
(32)
(33)
本小節(jié)中,應(yīng)用實際攻防對抗場景驗證所提出的制導(dǎo)律的有效性,其中大氣層外攔截器(A)攔截進攻彈頭(T),小型智能攔截器(D)作為防衛(wèi)彈攻擊大氣層外攔截器,保護進攻彈頭。防衛(wèi)彈與攔截器的殺傷半徑dD與dA分別設(shè)定為2m與1m。
仿真作戰(zhàn)場景如圖9所示,表1~表2分別給出大氣層外攔截器的性能參數(shù)與仿真初始參數(shù)。
圖9 仿真作戰(zhàn)場景Fig.9 Simulation scenario
參數(shù)名稱參數(shù)數(shù)值初始質(zhì)量/kg35燃料質(zhì)量/kg10軌控發(fā)動機推力/N3400
表2 初始參數(shù)
表3給出情況1下的初始仿真參數(shù)。
表3 情況1初始參數(shù)
初始脫靶量值ZAT(t=0)和ZAD(t=0)分別為-1526m和364.6m,符號相反。攔截彈僅相對于進攻彈采用最優(yōu)追蹤制導(dǎo)律即可命中進攻彈同時躲避防衛(wèi)彈。
圖10給出的是3個飛行器的攻防博弈飛行軌跡。其中AT作戰(zhàn)脫靶量為0.044226m,AD作戰(zhàn)脫靶量為1093.4345m。仿真表明,攔截彈可以成功躲避防衛(wèi)彈并成功攔截進攻彈,贏得三體攻防博弈。
圖10 情況1的飛行軌跡Fig.10 Fight path of case 1
ZAT(t=0)和ZAD(t=0)符號相同。
(1)條件1
表4給出情況2條件1下的初始仿真參數(shù)。
表4 例1初始參數(shù)
對應(yīng)條件1,ZAD(t=0)屬于較大正數(shù)。初始脫靶量值ZAT(t=0)和ZAD(t=0)分別為-1526m和-1725m,符號相同。
圖11顯示AT作戰(zhàn)脫靶量為0.044226m,AD作戰(zhàn)脫靶量為498.2268m。因此,攔截彈可以成功躲避防衛(wèi)彈并成功攔截進攻彈,贏得三體攻防博弈。
圖11 條件1的飛行軌跡Fig.11 Fight path of condition 1
(2)條件2
表5給出情況2條件2下的初始仿真參數(shù)。
表5 例2初始參數(shù)
對應(yīng)條件2,ZAD(t=0)屬于較小正數(shù)。初始脫靶量值ZAT(t=0)和ZAD(t=0)分別為-1526m和-157.6m,符號相同。
圖12顯示AT作戰(zhàn)脫靶量為0.044226m,AD作戰(zhàn)脫靶量為624.0914m。因此,攔截彈可以成功躲避防衛(wèi)彈并成功攔截進攻彈,贏得三體攻防博弈。
圖12 例2的飛行軌跡Fig.12 Fight path of condition 2
(3)條件3
表6給出了情況2條件3下的初始仿真參數(shù)。
表6 例3初始參數(shù)
對應(yīng)條件3,ZAD(t=0)不滿足條件1與條件2。在這一條件下,執(zhí)行2組仿真。第1組仿真中,攔截彈僅應(yīng)用一對一最優(yōu)制導(dǎo)律追蹤進攻彈。第2組仿真中攔截彈使用本文提出的新型制導(dǎo)律。
圖13給出的是第1組仿真結(jié)果。該組仿真情況下,AT作戰(zhàn)脫靶量為0.016644m,但AD作戰(zhàn)脫靶量為0.31179m。表明盡管攔截彈可以依據(jù)最優(yōu)制導(dǎo)律成功攔截進攻彈,但是卻無法成功躲避防衛(wèi)彈,攔截彈博弈失敗。
圖13 例3第1組仿真的飛行軌跡Fig.13 Fight path for the first simulation of example 3
圖14給出的是應(yīng)用本文制導(dǎo)律的第2組仿真結(jié)果。該組仿真情況下,AT作戰(zhàn)脫靶量為0.22464m,AD作戰(zhàn)脫靶量為327.0642m。表明應(yīng)用本文制導(dǎo)律,攔截彈可以成功躲避防衛(wèi)彈,然后精確命中進攻彈,完成預(yù)定任務(wù)。
圖14 例3第2組仿真的飛行軌跡Fig.14 Fight path for the second simulation of example 3
本文針對三體攻防博弈問題,基于微分對策理論,研究分析了攔截彈贏得博弈的不同情況,并為攔截彈提出一種新型制導(dǎo)律。在ZAT(t=0)和ZAD(t=0)符號相反時,攔截彈僅使用最優(yōu)一對一制導(dǎo)律追蹤進攻彈,即可同時躲避防衛(wèi)彈并命中進攻彈。在ZAT(t=0)和ZAD(t=0)符號相同時,分3種條件討論。前2種條件下,攔截彈同樣僅應(yīng)用最優(yōu)一對一制導(dǎo)律追蹤進攻彈即可贏得三體博弈。對于第3種條件,本文提出一種新型制導(dǎo)律,使得攔截彈可在AD作戰(zhàn)時間內(nèi)有效躲避防衛(wèi)彈,并保證與進攻彈之間零控脫靶量最小,在AD作戰(zhàn)結(jié)束后,攔截彈對進攻彈實施最優(yōu)追蹤,贏得三方博弈。