羅 生,孫衛(wèi)國(guó),張 萍,楊永勝
(1上海交通大學(xué)航空航天學(xué)院,上海 200240;2中國(guó)空空導(dǎo)彈研究院,河南洛陽(yáng) 471009)
20世紀(jì)50年代,由于制導(dǎo)系統(tǒng)攔截飛行器的引入、人造衛(wèi)星的發(fā)射和航天中有關(guān)機(jī)動(dòng)追擊問題的需要,美國(guó)數(shù)學(xué)家Isaacs[1]組織開展了對(duì)抗雙方都能自由決策行動(dòng)的理論追逃問題研究,取得了突破性的成果。1965年,Isaacs整理出版了世界上第一部微分對(duì)策著作《微分對(duì)策》。1971年,美國(guó)科學(xué)家Friedman[2]采用了兩個(gè)近似離散對(duì)策序列精確定義了微分對(duì)策,建立了微分對(duì)策值與鞍點(diǎn)存在性理論,從而奠定了微分對(duì)策理論的數(shù)學(xué)基礎(chǔ)。
微分對(duì)策因其理論上的最優(yōu)性,已應(yīng)用于戰(zhàn)術(shù)導(dǎo)彈的制導(dǎo)律設(shè)計(jì)[3-4]。Tahk[5]等人設(shè)計(jì)利用梯度法求得微分對(duì)策制導(dǎo)的數(shù)值解,但模型極為復(fù)雜。Basar[6]設(shè)計(jì)了神經(jīng)網(wǎng)絡(luò)微分制導(dǎo)律,但不能實(shí)時(shí)計(jì)算。我國(guó)院士湯善同[7]采用微分對(duì)策強(qiáng)迫奇異攝動(dòng)方法設(shè)計(jì)了零階組合反饋制導(dǎo)律,這種制導(dǎo)易于彈上實(shí)時(shí)實(shí)現(xiàn),但其是針對(duì)有強(qiáng)大地面雷達(dá)指示的防空導(dǎo)彈設(shè)計(jì)的。
文中采用伴隨理論,解決終端控制的最優(yōu)制導(dǎo)問題,避免了必須對(duì)矩陣方程式的直接求解,并通過仿真驗(yàn)證了所設(shè)計(jì)制導(dǎo)律的性能。
微分對(duì)策屬于雙邊的最優(yōu)控制問題,其狀態(tài)方程可以寫成:
式中:x為狀態(tài)變量;u為導(dǎo)彈控制策略;w為目標(biāo)機(jī)動(dòng)策略;A、B、D為狀態(tài)矩陣。
初始條件:x(0)=x0
性能指標(biāo)函數(shù):
式中:P(t)、R(t)、γ 為加權(quán)矩陣,t0為開始時(shí)刻,tf為終端時(shí)刻。
假設(shè)在導(dǎo)彈發(fā)射后,攔截目標(biāo)的某個(gè)時(shí)刻,目標(biāo)和導(dǎo)彈都知道對(duì)方在此時(shí)刻之前的所有信息。如果導(dǎo)彈首先采取機(jī)動(dòng)u1,然后目標(biāo)根據(jù)導(dǎo)彈采取最優(yōu)規(guī)避w1,指標(biāo)函數(shù)為minumaxwJ =J(u1,w1)。這種條件下,導(dǎo)彈攔截目標(biāo)將消耗最大能量,即有J(u1,w1)=Jmax。如果目標(biāo)不按照最優(yōu)機(jī)動(dòng)w1機(jī)動(dòng),即w≠w1,必有J(u1,w1)≥J(u1,w),即導(dǎo)彈消耗的能量J(u1,w)<Jmax;相反,如果目標(biāo)首先采用機(jī)動(dòng)策略,則有J(u,w2)≥J(u2,w2),即J(u,w2)>Jmin。
綜合可知minumaxwJ≥minwmaxuJ,即存在:J(u1,w1)≥J(u2,w2)。當(dāng)u1=u2=u*、w1=w2=w*時(shí),有J(u1,w1)=J(u2,w2)時(shí),此時(shí)稱(u*,w*)為鞍點(diǎn),鞍點(diǎn)(u*,w*)實(shí)際上就是雙方最優(yōu)控制界柵點(diǎn),微分對(duì)策實(shí)際上就是鞍點(diǎn)的求解,微分對(duì)策制導(dǎo)實(shí)際上就是假設(shè)目標(biāo)根據(jù)導(dǎo)彈信息進(jìn)行最優(yōu)規(guī)避條件下來求解導(dǎo)彈的最優(yōu)機(jī)動(dòng)。
制導(dǎo)律模型如圖1所示。
圖1 制導(dǎo)律模型
其中:
狀態(tài)矩陣:
只考慮對(duì)末端脫靶量進(jìn)行要求,得:
則指標(biāo)函數(shù)簡(jiǎn)化為:
對(duì)于單邊最優(yōu)的制導(dǎo)問題,可以應(yīng)用施瓦茨不等式求出解析解,而對(duì)于微分對(duì)策的雙邊最優(yōu)問題用這種方法是無法解決的。這里應(yīng)用一種在脈沖仿真中常用的伴隨方法對(duì)微分對(duì)策進(jìn)行求解。
應(yīng)用伴隨理論,寫出原系統(tǒng)狀態(tài)方程的伴隨方程:
其中伴隨矩陣AT為:
考慮末端只對(duì)脫靶量進(jìn)行要求,則末端伴隨狀態(tài)為:
λ1(tf)=bx1(tf),b為常數(shù)
λ2(tf)=λ3(tf)=0
因?yàn)棣?為常數(shù),令λ1=bx1(tf),則可得到:
把方程(5)代入到狀態(tài)方程(1)中,并對(duì)其進(jìn)行積分運(yùn)算,設(shè)可以得到微分對(duì)策制導(dǎo)律表達(dá)式為:
為了驗(yàn)證所設(shè)計(jì)微分制導(dǎo)律的性能,用Matlab搭建二維線性攔截模型,對(duì)理想比例制導(dǎo)(IPN)、單邊最優(yōu)制導(dǎo)(OPN)、微分對(duì)策制導(dǎo)(DOPN)進(jìn)行仿真驗(yàn)證。
為了模擬強(qiáng)電磁空戰(zhàn)中,導(dǎo)彈發(fā)射后可能無法準(zhǔn)確獲得目標(biāo)信息的情況,這里假設(shè)制導(dǎo)律中沒有目標(biāo)加速度補(bǔ)償。設(shè)彈目相對(duì)速度Vc=700m/s、導(dǎo)彈過載限幅umax=50g、一階導(dǎo)彈時(shí)間常數(shù)T=0.3s。
a)理想比例導(dǎo)引(IPN):
b)單邊最優(yōu)(OPN):
c)微分對(duì)策(DOPN):
其中取:γ=2.75;b=1000。
為了充分驗(yàn)證制導(dǎo)律對(duì)目標(biāo)的截獲能力,選取階躍機(jī)動(dòng)、正弦機(jī)動(dòng)和B_B機(jī)動(dòng)作為評(píng)估基準(zhǔn),具體模型如下:
a)階躍機(jī)動(dòng)
w=Ant
b)正弦機(jī)動(dòng)
w =Antsin(ωt),取ω=5rad/s
c)B_B機(jī)動(dòng)
仿真中目標(biāo)機(jī)動(dòng)幅值?。篈nt=9g。
在終端時(shí)間tf為1s和3s兩種末制導(dǎo)情況下分別仿真。表1為三種制導(dǎo)律對(duì)于不同機(jī)動(dòng)目標(biāo)的脫靶量情況。
表1 三種制導(dǎo)律脫靶量
圖2為目標(biāo)階躍機(jī)動(dòng)情況下導(dǎo)彈過載響應(yīng)和能量消耗曲線。
圖2 目標(biāo)階躍機(jī)動(dòng)下導(dǎo)彈過載響應(yīng)、能量消耗
圖3為目標(biāo)在正弦機(jī)動(dòng)情況下,導(dǎo)彈的過載響應(yīng)曲線和能量消耗曲線。
圖3 目標(biāo)正弦機(jī)動(dòng)下導(dǎo)彈過載響應(yīng)、能量消耗
從脫靶量上看,對(duì)于復(fù)雜目標(biāo)機(jī)動(dòng),IPN和OPN表現(xiàn)出明顯的不適應(yīng)性,而DOPN則具有很強(qiáng)魯棒性。從能量消耗的角度來衡量,IPN能量消耗大,而DOPN和OPN消耗能量小于IPN,并且DOPN還要小于OPN。
文中應(yīng)用伴隨理論成功推導(dǎo)了基于雙方最優(yōu)策略下的微分對(duì)策制導(dǎo)律,并通過對(duì)目標(biāo)三種不同典型機(jī)動(dòng)的仿真,以及將仿真結(jié)果與比例導(dǎo)引、最優(yōu)導(dǎo)引的對(duì)比,得出微分對(duì)策制導(dǎo)對(duì)多種形式的目標(biāo)機(jī)動(dòng)都具有很高的制導(dǎo)精度和小的能量消耗,是一種更高級(jí)的制導(dǎo)律,具有很大的應(yīng)用前景。
但微分對(duì)策制導(dǎo)律也有其自身缺點(diǎn),比如形式復(fù)雜,需要較多的精確信息,這些是影響微分對(duì)策能否成功應(yīng)用的關(guān)鍵。
[1]Isaacs R.Differential games[M].New York:John Wiley&Sons,1965.
[2]Friedman A.Differential games[M].New York:Wiley Interscience,1971.
[3]Cherry G W.A general explicit,optimizing guidance law for rocket-propellant spacecraft,AIAA 64-638[R].1964.
[4]Shaw R L.Fighter combat:the art and science of air-toair warfare[M].2nd ed.UK:Patrick Stephens Ltol,1988.
[5]M J Tahk,H Ryu,J G Kim.An iterative numerical method for a class of quantitative pursuit-evasion games[C]//AIAA Conference on Guidance,Navigation,and Control,1998:175-182.
[6]Basar T,Olsder G J.Dynamic noncooperative game theory[M].Philadelphia:SIAM,1999.
[7]湯善同.微分對(duì)策制導(dǎo)規(guī)律與改進(jìn)的比例導(dǎo)引制導(dǎo)規(guī)律性能比較[J].宇航學(xué)報(bào),2002,23(6):38-42.
[8]張嗣瀛.微分對(duì)策[M].北京:科學(xué)出版社,1987.