張振林, 張科, 呂梅柏, 王明昊, 韓治國
(1.西北工業(yè)大學(xué) 航天學(xué)院, 陜西 西安 710072; 2.航天飛行器生存技術(shù)與效能評(píng)估實(shí)驗(yàn)室, 北京 100085)
近年來,隨著各國導(dǎo)彈防御系統(tǒng)的發(fā)展,單枚導(dǎo)彈的突防、攻擊等能力受到威脅,不能勝任現(xiàn)階段對(duì)其提出的要求。多枚導(dǎo)彈組成的編隊(duì)系統(tǒng),在作戰(zhàn)過程中通過信息交互,共同完成目標(biāo)搜索、突防、飽和攻擊等作戰(zhàn)任務(wù),極大地提高了導(dǎo)彈的突防能力和打擊能力,增加了摧毀目標(biāo)的概率,因此研究多彈編隊(duì)飛行具有非常重要的現(xiàn)實(shí)意義。
目前編隊(duì)控制器的設(shè)計(jì)多集中在無人機(jī),究其原因,無人機(jī)可以對(duì)速度進(jìn)行實(shí)時(shí)控制,容易設(shè)計(jì)編隊(duì)控制器以及應(yīng)用到現(xiàn)實(shí)中。Tahk等提出了僅使用視線角度信息來實(shí)現(xiàn)飛行器編隊(duì)的控制器設(shè)計(jì)方法。因?yàn)闇y(cè)量視線角度不需要飛行器之間的數(shù)據(jù)通信,所以該方法是有用的,并且后續(xù)對(duì)多飛行器編隊(duì)飛行進(jìn)行了仿真,驗(yàn)證了所提控制器的可行性和有效性[1]。Dogan等提出了一種生成安全可行軌跡的重新配置無人機(jī)編隊(duì)的算法,給出了當(dāng)前位置和要去的位置。位置跟蹤控制器的設(shè)計(jì)采用積分控制、最優(yōu)LQR設(shè)計(jì)和非線性狀態(tài)反饋線性化相結(jié)合的重新配置無人機(jī)編隊(duì)的非線性控制器的方法[2]。 Giulietti等討論了編隊(duì)飛行的2個(gè)方面:動(dòng)態(tài)建模和編隊(duì)控制。在編隊(duì)飛行中,考慮飛行動(dòng)力學(xué)是由氣動(dòng)效應(yīng)耦合得到,提出了一種“分布式馬蹄渦理論”,建立了準(zhǔn)確的動(dòng)力學(xué)方程,并在此基礎(chǔ)上,設(shè)計(jì)了一種允許軌跡跟蹤和編隊(duì)幾何保持的編隊(duì)控制器。仿真結(jié)果表明,所設(shè)計(jì)的控制器在雙機(jī)編隊(duì)中表現(xiàn)出較好的性能[3]。為了減少多智能體編隊(duì)隊(duì)形變換帶來的能量消耗,Ajorlou等提出了一種兩階段能量最優(yōu)重構(gòu)策略,它是指在當(dāng)前任務(wù)發(fā)布到下一個(gè)隊(duì)形變換命令之間的空閑時(shí)間,將智能體移動(dòng)到一個(gè)特殊編隊(duì)。仿真結(jié)果表明,該策略相比傳統(tǒng)策略可以大大降低能耗[4]。文獻(xiàn)[5]與文獻(xiàn)[4]的方法相同,只是用編隊(duì)隊(duì)形變換時(shí)間的控制替換了對(duì)能量的控制。Zhao等針對(duì)四旋翼無人機(jī)編隊(duì)控制問題,采用一種分層方法,由上層的模型預(yù)測(cè)控制器(MPC)和底層的魯棒反饋線性化控制器組成該MPC控制器,生成滿足所有相關(guān)約束的優(yōu)化無碰撞狀態(tài)參考軌跡,該方法對(duì)輸入擾動(dòng)具有魯棒性,而且魯棒反饋線性化控制器跟蹤最優(yōu)狀態(tài)參考,抑制MPC更新區(qū)間內(nèi)的跟蹤誤差[6]。Jiang等提出了基于機(jī)載傳感器和嵌入式控制器的室外自主編隊(duì)飛行的高效軌跡規(guī)劃算法和集中控制方案。具體而言,研究了最優(yōu)互避碰(ORCA)算法,以避免無人機(jī)在編隊(duì)切換過程中的碰撞[7]。魏揚(yáng)等針對(duì)無人機(jī)在三維空間內(nèi)機(jī)動(dòng)飛行時(shí)的編隊(duì)隊(duì)形保持問題,利用無人機(jī)自動(dòng)駕駛儀模型和編隊(duì)運(yùn)動(dòng)學(xué)模型,設(shè)計(jì)了一種編隊(duì)保持的自適應(yīng)控制器[8]。謝文光等針對(duì)多無人機(jī)編隊(duì)控制問題提出了一種改進(jìn)深度神經(jīng)網(wǎng)絡(luò)的飛行控制方法。該方法在控制器中加入動(dòng)量因子,提高了網(wǎng)絡(luò)的學(xué)習(xí)性能,仿真結(jié)果表明該控制器效果較好[9]。Wang等利用對(duì)偶數(shù),考慮平移運(yùn)動(dòng)與旋轉(zhuǎn)運(yùn)動(dòng)之間的耦合效應(yīng),對(duì)跟隨航天器相對(duì)于先導(dǎo)航天器的六自由度運(yùn)動(dòng)進(jìn)行了建模。并在該模型的基礎(chǔ)上,提出了一種魯棒自適應(yīng)終端滑??刂坡?,包括自適應(yīng)算法,以保證在存在模型不確定性和外部擾動(dòng)的情況下,相對(duì)運(yùn)動(dòng)跟蹤誤差的有限時(shí)間收斂[10]。針對(duì)無人機(jī)設(shè)計(jì)的編隊(duì)控制器都是保證速度可控,雖然不能直接將方法用到導(dǎo)彈上,但是可以給多彈編隊(duì)控制器的設(shè)計(jì)提供思路。
目前針對(duì)多彈編隊(duì)控制器設(shè)計(jì)的文獻(xiàn)相對(duì)較少。采用領(lǐng)彈-從彈的編隊(duì)模式,馬培蓓和韋常柱等利用導(dǎo)彈的自動(dòng)駕駛儀分別設(shè)計(jì)了基于線性反饋[11]和最優(yōu)控制理論[12]的編隊(duì)控制器,但是該方法要求導(dǎo)彈速度可控。張磊等通過微分幾何理論將導(dǎo)彈的非線性運(yùn)動(dòng)模型進(jìn)行線性化,并且在此基礎(chǔ)上建立了基于導(dǎo)彈跟蹤誤差和相對(duì)誤差的控制系統(tǒng)狀態(tài)方程,在領(lǐng)彈推力方向上加入了速度控制項(xiàng),采用領(lǐng)彈-從彈的制導(dǎo)策略,利用自適應(yīng)滑??刂评碚撛O(shè)計(jì)了編隊(duì)控制器[13]。張磊等利用領(lǐng)彈-從彈策略,采用仿射非線性系統(tǒng)最優(yōu)控制理論設(shè)計(jì)了編隊(duì)控制器[14]。周慧波等針對(duì)導(dǎo)彈編隊(duì)系統(tǒng)外部擾動(dòng)和模型不確定性的情況,結(jié)合位置跟蹤誤差和速度跟蹤誤差設(shè)計(jì)了一種輔助誤差變量,并在輔助誤差變量的基礎(chǔ)上提出了一種基于有向通信拓?fù)涞聂敯糇赃m應(yīng)編隊(duì)控制策略,仿真結(jié)果表明該策略下的隊(duì)形跟蹤誤差較小[15]。彭明星等設(shè)計(jì)了2種基于領(lǐng)彈-從彈法的多彈編隊(duì)飛行控制方法,第一種是利用領(lǐng)從彈間的相對(duì)位置根據(jù)誤差反饋設(shè)計(jì)了一種編隊(duì)控制器,第二種方法是根據(jù)領(lǐng)彈、從彈和目標(biāo)位置關(guān)系設(shè)計(jì)了一種編隊(duì)控制器,仿真驗(yàn)證了這2種方法的有效性[16]。上述方法都可以實(shí)現(xiàn)編隊(duì)隊(duì)形的形成與保持,但都需要對(duì)導(dǎo)彈的速度進(jìn)行控制,這不符合現(xiàn)實(shí)中導(dǎo)彈速度不可控這一先決條件。
本文在導(dǎo)彈速度不可控的前提要求下,首先在慣性系下定義領(lǐng)彈和從彈的相對(duì)位置以及編隊(duì)控制器的狀態(tài)變量,并且設(shè)計(jì)了編隊(duì)控制系統(tǒng)。為了得到該系統(tǒng)的具體表達(dá)式,將導(dǎo)彈的俯仰和偏航通道加速度由彈道坐標(biāo)系轉(zhuǎn)到慣性坐標(biāo)系下;其次采用滑模變結(jié)構(gòu)控制理論和自適應(yīng)動(dòng)態(tài)面控制理論分別對(duì)領(lǐng)彈和從彈進(jìn)行制導(dǎo)律設(shè)計(jì);最后,針對(duì)中制導(dǎo)段領(lǐng)彈攻擊預(yù)測(cè)命中點(diǎn),采用1枚領(lǐng)彈、2枚從彈進(jìn)行仿真,仿真結(jié)果驗(yàn)證了該方法的可行性和有效性。
單枚導(dǎo)彈在中制導(dǎo)段可能出現(xiàn)探測(cè)視場(chǎng)角較小,導(dǎo)彈截獲目標(biāo)概率較低的情形,為了提高導(dǎo)彈在中制導(dǎo)段截獲目標(biāo)的概率,采用多枚導(dǎo)彈進(jìn)行編隊(duì),同時(shí)對(duì)目標(biāo)進(jìn)行觀測(cè)。下面給出導(dǎo)彈攻擊目標(biāo)的彈目相對(duì)運(yùn)動(dòng)關(guān)系如圖1所示。圖中,Oxyz代表慣性坐標(biāo)系,Ox2y2z2代表彈道坐標(biāo)系,M和T分別代表導(dǎo)彈和目標(biāo),θ和ψV分別代表彈道傾角和彈道偏角。
圖1 三維攻擊幾何
導(dǎo)彈由慣性坐標(biāo)系到彈道坐標(biāo)系的變換矩陣可通過兩次旋轉(zhuǎn)求得。首先將地面坐標(biāo)系繞Oy軸旋轉(zhuǎn)一個(gè)ψV角,然后繞Oz2軸旋轉(zhuǎn)一個(gè)θ角,可以得到慣性坐標(biāo)系與彈道坐標(biāo)系之間的轉(zhuǎn)換矩陣為
L(ψV,θ)=Lz(θ)Ly(ψV)=
(1)
導(dǎo)彈的運(yùn)動(dòng)學(xué)方程如下
(2)
本文采用領(lǐng)從式制導(dǎo)策略進(jìn)行編隊(duì)控制器設(shè)計(jì)。領(lǐng)彈和從彈的信息傳遞是單向的,從彈能夠接收領(lǐng)彈信息,領(lǐng)彈不能接收從彈信息,其在已設(shè)計(jì)好的制導(dǎo)律下攻擊目標(biāo)。領(lǐng)彈和第i枚從彈在慣性坐標(biāo)系下的相對(duì)位置關(guān)系如圖2所示。
圖2 領(lǐng)彈和從彈的相對(duì)位置關(guān)系
圖2中,Ml和Mfi分別代表領(lǐng)彈和第i枚從彈,Xl,Yl和Zl分別代表領(lǐng)彈在慣性系下x,y和z方向上的坐標(biāo)值,Xfi,Yfi和Zfi分別代表第i枚從彈在慣性系下x,y和z方向上的坐標(biāo)值,ΔXi,ΔYi和ΔZi分別代表領(lǐng)彈和第i枚從彈在慣性系下x,y和z方向上的相對(duì)位置差值。下面給出ΔXi,ΔYi和ΔZi的表達(dá)式。
(3)
(4)
式中:axl,ayl和azl分別代表領(lǐng)彈在慣性系下x,y和z方向上的加速度;axfi,ayfi和azfi分別代表第i枚從彈在慣性系下x,y和z方向上的加速度。
假設(shè)領(lǐng)彈在彈道坐標(biāo)系下的俯仰通道和偏航通道加速度分別為anyl和anzl,第i枚從彈在彈道坐標(biāo)系下的俯仰和偏航通道加速度分別為anyfi和anzfi。根據(jù)慣性坐標(biāo)系轉(zhuǎn)換到彈道坐標(biāo)系的變換矩陣,可以得到由彈道坐標(biāo)系變換到慣性坐標(biāo)系的轉(zhuǎn)換矩陣。
(5)
將領(lǐng)彈和從彈彈道坐標(biāo)系下的加速度轉(zhuǎn)換到慣性系下,得
(6)
(7)
將(5)式代入(6)式和(7)式中,得到領(lǐng)彈和第i枚從彈在慣性坐標(biāo)系下x,y和z方向加速度的具體表達(dá)式如下:
(8)
(9)
將(8)式和(9)式代入(4)式中,可以將控制系統(tǒng)表示為
(10)
觀察(10)式,對(duì)其進(jìn)行推理與轉(zhuǎn)換,可以得到控制系統(tǒng)的具體表達(dá)式。
(11)
為了后續(xù)控制器設(shè)計(jì)的簡(jiǎn)便,對(duì)(11)式進(jìn)行簡(jiǎn)化,令
(12)
觀察(12)式,可以將其近一步化簡(jiǎn),令
將上述矩陣代入(12)式中,可以得到控制系統(tǒng)的最終簡(jiǎn)化模型。
(13)
本文采用領(lǐng)彈-從彈的編隊(duì)模式,領(lǐng)彈和從彈的編隊(duì)控制器分別采用滑模變結(jié)構(gòu)控制理論和動(dòng)態(tài)面控制器設(shè)計(jì)理論進(jìn)行設(shè)計(jì),最終得到基于領(lǐng)從式制導(dǎo)策略的編隊(duì)控制器。
領(lǐng)彈采用文獻(xiàn)[17]中的滑模變結(jié)構(gòu)理論進(jìn)行控制器設(shè)計(jì),具體形式如下。
(14)
值得慶幸的是,樓上和左達(dá)打賭的徐藝,這一把贏了,左達(dá)出的是石頭,徐藝出的是布。他不禁往上一蹦:“哈哈,你輸了!”
(15)
針對(duì)上節(jié)推導(dǎo)出的編隊(duì)控制器模型,本節(jié)以第i枚從彈為例,考慮到(13)式具有嚴(yán)格反饋形式,下面采用自適應(yīng)動(dòng)態(tài)面控制算法完成多彈編隊(duì)控制系統(tǒng)設(shè)計(jì)。
1) 定義第一個(gè)動(dòng)態(tài)面s1i為
s1i=X1i
(16)
式中:s1i∈R3×1,X1i為系統(tǒng)狀態(tài)變量。
對(duì)(16)式微分,動(dòng)態(tài)面s1i的一階導(dǎo)數(shù)為
(17)
將(17)式中的狀態(tài)變量X2i作為X1i的虛擬控制輸入,設(shè)計(jì)虛擬控制指令X2ic為
X2ic=-k1is1i
(18)
式中,動(dòng)態(tài)面增益矩陣k1i=diag(k11i,k21i,k31i),k11i,k21i和k31i均為待設(shè)計(jì)正常數(shù)。
2) 定義第二個(gè)動(dòng)態(tài)面s2i為
s2i=X2i-X2ic
(19)
式中:s2i∈R3×1,實(shí)質(zhì)為慣性系下速度的跟蹤誤差;X2i為系統(tǒng)狀態(tài)變量。
對(duì)(19)式微分,有
(20)
設(shè)計(jì)系統(tǒng)的控制輸入ui為
ui=AT(AAT)-1(-k2is2i-D-(B+k1i)X2i)
(21)
式中,動(dòng)態(tài)面增益矩陣k2i=diag(k12i,k22i,k32i),k12i,k22i和k32i均為待設(shè)計(jì)正常數(shù)。
結(jié)合(16)~(21)式,得到多彈編隊(duì)控制器自適應(yīng)動(dòng)態(tài)面控制算法如下
(22)
采用Lyapunov穩(wěn)定性理論,對(duì)2.2節(jié)設(shè)計(jì)的編隊(duì)控制器表達(dá)(22)式進(jìn)行穩(wěn)定性分析。
取V(0)≤p,p>0,則閉環(huán)系統(tǒng)所有信號(hào)有界,收斂。
證明:對(duì)動(dòng)態(tài)面s1i求導(dǎo),有
(23)
對(duì)動(dòng)態(tài)面s2i求導(dǎo),有
(24)
定義如下Lyapunov函數(shù)
(25)
對(duì)(25)式進(jìn)行求導(dǎo),得
(26)
取正數(shù)r,若選擇的參數(shù)滿足
(27)
則
(28)
由Lyapunov穩(wěn)定性理論可知,系統(tǒng)在有限時(shí)間內(nèi)趨于穩(wěn)定,即當(dāng)t→∞時(shí),X1i→0。
(29)
由(29)式可得,領(lǐng)彈和第i枚從彈在慣性坐標(biāo)系下x,y和z方向的相對(duì)位置差值最終分別收斂到各方向的期望值。
下面進(jìn)行收斂性分析,首先給出引理1:
引理1[18]針對(duì)V:[0,∞)∈R,不等式方程
(30)
式中,α為任意常數(shù)。
上述引理的證明過程如下:
(31)
解為
(32)
由于ω(t)<0,?t≥t0≥0,則
(33)
V(t)≤e-α(t-t0)V(t0)
(34)
V(t)≤e-r(t-t0)V(t0)
(35)
即
(36)
由(36)式可知,V(t)漸進(jìn)收斂到零。
為了論證速度不可控條件下多彈編隊(duì)協(xié)同控制方法的可行性和有效性,本文設(shè)計(jì)了仿真驗(yàn)證試驗(yàn)。由1枚領(lǐng)彈和2枚從彈組成編隊(duì)隊(duì)形,針對(duì)領(lǐng)彈在中制導(dǎo)過程中攻擊預(yù)測(cè)命中點(diǎn)的場(chǎng)景,要求2枚從彈在有限時(shí)間內(nèi)與領(lǐng)彈形成期望的編隊(duì)隊(duì)形。導(dǎo)彈的初始參數(shù)信息如表1所示,假設(shè)預(yù)測(cè)命中點(diǎn)位于(0,5 000,0)點(diǎn),且靜止,領(lǐng)彈和從彈的速度均為1 000 m/s,且速度保持不變,加速度最大幅值均為AM=40g,仿真步長(zhǎng)為0.01 s。
針對(duì)表1所示的3枚導(dǎo)彈,領(lǐng)彈的滑模系數(shù)選取如下:m=5,n=10,δ1=δ2=0.002 5,從彈的參數(shù)
表1 導(dǎo)彈參數(shù)信息
圖3 3枚導(dǎo)彈軌跡圖 圖4 領(lǐng)彈加速度曲線圖5 從彈1加速度曲線
如圖3所示,領(lǐng)彈以滑模變結(jié)構(gòu)控制對(duì)預(yù)測(cè)命中點(diǎn)進(jìn)行攻擊,整體軌跡較為平滑,反映到圖4所示的領(lǐng)彈加速度曲線上,其俯仰通道和偏航通道曲線均較為平滑。2枚從彈都在初始階段軌跡迅速變化,在有限時(shí)間內(nèi)達(dá)到預(yù)先設(shè)定的期望值,此時(shí)軌跡平滑。反映到圖5和圖6上,2枚從彈的加速度曲線都會(huì)在初始段劇烈變化,當(dāng)達(dá)到隊(duì)形要求后,曲線平滑。
圖6 從彈2加速度曲線 圖7 領(lǐng)彈與從彈1相對(duì)位置與期望值誤差 圖8 領(lǐng)彈與從彈2相對(duì)位置與期望值誤差
圖9 文獻(xiàn)[16]方法中3枚導(dǎo)彈軌跡圖 圖10 文獻(xiàn)[16]方法中從彈1速度跟蹤曲線 圖11 文獻(xiàn)[16]方法中從彈2速度跟蹤曲線
圖12 文獻(xiàn)[16]方法中領(lǐng)彈與從彈1相對(duì)位置與期望值誤差
圖13 文獻(xiàn)[16]方法中領(lǐng)彈與從彈2相對(duì)位置與期望值誤差
表2 編隊(duì)誤差信息
圖7和圖8分別為領(lǐng)彈和2枚從彈位置差值與期望值的誤差,可以發(fā)現(xiàn)2枚從彈均會(huì)在有限時(shí)間內(nèi)達(dá)到誤差為零,結(jié)合表2,可以發(fā)現(xiàn)從彈1的跟蹤誤差較小,從彈2最大誤差為13.4 m,相對(duì)于速度為1 000 m/s來說,誤差較小,表明本文設(shè)計(jì)的編隊(duì)控制器效果較好。對(duì)比圖7至8和圖12至13,可以發(fā)現(xiàn)本文方法相較于文獻(xiàn)[16]方法,收斂時(shí)間會(huì)慢一些,但是差距不大。由圖12至13和表2可以發(fā)現(xiàn),本文提出的編隊(duì)控制器也能夠達(dá)到與文獻(xiàn)[16]中控制器的控制精度。
圖3和圖9分別代表本文控制器和文獻(xiàn)[16]現(xiàn)有要求速度可控編隊(duì)控制器的三維軌跡圖,可以發(fā)現(xiàn),2種方法均能在有限時(shí)間內(nèi)達(dá)到編隊(duì)隊(duì)形,并且此后保持該隊(duì)形。觀察圖10至11發(fā)現(xiàn),文獻(xiàn)[16]控制器算法為了達(dá)到期望隊(duì)形,需要對(duì)導(dǎo)彈的速度實(shí)時(shí)控制,這對(duì)當(dāng)前的技術(shù)提出了巨大的挑戰(zhàn),而且增加了能量的消耗。所以在不控制速度的條件下,本文提出的算法可以降低能量消耗,編隊(duì)控制效果與現(xiàn)有方法相近,并且更便于應(yīng)用到實(shí)際中去。
在導(dǎo)彈速度不可控這一前提下,本文采用領(lǐng)彈-從彈的編隊(duì)模式,基于滑模變結(jié)構(gòu)控制理論和自適應(yīng)動(dòng)態(tài)面控制理論分別對(duì)領(lǐng)彈和從彈的編隊(duì)控制器進(jìn)行設(shè)計(jì)。通過1枚領(lǐng)彈和2枚從彈的編隊(duì)形式進(jìn)行仿真,結(jié)果表明該制導(dǎo)律在響應(yīng)速度和穩(wěn)定性上效果都較好。而且本文提出的編隊(duì)控制器不對(duì)導(dǎo)彈速度做要求,更便于應(yīng)用到實(shí)際中。然而,本文并未考慮編隊(duì)系統(tǒng)存在的擾動(dòng)問題,控制器設(shè)計(jì)也是僅限于三自由度,這是今后進(jìn)一步需要做的工作。