劉佳琪,王偉,*,林德福,林時堯
1. 北京理工大學(xué) 宇航學(xué)院,北京 100081 2. 無人機自主控制技術(shù)北京重點實驗室,北京 100081
伴隨飛行器機動性、防御性不斷提高,工程上對導(dǎo)彈的制導(dǎo)精度提出了更高要求。而在實際應(yīng)用中,制導(dǎo)律往往受到導(dǎo)彈硬件性能約束。同時,如何準(zhǔn)確獲取目標(biāo)運動狀態(tài)也是限制制導(dǎo)律性能的重要因素。因此,在考慮硬件性能及制導(dǎo)信息約束的前提下,設(shè)計滿足精度需求的制導(dǎo)律具有重要的應(yīng)用價值。
多約束條件下的導(dǎo)彈制導(dǎo)控制系統(tǒng)為典型的非線性系統(tǒng),現(xiàn)有的比例導(dǎo)引方法針對復(fù)雜條件的擴展性較差,而反演控制方式適用于復(fù)雜非線性系統(tǒng)且易于添加約束,因而被廣泛應(yīng)用于制導(dǎo)律的設(shè)計中[1-3]。實際工程中,三維有限時間收斂制導(dǎo)律具有很高的應(yīng)用價值[4-6]。文獻(xiàn)[7]應(yīng)用了反演設(shè)計方法和輸入-狀態(tài)穩(wěn)定性理論,設(shè)計了一種三維魯棒非線性導(dǎo)引律,在有限收斂時間內(nèi)提高了系統(tǒng)的魯棒性。而反演法在對虛擬項求導(dǎo)的過程中會產(chǎn)生極大的計算量,占用工程中的有限計算資源,被稱為“微分膨脹”。目前常用的解決這一問題的動態(tài)面控制法將反演法的虛擬控制量通過一階低通濾波器,獲得下一步迭代數(shù)據(jù)。文獻(xiàn)[8-9]將動態(tài)面控制技術(shù)應(yīng)用在導(dǎo)彈制導(dǎo)控制系統(tǒng)設(shè)計中,消除了“微分膨脹”問題,減少了制導(dǎo)過程計算量。但動態(tài)面控制制導(dǎo)(Dynamic Surface Control Guidance, DSCG)律對虛擬控制量過濾作用有限。Ramy[10]和Dong[11]等針對反演控制過程中的“微分膨脹”問題提出了一種指令濾波反演方法,在濾波器中加入阻尼和帶寬的限制來過濾虛擬信號。指令濾波反演方法也被應(yīng)用制導(dǎo)控制問題中[12],文獻(xiàn)[13]在高超聲速飛行器模型上應(yīng)用指令濾波反演控制,驗證了其對制導(dǎo)信號的有效跟蹤控制。
在確定控制方法的前提下,充分考慮飛行器其他部分對制導(dǎo)過程的約束對提高實際制導(dǎo)效果有很大提升[14]。其中自動駕駛儀的動態(tài)特性會對實際制導(dǎo)控制回路造成較大延遲,在制導(dǎo)律設(shè)計過程中加入自駕儀環(huán)節(jié)可以有效改善。此外,在追蹤目標(biāo)持續(xù)變向機動的過程中,實際額定過載會約束導(dǎo)彈的追蹤性能。文獻(xiàn)[15-16]在制導(dǎo)律設(shè)計過程中充分考慮了導(dǎo)彈自動駕駛儀的動態(tài)特性,改善了系統(tǒng)的整體性能。Chwa[17]應(yīng)用動態(tài)面方法解決了輸入飽和情況下的控制問題,文獻(xiàn)[18-19]也在考慮輸入飽和的前提下開展了制導(dǎo)控制設(shè)計工作。文獻(xiàn)[20]以平面內(nèi)彈目運動模型為基礎(chǔ),考慮自駕儀動態(tài)性能設(shè)計了一種過載指令約束導(dǎo)引律,對指令濾波器在非線性系統(tǒng)控制中的應(yīng)用做出了較為詳盡的解釋。文獻(xiàn)[21]基于指令濾波反推方案,使用已知目標(biāo)狀態(tài)信息設(shè)計了考慮控制飽和及自駕儀動態(tài)性能問題的三維制導(dǎo)律。
目標(biāo)加速度信息的準(zhǔn)確性對制導(dǎo)精度有很大影響,而在實際工程應(yīng)用中,目標(biāo)加速度信息往往難以直接獲取并直接運用到制導(dǎo)律中。為此本文引入擴張狀態(tài)觀測器(Extended State Observer, ESO)對目標(biāo)加速度進行估計。擴張狀態(tài)觀測器對非線性制導(dǎo)律中的未知制導(dǎo)信息具有很好的跟蹤效果[22]。文獻(xiàn)[23]在二維縱向平面的設(shè)計了二階與一階2個擴張狀態(tài)觀測器分別估計目標(biāo)加速度與目標(biāo)視線角速度信息。文獻(xiàn)[24]則是將由擴張狀態(tài)觀測器觀測的目標(biāo)加速度信息應(yīng)用到滑模制導(dǎo)律的設(shè)計中。實際制導(dǎo)信息獲取、傳輸過程中,信號噪聲 會對制導(dǎo)律以及加速度信號跟蹤造成影響,擴張狀態(tài)觀測器也應(yīng)具有一定的抗干擾能力。
由上述分析,反演控制方法在制導(dǎo)控制方面有很好的可用性,且約束項也對制導(dǎo)律設(shè)計提出了實踐要求。本文以導(dǎo)彈對目標(biāo)精確打擊為背景,通過擴張狀態(tài)觀測器估計目標(biāo)加速度。相較于現(xiàn)有的DSCG,本文改進了濾波器結(jié)構(gòu),顯著提高了制導(dǎo)精度。較于傳統(tǒng)的有限時間收斂制導(dǎo)(Finite-Time Convergent Guidance, FTCG)律[25],本文設(shè)計的指令濾波反演制導(dǎo)(Command Filter Back-stepping Guidance,CFBG)律,具有更快的收斂速度及更高的精度;同時增加了自動駕駛儀動態(tài)環(huán)節(jié)和飽和濾波環(huán)節(jié),使該制導(dǎo)方式更具有工程應(yīng)用價值。
導(dǎo)彈和目標(biāo)的相對位置關(guān)系在圖1的彈目視線坐標(biāo)系中進行表示,視線坐標(biāo)系Ox′y′z′由慣性系Oxyz依次繞y軸和z′軸旋轉(zhuǎn)-η、ε的角度得到,慣性系Ox軸同導(dǎo)彈初始速度方向相同。
彈目相對運動方程為
(1)
式中:r為導(dǎo)彈與目標(biāo)相對距離;ε和η分別為彈目視線傾角和視線偏角;aTr、aTε和aTη分別目標(biāo)在彈目視線坐標(biāo)系下x′、y′、z′ 3個方向的加速度;aMr、aMε和aMη為導(dǎo)彈在上述3個方向上的加速度。
圖1 導(dǎo)彈與目標(biāo)相對位置關(guān)系Fig.1 Relative position of missile and target
(2)
(3)
在對導(dǎo)彈進行控制的過程中,制導(dǎo)律計算出的加速度指令直接輸出給導(dǎo)彈的自動駕駛儀,自動駕駛儀通過調(diào)節(jié)舵或推進器來跟蹤加速度指令。因此,導(dǎo)彈最終獲得的加速度相較于加速度指令而言,總存在滯后現(xiàn)象。在應(yīng)用過程中,使用能較好描述自動駕駛儀動力學(xué)特性的二階系統(tǒng)應(yīng)用到制導(dǎo)律模型的建立、設(shè)計中。自動駕駛儀二階模型為
(4)
式中:aMi為在制導(dǎo)控制過程中實際獲得的加速度;ui為控制信號;ξ為動力學(xué)環(huán)節(jié)阻尼比;ωn為動力學(xué)環(huán)節(jié)固有頻率。
在實際應(yīng)用中,如果制導(dǎo)律產(chǎn)生的控制信號不受約束,會將最大的信號輸入到控制系統(tǒng)中。但由于自動駕駛儀的特性以及硬件的限制,并不能對加速度指令進行有效的跟蹤。這種情況會產(chǎn)生信號突變的“尖角問題”,給控制系統(tǒng)造成執(zhí)行負(fù)擔(dān)。在設(shè)計制導(dǎo)律模型的過程中,引入一個飽和函數(shù)對控制量進行約束,將其控制在系統(tǒng)機構(gòu)調(diào)節(jié)能力范圍之內(nèi),飽和函數(shù)為
(5)
式中:uM為已知的控制輸入信號的邊界(包括上界、下界)。
可得出制導(dǎo)律的數(shù)學(xué)模型為
(6)
式中:
(7)
式中:f(x1)為因變量;d為目標(biāo)在視線坐標(biāo)系下的加速度,通過擴張狀態(tài)觀測器估算獲得。在制導(dǎo)律設(shè)計過程中,主要對x2,即導(dǎo)彈在視線傾角與視線偏角方向的加速度進行控制。
在制導(dǎo)律數(shù)學(xué)模型(6)中,目標(biāo)加速度d難以通過觀測直接獲得,因此需要根據(jù)已知狀態(tài)對d進行估計。根據(jù)擴張狀態(tài)觀測器設(shè)計原則,以導(dǎo)彈法向速度x1為狀態(tài)變量求解誤差,將目標(biāo)加速度作為干擾項設(shè)計擴張狀態(tài)觀測器(ESO)[24]來估算目標(biāo)加速度:
(8)
式中:β1、β2為觀測器的反饋增益系數(shù);z2可以實現(xiàn)對d的有效跟蹤。為保證前后描述的一致性,后文目標(biāo)加速度仍用d表示。接下來對制導(dǎo)律控制量進行設(shè)計。Δz代表實際應(yīng)用中導(dǎo)彈的制導(dǎo)參數(shù)(x1、x2等)輸入到擴張狀態(tài)觀測器過程中產(chǎn)生的噪聲信號,在仿真實驗中會對Δz做更詳盡的定義。
根據(jù)滑??刂圃O(shè)計原則,對非線性系統(tǒng)的控制量進行設(shè)計時,首先定義跟蹤誤差Si[9]:
Si=xi-xici=1,2,3
(9)
式中:x1c為制導(dǎo)過程中所需的彈目視線切向速度;x2c、x3c為虛擬控制輸入量。該制導(dǎo)律模型為三階非線性系統(tǒng),需要3個設(shè)計環(huán)節(jié)完成設(shè)計。
步驟1由于x1為導(dǎo)彈在視線坐標(biāo)系Oy′z′面上的2個速度,需要收斂到0,因此x1c定義為0,因此S1實際可以寫為
S1=x1
(10)
S1的導(dǎo)數(shù)為
(11)
f(S1)可被分為2個部分:
(12)
式中:
(13)
式(13)為一個非線性耦合項并滿足以下性質(zhì):
(14)
定義一個李雅普諾夫函數(shù)為
(15)
對式(15)求導(dǎo)可得
(16)
(17)
(18)
(19)
步驟2定義跟蹤誤差S2為
S2=x2-x2c
(20)
通過式(6)對S2求導(dǎo)可得
(21)
(22)
(23)
(24)
步驟3定義跟蹤誤差S3為
S3=x3-x3c
(25)
對S3進行求導(dǎo)得
(26)
為了避免實際應(yīng)用過程中產(chǎn)生控制輸入飽和的問題,除了設(shè)計飽和函數(shù)sat(u)外,再引入一個輔助的一階低通濾波器。令
(27)
若Δu=0則不存在控制輸入飽和的現(xiàn)象,將Δu通過一階低通濾波器獲得xe:
(28)
式中:xe為通過濾波器后的飽和項,參數(shù)τe為
(29)
式中:設(shè)計參數(shù)K3應(yīng)滿足K3>0。當(dāng)xe=0時γ(xe)=1,當(dāng)xe≠0時γ(xe)=0。
綜上,控制信號u最終設(shè)計為
(30)
定理1對于制導(dǎo)律模型(6),在采用指令濾波器(18)、(23),一階濾波器(28),并進行反演設(shè)計時,閉環(huán)系統(tǒng)穩(wěn)定,被控制參數(shù)逐漸收斂。
證明濾波器輸出式(18)和式(23)在不考慮幅值及速率的附加約束下,經(jīng)過變換可得
(31)
ESO的穩(wěn)定性在文獻(xiàn)[26]中有詳細(xì)證明,本文不再給出。由工程經(jīng)驗可知,反饋增益系數(shù)、影響系統(tǒng)收斂速度和穩(wěn)定性,反饋增益系數(shù)越大,z2向d收斂的速度越快,但如果系數(shù)過大,系統(tǒng)易因超調(diào)過大而失穩(wěn)。具體參數(shù)選取在仿真實驗中進行詳細(xì)描述。
已知跟蹤誤差對時間的一階導(dǎo)數(shù),定義李雅普諾夫函數(shù)為
(32)
代入邊界層誤差y2并對V1s對時間的一階導(dǎo)數(shù)為
(33)
同理,跟蹤誤差S2對時間的一階導(dǎo)數(shù)為
(34)
定義李雅普諾夫函數(shù)為
(35)
其對時間的一階導(dǎo)數(shù)為
(36)
跟蹤誤差S3對時間的一階導(dǎo)數(shù)為
(37)
定義李雅普諾夫函數(shù)
(38)
其對時間的一階導(dǎo)數(shù)為
(39)
輸入飽和情況下定義李雅普諾夫函數(shù)為
(40)
其對時間的一階導(dǎo)數(shù)為
(41)
綜上所述,在證明濾波過程穩(wěn)定的前提下啊,對整個閉環(huán)系統(tǒng)其他部分定義李雅普諾夫函數(shù)
(42)
其對時間的一階導(dǎo)數(shù)為
(43)
通過設(shè)計合適的參數(shù),可以使參數(shù)滿足以下約束條件:
(44)
式(43)可以簡化為
(45)
滿足:
(46)
通過合理設(shè)計參數(shù)可以保證系統(tǒng)的穩(wěn)定性,使系統(tǒng)中速度矢量沿視線傾角和視線偏角的分量逐漸收斂于0,證畢。
利用數(shù)學(xué)仿真來檢驗設(shè)計的指令濾波反演制導(dǎo)(CFBG)律的有效性,通過與動態(tài)面控制制導(dǎo)(DSCG)律[9]有限時間收斂制導(dǎo)(FTCG)律[25]對比來突出指令濾波反演制導(dǎo)(CFBG)律的優(yōu)勢。其中DSCG采用相同ESO估計目標(biāo)加速度,F(xiàn)TCG采用ESO估計彈目視線角速率參與制導(dǎo),且不考慮自駕儀延遲環(huán)節(jié)。同時為比較3種制導(dǎo)律的收斂性,以相同的飽和函數(shù)sat(u)限制加速度。
導(dǎo)彈和目標(biāo)的位置、運動狀態(tài)通常需要地面雷達(dá)、基站進行標(biāo)記。因此仿真中給定狀態(tài)量都在地面慣性坐標(biāo)系中進行表示,通過坐標(biāo)系轉(zhuǎn)換即可得到視線坐標(biāo)系中的各個變量。仿真參數(shù)設(shè)計為:仿真步長h=0.001,單位為s,ESO的反饋增益參數(shù)與仿真步長有關(guān),設(shè)計為:β1=2/h,β2=1/h;CFBG的仿真參數(shù)設(shè)計為:ωn=20,ξ=0.6,N=4,K1=3,K2=5,K3=7,K4=60,ζm=0.8,ωm=220,uM=[-200 200]。以導(dǎo)彈攔截空中機動目標(biāo)為背景,設(shè)定導(dǎo)彈位置為坐標(biāo)原點,單位為m;目標(biāo)位置在T0=(3 000, 3 000,3 000), 單位為m,模擬導(dǎo)彈在末制導(dǎo)過程中無助推環(huán)節(jié)下對目標(biāo)的追蹤打擊。設(shè)計較大的初始偏差來檢驗制導(dǎo)律對導(dǎo)彈的控制效果,設(shè)導(dǎo)彈初速度Vm0=800 m/s,沿慣性系軸正向,則導(dǎo)彈與目標(biāo)初始視線傾角ε0=45°,視線偏角η0=45°。實際應(yīng)用中,導(dǎo)彈過載受到各方面的限制,設(shè)定導(dǎo)彈加速度上限為am,max=200 m/s2。
為探究設(shè)計制導(dǎo)律對機動目標(biāo)的跟蹤、制導(dǎo)效果,設(shè)計2種不同運動模式的目標(biāo)運動:在豎直方向上做往返加速的正弦運動和在有限時間內(nèi)的不規(guī)則躲避運動。慣性系中目標(biāo)初始速度均為VT0,單位m/s;目標(biāo)正弦運動加速度參數(shù)為:aTz=-30sin(πt/2) m/s2,aTx=0,aTy=0;目標(biāo)不規(guī)則運動加速度參數(shù)為:t<2 s時,aTx=-10 m/s2,aTy=-10 m/s2,aTz=0;2≤t<4 s時,aTx=-20 m/s2,aTy=0,aTz=0;t≥4 s時,aTx=0,aTy=-10 m/s2,aTz=-10 m/s2。在ESO跟蹤目標(biāo)加速度仿真中,通過隨機數(shù)模擬噪聲信號Δz,隨機數(shù)符合μ=0,σ2=1的高斯分布。考慮目標(biāo)加速度量級,增加幅值為5放大器,采樣時間為0.001 s。其他仿真實驗中定義Δz=0。仿真結(jié)果和分析如下:
圖2和圖3中,圖2(a)中曲線為目標(biāo)和3種制導(dǎo)律下導(dǎo)彈的運動軌跡,圖2(b)和圖3(b)、圖2(c)和圖3(c)、圖2(d)和圖3(d)中12 s后制導(dǎo)數(shù)據(jù)突變處為導(dǎo)彈命中目標(biāo)時刻,對制導(dǎo)過程無影響。圖2(e)和圖3(e)表示控制參數(shù)u、sat(u)以及加速度。
由表1、表2的導(dǎo)彈攔截目標(biāo)脫靶量及圖2(a)、圖3(a)的導(dǎo)彈攔截目標(biāo)過程可以看出,3種制導(dǎo)方式都可以控制導(dǎo)彈接近目標(biāo)并以較小脫靶量命中目標(biāo)。相較于DSCG和FTCG,CFBG彈道在約0~5 s內(nèi)偏移量較小,在制導(dǎo)后段,偏移量逐漸增加,符合能量利用原則。目標(biāo)做正弦運動時,CFBG脫靶量位于中間位置,但如果去除ESO而直接使用目標(biāo)加速度,則CFBG的命中精度要高于其他2種制導(dǎo)律;目標(biāo)做不規(guī)則運動時,CFBG的命中精度最高。CFBG與DSCG相比改進了濾波環(huán)節(jié),引入速率及帶寬的約束,使得制導(dǎo)精度有約50%的提高。由圖2(b)和圖3(b)可知,設(shè)計的ESO可以實現(xiàn)對目標(biāo)加速度的跟蹤,除在目標(biāo)加速度突變時刻有小量延遲外,其他時刻ESO的跟蹤精度均較高。ESOI表示在添加信號噪聲之后擴張狀態(tài)觀測器的跟蹤曲線,可以看到當(dāng)噪聲信號在所觀測加速度信號中占比較大的影響下,ESO也能對加速度信號進行準(zhǔn)確跟蹤。從圖2(c)、圖2(d)和圖3(c)和圖3(d)可知3種制導(dǎo)方式都通過零化視線角速率的方式實現(xiàn)對目標(biāo)的追蹤。CFBG和DSCG 2種制導(dǎo)方式下彈目視線角速率收斂更快,在7 s左右實現(xiàn)收斂,F(xiàn)TCG收斂速度略慢于其他2種,尤其是在視線偏角方向上需要在9~10 s的時間段內(nèi)實現(xiàn)收斂。在目標(biāo)正弦運動過程中,F(xiàn)TCG在接近目標(biāo)時視線角速率也發(fā)生了類正弦的變化趨勢。結(jié)合目標(biāo)不規(guī)則運動結(jié)果,可以看出FTCG在攔截做法向運動的目標(biāo)的過程中,追蹤反應(yīng)要慢于CFBG和DSCG。由圖2(e)和圖3(e)可以看出,未經(jīng)約束的控制輸出u超過最大控制量,經(jīng)過飽和函數(shù)sat(u)約束后成功控制在200以內(nèi),但是頻率較高,不適合直接輸入到導(dǎo)彈模型中。通過低通濾波器可以得到最終相對平穩(wěn)的加速度指令。
2種目標(biāo)運動模式下脫靶量和制導(dǎo)參數(shù)如表1和表2所示。
圖2 目標(biāo)正弦運動仿真結(jié)果Fig.2 Simulation results of target sinusoidal motion
表1 目標(biāo)正弦運動脫靶量Table 1 Miss distance of target sinusoidal motion
表2 目標(biāo)不規(guī)則運動脫靶量Table 2 Miss distance of target irregular motion
本文基于指令濾波反演控制、有限時間穩(wěn)定理論、擴張狀態(tài)觀測方法,設(shè)計了一種同時考慮自動駕駛儀動態(tài)特性、控制輸入飽和目標(biāo)加速度未知問題的制導(dǎo)律。主要工作及結(jié)論如下:
1) 為獲取目標(biāo)加速度信息,設(shè)計了一種有限時間收斂的擴張狀態(tài)觀測器,可以實現(xiàn)對目標(biāo)加速度的有效跟蹤。
2) 在制導(dǎo)律中加入自動駕駛儀二階動態(tài)環(huán)節(jié)及飽和過濾環(huán)節(jié),并設(shè)計了一種指令濾波反演制導(dǎo)律,保證在有限時間內(nèi)彈目視線角速率零化。