張大元,雷虎民,吳 玲,邵 雷,王 君
(1.空軍工程大學(xué)防空反導(dǎo)學(xué)院,西安 710051;2.遼寧大學(xué),沈陽 110036)
基于LQR的彈道跟蹤制導(dǎo)律設(shè)計(jì)①
張大元1,雷虎民1,吳 玲2,邵 雷1,王 君1
(1.空軍工程大學(xué)防空反導(dǎo)學(xué)院,西安 710051;2.遼寧大學(xué),沈陽 110036)
針對(duì)防空導(dǎo)彈彈道跟蹤問題,基于線性二次型調(diào)節(jié)器(LQR)理論設(shè)計(jì)了2種彈道跟蹤制導(dǎo)律。首先,以時(shí)間為自變量,對(duì)導(dǎo)彈質(zhì)點(diǎn)運(yùn)動(dòng)模型線性化,得到第一種線性化模型;接著,為提高模型精度和允許擾動(dòng)范圍,以導(dǎo)彈X坐標(biāo)為自變量對(duì)導(dǎo)彈質(zhì)點(diǎn)運(yùn)動(dòng)模型線性化,得到第二種線性化模型;然后,針對(duì)2種線性化模型,利用LQR理論分別設(shè)計(jì)跟蹤制導(dǎo)律,并給出制導(dǎo)指令計(jì)算公式和制導(dǎo)流程;最后,在一定外界干擾作用下,將所設(shè)計(jì)2種跟蹤制導(dǎo)律應(yīng)用于導(dǎo)彈質(zhì)點(diǎn)運(yùn)動(dòng)仿真,并從抑制隨機(jī)風(fēng)干擾、消除初始偏差等方面對(duì)2種制導(dǎo)律進(jìn)行比較。結(jié)果表明,2種制導(dǎo)律都能實(shí)現(xiàn)彈道精確跟蹤,且基于第2種線性化模型設(shè)計(jì)的跟蹤制導(dǎo)律各項(xiàng)性能均優(yōu)于第1種跟蹤制導(dǎo)律,說明基于導(dǎo)彈X坐標(biāo)線性化的模型精確度較高,適用于彈道跟蹤制導(dǎo)律的設(shè)計(jì)。
彈道跟蹤;制導(dǎo)律;最優(yōu)控制;防空導(dǎo)彈
飛行器軌跡優(yōu)化可大大提高其飛行性能[1-5]。然而,大氣中存在各種干擾,跟蹤基準(zhǔn)軌跡時(shí)也存在各種初始偏差,使得飛行器并不能理想跟蹤優(yōu)化軌跡。因此,需要設(shè)計(jì)軌跡跟蹤制導(dǎo)律,保證飛行器按照理想彈道飛行[4]。軌跡優(yōu)化和跟蹤一直是飛行器領(lǐng)域研究的熱點(diǎn),許多非線性控制律被用于再入飛行器(RLV)和無人機(jī)的軌跡優(yōu)化和跟蹤,取得了較好的跟蹤效果[6-11];為提高遠(yuǎn)程防空導(dǎo)彈中制導(dǎo)段飛行性能,湯善同等研究了防空導(dǎo)彈的中制導(dǎo)彈道優(yōu)化和彈道跟蹤制導(dǎo)律問題[4];文獻(xiàn)[9]則采用幾何原理研究了一種非線性方案彈道跟蹤算法;Dukeman G A,Zhou W Y等先后將線性二次型調(diào)節(jié)器理論(LQR)用于再入飛行器的彈道跟蹤中[10-11],取得了較好效果,且易于實(shí)現(xiàn)。
本文利用LQR理論設(shè)計(jì)跟蹤制導(dǎo)律,但采用不同的自變量對(duì)導(dǎo)彈質(zhì)點(diǎn)運(yùn)動(dòng)模型線性化,得到2個(gè)不同的模型?;谶@2個(gè)模型,分別設(shè)計(jì)了彈道跟蹤制導(dǎo)律,并對(duì)其進(jìn)行了仿真比較,得出了一些有益結(jié)論。
為簡化問題討論,考慮導(dǎo)彈在縱向平面內(nèi)運(yùn)動(dòng),其質(zhì)點(diǎn)運(yùn)動(dòng)數(shù)學(xué)模型為[12]
其中,m、S為導(dǎo)彈質(zhì)量和參考面積;V為速度;P為發(fā)動(dòng)機(jī)推力;θ為彈道傾角;q為動(dòng)壓;g重力加速度;Cx、Cy為阻力系數(shù)和升力系數(shù),其計(jì)算公式為
導(dǎo)彈氣動(dòng)系數(shù)[13]如圖1所示。導(dǎo)彈質(zhì)量和發(fā)動(dòng)機(jī)特性如圖2所示。
圖1 導(dǎo)彈氣動(dòng)參數(shù)Fig.1 Dynamic coefficients
圖2 導(dǎo)彈發(fā)動(dòng)機(jī)推力特性和質(zhì)量變化Fig.2 Curve of trust and mass
大氣密度ρ和重力加速度g計(jì)算公式為
式中 ρ0=1.225 0 kg/m3為地面處空氣密度;hp=7 254.3 m,g0=9.806 m/s2,Re=6 371 km,計(jì)算重力加速度時(shí),略去地球橢球性及自轉(zhuǎn)影響。
2.1 線性二次型調(diào)節(jié)器理論
根據(jù)線性二次型調(diào)節(jié)器理論,對(duì)式(4)線性系統(tǒng):
其中,Q、R為權(quán)重矩陣,且Q半正定,R正定。該指標(biāo)物理意義為設(shè)計(jì)控制變量u,使用最少的控制能量,使得狀態(tài)量x在整個(gè)控制過程中最小。根據(jù)LQR理論,存在最優(yōu)控制變量u*=-Koptx,使得上述指標(biāo)最小,且反饋系數(shù)Kopt為
所謂彈道跟蹤問題就是希望導(dǎo)彈實(shí)際飛行彈道與給定彈道參數(shù)(如位置、彈道傾角等)偏差最小,因此,可選定全部或部分彈道參數(shù)的偏差作為狀態(tài)變量,建立線性化狀態(tài)空間方程,選定式(5)所示的性能指標(biāo),使用LQR理論設(shè)計(jì)最優(yōu)反饋增益Kopt,使得彈道偏差最小。顯然,非線性模型(1)不能直接用于LQR理論設(shè)計(jì)彈道跟蹤制導(dǎo)律。下面選擇不同的自變量將導(dǎo)彈運(yùn)動(dòng)模型線性化,然后利用線性化的模型近似替代該質(zhì)點(diǎn)模型,設(shè)計(jì)跟蹤制導(dǎo)律。
2.2 線性化模型I
在小擾動(dòng)假設(shè)條件下,以時(shí)間為自變量,在優(yōu)化彈道附近對(duì)導(dǎo)彈質(zhì)點(diǎn)運(yùn)動(dòng)模型(1)線性化,得含有氣動(dòng)力系數(shù)、動(dòng)壓和氣動(dòng)力系數(shù)導(dǎo)數(shù)項(xiàng)的線性化方程[12]:
式中 Aɑ為聲速;下標(biāo)“0”代表導(dǎo)彈在標(biāo)稱優(yōu)化彈道上的值。
在戰(zhàn)術(shù)導(dǎo)彈設(shè)計(jì)階段,一般首先進(jìn)行速度特性設(shè)計(jì),從而確定發(fā)動(dòng)機(jī)參數(shù);而在制導(dǎo)律設(shè)計(jì)中,僅設(shè)計(jì)縱向和側(cè)向過載指令,彈體軸向不進(jìn)行控制。因此,可假設(shè)導(dǎo)彈速度V和X坐標(biāo)不可控,從而將速度方程和X方程從方程組中除去,限制導(dǎo)彈攻角絕對(duì)值小于20°,則有sin α≈α,得彈道坐標(biāo)系下導(dǎo)彈縱向過載:
2.3 線性化模型II
在上面的線性化過程,以導(dǎo)彈運(yùn)動(dòng)時(shí)間為自變量,戰(zhàn)術(shù)導(dǎo)彈飛行時(shí)間一般較短,在幾十秒到一百秒的范圍內(nèi),而導(dǎo)彈飛行距離則較大,可達(dá)幾十公里至一百公里。因此,如果選擇導(dǎo)彈運(yùn)動(dòng)X坐標(biāo)作為自變量,使用固化系數(shù)法,認(rèn)為導(dǎo)彈在與基準(zhǔn)彈道的坐標(biāo)X偏差較小時(shí)氣動(dòng)參數(shù)不變,可得到新的線性化模型。
由前面分析知,導(dǎo)彈速度幾乎不可控,從而將速度方程從方程組中除去;選擇X坐標(biāo)作為獨(dú)立變量,從而除去時(shí)間變量,得新的導(dǎo)彈運(yùn)動(dòng)方程:
同理,取擾動(dòng)系統(tǒng)的狀態(tài)變量x=[Δy Δθ]T,取彈道縱向過載為控制量,即u=Δny,由式(9)可得新的擾動(dòng)系統(tǒng)狀態(tài)方程:
2.4 跟蹤制導(dǎo)律及其工作流程
由2.1節(jié)跟蹤問題的描述和LQR理論,使用上述2個(gè)線性化模型分別進(jìn)行設(shè)計(jì),可得反饋控制律:
使得導(dǎo)彈縱坐標(biāo)偏差Δy和彈道傾角偏差Δθ最小,且需用過載u較小。設(shè)計(jì)步驟如下:
Step1:在優(yōu)化彈道上按時(shí)間或X坐標(biāo)等間隔取樣,按照式(11)或式(13)獲得導(dǎo)彈擾動(dòng)運(yùn)動(dòng)的線性化模型參數(shù);
Step2:按照式(5)、式(6)、式(7)選擇權(quán)重指標(biāo),計(jì)算最優(yōu)反饋增益矩陣Kopt;
Step3:將Kopt和標(biāo)準(zhǔn)優(yōu)化彈道數(shù)據(jù)一并保存在彈載彈道數(shù)據(jù)庫中,在導(dǎo)彈飛行過程中,按照時(shí)間或X坐標(biāo)節(jié)點(diǎn)取用,按式(15)計(jì)算導(dǎo)彈運(yùn)動(dòng)狀態(tài)偏差:
跟蹤制導(dǎo)律閉環(huán)制導(dǎo)工作流程如圖3所示。
由圖3知,制導(dǎo)基本流程:首先,彈上慣導(dǎo)系統(tǒng)和彈載計(jì)算機(jī)測量、計(jì)算導(dǎo)彈運(yùn)動(dòng)狀態(tài),與彈上存儲(chǔ)基準(zhǔn)彈道相比較得出偏差量;然后,根據(jù)飛行時(shí)間或X坐標(biāo),從彈上計(jì)算機(jī)的基準(zhǔn)彈道數(shù)據(jù)庫中取出相應(yīng)最優(yōu)反饋增益,計(jì)算偏差控制量Δny和總控制量ny,控制導(dǎo)彈沿標(biāo)稱彈道飛行。
圖3 LQR彈道跟蹤制導(dǎo)律工作流程Fig.3 Flow chart of LQR guidance law
為驗(yàn)證所設(shè)計(jì)的彈道跟蹤制導(dǎo)律有效性,將其應(yīng)用于導(dǎo)彈質(zhì)點(diǎn)運(yùn)動(dòng)仿真。首先,給出干擾添加方法。
3.1 隨機(jī)風(fēng)干擾數(shù)學(xué)模型
由文獻(xiàn)[12]知,干擾力可等效為附加攻角,干擾攻角計(jì)算方法和步驟如下所示。
Step1:生成隨機(jī)地面風(fēng)根據(jù)風(fēng)級(jí)定義,取μ=0,σ=4 m/s,則
式中 U0為地面垂直風(fēng);W0為水平風(fēng);rɑndn為單位隨機(jī)數(shù);μ為均值;σ為均方差。
Step2:生成高空風(fēng)
式中 U為高空垂直風(fēng);W為高空水平風(fēng);ρ0為地面處大氣密度;ρ為高空大氣密度。
Step3:計(jì)算干擾攻角分量
式中 Δα1為高空垂直風(fēng)引起的干擾攻角;Δα2為高空水平風(fēng)引起的干擾攻角;θ為導(dǎo)彈彈道傾角。
圖4 等效干擾攻角Fig.4 Equivalent disturbance angle
3.2 仿真實(shí)驗(yàn)
仿真分別驗(yàn)證制導(dǎo)律抑制隨機(jī)風(fēng)干擾的能力、消除初始偏差的能力和對(duì)氣動(dòng)參數(shù)攝動(dòng)的魯棒性。仿真中認(rèn)為,消除Δy、Δθ偏差和控制能量小的重要性一樣。因此,制導(dǎo)律權(quán)重系數(shù)矩陣均為
仿真中,導(dǎo)彈運(yùn)動(dòng)初始條件為X=0 m,Y=100 m,V=100 m/s,θ=90°。為簡明起見,以下跟蹤制導(dǎo)律1代表使用以時(shí)間為自變量得到的線性化模型所設(shè)計(jì)的跟蹤制導(dǎo)律,跟蹤制導(dǎo)律2代表使用以X坐標(biāo)為自變量所得到的線性化模型設(shè)計(jì)的跟蹤制導(dǎo)律。
仿真一:抑制隨機(jī)風(fēng)干擾的能力
令各種初始偏差為0,隨機(jī)干擾見3.1節(jié),分別使用2種LQR跟蹤制導(dǎo)律跟蹤某基準(zhǔn)彈道,仿真結(jié)果見圖5、圖6及表1。
由圖5、圖6和表1的統(tǒng)計(jì)結(jié)果可知:
(1)基于2種線性化模型所設(shè)計(jì)的LQR彈道跟蹤制導(dǎo)律,均能有效抑制隨機(jī)風(fēng)的干擾,保證導(dǎo)彈精確的跟蹤理想彈道;但是,跟蹤制導(dǎo)律2在ΔY上控制效果較好。
(2)ΔX、ΔV較大,這是由于設(shè)計(jì)制導(dǎo)律時(shí)沒有考慮這兩項(xiàng)的緣故,但與開環(huán)控制情形相比,ΔX減小約40%,ΔV僅有開環(huán)誤差的60%。
(3)由圖6控制量曲線可知,基于X線性化模型的制導(dǎo)律2控制量小于制導(dǎo)律1控制量,且較為平穩(wěn)。
綜上,可認(rèn)為基于X變量線性化得到的模型所設(shè)計(jì)的跟蹤制導(dǎo)律效果要好于基于時(shí)間線性化得到的制導(dǎo)律。這是因?yàn)樵谝詴r(shí)間為自變量的線性化過程中,直接將受控性較小的X狀態(tài)方程忽略,引起一些不必要的誤差。而以X為自變量的線性化過程,首先將該狀態(tài)方程引入其他方程;然后,才是線性化過程。所以,引起控制效果不同。
圖5 彈道曲線Fig.5 Curve of trajectory
圖6 誤差量變化曲線Fig.6 Curve of errors
表1 仿真結(jié)果統(tǒng)計(jì)Table 1 Statistical data of simulation results
仿真二:消除初始誤差的能力
為檢驗(yàn)制導(dǎo)律消除單項(xiàng)初始偏差的性能,當(dāng)其中一個(gè)偏差存在時(shí),其余初始偏差為零,4次仿真中使用同一組隨機(jī)風(fēng)干擾(見3.1節(jié))。4種仿真情形的初始偏差值見表2。由于數(shù)據(jù)較多,此處僅給出各誤差量仿真結(jié)果,如圖7、圖8(圖例ΔX代表該偏差項(xiàng)不為零,其他初始偏差為零時(shí)的仿真結(jié)果)所示。開環(huán)控制誤差見表3。由圖7、圖8及表3的數(shù)據(jù)可知:
(1)X初始偏差引起開環(huán)控制ΔY急劇增大(達(dá)513 m);但對(duì)2種制導(dǎo)律影響較小(情形1數(shù)據(jù))。因此,2種制導(dǎo)律對(duì)X初始偏差都不敏感。
表2 仿真初始偏差Table 2 Initial simulation errors
圖7 X、Y和V誤差變化曲線Fig.7 Curve of errors for X、Y and V
(2)由情形二數(shù)據(jù)可知,制導(dǎo)律1對(duì)Y的初始偏差十分敏感,其ΔX甚至大于開環(huán)值,而 ΔY誤差高達(dá)-100,同時(shí)速度跟蹤性能急劇下降,ΔV也大于開環(huán),Δθ達(dá)-16°,原因可由圖7分析得到:制導(dǎo)律1為消除初始Y偏差,使V急劇變化,引起θ急劇變化,使得彈道跟蹤失穩(wěn),性能變差;相比之下,制導(dǎo)律2則能較快消除初始Y偏差,其他誤差也較小,性能優(yōu)異。
(3)情形三數(shù)據(jù)表明,速度初始偏差對(duì)2種制導(dǎo)律影響都較大,不管開環(huán)還是閉環(huán)制導(dǎo),X坐標(biāo)偏差均變大,這是由于制導(dǎo)律設(shè)計(jì)時(shí)沒有對(duì)X偏差進(jìn)行修正;速度初始偏差對(duì)開環(huán)ΔY影響較大,可達(dá)2 692 m;但2種制導(dǎo)律都能夠消除速度初始偏差帶來的影響,效果較好;與制導(dǎo)律1相比,制導(dǎo)律2對(duì)ΔY的調(diào)節(jié)速度快,性能優(yōu)于制導(dǎo)律1。
(4)彈道傾角的初始偏差對(duì)開環(huán)彈道影響很大,ΔX、ΔY、ΔV、Δθ達(dá)到-5 119 m、6 061 m、-75 m/s、3.9°,而兩種制導(dǎo)律均能較好消除初始彈道傾角偏差,其他偏差也較小。
圖8 彈道傾角誤差變化曲線Fig.8 Curve of errors for Δθ
表3 誤差范圍統(tǒng)計(jì)Table 3 Range statistics of errors
(1)為保證防空導(dǎo)彈沿優(yōu)化彈道飛行,必須設(shè)計(jì)彈道跟蹤制導(dǎo)律實(shí)施閉環(huán)制導(dǎo),否則將造成較大誤差。
(2)本文設(shè)計(jì)的2種制導(dǎo)律在小范圍氣動(dòng)參數(shù)攝動(dòng)的情況下,具有抑制隨機(jī)風(fēng)干擾的能力,在整個(gè)飛行過程中,彈道跟蹤效果較好;2種制導(dǎo)律都具有消除初始偏差的能力,但制導(dǎo)律1對(duì)Y坐標(biāo)初始偏差較為敏感;制導(dǎo)律2總體性能要優(yōu)于制導(dǎo)律1,由于制導(dǎo)律設(shè)計(jì)方法一樣,因此可認(rèn)為基于X坐標(biāo)的線性化模型效果好。
[1]李新國,王晨曦,王文虎.基于修正Newton法的固體火箭能量管理彈道設(shè)計(jì)[J].固體火箭技術(shù),2013,36(1):1-5.
[2]趙欣,閆循良,張金生,等.助推-滑翔導(dǎo)彈再入彈道快速優(yōu)化[J].固體火箭技術(shù),2012,35(4):427-433.
[3]Levy M,Shima T,Gutman S.Linear quadratic integrated versus separated autopilot-guidance design[J].Journal of Guidance,Control,and Dynamics,2013,36(6):1722-1730.
[4]湯善同,韓松臣.H∞控制在跟蹤優(yōu)化彈道自動(dòng)駕駛儀設(shè)計(jì)中應(yīng)用[J].系統(tǒng)工程與電子技術(shù),2002,24(9):62-65.
[5]谷學(xué)強(qiáng),王楠,陳璟,等.基于魯棒多目標(biāo)優(yōu)化方法的UCAV武器投放規(guī)劃[J].系統(tǒng)工程與電子技術(shù),2013,35(4):753-760.
[6]Hakim Bouadi F,Mora-Camino.Aircraft trajectory tracking by nonlinear spatial inversion[C]//AIAA Guidance,Navigation,and Control Conference.Minneapolis,Minnesota,2012.
[7]Pu Z Q,Tan X M,F(xiàn)an G L,et al.Design of entry trajectory tracking law for a hypersonic vehicle via inversion control[C]//Proc.of the 10th World Congress on Intelligent Control and Automation,2012:1092-1097.
[8]Yi Luo,Abraham K I,Kalmanje S Krishnakumar.Optimal lateral trajectory tracking using backstepping with a fully tuned growing RBF neural network[C].Garden Grove,California USA,June 19-21,2012.
[9]Park S,Deyst J,How J P.A new nonlinear guidance logic for trajectory tracking[C]//AIAA Guidance,Navigation,and Control Conference and Exhibit.Rhode Island,2004.
[10]Greg A Dukeman.Profile-following entry guidance using linear quadratic regulator theory[C]//AIAA Guidance,Navigation,and Control Conference and Exhibit.Monterey,California,2002.
[11]Zhou W Y,Tan S J,Chen H B.A simple reentry trajectory generation and tracking scheme for common aero vehicle[C]//AIAA Guidance,Navigation,and Control Conference.Minneapolis,Minnesota,2012.
[12]李新國,方群.導(dǎo)彈飛行力學(xué)[M].西安:西北工業(yè)大學(xué)出版社,2005.
[13]Muzumdar D V.Guidance laws for a short-range attack missile[D].Austin:University of Texas.1995.
(編輯:薛永利)
A trajectory tracking guidance law based on LQR
ZHANG Da-yuan1,LEI Hu-min1,WU Ling2,SHAO Lei1,WANG Jun1
(1.Air and Missile Defense College,Air Force Engineering University,Xi’an 710051,China;2.Liaoning University,Shenyang 110036,China)
Two trajectory tracking guidance laws were designed based on the theory of linear quadratic regulator(LQR),which can help to solve the problem of trajectory tracking for surface-to-air missile.Firstly,the variable of time was chosen to linearize the missile mass model to get the first linear model,and then,the coordinate variable of X axial was chosen to linearize the missile mass model to get the other linear model,which was more accurate;secondly,two trajectory tracking guidance laws were proposed with theory of linear quadratic regulator(LQR)and the two linear models given above,the flow chart of the guidance system was proposed too.Finally both of the laws were evaluated in simulations with uncertain disturbances,and were compared in two aspects as the ability to deal with disturbances and to remove the initial error.Results show that both laws can assure the trajectory tracking accurately,but the second one behaves better than the first one.
trajectory tracking;guidance law;optimal control;surface-to-air missile
V448.23
A
1006-2793(2014)06-0763-06
10.7673/j.issn.1006-2793.2014.06.005
2013-12-02;
2013-12-30。
張大元(1987—),男,博士,研究方向?yàn)橄冗M(jìn)防御技術(shù)、導(dǎo)彈制導(dǎo)與控制技術(shù)以及武器系統(tǒng)仿真技術(shù)。E-mail:dayuanyjs@163.com