袁宴波,張科,薛曉東
(1.西北工業(yè)大學(xué)航天學(xué)院,陜西西安 710072;2.中國(guó)空空導(dǎo)彈研究院第12研究所,河南洛陽(yáng) 471009)
基于Radau偽譜法的制導(dǎo)炸彈最優(yōu)滑翔彈道研究
袁宴波1,2,張科1,薛曉東2
(1.西北工業(yè)大學(xué)航天學(xué)院,陜西西安 710072;2.中國(guó)空空導(dǎo)彈研究院第12研究所,河南洛陽(yáng) 471009)
基于Radau偽譜法求解最優(yōu)控制問題的原理,研究了滑翔型制導(dǎo)炸彈的最大射程優(yōu)化問題。對(duì)制導(dǎo)炸彈動(dòng)力學(xué)模型進(jìn)行了無量綱化處理,結(jié)合極小值原理推導(dǎo)了最優(yōu)控制軌跡的解析解和一階必要性條件,采用Radau偽譜法將彈道優(yōu)化問題轉(zhuǎn)化為非線性規(guī)劃問題,基于協(xié)態(tài)映射原理給出了數(shù)值解的最優(yōu)性驗(yàn)證方法。仿真結(jié)果表明,Radau偽譜法能夠提供具有工程應(yīng)用價(jià)值的最優(yōu)解,與常規(guī)的最大升阻比滑翔彈道相比,優(yōu)化后的彈道射程增加10%以上。
兵器科學(xué)與技術(shù);滑翔制導(dǎo)炸彈;彈道優(yōu)化;Radau偽譜法
當(dāng)前,相當(dāng)多的制導(dǎo)炸彈采用了大升阻比氣動(dòng)外形設(shè)計(jì),如美國(guó)的JDAM-ER、SDB,中國(guó)的LS-6等。此類滑翔型制導(dǎo)炸彈具有很強(qiáng)的滑翔能力,因此射程較遠(yuǎn),可以實(shí)現(xiàn)防區(qū)外對(duì)地精確打擊。由于制導(dǎo)炸彈本身沒有動(dòng)力,僅能依靠投放高度勢(shì)能和投放初速度動(dòng)能來實(shí)現(xiàn)較遠(yuǎn)的滑翔距離。采用怎樣的彈道規(guī)劃策略才能實(shí)現(xiàn)最遠(yuǎn)的滑翔距離,是一個(gè)具有現(xiàn)實(shí)意義的問題。最常用的彈道規(guī)劃方案是將彈道劃分為滑翔段和俯沖攻擊段(如圖1所示):在滑翔段按照最大升阻比對(duì)應(yīng)的攻角來進(jìn)行飛行控制,在俯沖攻擊段按照比例導(dǎo)引的形式進(jìn)行彈道控制。然而,這種彈道規(guī)劃方案只是一種經(jīng)驗(yàn)上的方法,并不是理論上的最優(yōu)結(jié)果。
圖1 滑翔型制導(dǎo)炸彈常規(guī)彈道示意圖Fig.1 Conventional trajectory of glide guided bomb
實(shí)際上,制導(dǎo)炸彈的彈道優(yōu)化問題可以歸結(jié)為帶有狀態(tài)約束和控制約束的非線性最優(yōu)控制問題,其求解方法一般分為間接法和直接法[1]。間接法基于 Pontryagin極值原理將最優(yōu)控制問題轉(zhuǎn)換成Hamiltonian兩點(diǎn)邊值(HBVP)問題,其優(yōu)點(diǎn)是能夠滿足一階最優(yōu)性必要條件,能夠精確求得協(xié)態(tài)變量和控制變量。但是由于保證HBVP問題收斂的協(xié)態(tài)變量沒有物理意義,其初值很難估計(jì),同時(shí)還存在收斂半徑小,對(duì)初始值敏感等問題,HBVP的求解是非常困難的。直接法是采用參數(shù)化方法將連續(xù)空間的最優(yōu)控制問題轉(zhuǎn)化成非線性規(guī)劃(NLP)問題,而NLP問題有很多成熟的數(shù)值解法。由于直接法對(duì)狀態(tài)微分方程進(jìn)行了離散化,因此由直接法求得的協(xié)態(tài)變量和控制變量精度比間接法稍差。
偽譜法是最近發(fā)展的一類求解最優(yōu)控制問題的方法,該方法融合了間接法和直接法的優(yōu)點(diǎn):不僅能夠獲得最優(yōu)控制問題的數(shù)值解,而且可以提供協(xié)態(tài)變量的精確信息[2]。因而偽譜法在最優(yōu)控制問題的數(shù)值解法方面,特別是飛行器軌跡優(yōu)化方面逐漸流行并成為研究熱點(diǎn)。常見的偽譜方法包括:Legendre偽譜法(LPM)、Gauss偽譜法(GPM)以及Radau偽譜法(RPM)。文獻(xiàn)[3]對(duì)上述3種方法的計(jì)算精度、計(jì)算效率等方面進(jìn)行了比較研究,指出GPM和RPM精度相當(dāng),并且均略優(yōu)于LPM,而在計(jì)算效率方面3種方法差別不大。文獻(xiàn)[4]基于GPM對(duì)無人攻擊機(jī)(UCAV)對(duì)地攻擊武器的投放軌跡進(jìn)行了優(yōu)化計(jì)算;文獻(xiàn)[5]利用GPM進(jìn)行了助推-滑翔導(dǎo)彈的彈道優(yōu)化研究。但是對(duì)于飛行器的軌跡優(yōu)化問題,離散解的最優(yōu)性驗(yàn)證在文獻(xiàn)中還是很少見。
本文采用RPM來求解制導(dǎo)炸彈的最優(yōu)滑翔彈道,基于極小值原理推導(dǎo)了問題的解析解和最優(yōu)性一階必要條件,同時(shí)基于協(xié)態(tài)映射原理[6]給出了數(shù)值解的最優(yōu)性驗(yàn)證方法,并對(duì)數(shù)值解的最優(yōu)性進(jìn)行了比較全面的驗(yàn)證。
1.1 狀態(tài)方程及其無量綱化
進(jìn)行彈道優(yōu)化時(shí)主要關(guān)注制導(dǎo)炸彈鉛垂平面內(nèi)的運(yùn)動(dòng),不考慮地球自轉(zhuǎn)的影響,并假定重力加速度g為常值,則制導(dǎo)炸彈的運(yùn)動(dòng)可用如下簡(jiǎn)化方程進(jìn)行描述:
將以上各相對(duì)量(角度沒有相對(duì)量形式)代入(1)式中得到無量綱化的狀態(tài)方程:
下文為表述方便,省去式中的上標(biāo)。在制導(dǎo)炸彈彈道優(yōu)化問題中,僅考慮鉛垂平面運(yùn)動(dòng)的情況下,炸彈運(yùn)動(dòng)軌跡的改變?nèi)Q于攻角α,取控制量為攻角α.
1.2 過程約束
過程約束即炸彈在飛行過程中彈道參數(shù)必須滿足的約束條件。一般地,由于彈體結(jié)構(gòu)強(qiáng)度和操縱舵能力的限制,炸彈法向過載不能超過限制值。法向過載定義為
另外,炸彈飛行速度不能超出設(shè)計(jì)范圍太多,因此,應(yīng)滿足彈道最小速度約束。同時(shí),作為控制量的攻角必須在設(shè)計(jì)范圍內(nèi)變化,并且變化速率不能太快,故攻角的幅值和變化率受到上限約束。綜上,過程約束如下:
1.3 邊界條件
邊界條件包括初始邊界條件和終端邊界條件。初始邊界條件即炸彈投放時(shí)刻狀態(tài)變量的初值,是完全給定的,即
終端邊界條件是指制導(dǎo)炸彈在彈道終點(diǎn)需滿足的條件,通常有落地速度與落地彈道傾角的要求,即
1.4 性能指標(biāo)
制導(dǎo)炸彈彈道優(yōu)化的目的是增大射程,以x(tf)表示彈道終點(diǎn)處射程,射程取極大值等效為-x(tf)取極小值,故取性能指標(biāo)為
1.5 最優(yōu)控制的一階必要條件
上述彈道優(yōu)化問題對(duì)應(yīng)的最優(yōu)控制問題可描述為:在時(shí)間區(qū)間[t0,tf](其中tf自由)中,尋找最優(yōu)控制變量α*(t),使(10)式中的性能指標(biāo)J取極小值,并使?fàn)顟B(tài)變量[x,y,v,θ]T和控制變量α(t)滿足狀態(tài)微分方程(5)式、過程約束(7)式、邊界條件(8)式和(9)式。
根據(jù)最優(yōu)控制理論,上述最優(yōu)控制問題的哈密頓函數(shù)為
本文將采用RPM求解上述最優(yōu)控制問題,并驗(yàn)證偽譜法求得的結(jié)果滿足最優(yōu)性一階必要條件。
RPM求解最優(yōu)控制問題的基本原理為:將未知的狀態(tài)變量和控制變量在一系列 Legendre-Gauss-Radau(LGR)點(diǎn)上離散化,構(gòu)造全局插值多項(xiàng)式來逼近狀態(tài)變量和控制變量,再通過對(duì)狀態(tài)變量求導(dǎo)來代替動(dòng)力學(xué)微分方程。這樣,連續(xù)系統(tǒng)最優(yōu)控制問題被轉(zhuǎn)化為受一系列代數(shù)約束的NLP問題[7],可以采用數(shù)值方法求解。RPM離散最優(yōu)控制問題的主要流程[8]如下。
2.1 時(shí)域變換
2.2 全局插值多項(xiàng)式近似狀態(tài)變量和控制變量
用RPM處理連續(xù)時(shí)間最優(yōu)控制問題時(shí),需要在一系列LGR離散點(diǎn)上對(duì)控制變量和狀態(tài)變量進(jìn)行全局插值多項(xiàng)式逼近。控制變量在1,…,K-1個(gè)網(wǎng)格處用如下的Nk階Lagrange多項(xiàng)式來逼近:
由于終端時(shí)間tf沒被配置,第K個(gè)網(wǎng)格處的控制變量用Nk-1階Lagrange多項(xiàng)式來逼近。類似地,狀態(tài)變量在第k個(gè)網(wǎng)格處可以近似為
2.3 微分方程約束轉(zhuǎn)換為代數(shù)約束
通過全局插值多項(xiàng)式近似狀態(tài)變量后,狀態(tài)變量的導(dǎo)數(shù)可通過對(duì)多項(xiàng)式求導(dǎo)來近似,從而將動(dòng)力學(xué)微分方程轉(zhuǎn)換為代數(shù)約束,即
將(19)式代入動(dòng)力學(xué)微分方程,并在LGR點(diǎn)上進(jìn)行離散,可得
2.4 離散后的性能指標(biāo)及邊界條件
采用LGR配置點(diǎn)離散化后,性能指標(biāo)函數(shù)可近似表示為
基于上述的數(shù)值近似方法,原連續(xù)最優(yōu)控制問題被離散,并轉(zhuǎn)換為NLP問題,轉(zhuǎn)換所得的NLP問題可采用數(shù)值方法求解。其中,序列二次規(guī)劃(SQP)是一種較好的選擇,SQP算法較為成熟,在此不做介紹。
2.5 協(xié)態(tài)映射原理及最優(yōu)性驗(yàn)證
對(duì)于最優(yōu)控制問題,令PN為該問題經(jīng)偽譜法參數(shù)化得到的NLP問題,N為用于近似的Lagrange多項(xiàng)式階數(shù)。令Pλ為應(yīng)用龐特里亞金極小值原理得到的邊界值問題。Benson等[9]和 Huntington[10]的研究證明了PN問題的KKT(Karush-Kuhn-Tucker)條件與Pλ問題最優(yōu)性條件之間的等價(jià)性,即NLP問題的KKT乘子與LGR節(jié)點(diǎn)上的協(xié)態(tài)變量值之間存在一一對(duì)應(yīng)的關(guān)系,這就是偽譜法的協(xié)態(tài)映射原理。事實(shí)上,Fahroo等[11]指出,RPM對(duì)協(xié)態(tài)變量的估計(jì)由下式確定:
利用數(shù)值優(yōu)化結(jié)果和偽譜法得到的協(xié)態(tài)變量估值,可以根據(jù)1.5節(jié)中最優(yōu)控制的一階必要條件得到最優(yōu)控制軌跡的解析解,將其與全局插值多項(xiàng)式逼近得到的最優(yōu)控制軌跡相比較,可以驗(yàn)證偽譜法的有效性。本文將根據(jù)實(shí)例仿真結(jié)果對(duì)此進(jìn)行驗(yàn)證。
3.1 仿真結(jié)果
某制導(dǎo)炸彈升阻比與速度和攻角的關(guān)系如圖2所示。由圖2可知,在各個(gè)飛行馬赫數(shù)下,制導(dǎo)炸彈在攻角為5°時(shí)升阻比最大。因此,按照常規(guī)的彈道規(guī)劃方案,要保持制導(dǎo)炸彈在滑翔段始終處于最大升阻比的飛行狀態(tài),只需要按照5°的攻角進(jìn)行飛行控制即可。以下針對(duì)具體條件分析RPM優(yōu)化算法的邊界條件和約束條件,并將RPM優(yōu)化結(jié)果與常規(guī)彈道進(jìn)行對(duì)比。
圖2 某制導(dǎo)炸彈升阻比與速度和攻角的關(guān)系Fig.2 Lift-to-drag ratio vs.angle of attack at different Mach numbers of a glide guided bomb
制導(dǎo)炸彈相關(guān)參數(shù)為:質(zhì)量m=557 kg,參考面積S=0.116 m2,最大法向過載nymax為2g,彈道最小速度vmin=120 m/s;炸彈初始狀態(tài):投放高度y(t0)= 10 km,投放速度v(t0)=250 m/s;末端狀態(tài)約束: y(tf)=0 m,v(tf)=270 m/s,θ(tf)=-80°;取xref= 10 km,vref=250 m/s,則RPM算法的邊界條件為
按照(24)式和(25)式設(shè)定RPM優(yōu)化算法邊界條件及約束條件,優(yōu)化后的狀態(tài)變量和控制變量曲線如圖3~圖8所示,圖中給出了與常規(guī)的最大升阻比滑翔彈道的對(duì)比情況。
圖3 彈道曲線對(duì)比Fig.3 Trajectory vs.time
由圖3可以看出,從炸彈投放后開始,RPM優(yōu)化彈道就比常規(guī)彈道高度要高,且整體上彈道曲線更加平直,最終射程由81 km增大到92 km,增幅達(dá)13.5%.圖4、圖5表明在射程增大的同時(shí),彈道飛行時(shí)間由435 s增加到513 s,并且在彈道末端兩種方案均滿足(24)式中的速度約束和彈道傾角約束。圖6顯示在彈道初始段和末段兩種方案控制變量差別較大,而中段大部分時(shí)間RPM優(yōu)化結(jié)果只是在常規(guī)方案附近波動(dòng),說明常規(guī)的最大升阻比方案作為一種簡(jiǎn)單易行的方案,仍具有一定的工程應(yīng)用價(jià)值,但是如果追求發(fā)揮制導(dǎo)炸彈的射程極限,則RPM優(yōu)化算法顯示出優(yōu)勢(shì)。圖7和圖8表明在全彈道上(25)式的過程約束條件得到滿足。
圖6 攻角曲線對(duì)比Fig.6 Angle of attack vs.time
圖7 法向過載曲線對(duì)比Fig.7 Normal overload vs.time
圖8 攻角變化率曲線對(duì)比Fig.8 Angle of attack vs.time
3.2 最優(yōu)性驗(yàn)證
按照(24)式和(25)式確定的邊界條件及約束條件,經(jīng)RPM優(yōu)化算法得到的協(xié)態(tài)變量曲線如圖9所示;由RPM優(yōu)化算法得到的控制軌跡α(t)與通過最優(yōu)性一階必要條件得到的最優(yōu)控制軌跡α*(t),如圖10所示,RPM算法給出的哈密頓函數(shù)曲線如圖11所示。
圖9 RPM算法給出的協(xié)態(tài)變量曲線Fig.9 Co-states obtained from RPM optimization
由圖9可以看出,橫截條件(14)式得到滿足;另一方面,由于經(jīng)過無量綱化后各狀態(tài)變量處于同一數(shù)量級(jí),大大縮小了尋優(yōu)范圍,因而協(xié)態(tài)變量變化范圍也不大。由圖10可知,除個(gè)別地方由于控制約束限幅,RPM算法求得的控制變量軌跡與最優(yōu)控制軌跡稍有差別外,二者軌跡完全重合。由前文的分析知,哈密頓函數(shù)沿最優(yōu)軌線保持為0.由圖11可見,哈密頓函數(shù)值在0附近波動(dòng),滿足最優(yōu)性一階必要條件,充分說明了RPM算法求得的控制軌跡是最優(yōu)的,算法是有效的。
圖10 RPM算法控制軌跡與一階必要條件給出的控制軌跡對(duì)比Fig.10 Comparison of control trajectory obtained from RPM optimization and first-order necessary condition
圖11 RPM算法給出的Hamilton函數(shù)曲線Fig.11 Hamiltonian function curve obtained from RPM optimization
3.3 工程應(yīng)用分析
為了進(jìn)一步說明RPM優(yōu)化算法在增大制導(dǎo)炸彈射程方面的優(yōu)勢(shì),分別對(duì)上述兩種方案在不同初始條件下的彈道情況進(jìn)行了仿真計(jì)算(末端邊界條件和約束條件與(24)式和(25)式相同),仿真結(jié)果如表1所示。
表1 不同初始條件下RPM優(yōu)化算法增程情況Tab.1 The extended ranges obtained from RPM optimization under different initial conditions
從表1可以看出,與常規(guī)方案相比,在各種初始條件下,經(jīng)RPM優(yōu)化后制導(dǎo)炸彈最大射程均能得到顯著增加,增程效果均在 10%以上,最高達(dá)到17.8%.另一方面,從工程實(shí)現(xiàn)的角度來講,由于彈道優(yōu)化工作可以事先離線完成,因此,可以將最優(yōu)控制變量(即攻角)根據(jù)不同的飛行速度和高度進(jìn)行擬合,然后將擬合后的參數(shù)表裝定到彈上,炸彈投放后,由飛控計(jì)算機(jī)根據(jù)飛行條件實(shí)時(shí)插值得到最優(yōu)飛行攻角,進(jìn)而可以根據(jù)最優(yōu)飛行攻角進(jìn)行彈道飛行控制。與常規(guī)的最大升阻比方案相比,只是增加了最優(yōu)參數(shù)表的裝定和二維插值計(jì)算,占用彈載計(jì)算機(jī)資源不多,工程上完全可以實(shí)現(xiàn)。
本文利用RPM對(duì)滑翔型制導(dǎo)炸彈的最優(yōu)滑翔彈道進(jìn)行了研究。對(duì)制導(dǎo)炸彈動(dòng)力學(xué)模型進(jìn)行了無量綱化處理,結(jié)合極小值原理推導(dǎo)了最優(yōu)控制軌跡的解析解和一階必要性條件。采用RPM將彈道優(yōu)化問題轉(zhuǎn)化為NLP問題,基于協(xié)態(tài)映射原理給出了數(shù)值解的最優(yōu)性驗(yàn)證方法。仿真和分析結(jié)果表明:
1)無量綱化處理使各狀態(tài)變量處于同一數(shù)量級(jí),大大縮小了尋優(yōu)范圍;
2)采用RPM可以求得滿足最優(yōu)性一階必要條件的數(shù)值解,并且能夠準(zhǔn)確地給出協(xié)態(tài)變量的估值;
3)與常規(guī)的最大升阻比滑翔彈道相比,采用RPM優(yōu)化后的彈道增程效果超過10%.
本文的研究結(jié)果,對(duì)制導(dǎo)炸彈的增程設(shè)計(jì)具有工程應(yīng)用價(jià)值,同時(shí),對(duì)滑翔型制導(dǎo)炸彈的彈道規(guī)劃及制導(dǎo)律設(shè)計(jì)也具有一定的參考價(jià)值。
References)
[1] John B T.Survey of numerical methods for trajectory optimization [J].Journal of Guidance,Control and Dynamics,1998,21(2): 193-206.
[2] Rao A V,Clarke K A.Performance optimization of a maneuvering reentry vehicle using a Legendre pseudospectral method[C]∥AIAA Atmospheric Flight Mechanics Conference and Exhibit.California:AIAA,2002:1-13.
[3] Huntington G T,Benson D,Rao A V.A comparison of accuracy and computational efficiency of three pseudospectral methods[C]∥AIAA Guidance,Navigation and Control Conference and Exhibit. South Carolina:AIAA,2007:1-22.
[4] 張煜,張萬(wàn)鵬,陳璟,等.基于Gauss偽譜法的UCAV對(duì)地攻擊武器投放軌跡規(guī)劃[J].航空學(xué)報(bào),2011,32(7):1240-1251.
ZHANG Yu,ZHANG Wan-peng,CHEN Jing,et al.Air-toground weapon delivery trajectory planning for UCAVs using Gauss pseudospectral method[J].Acta Aeronautica et Astronautica Sinica,2011,32(7):1240-1251.(in Chinese)
[5] 劉欣,楊濤,張青斌.助推-滑翔導(dǎo)彈彈道優(yōu)化與總體參數(shù)分析[J].彈道學(xué)報(bào),2012,24(3):43-48.
LIU Xin,YANG Tao,ZHANG Qing-bin.Trajectory optimization and parameter analysis for boost-glide missile[J].Journal of Ballistics,2012,24(3):43-48.(in Chinese)
[6] Garg D,Patterson M A,Darby C L,et al.Directtrajectory optimization and costate estimation of general optimal control problems using a Radau pseudospectral method[C]∥AIAA Guidance,Navigation and Control Conference.Chicago,Illinois:AIAA,2009: 1-29.
[7] Darby C L,Hager W W,Rao A V.Direct trajectory optimization using a variable low-order adaptive pseudospectral method[J]. Journal of Spacecraft and Rockets,2011,48(3):433-445.
[8] 王鈾,趙輝,惠百斌,等.利用Radau偽譜法求解UCAV對(duì)地攻擊軌跡研究[J].電光與控制,2012,19(10):50-53.
WANG You,ZHAO Hui,HUI Bai-bin,et al.Air-to-ground trajectory planning for UCAVs using a Radau pesudosprctral method [J].Electronics Optics&Control,2012,19(10):50-53.(in Chinese)
[9] Benson D A,Huntington G T,Thorvaldsen T P.Direct trajectory optimization and costate estimation via an orthogonal collocation method[J].Journal of Guidance,Control,and Dynamics,2006, 29(6):1435-1440.
[10] Huntington G T. Advancementand analysisofa Gauss pseudospectral transcription for optimal control problems[D]. Massachusetts,US: MassachusettsInstituteofTechnology, 2007:51-57,115-143.
[11] FahrooF, Ross IM. Costateestimation by a Legendre pseudospectral method[J].Journal of Guidance,Control and Dynamics,2001,24(2):270-277.
Optimization of Glide Trajectory of Guided Bombs Using a Radau Pseudo-spectral Method
YUAN Yan-bo1,2,ZHANG Ke1,XUE Xiao-dong2
(1.School of Astronautics,Northwestern Polytechnical University,Xi'an 710072,Shaanxi,China; 2.No.12 Institute,China Airborne Missile Academy,Luoyang 471009,Henan,China)
The problem of optimizing the maximum range of a glide guided bomb is studied based on the principle of solving optimal control problems using the Radau pseudo-spectral method.The dynamic model of the guided bomb is nondimensionalized.Combining with the Pontryagin minimum principle,the analytic solution of the optimal control and the first-order necessary condition are derived.The trajectory optimization problem is translated to a nonlinear programming via the Radau pseudo-spectral method.Based on covector mapping principle,an optimality verification method is presented for the numerical solution. Simulation results show that the Radau pseudo-spectral method can provide a highly valuable optimal solution for engineering application.Compared with the conventional maximum lift-to-drag ratio gliding trajectory,the trajectory after optimization can be extended by more than 10%.
ordnance science and technology;glide guided bomb;trajectory optimization;Radau pseudo-spectral method
TJ765.5
:A
:1000-1093(2014)08-1179-08
10.3969/j.issn.1000-1093.2014.08.007
2013-09-10
袁宴波(1981—),男,博士研究生。E-mail:runble@163.com;張科(1968—),男,教授,博士生導(dǎo)師。E-mail:zhangke@mail.nwpu.edu.cn