聶聰, 張科, 張明環(huán), 王佩
(1.西北工業(yè)大學(xué) 航天學(xué)院, 陜西 西安 710072; 2.航天飛行動力學(xué)國家級重點實驗室, 陜西 西安 710072)
航空制導(dǎo)炸彈軌跡快速優(yōu)化研究
聶聰1,2, 張科1,2, 張明環(huán)1,2, 王佩1,2
(1.西北工業(yè)大學(xué) 航天學(xué)院, 陜西 西安 710072; 2.航天飛行動力學(xué)國家級重點實驗室, 陜西 西安 710072)
針對制導(dǎo)炸彈對地攻擊的垂直打擊的彈道特點,研究了多約束條件下的軌跡優(yōu)化問題,提出了一種基于hp自適應(yīng)Radau偽譜法(hp-RPM)的迭代求解策略。該方法允許不同區(qū)間的插值多項式的階次不同,并以軌跡曲率作為重新分配配點以提高區(qū)間求解精度的依據(jù),當(dāng)各配點處的計算精度達到設(shè)定的誤差允許范圍時,迭代停止。以某航空制導(dǎo)炸彈為對象進行軌跡快速優(yōu)化,仿真結(jié)果表明,該方法能夠在多約束條件下快速生成滿足要求的軌跡,且解的Hamilton函數(shù)滿足最優(yōu)性條件,與常規(guī)方法相比,平均增程效果達到11.45%。
制導(dǎo)炸彈;軌跡優(yōu)化;殘差;hp自適應(yīng);Radau偽譜法
航空制導(dǎo)炸彈具有有效載荷比高、命中精度高、成本相對低廉等優(yōu)點,是作戰(zhàn)飛機近距空中支援、執(zhí)行縱深打擊、壓制和摧毀敵方防控系統(tǒng)等任務(wù)最有效的內(nèi)埋式武器[1]。由于無發(fā)動機提供動力,其射程主要取決于投放時的高度、速度,因此需要進行軌跡優(yōu)化,一般采用“滑翔+俯沖攻擊”的方案,但這種做法并不能得到最優(yōu)的軌跡。
從原理上講,軌跡優(yōu)化問題可歸結(jié)為多約束下的非線性最優(yōu)控制問題,有間接法和直接法[2]2大類求解方法。間接法能夠求得精確解,但存在初值難以估計,收斂性無法保證的問題[3]。而直接法是將最優(yōu)控制問題轉(zhuǎn)化為有限維的非線性規(guī)劃問題(NLP),應(yīng)用NLP求解器進行求解。直接法中的配點法,尤其是近期發(fā)展起來的偽譜法,因其計算效率上的優(yōu)勢,逐漸成為求解NLP問題的研究熱點。
Elnagar等[4]首次對偽譜法的轉(zhuǎn)換原理,收斂速度、求解效率等方面做了深入研究,奠定了偽譜法求解最優(yōu)控制問題的基礎(chǔ)。偽譜法是將時間離散化為若干離散點,指標(biāo)函數(shù)、微分方程和約束條件由離散點上的狀態(tài)變量、控制變量表示,再利用NLP求解器求解,相比于傳統(tǒng)的智能優(yōu)化算法在計算時間、控制律的平滑度等方面具有明顯的優(yōu)越性[5]。常見的偽譜法包括:Legendre偽譜法(LPM)、Gauss偽譜法(GPM)、Radau偽譜法(RPM)。Huntington等[6]指出上述3種方法在計算精度方面,GPM、RPM相當(dāng),均高于LPM;Gandhi等[7]研究表明在給定求解精度的條件下,RPM比GPM的計算代價更小;Rexius等[8]基于RPM研究了在氣動加熱、禁飛區(qū)等多種約束條件下的高超聲速飛行器的軌跡優(yōu)化問題;袁宴波等[9]研究了Radau偽譜法在最優(yōu)滑翔彈道應(yīng)用方面的問題,給出了基于協(xié)態(tài)映射原理的數(shù)值解驗證方法。上述方法由于其節(jié)點分布形狀固定,容易導(dǎo)致需要較高維的插值多項式才能得到理想的近似解,甚至在采用高維多項式后仍然得不到理想的近似解。而自適應(yīng)hp偽譜法具有計算稀疏性、快速收斂性的特點,對于需要改進求解精度的區(qū)間,可細(xì)化網(wǎng)格或提高多項式的階次,這種方法能夠大大減小計算代價,在多約束下的軌跡快速優(yōu)化問題中,具有較大的優(yōu)勢。本文利用基于hp自適應(yīng)Radau偽譜法(hp-RPM)的優(yōu)點,采用hp-RPM求解策略對航空制導(dǎo)炸彈在多約束條件下的滑翔軌跡進行快速優(yōu)化。
1.1 航空制導(dǎo)炸彈縱向運動模型
軌跡優(yōu)化任務(wù)中,一般只考慮縱向運動的情況,為加快算法的收斂速度,宜采用無量綱化的制導(dǎo)炸彈縱向運動模型。
引入?yún)⒖剂縇r、Vr,則無量綱縱向運動模型為:
(1)
升力系數(shù)CL、阻力系數(shù)CD可近似為攻角的函數(shù):
(2)
式中,Ma為飛行馬赫數(shù);CL1、CD0、CD2為在不同馬赫數(shù)下根據(jù)攻角α擬合得到的氣動力系數(shù)。氣動參數(shù)根據(jù)某航空制導(dǎo)炸彈的啟動數(shù)據(jù)擬合獲得,擬合結(jié)果如圖1所示。
圖1 某航空制導(dǎo)炸彈升阻曲線
大氣密度、音速采用標(biāo)準(zhǔn)大氣擬合模型,其精確度能夠滿足航空制導(dǎo)炸彈的飛行空間。
(3)
1.2 約束條件
根據(jù)制導(dǎo)炸彈攻擊目標(biāo)的特點,對邊界條件有一定的約束,如大的彈著角、末端速度,這樣能夠保證制導(dǎo)炸彈具有一定的侵徹能力。
1) 邊值約束
初值約束:
(4)
終端約束:
航空制導(dǎo)炸彈對地攻擊對彈道傾角和碰撞速度有一定的要求,以保持一定的動能侵徹目標(biāo),即
y(tf)=yfV(tf)=yfθ(tf)=θf
(5)
2) 過程約束
航空制導(dǎo)炸彈因無推力,操縱舵效率有限等因素,其需要滿足一些諸如過載、攻角變化率、攻角幅值等的限制,建立如下過程約束條件:
(6)
1.3 目標(biāo)函數(shù)
對于軌跡優(yōu)化,在滿足約束條件的前提下,射程越遠(yuǎn)意味著攻擊范圍更廣,因此,取目標(biāo)函數(shù)為
minJ=-x(tf)
(7)
2.1 Radau基本原理
Radau偽譜法將控制變量和狀態(tài)變量離散化為時間軸上子區(qū)間[tk-1,tk]的一系列Legendre-Gauss-Radau(LGR)點,通過構(gòu)造Lagrange插值多項式對其進行逼近,并對該多項式的求導(dǎo)以代替動力學(xué)微分方程[10]。
1) 時域變換
Radau偽譜法的定義域為[-1,1],而實際問題的定義域為[t0,tf],將[t0,tf]分成K個網(wǎng)格,且?t∈[tk-1,tk],k=1,…,K,t0=t1<… (8) 2) 狀態(tài)變量與控制變量的插值近似 (9) (10) 3) 動力學(xué)微分方程約束轉(zhuǎn)換為代數(shù)約束 對(9)式求導(dǎo),有 (11) 則Nk個LGR點上的動力學(xué)微分方程約束變?yōu)榇鷶?shù)方程約束,即 (12) 4) 約束條件的離散化 子區(qū)間內(nèi)Nk個配點上的路徑不等式約束為 (13) 邊界條件 (14) 網(wǎng)點約束,有 (15) 5) LGR積分的性能指標(biāo)函數(shù) 用LGR積分近似性能指標(biāo)函數(shù) (16) (17) 經(jīng)過上述變換后,最優(yōu)控制問題轉(zhuǎn)化為求解離散節(jié)點上的狀態(tài)Xi和控制變量Uk,(i,k=1,…,K),以及初末時刻t0、tf(未給定),使得性能指標(biāo)(7)最小,并滿足動力學(xué)方程約束(1),終端條件約束(5),以及過程約束條件(6)的最優(yōu)控制問題。 2.2 hp-RPM自適應(yīng)策略設(shè)計 hp自適應(yīng)方法根據(jù)網(wǎng)格的曲率和約束方程的誤差判定自動調(diào)整網(wǎng)格數(shù)量和多項式階次[11]。通過判斷路徑約束誤差決定是否新增區(qū)間。在區(qū)間內(nèi)通過判斷軌跡的曲率來決定采用增加配點數(shù)的策略,還是增加多項式階次的策略。設(shè)允許的最大誤差為εmax,最大允許曲率為rmax,則誤差和曲率比判據(jù)為: 1) 誤差判據(jù) (18) 式中,i=1,…,Nk為第k個子區(qū)間的第i個配點。 則該區(qū)間上的采樣點在約束方程上的殘差為: (19) (20) 2) 曲率比判據(jù) (21) 于是,第l個狀態(tài)在第p個采樣點處的曲率為 (22) (23) (24) 因此,曲率判據(jù)為e 2.3 算法步驟 hp-RPM求解航空制導(dǎo)炸彈軌跡優(yōu)化設(shè)計問題的步驟如下所示,其迭代流程如圖2所示。 圖2 hp-RPM迭代流程圖 1) 初始化,給定初始狀態(tài)x0,誤差門限值εmax,選取K個區(qū)間,每個區(qū)間設(shè)定N個點; 4) 在局部殘差最大值所對應(yīng)的采樣點上將區(qū)間進一步細(xì)化,新增區(qū)間配點數(shù)為N; 5) 若e 6) 所有子區(qū)間更新后,返回步驟2)。 3.1 仿真條件 初始條件: y(t0)=7 000 m V(t0)=240 m/s 終端條件: y(tf)=0 m V(tf)=220 m/s θ(tf)=-75° 過程約束: 120 m/s≤V≤340 m/s 3.2 仿真結(jié)果 根據(jù)上述條件,選取Vr=240 m/s,Lr=7 400 m代入(1)式的無量綱化模型,采用第2節(jié)的hp-RPM優(yōu)化求解策略對制導(dǎo)炸彈軌跡進行優(yōu)化,優(yōu)化后的狀態(tài)變量和控制變量曲線如圖3所示。 圖3 軌跡優(yōu)化結(jié)果 其中,CM代表常規(guī)方法,Hamilton函數(shù)曲線如圖4所示。為驗證該增程效果,對其他不同初始條件下的軌跡快速優(yōu)化問題進行了仿真,表1為在不同初始條件下經(jīng)hp-RPM優(yōu)化后和與常規(guī)方案相比的仿真結(jié)果。 圖4 hp-RPM算法給出的Hamilton函數(shù)曲線 如圖3a)所示,經(jīng)hp-RPM優(yōu)化后的曲線顯得更加平緩光滑,特別是彈道的后半段,這樣的安排,使得制導(dǎo)炸彈飛的更遠(yuǎn)。圖3b)顯示,兩者在速度方面,常規(guī)方案的波動幅度要大,圖3c)展示,兩者的彈道傾角基本變化趨勢基本一致,但優(yōu)化后的方案速度變化更加平滑,圖3d)~圖3f)所示兩者在彈道初始段和彈道末段的控制量相差較大,在30~100 s的中段兩者基本一致,兩者都滿足了攻角、過載、攻角速率、終端速度、終端彈道傾角的約束,而優(yōu)化后,制導(dǎo)炸彈的飛行時間由原來的180 s增加至195 s。另外,若終端時刻自由,由極小值原理可知,哈密爾頓函數(shù)應(yīng)該保持為零,圖4可知,哈密頓函數(shù)在10-5量級,在一定程度上說明了解的最優(yōu)性。 該優(yōu)化計算在CPU為3.3GHz/i5-4590,內(nèi)存8G,Windows 7系統(tǒng),Matlab環(huán)境下編程實現(xiàn)。算例中,優(yōu)化的時間開銷為1.14 s,而在Matlab環(huán)境下求解一個二維優(yōu)化問題,一般需要30分鐘。因此,hp-RPM在計算速度上具有很大的優(yōu)勢。 表1 不同初始條件下hp-RPM優(yōu)化算法增程情況 從表1可知,經(jīng)hp-RPM優(yōu)化后制導(dǎo)炸彈的射程得到了較大的改善,均有不同程度的提高。其中在序號1和2的條件下,增程小于10%,這主要在于這2個初始條件的初始高度較高,制導(dǎo)炸彈滑翔段時間較長,占比整個彈道的比例較大,常規(guī)方案中俯沖攻擊段使得飛行時間減少。在7 000 m高度,240 m/s速度投放,能夠增程10.94%,而在180 m/s時能夠增程8.42%,這是因為220 m/s的末端速度約束,迫使俯沖攻擊段需要調(diào)整較大的角度,導(dǎo)致飛行時間減少。在5 000 m高度投放,最大可以增加17.37%的射程,增程比較明顯。 綜上,hp-RPM能在多約束條件下快速生成符合要求的軌跡,計算量小,計算精度高,適合于工程應(yīng)用。 本文采用了一種基于hp自適應(yīng)的Radau偽譜法對航空制導(dǎo)炸彈進行快速軌跡優(yōu)化,首先建立了優(yōu)化模型,將優(yōu)化問題轉(zhuǎn)換為NLP問題后,利用hp-RPM對其進行求解。仿真結(jié)果表明,在多約束條件下,該方法能夠快速的生成符合要求的軌跡,Hamilton函數(shù)曲線表明優(yōu)化結(jié)果滿足一階最優(yōu)性條件,計算速度快,射程增加幅度平均達到11.46%。對多約束條件下的軌跡優(yōu)化問題,具有一定的參考價值。 [1] 賈秋銳,孫媛媛,肖樹臣,等. 航空制導(dǎo)炸彈發(fā)展趨勢[J]. 制導(dǎo)與引信, 2014, 35(1): 8-11 Jia Qiurui, Sun Yuanyuan, Xiao Shuchen,等. Development Trend of the Aerial Guided Bomb[J]. Guidance & Fuze, 2014, 35(1): 8-11 (in Chinese) [2] 孫勇,張卯瑞,梁曉玲. 求解含復(fù)雜約束非線性最優(yōu)控制問題的改進Gauss偽譜法[J]. 自動化學(xué)報, 2013, 39(5): 672-678 Sun Yong, Zhang Maorui, Liang Xiaoling. Improved Gauss Pseudospectral Method for Solving Nonlinear Optimal Control Problem with Complex Constraints[J]. Acta Automatica Sinica, 2013, 39(5): 672-678 (in Chinese) [3] 雍恩米,唐國金,陳磊. 基于Gauss偽譜方法的高超聲速飛行器再入軌跡快速優(yōu)化[J]. 宇航學(xué)報, 2008, 29(6): 1766-1772 Yong Enmi, Tang Guojin, Chen Lei. Rapid Trajectory Optimization for Hypersonic Reentry Vehicle via Gauss Pseudospectral Method[J]. Journal of Astronautics, 2008, 29(6): 1766-1772 (in Chinese) [4] Elnagar G, Kazemi M A, Mchen R. The Pseudospectral Legendre Method for Discretizing Optimal Control Problems[J]. IEEE Trans on Automatic Control, 1995, 40(10): 1793-1796 [5] 董春云,蔡遠(yuǎn)利. 高超聲速再入飛行器軌跡優(yōu)化算法評估策略[J]. 西安交通大學(xué)學(xué)報, 2016, 50(4): 28-34 Dong Chunyun, Cai Yuanli. An Evaluation Strategy of Trajectory Optimization Algorithms for Hypersonic Reentry Vehicle[J]. Journal of Xi′an Jiaotong University, 2016, 50(4): 28-34 (in Chinese) [6] Huntingtong G T, Benson D, Rao A V. Comparison of Accuracy and Computational Efficiency of Three Pseudospectral Methods[C]∥AIAA Guidance, Navigation and Control Conference and Exhibit, 2007: 1-25 [7] Gandhi M, Theodonu E. A Comparison between Trajectory Optimization Methods: Differential Dynamic Programming and Pseudospectral Optimal Control[C]∥AIAA Guidance, Navigation and Control Confesence, 2016: 1-6 [8] Rexius S L, Rexius T E, Jorris T L, et al. Advances in Highly Constrained Multi-Phase Trajectory Generation using the General Pseudospectral Optimization Software (GPOPS)[C]∥AIAA Guidance, Navigation and Control Confesence, 2013: 1-6 [9] 袁宴波,張科,薛曉東. 基于Radau偽譜法的制導(dǎo)炸彈最優(yōu)滑翔彈道研究[J]. 兵工學(xué)報, 2014, 35(8): 1179-1186 Yuan Yanbo, Zhang Ke, Xue Xiaodong. Optimization of Glide Trajectory of Guided Bombs Using a Radau Pseudo-Spectral Method[J]. Acta Armamentarii, 2014, 35(8): 1179-1186 (in Chinese) [10] Guo T D, Li J F, Baotys H X, et al. Pseudospectral Methods for Trajectory Optimization with Interior Point Constraints: Verification and Applications[J]. IEEE Trans on Aerospace and Electronic Systems. 2013, 49(3): 2005-2017 [11] 王麗英,張友安,趙國榮. 改進的hp自適應(yīng)網(wǎng)格細(xì)化算法及應(yīng)用[J]. 彈道學(xué)報. 2013, 25(1): 16-21 Wang Liying, Zhang Youan, Zhao Guorong. Improved Hp-Adaptive Mesh Refinement Algorithm and Its Application[J]. Journal of Ballistics, 2013, 25(1): 16-21 (in Chinese) Rapid Trajectory Optimization for Air Guided Bomb Nie Cong1,2, Zhang Ke1,2, Zhang Minghuan1,2, Wang Pei1,2 1.School of Astronautics, Northwestern Polytechnical University, Xi′an 710072, China 2.National Key Laboratory of Aerospace Flight Dynamics, Northwestern Polytechnical University, Xi′an 710072, China According to the ballistic characteristics of the vertical attack by an aerial guided bomb, we optimize its trajectory and design the iterative variable-order solution strategy based on the hp-adaptive Radau pseudospectral method (hp-RPM) to rapidly optimize the glide trajectory under multiple constraints. The strategy allows for different orders of polynomial approximation in different intervals. We enhance the accuracy of the intervals by redistributing allocation points with the trajectory curvature. We iterate the redistribution of allocation points until their computational accuracy is acceptable to an error-tolerant degree. Then we simulate the rapid optimization of the trajectory of a certain aerial guided bomb. The simulation results show that the strategy can rapidly generate satisfactory trajectories under multiple constraints and that the Hamilton function of the solution satisfies optimal performance conditions. Compared with the conventional strategies, the trajectory optimized with our strategy is improved by an average of 11.46%. guided bomb; trajectory optimization; residual; hp-adaptive; Radau pseudospectral method 2016-09-04 國家自然基金(61502391)與航天支撐基金(N2015KC0121)資助 聶聰(1986—),西北工業(yè)大學(xué)博士研究生,主要從事飛行器導(dǎo)航、制導(dǎo)與控制的研究。 TJ761.5 A 1000-2758(2016)06-0963-063 仿真算例與結(jié)果分析
4 結(jié) 論