康繼芝, 張士峰, 胡鋮
(國防科技大學(xué) 空天科學(xué)學(xué)院,湖南 長沙 410073)
助推段主要在大氣層中,氣動(dòng)力是主要作用力之一。精確地計(jì)算火箭受到的氣動(dòng)力,對(duì)提高火箭制導(dǎo)精度至關(guān)重要。由于氣動(dòng)環(huán)境的復(fù)雜多變,很難直接建立氣動(dòng)力精確計(jì)算模型。目前使用的解決辦法是針對(duì)特定型號(hào)火箭外型,結(jié)合空氣動(dòng)力學(xué)理論計(jì)算和風(fēng)洞實(shí)驗(yàn)校正,給出計(jì)算氣動(dòng)力所需的圖表、曲線等[1]。工程上,通常提供氣動(dòng)力系數(shù)的曲線或插值表,以此來計(jì)算火箭飛行過程中的氣動(dòng)力。但是實(shí)際飛行過程氣動(dòng)環(huán)境復(fù)雜,標(biāo)準(zhǔn)氣動(dòng)參數(shù)與實(shí)際參數(shù)存在偏差。這種偏差在制導(dǎo)過程中如果沒有處理,一定程度上會(huì)影響制導(dǎo)精度,最終增大終端誤差。因此,利用辨識(shí)算法對(duì)氣動(dòng)參數(shù)進(jìn)行實(shí)時(shí)在線辨識(shí),并將辨識(shí)結(jié)果用于修正制導(dǎo)指令,對(duì)于提高火箭的制導(dǎo)精度有一定研究意義。
攝動(dòng)制導(dǎo)方法要求在射前計(jì)算參考彈道并裝載,在飛行過程中將實(shí)際彈道參數(shù)與參考彈道的偏離量視為小擾動(dòng)量,再基于攝動(dòng)理論計(jì)算制導(dǎo)指令,使真實(shí)彈道始終保持在標(biāo)準(zhǔn)彈道附近[2]。由于運(yùn)動(dòng)參數(shù)具有可觀測(cè)性,攝動(dòng)制導(dǎo)一般選擇運(yùn)動(dòng)參數(shù)擾動(dòng)(如位置坐標(biāo)、速度分量、角度值等)作為偏差量來計(jì)算制導(dǎo)指令。但是火箭真實(shí)飛行過程中的參數(shù)偏差量遠(yuǎn)不止這些運(yùn)動(dòng)參數(shù)[1]。本文擬將辨識(shí)得到的氣動(dòng)系數(shù)偏差量視為小擾動(dòng)量,對(duì)傳統(tǒng)攝動(dòng)制導(dǎo)方法進(jìn)行改進(jìn),提高制導(dǎo)精度。
現(xiàn)有的參數(shù)估計(jì)方法包括遞推最小二乘法、遞推極大似然法、Wiener濾波和Kalman濾波等,其中Kalman濾波是處理隨機(jī)估計(jì)應(yīng)用最廣泛的方法[3]。為擴(kuò)展適用范圍,Kalman濾波出現(xiàn)了多種改進(jìn)形式,包括擴(kuò)展Kalman濾波、無跡Kalman濾波[4-5]、UD分解濾波[6]等。在飛行器氣動(dòng)參數(shù)辨識(shí)上,文獻(xiàn)[7-8]分別應(yīng)用了具有指數(shù)遺忘的最小二乘法和徑向基神經(jīng)網(wǎng)絡(luò)方法分別對(duì)滑翔飛行器和旋翼飛行器進(jìn)行氣動(dòng)參數(shù)辨識(shí),達(dá)到較好效果。文獻(xiàn)[9-12]研究了擴(kuò)展Kalman濾波器在飛行器氣動(dòng)參數(shù)辨識(shí)上的應(yīng)用,使得擴(kuò)展Kalman濾波方法得到了廣泛應(yīng)用。本文將基于文獻(xiàn)[9]中的基本思想,構(gòu)建氣動(dòng)參數(shù)在線辨識(shí)模型,用于修正火箭助推段攝動(dòng)制導(dǎo)指令,提高末端精度。
為了便于后續(xù)辨識(shí)系統(tǒng)方程的推導(dǎo),本文擬引入速度坐標(biāo)系下的動(dòng)力學(xué)方程[13]。由于火箭助推段飛行時(shí)間較短,可假設(shè)地球?yàn)椴恍D(zhuǎn)均質(zhì)圓球;并假設(shè)火箭為對(duì)稱圓柱體形狀,不考慮傾側(cè)角控制。故在速度坐標(biāo)系下的動(dòng)力學(xué)方程簡(jiǎn)化為:
(1)
式中:v表示速度大??;Pe表示軸向推力大??;α為攻角;β為側(cè)滑角;ρ為大氣密度;Sm為火箭參考面積;CD、CL為阻力系數(shù)和升力系數(shù);θ為速度傾角;Re為地球平均半徑;h為飛行高度;m為火箭質(zhì)量。CD、CL均由標(biāo)準(zhǔn)值與擾動(dòng)量組成:
(2)
式中:CDd、CLd分別為阻力系數(shù)和升力系數(shù)的擾動(dòng)量,該擾動(dòng)量正是本文中要辨識(shí)的參量。
攝動(dòng)制導(dǎo)的目的是將火箭的實(shí)際飛行軌跡保持在標(biāo)準(zhǔn)彈道附近。在實(shí)際飛行過程中,導(dǎo)航系統(tǒng)計(jì)算得到火箭實(shí)際位置,制導(dǎo)系統(tǒng)將其與存儲(chǔ)在箭載計(jì)算機(jī)中的標(biāo)準(zhǔn)彈道進(jìn)行對(duì)比,經(jīng)制導(dǎo)方程計(jì)算出制導(dǎo)指令。為便于執(zhí)行機(jī)構(gòu)設(shè)計(jì),攝動(dòng)制導(dǎo)通常分為縱向制導(dǎo)和橫向?qū)б?,本文僅考慮縱平面內(nèi)的制導(dǎo)。不考慮姿態(tài)變化的動(dòng)態(tài)過程,制導(dǎo)指令俯仰角可簡(jiǎn)化為[14]:
φ(t)=φpr(t)+uφ
(3)
式中:φpr(t)為t時(shí)刻對(duì)應(yīng)的程序俯仰角;uφ為導(dǎo)引控制量,由真實(shí)狀態(tài)和參考狀態(tài)的偏差計(jì)算得到。導(dǎo)引控制量由導(dǎo)引目標(biāo)量和導(dǎo)引系數(shù)組成,即uφ=KδXδXf。本文選擇終端速度傾角偏差δθf作為導(dǎo)引目標(biāo)量。攝動(dòng)制導(dǎo)通常選擇可測(cè)量的狀態(tài)量偏差來計(jì)算導(dǎo)引目標(biāo)量:
(4)
但是根據(jù)攝動(dòng)理論,“擾動(dòng)”定義為實(shí)際彈道飛行條件與標(biāo)準(zhǔn)彈道飛行條件之間的偏差[1]。因此,擾動(dòng)量除了起始點(diǎn)位置速度外,還包括氣溫、壓強(qiáng)、大氣密度等環(huán)境參數(shù)和質(zhì)量、秒耗量、氣動(dòng)力系數(shù)等彈道參數(shù)。本文擬將辨識(shí)得到的氣動(dòng)參數(shù)偏差作為新的小擾動(dòng)量。在不考慮氣動(dòng)參數(shù)偏差的情況下,終端速度傾角θf是速度大小v、速度傾角θ和高度h的函數(shù),即:
θf=θf(v,θ,h)
(5)
故其攝動(dòng)方程如式(4)所示。當(dāng)考慮氣動(dòng)參數(shù)擾動(dòng)時(shí),式(5)可寫為:
θf=θf(v,θ,h,CD,CL)
(6)
對(duì)式(6)求微分:
(7)
式中:δCD、δCL是氣動(dòng)參數(shù)的等時(shí)偏差;在標(biāo)準(zhǔn)模型中,CD是馬赫數(shù)Ma和高度h的函數(shù),CL是馬赫數(shù)Ma和攻角α的函數(shù),即:
(8)
而Ma=v/a,聲速a又是高度的函數(shù)。攻角α=φpr-θ,是速度傾角θ的函數(shù)。所以在標(biāo)準(zhǔn)情況下,氣動(dòng)參數(shù)的等時(shí)偏差δCD、δCL可化為:
(9)
式中:
(10)
由式(4)可知,標(biāo)準(zhǔn)狀況下氣動(dòng)參數(shù)的等時(shí)偏差可表示為速度大小、高度和速度傾角的等時(shí)偏差,將式(9)代入式(4),得到的結(jié)果和式(4)等價(jià)。但是考慮氣動(dòng)參數(shù)擾動(dòng)時(shí),氣動(dòng)參數(shù)等時(shí)偏差除了來源于速度大小、高度和速度傾角等時(shí)偏差外,還來源于其他未知因素引起的氣動(dòng)參數(shù)擾動(dòng)。結(jié)合式(9)可擴(kuò)展為:
(11)
將式(11)代入式(7)中,相同的等時(shí)偏差項(xiàng)可以合并,得:
(12)
而標(biāo)準(zhǔn)彈道的氣動(dòng)參數(shù)擾動(dòng)量均為0,所以式(12)中δCDd=CDd,δCLd=CLd。式化(12)為:
(13)
式(13)就是考慮氣動(dòng)參數(shù)偏差的攝動(dòng)方程。
CDd、CLd為氣動(dòng)參數(shù)擾動(dòng)量,具有一定的隨機(jī)性,難以用精確模型進(jìn)行描述。而一階高斯馬爾可夫過程符合大多數(shù)物理過程,且數(shù)學(xué)描述較為簡(jiǎn)單。因此采用一階高斯馬爾可夫過程對(duì)氣動(dòng)參數(shù)擾動(dòng)進(jìn)行描述[9]:
(14)
Y=h(X)+V
(15)
式中:Y為觀測(cè)量;V為觀測(cè)噪聲向量?;鸺龖T性敏感器件可以測(cè)量除地球引力外的其余力產(chǎn)生的加速度。因此觀測(cè)量選擇為軸向和法向的視加速度,即Y=[Nx,Ny]T。其中:
(16)
只考慮加速度計(jì)的隨機(jī)漂移,故ωNx、ωNy為高斯白噪聲。
擴(kuò)展Kalman濾波的基本原理如下:
1)預(yù)測(cè)方程:
(17)
式中:Qk+1為系統(tǒng)噪聲矩陣;Φk,k+1為tk到tk+1時(shí)刻的狀態(tài)轉(zhuǎn)移矩陣,其表達(dá)式為:
(18)
式中:F(X)為狀態(tài)方程f(X)的雅克比矩陣。
2)更新方程:
(19)
大多數(shù)的人,第一次接觸武俠,都是在很年輕的時(shí)候。這也許是因?yàn)?,年輕的人,甚至有點(diǎn)中二的人,總是血?dú)夥絼偟模谑蔷透菀资艿轿鋫b小說里那種自由、熱血、張揚(yáng)和少年意氣的影響。
擴(kuò)展Kalman濾波方法能辨識(shí)出當(dāng)前時(shí)刻氣動(dòng)參數(shù)擾動(dòng)量,但是在計(jì)算下一時(shí)間段內(nèi)的制導(dǎo)指令時(shí),需要下一時(shí)間段內(nèi)的氣動(dòng)參數(shù)擾動(dòng)量。因此,需要通過已經(jīng)辨識(shí)出來的結(jié)果對(duì)下一時(shí)間段內(nèi)的氣動(dòng)參數(shù)擾動(dòng)量進(jìn)行預(yù)測(cè)。由于氣動(dòng)參數(shù)擾動(dòng)量具有一定的隨機(jī)性,其與其他狀態(tài)量的函數(shù)關(guān)系不明確。因此,建立擾動(dòng)量的時(shí)變多項(xiàng)式模型,再利用參數(shù)估計(jì)方法對(duì)多項(xiàng)式參數(shù)進(jìn)行估計(jì):
(20)
參數(shù)估計(jì)方法有遞推最小二乘法、遺忘因子遞推最小二乘法、限定記憶遞推最小二乘法等[15]。遞推最小二乘法雖然算法簡(jiǎn)單,但是隨著觀測(cè)數(shù)據(jù)的增多,會(huì)出現(xiàn)“數(shù)據(jù)飽和”現(xiàn)象,使新數(shù)據(jù)對(duì)估計(jì)結(jié)果的修正作用減弱。遺忘因子遞推最小二乘法通過對(duì)舊數(shù)據(jù)增加“遺忘因子”以減弱數(shù)據(jù)的作用,而限定記憶遞推最小二乘法通過不斷地剔除老數(shù)據(jù),增加新數(shù)據(jù),始終選擇固定長度的最新數(shù)據(jù)(即“數(shù)據(jù)矩形窗”)進(jìn)行參數(shù)估計(jì)。限定記憶遞推最小二乘法在一定程度上完全避免了數(shù)據(jù)飽和現(xiàn)象,更充分地體現(xiàn)了新數(shù)據(jù)的修正作用。但是為了保證預(yù)測(cè)結(jié)果的合理性,每次預(yù)測(cè)計(jì)算采用的數(shù)據(jù)量不能過少。本文選擇限定記憶遞推最小二乘法作為參數(shù)估計(jì)方法[16]。該方法的計(jì)算過程:
(21)
參數(shù)在線辨識(shí)的關(guān)鍵是實(shí)時(shí)性,即辨識(shí)結(jié)果及時(shí)應(yīng)用于下一階段的制導(dǎo)計(jì)算。但在實(shí)際飛行過程中,由于存在計(jì)算時(shí)延,辨識(shí)結(jié)果不能保持時(shí)刻更新。因此,本文考慮采用周期性迭代的方法,來實(shí)現(xiàn)在線氣動(dòng)參數(shù)實(shí)時(shí)更新:首先基于實(shí)時(shí)觀測(cè)數(shù)據(jù),采用擴(kuò)展Kalman濾波方法對(duì)氣動(dòng)參數(shù)擾動(dòng)進(jìn)行辨識(shí);然后再基于已有的辨識(shí)結(jié)果,采用限定記憶遞推最小二乘法,對(duì)下一制導(dǎo)周期的氣動(dòng)參數(shù)擾動(dòng)量進(jìn)行預(yù)測(cè),將預(yù)測(cè)結(jié)果用于下一制導(dǎo)周期的計(jì)算。依次循環(huán),便構(gòu)建了“辨識(shí)—預(yù)測(cè)—計(jì)算”迭代更新的在線辨識(shí)模型,如圖1所示。
圖1 氣動(dòng)參數(shù)在線辨識(shí)在攝動(dòng)制導(dǎo)中的應(yīng)用流程Fig.1 Flow chart of the aerodynamic parameter online identification in perturbation guidance
本文將通過數(shù)值仿真對(duì)以上方法進(jìn)行驗(yàn)證。仿真條件如下:對(duì)象是某型號(hào)的運(yùn)載火箭,飛行階段為起飛至一級(jí)分離,起飛方式為垂直起飛,狀態(tài)初值為:[v0,θ0,h0]=[0,π/2,0],飛行標(biāo)準(zhǔn)程序如圖2所示。
圖2 數(shù)值仿真標(biāo)準(zhǔn)彈道程序俯仰角Fig.2 Program pitch angle in numerical simulation
為了驗(yàn)證本文設(shè)計(jì)擴(kuò)展Kalman濾波的有效性,基于上述對(duì)象,設(shè)計(jì)算例對(duì)Kalman濾波器的辨識(shí)效果進(jìn)行驗(yàn)證。
在濾波參數(shù)設(shè)計(jì)中,假設(shè)測(cè)量噪聲僅存在隨機(jī)漂移,且保持常值:
Rk=diag(10-6,10-6)
(22)
Qk=diag(0,0,0,10-4,10-4,10-10,10-10)
(23)
系統(tǒng)狀態(tài)初值:
[v0,θ0,h0,CDd0,CLd0,ξD0,ξD0]=
[0,π/2,0,0.001,0.001,0,0]
狀態(tài)誤差協(xié)方差矩陣的初值為:
P0=diag(0,0,0,10-2,10-2,10-6,10-6)
(24)
分別設(shè)置擾動(dòng)量真實(shí)值為0.1、-0.1,利用本文中的擴(kuò)展Kalman濾波器進(jìn)行辨識(shí),辨識(shí)結(jié)果如圖3所示。從圖3可以發(fā)現(xiàn),濾波器的收斂時(shí)間約為10 s,收斂速度較快;辨識(shí)誤差保持在10%以內(nèi),精度較高。
圖3 擴(kuò)展Kalman濾波器辨識(shí)曲線Fig.3 The performance curves of extended Kalman filter
為了驗(yàn)證基于氣動(dòng)參數(shù)在線辨識(shí)的攝動(dòng)制導(dǎo)方案的有效性,設(shè)計(jì)仿真對(duì)比實(shí)驗(yàn)。分別設(shè)置多組真實(shí)擾動(dòng)值,計(jì)算傳統(tǒng)攝動(dòng)制導(dǎo)方案和基于氣動(dòng)參數(shù)在線辨識(shí)的攝動(dòng)制導(dǎo)方案的終端狀態(tài)偏差。如表1所示。
表1 氣動(dòng)參數(shù)擾動(dòng)下的終端狀態(tài)偏差Table 1 Deviation of terminal state under the aerodynamic parameter disturbance
對(duì)表1中的結(jié)果進(jìn)行分析,新的攝動(dòng)制導(dǎo)方案相對(duì)于傳統(tǒng)攝動(dòng)制導(dǎo)方案,終端速度傾角偏差和高度偏差有所降低,終端速度偏差改變不大。從能量的角度分析,氣動(dòng)參數(shù)擾動(dòng)量直接影響氣動(dòng)力的大小,進(jìn)而改變氣動(dòng)力消耗的能量大小。而終端速度直接與終端能量相關(guān),而僅靠制導(dǎo)方法是無法完全彌補(bǔ)能量損耗的,因此新的攝動(dòng)制導(dǎo)方案對(duì)于終端速度偏差沒有明顯的改善效果。綜合以上分析,基于氣動(dòng)參數(shù)在線辨識(shí)的攝動(dòng)制導(dǎo)方案相對(duì)于傳統(tǒng)攝動(dòng)制導(dǎo),可以一定程度上減小終端偏差,提高制導(dǎo)精度。
為了進(jìn)一步驗(yàn)證新的攝動(dòng)制導(dǎo)方案的可靠性,設(shè)計(jì)Monte Carlo仿真實(shí)驗(yàn)。將氣動(dòng)參數(shù)擾動(dòng)量CDd、CLd設(shè)置為隨機(jī)擾動(dòng),均服從零值正態(tài)分布,3δ偏差CDd為0.15,CLd為0.015,進(jìn)行500次Monte Carlo打靶,結(jié)果如圖4、5所示。圖4為終端高度-終端速度傾角剖面圖,由圖可知:基于氣動(dòng)參數(shù)在線辨識(shí)的攝動(dòng)制導(dǎo)方法終端高度-速度傾角散布明顯小于傳統(tǒng)攝動(dòng)制導(dǎo):終端高度散布從約2 000 m減小到約1 000 m,終端速度傾角散布從0.016°減小到0.006°。圖5為高度-時(shí)間曲線散布對(duì)比,由圖可知基于氣動(dòng)參數(shù)辨識(shí)的攝動(dòng)制導(dǎo)的高度-時(shí)間曲線散布明顯小于傳統(tǒng)攝動(dòng)制導(dǎo)。綜上所述,基于氣動(dòng)參數(shù)在線辨識(shí)的攝動(dòng)制導(dǎo)方案不僅能提高終端精度,還能讓真實(shí)彈道更好地保持在標(biāo)準(zhǔn)彈道附近。
圖4 Monte Carlo打靶終端狀態(tài)高度-速度傾角剖面圖Fig.4 Terminal altitude-velocity profile in Monte Carlo simulation
圖5 Monte Carlo打靶高度-時(shí)間曲線Fig.5 Altitude-velocity curves in Monte Carlo simulation
1) 采用擴(kuò)展Kalman濾波方法進(jìn)行氣動(dòng)參數(shù)辨識(shí),收斂較快,辨識(shí)精度較高;
2) 針對(duì)基于氣動(dòng)參數(shù)在線辨識(shí)的攝動(dòng)制導(dǎo)方法,設(shè)計(jì)對(duì)比仿真,發(fā)現(xiàn)該方法相對(duì)于傳統(tǒng)攝動(dòng)制導(dǎo)方法,能有效降低終端狀態(tài)偏差;并針對(duì)隨機(jī)氣動(dòng)擾動(dòng),進(jìn)行Monte Carlo打靶仿真,發(fā)現(xiàn)改進(jìn)的攝動(dòng)制導(dǎo)方案能有效地提高彈道收斂性,使彈道更好地保持在標(biāo)準(zhǔn)彈道附近。