謝 磊, 丁達(dá)理, 魏政磊, 湯安迪, 張 鵬
(空軍工程大學(xué)航空工程學(xué)院, 陜西 西安 710038)
軌跡預(yù)測(cè)是自主空戰(zhàn)中的一個(gè)重要內(nèi)容,對(duì)于機(jī)動(dòng)決策技術(shù)有著非常深遠(yuǎn)的影響,在雙方對(duì)抗過程中,擁有軌跡預(yù)測(cè)技術(shù)的一方將會(huì)更加迅速地占據(jù)態(tài)勢(shì)優(yōu)勢(shì),完成打擊任務(wù)。軌跡預(yù)測(cè)問題的本質(zhì)是時(shí)間序列的預(yù)測(cè)問題,且具有高度的非線性和時(shí)變特性[1]。其理論依據(jù)是物體的運(yùn)動(dòng)狀態(tài)具有一定的連續(xù)性,控制量不會(huì)發(fā)生突變,這意味著未來時(shí)刻的位置必然與之前時(shí)刻有一定的相關(guān)性。機(jī)動(dòng)軌跡預(yù)測(cè)是指在空戰(zhàn)過程中處理前一段時(shí)間內(nèi)的三維軌跡,通過預(yù)測(cè)方法得到未來一段時(shí)間內(nèi)的軌跡。在空戰(zhàn)對(duì)抗體系中,由于飛機(jī)機(jī)動(dòng)性能較強(qiáng),軌跡多變,長(zhǎng)時(shí)段的預(yù)測(cè)會(huì)使精度大大降低,僅預(yù)測(cè)后一時(shí)刻的位置就已經(jīng)具備預(yù)判條件。因此,一個(gè)迅速又準(zhǔn)確的機(jī)動(dòng)軌跡預(yù)測(cè)方法在空戰(zhàn)對(duì)抗中顯得極為重要。
國(guó)內(nèi)外學(xué)者為解決軌跡預(yù)測(cè)問題提出多種方法。文獻(xiàn)[2]采用隨機(jī)非線性混合系統(tǒng)模擬飛機(jī)動(dòng)力學(xué),將飛機(jī)軌跡預(yù)測(cè)轉(zhuǎn)化為貝葉斯估計(jì)問題,利用粒子濾波方法提供數(shù)值解,但當(dāng)軌跡發(fā)生劇烈變化時(shí),預(yù)測(cè)精度會(huì)降低。文獻(xiàn)[3]提出一種基于配置法的非線性模型預(yù)測(cè)方法,預(yù)測(cè)精度相比于傳統(tǒng)的線性模型大幅提高,實(shí)時(shí)性能也能夠滿足要求,但僅在低速條件下進(jìn)行測(cè)試,在高速飛行軌跡預(yù)測(cè)時(shí)誤差會(huì)放大。文獻(xiàn)[4]在二階隱馬爾可夫模型的基礎(chǔ)上,設(shè)計(jì)了火花平臺(tái)下的軌跡預(yù)測(cè)框架,相比于隱馬爾可夫模型和核平滑變階馬爾可夫模型魯棒性能更好,但該算法在預(yù)測(cè)精度上還有待提高。文獻(xiàn)[5]根據(jù)歷史軌跡的特征進(jìn)行聚類,對(duì)每一聚類訓(xùn)練一個(gè)隱馬爾可夫模型,但在實(shí)際飛行軌跡中,根據(jù)不同的特征會(huì)劃分出過多的類別,導(dǎo)致預(yù)測(cè)的實(shí)時(shí)性能無法滿足。文獻(xiàn)[6]利用氣動(dòng)參數(shù)設(shè)計(jì)機(jī)動(dòng)模式集,通過蒙特卡羅采樣和貝葉斯理論實(shí)現(xiàn)軌跡預(yù)測(cè),相對(duì)于傳統(tǒng)的外推理論精度更高,但要求建立一個(gè)較為完善的機(jī)動(dòng)模式集,在實(shí)際情況中很難進(jìn)行完善。文獻(xiàn)[7]采用混合粒子群優(yōu)化(hybrid particle swarm optimization, HPSO)算法優(yōu)化Elman網(wǎng)絡(luò)的初始權(quán)值和閾值并提出將三維坐標(biāo)拆分進(jìn)行獨(dú)立預(yù)測(cè),雖有更高的收斂速度,在各坐標(biāo)上的相對(duì)誤差也大大降低,但隨著飛行距離的不斷增加,其絕對(duì)誤差會(huì)逐漸偏大。文獻(xiàn)[8]對(duì)軌跡建立模型,提出了基于多元正態(tài)分布的最佳線性預(yù)測(cè)器,較大幅度地提高了預(yù)測(cè)精度,但該方法進(jìn)行預(yù)測(cè)會(huì)產(chǎn)生延遲,實(shí)時(shí)性能不夠。文獻(xiàn)[9]提出了基于高斯混合模型的軌跡預(yù)測(cè)方法,利用高斯混合模型計(jì)算不同運(yùn)動(dòng)模式的概率分布,其預(yù)測(cè)結(jié)果是未來所有可能運(yùn)動(dòng)軌跡的概率分布,在自由空戰(zhàn)中三維模型會(huì)產(chǎn)生大量不同的運(yùn)動(dòng)模式,預(yù)測(cè)結(jié)果可能會(huì)變成多種小概率事件,所以在多維運(yùn)動(dòng)中適應(yīng)性不高。文獻(xiàn)[10]將灰色理論和動(dòng)態(tài)測(cè)量理論結(jié)合,利用最小方差估計(jì)值代替實(shí)際值,引入微分方程,求解預(yù)測(cè)軌跡,該方法無法準(zhǔn)確地對(duì)參數(shù)估值,降低了預(yù)測(cè)的準(zhǔn)確性。文獻(xiàn)[11]提出一種基于隱馬爾可夫模型的軌跡預(yù)測(cè)方法,在隱形馬爾可夫過程中加入自適應(yīng)參數(shù),提高了預(yù)測(cè)效率,并能夠自適應(yīng)調(diào)整軌跡預(yù)測(cè)長(zhǎng)度。
隨著2012年Hinton課題組通過構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)參加ImageNet圖像識(shí)別比賽,且以碾壓性的優(yōu)勢(shì)遠(yuǎn)超第二名,深度學(xué)習(xí)開始進(jìn)入爆發(fā)期,在軌跡預(yù)測(cè)方面也得到廣泛應(yīng)用。文獻(xiàn)[12]提出了一種飛機(jī)4維軌跡預(yù)測(cè)模型,將CNN與長(zhǎng)短期記憶(long and short term memory,LSTM)網(wǎng)絡(luò)結(jié)合,預(yù)測(cè)精度相比于單一模型更高,但其缺點(diǎn)是只能進(jìn)行短期預(yù)測(cè),且飛機(jī)軌跡變化不能過于劇烈,適用范圍有限。文獻(xiàn)[13]提出了一種深度編碼和深度解碼的序列到序列的深度LSTM網(wǎng)絡(luò)用于軌跡預(yù)測(cè),提高了預(yù)測(cè)的準(zhǔn)確性和魯棒性,但其僅應(yīng)用于飛機(jī)航行的終端空域,終端空域的軌跡都較為平滑,在復(fù)雜軌跡情況下預(yù)測(cè)精度會(huì)大幅降低。文獻(xiàn)[14]提出了一種模糊長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò),解決了目標(biāo)運(yùn)動(dòng)的尖銳邊界問題,依靠歷史軌跡的鄰近性和周期性進(jìn)行預(yù)測(cè),準(zhǔn)確率較高。上述研究表明,深度神經(jīng)網(wǎng)絡(luò)計(jì)算速度非??烨也⒉恍枰^多的外界參數(shù)輸入,更不需要人為估值,相對(duì)于傳統(tǒng)的濾波算法、反向傳播(back propagation,BP)網(wǎng)絡(luò)和Elman網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確率更高。
由于沒有具備自主空戰(zhàn)的飛機(jī),且實(shí)際對(duì)抗成本過高,因此本文建立三自由度無人機(jī)(unmanned aerial vehicle, UAV)動(dòng)力學(xué)模型,解決了機(jī)動(dòng)軌跡數(shù)據(jù)來源的問題。目前的技術(shù)僅能探測(cè)對(duì)手的位置信息,無法確定其控制量的大小,必須建立一個(gè)僅通過歷史軌跡就可以迅速進(jìn)行預(yù)測(cè)的方法。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)是一類專門用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),而歷史軌跡正是一串時(shí)間序列數(shù)據(jù)。在實(shí)際運(yùn)用過程中,RNN在處理長(zhǎng)序列輸入時(shí)往往會(huì)喪失了學(xué)習(xí)能力,因此采用RNN的一種變體——LSTM網(wǎng)絡(luò)結(jié)構(gòu)。但LSTM解決梯度問題并不完善,主要是由于內(nèi)部權(quán)值訓(xùn)練仍采用基于時(shí)間的BP(BP through time, BPTT)算法,不斷地鏈?zhǔn)角髮?dǎo)再累乘就會(huì)導(dǎo)致“梯度爆炸”和“梯度消失”現(xiàn)象。為避免這一問題,采用粒子群優(yōu)化(particle swarm optimization, PSO)算法優(yōu)化內(nèi)部多維權(quán)值。為增加預(yù)測(cè)精度,通過自適應(yīng)增強(qiáng)(adaptive boosting, AdaBoost)算法建立強(qiáng)預(yù)測(cè)器。最后與傳統(tǒng)的AdaBoost-BP、CNN、RNN、LSTM和PSO-LSTM在一段變化較為頻繁的機(jī)動(dòng)軌跡上進(jìn)行對(duì)比預(yù)測(cè)。
UAV三自由度模型對(duì)UAV的運(yùn)動(dòng)狀態(tài)進(jìn)行描述。現(xiàn)作出如下假設(shè):① 將UAV視為質(zhì)點(diǎn),不考慮其形狀;② 忽略側(cè)滑角;③ 忽略地球自轉(zhuǎn)和曲率的影響,將地面坐標(biāo)系作為慣性坐標(biāo)系;④ 忽略氣流與陣風(fēng)的影響;⑤ 忽略高度與經(jīng)緯度對(duì)重力加速度的影響?;谝陨霞僭O(shè),可以建立如下質(zhì)點(diǎn)模型[15]:
(1)
神經(jīng)網(wǎng)絡(luò)主要分為前饋網(wǎng)絡(luò)和反饋網(wǎng)絡(luò)[16]。前饋神經(jīng)網(wǎng)絡(luò)每次輸出僅依賴當(dāng)前輸入,不具備考慮不同時(shí)刻輸入之間相互影響的能力,所以在處理時(shí)序性問題時(shí)一般采用反饋網(wǎng)絡(luò)。RNN就是一類專門處理時(shí)序數(shù)據(jù)樣本的反饋網(wǎng)絡(luò)[17-19]。RNN中不僅包含傳統(tǒng)的輸入到隱層,隱層到輸出的過程,還具有隱層到隱層的傳遞過程,結(jié)構(gòu)如圖1所示。可以清楚地看出,隱層的輸出不僅取決于輸入還與上一時(shí)刻的隱層輸出有關(guān),因此RNN能夠?qū)⑼恍蛄兄胁煌瑫r(shí)刻輸入關(guān)聯(lián)起來。在理論上,當(dāng)數(shù)據(jù)存在長(zhǎng)間隔的依賴或依賴范圍隨時(shí)間變化的問題時(shí),RNN可以較好地解決,但在實(shí)際過程中由于數(shù)據(jù)信息流過長(zhǎng),計(jì)算量會(huì)爆炸式增長(zhǎng),難以學(xué)習(xí)長(zhǎng)期依賴關(guān)系[20]。因此,RNN的變體LSTM網(wǎng)絡(luò)[21-23]被提出,本文也采用該種網(wǎng)絡(luò)結(jié)構(gòu)。
圖1 RNN結(jié)構(gòu)圖Fig.1 RNN structure diagram
LSTM網(wǎng)絡(luò)相對(duì)于RNN而言,增加了3個(gè)門控系統(tǒng)分別為:輸入門、遺忘門和輸出門,具體網(wǎng)絡(luò)單元如圖2所示。Ct-1為上一單元狀態(tài),ht-1為上一單元輸出,Xt表示為當(dāng)前時(shí)刻網(wǎng)絡(luò)單元的輸入,Ct和ht分別表示為當(dāng)前網(wǎng)絡(luò)單元的狀態(tài)和輸出。
圖2 LSTM網(wǎng)絡(luò)單元Fig.2 LSTM network unit
LSTM網(wǎng)絡(luò)主要通過單元狀態(tài)來進(jìn)行信息的傳遞。從計(jì)算過程來看,Ct-1首先和遺忘門的輸出進(jìn)行乘積,再和輸入門的輸出累加。本質(zhì)就是將上一時(shí)刻的信息進(jìn)行更新,再與當(dāng)前時(shí)刻信息融合,通過這種方式長(zhǎng)期記憶信息。為了保證數(shù)據(jù)的精簡(jiǎn),增加了遺忘門,將ht-1和Xt拼接為單個(gè)向量,通過Sigmoid激活函數(shù),把數(shù)據(jù)規(guī)整至0~1之間,其中1為“完全保留”,0為“完全拋棄”,利用該方法有效地進(jìn)行了數(shù)據(jù)篩選,避免了無用運(yùn)算。具體遺忘門計(jì)算公式為
Ft=σ(Wfg[ht-1,Xt]+bf)
(2)
式中,σ表示Sigmoid激活函數(shù);Wf表示遺忘門內(nèi)部權(quán)值;bf表示遺忘門內(nèi)部偏執(zhí);g表示向量拼接。
輸入門決定當(dāng)前單元的輸入信息。通過tanh函數(shù)表示當(dāng)前信息,同時(shí)利用Sigmoid函數(shù)決定哪些信息是有用,哪些是無用,與tanh函數(shù)輸出相乘,輸入到當(dāng)前單元狀態(tài),公式為
it=σ(Wig[ht-1,Xt]+bi)·
tanh(Wcg[ht-1,Xt]+bc)
(3)
式中,Wi表示輸入門權(quán)值;bi表示輸入門偏置。
輸出門決定當(dāng)前單元的輸出。將當(dāng)前單元狀態(tài)Ct經(jīng)過tanh函數(shù)表示,同時(shí)把ht-1和Xt利用Sigmoid函數(shù)激活,兩者相乘,其結(jié)果就是當(dāng)前單元輸出ht,計(jì)算公式為
Ot=σ(Wog[ht-1,Xt]+bo)
(4)
ht=Ot·tanh(Ct)
(5)
式中,Wo表示輸出門權(quán)值;bo為輸出門偏置。
LSTM網(wǎng)絡(luò)正是通過3個(gè)門的控制在一定程度上解決了RNN處理序列時(shí)的長(zhǎng)期依賴問題,因此也采用該網(wǎng)絡(luò)進(jìn)行軌跡預(yù)測(cè)。在文獻(xiàn)[7]中已經(jīng)提出三維坐標(biāo)獨(dú)立進(jìn)行預(yù)測(cè)相對(duì)于整體預(yù)測(cè)精度更高,所以將x、y和z軸上的坐標(biāo)單獨(dú)作為L(zhǎng)STM網(wǎng)絡(luò)的輸入。在利用三自由度模型仿真軌跡時(shí),每次采樣數(shù)據(jù)間隔0.3 s,10次采樣為一組,通過前9個(gè)樣本構(gòu)建5×5滑動(dòng)模塊矩陣,預(yù)測(cè)第10個(gè)樣本數(shù)據(jù)。
滑動(dòng)模塊輸入矩陣:
(6)
滑動(dòng)模塊預(yù)測(cè)輸出修正矩陣:
(7)
LSTM網(wǎng)絡(luò)在線測(cè)試時(shí)通過已知矩陣前4行預(yù)測(cè)數(shù)據(jù)進(jìn)行實(shí)時(shí)修正,及時(shí)調(diào)整內(nèi)部權(quán)值和偏置,此時(shí)網(wǎng)絡(luò)輸入節(jié)點(diǎn)為5,輸出節(jié)點(diǎn)為1。
LSTM網(wǎng)絡(luò)通過3個(gè)門控系統(tǒng)并沒有完全解決網(wǎng)絡(luò)的“梯度消失”和“梯度爆炸”問題,其主要原因就是內(nèi)部權(quán)值更新采用傳統(tǒng)的BPTT算法,不斷地鏈?zhǔn)角髮?dǎo)再累乘。為避免這一現(xiàn)象,采用PSO算法[24]把權(quán)值更新轉(zhuǎn)化為最優(yōu)化問題,具體過程如圖3所示。
圖3 PSO優(yōu)化LSTM內(nèi)部權(quán)值流程圖Fig.3 Flow chart of internal weight for PSO optimized LSTM
當(dāng)采用非定向性的優(yōu)化算法時(shí)與梯度下降方法相比難免會(huì)增加更新時(shí)間,為此采用數(shù)據(jù)共享,在第二次以后的預(yù)測(cè)過程中PSO算法的種群初始設(shè)置變?yōu)榈谝淮晤A(yù)測(cè)的最優(yōu)種群,大幅度地減少算法初期的搜索時(shí)間。在算法迭代尋優(yōu)過程中,采用LSTM網(wǎng)絡(luò)誤差作為適應(yīng)度函數(shù),如果3次連續(xù)迭代都沒有發(fā)生變化,則判定算法搜索陷入停滯,采用高斯隨機(jī)游走策略(Gaussian random walk strategy, GWS)[25]突破局部限制。GWS模型如下:
X(t+1)=Gaussian(X(t),s1)
(8)
(9)
為驗(yàn)證改進(jìn)后PSO-LSTM網(wǎng)絡(luò)相對(duì)于傳統(tǒng)網(wǎng)絡(luò),在在線預(yù)測(cè)方面更加快速準(zhǔn)確,利用模型采樣5組數(shù)據(jù),進(jìn)行預(yù)測(cè),結(jié)果如圖4所示。
圖4 PSO-LSTM與LSTM預(yù)測(cè)對(duì)比Fig.4 Prediction comparison of PSO-LSTM and LSTM
經(jīng)過相同的數(shù)據(jù)檢驗(yàn),PSO-LSTM網(wǎng)絡(luò)相對(duì)于傳統(tǒng)的網(wǎng)絡(luò),預(yù)測(cè)時(shí)間更加快,且5次預(yù)測(cè)的平均誤差也比LSTM網(wǎng)絡(luò)低,所以共享數(shù)據(jù)后的PSO算法調(diào)整LSTM網(wǎng)絡(luò)內(nèi)部權(quán)值可以做到更加快速,加入高斯游走策略以后也提升了預(yù)測(cè)精度。
AdaBoost算法[26-29]是一種提升預(yù)測(cè)精度的方法,將多個(gè)弱預(yù)測(cè)器組合成強(qiáng)預(yù)測(cè)器,采用該方法搭建的整體外框架如圖5所示。將PSO-LSTM網(wǎng)絡(luò)作為其弱預(yù)測(cè)器進(jìn)行訓(xùn)練,前一個(gè)網(wǎng)絡(luò)分錯(cuò)的樣本的權(quán)值會(huì)得到加強(qiáng),權(quán)值更新后的樣本再次被用來訓(xùn)練下一個(gè)網(wǎng)絡(luò)。在每輪訓(xùn)練中,用總體樣本訓(xùn)練新的PSO-LSTM,產(chǎn)生新的樣本權(quán)值和該弱預(yù)測(cè)器的權(quán)重,一直迭代直到達(dá)到預(yù)定的錯(cuò)誤率或指定的最大迭代次數(shù)。
圖5 AdaBoost框架圖Fig.5 AdaBoost framework diagram
具體算法流程如下。
步驟 1初始化訓(xùn)練數(shù)據(jù)權(quán)值分布。每個(gè)樣本賦予相同權(quán)值Wi=1/N,N為樣本總數(shù)。第一次迭代后每個(gè)樣本的權(quán)值集為D1=(W11,W12,…,W1N)。
步驟 2設(shè)置弱預(yù)測(cè)器數(shù)量K。根據(jù)時(shí)間與精度要求綜合設(shè)置弱預(yù)測(cè)器個(gè)數(shù)。
步驟 3弱預(yù)測(cè)器預(yù)測(cè)。訓(xùn)練第t個(gè)弱預(yù)測(cè)器,采用訓(xùn)練數(shù)據(jù)在PSO-LSTM網(wǎng)絡(luò)中預(yù)測(cè),得到輸出結(jié)果f(x),與實(shí)際值y比較得到誤差函數(shù)值et,計(jì)算公式為
(10)
步驟 4計(jì)算弱預(yù)測(cè)器權(quán)重。根據(jù)誤差函數(shù)值計(jì)算弱預(yù)測(cè)器權(quán)重at,計(jì)算公式為
(11)
步驟 5更新訓(xùn)練數(shù)據(jù)樣本權(quán)值。通過弱預(yù)測(cè)器權(quán)重at調(diào)整訓(xùn)練數(shù)據(jù)樣本權(quán)值,更新公式為
(12)
式中,β為歸一化因子,使得在權(quán)重比例不變的情況下使分布權(quán)值。
(13)
步驟 6強(qiáng)預(yù)測(cè)函數(shù)。弱預(yù)測(cè)器訓(xùn)練K次以后,得到K組弱預(yù)測(cè)預(yù)測(cè)值,組合后得到強(qiáng)預(yù)測(cè)器。強(qiáng)預(yù)測(cè)器預(yù)測(cè)計(jì)算公式為
(14)
由于網(wǎng)絡(luò)的輸入層和輸出層的節(jié)點(diǎn)數(shù)量已由滑動(dòng)模塊輸入矩陣確定,因此PSO-LSTM網(wǎng)絡(luò)結(jié)構(gòu)主要是設(shè)置隱藏層和隱藏層節(jié)點(diǎn)數(shù)量,由于隱藏層數(shù)量的增加會(huì)造成時(shí)間成本的快速增加,考慮到機(jī)動(dòng)預(yù)測(cè)對(duì)時(shí)效性的高要求,設(shè)置雙隱藏層網(wǎng)絡(luò)結(jié)構(gòu)。
隱藏層節(jié)點(diǎn)數(shù)與解算的復(fù)雜程度和輸出精度有著直接的聯(lián)系,節(jié)點(diǎn)數(shù)過多時(shí)會(huì)造成網(wǎng)絡(luò)泛化能力缺失,甚至出現(xiàn)“過擬合”現(xiàn)象;節(jié)點(diǎn)數(shù)過少時(shí),則會(huì)造成訓(xùn)練能力降低,性能較差[30]。因此,選擇不同節(jié)點(diǎn)數(shù)的網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)尋找出較優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)。預(yù)測(cè)時(shí)間如圖6(a)所示,預(yù)測(cè)精度如圖6(b)所示。從圖6可以看出,節(jié)點(diǎn)數(shù)的增加對(duì)預(yù)測(cè)時(shí)間影響并不是很大,都在0.035 s左右浮動(dòng),相對(duì)于0.3 s采樣時(shí)間是可以接受的。從圖6(b)可以看出,在節(jié)點(diǎn)數(shù)為8時(shí)預(yù)測(cè)絕對(duì)誤差最小,因此雙隱藏層網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)選擇為8。
圖6 預(yù)測(cè)指標(biāo)與節(jié)點(diǎn)數(shù)關(guān)系Fig.6 Relationship between prediction index and node number
從Boosting思想[31]到AdaBoost算法,關(guān)鍵是引入了在線分配算法思想。在AdaBoost算法中,在線分配算法的策略就是每一個(gè)弱分類器,根據(jù)每個(gè)策略所造成的損失值確定其在整體中的權(quán)重,這也正是AdaBoost算法弱分類器權(quán)重的理論來源。為了得到高擬合精度的強(qiáng)分類器,需要加入多個(gè)弱分類器,但這就會(huì)修改已有弱分類器的集成方式,增加復(fù)雜度。AdaBoost使用貪心策略避免了該問題,采用線性加和的方式加入新的弱分類器。線性加和的確大大提高了精度,簡(jiǎn)化了算法,但運(yùn)算時(shí)間也成了新的問題。在機(jī)動(dòng)軌跡預(yù)測(cè)方面,由于空戰(zhàn)變化非常劇烈所以對(duì)實(shí)時(shí)性要求很高,而弱預(yù)測(cè)器的數(shù)量K正是精度和時(shí)間的決定性因素。
在確定PSO-LSTM網(wǎng)絡(luò)層數(shù)和節(jié)點(diǎn)數(shù)以后,將其作為弱預(yù)測(cè)器對(duì)AdaBoost框架進(jìn)行填充,嘗試不同數(shù)量的弱預(yù)測(cè)器。為克服尋優(yōu)算法的偶然性,對(duì)同一K值的強(qiáng)預(yù)測(cè)器多次預(yù)測(cè),取平均誤差和平均時(shí)間,確定最合理的弱預(yù)測(cè)器數(shù)量,結(jié)果如表1所示。
表1 不同K值的強(qiáng)預(yù)測(cè)器誤差與時(shí)耗
為驗(yàn)證提出的預(yù)測(cè)模型切實(shí)有效,選取一段變化較為復(fù)雜的飛行軌跡,在實(shí)時(shí)性和準(zhǔn)確率兩方面與傳統(tǒng)的AdaBoost-BP、CNN、RNN、LSTM和LSTM-PSO網(wǎng)絡(luò)進(jìn)行對(duì)比。
由于機(jī)動(dòng)軌跡變化的多樣性,所有網(wǎng)絡(luò)的離線預(yù)測(cè)需要大量數(shù)據(jù)進(jìn)行訓(xùn)練且準(zhǔn)確率并不能夠得到保證,所以都采用滑動(dòng)輸入模塊的在線預(yù)測(cè)方法,并在此基礎(chǔ)上進(jìn)行單步預(yù)測(cè)時(shí)間對(duì)比。
從圖7中可以看出,所有網(wǎng)絡(luò)結(jié)構(gòu)在線預(yù)測(cè)的單步時(shí)間相差并不是很大,均在0.12 s以下,其中PSO-LSTM網(wǎng)絡(luò)所用時(shí)間最短約為0.04 s,而AdaBoost-PSO-LSTM所用時(shí)間約為0.08 s,相對(duì)于0.3 s的采樣間隔能夠及時(shí)地提供預(yù)測(cè)信息,實(shí)時(shí)性較好。
圖7 單步時(shí)間對(duì)比Fig.7 Comparison of single step time
利用三自由度模型隨機(jī)產(chǎn)生一組機(jī)動(dòng)軌跡,采樣300次,每10組進(jìn)行一次預(yù)測(cè),共預(yù)測(cè)30個(gè)周期。為能提高預(yù)測(cè)精度采用三維坐標(biāo)獨(dú)立預(yù)測(cè)[7],與其他預(yù)測(cè)方法進(jìn)行誤差對(duì)比。由圖8可知,AdaBoost-PSO-LSTM網(wǎng)絡(luò)在3個(gè)軸上的誤差均為最小,與實(shí)際軌跡最為切合。相對(duì)而言,x軸和y軸的預(yù)測(cè)結(jié)果較好,x軸誤差均值為1.9 m,y軸誤差均值為2.1 m。由于該機(jī)動(dòng)在z軸上的變換較為劇烈,造成多次飛行趨勢(shì)的變化,這也就產(chǎn)生了相對(duì)較大的誤差,最大為13.7 m,z軸誤差均值為8.3 m。相對(duì)于傳統(tǒng)的深度學(xué)習(xí)網(wǎng)絡(luò)[13]在離線訓(xùn)練后預(yù)測(cè),精度有明顯提高。在圖9所示的三維軌跡視圖中可以較為清楚地發(fā)現(xiàn),AdaBoost-PSO-LSTM網(wǎng)絡(luò)預(yù)測(cè)的軌跡并沒有很多的突變,而傳統(tǒng)的CNN、RNN和LSTM網(wǎng)絡(luò)預(yù)測(cè)點(diǎn)繪制的軌跡都有較多的突變點(diǎn),這與實(shí)際情況不相符合。PSO-LSTM網(wǎng)絡(luò)和AdaBoost-BP網(wǎng)絡(luò)的預(yù)測(cè)點(diǎn)與實(shí)際軌跡較接近,但相比之下AdaBoost-PSO-LSTM網(wǎng)絡(luò)預(yù)測(cè)的軌跡最貼近實(shí)際軌跡,大部分情況下都是處于一種重合狀態(tài),只有少部分預(yù)測(cè)點(diǎn)有較小的偏離,所以在精度上AdaBoost-PSO-LSTM網(wǎng)絡(luò)相對(duì)于其他網(wǎng)絡(luò)效果更好。
圖8 預(yù)測(cè)及誤差雷達(dá)圖Fig.8 Prediction and error radar chart
圖9 三維軌跡預(yù)測(cè)結(jié)果Fig.9 Three dimensional trajectory prediction results
針對(duì)近距空戰(zhàn)格斗中軌跡預(yù)測(cè)問題,提出了AdaBoost-PSO-LSTM網(wǎng)絡(luò)結(jié)構(gòu),并進(jìn)行實(shí)時(shí)預(yù)測(cè)仿真,得到以下結(jié)論:
(1) 采用PSO優(yōu)化算法代替?zhèn)鹘y(tǒng)BPTT算法對(duì)LSTM網(wǎng)絡(luò)內(nèi)部權(quán)值更新進(jìn)行軌跡預(yù)測(cè),所需時(shí)間更短,能夠滿足在線預(yù)測(cè)的時(shí)間要求,精度也有所提高;
(2) 利用AdaBoost算法搭建網(wǎng)絡(luò)外框架能夠較大幅度地提升預(yù)測(cè)精度,并且可以根據(jù)時(shí)間要求改變內(nèi)部弱預(yù)測(cè)器數(shù)量,使得軌跡預(yù)測(cè)能夠同時(shí)滿足實(shí)時(shí)性能和精度要求;
(3) 通過對(duì)比仿真確定網(wǎng)絡(luò)結(jié)構(gòu),在一段變化較為頻繁的軌跡上進(jìn)行預(yù)測(cè),精度方面明顯比AdaBoost-BP、CNN、RNN、LSTM和PSO-LSTM網(wǎng)絡(luò)更好,所用時(shí)間也在預(yù)測(cè)的允許范圍內(nèi),說明網(wǎng)絡(luò)結(jié)構(gòu)選取合理;
(4) 在所選擇的軌跡上,x軸平均誤差為1.9 m,y軸平均誤差為2.1 m,z軸平均誤差為8.3 m,與傳統(tǒng)的深度學(xué)習(xí)網(wǎng)絡(luò)離線訓(xùn)練再預(yù)測(cè)的結(jié)果相比有顯著的提高。