張顯煬,朱曉宇,林浩申,劉 剛,安喜彬
(火箭軍工程大學(xué) 核工程學(xué)院,西安 710025)
軌跡預(yù)測(cè)的目的是通過(guò)分析移動(dòng)目標(biāo)的歷史軌跡挖掘數(shù)據(jù)特征,從而得到軌跡數(shù)據(jù)模型,進(jìn)一步實(shí)現(xiàn)軌跡的時(shí)空預(yù)測(cè)[1]。通過(guò)對(duì)艦船的歷史軌跡數(shù)據(jù)建模并研究相應(yīng)的求解算法進(jìn)行艦船軌跡預(yù)測(cè),可以為海洋作業(yè)如海上搜救、海洋運(yùn)輸?shù)忍峁┲匾U?。海面艦船與地面道路車輛的不同主要有兩點(diǎn):一是軌跡約束不同,海面艦船軌道約束和速度約束弱,其運(yùn)動(dòng)的隨機(jī)性較大,運(yùn)動(dòng)模式多樣,運(yùn)動(dòng)規(guī)律多變;二是軌跡數(shù)據(jù)來(lái)源方式不同,車輛軌跡數(shù)據(jù)通常可以通過(guò)GPS定位得到,而海面艦船的軌跡一般是通過(guò)偵察衛(wèi)星觀測(cè)而來(lái),其軌跡是離散的數(shù)據(jù)點(diǎn),且受到衛(wèi)星觀測(cè)精度的影響,軌跡數(shù)據(jù)特征進(jìn)一步復(fù)雜化。因此,將傳統(tǒng)的地面車輛軌跡預(yù)測(cè)方法應(yīng)用于海面艦船上不能得到良好的預(yù)測(cè)結(jié)果,但是海洋作業(yè)又對(duì)艦船軌跡預(yù)測(cè)精度和實(shí)時(shí)性提出較高的要求。
當(dāng)前軌跡預(yù)測(cè)常用的方法有卡爾曼濾波器(Kalman Filter,KF)[2-3]、隱馬爾科夫模型(Hidden Markov Model,HMM)[4]和高斯混合模型(Gaussian Mixture Model,GMM)[5]??柭鼮V波器具有線性、無(wú)偏、方差小等特點(diǎn),被廣泛用于預(yù)測(cè)問(wèn)題,但是該方法需要做大量的矩陣運(yùn)算從而缺乏實(shí)時(shí)性,常用于道路車輛等運(yùn)動(dòng)模型簡(jiǎn)單的目標(biāo)的軌跡預(yù)測(cè)。隱馬爾科夫模型本質(zhì)上是對(duì)時(shí)間序列的預(yù)測(cè),但是對(duì)噪聲沒(méi)有較好的魯棒性,并且隨著數(shù)據(jù)集的增大,預(yù)測(cè)誤差會(huì)不斷累積。高斯混合模型是一種被廣泛應(yīng)用的基于概率統(tǒng)計(jì)的預(yù)測(cè)模型,模型中的軌跡數(shù)據(jù)由多個(gè)高斯過(guò)程線性組合產(chǎn)生,通過(guò)高斯混合建模并使用最大似然估計(jì)(Expectation-Maximization,EM)算法求取模型參數(shù),再通過(guò)高斯混合回歸實(shí)現(xiàn)軌跡預(yù)測(cè)。文獻(xiàn)[6]表明,對(duì)于軌跡數(shù)據(jù)較多的情況,GMM方法在預(yù)測(cè)精度和實(shí)時(shí)性上性能均優(yōu)于KF和HMM方法。目前,GMM方法在車輛軌跡預(yù)測(cè)[7-8]、智能交通[9]、數(shù)據(jù)聚類[10-11]等領(lǐng)域都得到了較好的應(yīng)用。由于車輛的行進(jìn)軌跡受到道路、速度等諸多約束,其移動(dòng)規(guī)律和數(shù)據(jù)特征較為簡(jiǎn)單,因此GMM的預(yù)測(cè)誤差小。但是當(dāng)數(shù)據(jù)的復(fù)雜度提高時(shí),GMM方法不再具有良好的適用性,并且隨著數(shù)據(jù)集的增大,GMM方法的計(jì)算代價(jià)也會(huì)指數(shù)級(jí)增加。因此,針對(duì)艦船軌跡的特征,亟需研究計(jì)算代價(jià)低、預(yù)測(cè)精度高的軌跡預(yù)測(cè)算法。
軌跡預(yù)測(cè)的本質(zhì)是通過(guò)訓(xùn)練模型獲得模型參數(shù),再利用模型進(jìn)行預(yù)測(cè)生成,這與變分自編碼器(Variational Autoencoder,VAE)[12]的設(shè)計(jì)思想相近。變分自編碼器是當(dāng)前被廣泛應(yīng)用的一種無(wú)監(jiān)督生成模型[13-14],能夠解決無(wú)標(biāo)簽的機(jī)器學(xué)習(xí)問(wèn)題[15-16]。它通過(guò)神經(jīng)網(wǎng)絡(luò)將原始的高維數(shù)據(jù)編碼到低維的隱空間,再根據(jù)解碼網(wǎng)絡(luò)生成原始數(shù)據(jù)的逼近值。在經(jīng)典的變分自編碼器中,隱變量的后驗(yàn)分布通常被假設(shè)為簡(jiǎn)單的分布,例如標(biāo)準(zhǔn)正態(tài)分布,這導(dǎo)致低維隱空間的表示和對(duì)隱空間的特征描述過(guò)于簡(jiǎn)單,一旦原始訓(xùn)練數(shù)據(jù)集復(fù)雜度提高,模型生成的精度將達(dá)不到要求。為解決該問(wèn)題,文獻(xiàn)[17-18]通過(guò)假設(shè)更復(fù)雜的先驗(yàn)分布形式來(lái)提高模型生成和預(yù)測(cè)的準(zhǔn)確性。如何將VAE方法應(yīng)用到軌跡預(yù)測(cè)問(wèn)題上,并通過(guò)合理假設(shè)隱空間的先驗(yàn)分布,使其更符合真實(shí)的數(shù)據(jù)分布,是當(dāng)前需要解決的問(wèn)題。
本文研究海面艦船的軌跡預(yù)測(cè)問(wèn)題,提出一種基于高斯混合先驗(yàn)-變分自編碼器(GMVAE)的軌跡預(yù)測(cè)算法。將軌跡坐標(biāo)轉(zhuǎn)化為軌跡矢量,并以位移矢量表示預(yù)測(cè)目標(biāo)的位置坐標(biāo),利用VAE完成軌跡特征的提取與生成預(yù)測(cè)。針對(duì)海面艦船的軌跡數(shù)據(jù)特點(diǎn),將隱空間的先驗(yàn)分布假設(shè)為混合高斯分布,使其更符合真實(shí)的數(shù)據(jù)特征,同時(shí)在隱空間引入類別標(biāo)簽,完成對(duì)數(shù)據(jù)特征的分類。
海面艦船的軌跡數(shù)據(jù)通常由衛(wèi)星觀測(cè)獲得[19],因此,艦船的軌跡由離散的經(jīng)緯坐標(biāo)點(diǎn)構(gòu)成。本文假設(shè)艦船在二維平面上移動(dòng),將上述經(jīng)緯度坐標(biāo)看作平面坐標(biāo),以T表示n條軌跡組成的數(shù)據(jù)集:
T={T1,T2,…,Tn}
(1)
Ti={(xi1,yi1),(xi2,yi2),…,(xil,yil)}
(2)
其中,Ti表示第i條軌跡,(xij,yij)表示第i條軌跡在j時(shí)刻的坐標(biāo)點(diǎn),l是第i條軌跡數(shù)據(jù)的長(zhǎng)度,即該條軌跡包含坐標(biāo)點(diǎn)的數(shù)量。
假設(shè)艦船軌跡在x和y方向上相互獨(dú)立,在本文中,均以x方向上的軌跡預(yù)測(cè)問(wèn)題為例,y方向上的同理可得。設(shè)x軸方向上的真實(shí)軌跡數(shù)據(jù)集為X:
X=(x1,x2,…,xn)T
(3)
(4)
(5)
其中,ψλ表示軌跡預(yù)測(cè)模型,λ表示模型參數(shù)。
在通常情況下,軌跡數(shù)據(jù)集X較大,如本文的仿真數(shù)據(jù)集就包含約10 000條軌跡。KF方法是對(duì)每條軌跡進(jìn)行逐條預(yù)測(cè),加上大量的矩陣運(yùn)算必然導(dǎo)致計(jì)算代價(jià)高。HMM方法雖然不必逐條預(yù)測(cè),但是其預(yù)測(cè)誤差會(huì)隨著預(yù)測(cè)長(zhǎng)度的遞增不斷累積,本身的迭代計(jì)算復(fù)雜度也非常高。因此,上述兩種算法均不適用于艦船的軌跡預(yù)測(cè)。GMM方法雖然可以避免大量的矩陣運(yùn)算,在一些簡(jiǎn)單的軌跡預(yù)測(cè)問(wèn)題上,其實(shí)時(shí)性和精度均優(yōu)于上述兩種算法[6],但是該方法需要計(jì)算完整軌跡數(shù)據(jù)的對(duì)數(shù)似然關(guān)于某個(gè)分布的期望,對(duì)于復(fù)雜度很高的艦船軌跡數(shù)據(jù),其耗時(shí)會(huì)隨著數(shù)據(jù)集的增大呈指數(shù)級(jí)增長(zhǎng),這在實(shí)際的預(yù)測(cè)中是不可取的。為解決樣本數(shù)據(jù)集增大帶來(lái)的計(jì)算代價(jià)增大問(wèn)題,同時(shí)又保證軌跡預(yù)測(cè)精度,本文提出一種基于變分自編碼的軌跡預(yù)測(cè)算法。
圖1 變分自編碼器結(jié)構(gòu)
本節(jié)首先對(duì)艦船軌跡數(shù)據(jù)集進(jìn)行矢量化和歸一化處理,得到軌跡運(yùn)動(dòng)矢量集,從而與變分自編碼器結(jié)合完成軌跡的特征提取與生成預(yù)測(cè);然后改進(jìn)了經(jīng)典VAE的隱空間網(wǎng)絡(luò)結(jié)構(gòu),從而進(jìn)一步提高軌跡預(yù)測(cè)精度。
2.1.1 軌跡矢量集轉(zhuǎn)化
V={V1,V2,…,Vn}
(6)
2.1.2 數(shù)據(jù)歸一化
為使VAE的訓(xùn)練過(guò)程能夠收斂到最優(yōu)解,需要對(duì)上述矢量集數(shù)據(jù)進(jìn)行歸一化處理。歸一化公式如下:
(7)
其中,xmax、xmin為輸入軌跡數(shù)據(jù)的最大值和最小值。按照上述歸一化公式,可以得到模型的輸入Vnormal。
在基于經(jīng)典VAE的軌跡預(yù)測(cè)算法(VAETP)中,編碼網(wǎng)絡(luò)將軌跡數(shù)據(jù)映射到隱空間Z以提取數(shù)據(jù)特征,得到隱變量z的后驗(yàn)分布。引入標(biāo)準(zhǔn)高斯分布作為z的先驗(yàn)分布,通過(guò)最小化后驗(yàn)與先驗(yàn)分布之間的KL距離,達(dá)到訓(xùn)練編碼網(wǎng)絡(luò)參數(shù)的目的。預(yù)測(cè)的軌跡數(shù)據(jù)通過(guò)從z中采樣和解碼獲得。在采樣過(guò)程中,為了能夠進(jìn)行參數(shù)更新,使用了參數(shù)重構(gòu)[11]方法,對(duì)于小樣本軌跡數(shù)據(jù)可以獲得良好的預(yù)測(cè)結(jié)果。VAETP網(wǎng)絡(luò)架構(gòu)如圖2所示。
圖2 VAETP網(wǎng)絡(luò)架構(gòu)
VAE的基本思想是假定軌跡數(shù)據(jù)V是對(duì)某個(gè)隨機(jī)過(guò)程采樣得到的,每條軌跡樣本由隱變量z決定。軌跡數(shù)據(jù)的生成過(guò)程為:首先從先驗(yàn)概率分布pθ(z)中采樣得到樣本z,然后根據(jù)條件概率分布函數(shù)pθ(V|z)解碼得到軌跡樣本,但是生成過(guò)程中解碼參數(shù)θ和隱變量z的信息未知,并且無(wú)法計(jì)算隱變量z的后驗(yàn)概率qφ(z|V)。所以,VAE統(tǒng)一用神經(jīng)網(wǎng)絡(luò)進(jìn)行擬合。根據(jù)邊緣概率公式,似然函數(shù)[12]可以寫(xiě)為:
logap(V)=DKL[qφ(z|V)||pθ(z|V)]+L(φ,θ;V)
(8)
L(φ,θ;V)=Eqφ[-logaqφ(z|V)+logapθ(z,V)]=
-DKL(qφ(z|V)||pθ(z))+Eqφ[logapθ(V|z)]
(9)
其中,L(φ,θ;V)為變分下界,也是VAE網(wǎng)絡(luò)的損失函數(shù);φ、θ為編碼和解碼網(wǎng)絡(luò)的參數(shù)。在式(9)中:第1項(xiàng)稱為KL散度項(xiàng)[21],用于衡量后驗(yàn)分布與先驗(yàn)分布的相似程度,通過(guò)優(yōu)化該項(xiàng)可以使得后驗(yàn)qφ(z|V)逼近先驗(yàn)pθ(z),從而防止模型過(guò)擬合;第2項(xiàng)是一個(gè)對(duì)數(shù)似然估計(jì),相當(dāng)于自編碼器中的重構(gòu)誤差損失函數(shù),用于重構(gòu)原始樣本數(shù)據(jù)。由于KL散度的非負(fù)性,最大化似然函數(shù)問(wèn)題轉(zhuǎn)化為了最大化變分下界的問(wèn)題。
VAETP運(yùn)用Adam算法[22]進(jìn)行編碼和解碼網(wǎng)絡(luò)參數(shù)的更新。編碼網(wǎng)絡(luò)的參數(shù)φ更新過(guò)程如式(10)~式(13)所示,解碼網(wǎng)絡(luò)的參數(shù)θ更新過(guò)程同理可得。
vi=β1×vi-1-(1-β1)×gi
(10)
(11)
(12)
φi+1=φi+Δφi
(13)
當(dāng)數(shù)據(jù)集的復(fù)雜度提高,如軌跡數(shù)據(jù)包含若干種運(yùn)動(dòng)模式,或者V的分布是復(fù)雜的高維分布時(shí),映射得到的隱空間復(fù)雜度隨之提高。此時(shí)式(9)中z的先驗(yàn)分布對(duì)隱空間的描述不能完全刻畫(huà)原始數(shù)據(jù)隱空間的特征,從而導(dǎo)致VAETP算法進(jìn)行軌跡生成和預(yù)測(cè)精度不夠準(zhǔn)確。對(duì)此,通常的解決方法是先對(duì)數(shù)據(jù)進(jìn)行分類,再針對(duì)每個(gè)類別的軌跡數(shù)據(jù)分別使用VAE訓(xùn)練,最終得到若干個(gè)網(wǎng)絡(luò)。軌跡生成和預(yù)測(cè)的過(guò)程,首先判斷軌跡數(shù)據(jù)所屬的類別,再?gòu)脑擃悇e隱空間中采樣得到預(yù)測(cè)的軌跡。但在實(shí)際中,原始軌跡數(shù)據(jù)往往很難實(shí)現(xiàn)有效分類,而且該方法模型的整體契合度不高[23]。
本文提出的軌跡預(yù)測(cè)算法,通過(guò)調(diào)整隱空間的先驗(yàn)分布形式使其更符合真實(shí)的分布,從而有效地解決VAETP算法采用固定高斯先驗(yàn)缺少變異性的問(wèn)題,提高預(yù)測(cè)的精度。該方法不需要事先對(duì)軌跡數(shù)據(jù)進(jìn)行分類處理,而是直接將軌跡矢量數(shù)據(jù)編碼到隱空間,在隱空間完成軌跡數(shù)據(jù)的分類,再經(jīng)過(guò)解碼得到預(yù)測(cè)的軌跡矢量,實(shí)現(xiàn)端到端的軌跡預(yù)測(cè)。
本節(jié)設(shè)計(jì)了基于GMVAE的軌跡預(yù)測(cè)算法。通過(guò)2.2節(jié)的分析可以看出,在VAETP方法中,隱空間的先驗(yàn)假設(shè)過(guò)于簡(jiǎn)單,難以逼近真實(shí)的軌跡特征,需要用更復(fù)雜的分布來(lái)描述。而混合高斯分布幾乎可以近似任意復(fù)雜的概率分布[24],所以,將隱空間的先驗(yàn)分布假設(shè)為混合高斯分布,可以更準(zhǔn)確地描述真實(shí)的軌跡特征。
圖3 GMVAE網(wǎng)絡(luò)架構(gòu)
編碼和解碼過(guò)程中變量之間的關(guān)系如圖4所示,其中,V表示軌跡數(shù)據(jù),y代表類別標(biāo)簽,z代表隱變量,φy、φz為編碼網(wǎng)絡(luò)參數(shù),θz、θV為解碼網(wǎng)絡(luò)參數(shù)。
圖4 GMVAE編碼和解碼過(guò)程中的變量關(guān)系
隱變量y、z編碼過(guò)程表示為:
qφ(y,z|V)=q(y|V;φy)q(z|V,y;φz)
(14)
其中,q(y|V;φy)表示y的編碼過(guò)程,q(z|V,y;φz)表示z的編碼過(guò)程。由此,原始軌跡數(shù)據(jù)經(jīng)過(guò)編碼網(wǎng)絡(luò)可以得到隱變量z的后驗(yàn)分布:
(15)
在解碼過(guò)程中,V、y和z的聯(lián)合概率分布可以描述為:
(16)
(17)
可以看出,隱變量z的先驗(yàn)實(shí)際上是一個(gè)混合高斯分布。不同的軌跡類別映射到隱空間后對(duì)應(yīng)著不同的高斯分量,每個(gè)分量的系數(shù)即為y分布的參數(shù)π。生成模型p(V|z;θV)通常假設(shè)為伯努利分布,損失函數(shù)為:
L(θ,φ;V)=Eq(y,z|V)[lnp(V,y,z)-lnq(y,z|V)]=
(18)
本節(jié)設(shè)計(jì)GMVTP算法流程,并通過(guò)與傳統(tǒng)算法GMMTP、VAETP進(jìn)行比較,檢驗(yàn)其算法性能。
軌跡數(shù)據(jù)經(jīng)過(guò)預(yù)處理后,得到的軌跡矢量集Vnormal作為VAE網(wǎng)絡(luò)的輸入。訓(xùn)練過(guò)程中選取n=400條軌跡,每條軌跡包含200個(gè)軌跡點(diǎn),設(shè)定軌跡類別總數(shù)為K=3。本文使用小批量(mini_batch)[25]方法進(jìn)行訓(xùn)練,將整個(gè)訓(xùn)練集劃分成若干個(gè)小的子訓(xùn)練集,用V_minibatch表示,每個(gè)子集的大小batchsize=m。參數(shù)更新過(guò)程可以表示為:
(19)
算法每次只在一個(gè)V_minibatch上更新梯度,而不用遍歷完整的數(shù)據(jù)集,大幅減少了算法收斂所需的迭代次數(shù),而且可以實(shí)現(xiàn)并行化計(jì)算。
算法1GMVTP算法
輸入軌跡矢量集Vnormal={V1,V2,…,Vn}
輸出網(wǎng)絡(luò)參數(shù)φ、θ
初始化隨機(jī)初始化網(wǎng)絡(luò)參數(shù)φ、θ
For i=1:epochs
For j=1:n/m
V_minibatch←{Vj,Vj+1,...Vj+m-1}//取m條軌跡數(shù)據(jù)
For k=1:m
y←q(y|Vk;φy)//通過(guò)編碼網(wǎng)絡(luò)φy生成標(biāo)簽y
μz,σz,z←q(z|y,Vk;φz)//通過(guò)編碼網(wǎng)絡(luò)φz生成z的后驗(yàn)
z←N(μ(y;θz),σ2(y;θz))//根據(jù)y從相應(yīng)的先驗(yàn)高斯//分布中采樣得到z
Vk|z←B(μ(z;θV))//根據(jù)z解碼出軌跡Vk
L(θ,φ;Vk)//根據(jù)式(17)計(jì)算損失函數(shù)值
gk←gk-φ,θL(φ,θ;Vk)//計(jì)算梯度
End for
gj←gk/m//單個(gè)batch數(shù)據(jù)訓(xùn)練后的梯度更新
φj,θj←φj,θj//根據(jù)式(10)~式(13)進(jìn)行參數(shù)更新
End for
End for
軌跡生成模型p(V|z;θV)的神經(jīng)網(wǎng)絡(luò)輸入層和輸出層節(jié)點(diǎn)數(shù)200,其他網(wǎng)絡(luò)輸出層節(jié)點(diǎn)設(shè)置為64,迭代次數(shù)為epochs。軌跡預(yù)測(cè)過(guò)程為將已知的軌跡前k′(k′<200)個(gè)點(diǎn)作為網(wǎng)絡(luò)輸入,經(jīng)過(guò)編碼可以得到其類別標(biāo)簽y,再根據(jù)標(biāo)簽y從對(duì)應(yīng)的隱空間z中采樣解碼生成完整的軌跡,即可得到預(yù)測(cè)出的第k′+1個(gè)~第200個(gè)軌跡點(diǎn)。
本文使用的軌跡數(shù)據(jù)集是MIT Trajectory Data。該數(shù)據(jù)集來(lái)源于衛(wèi)星采集數(shù)據(jù),移動(dòng)目標(biāo)是在平面上中速移動(dòng)的機(jī)動(dòng)車輛。因?yàn)樵撥壽E數(shù)據(jù)在采集類型以及目標(biāo)運(yùn)動(dòng)速度、自由度、路徑約束等方面與真實(shí)的艦船軌跡類似,所以通過(guò)與真實(shí)艦船軌跡數(shù)據(jù)的仿真結(jié)果比較,該數(shù)據(jù)集的仿真結(jié)果能夠較為真實(shí)地反映算法的性能。本文的仿真環(huán)境配置為CPU Intel?CoreTMi5-8300H @2.3 GHz,內(nèi)存8 GB,顯卡NVIDIA GeForce GTX 1050Ti,操作系統(tǒng)為Ubuntu16.04。訓(xùn)練過(guò)程中的超參數(shù)設(shè)置如表1所示。
表1 訓(xùn)練過(guò)程超參數(shù)設(shè)置
3.3.1 軌跡訓(xùn)練結(jié)果
本節(jié)從軌跡數(shù)據(jù)集中選取600條軌跡作為訓(xùn)練集。圖5為600條軌跡經(jīng)過(guò)矢量化和歸一化后的結(jié)果,從中可以看出,目標(biāo)運(yùn)動(dòng)軌跡主要包含了左高右低、左低右高、中間高兩邊低3種情況。這3種軌跡對(duì)應(yīng)著隱空間的3類特征,在仿真中給定K=3。圖6為VAETP經(jīng)過(guò)訓(xùn)練后從隱空間采樣得到的120條軌跡,從中可以看出,VAE雖然能夠生成和預(yù)測(cè)軌跡,但是相對(duì)于原始軌跡,3種運(yùn)動(dòng)特征之間的區(qū)別不明顯,這是因?yàn)樵赩AE中,軌跡數(shù)據(jù)被視為從一個(gè)標(biāo)準(zhǔn)正態(tài)分布中采樣得到。圖7為GMVTP的生成預(yù)測(cè)結(jié)果,從中可以看出,3類軌跡之間區(qū)分更加明顯,正是由于隱空間分布是混合高斯分布,因此能夠更準(zhǔn)確地描述軌跡特征。圖8為隨機(jī)選取的120軌跡使用GMVTP進(jìn)行分類的結(jié)果,不同深線線條分別代表不同特征的軌跡,從中可以看出,GMVTP可基本實(shí)現(xiàn)軌跡的無(wú)監(jiān)督分類。
圖5 訓(xùn)練軌跡矢量集
圖6 VAETP算法的軌跡生成結(jié)果
圖7 GMVTP算法的軌跡生成結(jié)果
圖8 GMVTP算法的軌跡分類結(jié)果
3.3.2 算法性能比較
本節(jié)比較GMVTP和VAETP2種算法在相同訓(xùn)練集大小(800條軌跡)下的收斂性,迭代步數(shù)設(shè)置為300。圖9為損失函數(shù)變化曲線。從中可以看出,VAETP在迭代150步左右收斂,而GMVTP在50步左右即收斂。損失函數(shù)值間接反映出生成軌跡與原始軌跡之間的差異性,由于GMVTP的隱空間結(jié)構(gòu)被假設(shè)為混合高斯分布,在訓(xùn)練開(kāi)始階段就能夠精確近似真實(shí)的分布,因此GMVTP的損失函數(shù)值始終小于VAETP并很快收斂。
圖9 損失函數(shù)變化曲線
3.3.3 預(yù)測(cè)精度和時(shí)間比較
采用均方根誤差(RMSE)計(jì)算軌跡預(yù)測(cè)誤差:
圖10 3種算法的預(yù)測(cè)誤差比較
為比較3種算法的實(shí)時(shí)性,計(jì)算在相同收斂條件下不同訓(xùn)練集大小時(shí)算法的運(yùn)行時(shí)間,實(shí)驗(yàn)結(jié)果取每種條件下訓(xùn)練30次的平均耗時(shí),如圖11所示。可以看出,GMMTP的平均訓(xùn)練耗時(shí)約為21 s,最長(zhǎng)達(dá)到27 s,而VAETP和GMVTP兩種算法的平均耗時(shí)在4 s左右。相對(duì)于GMMTP算法,后兩種算法的訓(xùn)練耗時(shí)平均縮短了80.3%和74.9%,并且隨著訓(xùn)練集的增大,GMMTP的訓(xùn)練時(shí)間顯著增大,而VAETP和GMVTP兩種算法的訓(xùn)練時(shí)間無(wú)明顯增長(zhǎng)。這是由于變分自編碼器采用了隨機(jī)梯度下降法更新網(wǎng)絡(luò)參數(shù),避免了GMMTP算法中有關(guān)概率分布期望的計(jì)算,同時(shí)TensorFlow框架下的GPU與程序之間的聯(lián)系加速了網(wǎng)絡(luò)參數(shù)的訓(xùn)練。因此,當(dāng)軌跡數(shù)據(jù)集龐大時(shí),基于VAE的軌跡預(yù)測(cè)算法優(yōu)勢(shì)更加明顯。從圖中還可以看出,GMVTP的訓(xùn)練時(shí)間略多于VAETP,這是由于GMVTP的網(wǎng)絡(luò)結(jié)構(gòu)更加復(fù)雜,導(dǎo)致訓(xùn)練時(shí)間略微增長(zhǎng),但從上文的仿真可知,GMVTP的預(yù)測(cè)誤差相比于VAETP平均降低了35.59%,總體而言其性能優(yōu)于VAETP。
圖11 3種算法訓(xùn)練時(shí)間比較
綜上所述,本文算法在預(yù)測(cè)精度和實(shí)時(shí)性上均優(yōu)于傳統(tǒng)的GMM軌跡預(yù)測(cè)算法,有利于實(shí)現(xiàn)艦船軌跡的在線預(yù)測(cè),并且由于隱空間先驗(yàn)分布復(fù)雜度提高,該算法能夠更精確地描述軌跡數(shù)據(jù)的特征,進(jìn)一步減小預(yù)測(cè)誤差。
海面艦船由于路徑約束小,移動(dòng)規(guī)律多變,且受到觀測(cè)手段的影響,其軌跡數(shù)據(jù)特征較為復(fù)雜。為此,本文提出一種基于高斯混合-變分自編碼器的軌跡預(yù)測(cè)算法GMVTP。將軌跡坐標(biāo)轉(zhuǎn)化為軌跡矢量,利用VAE提取軌跡特征并生成預(yù)測(cè)結(jié)果。針對(duì)海面艦船的軌跡數(shù)據(jù)特點(diǎn),改進(jìn)經(jīng)典的VAE算法,將隱空間的先驗(yàn)分布假設(shè)為混合高斯分布,從而使其更符合真實(shí)的數(shù)據(jù)特征分布,并在隱空間中完成軌跡特征分類,實(shí)現(xiàn)端到端的軌跡預(yù)測(cè)。仿真結(jié)果表明,該算法在預(yù)測(cè)精度和實(shí)時(shí)性上優(yōu)于傳統(tǒng)的GMM模型,有利于艦船軌跡數(shù)據(jù)的在線訓(xùn)練與預(yù)測(cè),并且提高了軌跡預(yù)測(cè)精度。下一步將考慮解決類別總數(shù)K的自適應(yīng)問(wèn)題以及各個(gè)類別概率向量π的訓(xùn)練問(wèn)題。