国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于RNN-LSTM 的船舶位置預(yù)測分析?

2021-03-22 09:11張玉人龔志猛
計算機與數(shù)字工程 2021年2期
關(guān)鍵詞:聚類軌跡神經(jīng)網(wǎng)絡(luò)

張玉人 龔志猛

(1.中國科學(xué)院福建物質(zhì)結(jié)構(gòu)研究所 福州 350608)(2.華信咨詢設(shè)計研究院有限公司 杭州 310052)

1 引言

船舶在開闊的航道區(qū)間內(nèi)航行時,很難用一個確定的線性關(guān)系去描述船舶的運動情況。通常,研究人員采用馬爾科夫過程來建立船舶航行軌跡預(yù)測非線性系統(tǒng)模型,但該模型結(jié)合軌跡數(shù)據(jù)建立多特征模型的復(fù)雜度較高,也無法記憶較長歷史時間跨度的信息[1]。而神經(jīng)網(wǎng)絡(luò)通過模擬人腦的神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)進行自主學(xué)習(xí)與訓(xùn)練,能夠較好地完成非線性數(shù)據(jù)的處理工作,具有優(yōu)異的非線性擬合能力。船舶航行過程中,由于GPS設(shè)備采集到的數(shù)據(jù)具有時序性,而且地理位置之間存在著上下文關(guān)聯(lián),使得循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)應(yīng)用成為可能。利用RNN 學(xué)習(xí)當(dāng)前環(huán)境和既有時刻基礎(chǔ)上的船舶運動規(guī)律,然后進行航跡預(yù)測。這既避免了傳統(tǒng)算法中繁雜的建模過程,又保證了所建立的模型符合實際邏輯。一個完善的RNN 模型可以預(yù)測任意復(fù)雜、期望的序列,但標(biāo)準(zhǔn)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型不能存儲過多的歷史信息[2~3]。在一定的歷史時間跨度下,歷史記憶的長短關(guān)乎模型預(yù)測的準(zhǔn)確度?;谏鲜隹紤],為了能夠記憶更長歷史時間跨度的信息,并能在一定誤差范圍內(nèi)運行穩(wěn)定,本文采用了基于長短型記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN-LSTM)模型來預(yù)測船舶下一位置。并不是每個歷史軌跡點位都是重要的,只有在一段時間內(nèi)有諸多點位數(shù)據(jù)聚集在某個區(qū)域才有意義,這個區(qū)域也稱為目標(biāo)位置。為降低系統(tǒng)的復(fù)雜度,本文采用了DBSCAN聚類算法來提取歷史軌跡中的目標(biāo)位置序列作為預(yù)測模型的輸入,并利用Embedding 與LSTM 雙層預(yù)測模型訓(xùn)練出船舶位置預(yù)測模型。

2 船舶位置預(yù)測技術(shù)概述

2.1 RNN-LSTM模型

循環(huán)神經(jīng)網(wǎng)絡(luò)在進行訓(xùn)練時,往往為降低模型的復(fù)雜度,只會選取若干個隱藏層,而非整個隱藏層作為記憶單元,這樣會導(dǎo)致在長時段歷史數(shù)據(jù)上下文語義信息挖掘應(yīng)用方面存在缺陷,無法做長時序數(shù)據(jù)挖掘?;谏鲜鲈?,Hochreiter 和Schmidhu?ber等提出了長短型循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN-LSTM)[4~5]。RNN-LSTM相較于傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò),它從設(shè)計上就避免了時序數(shù)據(jù)預(yù)測過程中長短時依賴問題,而設(shè)計的關(guān)鍵就是隱藏層中獨特的記憶單元結(jié)構(gòu)。如圖1 所示,為RNN-LSTM 隱藏層記憶單元結(jié)構(gòu),該結(jié)構(gòu)包含了三種門,分別是輸入門(Input Gate)、遺忘門(Forget Gate)、輸出門(Output Gate)。

圖1 RNN-LSTM隱藏層記憶單元結(jié)構(gòu)

將RNN-LSTM 隱藏層記憶單元結(jié)構(gòu)比作一個記憶細胞(memory cell),該細胞控制著記憶單元中信息的傳播途徑。其中A區(qū)域表示遺忘區(qū),其中遺忘門(Forget Gate)接收來自上一時刻隱藏層的輸出(ht-1)和當(dāng)前時刻輸入(xt)并決定丟棄當(dāng)前狀態(tài)下部分信息;B 區(qū)域表示更新區(qū),它決定了當(dāng)前狀態(tài)需要存儲哪些新的信息,并完成記憶細胞的信息更新;C區(qū)域表示輸出區(qū),其中輸出門(Output Gate)決定了當(dāng)前狀態(tài)下細胞輸出的內(nèi)容。

根據(jù)以上分析,在t時刻,為了計算傳給下一個記憶細胞的Ct,ht,現(xiàn)列出記憶單元中輸入狀態(tài)和三個門狀態(tài):

Input Gate:

Forget Gate:

Output Gate:

狀態(tài)輸入:

進而求出輸出狀態(tài)Ct和隱藏層輸出ht

綜上,RNN-LSTM 通過門的控制,解決了時序數(shù)據(jù)預(yù)測過程中長短時依賴問題,這對于長時段歷史數(shù)據(jù)預(yù)測研究有很好的幫助。

2.2 DBSCAN聚類算法

1996 年Ester M 等[6]提 出 了DBSCAN 聚 類 算法,該算法是一種基于點的周圍密度形成集群的聚類方法。在每個聚類的中,可以利用聚類的密度特點,找出任意形態(tài)的簇,它們滿足簇內(nèi)的點密度明顯高于簇外點的密度這一條件。即DBSCAN 聚類算法可表述為:在一個集合中,定義一個半徑為Eps的圓,如果這個圓內(nèi)落入的點的數(shù)目多于所給定最小點數(shù)MinPts,則可通過Eps 和MinPts 這兩個參數(shù)來定義聚類的密度。

關(guān)于DBSCAN聚類算法相關(guān)的概念定義[7~8]。

定義1給定一個點a,以點a 為圓心,Eps 為半徑得到的圓所在的區(qū)域叫做Eps鄰域。

定義2核心對象(Core objects),如果點a的Eps鄰域內(nèi)樣本點數(shù)b 大于所給定最小點數(shù)Minpts,則稱a 為核心對象,b 稱為核心點。若樣本點落在在Eps鄰域的邊界上,則稱b為邊界點。

定義3直接密度可達(Directly density reach?able),給定一個樣本集合D={d1,d2,…,dn},如果點di的Eps 鄰域內(nèi)樣本點數(shù)為b,且d1為核心對象,那么Eps鄰域內(nèi)樣本點到di直接密度可達。

定義4密度可達(Density reachable),對于一個樣本集合D={d1,d2,…,dn} ,給定數(shù)據(jù)樣本集{p1,p2,…,pn}其中p=p1,q=pn,又假設(shè)樣本點pi至pi-1直接密度可達,則對象q至對象p密度可達。

定義5密度相連(Density connected),對于一個樣本集合D={d1,d2,…,dn},假設(shè)在數(shù)據(jù)樣本集P={p1,p2,…,pn}樣本點pi至pj在樣本集合P 中的一點d 密度可達,那么樣本點pi和pj密度相連。假設(shè)樣本集合D 中存在一個對象a,使得樣本對象p 至q 從對象a 密度可達,則對象q 和p 密度相連。由此可知,密度相連是對稱關(guān)系,密度可達是直接密度可達的傳遞閉包。

以上基本介紹了DBSCAN相關(guān)定義、聚類原則等。DBSCAN 具有良好的去噪聲能力,能夠根據(jù)點位的疏密程度去除掉其中的噪聲區(qū)域。此外,DB?SCAN 初始值對聚類結(jié)果影響不大?;谏鲜鰞?yōu)點,本文選用DBSCAN作為船舶位置停留點聚類提取方法。

3 船舶位置預(yù)測分析

3.1 船舶位置預(yù)測框架

RNN-LSTM相較于傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò),它從設(shè)計上就避免了時序數(shù)據(jù)預(yù)測過程中長短時依賴問題,而設(shè)計的關(guān)鍵就是隱藏層中獨特的記憶單元結(jié)構(gòu)。該結(jié)構(gòu)在增長了記憶范圍的同時,能適當(dāng)?shù)膾仐壟f信息。圖2 為本文基于RNN-LSTM 神經(jīng)網(wǎng)絡(luò)構(gòu)建的船舶軌跡預(yù)測框架。

圖2 基于RNN-LSTM的船舶軌跡預(yù)測框架

由圖2可知,基于RNN-LSTM 神經(jīng)網(wǎng)絡(luò)構(gòu)建的船舶軌跡預(yù)測框架主要由Embedding層[9]、LSTM模塊構(gòu)成,下面詳細介紹這兩個模塊。

1)Embedding層

正如圖2 所示,本文通過DBSCAB 聚類算法提取目標(biāo)位置,得到了船舶航行目標(biāo)位置序列。這些目標(biāo)位置被賦予唯一的標(biāo)識1,2,3,…,k 。因此可以將目標(biāo)位置序列轉(zhuǎn)化成索引時序序列,例如1表示港口A,2表示航道B,3表示臨時拋錨點C,4表示目的地港口D。假設(shè)一條船舶m 從港口A 出發(fā),途徑航道B,行駛到C 點進行拋錨作業(yè)。但是也可能有另一條船舶n 從港口A 出發(fā),途徑航道B,行駛到目的地港口D。由此可知,船舶m 的航行軌跡向量可表示為[1,2,3],船舶n 的軌跡向量表示為[1,2,4]。通過歐式距離公式計算出的相似度顯然非常接近統(tǒng)一軌跡,若已知臨時拋錨點C 和目的地港口D方向相反,這樣得出的預(yù)測結(jié)果與實際情況大相徑庭。這樣可以說明一個事實,那就是如果單純用索引時序序列來標(biāo)識目標(biāo)位置,將不可能得到一個好的預(yù)測結(jié)果。而本文,為解決上述問題,采用了自然語言中的word2vec模型內(nèi)的Skip-gram 算法[10~11],用多維的方式將每一個目標(biāo)位置對應(yīng)一個特征向量,這樣為區(qū)別目標(biāo)位置提供了更詳細的區(qū)分度與可能性。

根據(jù)Skip-gram算法,相關(guān)參數(shù)定義如下[12~13]。

由歷史軌跡數(shù)據(jù)提取出來的目標(biāo)位置集合Q;

目標(biāo)位置L:其為列向量,長度為k;

目標(biāo)位置窗口C:以選取目標(biāo)位置序列中一個元素為中心,上下文寬度為j(向前和向后j 個目標(biāo)位置)組成的部分軌跡;

條件概率P(C|Li):表示目標(biāo)位置Li出現(xiàn)的時候,目標(biāo)窗口部分軌跡c 出現(xiàn)的概率,其中C(Li)表示所有目標(biāo)窗口中包含了目標(biāo)位置Li的集合。

給定模型參數(shù)θ,尋求模型參數(shù)最大化條件概率乘積如下:

再利用softmax[43]函數(shù)對θ 進行處理,將條件概率公式轉(zhuǎn)換成下列公式:

式中,vc、vLi分別表示維度為k的列向量。

通過上述模型表達式可知,模型訓(xùn)練時,其將每一個目標(biāo)位置用多維特征向量表示,并使得其在目標(biāo)窗口內(nèi)條件概率P(C|Li)最大化。由此就可以得出結(jié)論,只有特定的目標(biāo)位置L 才能匹配到特定的目標(biāo)窗口C。

2)LSTM模塊

現(xiàn)結(jié)合船舶預(yù)測模型,詳細介紹LSTM 模塊的工作流程如下。

細胞遺忘過程:很多時候,在基于許多已有的歷史軌跡屬性都已經(jīng)存入在隱藏層記憶單元結(jié)構(gòu)—記憶細胞內(nèi),當(dāng)預(yù)測船舶下一目標(biāo)位置時,可以立馬找到相應(yīng)的細胞狀態(tài)。但是當(dāng)有新的輸入時,這就需要去清除較舊的上下文軌跡信息,這就需要通過遺忘門來實現(xiàn)。

細胞狀態(tài)更新:這一過程是決定當(dāng)前狀態(tài)需要存儲哪些新的信息,并完成記憶細胞的信息更新。其主要分為兩步,一步是輸入門輸入新的值,它決定需要更新什么值;另一步是Tanh 層建立了一個候選值向量[14]。通過狀態(tài)更新,使得新增加的目標(biāo)位置添加到細胞狀態(tài)中去,以便代替需要被遺忘的信息。

細胞輸出:也就是輸出門,它決定了當(dāng)前狀態(tài)下細胞輸出的信息[15]。首先通過Sigmod 層來確定細胞內(nèi)哪些信息會被輸出,然后將這些信息做Tanh 處理,將得到的結(jié)果與Sigmod 門的輸出相乘,進而最終得到要輸出的信息,也就是本文要求得的船舶目標(biāo)位置概率向量。

結(jié)合上文對Embedding 層和LSTM 模塊的詳細分析可知,本文將離散的目標(biāo)位置序列作為輸入,送入Embedding 層進行計算,從而將目標(biāo)位置轉(zhuǎn)換成一個固定長度的特征向量。再將Embedding 層全部輸出結(jié)果送入LSTM 模塊內(nèi)進行遍歷,不斷調(diào)整模型參數(shù),最終使得模型預(yù)測下一目標(biāo)位置成為可能。預(yù)測算法實現(xiàn)流程的偽代碼如下。

算法名:基于RNN-LSTM的船舶位置預(yù)測算法

Input:A set of trajectory

Process:

1:X=generateSeqSample(trajectory);

2:Y=generateNextPlace(trajectory);

3:model=sequential();

4:model.add(Embedding());

5:model.add(LSTM());

6:model.add(Dropout);

7:model.add(Dense);

8:model.add(Activation);

9:model.compile(loss=,optimizer=);

10:model.fit(X,Y);

11:model.evelate();

Output:an index of future target location

前期通過DBSCAB 聚類算法提取目標(biāo)位置,得到了船舶航行目標(biāo)位置序列。為了訓(xùn)練預(yù)測模型,第1、2 行代碼分別表示了目標(biāo)位置序列樣本輸入和目標(biāo)位置對應(yīng)的下一位置。由于本文所提預(yù)測模型是一個線性模型,所以創(chuàng)建了一個Sequential模型(第3 行)。接下來是創(chuàng)建Embedding 層和LSTM 模塊,以用來構(gòu)建目標(biāo)位置特征向量和模型訓(xùn)練(第4、5 行)。與此同時,要選好模型使用的激活函數(shù)以及做好措施防止過擬合問題(第6、7、8行)。最后是模型預(yù)測效果驗證,將訓(xùn)練好的模型代入待測試的數(shù)據(jù),來預(yù)測下一步船舶可能出現(xiàn)的位置(第9、10 行)。需要強調(diào)的是,此模型的輸出并非是一個確定的地點,而是一個概率分布,所以需要根據(jù)概率借助索引找到最有可能的目標(biāo)位置(第11行)。

3.2 船舶下一位置預(yù)測

前一小節(jié)詳細介紹了船舶位置預(yù)測框架流程,但未將LSTM 模塊中如何預(yù)測加以詳述。本節(jié)將詳細推導(dǎo)從部分歷史目標(biāo)位置序列來預(yù)測船舶下一位置這一過程。如圖3 所示,為簡化后的循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)構(gòu)模型,只展示出了隱藏層結(jié)構(gòu)。

圖3 循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)構(gòu)模型

目標(biāo)位置序列經(jīng)由Embedding 層計算之后,使得目標(biāo)位置轉(zhuǎn)換成相應(yīng)的多維特征向量X=[x1,x2,…,xT],接著將這些多維特征向量送入擁有N 層隱藏層線性結(jié)構(gòu)的RNN 中去,通過迭代計算得到n層隱藏層線性輸出為,最終經(jīng)由輸出層得到目標(biāo)序列Y=[y1,y2,…,yT]。目標(biāo)序列中,每一個元素yi都是一個M維向量,其中每一維對應(yīng)下一目標(biāo)位置的概率。而本文則是利用得到的目標(biāo)序列中每一個結(jié)果向量yt與下一個目標(biāo)位置特征向量xt+1得出預(yù)測分布Pr(xt+1|yt)。

由于本文所設(shè)計的模型框架只有一層LSTM隱藏層,所以從t=1 至t=T 時刻(一般目標(biāo)位置序列中第一個元素為空值),隱藏層內(nèi)激活函數(shù)迭代計算公式如下:

式中,H 為激活函數(shù),w 為輸入層與隱藏層之間的權(quán)值,b 為偏移值。

在得到隱藏層輸出后,需要在輸出層計算船舶位置預(yù)測概率,公式如下:

式中,φ(?)是一種將輸出結(jié)果yt參數(shù)化預(yù)測分布Pr(xt+1|yt)的輸出函數(shù)。通常在實際數(shù)據(jù)中難以尋找到一個合適的預(yù)測概率分布,而本文可得到一個目標(biāo)位置序列Traj 的概率公式如下:

訓(xùn)練模型的損失函數(shù)如下:

4 實驗結(jié)果與分析

4.1 實驗數(shù)據(jù)集

研究過程中實驗數(shù)據(jù)是由自主設(shè)計的GPS 采集設(shè)備獲得。實驗采集設(shè)備一共有5 個GPS 信標(biāo),選取了其中3 個測量精度較好的信標(biāo)。實驗數(shù)據(jù)統(tǒng)計見表1所示。

表1 實驗數(shù)據(jù)集

為保證實驗的真實性,本實驗場地選在無錫市長廣溪國家濕地公園,實驗數(shù)據(jù)源一共包含了3 個實驗GPS 節(jié)點(模擬3 條船只),共計150 條軌跡軌跡信息,且平均每條軌跡包含了180 個GPS 軌跡點。由于GPS 采集設(shè)備精度以及冷啟動等因素的存在,該系統(tǒng)所采集到的位置數(shù)據(jù)中可能存在異常值。為避免這些異常值對后續(xù)各算法流程的影響,在軟件設(shè)計時,就采用了偏移處理算法濾除了這些異常值。同時為抑制采集系統(tǒng)中的高斯噪聲,所有采集到的軌跡數(shù)據(jù)均利用擴展卡爾曼濾波算法的船舶位置數(shù)據(jù)預(yù)處理模型來做船舶GPS 數(shù)據(jù)預(yù)處理。

4.2 評價指標(biāo)

本小節(jié)所介紹的評價指標(biāo)是用于權(quán)衡基于循環(huán)神經(jīng)網(wǎng)絡(luò)的船舶軌跡預(yù)測的實驗結(jié)果。主要評價指標(biāo)包括準(zhǔn)確率(precision)、召回率(recall rate)和F值(F-measure)。

假設(shè)實驗中預(yù)測結(jié)果集為Q,其中準(zhǔn)確的結(jié)果集為T,則相應(yīng)的實驗評價指標(biāo)公式如下:

式(13)是準(zhǔn)確率,表示預(yù)測結(jié)果集Q 中正確結(jié)果所占比例。

式(14)是召回率,表示準(zhǔn)確的結(jié)果集T 中正確結(jié)果所占比例。

式(15)是綜合評價指標(biāo),指準(zhǔn)確率和召回率的調(diào)和平均值。

4.3 船舶位置提取與預(yù)測結(jié)果

DBSCAN 聚類算法調(diào)節(jié)過程中包含了Eps 和MinPts 兩個主要參數(shù)。其中Eps 指鄰域半徑(聚類時每一個點),MinPts指以Eps為半徑的鄰域內(nèi)擁有軌跡點的最少個數(shù)。聚類分析過程中MinPts 設(shè)定為3,若MinPts ≥3 時,則被視為一個簇。表2 是調(diào)節(jié)Eps和MinPts兩參數(shù)后DBSCAN聚類效果統(tǒng)計。

表2 DBSCAN參數(shù)調(diào)節(jié)效果

由表2 可以看出,當(dāng)MinPts 一定時,提取到的目標(biāo)位置數(shù)量隨著Eps 的增大而減小。根據(jù)表中數(shù)據(jù)結(jié)合實驗經(jīng)驗,現(xiàn)將Eps=20,MinPts=3 作為聚類條件。由此,聚類分析之后,150 條軌跡數(shù)據(jù)提取出了291個目標(biāo)位置,同時將整理成50條時序目標(biāo)位置序列。

通過聚類分析提取的目標(biāo)位置序列,將作為循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型的數(shù)據(jù)集,用來進行預(yù)測模型的訓(xùn)練。實驗將取出20%的數(shù)據(jù)集作為測試數(shù)據(jù),其余將用于預(yù)測模型訓(xùn)練。

在使用LSTM 進行位置預(yù)測時,會有多種因素影響著系統(tǒng)的預(yù)測效果。下面將分不同參數(shù)條件來討論模型預(yù)測的準(zhǔn)確率。

表3 DBSCAN聚類參數(shù)Eps對預(yù)測模型的影響

表3 展示了DBSCAN 聚類算法在取不同鄰域半徑Eps 時對LSTM 模型預(yù)測結(jié)果的影響。當(dāng)MinPts為固定值時,隨著Eps的增大,鄰域半徑內(nèi)滿足MinPts條件的軌跡點會越來越多,更多的停留點被聚合在了一起,這樣相似的軌跡數(shù)量會越來越多,但也會出現(xiàn)聚類算法能夠提取到的目標(biāo)位置變少的狀況。進一步分析可知,當(dāng)Eps 的增大時,正是由于相似的軌跡數(shù)量越來越多,增強了模型的記憶訓(xùn)練,從而使得預(yù)測準(zhǔn)確率從51.61%升至68.13%。但Eps 也不是取越大越好,若是越大,會導(dǎo)致能夠提取到的目標(biāo)位置越來越少,使得送入模型的目標(biāo)位置序列長度無法反映真實的運行軌跡,不利于模型預(yù)測。

表4 LSTM模型參數(shù)對預(yù)測結(jié)果的影響

表4 展示了在進行循環(huán)神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)訓(xùn)練時,模型參數(shù)調(diào)節(jié)對預(yù)測結(jié)果的影響。由上表可知,其他參數(shù)一定時,隨著模型的迭代次數(shù)、梯度更新塊大小、Embedding 層個數(shù)的增加,系統(tǒng)的預(yù)測準(zhǔn)確率也會提升;其中梯度更新塊增多,會提升模型的訓(xùn)練速度,也會使預(yù)測結(jié)果趨于平穩(wěn)。經(jīng)過試驗調(diào)整,可以看到當(dāng)?shù)螖?shù)設(shè)定為50、梯度更新塊設(shè)定為64、Embedding 層數(shù)設(shè)定為64 時,本文提出的基于RNN-LSTM 的位置預(yù)測模型擁有較好的預(yù)測結(jié)果,預(yù)測準(zhǔn)確率為72.67%。

4.4 實驗結(jié)果對比

上一小節(jié)已經(jīng)驗證了基于RNN-LSTM 的船舶位置預(yù)測模型的可用性。為了進一步驗證模型的準(zhǔn)確性與研究的必要性,本文將選取傳統(tǒng)歷史軌跡位置預(yù)測模型如概率模型或馬爾科夫模型進行對比分析。

為保證本文提出的預(yù)測模型處于最佳狀態(tài),因此設(shè)定LSTM 模型各參數(shù)依次為:迭代次數(shù)設(shè)定為50、梯度更新塊設(shè)定為64、Embedding 層數(shù)設(shè)定為64。此外,DBSCAN 聚類分析時,設(shè)定鄰域半徑Eps設(shè)定為20、鄰域半徑內(nèi)最少軌跡點數(shù)MinPts 設(shè)定為3。

如圖4、圖5、圖6 分別是各模型準(zhǔn)確率、召回率、F-measure 值對比分析圖。其中1-MM 是一階馬爾科夫模型、2-MM 是二階馬爾科夫模型、1-VOMM 是一階變階馬爾科夫模型、2-VOMM 是二階變階馬爾科夫模型。由對比圖可以看出,在準(zhǔn)確度上,LSTM 模型達到72.67%,高出二階變階馬爾科夫模型13.3%;在召回率上,LSTM 模型達到81.3%,高出一階變階馬爾科夫模型9.4%;在F-measure 值上LSTM 模型達到76.47%,高出二階變階馬爾科夫模型12.24%。

圖4 各模型準(zhǔn)確率對比

圖5 各模型召回率對比

圖6 各模型F-measure值對比

綜上,基于循環(huán)神經(jīng)網(wǎng)絡(luò)的船舶位置預(yù)測模型相較于傳統(tǒng)基于馬爾科夫預(yù)測模型具有較高的預(yù)測精度,具有一定的研究價值。

5 結(jié)語

為解決在長時序跨度條件下,針對傳統(tǒng)馬爾科夫模型預(yù)測船舶的下一位置精度較低且系統(tǒng)復(fù)雜度較高的問題,本文提出了基于長短型記憶循環(huán)神經(jīng)網(wǎng)絡(luò)的船舶位置預(yù)測模型。該模型依據(jù)船舶軌跡數(shù)據(jù)龐雜而有序的特點,為降低系統(tǒng)復(fù)雜度,采用了新穎的DBSCAN 聚類算法來提取船舶軌跡數(shù)據(jù)中的目標(biāo)位置序列,同時為了獲得更好的目標(biāo)位置區(qū)分度,引入了Embedding 層,利用自然語言中的word2vec 模型內(nèi)的Skip-gram 算法,將每一個目標(biāo)位置用多維特征向量表示,最終將已構(gòu)建好的目標(biāo)位置特征向量送入LSTM 模塊中進行模型訓(xùn)練,進而利用模型預(yù)測出下一目標(biāo)位置。實驗結(jié)果表明,所提模型相較于傳統(tǒng)模型具有較高的預(yù)測準(zhǔn)確性。在后續(xù)的研究中,要綜合考慮不同影響因素對所建船舶位置預(yù)測模型造成的影響,并結(jié)合實際應(yīng)用場景,讓船舶位置預(yù)測模型較好地進行商業(yè)化探索。

猜你喜歡
聚類軌跡神經(jīng)網(wǎng)絡(luò)
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
基于神經(jīng)網(wǎng)絡(luò)的船舶電力系統(tǒng)故障診斷方法
解析幾何中的軌跡方程的常用求法
基于人工智能LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)成績預(yù)測
基于知識圖譜的k-modes文本聚類研究
MIV-PSO-BP神經(jīng)網(wǎng)絡(luò)用戶熱負荷預(yù)測
基于數(shù)據(jù)降維與聚類的車聯(lián)網(wǎng)數(shù)據(jù)分析應(yīng)用
基于模糊聚類和支持向量回歸的成績預(yù)測
三次樣條和二次刪除相輔助的WASD神經(jīng)網(wǎng)絡(luò)與日本人口預(yù)測
汉中市| 台中市| 丰城市| 合作市| 景泰县| 巨野县| 桂林市| 岳西县| 金塔县| 肇源县| 邛崃市| 本溪市| 临城县| 黔西县| 临猗县| 松阳县| 信丰县| 余江县| 肥西县| 信阳市| 鲁山县| 抚州市| 阿尔山市| 香河县| 深泽县| 佛坪县| 毕节市| 周宁县| 无锡市| 纳雍县| 晋城| 安龙县| 灌南县| 西昌市| 彰化市| 五大连池市| 涿鹿县| 辽宁省| 石柱| 弥勒县| 东兴市|