門瑞 郭俊俊
摘要:精確的車輛軌跡預(yù)測(cè)對(duì)于提高行車安全、優(yōu)化交通通行效率、改善城市交通環(huán)境具有非常重要的現(xiàn)實(shí)意義,是實(shí)現(xiàn)智能交通系統(tǒng)和自動(dòng)駕駛技術(shù)面臨的關(guān)鍵瓶頸問(wèn)題。然而現(xiàn)有的車輛移動(dòng)軌跡預(yù)測(cè)技術(shù)面臨預(yù)測(cè)精度不高、預(yù)測(cè)過(guò)程耗時(shí)過(guò)長(zhǎng)等問(wèn)題。在深入分析國(guó)內(nèi)外現(xiàn)有研究成果的基礎(chǔ)上,構(gòu)建了基于LSTM的輕量級(jí)車輛移動(dòng)軌跡預(yù)測(cè)模型。該模型能夠通過(guò)車輛的歷史軌跡數(shù)據(jù)捕獲影響車輛移動(dòng)的關(guān)鍵因素,從而以較低的算力資源消耗代價(jià)預(yù)測(cè)車輛未來(lái)的移動(dòng)軌跡,實(shí)驗(yàn)采用真實(shí)的車輛軌跡數(shù)據(jù),驗(yàn)證了模型的有效性。
關(guān)鍵詞:LSTM;移動(dòng)軌跡;預(yù)測(cè)
中圖分類號(hào):U461? 收稿日期:2024-04-18
DOI:1019999/jcnki1004-0226202406019
1 前言
智能交通系統(tǒng)和自動(dòng)駕駛技術(shù)的發(fā)展為車輛軌跡預(yù)測(cè)問(wèn)題的重要性提供了前所未有的機(jī)遇和挑戰(zhàn)。在智能交通系統(tǒng)中,準(zhǔn)確的車輛軌跡預(yù)測(cè)是實(shí)現(xiàn)交通流優(yōu)化、智能信號(hào)控制和事故預(yù)防的關(guān)鍵。對(duì)于自動(dòng)駕駛技術(shù)而言,車輛軌跡預(yù)測(cè)直接影響著車輛行為規(guī)劃、環(huán)境感知和決策制定,對(duì)實(shí)現(xiàn)安全、高效的自動(dòng)駕駛至關(guān)重要。因此,研究和解決車輛軌跡預(yù)測(cè)問(wèn)題不僅對(duì)智能交通和自動(dòng)駕駛技術(shù)的發(fā)展具有重要意義,也是提高交通系統(tǒng)安全性和效率的關(guān)鍵一步。
國(guó)內(nèi)外學(xué)者對(duì)此進(jìn)行了大量研究[1-3],提出了諸多車輛軌跡預(yù)測(cè)方法,然而,這些車輛軌跡預(yù)測(cè)方法均存在模型復(fù)雜、訓(xùn)練時(shí)間過(guò)長(zhǎng)、無(wú)法快速產(chǎn)生預(yù)測(cè)結(jié)果等問(wèn)題。近年來(lái),使用深度學(xué)習(xí)模型成為一種新興的趨勢(shì),這些模型更加靈活,能夠有效地處理非線性關(guān)系,從而更好地描述具有不確定性的車輛軌跡。深度學(xué)習(xí)模型中的一些技術(shù),如循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM),已在語(yǔ)言模型、語(yǔ)音識(shí)別等序列化數(shù)據(jù)的領(lǐng)域被廣泛應(yīng)用。
研究表明,RNN 網(wǎng)絡(luò)可以充分利用歷史軌跡數(shù)據(jù)。一些研究人員對(duì)統(tǒng)計(jì)模型和深度學(xué)習(xí)模型進(jìn)行了比較研究,發(fā)現(xiàn)統(tǒng)計(jì)模型更適用于線性數(shù)據(jù),但其空間復(fù)雜度較高;相比之下,深度學(xué)習(xí)模型在處理非線性數(shù)據(jù)時(shí)具有優(yōu)勢(shì)。LSTM是RNN的一種改進(jìn)型模型,它繼承了大部分RNN模型的特性,同時(shí)解決了梯度消失和梯度爆炸等問(wèn)題。由于LSTM具有長(zhǎng)時(shí)記憶功能,因此非常適合用于軌跡預(yù)測(cè)。
Yang等[4]人提出了基于注意力的雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(AT-BLSTM)模型,該模型由雙向長(zhǎng)短時(shí)記憶(BLSTM)層和注意力層組成。BLSTM層包含前向和后向的長(zhǎng)短時(shí)記憶,采用一種新的前向和后向輸出相結(jié)合的方法。注意力層利用新的自注意算法,根據(jù)特征之間的相關(guān)性分配不同的權(quán)值。孫寧[5]等人提出的結(jié)合注意力機(jī)制與時(shí)空特征融合的長(zhǎng)時(shí)程行為識(shí)別方法。施冬梅等[6]提出了一種基于改進(jìn)的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的駕駛行為檢測(cè)方法,在卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,結(jié)合注意力機(jī)制改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu),提出一種混合雙流卷積神經(jīng)網(wǎng)絡(luò)算法,空間流通道采用卷積神經(jīng)網(wǎng)絡(luò)提取視頻圖像的空間特征值,以空間金字塔池化代替均值池化,統(tǒng)一了特征圖的尺度變換,時(shí)間流通道采用SSD算法計(jì)算視頻序列相鄰兩幀光流圖像,用于人眼等臉部小目標(biāo)的檢測(cè),再進(jìn)行圖像特征融合與分類。
2 研究思路
通常情況下,車輛軌跡預(yù)測(cè)依賴于對(duì)歷史軌跡數(shù)據(jù)進(jìn)行規(guī)則和行為挖掘的過(guò)程,旨在構(gòu)建運(yùn)動(dòng)目標(biāo)模型,以實(shí)現(xiàn)未來(lái)位置的準(zhǔn)確預(yù)測(cè)。目前,車輛預(yù)測(cè)模型主要分為三類:概率圖模型、基于規(guī)劃的預(yù)測(cè)模型和深度學(xué)習(xí)模型。這些模型的問(wèn)題解決知識(shí)和信息主要來(lái)自于兩個(gè)方面:a.人類對(duì)駕駛行為、地圖信息、交通規(guī)則和車輛動(dòng)力學(xué)等方面的先驗(yàn)知識(shí);b.從真實(shí)交通場(chǎng)景中收集到的運(yùn)動(dòng)數(shù)據(jù)。總體而言,概率圖模型和基于規(guī)劃的預(yù)測(cè)模型更加依賴先驗(yàn)知識(shí),而深度學(xué)習(xí)模型更加注重于數(shù)據(jù)的利用。
LSTM與RNN具有相同的循環(huán)方式,其結(jié)構(gòu)中每個(gè)重復(fù)的模塊擁有一個(gè)不同的結(jié)構(gòu),適合被用于處理預(yù)測(cè)時(shí)間序列中間隔和延遲非常大的重要事件。LSTM通過(guò)精心設(shè)計(jì)的門讓信息選擇式通過(guò),以保留時(shí)間序列中的重要信息。
LSTM中的第一步是決定從細(xì)胞狀態(tài)中丟棄什么信息。這個(gè)決定通過(guò)一個(gè)稱為忘記門的結(jié)構(gòu)來(lái)完成。該門會(huì)讀取[ht-1]和[xt],輸出一個(gè)在0~1之間的數(shù)值給每個(gè)在細(xì)胞狀態(tài)[Ct-1]中的數(shù)字。為1時(shí),完全保留細(xì)胞的所有狀態(tài)信息;為0時(shí),完全舍棄細(xì)胞的所有狀態(tài)。輸出值[ft]的計(jì)算過(guò)程為:
[ft=σ(Wfht-1,xt+bf)]?? ??????????????????(1)
第二步是確定什么樣的新信息被存放在細(xì)胞狀態(tài)中。一個(gè)新的狀態(tài)候選值由公式[Ct=tanh(WCht=1,xt+bC))]創(chuàng)建。把舊狀態(tài)與[ft]相乘,丟棄掉確定需要丟棄的信息。接著加上[itCt],得出新的候選值,根據(jù)更新每個(gè)狀態(tài)的程度進(jìn)行變化。計(jì)算過(guò)程是:
[Ct=ftCt-1+itCt]?????????????????????????? (2)
第三是輸出門,決定了當(dāng)前時(shí)刻的細(xì)胞狀態(tài)如何影響當(dāng)前時(shí)刻的隱藏狀態(tài)。輸出門通過(guò)一個(gè)sigmoid函數(shù)來(lái)決定細(xì)胞狀態(tài)中的哪些部分應(yīng)該被輸出。輸出門的計(jì)算方式為:
[ot=σ(Woht-1,xt+bo)]????????????????????? (3)
輸出門通過(guò)控制輸出的大小和內(nèi)容,有選擇地將細(xì)胞狀態(tài)中的信息傳遞到下一個(gè)時(shí)間步的隱藏狀態(tài)中。
3 車輛軌跡源數(shù)據(jù)
采用深度學(xué)習(xí)模型預(yù)測(cè)需要大量的數(shù)據(jù)用來(lái)訓(xùn)練模型,數(shù)據(jù)的質(zhì)量直接影響著模型預(yù)測(cè)的準(zhǔn)確性。本文選取了舊金山海灣地區(qū)536輛出租車近30天的行駛軌跡數(shù)據(jù)(2008年5月1日-6月10日),車輛行駛數(shù)據(jù)的采樣時(shí)間間隔是1 min。車輛軌跡數(shù)據(jù)包含的字段有:[latitude,longitude,occupancy,time],例如:[3775134,
-12239488,0,1213084687],其中,latitude和longitude是用十進(jìn)制數(shù)表示的緯度和經(jīng)度,occupancy代表本出租車目前是否載客(1表示載客,0表示空車),time字段是用UNIX時(shí)間戳格式表示的采樣時(shí)刻。由于本文獲取的源數(shù)據(jù)質(zhì)量較高,去除了錯(cuò)誤數(shù)據(jù)和噪聲數(shù)據(jù),格式整齊,可以直接在程序中使用。
4 基于LSTM的車輛軌跡預(yù)測(cè)模型
41 實(shí)驗(yàn)環(huán)境
本文所用實(shí)驗(yàn)環(huán)境為操作系統(tǒng)Windows 10;處理器Intel(R)Core(TM)i5-10400F CPU@290GHz;內(nèi)存8GB;運(yùn)行環(huán)境:集成了Python365的Anaconda3;編譯環(huán)境為 PyCharm;用到的庫(kù)有TensorFlow220、pandas、numpy、matplotlib、datatime、sklearn等。
42 數(shù)據(jù)準(zhǔn)備
在構(gòu)建模型前,需要對(duì)數(shù)據(jù)進(jìn)行整理,以滿足訓(xùn)練模型需要的數(shù)據(jù)格式。首先讀取文件中的軌跡數(shù)據(jù);然后為數(shù)據(jù)添加列名,刪除對(duì)構(gòu)建模型無(wú)用的occupancy列;最后,將UNIX時(shí)間戳格式表示的采樣時(shí)刻轉(zhuǎn)換為時(shí)間格式,以時(shí)間列作為索引,刪除原時(shí)間列后,對(duì)軌跡數(shù)據(jù)進(jìn)行排序。
一般而言,在模型訓(xùn)練中,數(shù)據(jù)值大意味著更重要,由于經(jīng)緯度數(shù)據(jù)差異較大,直接用于訓(xùn)練模型時(shí),會(huì)對(duì)模型的準(zhǔn)確性產(chǎn)生過(guò)大的影響,因此,在構(gòu)建模型前,還需對(duì)數(shù)據(jù)進(jìn)行歸一化處理。在本文中,對(duì)latitude和longitude列做MinMaxScaler形式的歸一化,即將緯度和經(jīng)度都?xì)w一化為0~1之間的數(shù)。
43 模型的構(gòu)建
基于原始的軌跡數(shù)據(jù)創(chuàng)建新的特征數(shù)據(jù)集和標(biāo)簽數(shù)據(jù)集,Seq_len代表創(chuàng)建特征數(shù)據(jù)集時(shí)的序列長(zhǎng)度,序列的長(zhǎng)度需選擇適中值,本文設(shè)定Seq_len的默認(rèn)值為12,實(shí)際訓(xùn)練過(guò)程中可以隨時(shí)調(diào)整。創(chuàng)建過(guò)程由一個(gè)循環(huán)結(jié)構(gòu)完成,其流程如圖1所示,其中,X表示特征數(shù)據(jù)集;y表示標(biāo)簽數(shù)據(jù)集;data是原始數(shù)據(jù)集。構(gòu)建完成之后,需對(duì)特征數(shù)據(jù)集和標(biāo)簽數(shù)據(jù)集進(jìn)行切分,切分成訓(xùn)練集和測(cè)試集。在本文中,訓(xùn)練集占數(shù)據(jù)集總量的70%,測(cè)試集占總數(shù)據(jù)集的30%。為了提高模型的訓(xùn)練速度,需對(duì)訓(xùn)練集和測(cè)試集創(chuàng)建批數(shù)據(jù),這樣在模型的訓(xùn)練過(guò)程中,就可以批量導(dǎo)入數(shù)據(jù),節(jié)省時(shí)間。
在對(duì)原始軌跡數(shù)據(jù)創(chuàng)建特征數(shù)據(jù)集,以及對(duì)特征數(shù)據(jù)集切分后的輸出數(shù)據(jù)格式,如圖2所示。
在完成以上這些準(zhǔn)備工作后,即可開(kāi)始構(gòu)建和訓(xùn)練軌跡預(yù)測(cè)的模型。
44 模型的編譯和訓(xùn)練
設(shè)置LSTM模型的優(yōu)化器為adam,損失值的計(jì)算采用的是平均絕對(duì)誤差MAE。從訓(xùn)練過(guò)程可以看出,隨著訓(xùn)練輪數(shù)的增加,訓(xùn)練集的損失值和測(cè)試集的損失值都呈下降趨勢(shì)。
5 實(shí)驗(yàn)結(jié)果
評(píng)估模型準(zhǔn)確性的重要指標(biāo)是MAE,它體現(xiàn)了模型的預(yù)測(cè)值和真實(shí)值之間的差異,差異越小,模型的性能越好。圖3是在設(shè)定訓(xùn)練輪數(shù)為20輪時(shí)訓(xùn)練集的損失值和測(cè)試集的損失值??梢钥闯?,兩者的損失值都呈下降趨勢(shì),且最終在002左右保持穩(wěn)定,說(shuō)明了本模型能夠?qū)囕v的軌跡進(jìn)行較準(zhǔn)確的預(yù)測(cè)。
圖4顯示了車輛軌跡的預(yù)測(cè)值和實(shí)際值的對(duì)比,橫坐標(biāo)是歸一化后的緯度,縱坐標(biāo)是歸一化后的經(jīng)度。圖4中橙色的軌跡是車輛的真實(shí)軌跡,藍(lán)色的軌跡是車輛的預(yù)測(cè)軌跡??梢钥闯?,估計(jì)的吻合度相對(duì)較高,但預(yù)測(cè)軌跡存在一定的延遲,這與訓(xùn)練過(guò)程中模型逐步完善的過(guò)程相似。
參考文獻(xiàn):
[1]趙懂宇,王志建,宋程龍基于Informer算法的網(wǎng)聯(lián)車輛運(yùn)動(dòng)軌跡預(yù)測(cè)模型[J]計(jì)算機(jī)應(yīng)用研究,2020(5):1-6
[2]陳曉偉,李煊鵬,張為公基于動(dòng)態(tài)圖注意力的車輛軌跡預(yù)測(cè)研究[J]汽車技術(shù),2024(3):24-30
[3]劉創(chuàng),梁軍基于注意力機(jī)制的車輛運(yùn)動(dòng)軌跡預(yù)測(cè)[J]浙江大學(xué)學(xué)報(bào)(工學(xué)版),2020,54(6):1156-1163
[4]Yang F, Zhang H, Tao S Travel order quantity prediction via attention-based bidirectional LSTM networks[J] The Journal of Supercomputing,2021,25:1-23
[5]孫寧,郝一嘉,宦睿智,等結(jié)合注意力機(jī)制與時(shí)空特征融合的長(zhǎng)時(shí)程行為識(shí)別方法[J]合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,44(8):1051-1058
[6]施冬梅,肖鋒基于改進(jìn)長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的駕駛行為檢測(cè)方法研究[J]汽車工程,2021,43(8):1203-1209
作者簡(jiǎn)介:
門瑞,女,1987年生,講師,博士在讀,研究方向?yàn)檐嚶?lián)網(wǎng)、計(jì)算卸載、機(jī)器學(xué)習(xí)。
基金項(xiàng)目:甘肅省自然科學(xué)基金項(xiàng)目“基于智慧交通的邊緣計(jì)算卸載策略及算力資源分配機(jī)制研究”(23JRRM744);甘肅省高等學(xué)校創(chuàng)新基金項(xiàng)目“基于物聯(lián)網(wǎng)的設(shè)施蔬菜智能監(jiān)控與決策系統(tǒng)研究”(2023A-142)