摘 要:針對(duì)現(xiàn)有交通流預(yù)測(cè)方法存在難以構(gòu)建空間和時(shí)間依賴關(guān)系的問題,提出了新的利用時(shí)空位置注意力的圖神經(jīng)網(wǎng)絡(luò)(ST-PAGNN)方法。首先,該圖神經(jīng)網(wǎng)絡(luò)中包含有位置關(guān)注機(jī)制,由此能夠更好地對(duì)城市道路網(wǎng)絡(luò)中交通節(jié)點(diǎn)的空間依賴關(guān)系進(jìn)行有效捕捉;然后,利用帶有trend adaptive Transformer (Trendformer)的門控遞歸神經(jīng)網(wǎng)絡(luò)來捕捉交通流序列在時(shí)間維度上的局部和全局信息;最后,利用改進(jìn)的網(wǎng)格搜索優(yōu)化方法對(duì)模型的引入?yún)?shù)進(jìn)行優(yōu)化,并以較高的時(shí)間效率獲得全局最優(yōu)解。實(shí)驗(yàn)結(jié)果表明,在數(shù)據(jù)集PEMS-BAY中,預(yù)測(cè)步長分別為15 min,30 min,60 min時(shí),ST-PAGNN的評(píng)價(jià)指標(biāo)RMSE、MAE和MAPE分別為1.37,2.57,2.67%,1.55,3.64,3.37%,1.97,4.37,4.43%;在數(shù)據(jù)集METR-LA中,預(yù)測(cè)步長分別為15 min,30 min,60 min時(shí),ST-PAGNN的評(píng)價(jià)指標(biāo)RMSE、MAE和MAPE分別為2.73,5.16,7.13%,2.99,5.97,7.86%,3.53,7.16,9.96%。結(jié)論表明,ST-PAGNN在不同粒度下的評(píng)價(jià)指標(biāo)中均高于現(xiàn)有模型,從而說明了ST-PAGNN在解決交通預(yù)測(cè)問題方面的有效性和優(yōu)越性。
關(guān)鍵詞:ST-PAGNN;交通流預(yù)測(cè);深度學(xué)習(xí);圖卷積神經(jīng)網(wǎng)絡(luò);門控循環(huán)單元;Trendformer
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2024)10-008-2932-07
doi:10.19734/j.issn.1001-3695.2024.01.0026
Traffic flow prediction method based on spatial temporal positionattention graph neural network
He Ting, Zhou Yanqiu, Xin Chunhua
(Dept. of Computer Technology & Information Management, Inner Mongolia Agricultural University, Baotou Nei Mongol 010010, China)
Abstract:To address the challenge of constructing spatial and temporal dependencies in existing traffic flow prediction me-thods, this paper proposed a new method called spatial temporal position attention graph neural network (ST-PAGNN), which utilized spatiotemporal location attention. Firstly, the graph neural network contained a location attention mechanism, which could better capture the spatial dependence of traffic nodes in the urban road network. Then, it used a gated recurrent neural network with trend adaptive transformer (Trendformer) to capture the local and global information of the traffic flow sequence in the time dimension. Finally, it used the improved grid search optimization method to optimize the introduced para-meters of the model, obtaining the global optimal solution with high time efficiency. The experimental results show that in the dataset PEMS-BAY, the evaluation indexes RMSE, MAE and MAPE of the ST-PAGNN method are 1.37, 2.57, 2.67%, 1.55, 3.64, 3.37%, 1.97, 4.37 and 4.43%, respectively, when the prediction step size is 15 min, 30 min and 60 min, respectively. In the dataset METR-LA, when the prediction step size is 15 min, 30 min and 60 min, the evaluation indexes RMSE, MAE and MAPE of the ST-PAGNN method are 2.73, 5.16, 7.13%, 2.99, 5.97, 7.86%, 3.53, 7.16 and 9.96%, respectively. The results show that the proposed ST-PAGNN method is higher than the existing models in the evaluation indexes under different granularities, which illustrates the effectiveness and superiority of ST-PAGNN in solving traffic prediction problems.
Key words:ST-PAGNN; traffic flow forecasting; deep learning; GCN; GRU; Trendformer
0 引言
隨著城市化進(jìn)程的加速和人口的不斷增長,交通擁堵問題在人們的日常生活中也越來越嚴(yán)重[1]。準(zhǔn)確地預(yù)測(cè)未來短期內(nèi)的交通流是解決交通擁堵問題的關(guān)鍵。最近幾年,交通流預(yù)測(cè)領(lǐng)域開始普遍應(yīng)用大數(shù)據(jù)以及深度學(xué)習(xí)技術(shù),在此影響下獲得了更加有效的問題解決方案[2]。
大數(shù)據(jù)技術(shù)已經(jīng)成為現(xiàn)代社會(huì)不可或缺的組成部分[3]。在交通領(lǐng)域,大數(shù)據(jù)來源于各類傳感器、移動(dòng)設(shè)備、交通監(jiān)控系統(tǒng)以及社交媒體等多種渠道,提供了大量的交通信息。這些數(shù)據(jù)的分析和挖掘,通過準(zhǔn)確地捕捉交通流的特征和模式,可以為短時(shí)交通流預(yù)測(cè)提供有力支持[4]。作為機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域的最新研究和應(yīng)用成果,深度學(xué)習(xí)由于自身所具有的模式識(shí)別能力非常強(qiáng),特征學(xué)習(xí)能力也比較突出等特點(diǎn),所以能夠被深入應(yīng)用到交通流預(yù)測(cè)當(dāng)中。
目前,對(duì)于短期交通流預(yù)測(cè)的研究主要分為經(jīng)典統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法三類[5]。經(jīng)典統(tǒng)計(jì)方法模型較為簡(jiǎn)單,因此計(jì)算方便,速度較快,但是這些方法對(duì)于平穩(wěn)數(shù)據(jù)的預(yù)測(cè)效果較好,對(duì)于非線性和復(fù)雜的交通流數(shù)據(jù)表現(xiàn)較差?;跈C(jī)器學(xué)習(xí)的方法利用了回歸和分類算法進(jìn)行建模和預(yù)測(cè),能夠?qū)崿F(xiàn)較好的預(yù)測(cè)效果,但在大量數(shù)據(jù)和特征維度較高的情況下,仍然存在性能瓶頸。隨著深度學(xué)習(xí)技術(shù)的興起,基于深度學(xué)習(xí)的方法在交通流預(yù)測(cè)領(lǐng)域取得了顯著的突破,其強(qiáng)大的非線性建模能力使得預(yù)測(cè)準(zhǔn)確性大幅提高[6]。
為了彌補(bǔ)機(jī)器學(xué)習(xí)相關(guān)方法的不足,現(xiàn)存的深度學(xué)習(xí)方法,大多是通過設(shè)計(jì)和完善神經(jīng)網(wǎng)絡(luò)來捕捉交通流信息的時(shí)間和空間依賴性。例如,循環(huán)卷積神經(jīng)網(wǎng)絡(luò) RNN 通過二維時(shí)空矩陣將時(shí)空交通狀態(tài)轉(zhuǎn)換為描述交通流時(shí)空關(guān)系的圖像,增強(qiáng)了時(shí)空的關(guān)聯(lián)性。RNN的變體[7]長短期記憶網(wǎng)絡(luò)LSTM解決了RNN梯度消失的問題,提高了時(shí)空依賴性。Fu等人[8]提出將門控循環(huán)單元(GRU)遞歸神經(jīng)網(wǎng)絡(luò)(NN)結(jié)合LSTM方法來捕獲時(shí)空依賴性模型表現(xiàn)良好。以上方法通常適用于規(guī)則的歐幾里德結(jié)構(gòu)的數(shù)據(jù)[9],例如圖像、網(wǎng)格等。但是用于收集交通流信息的檢測(cè)器的分布屬于非歐幾里德結(jié)構(gòu),因此這些方法在交通流預(yù)測(cè)的準(zhǔn)確性上存在局限性。為此,Liu等人[10]提出基于圖卷積網(wǎng)絡(luò)(GCN)的模型用來提取交通流的領(lǐng)域信息和社區(qū)信息,加快了圖卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展。在圖卷積神經(jīng)網(wǎng)絡(luò)中,層次交叉的交通路線被建模成圖結(jié)構(gòu),圖中交通連接的地方稱為圖結(jié)構(gòu)中的節(jié)點(diǎn),邊權(quán)值叫做節(jié)點(diǎn)歐氏距離。為了捕獲交通數(shù)據(jù)的時(shí)間和空間的依賴性,時(shí)間圖卷積網(wǎng)絡(luò)(T-GCN)、圖卷積網(wǎng)絡(luò)和門控循環(huán)單元相結(jié)合[11~13],用圖卷積學(xué)習(xí)拓?fù)浣Y(jié)構(gòu)以捕捉空間依賴性,同時(shí)用門控遞歸單元學(xué)習(xí)交通數(shù)據(jù)變化以捕獲數(shù)據(jù)的時(shí)間依賴性。相較于之前沒有采用GCN的方法,這些方法雖然在模型的預(yù)測(cè)精度上有了一定的提升,但是仍然存在一些問題:a)采用的是定義好的不變的圖結(jié)構(gòu)[14],不能動(dòng)態(tài)地反映出節(jié)點(diǎn)之間的影響關(guān)系;b)無法很好地捕捉交通情況,以上方法使用共享模型參數(shù),而對(duì)于特征的交通數(shù)據(jù)情況,無法捕捉到細(xì)粒度的特征表示,例如交通路段封閉;c)不能同時(shí)有效地捕捉交通流數(shù)據(jù)的時(shí)空依賴性,從而導(dǎo)致其在預(yù)測(cè)準(zhǔn)確率上面存在局限性[15]。
由于現(xiàn)存方法不能有效解決空間和時(shí)間方面依賴關(guān)系,針對(duì)上述問題,本文設(shè)計(jì)了一個(gè)融合空間-時(shí)間依賴和位置注意力圖神經(jīng)網(wǎng)絡(luò)的交通流預(yù)測(cè)方法(spatial temporal position attention graph neural network, ST-PAGNN)。
本文的主要貢獻(xiàn)如下:
a)為了捕捉道路之間的空間關(guān)系,引入添加位置注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)模型,從而更加有效地聚集來自相鄰道路的交通流信息。
b)利用改進(jìn)的網(wǎng)格搜索優(yōu)化方法對(duì)模型的引入?yún)?shù)進(jìn)行優(yōu)化,并以較高的時(shí)間效率獲得全局最優(yōu)解,可以保證整合后模型的普適性。
c)通過GCN學(xué)習(xí)拓?fù)鋪聿东@空間依賴性,將LSTM[15]網(wǎng)絡(luò)嵌入到GCN增加網(wǎng)絡(luò)時(shí)間記憶功能來捕獲時(shí)間特征,增強(qiáng)長序列處理的能力。
d)通過結(jié)合GRU和Trendformer來捕捉局部和全局的時(shí)間依賴性,獲取交通流的動(dòng)態(tài)趨勢(shì),增強(qiáng)模型對(duì)特殊事件發(fā)生的魯棒性。
e)提出了新的ST-PAGNN框架進(jìn)行交通流的預(yù)測(cè),特別用于對(duì)具有復(fù)雜拓?fù)浜蜁r(shí)間依賴性的系列數(shù)據(jù)進(jìn)行建模。在真實(shí)的數(shù)據(jù)集上驗(yàn)證了ST-PAGNN的可行性和優(yōu)勢(shì),特別是對(duì)于以分鐘為單位的短時(shí)交通速度預(yù)測(cè)。實(shí)驗(yàn)表明,提出的模型明顯優(yōu)于其他幾種先進(jìn)的方法。
1 相關(guān)工作
在交通流預(yù)測(cè)領(lǐng)域,基于傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法已經(jīng)取得了一定的研究成果[16]?;诙虝r(shí)交通流預(yù)測(cè)問題的深入研究和分析需要,本文在對(duì)交通流預(yù)測(cè)方法進(jìn)行闡釋時(shí),主要基于傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)兩個(gè)維度進(jìn)行。
1.1 基于傳統(tǒng)的機(jī)器學(xué)習(xí)的交通流預(yù)測(cè)方法
基于傳統(tǒng)的機(jī)器學(xué)習(xí)方法通常依賴于手動(dòng)選取的特征提取,通過構(gòu)建和訓(xùn)練機(jī)器學(xué)習(xí)模型來預(yù)測(cè)交通流量[17]。這些方法主要基于統(tǒng)計(jì)模型、回歸模型和決策樹等,它們?cè)诮煌髁款A(yù)測(cè)中具有一定的可靠性和可解釋性。
常見的基于傳統(tǒng)的機(jī)器學(xué)習(xí)的方法包括:回歸模型如線性回歸和非線性回歸;決策樹算法如CART、隨機(jī)森林和支持向量機(jī)(SVM)等。Toan等人[18]提出了一種使用支持向量機(jī)進(jìn)行短期交通流預(yù)測(cè)的有效方法,與基線方法(包括歷史平均值、基于當(dāng)前時(shí)間和雙指數(shù)平滑預(yù)測(cè)因子)進(jìn)行比較。為了證明 SVM 的效率和準(zhǔn)確性,在新加坡泛島高速公路的一段路上使用了一個(gè)月的時(shí)間序列交通流量數(shù)據(jù)來訓(xùn)練和測(cè)試模型。結(jié)果表明,在大多數(shù)預(yù)測(cè)區(qū)間和各種交通條件下,在30 min的滾動(dòng)水平線上,SVM的性能顯著優(yōu)于基線方法。Miao等人[19]提出了一種多任務(wù)貝葉斯增強(qiáng)的對(duì)抗時(shí)空網(wǎng)絡(luò)MBA-STNet來學(xué)習(xí)特定任務(wù)的特征和共享特征。結(jié)果表明,MBA-STNet優(yōu)于目前先進(jìn)的方法。這些方法能夠利用歷史交通數(shù)據(jù)和其他影響因素,構(gòu)建模型來預(yù)測(cè)交通流量。Peng等人[20]提出了ARIMA-SVM組合預(yù)測(cè)模型用于預(yù)測(cè)城市短期交通流量。首先,利用ARIMA和SVM預(yù)測(cè)城市短期交通流量;然后,利用更新的動(dòng)態(tài)權(quán)重加權(quán)融合方法預(yù)測(cè)城市交通流量,得到ARIMA-SVM組合預(yù)測(cè)模型,并將結(jié)果與單獨(dú)的ARIMA和SVM進(jìn)行比較。實(shí)證結(jié)果表明,ARIMA-SVM組合模型能夠更準(zhǔn)確地預(yù)測(cè)城市的短期交通流量。然而,這類方法對(duì)于特征提取的依賴性較強(qiáng),需要人工選取合適的特征,并且在處理非線性和高維數(shù)據(jù)方面的能力有限。
1.2 基于深度學(xué)習(xí)的交通流預(yù)測(cè)方法
最近幾年,研究領(lǐng)域開始越來越關(guān)注基于深度學(xué)習(xí)的交通流預(yù)測(cè)方法。深度學(xué)習(xí)方法通過構(gòu)建多層神經(jīng)網(wǎng)絡(luò),可以自動(dòng)學(xué)習(xí)交通流的特征和模式,并將其應(yīng)用于交通流量的預(yù)測(cè)。相對(duì)于傳統(tǒng)的機(jī)器學(xué)習(xí)方法,深度學(xué)習(xí)具有更強(qiáng)的非線性建模和特征學(xué)習(xí)能力[21]。
在日常的研究中,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是應(yīng)用最為普遍的基于深度學(xué)習(xí)的方法,但是除此之外,由此衍生出來的門控循環(huán)單元網(wǎng)絡(luò)以及卷積神經(jīng)網(wǎng)絡(luò)(CNN)等也比較常見。文獻(xiàn)[22]提出了一種名為M-B-LSTM的混合深度學(xué)習(xí)網(wǎng)絡(luò)模型來對(duì)短期交通流進(jìn)行預(yù)測(cè)。該模型包括數(shù)據(jù)映射層、統(tǒng)計(jì)分布和深度雙向長短期記憶網(wǎng)絡(luò)(DBLSTM)。通過這些組件,M-B-LSTM能夠有效地處理交通流數(shù)據(jù)存在的分布不平衡、過擬合和不確定性問題,從而準(zhǔn)確預(yù)測(cè)未來一段時(shí)間內(nèi)的交通流狀態(tài)。此外,經(jīng)過充分的對(duì)比實(shí)驗(yàn),結(jié)果表明,與現(xiàn)有方法相比,所提模型在解決不確定性和過擬合問題方面具有更好的能力。Zheng等人[23]提出了一種基于深度學(xué)習(xí)的模型,該模型使用混合和多層架構(gòu)來自動(dòng)提取交通流數(shù)據(jù)的固有特征。首先,為了對(duì)空間和短期時(shí)間特征進(jìn)行有效的提取,最好的方法就是進(jìn)行基于注意力的Conv-LSTM模塊的開發(fā),而這又必須要建立在卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶(LSTM)網(wǎng)絡(luò)基礎(chǔ)之上;科學(xué)合理制定注意力機(jī)制,在自動(dòng)對(duì)各個(gè)權(quán)重進(jìn)行有效分配的基礎(chǔ)之上,能夠有效對(duì)各個(gè)時(shí)間流序列的不同重要程度進(jìn)行界定。其次,基于對(duì)長期時(shí)間特征進(jìn)行深入研究的需要,構(gòu)建了全新的雙向LSTM(Bi-LSTM)模塊,據(jù)此來對(duì)每日和每周的周期性特征進(jìn)行提取,由此能夠更好地對(duì)交通流從前向和后向的發(fā)展變化情況進(jìn)行捕捉。最后,通過大量的實(shí)驗(yàn)結(jié)果表明,與其他現(xiàn)有方法相比,所提結(jié)合注意力轉(zhuǎn)換和Bi-LSTM的模型具有更好的預(yù)測(cè)性能。Han等人[24]提出了一個(gè)名為LST-GCN的模型。利用LSTM(長短期記憶)網(wǎng)絡(luò)優(yōu)化GCN(圖卷積網(wǎng)絡(luò))參數(shù)來模擬交通流預(yù)測(cè)中存在的時(shí)空相關(guān)性。具體來說,本文通過GCN學(xué)習(xí)拓?fù)鋪聿东@空間相關(guān)性,通過將LSTM網(wǎng)絡(luò)嵌入GCN的訓(xùn)練過程中來捕獲時(shí)間相關(guān)性。該方法改進(jìn)了原有時(shí)空交通流預(yù)測(cè)中循環(huán)神經(jīng)網(wǎng)絡(luò)和圖神經(jīng)網(wǎng)絡(luò)相結(jié)合的傳統(tǒng)方法,能夠更好地捕捉交通流中存在的時(shí)空特征。在PEMS數(shù)據(jù)集上進(jìn)行的大量實(shí)驗(yàn)證明了與其他最新方法相比,該方法更有效。 Liu等人[25]提出一種基于GCN和LSTM網(wǎng)絡(luò)的深度學(xué)習(xí)網(wǎng)絡(luò)。該模型是使用綿陽市的本地交通數(shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試的。在引入新的深度學(xué)習(xí)網(wǎng)絡(luò)后,本文還建立了一種基于時(shí)間相關(guān)性選擇相關(guān)道路鏈接作為模型輸入的數(shù)據(jù)縮減方法。最后,將所提算法與其他常用方法進(jìn)行對(duì)比,在常規(guī)的5 min預(yù)測(cè)測(cè)試中可以獲得更好的結(jié)果。同時(shí),GCN-LSTM模型的性能可以通過多步預(yù)測(cè),在5~125 min的不同時(shí)間內(nèi)保持,比其他模型要好得多。這些方法能夠通過多層次的網(wǎng)絡(luò)結(jié)構(gòu),捕捉交通流的時(shí)序特征和空間關(guān)系,提高交通流量預(yù)測(cè)的準(zhǔn)確性。深度學(xué)習(xí)方法還可以通過端到端的訓(xùn)練過程,自動(dòng)進(jìn)行特征學(xué)習(xí)和模型優(yōu)化,減少對(duì)人工特征工程的依賴。
基于上述分析可知,盡管現(xiàn)有的交通流預(yù)測(cè)方法取得了優(yōu)異的表現(xiàn),但是當(dāng)前利用注意力機(jī)制捕獲動(dòng)態(tài)空間依賴的模型只使用了車速信息,忽視了其他的一些信息,也沒有利用全局的時(shí)間依賴。并且大多數(shù)的研究工作在空間和時(shí)間依賴性的建模上有一定的局限性,難以充分挖掘潛藏在復(fù)雜交通網(wǎng)絡(luò)中的內(nèi)在模式,難以實(shí)現(xiàn)精準(zhǔn)的交通流預(yù)測(cè)。因此,提出了基于ST-PAGNN的交通流預(yù)測(cè)方法。
2 基于ST-PAGNN的交通流預(yù)測(cè)方法
時(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò)框架如圖1所示,由三個(gè)主要部分組成:a)空間圖神經(jīng)網(wǎng)絡(luò)(S-GNN)層,用于捕捉道路之間的空間關(guān)系;b)GRU層,用于捕捉序列中的時(shí)間關(guān)系(或局部時(shí)間依賴性);c)改進(jìn)的Transformer層,用于直接捕捉序列中的長程時(shí)間依賴性(或全局時(shí)間依賴性)。需要注意的是,S-GNN層用于模擬節(jié)點(diǎn)之間的空間關(guān)系,并且同時(shí)應(yīng)用于GRU單元的輸入和隱藏表示,如圖1所示。GRU層[26]和改進(jìn)的Transformer層[27]都用于獨(dú)立地捕捉每個(gè)節(jié)點(diǎn)的時(shí)間相關(guān)性,分別從不同的角度進(jìn)行捕捉。接下來,首先討論利用S-GNN來建模空間依賴性,然后介紹如何利用GRU層和Transformer層來捕捉時(shí)間依賴性。在介紹完這些組件之后,將對(duì)整個(gè)框架進(jìn)行簡(jiǎn)要總結(jié)。
2.1 空間依賴性建模
交通網(wǎng)絡(luò)G對(duì)道路之間的關(guān)系進(jìn)行了編碼。交通網(wǎng)絡(luò)中的道路如果彼此之間連接在一起,那么其存在相似屬性的幾率也就越大。如果屬于間距較近的兩條路,那么其中任意一條路上出現(xiàn)的交通狀況都可能會(huì)影響到對(duì)方。所以,有必要借助于圖神經(jīng)網(wǎng)絡(luò)模型(graph neural networks model)[28]來對(duì)其空間進(jìn)行捕捉,通過網(wǎng)絡(luò)轉(zhuǎn)換和傳播信息。給定網(wǎng)絡(luò)上Xin∈Euclid ExtraaBpN×din的輸入信息,可生成輸出Xout∈Euclid ExtraaBpN×dout如下:
Xout=σ(D-1/2AD-1/2XinW)(1)
其中:σ為非線性激活函數(shù),采用ReLU(·);A=A+IN是細(xì)化鄰接矩陣;IN是N維標(biāo)識(shí)矩陣;D是細(xì)化度矩陣Dii=∑jAij;W是要學(xué)習(xí)的參數(shù)。式(1)中的運(yùn)算總結(jié)如下:
Xout=fg(A,Xin)(2)
上述都是以網(wǎng)絡(luò)信息為載體的工作,而處于道路上傳感器間的地理臨近性又是形成網(wǎng)絡(luò)信息的基本前提。但是,道路間實(shí)際上可能會(huì)存在更為復(fù)雜的影響。比如,車輛密度、道路狀況等因素也都可能會(huì)對(duì)交通流量產(chǎn)生重大影響。所以,式(1)在具體進(jìn)行聚合的過程當(dāng)中,要避免在某個(gè)中心點(diǎn)對(duì)相近節(jié)點(diǎn)的信息進(jìn)行平均聚合。本文嘗試采用全新的位置表示來對(duì)各個(gè)節(jié)點(diǎn)的這些因素進(jìn)行捕捉。如果用vi來表示各節(jié)點(diǎn),那么對(duì)應(yīng)地采用pi來表示該點(diǎn)對(duì)周圍點(diǎn)的信息進(jìn)行聚合之后的結(jié)果,任意兩個(gè)節(jié)點(diǎn)之間的相互作用關(guān)系計(jì)算如式(3)所示。
R[i, j]=exp(Φ(score(pi,pj)))∑Nk=1exp(Φ(score(pi,pk)))(3)
其中:Φ表示非線性映射函數(shù),用來對(duì)節(jié)點(diǎn)間的得分進(jìn)行變換;score()是一個(gè)用點(diǎn)積建模的關(guān)系得分函數(shù)。
score(pi,pj)=pTipj(4)
除此之外,借助于掩碼來稀疏化處理關(guān)系矩陣R,從而使計(jì)算變得更加簡(jiǎn)便:
mask(R)=Rij if Aij > 0
0 otherwise(5)
然后,就可以對(duì)新學(xué)習(xí)的關(guān)系矩陣mask(R)進(jìn)行GCN運(yùn)算:
Xout=σ(D-1/2RRD-1/2RXinW(l))(6)
其中:R=mask(R)+IN;DR是R的度矩陣。式(7)為式(6)的簡(jiǎn)寫,以捕捉空間關(guān)系:
Xout=fa(A,Xin)(7)
2.2 時(shí)間依賴性建模
基于對(duì)時(shí)間依賴性進(jìn)行捕捉的需要,本文在對(duì)序列信息進(jìn)行處理時(shí)借助了門控遞歸單元[26]。各個(gè)時(shí)間步分別有對(duì)應(yīng)的一個(gè)隱藏表示被保留,以便對(duì)下個(gè)時(shí)間步的信息流進(jìn)行控制,同時(shí)當(dāng)前時(shí)間步也是以此作為輸出。在所有的節(jié)點(diǎn)上都獨(dú)立應(yīng)用了GRU運(yùn)算,但是彼此之間能夠共享GRU參數(shù)。為了在對(duì)序列進(jìn)行處理時(shí)能夠?qū)⒖臻g關(guān)系納入其中,借助于式(7)中修改后的GCN來對(duì)GRU的輸入和隱藏表示進(jìn)行運(yùn)算。具體而言,將Xt和上一步的隱藏表示Ht-1輸入到t也就是時(shí)間步驟當(dāng)中,將修正的GCN運(yùn)算應(yīng)用其中:
Xt=fa(A,Xt)Ht-1=fa(A,Ht-1)
(8)
那么,對(duì)于時(shí)間步長為t的每個(gè)節(jié)點(diǎn) vi,GRU 的運(yùn)行情況 可以表示如下:
zt=σz(WzXt[i,:]+UzHt-1[i,:]+bz)
rt=σr(WrXt[i,:]+UrHt-1[i,:]+br)
Ht[i,:]=tanh(WhXt[i,:]+Uh(rt⊙UhHt-1[i,:])+bh)
Ht[i,:]=(1-zt)Ht-1[i,:]+zt⊙Ht[i,:]
(9)
其中:元素相乘用⊙表示;Wz和Uz代表更新門的權(quán)重矩陣;Wr和Ur代表重置門的權(quán)重矩陣;Wh,Uh代表候選隱藏狀態(tài)的權(quán)重矩陣;Ht[i,:]具有雙重角色,為及時(shí)輸出結(jié)果,同時(shí)也作為輸入存在于下一時(shí)間步中。
GRU的主要作用在于對(duì)局部時(shí)間信息進(jìn)行捕捉。但是,在現(xiàn)實(shí)當(dāng)中,時(shí)間信息除了具有順序相關(guān)之外還存在其他相關(guān)性。所以,在預(yù)測(cè)交通速度過程當(dāng)中必須要做好對(duì)全局時(shí)間信息的捕捉。因此,在GRU層之后,采用了Trendformer來直接捕捉全局相關(guān)性。對(duì)于節(jié)點(diǎn)vi,將GRU的輸出序列(H1[i,:],…,HT[i,:])作為轉(zhuǎn)換器的輸入。
Trendformer由一個(gè)自適應(yīng)趨勢(shì)模塊、一個(gè)時(shí)空編碼器、一個(gè)時(shí)空解碼器和一個(gè)輸出模塊組成。時(shí)空編碼器的主要構(gòu)成部分為時(shí)間編碼器和空間編碼器,且兩者并行存在。對(duì)于后者而言,又可以細(xì)分為串行存在的時(shí)間編碼器和空間編碼器。時(shí)間編碼器和時(shí)間解碼器對(duì)序列進(jìn)行多頭關(guān)注,以提取時(shí)間相關(guān)性??臻g編碼器和空間解碼器對(duì)傳感器圖進(jìn)行多頭關(guān)注,以提取空間相關(guān)性。將時(shí)間編碼器和空間編碼器的輸出進(jìn)行融合,以獲得編碼輸出。自適應(yīng)趨勢(shì)模塊根據(jù)編碼輸出確定可向解碼器傳輸多少趨勢(shì)信息,并控制預(yù)測(cè)輸出在趨勢(shì)周圍的波動(dòng)強(qiáng)度。然后,編碼器和自適應(yīng)趨勢(shì)模塊的輸出被送入時(shí)空解碼器。時(shí)空解碼器之后是一個(gè)輸出模塊,用于產(chǎn)生多步預(yù)測(cè)輸出,并最終輸出Hviout∈Euclid ExtraaBpT×d。Trendformer的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
2.3 預(yù)測(cè)層
在經(jīng)過Trendformer之后,將輸入數(shù)據(jù)設(shè)定為{Hviout|∈vi∈V},借助于多層前饋網(wǎng)絡(luò)以便更好地對(duì)交通流未來的變化情況進(jìn)行預(yù)測(cè)。
訓(xùn)練時(shí)必須要按照三部分來拆分歷史數(shù)據(jù)y,得到的為ytrain、ytest以及yvalid,分別對(duì)應(yīng)的內(nèi)容為訓(xùn)練、測(cè)試以及驗(yàn)證。然后,通過滑動(dòng),在訓(xùn)練數(shù)據(jù)ytrain上能夠得到窗口,其長度為T+T′,由此能夠得到相應(yīng)的訓(xùn)練序列。其中輸入為前T個(gè)元素,而基本事實(shí)則是剩下的T′元素。最后,將損失設(shè)定為平均絕對(duì)誤差,可以表示如下:
L=∑|ytrain|-T′t=1d(f(Yt+1,…,Yt+T),(Yt+T+1,…,Yt+T+T′))(10)
其中:
d(f(Yt+1,…,Yt+T),(Yt+T+1,…,Yt+T+T′))=
∑T′i=1‖Y^t+T+i-Yt+T+i‖(11)
(Y^t+T+1,…,Y^t+T+T′)=f(Yt+1,…,Yt+T)(12)
其中: f()是預(yù)測(cè)模型,通過式(10)的最小化損失函數(shù)完成訓(xùn)練。
2.4 參數(shù)優(yōu)化策略
參數(shù)的選擇對(duì)模型的性能起著至關(guān)重要的作用。所提模型利用C和Gamma的獨(dú)立特性,通過分布式資源并行執(zhí)行網(wǎng)格搜索來縮短模型搜索時(shí)間。
a)對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)清理和歸一化。根據(jù)時(shí)間延遲t和嵌入維度m重構(gòu)相空間后,作為模型訓(xùn)練和測(cè)試輸入。
b)初始化模型參數(shù),并將訓(xùn)練集分為兩部分,第一部分訓(xùn)練集用于GRU訓(xùn)練數(shù)據(jù),第二部分子集用于預(yù)測(cè)。
c)將第二部分子集的預(yù)測(cè)值和實(shí)際值拼接后作為元學(xué)習(xí)器的訓(xùn)練數(shù)據(jù)。
d)初始化Trendformer的C和Gamma參數(shù)范圍和步驟,通過多線程網(wǎng)格搜索找到最優(yōu)模型,并在交叉驗(yàn)證后返回最優(yōu)參數(shù)組合。
e)根據(jù)最優(yōu)參數(shù)重建集成模型,并調(diào)用該模型對(duì)測(cè)試數(shù)據(jù)進(jìn)行預(yù)測(cè)。
3 實(shí)驗(yàn)
3.1 實(shí)驗(yàn)環(huán)境和數(shù)據(jù)集
實(shí)驗(yàn)環(huán)境配置參數(shù)如表1所示。每個(gè)模型的實(shí)驗(yàn)結(jié)果均為十次實(shí)驗(yàn)結(jié)果的平均值。
實(shí)驗(yàn)中采用前12個(gè)節(jié)點(diǎn)進(jìn)行預(yù)測(cè),分別預(yù)測(cè)未來15 min、30 min、60 min的交通流速[29]。在本次實(shí)驗(yàn)中,將模型訓(xùn)練的迭代次數(shù)(epoch)設(shè)置為100,批量大?。╞atch size)設(shè)置為64,同時(shí)優(yōu)化器(optimizer)選擇了AdamW,損失函數(shù)(loss function)使用的是MAE指標(biāo)。實(shí)驗(yàn)中的學(xué)習(xí)率為動(dòng)態(tài)學(xué)習(xí)率[30],如式(1)所示。
newepochlr=startlr×[epochstepsize](13)
其中:newepochlr代表對(duì)應(yīng)迭代次數(shù)的學(xué)習(xí)率;startlr代表模型訓(xùn)練時(shí)的初始學(xué)習(xí)率;為每次更新學(xué)習(xí)率的乘法因子;[]為向下取整運(yùn)算;stepsize為更新學(xué)習(xí)率的步長。初始學(xué)習(xí)率startlr設(shè)置為0.001,乘法因子設(shè)置為0.999,更新步長stepsize設(shè)置為10。這里的初始學(xué)習(xí)率startlr、乘法因子以及更新步長stepsize均是根據(jù)文獻(xiàn)[30]來進(jìn)行設(shè)置的,同時(shí)也通過采用控制變量法進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證了這些參數(shù)的設(shè)置能夠使得模型取得最好的結(jié)果。此外,這些參數(shù)被設(shè)置后,再次通過使用控制變量法進(jìn)行實(shí)驗(yàn),然后選取對(duì)比實(shí)驗(yàn)中結(jié)果最佳狀態(tài)下的批量大小。
在兩個(gè)真實(shí)世界的流量數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),簡(jiǎn)要介紹如下:
a)METR-LA。該數(shù)據(jù)為從洛杉磯縣的高速公路上的檢測(cè)器上收集的交通速度[31]數(shù)據(jù)。每5 min記錄一次每個(gè)節(jié)點(diǎn)的交通速度,本文使用的數(shù)據(jù)的時(shí)間跨度為2020年3月1日至2020年6月30日,時(shí)間為4個(gè)月。時(shí)間片總數(shù)為34 272個(gè)。
b)PEMS-BAY。該數(shù)據(jù)集來自加州交通部(Caltrans)的性能測(cè)量系統(tǒng)(PeMS)[32]。本文使用的數(shù)據(jù)來自灣區(qū)的325個(gè)傳感器,時(shí)間跨度為2020年1月1日至2020年5月31日,為期6個(gè)月。同樣該數(shù)據(jù)每5 min被記錄一次,包含了52 116個(gè)時(shí)間切片。表2展示了兩個(gè)數(shù)據(jù)集的關(guān)鍵信息。
3.2 評(píng)估指標(biāo)
為了能夠確保最終的實(shí)驗(yàn)結(jié)果更加具有客觀性,在選取性能指標(biāo)上主要包括平均絕對(duì)誤差(mean absolute error, MAE)、平均絕對(duì)誤差百分比(mean absolute percentage error,MAPE)和均方根誤差(root mean square error,RMSE)三部分。
評(píng)價(jià)指標(biāo)計(jì)算公式如式(14)~(16)所示。
MAE=1n∑ni=1|yi-i|(14)
RMSE=1n∑ni=1(yi-i)2(15)
MAPE=1n∑ni=1yi-iyi×100%(16)
其中:yi代表實(shí)際的客流量數(shù)據(jù);i代表預(yù)測(cè)的客流量數(shù)據(jù);n為樣本數(shù)量。上述評(píng)估指標(biāo)的值越小,說明模型得到的交通流預(yù)測(cè)效果越好。
3.3 模型性能比較
為了驗(yàn)證該模型的優(yōu)越性,設(shè)計(jì)了一組比較實(shí)驗(yàn)。其中,比較模型包括M-B-LSTM[22]、LST-GCN[24]和GCN-LSTM[25]。
表3、4分別顯示了在數(shù)據(jù)集PEMS-BAY和METR-LA下的預(yù)測(cè)結(jié)果。本文對(duì)提前15 min、30 min和60 min的預(yù)測(cè)結(jié)果進(jìn)行了平均,并突出顯示了每種設(shè)置下的最佳結(jié)果。
由表3、4可知,實(shí)驗(yàn)數(shù)據(jù)集為PEMS-BAY時(shí),在15 min預(yù)測(cè)步長下,基線模型中表現(xiàn)最好的是GCN-LSTM,相較于該模型,ST-PAGNN在RMSE、MAE和MAPE指標(biāo)分別降低了0.08、0.41和0.3百分點(diǎn);在30 min預(yù)測(cè)步長下,基線模型中整體上表現(xiàn)較好的是GCN-LSTM,相較于該模型,ST-PAGNN在RMSE、MAE和MAPE指標(biāo)分別降低了0.19、0.33和0.53百分點(diǎn);在60 min預(yù)測(cè)步長下,基線模型中整體上表現(xiàn)較好的是LST-GCN,相較于該模型,ST-PAGNN在RMSE、MAE和MAPE指標(biāo)分別降低了0.40、0.30和0.71百分點(diǎn)。實(shí)驗(yàn)數(shù)據(jù)集為METR-LA時(shí),在15 min、30 min以及60 min預(yù)測(cè)步長時(shí),基線模型中GCN-LSTM均表現(xiàn)較好。在15 min預(yù)測(cè)步長下,相較于GCN-LSTM,ST-PAGNN在RMSE、MAE和MAPE指標(biāo)分別降低了0.24、0.53和0.66百分點(diǎn);在30 min預(yù)測(cè)步長下,相較于GCN-LSTM,ST-PAGNN在RMSE、MAE和MAPE指標(biāo)分別降低了0.68、0.89和1.10百分點(diǎn);在60 min預(yù)測(cè)步長下,相較于GCN-LSTM,ST-PAGNN在RMSE、MAE和MAPE指標(biāo)分別降低了0.23、0.60和0.61百分點(diǎn)。實(shí)驗(yàn)結(jié)果表明,ST-PAGNN在所有情況下均表現(xiàn)良好,展現(xiàn)出模型良好的表現(xiàn)能力。
3.4 交通流預(yù)測(cè)的性能分析
為了展示所提模型處理復(fù)雜交通情況的能力,在兩個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行案例研究。從每個(gè)數(shù)據(jù)集分別隨機(jī)選擇一個(gè)交通傳感器節(jié)點(diǎn),時(shí)間間隔設(shè)置為5 min,利用ST-PAGNN獲得交通流預(yù)測(cè)值,并將其與每個(gè)時(shí)間段的真實(shí)值進(jìn)行對(duì)比,在METR-LA和PEMS-BAY數(shù)據(jù)集上得到的可視化結(jié)果如圖3、4所示。
圖3中,提出模型在早期訓(xùn)練階段(1個(gè)epoch)表現(xiàn)不佳,經(jīng)過5個(gè)訓(xùn)練epoch后,該模型整體上表現(xiàn)良好,但仍然不能很好地適應(yīng)一些突變情況,如175個(gè)時(shí)間間隔附近。幸運(yùn)的是,當(dāng)執(zhí)行50個(gè)epoch后,該模型的預(yù)測(cè)能力被繼續(xù)提升,且在100個(gè)epoch后幾乎可以完美地接近真實(shí)值。值得注意的是,該傳感器在第100個(gè)時(shí)間間隔附近存在一些缺失值(圖中顯示的數(shù)值為零)。經(jīng)過100個(gè)訓(xùn)練epoch后,提出模型能夠通過合理的預(yù)測(cè)來有效彌合這些缺失值的差距。
圖4中,對(duì)于從PEMS-BAY采樣的節(jié)點(diǎn),真實(shí)值的曲線非常復(fù)雜,尤其是在末端。同樣,提出的模型能夠快速學(xué)習(xí)以獲得接近真實(shí)值的預(yù)測(cè)結(jié)果,表明該模型可以有效地處理復(fù)雜的交通流量預(yù)測(cè)問題。
3.5 空間依賴性建模分析
為了驗(yàn)證引入位置注意力機(jī)制的合理性,ST-PAGNN分別與引入無位置注意力的模型和未引入注意力的模型進(jìn)行實(shí)驗(yàn)對(duì)比,實(shí)驗(yàn)數(shù)據(jù)集為METR-LA,如表5所示。
實(shí)驗(yàn)結(jié)果表明,引入位置注意力的ST-PAGNN使得模型在RMSE、MAE和MAPE指標(biāo)上均有所降低,例如,在15 min預(yù)測(cè)步長下,相較于引入無位置注意力機(jī)制的模型,ST-PAGNN在RMSE、MAE和MAPE指標(biāo)分別降低了0.15、0.43和0.67百分點(diǎn)。引入位置注意力機(jī)制的ST-PAGNN可以更好地捕捉城市道路網(wǎng)絡(luò)中交通節(jié)點(diǎn)的空間依賴關(guān)系,從而使得交通流預(yù)測(cè)效果得以提升。
3.6 時(shí)間依賴性建模分析
為了驗(yàn)證GRU+Trendformer構(gòu)建的合理性,ST-PAGNN分別與未加入Trendformer、未加入GRU和GRU+Transformer進(jìn)行實(shí)驗(yàn)對(duì)比,實(shí)驗(yàn)數(shù)據(jù)集為METR-LA,如表6所示。
實(shí)驗(yàn)結(jié)果表明,引入位置注意力機(jī)制的GRU+Trendformer使得模型在RMSE、MAE和MAPE指標(biāo)上均有所降低,例如,在15 min預(yù)測(cè)步長下,相較于對(duì)比模型中表現(xiàn)較好的GRU+Transformer而言,引入位置注意力機(jī)制的GRU+Trendformer在RMSE、MAE和MAPE指標(biāo)方面分別降低了0.94、1.21和2.85百分點(diǎn)。GRU層能夠捕捉時(shí)間依賴,Trendformer層可以捕捉長期時(shí)間依賴,引入帶有Trendformer層的門控遞歸神經(jīng)網(wǎng)絡(luò)的ST-PAGNN可以更好地捕捉交通流序列在時(shí)間維度上的局部和全局信息,從而使得交通流預(yù)測(cè)效果得以提升。
為了測(cè)試不同基線和模型的整體性能,本文測(cè)試了Trendformer在RMSE、MAE和MAPE三種指標(biāo)上的精度,表7為各模型在PEMS-BAY數(shù)據(jù)集上對(duì)60 min時(shí)間步長的預(yù)測(cè)結(jié)果。LSTM相對(duì)比VAR和SVR等傳統(tǒng)的機(jī)器學(xué)習(xí)算法,取得了良好的效果,這說明LSTM給本文的模型提供了時(shí)空相關(guān)性。與改進(jìn)的Trendformer相對(duì)比,Transformer在RMSE、MAE和MAPE三個(gè)指標(biāo)上,分別下降了2.11%,2.99%和1.59%,這說明Trendformer相比Transformer能夠提供時(shí)空自適應(yīng)學(xué)習(xí)以更好地捕獲數(shù)據(jù)的時(shí)空相關(guān)性。另外對(duì)ST-PAGNN各個(gè)組成部分進(jìn)行消融實(shí)驗(yàn),對(duì)于S-GNN+GRN和Trendformer而言,ST-PAGNN在RMSE、MAE和MAPE指標(biāo)上降低了0.80,0.98,6百分點(diǎn)和0.50,1.30和4.71百分點(diǎn)。當(dāng)結(jié)合三種算法的時(shí)候,三個(gè)指標(biāo)的誤差都有所下降。這驗(yàn)證了Trendformer能夠很好地捕捉交通數(shù)據(jù)的時(shí)空相關(guān)性,同時(shí)在交流預(yù)測(cè)任務(wù)中具有普遍的實(shí)用性和有效性。
4 結(jié)束語
雖然目前已有一些關(guān)于預(yù)測(cè)未來交通流量的研究,但其中大多數(shù)研究在建立空間和時(shí)間依賴關(guān)系模型方面存在一定的局限性。因此,提出了一種新的時(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò)框架來解決交通流預(yù)測(cè)問題。通過實(shí)驗(yàn)驗(yàn)證了所提方法的有效性。通過以上分析和描述,可以得出以下結(jié)論:a)如果圖神經(jīng)網(wǎng)絡(luò)帶有位置注意力機(jī)制,那么據(jù)此能夠?qū)Τ鞘械缆肪W(wǎng)絡(luò)中交通節(jié)點(diǎn)的空間依賴關(guān)系進(jìn)行捕捉;b)利用帶有轉(zhuǎn)換層的門控遞歸神經(jīng)網(wǎng)絡(luò)可以捕捉交通流序列在時(shí)間維度上的局部和全局信息。這有效證明了所提框架在解決交通預(yù)測(cè)問題方面的有效性和優(yōu)越性。
然而,交通網(wǎng)絡(luò)與其他類型的網(wǎng)絡(luò)在結(jié)構(gòu)和動(dòng)態(tài)特性上存在許多差異。因此,直接將該模型應(yīng)用于其他網(wǎng)絡(luò)結(jié)構(gòu)或應(yīng)用場(chǎng)景是不夠嚴(yán)謹(jǐn)?shù)?。為了更好地理解和利用這種時(shí)空模型,未來將在進(jìn)一步分析不同網(wǎng)絡(luò)的特征和動(dòng)態(tài)的基礎(chǔ)上,嘗試將其優(yōu)勢(shì)應(yīng)用于對(duì)社交網(wǎng)絡(luò)的分析和預(yù)測(cè)任務(wù)中。
參考文獻(xiàn):
[1]周楚昊, 林培群. 基于多通道Transformer的交通量預(yù)測(cè)方法[J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40(2): 435-439. (Zhou Chuhao, Lin Peiqun. Traffic flow prediction method based on multi-channel Transformer[J]. Application Research of Computers, 2023, 40(2): 435-439.)
[2]Li Mengzhang, Zhu Zhanxing. Spatial-temporal fusion graph neural networks for traffic flow forecasting[C]// Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2021: 4189-4196.
[3]劉衛(wèi)明, 羅全成, 毛伊敏, 等. 基于Spark和AMPSO的并行深度卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化算法[J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40(10): 2957-2966. (Liu Weiming, Luo Quancheng, Mao Yimin,et al. Pa-rallel deep convolutional neural network optimization algorithm based on Spark and AMPSO[J]. Application Research of Computers, 2023, 40(10): 2957-2966.)
[4]Wang Haoxiang, Smys S. Big data analysis and perturbation using data mining algorithm[J]. Journal of Soft Computing Paradigm, 2021, 3(1): 19-28.
[5]劉起東, 劉超越, 邱紫鑫, 等. 基于時(shí)間感知Transformer的交通流預(yù)測(cè)方法[J]. 計(jì)算機(jī)科學(xué), 2023, 50(11): 88-96. (Liu Qidong, Liu Chaoyue, Qiu Zixin,et al. Time-aware Transformer for traffic flow forecasting [J]. Computer Science, 2023, 50(11): 88-96.)
[6]Shu Wanneng, Cai Ken, Xiong N N. A short-term traffic flow prediction model based on an improved gate recurrent unit neural network[J]. IEEE Trans on Intelligent Transportation Systems, 2021, 23(9): 16654-16665.
[7]Ma Xiaolei, Dai Zhuang, He Zhengbing,et al. Learning traffic as ima-ges: a deep convolutional neural network for large-scale transportation network speed prediction[J]. Sensors, 2017, 17(4): 818.
[8]Fu Rui, Zhang Zuo, Li Li. Using LSTM and GRU neural network methods for traffic flow prediction[C]// Proc of the 31st Youth Academic Annual Conference of Chinese Association of Automation. Piscataway, NJ: IEEE Press, 2016: 324-328.
[9]Li Chensheng, Qin Xiaowei, Xu Xiaodong,et al. Scalable graph convolutional networks with fast localized spectral filter for directed graphs[J]. IEEE Access, 2020, 8: 105634-105644.
[10]Liu Yanbei, Wang Qi, Wang Xiao,et al. Community enhanced graph convolutional networks[J]. Pattern Recognition Letters, 2020, 138: 462-468.
[11]Yu Bing, Yin Haoteng, Zhu Zhanxing. Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting[C]// Proc of the 27th International Joint Conference on Artificial Intelligence. [S.l.]: International Joint Conferences on Artificial Intelligence Organization, 2017: 3634-3640.
[12]Guo Shengnan, Lin Youfang, Feng Ning,et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[C]// Proc of the 33rd AAAI Conference on Artificial Intelligence and the 31st Innovative Applications of Artificial Intelligence Confe-rence and the 9th AAAI Symposium on Educational Advances in Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 922-929.
[13]Zhao Ling, Song Yujiao, Zhang Chao,et al. T-GCN: a temporal graph convolutional network for traffic prediction [J]. IEEE Trans on Intelligent Transportation Systems, 2020, 21(9): 3848-3858.
[14]Seo Y, Defferrard M, Vandergheynst P,et al. Structured sequence modeling with graph convolutional recurrent networks[M]// Cheng Long, Leung A C S, Ozawa S. Neural Information Processing. Cham: Springer International Publishing, 2018: 362-373.
[15]Wang Yunbo, Long Mingsheng, Wang Jianmin,et al. PredRNN: recurrent neural networks for predictive learning using spatiotemporal LSTMs[C]// Proc of the 31st International Conference on Neural Information Processing Systems. Red Hook, NY: Curran Associates Inc., 2017: 879-888.
[16]倪慶劍, 彭文強(qiáng), 張志政, 等. 基于信息增強(qiáng)傳輸?shù)臅r(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò)交通流預(yù)測(cè)[J]. 計(jì)算機(jī)研究與發(fā)展, 2022, 59(2): 282-293. (Ni Qingjian, Peng Wenqiang, Zhang Zhizheng,et al. Spatial-temporal graph neural network for traffic flow prediction based on information enhanced transmission[J]. Journal of Computer Research and Development, 2022, 59(2): 282-293.)
[17]Li Cong, Xu Pei. Application on traffic flow prediction of machine learning in intelligent transportation[J]. Neural Computing and Applications, 2021, 33(2): 613-624.
[18]Toan T D, Truong V H. Support vector machine for short-term traffic flow prediction and improvement of its model training using nearest neighbor approach[J]. Transportation Research Record, 2021, 2675(4): 362-373.
[19]Hao Miao, Shen Jiaxing, Cao Jiannong,et al. MBA-STNet: Bayes-enhanced discriminative multi-task learning for flow prediction[J]. IEEE Trans on Knowledge and Data Engineering, 2023, 35(7): 7164-7177.
[20]Peng Jiaxin, Xu Yongneng, Wu Menghui. Short-term traffic flow forecast based on ARIMA-SVM combined model[M]// Wang Wuhong, Wu Jianping, Jiang Xiaobei,et al. Green Transportation and Low Carbon Mobility Safety. International Conference on Green Intelligent Transportation System and Safety. Singapore: Springer Nature Singapore, 2021: 287-300.
[21]Kashyap A A, Raviraj S, Devarakonda A,et al. Traffic flow prediction models–a review of deep learning techniques[J]. Cogent Engineering, 2022, 9(1): 2010510.
[22]Qu Zhaowei, Li Haitao, Li Zhihui,et al. Short-term traffic flow forecasting method with M-B-LSTM hybrid network[J]. IEEE Trans on Intelligent Transportation Systems, 2020, 23(1): 225-235.
[23]Zheng Haifeng, Lin Feng, Feng Xinxin,et al. A hybrid deep learning model with attention-based conv-LSTM networks for short-term traffic flow prediction[J]. IEEE Trans on Intelligent Transportation Systems, 2020, 22(11): 6910-6920.
[24]Han Xu, Gong Shicai. LST-GCN: long short-term memory embedded graph convolution network for traffic flow forecasting[J]. Electro-nics, 2022, 11(14): 2230.
[25]Liu Daoguang, Hui Shen, Li Li,et al. A method for short-term traffic flow forecasting based on GCN-LSTM[C]// Proc of International Conference on Computer Vision, Image and Deep Learning. Pisca-taway, NJ: IEEE Press, 2020: 364-368.
[26]Chauhan N S, Kumar N. Traffic flow forecasting using attention enabled Bi-LSTM and GRU hybrid model[C]// Proc of International Conference on Neural Information Processing. Singapore: Springer Nature Singapore, 2022: 505-517.
[27]Huang Lei, Zhu Feng, Li Zhiheng. Trendformer: trend adaptive transformer for traffic flow prediction[C]// Proc of the 5th International Conference on Data Science and Information Technology. Piscataway, NJ: IEEE Press, 2022: 1-6.
[28]Wang Chunzhi, Wang Lu, Wei Siwei,et al. STN-GCN: spatial and temporal normalization graph convolutional neural networks for traffic flow forecasting[J]. Electronics, 2023, 12(14): 3158.
[29]賀文武, 裴博彧, 毛國君, 等. 基于輕量時(shí)空?qǐng)D卷積模型的路網(wǎng)交通流預(yù)測(cè)[J]. 鐵道科學(xué)與工程學(xué)報(bào), 2022, 19(9): 2552-2562. (He Wenwu, Pei Boyu, Mao Guojun,et al. Traffic flow forecasting based on lightweight spatial-temporal graph convolution networks model[J]. Journal of Railway Science & Engineering, 2022, 19(9): 2552-2562.)
[30]Smith L N. Cyclical learning rates for training neural networks [C]// Proc of IEEE Winter Conference on Applications of Computer Vision. Piscataway, NJ: IEEE Press, 2017: 464-472.
[31]Yuan Lilian, Fang Weilin, Xiao Hongbo,et al. Short-term traffic flow prediction by graph deep learning with spatial temporal modeling[C]// Proc of the 2nd International Conference on Electronic Information Technology and Smart Agriculture. Piscataway, NJ: IEEE Press, 2022: 172-177.
[32]Wang Luxuan, Bai Lei, Li Ziyue,et al. Correlated time series self-supervised representation learning via spatiotemporal bootstrapping[C]// Proc of the 19th International Conference on Automation Science and Engineering. Piscataway, NJ: IEEE Press, 2023: 1-7.
[33]Bai Lei, Yao Lina, Li Can,et al. Adaptive graph convolutional recurrent network for traffic forecasting[C]// Proc of the 34th International Conference on Neural Information Processing Systems. Red Hook, NY: Curran Associates Inc., 2020: 17804-17815.