董成祥,魏 昕,張坤鵬,汪永超
(1.廣東工業(yè)大學(xué) 機(jī)電工程學(xué)院,廣東 廣州,510006;2.河南工業(yè)大學(xué) 電氣工程學(xué)院,河南 鄭州,450001;3.廣州番禺職業(yè)技術(shù)學(xué)院 智能制造學(xué)院,廣東 廣州,511483)
對于大規(guī)模路網(wǎng),準(zhǔn)確的交通流量預(yù)測能夠為出行者提供有效的出行參考,為城市管理者提供制定政策的依據(jù)。然而,相較于路段或者局部區(qū)域的交通流量預(yù)測,大規(guī)模路網(wǎng)的交通流量預(yù)測因其更加復(fù)雜和動態(tài)的時空特征而充滿挑戰(zhàn)。目前,國內(nèi)外研究者對交通流量的預(yù)測方法主要可分為3 類:參數(shù)建模方法、機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法[1]。
對于參數(shù)化建模技術(shù),交通流量預(yù)測問題可被近似看作時間序列預(yù)測問題。因此,可以使用統(tǒng)計學(xué)原理模型進(jìn)行建模。其中,卡爾曼濾波 (Kalman filters, KF) 和自回歸積分滑動平均 (auto-regressive integrated moving average, ARIMA) 是最常用的參數(shù)化建模技術(shù)。Guo 等[2]運(yùn)用KF 對交通流的過程方差進(jìn)行實時建模。Williams 等[3]采用ARIMA 對交通數(shù)據(jù)進(jìn)行建模,實現(xiàn)交通流的準(zhǔn)確預(yù)測。此外,Kumar 等[4]采用有限的交通數(shù)據(jù),建立基于ARIMA的交通流預(yù)測模型。Xie 等[5]通過組合小波離散變化(discrete wavelet transform, DWT) 和卡爾曼濾波建立交通流量預(yù)測模型。然而,這些統(tǒng)計學(xué)理論的參數(shù)化建模技術(shù)是基于交通流的均值和方差始終不變的假設(shè),不能夠準(zhǔn)確地描述交通流的隨機(jī)性和非線性特征[6]。
與參數(shù)化建模技術(shù)相比,機(jī)器學(xué)習(xí)能夠在交通流預(yù)測中表現(xiàn)出更好的性能。最常用的機(jī)器學(xué)習(xí)方法包括支持向量機(jī) (support vector machine, SVM) ,k最近鄰 (k-nearest neighbors,k-NN) 和人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)。Yu 等[7]運(yùn)用k-NN 建立交通流量短期預(yù)測模型。Yang 等[8]采用SVM 實現(xiàn)交通流量的短期預(yù)測。Sharma 等[9]利用反向傳播ANN 預(yù)測混合交通條件下的雙車道不分叉公路的交通流量。然而,這些機(jī)器學(xué)習(xí)方法受限于簡單的自身結(jié)構(gòu),往往不能有效地捕捉路網(wǎng)層面上交通流量的時空特征。
近年來,隨著計算機(jī)計算能力的不斷提高和不斷豐富的數(shù)據(jù)源,深度學(xué)習(xí)技術(shù)已經(jīng)成功地應(yīng)用于交通預(yù)測領(lǐng)域。它能夠捕獲復(fù)雜、動態(tài)的交通流量的時間和空間特征。為了挖掘交通流的時間特征,循環(huán)神經(jīng)網(wǎng)絡(luò) (recurrent neural network, RNN) 及其變體 (long short-term memory, LSTM;gated recurrent unit, GRU) 被廣泛應(yīng)用。Yang 等[10]利用LSTM 建立交通流預(yù)測模型,并且在注意力機(jī)制的幫助下實現(xiàn)捕捉較長序列交通流的時間特征。Dai 等[11]基于GRU 提出交通流短期預(yù)測模型。盡管這些基于RNN 的模型能夠有效地捕捉歷史交通流數(shù)據(jù)的時間特征,但是他們往往忽視了路網(wǎng)層面的空間特征。
為了考慮路網(wǎng)層面的空間特征,基于卷積神經(jīng)網(wǎng)絡(luò) (convolutional neural network, CNN) 的深度學(xué)習(xí)模型被廣泛應(yīng)用在交通預(yù)測中。例如,Chen 等[12]建立一個多時空三維CNN 結(jié)構(gòu)模型 (multiple spatialtemporal three-dimensional CNNs, MST3D) 挖掘交通數(shù)據(jù)的時空特征。Zheng 等[13]基于CNN 建立一個深度嵌入的學(xué)習(xí)模型,該模型能夠從細(xì)粒度的交通信息中捕捉時空特征。此外,為了在路網(wǎng)層面充分考慮交通流的時間和空間特征,研究者經(jīng)常將CNN和RNN 模型結(jié)合起來運(yùn)用。例如,Cheng 等[14]通過將CNN 和RNN 結(jié)合起來從交通信息中捕獲時空特征。Du 等[15]提出一種用于交通流預(yù)測的混合多模態(tài)深度學(xué)習(xí)方法,其中采用CNN 捕捉空間特征,并采用具有注意力機(jī)制的GRU 單元捕捉時間特征。然而,這些基于CNN 的深度學(xué)習(xí)方法只適用于具有標(biāo)準(zhǔn)網(wǎng)格結(jié)構(gòu)的數(shù)據(jù),對于復(fù)雜的拓?fù)浣Y(jié)構(gòu)的路網(wǎng)并不適用[16]。
最近,以圖卷積神經(jīng)網(wǎng)絡(luò) (graph convolutional network, GCN) 為代表的深度學(xué)習(xí)方法在解決具有拓?fù)渚W(wǎng)絡(luò)結(jié)構(gòu)的問題中表現(xiàn)出強(qiáng)大的能力[17]。在交通領(lǐng)域,研究者采用GCN 模型挖掘路網(wǎng)的空間特征。例如,Zhao 等[18]采用GCN 挖掘路網(wǎng)的空間特征。Wu 等[19]提出一個圖形波浪網(wǎng)絡(luò)模型 (graph waveNet) ,該模型能夠挖掘交通數(shù)據(jù)中隱藏的空間特征。此外,為了同時獲取時間特征,GCN 與RNN 的混合網(wǎng)絡(luò)結(jié)構(gòu)能夠同時獲取路網(wǎng)的時空特征。例如,Li等[20]通過將GCN 和LSTM 組合在一起,實現(xiàn)了同時獲取路網(wǎng)的時間與空間特征?;贕RU 和GCN,Wang 等[16]構(gòu)建時空圖卷積網(wǎng)絡(luò) (spatiotemporal graph convolutional network, ST-GCN),實現(xiàn)更準(zhǔn)確的交通流量預(yù)測。然而,盡管這些基于GNN 的模型可以通過與RNN (即LSTM 和GRU) 結(jié)合來捕獲時間特征,但由于梯度消失和爆炸問題的限制,它們不足以捕獲交通流量長期的時間特征[21-22]。
為了解決上述問題,本文提出基于Graph Transformer 的大規(guī)模路網(wǎng)的交通流預(yù)測模型。在多頭注意力的幫助下,Transformer 能夠有效地學(xué)習(xí)交通流的長期時間依賴特征,通過組合GRU、GNN 和Transformer,建立一個端到端的深度學(xué)習(xí)框架,實現(xiàn)大規(guī)模路網(wǎng)的多預(yù)測范圍的交通流量預(yù)測。
交通流量預(yù)測的本質(zhì)是根據(jù)歷史交通流量預(yù)測未來的交通流量。因此,預(yù)測模型的輸入是大規(guī)模路的歷史交通流數(shù)據(jù),可定義矩陣X為
矩陣X作為模型的輸入,模型的預(yù)測值可用矩陣Y? 表示,其表達(dá)式為
式 (2) 所對應(yīng)的交通流量真實值可用矩陣Y表示。
預(yù)測模型的流程圖如圖1 所示。首先,從源數(shù)據(jù)中提取路網(wǎng)的歷史交通流數(shù)據(jù)和路網(wǎng)的物理結(jié)構(gòu),并將路網(wǎng)中各個傳感器的歷史交通流數(shù)據(jù)和它們在路網(wǎng)中的相互關(guān)系表示為交通圖G=(V,E) 。其中,V表示節(jié)點(diǎn) (即傳感器) 的特征集合;E表示相互聯(lián)系的節(jié)點(diǎn)之間的邊的集合。由于從源數(shù)據(jù)中提取的歷史交通流量的量綱不同,為了提高預(yù)測模型的穩(wěn)定性,需對歷史交通流數(shù)據(jù)進(jìn)行歸一化處理,本文采用最小-最大歸一化方法 (min-max normalization method:x=(x-min)/(max-min) ),通過歸一化處理,交通流數(shù)據(jù)的大小范圍在[0,1]之間。交通圖作為預(yù)測模型的輸入,可被劃分為3 個部分:70%作為訓(xùn)練集,10%作為驗證集,余下的20%作為測試集。其中,訓(xùn)練集和驗證集被用來訓(xùn)練和驗證模型,測試集被用來預(yù)測交通流量。
圖1 模型流程圖Figure 1 The flow chart of the proposed model
圖2 是預(yù)測模型的結(jié)構(gòu)示意圖。由于未來交通流量與歷史交通流量在時間上最具相關(guān)性,因此,從源數(shù)據(jù)中提取的歷史交通流數(shù)據(jù)首先經(jīng)過GRU單元處理,充分挖掘路網(wǎng)中歷史交通流量的時間特征。然后,由經(jīng)過GRU 處理的交通流特征和路網(wǎng)的物理結(jié)構(gòu)組成的邊所構(gòu)建的交通圖作為Graph Transformer 模塊的輸入,并經(jīng)過激活函數(shù)Leaky-ReLU,再次傳遞給Graph Transformer 模塊,目的是充分挖掘交通圖的時空特征。其輸出經(jīng)過一個批量標(biāo)準(zhǔn)化層處理,以提高模型的穩(wěn)定性。經(jīng)過處理的特征傳給Transformer 編碼器模塊再次進(jìn)行時空特征的挖掘,最后經(jīng)過兩個全連接層處理,實現(xiàn)大規(guī)模路網(wǎng)的交通流預(yù)測。
圖2 模型框架Figure 2 The framework of the proposed model
2.2.1 GRU 模塊
未來交通流與歷史交通流在時間上具有極大的相關(guān)性,為了發(fā)掘歷史交通流的時間特征,GRU 單元被用來處理路網(wǎng)中的歷史交通流信息,其內(nèi)部結(jié)構(gòu)示意圖如圖3 所示。
圖3 GRU 單元內(nèi)部結(jié)構(gòu)示意圖Figure 3 The inner structure of a GRU unit
GRU 單元的當(dāng)前輸入包含兩部分:當(dāng)前的輸入it,前一個節(jié)點(diǎn)的隱層狀態(tài)ht-1。當(dāng)前時間的輸入經(jīng)過GRU 單元處理后,輸出當(dāng)前節(jié)點(diǎn)的隱層狀態(tài)ht和當(dāng)前節(jié)點(diǎn)的狀態(tài)Ot。GRU 單元的關(guān)鍵數(shù)學(xué)表達(dá)式如 (4) ~ (7)所示。
其 中,rt是 重 置 門,由it和ht-1決 定;zt是 更 新門;h?t表示隱藏門;W*(Whr,Wir,Whz,Wiz,Ws,Wi)和b*(br,bz,bs) 分 別 是 可 被 模 型 學(xué) 習(xí) 的 權(quán) 重 和 偏差; σ 是激活函數(shù);符號“ ⊙ ”表示矩陣運(yùn)算 (hadamard product)。
2.2.2 交通圖
由GRU 模塊處理的歷史交通流特征和節(jié)點(diǎn)在路網(wǎng)中的連接關(guān)系共同組成的交通圖G={V,E} 構(gòu)成了Graph Transformed 模塊的輸入。然而,交通圖可分為無向圖、有向圖及帶自循環(huán)的無向圖3 種類型?,F(xiàn)實中一條道路的交通流會同時影響路段上游和下游的交通流量,且節(jié)點(diǎn)自身的交通流對預(yù)測未來交通流最具參考價值。因此,本文選取帶節(jié)點(diǎn)自循環(huán)的無向圖作為模型的輸入。如圖4 所示,以傳感 器s1、s2和s3為 例,節(jié) 點(diǎn)s1、s2和s3中 包 含 了 歷 史交通流數(shù)據(jù)特征,三者之間的連接關(guān)系可用一個二維矩陣表示。
圖4 交通圖Figure 4 The traffic graph
具體來說,輸入到Graph Transformer 模塊的節(jié)點(diǎn)集V的維度為 (B,N,T,F) ,其中,B為輸入到模塊的數(shù)據(jù)批量大??;N為路網(wǎng)中安裝的傳感器總數(shù)量;T為歷史觀測時間;F為交通流的特征數(shù)。由圖4 可知,邊E的維度為 (2,M),其中,數(shù)字2 代表兩個相互連接的節(jié)點(diǎn);M表示交通圖中邊的數(shù)量。
2.2.3 Graph Transformer 模塊
作為預(yù)測模型的關(guān)鍵組成部分,Graph Transformer 模塊被用來挖掘交通圖的時空特征。多頭注意力在Graph Transformer 中被用來執(zhí)行交通圖中的邊特征學(xué)習(xí),如圖5 所示。其原理如下。
圖5 Graph Transformer 的內(nèi)部結(jié)構(gòu)示意圖Figure 5 The inner structure of Graph Transformer
所示。
其中, || 表示C 頭注意力的連接操作。多頭注意力矩陣取代了GCN 的原始?xì)w一化鄰接矩陣作為信息傳遞的過渡矩陣。特征fj被轉(zhuǎn)換為vc,j∈Rd的加權(quán)和。與GAT 類似,如果采用圖形變換器作為最后一個輸出層,多頭輸出被平均化,非線性變換被去除,如式(14)、(15)所示。
2.2.4 Transformer Encoder 模塊及輸出
如圖2 所示,經(jīng)過批量標(biāo)準(zhǔn)化層處理的隱層特征,作為Transformer Encoder 模塊的輸入進(jìn)行更深層次的時空特征挖掘。在該模塊中,多頭注意力作為重要組成部分被用來挖掘交通圖中的邊特征的時空特征。由Transformer Encoder 輸出的隱層特征被引入到兩個線性連接層,其中,兩個線性連接層之間采用LeakyReLU 函數(shù)作為激活函數(shù)。最后的線性連接層的輸出即為模型的預(yù)測值,其維度為(B,N,L,F)。其中,B為模型輸出的批量大??;N是傳感器數(shù)量;L是模型預(yù)測的時間范圍;F是交通流特征。
為了驗證所建立模型的性能,選擇加州交通局性能測量系統(tǒng) (Caltrans' performance measurement system, PeMS) 數(shù)據(jù)集。該數(shù)據(jù)集包含了部署在加州高速公路系統(tǒng)中的15 000 個獨(dú)立探測器的實時交通數(shù)據(jù)。如圖6 所示,白色節(jié)點(diǎn)代表部署在高速公路系統(tǒng)中的數(shù)據(jù)收集傳感器。它包含了1 906 個交通測量傳感器在2018 年的251 d 內(nèi)的交通流量,每隔5 min 匯總交通流量作為一個時間間隔內(nèi)的交通流量。該數(shù)據(jù)集被分為3 部分:70%的數(shù)據(jù)被作為訓(xùn)練數(shù)據(jù)集;10%作為驗證數(shù)據(jù)集;其余20%為測試數(shù)據(jù)集。
圖6 研究區(qū)域Figure 6 The studied area
為了定量地評估模型的預(yù)測精度,引入3 個常用誤差評價指標(biāo):均方根誤差 (root mean square error,RMSE) 、平均絕對誤差 (mean absolute error, MAE)和平均絕對百分比誤差 (mean absolute percentage error, MAPE),表達(dá)式分別為
在進(jìn)行模型訓(xùn)練時,需要對模型的超參數(shù)進(jìn)行設(shè)置。模型的學(xué)習(xí)率設(shè)置為lr=0.000 1 ,訓(xùn)練批次大小設(shè)置為B=64 。對于Transformer 模塊中的多頭注意力的頭數(shù)均設(shè)置為2,隨機(jī)失活率設(shè)置為dropout =0.3。在訓(xùn)練過程中,選取MSE (mean squared error)作為模型訓(xùn)練的損失函數(shù),選取Adam 作為優(yōu)化器。
為了保證實驗的公正比較,本研究中所進(jìn)行的數(shù)值實驗均在同一臺工作站中開展,其主要配置包含一顆Core i5-11400F 中央處理器,32 GB 內(nèi)存和NVIDIA GeForce RTX 3060 圖形處理器。利用包括Scikit-learn 和Pytorch 在內(nèi)的Python 庫來開發(fā)上述模型。
本節(jié)引入6 種模型與所建立的預(yù)測模型進(jìn)行對比,所有的對比實驗均在PeMS 數(shù)據(jù)集上進(jìn)行。
1)k-NN:k-NN 是一種非參數(shù)數(shù)據(jù)驅(qū)動的分類和回歸方法。它可以計算當(dāng)前交通模式與k個歷史交通模式的相似度。本節(jié)中運(yùn)用k-NN 進(jìn)行交通流預(yù)測,其中選取k=5 。
2) SVM:SVM 是一種有監(jiān)督機(jī)器學(xué)習(xí)方法,被廣泛應(yīng)用于圖像分類、交通預(yù)測等領(lǐng)域。根據(jù)結(jié)構(gòu)風(fēng)險最小化原則,SVM 可以處理非線性和高維的問題和凸二次規(guī)劃。本節(jié)中采用SVM 預(yù)測交通流量,受模型自身結(jié)構(gòu)限制而不考慮節(jié)點(diǎn)間的連接關(guān)系。
3) LSTM:LSTM 是一種改進(jìn)后的循環(huán)神經(jīng)網(wǎng)絡(luò),它能夠避免RNN 模型在處理長期依賴問題中普遍存在的梯度消失或爆炸問題。它能夠有效地捕捉時間序列問題的時間特征,本節(jié)引入LSTM 作為對比模型,預(yù)測交通流量問題。其中,設(shè)置訓(xùn)練批次大小B= 64;歷史觀測時間T= 10;學(xué)習(xí)率取0.000 1。
4) GRU:GRU 是LSTM 的一種變體,它擁有比LSTM 更簡單的結(jié)構(gòu),更少的參數(shù),實現(xiàn)的功能類似。本節(jié)引入GRU 作為對比模型,預(yù)測交通流量問題,模型的超參數(shù)設(shè)置與LSTM 保持一致。
5) GAT-ConvGRU:它將GAT 模塊和ConvGRU模塊集成,成功應(yīng)用于預(yù)測多區(qū)域、多步長的乘客打車需求預(yù)測[23]。本文選取該模型進(jìn)行大規(guī)模路網(wǎng)的交通流預(yù)測問題,其中,訓(xùn)練批次大小B= 64;歷史觀測時間T= 10;學(xué)習(xí)率取0.000 1。
6) GCN-ConvGRU:該模型與GAT-ConvGRU相似,不同之處在于將GAT 模塊替換為GCN 模塊。其作為對比模型,超參數(shù)設(shè)置與GAT-ConvGRU 相同。
本文所建立的預(yù)測模型與6 種對比模型的預(yù)測性能對比如表1 所示。對比實驗均在同一PeMS 高速公路數(shù)據(jù)集上開展,預(yù)測時間范圍包含5 min、15 min和30 min。從表1 可知,本文所建立的預(yù)測模型在均方根誤差 (RMSE) 、平均絕對誤差 (MAE) 和平均絕對百分比誤差 (MAPE) 3 種誤差評定指標(biāo)中均最小,充分顯示了該預(yù)測模型針對大規(guī)模路網(wǎng)的交通流量預(yù)測的優(yōu)異性能。對于傳統(tǒng)的機(jī)器學(xué)習(xí)模型k-NN 和SVM,其建模能力受自身結(jié)構(gòu)的限制,很難從大規(guī)模路網(wǎng)中高度復(fù)雜和隨機(jī)的交通流量中充分挖掘有效的時空特征,因此,預(yù)測性能相較于深度學(xué)習(xí)模型較差。對于經(jīng)典的深度學(xué)習(xí)模型GRU 和LSTM,其預(yù)測誤差明顯低于傳統(tǒng)的機(jī)器學(xué)習(xí)模型k-NN 和SVM,這是因為GRU 和LSTM 能夠從大量的歷史交通流量中充分發(fā)掘交通流的時間特征,這對預(yù)測未來的交通流量至關(guān)重要。然而,GRU和LSTM 缺乏挖掘大規(guī)模路網(wǎng)交通流的空間特征的能力?;趫D神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)預(yù)測模型GCNConvGRU 和GAT-ConvGRU 通過將大規(guī)模路網(wǎng)的交通流量構(gòu)建成交通圖的形式,并且通過與GRU和LSTM 組合的深度學(xué)習(xí)混合框架,能夠充分發(fā)掘大規(guī)模路網(wǎng)中交通流量的時空特征,其預(yù)測性能優(yōu)于傳統(tǒng)的深度學(xué)習(xí)模型。
表1 預(yù)測模型與對比模型在多個預(yù)測范圍內(nèi)的性能對比Table 1 Performance comparison among the proposed model and baseline models over multiple prediction horizons
通過隨機(jī)選取路網(wǎng)中的一個傳感器,對本文所建立的預(yù)測模型在多時間預(yù)測范圍的預(yù)測效果進(jìn)行了可視化,如圖7 所示。由圖7 可知,在5 min 和15 min 預(yù)測范圍內(nèi),預(yù)測值與真實值吻合良好,在30 min 預(yù)測范圍內(nèi),真實值與預(yù)測值略有偏差。這是因為模型的預(yù)測誤差隨著預(yù)測范圍的不斷增加而增大。
圖7 模型在多個預(yù)測范圍內(nèi)的交通流量預(yù)測Figure 7 Traffic flow prediction of the proposed model over multiple prediction horizons
在對未來交通流量進(jìn)行預(yù)測時,歷史觀測時間作為預(yù)測模型的輸入起到關(guān)鍵作用。合適的歷史觀測時間能夠使模型充分發(fā)掘交通流量的時空特征而提高模型的預(yù)測精度。為了選取合適的歷史觀測時間,分別選取歷史觀測時間從1 增加到16 進(jìn)行對比分析,如圖8 所示。當(dāng)歷史觀測時間為10 時,模型的RMSE 誤差最小。歷史觀測時間從1 增加到10 時,模型的預(yù)測誤差逐漸減小,這是因為隨著歷史觀測的增加,模型能夠挖掘到更多的時空特征,有利于預(yù)測精度的提高。然而,當(dāng)歷史觀測時間從10 增加到16 時,模型的預(yù)測精度逐漸降低,說明過多的歷史觀測值不利于模型預(yù)測精度的提高。因此,選取10 作為模型的歷史觀測時間。
圖8 歷史觀測時間對比Figure 8 Comparisons of historical observation time
對于預(yù)測模型的輸入,選取合適的數(shù)據(jù)批量大小,能夠使模型表現(xiàn)出最佳的預(yù)測性能。針對5 種常用的批量大小 (Batch size: 8, 16, 32, 64, 128) 做了對比分析,如圖9 所示。當(dāng)批量大小Batchsize = 64時,模型表現(xiàn)出最小的預(yù)測誤差。
圖9 Batch size 對比Figure 9 Comparisons of batch sizes
同時,圖10 顯示了模型的收斂情況。在前20個迭代過程中,模型的驗證誤差RMSE 迅速下降,這表明模型的收斂速度較快。當(dāng)?shù)^程達(dá)到180之后,模型的驗證誤差有上升趨勢,這說明模型的迭代次數(shù)達(dá)到180 時可以停止訓(xùn)練。
圖10 模型的收斂性Figure 10 Convergence of the proposed model
基于Graph Transformer 建立交通流量預(yù)測模型能夠?qū)崿F(xiàn)大規(guī)模路網(wǎng)的交通流量在多時間預(yù)測范圍內(nèi)的準(zhǔn)確預(yù)測。通過有效地組合GRU、GNN 和Transformer 而建立的深度學(xué)習(xí)預(yù)測模型,能夠充分挖掘大規(guī)模路網(wǎng)中極其復(fù)雜、隨機(jī)的交通流量的時空特征。在PeMS 數(shù)據(jù)集上進(jìn)行的對比實驗表明,本文所建立的預(yù)測模型表現(xiàn)出最佳性能。該模型的優(yōu)點(diǎn)可歸結(jié)為以下幾點(diǎn):1) 基于大規(guī)模路網(wǎng)的交通流量數(shù)據(jù)和路網(wǎng)結(jié)構(gòu)而構(gòu)建的交通圖,有利于模型更加準(zhǔn)確地挖掘大規(guī)模路網(wǎng)中交通流量的時空特征;2) 通過引入Transformer 模塊,使得模型能夠挖掘交通流數(shù)據(jù)的長期依賴性,有利于模型預(yù)測性能的提高;3) 基于PeMS 高速公路數(shù)據(jù)集,通過與經(jīng)典的預(yù)測模型進(jìn)行對比分析,驗證了本文所提出的預(yù)測模型的先進(jìn)性能。