摘 要:針對(duì)交通速度預(yù)測(cè)方法主要考慮實(shí)際交通路網(wǎng)而忽略人群活動(dòng)熱點(diǎn)區(qū)域的影響問(wèn)題,提出一種層次時(shí)空?qǐng)D卷積網(wǎng)絡(luò)模型(hierarchical spatio-temporal graph convolutional network, H-STGCN)。首先,通過(guò)計(jì)算路段節(jié)點(diǎn)之間的距離構(gòu)建路網(wǎng)結(jié)構(gòu)圖,并使用聚類(lèi)算法得到熱點(diǎn)區(qū)域的聚類(lèi)圖;其次,利用圖卷積網(wǎng)絡(luò)層和時(shí)空注意力機(jī)制層來(lái)提取交通速度數(shù)據(jù)的時(shí)空特征;最后,引入過(guò)往鄰近時(shí)間段、昨天相同時(shí)間段及上周同一時(shí)間段3個(gè)時(shí)間分量的交通速度數(shù)據(jù)分別進(jìn)行訓(xùn)練,以挖掘交通速度在相同時(shí)間段的規(guī)律。實(shí)驗(yàn)結(jié)果表明,模型在預(yù)測(cè)時(shí)長(zhǎng)為30、60和120 min時(shí),相比于經(jīng)典的時(shí)空?qǐng)D卷積模型,平均絕對(duì)誤差分別降低了6.9%、13.6%和14.6%,實(shí)現(xiàn)了更準(zhǔn)確的預(yù)測(cè),能更好地服務(wù)于智能交通系統(tǒng)。
關(guān)鍵詞:交通速度預(yù)測(cè);圖卷積;注意力機(jī)制;時(shí)空特征;智能交通系統(tǒng)
中圖分類(lèi)號(hào):U491.14;U491.2 DOI:10.16375/j.cnki.cn45-1395/t.2024.04.012
0 引言
為了緩解交通擁堵,提高人們出行的舒適度,許多國(guó)家開(kāi)始研究智能交通系統(tǒng)(intelligent traffic system, ITS)[1]。在智能交通系統(tǒng)中,交通速度預(yù)測(cè)是一個(gè)非常重要的問(wèn)題。現(xiàn)有的交通速度預(yù)測(cè)方法主要分為3類(lèi):基于統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的預(yù)測(cè)方法。在基于統(tǒng)計(jì)分析的預(yù)測(cè)方法中,具有代表性的有歷史平均值法(history average, HA)[2]、卡爾曼濾波模型[3-5]及ARIMA(autoregressive integrated moving average)模型及其變形[6]。文獻(xiàn)[7]提出一種基于無(wú)跡卡爾曼濾波的交通預(yù)測(cè)模型,預(yù)測(cè)精度較高且比較穩(wěn)定,然而其計(jì)算代價(jià)相當(dāng)高;實(shí)驗(yàn)表明ARIMA模型在交通狀態(tài)周期性變化較強(qiáng)時(shí),預(yù)測(cè)效果比較好,但面對(duì)非平穩(wěn)的交通數(shù)據(jù)時(shí),預(yù)測(cè)準(zhǔn)確性會(huì)大幅降低[8]。
研究表明統(tǒng)計(jì)分析方法在交通狀態(tài)變化周期性較強(qiáng)時(shí),效果較好,但面對(duì)非平穩(wěn)的交通數(shù)據(jù)時(shí),預(yù)測(cè)準(zhǔn)確性會(huì)大幅降低。相較于傳統(tǒng)的統(tǒng)計(jì)分析方法,機(jī)器學(xué)習(xí)方法因其在結(jié)構(gòu)和參數(shù)上的靈活性,使其在處理一些非線(xiàn)性數(shù)據(jù)的問(wèn)題上更加具有優(yōu)勢(shì),典型的代表有支持向量機(jī)(support vector machine, SVM)模型和K近鄰模型(K-nearest neighbor, KNN)等。但基于機(jī)器學(xué)習(xí)的交通速度預(yù)測(cè)方法對(duì)輸入數(shù)據(jù)的質(zhì)量非常敏感,在實(shí)際應(yīng)用中需要綜合考慮各種因素。
神經(jīng)網(wǎng)絡(luò)模型具有強(qiáng)大的表示能力,廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理和交通預(yù)測(cè)[9-11]等領(lǐng)域。如典型的遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(long short term memory, LSTM)[12]和門(mén)控遞歸單元(gated recurrent unit, GRU)[13]等。但傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型往往忽略了道路網(wǎng)絡(luò)的自然連接,無(wú)法充分挖掘交通速度數(shù)據(jù)的空間特征[14-15]。圖卷積遞歸網(wǎng)絡(luò)(graph convolution recurrent network, GCRN)[16]和門(mén)控時(shí)空?qǐng)D卷積網(wǎng)絡(luò)[17]通過(guò)將圖卷積網(wǎng)絡(luò)(graph convolution network, GCN)與RNN或門(mén)控CNN相結(jié)合來(lái)解決交通預(yù)測(cè)的序列建模問(wèn)題。然而,這些方法均未能充分挖掘交通數(shù)據(jù)中潛在有價(jià)值的時(shí)空關(guān)系,實(shí)際的預(yù)測(cè)效果相對(duì)較差。
本文基于GCN提出了一種層次時(shí)空?qǐng)D卷積網(wǎng)絡(luò)模型(hierarchical spatio-temporal graph convolutional network, H-STGCN),旨在提高模型對(duì)時(shí)空信息的學(xué)習(xí)能力。具體而言,引入過(guò)往鄰近時(shí)間段、昨天相同時(shí)間段以及上周同一時(shí)間段3個(gè)時(shí)間分量的交通速度數(shù)據(jù)分別進(jìn)行訓(xùn)練,挖掘交通速度在相同時(shí)間段的規(guī)律。通過(guò)計(jì)算路段節(jié)點(diǎn)之間的距離構(gòu)建路網(wǎng)圖,并使用聚類(lèi)算法得到了熱點(diǎn)區(qū)域的聚類(lèi)圖,捕獲交通速度數(shù)據(jù)的空間特征。利用圖卷積網(wǎng)絡(luò)層和時(shí)空注意力機(jī)制層來(lái)提取交通速度數(shù)據(jù)的時(shí)空特征,充分挖掘交通速度數(shù)據(jù)的時(shí)空依賴(lài)關(guān)系。最后,將3個(gè)時(shí)間分量的輸出進(jìn)行合并,并進(jìn)行預(yù)測(cè)。
1 算法構(gòu)建
1.1 問(wèn)題描述
交通預(yù)測(cè)可以被視為一個(gè)函數(shù),該函數(shù)將觀(guān)測(cè)到的路網(wǎng)交通數(shù)據(jù)映射到未來(lái)的交通數(shù)據(jù)上,具體包括流量、速度等。同時(shí),交通預(yù)測(cè)也是一個(gè)序列建模問(wèn)題,通過(guò)使用滑動(dòng)窗口技術(shù)來(lái)建立歷史數(shù)據(jù)與未來(lái)數(shù)據(jù)之間的關(guān)聯(lián)。在本研究中,以交通速度預(yù)測(cè)作為目標(biāo),即通過(guò)歷史數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)一段道路上的交通速度,將這一過(guò)程公式化如下:
[Xt+1, Xt+2,…, Xt+T′=fXt-T,…, Xt-1, Xt] , (1)
式中:t表示時(shí)間;[T]表示輸入的序列長(zhǎng)度;[T′]表示要預(yù)測(cè)的序列長(zhǎng)度;[X∈RN×t]為特征矩陣,R為實(shí)數(shù)集,N表示道路節(jié)點(diǎn)總數(shù)。將交通網(wǎng)絡(luò)定義為無(wú)向圖[G=(V, R, A)],其中[V]是路段節(jié)點(diǎn)的集合,[R]是邊的集合,表示節(jié)點(diǎn)之間的連通性,[A∈RN×N]表示圖[G]的鄰接矩陣。
1.2 模型結(jié)構(gòu)
H-STGCN模型的整體框架圖如圖1所示,包含5大模塊,分別為數(shù)據(jù)準(zhǔn)備模塊、熱點(diǎn)區(qū)域圖生成模塊、時(shí)空注意力模塊、圖卷積模塊、特征融合模塊。實(shí)驗(yàn)中分別對(duì)過(guò)往鄰近時(shí)間段、昨天相同時(shí)間段以及上周同一時(shí)間段3個(gè)歷史時(shí)間段進(jìn)行訓(xùn)練,使用參數(shù)矩陣來(lái)進(jìn)一步合并3個(gè)時(shí)間的分量輸出,并融合熱點(diǎn)區(qū)域特征,以獲得最終的預(yù)測(cè)結(jié)果。為了提高訓(xùn)練效率,還采用了殘差學(xué)習(xí)框架[18]。
1.3 數(shù)據(jù)準(zhǔn)備
假設(shè)使用的速度數(shù)據(jù)每天記錄q次,當(dāng)前時(shí)間為[t0],那么當(dāng)前需要預(yù)測(cè)的交通速度的時(shí)間段[Tp]往往和過(guò)往臨近時(shí)間段[Th]有關(guān),且與昨天相同時(shí)間段[Td]以及上周當(dāng)日相同時(shí)間段[Tw]存在著極強(qiáng)的相似性,其中[Th]、[Td]和[Tw]都是[Tp]的整數(shù)倍。
[Xc,it∈R]表示節(jié)點(diǎn)i在t時(shí)間的第c個(gè)特征值,并且[Xit∈RF]表示節(jié)點(diǎn)i在時(shí)間t的所有特征的值。[Xt=(X1t, X2t,…, XNt)∈RN×F]表示t時(shí)間所有節(jié)點(diǎn)的所有特征值,F(xiàn)表示特征值大小。[X=(X1, X2,…, Xτ)∈RN×F×τ]表示τ時(shí)間段內(nèi)所有節(jié)點(diǎn)的所有特征的值。此外,設(shè)置[yit=Xf,it∈R]表示未來(lái)節(jié)點(diǎn)i在t時(shí)刻的交通速度。則3個(gè)時(shí)間段的交通速度數(shù)據(jù)[Xh]、[Xd]、[Xw]表示公式為
[Xh=Xt0-Th+1, Xt0-Th+2,…, Xt0∈RN×F×Th], (2)
[Xd=Xt0-q+1, Xt0-q+2,…, Xt0-q+Tp∈RN×F×Th], (3)
[Xw=Xt0-7×q+1, Xt0-7×q+2,…, Xt0-7×q+Tp∈RN×F×Th.] (4)
1.4 熱點(diǎn)區(qū)域圖生成
基于路網(wǎng)結(jié)構(gòu)得到鄰接矩陣,對(duì)鄰接矩陣的拉普拉斯矩陣進(jìn)行譜聚類(lèi),得到路網(wǎng)的劃分,分區(qū)的每個(gè)簇看作一個(gè)熱點(diǎn)區(qū)域節(jié)點(diǎn)。熱點(diǎn)區(qū)域節(jié)點(diǎn)的值是該區(qū)域內(nèi)路網(wǎng)節(jié)點(diǎn)交通速度數(shù)據(jù)平均值和最小值的組合。而熱點(diǎn)區(qū)域圖的邊緣是基于交通路網(wǎng)結(jié)構(gòu)圖構(gòu)造,如圖2所示的交通路網(wǎng)中,若節(jié)點(diǎn)i與節(jié)點(diǎn)j相連,同時(shí)根據(jù)聚類(lèi)算法的結(jié)果,節(jié)點(diǎn)i屬于區(qū)域1,節(jié)點(diǎn)j屬于區(qū)域2,那么在熱點(diǎn)區(qū)域圖中,區(qū)域1和區(qū)域2相連,由此來(lái)構(gòu)造熱點(diǎn)區(qū)域的連接圖。
在訓(xùn)練過(guò)程中,分別對(duì)3個(gè)時(shí)間段的道路節(jié)點(diǎn)數(shù)據(jù)[Xh]、[Xd]、[Xw]和熱點(diǎn)區(qū)域數(shù)據(jù)[X_ch]、[X_cd]、[X_cw]進(jìn)行訓(xùn)練,[X_ch]、[X_cd]、[X_cw]的計(jì)算參照路網(wǎng)節(jié)點(diǎn)數(shù)據(jù)的計(jì)算方法。道路節(jié)點(diǎn)數(shù)據(jù)與熱點(diǎn)區(qū)域數(shù)據(jù)除了輸入數(shù)據(jù)不同外,主要區(qū)別在于道路節(jié)點(diǎn)數(shù)據(jù)中的時(shí)空塊輸出特征還與熱點(diǎn)區(qū)域數(shù)據(jù)進(jìn)行了特征融合。
1.5 時(shí)空注意力模塊
不同道路之間的交通狀態(tài)往往相互關(guān)聯(lián),且這種相互依賴(lài)具有顯著的影響。使用注意力機(jī)制,可以自適應(yīng)地調(diào)整節(jié)點(diǎn)之間的關(guān)注程度,更好地捕捉它們之間的動(dòng)態(tài)關(guān)聯(lián)。以過(guò)往臨近時(shí)間段的交通速度[Xh]為例,表示公式如式(5)和式(6)所示,
[Sh=WSh?σX(r-1)hW1W2W3X(r-1)hT+bSh,] (5)
式中:[WSh、bSh∈RN×N、W1∈RTr-1、W2∈RCr-1×Tr-1、]
[W3∈RCr-1]為可學(xué)習(xí)參數(shù);[σ]為激活函數(shù);[X(r-1)h=(X1, X2,…, XTr-1)∈RN×Cr-1×Tr-1]是第r個(gè)時(shí)空塊的輸入,[Cr-1]是第r層中輸入數(shù)據(jù)的通道數(shù),[Tr-1]是第r層中時(shí)間維度的長(zhǎng)度。
[S′hi, j=expShi, jj=1NexpShi, j.] (6)
根據(jù)該層的當(dāng)前輸入動(dòng)態(tài)計(jì)算注意矩陣S。S中的元素[Si, j]的值在語(yǔ)義上表示節(jié)點(diǎn)i和j的相關(guān)強(qiáng)度,然后使用[softmax]函數(shù)來(lái)保證節(jié)點(diǎn)的注意力權(quán)重和等于1。在進(jìn)行圖卷積時(shí),將利用鄰接矩陣A與空間注意矩陣[S '∈RN×N]動(dòng)態(tài)調(diào)整節(jié)點(diǎn)之間的影響權(quán)重。
在時(shí)間維度上,交通狀況的演變具有一定的連續(xù)性。本文采用時(shí)間注意力機(jī)制來(lái)捕捉交通數(shù)據(jù)中的時(shí)間相關(guān)性,為不同的數(shù)據(jù)賦予適當(dāng)?shù)臋?quán)重,以實(shí)現(xiàn)自適應(yīng)性分析。以過(guò)往臨近時(shí)間[Xh]為例,公式如式(7)和式(8)所示,
[Eh=WEh?σ(X(r-1)h)TU1U2X(r-1)hU3T+bEh,] (7)
[E′hm, n=expEhm, nj=1Tr-1expEhm, n,] (8)
式中:[WEh、bEh∈RTr-1×Tr-1、U1∈RN×1、U2∈RCr-1×N、]
[U3∈RCr-1]是可學(xué)習(xí)的參數(shù)。時(shí)間相關(guān)矩陣E由不同的輸入決定。E中元素[Em, n]的值在語(yǔ)義上表示m、n時(shí)刻之間的依賴(lài)程度。最后,時(shí)間相關(guān)矩陣E通過(guò)[softmax]函數(shù)進(jìn)行歸一化,并直接將歸一化的時(shí)間注意力矩陣應(yīng)用于輸入,得到[Xr-1h=X1, X2,…, XTr-1=X1, X2,…, XTr-1E '∈RN×Cr-1×Tr-1],最后通過(guò)合并相關(guān)信息來(lái)動(dòng)態(tài)調(diào)整輸入。
1.6 圖卷積模塊
GCN起源于圖譜理論,相對(duì)于傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò),GCN在處理不規(guī)則的圖數(shù)據(jù)方面展現(xiàn)出獨(dú)特優(yōu)勢(shì),這種不規(guī)則的圖數(shù)據(jù),通常用其對(duì)應(yīng)的拉普拉斯矩陣表示。拉普拉斯矩陣定義為:[L=D-A],其中,L表示拉普拉斯矩陣,D是對(duì)角矩陣,對(duì)角線(xiàn)元素表示每個(gè)節(jié)點(diǎn)的度數(shù),A是鄰接矩陣,表示節(jié)點(diǎn)之間的連接關(guān)系。與傳統(tǒng)的CNN在規(guī)則網(wǎng)格數(shù)據(jù)上進(jìn)行卷積操作不同,GCN借助拉普拉斯矩陣,可以考慮節(jié)點(diǎn)之間的連接關(guān)系,并且通過(guò)卷積操作,能實(shí)現(xiàn)對(duì)節(jié)點(diǎn)的特征提取,從而有效處理不規(guī)則的圖結(jié)構(gòu)。標(biāo)準(zhǔn)化的拉普拉斯矩陣定義為
[L=IN-D-12AD-12=UΛUT,] (9)
式中:[IN]是單位矩陣;[D∈RN×N]是對(duì)角矩陣,由節(jié)點(diǎn)度組成;[A∈RN×N]是鄰接矩陣;U是傅里葉基;[Λ]為矩陣L特征值組成的對(duì)角矩陣。圖卷積是一種卷積運(yùn)算,通過(guò)使用傅里葉域中對(duì)角化的線(xiàn)性算子來(lái)代替經(jīng)典卷積算子。數(shù)據(jù)[X]在圖上的卷積操作表示為
[gθ?GX=gθ(L)X=gθUΛUTX=Ugθ(Λ)UTX ,] (10)
式中:[gθ]為卷積核,參數(shù)[θ∈RN]是切比雪夫多項(xiàng)式的系數(shù)的向量;[?G]表示圖卷積操作。對(duì)相對(duì)復(fù)雜的圖進(jìn)行拉普拉斯矩陣特征值的分解時(shí),計(jì)算代價(jià)相當(dāng)大,因此可以采用切比雪夫多項(xiàng)式近似的方法有效地解決這個(gè)問(wèn)題[19],表達(dá)式如公式(11)所示,
[gθ?GX=gθ(L)X=k=0k-1θktk(L)X,] (11)
式中:[L=2λmaxL-IN],[λmax]為拉普拉斯矩陣的最大特征值。
切比雪夫多項(xiàng)式的遞歸定義式為
[tk(X)=2Xtk-1(X)-tk-2(X),] (12)
特別地,[t0(X)=1],[t1(X)=X].
利用切比雪夫多項(xiàng)式的近似展開(kāi)解完成圖卷積運(yùn)算,以圖中每個(gè)節(jié)點(diǎn)為中心提取周?chē)?到[(k-1)]個(gè)鄰接節(jié)點(diǎn)的信息。為了動(dòng)態(tài)調(diào)整節(jié)點(diǎn)之間的相關(guān)性,對(duì)于切比雪夫多項(xiàng)式的每一項(xiàng),將空間注意力矩陣[S'∈RN×N]與切比雪夫多項(xiàng)式[tk(L)]相結(jié)合,得到[tk(L)⊙S'],其中[⊙]是哈達(dá)瑪乘積。最終,將上述過(guò)程公式化如下所示,
[gθ?GX=gθ(L)X=k=0k-1θktk(L)⊙SX.] (13)
在圖卷積操作中捕獲每個(gè)節(jié)點(diǎn)在空間維度上的鄰接信息后,對(duì)于每個(gè)時(shí)間段t,可得[gθ?GXt],再將其進(jìn)一步堆疊時(shí)間維度上的標(biāo)準(zhǔn)卷積層,提取相鄰時(shí)間段上的時(shí)間相關(guān)性。以過(guò)往臨近時(shí)間為例,過(guò)程用公式(14)表示為
[X(r)h=RELUΘ?σgθ?GX(r-1)h∈RCr×N×Tr] ,(14)
式中:[RELU]和[σ]為激活函數(shù);[Θ]為參數(shù)模型;[?]表示標(biāo)準(zhǔn)卷積操作。
1.7 特征融合模塊
為準(zhǔn)確預(yù)測(cè)未來(lái)時(shí)間段的交通狀況并避免在某些時(shí)間周期過(guò)度擬合的現(xiàn)象,通過(guò)關(guān)注3個(gè)不同時(shí)間段的交通數(shù)據(jù)來(lái)解決這個(gè)問(wèn)題,并通過(guò)歷史數(shù)據(jù)學(xué)習(xí)這3種時(shí)間周期的影響權(quán)重,公式化過(guò)程為
[Y=Qh⊙Yh+Qd⊙Yd+Qw⊙Yw+by ,] (15)
式中:[Qh]、[Qd]、[Qw]和[by]是可學(xué)習(xí)參數(shù),反映了3個(gè)時(shí)間維分量對(duì)預(yù)測(cè)目標(biāo)的影響程度。同時(shí),為了實(shí)現(xiàn)道路路網(wǎng)和熱點(diǎn)區(qū)域間的交通狀態(tài)的融合,定義一個(gè)變換矩陣[H∈RN×NR]為
[Hi, z=1,i∈z,0,其他, ] (16)
式中:i為路網(wǎng)節(jié)點(diǎn);z為聚類(lèi)后的熱點(diǎn)區(qū)域。如果道路節(jié)點(diǎn)i屬于區(qū)域z的特征便和道路節(jié)點(diǎn)i的特征連接起來(lái)。由于交通數(shù)據(jù)具有動(dòng)態(tài)變化的特征,路段與區(qū)域之間的關(guān)系也是多變的,因此,定義一個(gè)動(dòng)態(tài)轉(zhuǎn)移矩陣[H′∈RN×NR],計(jì)算方法如公式(17)所示:
[H′=σ(F)TU1U2FRU3T+bT?H .] (17)
即對(duì)于路段特征[F∈RN×T×F]和區(qū)域特征[FR∈RNR×T×F],可得融合特征[Fout∈RN×T×F],最后在輸出處增加一個(gè)[RELU]激活函數(shù),并通過(guò)線(xiàn)性變換得出最終的輸出結(jié)果,如式(18)所示:
[Output=LinearRELU(Fout).] (18)
2 實(shí)驗(yàn)與分析
2.1 數(shù)據(jù)集
為驗(yàn)證所提模型的準(zhǔn)確性,在實(shí)際實(shí)驗(yàn)中分別選取了國(guó)內(nèi)和國(guó)外2個(gè)公開(kāi)數(shù)據(jù)集來(lái)評(píng)估模型的預(yù)測(cè)性能。每個(gè)數(shù)據(jù)集按6∶2∶2的比例設(shè)置訓(xùn)練集、驗(yàn)證集和測(cè)試集。
GAIA數(shù)據(jù)集:該數(shù)據(jù)集是在中國(guó)濟(jì)南收集,包含市中心的561個(gè)路段(節(jié)點(diǎn)),采樣率為每10 min一個(gè)樣本,樣本數(shù)為52 286個(gè),數(shù)據(jù)集中包含路段的平均速度。
PeMSD4數(shù)據(jù)集:該數(shù)據(jù)集是舊金山灣區(qū)的交通數(shù)據(jù),由29條道路上的3 848個(gè)測(cè)速儀器記錄而成,由于測(cè)速器太過(guò)密集,大部分節(jié)點(diǎn)數(shù)據(jù)都非常相似,影響實(shí)驗(yàn)效果,因此將距離小于3.5英里(約為5.632 7 km)的測(cè)速器移除,篩選后有307個(gè)檢測(cè)器,每5 min收集一次交通數(shù)據(jù),實(shí)驗(yàn)過(guò)程中將其處理成每10 min一個(gè)樣本。
2.2 參數(shù)設(shè)置
本文實(shí)驗(yàn)是在Linux操作系統(tǒng)中的PyCharm2021.3.3專(zhuān)業(yè)版進(jìn)行的,其中Intel(R) Core(TM) i7-10870H CPU @ 2.20GHz,運(yùn)行內(nèi)存為32 GB,顯卡型號(hào)為NVIDIA RTX3060,程序運(yùn)行在python3.9以及深度學(xué)習(xí)框架Pytorch2.0.1的環(huán)境下。在本實(shí)驗(yàn)中對(duì)于3個(gè)時(shí)間周期長(zhǎng)度,將其設(shè)置為:[Th=12、][Td=12、][Tw=12],預(yù)測(cè)窗口的大小[Tp=12],[batch_size]設(shè)置為32。同時(shí)分別對(duì)切比雪夫多項(xiàng)式在[k={1,2,3,4,5,6}]、卷積核大小[g={16,32,64,128,256}]、隱藏層維度[dim={16,32,64,128,256}]時(shí)分別進(jìn)行了調(diào)參實(shí)驗(yàn)(圖3)。如圖3所示,當(dāng)k [=]3、g [=]64、dim[=]128時(shí),模型訓(xùn)練效果最佳。模型選擇[Adam]優(yōu)化算法作為優(yōu)化器,初始學(xué)習(xí)率設(shè)置為:γ =0.001。
采用多種評(píng)估指標(biāo)來(lái)對(duì)本文方法進(jìn)行評(píng)估,包括平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)。為了全面比較,與6種常見(jiàn)的交通速度預(yù)測(cè)方法進(jìn)行對(duì)比,分別是歷史平均值(HA)、自回歸移動(dòng)平均模型(ARIMA)、長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)、門(mén)控遞歸單元(GRU)、圖卷積循環(huán)網(wǎng)絡(luò)(GCRN)和門(mén)控時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(GatedSTGCN)。在2個(gè)不同的數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),數(shù)據(jù)集涵蓋了多種交通場(chǎng)景,且在時(shí)間周期、預(yù)測(cè)窗口大小等方面具有一定的差異。通過(guò)對(duì)比實(shí)驗(yàn),評(píng)估本文方法在不同數(shù)據(jù)集上的表現(xiàn)性能。
2.3 基線(xiàn)對(duì)比實(shí)驗(yàn)
表1和表2分別比較了層次時(shí)空?qǐng)D卷積網(wǎng)絡(luò)模型(H-STGCN)和基線(xiàn)模型在智能運(yùn)維領(lǐng)域通用公開(kāi)數(shù)據(jù)集(GAIA)和交通流量PeMSD4數(shù)據(jù)集上30、60和120 min預(yù)測(cè)的性能,H-STGCN在2個(gè)數(shù)據(jù)集上都獲得了優(yōu)異的結(jié)果,其中在GAIA數(shù)據(jù)集上30 min的預(yù)測(cè)過(guò)程中效果最好,在60和120 min的評(píng)價(jià)指標(biāo)中所有模型都有所降低,這可能是因?yàn)殡S著預(yù)測(cè)時(shí)間的變長(zhǎng),模型的誤差也在逐步變大,無(wú)法充分捕捉時(shí)空特征??傮w來(lái)說(shuō),GAIA數(shù)據(jù)集上的預(yù)測(cè)效果要優(yōu)于PeMSD4,存在這種現(xiàn)象的原因可能有2個(gè):1)因?yàn)镻eMSD4的數(shù)據(jù)的路網(wǎng)節(jié)點(diǎn)經(jīng)過(guò)了處理,節(jié)點(diǎn)在空間上的連續(xù)性要稍微弱一點(diǎn),處理后路網(wǎng)節(jié)點(diǎn)的總數(shù)大約只有GAIA數(shù)據(jù)集的一半,因而對(duì)空間注意力提取空間特征有一定的影響;2)由于HA模型和ARIMA模型適合在線(xiàn)性且路網(wǎng)相對(duì)較簡(jiǎn)單的環(huán)境下工作,因此效果并不理想。與其他深度學(xué)習(xí)模型相比,H-STGCN的預(yù)測(cè)精度比GCRN和GatedSTGCN更加精確,這說(shuō)明本文對(duì)交通熱點(diǎn)區(qū)域交通速度的處理能更加充分地學(xué)習(xí)交通速度的時(shí)空規(guī)律??傮w來(lái)說(shuō),基于GCN的預(yù)測(cè)方法優(yōu)于其他方法,這意味著H-STGCN更適合用于交通速度預(yù)測(cè)。
圖4(a)—(c)為各個(gè)模型在GAIA數(shù)據(jù)集上預(yù)測(cè)時(shí)間分別為30、60和120 min的MAPE值的柱狀圖,圖4(d)—(f)為各個(gè)模型在PeMSD4數(shù)據(jù)集上預(yù)測(cè)時(shí)間分別為30、60和120 min的MAPE值的柱狀圖。通過(guò)柱狀圖的分析,可以觀(guān)察到在GAIA數(shù)據(jù)集和PeMSD4數(shù)據(jù)集上,H-STGCN模型在所有模型中具有最小的MAPE,這表明H-STGCN模型在交通速度預(yù)測(cè)方面的性能和穩(wěn)定性均優(yōu)于其他6個(gè)基準(zhǔn)模型。同時(shí),可以看出統(tǒng)計(jì)學(xué)分析方法HA和ARIMA的整體效果明顯較差,這與本文的預(yù)期一致。此外,相對(duì)于LSTM模型,在短期預(yù)測(cè)方面,比GRU模型表現(xiàn)更好,但隨著預(yù)測(cè)時(shí)間的延長(zhǎng),預(yù)測(cè)未來(lái)60和120 min時(shí),其性能反而不及LSTM模型。這表明盡管GRU模型通過(guò)減少門(mén)控結(jié)構(gòu)來(lái)減少計(jì)算量并優(yōu)化模型,但在進(jìn)行長(zhǎng)期預(yù)測(cè)時(shí)其效果受到一定影響??傮w而言,H-STGCN模型展現(xiàn)出最佳的效果,這說(shuō)明本文提出的層次時(shí)空注意力機(jī)制在對(duì)多個(gè)時(shí)間段的熱點(diǎn)區(qū)域和普通路網(wǎng)的交通速度進(jìn)行融合時(shí),能更加充分地捕獲交通速度的變化規(guī)律,對(duì)交通速度預(yù)測(cè)具有一定的優(yōu)化效果。
2.4 預(yù)測(cè)性能實(shí)驗(yàn)
模型預(yù)測(cè)值與真實(shí)值的可視化圖如圖5所示,在2個(gè)數(shù)據(jù)集的測(cè)試數(shù)據(jù)上各選取了連續(xù)2天的數(shù)據(jù),繪制了預(yù)測(cè)后30 min交通速度的預(yù)測(cè)值與真實(shí)值,圖中黑色線(xiàn)表示交通數(shù)據(jù)的真實(shí)值,紅色線(xiàn)表示H-STGCN模型的預(yù)測(cè)值??梢钥闯?,在實(shí)際生活中,交通數(shù)據(jù)每時(shí)每刻都在上下波動(dòng),變化非常大,并且在上午9點(diǎn)和下午6點(diǎn)會(huì)出現(xiàn)一個(gè)速度的峰谷值,本文的模型能大致擬合實(shí)際交通狀態(tài),在交通速度驟減的地方,預(yù)測(cè)效果存在一定的滯后,但很快也能擬合實(shí)際數(shù)據(jù),這表明本文的模型很穩(wěn)定,在交通速度預(yù)測(cè)方面存在一定的優(yōu)勢(shì)。
為了準(zhǔn)確評(píng)估本文模型在交通驟變場(chǎng)景下的性能,選擇了2個(gè)具有交通復(fù)雜性的路段進(jìn)行真實(shí)值和預(yù)測(cè)值的可視化展示,如圖6所示,對(duì)于第一個(gè)路段,交通速度的真實(shí)值呈現(xiàn)出較大范圍的波動(dòng),而模型的預(yù)測(cè)值盡管能夠捕捉交通流的整體變化趨勢(shì),卻未能完全擬合波動(dòng)較大的區(qū)域??赡芤?yàn)樵撀范蔚慕煌E變情況較為復(fù)雜,而且這種變化只是瞬間發(fā)生,導(dǎo)致模型在捕捉到這種復(fù)雜變化時(shí)面臨困難。對(duì)于第二個(gè)路段,真實(shí)值和預(yù)測(cè)值之間的趨勢(shì)相對(duì)一致,但仍存在一些波動(dòng)。在某些時(shí)間步中,預(yù)測(cè)值能夠較好地匹配真實(shí)值,但在其他時(shí)間步中仍存在一定的誤差。這表明模型在捕捉該路段的交通驟變情況方面具備一定的能力。通過(guò)2個(gè)交通復(fù)雜路段的分析,表明H-STGCN在捕捉交通驟變情況方面具有一定的潛力。
3 結(jié)論
為了充分捕捉交通速度的時(shí)空相關(guān)性,提出了一種全新的層次時(shí)空?qǐng)D卷積模型H-STGCN。該模型不僅能夠捕捉交通速度數(shù)據(jù)的周期性規(guī)律,還能挖掘熱點(diǎn)區(qū)域的交通速度特征。同時(shí),通過(guò)引入時(shí)空注意力機(jī)制,能更加充分地挖掘交通速度數(shù)據(jù)的時(shí)空特征。通過(guò)在2個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),發(fā)現(xiàn)該模型能更好地適應(yīng)各種交通場(chǎng)景。尤其是在預(yù)測(cè)周期較長(zhǎng)的情況下,該模型相比其他基線(xiàn)模型具有更高的準(zhǔn)確性。實(shí)際上,高速公路交通流量受到許多外部因素的影響,如天氣和社會(huì)事件,今后將重點(diǎn)考慮外部因素的影響,進(jìn)一步提高預(yù)測(cè)精度。
參考文獻(xiàn)
[1] ZHU L,YU F R,WANG Y G,et al. Big data analytics in intelligent transportation systems:a survey[J]. IEEE Transactions on Intelligent Transportation Systems,2019,20(1):383-398.
[2] ZHANG J B,ZHENG Y,QI D K,et al. Predicting citywide crowd flows using deep spatio-temporal residual networks[J]. Artificial Intelligence,2018,259:147-166.
[3] 王東京,劉繼濤,俞東進(jìn). 電動(dòng)自行車(chē)軌跡簡(jiǎn)化與自適應(yīng)地圖匹配算法[J].軟件學(xué)報(bào),2023,34(8):3793-3820.
[4] 蔣銳,虞躍,徐友云,等. 基于CHAN的改進(jìn)卡爾曼濾波室內(nèi)定位算法[J].通信學(xué)報(bào),2023,44(2):136-147.
[5] VAN HINSBERGEN C P I J,SCHREITER T,ZUURBIER F S,et al.Localized extended Kalman filter for scalable real-time traffic state estimation[J].IEEE Transactions on Intelligent Transportation Systems,2012,13(1):385-394.
[6] WILLIAMS B M,HOEL L A.Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process:theoretical basis and empirical results[J].Journal of Transportation Engineering,2003,129(6):664-672.
[7] 陳明強(qiáng),傅嘉赟.基于無(wú)跡卡爾曼濾波的飛行航跡預(yù)測(cè)方法研究[J].計(jì)算機(jī)仿真,2021,38(6):27-30,36.
[8] ALGHAMDI T,ELGAZZAR K,BAYOUMI M,et al.Forecasting traffic congestion using ARIMA modeling[C]//2019 15th International Wireless Communications & Mobile Computing Conference (IWCMC).IEEE,2019:1227-1232.
[9] 秦勝君,李婷. 一種基于長(zhǎng)短記憶模型的交通軌跡異常挖掘模型[J].廣西科技大學(xué)學(xué)報(bào),2021,32(2):58-64.
[10] 鄒國(guó)建,賴(lài)子良,李曄. 基于時(shí)空注意力網(wǎng)絡(luò)的動(dòng)態(tài)高速路網(wǎng)交通速度預(yù)測(cè)[J].計(jì)算機(jī)工程,2023,49(2):303-313.
[11] 徐冰冰,岑科廷,黃俊杰,等.圖卷積神經(jīng)網(wǎng)絡(luò)綜述[J].計(jì)算機(jī)學(xué)報(bào),2020,43(5):755-780.
[12] 黃偉堅(jiān),李春貴.基于時(shí)空注意力圖卷積神經(jīng)網(wǎng)絡(luò)的交通速度預(yù)測(cè)[J].廣西科技大學(xué)學(xué)報(bào),2022,33(1):54-62.
[13] CUI Z Y,KE R M,PU Z Y,et al.Deep bidirectional and unidirectional LSTM recurrent neural network for network-wide traffic speed prediction[EB/OL].2018:arXiv:1801.02143.http://arxiv.org/abs/1801.02143.
[14] AGARAP A F M. A neural network architecture combining gated recurrent unit(GRU)and support vector machine(SVM)for intrusion detection in network traffic data[C]//Proceedings of the 2018 10th International Conference on Machine Learning and Computing. 2018:26-30.
[15] ZHENG G,CHAI W K,KATOS V.A dynamic spatial-temporal deep learning framework for traffic speed prediction on large-scale road networks[J].Expert Systems with Applications,2022,195:116585.
[16] SEO Y,DEFFERRARD M,VANDERGHEYNST P,et al.Structured sequence modeling with graph convolutional recurrent networks[C]//International Conference on Neural Information Processing.2018:362-373.
[17] YU B,YIN H T,ZHU Z X.Spatio-temporal graph convolutional networks:a deep learning framework for traffic forecasting[EB/OL].2017:arXiv:1709.04875.http://arxiv.org/abs/1709.04875.
[18] WEI X Q,YANG F M,WU C Z. Deep residual networks of residual networks for image super-resolution[C]//LIDAR Imaging Detection and Target Recognition 2017. SPIE,2017,10605:921-926.
[19] SIMONOVSKY M,KOMODAKIS N. Dynamic edge-conditioned filters in convolutional neural networks on graphs[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017:29-38.
Traffic speed prediction based on hierarchical spatio-temporal
attention graph convolutional network
ZHOU Xiaoyan1 , CAO Wei2 , XU Chao2
(1. General Education Department, Fuzhou Polytechnic, Fuzhou 350108, China; 2. College of Computer and
Cyber Security, Fujian Normal University, Fuzhou 350117, China)
Abstract: In response to the problem that the traffic speed prediction method mainly considers the actual road network and neglects the effect of the hot spot areas of crowd activity, a hierarchical spatio-temporal graph convolutional network(H-STGCN) model is proposed. Firstly, a road network structure graph is structured by calculating the distances between road segment nodes. Then, a clustering graph of the hot spot areas is obtained by using clustering algorithms. Secondly, the spatio-temporal features of the traffic speed data are extracted by using graph convolutional layers and spatio-temporal attention mechanism layers. Finally, three temporal components of traffic speed data, namely, historical adjacent time periods, the same time period from the previous day, and the corresponding time period from the previous week, are introduced for training respectively, so as to uncover the patterns of traffic speed during the same time periods. The experimental results show that when the prediction time of the model is 30, 60 and 120 min, the mean absolute error is reduced by 6.9%, 13.6% and 14.6%, respectively, compared with the classical spatio-temporal graph convolution model, which realizes more accurate prediction and can better serve the intelligent traffic system.
Keywords: traffic speed prediction; graph convolution; attention mechanism; spatio-temporal features; intelligent traffic system
(責(zé)任編輯:羅小芬)
收稿日期:2023-09-02;修回日期:2023-11-08
基金項(xiàng)目:福建省科技廳對(duì)外合作項(xiàng)目(2020I0014)資助
第一作者:周曉燕,碩士,副教授,研究方向:應(yīng)用數(shù)學(xué)、大數(shù)據(jù)分析與挖掘