胡錚 林楊 曾秋霖 舒泰 武筱彬
摘? 要:針對交通流數(shù)據(jù)建模時空特性挖掘不足的問題,提出了STGAN網(wǎng)絡(luò)。運(yùn)用時空圖卷積和注意力機(jī)制挖掘道路網(wǎng)絡(luò)時空規(guī)律。注意力機(jī)制使得網(wǎng)絡(luò)對相鄰道路和歷史時間數(shù)據(jù)的關(guān)注度不同,其分組注意力卷積的機(jī)制能夠使得網(wǎng)絡(luò)訓(xùn)練擺脫路網(wǎng)空間拓?fù)湟?guī)模的限制,并使模型可運(yùn)用在較大規(guī)模的路網(wǎng)上。實驗表明,STGAN模型在寧波高、快速路和主干路上速度預(yù)測誤差比DCRNN小,在寧波數(shù)據(jù)集上預(yù)測速度表現(xiàn)出良好的精度。
關(guān)鍵詞:公路運(yùn)輸;速度預(yù)測;時空依賴;注意力;圖卷積
中圖分類號:TP39;U495? 文獻(xiàn)標(biāo)識碼:A? 文章編號:2096-4706(2023)05-0128-04
Research on Road Speed Prediction Based on Spatiotemporal Convolution Attention Network
—A Case Study of Ningbo's Main Road Network
HU Zheng, LIN Yang, ZENG Qiulin, SHU Tai, WU Xiaobin
(Ningbo Transportation Development Research Center, Ningbo? 315042, China)
Abstract: STGAN network is proposed to solve the problem of insufficient mining of spatiotemporal characteristics of traffic flow data modeling. The spatiotemporal graph convolution and attention mechanism is used to mine the spatiotemporal laws of road network. The attention mechanism makes the network pay different attention to adjacent roads and historical time data. Its grouping attention convolution mechanism can make the network training get rid of the restriction of the spatial topological scale of the road network, and make the model can be applied to a large scale road network. The experiment shows that the STGAN model has a smaller speed prediction error than DCRNN in Ningbo high-speed, expressway and trunk roads, and the prediction speed shows good accuracy on Ningbo data set.
Keywords: road transportation; speed prediction; spatiotemporal dependence; attention; graph convolution
0? 引? 言
隨著機(jī)動車數(shù)量的快速增加,而城市路網(wǎng)承載能力有限,城市路網(wǎng)的擴(kuò)張難以企及機(jī)動車數(shù)量的增加速度,道路交通管理已經(jīng)成為當(dāng)前城市治理的難題之一。在互聯(lián)網(wǎng)技術(shù)和人工智能技術(shù)高度發(fā)達(dá)的今天,智能交通系統(tǒng)已被廣泛應(yīng)用于城市交通監(jiān)測及治理[1],交通管理部門可以基于歷史路網(wǎng)交通流數(shù)據(jù)預(yù)測得到未來時段的交通狀況,預(yù)先進(jìn)行交通資源分配或智能調(diào)度交通信號來對道路通行進(jìn)行控制。出行者可以根據(jù)預(yù)測得到的路網(wǎng)交通狀態(tài)來規(guī)劃出行時間及出行方式,更好地進(jìn)行路徑規(guī)劃。精確實時的交通流預(yù)測可以幫助改善交通堵塞、交通事故等一系列道路交通問題,對城市交通管理和綜合治理水平的提高具有重要意義。
交通流數(shù)據(jù)具有明顯的時間和空間的模式規(guī)律,國內(nèi)外眾多研究者針對交通流預(yù)測問題提出了多種預(yù)測方法,分別從交通流的時間特性、空間特性、時空依賴等多方面展開了深入研究,各自具有不同的優(yōu)點及適用范圍:
(1)時間序列模型。早在1975年時空相關(guān)性的概念就被提出,將時間序列計算模型延伸至空間領(lǐng)域,構(gòu)建了時空序列分析模型框架,從而能夠定量地測量時空依賴性。Moorthy將時間序列的移動平均自回歸方法(ARMA)引入到交通流的預(yù)測當(dāng)中,開啟了ARMA預(yù)測的大門。
(2)統(tǒng)計方法模型。Asif [2]等考慮到研究時空特性可以改善智能交通系統(tǒng)的性能,提出了利用K-means挖掘路網(wǎng)層面和路段層面的時空性能趨勢結(jié)合SVM對路網(wǎng)速度進(jìn)行預(yù)測。李樹彬[3]等通過層次聚類判定交通流狀態(tài),并結(jié)合相空間重構(gòu)和XGBoost算法提出了一種短時交通流預(yù)測模型。
(3)深度學(xué)習(xí)。Yang等[4]使用特征增強(qiáng)的LSTM方法用于交通流量預(yù)測,以遏制單一特征長序列卷積導(dǎo)致的梯度下降問題。朱凱利等[5]基于圖神經(jīng)網(wǎng)絡(luò)進(jìn)行交通流量和速度預(yù)測,利用圖卷積(GCN)捕獲圖的拓?fù)浣Y(jié)構(gòu)。Li等[6]引入擴(kuò)散卷積神經(jīng)網(wǎng)絡(luò)(DCRNN)進(jìn)行路網(wǎng)流量預(yù)測,基于圖上的雙向隨機(jī)游走來捕獲空間相關(guān)性,并使用具有預(yù)定采樣的編碼器-解碼器架構(gòu)來捕獲時間相關(guān)性,在規(guī)模較大的路網(wǎng)下有效。Wu等[7]基于WaveNet網(wǎng)絡(luò)預(yù)測時空交通流取得不錯的效果。Rasaizadi等[8]使用人工神經(jīng)網(wǎng)絡(luò)和K-nearest鄰居混合的模型預(yù)測預(yù)測小時交通量和每小時平均流量速度,根據(jù)結(jié)果敏感性分析后,得出影響K-nearest和預(yù)測精度的關(guān)鍵特征。
交通流受到路段狀況、天氣情況、人為活動等多種事件因素的影響,使得其具有高度的時變性、多模式性以及不確定性等特點,也增加了對交通流準(zhǔn)確預(yù)測的難度。本文針對短時交通量受隨機(jī)因素影響大、非線性強(qiáng)、時空規(guī)律多模態(tài)的特點,將時空卷積注意力網(wǎng)絡(luò)應(yīng)用于交通量預(yù)測的研究。
1? 時空卷積注意力預(yù)測模型
本文基于STGAN網(wǎng)絡(luò)進(jìn)行道路流量預(yù)測,STGAN模型有四個組成模塊,分別是位置編碼模塊、時空編碼器、時空解碼器和輸出模塊。如圖1所示。
1.1? 注意力模塊
在時空編碼器中分別使用了局部注意力模塊和分組注意力模塊,分別對交通流速度數(shù)據(jù)的時間和空間模式規(guī)律進(jìn)行建模。局部注意力機(jī)制用提取時序數(shù)據(jù)中的時間維度上的多模式依賴關(guān)系,基于不同的卷積核在時間序列上滑動提取不同范圍內(nèi)的局部特征,基于Attention機(jī)制利用因果卷積在局部時間特征上挖掘交通流時序數(shù)據(jù)的時間依賴關(guān)系。
組范圍卷積注意力用于學(xué)習(xí)交通流路段節(jié)點間的空間依賴,使得它們難以捕獲空間依賴的動態(tài)性和多模式性。由于實際應(yīng)用中路網(wǎng)規(guī)模大,圖注意力卷積的關(guān)于路網(wǎng)節(jié)點數(shù)N的計算復(fù)雜度是O(N2),對算力和內(nèi)存都將是挑戰(zhàn)。另外,路網(wǎng)中節(jié)點依賴隨著距離降低,反映在圖上就是節(jié)點依賴關(guān)系雖鄰域的階數(shù)增加而降低。組范圍卷積注意力使用核大小和步長均為k的一維卷積將輸入節(jié)點分組,以降低網(wǎng)絡(luò)復(fù)雜性,組數(shù)通過式(1)計算:
(1)
其中? 表示向下取整函數(shù),N表示路段節(jié)點的數(shù)量。卷積核k決定了組內(nèi)節(jié)點數(shù)量及組的數(shù)量,卷積操作將組內(nèi)節(jié)點信息進(jìn)行匯聚,之后使用注意力機(jī)制計算組間的注意力分?jǐn)?shù),隨后將得到的注意力得分矩陣作為圖的鄰接權(quán)重矩陣,表示組與組之間的相關(guān)關(guān)系。
1.2? 位置編碼器
STGAN沒有用到LSTM的序列卷積,其采用了位置編碼器提取速度時間序列的位置信息,位置編碼器借鑒了Transformer中位置編碼的做法來考慮序列位置信息,如式(2):
(2)
其中pos表示序列的位置,i表示編碼向量的位置下標(biāo)。由于交通流預(yù)測任務(wù)中使用歷史觀測值對未來值進(jìn)行預(yù)測,歷史輸入和預(yù)測輸出在序列上并不是獨(dú)立的,具有前后位置關(guān)系。如模型輸入的歷史時間步長為P,預(yù)測輸出的時間步長為Q,則據(jù)式(2)計算第1個位置到第P+Q個位置的連續(xù)編碼向量為:PE={PE1,PE2,…,PEP+Q},為了在模型中考慮這種前后位置信息,本文將輸入序列和前P個位置編碼向量做加性和,如式(3)所示,其中⊕表示元素和,Xin表示輸入的交通流序列, 和? 將用于時空編碼器和時空解碼器的輸入:
(3)
1.3? 時空編碼器
時空編碼器由并行的空間編碼器和時間編碼器組成。每個空間編碼器層包含兩個子層,分別是組范圍卷積注意力和全連接前饋網(wǎng)絡(luò)。歷史觀測數(shù)據(jù)首先經(jīng)過一個1×1的卷積層被轉(zhuǎn)換為 ,然后輸入空間編碼器產(chǎn)生輸出 ,每個時間編碼器層由局部范圍卷積注意機(jī)制和前饋網(wǎng)絡(luò)組成,時間編碼器的其他部分與空間編碼器相同。在連續(xù)位置編碼嵌入后, 被饋送到時間編碼器并產(chǎn)生輸出 、 和? 經(jīng)過拼接后產(chǎn)生時空編碼器的最終輸出 。
1.4? 時空解碼器
時空解碼器由時間解碼器和空間解碼器串行組成,其中時間解碼器和空間解碼器都由L個相同的子層堆疊而成,解碼器中使用到的殘差連接、層正則化以及前饋網(wǎng)絡(luò)都和編碼器相同。時間解碼器中的注意力機(jī)制為局部范圍卷積注意力,將連續(xù)位置編碼模塊的輸出作為輸入,通過L層堆疊后生成輸出 。空間解碼器中使用的注意力機(jī)制是組范圍卷積注意力,空間解碼器的最后一個子層生成時空解碼器的最終輸出 。
1.5? 輸出模塊
在輸出模塊中,時空解碼器輸出的時空特征作為輸出模塊的輸入。輸出模塊由兩個1×1的標(biāo)準(zhǔn)卷積層組成,將時空解碼器的輸出轉(zhuǎn)換成期望的預(yù)測輸出,公式表示為:
(4)
2? 模型性能評估
本文提出的速度預(yù)測模在PMES數(shù)據(jù)集中的交通流速度進(jìn)行驗證,如表1所示,PMES美國加州運(yùn)輸機(jī)構(gòu)性能檢測系統(tǒng)收集的高速公路交通監(jiān)控數(shù)據(jù),數(shù)據(jù)按照5 min時間跨度進(jìn)行切片,分別記錄了交通流量、平均速度和路段占用率,該數(shù)據(jù)集質(zhì)量較高不存在數(shù)據(jù)缺失的問題。
2.1? 模型試驗設(shè)置
將PEMS數(shù)據(jù)集劃分為70%訓(xùn)練集、30%驗證集,本文使用Adam優(yōu)化器搭配閾值為5的梯度裁剪來訓(xùn)練模型。初始學(xué)習(xí)率為0.001,權(quán)重衰減為0.000 1,并且在每個數(shù)據(jù)集上訓(xùn)練模型150個批次,PEMS04數(shù)據(jù)集batch size為32,PEMS07數(shù)據(jù)集batch size為16。為防止過擬合,采取drop out和earl stop在驗證集上的損失連續(xù)10個批次沒有減少時,停止訓(xùn)練,所有訓(xùn)練基于i9-9900K、RTX2080和128 GB內(nèi)存的Windows平臺進(jìn)行。
如表2所示,PEMS04和PEMS07的輸入輸出步長均12,即用過去一個小時的而速度序列預(yù)測未來一個小時的速度序列。由于PEMS07道路數(shù)量多,組范圍卷積數(shù)量調(diào)整為100,編碼器和解碼器堆疊層數(shù)設(shè)置為4,損失函數(shù)選擇L1。
2.2? 試驗結(jié)果
本文將所實現(xiàn)的STGAN模型與以下基準(zhǔn)模型進(jìn)行比較,包括傳統(tǒng)時間序列分析方法ARMA、時間序列深度學(xué)習(xí)預(yù)測方法FC-LSTM[4]、基于深度圖神經(jīng)網(wǎng)絡(luò)的方法DCRNN[6]、WaveNet[7]等模型,模型評價指標(biāo)選擇RMSE和MAPE。由表3多步預(yù)測平均誤差可知,相比FC-LSTM的序列卷積,時空卷積和圖注意力機(jī)制對交通流的多模式時空建模更有效;加入transformer結(jié)構(gòu)的STGAN比DCRNN在PMES-07數(shù)據(jù)集上表現(xiàn)更優(yōu),原因在于PMES-07相比節(jié)點數(shù)量PMES-04更多,時空關(guān)系更復(fù)雜,與此同時,分組卷積在減少計算量的同時,挖掘路網(wǎng)節(jié)點之間的時空相關(guān)性依賴也更有效。
在圖2中的多步預(yù)測誤差圖中,隨著預(yù)測步長的增加,F(xiàn)C-LSTM、DCRNN和STGAN預(yù)測誤差都在增加,在PEMS-07上的增加速度大于PEMS-04,STGAN在多步預(yù)測中精度較高,誤差上升速度慢于DCRNN。
3? 寧波路網(wǎng)速度預(yù)測
為了驗證STGAN網(wǎng)絡(luò)在國內(nèi)城市交通速度預(yù)測的實際應(yīng)用效果,本文在寧波市高、快速路速度數(shù)據(jù)集(NB_expressway)和寧波主干道速度數(shù)據(jù)(NB_trunk_road)集上,訓(xùn)練STGAN模型并評估預(yù)測效果。
3.1? 預(yù)測案例
寧波路網(wǎng)運(yùn)行速度由浮動車GPS地圖匹配與高德路況數(shù)據(jù)融合得到,每5 min計算一次全網(wǎng)道路運(yùn)行速度,幾乎覆蓋寧波城區(qū)所有主要道路,寧波路網(wǎng)信息及數(shù)據(jù)采集時間如表4所示。
由于車流在路網(wǎng)中時空分布不均勻的天然屬性,導(dǎo)致路網(wǎng)速度監(jiān)控數(shù)據(jù)存在不同程度的缺失,高速數(shù)據(jù)缺失9.13%、快速路缺失14.82%、主干道缺失23.36%,缺失程度隨道路等級降低而加重。根據(jù)歷史速度數(shù)據(jù)分組統(tǒng)計得出寧波市道路運(yùn)行速度均值如表5所示,針對速度缺失不嚴(yán)重的路段進(jìn)行缺失值填補(bǔ),以適當(dāng)緩解速度缺失對預(yù)測模型訓(xùn)練及預(yù)測精度的影響。STGCN具體的訓(xùn)練參數(shù)設(shè)置如表6所示,由于主干道數(shù)量多,NB_trunk_road分組卷積數(shù)量設(shè)置為6,transformer編碼解碼結(jié)構(gòu)設(shè)置為6,為降低顯存壓力,將批次大小調(diào)整為8。
3.2? 預(yù)測效果
由表7知,STGAN模型在寧波高、快速路和主干路上速度預(yù)測誤差比DCRNN小,在高、快速路上,預(yù)測誤差低0.39%,在主干路上低0.84%。在圖3多步預(yù)測誤差圖中,STGAN在NB_expressway和NB_trunk_road速度數(shù)據(jù)集上的預(yù)測誤差均隨著預(yù)測步長的增加,并且主干道誤差上升明顯快于高、快速路,表明STGAN對路況更加復(fù)雜的城市主干道交通流時空關(guān)系建模能力有所下降,STGAN在寧波高快速路和主干路的預(yù)測效果如圖4所示。
4? 結(jié)? 論
本文提出的STGAN網(wǎng)絡(luò)預(yù)測道路速度,在開放數(shù)據(jù)集上達(dá)到與主流標(biāo)準(zhǔn)模型一致水平的預(yù)測精度,其優(yōu)勢在于結(jié)合時空注意力機(jī)制時,使用局部注意力卷積和分組注意力卷積網(wǎng)絡(luò)訓(xùn)練參數(shù)收斂速度快。另外,分組注意力卷積用于學(xué)習(xí)交通流路段節(jié)點間的空間依賴,使得網(wǎng)絡(luò)捕獲空間依賴的動態(tài)性和多模式性。在寧波實際道路速度預(yù)測場景中,誤差比傳統(tǒng)模型小,證明了模型的有效性;同時需要注意的是,在城市主干道速度預(yù)測中,由于路網(wǎng)結(jié)構(gòu)復(fù)雜,道路數(shù)量多,易受交通信號限制,速度預(yù)測難度增加,模型存在預(yù)測精度下降的問題,下一步需投入更多精力解決此問題。
參考文獻(xiàn):
[1] 冉斌.世界智能交通進(jìn)展與趨勢 [J].中國公路,2018(14):22-23.
[2] ASIF M T,DAUWELS J,CHONG Y G,et al. Spatiotemporal Patterns in Large-Scale Traffic Speed Prediction [J].IEEE Transactions on Intelligent Transportation Systems,2014,15(2):794-804.
[3] 李樹彬,孔祥科,李青桐,等.考慮混沌特性的PSR-XGBoost短期交通流預(yù)測(英文) [J].東南大學(xué)學(xué)報:英文版,2022,38(1):92-96.
[4] YANG B L,SUN S L,LI J Y,et al. Traffic flow prediction using LSTM with feature enhancement [J].Neurocomputing,2019,332:320-327.
[5] 朱凱利,朱海龍,劉靖宇,等.基于圖卷積神經(jīng)網(wǎng)絡(luò)的交通流量預(yù)測 [J].智能計算機(jī)與應(yīng)用,2019,9(6):168-170+177.
[6] LI Y G,YU R,SHAHABI C,et al. Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecastingg [J/OL]. arXiv:1707.01926 [cs.LG].[2022-09-28].https://arxiv.org/abs/1707.01926.
[7] WU Z H,PAN S R,LONG G D,et al. Graph WaveNet for Deep Spatial-Temporal Graph Modeling [J/OL]. arXiv:1906.00121 [cs.LG].[2022-09-29].https://arxiv.org/abs/1906.00121.
[8] RASAIZADI A,ARDESTANI A,SEYEDABRISHAMI S. Traffic management via traffic parameters prediction by using machine learning algorithms [J].IJHCM(International Journal of Human Capital Management),2021,6(1):57-68.
作者簡介:胡睜(1985—),男,漢族,浙江寧波人,高級工程師,碩士,研究方向:交通信息化。
收稿日期:2022-10-20
基金項目:寧波市交通運(yùn)輸局科技項目(202117)