摘 要:為解決現(xiàn)有公交客流預(yù)測方法多數(shù)利用預(yù)定義的圖結(jié)構(gòu)進行空間建模,對交通狀況變化所引起客流波動考慮不充分,無法捕捉短時動態(tài)的空間依賴關(guān)系問題,提出一種自適應(yīng)平衡靜動態(tài)聯(lián)合網(wǎng)絡(luò)(ASDNet)模型。首先,利用時間卷積網(wǎng)絡(luò)捕獲序列的時間相關(guān)性;其次,利用圖卷積捕捉站點之間整體空間信息,采用動態(tài)圖同構(gòu)網(wǎng)絡(luò)捕捉相鄰時隙動態(tài)圖之間隱藏的動態(tài)依賴關(guān)系;最后,通過自適應(yīng)平衡機制自適應(yīng)地調(diào)節(jié)靜動態(tài)聯(lián)合網(wǎng)絡(luò)之間的信息傳遞。在廣州市真實公交數(shù)據(jù)集上進行了實驗,結(jié)果表明,與多個基準模型相比,該模型在MAE、RMSE和MAPE預(yù)測誤差指標上平均降低了12.2%、9.9%和15%,R2精確度指標上平均提高了6.3%。表明該模型能夠有效地捕捉客流數(shù)據(jù)的時空變化規(guī)律,可為公交運營管理提供技術(shù)參考。
關(guān)鍵詞:公交客流預(yù)測; 時間卷積網(wǎng)絡(luò); 圖卷積; 動態(tài)圖同構(gòu)網(wǎng)絡(luò); 自適應(yīng)平衡靜動態(tài)聯(lián)合網(wǎng)絡(luò); 時空變化
中圖分類號:TP183 文獻標志碼:A
文章編號:1001-3695(2024)08-016-2360-06
doi:10.19734/j.issn.1001-3695.2023.12.0589
Bus passenger flow prediction based on adaptive equilibriumstatic and dynamic joint network
Huang Lai’an, Zhu Hangxiong, Li Bo
(School of Automation, Guangdong University of Technology, Guangzhou 510006, China)
Abstract:To address the limitations of existing public transit passenger flow prediction methods, which often rely on predefined graph structures for spatial modeling, inadequately consider fluctuations in passenger flow caused by changes in traffic conditions, and fail to capture short-term dynamic spatial dependencies, this paper proposed an adaptively balanced static-dynamic joint network(ASDNet) model. Firstly, the model used a temporal convolution network to capture the temporal correlation of sequences. Secondly, it employed graph convolution to capture the overall spatial information between sites, and then incorporated a dynamic graph isomorphic network to capture the hidden dynamic dependencies between dynamic graphs of neighboring time slots. Finally, it introduced an adaptively balanced mechanism to adjust the information transfer between static-dynamic joint networks. The model tested a real bus dataset derived from Guangzhou city. The results demonstrate that the model reduces the MAE, RMSE, and MAPE prediction error metric by an average of 12.2%, 9.9%, and 15%, respectively, and improves the R2 accuracy metric by an average of 6.3% compared to several benchmark models. These results indicate that the model can effectively capture the spatiotemporal variation law of passenger flow data and provide technical reference for bus operation management.
Key words:public transit passenger flow prediction; temporal convolutional network; graph convolution; dynamic graph isomorphic network; adaptively balanced static-dynamic joint network; spatial-temporal variation
0 引言
隨著各城市公共交通健康可持續(xù)發(fā)展的全面推進,協(xié)助管理者優(yōu)化公交資源配置和規(guī)劃對促進公交服務(wù)提質(zhì)增效愈發(fā)重要[1]。公交客流預(yù)測是利用歷史客流量及其相關(guān)信息來預(yù)測未來一段時間內(nèi)的客流量,是公交企業(yè)對車輛合理調(diào)度與線路優(yōu)化的重要依據(jù)[2]。如何精準預(yù)測公交客流已逐漸成為公交運營管理的重難點問題。
公交客流量預(yù)測根據(jù)實際預(yù)測目標可分為區(qū)域流量預(yù)測[3]、線路流量預(yù)測[2]和站點流量預(yù)測[4]。區(qū)域預(yù)測通過分析城市區(qū)域特征,預(yù)測每個區(qū)域的客流量分布,無法捕捉不同區(qū)域交通流量的空間異質(zhì)性和交通模式隨時間變化的時間異質(zhì)性,影響實際客流預(yù)測的準確性。線路流量預(yù)測通過分析某段時間內(nèi)的線路客流量數(shù)據(jù)變化,捕捉交通線路之間的時空特征,可以相對提升客流預(yù)測的準確性。但公交客流中的預(yù)測未來值是整體和局部信息共同作用的結(jié)果,實際公交運行時的客流量受天氣、時間、交通實時狀況等因素影響。站點客流預(yù)測通過分析客流數(shù)據(jù),利用線路、區(qū)域間的全局空間信息,并考慮站點短時間范圍內(nèi)局部空間動態(tài)信息的變化,可以進一步提高公交客流預(yù)測模型的魯棒性和準確性。
針對公交客流預(yù)測問題的研究,其主要步驟分為空間路網(wǎng)拓撲構(gòu)造、時間相關(guān)性研究和空間相關(guān)性研究等[5,6]。
a)空間路網(wǎng)拓撲構(gòu)造。利用深度神經(jīng)網(wǎng)絡(luò)結(jié)合傳統(tǒng)網(wǎng)格的方法提取時空信息,描述路網(wǎng)空間結(jié)構(gòu),即卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[7]學(xué)習(xí)空間關(guān)系,遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)[8]捕捉時間依賴。如Zhang等人[3]提出ST-ResNet模型將城市劃分為網(wǎng)格地圖,用CNN分層捕獲空間結(jié)構(gòu)信息,使用殘差神經(jīng)網(wǎng)絡(luò)框架來建模人群交通的時間距離、周期和趨勢屬性。而路網(wǎng)公交站點的分布是一種拓撲網(wǎng)絡(luò)結(jié)構(gòu),并非標準的網(wǎng)格結(jié)構(gòu)分布,因此無法充分挖掘不同線路、站點之間的非線性空間依賴關(guān)系[9]。利用圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)處理圖拓撲[10,11]及非歐氏空間數(shù)據(jù),基于鄰接矩陣方法構(gòu)造不同類型的空間路網(wǎng)拓撲圖,可以較好地處理空間異質(zhì)性。因此成為目前交通預(yù)測領(lǐng)域的流行方法,取得了比基于網(wǎng)格方法更好的性能[12,13]。
b)時間相關(guān)性研究。指對時間序列數(shù)據(jù)進行建模,捕捉數(shù)據(jù)之間的時間相關(guān)依賴關(guān)系。常用方法有RNN、門控遞歸單元(gated recurrent unit,GRU)、長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)[14]和時間注意力機制[15]。除這些方法外,還有Transformer模型以及時間卷積網(wǎng)絡(luò)(temporal convolution network,TCN)[16]。如Cai等人[17]直接應(yīng)用谷歌的Transformer機器翻譯框架來預(yù)測交通流量,可以捕捉時間序列的連續(xù)性和周期性;王璨等人[18]提出了時間卷積知識跟蹤模型(TCN-KT),利用了TCN在處理時間序列數(shù)據(jù)方面的優(yōu)勢,有效地提高了模型效率。由于TCN利用CNN處理高維數(shù)據(jù)的優(yōu)勢,可以并行處理不同長度和采樣率的時間序列數(shù)據(jù),具有更高的效率,所以本文采用具有門控機制的TCN來捕獲時間相關(guān)性。
c)空間相關(guān)性研究。主要指對站點信息等空間位置數(shù)據(jù)進行建模,捕捉站點空間關(guān)系。較流行方法主要有圖卷積網(wǎng)絡(luò)(GCN)[19]、圖注意力網(wǎng)絡(luò)(graph attention network,GAT)及各種變體網(wǎng)絡(luò)[20]。其中GCN具有從相鄰節(jié)點中提取特征并根據(jù)不同的數(shù)據(jù)結(jié)構(gòu)進行靈活調(diào)整的優(yōu)點。Li等人[8]提出的DCRNN模型利用交通圖上的雙向隨機游走來對空間信息進行建模,并通過門控循環(huán)單元(GRU)捕獲時間動態(tài);Luo等人[21]基于物理鄰接和語義相似度構(gòu)造子圖來捕捉公交站/線路之間的空間依賴關(guān)系;Liu等人[22]構(gòu)建物理-虛擬協(xié)作圖網(wǎng)絡(luò)模型,將物理拓撲圖、相似性圖和相關(guān)性圖輸入到圖卷積門控循環(huán)單元(GC-GRU)中學(xué)習(xí)時空特征。
以上研究為公交客流預(yù)測奠定了良好的基礎(chǔ),但仍存在不足。許多模型利用相似性或距離度量對預(yù)定義的圖結(jié)構(gòu)數(shù)據(jù)構(gòu)造路網(wǎng)拓撲,進而捕捉站點間的時空相關(guān)性。然而,它們未充分考慮短時間范圍內(nèi)局部空間信息的影響,無法充分反映客流數(shù)據(jù)的時空變化規(guī)律,如:a)某個站點因為突發(fā)事件(交通事故或者臨時活動)而臨時關(guān)閉,乘客無法在該站點上車或下車,這可能會導(dǎo)致周邊站點的客流量發(fā)生變化;b)在早上上班高峰期和晚上下班高峰期,不同站點的客流情況也會有所不同。
為解決上述問題,本文提出一種自適應(yīng)平衡靜動態(tài)聯(lián)合網(wǎng)絡(luò)的公交客流預(yù)測模型(adaptive balanced static-dynamic joint network for bus passenger flow prediction model,ASDNet),該模型使用門控擴張因果卷積提取時間相關(guān)性,使用擴散圖卷積[8]捕捉公交站點之間的全局空間信息,使用動態(tài)圖同構(gòu)網(wǎng)絡(luò)[23]捕獲不同站點之間以及相鄰時隙之間隱藏的動態(tài)依賴關(guān)系,并增強圖學(xué)習(xí)的有效性,其目的是挖掘?qū)崟r客流量與路況變化引起的局部空間信息。然后利用平衡融合機制去平衡擴散圖卷積與動態(tài)圖同構(gòu)網(wǎng)絡(luò)的影響。本文的主要貢獻如下:
a)通過圖卷積來有效捕捉公交站點之間全局空間信息,使用一個動態(tài)圖構(gòu)建模塊與學(xué)習(xí)模塊,充分考慮局部信息的動態(tài)特性,挖掘節(jié)點屬性中的相關(guān)信息來描述客流量的突然波動。
b)引入一種改進的動態(tài)圖同構(gòu)網(wǎng)絡(luò),其核心是通過并行化實現(xiàn)動態(tài)范式表示不同時隙數(shù)據(jù)間的信息聯(lián)系,解決動態(tài)GNN由于在動態(tài)圖轉(zhuǎn)換后完全分離同一維度中不同時隙數(shù)據(jù),導(dǎo)致難以捕捉相鄰時隙之間隱藏的動態(tài)依賴關(guān)系的問題,從而提升模型對不同時隙數(shù)據(jù)圖結(jié)構(gòu)的判別和表示能力。
c)提出一種自適應(yīng)平衡融合機制,自適應(yīng)調(diào)節(jié)靜態(tài)信息和動態(tài)信息在公交客流預(yù)測中的影響,提升模型對短時間內(nèi)突發(fā)事件的適應(yīng)能力。實驗結(jié)果表明,該模型在真實公交數(shù)據(jù)集上預(yù)測公交客流方面具有有效性。
1 問題定義
實際公交系統(tǒng)的站點分布和客流分布通常呈現(xiàn)不規(guī)則拓撲結(jié)構(gòu),且站點間客流量分布與不同站點間的功能性和地理連接性呈現(xiàn)相關(guān)性。利用這種非歐關(guān)系,進行不同站點的客流預(yù)測。
定義帶權(quán)重的有向圖G=(V,E,A)描述公交路網(wǎng)拓撲結(jié)構(gòu),其中V表示公交站點的節(jié)點集,模值大小表示站點數(shù)量,即N=V,E表示站點之間連通性的邊集,A∈Euclid ExtraaBpN×N表示任意一對節(jié)點之間接近度的加權(quán)鄰接矩陣。
在每個時間步t,圖G表示為圖形信號X(t)∈Euclid ExtraaBpN×D,其中D是每個節(jié)點的屬性維度。公交站點客流預(yù)測問題描述為:給定S個歷史圖信號χ=[X(t-S+1),…,X(t)]∈Euclid ExtraaBpS×N×D和公交路網(wǎng)的鄰接矩陣A∈Euclid ExtraaBpN×N,通過模型函數(shù)f學(xué)習(xí)預(yù)測未來T個圖信號=[X^(t+1),…,X^(t+T)]∈Euclid ExtraaBpT×N×F各站點上車客流量,其映射關(guān)系表示如下:
[χ,A]f(1)
其中:期望盡可能接近真實值y。
2 自適應(yīng)平衡靜動態(tài)聯(lián)合網(wǎng)絡(luò)的公交客流預(yù)測模型
本文模型總體框架如圖1(a)所示,主要由輸入模塊、多個時空層和輸出模塊組成。首先,通過輸入模塊對歷史客流數(shù)據(jù)進行轉(zhuǎn)換,然后傳輸?shù)綍r空層。在每個時空層中,為了避免梯度消失的問題,在輸入端和輸出端之間使用殘差連接,并將其用作下一個時空層的輸入特征。最后,通過跳躍連接將每個時空層的輸出信息傳輸?shù)捷敵瞿K,從而得到預(yù)測結(jié)果。
時空層如圖1(b)所示,主要由時間模塊、空間模塊、動態(tài)圖構(gòu)造與學(xué)習(xí)模塊和路網(wǎng)結(jié)構(gòu)組成。時間模塊由兩個并行的時間卷積和一個門控機制組成,用于從輸入模塊數(shù)據(jù)中提取時間相關(guān)性特征,并將信息傳輸給空間模塊??臻g模塊由圖卷積(S-GCN)、動態(tài)圖同構(gòu)網(wǎng)絡(luò)(D-GIN)和平衡門組成,在路網(wǎng)結(jié)構(gòu)與動態(tài)圖構(gòu)造方面,分別使用圖卷積(S-GCN)和動態(tài)圖同構(gòu)網(wǎng)絡(luò)(D-GIN)提取整體空間特征與局部空間特征,兩者經(jīng)過平衡門融合作為整個時空層的輸出。
2.1 輸入輸出模塊
輸入模塊將每個節(jié)點每個時刻對應(yīng)的客流數(shù)據(jù)的時刻特征加入到客流數(shù)據(jù)中,公式定義為
It=conv1×1(Xt‖Tt)(2)
其中:It∈Euclid ExtraaBpB×N×Din為數(shù)據(jù)增加一個一天中的時間特征,Din是特征維度,B是批量大小,N是節(jié)點數(shù);Xt是客流數(shù)據(jù),Tt為一天中的時間。
輸出模塊將隱藏的特征投影到所需的維度以獲得最終結(jié)果。
2.2 時間卷積模塊
本文在時間卷積模塊使用擴張因果卷積網(wǎng)絡(luò),通過增加層的深度實現(xiàn)指數(shù)級較大感受野,向輸入填充零來保留時間因果順序,方便從節(jié)點歷史屬性中捕獲時間趨勢及依賴關(guān)系,從而簡化并行計算,節(jié)省計算資源,緩解梯度爆炸或消失問題。為提升時間卷積網(wǎng)絡(luò)層模塊信息流的傳遞效率和準確性,本文在擴張因果卷積網(wǎng)絡(luò)基礎(chǔ)上引入一種門控機制,將兩個輸入X′i,1,X′i,2經(jīng)過不同函數(shù)激活,再進行元素相乘,其定義如下:
hi=δ(Θ1X′i,1+b)⊙tanh(Θ2X′i,2+c)(3)
其中:Θ1、Θ2、b和c表示模型參數(shù);hi表示第i個節(jié)點的時間卷積模塊輸出;δ(·)表示決定傳遞到下一個模塊信息比率的sigmoid函數(shù),用來消除tanh(·)中的無關(guān)信息,選擇更重要的信息;⊙表示Hadamard乘積。
2.3 圖卷積模塊
將公交線路及其站點抽象為一個圖結(jié)構(gòu),利用擴散卷積層可以更有效捕捉空間相關(guān)性。在實際公交運營中,公交行駛分為上行和下行,路網(wǎng)建模本質(zhì)為有向圖結(jié)構(gòu),利用擴散卷積模擬雙向擴散過程,使模型能夠捕捉上游和下游流量的影響,其擴散圖卷積層定義:
Z=∑Kk=0PkfXθk1+PkbXθk2(4)
其中:前向轉(zhuǎn)換矩陣為Pf=D-1oA,后向轉(zhuǎn)換矩陣為Pb=D-1lAT;D是一個對角矩陣,對角線上的第i個元素表示第i個節(jié)點的度數(shù)Dii=∑jAij;Z表示輸出;k表示擴散步長;θ表示模型參數(shù)矩陣。
2.4 動態(tài)圖構(gòu)造與學(xué)習(xí)模塊
圖節(jié)點間關(guān)系在全局上相對穩(wěn)定,但圖中局部節(jié)點的空間關(guān)系易受早高峰、天氣狀況或交通事故等交通突發(fā)事件影響??紤]到節(jié)點與記錄客流量屬性之間存在相關(guān)性,本文通過挖掘節(jié)點屬性中的相關(guān)信息來描述客流量的突然波動。
本文利用動態(tài)圖構(gòu)造模塊生成圖鄰接矩陣,通過“淺層”嵌入對鄰接矩陣進行編碼,用于表示節(jié)點變量之間隱藏的依賴關(guān)系。通過訓(xùn)練進行迭代優(yōu)化,來學(xué)習(xí)局部信息的動態(tài)特性。圖的構(gòu)造定義如下:
=T·γ(5)
idx,idy=arg topk([:,:]) idx≠idy(6)
[-idx,-idy]=0(7)
其中:=[t,1,t,2,…,t,l],γ=[γt,1,γt,2,…,γt,l]表示可學(xué)習(xí)節(jié)點嵌入的隨機初始化;arg topk(·)返回鄰接矩陣前k個最大值的指數(shù)。對于每個時隙的鄰接矩陣,只保留權(quán)重最大的前k個元素,其他值均設(shè)為零。
2.5 改進動態(tài)圖同構(gòu)網(wǎng)絡(luò)模塊
動態(tài)圖神經(jīng)網(wǎng)絡(luò)通過傳遞和聚合節(jié)點特征信息來處理不同時間序列維度之間的空間關(guān)系,獲得節(jié)點間的作用關(guān)系,實現(xiàn)動態(tài)圖節(jié)點信息的傳播。為描述不同時隙動態(tài)圖節(jié)點之間的關(guān)聯(lián)轉(zhuǎn)換,本文建立動態(tài)圖轉(zhuǎn)換機制(如圖2所示),描述定義如下:對于每個時隙圖,除首個時隙圖外,添加相同數(shù)量的頂點,分別代表對應(yīng)頂點前一個時隙圖的數(shù)據(jù)。頂點集將被修改為{v(t,1),v(t,2),…,v(t,n),v(t-1,1),v(t-1,2),…,v(t-1,n)}。將前一個時隙頂點的方向(即有向邊)賦給當前時隙的對應(yīng)點,意味著在N=1,2,…,n的情況下,添加從v(t-1,n)到v(t,n)的連接,進而生成一組新動態(tài)圖用于進行下一操作。
與靜態(tài)GNN相比,動態(tài)GNN在DGT之后完全分離同一維度中的不同時隙數(shù)據(jù),但實際上不同時隙的同一頂點通常會聚合來自不同頂點集的信息。而在平均相鄰圖中,相比于其他動態(tài)GNN變體,圖同構(gòu)網(wǎng)絡(luò)(GIN)具有區(qū)分不同圖的局部拓撲結(jié)構(gòu)的優(yōu)點。為此本文通過改進動態(tài)圖同構(gòu)網(wǎng)絡(luò)(DyGIN),引入動態(tài)圖同構(gòu)權(quán)重聚合機制,提升模型對不同時隙數(shù)據(jù)圖結(jié)構(gòu)的判別和表示能力。具體地,某個圖節(jié)點vi在t時刻的圖同構(gòu)算子表示為
x(i,k)t=MLP(k)((1+ε(k))·x(i,k-1)t+∑j∈N(i)ij·x(j,k-1)t+x(i,k-1)t-1)(8)
其中:x(i,k)t表示節(jié)點vi在k層中時間t的輸出;x(i,k-1)t-1是動態(tài)圖變換的簡單實現(xiàn),表示聚合首個時隙圖后的數(shù)據(jù);邊緣權(quán)重ωij歸一化為ij;ε(k)是一個可學(xué)習(xí)的參數(shù),表示同一節(jié)點vi從前一層獲得的相當大的激活量的百分比。
進一步,設(shè)計一種新的聚合方法,通過并行化動態(tài)范例來表示不同時隙數(shù)據(jù)間的信息聯(lián)系,公式定義如下:
x(i,k)=concat(x(i,k)tt=0,1,…,T)(9)
2.6 自適應(yīng)平衡融合機制模塊
為了充分合理利用靜態(tài)信息和動態(tài)信息特征,形成更全面合理的公交客流圖,本文提出一種自適應(yīng)平衡融合機制,通過學(xué)習(xí)加權(quán)系數(shù)來確定靜態(tài)信息和動態(tài)信息的重要性,自適應(yīng)調(diào)節(jié)靜態(tài)圖和動態(tài)圖的影響,其公式定義如下:
Z=sigmoid(WsXs+WdXd)(10)
其中:Ws和Wd是可訓(xùn)練參數(shù);Xs和Xd分別代表靜態(tài)圖與動態(tài)圖做圖卷積的結(jié)果。sigmoid函數(shù)看作是一個門控函數(shù),表示將張量Z的值映射到0~1,通過控制平衡門的開啟程度,自適應(yīng)調(diào)整靜態(tài)圖和動態(tài)圖之間的權(quán)衡程度。
3 實驗
3.1 數(shù)據(jù)集
本文測試數(shù)據(jù)選取的是廣州市2023年3月1日至4月30日的公交IC卡刷卡數(shù)據(jù),如表1所示,其中包含刷卡時間、卡片ID、卡類型、交易金額、線路名稱、站點名稱和站點順序等信息。目前,廣州是采用“一站計價制”票制,即乘客搭乘公交上車時一次刷卡,到達目的地下車時無須二次刷卡。越秀區(qū)作為廣州最古老的中心城區(qū),承載了大量的客流需求,此外其交通環(huán)境復(fù)雜多變,站點客流變化受街區(qū)分布影響。因此,本文選取越秀區(qū)207個主要站點的上車客流作為本次研究的目標對象,來充分驗證本文模型在站點級客流預(yù)測任務(wù)上的有效性。其站點實際分布如圖3所示。
3.2 數(shù)據(jù)處理
根據(jù)各個公交線路的正常運營時間,本文排除6:00之前和22:30之后的記錄,并以5 min為間隔對各個公交站點不同時間段的客流數(shù)據(jù)進行統(tǒng)計,最終獲得了8 557條記錄作為數(shù)據(jù)集,并按照時間順序進行拆分,70%的數(shù)據(jù)用于訓(xùn)練,20%用于測試,其余10%用于驗證。所有實驗均使用z-score標準化方法對客流數(shù)據(jù)進行預(yù)處理。節(jié)點的預(yù)定義鄰接矩陣由站點之間的距離和閾值高斯核構(gòu)成[14]。預(yù)定義鄰接矩陣A可以定義如下:
Avi,vj=exp(-d2vi,vjσ2) exp(-d2vi,vjσ2)≥ε0其他情況(11)
其中:dvi,vj是站點vi到vj之間的距離,根據(jù)站點的經(jīng)緯度計算所得;σ是距離的標準差,控制矩陣A的分布;ε是控制矩陣A稀疏性的閾值。
3.3 參數(shù)設(shè)置
本文基于PyTorch框架在RTX3090 GPU上對本文模型進行訓(xùn)練。本文所有實驗均使用60 min的歷史數(shù)據(jù)來預(yù)測未來15 min、30 min和60 min的客流量。由于Adam增加了自適應(yīng)學(xué)習(xí)率機制,可以為不同的參數(shù)分配不同的學(xué)習(xí)率,使得訓(xùn)練過程可以更快地收斂[24]。因此,該模型使用Adam優(yōu)化器,實驗參數(shù)設(shè)置如表2所示。
為了覆蓋輸入序列的長度,使用4個時空塊和膨脹因子序列為1、2。針對模型在訓(xùn)練過程中需要進行一步預(yù)測,而在推理過程中需要進行多步預(yù)測導(dǎo)致訓(xùn)練和測試不一致的問題,本文選用平均絕對誤差(MAE)作為模型訓(xùn)練目標,定義客流預(yù)測的損失函數(shù)為
L(X,X^)=1T×N×D ∑i=Ti=1∑j=Nj=1∑k=Dk=1Xi,j,k-X^i,j,k(12)
其中:T是時間步,N是節(jié)點數(shù)量,D是特征維度。Xi,j,k和X^i,j,k是真實值和預(yù)測值。
3.4 比較算法與評估指標
a)歷史平均模型(HA)[25]。利用歷史時期的平均流量信息作為預(yù)測。
b)門控循環(huán)單元(GRU)[26]。它是RNN的一種變體模型,也是一種基于深度學(xué)習(xí)的時間序列預(yù)測方法。
c)圖波網(wǎng)絡(luò)(Graph WaveNet)[27]。它是一個基于GNN和CNN的模型。通過構(gòu)造自適應(yīng)依賴矩陣捕捉隱藏的空間依賴關(guān)系,并使用擴張一維卷積處理長時間序列。
d)多元時間圖神經(jīng)網(wǎng)絡(luò)(MTGNN)[28]。它是一個基于GNN 和CNN的模型。通過自適應(yīng)圖來學(xué)習(xí)變量間的依賴關(guān)系,并使用混合跳傳播層和擴張初始層表捕獲時空相關(guān)性。
e)自適應(yīng)圖卷積遞歸網(wǎng)絡(luò)(AGCRN)[29]。它是一種基于GNN和RNN的模型。將GRU和圖卷積在時間和空間上相互結(jié)合,形成了一種自適應(yīng)圖卷積循環(huán)網(wǎng)絡(luò)去捕捉空間和時間上的相關(guān)性。
f)自適應(yīng)時空圖神經(jīng)網(wǎng)絡(luò)(Ada-STNet)[30]。它是一種基于GNN和CNN的模型。從宏觀和微觀兩個角度獲得最優(yōu)圖鄰接矩陣,并通過專用的時空卷積結(jié)構(gòu)捕捉復(fù)雜的時空相關(guān)性。
g)動態(tài)圖卷積遞歸網(wǎng)絡(luò)(DGCRN)[6]。它是一種基于GNN和RNN的模型。通過節(jié)點嵌入過濾生成動態(tài)圖,并與預(yù)定義的靜態(tài)圖相結(jié)合,對動態(tài)圖的精細拓撲進行建模。
實驗選用平均絕對誤差(MAE)、均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)和決定系數(shù)(R2)指標評價模型性能,分別用于度量預(yù)測結(jié)果的準確性、離散度、相對誤差和擬合程度。各指標定義如下:
MAE=1n∑ni=1xi-i(13)
RMSE=1n∑ni=1(xi-i)2(14)
MAPE=1n∑ni=1xi-ixi(15)
R2=1-∑ni=1(xi-i)2∑ni=1(xi-)2(16)
其中:xi為真實值;i為預(yù)測值;為真實值的平均值;n為觀測樣本的總數(shù),本文設(shè)為12。上述指標大小反映了實際值和預(yù)測值之間的差異、模型的預(yù)測精度以及模型擬合程度,通過使用這些指標,可以客觀地比較和評估各種方法的性能,以確定在流量預(yù)測任務(wù)中表現(xiàn)最佳的方法。其中:MAE、RMSE和MAPE的值越小表示模型的預(yù)測能力越好;R2的值越大表示預(yù)測能力越好。
3.5 實驗結(jié)果分析
表3展示了不同模型在公交數(shù)據(jù)集上未來15 min、30 min和60 min預(yù)測的性能。*表示數(shù)值小到可以忽略不計,表明模型的預(yù)測效果較差。從表3可以看出,與2個經(jīng)典時間序列模型(HA、GRU)相比,ASDNet在15 min預(yù)測任務(wù)中RMSE分別降低了8.7%和8.0%,可以看出,經(jīng)典時間序列模型的預(yù)測結(jié)果較差,這可能是因為經(jīng)典時間序列模型通常只關(guān)注時間維度上的數(shù)據(jù)模式和趨勢,而忽略了空間維度上的相關(guān)性和影響。但與HA的R2相比,ASDNet在15 min預(yù)測任務(wù)中降低了2.2%,在60 min預(yù)測任務(wù)中高了7.9%,這可能是因為HA在波動較小的短期數(shù)據(jù)中預(yù)測得更好,但難以處理長期、非平穩(wěn)的時間序列數(shù)據(jù)。
此外,與同時考慮時間和空間相關(guān)性的模型(Graph WaveNet、MTGNN、AGCRN、Ada-STNet和DGCRN)相比,ASDNet在15 min預(yù)測任務(wù)中RMSE分別降低了1.0%、0.6%、1.1%、0.8%和0.8%。其中,與MTGNN相比,RMSE的降幅最小,但是在60 min預(yù)測任務(wù)中RMSE高了48.5%,這可能是因為MTGNN只構(gòu)造自適應(yīng)圖來捕捉交通網(wǎng)絡(luò)中不同節(jié)點之間的空間關(guān)系,而沒有考慮整個路網(wǎng)的全局空間信息,導(dǎo)致模型在長時間預(yù)測時存在一定的局限性。值得注意的是,ASDNet在三種評估指標的短期和長期預(yù)測任務(wù)中都取得了最佳的預(yù)測性能,這主要得益于其充分考慮了圖結(jié)構(gòu)的靜態(tài)性和動態(tài)性,充分利用整體空間信息(長期穩(wěn)定)和局部動態(tài)特性(短期波動)進行預(yù)測。
為了更直觀地說明模型的預(yù)測能力,繪制了MAE和RMSE每個預(yù)測步長的變化趨勢,如圖4所示。從圖中可以看出,隨著預(yù)測步長的增加,其他基準模型的MAE和RMSE比本文ASDNet增長更快,且ASDNet的增長趨勢更平緩,在短期和長期預(yù)測都表現(xiàn)更好。
在捕捉隱藏空間依賴關(guān)系方面,Graph WaveNet具有獨特優(yōu)勢。圖5繪制ASDNet與Graph WaveNet在6:00~22:30時間段內(nèi)預(yù)測值與真實值對比曲線,發(fā)現(xiàn)引入動態(tài)圖構(gòu)造學(xué)習(xí)局部信息的動態(tài)特性的ASDNet曲線更平滑,其結(jié)果更加擬合真實值曲線,相對Graph WaveNet具有更強的魯棒性。此外,ASDNet在捕捉短時隱藏動態(tài)依賴關(guān)系的性能方面優(yōu)于Graph WaveNet,尤其在晚高峰時段(下午17:00~19:00)可能出現(xiàn)突發(fā)交通事件,ASDNet可以更好地預(yù)測和捕捉各站點客流相關(guān)性變化。
3.6 消融實驗
為了進一步驗證本文模型中各個模塊的有效性,使用如下模型變體進行對比:a)W-D,移除動態(tài)圖同構(gòu)網(wǎng)絡(luò)模塊;b)W-G,移除圖卷積模塊。具體實驗結(jié)果如表4所示,ASDNet比變體a)和b)的RMSE分別降低了 0.68%、1.68%。結(jié)果表明:動態(tài)圖同構(gòu)網(wǎng)絡(luò)模塊有助于模型挖掘客流的瞬時波動,圖卷積模塊可有效捕獲站點之間的全局空間信息。通過自適應(yīng)平衡融合機制,彌補兩者之間空間特征的不足,實現(xiàn)更準確的客流預(yù)測。
3.7 靜態(tài)圖與動態(tài)圖區(qū)別
靜態(tài)和動態(tài)圖模擬的模式不同。靜態(tài)圖側(cè)重于整體空間模式,通過考慮每個節(jié)點自身特征,圖卷積可以有效地學(xué)習(xí)整體空間信息,如圖6(a)對角線所示。在圖6(b)中,發(fā)現(xiàn)動態(tài)圖沒有表現(xiàn)出節(jié)點的自身特征,而是幾條明顯的垂直線。這表明動態(tài)圖的重點在于站點之間的關(guān)聯(lián)性,能有效地捕捉站點之間的局部空間信息。
4 結(jié)束語
針對現(xiàn)有公交客流預(yù)測方法未能全面挖掘公交路網(wǎng)空間信息的問題,本文提出了基于自適應(yīng)平衡靜動態(tài)聯(lián)合網(wǎng)絡(luò)的模型。該模型通過擴張因果卷積捕捉節(jié)點的時間相關(guān)性,進一步利用圖卷積捕捉站點之間靜態(tài)空間信息,動態(tài)圖構(gòu)建與學(xué)習(xí)模塊和動態(tài)圖同構(gòu)網(wǎng)絡(luò)捕捉不同變量以及相鄰時隙之間隱藏的動態(tài)依賴關(guān)系,并利用自適應(yīng)平衡機制調(diào)節(jié)靜態(tài)信息和動態(tài)信息的權(quán)重影響,提升模型對短時間內(nèi)突發(fā)事件的適應(yīng)能力。在廣州公交真實數(shù)據(jù)集上進行驗證,結(jié)果表明本文模型具有較好的預(yù)測精度和魯棒性,評估指標基本優(yōu)于其他基線算法。下一步將融合多源數(shù)據(jù)特征,提取不同尺度的時間相關(guān)性,進行相關(guān)的公交客流預(yù)測研究。
參考文獻:
[1]中華人民共和國交通運輸部. 關(guān)于推進城市公共交通健康可持續(xù)發(fā)展的若干意見[J]. 交通財會, 2023(11): 91-93. (Ministry of Transport of the People’s Republic of China. Several opinions on promoting the healthy and sustainable development of urban public transportation[J]. Finance & Accounting for Communications, 2023(11): 91-93.)
[2]張偉, 朱鳳華, 陳圓圓, 等. 基于注意力機制和分時圖卷積的公交客流預(yù)測[J]. 模式識別與人工智能, 2021, 34(2): 167-175. (Zhang Wei, Zhu Fenghua, Chen Yuanyuan, et al. Bus passenger flow forecast based on attention and time-sharing graph convolutional network[J]. Pattern Recognition and Artificial Intelligence, 2021, 34(2): 167-175.)
[3]Zhang Junbo, Zheng Yu, Qi Dekang. Deep spatio-temporal residual networks for citywide crowd flows prediction[C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press, 2017: 1655-1661.
[4]Gong Min, Xiang Fei, Wang Zhihu, et al. Sequential framework for short-term passenger flow prediction at bus stop[J]. Transportation Research Record, 2014, 2417(1): 58-66.
[5]郭翔宇, 彭莉蘭, 李崇壽, 等. 多尺度融合與動態(tài)自適應(yīng)圖的公交客流預(yù)測模型[J]. 計算機科學(xué)與探索, 2024,18(7):1879-1888. (Guo Xiangyu, Peng Lilan, Li Chongshou, et al. Multi-scale fusion and dynamic adaptive graph bus passenger flow prediction model[J]. Journal of Frontiers of Computer Science and Techno-logy,2024,18(7):1879-1888.)
[6]Li Fuxian, Feng Jie, Huan Yan, et al. Dynamic graph convolutional recurrent network for traffic prediction: benchmark and solution[J]. ACM Trans on Knowledge Discovery from Data, 2023, 17(1): 1-21.
[7]Yao Huaxiu, Wu Fei, Ke Jintao, et al. Deep multi-view spatial-temporal network for taxi demand prediction[C]//Proc of AAAI Confe-rence on Artificial Intelligence. Palo Alto,CA: AAAI Press, 2018: 2588-2595.
[8]Li Yaguang, Yu R, Shahabi C, et al. Diffusion convolutional recurrent neural network: data-driven traffic forecasting[EB/OL]. (2018-02-22). https://arxiv.org/abs/1707.01926.
[9]Yao Huaxiu, Tang Xianfeng, Wei Hua, et al. Revisiting spatial-temporal similarity: a deep learning framework for traffic prediction[C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press, 2019: 5668-5675.
[10]Kipf T N, Welling M. Semi-supervised classification with graph con-volutional networks[EB/OL]. (2017-02-22). https://arxiv.org/abs/1609.02907.
[11]Hamilton W L, Ying R, Leskovec J. Inductive representation lear-ning on large graphs[C]//Proc of the 31st International Conference on Neural Information Processing Systems. Red Hook,NY: Curran Associates Inc., 2017: 1025-1035.
[12]Chen Cen, Li Kenli, Teo S G, et al. Gated residual recurrent graph neural networks for traffic prediction[C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press, 2019: 485-492.
[13]Bai Lei, Yao Lina, Kanhere S, et al. STG2Seq: spatial-temporal graph to sequence model for multi-step passenger demand forecasting[C]//Proc of the 28th International Joint Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press, 2019: 1981-1987.
[14]Han Yong, Wang Cheng, Ren Yibin, et al. Short-term prediction of bus passenger flow based on a hybrid optimized LSTM network[J]. ISPRS International Journal of Geo-Information, 2019, 8(9): 366.
[15]Zhang Qingyong, Li Changwu, Su Fuwen, et al. Spatio-temporal residual graph attention network for traffic flow forecasting[J]. IEEE Internet of Things Journal, 2023, 10(13): 11518-11532.
[16]Zhao Ling, Song Yujiao, Zhang Chao, et al. T-GCN: a temporal graph convolutional network for traffic prediction[J]. IEEE Trans on Intelligent Transportation Systems, 2019, 21(9): 3848-3858.
[17]Cai Ling, Janowicz K, Mai Gengchen, et al. Traffic transformer: capturing the continuity and periodicity of time series for traffic forecasting[J]. Transactions in GIS, 2020, 24(3): 736-755.
[18]王璨, 劉朝暉, 王蓓, 等. TCN-KT: 個人基礎(chǔ)與遺忘融合的時間卷積知識追蹤模型[J]. 計算機應(yīng)用研究, 2022, 39(5): 1496-1500. (Wang Can, Liu Chaohui, Wang Bei, et al. TCN-KT: temporal convolutional knowledge tracking model based on fusion of personal basis and forgetting[J]. Application Research of Compu-ters, 2022, 39(5): 1496-1500.)
[19]Yu Bing, Yin Haoteng, Zhu Zhanxing. Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting[C]//Proc of the 27th International Joint Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press, 2018: 3634-3640.
[20]Guo Shengnan, Lin Youfang, Feng Ning, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press, 2019: 922-929.
[21]Luo Dan, Zhao Dong, Ke Qixue, et al. Spatiotemporal hashing multigraph convolutional network for service-level passenger flow forecasting in bus transit systems[J]. IEEE Internet of Things Journal, 2021, 9(9): 6803-6815.
[22]Liu Lingbo, Chen Jingwen, Wu Hefeng, et al. Physical-virtual collaboration modeling for intra-and inter-station metro ridership prediction[J]. IEEE Trans on Intelligent Transportation Systems, 2022, 23(4): 3377-3391.
[23]Liu Huaiyuan, Liu Xianzhang, Yang Donghua, et al. TodyNet: temporal dynamic graph neural network for multivariate time series classification[EB/OL]. (2023-04-11) . https://arxiv.org/abs/2304.05078.
[24]Kingma D P, Ba J. Adam: a method for stochastic optimization[EB/OL]. (2017-01-30). https://arxiv.org/abs/1412.6980.
[25]Guan Wei. A summary of traffic flow forecasting methods[J]. Journal of Highway and Transportation Research and Development, 2004, 21(3): 82-85.
[26]Cho K, Van Merrienboer B, Bahdanau D, et al. On the properties of neural machine translation: encoder-decoder approaches[EB/OL]. (2014).https://arxiv.org/abs/1409.1259.
[27]Wu Zonghan, Pan Shirui, Long Guodong, et al. Graph WaveNet for deep spatial-temporal graph modeling[C]//Proc of the 28th International Joint Conference on Artificial Intelligence. Palo Alto,CA: AAAI Press, 2019: 1907-1913.
[28]Wu Zonghan, Pan Shirui, Long Guodong, et al. Connecting the dots: multivariate time series forecasting with graph neural networks[C]//Proc of the 26th ACM SIGKDD International Conference on Know-ledge Discovery & Data Mining. New York: ACM Press, 2020: 753-763.
[29]Bai Lei, Yao Lina, Li Can, et al. Adaptive graph convolutional recurrent network for traffic forecasting[J]. Advances in Neural Information Processing Systems, 2020, 33: 17804-17815.
[30]Ta Xuxiang, Liu Zihan, Hu Xiao, et al. Adaptive spatio-temporal graph neural network for traffic forecasting[J]. Knowledge-Based Systems, 2022, 242: 108199.