摘要 文章針對(duì)城市公交OD客流預(yù)測(cè)問(wèn)題,提出了一種融合圖注意力網(wǎng)絡(luò)和多源數(shù)據(jù)的時(shí)空客流預(yù)測(cè)模型。首先,通過(guò)構(gòu)建時(shí)空?qǐng)D注意力網(wǎng)絡(luò)模型STGAT(Spatio-Temporal Graph Attention Network),引入圖注意力機(jī)制自適應(yīng)學(xué)習(xí)站點(diǎn)間的影響權(quán)重;然后,引入站點(diǎn)POI等空間特征增強(qiáng)模型的解釋性;最后,通過(guò)案例分析表明,所提出的STGAT模型在客流預(yù)測(cè)的精度和穩(wěn)定性方面均優(yōu)于其他主流方法。
關(guān)鍵詞 公交客流預(yù)測(cè);圖注意力網(wǎng)絡(luò);時(shí)空依賴(lài);POI
中圖分類(lèi)號(hào) U121 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-8949(2024)24-0046-03
0 引言
近年來(lái),城市規(guī)模不斷擴(kuò)大,人口數(shù)量持續(xù)增長(zhǎng),由此帶來(lái)的交通擁堵、環(huán)境污染等問(wèn)題日益嚴(yán)重,已成為制約城市可持續(xù)發(fā)展的關(guān)鍵因素,因此準(zhǔn)確預(yù)測(cè)公交客流需求,特別是OD(Original Destination)客流分布,是制定公交合理調(diào)度方案的前提。
Yang[1]等人利用LSTM神經(jīng)網(wǎng)絡(luò)模型處理時(shí)間序列的優(yōu)勢(shì),提出了ELF-LSTM遞歸神經(jīng)網(wǎng)絡(luò)模型對(duì)短時(shí)OD客流進(jìn)行預(yù)測(cè),該模型克服了因時(shí)間滯后導(dǎo)致的長(zhǎng)時(shí)間依賴(lài)性學(xué)習(xí)不足的局限性;侯曉云[2]等人將MLR、KNN、XGBoost和LSTM進(jìn)行集成,通過(guò)預(yù)測(cè)結(jié)果對(duì)比發(fā)現(xiàn)集成模型的預(yù)測(cè)效果優(yōu)于子模型;Yang[3]等人提出了一種基于時(shí)間的城市軌道交通客流分層網(wǎng)絡(luò)模型,該模型在深度優(yōu)化框架下,能夠有效地獲得相對(duì)準(zhǔn)確的客流估計(jì)結(jié)果。
該文提出一種融合圖注意力網(wǎng)絡(luò)和多源數(shù)據(jù)的時(shí)空客流預(yù)測(cè)模型,通過(guò)對(duì)北京公交1路車(chē)IC刷卡數(shù)據(jù)和站點(diǎn)POI數(shù)據(jù)的分析,揭示客流在時(shí)空維度上的分布特征;通過(guò)構(gòu)建時(shí)空?qǐng)D注意力網(wǎng)絡(luò)模型,引入圖注意力機(jī)制自適應(yīng)學(xué)習(xí)站點(diǎn)影響權(quán)重,結(jié)合門(mén)控循環(huán)單元捕捉客流時(shí)序依賴(lài),并引入POI等空間特征增強(qiáng)解釋性,最后通過(guò)案例驗(yàn)證所提模型在預(yù)測(cè)精度和穩(wěn)定性方面的優(yōu)異
性能。
1 相關(guān)理論與數(shù)據(jù)準(zhǔn)備
1.1 公交IC刷卡數(shù)據(jù)
該文采集了北京公交1路車(chē)IC刷卡數(shù)據(jù)及各站點(diǎn)附近的POI情況,然后利用公交線路和站點(diǎn)基礎(chǔ)信息匹配其站點(diǎn)名和站點(diǎn)編號(hào),從而得到模型和算法可用的OD矩陣數(shù)據(jù),最后基于線路站點(diǎn)基礎(chǔ)信息中匹配的站點(diǎn)名和站點(diǎn)編號(hào),根據(jù)運(yùn)營(yíng)時(shí)間每小時(shí)將矩陣數(shù)據(jù)生成一個(gè)矩陣,一天運(yùn)營(yíng)時(shí)間為5:00—24:00,所以一天共有19個(gè)矩陣。
使用Arc GIS的緩沖區(qū)分析工具,建立北京公交1路車(chē)各站點(diǎn)500 m范圍內(nèi)的緩沖區(qū),通過(guò)對(duì)七種不同類(lèi)型的POI數(shù)據(jù)進(jìn)行KMO和巴特利特檢驗(yàn),逐步剔除關(guān)聯(lián)不大的POI類(lèi)型,最終確定五種與客流相關(guān)性較大的POI,分別是醫(yī)療保健、體育休閑服務(wù)、科教文化、購(gòu)物、商務(wù)住宅,其中KMO檢驗(yàn)值為0.86(gt;0.6)、Bartlett球形檢驗(yàn)概率值為0.000(lt;0.01),可以判斷相關(guān)系數(shù)矩陣不是單位矩陣,原始變量存在相關(guān)關(guān)系,可以對(duì)客流的吸引力進(jìn)行解釋。
1.2 POI權(quán)重分析
POI,全稱(chēng)為“Point of Interest”,可以泛指所有能夠抽象為點(diǎn)的地理實(shí)體,該文采用相關(guān)系數(shù)法,即以POI核密度與客流量之間的相關(guān)系數(shù)為權(quán)重[4],通過(guò)GIS進(jìn)行疊加分析,確定各類(lèi)POI數(shù)據(jù)的權(quán)重,在各類(lèi)POI數(shù)據(jù)分級(jí)評(píng)分的基礎(chǔ)上對(duì)各類(lèi)POI數(shù)據(jù)的分析結(jié)果進(jìn)行加權(quán)疊加,最終得到這五種類(lèi)型的POI權(quán)重如表1所示:
將POI權(quán)重分析的結(jié)果與前文的客流時(shí)空分布特征分析結(jié)果進(jìn)行結(jié)合,發(fā)現(xiàn)不同站點(diǎn)的客流不均勻性與周邊POI的豐富性和類(lèi)型密切相關(guān)。
2 基于時(shí)空?qǐng)D注意力網(wǎng)絡(luò)的OD客流預(yù)測(cè)
STGAT通過(guò)引入圖注意力機(jī)制刻畫(huà)各站點(diǎn)之間的空間依賴(lài),并使用門(mén)控循環(huán)單元捕捉客流在不同時(shí)間尺度上的演變規(guī)律。
(1)模型輸入與圖構(gòu)建。該文將道路網(wǎng)絡(luò)定義為一張有向帶權(quán)圖G=(V, E, A),其中,V=v1,v1,…,vN,表示N個(gè)公交站點(diǎn)的集合;E表示站點(diǎn)間的連接關(guān)系;為鄰接矩陣,表示站點(diǎn)間的距離;在每個(gè)時(shí)間步t,輸入表示N個(gè)站點(diǎn)的P維特征,包括各站點(diǎn)的進(jìn)出站客流量、POI密度及相應(yīng)權(quán)重。
(2)時(shí)空卷積層。圖注意力模塊負(fù)責(zé)對(duì)站點(diǎn)間的空間依賴(lài)進(jìn)行建模,其計(jì)算過(guò)程可以表示如下:
(1)
式中,——第l層空間卷積后站點(diǎn)的特征向量;——可學(xué)習(xí)的權(quán)重矩陣;——站點(diǎn)對(duì)站點(diǎn)的注意力權(quán)重;Ni——站點(diǎn)的鄰居集合。
在對(duì)站點(diǎn)信息進(jìn)行空間聚合后,通過(guò)門(mén)控循環(huán)單元進(jìn)一步對(duì)時(shí)序信息進(jìn)行建模,而對(duì)于STGAT的GRU門(mén)控機(jī)制,則通過(guò)更新門(mén)zt和重置門(mén)rt控制其隱藏狀態(tài)的信息流:
(2)
(3)
(4)
(5)
式中,xt——t時(shí)刻的輸入;——上一時(shí)刻的隱藏狀態(tài)。
對(duì)于預(yù)測(cè)未來(lái)個(gè)時(shí)間步的客流分布,則STGAT的輸出可以表示如下:
(6)
式中,Th——?dú)v史時(shí)間步數(shù)。
(3)模型訓(xùn)練與優(yōu)化。模型以端到端的方式進(jìn)行訓(xùn)練,以各站點(diǎn)歷史客流數(shù)據(jù)為輸入,以未來(lái)Tp個(gè)時(shí)間步的OD矩陣為監(jiān)督信號(hào)。其中,Xt分別為時(shí)間步t的真實(shí)OD矩陣,Tp為預(yù)測(cè)時(shí)間步數(shù)。
3 案例分析
STGAT模型的實(shí)例驗(yàn)證選取2019年北京市公交1路車(chē)上行方向的OD客流量數(shù)據(jù),對(duì)數(shù)據(jù)集進(jìn)行劃分,將1—11月數(shù)據(jù)作為訓(xùn)練集、12月前三周數(shù)據(jù)作為測(cè)試集、12月第四周數(shù)據(jù)作為預(yù)測(cè)集,分別采用CNN、RNN、LSTM、GCN這四種預(yù)測(cè)模型對(duì)OD客流進(jìn)行預(yù)測(cè)對(duì)比分析,見(jiàn)圖1所示。
STGAT模型的驗(yàn)證選取2019年北京公交1路車(chē)下行方向的OD客流量數(shù)據(jù),經(jīng)過(guò)上述對(duì)數(shù)據(jù)的處理可以得知,同樣采用CNN、RNN、LSTM、GCN這四種預(yù)測(cè)模型對(duì)OD客流進(jìn)行預(yù)測(cè)對(duì)比分析,見(jiàn)圖2所示:
圖1和圖2分別展示了各模型在北京公交1路車(chē)上、下行方向OD客流預(yù)測(cè)中的性能對(duì)比。從圖中可以看出,STGAT模型的預(yù)測(cè)結(jié)果最接近真實(shí)值,對(duì)客流量的變化趨勢(shì)和峰值捕捉得最為準(zhǔn)確。其次是GCN和LSTM模型,它們雖然在一些時(shí)段的預(yù)測(cè)值與真實(shí)值有所偏離,但總體上仍然能夠較好地?cái)M合客流量的變化趨勢(shì)。
各模型評(píng)價(jià)指標(biāo)對(duì)比如表2所示:
由表2中的評(píng)價(jià)指標(biāo)比較表明,在北京公交1路上、下行方向的OD客流預(yù)測(cè)中:STGAT模型在該數(shù)據(jù)集上的預(yù)測(cè)性能最優(yōu),這表明STGAT模型能夠很好地捕捉數(shù)據(jù)的內(nèi)在模式和趨勢(shì)。
4 結(jié)語(yǔ)
時(shí)空客流預(yù)測(cè)模型STGAT通過(guò)構(gòu)建時(shí)空?qǐng)D注意力網(wǎng)絡(luò),引入圖注意力機(jī)制自適應(yīng)學(xué)習(xí)站點(diǎn)之間的影響權(quán)重,捕捉客流在時(shí)空維度上的演變規(guī)律,同時(shí)結(jié)合站點(diǎn)POI等空間特征,增強(qiáng)了模型的解釋性。
參考文獻(xiàn)
[1]Yang D,Chen K,Yang M,et al.Urban rail transit passenger flow forecast based on LSTM with enhanced long-term features[J].Intelligent Transport Systems,IET, 2019,13(10): 1475-1482.
[2]侯曉云,邵麗萍,李靜,等.基于深度學(xué)習(xí)的城市軌道交通短時(shí)客流起訖點(diǎn)預(yù)測(cè)[J].城市軌道交通研究, 2020(1):55-58+115.
[3]Yang Y,Liu J,Shang P,et al.Dynamic Origin-Destination Matrix Estimation Based on Urban Rail Transit AFC Data: Deep Optimization Framework with Forward Passing and Backpropagation Techniques[J].Journal of Advanced Transportation, 2020:1-16.
[4]何惠雨,付曉,呂啟航.突發(fā)事件影響下的城市居民出行活動(dòng)時(shí)空模式研究[J].時(shí)空信息學(xué)報(bào), 2024(2):259-268.