王 忻,李 曄,張思韜,張凌云
(鐵科院(北京)工程咨詢有限公司,北京 100081)
我國(guó)城市化正進(jìn)入高速發(fā)展時(shí)期,越來越多的城市建立了城市軌道交通系統(tǒng),并且城市軌道交通在公共交通中的作用越來越顯著,“智慧化”成為城市軌道交通未來的發(fā)展趨勢(shì)[1]。而精準(zhǔn)的客流預(yù)測(cè)是建設(shè)智慧化城市軌道交通的重要前提,能實(shí)現(xiàn)高峰客流的提前感知,可為運(yùn)營(yíng)期間進(jìn)行動(dòng)態(tài)運(yùn)力調(diào)整提供數(shù)據(jù)基礎(chǔ),進(jìn)而為城市軌道交通的安全高效運(yùn)營(yíng)提供保障[2]。
目前,短時(shí)客流預(yù)測(cè)主要基于2類模型:傳統(tǒng)統(tǒng)計(jì)模型和機(jī)器學(xué)習(xí)模型。傳統(tǒng)統(tǒng)計(jì)模型從機(jī)理上對(duì)線性系統(tǒng)進(jìn)行刻畫,具有原理簡(jiǎn)單、方便計(jì)算等優(yōu)點(diǎn)。蔡昌俊等構(gòu)建差分整合移動(dòng)平均自回歸模型(ARIMA)實(shí)現(xiàn)進(jìn)出站客流的精準(zhǔn)預(yù)測(cè)[3]。邵必林等在ARIMA模型的基礎(chǔ)上應(yīng)用季節(jié)移動(dòng)平均自回歸模型(SARIMA)實(shí)現(xiàn)客流數(shù)據(jù)線性建模[4]。帥春燕等基于支持向量回歸模型實(shí)現(xiàn)站點(diǎn)短時(shí)進(jìn)出站客流預(yù)測(cè)[5]。但傳統(tǒng)數(shù)理統(tǒng)計(jì)模型存在對(duì)實(shí)際問題進(jìn)行簡(jiǎn)化和假設(shè)的問題,對(duì)于地鐵時(shí)序客流重的非線性特征難以刻畫,導(dǎo)致預(yù)測(cè)精度不高[6]。因此,隨著計(jì)算機(jī)技術(shù)的發(fā)展,基于機(jī)器學(xué)習(xí)模型的預(yù)測(cè)算法成為目前較為流行的客流預(yù)測(cè)算法,對(duì)于交通客流復(fù)雜時(shí)空特征具有較好的捕獲效果[7]。魏姝瑤等將長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSMT)與傳統(tǒng)統(tǒng)計(jì)模型結(jié)合提出SARIMA-LSTM模型[8],但是該模型缺少對(duì)空間特征的刻畫。Cao等利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)提取空間特征提升了預(yù)測(cè)效果[9],但對(duì)時(shí)間特征刻畫不足。唐繼強(qiáng)等利用圖卷積結(jié)合LSTM進(jìn)行預(yù)測(cè)網(wǎng)絡(luò)搭建,同時(shí)考慮了客流的時(shí)空特征[10],但僅為圖卷積模塊和LSTM模塊的拼接,并沒實(shí)現(xiàn)模型的深度融合。
由于城市軌道交通進(jìn)出站客流是一個(gè)復(fù)雜的非線性系統(tǒng),在時(shí)間維度上存在短期波動(dòng)性以及長(zhǎng)期的周期性,同時(shí)在空間上由于站點(diǎn)之間的相關(guān)性導(dǎo)致站點(diǎn)客流與站點(diǎn)客流之間具有復(fù)雜的空間相關(guān)性。目前研究忽略了客流之間的相互影響,缺少對(duì)站點(diǎn)短時(shí)客流之間的時(shí)空關(guān)系深入挖掘,無法實(shí)現(xiàn)時(shí)空特征的深度融合,導(dǎo)致目前短期客流預(yù)測(cè)存在精度不高的問題。
綜上所述,本文提出一種基于多層卷積長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(ConvLSTM)的城市軌道交通短時(shí)客流預(yù)測(cè)模型,充分考慮時(shí)序客流的時(shí)間特征和站點(diǎn)與站點(diǎn)間的空間特征,實(shí)現(xiàn)了時(shí)間特征和空間特征的刻畫和融合,相比于現(xiàn)有模型具有更好預(yù)測(cè)效果。
LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的變體,是處理時(shí)間序列預(yù)測(cè)問題的常用機(jī)器學(xué)習(xí)方法,解決了RNN因?yàn)樘荻缺ê吞荻认?dǎo)致的無法保存長(zhǎng)期序列特征的問題[11],如圖1所示。ConvLSTM將LSTM拓展至二維,將LSTM中的一部分全連接過程替換為卷積運(yùn)算,強(qiáng)化了LSTM無法刻畫的空間特征,可處理多維數(shù)據(jù)的時(shí)序預(yù)測(cè)問題[12],如圖2所示。
圖1 長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖2 卷積長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
ConvLSMT的計(jì)算原理類似于LSTM,具有3種類型的門結(jié)構(gòu):遺忘門、輸入門和輸出門。遺忘門決定應(yīng)丟棄或保留哪些信息,控制前一個(gè)隱藏狀態(tài)的信息和當(dāng)前輸入信息傳遞的保留程度,如式(1)所示:
式(1)中,ft為遺忘門,控制過去輸入信息累積;σ為sigmoid激活函數(shù);Xt為時(shí)間t的輸入矩陣序列;Wx為輸入序列的卷積權(quán)重;Ht-1為前一時(shí)刻隱藏狀態(tài)單元;Wh為隱藏單元的卷積權(quán)重;Ct-1為前一時(shí)刻神經(jīng)元狀態(tài)單元;Wf為遺忘門卷積權(quán)重;bf為遺忘門偏置;*為卷積運(yùn)算;為哈達(dá)瑪積運(yùn)算。
輸入門用于決定輸入神經(jīng)元狀態(tài)的信息,控制前一層隱藏狀態(tài)的信息和當(dāng)前輸入的信息傳遞后的信息更新程度,如式(2)所示:
式(2)中,it為輸入門,控制當(dāng)前輸入信息保留多少;Wi為輸入門卷積權(quán)重;bi為輸入門偏置。
輸出門用來確定下一個(gè)隱藏狀態(tài)的值,隱藏狀態(tài)包含了先前輸入的信息,如式(3)所示:
式(3)中,ot為輸出門,控制當(dāng)前狀態(tài)有多少信息對(duì)外可見;Wo為輸出門卷積權(quán)重;bo為輸出門偏置。
最后隱藏狀態(tài)和神經(jīng)元狀態(tài)計(jì)算如式(4)~式(6)所示:
式(4)~式(6)中,Ct為神經(jīng)元狀態(tài);為臨時(shí)單元;bc為殘差;Ht-1和Ht分別為前一時(shí)刻隱藏狀態(tài)和當(dāng)前時(shí)刻隱藏狀態(tài)單元。
本文提出基于多層ConvLSTM的短時(shí)預(yù)測(cè)模型(M-ConvLSTM),通過ConvLSTM中的卷積操作獲取站點(diǎn)間客流的空間特征以及LSTM機(jī)制捕獲時(shí)序客流的時(shí)間特征,實(shí)現(xiàn)對(duì)下一時(shí)間間隔內(nèi)的路網(wǎng)客流預(yù)測(cè)。該方法主要分為2個(gè)部分:第1部分通過多層ConvLSTM捕獲路網(wǎng)客流的時(shí)空特征;第2部分引入二維卷積對(duì)空間特征進(jìn)一步強(qiáng)化,如圖3所示。
圖3 多層ConvLSTM短時(shí)預(yù)測(cè)模型
其中,ConvLSTM 3×1×10代表該層采用10個(gè)大小為3×1的卷積核的卷積長(zhǎng)短期記憶層,Conv2D 3×10代表該層采用3×10的卷積核的卷積層,BN+ReLU為激活層及線性整流。模型輸入為前序的路網(wǎng)進(jìn)出站量序列Pt,輸出為預(yù)測(cè)的路網(wǎng)進(jìn)出站量pt:
式(7)中,Conv2D為二維卷積;M - ConvLSTM為多層ConvLSTM。
某城市地鐵路網(wǎng)共設(shè)23座車站,運(yùn)營(yíng)時(shí)間為早6 : 00 — 22 : 00。選用城市2021年6月至12月共7個(gè)月的進(jìn)出站數(shù)據(jù),在進(jìn)行配對(duì)分析之后,得到了相應(yīng)的斷面流量數(shù)據(jù),將工作日與周末、法定節(jié)假日等分別統(tǒng)計(jì),得到4個(gè)圖像,分別對(duì)應(yīng)工作日上行、工作日下行、節(jié)假日上行、節(jié)假日下行。每張圖片中橫軸代表時(shí)間,縱軸代表區(qū)間斷面,如圖4所示。該線路客流在工作日呈現(xiàn)明顯的早晚雙高峰,分別在7 : 30和18 : 00前后;同時(shí),上下行呈現(xiàn)明顯的對(duì)稱分布,早晨上行與晚上下行在區(qū)間和客流密度上都呈現(xiàn)出很大的相似性,與工作日一般客流特點(diǎn)一致。節(jié)假日客流整體上大于工作日客流,也呈現(xiàn)了一定的早晚高峰現(xiàn)象,但是其分布更加分散,在全天均有相對(duì)高的客流,并且對(duì)稱性不如工作日明顯。
圖4 不同時(shí)間上下行客流熱度圖
本文采用其2021年8月至9月去除周末及節(jié)假日共44天的30 min粒度自動(dòng)售票系統(tǒng)(AFC)數(shù)據(jù)進(jìn)行案例分析,其中前26天為訓(xùn)練集,之后9天為驗(yàn)證集,最后9天為測(cè)試集。
本文選用平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(WMAPE)作為評(píng)價(jià)指標(biāo)對(duì)預(yù)測(cè)精度進(jìn)行評(píng)價(jià),如式(8)~式(10)所示:
為評(píng)價(jià)本文M-ConvLSTM模型預(yù)測(cè)效果,選用多個(gè)模型進(jìn)行對(duì)照分析,包括:支持向量回歸(SVR)[13]、LSTM和ConvLSTM,對(duì)下一時(shí)段路網(wǎng)進(jìn)站量預(yù)測(cè)結(jié)果如表1所示。
表1 各模型預(yù)測(cè)結(jié)果對(duì)比
由表可知,本文模型在各項(xiàng)評(píng)估指標(biāo)均優(yōu)于基準(zhǔn)模型,對(duì)比SVR、LSTM和ConvLSTM本文模型在MAE上提升了72.2%、54.1%和18.7%。通過WMAPE指標(biāo)可看出本文模型相比基準(zhǔn)模型分別提升了39.99%、26.65%和5.68%的預(yù)測(cè)準(zhǔn)確率。說明本文提出的M-ConvLSTM模型在預(yù)測(cè)過程中充分捕獲了客流數(shù)據(jù)間的時(shí)空特征,具有良好的預(yù)測(cè)精度。
為直觀觀察算法預(yù)測(cè)效果,以路網(wǎng)中某站為例繪制進(jìn)站量時(shí)序圖,如圖5所示。可觀察到本文模型預(yù)測(cè)結(jié)果與實(shí)際值高度吻合,預(yù)測(cè)值在時(shí)序上呈雙峰特征,與現(xiàn)實(shí)物理世界規(guī)律一致,且不僅在峰值時(shí)段具有較好的擬合效果,在非高峰時(shí)段的低谷時(shí)段對(duì)波動(dòng)客流量的預(yù)測(cè)效果也同樣良好,說明本文模型在時(shí)間上具有較強(qiáng)的時(shí)間特征捕獲能力。
圖5 M-ConvLSTM預(yù)測(cè)結(jié)果與真實(shí)值對(duì)比
同時(shí),進(jìn)一步觀察各個(gè)站點(diǎn)的預(yù)測(cè)WMAPE,如圖6所示??捎^察到本文模型在大部分站點(diǎn)的WMAPE值較低,且在各站點(diǎn)的預(yù)測(cè)準(zhǔn)確率均高于基準(zhǔn)模型,對(duì)于所有類型的站點(diǎn)均有較好的預(yù)測(cè)精度,說明本文模型通過卷積操作,挖掘到不同站點(diǎn)間的空間關(guān)系,在空間上具有較強(qiáng)的空間特征捕獲能力。
圖6 各站點(diǎn)預(yù)測(cè)誤差分布
本文針對(duì)城市軌道交通路網(wǎng)短時(shí)客流預(yù)測(cè)問題,構(gòu)建了基于多層ConvLSTM的短時(shí)預(yù)測(cè)模型,通過ConvLSTM中的卷積操作獲取站點(diǎn)間客流的空間特征以及LSTM機(jī)制捕獲時(shí)序客流的時(shí)間特征。在某城市地鐵數(shù)據(jù)集上進(jìn)行案例驗(yàn)證以及分析,結(jié)果表明本文模型在預(yù)測(cè)精度上具有較好效果,能夠充分捕獲路網(wǎng)客流的時(shí)空特征。
精準(zhǔn)的客流預(yù)測(cè)能夠及時(shí)有效地預(yù)測(cè)未來路網(wǎng)信息,幫助運(yùn)營(yíng)部門提前感知高峰客流,為運(yùn)力的動(dòng)態(tài)調(diào)整提供數(shù)據(jù)基礎(chǔ),具有較高的研究?jī)r(jià)值和應(yīng)用價(jià)值。未來研究可引入外部因素如天氣、突發(fā)事件等信息,進(jìn)一步提升模型的泛用性和預(yù)測(cè)精度。