滕 騰,劉正琦,王小敏
(西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,成都 611756)
近年來,城市軌道交通因其便捷舒適、綠色低碳等特點(diǎn)受到大眾青睞,但大客流也造成了高峰時(shí)段站點(diǎn)擁擠、列車晚點(diǎn)等一系列問題[1]??土鞯牟粩嘣黾樱沟枚虝r(shí)客流預(yù)測(cè)成為運(yùn)營(yíng)部門保障行車安全、優(yōu)化行車運(yùn)營(yíng)效率的關(guān)鍵,同時(shí)也為乘客出行規(guī)劃提供參考依據(jù)[2-3]。短時(shí)客流預(yù)測(cè)指預(yù)測(cè)粒度小于15 min的客流預(yù)測(cè),相比中長(zhǎng)期預(yù)測(cè)具有更大的隨機(jī)性和波動(dòng)性,預(yù)測(cè)的準(zhǔn)確性也直接關(guān)系到城市軌道交通組織運(yùn)營(yíng)的高效性和合理性。
針對(duì)城市軌道交通短時(shí)客流預(yù)測(cè),眾多學(xué)者研究采用非線性預(yù)測(cè)方法或組合優(yōu)化模型的預(yù)測(cè)方法,證明了對(duì)短時(shí)客流進(jìn)行預(yù)測(cè)的可行性[4-5]。但常用于客流預(yù)測(cè)問題的卷積神經(jīng)網(wǎng)絡(luò)或循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN ,Recurrent Neural Network)模型受困于梯度消失或梯度爆炸,難以處理存在顯著的季節(jié)特性、長(zhǎng)時(shí)間跨度的數(shù)據(jù),長(zhǎng)短時(shí)記憶(LSTM,Long Short Term Memory )模型對(duì)這些問題進(jìn)行了改進(jìn)。王秋雯等人[6]將LSTM模型與自適應(yīng)K-means算法結(jié)合,并證明了該方法在客流預(yù)測(cè)問題上的有效性;Liu等人[7]將歷史數(shù)據(jù)分為最近、近期和長(zhǎng)期分別輸入LSTM模型中 ,提高了預(yù)測(cè)準(zhǔn)確性。預(yù)測(cè)模型超參數(shù)的選擇至關(guān)重要,影響著模型的好壞,一些研究人員引入優(yōu)化算法進(jìn)行優(yōu)化。仇建華等人[8]使用遺傳算法(GA,Genetic Algorithm)優(yōu)化相關(guān)向量機(jī)的核函數(shù)和核參數(shù);惠陽(yáng)等人[9]使用粒子群算法優(yōu)化BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)。
本文引入能有效處理復(fù)雜非線性問題、優(yōu)化初始值和閾值的GA,對(duì)堆疊式LSTM(SLSTM,Stacked LSTM)模型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化,構(gòu)建了GA-SLSTM預(yù)測(cè)模型。采用該預(yù)測(cè)模型對(duì)車站進(jìn)出站客流進(jìn)行預(yù)測(cè),以杭州市地鐵歷史運(yùn)營(yíng)數(shù)據(jù)為例展開試驗(yàn)。對(duì)比GA-RNN模型和單層未優(yōu)化LSTM模型對(duì)普通站點(diǎn)和換乘站的客流預(yù)測(cè)結(jié)果,證明了本文方法能夠提高短時(shí)客流的預(yù)測(cè)精度。
LSTM模型在1997年由Hochichreiter和Schmidhuber提出[10],保持了RNN模型的鏈狀結(jié)構(gòu),改進(jìn)了RNN模型不能處理長(zhǎng)期依賴的情況,并在一定程度上解決了梯度消失的問題,適用于學(xué)習(xí)具有長(zhǎng)期趨勢(shì)性和周期性的客流序列。LSTM模型單元內(nèi)部結(jié)構(gòu)增加了遺忘門ft、輸入門it和 輸出門ot3個(gè)門限控制,通過Sigmoid函數(shù)和點(diǎn)乘操作,限制序列信息的流入,并將上一時(shí)刻狀態(tài)輸入下一時(shí)刻進(jìn)行計(jì)算,其數(shù)學(xué)表達(dá)式為
其中,xt為t時(shí)刻輸入數(shù)據(jù);σ為Sigmoid函數(shù);{Wi,Wf,Wo,WC}分別為輸入門、遺忘門、輸出門和細(xì)胞狀態(tài)的參數(shù)矩陣; {bi,bf,bo,bC}為輸入門、遺忘門、輸出門和細(xì)胞狀態(tài)的偏移量;為候選細(xì)胞狀態(tài),Ct為 細(xì)胞狀態(tài);ht為隱藏狀態(tài)。
SLSTM模型中有多個(gè)隱藏LSTM層,每層包含多個(gè)LSTM單元,可對(duì)長(zhǎng)期狀態(tài)進(jìn)行處理。Graves等人[11]證明了LSTM層級(jí)的堆疊比增加內(nèi)部LSTM單元具有更好的預(yù)測(cè)性能,可通過加深網(wǎng)絡(luò)層級(jí)解決更加復(fù)雜的問題。SLSTM結(jié)構(gòu)層級(jí)間的狀態(tài)轉(zhuǎn)移如圖1所示,上層的LSTM結(jié)構(gòu)輸出一個(gè)隱藏狀態(tài)序列,輸入到下一層結(jié)構(gòu)中,其中,和分別是第l層t時(shí)刻的細(xì)胞狀態(tài)和隱藏狀態(tài)。
圖1 SLSTM神經(jīng)層狀態(tài)傳遞釋義
GA是生物遺傳和進(jìn)化的優(yōu)化算法,具有較強(qiáng)的全局搜索能力,本文采用GA對(duì)SLSTM模型進(jìn)行優(yōu)化。主要優(yōu)化的參數(shù)有:SLSTM層數(shù)、SLSTM隱藏層每層單元數(shù)量、全連接層層數(shù)、全連接層每層神經(jīng)元個(gè)數(shù)。針對(duì)具有非線性和隨機(jī)性的城市軌道交通短時(shí)客流預(yù)測(cè)問題,建立了GA-SLSTM 預(yù)測(cè)模型,如圖2所示。
圖2 優(yōu)化GA-SLSTM模型流程示意
其中,yi為 真實(shí)值;為預(yù)測(cè)值。均等系數(shù)AEC∈[0,1],其值越接近1表示預(yù)測(cè)值越接近真實(shí)值,則該個(gè)體被選擇的概率也越大,下一代種群根據(jù)適應(yīng)度選擇個(gè)體,并進(jìn)行交叉、變異操作。本文設(shè)置最大種群迭代為20代,重復(fù)選擇、交叉和變異生成隨機(jī)種群,并搭建相應(yīng)模型直至最大種群迭代,輸出預(yù)測(cè)結(jié)果AEC值最大的最優(yōu)個(gè)體和相應(yīng)預(yù)測(cè)模型。
由于乘客日常出行具有規(guī)律性,站點(diǎn)進(jìn)出站客流表現(xiàn)出明顯的周期性,同時(shí),由于天氣、突發(fā)活動(dòng)等隨機(jī)因素的影響,使其具有波動(dòng)性。本文以杭州市1號(hào)線普通站點(diǎn)西興站和換乘站火車東站為例分析客流變化特征。
2019年1月5—25日西興站3個(gè)星期內(nèi)的客流進(jìn)站情況如圖3所示。從圖3中可知,單日內(nèi)客流隨機(jī)波動(dòng)大,1個(gè)星期內(nèi)客流曲線存在相似性,工作日和休息日客流特性呈現(xiàn)出明顯差異,工作日表現(xiàn)出雙峰型客流特征,休息日表現(xiàn)出明顯的無峰型客流特征;星期與星期之間客流變化趨勢(shì)相似,具有明顯的周期性。
圖3 西興站進(jìn)站客流的周期特性
采用層次聚類算法將1個(gè)星期7天客流量作為聚類特征,簇間樣本點(diǎn)間距離采用歐式距離計(jì)算,生成層次聚類樹形圖如圖4所示,虛線為類別分割線。從圖4中可看出,虛線將西興站1個(gè)星期進(jìn)站客流劃分為星期一~星期五和休息日兩類,工作日和休息日客流特征分化明顯,可將1個(gè)星期內(nèi)的進(jìn)站客流量分為工作日和休息日2類。而屬于換乘站的火車東站工作日與休息日之間客流分布沒有明顯相似性,每一天客流趨勢(shì)都被單獨(dú)劃分,與其余幾天歐式距離較大。西興站2個(gè)星期之間每日客流的Spearman相關(guān)系數(shù)如表1所示。從表1中可知,工作日與上個(gè)星期工作日間相關(guān)系數(shù)大,相關(guān)系數(shù)最大值在上個(gè)星期相鄰幾日間略有浮動(dòng),和上個(gè)星期工作日的相關(guān)系數(shù)較小;休息日和上個(gè)星期工作日相關(guān)性小,星期六和星期日分別與上個(gè)星期六和上個(gè)星期日相關(guān)系數(shù)最大,周期性明顯。
圖4 7天內(nèi)客流層次聚類
表1 西興站2個(gè)星期之間客流Spearman相關(guān)系數(shù)
車站1日內(nèi)進(jìn)出站客流體現(xiàn)出固定的客流趨勢(shì),分為單峰型、雙峰型、全峰型和無峰型,早晚高峰不同時(shí)間段和平峰不同時(shí)間段間客流存在相似性。圖5是星期一不同時(shí)間段進(jìn)站客流層次聚類的散點(diǎn)圖,選用刷卡閘機(jī)數(shù)/min、客流量/min、當(dāng)前時(shí)間段客流量、前后時(shí)間段客流量等23維聚類特征映射到多維空間進(jìn)行聚類。西興站遠(yuǎn)離市中心,全天客流量較小,高峰時(shí)進(jìn)站客流量在60 人/min左右,平峰時(shí)在5 人/min左右?;疖嚃|站屬于全峰型客流特征,高峰客流達(dá)到150 人/min。雖然不同站點(diǎn)日內(nèi)客流分布不同,但圖5中高峰段和平峰段等不同時(shí)間段分類明顯。
圖5 1日內(nèi)不同時(shí)間段進(jìn)站客流量聚類
本文采用2019年1月5—25日杭州市地鐵AFC系統(tǒng)的歷史刷卡記錄作為實(shí)驗(yàn)數(shù)據(jù),共81個(gè)站點(diǎn),每天約200萬(wàn)條刷卡記錄。每條刷卡記錄的數(shù)據(jù)包含刷卡時(shí)間、用戶ID、站臺(tái)編號(hào)閘機(jī)設(shè)備編號(hào)、進(jìn)出站狀態(tài)、線路號(hào)和支付類型。檢查重復(fù)值和空值后,整理成10 min為粒度的進(jìn)出站客流數(shù)據(jù)樣本,整理后共291600個(gè)數(shù)據(jù)樣本。將2019年1月5—21日的數(shù)據(jù)作為訓(xùn)練集,2019年1月22—24日的數(shù)據(jù)為驗(yàn)證集,對(duì)2019年1月25日站點(diǎn)進(jìn)出站客流進(jìn)行10 min粒度預(yù)測(cè)。
提取乘客進(jìn)出站時(shí)間、星期、每10 min間隔的進(jìn)出站刷卡閘機(jī)的數(shù)量和天氣等14維基本特征,其中,天氣特征包括空氣質(zhì)量、風(fēng)向、風(fēng)速、氣溫和狀態(tài)(晴、陰、雨)。將1日內(nèi)每10 min和1個(gè)星期內(nèi)每天客流量聚類結(jié)果進(jìn)行定量轉(zhuǎn)換,提取每類的類別標(biāo)簽、平均值和方差作為1日內(nèi)和1個(gè)星期內(nèi)時(shí)間特征。2個(gè)星期之間的時(shí)間特征直接提取上個(gè)星期Spearman相關(guān)系數(shù)最大的一天的客流數(shù)據(jù)。
圖6是對(duì)西興站的預(yù)測(cè)模型進(jìn)行GA優(yōu)化的前11代種群的適應(yīng)度曲線。可以看出,第4代之后適應(yīng)度值趨于平穩(wěn),第11代種群的適應(yīng)度基本高于0.9,逐漸收斂于全局最優(yōu)解。因此,設(shè)置最大種群迭代為20代,每代有10個(gè)個(gè)體。
圖6 遺傳算法優(yōu)化模型前11代適應(yīng)度曲線
為更加直觀地衡量預(yù)測(cè)效果,引入平均絕對(duì)誤差(MAE ,Mean Absolute Error)、均方根誤差(RMSE ,Root Mean Square Error)和決定系數(shù)(R2)對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),計(jì)算公式為
EMAE表示平均預(yù)測(cè)差值程度,ERMSE表示單位時(shí)間間隔平均預(yù)測(cè)誤差的人數(shù),因此EMAE、ERMSE越小,預(yù)測(cè)精確度越高。ER2代表模型對(duì)數(shù)據(jù)的擬合程度,數(shù)值越大,預(yù)測(cè)值越接近真實(shí)值。
LSTM模型是RNN模型的繼承和發(fā)展,因此選取GA-RNN模型和單層未優(yōu)化LSTM模型與本文提出的GA-SLSTM預(yù)測(cè)模型進(jìn)行對(duì)比,每種模型訓(xùn)練3次取預(yù)測(cè)結(jié)果評(píng)價(jià)指標(biāo)的平均值。單層LSTM模型的神經(jīng)元個(gè)數(shù)在[32, 256]范圍內(nèi)、間隔32的數(shù)組中依次選取,以EMAE最小值的預(yù)測(cè)值作為預(yù)測(cè)結(jié)果。
3.3.1 普通站點(diǎn)預(yù)測(cè)結(jié)果
不同模型對(duì)西興站的預(yù)測(cè)值與真實(shí)值曲線如圖7所示,預(yù)測(cè)評(píng)價(jià)指標(biāo)如表2所示??梢?,本文提出的方法各項(xiàng)指標(biāo)均優(yōu)于其他方法,預(yù)測(cè)值更接近真實(shí)值,ER2可達(dá)0.95。
圖7 西興站不同模型預(yù)測(cè)結(jié)果
3.3.2 換乘站點(diǎn)預(yù)測(cè)結(jié)果
不同模型對(duì)換乘站火車東站的預(yù)測(cè)值及真實(shí)值曲線如圖8所示,預(yù)測(cè)評(píng)價(jià)指標(biāo)如表3所示。由于換乘站客流隨機(jī)波動(dòng)大,周期特征不明顯,預(yù)測(cè)準(zhǔn)確度低于普通站點(diǎn)。不同模型的預(yù)測(cè)值基本符合真實(shí)值,本文提出的方法各項(xiàng)指標(biāo)均優(yōu)于其他方法。
表3 火車東站不同模型預(yù)測(cè)指標(biāo)對(duì)比
圖8 火車東站不同模型預(yù)測(cè)結(jié)果
實(shí)驗(yàn)結(jié)果表明,本文提出GA-SLSTM模型能夠提高城市軌道交通短時(shí)客流預(yù)測(cè)準(zhǔn)確性。引入GA優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),相比手動(dòng)調(diào)參等方式,使得模型更有說服性。優(yōu)化后的SLSTM預(yù)測(cè)模型能夠?qū)W習(xí)長(zhǎng)序列信息,精確預(yù)測(cè)客流變化,無論是在普通站點(diǎn)還是在換乘站點(diǎn),其預(yù)測(cè)效果都明顯優(yōu)于其他模型。此外,為更好地提高短時(shí)客流預(yù)測(cè)準(zhǔn)確性,下一步需對(duì)換乘站的大客流數(shù)據(jù)進(jìn)行趨勢(shì)、周期和噪聲分解分析及研究,進(jìn)一步提高換乘站預(yù)測(cè)準(zhǔn)確性。