張國赟 金 輝
(遼寧工業(yè)大學(xué)汽車與交通工程學(xué)院 遼寧 錦州 121001)
近年來中國經(jīng)濟(jì)水平迅速提升,交通行業(yè)中乘客出行對交通工具的需求量大幅度增加,中國城市軌道交通的水平也步入快速發(fā)展的新篇章。出于緩和城市交通擁堵問題的考慮,給城市居民帶來更快速、更優(yōu)質(zhì)的出行服務(wù),越來越多的城市選擇具有客運(yùn)量大的公共交通系統(tǒng)來解決這一問題。而城市軌道交通很快成為城市公共交通系統(tǒng)中交通工具的第一選擇,不但因?yàn)槠淇瓦\(yùn)量大,更是因?yàn)槠渚哂锌旖菅杆俚韧怀鎏攸c(diǎn)。因此,做到對城市軌道交通站點(diǎn)的短時客流量的準(zhǔn)確預(yù)測是非常有必要的。
對城市軌道交通站點(diǎn)的短時客流預(yù)測的模型現(xiàn)如今主要分成以下幾類,第一類有基于時間序列的預(yù)測模型[1]、基于回歸分析的預(yù)測模型[2]等,統(tǒng)稱為線性預(yù)測模型,這類模型容易理解,有利于決策分析,但難以很好地表達(dá)高度復(fù)雜的數(shù)據(jù);第二類有小波理論預(yù)測模型[3]等,統(tǒng)稱為非線性預(yù)測模型;第三類有元胞自動機(jī)模型[4]等,統(tǒng)稱為基于模擬交通的預(yù)測模型;第四類有基于模糊神經(jīng)網(wǎng)絡(luò)的預(yù)測模型[5]、基于BP神經(jīng)網(wǎng)絡(luò)的預(yù)測模型[6]等,統(tǒng)稱為基于各種神經(jīng)網(wǎng)絡(luò)的預(yù)測模型;第五類有由兩種預(yù)測模型組合而成等,統(tǒng)稱為組合預(yù)測模型。Chiang等[7]使用回歸分析(具有自回歸誤差校正)、神經(jīng)網(wǎng)絡(luò)和ARIMA模型對客流影響因素進(jìn)行分析,隨后進(jìn)行客流預(yù)測,發(fā)現(xiàn)這些預(yù)測方法的簡單組合比單獨(dú)的模型會產(chǎn)生更高的預(yù)測精度,但是存在建模難度較大的問題。Gutiérrez等[8]采用地理信息系統(tǒng)(GIS)、距離衰減函數(shù)和多元回歸模型相結(jié)合的方法建立了系統(tǒng)乘客預(yù)測模型,經(jīng)過分析表明,預(yù)測中使用距離衰減函數(shù)對變量進(jìn)行加權(quán),系統(tǒng)地提供了較好的結(jié)果,但數(shù)據(jù)受限較大,分析具有局限性。鄒巍等[9]建立了運(yùn)用遺傳算法優(yōu)化小波理論的軌道交通客流預(yù)測模型,這個模型的優(yōu)勢在于能夠避免客流預(yù)測陷入部分最小值情況的發(fā)生。李科君等[10]構(gòu)建了非線性自回歸神經(jīng)網(wǎng)絡(luò)模型對地鐵進(jìn)站客流進(jìn)行短時預(yù)測。
通常短時客流量預(yù)測會隨時間的變化從而發(fā)生改變,長短時記憶網(wǎng)絡(luò)模型[11](Long Short Time Memory Network,LSTM)會在原有基礎(chǔ)上增添時間屬性,能對模型進(jìn)行深度的訓(xùn)練和特點(diǎn)提取。Kumar等[12]應(yīng)用人工神經(jīng)網(wǎng)絡(luò)(ANN)對過去的交通數(shù)據(jù)進(jìn)行交通流量的短期預(yù)測;Polson等[13]設(shè)計了一個深度學(xué)習(xí)模型來預(yù)測交通流,建立了一種序列擬合的線性模型體系結(jié)構(gòu);李梅等[14]通過建立深度學(xué)習(xí)LSTM網(wǎng)絡(luò)模型,并用模型來對地鐵站客流量進(jìn)行短時客流預(yù)測;李若怡[15]通過優(yōu)化LSTM網(wǎng)絡(luò)的神經(jīng)元以及隱藏層的方法,構(gòu)造得到了改良后的LSTM模型,但輸入層僅為OD客流數(shù)據(jù),具有局限性;張偉林[16]通過分析客流量的特點(diǎn),構(gòu)建利用優(yōu)化神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)預(yù)測模型。
本文利用成都軌道交通一號線火車北站2020年1月4日至1月13日的進(jìn)站客流量真實(shí)數(shù)據(jù),綜合考慮能夠影響城市軌道交通站點(diǎn)客流量的內(nèi)外部因素,設(shè)計一種基于改進(jìn)PSO-LSTM模型的城市軌道交通站點(diǎn)短時客流預(yù)測方法,并通過模型的運(yùn)行求解以及與其他模型的結(jié)果比較,驗(yàn)證改進(jìn)后的PSO-LSTM模型在客流預(yù)測中具有較高的精度,能夠取得更好的預(yù)測效果。
自動收費(fèi)系統(tǒng)(Automatic Fare Collection System,AFC)中保存有乘客刷卡進(jìn)出車站的數(shù)據(jù),通常作為基本數(shù)據(jù)對城市軌道交通站點(diǎn)進(jìn)站客流進(jìn)行實(shí)時預(yù)測。AFC系統(tǒng)具備自動售票、檢票、收費(fèi)等功能,是一種電腦統(tǒng)一控制并且封閉的全自動化網(wǎng)絡(luò)系統(tǒng)。近年來,我國對城市軌道交通車站的AFC系統(tǒng)不但進(jìn)行了大量的研究,并且提出了多重形式并行的新模式。隨著電腦技術(shù)的穩(wěn)步發(fā)展,中國城市軌道交通AFC系統(tǒng)也逐漸走向成熟,并且完成了很多大城市的AFC系統(tǒng)與居民城市刷卡通行的同步,甚至還實(shí)現(xiàn)了城市內(nèi)或者城市與城市之間的刷卡通行同步。
成都軌道交通1號線上的火車北站是一個換乘車站,它串聯(lián)著成都軌道交通1號線與成都軌道交通7號線,客流相對比較密集,方便研究。因此采集成都地鐵1號線火車北站2020年1月4日至1月13日進(jìn)站客流數(shù)據(jù),由原始數(shù)據(jù)分析可得,火車北站有進(jìn)站客流的時間段為5:00到00:55,以5分鐘為時間間隔,一天共包含240個時間段,每條數(shù)據(jù)包含起始時間、輸入流、輸出流、結(jié)束時間等信息。
長短時記憶網(wǎng)絡(luò)是一種目前常用的使用特殊方式把循環(huán)神經(jīng)網(wǎng)絡(luò)改良的神經(jīng)網(wǎng)絡(luò),具備處理長時間儲存信息的功能。一般的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)存在一個弊端就是不能夠處理信息的過度依賴問題。為了彌補(bǔ)循環(huán)神經(jīng)網(wǎng)絡(luò)的這個弊端,設(shè)計了長短時記憶網(wǎng)絡(luò)模型。LSTM的優(yōu)勢在于它對信息的長期過度依賴具備良好的自然處理能力。LSTM模型的主要設(shè)計結(jié)構(gòu)有兩個:存儲元組和非線性門單元。存儲元組的作用是維護(hù)保持模型的正常系統(tǒng)模式,非線性門單元起到調(diào)整各個不同節(jié)點(diǎn)輸入和輸出存儲元組的信息的作用。LSTM與RNN一樣,模型中的每個遞歸神經(jīng)網(wǎng)絡(luò)都可以無限向下分化,成為無數(shù)個反復(fù)的基本神經(jīng)單元。在一般的RNN結(jié)構(gòu)中,分化出的反復(fù)基本神經(jīng)單元網(wǎng)絡(luò)層結(jié)構(gòu)非常簡易,通常每個神經(jīng)單元網(wǎng)絡(luò)層只由一個基本的tanh模塊組成,如圖1所示;而在LSTM神經(jīng)網(wǎng)絡(luò)層中,組成結(jié)構(gòu)相對來說較為復(fù)雜,通常有互相聯(lián)系作用的四個模塊組成,如圖2所示。LSTM的總體網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖1 RNN神經(jīng)網(wǎng)絡(luò)層
圖2 LSTM神經(jīng)網(wǎng)絡(luò)層
圖3 LSTM網(wǎng)絡(luò)結(jié)構(gòu)
在LSTM神經(jīng)網(wǎng)絡(luò)中,每個神經(jīng)元里面都加入了三個基本單元門,分別是忘記門ft、輸入門i和輸出門Ot。忘記門的作用是幫助確定我們需要忘記的所有信息,并且?guī)椭鎰e前一時刻的隱含層狀態(tài)ht-1,然后幫助讀取當(dāng)前時刻的輸入Xt,讀取完成后輸出結(jié)果,最后再為Ct-1賦值,這個結(jié)果的輸出數(shù)值保持在0~1之間,兩個端點(diǎn)分別表示信息的全數(shù)拋棄和信息的全數(shù)保留,具體算法如下:
ft=σ(Wf·[ht-1,Xt]+bf)
(1)
式中:ft為忘記門的輸出值;σ為Sigmoid函數(shù);Wf為忘記門的權(quán)重矩陣;bf為忘記門的偏置項。
輸入門的作用是指定新的信息保存到Cell中。輸入門由兩部分構(gòu)成,一部分是根據(jù)Sigmoid層函數(shù)來計算輸入值,另一部分是添加新的候選值向量。新的候選值向量遵循tanh層的規(guī)則重新計算得來,具體計算方法如下:
it=σ(Wt·[ht-1,Xt]+bi)
(2)
對Cell的新貢獻(xiàn)見式(3)。
(3)
(4)
輸出門主要基于Cell當(dāng)前時刻的狀態(tài)經(jīng)由濾波器進(jìn)行過濾后輸出。先利用Sigmoid函數(shù)計算出Cell狀態(tài)中將要輸出的值,然后利用tanh函數(shù)計算Cell狀態(tài)中將要輸出的值,最后把兩個計算結(jié)果相乘,得到最終要輸出的值。具體計算方法為:
Ot=σ(Wo·[ht-1,Xt]+bo)
(5)
ht=Ot·tanh(Ct)
(6)
式中:W為權(quán)重值;b為偏置項;tanh為雙曲正切激活函數(shù)。
粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是一種能夠相互推動并且能夠在不同狀態(tài)下隨機(jī)產(chǎn)生的優(yōu)化算法,即使要被優(yōu)化的函數(shù)存在不連續(xù)、不可導(dǎo)等特點(diǎn),也可以憑借較快的速度優(yōu)化收斂。粒子群優(yōu)化算法的根本概念是研究鳥類的取食行為的結(jié)果,所以這個算法中任何一個問題的結(jié)果都可以比作搜索空間中的一只鳥,也就是我們所說的粒子。解空間的所有替代解由所有粒子確定,所有粒子的匹配度值由優(yōu)化函數(shù)確定,并且憑借任意速度在全解空間中隨意活動,通過與其他粒子之間建立一種特定形式的信息交換來獲得發(fā)現(xiàn)信息,從而能夠引導(dǎo)整個組的運(yùn)動。
首先將粒子群初始化為任意粒子組,然后經(jīng)過迭代計算得到最佳解。粒子每次重復(fù)運(yùn)動時都會更新速度向量和位置向量。用追蹤粒子通過的位置和粒子群通過的位置的方法,可以獲得這兩個結(jié)果的最佳值。具體方法見式(7)和式(8)。
vi=vi+c1×(pbesti-xi)+c2×(gbesti-xi)
(7)
xi=xi+vi
(8)
式中:i=1,2,…,N,N是此群中粒子的總數(shù);vi為粒子的速度;xi為粒子的當(dāng)前位置;c1和c2為學(xué)習(xí)因子;pbesti為粒子本身經(jīng)歷過的最優(yōu)位置;gbesti為粒子群經(jīng)歷過的最優(yōu)位置。
為了獲得更好的尋優(yōu)結(jié)果,引入慣性因子ω,方便對粒子群算法的全體搜索能力和部分搜索能力進(jìn)行調(diào)節(jié),使其能夠在PSO搜索過程中依據(jù)粒子群算法功能中的一個搜索函數(shù)發(fā)生改變。當(dāng)慣性因子值較大時,粒子群算法的全體搜索結(jié)果較好,部分搜索結(jié)果較差;反之,則粒子群算法的全體搜索結(jié)果較差,部分搜索結(jié)果較好。具體方法見式(9)和式(10)。
vi=ω×vi+c1×(pbesti-xi)+c2×(gbesti-xi)
(9)
(10)
式中:ωstart表示開始時的慣性因子權(quán)值;ωend表示結(jié)束時的慣性因子權(quán)值;t1表示當(dāng)前時刻的迭代次數(shù);t表示迭代完成的最大迭代次數(shù)。
圖4為改進(jìn)PSO的求解流程。
圖4 改進(jìn)PSO求解流程
具體操作步驟如下:
步驟1初始化粒子群并設(shè)定好相關(guān)參數(shù),種群大小設(shè)置為N,隨機(jī)位置為x,速度為v。
步驟2確定各個粒子的適應(yīng)度值。
步驟3確定粒子通過的最佳位置和粒子群通過的最佳位置。
步驟4確定是否滿足粒子群算法的收斂條件,如果滿足條件,那么輸出最后的尋優(yōu)結(jié)果;如果不滿足條件,那么繼續(xù)下面的步驟。
步驟5依據(jù)粒子通過的最優(yōu)位置和粒子群通過的最優(yōu)位置來更新速度向量。
步驟6依據(jù)更新的速度向量來更新粒子的位置向量。
步驟7更新全體最優(yōu)粒子和部分最優(yōu)粒子。
步驟8返回步驟4,直至滿足收斂準(zhǔn)則,輸出最優(yōu)結(jié)果和迭代次數(shù)。
本文使用MATLAB軟件對LSTM預(yù)測模型進(jìn)行編程設(shè)計。首先設(shè)定訓(xùn)練集函數(shù)與測試集函數(shù),設(shè)定訓(xùn)練集數(shù)量為75%,測試集數(shù)量為25%;其次設(shè)定神經(jīng)網(wǎng)絡(luò)變量;最后建立LSTM城軌交通站點(diǎn)短時客流量預(yù)測模型。通過運(yùn)行模型,最優(yōu)隱藏節(jié)點(diǎn)數(shù)為101,最優(yōu)學(xué)習(xí)速率為0.001,最優(yōu)迭代次數(shù)為30時,LSTM預(yù)測模型得到的預(yù)測結(jié)果最優(yōu)。運(yùn)行得到的進(jìn)站量預(yù)測結(jié)果如圖5所示。
圖5 LSTM進(jìn)站量預(yù)測結(jié)果
從圖5結(jié)果可以看出,雖然利用LSTM預(yù)測模型得到了結(jié)果,但是精度并不太高,因此本文設(shè)計了改進(jìn)PSO來優(yōu)化LSTM預(yù)測模型,希望能得到預(yù)測精度較高的結(jié)果。本文構(gòu)建改進(jìn)PSO-LSTM模型來實(shí)現(xiàn)城市軌道交通站點(diǎn)短時客流預(yù)測,經(jīng)過反復(fù)實(shí)驗(yàn),最優(yōu)隱藏節(jié)點(diǎn)數(shù)為101,最優(yōu)學(xué)習(xí)速率為0.001,最優(yōu)迭代次數(shù)為30時,預(yù)測精度最高,預(yù)測結(jié)果如圖6所示。與沒有經(jīng)過優(yōu)化的LSTM模型作對比,對比結(jié)果如圖7所示。
圖6 改進(jìn)PSO-LSTM進(jìn)站量預(yù)測結(jié)果
圖7 改進(jìn)PSO-LSTM進(jìn)站量預(yù)測結(jié)果對比
遺傳算法(Genetic Algorithm,GA)擁有天然選擇能力和種群傳播制度,有著較強(qiáng)的全體尋優(yōu)本領(lǐng),是一種常用的傳統(tǒng)搜索算法。天然選擇和種群傳播過程中通常伴隨著交配、繁衍、變異現(xiàn)象的發(fā)生,遺傳算法極佳地模仿了這種現(xiàn)象?;镜倪z傳算法包含選擇操作、交叉操作、變異操作三種常規(guī)操作。
本文通過設(shè)計GA-LSTM預(yù)測模型對城市軌道交通站點(diǎn)進(jìn)行短時客流預(yù)測,為保證其結(jié)果能與上述結(jié)果進(jìn)行公平合理的對比,預(yù)測時選用與上述模型預(yù)測時相同的數(shù)據(jù),模型得出預(yù)測結(jié)果如圖8所示。與沒有經(jīng)過優(yōu)化的LSTM模型作對比,結(jié)果如圖9所示,并與LSTM模型預(yù)測結(jié)果、改進(jìn)PSO-LSTM預(yù)測結(jié)果進(jìn)行比較,結(jié)果如圖10所示。
圖8 GA-LSTM進(jìn)站量預(yù)測結(jié)果
圖9 GA-LSTM進(jìn)站量預(yù)測結(jié)果對比
為了更好地比較LSTM模型、改進(jìn)PSO-LSTM模型、GA-LSTM模型的預(yù)測效果,本文運(yùn)用均方根誤差(RMSE)以及平均絕對誤差(MAE)兩個常用的誤差評價方法進(jìn)行比較分析,其計算公式如下:
(11)
(12)
均方根誤差計算的是客流預(yù)測值與客流實(shí)際值的平方誤差與總數(shù)量N的比值的平方根,一般用來解釋預(yù)測中的離散程度;平均絕對誤差計算的是客流預(yù)測值與客流實(shí)際值的偏差,一般用于預(yù)測值與真值的比較。分別計算上述三種預(yù)測模型的結(jié)果誤差分析如表1所示。
表1 預(yù)測結(jié)果誤差分析
計算的RMSE以及MAE兩種評價指標(biāo)數(shù)值越小,證明相對應(yīng)的模型的預(yù)測性能越好??梢钥闯?,改進(jìn)PSO-LSTM預(yù)測模型的兩種指標(biāo)數(shù)值較小,所以預(yù)測性能較好,預(yù)測精度也比其他兩種模型更高。
針對城市軌道交通站點(diǎn)短時客流預(yù)測問題,本文搭建了LSTM預(yù)測模型,并且提出改進(jìn)方法——改進(jìn)粒子群優(yōu)化算法(PSO)與LSTM模型的結(jié)合。通過實(shí)例研究,與優(yōu)化前的LSTM模型以及GA-LSTM模型預(yù)測結(jié)果進(jìn)行比較,得到以下結(jié)論:改進(jìn)PSO-LSTM預(yù)測模型預(yù)測精度提高較大,可以提供更加準(zhǔn)確的預(yù)測結(jié)果。