胡小敏, 賀園園
(西安交通工程學(xué)院,西安 710300)
基于組合模型的鐵路客運(yùn)量預(yù)測(cè)
胡小敏, 賀園園
(西安交通工程學(xué)院,西安 710300)
為了提高鐵路客運(yùn)量的預(yù)測(cè)精度,針對(duì)單一鐵路客運(yùn)量預(yù)測(cè)模型以及傳統(tǒng)組合預(yù)測(cè)模型的缺陷,設(shè)計(jì)了基于組合模型(ARIMA-LSSVM)的鐵路客運(yùn)量預(yù)測(cè)方法,采用ARIMA對(duì)鐵路客運(yùn)量的周期性變化特點(diǎn)進(jìn)行建模預(yù)測(cè),從整體上把握鐵路客運(yùn)量的變化特點(diǎn),采用LSSVM對(duì)鐵路客運(yùn)量的隨機(jī)性變化特點(diǎn)進(jìn)行預(yù)測(cè),采用具體鐵路客運(yùn)量預(yù)測(cè)實(shí)例對(duì)性能進(jìn)行測(cè)試和分析。結(jié)果表明,ARIMA-LSSVM可以準(zhǔn)確、全面描述鐵路客運(yùn)量的變化特點(diǎn),提高了鐵路客運(yùn)量的預(yù)測(cè)準(zhǔn)確性,預(yù)測(cè)結(jié)果可以為鐵路管理者提供有價(jià)值信息。
鐵路客運(yùn)量; 組合預(yù)測(cè)模型; 最小二乘支持向量機(jī); 自回歸移動(dòng)平均模型
隨著我國(guó)交通事業(yè)的不斷發(fā)展,鐵路客運(yùn)量不斷增加,鐵路客運(yùn)量預(yù)測(cè)結(jié)果可以指導(dǎo)鐵路企業(yè)和管理進(jìn)制定相應(yīng)的措施,對(duì)于提高經(jīng)營(yíng)、管理水平具有重要的意義[1]。鐵路客運(yùn)量受到許多因素影響,如經(jīng)濟(jì)、政策、人口數(shù)量等,這些因素之間又相互影響,導(dǎo)致鐵路客運(yùn)量變化十分復(fù)雜,設(shè)計(jì)性能優(yōu)異的鐵路客運(yùn)量預(yù)測(cè)模型成為了鐵路研究領(lǐng)域的一個(gè)重要方向[2]。
鐵路客運(yùn)量具有隨機(jī)性、周期性變化特點(diǎn),而且非平穩(wěn)性相當(dāng)明顯,難以建立精確的數(shù)學(xué)模型[3],當(dāng)前常根據(jù)鐵路客運(yùn)量的歷史數(shù)據(jù)進(jìn)行建模,歷史數(shù)據(jù)隱藏一定變化特征,可以從中發(fā)現(xiàn)鐵路客運(yùn)量的變化規(guī)律[4]。當(dāng)前鐵路客運(yùn)量預(yù)測(cè)模型主要分為兩類(lèi):線性模型和非線性模型[5],線性模型主要有:時(shí)間序列方法、回歸分析法[6,7],它們認(rèn)為鐵路客運(yùn)量是一種線性的變化趨勢(shì),待確定參數(shù)少,易實(shí)現(xiàn),建模效率高,但鐵路客運(yùn)量不簡(jiǎn)單是一種線性變化趨趨勢(shì),同時(shí)還具有非線性變化趨勢(shì),因此線性模型的鐵路客運(yùn)量預(yù)測(cè)精度低,預(yù)測(cè)結(jié)果的可信度低,在實(shí)際應(yīng)用中的范圍受限[8]。非線性模型主要有神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)[9,10],可以對(duì)鐵路客運(yùn)量的非線性變化特點(diǎn)進(jìn)行建模,但無(wú)法對(duì)鐵路客運(yùn)量的線性變化特點(diǎn)進(jìn)行預(yù)測(cè),因此預(yù)測(cè)結(jié)果也不太可靠。針對(duì)單一模型存在的不足,有學(xué)者提出了基于組合模型的鐵路客運(yùn)量預(yù)測(cè)方法[11,2],如灰色模型和線性回歸、線性回歸和馬爾可夫模型之間的組合,不同模型可以提供更多的鐵路客運(yùn)量的信息,提高了鐵路客運(yùn)量的預(yù)測(cè)效果,但組合模型到底如何進(jìn)行組合,當(dāng)前沒(méi)有統(tǒng)一理論指導(dǎo),鐵路客運(yùn)量的預(yù)測(cè)結(jié)果有待進(jìn)一步改善。
自回歸移動(dòng)平均模型(ARIMA)模型融合了時(shí)間序列分析和回歸分析的優(yōu)點(diǎn),但無(wú)法描述非線性數(shù)據(jù)的信息,最小二乘支持向量機(jī)(LSSVM)具有良好的非線性擬合能力,針對(duì)鐵路客運(yùn)量的線性和非線性變化特點(diǎn),提出基于ARIMA-LSSVM的鐵路客運(yùn)量組合預(yù)測(cè)模型,并通過(guò)具體實(shí)驗(yàn)驗(yàn)證ARIMA-LSSVM的有效性和可行性。
ARIMA模型是差分運(yùn)算和ARMA模型的結(jié)合,對(duì)于含有非季節(jié)性的時(shí)間序列進(jìn)行建模,可使用ARIMA(p,d,q)模型,可以通過(guò)適當(dāng)?shù)膁階差分運(yùn)算使序列平穩(wěn),一般形式為式(1)。
(1)
式中:{yt}為平穩(wěn)時(shí)間序列;{εt}為白噪聲序列:φi,θj(i=1,2,…,p;j=1,2,…,q)分別是{yt}、{εt}的參數(shù);p為自回歸階數(shù),q為移動(dòng)平均階數(shù)。
對(duì)于訓(xùn)練樣本集{(xi,yi)},i=1,2,…n,xi∈Rn,yi∈R,xi和yi分別表示樣本輸入和輸出,通過(guò)非線性映射函數(shù)φ(·)將樣本映射到高維特征空間,在高維特征空間進(jìn)行線性回歸,如式(2)。
f(x)=wTφ(x)+b
(2)
式中,ω為權(quán)值向量,b為偏置量。
根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,式(2)問(wèn)題求解可以變?yōu)槭?3)。
s.t.yi-wTφ(x)+b=ei
(3)
式中,γ為正規(guī)則化參數(shù);ei為實(shí)際值與回歸結(jié)果的誤差。
通過(guò)引入拉格朗日乘子將上述約束優(yōu)化問(wèn)題轉(zhuǎn)變對(duì)偶空間優(yōu)化問(wèn)題,得到式(4)。
(4)
wφ(xi)+b+ξi-yi=0
(5)
根據(jù)Mercer條件,核函數(shù)定義K(xi,xj)=φ(xi)Tφ(xj),LSSVM回歸模型為式(6)。
(6)
選擇RBF函數(shù)作為L(zhǎng)SSVM核函數(shù),其定義為式(7)。
(7)
式中,σ為寬度參婁。
最后LSSVM回歸模型為式(8)。
(8)
鐵路客運(yùn)量受到多種因素影響,具有隨機(jī)性、非平穩(wěn)性、周期性等變化特點(diǎn),單一ARIMA或者LSSVM無(wú)法建立高精度的鐵路客運(yùn)量預(yù)測(cè)模型。針對(duì)ARIMA和LSSVM的缺陷,結(jié)合它們線性和非線性預(yù)測(cè)優(yōu)點(diǎn),將它們組合在一起應(yīng)用于鐵路客運(yùn)量預(yù)測(cè)中。ARIMA-LSSVM的鐵路客運(yùn)量預(yù)測(cè)原理為:采用ARIMA對(duì)鐵路客運(yùn)量進(jìn)行建模,描述鐵路客運(yùn)量的周期性變化特點(diǎn),然后LSSVM對(duì)鐵路客運(yùn)量進(jìn)行建模,反映鐵路客運(yùn)量的隨機(jī)性變化特點(diǎn),最后通過(guò)神經(jīng)網(wǎng)絡(luò)確定兩者權(quán)值,對(duì)它們結(jié)果進(jìn)行加權(quán)組合得到鐵路客運(yùn)量的最終測(cè)結(jié)果,工作流程如圖1所示。
圖1 ARIMA-SVM的鐵路客運(yùn)量預(yù)測(cè)流程
為了測(cè)試ARIMA-LSSVM鐵路客運(yùn)量預(yù)測(cè)模型的性能,選擇1985~2016年的全國(guó)鐵路客運(yùn)量數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象,選擇后20個(gè)數(shù)據(jù)作為測(cè)試樣本,其它數(shù)據(jù)作為訓(xùn)練樣本,如圖2所示。
圖2 鐵路客運(yùn)量數(shù)據(jù)
從圖2可知,鐵路客運(yùn)量數(shù)據(jù)變化范圍大,對(duì)鐵路客運(yùn)量建模產(chǎn)生不利影響,為此將其歸一化到[0 1]區(qū)間,具體為式(9)。
(9)
式中,x為原始數(shù)據(jù),xmax和xmin為最大和最小的鐵路客運(yùn)量[14]。
4.2.1 ARIMA模型參數(shù)估計(jì)
鐵路客運(yùn)量的原始自相關(guān)函數(shù)(ACF)和偏相關(guān)函數(shù)(PACF)如圖3所示,從圖3可以發(fā)現(xiàn),鐵路客運(yùn)量數(shù)據(jù)之間的相關(guān)性很高,需要進(jìn)行差分處理。1階差分的ACF和PACF,如圖4所示。
圖3 鐵路客運(yùn)量的原始ACF和PACF
圖4 1階差分后ACF和PACF
1階差分后,鐵路客運(yùn)量數(shù)比較平穩(wěn),即ARIMA的參數(shù)d=1,最終確定鐵路客運(yùn)量的ARIMA(3,1,2)。
4.2.2 ARIMA的鐵路客運(yùn)量預(yù)測(cè)結(jié)果
采用ARIMA(3,1,2)對(duì)鐵路客運(yùn)量的訓(xùn)練樣本進(jìn)行建模,并對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),鐵路客運(yùn)量的預(yù)測(cè)結(jié)果,如圖5所示。
圖5 ARIMA的鐵路客運(yùn)量預(yù)測(cè)結(jié)果
從圖5可以看出,ARIMA可以整上對(duì)鐵路客運(yùn)量的變化趨勢(shì)進(jìn)行描述,但預(yù)測(cè)偏差比較大,鐵路客運(yùn)量的有待進(jìn)一步改善。
采用LSSVM對(duì)鐵路客運(yùn)量的訓(xùn)練樣本進(jìn)行建模,并對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),鐵路客運(yùn)量的預(yù)測(cè)結(jié)果如圖6所示。
從圖6可以看出,LSSVM的預(yù)測(cè)結(jié)果比ARIMA要好,但仍然多個(gè)樣本點(diǎn)的預(yù)測(cè)偏大,預(yù)測(cè)結(jié)果不穩(wěn)定,這主要是由于LSSVM只能提供鐵路客運(yùn)量部分信息,鐵路客運(yùn)量精度有待提高。
采用BP神經(jīng)網(wǎng)絡(luò)確定ARIMA和LSSVM的鐵路客運(yùn)量預(yù)測(cè)結(jié)果的權(quán)值,融合得到鐵路客運(yùn)量最終預(yù)測(cè)結(jié)果如圖7所示。
圖6 LSSVM的鐵路客運(yùn)量預(yù)測(cè)結(jié)果
圖7 ARIMA-LSSVM鐵路客運(yùn)量的預(yù)測(cè)結(jié)果
從圖7可知,ARIMA-LSSVM鐵路客運(yùn)量的預(yù)測(cè)精度比ARIMA、LSSVM要高,主要是綜合利用了ARIMA和LSSVM優(yōu)勢(shì),更加準(zhǔn)確描述鐵路客運(yùn)量變化趨勢(shì),改善了鐵路客運(yùn)量預(yù)測(cè)效果。
為了提高鐵路客運(yùn)量的預(yù)測(cè)精度,針對(duì)單一模型無(wú)法全面描述鐵路客運(yùn)量變化特點(diǎn)的缺陷,提出了基于ARIMA-LSSVM的鐵路客運(yùn)量預(yù)測(cè)方法,并采用具體鐵路客運(yùn)量預(yù)測(cè)實(shí)例對(duì)模型的性能進(jìn)行測(cè)試和分析,結(jié)果表明,ARIMA-LSSVM通過(guò)ARIMA對(duì)鐵路客運(yùn)量的周期性變化特點(diǎn)進(jìn)行建模預(yù)測(cè),可以從整體上把握鐵路客運(yùn)量的變化特點(diǎn),采用LSSVM對(duì)鐵路客運(yùn)量的隨機(jī)性變化特點(diǎn)進(jìn)行預(yù)測(cè),提高了鐵路客運(yùn)量的預(yù)測(cè)準(zhǔn)確性,預(yù)測(cè)結(jié)果有助于對(duì)鐵路管理者制定相應(yīng)的措施。
[1] 黃召杰,馮碩. 灰色預(yù)測(cè)模型在鐵路客流預(yù)測(cè)中的應(yīng)用[J]. 交通科技與經(jīng)濟(jì),2014,16(1): 57-60.
[2] 蔡昌俊,姚思建,王梅英,等. 基于乘積 ARIMA 模型的城市軌道交通進(jìn)出站客流量預(yù)測(cè)[J]. 北京交通大學(xué)學(xué)報(bào),2014,38(2): 135-140.
[3] 王文莉,楊俊紅. 基于灰色理論的鐵路客運(yùn)量預(yù)測(cè)影響因素優(yōu)化[J]. 微電子學(xué)與計(jì)算機(jī), 2011, 28(10): 164-167.
[4] 彭珍瑞,孟建軍,祝磊,等 . 基于支持向量機(jī)的鐵路客運(yùn)量預(yù)測(cè)[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào):自然科學(xué)版,2007,26(2):269-272.
[5] 侯麗敏,馬國(guó)峰. 基于灰色線性回歸組合模型鐵路客運(yùn)量預(yù)測(cè)[J]. 計(jì)算機(jī)仿真,2011,28(7): 1-3.
[6] 王卓, 王艷輝, 賈利民, 等.改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)在鐵路客運(yùn)量時(shí)間序列預(yù)測(cè)中的應(yīng)用[J]. 中國(guó)鐵道科學(xué), 2005, 26(2): 128~131.
[7] 孟歌,伍忠東,Muhammad Waqas Ahmad. FSVR在鐵路趟車(chē)客運(yùn)量預(yù)測(cè)中的應(yīng)用[J]. 濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2015, 29(5): 382-388.
[8] 朱偉,李楠,石超峰. 基于粒子群算法優(yōu)化支持向量機(jī)的鐵路客運(yùn)量預(yù)測(cè)模型[J]. 商丘師范學(xué)院學(xué)報(bào), 2013,29(12): 33-34.
[9] 趙清艷,熊茂華. 混沌粒子群優(yōu)化神經(jīng)網(wǎng)絡(luò)在鐵路客運(yùn)量預(yù)測(cè)中的應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2013, 30(6): 225-228.
[10] 劉琳玥. 基于PCA-BP 神經(jīng)網(wǎng)絡(luò)的鐵路客運(yùn)量預(yù)測(cè)模型研究[J]. 綜合運(yùn)輸,2016, 38(8): 43-48.
[11] 馮冰玉, 鮑學(xué)英, 王起才, 董朝陽(yáng). 新型組合模型在鐵路客運(yùn)量預(yù)測(cè)中的應(yīng)用[J]. 鐵道標(biāo)準(zhǔn)設(shè)計(jì), 2015, 59(12): 6-9.
[12] 李曉東. 基于線性回歸—馬爾可夫模型的鐵路客運(yùn)量預(yù)測(cè)[J]. 鐵道運(yùn)輸與經(jīng)濟(jì),2012, 34(4): 38-41.
[13] 賀曉霞,鮑學(xué)英,王起才,董朝陽(yáng). 基于GM-周期擴(kuò)展組合模型的鐵路客運(yùn)量預(yù)測(cè)[J]. 鐵道科學(xué)與工程學(xué)報(bào),2015, 12(3): 685-689.
[14] 褚鵬宇,劉瀾. 基于變權(quán)重組合模型的鐵路客運(yùn)量短期預(yù)測(cè)[J]. 計(jì)算機(jī)工程與應(yīng)用,2017, 53(4): 228-232.
RailwayPassengerVolumePredictionBasedonHybridModel
Hu Xiaomin, He Yuanyan
(Xi’an Traffic Engineering Institue, Xi’an 710300, China)
According to the defects of passenger traffic volume of railway single prediction model and traditional combination forecasting model, in order to improve the prediction accuracy of railway passenger volume, the combined model (ARIMA-LSSVM), a prediction method for railway passenger volume is designed. The railway passenger volume change periodic characteristics are predicted by ARIMA to grasp the whole railway passenger traffic volume, then the random variation characteristics are predicted by LSSVM for railway passenger volume forecast, at last passenger railway concrete is verified by test and analysis. The prediction results of the model show that the ARIMA-LSSVM model can accurate and comprehensive describe the railway passenger volume. The model improves the prediction accuracy of railway passenger volume, forecast results can help to provide valuable information to the railway management.
Railway passenger volume; Combined forecasting model; Least squares support vector machines; Auto regressive integrating moving average
1007-757X(2017)12-0067-04
胡小敏(1978-),女,渭南人,碩士,講師,研究方向:鐵路客運(yùn)。
賀園園(1985-),女,西安人,碩士,講師,主要研究方向:地理信息系統(tǒng)。
TP391
A
2017.08.29)