梁小林, 杜曉慧
?
基于粒子群優(yōu)化偏最小二乘的鐵路客運(yùn)量預(yù)測
梁小林*, 杜曉慧
(長沙理工大學(xué) 數(shù)學(xué)與計(jì)算科學(xué)學(xué)院, 湖南 長沙, 410076)
通過對(duì)1997—2012年鐵路客運(yùn)量的影響因素進(jìn)行分析, 建立偏最小二乘回歸模型, 并用實(shí)際的鐵路客運(yùn)量與預(yù)測值進(jìn)行比較, 檢驗(yàn)出模型的預(yù)測誤差較大. 為了提高模型的預(yù)測精度, 采取粒子群優(yōu)化算法優(yōu)化回歸系數(shù), 得到一個(gè)新的模型. 經(jīng)檢驗(yàn), 該模型的預(yù)測誤差由原模型的3.04%降到1.01%. 最后用該模型預(yù)測出2013—2014年的鐵路客運(yùn)量分別為210.970 5千萬人和227.368 8千萬人.
偏最小二乘; 粒子群優(yōu)化; 鐵路客運(yùn)量; 預(yù)測
鐵路客運(yùn)量預(yù)測是對(duì)客運(yùn)量的發(fā)展趨勢進(jìn)行分析, 由于影響鐵路客運(yùn)量的因素錯(cuò)綜復(fù)雜, 使得對(duì)鐵路客運(yùn)量預(yù)測建模非常困難. 傳統(tǒng)的預(yù)測方法有: 線性回歸法[1]、支持向量機(jī)[2—3]、灰色馬爾科夫模型法[4—5]、神經(jīng)網(wǎng)絡(luò)模型法[6]等, 它們大部分都是預(yù)測短時(shí)間內(nèi)客運(yùn)量的變化趨勢, 并且是通過前幾年的鐵路客運(yùn)量來預(yù)測, 沒有考慮到影響客運(yùn)量的一些因素, 因而預(yù)測效果不理想. 本文從影響鐵路客運(yùn)量的關(guān)鍵因素出發(fā), 利用偏最小二乘法和粒子群優(yōu)化算法來研究鐵路客運(yùn)量問題.
傳統(tǒng)的線性回歸方法可以很好的對(duì)相關(guān)性很小的變量進(jìn)行擬合和預(yù)測, 但是當(dāng)變量之間存在嚴(yán)重相關(guān)性時(shí), 再采用最小二乘求解擬合方程就不能得到好的預(yù)測模型. 然而, 偏最小二乘回歸方法[7]的一個(gè)突出特點(diǎn)是將主成分分析、典型相關(guān)分析與多元線性回歸分析方法結(jié)合起來, 同時(shí)實(shí)現(xiàn)了數(shù)據(jù)結(jié)構(gòu)簡化、回歸建模和變量之間的相關(guān)分析, 為多元數(shù)據(jù)分析提供了很大的方便, 并且在處理樣本少、變量多、變量之間存在多重共線性問題有很好的優(yōu)勢.
偏最小二乘的建模步驟:
粒子群優(yōu)化算法是一種新的進(jìn)化算法, 同遺傳算法類似, 都是一種基于群體迭代的優(yōu)化算法[8]. 首先初始化一群隨機(jī)粒子, 然后通過迭代計(jì)算尋找到最優(yōu)解. 但它比遺傳算法更簡單一些, 它沒有遺傳算法的交叉和變異操作, 它通過追尋當(dāng)前搜索到的最優(yōu)值來尋找全局最優(yōu)解.
粒子群優(yōu)化的偏最小二乘回歸模型的主要思想是: 把偏最小二乘的回歸系數(shù)作為最初的粒子位置, 偏回歸系數(shù)周圍的區(qū)域可以作為它的目標(biāo)區(qū)域, 通過迭代尋找到最優(yōu)的解, 直到達(dá)到滿意的結(jié)果為止. 具體步驟如下:
a. 通過建立的偏最小二乘回歸方程, 把未標(biāo)準(zhǔn)化的回歸系數(shù)作為目標(biāo)變量來對(duì)其進(jìn)行優(yōu)化, 并對(duì)粒子群的隨機(jī)位置和速度進(jìn)行初始設(shè)定.
b. 固定適應(yīng)度函數(shù). 定義適應(yīng)度函數(shù)如下:
e. 根據(jù)2個(gè)迭代公式對(duì)粒子的速度和位置進(jìn)行進(jìn)化;
f. 若達(dá)到了足夠好的適應(yīng)值, 則執(zhí)行第g步; 否則再執(zhí)行步驟b;
g. 輸出最優(yōu)結(jié)果.
表1 1997—2012年鐵路客運(yùn)量預(yù)測分析指標(biāo)
從表1可以看出, 鐵路客運(yùn)量的數(shù)據(jù)有明顯上升的趨勢. 但2003年的鐵路客運(yùn)量的數(shù)據(jù)卻急劇下降, 是因?yàn)?003年發(fā)生了SARS病毒感染, 因此在建模過程中可以去掉2003年的數(shù)據(jù). 采用1997—2007年的6個(gè)變量的數(shù)據(jù)作為自變量, 1999—2009年的鐵路客運(yùn)量作為因變量來建立回歸模型, 為了方便對(duì)結(jié)果進(jìn)行檢驗(yàn), 選取2010—2012年的模型預(yù)測的鐵路客運(yùn)量結(jié)果進(jìn)行檢驗(yàn).
表2 相關(guān)性分析
注: **在0.1水平(雙側(cè))上顯著相關(guān).
表3 1999—2009年鐵路客運(yùn)量預(yù)測值
通過該模型可以算出鐵路客運(yùn)量的相關(guān)數(shù)值,結(jié)果如表3所示.
該模型預(yù)測出來的2010—2012年的鐵路客運(yùn)量如表4所示.
從表3和表4可以看出, 優(yōu)化后的模型預(yù)測誤差相對(duì)小一些, 實(shí)際偏最小二乘模型的平均擬合誤差和平均預(yù)測誤差分別為1.4%和3.04%, 而粒子群優(yōu)化后的偏最小二乘模型的平均擬合誤差和平均預(yù)測誤差分別為1.04%和1.01%, 可見改進(jìn)后模型的預(yù)測性能更好, 誤差更小. 為了驗(yàn)證模型的預(yù)測性能好, 與文獻(xiàn)中預(yù)測的我國鐵路客運(yùn)量進(jìn)行比較, 李曉東[5]通過線性回歸與馬爾科夫理論結(jié)合起來預(yù)測2011—2012年的鐵路客運(yùn)量, 預(yù)測誤差比本文模型預(yù)測出來的
表4 2010—2012年鐵路客運(yùn)量預(yù)測值
誤差大. 朱偉[3]通過粒子群優(yōu)化支持向量機(jī), 雖然預(yù)測的鐵路客運(yùn)量的時(shí)間不一樣, 但是它的預(yù)測誤差
達(dá)到5%左右, 明顯沒有本文模型的預(yù)測效果好. 因此, 考慮影響鐵路運(yùn)客運(yùn)量的因素來對(duì)鐵路客運(yùn)量進(jìn)行預(yù)測, 本文模型能得到很好的預(yù)測效果.
通過圖1, 可以明顯看出優(yōu)化后模型的預(yù)測值更接近真實(shí)值, 因此可以用該模型來預(yù)測2013年和2014年的鐵路客運(yùn)量, 通過把2011年和2012年的自變量的指標(biāo)代入所建立的新的回歸方程(4)中, 預(yù)測出2013年和2014年的鐵路客運(yùn)量分別為210.970 5千萬人和227.368 8千萬人.
圖1 優(yōu)化后模型鐵路客運(yùn)量結(jié)果. 橫標(biāo)數(shù)據(jù)1, 2, 3, …, 13分別表示2001, 2002, 2003, …, 2013年.
本文利用粒子群優(yōu)化算法來優(yōu)化偏最小二乘回歸, 對(duì)其回歸系數(shù)進(jìn)行優(yōu)化, 來改進(jìn)模型的預(yù)測精度. 通過對(duì)影響鐵路客運(yùn)量的因素進(jìn)行分析, 來預(yù)測鐵路客運(yùn)量, 利用該模型預(yù)測出的2010—2012年的鐵路客運(yùn)量的預(yù)測值與真實(shí)值進(jìn)行比較, 得出預(yù)測誤差很小的結(jié)論. 并用該模型預(yù)測了2013—2014年的鐵路客運(yùn)量, 對(duì)鐵路部門進(jìn)行相關(guān)決策起到應(yīng)有的作用.
[1] 杜先漢, 李巖. 基于灰色關(guān)聯(lián)理論與多元線性回歸模型的鐵路客運(yùn)量預(yù)測[J]. 交通科技與經(jīng)濟(jì), 2013, 15(4): 90—93.
[2] 姜華, 曹紅妍. 基于最小二乘支持向量機(jī)的鐵路客運(yùn)量預(yù)測研究[J]. 河南科學(xué), 2010, 28(8): 89—92.
[3] 朱偉, 李楠等. 基于粒子群算法優(yōu)化支持向量機(jī)的鐵路客運(yùn)量預(yù)測模型[J]. 商丘師范學(xué)院學(xué)報(bào), 2013, 29(12): 33—36.
[4] Zhang Wei, Zhu Jinfu. Passenger Traffic Forecast based on the Grey-Markov Method [A]. Grey Systems and Intelligent Services IEEE International Conference [C]. Nanjing, 2009: 630—633
[5] 李曉東. 基于線性回歸-馬爾科夫模型的鐵路客運(yùn)量預(yù)測[J]. 鐵道運(yùn)輸與經(jīng)濟(jì), 2012(4): 38—42.
[6] 謝小山, 李遠(yuǎn)富.GA-BP算法的鐵路客運(yùn)量預(yù)測[J]. 西南交通大學(xué)學(xué)報(bào), 2009, 44(增):782—785.
[7] 王惠文. 偏最小二乘的線性與非線性方法[M]. 北京: 國防工業(yè)出版社, 2006.
[8] 劉波. 粒子群優(yōu)化算法及其工程應(yīng)用[M]. 北京: 電子工業(yè)出版社, 2010.
Forecast of railway passenger traffic based on PLS of particle swarm optimization
LIANG XiaoLin, DU XiaoHui
(School of Mathematics and Computing Sciences, Changsha University of Science & Technology, Changsha 410076, China)
By analyzing the influence factors of railway passenger traffic from 1997 to 2007, partial least-squares regression model were established, then actual and predicted values of railway passenger traffic were compared, and the model prediction error was relatively high. In order to improve the prediction accuracy of the model, PSO optimization algorithm was adopted to optimize the regression coefficients, then a new model was got. Upon examination, the prediction error of the model dropped to 1.01% from original 3.04%. Finally the railway passenger traffic from 2013 to 2014 which we use this model to predict were 2 109.705 million and 2 273.688 million.
partial least squares; particle swarm optimization; railway passenger traffic; forecast
10.3969/j.issn.1672-6146.2014.04.002
O 212
1672-6146(2014)04-0006-05
email: 494737721@qq.com.
2014-07-28
國家自然科學(xué)基金資助項(xiàng)目(11171044); 湖南省研究生課題資助(JG2013B040).
(責(zé)任編校:劉曉霞)