楊祺煊
(軍事交通學(xué)院 研究生管理大隊(duì),天津 300161)
● 基礎(chǔ)科學(xué)與技術(shù) Basic Science & Technology
基于主成分分析與GA-BP網(wǎng)絡(luò)的鐵路客運(yùn)量預(yù)測(cè)研究
楊祺煊
(軍事交通學(xué)院 研究生管理大隊(duì),天津 300161)
針對(duì)鐵路客運(yùn)量影響因素眾多、變量之間映射關(guān)系復(fù)雜的特點(diǎn),使用主成分分析方法對(duì)客運(yùn)量影響因素進(jìn)行處理,降低相關(guān)變量維數(shù),消除變量間的多重共線性關(guān)系,并將轉(zhuǎn)換后的變量輸入到基于GA-BP的神經(jīng)網(wǎng)絡(luò)模型中,完成對(duì)于鐵路客運(yùn)量的預(yù)測(cè)。仿真結(jié)果表明,該模型相較于BP神經(jīng)網(wǎng)絡(luò)模型,具有更好的預(yù)測(cè)精度和更簡(jiǎn)單的結(jié)構(gòu)。
鐵路客運(yùn)量預(yù)測(cè);主成分分析;神經(jīng)網(wǎng)絡(luò)
鐵路客運(yùn)量預(yù)測(cè)是指對(duì)客運(yùn)量的發(fā)展進(jìn)行動(dòng)態(tài)分析,并在定性基礎(chǔ)上進(jìn)行定量計(jì)算。正確預(yù)測(cè)鐵路客運(yùn)量,對(duì)國(guó)家的經(jīng)濟(jì)發(fā)展格局和資源配置,以及對(duì)鐵路企業(yè)內(nèi)部的投資結(jié)構(gòu)、經(jīng)營(yíng)管理等都有重要作用[1]。但現(xiàn)實(shí)中的鐵路客運(yùn)量呈現(xiàn)出較大的不確定性,在春運(yùn)階段的表現(xiàn)尤其突出,相關(guān)預(yù)測(cè)誤差會(huì)使運(yùn)力安排與各地區(qū)客流聚集程度不協(xié)調(diào)。由于客運(yùn)量增長(zhǎng)影響因素不僅包括人口結(jié)構(gòu)、經(jīng)濟(jì)社會(huì)發(fā)展水平、消費(fèi)水平,還易受到突發(fā)事件的影響,如何通過(guò)相關(guān)影響因素的變化分析出可能出現(xiàn)的客運(yùn)量異常變化,顯得十分重要。
預(yù)測(cè)精度和考慮的影響因素與使用的算法密切相關(guān)。常用的預(yù)測(cè)算法有時(shí)間序列法[2]、回歸分析法[3]、馬爾科夫預(yù)測(cè)法[4]、神經(jīng)網(wǎng)絡(luò)方法[5-7]、組合預(yù)測(cè)方法[8]等。各種方法在樣本數(shù)據(jù)需求、預(yù)測(cè)精度、運(yùn)算效率、預(yù)測(cè)偏差方面都有其各自的特點(diǎn),而在數(shù)據(jù)處理方法上主要有標(biāo)準(zhǔn)化、小波分析、因子分析[9]、主成分分析等。本文將對(duì)鐵路客運(yùn)量的影響因素進(jìn)行PCA處理,分析提取主成分,在此基礎(chǔ)之上建立利用遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò),對(duì)鐵路客運(yùn)量進(jìn)行預(yù)測(cè)。
1.1 PCA原理介紹
主成分分析(principal component analysis, PCA)是多元統(tǒng)計(jì)分析中一種簡(jiǎn)化數(shù)據(jù)、特征提取的方法。它通過(guò)分析樣本數(shù)據(jù)中方差最大的特征,將原變量的一系列線性組合成新的變量,使組合后的變量互不相關(guān)且最大限度保留原有變量信息。這里利用該方法對(duì)原始數(shù)據(jù)樣本進(jìn)行處理,提取主成分,組合成新的輸入指標(biāo),再利用簡(jiǎn)化后的數(shù)據(jù)集作為模型的輸入。
設(shè)有m個(gè)樣本,每個(gè)樣本有n維度,則整個(gè)樣本數(shù)據(jù)可表示為
式中單個(gè)樣本數(shù)據(jù)可表示為Xi=[xi1,xi2,…,xin],i=1,2,…,m。
PCA完整計(jì)算步驟如下:
(1)樣本數(shù)據(jù)均值化處理,以消除量綱的影響。
(2)矩陣分解。令X*=YTY,對(duì)X*求其特征值λj,特征向量vj。
式中:vj為Y的右奇異向量;σj為奇異值;uj為左奇異向量。
(3)選擇主成分個(gè)數(shù)。將奇異值σj從大到小排列,求其方差貢獻(xiàn)率ηj與累計(jì)方差貢獻(xiàn)率ηk。
一般來(lái)說(shuō),當(dāng)ηk>0.95時(shí),即視為包涵樣本的絕大部分信息,此時(shí)選取的主成分為前k個(gè)。
(4)數(shù)據(jù)變換。
1.2 GA-BP原理介紹
作為預(yù)測(cè)研究中重要的新興技術(shù),神經(jīng)網(wǎng)絡(luò)具有良好的自學(xué)習(xí)、自適應(yīng)、分布式存儲(chǔ)等特性,在處理模式識(shí)別、非線性回歸及優(yōu)化等問(wèn)題時(shí)展現(xiàn)了較大的優(yōu)勢(shì)。盡管如此,其自身也存在一些缺陷:由于BP算法的權(quán)值調(diào)整原則是基于誤差的梯度下降,這要求調(diào)整過(guò)程的每一步都取局部最優(yōu),因此,對(duì)于某些復(fù)雜的誤差曲面,BP網(wǎng)絡(luò)容易陷于局部極小點(diǎn)。此外,當(dāng)網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜、學(xué)習(xí)樣本數(shù)目較多時(shí),網(wǎng)絡(luò)初始權(quán)值的取值對(duì)網(wǎng)絡(luò)收斂與否影響很大,而標(biāo)準(zhǔn)算法中隨機(jī)確定的初始權(quán)值,增加了預(yù)測(cè)結(jié)果的不確定性。因此這里使用遺傳算法對(duì)BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值進(jìn)行篩選優(yōu)化,目的在于利用其啟發(fā)式搜索能力排除掉不利于網(wǎng)絡(luò)收斂的初始權(quán)值,提高網(wǎng)絡(luò)尋優(yōu)效率。
圖1所示的BP神經(jīng)網(wǎng)絡(luò)中,X=(x1,x2,…,xn)T為網(wǎng)絡(luò)的輸入向量,x0=-1將隱含層閾值轉(zhuǎn)化為權(quán)值;H=(h1,h2,…,hm)T為隱含層輸出向量,h0=-1將輸出層閾值轉(zhuǎn)化為權(quán)值;Y=(y1,y2,…,yl)T為網(wǎng)絡(luò)的輸出向量,V=(V1,V2,…,Vm)為隱含層神經(jīng)元權(quán)值,W=(W1,W2,…,Wl)輸出層神經(jīng)元權(quán)值,期望輸出向量為T=(t1,t2,…,tl)T。
圖1 BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
各層之間信號(hào)傳遞方式如下:從輸入層到隱含層:
hq=f(netq)q=1,2,…,m
從隱含層到輸出層:
yr=f(netr)r=1,2,…,l
基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)運(yùn)算過(guò)程如圖2所示。
圖2 GA-BP模型原理
2.1 預(yù)測(cè)影響因子選取
鐵路客運(yùn)量影響因素涉及面廣,根據(jù)相關(guān)文獻(xiàn)[10-12],綜合考慮區(qū)域經(jīng)濟(jì)發(fā)展水平、產(chǎn)業(yè)結(jié)構(gòu)、人口結(jié)構(gòu)與消費(fèi)、稅收情況等,選取以下13個(gè)指標(biāo)作為客運(yùn)量影響因素(見表1)。本文算例數(shù)據(jù)出自天津統(tǒng)計(jì)年鑒。
選取較多的影響因素是為了盡可能地保留并發(fā)現(xiàn)影響因素與客運(yùn)量之間的隱含映射關(guān)系,但輸入矩陣規(guī)模的擴(kuò)大,會(huì)導(dǎo)致網(wǎng)絡(luò)冗余。輸入變量間的多重共線性會(huì)導(dǎo)致網(wǎng)絡(luò)參數(shù)變化怪異,進(jìn)而降低網(wǎng)絡(luò)泛化性能[3]。對(duì)輸入矩陣的主成分提
取,能在保留絕大部分?jǐn)?shù)據(jù)信息量的同時(shí)盡可能降低輸入矩陣維數(shù),以少數(shù)不相關(guān)的主成分作為維度對(duì)原始數(shù)據(jù)進(jìn)行重新映射,將其投影到低維空間,作為神經(jīng)網(wǎng)絡(luò)的輸入(如圖3所示)。
表 1 鐵路客運(yùn)量的主要影響因素
圖3 客運(yùn)量預(yù)測(cè)模型
2.2 主成分分析與輸入變量提取
為去除輸入數(shù)據(jù)單位及量綱的差別,首先對(duì)數(shù)據(jù)進(jìn)行均值化處理[13],然后求其協(xié)方差矩陣的特征根以及相應(yīng)的特征向量,根據(jù)特征值的累計(jì)貢獻(xiàn)率篩選主成分(主要結(jié)果見表2)。
表2計(jì)算數(shù)據(jù)表明,特征值最大的主成分占有全部信息的98.8%,而前兩項(xiàng)主成分累計(jì)達(dá)到99%以上,符合選取標(biāo)準(zhǔn)[14],完全可以用前兩項(xiàng)主成分作為新的維度對(duì)原有數(shù)據(jù)進(jìn)行映射。
由表3可知,區(qū)域GDP、第二和三產(chǎn)業(yè)產(chǎn)值、新增固定資產(chǎn)投資、營(yíng)業(yè)稅、企業(yè)所得稅在第一主成分中占有較大載荷,即該主成分以較大程度反映了這方面特征。對(duì)于第二主成分,企業(yè)所得稅與個(gè)人所得稅則占據(jù)絕大部分比重。
表2 各主成分特征值與方差貢獻(xiàn)
表3 各影響因素的因子載荷矩陣
2.3 PCA-GABP預(yù)測(cè)方法的結(jié)果分析
(1)有PCA處理和無(wú)PCA處理的模型遺傳收斂代數(shù)與誤差曲線。圖4、圖5所示為兩種GABP模型的預(yù)測(cè)誤差與遺傳代數(shù)曲線,其中神經(jīng)網(wǎng)絡(luò)部分隱節(jié)點(diǎn)數(shù)同為4,相關(guān)參數(shù)相同,遺傳算法部分除個(gè)體長(zhǎng)度外其余參數(shù)相同??梢钥闯?,PCA處理過(guò)的模型無(wú)論是收斂代數(shù)、收斂速度、預(yù)測(cè)精度都優(yōu)于非PCA模型。非PCA模型在遺傳收斂初始階段誤差加大,這與其較大的網(wǎng)絡(luò)參數(shù)數(shù)據(jù)相關(guān)。隨著遺傳代數(shù)的增加,誤差下降較為緩慢,網(wǎng)絡(luò)開銷較大。而PCA模型得益于較小的網(wǎng)絡(luò)規(guī)模,遺傳初始階段誤差就已經(jīng)優(yōu)于前者的最終誤差,且在第10代時(shí)完成收斂,收斂速度有很大提高。
圖 4 PCA處理過(guò)的模型遺傳進(jìn)化過(guò)程
圖5 未經(jīng)PCA處理的模型進(jìn)化過(guò)程
(2)最優(yōu)隱節(jié)點(diǎn)取值時(shí)訓(xùn)練預(yù)測(cè)誤差圖。為考察PCA對(duì)于前饋網(wǎng)絡(luò)訓(xùn)練情況與預(yù)測(cè)精度的影響,這里將兩種模型平均絕對(duì)誤差最小的結(jié)果加以比較。采用試湊法尋找網(wǎng)絡(luò)預(yù)測(cè)誤差最小時(shí)隱節(jié)點(diǎn)取值,仿真結(jié)果表明:基于PCA的網(wǎng)絡(luò)最優(yōu)隱節(jié)點(diǎn)數(shù)為4;非PCA處理的網(wǎng)絡(luò)最優(yōu)隱節(jié)點(diǎn)數(shù)為7。網(wǎng)絡(luò)訓(xùn)練與預(yù)測(cè)情況如圖6所示。
在網(wǎng)絡(luò)訓(xùn)練階段,PCA網(wǎng)絡(luò)與非PCA網(wǎng)絡(luò)差異不大,前者相對(duì)于實(shí)際值的偏差較為平均,而后者擬合值明顯偏大。在預(yù)測(cè)階段,PCA網(wǎng)絡(luò)更準(zhǔn)確且誤差分布均勻;非PCA網(wǎng)絡(luò)預(yù)測(cè)誤差更大且顯著偏小。這說(shuō)明在同等精度水平下,PCA能夠減少前饋網(wǎng)絡(luò)的誤差偏性,將誤差控制在實(shí)際值兩側(cè)。主要原因在于輸入數(shù)據(jù)維數(shù)的縮減,有利于神經(jīng)網(wǎng)絡(luò)參數(shù)的優(yōu)化迭代,使參數(shù)變化更加簡(jiǎn)明有效;此外,主成分之間的相對(duì)獨(dú)立性會(huì)提高網(wǎng)絡(luò)效率,提高網(wǎng)絡(luò)識(shí)別能力。
圖6 兩種模型訓(xùn)練、預(yù)測(cè)誤差比較
將PCA處理過(guò)的樣本輸入到網(wǎng)絡(luò)中,三層前饋網(wǎng)絡(luò)隱節(jié)點(diǎn)數(shù)為4,網(wǎng)絡(luò)結(jié)構(gòu)為2-4-3;訓(xùn)練次數(shù)epochs=1 000,學(xué)習(xí)速率lr=0.1;遺傳優(yōu)化階段個(gè)體數(shù)目NIND=50,最大遺傳代數(shù)MAXGEN=50,交叉概率Px=0.8,初始變異概率Pm0=0.01,代溝GAP=0.95,選擇操作為隨機(jī)遍歷采樣,交叉操作采用單點(diǎn)交叉,變異操作使用離散變異算子;同時(shí)使用未經(jīng)PCA處理的樣本作為GABP網(wǎng)絡(luò)輸入建立對(duì)比模型,遍歷實(shí)驗(yàn)表明其最優(yōu)隱節(jié)點(diǎn)數(shù)為7,網(wǎng)絡(luò)結(jié)構(gòu)為13-7-3,其余參數(shù)不變。兩個(gè)模型使用1999—2010年數(shù)據(jù)作為訓(xùn)練樣本,2011—2013年樣本作為預(yù)測(cè)樣本,預(yù)測(cè)結(jié)果及誤差分析見表4、表5、圖7。其中:MAE為平均絕對(duì)誤差,RMSE為均方根誤差。
表4 兩種模型預(yù)測(cè)結(jié)果對(duì)比
表 5 兩種模型訓(xùn)練及預(yù)測(cè)誤差分析
圖7 兩種模型訓(xùn)練均方誤差比較
由表5可知,就訓(xùn)練誤差而言,GA-BP比PCA-GABP擬合度更高,但其預(yù)測(cè)誤差則遠(yuǎn)遠(yuǎn)大于PCA模型。盡管非PCA方法平均擬合度較好,由圖7可以看出,個(gè)別點(diǎn)擬合偏差不穩(wěn)定。訓(xùn)練次數(shù)過(guò)多或訓(xùn)練精度過(guò)高時(shí),BP網(wǎng)絡(luò)存在過(guò)擬合的趨勢(shì),可能導(dǎo)致網(wǎng)絡(luò)泛化能力減弱。這里輸入數(shù)據(jù)維度之間的冗余與線性關(guān)系,加上BP網(wǎng)絡(luò)基于經(jīng)驗(yàn)最小化的特點(diǎn),會(huì)進(jìn)一步降低其泛化能力[15]。若要減少過(guò)擬合的影響,就要控制訓(xùn)練數(shù)據(jù)輸入次序與訓(xùn)練迭代步數(shù),這會(huì)使模型預(yù)測(cè)能力帶有較大的不確定性。相比之下,PCA-GABP模型由于其相對(duì)較少的輸入變量、簡(jiǎn)單的網(wǎng)絡(luò)結(jié)構(gòu),因而在尋優(yōu)速度與預(yù)測(cè)精度方面具有明顯優(yōu)勢(shì)。
為探討該網(wǎng)絡(luò)模型與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在客運(yùn)量預(yù)測(cè)方面的性能,這里將廣義回歸神經(jīng)網(wǎng)絡(luò)(generalized regression neural network, GRNN)、BP網(wǎng)絡(luò)和本文模型同時(shí)對(duì)算例進(jìn)行預(yù)測(cè),對(duì)比分析其性能優(yōu)劣。以均方根誤差最小化為原則確定GRNN其最優(yōu)光滑因子(Spread)為0.4,BP網(wǎng)絡(luò)最優(yōu)隱節(jié)點(diǎn)數(shù)為31,GRNN網(wǎng)絡(luò)隱層中心由K-MEANS聚類確定,隱層至輸出層權(quán)值由最小二乘法確定,其余網(wǎng)絡(luò)參數(shù)同PCA-GABP模型一致。具體仿真結(jié)果見表6。
表6 不同網(wǎng)絡(luò)模型訓(xùn)練及預(yù)測(cè)結(jié)果分析
由表6可知:沒有經(jīng)過(guò)優(yōu)化的BP網(wǎng)絡(luò)在訓(xùn)練誤差上有一定的優(yōu)勢(shì),但在泛化性能上表現(xiàn)出較大劣勢(shì),這是由于網(wǎng)絡(luò)誤差面的結(jié)構(gòu)和學(xué)習(xí)算法特性使其容易陷于局部極小,且訓(xùn)練結(jié)果還受到初始權(quán)值的影響,進(jìn)而影響網(wǎng)絡(luò)性能。GRNN以結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練速度快等特點(diǎn)著稱,這里突出表現(xiàn)為較小的訓(xùn)練誤差,但面對(duì)較多的輸入變量時(shí),其經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的特點(diǎn)與過(guò)于簡(jiǎn)單的學(xué)習(xí)算法會(huì)使其泛化性能較差。相比之下,結(jié)合了PCA方法的GABP網(wǎng)絡(luò),在客運(yùn)量預(yù)測(cè)方面表現(xiàn)出更強(qiáng)的泛化性能與較簡(jiǎn)單的結(jié)構(gòu)。
本文利用主成分分析技術(shù)對(duì)影響鐵路客運(yùn)量的因素進(jìn)行處理,將取出主成分并輸入到利用遺傳算法優(yōu)化的BP網(wǎng)絡(luò)中,從而對(duì)客運(yùn)量進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,該模型能有效降低輸入數(shù)據(jù)規(guī)模并且具有較好的訓(xùn)練速度。不同模型的對(duì)比結(jié)果也說(shuō)明該模型較一般網(wǎng)絡(luò)模型具有更好的預(yù)測(cè)精度,印證了其在客運(yùn)量預(yù)測(cè)方面的優(yōu)勢(shì)。由于這里使用的是各年份的數(shù)據(jù),對(duì)于更細(xì)的客運(yùn)量數(shù)據(jù)劃分如季度、月,該模型的預(yù)測(cè)能力尚不可知,有待繼續(xù)研究。
[1] 侯福均, 吳祈宗. BP神經(jīng)網(wǎng)絡(luò)在鐵路客運(yùn)市場(chǎng)時(shí)間序列預(yù)測(cè)中的應(yīng)用[J]. 運(yùn)籌與管理, 2003, 12 (4): 73-75.
[2] 潘迪夫,劉輝,李燕飛.風(fēng)電場(chǎng)風(fēng)速短期多步預(yù)測(cè)改進(jìn)算法[J].中國(guó)電機(jī)工程學(xué)報(bào), 2008, 28(26): 87-91.
[3] 李曉剛,賈元華,敖谷昌.基于主成分分析的公路客運(yùn)量預(yù)測(cè)模型研究[J]. 公路標(biāo)準(zhǔn)化, 2009(5): 77-81.
[4] 芮海田,吳群琪,袁華智,等. 基于指數(shù)平滑法和馬爾科夫模型的公路客運(yùn)量預(yù)測(cè)方法[J]. 交通運(yùn)輸工程學(xué)報(bào), 2013, 13(4): 87-92.
[5] 王卓,王艷輝,賈利民,等. 改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)在鐵路客運(yùn)量時(shí)間序列預(yù)測(cè)中的應(yīng)用[J]. 中國(guó)鐵道科學(xué),2005,26(2): 127-131.
[6] 吳偉,符卓,王曉.運(yùn)輸通道客運(yùn)量預(yù)測(cè)方法[J].鐵道科學(xué)與工程學(xué)報(bào),2012,9(5): 96-102.
[7] SPECHT D F. A general regression neural network[J]. IEEE Transactions on Neural Works, 1991, 2(6): 568-576.
[8] 劉純,范高鋒,王偉勝,等.風(fēng)電場(chǎng)輸出功率的組合預(yù)測(cè)模型[J].電網(wǎng)技術(shù), 2009, 33(13): 74-79.
[9] 王學(xué)仁,王松桂.實(shí)用多元統(tǒng)計(jì)分析[M].上海:上??茖W(xué)技術(shù)出版社,1990:270-344.
[10] 姚新勝,蘇延川,孫金玲. 公路客運(yùn)短期運(yùn)量預(yù)測(cè)研究[J]. 公路交通科技, 2005, 22(11): 155-158.
[11] 陸化普.交通規(guī)劃理論與方法[M]. 北京: 清華大學(xué)出版社, 1998:47-59.
[12] 楊洋.基于運(yùn)輸一體化的區(qū)域交通運(yùn)輸需求預(yù)測(cè)研究[D]. 長(zhǎng)春: 吉林大學(xué), 2006.
[13] 徐雅靜, 汪遠(yuǎn)征.主成分分析應(yīng)用方法的改進(jìn)[J].數(shù)學(xué)實(shí)踐與認(rèn)識(shí),2006, 36(6):68-75.
[14] SANDHYA S.神經(jīng)網(wǎng)絡(luò)在應(yīng)用科學(xué)和工程中的應(yīng)用—從基本原理到復(fù)雜的模式識(shí)別[M].史曉霞,譯.北京:機(jī)械工業(yè)出版社,2009: 7.
[15] 周松林,茆美琴,蘇建徽.基于主成分分析與人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測(cè)[J]. 電網(wǎng)技術(shù),2011,35(9):128-132.
(編輯:史海英)
Prediction of Railway Passenger Volume Based on PCA and GA-BP Network
YANG Qixuan
(Postgraduate Training Brigade, Military Transportation University, Tianjin 300161, China)
Considering numerous factors influencing railway passenger volume and complex mapping relation among variables, the paper firstly deals with the influencing factors with PCA (principal component analysis) method and reduces the dimension of related variables to eliminate multiple co-linear relations between variables. Then, it enters the converted variables into neural network model based on GA-BP and predicts the railway passenger volume. The simulation result shows that this model is more accurate and simpler than BP neural network model.
railway passenger volume prediction; PCA (principal component analysis); neural network
2016-04-19;
2016-09-02.
楊祺煊(1991—),男,碩士研究生.
10.16807/j.cnki.12-1372/e.2017.02.021
U491
A
1674-2192(2017)02- 0084- 06