李博 曾鳴
摘要:利用核主成分分析法對煤炭物流需求影響因子進(jìn)行特征提取,以獲得的主成分作為支持向量機(jī)的特征向量建立支持向量機(jī)模型,利用粒子群算法對模型參數(shù)進(jìn)行選擇優(yōu)化,從而構(gòu)建出核主成分分析和粒子群優(yōu)化支持向量機(jī)協(xié)同模型,并通過實(shí)例對模型的合理性和有效性進(jìn)行驗(yàn)證。
關(guān)鍵詞:核主成分分析;PSO-SVR;煤炭;物流需求預(yù)測
1.引言
煤炭是我國重要的基礎(chǔ)能源,對其物流需求量進(jìn)行科學(xué)預(yù)測,可以使煤炭物流供給與需求相匹配,從而避免物流基礎(chǔ)設(shè)施的盲目投資,降低成本[1]。由于煤炭貨運(yùn)量在一定程度上能夠反映煤炭物流需求規(guī)模變化,因此本文所研究的煤炭物流需求就是指煤炭的貨運(yùn)量。
本文利用支持向量回歸機(jī)構(gòu)建煤炭物流需求預(yù)測模型,并利用核主成分分析法與粒子群算法進(jìn)行優(yōu)化。通過預(yù)測我國的煤炭物流需求,為政府以及相關(guān)企業(yè)的決策提供參考,進(jìn)而實(shí)現(xiàn)煤炭能源的可持續(xù)發(fā)展。
2.基于核主成分分析的PSO-SVR預(yù)測模型
2.1核主成分分析
設(shè)Rd為原始空間,其中有n個樣本x1,x2,…,xn,構(gòu)成數(shù)據(jù)矩陣X,通過非線性映射函數(shù)將其從Rd中映射到高維特征空間F中[2]。同時,將映射數(shù)據(jù)的均值設(shè)為0,即:
∑DDni=1DD)φxi)=0JY(1)
在特征空間F中,其協(xié)方差矩陣可以表示為:
CF=SX1nSX)∑DDnk=1DD)φxk)φxk)TJY(2)
對CF進(jìn)行特征矢量分析,其特征矢量為V,特征值為λ,即λV=CFV。由定義矩陣K=[Ki,j]n×n,Ki,j=φxi)·φxj))可知,通過核函數(shù)可對其進(jìn)行確定。設(shè)V的第k分特征矢量為Vk,通過歸一化處理,VkVk=1,可得到特征矢量Vk中映射數(shù)據(jù)φx)的投影為:
[Vk·φx)]=∑DDni=1DD)αki[φxi)·φx)]JY(3)
綜上推導(dǎo)是在映射數(shù)據(jù)均值為0的基礎(chǔ)上開展的,而這一假設(shè)在實(shí)際中幾乎不存在,因此,有必要對映射數(shù)據(jù)進(jìn)行中心化,即用AKK-來代替K:
AKK-=K-InK-KIn+InKInJY(4)
其中,In是n×n的矩陣(n為樣本數(shù)目),且滿足Ii,j=1/n。因此,樣本數(shù)據(jù)第k維非線性主成分為:
tk=VFTX-·φx)
=∑DDni=1DD)αkiTX-AKK-xi·x)JY(5)
2.2PSO-SVR模型
支持向量機(jī)(SVR)是指將輸入向量數(shù)據(jù)映射到高維特征空間中,建立最優(yōu)決解函數(shù),并利用原來核函數(shù)代替高維特征空間中點(diǎn)積運(yùn)算,通過有限樣本學(xué)習(xí),搜索全局最優(yōu)解[3]。支持向量機(jī)的估計(jì)函數(shù)為:
fx)=WTφx)+bJY(6)
應(yīng)用不敏感損失因子ε轉(zhuǎn)化估計(jì)函數(shù)為優(yōu)化問題,即:
minDDXw,b,ξ,ξ*DD)SX12SX)WTW + C∑DDli = 1DD)ξi + C∑DDli = 1DD)ξ*i JY(7)
約束條件為:
JB{WTxi ) + b-yi ≤ε + ξi yi -WTxi )-b≤ε + ξ*i JB),ξi ,ξ*i ≥0,i = 1,…lJY(8)
式中,b是偏置量,是松弛因子,C是懲罰因子。
利用對偶理論將式(8)轉(zhuǎn)化為二次規(guī)劃進(jìn)行求解,其對偶式為:
minDDXα,αDD)SX12SX)α-α)TQα-α)+ε∑DDli=1DD)α+α)+∑DDli=1DD)yiα-α)JY(9)
約束條件為:
∑DDli=1DD)α-α)=0,0≤αi,αi≤C,i=1,…,lJY(10)
其中,Qi.j=Kxi·x)≡φxi)·φxj)
通過二次規(guī)劃算法可得SVR回歸預(yù)測模型為:
∑DDli=1DD)-α+α)Kxi·x)+bJY(11)
利用粒子群算法(PSO)對SVR的參數(shù)進(jìn)行優(yōu)化。PSO是全局優(yōu)化算法中的一種,在一個D維搜索空間中,N個粒子構(gòu)成一個群落,其中,每個粒子均表示一個候選解。同時,粒子還具有一個速度來決定其飛行的距離與方向。粒子們追隨著當(dāng)前最優(yōu)粒子在D維空間中搜索極值,即全局極值與個體極值。找到這兩個極值后,粒子根據(jù)式(12)和式(13)來更新其位置與速度[4]:
vk+1id=ω×vkid+c1r1pkid-xkid)+c2r2pkgd-xkid)JY(12)
xk+1id=xkid+vk+1idJY(13)
式中,vk+1id是第i個粒子在k+1代的飛行速度,vid∈[-vmax,vmax],vmax是常數(shù)。ω為慣性權(quán)重,i=1,2,…,N,d=1,2,…,D;c1,c2為非負(fù)常數(shù),稱為加速因子,根據(jù)經(jīng)驗(yàn),通常c1≠c2,r1和r2是介于[0,1]之間的隨機(jī)數(shù)。
在PSO-SVR模型中,需要優(yōu)化支持向量機(jī)中的不敏感損失因子ε與懲罰因子C。選取參數(shù)ε較小的值為初始值,利用PSO優(yōu)選模型參數(shù),不斷搜索均方誤差最小的參數(shù)對,提高參數(shù)ε的值,直到滿意為止。進(jìn)而提高預(yù)測的準(zhǔn)確度,優(yōu)化SVR模型。
3.我國煤炭物流需求預(yù)測的實(shí)證分析
3.1建立煤炭物流需求影響因素指標(biāo)體系
影響煤炭物流需求因素十分廣泛且復(fù)雜[5]。煤炭需求受經(jīng)濟(jì)規(guī)模、宏觀經(jīng)濟(jì)政策、消費(fèi)觀念、煤炭運(yùn)輸網(wǎng)絡(luò)、消費(fèi)水平、物流服務(wù)水平等諸多因素的影響[6]。本文將盡可能從不同方面進(jìn)行分析,建立煤炭物流需求預(yù)測影響因素指標(biāo)體系。如下所示:
李博.TIFTS(JZHT7.H圖3-1煤炭物流需求預(yù)測影響因素指標(biāo)體系TS)KH*2
3.2利用模型進(jìn)行煤炭物流預(yù)測
以1995-2011年我國煤炭物流貨運(yùn)量為預(yù)測對象,結(jié)合指標(biāo)體系中所提出的13個影響因子,利用本文所提出的基于主成分分析的PSO-SVR對我國煤炭物流需求進(jìn)行預(yù)測,其詳細(xì)流程如下:
(1)利用核主成分分析法選取物流需求預(yù)測的主要影響因子。設(shè)置KPCA核函數(shù)為高斯徑向基核函數(shù),主成分方差計(jì)貢獻(xiàn)率如圖3-2所示,為了盡量包含數(shù)據(jù)的全部特征,本文取前五項(xiàng)主成分,其累計(jì)貢獻(xiàn)率達(dá)0.987。因此,本文最終選定的煤炭物流需求預(yù)測影響因子為:運(yùn)貨周轉(zhuǎn)量、煤炭消費(fèi)總量、城鎮(zhèn)化率、貨車擁有量、產(chǎn)業(yè)結(jié)構(gòu)(工業(yè)產(chǎn)值占GDP的比重)。詳細(xì)數(shù)據(jù)如表3-1所示。
李博2.TIFTS(JZHT7.H圖3-2主成分方差累計(jì)貢獻(xiàn)率TS)KH*2
表3-1煤炭貨運(yùn)量與影響因素?cái)?shù)據(jù)
(2)設(shè)訓(xùn)練樣本為1995-2007年的煤炭貨運(yùn)量和其影響因素,測試樣本為2008-2011年的數(shù)據(jù)。
(3)對樣本數(shù)據(jù)進(jìn)行歸一化,公式如下所示:
JZxi=SXxi-xminxmax-xminSX)
JZyi=SXyi-yminymax-yminSX)
(4)利用PSO優(yōu)化模型參數(shù)。設(shè)初始粒子群的群體數(shù)量為30,慣性權(quán)重ω為0.6,學(xué)習(xí)因子c1與c2分別為1.2和2,,最大迭代步數(shù)為100。搜索得到支持向量機(jī)的參數(shù),其中RBF核函數(shù)參數(shù)γ=0.241,懲罰因子C=8.825。應(yīng)用計(jì)算獲得的模型參數(shù),構(gòu)建煤炭物流需求與影響因素之間的非線性響應(yīng)模型。
(5)利用所建立的模型對測試樣本進(jìn)行預(yù)測,檢驗(yàn)?zāi)P偷挠行院皖A(yù)測能力。
預(yù)測結(jié)果如表3-2所示。
由表3-2可知,KPCA-PSO-SVR模型在煤炭物流預(yù)測過程中,相對誤差處于1%左右,這說明該模型的擬合能力是比較好的。2008-2011年,模型的預(yù)測相對誤差分別為0.88%、0.95%、1.01%和1.15%,精度雖均滿足要求,可是卻是在逐步下降的,這表明該模型具有較強(qiáng)的泛化能力。KPCA-PSO-SVR模型對整個時序數(shù)據(jù)月的平均絕對誤差為1500.75噸,平均相對誤差為1%,綜合展示了該模型在煤炭物流需求預(yù)測中較好的擬合和泛化能力。
4.結(jié)語
本文針對煤炭物流的復(fù)雜網(wǎng)絡(luò)特性,建立煤炭物流需求影響因素指標(biāo)體系,將核主成分分析法(KPCA)與粒子群優(yōu)化的支持向量機(jī)(PSO-SVR)相結(jié)合,提出了適用于小樣本量研究的基于核主成分分析的PSO-SVR預(yù)測模型,并進(jìn)行實(shí)證分析,結(jié)果表明:在解決我國煤炭物流需求預(yù)測這種非線性、小樣本、高維模式識別問題中,KPCA-PSO-SVR煤炭物流需求預(yù)測模型是—個比較有價值的預(yù)測模型。(作者單位:華北電力大學(xué)經(jīng)濟(jì)與管理學(xué)院)
參考文獻(xiàn):
[1]李琰,李紅霞.我國煤炭物流產(chǎn)業(yè)評價體系的構(gòu)建[J].統(tǒng)計(jì)與決策,2012(15):182-183.
[2]于紅蕓,姜濤,關(guān)鍵.SAR圖像的快速核主成分分析識別方法[J].中國圖象圖形學(xué)報,2012,17(1):137-141.
[3]耿立艷,趙鵬,張占福.基于二階振蕩微粒群最小二乘支持向量機(jī)的物流需求預(yù)測[J].計(jì)算機(jī)應(yīng)用研究,2012,29(7):2558-2560.
[4]Guzzetti F,Peruccacci S,Rossi M,etal. The rainfall intensity–duration control of shallow landslides and debris flows:an update[J]. Landslides,2008,5(1):3-17.
[5]王瑩瑩.基于灰色神經(jīng)網(wǎng)絡(luò)模型的煤炭物流需求預(yù)測研究[D].北京交通大學(xué),2012.
[6]趙光.煤炭需求影響因素及情景分析[J].煤炭經(jīng)濟(jì)研究.2011,31(11):18-20.