王琳琳
摘 要: 該文結(jié)合貴州省的情況,選取出影響公路貨運(yùn)周轉(zhuǎn) 量的6個(gè)主要影響因素:地區(qū)生產(chǎn)總值、社會(huì)消費(fèi)品零售總額、全部工業(yè)增加值、公路營(yíng)運(yùn)里程、鐵路貨運(yùn)周轉(zhuǎn)量、農(nóng)副產(chǎn)品產(chǎn)值;然后運(yùn)用主成分分析法,將影響因素進(jìn)行降維處理,得到兩個(gè)主成分;之后再將降維后的數(shù)據(jù)擬合部分線性模型,運(yùn)用該模型對(duì)貴州省2013年的公路貨運(yùn)周轉(zhuǎn)量進(jìn)行預(yù)測(cè),預(yù)測(cè)相對(duì)誤差為5.45%,達(dá)到了良好的預(yù)測(cè)效果 。
關(guān)鍵詞: 部分線性模型;主成分分析;公路貨運(yùn)周轉(zhuǎn)量;預(yù)測(cè)
引言
貨運(yùn)周轉(zhuǎn)量不僅包含運(yùn)輸對(duì)象的數(shù)量,同時(shí)還包含運(yùn)輸距離的因素,能夠全面地反映一定時(shí)期內(nèi)的運(yùn)輸成果。公路運(yùn)輸作為貴州省的重要交通運(yùn)輸方式,研究公路貨運(yùn)周轉(zhuǎn)量對(duì)于貴州交通運(yùn)輸業(yè)的發(fā)展和規(guī)劃具有較強(qiáng)的影響作用。
部分線性模型由Engle[1]等人在1986年研究天氣對(duì)電力需求的影響時(shí)提出的。由于該模型既包含參數(shù)部分,又包含非參數(shù)部分,因而表現(xiàn)出較強(qiáng)的靈活性,不僅可以避免一般線性模型的弊端,而且避免了非參數(shù)模型的維數(shù)禍根問(wèn)題,更能符合現(xiàn)實(shí)數(shù)據(jù)的特征,因而該文選取該方法對(duì)貴州省公路貨運(yùn)周轉(zhuǎn)量進(jìn)行預(yù)測(cè)研究。
1.部分線性模型
部分線性模型的表達(dá)形式為:Y=XTβ+g(T)+ε (1)
其中Y為標(biāo)量響應(yīng)變量,X為p維協(xié)變量,β為x6維未知參數(shù)向量,T為標(biāo)量協(xié)變量,g(·)為未知函數(shù),ε為隨機(jī)誤差,并且滿足E(ε)=0,Var(ε)=σ2。
部分線性模型的向量表示形式為:
該文采用權(quán)函數(shù)方法對(duì)部分線性模型進(jìn)行求解:
這樣就表示成了一般的線性模型,從而可以利用最小二乘法求解β的估計(jì)值,之后再求出非參數(shù)函數(shù)g(·)的估計(jì)。
2.貴州省公路貨運(yùn)量預(yù)測(cè)模型的估計(jì)
(1)指標(biāo)的選取與數(shù)據(jù)處理
該文參考之前的專家學(xué)者對(duì)公路貨運(yùn)周轉(zhuǎn)量的研究[2-4],并結(jié)合貴州省情況,選取影響貴州省公路貨運(yùn)周轉(zhuǎn)量的6個(gè)影響因素:地區(qū)生產(chǎn)總值、社會(huì)消費(fèi)品零售總額、全部工業(yè)增加值、公路營(yíng)運(yùn)里程、鐵路貨運(yùn)周轉(zhuǎn)量、農(nóng)副產(chǎn)品產(chǎn)值,并從各年份的《貴州省統(tǒng)計(jì)年鑒》及《新中國(guó)60年統(tǒng)計(jì)資料匯編》中收集到1978—2013年的指標(biāo)數(shù)據(jù),采用Z-score標(biāo)準(zhǔn)化方法對(duì)數(shù)據(jù)進(jìn)行處理。
將影響貴州省公路貨運(yùn)周轉(zhuǎn)量的主要影響因子地區(qū)生產(chǎn)總值x1(億元)、社會(huì)消費(fèi)品零售總額x2(億元)、全部工業(yè)增加值x3(億元)、公路營(yíng)運(yùn)里程x4(公里)、鐵路貨運(yùn)周轉(zhuǎn)量x5(億噸公里)、農(nóng)副產(chǎn)品產(chǎn)值x6(億元)導(dǎo)入spss18.0中進(jìn)行主成分分析,根據(jù)分析結(jié)果,選取前兩個(gè)主成分,主成分的累積貢獻(xiàn)率達(dá)到98.98%;對(duì)因子載荷矩陣進(jìn)行數(shù)據(jù)處理,得到兩個(gè)主成分的系數(shù)矩陣。
做出貴州省公路貨運(yùn)量與兩個(gè)主成分的散點(diǎn)圖,如圖1-2所示:
圖1 公路貨運(yùn)周轉(zhuǎn)量與第一主成分散點(diǎn)圖 圖2 公路貨運(yùn)周轉(zhuǎn)量與第二主成分散點(diǎn)圖
從上面的散點(diǎn)圖我們可以知道,公路貨運(yùn)周轉(zhuǎn)量與第一主成分存在顯著的線性關(guān)系,與第二主成分的線性關(guān)系并不顯著,因此,我們將第一主成分列為部分線性模型中線性部分的協(xié)變量,第二主成分定為該模型的非參數(shù)部分的協(xié)變量。
(2)部分線性模型的構(gòu)建
在模型Y=XTβ+g(T)+ε中,Y表示貴州省公路貨運(yùn)周轉(zhuǎn)量,X表示第一主成分,T表示第二主成分。在求解該模型時(shí)用到的權(quán)函數(shù)為:
其中,h表示窗寬,窗寬采用最佳窗寬的選擇方法,hn=cn-1/5,c為某個(gè)常數(shù),經(jīng)測(cè)試,當(dāng)c取2.46時(shí),預(yù)測(cè)效果及密度曲線光滑性較好;核函數(shù)K(·)選取Epanechnikov核:K(x)= 3 4 (1-x2), x <1
將標(biāo)準(zhǔn)化后的數(shù)據(jù)導(dǎo)入到matlab中,計(jì)算得到回歸系數(shù)為
3.模型評(píng)價(jià)
(1)模型的擬合效果
該文通過(guò)計(jì)算模型的擬合優(yōu)度以及畫出模型的擬合曲線來(lái)反映部分線性模型的擬合效果。
度量擬合優(yōu)度的統(tǒng)計(jì)量為可決系數(shù)與修正可決系數(shù),兩者的計(jì)算公式如下:
運(yùn)用上面的計(jì)算公式,算得R2=0.9513, 2=0.9364,可決系數(shù)與修正的可決系數(shù)都接近1,可見(jiàn),部分線性模型對(duì)樣本觀測(cè)值的擬合效果很好。
(2)貴州省公路貨運(yùn)周轉(zhuǎn)量預(yù)測(cè)
將2013年的變量數(shù)據(jù)代入表達(dá)式,預(yù)測(cè)貴州省公路貨運(yùn)周轉(zhuǎn)量為577.39億噸公里,并計(jì)算出預(yù)測(cè)相對(duì)誤差,預(yù)測(cè)相對(duì)誤差為5.45%,當(dāng)預(yù)測(cè)誤差處于5%—10%之間時(shí),預(yù)測(cè)效果好。
4.結(jié)語(yǔ)
該文運(yùn)用部分線性模型擬合貴州省公路貨運(yùn)周轉(zhuǎn)量,修正的可決系數(shù)達(dá)到0.9364,模型擬合效果很好;運(yùn)用該模型預(yù)測(cè)2013年的貴州省公路貨運(yùn)周轉(zhuǎn)量,計(jì)算得預(yù)測(cè)的相對(duì)誤差為5.45%,達(dá)到了良好的預(yù)測(cè)效果。
將部分線性模型應(yīng)用到公路貨運(yùn)周轉(zhuǎn)量的預(yù)測(cè)中來(lái),為公路貨運(yùn)周轉(zhuǎn)量的預(yù)測(cè)研究增添了新的研究方法。 (作者單位:貴州財(cái)經(jīng)大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院)
基金項(xiàng)目:貴州財(cái)經(jīng)大學(xué)2014年度在校學(xué)生科研資助項(xiàng)目
參考文獻(xiàn):
[1] Engk R F,Granger C W J,and R ice J. et al. Semiparametric estimates between Weather and electricity sales[J]. Journal of American Statistical Association,1986.80:310-319.
[2] 朱方海,凌建明等.西部地區(qū)公路貨運(yùn)周轉(zhuǎn)量可拓聚類預(yù)測(cè)[J].西部交通科技,2006(6)
[3] 劉文華.城市公路貨運(yùn)量預(yù)測(cè)及物流園區(qū)適站量確定研究[D].北京交通大學(xué),2009:39
[4] 趙建友.基于模糊線性回歸模型的公路貨運(yùn)量預(yù)測(cè)方法.交通運(yùn)輸工程學(xué)報(bào)[J].2012,12(3):83