張曉華
內(nèi)容摘要:城鎮(zhèn)化的發(fā)展在當(dāng)前經(jīng)濟(jì)發(fā)展的轉(zhuǎn)型期有著重要的作用,而物流業(yè)是帶動城鎮(zhèn)均衡、持續(xù)、穩(wěn)定、跨越發(fā)展的戰(zhàn)略性產(chǎn)業(yè)。本文采用因子分析法降維、非參數(shù)回歸等方法來處理物流業(yè)對城鎮(zhèn)化的影響并進(jìn)行分析。結(jié)果表明,從時間數(shù)據(jù)上來看,物流業(yè)對城鎮(zhèn)化的影響是非線性的正向關(guān)系,從截面數(shù)據(jù)上來看,2014年不同區(qū)域兩者之間正向關(guān)系有待考究。
關(guān)鍵詞:降維 ? 樣條基 ? 自然樣條 ? 非參數(shù)回歸
引言
當(dāng)前我國已進(jìn)入經(jīng)濟(jì)高速發(fā)展的轉(zhuǎn)型期,城鎮(zhèn)化發(fā)展無疑成為深入發(fā)展的重點,其在現(xiàn)代化、經(jīng)濟(jì)持續(xù)發(fā)展、產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型升級、解決農(nóng)村農(nóng)民問題、推動區(qū)域協(xié)調(diào)發(fā)展、促進(jìn)社會全面進(jìn)步等方面有重大的意義。物流業(yè)在城鎮(zhèn)化發(fā)展中具有促進(jìn)產(chǎn)業(yè)分工、吸引產(chǎn)業(yè)集聚、提升生活質(zhì)量、擴(kuò)大就業(yè)數(shù)量、帶動城鎮(zhèn)均衡、持續(xù)、跨越、穩(wěn)定發(fā)展的重要作用,是支撐和引導(dǎo)城鎮(zhèn)化發(fā)展的戰(zhàn)略性產(chǎn)業(yè)。對于兩者之間的關(guān)系,國內(nèi)外研究頗多,研究成果各有建樹。然而這些學(xué)者大多基于時間序列做定量研究,且采用降維后再引入樣條非參數(shù)回歸的方法更是鮮有人涉及。因此,本文采用另一種方法,從一個新的角度闡釋物流業(yè)對城鎮(zhèn)化的影響。
指標(biāo)設(shè)計和模型設(shè)定
衡量物流業(yè)發(fā)展的指標(biāo)迄今為止沒有一個唯一的標(biāo)準(zhǔn),不同學(xué)者所定義的指標(biāo)也不完全一樣。本文根據(jù)我國物流發(fā)展的實際情況,依據(jù)數(shù)據(jù)的可得性,建立三個一級指標(biāo)和九個二級指標(biāo)。一級指標(biāo)分為經(jīng)濟(jì)指標(biāo),基礎(chǔ)實施和物流規(guī)模。經(jīng)濟(jì)指標(biāo)下面的二級指標(biāo)分為地區(qū)產(chǎn)總值,地區(qū)交通運輸、倉儲和郵政業(yè)增加值和地區(qū)社會消費品零售總額?;A(chǔ)設(shè)施下面的二級指標(biāo)分為地區(qū)公路里程。物流規(guī)模下面的二級指標(biāo)分為地區(qū)郵電業(yè)務(wù)總量、地區(qū)貨運量、地區(qū)貨物周轉(zhuǎn)量、地區(qū)客運量和地區(qū)旅客周轉(zhuǎn)量。采用因子分析法將衡量物流業(yè)發(fā)展的九個指標(biāo)降維成一個指標(biāo)x。y代表城鎮(zhèn)化發(fā)展采用城鎮(zhèn)化率,最后用非參數(shù)回歸法來研究物流業(yè)x對城鎮(zhèn)化y發(fā)展的影響。
(一)因子分析法降維
第一步,將所有衡量物流業(yè)的變量進(jìn)行無量綱處理。
第二步,計算相關(guān)矩陣的特征根λ和特征向量γ、方差貢獻(xiàn)率,根據(jù)累計方差貢獻(xiàn)率大于85%確定公因子個數(shù)。
第三步,用最大化正交法求載荷矩陣(),確定公因子名稱和公因子得分。
第四步,用方差貢獻(xiàn)率作為權(quán)重,和公因子做加權(quán)平均得到一個綜合得分x。
(二)非參數(shù)回歸
線性模型雖然簡單,解釋性強,推斷理論也相對成熟,但變量之間若存在著大量的非線性關(guān)系,如果仍然用線性關(guān)系來研究非線性變量關(guān)系,實證結(jié)果就會難以讓人信服,因此本文選用非參數(shù)回歸。
為了研究相應(yīng)變量y和協(xié)變量x之間的非線性關(guān)系,如模型(1)所示,f(xi)是基函數(shù)(可以選用不同的基,本文主要使用多項式基和樣條基)。
yi=β0+f(xi)+εi ? ? ? ? ? ?(1)
若基函數(shù)f(xi)是多項式函數(shù),即x1,x2,x3,…,xd的線性組合,這種回歸就是多項式回歸,d一般不大于3或者4(d越大,多項式曲線就會越光滑,甚至?xí)趚變量定義域的邊界處呈現(xiàn)異樣的形狀)。多項式回歸系數(shù)的求法可用最小二乘求解。
更加穩(wěn)定的基函數(shù)f(xi)是樣條函數(shù),一個有k個結(jié)點的三次樣條函數(shù)可以由b1(x1)、b2(x2)、b3(x3)、…、bk+3(xi)的線性組合構(gòu)成,其中,bi(xi)有多種選法,本文選用三次多項式為基礎(chǔ),然后在每個結(jié)點添加一個截斷冪基,即:
yi=β0+β1xi+β2xi2+β3xi3+β4h(xi,ξ1)+……+βk+3h(xi,ξk)+εi ? ? (2)
其中,h(x,ξ)=(x-ξ)3,(x>ξ),h(x,ξ)=0,(x<ξ)。ξ是結(jié)點,截斷冪基項只會使三次多項式在ξ處的三階導(dǎo)數(shù)不連續(xù),而在每個結(jié)點,函數(shù)本身、一階導(dǎo)數(shù)、二階導(dǎo)數(shù)都是連續(xù)的。在邊界的結(jié)點外,函數(shù)是三次多項式,估計模型時,仍然采用最小二乘法估計k+4個系數(shù)。
雖然三次樣條函數(shù)相對穩(wěn)定,然而在預(yù)測變量之外的區(qū)域,即x取較大值或較小值時,有較大方差,體現(xiàn)在圖形中是邊界區(qū)域置信帶較寬,自然樣條,即模型(3)彌補了這點。
yi=β0+β1xi+β4h(xi,ξ1)+……+βk+3h(xi,ξk)+εi ? ? ? ? ? ? ? ? ? ? ? ?(3)
其中,h(x,ξ)=(x-ξ)3,(x>ξ),h(x,ξ)=0,(x<ξ)。三次自然樣條函數(shù)可以看作是三次樣條并附加了邊界約束(二階和三階導(dǎo)數(shù)為0)的回歸樣條,在邊界的結(jié)點外,函數(shù)為一次多項式,估計模型時,依然采用最小二乘法估計k+2個系數(shù)。
物流業(yè)對城鎮(zhèn)化發(fā)展的實證結(jié)果與分析
本部分從時間序列數(shù)據(jù)和橫截面序列數(shù)據(jù)兩個角度來研究物流業(yè)對城鎮(zhèn)化的影響。
(一)時間序列角度
本文通過2015年《中國統(tǒng)計年鑒》收集了2000-2014年每年物流業(yè)發(fā)展的八個指標(biāo)的數(shù)據(jù),根據(jù)因子分析法降維的思想得到了一個主成分(第一主成分達(dá)到86.5%)x來衡量物流業(yè)的發(fā)展。再收集2000-2014年城鎮(zhèn)化率的指標(biāo)數(shù)據(jù)y來代表城鎮(zhèn)化的發(fā)展。如表1所示。
表1顯示,2000年以來,我國城鎮(zhèn)化率快速發(fā)展,物流業(yè)發(fā)展水平也在逐年增加。用R軟件對上述城鎮(zhèn)化率y和物流業(yè)發(fā)展x標(biāo)準(zhǔn)化處理后做多項式回歸和樣條回歸擬合,顯然非線性擬合比線性擬合更加貼合散點圖,如圖1所示。從模型的殘差標(biāo)準(zhǔn)誤上來看,一元一次線性回歸是0.1561,4次多項式回歸是0.1109,三次樣條回歸是0.107(結(jié)點分別在25%、50%、75%處),自然3次樣條是0.135,可見3次樣條的模擬結(jié)果最好,自然樣條在邊界處置信帶較窄的優(yōu)勢在此并不明顯,反而標(biāo)準(zhǔn)誤大于三次樣條。結(jié)果表明,物流業(yè)對城鎮(zhèn)化影響確是正向關(guān)系,即隨著物流業(yè)發(fā)展的增加,城鎮(zhèn)化發(fā)展也隨之加快,兩者協(xié)調(diào)一致。從模擬曲線的斜率來看,城鎮(zhèn)化發(fā)展隨著物流業(yè)發(fā)展的速率經(jīng)歷了由快到慢再到快的趨勢。
(二)截面序列角度
本文通過2015年《中國統(tǒng)計年鑒》收集了2014年我國31個省市自治區(qū)(港澳臺地區(qū)除外)的物流業(yè)發(fā)展的八個指標(biāo)的數(shù)據(jù),采用同上的方法—因子分析法降維得到兩個主成分(累計貢獻(xiàn)度達(dá)到87.1%),再將其進(jìn)行加權(quán)平均得到最終公因子得分x來衡量物流業(yè)的發(fā)展。收集2014年31個省市自治區(qū)的城鎮(zhèn)化率y衡量城鎮(zhèn)化的發(fā)展,如表2所示。
結(jié)果顯示,2014年物流業(yè)綜合發(fā)展水平排在前五位的有廣東省、江蘇省、山東省,浙江省和河南省,這些省份是工業(yè)大省和人口大省,其交通運輸收益和運力較高,是物資消耗和人員的周轉(zhuǎn)集散地。而排在后五位的省份大多處于西部地區(qū),西部發(fā)展較晚,基礎(chǔ)設(shè)施相對不完善,因此要加大西部地區(qū)物流業(yè)的發(fā)展。
用R軟件對上述截面數(shù)據(jù)城鎮(zhèn)化率 和物流業(yè)發(fā)展 標(biāo)準(zhǔn)化處理后做散點圖,顯然非線性擬合仍然比線性擬合更加貼合散點圖,如圖2所示。從模型的殘差標(biāo)準(zhǔn)誤上來看,一元一次線性回歸是0.9858,4次多項式回歸是0.9791,3次B樣條是0.943,自然3次樣條是0.9749,仍然是3次B樣條的模擬結(jié)果最好。圖形顯示,物流業(yè)對城鎮(zhèn)化影響并不像縱向數(shù)據(jù)那樣呈現(xiàn)正向關(guān)系,兩者之間也并不協(xié)調(diào)一致,比如河北省、安徽省、湖南省、遼寧省等物流業(yè)發(fā)展水平相對高的地區(qū)(不是最高)其城鎮(zhèn)化率卻較低,說明2014年全國不同省份物流業(yè)對城鎮(zhèn)化影響不盡同,高物流水平的省份城鎮(zhèn)化率反倒不高,因此物流業(yè)對城鎮(zhèn)化的因果關(guān)系也有待考究。
結(jié)論
本文采用非參數(shù)回歸來研究物流業(yè)對城鎮(zhèn)化的影響,之所以提出此法是因為非參數(shù)回歸形式自由,受約束少,且無論從時間序列角度還是從截面序列角度來看,兩者之間關(guān)系非線性都比線性擬合更好,殘差標(biāo)準(zhǔn)誤更低。結(jié)果發(fā)現(xiàn),我國物流業(yè)對城鎮(zhèn)化的影響從時間趨勢上來看是協(xié)調(diào)一致發(fā)展的,呈非線性正向相關(guān)關(guān)系,然而從截面角度來看,不同區(qū)域物流業(yè)對城鎮(zhèn)化的影響并不都是正向關(guān)系,甚至有負(fù)向關(guān)系,原因有待進(jìn)一步考究。此外,非參數(shù)回歸的方法需要大的樣本容量,本文樣本量不夠大,時間趨勢上是15年的數(shù)據(jù),截面空間是31個省自治區(qū),所以非參數(shù)回歸結(jié)果有待商榷。
根據(jù)實證結(jié)果表明,物流業(yè)在我國城鎮(zhèn)化持續(xù)健康發(fā)展的過程中具有重要的作用,但全國不同區(qū)域地理位置、自然資源、經(jīng)濟(jì)發(fā)展方式有所差別,具體到各個地區(qū)來研究又有很多特點,因此區(qū)域物流業(yè)對城鎮(zhèn)化的影響作用有待考究。因此,應(yīng)增強城鎮(zhèn)化發(fā)展的動力,以積極推進(jìn)物流業(yè)帶動城鎮(zhèn)化高效和諧全面發(fā)展。