朱琳 陳飛
(云南財經大學統(tǒng)計與數學學院 云南 昆明 650221)
失業(yè)率是指失業(yè)人口(一定時期有工作意愿而仍未有工作的勞動力人口)占勞動人口的比率。失業(yè)是市場經濟不可避免的一種經濟社會現象。但失業(yè)人員數量過多,失業(yè)率過高,不僅會給失業(yè)者本人及家庭帶來極大沖擊,也會對經濟發(fā)展和社會穩(wěn)定構成重大威脅。因此,把失業(yè)率控制在社會可承受的范圍內,是市場經濟環(huán)境下國家政府的重要目標之一。
目前國內關于失業(yè)率的研究已取得一定的成果。田力(2003)研究了影響失業(yè)率的主要因素及降低失業(yè)率的對策,利用數學的窮舉法,就影響供給的因素、影響需求的因素以及同時影響供求雙方的因素三個方面,分析了與失業(yè)密切相關的七大因素,但其研究缺乏一個量化的統(tǒng)計模型。程紅莉和劉強(2003)以全國30個省市的相關數據為樣本研究了區(qū)域失業(yè)率差異影響因素。陳幼芳和張?zhí)鞎?006)對云南的失業(yè)率進行了預測和研究,其貢獻在于給出了比較全面的預測模型,但是缺乏對模型的檢驗。本文使用線性回歸模型對云南省失業(yè)率的影響因素進行實證研究,通過變量選擇方法,篩選得到了對失業(yè)率具有顯著影響的因素,并建立了擬合模型,該模型通過了異方差性、序列相關性和異常值檢驗。
本數據來源于云南統(tǒng)計局網站(http://www.stats.yn.gov.cn/TJJMH_Model/default.aspx)上統(tǒng)計公報公布的2001—2011的相關數據。
本文的失業(yè)率的影響因素的研究主要考察在眾多因素中哪些因素對失業(yè)率具有顯著的影響。我們首先給出自變量的待選變量集。奧肯定律認為經濟增長與失業(yè)率是負相關的,故首先考慮把GDP引入待選變量集中。此外,由于失業(yè)保險是解決失業(yè)所產生的不利因素的社會機制,故考慮把享受失業(yè)保險人數、失業(yè)保險參保人數、失業(yè)保險金收入額也引入待選變量集中。云南勞動力資源供給的潛力相當大,這將給云南的就業(yè)形勢造成不容忽視的壓力,故而把人口總數也引入變量集。固定資產投資是生產規(guī)模的重要表征,對就業(yè)情況產生著重要影響,故此,應將其也引入變量集中。綜上,我們選取失業(yè)保險參保人數(十萬人)、享受失業(yè)保險人數(萬人)、GDP(千億元)、人口總數(千萬人)、失業(yè)保險金收入額(億元)、生產性固定投資總額(百億元)為自變量,以城鎮(zhèn)登記失業(yè)率(%)為響應變量。
綜上分析,我們建立云南省失業(yè)率影響因素分析的六元回歸預測模型:
y=a0+a1x1+a2x2+a3x3+a4x4+a5x5+a6x6
其中,x1系參保人數(十萬人)、x2系享受失業(yè)保險人數(萬人)、x3系 GDP(千億元)、x4系人口總數(千萬人)、x5系失業(yè)保險金收入額(億元)、x6系生產性固定投資總額(百億元)、y系城鎮(zhèn)登記失業(yè)率(%)。
回歸方程的F檢驗的p值為0.016<0.05,這意味著,在5%的顯著性水平下,解釋變量對被解釋變量的聯(lián)合線性影響是顯著的。而系數的t檢驗中,p值最小的為0.208,故在5%顯著性水平下所有系數均不顯著,即每個解釋變量對被解釋變量的線性影響均是不顯著的。這說明模型自變量間很可能存在多重共線性。事實上,t-檢驗中解釋變量都不顯著,可能是由于某些自變量對因變量的影響被其他自變量掩蓋了。為了檢驗多重共線性的存在,先求出自變量的樣本協(xié)方差矩陣,并求得該協(xié)方差矩陣的條件數(最大特征值與最小特征值之比)為1.7914*104,這說明六個變量之間存在很嚴重的多重共線性。故此,分別通過逐步回歸法和AIC準則進行自變量的選擇。
對六個自變量采用逐步回歸方法進行變量篩選,用SPSS軟件逐步回歸的結果如表1所示。
表1 逐步回歸法選擇的變量回歸系數表
逐步回歸結果顯示選擇的自變量應當為失業(yè)保險參保人數(x1)和人口總數(x4)。在5%的顯著性水平下,他們的p值分別為.000和.000,表明這兩個解釋變量對方程的影響是顯著的。為了進一步確證上述變量選擇結果,我們使用AIC準則對一些重點待選模型進行比較。比較結果如下:僅包含x1、僅包含x4和包含x1和x4兩個自變量和其他任意自變量搭配的模型,其AIC值均大于只包含x1和x4兩個自變量的模型的AIC值??梢?,AIC準則提供的變量選擇的結果與逐步回歸法一致,均選擇x1和x4。
以y為因變量,以x1和x4為自變量的回歸模型擬合結果如下:
在5%的顯著性水平下,所有解釋變量系數的t統(tǒng)計量的P值均小于0.05,故所有系數均不顯著為0,即每個解釋變量對被解釋變量的線性影響均是顯著的。F檢驗(p=0.000<0.05)的結果顯示方程顯著,即在5%的顯著性水平下解釋變量對被解釋變量的聯(lián)合線性影響是顯著的。
由異方差性的White檢驗來看,F統(tǒng)計量的p值為0.3869,在5%的顯著性水平下,落在接受域內。所有的交叉項和獨立項的p值也都落在接受域內,說明無法拒絕原假設,所以模型中不存在明顯的異方差性。
異常點即為在預設統(tǒng)計模型下明顯與大多數數據點的統(tǒng)計規(guī)律不一致的數據點。在線性模型下,異常點可采用下述的均值漂移模型來檢驗,該模型的向量形式可表示為Y=Xβ+hiγ+ε,hi=(0,…,1,…,0)T。其中 hi中第 i個元素為 1,其余元素為 0,X為自變量矩陣,Y為因變量向量。若γ顯著,說明第i個點的均值有漂移,則該點不符合既定的線性回歸方程,從而說明第i個點為異常點。為了檢驗γ是否顯著,我們采用參數顯著性檢驗方法。
對異常點的檢驗過程如下:新增加一個自變量z,可疑點所對應的取值為1,其他元素取值為0,在模型(1)加入變量z再進行線性回歸,若z的系數顯著,則判定相應的樣本點為異常值點。經過計算,在5%的顯著性水平下,2000年和2002年的數據中變量z通過了系數的顯著性檢驗(其p值分別是0.014和0.006),故判定其為異常值點。
將2000年和2002年的數據點剔除,利用剩余十個年度的數據重新進行逐步回歸得到由x1和x4組成的模型,并得到以下的擬合方程:可見,剔除2000年和2002年的異常點后變大了,表明模型的擬合優(yōu)度得到了改善。F檢驗(p=0.000<0.05)的結果顯示方程顯著,即在5%的顯著性水平下解釋變量對被解釋變量的聯(lián)合線性影響是顯著的。該模型也通過了異方差和序列相關檢驗。上述擬合模型即為我們最終所得的失業(yè)率對失業(yè)保險參保人數和總人數的線性回歸模型。
從上述模型看,在失業(yè)保險參保人數、享受失業(yè)保險人數、GDP、人口總數、失業(yè)保險金收入額和生產性固定投資總額這些自變量中,對失業(yè)率影響最顯著的是參保人數和人口總數。失業(yè)保險參保人數和失業(yè)率呈負相關,這說明失業(yè)保險對保障失業(yè)人員的基本生活、降低失業(yè)者的再就業(yè)成本具有顯著意義,對就業(yè)起到積極的促進作用。人口總數和失業(yè)率呈正相關,說明人口增長給就業(yè)帶來了不可忽視的壓力。雖然,本文中使用的失業(yè)率是城鎮(zhèn)登記人口的失業(yè)率,而云南省是一個農業(yè)大省,農村人口占大多數,然而,近幾年進城務工的農村勞動者人口數的不斷攀升,仍給城鎮(zhèn)勞動者的就業(yè)帶來一定壓力。某一地區(qū)流動人口的大量增長會在短期內造成該地區(qū)勞動力市場的失衡,對本地區(qū)居民就業(yè)產生壓力,但流動人口也對本地區(qū)經濟增長提供了勞動力的支撐。面對由于這種原因造成的失業(yè),各地區(qū)應采取的措施是有效完善勞動力市場、加快勞動力市場的信息化建設、促進經濟增長帶動就業(yè)以降低失業(yè)率。模型表明GDP對失業(yè)率的影響不顯著,這表明云南省經濟增長對降低失業(yè)率的貢獻不大,這似乎與奧肯定律相違背,奧肯定律認為針對整個國家而言,經濟增長會引起失業(yè)率的下降。GDP對失業(yè)率的影響不顯著的原因除了經濟增長地區(qū)吸引勞動力而造成就業(yè)壓力以外,還可能與云南省GDP質量有關。此外,2000年和2002年的樣本點對于模型而言是異常值點,其異常的原因值得進一步研究。
[1]程紅莉、劉強:區(qū)域失業(yè)率差異影響因素的實證分析[J].統(tǒng)計與信息論壇,2003(3).
[2]田力:影響失業(yè)率的主要因素及降低失業(yè)率的對策[J].哈爾濱金融高等??茖W校學報,2003(1).
[3]陳幼芳、張?zhí)鞎涸颇鲜I(yè)率預測和研究[J].經濟問題探索,2006(6).
[4]高惠漩:應用多元統(tǒng)計分析[M].北京大學出版社,2005.