国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于偏最小二乘回歸的城鎮(zhèn)登記失業(yè)率預(yù)測*

2013-11-28 09:39:58韓慶艷李文濤
艦船電子工程 2013年12期
關(guān)鍵詞:共線性因變量失業(yè)率

韓慶艷 李文濤

(1.安徽郵電職業(yè)技術(shù)學(xué)院 合肥 230031)(2.陸軍軍官學(xué)院 合肥 230031)

1 引言

失業(yè)率是反應(yīng)社會(huì)形態(tài)的重要指標(biāo),是國民經(jīng)濟(jì)中極其重要的問題。近年來,國外學(xué)者非常關(guān)注城鎮(zhèn)失業(yè)率預(yù)測問題[1~3],我國的向東進(jìn)[4]、向小東[5]、楊帥國[6]、曹燦[7]等從不同角度,采用各種方法對城鎮(zhèn)失業(yè)率進(jìn)行了預(yù)測,取得了較好的效果。但是,從這些文獻(xiàn)中可以看出,為了完備地描述這一問題,分析人員盡可能多地選取影響城鎮(zhèn)失業(yè)率的因素,在城鎮(zhèn)失業(yè)率預(yù)測系統(tǒng)中往往會(huì)出現(xiàn)影響因素多重共線現(xiàn)象。王惠文在文獻(xiàn)[8]指出,無視這種多重共線性,會(huì)影響分析的客觀性,使結(jié)果產(chǎn)生嚴(yán)重偏差。

偏 最 小 二 乘 回 歸[9~10](Partial Least-Squares Regression,PLSR)是一種新型的多元統(tǒng)計(jì)分析方法,集多元線性回歸、典型相關(guān)分析和主成分分析的功能為一體,能有效解決自變量因子間的多重共線性影響的問題,因此,本文擬對PLSR建模方法在城鎮(zhèn)失業(yè)率預(yù)測中的應(yīng)用加以探討,以提高模型擬合效果和預(yù)測精度。

2 城鎮(zhèn)登記失業(yè)率影響因素與多重共線性診斷

2.1 城鎮(zhèn)登記失業(yè)率影響因素分析

失業(yè)的統(tǒng)計(jì)方法各國差異較大,我國采用城鎮(zhèn)登記失業(yè)率,是指城鎮(zhèn)登記失業(yè)人數(shù)同城鎮(zhèn)從業(yè)人數(shù)與城鎮(zhèn)登記失業(yè)人數(shù)之和的比。其中,城鎮(zhèn)登記失業(yè)人員是指有非農(nóng)業(yè)戶口,在一定的勞動(dòng)年齡內(nèi)(16歲以上及男50歲以下、女45歲以下),有勞動(dòng)能力,無業(yè)而要求就業(yè),并在當(dāng)?shù)鼐蜆I(yè)服務(wù)機(jī)構(gòu)進(jìn)行求職登記的人員[11]。

通過查閱相關(guān)資料,選取勞動(dòng)力因素、國家政策類因素、居民消費(fèi)類因素、投資與經(jīng)濟(jì)類因素和產(chǎn)能結(jié)構(gòu)因素等五類影響因素,具體指標(biāo)包括:

1)勞動(dòng)力因素類,包括年度總?cè)丝?、?jīng)濟(jì)活動(dòng)人口、城鎮(zhèn)就業(yè)人員數(shù)、城鎮(zhèn)單位就業(yè)人口平均工資、城鎮(zhèn)單位勞動(dòng)人員就業(yè)總報(bào)酬。

2)國家政策因素類,包括教育經(jīng)費(fèi)投入和財(cái)政支出。

3)居民消費(fèi)因素類,包括居民消費(fèi)價(jià)格指數(shù)(CPI)增長率、最終消費(fèi)支出以及社會(huì)消費(fèi)品零售總額。

4)投資和經(jīng)濟(jì)因素類,包括進(jìn)出口總額、城鎮(zhèn)固定資產(chǎn)投資、GDP、GDP增長率、匯率等。

5)產(chǎn)能結(jié)構(gòu)因素類,包括第一產(chǎn)業(yè)、第二產(chǎn)業(yè)和第三產(chǎn)業(yè)的產(chǎn)值比重。

綜上所述,得出了影響城鎮(zhèn)登記失業(yè)率的五大因素和18個(gè)指標(biāo),并且給出了結(jié)構(gòu)框架表,如表1所示。

表1 城鎮(zhèn)登記失業(yè)率影響因素和指標(biāo)結(jié)構(gòu)圖

2.2 影響因素多重共線性診斷

選定的城鎮(zhèn)登記失業(yè)率影響因素有18個(gè),可能將存在一些近似線性的變量選作解釋變量,這種解釋變量間的近似線性關(guān)系在統(tǒng)計(jì)中稱之為多重共線性(multicollinearity)[12]。由于多重共線性的存在,違背了線性回歸模型的假定,使得具有良好特性的最小二乘估計(jì)與最小二乘理論遭到嚴(yán)重破壞,所作的預(yù)測也就完全失效。因此有必要進(jìn)行多重共線性診斷。

目前較為常用的診斷方法主要有:條件指標(biāo)法、特征分解法、方差擴(kuò)大因子法、本征值與病態(tài)指數(shù)檢驗(yàn)法等。本文采用本征值與病態(tài)指數(shù)檢驗(yàn)法[13~14]。

該檢驗(yàn)法是由貝爾斯等人1980年提出的。首先對影響因素矩陣X中心化、標(biāo)準(zhǔn)化,再計(jì)算出R-1=(X′X)-1,設(shè)λmax與λmin為R-1的最大本征值和最小本征值,設(shè)k為病態(tài)數(shù),定義為k=λmax/λmin,病態(tài)指數(shù)CI定義為

根據(jù)經(jīng)驗(yàn),如果k∈[100,1000],則認(rèn)為有中度多重共線性,如果k>1000,則認(rèn)為存在嚴(yán)重的多重共線性;如果CI∈[10,30],則認(rèn)為有中度多重共線性,如果CI>30,則認(rèn)為存在嚴(yán)重的多重共線性。

利用該方法,對影響因素?cái)?shù)據(jù)進(jìn)行計(jì)算得:λmax=180.52與λmin=3.2219×10-2,代入式(1)得:k=5602.9,CI=74.8526,說明在18個(gè)影響因素之間存在著嚴(yán)重的多重共線性。

3 偏最小二乘回歸與算法

3.1 偏最小二乘回歸

考慮p個(gè)變量y1,y2,y3,…,yp與m 個(gè)自變量x1,x2,x3,…,xm的建模問題。偏最小二乘回歸的基本作法是首先在自變量集中提取第一成分t1,同時(shí)在因變量集中也提取第一成分u1,并要求t1與u1相關(guān)程度達(dá)到最大。然后建立因變量y1,y2,y3,…,yp,與t1的回歸,如果回歸方程已達(dá)到滿意的精度,則算法中止。否則繼續(xù)第二對成分的提取,直到能達(dá)到滿意的精度為止。若最終對自變量集提取r個(gè)成分t1,t2,t3,…,tr,偏最小二乘回歸將通過建立y1,y2,y3,…,yp與t1,t2,t3,…,tr的回歸式,然后再表示為y1,y2,y3,…,yp與原自變量x1,x2,x3,…,xm的回歸方程式,即偏最小二乘回歸方程式。

為了方便起見,不妨假定p個(gè)因變量y1,y2,y3,…,yp與m個(gè)自變量均為標(biāo)準(zhǔn)化變量。因變量組和自變量組的n次標(biāo)準(zhǔn)化觀測數(shù)據(jù)陣分別記為

3.2 偏最小二乘法回歸的簡潔算法

偏最小二乘法的簡潔算法的步驟如下:

4 基于PLSR模型的我國城鎮(zhèn)登記失業(yè)率預(yù)測

4.1 模型建立

根據(jù)中國統(tǒng)計(jì)年鑒中的統(tǒng)計(jì)數(shù)據(jù),并查閱相關(guān)資料,得出1997~2011年間這18個(gè)指標(biāo)和城鎮(zhèn)登記失業(yè)率的數(shù)據(jù),按照3.2中的偏最小二乘法回歸算法,采用Matlab程序編程[15],通過程序運(yùn)算得我國城鎮(zhèn)登記失業(yè)率的偏最小二乘回歸模型為

4.2 交叉有效性變量累計(jì)解釋能力

偏最小二乘回歸方程并不需要選用全部的成分進(jìn)行回歸建模,而是與主成分分析一樣,采用截尾的方式選擇幾個(gè)成分就可以得到一個(gè)預(yù)測性能較好的模型。對于因變量y,成分th的交叉有效性為,經(jīng)計(jì)算交叉有效性如表2所示。

表2 成分th對因變量y的交叉有效性

4.3 變量累計(jì)解釋能力

根據(jù)交叉有效性計(jì)算結(jié)果,從自變量系統(tǒng)中提取了五個(gè)成分,由成分對變量解釋能力定義,計(jì)算成分th(h=1,2,3,4,5)對自變量X和因變量y的累計(jì)解釋能力,如表3所示。

表3 成分th(h=1,2,3,4,5)的解釋能力

從表3可見,提取五個(gè)成分時(shí),對的X累計(jì)解釋能力達(dá)到99.6%,對y的累計(jì)解釋能力達(dá)到96%,自變量系統(tǒng)與因變量系統(tǒng)相關(guān)性較高。

4.4 預(yù)測結(jié)果與誤差分析

根據(jù)式(2)中的偏最小回歸方程,將數(shù)據(jù)代入計(jì)算得擬合值,并進(jìn)行誤差分析,結(jié)果如表4所示。

表4 城鎮(zhèn)登記失業(yè)率預(yù)測/擬合誤差對比表

根據(jù)數(shù)據(jù)繪制了預(yù)測/實(shí)際值對比圖和誤差分析圖,如圖1、圖2所示。

圖1 預(yù)測/實(shí)際值對比圖

圖2 誤差分析圖

從以上圖表的計(jì)算結(jié)果可以看出,偏最小二乘回歸模型的預(yù)測誤差為-0.00343,最大相對誤差為0.01107,預(yù)測精度高,擬合效果較好,

5 結(jié)語

本文根據(jù)以往研究,總結(jié)出了城鎮(zhèn)登記失業(yè)率的五類影響因素:勞動(dòng)力因素、國家政策類因素、居民消費(fèi)類因素、投資與經(jīng)濟(jì)類因素和產(chǎn)能結(jié)構(gòu)因素和18個(gè)預(yù)測指標(biāo),采用本征值與病態(tài)指數(shù)檢驗(yàn)法進(jìn)行多重共線性進(jìn)行診斷,說明在18個(gè)影響因素之間存在著嚴(yán)重的多重共線性。為了克服多重共線性導(dǎo)致的預(yù)測失真問題,運(yùn)用偏最小二乘回歸模型,以我國城鎮(zhèn)登記失業(yè)率為研究對象,按照Q2h≥0.0975的決策原則,由于Q24=0.2501,而Q25<0,提取5個(gè)主成分時(shí),對的X累計(jì)解釋能力達(dá)到99.6%,對y的累計(jì)解釋能力達(dá)到96%,方程的預(yù)測性能為最佳,自變量系統(tǒng)與因變量系統(tǒng)相關(guān)性較高。該方法還可以進(jìn)一步推廣到類似問題的解決中去。

[1]Chen,chun-I.Application of the novel nonlinear grey Bernoulli model for forecasting unemployment rent[J].Chaos,Solitons and Fractals,2008(37):278-287.

[2]Proietti,Tommaso.Forecasting the US unemployment rate[J].Statistics and Data Analysis,2003(42):451-476.

[3]Chiu,Chih-chou,Su,chao-ton.Novel neural network model using Box-Jenkins technique and response surface methodology to predict unemployment rate[J].Proceeding of the International Conference on Tools with Artificial Intelligence,1998(23):74-80.

[4]向東進(jìn),范輝.我國城鎮(zhèn)登記失業(yè)率的影響因素分析及預(yù)測[J].湘潭大學(xué)學(xué)報(bào),2010(5):73-77.

[5]向小東,宋芳.基于核主成分與加權(quán)支持向量機(jī)的福建省城鎮(zhèn)登記失業(yè)率預(yù)測[J].系統(tǒng)工程理論與實(shí)踐,2009(1):73-79.

[6]楊帥國,胡曉華,朱冬和.我國城鎮(zhèn)登記失業(yè)率的數(shù)學(xué)模型與預(yù)測[J].海南師范大學(xué)學(xué)報(bào),2010(4):372-374.

[7]曹燦,趙聯(lián)文.基于多元回歸分析中的中國城鎮(zhèn)失業(yè)率問題研究[J].長春大學(xué)學(xué)報(bào),2011(4):50-53.

[8]王惠文.偏最小二乘回歸方法及其應(yīng)用[M].北京:國防工業(yè)出版社,1999:65-97.

[9]Erikson L,Johansson E,Kettaneh W N,et al.Mutiple and mega variate data analysis:Principles and applications[M].umea:umetrics,2001:84-104.

[10]Schreiber T.Extremely simple nonlinear noise reduction method[J].Phys Rev E,1993(47):2401-2405.

[11]張車偉.失業(yè)率定義的國際比較及中國城鎮(zhèn)失業(yè)率[J].世界經(jīng)濟(jì),2003(5):73-76.

[12]Moore,William L.A cross-validity comparision of ratingbased and choice-based conjoint analysis models[J].International Journal of Research in Marketing,2004(3):299-312.

[13]高輝.多重共線性的診斷方法[J].統(tǒng)計(jì)與信息論壇,2003(1):73-76.

[14]趙松山,白雪梅.關(guān)于多重共線性檢驗(yàn)方法的研究[J].中國煤炭經(jīng)濟(jì)學(xué)院學(xué)報(bào),2001(4):296-300.

[15]周品,趙新芬.Matlab數(shù)理統(tǒng)計(jì)分析[M].北京:國防工業(yè)出版社,2009:103-126.

猜你喜歡
共線性因變量失業(yè)率
調(diào)整有限因變量混合模型在藥物經(jīng)濟(jì)學(xué)健康效用量表映射中的運(yùn)用
中國藥房(2022年7期)2022-04-14 00:34:30
銀行不良貸款額影響因素分析
文氏圖在計(jì)量統(tǒng)計(jì)類課程教學(xué)中的應(yīng)用
——以多重共線性內(nèi)容為例
適應(yīng)性回歸分析(Ⅳ)
——與非適應(yīng)性回歸分析的比較
不完全多重共線性定義存在的問題及其修正建議
偏最小二乘回歸方法
基于三次指數(shù)平滑的失業(yè)率預(yù)測
電子制作(2017年24期)2017-02-02 07:14:25
回歸分析中應(yīng)正確使用r、R、R23種符號
診斷復(fù)共線性的特征分析法及其在GEO定軌中的應(yīng)用
找工作
江口县| 蛟河市| 青冈县| 太原市| 黄陵县| 萍乡市| 广河县| 正宁县| 建始县| 廉江市| 温泉县| 威海市| 江孜县| 布尔津县| 九江县| 柳州市| 阿克苏市| 高阳县| 陵川县| 闽侯县| 壶关县| 札达县| 荔浦县| 锡林郭勒盟| 屏南县| 准格尔旗| 九寨沟县| 菏泽市| 榆社县| 新龙县| 乌拉特中旗| 正镶白旗| 金沙县| 多伦县| 长垣县| 吴桥县| 吉水县| 独山县| 苍梧县| 宁明县| 莱州市|