国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多元線性回歸與ARIMA在中國(guó)人口預(yù)測(cè)中的比較研究

2014-04-29 21:31:44韓紹庭周雨欣
中國(guó)管理信息化 2014年22期
關(guān)鍵詞:多元線性回歸

韓紹庭 周雨欣

[摘 要] 參考中國(guó)統(tǒng)計(jì)年鑒1970-2005年的數(shù)據(jù),文章建立了多元線性回歸模型和基于ARIMA算法的時(shí)間序列模型對(duì)我國(guó)人口進(jìn)行預(yù)測(cè),將結(jié)果與實(shí)際值進(jìn)行比較,得出多元線性回歸模型在人口預(yù)測(cè)上具有更高的精準(zhǔn)度。兩個(gè)模型同時(shí)表明,我國(guó)人口在短期內(nèi)會(huì)繼續(xù)增長(zhǎng),并且多元線性回歸模型表明增長(zhǎng)趨勢(shì)會(huì)逐漸變緩。

[關(guān)鍵詞] 人口預(yù)測(cè);多元線性回歸;ARIMA

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 22. 065

[中圖分類號(hào)] O212 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2014)22- 0100- 04

中國(guó)是一個(gè)人口大國(guó),人口問(wèn)題始終是制約我國(guó)發(fā)展的關(guān)鍵因素之一。人口多,人均耕地少,人均占有資源相對(duì)不足是中國(guó)的基本國(guó)情。

新中國(guó)成立以來(lái)共進(jìn)行了6次全國(guó)性人口普查,從人口總數(shù)上分析,我國(guó)人口發(fā)展經(jīng)歷了前30年高速增長(zhǎng)和后20多年低速增長(zhǎng)兩大階段。黨的十八大報(bào)告中指出,在中國(guó)目前的現(xiàn)代化進(jìn)程中,必須實(shí)現(xiàn)人口與經(jīng)濟(jì)、社會(huì)、資源、環(huán)境協(xié)調(diào)發(fā)展和可持續(xù)發(fā)展,進(jìn)一步控制人口數(shù)量,提高人口質(zhì)量,改善人口結(jié)構(gòu),實(shí)現(xiàn)五位一體的和諧發(fā)展。

有效控制我國(guó)人口數(shù)量的增長(zhǎng),將促進(jìn)我國(guó)經(jīng)濟(jì)的可持續(xù)發(fā)展,也是全面建設(shè)小康社會(huì)的需要。而認(rèn)識(shí)人口數(shù)量的變化規(guī)律,建立人口模型,作出精確的預(yù)報(bào),是有效控制人口增長(zhǎng)的前提。準(zhǔn)確預(yù)測(cè)未來(lái)一段時(shí)間內(nèi)每年人口數(shù)量及其增長(zhǎng),可以為中國(guó)經(jīng)濟(jì)和社會(huì)發(fā)展決策提供科學(xué)依據(jù),對(duì)于加速推進(jìn)中國(guó)現(xiàn)代化建設(shè)有著極為重要的現(xiàn)實(shí)意義。

1 文獻(xiàn)綜述

人口預(yù)測(cè)始于1696年,當(dāng)時(shí)英國(guó)社會(huì)學(xué)家G·金使用簡(jiǎn)單的數(shù)學(xué)方法對(duì)英國(guó)未來(lái)600年的人口發(fā)展進(jìn)行了粗略的計(jì)算,雖然這一結(jié)果與以后的實(shí)際情況相差甚遠(yuǎn),但他的思想?yún)s對(duì)后人的工作很有啟發(fā)。

早在1798年,英國(guó)人口統(tǒng)計(jì)學(xué)家馬爾薩斯提出了聞名于世的人口指數(shù)增長(zhǎng)模型,此模型曾用于世界人口的預(yù)測(cè),在1961年以前是比較準(zhǔn)確的,但用此模型預(yù)測(cè)未來(lái)人口,得到的結(jié)果會(huì)出現(xiàn)很大誤差。馬爾薩斯預(yù)見(jiàn), 各國(guó)經(jīng)濟(jì)將趨同于一個(gè)穩(wěn)定的人均收入水平, 而且當(dāng)收入水平超過(guò)均衡水平時(shí), 生育率上升, 死亡率下降, 反之亦然。

此后,K.Subbarao的研究表明,一個(gè)國(guó)家的人口增長(zhǎng)率與居民受教育水平負(fù)相關(guān)。另外,對(duì)于貧困階層來(lái)說(shuō),兒童在某種程度上是一種經(jīng)濟(jì)投入品,父母期待為其年老時(shí)提供經(jīng)濟(jì)支持的形式,獲得養(yǎng)育兒童的回報(bào),由此認(rèn)為貧富差距對(duì)人口數(shù)量的影響是顯著的。

在中國(guó),中國(guó)社會(huì)科學(xué)院學(xué)者李政(2006)使用中國(guó)1992—2002年的數(shù)據(jù),通過(guò)構(gòu)建人口增長(zhǎng)率與人均GDP、每萬(wàn)人在校大學(xué)生人數(shù)的回歸模型,得出經(jīng)濟(jì)增長(zhǎng)和教育水平對(duì)人口增長(zhǎng)率有抑制作用。

中國(guó)學(xué)者王浩(2006)年在《我國(guó)人口增長(zhǎng)的經(jīng)濟(jì)教育因素的實(shí)證分析》一文指出收入分配差距對(duì)人口增長(zhǎng)的影響有兩個(gè)途徑:其一, 從結(jié)構(gòu)上看, 收入分配差距越大, 低收入人群所占比重也越大。在我國(guó),低收入人群的生育率要遠(yuǎn)高于高收入人群。因此, 在其他情況不變的情況下, 收入分配差距越大, 人口增長(zhǎng)率也越大。其二, 從總體上看, 收入分配差距通過(guò)對(duì)經(jīng)濟(jì)增長(zhǎng)發(fā)生阻礙作用, 最終影響人口增長(zhǎng)。

由此,預(yù)測(cè)未來(lái)中國(guó)人口總數(shù)時(shí),既要參考人口的出生率、死亡率,更需要將國(guó)民經(jīng)濟(jì)數(shù)據(jù)(如GDP)、城鎮(zhèn)化率以及人口受教育程度等變量因素納入考察范圍。

2 人口預(yù)測(cè)的多元線性回歸模型

2.1 模型建立

基于文獻(xiàn)綜述的結(jié)果,本模型引入以下變量:

(1)選取“人均GDP”反映各觀測(cè)期的經(jīng)濟(jì)發(fā)展水平;

(2)選取“城鎮(zhèn)化率(城鎮(zhèn)人口/總?cè)丝冢狈从吵青l(xiāng)人口結(jié)構(gòu);

(3)選取“初中畢業(yè)生人數(shù)”反映我國(guó)居民的受教育水平;

(4)選取“城鎮(zhèn)居民家庭人均可支配收入/農(nóng)村居民家庭人均純收入”反映我國(guó)的貧富差距。

因此多元線性回歸模型設(shè)定為:

式中,yt為觀測(cè)期年底人口數(shù);c為截距項(xiàng);x1t為觀測(cè)期人均國(guó)內(nèi)生產(chǎn)總值(元);x2t為觀測(cè)期城鎮(zhèn)化率;x3t為觀測(cè)期初中畢業(yè)生人數(shù)(萬(wàn)人);x4t為觀測(cè)期城鎮(zhèn)居民家庭人均收入/農(nóng)村居民家庭人均收入;t為時(shí)間變量;εt為殘項(xiàng);βi為待估計(jì)參數(shù)值。

2.2 模型估計(jì)與分析

在導(dǎo)入1970-2005年的數(shù)據(jù)后,使用R軟件進(jìn)行回歸分析,得到:

分析結(jié)論:

(1)可決系數(shù)為0.999 6 ,校正的可決系數(shù)為0.999 5,可以看出模型的擬合度很高,模型對(duì)財(cái)政收入的解釋程度高達(dá)99.6%;

(2)F統(tǒng)計(jì)量為13 410,說(shuō)明0.05水平下回歸方程整體上顯著;

(3)t 檢驗(yàn)結(jié)果表明,除了初中生畢業(yè)人數(shù)以外,其他因素對(duì)人口總數(shù)的影響均顯著。

2.3 驗(yàn)證多重共線性

模型整體上擬和效果較好,但x3項(xiàng)(即初中生畢業(yè)人數(shù))的t檢驗(yàn)不顯著,而且符號(hào)與預(yù)期相反,模型可能存在多重共線性。經(jīng)計(jì)算各解釋變量的相關(guān)系數(shù),得相關(guān)系數(shù)矩陣,見(jiàn)表1。

由相關(guān)系數(shù)矩陣可以看出,各個(gè)解釋變量之間的相關(guān)系數(shù)較高,證實(shí)在此模型中,多個(gè)變量之間確實(shí)存在著比較顯著的多重共線性。而在線性回歸模型中,如果解釋變量之間存在精確相關(guān)關(guān)系或高度相關(guān)關(guān)系,則模型將會(huì)失真。

為了消除模型中多重共線性的影響,采用逐步回歸法剔除變量。start步中,全部變量回歸時(shí),AIC值為384.81.94;如果去掉x3,AIC值變?yōu)?82.86;去掉x4,AIC值變?yōu)?89.46;去掉x1,AIC值變?yōu)?29.9;去掉x2,AIC值變?yōu)?39.33。故第一步完成后判斷去掉x3,AIC值最小。然后使用此模型進(jìn)行下一輪計(jì)算。在下一輪計(jì)算中,無(wú)論去掉哪個(gè)變量,AIC值都會(huì)增加。因此終止計(jì)算,得到最優(yōu)回歸方程:

2.4 用模型預(yù)測(cè)值實(shí)際值比較

結(jié)果見(jiàn)表2。

2.5 模型診斷

令殘差對(duì)擬合值作圖,結(jié)果如圖1所示。橫軸是對(duì)各個(gè)觀測(cè)的擬合值Yi^,而縱軸是分離出來(lái)的殘差ε^=Yi-Yi^。從圖中首先可以看出第1、11個(gè)觀測(cè)值,即1978年、1988年的觀測(cè)值,殘差出現(xiàn)異常。對(duì)于以上兩個(gè)特殊年份,考慮到中國(guó)整個(gè)城鎮(zhèn)化進(jìn)程受到了前后不統(tǒng)一的政策影響,特別是在建國(guó)初期經(jīng)歷了短暫的正常發(fā)展后,城鎮(zhèn)化進(jìn)程受到大躍進(jìn)、“文革”等政治因素的強(qiáng)烈干擾,在1964年到1977年之間,城鎮(zhèn)化水平由原先的增長(zhǎng)轉(zhuǎn)為倒退,即“反向城鎮(zhèn)化進(jìn)程”。因此,從1978年重新進(jìn)入到一個(gè)上升渠道的城鎮(zhèn)化數(shù)據(jù)造成了1978年出現(xiàn)了觀測(cè)值異常。同樣,1988年也有類似的政策性干擾因素出現(xiàn)。

要檢驗(yàn)數(shù)據(jù)中是否有異常值或影響點(diǎn)可以通過(guò)計(jì)算比較Cook距離來(lái)實(shí)現(xiàn)。令標(biāo)準(zhǔn)化殘差對(duì)杠桿值作圖,如圖2所示。

通過(guò)圖2,發(fā)現(xiàn)1、5、17、35號(hào)樣本,即:1978年、1982年、1994年、2011年有較大的影響。正如之前考慮到幾個(gè)數(shù)據(jù)異常是由于我國(guó)的政策性因素所造成,因此,根據(jù)圖2可知第一個(gè)點(diǎn),即1978年政策性干擾較大,考慮剔除。而其后1982年、1994年以及2011年的幾個(gè)異常值由于殘差的差值在可接受范圍內(nèi),不考慮剔除。

3 基于ARIMA算法的時(shí)間序列模型

3.1 平穩(wěn)性檢驗(yàn)

根據(jù)ARIMA算法的建模步驟,可知ARIMA模型是以平穩(wěn)隨機(jī)序列為前提的,因此需要首先檢驗(yàn)人口的平穩(wěn)性。由于多元線性回歸模型已經(jīng)證明1978年數(shù)據(jù)異常,因此在本模型中選用1980-2005年的數(shù)據(jù),以此對(duì)未來(lái)人口進(jìn)行預(yù)測(cè),并與實(shí)際值進(jìn)行比較。

從圖3可知:我國(guó)人口逐年增長(zhǎng),因此為非平穩(wěn)時(shí)間序列,需要進(jìn)行差分。從圖4看出一階差分圖最后趨勢(shì)還是下降的,因此依舊是非平穩(wěn)序列,需要進(jìn)行二階差分。可以看出二階差分后(如圖5)數(shù)值近似在平均值上下波動(dòng),因此可以初步判斷其為平穩(wěn)序列。

接下來(lái)進(jìn)行單位根檢驗(yàn),采用ADF單位根檢驗(yàn)法,得到P值遠(yuǎn)小于0.01,因此拒絕原假設(shè),即拒絕二階差分序列存在單位根,因此可以判定二階差分序列為平穩(wěn)序列。

3.2 時(shí)間序列模型建立

由于我國(guó)人口數(shù)一直增長(zhǎng),因此判定無(wú)周期,可以采用ARMA(p,q)模型。

首先計(jì)算平穩(wěn)時(shí)間序列的樣本自相關(guān)系數(shù)(ACF)和偏自相關(guān)系數(shù)(PACF),然后依此來(lái)估計(jì)p和q的值。

做出二階差分序列滯后12期的ACF圖(如圖6)和PACF圖(如圖7)。

可以看出,ACF圖在q=1之后截尾,而PACF拖尾,因此根據(jù)判斷法則,可識(shí)別模型為ARIMA(0,2,1),得到模型的AIC值為293.1。同時(shí),根據(jù)R軟件自帶auto.arima函數(shù),得到建議模型為:ARIMA(0,2,0),其AIC值為292.77。二者的AIC值比較接近,因此有待進(jìn)一步根據(jù)檢驗(yàn)情況判斷。

3.3 模型預(yù)測(cè)結(jié)果

根據(jù)ARIMA(0,2,0)預(yù)測(cè)結(jié)果見(jiàn)表3。

根據(jù)ARIMA(0,2,1)預(yù)測(cè)結(jié)果見(jiàn)表4。

可以看出ARIMA(0,2,0)預(yù)測(cè)效果較好,因此選用ARIMA(0,2,0)模型作為最終模型。

3.4 殘差檢驗(yàn)

參數(shù)估計(jì)后,需對(duì)模型殘差序列進(jìn)行白噪聲檢驗(yàn),若殘差序列不是白噪聲序列,意味著殘差序列還存在有用信息沒(méi)有提取,需要進(jìn)一步改進(jìn)。

圖8中第二行的ACF檢驗(yàn)說(shuō)明殘差沒(méi)有明顯的自相關(guān)性,第三行的Ljung-Box測(cè)試顯示所有的P值都0.1,說(shuō)明殘差為白噪聲序列,模型合格。

3.5 模型預(yù)測(cè)結(jié)果圖示

模型預(yù)測(cè)結(jié)果如圖9所示。

4 結(jié) 論

運(yùn)用兩個(gè)模型同時(shí)對(duì)2006-2011年的人口數(shù)據(jù)進(jìn)行預(yù)測(cè),并與實(shí)際值進(jìn)行比較,發(fā)現(xiàn)多元線性回歸模型具有較高的精準(zhǔn)性。當(dāng)然,任何一種預(yù)測(cè)方法都是建立在一定假定條件之上的,而任何一種假定條件都難以包括現(xiàn)實(shí)世界中的所有復(fù)雜關(guān)系。相對(duì)來(lái)說(shuō),兩種模型都適用于中短期人口預(yù)測(cè),模型精確度都比較高。

經(jīng)過(guò)分析,ARIMA模型相對(duì)于多元線性回歸模型精確度較低的原因可能在于其僅基于時(shí)間以及歷史人口數(shù)據(jù)來(lái)對(duì)未來(lái)進(jìn)行預(yù)測(cè),并沒(méi)有考慮其他因素。而人口數(shù)量與眾多因素(出生率、死亡率、城鎮(zhèn)化率、國(guó)家政策)息息相關(guān),因此僅通過(guò)時(shí)間因素分析并不能很好地預(yù)測(cè)人口的變化。

在實(shí)際情況中,影響人口數(shù)量的因素還有很多,但是并不能把所有因素全部引入到多元線性回歸模型中,因?yàn)檫@將引起嚴(yán)重的多重共線性,進(jìn)而影響模型的準(zhǔn)確性、可靠性。而在消除共線性的過(guò)程中,又會(huì)引起變量減少、干擾序列不相關(guān)、存在異方差等諸多缺陷。因此更加精準(zhǔn)的預(yù)測(cè)人口變化,還需要更多的研究與探討。

主要參考文獻(xiàn)

[1]Jalan Jyotsna,K Subbarao. Gender Disparity in Human Resource Development: Cross Country Patterns[C]//Education and Social Policy Department, World Bank, ESP Discussion Paper Series 25,1994.

[2]門可佩,官琳琳,尹遜震.基于兩種新型灰色模型的中國(guó)人口預(yù)測(cè)[J].經(jīng)濟(jì)地理,2008(6):942-945.

[3]涂雄苓,徐海云. ARIMA與指數(shù)平滑法在我國(guó)人口預(yù)測(cè)中的比較研究[J].統(tǒng)計(jì)與決策,2009(16):21-23.

猜你喜歡
多元線性回歸
我國(guó)銀行業(yè)股票收益影響因素實(shí)證研究
國(guó)內(nèi)旅游收入主要影響因素的實(shí)證分析
基于灰色關(guān)聯(lián)和線性規(guī)劃的糧食種植面積影響因素分析
基于組合模型的卷煙市場(chǎng)需求預(yù)測(cè)研究
基于多元線性回歸分析的冬季鳥類生境選擇研究
我國(guó)上市商業(yè)銀行信貸資產(chǎn)證券化效應(yīng)實(shí)證研究
云學(xué)習(xí)平臺(tái)大學(xué)生學(xué)業(yè)成績(jī)預(yù)測(cè)與干預(yù)研究
全國(guó)主要市轄區(qū)的房?jī)r(jià)收入比影響因素研究
商(2016年20期)2016-07-04 01:23:26
宏觀經(jīng)濟(jì)變量對(duì)上證指數(shù)影響的實(shí)證研究
利用計(jì)量工具比較東西部的經(jīng)濟(jì)狀況
商(2016年5期)2016-03-28 12:14:30
平安县| 个旧市| 岑巩县| 永仁县| 定南县| 黑山县| 南和县| 饶平县| 阜康市| 星子县| 咸宁市| 开江县| 蕲春县| 大丰市| 文水县| 孝义市| 收藏| 炎陵县| 泌阳县| 松江区| 武安市| 水城县| 庐江县| 开原市| 额济纳旗| 楚雄市| 大安市| 徐闻县| 阳曲县| 大悟县| 荔浦县| 普兰县| 玉门市| 安义县| 西峡县| 安阳县| 张家界市| 监利县| 文成县| 德令哈市| 封开县|