金 露,夏萬軍
(安徽財經(jīng)大學(xué) 統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院,安徽蚌埠233041)
2010年中國第6 次全國人口普查結(jié)果顯示,全國總?cè)丝跀?shù)量為1 339 724 852,占世界人口總量的19.4%,仍然是目前世界上人口最多的國家[1]。與2000年第5 次人口普查相比,10年內(nèi)總?cè)丝谠黾? 390 萬人,增長了5.84%,年平均增加率為0.57%,比1990年到2000年的年均增加率1.07%下降了0.5%。該數(shù)據(jù)表明,自1980年在全國城鄉(xiāng)實行計劃生育政策以來,對人口控制效果成果顯著,人口增加率得到了一定程度控制,但從人口總量上看,形勢依然不容樂觀。
除了人口數(shù)量問題,人口結(jié)構(gòu)也是目前比較突出的問題之一。人口老齡化日趨嚴(yán)重,據(jù)估計,在未來幾年內(nèi),我國65 歲及以上人口將呈現(xiàn)快速增加趨勢,但是由于生育率持續(xù)走低,導(dǎo)致老齡化問題日益凸顯。此外,出生人口性別比例偏差問題也很嚴(yán)峻。2010年,我國出生人口的男女比例為1∶1.1808,2000年該比值為1∶1.1686,大大超過了103 ~107 的正常值范圍,說明我國人口性別比例問題沒有得到改善,且有愈演愈烈的趨勢。
在人口數(shù)量和人口結(jié)構(gòu)雙重問題的形勢下,中國人口問題的長期性、復(fù)雜性、艱巨性、矛盾性更加突出,人口問題嚴(yán)重影響了中國現(xiàn)代化進(jìn)程,阻礙了經(jīng)濟(jì)、社會、資源、環(huán)境等諸多因素的統(tǒng)籌協(xié)調(diào)可持續(xù)發(fā)展,對我國各項人口政策和福利保障機制提出了嚴(yán)峻的挑戰(zhàn)。
為了研究我國人口變化狀況,預(yù)測我國人口數(shù)量,本文采用組合模型為研究方法,對人口波動設(shè)置虛擬變量,從定量分析的角度,研究了新中國成立62年來我國的人口狀況和計劃生育政策的影響,并利于組合模型的預(yù)測優(yōu)勢,對人口序列進(jìn)行預(yù)測,以期得到令人信服的結(jié)果。
組合模型是指將回歸模型與時間序列模型分析方法相結(jié)合組成新的模型。假設(shè)有如下一元線性回歸模型:
設(shè)(1)式的估計式為:
組合模型主要有四種作用:(1)克服回歸模型中的自相關(guān)性;(2)對時間序列作長期預(yù)測;(3)對時間序列作干擾分析;(4)應(yīng)用于季節(jié)調(diào)整的時間序列組合模型。
本文采用組合模型,克服了回歸模型的自相關(guān)性,并對人口序列進(jìn)行預(yù)測,以期得到理想的預(yù)測效果。
本文選擇1949—2010年中國人口總量數(shù)據(jù)為研究對象,數(shù)據(jù)來源于國家統(tǒng)計局網(wǎng)站(由于篇幅有限,具體數(shù)據(jù)省略),人口序列總體情況見圖1。由圖可以看出,總體而言,中國人口序列隨著時間推移呈現(xiàn)明顯的增長趨勢。其中1960年、1961年人口史無前例出現(xiàn)下降的情況,這主要是由于1960年開始的自然災(zāi)害,導(dǎo)致人口數(shù)量的急劇減少。此外,自1980年實行計劃生育政策開始,我國的人口增長速率有所減緩,對我國人口數(shù)量的減少做了很大貢獻(xiàn)。這兩次人口變動,對我國人口基數(shù)和人口增長產(chǎn)生了較大影響。為了進(jìn)一步研究人口波動情況,分別對兩次人口波動設(shè)置虛擬變量,建立時間序列模型。
圖1 人口序列圖
1.模型I
首先對人口數(shù)取對數(shù),消除可能存在的異方差。為了研究1960年的人口突變情況,將1960年設(shè)為突變點。定義虛擬變量DL1:
假設(shè)斜率和截距雙突變,建立最小二乘模型,結(jié)果為:
注:DT1 = DL* t;括號中的數(shù)字為t 統(tǒng)計量;***、**、* 分別表示在1%、5%、10% 的水平下顯著,下同。
模型(4)中可以看出,R2=0.9796,模型整體擬合效果較好(根據(jù)DW 的值可以看出,模型存在自相關(guān)性,后文將對模型進(jìn)行改進(jìn)以消除異方差)。在1960年,截距突變在1% 的顯著性水平上顯著,人口基數(shù)發(fā)生了顯著變化,對于斜率突變的顯著性程度雖然不及截距,但也在10% 的顯著性水平上顯著,說明1960年的自然災(zāi)害對人口增長率也有一定程度的影響。這可能與人口的代際性質(zhì)有關(guān),即上代人口數(shù)量會影響下一代的人口數(shù)量。由于人口基數(shù)降低,這一時期出生人口數(shù)量也會在一定程度上降低,導(dǎo)致人口增長率的降低。
2.模型II
模型I 說明了1960年突變點的顯著程度,模型II 將在模型I 的基礎(chǔ)上研究1980年突變點的顯著程度,即計劃生育政策的有效性。再次定義虛擬變量DL2:
假設(shè)斜率和截距雙突變,建立最小二乘模型,結(jié)果為:
注:DT2 = DL2* t,下同。
上述模型中,除1960年突變點代表斜率突變的虛擬變量不顯著外,其余變量均顯著,剔除該變量,對模型進(jìn)行修正,結(jié)果如下:
模型(6)中R2= 0.9973,模型整體擬合效果較好,且各參數(shù)顯著。上述模型說明,新中國成立以來,人口發(fā)生兩次較大規(guī)模的波動,1960年為截距突變,導(dǎo)致人口數(shù)量急劇下降,與事實相符。1980年截距突變和斜率突變的虛擬變量都顯著,從代表斜率變動情況的虛擬變量DT2的系數(shù)可以看出,計劃生育政策控制了人口的增長速度,發(fā)揮了其應(yīng)有的功效。
3.組合模型的建立
根據(jù)模型(6)的DW 值可知,模型存在嚴(yán)重的自相關(guān)性,要克服自相關(guān)性,組合模型是一種很好的辦法。在建立組合模型之前,必須對(6)式的殘差μ 進(jìn)行平穩(wěn)性檢驗,選擇帶截距項帶趨勢項的ADF 檢驗,結(jié)果為ADF =-3.3317 <-2.9126(臨界值),在5% 的置信度水平下,拒絕存在單位根的原假設(shè)[3],因此,認(rèn)為殘差序列不存在單位根,為平穩(wěn)序列,可以直接建立組合模型,用ARMA 模型替代殘差μ。根據(jù)μ 的自相關(guān)圖確定ARMA 模型的自回歸和移動平均最大階數(shù),按AR(1)、AR(4)、MA(1)、ARMA(1,1)、ARMA(4,1)估計,結(jié)果見表1。
通過比較模型的擬合系數(shù)R2、各參數(shù)t 檢驗結(jié)果以及AIC、SC 值發(fā)現(xiàn)ARMA(4,1)模型估計結(jié)果最合理,最終選定以ARMA(4,1)替代殘差序列μ,建立組合模型,表達(dá)式為:
觀察DW 值可以明顯看出,組合模型克服了(6)式中的自相關(guān)性,新的組合模型各參數(shù)顯著,且模型的整體擬合效果較原模型有了進(jìn)一步提高。
表1 μ 序列的ARMA 模型回歸結(jié)果
將公式(7)根據(jù)虛擬變量拆分,得到分階段的三個公式:
為了便于觀察,將上式用圖形表示出來(見圖2)。根據(jù)圖2,可以明顯看出兩次人口變動的具體情況。第一次突變在1960年,人口基數(shù)發(fā)生下降,這里不具體分析。主要看第二次人口序列的變動,其斜率發(fā)生了明顯變化,前面兩階段的斜率為0.0217,第三階段斜率下降到0.0102,人口對數(shù)的增長下降了52.9954%,這是新中國成立以來人口問題的一大歷史性進(jìn)步,說明計劃生育政策為我國人口形勢作出了重大貢獻(xiàn)。
圖2 三個階段擬合效果圖
根據(jù)預(yù)測時間長短分為長期預(yù)測和短期預(yù)測,根據(jù)預(yù)測樣本區(qū)間可以分為樣本內(nèi)預(yù)測和樣本外預(yù)測。此外,根據(jù)預(yù)測方式,還分為結(jié)構(gòu)預(yù)測和非結(jié)構(gòu)預(yù)測,在本文中結(jié)構(gòu)預(yù)測指利用(7)式的第一行預(yù)測,即不包括ARMA 項,非結(jié)構(gòu)預(yù)測指完全按照(7)式進(jìn)行預(yù)測。本文分別就以上幾種預(yù)測類型,對我國人口數(shù)量進(jìn)行預(yù)測。
1.樣本內(nèi)短期預(yù)測
對2010年人口進(jìn)行預(yù)測,結(jié)果見表2。由下表可以看出,三項預(yù)測評價指標(biāo)——均方根誤差RMSE、平均誤差MAE 以及平均絕對百分誤差MAPE 都控制在理想范圍內(nèi),預(yù)測精度較高,且非結(jié)構(gòu)預(yù)測結(jié)果比結(jié)構(gòu)預(yù)測結(jié)果更準(zhǔn)確,非結(jié)構(gòu)預(yù)測誤差為0.52%,小于1%,控制在理想范圍內(nèi),說明在預(yù)測過程中加入ARMA 項之后,效果更好,精度更高,體現(xiàn)了組合模型在預(yù)測方面的優(yōu)勢。
表2 2010年人口預(yù)測結(jié)果
表3 2011-2015年人口序列預(yù)測結(jié)果
2.樣本內(nèi)長期預(yù)測
根據(jù)模型(7)預(yù)測1949—2010年的人口數(shù)量,分別得到非結(jié)構(gòu)預(yù)測結(jié)果YF3 以及結(jié)構(gòu)預(yù)測結(jié)果YF4,結(jié)果見圖3。根據(jù)該圖可以看出,代表非結(jié)構(gòu)模型預(yù)測結(jié)果的曲線YF3 與代表真實值的曲線Y 幾乎完全一致,比結(jié)構(gòu)模型預(yù)測的結(jié)果(YF4)更為精確。
3.樣本外預(yù)測
修改樣本期間為1949—2015年,以此預(yù)測2011—2015年未來5年我國人口數(shù)。預(yù)測結(jié)果見表3,到2014年我國人口總數(shù)將突破14 億,2015年我國總?cè)丝趯⑦_(dá)到14.2684 億,從預(yù)測評價指標(biāo)來看,均方誤差均在小于0.15,維持在0.12 左右,誤差波動平穩(wěn)且預(yù)測精度極高,說明該預(yù)測結(jié)果可信度較高。
圖3 1949—2010年人口序列預(yù)測結(jié)果
本文以新中國成立以來人口數(shù)量為研究對象,對人口波動以及計劃生育政策進(jìn)行分析,并設(shè)置虛擬變量,最后利用組合模型對未來我國人口進(jìn)行預(yù)測,得出以下幾點結(jié)論:
1.我國歷史上發(fā)生兩次重大的人口變動,第一次為截距突變,即人口數(shù)量的大幅度下降,人口的增長率并沒有發(fā)生變化。第二次是截距斜率雙突變,即人口增長率發(fā)生了降低。但要說明的是,模型(7)中雖然1980年的截距突變參數(shù)顯著,但并不說明人口基數(shù)的變化,事實上1980年人口基數(shù)并沒有發(fā)生變化,截距變化是由于斜率降低造成的,即圖3 中的LNYK3 曲線反向延伸于Y 軸的交點高于LNYK2 于Y 軸的交點。
2.通過上述模型結(jié)果可以看出,計劃生育政策效果顯著。實行計劃生育政策以來,我國人口對數(shù)的增加率下降了52.9954%,該項政策對我國的人口形勢起了關(guān)鍵作用,有效控制了我國人口的高速增長。
3.根據(jù)預(yù)測結(jié)果,發(fā)現(xiàn)非結(jié)構(gòu)預(yù)測結(jié)果明顯由于結(jié)構(gòu)預(yù)測結(jié)果,預(yù)測精度極高,體現(xiàn)了組合模型在預(yù)測方面的優(yōu)勢。此外,根據(jù)組合模型樣本外預(yù)測結(jié)果顯示,2014年我國人口總數(shù)將超過14億,2015年將達(dá)到14.26841 億,人口現(xiàn)狀依舊不容樂觀,因此各級政府必須長期堅持計劃生育政策,以確保我國社會、經(jīng)濟(jì)、資源、環(huán)境等各方面協(xié)調(diào)可持續(xù)發(fā)展。
[1]李樹拙,果 臻.中國人口動態(tài)、挑戰(zhàn)與國際影響[J].西安交通大學(xué)學(xué)報,2011,31(5):41-47.
[2]張曉峒.應(yīng)用數(shù)量經(jīng)濟(jì)學(xué)[M].北京:機械工業(yè)出版社,2009.
[3]易丹輝.數(shù)據(jù)分析與Eviews 應(yīng)用[M].北京:中國人民大學(xué)出版社,2008.
[4]王小合,李寒菁,黃仙紅,等.基于ARIMA 組合模型的不同經(jīng)濟(jì)類型區(qū)域衛(wèi)技人員預(yù)測研究[J].中國衛(wèi)生經(jīng)濟(jì),2010,29(12):49-53.
[5]陳 坤.基于組合模型方法的中國人口預(yù)測[J].中國商界,2010,(12):165-166.
[6]王 穎,黃 迪,趙娟瑩.多目標(biāo)決策視角下中國適度人口規(guī)模預(yù)測[J],人口學(xué)刊,2011(4).
[7]王桂新,陳冠春.中國人口變動與經(jīng)濟(jì)增長[J].人口學(xué)刊,2010(3).