王沛林
(北京理工大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,北京 100081)
在當(dāng)今科技經(jīng)濟(jì)飛速發(fā)展的社會(huì)中,人口問題一直是世界各個(gè)國(guó)家和各個(gè)領(lǐng)域所關(guān)注的焦點(diǎn)問題,它是一個(gè)社會(huì)發(fā)展的最基礎(chǔ)也是最關(guān)鍵的問題.為了維持社會(huì)生活的基本平衡與穩(wěn)定,把人口數(shù)量保持在一個(gè)比較理想化的狀態(tài),就要對(duì)國(guó)家和地區(qū)的人口總數(shù)進(jìn)行合理預(yù)測(cè),以便制定未來人口政策,使社會(huì)有序發(fā)展.在早期的研究中,進(jìn)行人口定量預(yù)測(cè)的基礎(chǔ)方法就是依據(jù)國(guó)家統(tǒng)計(jì)局的人口結(jié)構(gòu)和規(guī)模的資料和數(shù)據(jù),以當(dāng)前人口為出發(fā)點(diǎn),并且對(duì)未來人口的變化趨勢(shì)作出合乎常理的假設(shè),運(yùn)用科學(xué)的數(shù)學(xué)模型進(jìn)行擬合演算,進(jìn)而預(yù)測(cè)出未來人口總數(shù)、性別比例、結(jié)構(gòu)組成等一些重要人口要素.
社會(huì)的進(jìn)步需要人口穩(wěn)定可持續(xù)發(fā)展,基于中國(guó)人口數(shù)量現(xiàn)狀和上述已知方法,本文通過比較馬爾薩斯人口模型、多項(xiàng)式擬合模型、ARIMA模型和Logistic人口生長(zhǎng)模型的預(yù)測(cè)效果,著眼于未來人口總數(shù)的估計(jì)分析,關(guān)注人口發(fā)展的總體趨勢(shì),并將現(xiàn)有Logistic人口生長(zhǎng)模型從微分方程和模型參數(shù)擬合優(yōu)化角度進(jìn)行改進(jìn),得到了更加準(zhǔn)確的預(yù)測(cè)方程,以便更好地預(yù)測(cè)今后一段時(shí)間中國(guó)的總?cè)丝跀?shù),具有一定的預(yù)見性.
擬合數(shù)據(jù)的選取十分重要.經(jīng)過資料調(diào)查,我們知道從20世紀(jì)70年代,在全國(guó)范圍內(nèi)開始大力實(shí)施計(jì)劃生育政策[1],所以在預(yù)測(cè)全國(guó)總?cè)丝跁r(shí),我們選取1970年為基礎(chǔ)年份,1970年的總?cè)丝跀?shù)量為最初人數(shù).進(jìn)而考慮到數(shù)據(jù)選取的原則,數(shù)據(jù)選擇得越多,即樣本越多,能準(zhǔn)確預(yù)測(cè)擬合人口數(shù)量的可能性越大,結(jié)果就越精確,誤差就越小,所以選擇的年份不能少于25年,否則將很難發(fā)現(xiàn)人口數(shù)量變動(dòng)的趨勢(shì).再有,我國(guó)自2016年1月1日起,正式開始實(shí)行“全面二孩”政策[2],這項(xiàng)政策的實(shí)施在短期內(nèi)不會(huì)對(duì)我國(guó)總?cè)丝跀?shù)的變化趨勢(shì)產(chǎn)生較大的影響.因此,在本文中先不考慮近幾年二胎方針的影響.最后通過查閱中國(guó)國(guó)家統(tǒng)計(jì)局網(wǎng)站,獲得1970—2014年每年中國(guó)人口總數(shù),以這45年的數(shù)據(jù)作為擬合數(shù)據(jù),保證了一定的準(zhǔn)確性.
1)現(xiàn)有的基本國(guó)策“計(jì)劃生育”保持不變.
2)不考慮戰(zhàn)爭(zhēng)等不可預(yù)見因素.
3)由于環(huán)境等因素,人口不能無限制地增長(zhǎng).
1.3.1 模型的理論背景
人口學(xué)家馬爾薩斯在生物增長(zhǎng)定律中提到:人口的變化率與人口總數(shù)成正比[3],且這個(gè)比率不隨時(shí)間變化,為常量.由此,我們?cè)O(shè)定人口總數(shù)為p(t),人口變化率為l,若已經(jīng)知道在t0時(shí)刻的人口數(shù)量值p0,則就可以得到馬爾薩斯人口模型:
這就是非常著名的分析人口數(shù)量問題的基礎(chǔ)微分方程模型,通過求解方程,我們可以得到它的另外一種表達(dá)形式:
其中,t0表示最開始的時(shí)間(即初始年份),p0表示t0時(shí)刻的人口總數(shù),t表示一般意義上的時(shí)間,p(t)表示t時(shí)刻的人口總數(shù).
1.3.2 模型的建立與實(shí)現(xiàn)
將1970—2014年每一年的人口總數(shù)作為基礎(chǔ)數(shù)據(jù),代入模型中.為了進(jìn)行數(shù)據(jù)擬合,首先要考慮模型的求解實(shí)現(xiàn)問題.
參數(shù)估計(jì):l、p0可以用已知數(shù)據(jù),運(yùn)用線性最小二乘法進(jìn)行估計(jì).(2)式兩邊取對(duì)數(shù),得到:
作對(duì)數(shù)變換后,再以1970—2014年的人口數(shù)據(jù)擬合(3)式,經(jīng)計(jì)算得到:l=0.011 2,p0=88 521.43.
最后,得到馬爾薩斯人口模型:
其中t0=1970.
得到模型的表達(dá)式以后,我們進(jìn)而對(duì)2015—2019年的人口進(jìn)行預(yù)測(cè).
1.3.3 模型的誤差檢驗(yàn)分析
評(píng)價(jià)一個(gè)模型的好壞以及擬合效果,首先可以通過實(shí)際值和擬合值作出的圖像來直觀地對(duì)比分析.
如圖1所示,在馬爾薩斯人口模型預(yù)測(cè)圖中,這45年來實(shí)際人口和預(yù)測(cè)人口的總體增長(zhǎng)趨勢(shì)大體是一致的,但是到后期預(yù)測(cè)人口的增長(zhǎng)率要明顯大于實(shí)際人口的增長(zhǎng)率.
圖1 馬爾薩斯人口模型預(yù)測(cè)1970—2014年總?cè)丝?/p>
通過計(jì)算誤差來進(jìn)一步分析模型的優(yōu)劣.在統(tǒng)計(jì)學(xué)中,我們慣用yi來代表第i組數(shù)據(jù)的真實(shí)值,來代表第i組數(shù)據(jù)的預(yù)測(cè)值,用n來表示樣本數(shù)據(jù)的組數(shù),所以有誤差指標(biāo)為:相對(duì)誤差(RE),殘差平方和(resnorm):,標(biāo)準(zhǔn)誤差(RMSE):
相對(duì)誤差越小,模型可信度越高;殘差平方和越小,模型擬合效果越好;標(biāo)準(zhǔn)誤差越小,模型精密度越高;Rnew為非線性回歸方程的擬合優(yōu)度指標(biāo),其值越靠近1,模型擬合程度越高[4].
知悉這幾個(gè)誤差指標(biāo)后,用Matlab計(jì)算出由馬爾薩斯人口模型擬合的這45年數(shù)據(jù)的相對(duì)誤差最大值為0.066 6,殘差平方和為4.941 7,標(biāo)準(zhǔn)誤差為0.331 4,Rnew為0.971 3.
在物理學(xué)中,一般相對(duì)誤差不超過5%算是比較精確[5],但此模型最大相對(duì)誤差0.066 6要高于0.05,并且Rnew的值離1還有一定距離,由此看來馬爾薩斯人口模型的精確度不是很高.
1.3.4 模型的預(yù)測(cè)效果及總體評(píng)價(jià)
將前文利用馬爾薩斯人口模型預(yù)測(cè)出的2015—2019年中國(guó)總?cè)丝跀?shù)與國(guó)家統(tǒng)計(jì)局網(wǎng)站上的真實(shí)數(shù)據(jù)進(jìn)行對(duì)比,以此來判斷預(yù)測(cè)效果.
由表1可以計(jì)算出,這5年的相對(duì)誤差最大值為0.094 6,遠(yuǎn)大于0.05,誤差較大,預(yù)測(cè)效果并不是很理想.
表1 中國(guó)2015—2019年實(shí)際總?cè)丝跀?shù)與預(yù)測(cè)總?cè)丝跀?shù) 萬人
進(jìn)一步繪制2015—2030年的人口預(yù)測(cè)圖,從圖2中可以看出預(yù)測(cè)人口的年增長(zhǎng)率過高,人口數(shù)量呈幾何狀增長(zhǎng),不太符合實(shí)際.
圖2 馬爾薩斯人口模型預(yù)測(cè)2015—2030年總?cè)丝?/p>
從馬爾薩斯人口模型的擬合效果和預(yù)測(cè)結(jié)果來看,計(jì)算出來的誤差較大,模型并不是很精確,其預(yù)測(cè)的人口數(shù)量呈指數(shù)增長(zhǎng),增長(zhǎng)率過高,故該模型的現(xiàn)代利用價(jià)值有限.
1.4.1 模型的理論背景
從圖1中我們可以觀察出,人口數(shù)量的變化過程線上各點(diǎn)斜率都不太相同,這就表明各個(gè)階段的人口增長(zhǎng)速率是不一樣的,這時(shí)用單純的一條直線來描繪人口的發(fā)展顯然是不合適的,所以要用更貼近實(shí)際的曲線來擬合人口數(shù)量的變動(dòng),這就產(chǎn)生了多項(xiàng)式擬合模型.
1.4.2 模型的建立與實(shí)現(xiàn)
為了保證多項(xiàng)式擬合模型的合理性和準(zhǔn)確性,并且兼顧誤差最小的原則,還要使模型具有可解釋性,故本文選取了三次多項(xiàng)式對(duì)1970—2014年的總?cè)丝跀?shù)據(jù)進(jìn)行擬合.
將時(shí)間t作為解釋變量,中國(guó)總?cè)丝跀?shù)量p(t)作為預(yù)測(cè)變量,建立多項(xiàng)式確定它們之間的關(guān)系.得出如下結(jié)果:
1.4.3 模型的誤差檢驗(yàn)分析
通過圖3擬合圖像可以看出,在1970—2014年中,擬合的曲線很貼近實(shí)際的數(shù)據(jù),三次多項(xiàng)式擬合模型的短期預(yù)測(cè)效果很好,沒有太大的誤差.
圖3 三次多項(xiàng)式擬合模型預(yù)測(cè)1970—2014年總?cè)丝?/p>
三次多項(xiàng)式的相對(duì)誤差最大值為0.0133,殘差平方和為0.122 3,標(biāo)準(zhǔn)誤差為0.052 1,Rnew為0.995 5.由誤差可以看出,多項(xiàng)式擬合模型的精確度較馬爾薩斯人口模型有很大程度的提高.
1.4.4 模型的預(yù)測(cè)效果及總體評(píng)價(jià)
利用三次多項(xiàng)式擬合模型的表達(dá)式,預(yù)測(cè)出2015—2019年中國(guó)人口總數(shù)分別為136 090萬人、136 194萬人、136 218萬人、136 161萬人、136 021萬人,將這5年來的預(yù)測(cè)人口同實(shí)際人口相比較,我們得出最大的相對(duì)誤差值為0.028 5,沒有超過0.05,且要遠(yuǎn)低于馬爾薩斯人口模型的誤差值,預(yù)測(cè)效果比較好.
從三次多項(xiàng)式擬合模型的曲線貼合效果和部分預(yù)測(cè)結(jié)果來看,各種誤差都比較小,模型比較合理,但是2015—2019年預(yù)測(cè)出來的人口數(shù)量總體呈現(xiàn)先增長(zhǎng)后下降的趨勢(shì),人口數(shù)量下降在我國(guó)現(xiàn)階段幾乎是不可能的,所以筆者認(rèn)為多項(xiàng)式擬合模型只適合短時(shí)段1~3年內(nèi)的人口預(yù)測(cè),長(zhǎng)期預(yù)測(cè)則會(huì)出現(xiàn)大的偏差,效果不會(huì)很好.
1.5.1 模型的理論背景
由前面的多項(xiàng)式擬合模型可以看出,人口數(shù)量是隨著時(shí)間不斷變化的.但是人口與時(shí)間的關(guān)系又不能簡(jiǎn)單地用多項(xiàng)式來準(zhǔn)確的描述,為了尋找更合理的人口預(yù)測(cè)模型,我們想到了經(jīng)濟(jì)學(xué)中的ARIMA模型.
預(yù)測(cè)一種事物的變化時(shí),用它的過去推斷它的未來,即用時(shí)間序列的往日數(shù)據(jù)表示事物隨時(shí)間變化的種種規(guī)律,并將兩者之間的模式應(yīng)用到未來,進(jìn)而對(duì)未來的數(shù)據(jù)作出預(yù)測(cè).ARIMA模型就是一種常用的時(shí)間序列模型.
ARIMA(p,d,q)模型含有 3個(gè)參數(shù),這里面 p表示自回歸(AR)階數(shù),q表示移動(dòng)平均(MA)階數(shù),d 表示模型的差分階數(shù)[6].該模型有 3 種基本類別[7]:AR(p)模型、MA(q)模型、ARIMA(p,d,q)模型.
1.5.2 模型的建立與實(shí)現(xiàn)
利用1970—2014年的中國(guó)總?cè)丝跀?shù)據(jù),建立ARIMA(p,d,q)模型.模型的建立步驟如下:
1)載入數(shù)據(jù),進(jìn)行一次單位根檢驗(yàn),判定數(shù)據(jù)序列的平穩(wěn)性.本文得到p值為0.99,大于檢驗(yàn)的臨界值0.05,所以該序列不平穩(wěn).
2)對(duì)不平穩(wěn)序列進(jìn)行差分處理,差分的次數(shù)為d,使其成為平穩(wěn)序列.經(jīng)過了三次差分操作后,一次單位根檢驗(yàn)的p值小于了0.05,序列化為平穩(wěn)序列,進(jìn)而確定d=3.
3)對(duì)已經(jīng)平穩(wěn)的序列進(jìn)行白噪聲檢驗(yàn),判斷其是否為純粹的隨機(jī)序列,由于對(duì)白噪聲進(jìn)行下一步的處理和預(yù)測(cè)沒有任何價(jià)值,故使用Ljung-Box方法[8]進(jìn)行檢測(cè).p值為0.008 808,小于標(biāo)準(zhǔn)值0.05[8],所以三次差分后的平穩(wěn)序列不是隨機(jī)序列,可以展開下一步工作.
4)確定模型的階數(shù).畫出序列的自相關(guān)圖(ACF)和偏自相關(guān)圖(PACF),見圖4.據(jù)觀察可以發(fā)現(xiàn)ACF 1階截尾,PACF具有拖尾性.綜上,初定模型為ARIMA(0,3,1).接下來用R語言軟件中的自動(dòng)定階功能(auto.arima)來對(duì)上面的定階結(jié)果進(jìn)行準(zhǔn)確性檢驗(yàn),結(jié)果也顯示為ARIMA(0,3,1)模型.
圖4 自相關(guān)圖與偏自相關(guān)圖
5)確定模型的系數(shù).得出該模型為xt=εt+0.769εt-1.
6)模型的顯著性檢驗(yàn).使用Ljung-Box方法[8]檢驗(yàn)殘差:p 值為 0.287 8,大于 0.05,說明殘差是隨機(jī)序列,白噪聲檢驗(yàn)通過.參數(shù)的顯著性檢驗(yàn):用R軟件測(cè)出的系數(shù)-0.769 0除
以它的標(biāo)準(zhǔn)誤差0.122 7,商的絕對(duì)值為1.96,大于T檢驗(yàn)統(tǒng)計(jì)量在5%水平的臨界值,斷定系數(shù)顯著不等于零[9],檢驗(yàn)通過.
7)用 ARIMA(0,3,1)模型預(yù)測(cè) 2015—2019年的中國(guó)人口總數(shù).
1.5.3 模型的誤差檢驗(yàn)分析
從圖5可以看出,ARIMA模型作出的預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)比較吻合,相差不大,效果良好.
圖5 ARIMA模型預(yù)測(cè)1970—2014年總?cè)丝?/p>
相對(duì)誤差最大值為0.003 3,殘差平方和為0.006 3,標(biāo)準(zhǔn)誤差為0.011 8,Rnew為0.999 0.從誤差值來看,模型的擬合水平非常高,較前面2種模型而言,有著更高的可信度.
1.5.4 模型的預(yù)測(cè)效果及總體評(píng)價(jià)
利用ARIMA模型預(yù)測(cè)2015—2019年的中國(guó)人口總數(shù),將預(yù)測(cè)值與實(shí)際值作比較,得出相對(duì)誤差的最大值為0.002 8,遠(yuǎn)小于前2種模型的誤差值,預(yù)測(cè)效果有了質(zhì)的飛躍.
進(jìn)而利用此模型預(yù)測(cè)出了2015—2030年中國(guó)的總?cè)丝跀?shù),并繪成圖6.看出未來10年我國(guó)人口將呈緩慢增長(zhǎng)態(tài)勢(shì),到2030年不會(huì)破15億大關(guān).
圖6 ARIMA模型預(yù)測(cè)2015—2030年總?cè)丝?/p>
根據(jù)綜上各種論證來看,ARIMA模型的預(yù)測(cè)效果遠(yuǎn)優(yōu)于前2種模型,給出了較為合理的人口隨時(shí)間變化的趨勢(shì),精確度比較高,有較大的參考價(jià)值.
1.6.1 模型的理論背景
在前面討論過的馬爾薩斯人口模型中有致命的缺點(diǎn)——人口變化率l為常量.它只假設(shè)出了人類發(fā)展最理想的情況,并得出人口數(shù)量將呈指數(shù)上漲的極端結(jié)論.認(rèn)識(shí)到馬爾薩斯人口模型的不足之后,有學(xué)者在其基礎(chǔ)上進(jìn)行了改進(jìn),形成了Logistic人口生長(zhǎng)模型.模型的中心觀點(diǎn)為:人口數(shù)量并不能無窮盡地上漲,它會(huì)受到各種因素的約束,且隨著人口的不斷增加,這種約束力會(huì)不斷變強(qiáng),最終人數(shù)會(huì)到達(dá)一個(gè)極值.
1.6.2 模型的建立與實(shí)現(xiàn)
從上述的理論基礎(chǔ)中可知,如果想獲取方程(10)的解,就要估計(jì)出pm和l這2個(gè)參數(shù)的值,求解方法有2種.
1.6.2.1 三點(diǎn)等間距法
利用昔日的人口數(shù)據(jù),粗略計(jì)算出l和pm的值.再采用t0、t1、t2這3個(gè)年份的人口總數(shù)量p0、p1、p2,且滿足條件t2-t1=t1-t0=a,代入方程式(10)進(jìn)行計(jì)算,可得出:
取1970年作為開端年份t0,取1992年為中間年份t1,取2014年為最末年份t2,此時(shí)a=22,將相應(yīng)數(shù)值代入公式(11),獲取l和pm的具體值;將計(jì)算出的2個(gè)參數(shù)值代入方程(10)中,得到模型,模擬圖見圖7.
圖7 Logistic模型三點(diǎn)等間距法預(yù)測(cè)1970—2014年總?cè)丝?/p>
1.6.2.2 lsqcurvefit最小二乘法
在Matlab軟件中有一個(gè)lsqcurvefit命令,依據(jù)最小二乘原理即使模擬數(shù)據(jù)和實(shí)際數(shù)據(jù)之間的殘差平方和最小,也可擬合出最優(yōu)化的非線性曲線.
選取 t0=1970,p0=82 992代入式(10),然后將式(10)作為未知的需要擬合的非線性曲線,l和pm為要求解的參數(shù).給出兩參數(shù)的初值解,1970—2014年的總?cè)丝跒閷?shí)際數(shù)據(jù),用lsqcurvefit函數(shù)進(jìn)行擬合,pm為153 147 萬人,l為 0.045 4,有模型,最后畫出對(duì)比圖,見圖8.
圖8 Logistic模型最小二乘法預(yù)測(cè)1970—2014年總?cè)丝?/p>
1.6.3 模型的誤差檢驗(yàn)分析
從圖7、圖8中可以剖析出,三點(diǎn)等間距法和最小二乘法的模擬結(jié)果都不錯(cuò).
三點(diǎn)等間距法:相對(duì)誤差最大值為0.018 2,殘差平方和為0.305 0,標(biāo)準(zhǔn)誤差為0.082 3,Rnew為0.992 9.最小二乘法:相對(duì)誤差最大值為0.013 5,殘差平方和為0.247 7,標(biāo)準(zhǔn)誤差為 0.074 2,Rnew為 0.993 6.很明顯,最小二乘法還是要略優(yōu)于三點(diǎn)等間距法,這可能是因?yàn)閘sqcurvefit函數(shù)能夠找到全局最優(yōu)解,而三點(diǎn)等間距法只是拿出3年的數(shù)據(jù)來求解方程(10),有局限性.
1.6.4 模型的預(yù)測(cè)效果及總體評(píng)價(jià)
綜上,我們選用最優(yōu)的lsqcurvefit最小二乘法預(yù)測(cè)出了2015—2019年的總?cè)丝跀?shù),與實(shí)際人口比,最大相對(duì)誤差值為0.003 9.進(jìn)而本研究用Logistic人口生長(zhǎng)模型預(yù)測(cè)出了2015—2030年的總?cè)丝冢妶D9.
圖9 Logistic人口生長(zhǎng)模型預(yù)測(cè)2015—2030年總?cè)丝?/p>
從圖9可以發(fā)現(xiàn),在未來10年我國(guó)人口增長(zhǎng)有逐漸放緩的趨勢(shì),總體較平穩(wěn).
總體來說,Logistic人口生長(zhǎng)模型比馬爾薩斯人口模型考慮的影響人口變動(dòng)的因素更多更充分,預(yù)測(cè)結(jié)果也更加確切、合理.但是,從誤差的角度來看,該模型還不如ARIMA模型精確,有改進(jìn)優(yōu)化的空間.
通過表2我們清楚地認(rèn)識(shí)到,無論是從誤差最小化角度,還是從模型的擬合效果和預(yù)測(cè)結(jié)果方面,Logistic人口生長(zhǎng)模型和ARIMA模型都要優(yōu)于其他兩種模型,并且ARIMA模型的精確性還要比Logistic人口生長(zhǎng)模型突出,但是ARIMA模型的局限性在于它只適合短時(shí)間內(nèi)的預(yù)測(cè)[11],而Logistic人口生長(zhǎng)模型作為中長(zhǎng)期人口預(yù)測(cè)的一種典型方法,它的精確度還有待提高.為了更好地進(jìn)行人口中長(zhǎng)期預(yù)測(cè),下文將探討Logistic人口生長(zhǎng)模型的改良方法.
表2 4種預(yù)測(cè)模型的比較分析
通過分析看出,Logistic人口生長(zhǎng)模型在預(yù)測(cè)人口時(shí),其自身的合理性和精確度還有進(jìn)一步提升的空間,為此我們從2種不同角度探索對(duì)此模型修正的方法.
3.1.1 改進(jìn)的方法依據(jù)
從我國(guó)的當(dāng)前人口形勢(shì)出發(fā),由于計(jì)劃生育政策已實(shí)行了多年,我國(guó)過去人口猛烈增長(zhǎng)的勢(shì)頭已經(jīng)得到了很好的控制,久而久之又出現(xiàn)了生育率低、人口老齡化的現(xiàn)象.如今我國(guó)的人口增長(zhǎng)率已經(jīng)非常低,如方程(7)的假設(shè)——人口變化率l和人口總數(shù)p(t)是最簡(jiǎn)單的線性關(guān)系,已經(jīng)不再適用于當(dāng)下.現(xiàn)在我們從l與p(t)的關(guān)系入手,對(duì)l(p)函數(shù)式進(jìn)行改進(jìn).
作出假設(shè):人口上漲已經(jīng)快到了負(fù)荷的程度,上漲率慢慢變小最終將趨向零.
根據(jù)假設(shè),l(p)理應(yīng)表達(dá)為e-p的函數(shù),設(shè):
其中l(wèi)(p0)是初始年份為t0、總?cè)藬?shù)為p0時(shí)的人口增長(zhǎng)率,b、k為待求系數(shù).
于是,修正以后的模型為:
3.1.2 模型的建立與實(shí)現(xiàn)
依舊使用1970—2014年的中國(guó)人口總數(shù)作為研究數(shù)據(jù),這樣上下文形成對(duì)照,方便比較擬合效果.先來求解方程(12)中的參數(shù)值b、k.
首先,對(duì)方程(12)的兩邊作對(duì)數(shù)變換得到:
最后,得到從方程角度進(jìn)行修改后的模型:
其中起始年份t0為1970年.求出了方程(15)的數(shù)值解,并繪制擬合圖像,見圖10.
圖10 方程角度改進(jìn)的Logistic人口生長(zhǎng)模型預(yù)測(cè)1970—2014年總?cè)丝?/p>
3.1.3 模型的誤差檢驗(yàn)分析
根據(jù)圖10可看出,從方程角度改進(jìn)后的模型繪制的擬合曲線與現(xiàn)實(shí)中的數(shù)據(jù)比較貼近,在開始的5~6年和末尾的5~6年預(yù)測(cè)效果尤其好,在中間年份或多或少出現(xiàn)了偏差.依據(jù)程序運(yùn)行結(jié)果,相對(duì)誤差最大值是0.026 3,殘差平方和是0.796 3,標(biāo)準(zhǔn)誤差是0.134 5,Rnew是0.988 4.從誤差值的大小來看,此方法修正后的Logistic人口生長(zhǎng)模型并沒有較大改善.
3.1.4 模型的預(yù)測(cè)效果及總體評(píng)價(jià)
與前文一樣,我們用改良的模型預(yù)測(cè)出了2015—2019年的中國(guó)人口總數(shù),與實(shí)際人口比較,這5年的最大相對(duì)誤差值為0.004 0,這與沒有修正之前的最大相對(duì)誤差值0.003 9差距非常小,幾乎沒有改善.之后,用改進(jìn)后的模型預(yù)測(cè)了2015—2030年的中國(guó)總?cè)丝?,見圖11.
圖11 方程角度改進(jìn)的Logistic人口生長(zhǎng)模型預(yù)測(cè)2015—2030年總?cè)丝?/p>
將圖11與圖9對(duì)比發(fā)現(xiàn),改進(jìn)前預(yù)測(cè)2015—2030年的中國(guó)總?cè)丝诖蠹s是從13.8億上漲到14.5億,改進(jìn)后預(yù)測(cè)這16年的人口數(shù)大約是從13.8億上漲到14.7億多,首尾年都相差不大,說明我國(guó)未來人口的變化有很大可能按照這種趨勢(shì)發(fā)展,并在2030年達(dá)到14.6億左右的人口數(shù).
無論是從誤差指標(biāo)的角度來看,還是從預(yù)測(cè)效果來看,修正了主方程的Logistic人口生長(zhǎng)模型并沒有很大程度上提高模型的效率和精確性,與沒修改之前的預(yù)測(cè)大致相同,借鑒意義有限.
3.2.1 改進(jìn)的方法依據(jù)
本文又從另一個(gè)角度——使參數(shù)值更加精確化,來對(duì)模型的修正問題進(jìn)行探究.
在Logistic人口生長(zhǎng)模型中,存在關(guān)系函數(shù)l(p)=l-sp,l>0,s>0,此式中含有2個(gè)待求參數(shù)l和s.我們知道,這2個(gè)參數(shù)主要是通過專家預(yù)估[10]或者統(tǒng)計(jì)得來,而沒有從函數(shù)式本身入手去求其值.所以,修正模型中l(wèi)(p)的決定方式,根據(jù)1970—2014年逐年的總?cè)丝谠鲩L(zhǎng)率與每年人口總數(shù)的關(guān)系,運(yùn)用最小二乘線性擬合的方法來明確參數(shù)l、s的切實(shí)值,即通過真實(shí)數(shù)據(jù)的模擬仿真來確定參數(shù)值,而不是無端的估計(jì)統(tǒng)計(jì),這樣預(yù)測(cè)水平可能會(huì)有所提高.
3.2.2 模型的建立與實(shí)現(xiàn)
應(yīng)用國(guó)家統(tǒng)計(jì)局的數(shù)據(jù)計(jì)算出1970—2014年中國(guó)總?cè)丝诘闹鹉曜兓?,并制成散點(diǎn)圖.
由圖12可以觀察出,總?cè)丝诘脑鲩L(zhǎng)率自1987年開始,幾乎呈直線型下降,因此可以采用直線擬合的方式來得出函數(shù)l(p)=l-sp,l>0,s>0的具體表達(dá)式.
圖12 1970—2014年中國(guó)總?cè)丝诘脑鲩L(zhǎng)率變化
于是,1987—2014年逐年的總?cè)丝谠鲩L(zhǎng)率作為l(p),1987—2014年每年的總?cè)丝跀?shù)為p,運(yùn)用線性最小二乘法來擬合它們之間的關(guān)系式l(p)=l-sp,最終得到具體表達(dá)式為:
將1987年當(dāng)作初始年份t0,1987年所對(duì)應(yīng)的總?cè)丝跀?shù)為p0,2個(gè)數(shù)值與式(16)一起代入方程(6),得到方程:
而后再求解微分方程(17)得到了預(yù)測(cè)總?cè)丝跀?shù)p(t)的解析式:
實(shí)際總?cè)丝谂c預(yù)測(cè)總?cè)丝谙啾容^,見圖13.
圖13 參數(shù)角度改進(jìn)的Logistic人口生長(zhǎng)模型預(yù)測(cè)1987—2014年總?cè)丝?/p>
3.2.3 模型的誤差檢驗(yàn)分析
查看擬合圖13,我們發(fā)現(xiàn)改進(jìn)后的模型作出的預(yù)測(cè)數(shù)據(jù)與真實(shí)數(shù)據(jù)很接近,總體的增長(zhǎng)趨勢(shì)也相當(dāng)一致.
通過計(jì)算,得到了該模型下相對(duì)誤差最大值是0.006 9,殘差平方和是0.086 0,標(biāo)準(zhǔn)誤差是 0.055 4,Rnew是 0.995 6.改進(jìn)后模型計(jì)算出的誤差指標(biāo)值要比原模型計(jì)算出的誤差值小得多,擬合優(yōu)度Rnew也更加接近1,結(jié)果良好.
3.2.4 模型的預(yù)測(cè)效果及總體評(píng)價(jià)
同樣,我們用改良后的模型預(yù)測(cè)出了2015—2019年的中國(guó)總?cè)丝跀?shù),分別為137 480萬人、137 901萬人、138 298萬人、138 671萬人、139 023萬人,預(yù)測(cè)值與實(shí)際2015—2019年總?cè)丝跀?shù)的最大相對(duì)誤差值是0.007 0,與之前未改進(jìn)時(shí)的預(yù)測(cè)效果相近.接著我們又預(yù)測(cè)了2015—2030年的中國(guó)總?cè)丝跀?shù),見圖14.
圖14 參數(shù)角度改進(jìn)的Logistic人口生長(zhǎng)模型預(yù)測(cè)2015—2030年總?cè)丝?/p>
可以看出,按此種模型進(jìn)行推測(cè),我國(guó)的人口增長(zhǎng)率減小的趨勢(shì)將加快,人口增長(zhǎng)將放慢.
利用真實(shí)數(shù)據(jù)對(duì)未知函數(shù)進(jìn)行模擬仿真,進(jìn)而求解出更加有實(shí)際意義的參數(shù)值,這種改進(jìn)方法經(jīng)過實(shí)踐證明具有不錯(cuò)的效果,使模型的擬合優(yōu)度有了較大提高,從誤差值來看也比原始模型更具有說服力,精確性大幅度提高.
無論是從模型存在的偏差還是從模型的擬合優(yōu)度指標(biāo)來看,從參數(shù)角度進(jìn)行的模擬仿真改進(jìn)遠(yuǎn)遠(yuǎn)要比從方程入手對(duì)模型的改進(jìn)效果理想得多.改進(jìn)后的模型,參數(shù)值被賦予了更加具體的內(nèi)涵而且也精確了許多,同時(shí),與原有的Logistic人口生長(zhǎng)模型相比,從參數(shù)角度改進(jìn)后的模型精確度提高了,預(yù)測(cè)水平也升高了.
本文通過比較馬爾薩斯人口模型、多項(xiàng)式擬合模型、ARIMA模型、Logistic人口生長(zhǎng)模型這4種人口預(yù)測(cè)方法的優(yōu)劣,認(rèn)為ARIMA模型和Logistic人口生長(zhǎng)模型的預(yù)測(cè)效果比較理想,并用比較合理的Logistic人口生長(zhǎng)模型對(duì)未來的人口進(jìn)行了預(yù)測(cè),進(jìn)一步針對(duì)Logistic人口生長(zhǎng)模型存在的不足提出了2種改進(jìn)辦法,使模型的精確度進(jìn)一步提高.最后預(yù)測(cè),到2030年,我國(guó)的總?cè)丝趯⒃?4.2億~14.6億波動(dòng).