趙憲民
(萊蕪職業(yè)技術(shù)學(xué)院機(jī)電工程系,山東 萊蕪 271100)
時(shí)間序列是按照時(shí)間順序取得的一系列觀察值,時(shí)間序列數(shù)據(jù)的本質(zhì)特征就是相鄰觀察值之間的依賴性。所以在對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行分析時(shí),一般的回歸模型難以體現(xiàn)變量自身前后及應(yīng)變量與自變量過(guò)去的依賴關(guān)系。ARIMA模型是對(duì)變量自身前后依賴性進(jìn)行分析的技術(shù),它描述了變量自身當(dāng)前與過(guò)去的統(tǒng)計(jì)依賴關(guān)系,在顯示變量的動(dòng)態(tài)系統(tǒng)(dynamical system)演變規(guī)律方面有著較為豐富的結(jié)構(gòu)。但是由于ARIMA模型沒(méi)有考慮其它變量對(duì)應(yīng)變量的作用,所以也無(wú)法表達(dá)系統(tǒng)中變量間相互影響的關(guān)系。傳遞函數(shù)模型可在一定程度上彌補(bǔ)這兩種模型的欠缺,并且模型構(gòu)造靈活,可以用較少的參數(shù)建立階數(shù)較高的模型。
國(guó)內(nèi)外諸多學(xué)者對(duì)人口問(wèn)題進(jìn)行了廣泛的研究,常見(jiàn)的有依據(jù)社會(huì)人口結(jié)構(gòu)的Keyfitz矩陣方程模型、Lesilie矩陣方程模型、人口發(fā)展方程和指數(shù)方程模型及Logistic模型等[1-3]。對(duì)于時(shí)間序列模型,陳愛(ài)蓮、安和平[4]、趙進(jìn)文[5]、張慧芳[6]等用不同的方法對(duì)中國(guó)人口總量進(jìn)行了探討,都得到了較好的預(yù)測(cè)效果。
對(duì)于有關(guān)經(jīng)濟(jì)增長(zhǎng)、經(jīng)濟(jì)發(fā)展與人口增長(zhǎng)的關(guān)系問(wèn)題,國(guó)內(nèi)外學(xué)者進(jìn)行了大量的實(shí)證研究,大都采用簡(jiǎn)單相關(guān)與回歸分析方法來(lái)揭示其存在的關(guān)系。趙文進(jìn)[5]、王謙[6]、郭震威[7]都指出雖然經(jīng)濟(jì)增長(zhǎng)(GDP)與人口增長(zhǎng)之間存在著很強(qiáng)的相關(guān)性,但并不是簡(jiǎn)單的線性關(guān)系,并不能采用簡(jiǎn)單的線性回歸模型來(lái)揭示經(jīng)濟(jì)增長(zhǎng)與人口之間的相互影響。并與眾多文獻(xiàn)一樣,認(rèn)為目前我們還很難計(jì)算經(jīng)濟(jì)增長(zhǎng)與人口的數(shù)量關(guān)系?;诖?,我們不妨考慮將經(jīng)濟(jì)增長(zhǎng)量作為外生變量添加到人口時(shí)間序列模型中。本文就以萊蕪市人口總量和GDP總量為例,建立含有外生變量的人口時(shí)間序列預(yù)測(cè)模型,并對(duì)模型的精確度進(jìn)行檢驗(yàn),及對(duì)萊蕪市未來(lái)幾年人口進(jìn)行預(yù)測(cè)。
1970年Box和Jenkins提出ARIMA (autoregressive integrated moving average)模型,也稱為Box-Jenkins法[8]。該模型適用于非平穩(wěn)時(shí)間序列,應(yīng)用中需要通過(guò)若干次差分將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,再對(duì)此平穩(wěn)時(shí)間序列進(jìn)行定階和參數(shù)估計(jì),得到(p,q)的值,然后就可以應(yīng)用ARIMA(p,d,q)模型,其中p為模型的自回歸項(xiàng)數(shù),q為模型的滑動(dòng)平均項(xiàng)數(shù),d為時(shí)間序列成為平穩(wěn)之前必須做差分的次數(shù)。本質(zhì)上來(lái)說(shuō)ARIMA模型是將時(shí)間序列平穩(wěn)化后由ARMA模型來(lái)處理是一相同過(guò)程。
從定義上來(lái)說(shuō)即是:一個(gè)非平穩(wěn)時(shí)間序列Yi,通過(guò) ▽Yt=Y(jié)t-Yt-1,▽2Yt= ▽(▽Yt)= ▽(Yt-Yt-1),……等依次差分成平穩(wěn)時(shí)間序列Wt,使得Wt滿足ARMA(p,q)模型:
且φ(B)=0與θ(B)=0所有根的模大于1;φ1,φ2,…,φp為自回歸參數(shù);θ1,θ2,…θq為滑動(dòng)平均參數(shù);隨機(jī)項(xiàng)et為服從0均值、方差為σ2e且互相獨(dú)立的白噪聲序列;則稱Wt為綜合自回歸移動(dòng)平均序列,即ARIMA(p,d,q),所以ARIMA模型的一般形式為:
萊蕪市1990年至2011年的人口總量和GDP總量數(shù)據(jù)來(lái)自于萊蕪市統(tǒng)計(jì)年鑒[9]。記萊蕪市人口總量序列為{Yt},GDP總量序列為{Xt},如圖1和圖2所示。從圖1和圖2中可以看出,兩序列都具有明顯的增長(zhǎng)趨勢(shì),它是非平穩(wěn)的,需要對(duì)其進(jìn)行平穩(wěn)化處理。
圖1 1990—2011年萊蕪市人口總量
圖2 1990—2011年萊蕪市GDP總量
根據(jù)1987—2009年數(shù)據(jù)自身特點(diǎn)及建模的需要,通過(guò)對(duì)萊蕪市人口總量序列進(jìn)行二次差分,對(duì)萊蕪市GDP總量序列進(jìn)行對(duì)數(shù)變換后二次差分得到平穩(wěn)時(shí)間序列,即
其中▽是差分算子,Yt表示第t年萊蕪市的人口總量;Xt表示第t年萊蕪市的GDP總量。變換數(shù)據(jù)如圖3和圖4所示。
圖3 萊蕪市人口總量平穩(wěn)化處理序列圖
圖4 萊蕪市GDP總量平穩(wěn)化處理序列圖
傳遞函數(shù)模型為:
其中,ω(B)=α1B+α2B+…+αsB,δ(B)=β1B+β2B+…+βrB,Nt是噪聲序列,可用ARMA模型描述為:Nt=φ(B)-1θ(B)et,式中,φ(B)、θ(B)是B的多項(xiàng)式,et是白噪聲序列。
如果數(shù)據(jù)序列是非平穩(wěn)的,如存在一定的增長(zhǎng)或下降趨勢(shì)等,則需對(duì)數(shù)據(jù)進(jìn)行差分或滑動(dòng)平均法處理,使得數(shù)據(jù)平穩(wěn)。一般采用ADF(augment Dickey-Fuller test)檢驗(yàn)定量檢驗(yàn)變換序列的平穩(wěn)性,即先擬合序列的適應(yīng)模型,然后求由該模型的參數(shù)組成的特征方程的特征根。
表1 萊蕪市人口總量平穩(wěn)化ADF檢驗(yàn)結(jié)果
表2 萊蕪市GDP總量平穩(wěn)化ADF檢驗(yàn)結(jié)果
由表1可知,對(duì)萊蕪市人口總量平穩(wěn)化后ADF檢驗(yàn)統(tǒng)計(jì)量為-13.312 94,小于給出的1%~10%的臨界值,所以拒絕原假設(shè),說(shuō)明序列不存在單位根,即該序列是平穩(wěn)的。同理,萊蕪市GDP總量平穩(wěn)化后ADF檢驗(yàn)統(tǒng)計(jì)量為-6.445 136,介于1%~5%水平之間,在給定的α=0.05顯著性水平下,依然拒絕原假設(shè),認(rèn)為該序列是平穩(wěn)的,可以建模使用。
對(duì)模型階數(shù)的確定采用AIC和BIC準(zhǔn)則進(jìn)行定階。AIC和BIC準(zhǔn)則定義為
其中,是模型中噪聲項(xiàng)方差的最小二乘估計(jì),N為樣本容量。若
則確定 ARMA 模型階數(shù)為 (p0,q0)[8]。
在AIC和BIC準(zhǔn)則下,運(yùn)用Eviews軟件求得在所有p,q組合情況下對(duì)應(yīng)的AIC和BIC值,通過(guò)比較得出,當(dāng)萊蕪市人口總量的滯后階數(shù)p=2,q=1時(shí),AICmin=0.4681,BICmin=0.6165。故初步判定萊蕪市人口總量滯后階數(shù)p=2,q=1。同理初步確定萊蕪市GDP總量滯后階數(shù)p=1。
由以上分析初步建立模型為:
將▽2Yt記為Wt,▽2lnXt記為Vt則上式可簡(jiǎn)寫為
根據(jù)建立的模型,運(yùn)用EViews軟件對(duì)參數(shù)進(jìn)行估計(jì),具體結(jié)果見(jiàn)表3。
由表3最后一列中的p值可知,在顯著性水平α=0.05下,各變量的系數(shù)均是顯著的。因此建立的含外生變量時(shí)間序列模型為
將式 (1)還原為實(shí)際人口總量數(shù)據(jù)和GDP總量數(shù)據(jù)模型為:
根據(jù)建立以上建立的含有外生變量的時(shí)間序列模型[11],對(duì)萊蕪市2002-2011年總?cè)丝跀M合,計(jì)算結(jié)果見(jiàn)表4。
表4 基于ARIMA (2,2,1)模型對(duì)萊蕪市2002-2011年人口總量擬合
從表4中可以看出模型擬合的相對(duì)誤差在0.7%以下,擬合效果較為理想。
由于GDP作為外生變量,若要對(duì)未來(lái)人口總量進(jìn)行預(yù)測(cè),需要知道未來(lái)幾年的GDP總量。在此,根據(jù)已平穩(wěn)化的GDP序列數(shù)據(jù),采用時(shí)間序列模型對(duì)未來(lái)GDP總量進(jìn)行預(yù)測(cè)。表5給出了利用所建立含外生變量的時(shí)間序列模型預(yù)測(cè)[12]萊蕪市2010-2016年人口總量及其增長(zhǎng)速度的計(jì)算結(jié)果。此外,算得萊蕪市 “十二五”期間 (2011—2015年)人口總量的平均增長(zhǎng)速度約為0.4萬(wàn)人。
表5 萊蕪市2010-2016年人口總量及其增長(zhǎng)速度
本文針對(duì)萊蕪市地方人口總量的發(fā)展趨勢(shì),結(jié)合其與GDP總量的關(guān)系建立了含有外生變量的時(shí)間序列模型,擬合相對(duì)誤差普遍在0.7%以下。表明人口總量與GDP總量之間有直接的依存關(guān)系,一定程度上揭示了人口增長(zhǎng)與經(jīng)濟(jì)增長(zhǎng)的關(guān)系。因此建立以GDP總量為外生變量的人口總量時(shí)間序列預(yù)測(cè)模型是合理的。
根據(jù)凈增人口序列{Yt-Yt-1}可知,萊蕪市總?cè)丝谠?990-2001年平均每年增量在1.1萬(wàn)左右,2002年以后人口增量有所下降,平均在0.4萬(wàn)人左右。萊蕪市 “十二五”期間人口總量年凈增人口和環(huán)比增長(zhǎng)速度分別穩(wěn)定在0.4萬(wàn)人和0.3%左右,人口總規(guī)模將近130萬(wàn)。結(jié)果反映出黨和國(guó)家的計(jì)劃生育政策和促進(jìn)中部崛起計(jì)劃在萊蕪市得到了貫徹落實(shí)。
[1]宋健,田雪原,于景元,等.人口預(yù)測(cè)和人口控制[M].北京:人民出版社,1982:30-50.
[2]李永勝.人口統(tǒng)計(jì)學(xué)[M].成都:西南財(cái)經(jīng)大學(xué)出版社,2001:7-34.
[3]王彥,馬伯強(qiáng).20世紀(jì)80年代以來(lái)我國(guó)人口發(fā)展的數(shù)學(xué)模型與展望[J].北京大學(xué)學(xué)報(bào):自然科學(xué)版(增刊),2003,39(12):28-33.
[4]陳愛(ài)蓮,安和平.中國(guó)人口時(shí)間序列預(yù)測(cè)模型的探討[J].人口與經(jīng)濟(jì),2004,(06):65-69.
[5]趙進(jìn)文.中國(guó)人口總量與GDP總量關(guān)系模型研究[J].中國(guó)人口科學(xué),2003,(03):25-31.
[6]張慧芳,張德生,武新乾,等.我國(guó)人口總量的非參數(shù)預(yù)測(cè)模型[J].延邊大學(xué)學(xué)報(bào):自然科學(xué)版,2007,33(02):90-93.
[7]王謙,郭震威.人口增長(zhǎng)對(duì)經(jīng)濟(jì)增長(zhǎng)的影響分析——與胡鞍鋼博士商榷[J].人口研究,2000,25(01):20-23.
[8]王振龍.時(shí)間序列分析[M].北京:中國(guó)統(tǒng)計(jì)出版社,2000:28-56.
[9]萊蕪市統(tǒng)計(jì)局.萊蕪市統(tǒng)計(jì)年鑒2009[M].北京:中國(guó)統(tǒng)計(jì)出版社,2009:1-27.
[10]易丹輝.數(shù)據(jù)分析與EVIEWS應(yīng)用[M].北京:中國(guó)統(tǒng)計(jì)出版社,2002:17-63.
[11]陳澤中,李鐸,楊啟智,中國(guó)人均 GDP(1952-2002)時(shí)間序列分析[J].統(tǒng)計(jì)與決策,2005,(02):61-62.
[12]張曉峒.計(jì)量經(jīng)濟(jì)分析[M].上海:經(jīng)濟(jì)科學(xué)出版社,2000:20-80.