董莉娜++李倩
【摘要】通過(guò)對(duì)我國(guó)1949年至2012年共49年的人口數(shù)據(jù)進(jìn)行實(shí)證分析,分別運(yùn)用確定性因素分解法和ARIMA模型兩種不同的時(shí)間序列分析方法,對(duì)我國(guó)人口的變化規(guī)律進(jìn)行了擬合研究。
【關(guān)鍵詞】時(shí)間序列分析 確定性因素分解法建模 ARIMA模型
人口過(guò)多一直是我國(guó)最重要的問(wèn)題之一,合理的人口規(guī)模是經(jīng)濟(jì)、社會(huì)、資源和環(huán)境協(xié)調(diào)發(fā)展的有力保證,因此了解我國(guó)人口規(guī)模發(fā)展的現(xiàn)狀和預(yù)測(cè)未來(lái)人口規(guī)模發(fā)展的趨勢(shì),具有重要的理論和現(xiàn)實(shí)意義。早在十八世紀(jì)末,英國(guó)人馬爾薩斯在研究了百余年的人口統(tǒng)計(jì)數(shù)據(jù)資料后,利用微分方程建立了Logistic人口模型;國(guó)內(nèi)眾多學(xué)者也對(duì)人口預(yù)測(cè)方面的數(shù)學(xué)模型進(jìn)行許多研究。本文通過(guò)對(duì)我國(guó)1949年至2012年共49年的人口數(shù)據(jù)進(jìn)行實(shí)證分析,分別運(yùn)用確定性因素分解法和ARIMA模型兩個(gè)不同的時(shí)間序列分析方法,對(duì)我國(guó)人口的變化規(guī)律進(jìn)行了擬合研究。
時(shí)間序列是指同一現(xiàn)象的觀測(cè)值按不同時(shí)間排列的數(shù)字序列。在早期的時(shí)間序列分析中,通常是通過(guò)歷史數(shù)據(jù)的比較和圖形的觀察來(lái)揭示現(xiàn)象隨時(shí)間變化的規(guī)律,即所謂的描述性時(shí)序分析。傳統(tǒng)時(shí)間序列分析在實(shí)踐中的應(yīng)用主要是確定性時(shí)間序列分析方法,包括指數(shù)平滑法、移動(dòng)平均法、時(shí)間序列分解法等等。但在現(xiàn)實(shí)生活中,許多不確定性因素的影響越來(lái)越嚴(yán)重,已經(jīng)引起人們的重視。博克斯和詹金斯(1970)提出了一種基于隨機(jī)理論的時(shí)間序列分析方法,使時(shí)間序列分析理論達(dá)到了一個(gè)新的高度,大大提高了預(yù)測(cè)的精確度。對(duì)于平穩(wěn)時(shí)間序列來(lái)說(shuō),基本模型有:自回歸(AR)模型、移動(dòng)平均(MA)模型以及自回歸移動(dòng)平均(ARMA)模型等。對(duì)非平穩(wěn)時(shí)間序列,基本模型為:求和自回歸移動(dòng)平均模型以及殘差自回歸模型等。近年來(lái),隨著計(jì)算機(jī)技術(shù)和信號(hào)處理技術(shù)的迅速發(fā)展,時(shí)間序列分析的理論和方法越來(lái)越完善。
運(yùn)用確定性因素分解法建立模型時(shí),克萊默分解定理認(rèn)為任何時(shí)間序列都可以分解為兩部分:一部分是由多項(xiàng)式?jīng)Q定的確定趨勢(shì)的一部分,另一部分是平穩(wěn)零均值誤差。由于1949年到1970年間的總?cè)丝跀?shù)據(jù)有部分缺失,所以只選擇1970年到2012年的人口數(shù)據(jù)進(jìn)行分析。處理過(guò)程中以1970年為時(shí)間起點(diǎn),即t=1。通過(guò)觀察發(fā)現(xiàn),總?cè)丝谛蛄袌D有明顯的線(xiàn)性趨勢(shì),嘗試擬合一元線(xiàn)性直線(xiàn)。
建立ARIMA模型時(shí),先將時(shí)間序列從Excel表中讀入R中,做總?cè)丝诘内厔?shì)圖,觀察趨勢(shì)及平穩(wěn)性。時(shí)序圖清晰地顯示每年總?cè)丝诔尸F(xiàn)出明顯的逐年遞增的趨勢(shì),顯然該序列一定不是平穩(wěn)序列。同時(shí)單位根檢驗(yàn)的結(jié)果顯示,統(tǒng)計(jì)量的P值大于0.05,拒絕平穩(wěn)這一原假設(shè),所以可以認(rèn)為我國(guó)總?cè)丝谛蛄酗@著非平穩(wěn)。顯然,這個(gè)序列的DF檢驗(yàn)結(jié)果與根據(jù)時(shí)序圖得到的直觀判斷完全一致。先對(duì)總?cè)丝谛蛄羞M(jìn)行一階差分,觀察發(fā)現(xiàn)一階差分序列仍然是不平穩(wěn)序列,再對(duì)總?cè)丝谛蛄羞M(jìn)行二階差分,時(shí)序圖和單位根檢驗(yàn)結(jié)果表明二階差分序列是平穩(wěn)序列。建立二階差分序列的ARMA模型.。ACF為四步截尾的,PACF收斂的速度能達(dá)到要求,嘗試擬合MA(4)模型。先對(duì)回歸系數(shù)進(jìn)行估計(jì)和顯著性檢驗(yàn),根據(jù)輸出結(jié)果計(jì)算T統(tǒng)計(jì)量值(由參數(shù)除以標(biāo)準(zhǔn)差而得),MA(1)參數(shù)的T統(tǒng)計(jì)量值:-0.4502/0.1396=-3.22492837,MA(2)參數(shù)的T統(tǒng)計(jì)量值:-0.2038/0.1571=-1.29726289,MA(3)參數(shù)的T值:0.0946/0.1470 =0.64353741,MA(4)參數(shù)的T值0.4406/0.1460=-3.01780822,顯然MA(1)和MA(4)參數(shù)均在5%的顯著水平下拒絕零假設(shè)。根據(jù)檢驗(yàn)結(jié)果去掉不顯著的變量,建立疏系數(shù)模型,MA(1)和MA(4)參數(shù)均在5%的顯著水平下拒絕零假設(shè)。為了檢驗(yàn)?zāi)P褪欠裼糜诮Y(jié)果的預(yù)測(cè),對(duì)模型進(jìn)行進(jìn)一步的適應(yīng)性檢驗(yàn)。檢驗(yàn)結(jié)果表明:LB統(tǒng)計(jì)量的P—值多數(shù)大于0.05(或其ACF均落在區(qū)間內(nèi)),說(shuō)明殘差序列無(wú)自相關(guān),模型為適應(yīng)的。利用觀察值數(shù)據(jù)和前面得到的擬合數(shù)據(jù),進(jìn)行預(yù)測(cè)。
模型一中,擬合模型Xt=85342.930+1273.835t+εt
模型二中,綜合前面的差分運(yùn)算,實(shí)際上是對(duì)原序列擬合疏系數(shù)模型ARIMA(0,2,(1,4))。
參考文獻(xiàn)
[1]王燕.應(yīng)用時(shí)間序列分析[M].中國(guó)人民大學(xué)出版社,2005
[2][英]C.查特菲爾德著,駱振華譯.時(shí)間序列分析引論(第二版).廈門(mén):廈門(mén)大學(xué)出版社,1987
[3][美]Jonathan D.Cryer,Kung-Sik Chan著,潘紅宇等譯.時(shí)間序列分析及應(yīng)用(原書(shū)第二版).機(jī)械工業(yè)出版社,2011.1
作者簡(jiǎn)介:董莉娜(1993-),女,山西運(yùn)城人;李倩(1993-),女,山西長(zhǎng)治人,山西財(cái)經(jīng)大學(xué)應(yīng)用統(tǒng)計(jì)專(zhuān)業(yè)碩士研究生,研究方向:市場(chǎng)調(diào)查與分析。