龐艷蕾 張惠蘭 李向云△ 趙 晶
灰色模型GM(1,1)和ARIMA在擬合全國(guó)嬰兒、5歲以下兒童死亡率中的應(yīng)用
龐艷蕾1張惠蘭2李向云1△趙 晶1
目的 比較分析灰色模型GM(1,1)、ARIMA模型在全國(guó)嬰兒死亡率(IMR)和5歲以下兒童死亡率(U5MR)擬合過程中的適用性,為兒童保健工作提供科學(xué)依據(jù)。方法 以1991-2012年全國(guó)IMR、U5MR為原始資料,統(tǒng)一運(yùn)用SAS分析軟件。采用灰色模型GM(1,1)和ARIMA模型進(jìn)行擬合分析,分別計(jì)算各模型擬合MPE、MAPE值,比較各模型的適用性和精確性。結(jié)果 嬰兒死亡率GM(1,1)和ARIMA模型MPE分別為0.32、1.18,MAPE分別為3.09%、5.34%;5歲以下兒童死亡率GM(1,1)和ARIMA模型MPE分別為0.57、0.89,MAPE分別為3.11%、4.33%。結(jié)論 GM(1,1)模型對(duì)兒童保健指標(biāo)擬合效果優(yōu)于ARIMA模型,模型擬合要充分考慮數(shù)據(jù)特征。
GM(1,1) ARIMA 嬰兒死亡率 5歲以下兒童死亡率 擬合
2000年9月世界各國(guó)領(lǐng)導(dǎo)人在聯(lián)合國(guó)千年首腦會(huì)議上通過“聯(lián)合國(guó)千年宣言”[1]并制定了八項(xiàng)千年發(fā)展目標(biāo)(MDGs)。其中一項(xiàng)就關(guān)系到兒童保健方面,要求到2015年在1990年的基礎(chǔ)上使五歲以下兒童的死亡率降低三分之二??刂坪徒档蛬雰核劳雎?IMR)和5歲以下兒童死亡率(U5MR)既是改善和增進(jìn)人民福利的內(nèi)在要求,又是我國(guó)人口與社會(huì)發(fā)展的重要內(nèi)容[2]。國(guó)內(nèi)大多數(shù)學(xué)者運(yùn)用單一模型對(duì)兒童死亡率進(jìn)行擬合分析,且缺乏橫向比較。本文旨在運(yùn)用模型GM(1,1)和ARIMA對(duì)IMR和U5MR擬合分析,比較兩模型在擬合兒童死亡率中的適用性和精確性。
1.資料來源
資料來源于中國(guó)國(guó)家衛(wèi)生和計(jì)劃生育委員會(huì)衛(wèi)生信息中心《2013中國(guó)衛(wèi)生統(tǒng)計(jì)年鑒》和《2013年中國(guó)衛(wèi)生統(tǒng)計(jì)提要》,真實(shí)可靠。利用1991-2012年全國(guó)嬰兒死亡率(IMR)及5歲以下兒童死亡率(U5MR),作為建模分析的原始數(shù)據(jù)。
2.模型原理
(1) 灰色模型GM(1,1)
②模型檢驗(yàn) 根據(jù)小誤差概率(P值)和后驗(yàn)差檢驗(yàn)計(jì)算方差比(C值)檢驗(yàn)?zāi)P偷木_性,詳見表1。
* 以C值或P值對(duì)應(yīng)的最優(yōu)精度等級(jí)作為模型精度等級(jí)
(2) 模型ARIMA
②模型檢驗(yàn) 純隨機(jī)性檢驗(yàn)(白噪聲檢驗(yàn)),對(duì)模型檢驗(yàn)時(shí),殘差序列為白噪聲序列則模型擬合較好,說明充分提取了數(shù)列信息。若殘差序列不是白噪聲序列要重新建模,直到殘差為白噪聲序列為止。
3.統(tǒng)計(jì)分析
兩種預(yù)測(cè)模型都通過SAS軟件編輯程序并分析。根據(jù)兩種模型擬合結(jié)果計(jì)算出與實(shí)際值誤差,以擬合誤差來判定模型擬合的優(yōu)劣性。
4.模型比較
各指標(biāo)數(shù)據(jù)擬合后,以擬合值與真實(shí)值的差值作為誤差,然后計(jì)算各模型擬合預(yù)測(cè)平均相對(duì)誤差MPE和平均相對(duì)誤差絕對(duì)值MAPE。前者是將每個(gè)預(yù)測(cè)值的誤差以誤差的倍數(shù)放大,這樣單個(gè)誤差較大的預(yù)測(cè)值就可以使預(yù)測(cè)誤差的方差大幅增加,這更適合模型比較;與前者相比后者不存在正負(fù)相抵消的情況,所以應(yīng)用起來更優(yōu)越。因此,將MPE和MAPE結(jié)合起來共同作為模型評(píng)價(jià)標(biāo)準(zhǔn)。
1.擬合嬰兒死亡率
(2)建立ARIMA模型 利用全國(guó)1991-2012年IMR數(shù)據(jù),先進(jìn)行白噪聲檢驗(yàn)并結(jié)合序列ACF和PACF進(jìn)行分析,結(jié)果序列為有很強(qiáng)的遞減趨勢(shì)的非白噪聲序列。然后對(duì)序列進(jìn)行差分運(yùn)算,2階差分后,表現(xiàn)為平穩(wěn)非白噪聲序列。觀察差分后序列ACF和PACF,并結(jié)合表2和擬合結(jié)果殘差白噪聲檢驗(yàn)結(jié)果,最終選擇ARIMA(0,2,2)模型擬合,即2階差分2階移動(dòng)平均模型:(1-Β)2χt=(1-0.72067Β+0.81441Β2)εt。模型殘差和參數(shù)檢驗(yàn)均通過檢驗(yàn)詳見表3,擬合結(jié)果詳見表4。
2.擬合5歲以下兒童死亡率
(2)建立ARIMA模型 同ARIMA建模原理步驟,經(jīng)過白噪聲檢驗(yàn)、差分運(yùn)算、擬合結(jié)果白噪聲檢驗(yàn)以及AIC值和BIC值比較,最終選擇最優(yōu)ARIMA(0,2,1)模型,即2階差分1階移動(dòng)平均模型:(1-B)χt=0.12478 + (1-B)εt。模型殘差白噪聲檢驗(yàn):延遲6階χ2值為10.68,P值為0.0582,延遲12階χ2=19.14,P=0.0587,P值均大于0.05,模型通過檢驗(yàn)。模型參數(shù)顯著性檢驗(yàn):均值(常數(shù))t=2.96,P=0.0084,θ1檢驗(yàn)t=6.42,P=0.00001,P值均小于0.05,參數(shù)通過檢驗(yàn)。擬合結(jié)果詳見表4。
3.模型比較
根據(jù)各模型預(yù)測(cè)結(jié)果和擬合誤差,計(jì)算各模型擬合MPE、MAPE值。為使結(jié)果比較更有說服力現(xiàn)統(tǒng)一采用2005年以后擬合數(shù)據(jù)進(jìn)行誤差分析。嬰兒死亡率GM(1,1)和ARIMA模型MPE分別為0.32、1.18,MAPE分別為3.09%、5.34%;5歲以下兒童死亡率GM(1,1)和ARIMA模型MPE分別為0.57、0.89,MAPE分別為3.11%、4.33%??梢?,GM(1,1)模型在IMR和U5MR擬合方面優(yōu)于ARIMA。圖1、圖2直觀展現(xiàn)了兩模型在IMR和U5MR方面擬合效果。
GM(1,1)或ARIMA都適用于短期序列擬合,均曾被學(xué)者用在兒童死亡率的研究中[5-6],也有學(xué)者將兩者共同運(yùn)用于疾病或入院人數(shù)預(yù)測(cè)的比較分析[7-8]。本次研究將兩模型同時(shí)用于IMR和U5MR擬合,在各模型均通過檢驗(yàn)情況下,比較其精確性。兩種模型擬合均通過了模型檢驗(yàn),均可用于IMR和U5MR擬合,但GM(1,1)在IMR、U5MR的擬合時(shí)MPE、MAPE值均低于ARIMA模型。所以說在擬合兒童死亡率方面,GM(1,1)擬合效果優(yōu)于ARIMA。
GM(1,1)對(duì)樣本含量和概率分布沒有嚴(yán)格的要求,適應(yīng)性強(qiáng),可廣泛應(yīng)用于農(nóng)業(yè)、工業(yè)、氣象、醫(yī)學(xué)等領(lǐng)域的預(yù)測(cè)[9],并允許較少數(shù)據(jù)預(yù)測(cè),對(duì)影響因素不明確或結(jié)局不明朗的事件均可以展開預(yù)測(cè)[10]。而ARIMA對(duì)數(shù)據(jù)要求相對(duì)較高,需要相對(duì)較多的連續(xù)序列數(shù)據(jù),且過程相對(duì)GM(1,1)復(fù)雜。依據(jù)兩種模型的適用條件,數(shù)據(jù)無波動(dòng)或波動(dòng)較小的時(shí)間序列宜用GM模型、波動(dòng)較大的時(shí)間序列宜用ARIMA模型[7]。當(dāng)序列存在周期波動(dòng)或季節(jié)波動(dòng)時(shí)ARIMA更是首選。由原始數(shù)據(jù)可以看出,IMR、U5MR均表現(xiàn)很強(qiáng)的遞減趨勢(shì),沒有很大逆向波動(dòng),因此原始數(shù)據(jù)特征和模型自身特點(diǎn)是選擇合適擬合模型的關(guān)鍵。
兒童死亡率受到多方面的影響,比如社會(huì)經(jīng)濟(jì)發(fā)展水平、衛(wèi)生資源的配置利用、以及家長(zhǎng)經(jīng)濟(jì)狀況和文化程度等,并且各種因素對(duì)兒童死亡率影響程度、方式、途徑等都有各自的特點(diǎn)。模型擬合兒童死亡率只是單純從模型擬合角度探究模型擬合歷史數(shù)據(jù)的精確程度,數(shù)學(xué)模型主要是反映數(shù)據(jù)的規(guī)律性,不能完全反映各種非規(guī)律性的社會(huì)因素對(duì)預(yù)測(cè)數(shù)據(jù)的影響[11]。因此在擬合乃至預(yù)測(cè)過程中要慎重。
[1]聯(lián)合國(guó)千年宣言.A/55/L.2,http://www.un.org/chinese/ga/55/res/a55r2.htm.
[2]劉元元.2010年我國(guó)孕產(chǎn)婦、嬰兒及5歲以下兒童死亡率的統(tǒng)計(jì)預(yù)測(cè)研究.成都:四川大學(xué),2005.
[3]徐國(guó)祥.統(tǒng)計(jì)預(yù)測(cè)和決策.第二版.上海:上海財(cái)經(jīng)大學(xué)出版社,2005:202-224.
[4]王燕.應(yīng)用時(shí)間序列分析.第二版.北京:中國(guó)人民大學(xué)出版社,2008.142-173.
[5]劉潔,曲波,郭海強(qiáng),等.ARIMA模型在中國(guó)5歲以下兒童死亡率預(yù)測(cè)中應(yīng)用.中國(guó)公共衛(wèi)生,2011,27(2):237-238.
[6]李向云,劉曉冬,馬麗敏,等.GM (1,1)灰色模型在擬合我國(guó)嬰兒死亡率中的應(yīng)用.中國(guó)醫(yī)院統(tǒng)計(jì),2009,16(1):33-35.
[7]金如鋒,邱宏,周霞,等.ARIMA模型和GM(1,1)模型預(yù)測(cè)全國(guó)3種腸道傳染病發(fā)病率.復(fù)旦學(xué)報(bào)(醫(yī)學(xué)版),2008,35(5):675-680.
[8]梁景星.GM(1,1) 灰色模型和ARIMA模型在我院季度入院人數(shù)預(yù)測(cè)中的比較分析.中衛(wèi)生統(tǒng)計(jì),2014,31(1):107-109.
[9]許筱紅,金小林.GM(1,1)數(shù)學(xué)模型在瘧疾疫情預(yù)測(cè)中的應(yīng)用.中國(guó)寄生蟲病防治雜志,2005,18(3):178-179.
[10]楊婷,王玉貴,楊丹,等.基于灰色成分?jǐn)?shù)據(jù)模型的醫(yī)療費(fèi)用結(jié)構(gòu)變動(dòng)趨勢(shì)預(yù)測(cè)研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(1):58-60.
[11]張冬艷,盧亦愚,馮燕,等.應(yīng)用灰色系統(tǒng)模型預(yù)測(cè)麻疹的流行時(shí)間.數(shù)理醫(yī)藥學(xué)雜志,2011,24(1):7-9.
(責(zé)任編輯:郭海強(qiáng))
1.濰坊醫(yī)學(xué)院公共衛(wèi)生學(xué)院(261053)
2.山東省濰坊市奎文區(qū)婦幼保健院(261041)
△通信作者:李向云,E-mail:lixy@wfmc.edu.cn
中國(guó)衛(wèi)生統(tǒng)計(jì)2015年3期