董選軍 余運(yùn)賢 朱列波
義烏市手足口病流行趨勢(shì)組合預(yù)測(cè)模型研究
董選軍1余運(yùn)賢2朱列波1
目的 構(gòu)建義烏市手足口病流行趨勢(shì)最優(yōu)預(yù)測(cè)模型。方法 通過對(duì)義烏市2009-2011年手足口病按月發(fā)病數(shù)進(jìn)行ARIMA時(shí)間序列、GM(1,1)灰色模型以及2者的組合模型進(jìn)行建模,并預(yù)測(cè)2012年1-5月份發(fā)病數(shù)與實(shí)際比較。結(jié)果 ARIMA(1,1,1)模型的 r(曲)91.26%,GM(1,1)灰色模型的r(曲)為1.86%,組合預(yù)測(cè)模型的 r(曲)為94.55%;ARIMA(1,1,1)預(yù)測(cè)的 MAPE為 56.39%、MSPE為 27.28%,GM(1,1)預(yù)測(cè)的 MAPE為 42.09%、MSPE為22.91%,組合預(yù)測(cè)模型預(yù)測(cè)的MAPE為53.29%、MSPE為25.10%。結(jié)論 在進(jìn)行手足口病流行趨勢(shì)建模中,組合預(yù)測(cè)是一個(gè)較好的方法。
手足口病 ARIMA GM(1,1) 組合預(yù)測(cè)
1.義烏市疾病預(yù)防控制中心(322000)
2.浙江大學(xué)公共衛(wèi)生學(xué)院
手足口病是多種腸道病毒(以EV71和COXA16型為主)感染引起的一種常見急性傳染病,好發(fā)于嬰幼兒及學(xué)齡前兒童,以發(fā)熱和手足口臀部丘疹或皰疹為主要癥狀,該病傳染性強(qiáng),傳播速度快,短時(shí)間內(nèi)可在人群密集的地區(qū)引起大流行,因此了解手足口病的流行趨勢(shì),建立模型并進(jìn)行預(yù)測(cè)有利于更好地防控手足口病。本文對(duì)義烏市2009-2011年的手足口病按月發(fā)病數(shù)進(jìn)行ARIMA時(shí)間序列、GM(1,1)模型和組合模型建模,預(yù)測(cè)2012年1-5月份發(fā)病數(shù),并與實(shí)際進(jìn)行比較,結(jié)果如下。
1.資料來源 2009年1月-2012年5月義烏市手足口病疫情資料來源于中國(guó)疾病監(jiān)測(cè)信息報(bào)告管理系統(tǒng)。
2.方法 對(duì)2009-2011年義烏市手足口病流行趨勢(shì)進(jìn)行描述性統(tǒng)計(jì)分析和按月手足口病發(fā)病數(shù)建立ARIMA、GM(1,1)和組合預(yù)測(cè)模型。
3.統(tǒng)計(jì)分析 使用DPS7.05軟件進(jìn)行ARIMA時(shí)間序列、GM(1,1)和組合預(yù)測(cè)模型分析,SPSS19.0進(jìn)行有關(guān)系數(shù)計(jì)算。
1.疫情概況 2009-2011年義烏市共報(bào)告6122例,報(bào)告發(fā)病率分別為48.95/10萬(wàn)、179.23/10萬(wàn)和95.00/10萬(wàn),年報(bào)告平均發(fā)病率108.47/10萬(wàn)。2012年1-5月共報(bào)告4500例,遠(yuǎn)遠(yuǎn)超過歷年同期平均水平,并呈現(xiàn)逐月上升趨勢(shì)。
2.時(shí)間分布 2009-2011年每月均有發(fā)病,4-7月份和11-12月份呈現(xiàn)2個(gè)小高峰,其中4-7月份占63.85%。
3.ARIMA時(shí)間序列模型分析
用DPS7.05軟件對(duì)2009-2011年手足口病按月進(jìn)行ARIMA模型擬合,根據(jù)多次擬合,ARIMA(1,1,1)相對(duì)較好,得擬合方程Z(T+L)=-0.0021+0.30Z(T+L-1)+e(T+L)-0.058e(T+L-1)。曲線相關(guān)r(曲)=1-(Q/Lyy),其中Q為實(shí)際值與擬合值差的平方和,Lyy=∑(Y-)2,得到ARIMA模型的r(曲)為91.26%。預(yù)測(cè)得平均絕對(duì)百分比誤差為56.39%,均方百分比誤差
4.GM(1,1)灰色模型分析
用DPS7.05對(duì)2009-2011年手足口病進(jìn)行灰色模型分析,得Z(K+1)=135.18e-0.014k,r(曲)為1.86%,預(yù)測(cè)的MAPE為42.09%,MSPE為22.91%。
5.組合模型
設(shè)Y11,Y12分別是 ARIMA(1,1,1)和 GM(1,1)模型的預(yù)測(cè)值,Yt是最優(yōu)組合預(yù)測(cè)值,預(yù)測(cè)誤差分別為e1t、e2t、et,以預(yù)測(cè)誤差平方和最小為最優(yōu)準(zhǔn)則,即使E=取最小,k1,k2(k1+k2=1)為相應(yīng)的權(quán)系數(shù),則有:et=k1e1t+k2e2t,將k2用1-k1代入可得:
對(duì)于E==∑[k1(e1t-e2t)+e2t]2
關(guān)于k1求偏導(dǎo)數(shù),則∑2(e1t-e2t)[k1(e1t-e2t)+e2t]=0,得k1= -[∑(e1t-e2t)e2t]/[∑(e1t-e2t)2],得組合模型為Yt=0.84Y11+0.16Y12,r(曲)為94.55%,預(yù)測(cè)的MAPE為53.29%,MSPE為25.10%。
6.三種模型和預(yù)測(cè)比較
從 ARIMA(1,1,1)、GM(1,1)和組合模型比較,組合模型的曲線相關(guān)系數(shù)94.55%大于ARIMA(1,1,1)的91.26%和GM(1,1)的1.86%,擬合情況詳見圖1。
圖1 3種模型與實(shí)際比較圖
在衛(wèi)生統(tǒng)計(jì)研究中,需要從大量的數(shù)據(jù)中尋找出隱藏的規(guī)律,最好能夠用數(shù)學(xué)模型表示出來〔1〕。不同的預(yù)測(cè)模型各有其優(yōu)點(diǎn)和缺點(diǎn),組合預(yù)測(cè)模型綜合利用每種預(yù)測(cè)方法提供的有用信息,對(duì)所組合的各單項(xiàng)預(yù)測(cè)方法取長(zhǎng)補(bǔ)短,在當(dāng)前預(yù)測(cè)領(lǐng)域是一個(gè)研究熱點(diǎn)〔2〕。而基于數(shù)據(jù)挖掘的組合預(yù)測(cè)模型可以從原始數(shù)據(jù)中挖掘出更多的信息,有利于解決不同情況下的實(shí)際應(yīng)用問題〔3〕。
ARIMA時(shí)間序列分析因突出時(shí)間序列暫不考慮外界因素影響,當(dāng)外界發(fā)生較大變化時(shí),常會(huì)有較大偏差,因而時(shí)間序列預(yù)測(cè)法對(duì)于中短期預(yù)測(cè)的效果要比長(zhǎng)期預(yù)測(cè)的效果好〔4〕,同樣 GM(1,1)模型也不太適宜作長(zhǎng)期預(yù)測(cè)〔5〕。本文用ARIMA、灰色模型和二者的組合模型對(duì)2009-2011年義烏市手足口病疫情進(jìn)行了建模,并進(jìn)行了比較,得出雖然灰色模型遠(yuǎn)遠(yuǎn)不如ARIMA模型,但是當(dāng)用適當(dāng)?shù)姆椒ò鸦疑P秃虯RIMA模型組合起來的時(shí)候,所達(dá)到的效果最好,這也為我們優(yōu)化模型提供了新的方向。
1.管總平,陳芳,吳衛(wèi)紅,等.基于組合預(yù)測(cè)模型對(duì)門診量的預(yù)測(cè).中國(guó)醫(yī)院統(tǒng)計(jì),2009,16(3):226-230.
2.郭秀英.預(yù)測(cè)決策的理論與方法.化學(xué)工業(yè)出版社,2010.
3.張世強(qiáng).基于數(shù)據(jù)挖掘的組合預(yù)測(cè)模型的建模方法.中國(guó)衛(wèi)生統(tǒng)計(jì),2009,26(5):470-471.
4.劉曉東,景睿,孟祥臻,等.ARIMA模型對(duì)中國(guó)入口死亡率預(yù)測(cè)的研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2008,26(5):630-631.
5.任正洪.孕產(chǎn)婦死亡率的灰色預(yù)測(cè),中國(guó)衛(wèi)生統(tǒng)計(jì),2005,22(1):22-22.
(責(zé)任編輯:郭海強(qiáng))
中國(guó)衛(wèi)生統(tǒng)計(jì)2013年4期