ARIMA模型在甲型肝炎時(shí)間分布特征及趨勢(shì)預(yù)測(cè)中的應(yīng)用

2018-09-14 07:05:04朱佳佳胡登利

中西醫(yī)結(jié)合心血管病雜志(電子版) 2018年22期

朱佳佳，胡登利，呂媛*

（1．湖南師范大學(xué)醫(yī)學(xué)院，湖南長(zhǎng)沙 410013；2．中國(guó)人民解放軍第163醫(yī)院，湖南長(zhǎng)沙 410003）

甲型病毒性肝炎（Hepatitis A），簡(jiǎn)稱甲肝，是甲肝病毒（Hepatitis A virus，HAV）引起的，主要經(jīng)糞-口途徑傳播的急性傳染病。甲肝在全球均有報(bào)道，但由于經(jīng)濟(jì)衛(wèi)生條件差異，各個(gè)國(guó)家和地區(qū) 的甲肝流行趨勢(shì)呈現(xiàn)明顯差異。研究表明，收入水平和清潔飲用水可及性越高的國(guó)家和地區(qū)，甲肝發(fā)病率較低[1]。全球每年新發(fā)HAV感染者約140萬(wàn)人，我國(guó)各地每年均有病例報(bào)告，呈高度散發(fā)，暴發(fā)主要集中在學(xué)校等人群密集區(qū)域，西部地區(qū)省份發(fā)病率較高[2]。近年來我國(guó)甲肝發(fā)病率呈下降趨勢(shì)，但發(fā)病人數(shù)中兒童和青少年占有很大比例[3]。本研究將采用自回歸移動(dòng)平均模型（autoregressive integrated moving average model，ARIMA）分析我國(guó)甲肝的時(shí)間分布特征并就發(fā)病趨勢(shì)進(jìn)行預(yù)測(cè)，探討其在甲肝發(fā)病預(yù)測(cè)中的可行性。

1 資料與方法

1.1 一般資料

2004年1月～2017年12月全國(guó)各省甲肝月發(fā)病數(shù)監(jiān)測(cè)數(shù)據(jù)，來源于“中國(guó)疾病預(yù)防控制信息系統(tǒng)”網(wǎng)絡(luò)報(bào)告系統(tǒng)。

1.2 方法

基于2004年1月～2016年12月全國(guó)甲肝月發(fā)病數(shù)建立ARIMA乘積季節(jié)模型，并用2017年發(fā)病數(shù)據(jù)進(jìn)行驗(yàn)證預(yù)測(cè)效果。統(tǒng)計(jì)分析采用SPSS 23.0。

ARIMA模型的建立過程主要分為以下幾步[4]：原始序列平穩(wěn)化處理、模型的識(shí)別、模型的參數(shù)估計(jì)和模型的診斷。

2 結(jié) 果

2.1 全國(guó)甲肝發(fā)病變化趨勢(shì)

繪制2004年1月～2016年12月全國(guó)甲肝月發(fā)病數(shù)時(shí)間序列圖（見圖1），發(fā)現(xiàn)我國(guó)甲肝全年均有發(fā)病，但發(fā)病數(shù)逐年遞減。每年6月～10月是發(fā)病高峰期，呈現(xiàn)一定的季節(jié)性波動(dòng)，周期為12個(gè)月。故甲肝發(fā)病序列并不是穩(wěn)定的時(shí)間序列。

2.2 時(shí)間序列的平穩(wěn)化處理

對(duì)原始序列進(jìn)行一階普通差分和一階周期為12的季節(jié)性差分后，發(fā)現(xiàn)時(shí)序圖趨于平穩(wěn)，且自相關(guān)系數(shù)函數(shù)圖（ACF）截尾，偏自相關(guān)函數(shù)圖（PACF）拖尾，說明此時(shí)的序列為平穩(wěn)序列，符合ARIMA模型要求。

圖1 2004年～2016年全國(guó)甲肝月發(fā)病數(shù)時(shí)間序列圖

2.3 模型識(shí)別

由上述初步確定建立ARIMA（p，1，q）（P，1，Q）12模型，p，q和P，Q是連續(xù)模型和季節(jié)模型中的自回歸階數(shù)和移動(dòng)平均階數(shù)，需依據(jù)平穩(wěn)序列的ACF和PACF確定。相關(guān)文獻(xiàn)提示均不會(huì)超過2階，故采用由低階到高階方式擬合模型。經(jīng)比較，ARIMA（0，1，1）（0，1，1）12模型的標(biāo)準(zhǔn)化BIC最小（12.954），且R2（0.884）和標(biāo)準(zhǔn)化R2（0.381）較高，擬合優(yōu)度較高，因此可視為本研究的最優(yōu)模型。

2.4 模型參數(shù)的估計(jì)與模型診斷

ARIMA（0，1，1）（0，1，1）12模型殘差的ACF和PACF均落在95%置信區(qū)間內(nèi)（見圖2），提示殘差是隨機(jī)分布的。模型的參數(shù)估計(jì)結(jié)果見表1，差異均有統(tǒng)計(jì)學(xué)意義（P＜0.05）。Box-Ljung Q檢驗(yàn)結(jié)果顯示殘差序列為白噪聲序列（P=0.907），說明模型對(duì)數(shù)據(jù)信息的提取較為充分。

表1 甲肝發(fā)病數(shù)最優(yōu)ARIMA模型的參數(shù)估計(jì)

2.5 模型預(yù)測(cè)

ARIMA（0，1，1）（0，1，1）12模型對(duì)我國(guó)2017年1月～12月的甲肝發(fā)病的預(yù)測(cè)值和實(shí)際發(fā)病數(shù)比較結(jié)果見表2。所有預(yù)測(cè)值均落入95%置信區(qū)間內(nèi)，二者基本吻合，預(yù)測(cè)值與實(shí)際值之間的相對(duì)誤差范圍為2.4%～37.1%，說明該模型對(duì)我國(guó)甲肝的實(shí)際發(fā)病有較好的的預(yù)測(cè)能力。

圖2 ARIMA（0，1，1）（0，1，1）12模型殘差序列的自相關(guān)系數(shù)圖和偏自相關(guān)系數(shù)圖

表2 2017年我國(guó)甲肝實(shí)際發(fā)病數(shù)與預(yù)測(cè)值比較

3 討論

時(shí)間序列分析[4]能將影響疾病發(fā)生的多種因素綜合考慮于時(shí)間變量中，分析發(fā)病數(shù)據(jù)隨時(shí)間發(fā)展變化規(guī)律，并能進(jìn)行有效外推預(yù)測(cè)[5]。ARIMA模型是時(shí)間序列分析最常用的方法之一，本文將ARIMA乘積季節(jié)模型應(yīng)用于我國(guó)甲肝的發(fā)病規(guī)律研究中，利用2004年～2016年共156個(gè)月份的甲肝發(fā)病監(jiān)測(cè)資料建立的ARIMA（0，1，1）（0，1，1）12模型，較好地反映了我國(guó)甲肝發(fā)病序列的特征。2017年1月～6月的驗(yàn)證數(shù)據(jù)與實(shí)際值的吻合度較高，發(fā)病趨勢(shì)與往年基本一致，相對(duì)誤差較小，而7月～12月的預(yù)測(cè)數(shù)據(jù)相對(duì)誤差較大，表明利用ARIMA乘積季節(jié)模型可以對(duì)我國(guó)甲肝發(fā)病趨勢(shì)進(jìn)行短期預(yù)測(cè)。

本研究的數(shù)據(jù)來源于我國(guó)傳染病報(bào)告信息系統(tǒng)，質(zhì)量可靠，但應(yīng)注意的是，ARIMA模型適合疾病的短期預(yù)測(cè)[6]，因此要不斷納入新的發(fā)病數(shù)據(jù)，調(diào)整模型參數(shù)以適應(yīng)疾病的實(shí)際發(fā)生情況。此外，由于甲肝的發(fā)生還受諸多因素的影響，故后續(xù)研究中應(yīng)嘗試將影響因素納入模型中以提高模型預(yù)測(cè)的精確性和準(zhǔn)確性。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡