王燕芬,王旭峰,趙繼軍
(青島大學復雜性科學研究所,山東 青島,266071)
圖1 2009年~2016年手足口病發(fā)病數(shù)時間序列圖Fig.1 Time series of the incidence of HFMD from 2009 to 2016
本文使用的手足口病監(jiān)測數(shù)據為2009年至2016年月報告發(fā)病數(shù),來源于公共衛(wèi)生科學數(shù)據中心(www.phsciencedata.cn),全國各省年人口總數(shù)及年出生率來源于中國統(tǒng)計局(www.stats.gov.cn)。氣候數(shù)據包括月平均氣溫、降雨量和相對濕度,來源于中國氣象信息中心(data.cma.cn)。
寒暑假時間的選取參照各省教育廳公布的歷年中小學開學及放假時間通知,1月20日至2月20日為寒假時間,7月、8月為暑假。春運共計40天,一般為春節(jié)前15天和節(jié)后25天,由于每年時間不同,根據最早開始時間和最晚結束時間,選擇1月中旬至3月中旬作為春運期間。
本文首先建立時間序列SIR (Time Series Susceptible Infected Recovered,TSIR)模型估算各省手足口病月傳染率,模型中的參數(shù)由馬爾科夫蒙特卡洛方法(Markov chain Monte Carlo,MCMC)進行估計,然后利用線性回歸模型分析月平均氣溫、降雨量、相對濕度、開學放假和春運對各省手足口病傳染率的影響。
(1)
其中,B(t)為出生人數(shù),Yr(t)為報告發(fā)病人數(shù),ρ為報告率,β(t)為傳染率,本文假設每年同一個月的傳染率相同。由于經疾病監(jiān)測系統(tǒng)上報的發(fā)病人數(shù)僅占實際發(fā)病數(shù)的一定比例,在計算下一時刻易感者人數(shù)時候,需要除去實際感染者人數(shù),所以需要計算相應報告率來糾正發(fā)病人數(shù)。本文使用平滑樣條法對各地報告率進行估算,模型中自由度選取經驗值2.5[23,27]。
實際生活中,疾病的發(fā)病人數(shù)通常服從泊松分布或負二項分布[19,25],本文假設TSIR模型中感染者人數(shù)服從泊松分布:
Y(t)~Possion(λ)
(2)
其中,λ為感染力,且λ的期望值為:
E(λ)=β(t)Yα(t)X(t)
(3)
其中,α(0<α≤1)為人群混合程度,當α<1,說明人群是不完全混合的,即部分人之間的接觸高于他們與其他人群的接觸;當α=1,表示人群是均勻混合。因為TSIR模型中步長的選擇(兩周或是一個月)不影響最終結果[13],而我們收集的數(shù)據為月發(fā)病數(shù),所以采用時間步長為1個月。利用TSIR模型,本文估計了各省、自治區(qū)月手足口病傳染率β(t)、人群混合程度α、易感者人數(shù)X(t)及報告率ρ共15個參數(shù)。
TSIR模型中的參數(shù)由馬爾科夫蒙特卡洛方法(Markov chain Monte Carlo,MCMC)進行估計[28],馬爾科夫鏈用Gibbs采樣法產生,各地區(qū)初始易感者人數(shù)X(0)、人群混合程度α和傳染率β(t)的先驗參數(shù)都服從均勻分布,初始易感者人數(shù)X(0)取值范圍為總人口的1%~40%,人群混合程度α取值范圍為[0.5, 0.999]。為了保證各省相應的基本再生數(shù)在1至100范圍內,其傳染率初值的取值范圍不同。在初始迭代1 000次后,馬爾科夫鏈迭代1 000萬次,再對最后5 000個有效參數(shù)進行采樣,為了避免采樣結果自相關,采樣間隔取50。由于手足口病疫苗于2016年才投入使用,且對發(fā)病數(shù)影響并不明顯,所以TSIR模型中可以不考慮免疫措施的影響。
最后,在獲得各省傳染率的基礎上,估算各省手足口病基本再生數(shù),利用線性回歸模型分析月平均氣溫、降雨量、相對濕度、開學放假和春運期間對各省傳染率的影響。氣候因素為月數(shù)據變量,開學放假(“學期”、“寒假”或“暑假”)和春運(“春運期間”或“平常時期”)均為分類變量。由于估計的傳染率為月數(shù)值,所以本文選用2月作為寒假時間,7月、8月作為暑假時間。每年春運時間并不固定,考慮到人群接觸后疾病的傳播存在一定的時間滯后,本文選取有兩個星期滯后的2月和3月作為線性回歸模型中的春運期間。我們首先只選取氣候因素進行線性回歸,為了避免各因素之間相關性導致的模型中多重共線性問題,對變量進行篩選,將方差膨脹因子(方差膨脹因子越大,共線性越嚴重)大于5的因素依次去掉后,再找出對手足口病具有顯著影響的氣候因素。其次,應用包括具有顯著影響的氣候因素、開學放假和春運期間在內的線性回歸模型,分析各因素對手足口病傳染率的影響。
利用馬爾科夫蒙特卡洛方法估算TSIR模型中的參數(shù),對最后5 000個有效參數(shù)進行采樣(圖2),傳染率β(t)、人群混合度α和易感者人數(shù)X(t)收斂在一定區(qū)間內。
圖2 以湖南省為例,MCMC-TSIR模型最后5 000次迭代采樣結果Fig.2 Taking Hunan Province as an example, the results of the last 5 000 iterations of the MCMC-TSIR model
中國各省手足口病傳染率的峰值有明顯的季節(jié)性(見圖3),且在2月都有較大的增幅,這可能與春運期間大規(guī)模人口流動引起的人群接觸率快速增加有關,因為沒有發(fā)現(xiàn)氣候因素在2月有所變化。在暑假期間,多數(shù)省的傳染率處于較低水平。為了更好進行描述,根據傳染率峰值發(fā)生時間,可以將全國各省歸類到為4個區(qū)域(見表1):
圖3 全國各省手足口病傳染率峰值分布及各區(qū)域傳染率偏移值Fig.3 Peak distribution of HFMD transmission rate and the deviance of β(t) in each region
地區(qū)包含省份東南地區(qū)海南、廣東、廣西、浙江、江蘇、上海、安徽、云南、四川、重慶、貴州、山西、陜西、北京、天津、山東、江西、湖北、湖南、福建、河北、河南北部地區(qū)內蒙古、吉林、遼寧和沈陽西北地區(qū)新疆、青海、甘肅和寧夏西藏西藏
屬于東南地區(qū)的各省(除山東省和北京市外)的手足口病傳染率峰值集中于2月~3月;屬于西北地區(qū)的省份傳染率峰值在4月;東南地區(qū)和西北地區(qū)各省的手足口病傳染率在秋季還有一個小高峰。北方地區(qū)傳染率峰值在5月;西藏傳染率峰值則在8月,這可能是因為西藏地區(qū)手足口病的平均感染年齡在5歲左右,即學齡兒童更易感染疾病,因此學校開學、放假導致的學生間接觸率的變化能夠影響其傳染率的季節(jié)性。
根據模型估計的結果(見圖4):全國多數(shù)省份手足口病基本再生數(shù)在15至35之間,只有廣東省的手足口病基本再生數(shù)高于40,貴州省基本再生數(shù)則小于10;手足口病報告率在各地區(qū)也有較大差異,從整體上看,處于東南地區(qū)的省份手足口病報告率高于北部、西北地區(qū),其中山西省、青海省、新疆和西藏自治區(qū)的報告率不足5%,廣西省和海南省的報告率卻高達35%,其余省份的報告率多處于10%至25%之間;各省手足口病易感者比例則集中在10%至35%之間。
圖4 MCMC-TSIR模型估算各省參數(shù)結果Fig.4 Results of estimated parameters in different province of MCMC-TSIR model
利用MCMC-TSIR模型所得參數(shù)估計發(fā)病數(shù),對實際報告發(fā)病數(shù)和預測發(fā)病數(shù)取對數(shù)后進行分析。模型預測的發(fā)病數(shù)和實際發(fā)病數(shù)之間的關系為圖5。
手足口病傳染率季節(jié)性在不同地區(qū)受不同因素影響(見表2):東南地區(qū)各省份傳染率季節(jié)性僅與春運有關;北部地區(qū)手足足病傳染率季節(jié)性則受平均氣溫(解釋貢獻率20.10%)、暑假(解釋貢獻率49.42%)和春運(解釋貢獻率8.11%)的影響;西北地區(qū)傳染率季節(jié)性主要受到相對濕度(解釋貢獻率31.27%)和春運(解釋貢獻率9.80%)的影響;西藏省手足口病傳染率季節(jié)性既不受氣候因素影響,也不受春運的影響。
圖5 模型估計發(fā)病數(shù)及報告發(fā)病數(shù)關系Fig.5 The relationship between the estimated number of cases and the number of reported cases
影響因素估計值平均溫度相對濕度暑假春運期間R2東南地區(qū)回歸系數(shù)---1.204e-060.642 2P值-< 2.2e-16北部地區(qū)回歸系數(shù) 7.565e-08--1.944e-069.748e-070.420 3P值4.93e-06-0.000 1630.075 522西北地區(qū)回歸系數(shù)--1.141e-07 -1.710e-060.414 9P值-0.010 85-0.068 26西藏回歸系數(shù)-----P值----
各地區(qū)手足口病均不受降雨量影響,因此表中去除了降雨量這一項。地區(qū)內各省存在差異性,對各省的手足口病傳染率季節(jié)性影響因素進行分析發(fā)現(xiàn)東南地區(qū)各省傳染率季節(jié)性都與春運有顯著相關,其中廣東省傳染率季節(jié)性還與相對濕度有關,北京、天津傳染率季節(jié)性還與相對濕度和溫度相關;北部地區(qū)各省的傳染率季節(jié)性都與相對濕度有關,吉林、遼寧和黑龍江省傳染率季節(jié)性還受平均溫度影響;屬于西北地區(qū)的寧夏、甘肅手足口病傳染率季節(jié)性與相對濕度、溫度有關,青海省傳染率僅與春運有關,新疆自治區(qū)傳染率季節(jié)性則與相對濕度和降雨量有關。
手足口病傳染率在中國各省都有明顯的季節(jié)性,且在2月都有大幅度增加,這與春運期間,整體人群接觸率變化有關。根據傳染率峰值的時間分布,可以將全國各省歸類為四個區(qū)域:東南地區(qū)、西北地區(qū)、北部地區(qū)及西藏。東南地區(qū)的多數(shù)省份傳染率高峰集中在2月和3月,西北地區(qū),包括新疆、青海、甘肅和寧夏,手足口病傳染率高峰發(fā)生在4月,北方地區(qū),包括內蒙古、遼寧、吉林和沈陽的傳染率在5月達到最大值,而西藏地區(qū)的傳染率在8月達到峰值。
根據MCMC-TSIR模型,全國多數(shù)省份手足口病基本再生數(shù)在15至35之間,這可能與人口密度、易感者比例等因素有關。根據估算的基本再生數(shù),手足口病的免疫覆蓋率應高于93.3%。從整體上看,多數(shù)省份的報告率在10%至25%之間,處于東南地區(qū)的省份手足口病報告率高于北部地區(qū)和西北地區(qū),而西藏自治區(qū)報告率僅2.5%,這可能與當?shù)蒯t(yī)療水平、公共衛(wèi)生健康監(jiān)測系統(tǒng)的完善程度有關;各省手足口病易感者比例則集中在10%至35%之間。
手足口病傳染率的季節(jié)性影響因素主要分為兩類:社會因素及氣候因素。東南地區(qū)的大多數(shù)省份的手足口病傳染率季節(jié)性僅受春運期間的顯著影響。東南地區(qū)多數(shù)省份經濟發(fā)達,流動人口數(shù)目高于其他地區(qū),春運期間,人口遷移量更是急劇增加,使得各年齡組的接觸率遠高于平常時間,封閉、擁擠的旅途環(huán)境使得疾病的傳播可能性大大增加。北方地區(qū)的傳染率季節(jié)性則與平均溫度和暑假相關,西北地區(qū)的傳染率季節(jié)性受到相對濕度和春運的影響;這可能是因為西北、北部地區(qū)的月氣候變化較為顯著,氣候變化會影響病毒在環(huán)境中的生存率,還會在一定程度上影響人的行為方式,間接影響人群接觸率變化。西藏地區(qū)傳染率不受氣候、學期和春運的影響。在寒暑假期間,各省的手足口病傳染率也有所增加,尤其西藏地區(qū),其手足口病傳染率峰值在8月。這可能是因為中國各省手足口病平均感染年齡不同,西藏地區(qū)手足口病的平均感染年齡在5歲左右,學齡兒童更易感染疾病[4],因此學校開學、放假導致的兒童間接觸率的變化對其傳染率的季節(jié)性的影響較其他省更加顯著。
為了更好了解手足口病傳染率的季節(jié)性及其影響因素,需要更進一步研究,在未來研究中,我們將具體分析不同年齡組手足口病傳染率季節(jié)性及其影響因素,并將影響因素代入模型中,通過曲線下的面積(Area Under Curve,AUC)來進行評估。