国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于超幾何分布的前瞻性時(shí)空掃描統(tǒng)計(jì)量在瘧疾早期預(yù)警中的應(yīng)用*

2015-03-09 11:12飛李曉松馮子健趙
關(guān)鍵詞:泊松前瞻性瘧疾

陳 飛李曉松馮子健趙 星△

基于超幾何分布的前瞻性時(shí)空掃描統(tǒng)計(jì)量在瘧疾早期預(yù)警中的應(yīng)用*

陳 飛1李曉松1馮子健2趙 星1△

目的探索基于超幾何分布概率模型的前瞻性時(shí)空掃描統(tǒng)計(jì)量在瘧疾早期預(yù)警中的應(yīng)用。方法利用R語(yǔ)言編程實(shí)現(xiàn)兩種前瞻性時(shí)空掃描統(tǒng)計(jì)量,分別基于經(jīng)典的泊松分布概率模型和較新的超幾何分布概率模型,模擬實(shí)時(shí)監(jiān)測(cè)系統(tǒng)對(duì)四川省2009年瘧疾病例中6月21日-30日連續(xù)10天數(shù)據(jù)進(jìn)行逐日前瞻性分析。結(jié)果基于超幾何分布的前瞻性時(shí)空掃描統(tǒng)計(jì)量和基于泊松分布的前瞻性時(shí)空掃描統(tǒng)計(jì)量在瘧疾早期預(yù)警中效果相當(dāng),都能早期探測(cè)到瘧疾的爆發(fā)。結(jié)論基于超幾何分布的前瞻性時(shí)空掃描統(tǒng)計(jì)量在瘧疾早期預(yù)警中有應(yīng)用價(jià)值。

傳染病預(yù)警 時(shí)空掃描統(tǒng)計(jì)量 超幾何分布模型 泊松分布模型

近年國(guó)內(nèi)外相繼建立了傳染病實(shí)時(shí)報(bào)告系統(tǒng),使得傳染病早期預(yù)警成為可能。然而其預(yù)警方法的研究仍處于探索階段。目前國(guó)內(nèi)外傳染病時(shí)空預(yù)警方法中非常經(jīng)典的是Kulldorff前瞻性時(shí)空掃描統(tǒng)計(jì)量[1-2]。

掃描統(tǒng)計(jì)量是一種廣泛應(yīng)用的統(tǒng)計(jì)學(xué)方法,其目的是探測(cè)局部時(shí)間和/或空間事件發(fā)生數(shù)的增加,并檢驗(yàn)這種增加是否可由隨機(jī)變異解釋[3]。其基本思想是:設(shè)定一個(gè)掃描窗口,該窗口可在時(shí)間和/或空間移動(dòng),窗口的大小和位置均處于動(dòng)態(tài)變化之中。對(duì)每一個(gè)掃描窗口,根據(jù)實(shí)際發(fā)病數(shù)和人口數(shù)可計(jì)算出理論發(fā)病數(shù),然后利用掃描窗口內(nèi)外的實(shí)際發(fā)病數(shù)和理論發(fā)病數(shù)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量。統(tǒng)計(jì)學(xué)意義的評(píng)價(jià)采用蒙特卡羅法(Monte Carlo Method)。

經(jīng)典的時(shí)空掃描統(tǒng)計(jì)量基于的概率模型主要是泊松分布模型和伯努利分布模型[4],基于超幾何分布模型的時(shí)空掃描統(tǒng)計(jì)量是本文作者提出的一種新的方法[5]。該方法有著和傳統(tǒng)方法一樣的預(yù)警能力,都能給出預(yù)警信號(hào)空間范圍和時(shí)間范圍以及假設(shè)檢驗(yàn)的結(jié)果。此外,當(dāng)被預(yù)警疾病暴發(fā)發(fā)生于人口密度高,可能波及范圍大時(shí),基于超幾何分布模型的時(shí)空掃描統(tǒng)計(jì)量有更高的靈敏度與陽(yáng)性預(yù)測(cè)值[5]。目前尚未有現(xiàn)成的程序執(zhí)行該方法,也尚未有利用該方法進(jìn)行時(shí)空預(yù)警的探索。

本研究編制基于超幾何分布模型前瞻性時(shí)空掃描統(tǒng)計(jì)量的R程序,并探索其在四川省的瘧疾早期預(yù)警的應(yīng)用。

數(shù)據(jù)收集與預(yù)處理

本研究中病例數(shù)據(jù)為2009年四川省區(qū)縣級(jí)逐日瘧疾病例數(shù)據(jù),來(lái)源于國(guó)家疾病預(yù)防控制中心“全國(guó)傳染病疫情信息網(wǎng)絡(luò)直報(bào)系統(tǒng)”;人口數(shù)據(jù)為2009年四川省各區(qū)縣人口數(shù),來(lái)源于國(guó)家統(tǒng)計(jì)局;地理信息數(shù)據(jù)為四川省各區(qū)縣地理坐標(biāo),來(lái)源于中國(guó)1:400萬(wàn)電子地圖。數(shù)據(jù)清洗過(guò)程刪除不能與地理信息相匹配的病例(現(xiàn)住地址編碼不詳),得到213例病例,其中1-12月份的病例數(shù)分別為14、18、11、9、24、27、24、19、19、20、19、9例。選取其中6月21日-30日連續(xù)10天的數(shù)據(jù),進(jìn)行逐日前瞻性分析。

方 法

以2009年6月21日作為預(yù)警日期對(duì)兩種方法進(jìn)行解釋。

1.經(jīng)典方法—基于泊松分布的前瞻性時(shí)空掃描統(tǒng)計(jì)量

(1)預(yù)警過(guò)程

首先,設(shè)定好掃描窗口的最大時(shí)間半徑、最大空間半徑和基線長(zhǎng)度等關(guān)鍵參數(shù)(具體見(jiàn)下述)。由于前瞻性時(shí)空掃描統(tǒng)計(jì)量的掃描窗口存在兩個(gè)連續(xù)變化的維度,即時(shí)間維度和空間維度;其中時(shí)間半徑從0增加到預(yù)先設(shè)置的最大值,空間半徑也從0增加到預(yù)先設(shè)置的最大值,因此掃描窗口的大小、位置均處于動(dòng)態(tài)變化中,故在掃描過(guò)程中產(chǎn)生了很多掃描窗口[4,6]。

其次,對(duì)產(chǎn)生的每一個(gè)掃描窗口根據(jù)泊松分布模型構(gòu)造檢驗(yàn)統(tǒng)計(jì)量對(duì)數(shù)似然比(log likelihood ratio,LLR),用LLR來(lái)評(píng)價(jià)掃描窗口內(nèi)發(fā)病數(shù)的異常程度。

令nz為三維掃描窗口Z中的實(shí)際發(fā)病數(shù),mz為掃描窗口Z中人口數(shù),令μ(Z)為根據(jù)無(wú)效假設(shè)得到的掃描窗口Z中預(yù)期發(fā)病數(shù),令所有區(qū)域G的總發(fā)病數(shù)為nG,總?cè)丝跀?shù)為mG,預(yù)期發(fā)病數(shù)為μ(G)。似然比檢驗(yàn)統(tǒng)計(jì)量S的計(jì)算為公式(1)[4]:

其中,L(Z)是掃描窗口Z的似然函數(shù)值,L0是基于無(wú)效假設(shè)得到的似然函數(shù)值,S為所有可能的掃描窗口Z中最大的似然比。LLR=log(S)。掃描窗口Z的LLR越大表明越有可能存在聚集。選出LLR最大的窗口,該窗口為最有可能聚集信號(hào)(most likely cluster,MLC)。

最后利用蒙特卡羅法產(chǎn)生模擬數(shù)據(jù)集,對(duì)模擬數(shù)據(jù)集用跟真實(shí)數(shù)據(jù)集一樣的方法進(jìn)行計(jì)算,找出最有可能聚集信號(hào),計(jì)算P值。本研究采用9999次模擬數(shù)據(jù),對(duì)9999個(gè)模擬數(shù)據(jù)集計(jì)算最大的LLR,然后加上真實(shí)數(shù)據(jù)集的LLR進(jìn)行由小到大的排序,若真實(shí)數(shù)據(jù)集的LLR排序?yàn)榈?00位,則P=500/(9999+1)=0.05。

(2)關(guān)鍵參數(shù)及其設(shè)定

①最大時(shí)間半徑

時(shí)空掃描窗口的時(shí)間上限,也就是掃描窗口在時(shí)間維度上由零一直增加到設(shè)定的上限值。

②最大空間半徑

時(shí)空掃描窗口的空間上限,可選擇以人口比例或物理空間半徑來(lái)設(shè)置掃描空間窗口上限,經(jīng)典默認(rèn)值為50%人口。

③基線長(zhǎng)度

在逐日分析中每次分析納入發(fā)病時(shí)間當(dāng)天以及當(dāng)天之前的n天的病例作為基線數(shù)據(jù)以提供基線信息。

④6月21日所對(duì)應(yīng)的參數(shù)設(shè)置

時(shí)間半徑選擇7天,即最大時(shí)間預(yù)警長(zhǎng)度為6月 15日-21日。

空間半徑通過(guò)人口比例來(lái)設(shè)置掃描空間窗口上限,設(shè)定2009年四川省總?cè)丝跀?shù)的10%作為上限值。本研究中選擇30天作為基線長(zhǎng)度,即5月23日-6月21日,主要考慮到瘧疾潛伏期12-30日[7],30天既可提供足夠的基線,也可避免納入太多與當(dāng)前無(wú)關(guān)的信息。國(guó)內(nèi)也有研究認(rèn)為對(duì)于痢疾,將4天的病例數(shù)按1階權(quán)重取和后再進(jìn)行空間掃描統(tǒng)計(jì)量預(yù)警運(yùn)算,具有最優(yōu)的預(yù)警效果[8]。

2.新方法—基于超幾何分布的前瞻性時(shí)空掃描統(tǒng)計(jì)量

和經(jīng)典方法一樣,其目的也是探測(cè)潛在的聚集和檢驗(yàn)該聚集有無(wú)統(tǒng)計(jì)學(xué)意義。具體參數(shù)設(shè)定和掃描過(guò)程與經(jīng)典方法完全一致,但對(duì)于掃描窗口構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量不同。本法應(yīng)用了超幾何分布概率模型,即從有限總體中不放回的抽出n個(gè)樣本,成功抽出指定樣本的概率。

時(shí)空掃描統(tǒng)計(jì)量零假設(shè)是疾病在所研究區(qū)域內(nèi)是隨機(jī)分布的,也就是說(shuō)每個(gè)人都有同樣的機(jī)會(huì)發(fā)病,概率計(jì)算公式如下:

此概率越小,表明病例在窗口Z內(nèi)外隨機(jī)分布的概率越小。最有可能聚集信號(hào)的概率應(yīng)最小,

Φ與上述(2)式一致,S*為最有可能聚集信號(hào)所對(duì)應(yīng)的概率值,該聚集信號(hào)的統(tǒng)計(jì)學(xué)意義的評(píng)價(jià)仍采用蒙特卡羅法計(jì)算P值。

3.R語(yǔ)言編程實(shí)現(xiàn)及編程結(jié)果的正確性驗(yàn)證

時(shí)空掃描統(tǒng)計(jì)量的標(biāo)準(zhǔn)軟件SatScan[9]可執(zhí)行泊松概率模型的算法,但沒(méi)有基于超幾何模型的模塊,故本研究采用R語(yǔ)言編程實(shí)現(xiàn)該算法。為保證編程的準(zhǔn)確,先用R編寫基于泊松分布的算法,并和SatScan結(jié)果作比較,在二者結(jié)果一致的情況下再修改R語(yǔ)言代碼實(shí)現(xiàn)基于超幾何分布算法。這樣可保證編制的算法除了檢驗(yàn)統(tǒng)計(jì)量外,其他部分與SatScan完全一致。具體流程如圖1所示

圖1 驗(yàn)證R語(yǔ)言編程結(jié)果的正確性和可比性

結(jié) 果

1.編程結(jié)果的正確性

模擬實(shí)時(shí)監(jiān)測(cè)系統(tǒng),對(duì)四川省2009年6月21日-30日瘧疾數(shù)據(jù)進(jìn)行逐日前瞻性分析。表1是基于泊松分布和超幾何分布模型的時(shí)空掃描統(tǒng)計(jì)量預(yù)警結(jié)果,分別是使用SatScan的泊松分布模型的運(yùn)算結(jié)果、使用R編程的泊松分布模型的運(yùn)算結(jié)果和使用R編程的超幾何分布模型的運(yùn)算結(jié)果。

根據(jù)表1、2可知,三種預(yù)警結(jié)果基本一致,只是在沒(méi)有統(tǒng)計(jì)學(xué)意思(P>0.05)的預(yù)警結(jié)果存在些許差別,此處不再贅述,有統(tǒng)計(jì)學(xué)意義的預(yù)警結(jié)果(P<0.05)除了P值有微小差別之外,其余都完全一致。

2.預(yù)警結(jié)果的實(shí)際意義

綜合表1、2中給出的不同指標(biāo)可得出預(yù)警的實(shí)際意義。其中,最有可能聚集信號(hào)(MLC)表明最有可能發(fā)生聚集的窗口,相應(yīng)的次有可能聚集性信號(hào)(secondary clusters)表明發(fā)生聚集可能性相對(duì)于MLC略小的窗口。預(yù)警信號(hào)空間范圍和時(shí)間范圍表明聚集在以下空間和時(shí)間范圍發(fā)生,故在現(xiàn)實(shí)中可對(duì)該區(qū)域采取相應(yīng)的控制措施,預(yù)警信號(hào)空間范圍是用行政區(qū)劃代碼代替具體的地域(四川省各區(qū)縣);P值可以計(jì)算無(wú)效預(yù)警發(fā)生率(Null Occurrence Rate,NOR),其定義為NOR=1/P天,NOR是指假設(shè)不存在聚集性,那么出現(xiàn)虛假預(yù)警信號(hào)的時(shí)間間隔[6],例如某預(yù)警信號(hào)P=0.01,那么意味著每100天可能出現(xiàn)這樣一個(gè)虛假預(yù)警,由此可知P值越小,則NOR越大,說(shuō)明聚集性越強(qiáng);相對(duì)危險(xiǎn)度可知預(yù)警區(qū)域內(nèi)的瘧疾發(fā)病率是預(yù)警區(qū)域外發(fā)病率的倍數(shù)[9],如6月21日所對(duì)應(yīng)的MLC的相對(duì)危險(xiǎn)度值為319.13,表明在代碼510411所對(duì)應(yīng)的區(qū)縣瘧疾的發(fā)病率是其他區(qū)縣瘧疾發(fā)病率的319.13倍,6月21日-30日MLC所對(duì)應(yīng)的相對(duì)危險(xiǎn)度最大值為607.88,最小值為19.38,且在0.05水平下基本上都是有統(tǒng)計(jì)學(xué)意義的(除了6月29日和30日),當(dāng)然相對(duì)危險(xiǎn)度值大小與聚集區(qū)域內(nèi)的病例數(shù)和人口數(shù)有關(guān)。

所以結(jié)合NOR、相對(duì)危險(xiǎn)度和預(yù)警信號(hào)的空間和時(shí)間范圍可以綜合判斷疾病的聚集性,有助于政府有針對(duì)性的對(duì)該區(qū)域采取相應(yīng)的控制措施,合理分配衛(wèi)生資源,降低因傳染病暴發(fā)而造成的人生和財(cái)產(chǎn)的損失。

表1 瘧疾時(shí)空前瞻性預(yù)警最有可能聚集性信號(hào)(MLC)結(jié)果

表2 瘧疾時(shí)空前瞻性預(yù)警次有可能聚集性信號(hào)結(jié)果

討 論

本文采用R語(yǔ)言編程的方式實(shí)現(xiàn)了基于超幾何分布模型的前瞻性時(shí)空掃描統(tǒng)計(jì)量,該算法在現(xiàn)有軟件目前尚不能實(shí)現(xiàn)。由于篇幅所限且代碼較長(zhǎng),不能將R語(yǔ)言程序代碼添加在文章,可與通訊作者聯(lián)系獲取代碼。

基于不同概率模型的前瞻性時(shí)空掃描統(tǒng)計(jì)量對(duì)傳染病的預(yù)警,盡管概率分布模型不同,但都能得到時(shí)空二維的預(yù)警結(jié)果,相對(duì)于單純時(shí)間掃描統(tǒng)計(jì)量有明顯的優(yōu)勢(shì)。單純時(shí)間掃描統(tǒng)計(jì)量只能提供時(shí)間信息,即某時(shí)間內(nèi)有無(wú)聚集性存在,而時(shí)空掃描統(tǒng)計(jì)量不僅可得到有無(wú)聚集,還可得到聚集的準(zhǔn)確時(shí)間和空間,由于其充分利用了數(shù)據(jù)中的時(shí)間和空間信息,其預(yù)警結(jié)果更準(zhǔn)確、及時(shí),因此時(shí)空掃描統(tǒng)計(jì)量的預(yù)警結(jié)果更有實(shí)際意義[1,10-12]。

本文實(shí)現(xiàn)了基于超幾何分布的前瞻性時(shí)空掃描統(tǒng)計(jì)量,本方法和經(jīng)典方法有著相似的預(yù)警能力。模擬研究表明,當(dāng)被預(yù)警疾病暴發(fā)發(fā)生于人口密度高,可能波及范圍大時(shí),基于超幾何分布的前瞻性時(shí)空掃描統(tǒng)計(jì)量,預(yù)警能力強(qiáng)于經(jīng)典方法[5]。瘧疾在西南地區(qū)發(fā)病率較高[13]。因此,可考慮基于超幾何分布的前瞻性時(shí)空掃描統(tǒng)計(jì)量。此外,以上方法及結(jié)論還適用于其他傳染病的早期預(yù)警。掃描統(tǒng)計(jì)量的正確應(yīng)用除需要選擇合適的模型外,還與窗口的形態(tài),參數(shù)設(shè)置都相關(guān),這些都是未來(lái)的研究方向。

1.殷菲,李曉松,馮子健,等.基于網(wǎng)絡(luò)直報(bào)系統(tǒng)和時(shí)空聚集性探測(cè)的傳染病模擬實(shí)時(shí)監(jiān)測(cè)與預(yù)警.現(xiàn)代預(yù)防醫(yī)學(xué),2009,36(12):2204-2207.

2.Kulldorff M.Prospective time periodic geographical disease surveillance using a scan statistic.Journal of the Royal Statistical Society:Series A(Statistics in Society),2001,164(1):61-72.

3.Glaz J,Pozdnyakov V,Wallenstein S.Scan statistics:methods and applications,2009:Springer.

4.Kulldorff M.A spatial scan statistic.Communications in Statistics-Theory and methods,1997,26(6):1481-1496.

5.Zhao X,Zhou XH,F(xiàn)eng ZJ,et al.A Scan Statistic for Binary Outcome Based on Hypergeometric Probability Model,with an Application to Detecting Spatial Clusters of Japanese Encephalitis.PloS one,2013,8(6):e65419.

6.殷菲,馮子健,李曉松,等.基于前瞻性時(shí)空重排掃描統(tǒng)計(jì)量的傳染病早期預(yù)警系統(tǒng).衛(wèi)生研究,2007,36(4):455-458.

7.張賢昌,林榮幸.瘧疾防治知識(shí).華南預(yù)防醫(yī)學(xué),2007,33(3):73-76.

8.李小洲,王勁峰,廖一蘭,等.基于不同參數(shù)的空間掃描統(tǒng)計(jì)量方法在傳染病暴發(fā)探測(cè)中效果比較.中國(guó)衛(wèi)生統(tǒng)計(jì),2014,(2):236-239.

9.Kulldorff M.SaTScan user guide for version 9.0.2011.http://www. satscan.org/

10.Goldenberg A,Shmueli G,Caruana RA,et al.Early statistical detection of anthrax outbreaks by tracking over-the-counter medication sales.Proceedings of the National Academy of Sciences,2002,99(8):5237-5240.

11.Lawson AB,Cressie N.11 Spatial statistical methods for environmental epidemiology.Handbook of statistics,2000,18:357-396.

12.Rogerson PA.Monitoring point patterns for the development of spacetime clusters.Journal of the Royal Statistical Society:Series A(Statistics in Society),2001,164(1):87-96.

13.康萬(wàn)民,陳懷錄,文松,等.四川省瘧疾形勢(shì).寄生蟲(chóng)病與感染性疾病,1993,2:003.

(責(zé)任編輯:郭海強(qiáng))

The Application of Prospective Space-time Scan Statistics Based on Hypergeometric Distribution Model in the Early Warning of Malaria

Chen Fei,Li Xiaosong,F(xiàn)eng Zijian,et al.(West China School of Public Health,Sichuan University(610041),Chengdu)

ObjectiveTo investigate the application of prospective space-time scan statistic in the early warning of malaria.MethodsWe implement the R code for two prospective space-time scan statistics,based on Poisson and hypergeometric models,respectively.They were applied to the daily prospective analyses of malaria data of Sichuan province from June 21th to 30th,2009.ResultsThe prospective space-time scan statistic based on Poisson and hypergeometric models both could timely detect the outbreaks of malaria.ConclusionThe prospective space-time scan statistic based on hypergeometric distribution model has the potential value in the early warning of infectious diseases.

Early warning of infectious diseases;Malaria;Space-time scan statistic;Hypergeometric distribution model

四川大學(xué)青年教師科研啟動(dòng)基金(2015SCU11012)

1.四川大學(xué)華西公共衛(wèi)生學(xué)院流行病學(xué)與衛(wèi)生統(tǒng)計(jì)學(xué)系(610041)

2.中國(guó)疾病預(yù)防控制中心

△通信作者:趙星,E-mail:zhaoxing731@gmail.com

猜你喜歡
泊松前瞻性瘧疾
帶自由邊界的可壓縮歐拉與歐拉-泊松方程組徑向?qū)ΨQ解的爆破
基于泊松對(duì)相關(guān)的偽隨機(jī)數(shù)發(fā)生器的統(tǒng)計(jì)測(cè)試方法
一類帶有兩個(gè)參數(shù)的臨界薛定諤-泊松方程的多重解
中國(guó)榮獲世界衛(wèi)生組織頒發(fā)的“無(wú)瘧疾”認(rèn)證
形式正義的前瞻性要求:麥考密克的后果推理
3D-ASL在TIA預(yù)后的前瞻性評(píng)價(jià)中的價(jià)值研究
聯(lián)合國(guó)宣布阿爾及利亞和阿根廷根除致死性瘧疾
能迅速殺死傳播瘧疾蚊子的轉(zhuǎn)基因真菌
2019 年世界瘧疾日
——“零瘧疾從我開(kāi)始”
經(jīng)腹腔鏡Nissen與Toupet胃底折疊術(shù)治療GERD前瞻性隨機(jī)對(duì)照研究的Meta分析