尹哲 賀湘焱 李奇鳳 劉亞潔 張燕 李德洋 加依娜·拉茲別克 古麗娜扎爾·艾克拜爾 曹明芹
結(jié)核病傳播具有空間聚集性分布的特點(diǎn),在經(jīng)濟(jì)“邊緣化和脆弱地區(qū)”高發(fā),根據(jù)全國(guó)第五次結(jié)核病流行病學(xué)抽樣調(diào)查,西部地區(qū)涂陽(yáng)肺結(jié)核患病率是中部地區(qū)的1.7倍,是東部地區(qū)的2.4倍[1]。新疆維吾爾自治區(qū)(簡(jiǎn)稱“新疆”)地處我國(guó)西北部,經(jīng)濟(jì)發(fā)展相對(duì)落后,加之衛(wèi)生資源稀缺等因素造成基礎(chǔ)疫情嚴(yán)重,防治困難,年平均涂陽(yáng)肺結(jié)核登記率為39.31/10萬[2],是我國(guó)結(jié)核病發(fā)病比較嚴(yán)重的地區(qū)之一[3]。
伴隨著空間流行病學(xué)理論、技術(shù)的快速發(fā)展,地理信息系統(tǒng)(geographical information system,GIS)和空間分析軟件應(yīng)用日益廣泛,利用地理統(tǒng)計(jì)學(xué)的知識(shí)從空間角度揭示結(jié)核病的分布與傳播規(guī)律,已經(jīng)成為廣大科研工作者熱衷研究的方向。克里金插值法通過變異函數(shù)來研究具有空間相關(guān)性和依賴性的地理分布現(xiàn)象,主要應(yīng)用于采礦業(yè)、農(nóng)業(yè)、地質(zhì)等領(lǐng)域,隨著地質(zhì)統(tǒng)計(jì)學(xué)理論的不斷成熟,應(yīng)用范圍持續(xù)擴(kuò)展[4-5]。
本研究在2011—2015年新疆涂陽(yáng)肺結(jié)核發(fā)病風(fēng)險(xiǎn)時(shí)空分布探索的基礎(chǔ)上,根據(jù)克里金插值方法最優(yōu)無偏的特點(diǎn),采用普通克里金法和經(jīng)驗(yàn)貝葉斯克里金法建立模型,探索涂陽(yáng)肺結(jié)核發(fā)病風(fēng)險(xiǎn)時(shí)空分布的相關(guān)性和變異性,評(píng)估新疆不同地區(qū)肺結(jié)核疫情。
一、資料來源
2011—2015年新疆肺結(jié)核發(fā)病報(bào)告數(shù)據(jù)來自《中國(guó)疾病預(yù)防控制信息系統(tǒng)》的子系統(tǒng)《傳染病報(bào)告信息管理系統(tǒng)》。2011—2015年新疆涂陽(yáng)肺結(jié)核報(bào)告發(fā)病例數(shù)分別為11 813、14 059、11 149、10 483、10 196例,5年間共計(jì)57 700例。各年份區(qū)(縣)人口數(shù)據(jù)來自新疆統(tǒng)計(jì)年鑒。省級(jí)行政區(qū)域電子地圖(1∶10萬)從國(guó)家基礎(chǔ)地理信息系統(tǒng)獲取,各區(qū)(縣)的經(jīng)緯度數(shù)據(jù)由Google earth獲取,以2011年為標(biāo)準(zhǔn)。
二、分析方法
1. 涂陽(yáng)肺結(jié)核標(biāo)準(zhǔn)化發(fā)病比(standardized morbidity ratio,SMR)估算:2011—2015年新疆結(jié)核病發(fā)病數(shù)和發(fā)病率數(shù)據(jù)資料經(jīng)整理、計(jì)算,構(gòu)建各區(qū)(縣)涂陽(yáng)肺結(jié)核SMR數(shù)據(jù)庫(kù)。以各區(qū)(縣)年度報(bào)告的全疆人口構(gòu)成和涂陽(yáng)肺結(jié)核發(fā)病率作為標(biāo)準(zhǔn),計(jì)算各個(gè)區(qū)(縣)涂陽(yáng)肺結(jié)核SMR,公式如下:
公式(1)[6]
其中,yij表示i區(qū)(縣)(1≤i≤98)在第j年(2011≤j≤2015)的涂陽(yáng)肺結(jié)核報(bào)告例數(shù),Eij表示i區(qū)(縣)在第j年的期望報(bào)告例數(shù),由當(dāng)?shù)厝丝跀?shù)乘以全疆第j年的涂陽(yáng)肺結(jié)核報(bào)告率得到。
2. 空間自相關(guān)分析:采用全局莫蘭指數(shù)(MoranI)值反映空間自相關(guān)關(guān)系,公式如下:
公式(2)[7]
其中,zi是第i個(gè)區(qū)(縣)肺結(jié)核SMR與其平均值的偏差,wij是i和j之間的空間連接矩陣,n是要素總數(shù),即觀測(cè)區(qū)域數(shù)等于98,S0是98個(gè)區(qū)(縣)空間權(quán)重的聚合。MoranI取值范圍為-1~1,MoranI值越趨近1,代表肺結(jié)核SMR呈聚集分布;MoranI值越趨近-1,代表肺結(jié)核發(fā)病率分布具有負(fù)相關(guān)性;MoranI值為零,表明整體呈隨機(jī)分布。假設(shè)檢驗(yàn)使用Z-score得分,檢驗(yàn)水準(zhǔn)α=0.05;Z>1.96或<-1.96時(shí),α<0.05。
3. 克里金法:普通克里金法可對(duì)周圍的測(cè)量值進(jìn)行加權(quán)以得出未測(cè)量位置的一個(gè)線性估計(jì)預(yù)測(cè)系統(tǒng),適用于區(qū)域化變量存在空間相關(guān)性的情況,能夠給出估計(jì)誤差,充分考慮空間變量相關(guān)性,有效彌補(bǔ)數(shù)據(jù)集存在的聚類影響,插值精度高。公式如下:
公式(3)[8]
其中,Z(Si) 是第i個(gè)位置處的實(shí)際涂陽(yáng)肺結(jié)核SMR,λi是第i個(gè)位置處的未知權(quán)重,S0是預(yù)估點(diǎn),N是測(cè)量點(diǎn)數(shù)。在普通克里金法中,權(quán)重λi取決于涂陽(yáng)肺結(jié)核SMR實(shí)際點(diǎn)與待測(cè)點(diǎn)位置的距離,以及待測(cè)點(diǎn)周圍的實(shí)際涂陽(yáng)肺結(jié)核SMR之間空間關(guān)系的擬合模型。
經(jīng)驗(yàn)貝葉斯克里金法是地質(zhì)統(tǒng)計(jì)學(xué)建模技術(shù)之一。它與其他克里金模型不同之處在于其使用內(nèi)在隨機(jī)函數(shù)進(jìn)行空間插值。除了考慮半變異函數(shù)模型基本參數(shù)的不確定性之外,可以快速擬合許多理論半變異函數(shù)模型[9],從中選擇合適的理論模型進(jìn)行最優(yōu)擬合。根據(jù){z(xi);i=1,2,…,N}已知觀測(cè)點(diǎn)實(shí)際涂陽(yáng)肺結(jié)核SMR,進(jìn)一步求得未知測(cè)量點(diǎn)x0(x0∈D)處的貝葉斯克里金估計(jì)值,即:
公式(4)[10]
采用均方根誤差(root mean squared error,RMSE)來評(píng)價(jià)兩種模型的擬合效果,表示實(shí)際值與模型估計(jì)值之間的平均距離,RMSE值越小,誤差越小,模型效果越好。
三、統(tǒng)計(jì)學(xué)處理
采用Excel 2010軟件對(duì)2011—2015年新疆肺結(jié)核發(fā)病報(bào)告數(shù)據(jù)進(jìn)行整理。通過SPSS 25.0軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。使用ArcGIS 10.2軟件實(shí)現(xiàn)空間分布圖、全局相關(guān)性分析、克里金插值分析及其結(jié)果的可視化。采用均方根誤差評(píng)價(jià)兩種模型的擬合效果。檢驗(yàn)水準(zhǔn)均為α=0.05。
一、2011—2015年新疆涂陽(yáng)肺結(jié)核報(bào)告SMR時(shí)空分布格局
2011—2015年新疆涂陽(yáng)肺結(jié)核SMR較高的地區(qū)主要分布于南疆的喀什、和田、阿克蘇3個(gè)地區(qū),具體表現(xiàn)在英吉沙縣、澤普縣、于田縣、民豐縣、洛浦縣等13個(gè)區(qū)(縣),見表1。從空間上看,涂陽(yáng)肺結(jié)核SMR水平存在從南向北逐漸降低的趨勢(shì),南疆SMR水平一直居高不下,北疆、東疆的SMR處于較低水平。5年間,各地區(qū)涂陽(yáng)肺結(jié)核SMR均呈現(xiàn)小幅波動(dòng)、整體下降的趨勢(shì)。南疆涂陽(yáng)肺結(jié)核SMR水平較為平穩(wěn),但遠(yuǎn)高于北疆和東疆,在高位上下波動(dòng)。北疆和東疆始終保持在較低水平,以SMR水平降低為主要趨勢(shì),2015年呈現(xiàn)較為明顯的升高趨勢(shì),見圖1~5。
二、涂陽(yáng)肺結(jié)核SMR全局自相關(guān)分析
利用全局MoranI指數(shù)對(duì)2011—2015年新疆區(qū)(縣)涂陽(yáng)肺結(jié)核疫情進(jìn)行全局空間自相關(guān)分析。結(jié)果顯示,各年度全疆涂陽(yáng)肺結(jié)核SMR分布存在空間正相關(guān)關(guān)系,且差異有統(tǒng)計(jì)學(xué)意義(MoranI值均>0,P值均<0.001)。其中,整體表現(xiàn)出的聚集性在2013年最高(MoranI=0.376),在2014年最低(MoranI=0.248),詳見表2。
三、克里金插值模型構(gòu)建涂陽(yáng)肺結(jié)核SMR分布格局
對(duì)2011—2015年新疆涂陽(yáng)肺結(jié)核SMR數(shù)據(jù)庫(kù)進(jìn)行空間探索分析,變異云圖提示數(shù)據(jù)存在空間相關(guān)性,可以進(jìn)行插值分析。分別建立普通克里金和經(jīng)驗(yàn)貝葉斯克里金模型,生成新疆涂陽(yáng)肺結(jié)核發(fā)病SMR的克里金估計(jì)圖。交叉驗(yàn)證比較,2011—2015年普通克里金模型RMSE范圍在0.379~0.522,經(jīng)驗(yàn)貝葉斯克里金模型RMSE范圍在0.382~0.484,兩種模型擬合度較高。與新疆涂陽(yáng)肺結(jié)核SMR分布圖比較,符合實(shí)際分布規(guī)律,且更為直觀地表現(xiàn)出SMR在空間地理維度上的變化趨勢(shì),提示涂陽(yáng)肺結(jié)核SMR在新疆南部較高,北部較低,中部介于二者之間,南北疆之間存在一個(gè)較為明顯的分隔帶,走向基本與天山山脈走向一致,見圖6~15。
表1 2011—2015年新疆肺結(jié)核SMR的分布
表2 2011—2015年新疆涂陽(yáng)肺結(jié)核SMR全局
一、新疆涂陽(yáng)肺結(jié)核SMR時(shí)空格局的探討
本研究對(duì)2011—2015年新疆98個(gè)區(qū)(縣)涂陽(yáng)肺結(jié)核SMR進(jìn)行分析,以區(qū)(縣)級(jí)為尺度,為新疆尋找更有針對(duì)性的肺結(jié)核精準(zhǔn)防控地區(qū)。全局自相關(guān)分析結(jié)果提示,涂陽(yáng)肺結(jié)核SMR分布非隨機(jī),具有較強(qiáng)的地區(qū)變化規(guī)律。由北向南、由東向西SMR逐漸增高,呈階梯式分布。涂陽(yáng)肺結(jié)核發(fā)病高SMR地區(qū)主要分布在南疆的喀什、和田、阿克蘇3個(gè)地區(qū),具體表現(xiàn)在英吉沙縣、澤普縣、于田縣等10余個(gè)區(qū)(縣)。5年間,新疆涂陽(yáng)肺結(jié)核SMR平均值在0.9~2.0之間上下波動(dòng),2011—2014年在波動(dòng)中持續(xù)下降,2015年有小幅上漲。從宏觀上看,新疆SMR整體呈現(xiàn)一個(gè)好轉(zhuǎn)的趨勢(shì),高SMR地區(qū)范圍逐漸縮小,符合新疆結(jié)核病發(fā)展分布趨勢(shì)。但新疆肺結(jié)核防控工作任務(wù)仍然十分艱巨,需要進(jìn)一步強(qiáng)化和完善各項(xiàng)防治政策,落實(shí)各項(xiàng)防治措施。
圖1~5 2011—2015年新疆涂陽(yáng)肺結(jié)核SMR時(shí)空分布
圖6~10 2011—2015年新疆涂陽(yáng)肺結(jié)核SMR普通克里金估計(jì)值
圖11~15 2011—2015年新疆涂陽(yáng)肺結(jié)核SMR經(jīng)驗(yàn)貝葉斯克里金估計(jì)值
二、克里金插值在估計(jì)疾病風(fēng)險(xiǎn)中的應(yīng)用價(jià)值
克里金插值法可對(duì)所研究的對(duì)象提供一種最佳線性無偏估計(jì),利用半方差函數(shù)圖將統(tǒng)計(jì)相關(guān)性的強(qiáng)度作為距離函數(shù)來測(cè)量。本研究用涂陽(yáng)肺結(jié)核SMR數(shù)據(jù)庫(kù)分別建立普通克里金和經(jīng)驗(yàn)貝葉斯克里金模型。建模發(fā)現(xiàn)SMR分布與實(shí)際分布基本一致,誤差服從正態(tài)分布,估計(jì)圖、誤差圖均提示兩個(gè)模型擬合度較為理想。進(jìn)行交叉驗(yàn)證比較,采用均方根誤差指標(biāo)評(píng)價(jià)兩模型擬合度,從估計(jì)值和真實(shí)值的離散程度上來說,經(jīng)驗(yàn)貝葉斯克里金法(RMSE范圍在0.382~0.484)略優(yōu)于普通克里金法(RMSE范圍在0.379~0.522),擬合度更加符合實(shí)際分布。
克里金插值估計(jì)圖可直觀展現(xiàn)新疆涂陽(yáng)肺結(jié)核SMR階梯式變化,兩模型均提示在北疆與南疆之間存在一條與天山山脈走向較為相似的分隔帶。天山山脈將新疆分為南北兩大部分,南、北疆在海拔、氣候、經(jīng)濟(jì)、衛(wèi)生等方面差異明顯。南疆地區(qū)全年降水量一般不足100 mm,遠(yuǎn)低于北疆,且沙漠化現(xiàn)象嚴(yán)重[11]。西部大開發(fā)以來,隨著新亞歐大陸橋的開通,北疆經(jīng)濟(jì)迅猛發(fā)展,南北疆經(jīng)濟(jì)差距不斷擴(kuò)大,“十二五”期間,天山北坡經(jīng)濟(jì)帶建立,作為我國(guó)14個(gè)重點(diǎn)開發(fā)區(qū)之一,一直是新疆的重點(diǎn)開發(fā)區(qū),是新疆經(jīng)濟(jì)實(shí)力最強(qiáng)、城鎮(zhèn)最集中分布的區(qū)域,這也進(jìn)一步擴(kuò)大了地區(qū)經(jīng)濟(jì)差異[12]。研究表明,環(huán)境因素、經(jīng)濟(jì)因素對(duì)結(jié)核病的發(fā)生發(fā)展有著實(shí)質(zhì)性影響,國(guó)內(nèi)外肺結(jié)核疫情報(bào)告中多有報(bào)道,經(jīng)濟(jì)水平低下地區(qū)、自然條件惡劣地區(qū)的結(jié)核病的發(fā)病率較高[13]。
克里金插值作為一種局部估計(jì)方法,對(duì)估計(jì)值的整體空間相關(guān)性考慮不夠,其能保證數(shù)據(jù)的估計(jì)局部最優(yōu),卻不能保證數(shù)據(jù)的總體最優(yōu),因?yàn)榭死锝鸸乐档姆讲畋仍紨?shù)據(jù)的方差要小。因此,當(dāng)數(shù)據(jù)點(diǎn)較少且分布不均時(shí)可能會(huì)出現(xiàn)較大的估計(jì)誤差。此外克里金插值法作為內(nèi)插方法,為減小估計(jì)方差而對(duì)真實(shí)觀測(cè)數(shù)據(jù)的離散性進(jìn)行了平滑處理,雖然可以得到由于平滑而更美觀的等值線圖,但一些有意義的異常帶也可能被平滑作用而平滑掉[14]。在本研究的數(shù)據(jù)上也有體現(xiàn),具體表現(xiàn)為經(jīng)過克里金處理后,新疆涂陽(yáng)肺結(jié)核SMR的估計(jì)值跟實(shí)際值比較起來有較為明顯的下降,波動(dòng)范圍縮小。但克里金法通過有限的離散點(diǎn)數(shù)據(jù),研究了整個(gè)區(qū)域的分布特征,直觀地反映了變量的空間結(jié)構(gòu)性;并初步提供了未來新疆地區(qū)結(jié)核病防范的重點(diǎn)區(qū)域,為及時(shí)調(diào)整或完善防控措施提供線索和依據(jù),對(duì)未來新疆結(jié)核病的防治有著重要意義。