饒華祥 徐莉立 蔡芝鋒 李永紅 仇麗霞
【提 要】 目的 應(yīng)用空間截面回歸模型分析影響肺結(jié)核病發(fā)病率的社會(huì)因素,探討該模型在公共衛(wèi)生領(lǐng)域的應(yīng)用價(jià)值。方法 利用OpenGeoDa軟件對(duì)青海省2013年46個(gè)縣的肺結(jié)核病發(fā)病率數(shù)據(jù)和政府醫(yī)療教育支出、農(nóng)村居民人均純收入以及人均GDP等6項(xiàng)社會(huì)指標(biāo)進(jìn)行空間截面回歸模型分析。結(jié)果 普通最小二乘法(OLS)顯示回歸殘差不獨(dú)立(Moran’s I=0.178,P<0.05),參照拉格朗日乘數(shù)(LM)判斷原則,最終選擇空間滯后模型(SLM)進(jìn)行數(shù)據(jù)分析。SLM分析結(jié)果明顯優(yōu)于OLS(R2:0.67 vs 0.57,LogL:4.14 vs-0.82,AIC:7.73 vs 15.63,SC:22.36 vs 28.43),回歸殘差獨(dú)立(Moran’s I=-0.03,P>0.05),相鄰區(qū)域的發(fā)病率存在空間外溢現(xiàn)象(ρ=0.5277),農(nóng)村居民人均純收入對(duì)發(fā)病率有影響(b=-0.0446,P=0.0051)。結(jié)論 居民收入可影響肺結(jié)核病發(fā)病率水平,空間截面回歸模型在公共衛(wèi)生領(lǐng)域具有推廣價(jià)值。
肺結(jié)核病是一種已伴隨人類歷史幾千年的慢性傳染病,素有“白色瘟疫”之稱[1]。影響肺結(jié)核病流行的因素較多,國(guó)內(nèi)外已有大量研究從個(gè)體水平上探討了細(xì)菌和宿主因素對(duì)個(gè)體發(fā)病的影響[2-5]。從群體水平來(lái)講,社會(huì)經(jīng)濟(jì)水平和醫(yī)療衛(wèi)生投入等社會(huì)因素是否影響地區(qū)肺結(jié)核病的發(fā)病水平,需借助于生態(tài)學(xué)研究。
經(jīng)濟(jì)指標(biāo)一般以貨幣為衡量標(biāo)準(zhǔn),而貨幣具有時(shí)間價(jià)值,間隔時(shí)間較長(zhǎng)的經(jīng)濟(jì)指標(biāo)其可比性較差[6],原則上選取某一橫截面數(shù)據(jù)進(jìn)行討論。此類數(shù)據(jù)具有空間自相關(guān)性、異質(zhì)性和尺度依賴性等特征,傳統(tǒng)的多元線性回歸分析略顯不足。針對(duì)橫截面數(shù)據(jù),空間滯后模型和空間誤差模型等空間截面回歸模型是比較理想的建模方法,可有效解決空間單元間數(shù)據(jù)不獨(dú)立的問(wèn)題,在公共衛(wèi)生領(lǐng)域已有所應(yīng)用[7-10]。因此,本研究運(yùn)用空間截面回歸模型分析2013年青海省肺結(jié)核病年發(fā)病率與政府人均醫(yī)療衛(wèi)生教育投入費(fèi)用、農(nóng)村居民人均純收入和人均國(guó)內(nèi)生產(chǎn)總值(GDP)等社會(huì)指標(biāo)間的定量關(guān)系,探討空間計(jì)量經(jīng)濟(jì)模型和傳統(tǒng)分析方法在生態(tài)學(xué)研究方面的優(yōu)劣性和其在公共衛(wèi)生領(lǐng)域的推廣應(yīng)用價(jià)值。
1.資料來(lái)源
本研究資料包括兩方面:一是可能影響肺結(jié)核病發(fā)病率的社會(huì)因素資料(自變量),參照相關(guān)文獻(xiàn)報(bào)道和統(tǒng)計(jì)年鑒所能獲得資料的權(quán)限,選取了政府醫(yī)療衛(wèi)生支出、教育支出(千元/人)、醫(yī)療機(jī)構(gòu)床位數(shù)(張/千人)、醫(yī)療機(jī)構(gòu)人員配備情況(人/千人)、農(nóng)村居民人均純收入(千元)以及人均GDP(萬(wàn)元)等6項(xiàng)社會(huì)指標(biāo),來(lái)源于《青海省統(tǒng)計(jì)年鑒》(2014年)。二是青海省2013年46個(gè)縣的肺結(jié)核病年發(fā)病率資料(應(yīng)變量),來(lái)源于中國(guó)疾病預(yù)防控制信息系統(tǒng)(http://1.202.129.170/UVSSERVER2.0)。
2.分析方法
(1)數(shù)據(jù)準(zhǔn)備
以行政區(qū)劃代碼為連接字段,在ArcGIS軟件中將2013年各縣肺結(jié)核病發(fā)病率數(shù)據(jù)以及政府醫(yī)療衛(wèi)生支出、教育支出、醫(yī)療機(jī)構(gòu)床位數(shù)、醫(yī)療機(jī)構(gòu)人員配備情況、農(nóng)村居民人均純收入以及人均GDP等社會(huì)指標(biāo)數(shù)據(jù)與青海省縣級(jí)地理數(shù)據(jù)庫(kù)(*.shp格式)建立連接,導(dǎo)出的電子地圖數(shù)據(jù)庫(kù)即為本研究所需的地理信息系統(tǒng)數(shù)據(jù)庫(kù)。本研究所需空間權(quán)重矩陣采用基于一階Rook準(zhǔn)則構(gòu)建的行標(biāo)化空間權(quán)重矩陣。
(2)空間截面回歸模型
空間計(jì)量經(jīng)濟(jì)學(xué)理論認(rèn)為一個(gè)地區(qū)空間單元上的某種現(xiàn)象或某一屬性值與鄰近地區(qū)空間單元上同一現(xiàn)象或?qū)傩灾凳窍嚓P(guān)的,空間依賴的存在打破了經(jīng)典統(tǒng)計(jì)分析中研究對(duì)象相互獨(dú)立的基本假設(shè),采用普通最小二乘法(OLS)進(jìn)行模型估計(jì)存在明顯的局限性,可能使模型設(shè)定出現(xiàn)偏差,進(jìn)而導(dǎo)致研究結(jié)果和推論不夠完整,甚至錯(cuò)誤??臻g截面回歸模型主要解決基于空間截面數(shù)據(jù)分析時(shí)回歸模型中復(fù)雜的空間相互作用與空間依存性結(jié)構(gòu)問(wèn)題。其分析思路是首先采用Moran’sI檢驗(yàn)應(yīng)變量是否存在空間自相關(guān)性,如果存在空間自相關(guān)性,則采用空間截面回歸模型分析,反之,則采用傳統(tǒng)多元線性回歸模型分析?,F(xiàn)對(duì)兩種主要的空間截面回歸模型簡(jiǎn)要介紹如下[8,10-12]。
①空間滯后模型(SLM)
在空間滯后模型中,空間相關(guān)在回歸模型右邊加以考慮,即在模型中引入空間滯后因子(WY)作為解釋變量,因其與時(shí)間序列分析中的自回歸類似,所以又稱為空間自回歸模型,包含其他解釋變量的混合空間自回歸模型表達(dá)式為:Y=ρWY+Xβ+ε,式中Y為N×1維應(yīng)變量向量,X為包含K個(gè)解釋變量的N×K維向量,WY為空間滯后因子,ε為N×1維隨機(jī)誤差向量,W為N×N維空間權(quán)重矩陣,β為解釋變量系數(shù),反映了自變量X對(duì)應(yīng)變量Y的影響,ρ為空間自相關(guān)系數(shù),反映了研究對(duì)象的空間依賴作用,即相鄰區(qū)域的發(fā)病率對(duì)本地區(qū)發(fā)病率的影響方向和程度。在該模型中由于出現(xiàn)變量?jī)?nèi)生性問(wèn)題,OLS估計(jì)將不再適合。
②空間誤差模型(SEM)
在空間誤差模型中,空間相關(guān)性的存在不影響回歸模型的結(jié)構(gòu),模型表達(dá)式為:Y=Xβ+ε,ε=λWε+ξ,式中ε為隨機(jī)誤差項(xiàng)向量,λ為空間自相關(guān)系數(shù),Wε為空間滯后誤差項(xiàng),ξ為空間誤差模型的誤差項(xiàng)。由于SEM模型與時(shí)間序列中的序列相關(guān)問(wèn)題類似,也被稱為空間自相關(guān)模型。參數(shù)λ衡量了樣本觀察值中的空間依賴作用,即相鄰區(qū)域的被解釋變量對(duì)本地區(qū)觀察值的影響方向和程度,參數(shù)β反映了自變量X對(duì)應(yīng)變量Y的影響。SEM 的空間依賴作用存在于擾動(dòng)誤差項(xiàng)中,度量了鄰近地區(qū)關(guān)于應(yīng)變量的誤差沖擊對(duì)本地區(qū)觀察值的影響程度。在該模型中不存在解釋變量與誤差項(xiàng)的相關(guān)問(wèn)題,但因誤差項(xiàng)ε各觀測(cè)單元之間存在相關(guān)性,此時(shí)OLS估計(jì)是無(wú)效的。
③參數(shù)估計(jì)及模型選擇
本研究中采用Anselin建議的極大似然法估計(jì)SLM和SEM的參數(shù),通過(guò)Moran’sI檢驗(yàn)、兩個(gè)拉格朗日乘數(shù)(Lagrange Multiplier)形式LMERR、LMLAG及其穩(wěn)健的R-LMERR、R-LMLAG等來(lái)實(shí)現(xiàn)模型選擇,參照?qǐng)D1的分析思路展開(kāi)分析。通過(guò)自然對(duì)數(shù)似然函數(shù)值(LogL)、赤池信息準(zhǔn)則(AIC),施瓦茨準(zhǔn)則(SC)等指標(biāo)來(lái)對(duì)比模型的擬合效果,LogL值越大,AIC和SC值越小,模型擬合效果越好。
圖1 空間截面數(shù)據(jù)回歸分析流程圖
3.統(tǒng)計(jì)分析
社會(huì)指標(biāo)和發(fā)病率的統(tǒng)計(jì)描述在SPSS 22.0中完成,地理信息數(shù)據(jù)庫(kù)的建立在ArcGIS10.2中生成,空間截面回歸分析在OpenGeoDa軟件中完成,檢驗(yàn)水準(zhǔn)α=0.05。
1.肺結(jié)核病發(fā)病率及社會(huì)因素一般概況
2013年青海省共報(bào)告肺結(jié)核病例6055例,報(bào)告發(fā)病率為105.64/10萬(wàn)。對(duì)發(fā)病率和各項(xiàng)社會(huì)指標(biāo)進(jìn)行統(tǒng)計(jì)描述,結(jié)果見(jiàn)表1。繪制發(fā)病率可視化地圖和三維趨勢(shì)圖(圖2),結(jié)果顯示高發(fā)病率地區(qū)主要集中在青海省西南部的玉樹(shù)州和果洛州,發(fā)病率較低的地區(qū)主要集中在東部的西寧市及其周邊地區(qū)以及西北部的海西州。南北方向呈北低南高的弧形變化趨勢(shì),東西方向呈明顯的中間高兩邊低的倒“U”型。三維趨勢(shì)分析結(jié)果與發(fā)病率地區(qū)分布圖相吻合,提示青海省肺結(jié)核病存在明顯的區(qū)域聚集性,并非均勻隨機(jī)分布。
表1 2013年青海省肺結(jié)核發(fā)病率及各項(xiàng)社會(huì)指標(biāo)概況
圖2 2013年青海省肺結(jié)核病發(fā)病率可視化地圖和三維趨勢(shì)分析圖
2.肺結(jié)核病發(fā)病率相關(guān)社會(huì)因素回歸分析
(1)數(shù)據(jù)轉(zhuǎn)換
對(duì)發(fā)病率數(shù)據(jù)進(jìn)行Shapiro-Wilk正態(tài)性檢驗(yàn),W統(tǒng)計(jì)量為0.796,P<0.001,不服從正態(tài)分布。對(duì)發(fā)病率資料進(jìn)行以10為底的對(duì)數(shù)轉(zhuǎn)換后,W統(tǒng)計(jì)量為0.980,P=0.621,服從正態(tài)分布。因此,采用以10為底的對(duì)數(shù)轉(zhuǎn)換后的發(fā)病率數(shù)據(jù)為應(yīng)變量,進(jìn)行影響因素回歸分析。
(2)基于普通最小二乘法的分析
以經(jīng)對(duì)數(shù)轉(zhuǎn)換后的發(fā)病率與同期政府醫(yī)療衛(wèi)生支出和教育支出等6項(xiàng)社會(huì)指標(biāo)進(jìn)行OLS擬合。首先對(duì)各自變量進(jìn)行多重共線性判定,按照Anselin提出的判定原則,即如果多重共線性的值超過(guò)30,則說(shuō)明回歸模型中自變量存在多重共線性問(wèn)題,本研究顯示該值為14.32,說(shuō)明各自變量間不存在共線性問(wèn)題。分析結(jié)果顯示R2=0.57,LogL=-0.82,AIC=15.63,SC=28.43,除農(nóng)村居民人均純收入有統(tǒng)計(jì)學(xué)意義外,其余各指標(biāo)均無(wú)統(tǒng)計(jì)學(xué)意義(表2)。殘差Moran’sI=0.178,P<0.05,說(shuō)明回歸殘差不獨(dú)立,該資料不適合用OLS進(jìn)行擬合。參照空間截面回歸模型選擇原則,LMLAG和Robust-LMLAG均有統(tǒng)計(jì)學(xué)意義,而LMERR和Robust-LMERR無(wú)統(tǒng)計(jì)學(xué)意義,最終應(yīng)選用引入空間自相關(guān)性的空間滯后模型來(lái)定量分析各指標(biāo)對(duì)發(fā)病率的影響。
(3)基于空間截面回歸模型的分析
采用基于極大似然估計(jì)法的空間滯后模型進(jìn)行回歸擬合,結(jié)果顯示R2=0.67,LogL=4.14,比普通線性回歸模型有所提高,AIC=7.73,SC=22.36,低于普通線性回歸模型,殘差Moran’sI=-0.03,P>0.05,回歸殘差獨(dú)立,說(shuō)明模型中空間滯后應(yīng)變量的引入可較好地解釋地區(qū)間肺結(jié)核病發(fā)病率的空間相關(guān)性,該模型優(yōu)于傳統(tǒng)多元線性回歸模型(表3)。ρ=0.5277,說(shuō)明相鄰區(qū)域的發(fā)病率存在空間外溢現(xiàn)象,即在其他影響因素固定不變的情況下,相鄰地區(qū)肺結(jié)核病年發(fā)病率每增加9倍,本地區(qū)肺結(jié)核病年發(fā)病率將增加(100.5277-1)倍,即2.37倍。對(duì)6項(xiàng)社會(huì)指標(biāo)進(jìn)行分析,僅農(nóng)村居民人均純收入有統(tǒng)計(jì)學(xué)意義,b=-0.0446,相比傳統(tǒng)回歸模型其絕對(duì)值有所下降,說(shuō)明原有貢獻(xiàn)中有一部分是來(lái)自于相鄰區(qū)域的影響,可解釋為在其他影響因素固定不變的情況下,農(nóng)村居民人均純收入每增加1千元,本地區(qū)肺結(jié)核病年發(fā)病率將是現(xiàn)有發(fā)病率的10-0.0446倍,即0.90倍(發(fā)病率降低10%)。
表2 2013年青海省肺結(jié)核病發(fā)病率與社會(huì)因素普通最小二乘法回歸分析結(jié)果
表3 2013年青海省肺結(jié)核病發(fā)病率與社會(huì)因素極大似然估計(jì)回歸分析結(jié)果
據(jù)統(tǒng)計(jì),80%的流行病學(xué)資料具有空間屬性,傳染病亦是如此。伴隨空間流行病學(xué)的發(fā)展,空間統(tǒng)計(jì)分析方法逐漸成為傳染病監(jiān)測(cè)數(shù)據(jù)研究的熱點(diǎn)[12]。本研究采用空間計(jì)量經(jīng)濟(jì)模型對(duì)可能影響肺結(jié)核病的社會(huì)因素進(jìn)行生態(tài)學(xué)研究,為疾病防控和政府醫(yī)療衛(wèi)生投入提供有針對(duì)性的建議。實(shí)證研究證明,傳統(tǒng)回歸模型由于沒(méi)有考慮變量間的空間屬性,回歸殘差存在較強(qiáng)的空間自相關(guān)性,參數(shù)估計(jì)結(jié)果有偏。參照空間截面回歸模型選擇原則,最終選擇引入空間自相關(guān)性的空間滯后回歸模型來(lái)定量分析各指標(biāo)與發(fā)病率間的關(guān)系,在校正了應(yīng)變量的空間自相關(guān)性后,自變量(農(nóng)村居民人均純收入)的回歸系數(shù)絕對(duì)值相比傳統(tǒng)模型有所下降,說(shuō)明原有貢獻(xiàn)中有一部分是來(lái)自于相鄰區(qū)域的影響,這和以往他人研究結(jié)論一致[13-14]。
就研究結(jié)果而言,社會(huì)經(jīng)濟(jì)水平低下是結(jié)核病發(fā)病的重要危險(xiǎn)因素,經(jīng)濟(jì)狀況低下地區(qū)的結(jié)核病發(fā)病率往往較高,國(guó)內(nèi)外文獻(xiàn)多有報(bào)道[15-16]。我國(guó)結(jié)核病疫情地區(qū)間差異較大,西部地區(qū)的結(jié)核病疫情十分嚴(yán)重,2010年第五次全國(guó)結(jié)核病流行病學(xué)抽樣調(diào)查顯示西部地區(qū)活動(dòng)性肺結(jié)核病患病率最高,為東部地區(qū)的2.39倍、中部地區(qū)的1.50倍[17]。本研究農(nóng)村居民人均純收入是影響發(fā)病率的主要社會(huì)因素,二者呈負(fù)相關(guān),與王仲君等的文獻(xiàn)報(bào)道相符[18]。該指標(biāo)反映的是廣大農(nóng)牧民的整體生活水平和生存環(huán)境,收入水平低下,其生存環(huán)境必定堪憂,健康狀況難以得到保障,直接影響肺結(jié)核的發(fā)病。家庭經(jīng)濟(jì)條件差仍是肺結(jié)核發(fā)病的一個(gè)重要危險(xiǎn)因素,也是導(dǎo)致病患診治延誤和治療依從性差的重要原因。同時(shí),肺結(jié)核病患沉重的醫(yī)療負(fù)擔(dān)和勞動(dòng)力喪失,會(huì)給家庭帶來(lái)嚴(yán)重的經(jīng)濟(jì)損失。由于貧困導(dǎo)致患病,而患病又將進(jìn)一步加重貧困,如此惡性循環(huán),嚴(yán)重影響結(jié)核病的防治。作為肺結(jié)核病的重要危險(xiǎn)因素,大力發(fā)展經(jīng)濟(jì),提高居民收入水平,特別是農(nóng)牧民的收入水平,將有助于改善脆弱人群的生存狀態(tài),降低其患病風(fēng)險(xiǎn)。
綜上所述,本研究采用空間截面回歸模型在生態(tài)學(xué)層面探討了影響地區(qū)肺結(jié)核病發(fā)病率的主要社會(huì)因素。本研究證實(shí)空間截面回歸模型相比傳統(tǒng)回歸分析在生態(tài)學(xué)研究方面具有明顯的優(yōu)勢(shì),應(yīng)在公共衛(wèi)生領(lǐng)域相關(guān)研究中發(fā)揮其應(yīng)用價(jià)值。
中國(guó)衛(wèi)生統(tǒng)計(jì)2018年5期