首都醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(100069)
胥 芹 王 超 潘 蕾 曹 凱 劉 龍 郭秀花△
·論著·
廣義相加模型在北京市PM2.5與救護(hù)車出車次數(shù)關(guān)聯(lián)性研究中的應(yīng)用
首都醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(100069)
胥 芹 王 超 潘 蕾 曹 凱 劉 龍 郭秀花△
目的 探討北京市每日PM2.5濃度變化與救護(hù)車出車次數(shù)的關(guān)聯(lián)性。方法 應(yīng)用廣義相加模型,在控制多種可能混雜因素的基礎(chǔ)上,分析北京市2012年10月8日至2012年12月31日PM2.5污染當(dāng)天(lag 0)至滯后第7天(lag 7)PM2.5對(duì)救護(hù)車出車次數(shù)的影響。結(jié)果 模型擬合結(jié)果顯示PM2.5對(duì)滯后第4天救護(hù)車出車次數(shù)的影響有統(tǒng)計(jì)學(xué)意義(Z=2.461,P=0.0139),PM2.5每增加50 μg/m3,救護(hù)車出車次數(shù)增加的相對(duì)危險(xiǎn)度為1.028(95%CI1.006~1.050)。結(jié)論 北京市PM2.5濃度的增加對(duì)救護(hù)車出車次數(shù)的增加有影響,廣義相加模型應(yīng)用靈活性較強(qiáng)。
PM2.5污染 救護(hù)車出車次數(shù) 廣義相加模型 時(shí)間序列
Hastie 和 Tibshirani于1990 年在廣義線性模型和加性模型的基礎(chǔ)上提出廣義相加模型(generalized additive model,GAM)后,模型在各個(gè)領(lǐng)域得到了廣泛地應(yīng)用[1-2],近年來,由于其在控制時(shí)間的長(zhǎng)期變化趨勢(shì)和季節(jié)性趨勢(shì)、氣象因素等混雜因素時(shí)有較好的作用,已經(jīng)被廣泛應(yīng)用于評(píng)價(jià)大氣污染短期暴露的急性健康效應(yīng)[3-4]。目前,有很多研究者借助于居民死亡統(tǒng)計(jì)數(shù)據(jù)、醫(yī)院門急診數(shù)據(jù)研究PM2.5的人群健康效應(yīng),結(jié)果表明PM2.5與人群全死因死亡、與心血管疾病和呼吸系統(tǒng)疾病的急性發(fā)作和死亡都有較大的相關(guān)性[5-7],救護(hù)車出車情況能相對(duì)及時(shí)和敏銳地反映人群健康狀況的變化,因此能較好地體現(xiàn)出PM2.5對(duì)人群健康的影響,而對(duì)于PM2.5與救護(hù)車出車次數(shù)的關(guān)聯(lián)性研究還未見報(bào)道。近兩年北京市PM2.5的污染尤為嚴(yán)重,本研究選擇北京市作為研究現(xiàn)場(chǎng),應(yīng)用廣義相加模型來分析北京市2012年10月8日至2012年12月31日每日PM2.5濃度變化和救護(hù)車出車次數(shù)的相關(guān)關(guān)系,為醫(yī)療急救資源的應(yīng)急分配提供一定的參考。
1.資料
PM2.5質(zhì)量濃度數(shù)據(jù)來自于北京市環(huán)境保護(hù)監(jiān)測(cè)中心網(wǎng)站(http://zx.bjmemc.com.cn/),由35個(gè)監(jiān)測(cè)站點(diǎn)所記錄的PM2.5日均濃度平均值代表全市的PM2.5日均濃度,利用SPSS20.0軟件將缺失值采用線性內(nèi)插法補(bǔ)齊。氣溫、相對(duì)濕度等氣象因素?cái)?shù)據(jù)主要來自于中國(guó)氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)。救護(hù)車急救信息數(shù)據(jù)來自于北京市120急救中心,資料主要包括時(shí)間、地點(diǎn)、患者、性別、年齡、主訴、初診原因和病種判斷等信息,本研究排除了由中毒、外傷、車禍、自殺、他殺、懷孕等外部原因引起的急救。運(yùn)用Microsoft Excel建立數(shù)據(jù)庫(kù)。
2.統(tǒng)計(jì)分析方法
(1)模型基本理論
廣義相加模型的一般形式為:
g(u)=β0+s0+s1(x1)+s2(x2)+…sn(xn)
(1)
式中,g(u)代表各種連接函數(shù)關(guān)系,可以是多種概率分布,主要有正態(tài)分布、二項(xiàng)分布、負(fù)二項(xiàng)分布和Poisson分布等;s(x)代表平滑函數(shù),包括平滑樣條(smoothing spline,s)、自然立方樣條(natural cubic spline,ns)、懲罰樣條(penalized spine,ps)等。s(x)是非參數(shù)形式,可以控制自變量的非線性效應(yīng),使得模型非常靈活。
GAM應(yīng)用的潛在假設(shè)為自變量的函數(shù)是可加的,并且各部分是平滑的。在實(shí)際應(yīng)用中,若每個(gè)解釋變量的關(guān)系都用非參數(shù)擬合會(huì)出現(xiàn)計(jì)算量大、過度擬合等問題,因此,GAM也可以納入?yún)?shù)部分,這樣就出現(xiàn)了半?yún)?shù)廣義相加模型(semi-parametric generalized additive models),其形式為:
g(u)=α+β1x1+…βnxn+∑si(xi)
(2)
(2)建模策略
將救護(hù)車出車次數(shù)、PM2.5濃度、溫度、相對(duì)濕度通過日期鏈接,采用以對(duì)數(shù)鏈接的半?yún)?shù)廣義相加模型進(jìn)行分析。在全人群中,由于救護(hù)車急救相對(duì)于總?cè)巳簛碚f是小概率事件,救護(hù)車出車次數(shù)基本近似服從Poisson 分布,因此鏈接函數(shù)選用Poisson 回歸。
本次研究采取的建模策略是:①采用自然立方樣條(natural cubic spline,ns)函數(shù)控制救護(hù)車出車次數(shù)隨時(shí)間變化的長(zhǎng)期波動(dòng)和季節(jié)性波動(dòng)趨勢(shì)。②采用偏自相關(guān)函數(shù)(partial auto-correlation function,PACF)來指導(dǎo)時(shí)間平滑樣條中自由度的選擇。對(duì)時(shí)間趨勢(shì)采用3~8df/年,當(dāng)圖前2個(gè)滯后的絕對(duì)數(shù)值小于0.3,我們認(rèn)為基本模型已經(jīng)很好地控制了序列相關(guān)性。當(dāng)這一條件得不到滿足,我們加入最大滯后天數(shù)為7的自回歸(auto-regression,AR)項(xiàng),以改善模型。③采用自然立方樣條函數(shù)控制溫度和相對(duì)濕度對(duì)救護(hù)車人次的非線性影響,根據(jù)文獻(xiàn)報(bào)道,將其自由度均設(shè)為3。④采用以上建模策略,采用7df/年的自由度足以控制時(shí)間的長(zhǎng)期和季節(jié)變化趨勢(shì)。⑤在此基礎(chǔ)上對(duì)最終模型的殘差進(jìn)行分析,根據(jù)殘差是否滿足白噪聲來進(jìn)一步檢驗(yàn)?zāi)P偷臄M合優(yōu)度。
本次研究所擬合的半?yún)?shù)廣義相加模型為:
logE(Yt)=α+βPM2.5+ns(time,df)+ns(temperature,df)+ns(humid,df)
(3)
式中:E(Yt)為觀察日t救護(hù)車出車次數(shù)的期望值;α為殘差;β是回歸系數(shù);PM2.5是當(dāng)日的PM2.5日均濃度;ns是自然立方樣條函數(shù);df為自由度;time為時(shí)間,temperature為溫度,humid為相對(duì)濕度。
目前,國(guó)際上一般采用R軟件中的mgcv軟件包擬合時(shí)間序列的GAM模型,本研究采用R 3.0.2來建立模型。根據(jù)GAM模型估算出PM2.5的回歸系數(shù)β,計(jì)算相對(duì)危險(xiǎn)度(RR),RR=exp(50×β),在此基礎(chǔ)上計(jì)算出RR的95%可信區(qū)間(confidence interval,CI),公式為exp[50×(β±1.96SE)],表示PM2.5每增加50 μg/m3引起救護(hù)車出車次數(shù)增加的相對(duì)危險(xiǎn)度。考慮到空氣污染產(chǎn)生的健康效應(yīng)可能存在滯后,本文分析了污染當(dāng)天(lag 0)至滯后第7天(lag 7)的效應(yīng)。
1.統(tǒng)計(jì)描述結(jié)果
排除外部原因后,研究期間北京市每日救護(hù)車出車次數(shù)平均為622次。根據(jù)我國(guó)最新公布的環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)(GB3095-2012)中PM2.5二級(jí)標(biāo)準(zhǔn)日均濃度限值75 μg/m3,研究期間內(nèi)PM2.5超標(biāo)日為57天,約占研究天數(shù)的62%,這給研究PM2.5的急性健康效應(yīng)提供了良好的條件。
對(duì)研究變量檢驗(yàn)其正態(tài)性,可知救護(hù)車出車次數(shù)、日均溫度和日均濕度均不符合正態(tài)分布,故用Spearman秩相關(guān)分析研究變量之間的相關(guān)關(guān)系,分析結(jié)果見表2。
**:P<0.01,*:P<0.05。
2.回歸模擬結(jié)果
分別采用當(dāng)日(lag 0)-滯后第7日(lag 7)PM2.5的平均濃度作為PM2.5的暴露水平,擬合PM2.5與救護(hù)車出車次數(shù)的時(shí)間序列模型,結(jié)果見表3和圖1。由此可知,PM2.5對(duì)救護(hù)車出車次數(shù)的影響在滯后第4天的效應(yīng)有統(tǒng)計(jì)學(xué)意義(P=0.0139),且RR(1.028)及95%CI(1.006~1.050)均大于1。另外,PM2.5對(duì)當(dāng)日救護(hù)車出車次數(shù)的影響也有統(tǒng)計(jì)學(xué)意義(P=0.0353),但是,lag0的RR(0.980)及95%CI(0.956~0.998)均小于1,表示PM2.5每增加50ug/m3,救護(hù)車出車次數(shù)反而下降。其他滯后天的結(jié)果均沒有統(tǒng)計(jì)學(xué)意義(P>0.05)。
3.敏感性分析
采用每年自由度為7,PM2.5濃度為lag4天的平均濃度進(jìn)行建模后,由每日救護(hù)車出車次數(shù)的殘差圖(圖2)和殘差的偏自相關(guān)函數(shù)(PACF)圖(圖3)可知,基本上,殘差已變?yōu)橐?為中軸的隨機(jī)波動(dòng),滿足白噪聲,表明模型的擬合優(yōu)度滿足要求。救護(hù)車出車次數(shù)殘差的偏自相關(guān)函數(shù)也滿足要求。
廣義相加模型的構(gòu)建十分靈活,模型中既可包括參數(shù)擬合部分也可包括非參數(shù)擬合部分,甚至可以全部是非參數(shù)擬合,當(dāng)自變量的個(gè)數(shù)較多或者因變量與自變量之間的關(guān)系不明確時(shí),因變量的分布不容易判定或不符合所要求的分布時(shí)均可考慮應(yīng)用廣義相加模型。目前還未見研究PM2.5濃度變化與救護(hù)車出車次數(shù)關(guān)聯(lián)性的報(bào)道,本研究以廣義相加模型為基本統(tǒng)計(jì)模型,運(yùn)用時(shí)間序列方法,分析了日均PM2.5濃度變化對(duì)救護(hù)車出車次數(shù)的影響,救護(hù)車出車次數(shù)近似服從Poisson分布,而時(shí)間和氣象因素對(duì)救護(hù)車出車次數(shù)的作用形式不明,應(yīng)用廣義相加模型可通過平滑函數(shù)控制這些混雜因素的作用,應(yīng)用靈活方便。
本次模型擬合結(jié)果表明,PM2.5濃度對(duì)救護(hù)車出車次數(shù)的影響存在一定的滯后效應(yīng),在滯后的第4天有意義。國(guó)內(nèi)外的很多研究也表明,PM2.5的急性健康效應(yīng)存在一定的滯后時(shí)間,Huang等分析了2004年到2008年西安市戶籍居民的每日因病和自然死亡率與PM2.5的關(guān)系,結(jié)果顯示,PM2.5質(zhì)量濃度每增加103g/m3時(shí),居民全部死因的超額死亡風(fēng)險(xiǎn)會(huì)增加2.29%,滯后時(shí)間在1~2d[8]。滯后時(shí)間不一致的可能原因?yàn)?,本次研究納入只有3個(gè)月的數(shù)據(jù),研究時(shí)間較短,因此,有必要進(jìn)行更長(zhǎng)時(shí)間的研究,以進(jìn)一步探討每日PM2.5濃度變化與救護(hù)車出車次數(shù)的關(guān)系。
本研究控制了多種可能混雜因素的影響,較為客觀地分析了每日PM2.5濃度變化與救護(hù)車出車次數(shù)的關(guān)系,可以為醫(yī)療急救資源的應(yīng)急分配提供一定的參考,比如已知某地區(qū)存在嚴(yán)重的PM2.5污染,衛(wèi)生部門可以提前通知120急救中心做好充分的準(zhǔn)備,合理分配和使用各個(gè)地區(qū)的應(yīng)急車輛。由于本次研究資料獲得不易,研究時(shí)間段相對(duì)較短,在以后條件允許的情況下,將進(jìn)一步深入研究。
[1]陶芳芳,趙耐青,何懿,等.廣義相加模型在細(xì)菌性痢疾預(yù)警中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2012,29(4):481-483.
[2]牟喆,彭麗,花靜,等.上海市溫濕度與感冒就診人次的時(shí)間序列研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2013,30(2):237-239.
[3]Díaz-Robles LA,Fu JS,Vergara-Fernández A,et al.Health risks caused by short term exposure to ultrafine particles generated by residential wood combustion:a case study of Temuco,Chile.Environment International,2014,66:174-181.
[4]Neuberger M,Moshammer H,Rabczenko D.Acute and subacute effects of urban air pollution on cardiopulmonary emergencies and mortality:time series studies in Austrian cities.International Journal of Environment Research and Public Health,2013,10(10):4728-4751.
[5]Heo J,Schauer JJ,Yi O,et al.Fine particle air pollution and mortality:importance of specific sources and chemical species.Epidemiology,2014,25(3):379-388.
[6]Samoli E,Stafoggia M,Rodopoulou S,et al.Which specific causes of death are associated with short term exposure to fine and coarse particles in Southern Europe?Results from the MED-PARTICLES project.Environment International,2014,67:54-61.
[7]Dominici F,Peng RD,Bell ML,et al.Fine particulate air pollution and hospital admission for cardiovascular and respiratory diseases.The journal of the American Medical Association,2006,10(295):1127-1134.
[8]Huang W,Cao J,Tao Y,et al.Seasonal variation of chemical species associated with short-term mortality effects ofPM2.5in Xi’an,a Central City in China.American Journal of Epidemiology,2012,175(6):556-566.
(責(zé)任編輯:郭海強(qiáng))
The Application of Generalized Additive Model in the Association Study of PM2.5Concentrations Change with Daily Ambulance Dispatches in Beijing
Xu Qin,Wang Chao,Pan Lei,et al.
(School of Public Health in Capital Medical University(100069),Beijing)
Objective To research the relationship between daily PM2.5concentration change and the ambulance dispatches.Methods Generalized additive model was used to study the association of PM2.5pollution with ambulance dispatches from October to December in 2012,Beijing,after controlling for long-term trend,temperature and humid.Results Lag effect of the fourth day is statistically significant(Z=2.461,P=0.0139),with the PM2.5concentration increase 50 μg/m3,the relative risk of the ambulance dispatches increase is 1.028(95%CI:1.006~1.050).Conclusion The increase of PM2.5concentration has an impact on the increase of ambulance dispatches in Beijing.The application of generalized additive mode is flexible.
PM2.5pollution;Ambulance dispatches;Generalized additive model;Time series
△通信作者:郭秀花,E-mail:gouxiuh@ccmu.edu.cn