胡 森,李松廉,蔡忠亮
(1. 武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079)
疾病、健康和衛(wèi)生事件等公共衛(wèi)生數(shù)據(jù)往往具有空間屬性。通過(guò)地理信息系統(tǒng)和空間分析技術(shù),分析公共衛(wèi)生數(shù)據(jù)的空間分布規(guī)律,探究其影響因素,能為疾病防治、衛(wèi)生服務(wù)等提供優(yōu)化策略,并輔助公共衛(wèi)生管理[1]。該領(lǐng)域逐漸形成了空間流行病學(xué),而時(shí)空熱點(diǎn)分析作為時(shí)空數(shù)據(jù)挖掘的重要方法,也已廣泛應(yīng)用于公共衛(wèi)生領(lǐng)域,用于揭示相關(guān)數(shù)據(jù)的時(shí)空聚集性與時(shí)空分布規(guī)律[2-9]。
急救事件的發(fā)生往往存在熱點(diǎn)時(shí)段,并具有一定的周期性。如煙臺(tái)市開(kāi)發(fā)區(qū)“創(chuàng)傷”呼救統(tǒng)計(jì)結(jié)果顯示,7~9 月高發(fā),且早晨7:00~10:00 和夜間20:00~23:00 為呼救高峰[8]。但傳統(tǒng)流行病學(xué)分析框架下急救事件時(shí)間分布規(guī)律的分析往往為以折線(xiàn)圖、柱狀圖為代表的一維分析。這種分析方式忽略了不同時(shí)間周期的交互關(guān)系[9-10]。
基礎(chǔ)的熱圖以二維矩陣的形式,通過(guò)單元格色彩變化來(lái)直觀地顯示數(shù)據(jù),常用于顯示不同變量的組合模式、檢測(cè)彼此間是否有相關(guān)性,可在Excel 軟件中制作。當(dāng)橫軸與縱軸均取不同的時(shí)間周期變量時(shí),熱力圖即為時(shí)間熱點(diǎn)分析圖。一般可取橫軸為以小時(shí)為單位的時(shí)間周期,取縱軸為以天為間隔的星期循環(huán),統(tǒng)計(jì)不同時(shí)間維度上的急救時(shí)間數(shù)量。為優(yōu)化基礎(chǔ)時(shí)間熱點(diǎn)分析圖的視覺(jué)效果,可采用插值方法將離散網(wǎng)格連續(xù)化,形成平滑的時(shí)間熱點(diǎn)分布圖,而等值線(xiàn)的加入同樣可以輔助時(shí)間熱點(diǎn)分析結(jié)果的判讀。
空間熱點(diǎn)分析涉及“熱點(diǎn)識(shí)別”和“密度分析”兩個(gè)概念,其結(jié)果分別對(duì)應(yīng)“熱點(diǎn)圖”和“熱力圖”[10]。二者均用于探測(cè)地理事件高發(fā)區(qū)域,但其內(nèi)涵有所不同。其中熱點(diǎn)識(shí)別的目的是識(shí)別具有統(tǒng)計(jì)顯著性的熱點(diǎn)和冷點(diǎn),相對(duì)客觀。而密度分析的目的是可視化展現(xiàn)地理事件發(fā)生密度,其可視化效果相對(duì)主觀。值得注意的是,熱點(diǎn)識(shí)別中的“熱點(diǎn)”與密度分析中的高值地帶無(wú)必然聯(lián)系,其內(nèi)涵是高值聚集區(qū),要求要素具有高值,且被其他同樣具有高值的要素包圍。
熱點(diǎn)識(shí)別的主要方法包括Getis-Ord Gi*和Local Moran’s I,其中前者更為常用,后者除熱點(diǎn)外還能識(shí)別異常值。Getis-Ord Gi*的原理為:在引入地理權(quán)重矩陣后,計(jì)算加權(quán)要素值與加權(quán)均值之差再除以標(biāo)準(zhǔn)差加權(quán)值。其本質(zhì)是一種z值,計(jì)算公式為:
式中,xj為要素j的屬性值;wij為要素i,j的空間權(quán)重;n為要素總數(shù);Xˉ為屬性值均值;S則為屬性值標(biāo)準(zhǔn)差。
密度分析是一類(lèi)點(diǎn)模式分析方法,其目的是獲得要素在空間上分布的密集程度。其中最簡(jiǎn)單的方法是“樣方計(jì)數(shù)”,即將空間劃分為網(wǎng)格,統(tǒng)計(jì)網(wǎng)格中要素取值的總和。但是樣方法沒(méi)有考慮空間對(duì)象間的相互作用,且輸出離散化結(jié)果。相對(duì)于樣的方法,更為常用的是“核密度估計(jì)”。它通過(guò)計(jì)算要素周?chē)拿芏葮?gòu)建平滑表面,從而實(shí)現(xiàn)了從離散對(duì)象模型到連續(xù)場(chǎng)模型的轉(zhuǎn)變。具體而言,空間中某點(diǎn)急救事件密度等價(jià)于該點(diǎn)鄰域范圍內(nèi)急救事件核密度函數(shù)的貢獻(xiàn)之和。急救事件x的核密度函數(shù)可表示為:
式中,h為核函數(shù)帶寬;k(?)高斯正態(tài)分布形式的核函數(shù);x-xi為兩事件間距離。
本文所使用的武漢市核心城區(qū)行政區(qū)劃、水系數(shù)據(jù)等空間基礎(chǔ)數(shù)據(jù)來(lái)源于“武漢市第一次地理國(guó)情普查”,2014年疾病總覽數(shù)據(jù)和詳細(xì)數(shù)據(jù)來(lái)源于武漢市急救中心,其中2014年疾病總覽數(shù)據(jù)包括呼救病種、總?cè)藬?shù)、男性人數(shù)、女性人數(shù)、性別不詳人數(shù)、老年人數(shù)、中年人數(shù)、青年人數(shù)、少年人數(shù)、嬰兒人數(shù)等屬性,共103 965 條數(shù)據(jù),其中醉酒數(shù)據(jù)5 236 條。2014 年詳細(xì)數(shù)據(jù)包括執(zhí)行時(shí)間、搶救地點(diǎn)、診斷、出車(chē)結(jié)果等屬性,對(duì)其進(jìn)行篩選可得到醉酒詳細(xì)數(shù)據(jù),跑空率為13.4%。為執(zhí)行時(shí)空熱點(diǎn)分析,還需要獲得醉酒呼救記錄的空間坐標(biāo)。該過(guò)程共涉及三步。其一,調(diào)用百度逆地理編碼API獲得基本坐標(biāo);其二,對(duì)解析坐標(biāo)與實(shí)際位置的匹配度進(jìn)行人工核查,修正其中的偏差;其三,通過(guò)編程實(shí)現(xiàn)BD09坐標(biāo)到WGS84坐標(biāo)的轉(zhuǎn)換。
對(duì)篩選得到的醉酒數(shù)據(jù)分別按人口特征、空間位置、時(shí)間進(jìn)行分析,可得出以下結(jié)論:從人口特征來(lái)看,男女醉酒比例約為8∶1,中年人所占比例最大,約為38%;青年人和老年人次之,約為36%和24%;從空間位置來(lái)看,41.5%的醉酒事件發(fā)生在餐廳,酒吧,KTV等地,21.7%發(fā)生在居所,36.8%發(fā)生在途中或者其他場(chǎng)所;從時(shí)間特點(diǎn)上來(lái)看,1 月為高發(fā)月,而4 月和7 月是兩個(gè)明顯低谷月。另外,節(jié)假日醉酒頻次明顯高于全年均值與工作日均值。
將武漢市2014 年醉酒呼救按其呼救時(shí)間進(jìn)行劃分,用于劃分的2個(gè)時(shí)間維度分別為以1 h為間隔的日循環(huán)和以1 h 為間隔的周循環(huán)。利用Surfer 15 軟件中的等值線(xiàn)工具對(duì)劃分結(jié)果進(jìn)一步處理生成時(shí)間熱點(diǎn)分析結(jié)果如圖1所示。
圖1 醉酒時(shí)間熱點(diǎn)分析圖
結(jié)果顯示,每晚20:00~22:00 點(diǎn)是醉酒高發(fā)時(shí)段,其中周五為最高峰,而周二為低谷,且周三晚醉酒高發(fā)時(shí)段跨度相對(duì)周二、周四要大。另一方面,周六、周日下午15:00左右為醉酒高發(fā)時(shí)段。
受中國(guó)酒文化影響,中國(guó)飲酒以中青年男性為主,時(shí)間集中于晚上。周五作為工作日的最后一天,與公休日相接。一方面當(dāng)晚各方脫離日常工作學(xué)習(xí),各類(lèi)宴飲活動(dòng)更易組織;另一方面由于后顧之憂(yōu)相對(duì)較少,因此晚宴持續(xù)時(shí)間較長(zhǎng)飲酒量較大。這兩方面的綜合作用促成了周五的醉酒高峰。周三晚醉酒高峰時(shí)段的反向延長(zhǎng)則可能與人們周期性的工作狀態(tài)有關(guān),而周六、周日中午醉酒高峰的出現(xiàn)則可能是朋友、家人間聚餐增多所導(dǎo)致的。
將醉酒事件空間數(shù)據(jù)導(dǎo)入ArcGIS,并按季節(jié)進(jìn)行劃分。分別對(duì)春季(3~5 月)、夏季(6~8 月)、秋季(9~11月)、冬季(本年12月至來(lái)年2月)和全年醉酒事件執(zhí)行核密度分析,參考ArcGIS官方文檔,核函數(shù)帶寬計(jì)算公式為:
式中,Dm是(加權(quán))平均中心的(加權(quán))中值距離;n是點(diǎn)的數(shù)目;SD是加權(quán)標(biāo)準(zhǔn)距離。按照上述公式計(jì)算得到核函數(shù)帶寬為1 800 m。輸出像元大小取值為實(shí)際坐標(biāo)大小的1/250,計(jì)算得到輸出像元大小為25 m。核密度分析結(jié)果如圖2所示。
圖2 醉酒核密度分析圖
結(jié)果顯示春季時(shí)漢口古田四路、江漢路、西北湖、菱角湖,武昌曬湖、中南路-中北路、徐東、武鋼四十九中附近醉酒密度明顯高于其他區(qū)域;夏季時(shí),漢口火車(chē)站、江漢路、菱角湖、武勝路,武昌螃蟹岬、光谷廣場(chǎng);漢陽(yáng)王家灣、蓮花湖公園以西地帶醉酒密度明顯高于其他區(qū)域;秋季時(shí)漢口長(zhǎng)青花園、西北湖及以江漢路為核心的沿江地帶,武昌和平公園、徐東、中南路、復(fù)興路、光谷廣場(chǎng)醉酒密度明顯高于其他區(qū)域;冬季時(shí)漢口西北湖、武勝路、江漢路、武漢天地,漢陽(yáng)王家灣、鐘家村,武昌和平公園、楊家灣、光谷廣場(chǎng)、中南路、黃家湖醉酒密度明顯高于其他區(qū)域。全年來(lái)看,漢口火車(chē)站-以江漢路為核心的沿江地帶、古田四路、武漢天地,漢陽(yáng)王家灣、鐘家村,武昌中南路、徐東、和平公園附近、光谷廣場(chǎng)、黃家湖醉酒密度明顯高于其他區(qū)域。綜合來(lái)看,醉酒密度漢口>武昌>漢陽(yáng),除有漢口火車(chē)站-江漢路,漢陽(yáng)王家灣、鐘家村、武昌中南路、光谷廣場(chǎng)、黃家湖等穩(wěn)定的醉酒密度高值區(qū)域外,還有大量隨季節(jié)變化的醉酒密度高值區(qū)域。
按社區(qū)統(tǒng)計(jì)醉酒事件數(shù)量后,在ArcGIS中執(zhí)行熱點(diǎn)分析(Getis-Ord Gi*),其中選用歐氏距離生成空間權(quán)重矩陣,且?guī)捲O(shè)置為1 800 m。熱點(diǎn)識(shí)別結(jié)果如圖3所示。在0.05置信水平上,漢口火車(chē)站-西北湖區(qū)域、武昌以中南路為核心的連片區(qū)域、以光谷廣場(chǎng)為核心的連片區(qū)域及黃家湖附近是醉酒熱點(diǎn)。
圖3 醉酒熱點(diǎn)識(shí)別圖
不論是核密度分析還是熱點(diǎn)識(shí)別,其指出的醉酒高密度、熱點(diǎn)區(qū)域均處于商業(yè)繁華地段。考慮到國(guó)內(nèi)外研究均指出酒精出售點(diǎn)能顯著影響飲酒行為,結(jié)合熱點(diǎn)識(shí)別和核密度分析結(jié)果,認(rèn)為醉酒事件多發(fā)于餐廳、酒店、KTV、酒吧聚集區(qū)[11-12]。而醉酒高密度區(qū)域的季節(jié)性變化可能是由于人口周期性遷徙造成的,如春節(jié)務(wù)工人員返鄉(xiāng)、寒暑假大學(xué)生歸家。
時(shí)空熱點(diǎn)分析能有效挖掘急救事件的時(shí)空聚集規(guī)律,其結(jié)論能加深對(duì)急救工作的理解,并為院前急救資源調(diào)度提供決策支持。本文中的案例研究,一方面可以作為院前急救工作人員的知識(shí)儲(chǔ)備,另一方面提醒急救中心在醉酒高峰時(shí)段、熱點(diǎn)地區(qū)調(diào)整包括人員、車(chē)輛、急救設(shè)備與對(duì)應(yīng)藥物的配備。
院前急救呼救數(shù)據(jù)相對(duì)于其他公共衛(wèi)生數(shù)據(jù)具有更精確和更多維度的時(shí)空屬性,因此可以使用現(xiàn)有空間流行病學(xué)相關(guān)方法對(duì)其時(shí)空屬性進(jìn)行挖掘,也可以針對(duì)其特殊性引入新的方法和理論。