石 巖,王 達(dá),陳袁芳,陳炳蓉,趙冰冰,鄧 敏
中南大學(xué)地球科學(xué)與信息物理學(xué)院,湖南 長(zhǎng)沙 410083
流行病長(zhǎng)期威脅人類(lèi)生命健康安全。2019年12月武漢市出現(xiàn)的新型冠狀病毒引發(fā)的具有高強(qiáng)傳播力的肺炎(即COVID-19)疫情[1],發(fā)達(dá)的公路、鐵路與航空網(wǎng)絡(luò)為人群跨區(qū)域流動(dòng)提供了極大便利,進(jìn)一步提高了以武漢為傳播中心的疫情擴(kuò)散與局部區(qū)域爆發(fā)的風(fēng)險(xiǎn)[2]。探測(cè)疫情擴(kuò)散態(tài)勢(shì)的空間異常區(qū)域并探索其時(shí)變特征,將有助于疫情時(shí)空擴(kuò)散規(guī)律精確捕捉與動(dòng)態(tài)風(fēng)險(xiǎn)有效評(píng)估,從而輔助政府部門(mén)制定兼具針對(duì)性與適應(yīng)性應(yīng)急管控決策[3]。
相關(guān)領(lǐng)域?qū)W者就流行病分布的地理空間異常探測(cè)開(kāi)展了一系列研究工作。①基于數(shù)據(jù)統(tǒng)計(jì)的挖掘。通過(guò)對(duì)研究區(qū)域中病例絕對(duì)數(shù)量、發(fā)病率等疾病專(zhuān)題屬性值進(jìn)行有序統(tǒng)計(jì)與分析,發(fā)現(xiàn)傳染病異常高爆發(fā)區(qū)域[4-5]。②基于地圖可視化的挖掘。由于傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)方法難以反映傳染病的時(shí)空分異特征,相關(guān)學(xué)者受地圖思維啟發(fā),構(gòu)建了流行病數(shù)據(jù)時(shí)空可視化分析模型,利用視覺(jué)語(yǔ)言形象、直觀地揭示流行病時(shí)空分異規(guī)律。早在1854年,文獻(xiàn)[6]將地圖可視化方法首次用于疾病歸因研究,以點(diǎn)狀地圖符號(hào)的方式標(biāo)記倫敦市霍亂病例的空間分布,發(fā)現(xiàn)了霍亂疫情與公共井水污染之間的直接關(guān)聯(lián)關(guān)系。文獻(xiàn)[7]采用點(diǎn)狀地圖符號(hào)繪制我國(guó)縣級(jí)尺度乙肝病例空間分布地圖,通過(guò)視覺(jué)分析發(fā)現(xiàn)我國(guó)中部、南部以及東部的病例分布密度顯著偏高。中科院地理所和中國(guó)科學(xué)預(yù)防醫(yī)學(xué)科學(xué)院聯(lián)合編制了《中華人民共和國(guó)鼠疫與環(huán)境圖集》,這是我國(guó)首部系統(tǒng)、準(zhǔn)確反映鼠疫空間分布的大型專(zhuān)題地圖集[8];針對(duì)COVID-19疫情,文獻(xiàn)[9]針對(duì)省級(jí)行政單元,采用基于等級(jí)劃分的方法繪制包含新增確診病例數(shù)、累計(jì)確診病例數(shù)等屬性的專(zhuān)題地圖,實(shí)現(xiàn)了疫情發(fā)展的動(dòng)態(tài)可視化展示。③基于空間聚類(lèi)的挖掘。流行病分布作為一類(lèi)典型的地理現(xiàn)象,必然具有符合地理學(xué)第一定律的空間相關(guān)性[10]和第二定律的空間異質(zhì)性[11],而以上兩類(lèi)研究由于對(duì)數(shù)據(jù)缺乏時(shí)空約束下的統(tǒng)計(jì)分析,難以深層挖掘傳染病的空間熱點(diǎn)、離群等異常分布。為此,地理學(xué)領(lǐng)域?qū)W者提出基于空間聚類(lèi)的傳染病異常分布挖掘方法,將顯著偏離全局/局部分布的空間簇或離群?jiǎn)卧R(shí)別為異常區(qū)域或異常點(diǎn)。例如,空間掃描統(tǒng)計(jì)方法借助移動(dòng)掃描窗口,以空間擴(kuò)展分析的方式統(tǒng)計(jì)判別數(shù)據(jù)集中具有顯著高密度病例分布的熱點(diǎn)區(qū)域[12-13];在流行病學(xué)中,莫蘭指數(shù)(Moran’s I)、Getis G等空間相關(guān)性指數(shù)被廣泛用于定量刻畫(huà)疾病分布的全局與局部相關(guān)程度以及熱點(diǎn)-冷點(diǎn)區(qū)域[14-15];另外,文獻(xiàn)[16]利用蟻群聚類(lèi)算法探測(cè)傳染病聚集區(qū)域。
流行病傳播過(guò)程受主觀(如防控措施、人群流動(dòng)等)與客觀(如地理環(huán)境、人群分布等)因素綜合影響[17-18],不同因素間協(xié)同作用的區(qū)域差異性導(dǎo)致疫情擴(kuò)散態(tài)勢(shì)呈現(xiàn)出顯著的時(shí)空分異特征。然而,現(xiàn)有相關(guān)研究大多圍繞地理學(xué)第一定律[10],在歐氏空間鄰近約束下探測(cè)疾病分布的空間異常區(qū)域[14-15],這種策略?xún)H能發(fā)現(xiàn)空間鄰域范圍內(nèi)的疫情屬性特征顯著偏離區(qū)域,通常具有較強(qiáng)的可解釋性(如與傳播中心人群交互強(qiáng)度較大導(dǎo)致疫情態(tài)勢(shì)異常嚴(yán)重),難以深層識(shí)別由其他潛在因素引發(fā)的空間異常。實(shí)際上,區(qū)域間人群流動(dòng)是流行病發(fā)展-前期快速傳播的核心主導(dǎo)因素[19]。地理學(xué)第三定律指出:區(qū)域間地理環(huán)境配置越相近,則地理專(zhuān)題屬性值越相似[20]。為此,本文將由傳播中心至各空間單元的人群遷出強(qiáng)度視作一種給定的地理環(huán)境配置,那么空間區(qū)域之間由傳播中心遷入的人群流量序列越相似,其疫情屬性特征差異越小?;谝陨戏治?,本文從人群跨區(qū)域流動(dòng)形成的“流空間”視角出發(fā),構(gòu)建一種定量的流空間鄰近關(guān)系來(lái)度量地理環(huán)境配置的相似度,提出一種流空間鄰近約束下的流行病空間異常探測(cè)方法,以探測(cè)人群流動(dòng)外的其他潛在相關(guān)地理環(huán)境配置導(dǎo)致的疫情態(tài)勢(shì)空間異常分布區(qū)域,從而有效識(shí)別不同階段疫情擴(kuò)散潛在高風(fēng)險(xiǎn)區(qū)域,指導(dǎo)潛在風(fēng)險(xiǎn)誘因精準(zhǔn)追蹤,輔助區(qū)域疫情防控措施的針對(duì)性修正與改進(jìn)。
給定包含疫情專(zhuān)題屬性時(shí)間序列的空間單元集合,本文將疫情分布空間異常定義為“任一時(shí)段內(nèi),疫情專(zhuān)題屬性值在流空間鄰域范圍呈現(xiàn)顯著偏離的空間單元”,空間異常在時(shí)間維的動(dòng)態(tài)演變可以深層揭示疫情擴(kuò)散的時(shí)空分異規(guī)律。針對(duì)與疫情發(fā)展態(tài)勢(shì)相關(guān)的多維專(zhuān)題屬性特征(主要包括累計(jì)/新增確診病例數(shù)、確診病例增長(zhǎng)率等),本文首先借助地理探測(cè)器[21]對(duì)疫情屬性特征分布與傳播中心人群流出強(qiáng)度進(jìn)行關(guān)聯(lián)分析,從中提取與人群流動(dòng)呈顯著相關(guān)關(guān)系的疫情專(zhuān)題屬性;其次,基于傳播中心人群流出強(qiáng)度的相似性度量計(jì)算空間單元間的流空間鄰近度,自適應(yīng)構(gòu)建流空間權(quán)重矩陣;最后,融合疫情專(zhuān)題屬性的流空間梯度變化量,提出改進(jìn)的莫蘭指數(shù)(Moran’s I)實(shí)現(xiàn)疫情專(zhuān)題屬性全局空間分布特征判別與局部空間異常區(qū)域探測(cè)。本文總體研究策略如圖1所示。
圖1 本文總體研究策略Fig.1 The proposed strategy for detecting epidemic spatial anomalies in this study
給定研究區(qū)域中疫情專(zhuān)題屬性空間分布和傳播中心人群流出序列, 采用地理探測(cè)器定量分析人群流出強(qiáng)度對(duì)疫情屬性空間分布的解釋程度(圖2)。
圖2 疫情屬性特征分布與人群流出強(qiáng)度關(guān)聯(lián)分析Fig.2 Illustration of association analysis between spatial distributions of epidemic attributes and crowd flows
(1) 記人群從傳播中心流出至空間單元Vi的強(qiáng)度時(shí)間序列為Fi={fi1,fi2,…,fim,…,fit},其中fim表示第m天傳播中心流出至Vi的人群數(shù)量與總流出量之比,那么單元Vj(j≠i)與Vi的流空間距離可以表達(dá)為
FDij=
(1)
(2) 采用基于模塊度的社團(tuán)發(fā)現(xiàn)方法[22]進(jìn)行空間單元分區(qū)。進(jìn)而,基于q統(tǒng)計(jì)量將疫情屬性空間分布與人群流出強(qiáng)度間的關(guān)聯(lián)度表達(dá)為[21]
(2)
式中,l為人群流出強(qiáng)度分區(qū)后的區(qū)域數(shù)量;n和Nh分別為總單元數(shù)和區(qū)域h單元數(shù);S和Sh分別表示整體研究區(qū)域和區(qū)域h疫情屬性值方差。最后,采用F分布對(duì)q值進(jìn)行顯著性檢驗(yàn)[21],即
(3)
(4)
空間權(quán)重矩陣是規(guī)則化定量表達(dá)空間單元對(duì)間鄰近關(guān)系的有效工具之一[23-24]。本文將傳播中心人群流出強(qiáng)度序列作為疫情態(tài)勢(shì)的地理場(chǎng)景約束,借助高斯核函數(shù)將任意兩個(gè)空間單元Vi與Vj(j≠i)間的流空間鄰近度表達(dá)為
(5)
式中,帶寬σ用于描述流空間中空間單元相互作用范圍,對(duì)此本文采用交叉驗(yàn)證法自適應(yīng)確定帶寬值[24]
(6)
選擇CV最小值對(duì)應(yīng)的帶寬為最優(yōu)帶寬。基于此,可以構(gòu)建以下流空間對(duì)稱(chēng)權(quán)重矩陣
(7)
為進(jìn)一步消除量綱影響,對(duì)矩陣WF中各元素進(jìn)行行標(biāo)準(zhǔn)化可得到非對(duì)稱(chēng)標(biāo)準(zhǔn)化矩陣WF_S
(8)
給定研究區(qū)域中第m天疫情專(zhuān)題屬性空間分布數(shù)據(jù)集合Am={a1m,a2m,…,aim,…,anm},其中aim表示空間單元Vi在第m天的疫情專(zhuān)題屬性值,首先將單元Vi的流空間疫情專(zhuān)題屬性一階差異計(jì)算為
(9)
在此基礎(chǔ)上,采用如式(10)所示的疫情專(zhuān)題屬性空間局部變化梯度表征單元Vi的疫情專(zhuān)題屬性二階差異
(10)
式中,疫情屬性二階差異量Gradi越大,單元Vi越可能被判別為異常。例如,圖3(b)、圖3(c)分別為針對(duì)圖3(a)專(zhuān)題屬性空間分布數(shù)據(jù)計(jì)算得到的空間單元專(zhuān)題屬性一階差異和二階差異分布,可以明顯發(fā)現(xiàn)與專(zhuān)題屬性一階差異相比,專(zhuān)題屬性二階差異能夠有效消除由于屬性值量級(jí)不同而引起的空間異常誤判,從而真正探測(cè)獲得具有屬性值局部顯著突變的空間異常單元。
圖3 局部空間異常簡(jiǎn)例Fig.3 An example of local spatial anomalies
從本文對(duì)空間異常的定義可以看出,其本質(zhì)是在研究區(qū)域呈現(xiàn)空間正相關(guān)性條件下的一種局部空間負(fù)相關(guān)關(guān)系,即空間異常探測(cè)的前提在于需要保證數(shù)據(jù)具有顯著全局空間正相關(guān)性。對(duì)此,本文在流空間鄰近關(guān)系約束下,采用以下改進(jìn)的全局Moran’s I指數(shù)進(jìn)行空間相關(guān)性統(tǒng)計(jì)判別,表達(dá)為
(11)
(12)
式中,Iobs為全局Moran’s I觀測(cè)值;E(Inull)和D(Inull)為零假設(shè)下全局Moran’s I均值與標(biāo)準(zhǔn)差,分別表達(dá)為
(13)
給定顯著性水平α′,若Z>Zα′/2或Z 若疫情專(zhuān)題屬性值在流空間具有顯著正相關(guān)性,融合2.2節(jié)構(gòu)建的標(biāo)準(zhǔn)化流空間權(quán)重矩陣與2.3節(jié)定義的加權(quán)局部變化梯度提出一種改進(jìn)的局部Moran’s I指數(shù),從而實(shí)現(xiàn)在流空間鄰近約束下探測(cè)疫情屬性局部異常區(qū)域。具體而言,任一空間單元Vi的流空間局部Moran’s I指數(shù)可以表達(dá)為 (14) 式中,std(?)表示所有空間單元疫情屬性局部變化梯度的標(biāo)準(zhǔn)差函數(shù)?;诖?,在任一空間單元與其流空間鄰域單元之間疫情專(zhuān)題屬性值相互獨(dú)立的零假設(shè)下,構(gòu)造局部Moran’s I指數(shù)Z統(tǒng)計(jì)量,進(jìn)行顯著性檢驗(yàn) (15) 式中,E(Ii_null)和D(Ii_null)分別為零假設(shè)下空間單元Vi處局部Moran’s I的期望和方差,計(jì)算為 (16) (17) 若Flow_TADi_m>0,則表明空間單元Vi疫情專(zhuān)題屬性值顯著異常偏高,反之為顯著異常偏低。在此基礎(chǔ)上,對(duì)于任一空間異常單元Vi,本文進(jìn)一步定義“顯著異常偏高時(shí)長(zhǎng)”(Ti_H)和“顯著異常偏低時(shí)長(zhǎng)”(Ti_L)用以量化該單元判別為顯著異常偏高/偏低的時(shí)序變化特征,表達(dá)為 (18) (19) 式中,I(·)為值等于0或1的判別函數(shù);M為研究數(shù)據(jù)總天數(shù)。 本節(jié)采用我國(guó)新型冠狀病毒肺炎(COVID-19)疫情態(tài)勢(shì)空間分布時(shí)序數(shù)據(jù),通過(guò)與在歐氏空間鄰近約束下直接采用疫情專(zhuān)題屬性特征的Moran’s I指數(shù)分析方法[14-15]和分級(jí)可視化方法[9]進(jìn)行對(duì)比分析,以驗(yàn)證本文方法的有效性和優(yōu)越性。我國(guó)各省市于2020年1月24日起開(kāi)始逐日公開(kāi)COVID-19疫情發(fā)展態(tài)勢(shì),2月15日后各地新增病例數(shù)趨于平穩(wěn)下降,因此試驗(yàn)數(shù)據(jù)主要涵蓋我國(guó)各地市衛(wèi)生健康委員會(huì)在2020年1月23日—2月15日期間每日更新的累計(jì)確診病例數(shù)、新增確診病例數(shù)和確診病例增長(zhǎng)率等3類(lèi)疫情專(zhuān)題屬性的空間分布。疫情始發(fā)地武漢市自1月23日實(shí)施“封城”措施,考慮國(guó)家衛(wèi)健委公布的COVID-19潛伏期最長(zhǎng)為14 d的流行病學(xué)先驗(yàn)知識(shí)[25],可以推知各地市1月23日的確診病例最早在1月10日被感染。百度地圖遷徙數(shù)據(jù)(http:∥qianxi.baidu.com/)于2020年1月初,每天對(duì)地級(jí)市尺度人群跨區(qū)域流動(dòng)情況進(jìn)行無(wú)出行方式差別的更新[26],并且我國(guó)百度用戶(hù)在各大搜索引擎用戶(hù)中的滲透率高達(dá)90.9%[27],另外結(jié)合現(xiàn)有相關(guān)研究可以有力說(shuō)明百度遷徙數(shù)據(jù)在反映城市間人群流動(dòng)情況的實(shí)時(shí)性和真實(shí)性[28]。為此,本文將采用百度地圖遷徙數(shù)據(jù)記錄的2010年1月10日—1月23日期間從武漢市流出至各地市的人群比例信息以量化武漢市與各地人群流動(dòng)強(qiáng)度。 由COVID-19潛伏期的時(shí)間滯后影響可以大致推斷,2020年1月10日—1月23日期間武漢市的流出人群為其他地市2月4日前新增確診病例的主要來(lái)源。為此,針對(duì)新增確診病例數(shù)和確診病例增長(zhǎng)率,僅分析兩類(lèi)屬性在2020年1月24日—2月4日期間的空間分布與人群跨區(qū)域流動(dòng)因素間的相關(guān)性?;谀K度的社團(tuán)發(fā)現(xiàn)方法將研究區(qū)域劃分為5個(gè)社區(qū),模塊度值為0.654,表1為3類(lèi)疫情專(zhuān)題屬性空間分布與人群流動(dòng)強(qiáng)度間的q值及顯著性檢驗(yàn)結(jié)果,從中可以發(fā)現(xiàn)由于確診病例增長(zhǎng)率對(duì)累計(jì)確診病例基數(shù)變化敏感,使得該變量與人群流動(dòng)強(qiáng)度相關(guān)性較弱;2月4日前新增確診病例數(shù),以及研究時(shí)段的累計(jì)確診病例數(shù)均與人群流動(dòng)強(qiáng)度顯著相關(guān)。基于以上分析,下面將重點(diǎn)針對(duì)累計(jì)確診病例數(shù)和新增確診病例數(shù)探測(cè)我國(guó)地市尺度疫情分布的空間異常區(qū)域。 表1 疫情專(zhuān)題屬性——武漢人群流出強(qiáng)度間q值及顯著性檢驗(yàn)結(jié)果 首先對(duì)武漢遷出至全國(guó)各城市人口比例與各地疫情態(tài)勢(shì)屬性進(jìn)行線性回歸分析,如圖4所示??梢园l(fā)現(xiàn)整體上武漢遷出人口比例與新增、累計(jì)確診病例數(shù)具有顯著線性正相關(guān)關(guān)系,即新增、累計(jì)確診病例數(shù)隨武漢遷出至各地人口比例單調(diào)遞增,從而驗(yàn)證了“空間區(qū)域之間由傳播中心遷入的人群流量序列越相似,其疫情屬性特征差異越小”這一論點(diǎn)。 圖4 武漢遷出人口比例與疫情態(tài)勢(shì)專(zhuān)題屬性回歸分析Fig.4 Regression analysis results between outflow population rate from Wuhan and confirmed case numbers in each city 表2和表3分別給出了歐氏空間和流空間兩種分析視角下疫情累計(jì)和新增確診病例數(shù)屬性的全局Moran’s I值與顯著性檢驗(yàn)結(jié)果,兩類(lèi)疫情專(zhuān)題屬性在兩個(gè)空間中的全局Moran’s I值均大于0且在顯著性水平α=0.05下顯著,表明累計(jì)和新增確診病例數(shù)在歐氏空間和流空間中均呈顯著空間聚集分布。 表2 歐氏空間和流空間累計(jì)確診病例數(shù)空間分布特征判別 表3 歐氏空間和流空間新增確診病例數(shù)空間分布特征判別 在此基礎(chǔ)上,考慮到疫情潛伏期影響,1月23日武漢“封城”前流出人口中的潛在病例將在2月4日前被陸續(xù)確診,因此本文將2月4日確定為關(guān)鍵時(shí)間節(jié)點(diǎn)。進(jìn)而,分別采用本文方法、歐氏空間局部Moran’s I指數(shù)分析法和可視化分析方法對(duì)疫情屬性分布進(jìn)行空間異常探測(cè)。通過(guò)分析探測(cè)結(jié)果可以發(fā)現(xiàn): (1) 采用中國(guó)疾病預(yù)防控制中心的等級(jí)劃分方法可以繪制圖5所示的2月4日累計(jì)確診病例數(shù)和新增確診病例數(shù)空間分布專(zhuān)題圖。這種人為等級(jí)劃分的策略?xún)H能凸顯如湖北省內(nèi)各市、北京和重慶等專(zhuān)題數(shù)值較高的區(qū)域,難以從視覺(jué)層面直接從中發(fā)現(xiàn)隱含的疫情屬性分布局部異常區(qū)域。 圖5 2020年2月4日疫情專(zhuān)題屬性空間分布可視化Fig.5 Spatial distributions of COVID-19 related attribute values on February 4, 2020 (2) 圖6和圖7表明在歐氏空間鄰近約束下,累計(jì)和新增確診病例數(shù)一直保持在湖北省內(nèi)部分城市呈顯著HH聚集,并隨時(shí)間逐漸以武漢市為中心向孝感、黃岡、鄂州、咸寧、黃石、荊門(mén)、隨州等鄰近城市擴(kuò)張。結(jié)合百度遷徙信息可知,上述城市來(lái)自武漢的人群流量顯著大于未被識(shí)別為空間異常的城市。另外,由武漢遷入的人群比例越大,城市判別為累計(jì)和新增確診病例數(shù)顯著異常的時(shí)長(zhǎng)值越大。這說(shuō)明傳統(tǒng)歐氏空間局部Moran’s I指數(shù)分析法僅能發(fā)現(xiàn)與武漢市人群流動(dòng)強(qiáng)度較大導(dǎo)致的疫情屬性空間異常區(qū)域。 圖6 歐氏空間累計(jì)確診病例數(shù)空間異常偏高區(qū)域分布Fig.6 Spatial distribution of regions with anomalous large cumulative confirmed case numbers constrained by adjacency in Euclidean space 圖7 歐氏空間新增確診病例數(shù)空間異常偏高區(qū)域分布Fig.7 Spatial distribution of regions with anomalous large newly confirmed case numbers constrained by adjacency in Euclidean space (3) 圖8(a)和圖9所示流空間鄰近約束的探測(cè)結(jié)果表明2月4日前疫情累計(jì)和新增確診病例數(shù)的顯著異常區(qū)域具有相似的空間分布,均主要集中在北京、上海、廣州、深圳等超一線特大城市,以及重慶、成都、合肥、杭州等湖北鄰近省會(huì)城市或直轄市。上述城市不僅吸引各地流動(dòng)人群聚集,且城市內(nèi)部人群出行頻率較高,導(dǎo)致累計(jì)/確診病例數(shù)異常偏高、持續(xù)時(shí)間長(zhǎng)。 圖8 流空間累計(jì)確診病例數(shù)空間異常偏高區(qū)域分布Fig.8 Spatial distribution of regions with anomalous large cumulative confirmed case numbers constrained by adjacency in flow space 圖9 流空間新增確診病例數(shù)空間異常偏高區(qū)域分布Fig.9 Spatial distribution of regions with anomalous large newly confirmed case numbers constrained by adjacency in flow space (4) 本文方法還可以準(zhǔn)確識(shí)別哈爾濱等在疫情期間確診病例數(shù)持續(xù)異常偏高的城市。哈爾濱新聞辦曾報(bào)道當(dāng)?shù)剡B續(xù)多日出現(xiàn)聚集性疫情病例,截至2020年2月3日63例確診病例中有58.7%的病例由聚餐等聚集活動(dòng)被感染(https:∥www.sohu.com/a/370680380_120513233);在本文研究時(shí)間范圍外的4月10日—4月12日,該地再次發(fā)生由聚餐導(dǎo)致共計(jì)10人被陸續(xù)確診的事件(http:∥news.sina.com.cn/c/2020-04-13/doc-iircuyvh7520426.shtml),說(shuō)明本文方法能有效提前發(fā)現(xiàn)此類(lèi)空間異常并為相關(guān)部門(mén)決策提供有效支持。此外,如圖10(a)、(b)中長(zhǎng)沙市累計(jì)和新增確診病例數(shù)在2月4日前在流空間中顯著異常偏低,然而隨疫情發(fā)展該地新增確診病例數(shù)持續(xù)上升并呈現(xiàn)異常偏高的態(tài)勢(shì),說(shuō)明本文方法探測(cè)結(jié)果可以為疫情的未來(lái)潛在爆發(fā)風(fēng)險(xiǎn)預(yù)警提供先驗(yàn)信息。 (5) 2月4日后,累計(jì)確診病例數(shù)的流空間異常區(qū)域在顯著減少,再次印證了傳播中心人群流出是關(guān)鍵時(shí)間點(diǎn)前疫情在我國(guó)快速蔓延的關(guān)鍵因素。研究期間內(nèi),南陽(yáng)、溫州、臺(tái)州和寧波等地累計(jì)和新增確診病例數(shù)持續(xù)異常偏高,其中南陽(yáng)市是連接武漢市與豫西的重要交通樞紐以及武漢外來(lái)務(wù)工人員的重要來(lái)源地。據(jù)統(tǒng)計(jì),武漢市臺(tái)州籍從商人員達(dá)6萬(wàn)余人[29],經(jīng)商群體日常接觸人員繁雜且春節(jié)期間大量臺(tái)州籍經(jīng)商人員返鄉(xiāng);截至2月4日,寧波市以及與其流空間鄰近的佛山市累計(jì)確診病例數(shù)分別為120人和49人,統(tǒng)計(jì)兩市官方渠道發(fā)布的新冠肺炎疫情信息[30-31]可知,兩地武漢輸入型病例數(shù)量接近(分別為25人和29人),而與輸入型病例有流行病學(xué)關(guān)聯(lián)的則分別為50人和1人,且百度遷徙信息顯示1月10日—2月3日期間寧波市城內(nèi)人群出行強(qiáng)度持續(xù)顯著高于佛山市(圖11),為此推測(cè)與輸入型病例的頻繁接觸導(dǎo)致南陽(yáng)、臺(tái)州、寧波等地疫情初期發(fā)展態(tài)勢(shì)異常嚴(yán)峻。值得注意的是,溫州市累計(jì)確診病例數(shù)始終顯著高于武漢人口遷出強(qiáng)度與之十分相近的城市(如西安、南京),造成這種異常現(xiàn)象的主要原因在于溫商占據(jù)武漢返溫人群主體,且在疫情初始爆發(fā)地——華南海鮮市場(chǎng)活動(dòng)頻繁(http:∥www.henan.gov.cn/2020/03-07/1301598.html)。 (6) 通過(guò)百度遷徙信息可以發(fā)現(xiàn)河南省是武漢人群遷出比例最大地區(qū),但由于采取了新增130所定點(diǎn)醫(yī)院、全面排查武漢及其他各大城市外來(lái)人員等一系列強(qiáng)硬防控措施,使省內(nèi)擴(kuò)散得到有效遏制。例如圖10(c)中2月4日鄭州市累計(jì)確診病例數(shù)顯著低于武漢人群遷出強(qiáng)度與其相近的深圳、上海等城市。 圖10 部分城市疫情流空間異常信息時(shí)間序列Fig.10 Time series of epidemic anomaly information of partial cities obtained in flow space 圖11 寧波市和佛山市城市內(nèi)部人群出行強(qiáng)度Fig.11 The intensity of intra-city human mobility in Ningbo and Foshan 通過(guò)以上試驗(yàn)分析可以發(fā)現(xiàn),傳統(tǒng)基于歐氏空間鄰近約束的異常探測(cè)策略?xún)H能發(fā)現(xiàn)由傳播中心人群大量流出導(dǎo)致的空間異常區(qū)域,這種具有強(qiáng)解釋性的淺層異常難以提供深層防控決策信息,且直接采用疫情專(zhuān)題屬性作為空間單元特征值僅能發(fā)現(xiàn)與專(zhuān)題屬性平均值差異較大的全局異常區(qū)域。與此相比,本文方法在流空間中構(gòu)建區(qū)域間鄰近關(guān)系,并構(gòu)造疫情屬性值空間局部變化梯度變量作為異常度指標(biāo),可以準(zhǔn)確發(fā)現(xiàn)由于區(qū)位條件、職業(yè)組成、居民疫情防控意識(shí)等傳播中心人群流動(dòng)之外的因素引發(fā)的空間異常,真正為疫情分區(qū)分級(jí)的精準(zhǔn)防控提供風(fēng)險(xiǎn)評(píng)估決策支持。 然而,本文方法仍然存在以下問(wèn)題和局限性:①該方法主要考慮傳播中心人群流出強(qiáng)度對(duì)疫情跨區(qū)域傳播的影響,難以適應(yīng)多中心傳播或非傳播中心區(qū)域間人群流動(dòng)驅(qū)動(dòng)下的疫情擴(kuò)散情景;②單來(lái)源信息(如本文采用的百度遷徙數(shù)據(jù))由于不可避免地存在采樣偏差,導(dǎo)致基于此度量的人群跨區(qū)域流動(dòng)強(qiáng)度有偏,另外,百度遷徙數(shù)據(jù)不區(qū)分交通出行方式,從而無(wú)法有效反映不同出行場(chǎng)景中疫情傳播環(huán)境差異性對(duì)疫情擴(kuò)散過(guò)程造成的差異化影響;③除傳播中心人群流出強(qiáng)度因素外,缺乏考慮區(qū)域內(nèi)其他疫情相關(guān)因素(如區(qū)域內(nèi)部人群活動(dòng)強(qiáng)度、確診病例空間動(dòng)態(tài)分布等),難以對(duì)空間異常進(jìn)行更深層的挖掘與解釋?zhuān)虎茈m然本文方法探測(cè)結(jié)果能夠從空間域視角支持疫情的早期預(yù)警,但仍然難以在時(shí)間域確定疫情在潛在高風(fēng)險(xiǎn)區(qū)域的具體爆發(fā)時(shí)間或時(shí)段。 本文關(guān)注流行病在空間區(qū)域的發(fā)展態(tài)勢(shì),針對(duì)現(xiàn)有歐氏空間鄰近約束的異常探測(cè)方法難以有效識(shí)別人群跨區(qū)域流動(dòng)之外的其他因素導(dǎo)致的潛在空間異常這一問(wèn)題,從流空間鄰近關(guān)系約束的視角,采用一種流空間距離加權(quán)的疫情專(zhuān)題屬性二階差異作為空間單元疫情特征變量,提出改進(jìn)的Moran’s I指數(shù)模型,用于深層探測(cè)疫情專(zhuān)題屬性在流空間具有顯著局部偏離的空間異常區(qū)域。試驗(yàn)結(jié)果表明,本文方法可以準(zhǔn)確探測(cè)疫情不同發(fā)展階段由各類(lèi)因素導(dǎo)致的空間異常以及蘊(yùn)含潛在疫情暴發(fā)風(fēng)險(xiǎn)的異常區(qū)域,能夠科學(xué)指導(dǎo)各地政府相關(guān)部門(mén)在疫情不同發(fā)展階段展開(kāi)針對(duì)性的分區(qū)分級(jí)防控,同時(shí)能夠在城市尺度上指導(dǎo)疫情潛在爆發(fā)風(fēng)險(xiǎn)預(yù)警。 下一步研究工作將進(jìn)一步融合不同平臺(tái)(如鐵路、長(zhǎng)途客車(chē)、航空等)記錄的任意區(qū)域間人群遷徙信息,構(gòu)建多元出行場(chǎng)景下人群流動(dòng)蘊(yùn)含的區(qū)域流空間鄰近關(guān)系,全面獲取更精細(xì)的疫情分布空間異常區(qū)域探測(cè)結(jié)果。另外,需要關(guān)聯(lián)社交媒體簽到、用戶(hù)移動(dòng)軌跡等個(gè)體粒度時(shí)空大數(shù)據(jù),從輿論擴(kuò)散的空間分異性、城市內(nèi)部確診病例活動(dòng)規(guī)律與人群聚集性等多個(gè)視角進(jìn)一步剖析疫情擴(kuò)散的時(shí)空分異特征,并將此作為一種先驗(yàn)信息嵌入復(fù)雜網(wǎng)絡(luò)或深度學(xué)習(xí)模型實(shí)現(xiàn)疫情演化過(guò)程的動(dòng)態(tài)預(yù)測(cè)。1.5 局部空間異常區(qū)域探測(cè)
2 試驗(yàn)分析
2.1 試驗(yàn)區(qū)域與數(shù)據(jù)
2.2 疫情屬性分布空間異常探測(cè)
2.3 討 論
3 結(jié) 論