田 鋒,魏代俊
(湖北民族大學數(shù)學與統(tǒng)計學院,湖北 恩施 445000)
隨著新型冠狀病毒肺炎疫情的爆發(fā)與蔓延,截止北京時間2020年8月20日,湖北累計報告了新冠確診病例68 139例[1-3]. 2020年1月23日,為及時遏制新冠病毒隨人口的流動迅速傳播,武漢市政府于上午10時宣布全面關閉離漢通道. 基于百度遷徙和騰訊定位等地理位置服務所收集到的離漢人口遷出數(shù),發(fā)現(xiàn)在1月10日至23日14 d期間約有500萬人離開武漢,其中68.37%的遷出人口目的地在湖北境內(nèi),該階段性數(shù)據(jù)在一定程度上可以說明從武漢遷出的這500萬人口中,目的地在湖北境內(nèi)的人口占比很大. 因此分析這部分人的流動對疫情研究有很大作用.
目前,基于人口遷徙數(shù)據(jù)對新冠病毒傳染特性的建模研究分析已經(jīng)取得了較好的成果:許小可在《新冠肺炎爆發(fā)前期武漢外流人口的地理去向分布及影響》一文中分析得出“封城”之前離開武漢的500萬人口中大部分都不是社交媒體上熱議的“逃離”,絕大部分還是像往常一樣正常返鄉(xiāng)過年,另外也得出2020年武漢春節(jié)外流人口的地理分布與正常年份相比兩者之間沒有明顯差別[4-10];文獻[11]提出了一個針對中國城市級傳染病傳播的通用模擬器模型,其可依據(jù)具體用途進行調整、也可有助于應急響應中的政策分析以及對未來公共衛(wèi)生事件的早期預警[11];第一財經(jīng)報道則從1月23日武漢宣布關閉離漢通道后的人口遷徙指數(shù)對比中說明即使在解封后離漢人口也并未出現(xiàn)“井噴”現(xiàn)象[12]. 同時還有數(shù)據(jù)統(tǒng)計4月8日解封當天離開武漢的人口中約78%的人口遷出目的地仍是湖北省內(nèi)的其它城市,這一現(xiàn)象與解封之前武漢人口遷出情況相吻合[13-15].
目前已有的文章或通過統(tǒng)計分析或利用SIR模型對新冠疫情傳播進行研究,相比之下從網(wǎng)絡自身結構理論出發(fā)所做的分析還較少[16-21]. 2020年文獻[22]提出了單層網(wǎng)絡度-度距離的概念,其定義為兩節(jié)點度值越接近,則距離越小,很直觀地度量了網(wǎng)絡中兩個節(jié)點的相似程度,而城市間距離的度量也可超越傳統(tǒng)意義上按照人口規(guī)模和空間地理位置的劃分,借鑒度-度距離.
為此,本文把單層網(wǎng)絡的度-度距離推廣至多層,建立了湖北省內(nèi)17個地級市之間的航空、鐵路、高速公路3層交通網(wǎng)絡. 在多層網(wǎng)絡的基礎上利用網(wǎng)絡自身的結構特性對本次湖北省內(nèi)的新冠疫情進行研究,本文研究的意義在于:一是區(qū)分不同交通方式在疫情傳播中的不同作用;二是尋找到一種更加貼近實際的城市聚類方法,使得這種城市群的劃分更能反映疫情的實際傳播情況.
1.1.1 多層網(wǎng)絡
圖1 常見多層網(wǎng)絡圖Fig.1 Graph of common multi-layer network
單層網(wǎng)絡一般用一元數(shù)組G=(V,E)來表示,V表示節(jié)點、E表示鄰邊.但在實際的生活中不僅存在單層網(wǎng)絡,還存在很多復雜的多層網(wǎng)絡,為了表示由多個單層網(wǎng)絡組成的網(wǎng)絡或者一個網(wǎng)絡具有多種類型的邊以及其余某些特征時,需要在單層的基礎上通過引入不同的層或維度,即產(chǎn)生多層的概念.如:現(xiàn)實生活中兩個人之間的關系可以是同事、也可以是朋友,這里的同事和朋友就可以劃分為兩個維度.一般的多層網(wǎng)絡可以用多元數(shù)組G=(V,E,K)來表示,這里的V,E仍分別為節(jié)點和連邊,K表示不同的維度,多層網(wǎng)絡一般如圖1所示.
1.1.2 度-度距離
給定一個網(wǎng)絡G(V,E),其中每個節(jié)點i∈V都被自然地賦予了一個尺度pi(和i相連的節(jié)點數(shù)目),即網(wǎng)絡的度,該尺度是獨立于網(wǎng)絡外在屬性之外的,僅僅只由網(wǎng)絡內(nèi)部的拓撲結構所決定.每一個連邊(i,j)∈E是一個二元數(shù)組,一般地,連邊僅表示了兩節(jié)點之間是否連接,其除非被賦予一些額外的屬性(如權重或容量等),否則會因缺乏相應的可比較尺度從而導致無法對其在大多數(shù)復雜網(wǎng)絡中展開統(tǒng)計研究[22].
基于此研究現(xiàn)狀,周斌等[22]通過引入單層網(wǎng)絡度-度距離來重新給邊賦權體現(xiàn)出邊的統(tǒng)計重要性,在給定的網(wǎng)絡G中,度-度距離常用η(i,j)表示:
logη(i,j)=logη(j,i)=log|pi-pj|,(i,j)∈E.
(1)
從度量方式上看,logη比η或許更適合來定義距離,但是在后續(xù)的研究中發(fā)現(xiàn)就像網(wǎng)絡的度p在傳統(tǒng)的復雜網(wǎng)絡冪律研究中所起的作用那樣,η與logη在定義距離上起著相同的作用,因此仍然用η來定義距離,與此同時η和其概率分布P(η)都是服從冪律分布的.事實上,在假設大多數(shù)網(wǎng)絡都是連通的前提下,η比p在任何情況下都具有更大的統(tǒng)計意義.
從定義可知度-度距離實質上度量了網(wǎng)絡中兩個節(jié)點的相似程度,直觀上就是若兩個節(jié)點的度-度距離越小(接近于1),則說明這兩個節(jié)點越相似[23-30].同時η(i,j)是一個自然的尺度,其完全由網(wǎng)絡拓撲結構來決定,也是一種無量綱的表示形式,因此定義式(1)可以改寫為(2)式(即排序后兩端節(jié)點的度之比):
(2)
從該式可以看出η的取值范圍是[1,max{ki,i∈V}].
在1.1.2中介紹了單層網(wǎng)絡度-度距離的定義,其從本質上反映了網(wǎng)絡的內(nèi)在特征.對多層網(wǎng)絡而言其節(jié)點在不同層的代表意義不同,因此給多層網(wǎng)絡度-度距離的計算帶來了難度.
基于1.1.1中多層網(wǎng)絡的理論部分介紹,其通常用多元數(shù)組G=(V,E,K)表示,其中的K即表示網(wǎng)絡中不同的維度,筆者通過在多層網(wǎng)絡中引入“某種因子ωi”把多層“折算”為單層的方法建立多層網(wǎng)絡的度-度距離模型從而對其進行計算,建模步驟為:
第一步:考慮多層網(wǎng)絡中各層的權重比例ωi使得:
(3)
第二步:根據(jù)權重比例計算各層中節(jié)點“折算”后的度,如設第i層中第j個節(jié)點度為pj,那么其折算后的節(jié)點度為:
(4)
第三步:由此得到多層網(wǎng)絡中度-度距離模型為:
(5)
其中j,h表示多層網(wǎng)絡中的節(jié)點.
本文所用的2020年1月10日至23日期間每天從武漢遷入至湖北省內(nèi)其它地級市(州)的人口比例數(shù)據(jù)來源于百度遷徙和騰訊位置服務平臺,選取1月10日至23日的數(shù)據(jù)原因是:
(1)1月10日至23日處于2020年春運期,該時間段內(nèi)人口的流動規(guī)模比平常更大,選其進行分析對結果更有說服力;
(2)武漢市于1月23日上午10時全面關閉離漢通道,選取關閉之后的時間對結果無意義;
(3)新冠的潛伏期大致為14 d,從10日到23日恰好約為一個潛伏期時間,這對統(tǒng)計累計確診人數(shù)的結果更有價值.
由此得到了14 d內(nèi)武漢依次遷出至孝感、黃岡、荊州等16個地區(qū)的人口比例(見表1);所收集的截止到8月20日湖北省內(nèi)各地級市(州)累計確診病例人數(shù)來源于騰訊健康中心;所統(tǒng)計的湖北省內(nèi)3大交通的連接情況來源于航班管家、鐵路12306、汽車客運中心出行APP.
表2為收集到的湖北省內(nèi)各地區(qū)航空連通情況(鐵路和公路的連通不再贅述),其中數(shù)字“1”表示兩個地區(qū)之間可達、“0”表示不可達.
表1 武漢遷入各地區(qū)人數(shù)比例Table 1 Proportions of people moving into different regions in Wuhan
表2 湖北各地區(qū)飛機連通情況Table 2 Airplane connectivity in various regions of Hubei
2.2.1 遷入人口比例與確診人數(shù)關系研究
表3 遷入人口與確診人數(shù)相關性分析Table 3 Correlation analysis of correlation between immigratingpopulation and confirmed number of people
對14 d內(nèi)從武漢遷入至其余各地區(qū)的人口比例平均值與相應的累計確診人數(shù)用統(tǒng)計軟件SPSS進行相關性分析,結果如表3所示.
表中X表示平均遷入人口比例,Y表示累計確診人數(shù),從顯著性水平來看:雙尾顯著性檢驗結果為0.000,說明兩者之間的相關性檢驗通過且相關性十分顯著;從皮爾遜相關系數(shù)檢驗結果來看:兩者之間的相關系數(shù)為0.965,說明具有很強的正相關關系,即一個地區(qū)在該時間段內(nèi)由武漢遷入的人口數(shù)越多,那么該地區(qū)確診的病例就越多.
2.2.2 交通方式與確診人數(shù)關系研究
根據(jù)收集到的湖北省內(nèi)各地區(qū)航空、鐵路、公路3種交通方式的連通情況,分別以各地區(qū)為網(wǎng)絡節(jié)點、彼此相連為鄰邊畫出3種交通方式的網(wǎng)絡圖以及度分布圖發(fā)現(xiàn):飛機并不是湖北省內(nèi)的主要交通出行方式,其節(jié)點網(wǎng)絡圖較稀疏且度值較小;因鐵路和公路的節(jié)點網(wǎng)絡圖更密集且度值都較大,所以火車和汽車為湖北省內(nèi)的主要交通出行方式.
下面本文從省內(nèi)3大交通方式的節(jié)點網(wǎng)絡圖以及度分布圖中提取出除武漢市外其余地區(qū)的航空、鐵路、公路度數(shù)據(jù),對3大交通方式的度數(shù)據(jù)和各個地區(qū)的確診人數(shù)之間進行相關性的分析:
表4 航空度數(shù)據(jù)與確診人數(shù)相關性分析Table 4 Correlation analysis of air travel dataand confirmed number of people
以上分析中X1表示航空網(wǎng)絡度數(shù)據(jù)、X2表示鐵路網(wǎng)絡度數(shù)據(jù)、X3表示公路網(wǎng)絡度數(shù)據(jù). 表4顯示:航空網(wǎng)絡的度與確診人數(shù)之間的皮爾遜相關性檢驗的P值為0.241,無論在0.05還是0.01水平下都不顯著;表5顯示鐵路網(wǎng)絡的度與確診人數(shù)之間的皮爾遜相關系數(shù)為0.528,說明二者之間具有相關性且顯著性檢驗通過;表6顯示公路網(wǎng)絡的度與確診人數(shù)之間的皮爾遜相關系數(shù)為0.785,說明二者之間具有較強相關性且顯著性檢驗也通過.
因此從3大交通方式的度與確診人數(shù)的相關性分析比較,可以得出鐵路與公路網(wǎng)絡的度與確診人數(shù)之間的相關性是顯著的,航空網(wǎng)絡則不顯著. 此結果說明相對于航空而言鐵路和公路這兩種交通方式“更有利于”疫情的傳播. 筆者認為導致該結論發(fā)生的原因主要有:(1)鐵路和公路與航空不同的是這兩者每途徑一個城市就會有人流量的交換(上車與下車),這種交換越頻繁就會加大疫情傳播的風險且伴隨發(fā)生的交叉感染也更常見. (2)人們選擇鐵路和公路時其路途中花費(暴露)的時間會更多,與其他人交流的可能性也更大.
表5 鐵路度數(shù)據(jù)與確診人數(shù)相關性分析Table 5 Correlation analysis of railway degree dataand confirmed number of people
表6 公路度數(shù)據(jù)與確診人數(shù)相關性分析Table 6 Correlation analysis of highway degree dataand confirmed number of people
2.2.3 度-度距離的城市聚類與確診人數(shù)關系研究
基于模型(5),本文從航空、鐵路、公路3層交通網(wǎng)絡分析湖北省新冠肺炎的傳播情況,由湖北省 3種交通方式的節(jié)點網(wǎng)絡及度分布圖發(fā)現(xiàn)不同交通方式之間相應的度存在一定差異,得到湖北各地區(qū)的總航空度為24、總鐵路度為210、總公路度為184,三者比值為:0.06:0.50:0.44,本文取各層度的比值為權重因子,從表4得出確診人數(shù)與航空網(wǎng)絡的相關性較差,與鐵路和公路的相關性較強且強度類似. 因此本文定義湖北3層交通網(wǎng)絡的折算因子ωi(i=1,2,3)如下:
(6)
其中ωi(i=1,2,3)分別表示航空層、鐵路層、公路層的折算因子. 本文交通網(wǎng)絡中各層權重的設置主要是考慮到站點與站點之間的連接情況,即各層網(wǎng)絡度的比值,就湖北省內(nèi)的交通情況來看,目前省內(nèi)的出行還是主要以鐵路和公路為主,航空次之. 因此按照本文的標準來確定各層的權重比值符合現(xiàn)實情況;在其他多層網(wǎng)絡權重設置中也要結合實際網(wǎng)絡的情況,比如在經(jīng)濟學多層股票網(wǎng)絡中進行權重設置時則可以考慮按照行業(yè)的分類情況進行相應的折算因子設置.
由公式(4)和模型(5)計算得到了表7中各地區(qū)之間的度-度距離與每個地區(qū)的平均度-度距離,基于表7的結果進行系統(tǒng)聚類分析,結果如圖2所示.
對湖北省各地區(qū)按照相應的確診人數(shù)進行系統(tǒng)聚類的結果如圖3所示.
表7 湖北各地區(qū)之間的度-度距離Table 7 Degree-degree distance between different regions in Hubei
圖2和圖3中1-16的編號依次表示為:孝感、黃岡、荊州、鄂州、隨州、襄陽、黃石、宜昌、荊門、咸寧、十堰、仙桃、天門、恩施、潛江、神農(nóng)架.
從依據(jù)度-度距離聚類的結果來看,一共把湖北各地區(qū)分為了4類:孝感、黃岡、荊州為第一類;鄂州、隨州、襄陽為第二類;黃石、宜昌、荊門、咸寧、十堰為第三類;仙桃、天門、恩施、潛江、神農(nóng)架為第四類. 從基于確診人數(shù)的聚類結果來看依舊把湖北各地區(qū)分為了Ⅳ類,孝感、黃岡為第Ⅰ類;荊州、鄂州、隨州、襄陽為第Ⅱ類;黃石、宜昌、荊門、咸寧、十堰、仙桃、天門為第Ⅲ類;恩施、潛江、神農(nóng)架為第Ⅳ類. 據(jù)以上可以看出基于度-度距離聚類的結果與按確診人數(shù)的聚類結果之間的一致性很高,17個地市州排序完全一致,而且都分成了4類,只是在每一類中包含的地市州略有區(qū)別.
圖2 基于度-度距離的聚類分析結果圖Fig.2 Graph of clustering analysis results based ondegree-degree distance
圖3 基于確診人數(shù)的聚類分析結果圖Fig.3 Graph of clustering analysis results based onconfirmed number of people
本文在對新冠疫情的傳播研究中,對湖北省內(nèi)各地區(qū)的航空、鐵路、公路3層交通網(wǎng)絡通過構造度-度距離模型進行分析得出的主要結果如下:
(1)人口的流動與此次疫情的傳播有極強的關聯(lián):從表1可以看出在研究時段內(nèi)湖北省內(nèi)各地區(qū)由武漢遷入的人口數(shù)越多,該地區(qū)的確診人數(shù)也越多;
(2)湖北省內(nèi)本次新冠疫情的傳播在不同的交通方式中存在較大的差異:鐵路和公路這兩種交通方式在一定程度上“更有利于”疫情的傳播;
(3)可以按照度-度距離劃分“城市群”來實施層級防控:從度-度距離聚類結果可以看出度-度距離越接近的城市其疫情的嚴重程度也更接近,因此在疫情防范過程中可以按照這種劃分更有針對性、更有效率地進行防控.
當然本文也仍需做更深的推廣和探討:
(1)文中人口的流動和交通網(wǎng)絡的構建范圍僅限于湖北省內(nèi),所有網(wǎng)絡連接也都是在省內(nèi),可進一步推廣到省外的人口流動和交通連接并對其進行分析;
(2)文中通過構建度-度距離模型來對此次疫情的傳播情況進行分析時,所采用的相關病例數(shù)據(jù)均為確診人數(shù),可考慮對其按照衛(wèi)健委標準進行細分,如確診數(shù)、易感數(shù)、無癥狀感染數(shù)、死亡數(shù).