国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于信令數(shù)據(jù)的新冠肺炎傳播模型構建

2020-08-26 08:25:28
廣東通信技術 2020年8期
關鍵詞:信令傳染感染者

1 引言

自2019年12月以來,湖北省武漢市集中發(fā)生了多起病毒性肺炎,2020年1月8日查明病原為一種新型冠狀病毒,經(jīng)過基因測序被確定為新型冠狀病毒肺炎(簡稱“新冠肺炎”)[1]。流行病學調查簡稱流調,是通過詢問、信訪、問卷填寫、現(xiàn)場查看、測量和檢測等多種手段,全面系統(tǒng)地收集和疾病事件有關的各種資料和數(shù)據(jù),并進行綜合分析,得出合乎邏輯的病因結論或病因假設的線索,提出疾病防控策略和措施建議的行為。流調的主要內容包括病例基本信息、發(fā)病診療和報告情況、相關活動情況、可疑暴露史情況、實驗室檢測情況等。由于新冠肺炎的潛伏期一般為14天,所以流調主要調查確診或疑似病例在生病前14天至就醫(yī)期間的流動軌跡,例如接觸過什么人,去過什么地方,主要調查對象是感染源和感染途徑尚不明確的病例,相比確診病例的數(shù)量,感染源和感染途徑不明確病例數(shù)量的增加更令人警惕。2020年2月6日下午,廣東省新冠肺炎疫情防控工作視頻會議在廣州召開,會議強調做好流行病學調查,落實重點人群篩查,以應對返粵復工開學人潮高峰,防止疫情的擴散和蔓延。省衛(wèi)健委黨組書記、主任段宇飛表示,廣東各大醫(yī)療機構將相繼開診,醫(yī)院內感染風險加大,為此,廣東省疫情防控指揮部明確要求省內各級醫(yī)療機構做好院內患者相關流行病學調查工作,調查對象不僅為門診、急診患者,還包括住院的患者,一線醫(yī)務人員,凡是14天內有湖北旅行或居住史的患者必查。

隨著大數(shù)據(jù)分析技術的日益成熟,流行病學調查除了依靠患者或疑似患者的口述,很多時候還要依托大數(shù)據(jù)分析技術的協(xié)助。疫情發(fā)生后,國內外科研人員就基于大數(shù)據(jù)分析技術,對新型冠狀病毒的擴散趨勢[1]、傳播模型[2,3]和流行病學特點[4]等做了大量研究和報道。同時也產(chǎn)生了一系列為流行病學調查服務的定制化產(chǎn)品[5],騰訊、百度等互聯(lián)網(wǎng)巨頭基于GPS數(shù)據(jù)公開確診患者(匿名)的軌跡并發(fā)現(xiàn)軌跡重合的人群,加強對感染的評估。三大運營商授權基于信令數(shù)據(jù)通過用戶手機號分析判斷是否有與疫情確認人員接觸,或者通過短信查詢近期出行軌跡。中國電子科技集團授權通過接入鐵路、飛機及客運大巴的乘客身份證數(shù)據(jù)查詢最近14天內是否與新冠肺炎確診或疑似病例同乘火車、飛機位于其前后三排以及同乘大巴。相比互聯(lián)網(wǎng)定位數(shù)據(jù)和鐵路公路數(shù)據(jù),信令數(shù)據(jù)的覆蓋人群最廣,但受基站范圍影響定位誤差也比較大。

趙序茅等從數(shù)據(jù)上論證了新冠肺炎的源頭在武漢地區(qū),全國各地城市(除武漢外)71%的感染病例和從武漢輸出的人口相關[1],所以追溯省內感染病例與疫區(qū)輸入型病例的關聯(lián)關系對于流行病學調查尤為重要。本文利用脫敏信令數(shù)據(jù)進行軌跡碰撞,描繪省內感染病例與疫區(qū)輸入型病例的傳播關系、未感染者與確診病例之間的接觸情況,以達到追溯傳染源、發(fā)現(xiàn)高危人群的目的。

2 新冠肺炎傳播模型

2.1 數(shù)據(jù)概述

本文使用的數(shù)據(jù)來源于某省運營商提供脫敏后的信令軌跡數(shù)據(jù),該數(shù)據(jù)承載了用戶流動時產(chǎn)生的位置信息,實際為用戶在該時刻附著的基站位置,每一條記錄可以形式化為ci=,其中ui為加密后的用戶唯一標識,xi為基站經(jīng)度,yi為基站緯度,ti為時間戳。

另一數(shù)據(jù)源為該省疾控中心提供的確診病例名單,內容包括加密后的用戶唯一標識,是否有疫區(qū)旅居史,確診日期,其中用戶唯一標識與信令軌跡數(shù)據(jù)一一對應。該名單819個確診病例中,248名為輸入型病例,571名為本省感染病例,共涉及620 176個病例軌跡碰撞點,基于這些碰撞點在某市發(fā)現(xiàn)了310 713名高危用戶。

2.2 傳染源追溯

本文通過提取1月1日至各病例確診日期前2天的所有軌跡,研究輸入型病例與省內感染病例之間的關系,繪制傳播關系圖。整個分析過程如下:

(1)按照基站的覆蓋范圍,將該省劃分成150米*150米網(wǎng)格,如果確診病例在100秒內,與另一確診病例處于同一網(wǎng)格(這個時間過程中內處于同一基站下,有可能會發(fā)生一次密切接觸事件),我們認為發(fā)生一次碰撞事件,即這兩個病例產(chǎn)生過傳染事件,將產(chǎn)生傳染事件的用戶聚合為多元組,其中ti為傳染事件發(fā)生時間,gi為傳染事件發(fā)生網(wǎng)格,si為用戶集合。

(2)接觸時長也是影響傳染事件的重要因素,所以我們對傳染事件多元組中的時間進行累加,但是考慮到用戶位于基站交界處可能會產(chǎn)生乒乓數(shù)據(jù),即位置信息在多個基站間來回切換的情況,我們針對離開某一網(wǎng)格并在20分鐘內再次返回該網(wǎng)格的用戶繼續(xù)累加接觸時長,最終輸出接觸時長超過一定閾值的傳染事件多元組。

(3)傳染源追溯算法偽代碼如算法1所示,該算法以過濾接觸時長后的傳染事件多元組作為輸入,輸出與輸入型病例直接或間接接觸的所有傳播網(wǎng)絡結點集合。

(4)遍歷上述結點集合生成傳播森林,其中傳染時間遵循最早接觸原則,例如當傳播序列為時,應滿足ti>ti-1且ti為ni與ni+1的最早接觸時間,其中ni為確診病例唯一標識,ti為傳染時間。

2.3 高危人群發(fā)現(xiàn)

由于新冠肺炎的潛伏期一般為14天,所以本文提取某市確診日期在2月25日之后的病例及用戶2月11日至2月25日的所有軌跡,研究確診病例與未感染者之間的關系,從未感染者中尋找高危用戶。

算法1:傳染源追溯算法輸入:傳染事件多元組集合U輸出:傳播網(wǎng)絡結點集合T 1 T← ;2 P←輸入型病例唯一標識集合;3 U’←U按時間從小到大排序;4 foreach u’in U’do 5 family← ;6 roots←u’中輸入型病例集合7 if roots is not null then 8 foreach r in roots do 9 if r not in family then 10 father← ;11 children ← ;12 family[r]← ;13 T[r]←;14 end 15 foreach n in u’and not in roots and not in family[r] do 16 father←(r) ;17 children← ;18 family[r]←family[r]∪(n);19 T[r].children←T[r].children∪(n);20 T[n]← ;21 end 22 end 23 end 24 foreach n1,n2 in u’and not in roots and n1≠n2 do 25 foreach r’in family and not in roots do 26 if n1 in family[r’] then 27 father←(n1);28 children← ;29 family[r’]← family[r’]∪(n2);30 T[n1].children←T[n1].children∪(n2);31 T[n2]← ;32 end 33 end 34 end 35 end 36 return T;

分析方法:通過將地圖劃分成150米*150米網(wǎng)格,如果某一時空網(wǎng)格(時間為100秒)至少出現(xiàn)兩名確診病例,我們認為該網(wǎng)格為高危區(qū)域,未感染者所附著基站處于高危區(qū)域即發(fā)生了一次高危碰撞,未感染者很可能被確診病例傳染。

考慮到居家隔離的情況較多,與確診病例處于同一住宅樓的未感染者都可能被納入高危用戶,為減少上述情況帶來的干擾,我們會對未感染者的高危碰撞進一步過濾,只保留不同地理位置的高危碰撞,即未感染者經(jīng)過不同地理位置的高危區(qū)域越多被傳染的危險性就越大。

形式化表述為:

3 實驗結果與分析

確診病例關系圖如圖1所示,紅色點表示輸入型病例,黃色點表示省內感染病例,即每個發(fā)生傳染事件的輸入型病例對應一個關系圖,每個結點的時間(地點)為該結點與其子結點的首次接觸時間(地點)。在不考慮接觸時間的情況下,省內感染病例與輸入型病例的關聯(lián)率為72.85%,略高于已公開文獻的71%[1],究其原因,一方面信令數(shù)據(jù)的覆蓋人群相比航空數(shù)據(jù)更廣,另一方面本文使用的軌跡數(shù)據(jù)晚于該文獻,疫情已發(fā)生了進一步的擴散。在248名輸入型病例中,沒有感染其他人的有30名,即沒有發(fā)生碰撞事件。另外218名輸入型病例一共傳染給了416名省內被感染者,155名省內被感染者并未找到感染源頭,說明還存在中間的傳染源沒有被發(fā)現(xiàn)。

圖1 確診病例關系圖

進一步引入接觸時長因素,關聯(lián)情況隨接觸時長變化曲線如圖2所示,其中橫坐標為接觸時長閾值,0s表示不考慮接觸時長因素??梢悦黠@看出隨接觸時長閾值的升高,傳染他人的輸入型病例數(shù)量和被感染的本省病例數(shù)量均呈下降趨勢,關聯(lián)率也從最高的72.85%下降到51.49%,說明接觸時長對傳染源追溯模型影響較大,在模型應用中可以根據(jù)實際需要選擇合適的接觸時長閾值。建議接觸時長閾值小于30 s,關聯(lián)率能夠達到68%以上。

圖2 關聯(lián)情況隨接觸時長變化曲線

高危人群發(fā)現(xiàn)模塊通過確診病例14天軌跡碰撞獲得310 713名高危用戶,其中經(jīng)過1至2個高危區(qū)域的人數(shù)最多,達到303 614人,占比97.7%,剩余高危人數(shù)與高危區(qū)域數(shù)的分布如圖3所示,可以看出,高危區(qū)域數(shù)與未感染者人數(shù)呈反比,只有2人經(jīng)過了最多29個高危區(qū)域,盡管經(jīng)過10個以上高危區(qū)域的人數(shù)較少,但更有利于相關人員進行分析研判,相反實現(xiàn)預警則需要推送全部高危用戶。在資源有限但對碰撞精確度有一定要求的條件下,高危區(qū)域數(shù)建議取3個以上,一般選取10個比較合適。

圖3 高危人數(shù)與高危區(qū)域數(shù)分布

4 結論與展望

基于運營商提供的脫敏信令軌跡數(shù)據(jù),本文構建了一種新冠肺炎的傳播模型,通過追溯傳染源、發(fā)現(xiàn)高危人群輔助流行病學調查。該模型追溯到相關部門提供病例名單中72.85%省內感染病例的源頭,略高于已公開文獻的71%[1]。本文驗證了接觸時間和高危區(qū)域數(shù)量兩個閾值對模型的影響,為實際應用中的參數(shù)選擇提供依據(jù)。

定位精度、空氣流通程度和人流密集程度是影響新冠肺炎傳播的主要因素,信令軌跡數(shù)據(jù)所攜帶的位置信息受基站范圍影響存在較大誤差,特別是偏遠地區(qū)的基站覆蓋范圍更廣。在后續(xù)工作中,可以考慮結合三角定位法、GPS數(shù)據(jù)等手段進一步提高模型的定位精度,并針對室分、微站等不同基站類型優(yōu)化傳播模擬效果。

猜你喜歡
信令傳染感染者
重視肝功能正常的慢性HBV感染者
肝博士(2024年1期)2024-03-12 08:38:08
知信行模式在HIV感染者健康教育中的應用
Our Mood Can Affect Others
聽說,笑容是會“傳染”的
SLS字段在七號信令中的運用
移動信令在交通大數(shù)據(jù)分析中的應用探索
基于信令分析的TD-LTE無線網(wǎng)絡應用研究
消費導刊(2017年24期)2018-01-31 01:28:37
傳染
一類具有非線性傳染率的SVEIR模型的定性分析
LTE網(wǎng)絡信令采集數(shù)據(jù)的分析及探討
乐陵市| 延川县| 商水县| 玉山县| 法库县| 桂林市| 汤原县| 贵德县| 内江市| 孟村| 遂宁市| 大港区| 饶河县| 重庆市| 柯坪县| 克什克腾旗| 增城市| 东方市| 新化县| 巢湖市| 襄垣县| 疏附县| 铜梁县| 武冈市| 桓台县| 琼中| 平邑县| 深水埗区| 新安县| 察雅县| 东乡县| 礼泉县| 全椒县| 湖北省| 威宁| 江都市| 岳阳县| 临沭县| 伊春市| 长春市| 陕西省|