李 馮,賓 晟,孫更新
(青島大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,山東 青島 266071)
截至2021年4月18日,中國(guó)累計(jì)報(bào)告新型冠狀病毒肺炎(COVID-19)確診病例103 274人,全世界累計(jì)確診病例141 381 051人。新型冠狀病毒作為一種新型傳染病毒,其流行病學(xué)、發(fā)病率、突變頻率、基本再生數(shù)等傳播特性和以往有很大不同,不僅具有潛伏期且處于潛伏期的患者具有傳染性,在病毒感染者中存在大量的無(wú)癥狀感染者。在醫(yī)療檢測(cè)條件尚未完備的疫情初期,無(wú)癥狀感染患者極難被發(fā)現(xiàn),這意味著此類病毒攜帶者在不受控制的情況下自由傳播病毒,屬于非常危險(xiǎn)的一類群體。在傳染病模型的研究中考慮無(wú)癥狀感染患者的影響是十分必要的,相應(yīng)的研究成果也能為今后具有相似傳播特性的病毒防控提供重要參考。
自新型冠狀病毒爆發(fā)以來(lái),國(guó)內(nèi)外研究人員利用傳播模型做了大量有關(guān)COVID-19的研究工作[1-6]。其中大多數(shù)研究都是基于SIR[7]、SEIR[8]等經(jīng)典傳播模型的改進(jìn):喻孜等人[9]采用基于時(shí)變參數(shù)的SIR模型對(duì)疫情進(jìn)行評(píng)估和預(yù)測(cè),得到了預(yù)期拐點(diǎn)和最大確診數(shù);Joseph T Wu等人[10]基于SEIR模型,利用馬爾科夫鏈蒙特卡羅算法估計(jì)了基本再生數(shù),并預(yù)測(cè)了COVID-19的傳播風(fēng)險(xiǎn);林俊峰[11]在傳統(tǒng)SEIR模型基礎(chǔ)上,重新將潛伏者定義為體溫檢測(cè)和出行軌跡中存在疑點(diǎn)的人群,將感染者定義為“可疑人群”中被確診感染COVID-19的人群;文獻(xiàn)[12]提出了一種SIRU模型,此模型首次提出了未報(bào)告的有癥狀病例的數(shù)量,并且在不同等級(jí)的公共衛(wèi)生防控措施上預(yù)測(cè)疾病趨勢(shì);文獻(xiàn)[13]提出了一種SEllaHR模型,研究了隱性感染和隔離對(duì)COVID-19的影響;Ivan Korolev等人[14]將死亡病例單獨(dú)建立艙室,提出了SEIRD模型;Zhai Z M等人[15]建立了一個(gè)新的預(yù)測(cè)建模,通過(guò)逆推理分析確定了美國(guó)、英國(guó)、意大利和西班牙的COVID-19開始于元旦前后。然而,目前大多數(shù)針對(duì)COVID-19的傳播模型研究具有以下3個(gè)缺陷:1)模型中涉及的參數(shù)都是固定不變的,但在實(shí)際情況中,部分參數(shù)將隨時(shí)間變化;2)涉及的影響因素過(guò)于簡(jiǎn)單,未充分考慮COVID-19的傳播特性;3)模型中狀態(tài)的定義不符合實(shí)際群體特征。基于上述,本研究考慮新型冠狀病毒特有的傳播特性,引入無(wú)癥狀感染狀態(tài),重新定義了潛伏者為病毒傳播過(guò)程中的密切接觸者,建立了基于時(shí)變參數(shù)的SCUIR傳染病模型。
根據(jù)疫情實(shí)際傳播情況,本文所建立模型基于如下假設(shè):
1)忽略少數(shù)非接觸性傳播病例。
2)假設(shè)確診者出現(xiàn)癥狀且被隔離后,不再與易感者接觸。
3)忽略病毒傳播期間人口的自然死亡及自然出生。
4)不考慮連續(xù)變化情況,只考慮以天為單位的離散變化。
在傳統(tǒng)的SEIR模型中,研究對(duì)象存在的狀態(tài)通常分為S(Susceptible)、E(Exposed)、I(Infected)、R(Removed)4種類型,詳細(xì)解釋如下:
1)S:易感者,表示健康人群,接觸傳染源可被感染。單位時(shí)間內(nèi)平均有λ個(gè)易感者與感染者接觸,接觸后被傳染的概率為φ。
2)E:潛伏者,表示感染了病毒但尚未出現(xiàn)癥狀的人群。此階段病毒尚未發(fā)作,不具有傳染性。單位時(shí)間內(nèi)會(huì)有比例ρ的潛伏者出現(xiàn)癥狀轉(zhuǎn)化為感染者,其中ρ為潛伏期的倒數(shù)。
3)I:確診者,表示已經(jīng)出現(xiàn)癥狀的染病者,具有較強(qiáng)的傳染性,可將易感者同化。
4)R:移除者,表示感染病毒后死亡或康復(fù)的人,感染者在痊愈后獲得抗體,不會(huì)再恢復(fù)到易感狀態(tài),感染者單位時(shí)間內(nèi)的移除率為γ。
圖1展示了SEIR模型各狀態(tài)之間的轉(zhuǎn)換,可以看出模型相對(duì)簡(jiǎn)單,不足以模擬COVID-19的實(shí)際傳播情況。
圖1 傳統(tǒng)SEIR模型示意圖Fig.1 Schematic diagram of the traditional SEIR model
在COVID-19的防控中,主要存在兩個(gè)傳播特點(diǎn):1)病毒的密切接觸者通過(guò)一段時(shí)間的隔離觀察,可以確定是否被傳染,因此可以通過(guò)追蹤密切接觸者來(lái)監(jiān)控病毒傳播情況;2)存在大量具有傳染性的無(wú)癥狀感染者,這部分人群攜帶病毒但卻被當(dāng)成健康人,在被發(fā)現(xiàn)或出現(xiàn)癥狀前一直處于自由傳播狀態(tài),在醫(yī)療檢測(cè)條件并不充足的疫情初期,無(wú)癥狀感染者難以被第一時(shí)間發(fā)現(xiàn)并隔離,所以此類人群對(duì)疫情的發(fā)展將產(chǎn)生重要影響。
綜上所述,本文基于SEIR模型做出如下改進(jìn),提出SCUIR模型:
1)重新定義潛伏者(E)為病毒的密切接觸者C(Contacted),即未采取有效防護(hù)措施與傳染源近距離接觸的易感者。此類人群可能攜帶病毒也可能不攜帶病毒,密切接觸者中的病毒攜帶者當(dāng)處于醫(yī)學(xué)觀察或被隔離狀態(tài)時(shí),一旦出現(xiàn)癥狀將立即成為確診病例,而未攜帶病毒的密切接觸者經(jīng)過(guò)觀察期后回歸到易感人群中。
2)引入無(wú)癥狀感染者狀態(tài)U(Undiscovered)。將病毒傳播過(guò)程中未出現(xiàn)癥狀且混在健康人群中的病毒攜帶者定義為無(wú)癥狀感染者(U),此類人群具有傳染能力卻未被發(fā)現(xiàn),未受到任何強(qiáng)制隔離措施,在病毒潛伏期一直處于自由傳播狀態(tài),這種情況下,其傳播能力將遠(yuǎn)大于攜帶病毒的密切接觸者(C),將無(wú)癥狀感染者群體單獨(dú)分離建立的傳染病模型更能模擬出真實(shí)的傳播情況。
3)重新定義確診者(I)。由于密切接觸者(C)群體處于實(shí)時(shí)監(jiān)控狀態(tài),出現(xiàn)臨床感染癥狀后會(huì)被第一時(shí)間執(zhí)行嚴(yán)格的隔離措施,并且隨著疫情防控措施的升級(jí),無(wú)癥狀感染者(U)出現(xiàn)癥狀后也會(huì)第一時(shí)間做核酸檢測(cè)或上報(bào)政府,進(jìn)而被隔離。在絕大多數(shù)情況下,處于隔離治療狀態(tài)的感染者不會(huì)再與易感者接觸,直至死亡或治愈出院。故本文認(rèn)為確診者(I)不具備傳染性。
本文提出的SCUIR模型中各狀態(tài)轉(zhuǎn)換示意如圖2所示:
圖2 SCUIR模型示意圖Fig.2 Schematic diagram of the SCUIR model
本研究認(rèn)為易感者(S)可被感染病毒的密切接觸者(C)、無(wú)癥狀感染者(U)傳染。病毒感染者在被確診后,與他在無(wú)有效防護(hù)情況下有過(guò)密切接觸的人就會(huì)被轉(zhuǎn)化為密切接觸者(C),假設(shè)感染病毒的密切接觸者在潛伏期間平均密切接觸λ1個(gè)易感者(S),被確診的無(wú)癥狀感染者在未出現(xiàn)癥狀前平均密切接觸λ2個(gè)易感者(S),無(wú)癥狀感染者(U)在單位時(shí)間內(nèi)可將α個(gè)易感者傳染轉(zhuǎn)化為無(wú)癥狀感染者。則易感者的動(dòng)力學(xué)方程可表示為
(1)
密切接觸者(C)可由易感者(S)轉(zhuǎn)化,感染病毒的密切接觸者(占C比例為p)在經(jīng)過(guò)病毒潛伏期后出現(xiàn)癥狀,轉(zhuǎn)化為感染者(I),μ為單位時(shí)間內(nèi)感染病毒的密切接觸者轉(zhuǎn)化為感染者的比例,同時(shí)未感染病毒的密切接觸者(占C比例為1-p)經(jīng)過(guò)觀察期后回歸易感狀態(tài)。則密切接觸者(C)的動(dòng)力學(xué)方程為
(2)
無(wú)癥狀感染者(U)可通過(guò)接觸將病毒傳播給易感者(S),將其轉(zhuǎn)化為U類人群,也可能在檢測(cè)時(shí)被發(fā)現(xiàn)感染病毒,轉(zhuǎn)化為確診者(I)。無(wú)癥狀感染者分為兩類,一類是由于監(jiān)測(cè)措施尚未到位,健康群體中存在許多未檢測(cè)出來(lái)的病毒攜帶者,另一類人群攜帶病毒,但是由于機(jī)體免疫力較強(qiáng),未出現(xiàn)染病癥狀,經(jīng)過(guò)一段時(shí)間會(huì)自愈。無(wú)癥狀感染者的動(dòng)力學(xué)方程為
(3)
密切接觸者(C)出現(xiàn)臨床癥狀后被確診成為感染者(I),無(wú)癥狀感染者在經(jīng)過(guò)潛伏期后出現(xiàn)癥狀也會(huì)被確診,感染者(I)經(jīng)過(guò)隔離治療后會(huì)康復(fù)或死亡,從而轉(zhuǎn)化為移除者(R)。感染者(I)的動(dòng)力學(xué)方程為
(4)
移除者(R)由無(wú)癥狀感染者(U)中的自愈者和感染者(I)中的康復(fù)者或死亡者組成,其動(dòng)力學(xué)方程如式(5)所示。
(5)
官方公布的數(shù)據(jù)均以天為單位,因此本文僅考慮離散變化情況,將微分方程轉(zhuǎn)換為如式(6)的差分方程。
(6)
本文所建立的模型中共包含9個(gè)參數(shù),其詳細(xì)含義如表1所示。根據(jù)官方公布的真實(shí)數(shù)據(jù),可以對(duì){α,β1,β2,μ}的值進(jìn)行估計(jì),{λ1,λ2,p}的值無(wú)法通過(guò)已知數(shù)據(jù)直接獲取,將采用參數(shù)反演來(lái)測(cè)定最優(yōu)值。
表1 模型參數(shù)解釋Tab.1 Model′s parameters
參數(shù)優(yōu)化方程式如(7),優(yōu)化目標(biāo)為實(shí)際數(shù)據(jù)值與模擬數(shù)據(jù)值的偏差最小。本文介紹兩種式(7)的求解方法,其中一種是,在已知{α,β1,β2,μ}值的情況下,分別求{λ1,λ2,p}的偏導(dǎo)數(shù),得到一個(gè)三元方程組,求解方程組即可得到參數(shù)最優(yōu)值,此外,也可采用枚舉法得到最優(yōu)值。
(7)
考慮部分參數(shù)會(huì)隨時(shí)間增長(zhǎng)發(fā)生變化,故本文將其設(shè)置為時(shí)變參數(shù)。設(shè)γc,t和γd,t分別為日治愈率和日死亡率,其數(shù)值為當(dāng)天新增出院人數(shù)和新增死亡人數(shù)占前一天感染者人數(shù)的比率,對(duì)實(shí)際數(shù)據(jù)進(jìn)行擬合,結(jié)果如圖3所示。
圖3 時(shí)變參數(shù)擬合結(jié)果Fig.3 Fitting results for time-varying parameter
湖北省的治愈率和死亡率呈現(xiàn)出明顯的隨時(shí)間變化而變化的趨勢(shì)(見(jiàn)圖3),因此,采用時(shí)變參數(shù)才能正確模擬疫情發(fā)展的真實(shí)情況。時(shí)變參數(shù)擬合結(jié)果使用Power函數(shù)描述,結(jié)果如表2所示。
表2 時(shí)變參數(shù)擬合結(jié)果Tab.2 The fitting results for time-varying parameter
本研究基于中國(guó)湖北省衛(wèi)生健康委員會(huì)官網(wǎng)(http://wjw.hubei.gov.cn)公布的湖北省2020年1月15日—2020年4月26日的疫情數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。為驗(yàn)證本文模型的性能優(yōu)越性,同時(shí)基于SIR模型、SEIR模型進(jìn)行模擬實(shí)驗(yàn),并對(duì)比結(jié)果,評(píng)價(jià)指標(biāo)為與實(shí)際活躍病例數(shù)的均方根誤差(RMSE)和平均相對(duì)誤差(MAPE)。由于2020年2月12日之前,國(guó)家衛(wèi)生健康委員會(huì)公布的確診病例數(shù)據(jù)不包括臨床診斷病例,導(dǎo)致實(shí)際數(shù)據(jù)在2020年2月12日出現(xiàn)斷層。此外,在中國(guó)政府針對(duì)新冠肺炎疫情采取的一系列重要措施的影響下,新增確診人數(shù)于2020年3月18日實(shí)現(xiàn)了第1次新增確診人數(shù)為0,標(biāo)志著疫情被基本控制。綜合以上數(shù)據(jù)特征,本文選取湖北省2020年1月25日至2020年3月18日的數(shù)據(jù)進(jìn)行擬合,并以2020年2月12日為時(shí)間節(jié)點(diǎn),分為兩個(gè)時(shí)間段進(jìn)行分析:1)第1階段為2020年1月25日至2020年2月11日;2)第2階段為2020年2月12日至2020年3月18日。
疫情初期官方公布的數(shù)據(jù)中并未包括無(wú)癥狀感染者數(shù)量,本文根據(jù)無(wú)癥狀感染者占活躍病例的平均比例來(lái)設(shè)定U0值,S0值為去除非易感狀態(tài)人群的湖北省總?cè)丝冢瑊C0,I0,R0}值采用2020年1月25日湖北省的真實(shí)數(shù)據(jù),實(shí)驗(yàn)結(jié)果如表3、圖4所示。圖4顯示:SIR模型擬合結(jié)果在2月5日前明顯低于實(shí)際值,并于2月11日呈現(xiàn)出提前出現(xiàn)拐點(diǎn)的趨勢(shì);SEIR模型擬合結(jié)果呈現(xiàn)出加速上漲趨勢(shì),至2月12日較真實(shí)數(shù)據(jù)誤差超過(guò)14%;SCUIR模型擬合趨勢(shì)明顯更好,并且相對(duì)誤差始終保持在4%以內(nèi)。表4展示了3種模型的評(píng)價(jià)結(jié)果,SCUIR模型的擬合精度最高,其中,均方根誤差值(RMSE)比SIR模型縮小了14%,比SEIR模型縮小了39%,平均相對(duì)誤差值(MAPE)比SIR模型縮小了16.8%,比SEIR模型縮小了32%。
表3 湖北省第1階段參數(shù)值Tab.3 The first stage simulation parameter value of Hubei Province
圖4 第1階段模擬結(jié)果Fig.4 The first stage simulation results
表4 第1階段模型評(píng)價(jià)Tab.4 The evaluation for the first stage model
表3所示第1階段各參數(shù)值中,無(wú)癥狀感染者平均感染人數(shù)達(dá)到了0.473人,這表明:由于民眾自我防控意識(shí)低、醫(yī)療檢測(cè)條件尚未完善等原因,導(dǎo)致無(wú)癥狀感染者完全屬于自由傳播狀態(tài),屬于高傳播風(fēng)險(xiǎn)水平。密切接觸者的密切接觸人數(shù)λ1與無(wú)癥狀感染者的密切接觸人數(shù)λ2分別為1.18人、2.11人,λ2值為λ1值的1.78倍,說(shuō)明無(wú)癥狀感染者的危險(xiǎn)性要遠(yuǎn)高于密切接觸者中的病毒攜帶者。此外,第1階段密切接觸者中的病毒攜帶者比例(p值)達(dá)到35.5%,這表明通過(guò)追蹤并隔離密切接觸者人群可以控制大部分被傳染的患者,從而有效防止病毒的進(jìn)一步擴(kuò)散。
第2階段模型初始值設(shè)置為湖北省衛(wèi)生健康委員會(huì)官網(wǎng)2020年2月12日公布的數(shù)據(jù),由于第2階段國(guó)家采取的防控措施與第1階段存在差異,將導(dǎo)致模型參數(shù)發(fā)生變化,實(shí)驗(yàn)結(jié)果如表5、圖5所示。
表5展示了湖北省疫情第2階段的實(shí)驗(yàn)結(jié)果,其中,無(wú)癥狀感染者平均感染人數(shù)α較第1階段減小了94.1%,無(wú)癥狀感染者平均密切接觸人數(shù)λ2減小了40.3%,說(shuō)明隨著中國(guó)政府限制大規(guī)模集會(huì)、控制出行等措施的開展以及民眾自我防護(hù)意識(shí)的增強(qiáng),疫情正在被有效控制。另外,無(wú)癥狀感染者的日確診率β1增大了3.83倍,說(shuō)明隨著病毒檢測(cè)周期的縮短,隱藏在人群中的無(wú)癥狀感染者在被快速發(fā)現(xiàn)。觀察圖5、表6可以看到本文模型很好地復(fù)現(xiàn)了2020年2月12日至2020年3月18日湖北省疫情發(fā)展趨勢(shì),并且相比于SIR模型的RMSE值、MAPE值分別縮小了9.5%,8.3%,比SEIR模型的RMSE值、MAPE值分別縮小了10.5%,13.2%,進(jìn)一步體現(xiàn)了本文模型的優(yōu)越性。
表5 湖北省第2階段參數(shù)值Tab.5 The second stage simulation parameter value of Hubei Province
圖5 第2階段模擬結(jié)果Fig.5 Second stage simulation results
表6 第2階段模型評(píng)價(jià)Tab.6 The evaluation for the second stage model
對(duì)完整時(shí)間段(2020年1月25日—2020年4月26日)的回溯中,2020年1月25日—2020年2月12日數(shù)據(jù)采用調(diào)整后的數(shù)據(jù)(加上2月12日之前官方未公布的臨床診斷病例)。圖6a展示了3種模型的擬合結(jié)果,從宏觀趨勢(shì)來(lái)看,SCUIR模型的擬合結(jié)果相比較于SIR模型、SEIR模型與實(shí)際疫情發(fā)展趨勢(shì)最為吻合。其中,SIR模型由于未能考慮疾病的潛伏期、無(wú)癥狀感染者等傳播特性,導(dǎo)致擬合結(jié)果中的活躍病例數(shù)呈現(xiàn)隨時(shí)間快速上升/下降,擬合活躍病例數(shù)峰值大于疫情的實(shí)際規(guī)模且峰值出現(xiàn)時(shí)間有較大偏差。SEIR模型雖然考慮了疾病的潛伏期,但是未考慮無(wú)癥狀感染者的自愈以及確診者的嚴(yán)格隔離對(duì)病毒傳播的阻斷作用,盡管模型擬合的活躍病例數(shù)峰值出現(xiàn)的時(shí)間與實(shí)際情況很接近,但是其模擬結(jié)果與實(shí)際疫情發(fā)展規(guī)模依舊存在較大偏差。而SCUIR模型補(bǔ)充了上述模型的不足,并且治愈率、死亡率采用了更為合理的時(shí)變參數(shù),因此,實(shí)驗(yàn)結(jié)果中的病例數(shù)峰值出現(xiàn)時(shí)間、疫情發(fā)展趨勢(shì)都與實(shí)際數(shù)據(jù)最為吻合,模擬精度最高,與實(shí)際數(shù)據(jù)的擬合誤差較SIR模型、SEIR模型分別縮小了47.6%,26.4%。
除了官方數(shù)據(jù)涉及的人群分類,SCUIR模型還能夠計(jì)算出官方數(shù)據(jù)無(wú)法完全統(tǒng)計(jì)的無(wú)癥狀感染人群數(shù)量(見(jiàn)圖6b)。無(wú)癥狀感染者在未采取隔離措施的情況下自由傳播病毒,具有相當(dāng)大的危險(xiǎn)性,在整個(gè)疫情傳播期間持續(xù)出現(xiàn)了無(wú)癥狀感染病例,尤其在疫情后期,現(xiàn)存無(wú)癥狀感染病例數(shù)量甚至超過(guò)了活躍確診病例數(shù)量,因此,政府等相關(guān)機(jī)構(gòu)不可放松警惕,應(yīng)加強(qiáng)對(duì)無(wú)癥狀感染者的發(fā)現(xiàn)、報(bào)告和管理工作。
本文結(jié)合COVID-19的特殊傳播特性,采用時(shí)變參數(shù),提出了一種包括“易感狀態(tài),密切接觸狀態(tài),無(wú)癥狀感染狀態(tài),確診狀態(tài),移除狀態(tài)”等5類狀態(tài)的SCUIR傳播模型。利用中國(guó)湖北省的真實(shí)疫情數(shù)據(jù)進(jìn)行了實(shí)驗(yàn)驗(yàn)證,結(jié)果表明:1)SCUIR模型對(duì)于COVID-19的歷史數(shù)據(jù)具有更高的擬合精度,各離散點(diǎn)的相對(duì)誤差基本在5%以內(nèi),比SIR模型總體降低了8.3%~47.6%的擬合誤差,比SEIR模型總體降低了10.5%~32%的擬合誤差;2)SCUIR模型可以挖掘出在實(shí)際疫情數(shù)據(jù)統(tǒng)計(jì)中難以完全統(tǒng)計(jì)的隱藏?cái)?shù)據(jù),例如本實(shí)驗(yàn)中的無(wú)癥狀感染者數(shù)量,進(jìn)一步刻畫了疫情傳播機(jī)理。不僅如此,本文模型可以通過(guò)定量控制參數(shù)模擬不同防控措施,相應(yīng)的模型擬合結(jié)果可以更直觀地評(píng)估不同措施對(duì)疫情發(fā)展的影響,有利于制定合理、高效的防疫政策。總而言之,SCUIR模型對(duì)于與COVID-19有相似傳播特性的疫情防控有較大的指導(dǎo)和參考價(jià)值。