李 昊,段德光,陶學強,陳 恩,高樹田
(軍事科學院系統(tǒng)工程研究院衛(wèi)勤保障技術研究所,天津300161)
傳染病防控能力建設事關人民生命健康與國家社會穩(wěn)定。面對日益嚴峻的傳染病防控形勢,傳染病動力學模型在傳染病疫情發(fā)展趨勢預測、科學防控指導與評估中持續(xù)發(fā)揮著重要作用,為公共衛(wèi)生管理者的決策與高效干預措施的實施提供了重要數(shù)據(jù)依據(jù)和理論支撐[1]。
本文首先梳理具有代表性的傳染病動力學模型,然后結合新型冠狀病毒肺炎(COVID-19,以下簡稱“新冠肺炎”)疫情發(fā)展現(xiàn)狀,探討國內外研究者開展的基于傳染病動力學模型的新冠肺炎疫情仿真預測研究成果,最后提出對未來發(fā)展的一些思考建議。
傳染病動力學模型通過假設、參數(shù)、變量以及它們之間的聯(lián)系定量揭示傳染病主要特征,依托疫情暴發(fā)早期數(shù)據(jù),納入未來不確定性,幫助發(fā)現(xiàn)傳染病傳播機理,科學預測疫情流行趨勢。傳染病動力學模型根據(jù)數(shù)學表現(xiàn)形式可分為兩大類:決定論模型和網絡動力學模型。目前,以一般增長模型和室模型等為代表的決定論模型仍占據(jù)重要學術地位,但是隨著人工智能與計算機技術的發(fā)展,以元胞自動機和人工神經網絡等為代表的網絡動力學模型也逐漸被關注并應用。
決定論模型的基本假設是目標區(qū)域種群總數(shù)為常數(shù)或漸近常數(shù),模型表達形式以微分方程為主,根據(jù)建模依據(jù)還可以將決定論模型細分為現(xiàn)象學模型和機理學模型?,F(xiàn)象學模型主要依托經驗觀察結果,強調模型研究對象對經驗觀察結果的可重現(xiàn)性;而機理學模型則考慮疫情傳播動力學機理,基于一系列微分方程實現(xiàn)影響疾病傳播過程的參數(shù)定量化,進而闡釋目標人群中流行病學狀態(tài)的發(fā)展過程[2]。
1.1.1 現(xiàn)象學模型
(1)GGM(generalized-growth model)模型。GGM模型已被證明適用于描述和預測傳染病早期增長模式[3-4],其微分方程如下:
其中,C'(t)為新增確診病例數(shù),C(t)為累計確診病例數(shù),r 為無干預條件下的自然增長率,p 為增長減速因子。
累計確診病例函數(shù)C(t)在p=0 時,呈線性增長;在p=1 時,呈指數(shù)增長;在0
(2)GRM(generalized Richards model)模型。GRM模型是對原始Richards 增長模型[5]的擴展優(yōu)化,可模擬實現(xiàn)疫情暴發(fā)早期常見的亞指數(shù)增長模式,同時也具備較好的疫情峰后發(fā)展預測能力[6-7]。其微分方程表達如下:
其中,C'為新增確診病例數(shù),C 為累計確診病例數(shù)。模型中包含4 個自由參數(shù):無干預條件下的自然增長率r、增長減速因子p、模型與經典S 型增長曲線偏差的衡量參數(shù)a 及種群總體數(shù)量K。
1.1.2 機理學模型
(1)SIR(susceptible-infected-recovered)模型。Kermack 等[8]于1927年首次提出SIR 模型(如圖1所示),假定目標地區(qū)人群數(shù)為常數(shù)且康復后不再被傳染,將目標人群劃分為易感人群(S)、感染人群(I)、恢復人群(R)3 類,構建如下SIR 模型及微分方程:
其中,以天為基本時間單位時,λ 為日接觸率,β 為日傳染率,γ 為日治愈率,進而估測傳染病的基本再生數(shù)R0(R0=β/γ)以及更有指導意義的有效再生數(shù)Rt[Rt=R0×S(t)/N(N 為目標人群總數(shù))]。
圖2 SEIR 模型[9]
(2)SEIR(susceptible-exposed-infected-removed)模型。SEIR 模型[9](如圖2 所示)是目前最具代表性的固定人群傳染病動力學研究數(shù)學模型。該模型考慮了傳染病潛伏期特征,在SIR 模型基礎上增設潛伏期人群(E),構建如下SEIR 模型及微分方程:
其中,以天為基本時間單位時,λ 為日接觸率,β 為日傳染率,σ 為致病率,γ 為移出率(包含康復與死亡)。
基于上述4 個定量參數(shù),可以估測傳染病的基本再生數(shù)R0、有效再生數(shù)Rt,持續(xù)跟蹤每日新增確診病例C'(t)[C'(t)=σE(t)]與累計確診病例C(t)[C(t)=I(t)+R(t)]的變化趨勢。
網絡動力學模型主要研究動力學模型在不同網絡上的性質以及與相應網絡靜態(tài)統(tǒng)計性質的聯(lián)系,具有結構與規(guī)則固定的特征。目前,在傳染病理論研究中應用較廣、具有代表性的網絡動力學模型研究方法包括元胞自動機(cellular automata,CA)、人工神經網絡(artificial neural network,ANN)等。
1.2.1 元胞自動機模型
元胞自動機模型是由一系列模型構造的規(guī)則構成,不依靠嚴格定義的物理方程或函數(shù)來確定,在時間、空間、狀態(tài)上都離散,且空間相互作用和時間因果關系為局部的網格動力學模型,具有模擬復雜系統(tǒng)時空演化過程的能力[10-11]。元胞自動機的概念于20 世紀40年代由馮·諾依曼提出,在20 世紀80年代開展了全面的研究與分類[12],自20 世紀90年代中期開始被廣泛應用于傳染病傳播過程的描述與研究。
元胞自動機屬于一個方法框架,可視為由一個元胞空間和定義于該空間的變換函數(shù)組成,具體可用一個四元組形式[13]表示:
其中,CA 代表一個元胞自動機系統(tǒng);Ld代表一個任意正整數(shù)維(通常為一維或二維)的規(guī)則網格空間,包含若干網格單元(即元胞,cell);S 代表一個離散的有限集合,用來表示各個元胞的狀態(tài);N 代表含中心元胞的鄰居集合;f 為狀態(tài)轉換函數(shù)或局部規(guī)則,即根據(jù)t 時刻某個元胞(中心元胞)的所有鄰居的狀態(tài)組合來確定t+1 時刻該元胞的狀態(tài)值。
1.2.2 人工神經網絡模型
人工神經網絡模型是一類仿生型網絡動力學模型,具有自組織、自適應及自學習功能,其依據(jù)生物體神經系統(tǒng)的工作原理,將諸多節(jié)點人工神經元(基本單元)以一定的規(guī)則或方式連接形成網絡,模擬展現(xiàn)系統(tǒng)的整體性行為[14-15]。誤差反向傳播(back propagation,BP)神經網絡模型(如圖3 所示)是人工神經網絡中應用最廣泛的一種模型。
圖3 BP 神經網絡模型
基于以BP 神經網絡為代表的人工神經網絡構建傳染病數(shù)學模型可以依托網絡連接權系數(shù)實現(xiàn)高度并行分布式處理,具備聯(lián)想記憶、自組織、自學習能力,通過訓練學習可以逼近任意非線性映射,對傳染病流行趨勢具有較高的預測精度[16-17]。
本次新冠肺炎疫情由新型冠狀病毒(SARSCoV-2)引起,世界衛(wèi)生組織預測新型冠狀病毒基本再生數(shù)R0為1.4~2.5,具有潛伏期(平均3~7 d),且潛伏期也存在傳染性;人群普遍易感,并可持續(xù)人傳人;病毒主要依靠飛沫傳播和接觸傳播,存在氣溶膠傳播(限于相對封閉環(huán)境內長時間暴露于高濃度氣溶膠條件下)與糞-口傳播可能性,多數(shù)感染可導致新冠肺炎,存在無癥狀感染者且具有一定傳染性[18-19]。
由于暴發(fā)突然,加之春運期間人口遷移規(guī)模龐大[20-21],本次新冠肺炎疫情的蔓延速度和防控難度前所未有。截至2020年3月5 日24 時,31 個?。ㄗ灾螀^(qū)、直轄市)和新疆生產建設兵團報告累計確診病例80 552 例,累計死亡病例3 042 例,累計治愈病例53 726 例[22-23]。武漢“封城”(1月23 日)以來的疫情發(fā)展情況如圖4 所示。
本次新冠肺炎疫情存在潛伏期與無癥狀感染者,因此,絕大多數(shù)研究者基于經典的決定論模型(如SEIR 模型[24-29]、SIR 模型[30-31]、GGM 模型[32]等)開展疫情仿真與發(fā)展預測,基于訓練的人工智能(AI)[29]或機器學習[31]方法也有一定的輔助應用。具有代表性的研究模型及特點匯總見表1。
SEIR 模型特別考慮了傳染病存在潛伏期的情況,因此在本次新冠肺炎疫情仿真預測中的應用最為普遍。其中,范如國等[24]模擬不同潛伏期(5、7、10 d)對應的武漢峰值確診病例(29 000、31 500、34 100例),并預測武漢疫情拐點將出現(xiàn)在2月20 日至25 日。耿輝等[25]估算病毒基本再生數(shù)R0≈2.4~2.7,通過仿真發(fā)現(xiàn)基于嚴格限制出行的隔離措施可使?jié)摲诤透腥救巳旱姆逯到档?5.71%和29.90%,預測武漢最晚于3月初出現(xiàn)疫情拐點。魏永越等[26]基于SEIR+CAQ模型驗證了每日新增確診病例變化曲線已在2月初達到峰值,并較準確地預測了2月底全國的累計確診病例數(shù)(預測80 417 例,官方2月29 日數(shù)據(jù)為79 824 例[22])。曹盛力等[27]開展湖北省疫情的回溯研究,評估并驗證了防控隔離和醫(yī)學追蹤隔離對疫情大面積擴散的有效遏制作用,以及集中收治對感染人數(shù)峰值迅速回落的關鍵影響。Tang 等[28]通過仿真發(fā)現(xiàn)密切接觸者追蹤隔離可有效降低病毒有效再生數(shù)Rt和傳播風險,武漢及時采取“封城”舉措可有效降低北京隨后1 周內確診病例數(shù)(較未采取封城舉措,降幅可達91.14%),并比較準確地預測了國內每日新增確診人數(shù)達到峰值的時間(預測2月5 日前,實際2月4 日)。鐘南山團隊[29]科學考慮了武漢“封城”前后的人口遷移情況,通過干預措施評估發(fā)現(xiàn),如果武漢“封城”管控措施推遲5 d 實施,國內疫情規(guī)模將擴大至3 倍;降低武漢管控力度,很可能導致湖北省3月中旬出現(xiàn)二次疫情高峰。該團隊還創(chuàng)新結合訓練的AI 方法(基于2003年SARS 數(shù)據(jù))輔助預測疫情流行趨勢,做出了基本符合疫情實際發(fā)展趨勢的權威預測:國內疫情將于2月下旬達到高峰,截至4月底國內疫情現(xiàn)存確診病例將不高于70 000 例,湖北省不高于52 000 例,廣東省和浙江省不高于1 200 例[29]。
此外,喻孜等[30]考慮了病毒潛伏期及早期診斷周期帶來的時間延遲效應,擬合獲得具有時變特性的參數(shù)變化方程,解讀了疫情早期重要防控手段實施的影響效果,預測了國內現(xiàn)存確診病例數(shù)峰值(預測54 000 例,官方公布58 016 例[22])及出現(xiàn)時間(預測2月9 日左右,官方公布為2月17 日[22])。王志心等[31]估計疫情在2月13 日左右出現(xiàn)拐點,結合SIR 模型與機器學習的方法,評估國內重要省市疫情嚴重程度,并預測疫情最終確診病例在75 000 例左右。張琳[32]基于GGM 模型,分無障礙指數(shù)增長、次指數(shù)增長及次線性增長3 個階段做出與疫情實際數(shù)據(jù)吻合度較高的模型擬合,在揭示新冠肺炎疫情傳播機理及發(fā)展趨勢預測方面開展了有益探索。
圖4 新冠肺炎疫情數(shù)據(jù)變化曲線
表1 應用于新冠肺炎疫情預測的代表性傳染病動力學模型及特點
綜上所述,決定論模型在應用中往往能給出與實際統(tǒng)計結果符合度較好的結果,在本次新冠肺炎疫情發(fā)展預測中也被廣泛應用并發(fā)揮了較好的數(shù)據(jù)理論支撐與科學防控指導作用;網絡動力學模型從研究方法和適用對象上更加適合傳染病傳播趨勢模擬的復雜性要求,通過對以往疫情數(shù)據(jù)或目前有限數(shù)據(jù)的學習,也發(fā)揮了疫情發(fā)展輔助預測與驗證作用。
傳染病傳播過程中自然因素和人為因素的相互交織大大增加了建模仿真預測的復雜性,必須要在全面了解疾病傳播特征與重要影響因素的基礎上,提出合理假設,構建科學的數(shù)學模型與驗證方法,充分挖掘疫情發(fā)展數(shù)據(jù)的內在規(guī)律,有效控制模型參數(shù)的可識別性、適度敏感性,才能做出科學合理的疫情發(fā)展預測,有效指導疫情防控與救治工作。
傳染病動力學模型在本次新冠肺炎疫情的仿真預測應用中仍然存在一定局限性:
(1)新冠肺炎疫情暴發(fā)期間正值春運,人口遷移因素不可忽視,導致以?。ㄊ校檠芯繉ο蟮臎Q定論模型中種群總數(shù)為常數(shù)或漸近常數(shù)的基本假設缺乏合理性。
(2)新冠肺炎疫情的綜合防控措施相輔相成,現(xiàn)有的傳染病動力學模型研究難以納入疫情發(fā)展與防控中所有重要的影響因素,仿真預測結果結論或多或少存在片面性。
(3)決定論模型的參數(shù)敏感性較強,而本次以武漢為輻射中心的新冠肺炎在全國各省市的傳播存在一定的空間異質性與時間遲滯性,采用統(tǒng)一模型與參數(shù)設定的全國疫情發(fā)展預測結果科學性有待驗證。
(4)鑒于暴發(fā)初期疫情數(shù)據(jù)的有限性與不完整性以及以往疫情數(shù)據(jù)的差異性,基于數(shù)據(jù)學習的網絡動力學模型單獨應用并開展科學預測仍然存在不少限制。
(1)加強傳染病的快速認知與防控能力。及時了解傳播機理,科學部署防控干預措施,為準確構建傳染病動力學模型提供理論支撐和政策指導。
(2)構建全面的疫情信息實時共享平臺。明確統(tǒng)計規(guī)則,嚴格上報時限,為模型擬合與參數(shù)估算提供精確完整的數(shù)據(jù)支撐。
(3)推進多傳染病動力學研究的多模型結合應用。充分利用經典決定論模型與新興網絡動力學模型優(yōu)勢,提升模型的自適應性與仿真預測科學合理性。
傳染病動力學模型在傳染病傳播與發(fā)展的理論性研究與科學防控指導方面發(fā)揮著重要作用。未來傳染病動力學模型的研究需要滿足傳染病傳播與防控過程的復雜性要求,需要在加強傳染病的快速認知與防控、推進疫情信息實時共享、探索多模型結合應用的基礎上,充分利用計算機科學與智能化前沿技術發(fā)展成果,持續(xù)為公共衛(wèi)生決策與政策制定者提供理論支撐與數(shù)據(jù)支持。