尹天露,劉朝杰,張新國,趙李偉,高曉歡
本文價值:
(1)本文對多個國家在新型冠狀病毒肺炎(COVID-19)疫情中采用的不同流行病學(xué)模型的分析模式進(jìn)行梳理、評價、比較,總結(jié)各國經(jīng)驗(yàn),對預(yù)測COVID-19疫情下一步的發(fā)展趨勢及構(gòu)建其預(yù)測模型、COVID-19疫情防控具有重要的現(xiàn)實(shí)意義。(2)本文匯總了各國的防控建議,可為當(dāng)前世界COVID-19疫情防控提供決策依據(jù)。(3)本文以COVID-19疫情為例,研究流行病學(xué)模型在突發(fā)公共衛(wèi)生事件中的應(yīng)用現(xiàn)狀及存在的問題,為我國未來重大傳染病防控提供預(yù)測模型方法學(xué)參考。
新型冠狀病毒肺炎(COVID-19)的暴發(fā)及其在全國及世界范圍內(nèi)的擴(kuò)散、傳播造成了巨大的社會影響,自COVID-19疫情暴發(fā)以來,各地各層衛(wèi)生機(jī)構(gòu)采取了積極的防控救援建設(shè)行動。我國劉廷杰等[1]、胡艷等[2]、吳艷玲等[3]、李映霞等[4]分別通過調(diào)查中國不同城市的COVID-19發(fā)病率、暴露史等疫情數(shù)據(jù),分析當(dāng)?shù)谻OVID-19確診病例流行病學(xué)特征,為當(dāng)?shù)匾咔榉揽亟ㄔO(shè)的提升提供了科學(xué)依據(jù)。研究流行病傳播動力學(xué)特征有助于更好地對疫情進(jìn)行掌控和防治,是目前全世界共同面對的極其重要的科學(xué)課題,通過對多個國家在COVID-19疫情中采用的不同流行病學(xué)模型的分析模式進(jìn)行梳理、評價、比較,總結(jié)各國經(jīng)驗(yàn),并預(yù)測下一步的發(fā)展趨勢,同時構(gòu)建COVID-19疫情變化趨勢的合理預(yù)測模型,對COVID-19疫情防控?zé)o疑具有重要的現(xiàn)實(shí)意義,這不僅可對我國未來重大傳染病的防控提供預(yù)測模型方法學(xué)參考,而且也可對當(dāng)前世界COVID-19疫情防控提供決策依據(jù)。本研究通過范圍綜述(scoping review)的方法,系統(tǒng)地梳理了流行病學(xué)模型在COVID-19傳播預(yù)測中的應(yīng)用現(xiàn)狀及存在的問題,以期為健康中國背景下我國突發(fā)公共衛(wèi)生事件的預(yù)測及預(yù)防提供經(jīng)驗(yàn)借鑒。
1.1 研究設(shè)計 本研究利用范圍綜述方法研究流行病學(xué)模型在COVID-19傳播、預(yù)測中的應(yīng)用進(jìn)展及存在的問題。范圍綜述在解決探索性研究問題時優(yōu)于系統(tǒng)綜述。系統(tǒng)綜述旨在對一個已知研究領(lǐng)域的信息進(jìn)行整合,從而回答某一特定問題的特定干預(yù)的有效性。相反,范圍綜述鎖定了特定研究領(lǐng)域中的關(guān)鍵概念、證據(jù)類型和研究間的差距。相對于系統(tǒng)綜述而言,范圍綜述包括系統(tǒng)地檢索、選擇和整合研究證據(jù)。
1.2 研究問題 流行病學(xué)模型在COVID-19傳播、預(yù)測中的應(yīng)用現(xiàn)狀如何?
1.3 文獻(xiàn)檢索策略 (1)初步確定檢索詞為“新型冠狀病毒肺炎(COVID-19)”和“預(yù)測(prediction)”或“模型(model)”。(2)執(zhí)行最終文獻(xiàn)檢索策略。計算機(jī)檢索中國期刊全文數(shù)據(jù)庫、維普中文科技期刊全文數(shù)據(jù)庫、萬方數(shù)據(jù)知識服務(wù)平臺、中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫、PubMed、The Cochrane Library并手工檢索相關(guān)文獻(xiàn),檢索時間為數(shù)據(jù)庫建庫至2020年6月。
1.4 文獻(xiàn)篩選 通過閱讀標(biāo)題和摘要篩選合格的文獻(xiàn)。文獻(xiàn)納入標(biāo)準(zhǔn):研究主題為COVID-19疫情的預(yù)測模型,明確數(shù)據(jù)來源,明確預(yù)測模型建立所用的方法。文獻(xiàn)排除標(biāo)準(zhǔn):重復(fù)文獻(xiàn)。
1.5 數(shù)據(jù)提取 數(shù)據(jù)提取內(nèi)容主要包括第一作者、發(fā)表年份、數(shù)據(jù)來源、模型類型、疫情防控建議。
2.1 一般情況 初步檢索文獻(xiàn)519篇,刪除重復(fù)文獻(xiàn)218篇,通過閱讀標(biāo)題和摘要篩選合格的文獻(xiàn)45篇[5-49](見圖1)。納入文獻(xiàn)共涉及24個國家,分別為中國、美國、西班牙、意大利、法國、德國、英國、土耳其、伊朗、俄羅斯、巴西、加拿大、比利時、荷蘭、瑞士、瑞典、丹麥、印度、韓國、智利、新加坡、日本、奧地利、挪威。模型類型有9大類,分別為倉室模型(SIR模型)、傳播動力學(xué)模型(SEIR模型)、新時滯動力學(xué)模型(TDD-NCP模型)、邏輯增長模型(Logistic增長模型)、增長模型、自回歸積分滑動平均模型(ARIMA模型)、指數(shù)平滑預(yù)測模型(Holt模型)、SEAQIR模型、其他模型〔AI(a hybrid artificial-intelligence)模型、離散變量隨機(jī)概率方法、平滑指數(shù)模型、新發(fā)傳染病傳播動力學(xué)模型、手機(jī)定位大數(shù)據(jù)的捕獲再捕獲模型、Bernstein基函數(shù)建模二階導(dǎo)數(shù)模型、常微分方程框架組成的模型、the Verhulst equation模型、集合種群模型〕(見表1)。
2.2 預(yù)測模型分析
2.2.1 SIR模型 傳播動力學(xué)模型被廣泛應(yīng)用于預(yù)測疫情發(fā)展趨勢,其中,群體性模型的典型代表是SIR模型。該模型將人群分成易感者(記作“S”)、傳染者(記作“I”)及康復(fù)者(記作“R”)3個群體,并用確定性微分方程組來描述這3類人群在數(shù)量上的變化關(guān)系,其被廣泛應(yīng)用于各種傳染病的建模分析中。文獻(xiàn)[5-11]采用SIR模型進(jìn)行COVID-19疫情預(yù)測,所得疫情防控建議見表2。
2.2.2 SEIR模型 在實(shí)際使用中,SIR模型有很多派生形式,如增設(shè)了已經(jīng)暴露但是并沒有傳染能力的暴露者(記作“E”),這樣的模型稱為SEIR模型;SEIR模型考慮了處于潛伏期的病毒攜帶者,區(qū)分了潛伏者和已發(fā)病的感染者接觸易感人群概率的差異[13]。文獻(xiàn)[12-24]采用SEIR模型進(jìn)行COVID-19疫情預(yù)測,所得的疫情防控建議見表3。
圖1 研究設(shè)計流程圖Figure 1 Research and design flow chart
2.2.3 TDD-NCP模型 CHEN等[25]及嚴(yán)閱等[26]均提出采用TDD-NCP模型來描述COVID-19疫情的傳播過程。劉可伋等[27]將TDD-NCP模型用于研究部分省市的COVID-19疫情傳播問題,其通過增加模型的源項(xiàng)來模擬外來潛伏感染者對當(dāng)?shù)匾咔榈挠绊?,基于國家衛(wèi)生健康委員會官方網(wǎng)站每日公布的累計確診例數(shù)與治愈例數(shù),有效地模擬并預(yù)測了各地疫情的發(fā)展,提出了基于TDD-NCP模型的再生數(shù)的兩種計算方法,并做了估計與分析,發(fā)現(xiàn)疫情暴發(fā)初期再生數(shù)較大,但隨著各級政府防控力度的加大而逐漸減?。蛔詈?,分析了返程潮對上海疫情發(fā)展的影響,并建議上海市政府繼續(xù)加大防控力度,以防疫情二次暴發(fā)。邵年等[28]在TDD-NCP模型的基礎(chǔ)上,提出了基于隨機(jī)動力學(xué)的時滯卷積模型和離散卷積模型,并基于中國疾病預(yù)防控制中心的相關(guān)研究結(jié)果和公開數(shù)據(jù),反演出了COVID-19疫情的重要參數(shù),擬合了武漢市及上海市COVID-19疫情的發(fā)展趨勢。
表3 應(yīng)用SEIR模型進(jìn)行COVID-19疫情預(yù)測所得疫情防控建議Table 3 Recommendations for prevention and control of COVID-19 epidemic prediction by SEIR model
表1 COVID-19疫情預(yù)測模型匯總Table 1 Summary of COVID-19 epidemic prediction models
2.2.4 Logistic增長模型 SHEN[29]利用中國11個省/市(安徽省、北京市、重慶市、廣東省、河南省、湖北省、湖南省、江蘇省、江西省、上海市和浙江?。┮约捌渌?個國家(伊朗、韓國、法國、德國、美國、意大利、西班牙、新加坡和日本)的時間序列數(shù)據(jù),采用非線性最小二乘法(NLS)估計參數(shù)的Logistic增長模型分析發(fā)現(xiàn),Logistic增長模型非常適合中國的數(shù)據(jù),并且該研究能夠提供COVID-19患者例數(shù)的估計并比較各地區(qū)之間的擴(kuò)散速度。CHEN等[30]利用美國疾病控制與預(yù)防中心數(shù)據(jù),采用參數(shù)Logistic增長模型對COVID-19疫情進(jìn)行預(yù)測,結(jié)果顯示,數(shù)據(jù)與模型擬合較好,證明了參數(shù)Logistic增長模型的效用;除了為公共衛(wèi)生決策提供信息外,該研究的模型還增加了一個檢測工具,以便更準(zhǔn)確地捕捉COVID-19疫情的傳播情況。
2.2.5 增長模型 CáSSARO等[31]利用中國、奧地利、西班牙、比利時、意大利、德國、挪威的疫情數(shù)據(jù),采用簡單增長模型進(jìn)行COVID-19疫情預(yù)測,結(jié)果顯示,根據(jù)第1例COVID-19患者的相關(guān)數(shù)據(jù),幾乎不可能預(yù)測疫情將如何演變,因?yàn)槠渖婕霸S多必須考慮的因素,如傳播的動態(tài)、人口統(tǒng)計數(shù)據(jù)、社會流動性的限制、個人保護(hù)措施(使用防護(hù)口罩和衛(wèi)生程序)、病毒潛伏時間、傳播率、氣象因素等。胡云鶴等[32]采用簡單靈活、廣泛適用的動態(tài)增長率模型對海外重點(diǎn)國家的COVID-19疫情發(fā)展特點(diǎn)和趨勢進(jìn)行了分析,結(jié)果顯示,防控措施的及時性和有效性將決定疫情走向,多數(shù)海外國家并沒有利用好中國為世界爭取的寶貴時間,如果維持現(xiàn)有防控水平,情況不容樂觀。張琳[33]采用一般增長模型擬合了2020-01-15至2020-02-15中國COVID-19的累計確診人數(shù)及2020-01-23至2020-02-15中國累計疑似人數(shù)和中國累計密切接觸人數(shù),結(jié)果顯示,模型與國家衛(wèi)生健康委員會公布的數(shù)據(jù)吻合。
2.2.6 ARIMA模型 SINGH等[34]采用ARIMA模型分析美國、西班牙、意大利、法國、德國、英國、土耳其、伊朗、中國、俄羅斯、巴西、加拿大、比利時、荷蘭和瑞士的COVID-19疫情數(shù)據(jù)發(fā)現(xiàn),除中國、瑞士和德國外,其他國家中的COVID-19確診例數(shù)、死亡例數(shù)和康復(fù)率將增長一倍。CHINTALAPUDI等[35]利用意大利衛(wèi)生部的官方數(shù)據(jù),采用ARIMA模型對COVID-19疫情進(jìn)行預(yù)測,結(jié)果顯示,預(yù)測模型的準(zhǔn)確率為93.75%;到5月底,預(yù)測受感染患者可能達(dá)到182 757例,康復(fù)患者可能達(dá)到81 635例。
2.2.7 Holt模型 MARTINEZ等[36]利用巴西COVID-19疫情數(shù)據(jù),采用Holt模型進(jìn)行COVID-19疫情預(yù)測。林挺葵等[37]依據(jù)廣東省衛(wèi)生健康委員會截至2020-02-18 24:00的官方數(shù)據(jù)構(gòu)建傳染病動力學(xué)SIR模型,計算現(xiàn)階段粵西地區(qū)及各地級市COVID-19的基本再生數(shù)(R0),并采用Holt雙參數(shù)指數(shù)平滑模型預(yù)測其發(fā)展趨勢,結(jié)果顯示,該模型預(yù)測較準(zhǔn)確;預(yù)測在現(xiàn)有高效防控措施下,粵西地區(qū)及各地級市COVID-19疫情正在好轉(zhuǎn),有望在2月底出現(xiàn)“拐點(diǎn)”。
2.2.8 SEAQIR模型 ZHANG等[38]、張原等[39]采用隨機(jī)SEAQIR模型分析COVID-19的獨(dú)特傳播動態(tài)及中國大陸干預(yù)措施的實(shí)施效果,隨后又對世界各國的COVID-19疫情情況、控制再生數(shù)、無癥狀感染者占比以及在無額外管控、部分管控和有效管控情況下COVID-19疫情的未來發(fā)展趨勢進(jìn)行分析,并預(yù)測各國COVID-19疫情對中國輸入型病例的影響。
2.2.9 其他模型 ZHENG等[40]利用中國COVID-19疫情數(shù)據(jù),采用AI模型進(jìn)行COVID-19疫情預(yù)測。石耀霖等[41]發(fā)展了一種離散變量隨機(jī)概率方法,并對湖北省COVID-19疫情發(fā)展進(jìn)行模擬和預(yù)測,指出春節(jié)后回程的農(nóng)民工和學(xué)生誘發(fā)大的疫情回彈可能性不大;但是世界上一些國家正處在疫情可能暴發(fā)的階段,國家應(yīng)該對入境人員做好檢查和隔離管控工作。王旭艷等[42]采用平滑指數(shù)模型對COVID-19累計確診病例數(shù)、累計治愈出院病例數(shù)、累計死亡病例數(shù)、重癥病例數(shù)及危重癥病例數(shù)進(jìn)行擬合和預(yù)測,結(jié)果顯示,湖北省COVID-19疫情的防控措施是有效的,指數(shù)平滑法擬合效果較好,可用于COVID-19疫情預(yù)測。崔景安等[43]針對COVID-19等新發(fā)傳染病傳播動力學(xué)模型的實(shí)際應(yīng)用問題,提出了與確診病例實(shí)時數(shù)據(jù)相關(guān)聯(lián)的接觸數(shù),優(yōu)化了新發(fā)傳染病傳播動力學(xué)模型,提升了模型的實(shí)用價值,把實(shí)時數(shù)據(jù)信息應(yīng)用于模型參數(shù)估計;并利用公開數(shù)據(jù),采用動力學(xué)模型,預(yù)估廣州、武漢COVID-19傳播的峰值、最終規(guī)模、達(dá)峰時間,結(jié)果顯示,這類接觸數(shù)可推廣應(yīng)用于其他新發(fā)傳染病,同時可揭示其暴發(fā)過程中不同時期的傳播風(fēng)險。孟杰等[44]聚焦于構(gòu)造基于手機(jī)定位大數(shù)據(jù)的捕獲再捕獲模型,估計特定區(qū)域COVID-19傳染高危人群總量,并利用互聯(lián)網(wǎng)企業(yè)提供的經(jīng)脫敏處理的天津市手機(jī)APP定位大數(shù)據(jù)驗(yàn)證了該方法的實(shí)踐有效性。朱淼等[45]通過對累計確診病例人數(shù)與疑似病例人數(shù)的綜合量化,提出了抗擊COVID-19疫情信心指數(shù),其可客觀地反映人們對戰(zhàn)勝COVID-19疫情的信心;在此基礎(chǔ)上,以誤差目標(biāo)為要求,通過模擬構(gòu)建的Bernstein基函數(shù)模型,結(jié)合物理意義上的速率概念,深入地對COVID-19疫情的發(fā)展趨勢進(jìn)行了分析,并取得了良好的效果。CHEN等[46]利用國家衛(wèi)生健康委員會官方網(wǎng)站數(shù)據(jù),采用二階導(dǎo)數(shù)模型進(jìn)行COVID-19疫情預(yù)測,在這項(xiàng)研究中,作者使用了第2個導(dǎo)數(shù)模型來表征中國COVID-19疫情的流行情況,并在頭2個月內(nèi)累計診斷出病例。AMBIKAPATHY等[47]利用由常微分方程框架組成的模型對印度COVID-19疫情相關(guān)數(shù)據(jù)進(jìn)行分析,結(jié)果顯示,實(shí)施至少21 d的嚴(yán)格禁閉有望減少COVID-19的傳播,然而需要進(jìn)一步延長至少42 d的嚴(yán)格禁閉才能明顯減少COVID-19的傳播;放松封鎖措施可能導(dǎo)致指數(shù)級傳播,這給該國的衛(wèi)生保健系統(tǒng)造成了沉重負(fù)擔(dān)。SANCHEZCABALLERO等[48]利用WHO官方網(wǎng)站中中國、意大利和西班牙的 COVID-19 疫情數(shù)據(jù),采用 the Verhulst equation 模型進(jìn)行COVID-19疫情預(yù)測,并用該模型預(yù)測德國、法國和英國的COVID-19疫情,結(jié)果證明該模型是可靠的。WU等[49]依據(jù)武漢市輸出到中國內(nèi)地以外城市的COVID-19患者數(shù)據(jù),提供了一個武漢傳染模型(集合種群模型),并且預(yù)測了國內(nèi)和全球流行病的公共衛(wèi)生風(fēng)險,旨在為社會和非藥物干預(yù)提供預(yù)防措施。
3.1 研發(fā)預(yù)測模型的意義與作用 第一,模型可以揭示未來不同時段COVID-19疫情的總體發(fā)展?fàn)顩r(惡化還是緩解)、到達(dá)“拐點(diǎn)”的時刻以及未來的感染人數(shù)、潛伏期人數(shù)、發(fā)病期人數(shù)、地區(qū)COVID-19疫情走勢等關(guān)鍵信息。第二,從模型計算出的參數(shù)可以表征不易直接觀察到的COVID-19疫情動態(tài)參數(shù),幫助理解并預(yù)測不同時期的COVID-19疫情特點(diǎn),如有效再生數(shù)、R0、感染者被醫(yī)院收治比例等。第三,模型能夠預(yù)測不同措施對COVID-19疫情發(fā)展的影響:不同時期的措施對模型參數(shù)的影響不同,這會直接在指標(biāo)的發(fā)展曲線上反映出來。以上均可以輔助公共衛(wèi)生、應(yīng)急、疾控等部門和其他相關(guān)決策者制定COVID-19疫情防控策略,如落實(shí)在具體時間地點(diǎn)上的醫(yī)療投入、是否限制流動、對個人采取的防護(hù)建議、復(fù)工復(fù)學(xué)的可能性等。
筆者通過深入分析發(fā)現(xiàn),已發(fā)表的文獻(xiàn)從不同側(cè)面為預(yù)測COVID-19疫情傳播規(guī)律提供了借鑒,但是從計算結(jié)果來看,這些預(yù)測數(shù)據(jù)與實(shí)際數(shù)據(jù)存在較大出入[5-49]。此外,在模型構(gòu)建上均存在共同缺陷,主要包括以下幾點(diǎn):首先,均是基于均勻混合的假設(shè),即認(rèn)為各類人群的接觸概率完全相同,均采用確定性微分方程模型來描述病毒傳播過程,沒有考慮病毒傳播過程的隨機(jī)性。其次,沒有考慮COVID-19在潛伏期具有明顯的傳染性這一特點(diǎn)。此外,在模型構(gòu)建過程中,均沒有分析模型中重要參數(shù)的可識別性問題。如果部分參數(shù)是不可識別的,那么對這些參數(shù)的估計結(jié)果將嚴(yán)重依賴于所選擇的初始值,進(jìn)而降低了模型預(yù)測結(jié)果的可信度。同時,模型依據(jù)數(shù)據(jù)的權(quán)威性、檢測數(shù)據(jù)是否涵蓋預(yù)測地區(qū)的真實(shí)數(shù)據(jù)以及各個國家/地區(qū)防控措施的不同均會影響模型的預(yù)測效果。
3.2 展望 基于分析結(jié)果,后期應(yīng)從以下幾個方面深入研究以優(yōu)化和改進(jìn)COVID-19的傳播機(jī)制模型:(1)考慮傳播過程的隨機(jī)性,提高模型的精確性。因此,隨機(jī)性依然在病毒的傳播過程中起著難以忽視的作用,在模型中加入隨機(jī)性是有意義的。(2)考慮潛伏期的傳染性,提高模型的真實(shí)性。模型中應(yīng)該考慮潛伏期攜帶者與無癥狀感染者的存在及其傳染性、重癥與輕癥患者的轉(zhuǎn)化以及醫(yī)學(xué)追蹤與隔離過程中存在的時滯。綜合考慮這些現(xiàn)實(shí)因素,可使模型能夠更加真實(shí)地描述實(shí)際情況。(3)考慮時空結(jié)構(gòu),提高模型的可擴(kuò)展性。可以基于現(xiàn)有模型,引入多個城市及其在空間/交通上的聯(lián)系,刻畫人口在城市間的流動規(guī)律及其帶來的疾病傳播,包括交通工具上疾病的傳播,使得模型能夠符合實(shí)際情況。
在具體的建模過程中,需要依據(jù)病毒的傳播方式來構(gòu)建合適的模型。但是新型冠狀病毒的傳染性很強(qiáng),且潛伏期就具有傳染性,而且其具體的傳播方式還沒有完全被掌握[9],這些均對準(zhǔn)確建模提出了挑戰(zhàn)。建議從病毒基因數(shù)據(jù)入手,基于病毒發(fā)育樹來分析感染發(fā)生的時間,從而更加準(zhǔn)確地描述傳播過程。此外,基于臨床數(shù)據(jù)的研究(如文獻(xiàn)[49]等)也能夠提供關(guān)于病毒傳播過程如R0和代際間隔等要素的重要信息,這些均能夠幫助建立更加準(zhǔn)確的模型。
COVID-19疫情正在蔓延,確診人數(shù)仍然在不斷增長。相信通過建立準(zhǔn)確、可靠的數(shù)學(xué)和統(tǒng)計模型,能夠正確把握疾病的流行規(guī)律,從而制定科學(xué)、高效的防控措施,早日取得疫情防控戰(zhàn)斗的勝利。
作者貢獻(xiàn):尹天露、劉朝杰、高曉歡進(jìn)行文章的構(gòu)思與設(shè)計;尹天露、高曉歡撰寫論文,進(jìn)行論文的修訂,對文章整體負(fù)責(zé)、監(jiān)督管理;張新國、趙李偉、高曉歡進(jìn)行數(shù)據(jù)收集與整理;尹天露進(jìn)行英文的修訂。
本文無利益沖突。