国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一類SEIR-A與TCN混合傳染病模型的研究

2023-11-18 09:55:18鄒黎敏
關(guān)鍵詞:現(xiàn)存顯性隱性

李 季,喬 敏,鄒黎敏

重慶工商大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067

1 引 言

由于傳染病在全球不斷出現(xiàn),在研究傳染病機(jī)理的過程中,發(fā)現(xiàn)一類包含潛伏期的SEIR模型出現(xiàn)了局限性,如病毒在潛伏期間也可能存在傳染性,且患者在經(jīng)歷潛伏期之后可能被感染但未出現(xiàn)相關(guān)癥狀的隱性情況。針對這一類現(xiàn)象,需要建立更為復(fù)雜的動力學(xué)模型。李峰[1]、TANG Y L[2]、馬千里等[3]都針對隱性感染者構(gòu)建了不同的動力學(xué)模型,來分析疾病的傳播機(jī)制。雖然這些含有隱性感染人群的模型符合傳染病的發(fā)展規(guī)律,但較為刻板,都不能準(zhǔn)確體現(xiàn)隱性感染者與顯性感染者之間的轉(zhuǎn)換。

此外,將傳統(tǒng)動力學(xué)與機(jī)器學(xué)習(xí)融合進(jìn)行建模的方法也被廣泛應(yīng)用。馮苗勝等[4]提出一種將統(tǒng)計(jì)學(xué)與動力學(xué)融合的Logistic_SEIR模型,解決了單一模型需多次調(diào)參的局限; Malavika等[5]使用Logistic增長曲線模型、SIR模型對印度和部分高發(fā)州新患者進(jìn)行了預(yù)測;張晴[6]采用得SIR模型、Logistic模型相結(jié)合的方式,對傳染病的傳播情況進(jìn)行研究和預(yù)測;謝小良等[7]提出一種SEIR模型和ARIMA模型搭建的SEIR-ARIMA混合模型。上述學(xué)者都采用混合模型的形式來研究傳染病,這些方法在大數(shù)據(jù)時(shí)代下都可以取得較高的預(yù)測精度,但對傳播機(jī)理的解釋不夠完善。

基于上述,目前還沒有綜合考慮疾病潛伏期傳染性和隱性感染人群向顯性感染人群單向流動的動力學(xué)模型,因此,本文在基礎(chǔ)SEIR模型中假設(shè)潛伏期具有傳染性,同時(shí)引入隱性感染人群,增添隱性與顯性感染人群之間的轉(zhuǎn)換因子作為影響參數(shù),構(gòu)建一種含隱性感染人群的SEIR-A模型。此外,通過構(gòu)建SEIR-A與TCN的混合模型,有效減少不可控因素對疾病傳播的影響,彌補(bǔ)了原有數(shù)學(xué)模型的不足。

2 研究方法

首先,文章基于經(jīng)典的SEIR模型,將隱性感染人群加入傳統(tǒng)的動力學(xué)模型中,同時(shí)考慮潛伏期的傳染性,得到改進(jìn)的SEIR-A模型。接著,通過數(shù)據(jù)驗(yàn)證,使用粒子群算法分階段對此模型進(jìn)行參數(shù)估計(jì),粗略得到傳染病發(fā)展的整體趨勢。觀察結(jié)果發(fā)現(xiàn):顯性感染人群的變化受較多外界因素影響,而微分方程無法進(jìn)行模型外生變量的自我調(diào)節(jié),導(dǎo)致動力學(xué)模型無法達(dá)到理想的結(jié)果。在深度學(xué)習(xí)中,時(shí)序卷積網(wǎng)絡(luò)模型能夠減少其他因素對預(yù)測結(jié)果的影響。因此,本文建立SEIR-A與TCN混合模型來實(shí)現(xiàn)每日顯性感染者人數(shù)的擬合,實(shí)驗(yàn)結(jié)果證明了該混合模型預(yù)測的準(zhǔn)確性。

2.1 構(gòu)建SEIR-A模型

“倉室”模型早在1927年被首次提出,之后一直廣泛應(yīng)用并得到發(fā)展完善。經(jīng)典傳染性模型有SI模型、SIR模型及SEIR模型等。本文研究的傳染病模型具有隱性感染者居多的特點(diǎn),且5類人群之間存在相應(yīng)的流動與轉(zhuǎn)換,需要建立符合其發(fā)展規(guī)律的SEIR-A傳染病模型。該模型設(shè)置了5種不同的人群,它們分別為易感人群(S)、潛伏人群(E)、顯性感染人群(I)、隱性感染人群(A)以及恢復(fù)人群(R)這5個(gè)不同的倉室,其中重新定義相關(guān)人群,詳細(xì)解釋如下。

(1) E:潛伏人群,表示已接觸過感染者,但尚未呈現(xiàn)出陽性狀態(tài)的潛伏人群,同樣具有傳染性。

(2) A:隱性感染人群,表示尚未出現(xiàn)癥狀但已呈現(xiàn)出陽性的感染人群,具有傳染性。

(3) R:恢復(fù)人群,表示通過治療或者自愈方式獲得健康的人群,該階段的人群具有免疫力且不再具有傳染性。

2.1.1 模型假設(shè)

通過分析病毒的傳播機(jī)制(明確易感者、傳染源和傳播途徑)和流行病學(xué)相關(guān)知識,對疾病傳播過程作出必要假設(shè)。本文所建立模型基于如下假設(shè):

(1) 不考慮傳染期間人群的遷入和遷出、出生與死亡。

(2) 假設(shè)潛伏人群和隱性感染人群都具有傳染因子,且潛伏人群和顯性感染人群具有相同的傳染率。

(3) 假設(shè)隱性感染患者可以向顯性感染患者單向流動,且不可逆。

(4) 假設(shè)該類傳染病導(dǎo)致死亡的人數(shù)極少,可忽略死亡人群對疾病傳播的影響。

2.1.2 確定疾病發(fā)生率

已知流行病傳染的前提為感染病人與易感者之間發(fā)生有效接觸,這樣才會導(dǎo)致病毒的傳播。接觸率是指單位時(shí)間內(nèi)一個(gè)感染者和易感者之間可能接觸的平均次數(shù)。由于接觸率的形式不同,發(fā)生率也會隨之改變,常見的形式有雙線性發(fā)生率、標(biāo)準(zhǔn)發(fā)生率及飽和發(fā)生率。

通過查閱文獻(xiàn)和分析傳染病的傳播機(jī)制,本文選擇標(biāo)準(zhǔn)形式的發(fā)生率來研究疾病的傳播機(jī)理,其公式如下:

(1)

式(1)中,β和N分別代表疾病傳染率和人口總數(shù)。

2.1.3 建立微分方程組

假設(shè)這一類傳染病的傳播具有單向不可逆的特點(diǎn),各類人群的數(shù)量隨時(shí)間而不斷變化,t時(shí)刻各人群的狀態(tài)可分別記作S(t)、E(t)、I(t)、A(t)和R(t),它們之間存在如下恒等關(guān)系:

S(t)+E(t)+I(t) +R(t) +A(t)=N

通過分析疫病傳播的現(xiàn)狀,可得SEIR-A模型的動力學(xué)過程如圖1所示。

圖1 SEIR-A模型傳播過程圖Fig.1 Propagation process diagram of SEIR-A model

接著,根據(jù)疾病傳播規(guī)律和發(fā)生率的確定,可得到該模型的微分方程組為

其中,模型中的各參數(shù)的含義見表1所示。

表1 符號說明Table 1 Description of symbols

綜上,本文提出改進(jìn)后的SEIR-A模型有如下特點(diǎn):

(1) 引入具有感染性的隱性感染人群。由于疫苗和易感者免疫力的提高,所以在疾病發(fā)展過程中出現(xiàn)了大量沒有感染癥狀的患者,并攜帶一定的傳染因子。

(2) 考慮顯性感染人群與隱性感染人群之間的轉(zhuǎn)換率ω。實(shí)際情況下,隱性感染者在醫(yī)學(xué)隔離期間有概率轉(zhuǎn)為顯性感染者,兩類人群之間存在單向流動。

(3) 分別考慮潛伏人群向隱性感染人群和顯性感染人群的轉(zhuǎn)換比率q、1-q。

2.2 構(gòu)建時(shí)間卷積TCN模型

在深度學(xué)習(xí)中,TCN可以將一維卷積進(jìn)行變形,建立適用于時(shí)序的模型。TCN建模有兩個(gè)基本原則,一方面是該模型輸入序列的長度決定輸出序列的長度,兩者保持一致;另一方面指預(yù)測結(jié)果只與現(xiàn)在和過去有關(guān),與未來無關(guān)。為了實(shí)現(xiàn)第一點(diǎn),TCN模型在架構(gòu)時(shí)采用一維全卷積網(wǎng)絡(luò)FCN,這樣保證了每個(gè)隱藏層的長度與輸入層長度相同,再通過設(shè)置padding=0使后續(xù)層的長度與之前層保持相同。為了實(shí)現(xiàn)第二點(diǎn),可在TCN模型中增添因果卷積來保證不能從未來泄露到過去的事實(shí),則模型可表示為

TCN=1D FCN+因果卷積

接著,為了解決對長序列歷史信息的預(yù)測問題,采用空洞卷積來實(shí)現(xiàn)呈指數(shù)級別增大的感受野。對于一維輸入序列X∈Rn和過濾器f:{0,…,k-1}→R,對序列元素s的空洞卷積運(yùn)算F可以定義為(d代表膨脹因子):

為進(jìn)一步解決由深度增長而產(chǎn)生的退化問題,提出殘差模塊概念。其中F的輸出被添加到該模塊的輸入Χ中(σ為激活函數(shù)):

ο=σ(X+F(X))

在殘差塊內(nèi),TCN 模型使用了整流線性單元 (ReLU),這樣不僅擴(kuò)張了因果卷積,而且存在非線性,并將權(quán)重歸一化應(yīng)用于卷積濾波器,實(shí)現(xiàn)歸一化過程。此外,在每個(gè)擴(kuò)張卷積之后添加了空間 Dropout,目的就是為了正則化:在每個(gè)訓(xùn)練步驟中,將整個(gè)通道歸零。

2.3 構(gòu)建SEIR-A和TCN混合模型

本文利用SEIR-A模型和TCN模型的預(yù)測結(jié)果進(jìn)行建模,采用二元線性回歸方式進(jìn)行擬合,結(jié)合兩者特點(diǎn)組成一種混合模型。線性回歸模型主要研究自變量和因變量之間的關(guān)系。首先假設(shè)SEIR-A模型和TCN模型存在線性相關(guān)性,再通過擬合直線的方式找到兩者之間的內(nèi)部關(guān)系,使用該混合模型進(jìn)行預(yù)測的步驟如下:

(1) SEIR-A模型預(yù)測。根據(jù)官方數(shù)據(jù),利用SEIR-A模型分別對起始期、發(fā)展期及衰減期進(jìn)行多階段建模,在參數(shù)估計(jì)過程中,采用粒子群算法進(jìn)行優(yōu)化,使其適應(yīng)度函數(shù)達(dá)到最小值,最終整理得到完整的預(yù)測結(jié)果X1。

(2) TCN模型預(yù)測。對原始數(shù)據(jù)進(jìn)行滯后處理來構(gòu)建適合時(shí)序建模的數(shù)據(jù)集,通過調(diào)整不同滑動窗口及設(shè)置重要參數(shù)的方法來訓(xùn)練模型,并在測試集上進(jìn)行誤差評估,根據(jù)不同預(yù)測效果選擇均方根誤差最小的TCN模型,其預(yù)測結(jié)果為X2。

(3) SEIR-A與TCN模型混合預(yù)測。在得到兩個(gè)模型的預(yù)測結(jié)果X1和X2之后,將其作為二元線性回歸模型的兩個(gè)自變量,也就是模型的輸入值,用真實(shí)數(shù)據(jù)作為輸出值來建立回歸模型,其方程可以表示為

(2)

2.4 模型評估指標(biāo)

本文使用到的模型評估指標(biāo)一共有4個(gè),它們分別是平均絕對誤差YMAE、均方根誤差YRMSE、決定系數(shù)R2和平均誤差YBias,將其作為度量該傳染病擬合效果的評估體系,可對不同模型進(jìn)行性能分析,其中定義YBias:

(3)

優(yōu)化思想是參數(shù)估計(jì)的中心部分。粒子群算法不僅是基于群體的全局隨機(jī)搜索算法,而且具有智能的特點(diǎn)。在該算法中,可以把每個(gè)優(yōu)化問題的可能解看作搜索空間中的“粒子”,將每一個(gè)由優(yōu)化函數(shù)決定的適應(yīng)度值賦給所有的粒子們,同時(shí)每一個(gè)粒子都具有一個(gè)確定飛行方向和距離的速度。接著粒子們在解空間進(jìn)行最優(yōu)化搜索,PSO算法具體步驟如下:

(1) 第一步設(shè)置粒子群規(guī)模、慣性因子、加速因子以及迭代次數(shù)。

(2) 第二步是隨機(jī)初始化步驟,這也是建模過程的前提基礎(chǔ)。一般的做法是初始化粒子的初速度向量,并且假設(shè)當(dāng)前位置就是個(gè)體的最優(yōu)位置,這樣減少了復(fù)雜度,為后面算法尋找最優(yōu)位置做鋪墊。

(3) 第三步更新每個(gè)粒子的速度(約束粒子速度); 更新每個(gè)粒子的位置;在k+1次迭代d維更新位置。

(4) 第四步是模型的中心部分,通過適應(yīng)度函數(shù)的計(jì)算結(jié)果來更新迭代,方法就是更新每個(gè)粒子的個(gè)體歷史最優(yōu)解,同時(shí)為避免陷入局部最優(yōu)化,應(yīng)該設(shè)置適當(dāng)?shù)牧W訑?shù)量來控制全局最優(yōu)化。

(5) 第五步,若滿足條件,則停止搜索并輸出結(jié)果;否則回到第三步。

3 模型的驗(yàn)證與評估

3.1 數(shù)據(jù)來源

為了驗(yàn)證模型的合理性,本文確定研究對象為國內(nèi)一類含有大量隱性感染者的傳染病,且滿足模型假設(shè),數(shù)據(jù)范圍為2022-02-11—2022-06-10,相關(guān)數(shù)據(jù)來源于國家衛(wèi)生健康委員會官方網(wǎng)站。

3.2 基于粒子群算法驗(yàn)證SEIR-A模型

3.2.1 建立多階段傳染病模型

根據(jù)真實(shí)數(shù)據(jù),觀察該時(shí)間范圍內(nèi)傳染病發(fā)展現(xiàn)狀(圖2)。其中,現(xiàn)存隱性感染人群和累計(jì)恢復(fù)人群符合常規(guī)變化規(guī)律,而現(xiàn)存顯性感染人群的發(fā)展受外界因素影響較大,具有明顯的波動(現(xiàn)存隱性感染人數(shù)=累計(jì)隱性感染人數(shù)-累計(jì)隱性感染者自愈人數(shù)-累計(jì)隱性轉(zhuǎn)顯性的感染人數(shù))。

圖2 傳染病發(fā)展趨勢圖Fig.2 Trend of infectious disease development

由圖2可以看出:該傳染病出現(xiàn)了大量隱性感染患者的現(xiàn)象,表明該疾病傳播機(jī)制符合本文建立的SEIR-A模型,可以進(jìn)一步用來驗(yàn)證該模型的合理性。由于隱性感染者沒有臨床表現(xiàn),導(dǎo)致在生活中無法及時(shí)發(fā)現(xiàn),但卻在疾病傳播過程中起到了關(guān)鍵作用,所以將隱性患者加入感染者中,可以使模型更好地符合實(shí)際疾病的發(fā)展?,F(xiàn)將現(xiàn)存顯性感染人群和現(xiàn)存隱性感染人群結(jié)合為現(xiàn)有感染人群(現(xiàn)有感染人群=現(xiàn)存顯性感染人群+現(xiàn)存隱性感染人群),并以該人群為依據(jù)將傳染病分為3個(gè)階段:2月11日—3月2日(起始期)、3月3日—4月17日(發(fā)展期)、4月18日—6月10日(衰減期)。根據(jù)不同時(shí)期采取不同干預(yù)措施,引入不同的參數(shù),建立多階段傳染病模型(圖3)。

圖3 傳染病分段示意圖Fig.3 Schematic diagram of infectious diseases

3.2.2 Logistic模型估計(jì)易感人群

首先,確定SEIR-A模型中各類人群的初始值。一方面,每個(gè)感染者可以接觸到的人數(shù)是有限的,而且一旦被追蹤到就會被隔離或者治療,另一方面,易感者也會通過戴口罩等方式盡量避免與感染者接觸。將易感者初值設(shè)定為中國總?cè)丝谑遣缓侠淼?在本文中設(shè)定S(0)是未知量,需要對其進(jìn)行估計(jì)。而潛伏人群會根據(jù)易感人群的估計(jì)結(jié)果,通過解離散化微分方程組的方式獲得估計(jì)值。此外,顯性感染人群數(shù)目I(0)、隱性感染人群數(shù)目A(0)和累計(jì)恢復(fù)人群數(shù)目R(0)的初始值由官方數(shù)據(jù)獲得。

人口的增長情況可以用經(jīng)典的Logistic模型來擬合,之前也有學(xué)者提出用該模型研究傳染病的增長規(guī)律,如文獻(xiàn)[6]中采用該模型估計(jì)得到了易感人群的初始值。由此受到啟發(fā),決定采用累計(jì)感染人群的數(shù)據(jù)來估計(jì)易感人群,其累計(jì)感染人數(shù)滿足式(4):

(4)

假定易感者初始值與最大累計(jì)感染者在數(shù)值上差別不大,式(4)中:L0是累計(jì)感染人群的初始值;K的含義是環(huán)境容量,這里表示易感人群的初始值,表示傳染病模型中的最大累計(jì)感染人數(shù);r表示固定增長率;t表示時(shí)間;L(t)的含義為隨時(shí)間發(fā)生變化的累計(jì)感染人數(shù)。擬合結(jié)果中決定系數(shù)大于0.95,模型合理。

由上述分析可得易感人群的初始值,則該階段模型中所有人群的初始值見表2,總?cè)丝跀?shù)N=793 060。

表2 起始期模型初始值Table 2 Initial values of initial model

顯然,易感人群和傳染病模型增長趨勢呈相反趨勢,因此,將Logistic擬合模型得到的數(shù)值通過降序變化作為易感人群的估計(jì)值。同理得到第二階段和第三階段的初始人群數(shù)量。

3.2.3 粒子群算法估計(jì)模型參數(shù)值

SEIR-A模型一共有8個(gè)參數(shù),其中某些具有現(xiàn)實(shí)意義的參數(shù)可以根據(jù)文獻(xiàn)資料獲得,如潛伏期的轉(zhuǎn)陽率及易感人群的接觸率,分別設(shè)置為0.2和14.7;此外,還可以通過已獲得的真實(shí)數(shù)據(jù)計(jì)算得到相關(guān)參數(shù),后采用取平均值方法來確定該參數(shù),這些可計(jì)算的參數(shù)分別為γ0、γ1和ω。

在使用粒子群算法估計(jì)SEIR-A模型中的其他參數(shù)時(shí),粒子代表的就是其他剩余參數(shù),粒子的速度范圍就是各個(gè)參數(shù)的取值范圍,其中設(shè)置傳染率(β1和β2)的范圍為[0,0.5],其余參數(shù)在[0,1]中取值,其適應(yīng)度函數(shù)如下所示:

通過MATLAB軟件中的particleswarm()函數(shù)來求解該算法,函數(shù)采用的是自適應(yīng)的領(lǐng)域模式,搜索前期使用領(lǐng)域模式,如果適應(yīng)度開始停滯時(shí),粒子群搜索會從領(lǐng)域模式向全局模式轉(zhuǎn)換。設(shè)置學(xué)習(xí)因子為1.49,修改粒子數(shù)量為200,其最大的迭代次數(shù)為200。通過不斷調(diào)試可以發(fā)現(xiàn):在確定數(shù)值的5個(gè)參數(shù)中,需要在γ0和γ1中選擇一個(gè)參數(shù)作為已知參數(shù),另一個(gè)參數(shù)作為未知數(shù),通過求解粒子群算法來獲得。

結(jié)果顯示:第一階段選擇γ0作為已知參數(shù),γ1作為未知參數(shù)來進(jìn)行模型的擬合,模型效果如圖4所示。

圖4 SEIR-A模型第一階段擬合Fig.4 First stage fitting of SEIR-A model

接著,第二、三階段中選擇γ1作為已知參數(shù),γ0作為未知參數(shù)來進(jìn)行模型的擬合,模型效果如圖5所示。

(a) 第二階段

(b) 第三階段圖5 SEIR-A模型第二、三階段擬合Fig.5 Second and third stage fitting of SEIR-A model

經(jīng)過不斷修改調(diào)整,得到上述的擬合效果,結(jié)果表明該模型具有可行性,可以較好地預(yù)測該傳染病發(fā)展的大致趨勢。最終確定SEIR-A模型的參數(shù)見表3。

表3 多階段SEIR-A模型參數(shù)估計(jì)結(jié)果Table 3 Parameter estimation results of multi-stage SEIR-A model

3.2.4 SEIR-A模型的驗(yàn)證

為了驗(yàn)證模型,分別整理了3個(gè)階段的SEIR-A模型對現(xiàn)存顯性感染人群、現(xiàn)存隱性感染人群以及累計(jì)恢復(fù)人群的預(yù)測結(jié)果,并通過評估指標(biāo)來描述其合理性。其中隱性感染人群和累計(jì)恢復(fù)人群的擬合結(jié)果見表4和圖6所示,模型預(yù)測數(shù)值與真實(shí)數(shù)據(jù)相差不大,總體預(yù)測效果比較好,決定系數(shù)都大于0.95,說明參數(shù)估計(jì)結(jié)果較為準(zhǔn)確,反映了SEIR-A模型能夠科學(xué)地模擬傳染病的發(fā)展規(guī)律。

表4 A(t)和R(t)預(yù)測結(jié)果評估Table 4 Evaluation of A (t) and R (t) forecast results

(a) 現(xiàn)存隱性感染人群

(b) 累計(jì)恢復(fù)人群圖6 SEIR-A模型對現(xiàn)存隱性感染人群和累計(jì)恢復(fù)人群的擬合Fig.6 The fitting of SEIR-A model to recessive infection population and cumulative recovery population

但是,由于現(xiàn)存顯性感染人群I(t)的增減受不可控因素的影響較大,所以傳統(tǒng)動力學(xué)模型無法準(zhǔn)確預(yù)測該人群的動態(tài)變化(圖7),導(dǎo)致偏差達(dá)到Y(jié)Bias= 0.501 5,需要進(jìn)一步研究分析。

圖7 SEIR-A模型對現(xiàn)存顯性感染人群的擬合Fig.7 Fitting of SEIR-A model to existing dominant infection population

3.3 時(shí)間卷積TCN模型的驗(yàn)證

顯然,SEIR-A模型能夠刻畫出傳染病的總體變化趨勢,保證了模型的正確性。但由于不可控因素的影響使預(yù)測結(jié)果與實(shí)際情況存在一定的誤差,結(jié)合統(tǒng)計(jì)學(xué)知識,嘗試建立關(guān)于時(shí)間序列的卷積神經(jīng)網(wǎng)絡(luò)模型TCN來預(yù)測現(xiàn)存顯性感染人群的變化,并利用Python軟件得到對每日現(xiàn)存顯性感染人數(shù)的預(yù)測結(jié)果。

在建模過程中,TCN模型把每日現(xiàn)存的顯性感染人數(shù)作為非線性時(shí)間序列,預(yù)測過程可以看作是從輸入病例空間到輸出病例空間的非線性映射,再通過設(shè)置合適的滑動窗口,將每日現(xiàn)存顯性感染人數(shù)時(shí)間序列分成輸入序列和輸出序列,然后使用TCN網(wǎng)絡(luò)挖掘?qū)W習(xí)輸入序列前后之間的相關(guān)性,通過全連接網(wǎng)絡(luò)變換殘差塊輸出序列維度,使其與輸出序列維度相同,接著求預(yù)測值與真實(shí)值的均方根誤差,并利用反向傳播原理不斷更新梯度,最終得到具有預(yù)測現(xiàn)存顯性感染人群能力的TCN模型。

3.3.1 數(shù)據(jù)歸一化

3.3.2 構(gòu)建數(shù)據(jù)集

對于單維時(shí)序預(yù)測,需要采用滯后處理的方法來修改維度,從而構(gòu)造出適合TCN模型的數(shù)據(jù)集。設(shè)T天的每日現(xiàn)存顯性感染人數(shù)為X=(x1,x2,…,xT-1,xT),T就是統(tǒng)計(jì)數(shù)據(jù)的天數(shù),假設(shè)使用前T-1天的每日現(xiàn)存顯性感染人群預(yù)測第T天的顯性感染人數(shù),則可以通過設(shè)置適合的滯后天數(shù)來對T天的每日顯性感染人數(shù)進(jìn)行劃分,將其擴(kuò)展成為標(biāo)準(zhǔn)的矩陣形式。假設(shè)x1—xM作為第1個(gè)樣本,(x1,x2,…,xM-1)為輸入數(shù)據(jù),xM為預(yù)測第M天的顯性感染人數(shù),以此類推,x2—xM+1作為第2個(gè)樣本,X=(x2,x3,…,xM-1,xM)為輸入的顯性感染病例數(shù),xM+1為預(yù)測值,這樣就可以得到以下樣本矩陣:

在矩陣A中,每一行代表的是一個(gè)樣本,最后一列代表的是顯性感染人群的待預(yù)測值。本文設(shè)置訓(xùn)練集的占比為0.8,將該矩陣前91個(gè)樣本作為訓(xùn)練集輸入到TCN模型中進(jìn)行參數(shù)訓(xùn)練,剩余23個(gè)樣本作為測試集做預(yù)測結(jié)果的分析驗(yàn)證。

3.3.3 用現(xiàn)存顯性感染人群驗(yàn)證TCN模型

TCN模型中輸入序列的維數(shù)也是滯后處理的天數(shù)M,該參數(shù)為待調(diào)節(jié)參數(shù);本文TCN模型采用一維因果卷積,設(shè)置padding方式是‘causal’; Adam優(yōu)化器的選擇可以更新步長,它綜合考慮了梯度的一階矩估計(jì)和二階矩估計(jì),提高了計(jì)算效率且占用內(nèi)存較少;最后,為了減少計(jì)算量并且避免梯度消失,在殘差板塊使用activation=‘relu’作為激活函數(shù),其表達(dá)形式為

f(x)=max(0,x)

此外,所含殘差模塊層數(shù)、卷積核的個(gè)數(shù)和維度,以及其他的一些參數(shù)都會影響TCN模型的訓(xùn)練效率和擬合精度,需要通過不斷地調(diào)試使模型達(dá)到最佳預(yù)測性能。假設(shè)M的取值可能為2、6、10、14,觀察圖8中YRMSE的變化,由此圖可以看出:當(dāng)M=6時(shí)得到最小的誤差,則確定該模型的輸入序列維度。其他重要參數(shù)的設(shè)置見表5所示。

圖8 不同滯后天數(shù)下的RMSE數(shù)值Fig.8 RMSE values under different lag days

表5 TCN模型中幾個(gè)重要的參數(shù)值Table 5 Several important parameter values in TCN model

根據(jù)上述參數(shù)建立TCN模型,預(yù)測每日現(xiàn)存顯性感染者人數(shù),擬合效果如圖9所示。R2=0.900 5,說明TCN模型可以用來預(yù)測該傳染病中的現(xiàn)存顯性感染人群。

圖9 TCN模型擬合現(xiàn)存顯性感染人群I(t)Fig.9 TCN model fitting existing confirmed population I (t)

3.4 SEIR-A與TCN混合模型的驗(yàn)證

在TCN模型中確定的滯后天數(shù)為6,所以在構(gòu)建混合模型時(shí)選擇數(shù)據(jù)的起始時(shí)間為2022年2月17日。分別整理兩個(gè)獨(dú)立模型的預(yù)測結(jié)果作為輸入值,每日現(xiàn)存顯性感染人群的數(shù)據(jù)為目標(biāo)值,利用Python軟件實(shí)現(xiàn)線性回歸過程,結(jié)果如表6所示。其P值都小于0.05,則實(shí)驗(yàn)結(jié)果具有統(tǒng)計(jì)學(xué)意義。

表6 線性回歸模型結(jié)果Table 6 Results of linear regression model

最后,選擇近年來被廣泛應(yīng)用于時(shí)間序列預(yù)測領(lǐng)域的LSTM模型作為對比基準(zhǔn),并建立 SEIR-A與LSTM的混合模型。觀察圖10中5個(gè)模型預(yù)測值與真實(shí)值之間的擬合圖像,發(fā)現(xiàn)本文提出的SEIR-A與TCN混合模型更加貼合現(xiàn)存顯性感染人群的變化趨勢。

在數(shù)據(jù)上,分別計(jì)算出5種模型預(yù)測值與真實(shí)值之間的YMAE、YRMSE、R2和YBias,發(fā)現(xiàn)SEIR-A與TCN的混合模型和SEIR-A與LSTM的混合模型相差不大,前者結(jié)果略優(yōu)于后者,決定系數(shù)達(dá)到0.9611,且YMAE、YRMSE、YBias分別為1 628、2 144、0.289 1,都是該對比情況下的最小值。

表7 顯性感染人群I(t)擬合結(jié)果對比Table 7 Comparison of I(t) fitting results in dominant infected population

綜上所有對比實(shí)驗(yàn)可以得出:SEIR-A與TCN混合模型對現(xiàn)存顯性感染人群的擬合效果相比于SEIR-A模型、TCN模型、LSTM模型、SEIR-A與LSTM混合模型來說,其擬合效果更為精確,說明該混合模型具有很強(qiáng)的數(shù)據(jù)擬合能力和時(shí)序建模能力。

4 結(jié)論與展望

4.1 結(jié) 論

本文以傳統(tǒng)動力學(xué)SEIR 模型為基礎(chǔ),在原有疾病傳播過程中加入具有傳染性的潛伏者和隱形傳播者,用于表述一類含感染可能性較大的傳染病。利用數(shù)據(jù)進(jìn)行完整時(shí)間段的擬合,得到如下結(jié)論:

(1) 引入具有不同感染因子的潛伏者和隱性傳播者使動力學(xué)模型得到完善,利用現(xiàn)存隱性感染人群數(shù)量和累計(jì)恢復(fù)人群數(shù)量驗(yàn)證改進(jìn)后的SEIR-A模型,證明該模型合理。

(2) 引入時(shí)間卷積網(wǎng)絡(luò)TCN模型提高現(xiàn)存顯性感染人群的擬合精度,并利用線性回歸結(jié)合改進(jìn)后的SEIR-A模型得到混合模型,發(fā)現(xiàn)該模型在擬合結(jié)果上取得最優(yōu)。

(3) 經(jīng)典動力學(xué)和統(tǒng)計(jì)學(xué)模型的巧妙結(jié)合,表明本文提出的SEIR-A與TCN混合模型不僅體現(xiàn)出了疾病感染的傳播機(jī)理,而且提高了原有模型的擬合精度。

4.2 展 望

為了對傳染病傳播進(jìn)行準(zhǔn)確地時(shí)序建模,本文提出了一種基于SEIR-A與TCN混合模型擬合的方法,并利用一類含隱性感染人群傳染病的真實(shí)情況,驗(yàn)證了該模型的合理性。其SEIR-A模型是由經(jīng)典動力學(xué)模型SEIR改進(jìn)而來,在傳統(tǒng)定義的基礎(chǔ)之上引入了隱性感染人群,并理性增添了相關(guān)因子的影響,模型驗(yàn)證過程中采用多階段擬合的方式,得到了3個(gè)階段不同的參數(shù)值,這樣能有效減少整體預(yù)測所產(chǎn)生的誤差。結(jié)果表明:該模型只適用于對現(xiàn)存隱性感染人群和累計(jì)恢復(fù)人群進(jìn)行估計(jì),對現(xiàn)存顯性感染人群的擬合有所欠缺。所以,采用時(shí)間卷積網(wǎng)絡(luò)的方式建立TCN模型,通過不斷調(diào)試參數(shù),實(shí)現(xiàn)了對顯性感染人群更高精度的預(yù)測。最后,將數(shù)學(xué)模型與深度學(xué)習(xí)利用線性關(guān)系結(jié)合起來,通過對比可知:該混合模型能夠更為準(zhǔn)確地分析復(fù)雜狀態(tài)下現(xiàn)存顯性感染人群的變化趨勢,進(jìn)一步驗(yàn)證了模型的有效性以及對復(fù)雜真實(shí)情況的適應(yīng)性。

但是,本文尚未考慮隔離人群對傳染病的影響,后續(xù)可以在此基礎(chǔ)上完善SEIR-A模型,得到更加貼合現(xiàn)實(shí)情況的動力學(xué)模型。

猜你喜歡
現(xiàn)存顯性隱性
現(xiàn)存清代粵劇劇本初探
戲曲研究(2022年2期)2022-10-24 01:54:12
隱性就業(yè)歧視的司法認(rèn)定
反歧視評論(2019年0期)2019-12-09 08:52:40
顯性激勵與隱性激勵對管理績效的影響
社會權(quán)顯性入憲之思考
芻議隱性采訪
新聞傳播(2015年14期)2015-07-18 11:14:05
新聞報(bào)道隱性失實(shí)的四種表現(xiàn)
新聞傳播(2015年8期)2015-07-18 11:08:25
顯性的寫作,隱性的積累——淺談學(xué)生寫作動力的激發(fā)和培養(yǎng)
隱性但可預(yù)防的危險(xiǎn)
意識形態(tài)教育中的顯性灌輸與隱性滲透
淺談建筑業(yè)現(xiàn)存危機(jī)與未來的發(fā)展趨勢
河南科技(2014年16期)2014-02-27 14:13:25
通辽市| 台山市| 宿迁市| 郓城县| 济南市| 阜宁县| SHOW| 永靖县| 墨竹工卡县| 嘉善县| 习水县| 洛浦县| 溆浦县| 凌源市| 古丈县| 自治县| 麻栗坡县| 景谷| 措勤县| 太白县| 雷波县| 石台县| 温州市| 太湖县| 共和县| 商南县| 洪江市| 靖江市| 威信县| 南漳县| 普洱| 鄢陵县| 英超| 岑溪市| 岳普湖县| 习水县| 乌鲁木齐县| 雅江县| 喀喇| 印江| 科技|