段班祥 吳兆鑫 蔡丹敏 許梓炫
摘 要:文章探討新型冠狀病毒國家管控問題。查找新型冠狀病毒實時數(shù)據(jù),并提取2019年GDP排行前十的國家的數(shù)據(jù)。對世界各主要國家的數(shù)據(jù)進行數(shù)據(jù)標準化后,對數(shù)據(jù)進行了主成分分析,構(gòu)建了主成分的方差貢獻率模型。運用趨勢二次移動平均法,構(gòu)建了世界主要國家的發(fā)展趨勢預(yù)測模型,得出了2019年GDP排名全球靠前的國家在疫情期間的管控能力,分析了各國政府防控措施手段的有效程度。
關(guān)鍵詞:新型冠狀病毒;趨勢二次移動平均法;主成分分析;疫情預(yù)測
中圖分類號:F224 文獻標識碼:A 文章編號:1674-1064(2020)08-0001-04
新型冠狀病毒肺炎是近百年來人類遭遇的影響范圍最廣的全球性大流行病,對全世界是一次嚴重危機和嚴峻考驗。人類生命安全和健康面臨重大威脅。由于各個國家本身的經(jīng)濟能力、政治體制、文化差異、各國人民對疫情重視程度的差異及各國醫(yī)療水平等因素,導(dǎo)致每個國家抗擊疫情的道路各不相同。為此,搜集各國疫情數(shù)據(jù),進行大數(shù)據(jù)分析,建立數(shù)學(xué)模型,最終得到新冠病毒疫情發(fā)展的基本特點和規(guī)律,是文章研究的主要目的。
1 研究思路和方法
為評價各主要國家管控新冠疫情的效果,筆者選取了疫情發(fā)展最為嚴重且全球GDP排行靠前的國家,通過網(wǎng)站“http://hao.199it.com/ncov.html”爬取世界主要國家的疫情數(shù)據(jù),然后對數(shù)據(jù)進行標準化等預(yù)處理,利用主成分分析構(gòu)建方差貢獻率,求出方差貢獻率[1]累計占比超過95%的第一、第二主成分,根據(jù)各指標數(shù)據(jù)與主成分相關(guān)性得出國家的綜合得分,最終獲取各主要國家的管控效果。
為建立主要國家疫情發(fā)展趨勢的模型并進行預(yù)測,筆者根據(jù)時間序列模型的二次移動平均法[2],改進后采用趨勢移動平均法,得到了各主要國家疫情發(fā)展的趨勢預(yù)測模型[3],最后在相關(guān)軟件推演中得到推導(dǎo)和實證。
2 世界主要國家疫情發(fā)展特點
筆者在matlab中對世界GDP靠前的十個國家的數(shù)據(jù)進行處理并繪制成趨勢圖,新增確診、新增治愈、新增死亡的趨勢變化如圖1所示。
其中,紅色曲線為新增確診,綠色曲線為新增治愈,黑色曲線為新增死亡。其中,部分出現(xiàn)負值的原因為人為更改統(tǒng)計方式導(dǎo)致的,因此將出現(xiàn)負值的數(shù)據(jù)一并處理為0,這對結(jié)果并不會有很大的影響。根據(jù)圖1,可將十個國家各自的疫情程度進行分類。其中,USA(美國)、India(印度)、Brazil(巴西)這三個國家新增確診人數(shù)都大致呈現(xiàn)線性上升的趨勢,說明疫情程度在一直惡化;而其他國家都大致呈先上升后下降再趨向于平穩(wěn)的趨勢,說明疫情程度得到有效地控制。根據(jù)圖表分析,可以粗略地分為兩類:USA(美國)、India(印度)、Brazil(巴西)這三個國家為一類;其他國家為一類。
將這十個國家的新增確診、新增治愈、新增死亡數(shù)據(jù)進行匯總后求平均值,且計算出累計的確診人數(shù),如圖2所示。并用Q型聚類法[4]中的歐氏距離計算出各個國家之間的距離,如圖3所示。
根據(jù)圖3的聚類分析圖可得出最終的分類結(jié)論:印度、美國、巴西各為一類;剩余國家為一類。
3 世界主要國家疫情綜合評價模型
將GDP排名前十的國家在疫情期間的各數(shù)據(jù)指標取平均值,得到如圖4所示的指標平均數(shù)據(jù)。
通過計算得出了主成分的方差貢獻率,并對方差貢獻率進行可視化,如圖5所示。
通過計算得出,前兩個主成分的方差貢獻率累計已達到96.5%。其中,第一主成分的主要方差貢獻率為87.94%,第二主成分的主要方差貢獻率為8.57%。由于前兩個主成分分析占比超過95%,則考慮國家管控效果時,可只考慮前兩個主成分分析[5]。圖6為第一主成分和第二主成分各自主要方差貢獻率的各個指數(shù)。
根據(jù)以上數(shù)據(jù),利用主成分綜合評價模型求得:
可得出最終的綜合得分計算公式:
根據(jù)各個指數(shù)與兩個主成分分析的相關(guān)性可發(fā)現(xiàn),綜合得分越低,則代表該國家對疫情的管控效果越強。世界主要國家的綜合得分由低到高排序如表1所示。
因此可得出,在世界主要國家當(dāng)中,日本、加拿大、中國是疫情期間管控效果最好的;而印度、巴西、美國是疫情期間管控效果最差的。
4 基于趨勢二次移動平均法的新冠肺炎疫情的數(shù)學(xué)模型
二次移動平均法,是對一次移動平均數(shù)再進行第二次移動平均,再以一次移動平均值和二次移動平均值為基礎(chǔ)建立預(yù)測模型[2],計算預(yù)測值的方法。使用一次移動平均法的平均數(shù)計算公式為:
然后再對一次移動平均的數(shù)據(jù)進行第二次移動平均,即二次移動平均的計算公式為:
其次利用移動平均的滯后偏差來建立趨勢預(yù)測模型,因此設(shè)趨勢模型為:
其中,t為當(dāng)前時間數(shù);T為由t至預(yù)測期的時間數(shù);at為截距;bt為斜率。兩者又稱為平滑系數(shù)。
然后根據(jù)移動平均值來確定平滑系數(shù):
所以:
因此:
根據(jù)以上公式推導(dǎo)可得出:
綜上可得,平滑系數(shù)的計算公式為:
根據(jù)以上二次移動平均法對新冠疫情進行了預(yù)測,得出世界各主要國家新冠疫情的發(fā)展趨勢預(yù)測模型,如圖7至圖16所示。
通過計算與模型觀察可以得出各國的相對平均誤差,如表2所示。設(shè)相對平均誤差為f,預(yù)測值為yhat,根據(jù)相對平均誤差,對預(yù)測值進行以下處理,使預(yù)測值更加接近實際值。
5 結(jié)語
文章運用了趨勢二次移動平均法,構(gòu)建了世界主要國家的發(fā)展趨勢預(yù)測模型,很好地對世界各國的疫情及抗疫成效進行了分類評價及預(yù)測。在建模的過程中,堅持從數(shù)據(jù)本身出發(fā)尋找合適的模型,從而保證模型與數(shù)據(jù)之間具有較好的擬合效果,為后續(xù)的統(tǒng)計分析提供了便利,也保證了模型的可靠性。
參考文獻
[1] 卓金武,王鴻鈞.MATLAB數(shù)學(xué)建模方法與實踐(第3版)[M].北京:北京航空航天大學(xué)出版社,2018.
[2] 白曉東.應(yīng)用時間序列分析[M].北京:清華大學(xué)出版社,2017.
[3] 范晉蓉,白曉東,郭佩汶,等.廣西壯族自治區(qū)病毒性肝炎發(fā)病數(shù)的建模與預(yù)測分析[J].檢驗檢疫學(xué)刊,2019,29(6):1-5.
[4] 胡雷芳.五種常用系統(tǒng)聚類分析方法及其比較[J].浙江統(tǒng)計,2007(4):11-13.
[5] 馬知恩.傳染病動力學(xué)的數(shù)學(xué)建模與研究[M].北京:北京科學(xué)出版社,2004.