曹可 呂繼續(xù)
摘? 要:基于某傳染病從2004至2016年的發(fā)病數(shù)與死亡數(shù)數(shù)據(jù),繪制了該傳染病流行病的散點(diǎn)圖,判斷該流行病每年發(fā)病人數(shù)呈曲線式降低。通過(guò)最小二乘法的方法對(duì)該流行病進(jìn)行了曲線擬合,擬合結(jié)果顯示冪函數(shù)、3次函數(shù)、4次函數(shù)。都能較好地?cái)M合該流行病的變化趨勢(shì),通過(guò)比對(duì)發(fā)現(xiàn)3次函數(shù)擬合效果最好。最后,使用3次函數(shù)對(duì)該流行病2019年的發(fā)病人數(shù)進(jìn)行了預(yù)測(cè)。
關(guān)鍵詞:最小二乘法? 曲線擬合? 傳染病預(yù)測(cè)
中圖分類號(hào):TP18;N945.24 ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2019)11(c)-0228-02
疾病是我們每個(gè)人都會(huì)遇到的問(wèn)題,生活中的疾病感染源廣泛,那么我們就需要對(duì)疾病的感染人群的健康情況進(jìn)行分析、預(yù)測(cè),從而采取必要的措施來(lái)進(jìn)行疾病的預(yù)防。
身處大數(shù)據(jù)時(shí)代,分析數(shù)據(jù)成為了一種趨勢(shì),對(duì)于已知的數(shù)據(jù),我們可以采用多種方法對(duì)數(shù)據(jù)進(jìn)行管理、分析、預(yù)測(cè),從而得出對(duì)我們有用的數(shù)據(jù)信息。最小二乘法是最經(jīng)典的數(shù)據(jù)預(yù)測(cè)、分析計(jì)算方法。該文利用最小二乘法將已知的數(shù)據(jù)進(jìn)行數(shù)值分析,繪制不同類型的函數(shù)圖形,對(duì)比分析選取最優(yōu)函數(shù)。根據(jù)所得到的最優(yōu)函數(shù)對(duì)該種流行病2019年的發(fā)病人數(shù)進(jìn)行預(yù)測(cè)。
1? 最小二乘法實(shí)現(xiàn)原理及過(guò)程
通過(guò)實(shí)現(xiàn)原理的闡述,以及算法的具體實(shí)現(xiàn)過(guò)程介紹最小二乘法擬合。
1.1 最小二乘法實(shí)現(xiàn)原理
最小二乘法是一種常用的優(yōu)化方法,它采用的是求出平方的最小值得到誤差的最小值。對(duì)于給出的一組數(shù)據(jù),通過(guò)對(duì)這組數(shù)據(jù)的誤差最小值的求解得到最適合函數(shù),根據(jù)函數(shù)就可以對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)。
1.2 最小二乘法實(shí)現(xiàn)過(guò)程
對(duì)于給定的數(shù)據(jù)[1]點(diǎn){(xi,yi),i=0,1,…,n},假設(shè)yi=方f(xi),(i=1,2,…,n)擬合出一個(gè)函數(shù)y=S(x)與所給的數(shù)據(jù){(xi,yi),i=1,2,…,n},使得δi=S(xi)-yi(i=0,1,…,n)。設(shè)0(x),1(x),…,n(x)是C[a,b]上的線性無(wú)關(guān)函數(shù)簇。以(x)為基地找到一個(gè)使得min{0,1,…,n}最小的S(x),根據(jù)得到的函數(shù)y=S(x)對(duì)接下來(lái)的數(shù)據(jù)進(jìn)行預(yù)測(cè),這就是最小二乘法曲線擬合。
2? 基于流行病數(shù)據(jù)曲線擬合
根據(jù)現(xiàn)有的流行病數(shù)據(jù),繪制表1,年份為所在年份的后兩位,如4代表2004年,以此類推。
3? 散點(diǎn)圖分析及曲線擬合預(yù)測(cè)
通過(guò)對(duì)散點(diǎn)繪制圖像分析,選擇較合適的擬合曲線,對(duì)發(fā)病人數(shù)進(jìn)行預(yù)測(cè)。
3.1 擬合散點(diǎn)圖分析
根據(jù)擬合的曲線可觀測(cè)出4次函數(shù)最逼近散點(diǎn),從而得到如圖1所示的最能描述時(shí)間與發(fā)病人數(shù)的擬合曲線[2]。
3.2 曲線擬合對(duì)比預(yù)測(cè)
根據(jù)散點(diǎn)圖分析我們進(jìn)行曲線擬合,冪函數(shù)擬合,并進(jìn)行對(duì)比。可觀測(cè)出3次函數(shù)最逼近散點(diǎn),從而得到最能描述發(fā)病人數(shù)與時(shí)間的曲線方程[3]。
發(fā)病人數(shù)與時(shí)間的方程式為:
y=257.75+4+11490.5973-183315.5282+1192752.05-
1501238.253
根據(jù)擬合的曲線方程,預(yù)測(cè)得到2019年此流行病的發(fā)病人數(shù)為207848。
4? 結(jié)語(yǔ)
對(duì)于該文中的傳染病每年發(fā)病人數(shù)的預(yù)測(cè),采用了最小二乘法進(jìn)行曲線擬合。為了更好地?cái)M合效果,期間使用python語(yǔ)言進(jìn)行了多次冪函數(shù)的擬合,隨后將擬合得到的曲線進(jìn)行比較,選取最能描述時(shí)間與發(fā)病人數(shù)的關(guān)系的曲線方程進(jìn)行預(yù)測(cè)。因數(shù)值較大,最后采用python程序?qū)Y(jié)果進(jìn)行簡(jiǎn)單的預(yù)測(cè),得出較為精確的值。該文涉及到的最小二乘法預(yù)測(cè)流行病人群的發(fā)病。死亡情況,可根據(jù)預(yù)測(cè)得出的結(jié)果采取有效的措施,對(duì)流行病進(jìn)行合理有效的控制。
參考文獻(xiàn)
[1] 陳韋名.曲線擬合原理及其應(yīng)用研究[D].長(zhǎng)沙理工大學(xué),2018.
[2] 唐鵬,李嬌,苗純,等.基于matplotlib繪制材料力學(xué)中梁的彎矩圖的研究[J].中國(guó)多媒體與網(wǎng)絡(luò)教學(xué)學(xué)報(bào),2019(5):36-37.
[3] 段彥君,周西鳳.基于最小二乘法的宿州市GDP曲線擬合及預(yù)測(cè)研究[J].現(xiàn)代商業(yè),2018(34):65-67.