国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于回歸模型的流感疫情預(yù)測

2020-02-06 03:52白旭洋
現(xiàn)代商貿(mào)工業(yè) 2020年2期
關(guān)鍵詞:多元線性回歸

白旭洋

摘 要:目前現(xiàn)代醫(yī)學(xué)技術(shù)取得重大發(fā)展,但諸多傳染性疾病仍是人類社會向前發(fā)展的重要阻力之一。利用中國大陸地區(qū)已有的流感相關(guān)數(shù)據(jù)進行分析研究,應(yīng)用多元線性回歸、Lasso回歸以及Ridge回歸模型結(jié)合相關(guān)檢索詞數(shù)據(jù)進行建模分析, 探討回歸模型與流感疫情預(yù)測的相關(guān)性與可行性。結(jié)果發(fā)現(xiàn),與傳統(tǒng)最小二乘法結(jié)果進行比較,運用Lasso回歸以及Ridge回歸對于復(fù)雜數(shù)據(jù)的分析與建模準確度更高,表明上述模型的推斷能力更強,更適合于流感疫情的預(yù)測分析。通過回歸模型結(jié)合海量數(shù)據(jù)可分析流疫情,且具有相當高的準確性,因此建議將該種方法應(yīng)用到對于未來流感疫情的測控以及預(yù)防工程中。

關(guān)鍵詞:流感預(yù)測;多元線性回歸;Ridge回歸;Lasso回歸

中圖分類號:TB 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2020.02.092

0 引言

現(xiàn)階段的中國正處在由初級階段向全面小康社會過渡的關(guān)鍵時期。在經(jīng)濟水平高速發(fā)展的同時,醫(yī)療技術(shù)同樣應(yīng)該緊跟發(fā)展的快節(jié)奏,否則,相對落后的醫(yī)療技術(shù)將導(dǎo)致中國公民整體健康素質(zhì)的下滑,將對國家穩(wěn)定以及中國的國際形象造成難以預(yù)測的影響,甚至導(dǎo)致中國在未知的嚴重傳染病的侵襲下蒙受巨大損失。本文的目的即為利用搜索引擎數(shù)據(jù)結(jié)合回歸模型探究疫情暴發(fā)的因素,對其進行監(jiān)測防控,防止成為影響中國社會穩(wěn)定的因素之一。

Wu Yuan等人在2015年就在其論文中探討了未來利用時空大數(shù)據(jù)技術(shù)應(yīng)用于傳染病預(yù)警的可能性,并認為其能夠構(gòu)建起更加完善的基于泛在網(wǎng)絡(luò)的傳染病疫情獲取途。Li等也在2010年利用Z-D現(xiàn)象預(yù)測法、灰色預(yù)測模型。自回歸滑動平均混合模型與小波預(yù)測模型等數(shù)學(xué)預(yù)測方式對我國傳染病預(yù)測現(xiàn)狀進行了詳細分析。與此同時, Wang與她的團隊更是將定量預(yù)測模型與百度上有關(guān)登革熱的相關(guān)關(guān)鍵詞的指數(shù)結(jié)合,對于上一年在全國范圍內(nèi)爆發(fā)的登革熱疫情進行了分析,結(jié)果顯示,百度指數(shù)與登革熱疫情的關(guān)聯(lián)性非常明顯,又更進一步地說明了在信息時代,利用信息技術(shù)來輔助人類預(yù)防、監(jiān)測甚至治療疾病的可行性。這些研究都具有結(jié)合先進技術(shù)與大量數(shù)據(jù)對問題進行分析的優(yōu)點,但同時也都具有分析范圍相對小,數(shù)據(jù)涉及人群片面等問題。因此,利用多元線性回歸模型的數(shù)據(jù)分析與信息挖掘能力,可以有效地對全球范圍內(nèi)的疾病發(fā)病情況及數(shù)據(jù)進行統(tǒng)計與分析。在此過程中,利用多元線性回歸模型對傳染病疫情進行預(yù)測,可以有效地幫助疫情暴發(fā)后治療方案的提出。

2 數(shù)據(jù)查找

本研究使用中國2010年12月至2018年12月間流感發(fā)病人數(shù)作為因變量(y),流行性疾病相關(guān)搜索內(nèi)容(數(shù)據(jù)來源為百度指數(shù)網(wǎng)站)作為自變量,最終確定8個與流感相關(guān)的檢索詞作為本次驗證的具體指標,分別為:“流感”(X1),“病毒”(X2),“預(yù)防”(X3),“癥狀”(X4),“甲型”(X5),“傳染”(X6),“季節(jié)”(X7)和“疫苗”(X8)。

通過對上述8個檢索詞的相關(guān)數(shù)據(jù)在選定時間內(nèi)的折線圖進行數(shù)據(jù)分析,如圖1和圖2所示,最終利用回歸模型對于檢索數(shù)據(jù)進行分析。考慮到未知或潛在的因素對于最終統(tǒng)計結(jié)果的不利影響,最終決定將每月流感發(fā)病人數(shù)作為因變量。這最終,本次統(tǒng)計研究納入建模分析共有8個自變量。由于無偏估計在數(shù)據(jù)分析上的特點,有必要采用Lasso和Ridge回歸 等稀疏估計方法建立模型,對流感流行趨勢進行預(yù)測,分析其影響因素。

4 總結(jié)

本研究首先介紹了多元線性回歸模型以及Ridge回歸模型和Lasso回歸模型的原理及其在數(shù)據(jù)統(tǒng)計分析方面的具體應(yīng)用方法和模型預(yù)測性能,與百度指數(shù)相關(guān)結(jié)果數(shù)據(jù)結(jié)合,構(gòu)建了適合于流感疫情預(yù)測的Lasso回歸模型。研究結(jié)果Lasso回歸模型的結(jié)果更加貼近真實情況,具有實際的應(yīng)用價值。本文所構(gòu)建的統(tǒng)計模型選擇了較少的變量達到較高的穩(wěn)定性,使損失函數(shù)最小化。另外,本次實驗將三種模型結(jié)合共同分析八類檢索內(nèi)容,擁有較強的分析能力。因此,本研究所提出的方法也適用于對模型預(yù)測效果進行綜合評估的情況。

下一步可以將檢索詞數(shù)目由8詞上升至20詞,同時向檢索內(nèi)容中添加大量與流感有關(guān)內(nèi)容,去除部分流感并發(fā)癥相關(guān)內(nèi)容。此外,還可以將 2009年H1N1爆發(fā)第一波爆發(fā)流行的相關(guān)數(shù)據(jù)納入?yún)⒖?。弱化了對于異常的媒體關(guān)注熱點的反應(yīng),從而達到降低預(yù)測模型的效果。Lasso回歸模型具有的功能對于未來可能的傳染病疫情能夠發(fā)揮有效的監(jiān)測作用,能夠成為未來人工智能輔助醫(yī)學(xué)領(lǐng)域預(yù)防以及遏制傳染病的重要手段。

參考文獻

[1]李園,吳蜀豫.登革熱的流行趨勢與防控(英文)[J].Science Bulletin,2015,60(7):661-664.

[2]ZhenDong L I,Chen X R,Peng L I,et al.Identification of Polygonum viviparum endophytic bacteria Z5 and determination of the capacity to secrete IAA and antagonistic capacity towards pathogenic fungi[J].Acta Prataculturae Sinica,2010,19(2):61-68.

[3]趙修文.基于本體的醫(yī)療搜索引擎的設(shè)計和實現(xiàn)[D].長沙:國防科學(xué)技術(shù)大學(xué),2008.

[4]王若佳.融合百度指數(shù)的流感預(yù)測機理與實證研究[J].情報學(xué)報,2018,37(2):206-219.

[5]楊師華.基于Lasso回歸模型的遺傳性疾病與遺傳位點關(guān)聯(lián)分析[J].數(shù)學(xué)學(xué)習(xí)與研究:教研版,2019,(1):145-146.

[6]魯力,鄒遠強,彭友松,等.百度指數(shù)和微指數(shù)在中國流感監(jiān)測中的比較分析[J].計算機應(yīng)用研究,2016,33(2):392-395.

猜你喜歡
多元線性回歸
基于灰色關(guān)聯(lián)和線性規(guī)劃的糧食種植面積影響因素分析
宏觀經(jīng)濟變量對上證指數(shù)影響的實證研究
微觀尺度下商品房價格的影響因素
武漢市空氣污染對社會經(jīng)濟發(fā)展的影響
揭西县| 景东| 承德市| 黄山市| 化德县| 和硕县| 清远市| 德清县| 体育| 石台县| 巴楚县| 南川市| 宝坻区| 西吉县| 颍上县| 桂林市| 女性| 榆社县| 沁水县| 滁州市| 义乌市| 临朐县| 潼南县| 娄底市| 威海市| 孙吴县| 高淳县| 阿巴嘎旗| 神池县| 日土县| 象州县| 江阴市| 巩留县| 德庆县| 延津县| 理塘县| 财经| 泗洪县| 茂名市| 石屏县| 三穗县|