国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

百度和Google疾病預(yù)測(cè)有不同

2015-11-20 18:17:27
健康管理 2015年3期
關(guān)鍵詞:疾控中心流感百度

目前可供個(gè)人使用的大數(shù)據(jù)工具主要有兩類,一類是來(lái)自醫(yī)學(xué)監(jiān)測(cè)機(jī)構(gòu)的大數(shù)據(jù),類似中國(guó)的疾控中心,美國(guó)的Carolinas Health Care,日本京都大學(xué)荒牧研究所等,以來(lái)自就診患者統(tǒng)計(jì)為主,輔以大數(shù)據(jù)分析手段,以顯示某地區(qū)目前流行病的發(fā)病情況為主,預(yù)測(cè)疾病流行走向?yàn)檩o;另一類則來(lái)自搜索引擎和數(shù)據(jù)分析機(jī)構(gòu),包括Google Trends的疾病預(yù)測(cè),百度預(yù)測(cè)的疾病預(yù)測(cè),以及基于社交搜索的sickwether、patientslikeme和融合性的Healthmap等,以預(yù)測(cè)疾病流行走向?yàn)橹鳎故緟^(qū)域發(fā)病情況為輔。

兩種數(shù)據(jù)工具的手段大同小異,區(qū)別只在于前者提供的數(shù)據(jù)多是針對(duì)大區(qū)域的、服務(wù)機(jī)構(gòu)的數(shù)據(jù)需要,后者則多針對(duì)小區(qū)域甚至某個(gè)城市商圈,為個(gè)人消費(fèi)者服務(wù)。

Google 預(yù)測(cè)曾經(jīng)很準(zhǔn)

谷歌流感預(yù)測(cè)(www.google.org/flutrends)早在2008年即已推出,原理是采用流感趨勢(shì)系統(tǒng)監(jiān)測(cè)全美的網(wǎng)絡(luò)搜索,尋找與流感相關(guān)的詞語(yǔ),比如“咳嗽”和“發(fā)燒”等,并利用這些搜索結(jié)果來(lái)提前9個(gè)星期預(yù)測(cè)可能與流感相關(guān)的就醫(yī)量。

2009年在H1N1爆發(fā)幾周前,谷歌公司的工程師們?cè)凇禢ature》上發(fā)表了一篇論文,介紹了GFT,成功預(yù)測(cè)了H1N1在全美范圍的傳播,甚至具體到特定的地區(qū)和州,而且判斷非常及時(shí),令公共衛(wèi)生官員們和計(jì)算機(jī)科學(xué)家們倍感震驚。

這個(gè)工具最初運(yùn)行表現(xiàn)很好,許多國(guó)家的研究人員已經(jīng)證實(shí),其流感樣疾?。╥nfluenza-like illness, ILI)的估計(jì)是準(zhǔn)確的,并且可以提前數(shù)周乃至數(shù)月,不像疾控中心一樣要在流感爆發(fā)一兩周之后才可以做到。

但此后的2013年,《新科學(xué)家》發(fā)現(xiàn),在過(guò)去3年,該系統(tǒng)一直高估與流感相關(guān)的就醫(yī)量,在這類數(shù)據(jù)最有用的流感季節(jié)高峰期尤其預(yù)測(cè)不準(zhǔn)確。在2012/2013流感季節(jié),它預(yù)測(cè)的就醫(yī)量是美國(guó)疾控中心(CDC)最終記錄結(jié)果的兩倍;在2011/2012流感季節(jié),它高估了逾50%。

《scientists》雜志認(rèn)為,錯(cuò)誤源自一種被稱作大數(shù)據(jù)浮夸(Big Data Hubris)的算法變化,例如對(duì)模型的人工優(yōu)化,或是模型對(duì)某些不當(dāng)關(guān)鍵詞的自動(dòng)調(diào)整(例如某些搜索其實(shí)源于季節(jié)而非真實(shí)發(fā)病)。

芝加哥大學(xué)衛(wèi)生促進(jìn)研究中心博士后、衛(wèi)生經(jīng)濟(jì)學(xué)者陳茁也曾撰文分析了其中的原因。他認(rèn)為,谷歌搜索的結(jié)果和使用者人群“自我估計(jì)”的流感發(fā)病率相關(guān)。但在現(xiàn)實(shí)中,普通感冒在不同個(gè)體身上的嚴(yán)重程度上會(huì)有差別,有些患者因?yàn)閾?dān)心,便搜索了相關(guān)信息。這些搜索構(gòu)成了類流感“自我估計(jì)”中的“噪聲”。如果只用“谷歌流感趨勢(shì)”預(yù)測(cè)流感發(fā)病率就會(huì)存在問(wèn)題。

陳茁認(rèn)為“谷歌流感趨勢(shì)”項(xiàng)目失誤的另外一個(gè)原因是在數(shù)據(jù)分析方面存在欠缺。哈佛大學(xué)Gary King和搭檔的研究就指出了谷歌項(xiàng)目在分析上的不足。首先,這個(gè)項(xiàng)目沒(méi)有盡可能利用傳統(tǒng)的統(tǒng)計(jì)分析手段來(lái)剔除系統(tǒng)誤差,比如殘差的自相關(guān)性和季節(jié)性;其次,“谷歌流感趨勢(shì)”忽略了其他數(shù)據(jù)的作用。如果結(jié)合美國(guó)疾控中心的數(shù)據(jù),谷歌的預(yù)測(cè)其實(shí)有可能被大大改善。

百度預(yù)測(cè)野心很大

百度的疾病預(yù)測(cè)(http://trends.baidu.com/disease/)于2014年6月上線,目前可以對(duì)全國(guó)34個(gè)省區(qū)、331個(gè)地市、2870個(gè)區(qū)縣、19個(gè)城市的2558個(gè)商圈的11種疾病進(jìn)行未來(lái)趨勢(shì)的預(yù)測(cè),包括提供流感、肝炎、肺結(jié)核和性病等疾病的活躍度、流行指數(shù),以及各種疾病相關(guān)的城市和醫(yī)院排行榜,用戶可以查看過(guò)去 30 天以內(nèi)的數(shù)據(jù)和未來(lái) 7 天的預(yù)測(cè)趨勢(shì)。而且百度還在疾病預(yù)測(cè)的頁(yè)面上,整合了百度旗下其他優(yōu)勢(shì)產(chǎn)品資源,比如在頁(yè)面右下角提供了百度百科和百度健康的鏈接,用戶點(diǎn)擊過(guò)去就可以了解到有關(guān)當(dāng)前頁(yè)面疾病的各種相關(guān)知識(shí)。

百度疾病預(yù)測(cè)還加入了一些最新的技術(shù)成果和數(shù)據(jù)采集結(jié)果。例如,從公開(kāi)資料來(lái)看,該產(chǎn)品模型的搭建一是通過(guò)歷史數(shù)據(jù)構(gòu)建統(tǒng)計(jì)規(guī)律性,比如流感或者手足口等疾病具有季節(jié)性周期的規(guī)律,二是通過(guò)研究疾病人數(shù)與其他相關(guān)數(shù)據(jù)的相關(guān)性來(lái)計(jì)算預(yù)測(cè)結(jié)果,同時(shí)從統(tǒng)計(jì)的角度來(lái)驗(yàn)證數(shù)據(jù)的正確性,以機(jī)器提供的數(shù)據(jù)為基礎(chǔ),加入對(duì)異常數(shù)據(jù)的監(jiān)控和分析。

而為了讓預(yù)測(cè)的準(zhǔn)確率更高,百度還做了另外兩方面的努力。其一是在數(shù)據(jù)合作上,不僅引入權(quán)威機(jī)構(gòu)的相關(guān)數(shù)據(jù)而且保持同步更新,這其中不僅包含數(shù)據(jù)互通,同時(shí)也會(huì)與合作方的專家進(jìn)行產(chǎn)品交流。

另一點(diǎn)不同在于,百度預(yù)測(cè)引入社交、天氣、人群遷徙等搜索之外的數(shù)據(jù),在搜索數(shù)據(jù)上,Google的query數(shù)據(jù)依賴于Google Correlation產(chǎn)品,而百度則是直接從原始日志中進(jìn)行清洗、消岐、擴(kuò)展和分析,相對(duì)來(lái)說(shuō),理論上更容易避免“春天感冒怎么辦”這樣的查詢影響結(jié)果。此外,百度的地理劃分可以細(xì)化到城市商圈,可以查詢的疾病也比Google多。

事實(shí)上,百度的“野心”遠(yuǎn)不止簡(jiǎn)單的疾病預(yù)測(cè),讓“大數(shù)據(jù)落地”是如今互聯(lián)網(wǎng)公司不得不做出的改進(jìn),而百度也將在醫(yī)療領(lǐng)域深化定制化的健康信息服務(wù)。

為了讓疾病預(yù)測(cè)不只是一堆數(shù)據(jù)的堆積,而成為“中國(guó)人的健康圖譜,老百姓實(shí)用的生活助手”,百度正在對(duì)此產(chǎn)品進(jìn)行優(yōu)化,希望繼續(xù)增加病種,以覆蓋常見(jiàn)傳染病和慢性病。

此外,“除了時(shí)空數(shù)據(jù),我們還會(huì)增加天氣、環(huán)境污染、用戶屬性數(shù)據(jù),希望能夠針對(duì)不同用戶,提供個(gè)性化的防病、健康信息推送?!卑俣认嚓P(guān)負(fù)責(zé)人透露,百度疾病預(yù)測(cè)還將提供每日疾病指數(shù)等細(xì)化數(shù)據(jù),日后有望增加個(gè)人健康顧問(wèn)、預(yù)防治療措施、求醫(yī)用藥指導(dǎo)等功能。

來(lái)源:ITBear、健康LIFE

《中國(guó)科學(xué)報(bào)》

猜你喜歡
疾控中心流感百度
疾控中心采血人群的心理反應(yīng)與護(hù)理干預(yù)
疾控中心理化檢驗(yàn)人員職業(yè)危害分析及防護(hù)
冬春流感高發(fā) 加強(qiáng)防治最重要
Robust adaptive UKF based on SVR for inertial based integrated navigation
完善疾控中心人事檔案管理的有效策略研究
卷宗(2020年33期)2020-02-26 02:40:56
百度年度熱搜榜
在疾控中心微生物檢測(cè)中應(yīng)用微濾膜分離技術(shù)的效果分析
秋季謹(jǐn)防牛流感
百度遭投行下調(diào)評(píng)級(jí)
百度“放衛(wèi)星”,有沒(méi)有可能?
太空探索(2014年4期)2014-07-19 10:08:58
克东县| 大姚县| 河北区| 冀州市| 陵川县| 房产| 临夏市| 威信县| 长海县| 临沧市| 东宁县| 鄯善县| 正安县| 边坝县| 棋牌| 迁西县| 云和县| 泰和县| 肥西县| 奉贤区| 滦平县| 临泽县| 阿合奇县| 仁布县| 始兴县| 南通市| 西城区| 灵丘县| 广河县| 京山县| 安平县| 砚山县| 友谊县| 松桃| 崇州市| 五大连池市| 博野县| 东乡县| 阳新县| 唐河县| 若尔盖县|