黃文莉
摘 要本文首先對大數(shù)據(jù)的涵義及特點進行了梳理,在綜述國內(nèi)外大數(shù)據(jù)應(yīng)用實踐基礎(chǔ)上,歸納總結(jié)了我國大數(shù)據(jù)技術(shù)在疾病防控上應(yīng)用面臨的困難和挑戰(zhàn),進而提出了加快我國大數(shù)據(jù)發(fā)展的對策建議。
【關(guān)鍵詞】大數(shù)據(jù) 疾病防控
被喻為"未來的新石油"的大數(shù)據(jù),正成為繼云計算、物聯(lián)網(wǎng)之后信息技術(shù)領(lǐng)域的又一熱點《華爾街日報》將大數(shù)據(jù)時代、智能化生產(chǎn)和無線網(wǎng)絡(luò)革命稱為引領(lǐng)未來繁榮的三大技術(shù)變革。大數(shù)據(jù)技術(shù)已經(jīng)開始應(yīng)用到各行各業(yè)。在給人類社會帶來海量信息和巨大變革的同時,大數(shù)據(jù)技術(shù)在疾病防控上的應(yīng)用引起了人們越來越大的興趣。
1 大數(shù)據(jù)的定義
從某種程度上說,大數(shù)據(jù)是數(shù)據(jù)分析的前沿技術(shù)。簡言之,從各種各樣類型的數(shù)據(jù)中,快速獲得有價值信息的能力,就是大數(shù)據(jù)技術(shù)。
大數(shù)據(jù)的特點有四個層面:
(1)數(shù)據(jù)體量巨大。從TB級別,躍升到PB級別;
(2)數(shù)據(jù)類型繁多。如網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等等。
(3)處理速度快,1秒定律,可從各種類型的數(shù)據(jù)中快速獲得高價值的信息,這一點也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。
(4)高價值,只要合理利用數(shù)據(jù)并對其進行正確、準確的分析,將會帶來很高的價值回報。業(yè)界將其歸納為4個“V”——Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值)。
大數(shù)據(jù),其影響除了經(jīng)濟方面的,它同時也能在政治、文化、衛(wèi)生等方面產(chǎn)生深遠的影響,大數(shù)據(jù)可以幫助人們開啟循“數(shù)”管理的模式,也是我們當下“大社會”的集中體現(xiàn),三分技術(shù),七分數(shù)據(jù),得數(shù)據(jù)者得天下。數(shù)據(jù)有了,但如何駕馭這些海量數(shù)據(jù),將它們應(yīng)用于疾病防控工作方面,挖掘數(shù)據(jù)的核心價值,這就是我們疾控人員研究的方向。
1.1 大數(shù)據(jù)技術(shù)應(yīng)用的必要性
傳統(tǒng)疾病預(yù)防控制的方式最大的不足在于實時性上,但疾病的防控搶的就是時間。如果能在疾病流行前即預(yù)測到疾病的發(fā)展態(tài)勢,加強對疾病的預(yù)防,就能達到最大限度保障群眾健康的目的?,F(xiàn)在,利用大數(shù)據(jù)技術(shù)對疾病傳播進行更先進的監(jiān)控與控制成為了可能。
1.2 大數(shù)據(jù)技術(shù)應(yīng)用實例
(1)谷歌已在疾病預(yù)測防控上已經(jīng)走出先例,那么我們先來看下谷歌的谷歌流感趨勢(Google Flu Trends,GFT)的工作成果,從中窺視疾病預(yù)防控制的大數(shù)據(jù)未來。
2008年,谷歌上線“谷歌流感趨勢”項目,該項目開始預(yù)測流感傳播。
2009年在美國的H1N1爆發(fā)幾周前,谷歌成功預(yù)測了H1N1在全美的傳播范圍,具體到了州還有特定地區(qū),判斷非常及時,令美國公共衛(wèi)生機構(gòu)以及全美大為震驚,疾控中心通常只能在流感爆發(fā)一兩周之后才可以做到,而谷歌的及時性讓全美側(cè)目。
這是真正第一次利用搜索引擎大數(shù)據(jù)對疾病控制的預(yù)測嘗試,谷歌因此也獲得巨大殊榮。
(2)2014年4月2日,清華大學(xué)在京宣布,該校將聯(lián)合國內(nèi)醫(yī)療設(shè)備生產(chǎn)企業(yè)啟動基于大數(shù)據(jù)的公共衛(wèi)生項目國民“健康云數(shù)據(jù)”計劃,預(yù)計3年內(nèi)完成數(shù)據(jù)平臺建設(shè),并為遠程健康管理、疾病預(yù)防等提供支撐。這也是大數(shù)據(jù)技術(shù)服務(wù)于公共衛(wèi)生領(lǐng)域的個案,這個項目將有效提升疾病早期預(yù)防等服務(wù)的針對性。通過對大規(guī)模數(shù)據(jù)的整理分析,可以在疾病早期防控和阻斷疾病產(chǎn)生根源方面產(chǎn)生更積極的作用。
2 大數(shù)據(jù)在疾病防控的應(yīng)用方向
2.1 提前確定一定規(guī)模的未知疾病,為疫情控制爭取時間
無論傳統(tǒng)檢測還是歷史數(shù)據(jù)統(tǒng)計都是無法監(jiān)測到任何沒有臨床癥狀的病例的,這些經(jīng)驗在醫(yī)院的臨床經(jīng)驗中都為0。但大數(shù)據(jù)卻可以做到這件事,通過醫(yī)院的共享信息、疾病監(jiān)測系統(tǒng)網(wǎng)絡(luò)報告數(shù)據(jù)以及各類網(wǎng)絡(luò)監(jiān)控引擎指定地區(qū)的用戶的頻繁搜索關(guān)鍵詞,可以檢測到某個地區(qū)已經(jīng)出現(xiàn)了諸如不明原因的肺炎,某地餐館讓多少人出現(xiàn)嘔吐腹瀉等異常狀況……然后再通過與疾病控制中心的病毒庫中的病毒分析,尋找吻合的病毒,進行比對分析然后將其找出,為判斷疾病贏取時間。換句話說,有了大數(shù)據(jù)后,疾病預(yù)防可以真正在第一時間內(nèi)去判斷出疫情的病毒源,進而為控制爭取時間。當前的科技下,疫情的發(fā)生是誰也無法控制的,我們目前唯一能夠控制的就是及時制止其傳播的范圍,而大數(shù)據(jù)則是目前唯一的也是最佳的途徑。
2.2 判斷人員流向,控制疫情
在疫情發(fā)生后,雖然國家可以第一時間控制住當?shù)匾咔?,但是人員流動則是無法控制的?,F(xiàn)在利用網(wǎng)絡(luò)技術(shù)可以做到,比如A地突然爆發(fā)了傳染病,而此時根據(jù)大數(shù)據(jù)的監(jiān)控就能監(jiān)測到傳染源區(qū)人員的主要流向地是B地與C地,于是疾控中心就拿出對應(yīng)的醫(yī)療技術(shù)和對應(yīng)的治療藥品以及疫苗來防治,第一時間趕到B地與C地,將一切藥物準備就緒并為當?shù)厝私臃N疫苗,這樣一來就減少了盲目的廣撒網(wǎng)式的全面布局情況,通過網(wǎng)絡(luò)技術(shù)上提供的人員流動數(shù)據(jù),讓控制疫情在效率上大幅度提升。
2.3 治療藥物和疫苗的迅速研發(fā)
在疫情發(fā)生后最重要的事情就是研發(fā)對應(yīng)藥物,傳統(tǒng)的做法是一個小范圍的研發(fā),然后用傳統(tǒng)的交流方式,但是有了大數(shù)據(jù)就不可同日而語。在病人的治療中,所有藥物的使用數(shù)據(jù)以及用戶的病情數(shù)據(jù)都將全部聯(lián)網(wǎng),當機器檢測到發(fā)現(xiàn)某種藥物(通過讀取錄入的藥物數(shù)據(jù))對病人的病情(通過讀取錄入病人健康的關(guān)鍵指數(shù)后的數(shù)據(jù))有部分效果后,將會迅速納入研發(fā)的決策范圍,為研發(fā)部門提供有用參考,為研發(fā)對抗疫情的藥物以及預(yù)防疫情的疫苗,提供全網(wǎng)的大數(shù)據(jù)的支持。
2.4 建立疾病防控監(jiān)測預(yù)警預(yù)報機制
未來通過大數(shù)據(jù)技術(shù)在疾病防控的預(yù)警預(yù)報應(yīng)用方面,不僅僅只是有關(guān)部門的決策者能夠收到,而是全民都享有的福利,從而保障更多人的安全。比如當你去出差時,網(wǎng)絡(luò)會在你的手機上提前通知你,你將要去的地區(qū)有食品安全問題,再比如第一時間通知你,你所在的地區(qū)有流感地區(qū)的人群大量流入,讓你及時做好預(yù)防工作以及接種疫苗等等。
3 面臨的困難和挑戰(zhàn)
谷歌雖然在09年的預(yù)測上做出了漂亮的成績,但是在2013年的2月谷歌流感趨勢被媒體大量批評,原因就在于其數(shù)據(jù)總是偏高于真實的流感數(shù)據(jù)。
谷歌出錯的原因有很多,比如谷歌的搜索算法調(diào)整會間接影響到用戶習(xí)慣,再比如谷歌的推薦搜索以及相關(guān)性推薦也會影響用戶的搜索結(jié)果,此外搜索某個關(guān)鍵詞的用戶也不一定是患病用戶,再加上運營商的地理位置判斷等問題,使得谷歌出現(xiàn)算法過度擬合的情況,將噪聲當成了信號,導(dǎo)致其結(jié)果的不準確性。
4 對策與建議
大數(shù)據(jù)是云計算的具體化,且正在成為一個國家最重要的國家社會資源,對大數(shù)據(jù)的獲取和利用能力正成為軟硬兼?zhèn)涞恼鎸嵙?。因此,對于大?shù)據(jù)在疾病預(yù)防控制上應(yīng)用的研究可以由政府為主導(dǎo),搭建基于云計算的安全、可靠、準確大數(shù)據(jù)平臺,再引入社會力量建設(shè)各類疾病預(yù)防控制專業(yè)信息服務(wù)平臺,面向公眾提供疾病預(yù)防專業(yè)、權(quán)威咨訊。
困難從從,但機會與挑戰(zhàn)并存,我們要加快大數(shù)據(jù)技術(shù)研究,將其應(yīng)用于疾病防控,最大限度地保障人民的身體健康。
參考文獻
[1]馬家奇.公共衛(wèi)生大數(shù)據(jù)應(yīng)用[J].中國衛(wèi)生管理信息雜志,2014(04).
[2]于石成.大數(shù)據(jù)視角下的衛(wèi)生統(tǒng)計工作[J].醫(yī)學(xué)信息學(xué)雜志,2013(10).
[3]高漢松,基于云計算的醫(yī)療大數(shù)據(jù)挖掘平臺[J].醫(yī)學(xué)信息學(xué)雜志,2013(05).
[4]于石成.全球疾病負擔研究-大數(shù)據(jù)分析應(yīng)用實例[J].醫(yī)學(xué)信息學(xué)雜志,2013(09).
作者單位
廣東省肇慶市疾病預(yù)防控制中心 廣東省肇慶市 526060