劉奕
摘? ?要:大數(shù)據(jù)是國家提高公共衛(wèi)生保障能力和應對流行病威脅的關鍵資源。從可得性和應用價值來看,公共衛(wèi)生中涉及的大型數(shù)據(jù)源可以分為五大類,即醫(yī)學大數(shù)據(jù)、互聯(lián)網(wǎng)大數(shù)據(jù)、地理/氣象大數(shù)據(jù)、基于便攜設備的人類行為大數(shù)據(jù)和零售大數(shù)據(jù)。將多來源大數(shù)據(jù)納入公共衛(wèi)生體系,有助于改善公共衛(wèi)生體系信息報送的及時性、完整性以及對新發(fā)傳染病的監(jiān)測敏銳性,幫助傳染病防控政策精準實施,但面臨著數(shù)據(jù)挖掘和共享、數(shù)據(jù)集成和處理技術、數(shù)據(jù)隱私保護以及管理體制和機制不適應等方面的難題。為此,應搭建公共衛(wèi)生大數(shù)據(jù)應用協(xié)同網(wǎng)絡,加大大數(shù)據(jù)應用專項資金投入,健全公共衛(wèi)生大數(shù)據(jù)治理體系,加強專業(yè)人才培養(yǎng)。
關鍵詞:公共衛(wèi)生安全;大數(shù)據(jù);公共衛(wèi)生體系;新冠肺炎疫情
中圖分類號:TP311.13? ?文獻標識碼:A? ?文章編號:1003-7543(2020)04-0005-12
隨著移動互聯(lián)網(wǎng)、云計算、物聯(lián)網(wǎng)和社交媒體等的發(fā)展,全球的數(shù)據(jù)量和數(shù)據(jù)種類急劇增加,大數(shù)據(jù)已成為至關重要的經(jīng)濟資產。雖然大數(shù)據(jù)在打擊犯罪、市場營銷、金融、氣象預測、復雜物理模擬和環(huán)境治理等領域已顯示出廣闊的應用前景,但除了在病毒學和微生物學研究中使用全基因組測序和生物信息之外,整體上看醫(yī)療保健領域的大數(shù)據(jù)應用速度依然較慢。習近平總書記在中央政治局常委會會議研究應對新型冠狀病毒肺炎疫情工作時的講話中明確指出,新型冠狀病毒肺炎疫情是對我國治理體系和能力的一次大考,應健全國家應急管理體系,補齊公共衛(wèi)生短板[1]。突如其來的新冠肺炎疫情,暴露出我國公共衛(wèi)生和疾病防控體系建設與經(jīng)濟發(fā)展不相適應、重大公共衛(wèi)生事件初期科學防控預案缺乏、數(shù)據(jù)共享及轉化應用渠道不通暢等問題[2]。積極應對將大數(shù)據(jù)有效納入傳染病監(jiān)測和調查的挑戰(zhàn),使用人工智能、機器學習等新技術快速而及時地捕捉有關傳染性疾病的多來源動態(tài)信息,改進公共衛(wèi)生監(jiān)測系統(tǒng)和發(fā)展預測模型,對于我國在新的歷史時期提升應對突發(fā)重大公共衛(wèi)生事件的能力和水平具有重大價值。
一、將新的大數(shù)據(jù)源納入公共衛(wèi)生體系的意義與價值
大數(shù)據(jù)指的是龐大而復雜的數(shù)據(jù)集合,具有極大量、多種類、生成速度快、準確性高等特征。圍繞信用卡、互聯(lián)網(wǎng)、手機和社交網(wǎng)絡的使用,特別是來自微信、微博、視頻和音頻網(wǎng)站的非結構化數(shù)據(jù)在近些年經(jīng)歷了指數(shù)級增長。雖然數(shù)據(jù)挖掘具有探索隱藏模式和規(guī)律的巨大潛力,但其本質上是異構的,需要以有組織的形式搜集并予以整合;加之測量技術、數(shù)據(jù)存儲設備以及鏈接不同數(shù)據(jù)集的能力特別是機器學習和人工智能等處理技術應用成本的降低[3],搜集、組織和分析大數(shù)據(jù)集以發(fā)現(xiàn)有用信息的價值得以極大凸顯。公共衛(wèi)生體系預防疾病、改善健康的能力,很大程度上取決于收集和分析有關疾病和病因的人群水平數(shù)據(jù),以及采用循證干預措施的水平。對于傳統(tǒng)的傳染病監(jiān)測而言,基于實驗室測試和公共衛(wèi)生機構收集的醫(yī)學數(shù)據(jù)是判定的黃金標準,但可能會在時間上有所滯后,而且存在產出成本高、對小區(qū)域和部分人群的監(jiān)控精確性不足等問題。與傳統(tǒng)的監(jiān)控方法相比,源自電子病歷、志愿者眾包數(shù)據(jù)以及社交媒體、互聯(lián)網(wǎng)和手機等其他數(shù)字來源生成的大數(shù)據(jù),可以提供有關傳染病威脅或暴發(fā)的更及時、詳細的本地化信息,是現(xiàn)有方法的必要補充。
(一)有助于改善公共衛(wèi)生體系的信息及時性
現(xiàn)有傳染病的傳統(tǒng)信息積累模型仍然是分級輻射模式的變體,由較小的報告中心向地方一級的公共衛(wèi)生機構報告,再由其報告至國家級公共衛(wèi)生機構,累積的信息在總體級別進行匯總、處理、更正后,有關的行動再以自上而下的方式傳播到整個系統(tǒng)。從保證流程專業(yè)和規(guī)范的角度來看,這種方式是有效且經(jīng)濟的。但是,信息傳遞和處理步驟不可避免地會出現(xiàn)時間延遲,并將導致公共衛(wèi)生干預的響應效率降低。在應對迅速發(fā)展的傳染病威脅時,醫(yī)學評估和循證案例積累的時滯,帶來的后果可能是嚴重的。雖然在國際層面和一些國家層面已經(jīng)建立起的信息直報系統(tǒng)被認為可以成功識別潛在疾病的暴發(fā)并實現(xiàn)疾病暴發(fā)時的數(shù)據(jù)共享,但這種信息積累模型在可預測人群和疫情暴發(fā)的情況下才更為有效。在人群大規(guī)模流動的情形下,傳染病將以意想不到的方式和速度傳播,疾病發(fā)生和報告之間的時間間隔以及數(shù)據(jù)空間分辨率的局限性使監(jiān)控系統(tǒng)的有效性大大降低。相關研究表明,從首次報告到區(qū)域或國家開始調查的時間,是疾病暴發(fā)嚴重程度和總持續(xù)時間的重要決定因素[4]。眾包數(shù)據(jù)以及來自智能手機、社交媒體和互聯(lián)網(wǎng)等多種不同技術和平臺的大數(shù)據(jù),可以提供個人水平上的實時信息,雖然無法直接產出準確的病例數(shù),但可以用來增強醫(yī)療系統(tǒng)和實驗室的監(jiān)控,有助于從疾病首發(fā)到報告監(jiān)測時間間隔的縮短,從而實現(xiàn)更及時、更有效的傳染性疾病管理。研究發(fā)現(xiàn),綜合6種基于互聯(lián)網(wǎng)的傳染病大數(shù)據(jù)分析系統(tǒng),能夠比官方公共衛(wèi)生監(jiān)測平均提前10天發(fā)現(xiàn)H5N1流感的暴發(fā)[5]。
(二)有助于增進公共衛(wèi)生體系的信息完整性并提升分析精度
在使用常規(guī)傳染病報告系統(tǒng)的醫(yī)療機構中,可能會發(fā)生漏診、漏報和延誤報告的情況,這些信息通常在匯總分析中被掩蓋。盡管傳統(tǒng)監(jiān)測系統(tǒng)遺漏的病例在臨床上可能不太嚴重,未被涵蓋的偏遠地區(qū)在統(tǒng)計上也不夠顯著,但對于了解疾病傳播規(guī)律、進行預測性建模和控制工作,以及衡量疾病造成的生產力損失可能非常重要。而大數(shù)據(jù)集的一個突出特點是N=全部,即不需要樣本,可以使用整個背景種群,故而不存在抽樣偏差問題。而且,智能手機和可穿戴設備提供了有關位置、活動和聯(lián)系人的大量實時和高分辨率數(shù)據(jù),增加了在“難以到達”的人群和地區(qū)中獲取信息的機會,使得以前所未有的細節(jié)和廣度深入了解人群行為及其健康風險因素成為可能。比如,借助大數(shù)據(jù),決策者可以超越年齡、性別、種族、民族等傳統(tǒng)指標來進一步細化患者,并在適當?shù)牡乩矸秶鷥冗M行匯總,從而反映新發(fā)傳染病的群體和地理異質性,對不同類型干預措施的潛在效應進行有效評估。
(三)能夠提高公共衛(wèi)生體系對新發(fā)傳染病的監(jiān)測敏感性,節(jié)約社會成本
傳統(tǒng)的傳染病監(jiān)控系統(tǒng)正受到來自新發(fā)傳染病的挑戰(zhàn),如COVID-19、MERS、SARS、Zika、Ebola等。為了滿足發(fā)現(xiàn)新疾病特別是發(fā)現(xiàn)可能與生物恐怖主義相關疾病的需求,北美、歐洲及其他地區(qū)的許多國家已投入大量資源開發(fā)綜合癥狀監(jiān)測系統(tǒng)。癥狀監(jiān)測使用確診前可辨別的臨床特征或癥狀發(fā)作提示的活動作為疾病活動變化的警報,因而可以檢測新出現(xiàn)的疾病。除了可以通過大數(shù)據(jù)平臺增加新的信息源外,與傳統(tǒng)上用于監(jiān)測異?;顒拥慕y(tǒng)計過程相比,大數(shù)據(jù)分析和機器學習可以為監(jiān)測系統(tǒng)提供重要的優(yōu)勢,比如依托貝葉斯模型建立的算法,可以使用當前流行病學背景下的觀察數(shù)據(jù)和疾病先驗概率來估計疾病事件實際發(fā)生的概率,從而增進公共衛(wèi)生體系的戰(zhàn)略敏捷性。此外,傳統(tǒng)的以生物學為重點的監(jiān)測技術,采取患者訪談和實驗室檢查、后生成正式報告鏈條的模式,雖然通常被認為是準確的,但過程成本也是極其高昂的。大數(shù)據(jù)具有用公式化算法代替和支持人類決策的能力,可以更深入地了解和洞察影響健康的因素。與傳統(tǒng)的研究方法相比,它能夠提高統(tǒng)計的有效性,在公共衛(wèi)生系統(tǒng)中的應用有望成為大數(shù)據(jù)領域的最佳實踐。與個人生活趨勢相匹配時,從電子健康記錄中提取的數(shù)據(jù)不僅能夠提升單個患者的護理水平,而且可以發(fā)現(xiàn)潛在的健康風險,預測公共健康趨勢并在整體上有效降低醫(yī)療成本。
(四)能夠提升預測模型的精確性,幫助傳染病防控政策精準實施
近年來,對個人和人群進行更精確描述分析的“精準公共衛(wèi)生”,成為公共衛(wèi)生體系發(fā)展的重要方向。精準公共衛(wèi)生是指通過應用新興的方法和技術監(jiān)測人群中疾病、病原體暴露行為和易感性,從而提高預防疾病、促進健康和減少人群健康差異,以及制定改善健康的政策和目標明確的實施方案的能力。作為一種新興實踐,精準公共衛(wèi)生鼓勵使用新數(shù)據(jù)、新技術和新方法更精細地預測和了解公共衛(wèi)生風險,并針對更具體和同質的亞人群定制治療方法。大數(shù)據(jù)可以通過改善監(jiān)測和評估效果來促進精準的公共衛(wèi)生;對于預測模型來說,作為公共衛(wèi)生體系了解疾病傳播情況、進行疾病管理計劃的重要工具,納入大數(shù)據(jù)后,公共衛(wèi)生預測模型的有效性將有較大提升。與市場營銷和天氣預報等其他領域相比,將大數(shù)據(jù)應用于傳染病動態(tài)建模仍處于起步階段。傳染病與氣象事件的預測模型之間最大的區(qū)別是可用于參數(shù)化模型的信息的質量和數(shù)量,傳染病模型對接觸速率參數(shù)和組內組間接觸的異質性特別敏感。目前大多數(shù)公共衛(wèi)生模型都假設組內進行隨機混合并僅關注較大的人口中心之間的混合;而新的大數(shù)據(jù)分析工具可以為傳染病模型提供詳細的運動信息,并捕獲種群內接觸的異質性。為了響應媒體的關注以及由此引起的公眾關注變化,這種精確的運動數(shù)據(jù)還可以測量感染者和易感者之間的不同接觸率。通過智能手機和應用程序,還可以收集有關人員、地點和時間的數(shù)據(jù),并據(jù)此評估其施行效果,調整干預措施。因此,從公共衛(wèi)生的角度來看,大量數(shù)據(jù)的收集構成了流行病學研究中不可估量的資源,有助于分析人群的健康需求、評估基于人群的干預措施并制定明智的政策。
二、公共衛(wèi)生中的大數(shù)據(jù):來源及應用前景
將傳統(tǒng)傳染病監(jiān)測與大數(shù)據(jù)集相結合,是公共衛(wèi)生體系發(fā)展的重要方向。一些數(shù)據(jù)來源如社交媒體、搜索引擎、衛(wèi)星數(shù)據(jù)、全球氣候、社交媒體、學校/工作出勤、藥品銷售等本身并未包含很多關于健康的信息,雖然不能替代公共衛(wèi)生機構和研究人員提供的高質量監(jiān)控數(shù)據(jù),但如果將結構化和非結構化的多個傳統(tǒng)與非傳統(tǒng)數(shù)據(jù)源融合在一起,并通過使用一系列有助于從噪聲中提取信號的工具,它們所反映出的社區(qū)健康狀況的圖景將比僅從臨床數(shù)據(jù)中獲得的更為迅速和可操作。從可得性和應用價值角度來看,公共衛(wèi)生中涉及的大型數(shù)據(jù)源大致可以分為五個大類,即醫(yī)學大數(shù)據(jù)、互聯(lián)網(wǎng)大數(shù)據(jù)、地理/氣象大數(shù)據(jù)、基于便攜設備的人類行為大數(shù)據(jù)、零售大數(shù)據(jù)。
(一)醫(yī)學大數(shù)據(jù)
從來源上看,醫(yī)學大數(shù)據(jù)主要包括臨床大數(shù)據(jù)、全基因組測序(WGS)數(shù)據(jù)和眾包大數(shù)據(jù)。這些大數(shù)據(jù)在流行病學和分子生物學研究中已得到一定程度的應用,但其在傳染病監(jiān)測和調查中的作用尚待深度挖掘。
1.臨床大數(shù)據(jù)
在醫(yī)療領域,大數(shù)據(jù)來自醫(yī)院信息系統(tǒng)、醫(yī)生的工作、患者體檢、藥房、治療記錄和醫(yī)學成像等,產出的主要數(shù)據(jù)包括電子健康記錄(EHR)/電子病歷(EMR)、個人健康記錄(PHR)和醫(yī)學圖像。EHR目前已被許多國家采用,2012年電子健康記錄產生了約500 PB的數(shù)據(jù),2020年將達到25 000 PB[6]。盡管電子記錄是公共衛(wèi)生監(jiān)測數(shù)據(jù)的最直接來源,但也有許多因素會限制其利用。比如,這些大數(shù)據(jù)大多是非結構化的,用于分析來自異構源信息的工具尚在探索之中;高機密性的數(shù)據(jù)集即使是已取消標識和匯總的數(shù)據(jù),隱私問題也會成為訪問的重要障礙;而且,EHR通常不會記錄包括環(huán)境或行為風險因素等重要的關注變量,在公共衛(wèi)生監(jiān)測活動中的用途可能有限,故而大多數(shù)電子健康信息系統(tǒng)主要服務于臨床,而不是公共衛(wèi)生。
2.全基因組測序(WGS)數(shù)據(jù)
全基因組測序(WGS)數(shù)據(jù)的分析,是大數(shù)據(jù)在傳染病監(jiān)控和調查中最廣泛認可的應用之一。WGS可用于從特定暴發(fā)調查或疑似來源中吸納或排除病例,并以此幫助公共衛(wèi)生系統(tǒng)確定感染控制措施。在某些情況下,還可以使用進化分析方法推斷某些病原體的起源和出現(xiàn),估計潛在的疾病來源并確定最可能的傳播鏈。然而,WGS的應用仍有其局限性,工具性能的因素有可能導致影響分析的誤報,目前無論是WGS還是任何單獨的技術尚不足以確定傳染病暴發(fā)及其原因;生物信息學相關研究還對報告數(shù)據(jù)處理和WGS方法的透明性提出了質疑,并提出有必要對用于公共衛(wèi)生實踐的WGS方法論和生物信息學工具進行標準化。
3.眾包大數(shù)據(jù)
作為一種基于眾包數(shù)據(jù)的主動監(jiān)測方法,參與式人群監(jiān)測指的是志愿者通過互聯(lián)網(wǎng)或電話訪談形式主動提供健康相關信息。參與式監(jiān)測在志愿者注冊時進行背景調查,并對志愿者是否出現(xiàn)某些癥狀或行為進行連續(xù)調查,由此可以對一般人群中疾病或健康事件等分布情況作出估計[7]。由于相關信息由志愿者主動提供,參與式監(jiān)測數(shù)據(jù)較之公共衛(wèi)生系統(tǒng)被動搜集的可靠性、完整性和針對性都更強。從2003年荷蘭和比利時最先發(fā)起參與式監(jiān)測系統(tǒng)——大流感調查Great Influenza Survey以來,參與式系統(tǒng)已被世界各國廣泛用于流感監(jiān)測,典型的如英國的流感調查Flusurvey、澳大利亞流感追蹤FluTracking、墨西哥呼吸道疾病監(jiān)測系統(tǒng)Reporta和在美國、加拿大上線的Flu Near You等。歐洲流感監(jiān)測網(wǎng)Influenzanet目前已覆蓋10個國家和地區(qū),有5萬名注冊志愿者,而且其可擴展屬性決定了添加額外的參與者不會顯著增加成本。對流感網(wǎng)的評估顯示,其可以在前哨醫(yī)師發(fā)布之前成功檢測出病毒活性的變化[8]。然而,基于自愿者的監(jiān)測可能具有樣本自我選擇偏差、混雜因素等問題,自我報告的形式無法避免故意誤報,對于未經(jīng)醫(yī)生和實驗室測試證實的體征和癥狀識別也存在一定困難。
(二)互聯(lián)網(wǎng)大數(shù)據(jù)
互聯(lián)網(wǎng)大數(shù)據(jù)指的是個人在使用互聯(lián)網(wǎng)時留下的數(shù)字痕跡,其中涉及公共衛(wèi)生行為的大數(shù)據(jù)主要包括與公共衛(wèi)生有關的新聞報道、對健康相關主體信息的網(wǎng)絡搜索、微信、微博和網(wǎng)絡論壇上有意共享的相關信息等。
1.匯總新聞報道
事實表明,來自非醫(yī)學渠道的疫情信息非常重要。目前,世界上使用媒體新聞報道建立的疾病監(jiān)測系統(tǒng)包括GPHIN,ProMED-mail和HealthMap。監(jiān)測新興疾病計劃ProMED-mail是最早的基于事件的溫和監(jiān)測系統(tǒng),信息來源主要是媒體報道、官方報告、網(wǎng)上匯總和當?shù)赜^察員得到的世界疫癥情報。ProMED-mail目前主要和托管于哈佛大學的HealthMap合作,并結合世界衛(wèi)生組織、GeoSentinel、世界動物衛(wèi)生組織(OIE)、聯(lián)合國糧食及農業(yè)組織(FAO)、EuroSurveillance、Google新聞、Wildlife Data Integration Network、百度新聞和SOSO信息等多個來源渠道。HealthMap每天24小時監(jiān)控、匯總和過濾以9種語言收集的信息,在一項針對2012年6個月內111例傳染病暴發(fā)的研究中,HealthMap在首次正式報告之前的平均1.26天(p=0.002)就發(fā)布了預警[9]。
世界衛(wèi)生組織早在20世紀90年代后期就建立了“全球公共健康情報網(wǎng)”(Global Public Health Intelligence Network,GPHIN),總部設在加拿大。GPHIN使用與各國和地方報紙以及精選新聞通訊鏈接的新聞聚合器,可以收錄和挖掘9種不同語言的30 000多個全球新聞源,所考察的新聞涵蓋健康、體育、旅游和金融等多個領域。GPHIN每15分鐘掃描一次,能在不到1分鐘的時間內完成翻譯和數(shù)據(jù)處理,并結合人工判讀識別發(fā)現(xiàn)和跟蹤公共衛(wèi)生威脅,以實現(xiàn)基于互聯(lián)網(wǎng)的實時、早期預警。GPHIN系統(tǒng)被認為首先預測了MERS的暴發(fā),并且通過抗病毒藥物銷售量增加預測了SARS在中國的早期活動[10]。
除了以上兩種代表性的全球監(jiān)測系統(tǒng)之外,有一些研究還嘗試通過對媒體報道的自定義查詢預測傳染病暴發(fā),但同時也發(fā)現(xiàn)了一些應用局限。比如,媒體報道關注聳人聽聞故事的特性,決定了監(jiān)測結果有可能發(fā)生偏差,需要和其他醫(yī)學數(shù)據(jù)、眾包數(shù)據(jù)和智能手機數(shù)據(jù)相結合。未來隨著人工智能技術的發(fā)展,全球監(jiān)測系統(tǒng)有望通過搜索算法和維護系統(tǒng)的更新,實現(xiàn)功能的不斷完善。
2.搜索引擎
谷歌流感趨勢(Google Flu Trends)基于谷歌搜索引擎,每天使用查詢日志跟蹤特定區(qū)域的總搜索量和輸入特定搜索詞的頻率,據(jù)此預測流感的發(fā)生時間和規(guī)模。谷歌流感趨勢的預測效果令人鼓舞,可以做到比美國疾病控制與預防中心(CDC)的FluView快7—10天[11];它甚至被證明可以預測腸胃疾病的暴發(fā)以及輪狀病毒在幼兒中的暴發(fā)[12]。然而,其失守的事件也屢屢提醒人們,使用互聯(lián)網(wǎng)數(shù)據(jù)進行傳染病風險預測的方法,可能會在少數(shù)情況下過度擬合模型。2013年2月,谷歌流感趨勢估計的流感相關就診次數(shù)是CDC定點診所和醫(yī)院報告的兩倍[13]。盡管Google流感趨勢與實驗室確診病例的相關性一直偏低,但通過與歷史監(jiān)測數(shù)據(jù)結合,可以顯著改善預測精準度。另一個重要的局限是,其在流行病學中解釋特定年齡差異的能力有限,當然通過IP地址捕獲位置等相關信息也是可以考慮的改進方法。
3.平臺大數(shù)據(jù)
在平臺大數(shù)據(jù)監(jiān)測傳染病方面,已有研究主要關注在線餐廳評論論壇用于估計食源性疾病的風險或監(jiān)測疾病暴發(fā)的可行性問題。其中,Yelp(www.yelp.com)作為最經(jīng)常使用的飯店評論網(wǎng)站,理所當然成為了主要研究對象。通過回顧顧客在Yelp上發(fā)表的評論,比如根據(jù)對兩個或兩個以上顧客生病且潛伏期大于10小時的“病”“嘔吐”“腹瀉”“食物中毒”等詞的搜索來確定病例,已有研究預測9個月內發(fā)生的3次未報告的與餐廳相關的傳染病暴發(fā)[14],從而證明了在線餐館評論在識別食源性疾病暴發(fā)方面的有效性,特別是具有識別傳統(tǒng)監(jiān)測工具無法捕獲的小點源疾病暴發(fā)的潛力。除了評論文字中的監(jiān)測線索外,已有研究還通過建立統(tǒng)計模型,考察了評論的數(shù)量、長度、平均得分、負面評論的數(shù)量以及虛假評論數(shù)量,發(fā)現(xiàn)評論內容與公共衛(wèi)生部門衛(wèi)生檢查結果之間的高度相關性[15]。此外,基于7種語言對于維基百科(Wikipedia)數(shù)據(jù)查詢的模型,可以對登革熱和流感的發(fā)病時間監(jiān)控前置多達4周。目前,美國的一些大城市已經(jīng)使用Yelp或Twitter的數(shù)據(jù)來確定檢查的餐廳名錄,對于平臺大數(shù)據(jù)的監(jiān)測在確定嚴重違反健康法規(guī)的場所方面取得了可喜的成果??梢灶A期,在我國通過對美團點評、餓了嗎等平臺開展類似的分析,也有望取得較好的監(jiān)測效果。當然,虛假評論的存在也要求通過電話、發(fā)送私人信息等形式對異常評論和評分進行人工復核,或者從其他評論網(wǎng)站或地方衛(wèi)生和食藥監(jiān)管部門導入數(shù)據(jù)加以印證。也有研究指出,當以大型連鎖餐飲為樣本或使用高排名的評論時,模型準確性更高。此外,由于公眾缺乏對各種病原體不同潛伏期的專業(yè)知識,評論人也有可能將感染源歸于錯誤來源。
4.社交網(wǎng)絡大數(shù)據(jù)
社交媒體提供了利用公眾集體智慧對傳染病早期傳播進行控制的機會;通過非結構化的文本挖掘,公共衛(wèi)生管理部門可以獲取反映傳染病癥狀的被動監(jiān)視實時數(shù)據(jù)。已有研究主要是基于Twitter和Facebook兩個平臺展開的,對Facebook的研究主要關注慢性疾病的發(fā)生風險評估,而Twitter則被更多用于監(jiān)測不同地區(qū)的流感、霍亂、大腸桿菌和登革熱等傳染性疾病的暴發(fā),并根據(jù)相關活動解釋其原因。除了分析疾病的強度和原因之外,一些研究還使用社交網(wǎng)絡分析和空間集群的識別方法,分析了疾病暴發(fā)的空間特征[16]。比如Broniatowski等開發(fā)了自動將相關推文分類的流感病毒監(jiān)測系統(tǒng),并測試了該系統(tǒng)2012—2013年流感季期間多個地理粒度的性能,發(fā)現(xiàn)與各級衛(wèi)生部門監(jiān)測的流感流行率相比,系統(tǒng)準確度可以達到85%[17]。還有一些研究通過Twitter大數(shù)據(jù)了解人們的活動模式,用以估計疾病暴發(fā)期間人群的接觸率[18],因為與從手機運營商處獲得的呼叫記錄數(shù)據(jù)相比,帶有地理標簽的推文提供的位置數(shù)據(jù)分辨率更高。此外,一些研究正在嘗試將對于Twitter建立的模型擴展到Instagram使用;還有研究應用社交網(wǎng)絡數(shù)據(jù)評估了流感疫苗的接種情緒,發(fā)現(xiàn)消極情緒比積極情緒傳播更有效,而且負面情緒較高與疫苗接種率較低之間存在相關性[19]。值得注意的是,雖然已有研究證明Twitter在公共衛(wèi)生方面具有廣泛的適用性,但使用社交媒體監(jiān)控傳染病的困難也是顯而易見的。目前的應用范圍局限在學術界,各國衛(wèi)生部門都未將其大規(guī)模用于日常監(jiān)管實踐。推文中使用的語言是動態(tài)的,并且可能具有明顯的地理異常,需要對同預期不符的結果進行人工檢查,不斷更新流程的過程分類算法。查找“生?。╯ick)”之類的簡單算法將不起作用,因為“我厭倦了工作”和“我感到不舒服”等推文都不能被解釋為與疾病有關,因而需要建立可以將囊括參考原始搜索詞但未反映個人疾病的推文內容進行有效分類的高級機器學習算法。而且,社交媒體監(jiān)視系統(tǒng)的準確性會隨著媒體的關注而下降,因為媒體的關注會增加與傳染病有關但與實際感染無關的消息,掩蓋了真正的流行跡象。此外,社交網(wǎng)絡分析的潛在侵入性,也決定了需要在公共利益和保護個人隱私之間進行謹慎權衡。
(三)地理/氣象大數(shù)據(jù)
在預測傳染病方面有價值的地理空間數(shù)據(jù)包括降水、溫度、海拔、土壤類型、植被、永久性和短暫性水體、洪水、土壤濕度和濕地、土地利用,以及人口密度和涉及人口統(tǒng)計學變量的普查數(shù)據(jù),這些數(shù)據(jù)主要來自衛(wèi)星影像遙感觀測和直接野外觀測,此外無人機也可能提供新的高分辨率環(huán)境數(shù)據(jù)源。迄今為止,地理大數(shù)據(jù)在研究中已經(jīng)用于預測許多媒介傳染病,包括裂谷熱、埃博拉病毒、登革熱、墨累谷腦炎和寨卡病毒。ArcGIS是ESRI為預測分析而開發(fā)的一種工具,具有疾病暴發(fā)地點查詢和基于歷史數(shù)據(jù)的疾病威脅監(jiān)測等功能,能夠通過多次迭代進行假設檢驗,并生成預測性地圖。Attaway等使用ArcGIS分析溫度、降水、海拔、植被、人口密度以及其他可從公共來源獲得的變量,識別全年適合伊蚊活動的位置及時間,進而識別出可能存在自發(fā)性寨卡病毒感染危險的地理區(qū)域[20]。地理大數(shù)據(jù)還能用來揭示區(qū)域衛(wèi)生問題,比如杜克大學的研究項目就將數(shù)百萬患者的記錄同地理信息系統(tǒng)數(shù)據(jù)相結合,通過構建集成的臨床數(shù)據(jù)倉庫研究了區(qū)域公共衛(wèi)生的社會決定因素。雖然有關地理大數(shù)據(jù)的分析過程可以在較短時間內完成,但分析建立在長期數(shù)據(jù)可用性的基礎之上,衛(wèi)星圖像信息在使用前也需要進行大量預處理。
在氣候大數(shù)據(jù)方面,一些研究已經(jīng)證實,天氣是傳染病發(fā)生的重要影響因素。Anyamba et al.通過建模計算出撒哈拉以南非洲由于厄爾尼諾現(xiàn)象而存在超過特定閾值的降雨和植被異常,這樣的氣候變化直接指向裂谷熱的暴發(fā);對模型性能的回顧分析表明,模型可以成功預測東非70%和蘇丹約50%的裂谷熱暴發(fā)[21]。與氣候和天氣有關的大型數(shù)據(jù)集可用于傳染病傳播規(guī)律的研究,比如海面溫度會影響降水,進而影響地面溫度和植被,從而改變傳播疾病的媒介及傳播條件。通過使用天氣大數(shù)據(jù)、互聯(lián)網(wǎng)大數(shù)據(jù)和深度學習,可以更有效地預測傳染病。以美國國家航空航天局(NASA)為例,其擁有的數(shù)據(jù)集包括35年的海表溫度和植被模式、37年的降水量和16年的地表溫度。此類長期的大型數(shù)據(jù)集可以監(jiān)測到氣候異常,這些異常雖然本身不甚重要,但可能成為傳播媒介的發(fā)展條件,對于研究傳染病傳播規(guī)律非常有價值。此外,鑒于空氣污染物是觸發(fā)呼吸系統(tǒng)疾病的已知誘因,各地通過室外傳感器搜集的監(jiān)測空氣質量數(shù)據(jù),也可以用作呼吸道傳染病預測的重要數(shù)據(jù)源。
(四)基于便攜設備的人類行為大數(shù)據(jù)
移動網(wǎng)絡運營商通常會保留至少3個月的手機通話記錄(CDR),通過接入手機反映的基站位置信息,能夠獲得設備的粗略地理位置;在采取適當措施確保匿名的情況下,來自手機的通話記錄數(shù)據(jù)可以用于位置前溯或者持續(xù)追蹤。COVID-19疫情發(fā)生后,工業(yè)和信息化部隨即部署了CDR大數(shù)據(jù)支撐服務疫情防控的相關工作,3家基礎電信運營企業(yè)基于電子大數(shù)據(jù)分析,向用戶提供本人14天內到訪地查詢的服務,有效提升了對流動人員行程查驗的效率;另外還針對定點醫(yī)院、發(fā)熱門診、人員聚集區(qū)等重點區(qū)域的人流變化進行了重點關注,為疫情態(tài)勢研判和精準防控提供了有力支撐。迄今為止,智能手機上的許多復雜的功能尚未得到充分利用,這些功能用于傳染病監(jiān)視具有巨大潛力。智能手機可以收集、存儲和傳輸GPS坐標,詳細的GPS和WiFi數(shù)據(jù)為捕捉精細的個體運動提供了前所未有的機會;藍牙傳感器可用于跟蹤距離,甚至更精細的信號或更細顆粒度的聯(lián)系網(wǎng)絡。而基于加速計、陀螺儀、環(huán)境溫度和光線等傳感器搜集的數(shù)據(jù),也可為相關研究提供支持。此外,移動電話可用于解決全球醫(yī)療數(shù)據(jù)不均等問題,特別是對于中低收入國家更為重要,因為在這些國家中,與社會和健康相關的常規(guī)數(shù)據(jù)通常不完整或根本不存在。
公共衛(wèi)生系統(tǒng)還應重點關注通過可穿戴設備收集的用戶生理數(shù)據(jù),通常包括個人參數(shù)(血壓、心率、血糖)、心電圖、生命體征、氧氣水平、活動信息、傳染病、運動和飲食等信息。由于人們越來越關注自己的健康,許多硬件如帶有第三方應用程序的智能手機、蘋果手表、安卓手表和谷歌眼鏡已經(jīng)在醫(yī)療保健領域開發(fā)帶有傳感器的設備,并且在記錄個人的日常健康狀況以及患者的行為、體征和癥狀中起著關鍵作用。此外,人們的運動和飲食數(shù)據(jù)也可以對評估公共衛(wèi)生行為作出重要貢獻。據(jù)不完全統(tǒng)計,僅在Apple iTunes商店中,就有40 000多種醫(yī)療保健應用程序可用;到2017年,有超過17億人下載健康相關應用程序[22]。將基于便攜設備的人類行為大數(shù)據(jù)納入公共衛(wèi)生體系勢在必行,但需注意此類大數(shù)據(jù)存在樣本偏差,社會經(jīng)濟地位較低的人、兒童和老年人的代表性可能不足,偏遠農村地區(qū)的地理位置分辨率較低。在疫情防控期間,需要電信運營商與第三方共享手機通信記錄數(shù)據(jù),這就存在個人信息保護方面的風險。
(五)零售大數(shù)據(jù)
在收集零售信息識別傳染病暴發(fā)方面,藥店的處方藥和非處方藥零售可成為監(jiān)測數(shù)據(jù)的重要來源。藥品零售大數(shù)據(jù)在報告時效和地理分辨率方面具有顯著優(yōu)勢。以加拿大為例,對于嚴重的呼吸道疾病監(jiān)測,加拿大公共衛(wèi)生局會在癥狀發(fā)作后約10天獲得疾病數(shù)據(jù),17天后獲得實驗室數(shù)據(jù);但交易完成48小時后就可獲得非處方藥銷售數(shù)據(jù)。研究表明,季節(jié)性抗病毒藥物銷售與確診流感病例的發(fā)病日期和確診病例總數(shù)密切相關,非處方藥銷售量與實驗室呼吸道病毒病例數(shù)和其他呼吸道病毒檢出數(shù)之間也存在顯著關聯(lián)[23]。英國的非處方藥零售數(shù)據(jù)目前已用于監(jiān)測流感活動的時空格局,監(jiān)測商品涵蓋了成人和兒童的感冒藥、流感藥、咳嗽藥、溫度計和抗病毒產品(包括洗手液和濕巾紙)。對英國的研究也顯示,流感病例與溫度計和抗病毒洗手液的銷量之間存在顯著的正相關,但國家一級的非處方藥零售同監(jiān)測病例的相關性不強,而在更細的空間尺度和年齡組別上,藥品零售數(shù)據(jù)有助于擴大現(xiàn)有的監(jiān)測范圍[24]。此外,還有研究發(fā)現(xiàn),非處方止瀉藥和抗惡心藥物的銷售同諾如病毒、大腸桿菌等活性相關[25]。除藥品監(jiān)控之外,有關食品銷售的零售數(shù)據(jù)也已被用于調查食源性疾病在人群中的暴發(fā)。IBM使用時空分析系統(tǒng),在考慮產品保質期、可能的消費日期以及產品包含特定病原體可能性的基礎上,通過比較零售掃描數(shù)據(jù)和食品流行病病例的位置,發(fā)現(xiàn)了12種最有可能致病的嫌疑食品。當然應用時還需注意,購買行為也許會受到公共衛(wèi)生信息發(fā)布或媒體關注度的影響。
基于大數(shù)據(jù)構建公共衛(wèi)生體系的時代已經(jīng)到來。上述五類大數(shù)據(jù)遠未涵蓋可用數(shù)據(jù)的全部,保險理賠數(shù)據(jù)、學校出勤數(shù)據(jù)、工人曠工數(shù)據(jù)等也已被證明具有較好的監(jiān)測效果。大數(shù)據(jù)在傳染病監(jiān)測、增進對疾病的了解、預測未來風險、實行有針對性的干預措施等方面已顯示巨大潛力,隨著可用數(shù)據(jù)規(guī)模和種類的增長及數(shù)據(jù)捕獲成本的持續(xù)降低,大數(shù)據(jù)在未來將成為公共衛(wèi)生體系的必要支柱。
三、將大數(shù)據(jù)納入公共衛(wèi)生體系面臨的挑戰(zhàn)
雖然上述多來源大數(shù)據(jù)在傳染病監(jiān)測方面的初步應用較好地擬合了現(xiàn)實,顯示巨大的潛力和光明的前景,但將其應用于我國公共衛(wèi)生管理實踐,在數(shù)據(jù)挖掘和共享、數(shù)據(jù)集成和處理技術、隱私保護、管理體制和人才儲備等方面仍存在不小挑戰(zhàn)。
(一)數(shù)據(jù)挖掘和共享的困難
一方面,數(shù)據(jù)尚未完全嵌入相關組織的業(yè)務流程和組織管理實踐中。在許多情況下,患者監(jiān)測數(shù)據(jù)并未整合到臨床診斷和治療中,臨床數(shù)據(jù)也未整合到公共衛(wèi)生服務和傳染病監(jiān)測中,因而需要更多的數(shù)據(jù)集成。另一方面,對數(shù)據(jù)的有限訪問是實現(xiàn)大數(shù)據(jù)潛力的主要障礙。公共衛(wèi)生大數(shù)據(jù)分散在不同的數(shù)據(jù)池中,這些數(shù)據(jù)集之間沒有太多聯(lián)系,由于數(shù)據(jù)共享機制不完善,醫(yī)院、科研單位和其他機構之間存在著嚴重的信息壁壘,在機構之間共享結構化數(shù)據(jù)效率低下,而在不同組織之間共享非結構化數(shù)據(jù)則更難以實現(xiàn)。已有的全球疾病監(jiān)測組織和系統(tǒng)集成度較差,并且生成的數(shù)據(jù)報告格式不完整、不一致且不兼容。隨著數(shù)據(jù)全球化的加快,公共衛(wèi)生中的大數(shù)據(jù)也將面臨不同程度的語言、術語和標準化障礙。
(二)數(shù)據(jù)集成和處理技術的挑戰(zhàn)
當前的標準和技術尚不足以滿足公共衛(wèi)生大數(shù)據(jù)集成應用的要求。數(shù)據(jù)缺乏統(tǒng)一的標準、一致的描述格式和表示方法,很難實現(xiàn)不同級別的結構化、半結構化和非結構化數(shù)據(jù)集成;各種數(shù)據(jù)庫使用不同的軟件和數(shù)據(jù)格式,使得數(shù)據(jù)比較、分析、傳輸、共享變得非常困難。涉及數(shù)據(jù)不準確性、數(shù)據(jù)丟失和選擇性測量的問題會影響預測建模的結果和決策,模型校準中的缺陷也可能會干擾推斷。盡管結合了傳統(tǒng)傳染病監(jiān)測方法和大數(shù)據(jù)的新型混合模型顯示較好的前景,但當前技術手段在處理異構和實時數(shù)據(jù)方面依然效率不高,很難同時兼顧分布式系統(tǒng)的可用性、一致性和分區(qū)容錯性,信噪比問題尤其具有挑戰(zhàn)性,預測的可靠性尚無法與氣候學等領域相比,任何新穎的數(shù)據(jù)流在投入使用前都必須根據(jù)已建立的傳染病監(jiān)測數(shù)據(jù)和系統(tǒng)進行驗證。已有研究表明,將流行彈性行為納入有望提升模型的解釋力,因為從風險感知到勤洗手、戴口罩、改變社交距離和減少出行行為等預防措施的采用,都將顯著影響疾病在人群中的傳播速度和傳播途徑。
(三)隱私保護與公共利益間的權衡難題
公共衛(wèi)生大數(shù)據(jù)比其他類型的大數(shù)據(jù)更加敏感,患者數(shù)據(jù)泄漏可能會帶來被孤立、名譽受損、傷害、歧視等嚴重后果。云計算等大數(shù)據(jù)技術、醫(yī)療保健信息的集中化趨勢和一些大型數(shù)據(jù)庫的建立,使得私人醫(yī)療數(shù)據(jù)面臨受到攻擊的巨大風險,并為第三方出于商業(yè)目的在未經(jīng)授權的情況下濫用患者的健康信息提供了便利。對于數(shù)據(jù)隱私保護問題,尚無完美的解決方案。即使大數(shù)據(jù)庫使用匿名的個人加密數(shù)據(jù),仍然存在重新標識用戶身份的風險,并且可能通過數(shù)據(jù)鏈接技術重新確定個人身份;而完全刪除被認為是識別信息的內容,也將限制跨不同來源鏈接數(shù)據(jù)的用途??紤]到衛(wèi)生大數(shù)據(jù)在道德和倫理等方面的潛在問題,有必要就如何界定其在公共衛(wèi)生中的倫理用途和不道德用途進行廣泛討論,特別是患者數(shù)據(jù)隱私風險如何與公共利益之間妥善權衡。
(四)管理體制和人才儲備不適應大數(shù)據(jù)應用的要求
大數(shù)據(jù)的價值取決于其對公共衛(wèi)生從業(yè)者和政策制定者的效用。目前,公共衛(wèi)生基礎設施尚不具備分析和使用這些異構大數(shù)據(jù)的能力,跨學科的方法集成不夠,同時擁有數(shù)據(jù)處理技術和醫(yī)學知識的專業(yè)人才非常缺乏。在國家級公共衛(wèi)生監(jiān)測系統(tǒng)是監(jiān)測系統(tǒng)中心的前提下,需要改革管理體制和機制設計,以便將這些非常規(guī)來源生成的大數(shù)據(jù)轉換為可直接操作的信息。地方公共衛(wèi)生部門存在人力資源和預算限制,妨礙了其訪問和有效利用各種大數(shù)據(jù)資源。為此,應創(chuàng)造適當?shù)闹贫群驼攮h(huán)境,探索實現(xiàn)共享公共衛(wèi)生數(shù)據(jù)的做法。比如,將數(shù)字疾病監(jiān)測組織作為公共衛(wèi)生系統(tǒng)的正式合作伙伴,以系統(tǒng)的方式將可操作的數(shù)據(jù)輸入監(jiān)視系統(tǒng)。
四、以大數(shù)據(jù)筑牢公共衛(wèi)生安全網(wǎng)的政策建議
大數(shù)據(jù)是國家提高公共衛(wèi)生保障能力和應對流行病威脅的關鍵資源。為充分發(fā)揮大數(shù)據(jù)在筑牢公共衛(wèi)生安全網(wǎng)中的重要作用,需從加大投入、搭建網(wǎng)絡、優(yōu)化治理和人才培養(yǎng)四方面入手,使大數(shù)據(jù)更好地服務于公共衛(wèi)生管理與決策。
(一)搭建公共衛(wèi)生大數(shù)據(jù)應用協(xié)同網(wǎng)絡
近10年間,我國在公共衛(wèi)生領域建立了各種醫(yī)療健康數(shù)據(jù)采集平臺,但缺乏對跨系統(tǒng)多源數(shù)據(jù)的整合和綜合利用,多元化參與機制并未形成?!秶鴦赵恨k公廳關于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應用發(fā)展的指導意見》從加強公共衛(wèi)生業(yè)務系統(tǒng)建設、建設網(wǎng)絡直報系統(tǒng)等方面,為推進公共衛(wèi)生領域大數(shù)據(jù)應用指明了方向。下一步應以出臺專項文件為指向,由國家相關部門牽頭,整合社會公共信息資源,就大數(shù)據(jù)在公共衛(wèi)生領域的應用展開多機構跨學科聯(lián)合攻關。應在法律上明確限定數(shù)據(jù)共享范圍、方式和內容的前提下,搭建大規(guī)模協(xié)作網(wǎng)絡,創(chuàng)建和動員開放數(shù)據(jù)、開放學科、開放源代碼社區(qū)和開放協(xié)作平臺,協(xié)調分析和處理公共衛(wèi)生大數(shù)據(jù)的能力,確保在共享知識和數(shù)據(jù)的環(huán)境下形成真正的“研究社區(qū)”;定期發(fā)布公共衛(wèi)生領域大數(shù)據(jù)應用的最佳實踐,推動相關研究從數(shù)量、深度到應用廣度的飛躍。
(二)加大公共衛(wèi)生大數(shù)據(jù)應用專項資金投入
近年來,各國均通過優(yōu)先項目的形式,努力探索公共衛(wèi)生領域應用大數(shù)據(jù)的潛力。歐盟委員會于2016年以建立全面的國家公共衛(wèi)生數(shù)據(jù)倉庫的名義,收集醫(yī)生記錄、住院、藥物處方、實驗室和放射學分析及其他廣泛的數(shù)據(jù)類型;美國國立衛(wèi)生研究院大數(shù)據(jù)知識(BD2K)計劃則使生物醫(yī)學科學家能夠更充分地利用研究界正在生成的大數(shù)據(jù)。我國應設立專項資金和項目,支持多來源的國家和區(qū)域公共衛(wèi)生數(shù)據(jù)倉庫建設,加快公共衛(wèi)生大數(shù)據(jù)的集成和共享。應面向全國各行業(yè)征集公共衛(wèi)生大數(shù)據(jù)創(chuàng)新產品和服務,重點資助利用大數(shù)據(jù)開展重點人群防控、傳染病信息監(jiān)測、傳染病輿情監(jiān)測、社區(qū)疫情排查、多源數(shù)據(jù)傳染病跟蹤分析的智能化公共衛(wèi)生監(jiān)控和解決方案,以及為抗體研發(fā)、醫(yī)療救護、疫情防控、防疫物資調動等提供算力支撐的云計算公共服務平臺等。
(三)健全公共衛(wèi)生大數(shù)據(jù)治理體系
首先,應要求利益相關者協(xié)作并調整其系統(tǒng)的設計和性能,重點就相關技術標準達成一致,包括建立統(tǒng)一的疾病診斷編碼、臨床醫(yī)學術語、檢查檢驗規(guī)范、藥品應用編碼、信息數(shù)據(jù)接口和傳輸協(xié)議等,促進健康醫(yī)療大數(shù)據(jù)產品、服務流程標準化,以實現(xiàn)公共衛(wèi)生信息和創(chuàng)新技術的最大創(chuàng)新潛力。其次,在事關公共安全的特殊前提下,個人信息的公共屬性雖極大凸顯,但仍應明確不需個人同意而進行個人信息收集和利用的“例外規(guī)則”,并以法律形式規(guī)定適用的法定情形。要專門制定應對疫情等特殊情形下采集和使用用戶數(shù)據(jù)的隱私保護標準,將公民隱私權的讓渡嚴格限于防控疫情的目的和范圍,并保證政府、研究機構、救援機構、媒體和個人對數(shù)據(jù)的采集、處理、分析和對分析結果的共享在法律規(guī)定的基礎上進行。最后,從保護個人健康信息機密性、隱私性和安全性出發(fā),明確個人醫(yī)療保健信息方面的法律適用,采取有力的技術和組織措施防止未經(jīng)授權的訪問和使用。在這方面,各國主要采取兩種模式:一種是政府根據(jù)基本隱私法專門制定法律法規(guī),如美國的HIPAA,澳大利亞的《健康記錄和信息隱私法》等;另一種是將個人醫(yī)療保健信息作為個人信息或敏感信息的一部分,通過法律來保護個人信息或敏感信息,如英國的《數(shù)據(jù)保護法》以及加拿大的《個人信息保護和電子文件法》等。而具體到此類信息在公共衛(wèi)生領域的應用,需制定專門的法律法規(guī)平衡患者隱私保護同出于公共衛(wèi)生研究和監(jiān)測目的的數(shù)據(jù)共享。
(四)加強專業(yè)人才培養(yǎng)
由于大多數(shù)參與公共衛(wèi)生決策制定和實施的專業(yè)人員都不熟悉大數(shù)據(jù)科學,因而為其提供相關領域的職業(yè)培訓至關重要。在公共衛(wèi)生管理部門中,應考慮招募頂尖技術專家擔當首席公共衛(wèi)生數(shù)據(jù)科學家,為構建大數(shù)據(jù)基礎上的公共衛(wèi)生體系提供人才和技術支持。要對醫(yī)療保健從業(yè)人員開展數(shù)據(jù)標準化專項培訓,倡導和采用標準代碼和標識符。鼓勵高校開設公共衛(wèi)生與大數(shù)據(jù)技術應用專業(yè),大力培養(yǎng)既熟悉公共衛(wèi)生業(yè)務又擅長大數(shù)據(jù)工程技術的高水平復合型人才;改進衛(wèi)生信息學相關專業(yè)設置,加大對大數(shù)據(jù)科學課程的學習力度。對公共衛(wèi)生相關專業(yè)的學生加強數(shù)據(jù)科學技術的培訓,引入大數(shù)據(jù)分析和管理相關課程;鼓勵引進企業(yè)師資,建設校企共建實訓基地。
參考文獻
[1]習近平.在中央政治局常委會會議研究應對新型冠狀病毒肺炎疫情工作時的講話[EB/OL].(2020-02-04)[2020-03-15].http://www.qstheory.cn/dukan/qs/2020-02/15/c_1125572832.htm.
[2]丁蕾,蔡偉,丁健青,等.新型冠狀病毒感染疫情下的思考[J].中國科學:生命科學,2020(3):247-257.
[3]渠慎寧,楊丹輝.突發(fā)公共衛(wèi)生事件的智能化應對:理論溯源與趨向研判[J].改革,2020(3):14-21.
[4]WALDER C, OSGOOD N, SEITZINGER P. Big data for infectious diseases surveillance and the potential contribution to the investigation foodborne disease in Canada: An overview and discussion paper[R]. Report for the National Collaborating Centre for Infectious Diseases, May 2017.
[5]BARBOZA P, VAILLANT L, MAWUDEKU A, et al. Evaluation of epidemic intelligence system integrated in the early alerting and reporting project for the detection of A/H5N1 influenza events[J]. PLoS One, 2013, 8(3): e57252.
[6]FELDMAN B, MARTIN E, SKOTNES T. Big data in healthcare: Hype and hope[J]. Dr. Bonnie, 2013(1): 122-125.
[7]趙永謙,馬文軍.基于互聯(lián)網(wǎng)信息的公共衛(wèi)生監(jiān)測進展[J].中華流行病學雜志,2017(2):272-276.
[8]GUERRISI C, TURBELIN C, BLANCHON T, et al. Participatory syndromic surveillance of influenza in Europe[J]. Journal of Infectious Diseases, 2016, 214(4): S386-S392.
[9]BAHK C Y, SCALES D A, MEKARU S R, et al. Comparing timeliness, content, and disease severity of formal and informal source outbreak reporting[J]. Bmc Infectious Diseases, 2015, 15(1): 135.
[10]DION M, ABDELMALIK P, MAWUDEKU A. Big data and the global public health intelligence network(GPHIN)[J]. Can Commun Dis Rep, 2015, 41(9): 209-214.
[11]CAMEIRO H A, MYLONAKIS E. Google trends: A web-based tool for real-time surveillance of disease outbreaks[J]. Clinical Infectious Diseases, 2009, 49(10): 1557-1564.
[12]RISHI D, LOPMAN B, SHIMSHONI Y, et al.Use of internet search data to monitor impact of rotavirus vaccination in the United States[J]. Clinical Infectious Diseases, 2012, 54(9): 115-118.
[13]LAZER D, KENNEDY R, KING G, et al. The parable of Google Flu: Traps in big data analysis[J]. Science, 2014, 343(6176): 1203-1205.
[14]HARRISON C, JORDER M, STERN H, et al. Using online reviews by restaurant patrons to identify unreported cases of foodborne illness-New York city, 2012-2013[J]. Morbidity and Mortality Weekly Report, 2014, 63(20): 441-445.
[15]KANG J, KUZNETSOVA P, LUCA M. Where Not to eat? Improving public policy by predicting hygiene inspections using online reviews[R]. Conference: EMNLP 2013, Seattle, USA.
[16]THAPEN N, SIMMIE D, HANKIN C, et al. Defender: Detecting and forecasting epidemics using noveldata: analytics for enhanced response[J]. PLoS ONE, 2015, 11(5):e0155417.
[17]BRONIATOWSKI D, MICHAEL P, DREDZE M. National and local influenza surveillance through twitter: An analysis of the 2012-2013 influenza epidemic[J]. PloS One, 2013, 8(12): e83672.
[18]JURDAK R, ZHAO K, LIU J, et al. Understanding human mobility from Twitter[J]. PLoS ONE, 2015, 10(7): e0131469.
[19]KASS-HOUT T, ALHINNAWI H. Social media in public health[J]. British Medial Bulletin, 2013, 108(1): 5-24.
[20]ATTAWAY, D, WATERS N, GERAGHTY E, et al. Zika virus: Endemic and epidemic ranges of aedes mosquito transmission[J]. Journal of Infection & Public Health, 2017, 10(1): 120-123.
[21]ANYAMBA A, CHRETIEN J, SMALL J, et al. Prediction of a rift valley fever outbreak[J]. Proceedings of the National Academy of Sciences, 2009, 106(3): 955-959.
[22]AITKEN M, GAUNTLETT C. Patient apps for improved healthcare: from novelty to mainstream[J/OL]. IMS Institute for Healthcare Informatics.(2013-10-01)[2020-03-15].https://www.mendeley.com/catalogue/patient-apps-improved-healthcare-novelty-mainstream/.
[23]MUCHAAL P, PARKER S, MEGANATH K, et al. Evaluation of a national pharmacy-based syndromic surveillance system[J]. Relevé Des Maladies Transmissibles Au Canada, 2015, 41(9): 203-206.
[24]TODD S, DIGGLE P, WHITE P, et al. The spatiotemporal association of non-prescription retailsales with cases during the 2009 influenza pandemic in Great Britain[J]. BMJ Open, 2014, 4(4): e004869.
[25]EDGE V, POLLARIF, LAI K, et al. Syndromic surveillance of Norovirus using over-the-counter sales of medications related to gastrointestinal illness[J]. The Canadian Journal of Infectious Diseases & Medical Microbiology, 2006, 17(4): 235-241.
(責任編輯:羅重譜)