程越岳
[摘 要]大數(shù)據(jù)的應(yīng)用對發(fā)展醫(yī)療水平、保障人民健康有重要意義。文章從解讀醫(yī)療大數(shù)據(jù)入手,介紹醫(yī)療大數(shù)據(jù)的特征、來源及現(xiàn)狀,描述醫(yī)療大數(shù)據(jù)的宏觀與微觀應(yīng)用,提出當(dāng)前醫(yī)療大數(shù)據(jù)存在的問題及解決思路,最后總結(jié)醫(yī)療大數(shù)據(jù)遺留的問題。
[關(guān)鍵詞]醫(yī)療大數(shù)據(jù);應(yīng)用;醫(yī)院
[DOI]10.13939/j.cnki.zgsc.2018.17.184
現(xiàn)階段大數(shù)據(jù)應(yīng)用已進(jìn)入各個行業(yè)。當(dāng)前我國社會主要矛盾已經(jīng)轉(zhuǎn)化為人民日益增長的美好生活需要和不平衡不充分的發(fā)展之間的矛盾。發(fā)揮醫(yī)療大數(shù)據(jù)作用,有利于提高醫(yī)療水平,促進(jìn)民生發(fā)展,是人民美好生活需要的重要體現(xiàn)。
1 醫(yī)療大數(shù)據(jù)
1.1 醫(yī)療大數(shù)據(jù)概念
大數(shù)據(jù)是在合適的時間內(nèi)無法處理的大量數(shù)據(jù)的集合,一般特征為巨量性、多樣性、速變性、高價低密性和真實(shí)性。醫(yī)療大數(shù)據(jù)有多大,有的認(rèn)為數(shù)據(jù)體量在TB、PB級別,甚至EB級別。[1]文章認(rèn)為,體量大小沒有絕對范圍,一般要求要包含一個區(qū)域在一段時間內(nèi)所有醫(yī)療機(jī)構(gòu)的數(shù)據(jù),在數(shù)據(jù)體量大的同時,要使其能充分滿足多樣性、速變性、高價低密性和真實(shí)性。醫(yī)療行業(yè)的信息化水平相對較高,有海量長時間跨度的數(shù)據(jù)被保存(門診記錄要求保存15年,住院記錄要求保存30年),含有大量非結(jié)構(gòu)化數(shù)據(jù)和少量結(jié)構(gòu)化數(shù)據(jù)。
1.2 醫(yī)療大數(shù)據(jù)來源
第一,電子病歷。隨著醫(yī)療信息化的發(fā)展,電子病歷在我國絕大多數(shù)大中型醫(yī)院已經(jīng)普及。電子病歷除了包含紙質(zhì)病歷的全部信息,還包含檢驗(yàn)信息、影像信息,預(yù)后信息和結(jié)算信息。它能夠承載患者的全部醫(yī)療信息,并具有結(jié)構(gòu)化。
第二,醫(yī)療費(fèi)用。醫(yī)療費(fèi)用數(shù)據(jù)大部分是結(jié)構(gòu)化數(shù)據(jù),將城鎮(zhèn)居民醫(yī)療保險、新農(nóng)合直接與醫(yī)院HIS中費(fèi)用核算系統(tǒng)、藥品管理系統(tǒng)對接,可以擴(kuò)大醫(yī)療大數(shù)據(jù)范圍。
第三,基層數(shù)據(jù)。社區(qū)、鄉(xiāng)鎮(zhèn)衛(wèi)生院和商業(yè)藥店數(shù)據(jù)是不可忽略的一部分,它能夠更迅速地、靈活地反映人們的健康狀況,監(jiān)測傳染病疫情。
1.3 發(fā)展現(xiàn)狀
對比中外醫(yī)療大數(shù)據(jù),我國起步較晚,發(fā)展水平較低。我國最大的醫(yī)療大數(shù)據(jù)平臺是上海醫(yī)聯(lián)工程,只覆蓋了上海市級醫(yī)院,且該平臺數(shù)據(jù)僅作為各部門之間的數(shù)據(jù)交流記錄平臺,還未作研究使用,不能發(fā)揮醫(yī)療大數(shù)據(jù)價值。[2]中南大學(xué)醫(yī)學(xué)院與其六個附屬醫(yī)院構(gòu)建湘雅醫(yī)療大數(shù)據(jù)平臺,數(shù)據(jù)范圍限制在醫(yī)院輻射范圍內(nèi),研究疾病種類有限。
武志慧提出通過醫(yī)療大數(shù)據(jù)擴(kuò)大罕見病知識庫,尋找罕見病治療方法;[3]薛付忠關(guān)注醫(yī)療大數(shù)據(jù)中時間序列的重要性;[4]郭崇慧利用醫(yī)療大數(shù)據(jù)做出元決策,對決策進(jìn)行決策;[5]王靈芝闡述了醫(yī)療大數(shù)據(jù)廣泛應(yīng)用時產(chǎn)生隱私泄露以及帶來倫理上的一系列影響。[6]目前醫(yī)療大數(shù)據(jù)應(yīng)用的宏觀層面研究較少,尚未能夠發(fā)揮宏觀層面的價值。
2 醫(yī)療大數(shù)據(jù)應(yīng)用
大數(shù)據(jù)應(yīng)用需要關(guān)注全體數(shù)據(jù)而不是抽樣數(shù)據(jù),要提高效率而不是絕對精準(zhǔn),要找到相關(guān)關(guān)系而不是因果關(guān)系。[7]從這方面來說,利用大數(shù)據(jù)在短時間內(nèi)把握醫(yī)學(xué)動態(tài)方向,探究相關(guān)關(guān)系來解釋不明現(xiàn)象和發(fā)現(xiàn)未知問題。
2.1 宏觀應(yīng)用
第一,疫情防控。2009年谷歌提前幾周預(yù)測H1Z1疫情讓世界對大數(shù)據(jù)矚目,[8]即使2013年再次預(yù)測高于實(shí)際值,但也正確預(yù)測疫情暴發(fā)趨勢。
第二,藥物測試。通過醫(yī)療大數(shù)據(jù)能夠找到未知的相關(guān)關(guān)系。藥物研發(fā)后的療效測試、不良反應(yīng)測試都是在有限樣本中測試,然而通過醫(yī)療數(shù)據(jù)庫中患者的用藥信息,可以持續(xù)反映藥物的總體療效和不良反應(yīng),還可以更精準(zhǔn)地反映不同藥物之間的拮抗協(xié)同作用,甚至發(fā)現(xiàn)藥物的潛在作用。
第三,發(fā)現(xiàn)疾病分布。通過對全體數(shù)據(jù)的分析,不難發(fā)現(xiàn)空間、時間、人群高發(fā)疾病和家族遺傳疾病,找出致病因子,提出公共健康建議,提高全民健康水平。
2.2 微觀應(yīng)用
第一,提供臨床路徑偏好選擇。不同人群面對不同疾病的態(tài)度各有不同,在療效、療程、副作用和經(jīng)濟(jì)成本等各方面偏好取舍因人而異,在處理某一疾病時,醫(yī)療大數(shù)據(jù)能夠通過對全體該患者分析出療效、療程、風(fēng)險、成本,為患者提供多種不同偏好的治療方案。
第二,提供臨床輔助決策。數(shù)據(jù)表明,全球綜合誤診率30%,我國誤診率27.8%醫(yī)療大數(shù)據(jù)能夠匯聚各類病理數(shù)據(jù),總結(jié)大量有效經(jīng)驗(yàn)作為參考,從而輔助醫(yī)生診斷和臨床決策,從而最大限度減少漏診和誤診。
3 問題及解決方法
3.1 信息孤島
信息孤島是指信息不能再部門間相互交流、共享。醫(yī)療數(shù)據(jù)被嚴(yán)格記錄下來,然而事實(shí)上真正被人們整體利用起來指導(dǎo)行為的數(shù)據(jù)卻很少,目前大部分醫(yī)療數(shù)據(jù)都是在醫(yī)院內(nèi)部或科室內(nèi)部交流產(chǎn)生價值,在醫(yī)療機(jī)構(gòu)和區(qū)域間交流的數(shù)據(jù)較少,對醫(yī)療大數(shù)據(jù)充分利用程度不高。信息孤島產(chǎn)生原因有:數(shù)據(jù)系統(tǒng)標(biāo)準(zhǔn)化不夠、重視患者醫(yī)療信息隱私、數(shù)據(jù)的流出會導(dǎo)致經(jīng)濟(jì)利益流出。
提高數(shù)據(jù)標(biāo)準(zhǔn)化:一方面要做好物質(zhì)基礎(chǔ),各醫(yī)療單位數(shù)據(jù)系統(tǒng)能夠兼容,規(guī)范統(tǒng)一記錄,對醫(yī)院和設(shè)備供應(yīng)商提出統(tǒng)一格式的要求;另一方面做好教育基礎(chǔ),醫(yī)療從業(yè)人員要進(jìn)行相關(guān)數(shù)據(jù)處理技能培訓(xùn),醫(yī)學(xué)高校做好處理醫(yī)療數(shù)據(jù)技術(shù)人才培養(yǎng)。存儲電子病歷,在各醫(yī)院之間交流,推進(jìn)EHR發(fā)展,是避免信息孤島的前提條件。
醫(yī)療數(shù)據(jù)含有大量患者隱私,流出落入不法分子手中,威脅患者生命財(cái)產(chǎn)安全。醫(yī)療數(shù)據(jù)是寶貴的資源,醫(yī)療數(shù)據(jù)流出會導(dǎo)致醫(yī)院資源和利益流出,因此需要對醫(yī)療大數(shù)據(jù)庫進(jìn)行嚴(yán)格管理,加強(qiáng)監(jiān)管。
3.2 結(jié)構(gòu)化轉(zhuǎn)化困難
醫(yī)療大數(shù)據(jù)結(jié)構(gòu)化處理精準(zhǔn)度和標(biāo)準(zhǔn)化的高低,關(guān)系到能否有效對數(shù)據(jù)進(jìn)行存儲和計(jì)算。結(jié)構(gòu)化數(shù)據(jù)典型特征是可以用二維表的結(jié)構(gòu)來表達(dá),有嚴(yán)格的格式和長度要求。
半結(jié)構(gòu)化醫(yī)療數(shù)據(jù)主要就是電子病歷中的患者信息、診斷記錄和治療記錄,一般都是用文字和數(shù)字記錄。該記錄要求相對規(guī)范,進(jìn)一步根據(jù)其信息特征可以轉(zhuǎn)化有絕對格式要求的結(jié)構(gòu)化信息?;颊呋拘畔⑷缟矸葑C號、性別、年齡和生命體征,可以用二維表和規(guī)范的數(shù)字格式進(jìn)行記錄。
診斷記錄包含大量文字描述,可查詢國際疾病分類(ICD)編碼進(jìn)行記錄,國際疾病分類第10版(ICD-10)已對絕大多數(shù)疾病進(jìn)行登記。對于治療記錄,依據(jù)藥品編碼,在時間序列基礎(chǔ)上,將藥品、攝入方式等進(jìn)行記錄,條件允許的情況下與檢驗(yàn)記錄結(jié)合,形成預(yù)后信息反饋數(shù)據(jù)并記錄;此外,外科手術(shù)記錄參照國際疾病分類-手術(shù)與操作編碼。
醫(yī)學(xué)檢驗(yàn)數(shù)據(jù)和醫(yī)療費(fèi)用數(shù)據(jù)中也含有大量數(shù)字和結(jié)構(gòu)化數(shù)據(jù),隨著記錄格式規(guī)范統(tǒng)一,可以輕易實(shí)現(xiàn)結(jié)構(gòu)化。
醫(yī)學(xué)影像存儲與交流系統(tǒng)(PACS)是非結(jié)構(gòu)化醫(yī)療數(shù)據(jù),包括核磁共振、CT圖像、超聲成像和X射線等影像數(shù)據(jù)。挖掘醫(yī)學(xué)影像數(shù)據(jù)主要方法是粗糙集理論、人工神經(jīng)網(wǎng)絡(luò)等。挖掘影像數(shù)據(jù)技術(shù)應(yīng)用在輔助診斷和臨床輔助決策階段,影像數(shù)據(jù)實(shí)現(xiàn)信息化,仍要進(jìn)一步數(shù)字化,才能高效記錄和有效處理。
4 遺留問題
目前而言,大數(shù)據(jù)與醫(yī)療行業(yè)耦合程度不高,主要原因有:行業(yè)內(nèi)缺乏數(shù)據(jù)處理人才,對大數(shù)據(jù)的認(rèn)識不夠;普遍關(guān)注數(shù)據(jù)的精準(zhǔn)度,忽略數(shù)據(jù)相關(guān)度;挖掘醫(yī)療數(shù)據(jù)能力有限,信息化高,數(shù)字化、結(jié)構(gòu)化水平有待提升。
患者自述也是電子病歷中重要部分,是非結(jié)構(gòu)化數(shù)據(jù),不同患者對病理特征難以客觀表述,為數(shù)據(jù)記錄帶來阻礙。
參考文獻(xiàn):
[1]袁琛.淺談大數(shù)據(jù)技術(shù)在醫(yī)療信息化中的應(yīng)用[J].醫(yī)學(xué)工程,2016(2):12-13.
[2]馬燦.國內(nèi)外醫(yī)療大數(shù)據(jù)資源共享比較研究[J].情報資料工作,2016(3):63-67.
[3]武志慧.健康醫(yī)療大數(shù)據(jù)與罕見病的精準(zhǔn)用藥[J].科技導(dǎo)報,2017,35(16):20-25.
[4]薛付忠.健康醫(yī)療大數(shù)據(jù)驅(qū)動的健康管理學(xué)理論方法體系[J].山東大學(xué)學(xué)報:醫(yī)學(xué)版,2017,55(6):1-29.
[5]郭崇慧.元決策下的臨床路徑管理模式研究[J].醫(yī)學(xué)與哲學(xué),2017,38(7):6-9.
[6]王靈芝.醫(yī)療大數(shù)據(jù)的特征及應(yīng)用中的倫理思考[J].醫(yī)學(xué)與哲學(xué),2017,38(4):32-35.
[7]恩舍伯格·W.M.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2013:17-18.
[8]黃文莉.探討大數(shù)據(jù)技術(shù)在疾病防控上的應(yīng)用[J].電子技術(shù)與軟件工程,2016(6):188-189.