翟 曦 周蓮茹 焦雄飛
隨著信息技術(shù)的發(fā)展和普及,結(jié)合醫(yī)院數(shù)據(jù)特點(diǎn),醫(yī)院信息化建設(shè)逐漸成為提高醫(yī)院核心競(jìng)爭(zhēng)力的關(guān)鍵戰(zhàn)略措施。借助云計(jì)算技術(shù)與大數(shù)據(jù)來(lái)提高醫(yī)院信息數(shù)據(jù)處理效率,發(fā)揮出數(shù)據(jù)信息資源優(yōu)勢(shì),完善醫(yī)院經(jīng)營(yíng)管理結(jié)構(gòu)體系,進(jìn)而促進(jìn)醫(yī)院信息化建設(shè),實(shí)現(xiàn)醫(yī)院經(jīng)營(yíng)管理水平的提升[1]。對(duì)此,醫(yī)院高層管理者需重視大數(shù)據(jù)價(jià)值,結(jié)合醫(yī)院海量數(shù)據(jù)特點(diǎn),應(yīng)用大數(shù)據(jù)技術(shù),塑造“智慧醫(yī)院”,提高醫(yī)院核心競(jìng)爭(zhēng)力,為醫(yī)院謀求更為廣闊的發(fā)展空間。以往醫(yī)院信息系統(tǒng)只是技術(shù)支撐和運(yùn)維工具,而未來(lái)醫(yī)院信息系統(tǒng)將成為醫(yī)院的核心競(jìng)爭(zhēng)力,醫(yī)院最終會(huì)成為基于數(shù)據(jù)的醫(yī)療服務(wù)企業(yè)[2]。在這樣的環(huán)境背景下,探究醫(yī)院信息化的大數(shù)據(jù)應(yīng)用價(jià)值具有非常重要的現(xiàn)實(shí)意義。
近年來(lái),國(guó)際上許多國(guó)家已紛紛認(rèn)識(shí)到大數(shù)據(jù)在醫(yī)院信息化建設(shè)中的重要性,并加速其建設(shè)。美國(guó)是醫(yī)療信息化的起源地,早在2007年美國(guó)國(guó)會(huì)通過(guò)了《美國(guó)食品與藥品管理修改法案》(Food and Drug Administration Amendments Act,F(xiàn)DAAA),授權(quán)食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA)利用醫(yī)療信息電子數(shù)據(jù)庫(kù)建立藥品主動(dòng)監(jiān)測(cè)系統(tǒng),該套主動(dòng)監(jiān)測(cè)系統(tǒng)應(yīng)用大數(shù)據(jù)實(shí)現(xiàn)了分散數(shù)據(jù)資源的整合,主動(dòng)發(fā)起藥品安全研究,目前在藥品監(jiān)測(cè)上取得了極大的成功[3]。在實(shí)現(xiàn)部分區(qū)域衛(wèi)生信息共享的基礎(chǔ)下,歐盟開(kāi)始了探索國(guó)家層面上共享衛(wèi)生信息大數(shù)據(jù)模式的規(guī)劃,2000年以后,歐盟開(kāi)始進(jìn)行戰(zhàn)略衛(wèi)生信息化網(wǎng)絡(luò)工程,為了共享各醫(yī)院信息,英國(guó)、法國(guó)、意大利及德國(guó)等國(guó)許多公司都參與該項(xiàng)工程,在分布式數(shù)據(jù)庫(kù)系統(tǒng)和開(kāi)放網(wǎng)工程方面已做大量工作。英國(guó)國(guó)家衛(wèi)生服務(wù)戰(zhàn)略的目標(biāo)是建立每個(gè)人的終生電子健康記錄,國(guó)家的臨床醫(yī)生均可從網(wǎng)上得到患者記錄和最佳臨床治療方面的支持;建立一個(gè)國(guó)家衛(wèi)生電子圖書(shū)館,使醫(yī)生、護(hù)士和其他臨床技術(shù)人員及時(shí)得到最新臨床研究成果和實(shí)踐應(yīng)用技術(shù)[4-5]。
目前,我國(guó)醫(yī)院信息建設(shè)的現(xiàn)狀中許多醫(yī)院都已經(jīng)建設(shè)成了自己的數(shù)據(jù)信息管理系統(tǒng),在大數(shù)據(jù)以及大數(shù)據(jù)處理技術(shù)上的應(yīng)用也得到較大的發(fā)展,尤其表現(xiàn)在對(duì)醫(yī)院的經(jīng)營(yíng)管理、物資采購(gòu)管理等方面取得了較大的進(jìn)步。但是,在對(duì)信息進(jìn)行管理的過(guò)程中,面臨著數(shù)據(jù)數(shù)量急劇增長(zhǎng)、數(shù)據(jù)就緒時(shí)間在不斷增加、數(shù)據(jù)結(jié)構(gòu)不再單一性和數(shù)據(jù)儲(chǔ)存的方式更加分散的4個(gè)方面問(wèn)題,并且在區(qū)域醫(yī)療信息共享上仍然沒(méi)有長(zhǎng)足進(jìn)展,各個(gè)醫(yī)院還在數(shù)據(jù)孤島上繼續(xù)摸索前行[6-7]。
2016年,國(guó)務(wù)院發(fā)布的《“健康中國(guó)2030”規(guī)劃綱要》中明確指出,要大力推進(jìn)健康醫(yī)療大數(shù)據(jù)的開(kāi)放共享、深度挖掘和廣泛應(yīng)用。醫(yī)院信息化建設(shè)應(yīng)參照如健康等級(jí)7(health level seven,HL7)等國(guó)際醫(yī)療界公認(rèn)的醫(yī)療衛(wèi)生數(shù)據(jù)編碼標(biāo)準(zhǔn)、數(shù)據(jù)交換標(biāo)準(zhǔn)和其他信息技術(shù)標(biāo)準(zhǔn)規(guī)范,逐步探索建立統(tǒng)一的醫(yī)院信息化建設(shè)標(biāo)準(zhǔn)和規(guī)范體系,實(shí)現(xiàn)醫(yī)療機(jī)構(gòu)內(nèi)部以及跨機(jī)構(gòu)、跨區(qū)域、跨領(lǐng)域的醫(yī)療信息資源共享與利用[8-9]。
醫(yī)院數(shù)據(jù)具有來(lái)源復(fù)雜的特點(diǎn),其數(shù)據(jù)來(lái)源主要有以下方面。
(1)社會(huì)化媒體和互聯(lián)網(wǎng)中產(chǎn)生的數(shù)據(jù)信息,這些數(shù)據(jù)信息由于互聯(lián)網(wǎng)自身特點(diǎn),使得數(shù)據(jù)雜而量大,形成龐大的網(wǎng)絡(luò)數(shù)據(jù)庫(kù),其中蘊(yùn)藏大量的信息價(jià)值,等待挖掘。
(2)傳感器網(wǎng)絡(luò)、智能終端以及實(shí)時(shí)監(jiān)控系統(tǒng)所形成的信息,這些信息主要應(yīng)用在醫(yī)院內(nèi)部經(jīng)營(yíng)管理中,為各個(gè)管理決策提供信息依據(jù),進(jìn)而提高管理效率。
(3)以醫(yī)院信息系統(tǒng)(hospital information system,HIS)或電子病歷系統(tǒng)為核心的各個(gè)醫(yī)療系統(tǒng)所組成、所采集的患者臨床信息數(shù)據(jù),即由這些患者臨床信息數(shù)據(jù)所產(chǎn)生的對(duì)于臨床診斷,醫(yī)療行為的支持,是醫(yī)院核心數(shù)據(jù)處理平臺(tái),其應(yīng)用價(jià)值匯集成醫(yī)院核心競(jìng)爭(zhēng)優(yōu)勢(shì),促進(jìn)醫(yī)院的可持續(xù)健康發(fā)展[10]。
縱觀(guān)醫(yī)院醫(yī)療管理活動(dòng)中形成的全部數(shù)據(jù),其數(shù)據(jù)結(jié)構(gòu)多樣復(fù)雜,在進(jìn)行數(shù)據(jù)結(jié)構(gòu)分析中應(yīng)以多維角度進(jìn)行解析:①醫(yī)院數(shù)據(jù)結(jié)構(gòu)可分為結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化,其中非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)占總數(shù)據(jù)的75%~85%;②將醫(yī)院數(shù)據(jù)結(jié)構(gòu)分為內(nèi)部數(shù)據(jù)和外部數(shù)據(jù),兼?zhèn)溽t(yī)院的公共數(shù)據(jù)和私密數(shù)據(jù)的雙重屬性,外部數(shù)據(jù)具備公共特征,而內(nèi)部數(shù)據(jù)直接關(guān)系到醫(yī)院商業(yè)機(jī)密與行業(yè)標(biāo)準(zhǔn),具備私密性特點(diǎn)[11];③醫(yī)院數(shù)據(jù)結(jié)構(gòu)呈現(xiàn)多維性,除傳統(tǒng)紙質(zhì)文件及信函等內(nèi)容外,還擁有大量電子信息、音頻信息以及網(wǎng)絡(luò)信息等內(nèi)容,其數(shù)據(jù)格式互不兼容而具備隨機(jī)性,進(jìn)而給數(shù)據(jù)應(yīng)用帶來(lái)困難。
醫(yī)療數(shù)據(jù)不僅是來(lái)源復(fù)雜,其數(shù)據(jù)之間的關(guān)系也十分復(fù)雜,例如,一個(gè)原發(fā)性肝癌患者的醫(yī)療信息,可能會(huì)涉及到其所就診的多家醫(yī)院,會(huì)涉及到患者的疾病史、就診史和服藥史以及其他同類(lèi)病患的相關(guān)信息等。醫(yī)療數(shù)據(jù)之間的關(guān)系既有橫向的對(duì)比,又包含縱向的延續(xù)醫(yī)院在提供醫(yī)療服務(wù)的時(shí)候,需要提取相關(guān)患者的全部數(shù)據(jù),又要按照就診記錄、疾病史等因素進(jìn)行分類(lèi),方能幫助醫(yī)生實(shí)現(xiàn)對(duì)患者的全方位救助[12]。
醫(yī)院大數(shù)據(jù)外部構(gòu)架針對(duì)醫(yī)院外部數(shù)據(jù),將醫(yī)院公共數(shù)據(jù)和私密數(shù)據(jù)有效隔離開(kāi),將醫(yī)院數(shù)據(jù)處理能力與基礎(chǔ)設(shè)施資源從內(nèi)部應(yīng)用延伸至外部應(yīng)用,構(gòu)建基礎(chǔ)設(shè)施資源軟件應(yīng)用結(jié)構(gòu),借助虛擬化技術(shù)將醫(yī)院現(xiàn)有設(shè)備資源有效整合在一起,結(jié)合醫(yī)療服務(wù)需求開(kāi)展動(dòng)態(tài)化管理,進(jìn)而實(shí)現(xiàn)醫(yī)院各項(xiàng)設(shè)備資源的合理分配[13]。在醫(yī)院大數(shù)據(jù)外部構(gòu)架中,醫(yī)院可以結(jié)合自身醫(yī)療服務(wù)需求和內(nèi)部管理需求結(jié)合信息化產(chǎn)品外部資源的運(yùn)用,做好開(kāi)發(fā)測(cè)試工作,并以此調(diào)整系統(tǒng)運(yùn)行模式,包括醫(yī)學(xué)邏輯模型和其管理系統(tǒng),使得醫(yī)院醫(yī)務(wù)人員和患者可以根據(jù)規(guī)則制定自定義資源需求,促進(jìn)醫(yī)院信息化建設(shè)。
在醫(yī)院大數(shù)據(jù)內(nèi)部構(gòu)架中,以服務(wù)為核心,構(gòu)建3層服務(wù)模式。
(1)SaaS軟件服務(wù)層。將服務(wù)軟件統(tǒng)一部署在云端,用戶(hù)利用互聯(lián)網(wǎng)獲取相應(yīng)服務(wù)程序,便于系統(tǒng)后期維護(hù)和管理,同時(shí)用戶(hù)可以結(jié)合自身信息需求,以服務(wù)類(lèi)型、時(shí)間及價(jià)格等節(jié)點(diǎn)進(jìn)行劃分,提高醫(yī)院信息化服務(wù)水平,節(jié)省醫(yī)院經(jīng)營(yíng)成本,進(jìn)而提高醫(yī)院信息化建設(shè)的可靠性和經(jīng)濟(jì)性[14]。
(2)Paas平臺(tái)服務(wù)層。將開(kāi)發(fā)環(huán)境和服務(wù)器平臺(tái)視為一種服務(wù),為用戶(hù)提供軟件應(yīng)用環(huán)境,借助互聯(lián)網(wǎng)連接醫(yī)院云端,提高軟件開(kāi)發(fā)質(zhì)量,并對(duì)軟件運(yùn)行狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)控,構(gòu)建醫(yī)院管理系統(tǒng),提高內(nèi)部管理水平。
(3)IaaS基礎(chǔ)服務(wù)層。以硬件資源為核心,借助互聯(lián)網(wǎng)進(jìn)行服務(wù)器部署,提高各個(gè)系統(tǒng)的計(jì)算能力與數(shù)據(jù)儲(chǔ)存能力,挖掘醫(yī)院數(shù)據(jù)的核心價(jià)值,為醫(yī)院醫(yī)療技術(shù)的提高提供真實(shí)有效的信息依據(jù),同時(shí)有利于醫(yī)院日?;A(chǔ)設(shè)施的護(hù)理工作,降低醫(yī)院信息化投入成本,進(jìn)而加快醫(yī)院信息化建設(shè)進(jìn)程[15]。
(1)建立統(tǒng)一數(shù)據(jù)的大數(shù)據(jù)平臺(tái)。由于醫(yī)院信息數(shù)據(jù)的復(fù)雜性與結(jié)構(gòu)多樣性,各個(gè)醫(yī)療系統(tǒng)產(chǎn)生了大量的接口,導(dǎo)致了醫(yī)院在實(shí)際的醫(yī)療行為中會(huì)出現(xiàn)同一數(shù)據(jù)由于接口原因?qū)е卵舆t或調(diào)用失敗等問(wèn)題。建立統(tǒng)一數(shù)據(jù)的大數(shù)據(jù)平臺(tái),數(shù)據(jù)接入層采用分布式日志系統(tǒng),實(shí)現(xiàn)推拉模式的各種主流方式,并可按需升級(jí)為統(tǒng)一數(shù)據(jù)接入平臺(tái),不僅支持日志及頁(yè)面源碼數(shù)據(jù),還可以實(shí)現(xiàn)各類(lèi)接口數(shù)據(jù)的無(wú)縫可視化接入,如關(guān)系型和非關(guān)系型數(shù)據(jù)、各種主流非結(jié)構(gòu)化數(shù)據(jù)等[16]。
(2)海量數(shù)據(jù)管理技術(shù)。在實(shí)際應(yīng)用中,海量數(shù)據(jù)管理技術(shù)主要應(yīng)用于醫(yī)院大規(guī)模數(shù)據(jù)處理中,其安全性需求不高,服務(wù)于醫(yī)院外部數(shù)據(jù)管理[17]。由于醫(yī)院在實(shí)際經(jīng)營(yíng)管理中會(huì)產(chǎn)生大量的數(shù)據(jù)信息,大量數(shù)據(jù)的管理是醫(yī)院管理工作中的重要內(nèi)容,可以生成管理反饋,為醫(yī)院管理工作各項(xiàng)決策提供信息依據(jù)?;诖?,凸顯出以集中化數(shù)據(jù)管理模式為核心海量數(shù)據(jù)管理價(jià)值,其高效性和高容錯(cuò)性可以強(qiáng)化系統(tǒng)運(yùn)行性能,包含數(shù)據(jù)緩存、索引以及數(shù)據(jù)分區(qū),使得數(shù)據(jù)處理工作中服務(wù)器集群中實(shí)現(xiàn)任務(wù)分工,提高了數(shù)據(jù)管理效率,保證最佳管理效果。
(3)虛擬化技術(shù)。在進(jìn)行醫(yī)院信息化建設(shè)中,虛擬化技術(shù)是大數(shù)據(jù)應(yīng)用系統(tǒng)的核心技術(shù),可以將各系統(tǒng)中的儲(chǔ)存數(shù)據(jù)資源進(jìn)行整合和利用,將系統(tǒng)軟件應(yīng)用與低層硬件有效的隔離,既要將各系統(tǒng)收集到的數(shù)據(jù)資源轉(zhuǎn)化為多個(gè)虛擬資源,即為分裂模式,又要將各系統(tǒng)中收集到的數(shù)據(jù)資源整合為一個(gè)虛擬資源,即為聚合模式[18]。在醫(yī)院大數(shù)據(jù)應(yīng)用系統(tǒng)運(yùn)行中,虛擬化技術(shù)要將儲(chǔ)存、技術(shù)以及網(wǎng)絡(luò)進(jìn)行虛擬化處理,將系統(tǒng)中的數(shù)據(jù)資源進(jìn)行邏輯抽象與統(tǒng)一標(biāo)示,協(xié)助系統(tǒng)服務(wù)運(yùn)作,進(jìn)而提高醫(yī)院大數(shù)據(jù)應(yīng)用系統(tǒng)的運(yùn)行效率和運(yùn)行質(zhì)量,實(shí)現(xiàn)醫(yī)院信息化建設(shè)。對(duì)此,借助虛擬化技術(shù)可以有效降低大數(shù)據(jù)應(yīng)用系統(tǒng)整體能耗,將各個(gè)虛擬計(jì)算節(jié)點(diǎn)整合成一個(gè)物理節(jié)點(diǎn),實(shí)現(xiàn)數(shù)據(jù)資源利用的最大化,促進(jìn)物理節(jié)點(diǎn)的動(dòng)態(tài)漂移和負(fù)載平衡,形成可靠的計(jì)算機(jī)運(yùn)行環(huán)境,提高醫(yī)院數(shù)據(jù)處理的綜合質(zhì)量水平。
海量的數(shù)據(jù)量增長(zhǎng),多廠(chǎng)商信息系統(tǒng)數(shù)據(jù)的不一致性,成為目前醫(yī)療大數(shù)據(jù)的主要問(wèn)題。為了解決目前醫(yī)療大數(shù)據(jù)存在的問(wèn)題,業(yè)界逐漸形成了建設(shè)醫(yī)療大數(shù)據(jù)平臺(tái)的共識(shí),通過(guò)醫(yī)療大數(shù)據(jù)平臺(tái),將各類(lèi)醫(yī)療數(shù)據(jù)整合起來(lái)。
建立醫(yī)療大數(shù)據(jù)平臺(tái)的最終目標(biāo)是無(wú)論住院還是門(mén)診,所有相關(guān)診療信息都能存入數(shù)據(jù)庫(kù)伴隨患者終身。而建設(shè)臨床數(shù)據(jù)庫(kù)(clinical data repository,CDR)的關(guān)鍵是集成單個(gè)患者所有的臨床數(shù)據(jù),通過(guò)建立患者主索引,可將患者在門(mén)診、住院和體檢的歷史診療數(shù)據(jù)關(guān)聯(lián)起來(lái),自動(dòng)完成三級(jí)索引關(guān)系:主索引-就診索引-單據(jù)索引。
通過(guò)患者唯一索引標(biāo)識(shí)號(hào),將患者在醫(yī)院歷次門(mén)診、住院和體檢的詳細(xì)信息完整展現(xiàn)出來(lái),內(nèi)容涵蓋臨床上的所有治療信息,包括病案首頁(yè)、醫(yī)囑(處方)、病歷記錄、輔助檢查報(bào)告及體檢報(bào)告等,使醫(yī)護(hù)人員快速高效掌握患者既往診療情況,可以為治療提供參考幫助。CDR后期的數(shù)據(jù)分析挖掘,也是基于個(gè)體連續(xù)完整的診療信息集之上,因此患者主索引顯得尤為重要[19]。
CDR是指一種臨床信息整合與分析系統(tǒng),能夠?qū)崟r(shí)的整合不同臨床信息的數(shù)據(jù)源,為單一患者提供完整的臨床信息視圖。CDR的建設(shè)和應(yīng)用被認(rèn)為是電子病歷建設(shè)的一個(gè)新階段,是目前我國(guó)醫(yī)院信息化發(fā)展趨勢(shì),也為實(shí)現(xiàn)各級(jí)衛(wèi)生部門(mén)區(qū)域信息共享及分級(jí)診療的互聯(lián)互通奠定了基礎(chǔ)。
建立CDR的目的是為了將不同廠(chǎng)商或者系統(tǒng)內(nèi)復(fù)雜數(shù)據(jù)源的數(shù)據(jù)、異構(gòu)的數(shù)據(jù)和非標(biāo)準(zhǔn)的數(shù)據(jù)通過(guò)數(shù)據(jù)中心進(jìn)行關(guān)聯(lián)和整合,并涉及到對(duì)數(shù)據(jù)的清洗、關(guān)聯(lián)、標(biāo)準(zhǔn)化、整合及校驗(yàn)等過(guò)程。通過(guò)CDR的建設(shè),將區(qū)域化的所有醫(yī)療機(jī)構(gòu)與醫(yī)療相關(guān)的數(shù)據(jù)全部整合在一起。在以后的醫(yī)療主管部門(mén)的查詢(xún)分析和統(tǒng)計(jì),以及進(jìn)一步臨床或者運(yùn)營(yíng)方面的科研分析,均可基于該數(shù)據(jù)中心的數(shù)據(jù)進(jìn)行查詢(xún)(如圖1所示)。
圖1 臨床數(shù)據(jù)中心拓?fù)鋱D
利用互聯(lián)網(wǎng)+大數(shù)據(jù)技術(shù),基于臨床數(shù)據(jù)中心,建立醫(yī)療大數(shù)據(jù)平臺(tái)。醫(yī)療大數(shù)據(jù)平臺(tái)應(yīng)用Hadoop技術(shù),對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)和挖掘。在目前主流的醫(yī)療人工智能方面,使用人工智能學(xué)習(xí)模型進(jìn)行訓(xùn)練,機(jī)器學(xué)習(xí)的成果可通過(guò)醫(yī)療大數(shù)據(jù)平臺(tái)進(jìn)行驗(yàn)證和預(yù)測(cè)。
醫(yī)療大數(shù)據(jù)平臺(tái)的醫(yī)療相關(guān)數(shù)據(jù)來(lái)源于CDR,對(duì)于其他領(lǐng)域的數(shù)據(jù),可以通過(guò)CDR平臺(tái)對(duì)接其他的數(shù)據(jù)中心,使醫(yī)療大數(shù)據(jù)平臺(tái)擁有最廣泛的數(shù)據(jù)以供數(shù)據(jù)挖掘和分析[20](如圖2所示)。
圖2 醫(yī)療大數(shù)據(jù)平臺(tái)應(yīng)用場(chǎng)景示圖
目前,對(duì)比發(fā)達(dá)國(guó)家現(xiàn)階段醫(yī)療信息化的進(jìn)展,我國(guó)醫(yī)療領(lǐng)域的大數(shù)據(jù)應(yīng)用還屬于起步階段,面臨的共享壁壘、標(biāo)準(zhǔn)統(tǒng)一等問(wèn)題,制約著大數(shù)據(jù)在醫(yī)療信息化的發(fā)展。在闡述大數(shù)據(jù)在醫(yī)院信息化發(fā)展中存在的主要問(wèn)題的同時(shí),提出部分技術(shù)實(shí)現(xiàn)解決方法。在分析醫(yī)院大數(shù)據(jù)應(yīng)用體系結(jié)構(gòu)后,提出通過(guò)分布式儲(chǔ)存技術(shù)、海量數(shù)據(jù)管理技術(shù)以及虛擬化技術(shù)的綜合應(yīng)用,構(gòu)建醫(yī)院大數(shù)據(jù)應(yīng)用體系。相信在政策推動(dòng)和信息科學(xué)技術(shù)不斷發(fā)展的前提下,未來(lái)基于大數(shù)據(jù)的醫(yī)療信息化體系將實(shí)現(xiàn)醫(yī)療及管理等工作的智能化[21];借助互聯(lián)網(wǎng)+技術(shù)真正顛覆傳統(tǒng)的醫(yī)患行為交互模式,最終促進(jìn)醫(yī)院的可持續(xù)健康發(fā)展,并且在區(qū)域醫(yī)療體系的完善過(guò)程中發(fā)揮作用。