国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于循證醫(yī)學(xué)的海量醫(yī)學(xué)數(shù)據(jù)挖掘分析方法研究*

2015-03-13 11:38:00孫向東黃曉琴朱春倫
關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù)寧波市數(shù)據(jù)挖掘

孫向東 黃曉琴 朱春倫

(寧波市衛(wèi)生信息中心 寧波 315010) (華為技術(shù)有限公司 深圳 518129) (寧波市衛(wèi)生局 寧波 315010)

張 科 張 輝 陳曉妍 翁可為 陸傳統(tǒng) 唐 玲

(寧波市衛(wèi)生局寧波 315010) (寧波市衛(wèi)生信息中心寧波 315010) (寧波市衛(wèi)生信息中心寧波 315010)

?

基于循證醫(yī)學(xué)的海量醫(yī)學(xué)數(shù)據(jù)挖掘分析方法研究*

孫向東 黃曉琴 朱春倫

(寧波市衛(wèi)生信息中心 寧波 315010) (華為技術(shù)有限公司 深圳 518129) (寧波市衛(wèi)生局 寧波 315010)

張 科 張 輝 陳曉妍 翁可為 陸傳統(tǒng) 唐 玲

(寧波市衛(wèi)生局寧波 315010) (寧波市衛(wèi)生信息中心寧波 315010) (寧波市衛(wèi)生信息中心寧波 315010)

從循證醫(yī)學(xué)視角出發(fā),以寧波市智慧健康保障體系項(xiàng)目為例,介紹數(shù)據(jù)挖掘方法在醫(yī)學(xué)領(lǐng)域中的應(yīng)用,在此基礎(chǔ)上闡述醫(yī)學(xué)海量數(shù)據(jù)挖掘分析步驟、研究?jī)?nèi)容、分析方法、關(guān)鍵技術(shù)、模型構(gòu)建、平臺(tái)架構(gòu)與功能等。

循證醫(yī)學(xué);數(shù)據(jù)挖掘;分析模型

1 引言

1.1 數(shù)據(jù)共享與交換平臺(tái)建設(shè)為實(shí)施數(shù)據(jù)挖掘奠定基礎(chǔ)

1.1.1 循證醫(yī)學(xué)概念 循證醫(yī)學(xué)(Evidence-based Medicine,EBM)是指遵循證據(jù)的醫(yī)學(xué),又稱“實(shí)證醫(yī)學(xué)”、“證據(jù)醫(yī)學(xué)”,其核心思想是醫(yī)療決策應(yīng)在現(xiàn)有最好的臨床研究依據(jù)基礎(chǔ)上作出,同時(shí)也重視結(jié)合個(gè)人的臨床經(jīng)驗(yàn)。循證醫(yī)學(xué)不同于傳統(tǒng)醫(yī)學(xué),傳統(tǒng)醫(yī)學(xué)是以經(jīng)驗(yàn)醫(yī)學(xué)為主,往往根據(jù)非實(shí)驗(yàn)性的臨床經(jīng)驗(yàn)、臨床資料和對(duì)疾病基礎(chǔ)知識(shí)的理解來(lái)診治病人。而循證醫(yī)學(xué)是在臨床經(jīng)驗(yàn)、資料等基礎(chǔ)上,強(qiáng)調(diào)將醫(yī)療決策建立在最佳科學(xué)研究的證據(jù)基礎(chǔ)上。

1.1.2 平臺(tái)現(xiàn)狀 寧波市智慧健康保障體系項(xiàng)目建設(shè)目前已經(jīng)完成了數(shù)據(jù)共享與交換平臺(tái)的研發(fā),經(jīng)過(guò)與8家市級(jí)醫(yī)療機(jī)構(gòu)以及部分縣市區(qū)(鄞州區(qū)、海曙區(qū)、江東區(qū)、江北區(qū)、奉化縣)平臺(tái)的對(duì)接,實(shí)現(xiàn)了診療信息和健康保健信息的采集與交換。在市級(jí)數(shù)據(jù)中心存儲(chǔ)了全市大部分居民的健康檔案和電子病歷信息,在不斷完善,醫(yī)療衛(wèi)生的數(shù)字化信息將日益豐富。目前在市數(shù)據(jù)中心采集的信息主要包括病人的基本信息、病史、診療信息、檢驗(yàn)報(bào)告、檢查報(bào)告、用藥史、既往史、用藥記錄、醫(yī)囑等臨床信息,以及藥品管理、醫(yī)院管理等醫(yī)療信息。在大量數(shù)據(jù)后面蘊(yùn)含了許多對(duì)疾病的診斷、治療以及衛(wèi)生行政決策有重大價(jià)值的信息,從這些醫(yī)療數(shù)據(jù)中挖掘出有用的信息,對(duì)了解各種疾病之間的相互關(guān)系和發(fā)展規(guī)律,疾病的防控、診斷、治療和醫(yī)學(xué)研究的發(fā)展具有重大意義,醫(yī)療衛(wèi)生信息自動(dòng)化和智能化應(yīng)用和研究正在快速發(fā)展[1-4]。

1.1.3 構(gòu)建意義 從循證醫(yī)學(xué)視角出發(fā),構(gòu)建電子健康檔案和電子病歷信息資源整合與挖掘的宏觀模型和數(shù)據(jù)分析平臺(tái),將助力醫(yī)療衛(wèi)生行業(yè)全面提升,把紛繁復(fù)雜的醫(yī)療數(shù)據(jù)轉(zhuǎn)變成有價(jià)值的信息,為醫(yī)學(xué)科學(xué)研究、臨床診療、衛(wèi)生決策、公眾服務(wù)制定提供依據(jù),包括:(1)幫助尋找最佳藥物組合及標(biāo)準(zhǔn)化治療方法,提高診療效果。(2)預(yù)測(cè)慢性疾病風(fēng)險(xiǎn),查明罹患疾病幾率。(3)協(xié)助醫(yī)院評(píng)估、監(jiān)測(cè)和提高患者治療的安全性。(4)優(yōu)化醫(yī)院資源利用[5-7]。

1.2 數(shù)據(jù)挖掘在醫(yī)學(xué)領(lǐng)域中的應(yīng)用

用數(shù)據(jù)挖掘方法發(fā)現(xiàn)醫(yī)學(xué)數(shù)據(jù)中的規(guī)律性,可以輔助醫(yī)務(wù)人員快速準(zhǔn)確地診斷、預(yù)測(cè)、監(jiān)控病情,確定最優(yōu)的治療方案。目前數(shù)據(jù)挖掘已經(jīng)運(yùn)用在很多醫(yī)學(xué)應(yīng)用領(lǐng)域中[1,3]。(1)疾病的臨床診斷、治療和愈后預(yù)測(cè):醫(yī)學(xué)本身具有很強(qiáng)實(shí)踐性、統(tǒng)計(jì)性,這一過(guò)程往往是醫(yī)師知識(shí)和經(jīng)驗(yàn)的交織作用過(guò)程。數(shù)據(jù)挖掘可以通過(guò)對(duì)患者資料數(shù)據(jù)庫(kù)中大量歷史數(shù)據(jù)的處理,提煉其中大量有價(jià)值的信息,從而為臨床決策服務(wù)。(2)流行病學(xué)研究和醫(yī)學(xué)統(tǒng)計(jì)方法學(xué):如分析影響疾病死亡率的因素、產(chǎn)科病人早產(chǎn)的3個(gè)危險(xiǎn)因素等。(3) 醫(yī)院和衛(wèi)生事業(yè)管理:醫(yī)院科學(xué)管理、醫(yī)療保健政策的制定、衛(wèi)生資源的合理配置等。(4)藥物利用分析:藥物的研發(fā)和毒理學(xué)研究方面的探索和應(yīng)用性研究[8]。從國(guó)內(nèi)外當(dāng)前研究現(xiàn)狀來(lái)看,關(guān)于循證醫(yī)學(xué)海量數(shù)據(jù)挖掘的研究已日趨成熟,無(wú)論在理論上還是具體操作上學(xué)者們者做了積極的探索,形成了大量具有重要指導(dǎo)性的課題成果。從循證醫(yī)學(xué)本身來(lái)說(shuō),提供集成的個(gè)性化醫(yī)療服務(wù)是世界范圍內(nèi)的共識(shí)和目標(biāo),如何將EBM與醫(yī)院信息系統(tǒng)資源進(jìn)行整合和挖掘,構(gòu)建直接面向用戶服務(wù)的公共知識(shí)平臺(tái),實(shí)現(xiàn)循證醫(yī)學(xué)資源的有效利用,仍是國(guó)內(nèi)學(xué)者需要嘗試和探索的難題。

2 研究步驟[9-10]

2.1 明確需要解決的問(wèn)題

在此階段與醫(yī)學(xué)專家進(jìn)行深入交流,明確需要解決的問(wèn)題,確定數(shù)據(jù)挖掘的目標(biāo)和衡量其成功的標(biāo)準(zhǔn),了解該問(wèn)題目前的解決方法與存在的弊端。這個(gè)步驟是數(shù)據(jù)挖掘的基礎(chǔ)。

2.2 數(shù)據(jù)理解

這個(gè)步驟包括數(shù)據(jù)的初步收集、對(duì)原始數(shù)據(jù)進(jìn)行抽樣分析、列出數(shù)據(jù)的類型(包括大小、格式、屬性等)。經(jīng)過(guò)這個(gè)步驟可以回答部分?jǐn)?shù)據(jù)挖掘的目的,從而肯定最初的假設(shè)或?qū)π碌奶卣鬟M(jìn)行探求。

2.3 數(shù)據(jù)處理與數(shù)據(jù)倉(cāng)庫(kù)建立

這個(gè)步驟是決定數(shù)據(jù)挖掘成功與否的關(guān)鍵。區(qū)域衛(wèi)生數(shù)據(jù)中心積累了龐大的醫(yī)療衛(wèi)生數(shù)據(jù),處理所有的原始數(shù)據(jù)不僅耗時(shí)而且對(duì)計(jì)算機(jī)資源浪費(fèi)極大。清洗、抽取具有代表意義的部分?jǐn)?shù)據(jù)是一種有效的簡(jiǎn)化方法,可通過(guò)以下兩種途徑:(1)對(duì)數(shù)據(jù)空間進(jìn)行采樣,此時(shí)進(jìn)行的數(shù)據(jù)收集是隨機(jī)的。(2)對(duì)特征空間的采樣,只有具有某些特征的數(shù)據(jù)才能被選中,當(dāng)大量特征存在時(shí),這種選擇也將是隨機(jī)的,經(jīng)過(guò)數(shù)據(jù)清洗、轉(zhuǎn)換并去降噪聲,與其他一些需要的外部信息共同組成數(shù)據(jù)倉(cāng)庫(kù)。

2.4 數(shù)據(jù)挖掘

利用數(shù)據(jù)挖掘方法來(lái)發(fā)現(xiàn)新的內(nèi)容,包括選擇數(shù)據(jù)模型、決定訓(xùn)練和實(shí)驗(yàn)過(guò)程、建立模型、評(píng)價(jià)模型品質(zhì)等過(guò)程。數(shù)據(jù)挖掘不是一個(gè)單向的過(guò)程,對(duì)同一個(gè)問(wèn)題可有多種不同的算法。不同的數(shù)據(jù)挖掘方法作用于同一數(shù)據(jù)庫(kù),對(duì)數(shù)據(jù)的理解可有不同的角度,每種方法合理與否都有可能。這就需要將發(fā)現(xiàn)結(jié)果在實(shí)際運(yùn)用中反復(fù)求證,以檢驗(yàn)其合理性。

2.5 評(píng)估及應(yīng)用

首先,對(duì)發(fā)現(xiàn)的知識(shí)進(jìn)行醫(yī)學(xué)或者藥學(xué)上的解釋,其結(jié)論對(duì)使用者來(lái)說(shuō)必須是可理解的;其次,其在醫(yī)學(xué)或藥學(xué)領(lǐng)域中具有一定應(yīng)用價(jià)值,能夠解決一定實(shí)際問(wèn)題。

3 主要研究?jī)?nèi)容與關(guān)鍵技術(shù)

3.1 主要研究?jī)?nèi)容

3.1.1 數(shù)據(jù)挖掘需求梳理 對(duì)數(shù)據(jù)挖掘分析需求進(jìn)行梳理,任何平臺(tái)提供的預(yù)定義模型無(wú)法完全覆蓋全部業(yè)務(wù)功能,選擇就診實(shí)時(shí)預(yù)警應(yīng)用(用藥禁忌、重復(fù)用藥、重復(fù)檢驗(yàn)檢查)、醫(yī)務(wù)人員非法執(zhí)業(yè)警示、傳染病趨勢(shì)分析、衛(wèi)生決策分析等應(yīng)用需求。

3.1.2 標(biāo)準(zhǔn)規(guī)范與值域代碼 在加強(qiáng)對(duì)已有國(guó)家、行業(yè)和地方標(biāo)準(zhǔn)貫徹實(shí)施的同時(shí),制定寧波市統(tǒng)一的總體數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系,在寧波市智慧健康保障項(xiàng)目數(shù)據(jù)集與值域代碼梳理的基礎(chǔ)上,補(bǔ)充相應(yīng)的數(shù)據(jù)字典庫(kù),如藥品目錄、檢驗(yàn)指標(biāo)、收費(fèi)明細(xì)等。根據(jù)統(tǒng)一的標(biāo)準(zhǔn)規(guī)范采集電子健康檔案數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)共享與交換,適應(yīng)循證醫(yī)學(xué)醫(yī)療模式,融合國(guó)際、國(guó)家和區(qū)域性標(biāo)準(zhǔn),建立滿足各種數(shù)據(jù)挖掘需求的區(qū)域性或國(guó)家性資源整合與挖掘的平臺(tái)模型。針對(duì)已經(jīng)確認(rèn)的需求所涉及的數(shù)據(jù)進(jìn)行準(zhǔn)備與定義,沒有數(shù)據(jù)規(guī)則不可能有業(yè)務(wù)模型,數(shù)據(jù)挖掘平臺(tái)提供的預(yù)定義的經(jīng)過(guò)訓(xùn)練可重用的業(yè)務(wù)模型必須要基于真實(shí)業(yè)務(wù)數(shù)據(jù),基于測(cè)試數(shù)據(jù)訓(xùn)練出的模型不能重用。

3.1.3 信息資源中心建設(shè) 健康信息深化利用的數(shù)據(jù)來(lái)源于區(qū)域居民健康協(xié)同服務(wù)平臺(tái),是來(lái)自于不同醫(yī)院、公共衛(wèi)生業(yè)務(wù)、社區(qū)業(yè)務(wù)數(shù)據(jù)的匯總、整合,其結(jié)構(gòu)清晰,從源頭上避免了數(shù)據(jù)定義、結(jié)構(gòu)的不一致性,為數(shù)據(jù)倉(cāng)庫(kù)建立奠定基礎(chǔ)。數(shù)據(jù)倉(cāng)庫(kù)根據(jù)需求利用“健康管理數(shù)據(jù)質(zhì)量智能控制”保證數(shù)據(jù)的質(zhì)量,利用“健康管理信息智能整合”實(shí)現(xiàn)多維化模型構(gòu)建,形成以業(yè)務(wù)分析主題為核心、以數(shù)據(jù)分析為目的的數(shù)據(jù)集合。數(shù)據(jù)倉(cāng)庫(kù)的建立可以有效地管理業(yè)務(wù)數(shù)據(jù),為數(shù)據(jù)展示、挖掘利用奠定基礎(chǔ)。

3.1.4 數(shù)據(jù)分析和挖掘平臺(tái)研制 數(shù)據(jù)分析和挖掘平臺(tái)其實(shí)就是應(yīng)用平臺(tái),用戶可以使用該平臺(tái)提供的工具組件、模型庫(kù)、算法庫(kù)等功能實(shí)現(xiàn)數(shù)據(jù)挖掘應(yīng)用、OLAP多維分析應(yīng)用和數(shù)據(jù)服務(wù)應(yīng)用。數(shù)據(jù)挖掘平臺(tái)提供數(shù)據(jù)采集、數(shù)據(jù)管理、數(shù)據(jù)應(yīng)用、平臺(tái)訪問(wèn)、平臺(tái)管理5大類功能。

3.1.5 數(shù)據(jù)挖掘分析應(yīng)用 (1)藥物利用分析:數(shù)據(jù)來(lái)源于各家醫(yī)院的醫(yī)療資源數(shù)據(jù)和診療業(yè)務(wù)數(shù)據(jù),由于數(shù)據(jù)來(lái)源和性質(zhì)的差異,可將藥物利用分析分為兩類,一類是針對(duì)醫(yī)院藥品庫(kù)存的資源分析,另一類是針對(duì)診療過(guò)程中藥品利用的業(yè)務(wù)分析。系統(tǒng)以報(bào)表、圖形等直觀的方式發(fā)布分析信息,以便于管理者對(duì)信息特征的快速捕捉。(2)疾病危險(xiǎn)因素分析:疾病危險(xiǎn)因素指機(jī)體內(nèi)外環(huán)境中與疾病發(fā)生發(fā)展及死亡有聯(lián)系的誘發(fā)因素,包括環(huán)境因素、個(gè)人行為因素、人類生物學(xué)因素(如家族遺傳、相關(guān)體征等)、社會(huì)心理因素等,由于不同疾病的發(fā)病機(jī)理不同,其危險(xiǎn)因素也不盡相同。按照疾病與危險(xiǎn)因素是否已經(jīng)建立關(guān)聯(lián)關(guān)系,可將疾病危險(xiǎn)因素分析分為兩類:一類是對(duì)已經(jīng)明確的疾病危險(xiǎn)因素的多維分析,另一類是對(duì)指定疾病與指定危險(xiǎn)因素之間的關(guān)聯(lián)分析。(3)基于健康檔案與電子病歷的智能決策支持系統(tǒng):臨床決策支持、運(yùn)營(yíng)決策支持、社區(qū)衛(wèi)生管理決策支持、公共衛(wèi)生管理決策支持等[10]。

3.2 關(guān)鍵技術(shù)

3.2.1 循證醫(yī)學(xué)理論 其核心思想就是充分利用客觀的臨床科學(xué)證據(jù)進(jìn)行醫(yī)學(xué)決策,從而提高醫(yī)療質(zhì)量。

3.2.2 數(shù)據(jù)預(yù)處理 醫(yī)學(xué)數(shù)據(jù)庫(kù)中含有海量、不同來(lái)源的原始信息,其中包括大量模糊、不完整、帶有噪聲和冗余的信息。在數(shù)據(jù)挖掘之前,必須進(jìn)行清理和過(guò)濾,以確保數(shù)據(jù)的一致性和確定性,將其變成適合挖掘的形式[11]。

3.2.3 信息融合技術(shù) 醫(yī)學(xué)信息由文字、數(shù)據(jù)、波形信號(hào)、圖像以及少量的語(yǔ)音和視頻信號(hào)組成。對(duì)這些不同物理屬性的醫(yī)學(xué)數(shù)據(jù),應(yīng)采用不同的技術(shù)和措施進(jìn)行處理,使其在屬性上趨同或一致,再對(duì)處理的結(jié)果進(jìn)行綜合。醫(yī)學(xué)信息中多源性、時(shí)序性和非時(shí)序性數(shù)據(jù)共存、數(shù)字類型和非數(shù)字型數(shù)據(jù)共存的特點(diǎn),加大了信息融合的難度。

3.2.4 數(shù)據(jù)倉(cāng)庫(kù) 是面向主題、集成、時(shí)變、非易失的數(shù)據(jù)集合,用以支持決策制定過(guò)程。數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)庫(kù)技術(shù)的一種新應(yīng)用,是一個(gè)信息提供平臺(tái),它從業(yè)務(wù)處理系統(tǒng)獲得數(shù)據(jù),主要以星型模型和雪花模型進(jìn)行數(shù)據(jù)組織,為用戶提供各種手段從數(shù)據(jù)中獲取信息和知識(shí)[12]。從功能結(jié)構(gòu)劃分,數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)至少應(yīng)該包含數(shù)據(jù)獲取、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)訪問(wèn)3個(gè)關(guān)鍵部分。

3.2.5 數(shù)據(jù)挖掘 數(shù)據(jù)挖掘是人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù)高度自動(dòng)化地分析原有數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在模式或者行為,以幫助決策者做出正確決策的過(guò)程。

3.2.6 快速、魯棒的挖掘算法 醫(yī)學(xué)數(shù)據(jù)庫(kù)是一個(gè)涉及面廣、信息量大的信息庫(kù)。要在這樣龐大的數(shù)據(jù)庫(kù)中提取知識(shí),需要花費(fèi)比其他數(shù)據(jù)庫(kù)更多的時(shí)間,因此必須考慮醫(yī)學(xué)數(shù)據(jù)挖掘的效率問(wèn)題。研究快速挖掘算法對(duì)于循證醫(yī)學(xué)研究具有深遠(yuǎn)的影響。醫(yī)學(xué)數(shù)據(jù)庫(kù)的類型較多,并且是動(dòng)態(tài)變化的,要求挖掘算法具有一定的容錯(cuò)性和魯棒性。

3.2.7 XML Web Servies 是一種基于透明標(biāo)準(zhǔn)體系的組件化松耦合技術(shù),其目標(biāo)是實(shí)現(xiàn)不同系統(tǒng)間跨平臺(tái)、跨編程語(yǔ)言的互操作。它是一個(gè)基于XML的可編程實(shí)體,提供一種特殊的功能元素,可通過(guò)Internet標(biāo)準(zhǔn),如XML和HTTP等來(lái)訪問(wèn)分布式的操作平臺(tái),實(shí)現(xiàn)應(yīng)用的協(xié)同工作。Web Services的定位是擴(kuò)展分布式應(yīng)用,適合大數(shù)據(jù)量低頻率的遠(yuǎn)程數(shù)據(jù)調(diào)用。

4 模型構(gòu)建

4.1 采用數(shù)據(jù)中心模式

4.2 模塊劃分

模型可分為4大模塊:(1)源數(shù)據(jù)模塊:數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)源,主要來(lái)源于醫(yī)療衛(wèi)生機(jī)構(gòu)的各種操作型信息系統(tǒng)數(shù)據(jù)庫(kù)(如HIS、EHR、PACS、LIS、RIS等),各種醫(yī)療數(shù)據(jù)文檔以及其他相關(guān)數(shù)據(jù)。(2)數(shù)據(jù)倉(cāng)庫(kù)管理模塊:利用數(shù)據(jù)倉(cāng)庫(kù)管理工具、各種規(guī)范標(biāo)準(zhǔn)及元數(shù)據(jù)庫(kù)、數(shù)據(jù)字典庫(kù)等,通過(guò)數(shù)據(jù)建模工具完成各種異構(gòu)數(shù)據(jù)及數(shù)據(jù)結(jié)構(gòu)的統(tǒng)一、規(guī)范。(3)數(shù)據(jù)倉(cāng)庫(kù):集成了標(biāo)準(zhǔn)化、規(guī)范化處理后的各種數(shù)據(jù),可根據(jù)具體需求建立各種數(shù)據(jù)集。(4)分析應(yīng)用模塊:通過(guò)Web Services層完成各種分析應(yīng)用(如查詢工具、C/S工具、OLAP工具、數(shù)據(jù)挖掘工具等)與數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)傳輸請(qǐng)求。本模型通過(guò)倉(cāng)庫(kù)管理模塊將各種異構(gòu)數(shù)據(jù)源集成于數(shù)據(jù)倉(cāng)庫(kù),通過(guò)分析應(yīng)用模塊完成基于Web Services模式的終端應(yīng)用,即可兼容不同時(shí)間、不同區(qū)域、不同標(biāo)準(zhǔn)、不同結(jié)構(gòu)的各種源數(shù)據(jù),避免重復(fù)建設(shè)和資源浪費(fèi),又可以通過(guò)各種個(gè)性化工具實(shí)現(xiàn)對(duì)電子健康檔案相關(guān)資源的共享與應(yīng)用,實(shí)現(xiàn)基礎(chǔ)與通用的電子健康檔案系統(tǒng)建設(shè)目標(biāo)[13-14]。

4.3 數(shù)據(jù)挖掘平臺(tái)技術(shù)架構(gòu)(圖1)

平臺(tái)=工具+業(yè)務(wù)模型+數(shù)據(jù)+管理監(jiān)控。(1)算法組件:存儲(chǔ)管理維護(hù),部署醫(yī)院常用統(tǒng)計(jì)分析及挖掘算法,如決策樹、神經(jīng)網(wǎng)絡(luò)、線性回歸、貝葉斯等。(2)分析挖掘引擎:存儲(chǔ)管理循證醫(yī)學(xué)中的分析挖掘模型及自行研究的分析挖掘模型,支持模型的部署。主要功能包括模型注冊(cè)、測(cè)試、查詢、瀏覽、部署。(3)展示接口:對(duì)分析及挖掘結(jié)果提供對(duì)外展示的接口。

圖1 數(shù)據(jù)挖掘平臺(tái)技術(shù)架構(gòu)

4.4 數(shù)據(jù)挖掘平臺(tái)功能(圖2)

(1)數(shù)據(jù)采集:將數(shù)據(jù)從生產(chǎn)庫(kù)或交換庫(kù)中提取、轉(zhuǎn)換、加載(Extraction-Transformation-Loading, ETL)到數(shù)據(jù)挖掘平臺(tái)的數(shù)據(jù)存儲(chǔ)區(qū),涉及功能主要包括映射管理、運(yùn)行監(jiān)控、調(diào)度管理、元數(shù)據(jù)管理和接口管理。(2)數(shù)據(jù)管理:對(duì)數(shù)據(jù)存儲(chǔ)區(qū)中的數(shù)據(jù)(業(yè)務(wù)數(shù)據(jù)以及元數(shù)據(jù))進(jìn)行管理,涉及功能主要包括數(shù)據(jù)安全管理(災(zāi)備、備份恢復(fù))、元數(shù)據(jù)管理和接口管理。(3)數(shù)據(jù)應(yīng)用:對(duì)數(shù)據(jù)存儲(chǔ)區(qū)中的數(shù)據(jù)進(jìn)行業(yè)務(wù)使用和業(yè)務(wù)模型重用,涉及功能包括模型管理、算法實(shí)現(xiàn)、主題管理、指標(biāo)體系管理和接口管理。(4)平臺(tái)訪問(wèn):對(duì)數(shù)據(jù)的訪問(wèn)方式提供組件支持,包括數(shù)據(jù)服務(wù)接口(Web Service 服務(wù)開發(fā)和JDBC數(shù)據(jù)訪問(wèn)接口)、統(tǒng)計(jì)挖掘客戶端(馬克威網(wǎng)絡(luò)版)和數(shù)據(jù)應(yīng)用展現(xiàn)。(5)平臺(tái)管理:對(duì)整個(gè)平臺(tái)正常運(yùn)行執(zhí)行安全與運(yùn)行維護(hù),涉及功能包括用戶與權(quán)限管理、日志管理、安全集成功能。

圖2 數(shù)據(jù)挖掘平臺(tái)功能框架

5 結(jié)語(yǔ)

數(shù)據(jù)挖掘技術(shù)使用的海量檢索、人工智能和統(tǒng)計(jì)學(xué)方法使循證醫(yī)學(xué)所使用的預(yù)后終點(diǎn)指標(biāo)(死亡率、致殘率、臨床事件發(fā)生率、生存質(zhì)量等)所涵蓋的范圍更廣、更有代表性,使醫(yī)療衛(wèi)生工作人員擺脫人工分析大量循證數(shù)據(jù)的煩惱,從而提高收集利用數(shù)據(jù)的效率和準(zhǔn)確性、可靠性。數(shù)據(jù)挖掘技術(shù)在醫(yī)療衛(wèi)生管理與決策中的應(yīng)用范圍也會(huì)越來(lái)越廣并帶來(lái)可觀的經(jīng)濟(jì)和社會(huì)效益。

1 中華人民共和國(guó)衛(wèi)生部.衛(wèi)辦發(fā)〔2009〕46號(hào).健康檔案基本架構(gòu)與數(shù)據(jù)標(biāo)準(zhǔn)(試行) [S]. 2009.

2 中華人民共和國(guó)衛(wèi)生部.衛(wèi)辦綜函〔2009〕688號(hào).電子病歷基本架構(gòu)與數(shù)據(jù)標(biāo)準(zhǔn)(征求意見稿)[S].2009.

3 中華人民共和國(guó)衛(wèi)生部.衛(wèi)辦綜發(fā)〔2011〕39號(hào).基于電子病歷的醫(yī)院信息平臺(tái)建設(shè)技術(shù)解決方案(1.0版)[S].2011.

4 中華人民共和國(guó)衛(wèi)生部.衛(wèi)辦綜發(fā)〔2009〕230號(hào).基于健康檔案的區(qū)域衛(wèi)生信息平臺(tái)建設(shè)技術(shù)解決方案(試行)[S]. 2009.

5 李燕.海量數(shù)據(jù)與數(shù)據(jù)挖掘技術(shù)[J]. 醫(yī)學(xué)信息學(xué)雜志,2008,29(12): 23-25.

6 高艷霞.循證醫(yī)學(xué)對(duì)臨床決策的影響[J]. 醫(yī)學(xué)信息學(xué)雜志,2007,28(2):110-112,114.

7 周新憲,劉素賓.循證醫(yī)學(xué)在醫(yī)院信息系統(tǒng)中的應(yīng)用[J].醫(yī)學(xué)信息學(xué)雜志,2009,(9): 34-37.

8 劉莘,王飛. 醫(yī)學(xué)數(shù)據(jù)挖掘的現(xiàn)狀分析[J]. 福建電腦,2010,(5):62.

9 沈小慶,盛炳義,方曙,等. 數(shù)據(jù)挖掘技術(shù)及其在醫(yī)院藥學(xué)中的應(yīng)用[J].中國(guó)醫(yī)院管理,2005,25(12):46-48.

10 徐剛,袁兆康. 數(shù)據(jù)挖掘及其在醫(yī)學(xué)領(lǐng)域中的應(yīng)用和展望[J]. 實(shí)用臨床醫(yī)學(xué),2006,7(11):196-198.

11 韓煜.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息系統(tǒng)中的應(yīng)用[J]. 醫(yī)學(xué)信息學(xué)雜志,2010,(10): 28-31

12 鄭西川.臨床信息學(xué):從數(shù)據(jù)管理到循證醫(yī)學(xué)支持[J]. 醫(yī)學(xué)信息學(xué)雜志,2012,33(2): 34-37,43.

13 曹洪欣,徐維. 基于循證醫(yī)學(xué)的電子病歷資源整合與挖掘的宏觀模型構(gòu)建[J].圖書館理論與實(shí)踐,2010,(9):43-45.

14 Chae YM, Ho SH, Cho KW, et al. Data Mining approach to Policy Analysis in a Health Insurance Domain [J]. International Med Information, 2001, 62(8): 103-111.

Research on Massive Medical Data Mining Analysis Method Based on Evidence-based Medicine

SUNXiang-dong,Ningbo

HealthInformationCenter,Ningbo315010,

China;HUANGXiao-qin,

HuaweiTechnologiesCo.,Ltd,Shenzhen518129,China;ZHUChun-lun,

NingboHealthBureau,Ningbo315010,China;

LUChuan-tong,

TANGLing,

NingboHealthInformationCenter,Ningbo315010,China;ZHANGKe,

NingboHealthBureau,Ningbo315010,China;

ZHANGHui,CHENXiao-yan,

WENGKe-wei,

NingboHealthInformationCenter,Ningbo315010,China

From the perspective of evidence-based medicine, taking the project of intelligence health insurance sysem in Ningbo as an example, the paper introduces the application of data mining method in medical field, based on the above it elaborates the analytical steps, research contents, analytical methods, key technologies, model construction, the structure and function of the platform in massive medical data mining, etc.

Evidence-based medicine; Data mining; Analysis model

2013-10-08

孫向東,碩士,副研究員,出版著作1部,發(fā)表論文17篇。

2012年寧波市科技局服務(wù)業(yè)示范項(xiàng)目“基于循證醫(yī)學(xué)的海量數(shù)據(jù)挖掘分析平臺(tái)”(項(xiàng)目編號(hào):2012F1014)。

R-058

A 〔DOI〕10.3969/j.issn.1673-6036.2014.03.003

猜你喜歡
數(shù)據(jù)倉(cāng)庫(kù)寧波市數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于數(shù)據(jù)倉(cāng)庫(kù)的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
重建寧波市圖書館記憶
天一閣文叢(2018年0期)2018-11-29 07:49:00
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉(cāng)庫(kù)中的設(shè)計(jì)
電子制作(2016年15期)2017-01-15 13:39:15
探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
寧波市四眼碶中學(xué)
基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析探索與實(shí)踐
寧波市中城小學(xué)
阿合奇县| 昔阳县| 剑河县| 卓尼县| 普宁市| 安吉县| 遵义市| 介休市| 临湘市| 红河县| 开鲁县| 邹城市| 永善县| 霍州市| 灵宝市| 原阳县| 邵阳县| 永川市| 姚安县| 台南县| 隆尧县| 湟中县| 千阳县| 天长市| 新疆| 工布江达县| 皋兰县| 山东省| 沽源县| 都匀市| 弋阳县| 永仁县| 黑河市| 泾阳县| 句容市| 洛川县| 顺义区| 曲阜市| 福鼎市| 安仁县| 新余市|