国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘技術(shù)的門診合理用藥分析

2014-05-31 01:41韓蓉吳俊
中國醫(yī)療設(shè)備 2014年4期
關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)門診

韓蓉,吳俊

南通市腫瘤醫(yī)院 信息科,江蘇 南通266000

0 前言

數(shù)據(jù)挖掘是指從大量的、不安全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中人們未知的、但又具有潛在應(yīng)用價(jià)值的數(shù)據(jù),建立模型,提供給分析預(yù)測(cè)部門[1]。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于門診合理用藥分析的研究不僅有利于門診用藥信息結(jié)構(gòu)化,促進(jìn)門診用藥合理化研究,還有利于提示門診用藥與季節(jié)、科室、醫(yī)保政策是否允許等多層關(guān)聯(lián)屬性的研究。近年來,國內(nèi)將數(shù)據(jù)挖掘應(yīng)用于醫(yī)學(xué)、藥學(xué)的研究越來越多,秦莉花等人[2]將其應(yīng)用于絕經(jīng)綜合征焦慮、抑郁的相關(guān)因素的研究中;于紅艷等人[3]將其應(yīng)用于中藥藥性屬性與其他屬性的研究。臨床上利用數(shù)據(jù)挖掘算法找出提高孤立性肺結(jié)節(jié)(solitary pulmonary nodul,SPN,一種肺癌的先兆病癥)的診斷率[4];用數(shù)據(jù)挖掘方法來分析早期乳腺癌診斷的X光片,達(dá)到了比較滿意的準(zhǔn)確率(70%以上)[5]。大量研究證明,醫(yī)學(xué)數(shù)據(jù)挖掘有廣闊的應(yīng)用前景[6]。

1 目的

遏制藥品不當(dāng)促銷行為,控制藥品費(fèi)用不合理增長(zhǎng),使患者用上既安全又經(jīng)濟(jì)的藥品一直是醫(yī)院藥事管理部門追求的目標(biāo),針對(duì)用藥的不合理性,國內(nèi)大部分醫(yī)院的操作模式是從各個(gè)科室抽調(diào)負(fù)責(zé)人或技術(shù)骨干成立處方點(diǎn)評(píng)小組,由他們負(fù)責(zé)對(duì)門診處方用藥及配伍的合理性、用藥規(guī)范性進(jìn)行考核及點(diǎn)評(píng)。這樣的手工模式效率低、誤差高,而且有時(shí)因人為原因不能及時(shí)進(jìn)行處方點(diǎn)評(píng),導(dǎo)致問題不能及時(shí)發(fā)現(xiàn)。因此本文嘗試將數(shù)據(jù)挖掘的方法應(yīng)用于醫(yī)院門診用藥的合理性分析,從海量的醫(yī)療數(shù)據(jù)中找出門診各科室醫(yī)生、處方金額、藥品用量、是否醫(yī)保政策允許范圍藥品等之間的關(guān)聯(lián)規(guī)則,找出門診用藥可能存在的問題,及時(shí)指導(dǎo)、更正甚至處罰,真正做到減輕患者經(jīng)濟(jì)負(fù)擔(dān),解決人民群眾“看病難、看病貴”問題。

2 方法

2.1 數(shù)據(jù)預(yù)分類

數(shù)據(jù)預(yù)處理主要目的是消除或減少數(shù)據(jù)噪聲和處理缺失數(shù)據(jù),盡量減少數(shù)據(jù)“不一致性”“不完整性”等干擾因素,提高數(shù)據(jù)質(zhì)量[2]。針對(duì)本文挖掘的目的,我們將數(shù)據(jù)分成以下幾大類:

(1)疾病診斷類。病史類中的屬性是為了說明病人來院前和當(dāng)時(shí)的病情狀況及相關(guān)情況。這部分屬性分疾病主診斷,疾病次診斷等。

(2)檢查類。檢查類中的屬性主要是反映病人入院后所做檢查的結(jié)果。該數(shù)據(jù)主要從病人的檢驗(yàn)、體檢和其他檢查及病程記錄中抽取,如:血壓、脈搏、呼吸、血常規(guī)、大生化、凝血三項(xiàng)、超聲、胸片等屬性。該類屬性大多會(huì)有多屬性和多次檢查值,因此要建立這些屬性間的關(guān)聯(lián)及屬性值間的關(guān)聯(lián)。

(3)用藥類。該類中的屬性主要反映病人在我院門診開藥的情況,藥品單價(jià)、藥品數(shù)量、藥品金額、開單醫(yī)生等。

(4)醫(yī)保政策類。該類中的屬性主要反映病人的參保類型,有自費(fèi)、醫(yī)保、農(nóng)保等。

2.2 數(shù)據(jù)處理

對(duì)于抽取后存入數(shù)據(jù)庫的原始數(shù)據(jù)不完整和不一致的采用填充空缺值、糾正非法值和糾正數(shù)據(jù)不一致性的方法進(jìn)行處理。這部分主要是如何將數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的格式,以適合數(shù)據(jù)的再處理。一般在海量的數(shù)據(jù)上進(jìn)行復(fù)雜的數(shù)據(jù)分析和處理將花費(fèi)很長(zhǎng)的時(shí)間,甚至有時(shí)導(dǎo)致處理無法完成。而數(shù)據(jù)歸約技術(shù)則可以得到小數(shù)集的歸約表示,但仍能保持?jǐn)?shù)據(jù)的完整性。

本文在研究過程中用到概念分層技術(shù),主要涉及到的部分有開藥的日期、疾病診斷、開藥藥品單價(jià)、開單醫(yī)生、所屬科室等。醫(yī)保政策屬性則被歸約成醫(yī)保政策允許與不允許兩種。

維歸約技術(shù)是通過刪除不相關(guān)維來減少數(shù)據(jù)量的,屬性子集的選擇可以用基本子集的啟發(fā)式方法,這種方法主要包括逐步向前選擇、逐步向后刪除、向前選擇和向后刪除的結(jié)合和判定的歸納技術(shù)。本文采用逐步向后的刪除技術(shù)。

維歸約技術(shù)涉及到的維有病人癥狀、病人病史、個(gè)人史、輔助檢查、病人參保性質(zhì)等。下面舉例說明維歸約技術(shù)在本文中的應(yīng)用。

(1)醫(yī)保政策是否允許(Sfzl)。門診病人的醫(yī)保屬性有好多種,有農(nóng)保、市區(qū)醫(yī)保、縣區(qū)醫(yī)保等,我們就將其歸約為醫(yī)保政策允許與不允許。

(2)藥品處方金額(Jined)。處方金額設(shè)定≥300元即為大處方,用d表示,反之用j1表示。

(3)開藥日期(yf)。這部分?jǐn)?shù)據(jù)是以月份形式表示的,所以我們根據(jù)醫(yī)院專家的建議將其開藥時(shí)間分為4段,即0~3月為1段,4~6月為2段,7~9月為3段,10~12月為4段,也就是春夏秋冬四季,這樣劃分的意義在于,評(píng)估病人用藥的多少是否和季節(jié)有關(guān)。

(4)藥品單價(jià)(ypdjd)。根據(jù)抽取的數(shù)據(jù),最小金額為1.12元,最大金額為2596元。所以將其劃分為0~50元、50~100元、100~150元、150~200元等幾部分,分別用b1、b2、b3、b4、b5、b6 表示。

(5)藥品數(shù)量(shuld)。根據(jù)抽取的數(shù)據(jù),最小藥品數(shù)量為1支(粒),最大為1~10支(粒)、10~20支(粒)、20~30 支(粒)、30~40支(粒),40~50 支(粒)、50~100 支(粒),分別用 a、b、c、d、e、f表示。

(6)醫(yī)生科室(ksdm)。因?yàn)樵跀?shù)據(jù)庫中抽取的科室代碼均為數(shù)值型,我們將這些代碼均用字母代替,如 93、141、83、175、84、81 用 字 母 表 示 為 a、b、c、d、f、g。映射后得到的部分屬性數(shù)據(jù)庫,見表1。

表1 映射后的部分屬性數(shù)據(jù)庫

3 關(guān)聯(lián)規(guī)則挖掘與結(jié)果分析

根據(jù)研究目的的數(shù)據(jù)源數(shù)據(jù)屬性特點(diǎn),本文采用關(guān)聯(lián)規(guī)則方法,關(guān)聯(lián)規(guī)則就是從事務(wù)數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫和其他信息存儲(chǔ)中的大量數(shù)據(jù)的項(xiàng)集之間發(fā)現(xiàn)有趣的、頻繁出現(xiàn)的模式關(guān)聯(lián)和相關(guān)性。若2個(gè)或多個(gè)變量的取值之間存在某種規(guī)律,就稱為關(guān)聯(lián)。關(guān)聯(lián)規(guī)則[7]是R.Agrawal等人于1993年首先提出的。關(guān)聯(lián)規(guī)則的挖掘過程:

找出所有的頻繁項(xiàng)集,即找出所有那些支持度大于事先給定的最小支持度的項(xiàng)集。由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則:這種規(guī)則必須同時(shí)滿足最小支持度和最小置信度。對(duì)每一頻繁項(xiàng)目集A,找到A的所有非空子集a,如果比率support(A)/support(a)≥min_conf,就生成關(guān)聯(lián)規(guī)則a≥(A-a)。support(A)/support(a)即規(guī)則a≥(A-a)的置信度。即此過程分為兩個(gè)步驟,第一步找出頻繁項(xiàng)集,第二步再從頻繁項(xiàng)集中找出置信度,或者說滿足置信度的關(guān)聯(lián)規(guī)則。這些既滿足置信度,又滿足支持度的關(guān)聯(lián)規(guī)則,就是強(qiáng)關(guān)聯(lián)規(guī)則,也就是我們挖掘的結(jié)果。

收集2012年某三甲醫(yī)院門診用藥信息,采用自主開發(fā)的軟件經(jīng)過抽取、清理、轉(zhuǎn)換數(shù)據(jù)、最終裝載入數(shù)據(jù)庫,分析是否存在大處方的可能性,給定最小支持率minsup=0.1,最小置信度minconf=0.7,挖掘出74條關(guān)聯(lián)規(guī)則,這些關(guān)聯(lián)規(guī)則中有意義的部分及其最小支持度與最小可信度,見表2。

根據(jù)這些規(guī)則我們可以分析得出大處方存在的可能性,是否是醫(yī)保政策允許范圍的病人等。從表2可以看出,如果是醫(yī)保政策允許的病人則其處方金額≥300元,藥品單價(jià)<50元的可能性為81%,支持度為0.190752;同時(shí)我們也發(fā)現(xiàn)如果藥品數(shù)量<10且科室代碼為l(經(jīng)查為婦科),則不是醫(yī)保政策允許范圍的病人且開的藥品單價(jià)<50元的小處方的可能性為91%,支持度為0.168519。

表2 有意義的關(guān)聯(lián)規(guī)則(minsup=0.1,minconf=0.7)

經(jīng)過挖掘?qū)嵗菔痉治霭l(fā)現(xiàn):關(guān)聯(lián)規(guī)則與輸入的參數(shù)有很大的關(guān)系,輸入的參數(shù)值不同,產(chǎn)生的關(guān)聯(lián)規(guī)則也不同,有時(shí)甚至產(chǎn)生大量模糊的關(guān)聯(lián)規(guī)則。同時(shí)若數(shù)據(jù)源選取的不同,也是會(huì)產(chǎn)生不同的關(guān)聯(lián)規(guī)則。

經(jīng)過評(píng)估,數(shù)據(jù)挖掘階段發(fā)現(xiàn)出來的模式可能滿足用戶的需求,也可能不滿足。這就需要管理員在不斷完善挖掘過程中積累的經(jīng)驗(yàn),對(duì)挖掘模型的參數(shù)進(jìn)行調(diào)整,以達(dá)到更好的挖掘效果。

因?yàn)橛脩粼谕诰蜻^程中也可能存在冗余或無關(guān)的模式,這時(shí)則需要整個(gè)發(fā)現(xiàn)過程回退到前一階段,如需要用戶重新選擇數(shù)據(jù)源,設(shè)定新的參數(shù)值,直到達(dá)到用戶滿意為止。

挖掘結(jié)果應(yīng)用:① 門診有大處方存在,但是藥品單價(jià)并不高,而且一般是醫(yī)保政策允許范圍的病人,藥事管理部門就此情況在醫(yī)生處得到證實(shí),這種情況比較普遍,因?yàn)閰⒈2∪耍ㄡt(yī)保政策允許范圍的病人)認(rèn)為醫(yī)保帳戶上的款項(xiàng)取不出來,自己開藥也就順帶幫家人開些藥;② 分析看出,如果是自費(fèi)病人(非醫(yī)保政策允許的病人),存在大處方的可能性很小;③ 我們還發(fā)現(xiàn),該院婦科醫(yī)生開的處方一般性價(jià)比較高,金額都比較小。所以整體來說該院2012年全年門診用藥情況還算良好。

4 結(jié)論

本文采用自主開發(fā)的軟件抽取、清理、轉(zhuǎn)換數(shù)據(jù)、裝載入庫,通過設(shè)定最小支持度,最小可信度,挖掘出有意義的關(guān)聯(lián)規(guī)則,對(duì)這些規(guī)則分析解釋得出的結(jié)與門診科室真實(shí)情況大體一致,證明了關(guān)聯(lián)規(guī)則挖掘在門診合理用藥分析中的有效性。這些結(jié)論為藥事管理部門分析門診用藥合理性提供了重要的依據(jù),得到藥事管理部門的認(rèn)可與好評(píng)。隨著數(shù)據(jù)庫、人工智能等新技術(shù)的發(fā)展,在數(shù)據(jù)挖掘技術(shù)應(yīng)用于醫(yī)學(xué)領(lǐng)域必會(huì)有很多知識(shí)發(fā)現(xiàn)[8],本文只是提供了一個(gè)用數(shù)據(jù)挖掘來指導(dǎo)門診用藥合理性分析的一種方法,下一步將嘗試其他合理用藥的分析研究,以后還會(huì)進(jìn)一步嘗試將關(guān)聯(lián)規(guī)則的挖掘方法應(yīng)藥理分析、抗菌素等其他合理用藥分析中。

[1]崔園.數(shù)據(jù)挖掘在中文病歷分類中的應(yīng)用[J].計(jì)算機(jī)與數(shù)字工程,2011,(3):160-163.

[2]秦莉花,陳曉陽.基于數(shù)據(jù)挖掘的絕經(jīng)綜合征焦慮、抑郁的相關(guān)因素研究分析[J].時(shí)珍國醫(yī)國藥,2013,24(6):1431-1432.

[3]于紅艷.許成剛關(guān)聯(lián)挖掘技術(shù)在中藥藥性及其他屬性間關(guān)系的應(yīng)用研究[J].中國實(shí)驗(yàn)方劑學(xué)雜志,2013,19(14):343-346.

[4]Rakesh Agrawal,Tomasz Imielinski,Arun Swami.Data Mining:Medical and Engineering Case Studies[A].Proceedings of thd ILE Research 2000 conference[C].Cleveland, OH,May 2000:1-7.

[5]翟愛珍,莊人戈.計(jì)算機(jī)輔助醫(yī)學(xué)診斷系統(tǒng)的數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)研究[J].國外醫(yī)學(xué)生物醫(yī)學(xué)工程分冊(cè),2002, 25 (3):97-103.

[6]蔣儀,陳輝,管曉福,等.淺談抗菌藥物信息系統(tǒng)建設(shè)[J].中國醫(yī)療設(shè)備,2013,28(10)64-66.

[7]A kusiak,KH Kernstine,JA kern,et al.Database mining:A Performance Perspecetive[J].IEEE Transactions.on Knowledge and Data Engineering,1993,Vol.5:914-925.

[8]童元元,霍剛.數(shù)據(jù)挖掘技術(shù)在中藥研究中的應(yīng)用進(jìn)展[J].中華中醫(yī)藥學(xué)刊,2010,(5):1067-1069.

猜你喜歡
數(shù)據(jù)挖掘關(guān)聯(lián)門診
門診支付之變
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
奇趣搭配
智趣
漢字小門診系列(四)
漢字小門診系列(九)
漢字小門診系列(八)