李宏楨
摘要:醫(yī)院信息系統(tǒng)積累的大數(shù)據(jù),有著很大的潛在價值。通過數(shù)據(jù)挖掘技術,對數(shù)據(jù)進行統(tǒng)計分析,可以得到很多有價值的信息,從而輔助醫(yī)院管理者進行決策。本文以我院的具體應用為例,介紹了數(shù)據(jù)挖掘技術在醫(yī)院管理信息系統(tǒng)中的應用。
關鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)分析;醫(yī)院管理信息系統(tǒng)
中圖分類號:TP391 文獻標識碼:A 文章編號:1007-9416(2017)09-0228-02
醫(yī)院信息系統(tǒng)產(chǎn)生了大量數(shù)據(jù),這些數(shù)據(jù)包含了很多對醫(yī)院生存和發(fā)展有價值的信息。面對醫(yī)院信息系統(tǒng)的大數(shù)據(jù),普通的檢索方法已經(jīng)不能進行有效的處理。數(shù)據(jù)挖掘技術,是針對大數(shù)據(jù)進行統(tǒng)計分析的有效工具。使用數(shù)據(jù)挖掘技術,可以對大數(shù)據(jù)進行統(tǒng)計分析,從中發(fā)現(xiàn)有價值的信息,從而輔助管理者提升醫(yī)院管理水平,提高醫(yī)療質(zhì)量,促進醫(yī)院的健康發(fā)展。
1 醫(yī)院信息系統(tǒng)的現(xiàn)狀
醫(yī)院信息系統(tǒng)包含很多子系統(tǒng),產(chǎn)生了大量數(shù)據(jù)。各個子系統(tǒng)數(shù)據(jù)庫里有對醫(yī)院科研管理等工作有用的信息,也包含了很多對科研管理工作無用的信息。各個子系統(tǒng)彼此獨立,數(shù)據(jù)分別存放[1],如果不進行預處理,這些數(shù)據(jù)很難直接使用。
2 數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘是在大型數(shù)據(jù)存儲庫中,自動地發(fā)現(xiàn)先前未知的有用信息的過程,數(shù)據(jù)挖掘還可以預測未來,觀測結果[2]。數(shù)據(jù)挖掘是數(shù)據(jù)庫中知識發(fā)現(xiàn)不可缺少的一部分,而知識發(fā)現(xiàn)是指從大量的不完全的、有噪聲的,模糊的數(shù)據(jù)中提取隱含的,未知的,有潛在應用價值的信息的整個過程(圖1數(shù)據(jù)庫中知識發(fā)現(xiàn)過程)。
3 使用數(shù)據(jù)挖掘技術建立我院管理信息系統(tǒng)
我院信息系統(tǒng)積累的住院患者信息已超過30萬人次,系統(tǒng)數(shù)據(jù)已超過10T。為了充分挖掘這些數(shù)據(jù)的潛在價值,我使用數(shù)據(jù)挖掘技術,開發(fā)了醫(yī)院管理信息系統(tǒng)數(shù)據(jù)平臺,重點對患者的疾病診斷與地區(qū)、年齡、性別、職業(yè)的關系進行分析,分析結果供各個部門使用。
具體方法是:先從各個子系統(tǒng)中把出院患者的詳細信息抽取出來,包括:性別、年齡、職業(yè)、家庭地址、入院首程、出院診斷等信息。然后根據(jù)出院診斷分別按性別,年齡,職業(yè),地址等口徑進行統(tǒng)計分析,從而得到疾病的分布規(guī)律(圖2出院患者資料采集)。
4 數(shù)據(jù)挖掘技術在我院的應用效果
我院的管理信息系統(tǒng)數(shù)據(jù)平臺的主要用戶有客服部、市場部、臨床科室主任等。他們通過該系統(tǒng),可以分析出不同的疾病在我市的分布規(guī)律,有針對性地進行課題研究和市場開拓。
例如:通過該系統(tǒng)分析,可以看到高港區(qū)是我市食道癌高發(fā)區(qū),主要人群為61-70歲的男性農(nóng)民。根據(jù)分析結果,市場部定期到高港區(qū)組織當?shù)剞r(nóng)民參加醫(yī)學知識講座,增加患者對我院醫(yī)療技術的了解;相關科室通過加強與當?shù)蒯t(yī)院的感情聯(lián)絡,有效增加了食道癌患者往我院的轉診。從而為醫(yī)院開拓了市場,增加了醫(yī)院業(yè)務收入。
5 數(shù)據(jù)挖掘技術在使用過程中遇到的問題及解決辦法
5.1 問題主要有
(1)樣本總數(shù)不足的問題。有些疾病的樣本總數(shù)太少,統(tǒng)計結果沒有意義。
(2)醫(yī)院內(nèi)部數(shù)據(jù)及患者隱私保密的問題。管理信息系統(tǒng)數(shù)據(jù)平臺需要調(diào)取患者的病歷數(shù)據(jù),如果數(shù)據(jù)泄漏,可能要承擔法律責任。
5.2 解決辦法
(1)增加樣本空間。擴大采集數(shù)據(jù)的時間范圍(一般在1年以上),提高樣本總數(shù)。對于樣本總數(shù)少的,明確告知數(shù)據(jù)使用者樣本總量,分析結果僅供參考。
(2)制訂數(shù)據(jù)管理制度,嚴格進行操作和授權管理,對一些隱私信息進行屏蔽處理。
6 結語
通過應用數(shù)據(jù)挖掘技術,可以有效挖掘醫(yī)院信息系統(tǒng)保存的數(shù)據(jù)的潛在價值,發(fā)現(xiàn)其中包含的有用信息,從而為醫(yī)院的科研、管理、業(yè)務拓展等工作提供有力的支持。
參考文獻
[1]董建成.我國醫(yī)院信息系統(tǒng)現(xiàn)狀及原因分析[J].中華醫(yī)院管理雜志,2003,(4):228.
[2](美)Pang-NingTan,MichaelSteinbach,VipinKumar著,范明,范宏建譯.數(shù)據(jù)挖掘?qū)д摚和暾妫ǖ?版)[M].人民郵電出版社,2010:18.endprint