劉妍
摘 要 本文簡單介紹了數(shù)據(jù)挖掘技術,分析了數(shù)據(jù)挖掘技在醫(yī)學信息領域的重要意義,闡明醫(yī)學數(shù)據(jù)挖掘的主要應用,并對數(shù)據(jù)挖掘技術在醫(yī)療管理、疾病診斷和醫(yī)學科研方面的具體應用進行了分析研究,肯定了數(shù)據(jù)挖掘技術在醫(yī)學信息領域的價值和廣闊的應用前景。
關鍵詞 數(shù)據(jù)挖掘技術;醫(yī)學信息;醫(yī)學應用
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2016)172-0132-01
數(shù)據(jù)挖掘技術自20世紀90年代開始興起,隨著信息時代的到來,數(shù)據(jù)挖掘技術受到越來越多的關注。數(shù)據(jù)挖掘技術在眾多不同領域正發(fā)揮著重要作用,和其他領域一樣,數(shù)據(jù)挖掘技術在醫(yī)學信息領域也具有廣泛應用。數(shù)據(jù)挖掘技術有助于醫(yī)院管理者做出民智決策、醫(yī)生做出正確診斷、醫(yī)學研究者做出有效分析和預測。
1 數(shù)據(jù)挖掘技術
數(shù)據(jù)挖掘(Data mining)是指從大型數(shù)據(jù)中通過算法發(fā)現(xiàn)或提取有意義、有潛在價值、新穎的信息與規(guī)律等知識。Shapiro在1989年8月舉行的第11屆國際聯(lián)合人工智能學術會議上,首次提出數(shù)據(jù)庫中知識發(fā)現(xiàn)一詞——數(shù)據(jù)挖掘技術。隨后,很快吸引了大量數(shù)據(jù)庫工作者轉向數(shù)據(jù)挖掘的研究。
經(jīng)歷了20余年的發(fā)展,數(shù)據(jù)挖掘的算法日趨成熟,融合了模式識別、數(shù)字圖像處理、數(shù)據(jù)庫技術、信息檢索、數(shù)理統(tǒng)計等眾多技術。數(shù)據(jù)挖掘是一個復雜的過程,它是由多個流程組成的,隨不同領域的應用這些流程會有所變化,一般的流程為問題定義、數(shù)據(jù)準備、數(shù)據(jù)轉換、數(shù)據(jù)挖掘、結果評估、知識的發(fā)現(xiàn)和應用。這些流程的順序并不是線性的,而且為了取得好的數(shù)據(jù)挖掘結果常常需要反復。數(shù)據(jù)挖掘的方法主要有概念描述、關聯(lián)分析、分類、聚類分析、異常檢測等。
2 數(shù)據(jù)挖掘在醫(yī)學信息領域的重要意義
醫(yī)學信息的形式多樣,包括文字、圖像、聲音、視頻等形式,它涵蓋了生物信息學、藥物信息學、醫(yī)學圖形信息學等學科,同時,具有隱私性、冗余性、不完整性、模糊性且?guī)в性肼暤忍攸c。數(shù)據(jù)挖掘作為一種數(shù)據(jù)處理技術,從醫(yī)學數(shù)據(jù)信息中尋找潛在的關系或規(guī)律,從而獲得有效的對病人進行診斷、治療,增加對疾病的預測準確性,實現(xiàn)疾病的早期發(fā)現(xiàn),提高治愈率,為醫(yī)學信息領域提供了新的方法[ 1 ]。
1)醫(yī)學數(shù)據(jù)挖掘技術有助于提高數(shù)據(jù)分析效率,增加產(chǎn)生新知識的速度。醫(yī)學數(shù)據(jù)庫是一個龐大的信息庫,有海量的數(shù)據(jù),而且數(shù)據(jù)的形式多樣,要在這樣的數(shù)據(jù)信息中找到有價值的信息,采用傳統(tǒng)的方法需要花費更多的時間。利用數(shù)據(jù)挖掘技術,可以分析數(shù)據(jù)的趨勢變化和規(guī)律,減少數(shù)據(jù)冗余和重復性的影響,減少數(shù)據(jù)量,選擇合適的算法制定規(guī)則還可以實現(xiàn)自動化分析。如數(shù)據(jù)挖掘技術分析電子病歷中分散、非結構化數(shù)據(jù),進行自動化的數(shù)據(jù)采集[ 2 ]。
2)醫(yī)學數(shù)據(jù)挖掘技術可以提供知識的準確性和可靠性,提高疾病的治愈率。日常醫(yī)療中通常采用抽樣的方法獲取樣本,結果導致往往只有一部分符合特定要求,存在樣本的局部性并影響真實性。數(shù)據(jù)挖掘技術從數(shù)據(jù)的整體性出發(fā),通過概率抽樣、評估、假設驗證等過程提取信息中的共性特征和個性差異,彌補了隨機對照實驗的不足。理論上還能夠根據(jù)病人的個體差異,給出個性化治療方案。如通過整合系統(tǒng)生物學與電子病歷數(shù)據(jù),醫(yī)學數(shù)據(jù)挖掘技術為個性化醫(yī)療計劃轉變?yōu)榕R床實踐提供機會。
3)醫(yī)學數(shù)據(jù)挖掘技術可以用于預測建模,輔助臨床診斷和推薦治療措施。大量的研究和大數(shù)據(jù)的到來,使得大部分臨床醫(yī)生的知識轉化變得非常困難,難以跟上最新的知識來指導臨床診斷。數(shù)據(jù)挖掘預測建模,根據(jù)特定信息對離散數(shù)據(jù)進行預測。谷歌公司利用人們在網(wǎng)上檢索的與流感相關的記錄建立了數(shù)學模型,成功的預測流感傳播和發(fā)生的地點。又如癌癥早期診斷中,利用數(shù)據(jù)挖掘技術對癌癥患者做出診斷和提出治療方案。
3 數(shù)據(jù)挖掘在醫(yī)學信息領域的應用
醫(yī)學信息與數(shù)據(jù)挖掘都是快速發(fā)展的前沿研究,復雜多變的需求分析及醫(yī)學信息數(shù)據(jù)的特點,使醫(yī)學信息的數(shù)據(jù)分析迫切需要數(shù)據(jù)挖掘技術的支持。醫(yī)學信息中的很多內(nèi)容,如在醫(yī)療管理、疾病診斷和醫(yī)學科研方面,都在數(shù)據(jù)庫技術中找到了支持。
1)醫(yī)療管理。目前,隨著數(shù)字化的普及,很多醫(yī)院都建立了龐大的數(shù)據(jù)庫,目前主要有醫(yī)院信息系統(tǒng)(hospital information system,HIS),它分為管理信息系統(tǒng)和臨床信息系統(tǒng),管理信息系統(tǒng)主要處理諸如人事、財務和設備管理等醫(yī)院內(nèi)部管理方面的信息,臨床信息系統(tǒng)主要處理患者相關信息。從數(shù)據(jù)庫中運用數(shù)據(jù)挖掘技術,來分析和發(fā)現(xiàn)數(shù)據(jù)的各種信息,可以幫助醫(yī)院決策者更好的制定管理策略[3]。按照數(shù)據(jù)挖掘的需求,進行關聯(lián)分析、分類分析、聚類分析等挖掘算法,可進行醫(yī)院費用分析、醫(yī)療質(zhì)量管理、醫(yī)用耗材管理、住院患者人群分類等。
2)疾病診斷。面對日益龐大的病案數(shù)據(jù),僅依靠臨床經(jīng)驗,容易出現(xiàn)診斷錯誤,針對臨床數(shù)據(jù)庫、醫(yī)學圖像等,數(shù)據(jù)庫挖掘技術也發(fā)揮著重要的作用。
決策樹算法幫助醫(yī)生從大量數(shù)據(jù)中尋找規(guī)律,提高準確率。應用聚類算法、關聯(lián)規(guī)則等還可以進行疾病診斷因素和疾病關聯(lián)等方面的分析,如實現(xiàn)癌癥的早期診斷和預防等。
醫(yī)學圖像隨著醫(yī)療設備的發(fā)展,種類都越來越多,醫(yī)學圖像中蘊含這豐富的圖像特征和規(guī)則信息,使用決策樹、神經(jīng)網(wǎng)絡和關聯(lián)規(guī)則等數(shù)據(jù)挖掘算法,可以輔助醫(yī)生對病變區(qū)域進行分析,提高醫(yī)學診斷的準確性和正確性。
3)醫(yī)學科研。基因研究:數(shù)據(jù)挖掘技術與傳統(tǒng)的統(tǒng)計分析,在數(shù)據(jù)分析的效率上有明顯的優(yōu)勢。利用關聯(lián)規(guī)則、聚類分析等有助于發(fā)現(xiàn)一組序列的差異及相似性,闡明多個序列間的關系,確定基因種類。
蛋白質(zhì)結構預測:許多國家組建了蛋白質(zhì)結構和功能數(shù)據(jù)庫,為科研工作這提供豐富信息的同時,由于數(shù)據(jù)分散、存儲媒介多、數(shù)據(jù)冗余等復雜性,使用數(shù)據(jù)庫技術進行數(shù)據(jù)清理,追蹤蛋白質(zhì)數(shù)據(jù)序列,為蛋白質(zhì)結構預測提供便利。
藥物發(fā)現(xiàn)及設計:數(shù)據(jù)挖掘技術有助于增加新藥發(fā)現(xiàn)和設計中的主動性并避免盲目性。利用數(shù)據(jù)挖掘技術對從龐大的化合物數(shù)據(jù)庫中發(fā)現(xiàn)藥物靶分子,對藥物進行篩選、藥物毒理學、藥物副作用分析,從而降低藥物開發(fā)的時間和成本[4]。
4 結論
醫(yī)療信息的數(shù)字化發(fā)展和醫(yī)學研究工作者對高校處理和分析大數(shù)據(jù)的渴望為數(shù)據(jù)挖掘提供了廣闊的研究空間,也顯示了數(shù)據(jù)挖掘在醫(yī)學信息領域的發(fā)展?jié)摿?。利用?shù)據(jù)挖掘技術,將幫助醫(yī)療管理、臨床疾病診斷和醫(yī)學科研等。相信在不久的將來,數(shù)據(jù)挖掘在醫(yī)學信息領域將取得突破性進展。
參考文獻
[1]石曉敬.數(shù)據(jù)挖掘及其在醫(yī)學信息中的應用[J].醫(yī)學信息學雜志,2013(34):2-6.
[2]秦文哲,陳進,董力.大數(shù)據(jù)背景下醫(yī)學數(shù)據(jù)挖掘的研究進展及應用[J].中國胸心血管外科臨床雜志,2016(1):55-60.
[3]陳郁韓.數(shù)據(jù)挖掘技術在醫(yī)院管理中的應用.中國醫(yī)學裝備,2014(1):62-65.
[4]楊春華,李春華,王桂枝,等.數(shù)據(jù)挖掘技術在藥物研究與發(fā)現(xiàn)中的應用[J].醫(yī)藥導報,2005,24(12):1143-1145.