引言:在這個(gè)信息技術(shù)飛速發(fā)展的時(shí)代,與信息技術(shù)相關(guān)的采集應(yīng)用技術(shù)也被帶動著得到了飛速的發(fā)展,為了更好地適應(yīng)信息技術(shù)的飛速發(fā)展,數(shù)據(jù)挖掘誕生了。下面就簡單的介紹一下數(shù)據(jù)挖掘的含義,并通過殊絕挖掘的方法在生物學(xué)數(shù)據(jù)分析上應(yīng)用的案例,總結(jié)了數(shù)據(jù)挖掘和生物學(xué)數(shù)據(jù)分析之間的聯(lián)系。然后結(jié)合中國數(shù)據(jù)挖掘的在醫(yī)學(xué)數(shù)據(jù)分析應(yīng)用的現(xiàn)狀,對今后數(shù)據(jù)挖掘在醫(yī)學(xué)數(shù)據(jù)分析上的發(fā)展做出了預(yù)測。
前言:
為了提高醫(yī)學(xué)上的工作效率,慢慢的引入了計(jì)算機(jī),到目前為止,計(jì)算機(jī)已經(jīng)在醫(yī)學(xué)中得到了廣泛的應(yīng)用。醫(yī)學(xué)上為了對醫(yī)學(xué)數(shù)據(jù)分析系統(tǒng)化,理論化。也慢慢的出現(xiàn)了一個(gè)新的系統(tǒng),醫(yī)學(xué)信息系統(tǒng)。這個(gè)醫(yī)學(xué)信息系統(tǒng)大大的促進(jìn)了醫(yī)學(xué)數(shù)據(jù)的數(shù)字化程度,為以后的醫(yī)學(xué)數(shù)據(jù)分析帶了極大地方便。但是與此同時(shí)也帶了麻煩,要知道醫(yī)學(xué)數(shù)據(jù)是非常龐大的,要想提高辦事效率,就必須在短時(shí)間內(nèi)得到與這些數(shù)據(jù)相關(guān)的有價(jià)值的信息。因此我們把數(shù)據(jù)挖掘應(yīng)用到了醫(yī)學(xué)數(shù)據(jù)分析上,讓醫(yī)生能在短時(shí)間在龐大的醫(yī)學(xué)信息系統(tǒng)中獲得最有價(jià)值的信息對醫(yī)學(xué)數(shù)據(jù)作出分析,這樣不但提高了醫(yī)生的工作效率,而且還讓醫(yī)生的判斷更加準(zhǔn)確。所以說數(shù)據(jù)挖掘在醫(yī)學(xué)數(shù)據(jù)分析中的應(yīng)用是十分重要的。
一、 數(shù)據(jù)挖掘的概念和基本操作流程
數(shù)據(jù)挖掘技術(shù)是一項(xiàng)全新的技術(shù),它是近年來數(shù)據(jù)庫技術(shù)和人工智能技術(shù)飛速發(fā)展的產(chǎn)物。數(shù)據(jù)挖掘是幫助人們從數(shù)量龐大的,不健全的,亂七八糟的數(shù)據(jù)中找到人們需要的,能夠?qū)θ藗儺a(chǎn)生價(jià)值的信息。因此數(shù)據(jù)挖掘存在隱蔽性,所有我們也可以說,數(shù)據(jù)挖掘也是一個(gè)潛在有價(jià)值信息的過程。數(shù)據(jù)挖掘它具備了自動化的優(yōu)點(diǎn),它能根絕人們的需要自動的對人們的需求進(jìn)行分析和總結(jié),然后幫助決策者做出合理的決定。
它的基本過程:數(shù)據(jù)挖掘一般可以氛圍三個(gè)階段。數(shù)據(jù)的集成,數(shù)據(jù)的選擇和數(shù)據(jù)的轉(zhuǎn)換可以劃分為一個(gè)部分,成為數(shù)據(jù)預(yù)處理階段,數(shù)據(jù)的預(yù)處理階段的效果將直接影響著數(shù)據(jù)挖掘質(zhì)量的好壞。模式的發(fā)現(xiàn)是中間階段,是運(yùn)用數(shù)據(jù)挖掘算法從數(shù)據(jù)庫中提取有效模式的階段,最后一個(gè)階段是后續(xù)處理階段,它包括了模式的評估和知識的表示兩個(gè)部分,后續(xù)處理階段通過已經(jīng)制定好的標(biāo)準(zhǔn)識別出有用的知識。
二、 醫(yī)學(xué)數(shù)據(jù)的特點(diǎn)
根絕醫(yī)學(xué)信息系統(tǒng)數(shù)據(jù)自身的局限性,我們可以對醫(yī)學(xué)數(shù)據(jù)的特點(diǎn)作出以下總結(jié):
(一) 隱私性
因?yàn)獒t(yī)學(xué)自身的局限性,導(dǎo)致了臨床上產(chǎn)生的醫(yī)學(xué)數(shù)據(jù)有的會牽扯到病人的隱私,如果這些隱私不經(jīng)過患者的允許被公眾了,就會在一定程度上對患者造成侵?jǐn)_。這就要求數(shù)據(jù)挖掘者在工作的時(shí)候一定要保護(hù)好醫(yī)學(xué)數(shù)據(jù)的安全性和機(jī)密性。
(二) 多態(tài)性
醫(yī)學(xué)數(shù)據(jù)包含的東西很多,但不僅僅是文字,圖像,其中會有很多的聲音,信號等,這是其他信息所不具有的,醫(yī)學(xué)信息的多屬性模式給數(shù)據(jù)挖掘帶了很大的麻煩。
(三) 不全面性
因?yàn)樵卺t(yī)學(xué)上疾病多種多樣,再加上案例的局限性就讓醫(yī)學(xué)信息系統(tǒng)不能全部的反應(yīng)出任何一種病的信息。同時(shí)再加上記錄本身的局限性,很多醫(yī)學(xué)數(shù)據(jù)不能得到很好地記錄,所以導(dǎo)致了醫(yī)學(xué)信息的不全面性。
(四) 時(shí)域性
醫(yī)學(xué)數(shù)據(jù)中存在很多的時(shí)間函數(shù),有的是延遲,有的是提前,有的是波形的時(shí)間函數(shù)。同時(shí),還有一些靜態(tài)的數(shù)據(jù),盡管這些靜態(tài)的記錄不具有時(shí)序性,但是這部分醫(yī)療記錄在記錄的時(shí)候一定要詳細(xì)到某一時(shí)刻。
(五) 重復(fù)性
正如我們前面所提到的,醫(yī)學(xué)數(shù)據(jù)的數(shù)量是龐大的,它具有相似性,不同的疾病有時(shí)候會采用相同的醫(yī)療手段,這樣就會有很多的相同的醫(yī)學(xué)數(shù)據(jù)被記錄到醫(yī)學(xué)信息系統(tǒng)中,這樣會給以后數(shù)據(jù)的查找?guī)聿槐恪?/p>
三、 數(shù)據(jù)挖掘在醫(yī)學(xué)數(shù)據(jù)分析應(yīng)用的舉例
(一) 醫(yī)學(xué)圖像處理上
在疾病診斷的工具中,有很多方法,數(shù)據(jù)挖掘就是其中應(yīng)用比較廣泛方法之一。也是數(shù)據(jù)挖掘在醫(yī)學(xué)數(shù)據(jù)處理應(yīng)用最重要的一個(gè)方面。數(shù)據(jù)挖掘在醫(yī)學(xué)圖像上的應(yīng)用主要是從圖像上發(fā)現(xiàn)之間的關(guān)聯(lián),變化,然后總結(jié)出規(guī)律。提高醫(yī)生的決策效率,同時(shí)也提高決策的準(zhǔn)確度。
在數(shù)據(jù)挖掘算法中,應(yīng)用最廣的就是決策樹算法,它是一種歸納推理算法,它通過逼近離散值函數(shù)來對噪聲數(shù)據(jù)處理然后分析出表達(dá)式的方法來實(shí)現(xiàn)的。在這種方法中,表達(dá)式被稱為決策樹,也正是如此才被叫做決策樹算法的。
下面我們就談一下決策樹算法的特點(diǎn):一方面,種方法便于理解,因?yàn)閺氖陆虅?wù)處管理的老師并不了解數(shù)據(jù)挖掘相關(guān)的知識,而決策樹算法非常形象的通過樹形結(jié)構(gòu)表示最后的分類結(jié)果。它符合人們認(rèn)識事物的一般規(guī)律;一方面決策樹算法的計(jì)算量小,復(fù)雜程度小,這樣就能提高工作人員的效率嗎,能在短時(shí)間內(nèi)解決更多的問題;最后一方面,決策樹算法能夠主次分明的表達(dá)出重點(diǎn),屬性的重要程度能被一眼看出來。
(二) 在輔助醫(yī)療上
醫(yī)學(xué)診斷是一個(gè)復(fù)雜的過程,它需要按照一定的程序進(jìn)行。醫(yī)生通過多種途徑搜集和待診斷疾病的相關(guān)知識,然后構(gòu)建診斷網(wǎng)絡(luò),而這些病例數(shù)據(jù)被存放在醫(yī)學(xué)信息系統(tǒng)中,所以從醫(yī)學(xué)信息系統(tǒng)中提出有價(jià)值的診斷規(guī)則成為了現(xiàn)階段研究的重點(diǎn)。在數(shù)據(jù)挖掘技術(shù)的幫助下,通過數(shù)據(jù)挖掘中的正常訓(xùn)練集模型所篩選出有價(jià)值的診斷規(guī)則。獲得有效的知識。
(三) 其他方面
數(shù)據(jù)挖掘在醫(yī)學(xué)數(shù)據(jù)的處理上應(yīng)用廣泛,上面我們僅僅介紹了應(yīng)用的幾點(diǎn),沒介紹的也很多。比如在醫(yī)療政策數(shù)據(jù)方面上,在醫(yī)療保健數(shù)據(jù)方面上,在醫(yī)療資源數(shù)據(jù)方面上,在新藥品和新毒品的數(shù)據(jù)方面上等等都有很廣泛的應(yīng)用。
結(jié)語
雖然數(shù)據(jù)挖掘早醫(yī)療數(shù)據(jù)分析上已經(jīng)得到了很廣泛的應(yīng)用,但是在多年的應(yīng)用中逐漸出現(xiàn)了這樣或那樣的問題,影響著數(shù)據(jù)挖掘在醫(yī)療數(shù)據(jù)分析上的再突破和再發(fā)展。所有說,數(shù)據(jù)挖掘在醫(yī)學(xué)數(shù)據(jù)分析上還具有很大的發(fā)展空間,這就要求我們隨著醫(yī)學(xué)理論的健全和發(fā)展,不斷地對數(shù)據(jù)挖掘在醫(yī)學(xué)數(shù)據(jù)分析應(yīng)用上進(jìn)行創(chuàng)新,進(jìn)一步的實(shí)踐探索,經(jīng)過我們的努力,相信數(shù)據(jù)挖掘?qū)诩膊〉脑\斷治療醫(yī)學(xué)科研和教學(xué)中產(chǎn)生巨大的效益。
參考文獻(xiàn)
[1]龔著琳,陳瑛,蘇懿,劉雅琴,徐立鈞.數(shù)據(jù)挖掘在生物醫(yī)學(xué)數(shù)據(jù)分析中的應(yīng)用[J].上海交通大學(xué)學(xué)報(bào)(醫(yī)學(xué)版).2011(11).
[2]朱遠(yuǎn)平,陳偉,李建彬,陳劍鴻,許樹欣,魯春元.構(gòu)建web服務(wù)的醫(yī)學(xué)數(shù)據(jù)挖掘演示系統(tǒng)[J].數(shù)理醫(yī)藥學(xué)雜志.2012(04).
[3]唐佑萍,卓綺雯,葉靄瑩,王亞娜.基于醫(yī)院信息系統(tǒng)實(shí)施數(shù)據(jù)挖掘[J].醫(yī)學(xué)信息學(xué)雜志.2013(09).
(作者單位:長沙醫(yī)學(xué)院)
作者簡介:李紅艷,女,出生于1984年1月,籍貫湖南省衡陽市,就職于長沙醫(yī)學(xué)院,講師