国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于醫(yī)療數(shù)據(jù)的挖掘算法研究與應用

2021-04-04 08:35郭志豪
信息記錄材料 2021年9期
關鍵詞:數(shù)據(jù)挖掘關聯(lián)數(shù)據(jù)庫

郭志豪

(蘭州城市學院 甘肅 蘭州 730000)

1 引言

為更好地推進我國醫(yī)療衛(wèi)生事業(yè)的發(fā)展和進步,國家衛(wèi)健委在2015年通過了醫(yī)院監(jiān)管系統(tǒng)建設方案,其對于我國各個醫(yī)院數(shù)據(jù)采集工具的使用做出了明確說明,要求對各項數(shù)據(jù)的應用必須要規(guī)范化、科學化和合理化。醫(yī)療數(shù)據(jù)統(tǒng)一上傳,集中管理,可以幫助患者更加便捷地查詢自身就醫(yī)信息,醫(yī)務工作人員對于患者的就醫(yī)以及病史等也有了更加深入的了解和認識,其是醫(yī)療衛(wèi)生事業(yè)進步的重要表現(xiàn)。但實際上,我國建設方案雖然出臺已久,但是實際應用的質量效果卻不盡如人意,醫(yī)療領域的信息化程度沒有跟上互聯(lián)網(wǎng)發(fā)展的步伐,尤其是在一些縣鎮(zhèn)醫(yī)院,其實施效果比較差,這對于我國醫(yī)療衛(wèi)生的進步實際上產(chǎn)生極為不利的影響。為此,本文嘗試對醫(yī)療大數(shù)據(jù)中數(shù)據(jù)挖掘技術進行研究和分析,希望能夠更好地發(fā)揮相關技術的作用優(yōu)勢,推進各項工作朝著更好的方向發(fā)展[1]。

2 數(shù)據(jù)挖掘技術概述

在當前的信息化背景下,科學技術、醫(yī)療服務領域產(chǎn)生的信息呈爆炸式增長,這些信息中的一些數(shù)據(jù)十分關鍵,具備較高的分析價值。將這些數(shù)據(jù)轉化為容易被人們接受的圖表,一方面可以方便醫(yī)療工作人員的日常工作,同時也可以推動醫(yī)療大數(shù)據(jù)挖掘的進步[2]。所謂的數(shù)據(jù)挖掘,主要是指從海量的信息中挖掘出具備價值的信息,涉及機器學習、人工智能、統(tǒng)計分析和模式分類等不同學科的知識[3]。一般情況下,數(shù)據(jù)挖掘主要分成如下3個階段。

(1)數(shù)據(jù)準備。數(shù)據(jù)準備階段需要剔除干擾數(shù)據(jù),主要圍繞數(shù)據(jù)的清理、集成和選擇幾方面展開工作。將數(shù)據(jù)挖掘的基礎性數(shù)據(jù)形成一個數(shù)據(jù)庫,然后再對其降噪,最后再從數(shù)據(jù)庫中找到有用的信息;(2)發(fā)現(xiàn)規(guī)律。該階段主要是指通過運用各種算法來分析數(shù)據(jù)庫,并且發(fā)現(xiàn)有效信息,是整個數(shù)據(jù)挖掘中十分重要的環(huán)節(jié),該環(huán)節(jié)主要是對最終的決策提供必要的支持;(3)表現(xiàn)規(guī)律。該階段是在發(fā)現(xiàn)了數(shù)據(jù)的規(guī)律以后,利用可視化的工具將其展示出來,便于醫(yī)療人員的研判。

3 醫(yī)療大數(shù)據(jù)中的數(shù)據(jù)挖掘應用分析

為充分地發(fā)揮出數(shù)據(jù)的作用,需要對醫(yī)療大數(shù)據(jù)進行深度挖掘,并詳細整理、分析看似雜亂的數(shù)據(jù),找到其中蘊含的價值信息,從而方便臨床護理、醫(yī)學研究和疾病治療等方面的研究。對于患者來說,也可通過全面分析醫(yī)療大數(shù)據(jù)的相關信息,使其享受到更加高效精準的服務,免去一些不必要的檢查,避免醫(yī)療資源的浪費。醫(yī)學領域的研究也可通過深度挖掘醫(yī)療大數(shù)據(jù)為疾病的診斷和藥物的研發(fā)提供強大的支持,攻克很多過去無法解決的醫(yī)學難題??v觀整個醫(yī)療領域,挖掘分析醫(yī)療大數(shù)據(jù)可在醫(yī)療成本評估和醫(yī)療質量管理兩方面起到一定的作用。

在以上兩方面的應用過程中,主要是通過對于醫(yī)療大數(shù)據(jù)信息進行深度挖掘來密切監(jiān)測廣大群眾的健康狀況,并從中分辨出一些疾病的高發(fā)人群,從而精準預測一些流行病或區(qū)域性疾病的發(fā)展走向,從而為公共衛(wèi)生政策的制定提供一定的支持。數(shù)據(jù)挖掘技術是合理分析醫(yī)療大數(shù)據(jù)的關鍵,隨著深度學習技術的不斷進步,數(shù)據(jù)挖掘領域也得到了前所未有的發(fā)展,主要包括關聯(lián)規(guī)則挖掘、異常挖掘等,這些算法是醫(yī)療數(shù)據(jù)應用的基礎,同時在上述算法的基礎上也衍生出了其他拓展算法,下面分別說明。

3.1 關聯(lián)規(guī)則算法分析

關聯(lián)規(guī)則發(fā)掘技術主要是通過分析不同實驗,然后對其中有一定依賴或關聯(lián)的信息進行收集和分析,在數(shù)據(jù)挖掘技術中屬于關鍵性問題。關聯(lián)規(guī)則挖掘這一研究方向一經(jīng)提出,在國際上得到了學者的廣泛關注,通過這些年的不斷發(fā)展也推出了很多關聯(lián)規(guī)則的挖掘算法,典型的有Apriori算法。該算法是關聯(lián)規(guī)則挖掘算法中第一個被成熟應用的算法。在醫(yī)療行業(yè)的運行過程中,每天都會產(chǎn)生海量的數(shù)據(jù)信息,而這些信息之間看似雜亂無章,但實際的內在聯(lián)系十分密切,通過關聯(lián)規(guī)則挖掘算法的統(tǒng)計分析,可提取其中有關聯(lián)的知識,從而對致病因素、疾病診療及公共衛(wèi)生健康監(jiān)測等工作提供一定的幫助。

例如,通過海量的電子病歷信息,可以發(fā)掘心血管病死亡情況和傳統(tǒng)危險元素之間的關聯(lián)規(guī)則,然后通過分析這些數(shù)據(jù),還可以總結出心血管病死亡和體重超標之間的內在關系。又如,通過Apriori算法分析大量的女性乳腺疾病方面的數(shù)據(jù),可以建立乳腺癌和其他屬性之間的關聯(lián)規(guī)則。很多醫(yī)學科研工作需要分析病因,如一些新出現(xiàn)的并發(fā)癥是不是由另一種并發(fā)癥誘發(fā)而來的,這就需要數(shù)據(jù)挖掘技術中的關聯(lián)算法從大量的隨機個例中找尋內在的關聯(lián)。關聯(lián)算法的優(yōu)點主要在于在該算法下更容易識別內在的因果關系,如果在前后時間序列的互推中具有較高的置信度,則說明兩者之間存在著較為強烈的因果關系,否則為單方面映射或無映射。

3.2 分類挖掘算法分析

分類挖掘分析可通過分類算法將數(shù)據(jù)庫中的對象映射成某一個預設的類別,從而便于模型來計算和預測,進而實現(xiàn)對未知對象的類別歸類。上文中所提到的序列數(shù)據(jù)庫,主要是由一系列的數(shù)據(jù)對象構成,在這些數(shù)據(jù)對象中每一個單一對象都可以視為多種特性所構成的綜合輸入向量,且訓練樣本需要帶有多種類別標記。

現(xiàn)如今,對于不同數(shù)據(jù)類別的應用場合,已經(jīng)有多種多樣的分類挖掘模型,較為常見的有機器學習、神經(jīng)網(wǎng)絡、專家系統(tǒng)等方法。分類挖掘分析結合醫(yī)療行業(yè)來看及應用主要包括如下兩方面:首先,基于智能算法的疾病預測;其次,預測一些醫(yī)療事件。

在醫(yī)療服務中,大部分的疾病診斷都局限在經(jīng)驗性診斷上,但由于不同的病患存在著較大的個體差異,同時復合疾病也對經(jīng)驗性診斷帶來了一定程度的限制。所以,在具體的診斷過程中,對于一些疑難雜癥,醫(yī)生很難憑借現(xiàn)有的經(jīng)驗給出十分精確的判斷。但通過正確的搜集海量的診斷病例的信息,然后借助大數(shù)據(jù)分析工具,可以詳細地分析所有病例中的綜合癥狀,然后研究出疾病類型和病癥之間的內在聯(lián)系。在實際的臨床診斷過程中,通過分析患者所提供的基礎性信息,將其輸入到診斷系統(tǒng)中,就可給出較為精確的確診結論。國內目前有很多醫(yī)學專家和機器學習算法科研人員都通過醫(yī)療大數(shù)據(jù)的分類挖掘分析逐步構建起以預防早期慢性病為目的的防控體系。在新冠肺炎疫情的防控過程中,騰訊公司也聯(lián)合一些國內的醫(yī)療機構研發(fā)了一系列的智能診斷系統(tǒng),減輕醫(yī)療人員的壓力。

3.3 聚類算法分析

所謂的聚類分析主要是根據(jù)不同的規(guī)律按照個體屬性來分成不同的類別,其目的主要是為了縮小同類別下不同個體之間的距離。許多領域目前都廣泛應用了該技術,例如人工智能領域。聚類分析與分類學習相比,所分析的對象并沒有類別的標記,而是通過算法來自動確定,但由于訓練數(shù)據(jù)庫中對象的不同,其本質上有類別標記。近年來,聚類分析逐步成為大數(shù)據(jù)挖掘領域中較為前沿和熱門的研究領域,經(jīng)過學者們不斷分析研究,逐步開發(fā)了K均值聚類算法、BIRCH聚類算法等一系列的聚類分析模型,主要針對未知分布規(guī)律的數(shù)據(jù)展開挖掘,同時還可以挖掘具有代表性的事件集。

聚類分析算法被應用到醫(yī)療領域中的典型場景,主要有疾病的分布分析和醫(yī)療費用兩方面。過去的臨床科研研究對象一般以醫(yī)院的患者為主體,通過分析臨床指標和患者的基本變量展開研究。但一般情況下,性別和年齡存在差異的患者其醫(yī)學特征也并不相同,所以還要根據(jù)性別和年齡對病患展開分組,在分組過程中采用人工劃分的方法,例如以10年或5年為一個跨度,但這種分組難以客觀地反映出研究對象的年齡分布規(guī)律。而采用聚類分析算法,可以更加科學合理地換位研究對象的年齡和性別,并且對于不同性別和年齡組別下的患者,臨床指標也能展開深入的分析。

3.4 異常挖掘算法分析

數(shù)據(jù)庫建設過程中可能會遇到這樣或者那樣的問題,研究對象難以真實反映情況的現(xiàn)象也并不少見,之所以如此是因為研究對象與數(shù)據(jù)庫中的一般性樣本并不匹配,這些數(shù)據(jù)樣本通常被人們稱作離群點。為了保證數(shù)據(jù)挖掘技術應用的質量與效果,通常情況下,這些離群點可能會事先被當作異常數(shù)據(jù)處理掉,但在實際應用過程中,可能會發(fā)現(xiàn)這些異常數(shù)據(jù)反而更具有特點,如果進一步深入挖掘,可以挖掘出更加多元化的信息。在異常挖掘過程中,科研人員必須弄清楚如下兩方面的問題:(1)選擇何種挖掘算法作為確定異常點的挖掘方法;(2)在數(shù)據(jù)庫中何種特征的數(shù)據(jù)被劃分為異常數(shù)據(jù)。目前,較為成熟的異常挖掘分析算法,主要有基于距離的算法、基于偏差的算法及基于統(tǒng)計的算法。

例如,國內的有些學者就借助心電圖的歷史數(shù)據(jù)實施異常挖掘,在挖掘過程中主要采用了時間序列數(shù)據(jù),通過對數(shù)據(jù)進行挖掘,疾病診斷效果大幅度提升。同時,也可以針對醫(yī)療賬單中的數(shù)據(jù)進行挖掘,找到可能存在的醫(yī)保欺詐行為,該方法在控制醫(yī)療保險行業(yè)的欺詐行為中存在著十分明顯的效果。但值得注意的是,上述數(shù)據(jù)挖掘分析方法,在整個醫(yī)療大數(shù)據(jù)的應用過程中相對比較理論化,在應用過程中還要結合具體情況不斷調整使其適應醫(yī)院的實際形勢。

4 結語

綜上所述,當前醫(yī)療大數(shù)據(jù)中的數(shù)據(jù)挖掘技術,對于我國醫(yī)療衛(wèi)生事業(yè)的發(fā)展和進步有著較為積極促進作用,其可以為廣大人民群眾提供更好的治療效果,可以使醫(yī)療工作更具有針對性。但是不可否認的是,當前醫(yī)療大數(shù)據(jù)中的數(shù)據(jù)挖掘技術在具體應用中,還存在多方面的不足,而要想更好地發(fā)揮相關技術的優(yōu)勢作用,就需要正視其存在的缺點和不足,然后采取針對性措施予以優(yōu)化,以便更好地發(fā)揮大數(shù)據(jù)技術的作用與價值。

猜你喜歡
數(shù)據(jù)挖掘關聯(lián)數(shù)據(jù)庫
不懼于新,不困于形——一道函數(shù)“關聯(lián)”題的剖析與拓展
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
“一帶一路”遞進,關聯(lián)民生更緊
奇趣搭配
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
數(shù)據(jù)庫
智趣
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫