国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘的醫(yī)學(xué)影像檢索與分析

2016-02-09 06:28:54蔣友好高彩蘭
中國(guó)醫(yī)療器械雜志 2016年4期
關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù)粗糙集感興趣

蔣友好,喬 非,高彩蘭

1 同濟(jì)大學(xué)電子與信息工程學(xué)院控制科學(xué)與工程系,上海市,201804 2 上海市中醫(yī)藥大學(xué)附屬普陀醫(yī)院,上海市,200062

基于數(shù)據(jù)挖掘的醫(yī)學(xué)影像檢索與分析

【作者】蔣友好1,2,喬 非1,高彩蘭2

1 同濟(jì)大學(xué)電子與信息工程學(xué)院控制科學(xué)與工程系,上海市,201804 2 上海市中醫(yī)藥大學(xué)附屬普陀醫(yī)院,上海市,200062

通過(guò)了解數(shù)據(jù)挖掘的一些基本知識(shí),運(yùn)用關(guān)聯(lián)規(guī)則、粗糙集理論等用于醫(yī)學(xué)影像檢索并進(jìn)行分析。通過(guò)這些手段,從龐大的數(shù)據(jù)倉(cāng)庫(kù)中,挖掘更加精確、更為有用的數(shù)據(jù)并加以分析,為醫(yī)學(xué)影像的診斷提高可信度,以及為醫(yī)學(xué)影像檢索提供方便。

關(guān)聯(lián)規(guī)則;粗糙集理論;醫(yī)學(xué)影像

0 引言

醫(yī)學(xué)影像是醫(yī)院進(jìn)行病例分析的重要依據(jù)。通過(guò)采集醫(yī)院信息系統(tǒng),各類(lèi)影像數(shù)據(jù)可實(shí)現(xiàn)數(shù)字化存儲(chǔ),并可通過(guò)服務(wù)器訪(fǎng)問(wèn)、調(diào)用和處理。醫(yī)學(xué)影像數(shù)據(jù)的存儲(chǔ)量極為龐大,但是其用于病情分析的利用率還偏低。當(dāng)前對(duì)于跨院區(qū)、跨部門(mén)、跨系統(tǒng)的影像數(shù)據(jù)分析利用還比較困難,難以支持醫(yī)療和管理決策,因此急需對(duì)這些數(shù)據(jù)進(jìn)行整合并分析。

數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的且隨時(shí)間不斷變化的數(shù)據(jù)集合。醫(yī)學(xué)影像數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)倉(cāng)庫(kù)技術(shù)面向醫(yī)學(xué)領(lǐng)域數(shù)據(jù)的具體表現(xiàn)之一。與其他數(shù)據(jù)倉(cāng)庫(kù)相比,醫(yī)學(xué)影像數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)來(lái)源、數(shù)據(jù)類(lèi)型和數(shù)據(jù)特征都有其不確定性之處。建立醫(yī)學(xué)數(shù)據(jù)倉(cāng)庫(kù)是醫(yī)學(xué)數(shù)據(jù)分析處理的基礎(chǔ),是醫(yī)學(xué)信息技術(shù)發(fā)展的必然,對(duì)于醫(yī)學(xué)、醫(yī)療衛(wèi)生、生物學(xué)和醫(yī)療管理等領(lǐng)域的研究與應(yīng)用都有巨大的推動(dòng)作用[1]。

數(shù)據(jù)挖掘(Data Mining,DM)是從大量數(shù)據(jù)中提取出可信的、新穎的、有效率的并最終能被人理解的信息處理技術(shù)。涉及數(shù)據(jù)庫(kù)、人工智能、統(tǒng)計(jì)學(xué)、模式識(shí)別、可視化技術(shù)、并行計(jì)算等眾多領(lǐng)域知識(shí)。醫(yī)學(xué)影像數(shù)據(jù)挖掘是一門(mén)涉及面廣、技術(shù)難度大的新興交叉學(xué)科,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到醫(yī)學(xué)影像信息數(shù)據(jù)倉(cāng)庫(kù)中,可以發(fā)現(xiàn)其中的醫(yī)學(xué)診斷規(guī)則和模式,從而輔助醫(yī)生進(jìn)行疾病診斷[1]。

本文以普陀區(qū)中心醫(yī)院的醫(yī)學(xué)影像數(shù)據(jù)為依據(jù),研究基于數(shù)據(jù)挖掘的醫(yī)學(xué)影像檢索與分析方法,并對(duì)方法進(jìn)行驗(yàn)證。

1 醫(yī)學(xué)影像檢索關(guān)聯(lián)規(guī)則的應(yīng)用

1.1 關(guān)聯(lián)規(guī)則

在醫(yī)學(xué)影像中,通過(guò)醫(yī)院HIS、RIS以及PACS系統(tǒng)數(shù)據(jù)庫(kù)檢查信息表和項(xiàng)目信息表中,獲取患者基本信息、患者病情的報(bào)告,以及患者之前的病情數(shù)據(jù)。通過(guò)關(guān)聯(lián)規(guī)則的判斷,對(duì)患者進(jìn)行初步的評(píng)估再進(jìn)行有目的的檢查,從而有效避免了重復(fù)檢查和不完整檢查,可以對(duì)患者的檢查項(xiàng)目進(jìn)行統(tǒng)一規(guī)范化處理。

關(guān)聯(lián)規(guī)則X→Y的信任度是一個(gè)條件概率P(Y|X),即,Support(X→Y)=P(XUY),Confdence(X→Y)=P(Y|X)。

1.2 發(fā)現(xiàn)頻繁項(xiàng)集與生成關(guān)聯(lián)規(guī)則

通過(guò)發(fā)現(xiàn)頻繁項(xiàng),了解患者檢查的各個(gè)單個(gè)項(xiàng)目或檢查內(nèi)容,算出支持度與信任度,可發(fā)現(xiàn)患者就診過(guò)程中檢測(cè)項(xiàng)目的關(guān)聯(lián)度,進(jìn)一步結(jié)合患者疾病類(lèi)型,為醫(yī)學(xué)影像研究提供依據(jù),提高醫(yī)院臨床管理質(zhì)量。

1.3 Apriori算法步驟

Apriori算法的中心思想是首先對(duì)數(shù)據(jù)庫(kù)進(jìn)行掃描,找出支持度不小于最小支持度的所有項(xiàng)目,即頻繁1- 項(xiàng)集;接下來(lái)是循環(huán)操作,每次循環(huán)分3步進(jìn)行:連接、減枝、對(duì)數(shù)據(jù)庫(kù)進(jìn)行掃描并計(jì)算候選項(xiàng)的支持度。具體過(guò)程如圖1所示。

圖1 Apriori算法示意圖Fig.1 Apriori algorithm schematic

1.4 醫(yī)學(xué)影像檢索

采集我院100例肝癌病人的臨床資料,通過(guò)CT圖像的檢查,根據(jù)關(guān)聯(lián)規(guī)則公式,主要對(duì)腫瘤生長(zhǎng)方式和主瘤旁有小灶兩種情況進(jìn)行關(guān)聯(lián)規(guī)則的計(jì)算,計(jì)算結(jié)果如表1所示。

表1 計(jì)算結(jié)果Tab.1 Calculation results

通過(guò)簡(jiǎn)單的關(guān)聯(lián)規(guī)則,算出支持度與信任度,能對(duì)病人肝癌復(fù)發(fā)的概率進(jìn)行判斷,對(duì)日后的治療起到一定的幫助,也對(duì)研究者的判斷提供一定的數(shù)據(jù)支持。通過(guò)分析這些數(shù)據(jù),可判斷疾病發(fā)病的因素。

2 粗糙集應(yīng)用于醫(yī)學(xué)影像檢索

在醫(yī)學(xué)影像學(xué)中,各式各樣的數(shù)據(jù)經(jīng)常因數(shù)量龐大而不夠精確。例如每一份CT圖像分辨率極高,所包含的信息也極多:如病例數(shù)據(jù)、CT值、窗寬等。這些數(shù)據(jù)包羅萬(wàn)象,其模糊性和不確定性讓人摸不著頭腦。而粗糙集理論的優(yōu)勢(shì)在于它不需要關(guān)于數(shù)據(jù)的任何準(zhǔn)備或額外的信息,更容易從醫(yī)學(xué)影像數(shù)據(jù)中進(jìn)行數(shù)據(jù)挖掘。

2.1 粗糙集規(guī)則提取的一般步驟

粗糙集規(guī)則提取的目的一般有兩個(gè):一是用于建立分類(lèi)系統(tǒng),從數(shù)據(jù)倉(cāng)庫(kù)中導(dǎo)出規(guī)則,再用導(dǎo)出的規(guī)則去預(yù)測(cè)或分類(lèi)新的實(shí)例;二是用于實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)的任務(wù),從數(shù)據(jù)中尋找出潛在的信息模式,更好地了解并認(rèn)識(shí)數(shù)據(jù)。

一般步驟為:屬性約簡(jiǎn)、消除重復(fù)的行、值簡(jiǎn)約、整理規(guī)則[2]。

2.2 粗糙集理論的圖像處理

在醫(yī)學(xué)診斷中最有可能的問(wèn)題便是影像資料清晰度沒(méi)有達(dá)到標(biāo)準(zhǔn)值,使得醫(yī)生在診斷時(shí)產(chǎn)生偏差,容易導(dǎo)致病情延誤,嚴(yán)重的可能誤診。因此使用醫(yī)學(xué)圖像處理技術(shù),對(duì)醫(yī)學(xué)診斷的提高有很大價(jià)值,更為以后的研究創(chuàng)造前提條件。

醫(yī)學(xué)影像處理技術(shù)主要是突出了醫(yī)學(xué)影像特征(感興趣)區(qū)域的信息,并減弱或除去不必要的信息,從而使得感興趣區(qū)域的分辨率,清晰度得到提高,將信息的傳遞精確化。圖像處理的過(guò)程有兩步,首先是采用一系列技術(shù)改善圖像的視覺(jué)效果(如色階,灰度,噪聲等),將圖像的分辨率和清晰度提高。其次是將圖像轉(zhuǎn)化為一種信息或數(shù)據(jù),更加容易讓人或者計(jì)算機(jī)進(jìn)行解釋和分析[3]。

結(jié)合粗糙集理論,在醫(yī)學(xué)圖像處理后,依據(jù)各種圖像成像后的原理以及相應(yīng)基本的病例特征分析,提出基于粗糙集理論的醫(yī)學(xué)影像的算法,將醫(yī)學(xué)影像看成是一個(gè)知識(shí)系統(tǒng),利用粗糙集理論中的不可辨關(guān)系,根據(jù)醫(yī)學(xué)影像中的“知識(shí)”(人體器官之間的密度差異)來(lái)定義等價(jià)關(guān)系,將醫(yī)學(xué)圖像劃分為特征(目標(biāo))區(qū)域、背景區(qū)域,分別對(duì)各個(gè)區(qū)域進(jìn)行相應(yīng)的圖像處理,最后將各個(gè)區(qū)域處理后的結(jié)果進(jìn)行疊加,得到基于粗糙集的醫(yī)學(xué)影像處理結(jié)果。

2.2.1 粗糙集理論不可辨關(guān)系

給定一個(gè)論域U≠Ф,X是U的一個(gè)子集,R是U的等價(jià)關(guān)系且U/R={X1, X2, …, Xn}滿(mǎn)足以下條件:(1)Xi

∪U,Xi≠Ф,對(duì)于任何i; (2) Xi∩Xj=Φ,對(duì)于任何i和j; (3)Ui=1, 2, …, n, Xi=U。在子集Xi代表了等價(jià)類(lèi)R,x∈U用[x]R表示,不可辨關(guān)系IND(R)被定義為:[4]

我們定義子集X關(guān)于R的下近似和上近似分別為:

同時(shí)將P O S R(X)=R(X)稱(chēng)為X的R正域;NEGR(X)=U-R(X)稱(chēng)為X的R負(fù)域;BNR(X)= RX-RX稱(chēng)為X的R邊界域。

圖2 等價(jià)關(guān)系R下的分類(lèi)模式圖Fig.2 Classification schematic diagram under the equivalence relation R

2.2.2 粗糙集中不可辨關(guān)系的分析及應(yīng)用

在最簡(jiǎn)單的情況下,在感興趣區(qū)域中我們只有關(guān)于強(qiáng)度的閾值,在這種情況下,強(qiáng)度的閾值是獲取給定圖像中的體素。我們用ThL和ThH來(lái)表示下部閾值和上部閾值,感興趣區(qū)域ROI為上下部閾值中間值。

x(p)表示體素的所在位置為p,I(x(p))表示體素x(p)的強(qiáng)度。為簡(jiǎn)單起見(jiàn),將l(x(p))以l(p)表示。

我們用Ci定義強(qiáng)度的分布,d(Ci)為Ci的評(píng)價(jià)函數(shù),輸出d(Ci)=1時(shí),為感興趣區(qū)域。d(Ci)可表示為:

其中Ci為其區(qū)域平均強(qiáng)度。我們使用粗糙集,其近似的概念,代表一個(gè)不確定的邊界區(qū)域。在一個(gè)體積圖像,一個(gè)類(lèi)別X是建立為一組相鄰像素點(diǎn)的屬性值,例如在同一強(qiáng)度或同一位置。離散化聚類(lèi)方法和分類(lèi)器等工具可以用來(lái)建立基本類(lèi)別與正確的粒度級(jí)別。

為了確定感興趣區(qū)域的上、下近似強(qiáng)度,定義包含滿(mǎn)足閾值條件的體素的感興趣區(qū)域的理想形狀。然而,這樣的感興趣區(qū)域可能不完全是由圖像的基本集表示。換句話(huà)說(shuō),感興趣區(qū)域的邊界并不適合于圖像低層特征。為了表示這種不一致,我們把圖像分成以下三個(gè)區(qū)域:

正域:包括在感興趣區(qū)域的體素。

負(fù)域:排除在感興趣區(qū)域的體素。

邊界區(qū)域:可能包括在感興趣區(qū)域的體素。

基本類(lèi)別表示為U/IND(R)={C1,C2,… ,CN},同時(shí)設(shè)定XROI'為ROI的一組理想體素。然后,上述三個(gè)區(qū)域可以表示為:

圖像中的感興趣區(qū)域可表示為:

圖3表示了通過(guò)上述公式對(duì)感興趣區(qū)域進(jìn)行區(qū)分。左邊的圖像為原始圖像,感興趣區(qū)域?yàn)楹谏珗A形區(qū)域,即ROI1,ROI2,ROI3。設(shè)XROI’為理想感興趣區(qū)域。

將圖像強(qiáng)度分為幾個(gè)層次。在這種情況下,我們得到了10個(gè)區(qū)域C1~C10在圖3所顯示圖像的中心。根據(jù)前面的定義,正域、負(fù)域以及邊界區(qū)域可以得到如下公式:

即因此得出結(jié)論,對(duì)于給定的圖像特征,感興趣區(qū)域?yàn)镃5~C10,以及可能的邊界區(qū)域?yàn)镃4。

圖3 圖像中感興趣區(qū)域強(qiáng)度分布Fig.3 The intensity distribution of the image region of interest

2.3 基于粗糙集理論圖像處理后的例子

通過(guò)我院GE LightSpeed 64排容積VCT及Xtream FX系統(tǒng)處理。

通過(guò)CT所得圖像,突出區(qū)域如病灶、腫瘤、陰影等部位,進(jìn)行體素化,再由上述公式ROI=POSR(XROI’)+BNR(XROI’)等區(qū)分感興趣區(qū)域,抑制一些無(wú)用的圖像數(shù)據(jù),提高圖像利用價(jià)值。如圖4所示。

圖4 感興趣區(qū)域的對(duì)比圖Fig.4 Contrast figure for ROI

圖5為一例多排螺旋CT上腹部位置拍攝下的圖像,通過(guò)對(duì)圖像感興趣區(qū)域進(jìn)行處理后,左右對(duì)比能清晰看到特征區(qū)域內(nèi)的亮度與清晰度有了提高,原本黯淡的目標(biāo)區(qū)域變得紋理清晰,器官分泌的液體體積也一目了然,而其余區(qū)域(如背景區(qū)域等)并沒(méi)有太大變化。

圖5 圖像處理前后的圖像的對(duì)比(上腹部)Fig.5 Contrast (upper abdomen) image before and after image processing

圖6為我院另一例多排螺旋CT拍攝肺癌轉(zhuǎn)移至肺門(mén)和縱隔淋巴結(jié)的病例,經(jīng)過(guò)圖像處理后能清晰可見(jiàn)肺部的信息,出現(xiàn)明顯的肺癌轉(zhuǎn)移。

圖6 處理后的圖像(肺癌轉(zhuǎn)移至肺門(mén)和縱隔淋巴結(jié))Fig.6 The image after processing (lung cancer metastasis to the hilar and mediastinal lymph nodes)

通過(guò)圖5、圖6可見(jiàn)數(shù)字圖像處理技術(shù)的引入主要是為了改善醫(yī)學(xué)影像質(zhì)量,而目前對(duì)X光圖像、CT圖像、MRI圖像、超聲圖像、以及內(nèi)窺鏡圖像等醫(yī)學(xué)圖像的處理,己成為輔助醫(yī)學(xué)診斷的重要手段之一。

經(jīng)過(guò)改善的醫(yī)學(xué)影像,對(duì)感興趣區(qū)域的圖像積累,便能得到一系列相應(yīng)病癥的圖像信息例如紋理、形狀等。通過(guò)關(guān)聯(lián)規(guī)則進(jìn)行分析及存儲(chǔ),便能進(jìn)行圖像檢索。

2.4 粗糙集理論的圖像檢索應(yīng)用

醫(yī)學(xué)影像中的圖像存儲(chǔ)是龐大的,不僅是圖像的數(shù)量上,在圖片的屬性上也是如此。在龐大的數(shù)據(jù)中找到更為精確的數(shù)據(jù),對(duì)于提高醫(yī)學(xué)圖像資料的可靠度必不可少。在上文提到的依靠關(guān)聯(lián)規(guī)則進(jìn)行項(xiàng)目檢索的方法,因?yàn)獒t(yī)學(xué)圖像的模糊性不能很好地檢索圖像,而粗糙集理論,一種研究不精確、不確定性知識(shí)的數(shù)學(xué)工具則更為合適?;趫D像檢索的基本框架見(jiàn)圖7。

圖7 基于圖像檢索的基本框架Fig.7 The basic framework based on image retrieval

通過(guò)之前介紹的圖像處理技術(shù),使圖像質(zhì)量得到改善,將醫(yī)學(xué)影像拆分為各個(gè)區(qū)域后處理也使得圖像更容易被解釋和分析處理,為相應(yīng)圖像檢索提供了方便。用于圖像檢索的主要特征有顏色、紋理、草圖、形狀等,其中圖像中顏色、形狀、紋理應(yīng)用較為廣泛。粗糙集理論直接從給定集合的描述出發(fā),通過(guò)不可辨關(guān)系和不可辨類(lèi)確定給定問(wèn)題的近似域,從而找出圖像的內(nèi)在規(guī)律。在圖像信息不完整、不確定的前提下,仍能進(jìn)行認(rèn)識(shí)、分析、推理和決策[5]。

3 結(jié)論

隨著各種先進(jìn)技術(shù)的產(chǎn)生,大量醫(yī)學(xué)影像資料將快速增長(zhǎng),數(shù)據(jù)挖掘技術(shù)將成為輔助醫(yī)學(xué)診斷的主要手段之一,可用于研究人類(lèi)各種疾病發(fā)病機(jī)制的主要方法。

總之,數(shù)據(jù)挖掘的各項(xiàng)技術(shù)和方法均顯示出其獨(dú)有的優(yōu)越性,都在醫(yī)學(xué)數(shù)據(jù)挖掘中取得了成功的應(yīng)用,其應(yīng)用的潛力巨大。在這個(gè)大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘技術(shù)必將為臨床、醫(yī)學(xué)診斷及研究帶來(lái)極大的方便。

[1] 李雄飛, 杜欽生, 吳昊. 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M]. 北京: 機(jī)械工業(yè)出版社, 2013.

[2] 張文修, 吳偉志. 粗糙集理論介紹和研究綜述[J]. 模糊系統(tǒng)與數(shù)學(xué), 2000, 15(4): 1-12.

[3] Mitchell T M. 機(jī)器學(xué)習(xí)[M]. 北京: 機(jī)械工業(yè)出版社, 2003.

[4] 吳毅民. 基于不可分辨和優(yōu)勢(shì)關(guān)系的知識(shí)約簡(jiǎn)算法研究及其應(yīng)用[D]. 福州: 福州大學(xué), 2004.

[5] 強(qiáng)邦紅, 劉冬, 朱向明. 數(shù)據(jù)挖掘技術(shù)在醫(yī)學(xué)影像領(lǐng)域中的應(yīng)用進(jìn)展[J]. 臨床超聲醫(yī)學(xué)雜志, 2013, 15(4): 287-288.

Retrieval and Analysis Based on Data Mining in Medical lmaging

【W(wǎng)riters】JIANG Youhao1,2, QIAO Fei1, GAO Cailan2

1 Department of Control Science and Engineering, School of Electronic and Information Engineering, Tongji University, Shanghai, 201804
2 Putuo Hospital Affiliated to Shanghai University of Traditional Chinese Medicine, Shanghai, 200062

By the understanding of some basic knowledge of data mining, we use the association rule and rough set to the medical image retrieval. By these means, from large data warehouse, we dig more accurate, more useful information and analyze data to improve the diagnosis reliability of the medical image and propose the convenience for the medical image retrieval.

association rules, rough set theory, medical imaging

TP311.13

A

10.3969/j.issn.1671-7104.2016.04.018

1671-7104(2016)04-0297-04

2016-03-29

蔣友好,E-mail: jyouh_0416@163.com

猜你喜歡
數(shù)據(jù)倉(cāng)庫(kù)粗糙集感興趣
基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
更 正
含能材料(2021年1期)2021-01-10 08:34:34
基于數(shù)據(jù)倉(cāng)庫(kù)的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉(cāng)庫(kù)中的設(shè)計(jì)
電子制作(2016年15期)2017-01-15 13:39:15
探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用
多粒化粗糙集性質(zhì)的幾個(gè)充分條件
雙論域粗糙集在故障診斷中的應(yīng)用
這樣的智能廚房臺(tái)面,你會(huì)感興趣嗎?
基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析探索與實(shí)踐
兩個(gè)域上的覆蓋變精度粗糙集模型
义马市| 民权县| 琼结县| 榆林市| 玛沁县| 佛冈县| 八宿县| 虞城县| 南陵县| 息烽县| 闸北区| 奉节县| 莱西市| 西乌| 盐边县| 旬邑县| 临汾市| 金溪县| 台江县| 湖北省| 霍邱县| 大足县| 鄄城县| 定远县| 天祝| 化州市| 东宁县| 正宁县| 苗栗县| 阿拉善左旗| 会泽县| 芮城县| 北碚区| 赣州市| 锡林浩特市| 高邑县| 南漳县| 清远市| 青州市| 郁南县| 金沙县|