李彩紅 張慧娥 申海杰
摘要:隨著醫(yī)療成像設(shè)備的發(fā)展研制,結(jié)合機(jī)器學(xué)習(xí)算法在醫(yī)學(xué)圖像處理中的應(yīng)用,大大促進(jìn)了醫(yī)學(xué)圖像處理的研究[5],為醫(yī)學(xué)病理的診斷提供了充足的依據(jù)。本文以 K-means 算法為基礎(chǔ),將心臟 CT 圖像經(jīng)過(guò) K-means 算法處理得到聚類后的圖像;在此基礎(chǔ)上,選擇實(shí)驗(yàn)中K-means 算法輸出結(jié)果中灰度值的最大值作為閾值,利用閾值法實(shí)現(xiàn)心臟 CT 圖像的分割。
關(guān)鍵詞:機(jī)器學(xué)習(xí);K-means閾值法
中圖分類號(hào):TP18? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? 文章編號(hào):1009-3044(2019)01-0212-02
機(jī)器學(xué)習(xí)通過(guò)算法,使得機(jī)器能從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對(duì)新的樣本做智能識(shí)別或?qū)ξ磥?lái)做預(yù)測(cè)。機(jī)器學(xué)習(xí)算法分監(jiān)督算法、無(wú)監(jiān)督算法、半監(jiān)督算法。K-means 算法是一種經(jīng)典的無(wú)監(jiān)督聚類方法,具有強(qiáng)大的搜索力,該算法的主要思想是通過(guò)迭代把數(shù)據(jù)集劃分為不同類別,使評(píng)價(jià)聚類性能的準(zhǔn)則函數(shù)達(dá)到最優(yōu),從而使生成的每個(gè)聚類內(nèi)部緊湊,類間獨(dú)立[1]。
CT掃描技術(shù)是醫(yī)生進(jìn)行心臟疾病診斷的重要手段之一。CT 中心臟圖像的分割是病變區(qū)域提取、特定組織測(cè)量以及實(shí)現(xiàn)心臟三維立體重建的基礎(chǔ)??焖贉?zhǔn)確地實(shí)現(xiàn)心臟 CT 圖像的分割是醫(yī)學(xué)圖像分割領(lǐng)域中的一個(gè)重難點(diǎn)。
近年來(lái)機(jī)器學(xué)習(xí)算法在醫(yī)學(xué)圖像處理中發(fā)揮著重要的作用,是醫(yī)學(xué)圖像處理的常用算法之一[2]。本文基于 K-means 算法,將原始心臟CT圖像經(jīng)過(guò)算法處理得到聚類后的圖像,再用閾值法實(shí)現(xiàn)心臟圖像的分割。
1 K-Means均值聚類算法
K-means算法是很典型的基于距離的聚類算法,采用距離作為相似性的評(píng)價(jià)指標(biāo)。其原理為:首先隨機(jī)選定初始點(diǎn)為距離中心,并通過(guò)計(jì)算每一個(gè)樣本與距離中心之間的距離,找出最小距離把樣品歸入最近的聚類中心,接著,修改中心點(diǎn)的值為本類所有樣品的均值,再計(jì)算各個(gè)樣品到距離中心的距離,重新歸類,直到距離中心不再改變。根據(jù)原理,可定義準(zhǔn)則函數(shù)為:
[K=i=1kxj∈Si(xj-ui)2]
函數(shù)假設(shè)對(duì)象屬性來(lái)自空間向量,并且目標(biāo)是使各個(gè)群組內(nèi)部的均方誤差總和最小。假設(shè)有k個(gè)群組Si, i=1,2,...,k。ui是群組Si內(nèi)所有元素xj的重心,或叫中心點(diǎn)。
算法思路:
輸入:群組的數(shù)目k;包含n個(gè)對(duì)象的數(shù)據(jù)集D。
輸出:k個(gè)簇的集合。
方法:
1)從D中任意選擇k個(gè)對(duì)象作為初始中心;
2)重復(fù)選擇;
3)根據(jù)群組中對(duì)象的均值,將每個(gè)對(duì)象指派到最相似的群組;
4)更新群組均值,即計(jì)算每個(gè)群組中對(duì)象的均值;
5)計(jì)算準(zhǔn)則函數(shù);
6)直到準(zhǔn)則函數(shù)不再發(fā)生變化。
2 閾值分割
閾值處理是一種區(qū)域分割技術(shù), 它適用于物體與背景有較強(qiáng)對(duì)比的景物分割。 它主要是利用圖像中要提取的目標(biāo)物體和背景在灰度上的差異, 選擇一個(gè)合適的閾值, 通過(guò)判斷圖像中的每一個(gè)像素點(diǎn)的特征屬性是否滿足閾值的要求來(lái)確定圖像中該像素點(diǎn)應(yīng)該屬于目標(biāo)區(qū)還是應(yīng)該屬于背景區(qū)域, 從而產(chǎn)生二值圖像[3]。
閾值化分割分為兩個(gè)步驟:首先是確定合適的或者是最佳閾值,然后是將圖像的像素的灰度跟閾值進(jìn)行比較,進(jìn)而確定每個(gè)像素所屬的類。其難點(diǎn)和關(guān)鍵就是確定合適的閾值[4]。本實(shí)驗(yàn)中K-means 算法的輸出為聚類后的CT 圖像和灰度值,選擇輸出灰度值中的最大值作為閾值。
3 圖像處理實(shí)驗(yàn)及結(jié)果
3.1實(shí)驗(yàn)流程
通過(guò)MATLAB程序?qū)⑿呐KCT圖像轉(zhuǎn)為double類型,輸出原灰度圖,應(yīng)用k-means算法將圖像聚類,從k-means算法輸出的灰度值中選最大值為閾值進(jìn)行二值化分割,得出分割后圖像。
3.2實(shí)驗(yàn)過(guò)程
對(duì)心臟切片圖像進(jìn)行多次聚類,通過(guò)對(duì)比聚類結(jié)果得出,聚類數(shù)目為3時(shí)效果最好,故令輸入的聚類數(shù)目k=3,得到圖像聚類圖,圖1和圖2分別為原圖和聚類后圖像,從K-means算法結(jié)果中選擇最大的灰度值作為閾值,去除灰度值低于心臟的區(qū)域,得到圖3分割效果圖。
4 總結(jié)
實(shí)驗(yàn)證明機(jī)器學(xué)習(xí)算法應(yīng)在醫(yī)學(xué)圖像分割上是可行性。后續(xù)可改進(jìn)算法,結(jié)合形態(tài)學(xué)方法做更精細(xì)的分割研究。
參考文獻(xiàn):
[1] 李蘇梅,韓國(guó)強(qiáng)基于K-均值聚類算法的圖像分割方法[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(16):163-167.
[2] 安強(qiáng)強(qiáng),張峰,李趙興,等.基于機(jī)器學(xué)習(xí)的圖像分割[J].自動(dòng)化與儀器儀表,2018(6):29-31.
[3] 劉利雄,馬忠梅,趙恒博,等.一種基于主動(dòng)輪廓模型的心臟核磁共振圖像分割方法[J].計(jì)算機(jī)學(xué)報(bào),2012,35(1):146-153.
[4] 李志剛.心臟CT圖像分割算法研究[D].哈爾濱:哈爾濱工程大學(xué),2014:20-56.
[5] 史穎歡.醫(yī)學(xué)圖像處理中的機(jī)器學(xué)習(xí)方法及其應(yīng)用研究[D].南京:南京大學(xué),2013:38-76.