蔡武斌,宋文愛(ài),王青,杜曉亮,雷毅
(1.中北大學(xué)軟件學(xué)院,山西 太原 030051;2.清華大學(xué)信息技術(shù)研究院,北京 100084)
基于細(xì)胞形態(tài)學(xué)的計(jì)算機(jī)輔助診斷系統(tǒng)是一種可以自動(dòng)檢測(cè)細(xì)胞圖像的工具型軟件。自動(dòng)檢測(cè)與傳統(tǒng)的顯微檢測(cè)區(qū)別是:自動(dòng)檢測(cè)的操作簡(jiǎn)便、方法靈活,在無(wú)人監(jiān)督的情況下自動(dòng)判讀顯微細(xì)胞圖片,提高病理醫(yī)生的工作效率;而傳統(tǒng)檢測(cè)要求病理醫(yī)生在顯微鏡下全程檢閱細(xì)胞制片,工作量大,容易產(chǎn)生疲勞。自動(dòng)檢測(cè)技術(shù)能夠方便地幫助病理醫(yī)生閱片,提高工作效率、降低勞動(dòng)強(qiáng)度和縮短診斷時(shí)間。該技術(shù)基本思路是根據(jù)病理醫(yī)生們長(zhǎng)期工作得出的對(duì)腫瘤細(xì)胞形狀和特征的經(jīng)驗(yàn),分析顯微細(xì)胞圖片,自動(dòng)判斷出被檢測(cè)圖像中有無(wú)腫瘤細(xì)胞,將初始結(jié)果作為醫(yī)務(wù)人員進(jìn)一步診斷的一個(gè)基礎(chǔ)。
系統(tǒng)軟件的一般工作流程為:先讀取細(xì)胞顯微圖像進(jìn)行預(yù)處理,去除噪聲干擾,改善圖像質(zhì)量。然后利用預(yù)置的圖像分割算法找到目標(biāo)區(qū)域。在此基礎(chǔ)上,提取細(xì)胞指定的特征向量(如細(xì)胞半徑、核漿面積比等),并根據(jù)特征向量對(duì)可疑的細(xì)胞按序排列,最后將結(jié)果顯示給病理醫(yī)生分析,見(jiàn)圖1。
圖1 系統(tǒng)軟件工作流程圖
對(duì)宮頸顯微細(xì)胞圖像進(jìn)行檢測(cè)識(shí)別,是細(xì)胞學(xué)計(jì)算機(jī)輔助診斷的重要應(yīng)用領(lǐng)域。宮頸癌是一種危害女性健康的惡性腫瘤,是人體常見(jiàn)的癌癥之一。宮頸癌有較長(zhǎng)的癌前病變期,若能在早期發(fā)現(xiàn)并治療,可以大大提高治愈率,因而宮頸癌的篩查對(duì)疾病的診斷和治療非常重要。為了使診斷系統(tǒng)能夠準(zhǔn)確識(shí)別被檢測(cè)的圖像,有效的設(shè)計(jì)圖像分割算法是其中的關(guān)鍵。
圖像分割是指將圖像劃分為具有特定涵義的不同區(qū)域,并提取出感興趣的目標(biāo)[1]。細(xì)胞圖像的分割是細(xì)胞定量分析和分類(lèi)識(shí)別的重要步驟之一,其分割效果影響后續(xù)特征提取和識(shí)別工作的有效性。細(xì)胞圖像的分割的主要任務(wù)是:(1)將細(xì)胞圖像劃分為細(xì)胞體區(qū)域及背景區(qū)域;(2)將細(xì)胞體區(qū)域劃分為細(xì)胞核區(qū)域及細(xì)胞漿區(qū)域。
顯微醫(yī)學(xué)圖像是通過(guò)顯微成像儀來(lái)獲取,由于醫(yī)學(xué)圖像的成像原理和組織本身的特性差異,圖像的形成易受到各種外部干擾[2]。為了解決醫(yī)學(xué)圖像細(xì)胞分割的難題,近幾年來(lái),許多科研人員做了大量的工作,提出了很多有用的技術(shù)方法。
邊緣檢測(cè)技術(shù)是依據(jù)區(qū)域邊緣上的像素灰度值變換劇烈,通過(guò)檢測(cè)不同均勻區(qū)域之間的邊緣來(lái)解決圖像分割問(wèn)題。常見(jiàn)的邊緣檢測(cè)算子有Robert算子、Sobel算子、Prewitt算子、Laplacian算子、Canny算子等,見(jiàn)表1。
表1 各種邊緣檢測(cè)算子的比較
閾值處理是最常見(jiàn)的基于區(qū)域的分割技術(shù)[3]。通過(guò)設(shè)定某一閾值T,然后將圖像分割成大于閾值T的對(duì)象點(diǎn)和小于閾值T的背景點(diǎn)兩部分。設(shè)輸入圖像是g(x,y),輸出圖像是f(x,y),則:
根據(jù)閾值選取的數(shù)量分為單閾值分割和多閾值分割,見(jiàn)圖2。單閾值分割法將圖像分為目標(biāo)區(qū)域和背景區(qū)域。多閾值分割通過(guò)在圖像的灰度范圍內(nèi)確定n個(gè)閾值,將圖像中每個(gè)像素的灰度值都與這些閾值進(jìn)行比較,根據(jù)比較結(jié)果對(duì)圖像進(jìn)行分割[4]。細(xì)胞圖像需要分割出細(xì)胞質(zhì)、細(xì)胞核及背景,因此可以用兩個(gè)分割閾值。
圖2 閾值分類(lèi)
區(qū)域生長(zhǎng)是根據(jù)預(yù)先定義的生長(zhǎng)準(zhǔn)則將像素或子區(qū)域組合為更大區(qū)域的過(guò)程[5]?;具^(guò)程是先從一組“種子”點(diǎn)開(kāi)始,將與種子預(yù)先定義的性質(zhì)相似的那些鄰域像素添加到每個(gè)種子上,來(lái)形成這些生長(zhǎng)區(qū)域。相似性度量可以包括平均灰度值、紋理、顏色等信息。
在沒(méi)有先驗(yàn)知識(shí)可以利用時(shí),一種方法是在每個(gè)像素上計(jì)算一組相同的特性,最后在生長(zhǎng)處理期間分配像素到區(qū)域中。若這個(gè)計(jì)算的結(jié)果顯示一簇值,就把具有這些特性的像素放在能夠作為種子的這些簇的中心附近。
分水嶺算法是一種基于拓?fù)淅碚摰臄?shù)學(xué)形態(tài)學(xué)的分割方法,其基本思想是把圖像看作是測(cè)地學(xué)上的拓?fù)涞孛玻瑘D像中每一點(diǎn)像素的灰度值表示該點(diǎn)的海拔高度,每一個(gè)局部極小值及其影響區(qū)域成為集水盆,而集水盆的邊界則形成分水嶺,見(jiàn)圖3。
圖3 分水嶺地形圖
分水嶺算法實(shí)現(xiàn)相對(duì)簡(jiǎn)單,在圖像分割中執(zhí)行速度快,對(duì)微弱的邊緣有著良好的響應(yīng),但通常會(huì)由于噪聲和梯度的其他局部不規(guī)則性造成過(guò)度分割現(xiàn)象。針對(duì)分水嶺過(guò)度分割問(wèn)題,國(guó)內(nèi)外一些圖像處理專(zhuān)家做了大量的研究,在傳統(tǒng)的分水嶺算法基礎(chǔ)上提出了改進(jìn)方法,基于標(biāo)記符控制的分水嶺算法是其中一種較好的改進(jìn)。
基于標(biāo)記符控制的分水嶺算法是利用一些附加知識(shí),在原圖中尋找一些內(nèi)部標(biāo)記和外部標(biāo)記來(lái)引導(dǎo)算法進(jìn)行分割。然后利用找到的標(biāo)記來(lái)改進(jìn)梯度圖像,再在改進(jìn)梯度圖像上應(yīng)用分水嶺變換,得到分割結(jié)果。
主動(dòng)輪廓模型是由Kass[6]等人提出的,將圖像分割問(wèn)題轉(zhuǎn)換為求解能量泛函最小值問(wèn)題。其基本思想是通過(guò)構(gòu)造能量泛函,在能量函數(shù)最小值驅(qū)動(dòng)下,輪廓曲線(xiàn)逐漸向待檢測(cè)物體的邊緣逼近,最終分割出目標(biāo)。由于主動(dòng)輪廓模型利用曲線(xiàn)演化定位目標(biāo)的邊緣,因此也稱(chēng)為Snake模型。其最大優(yōu)點(diǎn)是在高噪聲的情況下,也能得到連續(xù)、光滑的閉合分割邊界。
其中第一項(xiàng)為彈性能量,是v的一階導(dǎo)數(shù)的模;第二項(xiàng)為彎曲能量,是v的二階導(dǎo)數(shù)的模;第三項(xiàng)是外部能量,在基本snakes模型中一般只取控制點(diǎn)或連線(xiàn)所在位置的圖像局部特征,例如梯度:
也稱(chēng)圖像力,基本Snakes模型就是在這三個(gè)力的聯(lián)合作用下工作的[8]。按照模型中曲線(xiàn)表達(dá)形式的不同,活動(dòng)輪廓模型可以分為兩大類(lèi):參數(shù)活動(dòng)輪廓模型(parametric active contour model)和幾何活動(dòng)輪廓模型(geometric active contour model)。
細(xì)胞核和細(xì)胞漿的幾何形態(tài)特征描述了區(qū)域的形狀,其中某些特征對(duì)于病理醫(yī)生診斷細(xì)胞是否正常發(fā)揮重要作用,例如腫瘤細(xì)胞的細(xì)胞核面積通常比正常細(xì)胞的細(xì)胞核面積明顯要大。因此,計(jì)算機(jī)輔助細(xì)胞學(xué)診斷系統(tǒng)需要分別提取細(xì)胞體的不同區(qū)域,以供進(jìn)一步的識(shí)別與分析。細(xì)胞圖像分割的重點(diǎn)是提取細(xì)胞核、細(xì)胞漿對(duì)應(yīng)的區(qū)域,難點(diǎn)是分割重疊區(qū)域的細(xì)胞體。本文實(shí)驗(yàn)針對(duì)不同情形,采用不同的圖像分割算法做實(shí)驗(yàn)分析。實(shí)驗(yàn)圖像使用顯微鏡高倍物鏡采集的宮頸細(xì)胞圖像,數(shù)據(jù)由清華大學(xué)信息技術(shù)研究院數(shù)字醫(yī)療與健康研究中心提供。
由于宮頸細(xì)胞圖像的細(xì)胞核區(qū)域明顯不同于其他區(qū)域,其顏色較深,大小在一定范圍內(nèi),因此可以充分利用圖像的特征,先利用閾值分割法做初始輪廓分割,再用形態(tài)學(xué)方法去除噪聲,獲取細(xì)胞核的粗輪廓。然后以粗輪廓的質(zhì)心為種子生長(zhǎng)點(diǎn),使用區(qū)域生長(zhǎng)算法,完成細(xì)胞核區(qū)域提取。該算法的基本思路是先使用效率較高的算法提取所需的參量,再將參量傳遞給其他算法進(jìn)行二次分割。采用該方法可以實(shí)現(xiàn)自動(dòng)定位種子生長(zhǎng)點(diǎn),從而避免人工干預(yù)設(shè)定起始生長(zhǎng)點(diǎn)。使用自動(dòng)種子點(diǎn)區(qū)域生長(zhǎng)的分割算法的主要步驟如下:
(1)讀取彩色圖像并轉(zhuǎn)化為灰度圖。圖(a)是由顯微鏡高倍物鏡采集的高分辨率細(xì)胞圖像,圖(b)是灰度化后的圖像。
(2)對(duì)目標(biāo)做全閾值分割及形態(tài)學(xué)處理。圖(c)是經(jīng)過(guò)處理后二值圖像,白色區(qū)域?yàn)樘崛〕龅募?xì)胞核初始區(qū)域。
(3)求得每個(gè)細(xì)胞核初輪廓的質(zhì)心坐標(biāo),圖(d)中以‘*’標(biāo)記。
(4)以每個(gè)質(zhì)心位置作為種子生長(zhǎng)點(diǎn),對(duì)原圖的灰度圖像做區(qū)域生長(zhǎng)算法,得到二次分割后的結(jié)果。(圖e)
(5)使用Canny算子做邊緣檢測(cè),最終顯示分割出的細(xì)胞核輪廓。(圖f)
通過(guò)實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),圖(e)比圖(c)更準(zhǔn)確的提取了細(xì)胞核區(qū)域,并且該算法不僅可以提取單細(xì)胞圖像的細(xì)胞核區(qū)域,對(duì)多細(xì)胞圖像的細(xì)胞核區(qū)域也有較好的分割效果。
圖(a)
圖(b)
圖(c)
圖(d)
圖(e)
圖(f)
對(duì)于細(xì)胞體區(qū)域的提取,我們可以采用上節(jié)提到的標(biāo)記符控制的分水嶺算法來(lái)實(shí)現(xiàn),并給出主要步驟結(jié)果:
(1)由于標(biāo)記控制符的分水嶺算法比較適用于亮目標(biāo)暗背景的圖像,因此對(duì)圖(b)做反相處理。(圖h)
(2)對(duì)圖像做基于重建的開(kāi)操作和閉操作。該步驟可以在保持目標(biāo)物體不變的基礎(chǔ)上,有效去除目標(biāo)內(nèi)部的細(xì)節(jié)。(圖i)
(3)計(jì)算圖像的梯度幅值,得到梯度圖像,再利用內(nèi)外標(biāo)記改進(jìn)梯度圖像,得到圖(j)。
(4)在改進(jìn)后的圖像上進(jìn)行分水嶺變換,并顯示前景(白色區(qū)域)、背景標(biāo)記(細(xì)線(xiàn))以及細(xì)胞體分割輪廓。(圖k)
(5)顯示細(xì)胞體分割輪廓。(圖l)
從實(shí)驗(yàn)結(jié)果可以看出,細(xì)胞體大部分區(qū)域被有效分離出來(lái)。但有少數(shù)灰度值與背景比較接近的細(xì)胞區(qū)域沒(méi)有被分割出來(lái),因此還需要做進(jìn)一步的改進(jìn)。
圖(h)
圖(i)
圖(j)
圖(k)
重疊細(xì)胞圖像分割一直以來(lái)是醫(yī)學(xué)圖像處理的難題,其主要難點(diǎn)在于細(xì)胞重疊區(qū)域的正確分離。細(xì)胞重疊區(qū)域較為相似,重疊部分輪廓不清晰,對(duì)圖像分割造成很大的干擾,使用傳統(tǒng)的圖像分割方法很難實(shí)現(xiàn)對(duì)重疊區(qū)域的有效分離。針對(duì)這類(lèi)問(wèn)題,近年來(lái)有研究學(xué)者提出基于snake模型的分割算法。根據(jù)snake模型對(duì)初始位置敏感的特點(diǎn),先人工設(shè)置一系列較準(zhǔn)確的初始輪廓點(diǎn)(圖m),再利用snake模型方法進(jìn)行分割,通過(guò)實(shí)驗(yàn)可以發(fā)現(xiàn),圖n中的主體細(xì)胞輪廓被較好的分離出來(lái)。所以在使用該方法前,先要經(jīng)過(guò)適當(dāng)?shù)某跏蓟僮鳌jP(guān)濤,周東翔[9]等人通過(guò)對(duì)細(xì)胞輪廓的幾何結(jié)構(gòu)分析,提出了細(xì)胞的稀疏輪廓點(diǎn)模型,利用環(huán)形動(dòng)態(tài)輪廓搜索算法,可以自動(dòng)定位出主體細(xì)胞的輪廓點(diǎn),從而避免了人工干預(yù),可以適用于一部分細(xì)胞漿發(fā)生重疊的圖像。
圖(l)
圖(m)
圖(n)
通過(guò)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行比較,得到表2:
表2 各種醫(yī)學(xué)圖像算法的比較
本文作者對(duì)近年來(lái)針對(duì)宮頸細(xì)胞圖像分割的典型方法做了說(shuō)明,此外還有許多醫(yī)學(xué)圖像處理方法,由于適用場(chǎng)景不同,沒(méi)有一一舉例。圖像分割沒(méi)有通用的、標(biāo)準(zhǔn)的、唯一的方法,每種算法都有其各自的優(yōu)缺點(diǎn),單獨(dú)使用某種算法用于分割,效果往往不是很理想。因此要根據(jù)不同的環(huán)境條件和要求,選擇合
適的策略進(jìn)行圖像處理,這樣分割效果才會(huì)理想。
傳統(tǒng)的圖像分割算法有時(shí)很難適應(yīng)顯微細(xì)胞圖像這樣復(fù)雜的環(huán)境,因此我們可能還需要一種具有較強(qiáng)學(xué)習(xí)及處理能力的圖像分割算法。強(qiáng)化學(xué)習(xí)作為一種重要的機(jī)器學(xué)習(xí)方法,在與環(huán)境交互時(shí),利用環(huán)境反饋的獎(jiǎng)懲,即依靠外部評(píng)價(jià)信號(hào)來(lái)調(diào)整自己的行為。該方法是一種在線(xiàn)、增量式的學(xué)習(xí)方法,通過(guò)增量的學(xué)習(xí)算法去接近最優(yōu)的分割閾值,訓(xùn)練完成后的算法可以基于自身獲取的知識(shí)對(duì)類(lèi)似的新圖片做出正確的分割,目前被廣泛應(yīng)用于圖像處理、智能控制等領(lǐng)域。后續(xù)的研究工作將結(jié)合機(jī)器學(xué)習(xí)方法,進(jìn)一步優(yōu)化該系統(tǒng)自動(dòng)圖像檢測(cè)的準(zhǔn)確度和魯棒性。
[1] 張錚,徐超.數(shù)字圖像處理與機(jī)器視覺(jué)[M].人民郵電出版社,2014.
[2] 聶生東,邱建峰,鄭建立.醫(yī)學(xué)圖像處理[M].復(fù)旦大學(xué)出版社,2010.
[3] Rafael C.Gonzalez,Richard E.Woods.數(shù)字圖像處理[M].電子工業(yè)出版社,2011.
[4] 范金坪.宮頸細(xì)胞圖像分割和識(shí)別方法研究[D].暨南大學(xué),2010.[5] Rafael C.Gonzalez,Richard E.Woodz,Steven L.Eddins.數(shù)字圖像處理的MATLAB實(shí)現(xiàn)[M].清華大學(xué)出版社,2013.
[6] Kass M,Witkin A,Terzopoulos D.Snakes:Active Contour Models.International Journal of Computer Vision,1987:321-331.
[7] 李天慶,張毅,劉志,胡東成.Snake模型綜述[J].計(jì)算機(jī)工程,2005,(09):1-3.
[8] 吳東東.宮頸細(xì)胞圖像分割方法研究[D].國(guó)防科學(xué)技術(shù)大學(xué),2012.
[9] 關(guān)濤,周東翔,樊瑋虹,等.基于稀疏輪廓點(diǎn)模型的彩色重疊細(xì)胞圖像分割[J].計(jì)算機(jī)研究與發(fā)展,2015,52(7).