徐勝舟,胡懷飛
(1 中南民族大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,武漢430074;2中南民族大學(xué) 生物醫(yī)學(xué)工程學(xué)院,武漢430074)
乳腺X線攝片被認(rèn)為是目前乳腺癌最常用和有效的診斷手段之一.全世界每年要產(chǎn)生大量的乳腺X線攝片,然而,由于放射科醫(yī)師的視覺疲勞或者人為疏忽,有10%~30%的可探測乳腺癌并不是開始就被檢測到并被解釋為乳腺癌[1].因此,設(shè)計(jì)一種基于乳腺X線攝片的計(jì)算機(jī)輔助檢測(CAD)系統(tǒng)幫助醫(yī)生進(jìn)行輔助診斷顯得尤為重要.
國內(nèi)外眾多研究者在乳腺腫塊CAD方面展開了大量的研究[2,3].這些腫塊檢測方法的過程大致可以分為兩個(gè)階段[4]:初始檢測和假陽性去除.初始檢測需檢測盡可能多的可疑腫塊,保持高敏感度;假陽性去除階段則需識(shí)別并去掉大多數(shù)假陽性.根據(jù)初始檢測方法,可以將腫塊檢測方法分為基于像素和基于區(qū)域的兩類.前者從每個(gè)像素上提取特征,而后者則從可疑區(qū)域中提取特征.基于區(qū)域的方法考慮了空間信息,其諸如區(qū)域的形狀和邊緣等特征與重要的診斷信息直接相關(guān)且計(jì)算量相對較小,因而得到更多的應(yīng)用.例如,Zheng和Nevine等人分別提出了基于三層地形模型[5]和多層地形模型[6]的檢測方法,這兩種方法均認(rèn)為腫塊區(qū)域中心灰度最高并向四周逐漸降低,并通過多閾值來逐層分割和識(shí)別可疑腫塊.Polakowski[7]則使用差分高斯函數(shù)(DOG)方法對腫塊進(jìn)行定位.
本文首先利用乳腺X線攝片灰度分布的先驗(yàn)信息,采用基于直方圖分析的閾值法分割出乳房區(qū)域.然后,針對乳腺腫塊的灰度分布及形態(tài)學(xué)特點(diǎn),采用兩個(gè)不同大小的Sech模板來分層匹配可疑區(qū)域,并在此基礎(chǔ)上提取層間特征、灰度特征及形態(tài)學(xué)特征以區(qū)分假陽性區(qū)域.實(shí)驗(yàn)結(jié)果表明本文方法能夠在保證高敏感度的同時(shí)保持較低的假陽性率.
圖1 乳腺X線攝片及其灰度直方圖
為提高腫塊檢測的效率并避免由背景區(qū)域中的一些噪聲(如標(biāo)簽等)而引起的假陽性,應(yīng)首先對乳腺圖像進(jìn)行分割以去掉背景的影響.典型的乳腺X線攝片(如圖1(a))的內(nèi)容可分為乳房區(qū)域和背景區(qū)域,其中乳房區(qū)域包括:胸壁、腺體組織及皮下脂肪.由于部分腫塊的位置靠近皮下脂肪區(qū),因而需要準(zhǔn)確分割出皮下脂肪,而皮下脂肪區(qū)域的灰度與乳房區(qū)域的灰度差別比較大,更接近于背景區(qū)域,因而增加了分割難度.在典型的乳腺X線攝片中背景區(qū)域的灰度值較低且其分布具有較好的一致性,在直方圖上表現(xiàn)為靠左端的最高峰(如圖1(b)).而皮下脂肪區(qū)域則對應(yīng)分布在靠近這個(gè)最高峰的右側(cè)的局部峰值.基于此先驗(yàn)信息,我們設(shè)計(jì)一種直方圖分析法來對乳房區(qū)域進(jìn)行分割.首先,找到直方圖中的對應(yīng)于背景部分的最高峰,并以此最高峰的位置作為搜索起始值,順序搜索乳腺X線片的灰度空間,找到最高峰右側(cè)的第一個(gè)灰度低谷位置,該位置即代表了背景與乳房區(qū)域的分界值.以此低谷值作為灰度閾值,對乳腺X線片進(jìn)行閾值分割.
圖2 乳房區(qū)域分割結(jié)果
圖1(b)中的T1、T2、T3、T4分別為原始Otsu分割算法、灰度剖面圖結(jié)合Otsu的分割算法[6]、限制灰度范圍的Otsu分割算法[8]以及本文分割算法所得到的分割閾值.圖2則對應(yīng)給出了這四種分割方法的分割結(jié)果.從圖中可以看出:原始Otsu閾值分割的乳房區(qū)域存在明顯的欠分割現(xiàn)象,脂肪區(qū)域沒有被正確地分割;兩種改進(jìn)后的Otsu方法對欠分割現(xiàn)象有一定的改善,但仍然存在,而本文的直方圖閾值法則能很好地找到完整的乳房區(qū)域,為后續(xù)的腫塊檢測提供良好的基礎(chǔ).
模板匹配是一種常用的目標(biāo)定位方法,它通過定義與目標(biāo)相似的模板,計(jì)算模板與子圖像的相似度來尋找目標(biāo).該方法的關(guān)鍵是建立恰當(dāng)?shù)哪0?考慮到乳腺X線攝片中腫塊區(qū)域通常表現(xiàn)為在區(qū)域中心附近的灰度值最高并向四周逐漸降低,其形狀大致類似圓形,且由于和周圍組織的灰度差異而產(chǎn)生一定的對比度.本文設(shè)計(jì)了3種具有與腫塊相似特征的模板,分別定義如下:
Sech模板:
s(x,y)=
(1)
Gauss模板:
g(x,y)=exp(-(x2+y2)/2σ2),
(2)
Sphere模板:
(3)
以模板中心為原點(diǎn),x,y分別表示橫、縱坐標(biāo).β、σ和r分別為控制模板的灰度由中心到邊緣的變化速率的參數(shù).設(shè)L為模板每邊上像素個(gè)數(shù),3種模板在各自的中心處的灰度取得最大值:s(0,0)=g(0,0)=p(0,0)=1,在離中心的距離為L/2的邊緣處的像素的灰度取得最小值.圖3給出了一個(gè)真實(shí)腫塊的灰度分布以及上述3種模板在尺寸為33×33時(shí)的灰度分布圖,其中β、σ和r的值分別取0.08、8和16.
圖3 乳腺腫塊及3種模型的灰度分布
模板與子圖像的匹配相似度直接影響到乳腺腫塊檢測的結(jié)果,這里采用歸一化的互相關(guān)(NCC)來度量.假設(shè)T表示模板圖像,I表示待檢測圖像,μT表示模板圖像的平均灰度,而μI(i,j)表示以(i,j)為中心的子圖像區(qū)域的平均灰度,記T′(i′,j′)-μT,I′(i+i′,j+j′)=I(i+i′,j+j′)-μI(i,j),其中i′=0,…,L-1,j′=0,…,L-1表示模板與圖像重疊區(qū)域,則待檢測圖像在(i,j)處的匹配結(jié)果R(i,j)可表示為:
R(i,j)=
(4)
其中:
按公式(4)計(jì)算每個(gè)像素點(diǎn)處的相似度值,構(gòu)造一幅相似度圖像.在該圖像中,腫塊區(qū)域由于與模板具有高相似度而具有高灰度值.因此,對此圖像其進(jìn)行閾值分割即可定位出原圖像中的可疑區(qū)域.
當(dāng)模板與腫塊大小有顯著差別的時(shí)候,相似度較低,而事實(shí)上乳腺腫塊大小各異.因此,若采用固定大小的模板進(jìn)行匹配,則難以同時(shí)保證高靈敏度和低假陽性率.考慮到乳腺腫塊具有中間灰度高,周圍灰度逐漸降低的類似分層的特點(diǎn).本文提出一種分層多模板匹配的方法,即先用小尺寸模板匹配腫塊的中心區(qū)域,由于小模板具有高敏感度,匹配結(jié)果可檢測到絕大多數(shù)的可疑區(qū)域,但是其中同時(shí)包含有較多的假陽性;再用大尺寸模板進(jìn)行腫塊區(qū)域匹配,大模板檢測到得可疑區(qū)域數(shù)目相對較少,可能會(huì)漏掉一些腫塊,但是大模板檢測得到的可疑區(qū)域?yàn)槟[塊的可能性相對更高,且大模板也可能檢測到小模板漏檢的腫塊;最后綜合兩者的檢測結(jié)果.這樣既可以獲得更高的敏感度,減少腫塊漏檢的情況,也同時(shí)突出了那些由大模板檢測出來的可疑性較高的區(qū)域,便于與假陽性區(qū)域相區(qū)分.
為比較上述3種類型的模板對不同大小的腫塊的敏感性,隨機(jī)選取70個(gè)不同大小的腫塊,對上述3種類型模板,每種設(shè)計(jì)13種不同尺寸(從17×17到65×65)的模板并分別與每個(gè)腫塊相匹配,計(jì)算匹配相似度,然后統(tǒng)計(jì)各種模板在不同尺寸下與70個(gè)腫塊相匹配的平均相似度值.結(jié)果如圖4所示.
圖4 3種模板在不同尺度下匹配結(jié)果比較
從圖4可以看出,在各種尺寸下,Sech模板相對于同尺寸的Gauss模板和Sphere模板具有更高的匹配相似度,即Sech模板能夠檢測出更多的可疑腫塊,可減少腫塊的漏檢.因此,本文選用Sech模板來進(jìn)行多尺度模板匹配.另外,從統(tǒng)計(jì)結(jié)果可看出:對于各種不同大小的腫塊,Sech模板的尺寸為33×33左右時(shí)其匹配平均相似度最高,因此小模板的尺寸設(shè)為33×33,而大模板的尺寸則設(shè)為65×65.多尺度分層匹配的具體步驟如下.
Step1.用一個(gè)小Sech模板對腫塊區(qū)域進(jìn)行匹配,對匹配結(jié)果進(jìn)行閾值分割得到可疑區(qū)域.
Step2.用一個(gè)大Sech模板對腫塊區(qū)域進(jìn)行匹配,對匹配結(jié)果進(jìn)行閾值分割得到可疑區(qū)域.
Step3.對兩次匹配的結(jié)果進(jìn)行加權(quán),且給大模板的匹配結(jié)果以稍高的權(quán)重將兩次匹配的結(jié)果合并,取兩者中匹配值較大者作為結(jié)果圖像的灰度值.
Step4.對合并后的結(jié)果做適當(dāng)?shù)男螒B(tài)學(xué)膨脹變換,使得匹配結(jié)果更接近真實(shí)腫塊.
圖5給出了多尺度Sech模板匹配過程:圖5(a)是一幅包含腫塊的乳腺X線攝片,圖5(b-c)則是分別是用小模板和大模板對其進(jìn)行檢測的結(jié)果,圖5(d))是加權(quán)合并之后做適當(dāng)?shù)男螒B(tài)學(xué)膨脹變換的結(jié)果.
圖5 多尺度模板匹配
對上述檢測結(jié)果:采用基于動(dòng)態(tài)規(guī)劃的分割算法[9]對其提取輪廓;提取包括層間特征、灰度特征及形態(tài)學(xué)特征在內(nèi)的10個(gè)特征;將這些特征輸入到事先設(shè)計(jì)好的Fisher分類器中,對可疑腫塊是否為真陽性做出判斷.
對DDSM數(shù)據(jù)庫[10]中的153位病患者某側(cè)乳腺組織的軸位(簡稱CC)視圖和側(cè)斜位(簡稱MLO)視圖共306幅乳腺X線攝片進(jìn)行實(shí)驗(yàn).每個(gè)患者的該側(cè)乳腺組織已被確診包含有一個(gè)腫塊病灶,且腫塊病灶信息均已被放射科醫(yī)師記錄下來.圖6所示是應(yīng)用本文的檢測方法對一幅軸位視圖(左)和一幅側(cè)斜位視圖(右)進(jìn)行檢測得到的結(jié)果,圖中白色邊界區(qū)域表示檢測出的真陽性區(qū)域,黑色邊界區(qū)域表示檢測出的假陽性區(qū)域.
圖6 對兩個(gè)病例圖像的檢測結(jié)果
為全面評(píng)估本文腫塊檢測算法的性能,實(shí)驗(yàn)過程中采用自由響應(yīng)的受試者操作特性曲線(FROC Curve)對算法進(jìn)行性能測試.為比較單模板匹配與多尺度模板分層匹配的效果,圖7給出了分別采用小模板、大模板、分層多模板進(jìn)行匹配的FROC曲線.
圖7 FROC曲線
由于乳腺CAD在臨床應(yīng)用中首先要保證較高的敏感度,表1列出了3種模板匹配方法敏感度在70%以上時(shí)的假陽性率.從圖7和表1中可以看出,多尺度模板匹配方法不僅能夠獲得更高的敏感度,而且在相同的敏感度下其假陽性率更低.
表1 模板匹配性能比較
文獻(xiàn)[6]中在DDSM數(shù)據(jù)庫中的由“LUMISYS”數(shù)字轉(zhuǎn)換器得到的270幅軸位視圖數(shù)據(jù)集上進(jìn)行訓(xùn)練和測試的,其敏感度在92%,88%,81%時(shí)對應(yīng)的平均每幅圖像上的假陽性個(gè)數(shù)分別為5.4,2.4,0.6.另外,對于同樣在DDSM上進(jìn)行測試的腫塊檢測算法: Catarious等人[2]在83幅圖像上進(jìn)行測試,算法的敏感度保持在92%時(shí),其假陽性率為每幅圖像5.2個(gè).Masotti等人[11]的算法則在敏感度為70%時(shí)其假陽性率為平均每幅圖像0.92個(gè).而本文則在DDSM中由“LUMISYS”數(shù)字轉(zhuǎn)換器得到的306幅包括軸位視圖和側(cè)斜位視圖(側(cè)斜位視圖通常因?yàn)榘^大的胸壁區(qū)而假陽性率更高)的數(shù)據(jù)集進(jìn)行測試,其結(jié)果在敏感度為92%,88%,81%時(shí)假陽性率分別為3.2,2.3,0.7.而且,而本文的最高敏感度可達(dá)95%,同時(shí)保持平均每幅圖像只有3.8個(gè)假陽性.可見,本文基于多尺度模板匹配的腫塊檢測算法確實(shí)是一種行之有效的檢測方法.可有效地輔助醫(yī)生提高乳腺癌檢測的精準(zhǔn)度和效率.
[1]Burhenne LJ W,Wood S A,D′Orsi C J,et al.Pote ntial contribution of computer-aided detection to the sensitivity of screening mammography[J].Radiology,2000,215: 554-562.
[2]Catarious D M,Baydush A H,F(xiàn)loyd C E.Characteri-zation of difference of Gaussian filters in the detection of mammographic regions[J].Medical Physics,2006,33 (11): 4104-4114.
[3]Yuan Y D,Giger M L,Li H,et al.A dual-stage method for lesion segmentation on digital mammograms[J].Medical Physics,2007,34(11): 4180-4193.
[4]Sampat M P,Markey M K,Bovik A C.Computer-aided detection and diagnosis in mammography[M].2nd ed.New York: Academic,2005:1195-1217.
[5]Sang C P,Pu J T,Zheng B.Improving performance of computer-aided detection scheme by combining results from two machine learning classifiers[J].Academic Radiology,2009,16(3):266-274.
[6]Eltonsy N H,Tourassi G D,Elmaghraby AS.A concen-tric morphology model for the detection of masses in mammography[J].IEEE Transactions on Medical Imaging,2007,26(06):880-889.
[7]Polakowaki W E,Cournoyer D A,Rogers S K,et al.Computer-aided breast cancer detection and diagnosis of masses using difference of Gaussians and derivative-based feature saliency[J].IEEE Transactions on Medical Imaging,1997,16(6):811-819.
[8]許向陽,宋恩民,金良海.Otsu準(zhǔn)則的閾值性質(zhì)分析[J].電子學(xué)報(bào),2009,37(12):2716-2719.
[9]Song E M,Xu S Z,Xu X Y,et al.Hybrid Segmentation of mass in mammograms using template matching and dynamic programming[J].Academic Radiology,2010,17(11):1414-1424.
[10]Heath M,Bowyer K,Kopans D,et al.The digital database for screening mammography[C]// Yaffe M J.Proceedings of the Fifth International Workshop on Digital Mammography.Berlin: Springer-Verlag,2001.
[11]Masotti M,Lanconelli N,Campanini Renato.Compu-ter-aided mass detection in mammography: false positive reduction via gray-scale invariant ranklet texture feature[J].Medical Physics,2009,36(2):311-316.