国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于乳腺鉬靶側(cè)斜位圖像的近期乳腺癌風(fēng)險(xiǎn)預(yù)測研究

2018-05-26 07:30:07李顏娥ZhengBin厲力華
關(guān)鍵詞:不對稱性全局乳腺

李顏娥 張 朋 范 明 Zheng Bin,2 厲力華*

1(杭州電子科技大學(xué)生命信息與儀器工程學(xué)院,杭州 310018)2(School of Electrical and Computer Engineering, University of Oklahoma, Tulsa, OK 74135, USA)

引言

乳腺癌是嚴(yán)重危害女性身心健康的惡性腫瘤,近年來婦女的乳腺癌發(fā)病率呈逐年上升趨勢,已成為城市女性的頭號(hào)殺手[1]。大量研究結(jié)果表明,通過早期診斷和治療,可以很大程度上降低乳腺癌患者的死亡率,并能提高癌癥治療后的生活質(zhì)量[2]。為了提高檢測和有效治療乳腺癌,中國正在積極推進(jìn)乳腺普查工作,在各種乳腺癌普查和早期檢測技術(shù)中,X光鉬靶成像技術(shù)是目前公認(rèn)的相對可靠有效可以普遍推廣的普查方法[3]。但是,乳腺鉬靶圖像是一種將三維乳腺組織結(jié)構(gòu)投影到二維空間的圖像,極大地增加了醫(yī)生正確診斷乳腺癌的難度[4]。同時(shí),在普查的環(huán)境中往往會(huì)產(chǎn)生較高假陽性率,造成過診斷問題[5]。所以,對于全民統(tǒng)一的乳腺癌普查是一項(xiàng)高成本低產(chǎn)出的工作,需要耗費(fèi)大量寶貴的醫(yī)療資源[6]。為改善乳腺癌普查成效,逐步廢除全民統(tǒng)一的普查模式,建立個(gè)體化的乳腺癌普查模式已在癌癥普查和流行病學(xué)研究領(lǐng)域逐步取得共識(shí)[7]。通過近期乳腺癌風(fēng)險(xiǎn)預(yù)測分析,高風(fēng)險(xiǎn)婦女需較頻繁地普查,而大多數(shù)低風(fēng)險(xiǎn)婦女可降低檢查頻率,從而把有限醫(yī)療資源集中于近期高風(fēng)險(xiǎn)人群中,同時(shí)避免現(xiàn)行普查對低風(fēng)險(xiǎn)婦女帶來的可能傷害。為實(shí)現(xiàn)個(gè)體化乳腺癌普查模式,建立以乳腺鉬靶圖像為基礎(chǔ)的近期乳腺癌風(fēng)險(xiǎn)評估模型是有重大意義的。

傳統(tǒng)的乳腺癌風(fēng)險(xiǎn)預(yù)測方法主要依賴乳腺癌風(fēng)險(xiǎn)因子,包括基因信息、家族史、年齡及乳腺密度等進(jìn)行長期的乳腺癌風(fēng)險(xiǎn)預(yù)測[8],而乳腺癌是一個(gè)逐步發(fā)展的過程,傳統(tǒng)乳腺癌風(fēng)險(xiǎn)預(yù)測模型不能提供近期乳腺癌風(fēng)險(xiǎn)概率[9]。近年來有學(xué)者開始對個(gè)體化乳腺癌風(fēng)險(xiǎn)預(yù)測進(jìn)行研究,主要采用單側(cè)乳腺鉬靶圖像特征進(jìn)行分析[8, 10-14]。一些新的研究表明,在近期乳腺癌風(fēng)險(xiǎn)預(yù)測方面乳腺鉬靶圖像雙側(cè)不對稱性特征表現(xiàn)顯著高于單側(cè)特征[15-19]。但目前只進(jìn)行了全局區(qū)域雙側(cè)不對稱性特征的研究,而雙側(cè)局部不對稱性在臨床乳腺癌診斷中起到重要作用。為此,前期研究了乳腺鉬靶圖像局部不對稱性與乳腺癌近期風(fēng)險(xiǎn)的關(guān)聯(lián)關(guān)系[20],以及乳腺鉬靶圖像局部區(qū)域結(jié)合全局區(qū)域的雙側(cè)不對稱性特征與近期乳腺癌風(fēng)險(xiǎn)預(yù)測研究的關(guān)聯(lián)性,并在頭尾位圖像中進(jìn)行了研究。本課題則對乳腺鉬靶圖像側(cè)斜位(mediolateral oblique, MLO)的局部結(jié)合全局雙側(cè)不對稱性特征與近期乳腺癌風(fēng)險(xiǎn)預(yù)測的關(guān)聯(lián)性進(jìn)行了探討研究。與其他采用雙側(cè)鉬靶圖像不對稱性進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測方法相比,本研究的主要改進(jìn)和新意體現(xiàn)在:第一,在策略上,采用局部區(qū)域不對稱性與全局區(qū)域不對稱性相結(jié)合的方法,進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測;第二,在特征選擇上,提取了灰度圖像、多方向Gabor濾波尺度響應(yīng),相位響應(yīng)的目標(biāo)區(qū)域空間差異性和結(jié)構(gòu)相似性特征,以及可疑鈣化點(diǎn)區(qū)域位置信息特征;第三,在數(shù)據(jù)上,采取高風(fēng)險(xiǎn)組樣本的年齡與低風(fēng)險(xiǎn)組樣本的年齡互相匹配,既減少了年齡這一重要風(fēng)險(xiǎn)因子帶來的預(yù)測偏差,也能夠進(jìn)行不同年齡段的風(fēng)險(xiǎn)預(yù)測研究。該研究方法首先對雙側(cè)MLO位圖像經(jīng)過去皮膚、胸肌分割、乳頭檢測等預(yù)處理,分割出雙側(cè)局部對應(yīng)區(qū)域及全局區(qū)域作為目標(biāo)區(qū)域,然后提取灰度圖像、多方向Gabor濾波尺度響應(yīng)及相位響應(yīng)的空間差異性、結(jié)構(gòu)相似性,以及位置信息等85維影像特征。經(jīng)去相關(guān)處理后,采用留一法及逐步回歸進(jìn)行特征選擇,并建立基于廣義線性模型(generalized linear model, GLM)的近期乳腺癌風(fēng)險(xiǎn)預(yù)測模型。本研究主要采用ROC曲線、優(yōu)勢比(adjusted odds ratio, OR)以及混淆矩陣分析靈敏度及特異性等對模型進(jìn)行評價(jià)。研究結(jié)果表明,從乳腺鉬靶側(cè)斜位圖像提取的局部及全局不對稱性特征對近期乳腺癌風(fēng)險(xiǎn)預(yù)測,可提供潛在有效價(jià)值。

1 材料和方法

1.1 研究對象

本次研究所用數(shù)據(jù)皆來自俄克拉荷馬大學(xué),包括2006—2015年的556例樣本。這些樣本均有連續(xù)兩年進(jìn)行乳腺普查,前一年普查均為陰性,當(dāng)前年患癌(高風(fēng)險(xiǎn)組)及陰性樣本(低風(fēng)險(xiǎn)組)各278例,且兩組樣本的年齡逐一匹配。所有病例均為女性,年齡范圍在37~87歲。本研究采用前一年數(shù)據(jù)作為研究對象,樣本信息如表1所示。

表1 高風(fēng)險(xiǎn)組與低風(fēng)險(xiǎn)組樣本信息

1.2 圖像預(yù)處理

首先對乳腺鉬靶側(cè)斜位原始影像進(jìn)行去皮膚、胸肌分割及乳頭檢測等預(yù)處理獲取乳腺區(qū)域,然后對全局區(qū)域及局部區(qū)域包括水平帶狀區(qū)域、垂直帶狀區(qū)域和基元區(qū)域進(jìn)行分割。

1.2.1去皮膚處理

本研究采用基于多方向Gabor濾波變換及Otsu閾值方法進(jìn)行皮膚檢測[21]。首先對原始圖像去標(biāo)簽后進(jìn)行灰度增強(qiáng)處理,在此基礎(chǔ)上采用18方向Gabor濾波變換獲取Gabor濾波尺度響應(yīng),然后對其進(jìn)行Otsu閾值變換及面積濾波去除皮膚。

1.2.2胸肌檢測

本研究采用基于霍夫變換的半自動(dòng)方法進(jìn)行胸肌檢測[22]。具體方法如圖1所示,對原始圖像(見圖1( a))進(jìn)行去皮膚處理后,分割包含胸肌的感興趣區(qū)域(ROI),如圖1(b)所示。其中,N1為最左上側(cè)像素點(diǎn),N5為最左下側(cè)像素點(diǎn),N2為乳腺區(qū)域中距離N5最遠(yuǎn)的點(diǎn),N3為N1與N5的中間點(diǎn),N1、N2、N3與N4構(gòu)成矩形區(qū)域。對該區(qū)域進(jìn)行歸一化及圖像增強(qiáng)處理后,采用高斯濾波(σx=σy=4)方法進(jìn)行去噪,然后求取ROI區(qū)域的Canny算子梯度,經(jīng)形態(tài)學(xué)處理后進(jìn)行霍夫變換并檢測直線,如圖1(d)所示。選擇滿足條件延長直線與N1和N2有一個(gè)交點(diǎn)且與N1和N5有一個(gè)交點(diǎn)的最長直線表示胸肌,如圖1(e)所示。分割結(jié)果如圖1(f)所示。

圖1 胸肌檢測。(a)原始圖像;(b)感興趣區(qū)域及控制點(diǎn);(c)感興趣區(qū)域;(d)感興趣區(qū)域的霍夫變換;(e)檢測出的胸肌線;(f)去除胸肌后圖像

1.2.3乳頭檢測

1.3 目標(biāo)區(qū)域分割

1.3.1帶狀區(qū)域

根據(jù)Tabar等提出的側(cè)斜位圖像水平標(biāo)記及側(cè)斜標(biāo)記思想[11],本研究對圖像進(jìn)行了平行于胸肌方向的垂直帶狀分割與垂直于胸肌方向的水平帶狀分割。對原始圖像預(yù)處理后,以乳頭位置為基準(zhǔn)點(diǎn),胸肌方向?yàn)閰⒖挤较蜻M(jìn)行分割,如圖2(a)所示。對于垂直帶狀區(qū)域,分別對左右乳腺圖像沿胸肌方向?qū)⑷橄賵D像平均分割為9個(gè)帶狀區(qū)域,如圖2(b)所示;取每個(gè)帶狀區(qū)域面積最大的矩形區(qū)域作為垂直帶狀目標(biāo)區(qū)域,如圖2(c)所示。對于水平帶狀區(qū)域,以乳頭位置及垂直胸肌方向?yàn)閰⒖紝⑷橄賵D像分為上下區(qū)域,分別對左右乳腺圖像的上下區(qū)域沿垂直于胸肌方向各平均分為4.5個(gè)帶狀區(qū)域,每個(gè)圖像上下區(qū)域共分為9個(gè)帶狀區(qū)域,如圖2(d)所示;取每個(gè)帶狀區(qū)域面積最大的矩形區(qū)域作為水平帶狀目標(biāo)區(qū)域,如圖2(e)所示。

圖2 帶狀區(qū)域分割。(a)原始圖像;(b)垂直帶狀區(qū)域;(c)垂直帶狀矩形區(qū)域;(d)水平帶狀區(qū)域;(e)水平帶狀矩形區(qū)域

圖3 基元區(qū)域分割。(a)原始圖像;(b)乳腺區(qū)域;(c)高斯差分濾波圖像;(d)基元區(qū)域

1.3.2基元區(qū)域

高斯差分(difference of gaussian, DoG)濾波可以將圖片中感興趣區(qū)域增強(qiáng),在乳腺鉬靶圖像中常被用來檢測可疑區(qū)域、乳腺腫塊等[14]。對原始圖像預(yù)處理后進(jìn)行高斯差分濾波(帶寬分別設(shè)為7和51)、閾值處理和形態(tài)學(xué)計(jì)算獲得基元區(qū)域[21],如圖3所示。

1.3.3全局區(qū)域

本研究采用乳腺區(qū)域的最大面積矩形區(qū)域作為全局區(qū)域[19],如圖4所示。

圖4 全局區(qū)域分割。(a)原始圖像;(b)乳腺區(qū)域;(c)全局區(qū)域

1.4 影像特征提取

本研究針對帶狀區(qū)域提取空間差異性特征及結(jié)構(gòu)相似性特征,針對基元區(qū)域提取其位置特征,針對全局區(qū)域提取空間差異性特征、結(jié)構(gòu)相似性特征及密度緊湊度特征。雙側(cè)圖像對應(yīng)特征的差值絕對值作為不對稱性特征進(jìn)行統(tǒng)計(jì)分析。

1.4.1空間差異性特征提取

由于半方差函數(shù)可以描述區(qū)域的空間變化尺度和模式差異性,本研究采用半方差函數(shù)描述符進(jìn)行乳腺鉬靶圖像局部區(qū)域的空間差異性分析。二維變異函數(shù)為

(1)

式中,um,0和um,h是空間坐標(biāo)(x,y)處以步長h分離的兩個(gè)向量對,f為灰度值。

Casti 等采用空間差異性計(jì)算乳腺鉬靶圖像雙側(cè)不對性[12],本研究引入該類特征進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測研究。對于每對帶狀區(qū)域,設(shè)置最大步長hmax為兩個(gè)區(qū)域中較小區(qū)域長度的一半,將hmax分為n等份,單元長度Δx=hmax/n,步長h分別設(shè)置為Δx,2Δx,...,nΔx,每個(gè)區(qū)域得到n個(gè)半方差值。以x軸表示不同觀測步長(h),y軸表示半方差值,得到經(jīng)驗(yàn)半方差圖。采用球形最小二乘法對經(jīng)驗(yàn)半方差擬合,得到擬合函數(shù)。以本研究采用數(shù)據(jù)中的某樣本為例,對左右兩側(cè)乳腺鉬靶圖像的中心區(qū)域進(jìn)行空間差異性分析,獲得左右兩側(cè)圖像的經(jīng)驗(yàn)半方差圖及對應(yīng)的擬合函數(shù),如圖5各點(diǎn)及曲線所示。其中,實(shí)點(diǎn)菱形及實(shí)曲線分別為左側(cè)乳腺鉬靶圖像經(jīng)驗(yàn)半方差值和擬合曲線,空心方格及虛曲線分別為右側(cè)乳腺鉬靶圖像經(jīng)驗(yàn)半方差值和擬合曲線。3個(gè)符號(hào)s、a、r分別表示半方差圖的3個(gè)重要特征:基臺(tái)值、塊金方差和變程。其中,基臺(tái)值(sill,s)表示隨機(jī)變量的方差,變程(range,r)反映了研究對象中某一區(qū)域化變量的變化程度,塊金方差(nugget variance,a)表示微小變異。

圖5 空間變異曲線

在帶狀區(qū)域中首先計(jì)算左右圖像各帶狀區(qū)域的塊金方差、基臺(tái)值及變程,然后計(jì)算左右圖像對應(yīng)帶狀區(qū)域相應(yīng)特征的差值絕對值,再提取其統(tǒng)計(jì)特征包括幾何平均值和眾數(shù)作為該樣本不對稱性特征。在全局區(qū)域中,首先計(jì)算左右圖像全局區(qū)域的塊金方差、基臺(tái)值及變程,然后計(jì)算左右圖像對應(yīng)帶狀區(qū)域相應(yīng)特征的差值絕對值,將差值絕對值作為該樣本不對稱性特征。在灰度圖像、Gabor濾波尺度響應(yīng)及Gabor濾波相位響應(yīng)中均進(jìn)行了這類特征提取,對帶狀區(qū)域共提取空間差異性特征36個(gè),針對全局區(qū)域共提取空間差異性特征18個(gè)。

1.4.2結(jié)構(gòu)相似性特征提取

結(jié)構(gòu)相似度(structure similarity, SSIM)指數(shù)是將圖像亮度、對比度和結(jié)構(gòu)3個(gè)因素組合來描述兩個(gè)圖像的相似度,通常采用均值進(jìn)行亮度估計(jì),采用標(biāo)準(zhǔn)差進(jìn)行對比度估計(jì),采用協(xié)方差作為結(jié)構(gòu)相似度估計(jì)[17]。給定大小為M×N的矩形圖像對X和Y,二者間的SSIM計(jì)算公式為

(2)

式中,μx、μy為X和Y的均值,σx、σy為X和Y的方差,σxy為X和Y的協(xié)方差,K1、K2為常數(shù)。

針對每一樣本,首先以左右對應(yīng)區(qū)域中心位置為基準(zhǔn)點(diǎn)獲取大小相等區(qū)域。然后計(jì)算左右圖像各帶狀區(qū)域的結(jié)構(gòu)相似性指數(shù)SSIM,并計(jì)算SSIM的統(tǒng)計(jì)特征均差值的差值絕對值作為該樣本不對稱性特征。同時(shí),在灰度圖像、Gabor濾波尺度響應(yīng)及相位響應(yīng)對應(yīng)區(qū)域均提取了該類特征。對全局區(qū)域,則計(jì)算左右圖像SSIM的差值絕對值為該樣本不對稱性特征。對帶狀區(qū)域共提取結(jié)構(gòu)相似性特征6個(gè),針對全局區(qū)域共提取結(jié)構(gòu)相似性特征3個(gè)。

1.4.3基元區(qū)域位置信息特征提取

本研究采用高斯差方法檢測乳腺鉬靶圖像可疑區(qū)域,并提取位置信息特征進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測研究。為方便建立坐標(biāo)系進(jìn)行位置信息表達(dá),將圖像旋轉(zhuǎn)θ,其中θ為胸肌與垂直方向夾角,以乳頭為原點(diǎn),垂直于胸肌方向?yàn)閤軸建立坐標(biāo)系,以距離及角度表示區(qū)域中每個(gè)像素點(diǎn)的位置信息,如圖6(b)所示。將左右乳腺區(qū)域以乳頭為參考點(diǎn),各自分成6個(gè)部分,乳頭上側(cè)分為1.5個(gè)等寬區(qū)域,下側(cè)分為1.5個(gè)等寬區(qū)域,乳頭位置至垂直胸肌分為等長兩個(gè)區(qū)域,如圖6(c)所示。分別計(jì)算左右兩個(gè)圖像每個(gè)部分的基元區(qū)域中各像素點(diǎn)的距離及角度的統(tǒng)計(jì)特征,左右對應(yīng)部分的距離及角度統(tǒng)計(jì)特征的差值的絕對值作為不對稱性特征。

圖6 基元區(qū)域坐標(biāo)系及子區(qū)域。(a)原始圖像;(b)基元區(qū)域坐標(biāo)系;(c)基元區(qū)域子區(qū)域

針對每一樣本,首先計(jì)算左右圖像各部分基元區(qū)域像素點(diǎn)與原點(diǎn)的距離及角度,然后計(jì)算這些像素點(diǎn)距離的最小值,角度的方差和范圍,對左右圖像對應(yīng)部分的距離和角度統(tǒng)計(jì)特征的差值絕對值作為該樣本不對稱性特征,在6個(gè)部分中共提取該類特征18個(gè),在整體基元區(qū)域提取該類特征3個(gè)。

1.4.4密度相關(guān)特征提取

針對預(yù)處理后的乳腺區(qū)域提取其緊密度特征。給定大小為M×N的矩形圖像X,計(jì)算其密度緊湊度。左右圖像的密度緊湊度差值的絕對值作為該樣本的不對稱性特征,有

1.5 特征選擇及風(fēng)險(xiǎn)預(yù)測分析

本研究共提取了60維局部區(qū)域特征,25維全局區(qū)域特征??紤]到影像特征中冗余的現(xiàn)象,首先進(jìn)行了去冗余處理,篩選掉相關(guān)性較大的特征。具體方法為:通過相關(guān)性分析篩選掉所有特征中相關(guān)系數(shù)較大的特征,當(dāng)兩個(gè)特征相關(guān)系數(shù)大于給定閾值(閾值設(shè)置為0.6[23-24])時(shí),篩掉與其他特征相關(guān)性大的特征。本研究通過去冗余處理,篩選掉7個(gè)特征,保留78個(gè)兩兩相關(guān)性均小于0.6的特征。然后通過留一法和逐步邏輯回歸進(jìn)行特征選擇,并利用廣義線性模型(generalized linear model, GLM)建立近期乳腺癌風(fēng)險(xiǎn)預(yù)測模型。由于年齡和乳腺X線分型是乳腺癌重要風(fēng)險(xiǎn)因子,因此根據(jù)年齡段分為3個(gè)子集:年齡段1,37~49歲,共148例;年齡段2,50~65歲,共314例;年齡段3,66~87歲,共94例,分別進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測分析。同時(shí),由于該樣本乳腺X線分型脂肪型(BIRADS 1)只有26例,而致密型(BIRADS 4)只有17例,因此本研究根據(jù)乳腺X線分型將樣本分為2個(gè)子集:214例少量腺體型(BIRADS 2)和299例多量腺體型(BIRADS 3),對其進(jìn)行了近期乳腺癌風(fēng)險(xiǎn)預(yù)測分析。本研究主要采用ROC曲線(AUC值)、優(yōu)勢比(odds ratio, OR)以及混淆矩陣分析靈敏度及特異性等,對模型進(jìn)行評價(jià)。

2 結(jié)果

2.1 近期乳腺癌風(fēng)險(xiǎn)預(yù)測模型評價(jià)

對全局區(qū)域雙側(cè)不對性特征及局部區(qū)域雙側(cè)不對性特征,分別采用本研究建立的模型進(jìn)行分析,其AUC值分別為0.527 3±0.024 3與0.632 6±0.023 3。將全局區(qū)域不對稱性特征與局部區(qū)域不對稱性特征相結(jié)合,進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測,AUC值提高為0.666 7±0.022 6,如表2及圖7所示。

表2 全局不對稱性特征、局部不對稱性特征及二者相結(jié)合的風(fēng)險(xiǎn)預(yù)測AUC值及95% 置信區(qū)間

圖7 對全局不對稱性特征、局部不對稱性特征及二者相結(jié)合的ROC曲線

本研究采用留一法和逐步邏輯回歸進(jìn)行特征選擇,針對556個(gè)樣本共進(jìn)行了556次特征選擇,在這些特征選擇中被選擇的特征共23個(gè),其中包括8個(gè)局部區(qū)域不對稱性特征和5個(gè)全局區(qū)域不對稱性特征。針對這些特征,采用Weka軟件組合樹結(jié)構(gòu)和Logistic回歸模型LMT方法進(jìn)行10折交叉驗(yàn)證分析,獲得單特征風(fēng)險(xiǎn)預(yù)測的AUC值及靈敏度,如表3所示。選擇次數(shù)高于500的被選擇特征其靈敏度最低的特征為第6部分基元區(qū)域的角度范圍不對稱性特征,靈敏度為0.435 3;反之,靈敏度最高的特征為全局區(qū)域沿垂直方向的基臺(tái)值,靈敏度為0.928 1。

對局部區(qū)域不對稱性特征與全局區(qū)域不對稱性特征相結(jié)合進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測,獲得每個(gè)樣本的風(fēng)險(xiǎn)預(yù)測值,共556個(gè)風(fēng)險(xiǎn)預(yù)測值。將其按序從小到大排列后按序均分為5組,其中1~4組各111個(gè)樣本,第5組為112個(gè)樣本,對這5組樣本分別計(jì)算各組中高風(fēng)險(xiǎn)樣本個(gè)數(shù)及低風(fēng)險(xiǎn)樣本個(gè)數(shù),并將第1組作為基準(zhǔn)值,后面4組分別以此為基準(zhǔn)計(jì)算其優(yōu)勢比OR值及對應(yīng)95%置信區(qū)間,結(jié)果如表4所示。其中,5組中最大的OR值為5.208 3,對應(yīng)95%置信區(qū)間為[2.94, 9.22],對風(fēng)險(xiǎn)預(yù)測值進(jìn)行回歸分析,各組OR值隨風(fēng)險(xiǎn)概率的增大而逐漸增大,增加趨勢一致(P值為0.002 033 )。

表3 被選擇特征及其性能表現(xiàn)

表4 局部區(qū)域特征結(jié)合全局區(qū)域特征獲得的OR值

采用局部區(qū)域結(jié)合全局區(qū)域不對稱性特征進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測,獲得每個(gè)樣本風(fēng)險(xiǎn)預(yù)測值,由此計(jì)算得到混淆矩陣如表5所示。

表5 局部區(qū)域結(jié)合全局區(qū)域不對稱性特征獲得的風(fēng)險(xiǎn)預(yù)測值的混淆矩陣

從表5可以看到,采用局部區(qū)域不對稱性與全局區(qū)域不對稱性特征相結(jié)合進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測,該模型特異性為0.690 6,靈敏度為0.521 6,準(zhǔn)確率為60.61%,陽性預(yù)測值為0.627 7,陰性預(yù)測值為0.590 8。

2.2 基于年齡的乳腺癌風(fēng)險(xiǎn)預(yù)測模型評價(jià)

對局部區(qū)域特征聯(lián)合全局區(qū)域特征進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測,對獲得樣本風(fēng)險(xiǎn)預(yù)測值根據(jù)樣本年齡分為3組,計(jì)算各組的AUC值,如表6所示,對應(yīng)ROC曲線如圖8所示。結(jié)果顯示,樣本年齡段37~49歲的AUC值達(dá)到0.681 0±0.043 2,高于樣本年齡段50~65歲及66~87歲的AUC值,但采用R語言DeLong檢驗(yàn)表明三者之間均無顯著差異(P>0.05)。而樣本年齡段50~65歲的AUC值與樣本年齡段66~87歲的AUC值分別為0.671 6±0.030 0和0.678 2±0.054 7,二者接近一致。

表7 不同年齡段的OR值及對應(yīng)95% 置信區(qū)間

表6 不同年齡段的風(fēng)險(xiǎn)預(yù)測AUC值及95% 置信區(qū)間

對3個(gè)年齡段樣本的風(fēng)險(xiǎn)概率值由小到大進(jìn)行排列,分別將其均分為5組,分別計(jì)算OR值及對應(yīng)95%置信區(qū)間,結(jié)果如表7所示。3個(gè)年齡段樣本最大的OR值分別6.708 3,5.238 1及4.190 5,對應(yīng)的95%置信區(qū)間分別為[2.186 3, 20.583 5],[2.463 6, 11.137 1]及[1.104 4, 15.900 6]。

圖8 基于年齡段的近期乳腺癌風(fēng)險(xiǎn)預(yù)測ROC曲線

對每個(gè)年齡段的風(fēng)險(xiǎn)概率值分為5組后,計(jì)算各組OR值隨風(fēng)險(xiǎn)概率的增大而進(jìn)行變化的情況,年齡段37~49歲的樣本集與年齡段50~65歲的樣本集其增加趨勢逐漸上升,P值分別為0.005 819和0.008 394,均小于0.05,而年齡段66~87歲的的樣本集OR值趨勢沒有顯著增加(P值為0.080 14),各年齡段樣本集的OR值趨勢走向如圖9所示。

圖9 基于年齡段的近期乳腺癌風(fēng)險(xiǎn)預(yù)測OR值趨勢

對不同各年齡段的風(fēng)險(xiǎn)預(yù)測值計(jì)算對應(yīng)混淆矩陣(分類閾值設(shè)為0.7),如表8所示。

表8 不同年齡段的風(fēng)險(xiǎn)預(yù)測混淆矩陣

由表8可以看出,對年齡段37~49歲的148例樣本,其特異性為0.702 7,靈敏度為0.554 1,準(zhǔn)確率為62.84%,陽性預(yù)測值為0.650 8,陰性預(yù)測值為0.611 8;對年齡段50~65歲的314例樣本,其特異性和靈敏度分別為0.694 3和0.490 4,準(zhǔn)確率為59.24%,陽性預(yù)測值為0.616 0,陰性預(yù)測值為0.576 7;對年齡段66~87歲的94例樣本,其特異性為0.723 4,靈敏度為0.574 5,準(zhǔn)確率為64.89%,陽性預(yù)測值為0.675 0,陰性預(yù)測值為0.629 6。

2.3 基于乳腺X線分型的乳腺癌風(fēng)險(xiǎn)預(yù)測模型評價(jià)

采用局部區(qū)域特征結(jié)合全局區(qū)域特征進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測,對樣本風(fēng)險(xiǎn)預(yù)測值根據(jù)乳腺密度分型將其分為2組,BIRADS2型及BIRADS3型,計(jì)算各組的AUC值,如表9所示,對應(yīng)ROC曲線如圖10所示。結(jié)果顯示,樣本BIRADS 3的AUC值達(dá)到0.694 4±0.03,高于樣本BIRADS 2的AUC值(0.654 5±0.036 9)。

表9 不同乳腺密度分型的預(yù)測AUC值及95%置信區(qū)間

圖10 基于乳腺密度分型的近期乳腺癌風(fēng)險(xiǎn)預(yù)測ROC曲線

對BIRADS 2和BIRADS 3樣本的風(fēng)險(xiǎn)概率值分別由小到大進(jìn)行排列,并分別將其均分為5組,各自計(jì)算OR值及對應(yīng)95%置信區(qū)間,結(jié)果如表10所示。2組樣本中最大的OR值分別3.720和7.257 4,對應(yīng)的95%置信區(qū)間分別為[1.539 5,8.988 9]和[3.262 5,16.144 0]。

表10 不同乳腺密度分型的OR值及對應(yīng)95% 置信區(qū)間

對樣本集BIRADS 2和樣本集BIRADS 3的風(fēng)險(xiǎn)概率值分為5組后,分別計(jì)算各組OR值隨風(fēng)險(xiǎn)概率的增大而進(jìn)行變化的情況,BIRADS 2的樣本集與BIRADS 3的樣本集其增加趨勢逐漸上升,P值分別為0.001 0和0.001 6,均小于0.05,OR值趨勢走向如圖11所示。

圖11 基于乳腺密度分型的近期乳腺癌風(fēng)險(xiǎn)預(yù)測OR值趨勢

對不同乳腺密度分型的風(fēng)險(xiǎn)預(yù)測值計(jì)算對應(yīng)混淆矩陣(分類閾值設(shè)為0.7),如表11所示。表11為不同乳腺X線分型的風(fēng)險(xiǎn)預(yù)測混淆矩陣。對BIRADS 2的214例樣本其特異性為0.676 2,靈敏度為0.522 9,準(zhǔn)確率為59.81%,陽性預(yù)測值為0.626 4,陰性預(yù)測值為0.577 2。對BIRADS 3的299例樣本其特異性為0.733 3,靈敏度為0.536 9,準(zhǔn)確率為63.55%,陽性預(yù)測值為0.666 7,陰性預(yù)測值為0.614 5。

表11 不同乳腺X線分型的風(fēng)險(xiǎn)預(yù)測混淆矩陣

3 討論

本研究對乳腺鉬靶側(cè)斜位圖像的局部區(qū)域結(jié)合全局區(qū)域的雙側(cè)不對稱性特征與近期乳腺癌風(fēng)險(xiǎn)預(yù)測的關(guān)聯(lián)性進(jìn)行了研究,并分別針對不同年齡段和不同乳腺X線分型子樣本集進(jìn)行了分析研究。與前人研究相比,本研究有幾點(diǎn)不同之處,并且得到不同的研究結(jié)果。

1)盡管之前的研究探討了雙側(cè)乳腺鉬靶圖像密度不對稱性對近期乳腺癌風(fēng)險(xiǎn)的影響 且證明了雙側(cè)圖像的不對稱性特征比單圖像特征更具有近期乳腺癌風(fēng)險(xiǎn)預(yù)測能力,但均是針對全局區(qū)域雙側(cè)不對稱性進(jìn)行探討[19,25-27], 而在臨床上雙側(cè)局部密度不對稱性是放射學(xué)家進(jìn)行乳腺鉬靶閱片時(shí)重要的乳腺癌風(fēng)險(xiǎn)評估因子[28-29]。本研究則采用全局區(qū)域與局部區(qū)域雙側(cè)不對稱性相結(jié)合的方法探討了MLO位圖像與近期乳腺癌風(fēng)險(xiǎn)預(yù)測的關(guān)聯(lián)性。本文研究結(jié)果僅采用全局區(qū)域不對稱性特征進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測AUC值為0.527 3±0.024 3,單獨(dú)采用局部區(qū)域不對稱性特征相結(jié)合AUC值上升為0.632 6±0.023,結(jié)果與放射學(xué)家在臨床實(shí)際閱片時(shí)采用局部雙側(cè)鉬靶圖像不對稱性特征,比采用全局雙側(cè)鉬靶圖像不對稱性特征有更高的性能相一致。本研究還顯示全局區(qū)域不對稱性特征與局部區(qū)域不對稱性特征相結(jié)合進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測AUC值得到顯著提高,達(dá)到0.666 7±0.022 6。同時(shí),通過對風(fēng)險(xiǎn)預(yù)測值進(jìn)行回歸分析發(fā)現(xiàn),OR值隨著風(fēng)險(xiǎn)的增加而顯著增加(P值為0.002 033)。

2)由于風(fēng)險(xiǎn)預(yù)測模型依賴于訓(xùn)練和測試的數(shù)據(jù)集,不能將本研究結(jié)果與之前不同數(shù)據(jù)集研究結(jié)果進(jìn)行比較。但是,不同于前人的近期乳腺癌風(fēng)險(xiǎn)預(yù)測研究方法[18, 25-27],本研究采用556例年齡匹配的FFDM數(shù)據(jù)集。利用年齡匹配的數(shù)據(jù)集可以減少由年齡這一重要風(fēng)險(xiǎn)因子帶來的偏差[30]。 同時(shí),本研究采用留一法逐步邏輯回歸進(jìn)行特征選擇建立了一個(gè)基于廣義線性模型(generalized linear model, GLM)的近期乳腺癌風(fēng)險(xiǎn)預(yù)測模型。采用留一法進(jìn)一步減少了來自特征和測試樣本帶來的偏差。因此,本研究應(yīng)該更具有可靠性和魯棒性。

3)本研究探討了風(fēng)險(xiǎn)預(yù)測模型在不同年齡段上的性能表現(xiàn)。對3個(gè)年齡段37~49歲,50~65歲,66~87歲,AUC值分別為0.681 0±0.043 2,0.671 6±0.030 0和0.678 2±0.054 7。雖然三者之間,樣本年齡段37~49歲的AUC值最高,但這3個(gè)年齡段之間的AUC值并無顯著差異(P>0.05)。結(jié)果表明,盡管年齡是乳腺癌的重要風(fēng)險(xiǎn)因子,但是本研究基于年齡段的近期乳腺癌風(fēng)險(xiǎn)預(yù)測研究結(jié)果則表明,乳腺組織模式從陰性到陽性的變化程度在不同年齡段之間并無顯著差異。

4)本研究探討了風(fēng)險(xiǎn)預(yù)測模型在不同乳腺X線分型中的性能表現(xiàn)。由于BIRADS1和BIRADS4樣本數(shù)很少(分別為26例和17例,所占比例分別為4.68%和3.06%),本研究只探討了BIRADS 2和BIRADS 3 的性能表現(xiàn)。BIRAD2和BIRAD3的AUC值分別為0.654 5±0.036 9和0.694 4±0.03。結(jié)果表明,風(fēng)險(xiǎn)預(yù)測AUC值從BIRADS2到BIRADS3有一個(gè)上升的趨勢,與乳腺X線分型這一重要的乳腺癌風(fēng)險(xiǎn)因子進(jìn)行鉬靶密度評估時(shí)等級越高風(fēng)險(xiǎn)越大模式是一致的。

5)本研究探索了以乳腺鉬靶MLO位影像為基礎(chǔ)的個(gè)體化近期乳腺癌風(fēng)險(xiǎn)評估方法,這樣可以把有限的醫(yī)療資源集中應(yīng)用于那些少數(shù)具有近期高風(fēng)險(xiǎn)的人群中,以提高乳腺癌的早期預(yù)防和檢測精度,同時(shí)又可以減少假陽性率。本研究模型在556個(gè)樣本進(jìn)行測試時(shí)其敏感性為0.521 6,特異性為0.690 6,則本研究模型能夠識(shí)別大約30.94%(309/1 000)高風(fēng)險(xiǎn)的人群,剩下的69.05%(691/1 000)為低風(fēng)險(xiǎn)的人群。假設(shè)下一年普查中癌癥檢測率為0.3%(3/1000)[27],采用本研究模型則在這309個(gè)高風(fēng)險(xiǎn)人群中檢測出3個(gè)癌癥患者,癌癥檢測率提升為0.97%(3/309),比當(dāng)前普查的癌癥檢測率0.3%高出3.2倍。在這種更低的癌癥檢測率下,較高的特異性是非常重要的,可以排除一大批低風(fēng)險(xiǎn)概率婦女避免頻繁普查,同時(shí)降低了假陽性率[27]。

本研究表明,從乳腺鉬靶側(cè)斜位圖像提取的局部特征及全局特征與近期乳腺癌風(fēng)險(xiǎn)預(yù)測存在一定的關(guān)聯(lián)性,但本研究仍存在一定局限性。首先樣本數(shù)量相對較少,導(dǎo)致結(jié)果可能存在一定偏差。其次,本研究所用圖像樣本要求連續(xù)兩年進(jìn)行乳腺鉬靶圖像普查,前一年檢查結(jié)果為陰性,但是前次普查“陰性”結(jié)果只是通過圖像判斷,并沒有進(jìn)行病理檢查驗(yàn)證。因此本研究所建立的模型仍需要采用更多樣本數(shù)據(jù)進(jìn)一步進(jìn)行研究驗(yàn)證。

4 結(jié)論

前人研究證明了乳腺鉬靶圖像雙側(cè)不對稱性可以用來預(yù)測近期乳腺癌風(fēng)險(xiǎn),但均是針對全局區(qū)域不對稱性進(jìn)行的研究,且采用的均是年齡不匹配數(shù)據(jù)集[19, 24-26]。為此前期提出了局部區(qū)域結(jié)合全局區(qū)域提取雙側(cè)不對稱性特征進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測研究的方法,并在CC位進(jìn)行了研究[31]。本研究則探討了MLO位圖像采用此方法進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測的價(jià)值。與其他采用雙側(cè)鉬靶圖像不對稱性進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測方法相比,該研究的主要改進(jìn)和新意體現(xiàn)在:第一,在策略上,采用局部區(qū)域不對稱性與全局區(qū)域不對稱性相結(jié)合的方法進(jìn)行近期乳腺癌風(fēng)險(xiǎn)預(yù)測;第二,在特征選擇方面,該研究提取了灰度圖像、多方向Gabor濾波尺度響應(yīng)及相位響應(yīng)的目標(biāo)區(qū)域空間差異性和結(jié)構(gòu)相似性特征,以及可疑鈣化點(diǎn)區(qū)域位置信息特征;第三,在數(shù)據(jù)上,該研究所采用的高風(fēng)險(xiǎn)組樣本的年齡與低風(fēng)險(xiǎn)組樣本的年齡互相匹配,這樣既減少了年齡這一重要風(fēng)險(xiǎn)因子帶來的預(yù)測偏差,也能夠進(jìn)行不同年齡段的風(fēng)險(xiǎn)預(yù)測研究。本研究結(jié)果表明,MLO位圖像采用此方法可以有效幫助近期乳腺癌風(fēng)險(xiǎn)預(yù)測研究。由于本研究仍存在一定局限性,所建立的模型仍需要采用更多樣本數(shù)據(jù)進(jìn)一步進(jìn)行研究驗(yàn)證。

[1] Siegel R, Naishadham D, Jemal A. Cancer statistics, 2013[J]. CA: A Cancer Journal for Clinicians, 2013, 63(1): 11-30.

[2] Tabár L, Vitak B, Chen HHT, et al. Beyond randomized controlled trials[J]. Cancer, 2001, 91(9): 1724-1731.

[3] Vainio H, Bianchini F, Heseltine E. IARC Handbook of Cancer Prevention, Volume 7: Breast Cancer Screening[M]. Lyon: IARC Press, 2002:1-248.

[4] Mandelson MT, Oestreicher N, Porter PL, et al. Breast density as a predictor of mammographic detection: comparison of interval and screen detected cancers[J]. Journal of the National Cancer Institute. 2000;92:1081-1087.

[5] Smith RA, Cokkinides V, Brooks D, et al. Cancer screening in the United States, 2011[J]. CA: A Cancer Journal for Clinicians, 2011, 61(1): 8-30.

[6] Buist DSM, Anderson ML, Haneuse SJPA, et al. Influence of annual interpretive volume on screening mammography performance in the United States[J]. Radiology, 2011, 259(1): 72-84.

[7] Schousboe JT, Kerlikowske K, Loh A, et al. Personalizing mammography by breast density and other risk factors for breast cancer: analysis of health benefits and cost-effectiveness[J]. Annals of Internal Medicine, 2011, 155(1): 10-20.

[8] Amir E, Freedman OC, Seruga B, et al. Assessing women at high risk of breast cancer: a review of risk assessment models[J]. Journal of the National Cancer Institute, 2010, 102(10):680-691.

[9] Gail MH, Mai PL. Comparing breast cancer risk assessment models [J]. Journal of the National Cancer Institute, 2010, 102(10):445-452.

[10] Casti P, Mencattini A, Salmeri M, et al. Automatic detection of the nipple in screen-film and full-field digital mammograms using a novel hessian-based method[J]. Journal of Digital Imaging, 2013, 26(5):948-957.

[11] Brem RF, Torrente J. Breast cancer: The art and science of early detection with mammography: Perception, interpretation, histopathologic correlation[J]. Jama the Journal of the American Medical Association, 2008, 300(300):1822-1822.

[12] Casti P, Mencattini A, Salmeri M, et al. Analysis of structural similarity in mammograms for detection of bilateral asymmetry[J]. IEEE Transactions on Medical Imaging, 2015, 34(2):662-671.

[13] Rafiee G, Dlay SS, Woo WL. Region-of-interest extraction in low depth of field images using ensemble clustering and difference of Gaussian approaches[J]. Pattern Recognition, 2013, 46(10):2685-2699.

[14] Jr CD, Baydush AH, Jr FC. Characterization of difference of Gaussian filters in the detection of mammographic regions[J]. Medical Physics, 2006, 33(11):4104-4114.

[15] Zheng B, Chang YH, Gur D. Computerized detection of masses in digitized mammograms using single-image segmentation and a multilayer topographic feature analysis[J]. Academic Radiology, 1995, 2(11):959-966.

[16] Ayres FJ, Rangayyan RM. Design and performance analysis of oriented feature detectors[J]. Journal of Electronic Imaging, 2007, 16(2):147-154.

[17] Wang Z, Bovik AC, Sheikh HR, et al. Image quality assessment: from error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13(4):600-612.

[18] Zheng B, Sumkin JH, Zuley ML, et al. Computer-aided detection of breast masses depicted on full-field digital mammograms: a performance assessment [J]. British Journal of Radiology, 2012, 85(1014):153-161.

[19] Tan M, Pu J, Cheng S, et al. Assessment of a four-view mammographic image feature based fusion model to predict near-term breast cancer risk[J]. Annals of Biomedical Engineering, 2015, 43(10):2416-2428.

[20] Li Yane, Fan Ming, Li Lihua, et al. Prediction of near-term breast cancer risk using local region-based bilateral asymmetry features in mammography[C]//SPIE Medical Imaging. Orlando: SPIE, 2017, 10138:101380L1-101380L8.

[21] Casti P, Mencattini A, Salmeri M, et al. Estimation of the breast skin-line in mammograms using multidirectional Gabor filters[J]. Computers in Biology & Medicine, 2013, 43(11):1870-1881.

[22] Ganesan K, Acharya UR, Kuang CC, et al. Pectoral muscle segmentation: A review[J]. Computer Methods & Programs in Biomedicine, 2013, 110(1):48-57.

[23] Hauskrecht M, Pelikan R, Malehorn DE, et al. Feature selection for classification of SELDI-TOF-MS proteomic profiles[J]. Applied Bioinformatics, 2005, 4(4): 227-246.

[24] H?berle L, Wagner F, Fasching PA, et al. Characterizing mammographic images by using generic texture features[J]. Breast Cancer Research, 2012, 14(2):1-12.

[25] Zheng Bin. Bilateral mammographic density asymmetry and breast cancer risk: a preliminary assessment[J]. European Journal of Radiology, 2012, 81(11): 3222-3228.

[26] Tan Maxine, Zheng Bin, Ramalingam P, et al. Prediction of near-term breast cancer risk based on bilateral mammographic feature asymmetry[J]. Academic Radiology, 2013, 20(12):1542-1550.

[27] Tan M, Zheng B, Leader JK, et al. Association between changes in mammographic image features and risk for near-term breast cancer development[J]. IEEE Transactions on Medical Imaging, 2016, 35(7):1719-1728.

[28] Smith RA, Andrews K, Brooks D, et al. Cancer screening in the United States, 2016: A review of current American Cancer Society guidelines and current issues in cancer screening[J]. CA: A Cancer Journal for Clinicians. 2016, 66: 95-114.

[29] Boyd NF. Mammographic density and the risk and detection of breast cancer[J]. New England Journal of Medicine, 2009, 356(3): 227-236.

[30] Martin LJ, Melnichouk O, Guo H, et al. Family history, mammographic density, and risk of breast cancer[J].Cancer Epidemiology, Biomarkers & Prevention, 2010, 19(2):456-463.

[31] Li Yane, Fan Ming, Cheng Hu, et al. Assessment of global and local region-based bilateral mammographic feature asymmetry to predict short-term breast cancer risk[J]. Physics in Medicine and Biology, 2018, 63(2):025004-025017.

猜你喜歡
不對稱性全局乳腺
Cahn-Hilliard-Brinkman系統(tǒng)的全局吸引子
量子Navier-Stokes方程弱解的全局存在性
體檢查出乳腺增生或結(jié)節(jié),該怎么辦
落子山東,意在全局
金橋(2018年4期)2018-09-26 02:24:54
得了乳腺增生,要怎么辦?
媽媽寶寶(2017年2期)2017-02-21 01:21:22
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
疼痛與知覺的不對稱性論證未推翻強(qiáng)表征主義
“上/下”的不對稱性及認(rèn)知分析
容易誤診的高回聲型乳腺病變
農(nóng)民獲取信息的不對稱性及對策——以臨安農(nóng)村為例
新龙县| 华宁县| 探索| 斗六市| 灵寿县| 资兴市| 邯郸县| 垦利县| 博野县| 西和县| 沧州市| 梓潼县| 板桥市| 调兵山市| 来凤县| 延庆县| 榆社县| 秦皇岛市| 方山县| 陈巴尔虎旗| 怀化市| 昌乐县| 射阳县| 喀喇沁旗| 尖扎县| 滨州市| 孝义市| 商洛市| 汶上县| 上虞市| 冀州市| 丹寨县| 太仆寺旗| 永平县| 东辽县| 保山市| 宜兴市| 庆云县| 龙山县| 汤阴县| 高安市|