王 駿,邵立偉,黃德皇,黃鈺斌,于澤源,王艷芳,陳慶武,馬 力(通訊作者)
(1中山火炬開發(fā)區(qū)醫(yī)院放射醫(yī)學(xué)科 廣東 中山 528400)
(2中山市北京理工大學(xué)研究院 廣東 中山 528400)
(3中國(guó)科技大學(xué) 安徽 合肥 230000)
(4中山仰視科技有限公司 廣東 中山 528400)
肺癌是致死率最高的疾病之一,在美國(guó)這種發(fā)達(dá)國(guó)家5年生存率只有16%,在發(fā)展中國(guó)家更低[1]。隨著現(xiàn)代醫(yī)學(xué)的進(jìn)展,研究人員已經(jīng)證明如果肺癌能夠在早期進(jìn)行治療,5年平均生存率能達(dá)到54%[2]。因此在CAD系統(tǒng)中早期發(fā)現(xiàn)肺結(jié)節(jié)成為肺癌診斷和治療的關(guān)鍵。
CT是肺癌檢測(cè)的常用工具,通過人體組織對(duì)于X光的吸收程度不同來提供內(nèi)部組織的可視化。肺結(jié)節(jié)通常具有與正常組織相同的吸收水平,但具有獨(dú)特的形狀:與支氣管和血管這樣具有連續(xù)的管道系統(tǒng),在根部粗壯,分支后稀薄的形狀相比,結(jié)節(jié)通常為球形和孤立存在。有些肺結(jié)節(jié)很小,很難找到。對(duì)一個(gè)病人進(jìn)行徹底的檢查,一個(gè)有經(jīng)驗(yàn)的醫(yī)生也需要大約10分鐘時(shí)間。而且肺結(jié)節(jié)本身有很多類型,不同類型成長(zhǎng)為癌癥的可能性是不同的。對(duì)于肺結(jié)節(jié)良惡性的判斷,醫(yī)生主要是已經(jīng)肺結(jié)節(jié)的形態(tài)特征,高度依賴于醫(yī)生的經(jīng)驗(yàn)[3]。
醫(yī)生期待CAD系統(tǒng)肺結(jié)節(jié)檢測(cè)方面具有高敏感度和低假陽性率,從而具有較高的參考價(jià)值。最近在深度學(xué)習(xí)方面的進(jìn)展,給肺癌早期診斷帶來了新的機(jī)會(huì)。
在數(shù)據(jù)集方面,大規(guī)模數(shù)據(jù)集比如L I D C-I D R I[4]等的出現(xiàn)事實(shí)上加速了肺結(jié)節(jié)檢測(cè)方面的研發(fā)。肺結(jié)節(jié)的檢測(cè)通常包括兩個(gè)部分:肺結(jié)節(jié)檢測(cè)[5-7]和肺結(jié)節(jié)分類[7-9]。
本文針對(duì)肺結(jié)節(jié)分類的任務(wù)提出一種適用于肺結(jié)節(jié)分類的網(wǎng)絡(luò)結(jié)構(gòu)和相應(yīng)的損失函數(shù)。我們?cè)O(shè)計(jì)了以3D-ResNet網(wǎng)絡(luò)為基架,將網(wǎng)絡(luò)特征和全局特征進(jìn)行融合,并用XGB[10]進(jìn)行最終的分類。我們提出的損失函數(shù)充分考慮肺結(jié)節(jié)良惡性分類指標(biāo)之間存在的有序性關(guān)系以及數(shù)據(jù)的不平衡性。該損失函數(shù)對(duì)于類似具有有序性指標(biāo)分類問題都具有適用性。我們使用上述技術(shù)在LIDCIDRI數(shù)據(jù)集上訓(xùn)練出的模型,有著高的準(zhǔn)確率、召回率、特異度和F1值。
在深度學(xué)習(xí)技術(shù)出現(xiàn)之前,肺結(jié)節(jié)的分類方法主要依靠人工提取的特征,包括數(shù)據(jù)的3D輪廓,形狀,紋理等。相比于傳統(tǒng)特征提取手段而言,深度學(xué)習(xí)技術(shù)基于大規(guī)模數(shù)據(jù)進(jìn)行學(xué)習(xí),在特征表現(xiàn)學(xué)習(xí)方面有很大優(yōu)勢(shì),能夠自動(dòng)涵蓋多種特征,適用性更強(qiáng)。我們提出的深度學(xué)習(xí)方法,以2個(gè)3D-ResNet網(wǎng)絡(luò)為基干網(wǎng)絡(luò)用于特征提取。特征提取網(wǎng)絡(luò)的輸出向量與肺結(jié)節(jié)的直徑這個(gè)參數(shù)用concat方式連接成為一個(gè)一維向量作為整體的特征向量輸入到后續(xù)的分類器進(jìn)行分類。這里我們通過實(shí)驗(yàn),最終選取XGB作為最后的分類器。
我們使用的肺結(jié)節(jié)分類中,良惡性指標(biāo)為1~5,分?jǐn)?shù)1,2,3為良性,而分?jǐn)?shù)4,5為惡性,分?jǐn)?shù)越高,惡性程度越高,各個(gè)分類之間是有序關(guān)系。為了讓網(wǎng)絡(luò)能夠應(yīng)對(duì)這種類似回歸的分類,學(xué)習(xí)指標(biāo)之間的有序關(guān)系,我們?cè)赾ross entropy損失的基礎(chǔ)上,增加了L1損失作為正則化懲罰項(xiàng)。損失函數(shù)如下:
其中,λ為超參數(shù),范圍是0到1之間。
我們訓(xùn)練使用的肺結(jié)節(jié)數(shù)據(jù)來自于數(shù)據(jù)集LIDCIDRI。我們將其中的肺結(jié)節(jié)數(shù)據(jù)按尺寸分為兩組,當(dāng)肺結(jié)節(jié)直接小于3 mm時(shí),不將它們作為分類對(duì)象。只有直接范圍在3 mm以上的結(jié)節(jié)被用于訓(xùn)練。直徑3 mm以上共計(jì)5910個(gè)。該數(shù)據(jù)集由四位醫(yī)生獨(dú)立標(biāo)注,不同醫(yī)生對(duì)于某個(gè)結(jié)節(jié)的評(píng)估結(jié)果不一致。為了保持?jǐn)?shù)據(jù)的一致性,我們將標(biāo)注區(qū)域有重疊的結(jié)節(jié),都視為同一結(jié)節(jié)。見表1。
表1 直徑≥3mm的結(jié)節(jié)分布
我們先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,以每個(gè)結(jié)節(jié)的中心為立方體的中心,截取72×72×72塊作為第一個(gè)3DRestNet網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù),第二個(gè)3DRestNet網(wǎng)絡(luò)中的16×16×16的塊由72×72×72塊進(jìn)行resize得到。
因?yàn)閿?shù)據(jù)量有限,我們進(jìn)行了數(shù)據(jù)增強(qiáng)。首先將72×72×72的數(shù)據(jù)隨機(jī)裁剪成64×64×64的數(shù)據(jù),然后對(duì)裁剪后的數(shù)據(jù)進(jìn)行隨機(jī)翻轉(zhuǎn)、鏡像、旋轉(zhuǎn),最后對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后輸入網(wǎng)絡(luò)中。
我們通過對(duì)λ的不同取值進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果的統(tǒng)計(jì)中我們將1類、2類、3類合并作為良性,4類、5類作為惡性,統(tǒng)計(jì)相應(yīng)的準(zhǔn)確率、召回率、特異度和F_1值。結(jié)果見表2。
表2 有序多分類-五折實(shí)驗(yàn)平均結(jié)果統(tǒng)計(jì)
此外,我們將本文中的提出模型的準(zhǔn)確率與其他模型的準(zhǔn)確率進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果如下。
表3 與其他模型的對(duì)比
由表2可知,有序多分類模型隨著λ從0到1增加,其各個(gè)指標(biāo)的大致趨勢(shì)為先上升后減小,綜合考慮,當(dāng)λ=0.7時(shí)最優(yōu)。此外通過表3可知,對(duì)于單模型而言,當(dāng)λ=0.7時(shí),我們的模型要優(yōu)于Multi-scale CNN、2D CNN Slice-level、2D CNN Nodule-level、Vanilla 3D CNN、Deep 3D DPN,這不僅是由于3D卷積能更好提取3D數(shù)據(jù)特征以及利用深度殘差網(wǎng)絡(luò)能更好提取數(shù)據(jù)深層特征,更主要的一個(gè)原因是我們引入了有序正則項(xiàng),使我們的模型能更好的學(xué)習(xí)到數(shù)據(jù)的有序結(jié)構(gòu)信息,使得信息更加利用充分。
最后我們通過提取結(jié)節(jié)數(shù)據(jù)的全局特征和結(jié)節(jié)直徑信息,將其與網(wǎng)絡(luò)特征結(jié)合,然后用XGB做分類,實(shí)驗(yàn)的結(jié)果也表明,當(dāng)λ=0.7時(shí),比λ=0.0的效果要好,這更充分表明了引入有序正則項(xiàng)對(duì)有序分類訓(xùn)練具有促進(jìn)作用。
本文提出了一種基于有序多分類的深度學(xué)習(xí)模型,模型通過有序正則項(xiàng)學(xué)習(xí)數(shù)據(jù)之間的有序關(guān)系,并通過調(diào)整超參數(shù)λ得到比較好的結(jié)果。實(shí)驗(yàn)表明,引入有序正則項(xiàng)能夠穩(wěn)定地提升分類模型的泛化性能,并取得更好的預(yù)測(cè)效果[11-14]。我們通過和其他模型的實(shí)驗(yàn)對(duì)比,表明我們的有序正則化分類模型的優(yōu)越性。