劉婧 張鶯
浙江大學(xué)醫(yī)學(xué)院附屬第二醫(yī)院核醫(yī)學(xué)科,杭州 310009
肺癌是目前在世界范圍內(nèi)患病率(11.6%)和病死率(18.4%)最高的惡性腫瘤[1],其5年生存率極低,在我國僅為15.6%,超過75%的患者在確診時已處于晚期[2]。因此,早發(fā)現(xiàn)、早診斷對于提高肺癌患者的生存率尤為關(guān)鍵。胸部X射線檢查是最早應(yīng)用于肺癌普查、篩查的影像學(xué)檢查方法,但因其靈敏度、特異度較低,已被發(fā)展迅速的胸部CT掃描所替代。從最早的低分辨率CT到目前高分辨率薄層、低劑量螺旋、雙源能譜CT,都包含了大量的影像學(xué)信息,放射科醫(yī)師需要耗費大量的時間和精力閱片,并結(jié)合臨床信息來診斷肺結(jié)節(jié)的良惡性。隨著人工智能的發(fā)展,基于人工智能技術(shù)的計算機(jī)輔助診斷(computer aided diagnosis,CAD)系統(tǒng)可提高放射科醫(yī)師的工作效率以及肺結(jié)節(jié)診斷結(jié)果的準(zhǔn)確率。深度學(xué)習(xí)是目前人工智能技術(shù)的研究熱點,基于深度學(xué)習(xí)的CAD系統(tǒng)在肺癌的早期診斷中的應(yīng)用取得了突破性的進(jìn)展[3]。
CAD系統(tǒng)應(yīng)用于肺癌的早期診斷,通常包含以下幾個步驟:數(shù)據(jù)預(yù)處理、肺區(qū)域分割、候選結(jié)節(jié)檢測與分割以及結(jié)節(jié)診斷[4]。基于深度學(xué)習(xí)的CAD系統(tǒng)能有效解決肺癌早期診斷中的核心問題,包括特征提取、肺結(jié)節(jié)檢測和假陽性率的降低3個方面[5]。深度學(xué)習(xí)模型通常分為監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)兩種形式,其中監(jiān)督學(xué)習(xí)需要使用帶有分類標(biāo)簽的數(shù)據(jù),此類模型包括卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)和大規(guī)模訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)(massive-training artificial neural networks,MTANNs);非監(jiān)督學(xué)習(xí)則使用無標(biāo)簽數(shù)據(jù),此類模型包括自動編碼器(autoencoder,AE)和深度置信網(wǎng)絡(luò)(deep belief network,DBN)。
CNN是監(jiān)督學(xué)習(xí)下的代表性深度學(xué)習(xí)模型,是端到端機(jī)器學(xué)習(xí)中的一種類型,主要由輸入層、卷積層、池化層、激活層、全連接層和輸出層組成。卷積層是CNN的核心層,用于提取較高等級的圖像特征,而全連接層則用于圖像特征分類。應(yīng)用于肺結(jié)節(jié)檢測和分類的CNN主要包括二維(two dimensional,2D)CNN 和三維(three dimensional,3D)CNN,以及多視圖、多流、多尺度的CNN等。
2D CNN是最早應(yīng)用于肺結(jié)節(jié)的深度網(wǎng)絡(luò)模型,其不受肺部CT圖像層厚的影響,且處理數(shù)據(jù)速度快,所需資源少。Setio等[6]提出了一種基于2D多視圖CNN的CAD系統(tǒng)對肺結(jié)節(jié)進(jìn)行分類。該CNN包含多個2D卷積流,使用肺部影像數(shù)據(jù)庫中的LIDC-IDRI數(shù)據(jù)庫[7]訓(xùn)練,訓(xùn)練過程中為了獲得更全面的鑒別特征,選取肺結(jié)節(jié)的9個不同視圖層的2D補(bǔ)丁作為輸入層,再融合不同輸出層結(jié)果,得到最終分類結(jié)果。這種方法相比于傳統(tǒng)算法大大地降低了肺結(jié)節(jié)的假陽性率,準(zhǔn)確率至少提升了15%~20%。2019年,Xie等[8]提出了一種更加快速和準(zhǔn)確的2D CNN,該CNN是利用兩個區(qū)域建議網(wǎng)絡(luò)和一個反卷積層改進(jìn)的Faster R-CNN進(jìn)行候選結(jié)節(jié)的檢測,采用了經(jīng)典的CNN模型視覺幾何群網(wǎng)絡(luò)16來進(jìn)行特征的提取。其強(qiáng)調(diào)保留錯誤分類的樣本,對網(wǎng)絡(luò)重新訓(xùn)練,這樣可提高肺結(jié)節(jié)檢測的靈敏度,同時降低假陽性率。
3D CNN比2D CNN在網(wǎng)絡(luò)深度上更深,其在CT圖像內(nèi)學(xué)習(xí)肺結(jié)節(jié)空間信息,進(jìn)行一系列的鑒別特征提取,極大地提高了識別準(zhǔn)確率。在使用相同網(wǎng)絡(luò)參數(shù)設(shè)置、對相同的數(shù)據(jù)集進(jìn)行分類識別時,3D CNN比2D CNN具有更高的準(zhǔn)確率。此外,一些研究者將不同的深度學(xué)習(xí)技術(shù)引入3D CNN。Jin等[9]引入了殘差學(xué)習(xí),通過使用殘差單元來加深網(wǎng)絡(luò)的深度,因此即使圖像數(shù)據(jù)有限,也可提取到更高級的特征,進(jìn)而有效地降低假陽性率。然而引入殘差的同時也會增加偏度,這需要增加更細(xì)的維度分類,并且該網(wǎng)絡(luò)結(jié)構(gòu)消耗大量的內(nèi)存和計算資源,對資源的需求極大地限制了網(wǎng)絡(luò)深度;另外,由于圖像數(shù)據(jù)量的限制,降低了數(shù)據(jù)的多樣性,在臨床應(yīng)用中可能存在問題。Tang等[10]引入了難分樣本挖掘技術(shù)訓(xùn)練一個3D Faster R-CNN,篩選出的難分樣本再訓(xùn)練一個3D深度卷積神經(jīng)網(wǎng)絡(luò)分類器,綜合兩個CNN結(jié)果提高肺結(jié)節(jié)檢測的準(zhǔn)確率,這種端到端的目標(biāo)檢測技術(shù)使其在2017年天池人工智能醫(yī)療競賽中脫穎而出。在2018年電氣電子工程師協(xié)會國際會議上,Qin等[11]進(jìn)一步采用在線難分樣本挖掘和多任務(wù)殘差學(xué)習(xí)技術(shù)展示了一種基于DenseNet的肺結(jié)節(jié)分類模型,提高了模型訓(xùn)練速度,降低了假陽性率。Zhu等[12]設(shè)計了兩個3D深度卷積神經(jīng)網(wǎng)絡(luò),其中一個采用3D雙路徑聯(lián)合類U-Net編碼解碼結(jié)構(gòu)的3D R-CNN用于肺結(jié)節(jié)檢測,而另一個具有結(jié)節(jié)尺寸、原始像素和深度特征的梯度增強(qiáng)機(jī)用于分類,該算法在LIDC-IDRI數(shù)據(jù)庫上進(jìn)行評估,準(zhǔn)確率為90.44%。
CNN的固定架構(gòu)決定了其所提取的特征是單一的,這使得傳統(tǒng)CNN在非實性肺結(jié)節(jié)中的診斷效果較差。近年來,一些研究者開發(fā)的多尺度、多流和多視圖CNN可檢測非實性肺結(jié)節(jié)。Ciompi等[13]使用基于多流、多尺度CNN的CAD系統(tǒng)對6種肺結(jié)節(jié)(包括實性結(jié)節(jié)、非實性結(jié)節(jié)、部分實性結(jié)節(jié)、鈣化結(jié)節(jié)、葉間裂周圍結(jié)節(jié)、分葉狀結(jié)節(jié))進(jìn)行分類。該系統(tǒng)直接處理原始CT數(shù)據(jù),無需任何預(yù)處理(如結(jié)節(jié)分割或結(jié)節(jié)大小判斷等),大大縮短了訓(xùn)練時間。結(jié)果證明在適當(dāng)范圍內(nèi)增大CNN的尺度對不同類型肺結(jié)節(jié)分類的準(zhǔn)確率超過傳統(tǒng)CNN。2018年,Liu等[14]開發(fā)了可對實性、磨玻璃結(jié)節(jié)和非結(jié)節(jié)分類的多視圖、多尺度CNN?;贚iu的方法,Yuan等[15]利用多核學(xué)習(xí)結(jié)合CNN提取的統(tǒng)計特征與Fisher vector編碼的幾何特征,對具有混合特征的肺結(jié)節(jié)進(jìn)行分類,在LIDC-IDRI和ELCAP數(shù)據(jù)庫的評估結(jié)果中分別獲得了93.1%和93.9%的分類準(zhǔn)確率,尤其是對邊界清楚的結(jié)節(jié),準(zhǔn)確率接近100%。
最近,研究者們提出CNN不僅可應(yīng)用于肺結(jié)節(jié)的檢測與分類,也可應(yīng)用于肺結(jié)節(jié)更多細(xì)節(jié)信息的提取。例如Wu等[16]提出了雙任務(wù)學(xué)習(xí)CNN,即同時學(xué)習(xí)肺結(jié)節(jié)的分割和惡性程度預(yù)測,其不僅能提供檢測到的結(jié)節(jié)的具體位置,而且能對結(jié)節(jié)的惡性程度進(jìn)行預(yù)測,準(zhǔn)確率達(dá)到97.58%。
MTANNs是端到端機(jī)器學(xué)習(xí)的另一種類型,其含有多層改進(jìn)的人工神經(jīng)網(wǎng)絡(luò),核心處理單元是全連接網(wǎng)絡(luò),以圖像的灰度數(shù)據(jù)作為直接輸入,量化輸出圖像,減少特征提取和計算引起的誤差,非常適合應(yīng)用于小樣本數(shù)據(jù)[17]。Tajbakhsh和Suzuki[18]比較了MTANNs與CNN在肺結(jié)節(jié)檢測和分類中的性能,結(jié)果表明在使用有限的訓(xùn)練數(shù)據(jù)時,MTANNs的性能高于CNN,而隨著數(shù)據(jù)量的增加,CNN的性能逐漸提高。因此,在有限的訓(xùn)練樣本中,MTANNs捕獲的中低等級的圖像特征足以對肺結(jié)節(jié)進(jìn)行準(zhǔn)確檢測和分類。
AE是一種非監(jiān)督學(xué)習(xí)下的深度學(xué)習(xí)模型,主要包含輸入層、隱藏層和輸出層。其特點是輸入層到隱藏層是一個編碼過程,而隱藏層到輸出層是一個解碼過程,通過編碼、解碼來提取特征,這相對于傳統(tǒng)的人工標(biāo)記提取更為客觀和可靠。目前應(yīng)用于肺結(jié)節(jié)的CAD系統(tǒng)中的AE包括:堆棧式AE[19]、去噪自動編碼器(denoising autoencoder,DAE)以及堆棧式DAE等。
降噪技術(shù)在一定程度上可對抗原始數(shù)據(jù)的污染、缺失[20],而堆棧多個AE或DAE構(gòu)成堆棧式AE或堆棧式DAE,可逐步多層地提取出更抽象的圖像特征[21]。Kumar等[22]于2015年首次使用了5層的DAE結(jié)合二元決策樹的CAD系統(tǒng)對肺結(jié)節(jié)進(jìn)行診斷,使用LIDC數(shù)據(jù)庫訓(xùn)練該系統(tǒng),并將從DAE提取的第4層特征作為特征向量用于分類,得到的準(zhǔn)確率為75.01%,靈敏度為83.35%。而Kim等[23]提出結(jié)合堆棧式DAE提取的抽象信息與原始圖像信息,形成一個組合特征向量,再采用t-test挑選的特征向量訓(xùn)練支持向量機(jī)進(jìn)行分類。該分類方法的準(zhǔn)確率達(dá)到了95.5%。最近,Mao等[24]建立了一種結(jié)合肺結(jié)節(jié)圖像局部和全局特征的模型,將圖像分割為局部補(bǔ)丁后,在深度AE中提取局部特征構(gòu)造視覺詞匯袋,與原始AE相比,深度AE可以捕捉到更詳細(xì)的特征信息。
DBN這一概念在 2006年被 Hinton和Salakhutdinov[3]提出,其被定義為一種具有多層神經(jīng)元的概率生成模型。DBN的基礎(chǔ)結(jié)構(gòu)是受限玻爾茲曼機(jī),其特點是可見層、隱藏層之間是全連接的,而可見層間和隱藏層間是無連接的[25],這種連接方式是其高效性的基礎(chǔ)。2015年,Hua等[26]利用DBN和CNN對胸部CT圖像上的良惡性肺結(jié)節(jié)進(jìn)行分類,采用隨機(jī)梯度下降法對DBN進(jìn)行逐層無監(jiān)督的預(yù)訓(xùn)練,并利用監(jiān)督微調(diào)預(yù)訓(xùn)練的深度網(wǎng)絡(luò),進(jìn)一步優(yōu)化整體網(wǎng)絡(luò)性能。將該方法與傳統(tǒng)的k近鄰法和支持向量機(jī)分形分析技術(shù)進(jìn)行性能比較,結(jié)果表明DBN和CNN在靈敏度和特異度上都優(yōu)于傳統(tǒng)的紋理特征分類法。
肺癌的早期診斷對于提高患者的生存率尤為關(guān)鍵。基于深度學(xué)習(xí)的CAD系統(tǒng)在肺結(jié)節(jié)的檢測與分類應(yīng)用中獲得的突破性進(jìn)展,可幫助放射科醫(yī)師提高診斷的準(zhǔn)確率,降低假陽性率。然而,深度學(xué)習(xí)在胸部影像診斷領(lǐng)域中的應(yīng)用仍處于起步階段,還存在諸多挑戰(zhàn)。首先,深度學(xué)習(xí)模型需要依賴大量的醫(yī)療數(shù)據(jù)集進(jìn)行訓(xùn)練,現(xiàn)有胸部影像數(shù)據(jù)集不足導(dǎo)致訓(xùn)練樣本不夠,數(shù)據(jù)集標(biāo)注缺乏統(tǒng)一標(biāo)準(zhǔn)、具有主觀性等均可影響模型的學(xué)習(xí)效果,因此需要建立開放的數(shù)據(jù)集平臺,為研究者提供一個統(tǒng)一的研發(fā)環(huán)境。其次,現(xiàn)有深度學(xué)習(xí)模型在肺結(jié)節(jié)的檢測和分類應(yīng)用中有較多的研究,而肺癌的早期診斷還需要更全面的信息,未來可結(jié)合多任務(wù)學(xué)習(xí)等技術(shù)開發(fā)具有復(fù)雜功能的系統(tǒng),更好地提高肺癌早期診斷的準(zhǔn)確率。最后,已有研究者聯(lián)合使用多種深度學(xué)習(xí)技術(shù)或模型改進(jìn)CAD系統(tǒng)的性能,并取得了較好的表現(xiàn)[27-28],期待多種新型模型的研發(fā)以進(jìn)一步提高胸部影像診斷系統(tǒng)的性能。
利益沖突本研究由署名作者按以下貢獻(xiàn)聲明獨立開展,不涉及任何利益沖突。
作者貢獻(xiàn)聲明劉婧負(fù)責(zé)資料的整理、論文的撰寫和修改;張鶯負(fù)責(zé)命題的提出和論文的審閱。