吳光耀,伍建林(大連大學(xué)附屬中山醫(yī)院放射科,遼寧 大連 116001)
肺結(jié)節(jié)指最大徑≤30 mm的病灶[1],分為實(shí)性、部分實(shí)性和純磨玻璃密度三種結(jié)節(jié),其惡性概率分別約為7%、63%和18%[2],準(zhǔn)確檢測肺結(jié)節(jié)對(duì)于肺癌早期診斷具有重要臨床價(jià)值。胸部CT是目前肺癌篩查與診斷最重要且可靠的非侵入性檢查手段,但在提供豐富影像信息的同時(shí),也使閱片工作量大幅增加,導(dǎo)致放射科醫(yī)師疲勞或漏檢、誤判。計(jì)算機(jī)輔助診斷(computer-aided diagnosis, CAD)系統(tǒng)有助于緩解影像科醫(yī)師壓力,減少肺結(jié)節(jié)漏檢,提高診斷效率和準(zhǔn)確率。CAD可分為CAD檢測(CADe)系統(tǒng)和CAD診斷(CADx)系統(tǒng)。本文對(duì)基于CT的計(jì)算機(jī)輔助檢測與診斷技術(shù)流程及其在肺結(jié)節(jié)中的應(yīng)用進(jìn)行綜述。
CADe系統(tǒng)的目標(biāo)是識(shí)別圖像中可能存在的異常改變區(qū)域,并向醫(yī)師提出警示,其工作流程包括數(shù)據(jù)獲取、圖像預(yù)處理、肺實(shí)質(zhì)分割、肺結(jié)節(jié)檢測和剔除假陽性結(jié)節(jié)。
1.1 數(shù)據(jù)獲取 CADe系統(tǒng)的數(shù)據(jù)主要來源于醫(yī)院內(nèi)部和公共數(shù)據(jù)庫。雖然醫(yī)院內(nèi)部數(shù)據(jù)庫也能有效支持CADe的算法,但目前尚存在以下問題:①醫(yī)院內(nèi)部數(shù)據(jù)不公開,不利于CAD算法的可重復(fù)性研究和比較不同算法的性能;②不同影像設(shè)備獲取和重建協(xié)議有較大差異,缺乏統(tǒng)一標(biāo)準(zhǔn);③對(duì)于大數(shù)據(jù)分析,單個(gè)醫(yī)院樣本量不足。為解決以上問題,先后有不同的國際組織建立了可用于開發(fā)、維護(hù)和培訓(xùn)的CT圖像公共數(shù)據(jù)庫,如LIDC、LIDC-IDRI、ELCAP、NELSON和ANODE09等,可用于醫(yī)師培訓(xùn)、罕見案例儲(chǔ)存等,還可進(jìn)行不同CADe系統(tǒng)性能的比較[3]。
1.2 圖像預(yù)處理 為可選流程,目的在于去除不同類型或不同來源數(shù)據(jù)間的差異,提高圖像質(zhì)量,從而獲得更好檢測效果。目前常用預(yù)處理技術(shù)包括線性插值、中值濾波、形態(tài)學(xué)帽操作、高斯濾波以及加權(quán)求和濾波等;其他尚有增強(qiáng)濾波器、對(duì)比限制自適應(yīng)直方圖均衡、自動(dòng)增強(qiáng)維納濾波器、快速傅立葉變換、小波變換以及平滑濾波器和噪聲校正等[4]。
1.3 肺實(shí)質(zhì)分割 系CADe關(guān)鍵步驟之一,包括人工分割和自動(dòng)分割,前者存在耗時(shí)多、主觀性強(qiáng)、重復(fù)性差、不易實(shí)現(xiàn)三維分割等缺陷,后者是當(dāng)前醫(yī)學(xué)影像圖像分析領(lǐng)域的研究熱點(diǎn)之一,可分為五類:基于閾值方法、基于區(qū)域方法、基于形狀方法、鄰近解剖引導(dǎo)方法和機(jī)器學(xué)習(xí)方法[5]。由于肺組織存在一定異質(zhì)性及多種結(jié)構(gòu)密度相似,目前尚無認(rèn)可度較高的通用分割算法。高精度、全自動(dòng)特定圖像分割算法是未來的發(fā)展趨勢(shì)。
1.4 肺結(jié)節(jié)檢測 肺結(jié)節(jié)形狀各異,易與肺內(nèi)氣管、血管混淆,且分布位置不確定,易與肺內(nèi)組織粘連,檢測肺結(jié)節(jié)存在一定難度?,F(xiàn)有技術(shù)包括基于閾值法、聚類法、模板匹配法、形狀增強(qiáng)濾波器法等[5],均存在不同程度假陽性率。
1.5 剔除假陽性結(jié)節(jié) 檢出候選肺結(jié)節(jié)后,需進(jìn)行分析、歸類,保留真性肺結(jié)節(jié),去除假性肺結(jié)節(jié)。目前多分為兩個(gè)階段:①基于規(guī)則分類剔除假陽性結(jié)節(jié),根據(jù)肺結(jié)節(jié)的某些特點(diǎn),設(shè)計(jì)某種規(guī)則,計(jì)算相應(yīng)的一個(gè)或多個(gè)特征,并設(shè)定相對(duì)寬松的特征閾值去除明顯的假陽性結(jié)節(jié)[6];②基于機(jī)器學(xué)習(xí)分類進(jìn)一步剔除假陽性肺結(jié)節(jié),提取候選肺結(jié)節(jié)數(shù)據(jù)集相關(guān)特征,采用人工神經(jīng)網(wǎng)絡(luò)[7]、支持向量機(jī)[8]、線性判別分析[9]等分類器法對(duì)候選肺結(jié)節(jié)訓(xùn)練集數(shù)據(jù)進(jìn)行訓(xùn)練,再對(duì)候選肺結(jié)節(jié)測試集進(jìn)行分類,進(jìn)一步剔除假陽性肺結(jié)節(jié)。
CADx系統(tǒng)的目標(biāo)是幫助放射科醫(yī)師判斷病灶良惡性、評(píng)估病理分型及分期、監(jiān)測治療反應(yīng)、評(píng)估預(yù)后等提供幫助,其工作流程包括特征提取與量化和分類預(yù)測。
2.1 特征提取與量化 目前文獻(xiàn)[10]提到的特征主要分為語義特征及統(tǒng)計(jì)學(xué)特征,前者指用于定量影像科醫(yī)師日常描述的結(jié)節(jié)大小、形狀、位置、邊界等特征,后者指利用數(shù)學(xué)或統(tǒng)計(jì)學(xué)方法定量提取的特征,如直方圖、紋理、小波等特征。為便于分析,在特征選擇和提取前,需對(duì)特征降維,可采用機(jī)器學(xué)習(xí)或統(tǒng)計(jì)學(xué)方法來實(shí)現(xiàn);也可通過最大相關(guān)最小冗余[11]或主成分分析法[12]獲得有顯著提示作用的特征。還可收集患者臨床特征、基因特征、生化檢查特征等資料,將影像學(xué)特征和其他特征結(jié)合,為分類和預(yù)測提供更準(zhǔn)確和詳細(xì)的信息。
2.2 分類和預(yù)測 基本思路為將數(shù)據(jù)分為訓(xùn)練集和測試集,采用機(jī)器學(xué)習(xí)算法從訓(xùn)練集中構(gòu)建分類器,再到測試集中驗(yàn)證其可靠性。目前常用且效果良好的機(jī)器學(xué)習(xí)算法[13]有人工神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)、支持向量機(jī)及決策樹學(xué)習(xí)。根據(jù)訓(xùn)練集數(shù)據(jù)結(jié)果是否被標(biāo)記,又可將其分為無監(jiān)督學(xué)習(xí)(未標(biāo)記結(jié)果)、半監(jiān)督學(xué)習(xí)(標(biāo)記部分結(jié)果)和監(jiān)督學(xué)習(xí)(標(biāo)記結(jié)果)。人工神經(jīng)網(wǎng)絡(luò)具有自主學(xué)習(xí)、自動(dòng)適應(yīng)的特點(diǎn),同時(shí)還具有并行處理、分布式存儲(chǔ)和容錯(cuò)性等優(yōu)勢(shì),是目前應(yīng)用較為廣泛的學(xué)習(xí)算法之一。深度學(xué)習(xí)系人工神經(jīng)網(wǎng)絡(luò)的深入發(fā)展,是目前最先進(jìn)的人工智能技術(shù),已在多個(gè)領(lǐng)域取得重大進(jìn)展[14]。在可預(yù)見的未來,無監(jiān)督深度學(xué)習(xí)可望實(shí)現(xiàn)高效、快捷、自動(dòng),成為下一場技術(shù)革新的亮點(diǎn)。
目前CADe檢測肺結(jié)節(jié)的敏感度較高,假陽性率亦較高,原因可能有以下方面:
3.1 CT圖像層厚、重建間隔及劑量 CADe的性能取決于CT掃描層厚和重建間隔。Brown等[15]使用層厚為1 mm、重建間隔為0.5~1.0 mm的CT圖像,發(fā)現(xiàn)CADe檢測直徑>3 mm肺結(jié)節(jié)的敏感度為100%。Demir等[16]的類似研究結(jié)果為敏感度98%。使用層厚為5~10 mm的CT圖像時(shí),肺結(jié)節(jié)檢出敏感度大為降低,每項(xiàng)檢查出現(xiàn)的假陽性結(jié)節(jié)可達(dá)幾十個(gè)[17]??衫幂^小的層間距重建CT圖像來彌補(bǔ)層厚過大的負(fù)面效果,如Kim等[18]將重建間隔從5 mm減少至1 mm,其敏感度明顯提高,每項(xiàng)檢查中的假陽性結(jié)節(jié)從23.6個(gè)降至9.7個(gè)。
Hein等[19]用兩種CADe系統(tǒng)比較管電流為5 mAs的超低劑量CT(ultra-low-dose CT, ULD-CT)和75 mAs標(biāo)準(zhǔn)劑量CT(standard-dose CT, SD-CT),ULD-CT對(duì)肺結(jié)節(jié)的檢出率為62%和72%,SD-CT為56%和73%,該兩種CADe系統(tǒng)在兩種劑量CT間檢出率差異無統(tǒng)計(jì)學(xué)意義。Bodelle等[20]對(duì)比了兩種管電壓(70 kV和100 kV)下CADe對(duì)肺實(shí)性結(jié)節(jié)的檢測率,發(fā)現(xiàn)兩者的檢測率分別為94.7%和92.4%。因此,降低管電流或管電壓可降低輻射劑量,且不影響CADe系統(tǒng)對(duì)肺結(jié)節(jié)的檢測率。
3.2 肺結(jié)節(jié)位置、大小及質(zhì)地 肺結(jié)節(jié)按位置可分為孤立性肺結(jié)節(jié)、胸膜旁肺結(jié)節(jié)和血管旁肺結(jié)節(jié)。CADe系統(tǒng)檢測孤立性肺結(jié)節(jié)最為敏感,原因是孤立性結(jié)節(jié)與周圍肺組織的對(duì)比度更高,且最多見,作為訓(xùn)練集時(shí)樣本量更大。一般來說,CADe對(duì)肺結(jié)節(jié)檢測的敏感度隨結(jié)節(jié)減小而降低。Brown等[15]發(fā)現(xiàn),對(duì)直徑>3 mm的肺結(jié)節(jié),CADe檢測敏感度為100%;而對(duì)直徑≤3 mm肺結(jié)節(jié),其敏感度降至70%。Setio等[21]觀察直徑>10 mm肺實(shí)性結(jié)節(jié),發(fā)現(xiàn)CADe敏感度可達(dá)94.1%。目前CADe檢出直徑≤3 mm肺結(jié)節(jié)尚面臨較大挑戰(zhàn)。Yanagawa等[22]評(píng)估商業(yè)性CADe系統(tǒng)檢測磨玻璃結(jié)節(jié)的性能,發(fā)現(xiàn)放射科醫(yī)師的檢測敏感度為60%~80%,明顯高于CADe的21%,其原因是實(shí)性結(jié)節(jié)對(duì)比度高且數(shù)量多,而磨玻璃結(jié)節(jié)較透明,與肺內(nèi)氣體灰度值對(duì)比不明顯,故檢測磨玻璃結(jié)節(jié)的難度較實(shí)性結(jié)節(jié)更高。
CADx的基本目標(biāo)是將計(jì)算機(jī)提供的結(jié)果作為第二意見,提高放射科醫(yī)師診斷的準(zhǔn)確率和減少閱片時(shí)間。在判斷肺結(jié)節(jié)良惡性方面,Armato等[23]將自動(dòng)檢測出的肺結(jié)節(jié)利用CADx根據(jù)形態(tài)和灰度級(jí)進(jìn)行分類,診斷敏感度達(dá)84%,ROC曲線下面積為0.79。Suzuki等[24]利用人工神經(jīng)網(wǎng)絡(luò)CADx判斷肺結(jié)節(jié)良惡性,其診斷惡性肺結(jié)節(jié)的準(zhǔn)確率可達(dá)100%,而診斷良性肺結(jié)節(jié)的準(zhǔn)確率僅為48%。最近有學(xué)者[25]對(duì)LIDC-IDRI數(shù)據(jù)庫的1 012個(gè)肺結(jié)節(jié)采用紋理特征分析方法來判斷其良惡性,ROC曲線下面積達(dá)0.927。大量研究[26-28]比較觀察者在使用和不使用CADx時(shí)判斷肺結(jié)節(jié)良惡性的準(zhǔn)確率,發(fā)現(xiàn)放射科醫(yī)師使用CADx后對(duì)肺結(jié)節(jié)良惡性判斷的準(zhǔn)確率有不同程度提高。
近年來,影像組學(xué)實(shí)現(xiàn)了肺結(jié)節(jié)分割、特征提取與模型建立,憑借對(duì)海量影像數(shù)據(jù)信息進(jìn)行更深層次的挖掘、預(yù)測和分析來輔助醫(yī)師做出更為準(zhǔn)確的診斷[29]。影像組學(xué)來源于CADx,結(jié)合了大數(shù)據(jù)技術(shù)特點(diǎn),已發(fā)展成融合影像、基因、臨床等信息的輔助診斷、分析和預(yù)測的新方法[30]。有學(xué)者[31]對(duì)孤立性肺結(jié)節(jié)的影像組學(xué)特征進(jìn)行貝葉斯分析,結(jié)果顯示其在肺結(jié)節(jié)良惡性分類中的準(zhǔn)確率為89.3%。Lee等[32]觀察86個(gè)部分實(shí)性肺結(jié)節(jié),將臨床信息和CT圖像作為紋理分析的特征,診斷肺結(jié)節(jié)良惡性的準(zhǔn)確率達(dá)92.9%。另有研究[33]對(duì)86個(gè)部分實(shí)性肺結(jié)節(jié)結(jié)合紋理特征分析和更高峰度方法,鑒別浸潤性腺癌與浸潤前病變的ROC曲線下面積達(dá)0.981。雖然CAD對(duì)磨玻璃結(jié)節(jié)的檢測率尚不高,但在鑒別良惡性及病理分型上仍有較好的效果。目前影像組學(xué)在判斷肺癌的病理分期、基因表型,預(yù)測其治療效果、轉(zhuǎn)移、復(fù)發(fā)、生存率等方面取得了一定進(jìn)展[34],卻仍鮮見針對(duì)表現(xiàn)為結(jié)節(jié)的早期肺癌的基因判斷及預(yù)后預(yù)測的研究報(bào)道,而這將成為未來研究的方向。
在肺結(jié)節(jié)檢測方面:①尚無認(rèn)可度高的通用分割算法,有些算法尚無法提供高效精準(zhǔn)的分割效果;②假陽性率較高;③CT圖像的采集與質(zhì)量評(píng)價(jià)尚無統(tǒng)一標(biāo)準(zhǔn);④結(jié)節(jié)位置、大小、質(zhì)地影響檢測效果。在肺結(jié)節(jié)診斷方面:目前多數(shù)研究旨在評(píng)估結(jié)節(jié)的良惡性,而判斷肺癌病理分型、分期,判斷基因表型,預(yù)測治療效果、轉(zhuǎn)移、復(fù)發(fā)、生存率等方面的研究較少。隨著深度學(xué)習(xí)方法不斷發(fā)展和人工智能浪潮的推動(dòng),上述問題可能會(huì)逐步得到妥善解決,對(duì)肺結(jié)節(jié)的多維度、多模態(tài)分析與定性、風(fēng)險(xiǎn)評(píng)估、預(yù)后判斷等研究將會(huì)越來越多,CAD有望真正實(shí)現(xiàn)高效和精準(zhǔn)的檢測與診斷目標(biāo),早日成為影像科醫(yī)師的得力助手。