周 瑾,常 才,周世崇
復(fù)旦大學(xué)附屬腫瘤醫(yī)院超聲科,復(fù)旦大學(xué)上海醫(yī)學(xué)院腫瘤學(xué)系,上海 200032
乳腺癌為全球第一大癌癥,也是女性最常見的惡性腫瘤[1]。乳腺癌早期診斷為其治療及預(yù)后的重要影響因素。由于中國人群致密型乳腺比例高,乳腺癌發(fā)病人群較年輕,超聲成為中國乳腺檢查的首選方式。隨著超聲技術(shù)的發(fā)展,乳腺檢查有二維成像、彩色多普勒成像、彈性成像等多種手段。但超聲檢查具有很強(qiáng)的主觀性和操作者依賴性。近年來,隨著人工智能(artificial intelligence,AI)的發(fā)展,人們將AI應(yīng)用到醫(yī)學(xué)圖像的處理當(dāng)中,并稱其為影像組學(xué)。影像組學(xué)能夠挖掘并客觀、定量地分析圖像微觀特征,彌補(bǔ)超聲檢查的缺點(diǎn),將影像組學(xué)方法應(yīng)用于超聲圖像中則為超聲組學(xué)。目前超聲組學(xué)的研究相對較少,本文對多種模態(tài)的超聲組學(xué)在乳腺癌診斷中的研究進(jìn)展進(jìn)行了綜述。
影像組學(xué)是將數(shù)字醫(yī)學(xué)圖像轉(zhuǎn)換為高維度、可挖掘數(shù)據(jù)的過程,它包含一階、二階和高階統(tǒng)計(jì),涉及高通量提取大量的定量成像特征,在腫瘤診斷、預(yù)后和治療領(lǐng)域中日益發(fā)展壯大[2-3]。影像組學(xué)分為傳統(tǒng)影像組學(xué)(伴或不伴機(jī)器學(xué)習(xí))和深度學(xué)習(xí)(deep learning,DL)影像組學(xué)[4],目前所說的影像組學(xué)一般指傳統(tǒng)影像組學(xué)。
傳統(tǒng)影像組學(xué)的流程為圖像獲取—圖像分割—特征提取—特征篩選—統(tǒng)計(jì)分類及模型建立(圖1a)。圖像分割分為手動(dòng)、半自動(dòng)和自動(dòng)分割,該方法主要適用于分辨率高、輪廓清晰的計(jì)算機(jī)體層成像(computed tomography,CT)和磁共振成像(magnetic resonance imaging,MRI)圖像。圖像特征提取一般依賴于醫(yī)師的經(jīng)驗(yàn)、影像學(xué)知識來人為定義特征并按照特定的算法進(jìn)行提取。模型建立采用統(tǒng)計(jì)學(xué)模型(如單因素、多因素分析)或機(jī)器學(xué)習(xí)方法(如隨機(jī)森林、支持向量機(jī)等)。傳統(tǒng)影像組學(xué)的特點(diǎn)是需要圖像分割和人為定義特征。
DL影像組學(xué)的流程為將重建圖像直接輸入后,由多個(gè)神經(jīng)網(wǎng)絡(luò)層自動(dòng)進(jìn)行特征的提取、篩選和分類,然后將圖像特征發(fā)送到標(biāo)準(zhǔn)監(jiān)督機(jī)器學(xué)習(xí)獲得所需預(yù)測模型(圖1b)。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)為最常用的方法。DL的特點(diǎn)是不需要人為預(yù)先定義和提取特征,該方法所提取的定量特征數(shù)要比人工定義特征的算法多幾個(gè)數(shù)量級。雖然CNN具有顯著的自動(dòng)化程度和應(yīng)用于多模態(tài)成像的靈活性,但整個(gè)過程處于“黑匣子”中,其透明度和可解釋性仍有待研究。
圖1 影像組學(xué)工作流程圖
目前超聲組學(xué)關(guān)于乳腺腫瘤良惡性辨別的研究多集中在二維超聲上,也有基于彈性超聲等單一模型或基于多模態(tài)超聲的模型,但較少與臨床特征融合。
既往研究[5-10]顯示,二維超聲組學(xué)模型對乳腺腫瘤的鑒別能力良好,多認(rèn)為其能力與專家組相當(dāng),其中DL模型表現(xiàn)更佳,曲線下面積(area under curve,AUC)一般大于0.9。一項(xiàng)前瞻性研究[11]顯示,將基于DL框架的計(jì)算機(jī)輔助診斷系統(tǒng)的結(jié)果添加到超聲圖像后再由醫(yī)師閱片,顯著改善了醫(yī)師診斷乳腺腫瘤的特異度、準(zhǔn)確度和陽性預(yù)測值。肖榕等[5]采用傳統(tǒng)影像組學(xué)方法選出15個(gè)組學(xué)特征,其對乳腺腫瘤的良惡性鑒別能力與年資10~12年的醫(yī)師相當(dāng)(AUC為0.840vs0.825)。Moon等[7]的一項(xiàng)大數(shù)據(jù)回顧性研究利用CNN建立診斷乳腺腫瘤的計(jì)算機(jī)輔助系統(tǒng),其AUC為0.971,并提示更多的圖像信息可提高系統(tǒng)預(yù)測性能,且腫瘤形狀特征可以提高診斷效果。Zhu等[9]的研究中有一個(gè)DL模型的AUC略低(0.875),但該模型基于甲狀腺癌和乳腺癌超聲表現(xiàn)相似的特點(diǎn),采用轉(zhuǎn)移學(xué)習(xí)和相同的架構(gòu)參數(shù)設(shè)置成功地建立了可以鑒別兩種癌癥的模型,且其乳腺癌診斷效能也優(yōu)于超聲科醫(yī)師。
臨床上乳腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(Breast Imaging Reporting and Data System,BI-RADS)評分4、5類結(jié)節(jié)為可疑惡性,需要通過穿刺活檢或手術(shù)才能明確,所以此類結(jié)節(jié)的超聲組學(xué)研究更具臨床意義。既往研究[12]采用傳統(tǒng)影像組學(xué)方法篩選出9個(gè)相關(guān)特征建立組學(xué)評分,對BIRADS 4類乳腺腫瘤具有良好的鑒別能力(AUC為0.810)。還有研究[13-14]將超聲組學(xué)特征和BIRADS評分相結(jié)合,預(yù)測能力有所提高(AUC為0.87~0.928),Kim等[14]的研究顯示,基于DL的諾莫圖可降低BI-RADS評分的假陽性率(97%vs45%),卻不影響靈敏度。
影像組學(xué)能挖掘人眼不能識別的特征,使二維超聲不易識別的乳腺腫瘤的良惡性鑒別成為可能。張宇等[15]的研究顯示,伴髓樣特征的乳腺癌與纖維腺瘤相比有更大的縱橫比和凹性率,更小的灰度均值、相關(guān)性和同質(zhì)性。Lee等[16]開發(fā)的影像組學(xué)評分對三陰性乳腺癌(triple negative breast cancer,TNBC)和乳腺纖維腺瘤具有良好的鑒別能力,甚至對BI-RADS 3和4A類的結(jié)節(jié)也具有較好的鑒別能力。有研究[17]顯示,超聲組學(xué)方法鑒別良惡性腫瘤的能力略高于BI-RADS評分(AUC為0.91vs0.84),還有研究[18]顯示,其對4A類乳腺腫瘤的鑒別能力略優(yōu)于放射科醫(yī)師(陽性預(yù)測值9.3%vs5.7%),但差異均無統(tǒng)計(jì)學(xué)意義。
既往多項(xiàng)研究[19-20]顯示,基于DL的剪切波彈性超聲(shear wave elastography,SWE)組學(xué)特征在乳腺腫瘤的診斷上優(yōu)于SWE定量參數(shù)、超聲科醫(yī)師讀片(采用5分視覺顏色評估和平均彈性值共識)和BI-RADS評分,且對比了多個(gè)CNN架構(gòu)后,認(rèn)為最好的為100個(gè)輪次的DenseNet169[20]。有研究[21]利用層次聚類和三特征選擇指標(biāo)篩選應(yīng)變式彈性超聲的高通量特征,篩選的7個(gè)組學(xué)特征鑒別乳腺腫瘤的AUC為0.917。Zhou等[22]也采用CNN自動(dòng)提取超聲彈性影像組學(xué)特征,CNN相對于手動(dòng)勾畫的方法保留了腫瘤周邊的特征,所建立的模型鑒別乳腺腫瘤良惡性的準(zhǔn)確度達(dá)到95.8%;Zhang等[23]認(rèn)為用DL架構(gòu)學(xué)習(xí)彈性圖像的特征相對量化圖像強(qiáng)度和紋理的統(tǒng)計(jì)特征具有更好的分類性能,均佐證了DL處理彈性圖像的優(yōu)越性。
ABUS的圖像采集獨(dú)立于操作者,可以提供整個(gè)乳房的三維視圖,但ABUS圖像閱片非常耗時(shí),可能由于疏忽會(huì)出現(xiàn)錯(cuò)誤。Wang等[24]證明了DL網(wǎng)絡(luò)可以用于ABUS閱片,在大大縮短閱片時(shí)間的同時(shí)還能達(dá)到95%的靈敏度,具有良好的乳腺腫瘤鑒別能力(AUC為0.947),且所有超聲科醫(yī)師的診斷效能在參考CNN的診斷結(jié)果后得到了提升[25]。
部分研究[19,26-27]直接顯示,基于二維超聲和彈性超聲的DL特征建立的組合特征模型,其診斷效果優(yōu)于兩種圖像的單一組學(xué)模型(AUC為0.961~1.000)。Youk等[28]經(jīng)過特征篩選及統(tǒng)計(jì)分析發(fā)現(xiàn),3個(gè)二維超聲和2個(gè)SWE的組學(xué)特征與乳腺癌獨(dú)立相關(guān),AUC為0.929和0.992。Li等[29]的研究顯示,多模態(tài)超聲圖像(二維、SWE和超聲造影)基于帶屬性包的特征篩選方法建立的乳腺腫瘤鑒別模型,其AUC達(dá)0.902。一項(xiàng)多中心大數(shù)據(jù)的研究[30]顯示,基于DL建立的二維-彩色多普勒模型對良性腫瘤、惡性腫瘤、炎性反應(yīng)性腫塊和腺病的分類AUC分別為0.90、0.91、0.90和0.89,表現(xiàn)明顯優(yōu)于超聲科醫(yī)師。
目前研究顯示超聲組學(xué)對乳腺腫瘤的診斷效能可媲美超聲專家,多模態(tài)超聲組學(xué)診斷效能優(yōu)于單一模態(tài),未來有望作為第二閱片人應(yīng)用于臨床,提高低年資超聲科醫(yī)師的診斷水平。然而目前超聲組學(xué)仍具有限制性:① 目前多數(shù)為小樣本量、回顧性研究,外部驗(yàn)證較少,而組學(xué)算法的可重復(fù)性需要大規(guī)模、高質(zhì)量的前瞻性研究來驗(yàn)證。② 研究圖像未標(biāo)準(zhǔn)化,如圖像切面、數(shù)量及采集設(shè)備參數(shù)等。③ 各個(gè)機(jī)構(gòu)甚至單個(gè)機(jī)構(gòu)之間的算法未標(biāo)準(zhǔn)化。