王妍潔,宋 青,韓 鵬,羅渝昆
1 解放軍醫(yī)學(xué)院,北京 100853;2 解放軍總醫(yī)院第一醫(yī)學(xué)中心 超聲診斷科,北京 100853
人工智能(artificial intelligence,AI)這一術(shù)語最早于1956年提出,旨在利用計算機模擬人腦信息處理過程從而進行科學(xué)問題的解決[1]。隨著關(guān)鍵數(shù)據(jù)處理方式的變革、核心建模方式的提出及計算機技術(shù)的迅速發(fā)展,人工智能技術(shù)與醫(yī)療(尤其是醫(yī)學(xué)影像領(lǐng)域)的融合不斷加深,為臨床疾病診治提供了幫助[2-3]。腹部超聲可獲得肝實質(zhì)及包膜、肝內(nèi)外血管及膽管情況、實時血流灌注特點等信息,具有便攜、低成本、實時及非電離成像等優(yōu)勢。作為疾病“前哨兵”,超聲對于肝彌漫性病變程度的評估及異常占位性病變的定位、定性具有很好的診斷效能。人工智能技術(shù),特別是深度學(xué)習(xí)(deep learning,DL)技術(shù)在輔助超聲診斷肝病方面的研究日新月異,本文就人工智能技術(shù)輔助超聲診斷肝病變的研究進展進行綜述。
非酒精性脂肪肝(non-alcoholic fatty liver disease,NAFLD)發(fā)病率近年來逐漸增高。據(jù)統(tǒng)計,非酒精性脂肪肝在我國成年人中的發(fā)病率為15%~30%,成為威脅國人健康的第一大慢性肝病[4]。傳統(tǒng)二維超聲對于脂肪肝程度的判定主要依靠觀察者的肉眼判別,征象包括實質(zhì)回聲細密、遠場回聲衰減、肝腎對比度增加及肝內(nèi)血管模糊表現(xiàn)等[5]。觀察者間一致性較差。因此,迫切需要一種能夠定量而又無創(chuàng)的方法對脂肪肝的嚴重程度進行分級。Han 等[6]以磁共振質(zhì)子脂肪密度分數(shù)(MRIderived proton density fat fraction,MRI-PDFF)為對照標準,對204 名受試者的射頻數(shù)據(jù)進行訓(xùn)練,建立了用于診斷NAFLD 有無的分類器和用于預(yù)測MRI-PDFF 的脂肪分數(shù)估算器,結(jié)果顯示診斷分類器的效能評估均超過90%,預(yù)測脂肪分數(shù)在整個MRI-PDFF 范圍內(nèi)的平均偏差為0.8%,證實基于超聲射頻數(shù)據(jù)進行非酒精性脂肪肝診斷及脂肪分數(shù)量化是準確可行的。Byra 等[7]通過對肝圖像進行高層特征提取,建立了基于遷移學(xué)習(xí)的網(wǎng)絡(luò)模型,使用特征和套索回歸方法對照肝活檢以評估脂肪變性程度,其曲線下面積(area under the curve,AUC)達0.977,優(yōu)于傳統(tǒng)灰度共生矩陣法和肝腎指數(shù)法。Cao 等[8]采用包絡(luò)信號法、灰度法和深度學(xué)習(xí)索引法對四分類肝圖像進行后處理和ROI 分析,三種方法區(qū)分有無NAFLD 二分類的診斷AUC 值均在0.85 以上,其中深度學(xué)習(xí)指數(shù)AUC 值可達0.933。但該研究缺乏病理或其他影像學(xué)標準對照,僅依據(jù)3 名醫(yī)師主觀判別NAFLD 程度,這或許解釋了其對于鑒別輕、中度NAFLD 效能較差的原因。Chen 等[9]使用基于VGG-16 模型的深度學(xué)習(xí)算法和基于超聲熵成像的反向散射統(tǒng)計分析,對肝脂肪變性進行分級預(yù)測,結(jié)果顯示兩者在識別中、重度脂肪肝的AUC差異有統(tǒng)計學(xué)意義,后者效能略優(yōu)于前者,且后者還可提供與微結(jié)構(gòu)有關(guān)的物理信息,這為臨床輔助診療提供了一種不同的思路。
近期,有研究提出了一種基于四種不同遷移學(xué)習(xí)預(yù)訓(xùn)練的組合式深度學(xué)習(xí)算法,其對肝是否存在NAFLD 的二分類準確性非常高(AUC 達0.999 9)[10]。但目前只做到二分類,且數(shù)據(jù)樣本僅包含55 名需減重手術(shù)的嚴重肥胖患者,輕、中度NAFLD 患者的納入量少,選擇偏倚對模型效能或有影響。
肝纖維化是機體應(yīng)對多種長期慢性損傷(如慢性乙型肝炎)后產(chǎn)生的累及全肝的免疫性損傷修復(fù)反應(yīng),其病理改變示纖維組織異常增生,至終末形成假小葉(即肝硬化階段)?!案窝?肝纖維化-肝硬化-肝癌”四部曲中肝纖維化與肝硬化的治療方案不盡相同,正確區(qū)分疾病進展情況有利于指導(dǎo)臨床治療方案的選擇。早期研究使用基于模糊邏輯算法的紋理分析測算超聲圖像中的數(shù)字定量特征,從而實現(xiàn)分類輸出[11]。Gao 等[12]使用灰度梯度共生矩陣和灰度共生矩陣對肝二維超聲圖像進行紋理分析,采用多層前饋神經(jīng)網(wǎng)絡(luò)作為分類器,對肝纖維化進行五分類預(yù)測,對不同分類的預(yù)測正確率均>70%,其中S0 和S4 分類準確率更高達100%,但灰度檢測法受到不同儀器及時間增益補償?shù)挠绊戄^大。高永振等[13]利用背向散射回波射頻時間序列分析原理,提取7個特征參數(shù)建立分類模型,對正常肝和肝硬化的二分類準確率為87.5%。Acharya 等[14]基于曲波變換方法提取熵特征,利用局部性敏感判別分析,對正常、肝纖維化和肝硬化三分類的預(yù)測準確率為97.33%。Cheng 等[15]分析了160 組大鼠肝纖維化超聲射頻數(shù)據(jù),采用基于雙向長短期記憶網(wǎng)絡(luò)模型定量預(yù)測不同分期肝纖維化程度,線性回歸顯示其與病理金標準具有良好的相關(guān)性(R2>0.93)。
付甜甜等[16]結(jié)合灰階超聲和二維剪切波彈性新技術(shù)作為輸入端對圖像數(shù)據(jù)進行訓(xùn)練,使用Let-Net-5 深度學(xué)習(xí)網(wǎng)絡(luò)模型對肝纖維化進行二分類和三分類的不同分級預(yù)測,其中二分類最好結(jié)果可達91.8%。Xue 等[17]基于超聲圖像灰度和彈性模量相結(jié)合的遷移學(xué)習(xí)模型對肝纖維化進行分期預(yù)測,二者相結(jié)合對肝纖維化各分期(S4、≥ S3 和 ≥S2)的AUC 分別為0.950、0.932 和0.930,性能優(yōu)于傳統(tǒng)血清學(xué)檢測。
趙萬明[18]對321 名慢性乙型肝炎患者的超聲圖像進行分析,篩選了121個影像組學(xué)特征對肝纖維化分期進行預(yù)測,結(jié)果示模型對于早期纖維化的AUC 值可達0.88,證實基于遷移學(xué)習(xí)和影像組學(xué)的網(wǎng)絡(luò)模型對肝纖維化具有較好的表征能力。除了對肝整體實質(zhì)變化情況進行特征提取學(xué)習(xí)之外,有研究基于手動勾畫高頻超聲圖像肝包膜輪廓模型,對肝硬化進行早期預(yù)測[19]。Liu 等[20]進一步提出了區(qū)域肝包膜自動檢測及特征分析的網(wǎng)絡(luò)模型,最大AUC 值可達0.97。
肝局灶性病變在臨床常見,不同病理類型的病變對應(yīng)的超聲圖像具有不同的影像學(xué)特征。臨床處理良性病變傾向于定期復(fù)查,而惡性病變需要盡早進行干預(yù)處理[21]。早期區(qū)分超聲圖像中肝局灶性病變性質(zhì)的計算機輔助診斷主要基于灰度紋理,即對病灶內(nèi)部和周邊對比提取有意義的紋理特征進行分析。Virmani 等[22]提出基于支持向量機的小波紋理描述符用以區(qū)分正常肝、肝硬化及HCC 圖像,其檢測正常肝和肝硬化的總分類準確度為88.8%,檢測HCC 病變的敏感度為86.6%。此外,原發(fā)性肝細胞肝癌和肝轉(zhuǎn)移癌的二分類輸出模型,囊腫、血管瘤和惡性腫瘤的三分類輸出模型,以及囊腫、血管瘤、肝細胞肝癌、轉(zhuǎn)移性癌和正常肝組織的五分類輸出模型,均有嘗試[23-26]。
深度學(xué)習(xí)基于大量人工神經(jīng)元網(wǎng)絡(luò)分層,對圖像數(shù)據(jù)進行自動學(xué)習(xí)和特征提取,因其卓越的性能,近年來被廣泛應(yīng)用。Schmauch 等[27]使用了50 層殘差神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法,對367 張肝局灶性病變的圖像進行良惡性分類,平均AUC 值約0.935,區(qū)分病變的AUC 值約0.916。Xi 等[28]基于596例超聲數(shù)據(jù)建立的殘差網(wǎng)絡(luò)模型,在病變模型的綜合測試精度為0.84,與兩名超聲醫(yī)生判定結(jié)果相當。一項多中心研究基于2 143例患者的24 343 張二維超聲圖像數(shù)據(jù),建立了用于肝局灶性病變良惡性預(yù)測的深度卷積網(wǎng)絡(luò)模型,其AUC 值可達0.924,模型診斷準確性與超聲造影和增強CT 相當,稍遜于增強MRI[29]。目前多種深度學(xué)習(xí)模型對肝占位性病變良惡性二分類預(yù)測的效能不錯,但尚無與病理學(xué)相關(guān)的更為詳細的分類預(yù)測,而病變的不同病理類型往往對應(yīng)著不同的治療方案和策略選擇。因此,期待在未來出現(xiàn)更為精細的預(yù)測模型。
有研究針對超聲引導(dǎo)下微波消融肝損傷范圍界定問題,利用豬肝消融區(qū)域的1 640個反向散射射頻信號建立卷積神經(jīng)網(wǎng)絡(luò),提出的兩種模型在監(jiān)測熱損傷方面的AUC 均高于0.85,優(yōu)于單純二維超聲圖像,且模型評估的消融區(qū)域與大體病理圖像有很好的相關(guān)性[30]。
大部分肝病已經(jīng)納入人工智能輔助診斷領(lǐng)域,為臨床診斷工作提供了便利。但超聲與人工智能融合發(fā)展仍存在一些問題:1)超聲是應(yīng)用高頻率聲波作為信息載體,提供圖像灰度信息供操作者進行疾病診斷參考的影像學(xué)手段。因其物理學(xué)特點,超聲圖像時有各種偽像存在,包括高斑點噪聲、低對比度、模糊邊界、低信噪比和強度不均勻性等,限制了圖像質(zhì)量[31]。2)與具有標準化切面及掃面間隔的CT/MRI 等成像方式相比,超聲圖像獲取高度依賴于操作者,不同操作者間一致性稍差,不同機器、不同調(diào)節(jié)模式(如2D 增益、機械指數(shù)、時間補償增益等) 的成像結(jié)果差異,對于高度依賴輸入圖像質(zhì)量的人工智能模型來說具有較高挑戰(zhàn)性。3)目前大多研究均基于單中心數(shù)據(jù)樣本進行建模分析,其模型應(yīng)用的普適性有待進一步提高。
目前,人工智能輔助超聲病變圖像識別及分類尚處于起步階段,其效能還有待驗證。臨床信息、病史數(shù)據(jù)的輸入有望與單純圖像信息相互補充,提高模型預(yù)測診斷準確率??傊斯ぶ悄芘c超聲診斷相互融合,對于減輕臨床醫(yī)生煩雜的工作量、促進規(guī)范化的臨床診療、提高觀察者一致性具有十分重要的意義。