樊鳳仙,胡萬均,姜艷麗,鄒婕,楊品,張靜*
肝纖維化(liver fibrosis,LF)是各種慢性肝病發(fā)展為肝硬化、肝癌的必經(jīng)途徑,全球的肝硬化患者已從1990年的7100萬大幅上升至2017年的1.22億[1]。大量臨床研究發(fā)現(xiàn)多數(shù)病因?qū)е碌腖F和早期肝硬化經(jīng)過治療干預是可以消退、逆轉(zhuǎn)的[2],因此,LF的早期診斷和及時的臨床干預成為肝病領(lǐng)域最重要的任務。肝活檢是LF 診斷和分期的金標準,但肝活檢的有創(chuàng)性、發(fā)生并發(fā)癥的風險、抽樣誤差等缺點使其不能在臨床廣泛開展,且不適于肝病進展的隨訪。
隨著人工智能技術(shù)的不斷發(fā)展,已經(jīng)在肝臟疾病中開發(fā)了多種機器學習算法并結(jié)合臨床參數(shù)來預測肝臟彌漫型疾病的風險和進程,例如評估LF 和脂肪變性,預測原發(fā)性硬化性膽管炎的肝臟失代償、篩選和選擇肝移植受體以及預測肝移植后的生存率和并發(fā)癥等[3]。Yasaka 等[4]運用釓塞酸二鈉(Gd-EOB-DTPA)增強的肝膽相圖像,研究了深度學習算法在LF 分期中的應用,但研究者所開發(fā)的算法需要手動選擇包括肝臟輪廓在內(nèi)的肝實質(zhì)區(qū)域進行圖像裁剪,該方法可能容易出現(xiàn)觀察者間的差異,且所獲得的感興趣區(qū)(region of interest, ROI)為2D圖像。此外,Gd-EOB-DTPA增強檢查需額外注射對比劑,存在過敏風險。因此,本研究基于LF 患者的常規(guī)T1WI、T2WI、表觀擴散系數(shù)(apparent diffusion coefficient, ADC)平掃圖像開發(fā)基于深度學習的3D 卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)模型,以區(qū)分無顯著LF(S0~S1)、顯著LF(≥S2)。
回顧性分析2016 年1 月至2020 年7 月蘭州大學第二醫(yī)院行肝臟組織穿刺活檢或手術(shù)病理檢查證實為LF,并在病理檢查后3 個月內(nèi)[4]接受過肝臟MRI 平掃檢查的患者病例。納入標準:(1)符合LF病理診斷標準,并有明確病理分期;(2)具有完整的臨床病史資料及臨床實驗室檢查資料。排除標準:(1)MRI 掃描機型及參數(shù)不一致或掃描序列不完整者;(2)圖像質(zhì)量不佳,無法進行分析,如圖像偽影重或重建后圖像有間隔;(3)肝臟彌漫病灶或單發(fā)較大腫塊(最大直徑>5 cm);(4)既往肝臟手術(shù)史。本研究經(jīng)蘭州大學第二醫(yī)院倫理委員會批準,免除受試者知情同意,批準文號:2021A-196。
所有患者均經(jīng)超聲引導下病理穿刺活檢證實為LF,穿刺點為肝右葉。參照國內(nèi)學者以Scheuer評分系統(tǒng)為基礎(chǔ)修訂的慢性肝炎的病理學診斷標準[5]中有關(guān)標準進行LF 分期,將LF 分為S0~S4期:S0為無纖維化;S1 為匯管區(qū)纖維化擴大,局限性竇周及小葉內(nèi)纖維化;S2為匯管區(qū)周圍纖維化,纖維間隔形成,小葉結(jié)構(gòu)保留;S3 為纖維間隔伴小葉結(jié)構(gòu)紊亂,無肝硬化;S4為早期肝硬化。本研究納入病例中S0~S4期LF患者分別為7例、107例、62例、29例、19例。MRI檢查與病理檢查平均間隔時間為4.5 d(0~89 d)。根據(jù)《肝纖維化診斷及治療共識(2019年)》[6],以S0~S1定義為無顯著LF,≥S2定義為顯著LF。
所有患者均行肝臟MRI平掃檢查,檢查前空腹>6 h,并進行呼吸和屏氣訓練以獲得良好的配合。采用荷蘭Philips 3.0 T Ingenia MRI掃描儀,16通道相控陣體線圈。軸位T2WI 頻率衰減翻轉(zhuǎn)恢復(T2WI spectral attenuated inversion recovery, T2WI-SPAIR)序列掃描參數(shù):TR/TE 718 ms/77 ms,F(xiàn)OV 350 mm×392 mm,矩陣232×200,層厚/層間距6.5 mm/1 mm;軸位T1魔鏡成像(T1-mDIXON)序列掃描參數(shù):TR/TE 3.7 ms/1.31 ms,F(xiàn)OV 400 mm×350 mm,矩 陣244×193,層 厚/層 間 距4 mm/-2 mm;軸位擴散加權(quán)成像(diffusion weighted imaging, DWI)序列參數(shù):TR/TE 2462 ms/75 ms,F(xiàn)OV 400 mm×353 mm,矩陣132×117,層厚/層間距6.5 mm/1 mm,b=0、800 s/mm2,掃描結(jié)束后DWI 序列重建出ADC圖。
從影像歸檔和通信系統(tǒng)(picture archiving and communication system, PACS)中下載患者圖像并存儲為DICOM格式文件。預處理步驟包括:(1)T1WI選擇mDIXON序列的水相,從T1-mDIXON序列中單獨保存水相,以T1 水相為標準圖像,應用ITK-SNAP(version 3.6.0,http://www.itksnap.org/)軟件對圖像進行預處理,運用仿射配準方法將T2WI 圖及ADC 圖配準到T1WI圖,重建后圖像層厚4 mm,層間距-2 mm,所有圖像以NiFTI格式保存,然后對所有患者圖像進行配準;(2)使用Python 3.7軟件編寫的代碼對圖像進行處理和自動裁剪,為更好對應病理穿刺區(qū)域,基于肝右葉所在目標區(qū)域坐標,對圖像隨機裁剪10次,步長為10,重疊10 個體素大小,分辨率為28 mm×28 mm×28 mm;(3)使用直方圖均衡化、拉普拉斯換算法對圖像進行增強,以增加訓練樣本的數(shù)量,更好地提取圖像特征、泛化模型,最終每個序列生成211 200幅圖像,將圖像轉(zhuǎn)換為對應的圖像矩陣,輸入CNN模型;(4)為了減少偏場效應,對裁剪后的圖像進行歸一化處理,將像素值歸一化到-1~1之間;(5)按8∶2 的比例隨機將所有患者分為訓練集(n=179)、測試集(n=45)。
CNN模型在GeForce GTX 1060(NVIDIA, California,USA)圖形處理單元上進行有監(jiān)督訓練,該模型是在TensorFlow后端(Google,https://www.Tensorflow.org/)上運行的Python 3.7 和Pytorch 2.4(https://pytorch.org)構(gòu)建。應用訓練集圖像對模型進行網(wǎng)絡結(jié)構(gòu)(包括權(quán)重計算和梯度自動求導)迭代訓練,將CNN 輸出的預測值與實際值(即纖維化病理分期)進行比較,利用損失函數(shù)(loss,本研究為交叉熵)計算誤差。然后對誤差進行反向傳播,并更新網(wǎng)絡權(quán)重、梯度自動求導以減少損失。利用深度學習中常用的隨機梯度下降(stochastic gradient descent, SGD)優(yōu)化器優(yōu)化訓練模型,并更新CNN 中的參數(shù),更新網(wǎng)絡權(quán)重,以減小LF 分類模型與LF 病理分期之間的差異。以四個樣本數(shù)據(jù)為batch 進行訓練。由于小批次的樣本訓練初始權(quán)重和患者選擇存在隨機性,因此進行了1500 個epoch(即所有訓練數(shù)據(jù)前向傳播和反向傳播后更新參數(shù)的過程,訓練過程中全部參數(shù)進行了6000 次更新)。訓練完成后,用測試集數(shù)據(jù)對CNN 模型進行測試,使用準確度(accuracy,ACC)曲線、loss 曲線及受試者工作特征(receiver operating characteristic, ROC)曲線來評價模型的性能。
最終的CNN模型構(gòu)成:(1)三個卷積層,全部使用3D 卷積,其中第一層對于原始圖像中的每個像素都有56 個卷積濾波器,而另外兩個層在所有像素上都有112 個濾波器,每個濾波器通過將體素卷積為2 mm×2 mm×2 mm來生成濾波后的圖像;(2)批標準化層(batch normalization, BN)、三個最大池化(max pooling)層(大小均為2 mm×2 mm×2 mm),BN層可防止模型過擬合,最大池層降低了濾波圖像的分辨率,但具有空間不變性(即通過體素移動的特征仍可以用相同的神經(jīng)元表示,這樣有助于特征提取);(3)兩個全連接(fully connected network,FC)層,一層具有1024 個神經(jīng)元,另一層輸出最終二分類結(jié)果。模型構(gòu)成見圖1。
圖1 3D卷積神經(jīng)網(wǎng)絡模型的結(jié)構(gòu)。輸入圖像經(jīng)過三個卷積層、三個最大池化層處理,然后使用兩個全連接層來處理數(shù)據(jù)。C:通道;U:單元。Fig. 1 The structure of 3D convolutional neural network model. The input image data was processed by three convolution layers and three maximum pooling layers. Then two fully connected layers were used to process the data.C:channel;U:unit.
使用SPSS 26.0(IBM, Armonk, New York, USA)軟件進行統(tǒng)計分析。符合正態(tài)分布的計量資料用均值±標準差(xˉ±s)表示,計數(shù)資料采用頻數(shù)表示。采用單因素方差分析(ANOVA)比較不同纖維化分期患者年齡組間差異。計數(shù)資料采用卡方檢驗進行分析。P<0.05為差異具有統(tǒng)計學意義。
根據(jù)納入及排除標準最終納入患者病例224例,其中:男134例,年齡17~62(37.7±9.9)歲;女90例,年 齡18~61(40.3±10.0)歲;無 顯 著LF(S0~S1)114例;顯著LF(≥S2)110例?;颊吲R床資料見表1。
表1 肝纖維化患者臨床資料Tab.1 Clinical data of patients with LF
模型訓練過程性能評價如圖2 所示,隨著epoch數(shù)量的增加,訓練集和測試集中l(wèi)oss值不斷下降,ACC不斷升高,且測試集ACC優(yōu)于訓練集,提示該模型有較好的分類性能。模型訓練完成后,基于多模態(tài)MRI的3D-CNN 模型在訓練集中的ROC 曲線下面積(area under the curve, AUC)值為0.94,在測試集中的AUC為0.98(圖3)。
慢性肝病給社會帶來了沉重的衛(wèi)生經(jīng)濟負擔,幾乎任何慢性肝病均可引起LF?!陡卫w維化診斷及治療共識(2019 年)》指出在LF 發(fā)生的早期階段以病因治療、抗炎保肝治療為主,進展期、顯著LF 期以及肝硬化期時需要進行抗LF治療[6],因此本研究中將患者分類為無顯著LF(S0~S1)、顯著LF(≥S2)。深度學習技術(shù)在醫(yī)學成像中發(fā)展迅速,其可以從圖像中獲得額外的診斷信息,從而全面和客觀地評估圖像特征。CNN是最流行的神經(jīng)網(wǎng)絡結(jié)構(gòu),也是最常應用于圖像的算法[7]。本研究建立基于多模態(tài)MRI 圖像的3D-CNN 模型,將LF有效分為無顯著LF、顯著LF,對指導臨床治療方法的選擇有重要意義。
以往對LF分期的深度模型開發(fā)多基于CT和超聲圖像[8-10],而MRI圖像具有多參數(shù)、多方位成像及較高的軟組織分辨率等優(yōu)勢,可以使CNN捕捉到更廣泛的成像特征。Yasaka等[4]、Hectors等[11]基于Gd-EOB-DTPA增強MRI的肝膽期圖像建立了深度學習的LF預測模型,特別是Hectors等的研究中實現(xiàn)了全自動深度學習算法,可自動進行肝臟分割,該深度學習模型在預測纖維化嚴重程度方面表現(xiàn)出色,在單獨的測試集中與磁共振彈性成像(magnetic resonance elastography,MRE)有相似的表現(xiàn)。本研究結(jié)果表明,基于T1WI、T2WI、ADC 圖多模態(tài)MRI 的訓練模型能夠在測試集對LF 進行準確分類,其AUC 值達0.98。本研究在LF 分類中具有較高ACC 可能原因如下:(1)首先也是最重要的原因是本研究應用了3D-CNN 網(wǎng)絡,與2D 網(wǎng)絡相比,3D 網(wǎng)絡結(jié)構(gòu)的優(yōu)勢在于密集的連接將信息從之前的所有層傳送到下面的層,這些類型的網(wǎng)絡更容易訓練,可以有效提高分類精確度,減少過度擬合[12]。此外,3D網(wǎng)絡可以編碼更豐富的空間信息,通過3D樣本訓練的層次結(jié)構(gòu)可提取更具代表性的特征[13]。多項研究證實3D-CNN 較傳統(tǒng)2D-CNN 模型有更優(yōu)的分類性能[14-15]。(2)另一個原因可能是本研究從多模態(tài)MRI 圖像中提取和綜合分析了眾多特征,可以實現(xiàn)不同序列中特征信息互補,研究發(fā)現(xiàn)這種方法明顯優(yōu)于單個MRI圖像的模型,且圖像的配準不會影響模型的分類性能[16]。
LF 與膠原蛋白等大分子物質(zhì)在肝臟中的沉積有關(guān),導致肝臟血管和結(jié)構(gòu)改變,從而產(chǎn)生組織紋理的改變,多項研究評估了MRI 影像組學在評估LF 中的應用[17-18],雖然取得了良好的結(jié)果,但影像組學分析需要手動勾畫ROI,不僅費時,ROI 的選擇也受到觀察者間差異的影響;此外,影像組學定性語義特征和定量特征均屬于淺層特征,主要表征圖像的“表象”[19]。深度學習不依賴于預定義的、手工設(shè)計的特征,使用CNN的深度學習能夠自動捕獲初始卷積層中多個層次的特征信息,隨著卷積層感知域的增大,高層次的抽象特征被提取出來,這些特征往往與臨床狀態(tài)有關(guān),從而有助于識別性能的提高[20]。
MRE 是有最高可信度和診斷性能的MRI 定量方法,已經(jīng)成為LF 評估的無創(chuàng)性標準[21],但MRE 檢查需要配備額外硬件,檢查耗時、費用較高等限制了其普及與應用。深度學習作為一種圖像處理方法,在不需要額外硬件的情況下,應用常規(guī)序列即可對LF 進行無創(chuàng)性評估,是肝臟疾病影像學評估中非常有前途的輔助工具。
本研究存在一些局限性。第一,本研究在肝臟分割時僅自動選擇了10個體素大小為28 mm×28 mm×28 mm的3D 正方體圖像,LF 為彌漫性病變,可能無法反映少部分肝臟的纖維化進展。目前有部分研究采用全自動的肝臟分割算法[11],很好地避免了這個問題,因此在今后研究中應不斷改進研究方法。第二,本研究為回顧性研究,患者選擇存在偏倚、樣本量數(shù)據(jù)過少,不同纖維化分期間樣本量不平衡,無法預測確切的纖維化階段,因此采用了二分類LF分類方法。但本研究通過圖像增強方法增加了樣本量,模型在二分類中有較好的診斷性能,今后的工作將不斷擴大研究隊列。
綜上所述,利用常規(guī)序列多模態(tài)MRI 圖像,基于深度學習的3D-CNN 模型可對無顯著LF 和顯著LF 進行準確分類,在LF 的無創(chuàng)性診斷中具有廣闊的應用前景。
作者利益沖突聲明:所有作者均聲明不存在利益沖突。