謝婷婷,劉想,林子楹,張曉東,張耀峰,張大斗,成官迅,王霄英
Couinaud’s肝段分類系統(tǒng)是目前最為廣泛使用的肝段劃分方法[1-2],是肝臟占位病變的定位基礎(chǔ),也用于計算剩余肝臟體積百分比(Future liver remnant,F(xiàn)LR %),進而評估手術(shù)可行性。目前,肝段體積測量和FLR %評估主要依賴于外科醫(yī)生在后處理工作站上“虛擬切除”目標肝段后獲得[3-4],臨床應(yīng)用受限、耗時較長。實現(xiàn)肝段的自動分割、體積測量及FLR %評估已成為臨床需求。
近年來通過深度學(xué)習(xí)實現(xiàn)CT圖像上肝臟分割已有報道[5-7],但肝段分割、體積測量乃至進一步運用到術(shù)前FLR %評估罕見。本研究基于U形全卷積神經(jīng)網(wǎng)絡(luò)(U-shaped fully convolutional neural network,U-Net),使用肝臟增強CT薄層圖像訓(xùn)練深度學(xué)習(xí)模型,并驗證其準確性,旨在探討此模型植入臨床工作中的可行性。
本研究獲得北京大學(xué)第一醫(yī)院、北京大學(xué)深圳醫(yī)院倫理審查委員會的批準[2019(169)、2021(071)]。本研究為回顧性研究,按照北京大學(xué)第一醫(yī)院AI項目研發(fā)規(guī)范進行。
1.用例定義
根據(jù)本單位AI項目管理方法,首先定義研發(fā)增強CT薄層圖像Couinaud’s肝段分割模型用例(Use Case)。分割模型的目標對象定義為增強CT薄層圖像上基于Couinaud’s分類系統(tǒng)的肝段。AI模型的預(yù)測結(jié)果(即8個獨立的Couinaud’s肝段及肝段體積)用于半肝切除術(shù)(右半肝切除術(shù)、擴大右半肝切除術(shù)、左半肝切除術(shù)、擴大左半肝切除術(shù))相應(yīng)FLR %的計算。AI模型提供的數(shù)據(jù)包括8個獨立的Couinaud’s肝段分割結(jié)果及體積。
2.研究隊列的建立
回顧性收集2017年1月至2019年2月在北京大學(xué)第一醫(yī)院(醫(yī)學(xué)中心A)行腹部CT增強掃描連續(xù)病例的資料,為增加模型適用性,納入多種肝臟背景。病例納入標準:CT報告診斷為“肝臟未見異?!?、“脂肪肝”及“肝硬化”者。病例排除標準:①直徑≥2 cm的肝臟占位;②肝臟術(shù)后、先天性肝葉缺如等導(dǎo)致的肝臟形態(tài)異常;③肝靜脈或門靜脈三級分支及以上顯示不清;④肝臟分割結(jié)果不滿意?;仡櫺允占?021年1月至2021年6月在北京大學(xué)深圳醫(yī)院(醫(yī)學(xué)中心B)行腹部CT增強掃描的連續(xù)病例資料,納入CT報告診斷為“肝臟未見異?!薄⑴懦龢藴释息邰艿牟±?。醫(yī)學(xué)中心A、B分別納入170例、50例(分別定義為數(shù)據(jù)集A、B,圖1)。
圖1 本研究納排標準。
3.CT檢查方法
醫(yī)學(xué)中心A、B所使用的掃描儀器、掃描參數(shù)見表1。
表1 醫(yī)學(xué)中心A、B所使用的掃描儀器及掃描參數(shù)
肝臟增強掃描對比劑為優(yōu)維顯(碘含量370 mg/mL),采用高壓注射器經(jīng)肘前靜脈注射,劑量1.5~2.0 mL/kg,注射流率2.5~5.0 mL/s,動脈期為注射對比劑后20~25 s,門脈期及延遲期分別為注射對比劑后85~90 s、300 s。
4.圖像標注
先將肝臟增強CT掃描的DICOM圖像匿名化,轉(zhuǎn)換為NiFTI格式,使用ITK-SNAP軟件標注肝段。先由一位具有5年腹部影像診斷經(jīng)驗的影像科醫(yī)師標
Couinaud’s肝段的標注根據(jù)Couinaud’s肝段劃分標準進行。因尾狀葉右緣和腹側(cè)緣的界定在學(xué)術(shù)界仍存在爭議[8-9],故本研究統(tǒng)一以靜脈韌帶裂右緣至下腔靜脈右緣連線作為劃分Ⅰ段右緣和腹側(cè)緣的分界線。手工標注流程及半肝切除術(shù)模擬圖見圖2。
圖2 肝段分割結(jié)果及半肝切除術(shù)三維模擬圖(手術(shù)模擬圖中白色部分為擬切除的肝段,彩色部分模擬半肝切除術(shù)后剩余肝臟)。
5.模型構(gòu)建
肝臟分割:本單位已訓(xùn)練了肝臟分割模型,用已有肝臟分割模型預(yù)測肝臟范圍,經(jīng)醫(yī)師修改、確認后為肝臟分割結(jié)果。
肝段分割:在肝臟分割結(jié)果的基礎(chǔ)上,根據(jù)Couinaud’s肝段劃分標準分割肝段。數(shù)據(jù)集A隨機分為訓(xùn)練集(train set,132例)、調(diào)優(yōu)集(validation set,19例)和測試集(test,19例),數(shù)據(jù)集B作為外部驗證,輸入數(shù)據(jù)為增強CT門脈期薄層圖像和標注(肝段體積記錄為V),輸出數(shù)據(jù)為模型的預(yù)測結(jié)果,包括各肝段及相應(yīng)肝段體積(記錄為V’)。深度學(xué)習(xí)的模型為 3D U-Net[10]。將NIFTI格式的NCHCT圖像分辨率設(shè)置為128×192×256,窗寬300 HU,窗位30 HU。采用隨機噪聲、平移、仿射變換等圖像擴增方法。使用ADAM梯度下降優(yōu)化算法,初始學(xué)習(xí)率(learning rate)為1×10-4,每次讀取的圖像數(shù)量(batch size)為 2。訓(xùn)練次數(shù)(Epoch)為400,研究所使用的程序語言為Python。模型訓(xùn)練的硬件為GPU NVIDIA Tesla P100 16G,軟件包括Python3.6、Pytorch 0.4.1、Opencv、Numpy、SimpleITK等。
半肝切除術(shù)FLR %的計算:右半肝切除術(shù)定義為切除Ⅴ至Ⅷ段(或在此基礎(chǔ)上同時切除Ⅰ段),擴大右半肝切除術(shù)為切除Ⅳ至Ⅷ段(或在此基礎(chǔ)上同時切除Ⅰ段);左半肝切除術(shù)定義為切除Ⅱ至Ⅳ段(或在此基礎(chǔ)上同時切除Ⅰ段),擴大左半肝切除術(shù)定義為切除Ⅱ至Ⅳ段及Ⅴ、Ⅷ段(或在此基礎(chǔ)上同時切除Ⅰ段)[11]。FLR %=半肝切除術(shù)后剩余肝臟體積/肝臟總體積×100%[4],模型預(yù)測的FLR%為半肝切除術(shù)后剩余肝臟的預(yù)測體積/預(yù)測的肝臟總體積×100%(表2)。
表2 四種半肝切除術(shù)及相應(yīng)FLR %計算方法
6.模型評價
模型分割效果的客觀評價指標為Dice相似性系數(shù)(dice similarity coefficient,DSC)值,計算公式為DSC=(2|X∩Y|)/(|X|+|Y|),X和Y分別代表放射科醫(yī)生標注的肝段區(qū)域和模型預(yù)測區(qū)域內(nèi)包含的像素集。
為測試模型應(yīng)用到FLR %評估的可行性,主觀評價指標為:模型與醫(yī)師基于FLR %預(yù)測半肝切除術(shù)是否可行的一致性。因臨床常建議正常肝臟、脂肪肝、明顯肝纖維化和肝硬化患者的FLR %分別大于20%、30%、40%[12-13]以最大程度降低術(shù)后肝功能衰竭的發(fā)生,故本研究設(shè)定正常肝臟、脂肪肝、肝硬化患者FLR %分別大于20%、30%、40%為半肝切除術(shù)可行的標準。
7.統(tǒng)計學(xué)分析
采用SPSS 21.0和Prism 7軟件進行統(tǒng)計學(xué)分析。計量資料以中位數(shù)(上、下四分位數(shù))表示,采用Bland-Altman分析比較模型與醫(yī)師測量結(jié)果的差異,使用Pearson相關(guān)分析和Bland-Altman分析模型預(yù)測與手工標注在FLR %預(yù)測結(jié)果方面的相關(guān)性和一致性,McNemar’s檢驗分析兩者在預(yù)測半肝切除術(shù)可行性上的一致性。以P<0.05為差異有統(tǒng)計學(xué)意義。
1.研究數(shù)據(jù)特征
醫(yī)學(xué)中心A、B的一般病例資料見表3。兩個醫(yī)學(xué)中心所有患者平均年齡為(52.91±7.1)歲,各肝段體積見圖3,肝臟總體積平均值為(1290.98±23.66)mL(95% CI:1244.36~1337.61)。外部驗證集手工標注的肝段體積為(37.59±1.26)mL至(241.76±6.07)mL,模型分割的肝段體積為(35.45±1.14)mL至(254.29±5.94)mL,兩者具有強相關(guān)性(r=0.956,P<0.05),與金標準相比,模型分割方法輕微高估肝段體積(平均偏差1.363 mL),95% 一致范圍(limit of agreement,LoA)為-8.53至11.26(圖4)。
圖3 兩個醫(yī)學(xué)中心共220例數(shù)據(jù)各肝段體積。 圖4 外部驗證集中模型預(yù)測與手工標注在肝段體積測量的相關(guān)性(a)和一致性(b)。兩者FLR %評估具有強相關(guān)性(r=0.956),一致性高,僅6 %數(shù)據(jù)位于95 %置信區(qū)間之外。 圖5 外部驗證中模型預(yù)測與手工標注在半肝切除術(shù)FLR %評估的相關(guān)性(a)和一致性(b)。兩者FLR %評估具有強相關(guān)性(r=0.99),一致性高,約7.5 %數(shù)據(jù)位于95 %置信區(qū)間之外。 圖6 各肝段DSC值。
表3 入組病例的基線資料
外部驗證集手工標注FLR %為12.41%~74.71%,平均38.27%,模型分割的FLR %為12.38%~75.81%,平均38.42%,兩者FLR%具有強相關(guān)性(r=0.99,P<0.05),與金標準相比,模型分割方法輕微低估FLR%(平均偏差- 0.16%),95% LoA 為0.9872~0.9927(圖5)。
2.模型定量評估
外部驗證各肝段的DSC值在0.46~0.99之間,平均DSC值為0.92±0.00(95% CI:0.91~0.93,圖6),提示模型預(yù)測結(jié)果與人工標注結(jié)果重合度較高。
3.模型定性評估
數(shù)據(jù)集B共50例數(shù)據(jù),模型和醫(yī)師各200個FLR %預(yù)測數(shù)據(jù)。醫(yī)師預(yù)測手術(shù)可行而模型預(yù)測手術(shù)不可行3例(1.50%,3/200),均出現(xiàn)在擴大右半肝切除術(shù),余兩者預(yù)測結(jié)果相同(兩者均預(yù)測手術(shù)可行172例,占86.0%;兩者均預(yù)測手術(shù)不可行25例,占12.5%;醫(yī)師預(yù)測手術(shù)不可行,模型預(yù)測手術(shù)可行0例)。McNemar’s檢驗精確顯著性P值為0.25,提示模型與醫(yī)師在預(yù)測手術(shù)可行性方面差異無統(tǒng)計學(xué)意義。
實現(xiàn)對正常肝臟、脂肪肝、肝硬化等多種肝臟背景下肝段的自動分割、體積測量及半肝切除術(shù)術(shù)前FLR %評估,為臨床迫切需求。
本研究使用AI技術(shù)先分割肝臟,再分割肝段,結(jié)果顯示U-Net模型用于增強CT薄層圖像肝段分割的平均DSC值為0.92,模型與醫(yī)師在FLR %評估上相關(guān)性高,在預(yù)測半肝切除術(shù)可行性上差異無統(tǒng)計學(xué)意義。本研究結(jié)果初步證明了U-Net模型用于增強CT薄層圖像上肝段分割、FLR %評估是可行的,為后續(xù)大樣本、細化肝臟背景的模型訓(xùn)練并植入半肝切除術(shù)術(shù)前FLR %評估提供了依據(jù)。
本研究在肝段體積測量上模型預(yù)測與手工標注高度重合,是植入FLR %評估的關(guān)鍵和前提。因Couinaud’s肝段的解剖基礎(chǔ)為門脈與肝靜脈,故模型提供的肝段體積有潛力提示肝臟血管變異、以肝右葉萎縮及尾狀葉增大為特征的肝硬化和布加綜合征的輔助診斷。
目前罕見基于深度學(xué)習(xí)的半肝切除術(shù)FLR %評估的研究報道。本研究以深度學(xué)習(xí)方法分割肝段為基礎(chǔ),初步證實了自動獲得FLR %值并預(yù)測不同肝臟背景患者半肝切除術(shù)的可行性。FLR %是半肝切除術(shù)后并發(fā)肝衰竭的獨立危險因子[14],本研究在一定程度上為自動預(yù)測半肝切除可行性提供了重要信息。
本研究存在以下局限性:①外部驗證中只有正常肝臟背景數(shù)據(jù),缺乏脂肪肝、肝硬化數(shù)據(jù),模型在此類患者中的分割性能如何將成為下一步研究計劃。②本研究排除了既往存在肝段或肝葉切除史、肝臟介入手術(shù)史的患者,在未來擴大樣本的模型訓(xùn)練中將增加此類肝臟形態(tài)異常的數(shù)據(jù)。③本研究評估FLR %時未剔除肝內(nèi)大血管、直徑小于2 cm的病灶,有可能造成FLR %預(yù)測結(jié)果與術(shù)后FLR %不完全一致,因此下一步將在現(xiàn)有模型基礎(chǔ)上行肝內(nèi)血管及病灶的亞分割。
綜上所述,基于深度學(xué)習(xí)的U-Net分割算法可在增強CT圖像上實現(xiàn)Couinaud’s肝段的自動分割、體積測量并初步運用到半肝切除術(shù)的FLR %評估中,未來的研究將拓寬模型的納入標準并在臨床應(yīng)用中檢驗其預(yù)測價值。