呂昊陽,洪重,黃俠鳴,俞富祥
1.溫州醫(yī)科大學(xué)附屬第一醫(yī)院 肝膽胰外科,浙江 溫州 325000;2.溫州醫(yī)科大學(xué)附屬第二醫(yī)院 肝膽胰外科,浙江 溫州 325027
肝內(nèi)膽管癌(intrahepatic cholangiocarcinoma,ICC)作為一種較為常見的肝臟惡性腫瘤,約占肝臟惡性腫瘤的20%,占胃腸道惡性腫瘤的3%[1-2],其中腫塊型的ICC是最主要的形態(tài)類型,占所有ICC病例的80%~90%[3-4]。據(jù)統(tǒng)計ICC患者5年總生存率低于10%[5],并且近年ICC的發(fā)病率與病死率普遍呈上升趨勢[6-7]。微血管侵犯(microvascular invasion,MVI)是ICC患者的獨立預(yù)后危險因素[8],對于MVI高風(fēng)險的患者建議行寬切緣的肝切除術(shù)以改善預(yù)后[9],并且MVI會增加肝移植后的復(fù)發(fā)率,是行肝移植治療的相對禁忌證[2,10]。
影像組學(xué)以及機器學(xué)習(xí)算法已經(jīng)被證實在腫塊型ICC的MVI預(yù)測中具有重要價值[11],但增強影像的時期選擇以及多種機器學(xué)習(xí)間比較等關(guān)鍵問題仍不明確,影像組學(xué)特診與臨床特征的結(jié)合研究也尚欠缺。因此,我們提取并篩選了ICC患者術(shù)前增強CT的多時相影像組學(xué)特征,采用多種常見的機器學(xué)習(xí)算法來構(gòu)建模型并進行比較,然后將最佳的影像組學(xué)機器學(xué)習(xí)預(yù)測方法與臨床資料結(jié)合,建立一種基于機器學(xué)習(xí)的腫塊型ICC術(shù)前MVI狀態(tài)預(yù)測模型,并且以列線圖的形式展示。
回顧性收集2015 年1 月至2023 年2 月期間就診于溫州醫(yī)科大學(xué)附屬第一醫(yī)院(75例)和溫州醫(yī)科大學(xué)附屬第二醫(yī)院(29例)的ICC患者的臨床資料。根據(jù)《赫爾辛基宣言》的原則獲得溫州醫(yī)科大學(xué)附屬第一醫(yī)院倫理委員會的批準,免于患者知情同意(批號:KY2023-R127),并在進行研究之前匿名處理數(shù)據(jù)。最終篩選出104例腫塊型ICC患者作為研究對象,其中微血管侵犯陽性35例(MVI陽性組),微血管侵犯陰性69例(MVI陰性組)。
納入標準:(1)行肝切除術(shù),術(shù)后病理學(xué)診斷為腫塊型ICC,并且有描述微血管侵犯情況;(2)術(shù)前1 個月內(nèi)做過上腹部增強CT 檢查,CT 圖像清晰,無偽影。排除標準:(1)術(shù)前行針對ICC治療,包括肝切除術(shù),經(jīng)動脈化療栓塞(transarterial chemoembolization,TACE),免疫治療,放射治療;(2)診斷ICC為肝內(nèi)多發(fā),或者伴發(fā)有其他惡性腫瘤;(3)臨床資料不完整。
臨床指標包括:患者年齡,高血壓史,糖尿病史,乙肝病史,腫瘤位置,腫瘤最大徑,遠端膽管是否擴張,增強CT有無瘤周強化,增強CT有無瘤內(nèi)動脈,白細胞計數(shù),中性粒細胞數(shù)絕對值,紅細胞計數(shù),部分活化凝血酶原時間,纖維蛋白原,直接膽紅素,間接膽紅素,總蛋白,白蛋白,丙氨酸氨基轉(zhuǎn)移酶,天冬氨酸氨基轉(zhuǎn)移酶,堿性磷酸酶,γ-谷氨?;D(zhuǎn)移酶,甲胎蛋白(AFP),癌胚抗原(CEA),糖類抗原CA199。其中實驗室檢查選擇術(shù)前10 d內(nèi)的最后一次結(jié)果。所有臨床資料根據(jù)正常值范圍或臨床分析重編碼為二分類變量。
本研究采用CT掃描儀包括GE BrightSpeed 16;東芝Aquilion ONE和飛利浦Brilliance 16,管電壓100~120 kV,管電流200~500 mA,旋轉(zhuǎn)時間0.5 s,圖像矩陣為512×512,采用非離子型碘比劑經(jīng)肘靜脈留置針注入,劑量1.5 mL/kg,注射流率3 mL/h,注射后30 s與60 s分別進行動脈期與門脈期掃描。所有CT影像以DICOM格式導(dǎo)出并使用RIAS 0.2.1 軟件進行預(yù)處理,包括重采樣為0.7 mm×0.7 mm×5.0 mm,固定窗寬200,窗位50,以及圖像Z值標準化。
由1 名具有相關(guān)資質(zhì)的研究員在病理結(jié)果和臨床資料均不知情的前提下,使用3D slicer5.2.2軟件獨立勾畫每一層圖像的ICC病灶區(qū)域,并自動生成三維容積感興趣區(qū),以nrrd格式導(dǎo)出。感興趣區(qū)域勾畫時盡可能沿腫瘤邊緣進行,避開腫瘤壞死或鈣化區(qū)域及周圍大血管。然后使用Python的Pyradiomics3.0.1包進行特征提取[12],動脈期與門脈期各提取到原始與變換處理后圖像的1 409個特征。為了評估感興趣區(qū)域的一致性,在完成第1次勾畫3周后,從數(shù)據(jù)中隨機抽取15 例,再次進行勾畫,使用組內(nèi)相關(guān)系數(shù)(intra-class correlation coefficients)來評估特征提取的一致性,去除了其中相關(guān)系數(shù)低于0.8的特征。
將提取到的影像組學(xué)特征使用MinMaxScaler法進行歸一化,并用U檢驗去除差異不顯著的特征。然后將動脈期,門脈期以及動脈-門脈期聯(lián)合的3 組特征分別用最大相關(guān)最小冗余算法(maxrelevance and min-redundancy,mRMR)進行篩選,選擇前10項特征用于建立模型。將3組影像組學(xué)特征分別使用極度梯度提升(XGBoost)、輕量級梯度提升(LightGBM)、隨機森林(randomforest)、自適應(yīng)增強(AdaBoost)、高斯樸素貝葉斯(GNB)、樸素貝葉斯(CNB)、神經(jīng)網(wǎng)絡(luò)(MLP)、支持向量機分類(SVM)及近鄰分類(KNN)9種機器學(xué)習(xí)分類算法,建立共27 種機器學(xué)習(xí)預(yù)測模型。為了更好地比較這27種預(yù)測模型,增加可信性,本研究并未將患者分為訓(xùn)練組和驗證組,而是選擇采用五折交叉法進行驗證。繪制了受試者操作特征(receive operating characteristic,ROC)曲線并計算工作曲線下面積(area under the curve,AUC)以進行比較,選擇出其中預(yù)測能力最強的模型(圖1)。
圖1 影像組學(xué)機器學(xué)習(xí)預(yù)測模型的建立及比較流程
將所有104例患者按7∶3分為訓(xùn)練組(n=73)與驗證組(n=31)。對訓(xùn)練組患者的影像組學(xué)特征,使用最佳機器學(xué)習(xí)算法建立預(yù)測模型,計算出所有患者的影像組學(xué)預(yù)測值。從臨床特征中篩選出具有顯著差異的特征,并使用最小絕對收縮和選擇算法(least absolute shrinkage and selec-tion operator,LASSO)回歸進一步篩選,用得到的臨床特征與影像組學(xué)機器學(xué)習(xí)預(yù)測值使用邏輯回歸建立預(yù)測模型,并繪制成列線圖以直觀展示。用驗證組對預(yù)測模型進行驗證,繪制ROC曲線并計算AUC。作為對比,使用臨床特征建立臨床預(yù)測模型,使用影像組學(xué)機器學(xué)習(xí)預(yù)測值建立影像組學(xué)預(yù)測模型(圖2)。
圖2 影像組學(xué)-臨床預(yù)測模型的建立及檢驗流程
單因素分析使用Python的statsmodels0.11.1包,其中影像組學(xué)特征按P<0.05 標準行U檢驗,臨床特征按P<0.1 行χ2檢驗。mRMR算法及機器學(xué)習(xí)預(yù)測模型使用了Python的xgboost1.2.1包,lightgbm3.2.1包和sklearn0.22.1 包。LASSO回歸特征篩選和邏輯回歸預(yù)測模型使用了R語言的glmnet4.1.2 包和logreg6.2.0包。P<0.05為差異具有統(tǒng)計學(xué)意義。
構(gòu)建并交叉驗證的27 個影像組學(xué)-機器學(xué)習(xí)預(yù)測模型中(圖3),經(jīng)DeLong檢驗,預(yù)測模型間的差異沒有統(tǒng)計學(xué)意義,其中門脈期的CNB 算法五折交叉驗證的平均AUC為0.818(表1),表現(xiàn)相對最佳。篩選出的門脈期特征包括了1 個一階統(tǒng)計特征“l(fā)ogsigma30mm3D_firstorder_Maximum”和9 個灰度紋理特征“waveletHHH_ngtdm_Contrast”“waveletHHL_glszm_SmallAre aLowGrayLevelEmphasis”“waveletHHL_glszm_SmallAreaEmphasis”“waveletHLL_glszm_Size ZoneNonUniformity”“waveletHLL_glszm_Low GrayLevelZoneEmphasis”“waveletLHH_glszm_ZonePercentage”“waveletLHH_glszm_LowGray LevelZoneEmphasis”“waveletLHL_glszm_GrayL evelNonUniformity”“l(fā)ogsigma30mm3D_glszm_LowGrayLevelZoneEmphasis”。見圖4。
圖3 影像組學(xué)-機器學(xué)習(xí)預(yù)測模型ROC曲線和校準曲線
MVI陽性組與陰性組間有8 項臨床特征差異有統(tǒng)計學(xué)意義(表2),包括年齡>60歲,乙肝,瘤內(nèi)動脈穿行,CEA>5 ng/mL,白蛋白<40 g/L,中性粒細胞>6.3×109/L,白細胞>9.5×109/L,經(jīng)LASSO回歸進一步篩選出CEA(OR=4.613)、瘤內(nèi)動脈穿行(OR=3.553)2個特征(圖4)。最終得到的影像組學(xué)-臨床聯(lián)合模型的訓(xùn)練組AUC為0.881,靈敏度為0.978,特異度為0.656,F(xiàn)1 分數(shù)為0.716;驗證組AUC為0.891,靈敏度為0.909,特異度為0.700,F(xiàn)1分數(shù)為0.707,顯示該模型具有良好的預(yù)測效果(表3)。臨床模型的訓(xùn)練組AUC為0.783,驗證組AUC為0.841,影像組學(xué)模型的訓(xùn)練組AUC為0.842,驗證組AUC為0.823。影像組學(xué)-臨床聯(lián)合模型的預(yù)測能力優(yōu)于臨床模型和影像組學(xué)模型,而影像組學(xué)模型的預(yù)測能力與臨床模型相近,聯(lián)合模型與臨床模型的訓(xùn)練組AUC稍低于驗證組,我們考慮為研究樣本量較少而產(chǎn)生的偏差。DCA決策曲線顯示,預(yù)測模型在較大的閾值范圍內(nèi)可以獲得凈收益(0~0.6)(圖5)。
表2 MVI陽性組與MVI陰性組患者臨床特征比較[例(%)]
表3 影像組學(xué)-臨床預(yù)測模型的準確性
圖5 訓(xùn)練組、驗證組三種模型(臨床模型、影像組學(xué)模型、影像組學(xué)-臨床模型)預(yù)測能力對比及影像組學(xué)-臨床模型列線圖
目前外科手術(shù)仍是唯一可能治愈ICC的方法,但手術(shù)后的5年生存率也僅有20%~30%[2,7,13]。而MVI狀態(tài)在是否擴大手術(shù)切緣,肝移植指征,術(shù)后輔助化療及預(yù)后方面有重要的臨床意義[9,14-15],如果能在術(shù)前預(yù)測出MVI狀態(tài),將對ICC患者的診療提供重要指導(dǎo)。影像組學(xué)作為傳統(tǒng)影像學(xué)的拓展,其重點關(guān)注于影像的微觀特征,展現(xiàn)出了較高的臨床價值。Xiang等[16]采用支持向量機算法構(gòu)建CT影像組學(xué)特征,并結(jié)合臨床數(shù)據(jù)開發(fā)了ICC的MVI預(yù)測模型,訓(xùn)練組和驗證組AUC分別為0.886 和0.800。Zhou等[17]基于動態(tài)增強MRI圖像開發(fā)了ICC的MVI影像組學(xué)預(yù)測模型,在訓(xùn)練組和驗證組中AUC分別為0.873和0.850。本研究中,我們將增強CT影像組學(xué)機器學(xué)習(xí)的預(yù)測值與臨床結(jié)合得到的預(yù)測模型訓(xùn)練組AUC為0.881,驗證組AUC為0.891,顯示出了較為優(yōu)良的預(yù)測能力,臨床醫(yī)師在進行決策時可以參考該預(yù)測模型的預(yù)測結(jié)果,從而制定出更適合患者的治療方案。
影像組學(xué)與機器學(xué)習(xí)算法的結(jié)合可以更好的發(fā)掘出影像中包含的信息,而且分類算法的選擇是預(yù)測模型的重要影響因素之一[18],因此本研究采用了9 種常用的機器學(xué)習(xí)算法來處理影像組學(xué)特征,并且在比較后選擇了CNB算法來計算影像組學(xué)機器學(xué)習(xí)的預(yù)測值。預(yù)測值和臨床資料的聯(lián)合模型則是采用了邏輯回歸算法,從而保證了模型的臨床解釋性,并繪制出一個列線圖來直觀展示,讓該模型可以在臨床中便于使用。
在不同的影像組學(xué)研究中,對增強影像的時相選擇也不盡相同[16,18-19],而在本研究中,門脈期模型的預(yù)測能力優(yōu)于動脈期模型以及動脈期-靜脈期聯(lián)合模型。在篩選出的10個門脈期影像組學(xué)特征中,1個一階統(tǒng)計特征(first order)表示最大灰度級強度,剩下9個灰度紋理特征中,1個灰度色調(diào)差異矩陣特征(ngtdm)表示體素及其鄰域之間灰度變化的大小,8 個灰度大小區(qū)域矩陣特征(glszm)量化了圖像中的灰度級區(qū)域,即具有相同灰度級強度的連接體素數(shù)量。這10個特征有9個來自于小波變換(Wavelet,binwindth=10),小波變換是空間(時間)頻率的局部化分析,能充分突出某方面細節(jié)特征,可能與低水平放射組學(xué)特征臨床檢查無法發(fā)現(xiàn)的病理生理學(xué)、蛋白質(zhì)組學(xué)和腫瘤形態(tài)學(xué)特點存在潛在關(guān)聯(lián)[20]。既往有多項研究表明紋理特征和小波特征可以反映更多關(guān)于腫瘤異質(zhì)性的信息,影像組學(xué)特征篩選的結(jié)果,也以紋理特征或小波紋理特征為主[16,21-22],這與本研究結(jié)果相一致。
本研究中,瘤內(nèi)動脈穿行被定義為肉眼可見的動脈期瘤內(nèi)血管增強,104例患者中有38例被評估為瘤內(nèi)動脈穿行。經(jīng)檢驗,瘤內(nèi)動脈穿行是ICC患者發(fā)生MVI的獨立危險因素(OR=3.553),被用于預(yù)測模型的建立,這也與既往的一些研究相吻合[23]。我們進一步分析發(fā)現(xiàn),瘤內(nèi)動脈穿行和腫瘤大小具有相關(guān)性(P<0.001),而腫瘤大小在大量研究中被證實與MVI有關(guān)[15,17,24],本研究中MVI陽性與陰性組間的腫瘤大小特征差異也具有統(tǒng)計學(xué)意義(P=0.012)。因此我們認為,瘤內(nèi)動脈穿行與腫瘤大小是兩個具有相關(guān)性的MVI危險因素,而瘤內(nèi)動脈穿行或許具有更好的預(yù)測價值。CEA是一種具有人類胚胎抗原特性的酸性糖蛋白,和CA199 一起被推薦為ICC早期檢測和診斷的標志物,并且與ICC的嚴重程度和疾病預(yù)后相關(guān)[3,25]。本研究中,我們發(fā)現(xiàn)CEA>5 ng/mL是MVI的獨立危險因素(P<0.001),將其作為預(yù)測模型的一個特征。但在不同的研究中CEA升高的閾值并不一致[26],因此需要更大樣本量的研究來確定適合用于MVI預(yù)測的閾值。
綜上所述,增強CT的影像組學(xué)特征和臨床特征結(jié)合可以在術(shù)前較好的預(yù)測ICC患者的MVI狀態(tài),我們建立的基于機器學(xué)習(xí)的預(yù)測模型也表現(xiàn)出良好的預(yù)測能力,可為ICC的臨床診治提供幫助。同時,受限于樣本量不足,仍有些問題難以明確,期待能有進一步研究。