劉書涵,李錦龍,周 青
(武漢大學(xué)人民醫(yī)院超聲影像科,湖北 武漢 430060)
2021年WHO中樞神經(jīng)系統(tǒng)腫瘤分類將成人彌漫性低級別膠質(zhì)瘤(diffuse lower grade glioma, DLGG)分為星形細(xì)胞瘤[異檸檬酸脫氫酶-1(isocitratedehydrogenase, IDH)突變型]和少突膠質(zhì)細(xì)胞瘤(IDH突變伴1p/19q共缺失)[1]。目前病理學(xué)檢查仍為臨床鑒定1p/19q共缺失的金標(biāo)準(zhǔn),存在諸多潛在風(fēng)險和并發(fā)癥[2]。作為無創(chuàng)預(yù)測腫瘤分子分型的新手段,影像組學(xué)現(xiàn)已廣泛用于臨床研究;但1p/19q共缺失在膠質(zhì)瘤中屬于相對少見的基因丟失事件[3],導(dǎo)致相關(guān)影像組學(xué)研究相對較少。本研究以對比增強液體衰減反轉(zhuǎn)恢復(fù)(contrast enhancement-fluid attenuated inversion recovery, CE-FLAIR)序列MRI構(gòu)建影像組學(xué)模型,觀察其判斷成人DLGG 1p/19q狀態(tài)的價值。
1.1 研究對象 回顧性分析2017年6月—2021年12月135例于武漢大學(xué)人民醫(yī)院經(jīng)術(shù)后病理診斷的DLGG患者,男69例,女66例,年齡19~84歲,平均(42.3±13.6)歲;其中少突膠質(zhì)細(xì)胞瘤81例(共缺失組),男37例,女44例,平均年齡(43.3±13.0)歲,WHO分級2級51例、3級30例;星形細(xì)胞瘤54例(非共缺失組),男32例,女22例,平均年齡(39.9±14.4)歲,WHO分級2級37例、3級17例。經(jīng)分層抽樣,按7∶3比例將患者分為訓(xùn)練集和驗證集。訓(xùn)練集(n=95)包括共缺失組57例、非共缺失組38例;驗證集(n=40)包括共缺失組24例及非共缺失組16例。納入標(biāo)準(zhǔn):①年齡≥18歲;②術(shù)前4周內(nèi)接受MR檢查,含完整CE-FLAIR序列成像,且圖像質(zhì)量較好;③腫瘤均為單發(fā),MR檢查前均未接受任何干預(yù);④術(shù)后均以熒光原位雜交法檢測1p/19q狀態(tài)。
1.2 儀器與方法 采用Siemens Verio 3.0T MR掃描儀,8通道頭部線圈。囑患者仰臥,完成常規(guī)序列掃描后,采用高壓注射器以3.0 ml/s流率經(jīng)肘靜脈團注釓噴酸葡胺注射液(Bayer公司,劑量0.1 mmol/kg體質(zhì)量),采集顱腦軸位CE-FLAIR序列圖像,參數(shù):TR 7 500 ms,TE 94 ms,層厚5.0 mm,層間距1.0 mm,F(xiàn)OV 220 mm×186 mm,F(xiàn)A 150°,矩陣408×512,NEX 2。
1.3 圖像分割及特征篩選 由2名具有12年以上工作經(jīng)驗的放射科主治醫(yī)師,采用3D-Slicer 4.11軟件,以盲法避開瘤周水腫區(qū)手動分割訓(xùn)練集軸位CE-FLAIR序列圖像中的腫瘤ROI,無明顯強化時勾畫腫瘤呈高信號最大范圍(圖1);如其勾畫的腫瘤范圍差異≥5%,則由第3名具有20年以上工作經(jīng)驗的神經(jīng)放射學(xué)專家評估并進行調(diào)整而完成分割。
圖1 手動勾畫CE-FLAIR序列MRI中的腫瘤ROI示意圖 A、B.患者女,29歲,右側(cè)額頂葉少突膠質(zhì)細(xì)胞瘤(WHO 2級,1p/19q共缺失),軸位CE-FLAIR圖像示腫瘤無明顯強化(A),故勾畫高信號最大范圍(B); C、D.患者男,61歲,左側(cè)額葉星形細(xì)胞瘤(WHO 3級,1p/19q非共缺失),軸位CE-FLAIR圖示腫瘤明顯強化(C),利于勾畫(D) (綠色為腫瘤ROI)
采用“Radiomics”插件提取腫瘤特征,將分割后的圖像(nii.gz)導(dǎo)入特征提取界面,依次勾選一階統(tǒng)計量(firstorder)、灰度共生矩陣(gray-level co-occurrence matrix, GLCM)、灰度相關(guān)矩陣(gray-level dependence matrix, GLDM)、灰度游程長度矩陣(gray-level run-length matrix, GLRLM)、灰度尺寸區(qū)域矩陣(gray-level size zone matrix, GLSZM)、鄰域灰度差矩陣(neighbouring gray tone difference matrix, NGTDM)、形狀(shape)、2D形狀(shape 2D)及基于小波的特征(wavelet-based features);以Mann-WhitneyU檢驗篩選具有差異的特征,再以5折交叉驗證最小絕對收縮和選擇算子(least absolute shrinkage and selection operator, LASSO)算法去除對1p/19q狀態(tài)影響不顯著者。
1.4 影像組學(xué)模型構(gòu)建 采用Python 3.9.7軟件分析處理定量特征,并分別以NumPy 1.20.3、Pandas 1.3.4、SciPy 1.7.1、Scikit-Learn 1.0.2、極限梯度提升(extreme gradient boosting, XGBoost)1.5.2及輕量梯度提升機(light gradient boosting machine, LightGBM)3.3.2構(gòu)建機器學(xué)習(xí)模型。針對所選影像組學(xué)特征構(gòu)建5種常用且效能評價較好的機器學(xué)習(xí)模型,包括支持向量機(support vector machine, SVM)、隨機森林(random forest, RF)、XGBoost、LightGBM及邏輯回歸(logistic regreesion, LR)模型。
1.5 統(tǒng)計學(xué)分析 采用SPSS 26.0統(tǒng)計分析軟件。以獨立樣本t檢驗比較符合正態(tài)分布且方差齊的計量資料;采用χ2檢驗比較組間計數(shù)資料差異。繪制受試者工作特征(receiver operating characteristic, ROC)曲線,計算曲線下面積(area under the curve, AUC),評價各影像組學(xué)模型判斷訓(xùn)練集及驗證集DLGG 1p/19q狀態(tài)的價值,并以DeLong檢驗進行比較。P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 一般資料 2組患者性別(χ2=2.391,P=0.122)、年齡(t=1.458,P=0.148)差異均無統(tǒng)計學(xué)意義。
2.2 影像組學(xué)特征篩選 針對每個ROI提取851個影像組學(xué)特征,分別標(biāo)記為F_1~F_851。經(jīng)Mann-WhitneyU檢驗共選出74個組間差異有統(tǒng)計學(xué)意義的特征;以5折交叉驗證的LASSO算法(圖2)引入懲罰因子(λ);于λ=0.029時篩選 12個與1p/19q狀態(tài)顯著相關(guān)的影像組學(xué)特征(表1),其間的關(guān)系熱圖見圖3。
圖2 LASSO算法篩選DLGG 1p/19q狀態(tài)的影像組學(xué)特征 A.于篩選特征中引入懲罰因子λ進行計算,λ取虛線對應(yīng)數(shù)值; B.篩選特征對應(yīng)的LASSO系數(shù)(即縱坐標(biāo))隨λ值變化情況
表1 與DLGG 1p/19q狀態(tài)顯著相關(guān)的影像組學(xué)特征
圖3 LASSO選出的影像組學(xué)特征之間的關(guān)系熱圖 (色帶為Pearson相關(guān)系數(shù))
2.3 影像組學(xué)模型效能評價 基于以上特征建立的SVM、RF、XGBoost、LightGBM及LR模型評價訓(xùn)練集DLGG 1p/19q狀態(tài)的AUC分別為0.89、0.97、0.97、0.96及0.85,驗證集的AUC分別為0.86、0.92、0.93、0.92及0.78。驗證集中,LR模型AUC低于SVM、RF、XGBoost、LightGBM(Z=2.981、3.136、3.014、2.827,P均<0.05);而SVM、RF、XGBoost及LightGBM間AUC差異均無統(tǒng)計學(xué)意義(P均>0.05),見圖4。其他參考評價指標(biāo)包括敏感度、特異度、陽性預(yù)測值、陰性預(yù)測值及準(zhǔn)確率,其中RF準(zhǔn)確率最高達88.24%,見表2。
表2 5種機器學(xué)習(xí)模型評價DLGG 1p/19q狀態(tài)的效能比較
圖4 5種機器學(xué)習(xí)模型評價DLGG 1p/19q狀態(tài)的ROC曲線 A.訓(xùn)練集; B.驗證集
本研究通過提取CE-FLAIR的影像組學(xué)特征,分別構(gòu)建SVM、RF、XGBoost、LightGBM及LR機器學(xué)習(xí)模型,最終經(jīng)降維篩選后納入12個與1p/19q狀態(tài)顯著相關(guān)的特征,包括6個主要反映所測體素對稱性、均勻性及局部強度分布變化的一階特征(first order)和6個主要反映圖像體素灰度之間的空間排列關(guān)系的高階紋理特征(2個GLCM,2個GLDM,1個GLSZM,1個NGTDM)。腫瘤偏度(skewness)越大,代表其內(nèi)部體素分布越不對稱。1p/19q共缺失膠質(zhì)瘤更易出現(xiàn)鈣化、囊變和水腫,即腫瘤內(nèi)部信號跨度大,可能與偏度差異增大有關(guān)[4]。本研究共篩選出4個不同類型偏度特征,包括original(原始特征)及wavelet-LHL/LHH/HLL。產(chǎn)生鈣化可間接增加一階特征中的平均值(mean,ROI內(nèi)平均灰度級強度)和峰度(kurtosis,平均值標(biāo)準(zhǔn)化數(shù)據(jù)的四次方)。本研究共缺失組較非共缺失組更易發(fā)生鈣化,且發(fā)生率高于囊變及水腫,或與納入了平均值和峰度特征有關(guān)。
高階紋理特征中,繁忙度(busyness)表示像素與其鄰域之間的強度變化,可能與腫瘤內(nèi)部信號不均勻密切相關(guān);CS是衡量GLCM偏度和均勻度的指標(biāo),CS越高,代表平均值的不對稱性越大,進一步佐證了偏度特征的可靠性。SDLGLE、IMC1、DV及GLNU則均具空間抽象性,可能與成人DLGG的異質(zhì)性有關(guān)。
樊建坤等[5]于來自98例DLGG患者的107個FLAIR序列影像組學(xué)特征中篩選出8個特征,用于建立SVM模型,其判斷驗證集1p/19q狀態(tài)的AUC為0.82。KONG等[6]提取WHO 2~3級彌漫性膠質(zhì)瘤三維增強T1WI和T2WI特征用于構(gòu)建RF模型,其預(yù)測訓(xùn)練集和驗證集1p/19q狀態(tài)的AUC分別為0.94和0.89,準(zhǔn)確率分別為0.89和0.83。KOCAK等[7]采用與上述相同的MR序列構(gòu)建的5種機器學(xué)習(xí)模型(神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯、SVM、RF及隨機梯度下降)預(yù)測1p/19q狀態(tài)的AUC為0.77~0.87,尤以神經(jīng)網(wǎng)絡(luò)表現(xiàn)最佳,但與其他模型比較無顯著差異。本研究所建立的SVM、RF、XGBoost、LightGBM及LR模型評價訓(xùn)練集DLGG 1p/19q狀態(tài)的AUC分別為0.89、0.97、0.97、0.96及0.85,其在驗證集的AUC分別為0.86、0.92、0.93、0.92及0.78,具有較高診斷效能,與前述研究結(jié)果相似或更優(yōu);分析原因,可能在于對比增強序列更具優(yōu)勢,顯示信息更為準(zhǔn)確,CE-FLAIR作為常規(guī)增強的補充手段有利于反映軟腦膜受累、評價血腦屏障破壞程度,以半劑量釓劑即可達到與CE-T1WI媲美的增強效果[8-10]。
一項最新研究表明[11],通過深度學(xué)習(xí)圖像標(biāo)簽(deep learning imaging signature, DLIS)構(gòu)建模型,可有效預(yù)測LGG患者1p/19q狀態(tài),其于用于訓(xùn)練集和驗證集的AUC高達0.99、0.98,F(xiàn)1分?jǐn)?shù)為0.99、0.94,明顯高于本研究結(jié)果;如能針對CE-FLAIR序列提取特征構(gòu)建DLIS模型,可能會更為優(yōu)異的表現(xiàn)。
綜上所述,基于CE-FLAIR影像組學(xué)模型可有效預(yù)測成人DLGG 1p/19q狀態(tài);SVM、RF、XGBoost及LightGBM模型效能均較高,RF模型準(zhǔn)確率最高。但本研究樣本量小,且為單中心研究,僅針對單一CE-FLAIR序列MRI進行研究,存在一定局限性,有待后續(xù)進一步完善。