周 振 沈 浮 陸海迪 王敏杰 陸建平
直腸癌是消化系統(tǒng)最常見的惡性腫瘤之一。術(shù)前對直腸癌T分期的準確評估,是影響治療方案的選擇及預后評價的關(guān)鍵因素[1]。傳統(tǒng)MRI檢查僅在形態(tài)學上對腫瘤進行術(shù)前分期評估,但無法滿足目前精準醫(yī)療的要求[2]。影像組學(radiomics)應(yīng)用高通量自動化數(shù)據(jù)特征化算法,將目標感興趣區(qū)(region of interest,ROI)的圖像信息轉(zhuǎn)化為可發(fā)掘的特征數(shù)據(jù),具有數(shù)據(jù)維度高、可定量分析等優(yōu)點,在腫瘤的術(shù)前分期、療效評估及預后預測方面具有一定臨床應(yīng)用價值。其中圖像采集與分割作為影像組學流程的第一步至關(guān)重要[3-5]。在腫瘤分割方法研究中,對直腸癌勾畫方法的探討較少。目前主流采用手動勾畫ROI作為常規(guī)分割方法,但主觀性強,穩(wěn)定性及可重復性稍差[6-7]。尤其是直腸癌如果突破固有肌層侵及周圍脂肪后病灶邊界模糊欠清,常對ROI的準確勾畫產(chǎn)生影響。本研究通過對2種手動勾畫方式進行比較,探討不同勾畫方法對直腸癌影像組學分析結(jié)果穩(wěn)定性的影響,以及對于評估直腸癌術(shù)前T分期的應(yīng)用價值。
回顧性分析2017年1月至2018年12月在海軍軍醫(yī)大學第一附屬醫(yī)院行術(shù)前直腸高分辨率T2加權(quán)成像(WI)檢查且經(jīng)手術(shù)病理證實的直腸癌患者(共317例)的臨床資料,其中2017年1月至2017年12月的152例納入訓練集,2018年1月至2018年12月的165例納入測試集。獲取原始DICOM數(shù)據(jù)并詳細記錄術(shù)后病理報告結(jié)果。排除標準:①圖像質(zhì)量差,如存在明顯偽影導致病灶無法準確勾畫ROI;②患者術(shù)前接受過任何化療或盆腔放療;③盆腔既往其他腫瘤或手術(shù)史。根據(jù)美國癌癥聯(lián)合委員會(American Joint Committee on Cancer,AJCC)第8版的分類標準進行病理診斷,記錄患者術(shù)后病理T分期,將T1-2期歸為未突破肌層組,T3-4期歸為突破肌層組。
掃描采用Siemens MAGNETOM Skyra 3.0 T磁共振儀。所有患者檢查前4 h禁食,使用1支開塞露(20 ml甘油)清潔腸道。采用腹部相控陣線圈。常規(guī)直腸MRI掃描序列,包括矢狀面T2WI脂肪抑制序列、橫斷面T1WI及增強掃描、彌散加權(quán)成像(DWI)。高分辨T2WI為斜橫斷面,掃描平面垂直于病灶所在腸管的長軸。掃描參數(shù):重復時間(TR)4 000 ms,回波時間(TE)108 ms,視野(FOV)18 cm×18 cm,矩陣320×320,層厚3 mm,層間距0,層數(shù)28,反轉(zhuǎn)角度150°,帶寬108 Hz/像素。無脂肪抑制,GRAPPA并行采集模式,加速因子為3,平均累加次數(shù)為2,回波鏈長度為16,掃描時長為250 s。
將獲取的原始DICOM圖像導入后處理平臺(大數(shù)據(jù)智能分析云平臺;慧影醫(yī)療科技有限公司,北京)。在高分辨T2WI圖像上采用2種方法手動逐層勾畫病灶ROI,計算機自動生成感興趣容積(volume of interest,VOI)。方法1(Model 1):最小輪廓法,沿病灶邊緣最明確的實性邊界勾畫,不含邊緣的模糊區(qū)域;方法2(Model 2):最大輪廓法,沿病灶的最大范圍勾畫,包括腸壁外圍的模糊軟組織影,如圖1所示。訓練集及測試集各隨機提取20例進行特征的一致性檢驗,由2名有5年以上工作經(jīng)驗的放射科醫(yī)師分別采用2種方法勾畫VOI后提取影像組學特征,計算全部特征的組內(nèi)相關(guān)系數(shù)(intra-class correlation coefficient,ICC),比較2種勾畫方法間的差異。其余病例均由一人勾畫完成并提取影像組學特征。
圖1 2種勾畫方法示例
將獲取到的全部特征去除ICC小于0.8的特征類別后,采用最小絕對收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)算法進行降維,選擇對直腸癌術(shù)后T分期診斷有價值的特征。將降維所獲得的特征在訓練集中與術(shù)后T分期構(gòu)建多層感知機(multilayer perceptron,MLP)分類器模型,在測試集中進行模型驗證。分別在訓練集及測試集中繪制受試者操作特征(ROC)曲線,計算曲線下面積(AUC)、靈敏度、特異度、95%置信區(qū)間(CI)、準確度、陽性似然比、陰性似然比、陽性預測值、陰性預測值。采用DeLong檢驗比較組間差異。
采用SPSS 19.0及MedCalc 15.2.2軟件進行數(shù)據(jù)處理。呈正態(tài)分布的定量資料以xˉ±s表示,2組間比較采用獨立樣本t檢驗;計數(shù)資料以例數(shù)和百分數(shù)表示,2組間比較采用χ2檢驗。服從偏態(tài)分布的定量資料以M(P25,P75)表示,Wilcoxon檢驗比較2組間差異。P<0.05為差異有統(tǒng)計學意義。
最終共納入317例患者,訓練集152例,測試集165例。訓練集及測試集一般資料比較結(jié)果(表1)顯示,2組間各臨床病理特征的差異均無統(tǒng)計學意義(P>0.05)。
表1 訓練集與測試集直腸癌患者一般資料比較
續(xù)表
2種方法所勾畫的VOI體積的M(P25,P75)分別為5.981(2.490,13.907)cm3和11.617(5.594,31.117)cm3,差異有統(tǒng)計學意義 (Z=3.29,P=0.001)。2種方法各提取到1 409組影像組學特征,包含以下兩類。(1)基于特征類:①一階統(tǒng)計量特征;②形狀特征;③紋理特征,包括灰度級共生矩陣(GLCM)、灰度級長度矩陣(GLRLM)、灰度級形狀矩陣(GLSZM)和鄰域灰度差分矩陣(NGTDM)。(2)基于過濾器類:如小波變換、拉普拉斯轉(zhuǎn)換、對數(shù)、指數(shù)等方式處理后的高階特征。
2種方法的ICC分布見圖2。Model 1和Model 2的ICC范圍均為0.005~1.000,M(P25,P75)分別為0.994(0.972,0.998)和0.977(0.940,0.979),ICC<0.8的個數(shù)分別為121(8.59%)和136(9.65%),2種方法間差異有統(tǒng)計學意義(Wilcoxon檢驗,Z=18.574,P<0.001)。Model 1和Model 2經(jīng)降維得到與T分期相關(guān)的特征分別為16個和14個(圖3)。
圖2 2種勾畫方法的ICC分布
圖3 篩選出的T分期相關(guān)特征
針對Model 1和Model 2經(jīng)降維處理后的影像組學特征與病理T分期分別建立MLP分類器模型,訓練集及測試集的ROC曲線分析均表現(xiàn)出較好的診斷效能,測試集中Model 1和Model 2的AUC分別為0.838(95%CI 0.764~0.912)及0.928(95%CI 0.864~0.992),DeLong檢驗P=0.036。詳見表2、圖4。
圖4 2種勾畫方法的測試集ROC曲線
表2 MLP模型的ROC曲線分析
近年來我國直腸癌整體發(fā)病率趨于平穩(wěn),但死亡率仍在繼續(xù)增長[8]。術(shù)前準確評估腫瘤的浸潤深度,尤其是否突破直腸固有肌層,是影響治療方案選擇及預后評價的關(guān)鍵所在[1]。傳統(tǒng)MRI檢查僅在形態(tài)學上對腫瘤進行術(shù)前分期評估,有一定的主觀性,缺乏定量評估,無法滿足精準影像醫(yī)學的要求,尤其當病灶周圍存在纖維化及滲出改變,出現(xiàn)類似腸周線狀/索條狀信號表現(xiàn)時,往往難以與腫瘤腸壁外浸潤相鑒別,導致T2期和早期T3的分期錯誤較為常見[2]。
影像組學(radiomics)作為新興非侵入性方法對腫瘤的整體評估具有巨大潛能[3]。它通過高通量地抽取影像中的量化特征,將其轉(zhuǎn)化為可挖掘的數(shù)據(jù),最終將這些數(shù)據(jù)的分析結(jié)果用于臨床診斷的決策支持,具有客觀、可重復的特點,可實現(xiàn)對疾病的精準診斷及預后評估等[9]。其流程可簡單歸納為圖像采集與分割、特征提取并降維、建立模型等步驟,其中病灶的分割是流程第一步,是后續(xù)提取影像特征的前提[3-5]。
為了獲得準確的影像學特征,穩(wěn)定且精確的勾畫非常重要,臨床常采用手動勾畫ROI作為常規(guī)分割方法,但其主觀性強,穩(wěn)定性及可重復性差[6-7]。很多研究強調(diào)T2期/T3期的鑒別診斷,兩者在MRI上最重要的鑒別標準是病灶是否突破固有肌層,周圍系膜脂肪是否受到侵犯,文獻[1-2]認為有時很難區(qū)分真正的腫瘤浸潤與結(jié)締組織增生性反應(yīng),導致病灶邊界的欠清晰對ROI的勾畫產(chǎn)生影響。大多數(shù)研究關(guān)注了觀察者間主觀差異對ROI手動勾畫差異的影響,但事實上病灶分割的方法性差異及量化評估在開展標準化研究中可能更為重要[6]。
Kocal等[10]確定了邊緣收縮2 mm的分割方法對基于CT的放射組學分析腎透明細胞癌的影響。Zhang等[6]對鼻咽癌及乳腺癌開展影像組學研究,證實不同疾病對ROI勾畫范圍的不同具有不同的敏感性,同時也影響了影像組學模型的診斷效能。然而在腫瘤分割中對直腸癌勾畫方法的探討較少,本研究對最小輪廓法(Model 1)及最大輪廓法(Model 2)2種手動勾畫方法進行比較,探討不同的勾畫方法對直腸癌影像組學分析結(jié)果的穩(wěn)定性和診斷效能的影響。
本研究采用2種方法在同一組病例上勾畫ROI,分別對提取的全部組學特征進行ICC分析,Model 1中ICC小于0.8的個數(shù)為121(8.59%),少于Model 2的個數(shù)為136(9.65%),Model 1的ICC中位數(shù)為0.994,大于Model 2的ICC中位數(shù)(0.977),差異有統(tǒng)計學意義(P<0.001),表明Model 1在提取影像組學特征時相對Model 2一致性更好。Model 1是沿病灶邊緣最明確的實性部分邊界勾畫,不含邊緣的模糊區(qū)域,具有較高的可重復性。該研究結(jié)果與目前大多數(shù)學者在影像組學研究所采用圖像分割原則相一致,都是盡可能地勾畫病灶最實性的部分,從而保證數(shù)據(jù)的穩(wěn)定性及可重復性[11-13]。本研究中Model 1按病灶的銳利邊界勾畫腫瘤組織,從而盡可能使提取的特征完全來自腫瘤組織的影像學信號,排除了因腫瘤刺激造成周圍炎性反應(yīng)及纖維化造成的不確定性影響,因此在穩(wěn)定性及可重復性的表現(xiàn)方面優(yōu)于Model 2。
MLP的機器學習算法能夠處理非線性可分離問題,應(yīng)用范圍廣,擴展性強,可用于圖像識別、機器翻譯等多個領(lǐng)域[14]。我們前期研究[15]表明基于MRI的MLP模型在直腸癌T分期的判斷中具有良好的診斷效能,故本次研究直接采用MLP模型,分別繪制ROC曲線。結(jié)果顯示測試集Model 2機器學習模型的AUC為0.928,高于Model 1的0.838,體現(xiàn)了Model 2的良好診斷效能,表明在判斷直腸癌浸潤是否突破肌層方面最大輪廓法建立的機器學習模型較最小輪廓畫法更具優(yōu)勢。有學者[6]在原始分割區(qū)域的基礎(chǔ)上,對VOI進行縮小、擴大和平滑,從而研究新產(chǎn)生的不同VOI對組學模型預測性能的影響。與該研究勾畫范圍擴大方式不同,我們的最大輪廓法是沿病變存在的最大范圍勾畫,而不是簡單按比例擴大,雖然也可能包含一些病灶周圍的非腫瘤區(qū)域,但更多的是按病灶周圍實際存在的組織信號來勾畫。同時與最小輪廓法不同,最大輪廓法盡可能多地包含病灶周圍可能存在的腸壁外腫瘤浸潤、神經(jīng)及脈管侵犯,最大程度體現(xiàn)了腫瘤組織的異質(zhì)性,因此可發(fā)揮良好的診斷效能。
本研究還存在以下局限性:①屬于單中心回顧性研究,可能存在選擇偏倚,未來有必要進行外部驗證以提高模型泛化性;②采用手動勾畫ROI,耗時久且工作量大,易受病灶形態(tài)影響,這可能導致提取影像組學特征的穩(wěn)定性欠佳,不適用于大規(guī)模的數(shù)據(jù)處理[16],所以基于深度學習的ROI半自動/自動分割方法將是我們未來進一步研究的主要方向;③僅基于磁共振T2WI高分辨率圖像,未加入彌散加權(quán)、動態(tài)增強等其他序列構(gòu)建多模態(tài)影像組學模型。
綜上,在基于高分辨T2WI的影像組學模型中,直腸癌病灶的2種不同勾畫方法對直腸癌術(shù)前T分期均具有良好診斷價值,其中最小輪廓法提取影像組學特征的穩(wěn)定性較好,而最大輪廓法的診斷效能更佳。