李武超,陳 琦,蔣 儀,王榮品*
(1.貴州省人民醫(yī)院放射科,3.信息科,貴州 貴陽 550002;2.貴州省智能醫(yī)學(xué)影像分析與精準(zhǔn)診斷重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽 550002)
胃癌是胃黏膜上皮細(xì)胞起源的惡性腫瘤,在我國男性胃癌發(fā)病率僅次于肺癌,居惡性腫瘤的第2位,女性發(fā)病率居第4位[1]。手術(shù)切除是胃癌主要的治療方式,但術(shù)后5年生存率僅約30%[2]。淋巴血管侵犯是指腫瘤周圍間質(zhì)淋巴管及動靜脈存在腫瘤細(xì)胞浸潤,是胃癌轉(zhuǎn)移、復(fù)發(fā)及預(yù)后較差的獨(dú)立預(yù)測因子[3-4],因此術(shù)前準(zhǔn)確評估及判斷淋巴血管侵犯對于個(gè)性化診療具有重要價(jià)值,但目前CT、MRI、胃鏡超聲等常規(guī)影像學(xué)檢查技術(shù)尚不能實(shí)現(xiàn)術(shù)前診斷。影像組學(xué)基于醫(yī)學(xué)成像高通量提取海量數(shù)據(jù)信息,可將醫(yī)學(xué)影像圖像轉(zhuǎn)化成為可挖掘的特征數(shù)據(jù),進(jìn)而實(shí)現(xiàn)客觀、定量分析疾病的生物學(xué)特征[5]。本研究探討CT影像組學(xué)對術(shù)前預(yù)測胃癌淋巴血管侵犯的價(jià)值。
1.1 一般資料 收集2012年9月—2015年10月我院收治并經(jīng)手術(shù)病理證實(shí)的181例胃癌患者,男123例,女58例,年齡22~85歲,平均(58.7±11.7)歲。納入標(biāo)準(zhǔn):①接受根治性胃癌切除術(shù);②病理確診為胃癌;③術(shù)后病理可確定有無淋巴血管侵犯;④術(shù)前20天內(nèi)接受腹部增強(qiáng)CT檢查。排除標(biāo)準(zhǔn):①術(shù)前接受治療(放射治療、化學(xué)治療或放化療);②無完整CT圖像,或圖像質(zhì)量較差無法評估;③臨床病理信息不完整。根據(jù)術(shù)后病理結(jié)果,181例中,96例存在淋巴血管侵犯,85例無淋巴血管侵犯。
1.2 儀器與方法 采用Siemens Somatom Definition Flash雙源CT掃描儀,CARE kV管電壓及CARE Dose4D管電流最優(yōu)自動調(diào)節(jié)技術(shù),參考管電壓為120 kV,參考管電流為180 mAs;FOV 350 mm×350 mm,矩陣512×512,準(zhǔn)直器寬64×0.6 mm,螺距1.0,旋轉(zhuǎn)時(shí)間0.5 s,重建層厚5 mm。對比劑采用優(yōu)維顯(370 mgI/ml),以高壓注射器經(jīng)肘靜脈注射,劑量1.5 ml/kg體質(zhì)量,流率3.5 ml/s,隨后以相同流率注射20 ml生理鹽水。于注射對比劑后25~30 s和60 s分別行動脈期和靜脈期掃描。
1.3 圖像分割 基于CT靜脈期圖像勾畫ROI。以DICOM格式導(dǎo)出圖像,由2名具有10年以上腹部影像學(xué)診斷經(jīng)驗(yàn)的放射科醫(yī)師A和B協(xié)同選擇腫瘤最大層面并確定輪廓,如不能達(dá)成一致,則由另1名有22年腹部診斷經(jīng)驗(yàn)的放射科醫(yī)師C進(jìn)行判斷。最終由醫(yī)師A基于ITK-SNAP(www.itk-snap.org)軟件于腫瘤最大層面沿腫瘤輪廓手動勾畫ROI,見圖1。
1.4 組內(nèi)及組間影像組學(xué)特征可重復(fù)性評估 隨機(jī)選擇30例CT圖像,由醫(yī)師A間隔2周各勾畫1次ROI,醫(yī)師B勾畫1次ROI,分別提取影像組學(xué)特征,采用組內(nèi)相關(guān)系數(shù)(interclass correlation coefficient, ICC)評價(jià)影像組學(xué)提取特征的一致性。ICC>0.75為一致性較好。
1.5 特征選擇和組學(xué)標(biāo)簽建立 按2∶1比例將181例隨機(jī)分為訓(xùn)練集和驗(yàn)證集,進(jìn)行模型訓(xùn)練及驗(yàn)證。采用開源的PyRadiomics(https://pyradiomics.readthedocs.io/en/latest/index.html)平臺對訓(xùn)練集每個(gè)ROI進(jìn)行特征提取,包括一階特征、形狀特征、灰度共生矩陣特征、灰度游程矩陣特征、灰度區(qū)域大小矩陣特征、相鄰灰度差矩陣特征和灰度依賴矩陣特征。濾掉低方差和高共線性的特征之后,采用最大相關(guān)最小冗余算法進(jìn)一步篩選,并以t檢驗(yàn)得到對淋巴血管侵犯最有預(yù)測價(jià)值的影像組學(xué)特征。根據(jù)不同特征的回歸系數(shù),最終通過線性組合構(gòu)建影像組學(xué)標(biāo)簽。
1.6 預(yù)測模型評估 采用ROC曲線和校準(zhǔn)曲線檢驗(yàn)?zāi)P偷念A(yù)測效能及擬合度,以評估該模型對于淋巴血管侵犯的預(yù)測效果。對校準(zhǔn)曲線使用1 000次自舉重采樣進(jìn)行修正,然后使用Hosmer-Lemeshow檢驗(yàn)進(jìn)行評價(jià),P>0.05為該模型與理想模型的擬合程度高。在訓(xùn)練集和驗(yàn)證集中分別進(jìn)行影像組學(xué)模型預(yù)測效能評估,并基于訓(xùn)練集的最優(yōu)閾值計(jì)算模型的準(zhǔn)確率、敏感度和特異度。
1.7 統(tǒng)計(jì)學(xué)分析 采用R軟件3.4.3版(http://www.r-project.org)進(jìn)行統(tǒng)計(jì)分析。以兩獨(dú)立樣本t檢驗(yàn)比較訓(xùn)練集與驗(yàn)證集患者年齡的差異,以χ2檢驗(yàn)比較患者間性別、TNM分期和淋巴血管侵犯的差異。使用R軟件中的“caret”包過濾低方差和高共線性特征,以“mRMRe”包用來實(shí)現(xiàn)最大相關(guān)最小冗余算法,“pROC”包繪制ROC曲線,“rms”包繪制校準(zhǔn)曲線。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
訓(xùn)練集120例,男80例,女40例,年齡31~84歲,平均(58.8±12.0)歲;其中淋巴血管侵犯陽性62例(62/120,51.67%),陰性58例(58/120,48.33%);TNM分期Ⅰ期4例,Ⅱ期37例,Ⅲ期79例。驗(yàn)證集61例,男43例,女18例,年齡30~85歲,平均(58.3±11.3)歲;其中淋巴血管侵犯陽性34例(34/61,55.74%),陰性27例(27/61,44.26%);TNM分期Ⅰ期4例,Ⅱ期12例,Ⅲ期45例。訓(xùn)練集與驗(yàn)證集患者性別(χ2=0.272,P=0.602)、年齡(t=0.255,P=0.799)、TNM分期(χ2=3.184,P=0.204)及淋巴血管侵犯占比(χ2=0.269,P=0.604)差異均無統(tǒng)計(jì)學(xué)意義。
2.1 影像組學(xué)特征提取可重復(fù)性評估 基于醫(yī)師A兩次勾畫ROI提取的影像組學(xué)特征具有較好的組內(nèi)一致性,ICC為0.812~0.977;基于醫(yī)師A和醫(yī)師B勾畫ROI提取的影像組學(xué)特征也具有較好的組間一致性,ICC為0.761~0.969。
2.2 影像組學(xué)標(biāo)簽構(gòu)建 基于每例胃癌患者CT靜脈期ROI共提取1 479個(gè)特征,以R軟件濾掉低方差和高共線性特征后,特征縮減到120個(gè),再以最大相關(guān)最小冗余算法篩選出15個(gè)特征,并以t檢驗(yàn)進(jìn)一步篩選,繼而獲得7個(gè)對胃癌淋巴管血管侵犯最有預(yù)測價(jià)值的影像組學(xué)特征,包括2個(gè)一階特征(square_firstorder_InterquartileRange和original_firstorder_InterquartileRange)、1個(gè)形狀特征(original_shape_Elongation)、2個(gè)灰度共生矩陣特征(square_glcm_Imc1和wavelet.HHH_glcm_MaximumProbability)和2個(gè)灰度區(qū)域大小矩陣特征(wavelet.LHH_glszm_SmallAreaEmphasis和original_glszm_SmallAreaEmphasis)。最后,基于每個(gè)特征對應(yīng)的回歸系數(shù),線性組合構(gòu)建影像組學(xué)標(biāo)簽,構(gòu)建公式為:yi=?ixi+β,其中?i表示特征值,xi表示回歸系數(shù),β表示截距。
2.3 模型預(yù)測胃癌淋巴管血管侵犯的效能 在訓(xùn)練集中,影像組學(xué)標(biāo)簽預(yù)測胃癌淋巴管血管侵犯的ROC曲線AUC為0.742[P=0.001,95%CI(0.652,0.831)],驗(yàn)證集的AUC為0.727[P=0.002,95%CI(0.593,0.853)],見圖2?;谟?xùn)練集所得最優(yōu)閾值為0.422,模型在訓(xùn)練集中的準(zhǔn)確率、敏感度和特異度為0.708、0.586、0.806;將此閾值用于驗(yàn)證集,其準(zhǔn)確率、敏感度和特異度分別為0.689、0.519和0.824。采用校準(zhǔn)曲線評估該模型的擬合度,均顯示較好的擬合度(訓(xùn)練集P=0.370,驗(yàn)證集P=0.604),見圖3。
影像組學(xué)最早由荷蘭Philippe Lambin教授[6]于2012年提出,是一種新興的影像分析方法,其目的是利用大數(shù)據(jù)分析技術(shù),從影像數(shù)據(jù)中挖掘可量化病變的海量特征,并構(gòu)建特征性影像組學(xué)標(biāo)簽,以期解析影像與基因、病理、臨床的潛在關(guān)聯(lián)[6-7]。CT是影像學(xué)檢查胃癌最重要的方法之一,針對基于CT的影像組學(xué)在胃癌分級分期、預(yù)測預(yù)后及評估療效等方面已進(jìn)行了初步研究[8-11],但既往研究主要基于各中心內(nèi)部開發(fā)的軟件,缺乏標(biāo)準(zhǔn)化的圖像處理流程及統(tǒng)一的特征定義,無法實(shí)現(xiàn)不同數(shù)據(jù)集之間的共享和對比。針對以上不足,本研究采用開源的PyRadiomics平臺進(jìn)行圖像處理及特征提取,以期為模型的推廣和臨床應(yīng)用奠定良好基礎(chǔ)[12]。
淋巴管血管侵犯是胃癌患者預(yù)后不良的重要因素,術(shù)前準(zhǔn)確評估有助于實(shí)現(xiàn)個(gè)性化診療。有學(xué)者[4]基于CT對術(shù)前淋巴結(jié)血管侵犯進(jìn)行了探索性研究。Yin等[13]提出增強(qiáng)CT動脈期、動脈-門靜脈期對比增強(qiáng)率與血管侵犯相關(guān),而靜脈期對比增強(qiáng)率與淋巴管侵犯有關(guān);此外,Komori等[14]研究發(fā)現(xiàn),動脈期胃癌病變與正常胃壁強(qiáng)化比與淋巴血管侵犯具有相關(guān)性。雖然上述研究表明胃癌CT征象有望提示淋巴血管侵犯,但由于納入病例較少,且僅為相關(guān)性分析,未能實(shí)現(xiàn)有效預(yù)測淋巴血管侵犯。Ma等[15]基于282例胃癌患者進(jìn)一步探討CT征象對淋巴血管侵犯的預(yù)測能力,結(jié)果顯示門靜脈期CT值具有最好預(yù)測價(jià)值,但該研究未對模型進(jìn)行驗(yàn)證,同時(shí)人為測量可能會存在選擇偏倚。針對以上不足,本研究以病變最大層面作為ROI,提高勾畫的魯棒性,同時(shí)進(jìn)行了組內(nèi)及組間提取特征的一致性檢驗(yàn),以保證提取特征的可重復(fù)性;并將患者分為訓(xùn)練集和驗(yàn)證集,分別對模型進(jìn)行構(gòu)建、驗(yàn)證和優(yōu)化,以提高模型在臨床應(yīng)用中的泛化能力和魯棒性。
圖1 基于腫瘤最大層面沿腫瘤輪廓手動勾畫ROI示意圖 圖2 影像組學(xué)標(biāo)簽預(yù)測胃癌淋巴血管侵犯的ROC曲線 圖3 影像組學(xué)標(biāo)簽的校準(zhǔn)曲線 A.訓(xùn)練集; B.驗(yàn)證集
基于本研究的影像組學(xué)模型,訓(xùn)練集和驗(yàn)證集均表現(xiàn)出良好準(zhǔn)確率,同時(shí)校準(zhǔn)曲線一致性佳,通過最優(yōu)閾值,該模型預(yù)測胃癌淋巴管血管侵犯的特異度明顯高于既往研究[16],但敏感度較低。筆者認(rèn)為較高的特異度有利于術(shù)前評估,特別是新輔助化療主要用于改善中、高危胃癌患者的生存及預(yù)后,因此準(zhǔn)確的預(yù)后評估尤為重要;而較高的特異度可保證納入患者淋巴血管侵犯的真陽性率,提高個(gè)體化藥物療效,同時(shí)有效規(guī)避假陽性導(dǎo)致的納入低危患者,避免過度治療損害。然而完美的預(yù)測模型應(yīng)同時(shí)具有較高的敏感度和特異度,后續(xù)研究中將擴(kuò)大樣本量,以進(jìn)一步提高模型的預(yù)測效能。
本研究存在一定的局限性。首先,本研究為單中心單機(jī)型回顧性分析,有待大樣本、多中心、多機(jī)型前瞻性研究進(jìn)一步驗(yàn)證模型的有效性;此外,本研究基于5 mm的重建層厚,在腫瘤最大層面進(jìn)行ROI勾畫及特征提取,但二維圖像對腫瘤生物學(xué)特性的表征尚有不足,可能影響模型的預(yù)測能力。
總之,本研究基于CT影像組學(xué)實(shí)現(xiàn)了術(shù)前無創(chuàng)個(gè)體化預(yù)測胃癌淋巴血管侵犯,可為評估預(yù)后風(fēng)險(xiǎn)、制定個(gè)體化診療方案提供有力、客觀的影像學(xué)依據(jù)。