鮑遠(yuǎn)照,葛亞瓊,程琦,劉欣,嚴(yán)立,韋煒
腎嫌色細(xì)胞癌(chromophobe renal cell carcinoma,CRCC)和腎嗜酸細(xì)胞腺瘤(renal oncocytoma,RO)是腎臟少見的局限性腫瘤,CRCC約占所有腎腫瘤的6%~8%,RO約占所有腎臟病變的3%~7%[1-2]。雖然CRCC為惡性腫瘤,RO為良性腫瘤,但兩者在形態(tài)學(xué)、組織學(xué)、電鏡和免疫組化特征上存在許多共性,在影像特征上也存在較多重疊[3-4]。腫瘤的臨床治療及預(yù)后評(píng)估往往與其分型密切相關(guān),具有侵襲性的類型可能會(huì)選擇消融或手術(shù)切除,而表現(xiàn)為惰性的類型則可能會(huì)選擇隨訪觀察[5-6]。因此,術(shù)前準(zhǔn)確鑒別CRCC與RO具有重要意義。影像組學(xué)是一種通過提取、分析和解釋定量成像參數(shù),反映腫瘤異質(zhì)性,為腫瘤分型分級(jí)、基因定位、早期治療及預(yù)后評(píng)估提供有用信息的新工具[7]。本研究旨在探討基于增強(qiáng)CT影像組學(xué)在鑒別CRCC與RO中的應(yīng)用價(jià)值。
1.病例資料
回顧性搜集2013年3月-2020年1月間我院經(jīng)病理證實(shí)的CRCC和RO患者。病例納入標(biāo)準(zhǔn):①嚴(yán)格按照固定掃描包獲得完整CT三期增強(qiáng)圖像;②此前未接受介入治療。病例排除標(biāo)準(zhǔn):①圖像存在顯著噪聲或其他質(zhì)量問題;②病理診斷不明確或單個(gè)病灶同時(shí)含有多種腫瘤成分。
2.圖像采集
CT檢查采用GE Discovery CT 750或GE Optima CT 680。掃描參數(shù):管電壓120 kV,管電流200~300 mA,層厚5 mm,層間距5 mm,掃描范圍為肺基底到髂嵴。CT增強(qiáng)掃描采用非離子型碘對(duì)比劑碘海醇(320 mg I/mL),劑量60~80 mL,高壓注射,依次于皮髓期(延遲30 s)、實(shí)質(zhì)期(延遲70 s)和排泄期(延遲180~300 s)進(jìn)行圖像采集。由于平掃圖像上難以區(qū)分病灶與周圍正常腎組織,故本研究只選取了對(duì)比增強(qiáng)三期圖像。
3.數(shù)據(jù)擴(kuò)增
數(shù)據(jù)擴(kuò)增被證明是避免數(shù)據(jù)量小時(shí)過擬合的有效方法,已經(jīng)成功應(yīng)用于多種不同的基于機(jī)器學(xué)習(xí)分類任務(wù)中[8-12]。如Hodgdon等[11]通過獲取病灶正中央及正中至上下兩極中間的軸面圖像,將每個(gè)腎臟病變擴(kuò)增至三張精選的軸向圖像,基于這些圖像的紋理特征建立支持向量機(jī)模型鑒別乏脂性血管平滑肌脂肪瘤與腎細(xì)胞癌,并獲得了較為理想的結(jié)果。考慮到本研究的病例數(shù)較少可能會(huì)導(dǎo)致潛在的過擬合,本研究采用了類似的方法,通過獲取每期病灶最大層面的軸面圖像及其單側(cè)(CRCC)或雙側(cè)(RO)較大層面的軸面圖像(依據(jù)病灶大小,間隔1~3個(gè)層間距),擴(kuò)大研究的樣本數(shù)據(jù),盡量保證兩種類型腎腫瘤樣本量的一致性。數(shù)據(jù)擴(kuò)增后的結(jié)果是從35個(gè)CRCC病灶中獲得70副軸面圖像,從23個(gè)RO病灶中獲取69副軸面圖像。
4.圖像分割和特征提取
由兩位分別有5年及10年以上工作經(jīng)驗(yàn)的放射科醫(yī)師在不知病理結(jié)果的情況下協(xié)商后共同選出病灶邊界最清晰的時(shí)相,并在此期相中選取病灶樣本圖像,沿輪廓勾畫ROI,然后將ROI復(fù)制粘貼于其他時(shí)相,適當(dāng)調(diào)整ROI的位置、大小及形狀,盡可能使ROI的選取在不同時(shí)相中保持一致。導(dǎo)入的樣本圖像格式為DICOM,導(dǎo)出的ROI格式為NII。為降低圖像窗寬、窗位不同造成視覺上的誤差,在ROI勾畫之前對(duì)圖像窗寬窗位進(jìn)行歸一化處理(設(shè)置窗寬280 HU,窗位40 HU)。將皮髓期、實(shí)質(zhì)期、排泄期的病灶樣本圖像及勾畫的相應(yīng)ROI圖像分別導(dǎo)入A.K(Analyze kit,GE healthcare,Shanghai)軟件進(jìn)行特征提取。為降低不同設(shè)備對(duì)影像組學(xué)特征穩(wěn)定性的影響,在特征提取之前對(duì)圖像進(jìn)行了預(yù)處理,即對(duì)每個(gè)樣本圖像進(jìn)行z-score轉(zhuǎn)化,將圖像強(qiáng)度轉(zhuǎn)化到標(biāo)準(zhǔn)正態(tài)分布之內(nèi)(均值為0,標(biāo)準(zhǔn)差為1)。每期提取的特征以7:3的比例分割為訓(xùn)練集與驗(yàn)證集,特征篩選與模型構(gòu)建采用訓(xùn)練集的數(shù)據(jù),驗(yàn)證集數(shù)據(jù)用于驗(yàn)證模型的泛化性。
5.特征篩選與模型建立
首先使用最大相關(guān)最小冗余(Maximal relevance and minimal redundancy,mRMR)算法去除冗余和無關(guān)的特征,保留20個(gè)特征;然后使用LASSO十折交叉驗(yàn)證進(jìn)一步篩選特征,建立影像組學(xué)標(biāo)簽,計(jì)算每一例患者的組學(xué)評(píng)分Radscore,并分別對(duì)訓(xùn)練組和試驗(yàn)組CRCC和RO的Radscore進(jìn)行比較。
6.統(tǒng)計(jì)學(xué)分析
采用R軟件(Version:3.5.1)對(duì)影像組學(xué)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析。采用受試者工作特征(receiver operating characteristic,ROC)曲線評(píng)價(jià)Radscore的分類性能,并根據(jù)約登指數(shù)計(jì)算敏感度、特異度和模型準(zhǔn)確率、陰性預(yù)測(cè)值、陽性預(yù)測(cè)值。采用Delong檢驗(yàn)比較各模型間的診斷效能。
采用SPSS 24.0軟件對(duì)CRCC與RO患者的臨床特征及各病灶的影像學(xué)特征進(jìn)行分析。計(jì)量資料的組間比較采用獨(dú)立樣本t檢驗(yàn),計(jì)數(shù)資料的組間比較采用成組設(shè)計(jì)χ2檢驗(yàn)。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
1.CRCC與RO的臨床及影像學(xué)特征
35例CRCC與21例RO患者的臨床特征比較中,兩組患者性別差異無統(tǒng)計(jì)學(xué)意義(P>0.05),平均發(fā)病年齡差異有統(tǒng)計(jì)學(xué)意義(P=0.032)。35個(gè)CRCC病灶與23個(gè)RO病灶的影像學(xué)特征比較中,長徑、鈣化、假包膜、中央瘢痕、節(jié)段性增強(qiáng)反轉(zhuǎn)及平掃均勻度情況差異均無統(tǒng)計(jì)學(xué)意義(P>0.05,表1);在強(qiáng)化方式上兩組均主要表現(xiàn)為皮髓期及實(shí)質(zhì)期持續(xù)強(qiáng)化,延遲期減退。
2.特征篩選結(jié)果
每期每個(gè)軸面圖像提取出396個(gè)特征,包括直方圖特征、灰度聯(lián)通區(qū)域矩陣特征、灰度共生矩陣特征、Haralick特征、游程矩陣特征、形態(tài)學(xué)特征等6大類,共計(jì)396個(gè)特征。使用mRMR去除冗余和無關(guān)的特征后剩余20個(gè)特征;然后使用LASSO和十折交叉驗(yàn)證進(jìn)一步篩選特征,保留最優(yōu)特征子集。結(jié)果顯示,皮髓質(zhì)期的最佳特征有6個(gè),其中來自直方圖特征中的Kurtosis表現(xiàn)出較好的預(yù)測(cè)價(jià)值;實(shí)質(zhì)期的最優(yōu)特征有13個(gè),其中來自區(qū)域大小矩陣中的Intensity Variability及灰度共生矩陣中的Inverse Difference Moment_AllDirection_offset4_SD表現(xiàn)出較好的預(yù)測(cè)價(jià)值;排泄期的最優(yōu)特征有7個(gè),其中來自灰度共生矩陣中的GLCMEntropy_angle45_offset7表現(xiàn)出較好的預(yù)測(cè)價(jià)值;而三期整合組篩選出的最優(yōu)特征子集同樣有7個(gè),其中來自排泄期灰度游程矩陣中的ShortRunEmphasis_angle0_offset4表現(xiàn)出了較好的預(yù)測(cè)價(jià)值。皮髓質(zhì)期組、實(shí)質(zhì)期組、排泄期組和三期整合組經(jīng)mRMR 和LASSO篩選出特征及相應(yīng)評(píng)估系數(shù)(圖1),特征越重要,其相對(duì)評(píng)估系數(shù)的絕對(duì)值也越大。
3.模型的診斷效能
皮髓質(zhì)期模型、實(shí)質(zhì)期模型、排泄期模型及整合模型在鑒別CRCC與RO時(shí)均表現(xiàn)出較好的預(yù)測(cè)能力(表2、圖2)。Delong結(jié)果顯示各模型間的AUC差異無統(tǒng)計(jì)學(xué)意義(P>0.05),表明幾個(gè)模型的性能相當(dāng)。
采用決策曲線分析(Decision curve,DCA)評(píng)價(jià)模型的臨床實(shí)用性,得出在0.2~1.0閾值范圍內(nèi)皮髓質(zhì)期模型、實(shí)質(zhì)期模型、排泄期模型及整合模型均表現(xiàn)出較高的凈效益,說明各模型在鑒別CRCC與RO上均具有較高的臨床應(yīng)用價(jià)值。
目前,組織病理學(xué)是腫瘤良惡性鑒別診斷的金標(biāo)準(zhǔn)。在形態(tài)學(xué)及組織學(xué)上,CRCC的嗜酸亞型與RO常因重疊而造成診斷上的困難,前者因?yàn)槊黠@的嗜酸性顆粒狀胞質(zhì)、不明顯的核周空暈以及不明顯的植物性胞膜而容易誤診為RO,而后者出現(xiàn)細(xì)胞核異型性或有侵襲性表現(xiàn)時(shí)往往被誤診為CRCC;在免疫組織化學(xué)上,雖然相關(guān)文獻(xiàn)報(bào)道一系列標(biāo)記物嘗試鑒別這兩種病變,但是還沒有哪一種標(biāo)記物能夠準(zhǔn)確鑒別[13]。影像學(xué)方法雖然不能對(duì)其進(jìn)行最終的定性診斷,但在一定程度上可以反映腫瘤的異質(zhì)性,為兩者之間的鑒別診斷提供有用信息。
圖1 經(jīng)mRMR和LASSO篩選后的皮髓期組、實(shí)質(zhì)期組、排泄期組和三期整合組的最優(yōu)特征及相應(yīng)評(píng)估系數(shù),Y軸代表特征名稱,X軸代表特征的相應(yīng)系數(shù)。a)皮髓質(zhì)期組;b)實(shí)質(zhì)期組;c)排泄期組;d)三期整合組。
圖2 皮髓質(zhì)期模型、實(shí)質(zhì)期模型、排泄期模型及整合模型鑒別CRCC與RO的ROC曲線。淺綠色曲線表示皮髓質(zhì)期,紅色曲線表示實(shí)質(zhì)期,藍(lán)色曲線表示排泄期,深綠色曲線表示整合期。a)訓(xùn)練組;b)驗(yàn)證組。圖3 皮髓質(zhì)期模型、實(shí)質(zhì)期模型、排泄期模型及整合組模型鑒別CRCC與RO的DCA曲線。橫坐標(biāo)為閾概率,縱坐標(biāo)為凈獲益率。紫色曲線表示所有樣本均為陽性,黑色水平線表示所有樣本均為陰性;黃色曲線、藍(lán)色曲線、綠色曲線及紅色曲線分別表示皮髓質(zhì)期組、實(shí)質(zhì)期組、排泄期組及三期整合組模型在0.2~1.0的閾值范圍內(nèi)具有較高的凈效益。
傳統(tǒng)CT圖像是通過對(duì)兩者影像學(xué)特征的視覺觀察來定性評(píng)估,如病灶大小、鈣化、假包膜、中央瘢痕、節(jié)段性增強(qiáng)反轉(zhuǎn)、平掃均勻度及強(qiáng)化方式等[14-16]。其中節(jié)段性增強(qiáng)反轉(zhuǎn)定義為病灶某些節(jié)段強(qiáng)化方式的不同,皮髓質(zhì)期明顯強(qiáng)化的節(jié)段在排泄期強(qiáng)化不明顯,而皮髓質(zhì)期強(qiáng)化不明顯的節(jié)段在排泄期明顯強(qiáng)化[17]。強(qiáng)化方式中的流入型、平臺(tái)型、流出型是按照時(shí)間-密度曲線來區(qū)分的。流入型是指病灶皮髓質(zhì)期呈輕中度強(qiáng)化,實(shí)質(zhì)期進(jìn)一步強(qiáng)化,排泄期明顯強(qiáng)化;平臺(tái)型是指病灶在皮髓質(zhì)期、實(shí)質(zhì)期呈輕中度強(qiáng)化,排泄期仍持續(xù)強(qiáng)化;流出型是指病灶在皮髓質(zhì)期呈明顯強(qiáng)化,實(shí)質(zhì)期及排泄期強(qiáng)化明顯減退[18]。Rozenkrantz等[19]研究了這兩種類型腫瘤的影像學(xué)特征,認(rèn)為CRCC與RO具有相似的定性特征,本研究得出了相似的結(jié)論,兩者常規(guī)CT影像學(xué)特征間存在較多的重疊,可見傳統(tǒng)的CT檢查在鑒別CRCC與RO時(shí)存在困難。
影像組學(xué)主要是從腫瘤中定量提取與病理生理學(xué)相關(guān)的特征,以顯示腫瘤的異質(zhì)性,從而進(jìn)行預(yù)后評(píng)估[20-21]。目前,利用影像組學(xué)對(duì)CRCC與RO進(jìn)行鑒別診斷的研究還不多[22-24]。已有的這些研究不僅存在樣本量過小導(dǎo)致的過擬合問題,還存在發(fā)病率不同導(dǎo)致的數(shù)據(jù)不平衡問題。如Yu等[22]提取了腎透明細(xì)胞癌、腎乳頭狀細(xì)胞癌、CRCC、RO四種類型腎腫瘤的紋理特征,使用SVM分類器對(duì)腫瘤進(jìn)行分類,區(qū)分CRCC和RO的AUC為0.882。Li等[23]通過提取44例CRCC及17例RO的紋理特征,使用5種分類器對(duì)腫瘤進(jìn)行鑒別,使用支持向量機(jī)結(jié)果最好,得出的AUC為0.945 。Baghdadi等[24]利用192例腎占位圖像設(shè)計(jì)半自動(dòng)分割法及卷積神經(jīng)網(wǎng)絡(luò),并用20例CD117(+)的CRCC與RO進(jìn)行驗(yàn)證,得出的AUC為0.95。本研究嘗試應(yīng)用一種經(jīng)過驗(yàn)證的數(shù)據(jù)擴(kuò)增方法,將這些問題最小化;同時(shí)增加驗(yàn)證組對(duì)模型進(jìn)行驗(yàn)證,增加模型的可泛化性。結(jié)果表明,皮髓質(zhì)期、實(shí)質(zhì)期及排泄期模型在鑒別兩者時(shí)均表現(xiàn)出較好的預(yù)測(cè)價(jià)值;整合模型雖然也有著較好的預(yù)測(cè)價(jià)值,但整合模型單獨(dú)與三期模型相比較,預(yù)測(cè)性能差異無統(tǒng)計(jì)學(xué)意義,未增加模型的預(yù)測(cè)價(jià)值。
本研究存在以下局限性:①本研究為單中心回顧性研究,未來需要進(jìn)行前瞻性多中心研究對(duì)模型進(jìn)行驗(yàn)證;②本研究雖然對(duì)數(shù)據(jù)進(jìn)行了擴(kuò)增,但依舊是對(duì)較少病例的軸面圖像進(jìn)行重復(fù)培訓(xùn)和測(cè)試,未來需要對(duì)大樣本病灶進(jìn)行多層面三維容積測(cè)量;③本研究采用多臺(tái)CT掃描設(shè)備,一定程度上影響了影像組學(xué)特征的穩(wěn)定性;④本研究未對(duì)影像組學(xué)特征的可重復(fù)性進(jìn)行分析。
綜上所述,本研究結(jié)果初步表明基于增強(qiáng)CT影像組學(xué)鑒別診斷CRCC與RO具有相對(duì)較高的臨床應(yīng)用價(jià)值,值得進(jìn)一步探索改進(jìn),以期獲得更加成熟的鑒別診斷體系,從而提高腎占位性病變的診斷符合率。