吳潔菡 宋家偉 徐暢 王偉 楊成文 劉桂芝 劉寧波
局限期小細(xì)胞肺癌(limit-stage small cell lung cancer,LS-SCLC)細(xì)胞增殖快、易轉(zhuǎn)移,治療后易復(fù)發(fā)[1],患者預(yù)后差,5 年生存率低于25%[2]。同步放、化療是LS-SCLC 的標(biāo)準(zhǔn)治療手段,但小細(xì)胞肺癌(small cell lung cancer,SCLC)腫瘤細(xì)胞異質(zhì)性強(qiáng),部分患者表現(xiàn)為難治性SCLC,具有先天性或獲得性治療抵抗,目前尚缺乏可靠的療效預(yù)測手段。影像組學(xué)是從高通量醫(yī)學(xué)影像中提取某些特征并將其量化,利用機(jī)器學(xué)習(xí)等對(duì)特征進(jìn)行篩選分析的技術(shù)[3]?;谟跋窠M學(xué)對(duì)SCLC 患者的預(yù)后預(yù)測的研究尚鮮有研究報(bào)道。
本研究利用影像組學(xué)方法分析放療定位CT 影像,根據(jù)獲得的臨床隨訪結(jié)果,構(gòu)建LS-SCLC 總生存期(overall survival,OS)、無進(jìn)展生存期(progressionfree survival,PFS)的預(yù)后模型,為臨床中更準(zhǔn)確地判斷預(yù)后、優(yōu)化治療方案提供更多依據(jù)。
回顧性分析天津醫(yī)科大學(xué)腫瘤醫(yī)院2013 年9 月至2019 年12 月193 例接受胸部放療LS-SCLC 患者影像資料。納入標(biāo)準(zhǔn):1)病理證實(shí)為SCLC;2)增強(qiáng)CT 行放療前定位;3)CT 定位前未接受過放療;4)經(jīng)多種影像包括骨掃描、PET-CT、MRI、增強(qiáng)CT 等確認(rèn)為局限期。排除標(biāo)準(zhǔn):1)患者相關(guān)臨床資料不全;2)患者未接受30 次胸部放療。
1.2.1 圖像采集 采用GE Discovery CT590 RT 型大孔徑CT 對(duì)患者進(jìn)行增強(qiáng)掃描,患者經(jīng)體位固定后,采用碘對(duì)比劑80~100 mL,速率2.0~3.0 mL/s,由高壓注射器經(jīng)肘靜脈注入,掃描延遲時(shí)間50 s[4],掃描過程中要求患者屏氣。掃描上界為乳突上1 cm,下界至膈下1 cm。
1.2.2 圖像分析 193 例患者影像資料均采用Pinnacle(版本3.2.0.27)進(jìn)行分析,包括病灶位置、形態(tài)、邊界、密度等。感興趣區(qū)(region of interest,ROI)分別在縱隔窗(窗寬350 HU,窗位40 HU)、肺窗(窗寬1 000 HU,窗位-650 HU)勾畫,以腫瘤靶區(qū)(gross tumor volume,GTV)為ROI。借助3D Slicer(版本4.11.20210226)提取影像特征(圖1)。具體流程設(shè)計(jì)及參數(shù)見圖2。
圖1 影像特征提取示意圖
圖2 特征提取及模型構(gòu)建流程圖
1.2.3 隨訪 通過電話隨訪與病歷查詢相結(jié)合的方式,了解患者生存情況。隨訪時(shí)間3.97~75.63 個(gè)月,中位隨訪時(shí)間42.73 個(gè)月。隨訪截至2020 年9 月。
采用Python(版本3.8.8)進(jìn)行隨機(jī)分組、特征篩選及模型構(gòu)建,采用MedCalc(版本19.4.1)軟件計(jì)算受試者工作特征曲線(receiver operating characteristic curve,ROC)。按照7∶3 對(duì)符合條件患者進(jìn)行隨機(jī)分組,得到訓(xùn)練組和測試組并構(gòu)建預(yù)測模型。在每一標(biāo)準(zhǔn)中,臨床因素符合正態(tài)分布采用t檢驗(yàn),非正態(tài)分布采用非參數(shù)檢驗(yàn),篩選影像特征應(yīng)用t檢驗(yàn)及LASSO 回歸,并采用交叉驗(yàn)證法選定最優(yōu)的λ 值,選擇對(duì)應(yīng)的LASSO 回歸模型。輸出準(zhǔn)確率、曲線下面積(area under the receiver operating characteristic curve,AUC)、靈敏度和特異度評(píng)估模型效能。以P<0.05 為差異具有統(tǒng)計(jì)學(xué)意義。
共193 例患者納入研究,中位OS 為29.77 個(gè)月,中位PFS 為14.03 個(gè)月。男性150 例,年齡23~79歲,中位年齡59 歲;女性43 例,年齡40~81 歲,中位年齡60 歲。吸煙史:有141 例,無52 例;預(yù)防性腦照射:有77 例,無116 例;放療后腦轉(zhuǎn)移:有52 例,無141 例;誘導(dǎo)化療超2 周期:有119 例,無74 例;同步化療:有114 例,無79 例;鞏固化療:有111 例,無82 例;治療技術(shù):固定野調(diào)強(qiáng)放療139 例,容積調(diào)強(qiáng)放療54 例。見表1。
表1 患者基本特征
以是否死亡、是否進(jìn)展、OS≤1 年或OS≥5 年、OS≤1 年或OS≥3 年、PFS≤6 個(gè)月或PFS≥24 個(gè)月、PFS≤12 個(gè)月或PFS≥18 個(gè)月對(duì)患者進(jìn)行篩選,訓(xùn)練組和測試組在患者性別、年齡、OS、PFS、吸煙史、KPS 評(píng)分、分期、劑量、調(diào)強(qiáng)技術(shù)、是否進(jìn)行預(yù)防性腦照射、是否腦轉(zhuǎn)移、是否接受超過2 個(gè)周期誘導(dǎo)化療、是否接受同步化療、是否接受鞏固化療等方面差異均無統(tǒng)計(jì)學(xué)意義(均P>0.05)。
每組影像在原始影像和派生圖像的基礎(chǔ)上共提取到包括一階特征、形狀特征、紋理特征、灰度共生矩陣(gray level cooccurence matrix,GLCM)、灰度依賴性矩陣(gray level dependence matrix,GLDM)、灰度級(jí)運(yùn)行長度矩陣(gray level run length matrix,GLRLM)、灰度及帶矩陣(gray level size zone matrix,GLSZM)、相鄰灰度差分矩陣(neighbouring gray tone difference matrix,NGTDM))在內(nèi)的1 037 個(gè)特征。
在不同分類標(biāo)準(zhǔn)下,篩選所得特征有較大差異。以是否死亡為標(biāo)準(zhǔn)共篩選到9 個(gè)特征,分布在一階特征、GLSZM、GLCM、GLRLM 和NGTDM,在模型構(gòu)建中參數(shù)wavelet-LLH_glszm_SmallAreaEmphasis 重復(fù)出現(xiàn),與是否死亡密切相關(guān)。按照OS≤1 年或OS≥5 年為標(biāo)準(zhǔn)篩選到7 個(gè)特征,分布在一階特征、GLCM、GLSZM 和NGTDM,參數(shù)original_ngtdm_Strength在3 次提取特征重要性前列中重復(fù)出現(xiàn),且與模型構(gòu)建關(guān)系最為緊密。按照OS≤1 年或OS≥3 年為標(biāo)準(zhǔn)篩選到6 個(gè)特征,分布在一階特征、GLCM、GLSZM和NGTDM,其中參數(shù)wavelet-HHL_ngtdm_Busyness 在3 次重要性輸出中均被提出構(gòu)建新的模型。
PFS 方面以是否進(jìn)展為標(biāo)準(zhǔn),提取到10 個(gè)特征,分布在一階特征、形狀特征、GLCM、GLSZM 和NGTDM,此標(biāo)準(zhǔn)下不存在特定特征被納入構(gòu)建新的模型。以PFS≤6 個(gè)月或PFS≥24 個(gè)月為標(biāo)準(zhǔn)篩選出6 個(gè)特征,分布在一階特征、GLCM 和GLSZM,其中參數(shù)wavelet-LLH_glcm_ClusterShade 和wavelet-LLH_glcm_Correlation 被用于構(gòu)建新模型。以PFS≤12 個(gè)月或PFS≥18 個(gè)月作標(biāo)準(zhǔn)篩選到11 個(gè)特征,分布在一階特征、形狀特征、GLCM、GLRLM 和GLDM,其中參數(shù)wavelet-HHL_gldm_SmallDependenceHighGrayLevelEmphasis 作為重要特征3 次被納入新模型構(gòu)建。
以是否死亡為標(biāo)準(zhǔn)(68 例生存、119 例死亡)對(duì)病例分類并在訓(xùn)練組納入全部篩選特征構(gòu)建模型,在測試組中輸出準(zhǔn)確率均值為62.9%且相對(duì)穩(wěn)定,3 次輸出特征重要性分別構(gòu)建新模型,以測試組為基礎(chǔ)輸出準(zhǔn)確率、AUC、靈敏度和特異度。新構(gòu)建模型以AUC≥0.7 為標(biāo)準(zhǔn)評(píng)估,不存在可靠結(jié)果。
以O(shè)S≤1 年(n=20)或OS≥5 年(n=19)為標(biāo)準(zhǔn)對(duì)病例分類并在訓(xùn)練組中納入全部篩選特征,所得模型準(zhǔn)確率均值為0.677 且相對(duì)穩(wěn)定。以original_ngtdm_Strength、wavelet-HLH_glszm_GrayLevelVariance、wavelet-HHL_glcm_MCC 構(gòu)建模型AUC 均值為0.7(95%CI:0.549~1.031)。以original_ngtdm_Strength、wavelet-HHL_glcm_MCC、wavelet-LLL_glcm_ClusterProminence 構(gòu)建模型AUC均值為0.84(95%CI:0.624~0.957)。
以O(shè)S≤1 年(n=20)或OS≥3 年(n=58)為標(biāo)準(zhǔn)對(duì)病例分類并在訓(xùn)練組中納入全部篩選特征,所得模型準(zhǔn)確率均值為79.5% 且相對(duì)穩(wěn)定。以wavelet-LLH_glcm_ClusterShade、wavelet-LLH_glszm_SizeZoneNonUniformity、wavelet-HHL_ngtdm_Busyness 構(gòu)建模型的AUC 均值為0.73(95%CI:0.549~0.911)。以original_ngtdm_Strength、wavelet-HHL_glcm_Correlation、wavelet-HHL_ngtdm_Busyness 構(gòu)建模型的AUC 均值為0.74(95%CI:0.561~0.914)。以wavelet-LLH_glcm_ClusterShade、wavelet-HHL_ngtdm_Busyness、wavelet-HHL_glcm_Correlation 構(gòu)建模型的AUC 均值為0.78(95%CI:0.611~0.949)。見表2。
表2 患者總生存期模型結(jié)果
以是否進(jìn)展為標(biāo)準(zhǔn)(48 例無進(jìn)展、138 例進(jìn)展)對(duì)病例分類并在訓(xùn)練組納入全部篩選特征構(gòu)建模型,在測試組中輸出準(zhǔn)確率均值為74.6%且相對(duì)穩(wěn)定,3 次輸出特征重要性分別構(gòu)建新模型,以測試組為基礎(chǔ)輸出準(zhǔn)確率、AUC、靈敏度和特異度。重復(fù)輸出最重要的3 個(gè)特征構(gòu)建模型,以AUC≥0.7 為標(biāo)準(zhǔn)評(píng)估,新模型不存在可靠結(jié)果。
以PFS≤6 個(gè)月(n=19)或PFS≥24 個(gè)月(n=57)為標(biāo)準(zhǔn)對(duì)病例分類并在訓(xùn)練組中納入全部篩選特征,所得模型準(zhǔn)確率均值為73.6%。以wavelet-LLH_glcm_ClusterShade、wavelet-LLH_glcm_Correlation、wavelet-HHH_glcm_MCC 構(gòu)建模型AUC 平均為0.70(95%CI:0.513~0.887)。
以PFS≤12 個(gè)月(n=69)或PFS≥18 個(gè)月(n=75)為標(biāo)準(zhǔn)對(duì)病例分類并在訓(xùn)練組中納入全部篩選特征,所得模型準(zhǔn)確率均值為82.3%。新構(gòu)建模型AUC 均無法達(dá)到要求(表3)。
表3 患者無進(jìn)展生存期模型結(jié)果
隨機(jī)選取各標(biāo)準(zhǔn)下某一陽性結(jié)果繪圖(圖3)。
圖3 預(yù)測模型受試者工作特征曲線
近年來,LS-SCLC 的治療進(jìn)展較慢,雖然部分早期患者可以行手術(shù)切除,但多數(shù)仍需術(shù)后化療或放化療等輔助治療,同步放、化療仍是多數(shù)LS-SCLC 的標(biāo)準(zhǔn)治療。但SCLC 細(xì)胞惡性度高,異質(zhì)性強(qiáng),不同患者間療效差異較大、預(yù)后差異也較大。本研究進(jìn)一步證實(shí),多數(shù)患者在治療后很快復(fù)發(fā),中位PFS 僅為14.03 個(gè)月。但仍有少部分LS-SCLC 患者可以達(dá)到長期生存,中位OS 為29.77 個(gè)月,5 年生存率達(dá)到9.8%。提示對(duì)于LS-SCLC 患者,可能需要對(duì)預(yù)后進(jìn)行分層分析。不同預(yù)后的SCLC,可能具有不同基因背景。因此,能否采用影像手段對(duì)SCLC 進(jìn)行分類,研究影響預(yù)后的影像組學(xué)特點(diǎn)對(duì)于指導(dǎo)臨床診療具有重要意義。
目前,影像組學(xué)在SCLC 方面的研究較為局限,主要集中在對(duì)疾病分型[5-10],研究預(yù)后的模型較少。部分已發(fā)表的組學(xué)研究均未區(qū)分局限期或廣泛期,且總病例數(shù)過少。Gkika 等[11]納入LS-SCLC 患者47 例、廣泛期患者51 例,基于CT 提取影像特征72 個(gè),分別與OS、PFS 行相關(guān)性分析,取相關(guān)性最高的特征納入Cox 風(fēng)險(xiǎn)比例模型。影像特征僅有original_glcm_Imc1、original_glcm_Imc2 和original_shape_Maximum2DDiameterColumn 可認(rèn)為中度相關(guān),但影像特征建立的模型無法預(yù)測生存情況。本研究的193例均為LS-SCLC 患者,病例更多、研究結(jié)果更為可靠。
本研究的影像特征提取來自放療定位CT,較診斷CT 是LS-SCLC 患者最接近治療前的影像結(jié)果,每例患者均提取1 037 個(gè)特征用于篩選,其中包括了基于原始圖像的一階特征、形狀特征、紋理特征和小波特征。Jiao 等[12]以早期NSCLC 患者為研究對(duì)象進(jìn)行預(yù)后預(yù)測,同樣以GTV 為ROI 所提取的特征數(shù)為每組680 個(gè)特征,其中包含一階特征、形狀特征及部分紋理特征,模型一致性指數(shù)0.734,而Gkika 等[11]僅提取了72 個(gè)影像特征,研究結(jié)果可信度一般。本研究在機(jī)器學(xué)習(xí)基礎(chǔ)上,提取特征數(shù)目更多、種類更全,對(duì)于預(yù)后的預(yù)測更為準(zhǔn)確。
有研究報(bào)道,特征篩選應(yīng)用LASSO 篩選,并進(jìn)行Cox 分析[13]。部分研究也未對(duì)特征進(jìn)行前期篩選,而是選擇納入全部特征進(jìn)行分析,然后再選取最相關(guān)的特征納入Cox 分析判斷是否能夠預(yù)測預(yù)后[11]。本研究結(jié)合了t檢驗(yàn)、LASSO 篩選特征和隨機(jī)森林分類器構(gòu)建預(yù)測模型,并選擇最重要的3 個(gè)特征重新構(gòu)建模型。CT 影像具有較好的空間分辨率,且以灰度來代表不同的組織結(jié)構(gòu),影像的紋理與腫瘤異質(zhì)性有關(guān),也可能預(yù)測腫瘤的生物學(xué)行為[14],本研究篩選獲得的特征大多為腫瘤區(qū)紋理特征,與上述研究結(jié)果相符。OS 部分以O(shè)S≤1 年或OS≥5 年和以O(shè)S≤1 年或OS≥3 年為標(biāo)準(zhǔn)構(gòu)建最終模型時(shí),original_ngtdm_Strength和wavelet-HHL_ngtdm_Busyness 3 次被認(rèn)定為重要特征,兩者均屬于NGTDM 特征,刻畫了一個(gè)像素與周圍像素值的關(guān)系,可用于衡量組織的異質(zhì)性;PFS 部分以PFS ≤6 個(gè)月或PFS ≥24 個(gè)月為標(biāo)準(zhǔn),wavelet-LLH_glcm_ClusterShade、wavelet-LLH_glcm_Correlation 被3 次用于構(gòu)建新模型,兩者屬于GLCM 特征,用于描述具有某種空間關(guān)系的兩個(gè)像素的聯(lián)合分布,wavelet-LLH_glcm_ClusterShade 反映影像的均勻度、wavelet-LLH_glcm_Correlation 反映圖像紋理的一致性,也可表示組織的同質(zhì)性。本研究篩選獲得的特征參數(shù)與臨床現(xiàn)狀保持一致,具有更高的可信度。
影響LS-SCLC 療效的因素眾多,長期以來,預(yù)測LS-SCLC 的OS 十分困難,目前已獲得的模型多AUC<0.7。本研究中以O(shè)S≤1 年或OS≥5 年和以O(shè)S≤1 年或OS≥3 年為標(biāo)準(zhǔn)獲得的模型進(jìn)一步在測試組中進(jìn)行結(jié)果驗(yàn)證所得AUC≥0.7,預(yù)測效果良好,具有進(jìn)一步擴(kuò)大樣本研究的價(jià)值。本研究在生存標(biāo)準(zhǔn)下得到具有預(yù)測效能的模型,但以是否生存為標(biāo)準(zhǔn)無法獲得期待模型,與Gkika 等[11]在OS 部分無法構(gòu)建具有預(yù)測效果的模型結(jié)果相似。這可能與OS 與患者整體情況、治療方案有關(guān),SCLC 通常接受化療、放療聯(lián)合治療,影響因素眾多,單純以影像特征進(jìn)行預(yù)測較為困難。Jain 等[15]借助影像組學(xué)構(gòu)建了預(yù)測接受鉑類藥物化療SCLC 患者預(yù)后模型,測試組模型一致性指數(shù)為0.69,也證實(shí)了上述推斷。
本研究對(duì)PFS 的結(jié)果同樣進(jìn)行了多種分組研究,其中僅有以PFS≤6 個(gè)月或≥24 個(gè)月納入患者構(gòu)建模型所得AUC=0.70。以是否進(jìn)展和PFS≤12 個(gè)月或PFS≥18 個(gè)月標(biāo)準(zhǔn)納入患者所構(gòu)建模型AUC 達(dá)不到標(biāo)準(zhǔn),認(rèn)為模型預(yù)測效果不佳。目前多數(shù)借助影像組學(xué)對(duì)SCLC 進(jìn)行預(yù)后預(yù)測的研究[11]中PFS 部分單因素分析所得均差異無統(tǒng)計(jì)學(xué)意義,無法進(jìn)行多因素分析并構(gòu)建方程,與本研究結(jié)果類似。提示SCLC 生物學(xué)特性復(fù)雜,難以用單一影像方法預(yù)測局部控制療效,這也與SCLC 易復(fù)發(fā),易轉(zhuǎn)移的臨床特點(diǎn)吻合。
綜上所述,本研究結(jié)果表明影像組學(xué)在SCLC 的預(yù)后預(yù)測方面可構(gòu)建具有較好預(yù)測效果的模型,但SCLC 生物學(xué)特性復(fù)雜,單一的影像特征難以描述,納入臨床因素、腫瘤標(biāo)志物或分子指標(biāo)等構(gòu)建融合模型,是下一步研究的方向。