郭 黎,楊朝鳳,李 楊,2
1.醫(yī)學(xué)影像四川省重點(diǎn)實(shí)驗(yàn)室/川北醫(yī)學(xué)院附屬醫(yī)院放射科,四川 南充 637000;2.四川省岳池縣人民醫(yī)院放射科,四川 岳池638300
肺癌是最常見的癌癥之一,也是癌癥死亡的主要原因,大多數(shù)肺癌患者就診時(shí)已處于晚期,5 年生存率僅16.3%[1]。肺癌可分為非小細(xì)胞肺癌(non-small cell lung cancer,NSCLC)和小細(xì)胞肺癌兩大類。NSCLC是一組異質(zhì)性疾病,約占肺癌的85%[2],主要為腺癌、鱗狀細(xì)胞癌和大細(xì)胞癌。早期診斷、準(zhǔn)確評(píng)估和個(gè)體化治療是提高肺癌患者生存率的重要途徑,而靶向治療和免疫治療等的應(yīng)用極大改善了NSCLC 患者的預(yù)后,使其2 年相對(duì)生存率從34%提高至42%[3-4]。
NSCLC 缺乏特異性臨床特征,大多數(shù)患者確診時(shí)已處于晚期,治療效果較差,生存率低。研究表明,影像組學(xué)能無(wú)創(chuàng)性地評(píng)估腫瘤組織的特征,可用于腫瘤診斷、分期和指導(dǎo)治療,且具有很高的準(zhǔn)確性[5],有望為臨床診療提供更多幫助。筆者對(duì)影像組學(xué)及其在NSCLC 中的研究進(jìn)展進(jìn)行綜述。
影像組學(xué)是指利用數(shù)學(xué)算法從醫(yī)學(xué)圖像(即CT、MRI、PET、超聲)中高通量地提取定量影像特征,深度挖掘圖像所包含的信息,協(xié)助臨床疾病診療的影像分析方法[6-8]。這些特征包括病變的形狀、體積、紋理、衰減及其他人眼難以識(shí)別或量化的特征[9]。影像組學(xué)的研究過程可分為5 個(gè)步驟:數(shù)據(jù)選擇、圖像分割、特征提取、探索性分析和模型建立[10]。
影像組學(xué)研究從選擇成像數(shù)據(jù)(即回顧性研究)或建立成像方案(即前瞻性研究)、選擇感興趣的組織和預(yù)測(cè)目標(biāo)(即希望預(yù)測(cè)的事件或特征)開始[11]。如對(duì)整個(gè)原發(fā)腫瘤進(jìn)行分析,將其與現(xiàn)有的治療結(jié)果(如預(yù)后、生存率等)數(shù)據(jù)聯(lián)系,然后從醫(yī)學(xué)圖像中提取出定量的影像學(xué)數(shù)據(jù),并以無(wú)創(chuàng)性方式探索其與療效的相關(guān)性[12]。與MRI 相比,CT 數(shù)據(jù)的可變性更小,在影像組學(xué)分析中應(yīng)用更廣泛[13]。
在二維/三維圖像中描繪ROI/VOI 是影像組學(xué)分析方法關(guān)鍵的一步[14],通常選擇ROI 作為兩者的統(tǒng)稱。ROI 定義了計(jì)算影像組學(xué)特征的區(qū)域,并采用手動(dòng)、半自動(dòng)或全自動(dòng)方式進(jìn)行分割。大多數(shù)影像組學(xué)研究采用手動(dòng)分割,可準(zhǔn)確勾畫腫瘤邊界,但存在耗時(shí)久、受主觀性影響較大、可重復(fù)性差的缺點(diǎn)。而自動(dòng)分割(包括半自動(dòng)和全自動(dòng))具有高效性和可重復(fù)性,將影像組學(xué)特征的提取與機(jī)器學(xué)習(xí)相結(jié)合,可自動(dòng)勾畫腫瘤病變的輪廓[15],避免人工勾畫的繁瑣與失誤。但許多腫瘤邊界模糊,難以正確劃分ROI,而后續(xù)特征數(shù)據(jù)需從ROI 中獲得,因此,自動(dòng)分割可能會(huì)導(dǎo)致特征數(shù)據(jù)缺乏準(zhǔn)確性[16]。
影像組學(xué)特征是一種定量特征,可分為形狀特征、一階統(tǒng)計(jì)特征、二階統(tǒng)計(jì)特征和高階統(tǒng)計(jì)特征[17]。形狀特征描述了所追蹤ROI 的形狀及其幾何屬性;一階統(tǒng)計(jì)特征描述了單個(gè)體素值的分布,而不考慮空間關(guān)系;二階統(tǒng)計(jì)特征即紋理特征,是通過計(jì)算相鄰體素之間的統(tǒng)計(jì)關(guān)系而獲得;高階統(tǒng)計(jì)特征是在對(duì)圖像應(yīng)用濾波器或數(shù)學(xué)變換后,通過統(tǒng)計(jì)方法獲得[18-19]。有些商業(yè)軟件包可執(zhí)行特征提取工作,如PyRadiomics、ONCOradiomics、LIFEx、3Dslicer、MIM、TexRAD、MaZda、CGITA、IBEX 等[20]。
在建模之前,可對(duì)提取的特征和預(yù)測(cè)目標(biāo)之間的關(guān)系進(jìn)行評(píng)估,以幫助選擇特征。如可使用相關(guān)或單變量邏輯回歸分析進(jìn)行評(píng)估[11],或?qū)⑻卣髋c1 個(gè)或多個(gè)特定結(jié)果行關(guān)聯(lián)分析[21],以探索特征的可行性與準(zhǔn)確性;可將收集的數(shù)據(jù)集劃分為用于創(chuàng)建模型的訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集,以及測(cè)試數(shù)據(jù)集。通常將80%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,20%作為測(cè)試數(shù)據(jù)集,而訓(xùn)練數(shù)據(jù)集的20%作為驗(yàn)證數(shù)據(jù)集,用于模型超參數(shù)調(diào)整時(shí)檢查是否過度擬合[22]。只有對(duì)預(yù)測(cè)目標(biāo)的評(píng)估顯示出顯著診斷性能的特征才能用于進(jìn)一步建立模型。
在獲得足夠多的定量成像特征后,需進(jìn)行特征選擇以保留關(guān)鍵特征,避免大量信息導(dǎo)致過度擬合,再根據(jù)臨床終點(diǎn)與關(guān)鍵特征構(gòu)建預(yù)測(cè)模型[23]。建立模型的關(guān)鍵在于模型的可重復(fù)性,因此可采用多重建模方法。當(dāng)數(shù)據(jù)量大時(shí),深度學(xué)習(xí)是建模的首選方法[22],常用的有邏輯回歸、支持向量機(jī)(support vector machine,SVM)和隨機(jī)森林等。研究表明,隨機(jī)森林通常具有較高的性能[24]。相較于單純的影像組學(xué)模型,將患者的臨床特征與影像組學(xué)特征相結(jié)合,可提高模型的有效性[25]。建立模型后,常采用ROC曲線或AUC 對(duì)模型性能進(jìn)行評(píng)估和驗(yàn)證,目前多采用AUC,其值為0~1[26],值越大,模型性能越好。
隨著醫(yī)療條件的進(jìn)步,NSCLC 患者的治療方法也趨于多元化:早期患者手術(shù)切除能獲得較好的預(yù)后效果;而晚期無(wú)法手術(shù)的患者,放射治療(包括立體定向消融放射治療)和全身治療(包括細(xì)胞毒性化療、酪氨酸激酶抑制劑和免疫檢查點(diǎn)抑制劑)的應(yīng)用也極大提高了患者的生存期[27]。影像組學(xué)能夠以無(wú)創(chuàng)的方式,對(duì)腫瘤的整體特征進(jìn)行分析,間接反映腫瘤細(xì)胞及分子層面的理化性質(zhì),并及時(shí)評(píng)估治療反應(yīng),建立起影像學(xué)與生物學(xué)之間的聯(lián)系,為臨床診療提供重要幫助。對(duì)于NSCLC 患者,影像組學(xué)的應(yīng)用包括以下幾個(gè)方面。
正確區(qū)分NSCLC 組織學(xué)亞型及基因突變對(duì)治療至關(guān)重要,但這些結(jié)果主要依賴病理活檢。重復(fù)活檢會(huì)增加腫瘤局部轉(zhuǎn)移的風(fēng)險(xiǎn)和患者的經(jīng)濟(jì)負(fù)擔(dān)[28],因此,影像組學(xué)因無(wú)創(chuàng)、可重復(fù)和成本低可替代病理活檢而用于組織分型和基因突變檢測(cè)中。Ferreira-Junior等[29]基于CT 影像組學(xué)特征預(yù)測(cè)肺癌組織學(xué)亞型的研究發(fā)現(xiàn),共生矩陣的最大概率特征變化能夠區(qū)分NSCLC 組織學(xué)亞型,其值越大,腫瘤為鱗狀細(xì)胞癌的可能性越大。Tang 等[30]收集了148 例NSCLC 患者的多模態(tài)MRI 數(shù)據(jù),分別構(gòu)建了影像組學(xué)評(píng)分(Rad-score)模型和影像組學(xué)-臨床列線圖用于區(qū)分鱗狀細(xì)胞癌和腺癌,結(jié)果顯示Rad-score 模型在2 個(gè)隊(duì)列中(訓(xùn)練組和驗(yàn)證組)均具有良好的區(qū)分性能,AUC 分別為0.819 和0.824,而結(jié)合了Rad-score 和臨床獨(dú)立預(yù)測(cè)因子的影像組學(xué)-臨床列線圖在2 個(gè)隊(duì)列中的AUC分別為0.901 和0.872,表明基于多模態(tài)MRI 的影像組學(xué)特征可對(duì)NSCLC 進(jìn)行組織學(xué)亞型分類,且影像組學(xué)特征與臨床特征相結(jié)合可進(jìn)一步提高對(duì)NSCLC組織學(xué)亞型分類的準(zhǔn)確性。另有研究顯示,影像組學(xué)特征(熵)聯(lián)合臨床特征(吸煙和性別)和影像學(xué)特征可正確識(shí)別85%的腺癌和鱗狀細(xì)胞癌,且這種預(yù)測(cè)的準(zhǔn)確率在表皮生長(zhǎng)因子受體(epidermal growth factor receptor,EGFR)突變型腺癌和鱗狀細(xì)胞癌中可達(dá)95%[31]。
NSCLC 致癌的核心機(jī)制為體細(xì)胞基因的突變,包括EGFR、kirsten 鼠類肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)、間變性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)、Erb-B2 受體酪氨酸激酶2(erb-B2 receptor tyrosine kinase 2,ERBB2)和腫瘤蛋白53(tumor protein 53,TP53)等。多項(xiàng)研究指出,影像組學(xué)在識(shí)別NSCLC 患者基因突變方面具有巨大潛力[32-33]。Zhang 等[32]納入了134 例NSCLC 患者,提取出20 個(gè)與突變相關(guān)的影像組學(xué)特征,結(jié)果顯示,用于區(qū)分EGFR、KRAS、ERBB2 和TP53突變的組合模型(影像組學(xué)特征和相關(guān)臨床因素)的AUC 分別為0.78、0.81、0.87 和0.84;其中非EGFR突變的特異度為0.96,KRAS、ERBB2 和TP53 突變的敏感度為0.82~0.92,表明影像組學(xué)可區(qū)分NSCLC 患者中不同類型的基因突變。還有研究提取出12 個(gè)與EGFR 突變顯著相關(guān)的影像組學(xué)特征,建立了臨床-放射-影像組學(xué)模型,該模型具有更高的AUC(0.849),優(yōu)于SVM 分類器(AUC=0.81)、邏輯回歸分類器(AUC=0.783)、決策樹分類器(AUC=0.768),這一結(jié)果表明臨床-放射-影像組學(xué)模型對(duì)EGFR 突變有更高的預(yù)測(cè)價(jià)值,可指導(dǎo)患者的靶向治療[33]。
NSCLC 患者中ALK 是另一種突變率較高的驅(qū)動(dòng)基因,占肺腺癌的5%~7%[34],但影像組學(xué)在ALK 突變方面的研究較少。Chang 等[35]研究發(fā)現(xiàn),PET/CT 影像組學(xué)-臨床模型在預(yù)測(cè)ALK 突變狀態(tài)方面具有顯著優(yōu)勢(shì)(訓(xùn)練組AUC=0.87,測(cè)試組AUC=0.88),高于單獨(dú)的臨床模型(訓(xùn)練組AUC=0.76,測(cè)試組AUC=0.74)(P=0.023),表明基于PET/CT 影像組學(xué)的機(jī)器學(xué)習(xí)模型可作為一種無(wú)創(chuàng)性診斷方法確定NSCLC 的ALK 突變狀態(tài)。
近年來,靶向治療在多種晚期腫瘤的治療中展現(xiàn)出巨大前景。在NSCLC 患者中,尤其是東亞人群,EGFR 的突變率高達(dá)40%~55%[36]。因此,研究人員開發(fā)了以EGFR 酪氨酸激酶抑制劑(tyrosine kinases in-hibitors,TKIs)為代表的靶向藥物,用于治療晚期NSCLC。當(dāng)患者出現(xiàn)EGFR 基因突變時(shí),采用TKIs治療的客觀緩解率高達(dá)80%,而野生型EGFR 患者的客觀緩解率僅10%[37]。Shao 等[36]收集了250 例接受第1、2 代EGFR-TKIs 藥物治療的ⅢC~Ⅳ期EGFR 突變型NSCLC 患者數(shù)據(jù),構(gòu)建Rad-score 模型,結(jié)果顯示Rad-score 與無(wú)進(jìn)展生存期呈負(fù)相關(guān),Rad-score 越高,無(wú)進(jìn)展生存期越短,說明基于PET/CT的Rad-score 可篩選出NSCLC 第1、2 代EGFR-TKIs藥物治療后有進(jìn)展風(fēng)險(xiǎn)的人群,并識(shí)別出對(duì)靶向治療敏感的EGFR 突變型NSCLC 人群,有助于為NSCLC患者提供精準(zhǔn)的治療方案。Yang 等[38]研究了治療前影像組學(xué)特征在預(yù)測(cè)接受一線化療、靶向治療或兩者聯(lián)合治療的NSCLC 患者的有效性,從322 例NSCLC患者數(shù)據(jù)中篩選出6 個(gè)最佳影像組學(xué)特征(包括4 個(gè)紋理特征,2 個(gè)統(tǒng)計(jì)特征)建立的影像組學(xué)標(biāo)簽,其AUC 達(dá)0.746,結(jié)果表明基于治療前CT 圖像的影像組學(xué)標(biāo)簽可準(zhǔn)確預(yù)測(cè)NSCLC 患者接受一線化療或靶向治療后的腫瘤情況。還有學(xué)者研究了預(yù)測(cè)EGFR-TKIs 治療晚期EGFR 突變NSCLC 無(wú)進(jìn)展生存期的最佳影像組學(xué)模型,結(jié)果顯示使用基尼指數(shù)特征選擇方法的邏輯回歸模型具有最佳表現(xiàn)(AUC=0.797),且風(fēng)險(xiǎn)評(píng)分中位值為0.518,其值越大,腫瘤快速進(jìn)展的可能性越大,而根據(jù)該臨界值可將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組[39],有助于臨床醫(yī)師篩選出高風(fēng)險(xiǎn)患者并及時(shí)干預(yù)治療。
ALK 是治療NSCLC 另一種較為成熟的靶點(diǎn),但并非所有NSCLC 患者都能受益于靶向治療。腦轉(zhuǎn)移是接受TKIs 治療ALK 陽(yáng)性肺癌患者治療失敗最常見的原因[40]。提前篩選并及時(shí)進(jìn)行干預(yù)有腦轉(zhuǎn)移風(fēng)險(xiǎn)的患者,可大大提高其生存率。Xu 等[41]研究發(fā)現(xiàn)了一個(gè)小波變換的紋理特征(即W_GLCM_LH_Correlation),結(jié)果顯示其能夠預(yù)測(cè)Ⅲ/Ⅳ期ALK 陽(yáng)性NSCLC 患者的腦轉(zhuǎn)移情況(AUC 分別為0.682、0.653)。Jiang 等[42]研究基于CT 的影像組學(xué)模型,用于預(yù)測(cè)接受克唑替尼治療NSCLC 患者的腦轉(zhuǎn)移情況發(fā)現(xiàn),結(jié)合吸煙史和影像組學(xué)特征的列線圖對(duì)NSCLC 患者的無(wú)腦轉(zhuǎn)移生存期預(yù)測(cè)性能良好(C 指數(shù)訓(xùn)練組0.762,驗(yàn)證組0.724)。
免疫療法能夠刺激針對(duì)惡性腫瘤的細(xì)胞免疫反應(yīng),以程序性細(xì)胞死亡蛋白1(programmed cell death protein 1,PD-1)或程序性死亡配體1(programmed death-ligand 1,PD-L1)信號(hào)通路為靶點(diǎn)的免疫檢查點(diǎn)抑制劑(immune checkpoint inhibitors,ICIs)是驅(qū)動(dòng)基因陰性晚期NSCLC 患者的標(biāo)準(zhǔn)治療方案[43]。影像組學(xué)在評(píng)估免疫治療效果方面也具有一定的價(jià)值。Zerunian 等[44]研究發(fā)現(xiàn),在紋理參數(shù)中,細(xì)過濾器和中等過濾器的正像素平均值(mean value of positive pixels,MPP)AUC分別為0.72 和0.70;Kaplan-Meier分析顯示MPP<56.2 與較短的總生存期及無(wú)進(jìn)展生存期顯著相關(guān),提示MPP 可作為ICIs 派姆單抗治療的NSCLC 患者總生存期和無(wú)進(jìn)展生存期的預(yù)測(cè)性影像學(xué)因素。Trebeschi 等[45]開發(fā)了一種評(píng)估免疫治療反應(yīng)的影像組學(xué)生物標(biāo)志物,該標(biāo)志物在NSCLC中具有良好性能(AUC=0.83),可反映免疫治療效果,且在改善新輔助治療和姑息治療患者分層方面具有潛在的效用。Li 等[46]研究顯示,在結(jié)合影像組學(xué)特征和臨床病理特征的基礎(chǔ)上,PD-L1 表達(dá)水平超過1%和50%的預(yù)測(cè)模型,其AUC 分別為0.762 和0.814,表明基于PET/CT 圖像和臨床病理特征的預(yù)測(cè)模型可篩選出抗PD-L1 免疫治療有效的NSCLC患者。
免疫治療后2 個(gè)月內(nèi)獲得的圖像與治療前圖像比,若腫瘤負(fù)荷增加50%以上,且進(jìn)展速度增加2 倍以上[47],則為超進(jìn)展。一旦患者出現(xiàn)超進(jìn)展,多預(yù)后不良,及早識(shí)別有超進(jìn)展風(fēng)險(xiǎn)的患者是目前亟待解決的問題。Vaidya 等[48]使用隨機(jī)森林分類器區(qū)分超進(jìn)展和非超進(jìn)展患者,在訓(xùn)練集和驗(yàn)證集中,其AUC 分別為0.85±0.06 和0.96,結(jié)果表明從接受ICIs 治療的晚期NSCLC 患者CT 圖像中提取的影像組學(xué)生物標(biāo)志物,有助于識(shí)別有超進(jìn)展風(fēng)險(xiǎn)患者。鑒于目前超進(jìn)展尚無(wú)統(tǒng)一的診斷標(biāo)準(zhǔn),其發(fā)生機(jī)制、危險(xiǎn)因素也不明確,應(yīng)用影像組學(xué)或可成為一種具有極大潛力的研究方式,但還需進(jìn)一步驗(yàn)證。
NSCLC 患者的預(yù)后通常取決于TNM 分期,但在臨床中,即使腫瘤病理類型和分期相同,采用同樣的方法治療后,也可能出現(xiàn)不同的治療結(jié)果。因此,預(yù)測(cè)患者的預(yù)后對(duì)選擇治療方案和提高生存率至關(guān)重要。尋找一種新的預(yù)測(cè)指標(biāo)成了影像工作者亟需解決的問題。有研究表明,非同義突變的腫瘤突變負(fù)荷(tumor mutation burden,TMB)與可切除NSCLC 患者的預(yù)后相關(guān),TMB 越高,預(yù)后越好[49]。He 等[50]收集327 例患者具有TMB 數(shù)據(jù)的CT 圖像,建立了TMB 影像組學(xué)生物標(biāo)志物(TMB radiomic biomarker,TMBRB),結(jié)果顯示TMBRB 能夠區(qū)分高TMB 和低TMB 的NSCLC 患者,并推測(cè)TMBRB 的ROI 可能與CD8 細(xì)胞豐度及腫瘤浸潤(rùn)淋巴細(xì)胞密度有關(guān)。Yang等[51]研究表明,CT、PET 或PET/CT 的影像組學(xué)評(píng)分對(duì)生存率有較好的預(yù)測(cè)能力,其中又以PET/CT 影像組學(xué)評(píng)分表現(xiàn)最好,其與臨床病理因素結(jié)合,可提高PET/CT 模型的預(yù)測(cè)性能。
有研究者改進(jìn)了影像組學(xué)方法,提出采用基于同源性的影像組學(xué)方法預(yù)測(cè)NSCLC 患者預(yù)后,但目前相關(guān)研究較少。Kadoya 等[52]根據(jù)Rad-score 將訓(xùn)練組和測(cè)試組中的患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,2 組的總生存期具有明顯差異。在訓(xùn)練組中,基于同源性的特征(Rad-score)、標(biāo)準(zhǔn)特征(Rad-score)和腫瘤大小的C 指數(shù)值分別為0.625、0.603 和0.607,而在測(cè)試組中分別為0.689、0.668 和0.667。這一結(jié)果表明,基于同源性的影像組學(xué)特征的預(yù)測(cè)能力略高于標(biāo)準(zhǔn)影像組學(xué)特征,提示其在提高影像組學(xué)的預(yù)后預(yù)測(cè)準(zhǔn)確性方面存在潛力。
近年來,影像組學(xué)在肺癌診斷、治療和預(yù)后評(píng)估等方面顯示出巨大前景,但其仍存在一些局限性:①大多數(shù)研究是回顧性隊(duì)列研究,樣本量較小,缺乏足夠的數(shù)據(jù)來驗(yàn)證影像組學(xué)的有效性。②在臨床中,患者的情況復(fù)雜,存在多種病變和共病,基于單個(gè)病變的預(yù)測(cè)模型可能無(wú)法滿足臨床需要[53]。③目前大多數(shù)為單中心研究,研究結(jié)果的可重復(fù)性較差,無(wú)法進(jìn)行驗(yàn)證,因此需大量的多中心前瞻性研究評(píng)估影像組學(xué)的準(zhǔn)確性。④缺乏標(biāo)準(zhǔn)化的影像組學(xué)方法、質(zhì)量評(píng)估,以及統(tǒng)一的圖像采集參數(shù),存在較大的主觀性,降低了研究結(jié)果的科學(xué)性。未來影像組學(xué)的發(fā)展需多學(xué)科、多機(jī)構(gòu)合作,通過建立影像組學(xué)數(shù)據(jù)庫(kù),實(shí)現(xiàn)數(shù)據(jù)共享,以克服不同數(shù)據(jù)之間的差異。同時(shí),將傳統(tǒng)影像組學(xué)與人工智能相結(jié)合有望從2 種技術(shù)的優(yōu)勢(shì)中獲益。
總之,影像組學(xué)在肺癌的應(yīng)用中存在巨大潛力,隨著影像組學(xué)的發(fā)展與進(jìn)步,必將為臨床診療帶來幫助,實(shí)現(xiàn)對(duì)NSCLC 患者的精準(zhǔn)治療。
中國(guó)中西醫(yī)結(jié)合影像學(xué)雜志2023年6期