張慧媛,孟祥溪,周欣,李囡
北京大學(xué)腫瘤醫(yī)院暨北京市腫瘤防治研究所核醫(yī)學(xué)科,國家藥監(jiān)局放射性藥物研究與評(píng)價(jià)重點(diǎn)實(shí)驗(yàn)室,惡性腫瘤發(fā)病機(jī)制及轉(zhuǎn)化研究教育部重點(diǎn)實(shí)驗(yàn)室,北京 100142;*通信作者 李囡 rainbow6283@sina.com
肺癌的發(fā)病率和死亡率均居全國首位,2020年中國癌癥死亡人數(shù)約300萬,肺癌死亡人數(shù)為71萬,占癌癥死亡總數(shù)的23.8%[1]。盡管肺癌的治療方法不斷多樣化,包括手術(shù)、放療、化療、靶向治療及免疫治療等,但其5年生存率仍較低,僅為19%[2]。目前,肺癌的診斷主要依靠影像學(xué)檢查。PET/CT能同時(shí)提供病灶的解剖和代謝信息,極大地提高了肺癌的早期診斷與療效評(píng)估水平,是肺癌診斷和分期的重要成像技術(shù)[3-4]。隨著醫(yī)學(xué)影像技術(shù)與人工智能技術(shù)的不斷發(fā)展與提高,影像組學(xué)的概念被提出,并在癌癥的診療中展現(xiàn)出巨大的潛力。目前影像組學(xué)應(yīng)用廣泛,可用于鑒別腫瘤良惡性、腫瘤分期、病理分型、預(yù)測(cè)基因突變和分子表型、預(yù)測(cè)預(yù)后等,在癌癥研究中日益重要。醫(yī)學(xué)影像的作用正從最初的診斷工具演變?yōu)閭€(gè)性化精準(zhǔn)醫(yī)療背景下的核心角色[5]。本文擬對(duì)PET/CT影像組學(xué)在非小細(xì)胞肺癌(non-small cell lung cancer,NSCLC)中的研究進(jìn)展進(jìn)行綜述。
1.1 影像組學(xué)的概念 Philippe Lambin于2012年首次提出影像組學(xué)的概念,之后不斷被完善,目前影像組學(xué)可定義為借助計(jì)算機(jī)軟件將醫(yī)學(xué)影像圖像轉(zhuǎn)化為海量的定量影像特征,運(yùn)用統(tǒng)計(jì)學(xué)和(或)機(jī)器學(xué)習(xí)的方法進(jìn)行量化分析,篩選出最有價(jià)值的影像組學(xué)特征,從而輔助臨床決策[6]。影像組學(xué)技術(shù)克服了傳統(tǒng)醫(yī)師判讀圖像的局限性和主觀性,將圖像特征轉(zhuǎn)化為可以進(jìn)行客觀、定量分析的數(shù)據(jù)信息,極大地拓展了醫(yī)學(xué)影像的臨床應(yīng)用價(jià)值,對(duì)于目前蓬勃發(fā)展的精準(zhǔn)醫(yī)學(xué)具有重要意義。
1.2 影像組學(xué)的流程 主要包括圖像獲取與重建、圖像分割、特征提取和選擇、模型建立和評(píng)估。
1.2.1 圖像獲取與重建 影像組學(xué)分析要求圖像數(shù)據(jù)具有較高的一致性。目前影像組學(xué)的圖像獲取主要來自CT、MRI和PET/CT,這些檢查設(shè)備通常在采集參數(shù)和重建算法上有很大的差異,缺乏一定的標(biāo)準(zhǔn),當(dāng)對(duì)圖像進(jìn)行分析以提取特征時(shí),由于參數(shù)的不同可能會(huì)導(dǎo)致誤差,因此,利用標(biāo)準(zhǔn)化的成像協(xié)議從而去除可能的混雜變異因素非常重要[7-8]。
1.2.2 圖像分割 圖像分割是影像組學(xué)中的重要步驟,指從醫(yī)學(xué)圖像中分割出感興趣區(qū)(ROI),即病灶,從而可將醫(yī)學(xué)影像圖像轉(zhuǎn)化為能夠進(jìn)行特征提取的圖像。圖像分割直接影響后續(xù)所提取的影像組學(xué)特征質(zhì)量,進(jìn)而影響研究結(jié)果的正確性和準(zhǔn)確性[9-10]。目前,圖像分割方法主要包括自動(dòng)分割、半自動(dòng)分割、手動(dòng)分割。自動(dòng)分割方法簡(jiǎn)便、高效;但是自動(dòng)分割算法種類繁多,準(zhǔn)確性不一,不同的情況選擇何種算法目前尚無統(tǒng)一標(biāo)準(zhǔn)。手動(dòng)分割是由專業(yè)的影像科醫(yī)師進(jìn)行勾畫,精確度高;但是費(fèi)時(shí)費(fèi)力,不適用于大數(shù)據(jù)的處理,且易受主觀因素影響。有研究表明,手動(dòng)分割的腫瘤輪廓在操作者之間具有很大的差異[11]。因此,計(jì)算機(jī)輔助勾畫、人工進(jìn)行管理的半自動(dòng)分割方法較為理想。
1.2.3 特征提取和選擇 特征提取是影像組學(xué)的核心步驟。特征大致可分為4類:①反映腫瘤強(qiáng)度的基于一階統(tǒng)計(jì)量的直方圖特征,如能量、熵、均方根等;②反映腫瘤形態(tài)和大小的特征;③描述腫瘤內(nèi)部異質(zhì)性的紋理特征,如灰度共生矩陣特征;④小波特征。目前,已有開源的特征提取軟件如PyRadiomics等,可實(shí)現(xiàn)組學(xué)特征提取過程的標(biāo)準(zhǔn)化和可重復(fù)操作。進(jìn)行特征提取時(shí)通常會(huì)提取出大量的特征,但在一定數(shù)據(jù)量下,過多特征可能會(huì)產(chǎn)生不利影響,因此需要對(duì)特征進(jìn)行篩選,去除冗雜、高度相關(guān)或貢獻(xiàn)有限的特征,從而避免過擬合。特征選擇主要有過濾法、嵌入法、包裝法,根據(jù)具體情況及相應(yīng)臨床目的選擇不同的篩選方法。
1.2.4 模型建立和評(píng)估 影像組學(xué)的最終目的是解決臨床實(shí)際問題、輔助臨床決策。提取并篩選出的影像組學(xué)特征需要建立預(yù)測(cè)模型,從而發(fā)現(xiàn)與臨床信息的潛在關(guān)聯(lián)。模型的建立一般采用機(jī)器學(xué)習(xí)的方法,多種模型顯示出其在影像組學(xué)分析中的有效性,如邏輯回歸(logistic regression,LR)、支持向量機(jī)(support vector machine,SVM)、隨機(jī)森林(random forest,RF)、主成分分析(principal component analysis,PCA)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)、LightGBM、XGBoost等。每種模型均有其自身的優(yōu)勢(shì)和局限性,一般根據(jù)研究人員的經(jīng)驗(yàn)選擇模型。建立模型后,應(yīng)對(duì)其性能進(jìn)行評(píng)估和驗(yàn)證。最終評(píng)估指標(biāo)常采用準(zhǔn)確度、敏感度、特異度、受試者工作特征(ROC)曲線和曲線下面積(AUC)等。
上述影像組學(xué)流程適用于各種醫(yī)學(xué)成像模態(tài)。傳統(tǒng)上,在CT、MRI和超聲中的應(yīng)用較為廣泛。近年來,影像組學(xué)在PET/CT及PET/MRI中的應(yīng)用也不斷增加,其基本流程并無差異。與其他成像模態(tài)相比,PET/CT的影像組學(xué)流程也具有相應(yīng)的特點(diǎn)。首先,PET/CT中功能模態(tài)和結(jié)構(gòu)模態(tài)經(jīng)過同機(jī)配準(zhǔn),在圖像分割過程中需要調(diào)和不同模態(tài)之間的關(guān)系,處理局部失配等特殊情況。其次,PET和CT特征并不完全相互獨(dú)立,特別是反映腫瘤形態(tài)大小的特征,需要在特征選擇過程中進(jìn)行調(diào)節(jié)。最后,由于PET/CT設(shè)備中,PET受日常校準(zhǔn)的影響很大,要關(guān)注采集過程中儀器狀態(tài)是否有漂移,并做好設(shè)備的質(zhì)量控制工作。
2.1 肺結(jié)節(jié)的良惡性鑒別18F-FDG PET/CT在鑒別肺結(jié)節(jié)良惡性方面仍面臨挑戰(zhàn)。傳統(tǒng)的PET/CT檢查主要依靠醫(yī)師的臨床經(jīng)驗(yàn),但部分良性病變無論是CT圖像上的解剖形態(tài)還是PET圖像上的代謝特點(diǎn)均與惡性腫瘤相似,這種相似的影像學(xué)表現(xiàn)令人難以準(zhǔn)確判斷。影像組學(xué)比視覺評(píng)估具有潛在的優(yōu)勢(shì),因?yàn)樗嵌亢涂陀^的,且部分組學(xué)特征無法進(jìn)行視覺評(píng)估。Kang等[12]的研究納入157例惡性和111例良性患者,分別從CT、薄層CT、PET和PET/CT中提取影像組學(xué)特征,結(jié)果發(fā)現(xiàn)與人工診斷相比,在不影響敏感度的同時(shí),聯(lián)合PET/CT影像組學(xué)和人工診斷可將肺癌診斷的假陽性率從30.6%降低到9.1%,AUC為0.92;并且與單純PET/CT影像組學(xué)相比,聯(lián)合人工診斷與PET/CT影像組學(xué)診斷準(zhǔn)確性更高,假陽性率更低。該研究證實(shí)了PET/CT影像組學(xué)在肺癌診斷中的重要作用,同時(shí)也提示臨床經(jīng)驗(yàn)可提高影像組學(xué)的性能,可協(xié)同影像組學(xué)對(duì)肺癌的診斷作用。Palumbo等[13]探討18F-FDG PET/CT影像組學(xué)特征鑒別孤立性肺結(jié)節(jié)良惡性的作用。該研究回顧性分析111例經(jīng)病理證實(shí)的39例良性和72例惡性孤立性肺結(jié)節(jié)的組學(xué)特征,結(jié)果顯示PET/CT的形態(tài)和紋理特征在準(zhǔn)確度、敏感度及特異度方面均高于常規(guī)影像學(xué)特征,證實(shí)影像組學(xué)特征在區(qū)分肺部良、惡性結(jié)節(jié)方面具有更高的價(jià)值。Miwa等[14]研究發(fā)現(xiàn):CT圖像上腫瘤形態(tài)的復(fù)雜性、PET圖像的SUVmax、FDG攝取的異質(zhì)性對(duì)鑒別良、惡性肺結(jié)節(jié)有重要作用,可以提高診斷準(zhǔn)確性。
2.2 肺癌的病理分型 不同病理類型的肺癌治療方法及預(yù)后均不同,因此在治療前明確病理類型是非常必要的。組織活檢是診斷病理分型和分期的“金標(biāo)準(zhǔn)”,但活檢有創(chuàng)、昂貴且耗時(shí),并且有時(shí)受患者臨床情況或病變部位的限制,使傳統(tǒng)活檢應(yīng)用受限。Yan等[15]研究發(fā)現(xiàn):PET/CT影像組學(xué)可有效預(yù)測(cè)肺癌的組織學(xué)亞型,有助于診斷并縮短診斷時(shí)間。該研究分別利用CT影像組學(xué)、PET影像組學(xué)、PET/CT影像組學(xué)建立預(yù)測(cè)模型,預(yù)測(cè)腺癌、鱗癌、轉(zhuǎn)移性肺癌和其他類型肺癌,其中聯(lián)合PET和CT影像組學(xué)特征預(yù)測(cè)的準(zhǔn)確性最高,為91.2%;單純CT影像組學(xué)、PET影像組學(xué)的預(yù)測(cè)準(zhǔn)確性分別為62.9%、79.1%。Hyun等[16]運(yùn)用機(jī)器學(xué)習(xí)方法區(qū)分肺鱗癌和肺腺癌,選擇5種機(jī)器學(xué)習(xí)模型(RF、ANN、樸素貝葉斯方法、LR和SVM),發(fā)現(xiàn)LR模型優(yōu)于其他分類器(AUC 0.859,準(zhǔn)確性為0.769,F(xiàn)1指數(shù)0.774,精確率0.804,召回率0.746),其次是ANN模型,并篩選出5個(gè)與腫瘤組織學(xué)亞型高度相關(guān)的特征:性別、SUVmax、灰階區(qū)長(zhǎng)度不均勻性、灰階區(qū)不均勻性和TLG,從而證實(shí)PET/CT影像組學(xué)特征可以幫助臨床醫(yī)師以無創(chuàng)的方式改善肺癌的組織病理學(xué)診斷。Bianconi等[17]分析了PET/CT紋理特征與組織學(xué)類型之間的相關(guān)性,結(jié)果發(fā)現(xiàn)鱗狀細(xì)胞癌的體積(CTvol、MTV)和FDG攝?。⊿UVmax、SUVmean)明顯大于其他組織學(xué)類型,而腺癌的攝取則低于其他亞型;同時(shí)根據(jù)PET的相關(guān)參數(shù),發(fā)現(xiàn)鱗狀細(xì)胞癌的異質(zhì)性明顯高于其他組織學(xué)類型,而腺癌的異質(zhì)性則低于其他類型。
2.3 肺癌基因突變及分子表型 近年來,靶向治療和免疫治療發(fā)展迅速,并顯著改善了NSCLC患者的預(yù)后。研究表明,表皮生長(zhǎng)因子受體(epidermal growth factor receptor,EGFR)基因突變患者使用酪氨酸激酶抑制劑(TKIs)可以獲得更長(zhǎng)的無進(jìn)展生存期(progress free survival,PFS)[18-19],程序性死亡蛋白配體-1(programmed death ligand-1,PD-L1)陽性患者進(jìn)行免疫治療可以顯著延長(zhǎng)無進(jìn)展生存時(shí)間和總生存時(shí)間(overall survival,OS)[20-22]。目前主要通過活檢獲得肺癌的基因突變狀態(tài)和分子表型,由于腫瘤存在異質(zhì)性,活檢組織不能全面反映整個(gè)腫瘤的狀態(tài),且活檢作為有創(chuàng)檢查,不宜重復(fù)進(jìn)行。影像組學(xué)作為無創(chuàng)性的高級(jí)成像分析學(xué)科,可以對(duì)腫瘤進(jìn)行整體評(píng)估,對(duì)于預(yù)測(cè)基因突變及分子表型具有重要意義。
Mu等[23]報(bào)道了基于18F-FDG PET/CT影像組學(xué)的深度學(xué)習(xí)模型,該模型在不同機(jī)構(gòu)的患者隊(duì)列中對(duì)于EGFR基因突變狀態(tài)的預(yù)測(cè)具有較高的準(zhǔn)確性,結(jié)果顯示利用PET/CT影像組學(xué)區(qū)分EGFR的突變狀態(tài)(野生型和突變型)時(shí)AUC在訓(xùn)練組、內(nèi)部驗(yàn)證組和外部測(cè)試組中分別為0.86、0.83和0.81,準(zhǔn)確度分別為81.1%、82.8%和78.5%;聯(lián)合臨床資料與影像組學(xué)的預(yù)測(cè)準(zhǔn)確性更高,在訓(xùn)練組、內(nèi)部驗(yàn)證組和外部測(cè)試組中AUC分別為0.88、0.88和0.84,準(zhǔn)確度分別為82.3%、82.9%和80.0%,但是研究者認(rèn)為兩者之間的微小差異可以忽略。Liu等[24]選用XGBoost建立了肺腺癌EGFR基因突變的預(yù)測(cè)模型,發(fā)現(xiàn)2個(gè)PET影像組學(xué)特征和8個(gè)CT組學(xué)特征與EGFR突變有關(guān),預(yù)測(cè)EGFR19突變時(shí)AUC為0.77,預(yù)測(cè)EGFR21突變時(shí)AUC為0.92,構(gòu)建EGFR突變陽性的整體預(yù)測(cè)模型AUC為0.87。Zhang等[25]選取SUVpeak 等5個(gè)PET 特征和Maximum等5個(gè)CT特征構(gòu)建預(yù)測(cè)模型,為預(yù)測(cè)EGFR突變狀態(tài)提供了一種相對(duì)準(zhǔn)確、方便、無創(chuàng)的方法。該研究發(fā)現(xiàn)EGFR突變組的SUVpeak和Maximum低于EGFR野生組。Yip等[26]的研究也證實(shí)了PET影像組學(xué)特征對(duì)預(yù)測(cè)EGFR突變的價(jià)值,并發(fā)現(xiàn)InvDiffmomnor是最具預(yù)測(cè)性的特征之一,能顯著區(qū)分EGFR突變陽性和EGFR陰性。
Jiang 等[27]報(bào)道了PET/CT 影像組學(xué)特征預(yù)測(cè)NSCLC的PD-L1表達(dá)狀態(tài),結(jié)果顯示CT組學(xué)特征建立的預(yù)測(cè)模型較PET組學(xué)特征更有效。
2.4 影像組學(xué)預(yù)測(cè)肺癌預(yù)后 即使病理類型及分期相同,采用相同的方法治療后,通常也會(huì)出現(xiàn)不同的治療反應(yīng)及效果。因此,準(zhǔn)確了解患者的預(yù)后對(duì)于治療方案的選擇和實(shí)施至關(guān)重要。
Mu等[28]確定了一種有效和穩(wěn)定的PET/CT影像組學(xué)特征,可作為預(yù)測(cè)免疫治療反應(yīng)的生物標(biāo)志物。此外,利用列線圖證實(shí)影像組學(xué)在評(píng)估持續(xù)性臨床獲益(DCB)、PFS、OS等方面的價(jià)值。在訓(xùn)練組、測(cè)試組、前瞻性測(cè)試組中,預(yù)測(cè)PFS的C指數(shù)分別為0.74、0.74、0.77,預(yù)測(cè)OS的C指數(shù)分別為0.83、0.83、0.80,具有指導(dǎo)個(gè)體免疫治療的潛力。Dissaux等[29]通過多中心研究發(fā)現(xiàn),PET/CT成像特征是NSCLC行立體定向放療患者局部控制的獨(dú)立預(yù)測(cè)因素。在接受立體定向放療的NSCLC中,將PET的一個(gè)特征(Information Correlation 2)和CT的一個(gè)特征(flatness)相結(jié)合,得到訓(xùn)練集中最好的預(yù)測(cè)模型,敏感度為100%,特異度為96%,精確度為0.98。這些特征可以提供復(fù)發(fā)相關(guān)的信息,并有助于臨床決策。Ohri等[30]使用最小絕對(duì)收縮和選擇算子(LASSO)篩選出1個(gè)紋理特征(SumMean)作為OS的獨(dú)立預(yù)測(cè)因子,并且發(fā)現(xiàn)原發(fā)腫瘤較大且SumMean較低的NSCLC放化療后預(yù)后較差。Fried等[31]通過比較Ⅲ期NSCLC,在Log-rank檢驗(yàn)(P=0.18比0.001)和一致性指數(shù)(0.62比0.58)方面,與單獨(dú)使用常規(guī)預(yù)后因素相比,使用PET定量成像特征和常規(guī)預(yù)后因素可以增強(qiáng)總體生存風(fēng)險(xiǎn)分層。此外,與單獨(dú)使用常規(guī)預(yù)后因素生成的模型相比,使用定量成像特征生成的模型在所有患者生存差異方面的一致性指數(shù)更高。劉寒冰等[32]報(bào)道PET/CT紋理參數(shù)與EGFR-TKI療效相關(guān),從而可用于臨床評(píng)估療效,結(jié)果表明年齡可預(yù)測(cè)肺腺癌EGFR-TKI療效,而PET/CT代謝參數(shù)與療效之間無相關(guān)性。
盡管影像組學(xué)可應(yīng)用于多種疾病,但目前NSCLC是影像組學(xué)研究最廣泛和最具特征性的惡性腫瘤。影像組學(xué)作為一種新興的研究方法,已形成了相對(duì)完整的理論體系和研究流程。但影像組學(xué)在發(fā)展中遇到的問題和挑戰(zhàn)是雙重的。在臨床應(yīng)用方面,影像組學(xué)更多地受限于樣本收集過程帶來的偏倚。目前關(guān)于影像組學(xué)的研究多是單中心、小樣本、回顧性研究,影像組學(xué)應(yīng)用于NSCLC的臨床治療指導(dǎo)之前,尚需進(jìn)行多中心、大樣本、隨機(jī)臨床對(duì)照的前瞻性試驗(yàn)進(jìn)行驗(yàn)證和臨床實(shí)踐。對(duì)于個(gè)別難以積累影像資料的病例,基于數(shù)據(jù)特征的影像組學(xué)方法也難以充分發(fā)揮作用。
此外,影像學(xué)還存在方法層面的固有缺陷。與直觀的影像學(xué)閱片模式不同,影像組學(xué)在特征提取的步驟中,很難尋找特征及特征組合在生理、代謝或解剖層面的意義,缺乏可解釋性。另外,圖像標(biāo)準(zhǔn)化、圖像配準(zhǔn)和數(shù)據(jù)共享等問題是影像組學(xué)臨床應(yīng)用的主要挑戰(zhàn)和限制。
影像組學(xué)可以幫助發(fā)現(xiàn)和揭示嵌入在醫(yī)學(xué)圖像中的重要信息,為影像診斷提供輔助信息、指導(dǎo)治療決策等。基于人工智能技術(shù)的影像組學(xué)在醫(yī)學(xué)領(lǐng)域尚處于起步階段,尚未廣泛應(yīng)用于臨床工作中,隨著影像技術(shù)的發(fā)展和機(jī)器學(xué)習(xí)方法的提升,仍有很大的發(fā)展空間,未來將會(huì)持續(xù)成為臨床醫(yī)學(xué)研究的熱點(diǎn),研究前景廣闊。在精準(zhǔn)醫(yī)療時(shí)代,影像組學(xué)在為未來個(gè)性化治療和隨訪提供基礎(chǔ)方法論方面發(fā)揮重要作用。