杜也 米熱阿依·阿布都熱孜克 左冉 袁東琪 霍庚崴 陳金良 張翠翠 孟昭婷 陳鵬
肺癌是全世界癌癥相關(guān)死亡的最常見原因,占癌癥死亡總?cè)藬?shù)的18.4%[1]。盡管手術(shù)治療、放化療及分子靶向治療取得了一定進(jìn)展,但肺腺癌(lung adenocarcinoma,LUAD)患者的生存率僅4%~7%[2]。因此仍需確定更多具有診斷和預(yù)后價(jià)值的分子標(biāo)志物。代謝重編程是癌癥的重要標(biāo)志[3],糖酵解水平升高和線粒體代謝受抑制已經(jīng)在多種癌癥中被驗(yàn)證[4]。糖酵解不僅能夠通過產(chǎn)生ATP 和乳酸促進(jìn)癌細(xì)胞存活,還能通過磷酸戊糖途徑為癌細(xì)胞提供用于生物合成的核苷酸、脂質(zhì)和非必需氨基酸[5]。此外,有報(bào)道糖酵解通過激活多種信號通路導(dǎo)致促進(jìn)癌細(xì)胞的增殖、遷移、侵襲和耐藥[3,6-8]。糖酵解相關(guān)基因與多種癌癥預(yù)后相關(guān),如TCF7L2 的高表達(dá)與胰腺癌的不良預(yù)后相關(guān)[9],CLDN9、B4GALT1、GMPPB、B4GALT4、AK4、CHST6、PC、GPC1 和SRD5A3 與子宮內(nèi)膜癌預(yù)后相關(guān)[10]。
本研究旨在基于癌癥基因圖譜(The Cancer Genome Atlas,TCGA)中的數(shù)據(jù)評估LUAD 中糖酵解相關(guān)基因的表達(dá),研究與LUAD 的預(yù)后相關(guān)的糖酵解相關(guān)基因。為此,本研究建立6 個(gè)基因風(fēng)險(xiǎn)預(yù)測模型。預(yù)后模型的應(yīng)用有助于指導(dǎo)臨床決策,對精準(zhǔn)醫(yī)療至關(guān)重要。經(jīng)驗(yàn)證,該模型可以作為一個(gè)獨(dú)立的因素預(yù)測患者預(yù)后,且預(yù)后性能明顯優(yōu)于其他臨床特征。
535 例LUAD 樣本及59 例正常肺組織樣本的mRNA 表達(dá)量及對應(yīng)患者臨床信息均通過TCGA 數(shù)據(jù)庫獲取,對數(shù)據(jù)進(jìn)行歸一化處理,排除臨床信息不完整的樣本。
1.2.1 基因富集分析 基因富集分析使用基因富集分析(gene set enrichment analysis,GSEA)識別LUAD 樣本和正常肺組織樣本的糖酵解相關(guān)基因是否存在顯著差異[11]。
1.2.2 差異基因表達(dá)分析 差異表達(dá)基因分析使用R 語言軟件中l(wèi)imma 包[12]篩選腫瘤組織和正常組織之間的差異表達(dá)基因(differentially expressed genes,DEGs),以|log2FC|>1,以P<0.05 為標(biāo)準(zhǔn)進(jìn)行篩選。
1.2.3 風(fēng)險(xiǎn)預(yù)測模型構(gòu)建 6 個(gè)基因風(fēng)險(xiǎn)預(yù)測模型構(gòu)建及評價(jià)使用R 語言軟件中g(shù)lmnet 包[13-14],將DEGs 擬合最小絕對收縮選擇算子(least absolute shrinkage and selection operator,LASSO)回歸模型,通過來自LASSO 回歸分析的系數(shù)和每個(gè)基因表達(dá)水平計(jì)算每例患者風(fēng)險(xiǎn)預(yù)后模型的評分(risk score),risk score=Σexpgenei* βi,根據(jù)作為臨界值的中位風(fēng)險(xiǎn)評分將所有LUAD 患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。使用R 語言軟件中survivalROC 包[15]基于風(fēng)險(xiǎn)評分預(yù)測患者生存情況,繪制Kaplan-Meier 生存曲線和ROC 曲線。
1.2.4 免疫細(xì)胞浸潤分析 免疫細(xì)胞浸潤分析為了探索高風(fēng)險(xiǎn)和低風(fēng)險(xiǎn)組中免疫細(xì)胞浸潤的差異,使用CIBERSORT 算法[16]評估基于表達(dá)文件的22 種免疫細(xì)胞亞型的比例。以P<0.05 為差異具有統(tǒng)計(jì)學(xué)意義。
1.2.5 列線圖構(gòu)建及驗(yàn)證 列線圖構(gòu)建及驗(yàn)證使用R 語言軟件中rms 包[17]和Cox 回歸分析,基于患者性別、年齡、分期(stage)、TNM 分期和風(fēng)險(xiǎn)評分構(gòu)建用于預(yù)測預(yù)后的列線圖。
應(yīng)用LASSO 回歸回歸分析,選擇最佳Lambda值,納入6 個(gè)預(yù)后相關(guān)基因,構(gòu)建預(yù)后風(fēng)險(xiǎn)評分模型。通過Kaplan-Meier 生存曲線分析高低風(fēng)險(xiǎn)組患者的生存情況。通過ROC 曲線評估不同時(shí)間點(diǎn)預(yù)后模型的預(yù)測價(jià)值。采用單因素和多因素Cox 回歸模型分析影響預(yù)后的因素。采用列線圖結(jié)合風(fēng)險(xiǎn)評分來預(yù)測患者1 年、2 年和3 年的生存概率。以P<0.05 為差異具有統(tǒng)計(jì)學(xué)意義。
本研究過分子特征數(shù)據(jù)庫(the molecular signature database,MsigDB)獲取了5 個(gè)糖酵解相關(guān)基因集,并對TCGA 數(shù)據(jù)庫的535 例LUAD 樣本和59 例正常肺組織樣本進(jìn)行GSEA 富集分析。根據(jù)|NES|>1,P<0.05,F(xiàn)DR<25% 為標(biāo)準(zhǔn)進(jìn)行篩選,最終篩選得BIOCARTA_GLYCOLYSIS_PATHWAY、HALLMARK_GLYCOLYSIS、REACTOME_GLYCOLYSIS 3個(gè)糖酵解相關(guān)基因集在LUAD 患者中被顯著富集(表1)。選擇此3 個(gè)基因集中275 個(gè)基因進(jìn)行后續(xù)分析。
表1 LUAD 患者中富集的基因集
對TCGA 來源的535 例LUAD 樣本和59 例正常肺組織的糖酵解相關(guān)基因表達(dá)進(jìn)行差異表達(dá)基因分析,鑒定出18 個(gè)差異表達(dá)基因(10 個(gè)下調(diào),8 個(gè)上調(diào))。通過LASSO 回歸分析從18 個(gè)糖酵解相關(guān)DEGs 中篩選出6 個(gè)基因(CITED2、SDC2、HS6ST2、ERO1A、PFKP、PFKFB3)構(gòu)建LUAD 預(yù)后風(fēng)險(xiǎn)評分模型(圖1)。
圖1 預(yù)后風(fēng)險(xiǎn)評分模型的構(gòu)建
根據(jù)6 個(gè)基因風(fēng)險(xiǎn)評分模型計(jì)算每例患者的風(fēng)險(xiǎn)評分。通過Kaplan-Meier 曲線分析,發(fā)現(xiàn)高風(fēng)險(xiǎn)組患者5 年死亡率顯著高于低風(fēng)險(xiǎn)組患者(P<0.0001,圖2A),且ROC 曲線分析結(jié)果顯示,1 年、2 年和3 年總生存期(overall survival,OS)的曲線下面積(area under the curve,AUC)分別為0.712、0.673、0.636(圖2B)。對風(fēng)險(xiǎn)評分模型進(jìn)行單因素和多因素Cox 回歸分析,在單因素Cox 回歸分析中,腫瘤分期(stage,P<0.001)、T 分 期(P<0.001)、N 分 期(P<0.001)、M 分 期(P=0.037)及風(fēng)險(xiǎn)評分(risk score,P<0.001)均與OS顯著相關(guān)(表2)。多因素Cox 回歸分析中,風(fēng)險(xiǎn)評分仍然是LUAD 患者的獨(dú)立預(yù)后因素(P=0.005,表2)。上述結(jié)果表明,該風(fēng)險(xiǎn)評分模型對患者的預(yù)后有較強(qiáng)的預(yù)測能力,可作為一個(gè)獨(dú)立的因素預(yù)測患者預(yù)后。
圖2 預(yù)后風(fēng)險(xiǎn)模型評估
表2 風(fēng)險(xiǎn)評分模型的單因素和多因素Cox 回歸分析
采用CIBERSORT 對高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組患者中22 種不同免疫細(xì)胞浸潤情況進(jìn)行分析。M1 型巨噬細(xì)胞在高風(fēng)險(xiǎn)組的浸潤比例更高(P<0.05,圖3),而激活的肥大細(xì)胞在低風(fēng)險(xiǎn)組的浸潤比例更高(P<0.01,表2),其他免疫細(xì)胞在兩組中有著相似的分布。
圖3 免疫細(xì)胞在高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組之間的差異
為了開發(fā)可以幫助臨床醫(yī)師預(yù)測患者OS 的臨床工具,最后構(gòu)建了一個(gè)包含年齡(age)、性別(gender)、腫瘤分期、TNM 分期及風(fēng)險(xiǎn)評分在內(nèi)的列線圖來預(yù)測患者1 年、2 年和3 年的生存率(圖4A)。ROC 分析的1 年、2 年和3 年AUC 值分別為0.749、0.751和0.718(圖4B),這與校準(zhǔn)曲線共同驗(yàn)證了列線圖對LUAD 患者預(yù)后有良好的預(yù)測性能(圖4C)。
圖4 列線圖的構(gòu)建和評估
LUAD 是全球癌癥相關(guān)死亡的最常見原因,但由于其表型和分子多樣性,很難預(yù)測其預(yù)后。亞型識別、風(fēng)險(xiǎn)分層對于改進(jìn)現(xiàn)有治療方法、開發(fā)更精確和個(gè)性化的療法以及延長患者的生存時(shí)間至關(guān)重要。因此本研究建立糖酵解相關(guān)的風(fēng)險(xiǎn)模型來預(yù)測LUAD 生存率,以提高預(yù)測的準(zhǔn)確性,并且為個(gè)性化治療奠定基礎(chǔ)。
本研究通過GSEA 分析,鑒別出3 個(gè)在LUAD中顯著富集的糖酵解相關(guān)基因集,進(jìn)一步對這3 個(gè)基因集中的基因進(jìn)行差異表達(dá)基因分析。正常肺組織相比有顯著性差異的基因用于構(gòu)建風(fēng)險(xiǎn)評分模型。LASSO回歸是一種機(jī)器學(xué)習(xí)算法,能夠更有效的處理復(fù)雜數(shù)據(jù)和識別潛在風(fēng)險(xiǎn)因素,構(gòu)建預(yù)后模型[18]。本研究用LASSO 回歸分析識別了6 個(gè)基因風(fēng)險(xiǎn)評分模型,根據(jù)風(fēng)險(xiǎn)評分將患者分為高、低風(fēng)險(xiǎn)組,進(jìn)一步通過Kaplan-Meier 曲線、ROC 曲線、單因素及多因素Cox回歸分析考察風(fēng)險(xiǎn)評分模型預(yù)測能力,結(jié)果顯示高風(fēng)險(xiǎn)組患者死亡率顯著高于低風(fēng)險(xiǎn)組患者,ROC 曲線提示該模型具有較好的短期預(yù)測能力。并且在單因素、多因素Cox 回歸分析中風(fēng)險(xiǎn)評分均是LUAD 患者的獨(dú)立預(yù)后因素;通過CIBERSORT 分析考察高、低風(fēng)險(xiǎn)組患者免疫細(xì)胞浸潤差異,發(fā)現(xiàn)M1 型巨噬細(xì)胞在高風(fēng)險(xiǎn)組的浸潤比例更高,而激活的肥大細(xì)胞在低風(fēng)險(xiǎn)組的浸潤比例更高,免疫細(xì)胞浸潤狀態(tài)可能與LUAD 患者的預(yù)后存在一定的聯(lián)系。Liu 等[19]研究發(fā)現(xiàn),差異表達(dá)的腫瘤浸潤細(xì)胞與LUAD 患者的OS 相關(guān),因此本研究分析了兩組的免疫細(xì)胞浸潤差異。據(jù)報(bào)道,基質(zhì)、免疫和微環(huán)境綜合特征與LUAD 患者的OS 相關(guān)[20]。對于腫瘤微環(huán)境中M1 型巨噬細(xì)胞及活化的肥大細(xì)胞與LUAD 患者預(yù)后的相關(guān)性,有研究[21]根據(jù)鐵死亡相關(guān)基因?qū)χ笖?shù)(ferroptosis-related gene-pair index,F(xiàn)RGPI)建立了另一種能夠預(yù)測LUAD 患者預(yù)后的模型,高FRGPI 提示不良的臨床預(yù)后,此模型中也顯示高FRGPI 組MI 型巨噬細(xì)胞浸潤程度較高。另一項(xiàng)研究[22]鑒定出了一種與LUAD 患者預(yù)后相關(guān)的基因,INTS7 mRNA 在LUAD 中的表達(dá)顯著上調(diào),早期LUAD 患者INTS7 高表達(dá)具有較短的OS,而INTS7 表達(dá)與活化肥大細(xì)胞浸潤呈負(fù)相關(guān),即INTS7高表達(dá)患者活化的肥大細(xì)胞浸潤程度較低,結(jié)果與本研究一致。本研究結(jié)合風(fēng)險(xiǎn)評分構(gòu)建列線圖,通過ROC 曲線及校準(zhǔn)曲線驗(yàn)證預(yù)測預(yù)后性能,結(jié)果表明列線圖具有良好的短期預(yù)測能力。
腫瘤細(xì)胞能量代謝過程中比正常細(xì)胞需要更多的葡萄糖,但是即使在氧氣充足的條件下,腫瘤細(xì)胞也更傾向于通過糖酵解而不是氧化磷酸化供能,這種現(xiàn)象被稱為Warburg 效應(yīng)[23]。有研究表明,糖酵解與腫瘤的發(fā)生發(fā)展、增殖、侵襲、遷移和耐藥等密切相關(guān)。CITED2(Cbp/p300 interacting transactivator with Glu/Asp-rich carboxy-terminal domain 2)是一種轉(zhuǎn)錄輔助因子[24],在癌癥相關(guān)的研究中發(fā)現(xiàn),其高表達(dá)與肺癌的不良預(yù)后相關(guān)[25]。SDC2(syndecan-2)是一種跨膜蛋白。SDC2 在LUAD 中表達(dá)上調(diào),并與LUAD 細(xì)胞較強(qiáng)的侵襲和轉(zhuǎn)移能力相關(guān)[26],并且是導(dǎo)致LUAD 腦轉(zhuǎn)移的關(guān)鍵基因[27]。HS6ST2(heparan sulfate 6-O-sulfotransferase 2)在甲狀腺癌[28]、結(jié)直腸癌[29]等多種腫瘤中上調(diào),并與患者不良預(yù)后相關(guān)[30],但其在LUAD 中的作用鮮見報(bào)道。ERO1(endoplasmic reticulum oxidase 1)是一種位于內(nèi)質(zhì)網(wǎng)的氧化酶。有報(bào)道ERO1 蛋白質(zhì)的高表達(dá)預(yù)示著早期LUAD 的不良預(yù)后[31]。PFKP(platelet type PFK)催化6-磷酸果糖轉(zhuǎn)化為1,6-二磷酸果糖,是糖酵解的一個(gè)關(guān)鍵步驟。有研究表明,PFKP 在肺癌組織和細(xì)胞系中高表達(dá),并與患者不良預(yù)后相關(guān),其表達(dá)水平降低會導(dǎo)致肺癌細(xì)胞增殖能力降低、細(xì)胞周期阻滯、葡萄糖攝取率降低、乳酸水平和ATP 濃度顯著降低[32]。PFKFB3(6-phosphofructo-2-kinase)屬于 PFKFB 家族,是糖酵解的關(guān)鍵酶之一。PFKFB3 蛋白質(zhì)的高表達(dá)是LUAD 的獨(dú)立預(yù)后標(biāo)志物,靶向PFKFB3 能夠抑制肺癌細(xì)胞活力、促進(jìn)細(xì)胞凋亡,導(dǎo)致細(xì)胞周期阻滯,抑制肺癌細(xì)胞的糖酵解、遷移和侵襲能力[33]。
本風(fēng)險(xiǎn)評分模型存在一定的局限性。影響LUAD 患者預(yù)后的因素諸多,如常規(guī)的用于評估臨床預(yù)后的指標(biāo)有,TNM 分期、年齡、表現(xiàn)狀態(tài)如ECOG評分等[34]。對于無法手術(shù)的晚期LUAD 患者,是否及時(shí)接受規(guī)范的治療以及治療方案的選擇對于預(yù)后的影響無疑更大,基于參與大型多機(jī)構(gòu)研究的患者樣本能夠提供最可靠的預(yù)后標(biāo)志物,特別是隨機(jī)安慰劑對照試驗(yàn)[35],大型隨機(jī)臨床試驗(yàn)?zāi)軌蛱峁└鼉?yōu)的治療方案,本模型對于晚期LUAD 患者預(yù)測預(yù)后的能力有限。對于能夠進(jìn)行手術(shù)的早期LUAD 患者,本模型主要有助于早期LUAD 術(shù)后患者進(jìn)行預(yù)后復(fù)發(fā)風(fēng)險(xiǎn)的判斷,可能對早期LUAD 術(shù)后患者是否積極進(jìn)行輔助治療具有一定的指導(dǎo)意義。類似模型評估肺癌預(yù)后的研究較多[21-22],本風(fēng)險(xiǎn)模型對于早期LUAD 術(shù)后患者預(yù)測預(yù)后尚存在一定的價(jià)值。另外,此研究也存在其他不確定性:1)所有的LUAD 患者均來自公共數(shù)據(jù)庫,仍需要在多中心的大規(guī)?;颊咧序?yàn)證該模型的性能;2)6 個(gè)風(fēng)險(xiǎn)基因在LUAD 中發(fā)揮的作用仍需要進(jìn)一步的實(shí)驗(yàn)驗(yàn)證。
總之,本研究建立與糖酵解相關(guān)的6 個(gè)基因風(fēng)險(xiǎn)評分模型,該模型有著良好的預(yù)測性能,可以幫助預(yù)測早期LUAD 患者的預(yù)后情況。該風(fēng)險(xiǎn)特征還可以用于開發(fā)新的LUAD 靶點(diǎn),推動(dòng)精準(zhǔn)醫(yī)療。