周靜 王心悅 李兆娜 蔣日成
肺癌是全球范圍內(nèi)癌癥相關(guān)死亡的主要原因,其5年生存率約為15%。非小細胞肺癌占所有肺癌的75%-80%。其中,肺腺癌是非吸煙者和女性中最常見的非小細胞肺癌亞型,其危險因素主要包括二手煙、污染和職業(yè)致癌物,并具有遺傳易感性[1]。盡管肺癌在化療和靶向治療方面已取得了很大的進展,但大多數(shù)患者的總生存率仍較低。其主要原因之一是大多數(shù)患者診斷時已處于晚期階段。目前臨床上常用的預(yù)測肺腺癌預(yù)后的指標包括腫瘤大小、轉(zhuǎn)移情況和突變負荷等,但腫瘤存在高度的異質(zhì)性,即使腫瘤原發(fā)灶-淋巴結(jié)-轉(zhuǎn)移(tumornode-metastasis, TNM)分期相同的患者,其治療效果和預(yù)后仍有很大差別,單純依靠上述指標有時并不能夠準確預(yù)測患者預(yù)后,特異性欠佳。因此,我們需要探索新的生物標志物,可以輔助上述常用的預(yù)測指標,可靠的評估腫瘤患者預(yù)后和生存情況,為肺腺癌個體化診療提供依據(jù)。
自噬是由一系列ARGs調(diào)控的多步驟的溶酶體降解過程,已被廣泛證實可參與多種癌癥的發(fā)生發(fā)展[2]。大量研究表明,自噬在腫瘤的發(fā)生和治療中是一把雙刃劍。一方面,自噬可在細胞癌變前降解受損的細胞器以維持細胞穩(wěn)態(tài)而發(fā)揮抑癌作用;另一方面,自噬可促進細胞代謝物質(zhì)循環(huán),滿足細胞營養(yǎng)需求,故在腫瘤發(fā)生晚期,自噬可為腫瘤細胞的增殖和侵襲提供能量和營養(yǎng),提高腫瘤細胞對放化療的耐受[3]。已有許多研究[4,5]表明,自噬與肺癌的發(fā)生發(fā)展密切相關(guān),如自噬相關(guān)基因10(ATG10)的過表達與肺癌的不良預(yù)后有關(guān)。盡管自噬在腫瘤治療中的作用仍有爭議,但已有證據(jù)[6,7]表明,自噬是LUAD放化療過程中關(guān)鍵的調(diào)控因子。
近幾年,基于多個基因所構(gòu)建的風險模型已被廣泛研究并用于預(yù)測各種腫瘤的預(yù)后,如結(jié)腸癌、乳腺癌、肝細胞癌等,在某些癌種中,其預(yù)后預(yù)測性能甚至優(yōu)于組織病理學(xué)診斷和腫瘤分期[8,9]。本研究利用生物信息學(xué),基于TCGA數(shù)據(jù)庫篩選對肺腺癌有預(yù)后價值的自噬相關(guān)基因,通過LASSO和Cox回歸分析最終構(gòu)建了由5個ARGs組成的肺腺癌的預(yù)后風險評分模型,評估模型的預(yù)測性能,確定模型的獨立預(yù)后價值和臨床相關(guān)性,為肺腺癌患者的個體化診療提供參考。
1.1 數(shù)據(jù)獲取 在GeneCards數(shù)據(jù)庫(https://www.genecards.org/)中檢索“Autophagy”獲得5,128個自噬相關(guān)基因。于2021年1月31日從TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)下載了全部的肺腺癌的3級RNA測序(RNA-Seq)數(shù)據(jù)。同時,從UCSC Xena網(wǎng)站(https://xenabrowser.net/)收集了這些患者相應(yīng)的臨床信息[包括性別、年齡、腫瘤大小、有無淋巴結(jié)轉(zhuǎn)移、腫瘤分期、表皮生長因子受體(epidermal growth factor receptor,EGFR)基因突變、ALK基因融合、KせS基因突變、生存時間及生存狀態(tài)]。排除臨床信息不完整的樣本后,共納入395例LUAD樣本和48例正常樣本。從基因表達綜合數(shù)據(jù)庫(Gene Expression Omnibus database, GEO)下載數(shù)據(jù)集GSE31210和GSE72094作為基因驗證集。本研究中,所有數(shù)據(jù)集均來自公共數(shù)據(jù)庫,無需倫理批準。
1.2 ARGs的差異表達分析和功能富集分析 利用R-4.0.3軟件中的“l(fā)imma”包篩選LUAD與正常肺組織間差異表達的ARGs,利用“edgeR”包對表達譜數(shù)據(jù)標準化,差異基因的篩選標準為:發(fā)現(xiàn)錯誤率(false discovery rate,FDR)<0.05和|log2(Fold Change)|>2。使用“ggplot2”和“pheatmap”包繪制火山圖和熱圖用于差異基因的可視化。通過生存分析確定差異表達ARGs與總生存期(overall survival, OS)的關(guān)系,設(shè)置閾值為P<0.05,初步篩選對肺腺癌有預(yù)后價值的差異表達自噬基因。利用R軟件的“clusterProfiler”和“enrichplot”等包對差異基因進行基因本體功能(Gene Ontology, GO)富集分析和京都基因與基因組百科全書通路(Kyoto Encyclopedia of Genes and Genomes pathway, KEGG)分析及可視化,以探討有預(yù)后價值的差異表達ARGs的潛在分子機制。P<0.05被認為差異有統(tǒng)計學(xué)意義。
1.3 構(gòu)建預(yù)后風險模型 通過log2(x+1)轉(zhuǎn)換對RNA-Seq數(shù)據(jù)進行標準化,將差異表達ARGs的標準化表達量與LUAD樣本生存信息合并,去除無生存時間記錄的患者后,共381例LUAD樣本納入Cox回歸分析。對有預(yù)后價值的ARGs進行單因素Cox回歸分析、LASSO回歸和多因素Cox回歸分析并繪制森林圖。LASSO回歸可減少基因之間的共線性影響,降低后續(xù)所構(gòu)建模型基因的過度擬合。在R軟件中加載“glmnet”包,對經(jīng)單因素Cox分析所獲得的預(yù)后相關(guān)ARGs進行LASSO回歸分析,將回歸系數(shù)不為0的基因再納入多因素Cox分析,構(gòu)建最終的預(yù)后風險評分模型。風險評分(RiskScore)計算公式為:RiskScore=基因表達量1×Coef1+基因表達量2×Coef2+…+基因表達量n×Coefn(Coef:基因在多因素Cox回歸分析中的回歸系數(shù),n:與預(yù)后相關(guān)ARGs總數(shù)目)。根據(jù)公式計算每位患者的風險評分,利用R軟件的“pROC”包繪制受試者工作特征(receiver operator characteristic, ROC)曲線計算約登指數(shù)(Youden index),以確定風險評分的最佳截斷(cut-off)值。以cut-off值為截斷值將肺腺癌患者分為高風險評分和低風險評分組。
1.4 評價預(yù)后風險模型 加載R軟件“survival”包,根據(jù)上述分組繪制高、低風險評分分布曲線、生存情況分布圖及建模基因表達量熱圖。同時,利用R軟件的“survminer”包繪制Kaplan-Meier生存曲線對兩組的OS進行生存分析比較。應(yīng)用“timeROC”包繪制時間依賴性ROC曲線,分別計算樣本OS在1年、2年、3年、5年、7年的AUC,從而評估模型預(yù)測預(yù)后的能力,AUC越高代表模型性能越好。
1.5 模型獨立預(yù)后及臨床特征相關(guān)性分析 對風險評分進行單因素和多因素Cox回歸分析,以確定模型是否具有獨立預(yù)后價值。若風險評分與OS在單因素和多因素Cox分析中均呈現(xiàn)顯著差異,則說明風險評分可作為獨立危險因素。將通過單因素和多因素分析識別出的獨立危險因素作為變量,加載“rms”包,繪制列線圖,用以推測患者未來的生存率。同時,分析風險評分是否對不同臨床特征患者的預(yù)后也具有預(yù)測性能。
1.6 驗證預(yù)后風險模型 在GEO數(shù)據(jù)庫選取GSE31210和GSE72094作為外部驗證集,根據(jù)上述風險評分公式,計算驗證集中每個樣本的風險評分。同樣地,利用ROC曲線,確定兩個數(shù)據(jù)集各自風險評分的最佳cut-off值,進行高、低風險分組,應(yīng)用Kaplan-Meier生存曲線對兩組的OS進行比較,AUC評估模型預(yù)測預(yù)后的能力,以驗證預(yù)后風險模型的預(yù)測性能。
2.1 差異表達自噬基因的篩選及功能富集分析 從GeneCards數(shù)據(jù)庫中共收集5,786個自噬相關(guān)基因。從TCGA數(shù)據(jù)庫共收集395個肺腺癌組織和48個正常組織的mRNA表達數(shù)據(jù)。提取5,786個ARGs的mRNA表達數(shù)據(jù),以FDR<0.05和|log2(Fold Change)|>2為閾值,在肺腺癌與正常肺組織中共篩選出361個差異表達的ARGs,包括275個上調(diào)基因和86個下調(diào)基因,差異基因可視化結(jié)果如圖1A、圖1B所示。對上述361個差異基因進行生存分析,篩選出52個與預(yù)后顯著相關(guān)的ARGs(P<0.05)。對52個有預(yù)后價值的差異表達ARGs進行GO功能及KEGG通路富集分析,GO功能富集結(jié)果顯示,差異表達ARGs主要富集在調(diào)控染色體分離、調(diào)控受體介導(dǎo)的內(nèi)吞、調(diào)控細胞周期和調(diào)控自噬等(P<0.05,圖2A);KEGG信號通路主要富集在細胞周期、細胞因子受體相互作用、IL-17信號通路、自噬、HIF-1信號通路和p53信號通路等(P<0.05,圖2B)。
圖 1 自噬相關(guān)基因的差異分析。A:差異表達基因火山圖(275個上調(diào)基因和86個下調(diào)基因);B:差異表達基因表達熱圖。Fig 1 Differential analysis of autophagy related genes. A: Volcano plot of differentially expressed genes (275 up-regulated genes and 86 down-regulated genes); B: Heat map of differentially expressed genes.
圖 2 功能富集分析和預(yù)后風險評分模型的構(gòu)建。A:GO富集分析;B:KEGG通路富集分析;C:單因素Cox回歸分析結(jié)果森林圖;D:LASSO分析;E:多因素Cox回歸分析結(jié)果森林圖。Fig 2 Functional enrichment analysis and construction of prognostic risk score model. A: GO enrichment analysis; B: KEGG pathway enrichment analysis; C: The forest plots of univariate Cox regression analysis; D: LASSO analysis; E: The forest plot of multivariate Cox regression analysis results.GO: Gene Ontology; KEGG: Kyoto Encyclopedia of Genes and Genomes pathway.
2.2 Cox分析及風險模型構(gòu)建 對52個與預(yù)后顯著相關(guān)的ARGs進行單因素Cox分析,得到7個與預(yù)后顯著相關(guān)的自噬基因ADAM12、CAMP、DKK1、FAM83A、GJB2、STRIP2和TFAP2A(P<0.05,圖2C)。對上述7個ARGs進行LASSO回歸分析識別更穩(wěn)定的基因,虛線標注處為logλ最小值,該處對應(yīng)的基因為最佳建?;颍琇ASSO回歸系數(shù)均不為0,如圖2D所示,虛線右側(cè)為篩選出可作為最佳建?;虻?個穩(wěn)定基因。經(jīng)進一步多因素Cox回歸分析,我們最終得到5個與肺腺癌預(yù)后顯著相關(guān)的自噬基因,構(gòu)成了肺腺癌預(yù)后風險評分模型,分別是ADAM12(ADAM metallopeptidase domain 12,Coef=0.042)、CAMP(Cathelicidin Antimicrobial Peptide,Coef=-0.081)、DKK1(Dickkopf WNT signaling pathway inhibitor 1, Coef=0.036)、STRIP2(striatin interacting protein 2, Coef=0.027)和TFAP2A(transcription factor AP-2 Alpha,Coef=0.039)(圖2E)。其中CAMP的風險比(hazar ratio, HR)<1,提示低表達與高風險有關(guān);ADAM12、DKK1、STRIP2和TFAP2A的HR>1,提示高表達與高風險有關(guān),5個基因的生存分析如圖3A-圖3E所示。根據(jù)5個ARGs的風險系數(shù)和mRNA表達量計算每個樣本的風險評分,風險評分(RiskScore)計算公式為:(0.042* ADAM12表達量)+(-0.081* CAMP表達量)+(0.036* DKK1表達量)+(0.027* STRIP2表達量)+(0.039* TFAP2A表達量)。
圖 3 5個建?;虻纳娣治?。A:ADAM12的生存曲線;B:CAMP的生存曲線;C:DKK1的生存曲線;D:STRIP2的生存曲線;E:TFAP2A的生存曲線。Fig 3 Survival analysis of 5 signature genes. A: The survival curve of ADAM12; B: The survival curve of CAMP; C: The survival curve of DKK1; D: The survival curve of STRIP2; E: The survival curve of TFAP2A.
2.3 風險模型性能評價 根據(jù)5個ARGs的表達量及回歸系數(shù)計算出每個肺腺癌樣本的風險評分,繪制ROC曲線得到風險評分的最佳cut-off值為1.057,以此將患者分為高風險評分組(N=154)和低風險評分組(N=227)??梢暬治鼋Y(jié)果顯示,紅色代表高風險評分組,藍色代表低風險評分組(圖4A)。高風險評分組患者死亡比例較低風險組更高,說明高風險評分組更易具有不良預(yù)后(圖4B)。ADAM12、DKK1、STRIP2和TFAP2A在高風險評分組高表達,提示高表達與高風險呈正相關(guān);CAMP在高風險評分組低表達,提示低表達與高風險呈正相關(guān)(圖4C),與圖3A-圖3E生存分析結(jié)果一致。Kaplan-Meier生存曲線表明,高風險評分患者OS明顯較低風險評分患者低,二者OS有顯著差異(P<0.000,1,圖4D)。時間依賴性ROC曲線結(jié)果如圖4E所示,1年時間AUC為0.78,2年AUC為0.71,3年時間AUC為0.67,5年時間AUC為0.62,7年時間AUC為0.65。上述評價結(jié)果表明,該風險評分模型對肺腺癌預(yù)后預(yù)測有較好的敏感性和特異性。
圖 4 預(yù)后風險評分模型的性能評估。A:風險曲線;B:生存狀態(tài)圖;C:建模基因表達熱圖;D:Kaplan-Meier生存曲線;E:時間ROC曲線。Fig 4 Performance evaluation of prognostic risk score model. A: Risk curve; B: The survival status chart; C: The heatmap of the five signature genes expression profiles; D: Kaplan-Meier survival curve; E: Time ROC curve.
2.4 風險評分具有獨立預(yù)后價值 風險評分在單因素和多因素Cox回歸分析結(jié)果均呈現(xiàn)顯著差異,說明風險評分具有獨立預(yù)后價值,可作為LUAD患者的獨立預(yù)后預(yù)測因子。將年齡、性別、腫瘤分期、EGFR基因突變、ALK基因融合、KRAS基因突變和風險評分作為變量納入單因素和多因素Cox回歸分析。單因素Cox分析顯示,風險評分和腫瘤分期是LUAD患者的預(yù)后危險因素(P<0.05,圖5A)。再將上述2個危險因素納入多變量Cox分析,結(jié)果顯示風險評分和腫瘤分期均是LUAD患者的獨立預(yù)后危險因素(P<0.05,圖5B)。Nomogram圖得分可用于推測患者未來1年、3年、5年的生存率(圖5C)。
圖 5 預(yù)后風險評分模型的獨立預(yù)后價值。A:單因素Cox獨立預(yù)后分析;B:多因素Cox獨立預(yù)后分析;C:Nomogram圖。Fig 5 Independent prognostic value of prognostic risk scoring models. A: Univariate Cox independent prognostic analysis; B: Multivariate Cox independent prognostic analysis; C: Nomogram plot.
2.5 風險評分與臨床特征相關(guān)性 我們利用TCGA-LUAD數(shù)據(jù)集的數(shù)據(jù)進一步研究該模型是否對不同臨床特征患者的預(yù)后也具有預(yù)測性能,包括性別、年齡、腫瘤大小、有無淋巴結(jié)轉(zhuǎn)移、腫瘤分期、EGFR基因突變、ALK基因融合、KRAS基因突變和生存狀態(tài)。分析結(jié)果:T3期-T4期患者較T1-T2期患者的風險評分高且兩組之間存在顯著差異(P<0.05,圖6C);T3期-T4期腫瘤患者較T1期-T2期腫瘤))))患者的風險評分高且兩組之間存在顯著差異(P<0.05,圖6B);死亡患者較生存患者的風險評分高且兩組之間存在顯著差異(P<0.001,圖6A);而在不同性別、不同年齡階段、有無淋巴結(jié)轉(zhuǎn)移、有無EGFR基因突變、有無ALK基因融合,及有無KRAS基因突變患者的風險評分未出現(xiàn)顯著差異。上述結(jié)果說明,風險評分與T分期、腫瘤分期和發(fā)生不良預(yù)后密切相關(guān)。
圖 6 臨床相關(guān)性分析。A:風險評分與生存狀態(tài)的臨床相關(guān)性;B:風險評分與腫瘤分期的臨床相關(guān)性;C:風險評分與T分期的臨床相關(guān)性。*P<0.05,***P<0.001。Fig 6 Clinical characteristic correlation analysis. A: The clinical correlation between risk score and survival status; B: The clinical correlation between risk score and tumor stage; C: The clinical association between risk score and T staging. *P<0.05, ***P<0.001.
2.6 外部數(shù)據(jù)集驗證模型 在GEO數(shù)據(jù)庫中選取GSE31210和GSE72094數(shù)據(jù)集及作為外部驗證集。GSE31210和GSE72094數(shù)據(jù)集的風險評分cut-off值分別為0.878和1.009,上述兩個驗證集的Kaplan-Meier生存曲線均表明,高風險評分患者OS較低風險評分患者更低,二者OS有顯著差異(圖7B,P=0.014;圖7D,P<0.000,1)。兩個驗證集的1年-5年AUC值在0.61-0.88,說明該模型在外部驗證集中仍具有較好的預(yù)測性能(圖7A,圖7C)。
圖 7 預(yù)后風險評分模型在外部驗證集中的性能評估。A:GSE31210的時間ROC曲線;B:GSE31210的Kaplan-Meier生存曲線;C:GSE72094的時間ROC曲線;D:GSE72094的Kaplan-Meier生存曲線。Fig 7 Performance evaluation of prognostic risk score model in external validation sets. A: Time ROC curve of GSE31210; B: Kaplan-Meier survival curve of GSE31210; C: The time ROC curve of GSE72094; D: Kaplan-Meier survival curve of GSE72094.
研究[10]表明自噬參與肺腺癌的發(fā)生發(fā)展,可以滿足腫瘤細胞高代謝的需求,在腫瘤的生長和侵襲中發(fā)揮重要作用。自噬是肺腺癌治療過程中耐藥的關(guān)鍵調(diào)控因子,抑制自噬可激活EGFR突變從而提高Afatinib在肺腺癌中的抗腫瘤活性[11]。抑制自噬還可以提高Shh抑制劑vismodegib對LUAD的療效[12]。
本研究通過GeneCard數(shù)據(jù)庫收集ARGs,利用來自TCGA的肺腺癌RNA-seq數(shù)據(jù)和生存信息,篩選出52個有預(yù)后價值的ARGs,經(jīng)GO和KEGG富集分析提示這些基因主要富集在調(diào)控細胞周期、參與自噬、參與HIF-1信號通路和p53信號通路等功能。通過單因素Cox回歸分析、LASSO回歸和多因素Cox回歸分析篩選出5個關(guān)鍵ARGs(ADAM12、CAMP、DKK1、STRIP2和TFAP2A),構(gòu)建了肺腺癌預(yù)后風險評分模型。ADAM12的分泌形式在肺癌中高表達,可促進腫瘤細胞的增殖、遷移和侵襲[13]。沉默ADAM12可通過激活人絨毛膜癌JEG-3細胞自噬促進細胞凋亡。抑制ADAM12可降低小細胞肺癌細胞增殖,促進細胞凋亡[14]。CAMP是體內(nèi)的一種宿主免疫肽,具有抗腫瘤作用。CAMP的C端肽LL-37是體內(nèi)唯一的抗菌肽,在細胞趨化、血管生成、免疫介質(zhì)誘導(dǎo)和炎癥反應(yīng)調(diào)節(jié)中發(fā)揮重要作用[15]。有研究[16,17]發(fā)現(xiàn),LL-37在正常結(jié)腸黏膜中表達強烈,在結(jié)腸癌組織中表達下調(diào),LL-37可誘導(dǎo)結(jié)腸癌細胞凋亡和自噬性死亡,具有獨特的抗腫瘤發(fā)生作用。DKK1是Wnt信號的負調(diào)控因子,是β-catenin/TCF通路的一個靶點,DDK1可通過抑制Wnt-CTNNB1信號通路誘導(dǎo)自噬[18,19]。STRIP2可調(diào)節(jié)多種腫瘤細胞的生長和遷移。STRIP2在肺腺癌中高表達,通過調(diào)控AKT/mTOR通路和上皮-間質(zhì)轉(zhuǎn)化促進肺腫瘤的增殖和侵襲[20]。TFAP2A在多種癌癥中均異常表達,例如,TFAP2A在人鼻咽癌中過表達,通過調(diào)節(jié)HIF-1α介導(dǎo)的VEGF/PEDF信號通路促進腫瘤的發(fā)生[21]。既往研究[22]發(fā)現(xiàn)TFAP2A可誘導(dǎo)KRT16過表達,通過EMT促進肺腺癌的發(fā)生發(fā)展。
上述5個風險ARGs的生存分析和風險評分分布圖提示,CAMP基因低表達和ADAM12、DKK1、STRIP2、TFAP2A基因高表達患者的風險評分高,更易發(fā)生預(yù)后不良(P<0.05)。通過繪制風險評分分布、Kaplan-Meier生存曲線證明高風險評分較低風險評分患者的預(yù)后更差,1年、2年、3年、5年和7年時間AUC證明模型對肺腺癌預(yù)后預(yù)測有較好的敏感性和特異性,并在外部數(shù)據(jù)集GSE31210和GSE72094得到驗證,證明模型的預(yù)測性能具有一定的準確性。同時,我們還對風險評分和其他臨床預(yù)測指標進行了單因素和多因素Cox回歸分析,證明了風險評分具有獨立預(yù)后價值,可作為LUAD患者的獨立預(yù)后預(yù)測因子。TNM分期是國際公認的臨床預(yù)后預(yù)測指標,盡管從單因素和多因素Cox分析上看風險評分(P<0.001)較腫瘤分期(P=0.018)更有優(yōu)勢,但尚不能說明本模型一定優(yōu)于TNM分期的預(yù)測能力。因為本模型尚處于初步建立階段,且為回顧性研究,樣本量較少,仍需要大規(guī)模的前瞻性臨床試驗數(shù)據(jù)來驗證其預(yù)測能力是否較TNM分期更好。待完善基礎(chǔ)實驗后,未來在臨床應(yīng)用中或可與TNM分期聯(lián)合應(yīng)用于肺腺癌患者的預(yù)后預(yù)測。風險評分與臨床特征相關(guān)性分析結(jié)果提示,風險評分高低與T分期、腫瘤分期和發(fā)生不良預(yù)后密切相關(guān),但它們之間的因果關(guān)系仍需進一步探索。同時,有無EGFR、ALK、KRAS基因突變,在單因素和多因素Cox 回歸分析,以及與風險評分進行相關(guān)性分析中均未呈現(xiàn)顯著差異,此結(jié)果可能與臨床中的觀察并不吻合。分析其原因,可能為包含基因突變信息的樣本量較少所導(dǎo)致。
綜上所述,本研究通過LASSO和Cox回歸分析構(gòu)建了基于自噬相關(guān)基因組肺腺癌的預(yù)后風險評分模型,該模型的預(yù)測性能穩(wěn)定,具有的獨立預(yù)后價值和臨床相關(guān)性,可輔助為LUAD患者的個體化診療提供參考。與同類研究相比,本研究的LUAD預(yù)后風險評分模型存在如下特點:首先,許多同類研究是以免疫為背景,構(gòu)建免疫相關(guān)基因(immune related genes, IRGs)風險模型以預(yù)測LUAD患者的預(yù)后[23,24]。然而,很少有預(yù)測模型以ARGs為基礎(chǔ)構(gòu)建預(yù)后預(yù)測模型。許多ARGs可調(diào)控腫瘤的發(fā)生發(fā)展,腫瘤組織中ARGs的表達情況在預(yù)測生存預(yù)后方面具有很大的前景,這些ARGs可作為新的分子靶點。因此,本研究以自噬為背景,篩選與預(yù)后顯著相關(guān)的ARGs,并構(gòu)建了包含多個ARGs的風險評分模型來預(yù)測LUAD患者的生存預(yù)后。同時,用于建模的風險基因也可作為LUAD基礎(chǔ)研究和潛在的治療靶點。因此,本研究補充了ARGs風險評分模型在LUAD中的研究空白,以實現(xiàn)對LUAD患者更精準的預(yù)后評估,為其個性化治療提供重要參考。其次,本研究通過2個外部數(shù)據(jù)集驗證所構(gòu)建的風險模型的可靠性。通過對風險模型的預(yù)測效能驗證(AUC均值>0.600),證明該模型在其他獨立數(shù)據(jù)集中也具有中等程度的預(yù)測性能,而上述前人研究中并未在多個數(shù)據(jù)集中進行驗證。遺憾的是,我們的研究仍存在一些局限性。首先,本研究中分析的所有數(shù)據(jù)均來自公共數(shù)據(jù)庫,所構(gòu)建的風險模型仍需大規(guī)模的臨床試驗以評估其預(yù)測效能;其次,本研究用于建模的風險基因尚缺少體內(nèi)、體外實驗進一步驗證。
Author contributions
Zhou J conceived and designed the study. Li ZN collected the data. Zhou J and Wang XY performed the bioinformatics analysis. Zhou J, Li ZN and Wang XY wrote the manuscript. Jiang RC provided critical inputs on design, analysis, and interpretation of the study. All the authors had access to the data. All authors read and approved the final manuscript as submitted.