葉必成,繆夏曄,劉樹青
1徐州醫(yī)科大附屬淮安醫(yī)院消化內(nèi)科,江蘇淮安223001;2揚州大學醫(yī)學院
肝癌全球發(fā)病率在惡性腫瘤中居第六位,是腫瘤相關死亡的第四大原因[1]。肝細胞癌(HCC)是最常見的原發(fā)性肝癌,早期HCC患者的主要治療手段為外科手術切除,然而大部分患者在診斷時已為晚期,其對應的治療手段非常局限,因此預后極差。對于HCC患者預后的預測及治療方案的確定,臨床通常用AJCC分期、肝功能指標及AFP進行評估[2-3],然而相同分期的HCC患者預后也可能不同,且分子遺傳學也證明不同亞群的HCC患者預后有差異[4]。因此,有必要探尋一種新型的生物學標志物以有效評估HCC患者預后。CTL作為T細胞的重要組成部分,其表面受體主要為CD8,是抵抗腫瘤進展的主要免疫細胞[5]。先前一項研究通過規(guī)律間隔成簇短回文重復序列在小鼠癌細胞株(腎癌、乳腺癌、黑色素細胞瘤、結(jié)直腸癌)中確定了182個與CTL相關的基因(CRG),CRG增強或減弱了CTL對癌細胞的殺傷[6]。然而,CRG在HCC中的作用尚未被系統(tǒng)研究。本研究旨在觀察CRG在HCC的表達情況以及探索其與預后的關系,并基于這些基因構(gòu)建預后預測模型,以期有助于評估患者預后及臨床精準化治療。
1.1 資料來源 從TCGA(https://portal.gdc.cancer.gov/repository)下載371例HCC患者共424個樣本(包含50個癌旁樣本)的資料,其中3例HCC組織重復測序2次。下載時間:2017年6月—2021年1月。排除生存時間為0患者6例,共納入HCC患者365例。患者男246例、女119例;年齡16~90歲,中位年齡61歲;腫瘤分級G1級55例、G2級175例、G3級118例、G4級12例、未知5例;腫瘤分期Ⅰ期170例、Ⅱ期84例、Ⅲ期83例、Ⅳ期4例、未知24例;存在血管浸潤106例、無血管浸潤205例、未知54例;AFP≤200 ng/mL 201例、AFP>200 ng/mL 75例、AFP未知89例。
從ICGC(https://dcc.icgc.org/projects/LIRI-JP)下載231例HCC患者的RNA-seq數(shù)據(jù)和臨床資料,用作模型驗證。下載時間:2019年3月—2021年1月。該隊列患者未存在重復測序以及生存資料缺失,既往有乙型肝炎或丙型肝炎病史。患者男170例、女61例;年齡31~89歲,中位年齡69歲;腫瘤分期Ⅰ期36例、Ⅱ期105例、Ⅲ期71例、Ⅳ期19例。對于重復測序的HCC組織,取其基因表達譜數(shù)據(jù)的平均值。若有多個探針對應同一個基因,則該基因的表達量為這些探針的均值。以上數(shù)據(jù)均為公開數(shù)據(jù)。
1.2 差異表達CRG的篩選 應用“base”R軟件包中的“wilcox.test”函數(shù)對371例HCC組織和50例癌旁組織的CRG進行表達差異分析,篩選標準:錯誤發(fā) 現(xiàn) 率(FDR)<0.05且|log2Fold Change|≥1,F(xiàn)oldChange為差異倍數(shù)。
1.3 與總生存期(OS)相關CRG的篩選 將具有生存信息的365例HCC患者與各個CRG的表達數(shù)據(jù)進行合并,并用“base”R軟件包中的“coxph”函數(shù)對CRG進行基于OS以及生存狀態(tài)的單因素回歸分析,計算各個CRG的P值以及風險比(HR),P<0.05為與OS相關CRG。
1.4 預后預測模型的構(gòu)建與驗證 利用R軟件“base”包中的“intersect”函數(shù)確定既為差異表達又與OS相關的CRG,并使用“glmnet”R軟件包中的“glmnet”函數(shù)和“cv.glmnet”函數(shù)對這些基因進行基于OS以及生存狀態(tài)的Lasso-Cox回歸分析,其中maxit=1 000。計算經(jīng)Lasso-Cox回歸所確定的各個基因的系數(shù),并乘以這些基因?qū)谋磉_水平,所得結(jié)果之和為風險評分。以風險評分的中位數(shù)為截斷值,將TCGA隊列以及ICGC隊列的患者分為高危組和低危組。利用“survival”包的“survdiff”對高、低危組患者進行基于Kaplan-Meier法的生存分析,并進行Log-rank檢驗評估兩組的預后差異。利用“Rtsne”的“prcomp”和“Rtsne”函數(shù)對Lasso-Cox回歸所確定的基因進行PCA及t-SNE分析,以探索高、低危組患者分布情況。利用“timeROC”R軟件包的“timeROC”函數(shù)進行時間相關的ROC曲線分析,計算曲線下面積(AUC)。
1.5 基因本體(GO)富集分析、京都基因與基因組百科全書(KEGG)富集分析及單樣本基因集富集分析(ssGSEA) 利用“clusterProfiler”R軟件包的“enrichGO”函數(shù)以及“enrichKEGG”函數(shù)對TCGA隊列的高、低危組之間的差異表達基因進行GO以及KEGG富集分析,其中GO富集分析包括生物學過程(BP)、細胞組成(CC)以及分子功能(MF)。利用“gsva”R軟件包的“gsva”函數(shù)對TCGA隊列的高、低危組進行ssGSEA,以量化免疫細胞浸潤及免疫相關功能激活情況。
1.6 統(tǒng)計學方法 采用R4.0.2軟件。差異表達基因(DEG)的鑒定采用Wilcoxon檢驗,并用BH法對P值進行矯正,篩選標準為FDR<0.05且|log2 Fold Change|≥1。如上文無特殊規(guī)定,則P<0.05為差異有統(tǒng)計學意義。
2.1 與OS相關的差異表達CRG 共篩選出37個與OS相關的差異表達DRG。見圖1。
圖1 與OS相關差異表達CRG的篩選
2.2 基于TCGA隊列建立預后模型 Lasso-Cox回歸將上述37個DRG進行再次篩選,并使用交叉驗證建立模型,最終建立了基于6個CRG(ATG10、HDAC1、PIGU、AHSA1、CAD、CEP55)的預后預測模型,其風險評分的計算公式為0.384×ATG10表達值+0.076×HDAC1表 達值+0.270×PIGU 表 達 值+0.153×AHSA1表達值+0.208×CAD表達值+0.169×CEP55表達值。
2.3 預后預測模型的外部驗證結(jié)果 上述公式計算ICGC隊列的風險評分,并以風險評分的中位數(shù)作為截斷值將ICGC隊列的患者分為高危組和低危組??紤]到OS超過5年的患者僅2例,因此僅評估該模型對患者術后1~4年生存率的預測價值。ROC曲線顯示,該模型對患者術后1~4年預后預測的曲線下面積分別為0.70、0.70、0.74、0.74。
2.4 GO富集分析、KEGG富集分析及ssGSEA結(jié)果
2.4.1 GO富集分析結(jié)果 差異表達的DRG在淋巴細胞介導免疫、補體激活、細胞吞噬、離子通道活性相關分子功能等生物學過程富集。見表1。
表1 GO富集分析結(jié)果(BP、CC及MF的前5位)
2.4.2 KEGG富集分析結(jié)果 差異表達的DRG基因在細胞因子-細胞因子受體的相互作用、細胞周期及部分癌癥通路顯著富集。見表2。
表2 KEGG富集分析(前10位)
2.4.3 ssGSEA結(jié)果 高危組活化的樹突細胞(aDC)、未成熟的樹突細胞(iDC)、漿細胞樣樹突細胞(pDC)、抗原提呈細胞共刺激(APC co-stimulation)、主要組織相容性復合體Ⅰ型分子(MHC class I)富集評分(0.62、0.61、0.72、0.98分)高于低危組(中位數(shù)分別為0.60、0.60、0.68、0.97分),比較差異有統(tǒng)計學意義(P均<0.05);高危組Ⅰ型干擾素反應(Type I IFN Reponse)、Ⅱ型干擾素反應(TypeⅡIFN Reponse)、NK細胞富集評分(0.82、0.77、0.60分)較低危組(0.83、0.80、0.62分)低,高危組調(diào)節(jié)性T細胞(Treg)富集評分(0.81分)較低危組(0.80分)高(P<0.05),比較差異有統(tǒng)計學意義(P<0.05)。
越來越多的證據(jù)表明,腫瘤微環(huán)境是影響腫瘤發(fā)生發(fā)展的重要因素[7]。腫瘤微環(huán)境主要由癌細胞、基質(zhì)細胞、免疫細胞、趨化因子和細胞因子共同構(gòu)成[8],其中CTL是抵抗腫瘤進展的主要免疫效應細胞。然而,由于癌細胞不具有很強的免疫原性,因此CTL在腫瘤微環(huán)境中是被抑制的[9]。目前已開發(fā)了諸如免疫檢查點抑制劑(PD-1、PDL-1和CTLA4)等免疫療法用于促進CTL特異性免疫應答,然而對于HCC患者,PD-1及PDL-1的有效應答率卻不到20%[10]。因此識別HCC中影響CTL功能的關鍵基因至關重要。本研究綜合分析182個CRG,最終篩選了6個與OS顯著相關的關鍵CRG,并基于CRG構(gòu)建了HCC預后預測模型。該模型對患者術后1~4年預后預測的曲線下面積均≥0.70。提示該模型具有良好的預測效能。
本研究發(fā)現(xiàn),近30%的CRG在腫瘤組織與癌旁組織之間差異表達,單因素Cox回歸分析表明超過50%的CRG與OS相關,這進一步證明了CTL在HCC發(fā)生發(fā)展中起重要作用。最終篩選出6個與預后相關的關鍵CRG,即ATG10、HDAC1、PIGU、AHSA1、CAD、CEP55。除AHSA1和CAD以外,均存在相關研究報道,這些基因在HCC中高表達,并且與OS相關,與本研究的發(fā)現(xiàn)一致。ATG10,位于5q14.1,是細胞自噬啟動的必要條件[11]。JO等[12]報道ATG10表達增加與血管侵襲和淋巴結(jié)轉(zhuǎn)移相關。HDAC1是組蛋白去乙?;讣易宄蓡T之一,直接參與調(diào)控細胞自噬[13]。HDAC1的高表達促進了HCC細胞增殖并抑制HCC細胞凋亡[14]。PIGU是GPI-T復合物的一個重要亞基[15],GPI-T復合物在腫瘤的發(fā)生發(fā)展中起至關重要的作用。WEI等[16]的研究發(fā)現(xiàn),PIGU高表達不但促進了HCC細胞的增殖,遷移和侵襲,而且抑制了細胞凋亡。此外,他們還發(fā)現(xiàn),PIGU的下調(diào)顯著增強了NK-92細胞對HCC細胞的敏感性。AHSA1為HSP90的一個關鍵分子伴侶,參與致癌蛋白的成熟、穩(wěn)定、激活[17],其與HSP90構(gòu)成的復合體也被證實是細胞自噬通路的關鍵蛋白[18]。本研究首次發(fā)現(xiàn),AHSA1在HCC中高表達,并且與OS顯著相關,其在HCC的具體生物學作用尚未明確,我們將進一步研究證實。CAD是一個具有三個酶結(jié)構(gòu)域的多肽,包括氨基甲?;姿岷铣擅浮⑻於彼徂D(zhuǎn)氨甲酰酶及二氫乳清酸酶,為嘧啶從頭合成的關鍵酶[19]。CAD與腫瘤相關的報道較少,本研究首次發(fā)現(xiàn),CAD在HCC中高表達,并且與OS相關。CEP55,又名C10orf3,為中心體蛋白相關蛋白家族成員,其主要生物學功能為中心體復制、細胞周期及胞質(zhì)分裂[20]。自噬蛋白 NBR1通過識別 CEP55,進而招募自噬相關蛋白形成自噬體。LI等[21]發(fā)現(xiàn),CEP55通過調(diào)節(jié)JAK2-STAT3-MMPs信號通路來促進HCC細胞遷移和侵襲。除PIGU和CAD以外,以上基因均有報道證明直接或間接參與細胞自噬,細胞自噬有助于癌細胞逃避CTL的攻擊[6]。本研究進一步證實,在HCC中細胞自噬通路介導CTL相關免疫逃避的關鍵性,也揭示了細胞自噬在HCC在發(fā)生發(fā)展中起重要作用。然而,對以上CRG在HCC中作用的了解仍然有限,其影響HCC預后的分子機制以及對HCC患者臨床治療的意義有待進一步研究。
為進一步探索高危組患者預后差的潛在機制,本研究基于TCGA隊列的高、低危組進行了GO富集分析、KEGG富集分析及ssGSEA。本研究發(fā)現(xiàn),免疫相關通路、離子通道以及一些癌癥通路顯著富集。研究證明離子通道在T細胞的穩(wěn)定與活化發(fā)揮重要作用[22],這與本研究的發(fā)現(xiàn)一致。低危組和高危組的抗原提呈相關細胞及功能的富集得分存在顯著差異,表明腫瘤相關抗原在高危組更容易識別,但高危組患者預后更差,可能是與高危組的CTL功能下降有關。高危組的Tregs富集得分相對于低危組更高。Tregs顯著抑制CTL的功能,進一步證明了高危組的CTL功能被抑制。高危組的Ⅰ型干擾素反應、Ⅱ型干擾素反應及NK細胞富集得分較低危組低。因此,高危組患者抗腫瘤免疫力的減弱是其預后不良的主要因素。
綜上所述,本研究構(gòu)建的模型可有效預測HCC患者預后,有助于HCC患者預后預測體系的完善及臨床個體化治療方案的開發(fā)。