趙小樂(lè),錢波,邵泉,
肝癌是全球最常見(jiàn)的惡性腫瘤之一,發(fā)病率全球排名第五,男性死亡率排名第二[1]。盡管早期肝癌患者可行腫瘤切除、肝移植等手術(shù)治療,但由于供體短缺等原因,大多數(shù)患者仍不適用。很多患者被診斷為疾病晚期,因此錯(cuò)過(guò)了接受外科手術(shù)等根治性治療的機(jī)會(huì)。此外,對(duì)于接受手術(shù)切除的患者,復(fù)發(fā)仍然是一個(gè)主要問(wèn)題,而且50%復(fù)發(fā)的患者在一年內(nèi)死亡[2-3]。由于復(fù)雜的病因及高復(fù)發(fā)性使肝癌預(yù)后預(yù)測(cè)具有挑戰(zhàn)性,考慮到肝癌治療策略有限,因此還需要開(kāi)發(fā)新的預(yù)后模型。
隨著微陣列技術(shù)和高通量測(cè)序技術(shù)的發(fā)展,人們現(xiàn)在能夠通過(guò)生物信息學(xué)分析來(lái)識(shí)別與腫瘤預(yù)后和進(jìn)展相關(guān)的關(guān)鍵基因,并在此基礎(chǔ)上發(fā)現(xiàn)了許多預(yù)后標(biāo)志物,建立了各種預(yù)后模型[4-5]。銅離子參與體內(nèi)眾多生化反應(yīng),當(dāng)體內(nèi)銅離子過(guò)高時(shí),會(huì)對(duì)細(xì)胞產(chǎn)生毒性,改變氧化還原狀態(tài)。有研究表明,與健康人群相比,癌癥患者的血清銅水平升高,并與疾病的嚴(yán)重程度和對(duì)治療的反應(yīng)相關(guān)[6]。最近,一種不同于已知細(xì)胞死亡機(jī)制的新型細(xì)胞死亡方式引起人們廣泛關(guān)注,它主要通過(guò)銅離子與線粒體中的三羧酸循環(huán)中的脂?;煞种苯咏Y(jié)合,從而導(dǎo)致脂酰化蛋白質(zhì)聚集和隨后的鐵硫簇蛋白下調(diào),最終使得蛋白質(zhì)毒性應(yīng)激并導(dǎo)致細(xì)胞死亡[7-8],并且從中發(fā)現(xiàn)了幾個(gè)與銅死亡相關(guān)的基因,這可能為預(yù)測(cè)肝癌患者的預(yù)后提供新的策略。
本研究采用生物信息學(xué)的方法分析銅死亡相關(guān)基因在肝癌與正常組織中的差異表達(dá),利用聚類分析和LASSO回歸分析篩選出與預(yù)后相關(guān)的基因并構(gòu)建風(fēng)險(xiǎn)預(yù)測(cè)模型,以期為肝癌患者早期診斷和預(yù)后評(píng)估提供參考依據(jù)。
從腫瘤基因組圖譜(TCGA)數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/)下載了371例肝癌患者腫瘤組織和50例正常肝組織的RNA測(cè)序(RNA-seq)數(shù)據(jù)集和臨床資料。采用R軟件“Limma”包對(duì)轉(zhuǎn)錄組基因表達(dá)譜進(jìn)行預(yù)處理。臨床資料主要包括患者的年齡、性別、腫瘤分級(jí)、腫瘤分期、生存時(shí)間和生存狀態(tài)等信息。此外,為了減少該分析中潛在的統(tǒng)計(jì)偏差,排除了生存時(shí)間未知且無(wú)生存狀態(tài)的患者。
選擇目前已知的10個(gè)銅死亡相關(guān)基因,提取這10個(gè)基因的表達(dá)矩陣,并使用Wilcoxon秩和檢驗(yàn)進(jìn)行組間差異表達(dá)分析。利用“corrplot”軟件包進(jìn)行相關(guān)性分析,基于“pheatmap”軟件包繪制熱圖。
移除50例正常組織樣本,使用“Consensus-ClusterPlus”軟件包對(duì)肝癌患者進(jìn)行一致性聚類分析,將其分成Cluster1和Cluster2組,分析不同的臨床特征和總體生存率在兩組聚類中是否存在差異。
使用“survival”軟件包進(jìn)行單因素Cox回歸分析篩選預(yù)后相關(guān)基因,使用LASSO回歸分析以消除假陽(yáng)性預(yù)后相關(guān)銅死亡基因,使用“glmnet”和“survival”軟件包,計(jì)算基因之間的相關(guān)回歸系數(shù),根據(jù)回歸系數(shù)加權(quán)建立肝癌預(yù)后風(fēng)險(xiǎn)評(píng)估公式:
公式中n指基因數(shù)量,Expi表示每個(gè)基因的表達(dá)量,Coei表示回歸系數(shù)。根據(jù)不同樣品中特征基因的表達(dá),為每例患者分配風(fēng)險(xiǎn)評(píng)分,根據(jù)評(píng)分中位值將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,通過(guò)Kaplan-Meier曲線和計(jì)算ROC曲線下的面積(AUC)評(píng)估風(fēng)險(xiǎn)評(píng)分的預(yù)后意義和診斷效能。將性別、年齡、TNM分期、組織學(xué)分級(jí)和風(fēng)險(xiǎn)評(píng)分納入單因素和多因素Cox回歸中,分析多種臨床特征干擾下風(fēng)險(xiǎn)評(píng)分的預(yù)后獨(dú)立性,并通過(guò)“forestplot”軟件包的森林圖可視化每個(gè)變量的P值、風(fēng)險(xiǎn)比(HR)和95%CI。
為了獲得與疾病發(fā)生發(fā)展所涉及的生物學(xué)功能和信號(hào)通路,使用仙桃學(xué)術(shù)平臺(tái)(https://www.xiantao.love/)進(jìn)行注釋和可視化,對(duì)5個(gè)銅死亡相關(guān)基因進(jìn)行基因本體(GO)分析和京都基因組百科全書(shū)(KEGG)通路分析。
采用R語(yǔ)言(4.1.3)軟件進(jìn)行統(tǒng)計(jì)分析。采用Wilcoxon秩和檢驗(yàn)進(jìn)行兩組之間基因差異分析。Spearman相關(guān)檢驗(yàn)分析基因表達(dá)間的相關(guān)性。Kaplan-Meier法繪制生存曲線。ROC曲線評(píng)估預(yù)后模型的敏感度和特異性。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
在TCGA隊(duì)列中,肝癌組織和正常組織樣本之間10個(gè)銅死亡相關(guān)基因的表達(dá)差異均有統(tǒng)計(jì)學(xué)意義(P<0.05),其中FDX1在肝癌組織中下調(diào),其余9個(gè)基因表達(dá)上調(diào),見(jiàn)圖1A~B。相關(guān)性分析顯示,大部分銅死亡相關(guān)基因都呈正相關(guān),其中LIPT1與MTF1呈現(xiàn)最強(qiáng)正相關(guān)(r=0.46);而FDX1與CDKN2A(r=-0.24),F(xiàn)DX1與LIPT1(r=-0.2)呈顯著負(fù)相關(guān),見(jiàn)圖1C。
圖1 銅死亡相關(guān)基因在肝癌中的表達(dá)水平及其相關(guān)性Figure 1 Expression level and correlation of cuprotosis-related genes in liver cancer
根據(jù)銅死亡相關(guān)基因的表達(dá)譜,對(duì)TCGA數(shù)據(jù)庫(kù)中371例肝癌樣本進(jìn)行聚類分析。當(dāng)k=2時(shí),肝癌樣本組內(nèi)相關(guān)性最高,組間相關(guān)性較低,聚類效果穩(wěn)定,確定了2個(gè)肝癌亞型,見(jiàn)圖2A~C。Cluster1的生存時(shí)間明顯短于Cluster2(P<0.05),見(jiàn)圖2D。此外,Cluster1與診斷時(shí)較高的分期(P<0.01)和較高的死亡狀態(tài)(P<0.05)顯著相關(guān),而與腫瘤分級(jí)、年齡、性別無(wú)關(guān)(P>0.05),見(jiàn)圖2E。
圖2 一致性聚類分析銅死亡相關(guān)基因Figure 2 Consistent cluster analysis of cuprotosis-related genes
移除所有生存時(shí)間未知且無(wú)生存狀態(tài)的樣本后,共有365例肝癌樣本與具有完整生存信息的相應(yīng)患者匹配。將所有銅死亡相關(guān)基因納入單因素Cox回歸模型中,篩選得到5個(gè)基因(LIPT1、DLAT、MTF1、GLS、CDKN2A)均為HR>1(且P<0.05)的危險(xiǎn)基因,見(jiàn)圖3A。通過(guò)LASSO回歸分析進(jìn)一步減少風(fēng)險(xiǎn)模型中包含的基因數(shù)量,最終5個(gè)基因全部被納入風(fēng)險(xiǎn)模型中,見(jiàn)圖3B~C。風(fēng)險(xiǎn)評(píng)分計(jì)算如下:風(fēng)險(xiǎn)評(píng)分=(0.293×LIPT1exp)+(0.064×DLATexp)+(0.031×MTF1exp)+(0.013×GLSexp)+(0.041×CDKN2Aexp)。根據(jù)風(fēng)險(xiǎn)評(píng)分公式計(jì)算的中位值將患者分為高危組和低危組。Kaplan-Meier生存曲線結(jié)果表明高危組在肝癌患者中的生存率較差,見(jiàn)圖3D,隨著風(fēng)險(xiǎn)評(píng)分的上升,死亡的患者例數(shù)明顯上升(P<0.05),這表明風(fēng)險(xiǎn)評(píng)分和生存時(shí)間顯著相關(guān),見(jiàn)圖3E。ROC曲線分析顯示該模型預(yù)測(cè)肝癌患者術(shù)后1、3、5年生存率的AUC值分別為 0.733、0.646、0.635,見(jiàn)圖3F。
圖3 篩選獨(dú)立預(yù)后因素Figure 3 Screening of independent prognostic factors
單因素Cox回歸分析結(jié)果表明,風(fēng)險(xiǎn)評(píng)分(HR=1.146,P<0.001)和分期(HR=1.680,P<0.001)是肝癌惡化的危險(xiǎn)因素,見(jiàn)圖4A。多因素Cox分析結(jié)果表明,在調(diào)整其他混雜因素后,風(fēng)險(xiǎn)評(píng)分(HR=1.117,P<0.001)仍是一個(gè)獨(dú)立的預(yù)后因素,見(jiàn)圖4B。計(jì)算風(fēng)險(xiǎn)評(píng)分的AUC值為0.727,明顯高于其他臨床特征的AUC值,見(jiàn)圖4C,表明5個(gè)銅死亡相關(guān)基因?qū)Ω伟┑念A(yù)后風(fēng)險(xiǎn)預(yù)測(cè)模型可靠。高危組和低危組患者中的5個(gè)銅死亡相關(guān)基因在肝癌的分級(jí)和分期之間存在統(tǒng)計(jì)學(xué)差異(P<0.01),見(jiàn)圖4D。
圖4 風(fēng)險(xiǎn)預(yù)測(cè)模型的獨(dú)立預(yù)后價(jià)值Figure 4 Independent prognostic value of risk prediction models
在生物學(xué)過(guò)程(BP)方面,5個(gè)銅死亡基因主要在巨噬細(xì)胞凋亡過(guò)程及其調(diào)控、異染色質(zhì)組裝等方面富集,見(jiàn)圖5A。對(duì)于分子功能(MF),銅死亡基因在轉(zhuǎn)移酶活性、酰基轉(zhuǎn)移酶活性等方面富集,見(jiàn)圖5B。對(duì)于細(xì)胞成分(CC),銅死亡基因在線粒體基質(zhì)、線粒體蛋白復(fù)合物以及氧化還原酶復(fù)合物等方面富集,見(jiàn)圖5C。在KEGG途徑富集分析中,銅死亡基因主要與丙氨酸、天冬氨酸和谷氨酸的代謝以及檸檬酸循環(huán)(TCA循環(huán))有關(guān),見(jiàn)圖5D。
圖5 銅死亡相關(guān)基因的GO和KEGG富集分析Figure 5 GO and KEGG functional enrichment analysis of cuprotosis-related genes
本研究擬探討銅死亡相關(guān)基因在肝癌中的作用,發(fā)現(xiàn)其與肝癌的臨床特征密切相關(guān)。首先,我們分析了10個(gè)目前已知的銅死亡相關(guān)基因的mRNA水平在肝癌組織和正常組織中的表達(dá)量,發(fā)現(xiàn)全部基因的表達(dá)量都存在差異。然后,基于這些差異表達(dá)的基因進(jìn)行一致性聚類分析,確定了肝癌的兩個(gè)亞組,第1亞組的預(yù)后較差。為了進(jìn)一步評(píng)估這些銅死亡相關(guān)基因的預(yù)后價(jià)值,通過(guò)單因素Cox回歸分析和LASSO回歸分析構(gòu)建了5個(gè)與銅死亡相關(guān)基因(LIPT1、DLAT、MTF1、GLS和CDKN2A)的風(fēng)險(xiǎn)特征模型,研究表明風(fēng)險(xiǎn)評(píng)分不僅是一個(gè)獨(dú)立的預(yù)后指標(biāo),而且可以預(yù)測(cè)肝癌的臨床特征。此外,功能分析顯示,與TCA循環(huán)相關(guān)的通路被富集。因此,利用5個(gè)銅死亡相關(guān)基因建立的肝癌預(yù)后模型是有意義的。
DLAT、MTF1、GLS、CDKN2A屬于丙酮酸脫氫酶復(fù)合體(PDC)中編碼蛋白的基因,該復(fù)合體是丙酮酸進(jìn)入線粒體后轉(zhuǎn)化為乙酰-CoA的唯一途徑。而二氫硫辛酰胺轉(zhuǎn)乙酰基酶基因(DLAT)屬于PDC E2亞單位,Goh等[9]發(fā)現(xiàn)DLAT在胃癌細(xì)胞中表達(dá)顯著上調(diào),Shan等[10]發(fā)現(xiàn)DLAT通過(guò)促進(jìn)戊糖磷酸途徑的激活進(jìn)而促進(jìn)腫瘤細(xì)胞生長(zhǎng)。金屬調(diào)控轉(zhuǎn)錄因子1基因(MTF1)是一種鋅指轉(zhuǎn)錄因子,通過(guò)激活下游靶基因促進(jìn)細(xì)胞存活。Ji等[11]研究表明,MTF1具有致癌作用,并通過(guò)促進(jìn)上皮—間充質(zhì)轉(zhuǎn)化從而促進(jìn)卵巢腫瘤轉(zhuǎn)移。在p53存在的乳腺癌細(xì)胞中,MTF1可被鋅和銅激活。MTF1可能是一種新的早期診斷生物標(biāo)志物,也是臨床治療的藥物靶點(diǎn)。谷氨酰胺酶基因(GLS)轉(zhuǎn)化為三羧酸循環(huán)代謝產(chǎn)物是促進(jìn)癌細(xì)胞增殖的關(guān)鍵代謝過(guò)程,已被確定為癌癥代謝的標(biāo)志[12]。Guo等[13]發(fā)現(xiàn)GLS的表達(dá)在子宮內(nèi)膜癌進(jìn)展過(guò)程中升高,并與不良預(yù)后相關(guān)。Zhang等[14]發(fā)現(xiàn)線粒體GCN5L1通過(guò)調(diào)節(jié)GLS乙酰化和活性在肝癌發(fā)展過(guò)程中發(fā)揮腫瘤調(diào)節(jié)器的作用。細(xì)胞周期依賴性激酶抑制基因(CDKN2A)又稱為P16基因,是一種多腫瘤抑制基因,能夠參與細(xì)胞周期的調(diào)控,抑制細(xì)胞增殖和分裂,而腫瘤細(xì)胞增殖速度較正常細(xì)胞快,這可能是因?yàn)槟[瘤細(xì)胞CDKN2A基因突變或失活,從而使其增殖分化速度增加。而關(guān)于脂酰轉(zhuǎn)移酶1基因(LIPT1)的相關(guān)報(bào)道較少,其突變可引起丙酮酸和α-酮戊二酸脫氫酶繼發(fā)缺乏的Leigh病,這是一種是由于呼吸鏈亞單位缺失造成的先天性代謝紊亂性疾病,是一種線粒體腦肌病[15]。銅死亡觀點(diǎn)的提出及進(jìn)一步揭示的具體機(jī)制,將為銅失調(diào)疾病、部分大量表達(dá)脂?;€粒體蛋白及具有高度呼吸作用的癌癥等疾病提供新的治療策略。
本研究有一定局限性:首先,使用的是公共數(shù)據(jù)庫(kù)的回顧性數(shù)據(jù),缺乏前瞻性臨床數(shù)據(jù)來(lái)驗(yàn)證其預(yù)后意義;其次,考慮到肝癌是一種典型的多基因疾病,本文僅用5個(gè)銅死亡相關(guān)基因來(lái)建立預(yù)后模型,可能缺少其他能更精準(zhǔn)預(yù)測(cè)肝癌預(yù)后的基因。
綜上所述,本研究使用5個(gè)銅死亡相關(guān)基因構(gòu)建了一個(gè)新的風(fēng)險(xiǎn)評(píng)分模型,并且與生存時(shí)間獨(dú)立相關(guān),為預(yù)測(cè)肝癌預(yù)后提供了新的見(jiàn)解。