馬 濤,陶 潤(rùn),關(guān) 翰,張家俊
膀胱癌(BC)在泌尿系統(tǒng)侵襲性惡性腫瘤中的發(fā)生率最高,也是全球最常見(jiàn)的癌癥之一[1]。全球每年約有165 000人因BC死亡,其生物學(xué)行為復(fù)雜,且極易復(fù)發(fā)和轉(zhuǎn)移[2-3]。目前,BC的診斷和治療仍存在很大的不足,其治療方法和預(yù)后與是否存在肌層浸潤(rùn)有關(guān)。非肌肉浸潤(rùn)型BC(NMIBC)預(yù)后較好,而肌肉浸潤(rùn)型(MIBC)惡性程度很高[4]。對(duì)于后者,根治性膀胱切除加盆腔淋巴結(jié)清掃是標(biāo)準(zhǔn)治療方案,但預(yù)后較差[3-5]。因此,迫切需要新的途徑為BC的預(yù)后和治療提供信息。本研究利用TCGA數(shù)據(jù)庫(kù)分析BC的mRNA表達(dá)水平,從中篩選出差異表達(dá)的基因。并對(duì)差異基因進(jìn)行系統(tǒng)性分析,為尋找更有效的分子治療方法提供參考。
1.1 數(shù)據(jù)材料 從TCGA數(shù)據(jù)庫(kù)下載BC的mRNA表達(dá)數(shù)據(jù),截止時(shí)間為2019年12月29日,該數(shù)據(jù)集mRNA的表達(dá)數(shù)據(jù)來(lái)源于414個(gè)BC樣本和19個(gè)相應(yīng)的正常組織樣本。本研究嚴(yán)格遵守TCGA發(fā)布的發(fā)表指導(dǎo)規(guī)范(https://cancergenome.nih.gov/pulications/publicationguidelines)。
1.2 數(shù)據(jù)處理
1.2.1 篩選差異基因 利用R version 3.6.2(https://www.r-project.org/)及其附帶的“edgeR”包、“gplots”包篩選出BC組織與正常組織間差異表達(dá)的基因,將篩選標(biāo)準(zhǔn)設(shè)為|LogFC|≥3,F(xiàn)DR≤0.05。
1.2.2 功能和途徑富集分析 利用線數(shù)據(jù)庫(kù)DAVID 6.8對(duì)獲得的差異基因進(jìn)行了GO和KEGG富集分析。
1.2.3 構(gòu)建編碼蛋白相互作用網(wǎng)絡(luò)(PPI)與選擇關(guān)鍵基因 使用在線數(shù)據(jù)庫(kù)STRING11.0(http://string.embl)對(duì)差異表達(dá)基因進(jìn)行編碼蛋白相互作用網(wǎng)絡(luò)(protein-protein interaction network,PPI)的構(gòu)建。使用Cytoscape_v3.7.0軟件(https://cytoscape.org/download.html)可視化PPI網(wǎng)絡(luò)。隨后,同時(shí)利用其插件Cytohubba分析PPI網(wǎng)絡(luò)中的關(guān)鍵基因。
1.2.4 關(guān)鍵基因差異表達(dá)驗(yàn)證 使用GEPIA、UALCAN數(shù)據(jù)庫(kù)分析差異基因在BC中的表達(dá)水平。
1.2.5 關(guān)鍵基因的生存分析 應(yīng)用在線工具Kaplan Meier Plotter(http://kmplot.com/analysis/)對(duì)關(guān)鍵基因進(jìn)行預(yù)后價(jià)值分析。
1.2.6 關(guān)鍵基因的臨床和病理相關(guān)性分析 利用R version 3.6.2(https://www.r-project.org/)及其附帶的“l(fā)imma”包、“ggplot2”包將篩選的目標(biāo)基因與病人臨床及病理資料做相關(guān)性分析。
2.1 差異表達(dá)的mRNA的篩選結(jié)果 通過(guò)對(duì)TCGA數(shù)據(jù)庫(kù)中414個(gè)BLCA樣本和19個(gè)對(duì)應(yīng)的對(duì)應(yīng)的癌旁組織樣本處理分析,得到1 538個(gè)差異表達(dá)基因,其中有1 088個(gè)為上調(diào),450個(gè)下調(diào)。利用R軟件繪制差異基因的火山圖(見(jiàn)圖1)。
2.2 差異基因的GO及KEGG富集分析結(jié)果
2.2.1 GO富集分析 應(yīng)用數(shù)據(jù)庫(kù)DAVID進(jìn)行GO富集分析評(píng)估了差異基因的潛在生物學(xué)功能。發(fā)現(xiàn)差異基因在生物過(guò)程(biological process,BP)方面主要富集在:rDNA上的染色質(zhì)沉默、DNA復(fù)制依賴的核小體組裝、蛋白異構(gòu)化、核小體組裝、肌肉收縮、細(xì)胞蛋白代謝過(guò)程、端粒組織、肌絲滑動(dòng)、女性妊娠等;在細(xì)胞組分(CC)方面主要富集在:細(xì)胞外間隙、核小體、Z盤(pán)、蛋白類細(xì)胞外基質(zhì)、胞外基質(zhì)、中間絲、胞外外泌體等;在分子功能(MF)方面主要富集在:結(jié)構(gòu)分子活性、序列特異性結(jié)合、蛋白異二聚化活性等(見(jiàn)圖2與表1)。
表1 差異表達(dá)基因的GO富集分析結(jié)果
2.2.2 KEGG富集分析 應(yīng)用數(shù)據(jù)庫(kù)DAVID進(jìn)行KEGG富集分析檢查了差異基因涉及的潛在信號(hào)通路。發(fā)現(xiàn)差異基因主要涉及癌癥中的轉(zhuǎn)錄失調(diào)、酪氨酸代謝、cGMP-PKG信號(hào)通路、系統(tǒng)性紅斑狼瘡、酒精中毒、擴(kuò)張型心肌病、肥厚型心肌病、神經(jīng)活性配體-受體相互作用等(見(jiàn)圖3和表2)。
表2 差異表達(dá)基因的KEGG富集分析結(jié)果
續(xù)表2
2.3 構(gòu)建編碼蛋白相互作用網(wǎng)絡(luò)(PPI)與選擇關(guān)鍵基因
2.3.1 構(gòu)建PPI網(wǎng)絡(luò) 為分析差異表達(dá)基因之間相互作用關(guān)系,利用在線數(shù)據(jù)庫(kù)STRING11.0對(duì)1 538個(gè)差異表達(dá)基因進(jìn)行PPI網(wǎng)絡(luò)構(gòu)建,將相互作用分?jǐn)?shù)設(shè)置為0.7,得到了相互作用網(wǎng)絡(luò)圖(見(jiàn)圖4)。
2.3.2 篩選關(guān)鍵基因 利用Cytoscape軟件插件Cytohubba,采用Betweenness算法得出INS、ACTN2、ALB、KNG1、白細(xì)胞介素-6(IL-6)、IGF2、FOS、間皮素(MSLN)、DMD、APCS為PPI網(wǎng)絡(luò)中的前10的關(guān)鍵節(jié)點(diǎn)基因(見(jiàn)圖4),這10個(gè)關(guān)鍵基因中,INS、ALB、KNG1、IGF2、MSLN、APCS表達(dá)均為上調(diào),ACTN2、IL-6、FOS、DMD下調(diào)(見(jiàn)圖5)。
2.4 關(guān)鍵基因差異表達(dá)驗(yàn)證
2.4.1 UALCAN數(shù)據(jù)庫(kù)驗(yàn)證差異表達(dá) 利用UALCAN數(shù)據(jù)庫(kù)驗(yàn)證了10個(gè)關(guān)鍵基因在BC中的表達(dá)水平,結(jié)果顯示,ACTN2、IL-6、FOS、DMD在BC中異常低表達(dá)(見(jiàn)圖6A),而ALB、MSLN的表達(dá)高于正常膀胱組織(見(jiàn)圖6B)。
2.4.2 GEPIA數(shù)據(jù)庫(kù)驗(yàn)證差異表達(dá) 為了進(jìn)一步探討其在BC中的特異性表達(dá)。通過(guò)GEPIA數(shù)據(jù)庫(kù)再次驗(yàn)證,分析結(jié)果與UALCAN數(shù)據(jù)庫(kù)驗(yàn)證吻合,ACTN2、IL-6、FOS、DMD在BC中異常低表達(dá)(見(jiàn)圖7A),而ALB、MSLN在BC中高表達(dá)(見(jiàn)圖7B)。
2.5 差異基因?qū)LCA病人預(yù)后的影響 應(yīng)用在線工具Kaplan Meier Plotter(http://kmplot.com/analysis/)對(duì)ACTN2、IL-6、FOS、DMD、ALB、MSLN等關(guān)鍵基因進(jìn)行預(yù)后價(jià)值分析,發(fā)現(xiàn)基因 IL-6、MSLN的表達(dá)情況與BC預(yù)后相關(guān)有統(tǒng)計(jì)學(xué)意義,在BC中IL-6表達(dá)越高預(yù)后越好(HR=0.46,P<0.05),MSLN表達(dá)越高預(yù)后越差(HR=2.27,P<0.05)(見(jiàn)圖8)。
2.6 關(guān)鍵基因的臨床和病理相關(guān)性分析 應(yīng)用R軟件分析IL-6與MSLN mRNA表達(dá)與BC不同臨床及病理參數(shù)的關(guān)系顯示,IL-6 mRNA的表達(dá)與病人年齡、腫瘤生長(zhǎng)部位及和病理分期T分期有關(guān)而與其他參數(shù)無(wú)關(guān)(見(jiàn)圖9): 55歲以上的BC病人的IL-6 mRNA表達(dá)水平高于低年齡組(P<0.05);在BC病人病理分期T分期中,T1期病人的IL-6 mRNA表達(dá)水平低于于其他組(P<0.05);腫瘤位于膀胱后壁組的BC病人IL-6 mRNA表達(dá)水平高于位于膀胱側(cè)壁組(P<0.05)。MSLN mRNA的表達(dá)與病人腫瘤生長(zhǎng)部位及和病理分期N分期有關(guān)而與其他參數(shù)無(wú)關(guān)(見(jiàn)圖9): 在BC病人病理分期N分期中,T3期病人的MSLN mRNA表達(dá)水平低于N0(P<0.05)、N2組(P<0.05);腫瘤位于膀胱前壁組的BC病人IL-6 mRNA表達(dá)水平高于位于膀胱側(cè)壁組(P<0.05)。
近年來(lái),BC的免疫靶向治療越來(lái)越受到關(guān)注。以PD-1/ PD-L1抑制劑為代表的免疫靶向藥物已在臨床治療BC取得了良好的結(jié)果[6-7]。腫瘤免疫正在成為癌癥診斷和治療領(lǐng)域的重要環(huán)節(jié)[8]。本研究通過(guò)生物信息學(xué)分析BC病人的mRNA表達(dá),找出影響B(tài)C病人生存的因素。
在本研究中,我們篩選出的1 538個(gè)差異表達(dá)基因,構(gòu)建了其編碼蛋白相互作用網(wǎng)絡(luò),并進(jìn)行富集分析。發(fā)現(xiàn)多條富集通路與腫瘤的發(fā)生發(fā)展相關(guān)。GO分析結(jié)果表明這些差異基因多為胞外外泌體、細(xì)胞外間隙、核小體、中間絲等CC。在生物功能方面主要參與核小體裝配、染色質(zhì)沉默、DNA復(fù)制等過(guò)程,在分子功能方面主要富集在結(jié)構(gòu)分子活性、序列特異性結(jié)合、蛋白異二聚化活性等方面。核小體裝配是指在核小體裝配因子調(diào)節(jié)下,由DNA鏈和組蛋白組裝成核小體的過(guò)程。DNA復(fù)制過(guò)程中的核小體裝配與正在進(jìn)行的DNA合成聯(lián)系緊密。這一過(guò)程被稱為DNA復(fù)制偶聯(lián)核小體裝配,是染色質(zhì)復(fù)制所必需的過(guò)程,對(duì)維持基因組和表觀遺傳的穩(wěn)定性都有很大影響[9]。結(jié)構(gòu)分子活性被定義為有助于細(xì)胞內(nèi)或細(xì)胞外復(fù)合物或組件的結(jié)構(gòu)完整性的分子的作用。KEGG分析結(jié)果表明這些差異基因主要與癌癥中的轉(zhuǎn)錄失調(diào)、鈣信號(hào)通路、酪氨酸代謝、cGMP-PKG信號(hào)通路相關(guān)。我們通過(guò)在線工具對(duì)10個(gè)關(guān)鍵基因進(jìn)行預(yù)后分析,發(fā)現(xiàn)MSLN、IL-6等基因的表達(dá)情況與BC預(yù)后顯著相關(guān),MSLN表達(dá)越高預(yù)后越差(P<0.05),IL-6表達(dá)越高預(yù)后越好(P<0.05)。
MSLN是一種由糖磷脂酰肌醇連接的細(xì)胞表面蛋白,通常在胸膜、腹膜和心包內(nèi)的間皮細(xì)胞中表達(dá)。MSLN基因可編碼71 000的前體蛋白,該蛋白可被加工成脫落蛋白巨核細(xì)胞增強(qiáng)因子和膜結(jié)合蛋白[10]。雖然目前MSLN的生物學(xué)功能仍不清楚,但在某些情況下,MSLN的表達(dá)與腫瘤侵襲性的增加和不良的臨床預(yù)后有關(guān)。一些研究分析了MSLN的表達(dá)對(duì)結(jié)直腸癌(CRC)病人生存的不良影響[11-12]。INAGUMA等[13]的研究小組觀察到MSLN在直腸癌中有明顯表達(dá),多達(dá)60%的病例表現(xiàn)出陽(yáng)性。INOUE等[14]在研究中也分析了MSLN彌漫性表達(dá)對(duì)Ⅱ~Ⅳ期直腸癌病人生存的影響,并將其表達(dá)確定為潛在的獨(dú)立危險(xiǎn)因素,發(fā)現(xiàn)MSLN在結(jié)直腸腫瘤中高表達(dá),表達(dá)強(qiáng)度與惡性程度呈正相關(guān)性,且MSLN表達(dá)程度越高預(yù)后越差;此外,他們還揭示了直腸癌的轉(zhuǎn)移與MSLN陽(yáng)性呈弱正相關(guān);并且,MSLN在結(jié)腸癌的體外細(xì)胞增殖中具有積極作用。在其他腫瘤類型中也已經(jīng)報(bào)道了使用MSLN免疫組織化學(xué)進(jìn)行病人預(yù)后的預(yù)測(cè)。在乳腺癌和肺腺癌的情況下,MSLN的高表達(dá)常常預(yù)示著病人的預(yù)后不良[15-16]。相反,在卵巢漿液性瘤病人中,MSLN的表達(dá)與病人存活時(shí)間延長(zhǎng)相關(guān)[17]。最近,HMELJAK等[18]通過(guò)對(duì)惡性胸膜間皮瘤進(jìn)行全面分子分析,其也表現(xiàn)出MSLN的低表達(dá)。這些結(jié)果表明,MSLN的異常表達(dá)在不同腫瘤中可能存在不同的生物學(xué)作用。在過(guò)去的幾年中,已經(jīng)研究了幾種關(guān)于使用MSLN治療腫瘤的策略,包括在胰腺癌導(dǎo)管腺癌中使用針對(duì)MSLN的單克隆抗體或攜帶毒素或細(xì)胞毒劑的蛋白質(zhì),含有識(shí)別MSLN的可變片段的嵌合T細(xì)胞,以及可以誘導(dǎo)針對(duì)MSLN的T細(xì)胞免疫應(yīng)答的特定疫苗[19-21]。抗間皮素CAR-T細(xì)胞也可有效抑制胰腺癌PDX模型的生長(zhǎng)[22]。
IL-6是由各種細(xì)胞產(chǎn)生的一種多功能細(xì)胞因子,在信息傳遞,免疫細(xì)胞激活和調(diào)節(jié),T和B細(xì)胞激活,增殖和分化以及炎癥反應(yīng)中起重要作用[23],其與包括乳腺癌[24]、肺癌[25]和卵巢癌[26]等在內(nèi)的多種腫瘤類型相關(guān)。IL-6的抗凋亡和促血管生成作用可能在各種惡性腫瘤類型的發(fā)生,發(fā)展和轉(zhuǎn)移密切相關(guān)[27]。有研究[28-29]顯示,IL-6的異常表達(dá)與非小細(xì)胞肺癌病人的腫瘤進(jìn)展和總生存時(shí)間相關(guān)。降低IL-6的表達(dá)可以抑制肺癌干細(xì)胞的增殖[30]。并且,術(shù)后血清IL-6水平越高,預(yù)示非小細(xì)胞肺癌病人術(shù)后早期復(fù)發(fā)的風(fēng)險(xiǎn)越高[31]。目前,IL-6已被證實(shí)會(huì)影響肝癌的增殖,并在肝癌的發(fā)展和復(fù)發(fā)中發(fā)揮重要作用[32]。據(jù)報(bào)道,IL-6可能通過(guò)介導(dǎo)各種信號(hào)通路來(lái)促進(jìn)腫瘤類型的發(fā)展,其中最主要的機(jī)制是誘導(dǎo)STAT3磷酸化。IL-6/STAT3信號(hào)轉(zhuǎn)導(dǎo)通路對(duì)于惡性腫瘤類型的發(fā)生和發(fā)展至關(guān)重要[33]。IL-6介導(dǎo)的STAT3激活可能顯著上調(diào)與腫瘤細(xì)胞增殖、凋亡、缺氧反應(yīng)、轉(zhuǎn)移和血管生成有關(guān)的許多基因的表達(dá),并可能下調(diào)促凋亡基因的表達(dá)[34-36]。IL-6可以結(jié)合糖蛋白130、誘導(dǎo)Janus激酶磷酸化,從而促進(jìn)肝癌的發(fā)展[37-38]。
綜上所述,本研究利用生物信息學(xué)分析方法篩選出MSLN、IL-6等在BC中可能存在預(yù)后價(jià)值的關(guān)鍵基因,可以幫助我們進(jìn)一步探究解BC潛在的分子發(fā)生發(fā)展機(jī)制,其靶向治療價(jià)值和意義有待后續(xù)研究證實(shí)。
蚌埠醫(yī)學(xué)院學(xué)報(bào)2022年6期