楊小兵,魏德超,馮 濤,趙佳暉,王永興,韓毅力,羅 勇,姜永光
(首都醫(yī)科大學(xué)附屬北京安貞醫(yī)院泌尿外科,北京 100029)
去勢抵抗型前列腺癌(castration resistant prostate cancer,CRPC)是前列腺癌(prostate cancer,PCa)惡性進展的極晚期狀態(tài),對傳統(tǒng)雄激素剝奪治療抵抗,預(yù)后極差。一直以來,除了多西他賽化療勉強使CRPC患者生存獲益18.9個月外[1],并無其他更為有效的治療選擇。以恩雜魯胺(enzalutamide,ENZ)為代表的第二代雄激素受體(androgen receptor,AR)抑制劑的問世,革新了CRPC 新型內(nèi)分泌治療理念、大幅延長了CRPC患者的中位生存時間[2],堪稱近年來CRPC 階段最重要的治療突破。盡管如此,那些初始治療有效的患者在經(jīng)過大約11.2 個月的緩解期后仍會出現(xiàn)ENZ耐藥的問題[2]。屆時,ENZ耐藥的CRPC患者將面臨治無可藥的困境。因此,如何克服ENZ耐藥一直是CRPC領(lǐng)域非常重要的研究焦點。在本研究中,我們從GEO數(shù)據(jù)庫中下載了ENZ耐藥的PCa細胞株的數(shù)據(jù)集(GSE104935),利用生物信息分析的方法篩選差異表達基因(differential expression genes,DEGs),進行GO/KEGG富集分析,構(gòu)建PPI網(wǎng)絡(luò)篩選中樞潛在耐藥基因,為臨床解決ENZ耐藥問題尋找新的作用靶點。
1.1 基因表達數(shù)據(jù)集的收集ENZ耐藥的數(shù)據(jù)集(GSE104935)來源于美國國立生物技術(shù)信息中心NCBI的基因表達數(shù)據(jù)庫(Gene Expression Omnibus data base,GEO)(https://www.ncbi.nlm.nih.gov/geo/),該數(shù)據(jù)集包含了10組樣本的測序數(shù)據(jù),其中4組為C4-2B細胞株(2組ENZ處理耐藥:C4-2B-ENZ;2組DMSO處理對照:C2-4B),另外6組為LNCaP細胞株(3組ENZ處理耐藥:LNCaP-ENZ,3組DMSO處理對照:LNCaP)。
1.2 差異表達基因的篩選使用R語言(版本:4.1.2)的limma軟件包分別研究4組C4-2B細胞株和6組LNCaP細胞株基因的差異表達,“P<0.05且log2FC(倍數(shù)變化)> 1或log2FC(倍數(shù)變化)<-1”被定義為基因差異表達的篩選閾值。使用R語言的ggplot2和ggreple軟件包繪制火山圖對差異基因分析結(jié)果進行可視化。為進一步篩選在不同前列腺癌耐藥株中均發(fā)揮共同作用的DEGs,使用Bioinformatics的在線繪圖工具Venn Diagrams(http://bioinformatics.psb.ugent.be/webtools/Venn/)繪制韋恩圖,得到兩種不同耐藥細胞株共表達的上下調(diào)基因。
1.3 差異表達基因的富集分析為了進一步確認DEGs的潛在功能,利用DAVID網(wǎng)站(https://david-d.ncifcrf.gov/tools.jsp)對上調(diào)基因和下調(diào)基因進行GO富集分析和KEGG通路富集分析。GO富集分析用于注釋具有功能的差異基因,主要包括分子功能(molecular founction,MF)、生物過程(biological process,BP)和細胞組分(cellular component,CC)3方面的內(nèi)容。KEGG通路富集分析用于識別差異基因發(fā)揮作用的信號通路。使用在線繪圖工具Bioinformatics(http://www.bioinformatics.com.cn/)繪制多分類氣泡圖對GO/KEGG富集結(jié)果進行可視化。
1.4 PPI網(wǎng)絡(luò)構(gòu)建與核心基因篩選為了進一步了解DEGs之間的相互作用關(guān)系,篩選在其中起到關(guān)鍵作用的Hub基因,利用STRING數(shù)據(jù)庫(https://string-db.org)構(gòu)建蛋白質(zhì)互作網(wǎng)絡(luò)(protein-protein interaction network,PPI network),使用Cytoscope軟件(版本:3.8.2)對上述PPI網(wǎng)絡(luò)進行優(yōu)化,并利用其cytoHubba軟件包中的MCC方法對DEGs進行排序和評估,最終生成前10位Hub基因的蛋白質(zhì)網(wǎng)絡(luò)。最后,使用R語言的heatmap軟件包繪制基因熱圖對Hub基因差異表達的定量數(shù)據(jù)進行可視化。
1.5 Hub基因的富集分析為了更好地說明Hub基因的潛在功能,首先利用Cytoscope軟件的ClueGO軟件包對Hub基因及其相鄰基因進行GO/KEGG富集分析,再利用yFiles Layout Algorithms軟件包對富集結(jié)果進行可視化。為了進一步了解上述基因的生物途徑,利用Bioinformatics進行富集,并用弦圖、條形圖和氣泡圖對結(jié)果進行可視化。
1.6 生存分析為了解ENZ耐藥后異常表達的Hub基因是否與PCa患者的生存預(yù)后相關(guān),利用GEPIA數(shù)據(jù)庫(http://gepia2.cancer-pku.cn/#survival)對Hub基因進行生存分析,繪制無進展生存期(progression-free survival,PFS)曲線。
2.1 ENZ耐藥細胞株DEGs篩選及功能富集分析C4-2B-ENZ與C4-2B相比,包含了448個上調(diào)基因和447個下調(diào)基因(圖1A和C)。LNCaP-ENZ與LNCaP相比,包含了561個上調(diào)基因和482下調(diào)基因(圖1B和C)。其中,C4-2B-ENZ與LNCaP-ENZ共表達的上調(diào)基因為106個,下調(diào)基因為88個(圖1C)。GO富集分析表明耐藥株共表達的上調(diào)基因調(diào)節(jié)的生物過程主要集中在男性性腺的發(fā)育、前列腺上皮組織生發(fā)、轉(zhuǎn)錄翻譯的調(diào)節(jié)、泛素化蛋白的降解,調(diào)節(jié)的細胞組分主要富集在核及胞外內(nèi)體、染色質(zhì)、細胞膜及細胞質(zhì),調(diào)節(jié)的分子功能主要富集在DNA、蛋白質(zhì)及PDZ結(jié)構(gòu)域的結(jié)合(圖1D)。KEGG富集分析表明共表達的上調(diào)基因主要在微量元素吸收、膽汁分泌及化學(xué)致癌相關(guān)受體激活這些通路富集(圖1D)。然而,GO富集分析顯示耐藥株共表達的下調(diào)基因調(diào)節(jié)的生物過程主要集中在DNA轉(zhuǎn)錄的調(diào)節(jié)及蛋白質(zhì)泛素化,調(diào)節(jié)的細胞組分主要富集在細胞膜、內(nèi)質(zhì)網(wǎng)膜、細胞質(zhì)及核質(zhì),調(diào)節(jié)的分子功能主要富集在蛋白激酶及磷脂的結(jié)合(圖1E)。KEGG富集分析顯示共表達的下調(diào)基因主要在癌癥的表達失調(diào)、前列腺癌相關(guān)的通路富集(圖1E)。
2.2 共表達差異基因的PPI網(wǎng)絡(luò)構(gòu)建及Hub基因篩選PPI網(wǎng)絡(luò)分析表明在C4-2B-ENZ與LNCaP-ENZ共表達的194個基因中,共計有99個基因的相互作用關(guān)系密切(圖2A)。利用cytoHubba軟件包中的MCC方法對上述基因進行排序和評估,最終生成在該網(wǎng)絡(luò)中起到核心作用的前10 個Hub基因(上調(diào):ACPP、AR和LEF1,下調(diào):KLK2、TMPRSS2、ZBTB16、FOXO1、NKX3-1、PMEPA1和SLC45A3,圖2C、E)及與其相鄰的13個基因(上調(diào):VAV3、HEY1、HOXA10、DLX3、ATP2B1、ZFHX4、WLS、GPER1、SVIL、MSX2及PATZ1,下調(diào):NFIB、GNMT及NKX3-1,圖2B、D)。
2.3 Hub基因及其相鄰基因的富集分析ClueGO軟件包對Hub基因及其相鄰基因的GO/KEGG富集分析結(jié)果表明Hub基因中除ACPP外,AR、LEF1、KLK2、TMPRSS2、ZBTB16、FOXO1、NKX3-1、PMEPA1和SLC45A3的異常表達均與前列腺癌的發(fā)生發(fā)展密切相關(guān),其中AR、LEF1、FOXO1、NKX3-1和PMEPA1在類固醇激素刺激的細胞反應(yīng)及其調(diào)節(jié)的信號通路富集,TMPRSS2、ZBTB16 SLC45A3在癌癥表達失調(diào)的相關(guān)通路富集(圖3A、B),上述基因在調(diào)節(jié)類固醇激素刺激的細胞反應(yīng)的生物過程中富集尤為明顯(圖3C、D)。
2.4 Hub基因異常表達對PCa患者生存預(yù)后的影響利用GEPIA數(shù)據(jù)庫對Hub基因進行生存分析,結(jié)果表明Hub基因中AR、FOXO1、NKX3-1和SLC45A3與PCa患者生存預(yù)后密切相關(guān),AR高表達組患者的生存預(yù)后較低表達組差(圖4A),而FOXO1、NKX3-1和SLC45A3高表達組的生存預(yù)后明顯優(yōu)于低表達組(圖4B~D)。這些結(jié)果提示我們上述基因的異常表達可能是CRPC惡性進展、ENZ治療失敗的原因之一。
以ENZ為代表的新型內(nèi)分泌藥物耐藥一直是嚴(yán)重影響晚期CRPC患者生存預(yù)后的重要因素,也是干擾泌尿外科醫(yī)生臨床決策的極大難題。盡管現(xiàn)階段的研究已表明AR再激活、突變及剪切變異體誘導(dǎo)其下游信號通路的恢復(fù)是晚期CRPC患者ENZ耐藥的重要機制之一[3],但是具體調(diào)控細節(jié)仍存在諸多亟待深入研究的地方。因此,我們利用生物信息學(xué)的分析方法,就ENZ耐藥的兩種不同細胞株的測序數(shù)據(jù)進行深入挖掘,共計篩選了194個DEGss,并對其功能進行識別,發(fā)現(xiàn)上述基因主要與DNA的轉(zhuǎn)錄翻譯、信號通路的調(diào)節(jié)及腫瘤的發(fā)生發(fā)展相關(guān)。
為了尋找其中潛在的耐藥基因,我們進一步構(gòu)建了上述基因的表達網(wǎng)絡(luò),最終篩選出10個起到關(guān)鍵作用的Hub基因。通過對其功能的富集分析,發(fā)現(xiàn)其與激素調(diào)節(jié)的相關(guān)信號通路及前列腺癌的發(fā)生發(fā)展關(guān)系密切。在這10個Hub基因中,又以AR、FOXO1、NKX3-1和SLC45A3與PCa患者的生存預(yù)后關(guān)系最為密切。其中,AR屬于類固醇激素受體家族,起轉(zhuǎn)錄因子的作用,主要是調(diào)節(jié)編碼前列腺功能所需蛋白質(zhì)轉(zhuǎn)錄的基因,促進正常前列腺的細胞分化[4]。最近的研究表明,盡管接受了ENZ治療,但是AR在CRPC中仍然高度表達并具有轉(zhuǎn)錄活性[5]。因此,靶向AR的增強子可能成為治療CRPC患者ENZ耐藥的潛在方法。
FOXO1屬于叉頭盒轉(zhuǎn)錄因子O(forkhead box O,F(xiàn)OXO)家族,通過調(diào)節(jié)促凋亡基因、細胞周期相關(guān)基因及DNA損傷反應(yīng)基因的表達發(fā)揮抑癌功能[6]。研究顯示FOXO1的激活能夠抑制PCa細胞的增殖和侵襲能力,誘導(dǎo)其凋亡[7-9]。更為重要的是,F(xiàn)OXO1在PCa中不但能夠抑制全長AR的活性,對AR的剪切變異體,如AR-V7的轉(zhuǎn)錄活性也具有良好的抑制作用[10]。然而,作為PTEN抑癌基因的下游效應(yīng)子,F(xiàn)OXO1表達下調(diào)在PTEN 缺失或突變的晚期/轉(zhuǎn)移性前列腺癌中卻非常常見[9-11]。此外,YANG等[12]發(fā)現(xiàn)與低表達患者相比,F(xiàn)OXO1高表達的PCa患者發(fā)生生化復(fù)發(fā)的可能性更小。TANG等[8]的生存分析也證實了FOXO1高表達的PCa患者的無進展生存率(progression-free survival,PFS)明顯好于低表達患者,與我們的分析結(jié)果相符。這些結(jié)果表明FOXO1活性的抑制對于PCa細胞的存活極為重要,因此諸如紫杉醇類能夠增加FOXO1表達量的化療藥聯(lián)合ENZ用藥,不失為增強ENZ療效、延緩其耐藥發(fā)生的合理治療策略。
NKX3-1作為前列腺特異性同源盒基因,主要起轉(zhuǎn)錄因子的作用,可調(diào)節(jié)前列腺分化并抑制前列腺癌的發(fā)生[13]。研究發(fā)現(xiàn)NKX3-1基因拷貝丟失在CRPC中比在局限性疾病中更頻繁,其表達缺失或下調(diào)能夠激活A(yù)R及AR-V7信號通路、促使CRPC惡性進展[14-15]。PAPACHRISTODOULOU等[16]的生存分析結(jié)果顯示NKX3-1表達下調(diào)與疾病的不良預(yù)后密切相關(guān),如更快的生化復(fù)發(fā)及更短的中位生存時間,這也與我們的分析結(jié)果相似。因此,靶向NKX3-1的上游調(diào)節(jié)基因如AURKA[14]、LIMK2[15]等,抑制其蛋白降解,似乎也是一種合理的抑制CRPC惡性進展、改善ENZ療效的治療措施。
SLC45A3屬于溶質(zhì)載體家族,也被稱為Prostein/P501S,是一種前列腺特異性的雄激素調(diào)節(jié)基因,常與紅細胞轉(zhuǎn)化特異性(erythroblast transformation specific,ETS)家族成員基因(如ETV1、ETV5、ERG及ELK4等)融合。盡管目前具體生物學(xué)功能尚不明確,但其對PCa而言在診斷及預(yù)后方面均有重要意義[17-18]。研究表明與原發(fā)性PCa相比,轉(zhuǎn)移性PCa中SLC45A3 蛋白表達較低,并且SLC45A3低表達的患者生化復(fù)發(fā)時間顯著縮短[19-20],與我們的分析結(jié)果相似。雖然SLC45A3的功能定位決定了其在誘導(dǎo)ENZ耐藥的關(guān)鍵環(huán)節(jié)可能并未發(fā)揮作用,但是其在ENZ耐藥株中低表達,這似乎預(yù)示著其可以作為一個細胞耐藥的標(biāo)志物。因此,對于那些SLC45A3低表達的CRPC患者,我們能夠制定更為精準(zhǔn)的治療策略,最大程度上改善患者的生存預(yù)后。
總之,由于本文僅通過單一數(shù)據(jù)集篩選差異基因,為了盡可能多地獲得DEGs,我們放寬了篩選標(biāo)準(zhǔn),增加了DEGs的假陽性率。盡管最終分析得到的4個Hub基因,尤其是FOXO1和NKX3-1與CRPC的惡性進展密切相關(guān),可能成為改善ENZ療效、延長CRPC患者生存時間的潛在治療靶點,但仍需結(jié)合臨床標(biāo)本,通過基因芯片等在后續(xù)試驗中進一步驗證。