張河元,陳南輝2,,王曉紅,高白云,凌木安,陳 果,吳志明,李宇同,鐘偉楓5,,潘 斌
1廣東省梅州市人民醫(yī)院泌尿外科,廣東 梅州 514021;2南方醫(yī)科大學(xué)南方醫(yī)院泌尿外科,廣東 廣州 510515;3南方醫(yī)科大學(xué)第三附屬醫(yī)院腎內(nèi)科,廣東 廣州 510630;4暨南大學(xué)附屬第一醫(yī)院泌尿外科,廣東 廣州 510630;5廣州市第十二人民醫(yī)院泌尿外科,廣東 廣州 510630;6中山大學(xué)腫瘤防治中心泌尿外科,廣東 廣州 510060
前列腺癌(PCa)是泌尿系統(tǒng)最常見的腫瘤之一,世界范圍內(nèi),前列腺癌發(fā)病率在所有男性惡性腫瘤中位居第二;因環(huán)境惡化及人口老齡化等原因,我國前列腺癌的發(fā)病率也在逐年上升[1]。雖然手術(shù)、根治性放療等治療手段對于早期前列腺癌有很好的療效,而一旦前列腺癌患者發(fā)生腫瘤轉(zhuǎn)移,其預(yù)后差且會(huì)嚴(yán)重影響其生活質(zhì)量[2]。目前為止,前列腺癌轉(zhuǎn)移的分子機(jī)制仍未明確,且臨床治療缺乏有效的治療手段。因此,探索新型、有效的治療方法成為現(xiàn)今國內(nèi)外學(xué)者研究的重點(diǎn)。闡明前列腺癌發(fā)生和轉(zhuǎn)移的分子機(jī)制,尋找可治療前列腺癌的關(guān)鍵靶標(biāo)至關(guān)重要。
傳統(tǒng)的“單疾病單基因”的研究模式不能從多基因系統(tǒng)角度闡述疾病的發(fā)生發(fā)展,近年來,隨著基因芯片、RNA-seq等高通量測序技術(shù)的興起,產(chǎn)生了大規(guī)模的組學(xué)數(shù)據(jù),而利用系統(tǒng)生物學(xué)分析的新方法,加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA)可大規(guī)模分析組學(xué)數(shù)據(jù),并發(fā)掘與疾病相關(guān)的樞紐基因[3],取得了一系列研究成果[4,5]。WGCNA可分析很多疾病的關(guān)鍵基因,比如影響成年人胰島素敏感性的關(guān)鍵基因[6],動(dòng)脈粥樣硬化合并糖尿病的功能基因模塊[7]、影響膿毒癥預(yù)后的關(guān)鍵基因[8]、阿爾茨海默病發(fā)病有關(guān)的關(guān)鍵基因[9]等,以及各種癌癥的關(guān)鍵致病基因的識別,比如乳腺癌循環(huán)腫瘤細(xì)胞轉(zhuǎn)移的關(guān)鍵基因分析[10]、舌鱗狀細(xì)胞癌密切相關(guān)的樞紐基因分析[11]、龍葵抗肺腺癌的潛在生物靶標(biāo)的探討[12]及腎透明細(xì)胞癌進(jìn)展相關(guān)基因的篩選[13]。但目前缺少關(guān)于前列腺癌的關(guān)鍵基因及預(yù)后系統(tǒng)性分析,因此,本研究采用WGCNA方法,對大樣本的前列腺癌研究隊(duì)列進(jìn)行分析,篩選與前列腺癌發(fā)生和轉(zhuǎn)移的樞紐基因,并通過TCGA公共數(shù)據(jù)庫和細(xì)胞模型進(jìn)行驗(yàn)證,以了解前列腺癌發(fā)生和轉(zhuǎn)移進(jìn)程中的關(guān)鍵基因,為臨床治療前列腺癌提供新的思路。
從NCBI的GEO公共數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/)下載編號為GSE6919的前列腺癌基因芯片數(shù)據(jù),該數(shù)據(jù)集采用GPL92、GPL93 及GPL8300 平臺(tái)。共171個(gè)組織樣本,包含了前列腺癌旁組織81例、前列腺癌組織65例及前列腺轉(zhuǎn)移組織25例。利用R軟件中的Affy包[14]對原始數(shù)據(jù)進(jìn)行讀取,通過PCA進(jìn)行樣本主成分分析,通過R軟件的limma包[15]對基因表達(dá)矩陣進(jìn)行差異基因分析,設(shè)置篩選值為:校正后P 值(FDR)<0.05和對數(shù)化表達(dá)變化倍數(shù)(|log2FC|)>1.2,作為篩選差異基因的閾值,總共進(jìn)行兩次分析:癌原位組ⅤS 癌旁組,癌轉(zhuǎn)移組ⅤS癌原位組,得到相應(yīng)組間的差異表達(dá)基因(DEGs),并繪制火山圖及熱圖。
使用R軟件的WGCNA包[3],通過基因注釋選擇方差最大的前7500個(gè)基因進(jìn)行WGCNA。計(jì)算各基因間的Pearson相關(guān)系數(shù),構(gòu)建無尺度網(wǎng)絡(luò)并選擇適當(dāng)?shù)拈撝郸逻M(jìn)行網(wǎng)絡(luò)構(gòu)建。采用兩步法構(gòu)建,將鄰接矩陣轉(zhuǎn)化為拓?fù)渲丿B矩陣TOM,通過層次聚類生成聚類樹,通過dynamic cut進(jìn)行聚類合并。通過計(jì)算基因顯著性(GS)以及模塊顯著性(MS),計(jì)算基因及模塊,基因與臨床樣本分組信息的顯著性。
計(jì)算各基因模塊身份(MM)以衡量基因在各個(gè)模塊內(nèi)的重要性。設(shè)置參數(shù)|MM|>0.8及|GS|>0.2為標(biāo)準(zhǔn),篩選與臨床性狀密切相關(guān)的模塊的樞紐基因。通過與相應(yīng)組間的DEGs進(jìn)行交叉,取兩者的交集即為樞紐基因。使用DAⅤID數(shù)據(jù)庫(http://david.abcc.ncifcrf.gov/)對特定模塊的基因進(jìn)行GO 分析。若錯(cuò)誤發(fā)現(xiàn)率(FDR)<0.05,認(rèn)為差異具有統(tǒng)計(jì)學(xué)意義。
通過R軟件下載TCGA數(shù)據(jù)庫前列腺癌研究對列,共得到498例前列腺癌樣本,對照樣本為52例。分析樞紐基因在對照組及前列腺癌樣本組的表達(dá),R軟件采用COX分析前列腺癌患者的預(yù)后生存曲線。
人前列腺癌細(xì)胞系PC3及LNCap由暨南大學(xué)附屬第一醫(yī)院中心實(shí)驗(yàn)室保存。細(xì)胞與RPMI 1640培養(yǎng)液中培養(yǎng),待細(xì)胞融合至50%,采用Lipofectamine 2000試劑盒進(jìn)行轉(zhuǎn)染,HNRNPA2B1 siRNA及對照片段由GenePharma 吉瑪公司提供,序列為:5'-GCAACCUU CUAACUACGGUtt-3' 和 5'-ACCGUAGUUAGAAG GUUGCtt-3'。方法步驟參照之前文獻(xiàn)進(jìn)行[16]。細(xì)胞轉(zhuǎn)染HNRNPA2B1 siRNA片段后,收集各組處理細(xì)胞,用100 μL無血清重懸轉(zhuǎn)入Transwell小室,進(jìn)行遷移和侵襲(鋪Matrigel膠),在37 ℃,5%CO2的細(xì)胞培養(yǎng)箱孵育24 h候取出小室,4%多聚甲醛固定20 min,PBS洗滌1次,結(jié)晶紫染色10 min,PBS洗滌干凈,并于顯微鏡下觀察細(xì)胞是否穿透小孔,并進(jìn)行拍照,200倍光鏡選取5個(gè)視野計(jì)數(shù)穿膜細(xì)胞數(shù),實(shí)驗(yàn)重復(fù)3次。
PC3及LNCap細(xì)胞分別接種于96孔板并進(jìn)行小分子干擾轉(zhuǎn)染,48 h后收集細(xì)胞,每孔加入20 μL MTT溶液(5 mg/mL),繼續(xù)培養(yǎng)4 h,每孔加入100 μL二甲基亞砜,置搖床上低速振蕩10 min。在酶標(biāo)儀測量各孔的吸光度值A(chǔ)490nm。
PC3和LNCap細(xì)胞轉(zhuǎn)染后48 h后,用0.25%胰酶-EDTA消化,并用預(yù)冷的PBS洗滌3次,2000 r/min離心5 min,收集細(xì)胞。在檢測細(xì)胞凋亡的試管中先后加入1×Buffer 100 mL、Annexin Ⅴ-FITC 染液5 μL、PI 染液1 μL,避光15 min,再加入1×Buffer 400 μL,上流式細(xì)胞儀進(jìn)行檢測。
細(xì)胞轉(zhuǎn)染后,然后將細(xì)胞懸液轉(zhuǎn)移到1.5 mL EP管中混勻并稀釋,按照20 000/孔的細(xì)胞濃度接種于6孔板,1次/3 d觀察及換液,克隆10 d左右,觀察克隆團(tuán)形成。吸出所有的培養(yǎng)基并清洗,用4%的多聚甲醛固定15 min,然后用0.1%結(jié)晶紫染色15 min后清洗,干燥后進(jìn)行拍照,最后對克隆細(xì)胞團(tuán)計(jì)數(shù)并進(jìn)行統(tǒng)計(jì)學(xué)分析。
采用SPSS 20.0 統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析,計(jì)量資料均由均數(shù)±標(biāo)準(zhǔn)差表示,兩組間差異分析使用Student'st-test進(jìn)行統(tǒng)計(jì),P<0.05 表示差異有統(tǒng)計(jì)學(xué)意義。
該隊(duì)列研究共收集了171個(gè)組織樣本,包含了前列腺癌旁組織81例、前列腺癌組織65例及前列腺轉(zhuǎn)移組織25例。使用R軟件讀取及預(yù)處理芯片數(shù)據(jù)后,共得到可注釋的8585個(gè)基因。對3組樣本進(jìn)行了PCA主成分分析,原位癌組和癌旁組聚類分不開,而癌轉(zhuǎn)移組的基因成分和前面兩組有顯著區(qū)別,可單獨(dú)聚類(圖1)。
圖1 基于3個(gè)組別每個(gè)樣本的基因表達(dá)情況,進(jìn)行PCA主成分分析Fig.1 PCA principal component analysis based on gene expression profile of each sample in 3 groups.
通過R語言的limma包進(jìn)行了原位癌組ⅤS癌旁組、癌轉(zhuǎn)移組ⅤS 原位癌組的比較。以FDR<0.05 和|log2FC|>1.2 為閾值,進(jìn)行差異基因的篩選。結(jié)果表明,原位癌與癌旁組的基因表達(dá)差異不大,只發(fā)現(xiàn)了9個(gè)上下調(diào)差異基因(圖2A),轉(zhuǎn)移癌與原位癌基因差別明顯,共篩選到425個(gè)差異基因(圖2B)。
圖2 DEGs火山圖Fig.2 Volcano map for the differentially expressed genes (DEGs).A:Volcano map for DEGs between in situ and adjacent tissues of PCa.B:Volcano map for DEGs between metastatic and in situ tissues of PCa.
將轉(zhuǎn)移癌和原位癌的DEGs挑出來對其表達(dá)量進(jìn)行熱圖分析。結(jié)果顯示,DEGs差異顯著,分組聚合明顯(圖3)。
圖3 DEGs熱圖展示差異基因Fig.3 DEGs heat map showing the differential genes.The x-axis represents the genes,and the y-axis represents the sample groups;red represents up-regulated genes and green the down-regulated genes.
選取樣本間MAD方差最大的前7500個(gè)基因進(jìn)行WGCNA 分析。以相關(guān)系數(shù)0.9 作為標(biāo)準(zhǔn),使用pickSoftThredhold函數(shù),選擇鄰接矩陣權(quán)重參數(shù)(軟閾值)β=6為標(biāo)準(zhǔn)構(gòu)建基因模塊(圖4)。采用兩步法,設(shè)置每個(gè)基因模塊最小基因數(shù)目為30,設(shè)置0.25為砍枝和合并模塊高度,最終得到9個(gè)模塊,其中g(shù)rey模塊表示未入組的基因集。
圖4 WGCNA分析Fig.4 WGCNA analysis.A:Topological structure analysis of soft threshold parameters.B:Hierarchical clustering tree based on the difference of adjacent values.
轉(zhuǎn)移組與Green模塊及Purple模塊密切相關(guān),原位癌與Brown模塊密切相關(guān)(圖5)。
圖5 模塊與臨床特征相關(guān)性Fig.5 Correlation between modules and clinical characteristics.Red represents positive correlation,the numbers represent correlation coefficients,and the numbers in parentheses represent P values.
GO 富集分析前列腺癌轉(zhuǎn)移組的Green 模塊及Purple模塊,及癌原位組的Brown模塊,顯示:Purple模塊主要與干細(xì)胞分化、細(xì)胞分裂、免疫呈遞、炎癥反應(yīng)等生物學(xué)過程相關(guān),說明轉(zhuǎn)移過程中干細(xì)胞相關(guān)信號通路在這過程中的重要作用;而Brown模塊則主要是細(xì)胞生長、氨基酸代謝、細(xì)胞凋亡等生物學(xué)過程相關(guān)(圖6)。
圖6 各基因模塊的GO富集分析相關(guān)生物學(xué)過程Fig.6 GO enrichment analysis of the biological processes related with each gene module.
模塊基因與DEGs取交集,得到了與前列腺癌發(fā)生相關(guān)的多個(gè)樞紐基因(如BDH1、PAK4、EXTL3)及與前列腺癌轉(zhuǎn)移密切相關(guān)的樞紐基因(如NKTR、CTBP2、HNRNPA2B1)。TCGA數(shù)據(jù)庫分析結(jié)果顯示在兩組之間均差異顯著(圖7)。以中位數(shù)為界分成基因表達(dá)量高和低兩組進(jìn)行生存分析,結(jié)果顯示樞紐基因均與前列腺癌病人的預(yù)后密切相關(guān)(圖8)。
圖7 TCGA數(shù)據(jù)庫中各個(gè)基因在前列腺癌及對照組中的表達(dá)量Fig.7 Expression of BDH1 (A), PAK4 (B), EXTL3 (C), NKTR (D), CTBP2 (E) and HNRNPA2B1 (F) in prostate cancer and control group in the TCGAdatabase.
圖8 TCGA數(shù)據(jù)庫中基因表達(dá)量與前列腺癌病人的生存分析Fig.8 Gene expression in TCGA database and survival probability of prostate cancer patients based on expression level of BDH1(A),PAK4(B),EXTL3(C),NKTR(C),CTBP2(E)and HNRNPA2B1(F).
小分子干擾片段成功的將前列腺癌細(xì)胞系的HNRNPA2B1基因進(jìn)行了沉默(圖9A、B)?;虺聊琀NRNPA2B1后細(xì)胞的生長受抑制(圖9C、D),顯著誘導(dǎo)細(xì)胞凋亡(圖9E、F),抑制前列腺癌細(xì)胞系的克隆形成能力(圖10A、B),且細(xì)胞的遷移和侵襲能力顯著下降(圖10C~F)。
圖9 小分子沉默HNRNPA2B1觀察對前列腺癌細(xì)胞系(PC3及LNCap)生長和凋亡的影響Fig.9 Effect of HNRNPA2B1 siRNA on growth and apoptosis of prostate cancer cell lines (PC3 and LNCap).A,B:Western blotting showing the efficiency of HNRNPA2B1 siRNA (NC is the control group).C,D:MTT showing the growth of cells in each group at 24,48,72 and 96 h.E,F:Flow cytometry showing cell apoptosis in each group.*P<0.05,**P<0.01,***P<0.01.
圖10 小分子沉默HNRNPA2B1觀察對前列腺癌克隆形成、細(xì)胞系遷移和侵襲的影響Fig.10 Effect of HNRNPA2B1 siRNA on colony formation,migration and invasion of the prostate cancer cell lines.A-B:Colony formation experiment.C-F:Transwell assay to observe cell migration and invasion(Scale bar:20 μm).*P<0.05,**P<0.01.
前列腺癌的潛伏期長、患病率高、發(fā)病率高、死亡率高,是一個(gè)亟待解決的醫(yī)學(xué)問題[17]。由于前列腺癌發(fā)病的分子機(jī)制非常復(fù)雜,涉及多種基因改變[18]。因此深入闡明前列腺癌發(fā)生和轉(zhuǎn)移的分子機(jī)制有助于為開發(fā)前列腺癌治療新靶點(diǎn)提供依據(jù)。
在本研究中,我們通過GEO數(shù)據(jù)庫下載了前列腺癌大樣本對列研究全基因組芯片數(shù)據(jù)GSE6919,經(jīng)處理注釋后,進(jìn)行PCA主成分分析,通過R語言limma包分析癌原位與癌旁、癌轉(zhuǎn)移與癌原位組別的差異表達(dá)基因(DEGs),發(fā)現(xiàn)該數(shù)據(jù)來源的原位癌與癌旁基因分組不明顯,而癌轉(zhuǎn)移組則具有明顯的聚類且基因表達(dá)有顯著差異;WGCNA構(gòu)建基因共表達(dá)網(wǎng)絡(luò),分析識別與前列腺原位癌及轉(zhuǎn)移癌組相關(guān)模塊,對密切相關(guān)模塊進(jìn)行功能注釋(GO),并利用可視化篩選出關(guān)鍵基因,發(fā)現(xiàn)了與前列腺癌發(fā)生相關(guān)的多個(gè)樞紐基因,如BDH1、PAK4、EXTL3及與前列腺癌轉(zhuǎn)移密切相關(guān)的樞紐基因,如NKTR、CTBP2、HNRNPA2B1。進(jìn)一步利用TCGA公共數(shù)據(jù)對關(guān)鍵基因進(jìn)行驗(yàn)證,發(fā)現(xiàn)BDH1、PAK4、EXTL3、NKTR、CTBP2及HNRNPA2B1基因在前列腺癌中表達(dá)有差異且與前列腺癌病人的預(yù)后密切相關(guān)。我們選擇了與前列腺癌轉(zhuǎn)移密切相關(guān)的高表達(dá)基因HNRNPA2B1進(jìn)行實(shí)驗(yàn)驗(yàn)證。合成并驗(yàn)證了HNRNPA2B1 siRNA的小分子干擾片段,對前列腺癌轉(zhuǎn)移灶細(xì)胞系LNCap和PC3細(xì)胞系轉(zhuǎn)染后,發(fā)現(xiàn)干擾HNRNPA2B1后細(xì)胞的生長增殖能力變緩,細(xì)胞凋亡增加,克隆形成能力減弱,且遷移和侵襲能力顯著下降。通過數(shù)據(jù)庫分析挖掘與細(xì)胞實(shí)驗(yàn)的雙重驗(yàn)證,顯示HNRNPA2B1基因的高表達(dá)與前列腺癌轉(zhuǎn)移密切相關(guān)。
HNRNPA2B1 在人體組織中發(fā)揮功能,如信使RNA 加工、參與端粒的維持和細(xì)胞增殖的調(diào)控[19,20]。HNRNPA2B1 在多種腫瘤細(xì)胞系中高表達(dá),HNRNPA2B1在胃癌[21]、乳腺癌[22]、肝癌[23]、膠質(zhì)母細(xì)胞瘤[24]、肺癌及胰腺癌中高表達(dá),并參與細(xì)胞凋亡和上皮-間充質(zhì)轉(zhuǎn)化(EMT),其可作為癌癥發(fā)展階段的一種生物標(biāo)志物[18,25]。HNRNPA2B1是ΚRAS激活A(yù)ΚT-mTOR信號以及PDAC細(xì)胞存活和小鼠腫瘤形成所必需的,且HNRNPA2B1可能是胰腺癌的治療靶點(diǎn)[26]。HNRNPA2B1可通過調(diào)節(jié)信號轉(zhuǎn)導(dǎo)子和轉(zhuǎn)錄激活子3(STAT3)以及細(xì)胞外信號調(diào)節(jié)激酶1/2(ERΚ1/2)信號通路,從而增加細(xì)胞的致瘤潛能[22]。抑制HNRNPA2B1可抑制丙酮酸激酶同工酶M2(PΚM2)[27]和腫瘤蛋白P53 誘導(dǎo)核蛋白2(TP53INP2)的選擇性剪接[28],已知PΚM2是腫瘤中葡萄糖代謝的關(guān)鍵酶,而TP53INP2是侵襲性細(xì)胞運(yùn)動(dòng)的重要組成部分。HNRNPA2B1是低氧誘導(dǎo)腫瘤存活的重要分子靶點(diǎn)[29],它參與低氧誘導(dǎo)腫瘤存活。近期研究還發(fā)現(xiàn)HNRNPA2B1 可識別病原DNA和放大IFN-α/β生產(chǎn)。當(dāng)HNRNPA2B1易位到細(xì)胞質(zhì)中,激活TBΚ1-IRF3通路,導(dǎo)致IFN-α/β生產(chǎn),還可促進(jìn)N6-甲基腺苷(m6A)的修飾和CGAS、IFI16 和STING mRNAs的核質(zhì)轉(zhuǎn)運(yùn)[30]。提示HNRNPA2B1功能多樣,是多種腫瘤的致癌因子和潛在的治療靶點(diǎn)。
癌癥基因組圖譜(TCGA)對大量人類腫瘤進(jìn)行了剖析和分析,發(fā)現(xiàn)DNA、RNA、蛋白質(zhì)和表觀遺傳水平上的分子畸變[31]。由于國家癌癥研究所和各研究所的嚴(yán)格控制,TCGA數(shù)據(jù)質(zhì)量很高,癌癥/數(shù)據(jù)集之間的可比性比其他研究要高得多。我們通過GEO數(shù)據(jù)庫得到前列腺癌基因芯片數(shù)據(jù)后,進(jìn)行加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA),找到差異基因得到BDH1、PAK4、EXTL3、NKTR,CTBP2、HNRNPA2B1共6個(gè)樞紐基因。再通過TCGA數(shù)據(jù)庫對上述基因進(jìn)行驗(yàn)證,發(fā)現(xiàn)了與前列腺癌轉(zhuǎn)移密切相關(guān)的樞紐基因,如NKTR、CTBP2、HNRNPA2B1。為進(jìn)一步驗(yàn)證其與前列腺癌轉(zhuǎn)移的相關(guān)性,我們選取高表達(dá)基因HNRNPA2B1,進(jìn)行了細(xì)胞功能的實(shí)驗(yàn)驗(yàn)證,發(fā)現(xiàn)沉默HNRNPA2B1基因后細(xì)胞生長、增殖、遷移和侵襲能力顯著減弱。因此權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA)是鑒別疾病發(fā)生發(fā)展樞紐基因的可靠工具。
綜上,我們基于加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析GEO數(shù)據(jù)庫中的前列腺癌基因芯片數(shù)據(jù),加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析可計(jì)算各基因間的Pearson相關(guān)系數(shù),通過選擇適當(dāng)?shù)拈撝郸逻M(jìn)行網(wǎng)絡(luò)構(gòu)建。通過計(jì)算基因及模塊顯著性以及模塊與臨床性狀顯著性,找到前列腺癌進(jìn)展的樞紐基因;再通過TCGA數(shù)據(jù)庫及細(xì)胞實(shí)驗(yàn)驗(yàn)證了樞紐基因與前列腺癌轉(zhuǎn)移的關(guān)系。因此加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析可以發(fā)現(xiàn)前列腺癌發(fā)生和轉(zhuǎn)移的樞紐基因,對研究前列腺癌發(fā)生發(fā)展的調(diào)控機(jī)制及臨床防治靶點(diǎn)提供了新思路。
南方醫(yī)科大學(xué)學(xué)報(bào)2021年11期