張明潔,史菲菲,何嘉歡,劉紅彥
(河南大學(xué)人民醫(yī)院,河南 鄭州)
卵巢癌(ovarian cancer, OC)是我國第三大婦科惡性腫瘤,其致死率極高[1]。漿液性卵巢癌是OC最常見的組織學(xué)類型,約占70%[2]。由于OC早期缺乏有效的篩查方法,因此得到確診時通常是疾病晚期,5年生存率僅為30%~40%[3]。目前卵巢癌的發(fā)病機制尚不明確,用于診斷疾病發(fā)生發(fā)展的生物標(biāo)記物也有限[4]。因此,對OC相關(guān)的特定生物標(biāo)志和信號通路研究將有助于揭示OC的分子發(fā)病機制,改善患者預(yù)后。本研究從GEO數(shù)據(jù)庫下載不同的基因數(shù)據(jù)集,采用GEO2R篩選出漿液性卵巢癌的差異表達(dá)基因并對其進(jìn)行一系列分析,篩選出關(guān)鍵基因并分析其與患者總生存期關(guān)系,為漿液性卵巢癌分子機制的深入研究和診療策略的制定提供一定的理論依據(jù)。
GEO(Gene Expression Omnibus)數(shù)據(jù)庫是免費的微陣列芯片和基因譜數(shù)據(jù)庫,本研究從GEO數(shù)據(jù)庫[5](http://www.ncbi.nlm.nih.gov/geo/)篩選數(shù)據(jù)集GSE36668[6]、GSE54388[7]、GSE38666[8]。GSE36668包含4個漿液性卵巢癌組織樣本和4個正常卵巢組織樣本,GSE54388包含16個漿液性卵巢癌組織樣本和6個正常卵巢組織樣本,GSE38666包含18個漿液性卵巢癌組織樣本和12個正常卵巢組織樣本,如圖1。
采用GEO自帶分析軟件GEO2R[9](http://www.ncbi.nlm.nih.gov/geo/geo2r)對GSE36668、GSE54388、GSE38666基因數(shù)據(jù)集進(jìn)行分析,以P<0.05,|log (FC)| >1為標(biāo)準(zhǔn)篩選漿液性卵巢癌組織和正常卵巢組織的差異表達(dá)基因(differential methylation gene, DEGS)。然后采用Venny2.1.0[10](https://bioinfogp.cnb.csic.es/tools/venny/index.html)在線工具重疊三個數(shù)據(jù)集之間的DEGS。
圖1 GSE36668、GSE54388、GSE38666基因數(shù)據(jù)集樣本
圖2 A.上調(diào)差異表達(dá)基因B.下調(diào)差異表達(dá)基因
DAVID(functional Annotation bioinformatics microarray analysis, http://david .abcc.ncifcrf.gov/)是一個功能注釋工具綜合數(shù)據(jù)庫[11]。為了更加深入了解DEGS的功能,本研究應(yīng)用DAVID對DEGS分別進(jìn)行GO(gene ontology)功能和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析,P值<0.05具有統(tǒng)計學(xué)意義。
采 用STRING[12](search tool for the retrieval of interacting genes, https://stringdb.org/)在 線 工 具 構(gòu) 建DEGS的蛋白互作(protein-protein interaction, PPI)網(wǎng)絡(luò),中心度分?jǐn)?shù)>0.4被認(rèn)為是重要的。輸出TVS格式,并導(dǎo)入到Cytoscape 3.5.1軟件[13](http://www.cytoscape.org/download.php)。隨后在Cytoscape軟件引入插件cytoHuba篩選PPI網(wǎng)絡(luò)的Hub基因,同時應(yīng)用插件MCODE構(gòu)建PPI網(wǎng)絡(luò)的功能模塊。
GEPIA(http://gepia.cancer-pku.cn/)是用于癌癥和正?;虮磉_(dá)譜分析及交互式分析的網(wǎng)絡(luò)服務(wù)器[14]。我們利用GEPIA在人體圖中進(jìn)行了腫瘤組織和正常組織樣本的中值表達(dá)分析。Kaplan-Meier是用于評估ECA、TCGA和GEO數(shù)據(jù)庫基因?qū)ι娴挠绊懙囊环N常用網(wǎng)絡(luò)工具[15]。本研究采用Kaplan-Meier方法探索Hub基因與漿液性卵巢癌患者總生存率之間的關(guān)系。
通過GEO2R在線工具,本研究從GSE36668基因數(shù)據(jù)集的漿液性卵巢癌組織和正常卵巢組織中篩選出6504個DEGS,其中包括3296個上調(diào)和3208個下調(diào)的DEGS;從GSE54388基因數(shù)據(jù)集篩選出3592個DEGS,包括2134個上調(diào)和1458個下調(diào)的DEGS;從GSE38666基因數(shù)據(jù)集篩選出12450個DEGS,包括9506個上調(diào)和2944個下調(diào)的DEGS。重疊三個數(shù)據(jù)集的上調(diào)DEGS獲得867個上調(diào)的DEGS;重疊三個數(shù)據(jù)集的下調(diào)DEGS獲得616個下調(diào)的DEGS。Venny圖見圖2。
為了進(jìn)一步研究DEGS在漿液性卵巢癌的功能,采用DAVID數(shù)據(jù)庫對全部DEGS進(jìn)行GO功能和KEGG通路富集分析,GO功能分析發(fā)現(xiàn)上調(diào)的DEGS主要在細(xì)胞核、細(xì)胞質(zhì)、細(xì)胞膜等結(jié)構(gòu)表達(dá),參與細(xì)胞分裂、姐妹染色的單體的凝聚力、細(xì)胞增殖、轉(zhuǎn)錄正調(diào)控、蛋白質(zhì)結(jié)合、細(xì)胞的黏附等生物學(xué)過程;下調(diào)的DEGS主要在細(xì)胞質(zhì)、細(xì)胞膜、細(xì)胞外基質(zhì)外來體等結(jié)構(gòu)表達(dá),參與轉(zhuǎn)錄正負(fù)調(diào)控、細(xì)胞增殖負(fù)調(diào)控、細(xì)胞黏附、蛋白質(zhì)結(jié)合、特定DNA序列結(jié)合、鋅離子結(jié)合等生物過程(表1)。上調(diào)差異表達(dá)基因KEGG通路富集在細(xì)胞周期、癌癥、抗生素生物合成、代謝和PI3K-Akt信號通路;下調(diào)差異表達(dá)基因KEGG通路富集在干細(xì)胞功能性調(diào)控、癌癥、蛋白聚糖和黏著斑等信號通路(表2)。
表1 與漿液性卵巢癌相關(guān)的差異表達(dá)基因的主要GO富集分析
采用STRING和Cytoscape繪制DEGS的PPI網(wǎng)絡(luò)并圖像可視化(圖3A)。采用插件MCODE篩選PPI功能模塊(圖3B)。運用插件CytoHubba篩選 出10個Hub基 因,包 含AKT1、GAPDH、CKD1、CCNB1、CDC20、BRCA1、CCNA2、AURKB、TOP2A、MAD2L1(圖4)。
在人體圖中腫瘤和正常樣品的中值表達(dá)顯示了CDC20、AURKB、CCNB1、AKT1和GAPDH的表達(dá)情況(圖5)。采用Kaplan-Meier方法評估Hub基因與漿液性卵巢癌患者的預(yù)后關(guān)系,發(fā)現(xiàn)CDC20(P=0.015)、AURKB(P=0.039)、CCNB1(P=0.019)、AKT1(P=0.0031)和GAPDH(P=0.041)的高表達(dá)與漿液性卵巢癌患者預(yù)后不良相關(guān)(圖6)。我們推測,CDC20、AURKB、CCNB1、AKT1和GAPDH基因可能是漿液性卵巢癌預(yù)后不良的潛在生物標(biāo)記物。
圖3 DEGS的PPI網(wǎng)絡(luò)(A)和頂級模塊(B)
圖4 針對漿液性卵巢癌組織和正常組織,采用CytoHubba插件篩選出10個Hub基因,A.紅色表示高富集,黃色表示低富集,B.Hub基因的度值
表2 與漿液性卵巢癌相關(guān)的差異表達(dá)基因的KEGG通路分析
卵巢癌是婦科惡性腫瘤中最常見的死亡原因,盡管卵巢癌通常對鉑類化合物和紫杉烷類藥物的一線化療藥物反應(yīng)良好,但大多數(shù)患者會復(fù)發(fā)并產(chǎn)生化學(xué)耐藥性[16]。因此,了解該病的特定生物標(biāo)志對于疾病的早期診斷和治療至關(guān)重要。
本研究表明,CDC20、AURKB、CCNB1、AKT1及GAPDH基因是卵巢癌差異表達(dá)中的上調(diào)基因,其過表達(dá)與卵巢癌患者的預(yù)后差相關(guān)。CDC20(細(xì)胞分裂周期20)是細(xì)胞有絲分裂后期促進(jìn)復(fù)合物APC活化所需的紡錘體組裝檢查點分子,從而調(diào)控染色體單體分離,使細(xì)胞分裂進(jìn)入分裂后期[17,18]。研究表明,CDC20的敲低可降低胰腺腫瘤細(xì)胞[19]和肝癌細(xì)胞[20]的增殖并誘導(dǎo)G2/M細(xì)胞周期停滯。CDC20也被認(rèn)為與多種腫瘤的預(yù)后相關(guān),如結(jié)直腸癌[21]、胰腺癌[22]、肺癌[23]和乳腺癌[24]。AURKB(極光激酶B)是一種絲氨酸/蘇氨酸激酶,主要參與調(diào)控細(xì)胞有絲分裂和減數(shù)分裂過程[25]。研究證明,AURKB在多種惡性腫瘤如結(jié)直腸癌[26]、神經(jīng)母細(xì)胞瘤[27]和肺癌[28]細(xì)胞中高表達(dá)。CCNB1的高表達(dá)與多種腫瘤的發(fā)生發(fā)展相關(guān),如膀胱癌[29],大腸癌[30],乳腺癌[31]和垂體腺瘤[32]。根據(jù)文獻(xiàn)報道,AKT1基因E17K是乳腺癌的潛在生物標(biāo)志[33];AKT1基因在骨肉瘤組織中高表達(dá),敲低該基因可以抑制骨肉瘤細(xì)胞的生長[34];是硬化性肺細(xì)胞瘤的遺傳標(biāo)志[35]。GAPDH酶是有氧糖酵解途徑的關(guān)鍵酶,其功能具有多效性,GAPDH的非糖酵解功能包括調(diào)節(jié)細(xì)胞死亡、細(xì)胞自噬及DNA修復(fù)等,被認(rèn)為是癌癥和神經(jīng)退行性疾病等多種疾病的潛在治療靶點[36]。
本研究進(jìn)一步進(jìn)行了功能富集分析,以尋找與這些差異基因相關(guān)的蛋白功能。在GO分析中,細(xì)胞分裂、細(xì)胞增殖及轉(zhuǎn)錄的正負(fù)調(diào)控被富集。細(xì)胞的異常增殖與腫瘤的發(fā)生有關(guān),表明有相關(guān)癌基因的過度表達(dá)或抑癌基因的表達(dá)降低。此外,PI3K-Akt、蛋白聚糖及黏著斑信號通路被富集。PI3K-Akt信號通路參與多細(xì)胞過程,其過度激活與腫瘤的發(fā)生、細(xì)胞增殖、細(xì)胞生長、細(xì)胞凋亡、侵襲、轉(zhuǎn)移、免疫微環(huán)境及癌細(xì)胞的耐藥性密切相關(guān)[37]。富含亮氨酸的小蛋白聚糖(SLRP)是細(xì)胞外基質(zhì)的組成成分,可以調(diào)節(jié)細(xì)胞的增殖、遷移和血管生成。蛋白聚糖是一類調(diào)節(jié)膠原纖維形成的SLRP,也是一種天然的泛酪氨酸激酶抑制劑,可以減少腫瘤的生長[38]。經(jīng)多種體內(nèi)外的腫瘤模型研究發(fā)現(xiàn),蛋白聚糖具有抑制腫瘤生長、血管生成及腫瘤遷移的功能,是對抗實體腫瘤的理想候選藥物[39]。黏著斑是大的、含整合素的多蛋白跨膜組裝物,將細(xì)胞骨架與周圍的細(xì)胞外基質(zhì)相連,在細(xì)胞黏附和信號傳導(dǎo)中起關(guān)鍵作用,是上皮細(xì)胞穩(wěn)態(tài)、組織損傷反應(yīng)和腫瘤發(fā)生的主要調(diào)節(jié)因子[40]。
圖5 腫瘤組織和正常組織在人體圖中的中位表達(dá),A.CDC20,B.AURKB,C.CCNB1,D.AKT1,E.GAPDH
圖6 CDC20、AURKB、CCNB1、AKT1、GAPDH基因表達(dá)水平與漿液性卵巢癌患者的預(yù)后關(guān)系
綜上所述,通過從GEO數(shù)據(jù)庫篩選基因數(shù)據(jù)集并鑒定出漿液性卵巢癌和正常組織的DEGs。采用GO功能和KEGG通路富集分析進(jìn)一步表明了DEGs在漿液性卵巢癌的作用。此外,研究表明CDC20、AURKB、CCNB1、AKT1及GAPDH基因可能與患者的預(yù)后差有關(guān)。本研究為進(jìn)一步研究漿液性卵巢癌的發(fā)生發(fā)展、篩選預(yù)后標(biāo)志物及潛在治療靶點提供了一定的研究基礎(chǔ)。