饒玉梅,王欣欣
(鄭州大學(xué)第一附屬醫(yī)院 婦科,河南 鄭州 450052)
女性生殖系統(tǒng)惡性腫瘤病死率中上皮性卵巢癌居首,雖然手術(shù)治療、鉑類為主的化療、貝伐珠單抗和多腺苷二磷酸核糖聚合酶抑制劑在一定程度上改善了預(yù)后,但晚期患者5 a生存率低于45%[1-2]。2021年美國(guó)卵巢癌病例數(shù)約24.7萬(wàn)人[3],而我國(guó)每年死于卵巢癌的人數(shù)約為2.5萬(wàn)人,而且呈逐年上升趨勢(shì)[4],因此研究卵巢癌發(fā)生發(fā)展的分子學(xué)機(jī)制,尋找可靠的臨床標(biāo)志物,用于診斷和識(shí)別不同特征患者,并進(jìn)行分層,以便進(jìn)行更精準(zhǔn)的個(gè)體化治療,具有重要的臨床意義。
近年來(lái)隨著生物信息學(xué)技術(shù)的發(fā)展,借用計(jì)算機(jī)從宏觀上進(jìn)行大數(shù)據(jù)分析,改變了以往單個(gè)基因研究的局限性,可以在多基因水平更全面地研究腫瘤特性,為更好研究腫瘤發(fā)生發(fā)展機(jī)制提供新的方法。本研究借助于基因表達(dá)綜合數(shù)據(jù)庫(kù)(gene expression ominibus,GEO)公共大數(shù)據(jù)平臺(tái),通過(guò)對(duì)比正常卵巢組織的基礎(chǔ)上,得到卵巢癌差異表達(dá)基因(differentially expressed genes,DEGs),再通過(guò)多種大數(shù)據(jù)庫(kù)對(duì)差異基因進(jìn)一步篩選,獲得與卵巢癌預(yù)后密切關(guān)聯(lián)的基因,為進(jìn)一步研究卵巢癌的分子學(xué)機(jī)制進(jìn)行鋪墊工作。
1.1 數(shù)據(jù)提取從GEO數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/geo)中篩選下載數(shù)據(jù)集GSE14001、GSE14407,分析平臺(tái)為GPL570。GSE14001包含20例漿液性卵巢癌和3例正常卵巢組織;GSE14407包含12例漿液性卵巢癌和 12例正常卵巢組織。
1.2 差異表達(dá)基因篩選運(yùn)用GEO自有的在線分析工具GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r)分析所下載的數(shù)據(jù)集,篩選出DEGs。篩選標(biāo)準(zhǔn)為adj.P.Val<0.05,|log FC|>2,下載所得數(shù)據(jù),去除無(wú)探針對(duì)應(yīng)或一對(duì)多個(gè)探針的基因。將DEGs輸入Venn軟件(http://bioinformatics.psb.ugent.be/webtools/Venn/),得出DEGs的交集。設(shè)log FC<0為下調(diào)基因,log FC>0為上調(diào)基因[5-6]。
1.3 基因本體論(gene ontology,GO)富集分析和京都基因和基因組百科全書(shū)(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析利用DAVID數(shù)據(jù)庫(kù)(https://david.ncifcrf.gov/)對(duì)所得DEGs進(jìn)行GO和KEGG富集分析,P<0.05為富集差異有統(tǒng)計(jì)學(xué)意義,結(jié)果大于3的僅列出差異最顯著的前三位[7]。
1.4 蛋白相互作用網(wǎng)絡(luò)(the protein- protein interaction network,PPI)及模塊分析應(yīng)用String11.0網(wǎng)站http://string-db.org分析DEGs,參數(shù)設(shè)置:maximum number of interactors=0,confidence score≥0.4,將分析所得數(shù)據(jù)導(dǎo)入Cytoscape 3.7.1軟件的插件MCODE 1.5.1,進(jìn)行分析,參數(shù)設(shè)置:degree cutoff=2,max.Depth=100,k-core=2,node score cutoff=0.2,得到關(guān)鍵基因網(wǎng)絡(luò)模塊[8]。
1.5 篩選分析關(guān)鍵基因用Kaplan Meier plotter網(wǎng)站http://kmplot.com/analysis分析網(wǎng)絡(luò)模塊關(guān)鍵基因,篩選出與患者總生存期(overall surviva,OS)有相關(guān)性的基因(P<0.05)。將篩選出的基因,通過(guò)GEPIA數(shù)據(jù)庫(kù)(http://gepia.cancer-pku.cn),再一次篩選出卵巢癌中表達(dá)異常的基因(P<0.05)[9]。
1.6 關(guān)鍵基因蛋白質(zhì)在正常卵巢及卵巢癌中表達(dá)及定位The Human Protein Atlas數(shù)據(jù)庫(kù)(https://www.proteinatlas.org/)提供了2萬(wàn)余種人類蛋白質(zhì)的細(xì)胞、組織和器官分布信息,并應(yīng)用免疫組化技術(shù)檢查每種蛋白質(zhì)在人類48種正常組織、20余種腫瘤組織中的表達(dá)情況。在該數(shù)據(jù)庫(kù)中檢索篩選的關(guān)鍵基因,在Tissue選項(xiàng)中選擇“ovary”,在Pathology分析中選擇“ovarian Cancer”,分別獲得上述基因的蛋白質(zhì),在正常卵巢組織和卵巢癌組織中表達(dá)的免疫組化情況,進(jìn)一步分析其表達(dá)和定位[10-11]。
2.1 篩選差異基因從GSE14001數(shù)據(jù)集得到1 199個(gè)DEGs,其中上調(diào)為518,下調(diào)為681;GSE14407中得到1 673個(gè)DEGs,上調(diào)為986,下調(diào)為687;二者交集得到211個(gè)DEGs,其中92個(gè)上調(diào)、119個(gè)下調(diào)基因。見(jiàn)圖1。
A為上調(diào)基因,B為下調(diào)基因。
2.2 GO和KEGG富集分析211個(gè)DEGs的GO富集主要從生物學(xué)過(guò)程、細(xì)胞組分和分子功能3個(gè)方面進(jìn)行分析,結(jié)果見(jiàn)表1,表內(nèi)基因數(shù)為對(duì)應(yīng)的DEGs數(shù)目,結(jié)果顯示差異基因主要參與細(xì)胞的氧化代謝、細(xì)胞外泌體、細(xì)胞運(yùn)動(dòng)等方面。KEGG通路主要集中于細(xì)胞黏附運(yùn)動(dòng)及癌癥通路等方面,見(jiàn)表2。
表1 卵巢癌DEGs的GO富集分析
表2 卵巢癌DEGs的KEGG富集分析
2.3 構(gòu)建PPI網(wǎng)絡(luò)選擇關(guān)鍵基因用String網(wǎng)站及Cytoscape軟件,對(duì)211個(gè)DEGs分析制作PPI網(wǎng)絡(luò)(圖2)。用MCODE插件對(duì)篩選的關(guān)鍵基因進(jìn)行網(wǎng)絡(luò)模塊構(gòu)建,得到3個(gè)模塊,其中第1個(gè)模塊里包含15個(gè)關(guān)鍵基因,第2個(gè)和第3個(gè)模塊各包含10個(gè)關(guān)鍵基因,共獲得35個(gè)關(guān)鍵基因,見(jiàn)圖3。
2.4 關(guān)鍵基因分析為分析35個(gè)關(guān)鍵基因與卵巢癌患者OS之間關(guān)系,使用Kaplan Meier plotter數(shù)據(jù)庫(kù)。其中22個(gè)基因與患者的預(yù)后存在相關(guān)性,分別為:ATP6V1C1(H+轉(zhuǎn)運(yùn)-ATP酶C1亞基)、ATP6V1D(H+轉(zhuǎn)運(yùn)-ATP酶D亞基)、ATP6V1E2(H+轉(zhuǎn)運(yùn)-ATP酶E2亞基)、ATP6V1H(H+轉(zhuǎn)運(yùn)-ATP酶H亞基)、ATP6V1F(H+轉(zhuǎn)運(yùn)-ATP酶F亞基,又名VATF)、GNAI1(鳥(niǎo)嘌呤核苷酸結(jié)合G蛋白α抑制活性肽1)、GNG11(鳥(niǎo)嘌呤核苷酸結(jié)合G蛋白γ11)、GNB4(鳥(niǎo)嘌呤核苷酸結(jié)合G蛋白β肽4)、GNB1(鳥(niǎo)嘌呤核苷酸結(jié)合G蛋白β肽1)、CXCL12(C-X-C基序趨化因子12)、GNG2(鳥(niǎo)嘌呤核苷酸結(jié)合G蛋白γ2)、GINS1(GINS復(fù)合體亞基1)、GINS4(GINS復(fù)合體亞基4)、WDHD1(WD重復(fù)和HMG框DNA結(jié)合蛋白1)等14個(gè)基因高表達(dá)與患者總生存期下降相關(guān)(P<0.05)。而ATP6V1B1(H+轉(zhuǎn)運(yùn)-ATP酶B1亞基)、ATP6V1C2(H+轉(zhuǎn)運(yùn)-ATP酶C2亞基)、ATP6V0D1( H+轉(zhuǎn)運(yùn)AT 酶V0亞基d1,又名VATX)、GNB3(G蛋白β3亞單位)、CXCR4(C-X-C基序趨化因子受體4)、GINS3(GINS復(fù)合體亞基3)、MCM3(微染色體維持缺陷3關(guān)聯(lián)蛋白)、MCM5(微染色體維持缺陷5關(guān)聯(lián)蛋白)等8個(gè)基因低表達(dá)與總生存期下降相關(guān)(P<0.05),見(jiàn)圖4,另外13個(gè)基因表達(dá)與患者總生存期無(wú)相關(guān)性。
用GEPIA數(shù)據(jù)庫(kù)分析上述22個(gè)篩選出來(lái)的關(guān)鍵基因在卵巢癌和正常卵巢組織中表達(dá)情況,結(jié)果示ATP6V1F、GINS1、GINS4在卵巢癌組織中表達(dá)高于正常組織,而GNB3在卵巢癌組織中表達(dá)低于正常組織(P<0.05),見(jiàn)圖5,其余18個(gè)基因在卵巢癌和正常組織間表達(dá)差異無(wú)統(tǒng)計(jì)學(xué)意義,或者與生存曲線表達(dá)趨勢(shì)的結(jié)論相悖。
2.5ATP6V1F、GINS1、GINS4、GNB3在卵巢及卵巢癌組織中的表達(dá)及定位于The Human Protein Atlas數(shù)據(jù)庫(kù)中獲取ATP6V1F、GINS1、GINS4、GNB3在卵巢及卵巢癌組織中的免疫組化檢測(cè)圖像,結(jié)果顯示,在蛋白水平上,ATP6V1F(抗體號(hào):HPA062011)在正常卵巢中不表達(dá),在卵巢癌中呈高、中表達(dá),表達(dá)主要定位于腫瘤細(xì)胞的胞質(zhì)和細(xì)胞核;GINS1(抗體號(hào):HPA051185)和GINS4(抗體號(hào):HPA024663)在正常卵巢中不表達(dá),在卵巢癌中呈中、低表達(dá),表達(dá)定位于腫瘤細(xì)胞的細(xì)胞質(zhì)、細(xì)胞膜和細(xì)胞核;GNB3(抗體號(hào):HPA040736)在正常卵巢中低表達(dá),定位于細(xì)胞質(zhì)和細(xì)胞膜,在卵巢癌中呈高、中表達(dá),定位于細(xì)胞核,細(xì)胞質(zhì)和細(xì)胞膜(圖6)。因此 ,ATP6V1F、GINS1、GINS4這3個(gè)基因與它們的mRNA表達(dá)水平一致,其蛋白水平在卵巢癌組織中表達(dá)升高,而GNB3蛋白表達(dá)水平與其mRNA表達(dá)水平不一致,在卵巢癌組織中表達(dá)高于正常組織(P<0.05)。故將選擇ATP6V1F、GINS1、GINS4這3個(gè)基因作為卵巢癌關(guān)鍵基因作為下一步繼續(xù)研究。
圖2 卵巢癌與正常卵巢組織DEGs的PPI網(wǎng)絡(luò)圖
圖3 關(guān)鍵基因模塊圖
圖5 ATP6V1F、GINS1、GINS4、GNB3在卵巢癌和正常卵巢組織中的表達(dá)
圖6 ATP6V1F、GINS1、GINS4、GNB3在卵巢癌和正常卵巢組織中的定位
全球范圍內(nèi)卵巢癌在婦科惡性腫瘤中的致死率都比較高[12],其中上皮性卵巢癌占卵巢癌的90%~95%[13]。而高級(jí)別漿液性癌是卵巢癌最常見(jiàn)的組織學(xué)亞型,占卵巢癌死亡的70%~80%[14]。本研究利用GEO數(shù)據(jù)庫(kù)中的GSE14001和GSE14407數(shù)據(jù)集,比對(duì)了漿液性卵巢癌和正常組織差異表達(dá)基因。通過(guò)GEO中的GEO2R工具,篩選出211個(gè)DEGs。DEGs的GO和KEGG通路富集分析結(jié)果顯示,它們集中在乏氧反應(yīng)、間充質(zhì)-上皮細(xì)胞信號(hào)傳導(dǎo)、細(xì)胞黏附通路、癌癥通路等方面,而這些過(guò)程或通路在惡性腫瘤的發(fā)生及演進(jìn)過(guò)程中有促進(jìn)作用,這已在許多種類惡性腫瘤中得到證實(shí),包括卵巢癌。本研究通過(guò)PPI網(wǎng)絡(luò)構(gòu)建、Kaplan Meier plotter數(shù)據(jù)庫(kù)、GEPIA數(shù)據(jù)庫(kù)分析、The Human Protein Atlas 數(shù)據(jù)庫(kù)等篩選,得到ATP6V1F、GINS1、GINS4這3個(gè)基因作為進(jìn)一步研究的對(duì)象。
V-ATP酶廣泛分布于真核細(xì)胞中,它分為兩部分,包括位于細(xì)胞質(zhì)部分V1和跨膜部分V0。V-ATP酶V1也被稱為ATP6V1,它由A-H共8個(gè)亞基組成[15]。ATP6V1F基因?qū)儆贏TP6V1家族成員之一,ATP6V1的主要功能是水解ATP,為運(yùn)輸氫離子提供能量。ATP6V1家族在腫瘤、腎臟疾病、骨骼發(fā)育異常和糖尿病等疾病中發(fā)揮著重要作用[16-17]。許多研究表明,ATP6V1家族成員在腫瘤組織或腫瘤細(xì)胞系中異常表達(dá),比如:ATP6V1C1在口腔鱗狀細(xì)胞癌中表達(dá)升高[18],ATP6V1A在胃癌組織中過(guò)表達(dá),且與組織學(xué)分級(jí)、淋巴結(jié)轉(zhuǎn)移、血管浸潤(rùn)有關(guān)。抑制ATP6V1A的表達(dá)可抑制胃癌細(xì)胞的增殖和侵襲能力,也可降低肝癌細(xì)胞的侵襲性[19]。ATP6V1C1通過(guò)激活mTORC1通路促進(jìn)乳腺癌的生長(zhǎng),并促進(jìn)乳腺癌的骨轉(zhuǎn)移[20]。而ATP6V1F相較于正常腎組織,其在腎透明細(xì)胞癌中表達(dá)是降低的[21],這表明ATP6V1家族在不同的腫瘤譜中表達(dá)不太相同,具有組織特異性,這也提示其在不同腫瘤中的作用功能亦不相同。而ATP6V1家族與卵巢癌之間關(guān)系的研究未見(jiàn)報(bào)道。本研究顯示ATP6V1家族中的ATP6V1F成員在卵巢癌組織中高表達(dá),且與患者的預(yù)后不良相關(guān),這與ATP6V1家族其他大多數(shù)成員在大部分腫瘤中的高表達(dá)和促進(jìn)腫瘤進(jìn)展作用的報(bào)道相一致,其具體作用機(jī)制需要進(jìn)一步研究,有可能成為卵巢癌預(yù)后的潛在標(biāo)志物。
GINS家族有4個(gè)成員,分別為GINS1、2、3、4,GINS1也被稱為PSF1伴侶,與SLD5、PSF2和PSF3形成異四聚體復(fù)合物,該復(fù)合物對(duì)DNA復(fù)制起始和復(fù)制叉的延伸至關(guān)重要[22]。GINS1最初被發(fā)現(xiàn)主要在高增殖細(xì)胞中表達(dá),而不是成熟細(xì)胞。每個(gè)GINS亞基的表達(dá)水平在不同的人類癌癥中不同,對(duì)腫瘤的發(fā)生和演進(jìn)起著重要作用。有研究顯示:GINS1在乳腺癌、結(jié)直腸癌、肝細(xì)胞癌、神經(jīng)膠質(zhì)瘤等多種腫瘤組織中高表達(dá),參與腫瘤的發(fā)生和發(fā)展。GINS1可通過(guò)usp15介導(dǎo)的TOP2A蛋白去泛素化促進(jìn)膠質(zhì)瘤細(xì)胞的增殖和遷移[23]。而GINS1在卵巢癌中的研究報(bào)道罕見(jiàn),有研究者基于全基因組SNP微陣列芯片研究,僅發(fā)現(xiàn)在卵巢癌和乳腺癌中GINS1基因高表達(dá)[24],而缺乏該基因的臨床及作用機(jī)制研究。本研究顯示,在卵巢癌中GINS1在RNA水平和蛋白質(zhì)水平均高表達(dá),且GINS1表達(dá)高的患者總生存期更短,表明GINS1在卵巢癌中是個(gè)促癌基因,能促進(jìn)卵巢腫瘤患者疾病的發(fā)生發(fā)展,對(duì)卵巢癌患者的預(yù)后有估測(cè)作用。The Human Protein Atlas數(shù)據(jù)庫(kù)中顯示GINS1在人正常唾液腺腺細(xì)胞中表達(dá)定位于細(xì)胞核,而在卵巢癌細(xì)胞中表達(dá)定位除了在細(xì)胞核中,還定位于細(xì)胞質(zhì)和細(xì)胞膜,這種異常定位可能與其導(dǎo)致卵巢腫瘤惡性生物學(xué)行為有關(guān)。有研究顯示GINS4在肺癌、胃癌、乳腺癌等組織中的表達(dá)水平明顯高于正常組織,GINS4亞單位表達(dá)水平的增加與肺癌、乳腺癌不良預(yù)后相關(guān)[25-26],而幾乎未見(jiàn)GINS4在卵巢癌中的研究。本研究結(jié)果顯示,與GINS1研究結(jié)果相似,GINS4在卵巢癌中無(wú)論RNA水平還是蛋白質(zhì)水平表達(dá)均升高,且高表達(dá)者患者預(yù)后不良,表明GINS4在卵巢癌中有促進(jìn)腫瘤進(jìn)展的作用,對(duì)患者預(yù)后有預(yù)測(cè)作用,可以試探性作為卵巢癌標(biāo)志性分子進(jìn)一步研究。GINS4在正常人唾液腺上皮細(xì)胞中主要定位于細(xì)胞核,其次定位于中心體。與GINS1相似,GINS4在卵巢癌中定位發(fā)生異化,可見(jiàn)于細(xì)胞質(zhì)、細(xì)胞膜和細(xì)胞核,這也可能提示其致瘤作用的機(jī)制所在,為下一步研究其在卵巢癌中的作用機(jī)制提供研究方向。
總之,本研究通過(guò)多種大樣本數(shù)據(jù)庫(kù)層層篩選驗(yàn)證,ATP6V1F、GINS1、GINS4基因在卵巢癌組織中,無(wú)論是RNA水平還是蛋白水平表達(dá)均高于正常組織,它們表達(dá)的升高提示患者生存期更短。ATP6V1F、GINS1、GINS4有可能是卵巢癌預(yù)后不良的新標(biāo)志物,需進(jìn)一步研究。