高雯琪 肖 晗 鄧艾平 劉 玨 鄧志芳
(1. 華中科技大學(xué) 同濟(jì)醫(yī)學(xué)院附屬武漢兒童醫(yī)院 婦女兒童健康研究所, 湖北 武漢 430015; 2. 華中科技大學(xué) 同濟(jì)醫(yī)學(xué)院附屬武漢市中心醫(yī)院 藥學(xué)部, 湖北 武漢 430022)
抑郁癥是常見(jiàn)的神經(jīng)精神疾病,位于全球疾病負(fù)擔(dān)的第三位[1]。世界衛(wèi)生組織統(tǒng)計(jì)結(jié)果顯示,全球范圍內(nèi)約有3.5億抑郁癥患者[2]。由于抑郁癥的高患病率、高致殘性,給個(gè)人和社會(huì)帶來(lái)了嚴(yán)重的健康風(fēng)險(xiǎn)和沉重的經(jīng)濟(jì)負(fù)擔(dān)。目前,重度抑郁癥(major depressive disorder,MDD)的診斷和治療是基于患者的癥狀和體征,對(duì)于MDD患者早期診斷的客觀標(biāo)準(zhǔn)仍有待闡明[3, 4]。基因組學(xué)技術(shù)的發(fā)展使研究人員能夠在基因組水平上研究多種疾病的基因表達(dá)和表觀遺傳學(xué)改變,而生物信息學(xué)分析方法的迅速發(fā)展為基因組學(xué)結(jié)果的解讀帶來(lái)了全新的思路,已廣泛用于分析差異表達(dá)基因、篩選疾病診斷和治療的生物標(biāo)志物[5-8]。
本研究中,我們從GEO數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)中下載MDD的表達(dá)譜數(shù)據(jù)集GSE32280。采用R軟件篩選出差異表達(dá)基因(differentially expressed genes,DEGs),并對(duì)DEGs進(jìn)行功能注釋和通路富集分析。之后構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)并鑒定疾病相關(guān)的關(guān)鍵(hub)基因,通過(guò)ROC曲線對(duì)hub基因進(jìn)行診斷價(jià)值分析,以期篩選出MDD的分子診斷標(biāo)志物。
從美國(guó)國(guó)立生物信息中心(National Center for Biotechnology Information, NCBI)的GEO數(shù)據(jù)庫(kù)[9]中下載表達(dá)譜數(shù)據(jù)集GSE32280。GSE32280數(shù)據(jù)集中一共包括16例外周血樣本,其中正常對(duì)照樣本8例(GSM799727, GSM799728, GSM799729, GSM799730, GSM799731, GSM799732, GSM799733, GSM799734)和MDD樣本8例(GSM799722, GSM799723,GSM799724,GSM799725,GSM799726, GSM799738, GSM799740, GSM799743)。數(shù)據(jù)集中的所有樣本均采用Agent GPL570平臺(tái)([HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array)進(jìn)行分析。GSE32280數(shù)據(jù)集的樣本下載自同一個(gè)平臺(tái),上傳的數(shù)據(jù)已經(jīng)經(jīng)過(guò)均一化處理,不需要進(jìn)一步校正。
使用R軟件的Limma包對(duì)GSE32280表達(dá)譜數(shù)據(jù)集篩選DEGs。設(shè)定閾值為調(diào)整后P<0.05、log FC<-0.5(下調(diào)基因)、log FC>0.5(上調(diào)基因)定義DEGs,并使用ggplot2包[10]繪制DEGs的火山圖,直觀展示DEGs的差異表達(dá)情況。
利用David(https://david.ncifcrf.gov/home.jsp)進(jìn)行GO(gene ontology)分析。GO分析包括細(xì)胞組分(cell component,CC)、分子功能(molecular function,MF)和生物過(guò)程(biological process,BP)三個(gè)方面。KEGG(kyoto encyclopedia of genes and genomes)是一個(gè)通路集合的數(shù)據(jù)庫(kù)。我們使用R軟件Cluster Profile包[11]對(duì)DEGs進(jìn)行GO和KEGG通路富集分析。
STRING (https://string-db.org/)是一個(gè)旨在評(píng)估蛋白-蛋白互作的在線工具[12]。采用Cytoscape軟件中MCODE模塊對(duì)STRING的結(jié)果進(jìn)行分析和可視化。運(yùn)用CytoHubba模塊選擇最大相關(guān)標(biāo)準(zhǔn)中的前16個(gè)基因作為hub基因。Network Analyst (https://www.networkanalyst.ca/faces/home.xhtml)是一個(gè)PPI網(wǎng)絡(luò)可視化分析平臺(tái)。我們將16個(gè)hub基因輸入Network Analyst中,以實(shí)現(xiàn)PPI網(wǎng)絡(luò)的可視化。
采用R軟件的pROC包[13]進(jìn)行ROC曲線分析,評(píng)估16個(gè)hub基因的診斷價(jià)值,并篩選出MDD的診斷生物標(biāo)志物。
數(shù)據(jù)測(cè)量采用R軟件(3.5.2版),P<0.05認(rèn)為有統(tǒng)計(jì)學(xué)意義。
GSE32280數(shù)據(jù)集中一共包括16例外周血樣本,其中8例為正常樣本,8例為MDD樣本。采用R軟件篩選正常和MDD樣本之間的DEGs,設(shè)定閾值為調(diào)整后P<0.05、log FC<-0.5(下調(diào)基因)、log FC>0.5(上調(diào)基因)。如圖1所示,GSE32280數(shù)據(jù)集中共發(fā)現(xiàn)104個(gè)DEGs,其中上調(diào)基因47個(gè),下調(diào)基因57個(gè)。
對(duì)GSE32280數(shù)據(jù)集中篩選出來(lái)的104個(gè)DEGs進(jìn)行GO功能注釋分析。結(jié)果顯示,下調(diào)DEGs的BP變化主要富集在細(xì)胞增殖、炎癥反應(yīng)、轉(zhuǎn)運(yùn)調(diào)控;CC的變化包括血小板顆粒和分泌顆粒;MF的變化主要富集在細(xì)胞因子活性、趨化因子活性、趨化因子受體結(jié)合程度(見(jiàn)圖2A)。上調(diào)DEGs主要涉及的BP包括免疫反應(yīng)、腫瘤壞死因子生成以及防御機(jī)制;CC的變化包括細(xì)胞質(zhì)膜、細(xì)胞表面;MF的變化主要富集在MHC蛋白和多糖錨定(見(jiàn)圖2B)。KEGG通路富集分析結(jié)果顯示,DEGs主要富集于NK細(xì)胞介導(dǎo)的細(xì)胞毒性、細(xì)胞因子與其受體相互作用和趨化因子信號(hào)通路(見(jiàn)圖2C和2D)。
GSEA分析結(jié)果顯示,富集的通路包括成熟型糖尿病通路、糖胺聚糖生物合成、糖酵解合成途徑、鈣信號(hào)通路、背腹軸形成等(見(jiàn)圖3)。Ryanodine受體2 (RYR2)、鈣電壓門(mén)控通道亞基alpha 1c (CACNA1C)和鈣電壓門(mén)控通道亞基alpha 1s (CACNA1S)是這些通路的重要基因(見(jiàn)圖4)。
通過(guò)STRING對(duì)GSE32280數(shù)據(jù)集中篩選出來(lái)的DEGs進(jìn)行分析。將分析結(jié)果導(dǎo)入Cytoscape,采用MCODE插件構(gòu)建PPI網(wǎng)絡(luò),PPI網(wǎng)絡(luò)如圖5A所示,獲得10節(jié)點(diǎn),41對(duì)PPI關(guān)系。然后,運(yùn)用CytoHubba插件,獲取16個(gè)與MDD密切相關(guān)的hub基因,分別為CXCL8、IFNG、EGF、CXCL1、TLR3、PTGS2、CXCL5、CCL20、IL1RN、CXCL3、FASLG、CCR10、THBS1、CLEC7A、TNFSF4、OSM (見(jiàn)圖5B)。
采用ROC分析評(píng)估16個(gè)hub基因在MDD中的診斷價(jià)值。CXCL1、EGF、CXCL8和IFNG的ROC曲線下面積(area under the curve,AUC)分別為0.865、0.799、0.737、0.705(圖6),AUC在0.700~0.900之間被認(rèn)為是具有較高的診斷價(jià)值。因此,CXCL1、EGF、CXCL8和IFNG是MDD中具有較高診斷價(jià)值的基因。
抑郁癥已成為一個(gè)全球性的精神健康問(wèn)題[14]。近年來(lái),MDD的患病率不斷上升,但仍沒(méi)有實(shí)驗(yàn)室血液檢測(cè)來(lái)支持MDD的早期診斷[15]。微陣列基因芯片技術(shù)的快速發(fā)展和廣泛應(yīng)用揭示了疾病病理生理過(guò)程中的數(shù)千種基因表達(dá)變化,生物信息學(xué)結(jié)合微陣列基因芯片系統(tǒng)地對(duì)疾病中表達(dá)變化基因進(jìn)行全面分析,可以為疾病的早期診斷篩選出重要的生物標(biāo)記物[16]。因此,我們希望借助生物信息學(xué)分析和微陣列基因芯片結(jié)果對(duì)MDD的mRNA表達(dá)譜進(jìn)行分析,以篩選出MDD相關(guān)的診斷生物標(biāo)志物。
本研究中,我們首先從GEO數(shù)據(jù)庫(kù)中下載表達(dá)譜數(shù)據(jù)集GSE32280,使用R軟件在此數(shù)據(jù)集中篩選出104個(gè)DEGs。對(duì)104個(gè)DEGs進(jìn)行GO功能注釋分析發(fā)現(xiàn),DEGs主要富集在細(xì)胞增殖、炎癥反應(yīng)、轉(zhuǎn)運(yùn)調(diào)控等生物學(xué)過(guò)程;參與細(xì)胞因子活性、趨化因子活性、趨化因子受體結(jié)合等分子功能;DEGs的細(xì)胞成分主要富集于血小板顆粒和分泌顆粒。DEGs主要介導(dǎo)了NK細(xì)胞相關(guān)的細(xì)胞毒性、細(xì)胞因子與其受體相互作用和趨化因子信號(hào)通路。其次,我們運(yùn)用GSEA鑒定DEGs與MDD相關(guān)的基因和通路,富集的通路主要與鈣信號(hào)通路和心律失常性右心室心肌病(arrthythmia right ventricular cardiomyopathy, ARVC)通路相關(guān)。細(xì)胞內(nèi)鈣通道Ryanodine受體(RYR)、鈣電壓門(mén)控通道亞基alpha 1c (CACNA1C)是這些通路的重要基因。
RYR定位于神經(jīng)元的軸突、樹(shù)突棘和突觸前終端,在小腦、海馬、嗅區(qū)、基底神經(jīng)節(jié)和大腦皮層呈高表達(dá)。RYR負(fù)責(zé)介導(dǎo)Ca2+從細(xì)胞內(nèi)鈣池釋放[17],構(gòu)成了內(nèi)質(zhì)網(wǎng)膜和肌漿網(wǎng)膜上的細(xì)胞內(nèi)鈣釋放通道。經(jīng)過(guò)細(xì)胞膜進(jìn)入細(xì)胞的Ca2+能夠通過(guò)激活Ryanodine受體而直接觸發(fā)Ca2+從細(xì)胞內(nèi)鈣池釋放。在發(fā)育和衰老的生理過(guò)程中,細(xì)胞內(nèi)鈣穩(wěn)態(tài)主要受RYR的調(diào)節(jié)。RYR表達(dá)異常會(huì)引發(fā)細(xì)胞內(nèi)Ca2+水平失衡、細(xì)胞脆弱以及突觸神經(jīng)元功能受損,導(dǎo)致神經(jīng)元死亡,最終可能導(dǎo)致抑郁癥的發(fā)生[18]。
CACNA1C編碼L-型電壓依賴(lài)Ca2+通道α1C亞基,α1C亞基是Cav1.2的主要亞單位。Cav1.2是介導(dǎo)Ca2+進(jìn)入細(xì)胞內(nèi)的重要途徑,在樹(shù)突發(fā)育、神經(jīng)元存活、突觸可塑性、記憶形成、學(xué)習(xí)和行為中起著重要作用[19]。研究表明,CACNA1C已成為雙相情感障礙、重性抑郁癥和精神分裂癥等神經(jīng)精神疾病的候選風(fēng)險(xiǎn)基因[20]。CACNA1C雜合子缺失小鼠的Cav1.2蛋白水平、LTCC 電流降低,探究行為降低,對(duì)苯丙胺的反應(yīng)降低,在強(qiáng)迫游泳和懸尾試驗(yàn)存在抗抑郁樣行為[21]。抑制小鼠前額皮層CACNA1C表達(dá)后,小鼠出現(xiàn)顯著的抗抑郁樣行為[22]。本研究中的數(shù)據(jù)表明,CACNA1C、RYR很可能在抑郁癥患者外周血中表達(dá)出現(xiàn)明顯異常,因此我們推測(cè)CACNA1C、RYR可能參與MDD的病理生理機(jī)制。
本研究對(duì)hub基因進(jìn)行診斷價(jià)值評(píng)估發(fā)現(xiàn),4個(gè)基因(CXCL1、EGF、CXCL8和IFNG)與MDD病理生理機(jī)制密切相關(guān),可能成為MDD的診斷生物標(biāo)志物。其中,CXCL1和CXCL8均為趨化因子。趨化因子是由多種細(xì)胞分泌的、可引起白細(xì)胞趨化特性的細(xì)胞因子。趨化因子除了趨化及激活白細(xì)胞外,還具有刺激細(xì)胞增殖、促進(jìn)新生血管形成等多方面的生物學(xué)活性,在炎癥的致病機(jī)制中發(fā)揮重要作用[23]。研究表明,CXCL1在慢性不可預(yù)知抑郁模型的腦脊液中明顯升高[24]。CXCL8在抑郁癥患者外周血表達(dá)顯著升高[25]。表皮細(xì)胞生長(zhǎng)因子(epidermal growth factor,EGF),是一種重要細(xì)胞生長(zhǎng)因子。抑郁癥患者外周血中EGF水平升高,抗抑郁治療顯著降低EGF水平[26]。由此,我們推測(cè)CXCL1、CXCL8和EGF可能參與MDD的病理生理過(guò)程,可能成為潛在的MDD診斷生物標(biāo)志物。
本研究通過(guò)生物信息學(xué)的方法,對(duì)MDD的mRNA表達(dá)譜數(shù)據(jù)集進(jìn)行分析,共獲得104個(gè)DEGs和16個(gè)hub基因。進(jìn)一步對(duì)hub基因進(jìn)行ROC分析,得到4個(gè)診斷標(biāo)記物,分別是CXCL1、EGF、CXCL8和IFNG。本研究的結(jié)果為開(kāi)發(fā)新型MDD診斷生物標(biāo)記物提供了理論依據(jù)?;诖搜芯拷Y(jié)果,我們后續(xù)會(huì)在細(xì)胞和分子水平上進(jìn)一步研究MDD的病理生理機(jī)制。