王璐茜 陳志博 鄭曉露
[摘要] 目的 通過(guò)分析帕金森病患者與健康人基因芯片數(shù)據(jù),尋找差異基因及其關(guān)鍵通路。 方法 利用GEO數(shù)據(jù)庫(kù)中高通量基因芯片數(shù)據(jù)庫(kù)篩選出帕金森病患者與健康對(duì)照的芯片。采用GO基因功能注釋和KEGG通路富集分析,篩選出帕金森病的特征基因簇和通路,并進(jìn)行蛋白質(zhì)相互作用網(wǎng)絡(luò)可視化分析。 結(jié)果 篩選出15個(gè)差異基因及7個(gè)關(guān)鍵節(jié)點(diǎn)蛋白。經(jīng)差異基因分析后,發(fā)現(xiàn)神經(jīng)絲、網(wǎng)格蛋白包被組裝及多巴胺受體信號(hào)通路富集程度最高。 結(jié)論 本研究利用生物信息學(xué)方法,從不同的角度研究帕金森病的遺傳學(xué)背景,在基因?qū)用鏋榕两鹕〉脑\斷學(xué)標(biāo)志與精準(zhǔn)治療提供新的思路。
[關(guān)鍵詞] 帕金森病;差異基因;通路富集分析;生物信息學(xué)分析
[中圖分類(lèi)號(hào)] R742.5 ? ? ? ? ?[文獻(xiàn)標(biāo)識(shí)碼] A ? ? ? ? ?[文章編號(hào)] 1673-9701(2020)12-0001-04
[Abstract] Objective To find out the differential genes and their key pathways by analyzing the gene microarray data of Parkinson's patients and healthy people. Methods The high-throughput gene chip database in the GEO database was used to screen the chips of Parkinson's patients and healthy controls. Go gene function annotation and KEGG pathway enrichment analysis were used, the characteristic gene clusters and pathways of Parkinson's disease were screened, and the network visualization analysis of protein interaction was performed. Results 15 differential genes and 7 key node proteins were screened. After differential gene analysis, it was found that neurofilament, clathrin-coated assembly, and the degree of dopamine receptor signaling pathway enrichment were the highest. Conclusion This study uses bioinformatic methods to study the genetic background of Parkinson's disease from different perspectives, and provides new ideas for the diagnostic markers and precise treatment of Parkinson's disease at the genetic level.
[Key words] Parkinson's disease; Differential genes; Pathway enrichment analysis; Bioinformatic analysis
帕金森?。≒arkinsons disease,PD)是最常見(jiàn)的神經(jīng)退行性疾病之一,亦是最為常見(jiàn)的運(yùn)動(dòng)障礙疾病。該病在65歲以上人群中患病率約為1%,在80歲以上人群中患病率高達(dá)約4%[1,2]。帕金森病的臨床特征以運(yùn)動(dòng)障礙最為顯著,包括運(yùn)動(dòng)遲緩、肌強(qiáng)直、姿勢(shì)反射消失以及靜止性震顫[3]。其典型病理特征是中腦黑質(zhì)多巴胺能神經(jīng)元的丟失,和殘存神經(jīng)元內(nèi)異常蛋白包涵體即路易小體(Lewy body,LB)和路易突起(Lewy neurite,LN)的形成。其中,路易小體的主要成分是α-突觸核蛋白(α-synuclein,α-syn)[1,4]。PD的病理機(jī)制尚未明確,目前最主流的假說(shuō)認(rèn)為:在不利因素的誘導(dǎo)下,神經(jīng)元內(nèi)的α-syn首先從單體或四聚體聚集為異常寡聚體,而后逐步形成多聚體、淀粉樣纖維,最終聚集形成路易小體[5,6]。于此同時(shí),有越來(lái)越多的基因被發(fā)現(xiàn)與PD尤其是家族性PD的發(fā)病有關(guān),包括SNCA、LRRK2、VPS35、EIF4G1、DNAJC13和CHCHD2[7,8]。然而,目前已有的帕金森病相關(guān)基因的研究仍未幫助我們找到PD的確切發(fā)病機(jī)制及有效的病因治療方法,以左旋多巴為首的藥物對(duì)癥治療仍是PD的主要治療手段[7]。因此,本研究旨在通過(guò)生物信息學(xué)的方法,對(duì)不同數(shù)據(jù)庫(kù)中的PD基因信息進(jìn)行整合、分析,從而找到PD中的差異表達(dá)基因(differentially-expressed gene,DEG)及其相關(guān)通路,為探索PD的遺傳學(xué)病因和發(fā)病機(jī)制提供新的證據(jù),現(xiàn)報(bào)道如下。
1 資料與方法
1.1 差異表達(dá)基因篩選
利用NCBI(National center for biotechnology information)平臺(tái)下的GEO數(shù)據(jù)庫(kù)進(jìn)行DEG篩選。在GEO數(shù)據(jù)庫(kù)中以“Parkinsons disease”、“Homo sapiens”、“tissue”為關(guān)鍵詞搜索基因序列,排除微小RNA、線(xiàn)粒體DNA、非體內(nèi)腦組織取材標(biāo)本等相關(guān)數(shù)據(jù),最終有3個(gè)數(shù)據(jù)集入選:GSE8397、GSE28894和GSE 20164。其中,GSE8397的數(shù)據(jù)出自GPL96平臺(tái),來(lái)源于24例PD患者和13例健康對(duì)照的紋狀體樣本;GSE28894的數(shù)據(jù)來(lái)源于15例PD患者和 15例健康對(duì)照的紋狀體樣本;GSE20164的數(shù)據(jù)來(lái)源于6例PD患者和5例健康對(duì)照的紋狀體黑質(zhì)樣本。利用在線(xiàn)工具GEO2R(https://www.ncbi.nlm. nih.gov/geo/geo2r/)分析各個(gè)數(shù)據(jù)集,選取P<0.05,|logFC|>1的基因?yàn)楹蜻x差異基因。三個(gè)數(shù)據(jù)集中選取出的差異基因取交集,篩選出DEG?;蚩s寫(xiě)列表見(jiàn)表1。
1.2 基因功能注釋與通路富集分析
利用DAVID生物信息資源數(shù)據(jù)庫(kù)(https://david.ncifcrf. gov/,版本6.8)中在線(xiàn)分析工具,以人源基因?yàn)楸尘斑M(jìn)行GO(Gene ontology)和KEGG(Kyoto encyclopedia of genes and genomes)通路富集,設(shè)定P<0.05。
1.3 蛋白相互作用網(wǎng)絡(luò)分析
利用Cytoscape 3.5.1(版本6.8)的蛋白相互作用網(wǎng)絡(luò)分析插件MCODE(Version 1.4.2,Bader Lab,University of Toronto)對(duì)構(gòu)建的生物學(xué)網(wǎng)絡(luò)中的區(qū)域進(jìn)行關(guān)聯(lián)度分析。通過(guò)分析網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)關(guān)聯(lián)積分值,可獲得整個(gè)網(wǎng)絡(luò)中可能形成的蛋白質(zhì)簇和關(guān)鍵節(jié)點(diǎn)蛋白,并在Cytoscape中進(jìn)行可視化顯示。
2 結(jié)果
2.1 帕金森病中差異表達(dá)基因的篩選
經(jīng)過(guò)對(duì)GEO數(shù)據(jù)庫(kù)的檢索,以下三個(gè)數(shù)據(jù)集的數(shù)據(jù)被納入本研究:GSE8397、GSE28894和GSE20164。通過(guò)對(duì)該三個(gè)數(shù)據(jù)集中對(duì)照組與PD組之間的比較分析,分別確定了362、884和573個(gè)DEG,隨后從中綜合篩選出15個(gè)共同差異表達(dá)的基因,分別是RALYL、SYNGR3、NEFH、RGS4、HMP19、NEFL、CALY、CHGB、SYT1、INA、SLC18A2、FGF13、NSG1、GABBR2、STMN2。見(jiàn)圖1。
2.2 DEG的基因功能注釋與通路富集分析
選取“2.1”中所篩選出的DEG,利用DAVID生物信息資源數(shù)據(jù)庫(kù)中在線(xiàn)分析工具,以人源基因?yàn)楸尘斑M(jìn)行GO(Gene ontology)和KEGG(Kyoto Encyclopedia of genes and genomes)通路富集,得出顯著富集的基因功能24項(xiàng)及通路1條(P<0.05)。見(jiàn)表2。其中有3項(xiàng)基因功能富集因子較高、差異最為顯著,分別是神經(jīng)絲、網(wǎng)格蛋白包被組裝及多巴胺受體信號(hào)通路,見(jiàn)封三圖1;其涉及到的基因包括:INA、NEFH、NEFL、CALY、NSG1、HMP19。
2.3 蛋白相互作用網(wǎng)絡(luò)可視化分析
通過(guò)對(duì)蛋白-蛋白相互作用進(jìn)行評(píng)分,作出可視化網(wǎng)絡(luò),基于前述基因富集通路的蛋白相互作用構(gòu)建網(wǎng)絡(luò)。見(jiàn)圖 2。從該網(wǎng)絡(luò)中找出蛋白質(zhì)簇及其中的關(guān)鍵節(jié)點(diǎn)蛋白,分別為NEFL、CALY、RALYL、CHGB、STMN2、SYNGR3、SYT1。見(jiàn)圖3。
3 討論
作為最常見(jiàn)的運(yùn)動(dòng)障礙疾病,帕金森病對(duì)患者(尤其是疾病晚期患者)的運(yùn)動(dòng)功能及生活質(zhì)量造成了廣泛而巨大的負(fù)面影響。然而,近幾十年對(duì)帕金森病的大量研究仍未完全明確該病的發(fā)病機(jī)制,亦無(wú)法提供有效的病因治療。
本研究通過(guò)GEO數(shù)據(jù)庫(kù)檢索獲得了3個(gè)數(shù)據(jù)集中帕金森病患者基因芯片共45例,將其與健康患者進(jìn)行比較,通過(guò)對(duì)基因芯片進(jìn)行表達(dá)譜差異分析,基因功能注釋和通路富集,最終篩選出帕金森病發(fā)病機(jī)制中的重要信號(hào)通路,并對(duì)其蛋白相互作用進(jìn)行可視化作圖。
本研究發(fā)現(xiàn),PD的差異基因在神經(jīng)絲、網(wǎng)格蛋白包被組裝及多巴胺受體信號(hào)通路這三項(xiàng)基因功能中富集程度最高、差異最為顯著。CALY、NSG1、HMP19這三個(gè)差異基因,則同時(shí)與多巴胺受體信號(hào)通路和網(wǎng)格蛋白包被組裝有關(guān)。其中,NSG1與CALY(又名NSG3)同屬神經(jīng)元富含核內(nèi)體蛋白(neuron-enriched endosomal protein)系,參與淀粉樣蛋白前體的水解、軸突轉(zhuǎn)運(yùn)等多種功能[9]。值得關(guān)注的是,神經(jīng)元內(nèi)的α-突觸核蛋白(α-synuclein,α-syn)聚集為異常寡聚體后逐步形成多聚體、淀粉樣纖維,最終聚集形成Lewy小體,是目前主流公認(rèn)的PD發(fā)病機(jī)制[5]。NSG1與CALY作為PD的差異基因,同時(shí)與淀粉樣蛋白前體的水解作用有關(guān),提示二者在PD發(fā)病過(guò)程中可能具有重要作用。另外,CALY亦是本研究中蛋白相互作用網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)蛋白。CALY主要位于前額皮質(zhì)及背側(cè)紋狀體區(qū)多巴胺D1受體表達(dá)的椎體細(xì)胞中,參與多巴胺相關(guān)通路并與D1受體上的多巴胺活性有關(guān),同時(shí)與D1受體存在著直接的相互作用[10,11]。而黑質(zhì)致密部中多巴胺能神經(jīng)元的丟失正是帕金森病的基本病理特點(diǎn)之一[1,12]。經(jīng)查閱,目前PD領(lǐng)域中尚無(wú)關(guān)于CALY、NSG1基因及其編碼蛋白的研究,其在PD發(fā)病機(jī)制中究竟有何作用,在PD治療領(lǐng)域有何價(jià)值,仍亟待更多的研究證實(shí)。
除CALY外,NEFL是本文在基因功能注釋與蛋白相互作用網(wǎng)絡(luò)可視化分析同時(shí)找出的另一個(gè)PD差異基因。近3年,外周血及腦脊液中NEFL蛋白濃度與帕金森綜合征之間的聯(lián)系逐漸引起了學(xué)界的重視。有研究曾對(duì)腦脊液NEFL濃度在PD診斷中的作用進(jìn)行系統(tǒng)分析并發(fā)現(xiàn),PD、帕金森病癡呆(Parkinsons disease dementia,PDD)、路易體癡呆(Dementia with lewy bodies,DLB)這三類(lèi)病患者的腦脊液NEFL水平與健康人相仿,而多發(fā)性硬化(Multiple system atrophy,MSA)、進(jìn)行性核上性麻痹(Multiple system atrophy,PSP)與皮質(zhì)基底節(jié)變性(Corticobasal syndrome of suspected tau underlying pathology,CBS)這三類(lèi)疾病患者的腦脊液NEFL水平則有明顯升高,因此腦脊液NEFL濃度將有希望用以鑒別PD及其他非典型的帕金森病綜合征[13]。另有研究表明,外周血中的NEFL水平具有相似的鑒別診斷作用[14]。與此同時(shí)卻有研究發(fā)現(xiàn)PD患者的外周血NEFL水平與其癡呆水平呈正相關(guān)[15-17]。一篇于2019年最新發(fā)表的論文更是進(jìn)一步提出,PD患者的外周血及腦脊液中的NEFL水平均遠(yuǎn)高于正常人[17]。結(jié)合本文結(jié)果,盡管NEFL在PD發(fā)病過(guò)程中的作用并不明確,該蛋白在幫助我們更加精準(zhǔn)診斷與治療帕金森病方面可能存在著巨大的價(jià)值。
SYNGR3是本研究篩選出的關(guān)鍵節(jié)點(diǎn)蛋白之一,位于神經(jīng)元中的多巴胺相關(guān)轉(zhuǎn)運(yùn)體,表達(dá)于紋狀體、海馬體、小腦及中腦多巴胺能神經(jīng)元等部位[18]。在PC12和MN9D細(xì)胞中,SYNGR3的表達(dá)不僅與多巴胺轉(zhuǎn)運(yùn)體(dopamine transporter,DAT)活性呈相關(guān)性,且可以被囊泡單胺轉(zhuǎn)運(yùn)體2(vesicular monoamine transporter type2,VMAT2)抑制劑利血平所阻斷[19]。有研究發(fā)現(xiàn)PD患者和PD小鼠的黑質(zhì)中SYNGR3都存在著顯著的降低[20,21]。
以上2個(gè)差異基因與1個(gè)關(guān)鍵節(jié)點(diǎn)蛋白與PD發(fā)病之間的聯(lián)系已經(jīng)得到了體內(nèi)及體外實(shí)驗(yàn)數(shù)據(jù)的支持,而其余差異基因與關(guān)鍵節(jié)點(diǎn)蛋白在PD尚無(wú)類(lèi)似的研究,亟待RT-PCR和Western blot實(shí)驗(yàn)在臨床樣本中進(jìn)一步驗(yàn)證。受數(shù)據(jù)庫(kù)數(shù)據(jù)所限,本研究也存在一定的局限性。本文采用的GEO數(shù)據(jù)庫(kù)僅提供mRNA水平的數(shù)據(jù),其蛋白表達(dá)與mRNA轉(zhuǎn)錄一致性仍有待明確。因此,帕金森病的特征基因仍需更深入的數(shù)據(jù)支持。
綜上所述,本研究利用多種生物信息學(xué)方法從不同的角度研究帕金森病的遺傳學(xué)背景,在基因?qū)用鏋榕两鹕』颊叩脑\斷學(xué)標(biāo)志與精準(zhǔn)治療提供新的思路。
[參考文獻(xiàn)]
[1] Lees AJ,Hardy J,Revesz T. Parkinson's disease[J]. Lancet (London, England),2009,373(9680):2055.
[2] Lau LMD,Breteler MM. Epidemiology of Parkinson's disease[J]. Proceedings of the Royal Society of Medicine,2006,5(6):525-535.
[3] Thomas B,Beal MF. Parkinson's disease[J]. Human Molecular Genetics,2007,16(R2):R183-R194.
[4] Dehay B,Bourdenx M,Gorry P,et al. Targeting α-synuclein for treatment of Parkinson's disease:Mechanistic and therapeutic considerations[J]. Lancet Neurology,2015, 14(8):855-866.
[5] Shahmoradian SH,Genoud C,Graff-Meyer A,et al. Lewy pathology in Parkinson's disease consists of a crowded organellar membranous medley[J]. bioRxiv,2017.
[6] Lashuel HA,Overk CR,Oueslati A,et al. The many faces of alpha-synuclein:From structure and toxicity to therapeutic target[J]. Nature Reviews Neuroscience,2013, 14(1):38-48.
[7] Kalia LV,Lang AE. Parkinson's disease[J]. Lancet(London,England),2015,386(9996):896-912.
[8] Bras J,Guerreiro R,Hardy J. SnapShot:Genetics of Parkinson's disease[J]. Cell,2015,160(3):570-571.
[9] Muthusamy N,Chen YJ,Yin DM,et al. Complementary roles of the neuron-enriched endosomal proteins NEEP21 and calcyon in neuronal vesicle trafficking[J]. J Neurochem,2015,132(1):20-31.
[10] Lezcano N,Mrzljak L,Eubanks S,et al. Dual signaling regulated by calcyon,a D1 dopamine receptor interacting protein [J]. Science,2000,287(5458):1660-1664.
[11] Bensmann W,Zink N,Arning L,et al. Dopamine D1,but not D2,signaling protects mental representations from distracting bottom-up influences[J]. Neuroimage,2020, 204:116243.
[12] Goedert M,Neurodegeneration. Alzheimer's and Parkinson's diseases:The prion concept in relation to assembled Abeta,tau,and alpha-synuclein[J]. Science(New York,NY),2015,349(6248):1255555.
[13] Andersen AD,Binzer M,Stenager E,et al. Cerebrospinal fluid biomarkers for Parkinson's disease—A systematic review[J]. Acta Neurol Scand,2017,135(1):34-56.
[14] Hansson O,Janelidze S,Hall S,et al. Blood-based NfL:A biomarker for differential diagnosis of parkinsonian disorder[J]. Neurology,2017,88(10):930-937.
[15] Lin YS,Lee WJ,Wang SJ,et al. Levels of plasma neurofilament light chain and cognitive function in patients with Alzheimer or Parkinson disease[J]. Sci Rep,2018,8(1):17368.
[16] Zerr I,Schmitz M,Karch A,et al. Cerebrospinal fluid neurofilament light levels in neurodegenerative dementia:Evaluation of diagnostic accuracy in the differential diagnosis of prion diseases[J]. Alzheimers Dement,2018, 14(6):751-763.
[17] Oosterveld LP,Verberk IMW,Majbour NK,et al. CSF or serum neurofilament light added to α-Synuclein panel discriminates Parkinson's from controls[J]. Mov Disord,2020,35(2):288-295.
[18] Belizaire R,Komanduri C,Wooten K,et al. Characterization of synaptogyrin 3 as a new synaptic vesicle protein[J].J Comp Neurol,2004,470(3):266-281.
[19] Ega?觡a LA,Cuevas RA,Baust TB,et al. Physical and functional interaction between the dopamine transporter and the synaptic vesicle protein synaptogyrin-3[J]. J Neurosci,2009,29(14):4592-4604.
[20] Simunovic F,Yi M,Wang Y,et al. Gene expression profiling of substantia nigra dopamine neurons:Further insights into Parkinson's disease pathology[J]. Brain,2009, 132(Pt 7):1795-1809.
[21] Miller RM,Callahan LM,Casaceli C,et al. Dysregulation of gene expression in the 1-methyl-4-phenyl-1,2,3,6-tetrahydropyridine-lesioned mouse substantia nigra[J]. J Neurosci,2004,24(34):7445-7454.
(收稿日期:2020-01-20)