劉靜,張蕾,趙志剛,陳瑞玲,劉騰,余克富,朱斌
(1.首都醫(yī)科大學(xué) 附屬北京天壇醫(yī)院,北京 100050;2.首都醫(yī)科大學(xué) 附屬北京世紀(jì)壇醫(yī)院,北京 100038)
?
·論 著·
基于表達(dá)譜芯片數(shù)據(jù)的阿爾茨海默病易感基因的生物信息學(xué)數(shù)據(jù)挖掘
劉靜1,張蕾2,趙志剛1,陳瑞玲1,劉騰1,余克富1,朱斌1
(1.首都醫(yī)科大學(xué) 附屬北京天壇醫(yī)院,北京 100050;2.首都醫(yī)科大學(xué) 附屬北京世紀(jì)壇醫(yī)院,北京 100038)
目的:采用生物信息學(xué)對(duì)阿爾茨海默病(AD)表達(dá)譜芯片結(jié)果進(jìn)行數(shù)據(jù)挖掘,尋找影響AD發(fā)病的差異表達(dá)基因,為AD的前期有效預(yù)防提供一定的基礎(chǔ)。方法:從GEO數(shù)據(jù)庫(kù)中下載符合條件的表達(dá)譜芯片研究結(jié)果,通過(guò)Expression Console對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后,導(dǎo)入Transcriptome Analysis Console進(jìn)行數(shù)據(jù)分析比較。將得到的數(shù)據(jù)導(dǎo)入在線分析工具DAVID、ToppGene、STRING中對(duì)差異表達(dá)基因進(jìn)行篩選,同時(shí)進(jìn)行GO分析及Pathway分析。結(jié)果:本次研究共納入3項(xiàng)以人腦海馬組織為樣本的獨(dú)立實(shí)驗(yàn)。24個(gè)差異表達(dá)基因中上調(diào)的基因共有18個(gè),下調(diào)基因6個(gè)。NEFM和SV2B基因與神經(jīng)突觸信號(hào)傳導(dǎo)關(guān)系密切,與AD的發(fā)病有一定的聯(lián)系。結(jié)論:AD的發(fā)病可能與NEFM和SV2B基因密切相關(guān),尚需具體實(shí)驗(yàn)進(jìn)行更深一步研究。
阿爾茨海默?。簧镄畔?;表達(dá)譜芯片;基因
阿爾茨海默病(Alzheimer’s disease,AD)是嚴(yán)重影響老年人生活質(zhì)量的危險(xiǎn)疾病之一[1-2]。AD的發(fā)病機(jī)制很復(fù)雜,呈現(xiàn)多樣性和不確定性,臨床診斷的AD患者多已處于中晚期,現(xiàn)有治療均難以取得滿意療效[3]。自1906年11月德國(guó)病理學(xué)和精神病學(xué)醫(yī)師Alois Alzheimer首次報(bào)道1例老年性癡呆病例起,已有100多年的時(shí)間,在此期間各國(guó)學(xué)者在多個(gè)領(lǐng)域從不同角度開(kāi)展對(duì)AD的研究,試圖揭示其發(fā)生發(fā)展的病理機(jī)制,但因病因不明和早期診斷困難,再加上缺乏有效的治療藥物,給診斷、預(yù)防和治療帶來(lái)了難以克服的困難[4]。本研究擬通過(guò)對(duì)美國(guó)國(guó)家生物信息中心(NCBI)數(shù)據(jù)庫(kù)中的表達(dá)譜芯片原始數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,從而篩選到AD發(fā)病的易感基因,為AD的早期預(yù)防和診斷提供可參考的標(biāo)志物。
1.1 原始研究資料
數(shù)據(jù)來(lái)自所有采用美國(guó)Affymetrix公司表達(dá)譜芯片且其比較了患病和未患病患者的原始芯片研究結(jié)果(CEL文件)。具體方法如下:通過(guò)NCBI的GEO數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/pubmed/),以“Alzheimer”“Hippocampus”“Homo sapiens”為檢索詞,查找所有符合條件的研究結(jié)果。
1.2 數(shù)據(jù)處理及差異基因分析
將3項(xiàng)研究的結(jié)果分別導(dǎo)入Expression Console(Affymetrix)軟件,采用RMA法和MAS 5對(duì)數(shù)據(jù)進(jìn)行歸一化處理,同時(shí)對(duì)芯片探針信號(hào)強(qiáng)度及芯片質(zhì)量進(jìn)行分析。完成上述分析后,將所得到3項(xiàng)CHP文件導(dǎo)入到Transcriptome Analysis Console(TAC)中,基因表達(dá)數(shù)據(jù)缺失數(shù)不超過(guò)50%,對(duì)通過(guò)過(guò)濾標(biāo)準(zhǔn)的基因進(jìn)行非配對(duì)樣本t檢驗(yàn)。根據(jù)設(shè)定的篩選標(biāo)準(zhǔn):fold change<-1.5或者fold change>1.5,且P值小于0.05,篩選得到每個(gè)數(shù)據(jù)集的差異基因。利用在線分析網(wǎng)站(http://bioinfogp.cnb.csic.es/tools/venny/index.html)制作Venn圖得到3張芯片的共有差異基因。
1.3 差異基因的GO分析和通路分析
將所篩選到的共有差異基因分別上傳至the Database for Annotation,Visualization and Integrated Discovery(DAVID)生物信息數(shù)據(jù)庫(kù)中,對(duì)這些差異基因分別進(jìn)行生物學(xué)過(guò)程、分子功能、生物學(xué)通路分析。利用ToppGene(http://topp.gene.cchmc.org/)在線工具對(duì)差異表達(dá)基因進(jìn)行共表達(dá)分析。
1.4 差異基因編碼蛋白的相互作用分析
將得到的差異基因上傳至蛋白質(zhì)相互作用關(guān)系數(shù)據(jù)庫(kù)(Functional Protein Association Networks,STRING),通過(guò)STRINQ分析工具,分析其所編碼的蛋白之間的相互作用圖,找出處在關(guān)鍵節(jié)點(diǎn)的蛋白質(zhì)。
2.1 納入分析的基因芯片數(shù)據(jù)一般情況
通過(guò)橫向比較篩選,我們共得到3項(xiàng)研究符合本此研究條件的研究(表1)。3項(xiàng)研究均采用AD患者和非AD患者進(jìn)行比較,其中第1個(gè)研究共納入17例樣本(AD患者7例,非AD患者10例);第2個(gè)研究共納入20例樣本(AD患者10例,非AD患者10例);第3個(gè)研究共納入24例樣本(AD患者15例,非AD患者9例)。
表1 前期研究所納入的3項(xiàng)研究
Tab 1 The studies which included in the research
研究研究者取樣組織檢測(cè)平臺(tái)芯片類型芯片型號(hào)第1個(gè)研究YusakuNakabeppuHippocampusHomosapiensGPL6244AffymetrixHumanGene1.0STArrayGSE36980第2個(gè)研究WinnieLiangHippocampusHomosapiensGPL570AffymetrixHumanGenomeU133Plus2.0ArrayGSE4757第3個(gè)研究EricMBlalockHippocampusHomosapiensGPL96AffymetrixHumanGenomeU133AArrayGSE1297
2.2 差異基因篩選
通過(guò)分析,我們獲得3項(xiàng)獨(dú)立研究中均出現(xiàn)明顯表達(dá)的差異基因共24個(gè)(圖1、表2)。其中上調(diào)的基因共有18個(gè),下調(diào)基因6個(gè)。
圖1 所納入的3項(xiàng)獨(dú)立研究篩選得到的差異基因
Fig 1 The Venn diagram of the differently expressed genes
2.3 差異基因的GO富集分析和通路分析
差異基因所涉及到的基因功能主要與神經(jīng)細(xì)胞、神經(jīng)突觸及細(xì)胞骨架相關(guān)的功能相關(guān)。在本研究中的24個(gè)基因中與神經(jīng)突觸功能相關(guān)的基因約有9個(gè)基因,分別為ATP2B1、SLC12A5、NEFM、SLC17A7、GABBR2、WASF1、SV2B、NEEFM及GABBR2。通過(guò)ToppGene在線工具進(jìn)一步的分析,我們最終確定了NEFM和SV2B為神經(jīng)信號(hào)轉(zhuǎn)到通路上的關(guān)鍵基因。見(jiàn)圖2、表3。
2.4 NEFM和SV2B蛋白相互作用圖
通過(guò)STRING 10在線工具對(duì)最終篩選的差異基因進(jìn)行蛋白質(zhì)相互作用網(wǎng)絡(luò)分析,從圖3可以看出NEFM和SV2B蛋白與其他蛋白均存在≥5的相互作用關(guān)系,為此蛋白質(zhì)相互作用網(wǎng)絡(luò)的中心節(jié)點(diǎn),刪除這些節(jié)點(diǎn)蛋白后,網(wǎng)絡(luò)結(jié)構(gòu)的穩(wěn)定性降低。
表2 24個(gè)差異基因及其所在研究中的差異倍數(shù)變化
Tab 2 The fold changes of the 24 differently expressed genes
差異基因差異倍數(shù)(研究1)差異倍數(shù)(研究2)差異倍數(shù)(研究3)HOPX1.741.721.55MAN1A11.761.851.74ENC11.811.811.95SLC17A71.561.761.61GABBR21.571.81.67CAP21.521.811.59OXCT11.591.811.61SV2B2.011.521.81WIF12.661.543.98ANGPT1-1.51-1.67-1.66AEBP1-1.87-1.87-2.63RGS42.431.512.16LMO41.562.221.82WASF11.711.631.74SCN3B1.781.651.79SLC12A51.581.561.6MYO161.541.672.27NEFM1.681.522.11APLNR-1.95-2.33-3.01GPR221.623.612.43AHNAK-1.53-4.83-1.51FLNC-1.81-1.54-1.75ATP2B11.521.641.56CP-1.73-1.95-1.83
圖2 GO分析網(wǎng)絡(luò)圖
Fig 2 The network diagram of GO analysis
阿爾茨海默病的發(fā)病機(jī)制目前仍不明確,其發(fā)病是多基因、多途徑、多步驟、多階段相互作用和相互影響的復(fù)雜過(guò)程。然而由于阿爾茨海默病患者的腦組織不易取得,這也嚴(yán)重阻礙了對(duì)該病的治療進(jìn)展。為了更好地研究AD患者的發(fā)病機(jī)制,最直接的辦法就是以患病的組織為標(biāo)本進(jìn)行研究,然而這些標(biāo)本的取得往往存在非常大的難度,因而也限制了對(duì)AD發(fā)病機(jī)制的深入研究。本次研究我們利用國(guó)外珍貴海馬組織芯片數(shù)據(jù),一方面解決了課題研究過(guò)程中標(biāo)本獲得困難的不足,另一方面通過(guò)對(duì)多項(xiàng)研究數(shù)據(jù)的橫向比較也可以更加行之有效地篩選出特異性的差異基因。
表3 24個(gè)差異基因GO分析
Tab 3 The GO analysis of the 24 genes
隨著基因芯片技術(shù)的不斷成熟,為高通量篩選疾病易感基因帶來(lái)了新的曙光。通過(guò)生物信息學(xué)進(jìn)行信息挖掘,我們能夠多層次了解基因表達(dá)狀況,對(duì)基因功能富集分析、通路富集分析及網(wǎng)絡(luò)調(diào)控分析的探討有重要作用,因此該技術(shù)已經(jīng)廣泛應(yīng)用于疾病差異基因的篩選、疾病治療藥物的篩選以及疾病應(yīng)用基因診斷和治療等方面[5]。通過(guò)生物信息學(xué)對(duì)阿爾茨海默病進(jìn)行信息挖掘,能夠深層次了解相關(guān)基因表達(dá)狀況,對(duì)于疾病差異基因的篩選、治療藥物篩選以及早期標(biāo)志物的發(fā)現(xiàn),具有重大的現(xiàn)實(shí)意義。
圖3 NEFM和SV2B蛋白相互作用圖
Fig 3 The interaction of NEFM and SV2B
本研究共篩選到了與阿爾茨海默病發(fā)病相關(guān)的基因24個(gè),涉及與神經(jīng)生長(zhǎng)、突觸連接、離子轉(zhuǎn)運(yùn)、G蛋白偶聯(lián)等,其中每一項(xiàng)研究中fold change≥2或fold change≤-2的差異基因主要有SV2B、WIF1、AEBP1、RGS4、LMO4、MYO16、NEFM、APLNR、GPR22及AHNAK。同時(shí),通過(guò)對(duì)GO分析得到的基因功能中與神經(jīng)細(xì)胞相關(guān)的基因(dendrite membrane,synapse,neuron projection membrane,neuron part,synaptic vesicle membrane,neurofibrillary tangle,neuron projection)進(jìn)行篩選,得到ATP2B1、SLC12A5、NEFM、SLC17A7、GABBR2、WASF1、SV2B、NEEFM、GABBR2等9個(gè)基因。將2次基因篩選得到的結(jié)果進(jìn)行較分析,發(fā)現(xiàn)NEFM和SV2B在所納入的3項(xiàng)研究中其FDR值均≥2,且其基因功能均與神經(jīng)細(xì)胞的生長(zhǎng)發(fā)育密切相關(guān)。其中NEFM的基因功能與神經(jīng)元信息傳遞、神經(jīng)原纖維纏結(jié)關(guān)系緊密,而SV2B(突觸囊泡蛋白2B)與神經(jīng)細(xì)胞信號(hào)轉(zhuǎn)到關(guān)系密切。由此我們推測(cè)在AD患者中NEFM和SV2B基因的突變可能與阿爾茨海默病的發(fā)展密切相關(guān),但是其具體的作用機(jī)制目前還不清楚,文獻(xiàn)中也未見(jiàn)詳細(xì)報(bào)道,可以作為潛在的治療靶點(diǎn),但尚需實(shí)驗(yàn)進(jìn)行證實(shí)。
[1] LLORET A,F(xiàn)UCHSBERGER T,GIRALDO E,et al.Molecular mechanisms linking amyloid beta toxicity and Tau hyperphosphorylation in Alzheimer’s Disease[J].Free Radic Biol Med,2015,83:186-191.
[2] MAYEUX R.Early Alzheimer’s disease[J].N Engl J Med,2010,362(23):2194-201.
[3] 高天麗,陳克平.阿爾茨海默病的常見(jiàn)診斷方法[J].現(xiàn)代醫(yī)學(xué),2016,44(3):415-419.
[4] KUMAR A,SINGH A,EKAVAL I.A review on Alzheimer’s disease pathophysiology and its management:an update[J].Pharmacol Rep,2015,67(2):195-203.
[5] 李鐵求,楊宇,李琦,等.前列腺癌轉(zhuǎn)移相關(guān)基因的生物信息學(xué)分析[J].實(shí)用醫(yī)學(xué)雜志,2013,29(21):3481-3485.
Bioinformatics data mining of Alzheimer’s disease susceptible genes based on the data of expression profile chip
LIU Jing1,ZHANG Lei2,ZHAO Zhi-gang1,CHEN Rui-ling1,LIU Teng1,YU Ke-fu1,ZHU Bin1
(1.BeijingTiantanHospital,CapitalMedicalUniversity,Beijing100050,China;2.BeijingShijitanHospital,CapitalMedicalUniversity,Beijing100038,China)
Objective: To analyze the expression information of three independent researches to explore differential genes in the progress of alzheimer disease(AD)and providing a basis for the AD prevention.Methods: Raw data were downloaded from NCBI databases and imported to “Expression Console” to standardize the data and then the results were output to “Transcriptome Analysis Console” for data analysis.After that all different genes were imported to online analysis tools DAVID,ToppGene,STRING for further analyze.Results: The studies included in our research all used human brain hippocampus sample.Through further analysis,24 differentially expressed genes were analyzed,among which 18 genes were increased and 6 were down-regulated.Through further analysis,two genesNEFM and SV2B were found to be closely related to synapses signal transduction.Conclusion: The pathogenesis of AD may be closely related with NEFM and SV2B genes.Nevertheless,specific experiment will be needed to verify the geness.
Alzheimer’s disease; biological information; expression profile chip; gene
2016-05-18
2016-07-06
國(guó)家自然科學(xué)基金青年基金資助項(xiàng)目(81402814)
劉靜(1975-),女,北京人,主管藥師。E-mail:liujing1366@sina.cn
朱斌 E-mail:zbtcm@163.com
劉靜,張蕾,趙志剛,等.基于表達(dá)譜芯片數(shù)據(jù)的阿爾茨海默病易感基因的生物信息學(xué)數(shù)據(jù)挖掘[J].東南大學(xué)學(xué)報(bào):醫(yī)學(xué)版,2016,35(5):653-657.
R749.16; Q7
A
1671-6264(2016)05-0653-05
10.3969/j.issn.1671-6264.2016.05.002