王卓雅, 王燕琳, 楊志華, 孫慧芳, 張 奇, 楊 靖, 許予明
阿爾茨海默病(Alzheimer’s disease,AD)是一種年齡相關的神經退行性疾病,也是認知功能下降最常見的病因。目前,全球有4000多萬人患有AD,預計到2050年,這一數(shù)字將超過1億[1]。影像學的應用在AD診斷方面有極大影響,研究表明AD腦萎縮的模式不是隨機的,通常是緩慢有序發(fā)展的,首先涉及海馬體,然后擴散到內側頂葉、外側顳葉和額葉區(qū)域,最終影響皮質的所有區(qū)域,因此,海馬體的是區(qū)分AD的最佳區(qū)域[2]。關于AD的發(fā)病機制存在很多種假說,包括淀粉樣蛋白級聯(lián)反應,tau過度磷酸化,神經遞質和氧化應激等[3],但具體的發(fā)病機制和最佳的治療方案仍未明確。目前,有幾種針對Aβ和tau的藥物可以改善癥狀,但這些藥物不能延緩疾病的進展。在我們此次的研究中,利用GEO數(shù)據(jù)庫結合GO富集分析、KEGG通路分析、PPI網絡分析、基因共表達網絡分析等生物信息學方法,識別可能參與AD發(fā)生發(fā)展的關鍵基因。因此,探討AD發(fā)病的分子機制,進一步為AD的精準治療提供依據(jù)。
1.1 資料來源 GEO(Gene Expression Omnibus database)數(shù)據(jù)庫(https://www. ncbi. nlm. nih. gov/geo/)系美國國立生物技術信息中心(NCBI)創(chuàng)建并維護的基因表達數(shù)據(jù)庫,是目前最全面的公共基因表達數(shù)據(jù)庫[4]。從GEO數(shù)據(jù)庫中搜索獲取基因芯片GSE5281,該芯片包含161個人大腦組織,芯片數(shù)據(jù)是通過Affymetrix U133 Plus 2.0 array獲取的表達譜,其中包括6個腦區(qū)樣本,分別是內嗅皮質(AD患者10例,正常對照13例)、海馬(AD患者10例,正常對照13例)、內側顳葉(AD患者16例,正常對照12例)、后扣帶回(AD患者9例,正常對照13例)、額上回(AD患者23例,正常對照11例)和初級視覺皮質(AD患者19例,正常對照12例)。本研究選取海馬區(qū)AD患者10例,正常對照13例作為樣本,并比較兩者之間的差異。
1.2 差異表達基因的篩選 使用R程序對基因進行t檢驗,通過統(tǒng)計學方法差異基因,通過采用調整P值<0.05,|logFC|>1.5 作為入選標準,其中l(wèi)ogFC>1.5 作為上調差異表達基因,logFC<-1.5作為下調差異表達基因。
1.3 基因本體(GO)及京都基因與基因組百科全書(KEGG)通路富集分析 GO富集分析從生物過程、細胞組成和分子功能三方面對基因產物進行標準化描述,能夠有效地鑒定獲取數(shù)據(jù)的相應生物學屬性。KEGG通路富集分析DEGs所參與的代謝途徑以及各途徑之間的關系,從而可以表示參與其中的基因列表以及信號通路。使用DAVID數(shù)據(jù)庫(https://david. ncifcrf. gov)對篩選得到的DEGs進行在線GO富集分析,使用R程序clusterProfiler包對DEGs進行KEGG通路富集分析,獲取P值,P<0.05并且基因數(shù)≥5有統(tǒng)計學意義。
1.4 蛋白質-蛋白質相互作用(Protein-Protein interaction,PPI) 網絡分析 采用STRING數(shù)據(jù)庫(https://string-db. org)進行DEGs的PPI網絡構建,STRING是目前覆蓋蛋白質相互作用信息最全面的數(shù)據(jù)庫,使用STRING分析得到的PPI網絡結合Cytoscape軟件進行可視化分析。
1.5 藥物-基因的相互作用 利用開源的藥物基因相互作用數(shù)據(jù)庫(https:/ /www. Dgidb. org)來分析基因與藥物之間的相互作用,以關鍵基因為潛在的標靶在數(shù)據(jù)庫中搜素現(xiàn)有的藥物,以探索新的藥物在疾病中的潛在應用。
1.6 統(tǒng)計學分析 DEGs分析采用t檢驗的P值和差異倍數(shù)進行篩選和鑒定,篩選的標準為調整P值<0.05且差異倍數(shù)>1.5有統(tǒng)計學意義,對DEGs進行GO及 KEGG富集分析,P<0.05有統(tǒng)計學意義。所有統(tǒng)計分析均在R 4.0.3中完成。
2.1 差異表達基因 通過GSE5281中海馬組進行差異基因篩選出863個DEGs(差異倍數(shù)>1.5,且調整P<0.05),分別包括246個上調基因和617個下調基因(前10位上調和下調DEGs見表1)。通過差異表達基因繪制火山圖(圖1A)和聚類圖(見圖1B)。紅色代表上調基因,藍色代表下調基因,從圖中可以說明下調基因比例較高。
表1 前10位上調及下調差異表達基因
2.2 差異表達基因的功能分析
2.2.1 GO富集分析 GO分析可由生物過程、分子功能和細胞組成3個部分結果構成。上調的DEGs在分子功能包括ATP結合以及POLY(A) RNA結合,細胞組成包括細胞外泌體,線粒體,線粒體內膜,細胞膜等,生物過程中主要包括蛋白折疊和內質網(ER)相關泛素依賴蛋白分解過程,下調的DFGs在分子功能包括RNA聚合酶Ⅱ核心啟動子的結合及特異性DNA結合以及轉錄調控區(qū)域的特異性結合,細胞組成包括核質和細胞核內,生物過程中主要包括RNA聚合酶Ⅱ啟動子的轉錄的調控以及轉化生長因子受體信號通路的負調控等(見圖2)。
2.2.2 KEGG通路分析 KEGG分析結果顯示,上調DEGs主要涉及帕金森病、朊蛋白病、亨廷頓病、阿爾茲海默病等多種神經退行性疾病,以及蛋白酶體、氧化磷酸化和生熱作用,下調DEGs主要包括長時程增強作用、軸突導向、嗅覺傳導以及MAPK、Rap1、雌激素鈣離子、Ras信號通路等(見圖3)。
圖3 差異表達基因的KEGG富集分析(紅色代表上調基因,藍色代表下調基因)
2.3 差異表達基因的PPI結果
2.3.1 PPI網絡的構建以及核心基因的篩選 為了鑒定潛在調控基因,構建 PPI 網絡,基于STRING數(shù)據(jù)庫結合Cytoscape插件篩選出5個基因PSMA7、PSMA3、PSMB7、PSMC5和PSMC3,將這5個基因命名為核心基因(見圖4A)。
2.3.2 功能模塊分析 使用 Cytoscape 中的 MCODE 插件,其根據(jù)拓撲關系對給定網絡進行聚類,篩選出31個關鍵基因,其中包括23個上調基因和8個下調基因(圖4B),紅色代表上調基因,藍色代表下調基因。31個關鍵基因為PSMC5、PSMA7、PSMC3、PSMB3、TNPO1、UBE2W、FBXO32、CCT4、MYLIP、PSMB7、RPL3、RNF25、FBXW12、CCT2、PSMA3、CUL3、PFDN5、CCT5、SMURF2、UBE2M、COPS5、EIF3G、ASB16、UBC、PPP2R1A、HSP90AB1、PSMD8、CCT7、CUL1、NACA、NHP2L1,其中TNPO1、NHP2L1、ASB16、FBXW12、SMURF2、FBXO32、UBE2W、MYLIP為下調基因,余23個均為上調基因。通過KEGG分析得這些關鍵基因與蛋白酶體及泛素介導的蛋白水解關系密切。
2.4 藥物基因相互作用 以5個核心基因為靶點篩選出8種現(xiàn)有藥物,分別為CARFILZOMIB、BORTEZOMIB、IXAZOMIB CITRATE、OPROZOMIB、PHENETHYLISOTHIOCYANATEIXAZOMI、CHEMBL304784、MARIZOMIB(見表2)。
表2 藥物與核心基因相互作用
2.5 多組基因芯片分析 由于所檢索的基因表達譜芯片(ID:GSE5281)樣本量較少,為了使數(shù)據(jù)更加具有說服力,進一步擴大樣本量進行分析,以用于尋找到共同的差異表達基因,從GEO數(shù)據(jù)庫中進一步篩選出兩組基因芯片GSE1297和GSE48350,GSE1297芯片來源于海馬部分的基因表達分析,其包含9個正常對照和31個AD患者的海馬區(qū)腦組織,根據(jù)MMSE和NFT評分將患者劃分為輕、中、重度,我們選取其中9個正常對照和7個分型為重度的患者進行分析。GSE48350芯片包括253例腦組織樣本的基因表達譜數(shù)據(jù)集,我們選取其中對本研究有意義的62例樣本,包括19例AD患者海馬區(qū)腦組織樣本和43例正常對照海馬區(qū)腦組織樣本進行分析(P值<0.05,|logFC|>1.5 作為入選標準)。GEO數(shù)據(jù)庫中僅GSE5281,GSE1297和GSE48350這3組基因芯片為AD患者海馬區(qū)腦組織表達譜芯片,這三組基因芯片兩兩比較結果見表3。
表3 3組基因芯片分析結果兩兩比較
阿爾茨海默病(AD)是1907年由Alois Alzheimer首次提出并以其名字命名此種疾病[5]。AD是癡呆最常見的原因,約占70%[6]。臨床表現(xiàn)起病隱匿,包括記憶力減退、認知功能下降,行為功能障礙,日常生活活動不能維持[7]?;颊邚恼UJ知障礙進展到輕度認知障礙(MCI),隨后癡呆程度逐漸加重從輕度進展為中度進而變?yōu)橹囟取?5歲患者確診后的平均存活時間為8 y[8]。AD的神經病理學在宏觀上表現(xiàn)為腦萎縮,皮質變薄、萎縮,主要顯微特征包括神經炎性淀粉樣斑塊和神經原纖維纏結(NFTs)形成。目前多數(shù)研究認為Aβ和tau寡聚物沉積是AD重要的發(fā)病機制[9]。但具體的機制仍不清晰,并且治療方式單一,效果甚微,給患者及家庭造成了極大的精神和經濟負擔,因此加快對AD的發(fā)病機制的研究進而促進治療的需求十分迫切。
本研究通過使用t檢驗對GSE5281基因芯片進行分析,獲得AD患者海馬體部分腦組織與正常對照相比差異表達863個基因,包括 246個上調基因和617個下調基因,通過PPI分析得到31個關鍵基因:PSMC5、PSMA7、PSMC3、PSMB3、TNPO1、UBE2W、FBXO32、CCT4、MYLIP、PSMB7、RPL3、RNF25、FBXW12、CCT2、PSMA3、CUL3、PFDN5、CCT5、SMURF2、UBE2M、COPS5、EIF3G、ASB16、UBC、PPP2R1A、HSP90AB1、PSMD8、CCT7、CUL1、NACA、NHP2L1,其中TNPO1、NHP2L1、ASB16、FBXW12、SMURF2、FBXO32、UBE2W、MYLIP為下調基因,余23個差異表達基因在AD患者海馬體部分為上調基因。
通過生物信息學的方法,我們分析得到AD患者海馬體部分與正常對照相比有31個關鍵的DEGs,其中COPS5、PSDN5和TNPO1在AD中的作用已有研究,而有些基因在AD中的作用仍需進一步研究。有研究表明在細胞系和小鼠腦中COPS5 (Constitutive Photomorphogenesis 9 Signalosome Subunit 5)與LRP、BACE1、APP和RanBP9結合從而導致Aβ的分泌增加[10],此外,COPS5過表達減少腦內樹突棘標志物的表達并且小鼠的學習和記憶能力均有下降[11],因此說明COPS5是RanBP9復合物的一部分,并且在Aβ的產生和體內突觸蛋白水平變化中占據(jù)重要作用。PFDN(Prefoldin)是一種廣泛表達的異六聚體輔伴侶蛋白,由2個α亞基(PFDN3、5)和4個β亞基(PFDN1,2,4,和6)組成[12],其生物功能主要為協(xié)助新合成大小的蛋白質折疊,防止已存在的蛋白質聚集和錯誤折疊[13],其中PFDN5在神經系統(tǒng)中研究最為充分,PFDN5功能異常導致致病性淀粉樣β蛋白聚集,隨后神經元死亡[14],此外,在小鼠體內PFDN5基因破壞可導致小腦神經元細胞變性[15],因此PFDN5功能障礙是導致AD的病因之一。有研究指出TNPO1(Transportin-1)在早期AD中發(fā)揮了重要作用,在AD小鼠海馬區(qū)發(fā)現(xiàn)TNPO1水平上調,這與我們此次的研究相符,這可能說明了TNOP1表達水平的上調可能是腦內Aβ增加的調節(jié)機制,因此TNOP1可能在早期AD中Aβ代謝中占據(jù)了重要作用[16]。
GO富集分析得到DEGs主要集中在線粒體電子傳遞、ATP結合以及定位于線粒體內等生物過程。線粒體功能障礙與AD之間的關系十分密切,線粒體主要產生ATP用于為細胞生命活動提供能量,許多線粒體功能障礙已經在AD中有研究,在Aβ和tau蛋白開始形成之前線粒體中葡萄糖的代謝受損、線粒體酶功能下降以及ROS的產生增加[17],此外,在早期AD線粒體動力學方面也出現(xiàn)功能障礙,包括線粒體融合和裂變之間的平衡破壞、線粒體軸突運輸減少、細胞內線粒體比例降低、大小發(fā)生改變,線粒體在AD中維持為更短、更寬的形狀[18]。因此,線粒體功能缺陷可能是AD進展的核心。KEGG富集分析結果示上調DEGs主要跟AD、帕金森病及亨廷頓病等神經退行性疾病有關,下調DEGs主要跟長時程增強有關,長時程增強(LTP)是1973年首次在哺乳動物大腦中的穿通神經纖維與顆粒細胞之間的突觸連接中發(fā)現(xiàn),海馬內單突觸興奮同類的短暫高頻刺激尋獵導致突觸傳遞效率的突然和持續(xù)增加,LTP構成海馬體的所有興奮通路及大腦其他幾個區(qū)域[19],因此可以說明其構成了記憶形式的基礎,我們此次研究說明AD患者海馬體與正常對照相比下調DEGs的KEGG富集通路主要集中于長時程增強,構成AD的發(fā)病機制。然而,我們此次研究中GO富集分析中發(fā)現(xiàn)DEGs與RNA聚合酶Ⅱ啟動子的結合劑轉錄調控關系密切,然而這部分研究相對較少,可能為以后研究AD發(fā)病機制提供新方向。
通過基因與藥物相互關系研究,我們通過PPI篩選出5個核心基因(PSMA7、PSMA3、PSMB7、PSMC5和PSMC3),并以此為靶點篩選出8種藥物,分別為CARFILZOMIB、BORTEZOMIB、IXAZOMIB CITRATE、OPROZOMIB、PHENETHYLISOTHIOCYANATE、IXAZOMI、CHEMBL304784、MARIZOMIB,這8種藥物均為相應基因位點的抑制劑。其中,CARFILZOMIB用于治療難治性和復發(fā)性多發(fā)性骨髓瘤的蛋白酶體抑制劑,美國食品和藥物管理局(FDA)批準該藥物可以與地塞米松或來那度胺聯(lián)合使用來做進一步治療[20],有案例曾報道一位使用CARFILZOMIB治療的多發(fā)性骨髓瘤患者出現(xiàn)了癲癇持續(xù)狀態(tài),停藥3 d后這些癥狀消失[21],目前針對CARFILZOMIB與癲癇的關系并沒有機制說明,我們猜測可能通過降低血管內皮生長因子的轉錄導致內皮功能障礙從而導致腦內神經元的興奮性增強出現(xiàn)癲癇等癥狀,而AD是一種退行性疾病,由此我們推測CARFILZOMIB可能提高神經系統(tǒng)的興奮性。然而這些藥物均未在AD模型進行研究,我們此次的研究為探討AD的發(fā)病機制及治療方式提供了新的思路,但仍需要進行分子實驗進行驗證。
我們通過一系列生物信息信息學方法對基因表達譜進行分析,篩選出多個AD患者海馬體部分與正常人相比的差異表達基因,以及現(xiàn)有的靶向藥物,這將為我們了解AD發(fā)病機制和探討新的治療方案提供依據(jù)。