司蕊豪,劉羽茜,朱仲康,王旭,侯文曉,趙丹玉
(遼寧中醫(yī)藥大學中西醫(yī)結(jié)合學院1.生物化學教研室;2.生理學教研室;3.組織與胚胎學教研室,沈陽 110847)
阿爾茨海默?。ˋlzheimer′s disease,AD)是一種常見的慢性神經(jīng)退行性疾病。據(jù)世界衛(wèi)生組織報道,截至2020 年9 月,全球約有5 000 萬AD 患者[1]。由于人口老齡化的加劇,預計到2050 年AD 病例數(shù)將增至1.52 億[2]。AD 的主要臨床表現(xiàn)為記憶力減退和認知功能障礙,主要病理特征為β 淀粉樣蛋白(amyloid β-protein,Aβ)沉積、tau 蛋白過度磷酸化、神經(jīng)纖維纏結(jié)等[3]。大量研究表明,在AD 發(fā)病過程中,各種炎癥及炎癥相關(guān)細胞因子在不同的大腦區(qū)域中異常表達,并且與疾病進展顯著相關(guān)[4-5]。因此,研究炎癥相關(guān)基因(inflammation-related genes,IRGs)的表達對于診斷與防治AD 尤為重要。本文旨在通過生信分析鑒定AD 過程中與IRGs 相關(guān)的特征基因,分析特征基因所富集的生物學途徑,篩選并鑒定關(guān)鍵基因,為AD 的臨床診斷和治療提供潛在的靶點。
1.1 數(shù)據(jù)的獲取及差異表達IRGs 的篩選 通過GEO 數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)搜索“Alzheimer”并且下載GSE144459[6-7](GPL21163 Agilent-074809SurePrint G3 Mouse GE v2 8x60K Microarray 數(shù)據(jù)更新至Aug 25,2020)和GSE135999[8](GPL21810 Agilent -074809 SurePrint G3 Mouse GE v2 8x60K Microarray[Feature Number version]數(shù)據(jù)更新至Aug 28,2021)中的AD 模型小鼠海馬和正常小鼠海馬轉(zhuǎn)錄組數(shù)據(jù)。使用limma[9]包分別分析兩個數(shù)據(jù)集中的差異表達基因(differentially expre ssed genes,DEGs)。篩選標準為:P<0.05。并 使 用ggplot2[10]對DEGs 進行可視化。然后在NCBI 數(shù)據(jù)庫中的Gene 子數(shù)據(jù)庫中搜索關(guān)鍵詞“Inflammatory”及“Musmusculus”獲得IRGs。運用在線韋恩圖工具(http://bioinformatics.psb.ugent.be/webtools/Venn/) 對上述獲得的差異表達基因(DEG1、DEG2)與NCBI 數(shù)據(jù)庫獲得IRGs 取交集并獲得差異表達IRGs。
1.2 差異表達IRGs 的功能富集分析 基于GO 及KEGG 數(shù)據(jù)庫,使用clusterProfiler[11]包對差異表達IRGs 進行功能富集分析,并對富集結(jié)果進行可視化。GO 富集分析包含生物過程、分子功能、細胞組成。本研究中篩選條件為P<0.05,count≥1。選取排名前15 的信號通路探索差異表達IRGs 的生物學功能。
1.3 PPI 網(wǎng)絡(luò)構(gòu)建及候選基因篩選
1.3.1 差異表達IRGs 的PPI 網(wǎng)絡(luò) 為探究差異表達IRGs 之間是否存在互作關(guān)系,利用STRING 數(shù)據(jù)庫(https://string-db.org)對106 個差異表達IRGs 進行PPI 網(wǎng)絡(luò)構(gòu)建。置信度為0.4(Confidence=0.4),去除離散的蛋白。用Cytoscape 軟件對蛋白網(wǎng)絡(luò)圖進行美化,得到PPI 網(wǎng)絡(luò)圖。
1.3.2 PPI 網(wǎng)絡(luò)中候選基因篩選-cytoHubba 利用cytoHubba 插件來篩選PPI 中的關(guān)鍵節(jié)點。根據(jù)nodes在網(wǎng)絡(luò)中的屬性進行排名。以MCC、DMNC、MNC、DEGREE、EPC 5 種算法分別進行排序,然后對5 種算法的TOP30 基因取交集,獲得候選基因。
1.4 特征基因的篩選及鑒定
1.4.1 LASSO 回歸分析篩選特征基因 本研究以GSE144459(Healthy=16,AD=16)作為訓練集,以GSE135999(Healthy=6,AD=7)作為驗證集,來進行LASSO 回歸分析。設(shè)置參數(shù)為:family ="binomial",type.measure="class";LASSO 分 析 工 具 為R 語 言glmnet[12]包,以lambda 最小值取0.000 時的模型為最佳診斷模型。
1.4.2 鑒定特征基因并繪制受試者工作特征(ROC)曲線 將篩選得到的特征基因輸入文件進行主成份分析(principle component analysis,PCA),以確定對疾病及正常小鼠的區(qū)分能力。使用pROC[13]包繪制每個特征基因的ROC 曲線,判斷特征基因在AD 中的預測診斷能力。ROC 曲線下面積(AUC)的值一般在0.5~1.0 之間。在0.5~0.7 時預測診斷準確性較低,在0.7~0.9 時具有一定的預測診斷意義,在0.9 以上越接近于1.0,說明其預測診斷效果越好。
1.5 LASSO、SVM 、GSVA 分類器構(gòu)建 分別以GSE144459 及GSE135999 作為訓練集和驗證集,采用LASSO、SVM、GSVA 3 種不同的算法分別計算8個特征基因,使用R 語言pROC 包繪制訓練集及驗證集的ROC 曲線,并計算AUC,一般AUC 值越大,說明預測的結(jié)果較為準確,對應(yīng)的分類器具有較高的分類意義。
1.6 特征基因功能網(wǎng)絡(luò) 為進一步探索特征基因(adj.P<0.05)所靶向的通路及其發(fā)揮的功能,本研究使用clusterProfiler 包對其進行基于GO 和KEGG 的富集分析。并繪制特征基因與通路的網(wǎng)絡(luò)圖并且對富集結(jié)果進行可視化。
1.7 特征基因的表達驗證 用AD 相關(guān)的數(shù)據(jù)集GSE122063(AD=56,Control=44)驗證8 個特征基因(Fcgr2b、Cd14、Fcgr4、Fcgr1、Lyz2、Fcgr3、Ly86 及Themis2)。采用秩和檢驗和R 語言ggplot2 包對特征基因的表達進行分析和可視化。
2.1 差異表達 IRGs 的篩選 用limma 包篩選GSE135999 數(shù)據(jù)集AD/WT 小鼠海馬組織中共存在2 101 個差異表達基因(DEG1),其中920 個上調(diào)基因,1 181 個下調(diào)基因;GSE144459 數(shù)據(jù)集AD/WT小鼠海馬組織中共存在9 239 個差異表達的基因(DEG2),其中3 883 個上調(diào)基因,5 256 個下調(diào)基因。如圖1A、1B 所示。對上述獲得的差異表達基因(DEG1、DEG2)與NCBI 數(shù)據(jù)庫獲得IRGs 取交集,以獲得差異表達的IRGs。結(jié)果共獲得90 個上調(diào)表達IRGs,16 個下調(diào)表達IRGs ,如圖1C、D 所示。
圖1 差異表達的IRGs 的篩選Fig 1 Screening of differentially expressed IRGs
2.2 功能富集分析結(jié)果 為探索差異表達IRGs 的生物學功能,本研究對106 個差異表達IRGs 進行KEGG 功能富集分析后,使用氣泡圖對TOP15 通路進行展示(圖2A)。得到差異表達IRGs 參與了金黃色葡萄球菌感染、中性粒細胞外陷阱形成、破骨細胞分化、吞噬體、Toll 樣受體、FcγR 介導吞噬作用、趨化因子等信號通路。此外對106 個差異表達IRGs 進行GO 分析,發(fā)現(xiàn)在BP 中這些基因參與細胞對生物刺激的反應(yīng)、單核細胞增殖、淋巴細胞增殖、白細胞遷移、炎癥反應(yīng)的調(diào)節(jié)等方面。在CC 中與溶酶體、吞噬囊泡、膜微區(qū)、膜筏、炎癥體復合體等顯著相關(guān)。在MF 中與G 蛋白耦聯(lián)受體結(jié)合、免疫球蛋白結(jié)合、Toll 樣受體結(jié)合、CCR 趨化因子受體結(jié)合、細胞因子受體結(jié)合等生物學功能相關(guān)(圖2B)。
圖2 差異表達IRGs 功能富集分析Fig 2 Functional enrichment analysis of differentially expressed IRGs
2.3 PPI 網(wǎng)絡(luò)構(gòu)建及候選基因篩選
2.3.1 差異表達IRGs 的PPI 網(wǎng)絡(luò) 利用STRING數(shù)據(jù)庫(https://string-db.org)對106 個差異表達IRGs進行PPI 網(wǎng)絡(luò)構(gòu)建,得到98 個蛋白的互作網(wǎng)關(guān)系,包括98 個節(jié)點,815 條邊。然后用Cytoscape 插件對蛋白網(wǎng)絡(luò)圖進行美化,如圖3。圖中綠色表示下調(diào)表達,紅色表示上調(diào)表達,顏色越深,上調(diào)/下調(diào)的越明顯。
圖3 差異表達IRGs的PPI網(wǎng)絡(luò)Fig 3 PPI networks for differential expression of IRGs
2.3.2 PPI 網(wǎng)絡(luò)中候選基因篩選-cytoHubba 基于cytoHubba 插件中的算法,對5 種算法的TOP30 基因取交集,獲得17 個候選基因。分別是Tyrobp、Fcgr3、Fcgr2b、Fcgr1、C1qa、Cd14、Cd86、Ctss、Irf8、Cd68、Fcgr4、Ccl4、Lyz2、Ly86、Clec7a、Ccl3、Themis2。然后使用UpSetR[14]包進行可視化,得到UpSet 圖,如圖4。
圖4 MCC、DMNC、MNC、DEGREE、EPCTOP30 基因交集Upset 圖Fig 4 MCC,DMNC,MNC,DEGREE,EPC TOP30 gene intersection Upset diagram
2.4 特征基因的篩選及鑒定
2.4.1 特征基因的篩選 用LASSO 回歸對訓練集GSE144459(Healthy=16,AD=16)和驗證集GSE135999(Healthy=6,AD=7)進行分析,得到基因系數(shù)的圖形和交叉驗證的誤差圖。如圖5,以lambda 最小值取0.000 時的模型為最佳診斷模型,可見LASSO 回歸分析篩選得到由8 個基因構(gòu)成的診斷模型,分別為Fcgr2b、Cd14、Fcgr4、Fcgr1、Lyz2、Fcgr3、Ly86 及Themis2。
圖5 LASSO 回歸分析篩選特征基因Fig 5 Selection of characteristic genes by LASSO regression analysis
2.4.2 鑒定特征基因并繪制ROC 曲線 對8 個特征基因進行PCA 分析得出無論是在GSE135999還是GSE144459 中,特征基因均可較好的區(qū)分AD組和正常組(圖6)。此外,通過繪制特征基因的ROC 曲線(圖7) 可知每個基因的AUC 值均在0.7以上,由此說明特征基因?qū)D 具有較強的預測能力。
圖6 特征基因?qū)颖镜腜CAFig 6 PCA of characteristic gene pair samples
圖7 特征基因的鑒定Fig 7 Identification of characteristic genes
2.5 LASSO、SVM、GSVA 分類器構(gòu)建 由LASSO模型(圖8A)中可以看出,訓練集及驗證集的AUC均大于等于0.8;SVM 模型中(圖8B)訓練集及驗證集的AUC 值均為1;GSVA 模型中(圖8C)中訓練集及驗證集的AUC 值均在0.9 以上。由此說明3 種模型均為較好的分類器,對AD 具有較高的預測能力,因此這8 個基因可作為AD 的特征基因。
圖8 LASSO、SVM、GSVA分類器的ROC 曲線Fig 8 ROC curve of LASSO,SVM,GSVA classifiers
2.6 特征基因功能網(wǎng)絡(luò) 在生物過程方面,共獲得151 個Terms,特征基因與抗原刺激的急性炎癥反應(yīng)、B 細胞介導免疫的調(diào)節(jié)、免疫球蛋白介導免疫應(yīng)答的調(diào)節(jié)等功能相關(guān)(圖9A)。在分子功能方面,共獲得9 個Terms,主要與酰胺結(jié)合、β-淀粉樣蛋白結(jié)合、水解酶活性、免疫受體活性、溶菌酶活性等功能相關(guān)(圖9B)。在細胞組成方面,共獲得7 個Terms,與高爾基體順面內(nèi)胞漿網(wǎng)、質(zhì)膜外側(cè)固有成分、膜微區(qū)、膜筏等功能相關(guān)(圖9C)。此外特征基因參與了急性髓系白血病、FcγR-介導吞噬作用、利什曼病、中性粒細胞外陷阱形成、系統(tǒng)性紅斑狼瘡、肺結(jié)核等疾病相關(guān)通路(圖9D)。
圖9 特征基因功能網(wǎng)絡(luò)Fig 9 Characteristic gene function network
2.7 特征基因的表達驗證 如圖10 所示,8 個特征基因中的5 個基因(Fcgr2b、Cd14、Fcgr1、Fcgr3、Ly86)在AD 腦組織中表達上調(diào)且有統(tǒng)計學意義。因此可作為AD 發(fā)展過程中與炎癥相關(guān)的關(guān)鍵基因。
圖10 5 個特征基因在相關(guān)的GSE122063 數(shù)據(jù)集的腦組織樣本中的表達Fig 10 Expression of five characteristic genes in brain tissue samples from the associated GSE122063 dataset
AD 是最常見且發(fā)病率最高的癡呆類型,嚴重影響著人們的生活質(zhì)量,已經(jīng)被世界衛(wèi)生組織列為全球公共衛(wèi)生重點之一,同時也是造成老年人死亡的第三主要病因[2]。目前尚未找到有效治愈的藥物或方法。臨床上被診斷具有輕度認知障礙的AD 患者其病情往往已經(jīng)進展到了較晚的階段,此時發(fā)生了不可逆轉(zhuǎn)的腦損傷,不能通過保護神經(jīng)或清除Aβ沉積來治愈,這也是目前AD 治療效果不理想的重要原因[15]。因此,早期診斷以及尋找有效的治療靶點對AD 的防治具有重要的意義。大量研究表明,神經(jīng)炎癥在AD 發(fā)生、發(fā)展中起著重要作用。本研究通過生物信息學分析方法鑒定出Fcgr2b、Cd14、Fcgr1、Fcgr3、Ly86 為AD 神經(jīng)炎癥過程中的關(guān)鍵基因,為AD 的機制研究及診斷治療提供新的思路。
神經(jīng)炎癥在AD 發(fā)生中涉及Aβ 的生成、神經(jīng)元丟失、氧化應(yīng)激等多方面病理過程。作為腦內(nèi)固有免疫細胞的小膠質(zhì)細胞在神經(jīng)炎癥的發(fā)生、發(fā)展過程中起著至關(guān)重要的作用。AD 發(fā)病早期,在炎癥因子和Aβ 等病理產(chǎn)物的作用下,小膠質(zhì)細胞發(fā)揮趨化和吞噬作用對病理物質(zhì)進行清除,并減輕炎癥。然而隨著疾病的逐漸加重,小膠質(zhì)細胞被持續(xù)刺激導致過度激活,其趨化和吞噬能力嚴重受損,對病理產(chǎn)物的清除能力下降,使得Aβ 大量積聚,此時促炎因子白細胞介素-1β、白細胞介素-6、腫瘤壞死因子-α 等產(chǎn)生持續(xù)增多,抑炎因子分泌減少,神經(jīng)炎癥不斷加重,產(chǎn)生神經(jīng)毒性,進一步加重神經(jīng)損傷[16]。AD 發(fā)病初期神經(jīng)炎癥的原因目前尚未完全闡明。在本研究中,KEGG 富集分析結(jié)果提示AD 神經(jīng)炎癥的發(fā)生與金黃色葡萄球菌感染、中性粒細胞外陷阱形成、細胞因子與細胞因子受體相互作用、FcγR 介導吞噬作用、Toll 樣受體等信號通路相關(guān)。GO 富集分析結(jié)果提示AD 的發(fā)生與白細胞遷移、炎癥的調(diào)節(jié)、白細胞增殖、對細菌源性分子的反應(yīng)、對外部刺激反應(yīng)的積極調(diào)節(jié)、細胞因子產(chǎn)生的正調(diào)節(jié)等生物學功能相關(guān)。因此研究神經(jīng)炎癥機制對AD 的診斷及防治具有至關(guān)重要的意義。
研究表明,F(xiàn)c 片段結(jié)合受體(fcreceptors,F(xiàn)cRs)能夠與IgG 的Fc 部分相結(jié)合。根據(jù)其不同的親和力,F(xiàn)cRs 可分為激活型受體和抑制型受體。其中Fcgr1、Fcgr3 為激活型受體,F(xiàn)cgr2b 是唯一的抑制型受體[17]。激活型受體在與免疫復合物(immune complex,IC)交聯(lián)后,Src 家族激酶(src family kinase,SFK)使免疫受體酪氨酸激活基序(immunoreceptor tyrosine-based activation motif,ITAM)上的酪氨酸殘基磷酸化,募集脾酪氨酸激酶(spleen tyrosine kinase,SYK),介導信號的激活從而調(diào)控下游分子表達[18]。Fcgr1、Fcgr3 廣泛存在于人和小鼠的小膠質(zhì)細胞中。AD 狀態(tài)下,兩者在小膠質(zhì)細胞中表達量增加。小膠質(zhì)細胞在激活型受體的作用下,對Aβ 的吞噬能力增強[19。Fcgr2b 雖然不含ITAM 基序,但其含有免疫受體酪氨酸抑制基序(Immunoreceptor tyrosinebased inhibition motif,ITIM),能夠通過其攜帶的ITIM 基序來拮抗激活型受體所引起的促進吞噬、釋放炎性介質(zhì)等信號,轉(zhuǎn)導抑制型信號[20]。有研究提出Fcgr2b 可能通過調(diào)控吞噬作用來參與心肌缺血再灌注損傷的病理過程[21]。此外,F(xiàn)cgr2b 是寡聚體Aβ的受體,寡聚體Aβ 會導致在原代培養(yǎng)的小膠質(zhì)細胞中Fcgr2b 聚集增多[22]。Fcgr2b 過表達則會介導Aβ對神經(jīng)細胞的損傷作用,導致小膠質(zhì)細胞凋亡[19]??傊?,F(xiàn)cgr1、Fcgr3、Fcgr2b 在神經(jīng)炎癥AD 中的具體機制仍需要進一步研究。本研究通過對GSE135999 和GSE144459 數(shù)據(jù)集差異表達的IRGs 分析表明,在AD 小鼠海馬中,F(xiàn)cgr1、Fcgr3、Fcgr2b 均為上調(diào)基因,在外部數(shù)據(jù)集GSE122063 中人腦組織中得以驗證,并且有較高的診斷效能,因此可能成為AD 發(fā)病過程中神經(jīng)炎癥相關(guān)的關(guān)鍵基因。
Cd14 作為白細胞分化抗原的一種,主要分布在單核細胞、巨噬細胞等細胞表面[23],其生物學活性主要表現(xiàn)在識別并結(jié)合脂多糖復合物。Cd14 作為脂多糖受體,可以參與并調(diào)控脂多糖性細胞反應(yīng)[24]。研究報道,多種損傷相關(guān)分子模式(damage-associated molecular patterns,DAMPs)可以作用于Cd14,促進炎性細胞分泌促炎因子[22]。Cd14 還作用于RNA 剪接、轉(zhuǎn)運,參與蛋白酶體蛋白質(zhì)的分解過程。Cd14 也被證實與AD 的發(fā)病相關(guān),其作用機制可能是小膠質(zhì)細胞表面激活的Cd14 促進細胞攝取Aβ,同時調(diào)節(jié)免疫應(yīng)答,改變腦內(nèi)的炎癥,影響AD 的發(fā)生、發(fā)展[25]。本研究結(jié)果表明Cd14 在AD 小鼠的海馬以及人腦組織中均表現(xiàn)為上調(diào)基因,與之前學者研究一致[25]。
Ly86 基因所編碼的蛋白質(zhì)為MD-1,它與RP105(Toll 樣受體家族蛋白)相結(jié)合形成免疫復合物RP105/MD-1,在B 細胞、巨噬細胞和樹突細胞等免疫細胞中表達[26]。有研究猜測Ly86 可能參與免疫功能異常相關(guān)疾病的調(diào)節(jié)過程[27]。已證實Ly86 基因的DNA 甲基化在肥胖、胰島素抵抗和炎癥中發(fā)揮重要作用[28]。有研究發(fā)現(xiàn),與野生型相比,MD-1 基因敲除可有效緩解高脂飲食誘導的小鼠脂肪組織炎癥及胰島素抵抗。感染等內(nèi)質(zhì)網(wǎng)應(yīng)激觸發(fā)因素可誘導血清和尿液中MD-1 的產(chǎn)生[29]。本研究結(jié)果發(fā)現(xiàn)Ly86 在AD 小鼠的海馬和人腦組織中均為上調(diào)基因,其機制還有待研究。
綜上所述,本研究基于生物信息學分析篩選出與AD 炎癥相關(guān)的8 個特征基因,其中5 個關(guān)鍵基因(Fcgr2b、Cd14、Fcgr1、Fcgr3、Ly86)可能成為AD潛在的診斷和治療靶點,其作用機制有待進一步探究。本文為探索AD 神經(jīng)炎癥發(fā)生、發(fā)展的分子機制、診斷和治療提供了依據(jù)。