袁文華 解琪琪 劉 正 沈 偉 馮曉飛 周海宇
(蘭州大學(xué)第二醫(yī)院骨科,甘肅省骨與關(guān)節(jié)疾病研究重點(diǎn)實(shí)驗(yàn)室,蘭州 730000)
類風(fēng)濕關(guān)節(jié)炎(rheumatoid arthritis,RA)是關(guān)節(jié)慢性炎癥性疾病,發(fā)病率為0.5%~1%,可引起軟骨和骨損傷,甚至導(dǎo)致殘疾[1,2]。目前對(duì)于大部分RA患者均采用以延緩病變進(jìn)程為主要目的的治療,然而并不能夠逆轉(zhuǎn)或者阻止病變的進(jìn)展,RA除了降低患者生活質(zhì)量外,還給個(gè)人、家庭及社會(huì)帶來了巨大的負(fù)擔(dān)[3,4]。關(guān)于RA發(fā)生發(fā)展的機(jī)制尚不完全明確,其中遺傳和滑膜炎癥扮演重要角色,進(jìn)一步闡明其發(fā)病機(jī)制是當(dāng)前RA研究領(lǐng)域的難題[5-7]。近年來生物信息學(xué)作為生命科學(xué)領(lǐng)域的新興學(xué)科,為疾病分子機(jī)制的實(shí)驗(yàn)研究提供了可能的依據(jù)和可行的思路[8,9]。本研究通過生物信息學(xué)相關(guān)方法對(duì)GEO數(shù)據(jù)庫中3個(gè)RA與正常滑膜組織基因芯片數(shù)據(jù)集進(jìn)行整合分析,篩選與RA相關(guān)的差異表達(dá)基因(differentially expressed genes,DEGs),然后進(jìn)行GO功能注釋、KEGG通路富集分析、蛋白-蛋白相互作用(PPI)網(wǎng)絡(luò)構(gòu)建,識(shí)別參與RA發(fā)生發(fā)展的關(guān)鍵基因,為RA發(fā)病機(jī)制的進(jìn)一步研究提供生物信息學(xué)依據(jù)。
1.1材料 生物信息學(xué)分析數(shù)據(jù)集GSE1919、GSE55235、GSE55457均來源于NCBI的GEO(Gene Expression Omnibus)數(shù)據(jù)庫,均為滑膜組織總RNA的mRNA表達(dá)譜芯片分析[10-12];GSE1919是基于GPL91平臺(tái)[HG_U95A]的Affymetrix Human Genome U95A Array,該芯片數(shù)據(jù)包括5例RA滑膜組織樣本、5例骨性關(guān)節(jié)炎組織樣本及5例正常人滑膜組織樣本,本研究納入5例RA及5例正?;そM織;GSE55235是基于GPL96平臺(tái)[HG-U133A]的Affymetrix Human Genome U133A Array,該芯片數(shù)據(jù)包括10例RA滑膜組織樣本、10例骨性關(guān)節(jié)炎組織樣本及10例正常人滑膜組織樣本,本研究納入10例RA及10例正?;そM織;GSE55457同樣是基于GPL96平臺(tái)[HG-U133A]的Affymetrix Human Genome U133A Array,該芯片數(shù)據(jù)包括10例RA滑膜組織樣本、13例骨性關(guān)節(jié)炎組織樣本及10例正常人滑膜組織樣本,本研究納入10例RA及10例正?;そM織。
1.2方法
1.2.1數(shù)據(jù)處理及篩選DEGs 3個(gè)數(shù)據(jù)集的原始CEL文件均通過R語言affy軟件包分析,進(jìn)行標(biāo)準(zhǔn)化預(yù)處理,得到每個(gè)樣本的探針表達(dá)矩陣,利用R語言limma工具包輸出同時(shí)滿足|log2 fold change(log2FC)|>1且P<0.05的DEGs,然后根據(jù)相應(yīng)平臺(tái)文件所對(duì)應(yīng)的R語言hgu133a.db、hgu95av2.db包將探針名轉(zhuǎn)化為基因名;將3個(gè)數(shù)據(jù)集所得DEGs取交集,然后對(duì)交集所得基因(以|log2FC|為標(biāo)準(zhǔn))使用heatmap.2工具包繪制熱圖,將每個(gè)DEG的差異表達(dá)情況進(jìn)行直觀展示[13,14]。
1.2.2DEGs的基因本體論和通路富集分析 基因本體論(gene ontology,GO)是注釋基因及其產(chǎn)物的重要方法和工具,有利于生物數(shù)據(jù)的整合和利用[15]。注釋、可視化數(shù)據(jù)庫DAVID(http://david.abcc.ncifcrf.gov/)是1個(gè)在線數(shù)據(jù)合成工具,為成功的高通量基因功能分析奠定基礎(chǔ)。利用DAVID對(duì)DEGs進(jìn)行GO和KEGG通路富集分析,并用R軟件包GOplot進(jìn)行結(jié)果可視化處理[16,17]。顯著性基因富集的臨界值設(shè)定為P<0.05。
1.2.3共表達(dá)分析 通過將所得58個(gè)DEGs導(dǎo)入STRING(Version:10.5)在線軟件(https://string-db.org/)中,得出PPI關(guān)系(score>0.4),并以TSV格式導(dǎo)出后,再將得到的源文件導(dǎo)入Cytoscape軟件,使用插件NetworkAnalyzer、cytoHubba進(jìn)行關(guān)鍵基因(Hub基因)的篩選,選用MCC算法,得分前10的基因選取為Hub基因[18-20]。
2.1數(shù)據(jù)處理和篩選DEGs 對(duì)GSE1919、GSE55235、GSE55457數(shù)據(jù)集的DEGs進(jìn)行標(biāo)準(zhǔn)化處理,標(biāo)準(zhǔn)化后以箱式圖呈現(xiàn)(圖1),然后采用spearman算法對(duì)兩組樣本進(jìn)行聚類分析,計(jì)算樣本之間的相關(guān)系數(shù),最終以R語言的pheatmap包進(jìn)行結(jié)果可視化[21]。結(jié)果表明樣本來源可靠(圖2);GSE1919篩選出262個(gè)DEGs,GSE55235篩選出527個(gè)DEGs,GSE55457篩選174個(gè)DEGs(圖3);圖4A~C為3個(gè)數(shù)據(jù)集表達(dá)的聚類熱圖,將GSE1919、GSE55235、GSE55457數(shù)據(jù)集所得差異基因取交集得到58個(gè)DEGs(圖4D)。
圖1 樣本表達(dá)校正箱式圖Fig.1 Sample expression correction box diagramNote:Box plot of number of genes among RA patient samples and control samples in GSE1919,GSE55235,and GSE55457.Red dots represent mean values of gene expression after sample normalization.
圖2 樣本聚類圖Fig.2 Sample clustering diagramNote:Heatmap of number of RA patient samples and control samples in GSE1919,GSE55235,and GSE55457.Green represents control group and purple represents RA group.
圖3 差異基因火山圖Fig.3 Differential gene volcano diagramNote:No significantly changed genes are marked as black dots,red dots represent up-regulated differential genes and green dots represent down-regulated genes.
圖4 差異基因交集Venn圖及熱圖分析Fig.4 Differential gene intersection Venn diagram and heatmap analysisNote:A-C.Heatmaps using hierarchical clustering of DEGs in GSE1919,GSE55235,and GSE55457;D.Venn diagram DEGs were selected with a fold change > 1 and P-value <0.05 among GSE1919,GSE55235,and GSE55457.
2.2GO和KEGG通路富集分析 采用DAVID數(shù)據(jù)庫對(duì)58個(gè)DEGs進(jìn)行GO功能富集分析結(jié)果表明,DEGs主要涉及免疫應(yīng)答、趨化因子介導(dǎo)的信號(hào)通路、炎癥反應(yīng)及細(xì)胞表面受體信號(hào)通路等生物過程,介導(dǎo)趨化因子活性、CXCR3趨化因子受體結(jié)合、抗原結(jié)合、免疫球蛋白受體結(jié)合等分子功能,主要富集于質(zhì)膜外區(qū)域;KEGG通路富集分析結(jié)果顯示DEGs主要涉及細(xì)胞因子-細(xì)胞因子受體相互作用、趨化因子信號(hào)通路、Toll樣受體信號(hào)通路等經(jīng)典信號(hào)通路(圖5)。
圖5 差異基因GO分析及通路富集分析Fig.5 GO analysis and pathway enrichment analysis of differential genesNote:A.GO functional enrichment analysis of DEGs;B.Kyoto Encyclopedia of Genes and Genomes enrichment analysis of DEGs.
2.3差異表達(dá)編碼蛋白質(zhì)間相互網(wǎng)絡(luò)分析及Hub基因表達(dá)驗(yàn)證 STRING工具和Cytoscape軟件對(duì)58個(gè)顯著DEGs進(jìn)行分析結(jié)果表明,CCR5、CCL5、CCL19、CXCL9、CXCL10、CCR2、CXCL13、CD2、CD27、PTPRC為所得Hub基因(圖6)。
圖6 差異基因編碼蛋白質(zhì)的PPI分析和Hub基因Fig.6 PPI analysis of differentially encoded proteins and Hub geneNote:A total of 58 DEGs were imported into STRING online software (version:10.5) to identify interactions among nodes (the parameters were default in STRING database) and exported in TSV format.The obtained source file was imported into Cytoscape software.A.Data were analyzed using NetworkAnalyzer plugin;B.CytoHubba plugin was used to analyze hub genes with maximum correlation criterion (MCC).
RA是最常見的慢性關(guān)節(jié)炎之一,可導(dǎo)致軟骨和骨損傷甚至殘疾[1,2]。當(dāng)前的治療主要以延緩病變進(jìn)程為主,并不能逆轉(zhuǎn)或者阻止病變的進(jìn)展[3,4]。且RA的病因尚不清楚,缺乏可靠的生物標(biāo)志物評(píng)估其預(yù)后、治療反應(yīng)和毒性,導(dǎo)致治療策略的制定在臨床實(shí)踐中十分困難[22]。因此,闡明RA的發(fā)病機(jī)制將有助于制定更有效的治療策略,并可能找到潛在的治療靶點(diǎn)。本研究利用生物信息學(xué)方法對(duì)3個(gè)數(shù)據(jù)集的RA和正常滑膜組織基因芯片進(jìn)行整合分析,共篩選出58個(gè)DEGs。隨后對(duì)DEGs進(jìn)行GO功能注釋及KEGG通路富集分析,尋找Hub基因,旨在為進(jìn)一步研究RA的發(fā)病機(jī)制提供參考依據(jù)。
為了解DEGs在RA中所涉及的通路及功能,課題組進(jìn)行了GO功能注釋及KEGG通路富集分析。結(jié)果顯示,DEGs主要涉及免疫應(yīng)答、趨化因子介導(dǎo)的信號(hào)通路、炎癥反應(yīng)及細(xì)胞表面受體信號(hào)通路等生物過程,介導(dǎo)趨化因子活性、CXCR3趨化因子受體結(jié)合、抗原結(jié)合、免疫球蛋白受體結(jié)合等分子功能,主要富集于質(zhì)膜外區(qū)域;上述生物過程及分子功能與免疫系統(tǒng)功能密切相關(guān),而免疫系統(tǒng)功能的異常導(dǎo)致了RA的發(fā)生發(fā)展[23,24]。KEGG通路富集分析顯示,DEGs主要富集到細(xì)胞因子-細(xì)胞因子受體信號(hào)通路、趨化因子信號(hào)通路和Toll樣受體信號(hào)通路;細(xì)胞因子與細(xì)胞因子受體信號(hào)通路參與了RA的發(fā)病機(jī)制,并在RA中介導(dǎo)中性粒細(xì)胞自噬[25,26];Toll樣受體信號(hào)通路與炎癥和自身免疫性疾病的發(fā)病機(jī)制密切相關(guān)[27]。大量研究表明,該信號(hào)通路在RA發(fā)生發(fā)展中起重要作用,且趨化因子信號(hào)通路同樣在RA中起一定作用[28-33]。由此可見,課題組的分析結(jié)果與既往研究結(jié)論一致,可信度較高,提示這些DEGs和信號(hào)通路可能參與RA的發(fā)生發(fā)展,通過對(duì)這些DEGs的監(jiān)測(cè)可能有助于評(píng)估RA的發(fā)生與進(jìn)展,而這些信號(hào)通路有望成為潛在的藥物治療靶點(diǎn)。
CCR2、CCR5、CCL5、CCL19、CXCL9、CXCL10、CXCL13、CD2、CD27、PTPRC為所得Hub基因。CCR2和CCR5同屬于趨化因子受體家族且互為同源物,CCR2位于3號(hào)染色體的趨化因子受體基因簇區(qū),其編碼的蛋白是單核細(xì)胞趨化蛋白-1(monocyte chemoattractant protein-1,MCP-1)的受體,是一種特異性介導(dǎo)單核細(xì)胞趨化性的趨化因子,而MCP-1主要參與RA等炎癥性疾病的單核細(xì)胞浸潤(rùn)[34]。CCR5功能與CCR2類似,為趨化因子CCL5的受體[35,36]。早在1999年Suzuki等[37]就發(fā)現(xiàn)了CCR5通過選擇性的募集促炎性T細(xì)胞到RA關(guān)節(jié)處從而發(fā)揮作用,之后大量研究也驗(yàn)證了兩者在RA的進(jìn)展中起重要作用[38-40]。CCL19是一種B 細(xì)胞特異性趨化因子,通過B 細(xì)胞上表達(dá)的相應(yīng)受體(CXCR5、CXCR4和 CCR7),促進(jìn) B 細(xì)胞在組織中的聚集和滑膜內(nèi)生發(fā)中心的形成[41];Sellam等[42]研究表明,RA患者血清中B細(xì)胞相關(guān)趨化因子CCL19表達(dá)水平升高,是B細(xì)胞介導(dǎo)的RA亞型新的生物標(biāo)志物,可用于預(yù)測(cè)利妥昔單抗(RTX)治療RA的臨床療效;有研究報(bào)道,RA患者的血液和滑液中趨化因子CCL19的水平升高,其通過CCR7/Rho信號(hào)通路刺激破骨細(xì)胞遷移和破骨活性,促進(jìn)RA的發(fā)生發(fā)展[43,44]。CXC趨化因子家族,又稱為γ-干擾素誘導(dǎo)的單核細(xì)胞趨化因子家族,為趨化因子大家族中的一個(gè)亞族,在炎癥性疾病及腫瘤中發(fā)揮重要作用[45-47]。Tsubaki等[48]研究表明在RA的早期階段,表達(dá)CXCR3的漿細(xì)胞大量被CXCL9陽性滑膜成纖維細(xì)胞招募至滑膜處;Kotrych等[49]通過檢測(cè)422例RA患者和338例正常人的CXCL9的基因多態(tài)性,發(fā)現(xiàn)其與RA的關(guān)系密切。以上研究均說明CXCL9在RA的發(fā)生發(fā)展中發(fā)揮重要作用,但其具體作用機(jī)制不明,值得進(jìn)一步深入探討。CXCL10是一種蛋白質(zhì)編碼基因,其編碼的促炎細(xì)胞因子參與多種生物過程,如外周免疫細(xì)胞的趨化、分化和活化等[50];Laragione等[51]研究表明,CXCL10在RA的高侵襲性成纖維細(xì)胞樣滑膜細(xì)胞(fibroblast-like synoviocyte,FLS)中的表達(dá)水平升高,發(fā)現(xiàn)CXCL10/CXCR3在調(diào)節(jié)RA患者FLS侵襲中具有一種新的自分泌/旁分泌作用,并提出CXCL10-CXCR3軸可能是一個(gè)新的潛在治療靶點(diǎn),可用于減少FLS侵襲及其相關(guān)的關(guān)節(jié)損傷和血管翳在RA中的侵襲和破壞;有研究報(bào)道,CXCL10在RA早期炎癥中起關(guān)鍵作用,可作為RA早期疾病活動(dòng)的生物標(biāo)志物[52]。此外,CD2、CD27在RA中的作用研究較為深入,機(jī)制相對(duì)明確[53,54]。PTPRC又稱受體型酪氨酸蛋白磷酸酶C(receptor-type tyrosine-protein phosphatase C,PTPRC),為蛋白酪氨酸磷酸酶(protein tyrosine phosphatase,PTP)家族的成員,PTP參與調(diào)節(jié)細(xì)胞生長(zhǎng)、分化、有絲分裂等多種細(xì)胞過程,已被證實(shí)是T細(xì)胞和B細(xì)胞抗原受體信號(hào)的重要調(diào)節(jié)因子,還可抑制JAK激酶,而這些功能均與RA的發(fā)生發(fā)展密切相關(guān)[1,4,22]。最新研究表明,PTPRC在RA中發(fā)揮作用,但具體作用機(jī)制尚不明確,值得深入研究[55,56]。CXCL13是一種通過與CXC趨化因子受體5(CXCR5)結(jié)合而吸引B淋巴細(xì)胞和濾泡輔助T淋巴細(xì)胞的趨化因子,涉及B淋巴細(xì)胞和濾泡輔助T淋巴細(xì)胞生發(fā)中心的形成,并可能將其募集到RA的滑膜組織中,產(chǎn)生抗體并引起局部免疫反應(yīng)從而促進(jìn)RA的發(fā)生發(fā)展,而血清CXCL13可作為RA早期炎癥的生物標(biāo)志物,通過監(jiān)測(cè)CXCL13,可以讓RA患者獲得早期診斷及治療,從而取得更佳的治療效果[57-60]。
綜上所述,本研究通過生物信息學(xué)方法整合RA表達(dá)譜芯片,分析其DEGs之間的相互關(guān)系,確定了可能導(dǎo)致RA發(fā)生發(fā)展的信號(hào)通路和Hub基因,其可能是RA潛在的治療靶點(diǎn)。這些發(fā)現(xiàn)可能有助于提高研究人員對(duì)RA潛在分子機(jī)制的認(rèn)識(shí),為RA發(fā)病機(jī)制的進(jìn)一步研究提供可能的參考依據(jù)。