孫 悅 夏 寧 戴瑋然
(1 重慶醫(yī)科大學(xué)附屬第一醫(yī)院內(nèi)分泌科,重慶市 400010; 2 廣西醫(yī)科大學(xué)第一附屬醫(yī)院老年內(nèi)分泌科,廣西南寧市 530021; 3 重慶醫(yī)科大學(xué)附屬第二醫(yī)院心內(nèi)科,重慶市 400010)
甲狀腺相關(guān)性眼病(thyroid-associated ophthalmopathy,TAO)是一種以眼球后及眶周組織的浸潤(rùn)性病變?yōu)樘卣鞯奶禺愋宰陨砻庖咝约膊?。研究顯示,25%~50%的Graves病患者會(huì)出現(xiàn)TAO[1],故TAO亦稱為Graves眼病。TAO的主要臨床特征包括眼球突出、淚腺增大、眼瞼回縮、復(fù)視和暴露性角膜病變,嚴(yán)重時(shí)可發(fā)展為不可逆的視力喪失[2]。目前TAO的治療手段主要包括基礎(chǔ)治療、藥物治療、放射治療和手術(shù)治療。其中,靜脈使用糖皮質(zhì)激素是中重度活動(dòng)性TAO的一線治療方案[3]。
有研究表明TAO 的病因及發(fā)病機(jī)制主要涉及環(huán)境、遺傳和免疫等因素[4],其中免疫因素是TAO發(fā)生、發(fā)展的關(guān)鍵因素。TAO的病理學(xué)改變主要為炎癥、脂肪形成和糖胺聚糖積累[5]。近年來,有學(xué)者認(rèn)為眼眶成纖維細(xì)胞是免疫細(xì)胞浸潤(rùn)并釋放促炎性細(xì)胞因子的主要靶點(diǎn),也是疾病進(jìn)展的積極參與者[6-7]。在TAO早期及后期,眼眶成纖維細(xì)胞被激活后可分泌多種細(xì)胞因子,如白細(xì)胞介素(interleukin,IL)-2、IL-4、IL- 5、IL-6、IL-10、γ-干擾素和腫瘤壞死因子α[5,8]。這些細(xì)胞因子促進(jìn)單核細(xì)胞和巨噬細(xì)胞在眶周組織中增殖,并促使眼眶成纖維細(xì)胞分化,刺激富含透明質(zhì)酸的基質(zhì)積聚,進(jìn)而引起免疫應(yīng)答[9]。盡管目前關(guān)于TAO發(fā)病機(jī)制的研究日益增多,但其與免疫細(xì)胞之間的關(guān)系尚不明確,有待進(jìn)一步研究。
近年來,基于高通量平臺(tái)的微陣列技術(shù)已被廣泛應(yīng)用于在基因組水平上探索和識(shí)別疾病診斷及預(yù)后評(píng)估的潛在生物標(biāo)志物。本研究通過生物信息學(xué)方法,從公共數(shù)據(jù)庫下載TAO患者的基因表達(dá)矩陣,獲取與TAO相關(guān)的差異表達(dá)基因(differentially expressed genes,DEGs),對(duì)DEGs進(jìn)行富集分析,并利用機(jī)器學(xué)習(xí)算法進(jìn)一步對(duì)這些基因進(jìn)行篩選以獲取特征性基因,分析特征性基因的診斷價(jià)值及與免疫細(xì)胞之間的相互作用,從而為TAO的診斷和治療提供新思路。
1.1 數(shù)據(jù)下載及整理 從GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)下載TAO相關(guān)基因芯片數(shù)據(jù)集GSE185952和GSE58331,整理數(shù)據(jù)后共獲得24例正常對(duì)照者(正常對(duì)照組)的樣本和27例TAO患者(TAO組)的樣本,樣本均取材自人眶周組織。利用R 4.2.1軟件的sva包對(duì) GSE185952和GSE58331的數(shù)據(jù)進(jìn)行批次校正及合并整理。
1.2 DEGs的獲取 利用R 4.2.1軟件的limma包對(duì)合并后的芯片數(shù)據(jù)進(jìn)行差異分析,設(shè)置篩選條件為校正后P值<0.05和|log2FC|>1,獲取DEGs,然后繪制熱圖及火山圖。
1.3 富集分析 (1)利用R 4.2.1軟件的clusterProfiler包對(duì)DEGs進(jìn)行基因本體論(Gene Ontology,GO)功能富集分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析,其中GO功能富集分析項(xiàng)目包括生物過程、細(xì)胞組分和分子功能。設(shè)置篩選條件為P<0.05,將P值從小到大進(jìn)行排序,取排名前10的條目進(jìn)行展示。(2)利用R 4.2.1軟件的dose包對(duì)DEGs進(jìn)行疾病本體(Disease Ontology,DO)富集分析。(3)在MSigDB 數(shù)據(jù)庫(https://www.gsea-msigdb.org/gsea/msigdb/)下載包含KEGG信息的基因集“c2.cp.kegg.v7.4.symbols.gmt”作為參考基因集,利用R 4.2.1軟件的clusterProfiler包進(jìn)行基因集富集分析(Gene Set Enrichment Analysis,GSEA),從而識(shí)別TAO組和正常對(duì)照組之間差異最顯著的信號(hào)通路,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
1.4 特征性基因的篩選 最小絕對(duì)值收斂和選擇算子(least absolute shrinkage and selection operator,LASSO)算法是一種利用正則化方法來提高預(yù)測(cè)精度的回歸分析算法,可借助R 4.2.1軟件的glmnet包進(jìn)行運(yùn)算;支持向量機(jī)-遞歸特征消除(support vector machine-recursive feature elimination,SVM-RFE)算法中的支持向量機(jī)算法則是一種監(jiān)督機(jī)器學(xué)習(xí)的技術(shù),被廣泛用于分類和回歸分析[10],為了避免過擬合,可進(jìn)一步采用遞歸特征消除算法從元數(shù)據(jù)隊(duì)列中識(shí)別出診斷效能最高的基因集。故本研究采用LASSO算法和SVM-RFE算法兩種機(jī)器學(xué)習(xí)算法,對(duì)DEGs進(jìn)行運(yùn)算分析,在LASSO算法中設(shè)置α=1,在SVM-RFE算法中設(shè)置sizes=c[2,4,6,8,seq(10,40,by=3)],篩選具有潛在診斷價(jià)值的特征性基因。最終將LASSO算法和SVM-RFE算法得到的基因取交集,獲取具有潛在診斷價(jià)值的最佳特征性基因并繪制韋恩圖。
1.5 特征性基因的診斷價(jià)值分析 為了檢驗(yàn)最佳特征性基因的診斷價(jià)值,利用TAO組和正常對(duì)照組的樣本數(shù)據(jù),繪制特征性基因mRNA表達(dá)量診斷TAO的受試者工作特征(receiver operating characteristic,ROC)曲線,以曲線下面積(area under the curve,AUC)表示診斷價(jià)值,AUC越大表明診斷價(jià)值越高。
1.6 免疫細(xì)胞浸潤(rùn)分析 針對(duì)兩組樣本的基因表達(dá)數(shù)據(jù),基于R 4.2.1軟件通過CIBERSORT反卷積算法模擬計(jì)算22種免疫細(xì)胞的轉(zhuǎn)錄特征矩陣。利用R 4.2.1軟件的corrplot包對(duì)各組內(nèi)22種免疫細(xì)胞的占比進(jìn)行可視化處理,再利用vioplot包繪制小提琴圖,對(duì)TAO組和正常對(duì)照組之間22種免疫細(xì)胞占比的差異性(采用Mann-Whitney檢驗(yàn)分析兩組的差異性)進(jìn)行可視化處理,然后利用pheatmap包繪制熱圖,展示22種免疫細(xì)胞的相關(guān)矩陣。
1.7 特征性基因與免疫細(xì)胞的相關(guān)性分析 利用R 4.2.1軟件的Spearman秩相關(guān)檢驗(yàn),在TAO組中分析診斷價(jià)值相對(duì)較大的最佳特征性基因的mRNA表達(dá)量與免疫細(xì)胞占比之間的相關(guān)性,并使用ggplot2包對(duì)結(jié)果進(jìn)行可視化展示。
2.1 DEGs的獲取情況 共得到20個(gè)DEGs,其中表達(dá)上調(diào)基因7個(gè),表達(dá)下調(diào)基因13個(gè)。上調(diào)基因分別為富含半胱氨酸/絲氨酸的核蛋白1(cysteine and serine rich nuclear protein 1,CSRNP1)、S100鈣結(jié)合蛋白 (S100 calcium binding protein,S100)A8、早期生長(zhǎng)應(yīng)答蛋白1(early growth response 1,EGR1)、原癌基因C-Fos(proto-oncogene C-Fos,FOS)、G0/G1轉(zhuǎn)換調(diào)節(jié)蛋白3 (G0/G1 switch regulatory protein 3,FOSB)、S100A12、核受體亞家族4 A組成員1(nuclear receptor subfamily 4 group A member 1,NR4A1 );下調(diào)基因分別為天冬酰胺內(nèi)肽酶(legumain,LGMN)、巨噬細(xì)胞表達(dá)基因1(macrophage expressed gene 1,MPEG1)、軟骨蛋白1(cartilage homeoprotein 1,ALX1)、凝血因子ⅩⅢ A1肽(coagulation factor ⅩⅢ A chain,F13A1)、跨膜結(jié)構(gòu)域4亞家族A成員4(membrane-spanning 4-domains,subfamily A,member 4,MS4A4A)、差異表達(dá)蛋白2(differentially expressed protein 2,DAB2)、補(bǔ)體因子H(complement factor H,CFH)、鋅指蛋白家族成員2(zinc finger protein family member 2,ZIC2)、可羅索β(Klotho beta,KLB)、淋巴管內(nèi)皮透明質(zhì)酸受體1(lymphatic vessel endothelial hyaluronan receptor 1,LYVE1)、半胱氨酸蛋白酶抑制劑A(cystatin A,CSTA)、基質(zhì)重塑關(guān)聯(lián)蛋白5(matrix remodeling associated 5,MXRA5)、甲狀腺激素反應(yīng)基因(thyroid hormone responsive,THRSP)。 見圖1。
圖1 DEGs的熱圖及火山圖
2.2 富集分析結(jié)果 (1)GO功能富集分析結(jié)果顯示,DEGs涉及的生物過程主要為骨骼肌細(xì)胞分化、激素代謝過程的正向調(diào)節(jié)、細(xì)胞趨化過程、烯烴化合物的生物合成、細(xì)胞對(duì)鈣離子的反應(yīng)等,涉及的細(xì)胞組分為分泌顆粒管腔及囊腔等,涉及的分子功能為DNA結(jié)合轉(zhuǎn)錄激活因子活性、多種受體(晚期糖基化終末產(chǎn)物受體、Toll樣受體等)結(jié)合、維生素D依賴性鈣結(jié)合蛋白、長(zhǎng)鏈脂肪酸結(jié)合及氨基?;D(zhuǎn)移酶活性等,見圖2A。KEGG通路富集分析結(jié)果顯示,大部分DEGs主要富集在IL-17信號(hào)通路、補(bǔ)體和凝血級(jí)聯(lián)、甲狀旁腺激素的合成與分泌、破骨細(xì)胞分化等信號(hào)通路中,見圖2B。(2)DO富集分析結(jié)果顯示,DEGs富集的疾病主要有食管腫瘤、關(guān)節(jié)炎、淋巴結(jié)疾病和川崎病等,見圖3。(3) GSEA結(jié)果顯示,與正常組相比,TAO組中的基因主要富集在與溶酶體、氧化磷酸化、氨基糖和核苷酸糖的代謝、N聚糖生物合成相關(guān)的信號(hào)通路及過氧化物酶體增殖物激活受體信號(hào)通路中,見圖4。
圖2 DEGs的GO功能富集分析和KEGG通路富集分析結(jié)果
圖3 DEGs的DO富集分析結(jié)果
圖4 GSEA結(jié)果
2.3 具有潛在診斷價(jià)值的最佳特征性基因的篩選結(jié)果 基于機(jī)器學(xué)習(xí)算法,對(duì)20個(gè)DEGs進(jìn)行篩選。使用LASSO算法進(jìn)行分析,得到ALX1、CSRNP1、KLB、MPEG1、S100A8、ZIC2 6個(gè)特征性基因,見圖5A;使用SVM-REF算法進(jìn)行分析,得到20個(gè)特征性基因,見圖5B。對(duì)兩種算法結(jié)果取交集后共獲得6個(gè)最佳特征性基因,即ALX1、CSRNP1、KLB、MPEG1、S100A8、ZIC2,見圖5C。
圖5 基于機(jī)器學(xué)習(xí)算法篩選具有潛在診斷價(jià)值的最佳特征性基因
2.4 最佳特征性基因?qū)AO的診斷價(jià)值 ROC曲線分析結(jié)果顯示,MPEG1的mRNA表達(dá)量診斷TAO的AUC相對(duì)較大,為0.889,提示其診斷價(jià)值較高,見圖6。
圖6 6個(gè)最佳特征性基因mRNA表達(dá)量診斷TAO的ROC曲線圖
2.5 免疫細(xì)胞浸潤(rùn)分析結(jié)果 正常對(duì)照組中,肥大細(xì)胞、樹突狀細(xì)胞及巨噬細(xì)胞的占比較大,而在TAO組中,中性粒細(xì)胞、嗜酸性粒細(xì)胞及自然殺傷(nature killer,NK)細(xì)胞的占比較大,見圖7A。小提琴圖顯示,TAO組的CD4+幼稚T淋巴細(xì)胞、濾泡輔助性T淋巴細(xì)胞、單核細(xì)胞、M0型巨噬細(xì)胞、激活的肥大細(xì)胞及中性粒細(xì)胞的占比均高于正常對(duì)照組,而M2型巨噬細(xì)胞和靜息的肥大細(xì)胞的占比均低于正常對(duì)照組(均P<0.05),見圖7B。21種免疫細(xì)胞之間的相關(guān)性見圖7C。
圖7 免疫細(xì)胞浸潤(rùn)分析
2.6 在TAO組中特征性基因與免疫細(xì)胞的相關(guān)性分析 對(duì)2.4得到的診斷價(jià)值相對(duì)較高的最佳特征性基因MPEG1的mRNA表達(dá)量與免疫細(xì)胞占比進(jìn)行相關(guān)性分析。結(jié)果顯示,MPEG1的mRNA表達(dá)量與CD4+幼稚T淋巴細(xì)胞(r=-0.492,P<0.001)、濾泡輔助性T淋巴細(xì)胞(r=-0.780,P<0.001)、單核細(xì)胞(r=-0.544,P<0.001)、M0型巨噬細(xì)胞(r=-0.524,P<0.001)、激活的肥大細(xì)胞(r=-0.662,P<0.001)占比呈負(fù)相關(guān),與M2型巨噬細(xì)胞(r=0.681,P<0.001)和靜息的肥大細(xì)胞(r=0.730,P<0.001)占比呈正相關(guān)。見圖8。
圖8 TAO組中MPEG1的mRNA表達(dá)量與免疫細(xì)胞占比的相關(guān)性
TAO是一種復(fù)雜的自身免疫性疾病,其確切的分子機(jī)制仍尚未完全明確[11],治療手段仍相對(duì)有限。近年來,隨著生物信息學(xué)的廣泛應(yīng)用,關(guān)于TAO發(fā)病機(jī)制及潛在靶點(diǎn)的研究日益增多。但是,由于TAO患者眶周組織標(biāo)本獲取困難,多數(shù)研究集中在患者血液標(biāo)本的測(cè)序比對(duì),準(zhǔn)確性相對(duì)較差。此外,免疫細(xì)胞與生物靶點(diǎn)之間相關(guān)性的研究仍比較匱乏。因此,本研究利用機(jī)器學(xué)習(xí)算法探索TAO的免疫相關(guān)基因,以期為探尋TAO治療靶點(diǎn)的相關(guān)研究提供參考依據(jù)。
本研究共獲得20個(gè)與TAO相關(guān)的DEGs,GO功能富集分析結(jié)果顯示,這些DEGs涉及的生物過程包括骨骼肌細(xì)胞分化、細(xì)胞趨化過程等,涉及的細(xì)胞組分包括分泌顆粒管腔及囊腔等,涉及的分子功能包括多種受體(晚期糖基化終末產(chǎn)物受體、Toll樣受體等)結(jié)合、長(zhǎng)鏈脂肪酸結(jié)合及氨基?;D(zhuǎn)移酶活性等,說明DEGs主要與分子趨化、受體激活及炎癥因子有關(guān)。研究表明,趨化因子和黏附分子可介導(dǎo)T淋巴細(xì)胞和B 淋巴細(xì)胞進(jìn)入眼部組織,參與TAO的病理過程[12-13]。李威等[14]發(fā)現(xiàn),在活動(dòng)期TAO患者的淚液中IL-17、IL-10、IL-6 等炎癥因子水平顯著高于穩(wěn)定期TAO患者,提示這些炎癥因子對(duì)TAO的發(fā)生有重要作用。國(guó)外已有研究表明,在細(xì)胞因子過氧化物酶體增殖物激活受體γ作用下,TAO患者的眼外肌細(xì)胞分泌C-X-C基序趨化因子配體10和C-C基序趨化因子配體2增多,導(dǎo)致TAO癥狀加重[15]。王秋怡等[16]也發(fā)現(xiàn),免疫細(xì)胞被激活后,趨化因子分泌增多,并可作用于眼眶成纖維細(xì)胞,引起眶周軟組織炎癥,使患者出現(xiàn)畏光、流淚、眼球突出等癥狀。研究顯示,C-C基序趨化因子受體5不僅參與腫瘤的發(fā)生和發(fā)展過程,還在自身免疫性甲狀腺疾病、糖尿病等許多自身免疫性疾病的發(fā)生和發(fā)展過程中有著重要的作用[17-18]。本研究的KEGG通路富集分析結(jié)果也顯示,DEGs主要富集在IL-17信號(hào)通路上,說明IL-17信號(hào)通路與TAO密切相關(guān),與既往研究結(jié)果[19]相符,IL-17有可能成為評(píng)估TAO疾病活動(dòng)程度的新指標(biāo)。DO富集分析結(jié)果顯示,較多的DEGs在關(guān)節(jié)炎、淋巴結(jié)疾病和川崎病中豐度較高。GSEA結(jié)果也提示,與正常對(duì)照組相比,TAO組中的基因主要富集在與溶酶體、氧化磷酸化、氨基糖和核苷酸糖的代謝、N聚糖生物合成相關(guān)的信號(hào)通路及過氧化物酶體增殖物激活受體信號(hào)通路中。說明這些DEGs在免疫炎癥性疾病的發(fā)生和發(fā)展過程中發(fā)揮重要作用,間接說明其可能也與TAO密切相關(guān)。
基于兩種機(jī)器學(xué)習(xí)算法及ROC曲線分析,我們發(fā)現(xiàn)MPEG1的mRNA表達(dá)量對(duì)TAO的診斷效能較高。MPEG1是首個(gè)被發(fā)現(xiàn)的高表達(dá)于人類和鼠科動(dòng)物巨噬細(xì)胞內(nèi)的基因。有研究顯示,在斑馬魚中轉(zhuǎn)入MPEG1基因后其巨噬細(xì)胞系反應(yīng)明顯增強(qiáng),說明MPEG1特異性表達(dá)于巨噬細(xì)胞[20]。MPEG1編碼的蛋白為穿孔素2,但其在巨噬細(xì)胞防御機(jī)制中的作用尚不清楚[21]。近期還有學(xué)者在彌漫性大B細(xì)胞淋巴瘤中檢測(cè)到MPEG1的突變,MPEG1的突變與T淋巴細(xì)胞激活和甲狀腺、淋巴結(jié)等器官轉(zhuǎn)移有著密切的關(guān)系[22]。然而,關(guān)于MPEG1與TAO之間相關(guān)性的研究仍相對(duì)匱乏,值得進(jìn)一步探索。
國(guó)內(nèi)已有研究證實(shí)TAO患者外周血中性粒細(xì)胞與淋巴細(xì)胞比值較正常人群升高,并與疾病的活動(dòng)度相關(guān)[23]。本研究利用CIBERSOTR反卷積算法分析免疫細(xì)胞浸潤(rùn)情況與TAO的關(guān)系,結(jié)果也顯示,CD4+幼稚T淋巴細(xì)胞、M0型巨噬細(xì)胞、中性粒細(xì)胞等多種免疫細(xì)胞在TAO中的占比高于正常組織。我們進(jìn)一步在TAO組中進(jìn)行相關(guān)性分析,結(jié)果提示MPEG1的mRNA表達(dá)量主要與單核細(xì)胞、巨噬細(xì)胞、CD4+T淋巴細(xì)胞等占比相關(guān)。近年來,國(guó)外學(xué)者通過對(duì)斑馬魚進(jìn)行MPEG1蛋白熒光標(biāo)記,并對(duì)其幼仔體內(nèi)巨噬細(xì)胞和淋巴樣祖細(xì)胞的轉(zhuǎn)錄組進(jìn)行排序和測(cè)序,發(fā)現(xiàn)在巨噬細(xì)胞中可特異性檢測(cè)到參與抗原呈遞和加工的基因的表達(dá),而在淋巴樣祖細(xì)胞中可檢測(cè)到參與巨噬細(xì)胞激活的基因的表達(dá)[24]。但是,以TAO患者為研究對(duì)象,探討患者體內(nèi)免疫細(xì)胞與MPEG1之間相互作用的研究仍處于空白。根據(jù)本研究的生物信息學(xué)分析結(jié)果,我們推測(cè)MPEG1極可能在TAO疾病的免疫應(yīng)答中發(fā)揮關(guān)鍵作用。
綜上所述,TAO是一種自身免疫性疾病,免疫細(xì)胞及炎癥因子均參與該病的發(fā)生和發(fā)展。MPEG1可能是TAO的特征性基因,其與多種免疫細(xì)胞有著緊密聯(lián)系,并與免疫細(xì)胞共同參與TAO的生理病理過程。這或可為研究TAO的發(fā)病機(jī)制及治療藥物提供新思路,但今后仍有待更深入的基礎(chǔ)研究加以驗(yàn)證。