馬慶慶,龔亞東,劉木波,韓曉靜,陳云華,唐 竹
(貴州航天醫(yī)院中心實驗室,貴州 遵義 563000)
結(jié)核病是由結(jié)核分枝桿菌感染所致,是在世界大范圍流行并嚴重威脅人類健康的傳染病。世界衛(wèi)生組織(WHO)估計,2018年約有1 000萬新增結(jié)核病患者,死亡人數(shù)高達120萬人,在致死性傳染性疾病中排名第一[1]。流行病學(xué)研究表明,全球約有17億人感染結(jié)核分枝桿菌,但其中絕大部分人處于潛伏感染狀態(tài)而不發(fā)病,5%~10%的感染者最終發(fā)展為活動性結(jié)核(PTB),在結(jié)核病發(fā)展過程中機體免疫功能發(fā)揮了關(guān)鍵作用[2-3],但具體分子機制至今尚未明確。因此,尋找與疾病相關(guān)的信號通路有助于闡明疾病發(fā)生、發(fā)展機制。
隨著高通量測序技術(shù)和基因組學(xué)的發(fā)展,以基因芯片為代表的基因表達分析數(shù)據(jù)呈指數(shù)增長趨勢,通過基因芯片篩選出差異基因可在短時間內(nèi)獲得大量與疾病相關(guān)的基因信息,在研究疾病發(fā)生、發(fā)展的相關(guān)基因和信號通路等方面發(fā)揮著重要作用[4-5]。本研究下載并分析了美國國立生物技術(shù)信息中心的基因表達數(shù)據(jù)庫(GEO)中的2個芯片數(shù)據(jù)集(GSE29536和GSE42834)[6-8]。篩選得到PTB和健康者差異基因,再對差異基因進行基因本體(GO)功能注釋和京都基因與基因組百科全書(KEGG)信號通路富集分析,構(gòu)建了蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò),對PPI網(wǎng)絡(luò)進行核心模塊篩選和信號通路富集分析,后續(xù)參照文獻[9-10]進行逆轉(zhuǎn)錄聚合酶鏈反應(yīng)(RT-PCR)驗證。探究了與PTB相關(guān)的基因和信號通路的功能變化,旨在為明確PTB發(fā)生的分子機制提供重要依據(jù)。
1.1數(shù)據(jù)來源 2021年3月在GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)中輸入關(guān)鍵詞“Active /Pulmonary Tuberculosis,blood”進行表達譜數(shù)據(jù)集搜索,篩選條件:(1)包含PTB患者和健康者樣本;(2)包含外周血樣本。經(jīng)過篩選得到GSE29536和GSE42834芯片數(shù)據(jù)集,包括49例PTB患者和224例健康對照者,樣本均來源于人全血。基于GPL10558(Illumina HumanHT-12 V4.0 expression beadchip)和GPL6102(Illumina human-6 v2.0 expression beadchip)平臺,表達數(shù)據(jù)均為Expression profiling by array,種屬為Homo sapiens。
1.2方法
1.2.1微陣列數(shù)據(jù)挖掘 在數(shù)據(jù)來源中選擇2個微陣列數(shù)據(jù)集(GSE29536,GSE42834)用于鑒定差異表達基因。將P<0.01作為標準,并用R語言heatmap,ggpubr,ggthems等R包分別對2個微陣列數(shù)據(jù)集進行可視化聚類分析及火山圖繪制。
1.2.2差異基因篩選 通過GEO2R篩選差異基因,限定條件為|log2 fold change(log2FC)|>1 且P<0.01。在http://bioinformatics.psb.ugent.be/web tools/Venn/網(wǎng)站進行差異基因篩選。
1.2.3GO功能富集與KEGG通路分析 GO主要是用于注釋基因和蛋白質(zhì)功能。包括3個生物學(xué)部分,即生物過程、細胞組件和分子功能。使用David網(wǎng)站(https://david.ncifcrf.gov/home.jsp)將篩選好的166個差異共表達基因進行GO功能分析與KEGG通路富集。并使用R語言中的ggplot2包進行氣泡圖可視化,應(yīng)用Funrich tool軟件分析通路富集相關(guān)性。P<0.01、FDR<0.05 設(shè)定為顯著性基因富集臨界值。
1.2.4蛋白互作網(wǎng)絡(luò) 通過STRING 數(shù)據(jù)庫(https://string-db.org/)構(gòu)建已確定的差異基因進行PPI網(wǎng)絡(luò)分析,然后使用 Cytoscape軟件中的cytohHubba,ClueGO等插件對網(wǎng)絡(luò)進行可視化和通路富集分析,篩選關(guān)鍵(hub)基因。
1.2.5RT-PCR驗證關(guān)鍵(hub)基因在PTB患者血液中的表達 驗證血液樣本系本院結(jié)核病科收治的45例PTB患者(PTB組)和15例健康者(健康對照組)。使用Paxgene Blood RNA Extraction Kit(Qiagen) 提取和純化全血中總RNA,經(jīng)反轉(zhuǎn)錄后獲得cDNA;以GAPDH作為內(nèi)參基因,采用FastStart Universal SYBR Green Master(Roche)試劑盒,利用Primer 3在線引物設(shè)計工具(http://primer3.ut.ee)設(shè)計各基因qPCR引物,qPCR檢測PTB組和健康對照組研究對象hub基因表達。根據(jù)2-ΔΔCT值計算hub基因在PTB患者中的相對表達量。
2.1差異基因篩選 GSE29536共有461個差異基因,上調(diào)基因229個,下調(diào)基因232個;GSE42834共有343個差異基因,上調(diào)基因282個,下調(diào)基因61個,見圖1A、B。上、下調(diào)基因與在線分析結(jié)果一致。見圖1C、D。2個芯片數(shù)據(jù)集差異共表達基因166個,包括114個上調(diào)基因和52個下調(diào)基因。見圖1E。
A.GSE29536 差異基因火山圖;B.GSE42834 差異基因火山圖,紅色代表上調(diào),藍色代表下調(diào);C.GSE29536聚類圖;D.GSE42834聚類圖;E.差異共表達基因維恩圖。
2.2GO與KEGG通路富集分析 差異基因主要富集在防御病毒、免疫反應(yīng)、先天免疫反應(yīng)、對病毒的反應(yīng)等生物過程,見圖2A。介導(dǎo)蛋白質(zhì)結(jié)合、腺苷三磷酸結(jié)合、相同的蛋白質(zhì)結(jié)合、鈣離子結(jié)合、蛋白激酶結(jié)合等分子功能,見圖2B。富集在細胞質(zhì)、胞質(zhì)溶膠、質(zhì)膜、細胞外區(qū)域、質(zhì)膜的組成部分、線粒體等細胞組分。見圖2C。差異基因主要涉及甲型流行性感冒(流感)、單純皰疹感染、麻疹、丙型肝炎、胞質(zhì)DNA傳感途徑、Toll樣受體信號通路、視黃酸誘導(dǎo)基因I(RIG-I)樣受體信號通路等過程。見圖2D。免疫系統(tǒng)信號通路與結(jié)核病患者相關(guān)性最高(44.6%),差異有統(tǒng)計學(xué)意義(P=0.001)。
A.生物過程圖;B.細胞組件圖;C.分子功能圖;D.KEGG通路富集圖。
2.3蛋白互作網(wǎng)絡(luò)分析 信號傳導(dǎo)及轉(zhuǎn)錄活化因子1(STAT1)、GBP1、TRIM5、CXCL10、TLR5、CCR7、CD3E、MAPK14、CD28、CCR1等在結(jié)核病患者中異常表達。10個hub基因分別為STAT1、CXCL10、干擾素(IFN)調(diào)節(jié)因子7(IRF7)、ISG15、IFIH1、IFIT1、IFIT3、GBP1、OAS1和OAS2。見圖3C。細胞因子生成、先天免疫、病毒防御等通路及生物過程明顯交互。見圖3D。主要功能涉及調(diào)節(jié)IFN、細胞因子、免疫反應(yīng)等方面。見表1。
A.蛋白互作網(wǎng)絡(luò)圖;B.hub基因;C.ClueGo富集分析通路餅狀圖;D.生物過程交互網(wǎng)絡(luò)圖。
表1 hub基因功能注釋
2.4RT-PCR驗證 STAT1、ISG15、OAS1表達明顯上調(diào),差異均有統(tǒng)計學(xué)意義(P<0.01)。見圖4。
aP<0.01。
結(jié)核分枝桿菌能通過多種途徑操縱巨噬細胞活化并在其胞內(nèi)建立適宜的增殖環(huán)境以防止被消除[11-12];同時,采取一系列機制逃逸宿主細胞的免疫應(yīng)答機制[13-14],與其易發(fā)生耐藥[15]及宿主免疫系統(tǒng)的相互適應(yīng)性改變等密切相關(guān)?;诨虮磉_數(shù)據(jù)庫挖掘相關(guān)差異表達基因和信號通路對結(jié)核病的診治具有至關(guān)重要的作用[16]。
為進一步了解PTB發(fā)生、發(fā)展的分子機制,本研究選取GEO 數(shù)據(jù)庫中與PTB密切相關(guān)的2張芯片數(shù)據(jù)集(GSE29536和GSE42834)參照文獻[17-18]的方法進行了生物信息學(xué)分析,樣本包括49例PTB患者和224例健康對照者(均為人全血樣本),結(jié)果顯示,GSE29536數(shù)據(jù)集共有461個差異基因,其中上調(diào)229個,下調(diào)232個;GSE42834數(shù)據(jù)集共有343個差異基因,其中上調(diào)282個,下調(diào)61個。采用GEO2R在線分析上、下調(diào)基因結(jié)果得到差異表達基因166個,進一步說明PTB的發(fā)病機制是極其復(fù)雜的,可能是由眾多基因和(或)蛋白質(zhì)分子等相互作用的結(jié)果[19-20]。
本研究通過GO富集分析發(fā)現(xiàn),差異基因主要富集于以下幾個方面:(1)生物過程,差異基因顯著富集于防御病毒、免疫反應(yīng)、先天免疫反應(yīng)、對病毒的反應(yīng)等;(2)細胞單位,差異基因顯著富集于細胞質(zhì)、胞質(zhì)溶膠、質(zhì)膜、細胞外區(qū)域、質(zhì)膜的組成部分、線粒體等;(3)分子功能,差異基因顯著富集于蛋白質(zhì)結(jié)合、腺苷三磷酸結(jié)合、相同的蛋白質(zhì)結(jié)合、鈣離子結(jié)合、蛋白激酶結(jié)合等。KEGG 信號通路主要富集在甲型流感、單純皰疹感染、麻疹、丙型肝炎、胞質(zhì)DNA傳感途徑、Toll樣受體信號通路、RIG-I樣受體信號通路等。
由于傳統(tǒng)篩選表達差異基因的方法會掩蓋一些具有重要生物學(xué)意義但表達上調(diào)倍數(shù)較低而被掩蓋的基因,本研究繼續(xù)運用FunRich軟件分析了全部差異基因相關(guān)的信號通路,結(jié)果顯示,免疫系統(tǒng)信號通路與結(jié)核病患者相關(guān)性最高。通過文獻發(fā)現(xiàn),本研究結(jié)果大部分可以在目前已發(fā)表的文獻中找到證據(jù)[21- 22]。結(jié)核分枝桿菌侵入機體后免疫調(diào)節(jié)功能的變化仍有待于進一步研究,而現(xiàn)有研究證明,固有免疫細胞如自然殺傷細胞、吞噬細胞等首先反應(yīng),啟動免疫反應(yīng)機制,隨之啟動適應(yīng)性免疫,共同完成免疫防御。機體抗結(jié)核感染的過程是一個精細而復(fù)雜的免疫反應(yīng)過程,其相互影響,共同維持機體的正常免疫防御機制[23]。
本研究借助STRING在線數(shù)據(jù)庫和Cytoscape軟件對差異基因進行了蛋白質(zhì)相互作用網(wǎng)格分析,篩選得到10個關(guān)鍵基因,即STAT1、IRF7、CXCL10、ISG15、IFIH1、IFIT1、OAS1、GBP1、IFIT3和OAS2。
本研究驗證結(jié)果證實,STAT1、ISG15、OAS1 mRNA在PTB患者外周血中表達明顯上調(diào)。有研究表明,在結(jié)核病感染的早期STAT1可通過磷酸化促進下游凋亡因子激活轉(zhuǎn)錄。同時,STAT1在促進巨噬細胞極化到M1極化巨噬細胞方面也非常重要,與M2極化巨噬細胞比較,STAT1可更有效地清除結(jié)核分枝桿菌[24]。STAT1可結(jié)合特定的含磷酸酪氨酸的肽段,當STAT被磷酸化時會聚集成同源的二聚體,從而參與IFN-γ引發(fā)的信號通路。當STAT進入細胞核時IFN誘導(dǎo)的早期基因表達被與啟動子結(jié)合的IFN-γ激活序列激活[25]。因此認為,STAT1可能在結(jié)核病免疫防御過程中具有至關(guān)重要的作用。IRF、STAT均具有共有的靶基因。有研究表明,IRF7是誘導(dǎo)IFN表達的最重要的調(diào)節(jié)因子之一[26]。IFN尤其是IFN-γ是與結(jié)核的發(fā)生、發(fā)展、轉(zhuǎn)歸、診治均密切相關(guān)。目前,已被用于結(jié)核病的診斷及免疫治療等方面。另外,有研究探索了CXCL10(IP-10)作為IFN-γ的替代標記物的可行性,結(jié)果證實CXCL10的診斷準確性與IFN-γ相當,且CXCL10在幼兒和細胞免疫低下的人類免疫缺陷病毒感染者中可能更為準確[27]。ISG15是IFN誘導(dǎo)產(chǎn)生的一種類泛素蛋白分子,其在抗病毒反應(yīng)中具有重要作用,DOS SANTOS等[28]研究證實,ISG15與PTB的炎性反應(yīng)和疾病嚴重程度密切相關(guān),表明其可能作為結(jié)核病的生物標志物。
綜上所述,本研究通過對結(jié)核病芯片表達譜數(shù)據(jù)的挖掘分析,獲得結(jié)核病患者基因表達差異基因,并初步對差異基因進行了功能富集和探討,構(gòu)建出蛋白質(zhì)相互作用網(wǎng)絡(luò)圖,并篩選出關(guān)鍵差異基因。結(jié)合RT-PCR驗證結(jié)果也支持了部分數(shù)據(jù)分析結(jié)果,但更深入的機制仍值得探究。本研究篩選到的基因為今后更進一步研究以上生物學(xué)過程在結(jié)核病發(fā)病機制中的作用提供了新的可能和方向。