陳曉文 李中鵬 王 芳 李章紊 吳 健
支氣管哮喘是全球范圍內(nèi)最常見的慢性呼吸道疾病之一,根據(jù)Th2 細胞因子是否參與其病理生理發(fā)展可將哮喘分為2 型和非2 型[1]。全球哮喘患者達3.58億,患病率較1990年增加了12.6%[2]。王辰院士團隊于2019年在《Lancet》雜志上發(fā)表了中國哮喘流行病學研究結(jié)果,中國哮喘病人總數(shù)約有4570萬,20歲及以上人群的哮喘患病率為4.2%,其中重度哮喘占5.99%,提示我國哮喘防控形勢嚴峻[3]。
持續(xù)24h仍不緩解的哮喘稱為哮喘持續(xù)狀態(tài)或重癥哮喘。重癥哮喘的臨床表現(xiàn)為發(fā)作性呼氣性呼吸困難,雙肺哮鳴音的呼吸系統(tǒng)急癥。重癥哮喘患者癥狀不受控制、經(jīng)常惡化,伴隨著肺功能的下降,嚴重影響患者的生存質(zhì)量,甚至危及生命[4, 5]。近年來針對其發(fā)病機制的研究,使阻斷多個分子靶點的生物制劑出現(xiàn)成為可能,如與免疫球蛋白E(IgE)、白介素(IL)-4、IL-5和IL-13等2型炎癥生物學標志物升高相關(guān)的2型哮喘。然而,2型炎癥僅能解釋約半數(shù)重癥哮喘發(fā)病機制,而關(guān)于非2 型哮喘的研究較少[6]。
誘導痰細胞學是確定哮喘炎癥表型的金標準,常用于評估氣道炎癥[7]。隨著組學研究的興起,利用誘導痰尋找重癥哮喘新生物學標志物的方法取得了突破[8]。篩選新的靶點,有可能作為重癥哮喘患者治療新靶標。本研究對正常人與重癥哮喘患者誘導痰基因芯片數(shù)據(jù)進行分析處理,旨在鑒定候選的重癥哮喘疾病進展中誘導痰顯著差異表達的關(guān)鍵基因。
1.數(shù)據(jù)集篩選:NCBI的GEO數(shù)據(jù)庫(Gene Expression Omnibus,GEO)是一個公共功能基因組數(shù)據(jù)庫,創(chuàng)建于2000年,收錄全世界各國研究機構(gòu)提交的高通量基因表達數(shù)據(jù)。本研究從GEO(Affymetrix GPL13158平臺,Affymetrix Human Genome U133 Plus 2.0 Array)下載基因表達數(shù)據(jù)集(GSE137268),數(shù)據(jù)集中包含33例重癥哮喘誘導痰樣本(嗜酸性粒細胞哮喘13例,非嗜酸性哮喘20例)和15例正常對照誘導痰樣本。
2.獲取差異基因:使用Benjamini&Hochberg方法進行統(tǒng)計分析,并用R語言軟件作火山圖。矯正后P<0.05同時log2(差異倍數(shù))≥0.58認為上調(diào)基因表達差異有統(tǒng)計學意義;矯正后P<0.05同時log2(差異倍數(shù))≤-0.58認為下調(diào)基因表達差異有統(tǒng)計學意義[9]。
3.蛋白互作網(wǎng)絡(luò)圖構(gòu)建:使用String數(shù)據(jù)庫構(gòu)建蛋白互作網(wǎng)絡(luò),String數(shù)據(jù)庫可用于了解已知的蛋白相互作用,這些數(shù)據(jù)來源于其他已經(jīng)過驗證的數(shù)據(jù)庫或?qū)嶒炇以紨?shù)據(jù),也可用于預測蛋白相互作用。使用Cytoscape進一步處理數(shù)據(jù),并使用MCODE確定蛋白互作網(wǎng)絡(luò)中最重要的模塊。選擇的標準為:MCODE評分>5分,度截止=2分,結(jié)點得分截止=0.2分,最大深度=100分,K-Score=2分[10]。
4.差異基因富集分析:《京都基因與基因組百科全書》(Kyoto Encyclopedia of Genes and Genomes,KEGG),是一個用于從高通量實驗技術(shù)產(chǎn)生的大規(guī)模分子數(shù)據(jù)集中了解高級功能和生物系統(tǒng)的數(shù)據(jù)資源庫。GO是用來注釋基因和分析基因生物學過程的主要生物信息學工具[11]。為了分析差異基因的功能,使用R軟件進行統(tǒng)計分析與可視化,R語言軟件包ClusterProfiler用于富集分析[12]。
1.差異表達基因篩選:GSE137268數(shù)據(jù)集檢測到22185個基因,其中顯著上調(diào)(矯正后P<0.05及l(fā)og2(差異倍數(shù))≥0.58)70個;顯著下調(diào)(矯正后P<0.05及l(fā)og2(差異倍數(shù))≤-0.58)31個。前10位顯著上調(diào)和下調(diào)基因詳見表1。圖1顯示了差異表達基因的分布情況。
表1 前10位顯著上調(diào)和下調(diào)基因
圖1 差異表達基因火山圖log2(差異倍數(shù)).對差異表達倍數(shù)值取log2,橫坐標的絕對值越大,表明基因表達量在兩個樣本間的倍數(shù)差異越大;-lg(P).對P值取-lg,縱坐標值越大,表明差異基因的表達越顯著。上調(diào)基因用紅色點表示;下調(diào)基因用綠色點表示;非顯著差異的基因用灰色點表示
2.蛋白互作網(wǎng)絡(luò)圖構(gòu)建:差異表達基因的蛋白相互作用網(wǎng)絡(luò)包含40個節(jié)點和52個邊,詳見圖2A。通過Cytoscape下的 MCODE插件,篩出一個最顯著的模塊,共5個節(jié)點,包含jumonji富含at結(jié)合結(jié)構(gòu)域2(jumonjiandat-rich interaction domain containing 2,JARID2)、組蛋白2簇h2ac (recombinant histone cluster 2,HIST2H2AC)、組蛋白2簇h2aa3(recombinant histone cluster 2, h2aa3,HIST2H2AA3)、組蛋白2簇h2be(recombinant histone cluster 2, h2be,HIST2H2BE)、多同源性蛋白2(polyhomeotichomolog 2,PHC2),詳見圖2。
圖2 差異表達基因的蛋白互作網(wǎng)絡(luò)圖及關(guān)鍵模塊A.差異表達基因蛋白互作網(wǎng)絡(luò);B.差異表達基因關(guān)鍵模塊
3.差異基因富集分析:在滿足矯正后P<0.05 且Q<0.2條件下,重癥哮喘組和健康對照組主要差異蛋白富集于激活T細胞和調(diào)節(jié)適應性免疫應答等生物進程;肌動蛋白結(jié)合、裂解酶、碳-碳裂解酶、細胞因子受體活性以及CARD蛋白結(jié)構(gòu)域等分子功能;中性粒細胞顆粒、Ficolins以及3級顆粒等細胞組成,詳見圖3。
圖3 GO富集分析A.生物進程;B.分子功能;C.細胞組成
4.KEGG富集分析:KEGG是一個整合了基因組、化學和系統(tǒng)功能信息的數(shù)據(jù)庫。具有把從已經(jīng)完整測序的基因組中得到的基因目錄與更高級別的細胞、物種和生態(tài)系統(tǒng)水平的系統(tǒng)功能關(guān)聯(lián)起來的功能。重癥哮喘組和健康對照組誘導痰差異上調(diào)蛋白IL3RA/IL1R2/CXCR4/TNFSF14/IL18R1參與了細胞因子-細胞因子受體相互作用;ALDOC/HK3/TFRC參與了HIF-1信號通路; CXCR4/TNFSF14/IL18R1同時參與了病毒與細胞因子-細胞因子受體相互作用; IL3RA/TFRC/IL1R2同時參與了造血細胞系統(tǒng);而ALDOC/HK3同時參與了果糖與甘露糖代謝,詳見圖4。
圖4 KEGG富集分析結(jié)果根據(jù)矯正后的P繪制氣泡圖以展現(xiàn)差異蛋白顯著富集的KEGG通路??v坐標為KEGG 通路,橫坐標數(shù)值為經(jīng)校驗后的P經(jīng)過lg負對數(shù)轉(zhuǎn)換后的值
誘導痰技術(shù)應用始于1958年,痰中豐富的細胞、蛋白質(zhì)和微生物成分可作為疾病嚴重性、急性發(fā)作、病情進展及治療療效評價的標志物。誘導痰技術(shù)作為哮喘實驗室檢查的一種手段,因其無創(chuàng)性、安全性、可靠性及可重復性,在哮喘的診斷及表型確定中受到重視[13]。近年來,基因芯片技術(shù)廣泛用于揭示疾病發(fā)生、發(fā)展中遺傳改變。對哮喘誘導痰基因芯片數(shù)據(jù)進行分析,有助于發(fā)掘治療哮喘的靶基因。
利用GEO2R對GSE137268基因芯片數(shù)據(jù)進行分析,獲得重癥哮喘與正常人氣誘導痰差異表達101個基因,其中70個上調(diào)基因,31個下調(diào)基因。通過蛋白相互作用網(wǎng)絡(luò),篩選出5個關(guān)鍵基因,包括JARID、HIST2H2AC、HIST2H2AA3、HIST2H2BE和PHC2。JARID2位于染色體6p22.3上,是組蛋白甲基轉(zhuǎn)移酶復合物的調(diào)節(jié)因子,在哮喘發(fā)生、發(fā)展中的作用未知[14]。HIST2H2AC、HIST2H2AA3和HIST2H2BE是核小體的核心成分。核小體將DNA包裹并壓縮成染色質(zhì),限制了DNA進入需要DNA作為模板的細胞機制。它們在轉(zhuǎn)錄調(diào)控、DNA修復、DNA復制和染色體穩(wěn)定性中起著重要作用,可調(diào)節(jié)細胞因子產(chǎn)生及在哮喘發(fā)病、嚴重程度[15]。PHC2是造血干細胞的重要調(diào)節(jié)因子,哮喘患者造血干細胞動員的具體機制目前仍不明確[16]。
富集分析提示T細胞參與的免疫應答在重癥哮喘患者疾病發(fā)生、發(fā)展中起重要作用。Th2亢進被認為是哮喘慢性氣道炎癥、氣道高反應性的關(guān)鍵環(huán)節(jié)[17, 18]。αβT分為CD4+αβT細胞和CD8+αβT兩種,主要在淋巴結(jié)之間巡邏、監(jiān)視,一旦受刺激被抗原遞呈細胞活化,前者可快速分化為效應或調(diào)節(jié)T細胞,后者可分化為細胞毒性T和記憶T細胞。大部分過敏性哮喘氣道炎癥表現(xiàn)是由Th2型細胞因子調(diào)控的嗜酸粒細胞所介導的,本研究納入20例非嗜酸性粒細胞哮喘,其免疫機制有待進一步深入研究。Ficolins是一種可溶分子,可與微生物表面上存在的碳水化合物相結(jié)合,且在凝集素補體激活途徑中充當識別分子,在哮喘發(fā)生、發(fā)展中機制未明。
KEGG信號通路分析結(jié)果可以看到重癥哮喘組與健康對照組誘導痰基因表達存在差異。細胞因子是可溶性的細胞外蛋白或糖蛋白,哮喘疾病的發(fā)生、發(fā)展中多種細胞因子相互作用。細胞因子充當細胞間重要的調(diào)節(jié)因子和動員因子,參與先天性和適應性免疫。在宿主防御、細胞生長、分化、死亡、血管生成以及發(fā)育和修復過程。缺氧誘導因子-1α是炎癥的主要調(diào)節(jié)者,研究觀察到在哮喘的肺泡巨噬細胞和肺實質(zhì)中上調(diào),可能驅(qū)動特定的哮喘表型[19]。研究顯示,美國兒童哮喘患病率(1980~1995年)不明原因的翻倍、持續(xù)攀升直至2013年的穩(wěn)定,可能與食品供應中高果糖玉米糖漿的擴散有關(guān)[20]。據(jù)估計,約30%~40%的成人哮喘發(fā)作與呼吸道病毒感染有關(guān)。大多數(shù)哮喘相關(guān)病毒包括呼吸道合胞病毒、鼻病毒和副流感病毒[21]。
綜上所述,通過生信分析篩選出的重癥哮喘誘導痰差異表達基因,部分在支氣管哮喘方面已有多項研究,但有些還有待于進一步探索,如PHC2與造血細胞系統(tǒng),以及補體系統(tǒng)重癥哮喘發(fā)生、發(fā)展中的作用。本實驗利用生物信息學分析工具可預測哮喘誘導痰差異表達關(guān)鍵基因及通路,為哮喘的診治提供潛在的治療目標。