張 宇 封明軒 朱建軍 夏 強(qiáng)
膽道閉鎖(BA)是一種嚴(yán)重的新生兒疾病,由于肝內(nèi)膽管和肝外膽管的炎性反應(yīng)及進(jìn)行性纖維化,最終導(dǎo)致膽汁淤積性肝硬化[1-2]。盡管Kasai手術(shù)可以改善部分患者的癥狀,但大約80%的BA患者最終需要進(jìn)行肝移植;同時(shí),BA也是小兒肝移植主要的手術(shù)適應(yīng)證之一[3]。BA的病因和發(fā)病機(jī)制目前尚未明確,有研究報(bào)道其可能主要與遺傳易感性、先天發(fā)育異常、病毒感染以及異常的自身免疫等因素相關(guān)[4]。高通量基因芯片和測(cè)序技術(shù)的不斷發(fā)展為從基因水平深入研究BA的病因提供了重要線索。本研究通過(guò)對(duì)BA肝組織、肝硬化組織和正常肝組織的基因表達(dá)譜進(jìn)行分析后篩選出差異基因,對(duì)差異基因進(jìn)行生物學(xué)功能和信號(hào)通路分析,旨在進(jìn)一步揭示BA的發(fā)生、發(fā)展機(jī)制。
生物信息學(xué)分析數(shù)據(jù)GSE46960來(lái)自公共數(shù)據(jù)平臺(tái)GEO(Gene Expression Omnibus)數(shù)據(jù)庫(kù),該芯片共有85例樣本,包括64例BA患者的肝組織、14例年齡匹配的非BA的肝硬化組織和7名正常兒童的肝組織。
用R語(yǔ)言軟件讀取下載矩陣文件,使用limma包[5]分別對(duì)BA肝組織、非BA的肝硬化組織和正常肝組織進(jìn)行分析,根據(jù)基因表達(dá)差異倍數(shù)|logFC|≥1且adjustP<0.05,得到各自差異表達(dá)基因(DEG)。最終篩選出與BA相關(guān)的DEG。
通過(guò)DAVID(the Database for Annotation, Visualization and Integrated Discovery)數(shù)據(jù)庫(kù)[6]對(duì)DEG行KEGG(Kyoto Encyclopedia of Genes and Genomes)信號(hào)通路分析,得到DEG的KEGG信號(hào)通路分析結(jié)果,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
通過(guò)在線分析網(wǎng)站STRING(Search Tool for the Retrieval of Interacting Genes)得到DEG的PPI(Protein-Protein Interaction)網(wǎng)絡(luò),篩選條件為評(píng)分>0.4。運(yùn)用Cytoscape在PPI網(wǎng)絡(luò)中篩選合適的模塊,設(shè)置條件為MCODE(Molecular Complex Detection)評(píng)分>6。
運(yùn)用GSE46960芯片,將BA肝組織和正常肝組織進(jìn)行GSEA(Gene Set Enrichment Analysis)分析,篩選出差異較顯著的兩條信號(hào)通路,合并這兩條通路的Core Enrichment Gene。
將BA肝組織與正常肝組織進(jìn)行比較,篩選出484個(gè)差異基因(DEG1),其中在BA肝組織中表達(dá)上調(diào)的有283個(gè)基因,表達(dá)下調(diào)的有201個(gè)基因(圖1A)。將非BA的肝硬化組織與正常肝組織進(jìn)行比較,篩選出438個(gè)差異基因(DEG2),其中在非BA的肝硬化組織中表達(dá)上調(diào)的有205個(gè)基因,表達(dá)下調(diào)的有233個(gè)基因(圖1B)。在DEG1中去除與DEG2并集的基因,得到在BA中起特異作用的146個(gè)差異基因(DEG3),其中表達(dá)上調(diào)的基因?yàn)?28個(gè)(圖1C),表達(dá)下調(diào)的基因?yàn)?8個(gè)(圖1D)。
對(duì)DEG3進(jìn)行KEGG分析,發(fā)現(xiàn)其主要涉及的信號(hào)通路為細(xì)胞外基質(zhì)-受體相互作用、黏附等過(guò)程(圖2A);同時(shí),將DEG3導(dǎo)入STRING在線分析網(wǎng)站得到PPI網(wǎng)絡(luò)圖,運(yùn)用Cytoscape軟件分析后得到了主要包括21個(gè)差異基因(DEG4)的模塊(圖2B)。
根據(jù)GSE46960數(shù)據(jù)庫(kù),運(yùn)用GSEA篩選出BA患者中上調(diào)較明顯的兩條信號(hào)通路,分別為ECM-receptor interaction(圖3A)和Focal adhesion(圖3B)。同時(shí)富集出79個(gè)Core Enrichment Gene,將其與DEG4做交集,得到11個(gè)在BA中差異表達(dá)且與細(xì)胞外基質(zhì)-受體相互作用和黏附信號(hào)通路密切相關(guān)的基因(圖3C)。
注:NC指正常肝組織,DC指非BA的肝硬化組織
圖1 BA的DEG篩選 A BA肝組織與NC相比DEG的表達(dá) B DC與NC相比DEG的表達(dá) C DEG中表達(dá)上調(diào)的基因 D DEG中表達(dá)下調(diào)的基因
圖2 DEG3的KEGG分析和PPI網(wǎng)絡(luò)分析 A KEGG分析結(jié)果 B PPI網(wǎng)絡(luò)分析結(jié)果
圖3 GSEA篩選BA的信號(hào)通路 A ECM-receptor interaction通路 B Focal adhesion通路 C PPI網(wǎng)絡(luò)分析出的差異基因與GSEA富集出的Core Enrichment Gene做交集
運(yùn)用受試者工作特征(ROC)曲線檢測(cè)在肝臟組織中表達(dá)的11個(gè)DEG診斷BA的準(zhǔn)確度,同時(shí)運(yùn)用二元Logistic回歸分析篩選出JUN和LAMC2(表1)。聯(lián)合JUN和LAMC2后,運(yùn)用ROC曲線診斷BA的準(zhǔn)確度可提高至96.4%(圖4)。
表1 JUN和LAMC2診斷BA的二元Logistic回歸分析
圖4 11個(gè)DEG診斷BA的ROC曲線
BA的病因尚未明確,可能與遺傳易感性、先天發(fā)育異常、病毒感染以及異常的自身免疫等因素相關(guān)。隨著科研技術(shù)的發(fā)展,微陣列表達(dá)譜分析可以提供人類基因組中數(shù)千個(gè)基因的表達(dá)差異的信息,本研究運(yùn)用此技術(shù)預(yù)測(cè)BA發(fā)生、發(fā)展中的關(guān)鍵生物學(xué)過(guò)程以及潛在的基因。
本研究篩選了微陣列數(shù)據(jù)GSE46960,對(duì)64例BA患者的肝組織、14例年齡匹配的非BA的肝硬化組織和7名正常兒童的肝組織進(jìn)行生物信息學(xué)分析,通過(guò)比較,最終篩選出可能與BA有密切關(guān)系的DEG3,其中表達(dá)上調(diào)的基因?yàn)?28個(gè),表達(dá)下調(diào)的基因?yàn)?8個(gè)。通過(guò)KEGG分析,DEG的信號(hào)通路主要與細(xì)胞外基質(zhì)-受體相互作用和黏附等相關(guān)。細(xì)胞外基質(zhì)可調(diào)節(jié)細(xì)胞的多種功能,如存活、生長(zhǎng)、遷移和分化等,且對(duì)維持正常的體內(nèi)平衡至關(guān)重要[7],失調(diào)的細(xì)胞外基質(zhì)重塑與病理狀況可能加劇疾病進(jìn)展[8]。BA患者處于炎性感染狀態(tài)[9],異常的基質(zhì)形成可能是BA患者肝膽管樹(shù)易遭受感染的重要原因之一;細(xì)胞外基質(zhì)作為可溶性細(xì)胞因子儲(chǔ)存庫(kù)[10],異常的細(xì)胞外基質(zhì)的功能失調(diào)可進(jìn)一步加重炎性反應(yīng),持續(xù)的炎性反應(yīng)可能與BA的發(fā)生密切相關(guān),最終可導(dǎo)致膽汁淤積性肝硬化,肝纖維化的過(guò)程同樣也是細(xì)胞外基質(zhì)重塑的過(guò)程[11]。
本研究運(yùn)用STRING和Cytoscape 構(gòu)建DEG的PPI網(wǎng)絡(luò),篩選出了DEG4模塊。其中白細(xì)胞介素-8(IL-8)是人類疾病中炎性反應(yīng)和免疫反應(yīng)的重要介質(zhì)[12]。有報(bào)道指出,IL-8在BA中過(guò)表達(dá),其表達(dá)水平與炎性反應(yīng)及肝纖維化程度呈正相關(guān)[13]。CTGF由多種間充質(zhì)細(xì)胞和上皮細(xì)胞產(chǎn)生,是促纖維化因子——轉(zhuǎn)化生長(zhǎng)因子-β(TGF-β)的下游介質(zhì)[14];BA肝組織中CTGF表達(dá)上調(diào),且與纖維化程度相關(guān)[15]。LOX、COL5A1、BNG、LAMC1等基因在細(xì)胞外基質(zhì)的形成和重建過(guò)程中起著重要作用[16-17],其與BA發(fā)病機(jī)制之間的關(guān)系有待進(jìn)一步研究。本研究通過(guò)GSEA對(duì)BA信號(hào)通路進(jìn)行分析,篩選出差異較顯著的兩條通路(細(xì)胞外基質(zhì)-受體相互作用和黏附),提示這兩條通路在BA的發(fā)生、發(fā)展中起著重要作用。同時(shí),本研究富集出79個(gè)Core Enrichment Gene,將其與DEG4做交集后得到了11個(gè)基因,提示這11個(gè)DEG在BA的發(fā)生、發(fā)展中參與了細(xì)胞外基質(zhì)-受體相互作用和黏附作用。本研究運(yùn)用ROC曲線進(jìn)一步探究了這11個(gè)DEG對(duì)于BA肝臟組織診斷的準(zhǔn)確度,并運(yùn)用二元Logistic回歸分析篩選出JUN和LAMC2基因。結(jié)果表明,JUN聯(lián)合LAMC2診斷BA的準(zhǔn)確度可達(dá)96.4%。
BA是兒童終末期肝病的常見(jiàn)原因,肝移植是目前唯一的治療手段。BA的發(fā)病原因和機(jī)制目前尚未明確,本研究通過(guò)生物信息學(xué)分析發(fā)現(xiàn),細(xì)胞外基質(zhì)-受體相互作用和黏附信號(hào)通路與BA的發(fā)生、發(fā)展密切相關(guān),且篩選了11個(gè)與該生物反應(yīng)過(guò)程密切相關(guān)的基因,但其在BA中的具體作用有待進(jìn)一步驗(yàn)證。