王紫 孫婷也 陶筱婷 王昕 莊美婷 李海洲 李青峰
增生性瘢痕是皮膚組織損傷后傷口過度愈合形成的纖維增生性疾病。瘢痕的過度增生與攣縮,可導致局部畸形并產(chǎn)生功能障礙,是臨床治療的難題[1]。
研究表明,M2型巨噬細胞是參與增生性瘢痕形成的重要調控細胞。巨噬細胞是免疫反應、組織修復和重塑過程中發(fā)揮主要作用的免疫細胞。在慢性炎癥中,持續(xù)積聚的巨噬細胞可導致組織破壞和纖維化。巨噬細胞的多能性與其表型密切相關。其中M1型為促炎表型,由Th1型細胞因子等激活后參與經(jīng)典的炎癥反應[2]。M2型則由Th2型細胞因子等激活,產(chǎn)生抗炎因子并參與組織修復、重塑、發(fā)育及再生等過程[3]。現(xiàn)有證據(jù)表明:①增生性瘢痕中IL-4 mRNA表達升高,是激活M2型巨噬細胞,誘導增生性瘢痕形成的重要因素[4];②局部應用IL-4和IL-13可激活M2型巨噬細胞,從而使組織中TGF-β表達上調,通過下游Smad信號通路直接促進成纖維細胞膠原蛋白合成;③M2巨噬細胞可直接生成某些ECM(細胞外基質)成分,包括Ⅵ型膠原蛋白、纖連蛋白和βIG-H3等[5-6]。由此可見,Th2細胞因子和M2型巨噬細胞在增生性瘢痕形成中具有重要作用。目前,這一免疫應答的啟動及調節(jié)機制仍未闡明,故尚無針對性的干預方法,臨床治療效果有限。
本研究擬采用加權基因共表達網(wǎng)絡分析(WGCNA)[7],對小鼠增生性瘢痕的全基因組表達數(shù)據(jù)GSE26390進行處理,尋找與M2型巨噬細胞、Th2細胞因子和纖維化高度相關的共表達基因模塊,通過分析關鍵結點基因與目標基因的關聯(lián)性,尋找到瘢痕形成過程中起到最關鍵作用的靶基因,從而為臨床預防和治療增生性瘢痕提供新的作用靶點,并為此類纖維化相關疾病的病理發(fā)生機制研究提供參考。
小鼠瘢痕的全基因組表達數(shù)據(jù)GSE26390(NCBI下載,數(shù)據(jù)來源為 Wong等的工作[8])。
在WGCNA算法中,每一個共表達基因組代表一個鄰接矩陣,鄰接矩陣包含了每對節(jié)點之間的關聯(lián)度,即每對基因 i和 j的相關系數(shù)為 Sij=|cor(m,n)|。算法的前提是共表達網(wǎng)絡需服從無尺度網(wǎng)絡分布。因此,我們對基因的相關系數(shù)進行加權處理。權重的選擇標準是能使得基因間的連接服從無尺度網(wǎng)絡分布(Scale-free networks),即連接數(shù)為 i的概率 P(i)與in成反比。
最直接的鄰接函數(shù)使用硬閾值,節(jié)點之間的關聯(lián)度僅有“1”或“0”兩個數(shù)值。
即閾值設定為0.8,那么即便關聯(lián)度為0.79的節(jié)點仍定義為不相關。為了避免損失大量信息,我們引入冪指數(shù)鄰接函數(shù),aij=power(Sij,B)=|Sij|β(圖 1)。
圖1 冪指數(shù)鄰接函數(shù)Fig.1 Power exponent adjacency function
模塊是指高度關聯(lián)的共表達基因群,在WGCNA算法中即為符合高度拓撲覆蓋的節(jié)點群。我們引入TOM離散度來構建分層聚類樹,利用動態(tài)切割去除非必要基因,從而獲得所需的基因模塊組。
模塊向量基因代表模塊內關聯(lián)度最高的基因。模塊向量基因可以通過對表達數(shù)據(jù)的奇異性分解得到(X=UDVT),X是指定模塊的基因表達數(shù)據(jù),V表示模塊向量基因。
計算每個基因模塊的特征值與外部特征的相關系數(shù),然后利用t檢驗分析基因重要性,確定模塊與外部特征是否相關,從而縮小基因模塊,定位關鍵基因(Hub gene)所在模塊。
通過計算基因i與模塊內的向量基因的關聯(lián)得到模塊聯(lián)盟:MM(i)=|cor(x(i),ME)|。然后通過基因重要性(Gene significance)尋找模塊中處于關鍵地位的靶基因。
為了盡量滿足無尺度網(wǎng)絡分布前提條件,編寫探索鄰接矩陣權重參數(shù)取值,使參數(shù)取值1~18,計算相應的模型,選擇統(tǒng)計量繪制圖形(圖2),以權重值10為相關系數(shù)的平方取值較高(達到0.8)。
圖2 權重值的選擇與平均關聯(lián)性Fig.2 Weight value selection and average correlation
以TOM離散度來構建分層聚類樹,使用動態(tài)剪切法確定基因模塊后,依次計算每個模塊的特征向量值,然后對模塊進行聚類分析,將距離較近的模塊合并成新的模塊,設置高度為0.25。
小鼠瘢痕的全基因組表達數(shù)據(jù)GSE26390分析結果顯示,小鼠瘢痕形成全基因組數(shù)據(jù)中共形成31個網(wǎng)絡模塊。這些模塊是通過基于拓撲結構重疊的不相似性的聚類方法分析檢測到的,每一個模塊用一種顏色來表示(圖3)。不同基因間、不同模塊間的TOM 離散度不同,組成了熱圖(圖4)。
圖3 合并距離較近的模塊并形成最終模塊Fig.3 Merge modules closer together and form the finalmodule
圖4 TOM離散度熱圖Fig.4 TOM discrete heat map
通過進一步運算基因模塊成員關系運算(Gene-module membership),獲得了每個特定基因與各個模塊間的關系。結合前期文獻檢索得到的巨噬細胞、纖維化相關基因。挑選Blue2、magenta、green4及darkmargenta模塊進行進一步的模塊內分析工作。其中,Blue2模塊與M2型巨噬細胞及纖維化相關表型有很強的正相關性(圖5)。
圖5 基因模塊成員關系圖,各個模塊與相關巨噬細胞及纖維化基因指標的關系Fig.5 Gene module membership diagram,relationship between each module and related macrophage and fibrosis gene indicators
對Blue2模塊進行進一步的分析。首先,利用DAVID功能注釋生物信息學芯片分析系統(tǒng)(DAVID Bioinformatics Resources 6.7)對Blue2模塊進行富集分析(Functional Annotation Clustering),形成 169 個類聚簇,其中信號轉導、膠原、組織愈合等類聚簇富集化程度較高。進一步的KEEG信號通路富集分析發(fā)現(xiàn)34個有統(tǒng)計學意義的相關信號通路,其中包括Leukocyte transendothelial migration、Fc gamma R-mediated phagocytosis、Toll-like receptor signaling 等多個免疫細胞相關信號通路(表1)。
表1 Blue2模塊的KEEG通路富集分析Table 1 Functional annotation clustering of KEEG pathway in the Blue2 module
上述結果表明,Blue2模塊是介導免疫細胞參與纖維化過程的主要模塊,對該模塊中的核心基因進行調控,作為靶向干預手段,可能對治療瘢痕有一定作用。為此,我們在上述基礎上,將基因關聯(lián)性數(shù)據(jù)導入Cytoscape程序,分別對重要模塊的基因作核心基因可視化分析。通過比較模塊內連通性和基因重要性可以找到一些免疫調控瘢痕的關鍵基因。在模塊中與其他基因關聯(lián)性越多的基因,往往在模塊中的作用越重要。通過Cytoscape對基因間關聯(lián)性和模塊內基因重要性的篩選,確定以下8個基因為起到關鍵作用的核心調控基因:CLEC4A、CYBA、LOXL2、Hcvn1、NCKAP1L、PRRX2、LGALS9、CMTM3(圖 6)。
圖6 Blue2模塊中的核心基因可視化分析及相互關系Fig.6 Visualization analysis and correlation of core genes in the Blue2 module
增生性瘢痕是一種發(fā)生于皮膚的纖維增生性疾病,涉及多種細胞、細胞因子及信號通路,發(fā)病機制仍未明確。以往病理學研究多以單個基因或蛋白為靶點,僅能幫助明確疾病發(fā)病機制的局部,難以從整體進行系統(tǒng)分析研究。權重基因共表達網(wǎng)絡分析(WGCNA)可尋找協(xié)同表達的基因模塊,并探索基因網(wǎng)絡與關注表型之間的關聯(lián)性。利用高通量的微陣列技術,應用基因表達芯片得到實驗數(shù)據(jù),從轉錄(mRNA)水平探索基因網(wǎng)與疾病或者研究者關注的性狀之間的關系[9]。利用WGCNA,我們可應對復雜數(shù)據(jù)的歸納整理,進而用于關聯(lián)性狀研究、代謝通路建模、基因互作網(wǎng)絡構建等。研究中,通過權重基因共表達網(wǎng)絡分析(WGCNA)處理小鼠增生性瘢痕的全基因組表達數(shù)據(jù)GSE26390,識別出與M2型巨噬細胞、Th2細胞因子以及纖維化高度相關的共表達基因模塊。隨后運用分析關鍵結點基因與目標基因關聯(lián)性,找到瘢痕形成過程中的8個核心調控基因:CLEC4A、CYBA、LOXL2、Hcvn1、NCKAP1L、PRRX2、LGALS9、CMTM3。
CLEC4A基因是C型凝集素/C型凝集素樣(CTL/CTLD)超家族的成員,其編碼蛋白存在于樹突細胞、單核細胞、巨噬細胞、B淋巴細胞和粒細胞中[10]。研究發(fā)現(xiàn),其組成與巨噬細胞凝集素高度同源,可能參與了巨噬細胞抗原的提呈過程[11-12]。CYBA基因編碼細胞色素的輕鏈(α鏈)蛋白,是NADPH酶的重要組成部分[13-14],而NADPH的氧化是吞噬細胞免疫反應的初步過程。吞噬細胞通過利用氧化應激過程中產(chǎn)生的活性氧(ROC)殺死外來物質,完成相關免疫過程。當CYBA基因發(fā)生突變時,可導致ROS水平升高,從而引起一系列免疫相關疾病,如慢性肉芽腫性疾病等[15]。LOXL2(賴氨酸氧化酶樣蛋白-2)是賴氨酰氧化酶家族(LOXs)的成員之一,其他成員包括 LOX、LOXL-1、LOXL-3、LOXL-4,能催化膠原及彈力蛋白的交聯(lián),使其成為不可溶的纖維,對形成正常的細胞外基質形態(tài)和完成組織修復有極其重要的作用[16]。研究認為,LOXs在腫瘤抑制及轉移、細胞增殖和細胞趨化中扮演重要作用,也參與了肝臟、肺等臟器的纖維化過程[17-18]。電壓門控質子通道-1(Hydrogen voltage gated channel 1,Hvcn1)的作用非常廣泛,包括調節(jié)氣道PH、嗜堿性粒細胞釋放組胺等[19-20],有證據(jù)表明,在吞噬細胞中,Hvcn1釋放氫離子或將其聚集在吞噬小體內可代償細胞代謝過程中產(chǎn)生的大量超氧化胺,從而保持細胞的活性和吞噬功能[21-22]。 Nck 相關蛋白-1(NCKAP1),編碼的蛋白也稱造血蛋白1(HEM1),HEM1是Scar/WAVE復合體的一部分[23]。在免疫應答中活化的Rac(屬于Rho-GTPase家族)激動細胞骨架F-actin的聚集,Scar/WAVE復合體在其中起信號傳遞的作用,因此,HEM-1是Rac的效應蛋白[24]。研究認為,HEM-1可能參與了免疫細胞黏附、趨化和吞噬過程中細胞骨架的重塑過程,阻斷該通路上的蛋白會導致免疫功能缺陷[25]。PRRX2是編碼表達一組DNA相關的人類同源蛋白質(Homeobox)的轉錄調控基因,參與調節(jié)胎兒成纖維細胞的增殖、胎兒和成人皮膚生發(fā)層細胞的增殖。相關研究表明,人類皮膚創(chuàng)傷后,在胎兒時期,PRRX2可上調該類蛋白的表達,促進皮膚無瘢痕愈合,并只局限在傷口周圍組織;而在成人時期,PRRX2在皮膚瘢痕愈合調節(jié)中呈弱表達[26]。LGALS9(Lectin galactoside-binding soluble 9),該基因編碼的蛋白是一種可溶于水的S型半乳糖凝素。研究表明,LGLAS9編碼表達的Galectin-9可通過多種途徑參與調節(jié)T細胞免疫反應[27]。而CMTM3(CKLF-like MARVEL transmembrane domain containing 3)基因是趨化因子樣基因超家族(Chemokine-like factor gene superfamily)中的一員。在免疫系統(tǒng)方面,CMTM3基因不僅高表達于外周血中B淋巴細胞,也高表達于富含B細胞的脾臟中,可能影響B(tài)細胞的分化成熟及免疫功能;同時也高表達于CD4+T細胞及單核細胞中,可能對免疫系統(tǒng)的調節(jié)發(fā)揮作用[28]。
因此,M2型巨噬細胞和Th2型細胞因子通過上述8個核心調控基因,可能經(jīng)由多種途徑促進組織膠原蛋白合成及纖維化:激活的M2型巨噬細胞使組織中TGF-β表達上調,通過下游Smad信號通路直接促進成纖維細胞膠原蛋白合成[29];活化的M2型巨噬細胞合成及成纖維細胞遷移過程中產(chǎn)生纖連蛋白等細胞外基質成分,促進纖維化進程[30];在M2型巨噬細胞占優(yōu)勢的組織中,精氨酸酶活性強于誘導型一氧化氮合酶系統(tǒng),從而促進膠原蛋白合成及細胞增殖,進而導致增生性瘢痕形成[31]。本研究結果為相關纖維化疾病的病理發(fā)生機制的研究及臨床預防、治療增生性瘢痕提供了新的靶點,拓寬了思路。本研究采用的全基因表達數(shù)據(jù)從小鼠增生性瘢痕皮膚中獲得,而人類皮膚結構及免疫細胞的活化和浸潤狀態(tài)與瘢痕模型小鼠仍有差異,因此需要進一步探究這些基因在增生性瘢痕形成中的相互作用,以期更透徹地認識M2型巨噬細胞及Th2型細胞因子參與增生性瘢痕形成的過程,提高相關纖維化疾病的診療水平。