朱葉,譚秋凡,鞏倩文,胡曉建,陳世豪
1.溫州醫(yī)科大學附屬眼視光醫(yī)院 屈光手術中心,浙江 溫州 325027;2.義烏市婦幼保健院 五官科,浙江 金華 322000
圓錐角膜(keratoconus,KC)是一種多因素病因的雙側角膜變薄性疾病,以進行性角膜變薄變陡,不規(guī)則散光,視力下降,角膜前突為主要表現(xiàn)[1]。已有研究表明,遺傳因素在KC發(fā)病過程中發(fā)揮重要作用[2]。雖然多年來,KC的眾多候選基因已被確定,但這些孤立的基因尚不能解釋疾病的復雜機制[3]。 目前,微陣列分析作為在基因組水平上獲得基因表達數(shù)據(jù)的一種有前景的工具,已被廣泛應用于疾病的分子發(fā)生和發(fā)展研究中[4]。隨著生物信息學技術的發(fā)展,基于網(wǎng)絡的方法使疾病機制的研究更加深入。SHARIF等[5]利用蛋白相互作用(protein- protein interaction,PPI)網(wǎng)絡分析鑒定了EGFR、NEDD4、SNTA1、LGALS3BP、HSPB1、SDC2、Mme和HIF1a等多種網(wǎng)絡節(jié)點,這些節(jié)點被稱為關鍵(Hub)基因(蛋白質(zhì)),在維持網(wǎng)絡結構和提供生物系統(tǒng)的關鍵信息方面起著關鍵作用[6-8]。本研究在網(wǎng)絡分析的基礎上[9],進一步使用ClueGO使基因矩陣中最重要的條目在網(wǎng)絡中可視化,為觀察他們之間的相互關系提供了更加深入的視角,同時從分子水平上進一步了解KC的發(fā)生發(fā)展,并探索了診斷、預后和藥物靶點的潛在候選的生物標志物。
1.1 微陣列分析數(shù)據(jù) 從GEO數(shù)據(jù)庫下載GSE77938基因表達譜。GSE77938基于Affymetrix GPL18460 平臺(Affymetrix Human,Illumina HiSeq 1500),由 KABZA等[10]提交。GSE77938數(shù)據(jù)集包含50個樣本,其中有25個KC樣本和25個正常對照樣本(下載地址:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE77938)。
1.2 差異表達基因(differentially expressed genes,DEGs)的數(shù)據(jù)預處理與鑒定 用R語言(v.3.3.2)對原始微陣列數(shù)據(jù)進行預處理?;谄脚_ 上的注釋信息,將探針I(yè)Ds轉換成相應的基因名。當 多個探針對應于同一基因時,計算平均表達值來表示基因表達水平。樣本分為KC組和對照組。然后,采用線性模型進行微陣列分析(Bioconductor的limma包)以識別DEGs。以|log2fold change(FC)| >0.992并且P<0.05作為DEGs的臨界值。
1.3 DEGs的功能富集分析 基因本體論(GO,http://www.geneontology.org/)是一種常用的對基因和基因產(chǎn)物進行注釋和識別特征生物的方法。京都基因和基因組百科全書(KEGG,http://www.genome.jp/kegg/Pathway.html)通路富集分析是一個包含生物化學通路的生物信息學數(shù)據(jù)庫。注釋、可視化和集成發(fā)現(xiàn)的數(shù)據(jù)庫(DAVID,http://david.abcc.Ncifcrf.gov/)在線軟件,是從大量基因中提取生物意義的分析工具。DAVID分別用于上調(diào)和下調(diào)DEGs的GO富集和KEGG通路富集分析。具有顯著差異的功能和通路的臨界值為P<0.05,計數(shù)(在特定功能或途徑項中富集的基因數(shù))>2。
1.4 PPI網(wǎng)絡的構建及子網(wǎng)絡分析 檢索相互作用基因的搜索工具(STRINGv-10.0,http://stringdb.org/)數(shù)據(jù)庫是用來評估PPI信息的在線工具。為了評價DEGs之間的相互作用關系,將DEGs映射到STRING上,并從蛋白質(zhì)水平篩選DEGs之間的相互作用關系。然后,在聯(lián)合評分>0.4 的條件下,分別構建了上調(diào)和下調(diào)DEGs的PPI網(wǎng)絡。然后,利用 Cytoscape軟件構建PPI網(wǎng)絡。采用插入式分子復合物檢測技術(MCODE)對Cytoscape中PPI網(wǎng)絡的子網(wǎng)絡進行了篩選。選擇閾值節(jié)點密度截斷值為1、節(jié)點得分截斷值為0.2、k核為3、最大深度為100的聚類進行進一步分析。采用ClueGO插件對Hub基因列表進行可視化GO和KEGG分析。
2.1 DEGs的鑒定 分析的樣本為25個KC樣本和25個正常樣本。根據(jù)篩選標準,KC患者角膜共鑒定出1 547個DEGs,其中上調(diào)基因1 103個,下調(diào)基因444個(見圖1)。
圖1 DEGs的火山圖
2.2 GO富集分析 上調(diào)和下調(diào)表達基因富集的前5個GO項見圖2。GO分析結果表明,上調(diào)的DEGs在生物過程(biological process,BP,1 220)、分子功能(molecular function,MF,102)和細胞成分 (cell composition,CC,102)中均顯著富集。在BP中,這些基因顯著參與免疫應答(P<0.001)、免疫系統(tǒng)過程(P<0.001)和防御應答(P<0.001)。MF和CC的最顯著項分別是抗原結合(P<0.001)和質(zhì)膜(P<0.001),而下調(diào)的DEGs在BP(99)、MF(47)和CC(64)中也有富集。BP、MF和CC的最顯著富集項分別為感知覺(P<0.001)、門控通道活性(P<0.001)和膜內(nèi)成分(P<0.001)。
2.3 KEGG通路分析 上調(diào)和下調(diào)基因的KEGG通路見圖3。上調(diào)的DEGs在72條通路中顯著富集,其中前5個最具有顯著差異的通路分別為細胞因子-細胞因子受體相互作用、趨化因子信號途徑、移植物排斥反應、類風濕關節(jié)炎和移植物抗宿主病。而下調(diào)的DEGs在8條通路中顯著富集,其中富集最顯著的前5條通路為味覺傳導、cAMP信號途徑、谷氨酸突觸、5-羥色胺能突觸和2型糖尿病。
圖2 KC相關DEGs的前5位GO功能富集分析
2.4 PPI網(wǎng)絡和子網(wǎng)絡 基于STRING數(shù)據(jù)庫的信息,分別構建了上調(diào)和下調(diào)DEGs的PPI網(wǎng)絡。在上調(diào)DEGs的PPI網(wǎng)絡中,共有602個節(jié)點和9 903個相互作用,識別出三個聚類(見圖4)。Hub基因(度>150)為TNF(235)、JUN(231)、IFNG(216)、PTPRC (197)、ICAM1(194)、FOS(193)、IL6(192)、CXCL8 (178)、LCK(165)、CSF2(163)、MMP9(162)、ITGAX (152)、CD40LG(152)和IL10(151),對于下調(diào)的DEGs,共有143個節(jié)點和319個相互作用(見圖5)(度>150)。
圖3 KC相關DEGs的前5位KEGG通路分析
2.5 Hub基因的ClueGO分析 通過ClueGO分析,將Hub基因和通路網(wǎng)絡進行可視化展示。結果表明,這些Hub基因顯著富集在6個GO項中(見圖6)。最顯著的是骨髓白細胞分化的陽性調(diào)節(jié)(P <0.01)、STAT蛋白酪氨酸磷酸化的陽性調(diào)節(jié)(P<0.01)、平滑肌細胞增殖(P<0.01)、平滑肌細胞增殖的調(diào)節(jié) (P<0.01)、細胞對脂多糖的反應(P<0.01)以及趨化因子生物合成過程的調(diào)節(jié)(P<0.01)。而Hub基因的KEGG途徑在3個通路顯著富集(見圖7)。最顯著的是NF-κB信號通路(P<0.01)、原發(fā)性免疫 缺陷(P<0.01)和T細胞受體信號通路(P<0.01)。
圖5 PPI網(wǎng)絡用于表示下調(diào)表達的DEGs
KC是一種異質(zhì)性退行性疾病。其病因和潛在的病理機制尚不清楚,但環(huán)境和遺傳因素都被認為是導致該疾病發(fā)展的相關因素[11-12]。最近,12項不同的KC研究已經(jīng)確定了至少17個基因座,表明KC可能是由不同家族的許多不同基因突變引起的[13],因此了解KC的分子機制和關鍵基因對于診斷和治療具有重要意義。本研究從GSE77938中提取數(shù)據(jù),利用生物信息學分析鑒定KC和正常對照之間1 103個上調(diào)和444個下調(diào)的DEGs。為了更好地理解DEGs的相互作用進一步進行了GO功能富集分析、KEGG通路分析和PPI網(wǎng)絡分析。通過構建PPI并應用MCODE和ClueGO插件發(fā)現(xiàn)了一些Hub基因和關鍵通路,為KC的治療研究提供了新的思路。
構建了上調(diào)和下調(diào)DEGs的PPI網(wǎng)絡后,發(fā)現(xiàn)最高度的基因(度>20)均處于上調(diào)DEGs中,充分提示上調(diào)的DEGs具有KC的生物活性。GO分析表明,上調(diào)的DEGs在BP方面主要參與免疫應答、免疫系統(tǒng)過程和防御應答的調(diào)控等過程。MF和CC主要表現(xiàn)在抗原結合、受體結合、細胞因子活性和質(zhì)膜、細胞外周,這些結果表明,該病的病因與免疫反應可能存在根本的聯(lián)系或相關性。而過去研究發(fā)現(xiàn)KC患者血清免疫球蛋白E水平較高,免疫穩(wěn)態(tài)受到損害等表現(xiàn)也從側面確認了變態(tài)反應和KC之間的聯(lián)系 性[14-16]。此外,上調(diào)DEGs富集的KEGG通路主要包括細胞因子-細胞因子受體相互作用和趨化因子信號途徑,這與角膜上皮細胞和基質(zhì)細胞能夠合成趨化因子、細胞因子及其受體,以及這些分子在角膜傷口愈合和炎癥反應中能夠發(fā)揮作用的認識是一致的[17]。WHEATER等[18]報道在其他類型的角膜疾病中,如大皰性角膜病變,這些通路也發(fā)生了變化。
通過用上調(diào)的DEGs構建PPI網(wǎng)絡,并應用MCODE和ClueGO,發(fā)現(xiàn)了幾個重要的通路(骨髓白細胞分化的陽性調(diào)節(jié),STAT蛋白酪氨酸磷酸化的陽性調(diào)節(jié),平滑肌細胞增殖,平滑肌細胞增殖的調(diào)節(jié),細胞對脂多糖的反應、趨化因子生物合成過程的調(diào)控、NF-κB 信號通路、原發(fā)性免疫缺陷和T細胞受體信號通路)和14個Hub基因,這些通路和基因可能是診斷KC的有效途徑。
本研究相比KABZA等[10]的研究最大的不同也是本研究的主要創(chuàng)新點在于,本研究不僅僅分析了基因的表達差異,同時結合了GO進行數(shù)據(jù)分析(KABZA等[10]的研究并未使用GO分析方法),且發(fā)現(xiàn)了關聯(lián)基因TNF、JUN、IFNG、PTPRC、ICAM1、FOS、IL6、CXCL8、LCK、CSF2、MMP9、ITGAX、CD40LG和IL10。在這些發(fā)現(xiàn)的與KC相關聯(lián)的基因中,TNF、IFNG、PTPRC、ICAM1、FOS、CXCL8、LCK、CSF2,ITGAX基因之前未見報道。
本研究中,腫瘤壞死因子(tumor necrosis factor,TNF)基因在網(wǎng)絡中顯示出最高的度(232)。TNF作為一種主調(diào)節(jié)因子在平衡細胞存活、凋亡和壞死中的作用已經(jīng)在各種細胞類型和組織中被廣泛研究[19]。有研究發(fā)現(xiàn)單側KC患者和對側有亞臨床疾病的患者,雙眼IL-6和TNF-α水平均升高,但TNF-α只在KC眼中顯著升高[20]。CHEUNG等[21]發(fā)現(xiàn),TNF-α能夠觸發(fā)角膜細胞凋亡,以及增加膠原蛋白的更新率。此外,POULIQUEN等[22]認為TNF-α可能調(diào)節(jié)一個涉及纖溶酶系統(tǒng)的蛋白酶級聯(lián)反應,最終導致KC細胞外基質(zhì)的變化。
據(jù)報道,PPI網(wǎng)絡中的IL6、MMP9、IL10等基因在KC患者以及角膜下壁變薄病例(類似KC)的淚液中也有明顯升高。這是一個非常有力的證據(jù),同樣支持角膜變薄和擴張與涉及炎癥事件的細胞外基質(zhì)降解有關(主要是MMP-9、IL-6和TNF-α水平升 高)[23-24]。
本研究在KC中獲得了一些重要的基因和通路,但還存在一些局限性:基于生物信息學方法進行探究,結論尚未得到生物學實驗的證實;研究樣本量有限。進一步探討KC的分子機制,并將分子遺傳學診斷應用于臨床,有待進一步地探索[25]。
綜上所述,本研究提出了幾個與KC相關的Hub基因,系統(tǒng)地介紹了與之相關的生物過程和信號傳導通路,這些基因很少有被證實,但其中有許多被報道與KC有關。這些基因可作為KC治療的分子靶點和診斷性生物標志物,應引起更多的研究關注。通過生物信息學分析揭示這些基因有可能與KC的病理機制相關,后續(xù)的研究需要利用細胞實驗和動物實驗進行深入的驗證,為尋找新的靶點藥物奠定關鍵的科學基礎。
圖7 上調(diào)DEGs中Hub基因的ClueGO分析