鄒小龍,董雪松,孫學(xué)溥
(哈爾濱醫(yī)科大學(xué) 附屬第一醫(yī)院普外科,哈爾濱 150001)
2018年全球癌癥報告結(jié)果顯示,結(jié)腸癌的發(fā)病率仍高居前五位。近幾年來我國患上結(jié)腸癌的人數(shù)每年都在增加,結(jié)腸癌是我國常見的消化道腫瘤之一,具有發(fā)病率高、早期治愈率高的特點。盡管在眾多研究人員與臨床醫(yī)生的共同努力下結(jié)腸癌的診治技術(shù)及療效已經(jīng)有很大的提高,但是結(jié)腸癌的患者仍逐年增加[1]。目前,眾多研究主要是針對結(jié)腸癌發(fā)病機制的眾多研究仍不夠深入,對疾病本身的發(fā)生、發(fā)展機制尚不夠深入,因而沒有一個高效的診療測序?qū)Y(jié)腸癌的發(fā)生進(jìn)行有效的預(yù)防和預(yù)警。
迄今為止的miRNA和基因表達(dá)之間的關(guān)系研究主要集中在miRNA的3’非編碼區(qū)域的負(fù)向調(diào)控基因的翻譯過程。但隨著miRNA作用機制研究的深入,有研究發(fā)現(xiàn)miRNA在細(xì)胞核內(nèi)也存在通過增強子介導(dǎo)而激活基因表達(dá)的調(diào)控機制[2]。那么利用miRNA細(xì)胞核內(nèi)調(diào)控機制,我們利用生物信息的多種分析方法對結(jié)腸癌的miRNA和基因進(jìn)行補充性分析,從而為結(jié)腸癌發(fā)病的研究提供新的視角。
通過整合多個數(shù)據(jù)庫的miRNA、基因表達(dá)譜數(shù)據(jù),結(jié)腸特異的增強子數(shù)據(jù),通知利用miRNA增強子預(yù)測算法對上述數(shù)據(jù)進(jìn)行系統(tǒng)的整合分析,并肩miRNA-增強子-靶基因調(diào)控網(wǎng)絡(luò),并對網(wǎng)絡(luò)進(jìn)行拓?fù)鋵W(xué)分析,最后通過分析網(wǎng)絡(luò)中差異表達(dá)基因的功能,發(fā)現(xiàn)了多個與結(jié)腸癌發(fā)生密切相關(guān)的生物學(xué)功能。
從HMDD V3.0數(shù)據(jù)庫[3](http://www.cuilab.cn/hmdd)篩選得到了被多篇文獻(xiàn)證實結(jié)腸癌中差異表達(dá)的miRNA信息。
從CoRECG數(shù)據(jù)庫[4](http://lms.snu.edu.in/corecg/)下載至少被一篇文獻(xiàn)報道過在結(jié)腸癌樣本中差異表達(dá)的基因數(shù)據(jù)。
從EnhancerAtlas數(shù)據(jù)庫(http://enhanceratlas.org/download.php)下載了結(jié)腸特異的增強子和靶基因關(guān)系數(shù)據(jù)。
利用從EnhancerAtlas數(shù)據(jù)庫[5]中得到的結(jié)腸特異的增強子區(qū)域信息,首先將位置信息轉(zhuǎn)化為每個增強子基因組序列信息,即得到對應(yīng)增強子的fastq格式的文件。
利用RNA biology文章中提供的miRNA與增強子靶向關(guān)系預(yù)測算法[2],計算并篩選miRNA靶向的增強子區(qū)域。
利用上述方法得到miRNA-增強子-靶基因關(guān)系網(wǎng)絡(luò),并結(jié)合結(jié)腸癌差異表達(dá)靶基因的信息,最終得到差異表達(dá)miRNA-結(jié)腸特異增強子-結(jié)腸癌差異表達(dá)靶基因網(wǎng)絡(luò)。并 使用Cytoscape軟件對網(wǎng)路進(jìn)行相關(guān)的網(wǎng)絡(luò)參數(shù)分析。
基因本體論(Gene Ontology,GO)[6]是一種常用的基因相關(guān)功能注釋軟件,該數(shù)據(jù)庫為樹狀結(jié)構(gòu)。該數(shù)據(jù)庫主要包含生物學(xué)過程、細(xì)胞組分、分子功能三個主要的功能分支。我們將網(wǎng)絡(luò)中的差異表達(dá)靶基因進(jìn)行功能注釋(P<0.01,F(xiàn)DR<0.05)。
將下載的數(shù)據(jù)進(jìn)行篩選整理,最終得到的結(jié)腸癌差異表達(dá)miRNA共計24個,其中7個下調(diào)的miRNA,35個上調(diào)的miRNA.
經(jīng)過篩選分析得到在正常和結(jié)腸癌樣本中差異表達(dá)基因1 551個,其中上調(diào)基因1 144個,下調(diào)基因407個。
將24個差異表達(dá)miRNA分別利用NamiRNA增強子預(yù)測分析算法在842個結(jié)腸特異性增強子區(qū)域進(jìn)行靶向位點預(yù)測,共得到miRNA靶向增強子關(guān)系對76 274對。整合結(jié)腸癌差異表達(dá)基因數(shù)據(jù),最終得到上調(diào)miRNA-上調(diào)靶基因關(guān)系對3 839個,下調(diào)miRNA-下調(diào)靶基因關(guān)系對1 042個。miRNA激活調(diào)控的差異表達(dá)基因共計249個, 上調(diào)基因201個,下調(diào)基因48個。
利用上述步驟建立的miRNA-增強子,增強子靶向的差異表達(dá)基因關(guān)系對,最終得到miRNA-靶基因關(guān)系對2 121個,259個節(jié)點,其中包含34個下調(diào)基因、183個上調(diào)的基因,7個下調(diào)的miRNA,35個上調(diào)的miRNA(見圖1)。網(wǎng)絡(luò)中的節(jié)點的度分布如圖2所示,網(wǎng)絡(luò)中的失調(diào)的miRNA可以通過細(xì)胞核內(nèi)激活調(diào)控的方式同時調(diào)控217個基因的差異表達(dá)。其次,對網(wǎng)絡(luò)中所有基因和miRNA的度進(jìn)行分析,篩選度比較高的基因節(jié)點,認(rèn)為該部分的基因是潛在的結(jié)腸癌診療靶點,如圖3所示。利用網(wǎng)絡(luò)的度分析,篩選到TDG、NUCKS1、IL11RA、POLB、COL1A1,ITGB4等關(guān)鍵基因。
圖1 miRNA-激活調(diào)控靶基因網(wǎng)絡(luò)Fig.1 miRNA positive regulated genes network
注:圖中的桔色圓點代表上調(diào)靶基因;紅色三角形代表上調(diào)的miRNA;綠色三角形代表下調(diào)miRNA;綠色圓形代表下調(diào)靶基因.彩圖見電子版http://swxxx.alljournals.cn/ch/index.aspx.2019年第2期.
圖2 網(wǎng)絡(luò)中度的分布圖Fig.2 Distribution of degree in the network
差異表達(dá)靶基因GO功能富集分析,結(jié)果顯示,結(jié)腸癌中被下調(diào)miRNA正向調(diào)控的下調(diào)靶基因主要富集在應(yīng)激反應(yīng)[7]、對脂質(zhì)體的反應(yīng)、細(xì)胞周期負(fù)向調(diào)控、細(xì)胞生長的負(fù)調(diào)控、細(xì)胞凋亡[8]、雙鏈斷裂修復(fù)、對生物刺激的反應(yīng)等生物學(xué)功能均被抑制因此出現(xiàn)細(xì)胞的異常增生和分裂的異常。功能中排在前十位被下調(diào)的功能如下圖(見圖4)。
圖3 網(wǎng)路度分布連通圖Fig.3 Network overview by node degree
注:網(wǎng)絡(luò)是節(jié)點的大小顯示該節(jié)點的度,網(wǎng)絡(luò)中綠色邊為網(wǎng)路中度較高節(jié)點的邊.
圖4 下調(diào)基因GO功能分析Fig.4 GO analysis on down-regulated genes
結(jié)腸癌中被上調(diào)miRNA正向調(diào)控的上調(diào)靶基因主要富集細(xì)胞對外界刺激的反應(yīng)、對于應(yīng)激反應(yīng)和化學(xué)刺激的反應(yīng)、細(xì)胞代謝和細(xì)胞過程和巨噬細(xì)胞代謝的調(diào)控等生物學(xué)過程[9-10],如圖5所示。
圖5 上調(diào)基因GO功能分析Fig.5 GO analysis on up-regulated genes
通過整合結(jié)腸癌差異表達(dá)的miRNA、結(jié)腸特異性增強子數(shù)據(jù)和結(jié)腸癌差異表達(dá)基因數(shù)據(jù),同時,采用NamiRNA靶向增強子預(yù)測算法篩選miRNA和靶向增強子區(qū)域的靶向關(guān)系,從而構(gòu)建結(jié)腸癌特異的miRNA-增強子-靶基因激活調(diào)控網(wǎng)絡(luò)。該網(wǎng)絡(luò)包含miRNA-靶基因關(guān)系對2 121個,259個節(jié)點,其中包含34個下調(diào)基因、183個上調(diào)的基因,7個下調(diào)的miRNA,35個上調(diào)的miRNA。而后我們分析了網(wǎng)絡(luò)進(jìn)行的節(jié)點度的整體分布情況,發(fā)現(xiàn)網(wǎng)絡(luò)中大部分的節(jié)點的度都是小于10的,僅有少量miRNA結(jié)合和部分的差異表達(dá)基因節(jié)點的度大于10。
其次,利用網(wǎng)絡(luò)中節(jié)點的度對網(wǎng)絡(luò)中關(guān)鍵節(jié)點進(jìn)行分析,發(fā)現(xiàn)除了篩選到的42個miRNA外,還有部分差異表達(dá)基因受到多個miRNA的調(diào)控,例如TDG、NUCKS1、IL11RA、POLB、COL1A1、ITGB4等關(guān)鍵基因。篩選的關(guān)鍵基因中如IL11RA于結(jié)腸癌中高表達(dá),并且與結(jié)腸癌的臨床病理因素密切相關(guān)[11]。TDG(胸腺嘧啶糖基化酶)等基因也被多篇文章報道可以作為結(jié)腸癌的標(biāo)記。
通過分別對miRNA-增強子-靶基因網(wǎng)絡(luò)中上調(diào)和下調(diào)靶基因的GO功能分析,發(fā)現(xiàn)結(jié)腸癌中激活表達(dá)的基因主要參與了一些應(yīng)激反應(yīng)相關(guān)的功能和,同時,抑制了細(xì)胞周期、細(xì)胞凋亡、細(xì)胞死亡巨噬細(xì)胞代謝等相關(guān)功能,通過激活和抑制相關(guān)功能誘發(fā)結(jié)腸癌的發(fā)生。