国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于轉(zhuǎn)錄組數(shù)據(jù)識(shí)別結(jié)直腸癌的特異性功能模塊*

2021-06-07 05:41陳曉琳許德華廖苑君李讓孫勝南藍(lán)樹金饒紹奇
腫瘤預(yù)防與治療 2021年4期
關(guān)鍵詞:功能模塊通路節(jié)點(diǎn)

陳曉琳,許德華,廖苑君,李讓,孫勝南,藍(lán)樹金,饒紹奇

523808 廣東 東莞,廣東醫(yī)科大學(xué) 公共衛(wèi)生學(xué)院(陳曉琳、許德華、廖苑君、李讓、孫勝南、藍(lán)樹金),醫(yī)學(xué)系統(tǒng)生物學(xué)研究所(陳曉琳、許德華、廖苑君、李讓、孫勝南、藍(lán)樹金、饒紹奇)

結(jié)直腸癌(colorectal cancer,CRC)是常見(jiàn)的消化道惡性腫瘤,為全球第4大致命的癌癥(僅次于肺癌、肝癌和胃癌),每年約有90萬(wàn)人死于該疾病[1]。近年來(lái),CRC的發(fā)病率和死亡率呈上升趨勢(shì),主要原因是現(xiàn)代人飲食習(xí)慣和生活方式的改變。據(jù)預(yù)測(cè),到2030年,全球CRC負(fù)擔(dān)將增加60%,新增病例將超過(guò)220萬(wàn),癌癥死亡將超過(guò)110萬(wàn)[2]。目前,改善CRC的治療效果逐漸成為人們關(guān)注的重點(diǎn)。盡管CRC的新療法取得了一定成效,包括原發(fā)性疾病的腹腔鏡手術(shù),轉(zhuǎn)移性疾病(如肝和肺轉(zhuǎn)移)的切除術(shù),放射治療與新輔助治療、姑息化療[3]。然而,這些新療法對(duì)提高CRC的治愈率和長(zhǎng)期生存率還存在一定的局限性,CRC的5年生存率仍很低。因此,揭示CRC的病因與發(fā)病機(jī)制對(duì)其預(yù)防和治療具有重要意義。

近年來(lái),大量研究利用生物信息學(xué)方法在分子水平上進(jìn)行數(shù)據(jù)挖掘,為研究各種疾病的致病機(jī)制提供新思路。迄今為止,分析基因表達(dá)譜數(shù)據(jù)已被證明有助于更好地探究疾病的發(fā)病機(jī)制、輔助臨床診斷和判斷藥物療效,尤其在癌癥中已經(jīng)確定了許多生物學(xué)過(guò)程和疾病的分子基礎(chǔ)[4]。為此,本研究通過(guò)收集GEO數(shù)據(jù)庫(kù)中CRC芯片數(shù)據(jù)集,利用大規(guī)模的轉(zhuǎn)錄組數(shù)據(jù)分析與CRC致病相關(guān)的特異性功能模塊和核心基因,并對(duì)各功能模塊進(jìn)行通路富集分析,為進(jìn)一步闡明CRC的病因、發(fā)病機(jī)制及預(yù)后提供重要依據(jù)。

1 材料與方法

1.1 數(shù)據(jù)來(lái)源

從基因表達(dá)綜合GEO數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/gds/)中按照以下標(biāo)準(zhǔn)獲取CRC的基因芯片數(shù)據(jù)集:1)以“colorectal”為關(guān)鍵詞檢索與CRC相關(guān)的轉(zhuǎn)錄組基因芯片;2)選擇物種為“Homo sapiens”、研究類型為“expression profiling by array”兩個(gè)過(guò)濾條件進(jìn)一步篩選數(shù)據(jù);3)最后選定實(shí)驗(yàn)設(shè)計(jì)符合病例對(duì)照研究類型并且病例組織樣本數(shù)均大于30的基因芯片。最終獲取CRC的4個(gè)基因芯片數(shù)據(jù)集:GSE44076(98病例+50對(duì)照)、GSE21815(132病例+9對(duì)照)、GSE9348(70病例+12對(duì)照)、GSE8671(32病例+32對(duì)照)。

1.2 篩選差異性表達(dá)基因

本研究利用在線分析工具GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r/)分別篩選4個(gè)芯片數(shù)據(jù)集的差異表達(dá)基因(differentially expressed genes,DEGs),條件設(shè)定為校正P值小于0.05且logFC的絕對(duì)值大于1。然后運(yùn)用在線工具jvenn(http://jvenn.toulouse.inra.fr/app/example.html)對(duì)4個(gè)芯片數(shù)據(jù)集的上下調(diào)的DEGs進(jìn)行取交集,得到4個(gè)芯片數(shù)據(jù)集的上下調(diào)DEGs的交集。

1.3 構(gòu)建特異性基因網(wǎng)絡(luò)

HPRD數(shù)據(jù)庫(kù)[5](http://www.hprd.org/)是人類蛋白質(zhì)參考數(shù)據(jù)庫(kù),其中包含人類蛋白質(zhì)互作(protein-protein interaction,PPI)注釋信息。當(dāng)前,該數(shù)據(jù)庫(kù)共收集了41 327條PPI對(duì)子數(shù)據(jù),是目前關(guān)于人類蛋白互作數(shù)據(jù)可信度最高的數(shù)據(jù)庫(kù)之一。

本研究假設(shè)初始種子基因?yàn)楹Y選得到的CRC共同差異基因。而CRC致病基因網(wǎng)絡(luò)的節(jié)點(diǎn)集合主要包含兩類基因,初始種子基因及其在PPI的一級(jí)鄰居基因。對(duì)于集合中的任意2個(gè)不同基因,只要該基因產(chǎn)物在PPI網(wǎng)絡(luò)中存在互作關(guān)系,則視它們?cè)诰W(wǎng)絡(luò)中存在連接?;谝陨霞僭O(shè),我們構(gòu)建了一個(gè)無(wú)向的CRC特異性基因網(wǎng)絡(luò),其中所有節(jié)點(diǎn)表示基因,節(jié)點(diǎn)之間的邊表示基因間存在互作關(guān)系。最終,通過(guò)Cytoscape軟件(版本3.6.1)實(shí)現(xiàn)PPI網(wǎng)絡(luò)的可視化。

1.4 挖掘網(wǎng)絡(luò)的特異性功能模塊

蛋白質(zhì)相互作用網(wǎng)絡(luò)中存在具有統(tǒng)計(jì)學(xué)意義的模塊,對(duì)這些模塊進(jìn)行分析不僅能夠在一定程度上降低網(wǎng)絡(luò)的復(fù)雜性,同時(shí)能夠?qū)哂猩飳W(xué)意義的有效信息進(jìn)行提取。功能模塊在通常情況下能夠被視為功能相似且較為獨(dú)立的子結(jié)構(gòu)或子網(wǎng)絡(luò),同一個(gè)模塊中的蛋白質(zhì)互相之間有較顯著的功能性。因此,同隨機(jī)網(wǎng)絡(luò)比較而言,模塊化網(wǎng)絡(luò)的連接將表現(xiàn)出更優(yōu)異的緊密性。通過(guò)功能模塊的角度對(duì)網(wǎng)絡(luò)進(jìn)行分析具有較高的可靠性,同時(shí)功能模塊的識(shí)別實(shí)際上是網(wǎng)絡(luò)結(jié)構(gòu)分解的優(yōu)化問(wèn)題。本研究應(yīng)用Newman算法[6-7]對(duì)CRC基因網(wǎng)絡(luò)展開(kāi)一分為二的循環(huán)式網(wǎng)絡(luò)分解,識(shí)別網(wǎng)絡(luò)中高度模塊化的功能模塊。該算法的基本思想在于將網(wǎng)絡(luò)分解問(wèn)題轉(zhuǎn)變成二次型優(yōu)化問(wèn)題,即求使目標(biāo)函數(shù)Q最大的列向量s所對(duì)應(yīng)的數(shù)值:

在方程式中s包括兩類基因,分別是初始種子基因及其在PPI中的一級(jí)鄰居基因,A為集合s的鄰接矩陣(adjacent matrix),通常視為網(wǎng)絡(luò)中基因間的相互連接關(guān)系,其中Aij=1表明基因i和基因j存在互作關(guān)系,相反記為Aij=0;m為網(wǎng)絡(luò)中邊的總數(shù),ki為節(jié)點(diǎn)i的連通度,kj為節(jié)點(diǎn)j的連通度。因此s是取值1或-1的指示列向量,si為基因i所屬的子網(wǎng),則:

根據(jù)柯西(Cauchy)不等式,若s取模塊化矩陣B的最大特征值對(duì)應(yīng)的特征向量,那么目標(biāo)函數(shù)Q則最大。由于s只取±1值,故s僅會(huì)保留特征向量對(duì)應(yīng)元素的正負(fù)號(hào),同時(shí)結(jié)合符號(hào)方向,將網(wǎng)絡(luò)分為兩個(gè)部分。對(duì)上述網(wǎng)絡(luò)一分為二的過(guò)程重復(fù)操作,一直持續(xù)到無(wú)法分解為止,最后我們將節(jié)點(diǎn)數(shù)大于60的子網(wǎng)作為模塊。

1.5 功能模塊拓?fù)鋵W(xué)屬性分析

本研究從以下4個(gè)指標(biāo)進(jìn)行功能模塊的拓?fù)鋵W(xué)屬性分析:

1)連通度(degree):指網(wǎng)絡(luò)中直接與某一節(jié)點(diǎn)v相連的邊的數(shù)目。連通度是描述單一節(jié)點(diǎn)的最基本的拓?fù)湫再|(zhì),通常把連通度較大的中心節(jié)點(diǎn)(hub)作為研究的重點(diǎn)。因此,該指標(biāo)的值能夠較為準(zhǔn)確地反映出網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性,可以看作獲取網(wǎng)絡(luò)中流動(dòng)性的程度。某個(gè)節(jié)點(diǎn)的連通度大于或等于t的概率為:

在方程式中λ=NP,λ為節(jié)點(diǎn)的期望連通度,N為節(jié)點(diǎn)數(shù)目,P為任意兩個(gè)不同節(jié)點(diǎn)發(fā)生連接的概率。對(duì)核心節(jié)點(diǎn)進(jìn)行泊松分布檢驗(yàn),設(shè)定顯著性水準(zhǔn)Bonferroni校正后P<0.01。

2)網(wǎng)絡(luò)直徑:指網(wǎng)絡(luò)中任意兩節(jié)點(diǎn)間最短路徑的最大值。它是描述網(wǎng)絡(luò)總體性質(zhì)的屬性,可反映網(wǎng)絡(luò)的大小。

3)特征路徑長(zhǎng)度:指網(wǎng)絡(luò)中所有節(jié)點(diǎn)間的最短路徑的平均值,可反映模塊的緊密程度。

4)無(wú)標(biāo)度網(wǎng)絡(luò):指網(wǎng)絡(luò)中連通度的分布符合冪率分布,即p(k)∝k-α,其中k為接通度,α為指數(shù)參數(shù),可采用極大似然法估計(jì)[8]。冪率分布表明在無(wú)標(biāo)度網(wǎng)絡(luò)中少數(shù)連通度很大的關(guān)鍵節(jié)點(diǎn)控制著整個(gè)網(wǎng)絡(luò),使網(wǎng)絡(luò)緊密地連接在一起。本研究通過(guò)Kolmogorov-Smirnov(KS)擬合優(yōu)度檢驗(yàn)判斷網(wǎng)絡(luò)的無(wú)標(biāo)度特性。

1.6 KEGG通路富集分析

采用R語(yǔ)言(版本3.5.2)的“cluster profiler”軟件包對(duì)每個(gè)功能模塊進(jìn)行京都基因與基因組大百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)生物學(xué)通路富集分析。設(shè)定顯著性水準(zhǔn)FDR(false discovery rate)校正后P<0.001,對(duì)各功能模塊前5條通路開(kāi)展后續(xù)分析。通過(guò)Cytoscape軟件實(shí)現(xiàn)功能模塊與通路分類的關(guān)系的可視化。本研究按照上述方法步驟進(jìn)行,具體技術(shù)路線見(jiàn)圖1。

圖1 數(shù)據(jù)分析流程圖

2 結(jié) 果

2.1 篩選差異性表達(dá)基因

通過(guò)在線工具GEO2R對(duì)4個(gè)芯片數(shù)據(jù)集進(jìn)行差異表達(dá)分析。GSE44076數(shù)據(jù)集經(jīng)篩選后得到3 160個(gè)DEGs;GSE21815數(shù)據(jù)集經(jīng)篩選后得到8 528個(gè)DEGs;GSE9348數(shù)據(jù)集經(jīng)篩選后得到4 914個(gè)DEGs;GSE8671數(shù)據(jù)集經(jīng)篩選得到3 411個(gè)DEGs。通過(guò)在線工具jvenn得到4個(gè)數(shù)據(jù)集的交集基因,其中包括412個(gè)上調(diào)DEGs以及231個(gè)下調(diào)DEGs。4個(gè)數(shù)據(jù)集的上下調(diào)基因韋恩圖見(jiàn)圖2。

圖2 差異表達(dá)基因的韋恩圖

2.2 構(gòu)建特異性基因網(wǎng)絡(luò)及拓?fù)鋵W(xué)屬性分析

本研究利用HPRD數(shù)據(jù)庫(kù)構(gòu)建CRC特異性基因網(wǎng)絡(luò),網(wǎng)絡(luò)中包含所有差異基因的互作關(guān)系。原始網(wǎng)絡(luò)含有2 460個(gè)節(jié)點(diǎn)和3 576個(gè)互作對(duì)子,節(jié)點(diǎn)代表基因,邊代表蛋白互作。隨后刪除孤立作用的節(jié)點(diǎn)(SST、GTF3A、1L1R2等),最終生成的最大子網(wǎng)絡(luò)含有2 261個(gè)節(jié)點(diǎn)和3 450個(gè)互作對(duì)子。通過(guò)Cytoscape在線分析工具NetworkAnalyzer對(duì)最大子網(wǎng)絡(luò)進(jìn)行拓?fù)鋵傩苑治?,結(jié)果顯示聚類系數(shù)為0.034,網(wǎng)絡(luò)直徑為17,網(wǎng)絡(luò)平均路徑長(zhǎng)度為3.048,特征路徑長(zhǎng)度為5.428。將最大子網(wǎng)絡(luò)中連通度排名前10的核心節(jié)點(diǎn)進(jìn)行拓?fù)鋵W(xué)屬性分析(表1)。其中經(jīng)Pubmed數(shù)據(jù)庫(kù)檢索發(fā)現(xiàn),目前尚未有文獻(xiàn)明確報(bào)道PRKCB、KAT2B、ACTN1等基因在CRC發(fā)生發(fā)展中的作用。因此,這些基因可能是臨床上診治CRC的潛在靶點(diǎn)。

表1 連通度排名前10的核心節(jié)點(diǎn)的拓?fù)鋵W(xué)屬性

2.3 挖掘網(wǎng)絡(luò)的特異性功能模塊

應(yīng)用Newman算法挖掘分解CRC的最大子網(wǎng)絡(luò),將15個(gè)節(jié)點(diǎn)數(shù)大于60的功能模塊納入后續(xù)分析。15個(gè)功能模塊的基本特征和拓?fù)鋵傩砸?jiàn)表2。從表2可見(jiàn),不同功能模塊的節(jié)點(diǎn)數(shù)有較大區(qū)別,本研究最大的模塊(M11)包含352個(gè)基因(其中初始種子基因有47個(gè))和557條邊,平均每個(gè)節(jié)點(diǎn)有1.6條邊。最小的模塊(M13)包含60個(gè)基因(其中初始種子基因有9個(gè))和61條邊,平均每個(gè)節(jié)點(diǎn)有1條邊。這些功能模塊的拓?fù)鋵W(xué)特征相似并符合“六度分離理論”[9],它們的網(wǎng)絡(luò)直徑波動(dòng)范圍在7~14,特征路徑長(zhǎng)度均小于6。各功能模塊的無(wú)標(biāo)度性可從兩方面體現(xiàn)。首先結(jié)果顯示多數(shù)功能模塊指數(shù)參數(shù)α在2~3之間,符合生物學(xué)無(wú)標(biāo)度網(wǎng)絡(luò)的特征。同時(shí)KS擬合優(yōu)度檢驗(yàn)結(jié)果可見(jiàn)各功能模塊的連通度均近似服從冪率分布(P>0.05),可判斷為無(wú)標(biāo)度網(wǎng)絡(luò)。

表2 各模塊的基本特征和拓?fù)鋵傩?/p>

2.4 識(shí)別核心基因

本研究對(duì)模塊中的基因進(jìn)行泊松分布檢驗(yàn),設(shè)定顯著性水準(zhǔn)為Bonferroni校正P<0.01。我們共識(shí)別了87個(gè)核心基因,其中通過(guò)PPI發(fā)現(xiàn)的核心基因有4個(gè)(LPL、NR3C1、ETS2、TP53),列出各個(gè)功能模塊的核心基因(表3)。15個(gè)功能模塊中,模塊11挖掘的核心基因最多:共22個(gè)(包含MSX1、CDC25A、TOP2A等),模塊3挖掘的核心基因最少:1個(gè)。本研究經(jīng)過(guò)R語(yǔ)言軟件的“igraph”包實(shí)現(xiàn)功能模塊與核心基因分布圖的可視化(圖3)。

通過(guò)Pubmed數(shù)據(jù)庫(kù)的檢索,發(fā)現(xiàn)有26個(gè)核心基因暫無(wú)文獻(xiàn)明確報(bào)道與CRC相關(guān),這些基因可能成為CRC潛在的分子標(biāo)志物,例如核受體亞家族5A組成員2 (nuclear receptor subfamily 5 group A member 2,NR5A2)、端粒酶逆轉(zhuǎn)錄酶(ETS proto-oncogene 2,ETS2)、絲氨酸蛋白酶抑制H族成員1(serpin family H member 1,SERPINH1)、磷酸肌醇-5-磷酸酶D(inositol polyphosphate-5-phosphatase D,INPP5D)等基因。另外有部分核心基因雖然被報(bào)道與CRC相關(guān),但仍然缺乏大量的實(shí)驗(yàn)來(lái)探究其影響CRC的發(fā)病機(jī)理,因此著重關(guān)注這些核心基因可能為疾病的臨床診治提供參考。例如層粘連蛋白亞基α1(laminin subunit alpha 1,KAMA1)、絲氨酸蛋白酶抑制劑E族成員1(serpin family E member 1,SERPINE1)等蛋白的編碼基因。

表3 各功能模塊的核心基因

圖3 部分功能模塊和核心基因

2.5 模塊的功能富集分析

15個(gè)CRC功能模塊經(jīng)過(guò)KEGG通路富集分析后的結(jié)果見(jiàn)表4,表4結(jié)果顯示:15個(gè)功能模塊有13個(gè)模塊至少富集到1條生物學(xué)通路(除模塊M12、M13)。DEGs顯著富集于細(xì)胞周期(hsa04110)、DNA復(fù)制(hsa03030)、Wnt信號(hào)通路(hsa04310)、PI3K-AKT信號(hào)通路(hsa04151)等有統(tǒng)計(jì)學(xué)意義的生物學(xué)通路(FDR<0.001)。

本研究整合全部富集通路的類別與13個(gè)功能模塊的相互關(guān)系,并對(duì)其產(chǎn)生的相互作用進(jìn)行評(píng)估。最終,利用Cytoscape軟件實(shí)現(xiàn)模塊和通路分類關(guān)系的可視化(圖4)。通路分類結(jié)果顯示:信號(hào)轉(zhuǎn)導(dǎo)(M2、M5、M6、M8)、信號(hào)分子與相互作用(M1、M3、M8)以及內(nèi)分泌系統(tǒng)(M8、M10、M11)、細(xì)胞生長(zhǎng)與死亡(M10、M11、M14)這4種功能類別的連通度較高,提示CRC的發(fā)生與這些功能密切相關(guān),各模塊之間聯(lián)系緊密共同影響疾病的發(fā)生發(fā)展。

表4 各功能模塊的KEGG通路富集結(jié)果

圖4 CRC特異性模塊與通路功能分類的相互聯(lián)系

3 討 論

CRC的復(fù)雜進(jìn)展是一個(gè)多因素影響、多階段作用的過(guò)程,是多基因及多條信號(hào)通路共同參與的結(jié)果。從多基因水平研究腫瘤基因表達(dá)譜可能為更好地探索腫瘤發(fā)病機(jī)制提供依據(jù)。雖然近年CRC的研究取得了進(jìn)展,但它在全球的發(fā)病率和死亡率仍居高不下,早期診斷困難、腫瘤易轉(zhuǎn)移復(fù)發(fā)、5年生存率低等問(wèn)題仍存在。近年來(lái),基于基因表達(dá)數(shù)據(jù)的分析研究已經(jīng)確定了許多人類癌癥不同類型的基因生物標(biāo)記物。例如,研究發(fā)現(xiàn)BRCA1和BRCA2基因的突變導(dǎo)致了60%的遺傳性乳腺癌和卵巢癌病例[10-11]。因此,挖掘與CRC致病相關(guān)的核心基因和功能模塊,尋找新的潛在基因生物標(biāo)記物將有助于為CRC開(kāi)發(fā)更有效的診斷和治療方案。

本研究應(yīng)用生物信息學(xué)方法篩選與CRC相關(guān)的412個(gè)上調(diào)DEGs以及231個(gè)下調(diào)DEGs,通過(guò)PPI知識(shí)擴(kuò)充構(gòu)建致病基因網(wǎng)絡(luò),應(yīng)用Newman算法提取了15個(gè)與CRC相關(guān)的功能模塊。然后根據(jù)連通度分布情況和泊松分布來(lái)確定核心基因,共識(shí)別出87個(gè)核心基因。通常,探討模塊中核心基因的功能有助于揭示疾病發(fā)生的病因和發(fā)病機(jī)制。通過(guò)檢索Pubmed數(shù)據(jù)庫(kù),發(fā)現(xiàn)有一部分基因已被文獻(xiàn)報(bào)道直接或間接與CRC相關(guān),例如CRC差異表達(dá)下調(diào)的基因COL1A2以及差異表達(dá)上調(diào)的基因CDK1、MYC等。許多研究表明COL1A2參與惡性腫瘤的發(fā)生和發(fā)展。COL1A2的差異表達(dá)可能在人類惡性腫瘤中引起明顯的膠原介導(dǎo)效應(yīng)。Kalmar 等[12]發(fā)現(xiàn)COL1A2基因高度甲基化,其mRNA表達(dá)在CRC樣本中顯著降低。Yu等[13]報(bào)道證實(shí),原發(fā)性CRC組織中COL1A2表達(dá)明顯下調(diào),其mRNA在CRC組織中的表達(dá)與腫瘤分化程度、浸潤(rùn)深度、淋巴結(jié)轉(zhuǎn)移呈正相關(guān),這些結(jié)果提示COL1A2可能是鑒別CRC組織和非惡性組織的潛在生物標(biāo)志物。另外,有相關(guān)研究發(fā)現(xiàn)COL1A2在某些惡性腫瘤中具有抑制作用,結(jié)合COL1A2過(guò)表達(dá)會(huì)抑制CRC細(xì)胞增殖、遷移和侵襲的現(xiàn)象,提示COL1A2在CRC中具有抗癌作用[13-16]。網(wǎng)絡(luò)中連通度最高的基因是CDK1,它維系著網(wǎng)絡(luò)中15.70%的基因間最短路徑的連通路徑。CDK1是G2-M檢查點(diǎn)的重要調(diào)控因子。有研究表明,CDK1和iASPP在CRC組織和細(xì)胞系中表達(dá)上調(diào),CDK1蛋白與iASPP蛋白存在相互作用,它們通過(guò)p53凋亡途徑影響CRC細(xì)胞的增殖和凋亡[17]。基于CDK1在癌細(xì)胞中的高表達(dá),其不僅可以作為CRC治療的靶點(diǎn),而且可以作為一個(gè)有效預(yù)后指標(biāo)。MYC是Wnt信號(hào)通路的一個(gè)靶基因,Wnt/β-catenin信號(hào)通路的激活通過(guò)解除對(duì)包括c-Myc原癌基因在內(nèi)的下游靶基因的表達(dá)調(diào)控來(lái)驅(qū)動(dòng)CRC的生長(zhǎng)。有研究證明敲除MYC或MYC靶向嘧啶合成基因(CAD、UMPS和CTPS)可以抑制CRC細(xì)胞增殖[18]。因此,MYC靶向嘧啶合成途徑可能是CRC治療的潛在靶點(diǎn)。

本研究發(fā)現(xiàn)一些在網(wǎng)絡(luò)中連通度較高的基因,尚無(wú)文獻(xiàn)報(bào)道證實(shí)其與CRC相關(guān),有進(jìn)一步探索的價(jià)值。例如CRC下調(diào)的差異表達(dá)基因PRKCB、KAT2B以及上調(diào)的差異表達(dá)基因ACTN1。通過(guò)查閱相關(guān)文獻(xiàn)發(fā)現(xiàn)這些核心基因曾被報(bào)道與其他腫瘤的發(fā)生發(fā)展有關(guān)。例如,PRKCB是蛋白激酶C基因家族成員的一個(gè)基因[19]。PKC家族成員具有獨(dú)特的表達(dá)趨勢(shì),被認(rèn)為在腫瘤相關(guān)過(guò)程中起著獨(dú)特的作用[20-21]。PKCβ1是由PRKCB編碼的蛋白,相關(guān)研究發(fā)現(xiàn)PKCβ1在胰腺PANC1細(xì)胞中的重要作用,發(fā)現(xiàn)它可抑制胰腺癌的發(fā)生[20]。Liu等[22]發(fā)現(xiàn)PRKCB在過(guò)氧化物酶體增殖物激活受體途徑發(fā)生遺傳變異,可能會(huì)導(dǎo)致胰腺癌的易感性。近年來(lái)研究發(fā)現(xiàn)新型環(huán)狀RNA hsa_circ_0092306通過(guò)調(diào)節(jié)MKN-45細(xì)胞中miR-197-3p/PRKCB的途徑促進(jìn)了胃癌的發(fā)展[23]。KAT2B是一種蛋白質(zhì)編碼基因,在腫瘤組織中它的mRNA和蛋白質(zhì)表達(dá)異常。有相關(guān)文獻(xiàn)報(bào)道,與癌旁組織相比,KAT2B在食管鱗狀細(xì)胞癌[24]、腸型胃癌[25]和肝細(xì)胞癌[26]癌組織中的表達(dá)下調(diào)。據(jù)報(bào)道,Kaplan-Meier生存分析顯示,KAT2B表達(dá)下調(diào)與肝癌患者總體生存率降低有關(guān)[24]。此外,一項(xiàng)有關(guān)宮頸癌的研究發(fā)現(xiàn)[27],KAT2B組蛋白乙酰轉(zhuǎn)移酶活性的下降會(huì)受到癌蛋白HPV16E7表達(dá)的影響。肌動(dòng)蛋白α1(actinin alpha 1,ACTN1)是參與癌癥轉(zhuǎn)移的骨架蛋白之一[28],它可以通過(guò)影響FAK信號(hào)通路的表達(dá)和包括CCL2在內(nèi)的分泌因子的含量來(lái)調(diào)節(jié)腫瘤的微環(huán)境[29]。Cao等[30]研究中證明了黃芩中的黃酮類化合物Oroxylin A抑制ACTN1表達(dá)以滅活與癌癥相關(guān)的成纖維細(xì)胞,從而抑制乳腺癌轉(zhuǎn)移。另有研究發(fā)現(xiàn)ACTN1表達(dá)是口腔鱗狀細(xì)胞癌(oral squamous cell carcinoma,OSCC)預(yù)后不良的獨(dú)立預(yù)測(cè)因子,敲除ACTN1可以抑制OSCC腫瘤細(xì)胞增殖和轉(zhuǎn)移[31]。雖然這些基因目前尚缺乏完善的研究來(lái)證明其與CRC相關(guān),但它們有可能是治療CRC的潛在重要靶標(biāo)。

為了闡明每個(gè)模塊的生物學(xué)功能,本研究對(duì)各模塊進(jìn)行通路富集分析。結(jié)果顯示通路主要富集于細(xì)胞周期(hsa04110)、DNA復(fù)制(hsa03030)、Wnt信號(hào)通路(hsa04310)、PI3K-AKT信號(hào)通路(hsa04151)等。其中最顯著相關(guān)的是細(xì)胞周期(hsa04110)。多項(xiàng)研究已證實(shí)p53基因突變、細(xì)胞周期阻滯、異常細(xì)胞分裂增殖、DNA復(fù)制等與CRC的發(fā)生發(fā)展密切相關(guān)[32-35]。先前的研究表明,人類CRC的發(fā)生中與細(xì)胞周期相關(guān)的上調(diào)基因可以預(yù)測(cè)CRC患者的整體生存情況[36]。近年來(lái),Wnt/β-catenin途徑(hsa04310)已成為CRC治療的靶點(diǎn),因?yàn)榇蠖鄶?shù)CRC患者至少有一個(gè)Wnt信號(hào)級(jí)聯(lián)基因發(fā)生突變,如β-catenin(CTNNB1)和腺瘤性息肉病基因。據(jù)報(bào)道,漢黃芩素通過(guò)誘導(dǎo)G1細(xì)胞周期阻滯和下調(diào)β-連環(huán)蛋白依賴性Wnt信號(hào)通路來(lái)抑制人CRC細(xì)胞的體外增殖[37]。Wnt信號(hào)通路是CRC中重要的失調(diào)通路之一,它與腫瘤細(xì)胞增殖和抗化療有關(guān)[38]。研究表明,PI3K-AKT信號(hào)通路(hsa04151)在腫瘤細(xì)胞的增殖、凋亡及遷移侵襲方面發(fā)揮重要作用,并與多種腫瘤的發(fā)生發(fā)展相關(guān)[39]。我們已經(jīng)證明PIK3CA和AKT1的基因變異與CRC風(fēng)險(xiǎn)的顯著增加相關(guān)[40]。 Slattery等[41]發(fā)現(xiàn)PI3K/AKT信號(hào)通路在CRC中是失調(diào)的,并且一些失調(diào)基因與miRNAs有關(guān)。Yang等[42]研究顯示GLI1與PI3K/AKT/NFκB信號(hào)的聯(lián)合靶向治療可對(duì)CRC患者產(chǎn)生協(xié)同治療作用,從而為CRC的治療提供新的途徑。

本研究探討13個(gè)功能模塊與KEGG通路類別之間的相互作用。結(jié)果表明功能相似的模塊之間會(huì)相互影響,在疾病的發(fā)生發(fā)展中共同發(fā)揮作用。13個(gè)功能模塊KEGG通路分類主要參與信號(hào)轉(zhuǎn)導(dǎo)、信號(hào)分子與相互作用、內(nèi)分泌系統(tǒng)、細(xì)胞生長(zhǎng)與死亡、免疫系統(tǒng)、傳染病、復(fù)制與修復(fù)、聚糖的生物合成與代謝等多個(gè)功能類別。模塊M2、M5、M6、M8與信號(hào)轉(zhuǎn)導(dǎo)有關(guān),涉及的通路有Hippo信號(hào)通路、Ras信號(hào)通路、PI3K-AKT信號(hào)通路、Wnt信號(hào)通路、cAMP信號(hào)通路。據(jù)文獻(xiàn)報(bào)道,這一系列信號(hào)通路在CRC的發(fā)生和進(jìn)展中起關(guān)鍵作用。模塊M8、M10、M11與內(nèi)分泌系統(tǒng)有關(guān),胃腸道粘膜散在分布眾多隱匿的神經(jīng)內(nèi)分泌細(xì)胞,因此被認(rèn)為是最大的神經(jīng)內(nèi)分泌器官。有研究證實(shí),CRC的發(fā)病與2型糖尿病之間存在關(guān)聯(lián)[43]。糖尿病是一種屬于內(nèi)分泌系統(tǒng)的代謝性疾病,間接揭示CRC的發(fā)生與內(nèi)分泌系統(tǒng)息息相關(guān)。因此,可從挖掘到的模塊以及相應(yīng)富集通路進(jìn)一步深入了解CRC與內(nèi)分泌系統(tǒng)之間關(guān)系的機(jī)制。

綜上,本研究利用轉(zhuǎn)錄組數(shù)據(jù)從特異性功能模塊的角度分析了CRC基因網(wǎng)絡(luò)的功能學(xué)特征,為疾病基礎(chǔ)研究提供新思路。本次分析共挖掘了15個(gè)功能模塊,87個(gè)密切相關(guān)的核心基因(如CDK1、COL1A2、MYC等)以及發(fā)現(xiàn)了Wnt信號(hào)通路、PI3K-AKT信號(hào)通路、細(xì)胞周期等與CRC發(fā)病有重要意義的富集通路。這些發(fā)現(xiàn)不僅增加了對(duì)CRC發(fā)病機(jī)制和潛在分子機(jī)制的認(rèn)識(shí),而且為腫瘤標(biāo)記物的篩選和藥物靶點(diǎn)的選擇提供了理論基礎(chǔ)。本研究也存在一些不足,新發(fā)現(xiàn)的相關(guān)基因和通路功能仍需要進(jìn)一步的分子生物學(xué)實(shí)驗(yàn)和動(dòng)物實(shí)驗(yàn)來(lái)驗(yàn)證。

作者聲明:本文全部作者對(duì)于研究和撰寫的論文出現(xiàn)的不端行為承擔(dān)相應(yīng)責(zé)任;并承諾論文中涉及的原始圖片、數(shù)據(jù)資料等已按照有關(guān)規(guī)定保存,可接受核查。

學(xué)術(shù)不端:本文在初審、返修及出版前均通過(guò)中國(guó)知網(wǎng)(CNKI)科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的學(xué)術(shù)不端檢測(cè)。

同行評(píng)議:經(jīng)同行專家雙盲外審,達(dá)到刊發(fā)要求。

利益沖突:所有作者均聲明不存在利益沖突。

文章版權(quán):本文出版前已與全體作者簽署了論文授權(quán)書等協(xié)議。

猜你喜歡
功能模塊通路節(jié)點(diǎn)
DJ-1調(diào)控Nrf2信號(hào)通路在支氣管哮喘中的研究進(jìn)展
基于圖連通支配集的子圖匹配優(yōu)化算法
小檗堿治療非酒精性脂肪肝病相關(guān)通路的研究進(jìn)展
Wnt/β-catenin信號(hào)轉(zhuǎn)導(dǎo)通路在瘢痕疙瘩形成中的作用機(jī)制研究
白芍總苷調(diào)控Sirt1/Foxo1通路對(duì)慢性心力衰竭大鼠的保護(hù)作用研究
結(jié)合概率路由的機(jī)會(huì)網(wǎng)絡(luò)自私節(jié)點(diǎn)檢測(cè)算法
面向復(fù)雜網(wǎng)絡(luò)的節(jié)點(diǎn)相似性度量*
采用貪婪啟發(fā)式的異構(gòu)WSNs 部分覆蓋算法*
商業(yè)模式是新媒體的核心
基于ASP.NET標(biāo)準(zhǔn)的采購(gòu)管理系統(tǒng)研究
封丘县| 九台市| 新邵县| 潮州市| 资溪县| 温州市| 西城区| 漯河市| 赤水市| 阿荣旗| 铜鼓县| 大竹县| 沙田区| 大连市| 永康市| 沂南县| 平阴县| 阳山县| 美姑县| 北京市| 张家口市| 沂南县| 福清市| 隆尧县| 肃南| 五指山市| 庆云县| 承德市| 九龙坡区| 无为县| 琼中| 夏津县| 会宁县| 沙坪坝区| 万全县| 广南县| 翁牛特旗| 都昌县| 锦州市| 浮梁县| 横峰县|