国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于生物信息學(xué)篩選和鑒定結(jié)直腸癌 關(guān)鍵的生物標(biāo)志物

2021-09-09 01:07:20張永玲范文濤
激光生物學(xué)報 2021年4期
關(guān)鍵詞:差異基因直腸癌受體

張永玲,范文濤

(陜西中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院,咸陽 712046)

結(jié)直腸癌是臨床上最常見的消化道惡性腫瘤之一,致死率在惡性腫瘤中居第三位。根據(jù)2018年全美的癌癥統(tǒng)計數(shù)據(jù)顯示:男性和女性的結(jié)直腸癌發(fā)病率在各類腫瘤發(fā)病率中均居于第三位[1]。該疾病多發(fā)生在中年以上的男性,以40~70歲最為常見。隨著人口老齡化以及生活習(xí)慣等因素的影響,結(jié)直腸癌的發(fā)病率和死亡率呈逐步上升趨勢,且越發(fā)年輕化,但其發(fā)病原因仍然不明。現(xiàn)代臨床早期診斷主要檢測癌胚抗原(carcinoembryonic antigen,CEA)或糖類抗原199(carbohydrate antigen199,CA199)、糖類抗原242(carbohydrate antigen242,CA242)、糖類抗原724(carbohydrate antigen724,CA724),其雖可以診斷結(jié)直腸癌,但敏感度不高。越來越多的研究數(shù)據(jù)發(fā)現(xiàn),基因異常和突變的基因參與結(jié)直腸癌的致癌作用和進(jìn)展,如p53基因、原癌基因K-ras突變、表皮生長因子受體(epidermal growth factor receptor,EGFR)、Toll樣受體(toll-like receptor,TLR)、同源異型盒D10(homeoboxD10,HOXD10)基因等。p53是一種重要的腫瘤抑制基因,通過調(diào)節(jié)不同的下游基因,在多種信號的轉(zhuǎn)導(dǎo)過程中發(fā)揮著重要的作用[2]。原癌基因K-ras是表皮生長因子受體信號通路的下游分子,是引發(fā)和治療結(jié)直腸癌的關(guān)鍵基因[3]。有相關(guān)研究發(fā)現(xiàn),有近50%的結(jié)直腸癌患者其K-ras基因均發(fā)生突變[4]。TLR4是跨膜傳遞信號的受體,可以識別病原病參與相關(guān)的免疫應(yīng)答[5]。根據(jù)部分臨床研究發(fā)現(xiàn),TLR4位于外顯子區(qū)域的1196C>T及896A>G兩個位點的突變最為明顯,其可以改變氨基酸已被編碼的序列[6]。也有研究表明,TLR4基因的多態(tài)性對炎性因子的合成過程產(chǎn)生影響,進(jìn)而引發(fā)結(jié)直腸癌[7]。郗昌磊等[8]運(yùn)用蛋白免疫印跡法(Western blot,WB)檢測結(jié)直腸癌細(xì)胞中HOXD10的表達(dá),發(fā)現(xiàn)過表達(dá)的HOXD10可以明顯的降低Notch信號通路Notch1及下游靶基因Hesde的蛋白的表達(dá),由此得知過表達(dá)的HOXD10可能通過下調(diào)Notch信號通路進(jìn)而影響結(jié)直腸癌的發(fā)生。目前已發(fā)現(xiàn)的可用于診療的分子靶點很多,但仍需不斷尋找有效的靶點。結(jié)直腸癌的早期癥狀不明顯,晚期其發(fā)病率和死亡率在消化系統(tǒng)的惡性腫瘤中僅次于胃癌、食管癌和原發(fā)性肝癌。因此,開發(fā)有效的診斷和治療方法至關(guān)重要。在近幾十年里,微陣列技術(shù)和生物信息學(xué)分析日益廣泛用于各類疾病相關(guān)基因的分析層面,也更好地幫助我們識別差異表達(dá)基因和功能通路參與結(jié)直腸癌的致癌作用和進(jìn)展。然而,通過分析獨(dú)立的微陣列數(shù)據(jù)很難獲得可靠的結(jié)果。因此,在本研究中,從基因表達(dá)(gene expression omnibus,GEO,http://www.ncbi.nlm.nih.gov/geo)數(shù)據(jù)庫下載3個數(shù)據(jù)集,并通過分析獲得結(jié)直腸癌組織和非腫瘤組織之間的差異基因;然后,通過京都基因和基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)通路富集分析和蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)分析進(jìn)一步幫助我們理解致癌分子機(jī)制。綜上方法所述,472個差異基因和15個核心基因通過分析被確定為有可能是結(jié)直腸癌候選的生物標(biāo)志物。

1 材料和方法

1.1 GEO數(shù)據(jù)庫

GEO是一個公共功能基因組學(xué)高通量基因表達(dá)數(shù)據(jù)的數(shù)據(jù)存儲庫,包括芯片和微陣列數(shù)據(jù)[9]。我們從GEO數(shù)據(jù)庫篩選了3個基因表達(dá)數(shù)據(jù)集GSE21510、GSE32323、GSE15781(均來自于GPL570平臺)。GSE21510數(shù)據(jù)集包含104個結(jié)直腸癌組織樣本和44個癌旁樣本;GSE32323包含22個結(jié)直腸癌樣本和22個非腫瘤樣本;GSE15781包含25個結(jié)直腸癌樣本和17個非腫瘤樣本。

1.2 篩選差異基因

選擇GEO數(shù)據(jù)庫自帶分析工具Analyze with GEO2R進(jìn)行分組,分為癌組織組和正常組織組,點擊TOP250進(jìn)行分析,保存分析數(shù)據(jù)。根據(jù)P<0.01,|logFC|>1篩選出差異基因。

1.3 繪制韋恩圖

采用韋恩圖制作軟件(venny2.1),將檢索出的差異基因繪制韋恩圖,查找3組共有基因。

1.4 對共有差異基因進(jìn)行KEGG和GO富集功能分析

DAVID (http://david.ncifcrf.gov)[10]是一個在線的可視化的生物信息數(shù)據(jù)庫,整合了生物數(shù)據(jù)和分析工具,為用戶提供更加全面的基因和蛋白質(zhì)功能注釋信息,可從中提取生物學(xué)信息。KEGG數(shù)據(jù)庫是系統(tǒng)分析基因產(chǎn)物在細(xì)胞中的代謝途徑以及這些基因產(chǎn)物功能的數(shù)據(jù)庫[11]?;虮倔w論(gene ontology,GO)是一個主要的生物信息學(xué)工具,可以注釋基因和分析基因的生物過程[12]。運(yùn)用DAVID在線數(shù)據(jù)庫可以將差異基因的功能和生物分析結(jié)果更好地以可視化的方式呈現(xiàn)。P<0.05被認(rèn)為具有統(tǒng)計學(xué)意義。

1.5 PPI網(wǎng)絡(luò)蛋白互作分析(篩選核心基因)

PPI網(wǎng)絡(luò)是使用搜索工具(http://string-db.org)來檢索基因相互作用的在線數(shù)據(jù)庫[13]。通過分析功能蛋白之間的相互作用可以為疾病產(chǎn)生的機(jī)制或疾病的發(fā)展提供新的見解。STRING數(shù)據(jù)庫是一個常用的 PPI數(shù)據(jù)庫,combine score>0.4被認(rèn)為是具有統(tǒng)計學(xué)意義。Cytoscape是可視化的分子相互作用網(wǎng)絡(luò),為用戶提供了一個開放的生物信息學(xué)軟件平臺,內(nèi)含的插件MCODE(molecular complex detection)是一個應(yīng)用程序集群,其通過基于給定的差異基因蛋白互作網(wǎng)絡(luò)圖發(fā)現(xiàn)蛋白互作密集區(qū)域,即核心基因所在區(qū)域[14-15]。選擇的標(biāo)準(zhǔn)如下:MCODE score>5,degree cut-off=2,node score cut-off=0.2,max depth=100,k-score=2。核心基因的KEGG和GO分析模塊使用DAVID可視化呈現(xiàn)。

1.6 核心基因選擇和功能分析

運(yùn)用Cytoscape中的插件MCODE選擇核心基因。網(wǎng)絡(luò)的基因分析使用cbioportal(http://www.cbioportal.org)在線平臺[16]。使用Kaplan-Meier曲線(cbioPortal)對核心基因的總體生存和無病生存進(jìn)行分析。

1.7 核心基因驗證

使用數(shù)據(jù)庫Oncomine(http://www.oncomine.com)將正常組織與癌癥組織進(jìn)行對比分析。

2 結(jié)果與分析

2.1 篩選差異基因

從GEO數(shù)據(jù)庫中篩選3個與結(jié)腸癌相關(guān)的數(shù)據(jù)集,通過對數(shù)據(jù)集中的數(shù)據(jù)統(tǒng)一處理之后,鑒定出3個數(shù)據(jù)集的差異表達(dá)基因:GSE21510(148個樣本)、GSE32323(44個樣本)、GSE15781(42個樣本)。其中GSE21510中有4 993個差異表達(dá)基因,GSE32323中有2 504個差異表達(dá)基因,GSE15781中有1 096個差異表達(dá)基因。通過韋恩圖(venny2.1)可見3個數(shù)據(jù)集包含了472個重復(fù)基因,其中包括上調(diào)基因212個,下調(diào)基因260個(圖1a)。

2.2 對差異基因進(jìn)行KEGG和GO富集功能分析

運(yùn)用DAVID在線可視化數(shù)據(jù)庫分析差異基因的功能和富集結(jié)果。利用GO分析,將所有差異基因富集到生物學(xué)過程(biological process,BP)、細(xì)胞組分(cellular component,CC)和生物學(xué)功能(molecular functions,MF)3種生物關(guān)系中。分析結(jié)果表明,蛋白在生物學(xué)過程中主要參與調(diào)節(jié)細(xì)胞增殖、免疫應(yīng)答、離子傳輸、調(diào)節(jié)細(xì)胞活性、脂質(zhì)的分解過程等(表1)。細(xì)胞學(xué)組分主要集中細(xì)胞外區(qū)域等。生物學(xué)功能主要集中于蛋白結(jié)合、肽酶的活性、細(xì)胞骨架的綁定以及結(jié)構(gòu)分子活動。KEGG通路分析結(jié)果顯示,下調(diào)的差異基因主要富集在過氧化物酶體增殖物激活受體(peroxisome proliferator activated-receptor,PPAR)信號通路、細(xì)胞因子與細(xì)胞因子受體的相互作用以及醛固酮調(diào)節(jié)鈉的重吸收,而上調(diào)的差異基因主要富集于淀粉和蔗糖代謝TGF-β信號通路等。

表1 差異基因KEGG和GO富集功能分析Tab. 1 KEGG and GO enrichment function analysis of differential gene

2.3 PPI網(wǎng)絡(luò)蛋白互作分析(篩選核心基因)

使用STRING數(shù)據(jù)庫、Cytoscape在線分析軟件對差異基因和核心基因的PPI網(wǎng)絡(luò)進(jìn)行構(gòu)建(圖1b、1c)。運(yùn)用Cytoscape中的插件MCODE,根據(jù)score排序,選擇出得分最明顯的區(qū)域圖1 c,即核心基因。通過DAVID對核心基因的功能進(jìn)行分析。GO分析結(jié)果顯示,核心基因在生物學(xué)過程中主要參與蛋白耦合受體蛋白信號通路和細(xì)胞表面受體信號轉(zhuǎn)導(dǎo),生物學(xué)功能主要集中于趨化因子受體結(jié)合、細(xì)胞和生長因子活動(表2)。KEGG主要富集在趨化因子信號通路以及受體的互動。

表2 核心基因KEGG和GO富集功能分析Tab. 2 Enrichment function analysis of core genes KEGG and GO

圖1 差異基因的韋恩圖、PPI網(wǎng)絡(luò)和核心基因Fig. 1 Venn diagram, PPI network and core gene diagram of differential genes(a)在mRNA表達(dá)譜集GSE21510、GSE32323和GSE15781中選擇倍數(shù)變化>2且P<0.01的基因。3個數(shù)據(jù)集顯示472個基因的重疊,即472個差異基因;(b)使用Cytoscape構(gòu)建差異基因的PPI網(wǎng)絡(luò);(c)從獲得的PPI網(wǎng)絡(luò)中篩選出最重要的模塊,即核心基因。 (a) Select genes with fold change>2 and P value<0.01 in the mRNA expression profile sets GSE21510, GSE32323 and GSE15781. The 3 data sets show an overlap of 472 genes, that is, 472 differential genes; (b) Use Cytoscape to construct a PPI network of differential genes; (c) Screen out the most important module, the core gene, from the obtained PPI network.

2.4 核心基因選擇和功能分析

總共15個基因被確定為核心基因。這些核心基因的名稱、縮寫和功能如表3所示。使用cbioPortal在線平臺對核心的基因構(gòu)建共表達(dá)基因蛋白網(wǎng)絡(luò)(圖2a)。使用Kaplan- Meier曲線對核心基因的總體生存進(jìn)行分析(圖2 b),發(fā)現(xiàn)結(jié)直腸癌患者含有CXCL2、AGT基因,其生存率相比無病生存率較差。

圖2 核心基因的相互作用網(wǎng)絡(luò)和生存曲線分析Fig. 2 Analysis of interaction network and survival curve of core genes(a)使用cbioPortal分析核心基因及其共表達(dá)基因。黑色粗體輪廓的節(jié)點代表核心基因,黑色細(xì)體輪廓的節(jié)點代表共表達(dá)基因;(b)使用cbioPortal在線平臺對核心基因進(jìn)行總體存活和無病存活分析。 (a) Use cbioPortal to analyze Hub genes and their co-expressed genes. The nodes with black bold outlines represent core genes, the nodes with the black body outline represent co-expressed genes; (b) Use the cbioPortal online platform to analyze the overall survival and disease-free survival of core genes.

表3 核心基因功能Tab. 3 Core gene functions

2.5 核心基因的驗證

利用數(shù)據(jù)庫Oncomine將基因AGT與CXCL2在正常結(jié)直腸組織中的表達(dá)與結(jié)直腸癌組織中的表達(dá)進(jìn)行對比,結(jié)果用箱式圖顯示(圖3)。選取Oncomine數(shù)據(jù)庫中3個數(shù)據(jù)集進(jìn)行進(jìn)一步驗證(圖4),結(jié)果發(fā)現(xiàn),AGT與CXCL2在結(jié)直腸癌組織確實呈高表達(dá)。

圖3 AGT和CXCL2在正常結(jié)直腸組織與結(jié)直腸癌組織中的表達(dá)Fig. 3 The expression of AGT and CXCL2 in normal colorectal tissues and colorectal cancer tissue

圖4 AGT和CXCL2在Oncomine 3個數(shù)據(jù)集中的驗證結(jié)果Fig. 4 The verification results of AGT and CXCL2 in Oncomine’s three data sets(a)AGT;(b)CXCL2。1.大腸癌與正常Graudens結(jié)腸的比較;2.直腸癌與正常Skrzypczak結(jié)直腸的比較;3. 結(jié)腸癌與正常Skrzypczak結(jié)腸直腸比較。Oncomine數(shù)據(jù)集結(jié)果顯示AGT、CXCL2在結(jié)直腸癌組織中呈現(xiàn)明顯的高表達(dá)。(a) AGT; (b) CXCL2. 1. Colorectal carcinoma vs. normal graudens colon; 2. Colorectal carcinoma vs. normal skrzypczak colorectal; 3. Colon carcinoma vs. normal skrzypczak colorectal. The results of the Oncomine dataset showed that AGT and CXCL2 were significantly over-expression in colorectal cancer tissues.

3 討論

結(jié)直腸癌已經(jīng)成為中國三大癌癥之一,絕大多數(shù)的結(jié)直腸癌來源于腺瘤,其發(fā)病率正以螺旋速度遞增,但其病因仍然模糊不清。結(jié)直腸癌并非不可防治,是最易自我篩查的疾病,但其潛伏期較長,早期診斷率較小。

近幾年有關(guān)結(jié)直腸癌分子機(jī)制的研究還是甚少。本研究基于GEO數(shù)據(jù)庫,選擇3個數(shù)據(jù)集,篩選出差異基因和核心基因,并對其蛋白互作網(wǎng)絡(luò)、分子功能以及生存曲線通過cytoscape、cbioportal等生物信息工具進(jìn)行分析,最終根據(jù)分析結(jié)果確定了AGT、CXCL2基因?qū)Y(jié)直腸癌具有促進(jìn)作用。就目前,在我們所能查閱到的文獻(xiàn)中,只有1篇文獻(xiàn)研究了AGT與結(jié)直腸癌的相關(guān)性:AGT不僅可以調(diào)節(jié)血壓和穩(wěn)定體液平衡,而且能夠抑制腫瘤細(xì)胞的增殖、遷移;AGT M235T多態(tài)性與中國人結(jié)直腸癌的分化程度密切相關(guān)[17]。本研究結(jié)果與上述研究結(jié)果有所出入,分析原因如下:1)樣本量有限,所以有必要擴(kuò)大樣本量;2)我們在GEO數(shù)據(jù)庫中所選取的數(shù)據(jù)集中的樣本主要來自于日本和挪威,不能排除這種差異是由種族的差異而引起的,所以需要在擴(kuò)大樣本量的基礎(chǔ)上增加多種族的樣本來源,來獲得更加準(zhǔn)確的分析結(jié)果;3)我們的研究是一個描述性的研究,還有待功能驗證。CXCL2是一種趨化因子,與CXCR2受體結(jié)合參與細(xì)胞的增殖和凋亡、腫瘤的形成及其發(fā)展,以及干細(xì)胞的分化、中性粒細(xì)胞的聚集、神經(jīng)遞質(zhì)的釋放。宋宏偉等[18]運(yùn)用免疫組化染色分析結(jié)直腸癌及癌旁組織中CXCL2蛋白的表達(dá),結(jié)果發(fā)現(xiàn)CXCL2表達(dá)可能通過某種特殊的途徑影響結(jié)直腸組織,從而致癌,但其具體途徑還有待研究。鄭敏[19]運(yùn)用免疫印跡法、酶聯(lián)免疫吸附法(enzyme linked immunosorbent assay,ELISA)檢測發(fā)現(xiàn),結(jié)直腸癌組織及血清中的CXCL2蛋白表達(dá)均明顯高于癌旁正常組織。當(dāng)根據(jù)解剖部位分為結(jié)腸、直腸時,CXCL2在結(jié)腸的高表達(dá)比在直腸更加明顯[20]。CXCL2聯(lián)合檢測CEA、CA199能夠有效的診斷結(jié)腸癌[21]。

本研究旨在識別可能參與結(jié)直腸癌的致癌或進(jìn)展的差異基因。通過對472個差異基因和15個核心基因的識別,發(fā)現(xiàn)促癌因子AGT、CXCL2可能被視為對結(jié)直腸癌診斷的生物標(biāo)志物,為后續(xù)的研究提供分子靶標(biāo)。然而,未來還需要進(jìn)一步的研究來闡明這些基因在結(jié)直腸癌細(xì)胞中的生物功能及其激活途徑。

猜你喜歡
差異基因直腸癌受體
ICR鼠肝和腎毒性損傷生物標(biāo)志物的篩選
基于RNA 測序研究人參二醇對大鼠心血管內(nèi)皮細(xì)胞基因表達(dá)的影響 (正文見第26 頁)
腹腔鏡下直腸癌前側(cè)切除術(shù)治療直腸癌的效果觀察
Toll樣受體在胎膜早破新生兒宮內(nèi)感染中的臨床意義
2,2’,4,4’-四溴聯(lián)苯醚對視黃醛受體和雌激素受體的影響
直腸癌術(shù)前放療的研究進(jìn)展
COXⅠ和COX Ⅲ在結(jié)直腸癌組織中的表達(dá)及其臨床意義
GRP及GRPR在結(jié)直腸癌中的表達(dá)及意義
SSH技術(shù)在絲狀真菌功能基因篩選中的應(yīng)用
Toll樣受體:免疫治療的新進(jìn)展
墨竹工卡县| 永定县| 会宁县| 汪清县| 永昌县| 清原| 高雄市| 高台县| 蚌埠市| 布尔津县| 吕梁市| 西林县| 石阡县| 定日县| 安溪县| 九龙坡区| 吴忠市| 安仁县| 临潭县| 方山县| 磴口县| 海阳市| 桂平市| 泊头市| 洛浦县| 乌鲁木齐市| 孟村| 水城县| 广州市| 龙井市| 永德县| 隆安县| 东港市| 沂南县| 黄骅市| 砚山县| 黑山县| 绩溪县| 绥滨县| 大庆市| 陈巴尔虎旗|