国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

應(yīng)用生物信息學(xué)方法篩選食管鱗癌的關(guān)鍵基因

2020-05-25 02:35趙飛原志慶
中國醫(yī)藥導(dǎo)報 2020年12期
關(guān)鍵詞:生物信息學(xué)基因芯片

趙飛 原志慶

[摘要] 目的 篩選食管鱗癌的關(guān)鍵基因,為腫瘤的發(fā)病機(jī)制研究提供新的思路。 方法 檢索GEO數(shù)據(jù)庫中食管鱗癌基因表達(dá)芯片,分析差異表達(dá)基因并獲得共同差異基因;利用在線數(shù)據(jù)庫DAVID進(jìn)行GO和KEGG通路富集分析;通過String數(shù)據(jù)庫和Cytoscape軟件分析獲取鏈接度最高的10個關(guān)鍵基因,并在TCGA數(shù)據(jù)庫中驗(yàn)證。結(jié)果 共篩選出204個差異表達(dá)基因。GO分析顯示其生物學(xué)過程富集在細(xì)胞分裂、細(xì)胞器斷裂和細(xì)胞周期等163個條目中;細(xì)胞學(xué)組分富集在細(xì)胞外、細(xì)胞質(zhì)和細(xì)胞器腔內(nèi)等48個條目中;分子功能富集在調(diào)控肽酶活性、與細(xì)胞外基質(zhì)結(jié)合等46個條目中。KEGG通路富集在局部黏附、p53信號通路、錯配修復(fù)等12個條目中。篩選出10個鏈接度最高的Hub基因,且通過TCGA數(shù)據(jù)庫驗(yàn)證其全部在食管鱗癌組織中高表達(dá)(P < 0.01)。 結(jié)論 CDK1、CCNA2、RFC4、CCNB1、TOP2A、AURKA、CDC6、BUB1、BUB1B、PLK1是食管鱗癌的關(guān)鍵基因,可能是食管鱗癌的生物標(biāo)志和治療靶點(diǎn)。

[關(guān)鍵詞] 食管鱗癌;關(guān)鍵基因;生物信息學(xué);基因芯片

[中圖分類號] R735.1 ? ? ? ? ?[文獻(xiàn)標(biāo)識碼] A ? ? ? ? ?[文章編號] 1673-7210(2020)04(c)-0009-05

The key genes in esophageal squamous cell carcinoma screened by bioinformatics

ZHAO Fei1 ? YUAN Zhiqing2

1.The Third Clinical College, Xinxiang Medical University, He′nan Province, Xinxiang ? 453003, China; 2.College of Basic Medicine, Xinxiang Medical University, He′nan Province, Xinxiang ? 453003, China

[Abstract] Objective To provide new ideas for the study of tumor pathogenesis by screening the key genes of esophageal squamous cell carcinoma (ESCC). Methods The gene expression chips of ESCC were retrieved in GEO database. The differential expression genes were analyzed for obtaining common differential genes. GO and KEGG pathway enrichment analysis were performed in DAVID online database. The 10 key genes with the highest link were obtained by String database and Cytoscape software, and verified in the TCGA database. Results A total of 204 differentially expressed genes were screened. GO analysis showed that the biological process was enriched in 163 items, such as cell division, organelle fission, cell cycle, etc. Cytological components were enriched in 48 entries including extracellular, cytoplasmic and organelle lumen. Molecular function enrichment in 46 entries, such as regulating peptidase activity, binding to extracellular matrix, etc. KEGG pathways were enriched in 12 entries, including local adhesion, p53 signaling pathways, mismatch repair, etc. The 10 highest-linked Hub genes were verified to be highly expressed in ESCC by TCGA databases (P < 0.01). Conclusion CDK1, CCNA2, RFC4, CCNB1, TOP2A, AURKA, CDC6, BUB1, BUB1B and PLK1 are the key genes of ESSC, and may be biomarkers and therapeutic targets in ESCC.

[Key words] Esophageal squamous cell carcinoma; Key genes; Bioinformatics; Gene chip

根據(jù)WHO統(tǒng)計,全世界每年約有40萬人死于食管癌,其中我國約20萬人,占世界的一半[1]。食管癌主要有兩個亞型——食管鱗癌和腺癌,我國食管癌患者主要為鱗癌。目前食管癌的發(fā)生發(fā)展及轉(zhuǎn)移機(jī)制尚不清楚,因此進(jìn)一步研究其發(fā)病機(jī)制,建立有效的預(yù)防和診療方法,是迫切需要解決的問題。本研究通過分析GEO數(shù)據(jù)庫[2]中食管鱗癌的相關(guān)芯片數(shù)據(jù),旨在挖掘食管鱗癌的關(guān)鍵基因,利用生物信息學(xué)方法探討其可能的發(fā)病機(jī)制,為進(jìn)一步的基礎(chǔ)與臨床研究提供方向。

1 資料與方法

1.1 一般資料

資料來源GEO在線數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo),下載食管鱗癌全基因組表達(dá)譜芯片數(shù)據(jù)集。入選條件:①全基因組RNA表達(dá)譜芯片;②人食管鱗癌組織與配對的癌旁正常組織。

1.2 方法

1.2.1 分析差異表達(dá)基因 ?①數(shù)據(jù)預(yù)處理:將下載的芯片數(shù)據(jù)導(dǎo)入R語言,經(jīng)RMA法進(jìn)行背景校正和矩陣數(shù)據(jù)歸一化處理獲得標(biāo)準(zhǔn)化芯片表達(dá)矩陣數(shù)據(jù);②篩選差異表達(dá)基因:使用“Limma”包[3]篩選差異倍數(shù)(FC)>2且P < 0.01的數(shù)據(jù)作為有意義的差異表達(dá)基因,并使用“ggplot”包繪制火山圖。

1.2.2 共同差異表達(dá)基因 ?將篩選出的各個基因芯片數(shù)據(jù)集的差異表達(dá)基因取交集,獲得共同的差異表達(dá)基因。

1.2.3 GO與KEGG通路富集分析 ?將共同差異表達(dá)基因?qū)隓AVID 6.8分析工具(http://david-d.ncifcrf.gov)[4],進(jìn)行GO與KEGG通路富集分析[5],條件設(shè)定為P < 0.01,結(jié)果使用“ggplot 2”包[6]繪制氣泡圖。

1.2.4 PPI網(wǎng)絡(luò)構(gòu)建與關(guān)鍵基因分析 ?將篩選出的共同差異表達(dá)基因通過數(shù)據(jù)庫String 11.0(http://www.string-db.org)進(jìn)行蛋白互作PPI網(wǎng)絡(luò)分析,結(jié)果導(dǎo)入Cytoscape軟件的CytoHubba插件[7],獲取鏈接度最高的10個Hub基因。

1.2.5 關(guān)鍵基因驗(yàn)證 ?通過GEPIA(http://gepia.cancer-pku.cn)[8]網(wǎng)站,驗(yàn)證這10個Hub基因在TCGA和GTEx[9]數(shù)據(jù)庫的表達(dá)情況,確定食管鱗癌的關(guān)鍵基因。

2 結(jié)果

2.1 食管鱗癌芯片數(shù)據(jù)集篩選

通過GEO數(shù)據(jù)庫共篩選出符合條件的數(shù)據(jù)集三組,分別為GSE23400[10]、GSE20347[11]和GSE17351[12],樣本均為食管鱗癌及其配對癌旁正常食管黏膜組織。見表1。

表1 ? 食管鱗癌基因表達(dá)譜芯片數(shù)據(jù)集基本信息

2.2 差異表達(dá)基因分析

分析各組芯片數(shù)據(jù)集差異倍數(shù)FC > 2且P < 0.01的差異表達(dá)基因。見表2、圖1。

表2 ? 食管鱗癌基因表達(dá)譜芯片數(shù)據(jù)集DEGs分析結(jié)果(個)

2.3 共同差異表達(dá)基因

對三組數(shù)據(jù)集差異表達(dá)基因進(jìn)行Venn交集[13],共獲得204個共同差異表達(dá)基因,其中上調(diào)的167個,下調(diào)的37個。見圖2。

2.4 GO富集分析

將共同差異表達(dá)基因?qū)隓AVID 6.8進(jìn)行GO富集分析,發(fā)現(xiàn)食管鱗癌共同差異表達(dá)基因主要富集在細(xì)胞分裂、細(xì)胞周期、有絲分裂等163個生物過程中;主要位于細(xì)胞質(zhì)、細(xì)胞器腔內(nèi)、細(xì)胞核等48個細(xì)胞學(xué)組分中;主要參與調(diào)控肽酶活性,與細(xì)胞外基質(zhì)、結(jié)構(gòu)特異性DNA結(jié)合等46個分子功能。取統(tǒng)計學(xué)意義最為顯著(P值最?。┑那?5個。見圖3(封三)。

2.5 KEGG通路富集分析

共同的差異表達(dá)基因在KEGG通路方面主要富集在小細(xì)胞肺癌、癌癥通路、局部黏附、細(xì)胞周期、DNA復(fù)制等12個條目中(圖4,封三)。

2.6 Hub基因篩選

通過分析工具String 11.0對這些共同的差異基因構(gòu)建PPI網(wǎng)絡(luò),再利CytoHubba插件,對其互作關(guān)系進(jìn)行MCC算法分析,得到鏈接度最高的10個Hub基因(圖5)。鏈接度由高至低分別為CDK1、CCNA2、RFC4、CCNB1、TOP2A、AURKA、CDC6、BUB1、BUB1B、PLK1。

2.7 關(guān)鍵基因在公共數(shù)據(jù)庫中的驗(yàn)證

將篩選出的10個Hub基因通過GEPIA2網(wǎng)站驗(yàn)證,顯示在TCGA和GTEx數(shù)據(jù)庫中,相對于食管癌旁正常組織,10個基因在食管癌組織中均呈高表達(dá)狀態(tài)(P < 0.01)(圖6),說明其是食管癌的關(guān)鍵差異基因。

3 討論

本研究分析GEO數(shù)據(jù)庫中3個食管鱗癌全基因表達(dá)譜芯片數(shù)據(jù),發(fā)現(xiàn)相對于配對正常食管黏膜組織,共有204個差異基因?yàn)?個芯片數(shù)據(jù)集共有。對其進(jìn)行GO功能注釋發(fā)現(xiàn)其與細(xì)胞周期、有絲分裂、細(xì)胞黏附等生物學(xué)過程相關(guān)。KEGG通路富集分析表明食管鱗癌與小細(xì)胞肺癌、膀胱癌可能具備相同的分子機(jī)制,提示其與細(xì)胞周期、局部黏附、p53信號通路等機(jī)制相關(guān)。

分析以上結(jié)果,發(fā)現(xiàn)GO與KEGG通路富集分析均提示細(xì)胞周期和細(xì)胞黏附可能與食管癌密切相關(guān)。細(xì)胞周期與惡性腫瘤發(fā)生關(guān)系密切,細(xì)胞周期調(diào)控紊亂可以導(dǎo)致細(xì)胞失控性增殖,這也是惡性腫瘤最基本的生物學(xué)特征[14]。p53信號通路參與細(xì)胞周期調(diào)控,誘導(dǎo)G1、G2期阻滯,這與腫瘤的發(fā)生、發(fā)展密切相關(guān)。細(xì)胞黏附在腫瘤侵襲轉(zhuǎn)移過程中發(fā)揮重要作用,腫瘤細(xì)胞發(fā)生黏附特性的改變,使其易從原位細(xì)胞群中解黏附脫離出來,進(jìn)入血液和淋巴循環(huán)系統(tǒng),同時也使腫瘤細(xì)胞到達(dá)靶器官后,更容易與靶器官的基質(zhì)黏附[15]。所以通過公共數(shù)據(jù)庫進(jìn)行大數(shù)據(jù)挖掘與分析,為腫瘤發(fā)病機(jī)制的研究提供方向與思路是可行的。

通過構(gòu)建PPI網(wǎng)絡(luò),得到10個核心差異基因:CDK1、CCNA2、RFC4、CCNB1、TOP2A、AURKA、CDC6、BUB1、BUB1B、PLK1。10個基因中,除RFC4、BUB1、BUB1B基因未見報道外,其余均已有相關(guān)報道。CDK1在細(xì)胞周期中介導(dǎo)細(xì)胞從G2期進(jìn)入M期,是參與細(xì)胞有絲分裂的主要因子[16]。CDK1也是食管癌及癌前病變的診斷、預(yù)后標(biāo)志物和潛在治療靶點(diǎn)[17]。CCNA2與CCNB1與CDK激酶相互作用,參與細(xì)胞周期調(diào)控[18]。TOP2A在調(diào)節(jié)細(xì)胞周期和調(diào)節(jié)腫瘤增殖中起著重要作用,是各種腫瘤進(jìn)展和預(yù)后的潛在生物標(biāo)志物[19]。AURKA是細(xì)胞周期正常發(fā)生的必需蛋白,該基因的突變與多種類型癌癥發(fā)生有關(guān),AURKA在乳腺癌、結(jié)腸直腸、前列腺癌等幾種細(xì)胞系中過表達(dá)[20]。本研究進(jìn)一步驗(yàn)證了這10個基因在TCGA數(shù)據(jù)庫中的表達(dá)情況,結(jié)果顯示其在食管癌樣本中全部高表達(dá),表明它們可能是食管鱗癌的生物標(biāo)志物。雖然本項(xiàng)研究是一種傾向性研究,最終需要大量實(shí)驗(yàn)數(shù)據(jù)的證實(shí),但也為食管癌的發(fā)病機(jī)制研究提供了基礎(chǔ)信息和新的研究方向。

[參考文獻(xiàn)]

[1] ?McGuire S. World Cancer Report 2014 Geneva,Switzerland:World Health Organization,International Agency for Research on Cancer,WHO Press,2015 [J]. Adv Nutr,2016, 7(1):418-419.

[2] ?Edgar R,Domrachev M,Lash AE. Gene expression omnibus:NCBI gene expression and hybridization array data repository [J]. Nucleic Acids Res,2002,30(1):207-210.

[3] ?Ritchie ME,Phipson B,Wu D,et al. limma powers differential expression analyses for RNA-sequencing and microarray studies [J]. Nucleic Acids Res,2015,43(7):e47.

[4] ?Huang da W,Sherman BT,Lempicki RA. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources [J]. Nat Protoc,2009,4(1):44-57.

[5] ?Kanehisa M,Goto S. KEGG:kyoto encyclopedia of genes and genomes [J]. Nucleic Acids Res,2000,28(1):27-30.

[6] ?Maag Jesper LV. Gganatogram:an R package for modular visualisation of anatograms and tissues based on ggplot2 [J]. F1000 Res,2018,7(1):15-76.

[7] ?Chin CH,Chen SH,Wu HH,et al. CytoHubba:identifying hub objects and sub-networks from complex interactome [J]. BMC Syst Biol,2014,8 Suppl 4:S11.

[8] ?Tang Z,Li C,Kang B,et al. GEPIA:a web server for cancer and normal gene expression profiling and interactive analyses [J]. Nucleic Acids Res,2017,45(W1):W98-W102.

[9] ?Consortium GT. The genotype-tissue expression(GTEx)project [J]. Nat Genet,2013,45(6):580-585.

[10] ?Su H,Hu N,Yang HH,et al. Global gene expression profiling and validation in esophageal squamous cell carcinoma and its association with clinical phenotypes [J]. Clin Cancer Res,2011,17(9):2955-2966.

[11] ?Hu N,Clifford RJ,Yang HH,et al. Genome wide analysis of DNA copy number neutral loss of heterozygosity (CNNLOH) and its relation to gene expression in esop-hageal squamous cell carcinoma [J]. BMC Genomics,2010,11(6):576.

[12] ?Lee JJ,Natsuizaka M,Ohashi S,et al. Hypoxia activates the cyclooxygenase-2-prostaglandin E synthase axis [J]. Carcinogenesis,2010,31(3):427-434.

[13] ?Lin G,Chai J,Yuan S,et al. Venn painter:a tool for the comparison and identification of candidate genes based on venn diagrams [J]. PLoS One,2016,11(4):e0154315.

[14] ?Evan GI,Vousden KH. Proliferation,cell cycle and apoptosis in cancer [J]. Nature,2001,411(6835):342-348.

[15] ?Lietha D,Cai X,Ceccarelli DF,et al. Structural basis for the autoinhibition of focal adhesion kinase [J]. Cell,2007, 129(6):1177-1187.

[16] ?Santamaria D,Barriere C,Cerqueira A,et al. Cdk1 is sufficient to drive the mammalian cell cycle [J]. Nature,2007,448(7155):811-815.

[17] ?Hansel D,Dhara S,Huang RC,et al. CDC2/CDK1 expression in esophageal adenocarcinoma and precursor lesions serves as a diagnostic and cancer progression marker and potential novel drug target [J]. Am J Surg Pathol,2005,29(2):390-399.

[18] ?Hayward D,Alfonso-Perez T,Cundell MJ,et al. CDK1-CCNB1 creates a spindle checkpoint-permissive state by enabling MPS1 kinetochore localization [J]. J Cell Biol,2019,218(4):1182-1199.

[19] ?Lee YE,He HL,Lee SW,et al. AMACR overexpression as a poor prognostic factor in patients with nasopharyngeal carcinoma [J]. Tumour Biol,2014,35(8):7983-7991.

[20] ?Nakamura T,Hamada F,Ishidate T,et al. Axin,an inhibitor of the Wnt signalling pathway,interacts with β-catenin,GSK-3b and APC and reduces the β-catenin level [J]. Genes Cells,1998,3(1998):395-403.

(收稿日期:2020-01-13 ?本文編輯:李亞聰)

猜你喜歡
生物信息學(xué)基因芯片
出生時即可預(yù)判發(fā)育潛力 基因芯片精準(zhǔn)篩選肉牛良種
基因芯片技術(shù)在生物研究中的應(yīng)用進(jìn)展
淺談醫(yī)學(xué)院校生物信息學(xué)專業(yè)青年教師規(guī)范培訓(xùn)模式的建立
“PBL+E—learning”教學(xué)模式探索
移動教學(xué)在生物信息學(xué)課程改革中的應(yīng)用
中醫(yī)大數(shù)據(jù)下生物信息學(xué)的發(fā)展及教育模式淺析
數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)中的應(yīng)用
雙管單色熒光PCR法與基因芯片法檢測CYP2C19基因多態(tài)性的比較研究
生物信息學(xué)課堂危機(jī)及對策研究
應(yīng)用基因芯片技術(shù)檢測四種結(jié)核藥物敏感試驗(yàn)的研究
霞浦县| 玛曲县| 泰州市| 九台市| 江阴市| 阜康市| 芜湖市| 黔江区| 江西省| 枣阳市| 拉孜县| 确山县| 息烽县| 赞皇县| 榆社县| 新闻| 隆德县| 文水县| 二连浩特市| 雷州市| 巢湖市| 千阳县| 弥渡县| 平顶山市| 抚顺县| 朝阳区| 平果县| 牡丹江市| 尖扎县| 长泰县| 夏河县| 黄冈市| 秀山| 伊春市| 武汉市| 玛多县| 霞浦县| 栖霞市| 孝昌县| 黑山县| 松桃|