黃琪峰,鄭琳琳,張菁
摘要:目的 ?基于生物信息學分析篩選肺腺癌靶基因及評估預后價值。方法 ?對三個數(shù)據(jù)集(GSE118370、GSE32863、TCGA-LUAD)分別使用limma和edgeR包篩選出肺腺癌差異表達基因,對共同差異基因進行功能富集分析,通過String數(shù)據(jù)庫構建蛋白質-蛋白質相互作用(PPI)網(wǎng)絡,采用Cytoscape進行可視化分析并用其插件cytoHubba來篩選關鍵基因,采用Kaplan-Meier曲線進行總體生存分析。結果 ?共224個共同差異基因,其中上調(diào)基因34個,下調(diào)基因190個。共同差異基因在血管生成、白細胞調(diào)節(jié)、免疫反應等生物學過程富集。通過從PPI網(wǎng)絡中篩選出8個關鍵基因,分別為IL6、VWF、PECAM1、SPP1、CDH5、CXCL12、TIMP1、CLDN5。生存分析顯示,PECAM1與LUAD的預后有關。腫瘤組織中PECAM1表達高于正常組織,差異有統(tǒng)計學意義(P<0.05)。結論 ?PECAM1是一種與肺腺癌預后相關的新的生物標志物,有望成為肺腺癌的一個治療的靶點。
關鍵詞:肺腺癌;差異表達基因;生物標志物;生物信息學分析
中圖分類號:R734.2 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? DOI:10.3969/j.issn.1006-1959.2019.22.020
文章編號:1006-1959(2019)22-0062-04
Bioinformatics Analysis of Screening Lung Adenocarcinoma Target Genes and
Evaluating Prognostic Value
HUANG Qi-feng1,ZHENG Lin-lin2,ZHANG Jing1
(Department of Pharmacy1,Department of Ultrasound2,Sir Run Run Shaw Hospital,Zhejiang University School of Medicine,
Hangzhou 310000,Zhejiang,China)
Abstract:Objective ?To screen the target genes of lung adenocarcinoma based on bioinformatics analysis and evaluate the prognostic value. Methods ?Three data sets (GSE118370, GSE32863, TCGA-LUAD) were used to screen differentially expressed genes in lung adenocarcinoma using limma and edgeR packages, functional enrichment analysis of common differential genes, and protein-protein interactions were constructed by String database. PPI) network, using Cytoscape for visual analysis and using its plug-in cytoHubba to screen key genes, Kaplan-Meier curve for overall survival analysis. Results ?A total of 224 common differential genes, including 34 up-regulated genes and 190 down-regulated genes. Common differential genes are enriched in biological processes such as angiogenesis, leukocyte regulation, and immune response. Eight key genes were screened from the PPI network, namely IL6, VWF, PECAM1, SPP1, CDH5, CXCL12, TIMP1, and CLDN5. Survival analysis showed that PECAM1 was associated with the prognosis of LUAD. The expression of PECAM1 in tumor tissues was higher than that in normal tissues,the difference was statistically significant (P<0.05). Conclusion ?PECAM1 is a new biomarker related to the prognosis of lung adenocarcinoma and is expected to be a target for the treatment of lung adenocarcinoma.
Key words:Lung adenocarcinoma;Differentially expressed genes;Biomarkers;Bioinformatics analysis
肺癌(lung cancer)是常見的惡性腫瘤,根據(jù)2018年全球癌癥統(tǒng)計數(shù)據(jù)顯示,肺癌占癌癥總發(fā)生病例的11.6%,其死亡率占癌癥導致死亡人數(shù)的18.4%[1]。肺腺癌是肺癌的一種,屬于非小細胞肺癌,一般起源于細小支氣管粘膜上皮,少數(shù)起源于大支氣管的粘液腺,疾病發(fā)生的確切機制目前尚不明確[2]。肺腺癌的前期診斷以及預后預測均較困難,一些治療方案對提高患者生存率的作用并不明顯,因此深入了解肺腺癌發(fā)生機制對于預防肺腺癌非常重要。而早期肺癌生物標志物的篩選及其在肺癌發(fā)生發(fā)展中的作用、機制和應用研究對該病的早期診斷、治療和預后評價具有重要意義[4]。基因芯片是一種高通量和系統(tǒng)性的研究技術,能檢測和分析不同組織的差異表達基因。研究發(fā)現(xiàn)[5,6],肺癌中存在不同類型的生物標志物,包括編碼基因、miRNAs、長非編碼RNAs和circRNAs,這些分子的失調(diào)均參與了腫瘤的進展或與患者的預后相關。本研究利用TCGA數(shù)據(jù)庫和GEO數(shù)據(jù)庫,篩選出肺腺癌的差異表達基因,利用GO-KEGG富集分析、PPI網(wǎng)絡分析等方法探索與肺腺癌進展有關的生物標志物,現(xiàn)報道如下。
1資料與方法
1.1數(shù)據(jù)下載 ?從TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)下載肺腺癌患者癌組織和癌旁組織的基因表達數(shù)據(jù);從GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)下載基因表達譜數(shù)據(jù)(GSE118370、GSE32863),共123例正常樣本和599例肺腺癌樣本。
1.2數(shù)據(jù)處理 ?利用R語言程序包對下載的數(shù)據(jù)進行處理,篩選出肺腺癌和癌旁組織表達差異的基因,并對三個數(shù)據(jù)集篩選出的差異表達基因用韋恩圖取交集。篩選標準:Log2∣差異倍數(shù)(FC)∣>1,P<0.05。
1.3基因富集分析 ?利用DAVID(https://david.ncifcrf.gov/)對共同的差異表達基因進行功能注釋,包括分子功能、細胞組成與生物過程的GO功能富集分析,F(xiàn)DR<0.05表示差異有統(tǒng)計學意義。
1.4差異基因編碼蛋白間相互作用的分析 ?通過在線分析網(wǎng)站STRING(https://string-db.org/)得到差異表達基因的蛋白互作網(wǎng)絡,將所得源文件導入Cytoscape進行可視化分析,用插件cytoHubba進行Hub基因分析,選用其中6種算法,選取前10個關鍵基因。
1.5生存分析 ?下載TCGA-LUAD的臨床信息,通過Cox比例風險模型調(diào)整相對危險度后,采用GraphPad Prism7繪制Kaplan-Meier生存曲線,P<0.05表示差異有統(tǒng)計學意義。
1.6 GEPIA數(shù)據(jù)庫分析 ?核心基因表達通過GEPIA數(shù)據(jù)庫(http://gepia. cancer-pku.cn/)分析核心基因在泛癌中組織與正常組織的基因表達差異。
2結果
2.1初步篩查 ?GSE118370中上調(diào)基因和下調(diào)基因分別為301個和1784個;GSE32863中上調(diào)基因和下調(diào)基因分別為194個和417個;TCGA-LUAD中上調(diào)基因和下調(diào)基因分別為3713個和1813個。并根據(jù)3個數(shù)據(jù)集的差異表達基因制作韋恩圖,最終獲得共同差異表達基因224個,其中上調(diào)基因34個,下調(diào)基因190個,見圖1。
2.2 GO富集分析 ?DAVID網(wǎng)站對224個差異表達基因的GO富集分析結果顯示,差異基因在生物過程(BP)中參與血管生成、對缺氧反應、白細胞調(diào)節(jié)、免疫反應、受體內(nèi)化;細胞成分(CC)主要表現(xiàn)為細胞外區(qū)和質膜的整體部分;分子功能(MF)包括參與肝素、轉化生長因子β、糖胺聚糖的結合過程,見圖2。
2.3 PPI網(wǎng)絡構建和目的基因的篩選 ?根據(jù)cytoHubba的6種算法,對每種算法的前10個基因進行取交集,最終得到8個目的基因,分別為IL6、VWF、PECAM1、SPP1、CDH5、CXCL12、TIMP1、CLDN5,見表1。
2.4生存分析結果 ?PECAM1與LUAD的預后有關(P<0.05),低表達的PECAM1患者預后更差,見圖3。
2.5腫瘤組織與正常組織中PECAM1表達比較 ?腫瘤組織中PECAM1表達高于正常組織,差異有統(tǒng)計學意義(P<0.05),見圖4。
3討論
肺腺癌又被稱為非鱗狀肺癌,是一種非小細胞肺癌,也是最常見的肺癌類型。非小細胞肺癌占肺癌的80%,其中約50%為腺癌。根據(jù)肺腺癌的階段,肺腺癌的治療包括手術,化療,放療,免疫治療等,取得了較大的進展,但是預后仍然不太理想[7]。肺腺癌與肺部慢性感染有關,其發(fā)病機制主要有直接擴散、血行轉移、支氣管內(nèi)播散、淋巴轉移等,而基因組分析可對肺腺癌發(fā)生機制進行全面洞察,還可發(fā)現(xiàn)一些新的肺腺癌預后和治療的潛在生物標志物。
本研究中對3個數(shù)據(jù)集(GSE118370、GSE32863和TCGA-LUAD)共123例正常樣本和599例肺腺癌樣本進行分析,最終發(fā)現(xiàn)共有224個共同的差異表達基因,其中190個下調(diào)基因,34個上調(diào)基因。GO富集分析結果顯示,差異基因在生物過程(BP)中參與血管生成、對缺氧反應、白細胞調(diào)節(jié)、免疫反應、受體內(nèi)化等;細胞成分(CC)主要表現(xiàn)為細胞外區(qū)和質膜的整體部分;分子功能(MF)包括參與肝素、轉化生長因子β、糖胺聚糖的結合過程。表明腫瘤的發(fā)病機制是一個由特定基因和表觀遺傳變化驅動的復雜生物學過程,多基因的異常調(diào)控可通過不同的機制促進肺腺癌的發(fā)生和發(fā)展。
為了進一步篩選關鍵基因,本研究利用string構建了一個由224個節(jié)點、447條邊組成的蛋白質-蛋白質互作網(wǎng)絡,利用cytoscape對該網(wǎng)絡可視化,并用cytoHubba插來篩選目的基因。根據(jù)6種不同算法得到每種算法的前10個關鍵基因,再對這6種方法得到的關鍵基因取交集,分別為IL6、VWF、PECAM1、SPP1、CDH5、CXCL12、TIMP1、CLDN5關鍵基因,其中VWF、SPP1、CDH5已在其他文獻中有過報道[8,9]。本研究對PECAM1進行生存曲線分析,結果表明PECAM1的表達與LUAD患者的預后有關(P<0.05),低表達的PECAM1患者的預后更差。另有研究發(fā)現(xiàn),PECAM1在多種腫瘤中與正常組織存在差異表達,如卵巢癌[10]、淋巴瘤[11]、肝癌[12]、胃癌[13]、白血病[14]、結腸癌[15]等。PECAM-1,也稱為CD31,是一種130 KDa的糖蛋白,是免疫球蛋白(Ig)超家族的成員,表達于內(nèi)皮細胞(EC)、白細胞和血小板4,能夠與自身以及其他非PECAM分子相互作用,并與粘附和信號傳導有關,對于內(nèi)皮細胞的遷移及血管生成具有重要作用[16,17]。在腫瘤生長過程中,腫瘤血管的生成過程受多種血管生成因子和血管生產(chǎn)抑制物的調(diào)控[18],而PECAM1作為常見的黏附蛋白在血管生成過程中起著重要的作用。本研究中,腫瘤組織中PECAM1表達高于正常組織,差異有統(tǒng)計學意義(P<0.05),說明PECAM1可能成為肺腺癌的治療靶點,值得進一步深入探究。
綜上所述,肺腺癌的發(fā)生發(fā)展受復合基因網(wǎng)絡通過不同的生物學途徑進行調(diào)控,PECAM1是該網(wǎng)絡中的核心基因,與肺腺癌的預后相關,有望成為有效抑制肺腺癌的靶點。但本研究尚存在不足之處:①缺乏對關鍵基因的進一步實驗驗證;②由于只分析了三個數(shù)據(jù)集,樣本量較小,需要更大的樣本研究來證實本次研究;③肺腺癌與諸多因素密切相關,在本次研究中沒有分析病因;④生存分析中只對TCGA中594個樣本進行分析,還需要進一步的實驗證實肺腺癌的具體分子生物學機制。
參考文獻:
[1]Bray F,F(xiàn)erlay J,Soerjomataram I,et al.Global cancer statistics 2018:GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J].CA Cancer J Clin,2018,68(6):394-424.
[2]Cho J,Choi SM,Lee J,et al.Proportion and clinical features of never-smokers with non-small cell lung cancer[J].Chin J Cancer,2017,36(1):20.
[3]全斌,喻艷林.肺結核合并肺癌的發(fā)生機制研究進展[J].山東醫(yī)藥,2015,55(24):104-106.
[4]Guo T,Ma H,Zhou Y.Bioinformatics analysis of microarray data to identify the candidate biomarkers of lung adenocarcinoma[J].Peer J,2019(7):e7313.
[5]Di X,Jin X,Li R,et al.CircRNAs and lung cancer:Biomarkers and master regulators[J].Life Sci,2019(220):177-185.
[6]Vargas AJ,Harris CC.Biomarker development in the precision medicine era:lung cancer as a case study[J].Nat Rev Cancer,2016,16(8):525-537.
[7]Hanna N,Johnson D,Temin S,et al.Systemic Therapy for Stage IV Non-Small-Cell Lung Cancer:American Society of Clinical Oncology Clinical Practice Guideline Update Summary[J].J Oncol Pract,2017,13(12):832-837.
[8]Piao J,Sun J,Yang Y,et al.Target gene screening and evaluation of prognostic values in non-small cell lung ?cancers by bioinformatics analysis[J].Gene,2018(647):306-311.
[9]高強,鐘英英,丁華杰,等.肺腺癌相關基因的生物信息學分析[J].中國腫瘤生物治療雜志,2019,26(2):190-195.
[10]Rask L,Hogdall CK,Kjaer SK,et al.Association of CD31 and p53 With Survival of Ovarian Cancer Patients[J].Anticancer Res,2019,39(2):567-576.
[11]Molinsky J,Klánová M,Maswabi B,et al.In vivo growth of mantle cell lymphoma xenografts in immunodeficient mice is positively regulated by VEGF and associated with significant up-regulation of CD31/PECAM1[J].Folia Biol (Praha),2013,59(1):26-31.
[12]Mas VR,Maluf DG,Archer KJ,et al.Genes involved in viral carcinogenesis and tumor initiation in hepatitis C virus-induced hepatocellular carcinoma[J].Mol Med,2009,15(3-4):85-94.
[13]袁梅琴,王增,王海洋,等.血清PECAM-1和IGF-1水平與晚期胃癌臨床病理特征及預后的相關性研究[J].中華全科醫(yī)學,2018(7):1051-1053.
[14]Haslinger C,Schweifer N,Stilgenbauer S,et al.Microarray gene expression profiling of B-cell chronic lymphocytic leukemia subgroups defined by genomic aberrations and VH mutation status[J].J Clin Oncol,2004,22(19):3937-3949.
[15]Skrzypczak M,Goryca K,Rubel T,et al.Modeling oncogenic signaling in colon tumors by multidirectional analyses of microarray data directed for maximization of analytical reliability[J].PLoS One,2010,5(10):e13091.
[16]Lertkiatmongkol P,Liao D,Mei H,et al.Endothelial functions of platelet/endothelial cell adhesion molecule-1 (CD31)[J].Curr Opin Hematol,2016,23(3):253-259.
[17]Umezawa Y,Akiyama H,Okada K,et al.Molecular mechanisms for enhancement of stromal cell-derived factor 1-induced chemotaxis by platelet endothelial cell adhesion molecule 1 (PECAM-1)[J].J Biol Chem,2017,292(48):19639-19655.
[18]Khan I,Bhardwaj M,Shukla S,et al.Carvacrol encapsulated nanocarrier/ nanoemulsion abrogates angiogenesis by downregulating COX-2,VEGF and CD31 in vitro and in vivo in a lung adenocarcinoma model[J].Colloids Surf B Biointerfaces,2019(181):612-622.
收稿日期:2019-9-9;修回日期:2019-9-23
編輯/杜帆