[摘 要] 針對(duì)胰腺癌臨床癥狀隱匿、診斷及治療困難等特點(diǎn),利用生物信息學(xué)技術(shù),旨在鑒定可能參與PC發(fā)生或發(fā)展的差異表達(dá)基因(differentially expressed genes,DEGs),為該疾病的早期診斷和預(yù)防提供理論支持。從GEO數(shù)據(jù)庫(kù)下載3個(gè)與PC相關(guān)的mRNA微陣列數(shù)據(jù)集(GSE41368、GSE91035、GSE43795),并通過(guò)GEO2R篩選DEGs,篩選條件為校正后的p值lt;0.05和|log2 fold change|gt;1.5。對(duì)DEGs進(jìn)行GO和KEGG通路富集分析,構(gòu)建蛋白質(zhì)蛋白質(zhì)互作網(wǎng)絡(luò)并進(jìn)行模塊分析,利用Cytoscape的MCODE插件識(shí)別中心基因,并進(jìn)行生存分析,在其他數(shù)據(jù)庫(kù)中對(duì)感興趣的中心基因進(jìn)行組分表達(dá)和臨床相關(guān)性分析,以探索和驗(yàn)證基因表達(dá)與疾病的關(guān)系,共鑒定出236個(gè)DEGs,揭示其涉及的生物學(xué)功能和過(guò)程,其中20個(gè)基因被鑒定為中心基因。生存分析顯示:PSAT1、CYB5A、GMNN、DDX60、CCL20、ALB、PDIA2高表達(dá)、F8低表達(dá)的胰腺癌患者總生存期較差,CTRC、CLPS、DDX60、CCL20、SYCN、CELA2A、PNLIPRP1、CELA2B高表達(dá)的胰腺癌患者無(wú)復(fù)發(fā)生存期較差。DDX60、CCL20在癌組織與正常組織之間的差異表達(dá)分析顯示,總生存期和無(wú)復(fù)發(fā)生存期分析均存在顯著相關(guān)性,提示它們可能在PC的發(fā)生或發(fā)展中起重要作用。
[關(guān)鍵詞] 生物信息學(xué)分析; 胰腺癌; 差異表達(dá)基因
[中圖分類號(hào)] R735.9" [文獻(xiàn)標(biāo)識(shí)碼] A
在一項(xiàng)流行病學(xué)研究中,48個(gè)國(guó)家的胰腺癌(pancreatic cancer,PC)發(fā)病率和死亡率上升[1]。造成這種現(xiàn)象的原因有多個(gè)[2]:一是胰腺癌在早期沒(méi)有明顯的癥狀;二是胰腺癌出現(xiàn)癥狀被發(fā)現(xiàn)時(shí)往往是疾病晚期;三是由于胰腺隱藏在胃、小腸、肝臟等其他器官后面,很難發(fā)現(xiàn)癥狀。為了促進(jìn)PC的早期檢測(cè),研究PC發(fā)生發(fā)展的分子機(jī)制尤為重要,然而這一機(jī)制目前尚不清楚。
本研究采用基因本體論(gene ontology,GO)和京都基因與基因組百科全書(shū)(kyoto encyclopedia of genes and genomes,KEGG) 途徑富集分析方法,鑒定可能參與PC發(fā)生或發(fā)展的差異表達(dá)基因(differentially expressed genes,DEGs)和中心基因。首先選擇3個(gè)PC相關(guān)基因表達(dá)數(shù)據(jù)集(GSE41368、GSE91035、GSE43795);然后利用GEO2R在線工具篩選PC組織與正常胰腺組織之間的DEGs;第三,應(yīng)用KEGG數(shù)據(jù)庫(kù)和GO分析來(lái)識(shí)別基因產(chǎn)物所涉及的分子功能(molecular functions, MF)、細(xì)胞成分(cellular components, CC)和生物過(guò)程(biological processes, BP)以及相關(guān)通路;第四,使用互作基因檢索工具(search tool for the retrieval of interacting genes, STRING)構(gòu)建DEGs的蛋白質(zhì)蛋白質(zhì)互作(protein-protein interaction,PPI)網(wǎng)絡(luò),并使用注釋、可視化和集成發(fā)現(xiàn)數(shù)據(jù)庫(kù)(database for annotation, visualization, and integrated discovery,DAVID)對(duì)模塊中的DEGs進(jìn)行KEGG通路和GO富集再分析;最后,利用分子復(fù)合體檢測(cè)(molecular complex detection, MCODE)插件鑒定20個(gè)中心基因,并在其他數(shù)據(jù)庫(kù)中探索和驗(yàn)證中心基因表達(dá)與疾病的關(guān)系。
1 材料和方法
1.1 微陣列數(shù)據(jù)集的獲取
在GEO數(shù)據(jù)庫(kù)[3]中下載了GSE41368[4]、GSE91035[5]和GSE43795[6]3個(gè)人源PC基因表達(dá)數(shù)據(jù)集(表1),分別使用GSE41368、GSE91035和GSE43795數(shù)據(jù)集中的6、25、7個(gè)胰腺癌組織,和6、8、5個(gè)正常胰腺組織。
1.2 DEGs的篩選
通過(guò)GEO2R在線工具[7]篩選PC組織與正常胰腺組織之間的DEGs。篩選條件為校正后的p值lt;0.05和|log2 FC(fold change)|gt;1.5。log2 FCgt;1.5的DEGs即為上調(diào)基因,log2 FClt;-1.5的DEGs即為下調(diào)基因。在剔除沒(méi)有相應(yīng)基因符號(hào)的探針集和多基因探針集后,將初步篩選的數(shù)據(jù)以TXT格式導(dǎo)入Venn圖在線制作軟件(http:∥bioinformatics.psb.ugent.be/webtools/Venn/)得到3個(gè)數(shù)據(jù)集中交集上調(diào)或下調(diào)的DEGs。
1.3 KEGG通路和GO富集分析
KEGG是一個(gè)集功能信息、基因組學(xué)和化學(xué)于一體的數(shù)據(jù)庫(kù),它具備在基因組和分子水平上了解生物系統(tǒng)的高級(jí)功能[8]。GO分析是識(shí)別基因產(chǎn)物中所涉及的BP、CC和MF的常用方法[9]。DAVID是一個(gè)可提供全面的功能性注釋工具,幫助理解眾多基因或蛋白質(zhì)背后生物學(xué)意義的在線數(shù)據(jù)庫(kù)[10]。通過(guò)在DAVID數(shù)據(jù)庫(kù)中進(jìn)行富集DEGs的KEGG通路和GO富集分析,探究其生物學(xué)功能。在微生信網(wǎng)站(http:∥www.bioinformatics.com.cn)中繪制氣泡圖。
1.4 PPI網(wǎng)絡(luò)的構(gòu)建和模塊分析
STRING(11.0版本)是一個(gè)搜索已知蛋白相互作用的在線數(shù)據(jù)庫(kù)[11],使用該數(shù)據(jù)庫(kù)初步構(gòu)建了DEGs的PPI網(wǎng)絡(luò)(置信度gt;0.4)。Cytoscape是一款用于網(wǎng)絡(luò)可視化分析的開(kāi)源生物信息學(xué)軟件,可用于蛋白質(zhì)蛋白質(zhì)相互作用、蛋白質(zhì)DNA以及遺傳相互作用的大規(guī)模分析[12]。使用Cytoscape插件MCODE(2.0.0版本)[13]識(shí)別可視化后的PPI網(wǎng)絡(luò)中最重要的模塊(degree cut-off=2, k-core=2, node score cut-off=0.2, max. depth=100)。然后,利用DAVID對(duì)模塊中的DEGs進(jìn)行KEGG通路和GO富集再分析。生物網(wǎng)絡(luò)基因本體工具(biological networks gene ontology tool, BiNGO(3.0.3版本))能以網(wǎng)絡(luò)圖的形式顯示基因的GO富集分析結(jié)果[14]。使用BiNGO對(duì)模塊1和模塊2的生物過(guò)程分析進(jìn)行網(wǎng)絡(luò)構(gòu)建和可視化。
1.5 中心基因的鑒定和分析
通過(guò)MCODE插件,選擇10個(gè)種子基因作為中心基因,并添加10個(gè)下調(diào)最高的交集DEGs作為補(bǔ)充。使用GeneCards數(shù)據(jù)庫(kù)[15]對(duì)20個(gè)中心基因的功能進(jìn)行分析,并使用DAVID對(duì)20個(gè)中心基因進(jìn)行再分析。為驗(yàn)證和探究中心基因表達(dá)與疾病的關(guān)系,采用基因表達(dá)譜交互分析2(gene expression profiling interactive analysis 2, GEPIA 2)[16]對(duì)腫瘤組織與正常組織間20個(gè)中心基因的表達(dá)水平進(jìn)行可視化分析,并進(jìn)行DDX60和CCL20在PC不同病理分期的差異表達(dá)分析。在Kaplan-Meier Plotter[17]數(shù)據(jù)庫(kù)中,使用泛癌數(shù)據(jù)庫(kù)177例胰腺導(dǎo)管腺癌(pancreatic adenocarcinoma, PAAD)的RNA-seq對(duì)中心基因進(jìn)行總生存期和無(wú)復(fù)發(fā)生存期分析[18]。使用Oncomine數(shù)據(jù)庫(kù)完成DDX60和CCL20在癌組織與正常組織間的差異表達(dá)分析[19-20]0。
2 結(jié)果
2.1 胰腺癌中DEGs的篩選和鑒定
3個(gè)GSE數(shù)據(jù)集中共包含38個(gè)PC組織和19個(gè)正常胰腺組織。篩選芯片后,分別從GSE41368、GSE91035和GSE43795中得到853、1787和1458個(gè)DEGs。然后,通過(guò)Venn diagram軟件,在3個(gè)數(shù)據(jù)集中鑒定236個(gè)DEGs,包括133個(gè)上調(diào)基因(log2 FCgt;1.5)和103個(gè)下調(diào)基因(log2 FClt;-1.5)(圖1)。
2.2 DEGs的KEGG通路與GO富集分析
為了探究差異表達(dá)基因所涉及生物學(xué)過(guò)程,了解它在PC中的作用機(jī)理,通過(guò)DAVID軟件對(duì)236個(gè)DEGs進(jìn)行了通路分析和功能富集分析。236個(gè)DEGs的GO分析結(jié)果如圖2所示:上調(diào)的DEGs(圖2a)的BP在細(xì)胞外基質(zhì)組織、細(xì)胞粘附、細(xì)胞運(yùn)動(dòng)等過(guò)程中顯著富集,而下調(diào)的DEGs(圖2b)主要富集在羧酸代謝過(guò)程、脂質(zhì)代謝過(guò)程、維生素代謝過(guò)程中。上調(diào)DEGs的CC主要富集于細(xì)胞外基質(zhì)組分、基膜、細(xì)胞表面和細(xì)胞外泌體,而下調(diào)DEGs主要富集于細(xì)胞外區(qū)、膜結(jié)合囊泡和基外側(cè)質(zhì)膜。上調(diào)DEGs的MF在細(xì)胞外基質(zhì)結(jié)構(gòu)成分和GTPase活性上顯著富集,下調(diào)DEGs在肽酶活性、氨基酸跨膜轉(zhuǎn)運(yùn)體活性、修飾氨基酸跨膜轉(zhuǎn)運(yùn)體活性和脂肪酶活性上顯著富集。
KEGG通路分析結(jié)果顯示:上調(diào)DEGs(圖3a)在甲型流感、黏著斑、PI3K-Akt信號(hào)通路等過(guò)程中顯著富集,下調(diào)DEGs(圖3b)則在胰腺分泌、蛋白質(zhì)消化吸收、脂肪消化吸收等過(guò)程中顯著富集(圖3)。
2.3 PPI網(wǎng)絡(luò)構(gòu)建與模塊分析
使用Cytoscape構(gòu)建了236個(gè)DEGs的PPI網(wǎng)絡(luò)(圖4a)。為了進(jìn)一步分析,采用MCODE獲得2個(gè)最顯著的模塊。模塊1和模塊2中分別鑒定出13個(gè)中心節(jié)點(diǎn)(12個(gè)上調(diào)基因,1個(gè)下調(diào)基因)和12個(gè)中心節(jié)點(diǎn)(均為上調(diào)基因)(圖4b, 4c)。
2.4 模塊1和模塊2的再分析
為了進(jìn)一步了解模塊1和模塊2中DEGs的生物學(xué)分類, 進(jìn)行了GO富集和KEGG通路分析(plt;0.05)。 對(duì)于BP,模塊1中DEGs富集于細(xì)胞周期、 細(xì)胞周期調(diào)控過(guò)程等方面, 模塊2中DEGs富集于I型干擾素信號(hào)通路、 對(duì)病毒的反應(yīng)、 防御反應(yīng)等過(guò)程。對(duì)于CC, 模塊1中的DEGs主要富集在紡錘體、 中心體、 微管細(xì)胞骨架和微管組織中心, 模塊2中的DEGs主要富集在線粒體、 細(xì)胞質(zhì)核周區(qū)和內(nèi)質(zhì)網(wǎng)。 對(duì)于MF, 模塊1中的DEGs僅富集于組蛋白去乙?;附Y(jié)合, 模塊2中的DEGs主要富集于碳水化合物衍生物結(jié)合、 核苷結(jié)合等過(guò)程(圖5、圖6)。
對(duì)于KEGG而言,模塊1中的DEGs沒(méi)有顯著途徑,而模塊2中的DEGs在甲型流感和麻疹中顯著富集。采用Cytoscape的BiNGO插件進(jìn)行模塊1和模塊2的生物過(guò)程分析并可視化(圖7)。圖7中節(jié)點(diǎn)大小代表一個(gè)本體中涉及的基因數(shù)量,節(jié)點(diǎn)顏色深度表示本體修正后的p值。plt;0.05被認(rèn)為有統(tǒng)計(jì)學(xué)意義。
2.5 中心基因的鑒定與分析
共鑒定出20個(gè)中心基因,基因的縮寫(xiě)、全稱及對(duì)應(yīng)的功能如表2所示。
20個(gè)中心基因的KEGG通路富集結(jié)果顯示,5個(gè)基因(PNLIPRP1、CELA2A、CELA2B、CTRL、CEL)在胰腺分泌中顯著富集(表3、圖8)。
為進(jìn)一步驗(yàn)證和探究癌癥患者與正常對(duì)照間中心基因表達(dá)水平,使用GEPIA 2進(jìn)行20個(gè)中心基因在癌癥患者與正常對(duì)照之間的差異表達(dá)分析。結(jié)果顯示:20個(gè)中心基因中有18個(gè)(ALB、CCL20、CD68、CEL、SYCN、CELA2A、CELA2B、CLPS、CTRC、SERPINI2、CTRL、DDX60、PSAT1、GMNN、GP2、KLK1、PDIA2、PNLIPRP1)在PC和正常標(biāo)本中表達(dá)差異顯著(plt;0.01,圖9)。圖9中,與健康人相比,PC患者的中心基因表達(dá)明顯。20個(gè)中心基因中有18個(gè)在PAAD和正常樣本之間表達(dá)顯著(plt;0.01)。圖8中5個(gè)基因(PNLIPRP1、CELA2A、CELA2B、CTRL、CEL)在胰液分泌通路中顯著富集,尤其是在胰腺蛋白酶和脂肪酶中富集。CELA包括CELA2A和CELA2B,PLRP1即PNLIPRP1。
2.6 中心基因的生存分析
為了解中心基因在疾病中的臨床表現(xiàn),使用Kaplan Meier繪圖儀在線工具對(duì)20個(gè)中心基因中的18個(gè)的總生存期和無(wú)復(fù)發(fā)生存期進(jìn)行分析。結(jié)果顯示:PSAT1、CYB5A、GMNN、DDX60、CCL20、ALB、PDIA2高表達(dá)、F8低表達(dá)的PC患者的總生存期明顯較差(圖10, log-rank plt;0.05),而CTRC、CLPS、DDX60、CCL20、SYCN、CELA2A、PNLIPRP1、CELA2B高表達(dá)的PC患者的無(wú)復(fù)發(fā)生存期較差(圖11, log-rank plt;0.05)。
2.7 中心基因的組分表達(dá)和Oncomine分析
在這些中心基因中,DDX60和CCL20在總生存期分析和無(wú)復(fù)發(fā)生存期分析中均顯示出顯著的相關(guān)性,提示它們可能在PC的發(fā)生或發(fā)展中發(fā)揮重要作用(圖10、11)。中心基因表達(dá)與疾病的關(guān)系在其他數(shù)據(jù)庫(kù)中也得到了進(jìn)一步的探索和驗(yàn)證。腫瘤組織與正常組織中DDX60和CCL20的Oncomine分析結(jié)果顯示,兩個(gè)中心基因在不同數(shù)據(jù)集的PC中均顯著過(guò)表達(dá)(圖12)。圖12中,從GEPIA 2中獲得DDX60(A)和CCL20(B)的交互式人體圖(log2(TPM+1)尺度)。紅色為腫瘤樣本,綠色為正常樣本。組織顏色的深度代表基因mRNA的表達(dá)量。在GEPIA 2中獲得DDX60(C)和CCL20(D)所有腫瘤樣本和配對(duì)正常組織點(diǎn)圖(log2(TPM+1)尺度)。紅色的癌癥名稱表示該基因在疾病中的顯著高表達(dá),而綠色的名稱表示該基因顯著低表達(dá)。
運(yùn)用GEPIA 2在線工具,繪制DDX60和CCL20在所有腫瘤樣本和配對(duì)正常組織中的表達(dá)圖譜。結(jié)果顯示,與正常組織相比,DDX60 mRNA在大腦、食管、頸部、胰腺和子宮等組織中均有顯著的高水平表達(dá)(圖13中A、C)。CCL20 mRNA在腦、頸、食道、肺、胃和胰腺等組織中表達(dá)明顯高于相應(yīng)的正常組織(圖13中BD)。DDX60和CCL20的PAAD腫瘤分期的表達(dá)情況顯示,CCL20在不同病理分期的患者中表達(dá)差異有統(tǒng)計(jì)學(xué)意義,而DDX60的表達(dá)差異無(wú)統(tǒng)計(jì)學(xué)意義(圖14)。
3 討論和結(jié)論
從GEO數(shù)據(jù)庫(kù)中篩選出3組PC相關(guān)mRNA微陣列數(shù)據(jù)集,鑒定出236個(gè)DEGs(133個(gè)上調(diào),103個(gè)下調(diào)),分別對(duì)上調(diào)和下調(diào)的DEGs進(jìn)行GO富集分析和KEGG通路富集分析。上調(diào)的DEGs主要富集于細(xì)胞外基質(zhì)組織、細(xì)胞外基質(zhì)成分、結(jié)構(gòu)和甲型流感。下調(diào)的DEGs主要富集于有機(jī)陰離子轉(zhuǎn)運(yùn)、細(xì)胞外區(qū)、肽酶活性和胰腺分泌。細(xì)胞外基質(zhì)成分的變化在腫瘤的發(fā)生發(fā)展中起著重要作用[21]。在腫瘤發(fā)生過(guò)程中,胰腺星狀細(xì)胞被激活并分泌大量的細(xì)胞外基質(zhì)蛋白,進(jìn)而影響腫瘤的侵襲[22]。Abe等人的研究發(fā)現(xiàn),有機(jī)陰離子轉(zhuǎn)運(yùn)肽1B3(OATP1B3)在胰腺癌的mRNA和蛋白水平上均有表達(dá)[23]。PC的腫瘤分化程度越高,金屬蛋白酶的活性越低,其中,金屬蛋白酶2和9作為PC微環(huán)境的重要組成部分,在PC的發(fā)生發(fā)展中也發(fā)揮著重要作用[24]。PC患者的胰液樣本中17種代謝物(L-苯丙氨酸、檸檬酸、L-谷氨酰胺、L-酪氨酸、乙酸、L-色氨酸、L-纈氨酸、琥珀酸、L-亮氨酸、L-異亮氨酸、3-羥基丁酸、甘氨酸、葡萄糖、甲酸、L-丙氨酸、丙酮、乙酰乙酸)的濃度下降[25]。這些代謝物濃度的下降,與通路分析中下調(diào)DEGs富集于胰腺分泌的結(jié)果具有相關(guān)性,提示這些基因的下調(diào)可能引起了下游代謝物水平的變化。GO富集分析結(jié)果顯示,重要模塊的DEGs主要富集于細(xì)胞周期、I型干擾素信號(hào)通路、紡錘極、線粒體和碳水化合物衍生物結(jié)合。研究發(fā)現(xiàn)重要模塊的DEGs主要富集在甲型流感KEGG通路中,故甲型流感可能是急性胰腺炎的原因之一。當(dāng)流感病毒感染人類或哺乳動(dòng)物時(shí),會(huì)導(dǎo)致急性胰腺炎和胰腺損傷[26-27]。研究表明,胰腺細(xì)胞易受H5N1流感病毒感染,從而誘導(dǎo)細(xì)胞凋亡和促炎細(xì)胞因子反應(yīng)[28]。這在一定程度上說(shuō)明A型流感病毒與胰腺疾病相關(guān),具體的發(fā)病機(jī)制有待更深入的研究。
20個(gè)中心基因中,PC標(biāo)本中高表達(dá)的DDX60和CCL20的總生存期和無(wú)復(fù)發(fā)生存期明顯較差。作為一種RNA解旋酶,DDX60在病毒感染后誘導(dǎo)表達(dá),其轉(zhuǎn)錄本在免疫和人類干擾素抗病毒活性中發(fā)揮著重要作用[29]。DDX60可參與病毒核糖核酸降解途徑,促進(jìn)RIG-1樣受體介導(dǎo)的信號(hào)轉(zhuǎn)導(dǎo),在體內(nèi)參與RIG-1介導(dǎo)的先天免疫應(yīng)答[30-31]。另外,DDX60的低表達(dá)可能與乳腺癌患者個(gè)體的放射敏感性密切相關(guān)。由此可見(jiàn),DDX60與癌癥之間存在一定的聯(lián)系。案例研究發(fā)現(xiàn),CCK2R拮抗劑YF476對(duì)小鼠胰腺癌有一定的抑制作用。與未處理的小鼠胰腺相比,YF476處理的小鼠胰腺中DDX60基因表達(dá)下調(diào)[32]。這也在一定程度上說(shuō)明,DDX60與PC的發(fā)生發(fā)展存在一定的關(guān)系。但由于缺乏充分的實(shí)驗(yàn)研究,DDX60在PC發(fā)生或發(fā)展中的具體機(jī)理仍有待探索。作為趨化因子家族的一員,CCL20在炎癥和免疫調(diào)節(jié)中發(fā)揮著重要作用。這些趨化因子可以通過(guò)吸引內(nèi)皮細(xì)胞、啟動(dòng)血管生成或影響癌細(xì)胞的運(yùn)動(dòng)和遷移來(lái)促進(jìn)腫瘤的生長(zhǎng)和轉(zhuǎn)移[33]。多項(xiàng)研究發(fā)現(xiàn),PC組織中CCL20的表達(dá)水平明顯高于健康胰腺組織[34-36]。此外,在IL-17B-IL-17RB信號(hào)通路中,轉(zhuǎn)錄因子NF-κB可上調(diào)CCL20,激活轉(zhuǎn)錄因子2和急性髓系白血病-1蛋白,從而促進(jìn)胰腺細(xì)胞招募巨噬細(xì)胞,提高遠(yuǎn)處器官癌細(xì)胞存活率[37]。CCL20還可能通過(guò)自分泌或旁分泌機(jī)制以及基質(zhì)金屬蛋白酶的上調(diào)促進(jìn)PAAD的增殖、遷移和侵襲[35-36, 38]。可見(jiàn),CCL20在PC細(xì)胞的產(chǎn)生和生存中起著不可或缺的作用。Oncomine分析顯示,與正常組織相比,不同數(shù)據(jù)集DDX60和CCL20在PC中均顯著過(guò)表達(dá)。此外,研究還獲得了DDX60和CCL20在不同疾病中的表達(dá)譜。結(jié)果表明,兩個(gè)中心基因在PC中高度表達(dá)。CCL20的表達(dá)與疾病病理分期有顯著相關(guān)性,而DDX60的表達(dá)與疾病分期無(wú)顯著相關(guān)性。
總之,本研究旨在確定可能參與PC發(fā)生或進(jìn)展的DEGs,共鑒定出236個(gè)DEGs和20個(gè)中心基因,其中DDX60和CCL20具有作為PC診斷的生物標(biāo)志物潛力。然而,這些基因在PC中的生物學(xué)功能還需要通過(guò)進(jìn)一步的實(shí)驗(yàn)來(lái)驗(yàn)證和闡明。
[ 參 考 文 獻(xiàn) ]
[1] HUANG J, LOK V, NGAI C H, et al.Worldwide burden of, risk factors for, and trends in pancreatic cancer [J]. Gastroenterology ,2021, 160:744-754.
[2] BOARD P D Q A T E.Pancreatic cancer treatment (Adult) (PDQ): patient version [C]. In PDQ Cancer Information Summaries. Bethesda (MD): National Cancer Institute (US),2002.
[3] EDGAR R, DOMRACHEV M, LASH A E. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository [J]. Nucleic Acids Res, 2002, 30:207-210.
[4] FRAMPTON A E, L CASTELLANO, T COLOMBO, et al.MicroRNAs cooperatively inhibit a network of tumor suppressor genes to promote pancreatic tumor growth and progression [J]. Gastroenterology ,2014, 146:268-277.
[5] SUTARIA D S, JIANG J, AZEVEDO-POULY A C P, et al. Expression profiling identifies the noncoding processed transcript of hnrnpu with proliferative properties in pancreatic ductal adenocarcinoma [J]. Noncoding RNA ,2017, 3(03), 24.
[6] PARK M, KIM M, HWANG D, et al. Characterization of gene expression and activated signaling pathways in solid-pseudopapillary neoplasm of pancreas [J]. Mod Pathol ,2014, 27:580-593.
[7] DAVIS S, MELTZER P S.Geoquery: a bridge between the gene expression omnibus (GEO) and bioconductor [J]. Bioinformatics, 2007, 23:1846-1847.
[8] KANEHISA M, Goto S. KEGG: kyoto encyclopedia of genes and genomes [J]. Nucleic Acids Res ,2000, 28:27-30.
[9] ASHBURNER M, BALL C A, BLAKE J A, et al. Gene ontology: tool for the unification of biology. the gene ontology consortium [J]. Nat Genet ,2000, 25:25-29.
[10] HUANG DA W, SHERMAN B T, LEMPICKI R A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources [J]. Nat Protoc, 2009, 4:44-57.
[11] SZKLARCZYK D, GABLE A L, LYOD N, ET al. STRING v11: protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets [J]. Nucleic Acids Res ,2019, 47:D607-D613.
[12] SHANNON P, MARKIE A L, OZIER O, et al: Cytoscape: a software environment for integrated models of biomolecular interaction networks [J]. Genome Res ,2003, 13:2498-2504.
[13] BADER G D, HOGUE C W. An automated method for finding molecular complexes in large protein interaction networks [J]. BMC Bioinformatics ,2003, 4:2.
[14] MAERE S, HEYMANS K, KUIPER M. BiNGO: a Cytoscape plugin to assess overrepresentation of gene ontology categories in biological networks [J]. Bioinformatics,2005, 21:3448-3449.
[15] STELZER G, ROSEN N, PLASCHKES I, et al: The genecards suite: from gene data mining to disease genome sequence analyses [J]. Curr Protoc Bioinformatics, 2016, 54:1.30.31-31.30.33.
[16] TANG Z, KANG B, LI C, et al. GEPIA2: an enhanced web server for large-scale expression profiling and interactive analysis [J]. Nucleic Acids Res,2019, 47:556-560.
[17] GYRFFY B.Survival analysis across the entire transcriptome identifies biomarkers with the highest prognostic power in breast cancer [J]. Comput Struct Biotechnol J ,2021, 19:4101-4109.
[18] NAGY, MUNKCSY, GYRFFY G B. Pancancer survival analysis of cancer hallmark genes [J]. Sci Rep,2021, 11:6047.
[19] PEI H, LI L, B FRIDLEY L, et al: FKBP51 affects cancer cell response to chemotherapy by negatively regulating Akt [J]. Cancer Cell ,2009, 16:259-266.
[20] SEGARA D, BIANKIN A V, KENCH J G, et al. Expression of HOXB2, a retinoic acid signaling target in pancreatic cancer and pancreatic intraepithelial neoplasia [J]. Clin Cancer Res, 2005, 11:3587-3596.
[21] JIANG H, HEGDE S, DeNardo D G. Tumor-associated fibrosis as a regulator of tumor immunity and response to immunotherapy [J]. Cancer Immunol Immunother, 2017, 66:1037-1048.
[22] APTE M V, PARK S, PHILLIPS P A, et al: Desmoplastic reaction in pancreatic cancer: role of pancreatic stellate cells [J]. Pancreas,2004, 29:179-187.
[23] ABE T, M UNNO, T ONOGAWA, et al: LST-2, a human liver-specific organic anion transporter, determines methotrexate sensitivity in gastrointestinal cancers [J]. Gastroenterology,2001, 120:1689-1699.
[24] DURLIK M, GARDIAN K. Metalloproteinase 2 and 9 activity in the development of pancreatic cancer [J]. Pol Przegl Chir,2012, 84:377-382.
[25] CORTESE N, CAPRETTI G, BARBAGALLO M, et al. Metabolome of pancreatic juice delineates distinct clinical profiles of pancreatic cancer and reveals a link between glucose metabolism and PD-1(+) Cells [J]. Cancer Immunol Res ,2020, 8:493-505.
[26] KASLOFF S B, PIZZUTO M S, SILIC-BENUSSI M, et al. Oncolytic activity of avian influenza virus in human pancreatic ductal adenocarcinoma cell lines [J]. J Virol ,2014, 88:9321-9334.
[27] CALORE E E, UIP D E, PEREZ N M. Pathology of the swine-origin influenza A (H1N1) flu [J]. Pathol Res Pract, 2011, 207:86-90.
[28] HUO C, XIAO K, ZHANG S, et al. H5N1 Influenza a Virus Replicates Productively in Pancreatic Cells and Induces Apoptosis and Pro-Inflammatory Cytokine Response [J]. Front Cell Infect Microbiol,2018, 8:386.
[29] XIN D, LIU J, GU J, et al. Low Expression of DDX60 Gene Might Associate with the Radiosensitivity for Patients with Breast Cancer [J]. Hindawi Journal of Oncol ,2020:8309492.
[30] MIYASHITA M, OSHIUMI H, MATSUMOTO M, et al: DDX60, a DEXD/H box helicase, is a novel antiviral factor promoting RIG-I-like receptor-mediated signaling [J]. Mol Cell Biol ,2011, 31:3802-3819.
[31] GRNVOGEL O, ESSER-NOBIS K, REUSTLE A, et al: DDX60L Is an Interferon-Stimulated Gene Product Restricting Hepatitis C Virus Replication in Cell Culture [J]. J Virol ,2015, 89:10548-10568.
[32] MOHAMMED A, N B JANAKIRAM, SUEN C, et al: Targeting cholecystokinin-2 receptor for pancreatic cancer chemoprevention [J]. Mol Carcinog,2019, 58:1908-1918.
[33] SCHUTYSER E, STRUYF S, VAN DAMME J. The CC chemokine CCL20 and its receptor CCR6 [J]. Cytokine Growth Factor Rev ,2003, 14:409-426.
[34] RUBIE C, V O FRICK, GHADJAR P, et al: CCL20/CCR6 expression profile in pancreatic cancer [J]. J Transl Med ,2010, 8:45.
[35] KIMSEY T F, CAMPBELL A S, ALBO D, et al.Co-localization of macrophage inflammatory protein-3alpha (Mip-3alpha) and its receptor, CCR6, promotes pancreatic cancer cell invasion [J]. Cancer J 2004, 10:374-380.
[36] KLEEFF J, KUSAMA T, ROSSI D L, et al. Detection and localization of Mip-3alpha/LARC/Exodus, a macrophage proinflammatory chemokine, and its CCR6 receptor in human pancreatic cancer [J]. Int J Cancer ,1999, 81:650-657.
[37] WU H H, HWANG-VERSLUES W W, LEE W H, et al. Targeting IL-17B-IL-17RB signaling with an anti-IL-17RB antibody blocks pancreatic cancer metastasis by silencing multiple chemokines [J]. J Exp Med ,2015, 212:333-349.
[38] CAMPBELL A S, ALBO D, KIMSEY T F, et al. Macrophage inflammatory protein-3alpha promotes pancreatic cancer cell invasion [J]. J Surg Res ,2005, 123:96-101.
Identification of Key Biomarkers in Pancreatic CancerVia Bioinformatic Analysis
DENG Ying, LIU Di, YANG Ning, DENG Wenwen, WANG Jun
(School of Life Science and Health Engineering, Hubei Univ. of Tech.,Wuhan 430068, China)
Abstract: Given that pancreatic cancer (PC) has insidious clinical symptoms and is difficult to diagnose and treat, this study aimed to identify differentially expressed genes (DEGs) that may be involved in the occurrence or development of PC using bioinformatics technology to provide theoretical support for the early diagnosis and prevention of this disease. Three PC-related mRNA microarray datasets (GSE41368, GSE91035, GSE43795) were downloaded from the GEO database, and DEGs were screened by GEO2R with adjusted P value lt; 0.05 and |log2 fold change| gt; 1.5. GO and KEGG pathway enrichment analyses, construction of protein-protein interaction network and modular analysis were performed for DEGs. The hub genes were identified using Cytoscape's MCODE plugin, and survival analysis was performed. In addition, component expression and oncomine analyses of hub genes of interest were performed in different databases to explore and validate the relationship between gene expression and disease. A total of 236 DEGs were identified and revealed the biological functions and processes involved. 20 genes were identified as hub genes. Survival analysis showed that PC patients with high expression of PSAT1, CYB5A, GMNN, DDX60, CCL20, ALB, PDIA2 and low expression of F8 had poorer overall survival, and PC patients with high expression of CTRC, CLPS, DDX60, CCL20, SYCN, CELA2A, PNLIPRP1 and CELA2B had worse relapse free survival. Analysis of the differential expression of DDX60 and CCL20 between cancerous and normal tissues showed significant correlations in both overall and relapse free survival analyses, suggesting that they may play an important role in the development or progression of PC. The identified DEGs and hub genes in this study may provide insight into the molecular mechanisms of PC, which could be useful for early diagnosis and treatment of PC.
Keywords: bioinformatic analysis; pancreatic cancer; differentially expressed genes
[責(zé)任編校: 張 眾]