曾成, 祁國萍, 沈穎,2, 陸文斌,2, 鄧建忠,2, 劉遷,2, 金建華,2
(1. 江蘇大學(xué)附屬武進(jìn)醫(yī)院腫瘤科,江蘇 常州 213017;2. 徐州醫(yī)科大學(xué)武進(jìn)臨床學(xué)院腫瘤科,江蘇 常州 213017)
結(jié)直腸癌是常見的消化道惡性腫瘤,其全球發(fā)病率僅次于乳腺癌、肺癌,居第3位,死亡率居癌癥相關(guān)死亡的第2位[1]。目前認(rèn)為結(jié)腸癌與遺傳、環(huán)境、飲食、炎癥性腸病、性別、種族等相關(guān)[2],但其發(fā)病確切分子機(jī)制尚不清楚,臨床亦缺乏早期診斷和預(yù)后判斷的分子標(biāo)志物?;诟咄繙y(cè)序及基因芯片技術(shù)的快速發(fā)展,有研究者通過生物信息學(xué)方法篩選結(jié)腸癌的潛在核心基因[3-4],但由于數(shù)據(jù)集和篩選方法不同,篩選結(jié)果存在差異。本研究通過分析GEO數(shù)據(jù)庫中結(jié)腸癌數(shù)據(jù)集,篩選結(jié)腸癌核心基因,利用TCGA數(shù)據(jù)庫驗(yàn)證核心基因表達(dá)水平并做生存分析,最后通過體外實(shí)驗(yàn)探討預(yù)后相關(guān)基因?qū)Y(jié)腸癌細(xì)胞增殖的影響,旨在獲得更多與結(jié)腸癌發(fā)生發(fā)展相關(guān)的潛在核心基因。
從GEO數(shù)據(jù)庫(www.ncbi.nlm.nih.gov/geo/)中下載數(shù)據(jù)集,篩選條件:人類結(jié)腸癌全基因組表達(dá)譜數(shù)據(jù),樣本中包含結(jié)腸癌組織及癌旁組織,樣本量>50。本研究選擇GSE23878、GSE37182和GSE74602數(shù)據(jù)集進(jìn)行后續(xù)分析。GSE23878數(shù)據(jù)集基于GPL570平臺(tái),包含結(jié)腸癌組織35例,癌旁組織24例;GSE37182數(shù)據(jù)集基于GPL6947平臺(tái),包含結(jié)腸癌組織84例,癌旁組織88例;GSE74602數(shù)據(jù)集基于GPL6104平臺(tái),包含結(jié)腸癌組織30例,癌旁組織30例。
人結(jié)腸癌HCT116、SW620細(xì)胞購自中國科學(xué)院上海生物化學(xué)與細(xì)胞研究所。DMEM、RPMI 1640培養(yǎng)基、胎牛血清均為美國Gibco公司產(chǎn)品;pECMV、pECMV-AURKA、pEGFP、pEGFP-TIMP1質(zhì)粒由淼靈質(zhì)粒平臺(tái)構(gòu)建;轉(zhuǎn)染試劑TurboFect Transfection、兔抗人Aurora A蛋白激酶(AURKA)一抗、兔抗人β-肌動(dòng)蛋白一抗、山羊抗兔二抗、MTT試劑盒、5×上樣緩沖液、細(xì)胞裂解液均購自上海生工生物工程有限公司;兔抗人基質(zhì)金屬蛋白酶抑制物1(TIMP1)一抗購自武漢三鷹生物技術(shù)有限公司;ECL化學(xué)發(fā)光液購自合肥蘭杰柯科技有限公司;BCA蛋白定量試劑盒購自上海碧云天生物技術(shù)有限公司。
在R軟件(版本:4.0.2)中利用ggplot2、limma、pheatmap等軟件包處理3個(gè)數(shù)據(jù)集。差異表達(dá)基因(differentially expressed genes,DEGs)篩選標(biāo)準(zhǔn)如下:錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)校正后P值<0.05,且|log2FC|>1。倍數(shù)變化(fold change,F(xiàn)C)表示DEGs的差值倍數(shù)。對(duì)3個(gè)數(shù)據(jù)集篩選出的DEGs取交集,利用VennDiagram軟件包作韋恩圖,得到共有DEGs。
在R軟件(版本:4.0.2)中利用clusterProfiler、org.Hs.eg.db、enrichplot、ggplot2等軟件包對(duì)共有DEGs進(jìn)行基因本體論(gene ontology,GO)富集分析和京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)信號(hào)通路分析,GO富集分析包括分子功能、生物學(xué)過程及細(xì)胞組成。
利用STRING(https://string-db.org/)在線數(shù)據(jù)庫對(duì)共有DEGs構(gòu)建蛋白質(zhì)相互作用(protein-protein interaction, PPI)網(wǎng)絡(luò),設(shè)置有效結(jié)合分?jǐn)?shù)>0.4。隨后將PPI網(wǎng)絡(luò)導(dǎo)入Cytoscape軟件(版本:3.7.2),利用CytoHubba插件篩選核心基因。CytoHubba插件中有EPC、BottleNeck、EcCentricity、Closeness、Radiality、Betweenness、Stress、ClusteringCoefficient、MCC、DMNC、MNC和Degree 共12種分析方法[5]。每種分析方法選擇前10個(gè)基因,所有基因按照在12種分析方法中出現(xiàn)次數(shù)進(jìn)行排序,最后選擇出現(xiàn)次數(shù)最多的10個(gè)基因作為核心基因,并構(gòu)建核心基因的PPI網(wǎng)絡(luò)。
利用基于TCGA數(shù)據(jù)庫的GEPIA在線網(wǎng)站(http://gepia.cancer-pku.cn/ index.html)驗(yàn)證核心基因在結(jié)腸癌及癌旁組織表達(dá)水平,并對(duì)核心基因進(jìn)行生存分析。
在37 ℃、5% CO2條件下,將HCT116、SW620細(xì)胞分別置于含10%胎牛血清DMEM、RPMI 1640培養(yǎng)基中培養(yǎng)。取對(duì)數(shù)生長期細(xì)胞接種于6孔板,待細(xì)胞融合度達(dá)80%時(shí),按照轉(zhuǎn)染說明書,將pECMV(空載體)、pECMV-AURKA、pEGFP(空載體)、pEGFP-TIMP1質(zhì)粒各2 μg分別轉(zhuǎn)染HCT116和SW620細(xì)胞。
收集“1.7”轉(zhuǎn)染48 h后各組細(xì)胞,加入含1% PMSF的RIPA裂解液,冰上裂解30 min;4 ℃、15 000 r/min離心20 min后取上清液,BCA法行蛋白定量;加入5×上樣緩沖液,100 ℃沸水浴5 min;分別取40 μg樣品行SDS-PAGE,80 V分離蛋白;200 mA 90 min冰上轉(zhuǎn)PVDF膜;5%脫脂牛奶室溫封閉2 h;PBST洗膜3次,5 min/次;加入相應(yīng)的用5% 脫脂牛奶稀釋的一抗β-肌動(dòng)蛋白(1 ∶4 000,內(nèi)參)、AURKA和TIMP1(均為1 ∶1 000), 4 ℃孵育過夜;PBST洗膜3次,5 min/次;加入用PBS稀釋的二抗(1 ∶5 000)室溫孵育1 h;PBST洗膜3次,5 min/次;用ECL化學(xué)發(fā)光液暗室曝光;用Image J 軟件處理分析蛋白條帶。
取“1.7”轉(zhuǎn)染后各組細(xì)胞懸液接種于96孔板,每孔2×103個(gè),每組5個(gè)復(fù)孔。5% CO2、37 ℃分別培養(yǎng)24、48、72 h,每孔加入20 μL MTT(5 mg/mL),37 ℃孵育4 h;棄上清液,每孔加入150 μL二甲基亞砜,置搖床上低速振蕩10 min,待結(jié)晶物充分溶解,于酶聯(lián)檢測(cè)儀490 nm波長處測(cè)定光密度(D)值,計(jì)算細(xì)胞增殖率。細(xì)胞增殖率(%)=(實(shí)驗(yàn)組D值-空白組D值)/(對(duì)照組D值-空白組D值)×100%。
通過R軟件分析,GSE23878數(shù)據(jù)集DEGs 1 411個(gè),其中上調(diào)基因502個(gè),下調(diào)基因909個(gè);GSE37182數(shù)據(jù)集DEGs 627個(gè),其中上調(diào)基因261個(gè),下調(diào)基因366個(gè);GSE74602數(shù)據(jù)集DEGs 1 485個(gè),其中上調(diào)基因816個(gè),下調(diào)基因669個(gè)。3個(gè)數(shù)據(jù)集DEGs通過VennDiagram軟件包取交集后得到270個(gè)共有DEGs(圖1)。
圖1 DEGs韋恩圖
GO富集分析結(jié)果顯示,共有DEGs生物學(xué)過程主要與生長負(fù)調(diào)控、細(xì)胞外基質(zhì)組織、細(xì)胞外結(jié)構(gòu)組織等相關(guān);細(xì)胞組成主要富集于含膠原的細(xì)胞外基質(zhì)、收縮纖維、肌節(jié)等;分子功能主要富集于受體配體活性、信號(hào)轉(zhuǎn)導(dǎo)受體激活劑、糖胺聚糖結(jié)合等。KEGG信號(hào)通路富集結(jié)果表明,共有DEGs主要與礦物質(zhì)吸收、Wnt、緊密連接、NF-κB、細(xì)胞周期、細(xì)胞黏附分子等信號(hào)通路相關(guān)。見圖2。
圖2 共有DEGs的GO富集分析及KEGG信號(hào)通路分析
利用STRING數(shù)據(jù)庫對(duì)共有DEGs進(jìn)行PPI網(wǎng)絡(luò)分析,結(jié)果顯示,PPI網(wǎng)絡(luò)具有明顯的交互作用(P<1.0×10-16)。將結(jié)果導(dǎo)入Cytoscape軟件(圖3A),利用插件CytoHubba中的12種算法篩選出重復(fù)次數(shù)最多的前10個(gè)核心基因,由于第11個(gè)基因重復(fù)出現(xiàn)的次數(shù)和第10個(gè)基因重復(fù)出現(xiàn)的次數(shù)相同,本研究也將其納入核心基因,故最終獲得11個(gè)核心基因。核心基因在12種算法中重復(fù)出現(xiàn)次數(shù)如下:MYC8次、基質(zhì)金屬蛋白酶抑制物1(TIMP1)6次、泛素偶聯(lián)酶E2C(UBE2C)5次、小窩蛋白1(CAV1)5次、Y 染色體中性別決定區(qū)相關(guān)的高遷移率組框9(SOX9)5次、C-X-C型趨化因子配體12(CXCL12) 5次、Aurora A蛋白激酶(AURKA) 4次、Ⅰ型膠原蛋白α1鏈(COL1A1)4次、細(xì)胞周期分裂蛋白20(CDC20)4次、DNA拓?fù)洚悩?gòu)酶Ⅱα(TOP2A)4次、著絲粒蛋白F(CENPF)4次。11個(gè)核心基因重新導(dǎo)入STRING數(shù)據(jù)庫后構(gòu)建核心基因的PPI網(wǎng)絡(luò)(圖3B),結(jié)果顯示有明顯交互作用(P=7.66×10-7)。
A:共有DEGs的PPI網(wǎng)絡(luò);B:核心基因的PPI網(wǎng)絡(luò)
GEPIA在線網(wǎng)站包含TCGA數(shù)據(jù)庫中275例結(jié)腸癌組織和41例癌旁組織相關(guān)信息。11個(gè)核心基因通過GEPIA網(wǎng)站驗(yàn)證顯示,其中MYC、TIMP1、UBE2C、SOX9、AURKA、COL1A1、CDC20、TOP2A和CENPF共9個(gè)基因在結(jié)腸癌中呈高表達(dá),而CAV1和CXCL12在結(jié)腸癌中呈低表達(dá),差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖4。
圖4 核心基因在結(jié)腸癌和癌旁組織表達(dá)水平的驗(yàn)證
此外,本研究也利用該網(wǎng)站對(duì)核心基因進(jìn)行生存分析,發(fā)現(xiàn)TIMP1表達(dá)與結(jié)腸癌患者總體生存期(overall survival,OS)呈顯著負(fù)相關(guān)(P<0.05),即TIMP1在結(jié)腸癌樣本中表達(dá)越高,結(jié)腸癌患者OS越短,AURKA表達(dá)與結(jié)腸癌患者OS呈顯著正相關(guān)(P<0.05),而COL1A1表達(dá)與結(jié)腸癌患者無病生存期呈顯著負(fù)相關(guān)(P<0.05),見圖5。
圖5 3個(gè)核心基因的生存分析
為進(jìn)一步驗(yàn)證影響結(jié)腸癌患者OS相關(guān)基因(TIMP1和AURKA)在結(jié)腸癌細(xì)胞中的功能,本研究分別將pECMV,pECMV-AURKA,pEGFP,pEGFP-TIMP1質(zhì)粒轉(zhuǎn)染入HCT116和SW620細(xì)胞。蛋白質(zhì)印跡結(jié)果顯示,HCT116、SW620細(xì)胞pECMV-AURKA組AURKA蛋白相對(duì)表達(dá)量顯著高于相應(yīng)pECMV組(P均<0.01);HCT116、SW620細(xì)胞 pEGFP-TIMP1組TIMP1蛋白表達(dá)相對(duì)量顯著高于相應(yīng)pEGFP 組(P均<0.01),見圖6。MTT結(jié)果顯示,HCT116、SW620細(xì)胞pECMV-AURKA 組72 h細(xì)胞增殖能力明顯高于pECMV組(t=4.039,5.731,P均<0.05),24、48 h兩組間差異無統(tǒng)計(jì)學(xué)意義。HCT116細(xì)胞 pEGFP-TIMP1組48、72 h細(xì)胞增殖能力明顯高于pEGFP組(t=11.716,5.673,P均<0.01),24 h兩組間差異無統(tǒng)計(jì)學(xué)意義。SW620細(xì)胞pEGFP-TIMP1組72 h細(xì)胞增殖能力明顯高于pEGFP組(t=5.920,P<0.01),24、48 h兩組間差異無統(tǒng)計(jì)學(xué)意義(圖7)。
圖6 蛋白質(zhì)印跡檢測(cè)HCT116和SW620細(xì)胞中AURKA和TIMP1蛋白表達(dá)
a:P<0.05,與同時(shí)間點(diǎn)pECMV組比較;b:P<0.01, 與同時(shí)間點(diǎn)pEGFP組比較
本研究通過下載GEO數(shù)據(jù)庫中GSE23878、GSE37182和GSE74602數(shù)據(jù)集,經(jīng)分析獲得270個(gè)共有DEGs。GO富集和KEGG信號(hào)通路分析顯示這些基因主要與生長負(fù)調(diào)控、受體配體活性、信號(hào)轉(zhuǎn)導(dǎo)受體激活劑、Wnt信號(hào)通路、NF-κB信號(hào)通路、細(xì)胞周期信號(hào)通路等有關(guān)。在篩選核心基因時(shí),為了減少單一算法的局限性,本研究充分利用CytoHubba軟件中12種算法,將每一種算法的前10個(gè)核心基因按照重復(fù)出現(xiàn)的次數(shù)進(jìn)行排序,選取重復(fù)次數(shù)最多的11個(gè)核心基因(MYC、TIMP1、UBE2C、CAV1、SOX9、CXCL12、AURKA、COL1A1、CDC20、TOP2A和CENPF)進(jìn)行后續(xù)驗(yàn)證分析。為了驗(yàn)證GEO數(shù)據(jù)集篩選結(jié)果的準(zhǔn)確性,將11個(gè)核心基因通過基于TCGA數(shù)據(jù)庫的GEPIA在線網(wǎng)站進(jìn)行驗(yàn)證,結(jié)果顯示11個(gè)核心基因在TCGA數(shù)據(jù)庫的表達(dá)水平與GEO數(shù)據(jù)庫篩選結(jié)果一致,其中MYC、TIMP1、UBE2C、SOX9、AURKA、COL1A1、CDC20、TOP2A和CENPF在結(jié)腸癌中高表達(dá),而CAV1和CXCL12在結(jié)腸癌中低表達(dá)。
MYC蛋白是一種轉(zhuǎn)錄因子,在眾多腫瘤中發(fā)揮重要作用。UBE2C蛋白是泛素-蛋白酶體系統(tǒng)的重要組成部分,UBE2C高表達(dá)與多種腫瘤不良預(yù)后相關(guān)[6],但其在結(jié)腸癌中的分子機(jī)制研究較少。CAV1蛋白是細(xì)胞膜主要支架蛋白,CAV1在結(jié)腸癌細(xì)胞中過表達(dá)能夠引起啟動(dòng)子CpG位點(diǎn)低甲基化,進(jìn)而促進(jìn)細(xì)胞增殖[7]。SOX9蛋白是轉(zhuǎn)錄因子SOX家族成員之一,陳玉昌等[8]研究顯示,SOX9 mRNA和蛋白表達(dá)在結(jié)腸癌組織中均上調(diào),且SOX9蛋白與腫瘤的分化程度、TNM分期和淋巴轉(zhuǎn)移有關(guān)。CXCL12蛋白是與CXCR4(G蛋白偶聯(lián)受體)特異性結(jié)合的一種趨化因子,CXCL12/CXCR4信號(hào)與多種腫瘤的侵襲、遷移密切相關(guān)[9-10]。TOP2A蛋白是一種酶蛋白,與細(xì)胞增殖、凋亡及有絲分裂相關(guān)。研究顯示,TOP2A敲減可通過影響凋亡蛋白(Bcl-2、Bax)、侵襲相關(guān)蛋白(MMP2、MMP9)表達(dá)抑制結(jié)腸癌細(xì)胞的增殖和侵襲[11]。CENPF蛋白是著絲粒蛋白家族成員之一,在有絲分裂及腫瘤中起重要作用,被認(rèn)為是結(jié)腸腺癌的新型分子標(biāo)志物[12]。CDC20蛋白是細(xì)胞周期相關(guān)蛋白,其異常表達(dá)使有絲分裂發(fā)生錯(cuò)誤,從而導(dǎo)致一些癌基因的過表達(dá)及抑癌基因的失活,最終抑制腫瘤細(xì)胞凋亡和促進(jìn)腫瘤細(xì)胞增殖、侵襲、轉(zhuǎn)移[13]。有研究顯示,CDC20高表達(dá)與結(jié)腸癌的臨床分期、病理分化程度和TNM分期有關(guān),且CDC20高表達(dá)結(jié)腸癌患者OS較CDC20低表達(dá)患者短[14]。本研究顯示,CDC20高表達(dá)與結(jié)腸癌患者OS無統(tǒng)計(jì)學(xué)意義(P>0.05),這可能與采用不同的生存分析方法有關(guān)。因此,CDC20對(duì)結(jié)腸癌患者預(yù)后的影響有待進(jìn)一步研究。
COL1A1蛋白是膠原蛋白家族成員之一,是細(xì)胞外基質(zhì)重要組成成分,COL1A1過表達(dá)可導(dǎo)致結(jié)腸癌細(xì)胞上皮-間質(zhì)轉(zhuǎn)化,進(jìn)而促進(jìn)結(jié)腸癌細(xì)胞肝轉(zhuǎn)移[15]。本研究顯示COL1A1高表達(dá)與結(jié)腸癌患者無病生存期呈負(fù)相關(guān),與丁志祥等[4]研究結(jié)果一致。AURKA蛋白在細(xì)胞有絲分裂過程中起重要作用,是調(diào)節(jié)細(xì)胞周期關(guān)鍵分子。研究顯示,使用AURKA蛋白抑制劑Alisertib可顯著抑制MYC驅(qū)動(dòng)的結(jié)腸癌細(xì)胞增殖[16],也能促進(jìn)KRAS驅(qū)動(dòng)的結(jié)腸癌細(xì)胞死亡[17]。本研究顯示AURKA過表達(dá)能夠促進(jìn)結(jié)腸癌細(xì)胞增殖,但AURKA高表達(dá)結(jié)腸癌患者OS卻更長,這可能與AURKA高表達(dá)增加結(jié)腸癌細(xì)胞化療敏感性有關(guān)[18]。AURKA在結(jié)腸癌中呈高表達(dá),可作為結(jié)腸癌的預(yù)后標(biāo)志物[19]。TIMP1蛋白是組織金屬蛋白酶抑制劑-1,在抑制金屬蛋白酶介導(dǎo)的細(xì)胞外基質(zhì)轉(zhuǎn)化方面發(fā)揮重要作用,進(jìn)而參與腫瘤的侵襲和轉(zhuǎn)移。研究表明,TIMP1敲除后能夠通過FAK-PI3K/AKT 和 MAPK信號(hào)通路抑制結(jié)腸癌細(xì)胞的增殖和轉(zhuǎn)移,且與TNM分期、無病生存期、血管侵犯以及淋巴結(jié)轉(zhuǎn)移有關(guān)[20]。本研究通過生物信息學(xué)發(fā)現(xiàn)TIMP1表達(dá)量越高的結(jié)腸癌患者OS越短,MTT實(shí)驗(yàn)顯示結(jié)腸癌細(xì)胞中過表達(dá)TIMP1能夠顯著促進(jìn)細(xì)胞增殖,該結(jié)果與相關(guān)報(bào)道[20]一致,故認(rèn)為TIMP1蛋白可能為潛在的結(jié)腸癌分子標(biāo)志物。
綜上所述,本研究通過生物信息學(xué)方法篩選出可能的結(jié)腸癌核心基因,包括MYC、TIMP1、UBE2C、CAV1、SOX9、CXCL12、AURKA、COL1A1、CDC20、TOP2A和CENPF,其中AURKA和TIMP1表達(dá)變化與結(jié)腸癌患者預(yù)后相關(guān),但仍需更多實(shí)驗(yàn)研究進(jìn)行驗(yàn)證。