陳林波,李先鵬,姜昊,曾麗麗,鄭靜蕾,許豐
(寧波市鄞州人民醫(yī)院,浙江 寧波 315040,1.消化內(nèi)科;2.感染科;3.內(nèi)鏡中心)
原發(fā)性肝癌是一種消化系統(tǒng)常見的惡性腫瘤,我國每年因肝癌死亡的人數(shù)在所有惡性腫瘤中位居第三[1]。雖然近年來肝癌的治療方式發(fā)展迅速,但患者5年生存率仍不容樂觀,全世界范圍內(nèi)每年約有75萬人因肝癌死亡[2]。近年來基因芯片技術(shù)的快速發(fā)展在研究腫瘤基因表達(dá)譜和尋找腫瘤關(guān)鍵基因中發(fā)揮重要作用[3]。本研究從GEO(Gene Expression Omnibus)數(shù)據(jù)庫下載包含正常癌旁組織、肝硬化組織、肝癌組織的基因芯片(GSE45050),利用生物信息學(xué)技術(shù)篩選出肝癌相關(guān)差異表達(dá)基因,之后進(jìn)行功能富集分析并構(gòu)建蛋白-蛋白相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò),進(jìn)一步篩選出關(guān)鍵基因并進(jìn)行驗證,為闡明肝癌的發(fā)病機(jī)制提供重要理論依據(jù)。
1.1 芯片數(shù)據(jù)來源 本研究從GEO(https∶//www.ncbi.nlm.nih.gov/geo/)數(shù)據(jù)庫下載基因芯片數(shù)據(jù)集GSE45050,芯片總共包含16例樣本,其中3例正常癌旁組織,2例脂肪肝組織,5例肝硬化組織和6例肝細(xì)胞肝癌組織,其芯片平臺是GPL6244[HuGene-1_0-st] Affymetrix Human Gene 1.0 ST Array[transcript (gene) version]。
1.2 DEGs篩選 用R語言軟件讀取下載矩陣文件,使用limma包[4]對正常癌旁組織和肝癌組織、肝硬化組織和肝癌組織進(jìn)行分析,分別得到各自差異表達(dá)基因(differentially expressed genes,DEGs)。DEGs篩選標(biāo)準(zhǔn):log2基因表達(dá)差異倍數(shù)(foldchange,F(xiàn)C)絕對值≥1,adjust P<0.05。
1.3 DEGs的GO和KEGG分析 通過DAVID(the Database for Annotation,Visualization and Integrated Discovery,https∶//david.ncifcrf.gov/)數(shù)據(jù)庫[5]對DEGs行基因本體論(Gene Ontology,GO)和KEGG(Kyoto Encyclopedia of Genes and Genomes)信號通路分析,得到DEGs的生物學(xué)過程分析結(jié)果和KEGG信號通路分析結(jié)果,P<0.05為差異有統(tǒng)計學(xué)意義。
1.4 DEGs的PPI網(wǎng)絡(luò)構(gòu)建和關(guān)鍵基因篩選驗證 通過在線分析網(wǎng)站STRING(Search Tool for the Rtrieval of Interacting Genes,https∶//string-db.org/)[6]得到DEGs的PPI網(wǎng)絡(luò),篩選條件為combined score>0.4,之后進(jìn)一步用Cytoscape[7]篩選出PPI網(wǎng)絡(luò)中處于關(guān)鍵位置的前10個基因,并在GEPIA(Gene Expression Profiling Interactive Analysis,http∶//gepia.cancerpku.cn/)[8]數(shù)據(jù)庫行大樣本驗證,篩選出肝癌中可能發(fā)揮關(guān)鍵作用的基因。
2.1 篩選DEGs 將正常癌旁組織和肝癌組織比較后,總共篩選出350個DEGs(用DEGs1表示),其中在肝癌組織中上調(diào)的有106個,肝癌組織中下調(diào)的有244個。肝硬化組織和肝癌組織比較后共得到223個DEGs(用DEGs2表示),其中肝癌組織中上調(diào)55個,下調(diào)168個。分別對DEGs1和DEGs2進(jìn)行聚類分析,其結(jié)果分別如圖1A和圖1B所示。
圖1 肝癌DEGs分析
2.2 DEGs的GO和KEGG分析結(jié)果 將DEGs1和DEGs2取交集后得到共同DEGs(見圖2),對共同DEGs行GO分析,結(jié)果顯示其生物學(xué)過程(biological process,BP)主要和端粒合成、DNA復(fù)制、基因表達(dá)調(diào)控等密切相關(guān)(見圖3A),KEGG分析結(jié)果顯示共同DEGs涉及信號通路主要為礦物質(zhì)吸收、系統(tǒng)性紅斑狼瘡、腫瘤細(xì)胞碳代謝等過程(見圖3B)。
圖2 篩選共同DEGs
圖3 DEGs的功能注釋
2.3 DEGs的PPI網(wǎng)絡(luò)分析結(jié)果 將共同DEGs導(dǎo)入STRING和Cytoscape進(jìn)行分析后得到PPI網(wǎng)絡(luò),該網(wǎng)絡(luò)由36個節(jié)點蛋白和139條相互作用關(guān)系構(gòu)成,最終篩選出處于關(guān)鍵位置的10個基因(見圖4),分別是DNA拓?fù)洚悩?gòu)酶IIα(DNA topoisomerase II alpha,TOP2A)、著絲粒蛋白F(centromere protein F,CENPF)、異常紡錘體微管裝配(abnormal spindle microtubule assembly,ASPM)、NIMA相關(guān)蛋白激酶2(NIMA related kinase 2,NEK2)、細(xì)胞周期蛋白A2(cyclin A2,CCNA2)、細(xì)胞質(zhì)分裂調(diào)控蛋白1(protein regulator of cytokinesis 1,PRC1)、母系胚胎亮氨酸拉鏈蛋白激酶(maternal embryonic leucine zipper kinase,MELK)、細(xì)胞周期蛋白B2(cyclin B2,CCNB2)、RacGTP酶激活蛋白1(Rac GTPase activating protein 1,RACGAP1)、核仁紡錘體相關(guān)蛋白1(nucleolar and spindle associated protein 1,NUSAP1)。
圖4 DEGs的PPI網(wǎng)絡(luò)構(gòu)建和關(guān)鍵基因篩選(關(guān)鍵基因用紅色、橙色、黃色標(biāo)
2.4 10個共同DEGs篩選并驗證 用GEPIA數(shù)據(jù)庫進(jìn)一步驗證10個關(guān)鍵基因在肝癌中的表達(dá)情況,發(fā)現(xiàn)10個關(guān)鍵基因均在肝癌組織中高表達(dá),生存分析結(jié)果顯示它們的高表達(dá)均和患者不良預(yù)后密切相關(guān)。其中ASPM、NUSAP1、RACGAP1與肝癌相關(guān)的報道相對較少,對三者驗證結(jié)果進(jìn)行展示,ASPM、NUSAP1和RACGAP1在肝癌組織中mRNA表達(dá)水平明顯升高,其結(jié)果如圖5所示,圖6結(jié)果顯示三者高表達(dá)均與肝癌患者不良預(yù)后有關(guān)。
圖5 肝癌組織關(guān)鍵基因表達(dá)情況驗證結(jié)果
圖6 肝癌患者生存分析驗證結(jié)果
肝癌的發(fā)生發(fā)展是一個多分子、多步驟、多因素的動態(tài)生物學(xué)過程,目前人們對其發(fā)生機(jī)制的了解依然十分有限。典型的肝癌會經(jīng)歷肝炎-肝硬化-肝癌這樣一個演進(jìn)過程,在這過程中會不斷出現(xiàn)基因突變和表觀遺傳學(xué)改變,這些改變進(jìn)一步導(dǎo)致細(xì)胞生物學(xué)功能異常,最終引起細(xì)胞癌變。以往的研究大多局限在單個基因?qū)δ[瘤的影響,但在細(xì)胞癌變過程中往往涉及多個基因的改變,并且這些基因之間能夠相互作用,通過調(diào)控網(wǎng)絡(luò)發(fā)揮作用[9],因此在多基因水平研究癌癥基因表達(dá)譜有助于我們更好地探索發(fā)病機(jī)制?;蛐酒鳛樾乱淮咄繖z測技術(shù),可以同時檢測上萬個基因的表達(dá)水平,是一種研究基因組和基因間相互作用的強(qiáng)有力工具。
本研究首先比較正常癌旁組織和肝癌組織中的基因表達(dá)情況,共篩選出350個DEGs。之后又對肝硬化組織和肝癌組織進(jìn)行比較,共發(fā)現(xiàn)223個DEGs。為了更好地了解那些在肝癌發(fā)生中始終處于表達(dá)異常狀態(tài)的基因,我們將2組DEGs取交集,得到154個共同DEGs?;蛲蛔兂?dǎo)致細(xì)胞功能改變,對154個DEGs行功能富集分析發(fā)現(xiàn)主要涉及細(xì)胞端粒合成、DNA復(fù)制、基因表達(dá)調(diào)控,而信號通路分析顯示它們參與礦物質(zhì)吸收、系統(tǒng)性紅斑狼瘡、腫瘤細(xì)胞碳代謝等過程。之后我們利用STRING和Cytoscape構(gòu)建DEGs的PPI網(wǎng)絡(luò),進(jìn)而篩選出最關(guān)鍵的10個基因,分別是TOP2A、CENPF、ASPM、NEK2、CCNA2、PRC1、MELK、CCNB2、RACGAP1、NUSAP1。
查閱文獻(xiàn)后我們發(fā)現(xiàn)這10個關(guān)鍵基因編碼的蛋白質(zhì)大部分參與細(xì)胞周期進(jìn)展,也有部分屬于蛋白激酶,通過影響蛋白質(zhì)修飾發(fā)揮作用。比如CCNA2和CCNB2是比較著名的細(xì)胞周期蛋白,兩者在細(xì)胞周期進(jìn)展中必不可少,本研究結(jié)果顯示兩者均在肝癌組織中高表達(dá),并且高表達(dá)的患者總體生存率更低,這和目前已有的報道[10-11]結(jié)果相似。TOP2A的主要功能是在DNA復(fù)制和轉(zhuǎn)錄過程中維持染色體拓?fù)錉顟B(tài),通過催化DNA雙鏈斷裂和重連,控制細(xì)胞周期進(jìn)展[12],目前在人類多種癌癥中的作用已經(jīng)被研究得較為透徹,比如胃癌、結(jié)直腸癌、前列腺癌、肝癌、乳腺癌等,也因此被廣泛用于癌癥治療[13]。作為著絲粒蛋白家族成員之一,CENPF最主要的功能就是調(diào)控細(xì)胞分裂。目前的研究表明CENPF是一個明確的癌基因。在肝癌方面,已經(jīng)有學(xué)者發(fā)現(xiàn)CENPF有成為肝癌早期診斷標(biāo)志物的潛能,和甲胎蛋白(alpha fetoprotein,AFP)聯(lián)合更是能顯著提高肝癌診斷率[14]。另外,ASPM、PRC1、NUSAP1也均和細(xì)胞分裂密切相關(guān),其中PRC1在肝癌中相關(guān)研究較多,促癌功能也較為明確[15],但ASPM和NUSAP1的研究相對較少,目前的報道認(rèn)為兩者在肝癌中表達(dá)水平明顯升高并且和患者不良預(yù)后有關(guān)[16-17],這和我們的分析結(jié)果相符,此外ASPM還被認(rèn)為與肝硬化進(jìn)展為肝癌密切相關(guān)[18],這更加說明其在肝正常組織-肝硬化-肝癌這一過程中的關(guān)鍵作用。MELK和NEK2雖然屬于蛋白激酶家族,但兩者最終也是通過影響細(xì)胞周期發(fā)揮作用。MELK最初一直被認(rèn)為是包括肝癌在內(nèi)的癌細(xì)胞所必須的一種蛋白質(zhì)[19],但利用CRISPR/Cas9基因編輯系統(tǒng)敲除MELK基因后發(fā)現(xiàn)并未對癌細(xì)胞產(chǎn)生任何影響[20]。NEK2在肝癌中也存在研究結(jié)果相反的報道[21-22],促癌或是抑癌,仍需要進(jìn)一步研究去闡明,而我們的研究結(jié)果更支持NEK2和MELK是癌基因。RACGAP1屬于GTP酶激活蛋白家族,目前認(rèn)為其在腫瘤中廣泛高表達(dá)并且發(fā)揮促癌作用,但和肝癌相關(guān)的報道極少,僅有WANG等[23]研究發(fā)現(xiàn)RACGAP1在肝癌組織中表達(dá)明顯升高,并且腫瘤患者中那些具有高復(fù)發(fā)風(fēng)險的患者表達(dá)水平更高,這預(yù)示其具有成為肝癌預(yù)后判斷標(biāo)志物的可能,但目前缺少功能和機(jī)制研究。
本研究共篩選出10個肝癌相關(guān)關(guān)鍵基因,有的目前被研究得較為透徹,比如TOP2A已經(jīng)用于癌癥臨床治療;有的基因正在從實驗室走向臨床,比如CENPF和PRC1表現(xiàn)出可用于肝癌診斷和治療的潛能;也有一些基因目前所了解的仍十分有限,例如ASPM、NUSAP1、RACGAP1仍需要更多實驗去深入探索??偠灾瑢@些關(guān)鍵基因的研究將使我們在肝癌早期診治上擁有更多的選擇。