趙琳 何章彪 張欣 曹翠萍
(1商丘醫(yī)學高等??茖W校,河南 商丘 476000;2南陽醫(yī)學高等??茖W校)
鼻咽癌(NPC)是鼻咽上皮的惡性腫瘤,在東南亞和中國比較普遍〔1,2〕。在流行區(qū),早期NPC患者的5年生存率達95%,晚期NPC患者的生存率僅為60%,70%的初診NPC患者的病情會進一步發(fā)展〔3〕。因此,尋找潛在的識別早期NPC患者的生物標記物對改善患者預后具有重要意義。EB病毒(EBV)DNA檢測目前用于NPC早期患者的篩查,但其對腫瘤篩查的陽性預測值較低(11%)〔4〕。有證據(jù)表明,基因和細胞信號通路,可能參與NPC的發(fā)生和發(fā)展,包括TGF-β信號通路和Notch信號通路〔5〕。NPC進展的分子機制尚不清楚,目前對NPC的早期診斷和治療有限〔6〕。因此,需要進一步研究NPC發(fā)生和發(fā)展的分子機制。
基因芯片是分析基因表達的高通量平臺,可以鑒定參與各種信號通路、分子功能和生物學過程的數(shù)百個差異表達基因(DEGs)〔7〕。本研究從基因表達綜合數(shù)據(jù)庫〔GEO;www.ncbi.nlm.nih.gov/geo;GPL570(HG-U133_Plus_2)Affymetrix Human Genome U133 Plus 2.0 Array〕上下載了GSE64634數(shù)據(jù),以鑒定NPC組織中的DEGs〔8〕。隨后,進行了基因本體論(GO;www.genontology.org)和京都基因與基因組百科全書(KEGG)信號通路富集分析,以確定關(guān)鍵基因的生物學功能和通路〔9〕。這項研究的結(jié)果為NPC的潛在生物標志物提供了新的見解,并可能有助于對NPC發(fā)生和發(fā)展的分子機制的理解。
1.1研究工具和對象 基因表達譜GSE64634從GEO數(shù)據(jù)庫下載。GSE64634是在Affymetrix GPL570平臺〔GPL570(HG-U133_Plus_2)Affymetrix Human Genome U133 Plus 2.0 Array〕的基礎(chǔ)上提出的,由12例NPC標本和4例正常對照(GSM1575894,GSM1575895,GSM1575896,GSM15-75897)組成。應用在線分析工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)對NPC及對應的癌旁組織進行DEGs分析。GEO2R是一個基于R語言程序的數(shù)據(jù)集分析工具,能夠?qū)ο嗤瑢嶒灄l件下的兩組樣品進行對比,篩選DEGs?;虮磉_的差異用差異倍數(shù)(FC)表示。本研究設定的篩選標準分別為P<0.05,|logFC|≥1(篩選表達差異大于等于2倍的DEGs;或P<0.05,|logFC| ≥2 (篩選表達差異≥4倍的DEGs)。所篩選的差異顯著性基因見表1。
1.2基因功能和通路富集分析 Metascape (http://metascape.org/)是一種在線分析工具,用于提取與候選基因列表相關(guān)的生物信息。它不僅可以提供典型的基因功能富集分析,而且可以實現(xiàn)可視化分析,可查看差異顯著性基因的生物功能、信號通路富集等。對篩選出的DEGs進行了GO分析和KEGG通路分析,并利用Metascape工具對篩選的DEGs進行了GO和KEGG通路分析。以P值<0.01為界值,以富集程度評分〔-log10(P)〕進行顯著性排列。
1.3構(gòu)建蛋白質(zhì)相互作用(PPI) 網(wǎng)絡String(http://string-db.org)是一個基于Web的資源,用于檢索基因相互作用的搜索工具,用于預測輸入基因列表的蛋白質(zhì)綜合信息。本研究使用字符串來獲取DEGs的PPI信息,并選擇組合得分大于0.4的相互作用進行研究。在此基礎(chǔ)上,根據(jù)蛋白質(zhì)之間相互作用的信息,利用Cytoscape軟件(Version3.4.0,http://www.cytoscape.org/)構(gòu)建了PPI網(wǎng)絡,并對網(wǎng)絡進行了可視化。使用Cytoscape Plug-in Network Analyzer進行了進一步的分析,并計算了PPI網(wǎng)絡的拓撲性質(zhì)、節(jié)點度。
1.4以MCODE方法分析鼻咽癌的Hub基因 MCODE分析是檢測PPI網(wǎng)絡中緊密連接區(qū)域的一種方法。本研究使用MCODE分析從構(gòu)建的PPI網(wǎng)絡中選取最重要的模塊進行進一步分析。參數(shù)設置:node score cutoff=0.2,K-Core=2,degree cutoff=2。
2.1NPC差異顯著基因的篩選 從GEO公共數(shù)據(jù)庫中選取GSE64634的基因芯片數(shù)據(jù),上傳到GEO2R網(wǎng)絡工具中,篩選正常鼻咽組織和NPC組織之間的DEGs。圖1顯示了DEGs的火山圖。每個顏色點代表一個上調(diào)或下調(diào)的基因,其中綠色表示下調(diào)的基因,紅色表示上調(diào)的基因,黑色表示根據(jù)P值<0.05和|logFC|>1的標準,沒有差異表達的基因。從GSE64634中鑒定出1 014個DEGs,包括191個上調(diào)基因和823個下調(diào)基因。圖2分別描繪了來自GSE64634的上調(diào)和下調(diào)的前10個重要基因的DEGs表達熱圖,基因表達水平用顏色表示,紅色表示高表達,藍色表示低表達。聚類分析表明,在正常鼻咽和NPC組織中,DEGs的表達存在差異。具體差異顯著性基因以表格的形式呈現(xiàn)(表1)。這193個重疊基因被確認為候選DEGs,并用于進一步的分析。
表1 NPC基因芯片GSE64634中篩選出193個差異表達基因
圖1 GSE64634微陣列中的DEGs火山圖
圖2 GSE64634微陣列中前10個差異表達的DEGs mRNA水平的熱圖
2.2DEGs的功能和途徑富集分析 在Metascape數(shù)據(jù)庫的基礎(chǔ)上,對篩選的NPC的候選DEGs的GO功能和KEGG通路進行了富集分析。以P值為<0.01、最小重疊基因=3和最小富集因子>1.5作為設置標準。如圖3所示,DEGs富集分析主要集中在纖毛運動、體液免疫應答、抗菌體液反應、藥物代謝-細胞色素P450、花生四烯酸代謝過程、鞭毛的精子能動性、化學致癌性、金屬離子運輸、適應性免疫反應的負調(diào)控等方面,這些基因之間的功能彼此緊密地聯(lián)系在一起,并聚集成完整的網(wǎng)絡(圖4)。圖4顯示了KEGG途徑的富集分析。每個條帶代表一個豐富項或通路,根據(jù)-log 10P值著色,網(wǎng)絡的豐富條件和途徑,節(jié)點代表豐富的術(shù)語或途徑,節(jié)點大小表示所涉及的DEGs的數(shù)量。共享同一個集群的節(jié)點通常彼此靠近,顯示的邊界越粗,相似度就越高。
2.3PPI網(wǎng)絡構(gòu)建 將篩選的獲得的差異基因輸入STRING網(wǎng)站,構(gòu)建PPI網(wǎng)絡(圖5),并進一步應用Cytoscape軟件中的分子復合物檢測(MCODE)分析對PPI網(wǎng)絡中連接最為緊密的基因進行分組,形成多個模塊。結(jié)果顯示共有3個模塊評分較高(圖2)。其中評分最高的模塊1中共包含了SNRPG,SNRPE,DDX42,SF3A3,DDX46,BUD31,SF3B6,U2AF2,SF3B5,SF3B3,PHF5A,SNRPD3,SF3A2,SNRPA1,SNRPB2,SF3B1,SF3B4,SNRPD2,PRPF6,SF3A1,PRPF31,SNRPA,SNRPB,SNRPD1,SF3B2等25個基因,共形成了300種相互作用關(guān)系,具有較高連接度,為中心(Hub)基因。
1~13:纖毛運動、體液免疫反應、抗菌體液反應、藥物代謝細胞色素P450、花生四烯酸代謝過程、鞭毛精子存活率、化學致癌、輔助因子轉(zhuǎn)運、金屬離子轉(zhuǎn)運、營養(yǎng)水平的細胞反應、成肌細胞融合、適應免疫反應的負調(diào)控、SLC介導的跨膜轉(zhuǎn)運;圖4同圖3 DEGs富集分析
圖4 KEGG途徑的富集分析
圖5 DEGs對應的蛋白質(zhì)相互作用緊密連接度最高的3個模塊
NPC是頭頸部最常見的鱗狀細胞腫瘤之一〔5,10〕。Ⅰ期患者的5年生存率為95%。然而,Ⅳ期患者的5年存活率略高于60%〔11〕。因此,了解NPC進展的病因和分子機制對于診斷和治療至關(guān)重要〔12〕。微陣列技術(shù)已被廣泛應用于預測癌癥的潛在治療靶點,包括結(jié)直腸癌〔13〕。在此之前,Wang等〔14〕分析了GSE12452數(shù)據(jù)集,發(fā)現(xiàn)細胞周期蛋白(cyclin)B1、黏蛋白1、細胞表面相關(guān)和乙醛脫氫酶1家族成員A1可能與EBV相關(guān)的NPC有關(guān)。GSE12452序列分析表明,CXC基序趨化因子配體(CXCL)9、ZIC家族成員2、前列腺素內(nèi)過氧化物合成酶2、纖維連接蛋白1、CXCL10和 ovo 樣轉(zhuǎn)錄抑制因子1可能在NPC中發(fā)揮作用。在本研究中,通過生物信息學分析篩選了20個上調(diào)和173個下調(diào)的DEGs。KEGG通路富集分析和GO功能注釋結(jié)果顯示,上調(diào)表達的DEGs主要富集于依賴DNA的DNA復制、細胞分裂、調(diào)節(jié)參與炎癥反應的細胞因子的產(chǎn)生、抗原處理和肽抗原通過MHC Ⅱ類遞呈和胚胎骨骼系統(tǒng)發(fā)育,而表達下調(diào)的DEGs主要參與纖毛運動、微管運動、鞭毛精子活力、纖毛或鞭毛依賴的細胞運動和動脈內(nèi)皮細胞分化,膠質(zhì)細胞增殖、趨化因子介導的信號通路、軟骨細胞增殖、肌動蛋白絲聚合、神經(jīng)遞質(zhì)分解代謝過程。已有研究表明,NPC細胞的侵襲、轉(zhuǎn)移、增殖和凋亡可能受特異性基因表達上調(diào)或下調(diào)的影響。這個結(jié)果與癌細胞的侵襲和轉(zhuǎn)移與異常的細胞黏附和細胞分裂密切相關(guān)的事實是一致的〔15〕。此外,癌細胞的增殖和凋亡與依賴DNA的DNA復制的異常密切相關(guān)。因此,分析所涉及的信號通路為理解腫瘤增殖提供新的見解。
本研究中構(gòu)建了一個PPI網(wǎng)絡來識別25個最重要的Hub基因。這25個基因形成300種相互作用關(guān)系將其緊密聯(lián)系在一起,構(gòu)成一個相對獨立的網(wǎng)絡,并可能通過拮抗或協(xié)同作用起到相似的生物學功能。進一步GO分析發(fā)現(xiàn),DDX42參與調(diào)控細胞凋亡的過程,通過與TP53BP2相互作用參與細胞存活,可以抵消TP53BP2的凋亡刺激活性。沒有白細胞介素(IL)-3的誘導會引起細胞凋亡,過表達DDX42可以保護Ba/F3細胞免受這種影響,過表達DDX42通過影響IL-3誘導細胞骨架重排來調(diào)節(jié)細胞極化〔16〕。U2AF2可以負性調(diào)控蛋白泛素化。U2AF2在原發(fā)性非小細胞肺癌組織中也顯著上調(diào),并且與腫瘤轉(zhuǎn)移,晚期腫瘤分期,腫瘤患者不良預后和復發(fā)顯著相關(guān)〔17〕。而且癌癥相關(guān)突變與U2AF2剪接因子的功能密切關(guān)聯(lián)〔18〕。U2AF2介導的CD44亞型會導致體外黑素瘤遷移,體內(nèi)黑色素瘤轉(zhuǎn)移至肺和肝〔19〕。SNRPD3、SNRPB參與蛋白質(zhì)甲基化作用〔20〕。SNRPB在非小細胞肺癌中的表達異常,并且與非小細胞肺癌不良預后相關(guān)。在小鼠前列腺癌移植模型中,SNRPB被鑒定為轉(zhuǎn)移抑制基因〔21〕。敲除SNRPB改變了與膠質(zhì)母細胞瘤發(fā)展相關(guān)的關(guān)鍵基因/途徑〔受體酪氨酸激酶(RTK),磷脂酰肌醇3-激酶(PI3K),絲裂原活化蛋白激酶(MAPK),轉(zhuǎn)化(RAS),絲氨酪/蘇氨酸激酶(AKT),成視網(wǎng)膜細胞瘤(RB),p53〕〔22〕。SNRPA1參與IL-12介導的信號通路。SNPRA1是一種剪接體組分,負責將前mRNA加工成mRNA,對男性生育至關(guān)重要。SNRPA1與TCF7L2(Wnt信號通路的轉(zhuǎn)錄因子)與rs386772267的等位基因結(jié)合,增加胰腺癌患病風險。SNRPA1對腎癌和卵巢癌的預后不良〔23〕。SNRPA1影響結(jié)直腸癌細胞周期,增殖和遷移。SF3B1積極調(diào)控基因表達,參與表觀遺傳作用,SF3B1在鼻竇黑色素瘤中出現(xiàn)7%的突變,是鼻竇黑色素瘤潛在的致癌因子〔24〕。
綜上所述,通過GSE64634基因芯片篩查出的DDX42、U2AF2、SNRPB、SNRPA1,SF3B1等5個基因在多種腫瘤中表達異常,并已明確在某些特定腫瘤的發(fā)生發(fā)展中扮演著重要的角色。這5個基因位于NPC DEGs構(gòu)成的表達譜網(wǎng)絡中的關(guān)鍵節(jié)點位置,可作為NPC發(fā)生過程中的關(guān)鍵Hub基因,為進一步研究NPC發(fā)生發(fā)展的分子機制及分子標志物的篩選提供指導。