紀(jì)珊珊 王思月 胡文倩 張雪梅 張志
1華北理工大學(xué)附屬唐山工人醫(yī)院腫瘤內(nèi)二科 河北唐山 063000;2華北理工大學(xué)公共衛(wèi)生學(xué)院
2020年全球癌癥統(tǒng)計(jì)結(jié)果顯示,肺癌新發(fā)病例和死亡病例均位居第二位[1],嚴(yán)重威脅人類健康和生存質(zhì)量。肺癌分為非小細(xì)胞肺癌(non-small cell lung cancer,NSCLC)和小細(xì)胞肺癌(small-cell lung cancer, SCLC)兩大類,其中SCLC只占肺癌總數(shù)的15%[2]。SCLC經(jīng)一線化療后具有高復(fù)發(fā)和高轉(zhuǎn)移率的特點(diǎn),經(jīng)二線化療后具有低有效率和短緩解期的特點(diǎn),使得SCLC的5年生存率較低,預(yù)后較差。尋找SCLC發(fā)病過程中的關(guān)鍵基因,對于理解其發(fā)病機(jī)制進(jìn)而為發(fā)現(xiàn)可能的診斷或預(yù)后生物標(biāo)記物提供重要的理論依據(jù)。
基因表達(dá)陣列作為一種高通量、高效的基因組技術(shù),已廣泛應(yīng)用于研究重大疾病相關(guān)的關(guān)鍵基因[3]。SCLC的發(fā)生發(fā)展過程必然伴隨著特定基因表達(dá)的變化。隨著基因測序技術(shù)的發(fā)展,海量表達(dá)數(shù)據(jù)被提交到公共數(shù)據(jù)平臺供廣大研究人員使用。本研究旨在使用公共數(shù)據(jù)平臺提供的SCLC基因表達(dá)數(shù)據(jù)篩選與SCLC發(fā)生發(fā)展密切相關(guān)的關(guān)鍵基因,為后續(xù)生物學(xué)功能研究提供分子靶標(biāo)。
1.1數(shù)據(jù)來源 基因表達(dá)綜合數(shù)據(jù)庫(Gene Expression Omnibus,GEO)是由美國國立生物信息中心創(chuàng)建并維護(hù)的大型基因表達(dá)數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo),可提供經(jīng)芯片、二代測序和高通量測序產(chǎn)生的海量基因表達(dá)數(shù)據(jù)。在數(shù)據(jù)庫中提取含有SCLC癌組織和癌旁組織基因表達(dá)數(shù)據(jù)信息的數(shù)據(jù)集GSE43346(23個癌組織和43個正常組織)和GSE40275(15個癌組織和43個正常組織)用于后續(xù)分析。
1.2SCLC差異基因篩選及數(shù)據(jù)處理 使用GEO2R在線程序分析SCLC癌組織和正常肺組織之間的差異表達(dá)基因(differentially expressed genes,DEGs),篩選條件為P<0.01,∣Log2FC∣>2,并用GraphPad Prism作圖軟件(版本8.0)對DEGs進(jìn)行可視化分析繪制火山圖。使用維恩(Venn)作圖工具(https://bioinfogp.cnb.csic.es/tools/venny/)將兩個數(shù)據(jù)集中表達(dá)上調(diào)或下調(diào)的基因分別取交集,篩選出共同的上調(diào)或下調(diào)的共有DEGs。
1.3GO富集分析和KEGG通路分析 DAVID富集分析數(shù)據(jù)庫(https://david.ncifcrf.gov/)可為研究人員提供基因生物學(xué)功能注釋以了解生物學(xué)意義[4]。使用DAVID數(shù)據(jù)庫(版本6.8)對SCLC的DEGs基因進(jìn)行本體(Gene Ontology,GO)功能富集以及京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析(FDR<0.05)。
1.4構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò)和關(guān)鍵基因模塊 使用STRING(Search Tool for the Retrieval of Interacting Genes,https://www.string-db.org/)數(shù)據(jù)庫(版本11)構(gòu)建SCLC的DEGs蛋白質(zhì)相互作用網(wǎng)絡(luò)(Protein-Protein Interaction Networks,PPI),得分大于0.9,F(xiàn)DR<0.01作為標(biāo)準(zhǔn)。將篩選得到的基因輸入Cytoscape軟件(版本3.8.2)對PPI網(wǎng)絡(luò)進(jìn)行可視化分析。然后使用其中的分子復(fù)合物檢測算法(Molecular Complex Detection,MCODE)分析重要的功能模塊。其篩選閾值Degree Cut - off、Node Score Cut - off 和K-core 均為2,Max Depth為100。使用cytoHubba插件尋找子模塊關(guān)鍵基因(根據(jù)degree值排序,選取前10位)。
2.1確定DEGs 圖1A和1B為SCLC的DEGs火山圖。在GSE43346和GSE40275兩個數(shù)據(jù)集中,SCLC癌組織中的上調(diào)基因分別有662和381個,下調(diào)基因分別有783和461個。將兩組數(shù)據(jù)集獲得的DEGs合并分析發(fā)現(xiàn),共同上調(diào)基因有151個,共同下調(diào)基因有81個,見圖1C、1D。
圖1 GSE43346 和GSE40275數(shù)據(jù)集中DEGs的火山圖和維恩圖
2.2GO富集分析和KEGG通路分析結(jié)果 使用DAVID數(shù)據(jù)庫對232個DEGs進(jìn)行GO富集分析。結(jié)果顯示232個差異基因主要參與細(xì)胞分裂、有絲核分裂、細(xì)胞增殖、DNA復(fù)制和有絲分裂細(xì)胞周期G1/S過渡等生物過程(biological processes,BP)。DEGs主要構(gòu)成細(xì)胞核、細(xì)胞質(zhì)、核漿、細(xì)胞質(zhì)基質(zhì)以及黏著斑等細(xì)胞組分(cellular component,CC)。主要發(fā)揮蛋白質(zhì)結(jié)合、ATP結(jié)合、DNA結(jié)合、蛋白激酶結(jié)合和微管結(jié)合等分子功能(cellular components,MF)。見表1。
表1 DEGs的GO富集分析
KEGG通路富集分析顯示,DEGs主要富集于細(xì)胞周期、HTLV-I感染、癌癥通路等。其中17個基因富集在細(xì)胞周期通路中(CDKN2C、PCNA、 GADD45B、CDKN2A、 PLK1、 BUB1B、TTK、CDC7、CCNA2、CCNB2、CCNE2、PTTG1、CHEK1、 MCM4、MCM6、BUB1、MCM2)。12個基因富集在HTLV-I感染(ZFP36、FZD3、CDKN2C、 PCNA、PTTG1、RRAS、CDKN2A、POLE2、CHEK1、ITGB2、BUB1B、TGFBR2)。11個基因富集在癌癥通路(FZD3、EDNRB、LAMA2、MSH2、CCNE2、GNG4、EPAS1、CDKN2A、ZBTB16、CKS2、TGFBR2)。見圖2。
圖2 DEGs的KEGG通路分析
2.3PPI網(wǎng)絡(luò)構(gòu)建和關(guān)鍵基因的選擇 使用DEGs構(gòu)建的PPI含74個節(jié)點(diǎn)和881條邊,見圖3。使用Cytoscape中的MCODE插件分析相互作用蛋白關(guān)聯(lián)性最強(qiáng)的區(qū)域,篩選出其重要的核心模塊,包括32個節(jié)點(diǎn)和441個邊,見圖4A。該模塊主要富集于細(xì)胞周期、卵母細(xì)胞成熟抑制因子、孕細(xì)胞介導(dǎo)的卵細(xì)胞成熟信號通路。在該模塊中,位列前10的關(guān)鍵基因是CCNB2、BUB1、CCNA2、KIF11、BUB1B、NDC80、TOP2A、ASPM、PLK1和KIF20A,見圖4B、4C。
圖3 PPI網(wǎng)絡(luò)圖
圖4 核心功能模塊分析和關(guān)鍵基因
本研究基于高通量測序數(shù)據(jù)篩選出可能在SCLC發(fā)生發(fā)展過程中起重要作用的十個關(guān)鍵基因:CCNB2、BUB1、CCNA2、KIF11、BUB1B、NDC80、TOP2A、ASPM、PLK1和KIF20A,其有可能成為潛在生物標(biāo)志物和治療靶點(diǎn)。
PLK1(Polo-like kinase1)是廣泛存在于真核細(xì)胞中的絲氨酸/蘇氨酸蛋白激酶家族成員[5],是細(xì)胞周期的關(guān)鍵調(diào)控因子,也是癌癥發(fā)生、發(fā)展中重要的致癌基因[6]。PLK1在細(xì)胞周期中發(fā)揮多種作用,如控制G2/M檢查點(diǎn),協(xié)調(diào)中心體,調(diào)節(jié)紡錘體組裝和染色體分離等[7]。研究表明,通過抗體、RNA干擾或激酶抑制劑阻斷PLK1的表達(dá)可以有效抑制腫瘤細(xì)胞的增殖,并誘導(dǎo)腫瘤細(xì)胞凋亡[8-9]。PLK1抑制劑可誘導(dǎo)DNA損傷并在SCLC中發(fā)揮強(qiáng)大的抗腫瘤活性[10]。因此,PLK1可能是一種很有前途的SCLC治療靶點(diǎn)。
TOP2A(Topoisomerase II Alpha)是一種細(xì)胞周期依賴性蛋白[11]。多項(xiàng)研究發(fā)現(xiàn)TOP2A基因表達(dá)與許多腫瘤的發(fā)生和發(fā)展密切相關(guān)[12-14]。Nicos等[15]研究發(fā)現(xiàn),TOP2A rs13695與SCLC患者在化療期間發(fā)生中性粒細(xì)胞減少的風(fēng)險(xiǎn)相關(guān)。有學(xué)者研究表明,TOP2A表達(dá)被認(rèn)為是SCLC患者的預(yù)后因素[16]。蒽環(huán)類、依托泊苷等細(xì)胞毒性藥物以TOP2A為靶點(diǎn),調(diào)節(jié)染色體凝聚和染色單體分離[15]。依托泊苷作用于TOP2A蛋白,阻止DNA復(fù)制和轉(zhuǎn)錄,導(dǎo)致細(xì)胞凋亡[17]。
CCNA2(CyclinA2)、CCNB2(CyclinB2)是細(xì)胞周期蛋白家族的成員,可通過調(diào)控細(xì)胞增殖和凋亡在多種實(shí)體腫瘤發(fā)揮作用[18]。Li等發(fā)現(xiàn),CCNA2在調(diào)節(jié)CDK6介導(dǎo)的細(xì)胞周期通路和EMT進(jìn)展中發(fā)揮重要作用[19]。目前雖無直接研究結(jié)果證實(shí)CCNA2在SCLC中的作用,但已有學(xué)者發(fā)現(xiàn)CDK6突變可影響SCLC患者的生存[20]。這一結(jié)果間接證明CCNA2可能在SCLC中發(fā)揮作用。同樣,目前也無CCNB2在SCLC的研究。但有研究發(fā)現(xiàn),miR-205可通過靶向CCNB2抑制癌細(xì)胞的增殖和遷移[21]。同時另有學(xué)者研究發(fā)現(xiàn)miR-205可影響SCLC患者的預(yù)后[22]。因此我們預(yù)測CCNB2、CCNA2可能是SCLC患者的潛在生物標(biāo)記物。
BUB1(Budding uninhibited by benzimidazoles-1)和BUB1B(BUB1 mitotic checkpoint serine/threonine kinaseB)是紡錘體組裝的有絲分裂檢查點(diǎn)的關(guān)鍵因素[23]。研究表明,BUB1與AURKA在晚期卵巢漿液性癌中顯著共表達(dá)[24]。Lu等發(fā)現(xiàn)敲低AURKA基因的表達(dá),可抑制人SCLC細(xì)胞增殖從而達(dá)到抗腫瘤效應(yīng)[25]。有關(guān)研究顯示,F(xiàn)OXM1通過結(jié)合并激活BUB1B啟動子來轉(zhuǎn)錄調(diào)節(jié)BUB1B的表達(dá)[26]。既往研究顯示FOXM1高表達(dá)的SCLC患者預(yù)后較差,并且在小鼠異種移植瘤模型中發(fā)現(xiàn)FOXM1可影響SCLC的形成[27]。Yin等證實(shí)在SCLC中,F(xiàn)OXM1的轉(zhuǎn)錄驅(qū)動會使硼替佐米和卡非佐米誘導(dǎo)的MCL-1上調(diào),進(jìn)而促進(jìn)腫瘤發(fā)生[28]。這些研究提示BUB1和BUB1B可能成為SCLC預(yù)后生物標(biāo)志物和潛在分子靶標(biāo)。
KIF11(Kinesin Family Member 11)[29]、KIF20A(Kinesin Family Member 20A)[30]是驅(qū)動蛋白相關(guān)蛋白家族的成員。在四聚體微管交聯(lián)、細(xì)胞有絲分裂、細(xì)胞周期和分化等方面具有重要作用[31-32]。已有研究證實(shí)p53和GSK3β在SCLC腫瘤發(fā)生和發(fā)展過程發(fā)揮著重要作用,有研究發(fā)現(xiàn)CRC細(xì)胞中KIF11敲降產(chǎn)生的效應(yīng)可能是p53信號異常激活或GSK3β信號異常失活導(dǎo)致的[33-35]。KIF20A通過調(diào)節(jié)JAK/STAT3信號通路促進(jìn)癌細(xì)胞惡性行為并增強(qiáng)對化療的抵抗力[36]。而JAK/STAT3信號通路在SCLC進(jìn)展中至關(guān)重要[37]。因此,我們猜測KIF11和KIF20A可以作為潛在的致癌基因和生物標(biāo)志物。
NDC80(Nuclear division cycle 80)是一種異四聚體蛋白復(fù)合物,是細(xì)胞分裂周期的關(guān)鍵調(diào)控因子[38]。最近的一項(xiàng)研究推測,NDC80可能通過阻礙有絲分裂的進(jìn)展來參與癌癥的形成[39]。Sugimasa等[40]證實(shí)了這一假說,他們發(fā)現(xiàn)NDC80的組分NUF2通過調(diào)節(jié)有絲分裂中期染色體排列來促進(jìn)腫瘤的生長。有發(fā)現(xiàn)NDC80可以與ZW10互作蛋白相互作用,參與SCLC的形成,NDC80還是NEK2的關(guān)鍵相互作用蛋白,NEK2與SCLC侵襲有關(guān),并與患者的生存相關(guān)[41-43]。以上與我們的推測一致,NDC80可能在的SCLC發(fā)展中起著至關(guān)重要的驅(qū)動作用。
ASPM(Abnormal spindle-like microcephaly-associated)也稱為異常紡錘體微管組裝,位于染色體1q31上,編碼ASPM蛋白,在多種癌癥表達(dá)異常[44],如肝細(xì)胞癌[45]、NSCLC[46]等。ASPM是一種Wnt調(diào)節(jié)劑[47]。研究人員發(fā)現(xiàn)Wnt信號的激活是復(fù)發(fā)性SCLC化療耐藥的一種機(jī)制[48]。這提示ASPM可能成為SCLC生物標(biāo)志物和潛在分子靶標(biāo)。
綜上所述,基于生物信息學(xué)分析,本研究確定了兩數(shù)據(jù)集中SCLC組織和正常肺組織之間常見DEGs的相關(guān)信號通路和關(guān)鍵基因,它們可能在SCLC的發(fā)生發(fā)展中發(fā)揮重要作用。這些發(fā)現(xiàn)可能為進(jìn)一步發(fā)現(xiàn)SCLC潛在的生物標(biāo)志物和生物學(xué)機(jī)制的研究提供新的線索,也為進(jìn)一步確定SCLC的診斷和治療干預(yù)方法提供方向。