張婕 戴巍 馮宇 葉佳琪
摘要:運(yùn)用生物信息學(xué)方法分析小細(xì)胞肺癌的相關(guān)基因,選取GEO數(shù)據(jù)庫基因芯片數(shù)據(jù)集GSE66635進(jìn)行深入挖掘,通過GEO2R篩選差異表達(dá)基因,并利用R軟件對(duì)其進(jìn)行聚類分析、DAVID數(shù)據(jù)庫進(jìn)行GO功能和KEGG通路富集分析、STRING數(shù)據(jù)庫和Cytoscape軟件構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò),最終得到6個(gè)關(guān)鍵基因:TP53,CCL2,F(xiàn)GF2,F(xiàn)OS,F(xiàn)GFR4,PGF,其所參與的生物學(xué)過程等可能與小細(xì)胞肺癌的發(fā)生、發(fā)展相關(guān)。
關(guān)鍵詞:生物信息學(xué);相關(guān)基因;小細(xì)胞肺癌
中圖分類號(hào):R319 ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)34-0014-03
小細(xì)胞肺癌(small cell lung cancer,SCLC) 是一類惡性程度高的肺癌,雖然只占肺癌的13%-15%,但是其死亡率極高[1]。有關(guān)研究表明,SCLC是多個(gè)分子水平改變累積的結(jié)果,單靶點(diǎn)的抑制對(duì)SCLC的治療作用有限[1]。由于SCLC的復(fù)雜性及其發(fā)病機(jī)制的不明確性導(dǎo)致研究人員無法確定靶向治療的靶點(diǎn),因此我們需要更深入地研究與SCLC發(fā)生發(fā)展相關(guān)的基因。
隨著精準(zhǔn)醫(yī)療的發(fā)展,生物信息學(xué)分析技術(shù)的成熟為癌癥的診治提供更為廣泛的空間。由于生物信息學(xué)數(shù)據(jù)庫及其分析軟件的種類多樣性和開放共享性,使得利用生物信息分析方法識(shí)別疾病相關(guān)的治療靶基因成為可能。其中,NCBI的GEO數(shù)據(jù)庫中有著大量的基因芯片數(shù)據(jù)集,其具有更新快、大規(guī)模等優(yōu)點(diǎn),而且易于共享,避免在數(shù)據(jù)采集等方面浪費(fèi)大量時(shí)間,因此在生命科學(xué)領(lǐng)域的研究中運(yùn)用逐漸廣泛[2]。本研究通過生物信息學(xué)方法挖掘SCLC基因芯片數(shù)據(jù)集GSE66625,利用計(jì)算機(jī)分析預(yù)測(cè)SCLC的潛在相關(guān)基因,從分子層面探討SCLC可能的作用機(jī)制。
1 ?材料與方法
1.1 ?材料
以SCLC和差異表達(dá)基因?yàn)殛P(guān)鍵詞,在NCBI的GEO數(shù)據(jù)庫中查找基因芯片數(shù)據(jù)集,最終選擇并下載檢索序列號(hào)為GSE66625的基因芯片數(shù)據(jù)集,此數(shù)據(jù)集基于GPL16951平臺(tái),是人SCLC細(xì)胞NCI-H446經(jīng)一種化療藥物治療前后的基因表達(dá)變化數(shù)據(jù),其中對(duì)照組為經(jīng)DMSO處理的3瓶SCLC細(xì)胞,實(shí)驗(yàn)組為相同濃度藥物處理后的3瓶細(xì)胞,采用Phalanx OneArrayTM檢測(cè)它們之間的基因表達(dá)差異,體現(xiàn)了SCLC細(xì)胞經(jīng)化療藥物治療前后的基因表達(dá)差異。
1.2 ?方法
1.2.1 ?差異表達(dá)基因篩選
使用GEO2R在線分析藥物治療組與癌癥對(duì)照組的基因數(shù)據(jù)并保存所有基因的分析結(jié)果,在Excel中以|logFC|>2.00且P.Value<0.05為條件篩選出差異表達(dá)基因(Differential Expression Genes,DEGs),并使用SangerBox軟件和R軟件的Pheatmap包分別繪制出全部基因的火山圖以及DEGs的聚類熱圖。
1.2.2 ?功能與富集分析
DAVID是一個(gè)為大量基因提供一系列功能性注釋的生物信息數(shù)據(jù)庫。將DEGs上傳到DAVID 6.7版在線數(shù)據(jù)庫,并選擇物種homo sapiens,選定p<0.05,基因數(shù)目≥5的條件進(jìn)行GO功能富集分析,以p<0.05為限定條件進(jìn)行KEGG通路富集分析,并篩選出富集到每項(xiàng)條目的共同基因。
1.2.3 ?蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)構(gòu)建
STRING數(shù)據(jù)庫能夠?qū)Φ鞍踪|(zhì)相互作用網(wǎng)絡(luò)進(jìn)行分析和預(yù)測(cè),并提供詳細(xì)的相互作用信息。將顯著富集到生物過程、細(xì)胞組件、分子功能以及KEGG代謝通路中的共同DEGs上傳至STRING 11.0版數(shù)據(jù)庫,以數(shù)據(jù)庫、文本挖掘、實(shí)驗(yàn)結(jié)果等為依據(jù)進(jìn)行蛋白之間交互網(wǎng)絡(luò)的初步預(yù)測(cè),篩選出綜合得分≥0.4的相互作用關(guān)系,將相互作用表格及注釋信息導(dǎo)入Cytoscape軟件中進(jìn)行可視化交互網(wǎng)絡(luò)的構(gòu)建。
2 ?結(jié)果與分析
2.1 ?DEGs的篩選結(jié)果與分析
經(jīng)過藥物治療組與癌癥對(duì)照組的比較,得到864個(gè)DEGs,其中有566個(gè)基因上調(diào),298個(gè)基因下調(diào),將其繪制成火山圖,其中紅色表示上調(diào),綠色表示下調(diào),黑色部分為普通基因,如圖1(a)。利用R軟件的Pheatmap包將DEGs的基因表達(dá)矩陣?yán)L制成聚類熱圖,如圖1(b)。
2.2 ?DEGs的GO功能與KEGG通路富集分析
通過GO功能的3種生物學(xué)關(guān)系分析,SCLC的DEGs主要參與細(xì)胞遷移的正調(diào)控、凋亡過程和正調(diào)控血管生成等生物學(xué)過程,如圖2(a)所示,其產(chǎn)物主要參與神經(jīng)元投射、細(xì)胞外空間、突觸小泡等細(xì)胞組分,如圖2(b)所示,并且DEGs主要發(fā)揮著調(diào)節(jié)蛋白質(zhì)同二聚化活性、磷脂結(jié)合、肝素結(jié)合等分子功能,如圖2(C)。通過KEGG代謝通路分析,得到16條顯著富集的信號(hào)通路,主要包括PI3K-Akt信號(hào)通路、軸突導(dǎo)向、p53信號(hào)通路等代謝通路,如圖2(d)所示,與SCLC的發(fā)生、發(fā)展密切相關(guān)。其中共有52個(gè)基因同時(shí)富集到3種生物學(xué)關(guān)系和KEGG代謝通路中,如圖3所示。
2.3 ?DEGs的蛋白-蛋白交互網(wǎng)絡(luò)構(gòu)建
為發(fā)現(xiàn)DEGs之間的相互作用和SCLC的相關(guān)分子機(jī)制,將同時(shí)富集到KEGG通路以及GO功能3個(gè)條目的52個(gè)基因所編碼的蛋白進(jìn)行蛋白-蛋白交互網(wǎng)絡(luò)的構(gòu)建,隱藏沒有參與相互作用的4個(gè)蛋白,整個(gè)網(wǎng)絡(luò)中共有48個(gè)蛋白和187個(gè)交互關(guān)系。將相互作用信息導(dǎo)入Cytoscape軟件中進(jìn)行互作網(wǎng)絡(luò)的可視化,每一個(gè)節(jié)點(diǎn)代表一個(gè)蛋白,每一條邊代表一個(gè)交互關(guān)系。其中,節(jié)點(diǎn)的大小隨度漸變,且紅色表示基因上調(diào),綠色表示基因下調(diào),邊的粗細(xì)隨相互作用的強(qiáng)度漸變。結(jié)果顯示(圖4),交互網(wǎng)絡(luò)中TP53,CCL2,F(xiàn)GF2,F(xiàn)OS,F(xiàn)GFR4和PGF與其他蛋白的關(guān)系最為密切,為整個(gè)交互網(wǎng)絡(luò)的中心節(jié)點(diǎn)。將這6個(gè)基因所參與的生物過程(表1)、細(xì)胞組分(表2)、分子功能(表3)和KEGG代謝通路(表4)分別整理成表。
3 討論
本研究運(yùn)用生物信息學(xué)方法從GEO數(shù)據(jù)庫中下載SCLC的相關(guān)基因芯片數(shù)據(jù)集GSE66625,并利用GEO2R對(duì)其進(jìn)行初步分析,得到了864個(gè)DEGs,其中566個(gè)基因上調(diào),298個(gè)基因下調(diào)。通過GO功能富集和KEGG通路分析,我們選取富集分析結(jié)果中交集的52個(gè)基因的編碼蛋白進(jìn)行蛋白質(zhì)相互作用網(wǎng)絡(luò)的構(gòu)建,最終得到TP53,CCL2,F(xiàn)GF2,F(xiàn)OS,F(xiàn)GFR4,PGF為網(wǎng)絡(luò)的中心蛋白。
TP53(Tumor Protein 53)是與人類腫瘤相關(guān)性最高的基因之一,編碼生成腫瘤蛋白p53。有研究發(fā)現(xiàn),在人體正常細(xì)胞的活動(dòng)中,TP53通過參與細(xì)胞調(diào)控、促進(jìn)DNA修復(fù)等過程,發(fā)揮著維持基因組穩(wěn)定、調(diào)節(jié)細(xì)胞分化等作用[3]。在本研究中,TP53在經(jīng)化療藥物處理過后的細(xì)胞內(nèi)顯著下調(diào),說明其在癌組織中表達(dá)量上調(diào),同時(shí)在互作網(wǎng)絡(luò)中處于中心位置。此外,TP53顯著富集到細(xì)胞的凋亡過程以及p53、PI3K-Akt等信號(hào)通路中。PI3K與其下游分子蛋白激酶所組成的PI3K-Akt信號(hào)通路在人類腫瘤的發(fā)生發(fā)展過程中有著關(guān)鍵地位。TP53可能通過此過程以及代謝通路來抑制腫瘤細(xì)胞的表達(dá)并促進(jìn)細(xì)胞凋亡,在SCLC的作用機(jī)制中起著關(guān)鍵作用。
CCL2蛋白是趨化因子CC亞家族的成員之一,可以趨化單核細(xì)胞、巨噬細(xì)胞、記憶T細(xì)胞等到達(dá)感染的部位,在腫瘤、免疫系統(tǒng)疾病等多種疾病的發(fā)生發(fā)展中起著關(guān)鍵作用[4]。它能夠增強(qiáng)腫瘤細(xì)胞的侵襲能力,促進(jìn)腫瘤的轉(zhuǎn)移,從而導(dǎo)致疾病惡化。在本研究中,CCL2的表達(dá)量在經(jīng)藥物處理后的細(xì)胞中顯著下調(diào),且顯著富集到細(xì)胞外空間的細(xì)胞組分并參與肝素結(jié)合功能,這表明CCL2的下調(diào)可能通過調(diào)控胞外空間組分和肝素結(jié)合功能等途徑抑制SCLC的致癌作用。FOS蛋白是細(xì)胞增殖、分化等的調(diào)節(jié)因子。本研究中FOS在經(jīng)藥物處理的細(xì)胞中表達(dá)上調(diào),在癌細(xì)胞中下調(diào),且顯著富集到神經(jīng)元投射的細(xì)胞組件中,可能通過此過程在致癌機(jī)制的調(diào)控中發(fā)揮功能。
PGF(Placenta growth factor)一種胎盤生長(zhǎng)因子,在本研究中,PGF表達(dá)量在經(jīng)藥物處理后的細(xì)胞內(nèi)顯著下調(diào),在癌組織中顯著上調(diào),顯著富集到血管生成、器官再生過程中,并參與著肝素結(jié)合等分子功能以及PI3K-Akt信號(hào)通路,可能發(fā)揮著促進(jìn)腫瘤細(xì)胞生長(zhǎng)的功能。
FGF2(Fibroblast Growth Factor 2)是成纖維細(xì)胞生長(zhǎng)因子家族成員中較典型的一類多肽,具有促進(jìn)血管生成、創(chuàng)傷修復(fù)、組織再生等功能。有研究發(fā)現(xiàn)其可通過PKC信號(hào)傳導(dǎo)途徑來促進(jìn)小細(xì)胞肺癌細(xì)胞中凋亡抑制蛋白的表達(dá),從而抑制細(xì)胞凋亡[5]。FGFR4(Fibroblast Growth Factor Receptor 4)是一種跨膜受體酪氨酸激酶,是成纖維細(xì)胞生長(zhǎng)因子受體中的一員[6]。FGF2主要通過與細(xì)胞表面上的FGFRs高親和力結(jié)合發(fā)揮生物學(xué)效應(yīng)。馮彥等人研究發(fā)現(xiàn)FGF2和FGFR4與SCLC的侵襲和轉(zhuǎn)移密切相關(guān)[7]。在本研究中,F(xiàn)GF2表達(dá)量在經(jīng)藥物處理后的細(xì)胞內(nèi)顯著下調(diào),在癌組織中顯著上調(diào),而FGFR4的表達(dá)量在經(jīng)藥物處理后的細(xì)胞內(nèi)顯著上調(diào),在癌組織中表達(dá)量下調(diào)。這兩種基因共同發(fā)揮肝素結(jié)合的分子功能而且同PGF、TP53富集到PI3K-Akt信號(hào)通路中,表明其基因表達(dá)結(jié)果可能通過影響肝素結(jié)合和PI3K-Akt信號(hào)通路調(diào)控SCLC的發(fā)展,阻止FGF2與其受體的結(jié)合從而抑制癌細(xì)胞的增殖。此外,F(xiàn)GF2參與著細(xì)胞遷移、血管生成以及經(jīng)典Wnt信號(hào)轉(zhuǎn)導(dǎo)通路調(diào)節(jié)等生物學(xué)過程,與CCL2、PGF共同參與著胞外空間的細(xì)胞組分,且與TP53共同富集到癌癥中蛋白多糖代謝通路,這表明這些基因可能通過調(diào)控細(xì)胞遷移、細(xì)胞外空間的組分或者是蛋白多糖的代謝參與SCLC的發(fā)生、發(fā)展,從而在SCLC的作用機(jī)制中起重要作用,這可能是SCLC的潛在致病機(jī)制。
綜上所述,本研究通過對(duì)SCLC基因芯片數(shù)據(jù)集進(jìn)行生物信息學(xué)分析,發(fā)現(xiàn)TP53,CCL2,F(xiàn)GF2,F(xiàn)OS,F(xiàn)GFR4,PGF可能是SCLC的潛在相關(guān)基因,然而我們?nèi)孕韪嗟匮芯縼碜C實(shí)其在SCLC中的作用。
參考文獻(xiàn):
[1] 王伙剛,洪波,林文楚.小細(xì)胞肺癌靶向治療研究進(jìn)展[J].中國藥理學(xué)通報(bào),2017,33(10):1333-1337.
[2] 滕牧洲,馬文麗.走近醫(yī)學(xué)研究領(lǐng)域中的基因芯片技術(shù)[J].分子診斷與治療雜志,2014,6(6):361-365.
[3] 徐文達(dá),高平,楊文君.p53信號(hào)通路與腫瘤關(guān)系的研究進(jìn)展[J].寧夏醫(yī)科大學(xué)學(xué)報(bào),2012,34(9):971-976.
[4] 姜懿納,陳乃宏.CCL2/MCP-1在其相關(guān)疾病的機(jī)制研究[J].中國藥理學(xué)通報(bào),2016,32(12):1634-1638.
[5] 屈曉輝,周建華.堿性成纖維細(xì)胞成長(zhǎng)因子2對(duì)小細(xì)胞肺癌細(xì)胞凋亡的影響及機(jī)制研究[J].江西醫(yī)藥,2016,51(10):1023-1027.
[6] 伍代朝,陳林,陳永恒, 等.靶向FGFR4的抗腫瘤藥物研究進(jìn)展[J].腫瘤防治研究,2017,44(1):61-65.
[7] 馮彥,李建慧,趙雪, 等.FGF-2和ToPo Ⅱ在小細(xì)胞肺癌中的表達(dá)及相關(guān)性[J].臨床腫瘤學(xué)雜志,2012,17(2):121-125.
【通聯(lián)編輯:光文玲】