陸漢凌,任旻,唐玉寶,朱云祥
(揚州大學(xué)附屬醫(yī)院,江蘇 揚州 225000)
胃癌是全球常見惡性腫瘤之一,在中國,胃癌的發(fā)病率和死亡率分別在第三位和第二位[1]?,F(xiàn)階段的胃癌診斷方法中,主要依靠CT、胃鏡檢查及腫瘤標(biāo)志物等[2-4]。但胃鏡檢查屬于侵入性檢查,費用相對較高,普通患者接受度不高,因此對于尋找有效胃癌基因標(biāo)志物成為新的熱門選擇。本文從基因表達數(shù)據(jù)庫中篩選胃癌相關(guān)基因芯片并分析其生物學(xué)功能及信號通路,同時篩選了胃癌相關(guān)核心差異表達基因,并探討了胃癌相關(guān)核心差異表達基因與預(yù)后的關(guān)系。
登錄GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo),以“gastric cancer”為檢索詞,獲取到與GC相關(guān)的兩組數(shù)據(jù)集:GSE33651、GSE54129。GSE33651共有樣本數(shù)52個,其中GC組織組40個,正常黏膜組12個。GSE54129共有樣本數(shù)132個,其中GC組織組111個,正常黏膜組21個。
利用在線平臺GEO2R分別對兩組芯片的胃癌組織組和正常黏膜組差異表達基因進行篩選,以LogFC>1或者LogFC<-1且校正后P值(adj.Pvalue)<0.01為篩選標(biāo)準分別對兩組數(shù)據(jù)集進行差異表達基因篩選。篩選得到的數(shù)據(jù)利用DrawVenn Diagram (http://bioinformatics.psb.ugent.be/webtools/Venn/),繪制出兩組芯片差異表達基因的韋恩圖,得到共有的差異表達基因。
登錄基因功能數(shù)據(jù)庫DAVID(https://david.ncifcrf.gov/),將差異基因?qū)?,對其進行基因本體(Gene Ontology,GO)分析,通過GO分析了解到差異基因的細胞組成(CC)、生物學(xué)過程(BP)及分子功能(MF)。接著進行京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析,得到相關(guān)作用的信號通路。
將上述篩選出的差異基因利用STRING數(shù)據(jù)庫(https://string-db.org/)進行分析,得出蛋白互作網(wǎng)絡(luò)(PPI),以R-軟件對PPI進行核心基因篩選,以節(jié)點聯(lián)系進行排序,篩選出12個核心基因(FN1、CXCL8、CD44、COL1A1、MMP2、COL1A2、ITGB2、PECAM1、THBS1、ACTB、CXCR4、ITGAM),對核心基因進一步分析其表達及生存預(yù)期。
兩組GC相關(guān)芯片,以LogFC>1或者LogFC<-1且校正后P值(adj.Pvalue)<0.01為篩選標(biāo)準。GSE33651共有樣本數(shù)52個,其中GC組織組40個,正常黏膜組12個,共篩選出差異表達基因1821個。GSE54129共有樣本數(shù)132個,其中GC組織組111個,正常黏膜組21個,共篩選出差異表達基因2092個。將兩個芯片組基因用DrawVenn Diagram取交集得到韋恩圖,得到差異共表達基因330個,其中下調(diào)基因有123個,上調(diào)基因207個。具體可見圖1。
圖1 兩組芯片數(shù)據(jù)差異表達基因韋恩圖
在GO分析中可以發(fā)現(xiàn)(表1),330個差異共表達基因的分子功能(MF)主要集中在膠原結(jié)合、蛋白質(zhì)結(jié)合、整聯(lián)蛋白結(jié)合、纖連蛋白結(jié)合等過程中。細胞組成(CC)主要參與在細胞外泌體、細胞外基質(zhì)、胞外區(qū)域、細胞表面等。同時,在生物學(xué)過程(BP)中主要在膠原分解代謝過程、血管生成、細胞粘附、白細胞遷移等發(fā)揮著作用。KEGG分析中(表2),差異表達基因主要集中于百日咳、阿米巴病、白細胞跨內(nèi)皮遷移及ECM-受體相互作用等通路。
表1 GC相關(guān)差異表達基因GO分析
表2 GC相關(guān)差異表達基因KEGG分析
登錄STRING數(shù)據(jù)庫(https://string-db.org/),將差異表達基因?qū)霐?shù)據(jù)庫中,構(gòu)建出PPI,得到下圖2。使用STRING數(shù)據(jù)庫對差異基因進行蛋白互作網(wǎng)絡(luò)分析,以R-軟件對PPI進行核心基因篩選,篩選后以節(jié)點聯(lián)系排序,得到下圖3。
圖2 GC差異表達基因PPI圖
圖3 GC相關(guān)核心基因
登錄在線分析網(wǎng)站GEPIA(http://gepia.cancer-pku.cn/),比較所獲取的12個核心差異表達基因在胃腺癌(stomach adenocarcinoma,STAD)病人與正常人組織的表達水平情況(見圖4)。我們發(fā)現(xiàn),除了PECAM1外,其余基因在STAD病人中均表達上調(diào)。在生存分析圖5中,可以找到基因FN1、THBS1、CXCR4、COL1A1是有益于胃癌患者的生存。
圖4 GC核心差異表達基因的表達分析
圖5 核心差異表達基因生存分析圖
在2018年全國最新癌癥報告中指出,胃癌在我國的發(fā)病率為第二位[5],它的發(fā)生發(fā)展與多種因素可能相關(guān),例如性別、年齡、種族、生活飲食方式等[6]。為了更好、更方便地去了解胃癌相關(guān)發(fā)病機制,從而達到理想的診斷和治療效果,我們可以從基因芯片方面去入手。本研究通過GEO數(shù)據(jù)庫進行檢索,得到兩組基因芯片GSE33651、GSE54129,通過韋恩圖篩選出差異共表達基因330個,其中上調(diào)基因有207個,下調(diào)基因123個。結(jié)合GO及KEGG分析我們發(fā)現(xiàn),這些差異共表達基因主要集中在膠原結(jié)合、蛋白質(zhì)結(jié)合、整聯(lián)蛋白結(jié)合、纖連蛋白結(jié)合等過程中。主要參與在細胞外泌體、細胞外基質(zhì)、胞外區(qū)域、細胞表面等。同時,在膠原分解代謝過程、血管生成、細胞粘附、白細胞遷移等發(fā)揮著作用。KEGG分析中,差異表達基因主要集中于百日咳、阿米巴病、白細胞跨內(nèi)皮遷移及ECM-受體相互作用等通路。
為了進一步篩選合適基因,我們利用STRING數(shù)據(jù)庫,構(gòu)建出PPI,并由R軟件利用節(jié)點聯(lián)系得出12個核心基因。為評估這些核心基因的表達情況及預(yù)后分析,我們利用GEPIA,比較所獲取的30個核心差異表達基因在胃腺癌病人與正常人組織的表達水平情況。根據(jù)所得圖表發(fā)現(xiàn)除了PECAM1外,其余基因在STAD病人中均表達上調(diào)。結(jié)合生存分析圖,可以找到基因FN1、CXCR4、COL1A1的低表達是有益于胃癌患者的生存。
纖維連接蛋白(FN1)是一種糖蛋白分子,它參與各種細胞的細胞粘附,遷移和運動[7]。先前有研究表明其與卵巢癌、乳腺癌的發(fā)生發(fā)展有關(guān)[8,9]。在非小細胞肺癌(NSCLC)中,F(xiàn)N1可能與血管內(nèi)皮生長因子A相互作用,以此起到重要作用,且其相應(yīng)的蛋白質(zhì)可作為NSCLC患者診斷或治療的靶點[10]。經(jīng)過進一步的分析驗證后,發(fā)現(xiàn)FN1的低表達對胃癌細胞的侵襲有抑制作用[11,12]。趨化因子受體4(CXCR4)是CXCL12的主要受體[13]。相對于正常人而言,胃癌患者體內(nèi)的CXCR4和CXCL12呈現(xiàn)高表達狀態(tài)[14],實驗發(fā)現(xiàn)CXCL12與CXCR4的結(jié)合上調(diào)了磷脂酰肌醇3激酶(PI3K)/雷帕霉素(mTOR)和c-MET途徑,從而使胃癌的侵襲性增加[15,16]。此外,CXCR4在乳腺癌、胰腺癌、結(jié)直腸癌中,也有報道說明其高表達[17,18]。膠原蛋白是ECM的重要組成部分,能夠增強癌細胞的遷移、侵襲和粘附性[19,20]。I型膠原蛋白α1(COL1A1)是膠原蛋白家族的成員之一,有報道說,在乳腺癌、肺癌、腎癌中,COL1A1與腫瘤細胞的增殖及侵襲性有關(guān)[21-23]。在肝細胞癌變和轉(zhuǎn)移的潛在靶標(biāo)里,COL1A1也被當(dāng)做可靠的生物標(biāo)志物[24]。在胃癌中,尚未有明確的實驗證明COL1A1的作用和分子調(diào)控機制。但最新的一項研究猜測,COL1A1通過激活TGF-β信號通路來促進了GC細胞的遷移和侵襲[25]。
綜上所述,我們通過GEO數(shù)據(jù)庫進行篩選分析,確定核心差異表達基因,發(fā)現(xiàn)了FN1、CXCR4、COL1A1這三個基因,通過富集分析和蛋白互作、生存分析發(fā)現(xiàn),這些基因可能作為胃癌的潛在標(biāo)志物來幫助胃癌的早期診斷、治療及預(yù)后判斷。在基因診斷技術(shù)愈發(fā)成熟的現(xiàn)在,更加簡便、快捷、有效的方法一定可以得到進一步的發(fā)掘。