黃勛功 馮 旭 涂順珂
(廣西醫(yī)科大學(xué)第一附屬醫(yī)院心胸外科,廣西南寧市 530021)
肺癌是全球最常見的癌癥之一,早期診斷是肺癌治療過程中最關(guān)鍵的部分,但晚期患者占肺癌人群的比例依然很高,因此,對(duì)患者進(jìn)行早期診斷及預(yù)后監(jiān)測至關(guān)重要[1]。近年來,諸多研究發(fā)現(xiàn)多個(gè)基因與肺癌的發(fā)生、發(fā)展及預(yù)后相關(guān),基因靶向治療可有效識(shí)別腫瘤細(xì)胞及正常細(xì)胞,在發(fā)揮抗腫瘤作用的同時(shí)減少對(duì)正常細(xì)胞的損傷,這使其成為研究的重點(diǎn)。目前,肺腺癌約占全部肺癌的45%,在女性和抽煙者中發(fā)病率較高,但其具體的分子機(jī)制尚未完全清楚,因此,揭示潛在關(guān)鍵基因?qū)Ψ蜗侔┑姆乐魏皖A(yù)后評(píng)估非常重要[2]。G蛋白偶聯(lián)受體116(G-protein coupled receptor 116, GPCR116)屬于G蛋白偶聯(lián)受體家族,該受體在維持肺表面活性物質(zhì)穩(wěn)態(tài)中起著關(guān)鍵作用,GPCR116丟失會(huì)引起肺氣腫樣病變[3]。有研究顯示,GPCR116具有調(diào)節(jié)血管內(nèi)皮的功能,其功能的缺失會(huì)導(dǎo)致腦血管滲漏風(fēng)險(xiǎn)顯著增加[4]。此外,還有研究報(bào)道GPCR116可以預(yù)測胃癌和結(jié)直腸癌的不良預(yù)后[5-6]。然而,GPCR116基因在肺腺癌中的作用尚不清楚,本研究旨在探討GPCR116基因與肺腺癌發(fā)生、發(fā)展的相關(guān)性及其作用機(jī)制。現(xiàn)報(bào)告如下。
1.1 數(shù)據(jù)來源 從高通量功能基因組(Gene Expression Omnibus, GEO)數(shù)據(jù)庫(www.ncbi. nlm.nih. gov/geo)下載GSE68465數(shù)據(jù)集,該數(shù)據(jù)集包含442例肺腺癌組織樣本和20例正常組織樣本的mRNA數(shù)據(jù)和基本臨床資料(包括T分期、N分期、年齡、性別、吸煙史等)[7]。
1.2 數(shù)據(jù)分析 利用R語言對(duì)基因名進(jìn)行注釋,用“l(fā)imma”和“impute”工具包對(duì)其相應(yīng)的基因表達(dá)量進(jìn)行補(bǔ)缺矯正[8-9]。通過Wilcoxon秩和檢驗(yàn)分析數(shù)據(jù)集中的正常組織與癌組織樣本GPCR116表達(dá)量之間的差異。篩選出腫瘤患者,按照其中位值(20.438 865)將腫瘤患者分為高表達(dá)組和低表達(dá)組,使用R語言中的“survival”行Kaplan-Meier生存分析。使用R語言對(duì)GPCR116行單因素和多因素Cox回歸,分析臨床特征與肺腺癌患者預(yù)后的關(guān)系。使用R語言中的Kruskal-Wallis檢驗(yàn),探究GPCR116基因表達(dá)量與各臨床特征的相關(guān)性。
1.3 基因集富集分析 運(yùn)用基因集富集分析(Gene Set Enrichment Analysis, GSEA)軟件4.2.3版輸入GPCR116高表達(dá)組和低表達(dá)組的數(shù)據(jù)集文件和表型數(shù)據(jù)文件,選擇c2.cp.kegg.v7.5.1.symbols.gmt [Curated]作為參考基因集,將P<0.05、錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.25的基因集作為顯著富集的基因集。
1.4 識(shí)別差異表達(dá)基因 根據(jù)GPCR116基因表達(dá)量對(duì)腫瘤樣本數(shù)據(jù)進(jìn)行重新排序,按照各基因表達(dá)中位值進(jìn)行分組,使用R語言分析并輸出同時(shí)滿足|(log2FC)|>1且P<0.05的差異表達(dá)基因(differentially expressed genes, DEGs) ,使用R語言繪制火山圖,并使用R語言中的“pheatmap”對(duì)上調(diào)與下調(diào)最顯著的20個(gè)DEGs繪制差異基因熱圖。
1.5 GO功能富集和KEGG通路富集分析 使用R語言中的“clusterProfiler”進(jìn)行基因本體論(Gene Ontology,GO)富集分析及京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析,滿足將P<0.05、最小富集差異基因計(jì)數(shù)為5、富集基因占整條通路所有基因的最小占比為0.05的基因作為顯著性基因富集。
1.6 相關(guān)性分析 挑選出上調(diào)與下調(diào)最顯著的DEGs各20個(gè),利用R語言中的“corrplot”工具包分析GPCR116基因與這40個(gè)DEGs之間的相關(guān)性。
1.7 構(gòu)建PPI網(wǎng)絡(luò)并篩選關(guān)鍵基因 使用在線分析數(shù)據(jù)庫 STRING(http: //string-db.org /cgi /input.pl)構(gòu)建蛋白互作(protein-protein interaction,PPI)網(wǎng)絡(luò),設(shè)定最小互作評(píng)分>0.15。使用Cytoscape 3.9.1的插件CytoHubba中的5種拓?fù)浞治鏊惴?EcCentricity、Closeness、Radiality、Betweeness、Stress)分別計(jì)算PPI網(wǎng)絡(luò)中DEGs的表達(dá)量并進(jìn)行排列,取交集,篩選得到關(guān)鍵基因。
2.1 GPCR116基因在肺腺癌組織中的表達(dá)情況 與正常組織相比,GPCR116基因在肺腺癌組織中的表達(dá)量明顯升高,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖1。
圖1 GPCR116在正常組織和肺腺癌組織中的表達(dá)
2.2 GPCR116基因表達(dá)量與肺腺癌患者預(yù)后的關(guān)系 生存分析結(jié)果顯示,低表達(dá)組5年生存率為0.451(0.380~0.536),高表達(dá)組的5年生存率可達(dá) 0.651(0.578~0.733),高表達(dá)組預(yù)后較好,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖2。單因素和多因素Cox回歸分析結(jié)果均顯示,GPCR116表達(dá)量是肺腺癌患者預(yù)后的獨(dú)立影響因素(均P<0.05),見表1。
圖2 GPCR116基因表達(dá)量與肺腺癌患者預(yù)后關(guān)系的Kaplan-Meier生存分析
表1 GPCR116基因表達(dá)量與肺腺癌患者預(yù)后關(guān)系的單因素及多因素Cox回歸分析
2.3 GPCR116基因表達(dá)量與臨床特征的相關(guān)性分析 GPCR116基因的表達(dá)量與T分期、N分期及吸煙史相關(guān)(均P<0.05),見圖3。
圖3 GPCR116基因表達(dá)量與臨床特征的相關(guān)性
2.4 GPCR116基因的GSEA富集分析 GPCR116基因高表達(dá)組主要富集在溶酶體,低表達(dá)組主要富集在細(xì)胞周期、P53信號(hào)通路、錯(cuò)配修復(fù)、卵母細(xì)胞減數(shù)分裂等信號(hào)通路中,見表2;可視化分析得到的富集分析圖見圖4。
表2 GPCR116基因GSEA富集分析表達(dá)通路
圖4 GPCR116基因GSEA富集分析圖
2.5 差異基因的火山圖與熱圖 共篩選出DEGs 235個(gè),包括下調(diào)基因103個(gè),上調(diào)基因132個(gè)。DEGs的火山圖見圖5,由最顯著的40個(gè)DEGs繪制得到的差異基因熱圖見圖6。
圖5 DEGs火山圖
圖6 DEGs熱圖
2.6 差異基因GO分析和KEGG通路富集分析 GO富集分析結(jié)果顯示:DEGs的生物過程主要涉及細(xì)胞核分裂、細(xì)胞器裂變、有絲分裂細(xì)胞周期相變等,見表3。KEGG通路富集分析結(jié)果顯示:DEGs主要在人類T細(xì)胞白血病病毒1感染、細(xì)胞周期、類風(fēng)濕性關(guān)節(jié)炎等信號(hào)通路中富集,見表4。
表3 DEGs的GO功能富集分析結(jié)果(生物過程,前5個(gè))
表4 DEGs的KEGG通路富集分析結(jié)果(前5個(gè))
2.7 相關(guān)性分析 GPCR116基因的表達(dá)量與13個(gè)顯著性差異基因的表達(dá)量呈正相關(guān),包括HSD17B6、CYP2B7P、RNASE1等;與20個(gè)顯著性差異基因的表達(dá)量呈負(fù)相關(guān),包括TMEM158、MCM10、NDC80等。見圖7。
圖7 GPCR116基因的表達(dá)量與上調(diào)和下調(diào)最顯著的40個(gè)差異基因表達(dá)量的相關(guān)性
2.8 PPI網(wǎng)絡(luò)構(gòu)建及關(guān)鍵基因篩選 PPI網(wǎng)絡(luò)共包含40個(gè)節(jié)點(diǎn)、129條連線,其中SFTPC、SFTPB、SFRPD、HOPX、WIF1與GPCR116基因均呈正相關(guān)(見圖8)。5種拓?fù)浞治鏊惴ǚ謩e計(jì)算出前20位基因,取交集得到10個(gè)關(guān)鍵基因,分別為NKX2-1、SFTPB、SFTPC、SCGB1A1、PITX1、FOXM1、MYBL2、CDCA3、TFF1、WIF1。
圖8 與GPCR116基因相關(guān)的PPI網(wǎng)絡(luò)(共預(yù)測40個(gè)功能蛋白)
肺腺癌是一種高度惡性的異質(zhì)性疾病,采用生物標(biāo)志物預(yù)測患者預(yù)后并尋找關(guān)鍵的治療靶點(diǎn)或?qū)⒊蔀槲磥硌芯康闹攸c(diǎn)。本研究探討了GPCR116基因預(yù)測肺腺癌預(yù)后的價(jià)值,并利用富集分析和PPI網(wǎng)絡(luò)探究GPCR116基因可能的作用機(jī)制,然后篩選肺腺癌的潛在治療靶點(diǎn),旨在為闡明GPCR116基因與肺腺癌的相關(guān)性及其作用機(jī)制提供參考。
G蛋白偶聯(lián)受體是參與信號(hào)傳遞的最大細(xì)胞表面分子家族,在腫瘤生長和轉(zhuǎn)移中發(fā)揮重要作用。已有研究表明,惡性細(xì)胞常影響G蛋白偶聯(lián)受體的正常功能[10]。GPCR116基因作為G蛋白偶聯(lián)受體家族中的一員,其在不同類型的腫瘤中發(fā)揮作用。本研究結(jié)果顯示,GPCR116基因在肺腺癌組織中低表達(dá)是肺腺癌預(yù)后較差的預(yù)測指標(biāo)。GSEA富集的多個(gè)通路與腫瘤的進(jìn)展相關(guān),例如:P53是人類癌癥中最常見的腫瘤抑制基因,它的缺失或突變可導(dǎo)致免疫逃避和癌癥進(jìn)展[11];錯(cuò)配修復(fù)可保護(hù)DNA,抑制突變,修復(fù)的缺失與癌變進(jìn)展關(guān)系密切[12];細(xì)胞周期檢查點(diǎn)為DNA復(fù)制的監(jiān)控機(jī)制,可防止細(xì)胞分裂過程中遺傳錯(cuò)誤的積累,檢查點(diǎn)缺陷是細(xì)胞癌變的前提[13];溶酶體中的溶酶體蛋白可使癌細(xì)胞凋亡從而發(fā)揮抑癌作用,也可為降解的ECM蛋白入侵癌細(xì)胞提供營養(yǎng)和能量,從而促進(jìn)腫瘤的侵襲、生長[14]。由此預(yù)測,GPCR116基因可能參與肺腺癌細(xì)胞的自噬過程,其低表達(dá)可能促進(jìn)了肺腺癌的發(fā)生、發(fā)展。
差異基因的GO功能富集分析與KEGG通路富集分析結(jié)果顯示,差異基因富集的功能與通路在肺腺癌的發(fā)生、發(fā)展中起重要作用。GPCR116基因與其中的多個(gè)基因發(fā)揮交互作用,PPI網(wǎng)絡(luò)預(yù)測的40個(gè)功能蛋白中,多種蛋白被證實(shí)與肺癌相關(guān),例如:HOPX可誘導(dǎo)非小細(xì)胞肺癌細(xì)胞衰老、凋亡,發(fā)揮抑制腫瘤活性的作用[15-16];SFTPD可抑制EGFR突變型非小細(xì)胞肺癌細(xì)胞的生長和運(yùn)動(dòng)[17];WIF1可通過抑制Wnt/β-連環(huán)蛋白信號(hào)傳導(dǎo)來抑制非小細(xì)胞肺癌細(xì)胞的增殖并誘導(dǎo)其凋亡[18];CDC45參與DNA復(fù)制并維護(hù)基因組穩(wěn)定,CDC45功能缺失會(huì)促進(jìn)腫瘤的發(fā)生[19-20]。由此可以預(yù)測,GPCR116基因可能通過正向調(diào)節(jié)HOPX、WIF1、SFTPD來誘導(dǎo)肺腺癌細(xì)胞衰老、凋亡,抑制肺腺癌細(xì)胞的增殖、黏附和侵襲。
本研究得到10個(gè)關(guān)鍵基因(NKX2-1、SFTPB、SFTPC、SCGB1A1、PITX1、FOXM1、MYBL2、CDCA3、TFF1、WIF1),其中SFTPC、SCGB1A1、PITX1、FOXM1、MYBL2、CDCA3、WIF1這7個(gè)基因在肺癌中的作用已明確[21-23]。但SFTPB、TFF1、NKX2-1這3個(gè)關(guān)鍵基因的作用尚不明確,可能與患者的預(yù)后相關(guān),或可作為潛在的治療靶點(diǎn)。例如,SFTPB可用于肺腺癌的前期篩查和預(yù)后評(píng)估[24];TFF-1在某些肺癌細(xì)胞中過度表達(dá),可驅(qū)動(dòng)腫瘤抑制[25];NKX2-1可通過抑制細(xì)胞外調(diào)節(jié)蛋白激酶的活性來控制肺癌進(jìn)展[26]。本研究篩選出的關(guān)鍵基因有助于肺癌的診斷與治療,但其具體的作用還有待進(jìn)一步研究。
綜上所述,GPCR116基因在肺腺癌組織中顯著高表達(dá),且其表達(dá)量與肺腺癌患者的預(yù)后相關(guān),可作為肺腺癌患者預(yù)后的預(yù)測因素。P53信號(hào)通路、錯(cuò)配修復(fù)、溶酶體蛋白等通過調(diào)控GPCR116基因的表達(dá)而在肺腺癌的發(fā)生、發(fā)展中發(fā)揮重要作用。本文篩選出的10個(gè)關(guān)鍵基因,或可為揭示肺腺癌的一些潛在致病機(jī)制提供參考。