馬國(guó)玉,熊 慶,蔣國(guó)慶,楊家甜,木云珍
(1) 昆明醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,云南昆明 650500;2) 云南省疾病預(yù)防控制中心環(huán)境衛(wèi)生所,云南昆明 650022;3) 昆明醫(yī)科大學(xué)第一附屬醫(yī)院產(chǎn)科,云南昆明 650032)
肺癌是嚴(yán)重威脅人類健康的惡性腫瘤之一,其發(fā)病率和病死率均較高,已分別占到癌癥總發(fā)病數(shù)和總死亡數(shù)的11.6%和18.4%[1]。近年來(lái),我國(guó)肺癌的發(fā)病人數(shù)不斷上升,尤其以云南宣威較為嚴(yán)重[2]。據(jù)權(quán)威估計(jì),到2020 年我國(guó)肺癌發(fā)病人數(shù)將突破80 萬(wàn),死亡人數(shù)將接近70 萬(wàn)[3]。肺腺癌作為肺癌的主要類型之一,占到所有肺癌的40%,危害較大[4]。已有研究結(jié)果證明,一些基因在肺腺癌的發(fā)生發(fā)展過(guò)程中起著重要的調(diào)控作用[5-6]。肺腺癌分子機(jī)制研究對(duì)肺癌的靶點(diǎn)治療有著重要意義。本研究基于GEO 數(shù)據(jù)庫(kù),獲取肺腺癌的相關(guān)基因芯片數(shù)據(jù)集,利用多種生物信息學(xué)方法篩選出差異基因,并進(jìn)一步篩選得到關(guān)鍵基因,進(jìn)而分析關(guān)鍵基因的表達(dá)與肺腺癌的相關(guān)性。
基于美國(guó)國(guó)家生物信息技術(shù)中心(national center for biotechnology information,NCBI) 下的基因表達(dá)綜合數(shù)據(jù)庫(kù)(gene expression omnibus,GEO),獲取肺腺癌基因表達(dá)譜數(shù)據(jù),輸入關(guān)鍵詞為:“l(fā)ung adenocarcinoma”,檢索條件為:“homo sapiens”、“expression profiling by array” 和“tissue”。共下載到四個(gè)數(shù)據(jù)集,分別為GSE10072、GSE32863、GSE43458 和GSE116959,其平臺(tái)及樣本等詳細(xì)信息見(jiàn)表1。
表1 基因表達(dá)譜數(shù)據(jù)信息表Tab.1 Information table of gene expression profile data
用R 語(yǔ)言的Limma 包分別對(duì)四組基因表達(dá)譜數(shù)據(jù)進(jìn)行差異基因的篩選,篩選條件為:P<0.05,|Log2FC|≥1。用Intersect 函數(shù)對(duì)四組差異基因取交集,并用VennDiagram 包繪制韋恩圖。
利用在線網(wǎng)站STRING(https://string-db.org/cgi) 對(duì)差異基因進(jìn)行蛋白-蛋白互相作用(Protein-protein interaction,PPI) 網(wǎng)絡(luò)分析。將已經(jīng)建立的差異基因PPI 網(wǎng)絡(luò)導(dǎo)入到Cytoscape 3.7.2(https://cytoscape.org/) 中進(jìn)行可視化。
利用在線網(wǎng)站DAVID(https://david.ncifcrf.gov/home.jsp) 對(duì)差異基因進(jìn)行GO 分析(Gene Ontology,GO),包括分子功能 (Molecular Function)、細(xì)胞組成(Cell Component) 與生物學(xué)過(guò)程(Biology Process),以及KEGG 通路分析(Kyoto Encyclopedia of Genes and Genomes),尋找不同的差異基因可能和哪些基因功能和細(xì)胞信號(hào)通路有關(guān)。
Cytoscape 是一款圖形化顯示網(wǎng)絡(luò)并進(jìn)行分析和編輯的軟件,可利用軟件本身的編輯器模塊直接構(gòu)建PPI 網(wǎng)絡(luò)。本研究將差異基因的PPI 結(jié)果導(dǎo)入Cytoscape 軟件中,用其插件CytoHubba[7]篩選關(guān)鍵基因。
GEPIA(http://gepia.cancer-pku.cn/) 是由北京大學(xué)開(kāi)發(fā)的基因表達(dá)譜動(dòng)態(tài)數(shù)據(jù)分析數(shù)據(jù)庫(kù),利用該數(shù)據(jù)庫(kù)挖掘肺腺癌關(guān)鍵基因在肺腺癌組織與正常肺組織中的差異表達(dá),篩選條件為:|Log2FC|≥1、P<0.01。通過(guò)GEPIA 數(shù)據(jù)庫(kù)對(duì)肺腺癌數(shù)據(jù)進(jìn)行生存分析,篩選條件為95%置信區(qū)間,以月作為時(shí)間軸。采用t檢驗(yàn)分析基因表達(dá)的差異,采用Log-rank 檢驗(yàn)分析關(guān)鍵基因在肺腺癌中表達(dá)量與預(yù)后的關(guān)系。
人類疾病甲基化數(shù)據(jù)庫(kù)2.0 版(http://bioinfo.hrbmu.edu.cn/disease meth) 結(jié)合了來(lái)自芯片和測(cè)序技術(shù)的甲基化數(shù)據(jù),并注釋了人類疾病中DNA 甲基化的狀態(tài)[8]。筆者利用該網(wǎng)站對(duì)肺腺癌組織和正常肺組織中關(guān)鍵基因的甲基化水平進(jìn)行了比較。
對(duì)四組基因芯片表達(dá)譜數(shù)據(jù)進(jìn)行分析,共篩選到214 個(gè)差異基因,其中,上調(diào)基因42 個(gè),下調(diào)基因172 個(gè)。篩選結(jié)果見(jiàn)圖1。
用差異基因構(gòu)建PPI 網(wǎng)絡(luò),網(wǎng)絡(luò)中共包含186個(gè)節(jié)點(diǎn)和565 個(gè)鏈接,即186 個(gè)基因和565 個(gè)相互作用關(guān)系,見(jiàn)圖2(紅色表示上調(diào)基因,綠色表示下調(diào)基因)。
圖1 差異基因表達(dá)的韋恩圖Fig.1 Venn diagram of differential gene expression
圖2 差異表達(dá)基因的PPI 網(wǎng)絡(luò)圖Fig.2 The PPI network diagram of differentially expressed genes
為了比較肺腺癌組織和正常肺組織中差異基因的功能,筆者對(duì)214 個(gè)差異表達(dá)的基因進(jìn)行了GO 分析和KEGG 通路分析。GO 分析中顯著富集的生物學(xué)過(guò)程結(jié)果顯示差異基因與細(xì)胞增殖、細(xì)胞周期和凋亡過(guò)程有關(guān),見(jiàn)圖3(A、B 和C)。KEEG 通路分析的結(jié)果表明差異表達(dá)基因參與PPAR、HIF-1、細(xì)胞粘附分子(CAMs)和PI3K-Akt 等信號(hào)通路,見(jiàn)圖3D。
Cytohubba 插件計(jì)算的結(jié)果包括十一種算法的結(jié)果,筆者選擇最常用的三種算法(Degree、Closeness 和Betweenness) 篩選排名前十的基因,篩選結(jié)果見(jiàn)表2,其相應(yīng)的網(wǎng)絡(luò)圖見(jiàn)圖4。
GEPIA 分析結(jié)果顯示,PECAM1、SPP1 和KIAA0101 三個(gè)關(guān)鍵基因的表達(dá)對(duì)患者的總生存時(shí)間有著顯著影響,三種關(guān)鍵基因與生存時(shí)間具有顯著相關(guān)性(P<0.05),結(jié)果見(jiàn)圖5。
為了探討上述關(guān)鍵基因在肺腺癌組織和正常組織中的表達(dá)差異是否與DNA 甲基化水平有關(guān),筆者參考了DiseaseMeth 2.0。結(jié)果顯示,GNG11、COL3A1 和FOS 在肺腺癌組織中的甲基化水平高于正常組織,SPP1 和KIAA0101 在肺腺癌組織中的甲基化水平低于正常組織,結(jié)果見(jiàn)圖6。6 個(gè)關(guān)鍵基因的在肺腺癌組織和正常組織中的表達(dá)差異見(jiàn)圖7。
圖3 GO 和KEGG 分析結(jié)果Fig.3 The results of GO analysis and KEGG analysis
表2 排名前10 的基因信息表Tab.2 Information table of 10 strongest genes
圖4 三種算法結(jié)果排名前10 的基因在網(wǎng)絡(luò)中的相互關(guān)系Fig.4 The interrelationships in gene networks of 10 strongest genes in three algorithms
圖5 關(guān)鍵基因的表達(dá)與患者預(yù)后的生存曲線Fig.5 The key gene expression and survival curves of the patients'prognosis
圖6 肺腺癌關(guān)鍵基因的甲基化分析Fig.6 The methylation analysis key genes of the patients
圖7 關(guān)鍵基因在肺腺癌組織與正常肺組織中表達(dá)量的GEPIA 分析結(jié)果Fig.7 The key genes expression'GEPIA analysis results of pulmonary adenocarcinoma and normal lung tissue
當(dāng)前對(duì)于肺癌的環(huán)境因素研究相對(duì)成熟,但其發(fā)生發(fā)展的分子機(jī)制尚不明確。肺腺癌基因的研究有助于明確其發(fā)生發(fā)展的病理機(jī)制,進(jìn)而有利于肺腺癌疾病的診斷、治療及其預(yù)后。隨著二代基因測(cè)序和芯片技術(shù)的不斷成熟,以及生物信息學(xué)的迅猛發(fā)展,肺腺癌發(fā)生發(fā)展過(guò)程中的差異表達(dá)基因篩選變得更加簡(jiǎn)易,這從分子層面為研究肺腺癌發(fā)病機(jī)制提供了更廣泛的思路和更優(yōu)化的條件,打開(kāi)了新的視角。已有文獻(xiàn)表明多種基因與肺腺癌的預(yù)后相關(guān)[9]。為了尋找與肺腺癌關(guān)系密切的基因,筆者從全球最大的基因表達(dá)綜合數(shù)據(jù)庫(kù)(GEO) 中選取了四組基因表達(dá)芯片數(shù)據(jù)集GSE10072、GSE32863、GSE43458 和GSE116959。將四組數(shù)據(jù)集整合后獲得肺腺癌的差異表達(dá)基因,為了對(duì)數(shù)據(jù)整理結(jié)果進(jìn)行更透徹的分析,明確結(jié)果的意義,本研究采用了多種生物信息分析方法,對(duì)篩選出的差異基因進(jìn)行分析。
本研究的GO 分析表明,差異基因與細(xì)胞增殖、細(xì)胞周期和凋亡過(guò)程有關(guān)。KEEG 通路分析結(jié)果表明差異基因參與PPAR、HIF-1、CAMs 和PI3K-Akt 等信號(hào)通路。PPARγ 是核激素受體配體依賴性轉(zhuǎn)錄因子,在多種生物過(guò)程中扮演重要角色,包括調(diào)制的代謝、炎癥反應(yīng)和細(xì)胞分化,在肺腺癌中參與了腫瘤的增殖和凋亡[10]。CAMs 與腫瘤疾病的診療已被廣泛研究,已經(jīng)有大量研究表明其與腫瘤的增殖、侵襲和轉(zhuǎn)移密切相關(guān)[11-14]。PI3K-Akt 信號(hào)通路作為經(jīng)典的腫瘤信號(hào)通路已經(jīng)在肺腺癌的發(fā)病機(jī)制中被多次報(bào)道[15-17]。生物信息學(xué)分析結(jié)果提示肺腺癌組織中差異基因與肺腺癌的發(fā)病機(jī)制密切相關(guān),可能通過(guò)這些信號(hào)通路參與其發(fā)生發(fā)展。
本研究分析結(jié)果顯示,MMP9,PECAM1,VWF,COL1A1,SPP1,TIMP1,CD34,EDN1,DCN,COL3A1,GNG11,KIAA0101 和FOS 這13個(gè)基因富集分?jǐn)?shù)較高。生存分析表明PECAM1,SPP1 和KIAA0101 與患者的生存密切相關(guān),甲基化分析結(jié)果顯示,肺腺癌組織中的SPP1 和KIAA0101 甲基化程度較低,COL3A1、GNG11 和FOS 甲基化程度較高。PECAM1 是血小板-內(nèi)皮細(xì)胞黏附分子(Platelet Endothelial Cell Adhesion Molecule 1),已有研究結(jié)果表明其在非小細(xì)胞肺癌中表達(dá)高于正常組織[18],筆者的分析結(jié)果與之相同,這更加驗(yàn)證了PECAM1 對(duì)于肺腺癌發(fā)生發(fā)展的重要意義。SPP1 是分泌性磷蛋白-1(Secreted Phosphorprotein-1),眾多研究表明其參與多種病理生理過(guò)程以及腫瘤的發(fā)生發(fā)展,包括結(jié)直腸癌[19]、肝細(xì)胞[20]、肺鱗癌[21]和肺腺癌[22]等腫瘤的進(jìn)展。筆者的分析結(jié)果也表明SPP1 與肺腺癌預(yù)后存在相關(guān)性。因此,SPP1 精確的分子機(jī)制在肺腺癌中的表達(dá)、定位和分子功能的進(jìn)一步研究是極為必要的。KIAA0101 也被稱為也PCLAF,很可能參與了細(xì)胞的增殖、分化、遷移、凋亡、代謝及DNA 修復(fù)等過(guò)程,先前有報(bào)道出其在卵巢癌[23]、胃癌[24]的表達(dá)水平異常,但是關(guān)于其與肺腺癌的相關(guān)研究為數(shù)尚少。筆者的發(fā)現(xiàn)為肺腺癌預(yù)后相關(guān)基因提供了新的切入點(diǎn),發(fā)現(xiàn)肺腺癌發(fā)生發(fā)展與KIAA0101 基因的關(guān)系。有研究報(bào)道了COL3A1 與早期卵巢癌預(yù)后有關(guān)[25],F(xiàn)OS 對(duì)肺腺癌A549 細(xì)胞的惡性生物學(xué)行為具有抑制作用[26],其亞型c-Fos 在癌細(xì)胞中的表達(dá)明顯高于癌旁組織,可導(dǎo)致上皮間質(zhì)化,促進(jìn)腫瘤轉(zhuǎn)移[27]。但GNG11 與肺腺癌的研究尚未見(jiàn)有報(bào)道。本研究的分析結(jié)果提示COL3A1、GNG11 和FOS 可能通過(guò)甲基化調(diào)控參與了肺腺癌的發(fā)生發(fā)展。
綜上所述,本研究分析發(fā)現(xiàn)了PECAM1、SPP1、KIAA0101、COL3A1、GNG11 和FOS 六個(gè)基因在肺腺癌組織與正常組織中表達(dá)存在顯著差異,預(yù)測(cè)它們極有可能參與了肺腺癌發(fā)生發(fā)展的調(diào)控。通過(guò)甲基化分析發(fā)現(xiàn)它們的甲基化水平也存在差異,因此它們可能通過(guò)甲基化調(diào)控參與了肺腺癌的發(fā)展。這六個(gè)基因?qū)τ陬A(yù)測(cè)肺腺癌預(yù)后有一定參考意義和價(jià)值,可作為肺腺癌的生物標(biāo)志物進(jìn)一步研究,有望成為肺腺癌重要的診斷標(biāo)志物和治療靶點(diǎn)。因此,筆者的發(fā)現(xiàn)將有助于從分子機(jī)制了解肺腺癌的發(fā)生發(fā)展,并為肺腺癌的早期診斷、靶點(diǎn)治療和預(yù)后提供新的潛在生物學(xué)標(biāo)志物。
昆明醫(yī)科大學(xué)學(xué)報(bào)2020年7期