国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于TCGA數(shù)據(jù)庫分析TET1在肺腺癌的表達(dá)及其相關(guān)分析

2019-07-30 06:16馬晨陽楊勇
浙江臨床醫(yī)學(xué) 2019年6期
關(guān)鍵詞:共表達(dá)網(wǎng)絡(luò)分析拷貝數(shù)

馬晨陽 楊勇*

肺癌是常見的惡性腫瘤,其發(fā)病率和病死率居惡性腫瘤首位,且在中國上升趨勢明顯[1]。目前對肺癌的防治主要為控?zé)熀驮缙谠\斷篩查,其中肺癌早期診斷篩查處于關(guān)鍵地位。若能早期篩查到肺癌病變,并手術(shù)切除,肺癌患者的5年生存率可得到較大提高[2]。近年來隨著表觀遺傳學(xué)的發(fā)展,5-甲基胞嘧啶(5-methylcytosine,5mC)在腫瘤的早期診斷和防治方面扮演了重要角色,而由其在DNA甲基胞嘧啶雙加氧酶1(Ten-eleven translocation methylcytosine dioxygenase 1,TET1)調(diào)控腫瘤機(jī)制成為新的熱點(diǎn)。研究表明,TET1作為一個(gè)重要的催化酶參與了DNA的主動去甲基化過程[3],并且與胃癌、結(jié)直腸癌、肝癌、肺癌和乳腺癌等多種癌癥的發(fā)生發(fā)展密切相關(guān)。由于肺癌早治療、高生存的優(yōu)勢,尋求可能的判斷早期肺癌,檢測復(fù)發(fā)和轉(zhuǎn)移的分子標(biāo)記具有較高價(jià)值。本研究利用TCGA公共數(shù)據(jù),探討TET1在肺腺癌(LUAD)中的表達(dá)和預(yù)后情況,并預(yù)測其參與LUAD發(fā)生發(fā)展的作用機(jī)制。

1 材料與方法

1.1 研究對象 本研究所采用的數(shù)據(jù)均來源于腫瘤 基 因 組 圖 譜(Cancer Genome Atlas,TCGA)( 美國National Cancer Institute和National Human Genome Research Institute聯(lián)合啟動項(xiàng)目),數(shù)據(jù)收集了截至2019年1月的LUAD組織樣本及臨床預(yù)后數(shù)據(jù)(包括mRNA表達(dá)數(shù)據(jù)和臨床資料)。通過多種在線TCGA數(shù)據(jù)分析工具,包括可視化工具 cBioPortal[4]和 GEPIA[5]等,對TET1在LUAD中的表達(dá)情況進(jìn)行分析。排除標(biāo)準(zhǔn):(1)患有其他腫瘤病史;(2)存在基本資料缺失患者。

1.2 研究方法 本研究首先通過GEPIA分析TCGA的LUAD數(shù)據(jù)庫,比較TET1基因在LUAD和正常組織中的表達(dá)差異,并對其臨床病理分期和總生存預(yù)后進(jìn)行相關(guān)分析,確定TET1基因在LUAD中的醫(yī)學(xué)研究價(jià)值。然后通過cBioPortal分析比較TET1在TCGA數(shù)據(jù)庫多個(gè)數(shù)據(jù)集的LUAD基因轉(zhuǎn)錄組(RVAseqV2,raw count)的總體表達(dá)水平,排除個(gè)體與組織取樣時(shí)間的差異。研究TET1基因拷貝數(shù)變異、甲基化水平與其mRNA表達(dá)水平的相關(guān)性,推測TET1基因在LUAD發(fā)生作用的機(jī)制。同時(shí)檢測TET1基因與臨床常見LUAD驅(qū)動基因EGFR、TP53的相關(guān)性,并對TET1、EGFR、TP53三個(gè)基因通過cBioPortal的Network功能和STRING[6]進(jìn)行蛋白相互作用網(wǎng)絡(luò)分析,確認(rèn)TET1區(qū)別于EGFR、TP53在LUAD中的獨(dú)特作用,即作為不同于傳統(tǒng)LUAD驅(qū)動基因的新型基因靶點(diǎn)地位。在獲取TET1的共表達(dá)基因后,與來源于TCGA和GEO的LUAD數(shù)據(jù)集所共有的高表達(dá)基因(P-value<0.001,|FoldChange|>2.02)進(jìn)行venn圖分析,找出確定的基因組,并將基因組集導(dǎo)入DAVID分析工具[7]進(jìn)行GO基因集富集分析和通路分析,并使用funrich3.1.3導(dǎo)出效果圖。

1.3 統(tǒng)計(jì)分析 采用SPSS 20.0統(tǒng)計(jì)軟件。生存分析使用Kaplan-Meier和Log-rank檢驗(yàn),P<0.05為差異有統(tǒng)計(jì)學(xué)意義。其它基因表達(dá)與CNV的相關(guān)性以及共表達(dá)蛋白的相關(guān)性使用Spearman(相關(guān)系數(shù):1代表完全線性正相關(guān),0不相關(guān),-1完全線性負(fù)相關(guān))和Pearson檢驗(yàn)相關(guān)系數(shù)(0.8~1.0極強(qiáng)相關(guān),0.6~0.8強(qiáng)相關(guān),0.4~0.6中等程度相關(guān),0.2~0.4弱相關(guān),0.0~0.2極弱相關(guān)或無相關(guān)),R>0.3且P<0.05認(rèn)為有統(tǒng)計(jì)學(xué)相關(guān)。富集功能分析采用Fisher檢驗(yàn),P<0.05為功能富集有統(tǒng)計(jì)學(xué)差異。

2 結(jié)果

2.1 TET1在LUAD及正常肺組織中的表達(dá)情況 GEPIA分析TET1在LUAD、肺鱗癌(LUSC)與相鄰正常肺組織的表達(dá)情況,結(jié)果見圖1。圖1A表明在TCGA數(shù)據(jù)庫中,TET1基因在LUAD組和LUSC組的mRNA表達(dá)情況,結(jié)果顯示TET1在LUAD和LUSC的表達(dá)水平均顯著高于相鄰正常組織(P<0.05)。圖1B通過oncomine在線分析工具對TET1在非小細(xì)胞肺癌及正常肺組織的表達(dá)情況再次分析,以對GEPIA的結(jié)果驗(yàn)證,結(jié)果顯示TET1在LUAD的表達(dá)量仍高于正常肺組織。因此,由以上重復(fù)驗(yàn)證可推斷TET1在LUAD的表達(dá)量確實(shí)高于正常肺組織(P<0.05)。

圖1 TET1基因在不同非小細(xì)胞肺癌的表達(dá)情況[A:TET1在LUAD、LUSC與正常肺組織表達(dá)水平的情況;B:TET1在正常肺(1)、LUAD(2)、大細(xì)胞肺癌(3)、LUSC(4)與正常肺組織表達(dá)水平的情況]

2.2 TET1表達(dá)水平對LUAD患者預(yù)后的影響 GEPIA分析在LUAD中TET1高低表達(dá)水平對患者的病理分期及其生存預(yù)后的情況,結(jié)果見圖2。圖2A表明隨著LUAD臨床病理的不斷惡化,TET1的表達(dá)水平呈現(xiàn)上升趨勢,而LUADⅠ期的TET1表達(dá)水平雖然最大值與后期表達(dá)水平相當(dāng),但其中位數(shù)仍低于后期表達(dá)水平,這可能是由于樣本個(gè)體數(shù)據(jù)所造成的偏倚。可見在不同的病理總分期之間的TET1表達(dá)水平具有統(tǒng)計(jì)學(xué)差異(P=0.04),且隨病理分期的增加TET1基因的表達(dá)水平逐漸上升。圖2B表明LUAD患者的總生存期與TET1基因表達(dá)水平的相關(guān)性,與TET1基因高表達(dá)(n=239)相比,TET1基因低表達(dá)(n=226)的LUAD患者總生存率[P=0.045;HR=1.4,P(HR)=0.046]明顯降低,可見TET1高表達(dá)患者的生存時(shí)間較短,預(yù)后較差。

圖2 TET1基因在LUAD病理分期的情況及生存預(yù)后(A:TET1在不同LUAD病理分期的表達(dá)情況;B:TET1表達(dá)水平與LUAD患者生存時(shí)間的相關(guān)性)

2.3 納入分析的人群基本特征 cBioPortal分析選 擇TCGA數(shù) 據(jù) 集Lung Adenocarcinoma(TCGA,Provisional),共納入的586例LUAD樣本。其中男242例(41.4%),女280例(47.9%);除去年齡未知的數(shù)據(jù),平均年齡(65.619±9.914)歲;LUAD病理分期Ⅰ期(包括Ⅰ、ⅠA、ⅠB)有279例(47.8%),Ⅱ期(包括Ⅱ、ⅡA、ⅡB)有124例(21.3%),Ⅲ期(包括ⅢA、ⅢB)有85例(14.6%),Ⅳ期有26例(4.5%),此外分期未知70例(12.0%);除去未知數(shù)據(jù)外,平均腫瘤直徑(1.18±0.515)cm。

2.4 TET1基因的拷貝數(shù)變異、甲基化水平與其mRNA表達(dá)水平的相關(guān)性 cBioPortal在線分析工具可對TCGA數(shù)據(jù)庫LUAD(TCGA,Provisional)數(shù)據(jù)集中TET1基因拷貝數(shù)變異、甲基化水平與其mRNA表達(dá)水平的相關(guān)性情況進(jìn)行分析??截悢?shù)變異(Copy number variation,CNV)指>1kb DNA大片段的缺失(Deletion)、增加(Duplication)或倒置(Inversion),作為一種基因組多樣性形式,在癌癥發(fā)展過程中起著重要作用。TET1基因的拷貝數(shù)變異(CNV)主要集中于 Diploid、Gain和 Shallow Deletion,其中 Diploid為二倍體,即沒有拷貝數(shù)變異,Shallow Deletion是拷貝數(shù)的輕度丟失,Gain是輕度拷貝數(shù)擴(kuò)增。隨著DNA甲基化水平的不斷上升,TET1基因的表達(dá)量逐漸下降,兩者呈負(fù)相關(guān),相關(guān)性較弱(Spearman:r=-0.33,Pearson:r=-0.13,P<0.001)。總之,TET1 mRNA Sqe分析表明TET1基因在LUAD中雜合缺失、低水平基因擴(kuò)增的頻率較高,而其與DNA甲基化相關(guān)性較小。

2.5 TET1基因與臨床常見LUAD驅(qū)動基因的相關(guān)性 目前臨床常用的檢測LUAD驅(qū)動基因主要為EGFR、TP53,其與患者的治療、預(yù)后密切相關(guān)。作為近年熱門的免疫治療,EGFR、TP53基因突變是治療的優(yōu)勢靶點(diǎn)。本研究將結(jié)合EGFR、TP53基因,通過cBioPortal在線分析工具分析在TCGA數(shù)據(jù)庫LUAD(TCGA,Provisional)數(shù)據(jù)集中TET1基因與兩者的相關(guān)性。結(jié)果顯示,EGFR與TP53基因共表達(dá)趨勢顯著(P<0.001,q<0.001),TET1與 TP53基因的存在共表達(dá)趨勢(P=0.012),存在顯著的共表達(dá)趨勢,而其與EGFR基因則無顯著相關(guān)性(P=0.061)。通過GEPIA對TET1與EGFR、TP53兩者在LUAD的相關(guān)性再次進(jìn)行驗(yàn)證,結(jié)果顯示,在整合所有TCGALUAD數(shù)據(jù)后,發(fā)現(xiàn)TET1與EGFR呈弱相關(guān)性(R=0.3,P=3.4e-11),而TET1與TP53兩者呈極弱相關(guān)性(R=0.11,P=0.017)。這與cBioPortal單數(shù)據(jù)集分析結(jié)果較一致,綜合兩者分析,可以認(rèn)為TET1與EGFR、TP53基因的相關(guān)性較弱,可能是不同于傳統(tǒng)EGFR、TP53基因的新型LUAD靶點(diǎn)基因。

2.6 蛋白相互作用網(wǎng)絡(luò)分析(PPI) 通過cBioPortal的Network功能和STRING對TET1、EGFR、TP53三個(gè)基因進(jìn)行蛋白相互作用網(wǎng)絡(luò)分析,確認(rèn)TET1區(qū)別于EGFR、TP53在LUAD中的獨(dú)特位置。通過cBioPortal的Network功能,共篩選出TET1、EGFR、TP53基因的共表達(dá)基因如下:ACTB、ACTG1、AGO2、AKT1、AKT2、AKT3、BAZ1B、CCNK、CDH10、CDH12、CDH18、CDH6、CDH9、CDKN2A、COP1、DDR2、DROSHA、DVL3、DYRK1A、EGFR、FCGR1A、FCGR3A、FOXA1、GAB2、GDNF、GRB2、HGS、MAPK14、MAPKAPK、MCL1、MDM4、MET、NDRG1、NF1、PDP1、PIK3CA、PIP4K2B、PITPNA、PRKAB2、PRKD1、PRKDC、PTK2、S100A2、SHC1、SKP2、SPTA1、STK11、STK17A、TERT、TET1、TP53、TP53INP1、TRIO。將基因納入Network網(wǎng)絡(luò)后,EGFR和TP53在PPI網(wǎng)絡(luò)中處于中心地位,與絕大多數(shù)的共表達(dá)基因節(jié)點(diǎn)相連接,而TET1由于聯(lián)系較弱,并未出現(xiàn)在Network網(wǎng)絡(luò)中。通過STRING對以上共表達(dá)基因進(jìn)行再次驗(yàn)證后,發(fā)現(xiàn)TET1基因處于PPI網(wǎng)絡(luò)的邊緣位置,與EGFR、TP53基因無直接連接節(jié)點(diǎn),間接連接節(jié)點(diǎn)僅AKT1。綜合相關(guān)性分析和PPI網(wǎng)絡(luò)分析,說明TET1確實(shí)與傳統(tǒng)LUAD驅(qū)動基因EGFR、TP53無明顯相關(guān),可能是作為一種獨(dú)立的驅(qū)動基因?qū)UAD的發(fā)生發(fā)展起作用的。

2.7 TET1的共表達(dá)基因 通過cBioPortal分析方法對TET1在LUAD的共表達(dá)基因進(jìn)行篩選,結(jié)果的P值從小到大進(jìn)行排序,選取P值最小的前100個(gè)共表達(dá)基因。同時(shí)通過Cancer RNA-Seq Nexus[8]下載TCGA和GEO的LUAD基因數(shù)據(jù)集組,對高表達(dá)基因進(jìn)行篩選去重處理(P-value<0.001,|FoldChange|>2.02),得到三組基因集,分別為早期LUAD與正常肺組織對照所得的高表達(dá)基因,中晚期LUAD與正常肺組織對照所得的高表達(dá)基因以及GEO數(shù)據(jù)庫(GES40419)中LUAD與正常肺組織對照所得的高表達(dá)基因,通過Venn圖進(jìn)行分析后確定共表達(dá)的基因組。將共表達(dá)基因組與cBioPortal分析方法所得的TET1共表達(dá)基因組再次進(jìn)行Venn圖分析,確定TET1在LUAD有13個(gè)共表達(dá)基因,分別為TET1、DNMT3A、MEX3A、PAPOLA、SMC6、XPO5、ATAD2B、ZNF146、ZNF260、HMOX2、CCAR1、TRADD、TMEM219。

2.8 TET1基因的PPI網(wǎng)絡(luò)分析 在獲取TET1的共表達(dá)基因后,通過cBioPortal的Network功能將共表達(dá)基因?qū)?,進(jìn)行PPI網(wǎng)絡(luò)分析。結(jié)果顯示:基因 MRPL54、TRADD、CTSD、CD74、MAPKAPK3、PRPF4B、RPS6KA1、GNA1S、CLTB、PSMB10、SOS1、SPSF6、TREM2、LGALS3、OAZ1處 于 調(diào)控網(wǎng)絡(luò)的中心地位,有多個(gè)Node相連接。其中,RPS6KA1、MAPKAPK3、CTSD、CD74、LGALS3 為現(xiàn)有藥物的靶點(diǎn)。

2.9 TET1基因集富集分析及通路預(yù)測 通過對TET1基因相關(guān)共表達(dá)基因分析發(fā)現(xiàn),TET1基因與一些基因表達(dá)水平存在明顯的關(guān)聯(lián),對包括TET1相關(guān)表達(dá)GO功能富集分析(見表1),發(fā)現(xiàn)這些共表達(dá)基因的細(xì)胞組分主要集中在細(xì)胞核和細(xì)胞質(zhì),生物學(xué)功能主要集中于調(diào)控堿基、核苷功能,分子功能富集主要在DNA連接和轉(zhuǎn)錄活動的調(diào)控。因此,TET1相關(guān)共表達(dá)基因主要通過遺傳轉(zhuǎn)錄調(diào)控方面調(diào)節(jié)腫瘤的發(fā)生發(fā)展。表1表明三條通路 HSA-212165、HSA-74160、HSA-5334118與TET1基因具有相關(guān)性。提示對TET1基因在LUAD的機(jī)制分析可從這三條通路考慮,且此三條通路的功能與go注釋分析結(jié)果,遺傳轉(zhuǎn)錄調(diào)控調(diào)節(jié)腫瘤相一致。

表1 TET1的通路分析

3 討論

LUAD作為惡性程度較高的呼吸道腫瘤,若早期未發(fā)現(xiàn),常會錯(cuò)過最佳治療時(shí)期,放療、化療等綜合治療對患者生存時(shí)間的改善甚微,其治療的首選方案為手術(shù),但長期的臨床實(shí)踐表明,對于LUAD單純手術(shù)的治療效果有限[2]。因此,早期發(fā)現(xiàn)并診斷LUAD成為目前迫在眉睫的問題。通過對LUAD基因的調(diào)查,發(fā)現(xiàn)了以前的基因研究尚不完善。在過去的幾十年里,有一些分子標(biāo)志物被研究出來,作為LUAD早期診斷的基因標(biāo)志物。

DNA甲基化是腫瘤發(fā)生發(fā)展過程中的重要角色,其通過沉默抑癌基因表達(dá)而影響腫瘤進(jìn)程,而DNA去甲基化則可使抑癌基因再表達(dá)。TET1基因作為DNA去甲基化酶在許多腫瘤的發(fā)生、發(fā)展中有著不同的改變,其對于腫瘤的密切關(guān)系與日俱增。LUAD患者存在TET1基因突變頻率增加的情況,并且LUAD中TET1大多數(shù)的變異是基因缺失,TET1基因主要是通過腫瘤細(xì)胞周期抑制劑調(diào)控腫瘤進(jìn)展。在胃癌、結(jié)直腸癌、肝癌、肺癌和乳腺癌等多種癌癥中發(fā)現(xiàn)腫瘤組織中TET1表達(dá)水平的降低常伴隨5hmC水平降低[9],表明5hmC也可能在TET1蛋白的作用下通過去甲基化作用抑制抑癌基因的表達(dá)。在實(shí)驗(yàn)動物腫瘤種植模型上,有研究者觀察到小鼠TET1基因的敲除會強(qiáng)化腫瘤細(xì)胞的侵襲能力、生長速度及轉(zhuǎn)移能力[10],并發(fā)現(xiàn)5hmC水平的相應(yīng)變化。這可能是由于TET1表達(dá)降低導(dǎo)致抑癌基因沉默,最終使正常細(xì)胞惡變并促其增殖。但TET1基因還存在一些不足,其在非實(shí)體腫瘤的檢測中也有升高,如在白血病中等等。所以,通過認(rèn)識、了解TET1基因的改變特點(diǎn),有可能為LUAD的早期診斷及治療提供新的思路和方法。

本研究結(jié)果表明,在LUAD中TET1基因表達(dá)上升是一種預(yù)后較差的因素。利用 TCGA數(shù)據(jù)庫分析發(fā)現(xiàn)TET1基因在LUAD中特異性高表達(dá),且TET1高表達(dá)的LUAD患者總生存預(yù)后較差。對TET1基因的CNV、甲基化水平與其mRNA的表達(dá)水平的相關(guān)性研究,發(fā)現(xiàn)TET1基因在LUAD中雜合缺失、低水平基因擴(kuò)增的頻率較高,而其與DNA甲基化相關(guān)性較小。臨床常檢測驅(qū)動基因TP53、EGFR在LUAD中的表達(dá),相關(guān)性分析發(fā)現(xiàn)TET1基因與兩者無顯著相關(guān),而PPI網(wǎng)絡(luò)分析也驗(yàn)證了這一結(jié)果,可見TET1基因可能作為一種獨(dú)立的LUAD驅(qū)動基因?qū)UAD的發(fā)生、發(fā)展起到作用。

再次對TET1基因功能的研究通過共表達(dá)基因的方式進(jìn)行,對TET1共表達(dá)基因的PPI網(wǎng)絡(luò)分析發(fā)現(xiàn)DNMT3A、DNMT3L、CCAR1與TET1基因存在明顯的上下游關(guān)系。結(jié)合TET1及其共表達(dá)基因的KEGG-GO功能富集分析,發(fā)現(xiàn)這些共表達(dá)基因的功能主要集中于一些遺傳轉(zhuǎn)錄調(diào)控方面的信號通路,可確認(rèn)TET1在LUAD產(chǎn)生作用主要是通過遺傳轉(zhuǎn)錄調(diào)控方面調(diào)節(jié)腫瘤的發(fā)生發(fā)展。

綜上所述,本研究依托TCGA數(shù)據(jù)庫,對LUAD患者進(jìn)行大樣本數(shù)據(jù)分析和臨床資料對比分析,探討TET1基因表達(dá)水平對患者預(yù)后的影響,可確定TET1基因可作為不同于傳統(tǒng)EGFR、TP53的LUAD驅(qū)動基因,對LUAD的發(fā)生發(fā)展起到促進(jìn)作用。對TET1在LUAD的后續(xù)機(jī)制和相關(guān)共表達(dá)基因的研究,有利于臨床新型的LUAD預(yù)后評估分子標(biāo)志物和治療作用靶點(diǎn)的發(fā)現(xiàn)和應(yīng)用。

猜你喜歡
共表達(dá)網(wǎng)絡(luò)分析拷貝數(shù)
SO2引起巨峰葡萄采后落粒的共表達(dá)網(wǎng)絡(luò)和轉(zhuǎn)錄調(diào)控分析
線粒體DNA拷貝數(shù)在兒童腦性癱瘓患者中的表達(dá)及臨床意義
基于交通運(yùn)輸業(yè)的股票因果網(wǎng)絡(luò)分析
基于ISM模型的EPC項(xiàng)目風(fēng)險(xiǎn)網(wǎng)絡(luò)分析
低軌衛(wèi)星互聯(lián)網(wǎng)融合5G信息網(wǎng)絡(luò)分析與應(yīng)用
UdhA和博伊丁假絲酵母xylI基因共表達(dá)對木糖醇發(fā)酵的影響
卵巢癌與宮頸癌PIK3CA基因拷貝數(shù)變異及意義
高世代回交玉米矮稈種質(zhì)的轉(zhuǎn)錄組分析
小麥Glu-3位點(diǎn)基因拷貝數(shù)的變異分析
認(rèn)知重評和表達(dá)抑制情緒調(diào)節(jié)策略的腦網(wǎng)絡(luò)分析:來自EEG和ERP的證據(jù)*