許瓊,查瓊芳,秦慧,劉斌,吳學(xué)玲
上海交通大學(xué)醫(yī)學(xué)院附屬仁濟(jì)醫(yī)院呼吸科,上海200127
衰老是腫瘤發(fā)生發(fā)展的重要危險(xiǎn)因素。除黑色素瘤外,全身其他部位的腫瘤在年齡大于70 歲的老年人中發(fā)生率都明顯高于年齡小于70 歲的老年人[1],并且70%腫瘤相關(guān)的死亡都出現(xiàn)在年齡大于65 歲的患者中。自身合并癥多、治療藥物療效差以及治療后不良反應(yīng)多、并發(fā)癥多等多種因素是老年患者診斷腫瘤后死亡率高的原因。積極探討腫瘤在老年人中的發(fā)生機(jī)制為最終降低腫瘤的發(fā)生率和死亡率提供基礎(chǔ)。
隨年齡增加,體細(xì)胞基因突變的逐步累積,可以促進(jìn)腫瘤的發(fā)生。另外隨年齡增加,表觀遺傳學(xué)出現(xiàn)整體低甲基化的特點(diǎn),恰好與腫瘤發(fā)生過(guò)程中基因組的甲基化水平變化一致[2],是衰老促進(jìn)腫瘤發(fā)生的另一因素。因此鑒定腫瘤發(fā)生過(guò)程中驅(qū)動(dòng)整體甲基化水平變化的基因,有助于理解衰老如何通過(guò)調(diào)控甲基化參與腫瘤的發(fā)生。在某些腫瘤如急性髓系白血病中,一些特定基因的突變已經(jīng)證實(shí)參與調(diào)控DNA甲基化。例如DNA 甲基化酶DNMT3A(methyltransferase 3 al pha,DNMT3A)的突變?cè)?2%的成人AML 中出現(xiàn)[3],是髓系白血病發(fā)生的早期事件[4]。含有DNMT3AR882突變的AML 患者與野生型患者相比在182 個(gè)基因部位的甲基化水平降低[3],這可能與DNMT3AR882 突變后重頭合成的 DNMT3A 活性降低相關(guān)[5]。除DNMT3A 外,IDH1 和IDH2 突變的AML 患者呈現(xiàn)基因組水平的高甲基化[6]。那么,在其他類型的腫瘤中是否也存在類似于DNMT3A和IDH1/IDH2 的基因,影響腫瘤細(xì)胞整體甲基化的水平,是腫瘤甲基化的潛在驅(qū)動(dòng)基因,目前還不清楚。因此,本研究分析TCGA(The Cancer Genome Atlas,TCGA)中35 種腫瘤類型的450k 甲基化數(shù)據(jù)、DNA 突變數(shù)據(jù)以及RNA 表達(dá)的數(shù)據(jù),鑒定影響腫瘤整體甲基化水平的潛在驅(qū)動(dòng)基因,為研究衰老如何參與腫瘤的發(fā)生和最終降低腫瘤在老年人中的發(fā)生率及死亡率提供思路。
1.1 腫瘤數(shù)據(jù)類型 從 Broad Firehose(https: //gdac.broadinstitute.org/)下載TCGA 項(xiàng)目中35 種腫瘤類別、共12 317 例腫瘤樣本的DNA 測(cè)序、RNA 測(cè)序以及450k 甲基化芯片的數(shù)據(jù)。這35 種腫瘤包括腎上腺皮質(zhì)癌(ACC)、膀胱上皮尿路癌(BLACA)、乳腺浸潤(rùn)癌(BRCA)、宮頸癌(CESC)、膽管癌(CHOL)、結(jié)腸腺癌(COAD)、結(jié)直腸腺癌(COADREAD)、彌漫性大B 淋巴瘤(DLBC)、食管癌(ESCA)、神經(jīng)膠質(zhì)瘤(GBM)、多型性膠質(zhì)母細(xì)胞瘤(GBM)、頭頸鱗狀細(xì)胞癌(HNSC)、腎嫌色細(xì)胞癌(KICH)、混合腎癌(KIPAN)、腎透明細(xì)胞癌(KIRC)、腎乳頭細(xì)胞癌(KIRP)、急性髓系白血病(AML)、腦低分化神經(jīng)膠細(xì)胞瘤(LGG)、肝細(xì)胞癌(LIHC)、肺腺癌(LUAD)、肺鱗狀細(xì)胞癌(LUSC)、卵巢漿液性漿液性囊腺癌(OV)、胰腺癌(PAAD)、腎上腺嗜鉻細(xì)胞瘤和副神經(jīng)節(jié)瘤(PCPG)、直腸腺癌(READ)、肉瘤(SARC)、皮膚黑色素瘤(SKCM)、胃腺癌(STAD)、胃和食管癌(STES)、睪丸生殖細(xì)胞瘤(TGCT)、甲狀腺癌(THCA)、胸腺瘤(THYM)、子宮內(nèi)膜癌(UCEC)、子宮肉瘤(UCS) 和視網(wǎng)膜黑色素瘤(UVM)。
1.2 顯著突變的基因和整體DNA 甲基化水平的關(guān)系腫瘤驅(qū)動(dòng)基因由MutSigCV2 分析得出,用FDR<0.05選擇。用所有CpG 位點(diǎn)甲基化的中值來(lái)代表單個(gè)樣本的整體甲基化水平。以AML 為例,基于文獻(xiàn)報(bào)道[3,7],AML 中DNMT3A 與整體甲基化的狀態(tài)是已知的,DNMT3A 用作此分析方法的陽(yáng)性對(duì)照。如圖1A 所示,AML 樣本中50%分位的DNA 甲基化水平在DNMT3A 突變組及非突變組有顯著性的差異。樣本的整體甲基化作為因變量(),驅(qū)動(dòng)基因的突變狀態(tài)作為自變量(),通過(guò)多元線性回歸分析,篩選統(tǒng)計(jì)上顯著的變量(FDR<0.05)。
1.3 基因表達(dá)和整體DNA 甲基化水平的關(guān)系 基因表達(dá)譜定量用Log2 轉(zhuǎn)換,多元線性回歸用于分析基因的表達(dá)水平與DNA 甲基化之間的關(guān)系。在前面分析過(guò)程中已鑒定的驅(qū)動(dòng)基因先納入多重回歸模型,再把基因的表達(dá)量作為獨(dú)立變量逐步加入多重回歸方程中,然后用 GRAIL (Network-based Gene Prioritization Analysis)[8]方法預(yù)測(cè)篩選在功能上與DNA 甲基化相關(guān)的基因。最后,F(xiàn)DR<0.05 的基因納入最后的回歸分析,并定義為甲基化驅(qū)動(dòng)基因。
2.1 AML 中與基因甲基化水平相關(guān)的重要突變基因AML樣本中DNMT3A 的突變與基因組整體低甲基化水平相關(guān)(圖1A);IDH1 和IDH2 的突變與腫瘤細(xì)胞的高甲基化水平相關(guān)(圖1B),與文獻(xiàn)報(bào)道一致[3,6],提示分析方法的有效性。除此外,CEBPA(CCAAT enhancer binding protein alpha)的突變也與AML 基因組的整體高甲基化水平相關(guān)(圖1B)。文獻(xiàn)報(bào)道CEBPA突變后所致的高甲基化可能是AML 患者生存時(shí)間延長(zhǎng)的原因[9]。
圖1 AML 樣本中與整體基因甲基化相關(guān)的突變基因
SETD2 和SMARCB1 在腎癌樣本中與DNA 的高甲基化水平相關(guān)(表1)。SETD2 是甲基化轉(zhuǎn)移酶,能促進(jìn)H3 組蛋白36 位賴氨酸三甲基化(H3K36me3)形成。含有H3K36me2/H3K36me3 修飾的基因組,易結(jié)合DNA 甲基化轉(zhuǎn)移酶DNMT3A,導(dǎo)致基因組5mC部位的甲基化[13]。突變盡管引起甲基化轉(zhuǎn)移酶的失活,但也可導(dǎo)致整個(gè)基因組H3K36me3 的異位分布,從而致整體基因組水平的高甲基化,參與腎臟腫瘤的形成[14]。
圖2 AML 樣本中表達(dá)量與整體甲基化相關(guān)的基因
2.4 甲基化相關(guān)驅(qū)動(dòng)基因與年齡的關(guān)系 進(jìn)一步分析甲基化驅(qū)動(dòng)基因突變率在年齡大于60 歲以及小于60 歲兩組患者之間的差異,兩組間有統(tǒng)計(jì)學(xué)差異<0.05)的基因列在表2 中。和這3個(gè)基因的突變與年齡相關(guān),隨年齡的增加突變率增加;而參與影響神經(jīng)膠質(zhì)瘤甲基化的基因和以及影響皮膚黑色素瘤甲基化的基因它們的突變率與年齡呈負(fù)相關(guān)。已有文獻(xiàn)報(bào)道含有上述突變基因的神經(jīng)膠質(zhì)瘤患者或黑色素瘤患者,發(fā)病年齡小于不含有突變基因的患者[24-25]。
2.5 35 種腫瘤類型中表達(dá)量與DNA 甲基化相關(guān)的基因 通過(guò)前述方法,本研究鑒定了在功能上與DNA 甲基化相關(guān),且表達(dá)量與其他35 種腫瘤甲基化水平相關(guān)的基因(FDR<0.05),將在多種腫瘤中重復(fù)出現(xiàn)的基因羅列在表3 中。其中一些基因?qū)φw甲基化水平的影響已有報(bào)道,如組蛋白H3 精氨酸甲基轉(zhuǎn)移酶PRMT6。在乳腺腫瘤細(xì)胞株中,它的高表達(dá)影響DNA甲基化轉(zhuǎn)移酶1(DNA methyltransferase1,DNMT1)的活化因子UHRF1 在染色質(zhì)的結(jié)合,導(dǎo)致基因組的低甲基化。在神經(jīng)膠質(zhì)細(xì)胞瘤中PRMT6 如何影響腫瘤細(xì)胞整體甲基化的水平需要進(jìn)一步探討。甲基胞嘧啶結(jié)合域(methylcytosine-binding domain, MBD)家族是與DNA 甲基化的表現(xiàn)形式相關(guān)的一組基因[26],本研究發(fā)現(xiàn),MBD1 和MBD4 的高表達(dá)分別與腎臟細(xì)胞癌及甲狀腺癌基因組整體低甲基水平相關(guān)。另外CBX5 的表達(dá)與腎臟腫瘤細(xì)胞及肝細(xì)胞癌細(xì)胞中的高甲基化相關(guān),這可能與CBX5 能與DNMT1 相互作用,參與UHRF1/DNMT1 軸介導(dǎo)的細(xì)胞內(nèi)甲基化變化相關(guān)[27]。
表3 35 種腫瘤中表達(dá)量與整體DNA 甲基化水平相關(guān)的基因
在本研究中,首先以AML 為參考數(shù)據(jù),構(gòu)建了挖掘腫瘤甲基化的驅(qū)動(dòng)基因的生物信息學(xué)方法,而后應(yīng)用此方法在TCGA 數(shù)據(jù)中,鑒定出其它34 種腫瘤中與基因甲基化水平相關(guān)的潛在驅(qū)動(dòng)基因及表達(dá)相關(guān)基因。
終上所述,此研究通過(guò)多數(shù)據(jù)整合的方法,鑒定了與基因甲基化相關(guān)的潛在驅(qū)動(dòng)基因,為后續(xù)在老年患者中研究表觀遺傳學(xué)甲基化水平的變化如何參與腫瘤發(fā)生提供基礎(chǔ)。本研究不足之處是沒(méi)能通過(guò)實(shí)驗(yàn)方法,在相應(yīng)的腫瘤模型中對(duì)文中鑒定的甲基化驅(qū)動(dòng)基因進(jìn)行驗(yàn)證,并探討這些基因如何參與調(diào)節(jié)整體甲基化狀態(tài)。后續(xù)研究中將針對(duì)其中單個(gè)基因,在獨(dú)立的疾病模型中研究突變基因?qū)谆降挠绊懀貏e是與衰老相關(guān)的突變基因。