余 捷 王梓樺 楊世英 薛寒冰
上海交通大學醫(yī)學院附屬仁濟醫(yī)院消化內科 上海市消化疾病研究所(200001)
背景:DNA甲基化作為表觀遺傳學修飾的重要組成部分,與結直腸癌等多種腫瘤的發(fā)生、發(fā)展密切相關,但具體作用機制尚未完全明確。篩選特異性甲基化基因和構建腫瘤的甲基化表達譜已成為當前研究熱點。目的:應用基因甲基化芯片技術初步篩選結直腸癌組織與癌旁正常黏膜組織間差異甲基化位點,構建特異性結直腸癌差異甲基化基因譜。方法:應用甲基化450K芯片技術對6例結直腸癌及其癌旁組織進行甲基化分析,共分析位點 431 467 個,按P值篩選出異常甲基化位點,按甲基化β值差值區(qū)分高甲基化位點和低甲基化位點;對篩選出的差異甲基化位點進一步行GO分析和KEGG分析,了解差異甲基化位點的功能。結果:共檢出結直腸癌和癌旁正常組織顯著差異的甲基化位點3 649個,其中高甲基化位點1 259個,主要分布于基因啟動子區(qū)和基因體,篩選出特異的SLC15A3等高甲基化基因;低甲基化位點共2 390個,主要分布于基因間區(qū)和基因體,篩選出特異的ACOT2、TTLL8、UHRF1等低甲基化基因。GO分析和KEGG分析發(fā)現,這些基因功能與DNA結合、轉錄因子活性、信號轉導通路等有關。結論:結直腸癌和癌旁正常組織存在大量差異甲基化位點,提示DNA異常甲基化與結直腸癌的發(fā)生、發(fā)展密切相關?;蛐酒夹g可用于結直腸癌差異甲基化位點的初篩,但構建結直腸癌差異甲基化譜作為臨床分子標記物仍需行進一步驗證。
結直腸癌(colorectal cancer)的發(fā)病率和病死率分別高居世界惡性腫瘤的第3位和第4位[1]。DNA甲基化(DNA methylation)通過調節(jié)基因的表達影響其功能發(fā)揮,是表觀遺傳學的重要組成部分,亦是調節(jié)基因組功能的重要手段。已有許多研究證實DNA甲基化在結直腸癌中發(fā)揮重要作用,但多為一個或數個基因的研究,全基因組水平繪制特異性甲基化譜的研究尚處于探索階段[2-6]。本研究通過采用高敏感性、高通量的全基因組甲基化芯片技術建立結直腸癌特異性甲基化基因表達譜,并利用生物信息學手段對差異甲基化位點進行篩選和分析,旨在為進一步闡述結直腸癌發(fā)生、發(fā)展的分子機制、尋找特異性診斷標記物以及確定可能的基因靶向治療位點提供理論依據。
選取2015年8月—2015年12月上海交通大學醫(yī)學院附屬仁濟醫(yī)院6例原發(fā)性結直腸癌患者術后標本,診斷經病理檢查證實。其中男3例,女3例;年齡64~79歲,平均(68.67±5.47)歲;根據最新AJCC結直腸癌TNM分期[7],T2N1M1、T3N0M0、T3N2bM0、T4aN0M0、T4bN0M0、T4aN1M1各1例;根據2010版WHO結直腸癌組織學分級[8],低級別腺癌4例,高級別腺癌2例。所有患者術前均未接受過放射和(或)化學藥物治療。以相應癌旁正常黏膜組織(距癌組織2~3 cm)作為對照,組織離體后30 min 內置于液氮中,隨后轉入-80 ℃冰箱保存。
取結直腸癌和癌旁正常黏膜組織各約50 mg,采用基因組DNA提取試劑盒(德國Qiagen公司),按說明書步驟提取DNA。提取的DNA含量先用紫外分光光度計(德國Eppendorf公司)定量,然后行1%瓊脂糖凝膠電泳檢測DNA樣本的完整性。將質檢合格的DNA濃度調整至50 mg/L,-20 ℃冰箱保存待用。
按照EZ DNA Methylation Kit(美國Illumina公司)優(yōu)化方法行DNA亞硫酸鹽轉化;之后經擴增、斷化、沉淀、重懸,在Illumina Methylation 450K芯片上行雜交、溶洗、延伸、染色、掃描等過程,獲取DNA甲基化信號。信號采集與分析采用iScan軟件(美國Illumina公司)分析系統(tǒng)。對6組癌組織和癌旁正常組織逐個進行甲基化分析,得到癌組織和癌旁組織中每個探針位點的甲基化β值,計算平均甲基化β值、甲基化β值差值。利用R語言的limma包建立線性模型,計算結直腸癌組織和癌旁正常黏膜組織間甲基化位點的P值。P<0.01為差異甲基化位點的篩選標準。
首先將芯片篩選出的差異甲基化位點對應的基因映射到GO(Gene Ontology)數據庫的各個條目中,進行GO功能注釋,計算映射到各條目的基因數,利用超幾何分布計算得到P值。P<0.01為差異甲基化基因中顯著性富集的GO條目。然后利用KEGG(Kyoto Encyclopedia of Genes and Genomes)數據庫,將差異甲基化基因進行映射和通路分析。P<0.05為差異甲基化基因中顯著性富集的通路。
芯片所檢測的431 467個位點對應22 300個基因,根據P<0.01和甲基化β值差值篩選出差異甲基化位點3 649個,包括1 259個高甲基化位點和2 390 個低甲基化位點,這些差異甲基化位點隨機分布于每條染色體。其中11號染色體的高甲基化位點最多(131個),其次為7號染色體(104個);1號染色體的低甲基化位點最多(198個),其次為11號染色體(197個)(表1)。
芯片所檢出的高甲基化位點在基因結構元件的分布主要位于基因啟動子區(qū)和基因體,低甲基化位點主要分布于基因間區(qū)、基因體和基因啟動子區(qū)(表2)?;騿幼訁^(qū)的高甲基化位點主要分布于TSS1500、5’UTR和TSS200,低甲基化位點主要分布于TSS1500、5’UTR和TSS200(表3)。CpG島及其周圍區(qū)域也有差異甲基化現象,根據CpG位點含量和距離劃分,高甲基化位點主要分布于CpG島和島灘區(qū),低甲基化位點主要分布于其他區(qū)域(表4)。
表1 差異甲基化位點在染色體上的分布(n)
表2 差異甲基化位點在基因結構元件的分布n (%)
表3 差異甲基化位點在基因啟動子區(qū)的分布n (%)
表4 根據CpG島劃分的差異甲基化位點分布n (%)
在已篩選出的差異甲基化位點中,按P值選出10個最顯著的高甲基化基因,分別為溶質載體家族15成員3(SLC15A3)、CBFA2/RUNX1易位伙伴2(CBFA2T2)、腦蛋白9(KNDC1)、硫酸皮膚素差向異構酶(DSE)、AT豐富結合域4A(ARID4A)、卷曲螺旋結構域蛋白5(CHCHD5)、USP6氨基端樣蛋白(USP6NL)、RP4-544H6.2、G蛋白信號調節(jié)因子19(RGS19)、胎盤堿性磷酸酶(ALPP)(表5),10個最顯著的低甲基化基因分別為脂酰輔酶A硫脂酶2(ACOT2)、微管蛋白酪氨酸連接酶家族成員8(TTLL8)、泛素樣含PHD和環(huán)指域蛋白1(UHRF1)、鋅指蛋白566(ZNF566)、CCR4-NOT轉錄復合體亞基1(CNOT1)、表皮生長因子4(ERBB4)、磷酸二酯酶4D(PDE4D)、MLX相互作用蛋白(MLXIP)、可溶性鳥苷酸環(huán)化酶α亞基2(GUCY1A2)、動力蛋白胞漿1重鏈1(DYNC1H1)(表6)。
表5 篩選出的10個最顯著的高甲基化基因
*甲基化位點在染色體上的位置
表6 篩選出的10個最顯著的低甲基化基因
對篩選出的差異甲基化位點分別行GO分析和KEGG分析,富集得到849個GO功能注釋和45條通路。GO本體涵蓋了基因的生物學過程(biological process)、細胞組分(cellular component)、分子功能(molecular function)。GO分析顯示結直腸癌差異甲基化基因涵蓋多種不同的功能群落,在生物學過程方面,主要參與器官系統(tǒng)發(fā)生、解剖結構的形成;在細胞組分方面,主要存在于胞外區(qū)、細胞膜、突觸中;在分子功能方面,主要與DNA結合、轉錄因子活性等有關(表7)。KEGG分析顯示結直腸癌差異甲基化位點參與各種細胞通路,如刺激神經組織的配體受體相互作用通路(neuroactive ligand-receptor interaction)、腫瘤蛋白多糖通路(proteoglycans in cancer)、腫瘤轉錄失調通路(transcriptional misregulation in cancer)、PI3K-AKT信號通路等(表8)。
全球每年約120萬例患者被確診為結直腸癌,超過60萬例患者直接或間接死于結直腸癌[1]。目前結直腸癌的發(fā)病率呈年輕化趨勢[9-12]。結直腸癌的發(fā)生是多步驟、多環(huán)節(jié)相互作用的結果,其分子機制涉及基因和染色體的結構和(或)功能異常,如包括基因突變等在內的DNA序列改變和包括DNA甲基化、組蛋白修飾、非編碼RNA調控等在內的表觀遺傳學修飾。
表7 差異甲基化位點的GO分析
DNA甲基化系指在DNA甲基轉移酶(DNA methyltransferases, DNMTs)的催化作用下,以S-腺苷甲硫氨酸(S-adenosyl methionine, SAM)為甲基供體,將甲基基團轉移到胞嘧啶和鳥嘌呤(CpG)二核苷酸的胞嘧啶5’-碳原子上,形成5-甲基胞嘧啶的過程[13-15]。人類甲基化發(fā)生在CpG位點,多種基因的啟動子區(qū)和第一外顯子富含CpG,而CpG相對集中的區(qū)域稱為CpG島。生理情況下,CpG島多處于非甲基化狀態(tài),而大部分散在CpG二核苷酸為甲基化狀態(tài),這對正常的細胞發(fā)育和維持組織穩(wěn)定性具有重要作用。但在腫瘤發(fā)生過程中,該模式發(fā)生逆轉,包括總基因組甲基化水平降低、癌基因的低甲基化和抑癌基因的高甲基化。DNA低甲基化常誘導基因的重新活化和表達,增加染色體的不穩(wěn)定性;DNA高甲基化常導致基因沉默抑制基因表達,參與調控DNA修復[16-17]、細胞凋亡[18-19]、細胞周期[20-21]等重要生物學過程。
基因甲基化芯片憑借其高通量、高敏感性、自動化、微型性的優(yōu)勢在各種疾病、組織特異性表達等多種領域研究中的應用極為廣泛[22-24]。本研究應用該技術共檢出結直腸癌和癌旁正常組織顯著差異的甲基化位點3 649個,其中高甲基化位點1 259個,主要分布于基因啟動子區(qū)和基因體,篩選出特異的SLC15A3等高甲基化基因;低甲基化位點共2 390個,主要分布于基因間區(qū)和基因體,篩選出特異的ACOT2、TTLL8、UHRF1等低甲基化基因。通過GO分析和KEGG分析發(fā)現,這些基因功能與DNA結合、轉錄因子活性、信號轉導通路等有關。通過相關檢索發(fā)現,針對本研究篩選出的差異甲基化基因的相關報道甚少。Zhou等[25]通過對正常腸黏膜組、腺瘤組織和腺癌組織進行外顯子組捕獲測序研究,在結直腸腺瘤組中發(fā)現了包括SLC15A3在內的12個非同義突變基因。Sabatino等[26]的研究發(fā)現UHRF1可能通過DNA去甲基化和組蛋白抑制修飾等途徑負調控PPARγ表達,與結直腸癌增殖、遷移潛能相關,且UHRF1過表達和PPARγ沉默與上皮-間質轉化過程中的高生長速率和表型特征有關。Kofunato等[27]的研究通過免疫組化染色法發(fā)現,65.8% 的結直腸癌患者中UHRF1表達上調,在右半結腸癌中更為明顯,且UHRF1高表達可能與癌細胞侵犯深度有關;利用siRNA敲除UHRF1后,結腸癌HCT116和SW620細胞生長速度受到明顯抑制。
總之,結直腸癌和癌旁正常組織存在大量差異甲基化位點,提示DNA異常甲基化與結直腸癌的發(fā)生、發(fā)展密切相關。然而,利用基因甲基化芯片篩選出的差異位點、對應的基因以及在結直腸癌中可能的作用機制仍需通過特異性甲基化聚合酶鏈反應、免疫組化染色等實驗室方法和收集大量臨床病例進行隨機對照研究來進一步分析驗證?;蚣谆夹g在臨床中對確定特異性甲基化標記物、早期診斷疾病、確定靶向治療位點以及評估預后等有潛在的應用前景,但目前仍存在諸多困難,其結果的準確性和特異性有待實驗室技術進行檢驗以及臨床大樣本研究進行證實。