段昕妤, 肖 蘅, 陳善元
(云南大學(xué) 生命科學(xué)學(xué)院, 昆明 650091)
DNA甲基化是指在DNA甲基轉(zhuǎn)移酶的催化下,以S-腺苷甲硫氨酸(SAM)為甲基供體,將甲基轉(zhuǎn)移到胞嘧啶的5′C上,DNA的堿基結(jié)合甲基的過程[1]。在哺乳動物中,正常的DNA甲基化在基因表達(dá)等方面具有重要作用。但是,異常的DNA甲基化卻會引起人類疾病的發(fā)生,如癌癥、衰老、老年癡呆等。隨著甲基化研究的不斷深入,甲基化的檢測方法也在不斷改進(jìn)更新,本文將對哺乳動物DNA甲基化測序技術(shù)作簡要介紹,以期為甲基化測序技術(shù)的選擇提供參考依據(jù)。
DNA甲基化現(xiàn)象是1948年Hotchkiss在小牛胸腺DNA中發(fā)現(xiàn)的[2],直到1988年,人們才逐漸認(rèn)識到DNA甲基化對基因功能的影響,進(jìn)而展開了該領(lǐng)域的研究。作為表觀遺傳學(xué)的重要修飾方法之一,DNA甲基化在很多生物代謝進(jìn)程中起著關(guān)鍵性作用,如基因表達(dá)、胚胎發(fā)育、細(xì)胞增生、細(xì)胞分化和染色體穩(wěn)定性等。更重要的是,DNA甲基化可以隨著細(xì)胞分裂在世代間遺傳[3]。除了可遺傳性,DNA甲基化還具有其他特性:1)普遍性。DNA甲基化現(xiàn)象普遍存在于原核生物和真核生物中,哺乳動物基因組中約有5%~10%是CpG位點,其中約80%為甲基化CpG位點(mCpG)[4]。2)分布規(guī)律性。DNA甲基化主要發(fā)生于啟動子、轉(zhuǎn)座子、增強子、沉默子和基因本體等部位的CpG二核苷酸上。3)時間特異性和空間特異性。時間特異性指的是在生命不同時期DNA甲基化程度存在巨大差異,而空間特異性即組織特異性,指的是不同的組織細(xì)胞即便擁有一樣的基因序列卻有不一樣的DNA甲基化模式,以此調(diào)控基因在不同組織內(nèi)的特異性表達(dá)。4)可逆性。去甲基化(demethylation)是與甲基化一樣存在于生物中卻完全相反的過程,且細(xì)胞內(nèi)只要存在甲基化就必然存在去甲基化,甲基胞嘧啶的水平和模式由DNA甲基化和去甲基化共同決定。除去甲基化與去甲基化的動態(tài)調(diào)控,甲基化狀態(tài)還會受到環(huán)境、年齡、性別等因素影響。其中,DNA甲基轉(zhuǎn)移酶(DNA methyltransferase, DNMTs)也是影響DNA甲基化的重要因素之一,哺乳動物存在3個甲基化轉(zhuǎn)移酶家族:DNMT1、DNMT2、DNMT3(DNMT3A和DNMT3B)[5]。DNMT1在細(xì)胞分裂期DNA進(jìn)行復(fù)制修復(fù)及維持正常甲基化的過程中起關(guān)鍵作用;DNMT2是主要的tRNA甲基轉(zhuǎn)移酶[6];DNMT3含有3個亞基,3A和3B催化CpG島進(jìn)行從頭甲基化,而3L(DNMT3-like)是一個不具有催化活性的調(diào)節(jié)蛋白,主要負(fù)責(zé)3A和3B的調(diào)控[7]。DNMT1是DNMT酶家族中研究最多的一種酶,很多研究發(fā)現(xiàn)DNMT1的上調(diào)與DNA異常甲基化有關(guān),會導(dǎo)致抑癌基因沉默、原癌基因激活導(dǎo)致的腫瘤發(fā)生[8]。
在對甲基化作用研究有一定了解的基礎(chǔ)上,還發(fā)現(xiàn)DNA甲基化在克隆技術(shù)、家畜育種、人類疾病等方面也扮演著重要角色。從目前克隆動物的繁育情況來看,動物克隆效率低且克隆胚胎流產(chǎn)率極高,分析原因可能是基因啟動子區(qū)域異常的DNA甲基化引起異常的基因表達(dá)從而使得克隆動物表型異?;虬l(fā)育缺陷[9]。此外,DNA甲基化修飾還參與調(diào)控家畜重要性狀的表達(dá),如Fang等[10]比較分析了日本黑牛(Wagyu)與中國草原紅牛背最長肌的甲基化差異與肉質(zhì)性狀的關(guān)系。在人類疾病方面,DNA的甲基化狀態(tài)往往與疾病的發(fā)生密切相關(guān),了解復(fù)雜疾病的甲基化致病機理,摸清治病基因的甲基化模式,既有助于理解復(fù)雜疾病的產(chǎn)生也有利于復(fù)雜疾病的治療。DNA甲基化具有可逆性,對異常甲基化還原藥物的研發(fā)、復(fù)雜疾病的治療都有較高價值。隨著DNA甲基化在醫(yī)學(xué)、畜牧育種等領(lǐng)域逐漸凸顯出重要作用,甲基化的檢測也成了現(xiàn)階段的研究熱點。以下將對一些常用測序方法進(jìn)行介紹和綜合比較,以期為甲基化測序技術(shù)的選擇提供思路。
在測序技術(shù)普及之前,高效液相色譜法(HPLC)是經(jīng)典的甲基化測定方法,但只能測定總的DNA甲基化水平,對特定序列無法測定。而對特定DNA序列測定的經(jīng)典方法是Southern雜交分析法,但此方法敏感性較低,樣品需求量較大。之后,結(jié)合PCR技術(shù)與酶切技術(shù)出現(xiàn)了新的檢測技術(shù),例如甲基化敏感的限制性指紋法(MSRF)、甲基化敏感擴增多態(tài)性法(MASP)、限制性標(biāo)記基因組掃描法(RLGS)和CpG島擴增結(jié)合代表差異分析技術(shù)(MCA-RDA)等。隨著測序技術(shù)的不斷發(fā)展和哺乳動物基因組測序的完成,對哺乳動物全基因組水平DNA甲基化的檢測也逐漸實現(xiàn)。結(jié)合新一代測序技術(shù)(next-generation sequencing, NGS)的甲基化測定法是目前最新、最具前景的全基因組DNA甲基化分析方法,能對DNA甲基化進(jìn)行定量測定且產(chǎn)生大量的序列信息?;贜GS進(jìn)行全基因組DNA甲基化水平的方法主要分為3大類:1)核酸內(nèi)切酶消化法;2)親和富集法;3)重亞硫酸鹽轉(zhuǎn)化法。以下將對上述3類方法進(jìn)行詳細(xì)介紹。
2.1.1 HELP-seq
連接子介導(dǎo)PCR的HpaⅡ小片段富集測序法(HpaⅡtiny fragement enrichment by ligation-mediated PCR, HELP-seq)指用限制性內(nèi)切酶Ⅱ(HpaⅡ)與甲基化敏感同裂酶(MspⅠ)對同一基因組序列進(jìn)行消化,產(chǎn)生不同的代表性序列,然后對此序列進(jìn)行連接子介導(dǎo)的PCR,之后將此DNA樣本在基因組芯片上進(jìn)行共雜交分析或測序分析。但此方法受限于甲基化敏感性限制性核酸內(nèi)切酶,對甲基化序列的識別具有局限性,如采用HpaⅡ僅能分析基因組內(nèi)8%的CpG島[11]。
2.1.2 MSCC
甲基化敏感酶切計數(shù)測序法(methyl-sensitive cut counting, MSCC)是基于全基因組的DNA甲基化測序方法,利用基因組內(nèi)全部CCGG位點對HpaⅡ酶的敏感性來進(jìn)行甲基化位點測定,能被HpaⅡ酶識別的位點均能被檢測到,并且該方法不局限于使用HpaⅡ一種酶。MSCC有利于從高甲基化事件中辨別中甲基化事件,且測序深度越深,精確度越高[12]。但是MSCC在酶切過程中會計入較多雜位點,雜位點會影響甲基化位點的統(tǒng)計,且雜位點不易被排除。
2.2.1 MeDIP-seq
甲基化DNA免疫共沉淀測序法(methylated DNA immunoprecipitation sequencing, MeDIP-seq),是通過使用5-甲基胞嘧啶抗體富集高甲基化的DNA片段,然后對全基因組中DNA高甲基化區(qū)域進(jìn)行高通量測序的方法[13]。此方法成本低、數(shù)據(jù)處理簡單且對高度甲基化區(qū)域敏感性高。但在實際應(yīng)用過程中卻存在一些問題,如經(jīng)免疫共沉淀后得到的MeDIP產(chǎn)物產(chǎn)量較低難以達(dá)到測序建庫的標(biāo)準(zhǔn),且反應(yīng)過后雙鏈DNA會變?yōu)閱捂淒NA,而單鏈DNA并不適合測序文庫的構(gòu)建。采用該方法進(jìn)行甲基化水平測定時,推薦增添一個成本較低的互補實驗即甲基化敏感限制性內(nèi)切酶測序(methylation-sensitive restriction enzyme sequencing, MRE-seq)構(gòu)成M&M方法(MeDIP-seq和MRE-seq);相較單一測序,M&M具有更高的準(zhǔn)確性和重復(fù)性[14]。許多研究者采用MeDIP-seq研究了多種疾病的全基因組DNA甲基化水平,如王汨[15]通過比較伴童年創(chuàng)傷抑郁癥患者、不伴童年創(chuàng)傷抑郁癥患者和健康人之間的甲基化水平發(fā)現(xiàn),各對照組間NR3C1基因內(nèi)含子區(qū)的DNA甲基化水平均有改變,推測這些區(qū)域的甲基化的改變與童年創(chuàng)傷、抑郁癥有一定的相關(guān)性。
2.2.2 MBD-seq
甲基結(jié)合蛋白測序法(methyl-CpG binding domain protein-enriched genome sequencing, MBD-seq)檢測全基因組DNA甲基化的原理與MeDIP-seq基本相同,區(qū)別在于該方法用MBD2b蛋白富集甲基化DNA片段來取代MeDIP-seq的甲基化胞嘧啶抗體富集,對富集到的DNA片段進(jìn)行高通量測序從而檢測全基因組范圍內(nèi)的甲基化位點,對高甲基化位點更敏感。Frattini等[16]利用MBD-seq研究了山羊在全基因組水平下的下丘腦和卵巢的DNA甲基化狀態(tài),并繪制了山羊的甲基化圖譜。Neary等[17]利用MeDIP-seq和MBD-seq兩種方法對患精神疾病的小鼠進(jìn)行甲基化測序,發(fā)現(xiàn)MeDIP-seq比MBD-seq能識別更多的差異甲基化區(qū)域(differentially methylated regions, DMRs),且小鼠基因組的甲基化改變影響其基因的表達(dá)。
圖 1 3類DNA甲基化測序技術(shù)流程圖Fig 1 Workflow of three DNA methylation sequencing technologies
2.2.3 MethylCap-seq
甲基化DNA捕捉測序法(methylated DNA capture by affinity purification, MethylCap-seq)是一項基于捕捉帶MeCP2基團MBD從而進(jìn)行甲基化測序的技術(shù)[18]。該技術(shù)由兩部分組成,一個是通過攜帶mCpG的MBD來捕捉甲基化DNA片段,另一個是對洗脫后的DNA進(jìn)行測序。梯度洗脫可以將不同甲基化狀態(tài)的基因分成不同的部分,從而高效率地洗脫出甲基化DNA片段。洗脫后的DNA基因組按mCpG密度分層分布在不同部位,相比全基因組來說降低了復(fù)雜性。用該方法可以得到詳細(xì)的全基因甲基化區(qū)域圖譜且可以檢測不同基因區(qū)域的DNA甲基化水平。Meyer等[19]利用MethylCap-seq對70個人類大腦組織進(jìn)行了研究,發(fā)現(xiàn)比較之前的測序方法,MethylCap-seq能識別更多甲基化區(qū)域且敏感性較高。但MethylCap-seq也存在不足之處,即有限的測序覆蓋度,無法滿足高覆蓋度測序?qū)嶒灥囊蟆?/p>
2.3.1 WGBS
全基因組重亞硫酸鹽測序法(whole genome bisulfite sequencing, WGBS)是前期用重亞硫酸鹽(bisulfite)處理,將基因組中未發(fā)生甲基化的C堿基轉(zhuǎn)換成U堿基,進(jìn)行PCR擴增后變成T堿基,與原本具有甲基化修飾的C堿基區(qū)分開來,再對PCR產(chǎn)物進(jìn)行高通量測序的方法。WGBS在1992年由Frommer等[20]提出,被公認(rèn)為一項革命性的創(chuàng)新,已成為繪制單堿基DNA甲基化圖譜的首選方法。該方法因其通量高、耗時少、單堿基分辨率、高覆蓋率的優(yōu)勢被稱為甲基化測序的“黃金標(biāo)準(zhǔn)”,避免了酶切不完全可能導(dǎo)致的假陽性問題,且敏感性較高,僅需1 ng 的DNA量即可進(jìn)行建庫檢測。此外,WGBS還具有精準(zhǔn)性高等優(yōu)點,每個胞嘧啶的甲基化程度都能被精密地定量檢測出來。但也存在一些缺陷,WGBS測序價格昂貴且數(shù)據(jù)量龐大,在多樣品研究中,WGBS在單堿基分辨率下無法分辨5-羥甲基胞嘧啶(5hmC)和5-甲基胞嘧啶(5mC),對5mC數(shù)量統(tǒng)計存在一定影響。測序完成后需要高級計算分析來確定DNA甲基化模式和內(nèi)在發(fā)生的改變,被限制于比較樣品間個體的CpG位點。WGBS雖然降低了序列的復(fù)雜度,卻未能解釋產(chǎn)生不完全轉(zhuǎn)化和序列錯誤的問題。在實際應(yīng)用中,例如,Zhang等[21]利用WGBS方法對小鼠腦組織進(jìn)行甲基化測序,尋找到新的甲基化位點可用于抵抗未來威脅人類健康的疾病。此外,Zhang等[22]對多產(chǎn)和低產(chǎn)湖羊的卵巢組織進(jìn)行WGBS測序,描繪了湖羊卵巢組織的全基因組甲基化圖譜。
2.3.2 RRBS
簡化基因組重亞硫酸鹽測序(reduced representation bisulfite sequencing, RRBS)是結(jié)合新一代測序的重亞硫酸鹽轉(zhuǎn)化和限制性內(nèi)切酶消化的方法,可有效檢測單堿基分辨率的DNA甲基化水平,與WGBS相比分辨率相當(dāng)?shù)M用較低。RRBS富集高CpG的基因區(qū)域,可以減少樣品DNA的需求量,優(yōu)化了未甲基化胞嘧啶的轉(zhuǎn)化,使重亞硫酸鹽處理過程中的DNA損耗降到最低[23],為定量分析DNA甲基化提供了高敏感性的測定方法。RRBS減小了由不完全胞嘧啶轉(zhuǎn)化為尿嘧啶或PCR或測序錯誤造成的假陽性甲基胞嘧啶出現(xiàn)的可能性,建庫時僅需要非常小的片段(500~600 bp),是因為在重亞硫酸鹽反應(yīng)時溫度很高且pH值很低,會造成脫嘌呤和雙鏈斷裂,小片段更能減少PCR過程中的損傷。由于WGBS價格昂貴且數(shù)據(jù)量龐大,RRBS是一種可用于替代WGBS的方法。RRBS已被用于重要基因區(qū)域的高覆蓋度、高靈敏度的測序,如Aniruddha等[24]利用RRBS描繪了斑馬魚大腦的甲基化圖譜,此外Korkmaz等[25]也對不同年齡牛的纖維母細(xì)胞進(jìn)行RRBS測序后發(fā)現(xiàn)免疫相關(guān)的甲基化位點可能與不同的脂多糖應(yīng)答反應(yīng)有關(guān)。另一方面,因為RRBS結(jié)合了重亞硫酸鹽轉(zhuǎn)化和限制性內(nèi)切酶消化,它同時也具有二者的缺點。同理,RRBS無法分辨5hmC與5mC,也無法解釋不完全轉(zhuǎn)化與序列錯誤的問題。
2.3.3 oxBS-seq
WGBS和RRBS在單堿基分辨率下無法分辨5hmC和5mC,5hmC是5mC脫甲基成胞嘧啶過程的中間產(chǎn)物,在某些哺乳動物細(xì)胞和組織中豐度較高,而采用Booth等[26]提出的氧化-重亞硫酸鹽測序法(oxidative bisulfite sequencing, oxBS-seq),將DNA樣品5hmC讀為胸腺嘧啶(T),而5mC仍被讀為胞嘧啶(C),隨后再將經(jīng)過氧化處理和未處理的樣本進(jìn)行測序比較,即可在單堿基分辨率下分辨5hmC和5mC。換言之,oxBS-seq是改良升級版的WGBS,繼承了WGBS的優(yōu)點的同時還彌補了其缺點,但該方法本身也存在一定的局限性,如因氧化條件會對基因組DNA造成嚴(yán)重的降解和損傷。為了降低DNA損傷和降解對測序的影響,一般要求DNA建庫量在100 ng以上。實際應(yīng)用中,Booth等[26]通過oxBS-seq初次構(gòu)建了小鼠胚胎干細(xì)胞CpG富集區(qū)域5hmC和5mC單分辨率的甲基化圖譜。Hernandez Mora等[27]發(fā)現(xiàn)人類胎盤和大腦的5hmC可能與印記位點轉(zhuǎn)錄相關(guān)。
以上測序方法都為廣泛應(yīng)用于高通量表觀遺傳學(xué)研究中的技術(shù)手段,上述介紹著重于各技術(shù)核心。圖1從樣本處理、富集建庫、軟件分析等方面簡要總結(jié)了3大類測序技術(shù)的工作流程。此工作流程圖利用不同類型箭頭展示不同的DNA甲基化高通量測序步驟,淺藍(lán)色注釋框與注釋圈表示可使用的生物信息軟件。在選擇合適的測序技術(shù)時,還需要考慮該方法的覆蓋度、靈敏度、分辨率、特異性和費用等是否符合實驗?zāi)康囊?,為更簡潔明了地展示各方法的?yōu)點與缺點,采用5等級分段法對以上技術(shù)手段進(jìn)行綜合比較(表1),以期為選擇最適測序手段提供參考依據(jù)。
表1 不同測序方法的比較
注:測序技術(shù)各指標(biāo)分為5等級,依次++>+>+/->->--
近年來,DNA甲基化已成為各領(lǐng)域研究的熱點,尤其在家畜育種和人類疾病臨床應(yīng)用方面具有十分重要的意義。基于NGS檢測全基因組DNA甲基化的方法通常分為核酸內(nèi)切酶消化法、親和富集法、重亞硫酸鹽轉(zhuǎn)化法3類,每種方法各有其優(yōu)缺點,但從理論、方法、測序平臺等方面來看,檢測DNA甲基化的測序技術(shù)一直在不斷地改進(jìn)和完善。核酸內(nèi)切酶消化法僅能識別一部分的甲基化位點,且不能識別出甲基化位點在染色體上的具體位置。親和富集法成本較低,檢測物種范圍較廣,但達(dá)不到單堿基分辨率,且只對高、中水平甲基化敏感,難以檢測低水平甲基化位點。重亞硫酸鹽轉(zhuǎn)化法具有高敏感、高覆蓋度、高分辨率的優(yōu)勢,使之成為甲基化位點檢測的首選方法,但高昂的價格、龐大的數(shù)據(jù)量也限制了它的廣泛應(yīng)用。就目前而言,在實際應(yīng)用過程中,為了獲取更加準(zhǔn)確可靠的甲基化數(shù)據(jù),可聯(lián)合不同的分析方法,或選擇合適的方法后進(jìn)行技術(shù)方面的微調(diào)來達(dá)到實驗的目的。測序只是實驗中的一個重要步驟,后續(xù)的數(shù)據(jù)分析也同測序技術(shù)一樣重要,有必要結(jié)合其他分子生物學(xué)技術(shù),開發(fā)或改進(jìn)生物信息分析工具,共同分析解讀甲基化數(shù)據(jù),來挖掘數(shù)據(jù)背后的信息。相信不久的將來,測序成本會大幅度降低,高通量甲基化測序方法會得到廣泛的應(yīng)用,也會開發(fā)出更多新型甲基化檢測技術(shù)及分析方法,為動物遺傳育種、人類疾病治療等領(lǐng)域提供理論依據(jù)與技術(shù)支撐。