吳杰,全建平,葉勇,吳珍芳,楊杰,楊明,鄭恩琴
綜 述
染色質(zhì)轉(zhuǎn)座酶可及性測序研究進展
吳杰1,全建平1,葉勇1,吳珍芳1,楊杰1,楊明2,鄭恩琴1
1. 華南農(nóng)業(yè)大學動物科學學院,國家生豬種業(yè)工程技術(shù)研究中心,廣州 510642 2. 仲愷農(nóng)業(yè)工程學院,動物科技學院,廣州 510225
染色質(zhì)轉(zhuǎn)座酶可及性測序(assay for transposase-accessible chromatin with high-throughput sequencing, ATAC-seq)誕生于2013年,具有比脫氧核糖核酸酶I超敏感位點測序(deoxyribonuclease I hypersensitive site sequencing, DNase-seq)和微球菌核酸酶敏感位點測序(micrococcal nuclease sequencing, MNase-seq)更快速、靈敏、簡便的優(yōu)點,是目前分析全基因組范圍染色質(zhì)開放區(qū)域的熱點技術(shù)。通過該技術(shù)能獲得染色質(zhì)開放區(qū)域的相關(guān)信息,從而映射出轉(zhuǎn)錄因子等調(diào)控蛋白的結(jié)合區(qū)域和核小體定位等信息,對于研究表觀遺傳分子機制具有重要意義。本文比較了5種獲取染色質(zhì)開放區(qū)域技術(shù)的優(yōu)缺點,重點介紹了ATAC-seq的原理和主要流程,描述了利用ATAC-seq技術(shù)研究染色質(zhì)開放區(qū)域的發(fā)展概況以及ATAC-seq的相關(guān)應(yīng)用,期望對真核生物全基因組水平的染色質(zhì)開放區(qū)域研究、順式調(diào)控元件鑒定以及遺傳調(diào)控網(wǎng)絡(luò)的解析等提供借鑒。
染色質(zhì)轉(zhuǎn)座酶可及性測序;染色質(zhì)開放區(qū)域;Tn5轉(zhuǎn)座酶;表觀遺傳修飾;轉(zhuǎn)錄因子
自然界中的生物根據(jù)其細胞核類型可以分為原核生物和真核生物,其中原核生物的細胞核無核膜包被,其遺傳物質(zhì)DNA裸露在外;而真核生物細胞的細胞核DNA并非裸露,而是以左旋超螺旋的方式(約147 bp)繞八聚體結(jié)構(gòu)的組蛋白1.67圈,進而形成核小體[1,2]。相鄰核小體的連接區(qū)由10~80 bp的游離DNA與組蛋白H1共同構(gòu)成;核小體通過連接區(qū)的連接形成串珠式結(jié)構(gòu),這種串聯(lián)結(jié)構(gòu)進一步折疊、凝聚,形成染色質(zhì);最終多條染色質(zhì)以高度螺旋化狀態(tài)包裹于細胞核中[3]。研究顯示,染色質(zhì)開放區(qū)域的基因組占總DNA序列的2%~3%,且超過90%的開放區(qū)域均與轉(zhuǎn)錄因子(transcription factor, TF)的結(jié)合相關(guān)[4]。以TF為代表的調(diào)控因子可與其他染色質(zhì)結(jié)合蛋白相互作用,從而動態(tài)調(diào)控和維持染色質(zhì)穩(wěn)態(tài),在發(fā)育過程的調(diào)控中發(fā)揮著不可替代的作用[5~7]。在DNA復制或轉(zhuǎn)錄過程中,DNA的折疊結(jié)構(gòu)被打開,一些染色質(zhì)區(qū)域處于開放狀態(tài),調(diào)控因子(如轉(zhuǎn)錄因子)會與這些裸露的無核小體結(jié)合的DNA部位結(jié)合,進而調(diào)控DNA的復制或轉(zhuǎn)錄過程[8]。此外,有研究表明,DNA折疊、凝聚形成的染色質(zhì)物理結(jié)構(gòu)并不是一成不變的,仍然能夠發(fā)生動態(tài)的表觀遺傳修飾,如DNA甲基化、組蛋白修飾、染色質(zhì)重塑等[8~11]。因此,通過了解相關(guān)獲取染色質(zhì)開放信息的技術(shù),學習技術(shù)原理和應(yīng)用,明確了這些技術(shù)對于基因組調(diào)控元件的鑒定、轉(zhuǎn)錄因子結(jié)合位點的識別及轉(zhuǎn)錄調(diào)控機制等研究均具有重要意義。本文主要綜述了染色質(zhì)可及性研究技術(shù)的發(fā)展概況、以及染色質(zhì)轉(zhuǎn)座酶可及性測序(assay for transposase acces-sible chromatin with high-throughput sequencing, ATAC-seq)技術(shù)的原理和應(yīng)用,以期為表觀遺傳學研究提供重要的參考。
染色質(zhì)開放區(qū)域的研究源于人們發(fā)現(xiàn)某些染色質(zhì)特定位點表現(xiàn)出對DNase I酶切的高度敏感性[12~15]。后期研究表明,這些DNase I敏感位點(deoxyribonuclease I hypersensitive site, DHS)通常是順式調(diào)控元件所在區(qū)域[16],其染色質(zhì)裸露、結(jié)構(gòu)疏松,可與轉(zhuǎn)錄因子結(jié)合,從而便于DNase I與之結(jié)合并剪切,進而表現(xiàn)出高度敏感性[17]。基于上述原理,染色質(zhì)開放區(qū)域的鑒定工作也隨之展開。最先開展的是DHS鑒定分析工作,該分析依賴DNase I高度敏感性特點,并與 Southern 雜交技術(shù)結(jié)合,不過很快發(fā)現(xiàn)該方法的靈敏性和精確性都較低,并且耗時費力[18,19]。隨著高通量測序技術(shù)(high-throug-hput sequencing, HTS)的發(fā)展及測序成本不斷降低,衍生出一系列研究染色質(zhì)開放區(qū)域的技術(shù)與方法,如脫氧核糖核酸酶I超敏感位點測序(deoxyribonu-clease I hypersensitive site sequencing, DNase-seq)[20]、微球菌核酸酶敏感位點測序(micrococcal nuclease sequencing, MNase-seq)[11]、甲醛輔助性調(diào)控元件分離測序(formaldehyde-assisted isolation of regulatory elements followed by sequencing, FAIRE-seq)[21]、核小體定位和甲基化組測序(nucleosome occupancy and methylome sequencing, NOMe-seq)[22]和ATAC-seq。在上述5種技術(shù)中,獲取染色質(zhì)開放信息的方式分為3種:DNase-seq、MNase-seq以及ATAC-seq采用酶切法;FAIRE-seq采用物理斷裂法;NOMe-seq技術(shù)則利用甲基化修飾。5種技術(shù)的具體信息見表1。ATAC-seq與其他4種技術(shù)相比表現(xiàn)出更為簡便和高效的優(yōu)勢,一經(jīng)發(fā)明就被廣泛采用,成為當前染色質(zhì)開放區(qū)域獲取的前沿技術(shù)。下面將對上述染色質(zhì)開放區(qū)域獲取技術(shù)的發(fā)展歷程、作用機理以及研究進程進行描述。
表1 5種染色質(zhì)可及性研究技術(shù)介紹
早在2006年,DNase-seq技術(shù)便被用于DHS區(qū)域的探究。該技術(shù)過程可簡單概括為:先通過裂解劑裂解細胞釋放細胞核,選用最佳濃度DNase I消化細胞核并包埋于低熔點凝膠瓊脂糖塞中,以減少額外的隨機剪切;隨后,將DNA片段平末端化并在兩端連接上接頭,通過PCR擴增目的片段完成測序文庫構(gòu)建[20]。DNase-seq鑒定大多數(shù)轉(zhuǎn)錄因子的結(jié)合位點的精確性主要取決于酶切片段大小,其中短片段(<100 bp)比較長片段效果更佳[23]。DNase-seq技術(shù)的建立使得DHS的分析鑒定變得更簡便,但存在細胞量需要量大(1,000,000~10,000,000)、樣品制備過程復雜且耗時、最優(yōu)酶濃度確定過程繁瑣等缺點[24]。2015年,Cumbie等[25]發(fā)現(xiàn)使用傳統(tǒng)DNase-seq技術(shù)消化擬南芥()時,無法獲得足夠的DNA量用于建庫測序。其主要原因在于植物細胞碎片及根毛等雜質(zhì)占據(jù)了凝膠瓊脂糖塞,從而導致DNA產(chǎn)量過低。因此,他們在傳統(tǒng)DNase-seq基礎(chǔ)上建立了DNase I-SIM (for simplified in-nucleus method)技術(shù)。該技術(shù)在DNase I消化細胞核前,先采用Percoll層析液對細胞核進行初步純化;經(jīng)DNase I消化后,在T4 DNA聚合酶的作用下,DNA片段的雙鏈形成平末端,而不包埋于瓊脂糖塞中。這種改進的DNase I-SIM技術(shù)的優(yōu)點在于,Percoll梯度純化后的細胞核及T4 DNA聚合酶處理后的DNA片段依然具備高度完整性,在極大縮減DNase- seq文庫制備時間的同時,有效提升了DNA片段的回收效率。
MNase-seq技術(shù)發(fā)明于2008年,其原理與DNase-seq大體相似,不同之處在于,該技術(shù)采用的是微球菌核酸酶替代DNase I酶,進而對細胞核中的DNA進行切割。該技術(shù)可通過揭示由核小體和其他調(diào)節(jié)因子占據(jù)的基因組區(qū)域,從而間接探測染色質(zhì)可及性并繪制核小體圖譜[26]。與DNase-seq相比,MNase-seq具有操作簡單、后期數(shù)據(jù)處理更方便等優(yōu)點。然而,MNase-seq技術(shù)仍存在一些技術(shù)弊端。首先,其靈敏度同樣受到細胞樣本數(shù)量(1,000,000~ 10,000,000)、酶濃度和切割溫度等因素的影響[27];其次,微球菌核酸酶對A/T堿基序列存在切割傾向性[28],從而無法精確切割核小體邊界[29]。
2007年,Giresi等[21]開發(fā)了一種物理打斷DNA雙鏈的技術(shù),即FAIRE-seq技術(shù),其過程相較DNase-seq更為簡便。該技術(shù)是利用超聲波打斷已用甲醛交聯(lián)的DNA序列,在未解交聯(lián)的條件下,通過酚-氯仿抽提,提取位于水相中的游離DNA并測序,最終獲得相應(yīng)的染色質(zhì)開放區(qū)域信息[21]。FAIRE-seq具有不需要酶、不需要分離出細胞核、不受細胞類型限制、沒有序列切割特異性[30]、以及在增強子區(qū)域具有更高的覆蓋率等優(yōu)點[31],但同樣面臨著樣品需求量大的限制(需要100,000~10,000,000的細胞)[24]。值得注意的是,該技術(shù)難以確定甲醛最佳交聯(lián)程度,從而成為限制該技術(shù)應(yīng)用的最大瓶頸。究其原因在于,DNA與甲醛過度交聯(lián)或不充分交聯(lián),均會影響到最終的測序結(jié)果[32]。2009年,Auerbach等[33]在此基礎(chǔ)上創(chuàng)建了超聲處理交聯(lián)染色質(zhì)測序(sonication of cross-linked chromatin sequencing, Sono-seq)技術(shù),其原理與FAIRE-seq相同,其主要區(qū)別在于,F(xiàn)AIRE- seq是在酚-氯仿抽提之后進行大小分級,選擇特定大小范圍如100~350 bp范圍進行建庫測序。由于存在大小分級選擇這一關(guān)鍵步驟,Sono-seq與FARIRE- seq各自所鑒定的Peaks存在明顯的區(qū)別。
NOMe-seq技術(shù)由Kelly等[22]于2012年發(fā)明,該技術(shù)利用GpC甲基轉(zhuǎn)移酶(M.CviPI)通過甲基化修飾的方式處理開放區(qū)域的GpC二核苷酸。因為GpCm不存在于人類基因組中,M.CviPI使GpC甲基化為無內(nèi)源背景的GpCm。隨后,經(jīng)過亞硫酸氫鹽處理和全基因組測序,可同時獲得含GpC和CpG二核苷酸的相關(guān)信息,從而能在全基因組范圍內(nèi)確定核小體的位置,同時還能獲得內(nèi)源DNA甲基化的信息[22,34]。NOMe-seq需要的細胞量為1,000,000個,材料處理因為不需要使DNA斷裂,因此不會產(chǎn)生富集偏差,從而可降低假陽性的概率。但由于NOMe-seq不是基于先富集目的片段,然后再測序的方法,因此需要大量的測序讀長數(shù)據(jù)以獲得足夠的深度及基因組覆蓋率,從而獲取整個基因組的開放性水平[35]。
以上4種技術(shù)雖然都能應(yīng)用于染色質(zhì)開放性的表觀基因組學研究,但通病是通常需要幾萬至數(shù)百萬個細胞作為輸入材料用以平均細胞群體的異質(zhì)性,涉及到復雜、耗時的樣品制備過程,且不能同時探究核小體定位、染色質(zhì)可接近性和TF結(jié)合的相互作用。而多數(shù)情況下,很多重要且稀少的細胞亞型可能很難提供足夠的樣品量進行全基因組染色質(zhì)可及性分析。2013年,Buenrostro等[36]建立了材料需求量少、過程更為簡便、效率更高的ATAC-seq技術(shù)。該技術(shù)僅需兩步就能從500~50,000個細胞捕獲染色質(zhì)開放區(qū)域[36,37]。與其他技術(shù)方法不同的是,ATAC-seq利用高度活躍的Tn5轉(zhuǎn)座酶代替DNase I核酸酶、微球菌核酸酶MNase等分析染色質(zhì)易接近性,能夠?qū)⒛康腄NA片段化、末端修復和加上測序所需的接頭(adaptor)一步完成,從而使建庫步驟變得極為簡便,達到投入量更低、通量更高的建庫效果。Tn5轉(zhuǎn)座子的深入研究以及高通量技術(shù)的快速發(fā)展使得ATAC-seq技術(shù)能夠成功建立并廣泛應(yīng)用,ATAC-seq技術(shù)以及其衍生技術(shù)如轉(zhuǎn)座子超敏位點測序(transposome hypersensitive sites sequencing, THS-seq)、Omni-ATAC技術(shù)使染色質(zhì)開放區(qū)域的獲取更加精準、高效,必將成為染色質(zhì)開放區(qū)獲取的主流技術(shù)之一。
20世紀40年代,美國遺傳學家Barbara Mc-Clintock發(fā)現(xiàn)了轉(zhuǎn)座子(transposon)[39]。轉(zhuǎn)座子也叫跳躍基因或轉(zhuǎn)座因子,是一段可以改變其在基因組中的位置的DNA序列。轉(zhuǎn)座因子幾乎存在于所有真核生物的基因組中,其衍生物構(gòu)成了基因組的很大一部分,從而在基因組功能和進化過程中發(fā)揮著重要作用[40]。根據(jù)轉(zhuǎn)座子的結(jié)構(gòu)特點和轉(zhuǎn)座方式可將其分為I型和II型。I型轉(zhuǎn)座子,也稱作RNA轉(zhuǎn)座子(即反轉(zhuǎn)錄轉(zhuǎn)座子),轉(zhuǎn)座方式為“復制–粘貼”型,即轉(zhuǎn)座時先將自身轉(zhuǎn)錄獲得RNA,再反轉(zhuǎn)錄回DNA,增加自身一倍的拷貝數(shù),增加的DNA再轉(zhuǎn)座至新的位置。II型轉(zhuǎn)座子,也稱作DNA轉(zhuǎn)座子,直接以“剪切?粘貼”的方式剪切下自身的DNA序列插入到新的位置,不會增加拷貝數(shù)。
Tn5轉(zhuǎn)座子是一種細菌轉(zhuǎn)座子,屬于II型轉(zhuǎn)座子的一種[41],最早是在中被發(fā)現(xiàn)。Tn5由編碼卡那霉素(kanamycin, KAN)、新霉素(neomycin, NEO)、鏈霉素(streptomycin, STR)3種抗生素的核心序列和位于側(cè)翼的兩個高度同源且倒置的 IS50(insertion sequence, IS)序列組成,該DNA序列全長5818 bp[42~45]。其中,IS50序列可編碼參與轉(zhuǎn)座的蛋白:轉(zhuǎn)座酶(transposase, Tnp)和轉(zhuǎn)座阻遏蛋白(transposase inhibitor, Inh)。但由于左側(cè)末端的IS50L序列的第1442位堿基處T/A堿基對被C/G堿基對取代發(fā)生突變,導致翻譯提前終止,因此僅有IS50R能夠表達正常有活性的Tnp和Inh[43]。每個IS50序列具有兩個19 bp的倒置末端:外末端(outside end, OE)和內(nèi)末端(inside end, IE)。兩倒置末端有7個bp不同,該末端是Tnp的結(jié)合位點[46~48]。
轉(zhuǎn)座發(fā)生過程大致分為3個步驟:(1)形成轉(zhuǎn)座復合體。Tnp分子的兩個N末端結(jié)構(gòu)域分別結(jié)合到Tn5轉(zhuǎn)座子的兩個OE末端,形成兩個Tnp-OE復合體[49];隨后以末端第2位序列為中心彎曲約36°~ 48°[50],兩個復合體發(fā)生聯(lián)會,Tnp的C末端結(jié)構(gòu)域相互作用而二聚體化,形成一個二聚體蛋白與兩分子DNA組成的Tn5轉(zhuǎn)座復合體[51,52];(2) Tnp切割。形成轉(zhuǎn)座復合體結(jié)構(gòu)后,Tnp便具備了切割DNA的活性[53],且正因為上述轉(zhuǎn)座復合體結(jié)構(gòu),結(jié)合在左末端的Tnp便會催化右末端的磷酸二酯鍵水解,而結(jié)合在右末端的Tnp負責催化左末端的磷酸二酯鍵水解,以此有效防止Tnp只對轉(zhuǎn)座子DNA鏈的一端進行切割[54,55];(3)插入靶序列。Tnp通過活化水分子水解DNA鏈,使Tn5兩末端分別形成3?-OH親核基團,該親核基團對DNA互補鏈進行親核攻擊,形成發(fā)夾結(jié)構(gòu),另一活化的水分子水解發(fā)夾結(jié)構(gòu),使Tn5的兩端均變?yōu)槠侥┒?,此時整個轉(zhuǎn)座復合體離開供體DNA,向靶序列結(jié)合[56];轉(zhuǎn)座子的3'-OH基團以交錯的方式攻擊靶序列中的磷酸二酯鍵,使轉(zhuǎn)座子插入位點間形成9 bp的粘性末端,通過其3'-OH端同靶序列的5?-P之間形成共價鍵,插入到靶DNA中[57,58],隨后在DNA聚合酶的作用下,Tn5的兩側(cè)翼形成9 bp的正向重復序列補齊缺口[59]。至此,整個轉(zhuǎn)座過程完成。
通過上述轉(zhuǎn)座過程不難看出,體外Tn5轉(zhuǎn)座過程僅需4個條件便能完成:Mg2+、轉(zhuǎn)座子末端序列、Tnp和靶DNA[60]。ATAC-seq過程中使用的就是簡化后的二聚體轉(zhuǎn)座復合物。復合物僅含有3個部分:轉(zhuǎn)座酶、末端序列和測序接頭[61],能夠保證在切割DNA的同時連接上接頭以便后續(xù)的測序工作。同時,簡化復合物的Tnp在Tn5主鏈上攜帶了特異的點突變體,使Tnp具有了更高的活性[60,62]。另外,之所以需要Mg2+,是由于Mg2+在轉(zhuǎn)座過程中能協(xié)同親核基團,在Mg2+的作用下,轉(zhuǎn)座酶上催化轉(zhuǎn)座子運動的DDE基序(天冬氨酸和谷氨酸)與Mg2+配位發(fā) 生突變,使原本不活躍的轉(zhuǎn)座酶變成高度活躍狀 態(tài)[63,64],是完成轉(zhuǎn)座必不可少的因子之一。目前,Tn5轉(zhuǎn)座子以其轉(zhuǎn)座的隨機性好、穩(wěn)定性高、插入位點容易測序等特點,已經(jīng)成為分子遺傳學研究的熱門工具[65,66]。隨著高通量測序技術(shù)的發(fā)展和實驗通量的不斷增加,Tn5轉(zhuǎn)座酶因其優(yōu)勢被應(yīng)用得越來越廣泛。其中,極速建庫、長讀長測序技術(shù)(single tube long fragment read, stLFR)、單細胞測序、 Mate Pair文庫構(gòu)建、染色質(zhì)轉(zhuǎn)座酶可及性可視化分析(assay of transposase-acce-ssible chromatin with visualization, ATAC-see),以及近幾年發(fā)現(xiàn)的Tn5家族對于蛋白結(jié)合區(qū)域、互作基因片段等研究的幫助都顯示Tn5轉(zhuǎn)座酶擁有不可估量的應(yīng)用潛力[67~69]。Buenrostro等[36]建立的ATAC-seq技術(shù),正是充分利用了Tn5酶在測序建庫中的巨大優(yōu)勢,能高效、精準的從基因組水平鑒別出染色質(zhì)開放區(qū)域,在生命科學領(lǐng)域的遺傳學研究中發(fā)揮著至關(guān)重要的作用。
ATAC-seq涉及3個主要的步驟[36,38]:(1)獲取細胞核。使用冷裂解緩沖液裂解細胞;(2)轉(zhuǎn)座和純化(圖1A)。細胞核提取后立即將沉淀重懸于轉(zhuǎn)座酶反應(yīng)混合物中,轉(zhuǎn)座后使用Qiagen MinElute PCR Purification Kit純化樣品;(3) PCR擴增(圖1B)。純化后,進行qPCR定量分析以及PCR擴增。上述過程大概需要3 h,幾處細節(jié)的處理尤為重要:(1)為減小PCR中的片段大小和GC偏差影響,需要通過qPCR來確定PCR后續(xù)的循環(huán)數(shù),在飽和前停止擴增,以此保證轉(zhuǎn)座后片段大小在40 bp~1 kb范圍而不需要進行大小選擇,維持較高的庫復雜性;(2)因轉(zhuǎn)座過程產(chǎn)生了9 bp的空隙,因此PCR的第一步需要72℃反應(yīng)5 min以填補該空隙,且所用的PCR酶是具有鏈置換功能的非熱啟動酶;(3)對于一個DNA片段而言,兩端接頭連接是隨機的。Tn5酶切后會出現(xiàn)3類產(chǎn)物:單端接頭1、單端接頭2以及雙端接頭1–接頭2,只有連接不同接頭的片段可用于富集擴增及測序。
圖1 轉(zhuǎn)座及擴增過程示意圖
A:轉(zhuǎn)座過程;B:擴增過程。
ATAC-seq的數(shù)據(jù)分析過程大概可分為4個階段[24]:第一階段的數(shù)據(jù)預處理主要包括了過濾、比對和數(shù)據(jù)質(zhì)量檢測,利用軟件CASAVA(Illumina)獲得FASTQ文件后過濾掉低質(zhì)量片段,由于相鄰轉(zhuǎn)座的最小間隔為38 bp,通常38 bp以下的片段直接刪除[61],并用Bowtie與參考基因組進行比對,隨后利用SAMtools去除重復的以及細胞器的reads;第二階段是質(zhì)控、數(shù)據(jù)可視化和peak calling,第二次的質(zhì)控標準包括線粒體基因組所占比例高低和插入物大小分布圖,使用軟件IGV可對數(shù)據(jù)進行可視化處理,峰可以用軟件macs2、Hotspot或者ZINBA尋找;第三階段是peak注釋,以獲取基因組中peak的位置信息;最后一步為模體(motif)注釋和差異peaks分析,將峰對應(yīng)序列進行注釋以間接確定轉(zhuǎn)錄因子信息,同時,利用diffbind、DESeq2等工具分析如不同的實驗條件、多個時間節(jié)點、不同的發(fā)育時期等的差異區(qū)域,最終獲得轉(zhuǎn)錄因子結(jié)合位點的染色質(zhì)可接近性狀態(tài)信息。
開展染色質(zhì)開放區(qū)域的表觀基因組學研究具有巨大的生物學意義,但過去的研究方法受到了復雜工作流程和大量細胞需求量的限制,從而導致該領(lǐng)域進展相對緩慢。直到ATAC-seq的出現(xiàn),為注釋開放染色質(zhì)的基因組位置、DNA結(jié)合蛋白、轉(zhuǎn)錄因子結(jié)合位點等基因組功能元件提供了新的契機。ATAC-seq技術(shù)擺脫了像DNase-seq需要精確控制酶量以及FAIRE-seq需要確定甲醛交聯(lián)時長等條件的限制,但依然存在影響其精確性的因素,如線粒體及植物細胞中葉綠體DNA的干擾、冷凍組織細胞DNA提取效率低、接頭連接的隨機性造成DNA片段的損失,以及大量酶切后的DNA 片段過大而無法富集等[24,36,38,70]。針對上述缺陷,同樣產(chǎn)生了一系列改進措施。例如,Lu等[71]開發(fā)的FANS-ATAC-seq (fluorescent activated nuclei sorting, FANS)、Roger等[72]開發(fā)的與細胞核基因組序列比對能達90%以上的INTACT (isolation of nuclei tagged in specific cell types)系統(tǒng),以及與INTACT有相似結(jié)果的蔗糖沉淀法(crude)確保了在測定中使用高質(zhì)量的完整細胞核的同時,能最大限度地減少線粒體和葉綠體中DNA的污染[73]。Corces等[74]發(fā)明的Omni-ATAC,提高了ATAC-seq對困難細胞系、稀少的原代細胞和臨床上相關(guān)的冷凍組織中的應(yīng)用普遍性。此外,針對接頭的隨機性和剪切后片段過大的問題,Sos等[75]開發(fā)了THS-seq技術(shù),具有比傳統(tǒng)EzTn5轉(zhuǎn)座酶活性更高的新型Tn5超突變體(Tn5059)以及更優(yōu)化的反應(yīng)溶液和條件。同時設(shè)計T7啟動子加轉(zhuǎn)錄引物替換原Tn5轉(zhuǎn)座復合物中的Adapter 1和2。通過轉(zhuǎn)錄生成單鏈RNA,利用與RNA測序相同的原理獲得cDNA并加上銜接子,最終完成建庫。該技術(shù)避免了接頭的隨機連接,大大提高了轉(zhuǎn)座效率,使得測序數(shù)據(jù)更為完整。隨著ATAC-seq技術(shù)被不斷改進,ATAC-seq已逐漸成為目前染色質(zhì)可及性分析的主流實驗方法。
自ATAC-seq技術(shù)誕生起,該技術(shù)憑借其穩(wěn)定性和高靈敏度已廣泛應(yīng)用于表觀基因組學研究。除了能用來確定功能基因組調(diào)控區(qū)域信息、找出組織特異基因以及預測潛在結(jié)合蛋白外,還能跟其他分析技術(shù)聯(lián)合,如RNA-seq、ChIP-seq(chromatin immuno-precipitation followed by high throughput sequencing)以及Hi-C (high-through chromosome conformation ca-pture)等,用以發(fā)現(xiàn)潛在的關(guān)鍵調(diào)控元件、轉(zhuǎn)錄因子和理解控制體內(nèi)復雜過程的基因調(diào)控網(wǎng)絡(luò)。其應(yīng)用包括如下方面:
(1) DNA調(diào)控功能元件注釋。ATAC-seq最直接的功能就是用來研究各種調(diào)控因子如TF、啟動子、增強子等的結(jié)合區(qū)域的開放狀態(tài)以及對核小體進行定位,如對啟動子區(qū)域開放狀態(tài)的研究。Tan等[76]為探究壽命長且癌癥發(fā)病率極低的裸鼴鼠的遺傳機制,用ATAC-seq探測其染色質(zhì)開放區(qū)域,結(jié)果顯示裸鼴鼠的重編程基因的啟動子區(qū)域更多的是處于關(guān)閉狀態(tài)。通過對啟動子區(qū)域開放狀態(tài)后進行SV40 LT (large tantigen, LT)抗原處理,發(fā)現(xiàn)LT可以抑制抑癌基因,從而提高重編程效率;而LT處理后,啟動子區(qū)可接近性較處理前更高。上述結(jié)果表明裸鼴鼠細胞具有更穩(wěn)定的表觀基因組,提示可以利用這種穩(wěn)定性為人類癌癥預防和治療提供新見解。同樣,還有對轉(zhuǎn)錄因子結(jié)合區(qū)域開放性的研究。Scharer等[77]為深入了解系統(tǒng)性紅斑狼瘡(systemic lupus erythematosus, SLE)的表觀遺傳調(diào)控過程,對來自SLE和健康對照的CD19+幼稚B細胞進行ATAC-seq分析。他們發(fā)現(xiàn)與健康對照相比,參與B細胞活化的基因周圍的基因座,以及調(diào)節(jié)B細胞活化和分化的TF的結(jié)合位點在SLE細胞中可接近性更高,該結(jié)果驗證了與B細胞活化相關(guān)的區(qū)域的開放狀態(tài),為進一步研究SLE疾病機制打下基礎(chǔ),充分體現(xiàn)了ATAC-seq確定染色質(zhì)開放區(qū)域和鑒定順式調(diào)控元件的能力。Kristofer等[78]利用ATAC-seq比較了致癌蛋白RasV12誘導的癌組織在早期腫瘤、晚期腫瘤與正常組織間染色質(zhì)開放區(qū)域的狀態(tài)。他們發(fā)現(xiàn)與正常組織比,腫瘤在發(fā)展過程中有數(shù)千個更容易接近的區(qū)域,從這些區(qū)域篩選并鑒定了在Ras依賴性腫瘤發(fā)生過程中異?;钴S的調(diào)節(jié)區(qū)域,并結(jié)合motif分析確定出了結(jié)合這些區(qū)域的關(guān)鍵轉(zhuǎn)錄因子AP-1和Stat92E。后期通過引入突變使Stat92E喪失功能后,發(fā)現(xiàn)腫瘤的嚴重程度降低,證明了轉(zhuǎn)錄因子Stat92E在腫瘤治療發(fā)展中重要意義,也對Ras依賴性腫瘤的發(fā)展有了新的認知。上述基于ATAC-seq和motif分析的成功案例表明,ATAC-seq可作為一種研究功能基因組調(diào)控區(qū)域和了解體內(nèi)復雜基因調(diào)控網(wǎng)絡(luò)的有效方式。另外,轉(zhuǎn)錄過程中,轉(zhuǎn)錄因子與核小體競爭結(jié)合DNA序列,轉(zhuǎn)錄因子結(jié)合處的核小體水平也因此較低[79]。所以,獲取核小體定位信息,對于了解轉(zhuǎn)錄調(diào)控、DNA復制和修復等過程也很重要。Quillien等[80]為鑒定整個斑馬魚基因組中的細胞特異性增強子,對來自Tg (fli1a: egfp)y1轉(zhuǎn)基因胚胎的內(nèi)皮細胞的細胞核進行ATAC-seq分析;在FANS技術(shù)的輔助下,用綠色熒光蛋白標記內(nèi)皮細胞,通過熒光分離出細胞核獲得高質(zhì)量的ATAC-seq數(shù)據(jù);后續(xù)通過分析短DNA片段(<100 bp)和長片段(180~247 bp)分別獲得無核小體區(qū)及核小體結(jié)合區(qū),以此定位核小體的位置。該研究揭示了整個基因組中轉(zhuǎn)錄起始位點的核小體定位模式以及與組蛋白修飾間的關(guān)聯(lián),還提供了在胚胎發(fā)育過程中控制基因表達的全基因組范圍轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)的動態(tài)信息。
(2) ATAC-seq與RNA-seq、ChIP-seq等多組學數(shù)據(jù)的聯(lián)合分析。ATAC-seq技術(shù)更為巧妙的應(yīng)用是將其獲得的數(shù)據(jù)與其他表觀遺傳信息相結(jié)合,用以增強對科學問題的進一步解釋。許多研究表明,通過聯(lián)合ATAC-seq與RNA-seq數(shù)據(jù)進行分析,可發(fā)現(xiàn)潛在的特異性基因。Ackermann等[81]使用ATAC- seq對純化的人α和β細胞中的開放染色質(zhì)區(qū)進行了首次分析。通過與RNA-seq數(shù)據(jù)整合,進一步鑒定了兩種細胞中已知的胰島細胞轉(zhuǎn)錄因子的結(jié)合位點和已發(fā)現(xiàn)的II型糖尿病易感基因座的單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)。更重要的是,發(fā)現(xiàn)了這兩種細胞類型的新型特征基因,“組特異性蛋白質(zhì)”(group specific protein)即維生素D結(jié)合蛋白僅存在于α細胞,而軟骨素(chondrolectin)的免疫反應(yīng)性僅存在于β細胞中。ATAC-seq與RNA-seq的聯(lián)合分析具備鑒定轉(zhuǎn)錄因子結(jié)合位點和發(fā)現(xiàn)潛在特異性基因的作用。2016年,Garcia等[82]通過ATAC-seq比對分析了經(jīng)典食道癌細胞系(OE33)、一種新發(fā)現(xiàn)的食管癌細胞系(MFD-1)、以及正常細胞系(HET1A)三種細胞系的特異染色質(zhì)開放位點。他們發(fā)現(xiàn)和正常對照組相比,MFD-1特異的染色質(zhì)開放位點顯著富集著CTCF、NFY、Meis3、Nrf2的motif,且這些位點附近基因富集在和食道癌及消化道腫瘤相關(guān)的功能基因區(qū)域內(nèi)。后續(xù)結(jié)合全基因組測序和RNA-seq技術(shù),發(fā)現(xiàn)了MFD-1的基因表達特性,進一步表明了MFD-1作為食管腺癌的臨床疾病模型的可行性。同樣,通過ATAC-seq與RNA-seq技術(shù)聯(lián)合,可驗證基因表達量與ATAC-seq信號的相關(guān)性,從而找出對應(yīng)的轉(zhuǎn)錄因子。Ho等[83]為了找出特異表征間充質(zhì)干細胞(mesenchymal stem cells, MSCs)的分子特征,從8周齡小鼠的四個組織(股骨和椎骨的骨髓、脂肪、肺)中分離出MSCs進行ATAC-seq和RNA-seq聯(lián)合分析。首先,得出了ATAC-seq比轉(zhuǎn)錄組分析更加適合用來研究細胞特異性的結(jié)論,隨后鑒定出可能有助于區(qū)分具有不同特征的MSCs的潛在轉(zhuǎn)錄因子,并推測這種通過研究染色質(zhì)可及性來分析MSCs的方法,也可用于表征人類的MSCs和人類MSCs的臨床應(yīng)用。值得注意的是,雖然啟動子可訪問性和基因表達之間呈正相關(guān),但也有許多研究表明,低表達或表達降低并不總是由于缺乏可訪問區(qū)導致[84,85]。因此,Starks等[86]再一次聯(lián)合使用ATAC-seq和RNA-seq技術(shù),探索染色質(zhì)開放性與基因表達間的關(guān)聯(lián)。試驗通過分析妊娠中期小鼠胎盤的表達水平和啟動子覆蓋率將基因分成3組:高啟動子覆蓋率和高表達的基因組(HA-HE)、中低覆蓋率和高表達的基因組(HA-ME)、低覆蓋率和低表達的基因組(MA-ME)。結(jié)果發(fā)現(xiàn)HA-HE組基因可能是管家基因,而HA-ME組基因可能是組織特異性基因。隨后,他們通過motif富集分析鑒定出了抑制HA-ME組基因的潛在轉(zhuǎn)錄因子,并發(fā)現(xiàn)HA-ME組的基因與胎盤的功能密切相關(guān)。該試驗證明了ATAC-seq和RNA-seq的聯(lián)合分析可用于小鼠和人的多種組織和細胞類型,用以鑒定活性抑制因子和組織特異性基因。
ATAC-seq與ChIP-seq的聯(lián)合使用常用于驗證轉(zhuǎn)錄因子與目標開放區(qū)域的結(jié)合。2018年,Rajb-handari等[87]聯(lián)合ATAC-seq、ChIP-seq和RNA-seq揭示了抗炎癥因子IL-10的作用機理。為探究IL-10抑制脂肪細胞產(chǎn)熱和能量輸出的潛在機制,他們先利用ATAC-seq和RNA-seq,驗證了IL-10能改變脂肪細胞的染色質(zhì)開放狀態(tài)和降低產(chǎn)熱相關(guān)基因的表達量。最后利用ChIP-seq揭示了IL-10通過抑制產(chǎn)熱轉(zhuǎn)錄因子ATF和C/EBP β向增強子區(qū)域募集進而達到抗炎作用的機制。Denny等[88]為探究小細胞肺癌的轉(zhuǎn)移機制,聯(lián)合ATAC-seq、ChIP-seq與RNA-seq對肺原發(fā)癌和肝臟轉(zhuǎn)移癌進行比較分析。ATAC-seq分析發(fā)現(xiàn)轉(zhuǎn)移癌中的染色質(zhì)開放性普遍增高,且差異的染色質(zhì)開放性區(qū)域主要在基因遠端調(diào)控元件上。隨后通過motif富集分析、RNA-seq和ChIP-seq,發(fā)現(xiàn)顯著富集的基因在轉(zhuǎn)移癌中表達量增高,其ChIP信號與開放信號正相關(guān),從而最終鎖定關(guān)鍵基因。
此外,還有聯(lián)合Hi-C分析尋找調(diào)控元件如增強子。2018年,Wang等[89]利用ATAC-seq和Hi-C研究多倍體棉花的三維基因組結(jié)構(gòu)和轉(zhuǎn)錄調(diào)控之間的關(guān)系。他們發(fā)現(xiàn)一些由DNase-seq數(shù)據(jù)獲得的DHSs與啟動子之間存在互作,并推測這些處于開放狀態(tài)的區(qū)域是潛在增強子,與RNA-seq數(shù)據(jù)整合進一步確認這些關(guān)鍵候選增強子具有轉(zhuǎn)錄活性。Mas等[90]聯(lián)合Hi-C、ATAC-seq、ChIP-seq和RNA-seq四種技術(shù),研究敲除甲基轉(zhuǎn)移酶復合體亞基基因后對基因組三維結(jié)構(gòu)、染色質(zhì)可接近性、組蛋白修飾以及表達水平的影響。首先利用ChIP-seq和reChIP-seq檢測二價修飾,鑒定二價啟動子。再通過Hi-C分析發(fā)現(xiàn)的敲除會引起二價基因轉(zhuǎn)錄起始位點與上下游互作模式的改變。隨后ATAC-seq研究發(fā)現(xiàn)敲除引起二價啟動子區(qū)的可接近性減少。最終揭示了通過作用于二價啟動子,維持相對集中的二價基因間互作,可接近性狀態(tài)和轉(zhuǎn)錄水平正常的作用。總之,ATAC-seq能夠與各種組學構(gòu)建不同的關(guān)聯(lián)模式,從不同的分析思路獲取表觀遺傳信息或是探究轉(zhuǎn)錄調(diào)控機制,充分展現(xiàn)了其巨大的應(yīng)用前景和無限的可能性。
染色質(zhì)狀態(tài)是以細胞類型特異性的方式動態(tài)調(diào)節(jié)的[91]。雖然DNase-seq、ATAC-seq等技術(shù)用于測定全基因組水平染色質(zhì)特定區(qū)域的可接近性,但測量獲得的是群體細胞平均染色質(zhì)狀態(tài),掩蓋了細胞類型間和細胞內(nèi)的異質(zhì)性。因此,基于單細胞測序的ATAC-seq (single-cell assay for transposase-acces-sible chromatin, scATAC-seq)被用于探測單細胞水平的染色質(zhì)可及性[92]。scATAC-seq可應(yīng)用于分析細胞亞群的基因調(diào)控網(wǎng)絡(luò)、研究細胞異質(zhì)性、發(fā)現(xiàn)生物標志物、研究單細胞表觀基因組學等[93,94]。
目前scATAC-seq主要通過兩種技術(shù)手段來高效獲取單細胞全基因組范圍染色質(zhì)開放信息,分別為微流控技術(shù)[92]和ATAC-seq組合標簽方法(single-cell combinatorial indexed ATAC-seq, sciATAC- seq)[95]。單細胞ATAC-seq目前最常用的平臺為 10× Genomics。其核心的微流控技術(shù)原理是將帶有barcode信息的凝膠珠與轉(zhuǎn)座酶處理后的細胞核混合,包裹在油滴中形成GEMs(Gel Beads-in- emulsion)。一個特定barcode序列標記一個細胞核的所有序列以此區(qū)別各個細胞。單細胞 ATAC-Seq微流控技術(shù)因其捕獲率高、容納量大和價格相對較低等優(yōu)點,被廣泛應(yīng)用于探索由表觀遺傳變化引起的細胞異質(zhì)性、探索生物標志物、了解基因表達上游的基因調(diào)控網(wǎng)絡(luò)等方面[93]。另外,2015年,華盛頓大學的Jay Shendure團隊開發(fā)了ATAC-seq組合標簽技術(shù)sciATAC-seq[95]。該方法不必依賴微流控平臺,而是利用細胞標簽技術(shù)對細胞核進行分子標記,通過兩次稀釋標記-混勻-再稀釋標記-再混勻,使單個細胞能夠被唯一標記而無需物理分離細胞。以此獲得大量單細胞的染色質(zhì)開放信息。該技術(shù)與微流控scATAC-seq相比,每個實驗可共同測定數(shù)百萬個單細胞,獲得更多的單細胞信息。sciATAC-seq的局限性是由于數(shù)據(jù)的稀疏性導致產(chǎn)生的數(shù)據(jù)集難以分析,無法獲得較高的精確性[96,97]。不過,相信隨著數(shù)據(jù)集分析工具的不斷改進,能夠有效地提高分析精確性。如最新的分析工具Scasat可將開放的染色質(zhì)信息作為二進制數(shù)據(jù)進行處理,并在保持數(shù)據(jù)的二進制特性的同時校正批次效應(yīng),使得該工具在分析scATAC-seq數(shù)據(jù)方面優(yōu)于其他工具[98]。sciATAC-seq常用于獲取單細胞的染色質(zhì)調(diào)控信息以研究轉(zhuǎn)錄調(diào)控機制[99,100]。
單細胞測序也同樣發(fā)展到了單細胞水平的多組學整合分析,這對于準確解析細胞群中的細胞間差異至關(guān)重要。通過單細胞多組學聯(lián)合分析,如通過聯(lián)合scATAC-seq和RNA-seq技術(shù),同時獲得單細胞的表觀基因組和轉(zhuǎn)錄組學信息,能夠鑒定引起這些不同細胞表型的致病的順式和反式作用元件,揭示基因表達調(diào)控特異性。如用于研究腫瘤異質(zhì)性[93]、揭示造血系統(tǒng)異質(zhì)性[101]等。Cusanovich等[94]為深入研究細胞亞群的基因表達調(diào)控機制,應(yīng)用組合標簽技術(shù)sciATAC-seq分析13個成年小鼠組織的10萬個單細胞的基因組范圍內(nèi)染色質(zhì)的可接近性,采用了一種label-transfer的方法,整合RNA-seq和ATAC-seq數(shù)據(jù)對細胞進行聚類分析,共鑒定出30個主要細胞亞群,隨后確定出85種不同的染色質(zhì)可接近性模式,以及近40萬個差異可接近性元件。并使用這些數(shù)據(jù)將調(diào)節(jié)元件與其靶基因建立聯(lián)系,鑒定出了許多組織特異性的轉(zhuǎn)錄因子。之后,通過將小鼠染色質(zhì)開放性與人類全基因組相關(guān)聯(lián),揭示了部分人類遺傳病與開放染色質(zhì)間的潛在關(guān)系,拓展了該研究的意義。整個實驗為組織結(jié)構(gòu),發(fā)育和分化,各組織器官的調(diào)控網(wǎng)絡(luò)的研究提供了豐富的參考。scATAC-seq組合標簽的方式進一步提高了單細胞ATAC-seq的通量,標簽組合作為單細胞基因組學的一種推廣策略[102],sciATAC-seq具有不可估量的發(fā)展?jié)撃???傊?,單細胞多組學聯(lián)合分析無論是在疾病研究還是了解基因組功能等領(lǐng)域上都有廣泛的應(yīng)用前景。
鑒定染色質(zhì)開放區(qū)域并對其進行精確定位,對表觀遺傳學的研究具備重要意義。隨著高通量測序技術(shù)的不斷發(fā)展,以ATAC-seq為代表的染色質(zhì)開放區(qū)域獲取技術(shù),將能系統(tǒng)發(fā)掘全基因組上的啟動子、增強子、絕緣子和轉(zhuǎn)錄因子等重要調(diào)控元件的結(jié)合位點,對深入了解整個基因調(diào)控網(wǎng)絡(luò)具有重要意義。除了應(yīng)用于尋找組織特異基因、定位核小體外,將ATAC-seq的染色質(zhì)開放信息進一步整合基因組、轉(zhuǎn)錄組、甲基化組等多組學數(shù)據(jù),可更加立體、直觀地了解復雜基因之間的相互作用及其對表型的影響效應(yīng)。
當前,ATAC-seq技術(shù)已成為研究表觀遺傳調(diào)控的重要手段,其更加簡便的操作過程和更易滿足的實驗材料,已在染色質(zhì)開放區(qū)獲取方面展現(xiàn)出無可比擬的優(yōu)勢和應(yīng)用潛能。盡管該技術(shù)目前的數(shù)據(jù)分析工具還不夠成熟,但不容質(zhì)疑的是,其已成為表觀遺傳學研究的突破性技術(shù)。隨著相應(yīng)實驗技術(shù)的進一步提高,可以預期,ATAC-seq將成為復雜性狀遺傳解析的研究利器之一,從而進一步推動人類、小鼠及其他動植物等生命科學領(lǐng)域的穩(wěn)步向前發(fā)展。
[1] Kornberg RD. Chromatin structure: a repeating unit of histones and DNA., 1974, 184(4139): 868–871.
[2] Richmond TJ, Finch JT, Rushton B, Rhodes D, Klug A. Structure of the nucleosome core particle at 7 A resolution., 1984, 311(5986): 532–537.
[3] Zhou YB, Gerchman SE, Ramakrishnan V, Travers A, Muyldermans S. Position and orientation of the globular domain of linker histone H5 on the nucleosome., 1998, 395(6700): 402–405.
[4] Thurman RE, Rynes E, Humbert R, Vierstra J, Maurano MT, Haugen E, Sheffield NC, Stergachis AB, Wang H, Vernot B, Garg K, John S, Sandstrom R, Bates D, Boatman L, Canfield TK, Diegel M, Dunn D, Ebersol AK, Frum T, Giste E, Johnson AK, Johnson EM, Kutyavin T, Lajoie B, Lee BK, Lee K, London D, Lotakis D, Neph S, Neri F, Nguyen ED, Qu H, Reynolds AP, Roach V, Safi A, Sanchez ME, Sanyal A, Shafer A, Simon JM, Song L, Vong S, Weaver M, Yan Y, Zhang Z, Zhang Z, Lenhard B, Tewari M, Dorschner MO, Hansen RS, Navas PA, Stamatoyannopoulos G, Iyer VR, Lieb JD, Sunyaev SR, Akey JM, Sabo PJ, Kaul R, Furey TS, Dekker J, Crawford GE, Stamatoyannopoulos JA. The accessible chromatin landscape of the human genome., 2012, 489(7414): 75–82.
[5] Poirier MG, Bussiek M, Langowski J, Widom J. Spontaneous access to DNA target sites in folded chromatin fibers., 2008, 379(4): 772–786.
[6] Fedor MJ. Chromatin structure and gene expression., 1996, 4(18): 9384–9388.
[7] John S, Sabo PJ, Thurman RE, Sung MH, Biddie SC, Johnson TA, Hager GL, Stamatoyannopoulos JA. Chromatin accessibility pre-determines glucocorticoid receptor binding patterns., 2011, 43(3): 264– 268.
[8] Bell O, Tiwari VK, Thom? NH, Schübeler D. Determinants and dynamics of genome accessibility., 2011, 12(8): 554–564.
[9] Kouzarides T. Chromatin modifications and their function., 2007, 128(4): 693–705.
[10] Jiang C, Pugh BF. Nucleosome positioning and gene regulation: advances through genomics., 2009, 10(3): 161–172.
[11] Schones DE, Cui K, Cuddapah S, Roh TY, Barski A, Wang ZB, Wei G, Zhao KJ. Dynamic regulation of nucleosome positioning in the human genome., 2008, 132(5): 887–898.
[12] Hewish DR, Burgoyne LA. Chromatin sub-structure. The digestion of chromatin DNA at regularly spaced sites by a nuclear deoxyribonuclease., 1973, 52(2): 504–510.
[13] Scott WA, Wigmore DJ. Sites in simian virus 40 chromatin which are preferentially cleaved by endonucleases., 1978, 15(4): 1511–1518.
[14] Wu C, Bingham PM, Livak KJ, Holmgren R, Elgin SCR. The chromatin structure of specific genes: I. Evidence for higher order domains of defined DNA sequence., 1979, 16(4): 797–806.
[15] Stalder J, Larsen A, Engel JD, Dolan M, Groudine M, Weintraub H. Tissue-specific DNA cleavages in the globin chromatin domain introduced by DNase I., 1980, 20(2): 451–460.
[16] Mcghee JD, Wood WI, Dolan M, Engel JD, Felsenfeld G. A 200 base pair region at the 5’ end of the chicken adult β-globin gene is accessible to nuclease digestion., 1981, 27(1, Part 2): 45–55.
[17] Gross DS, Garrard WT. Nuclease hypersensitive sites in chromatin., 2003, 57(57): 159–197.
[18] Wu C. The 5’ ends ofheat shock genes in chromatin are hypersensitive to DNase I., 1980, 286(5776): 854–860.
[19] Crawford GE, Holt IE, Mullikin JC, Tai D, Blakesley R, Bouffard G, Young A, Masiello C, Green ED, Wolfsberg TG, Collins FS. Identifying gene regulatory elements by genome-wide recovery of DNase hypersensitive sites ., 2004, 101(4): 992–997.
[20] Boyle AP, Davis S, Shulha HP, Meltzer P, Margulies EH, Weng Z, Furey TS, Crawford GE. High-resolution mapping and characterization of open chromatin across the genome., 2008, 132(2): 311–322.
[21] Giresi PG, Kim J, Mcdaniell RM, Iyer VR, Lieb JD. FAIRE (Formaldehyde-Assisted Isolation of Regulatory Elements) isolates active regulatory elements from human chromatin., 2007, 17(6): 877–885.
[22] Kelly TK, Liu YP, Lay FD, Liang GN, Berman BP, Jones PA. Genome-wide mapping of nucleosome positioning and DNA methylation within individual DNA molecules., 2012, 22(12): 2497– 2506.
[23] He HH, Meyer CA, Hu SS, Chen MW, Zang C, Liu Y, Rao PK, Fei T, Xu H, Long H, Liu XS, Brown M. Refined DNase-seq protocol and data analysis reveals intrinsic bias in transcription factor footprint identification., 2014, 11(1): 73–78.
[24] Tsompana M, Buck MJ. Chromatin accessibility: a window into the genome., 2014, 7(1): 33.
[25] Cumbie JS, Filichkin SA, Megraw M. Improved DNase-seq protocol facilitates high resolution mapping of DNase I hypersensitive sites in roots in., 2015, 11(1): 42.
[26] Rizzo JM, Sinha S. Analyzing the global chromatin structure of keratinocytes by MNase-seq., 2014, 1195: 49–59.
[27] Telford DJ, Stewart BW. Micrococcal nuclease: its specificity and use for chromatin analysis., 1989, 21(2): 127–137.
[28] Chung HR, Dunkel I, Heise F, Linke C, Krobitsch S, Ehrenhofer-Murray AE, Sperling SR, Vingron M. The effect of micrococcal nuclease digestion on nucleosome positioning data., 2010, 5(12): e15754.
[29] Clark DJ. Nucleosome Positioning, Nucleosome spacing and the nucleosome code., 2010, 27(6): 781–793.
[30] Zentner GE, Henikoff S. Surveying the epigenomic landscape, one base at a time., 2012, 13(10): 250.
[31] Kumar V, Muratani M, Rayan NA, Kraus P, Lufkin T, Ng HH, Prabhakar S. Uniform, optimal signal processing of mapped deep-sequencing data., 2013, 31(7): 615–622.
[32] Simon JM, Giresi PG, Davis IJ, Lieb JD. Using formaldehyde-assisted isolation of regulatory elements (FAIRE) to isolate active regulatory DNA., 2012, 7(2): 256–267.
[33] Auerbach RK, Euskirchen G, Rozowsky J, Lamarre- Vincent N, Moqtaderi Z, Lefrancois P, Struhl K, Gerstein M, Snyder M. Mapping accessible chromatin regions using Sono-Seq., 2009, 106(35): 14926–14931.
[34] Rhie SK, Schreiner S, Farnham PJ. Defining regulatory elements in the human genome using nucleosome occupancy and methylome sequencing (NOMe-Seq)., 2018, 1766: 209–229.
[35] Klemm SL, Shipony Z, Greenleaf WJ. Chromatin accessibility and the regulatory epigenome., 2019, 20(4): 207–220.
[36] Buenrostro JD, Giresi PG, Zaba LC, Chang HY, Greenleaf WJ. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position., 2013, 10(12): 1213–1218.
[37] Wu JY, Huang B, Chen H, Yin QZ, Liu Y, Xiang YL, Zhang BJ, Liu BF, Wang QJ, Xia WK, Li WZ, Li YY, Ma J, Peng X, Zheng H, Ming J, Zhang WH, Zhang J, Tian G, Xu F, Chang Z, Na J, Yang XR, Xie W. The landscape of accessible chromatin in mammalian preimplantation embryos., 2016, 534(7609): 652–657.
[38] Buenrostro JD, Wu B, Chang HY, Greenleaf WJ. ATAC-seq: A method for assaying chromatin accessibility genome-wide., 2015, 109: 21–29.
[39] Mcclintock B. The origin and behavior of mutable loci in maize., 1950, 36(6): 344– 355.
[40] Bucher E, Reinders J, Mirouze M. Epigenetic control of transposon transcription and mobility in., 2012, 15(5): 503–510.
[41] Huang CR, Burns KH, Boeke JD. Active transposition in genomes., 2012, 46: 651–675.
[42] Berg DE, Davies J, Allet B, Rochaix JD. Transposition of R factor genes to bacteriophage lambda., 1975, 72(9): 3628–3632.
[43] Rothstein SJ, Jorgensen RA, Postle K, Reznikoff WS. The inverted repeats of Tn5 are functionally different., 1980, 19(3): 795–805.
[44] Lovell S, Goryshin IY, Reznikoff WR, Rayment I. Two-metal active site binding of a Tn5 transposase synaptic complex., 2002, 9(4): 278–281.
[45] Auerswald EA, Ludwig G, Schaller H. Structural analysis of Tn5., 1981, 45 Pt 1: 107.
[46] Berg DE. Julian Davies and the discovery of kanamycin resistance transposon Tn5., 2017, 70(4): 339–346.
[47] Reznikoff WS. The TN5 transposon., 1993, 47(1): 945–963.
[48] Reznikoff WS, Bhasin A, Davies DR, Goryshin IY, Mahnke LA, Naumann T, Rayment I, Steiniger-White M, Twining SS. Tn5: A molecular window on transposition., 1999, 266(3): 729–734.
[49] Zhou M, Reznikoff WS. Tn5 transposase mutants that alter DNA binding specificity., 1997, 271(3): 362–373.
[50] York D, Reznikoff WS. DNA binding and phasing analyses of Tn5 transposase and a monomeric variant., 1997, 25(11): 2153–2160.
[51] Steiniger-White M, Reznikoff WS. The C-terminal alpha helix of Tn5 transposase is required for synaptic complex formation., 2000, 275(30): 23127–23133.
[52] Bhasin A, Goryshin IY, Steiniger-White M, York D, Reznikoff WS. Characterization of a Tn5 pre-cleavage synaptic complex., 2000, 302(1): 49–63.
[53] Kale SB, Landree MA, Roth DB. Conditional RAG-1 mutants block the hairpin formation step of V(D)J recombination., 2001, 21(2): 459–466.
[54] Naumann TA, Reznikoff WS. Trans catalysis in Tn5 transposition., 2000, 97(16): 8944–8949.
[55] Lisa AMB, Goryshin IY, Reznikoff WS. A mechanism for Tn5 inhibition., 1999, 274(1): 86.
[56] Bhasin A, Goryshin IY, Reznikoff WS. Hairpin formation in Tn5 transposition., 1999, 274(52): 37021–37029.
[57] Mizuuchi K, Adzuma K. Inversion of the phosphate chirality at the target site of Mu DNA strand transfer: Evidence for a one-step transesterification mechanism., 1991, 66(1): 129–140.
[58] Mizuuchi K. Transpositional recombination: mechanistic insights from studies of mu and other elements., 1992, 61: 1011–1051.
[59] Crellin P, Chalmers R. Protein-DNA contacts and conformational changes in the Tn10 transpososome during assembly and activation for cleavage., 2001, 20(14): 3882–3891.
[60] Goryshin IY, Reznikoff WS. Tn5transposition., 1998, 273(13): 7367–7374.
[61] Adey A, Morrison HG, Asan, Xun X, Kitzman JO, Turner EH, Stackhouse B, Mackenzie AP, Caruccio NC, Zhang X, Shendure J. Rapid, low-input, low-bias construction of shotgun fragment libraries by high- densitytransposition., 2010, 11(12): R119.
[62] Reznikoff WS. Transposon Tn5., 2008, 42: 269–286.
[63] Davies DR, Mahnke Braam L, Reznikoff WS, Rayment I. The three-dimensional structure of a Tn5 transposase- related protein determined to 2.9-A resolution., 1999, 274(17): 11904–11913.
[64] Peterson G, Reznikoff W. Tn5 transposase active site mutations suggest position of donor backbone DNA in synaptic complex., 2003, 278(3): 1904– 1909.
[65] Reznikoff WS. Tn5 as a model for understanding DNA transposition., 2003, 47(5): 1199–1206.
[66] Sakamoto H, Thiberge S, Akerman S, Janse CJ, Carvalho TG, Ménard R. Towards systematic identification of Plasmodium essential genes by transposon shuttle mutagenesis., 2005, 33(20): e174.
[67] Caruccio N. Preparation of next-generation sequencing libraries using NexteraTMtechnology: simultaneous DNA fragmentation and adaptor tagging by in vitro transposition., 2011, 733: 241–255.
[68] Chen CY, Xing D, Tan LZ, Li H, Zhou GY, Huang L, Xie XS. Single-cell whole-genome analyses by linear amplification via transposon insertion (LIANTI)., 2017, 356(6334): 189–194.
[69] Chen XQ, Shen Y, Draper W, Buenrostro JD, Litzenburger U, Cho SW, Satpathy AT, Carter AC, Ghosh RP, East-Seletsky A, Doudna JA, Greenleaf WJ, Liphardt JT, Chang HY. ATAC-see reveals the accessible genome by transposase-mediated imaging and sequencing., 2016, 13(12): 1013–1020.
[70] Buenrostro JD Giresi PG Zaba LC, Chang HY, Greenleat W. Transposition of native chromatin for multimodal regulatory analysis and personal epigenomics., 2013, 10(12): 1213–1218.
[71] Lu Z, Hofmeister BT, Vollmers C, Dubois RM, Schmitz RJ. Combining ATAC-seq with nuclei sorting for discovery of cis-regulatory regions in plant genomes., 2017, 45(6): e41.
[72] Deal RB, Henikoff S. A simple method for gene expression and chromatin profiling of individual cell types within a tissue., 2010, 18(6): 1030–1040.
[73] Maher KA, Bajic M, Kajala K, Reynoso M, Pauluzzi G, West DA, Zumstein K, Woodhouse M, Bubb K, Dorrity MW, Queitsch C, Bailey-Serres J, Sinha N, Brady SM, Deal RB. Profiling of accessible chromatin regions across multiple plant species and cell types reveals common gene regulatory principles and new control modules., 2018, 30(1): 15–36.
[74] Corces MR, Trevino AE, Hamilton EG, Greenside PG, Sinnott-Armstrong NA, Vesuna S, Satpathy AT, Rubin AJ, Montine KS, Wu B, Kathiria A, Cho SW, Mumbach MR, Carter AC, Kasowski M, Orloff LA, Risca VI, Kundaje A, Khavari PA, Montine TJ, Greenleaf WJ, Chang HY. An improved ATAC-seq protocol reduces background and enables interrogation of frozen tissues., 2017, 14(10): 959–962.
[75] Sos BC, Fung HL, Gao DR, Osothprarop TF, Kia A, He MM, Zhang K. Characterization of chromatin accessibility with a transposome hypersensitive sites sequencing (THS-seq) assay., 2016, 17(1): 20.
[76] Tan L, Ke Z, Tombline G, Macoretta N, Hayes K, Tian X, Lv R, Ablaeva J, Gilbert M, Bhanu NV, Yuan Z F, Garcia BA, Shi YG, Shi Y, Seluanov A, Gorbunova V. Naked mole rat cells have a stable epigenome that resists iPSC reprogramming., 2017, 9(5): 1721–1734.
[77] Scharer CD, Blalock EL, Barwick BG, Haines RR, Wei C, Sanz I, Boss JM. ATAC-seq on biobanked specimens defines a unique chromatin accessibility structure in na?ve SLE B cells., 2016, 6(1): 27030.
[78] Davie K, Jacobs J, Atkins M, Potier D, Christiaens V, Halder G, Aerts S. Discovery of transcription factors and regulatory regions driving in vivo tumor develop-ment by ATAC-seq and FAIRE-seq open chromatin profiling., 2015, 11(2): e1004994.
[79] Liu YJ, Zhang F, Liu HD, Sun X. The application of next-generation sequencing techniques in studying transcriptional regulation in embryonic stem cells., 2017, 39(8): 717–725.劉亞軍, 張峰, 劉宏德, 孫嘯. 下一代測序技術(shù)在干細胞轉(zhuǎn)錄調(diào)控研究中的應(yīng)用. 遺傳, 2017, 39(8): 717–725.
[80] Quillien A, Abdalla M, Yu J, Ou JH, Zhu LJ, Lawson ND. Robust identification of developmentally active endothelial enhancers in zebrafish using FANS-assisted ATAC-Seq., 2017, 20(3): 709–720.
[81] Ackermann AM, Wang ZP, Schug J, Naji A, Kaestner KH. Integration of ATAC-seq and RNA-seq identifies human alpha cell and beta cell signature genes., 2016, 5(3): 233–244.
[82] Garcia E, Hayden A, Birts C, Britton E, Cowie A, Pickard K, Mellone M, Choh C, Derouet M, Duriez P, Noble F, White MJ, Primrose JN, Strefford JC, Rose-Zerilli M, Thomas GJ, Ang Y, Sharrocks AD, Fitzgerald RC, Underwood TJ. Authentication and characterisation of a new oesophageal adenocarcinoma cell line: MFD-1., 2016, 6: 32417.
[83] Ho YT, Shimbo T, Wijaya E, Ouchi Y, Takaki E, Yamamoto R, Kikuchi Y, Kaneda Y, Tamai K. Chromatin accessibility identifies diversity in mesenchymal stem cells from different tissue origins., 2018, 8(1): 17765.
[84] Nelson AC, Mould AW, Bikoff EK, Robertson EJ. Mapping the chromatin landscape and Blimp1 trans-criptional targets that regulate trophoblast differentiation., 2017, 7(1): 6715–6793.
[85] Scott-Browne JP, López-Moyado IF, Trifari S, Wong V, Chavez L, Rao A, Pereira RM. Dynamic changes in chromatin accessibility occur in CD8+T cells responding to viral infection., 2016, 45(6): 1327–1340.
[86] Starks RR, Biswas A, Jain A, Tuteja G. Combined analysis of dissimilar promoter accessibility and gene expression profiles identifies tissue-specific genes and actively repressed networks., 2019, 12(1): 16.
[87] Rajbhandari P, Thomas B J, Feng A, Hong C, Wang JX, Vergnes L, Sallam T, Wang B, Sandhu J, Seldin M M, Lusis AJ, Fong LG, Katz M, Lee R, Young SG, Reue K, Smale ST, Tontonoz P. IL-10 signaling remodels adipose chromatin architecture to limit thermogenesis and energy expenditure., 2018, 172(1–2): 218– 233.e17.
[88] Denny SK, Yang D, Chuang CH, Brady JJ, Lim JS, Grüner BM, Chiou S, Schep AN, Baral J, Hamard C, Antoine M, Wislez M, Kong CS, Connolly AJ, Park K, Sage J, Greenleaf WJ, Winslow MM. Nfib promotes metastasis through a widespread increase in chromatin accessibility., 2016, 166(2): 328–342.
[89] Wang MJ, Wang PC, Lin M, Ye ZX, Li GL, Tu LL, Shen C, Li JY, Yang QY, Zhang XL. Evolutionary dynamics of 3D genome architecture following polyp-loidization in cotton., 2018, 4(2): 90–97.
[90] Mas G, Blanco E, Ballaré C, Sansó M, Spill YG, Hu D, Aoi Y, Le Dily F, Shilatifard A, Marti-Renom MA, Di Croce L. Promoter bivalency favors an open chromatin architecture in embryonic stem cells., 2018, 50(10): 1452–1462.
[91] Stergachis AB, Neph S, Reynolds A, Humbert R, Miller B, Paige SL, Vernot B, Cheng JB, Thurman RE, Sandstrom R, Haugen E, Heimfeld S, Murry CE, Akey JM, Stamatoyannopoulos JA. Developmental fate and cellular maturity encoded in human regulatory DNA landscapes., 2013, 154(4): 888–903.
[92] Buenrostro JD, Wu B, Litzenburger UM, Ruff D, Gonzales ML, Snyder MP, Chang HY, Greenleaf WJ. Single-cell chromatin accessibility reveals principles of regulatory variation., 2015, 523(7561): 486–490.
[93] Liu LQ, Liu YC, Quintero A, Wu L, Yuan Y, Wang MY, Cheng MN, Leng LZ, Xu LQ, Dong GY, Li R, Liu Y, Wei XY, Xu JS, Chen XW, Lu HR, Chen DS, Wang QL, Zhou Q, Lin XX, Li GB, Liu SP, Wang Q, Wang HR, Fink JL, Gao ZL, Liu X, Hou Y, Zhu SD, Yang HM, Ye YM, Lin G, Chen F, Herrmann C, Eils R, Shang ZC, Xu X. Deconvolution of single-cell multi-omics layers reveals regulatory heterogeneity., 2019, 10(1): 470.
[94] Cusanovich DA, Hill AJ, Aghamirzaie D, Daza RM, Pliner HA, Berletch JB, Filippova GN, Huang X, Christiansen L, Dewitt WS, Lee C, Regalado SG, Read DF, Steemers FJ, Disteche CM, Trapnell C, Shendure J. A single-cell atlas ofmammalian chromatin accessibility., 2018, 174(5): 1309–1324.
[95] Cusanovich DA, Daza R, Adey A, Pliner HA, Christiansen L, Gunderson KL, Steemers FJ, Trapnell C, Shendure J. Multiplex single cell profiling of chromatin accessibility by combinatorial cellular indexing., 2015, 348(6237): 910–914.
[96] Zamanighomi M, Lin ZL, Daley T, Chen X, Duren Z, Schep A, Greenleaf WJ, Wong WH. Unsupervised clustering and epigenetic classification of single cells., 2018, 9(1): 2410.
[97] Schep AN, Wu BJ, Buenrostro JD, Greenleaf WJ. chromVAR: inferring transcription-factor-associated accessibility from single-cell epigenomic data., 2017, 14(10): 975–978.
[98] Baker SM, Rogerson C, Hayes A, Sharrocks AD, Rattray M. Classifying cells with Scasat, a single-cell ATAC-seq analysis tool., 2019, 47(2): e10.
[99] Preissl S, Fang RX, Huang H, Zhao Y, Raviram R, Gorkin DU, Zhang YX, Sos BC, Afzal V, Dickel DE, Kuan S, Visel A, Pennacchio LA, Zhang K, Ren B. Single-nucleus analysis of accessible chromatin in developing mouse forebrain reveals cell-type-specific transcriptional regulation., 2018, 21(3): 432–439.
[100] Cusanovich DA, Reddington JP, Garfield DA, Daza RM, Aghamirzaie D, Marco-Ferreres R, Pliner HA, Christiansen L, Qiu X, Steemers FJ, Trapnell C, Shendure J, Furlong EEM. The cis-regulatory dynamics of embryonic development at single-cell resolution., 2018, 555(7697): 538–542.
[101] Buenrostro JD, Corces MR, Lareau CA, Wu B, Schep AN, Aryee MJ, Majeti R, Chang HY, Greenleaf WJ. Integrated single-cell analysis maps the continuous regulatory landscape of human hematopoietic differe-ntiation., 2018, 173(6): 1535–1548.
[102] Ramani V, Deng X, Qiu R, Gunderson KL, Steemers FJ, Disteche CM, Noble WS, Duan Z, Shendure J. Massively multiplex single-cell Hi-C., 2017, 14(3): 263–266.
Advances in assay for transposase-accessible chromatin with high-throughput sequencing
Jie Wu1, Jianping Quan1, Yong Ye1, ZhenFang Wu1, Jie Yang1, Ming Yang2, Enqin Zheng1
Assay for transposase accessible chromatin with high-throughput sequencing (ATAC-seq) was developed in 2013. It has the advantages of more convenient operation andhigher efficiency for DNA recovery than DNase I hypersensitive site sequencing (DNase-seq) and micrococcal nuclease sequencing (MNase-seq). ATAC-seq currently is the most popular technique of genome-wide mapping for chromatin accessibility. It provides information on binding regions of transcription factors and nucleosome localization on the chromatin. Thus, ATAC-seq is of great significance for studying the epigenetics and molecular mechanisms in chromatin structure. In this review, we compare the advantages and disadvantages of multiple techniques for profiling chromatin accessibility, and summarize the principles, main process, development and applications of ATAC-seq. We hope this review will provide a reference for study of genome-wide mapping for chromatin accessibility, identification of cis-regulatory elements, and dissection of the epigenetic and genetic regulatory networks using the ATAC-seq technology in eukaryotes.
assay for transposase-accessible chromatin with high-throughput sequencing; open chromatin regions; Tn5 transposase; epigenetic modification; transcription factor
2019-11-14;
2020-01-29
廣東省“揚帆計劃”引進創(chuàng)新創(chuàng)業(yè)團隊項目(編號:2016YT03H062),廣東省現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系生豬創(chuàng)新團隊項目(編號:2019KJ126)和廣東省自然科學基金項目(編號:2017A030313213)資助[Supported by Guangdong YangFan Innovative and Entre-preneurial Research Team Program (No. 2016YT03H062), Guangdong Modern Agricultural Industry Technology System Pig Innovation Team Project (No. 2019KJ126) and Guangdong Natural Science Foundation (No. 2017A030313213)]
吳杰,碩士研究生,專業(yè)方向:分子遺傳與動物育種。E-mail: wujiezi163@163.com
楊明,博士,高級畜牧師,研究方向:動物遺傳育種。E-mail: yangming@zhku.edu.cn
鄭恩琴,碩士,高級實驗師,研究方向:遺傳育種。E-mail: eqzheng@scau.edu.cn
10.16288/j.yczz.19-279
2020/2/29 8:47:16
URI: http://kns.cnki.net/kcms/detail/11.1913.R.20200228.0936.002.html
(責任編委: 朱衛(wèi)國)