施威揚(yáng),袁明波
(中國海洋大學(xué)海洋生命學(xué)院,山東 青島 266003)
真核生物基因表達(dá)由RNA聚合酶、轉(zhuǎn)錄因子、組蛋白修飾等多種因素調(diào)控。為了在全基因組上定位DNA-蛋白質(zhì)的互作區(qū)域,表觀遺傳學(xué)研究者提出了一系列技術(shù)方法。在1980年代,Gilmour D S等[1]和 Solomon M J等[2]最先提出了ChIP,用于富集和蛋白結(jié)合的DNA片段。在2000年代,基因組微陣列技術(shù)(Microarray)被用于定位這種富集的DNA,這一技術(shù)稱為ChIP-chip[3]。隨著二代測序技術(shù)的發(fā)展,ChIP-seq[4]技術(shù)在2007年首次被提出,并被很多大型跨國研究計(jì)劃例如ENCODE(全稱)廣泛采用,從而成為研究DNA-蛋白質(zhì)互作的金標(biāo)準(zhǔn)。但是ChIP技術(shù)對樣本需求量大,存在著實(shí)驗(yàn)重復(fù)性差、信號低、背景高等缺點(diǎn)。此外,實(shí)驗(yàn)過程中容易引入DNA污染和DNA片段異質(zhì)性,造成測序結(jié)果的假陽性。近年來,研究者對ChIP-seq技術(shù)不斷進(jìn)行改進(jìn):2011年ChIP-exo[5]技術(shù)被提出,利用外切酶作用于DNA片段,在一定程度上解決了ChIP-seq技術(shù)存在的假陽性、分辨率低、不能實(shí)現(xiàn)精確的映射(Map)等問題,實(shí)現(xiàn)了接近單堿基水平上定位DNA-蛋白結(jié)合位點(diǎn)。2013年,另一種表觀組學(xué)技術(shù)ATAC-seq[6]出現(xiàn),它利用Tn5轉(zhuǎn)座酶處理細(xì)胞核中的染色質(zhì)來研究染色質(zhì)可及行區(qū)域,該技術(shù)常和其他方法結(jié)合被用于篩選可能的蛋白質(zhì)結(jié)合位點(diǎn)。2017—2019年,一類全新的不依賴免疫沉淀的DNA-蛋白質(zhì)互作研究方法,包括CUT&RUN[7-8]和CUT&Tag[9]徹底革新了DNA-蛋白質(zhì)互作的研究模式。本文綜述了ChIP-seq、CUT&RUN、CUT&Tag的技術(shù)原理,回顧了各項(xiàng)技術(shù)的重要應(yīng)用場景,討論了各技術(shù)存在的問題,并介紹了在單細(xì)胞水平研究DNA-蛋白質(zhì)互作的技術(shù)挑戰(zhàn)。本文最后對DNA-蛋白質(zhì)互作研究技術(shù)的發(fā)展和應(yīng)用進(jìn)行了展望,為表觀生物學(xué)研究提供借鑒和思路。
ChIP-seq、CUT&RUN和CUT&Tag是目前最常用的研究DNA-蛋白質(zhì)互作的技術(shù),其基本原理是先獲得和目標(biāo)蛋白質(zhì)結(jié)合的DNA區(qū)域,然后對這一DNA區(qū)域進(jìn)行高通量測序。通過這些技術(shù)揭示RNA聚合酶、轉(zhuǎn)錄因子結(jié)合位點(diǎn)和組蛋白修飾位點(diǎn)等表觀遺傳修飾信息,從而闡明基因開啟或關(guān)閉的表觀調(diào)控機(jī)制。例如:組蛋白第三亞基二十七號賴氨酸的三甲基化(H3K27me3)作為一種組蛋白甲基化修飾,標(biāo)志著基因沉默;而組蛋白第三亞基四號賴氨酸的一甲基化(H3K4me1)和組蛋白第三亞基四號賴氨酸的二甲基化(H3K4me2)是活躍基因的標(biāo)志,其富集區(qū)域容易進(jìn)行轉(zhuǎn)錄和翻譯[10]。表1給出了三種技術(shù)的實(shí)驗(yàn)流程比較。
表1 三種技術(shù)的實(shí)驗(yàn)流程比較
ChIP-seq根據(jù)樣品處理方式的不同可以分為X-ChIP-seq和Native ChIP-seq。X-ChIP-seq先利用甲醛處理樣品,使DNA-蛋白質(zhì)交聯(lián)固定;然后裂解細(xì)胞,釋放染色質(zhì)并進(jìn)行超聲打斷;之后用特異的抗體孵育,抗體結(jié)合到交聯(lián)的DNA-蛋白質(zhì)復(fù)合物上;再利用結(jié)合抗體的磁珠將DNA-蛋白質(zhì)復(fù)合物沉淀富集;隨后進(jìn)行DNA與蛋白解交聯(lián),并純化獲得的DNA片段;最后將DNA片段補(bǔ)平,加腺嘌呤A,加接頭序列(見圖1A)。和需要交聯(lián)的樣本不同,Native ChIP-seq實(shí)驗(yàn)利用微球菌核酸酶MNase代替超聲打斷,直接對天然狀態(tài)細(xì)胞中的染色質(zhì)進(jìn)行切割。MNase是一種同時具有內(nèi)切酶活性和外切酶活性的核酸酶,主要作用于染色質(zhì)上核小體之間的DNA區(qū)域。在Native ChIP-seq中,MNase消化未用甲醛固定的通透細(xì)胞或者細(xì)胞核,獲得單個或多個核小體;之后同樣通過抗體孵育和磁珠結(jié)合對DNA-蛋白質(zhì)復(fù)合物進(jìn)行富集;然后純化獲得的DNA片段通過之后的PCR擴(kuò)增建庫和高通量測序,獲得與蛋白結(jié)合的DNA序列信息(見圖1B)。
X-ChIP-seq需要進(jìn)行甲醛交聯(lián)、基因組超聲打斷、免疫共沉淀、DNA-蛋白質(zhì)解交聯(lián)以及文庫構(gòu)建加接頭序列,這些繁瑣的實(shí)驗(yàn)步驟容易造成樣品的丟失。而Native ChIP-seq則避免了甲醛交聯(lián)、超聲打斷、解交聯(lián)這些步驟給樣品帶來的損害。這兩種方法分別適用于不同性質(zhì)的目標(biāo)蛋白。例如:轉(zhuǎn)錄因子跟DNA通常是不穩(wěn)定的瞬時結(jié)合,在Native ChIP-seq環(huán)境下很難捕捉,需要對樣品進(jìn)行甲醛固定;相反,組蛋白則是核小體組分,和DNA結(jié)合緊密,因此Native ChIP-seq常常用于組蛋白修飾位點(diǎn)的研究。但是,由于這兩種方法都需要用經(jīng)過免疫沉淀的步驟,用抗體和磁珠富集DNA-蛋白復(fù)合物,因此普遍存在樣品需求量大,背景信號高,信噪比和分辨率低,以及容易出現(xiàn)假陽性的結(jié)果等缺陷。這些問題在一定程度上阻礙了ChIP-seq技術(shù)的應(yīng)用。
盡管ChIP-seq技術(shù)存在種種弊端,其對表觀基因組學(xué)的發(fā)展仍起到了極大的推動作用。ChIP-seq技術(shù)被廣泛應(yīng)用于轉(zhuǎn)錄、基因調(diào)控和表觀遺傳學(xué)領(lǐng)域。例如,Xiao R等[12],利用ChIP-seq技術(shù)對RNA結(jié)合蛋白(RNA-binding proteins, RBPs)結(jié)合位點(diǎn)分析發(fā)現(xiàn)RBPs主要分布在活性染色質(zhì)區(qū)域,并在活性基因的啟動子處有大量富集。之后通過與組蛋白修飾位點(diǎn)比較,發(fā)現(xiàn)RBPs結(jié)合位點(diǎn)與活性組蛋白修飾呈正相關(guān),如:組蛋白第三亞基二十七號賴氨酸的乙?;?H3K27ac);與抑制性組蛋白修飾呈負(fù)相關(guān),如:組蛋白第三亞基九號賴氨酸的三甲基化(H3K9me3),這些證據(jù)表明RBPs能夠調(diào)控基因的轉(zhuǎn)錄。其既可以直接調(diào)控轉(zhuǎn)錄,又可以通過和其他轉(zhuǎn)錄因子結(jié)合間接調(diào)控。作者進(jìn)一步發(fā)現(xiàn)一個特定的RNA結(jié)合蛋白25(RNA binding protein 25, RBM25)可以和轉(zhuǎn)錄因子YY1相互作用并調(diào)控下游靶基因。YY1是一種廣泛分布的轉(zhuǎn)錄因子,參與多種啟動子的抑制或激活。ChIP-seq發(fā)現(xiàn)YY1既可以與RBM25共同結(jié)合到啟動子區(qū)域,也可以單獨(dú)結(jié)合,且YY1和RBM25共同結(jié)合比YY1單獨(dú)結(jié)合能力更強(qiáng),這表明RBM25的缺失會減弱YY1對下游靶基因的調(diào)控。這些結(jié)果顯示RBPs能夠廣泛地與染色質(zhì)直接或間接作用,從而實(shí)現(xiàn)RNA介導(dǎo)的轉(zhuǎn)錄調(diào)控,這一發(fā)現(xiàn)為研究轉(zhuǎn)錄調(diào)控的相關(guān)機(jī)理提供了新思路。Ran L等[13]用ChIP-seq對人類胃腸道間質(zhì)瘤細(xì)胞系和前列腺癌細(xì)胞系中的轉(zhuǎn)錄因子ETS易位變體1(ETS translocation variant 1, ETV1)進(jìn)行了全基因組定位,之后又在胃腸道間質(zhì)瘤細(xì)胞系中對前叉箱蛋白F1(Forkhead box protein F1, FOXF1)進(jìn)行了ChIP-seq分析,以確定FOXF1在胃腸道間質(zhì)瘤細(xì)胞系的ETV1增強(qiáng)子位點(diǎn)的富集情況。同時,他們對H3K4me1和H3K4me3兩個組蛋白修飾位點(diǎn)進(jìn)行了ChIP-seq分析,并將其和ETV1富集進(jìn)行了比較,發(fā)現(xiàn)FOXF1在增強(qiáng)子處與ETV1共域,并作為先鋒因子發(fā)揮作用。FOXF1通過調(diào)節(jié)染色質(zhì)可及性、增強(qiáng)子維持和ETV1結(jié)合,來調(diào)節(jié)依賴ETV1的胃腸道間質(zhì)瘤細(xì)胞系的特異性轉(zhuǎn)錄組。這一研究為了解胃腸道間質(zhì)瘤發(fā)生的分子機(jī)理提供了參考,并顯示有望通過靶向干擾FOXF1表達(dá)來治療胃腸道間質(zhì)瘤。Cohen S等[14]在對蛋白SETX(Senataxin)在DNA雙鏈斷裂時的作用的研究中,用ChIP-seq對DNA雙鏈斷裂前后的SETX在全基因組定位進(jìn)行了比對,發(fā)現(xiàn)在DIvA細(xì)胞中SETX被特異性招募到DNA雙鏈斷裂后活性轉(zhuǎn)錄基因上,且在誘導(dǎo)后表現(xiàn)出RNA:DNA雜交積累。由于SETX可以促進(jìn)Rad51的募集,減少DNA末端的錯誤再連接,并在DNA雙鏈斷裂產(chǎn)生后維持細(xì)胞活力。這表明SETX在DNA雙鏈斷裂處通過限制移位以確保細(xì)胞存活,為SETX基因突變而引起的AOA2(常染色體隱性遺傳性共濟(jì)失調(diào)-眼運(yùn)動不能2型)/ALS4(常染色體顯性遺傳性青年型)神經(jīng)病變提供了新見解。Donaghey J等[15],用ChIP-seq技術(shù)對不同細(xì)胞中的前叉箱蛋白A2( Forkhead box protein A2, FOXA2)進(jìn)行全基因組定位,發(fā)現(xiàn)FOXA2分布具有細(xì)胞特異性,獲得了FOXA2所結(jié)合的基序(Motif)信息。為了探討前表觀遺傳狀態(tài)對先鋒因子FOXA2, GATA4 和OCT4 結(jié)合的影響,作者定位了活性組蛋白修飾H3K27ac、H3K4me1和抑制性組蛋白修飾H3K27me3的分布,最后對G1停滯細(xì)胞中的FOXA2進(jìn)行ChIP-seq分析。發(fā)現(xiàn)FOXA2占用和DNA可及性的改變可能發(fā)生在G1停滯細(xì)胞中。Wang C等[16]利用低輸入樣品量Native ChIP-seq(ULI-NChIP-seq),研究了哺乳動物胚胎發(fā)育過程中H3K9me3依賴性異染色質(zhì)的重編程過程。通過小鼠胚胎著床前和著床后胚胎組織中H3K9me3的定位,繪制了小鼠早期胚胎中H3K9me3的全基因組分布圖。發(fā)現(xiàn)H3K9me3在啟動子和長末端重復(fù)序列(LTR)中表現(xiàn)出明顯的動態(tài)特征,證明H3K9me3依賴性異染色質(zhì)在早期胚胎發(fā)育過程中經(jīng)歷了戲劇性的重編程,為進(jìn)一步探索早期胚胎的表觀遺傳機(jī)制提供了寶貴資源。因此,ChIP-seq技術(shù)已經(jīng)成為表觀生物學(xué)研究必不可缺的核心研究工具。
(A:交聯(lián)染色體免疫共沉淀測序;B:天然染色體免疫共沉淀測序。A:Crosslinking chromation immunoprecipitation sequencing,X-ChIP-seq;B:Native chromation immunoprecipitation sequencing,Native ChIP-seq.)
CUT&RUN作為一種革命性技術(shù),省略了免疫沉淀步驟,直接利用抗體把具有切割核小體間區(qū)能力的MNase酶靶向到原位,實(shí)現(xiàn)對蛋白質(zhì)結(jié)合區(qū)域的核小體進(jìn)行切割。該技術(shù)的核心是借助一種Protein A-MNase融合蛋白,Protein A是一種金黃色葡萄球菌細(xì)胞壁蛋白質(zhì),能特異地與人和哺乳動物抗體的Fc區(qū)(重鏈固定區(qū))結(jié)合。其工作原理是:首先將細(xì)胞/核進(jìn)行滲透處理,改變細(xì)胞通透性使得抗體和融合蛋白能夠進(jìn)入細(xì)胞核中;然后用目標(biāo)蛋白的特異性抗體孵育,之后洗掉未結(jié)合的抗體,并與Protein A-MNase融合蛋白孵育,通過Protein A跟抗體的特異結(jié)合將MNase靶向到抗原周邊。隨后加入Ca2+激活MNase,MNase就會隨機(jī)切割目標(biāo)蛋白周圍的DNA并從染色質(zhì)上面釋放出來。終止反應(yīng)后,純化這些釋放出的DNA片段,然后加接頭序列,建庫測序(見圖2)。由于只有被切割的DNA被釋放并建庫,而其余大部分DNA被留在細(xì)胞核當(dāng)中,因此這一技術(shù)的背景非常低。
圖2 CUT&RUN技術(shù)原理(參考Skene P J等[8])
CUT&RUN為表觀生物學(xué)領(lǐng)域帶來了重大革新。與X-ChIP-seq相比,CUT&RUN需要的細(xì)胞量大大減少,僅僅需要100個細(xì)胞就能定位組蛋白修飾位點(diǎn);與Native ChIP-seq相比,CUT&RUN可以在低測序深度的情況下,就能得到高信噪比的數(shù)據(jù)。目前,CUT&RUN技術(shù)作為ChIP-seq的替代技術(shù)被廣泛應(yīng)用。Xia W等[17]利用CUT&RUN技術(shù)檢測人類發(fā)育成熟的卵母細(xì)胞和早期胚胎中H3K4me3,H3K27me3以及H3K27ac的動態(tài)變化,揭示了人類早期發(fā)育過程中組蛋白修飾的重編程過程。研究發(fā)現(xiàn),人類早期胚胎發(fā)育過程中的組蛋白重編程和小鼠相比呈現(xiàn)不同的動態(tài)變化。受精小鼠母源H3K27me3能夠傳遞至囊胚,而人類H3K27me3在合子基因組激活前被大規(guī)模地去除,并在基因組激活后重新建立。在合子基因組激活前,H3K4me3分布在許多啟動子區(qū)域以及基因遠(yuǎn)端開放區(qū)域,并伴隨著這些區(qū)域的染色質(zhì)開放性分布。此H3K4me3被稱為預(yù)備H3K4me3(Priming H3K4me3),合子基因組激活后,這些區(qū)域會轉(zhuǎn)變?yōu)榧せ罨蛞种频臓顟B(tài)。這些發(fā)現(xiàn)為進(jìn)一步了解人類早期胚胎的表觀調(diào)控機(jī)制提供了重要依據(jù)。Zheng X Y等[18]利用CUT&RUN技術(shù)研究了擬南芥胚乳細(xì)胞的H3K27me3,獲得了具有高靈敏度、特異性和可重復(fù)性的親本特異性全基因組景觀。這一研究進(jìn)一步比較了用CUT&RUN和ChIP-seq獲得的H3K27me3定位信息,發(fā)現(xiàn)二者富集峰重疊程度大,只在異染色質(zhì)上存在差異,進(jìn)一步證明了CUT&RUN可以基本替代ChIP-seq技術(shù)。CUT&RUN在臨床研究中也發(fā)揮了重要作用。白血病是因?yàn)樵煅杉?xì)胞(HSCs)過度增殖,以及分化和凋亡受到抑制導(dǎo)致的非正常功能造血細(xì)胞大量積累并浸潤其他組織,從而導(dǎo)致的機(jī)體造血功能障礙。IKAROS家族鋅指2(IKAROS Family Zinc Finger 2, IKZF2)是一種染色質(zhì)重塑劑,對染色質(zhì)結(jié)構(gòu)變化起到至關(guān)重要的作用。Park S等[19]用CUT&RUN對IKZF2定位分析,發(fā)現(xiàn)IKZF2在白血病干細(xì)胞(LSC)中高表達(dá),其缺陷導(dǎo)致LSC功能缺陷。急性髓系白血病(AML)細(xì)胞中IKZF2的缺失可以減少集落形成,促進(jìn)分化和凋亡,延緩白血病的發(fā)生。通過對LSC的基因表達(dá)分析、染色質(zhì)可及性分析和IKZF2結(jié)合位點(diǎn)分析,表明IKZF2能夠抑制分化轉(zhuǎn)錄因子C/EBP的表達(dá),維持自我更新轉(zhuǎn)錄因子HOXA9和MYC的表達(dá)。后續(xù)功能驗(yàn)證實(shí)驗(yàn)證明IKZF2能調(diào)節(jié)AML-LSC程序,從而為通過靶向IKZF2來治療髓系白血病提供了理論依據(jù)。最后,CUT&RUN技術(shù)被應(yīng)用于胚胎造血過程的研究中。在胎兒向幼體的發(fā)育過程中,胎兒血紅蛋白(HbF,α2γ2)的含量不斷降低,成人血紅蛋白(HbA,α2β2)比例不斷升高。這一過程HbF沉默調(diào)節(jié)因子BCL11A起著關(guān)鍵作用。Macias-Trevino C等[20]利用CUT&RUN方法研究了從胎兒到成人血紅蛋白轉(zhuǎn)變過程中BCL11A所扮演的角色。首先用功能分析和蛋白質(zhì)微陣列,確定了BCL11A的鋅指簇和BCL11A的DNA結(jié)合序列(Motif)。還發(fā)現(xiàn)胚胎和胎兒時期珠蛋白啟動子中存在這一Motif,特別是γ珠蛋白啟動子中存在重復(fù)Motif。之后用CUT&RUN方法繪制紅細(xì)胞中BCL11A蛋白合位點(diǎn),發(fā)現(xiàn)BCL11A和γ珠蛋白基因啟動子遠(yuǎn)端Motif上有結(jié)合。通過CRISPR編輯技術(shù)在 HUDEP-2細(xì)胞系中敲除這個遠(yuǎn)端Motif,可以阻止BCL11A結(jié)合,并導(dǎo)致γ珠蛋白基因啟動子可及行增加。這一工作揭示了BCL11A對γ珠蛋白基因啟動子的直接抑制是血紅蛋白轉(zhuǎn)換的基礎(chǔ),為深入了解人類胚胎發(fā)育過程中血紅蛋白轉(zhuǎn)變的分子機(jī)理做出了貢獻(xiàn)。
在CUT&RUN技術(shù)中,MNase切割出的DNA需要純化和建庫,這一步驟中不可避免存在DNA的損失。在CUT&RUN技術(shù)基礎(chǔ)上發(fā)展來的CUT&Tag則對此進(jìn)行了進(jìn)一步優(yōu)化,它在靶向切割DNA的同時也標(biāo)記了DNA,因此切割產(chǎn)物可以直接進(jìn)行文庫擴(kuò)增。CUT&Tag的原理是用Tn5轉(zhuǎn)座酶替代了pA-MNase融合蛋白中的MNase進(jìn)行基因組的切割。Tn5轉(zhuǎn)座酶可以催化雙鏈進(jìn)行重組交換[21],在打斷DNA的同時在DNA片段兩側(cè)加入外源的擴(kuò)增接頭序列,因此它常被用于微量DNA建庫測序[22]和染色質(zhì)可及行分析[23-24]。CUT&Tag的技術(shù)原理是先用特異的一抗去孵育通透的細(xì)胞或者細(xì)胞核,洗去未結(jié)合的一抗;用組裝好的Protein A-Tn5融合蛋白孵育,洗去多余的融合蛋白,形成Protein A-Tn5、抗體、靶蛋白和染色質(zhì)復(fù)合物。之后,加入Mg2+激活Tn5轉(zhuǎn)座酶,Tn5轉(zhuǎn)座酶會將其結(jié)合區(qū)域鄰近的DNA隨機(jī)打斷,并插入接頭序列(見圖3)。最后,直接經(jīng)過DNA片段純化和PCR擴(kuò)增,便可以獲得目標(biāo)蛋白周邊DNA區(qū)域的測序文庫。
和ChIP-seq相比,CUT&Tag同樣具有更高的信噪比;而跟CUT&RUN相比,它所需的細(xì)胞量更少,可以直接在單細(xì)胞水平進(jìn)行檢測。 Douse C H等[25]利用CUT&Tag技術(shù)成功研究人類沉默中樞復(fù)合體(HUSH)的亞單位TASOR。TASOR作為含有一個聚ADP核糖聚合酶(PARP)結(jié)構(gòu)域的蛋白,對組裝HUSH和抑制基因轉(zhuǎn)座必不可少??赡苡捎赥ASOR分子大小或溶解度的問題,CUT&RUN技術(shù)并不適用于研究TASOR,此時CUT&Tag技術(shù)就顯現(xiàn)出很大的優(yōu)勢。通過CUT&Tag對TASOR定位分析,發(fā)現(xiàn)TASOR富集峰和H3K9me3重合,表明TASOR對H3K9me3的富集至關(guān)重要。
細(xì)胞是生物體基本的結(jié)構(gòu)和功能單位,各細(xì)胞之間存在著異質(zhì)性,因此在單細(xì)胞水平上研究細(xì)胞中各種組學(xué)信息至關(guān)重要。隨著Drop-seq[26]、inDrop[27]和10×Genomics等單細(xì)胞轉(zhuǎn)錄組測序技術(shù)的出現(xiàn),單細(xì)胞基因表達(dá)研究日漸成熟,單細(xì)胞多組學(xué)技術(shù)將成為未來研究的重點(diǎn)。其中,在單細(xì)胞水平上對DNA-蛋白質(zhì)互作的研究已經(jīng)獲得了初步的成果。Rotem A等[28]提出Drop-ChIP,將液滴微流控技術(shù)和ChIP-seq聯(lián)系起來,首次實(shí)現(xiàn)在單細(xì)胞水平上進(jìn)行ChIP-seq。Drop-ChIP采用MNase代替超聲打斷,且在染色體免疫共沉淀之前就對單細(xì)胞染色體進(jìn)行標(biāo)記。通過對小鼠胚胎干細(xì)胞(ES),胚胎成纖維細(xì)胞(MEF)和造血祖細(xì)胞(EML)中H3K4me3和H3K4me2組蛋白修飾的定位分析,作者證明了Drop-ChIP技術(shù)可以用于區(qū)分單個細(xì)胞的異質(zhì)性。CUT&RUN技術(shù)同樣也被應(yīng)用于單個細(xì)胞,Hainer S J等[29]通過對CUT&RUN實(shí)驗(yàn)條件進(jìn)行了優(yōu)化,改變了緩沖液、樣品體積、抗體和融合蛋白孵育時間,以及文庫制備和純化方法,使CUT&RUN可以檢測單個細(xì)胞中的DNA-蛋白相互作用信息。Ku W L等[30]提出scChIC-seq技術(shù),除了采用和CUT&RUN一樣的Protein A-MNase融合蛋白,其主要改進(jìn)是相比CUT&RUN,它省略了分離目標(biāo)DNA片段步驟,從而提高了DNA回收效率,使scChIC-seq技術(shù)適用于研究單細(xì)胞的DNA-蛋白質(zhì)互作。同樣,CUT&Tag技術(shù)也被應(yīng)用于單細(xì)胞水平。 Wang Q等[31]等基于CUT&Tag原理提出了CoBATCH技術(shù),通過組合標(biāo)記(Combinatory labeling)的物理標(biāo)記方式,用帶有不同標(biāo)記序列(Barcode)的Protein A-Tn5對細(xì)胞進(jìn)行切割的同時使細(xì)胞帶上第一輪標(biāo)簽;然后將所有細(xì)胞合并,重新分配到不同的孔,用不同的PCR引物進(jìn)行擴(kuò)增使細(xì)胞帶上第二輪標(biāo)簽,從而實(shí)現(xiàn)一次數(shù)百個單細(xì)胞的檢測。CoBATCH具有較高的信噪比,且每個細(xì)胞大約有100 00個讀數(shù),因此該技術(shù)可用于細(xì)胞種群異質(zhì)性和亞型分析。
圖3 CUT&Tag技術(shù)原理(參考Kaya-Okur H S等[9])
DNA-蛋白質(zhì)互作研究一直是表觀遺傳學(xué)領(lǐng)域的熱點(diǎn)。作為研究DNA-蛋白相互作用的傳統(tǒng)手段,ChIP-seq技術(shù)已經(jīng)被廣泛應(yīng)用在動、植物研究中。在臨床研究領(lǐng)域,ChIP-seq系統(tǒng)揭示了多種人類腫瘤中基因表達(dá)的表觀調(diào)控機(jī)制,為腫瘤機(jī)制研究和治療提供了重要生物學(xué)基礎(chǔ)。而近年來發(fā)展出的CUT & RUN和CUT & Tag技術(shù)改變了傳統(tǒng)的ChIP-seq研究模式,新的實(shí)驗(yàn)過程簡單、實(shí)驗(yàn)條件容易控制,數(shù)據(jù)分辨率高,背景低,同時,這些技術(shù)對樣品量要求低,可以直接進(jìn)行單細(xì)胞水平的檢測。盡管研究DNA-蛋白質(zhì)互作的技術(shù)已經(jīng)取得了很大進(jìn)步,然而依然存在著不足。目前,最大的挑戰(zhàn)是缺少合適的抗體來針對目標(biāo)DNA-蛋白質(zhì)互作區(qū)域。很多商用抗體質(zhì)量不穩(wěn)定,難以重復(fù),而定制抗體生產(chǎn)周期長,成功率低。面對這一挑戰(zhàn),研究者提出了一些新的解決方法,例如直接在細(xì)胞中利用化學(xué)或生物修飾方法在蛋白上面加入標(biāo)記,例如Branon T C[32]通過大腸桿菌生物素連接酶(BirA)融合蛋白在細(xì)胞內(nèi)源蛋白上導(dǎo)入生物素(Biotin)修飾,從而可以用鏈霉親和素來介導(dǎo)跟目標(biāo)蛋白的特異結(jié)合。隨著各種新的研究DNA-蛋白相互作用的技術(shù)的發(fā)展,以及各種對目標(biāo)蛋白的化學(xué)和生物修飾方法的開發(fā),整個表觀遺傳領(lǐng)域必將迎來新的發(fā)展。