国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

染色質(zhì)免疫共沉淀測序技術(shù)研究進(jìn)展

2022-09-14 09:59陳桂芳楊佳怡高運(yùn)華任歌
生物技術(shù)通報 2022年7期
關(guān)鍵詞:建庫染色質(zhì)基因組

陳桂芳 楊佳怡 高運(yùn)華 任歌

(1.中國計量科學(xué)研究院,北京 100029;2.沈陽化工大學(xué),沈陽 110142)

組蛋白修飾和轉(zhuǎn)錄因子對基因表達(dá)具有重要的調(diào)控作用。在真核細(xì)胞中,DNA纏繞著由H2A、H2B、H3、H4構(gòu)成的核心組蛋白八聚體形成核小體,通過連接DNA串聯(lián)形成染色質(zhì)。組蛋白修飾的發(fā)生將影響組蛋白與DNA的親和性,改變?nèi)旧|(zhì)的可及性,進(jìn)而影響基因的表達(dá)。轉(zhuǎn)錄因子識別并結(jié)合基因上游區(qū)域特定DNA序列,調(diào)控相關(guān)基因的表達(dá)。染色質(zhì)免疫共沉淀(chromatin immunoprecipitation,ChIP)利用目的蛋白特異性抗體,與可溶性染色質(zhì)免疫共沉淀,特異性地富集目的蛋白結(jié)合的DNA。與芯片技術(shù)相結(jié)合的ChIP-chip(chromatin immunoprecipitation-chip)是利用表面覆蓋已知序列的核苷酸探針的芯片,對染色質(zhì)免疫共沉淀捕獲的DNA進(jìn)行核酸雜交,通過傳感器檢測堿基互補(bǔ)配對產(chǎn)生的熒光信號,進(jìn)一步分析目的蛋白結(jié)合位點[1]。ChIP-chip檢測覆蓋率受限于芯片上預(yù)先設(shè)定的DNA序列,存在分辨率低、靈敏度有限,對探針設(shè)計要求高等局限性[2]。隨著高通量測序技術(shù)的發(fā)展以及測序成本不斷降低,染色質(zhì)免疫共沉淀與測序相結(jié)合的ChIP-seq被廣泛使用。研究人員利用生物信息學(xué)工具對高通量測序生成的大量數(shù)據(jù)進(jìn)行分析,通過將測序序列比對到全基因組,定位轉(zhuǎn)錄因子結(jié)合、組蛋白修飾的區(qū)域[3]。近年來,ChIP-seq被越來越廣泛地用于擬南芥、水稻及其他植物的基因表達(dá)調(diào)控研究中。

ChIP-seq通常需要數(shù)百萬個細(xì)胞,染色質(zhì)免疫共沉淀和測序文庫制備包含多個實驗步驟,免疫共沉淀可能受到非特異性結(jié)合的影響,產(chǎn)生背景噪音,文庫中DNA中GC含量過高或過低,將導(dǎo)致PCR擴(kuò)增偏倚,進(jìn)而影響分析結(jié)果的準(zhǔn)確性。研究人員利用流式細(xì)胞術(shù)、微流控芯片等技術(shù)分離少量細(xì)胞或單細(xì)胞,優(yōu)化染色質(zhì)片段化、免疫共沉淀以及測序文庫構(gòu)建等實驗流程;通過特異性抗體引導(dǎo)將MNase或Tn5轉(zhuǎn)座酶間接結(jié)合到目的蛋白,并在蛋白結(jié)合位點附近使染色質(zhì)斷裂,替代了ChIP-seq染色質(zhì)片段化和免疫共沉淀操作,簡化實驗操作流程。在上述基礎(chǔ)上,實現(xiàn)少量細(xì)胞或單細(xì)胞水平的ChIP-seq檢測。本文簡述了ChIP-seq原理,詳細(xì)介紹其數(shù)據(jù)分析方法,討論近年來發(fā)展的ChIP-seq優(yōu)化方法和衍生技術(shù),分析并比較不同方法的特點,總結(jié)了植物轉(zhuǎn)錄因子和組蛋白修飾在生物鐘調(diào)控、激素信號轉(zhuǎn)導(dǎo)、光信號途徑、脅迫響應(yīng)等方面研究與應(yīng)用。

1 ChIP-seq原理及數(shù)據(jù)分析

1.1 ChIP-seq原理

組蛋白修飾主要發(fā)生在組蛋白的N端,核小體組蛋白被DNA環(huán)繞,兩者結(jié)合較穩(wěn)定。轉(zhuǎn)錄因子一般具有DNA結(jié)合結(jié)構(gòu)域,識別靶基因并以序列特異性方式結(jié)合DNA,轉(zhuǎn)錄因子與DNA相互作用通常是動態(tài)的[4-5]。根據(jù)目的蛋白與DNA結(jié)合特性,ChIP中制備染色質(zhì)片段的方式不同,主要包括甲醛交聯(lián)染色質(zhì)免疫共沉淀(formaldehyde cross-linking and sonication followed by chromatin immunoprecipitation,X-ChIP)和非交聯(lián)染色質(zhì)免疫 共 沉 淀(native chromatin immunoprecipitation,N-ChIP)[6-7]。甲醛能交聯(lián)固定蛋白與DNA,X-ChIP通過甲醛交聯(lián)與超聲處理形成可溶性染色質(zhì)片段,利用特異性抗體沉淀目的蛋白與DNA復(fù)合物,通過解交聯(lián)、蛋白酶消化等分離純化DNA,常用于檢測轉(zhuǎn)錄因子與DNA的相互作用[7]。微球菌核酸酶(micrococcal nuclease,MNase)兼具核酸內(nèi)切酶和核酸外切酶活性,主要作用于核小體之間的連接DNA(linker DNA)。N-ChIP一般無需甲醛交聯(lián),MNase使染色質(zhì)在連接DNA區(qū)域斷裂,形成以核小體為單元的染色質(zhì)片段,酶切后采用組蛋白修飾特異性抗體進(jìn)行免疫共沉淀并分離純化DNA,常用于組蛋白修飾的檢測[8-9]。

通過超聲或酶切斷裂的DNA帶有凸出的粘性末端,為連接具有平末端的測序接頭,在構(gòu)建文庫過程中,需要對DNA進(jìn)行末端修復(fù)。延伸DNA 3'端直至與5'端平齊,隨后對5'和3'末端分別進(jìn)行磷酸化和加dA修飾,獲得具有5'磷酸化和3' dA的DNA片段,進(jìn)一步連接測序接頭[4,10]。圖1顯示了ChIP-seq基本流程:通過超聲或酶切進(jìn)行染色質(zhì)片段化,利用特異性抗體免疫共沉淀目的蛋白和DNA,分離純化的DNA經(jīng)末端修復(fù)、連接測序接頭,通過PCR擴(kuò)增構(gòu)建文庫、測序并分析[11]。

圖1 ChIP-seq基本流程Fig.1 Major steps of ChIP-seq

1.2 ChIP-seq數(shù)據(jù)分析

ChIP-seq數(shù)據(jù)分析是通過將測序序列比對到參考基因組,識別富集區(qū)域內(nèi)具有顯著信號的峰、定位目的蛋白結(jié)合位點[12-13]。ChIP-seq數(shù)據(jù)分析基本流程包括:預(yù)處理及質(zhì)量控制、序列比對、峰識別、可視化及高級分析等[14]。研究人員開發(fā)了多種基于不同算法的軟件工具對高通量測序數(shù)據(jù)進(jìn)行處理。其中,Linux系統(tǒng)的Conda和基于R語言的Bioconductor是開放式軟件平臺,具有ChIP-seq數(shù)據(jù)分析的大量工具和軟件包[15]。

1.2.1 ChIP-seq數(shù)據(jù)分析軟件及算法 測序數(shù)據(jù)質(zhì)量控制包括質(zhì)量評估和預(yù)處理。測序中,每個堿基具有一個質(zhì)量值Q-score(Q-score= -log10e,e為測序錯誤率),用于衡量測序準(zhǔn)確度,如Q30表明堿基識別發(fā)生錯誤的概率為0.1%,Q20指堿基識別發(fā)生錯誤的概率為1%。通過FastQC軟件對測序的原始讀長(raw reads)進(jìn)行質(zhì)量評估,一般使用質(zhì)量值大于20或30的堿基占總體堿基的百分比(Q20或Q30)來評估測序數(shù)據(jù)質(zhì)量。接頭序列、擴(kuò)增不均勻等將影響測序數(shù)據(jù)質(zhì)量,這些情況可利用FastQC查看[16]。根據(jù)質(zhì)量評估結(jié)果,可選擇TrimGalore、Picard以及SAMTools等工具進(jìn)行預(yù)處理,去除低質(zhì)量堿基、接頭序列以及PCR擴(kuò)增重復(fù)(PCR duplicates)等,獲得較高質(zhì)量的數(shù)據(jù)(clean data)[17]。

序列比對通過將測序序列比對到參考基因組(或序列已知的基因組)進(jìn)行定位[18]。高通量測序?qū)a(chǎn)生大量的短序列數(shù)據(jù),包含許多重復(fù)序列。絕大多數(shù)的序列比對算法構(gòu)建索引數(shù)據(jù)庫,通過索引篩選短序列在基因組中候選位置,減少搜索空間,提高比對效率[19]。根據(jù)建立索引數(shù)據(jù)結(jié)構(gòu)方法的不同,短序列比對軟件主要分為兩類:基于哈希表(Hash table)數(shù)據(jù)結(jié)構(gòu)和基于BWT壓縮算法的索引數(shù)據(jù)結(jié)構(gòu)(Burrows Wheeler transform,BWT)[20-22]。 哈 希表數(shù)據(jù)結(jié)構(gòu)序列比對過程中,測序讀段(reads)將以種子序列(seed)為單元生成序列集合,排列種子序列并建立索引數(shù)據(jù)結(jié)構(gòu)進(jìn)行比對[14,23]。該方法也可以對參考基因組生成種子序列,建立索引數(shù)據(jù)結(jié)構(gòu)。BWT算法通過掃描短序列識別堿基重復(fù)的序列,將重復(fù)序列排列在一起,進(jìn)一步壓縮索引數(shù)據(jù)結(jié)構(gòu)并重排列,以利于快速搜索和比對。目前,較為常用的短序列比對軟件有Bowtie2、BWA、SOAP2和MAQ,不同的比對軟件在比對數(shù)目、運(yùn)行時間、內(nèi)存消耗等方面各具優(yōu)勢和不足[24]。較短讀長為單元時,可能的匹配區(qū)域很多,種子序列位點定位效率將降低,在進(jìn)行序列比對過程中,基于Hash table數(shù)據(jù)結(jié)構(gòu)的MAQ難以實現(xiàn)準(zhǔn)確比對;基于BWT算法的比對工具有Bowtie2、BWA、SOAP2等,該算法的重排列利于短讀長在基因組中候選位點進(jìn)行快速搜索和比對[25]。測序堿基的深度與基因組覆蓋率成正比例相關(guān),隨測序深度增加,基因組覆蓋率增加,數(shù)據(jù)量更大。在HPV全基因組測序數(shù)據(jù)比對分析中,研究者采用上述4種工具將部分HPV測序數(shù)據(jù)與已知HPV基因組數(shù)據(jù)庫進(jìn)行比對,結(jié)果表明BWT算法的比對效率和計算速度優(yōu)于Hash table算法[26]。

ChIP-seq數(shù)據(jù)分析中的重要環(huán)節(jié)是峰識別(peak calling)。峰(peak)被定義為基因組上reads富集的區(qū)域,峰識別是通過掃描比對到基因組上的短序列數(shù)據(jù),進(jìn)行樣本數(shù)據(jù)和對照組數(shù)據(jù)的比較,識別富集區(qū)域[14]。MACS算法通過滑動窗口(sliding window)掃描,基于泊松分布模型統(tǒng)計顯著的峰[27]。MACS采用具有固定大小的滑動窗口移動,可能產(chǎn)生窗口邊緣識別模糊的問題。QuEST算法基于連續(xù)覆蓋掃描,通過高斯核密度函數(shù)對reads富集密度進(jìn)行評估,其中reads所在位置為窗口中心,具有最高密度值[28-29]。MACS通過計算全基因組范圍內(nèi)每個檢測峰(peak)顯著性P值,進(jìn)一步分析差異peak,鑒定具有統(tǒng)計顯著性的差異蛋白質(zhì)結(jié)合位點,為較常用的峰識別工具[29]。

基于不同的需求,后續(xù)的數(shù)據(jù)處理和分析方法有所不同,如DNA序列特征的Motif分析、目的蛋白結(jié)合位點在基因組不同區(qū)域的偏好性分析、預(yù)測結(jié)合位點關(guān)聯(lián)基因功能的GO注釋及預(yù)測基因調(diào)控通路的Pathway分析等[30-31]。圖2顯示ChIP-seq數(shù)據(jù)分析流程及軟件。

圖2 ChIP-seq數(shù)據(jù)分析流程及軟件Fig.2 Protocol for computational analysis of ChIP-seq data and software

1.2.2 ChIP-seq常見數(shù)據(jù)格式及可視化 數(shù)據(jù)格式對于合理組織數(shù)據(jù)存儲,有效降低存儲空間以及加快下游分析速度至關(guān)重要。圖3顯示了ChIP-seq數(shù)據(jù)常見格式、格式轉(zhuǎn)變軟件及可視化方法。fasta和fastq格式是存儲核酸序列的常用格式,為二進(jìn)制文本。其中,fastq格式包含短讀序列和質(zhì)量分?jǐn)?shù)等信息[32]。為方便后續(xù)分析,可利用sratoolkit軟件將測序原始數(shù)據(jù)格式轉(zhuǎn)換為標(biāo)準(zhǔn)的fastq格式。SAM和BAM格式專用于存儲參考序列的比對序列,是由基因組序列比對得到的輸出格式[33]。BAM數(shù)據(jù)格式具有索引功能,為SAM格式的二進(jìn)制,通過SAMTools軟件可將SAM文件轉(zhuǎn)換為BAM,有利于降低儲存空間。UCSC基因瀏覽器可以讀取BAM格式的數(shù)據(jù),實現(xiàn)快速瀏覽[34]。儲存轉(zhuǎn)錄因子、組蛋白修飾等結(jié)合位點在全基因組上的信號分布情況的數(shù)據(jù)格式為BedGraph(Bed)格式。該格式包含有染色體名稱、染色體起始位點以及檢出信號值。將MACS軟件輸出Bed格式文件轉(zhuǎn)化為bigwig文件,上傳到UCSC或IGV瀏覽器以實現(xiàn)數(shù)據(jù)可視化[35-36]。其他可視化工具有基于R語言的ChIPseeker和基于Python的deepTools等。

圖3 ChIP-seq數(shù)據(jù)格式及可視化Fig.3 Standard data formats and visualization tools for ChIP-seq

2 基于ChIP-seq的優(yōu)化技術(shù)

ChIP-seq需要大量細(xì)胞,面對稀少樣本,收集足夠多的細(xì)胞存在困難。免疫共沉淀過程,可能受到甲醛交聯(lián),非特異性結(jié)合的影響[37]。DNA片段中GC含量過高或過低,將導(dǎo)致PCR擴(kuò)增偏倚,影響測序質(zhì)量[38]。近年來研究人員針對上述問題進(jìn)行優(yōu)化并提出相應(yīng)的技術(shù)。

2.1 基于細(xì)胞分離優(yōu)化的ChIP-seq技術(shù)

流式細(xì)胞分選(fluorescence activated cell sorting,F(xiàn)ACS)是利用鞘液包裹細(xì)胞形成樣品流,通過流式細(xì)胞儀檢測細(xì)胞攜帶的熒光信號,由分選器將特定的細(xì)胞從樣本中分離出來。Amour等[39]通過FACS將細(xì)胞分離到含有裂解緩沖液的反應(yīng)池中,進(jìn)行細(xì)胞核分離與MNase酶切,提出基于MNase酶切的非交聯(lián)免疫共沉淀ChIP-seq技術(shù)(nultra low input micrococcal nuclease-based native ChIP,ULI-NChIP),該技術(shù)適用于微量樣品建庫測序。該方法利用連續(xù)裝置簡化實驗操作流程、減少分離純化過程的洗滌次數(shù),降低樣品損失,利于在少量細(xì)胞中進(jìn)行ChIP-seq 實驗[40]。

微流控芯片通過產(chǎn)生非連續(xù)的液滴包裹單個細(xì)胞,實現(xiàn)單細(xì)胞分離[41]。Rotem等[42]基于液滴微流控芯片建立scChIP-seq(single-cell ChIP-seq):在具有多通道結(jié)構(gòu)的芯片上,細(xì)胞裂解緩沖液包裹著標(biāo)簽序列與單細(xì)胞懸液匯聚并通過油相,形成“油包水”液滴,液滴內(nèi)發(fā)生細(xì)胞裂解反應(yīng),隨后與含MNase的凝膠微珠融合進(jìn)行染色質(zhì)片段化,進(jìn)一步對數(shù)千個單細(xì)胞獨立建庫。scChIP-seq具有高度集成化、自動化優(yōu)勢,但微流控芯片使用成本較高,且微流控液滴操作對實驗人員有較高技術(shù)要求。

2.2 基于酶切優(yōu)化的ChIP-seq技術(shù)

lambda核酸外切酶、RecJf核酸外切酶具有5'-3'外切酶活性,分別作用于雙鏈DNA和單鏈DNA,水解核苷酸之間的磷酸二酯鍵。Ho和Pugh將兩種核酸外切酶引入到X-ChIP實驗,提出ChIP-exo(ChIP combined with lambda exonuclease digestion)[43-44]。在特異性抗體沉淀目的蛋白與DNA交聯(lián)復(fù)合物之后,通過lambda核酸外切酶消化,使雙鏈DNA斷裂末端最大程度的靠近蛋白,減少背景干擾,提高蛋白質(zhì)結(jié)合區(qū)域分析的準(zhǔn)確性。進(jìn)一步解交聯(lián)、分離純化DNA,利用RecJf核酸外切酶消化單鏈DNA,減少背景噪音。ChIP-exo核酸外切酶處理,有利于提高檢測轉(zhuǎn)錄因子結(jié)合位點的分辨率[2,44]。

2.3 基于免疫共沉淀優(yōu)化的ChIP-seq技術(shù)

染色質(zhì)免疫共沉淀實驗過程中,通常使用磁珠富集抗體、蛋白和DNA復(fù)合物,但難以避免非特異性結(jié)合的影響[37]。Zhu等[45]基于微流控芯片優(yōu)化ChIP實驗操作流程,提出MOW ChIP-seq(microfluidic oscillatory washing-based ChIP-seq)。將超聲處理的染色質(zhì)載入芯片,采用偶聯(lián)有目的蛋白特異性抗體的磁珠富集可溶性片段。通過控制芯片上微量流道內(nèi)樣品與磁珠的流動速度,促進(jìn)兩者混合均勻,提高免疫磁珠的捕獲效率。另外利用微流控振蕩輔助,降低非特異性結(jié)合,提高結(jié)果準(zhǔn)確度。MOW ChIP-seq通過結(jié)合免疫磁珠、微流控芯片對樣品進(jìn)行分離與富集,具有試劑和樣品消耗量少、自動化等優(yōu)勢[37]。

2.4 基于測序文庫優(yōu)化的ChIP-seq技術(shù)

ChIP-exo增加的酶切步驟以及多次洗滌,使用于建庫的起始DNA量減少,需要增加PCR循環(huán)擴(kuò)增數(shù),可能導(dǎo)致過多的重復(fù)序列[46]。在ChIP-exo基礎(chǔ)上,He等[47]設(shè)計含特異性序列的測序接頭,通過DNA自環(huán)化(self-circularization)方法優(yōu)化建庫,提 出 ChIP-nexus(ChIP experiments with nucleotide resolution through exonuclease,unique barcode and single ligation)。建庫過程中,將帶有限制性內(nèi)切酶BamH I酶切位點序列的測序接頭連接到DNA,利用環(huán)化連接酶將DNA自身環(huán)化。環(huán)化DNA通過BamH I酶切處理,其斷裂產(chǎn)物兩端將帶有測序接頭,利于直接擴(kuò)增建庫。ChIP-nexus通過分子內(nèi)自身環(huán)化進(jìn)行接頭連接構(gòu)建文庫,其連接效率比ChIP-seq中DNA連接酶的連接效率更高,有利于降低建庫DNA需求量。

擴(kuò)增構(gòu)建測序文庫過程中,高GC含量DNA片段易產(chǎn)生擴(kuò)增偏倚,擴(kuò)增體系中的引物二聚體將造成背景信號[48]。Adli等[49]對文庫構(gòu)建方案優(yōu)化,并提出Nano-ChIP-seq。在PCR擴(kuò)增建庫過程中,使用發(fā)夾結(jié)構(gòu)引物,減少引物二聚體。針對高GC含量序列,使用Phusion高保真DNA聚合酶,并優(yōu)化緩沖液和擴(kuò)增循環(huán)次數(shù)。此外,在引物序列中引入限制性內(nèi)切酶BciV I的酶切位點序列,擴(kuò)增產(chǎn)物在內(nèi)切酶作用下產(chǎn)生3'A突出末端,利于直接連接測序接頭。研究表明,利用Nano-ChIP-seq建庫方案可從少量細(xì)胞中進(jìn)行ChIP-seq檢測[49-50]。表1比較了上述ChIP-seq優(yōu)化技術(shù)。

表1 ChIP-seq優(yōu)化技術(shù)比較Table 1 Comparison of optimization techniques of ChIP-seq

3 CUT&RUN、CUT&Tag及CoBATCH技術(shù)

ChIP包含細(xì)胞裂解、細(xì)胞核提取、染色質(zhì)制備以及免疫共沉淀等多個連續(xù)步驟,需要的細(xì)胞量較大,常規(guī)ChIP-seq很難進(jìn)行少量細(xì)胞或單細(xì)胞水平的檢測[51]。最近,研究人員利用目的蛋白特異性抗體使MNase或Tn5轉(zhuǎn)座酶“靶向”作用于目的蛋白結(jié)合位點附近的染色質(zhì),提出CUT&RUN、CUT&Tag等方法。與ChIP-seq相比較,這些方法無需獲取可溶性染色質(zhì)進(jìn)行免疫共沉淀,具有實驗流程簡單、耗時短等優(yōu)勢,可以在少量細(xì)胞或單細(xì)胞水平進(jìn)行檢測。

3.1 CUT&RUN技術(shù)

Schmid等[52]建立了以酶“靶向”切割染色質(zhì)的 方 法:ChIC(chromatin immunocleavage)。 為 使MNase選擇性地作用于目的蛋白結(jié)合區(qū)域,研究者利用對抗體具有親和力的Protein A融合MNase(pAMN),通過抗體結(jié)合pA-MN融合蛋白將MNase間接結(jié)合到目的蛋白。在ChIC實驗中,首先利用螯合劑EDTA、EGTA等抑制MNase酶活性,將細(xì)胞與含有目的蛋白特異性抗體、pA-MN的緩沖液反應(yīng)后,用Ca2+激活MNase,使其在特定位點斷裂DNA。2016年,Skene等[51]將ChIC與高通量測序技術(shù)結(jié)合,提出CUT&RUN。

CUT&RUN中,特異性抗體先與目的蛋白結(jié)合,進(jìn)一步與pA-MN反應(yīng),募集pA-MN到結(jié)合位點。在0℃下保持較低的酶活性,抗體固定酶后,采用Ca2+激活MNase使其在目的蛋白結(jié)合位點附近作用于染色質(zhì)開放區(qū)域,酶切后染色質(zhì)片段釋放,進(jìn)一步建庫測序[51,53]。研究者利用伴刀豆球蛋白A(concanavalin A,Con A)能與細(xì)胞的多糖、糖蛋白特異結(jié)合特性,將Con A包被在磁珠表面,固定細(xì)胞或細(xì)胞核,以利于洗滌。2018年,Skene等[54]對CUT&RUN實驗優(yōu)化,通過洋地黃皂苷(digitonin)增加細(xì)胞膜通透性,釋放酶切染色質(zhì)片段到細(xì)胞外,由于未被切割的染色質(zhì)仍留在細(xì)胞內(nèi),有利于降低背景噪音。2019年,Hainer等[55]利用流式細(xì)胞分選將單個細(xì)胞分離到多孔板中進(jìn)行CUT&RUN實驗,提出可對極少量細(xì)胞進(jìn)行檢測的ULI-CUT&RUN(ultra-low input CUT&RUN)。

3.2 CUT&Tag及CoBATCH技術(shù)

Tn5轉(zhuǎn)座子由核心序列和兩末端序列組成。Tn5轉(zhuǎn)座酶可以與Tn5轉(zhuǎn)座子的末端序列結(jié)合形成復(fù)合物,該復(fù)合物具有“剪切-粘貼”(cut and paste)催化活性,兩者協(xié)同完成Tn5轉(zhuǎn)座子末端序列的切割和轉(zhuǎn)移。在Tn5轉(zhuǎn)座復(fù)合體作用下,轉(zhuǎn)座子末端DNA的磷酸二酯鍵被水解并產(chǎn)生3'- OH羥基末端,隨后Tn5轉(zhuǎn)座酶進(jìn)攻目標(biāo)DNA形成9 bp的切口,同時轉(zhuǎn)座子羥基末端與目標(biāo)DNA的磷酸基團(tuán)之間形成共價鍵,從而將轉(zhuǎn)座子序列插入到目標(biāo)DNA[56]。由于這一特性,Tn5轉(zhuǎn)座酶可將測序接頭序列隨機(jī)插入染色質(zhì)開放區(qū)域,進(jìn)行DNA片段化和測序接頭連接[57]。Schmidl等[58]首先將 Tn5轉(zhuǎn)座酶工具與ChIP相結(jié)合,代替ChIP-seq構(gòu)建測序文庫中的末端補(bǔ)平、3'末端加A等處理,提出ChIPmentation。其中,測序接頭和Tn5轉(zhuǎn)座酶組裝形成轉(zhuǎn)座復(fù)合物,與X-ChIP獲得的目的蛋白結(jié)合DNA反應(yīng),進(jìn)行接頭連接。

2019年,Kaya-Okur等[59]參考 CUT&RUN的實驗流程,將帶有測序接頭的Tn5轉(zhuǎn)座酶與Protein A融合(pA-Tn5),利用pA-Tn5替換pA-MN,提出CUT&Tag。特異性抗體結(jié)合目的蛋白后,進(jìn)一步與pA-Tn5反應(yīng),利用Mg2+激活Tn5轉(zhuǎn)座酶活性進(jìn)行染色質(zhì)切割與接頭連接。Tn5轉(zhuǎn)座酶建庫有利于減少損失,與CUT&RUN比較,CUT&Tag的樣本需求量更小。2020年,Bartosovic等[60]將液滴微流控技術(shù)與CUT&Tag相結(jié)合,進(jìn)行單細(xì)胞建庫測序,提出 scCUT&Tag(single-cell Cut&Tag)。 表2比 較 了CUT&RUN、CUT&Tag與 ChIP-seq。

表2 CUT&RUN、CUT&Tag與ChIP-seq比較Table 2 Comparison of CUT&RUN,CUT&Tag and ChIP-seq

標(biāo)簽組合(combinatorial indexing)建庫是利用不同的barcode序列為不同樣品的DNA進(jìn)行組合標(biāo)簽標(biāo)記,通過一次建庫可區(qū)別成千上萬單細(xì)胞,利于提高單細(xì)胞測序的通量,獲得更多單細(xì)胞信息[61]。2019年,Wang等[62]基于標(biāo)簽組合和pA-Tn5提出 CoBATCH(combinatorial barcoding and targeted chromatin release)。通過流式細(xì)胞儀和微孔板進(jìn)行單個細(xì)胞的分選和分離,采用帶有T5/T7組合標(biāo)簽的pA-Tn5對染色質(zhì)進(jìn)行轉(zhuǎn)座酶切割和標(biāo)簽標(biāo)記,進(jìn)一步對帶有不同標(biāo)簽的DNA建庫與測序。CoBATCH利用組合標(biāo)簽區(qū)分不同樣本來源的細(xì)胞,同時組合標(biāo)簽增加了測序文庫的復(fù)雜度,利于進(jìn)行高通量的單細(xì)胞檢測。

4 在植物基因表達(dá)調(diào)控研究中的應(yīng)用

研究人員使用ChIP-seq檢測植物轉(zhuǎn)錄因子結(jié)合位點、組蛋白修飾分布,已廣泛應(yīng)用于生物鐘調(diào)控、激素信號轉(zhuǎn)導(dǎo)、光信號途徑、脅迫響應(yīng)等研究[63-65]。CUT&RUN和CUT&Tag方法具有流程簡單、良好的可重復(fù)性、需要的細(xì)胞數(shù)量少等優(yōu)勢,近年來,被初步應(yīng)用于植物轉(zhuǎn)錄因子、組蛋白修飾H3K27me3和 H3K4me3 等研究[66-68]。

4.1 植物轉(zhuǎn)錄因子結(jié)合位點相關(guān)研究

植物的生長發(fā)育除了受自身遺傳因素的調(diào)控外,還受到環(huán)境脅迫、內(nèi)源激素變化等影響。轉(zhuǎn)錄因子在植物的生物鐘調(diào)控、激素信號轉(zhuǎn)導(dǎo)、生長和代謝等過程中發(fā)揮重要作用[69-70]。GRF7(growthregulating factor 7)是水稻(Oryza sativa)生長調(diào)節(jié)因子類轉(zhuǎn)錄因子,Chen等[71]選用不同發(fā)育時期的水稻幼穗進(jìn)行ChIP-seq檢測,發(fā)現(xiàn)OsGRF7與細(xì)胞色素P450基因OsCYP714B1和生長素響應(yīng)基因OsARF12啟動子中的ACRGDA motif結(jié)合,激活基因轉(zhuǎn)錄,參與赤霉素的合成和生長素的信號傳導(dǎo)途徑,調(diào)控幼穗發(fā)育。生物鐘是影響生物晝夜節(jié)律的重要因素,CAA1(circadian clock-associated 1)是擬南芥(Arabidopsis thaliana)生物鐘重要轉(zhuǎn)錄因子,PRRs家族基因參與生物鐘調(diào)控,Kamioka等[69]通過ChIP-seq發(fā)現(xiàn)CCA1直接結(jié)合在基因PRR5的啟動子區(qū)域,抑制PRR5表達(dá),并發(fā)現(xiàn)CCA1與PRR9、PRR7、PRR5等基因啟動子上多個motif結(jié)合,包括G-box、EEs、CT重復(fù)、TCP等,調(diào)控生物鐘周期。光是調(diào)控植物生長和發(fā)育的重要環(huán)境因素,F(xiàn)HY3(far-red elongated hypocotyl 3)是擬南芥光信號轉(zhuǎn)錄因子,Ouyang等[72]利用ChIP-seq在遠(yuǎn)紅光條件下鑒定到FHY3結(jié)合在基因FHY1和ELF4啟動子的FBS motif(CACGCGC),激活基因表達(dá),促進(jìn)光敏色素A在細(xì)胞核的積累,進(jìn)而調(diào)控光信號途徑;并發(fā)現(xiàn)FHY3與葉綠體分裂相關(guān)基因ARC5啟動子區(qū)域的FBS motif結(jié)合,激活其轉(zhuǎn)錄,進(jìn)而影響葉綠體發(fā)育。葉夾角是影響株型與作物產(chǎn)量的重要農(nóng)藝性狀,油菜素內(nèi)酯(brassinosteroid,BR)是植物重要的促生長類激素。BR促進(jìn)細(xì)胞伸長與分裂,對水稻葉夾角發(fā)育有影響,Guo等[68]通過CUT&RUN分析發(fā)現(xiàn),水稻bHLH(basic-helix-loop-helix)轉(zhuǎn)錄因子家族的OsbHLH98,結(jié)合水稻BR信號轉(zhuǎn)導(dǎo)途徑相關(guān)基因BUL1的啟動子上的G-box、E-box等motif,抑制基因表達(dá),調(diào)控水稻葉夾角發(fā)育。

4.2 植物組蛋白修飾及分布相關(guān)研究

在植物發(fā)育過程中,除了轉(zhuǎn)錄因子激活或抑制基因表達(dá)的作用外,染色質(zhì)組蛋白翻譯后修飾通過影響染色質(zhì)結(jié)構(gòu)來調(diào)控基因的表達(dá)。組蛋白修飾H3K27me3抑制基因轉(zhuǎn)錄,Wu等[73]通過ChIP-seq發(fā)現(xiàn)在高氮素條件下水稻分蘗抑制基因D14和OsSPL14啟動子區(qū)域的H3K27me3富集水平顯著升高。進(jìn)一步研究表明,水稻分蘗期氮素應(yīng)答關(guān)鍵蛋白NGR5通過與PRC2相互作用,將PRC2招募到D14和OsSPL14的啟動子上催化H3K27me3修飾并抑制基因表達(dá),進(jìn)而調(diào)控氮濃度對水稻氮素吸收和分蘗發(fā)生的影響。Nishio等[74]以鼠耳芥(Arabidopsis halleri)為材料,通過ChIP-seq分析組蛋白修飾H3K27me3對其季節(jié)性和晝夜節(jié)律基因表達(dá)的影響,并與組蛋白修飾H3K4me3進(jìn)行比較。發(fā)現(xiàn)H3K27me3具有季節(jié)性的可塑性與晝夜節(jié)律穩(wěn)定性,H3K27me3的信號變化晚于H3K4me3出現(xiàn),在環(huán)境變化中進(jìn)行長期的基因表達(dá)調(diào)控。

研究者將CUT&RUN、CUT&Tag用于植物組蛋白修飾分析,并與ChIP-seq進(jìn)行比較。Zheng等[66]利用流式細(xì)胞儀分選擬南芥胚乳細(xì)胞核,通過CUT&RUN分析發(fā)現(xiàn)胚乳細(xì)胞周期中有絲分裂間期的相關(guān)基因被H3K27me3修飾,H3K27me3影響親本等位基因的差異表達(dá)與胚乳發(fā)育。與ChIP-seq相比較,CUT&RUN檢測所需細(xì)胞數(shù)量更少。Tao等[67]將CUT&Tag用于對棉纖維細(xì)胞基因組及外顯子、內(nèi)含子、啟動子等區(qū)域組蛋白修飾H3K4me3的分布特征分析,發(fā)現(xiàn)H3K4me3顯著富集在基因啟動子上(轉(zhuǎn)錄起始位點上游1-2 kb)。使用相同數(shù)量細(xì)胞進(jìn)行CUT&Tag和ChIP-seq檢測,發(fā)現(xiàn)CUT&Tag分析結(jié)果具有較好重復(fù)性,顯示出更高分辨率和更低的背景信號,所需實驗時間更短。

5 總結(jié)與展望

ChIP-seq已被廣泛用于轉(zhuǎn)錄因子和組蛋白修飾研究。近年來,研究人員將流式細(xì)胞分選、微流控芯片與ChIP-seq相結(jié)合,優(yōu)化細(xì)胞分離、染色質(zhì)片段化、免疫共沉淀以及測序文庫構(gòu)建等關(guān)鍵步驟并提出優(yōu)化方法。CUT&RUN、CUT&Tag利用“靶向”酶切和Tn5轉(zhuǎn)座酶建庫,簡化實驗流程。在上述基礎(chǔ)上,使得ChIP-seq在少量細(xì)胞或在單細(xì)胞水平的檢測成為可能。其他測序技術(shù)在轉(zhuǎn)錄因子和組蛋白修飾研究中具有重要作用:微球菌核酸酶測序MNase-seq(micrococcal nuclease sequencing) 利 用MNase切割染色質(zhì),獲取核小體DNA建庫測序,繪制核小體定位圖譜[75]。MNase-seq與ChIP-seq聯(lián)合將利于分析目的蛋白結(jié)合位點附近的核小體定位狀態(tài)。染色質(zhì)轉(zhuǎn)座酶可及性測序ATAC-seq(assay for transposase-accessible chromatin with high throughput sequencing)利用Tn5轉(zhuǎn)座酶進(jìn)行染色質(zhì)切割與接頭連接,檢測染色質(zhì)開放區(qū)域[76]。ATAC-seq結(jié)合ChIP-seq可進(jìn)一步分析轉(zhuǎn)錄因子、組蛋白修飾對染色質(zhì)開放性的影響。ChIP-seq與轉(zhuǎn)錄組測序技術(shù)(RNA-seq)的聯(lián)合分析,有利于進(jìn)一步確認(rèn)轉(zhuǎn)錄因子以及組蛋白的修飾對于基因表達(dá)的調(diào)控作用。

隨著技術(shù)的不斷發(fā)展,ATAC-seq、RNA-seq,CUT&RUN、CUT&Tag等均可以實現(xiàn)單細(xì)胞水平的檢測。進(jìn)行單細(xì)胞的組學(xué)分析,克服細(xì)胞異質(zhì)性對有效信號的“干擾”問題,有利于珍稀樣品的準(zhǔn)確分析。將ChIP-seq納入多組學(xué)聯(lián)合分析,幫助更全面的理解細(xì)胞內(nèi)蛋白與DNA相互作用,具有重要的研究意義。

猜你喜歡
建庫染色質(zhì)基因組
染色質(zhì)開放性與動物胚胎發(fā)育關(guān)系的研究進(jìn)展
哺乳動物合子基因組激活過程中的染色質(zhì)重塑
牛參考基因組中發(fā)現(xiàn)被忽視基因
科學(xué)家找到母愛改變基因組的證據(jù)
血清HBV前基因組RNA的研究進(jìn)展
豚鼠卵母細(xì)胞體外成熟過程中生發(fā)泡染色質(zhì)構(gòu)型的變化
水稻基因組有了更清晰的三維圖譜
“數(shù)字溫縣”建設(shè)項目通過驗收
紫花白及基因組DNA提取方法的比較
交通規(guī)劃數(shù)據(jù)庫道路紅線規(guī)劃建庫規(guī)則
通城县| 普兰店市| 安宁市| 卓尼县| 平武县| 江门市| 土默特右旗| 广宗县| 菏泽市| 宁陕县| 大余县| 屏东县| 安义县| 于田县| 滨海县| 广丰县| 万安县| 宣恩县| 布尔津县| 锡林浩特市| 滨海县| 五峰| 大兴区| 林西县| 盐池县| 石台县| 神池县| 灵台县| 尤溪县| 阿勒泰市| 汕尾市| 齐齐哈尔市| 清原| 蒙城县| 八宿县| 四平市| 邛崃市| 夏河县| 鲜城| 秀山| 页游|