鐘 成,黃龍輝,劉其敬,謝燕燕,譚之磊
(工業(yè)發(fā)酵微生物教育部重點實驗室,天津科技大學生物工程學院,天津 300457)
CRISPR(clustered regularly interspaced short palindromic repeats)是細菌等生物體細胞內的一種遺傳適應性免疫系統(tǒng),細菌可以通過該系統(tǒng)抵御侵入細胞內的 DNA[1].它主要由 crRNA(CRISPR RNA)和相應的 Cas(CRISPR-associated)蛋白組成.在 CRISPR系統(tǒng)中,crRNA的基因包含一段用于定位 CRISPRCas系統(tǒng)靶位點基因的序列,該序列是一段外源侵入至 CRISPR陣列的 DNA.crRNA主要通過結合 Cas蛋白和特異的 20nt左右的間隔序列對 DNA序列進行特異的靶邊點識別,并實現(xiàn)對靶位點 DNA的切割[2-3].通過整合外源侵入的 DNA,CRISPR 能夠記錄下外源 DNA的具體序列,從而實現(xiàn)對外源 DNA特定序列的切割.基于不同 CRISPR免疫系統(tǒng)中crRNA和Cas蛋白的不同,CRISPR-Cas系統(tǒng)主要通過其特征基因分為三大類型:Ⅰ型系統(tǒng)具備 cas3,Ⅱ型系統(tǒng)具備 cas9,Ⅲ型系統(tǒng)具備 cas10.在所有的CRISPR/Cas系統(tǒng)中,Ⅱ型系統(tǒng)的結構最為簡單,僅需要 Cas9蛋白便能實現(xiàn)切割,因此人們最早將它改造成用于基因編輯的CRISPR/Cas9系統(tǒng)[4].
CRISPR/dCas9是通過將 CRISPR/Cas9系統(tǒng)中的Cas9蛋白改造成dCas9(catalytically dead Cas9),得到的具有轉錄調控功能的系統(tǒng).相對于 CRISPR/Cas9系統(tǒng),CRISPR/dCas9系統(tǒng)具備與靶位點結合,但不對DNA進行切割的特點(圖1).
Cas9蛋白的結構如圖2所示,它主要存在HNH和RuvC核酸酶結構域以及與sgRNA(target-specific guide RNA)接觸的α-螺旋葉,其中HNH和RuvC核酸酶結構域都是切割 dsDNA所必需的[5-6].HNH和RuvC兩個結構域各自負責一條單鏈的切割,選擇其中任何一個結構域進行突變可以得到具備單鏈切割能力的 Cas9n蛋白.將兩個不同突變位點的 Cas9n蛋白結合起來切割雙鏈,從而提高靶位點切割的特異性[7].將 CRISPR系統(tǒng)中 Cas9蛋白改造成 dCas9蛋白后,蛋白就能方便精準地被引導至靶位點.同時,對HNH和RuvC兩個結構域中的D10A和H840A氨基酸進行點突變可以獲得剪切失活的Cas9蛋白[8].基于此,研究人員除了將dCas9蛋白直接用于轉錄抑制外,也融合了不同的轉錄調控相關的因子,得到了一系列基于CRISPR/dCas9的轉錄調控工具.
圖1 Cas9蛋白與gRNA及靶位點的結合過程Fig. 1 The binding process of Cas9 to gRNA and target sites
圖2 Cas9蛋白的結構示意圖Fig. 2 Schema of Cas9 protein structure
Cas9首先需要識別一個短的原型間隔區(qū)相鄰基序(protospacer adjacent motif,PAM),再通過 sgRNA中和 DNA互補的 20nt與 DNA結合.結合后的Cas9-sgRNA復合物就變得非常穩(wěn)定;體外結合動力學研究結果表明,這一反應在結合后較長時間內幾乎是不可逆的[9].通過對 CRISPR系統(tǒng)的改造,其已經在激活或抑制特定靶位點基因表達以及表觀修飾等領域取得了重大突破[10-11].CRISPR/Cas9系統(tǒng)作為一種基因編輯工具,為基因工程帶來了巨大的變革,許多綜述已經詳細闡述了其在真核生物中的應用[12-16].相比 CRSPR/Cas9系統(tǒng),CRSPR/dCas9系統(tǒng)是在其基礎上發(fā)展而來的轉錄調控工具.該系統(tǒng)作為轉錄抑制工具方面已在多種細菌中得到應用,而該系統(tǒng)在細菌作為轉錄激活工具的應用卻鮮有報道.本文以 CRSPR/dCas9為例,首先對 CRISPR干擾和激活在細菌中的應用和研究進展進行了介紹,然后總結和討論了在細菌中構建該系統(tǒng)存在的問題.
細菌 CRISPR 干擾(CRISPR interference,CRISPRi)在大腸桿菌(E.coli)中已有大量研究[10-11,17].在大腸桿菌中,dCas9-sgRNA復合物通過阻斷 RNA聚合酶(RNA polymerase,RNAP)與啟動子 DNA 的結合或通過阻斷轉錄的延伸抑制轉錄(圖 3),這一點已被深度測序證明[10-11,18].靶向非模板鏈的延伸區(qū)段是最有效的[19].RNA測序表明這種抑制具有高度的特異性[10].CRISPRi已被用于模式菌株如大腸桿菌中的遺傳回路控制[10]以及結核分枝桿菌(Mycobacterium tuberculosis)中基因表達的調控[20],并通過 CRISPRi改變代謝通量,從而改變代謝途徑[21].研究[22]顯示,CRISPRi系統(tǒng)已成功應用于革蘭氏陽性細菌枯草芽胞桿菌(Bacillus subtilis)、人類微生物群共生菌擬桿菌(Bacterioides sp.)以及產生醫(yī)學相關次級代謝產物的放線菌目中.
圖3 CRISPRi系統(tǒng)的作用機制Fig. 3 Mechanism of the CRISPRi System
在細菌中dCas9僅需通過gRNA的引導與靶位點結合就能有效地抑制基因的表達.而與原核生物相比,在真核生物中dCas9蛋白不能明顯地抑制基因表達,Cas9蛋白需要與轉錄抑制蛋白結構域(KRAB)融合,實現(xiàn)抑制基因的轉錄[23](圖 3).與傳統(tǒng)的調控基因表達的技術相比,CRISPRi的優(yōu)勢明顯[24-26].第一,僅通過在sgRNA中插入一個新的20nt堿基配對區(qū)域就可以很容易地抑制新靶點.第二,由于CRISPRi構建完成后只需要改變其中的 20nt就可以靶向不同的基因,因此可以使用合并克隆策略,將20nt文庫與CRISPRi載體整合進行文庫構建[24,27-29].通過文庫的構建,可以高通量地篩選出理想表型的菌株,并找到影響該表型的基因,從而進一步指導理性地改造菌株.第三,由于 CRISPRi可以是誘導型的,所以它能夠通過部分抑制而操縱基因表達[20].
除了傳統(tǒng)的誘導方法外,近年來有研究顯示可以通過光遺傳工具調控CRISPRi的表達.例如,通過光誘導 CRISPRi的表達調控哺乳動物細胞中基因的表達[30-31].而這一策略在發(fā)酵領域的應用雖未報道,但其在特定的發(fā)酵條件(比如靜息發(fā)酵)下的基因調控同樣具有相當價值.CRISPRi可與多種 sgRNA在同一細胞中同時對多種基因的表達進行干擾[10,17].這對于需要調節(jié)許多基因表達優(yōu)化代謝途徑的應用很重要,它可以簡單快速地探究多個基因的表達對代謝通路的影響.由于這一系統(tǒng)構建方便,而在一些倍增時間極長的細菌中進行基因編輯又非常耗時,因此通過這種方法探究代謝途徑的應用價值具有明顯的優(yōu)勢.
然而,由于 dCas9阻斷了 RNA聚合酶的延伸,操縱子中的下游基因的表達也同樣會受到干擾,相對于基因組編輯來說,這是一個不可忽視的缺陷.與CRISPR編輯的情況一樣,在CRISPRi對生長所必需基因進行干擾的時候,生存選擇壓力可能導致CRISPR系統(tǒng)發(fā)生突變甚至不再工作.最近,Cui等[19]將包含92000種特異性靶點的CRISPRi文庫應用于大腸桿菌中高通量篩選時發(fā)現(xiàn),sgRNA中靠近 PAM序列的12nt的種子序列中的5個特定的核苷酸就能造成菌株產生適應性缺陷.同時,他們也發(fā)現(xiàn)隨著dCas9濃度降低,適應性缺陷也會降低.而 dCas9在低濃度時也能夠明顯抑制靶點基因的表達.因此,在構建細菌的CRISPRi過程中優(yōu)化dCas9的表達量就顯得尤為重要.
CRISPRa(CRISPR activition)是一種基于CRISPR/dCas9的轉錄激活工具.CRISPR/dCas9系統(tǒng)要實現(xiàn)轉錄激活,需要dCas9蛋白與轉錄激活因子融合或者在 sgRNA的末端融合一段 scRNA(small cytoplasmic RNA)來募集能激活基因表達的RNA結合蛋白,從而激活或增強基因轉錄.大腸桿菌CRISPRa系統(tǒng)中,dCas9與 RNA聚合酶的 ω亞基(dCas9∷ω)融合[11],在特異性的 sgRNA 引導下,RNA聚合酶被聚集到啟動子的上游位置,從而激活轉錄[14](圖 4).真核微生物中有 SAM、SunTag和VP64-p65-Rta(VPR)等系統(tǒng)[21,24-25].基于對不同啟動子的特征分析表明,可能存在有效激活的狹窄區(qū)域,即 dCas9∷ω過于接近啟動子則發(fā)生抑制,并且當dCas9∷ω的結合位點遠離啟動子時,激活則會失敗.這一特性雖然使 CRISPRa不能明確界定靶位點,但同時也增強了 CRISPRa系統(tǒng)的特異性.CRISPRa對弱啟動子的激活有明顯效果[11].由于基因組中啟動子的具體位點不能明確界定,因此該系統(tǒng)需要進一步的研究和優(yōu)化才能廣泛適用.研究[11]顯示,大腸桿菌CRISPRa系統(tǒng)需要在缺乏ω因子的菌株中才能工作.
相對于傳統(tǒng)的轉錄調控工具,CRISPRa系統(tǒng)繼承了 CRISPR/dCas9系統(tǒng)在構建方面的簡單快捷的優(yōu)勢.另外,其在利用轉錄調控探究基因功能方面能夠彌補 CRISPRi對表達弱的基因不明顯這一缺陷.不同基因表達的強弱不同,當 CRISPRa用于強啟動子的時候其效果就不十分顯著,而當 CRISPRi用于弱啟動子的時候其效果也可能會不明顯.因此,若利用 CRISPRa探究加強表達基因的功能或用CRISPRa探究削弱表達基因的功能,效果則不會顯著.與此相反,當 CRISPRa用于弱啟動子或CRISPRi用于強啟動子的時候其效果則可能變得顯著.因此,將二者分別用于同一基因的激活和弱化的時候,就可以抵消之前二者的缺陷.設計不同的 20nt序列和scRNA序列可以實現(xiàn)分別對不同基因的抑制和激活,并且兩個系統(tǒng)互不干擾[34].結合 CRISPRi和CRISPRa就可以在基因組規(guī)模上進行基因功能的探究[32](圖 5).CRISPRa系統(tǒng)的另一個應用是探究抗生素作用機制.為了實現(xiàn)這一效果,可能需要不依賴于啟動子的精確間距的 CRISPRa的策略.研究人員通過在 sgRNA的末端連接長而靈活的連接子(一段能夠與激活子結合的 RNA片段),利用連接子將激活子聚集在 dCas9附近[24,28](圖 4),以減少CRISPRa對間距的依賴性.
圖5 同時激活和抑制基因組上不同基因Fig. 5 Simultaneous activation and depression of different genes on a genome scale
由于細菌的多樣性,CRISPR技術在細菌中的應用卻不如哺乳動物中那么成熟[33].CRISPR系統(tǒng)在 γ變形菌門中基因編輯的實現(xiàn)標志著在原核微生物中從傳統(tǒng)基因編輯技術到利用 CRISPR系統(tǒng)對基因組編輯的轉變[34-35].厚壁菌和放線菌中的應用標志著研究人員正將這一便捷的技術轉移到以前缺乏足夠遺傳改造工具的細菌中[36-37].將CRISPR/dCas9系統(tǒng)應用到一株新的菌株中主要會經歷系統(tǒng)的選擇與構建、靶位點的選擇和gRNA的設計3個過程,本節(jié)將結合筆者實際研究和文獻總結,從這 3個方面探討CRISPR/dCas9在細菌轉錄調控中的應用以及應用過程中存在的問題.
(1) 利用 CRISPR/dCas9系統(tǒng)在一株新的細菌中有效地調控基因的表達需要選擇合適的系統(tǒng).而在系統(tǒng)選擇的過程中,靶點基因表達的強弱是選擇系統(tǒng)的主要依據(jù).這是因為用該系統(tǒng)去激活表達強的基因或者弱化表達弱的基因都不會有明顯的效果.因此,利用 CRISPR/dCas9探究細菌中某一基因功能的時候,將激活和弱化二者結合運用或許會取得更明顯的效果.
(2) 需要考慮CRISPR/dCas9的表達系統(tǒng).一方面,由于原核微生物的多樣性,很難找到一個能在所有細菌中共用的表達系統(tǒng),因此要將CRISPR系統(tǒng)引入一株新的菌株,需要選擇能在宿主中工作的表達系統(tǒng).另一方面,則是要在較低的水平表達 dCas9蛋白,這是因為過量的表達dCas9蛋白會對宿主造成毒害.而將dcas9基因的表達量控制在較低的表達水平則會有效地減少 CRISPR/dCas9系統(tǒng)對宿主的毒性[19]. 并且,Cas9-sgRNA復合物與基因結合后就變得非常穩(wěn)定;體外結合動力學研究結果表明,這一反應在結合后較長時間內幾乎是不可逆的[9].總而言之,在一個新的菌株中構建 CRISPR/dCas9系統(tǒng)時,需要考慮質粒的拷貝數(shù)、啟動子的強弱和密碼子的適應度的優(yōu)化,讓該系統(tǒng)達到既能對靶位點基因有效地調控又不至于對宿主帶來毒性的效果.
(3) 需要選擇合適的靶位點.與 CRISPR/Cas9這一基因編輯工具只需要考慮 Cas9-sgRNA復合物與靶位點的結合效率不同的是,在選取 CRISPR/dCas9靶位點的時候還需要考慮復合物結合靶位點后對基因調控的效果.在同一操縱子內,選取不同的靶位點具有不同的調控效果.就CRISPRi而言,可以選與結構基因啟動子或基因內部結合.當在靶基因內部選取靶位點時,只有以編碼鏈中的序列為靶位點時才能抑制基因的表達.而當將靶向位點選取在啟動子的時候,以 DNA雙鏈的任何一條鏈作為靶位點都會對基因的表達產生較強的抑制.當操縱子中有多個基因時,靶向上游基因能抑制下游基因的表達,而靶向下游基因對上游基因的表達幾乎沒有影響[19].與 CRISPRi靶位點選取不同的是,CRISPRa需要將靶位點選在啟動子上游位置才能激活基因的表達[11].由于 CRISPRa可能存在狹窄的有效激活域,因此選取靶位點的時候最好不要太靠近啟動子,也不要距離啟動子太遠.
(4) 設計有效的 sgRNA.sgRNA 的設計必須符合兩個標準:靶向具有 PAM 的區(qū)域和最小化的脫靶率.選擇靶向PAM序列是由于CRISPR雖然能靈活且精確地將 Cas9靶向基因組上不同位置,但靶向DNA特異位點首先需要Cas9識別PAM序列[8-9],然后通過 20nt左右的靶序列與 sgRNA的間隔區(qū)堿基配對.選擇與PAM相鄰靶位點完全匹配的20nt序列能有效降低脫靶率.這是因為雖然不完全匹配的靶位點仍然可以與 dCas9-sgRNA復合物結合,但抑制效果最強的 sgRNA都與 PAM 相鄰靶位點完全匹配.在sgRNA的3′末端或與PAM序列相鄰的12個核苷酸中的單個錯配會明顯降低 dCas9-sgRNA對基因表達的抑制作用.sgRNA與靶點之間的錯配將進一步降低抑制的效果[10-11].抑制效果也可以通過改變靶點匹配所在基因內的位置來調整,這是由于目的基因的3′堿基或sgRNA與模板鏈結合的位置都會影響抑制效果[10,20].Bowtie等計算工具可用于比較PAM 相鄰的靶位點,使用加權算法可以幫助丟棄具有潛在脫靶效應的sgRNA[29-30].
相對于在哺乳動物中CRISPRi需要與dCas9融合染色質沉默子(KRAB)這一特點[29,38],在細菌中CRISPRi系統(tǒng)僅 dCas9就能對基因的表達起到明顯的抑制效果[10].因此,細菌 CRISPRi中 sgRNA的設計規(guī)則可能與哺乳動物細胞中的規(guī)則不同;這些規(guī)則可以在包含大量的 sgRNA文庫實驗中,利用深度測序測試sgRNA的功效進行確定.由于CRISPRi對基因的抑制會影響操縱子下游基因的表達,而不是僅對個別基因的抑制,因此 CRISPRi只適用于操縱子的篩選.另外,高濃度表達 dCas9對細菌造成適應性缺陷,因此在利用 CRISPR/dCas9系統(tǒng)探究細菌基因功能的時候,優(yōu)化dCas9的表達量就顯得尤為重要.
在細菌中構建 CRISPRi系統(tǒng)的過程中,還必須解決 CRISPRi系統(tǒng)在不同細菌中通用性的問題.由于不同細菌之間的種間差異較大,因此很有可能不會有通用的 CRISPRi系統(tǒng)能在所有細菌中工作.而將系統(tǒng)中的組件模塊化標準化方法(比如可以通過酶切方法輕易地替換系統(tǒng)中的復制子或啟動子等原件)或許更適用于CRISPR系統(tǒng)在不同細菌中的擴展.
與 RNAi或其他已知的調控基因表達的方法(基因過表達,TALE或ZF介導的調控)相比,CRISPRi/a具備設計簡易性和高特異性的特點[23-24,38].基于這些特點,研究人員一方面可以通過其直接控制內源基因轉錄水平上的表達.另一方面也可以在該系統(tǒng)的基礎上進一步改造,以適應不同的研究目的.比如,在基因互作方面,科研人員將 CRISPR/dCas9系統(tǒng)與熒光蛋白結合用于基因定位,研究活細胞中基因組的三維結構和動力學特征[7,10];在調控基因表達方面,研究人員將光遺傳工具與 CRISPR/dCas9結合,實現(xiàn)了通過光誘導抑制基因的表達[26,32].而這些也為在細菌中進一步研究 CRISPR/dCas9提供了思路.CRISPR/dCas9技術以調控基因表達開始出現(xiàn)在實驗室,相信其還有更多的擴展功能等待著研究人員去開發(fā).