馮 紅, 董 閣, 雍 彬, 李 維
(1.四川大學(xué)生命科學(xué)學(xué)院生物資源與生態(tài)教育部重點(diǎn)實(shí)驗(yàn)室,四川成都610064; 2.四川師范大學(xué)生命科學(xué)學(xué)院,四川成都610066)
CRISPR(Clustered regularly interspaced short palindromic repeats)稱為成簇規(guī)則間隔的短回文重復(fù)序列,最早于1987年在大腸桿菌中發(fā)現(xiàn)[1],隨后陸續(xù)在許多真細(xì)菌和古菌基因組中發(fā)現(xiàn)了這種重復(fù)序列[2-5].2002年R.Jansen等[6-7]詳細(xì)比較分析原核基因組中的這種重復(fù)序列,更重要的是發(fā)現(xiàn)在此重復(fù)序列的旁側(cè)經(jīng)常伴隨出現(xiàn)保守的系列基因.根據(jù)重復(fù)序列的排列特征,他們將這種獨(dú)特的重復(fù)序列命名為CRISPR,保守基因編碼的蛋白質(zhì)統(tǒng)稱為CRISPR附屬蛋白(Cas,CRISPR-association proteins).由于這種序列在細(xì)菌和古菌中分布如此之廣,因此推測CRISPR-Cas系統(tǒng)應(yīng)該具有某種細(xì)胞功能.
后來,陸續(xù)在不同的細(xì)菌中檢測到CRISPR位點(diǎn)的轉(zhuǎn)錄產(chǎn)物 crRNA(CRISPR RNA)[4,8-10],但crRNA通常較編碼基因序列短,說明這些轉(zhuǎn)錄產(chǎn)物是經(jīng)過核酸酶修飾加工后產(chǎn)生的.此外,由于Cas蛋白往往包含核酸切割、修飾的功能域,因此有人推測CRISPR-Cas系統(tǒng)可能與DNA復(fù)制、修復(fù)等DNA代謝有關(guān)[11-12].2005年3個(gè)獨(dú)立的研究小組在對(duì)CRISPR重復(fù)序列的進(jìn)一步分析比較后,幾乎同時(shí)發(fā)現(xiàn)CRISPR中的間隔序列與噬菌體和質(zhì)粒的序列完全相同[13-15].所以又提出了新的假說,認(rèn)為原核CRISPR-Cas系統(tǒng)可能是細(xì)菌抵御外來質(zhì)粒和噬菌體侵入的一種免疫防御機(jī)制.2007年R.Barrangou等[16]首次在乳酸菌Streptococcus thermophilus中,用實(shí)驗(yàn)證實(shí)了CRISPR-Cas系統(tǒng)的生物學(xué)功能,它確實(shí)是原核細(xì)胞抵御噬菌體侵染的一種新的免疫機(jī)制.次年,L.A.Marraffini等[17]在Staphylococci中證明CRISPR-Cas系統(tǒng)同樣也能夠干擾質(zhì)粒的結(jié)合轉(zhuǎn)移.
隨后幾年,在CRISPR-Cas系統(tǒng)的免疫機(jī)制以及Cas蛋白質(zhì)結(jié)構(gòu)功能等方面的研究取得了重大的進(jìn)展,而且基于CRISPR-Cas系統(tǒng)發(fā)展了一種新的DNA編輯技術(shù),在原核和真核細(xì)胞中成功地用于基因組的編輯、改造,顯示出巨大的潛力.本文較全面綜述了原核CRISPR-Cas系統(tǒng)的分布、組織結(jié)構(gòu)和作用機(jī)理以及在基因組編輯等方面應(yīng)用,以期推動(dòng)國內(nèi)在此相關(guān)領(lǐng)域的研究.
CRISPR重復(fù)序列具有典型的特征,可以通過簡單搜索重復(fù)序列在基因組中找到這樣的重復(fù)序列.但是由于CRISPR重復(fù)序列的多樣性和整個(gè)系統(tǒng)的復(fù)雜組成,為了能夠更加準(zhǔn)確地鑒定出CRISPR-Cas系統(tǒng),近年來開發(fā)了一些專門的計(jì)算機(jī)軟件,用于搜索CRISPR序列及其Cas基因,如CRISPRfinder,PILER-CR,CRT等[18-21].基于CRISPRfinder等計(jì)算機(jī)軟件的搜索比較,構(gòu)建了2個(gè)獨(dú)立的數(shù)據(jù)庫(http://crispr.u-psud.fr/crispr;http://crispr.genouest.org)[18-19].基于這2個(gè)數(shù)據(jù)庫,我們可以看到CRISPR重復(fù)序列廣泛分布于原核世界,在所有已經(jīng)分析的基因組中,45.4%(1126/2480)或46.4%(1141/2457)的真細(xì)菌、83.3%(125/150)或79.2%(126/159)的古細(xì)菌中存在CRISPR重復(fù)序列(這2組數(shù)據(jù)分別來自于以上的兩個(gè)數(shù)據(jù)庫,截止時(shí)間分別為1013/9/18和1013/7/27),而且這些細(xì)菌分屬于各種不同的類群.迄今為止,Chlamydiae是唯一沒有發(fā)現(xiàn)CRISPR重復(fù)序列的細(xì)菌類群,也許這與其專性寄生的生境和較小的基因組有關(guān).此外,在宏基因組測序中也發(fā)現(xiàn)了豐富多樣的CRISPR重復(fù)序列[22-23].
圖1 CRISPR-Cas系統(tǒng)的組織構(gòu)成Fig.1 Organization of the CRISPR-Cas system
典型的CRISPR重復(fù)序列由3部分組成(圖1):即同向重復(fù)序列(directed repeat,R);長度不等的間隔序列(spacer,S);以及位于5′端的前導(dǎo)序列(leader,L).前2種序列依次串聯(lián)排列,可以擁有2到100個(gè)重復(fù).CRISPR位點(diǎn)大多出現(xiàn)在染色體基因組中,也有少數(shù)出現(xiàn)在質(zhì)粒序列中;有的基因組可能包括多個(gè)CRISPR位點(diǎn),有的細(xì)菌可能只有一個(gè).
大多數(shù)CRISPR包含前導(dǎo)序列,長度在100~500 bp之間,通常富含AT.在不同的CRISPR中,前導(dǎo)序列并不保守,但包含轉(zhuǎn)錄起始位點(diǎn),而且在一些細(xì)菌中已經(jīng)得到了實(shí)驗(yàn)驗(yàn)證[24-25],因此前導(dǎo)序列就是啟動(dòng)CRISPR重復(fù)序列轉(zhuǎn)錄的啟動(dòng)子,在擁有CRISPR系統(tǒng)的細(xì)菌細(xì)胞內(nèi),很容易檢測到CRISPR的轉(zhuǎn)錄產(chǎn)物[24-26].
同向重復(fù)序列通常在23~55 bp之間,中位數(shù)集中于24~25,29~30,36~37[18].不同的細(xì)菌具有不同的CRISPR重復(fù)序列,并且這種重復(fù)序列呈現(xiàn)多樣性,根據(jù)同向重復(fù)序列的同源性,大致可以分成12個(gè)群以及21個(gè)亞群[27].但是在同一個(gè)CRISPR排列中,同向重復(fù)序列是高度保守的;而且在一些相近的細(xì)菌屬種間,也具有一定的同源性.由此推測CRISPR-Cas系統(tǒng)可能來自于“偶然”的水平基因轉(zhuǎn)移[28-29].重復(fù)序列的另外一個(gè)特點(diǎn)是,其序列呈部分回文對(duì)稱結(jié)構(gòu),因此成熟的crRNA能夠形成一個(gè)莖環(huán)環(huán)結(jié)構(gòu)(圖1).
間隔序列位于兩個(gè)重復(fù)序列之間,在同一個(gè)CRISPR排列中擁有相似的長度,但序列是獨(dú)特的.在不同的CRIPSR-Cas系統(tǒng)中,間隔序列的長度大多位于21~72 bp的范圍,主要集中在32 bp或35~37 bp之間[27].對(duì)于不同的原核種類,間隔序列具有高度的多樣性,只有在一個(gè)細(xì)菌的種內(nèi)不同菌株之間趨于同源.目前已經(jīng)明確認(rèn)為間隔序列來自于噬菌體或質(zhì)粒,實(shí)際上是噬菌體或質(zhì)粒入侵后留下的“痕跡”,從而賦予細(xì)胞獲得對(duì)相應(yīng)噬菌體或質(zhì)粒的免疫防御能力.此外,許多間隔序列在數(shù)據(jù)庫中還不能找到同源序列,這從另一個(gè)側(cè)面說明我們對(duì)噬菌體等移動(dòng)元件的多樣性仍然缺乏充分的認(rèn)識(shí).
CRISPR-Cas系統(tǒng)是由CRISPR重復(fù)序列排列與其串聯(lián)的cas基因組成的一個(gè)原核免疫系統(tǒng)(圖1).其中,cas基因主要編碼核酸酶、DNA解旋酶等切割修飾核酸的相關(guān)蛋白質(zhì).通過對(duì)大量的CRISPRCas系統(tǒng)中編碼的蛋白質(zhì)的鑒定和序列分析,可將Cas蛋白歸并為45個(gè)蛋白家族[12].除了少數(shù)的基因,如cas1和cas2幾乎出現(xiàn)在所有的CRISPR-Cas系統(tǒng)中,不同的CRISPR-Cas系統(tǒng)包含各種不同、復(fù)雜和異源的編碼基因,最多可達(dá)到20個(gè)以上.主要的Cas蛋白的特征和功能匯總見表1.
根據(jù)CRISPR-Cas系統(tǒng)中的Cas蛋白的種類和同源性,可將CRISPR-Cas系統(tǒng)區(qū)分成3種類型[48-50],即Type I~I(xiàn)II.這3種類型除了包括2個(gè)共有基因cas1和cas2之外,還包括特定的“標(biāo)記”基因,類型I-III的標(biāo)志基因分別是cas3、cas9和cas10.其次,在每一種類型下再根據(jù)cas基因的異同以及cas1的同源性,進(jìn)一步分成不同的亞型(表2).值得注意的是這些類型和亞型并沒有原核種屬的特異性,而且同一個(gè)細(xì)菌菌株也可能包含不同類型的CRISPR-Cas系統(tǒng).
類型I(Type I)主要出現(xiàn)在真細(xì)菌中(~31%),除了標(biāo)志基因cas3和共有基因cas1和cas2以外,通常還包括cse1、cse2、cas7、cas5、cas5e等基因.該類型下再分成了6個(gè)亞型(I-A~E).如Escherichia coliK12中的 CRISPR-Cas系統(tǒng)I-E亞型包括8 個(gè)基因(cas1、cas2、cas3、cas5、cas6、cas7、cse1和cse2),14個(gè)部分重復(fù)的回文序列以及13個(gè)間隔序列[48].類型II(Type II)最早在乳酸菌Streptococcus thermophilus中發(fā)現(xiàn),屬于比較簡單的CRISPR-Cas系統(tǒng),即除了共有基因cas1和cas2和標(biāo)志基因cas9之外,包括的其它c(diǎn)as基因比較少,據(jù)此可進(jìn)一步分成2個(gè)亞型.
表1 CRIPSR-Cas系統(tǒng)中編碼的主要蛋白質(zhì)家族的特征Table 1 Characterization of the protein families in CRISPR-Cas system
類型III(Type III)約占已知CRISPR-Cas系統(tǒng)的1/4,其中分布有一些重要的病原細(xì)菌,如Styphylococcus和Mycobacteria;絕大多數(shù)古菌中存在的CRISPR-Cas系統(tǒng)也屬于類型III.類型III通常由較多的基因組成,除了標(biāo)志基因cas10之外,還包括許多編碼RAMP蛋白的基因.根據(jù)cas1的同源性以及擁有的RAMP蛋白編碼基因,可進(jìn)一步分成2個(gè)亞型(III-A和III-B).
表2 CRISPR-Cas系統(tǒng)的分類[47]Table 2 Classification of CRISPR-Cas system
自從2007年R.Barrangou等[16]首次在Streptococcus中用實(shí)驗(yàn)證明了CRISPR-Cas系統(tǒng)的免疫防御功能后,最近幾年在CRISPR-Cas系統(tǒng)作用機(jī)理的研究中取得了極大的進(jìn)展.雖然對(duì)整個(gè)過程中的某些細(xì)節(jié)還有待闡明,但大體上可以將CRISPR-Cas系統(tǒng)的免疫作用機(jī)理分為3步:即獲得間隔序列;crRNA的表達(dá)、加工和成熟;以及免疫干擾.其中,crRNA的加工成熟是闡明CRISPR-Cas系統(tǒng)作用機(jī)理的核心.
3.1 獲得間隔序列間隔序列的獲得是一個(gè)較為保守的過程,包括吸收外源DNA,并插入CRISPR重復(fù)序列中形成一個(gè)新的間隔序列,這一過程又稱為“適應(yīng)”(adaption).在分析環(huán)境樣品的 CRISPR序列時(shí),發(fā)現(xiàn)獲得間隔序列是非?;钴S的[51],說明在自然界中這是一種經(jīng)常發(fā)生的事件.當(dāng)然,在實(shí)驗(yàn)室已經(jīng)證明細(xì)菌確實(shí)能夠從入侵的外源DNA中捕獲間隔序列[16],隨后在E.coli,Pseudomonas aeruginosa,Streptococcus agalactiae,Sulfolobus solfataricus等多種不同的細(xì)菌中也觀察到同樣的現(xiàn)象[52-57].一般認(rèn)為共有基因cas1和cas2編碼產(chǎn)物是獲得間隔序列所必需的,一是因?yàn)檫@2個(gè)基因存在于所有的 CRISPR-Cas類型中;二是在一些CRISPR-Cas系統(tǒng)中敲除cas1或cas2基因后,細(xì)菌不能獲得新的間隔序列[52,54].但是目前對(duì)這一過程的機(jī)制并不了解,如外源DNA序列的識(shí)別、原間隔序列(protospacer)的切割和整合,以及重復(fù)序列的“復(fù)制”等.但通過對(duì)Cas1和Cas2的生化特性和結(jié)構(gòu)等方面的研究可能提供一些線索.Cas1在體外能夠切割核酸,具有內(nèi)切核酸酶活性,如來自于Pseudomonas的Cas1能夠?qū)sDNA切割成80 bp長的小片段[31],但是80 bp遠(yuǎn)大于間隔序列的長度,因此推測可能還有其它組分參與間隔序列的獲得.來自于S.solfataricus的Cas2能切割富含U的RNA[30],但Desulfovibtio culgaris的 Cas2卻不能切割DNA[58],最近發(fā)現(xiàn)來自于Bacillus halodurans的Cas2也能將DNA切割成120 bp長的小片段[59].此外,已有實(shí)驗(yàn)結(jié)果認(rèn)為其它的Cas蛋白,如Csn2也可能參與間隔序列的獲得,一是因?yàn)榍贸齝sn2基因后導(dǎo)致不能獲得間隔序列[16];二是最新的一個(gè)研究表明Csn2蛋白形成一個(gè)環(huán)狀的4聚體,可結(jié)合dsDNA末端,并在dsDNA上滑動(dòng)[60].因此推測Csn2也可能參與識(shí)別原間隔序列和整合,并且類似于雙鏈斷裂的修復(fù).
在對(duì)原間隔序列的分析過程中,發(fā)現(xiàn)在原間隔序列旁側(cè)存在一個(gè)保守的短序列(2-3 nt),稱為PAM(Protospacer-Adjacent Motif),有實(shí)驗(yàn)表明PAM序列可能作為一個(gè)序列信號(hào)用于Cas蛋白對(duì)原間隔序列的識(shí)別,這些實(shí)驗(yàn)證實(shí)原間隔序列在插入CRISPR排列的序列中包括PAM的第3個(gè)核苷酸,同時(shí)成為重復(fù)序列的第一個(gè)核苷酸[53-54,61],也許這是保證原間隔序列精準(zhǔn)插入的一種機(jī)制[62].在捕獲間隔序列的同時(shí),還需要“復(fù)制”產(chǎn)生一個(gè)新的重復(fù)序列單元,一般認(rèn)為靠近前導(dǎo)序列的第一個(gè)重復(fù)序列復(fù)制產(chǎn)生新的重復(fù)序列[61].最近在S.solfutaricus中發(fā)現(xiàn)新的間隔序列可插入在整個(gè)CRISPR排列的內(nèi)部,而不是經(jīng)常觀察到的哪樣,即插入在緊鄰前導(dǎo)序列的5′端[57].綜上所述,CRISPR-Cas系統(tǒng)獲得間隔序列的過程大致如圖2所示,當(dāng)噬菌體的染色體注入細(xì)胞后,Cas蛋白通過PAM信號(hào)識(shí)別原間隔序列(protospacer),然后酶切產(chǎn)生前體間隔序列,最后再整合到CRISPR重復(fù)序列中,其間包括復(fù)制產(chǎn)生一個(gè)新的重復(fù)序列單元.一般認(rèn)為在3種類型的CRISPR-Cas系統(tǒng)中,間隔序列的捕獲過程是相似的,但在一些細(xì)節(jié)上存在一定的差異.
圖2 CRISPR-Cas系統(tǒng)的適應(yīng)示意過程Fig.2 Adaption processing of CRISPR-Cas system
3.2 類型I中crRNA的產(chǎn)生及干擾機(jī)理在免疫防御過程中,首先是CRISPR重復(fù)序列作為一個(gè)遺傳位點(diǎn)在前導(dǎo)序列啟動(dòng)子的驅(qū)動(dòng)下,轉(zhuǎn)錄產(chǎn)生Pre-crRNA(Precursor crRNA),再通過加工、形成成熟的crRNA,成熟的crRNA包括一個(gè)單元的同向重復(fù)序列和間隔序列.然后,crRNA結(jié)合Cas蛋白質(zhì),組成的一個(gè)復(fù)合體,并作用于同源的外源序列,crRNA以形成R-環(huán)(R-loop)的方式侵入靶序列,最后在crRNA的指導(dǎo)下,外源序列被Cas核酸酶降解,即產(chǎn)生所謂的免疫干擾,從而抵御外源DNA(噬菌體、質(zhì)粒)的侵入.由于CRISPR-Cas系統(tǒng)的復(fù)雜和多樣性,這一過程的細(xì)節(jié)和參與的蛋白質(zhì)均有差異.在類型I中,CRISPR首先轉(zhuǎn)錄表達(dá)成pre-crRNA,并通過部分回文對(duì)稱的重復(fù)序列形成莖環(huán)結(jié)構(gòu),然后結(jié)合Cas6蛋白,并在特定位點(diǎn)切割產(chǎn)生形成一個(gè)成熟的crRNA(5′端包括一個(gè)完整單元的間隔序列,3′端為莖環(huán)單元)[63-64].crRNA生成后,仍然結(jié)合在Cas6上,并作為一個(gè)核心,招募其它的Cas蛋白,構(gòu)成一個(gè)稱為Cascade(CRISPR-associated complex for antiviral defense)的復(fù)合體[36].在E.coli(Type I-E)中,Cascade復(fù)合體由5個(gè)蛋白組成CasABCDE[36].這5個(gè)蛋白現(xiàn)在分別稱為 Cse1、Cse2、Cse7、Cas5 和 Cas6,它們?cè)?Cascade復(fù)合體中的組成為1∶2∶6∶1∶1,其中6個(gè)Cse7亞基作為骨架,crRNA負(fù)責(zé)將Cse7組裝成一個(gè)“海馬”狀的核蛋白螺旋,其中Cas6結(jié)合在crRNA的3′端[37,65].共表達(dá)這5個(gè)蛋白質(zhì)以及加上Cas3和一個(gè)人工構(gòu)建的crRNA(互補(bǔ)噬菌體DNA)就能完全保護(hù)E.coli抵御噬菌體λVir的侵染,在平板上不會(huì)形成噬菌斑[36].因此,在類型I中,推測crRNA的切割和加工過程大致如圖3所示.另外,在Sulfolobus solfataricus(I-A)[64]、Thermoproproteus tenax(I-A)[65],Bacillus halodurans(I-C)[66]和Pseudomonas aeruginosa(I-F)[67]等系統(tǒng)中也分離鑒定出一個(gè)類似E.coli(I-E)的Cascade復(fù)合體.當(dāng)然在這些不同的復(fù)合體中,蛋白質(zhì)的組分和比例存在一定的差異,但一般認(rèn)為在類型I中產(chǎn)生crRNA和形成Cascade復(fù)合體的過程和機(jī)理是相似的.
圖3 CRISPR-Cas系統(tǒng)I型crRNA產(chǎn)生與免疫干擾機(jī)理Fig.3 Immune interference mechanism and formation of crRNA in Type I of CRISPR-Cas system
成熟的crRNA指導(dǎo)Cascade復(fù)合體識(shí)別、并作用于外源DNA(噬菌體)中的原間隔序列,并以形成R-環(huán)的方式,入侵靶序列(圖3).在此過程中,原間隔序列中的PAM序列決定Cascade復(fù)合體與原間隔序列的識(shí)別和切割,例如CasA可能參與識(shí)別PAM序列,并以此區(qū)分自身的DNA[70],而且對(duì)PAM的識(shí)別并不依賴于互補(bǔ)配對(duì)[71].此外,間隔序列中的前8個(gè)核苷酸也與最初的識(shí)別有關(guān),這個(gè)序列被稱為“種子”序列(seed sequence)[72].此時(shí),另一個(gè)蛋白Cas3被招募到復(fù)合體中,負(fù)責(zé)切割外源DNA[33-34,73-74].有關(guān)結(jié)構(gòu)和生化分析證明Cas3本身就是一個(gè)核酸酶[33-34].
3.3 類型II中crRNA的產(chǎn)生及干擾機(jī)理類型II只有4個(gè)cas基因,除了共有基因cas1、cas2外,cas9編碼一個(gè)較大的蛋白質(zhì),序列分析表明Cas9蛋白具有核酸酶和RNase H結(jié)構(gòu)域.2011年利用S.pyogenes(II-A)揭示了該類型產(chǎn)生crRNA的過程[75].在差異 RNA-seq中,首先檢測到 PrecrRNA,并用Northern雜交所證實(shí).同時(shí)還檢測到另外一個(gè)RNA,是cas操縱子上游反義鏈的轉(zhuǎn)錄產(chǎn)物,稱為 tracrRNA(trans-activating crRNA).同時(shí)還發(fā)現(xiàn)了這兩個(gè) RNA的剪接產(chǎn)物,75 nt的tracRNA和66 nt的crRNA形成的雜交中間產(chǎn)物存在3′端突起,這是RNase III切割后的一個(gè)典型末端結(jié)構(gòu).利用RNase III基因的突變體確實(shí)也證明RNaseIII是crRNA加工和成熟必需的組分[75].同時(shí),cas9基因的突變體也證實(shí)了cas9參與crRNA的形成[75].因此,在tracrRNA的協(xié)同下,RNase III和Cas9組成了一個(gè)負(fù)責(zé)生成crRNA的簡單結(jié)構(gòu)(圖4).
在類型II中,Cas9與2個(gè)部分互補(bǔ)的RNA形成復(fù)合體,并在RNA的指導(dǎo)下,識(shí)別入侵的外源DNA(這一過程不需要RNase III).這個(gè)RNA/蛋白質(zhì)復(fù)合體與類型I相似,也是通過PAM位點(diǎn)識(shí)別原間隔序列,有實(shí)驗(yàn)表明如果突變PAM,將會(huì)導(dǎo)致入侵的外源 DNA逃逸切割降解[76].此外,Cas9/tracRNA/crRNA這樣的復(fù)合體也能夠在體外,特異切割噬菌體或質(zhì)粒DNA[44,77].因此,這個(gè)系統(tǒng)具有成為發(fā)展基因組編輯技術(shù)的潛力.
3.4 類型III中crRNA的產(chǎn)生及干擾機(jī)理類型III包括兩個(gè)亞型(III-A和III-B),前者主要分布在真細(xì)菌中,包括一些重要的病原菌;后者主要分布在古菌中.類型III包括的cas基因比較多,特別是編碼的RAMP蛋白質(zhì),這些蛋白質(zhì)與Cas10都是類型III所必需的組分.通過Northern雜交,在正常生長條件下的多種細(xì)菌和古菌細(xì)胞中檢測到crRNA,因此認(rèn)為這些CRISPR系統(tǒng)是組成型表達(dá)的[10,25,78].相反,在類型I-E中,似乎CRISPR的表達(dá)受到高度調(diào)控[79-80];或者在暴露于噬菌體下,CRISPR被激活表達(dá)[81].
圖4 CRISPR-Cas系統(tǒng)II型crRNA產(chǎn)生與免疫干擾機(jī)理Fig.4 Immune interference mechanism and formation of crRNA in type II of CRISPR-Cas system
在類型III中,Pre-crRNA的加工需要經(jīng)歷初加工和成熟兩個(gè)階段.Pre-RNA首先在同向重復(fù)序列中切割,產(chǎn)生一個(gè)crRNA中間產(chǎn)物,其兩端具有部分重復(fù)序列,中間為完整的間隔序列.在成熟階段,crRNA中間產(chǎn)物的3′端進(jìn)一步被切割,產(chǎn)生成熟的crRNA.在Styphylococcus epidermidis中(Type III-A),成熟的crRNA長43 bp,少數(shù)為37 bp,負(fù)責(zé)初加工的蛋白質(zhì)可能包括Cas6、Cas10和Csm4,但具體的作用還不清楚[17,82].在古菌P.furiosus(Type III-B)中,重復(fù)序列不是部分回文對(duì)稱的,很多實(shí)驗(yàn)證據(jù)認(rèn)為也是Cas6負(fù)責(zé)類型III中PrecrRNA的初加工,但是作用機(jī)制與類型I不同,Pre-crRNA結(jié)合“纏繞”在 Cas6蛋白質(zhì)的表面(圖5),然后在重復(fù)序列內(nèi)部切割pre-crRNA,產(chǎn)生66~72 bp長的中間產(chǎn)物,中間產(chǎn)物將進(jìn)一步在3′端縮短(負(fù)責(zé)的核酸酶不清楚),最后產(chǎn)生成熟的crRNA,其中在間隔序列的5′端保留8 nt的保守重復(fù)序列[83-85].此外,Cas6的催化特性以及與crRNA的共結(jié)構(gòu)也揭示了Cas6是一個(gè)典型的核酸酶,并分別具有獨(dú)立的DNA結(jié)合功能域和催化功能域[86].
類型III-A/B在干擾過程中作用的目標(biāo)不同.在S.epidermidis(Type III-A)中,能夠依賴間隔序列spc-1和spc-2分別抵御質(zhì)粒的接合轉(zhuǎn)移和噬菌體的入侵,并且入侵DNA中與間隔序列同源的序列(proto-spacer DNA)是類型III-A作用的靶點(diǎn)[17,82],但識(shí)別入侵DNA主要通過成熟crRNA與原間隔序列的互補(bǔ)配對(duì)[82],而不像類型I/II,這種識(shí)別依賴于PAM序列[70-71,76].目前還不清楚哪些Cas蛋白質(zhì)參與了這一過程.
圖5 CRISPR-Cas系統(tǒng)I型crRNA產(chǎn)生與免疫干擾機(jī)理Fig.5 Immune interference mechanism and formation of crRNA in type III of CRISPR-Cas system
已有的實(shí)驗(yàn)證據(jù)顯示III-B類型在干擾時(shí),作用的目標(biāo)是RNA分子,這與其它所有的CRISPRCas系統(tǒng)都不相同.在古菌P.furiosus(III-B)中,2009年C.R.Hale等[87]利用質(zhì)譜技術(shù)從分離的復(fù)合體中鑒定出Cas10、Cmr5和幾個(gè)RAMP蛋白質(zhì)(Cmr1、Cmr3、Cmr4 和 Cmr6),而且純化的 Cmr復(fù)合體只能離體切割crRNA反義的單鏈的RNA,且位點(diǎn)是特異的;但不能切割任何 dsRNA或DNA[87-88].在另一個(gè)屬于類型III-B的S.solfataricus中,也鑒定出一個(gè)包括7個(gè)Cas蛋白的復(fù)合體,在crRNA的指導(dǎo)下也只能切割RNA,但這種活性依賴于成熟 crRNA分子5′端 8 nt的重復(fù)序列[89].此外,雖然Cas10是類型III的標(biāo)志蛋白,但根據(jù)Cmr復(fù)合體的結(jié)構(gòu)組成,認(rèn)為Cas10不參與靶RNA的切割,只是復(fù)合體中的一個(gè)結(jié)構(gòu)蛋白質(zhì)[85].綜上所述,在類型III中,crRNA的加工成熟以及免疫干擾作用可歸納見圖5.
由于CRISPR-Cas系統(tǒng)的生物學(xué)功能以及重復(fù)序列的多樣性和動(dòng)態(tài)特性,CRISPR系統(tǒng)在原核的遺傳學(xué)研究、抗病毒和生物技術(shù)等領(lǐng)域獲得了廣泛的應(yīng)用.首先CRISPR-Cas系統(tǒng)的原始功能主要是防御噬菌體等外源入侵的移動(dòng)元件.鑒于CRISPR-Cas適應(yīng)功能,理論上可以通過將細(xì)菌菌株“暴露”于天然的噬菌體或通過基因工程技術(shù),將小片段的病毒原間隔序列整合到CRIPSR的重復(fù)序列中,從而賦予細(xì)胞獲得相應(yīng)的免疫功能.這對(duì)于一些工業(yè)發(fā)酵菌株仍然具有一定的實(shí)際意義,即基于CRISPR的適應(yīng)系統(tǒng)構(gòu)建抗噬菌體的工業(yè)菌株,例如有人提出了所謂的“CRISPerization”策略(國際專利WO/2008/108989),以此篩選噬菌體的拮抗菌株.
其次,CRISPR重復(fù)序列具有廣泛的多樣性和動(dòng)態(tài)特征,因此有研究者利用CRISPR排列及重復(fù)序列進(jìn)行細(xì)菌的基因分型(genotyping).如1993年利用CRISPR中的同向重復(fù)序列對(duì)病原菌Mycobacterium tuberculosis進(jìn)行分型[90],而且數(shù)字化后用以監(jiān)控M.tuberculosis的臨床流行學(xué)[91].基于同樣的原理,測序分析環(huán)境樣品中的CRISPR重復(fù)序列,可以用來監(jiān)控自然界中原核細(xì)菌及其動(dòng)態(tài)變化情況[92].另一方面,由于CRISPR排列中的間隔序列來自于噬菌體,并且借助于DNA二代測序技術(shù),可以獲得許多細(xì)菌或菌株,甚至環(huán)境樣品中海量的CRISPR序列信息,可以很方便地用以分析研究原核世界或自然生境中細(xì)菌與噬菌體病毒之間的進(jìn)化、相互作用及其生態(tài)適應(yīng)等[93-94].
最后,由于CRISPR-Cas系統(tǒng)中,一些Cas蛋白具有DNA或RNA特異的切割特性,并能將外源DNA(原間隔序列)插入到基因組的CRISPR重復(fù)序列中.特別是類型II編碼的Cas9蛋白質(zhì),在特定RNA的指導(dǎo)下能夠特異切割DNA[44,95].因此,基于CRISPR-Cas系統(tǒng)有望發(fā)展新的基因組編輯技術(shù),可用于細(xì)胞內(nèi)基因組的操作,如插入、替換基因組中特定序列[44].正如預(yù)期的哪樣,在2013年初,幾個(gè)獨(dú)立的研究小組分別在《Science》、《Nature Biotechnolgy》等雜志上發(fā)表研究成果,利用CRISPRCas系統(tǒng)(Cas9)在哺乳等細(xì)胞中成功地實(shí)現(xiàn)了基因組的靶向編輯[96-100],預(yù)示著這項(xiàng)新技術(shù)可能成為“精確”操縱基因組的一種非常強(qiáng)大的工具.
在CRISPR-Cas系統(tǒng)的類型II中,已有的研究顯示Cas9蛋白在RNA的指導(dǎo)下,能夠特異切割核酸[44,95].根據(jù)這樣的原理,只需通過簡單的構(gòu)建,即將cas9基因和針對(duì)基因組靶序列設(shè)計(jì)的編碼“crRNA”的基因一起共轉(zhuǎn)化受體細(xì)胞,然后通過RNA定向靶基因序列,并指導(dǎo)Cas9在特異位點(diǎn)切割靶序列,最后依靠細(xì)胞內(nèi)的DNA修復(fù)功能,即可實(shí)現(xiàn)在特定靶位點(diǎn)對(duì)基因組DNA進(jìn)行修飾,其原理見圖6.例如,2013年哈佛醫(yī)學(xué)院的 P.Mali等[96]依據(jù)這樣的原理,針對(duì)哺乳動(dòng)物細(xì)胞,構(gòu)建了一個(gè)優(yōu)化的cas9基因表達(dá)單元,且在cas9基因的3′端融合了一個(gè)核定位序列(NLS);同時(shí)設(shè)計(jì)了一個(gè)類似 CRISPR-Cas系統(tǒng)類型 II中的 crRNA/tracrRNA融合基因(稱為gRNA,guide RNA),并置于真核U6啟動(dòng)子下;然后轉(zhuǎn)化T293和K562細(xì)胞系.結(jié)果表明對(duì)基因組靶基因的定點(diǎn)修飾率在兩種細(xì)胞中分別達(dá)到了10%~25%和8%~13%.其中,PAM位點(diǎn)是實(shí)現(xiàn)定點(diǎn)編輯所必需的,因此在選擇靶序列時(shí),需要靶序列至少包括部分PAM序列(圖6).隨后,這一技術(shù)和方法迅速發(fā)展,并應(yīng)用于不同的生物種類,如細(xì)菌、酵母菌、植物、線蟲、果蠅、斑馬魚和小鼠等[101-106],在基因組的定向編輯方面展現(xiàn)出了巨大的應(yīng)用潛力.對(duì)于果蠅和斑馬魚等動(dòng)物的胚胎細(xì)胞[107-108],甚至可以直接將cas9體外轉(zhuǎn)錄的mRNA和gRNA混合物注射胚胎細(xì)胞,結(jié)果表明在果蠅實(shí)驗(yàn)中,有88%的胚胎細(xì)胞獲得定點(diǎn)修飾,而且這些突變系能夠轉(zhuǎn)化為穩(wěn)定的突變體.這種方法的優(yōu)點(diǎn)是在細(xì)胞內(nèi)不會(huì)殘留“污染DNA”.
此外,Cas9/gRNA編輯技術(shù)可以很容易進(jìn)行多點(diǎn)突變或大尺度基因組修飾,理論上可以針對(duì)多個(gè)靶位點(diǎn)序列設(shè)計(jì)一組gRNA,將其串聯(lián)表達(dá),轉(zhuǎn)化細(xì)胞后,即可在設(shè)計(jì)的靶位點(diǎn)指導(dǎo)Cas9切割修飾基因組.如2013年H.Wang等[109]同時(shí)用編碼Cas9的mRNA和針對(duì)5個(gè)靶位點(diǎn)的gRNA混合物,注射小鼠胚胎干細(xì)胞獲得了高效的基因組編輯;進(jìn)一步將兩種gRNA注射胚胎細(xì)胞,結(jié)果顯示獲得大多數(shù)小鼠(80%)都同時(shí)在兩個(gè)位點(diǎn)實(shí)現(xiàn)了基因修飾;另外,在注射gRNA的同時(shí),加入突變寡核苷酸,發(fā)現(xiàn)能夠產(chǎn)生精確的定點(diǎn)突變.Cas9/gRNA基因編輯技術(shù)也能創(chuàng)造缺失突變[98],甚至大片段的缺失[110].如在小鼠中,W.Fujii等[110](2013)在需要缺失的靶序列的兩端分別設(shè)計(jì)2個(gè)gRNA,然后注射胚胎細(xì)胞,結(jié)果表明能夠造成這2個(gè)靶位點(diǎn)之間的基因組序列丟失,而且缺失的序列超過10 kb.
目前,Cas9/gRNA基因組編輯通過干擾目標(biāo)基因,還能用于基因表達(dá)調(diào)控的研究.這項(xiàng)發(fā)展主要是利用一個(gè)核酸酶失活、但保留了DNA結(jié)合特性的Cas9突變體.將突變體基因與gRNA一起轉(zhuǎn)化E.coli,Cas9突變蛋白質(zhì)在gRNA的指導(dǎo)下結(jié)合靶序列,如果是啟動(dòng)子區(qū)域則阻止RNA聚合酶對(duì)啟動(dòng)子的識(shí)別和結(jié)合,從而降低靶基因的轉(zhuǎn)錄[111-112].基于同樣的設(shè)計(jì),2013年L.A.Gilbert等[113]在真核中利用同樣的失活突變體,進(jìn)一步與特定的效應(yīng)蛋白質(zhì)融合表達(dá),在gRNA的指導(dǎo)下可以通過效應(yīng)蛋白質(zhì)調(diào)控真核基因的轉(zhuǎn)錄表達(dá),而且作用非常專一.這些研究事實(shí)上建立了一個(gè)基于Cas9/gRNA的DNA結(jié)合平臺(tái),根據(jù)融合的效應(yīng)蛋白基因,可以在特定的基因位點(diǎn)招募或阻止蛋白質(zhì),從而干擾靶基因的表達(dá),作者將此作用稱為CRISPR干擾(CRISPRi)[111].也有人利用Cas9/gRNA技術(shù),期望編輯細(xì)胞內(nèi)的HIV基因組、并阻止病毒基因的表達(dá),以此探索HIV等傳染性疾病治療的新途徑[114].
圖6 基于Cas9/gRNA的基組編輯技術(shù)[96]Fig.6 Genomic editing technology based on Cas9
基于Cas9/gRNA的基因組編輯技術(shù)正處于發(fā)展初期,還需要完善以及進(jìn)一步拓展應(yīng)用范圍.通常采用圖6所示的策略,在gRNA的指導(dǎo)下,利用Cas9特異切割雙鏈靶序列,然后依靠細(xì)胞的非同源末端的連接(NHEJ)的機(jī)制修復(fù)切點(diǎn),并導(dǎo)致靶序列被修改.由于Cas9能夠“忍耐”gRNA與靶序列之間的錯(cuò)配,因此可能會(huì)導(dǎo)致脫靶,在非靶位點(diǎn)產(chǎn)生造成不需要的突變.已經(jīng)在一些實(shí)驗(yàn)中觀察到這種現(xiàn)象[98,115-116],甚至產(chǎn)生較高的脫靶率[117-118].雖然有研究發(fā)現(xiàn)利用較長的gRNA,可以降低脫靶率[110];但也有相反的研究結(jié)果,認(rèn)為較短的但活性較低的 gRNA可能提高靶向性[118].此外,降低Cas9/gRNA的表達(dá)量也有利于提高靶向性[110,116,118].因此,在利用Cas9/gRNA進(jìn)行基因組編輯時(shí),必須在“活性”和特異性之間找到平衡,降低脫靶率成為Cas9編輯技術(shù)需要解決的問題.最近的一個(gè)研究利用Cas9的切口酶(nickase)突變體,通過設(shè)計(jì)2個(gè)gRNA,分別對(duì)應(yīng)靶序列的互補(bǔ)鏈,這樣可利用Cas9的切口酶活性,分別在靶序列的互補(bǔ)鏈上產(chǎn)生單鏈切口,然后通過同源重組的修復(fù),結(jié)果發(fā)現(xiàn)能夠極大地降低脫靶率50~1 500倍[119].脫靶率是所有基因組編輯技術(shù)所面臨的主要問題之一,但是目前關(guān)于Cas9核酸酶的生化性質(zhì)了解很少;并且Cas9的切割特異性還取決于gRNA以及與靶序列的互補(bǔ)配對(duì),因此尋找更多來源的Cas9[120],或直接采用蛋白質(zhì)工程改變Cas9的核酸酶活性[119]、或者提高特異性也是將來在優(yōu)化完善Cas9編輯技術(shù)值得嘗試的研究課題.
CRISPR-Cas系統(tǒng)是一些細(xì)菌和古菌進(jìn)化出來的一種適應(yīng)型的免疫機(jī)制,用以抵御外來病毒、質(zhì)粒等移動(dòng)元件的入侵.這是繼限制修飾系統(tǒng)、非特異核酸酶等后,在原核細(xì)菌中發(fā)現(xiàn)的又一種新的機(jī)制.除此之外,也有研究證明這個(gè)系統(tǒng)在某些細(xì)菌中還扮演其它的作用.例如,在條件致病菌Pseudononas aeruginosa中,已有實(shí)驗(yàn)證明了CRISPR-Cas系統(tǒng)調(diào)控生物膜的形成[121-122].另一個(gè)例子來自于粘細(xì)菌Myxococcus xanthus,當(dāng)一個(gè)CRISPR位點(diǎn)在轉(zhuǎn)座子插入突變后,細(xì)胞不能聚集并發(fā)育形成子實(shí)體,表明 CRISPR與粘細(xì)菌的發(fā)育有關(guān)[123-124].還有研究發(fā)現(xiàn)Cas1參與DNA修復(fù),如2011年M.Babu等[125]發(fā)現(xiàn)純化的雙鏈斷裂修復(fù)酶RecBCD中包括Cas1,而且敲除Cas1后的E.coli細(xì)胞對(duì)UV和絲裂霉素(mitomycin)更為敏感.
目前,雖然對(duì)CRISPR-Cas系統(tǒng)的功能和作用機(jī)理以及參與的蛋白質(zhì)等諸多方面的研究取得了極大的進(jìn)展;而且基于CRISPR-Cas系統(tǒng)Cas9發(fā)展起來的基因組編輯技術(shù)也顯示出了巨大的潛力,可能成為“精確”操縱基因組的一種革命性的技術(shù)[126].但是也要看到,有關(guān)CRISPR-Cas系統(tǒng)免疫功能、組織結(jié)構(gòu)的多樣性以及作用機(jī)理的了解仍然還非常有限,許多過程中的一些細(xì)節(jié)依然不太清楚.例如:Cas1/Cas2等蛋白在間隔序列獲得的過程中如何發(fā)揮作用?CRISPR-Cas怎樣區(qū)別自身和外來的DNA?免疫作用與其它功能之間的聯(lián)系和進(jìn)化有何關(guān)系?這些問題必將隨著研究的深入和發(fā)展逐漸明了.
[1]Ishino Y,Shinagawa H,Makino K,et al.Nucleotide-sequence of theIapgene responsible for alkaline-phosphatase isozyme conversion inEscherichia coliand identification of the gene product[J].J Bacteriol,1987,169:5429-5433.
[2]Nakata A,Amemura M,Makino K.Unusual nucleotide arrangement with repeated sequences in theEscherichia coliK-12 chromosome[J].J Bacteriol,1989,171:3553-3556.
[3]Groenen P M,Bunschoten A E,van Soolingen D,et al.Nature of DNA polymorphism in the direct repeat cluster ofMycobacterium tuberculosis;application for strain differentiation by a novel typing method[J].Mol Microbiol,1993,10:1057-1065.
[4]Mojica F J M,Juez G,Rodríguez-Valera F.Transcription at different salinities ofHaloferax mediterraneisequences adjacent to partially modifiedPstI sites[J].Mol Microbiol,1993,9:613-621.
[5]Mojica F J M,Ferrer C,Juez G,et al.Long stretches of short tandem repeats are present in the largest replicons of the archaeaHaloferax mediterraneiandHaloferax volcaniiand could be involved in replicon partitioning[J].Mol Microbiol,1995,17:85-93.
[6]Jansen R,van Embden J D,Gaastra W,et al.Identification of genes that are associated with DNA repeats in prokaryotes[J].Mol Microbiol,2002,43:1565-1575.
[7]Jansen R,van Embden J D,Gaastra W,et al.Identification of a novel family of sequence repeats among prokaryotes[J].OMICS,2002,6:23-33.
[8]Lillest?l R K,Redder P,Garrett RA,et al.A putative viral defence mechanism in archaeal cells[J].Archaea,2006,2:59-72.
[9]Tang T H,Bachellerie J P,Rozhdestvensky T,et al.Identification of 86 candidates for small non-messenger RNAs from the archaeonArchaeoglobus fulgidus[J].Proc Natl Acad Sci USA,2002,99:7536-7541.
[10]Tang T H,Polacek N,Zywicki M,et al.Identification of novel non-coding RNAs as potential antisense regulators in the archaeonSulfolobus solfataricus[J].Mol Microbiol,2005,55:469-481.
[11]Makarova K S,Aravind L,Grishin N V,et al.A DNA repair system specific for thermophilic Archaea and bacteria predicted by genomic context analysis[J].Nucleic Acids Res,2002,30:482-496.
[12]Haft D H,Selengut J,Mongodin E F,et al.A guild of 45 CRISPR-associated(Cas)protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes[J].PLoS Comput Biol,205,1:474-483.
[13]Mojica F J M,Díez-Villase?or C,García-Martínez J,et al.Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements[J].J Mol Evol,2005,60:174-182.
[14]Bolotin A,Quinquis B,Sorokin A,et al.Clustered regularly interspaced short palindrome repeats(CRISPRs)have spacers of extrachromosomal origin[J].Microbiol,2005,151:2551-2561.
[15]Pourcel C,Salvignol G,Vergnaud G.CRISPR elements inYersinia pestisacquire new repeats by preferential uptake of bacteriophage DNA and provide additional tools for evolutionary studies[J].Microbiol,2005,151:653-663.
[16]Barrangou R,Fremaux C,Deveau H,et al.CRISPR provides acquired resistance against viruses in prokaryotes[J].Science,2007,315:1709-1712.
[17]Marraffini L A,Sontheimer E J.CRISPR interference limits horizontal gene transfer inStaphylococciby targeting DNA[J].Science,2008,322:1843-1845.
[18]Grissa I,Vergnaud G,Pourcel C.The CRISPRdb database and tools to display CRISPRs and to generate dictionaries of spacers and repeats[J].BMC Bioinf,2007,8:172.
[19]Rousseau C,Nicolas J,Gonnet M.CRISPI:a CRISPR interactive database[J].Bioinformatics,2009,25:3317-3318.
[20]Bland C,Ramsey T L,Sabree F,et al.CRISPR Recognition Tool(CRT):a tool for automatic detection of clustered regularly interspaced palindromic repeats[J].BMC Bioinformatics,2007,8:209.
[21]Skennerton C T,Imelfort M,Tyson G W.Crass:identification and reconstruction of CRISPR from unassembled metagenomic data[J].Nucleic Acids Res,2013,41:e105.
[22]Berg Miller M E,Yeoman C J,Chia N,et al.Phage-bacteria relationships and CRISPR elements revealed by a metagenomic survey of the rumen microbiome[J].Environ Microbiol,2012,14:207-227.
[23]Willner D,Thurber R V,Rohwer F.Metagenomic signatures of 86 microbial and viral metagenomes[J].Environ Microbiol,2009,11:1752-1766.
[24]Lillest?l R K,Shah S A,Brügger K,et al.CRISPR families of the crenarchaeal genusSulfolobus:bidirectional transcription and dynamic properties[J].Mol Microbiol,2009,72:259-272.
[25]Deng L,Kenchappa C S,Peng X,et al.Modulation of CRISPR locus transcription by the repeat-binding protein Cbp1 inSulfolobus[J].Nucleic Acids Res,2012,40:2470-2480.
[26]Agari Y,Sakamoto K,Tamakoshi M,et al.Transcription profile of Thermus thermophilus CRISPR systems after phage infection[J].J Mol Biol,2009,395:270-281.
[27]Kunin V,Sorek R,Hugenholtz P.Evolutionary conservation of sequence and secondary structures in CRISPR repeats[J].Genome Biol,2007,8:R61.
[28]Godde J S,Bickerton A.The repetitive DNA elements called CRISPRs and their associated genes:evidence of horizontal transfer among prokaryotes[J].J Mol Evol,2006,62:718-729.
[29]Chakraborty S,Snijders A P,Chakravorty R,et al.Comparative network clustering of direct repeats(DRs)and cas genes confirms the possibility of the horizontal transfer of CRISPR locus among bacteria[J].Mol Phylogenet Evol,2010,56:878-887.
[30]Han D,Lehmann K,Krauss G.SSO1450-a CAS1 protein fromSulfolobus solfataricusP2 with high affinity for RNA and DNA[J].FEBS Lett,2009,583:1928-1932.
[31]Wiedenheft B,Zhou K,Jinek M,et al.Structural basis for DNase activity of a conserved protein implicated in CRISPR-mediated genome defense[J].Structure,2009,17:904-912.
[32]Beloglazova N,Brown G,Zimmerman MD,et al.A novel family of sequence-specific endoribonucleases associated with the clustered regularly interspaced short palindromic repeats[J].J Biol Chem,2008,283:20361-20371.
[33]Beloglazova N,Petit P,Flick R,et al.Structure and activity of the Cas3 HD nuclease MJ0384,an effector enzyme of the CRISPR interference[J].EMBO J,2011,30:4616-4627.
[34]Sinkunas T,Gasiunas G,Fremaux C,et al.Cas3 is a single stranded DNA nuclease and ATP-dependent helicase in the CRISPR/Cas immune system[J].EMBO J,2011,30:1335-1342.
[35]Zhang J,Kasciukovic T,White M F.The CRISPR associated protein Cas4 is a 59 to 39 DNA exonuclease with an iron-sulfur cluster[J].PLoS ONE,2013,7:e4723.
[36]Brouns S J,Jore M M,Lundgren M,et al.Small CRISPR RNAs guide antiviral defense in prokaryotes[J].Science,2008,321:960-964.
[37]Jore M M,Lundgren M,van Duijn E,et al.Structural basis for CRISPR RNA-guided DNA recognition by Cascade[J].Nat Struct Mol Biol,2011,18:529-536.
[38]Hale C R,Zhao P,Olson S,et al.RNAguided RNA cleavage by a CRISPR RNA-Cas protein complex[J].Cell,2009,139:945-956.
[39]Haurwitz R E,Jinek M,Wiedenheft B,et al.Sequence-and structure specific RNA processing by a CRISPR endonuclease[J].Science,2010,329:1355-1358.
[40]Reeks J,Sokolowski R D,Graham S,et al.Structure of a dimeric crenarchaeal Cas6 enzyme with an atypical active site for CRISPR RNA processing[J].Biochem J,2013,452:223-230.
[41]Wang R,Preamplume G,Terns M P,et al.Interaction of the Cas6 riboendonuclease with CRISPR RNAs:recognition and cleavage[J].Structure,2011,19:257-264.
[42]Sashital D G,Wiedenheft B,Doudna J A.Mechanism of foreign DNA selection in a bacterial adaptive immune system[J].Mol Cell,2012,46:606-615.
[43]Sapranauskas R,Gasiunas G,Fremaux C,et al.TheStreptococcus thermophilusCRISPR/Cas system provides immunity inEscherichia coli[J].Nucleic Acids Res,2011,39:9275-9282.
[44]Jinek M,Chylinski K,Fonfara I,et al.A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity[J].Science,2012,337:816-821.
[45]Garneau J E,Dupuis M E,Villion M,et al.The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA[J].Nature,2010,468:67-71.
[46]Hale C R,Zhao P,Olson S,et al.RNAguided RNA cleavage by a CRISPR RNA-Cas protein complex[J].Cell,2009,139:945-956.
[47]Han D,Krauss G.Characterization of the endonuclease SSO2001 fromSulfolobus solfataricusP2[J].FEBS Lett,2009,583:771-776.
[48]Makarova K S,Haft D H,Barrangou R,et al.Evolution and classification of the CRISPR-Cas systems[J].Nature Rev Microbiol,2011,9:467-477.
[49]Wiedenheft B,Sternberg S H,Doudna J A.RNA-guided genetic silencing systems in bacteria and archaea[J].Nature,2012,482:331-338.
[50]Bhaya D,Davison M,Barrangou R.CRISPR-Cas systems in bacteria and archaea:versatile small RNAs for adaptive defense and regulation[J].Annu Rev Genet,2011,45:273-297.
[51]Tyson G W,Banfield J F.Rapidly evolving CRISPRs implicated in acquired resistance of microorganisms to viruses[J].Environ Microbiol,2008,10:200-207.
[52]Yosef I,Goren M G,Qimron U.Proteins and DNA elements essential for the CRISPR adaptation process inEscherichia coli[J].Nucleic Acids Res,2012,40:5569-5576.
[53]Swarts D C,Mosterd C,van Passel M W,et al.CRISPR interference directs strand specific spacer acquisition[J].PLoS One,2012,7:e35888.
[54]Datsenko K A.Pougach K,Tikhonov A,et al.Molecular memory of prior infections activates the CRISPR/Cas adaptive bacterial immunity system[J].Nat Commun,2012,3:945.
[55]Cady K C,Bondy-Denomy J,Heussler G E,et al.The CRISPR/Cas adaptive immune system ofPseudomonas aeruginosamediates resistance to naturally occurring and engineered phages[J].J Bacteriol,2012,194:5728-5738.
[56]Lopez-Sanchez M J,Sauvage E,Da Cunha V,et al.The highly dynamic CRISPR1 system ofStreptococcus agalactiaecontrols the diversity of its mobilome[J].Mol Microbiol,2012,85:1057-1071.
[57]Erdmann S,Garrett R A.Selective and hyperactive uptake of foreign DNA by adaptive immune systems of an archaeon via two distinct mechanisms[J].Mol Microbiol,2012,85:1044-1056.
[58]Samai P,Smith P,Shuman S.Structure of a CRISPR-associated protein Cas2 fromDesulfovibrio vulgaris[J].Acta Crystallogr F Struct Biol Cryst Commun,2010,66:1552-1556.
[59]Nam K H,Ding F,Haitjema C,et al.Double-stranded endonuclease activity inBacillus haloduransclustered regularly interspaced short palindromic repeats(CRISPR)-associated Cas2 protein[J].J Biol Chem,2012,287:35943-35952.
[60]Arslan Z,Wurm R,Brener O,et al.Double-strand DNA end-binding and sliding of the toroidal CRISPR-associated protein Csn2[J].Nucleic Acids Res,2013,doi:10.1093/nar/gkt315.
[61]Goren M G,Yosef I,Auster O,et al.Experimental definition of a clustered regularly interspaced short palindromic duplication inEscherichia coli[J].J Mol Biol,2012,423:14-16.
[62]Westra E R,Brouns S J.The rise and fall of CRISPRs-Dynamics of spacer acquisition and loss[J].Mol Microbiol,2012,85:1021-1025.
[63]Wiedenheft B,Lander G C,Zhou K,et al.Structures of the RNA-guided surveillance complex from a bacterial immune system[J].Nature,2011,477:486-489.
[64]Lintner N G,Frankel K A,Tsutakawa S E,et al.The structure of the CRISPR-associated protein Csa3 provides insight into the regulation of the CRISPR/Cas system[J].J Mol Biol,2011,405:939-955.
[65]Plagens A,Tjaden B,Hagemann A,et al.Characterization of the CRISPR/Cas subtype I-A system of the hyperthermophilic crenarchaeonThermoproteus tenax[J].J Bacteriol,2012,194:2491-2500.
[66]Nam K H,Haitjema C,Liu X,et al.Cas5d protein processes pre-crRNA and assembles into a Cascade-like interference complex in subtype I-C/Dvulg CRISPR-Cas System[J].Structure,2012,20:1574-1584.
[67]Haurwitz R E,Jinek M,Wiedenheft B,et al.Sequence-and structure-specific RNA processing by a CRISPR endonuclease[J].Science,2010,329:1355-1358.
[68]Sternberg S H,Haurwitz R E,Doudna J A.Mechanism of substrate selection by a highly specific CRISPR endoribonuclease[J].RNA,2012,18:661-672.
[69]Haurwitz R E,Sternberg S H,Doudna J A.Csy4 relies on an unusual catalytic dyad to position and cleave CRISPR RNA[J].EMBO J,2012,31:2824-2832.
[70]Sashital D G,Wiedenheft B,Doudna J A.Mechanism of foreign DNA selection in a bacterial adaptive immune system[J].Mol Cell,2012,46:606-615.
[71]Westra E R,Semenova E,Datsenko K A,et al.Type I-E CRISPR-Cas systems discriminate target from non-target DNA through base pairing-independent PAM recognition[J].PLoS Genet,2013,9:e1003742.
[72]Semenova E,Jore M M,Datsenko K A,et al.Interference by clustered regularly interspaced short palindromic repeat(CRISPR)RNA is governed by a seed sequence[J].Proc Natl Acad Sci USA,2011,108:10098-10103.
[73]Westra E R,van Erp P B,Kunne T,et al.CRISPR immunity relies on the consecutive binding and degradation of negatively supercoiled invader DNA by Cascade and Cas3[J].Mol Cell,2012,46:595-605.
[74]Howard J A,Delmas S,Ivancic-Bace I,et al.Helicase dissociation and annealing of RNA-DNA hybrids byEscherichia coliCas3 protein[J].Biochem J,2011,439:85-95.
[75]Deltcheva E,Chylinski K,Sharma C M,et al.CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III[J].Nature,2011,471:602-607.
[76]Garneau J E,Dupuis M E,Villion M,et al.The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA[J].Nature,2010,468:67-71.
[77]Deveau H,Barrangou R,Garneau J E,et al.Phage response to CRISPR-encoded resistance inStreptococcus thermophilus[J].J Bacteriol,2008,190:1390-1400.
[78]Gudbergsdottir S,Deng L,Chen Z,et al.Dynamic properties of theSulfolobusCRISPR/Cas and CRISPR/Cmr systems when challenged with vector-borne viral and plasmid genes and protospacers[J].Mol Microbiol,2011,79:35-49.
[79]Westra E R,Pul ü,Heidrich N,et al.H-NS-mediated repression of CRISPR-based immunity inEscherichia coliK12 can be relieved by the transcription activator LeuO[J].Mol Microbiol,2010,77:1380-1393.
[80]Mojica F J,Díez-Villase?or C.The on-off switch of CRISPR immunity against phages inEscherichia coli[J].Mol Microbiol,2010,77:1341-13.
[81]Agari Y,Sakamoto K,Tamakoshi M,et al.Transcription profile of thermos thermophilus CRISPR systems after phage infection[J].J Mol Biol,2010,395:270-281.
[82]Hatoum-Aslan A,Maniv I,Marraffini L A.Mature clustered,regularly interspaced,short palindromic repeats RNA(crRNA)length is measured by q rule mechanism anchored at the precursor processing site[J].Proc Natl Acad Sci USA,2011,108:21218-21222.
[83]Carte J,Wang R,Li H,et al.Cas6 is an endoribonuclease that generates guide RNAs for invader defense in prokaryotes[J].Genes Dev,2008,22:3489-3496.
[84]Carte J,Pfister N T,Compton M M,et al.Binding and cleavage of CRISPR RNA by Cas6[J].RNA,2010,16:2181-2188.
[85]Shao Y,Li H.Recognition and cleavage of a nonstructured CRISPR RNA by its processing endoribonuclease Cas6[J].Structure,2013,21:385-393.
[86]Wang R,Preamplume G,Terns M P,et al.Interaction of the Cas6 riboendonuclease with CRISPR RNAs:recognition and cleavage[J].Structure,2011,19:257-264.
[87]Hale C R,Zhao P,Olson S,et al.RNA-guided RNA cleavage by a CRISPR RNA-Cas protein complex[J].Cell,2009,139:945-956.
[88]Hale C R,Majumdar S,Elmore J,et al.Essential features and rational design of CRISPR RNAs that function with the Cas RAMP module complex to cleave RNAs[J].Mol Cell,2012,45:292-302.
[89]Zhang J,Rouillon C,Kerou M,et al.Structure and mechanism of the CMR complex for CRISPR-mediated antiviral immunity[J].Mol Cell,2012,45:303-313.
[90]Groenen P M,Bunschoten A E,van Soolingen D,et al.Nature of DNA polymorphism in the direct repeat cluster ofMycobacterium tuberculosis;application for strain differentiation by a novel typing method[J].Mol Microbiol,1993,10:1057-1065.
[91]Brudey K,Driscoll J R,Rigouts L,et al.Mycobacterium tuberculosiscomplex genetic diversity:mining the fourth international spoligotyping database(SpolDB4)for classification,population genetics and epidemiology[J].BMC Microbiol,2006,6:23.
[92]Snyder J C,Bateson M M,Lavin M,et al.Use of cellular CRISPR(clusters of regularly interspaced short palindromic repeats)spacer-based microarrays for detection of viruses in environmental samples[J].Appl Environ Microbiol,2010,76:7251-7258.
[93]Garcia-Heredia I,Martin-Cuadrado A B,Mojica FJ,et al.Reconstructing viral genomes from the environment using fosmid clones:the case of haloviruses[J].PLoS One,2012,7:e33802.
[94]Pride D T,Salzman J,Relman D A.Comparisons of clustered regularly interspaced short palindromic repeats and viromes in human saliva reveal bacterial adaptations to salivary viruses[J].Environ Microbiol,2012,14:2564-2576.
[95]Barrangou R.RNA-mediated programmable DNA cleavage[J].Nat Biotechnol,2012,30:836-838.
[96]Mali P,Yang L,Esvelt K M,et al.RNA-guided human genome engineering via Cas9[J].Science,2013,339:823-826.
[97]Cong L,Ran F A,Cox D,et al.Multiplex genome engineering using CRISPR/Cas systems[J].Science,2013,339:819-823.
[98]Jiang W,Bikard D,Cox D,et al.RNA-guided editing of bacterial genomes using CRISPR-Cas systems[J].Nat Biotechnol,2013,31:233-239.
[99]Hwang W Y,Fu Y,Reyon D,et al.Efficient genome editing in zebrafish using a CRISPR-Cas system[J].Nat Biotechnol,2013,31:227-229.
[100]Shen B,Zhang J,Wu H,et al.Generation of gene-modified mice via Cas9/RNA-mediated gene targeting[J].Cell Res,2013,23:720-723.
[101]Cho S W,Kim S,Kim J M,et al.Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease[J].Nat Biotechnol,2013,31:230-232.
[102]Gratz S J,Cummings A M,Nguyen J N,et al.Genome engineering of Drosophila with the CRISPR RNA-guided Cas9 nuclease[J].Genetics,2013,194:1029-1035.
[103]Xiao A,Wang Z,Hu Y,et al.Chromosomal deletions and inversions mediated by TALENs and CRISPR/Cas in zebrafish[J].Nucleic Acids Res,2013,41:e141.
[104]Di Carlo J E,Norville J E,Mali P,et al.Genome engineering inSaccharomyces cerevisiaeusing CRISPR-Cas systems[J].Nucleic Acids Res,2013,41:4336-4343.
[105]Hou Z,Zhang Y,Propson N E,et al.Efficient genome engineering in human pluripotent stem cells using Cas9 fromNeisseria meningitides[J].Proc Natl Acad Sci USA,2013,110:15644-15649.
[106]Nekrasov V,Staskawicz B,Weige D,et al.Targeted mutagenesis in the model plant Nicotiana benthamiana using Cas9 RNA-guided endonuclease[J].Nat Biotechnol,2013,31:691-693.
[107]Bassett A R,Tibbit C,Ponting C P,et al.Highly efficient targeted mutagenesis ofDrosophilawith the CRISPR/Cas9 System[J].Cell Rep,2013,4:220-228.
[108]Chang N,Sun C,Gao L,et al.Genome editing with RNA-guided Cas9 nuclease in zebrafish embryos[J].Cell Res,2013,23:465-472.
[109]Wang H,Yang H,Shivalila C S,et al.One-step generation of mice carrying mutations in multiple genes by CRISPR/Casmediated genome engineering[J].Cell,2013,153:910-918.
[110]Fujii W,Kawasaki K,Sugiura K,et al.Efficient generation of large-scale genome-modified mice using gRNA and CAS9 endonuclease[J].Nucleic Acids Res,2013,doi:10.1093/nar/gkt772.
[111]Qi L S,Larson M H,Gilbert L A,et al.Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression[J].Cell,2013,152:1173-1183.
[112]Bikard D,Jiang W,Samai P,et al.Programmable repression and activation of bacterial gene expression using an engineered CRISPR-Cas system[J].Nucleic Acids Res,2013,41:7429-7437.
[113]Gilbert L A,Larson M H,Morsut L,et al.CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes[J].Cell,2013,154:442-451.
[114]Ebina H,Misawa N,Kanemura Y,et al.Harnessing the CRISPR/Cas9 system to disrupt latent HIV-1 provirus[J].Sci Rep,2013,3:2510.
[115]Mali P,Aach J,Stranges P B,et al.Cas9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering[J].Nat Biotechnol,2013,31:833-838.
[116]Hsu P D,Scott D A,Weinstein J A,et al.DNA targeting specificity of RNA-guided Cas9 nucleases[J].Nat Biotechnol,2013,31:827-832.
[117]Fu Y,Foden J A,Khayter C,et al.High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells[J].Nat Biotech,2013,31:822-826.
[118]Pattanayak V,Lin S,Guilinger J P,et al.High-throughput profiling of off-target DNA cleavage reveals RNA-programmed Cas9 nuclease specificity[J].Nat Biotechnol,2013,31:839-843.
[119]Ran F A,Hsu P D,Lin C Y,et al.Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity[J].Cell,2013,154:1380-1389.
[120]Esvelt K M,Mali P,Braff J L,et al.Orthogonal Cas9 proteins for RNA-guided gene regulation and editing[J].Nat Methods,2013,doi:10.1038/NMETH.2681.
[121]Zegans M E,Wagner J C,Cady K C,et al.Interaction between bacteriophage DMS3 and host CRISPR region inhibits group behaviors ofPseudomonas aeruginosa[J].J Bacteriol,2009,191:210-219.
[122]Cady K C,O’Toole G A.Non-identity-mediated CRISPR-bacteriophage interaction mediated via the Csy and Cas3 proteins[J].J Bacteriol,2011,193:3433-3445.
[123]Viswanathan P,Murphy K,Julien B,et al.Regulation of dev,an operon that includes genes essential forMyxococcus xanthusdevelopment and CRISPR-associated genes and repeats[J].J Bacteriol,2007,189:3738-3750.
[124]Thony-Meyer L,Kaiser D.devRS,an autoregulated and essential genetic locus for fruiting body development in Myxococcus xanthus[J].J Bacteriol,1993,175:7450-7462.
[125]Babu M,Beloglazova N,Flick R,et al.A dual function of the CRISPR-Cas system in bacterial antivirus immunity and DNA repair[J].Mol Microbiol,2011,79:484-502.
[126]Mali P,Esvelt K M,Church G M.Cas9 as a versatile tool for engineering biology[J].Nat Methods,2013,10:957-963.