楊蘭,楊洋,李偉勛,Obaroakpo JOY,逄曉陽(yáng),呂加平
?
干酪乳桿菌CRISPR基因座分析
楊蘭,楊洋,李偉勛,Obaroakpo JOY,逄曉陽(yáng),呂加平
(中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)產(chǎn)品加工研究所,北京 100193)
【目的】目前基于釀膿鏈球菌()spCas9為核心的CRISPR/Cas9基因編輯系統(tǒng)在乳酸菌上的應(yīng)用受到很多限制,亟待開(kāi)發(fā)適合于乳酸菌的基因編輯系統(tǒng)。對(duì)6株干酪乳桿菌()的CRISPR系統(tǒng)進(jìn)行深入分析,并預(yù)測(cè)激活干酪乳桿菌自身Cas9蛋白所識(shí)別的PAM序列,為開(kāi)發(fā)適用于乳酸菌的CRISPR/lcCas9基因編輯系統(tǒng)奠定基礎(chǔ)?!痉椒ā恳砸淹瓿扇蚪M測(cè)序的6株干酪乳桿菌為研究對(duì)象,利用生物信息學(xué)方法對(duì)其CRISPR系統(tǒng)進(jìn)行深入分析,重點(diǎn)對(duì)不同菌株的CRISPR系統(tǒng)結(jié)構(gòu)進(jìn)行解析,并且對(duì)Cas蛋白以及spacer的同源性進(jìn)行分析,最后對(duì)CRISPR區(qū)重復(fù)序列的二級(jí)結(jié)構(gòu)以及Cas9蛋白識(shí)別的PAM序列進(jìn)行預(yù)測(cè)?!窘Y(jié)果】6株干酪乳桿菌CRISPR系統(tǒng)具有相似的結(jié)構(gòu),均具有特征性的Cas9蛋白,并且Cas基因序列保守。預(yù)測(cè)到tracrRNA位于Cas9和Cas1之間,重復(fù)序列可以形成莖部長(zhǎng)達(dá)7個(gè)堿基的二級(jí)結(jié)構(gòu)。根據(jù)CRISPR的間隔區(qū)序列,6株干酪乳桿菌可被分為3個(gè)基因型,將間隔區(qū)逐一進(jìn)行blast比對(duì),結(jié)果表明6個(gè)間隔區(qū)比對(duì)上14個(gè)來(lái)源不同的原間隔序列,這些間隔序列均來(lái)源于不同質(zhì)粒。干酪乳桿菌lcCas9蛋白識(shí)別PAM序列的1、3位堿基偏好T/C、A/C,2、4位堿基對(duì)G、A的偏好性比較大?!窘Y(jié)論】6株干酪乳桿菌CRISPR系統(tǒng)均為type-ⅡA型,序列和重復(fù)序列高度保守。DR序列可以形成穩(wěn)定的二級(jí)結(jié)構(gòu),TGMA為干酪乳桿菌Cas9蛋白高效識(shí)別的PAM序列。
干酪乳桿菌;CRISPR系統(tǒng);spacer;;PAM
【研究意義】隨著分子生物學(xué)和高通量測(cè)序技術(shù)的飛速發(fā)展,人類已經(jīng)完成了數(shù)以千計(jì)乳酸菌的全基因組測(cè)序,但是目前對(duì)于乳酸菌全基因組的研究仍然面臨兩大艱巨任務(wù),一是如何更精確解讀基因組測(cè)序得到的海量數(shù)據(jù);二是如何對(duì)乳酸菌基因組進(jìn)行遺傳修飾,更加突出乳酸菌的益生功能。近年來(lái),研究火熱的CRISPR/Cas9基因編輯技術(shù)為高效完成上述兩大任務(wù)提供了強(qiáng)有力的工具。目前應(yīng)用最多的CRISPR/Cas9系統(tǒng)是以釀膿鏈球菌()的spCas9為核心構(gòu)建的,已經(jīng)廣泛應(yīng)用于真核生物的基因組編輯[1-3]。然而它在乳酸菌中的應(yīng)用仍然受到很大限制,主要原因是spCas9在多數(shù)乳酸菌內(nèi)有較高的細(xì)胞毒性;另外,spCas9蛋白較大、異源蛋白密碼子偏好性等也是限制該系統(tǒng)在乳酸菌成功應(yīng)用的重要原因。對(duì)乳酸菌自身CRISPR系統(tǒng)進(jìn)行深入研究,解析乳酸菌抵御噬菌體等外源遺傳基因侵染的機(jī)制,對(duì)于后續(xù)開(kāi)發(fā)適合于乳酸菌的CRISPR/Cas9基因編輯系統(tǒng)具有重要意義。另一方面,干酪乳桿菌作為具有益生功能的微生物發(fā)酵劑被廣泛的用于食品發(fā)酵中,具有降血壓[4]、調(diào)節(jié)腸道菌群[5]和提高機(jī)體免疫力[6]等促進(jìn)健康的作用。深入研究該菌CRISPR系統(tǒng)行使免疫功能的機(jī)制,將為解決乳酸菌工業(yè)發(fā)酵過(guò)程中易受到噬菌體的侵染導(dǎo)致發(fā)酵失敗提供重要的理論依據(jù)?!厩叭搜芯窟M(jìn)展】CRISPR(clustered regularly interspaced short palindromic repeat)/Cas(CRISPR associated)系統(tǒng)是細(xì)菌的一種獲得性免疫系統(tǒng),用來(lái)抵御噬菌體、質(zhì)粒等外源DNA的侵害[7]。CRISPR基因座包括CRISPR序列和Cas蛋白,CRISPR序列由重復(fù)序列(repeat)和間隔序列(spacer)交替組成[8]。在前導(dǎo)區(qū)的調(diào)控下,CRISPR序列轉(zhuǎn)錄為pre-crRNA[9-10],與一種反式編碼的小RNA(tracrRNA)通過(guò)堿基配對(duì)形成雙鏈RNA(dsRNA)區(qū)域,在Cas蛋白存在下被RNase III切割加工成熟,然后與細(xì)菌自身的Cas核酸酶形成核酸蛋白復(fù)合體[11]。在type-II型系統(tǒng)中,當(dāng)入侵的外源DNA和crRNA序列配對(duì)結(jié)合,同時(shí)Cas9蛋白識(shí)別對(duì)應(yīng)的特異性PAM序列,就能夠?qū)θ肭值腄NA進(jìn)行靶向切割,從而得到破壞外源DNA、實(shí)現(xiàn)自我防御的目的[12]。CRISPR/Cas系統(tǒng)的機(jī)制和功能日益清晰,科學(xué)家逐漸意識(shí)到可以將其應(yīng)用于基因編輯。目前,CRISPR/Cas編輯系統(tǒng)飛速發(fā)展,已經(jīng)被迅速應(yīng)用于小鼠[13-15]、大鼠[16]、斑馬魚(yú)[17-18]、秀麗隱桿線蟲(chóng)[19]、擬南芥[20-21]及大腸桿菌[22-23]等多個(gè)物種,成為基因組精準(zhǔn)編輯的有力工具[24-26],但是目前在乳酸菌中利用此系統(tǒng)進(jìn)行成功編輯的研究還較少。OH等[27]將CRISPR/Cas9系統(tǒng)引入羅伊氏乳桿菌中,結(jié)合RED重組技術(shù)實(shí)現(xiàn)了對(duì)乳酸菌基因組的成功編輯,這是CRISPR/Cas9系統(tǒng)在乳酸菌上應(yīng)用的首次報(bào)道。但是該研究也存在一些問(wèn)題,其Cas9蛋白載體的構(gòu)建是一種組成型表達(dá),而且構(gòu)建敲除系統(tǒng)所用質(zhì)粒較多,電轉(zhuǎn)化效率不是很高,影響了基因編輯的效率。目前在乳酸菌領(lǐng)域使用的基因編輯方法仍然是傳統(tǒng)的基于基因同源重組的策略,至少需要24 d才能獲得一個(gè)基因敲除,這是相當(dāng)繁瑣且耗時(shí)的[28]。【本研究切入點(diǎn)】目前的CRISPR/Cas9系統(tǒng)應(yīng)用于乳酸菌還存在很多限制因素,亟待對(duì)該系統(tǒng)進(jìn)行改進(jìn)優(yōu)化。本研究以干酪乳桿菌()的CRISPR系統(tǒng)為切入點(diǎn),深入研究該菌的CRISPR系統(tǒng)行使免疫功能的機(jī)制,解析lcCas9識(shí)別的PAM序列?!緮M解決的關(guān)鍵問(wèn)題】本研究對(duì)干酪乳桿菌不同菌株CRISPR系統(tǒng)進(jìn)行深入分析,重點(diǎn)解析lcCas9蛋白識(shí)別的PAM序列,以期對(duì)現(xiàn)有CRISPR/Cas9系統(tǒng)進(jìn)行改良,為開(kāi)發(fā)適用于乳酸菌的CRISPR/Cas9基因編輯系統(tǒng)奠定理論基礎(chǔ)。
試驗(yàn)于2017年10月—2018年7月在中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)產(chǎn)加工研究所乳品研究實(shí)驗(yàn)室進(jìn)行。
NCBI Genbank(https://www.ncbi.nlm.nih.gov/)數(shù)據(jù)庫(kù)中已公布全基因組序列的6株干酪乳桿菌。這些菌株包括:干酪乳桿菌BD-Ⅱ(NC_017474.1)、干酪乳桿菌BL23(NC_010999.1)、干酪乳桿菌LC2W (NC_017473.1)、干酪乳桿菌W56(NC_018641.1)、干酪乳桿菌ZHANG(NZ_CP001084.1/NC_014334.2)、干酪乳桿菌LOCK919(NC_021721.1)。
1.2.1 CRISPR系統(tǒng)結(jié)構(gòu)分析 使用CRISPR-CAS++(https://crisprcas.i2bc.paris-saclay.fr/CrisprCasFinder/Index)以及CRISPRdisco軟件對(duì)CRISPR系統(tǒng)進(jìn)行查找,包括CRISPR序列及位置,確定CRISPR/Cas系統(tǒng)的類型。使用MEGA7對(duì)進(jìn)行序列同源性分析。使用IBS 1.0.2進(jìn)行基因結(jié)構(gòu)作圖。
1.2.2 TracrRNA位置預(yù)測(cè) 基于之前對(duì)大量tracrRNA同源物的研究[29],tracrRNA在CRISPR基因座內(nèi)的位置并不是保守的,在4個(gè)典型的位置中發(fā)現(xiàn)了反重復(fù)序列,分別為:Cas9的上游,Cas9和Cas1之間以及CRISPR序列的上下游。為了預(yù)測(cè)新的tracrRNA,通過(guò)一系列序列比對(duì)篩選了CRISPR/Cas基因座非repeat-spacer序列,包括Cas9上游1 kb、Cas9-Cas1之間以及CRISPR序列上下游1 kb兩條鏈的序列;驗(yàn)證CRISPR重復(fù):反重復(fù)配對(duì)情況。將篩選出的反重復(fù)序列使用Promoter 2.0 prediction server(http://www.cbs.dtu.dk/services/Promoter/)預(yù)測(cè)啟動(dòng)子,使用ARNold(http://rna.igmors.u-psud.fr/)預(yù)測(cè)終止子。
1.2.3 DR序列的二級(jí)結(jié)構(gòu)預(yù)測(cè) 在前導(dǎo)區(qū)的調(diào)控下,CRISPR基因座轉(zhuǎn)錄為單鏈RNA分子(pre- crRNA)[9-10]。由于CRISPR重復(fù)序列部分回文性質(zhì),其可能形成穩(wěn)定的發(fā)夾二級(jí)結(jié)構(gòu)[8,30]。使用RNAalifold web server(http://nibiru.tbi.univie.ac.at/cgi-bin/RNAWebSuite/ RNAalifold.cgi)進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè),計(jì)算方法采用最小自由能法(minimum free energy,MFE),其他參數(shù)選擇默認(rèn)。
1.2.4 間隔區(qū)多樣性及同源性分析 通過(guò)祖先間隔區(qū)和保守間隔區(qū)的分布可以將CRISPR序列分型將間隔區(qū)序列進(jìn)行,使用Clustal X進(jìn)行序列相似性分析。將6株菌的spacer逐一進(jìn)行blast,查找預(yù)期匹配的原間隔序列,最多允許3個(gè)不匹配,并對(duì)原間隔序列進(jìn)行溯源。篩選去除來(lái)源于CRISPR序列的同源序列,選擇來(lái)源于噬菌體或質(zhì)粒的序列作為潛在的外源遺傳元件[31-33]。
1.2.5 PAM序列預(yù)測(cè)及其可視化 使用CRISPR target(http://bioanalysis.otago.ac.nz/CRISPRTarget/crispr_analysis.html)分析來(lái)源不同的原間隔序列非靶標(biāo)鏈下游10個(gè)堿基序列。使用weblogo(http://weblogo.berkeley. edu/logo.cgi)對(duì)每個(gè)位點(diǎn)的堿基偏好性進(jìn)行可視化。
本研究的6株干酪乳桿菌中均只有一個(gè)已證實(shí)的CRISPR系統(tǒng),同時(shí)在干酪乳桿菌ZHANG基因組上還存在5個(gè)疑似CRISPR區(qū)域,在干酪乳桿菌ZHANG質(zhì)粒上存在1個(gè)疑似CRISPR區(qū)域,在干酪乳桿菌LOCK919質(zhì)粒上存在一個(gè)疑似CRISPR區(qū)域,這些區(qū)域雖然存在簡(jiǎn)單的重復(fù)間隔區(qū),但是均只有1—2個(gè)間隔區(qū),且不存在,本研究對(duì)此不進(jìn)行深入分析(表1)。分析6株干酪乳桿菌確認(rèn)的CRISPR系統(tǒng),發(fā)現(xiàn)4個(gè)(、、、)位于CRISPR序列側(cè)翼。6株菌的基因組上均含有標(biāo)志性基因,可以確定其CRISPR系統(tǒng)為type-ⅡA型。CRISPR序列最長(zhǎng)的為1 424 bp,含有21個(gè)間隔序列,最短的為762 bp,含有11個(gè)間隔序列,重復(fù)序列均為36 bp,間隔序列為28—31 bp。對(duì)Cas蛋白序列保守型的比較分析表明,這些菌株的Cas蛋白之間具有高度的相似性。包括干酪乳桿菌BD-Ⅱ、干酪乳桿菌BL23、干酪乳桿菌LC2W、干酪乳桿菌W56、干酪乳桿菌ZHANG在內(nèi)的菌株,他們的Cas蛋白序列相似性均達(dá)到了100%,僅LOCK919與他們有微小差別,但相似性仍然達(dá)到90%以上(圖1)。
圖1 干酪乳桿菌CRISPR基因座結(jié)構(gòu)
表1 6株干酪乳桿菌CRISPR序列情況
對(duì)6株菌株tracrRNA的預(yù)測(cè)表明,其tracrRNA均位于與之間,與轉(zhuǎn)錄方向相反(圖2)。tracrRNA與repeat區(qū)有高達(dá)30 bp的配對(duì),并成預(yù)測(cè)tracrRNA的啟動(dòng)子和終止子。啟動(dòng)子和轉(zhuǎn)錄終止子預(yù)測(cè)作為非必要的步驟,計(jì)算機(jī)模擬預(yù)測(cè)算法可以提供參考,若要獲得準(zhǔn)確的序列可以進(jìn)行RNA深度測(cè)序驗(yàn)證。
圖2 干酪乳桿菌tracrRNA在CRISPR基因座中的位置
DR序列轉(zhuǎn)錄成非信使RNA,以特殊的結(jié)構(gòu)發(fā)揮功能。隨著轉(zhuǎn)錄的進(jìn)行,連續(xù)的單鏈重復(fù)序列形成二級(jí)結(jié)構(gòu),莖可長(zhǎng)達(dá)4—8個(gè)堿基,從而產(chǎn)生更穩(wěn)定的RNA結(jié)構(gòu)。為了評(píng)估干酪乳桿菌CRISPR重復(fù)序列形成穩(wěn)定的RNA二級(jí)結(jié)構(gòu)的可能性,使用RNAalifold來(lái)預(yù)測(cè)重復(fù)序列的分子內(nèi)RNA結(jié)構(gòu)。預(yù)測(cè)到的DR序列二級(jí)結(jié)構(gòu)自由能為-2.50 kcal/mol,莖長(zhǎng)度達(dá)7個(gè)堿基,結(jié)構(gòu)穩(wěn)定(圖3)。
本研究發(fā)現(xiàn)40個(gè)獨(dú)特的間隔區(qū)類型(圖4),根據(jù)祖先間隔區(qū)及保守間隔區(qū)的位置,6株菌被分為3種CRISPR類型。其中BD-Ⅱ、BL23、LC2W分享完全相同的間隔區(qū),W56與他們共享祖先間隔區(qū),但是有3個(gè)間隔區(qū)不同,這3個(gè)不同的間隔區(qū)又與之前的序列高度相似。ZHANG與GENOTYPE 1型共享一些保守的間隔區(qū),但是具有不完全相同的祖先間隔區(qū)及部分獨(dú)特間隔區(qū)。LOCK919享有所有的獨(dú)特間隔區(qū)。
圖3 重復(fù)序列的RNA二級(jí)結(jié)構(gòu)
圖4 6株干酪乳桿菌CRISPR間隔區(qū)多樣性分析
為了確定CRISPR間隔區(qū)的可能起源,研究其與已知序列的同源性。得到與干酪乳桿菌的部分間隔區(qū)高度匹配的噬菌體或質(zhì)粒序列,其中包括某些完全匹配(表2)。BD-Ⅱ、BL23、LC2W、W56的spacer21序列均與乳桿菌的質(zhì)粒pREN 100%匹配。ZHANG的spacer14序列與乳酸乳球菌乳酸亞種和乳酸乳球菌乳脂亞種的質(zhì)粒僅有一個(gè)堿基錯(cuò)配。Spacer15序列與巴克乳桿菌、副干酪乳桿菌、卡氏雙球菌、植物乳桿菌、短乳酸桿菌、乳明串珠球菌、戊糖片球菌中的質(zhì)粒有1—3個(gè)堿基錯(cuò)配。
Blast的結(jié)果中40個(gè)間隔區(qū)只有6個(gè)間隔區(qū)比對(duì)上了原間隔序列,這其中還包括一些非完全匹配序列。另外匹配到原間隔序列的spacer均為新獲取的間隔區(qū),祖先間隔區(qū)均未匹配到有效序列,這可能是由于數(shù)據(jù)庫(kù)的不完整以及噬菌體質(zhì)粒進(jìn)化過(guò)程中發(fā)生突變所致。ZHANG的spacer14和spacer15匹配到了多株菌的質(zhì)粒,這表明一個(gè)間隔序列可以抵抗多種外源元件的侵入。僅有幾個(gè)間隔區(qū)能夠匹配上編碼蛋白的基因,ZHANG的spacer15匹配到了來(lái)源于植物乳桿菌pXY3質(zhì)粒的ORF4,BD-Ⅱ、BL23、LC2W、W56的spacer21以及ZHANG的spacer來(lái)源于副干酪乳桿菌的質(zhì)粒均匹配到的是假定的蛋白,其余間隔區(qū)均未匹配到編碼蛋白的序列。結(jié)果表明,所有間隔序列的來(lái)源均為質(zhì)粒,但是這并不能說(shuō)明抗噬菌體的能力較弱,僅有較少的新間隔區(qū)在數(shù)據(jù)庫(kù)中得到匹配,絕大多數(shù)的間隔區(qū)沒(méi)有得到匹配,噬菌體數(shù)據(jù)庫(kù)不完善成為了主要限制因素,blast結(jié)果只能成為細(xì)菌抗噬菌體能力的一種參考。
分析結(jié)果表明,干酪乳桿菌PAM序列的1、3位堿基偏好T/C、A/C,2、4位堿基對(duì)G、A的偏好性比較大,推測(cè)干酪乳桿菌CRISPR系統(tǒng)識(shí)別效率最高的PAM序列為T(mén)GMA(圖5)。但是通過(guò)生物信息學(xué)分析的方法預(yù)測(cè)到的原間隔序列有限,所以這一方法可以對(duì)CRISPR系統(tǒng)識(shí)別的PAM進(jìn)行初步預(yù)測(cè),對(duì)于將這一系統(tǒng)應(yīng)用于基因編輯,后續(xù)將通過(guò)分子試驗(yàn)進(jìn)一步驗(yàn)證。
CRISPR/Cas系統(tǒng)是細(xì)菌的獲得性免疫系統(tǒng),存在于46%細(xì)菌和84%古菌基因組中[31,34]。免疫功能由細(xì)菌基因組上的CRISPR序列和Cas蛋白執(zhí)行,Cas1-Cas2復(fù)合物將新捕獲的外源間隔序列整合入細(xì)菌的CRISPR區(qū)[35],間隔序列的插入代表著入侵者的特征遺傳信息存儲(chǔ)到宿主基因組。當(dāng)入侵者再次侵染時(shí),菌體自身的CRISPR系統(tǒng)會(huì)快速識(shí)別入侵者并引導(dǎo)相關(guān)Cas蛋白對(duì)入侵者DNA序列進(jìn)行特異性切割破壞,從而發(fā)揮免疫作用。值得注意的是,間隔區(qū)在CRISPR基因座上的排列是按照進(jìn)化時(shí)間順序的,新獲取的間隔區(qū)序列總是被整合到CRISPR位點(diǎn)的前導(dǎo)序列和第一個(gè)重復(fù)間隔單元之間[31]。因此,間隔區(qū)的位置可以代表他們被捕獲時(shí)間的先后,這也為細(xì)菌提供了一種基于獨(dú)特高變的基因座基因分型方法[36]。本研究通過(guò)分析確定其均為type-ⅡA型系統(tǒng),并且基于CRISPR序列,將6株菌分為3個(gè)基因型。通過(guò)對(duì)其Cas蛋白序列對(duì)比分析,發(fā)現(xiàn)6株菌的Cas蛋白相似性較高,ZHANG與BD-Ⅱ等菌株Cas蛋白相似度均為100%,但是其間隔區(qū)卻不完全相同,僅共享一部分保守間隔區(qū)。LOCK919與其他菌株Cas蛋白相似度達(dá)到90%左右,但是他們的間隔區(qū)完全不同,保守的祖先間隔區(qū)意味著菌株之間具有較高的親緣關(guān)系,而后來(lái)獲得的間隔區(qū)由于相關(guān)菌株暴露于不同的外來(lái)侵入性DNA而不同。雖然間隔區(qū)的差異巨大,但是repeat以及tracrRNA和Cas蛋白比對(duì)結(jié)果相似,是高度保守的。
表2 干酪乳桿菌spacer對(duì)應(yīng)的原間隔區(qū)序列特點(diǎn)
圖5 干酪乳桿菌CRISPR系統(tǒng)識(shí)別PAM預(yù)測(cè)
通過(guò)對(duì)入侵者的靶標(biāo)序列分析發(fā)現(xiàn),原間隔序列側(cè)翼位置上有一段2—7個(gè)堿基的前間隔序列鄰近基序(Protospacer adjacent motif,PAM)[37]?,F(xiàn)有研究表明,細(xì)菌CRISPR系統(tǒng)在獲取新的間隔序列過(guò)程[38]和Cas9介導(dǎo)的靶序列特異性切割過(guò)程[10,39]中,PAM序列發(fā)揮著至關(guān)重要的作用。PAM存在于入侵者靶標(biāo)序列側(cè)翼但是在自身CRISPR序列中并不存在,這是宿主區(qū)分自我和非我的重要依據(jù)[40]。在不存在PAM的情況下,即使gRNA將Cas9蛋白引導(dǎo)到靶標(biāo)基因的位置,Cas9蛋白也不會(huì)被激活,從而無(wú)切割活性。隨著不同宿主來(lái)源的CRISPR系統(tǒng)被研究的逐漸深入,越來(lái)越多的PAM序列被解析出來(lái)。目前廣泛使用的CRISPR/Cas9基因編輯系統(tǒng)是基于釀膿鏈球菌Cas9(SpCas9)為核心構(gòu)建的,研究已證實(shí)該Cas9識(shí)別的經(jīng)典PAM序列是5-NGG-3,進(jìn)一步的研究表明5-NAG/NGA-3也是其識(shí)別的非經(jīng)典PAM[40-42]。通過(guò)體外篩選試驗(yàn),研究人員發(fā)現(xiàn)金黃色葡萄球菌Cas9(SaCas9)識(shí)別更長(zhǎng)的PAM(5-NNGRR(T)-3),SaCas9體積小,有利于體內(nèi)基因組編輯[43-44]。不同來(lái)源的Cas9基因序列相似性不同使他們識(shí)別不同的PAM序列,這使得可以不斷探索不同物種Cas9蛋白所識(shí)別的PAM序列,豐富CRISPR工具庫(kù),提高基因編輯效率。本研究使用CRISPRtarget對(duì)干酪乳桿菌lcCas9所識(shí)別的PAM進(jìn)行了初步預(yù)測(cè)。40個(gè)間隔序列在GenBank-Phage、RefSeq-Plasmid、RefSeq-Viral數(shù)據(jù)庫(kù)中進(jìn)行檢索,僅有3個(gè)序列得到了有效匹配,但是其中2個(gè)匹配到了多達(dá)13個(gè)不同質(zhì)粒。雖然間隔區(qū)是相同的,但是其匹配到的間隔區(qū)來(lái)源及錯(cuò)配數(shù)都是不同的,而且得到有效匹配的間隔序列均位于CRISPR的新獲取間隔區(qū),可靠性較強(qiáng),表明TGMA非常有潛力成為高切割效率的PAM序列。
目前CRISPR/Cas9基因編輯方法在乳酸菌的應(yīng)用并不廣泛,受到了很多限制。對(duì)乳酸菌自身的CRISPR系統(tǒng)進(jìn)行解析并基于此開(kāi)發(fā)適合于乳酸菌的CRISPR/ cas9基因編輯系統(tǒng),在乳酸菌遺傳改良方面具有重要應(yīng)用前景。本研究對(duì)干酪乳桿菌CRISPR基因座進(jìn)行了全面的分析,預(yù)測(cè)了trcarRNA位置,并對(duì)PAM進(jìn)行了初步預(yù)測(cè),為解析干酪乳桿菌CRISPR系統(tǒng)提供了理論基礎(chǔ)。同時(shí)也為解決乳酸菌工業(yè)發(fā)酵中噬菌體侵染這一產(chǎn)業(yè)難題提供了十分重要的理論依據(jù),具有較高的應(yīng)用價(jià)值和實(shí)際意義。
6株干酪乳桿菌CRISPR系統(tǒng)均為type-ⅡA型,Cas基因序列和重復(fù)區(qū)序列保守,tracrRNA位于Cas9和Cas1蛋白之間。DR可以形成穩(wěn)定的二級(jí)結(jié)構(gòu),根據(jù)間隔區(qū)序列可以將6株菌株分為3種基因型,TGMA為干酪乳桿菌CRISPR系統(tǒng)高效識(shí)別的PAM序列。
[1] COBB R E, WANG Y, ZHAO H. High-efficiency multiplex genome editing of Streptomyces species using an engineered CRISPR/Cas system., 2015, 4(6): 723-728.
[2] JIANG Y, CHEN B, DUAN C, SUN B, YANG J, YANG S. Multigene editing in thegenome via the CRISPR-Cas9 system., 2015, 81(7): 2506-2514.
[3] PYNE M E, MOO-YOUNG M, CHUNG D A, CHOU C P. Coupling the CRISPR/Cas9 system with lambda red recombineering enables simplified chromosomal gene replacement in., 2015, 81(15): 5103-5114.
[4] 陳沖, 宋麗菊, 齊盼盼, 王敏, 馮盨, 張杰, 趙建. 干酪乳桿菌在乳制品中的應(yīng)用研究進(jìn)展. 食品與發(fā)酵科技, 2015, 51(4): 88-91.
CHEN C, SONG L J, QI P P, WANG M, FENG W, ZHANG J, ZHAO J. Progress in the application of Lactobacillus casei in dairy products.2015, 51(4): 88-91. (in Chinese)
[5] KOEBNICK C, WAGNER I, LEITZMANN P, STERN U, ZUNFT H J. Probiotic beverage containingShirota improves gastrointestinal symptoms in patients with chronic constipation., 2016, 17(11): 655-659.
[6] AKOGLU B, LOYTVED A, NUIDING H, ZEUZEM S, FAUST D. Probiotic Lactobacillus casei Shirota improves kidney function, inflammation and bowel movements in hospitalized patients with acute gastroenteritis-A prospective study., 2015, 17: 305-313.
[7] MAKAROVA K S, WOLF Y I, KOONIN E V. Comparative genomics of defense systems in archaea and bacteria., 2013, 41(8): 4360-4377.
[8] BOLOTIN A,QUINQUIS B, SOROKIN A, EHRLICH S D. Clustered regularly interspaced short palindrome repeats (CRISPRs) have spacers of extrachromosomal origin., 2005, 151(Pt 8): 2551-2561.
[9] VISWANATHAN P, MURPHY K, JULIEN B, GARZA A G, KROOS L. Regulation of dev, an operon that includes genes essential fordevelopment and CRISPR-associated genes and repeats., 2007, 189(10): 3738-3750.
[10] KARVELIS T, GASIUNAS G, MIKSYS A, BARRANGOU R, HORVATH P, SIKSNYS V. CrRNA and tracrRNA guide Cas9- mediated DNA interference in., 2013, 10(5): 841-851.
[11] DELTCHEVA E, CHYLINSKI K, SHARMA C M, GONZALES K, CHAO Y, PIRZADA Z A, ECKERT M R, VOGEL J, CHARPENTIER E. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III., 2011, 471(7340): 602-607.
[12] VAN DER OOST J, JORE M M, WESTRA E R, LUNDGREN M, BROUNS S J. CRISPR-based adaptive and heritable immunity in prokaryotes., 2009, 34(8): 401-407.
[13] FUJII W, ONUMA A, SUGIURA K, NAITO K. Efficient generation of genome-modified mice via offset-nicking by CRISPR/Cas system., 2014, 445(4): 791-794.
[14] AIDA T, CHIYO K, USAMI T, ISHIKUBO H, IMAHASHI R, WADA Y, TANAKA K F, SAKUMA T, YAMAMOTO T, TANAKA K. Cloning-free CRISPR/Cas system facilitates functional cassette knock-in in mice., 2015, 16(1): 1-11.
[15] NAKAGAWA Y, SAKUMA T, SAKAMOTO T, OHMURAYA M, NAKAGATA N, YAMAMOTO T. Production of knockout mice by DNA microinjection of various CRISPR/Cas9 vectors into freeze- thawed fertilized oocytes., 2015, 15(1): 33.
[16] MA Y W, ZHANG X, SHEN B, LU Y D, CHEN W, MA J, BAI L, HUANG X X, ZHANG L F. Generating rats with conditional alleles using CRISPR/Cas9., 2014, 24(1): 122-125.
[17] VARSHNEY G K, PEI W, LAFAVE M C, IDOL J, XU L, GALLARDO V, CARRINGTON B, BISHOP K, JONES M, LI M. High-throughput gene targeting and phenotyping in zebrafish using CRISPR/Cas9., 2015, 25(7): 1030-1042.
[18] AUER T O, DUROURE K, DE CIAN A, CONCORDET J P, DEL BENE F. Highly efficient CRISPR/Cas9 mediated knock-in in zebrafish by homology-independent DNA repair., 2014, 24(1): 142.
[19] SHEN Z F, ZHANG X L, CHAI Y P, ZHU Z W, YI P S, FENG G X, LI W, OU G S. Conditional knockouts generated by engineered CRISPR-Cas9 endonuclease reveal the roles of coronin inneural development., 2014, 30(5): 625-636.
[20] MIAO J, GUO D S, ZHANG J Z, HUANG Q P, QIN G J, ZHANG X, WAN J M, GU H Y, QU L J. Targeted mutagenesis in rice using CRISPR-Cas system., 2013, 23(10): 1233-1236.
[21] FENG Z Y, MAO Y F, XU N F, ZHANG B T, WEI P L, YANG D L, WANG Z, ZHANG Z J, ZHENG R, YANG L, ZENG L, LIU X D, ZHU J K. Multigeneration analysis reveals the inheritance, specificity, and patterns of CRISPR/Cas-induced gene modifications in., 2014, 111(12): 4632-4637.
[22] LUN C, BIKARD D. Consequences of Cas9 cleavage in the chromosome of., 2016, 44(9): 4243-4251.
[23] JI W Y, LEE D, WONG E, DADLANI P, DINH D, HUANG V, KEARNS K, TENG S, CHEN S, HALIBURTON J, HALIBURTON J, HEIMBERG G, HEINEIKE B, RAMASUBRAMANIAN A, STEVENS T, HELMKE K J, ZEPEDA V, QI L S, LIM W A. Specific gene repression by CRISPRi system transferred through bacterial conjugation., 2014, 3(12): 929-931.
[24] JINEK M, CHYLINSKI K, FONFARA I, HAUER M, DOUDNA J A, CHARPENTIER E. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity., 2012, 337(6096): 816-821.
[25] JIANG W, BIKARD D, COX D, ZHANG F, MARRAFFINI L A. RNA-guided editing of bacterial genomes using CRISPR-Cas systems., 2013, 31(3): 233-239.
[26] BURGESS D J. Technology: A CRISPR genome-editing tool., 2013, 14(2): 80.
[27] OH J H, VAN PIJKEREN J P. CRISPR-Cas9-assisted recombineering in., 2014, 42(17): e131.
[28] BIDART G N, RODRIGUEZ-DIAZ J, MONEDERO V, YEBRA M J. A unique gene cluster for the utilization of the mucosal and human milk-associated glycans galacto-N-biose and lacto-N-biose in., 2014, 93(3): 521-538.
[29] CHYLINSKI K, LE RHUN A, CHARPENTIER E. The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems., 2013, 10(5): 726-737.
[30] HORVATH P, BARRANGOU R. CRISPR/Cas, the immune system of bacteria and archaea., 2010, 327(5962): 167-170.
[31] BARRANGOU R, FREMAUX C, DEVEAU H, RICHARDS M, BOYAVAL P, MOINEAU S, ROMERO D A, HORVATH P. CRISPR provides acquired resistance against viruses in prokaryotes.,2007, 315(5819): 1709-1712.
[32] GARNEAU J E, DUPUIS M E, VILLION M, ROMERO D A, BARRANGOU R, BOYAVAL P, FREMAUX C, HORVATH P, MAGADAN A H, MOINEAU S. The CRISPR/Cas bacterial immune system cleaves bacteriophage and plasmid DNA., 2010, 468(7320): 67-71.
[33] SAPRANAUSKAS R, GASIUNAS G, FREMAUX C, BARRANGOU R, HORVATH P, SIKSNYS V. TheCRISPR/ Cas system provides immunity in., 2011, 39(21): 9275-9282.
[34] MARRAFFINI L A, SONTHEIMER E J. CRISPR interference limits horizontal gene transfer in staphylococci by targeting DNA., 2008, 322(5909): 1843.
[35] BARRANGOU R, HORVATH P. A decade of discovery: CRISPR functions and applications., 2017, 2: 17092.
[36] BRINER A E, LUGLI G A, MILANI C, DURANTI S, TURRONI F, GUEIMONDE M, MARGOLLES A, VAN SINDEREN D, VENTURA M, BARRANGOU R. Occurrence and diversity of CRISPR-Cas systems in the genus bifidobacterium., 2015, 10(7): e0133661.
[37] DEVEAU H, BARRANGOU R, GARNEAU J E, LABONTE J, FREMAUX C, BOYAVAL P, ROMERO D A, HORVATH P, MOINEAU S. Phage response to CRISPR-encoded resistance in., 2008, 190(4): 1390-1400.
[38] PAEZ-ESPINO D, MOROVIC W, SUN C L, THOMAS B C, UEDA K, STAHL B, BARRANGOU R, BANFIELD J F. Strong bias in the bacterial CRISPR elements that confer immunity to phage., 2013, 4: 1430.
[39] GASIUNAS G, BARRANGOU R, HORVATH P, SIKSNYS V. Cas9- crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria., 2012, 109(39): E2579-E2586.
[40] MOJICA F J, DIEZ-VILLASENOR C, GARCIA-MARTINEZ J, ALMENDROS C. Short motif sequences determine the targets of the prokaryotic CRISPR defence system., 2009, 155(Pt 3): 733-740.
[41] HSU P D, SCOTT D A, WEINSTEIN J A, RAN F A, KONERMANN S, AGARWALA V, LI Y, FINE E J, WU X, SHALEM O, CRADICK T J, MARRAFFINI L A, BAO G, ZHANG F. DNA targeting specificity of RNA-guided Cas9 nucleases., 2013, 31(9): 827-832.
[42] ZHANG Y, GE X, YANG F, ZHANG L, ZHENG J, TAN X, JIN Z B, QU J, GU F. Comparison of non-canonical PAMs for CRISPR/ Cas9-mediated DNA cleavage in human cells., 2014, 4: 5405.
[43] RAN F A, CONG L, YAN W X, SCOTT D A, GOOTENBERG J S, KRIZ A J, ZETSCHE B, SHALEM O, WU X, MAKAROVA K S, KOONIN E V, SHARP P A, ZHANG F.genome editing usingCas9., 2015, 520(7546): 186-191.
[44] KLEINSTIVER B P, PREW M S, TSAI S Q, NGUYEN N T, TOPKAR V V, ZHENG Z, JOUNG J K. Broadening the targeting range ofCRISPR-Cas9 by modifying PAM recognition., 2015, 33(12): 1293-1298.
CRISPR Locus Analysisof
YANG Lan, YANG Yang, LI WeiXun, Obaroakpo JOY, PANG XiaoYang, Lü JiaPing
(Institute of Food Science and Technology,Chinese Academy of Agricultural Sciences, Beijing 100193)
【Objective】The application of the CRISPR/Cas9 gene editing system based onspCas9 has restriction on lactic acid bacteria at present. It is urgent to develop a suitable gene editing system for lactic acid bacteria. In this study, we analysed the CRISPR system ofin depth, and then predicted the PAM sequence to activate its Cas9 protein. Our study provided the experimental foundation for the development of the CRISPR/lcCas9 gene editing system for lactic acid bacteria 【Method】In this study, six strains of whole genome-sequencedwere used as research object. Bioinformatics was used to analyze the CRISPR system. Cas protein structure, CRISPR system and homology of space were analysed. At the end, the second structure of the CRISPR repeat and PAM sequence recognized by Cas9 protein were predicted. 【Result】The CRISPR system ofhad similar structures characteristic of Cas9 protein, and the Cas gene were conserved. It was predicted that the tracrRNA was located between Cas9 and Cas1, and the repeat sequence could form a secondary structure with a stem length of seven bases. According to the sequence characteristics of CRISPR spacers, sixcould be divided into three genotypes. Then the spacer sequences were blasted one by one. The results showed that the six spacers aligned 14 original source sequences with different origins, and these spacer sequences were all derived from different plasmids. The PAM sequence recognized bylcCas9 protein preferred T/C, A/C at the 1stand 3rdbases. The 2ndand 4thbases had greater preferences for G and A.【Conclusion】The CRISPR system of six strains ofwere all type-IIA. Consequently, thegene and repeat sequences were highly conserved. The DR sequence formed a stable secondary structure, while TGMA as a PAM sequence was effectively identified by the Cas9 proetein of..
; CRISPR system; spacer;gene; PAM
10.3864/j.issn.0578-1752.2019.03.012
2018-08-03;
2018-11-14
國(guó)家重點(diǎn)研發(fā)計(jì)劃(2017YFC1600903)、國(guó)家自然科學(xué)基金面上項(xiàng)目(31871833)
楊蘭,E-mail:poplarorchid@163.com。通信作者逄曉陽(yáng),E-mail:pangxiaoyang@163.com。通信作者呂加平,E-mail:lvjp586@vip.sina.com
(責(zé)任編輯 趙伶俐)
中國(guó)農(nóng)業(yè)科學(xué)2019年3期