蔡銀強,李求春,陶 靜,蔣道軍,潘志明*,焦新安
(1.揚州大學(xué)江蘇省動物重要疫病與人獸共患病防控協(xié)同創(chuàng)新中心,江蘇揚州225009;2.揚州大學(xué)江蘇省人獸共患病學(xué)重點實驗室,江蘇揚州225009;3.江蘇全福農(nóng)牧實業(yè)有限公司,江蘇溧陽213353)
沙門菌是全球范圍內(nèi)最重要的幾種食源性致病菌之一,給人類衛(wèi)生保健系統(tǒng)造成了嚴重的經(jīng)濟負擔(dān)。在美國,沙門菌每年引起約140萬例感染事件,造成15 000人住院,超過400人死亡[1]。在中國,大約70%~80%的食源性疾病的暴發(fā)流行是由沙門菌引起的[2]。沙門菌可分離于多種食物(CDC 食源性疾病暴發(fā)在線數(shù)據(jù)庫http://wwwn.cdc.gov/foodborneoutbreaks/),同時,這些污染沙門菌食物的廣泛分布,使得在沙門菌食源性疾病暴發(fā)流行期間,人們很難對它們進行調(diào)查和溯源。
目前,已建立起多種鑒定沙門菌的方法,如傳統(tǒng)的生化鑒定、血清型鑒定及PCR 鑒定等。近年來,應(yīng)用于沙門菌鑒定的方法,大多以核酸為基礎(chǔ),包括環(huán)介導(dǎo)等溫擴增(loop-mediated isothermal amplification)[3]、實 時 熒 光 定 量PCR(real-time fluorescence quantitative PCR,real-time PCR)[4]、脈 沖 場凝 膠 電 泳(pulsed field gel electrophoresis,PFGE)[5]、規(guī)律成簇間隔的短回文重復(fù)序列(clustered regularly interspaced short palindromic repeats,CRISPR)[6]等。PFGE目前被認為是食源性致病菌亞分型的金標(biāo)準(zhǔn),并得到了廣泛應(yīng)用。CRISPR 是細菌基因組中進化最快的一種遺傳元件,它普遍存在于約90%古細菌和40%細菌的基因組中,包括沙門菌[7]。近年來,CRISPR 的研究已成為生物界的一大熱點,沙門菌便是其中的一個代表。
1987年,Ishino Y 等[8]在對大腸埃希菌的堿性磷酸酶同工酶Ipa 所對應(yīng)的核酸序列進行分析時,發(fā)現(xiàn)在該產(chǎn)物編碼區(qū)的下游存在著一個由29個堿基組成、重復(fù)出現(xiàn)的、并且高度保守的核酸序列;同時,在兩個重復(fù)的核酸序列之間,存在著長度大致相等、獨特的非重復(fù)核酸序列,將它們間隔開來。2000年,Mojica F J等[9]通過比對數(shù)種古生菌和細菌的核酸序列,發(fā)現(xiàn)大腸埃希菌和傷寒沙門菌的核酸序列中,存在著高度同源的大小為29bp的重復(fù)序列,當(dāng)時稱之為SRSRs(short regularly spaced repeats,SRSRs)序 列,直 到2002 年,Jansen R 等[10]才 將 其正式命名為CRISPR,即規(guī)律成簇間隔的短回文重復(fù)序列,并一直沿用至今。
在已發(fā)現(xiàn)的含有CRISPR 位點的細菌中,該位點的數(shù)量從1個~3個不等[11]。比較而言,沙門菌中普遍存 在2 個CRISPR 位 點[10],由 前 導(dǎo) 區(qū)(leader),序列高度保守的重復(fù)區(qū)(repeat),以及間隔區(qū)(spacer)3個部分組成。其中,序列高度保守的重復(fù)區(qū)與間隔區(qū)交替出現(xiàn),最終形成一個完整的CRISPR 位點。前導(dǎo)區(qū)一般位于CRISPR 位點的上游,由AT 富集的、大小為300bp~500bp的堿基組成。該區(qū)在種內(nèi)相對保守,但是在種間卻存在著顯著水平的差異[10]。研究表明,前導(dǎo)區(qū)的存在,很可能起著CAS(CRISPR-associated)相關(guān)蛋白的識別位點的作用。重復(fù)區(qū)一般由平均長度為29bp的堿基組成,序列高度保守,但也存在如其他細菌一樣的被稱為退化重復(fù)(degeneration repeats,DRs)的變異[12]。Touchon M 等[13]研究發(fā)現(xiàn),重復(fù)區(qū)的序 列具有二重對稱性,意味著它們能夠形成發(fā)夾般的、穩(wěn)定的二級結(jié)構(gòu);同時,重復(fù)區(qū)的數(shù)量與CAS系統(tǒng)的完整程度呈現(xiàn)正相關(guān),即CAS系統(tǒng)越完整,CRISPR位點中的重復(fù)區(qū)數(shù)量越多;而在其他細菌中,尚未發(fā)現(xiàn)如此的規(guī)律。間隔區(qū)一般由平均長度為32bp的核苷酸序列組成,它們的插入和丟失,導(dǎo)致了沙門菌CRISPR 位點的多樣性,被形象地稱為“CRISPR 微進化”。值得注意的是,沙門菌的CRISPR 間隔區(qū)特有地與血清型密切相關(guān),在一定程度上,可以用CRISPR 來代替沙門菌血清學(xué)分型[6]。在同一個CRISPR 中,基本上不存在相同或是較相似的間隔區(qū)。長期的研究表明,部分間隔區(qū)序列與已知的質(zhì)粒、噬菌體的序列相匹配[14]。目前,CRISPR Data-Base數(shù)據(jù)庫中的間隔區(qū)序列,僅存在約2%能在GenBank中找到其相應(yīng)的匹配,其原因可能是目前全基因測序的噬菌體和質(zhì)粒還比較少。隨著全基因組測序技術(shù)的進一步發(fā)展,測序的噬菌體和質(zhì)粒越來越多,而相應(yīng)匹配的間隔區(qū)比例也在不斷上升[15]。
盡管CRISPR 大量發(fā)現(xiàn)于多種古細菌和細菌中[7],但是鑒于CRISPR 的非編碼區(qū)特性,如要發(fā)揮其功能,還必須依賴于其相關(guān)的蛋白。2002 年,Jansen R 等[10]對CRISPR 側(cè)翼序 列 進 行 比 對,發(fā) 現(xiàn)在不同的細菌基因組間,都含有4個基因;同時,這些基因表現(xiàn)出顯著的同源性,說明這些基因與CRISPR 位點存在很大的關(guān)聯(lián)。迄今為止,已鑒定出40多種與CRISPR 位點相關(guān)的、多樣化的cas基因[16],它們主要編碼與CRISPR 相關(guān)的蛋白,這些蛋白存在RNA 結(jié)合蛋白、聚合酶等結(jié)構(gòu)域,與核酸的重組修復(fù)等功能有關(guān)。每個CRISPR 位點都伴有一類特異的CRISPR 相關(guān)的cas基因。Marraffini L A 等[17]根據(jù)45種cas基因?qū)?yīng)的CAS蛋白的序列同源性、組成情況和功能,將CRISPR 系統(tǒng)分成9種亞 型,即 Ecoli、Ypest、Nmeni、Dvulg、Tneap、Hmari、Apernn、Mtube和RAMP module。
在已測定的E.coli亞型的沙門菌中,CRISPR/CAS系統(tǒng)傾向存在于CRISPR1 位點的一側(cè),且8個連續(xù)的cas基因按照cas2、cas1、cse3、cas5、cse4、cse2、cse1、cas3的順序排列[13],與其他在染色體或質(zhì)粒上按照cas4-cas3-cas1-cas2順序排列的細菌略有不同,同時還存在諸如cas3及其后所有cas基因缺失等現(xiàn)象[6]。這些cas基因分為兩大類,各自編碼不同功能的蛋白質(zhì)。一類稱為核心基因,包括cas1~cas6,其中,cas1和cas2 基因編碼的蛋白,主要在新重復(fù)序列的獲得中發(fā)揮作用,cas3編碼的蛋白被預(yù)測具有核酸酶和解旋酶的功能,在靶標(biāo)基因的剪切中扮演重要角色[18]。另一類稱為亞型特異性基因,包括cse、csy、csn、csd、cst等,其中只有少部分已經(jīng)確定。除cas基因以外,還存在另一類非cas基因。Medina Aparicio L等[19]發(fā)現(xiàn),傷寒沙門菌中的LeuO 和LRP基因,對于CRISPR 的活性具有直接的調(diào)控作用,參與crRNA 的加工、DNA 的剪切及調(diào)節(jié)外源DNA 的進入等。
CRISPR 的作用機制類似于免疫防疫,可分為適應(yīng)階段、表達階段和干擾階段。①適應(yīng)階段,CRISPR 系統(tǒng)將一段與入侵的質(zhì)粒亦或噬菌體上的同源短片段(原間隔序列proto-spacers),插入到前導(dǎo)序列與第一段重復(fù)序列之間,同時伴隨一次重復(fù)區(qū)的復(fù)制,進而形成了一個新的重復(fù)區(qū)-間隔區(qū)單元,使得CRISPR 基因座留下入侵的噬菌體或是質(zhì)粒的序列信息,為隨后的兩個階段提供結(jié)構(gòu)基礎(chǔ)[20]。②表達階段,CRISPR 基因座被轉(zhuǎn)錄成一段長的CRISPR RNA(crRNA)前體(pre-crRNA),該前體在相應(yīng)Cas蛋白的作用下,被切割并加工成小的、成熟的crRNA。隨后,成熟的crRNA 與Cas蛋白結(jié)合形成Cas/crRNA 蛋白復(fù)合體。③干擾階段,由crRNA 充當(dāng)向?qū)?,Cas/crRNA 蛋白復(fù)合體找到與crRNA 同源的外源核酸靶序列,通過堿基互補配對原則進行配對,隨后Cas/crRNA 蛋白復(fù)合體將靶標(biāo)序列降解。在CRISPR 免疫的3個階段中,適應(yīng)階段的機制,在不同的CRISPR 系統(tǒng)中高度保守,主要通過Cas1和Cas2蛋白發(fā)揮功能。后兩個階段,不同于第一個階段,它們屬于執(zhí)行階段,在不同的CRISPR 系統(tǒng)中差異性較大,發(fā)揮作用的蛋白也有所差別[21]。
CRISPR 干擾與已發(fā)現(xiàn)的RNA 干擾有諸多相似性,但是它們在蛋白結(jié)構(gòu)、作用靶標(biāo)、防御機制等方面存在諸多差異。目前,已發(fā)現(xiàn)的CRISPR 的功能還僅僅局限于防御外源基因的入侵,而真核生物則能通過RNAi相關(guān)通路,調(diào)節(jié)胞內(nèi)的基因表達等[17]。
除去與其他細菌CRISPR 類似的抵御外源質(zhì)粒和噬菌體DNA 的入侵的功能以外,沙門菌CRISPR還能介導(dǎo)自身短期表型的變化,也能介導(dǎo)長期的亞類進化[22];同時,由于沙門菌的CRISPR 特有地與血清型密切相關(guān),使得我們能在沙門菌食源性疾病暴發(fā)期間能快速地對其進行溯源。最近有研究表明,沙門菌的CRISPR 結(jié)構(gòu)與它的耐藥密切相關(guān)。當(dāng)然,更多的功能目前還尚不清楚,還有待進一步的研究。
CRISPR 間隔區(qū)的插入及丟失,形成了間隔區(qū)特有的高度多態(tài)性,進而間接造成了CRISPR 的多元性。因此,可通過設(shè)計相應(yīng)的引物,擴增細菌中的CRISPR 位點并測序,獲得CRISPR 序列信息,通過CRISPR 軟件分析,了解CRISPR 間隔區(qū)的數(shù)量,大小及排列情況。通過比對和分析這些序列信息,可對細菌進行分型研究。同時,鑒于間隔區(qū)在細菌核酸序列中是按照外源核酸序列入侵先后的順序排列,所以可利用CRISPR 對細菌進行遺傳進化研究。
2012年,F(xiàn)abre L 等[6]通 過 對783 株130 種 血清型的沙門菌進行CRISPR 分析,發(fā)現(xiàn)CRISPR 存在高分辨率,高實用性等優(yōu)點,與PFGE 相比,它能夠有效區(qū)分暴發(fā)流行中相同血清型的菌株,耗時更短,自動化程度更高,還能用于研究沙門菌的多態(tài)性;同時發(fā)現(xiàn)CRISPR 的多元性與血清型及ST 型(sequence type)密切相關(guān)。建議鑒于CRISPR 與血清型的高度相關(guān)性,只需根據(jù)兩個CRISPR 位點的大小,就能初步對沙門菌進行分型。其次,可以用軟件對CRISPR 位點的間隔序列進一步分析,得到更細致的分型結(jié)果。
CRISPR 除了單獨應(yīng)用于沙門菌的分型之外,還能與其他分型方法聯(lián)用。近年來,基于沙門菌的兩個毒力基因(fimH,sseL)的MLST 及CRISPR 兩種分型方法的結(jié)合,建立了一種新的沙門菌分型方法,命名為CRISPR-MVLST,并成功應(yīng)用于沙門菌的研究中。2011 年,Liu F 等[23]將該方法應(yīng)用于171株9種血清型的臨床沙門菌分離株的分型研究,發(fā)現(xiàn)該方法較PFGE 而言,具有更高的分辨率,能將暴發(fā)菌株及高度克隆的菌株區(qū)分開來,可作為沙門菌暴發(fā)流行時一種重要的分型方法。2013年,Shariat N 等[24]將該方法應(yīng)用于175株海德堡沙門菌和鼠傷寒沙門菌的分型研究中,表明該方法具有實用性強、分辨力高、流行病學(xué)一致性高等優(yōu)點,同時認為可以將該方法作為PFGE分型方法的一種補充,用于沙門菌的分型研究。
CRISPR 技術(shù)以核酸序列為基礎(chǔ),具有良好的可操控性,可用于下游的進化分析。Fricke W F等[22]比對了28株沙門菌的基因組發(fā)現(xiàn),CRISPR 介導(dǎo)的免疫能夠控制細菌短期的表型變化,也能介導(dǎo)長期的沙門菌亞類的進化,認為CRISPR 分析對評估沙門菌亞類的潛在進化性至關(guān)重要,能夠幫助和預(yù)防未來沙門菌的暴發(fā)流行。Timme R E 等[25]通過對156株78種血清型的腸道沙門菌進行序列測定,發(fā)現(xiàn)CRISPR 反映了與系統(tǒng)進化不同的進化模式,同時,有可能因為水平基因的轉(zhuǎn)移或共享環(huán)境的獲得,影響著目前沙門菌的分布情況。
在CRISPR 結(jié)構(gòu)中,間隔區(qū)的插入和丟失、間隔序列與外源DNA 的高度同源性、cas基因家族及其所編碼蛋白的多種功能,使它被廣泛地應(yīng)用于沙門菌及其他細菌的分型和進化分析研究。無論是單獨使用,還是與其他方法聯(lián)用,都表現(xiàn)出諸多優(yōu)越性。但是,現(xiàn)階段應(yīng)用CRISPR 進行細菌分型研究,數(shù)據(jù)尚不充分,數(shù)據(jù)庫也不健全,還沒有形成特定的標(biāo)準(zhǔn)。另外,目前對于CRISPR 的研究還僅僅局限于它的防御機制,是否還有其他功能,以及已發(fā)現(xiàn)的關(guān)于CRISPR 的各種現(xiàn)象的原因,如新間隔序列的獲得及選擇性缺失,都未得到明確的解答。此外,迄今發(fā)現(xiàn),CRISPR 只存在于90%的古細菌和40%的細菌,在數(shù)量上差異如此之大,是因為目前測序的細菌數(shù)量過少,還是由于與細菌共進化的噬菌體中,也存在CRISPR,亦或是存在類似于CRISPR 的其他元件,都值得探究。CRISPR 作為一個新的研究領(lǐng)域,鑒于它特殊的結(jié)構(gòu)及強大的功能,應(yīng)用前景廣闊。CRISPR 也許會像RNAi一樣,將揭開生物學(xué)領(lǐng)域的又一層面紗。
[1] Voetsch A C,Van Gilder T J,Angulo F J,et al.FoodNet estimate of the burden of illness caused by nontyphoidal Salmonellainfections in the United States[J].Clin Infect Dis,2004,38(Suppl.3):127-134.
[2] 王 軍,鄭增忍,王晶鈺.動物源性食品中沙門氏菌的風(fēng)險評估[J].中國動物檢疫,2007,24(4):23-25.
[3] 鄧顯文,謝芝勛,謝麗基,等.腸炎沙門菌LAMP檢測方法的建立[J].動物醫(yī)學(xué)進展,2012,33(5):27-30.
[4] 李丹丹,徐義剛,王綏家,等.動物性食品中沙門菌實時熒光定量PCR 快速檢測方法的建立[J].動物醫(yī)學(xué)進展,2014,35(5):24-30.
[5] 唐 攀,崔恩慧,劉萬華,等.雞源沙門菌PFGE 分型及耐藥性研究[J].動物醫(yī)學(xué)進展,2013,34(11):1-5.
[6] Fabre L,Zhang J,Guigon G,et al.CRISPR typing and subtyping for improved laboratory surveillance of Salmonella infections[J].PLoS One,2012,7(5):e36995.
[7] Sorek R,Kunin V,Hugenholtz P.CRISPR-a widespread system that provides acquired resistance against phage in bacteria and archaea[J].Nat Rev Microbiol,2008,6:181-186.
[8] Ishino Y,Shinagawa H,Makino K,et al.Nucleotide sequence of the iap gene,responsible for alkaline phosphatase isozyme conversion in Escherichia coli,and identification of the gene product[J].J Bacteriol,1987,169(12):5429-5433.
[9] Mojica F J,Díez-Villasenor C,Soria E,et al.Biological significance of a family of regularly spaced repeatsin the genomes of archaea,bacteria and mitochondria[J].Mol Microbiol,2000,36(1):244-246.
[10] Jansen R,Embden J D,Gaastra W,et al.Identification of genes that are associated with DNA repeats in prokaryotes[J].Mol Microbiol,2002,43:1565-1575.
[11] Grissa I,Vergnaud G,Pourcel C.The CRISPRdb database and tools to display CRISPRs and to generate dictionaries of spacers and repeats[J].BMC Bioinformatics,2007,8(172):1-10.
[12] Shariat N,DiMarzio M J,Yin S,et al.The combination of CRISPR-MVLST and PFGE provides increased discriminatory power for differentiating human clinical isolates of Salmonella enterica subsp.enterica serovar Enteritidis[J].Food Microbiol,2013,34(1):164-173.
[13] Touchon M,Rocha E P.The small,slow and specialized CRISPR and anti-CRISPR of Escherichia and Salmonella[J].PLoS One,2010,5:e11126.
[14] Mojica F J,F(xiàn)errer C,Juez G,et al.Long stretches of short tandem repeats are present in the largest replicons of the Archaea Haloferax mediterranei and Haloferax volcanii and could be involved in replicon partitioning[J].Mol Microbiol,1995,17(1):85-93.
[15] Heidelberg J F,Nelson W C,Schoenfeld T,et al.Germ warfare in a microbial mat community:CRISPRs provide insights into the co-evolution of host and viral genomes[J].PLoS One,2009,4(1):e4169.
[16] Hale C R,Zhao P,Olson S,et al.RNA-guided RNA cleavage by a CRISPR RNA-Cas protein complex[J].Cell,2009,39(5):945-956.
[17] Marraffini L A,Sontheimer E J.CRISPR interference:RNAdirected adaptive immunity in bacteria andarchaea[J].Nat Rev Genet,2010,11(3):181-190.
[18] Han D,Krauss G.Characterization of the endonuclease SSO2001from Sulfolobus solfataricus P2[J].FEBS Lett,2009,583(4):771-776.
[19] Medina-Aparicio L,Rebollar-Flores J E,Gallego-Hernández A L,et al.The CRISPR/Cas immune system is an operon regulated by LeuO,H-NS,and leucine-responsive regulatory protein in Salmonella enterica serovar typhi[J].J Bacteriol,2011,193(10):2396-2407.
[20] Barrangou R,F(xiàn)remaux C,Deveau H,et al.CRISPR provides acquired resistance against viruses in prokaryotes[J].Science,2007,315(5819):1709-1712.
[21] Makarova K S,Haft D H,Barrangou R,et al.Evolution and classification of the CRISPR-Cas systems[J].Nat Rev Microbiol,2011,9(6):467-477.
[22] Fricke W F,Mammel M K,McDermott P F,et al.Comparative genomics of 28 Salmonella enterica isolates:evidence for CRISPR-mediated adaptive sublineage evolution[J].J Bacteriol,2011,193:3556-3568.
[23] Liu F,Barrangou R,Gerner-Smidt P,et al.Novel virulence gene and clustered regularly interspaced short palindromic repeat(CRISPR)multilocus sequence typing scheme for subtyping of the major serovars of Salmonella enterica subsp.enterica[J].Appl Environ Microbiol,2011,77:1946-1956.
[24] Shariat N,Sandt C H,DiMarzio M J,et al.CRISPR-MVLST subtyping of Salmonella enterica subsp.enterica serovars Typhimuriumand Heidelbergand application in identifying outbreak isolates[J].BMC Microbiol,2013,13:254.
[25] Timme R E,Pettengill J B,Allard M W,et al.Phylogenetic diversity of the enteric pathogen Salmonella entericasubsp.entericainferred from genome-wide reference-free SNP characters[J].Genome Biol Evol,2013,5(11):2109-2123.