陳楠楠
(蘇州大學,江蘇蘇州 215000)
在CRISPER-Cas9基因編輯技術創(chuàng)建之前,人們已找到兩種可以特異性切斷DNA雙鏈的酶,一種是鋅指核酸酶(ZFNs),另一種是利用類轉(zhuǎn)錄激活因子效應物核酸酶(TALENs)。ZFNs是由多個鋅指基序串聯(lián)成的DNA識別域和非特異性核酸內(nèi)切酶FokⅠ的羧基端功能域組成的融合蛋白,當兩個ZFN分別結(jié)合到DNA的兩條鏈上間隔5~7個堿基的靶序列后,進而激活FokⅠ核酸內(nèi)切酶的剪切結(jié)構域,使DNA在特定位點產(chǎn)生雙鏈斷裂。但是,鋅指基序同其靶序列的對應性并不特異,而且在基因組上找到合適的ZFN靶點也比較困難。TALENs是將特異性DNA結(jié)合結(jié)構域TALE代替ZFNs的鋅指基序改造而成,但是TALE的識別位點有限。CRISPR/Cas9技術有效的利用了RNA-DNA的特異配對特性,并簡化了設計過程,使應用范圍更廣泛。
1987年,日本的Nakata實驗室在分析大腸桿菌基因iap及臨近序列時發(fā)現(xiàn)在iap基因的3'端存在多個含有29個堿基且高度同源的重復序列,這些重復序列之間包含32個堿基的間隔序列。真正對這些序列著迷的是FranciscoMojica。他的導師在前期研究中發(fā)現(xiàn)鹽的濃度會影響Haloferaxmediterranei DNA酶切片段的大小,Mojica便尋其中的原因。他在分析DNA片段的序列時發(fā)現(xiàn)了與Nakata實驗室所發(fā)現(xiàn)序列類似的“重復-居間序列-重復”序列[1]。隨后的幾年里,Mojica在多種微生物中都找到了類似的序列,并意識到這些序列可能在微生物中發(fā)揮重要作用。后來,Mojica將這種“重復-居間序列-重復”序列命名為SRSRs。到2000年,Mojica在20種不同的微生物基因組中發(fā)現(xiàn)了類似序列[2]。兩年后,Ruud Jansen在研究這些序列過程中發(fā)現(xiàn)了許多與其關聯(lián)的核酸酶。與Mojica交流后,這種序列結(jié)構被正式命名為CRISPR,與之相關的核酸酶則被命名為Cas[3]。雖然人們鑒定到了大量CRISPR序列,但對其生物學功能則毫無所知。
得益于數(shù)據(jù)庫的不斷豐富,在2003年,Mojica通過BLAST發(fā)現(xiàn)來自E.coli的居間序列能匹配侵染E.coli的P1噬菌體序列,而包含這些居間序列的E.coli菌株對P1噬菌體具有顯著的抗性。經(jīng)過一周的艱苦努力,Mojica分析了4500條居間序列,找到了88條有資料可查的序列,其中2/3的序列為病毒或外源質(zhì)粒的序列,他意識到CRISPR/Cas系統(tǒng)可能與細菌的獲得性免疫有關[4]。同一時期,法國的兩個實驗室也分別獨立得出了類似的結(jié)論。就職于法國國防部的Gilles Vergnaud在分析61份Y.pestis樣本后,得出了與Mojica一致的結(jié)論,即CRISPR與細菌的獲得性免疫有關[5]。同時,Alexander Bolotin提出了微生物中CRISPR序列染色體外起源的假說[6]。
2005年開始,CRISPR得到了更多的重視。2005年,Philippe Horvath等在法國羅地亞食品公司成立了一個研究小組,研究Mojica等人提出的CRISPR可能與細菌的獲得性免疫相關的假說。他們建立了由一個對噬菌體敏感的S.thermophilus菌株和兩個噬菌體組成的研究體系,發(fā)現(xiàn)菌株對噬菌體抗性的獲得與菌株CRISPR位點獲得噬菌體來源的序列相關[7],當噬菌體中相應的序列發(fā)生突變后,該菌株的噬菌體抗體則喪失。在后續(xù)的研究中,他們收集了大量具有不同程度免疫缺陷的菌株,并利用這些資源證實Cas7對菌株在CRISPR位點獲得噬菌體來源的序列是必需的,而與序列獲得后的抗性無關;而酶學專家VirginijusSiksnys證實,Cas9對菌株維持噬菌體抗性是必需的[6]。同一時期,在瓦格寧根大學的實驗室中,John van der Oost和EugeneKoonin合作,利用E.coli建立了另外一個研究CRISPR與細菌獲得性免疫關系的研究系統(tǒng),并分析了其中的5個Cas蛋白(Cascade)的功能[8]。他們發(fā)現(xiàn)Cas能將CRISPR位點轉(zhuǎn)錄來的RNA前體剪接為61個堿基大小的成熟crRNA(CRISPR RNA)。為了驗證crRNA對于CRISPR介導的免疫抗性是必需的,他們在細菌中建立了第一個人工CRISPR/Cas系統(tǒng),證實了其介導細菌抗噬菌體的能力,并猜測crRNA靶向DNA而不是傳統(tǒng)認為的anti-RNA。
證實CRISPR系統(tǒng)靶向DNA的是盧西亞諾·馬拉夫尼(Luciano Marraffini)等人。馬拉夫尼在芝加哥大學攻讀博士學位時,接受了噬菌體遺傳學權威人物Malcolm Casadaban的建議著手研究CRISPR。當時人們已普遍懷疑CRISPR anti-RNA理論,于是馬拉夫尼大膽推測,CRISPR能像限制性內(nèi)切酶一樣直接切割DNA。后來,馬拉夫尼與Erik Sontheimer合作,證實CRISPR可以像抵御病毒一樣破壞轉(zhuǎn)化的質(zhì)粒[9]。為了進一步證實此事,他們構建了一個體外CRISPR免疫系統(tǒng),確證CRISPR靶向DNA。他們甚至通過改造CRISPR免疫系統(tǒng),在真核細胞中實現(xiàn)對染色質(zhì)DNA的剪切。但馬拉夫尼等人在設計這些實驗時并不知道是哪個Cas起到了DNA內(nèi)切酶的功能,這導致了他們的實驗設計存在大量問題,因此沒有引起人們的重視。最終,Sylvain Moineau等人利用手中的免疫缺陷菌株研究發(fā)現(xiàn)切割質(zhì)粒取決于Cas9核酸酶。當他們對質(zhì)粒進行測序時,發(fā)現(xiàn)切割發(fā)生在PAM序列上游3個核苷酸處,這一關鍵序列特征與他們早期論文中所描述的一致[10]。
盡管CRISPR/CAS9系統(tǒng)已經(jīng)完整,但還有一個謎團,即被稱為trans-activating CRISPR RNA(tracrRNA)的小RNA。tracrRNA最早由Emmanuelle Charpentier在病原菌中發(fā)現(xiàn),后經(jīng)J?rgVogel分析發(fā)現(xiàn)該小RNA是由緊鄰CRISPR的序列轉(zhuǎn)錄而來,并包含一個由25個堿基組成,與CRISPR序列互補的序列。后經(jīng)基因敲出實驗證明,tracrRNA指導crRNA的成熟過程[11]。后經(jīng)Siksnys等人的研究表明,tracrRNA還有另一個關鍵作用,即對于Cas9核酸酶復合物的形成是必需的[12-13]。就在Siksnys等人解析Cas9的酶學結(jié)構時,Charpentier與結(jié)構生物學家JenniferDoudna開展合作,發(fā)現(xiàn)從E.coli中純化的Cas9能與純化的crRNA和tracrRNA在體外形成功能復合體,更重要的是,他們發(fā)現(xiàn)將crRNA和tracrRNA融合成一條RNA(sgRNA)時,Cas9復合體的功能不受影響,并指出“該系統(tǒng)在RNA指導的基因組編輯方面具有巨大潛力”[12]。
在解析CRISPR/Cas免疫系統(tǒng)的過程中,有兩件具有里程碑意義的成果,即CRISPR/Cas免疫系統(tǒng)在不同微生物間的移植和在體外的成功重建。在接下來的研究中,科學家張峰取得了首屈一指的成果。當時TALENs研究剛興起,張峰等人與來自SangamoBioSciences的另一實驗室分別成功地將TALENs應用在哺乳動物細胞中。2011年2月,張峰首次接觸到CRIAPR/Cas9系統(tǒng),兩個月后他便在哺乳動物細胞中實現(xiàn)了sgRNA介導的熒光報告基因的表達調(diào)控,但效果并不理想。接下來的一年中,張峰對CRIAPR/Cas9系統(tǒng)進行了優(yōu)化。2012年,他建立了一個由Cas9、tracrRNA和CRISPR序列三種元件組成的基因調(diào)控系統(tǒng),以及包含16個基因的CRISPR文庫。他發(fā)現(xiàn)該系統(tǒng)可以同時準確高效地突變多個基因序列。接下來,他檢測了由Cas9和sgRNA兩種元件組成的系統(tǒng),發(fā)現(xiàn)sgRNA的3'端發(fā)夾結(jié)構在激活Cas9的過程中發(fā)揮重要作用[14]。
自CRISPR/Cas9技術被證明可以高效準確編輯哺乳動物基因序列后,關于CRISPR/Cas9的科學報道迅速席卷生命科學的各個領域,CRISPR/Cas9技術在應用方面實現(xiàn)迅猛拓展,概括來講可以分為基因組編輯、轉(zhuǎn)錄調(diào)控、RNA調(diào)控及基因組定位。除了科研領域,CRISPR/Cas9還對社會思想帶來了巨大沖擊,特別是基因編輯嬰兒的誕生,引發(fā)了關于CRISPR/Cas9倫理的廣泛討論。但無論如何,CRISPR/Cas9基因編輯技術的出現(xiàn)為人類戰(zhàn)勝遺傳性疾病及癌癥等嚴重疾病帶來了新的希望,具有不可估量的價值。