張愛霞,趙 宇,安 靜,羅 影,陳志國
(1.首都醫(yī)科大學宣武醫(yī)院細胞治療中心,北京 100053;2.北京腦重大疾病研究院神經損傷和修復所,北京 100053;3.嘉應學院生命科學學院,廣東 梅州 514015)
成簇規(guī)律間隔短回文重復序列及其相關基因(clustered regularly interspaced short palindromic repeats/CRISPR-associated genes,CRISPR/Cas)系統(tǒng)是細菌或古細菌用來抵御外來噬菌體、質粒或其他移動元件侵染的獲得性免疫防御體系[1-4]。CRISPR/Cas9屬于CRISPR/Cas蛋白家族中的Ⅱ型,構成簡單,主要有Cas9蛋白、特異性CRISPR RNA(crRNA)及反式激活 crRNA(transactivating crRNA,tracrRNA)組成[5]。目前使用的 CRISPR/Cas9基因組編輯系統(tǒng)是用人工設計的單鏈向導RNA(single guide RNA,sgRNA)對tracrRNA-crRNA復合物進行了替換,使該系統(tǒng)只包含sgRNA和Cas9核酸內切酶2個元件[6],使設計過程更加簡便。經過人工改造后的CRISPR/Cas9系統(tǒng)因其操作簡便、作用高效而廣泛應用于基因治療、作物育種、疾病模型構建及功能基因組研究等領域,成為最熱門的基因組編輯工具[7-11]。在CRISPR/Cas9基因編輯系統(tǒng)中,sgRNA能與靶序列的堿基互補配對,Cas9蛋白作為核酸酶能切割雙鏈DNA,靶序列3′端的前間區(qū)序列鄰近基序(protospacer adja?cent motif,PAM)為Cas9的DNA識別位點,sgRNA與Cas9蛋白形成復合物后,通過sgRNA與靶序列的配對和Cas9蛋白對PAM的識別,該RNA-蛋白復合物精準地靶向特異的DNA位點,激活Cas9的核酸酶活性,切割靶DNA,產生雙鏈斷裂(double strand breaks,DSB)[12-13]。DSB的產生將激活細胞內部的DNA損傷修復機制,主要的修復機制有2種:同源重組(homology-directed repair,HDR)和非同源末端連接(non-homologous end joining,NHEJ),以NHEJ為主,這會造成基因組編輯位點的堿基產生插入/缺失突變[14-16]。通過引入外源基因片段作為修復模板[17]和抑制NHEJ[18-20]雖可以提高HDR的編輯效率,但在靶位點精確矯正點突變,HDR的效率仍然較低(0.1%~5%)[13,21]。除此之外,由于DSB的產生,不可避免地激活細胞內NHEJ修復機制,導致靶位點處出現(xiàn)非預期的堿基改變,而且該系統(tǒng)可能會產生脫靶效應,在非靶位點誘發(fā)DSB而產生插入/缺失突變[15,22]。如何能在不產生DSB的情況下進行精確的基因組編輯成為亟待解決的技術難題。
針對上述技術瓶頸,美國哈佛大學David LIU實驗室于2016年4月和2017年10月在Nature雜志上分別首次報道了基于CRISPR/Cas9的胞嘧啶單堿基基因編輯技術[23]和新型腺嘌呤單堿基基因編輯技術[24],該技術首次實現(xiàn)了不依賴DNA雙鏈斷裂而能夠將DNA 4種堿基A,T,G和C進行替換,開啟了單堿基基因組編輯的新紀元。
胞嘧啶單堿基基因編輯技術能在一定的編輯窗口內實現(xiàn)堿基C到T的單堿基轉換,也稱之為單堿基編輯器(base editor,BE)。David LIU實驗室共研發(fā)了4代BE系統(tǒng),即BE1-BE4,其核心組成主要由sgRNA和Cas9蛋白和胞苷脫氨酶組成,其中Cas9蛋白和胞苷脫氨酶為融合蛋白。該系統(tǒng)中使用的胞苷脫氨酶有大鼠的APOBEC1、七鰓鰻來源的胞苷脫氨酶(petromyzon marinus cytidine deami?nase1,PmCDA1)以及人源的激活誘導性胞苷脫氨酶(activation induced cytidine deaminase,AID);使用的Cas9蛋白來自釀膿鏈球菌(Streptococcus pyogenesCas9,SpCas9)和金黃色葡萄球菌(Staph?ylococcus aureusCas9,SaCas9)。SaCas9的BE系統(tǒng)習慣稱為SaBE,在單堿基基因編輯系統(tǒng)中Cas9蛋白使用的是Cas9突變體,即dCas9和Cas9n(D10A)。dCas9無核酸內切酶活性,進行DNA編輯時不切割靶DNA,不會產生DNA斷裂,而Cas9n(D10A)是在dCas9的基礎上,恢復了其在HNH結構域的催化堿基。因此,Cas9n(D10A)有單鏈DNA切口酶活性,在進行DNA編輯時會在1條DNA單鏈上切割而產生切口。由于Cas9n(D10A)和dCas9仍保持與sgRNA結合的能力,但均不會引起DSB,從而有效抑制了由NHEJ介導的插入/缺失突變的發(fā)生。BE進行基因編輯時,通過sgRNA與靶位點序列互補配對和Cas9蛋白對PAM的識別,融合蛋白結合并識別靶位點,胞苷脫氨酶能夠將非互補鏈中編輯窗口內的堿基C脫氨基而轉變?yōu)閴A基U,而U可以在隨后的復制過程中被DNA聚合酶識別為T,從而實現(xiàn)DNA中C→T(或者G→A)的轉變?;诖硕a生了第1代BE,即rAPO?BEC1-XTEN-dCas9。但EB1在細胞內的編輯效率很低,僅0.8%~7.7%,比細胞外編輯效率降低了80%~97.2%,原因是細胞內的DNA修復機制影響了堿基編輯的U∶G配對產物。在細胞中,尿嘧啶DNA糖基化酶(uracil DNA glycosylase,UDG)能催化U從DNA鏈上移除,并且啟動堿基切除修復(base-excision repair,BER)。通常修復的結果是將U∶G堿基修復為C∶G堿基,從而使得編輯效率大幅下降,這是第1代BE存在的主要問題。為了抑制UDG的作用,在Cas9蛋白和胞苷脫氨酶融合蛋白后又融合了尿嘧啶DNA糖基化酶抑制因子(uracil DNA glycosylase inhibitor,UGI)。UGI是一種來自枯草芽孢桿菌噬菌體PBS2的含有83個氨基酸殘基的蛋白質,可以抑制UDG活性,從而提高了BE的單堿基編輯效率。由此產生了BE2,即rAPO?BEC-XTEN-dCas9-UGI,BE2的編輯效率比BE1提高3倍,提高至20%。為了促進細胞內啟動以編輯鏈為模板合成新DNA鏈的修復機制從而進一步提高編輯效率,研究者開發(fā)了第3代BE,即用Cas9n(D10A)替換了dCas9。Cas9n(D10A)可將包含G堿基的非編輯鏈(單鏈)切斷,通過誘導DNA錯配修復(mismatch repair,MMR),使BE3 rAPO?BEC-XTEN-Cas9n-UGI的編輯效率提高至約37%且脫靶效率顯著下降,而且不同來源的胞嘧啶脫氨酶組成的BE3和使用SaCas9突變體的SaBE3同樣具有較高的編輯效率。雖然第3代單堿基編輯系統(tǒng)的編輯效果得到很大改善,但編輯的產物純度仍不盡人意,即C∶G堿基對不僅會被編輯成T∶A,同時也會被編輯成G∶C或者A∶T。這種情況在編輯窗口中只存在一個堿基C時更加明顯,這主要是由于UDG和DNA無嘌呤或無嘧啶位點(apurinic or apyrimidinic site,AP)裂合酶的作用導致的。AP裂合酶是一種BER酶,可以將AP轉變成單鏈DNA缺口。由于UDG催化U從DNA鏈上移除將會造成AP位點,被AP裂合酶識別從而斷裂DNA,加之Cas9n(D10A)將包含G堿基的非編輯鏈(單鏈)切斷,從而造成DSB,造成細胞的錯誤修復。為了進一步減少UDG對堿基U的接觸,研究者將UGI增加到2個拷貝,即成為rAPOBEC-XTEN-Cas9n-UGI-UGI,稱為第4代BE。BE4比BE3 rAPOBECXTEN-Cas9n-UGI的編輯效率提高約1.5倍,非T產物降低約52.2%,插入/缺失突變率降低約52.2%,顯著提高了編輯產物的純度和編輯效率。由于UDG和AP裂合酶的作用能產生DSB,在BE3和BE4的產物中也存在一定的插入/缺失突變。一種來自噬菌體Mu的蛋白質Gam可以結合在DSB位點的末端起到保護作用,所以研究者在BE3,SaBE3,BE4和SaBE4中融入Gam蛋白,均有效降低了插入/缺失突變的發(fā)生[23,25-27]。
除David LIU實驗室之外,日本神戶大學Akihiko Kondo實驗室于2016年8月在Science雜志上也報道了胞嘧啶單堿基基因編輯技術[28]。該實驗室將七鰓鰻的胞苷脫氨酶與SpCas9的突變體和UGI融合,開發(fā)了dCas9-PmCDA1-UGI和Cas9n-PmCDA1-UGI單堿基基因編輯系統(tǒng)。同年10月,上海交通大學常興課題組[29]把核酸酶缺陷的Cas9蛋白和誘導抗體高頻突變的人胞苷脫氨酶AID融合,開發(fā)了dCas9-AIDx單堿基編輯系統(tǒng):在一種UDG抑制因子的輔助下,dCas9-AIDx可以誘導特定的堿基C向T轉變,實現(xiàn)單堿基的精準編輯。隨后報道的CRISPR-X也使用了dCas9和AID突變體,與常興課題組的單堿基編輯系統(tǒng)有相似作用[30]。
胞嘧啶單堿基基因編輯技術能利用胞苷脫氨酶將C∶G堿基對轉換成T∶A堿基對,如果將胞苷脫氨酶換成腺苷脫氨酶,理論上可以實現(xiàn)A∶T堿基對轉換成G:C堿基對。但是,已發(fā)現(xiàn)的天然腺苷脫氨酶,比如大腸桿菌的TadA[31-32]、人ADAR2[33]、小鼠ADA[34]和人 ADAT2[35],僅作用于游離的腺嘌呤、腺苷、RNA中的腺苷或者錯配的RNA∶DNA異聚體,不能催化DNA鏈上的堿基A脫氨基[36]。因此,人工創(chuàng)造出能催化DNA鏈上的A堿基脫氨基成為此技術的關鍵環(huán)節(jié)。
David LIU實驗室率先實現(xiàn)了上述突破,他們選擇與APOBEC酶同源的大腸桿菌TadA酶作為改造對象。該酶作用于tRNA單鏈反密碼子環(huán),無需小分子激活劑即能催化tRNA上的堿基A脫氨基。將該酶與dCas9融合構建了TadA-dCas9的隨機突變(突變位點在TadA)質粒文庫,將細菌中抗生素抗性基因的關鍵位點突變成A∶T從而使抗性失效,細菌在抗生素環(huán)境中無法存活。只有具備DNA堿基編輯能力的突變TadA-dCas9的存在,在sgRNA的引導下,將突變的A∶T修復成G∶C后才能使細菌重新獲得抗性而存活。通過細菌對TadA酶的定向進化和蛋白質工程手段,經過7輪選擇優(yōu)化,David LIU實驗室成功獲得了將A∶T堿基對轉換成G∶C堿基對的腺嘌呤單堿基編輯器(adenine base editor,ABE),其中ABE7.10的編輯效率達到(58±4.0)%[24]。
ABE系統(tǒng)能將編輯窗口內的A堿基脫氨基而轉變?yōu)榧≤?,肌苷被當成G進行讀碼與復制,從而實現(xiàn)編輯窗口內A到G的突變。ABE7.10的編輯窗口大概包含4~6個核苷酸,目標堿基A在原型間隔序列(protospacer)上第4~7堿基位置,PAM在第21~23堿基位置。將檢測目標DNA位點由6個增加到17個,ABE7.10的編輯效率仍然達到(53±3.7)%,顯著高于經典BE3對C∶G至 T∶A的編輯效率[1],具有更低的靶位點非A→G突變和插入/缺失突變的產生(≤0.1%),而且脫靶率也很低[24]。
中國科學院上海植物逆境生物學研究中心的朱健康研究團隊[37]使用SaCas9與突變的TadA酶融合,開發(fā)了ABEP2,在某些位點的編輯效率可達61.3%,而且精確性也很高。
BE系統(tǒng)中胞苷脫氨酶rAPOBEC1的活性窗口有大概含5個核苷酸,目標堿基C在原型間隔序列上第4~8堿基的位置。常用的SpCas9的PAM NGG在第21~23堿基的位置,編輯窗口內的全部堿基C都有可能被編輯[23,27],這樣就會導致活性窗口中非目標的堿基C也會發(fā)生替換作用。而且因為大多數位點在靶點堿基下游缺少PAM序列,PAM NGG序列的要求限制了單堿基基因編輯系統(tǒng)可以編輯的基因組位點。因此,縮小編輯窗口或擴大PAM識別序列類型成為亟待解決的問題。
鑒于上述問題,David LIU實驗室通過多種嘗試,發(fā)現(xiàn)對胞苷脫氨酶進行突變,可以縮小編輯窗口。他們針對rAPOBEC1的催化位點W90及結合位點R126和R132進行突變檢測,發(fā)現(xiàn)W90Y,W90F,R126A,R126E和R132E突變均可縮小活性窗口。將這3個突變位點進行組合突變,篩選出了可以進一步縮小編輯窗口,提高編輯精準性的優(yōu)化編輯器:YE1-BE3(W90Y+R132E),YE2-BE3(W90Y+R126E),EE-BE3(R126E+R132E)和YEE-BE3(W90Y+R126E+R132E)。前3個編輯器的編輯窗口約2個堿基,編輯效率與BE3相似。YEE-BE3在平均編輯效率只降低了96.6%的情況下,將編輯窗口精確到了1個堿基C,大大提高了編輯的精準性。在包含多個C堿基的BE3編輯窗口內,這些優(yōu)化的編輯器具有編輯位置偏好性,一般是C5>C6>C7≈C4[38]。
目前,常用的SpCas9蛋白識別的PAM一般是NGG,SaCas9蛋白識別的PAM是NNGRRT,這在傳統(tǒng)CRISPR/Cas9基因編輯系統(tǒng)的應用中也受到限制。為了擴大CRISPR/Cas9基因編輯系統(tǒng)的靶向范圍,多個實驗室對Cas9蛋白進行了突變篩選,得到了許多優(yōu)化突變體[39-40]。為了擴大單堿基基因編輯系統(tǒng)可編輯的基因組位點,David LIU實驗室將優(yōu)化的Cas9突變體代替BE3和SaBE3中相應的Cas9蛋白,獲得了優(yōu)化的單堿基編輯器:VQRBE3,EQR-BE3,VRER-BE3 和SaKKH-BE3。他們識別的PAM分別是NGAN,NGAG,NGCG和NNNRRT,而且VQR-BE3和EQR-BE3的脫靶率更低[38]。
當然,上述對PAM識別的擴展對于龐大的基因組編輯來講是遠遠不夠的。2018年2月,David Liu實驗室在Nature上發(fā)表了新的研究成果,極大地拓寬了基因編輯的應用范圍[41-42]。該團隊利用噬菌體輔助持續(xù)進化(phage-assisted continuous evolu?tion,PACE)的定向進化技術,基于SpCas9開發(fā)出了新型基因編輯工具酶——xCas9。其中的xCas9 3.7除了能夠識別NGG PAM之外,對于NG,NNG,GAA,GAT及CAA這些PAM序列也能夠識別。將xCas9 3.7替換BE3和ABE7.10中的SpCas9,構建 xCas9(3.7)-BE3 和 xCas9(3.7)-ABE單堿基編輯器。研究發(fā)現(xiàn),在NGG PAM位點,xCas9(3.7)-BE3編輯效率為(37±10)%,而SpCas9-BE3的編輯效率為(28±5.2)%;在NGT,NGA和NGC PAM位點,xCas9(3.7)-BE3編輯效率分別為SpCas9-BE3的9.5,3.5和13倍;而在GAA 和GAT PAM位點,xCas9(3.7)-BE3編輯效率分別是SpCas9-BE3的50倍以上和100倍以上;xCas9(3.7)-ABE的編輯效率同樣高于SpCas9-ABE,在NGG PAM位點,xCas9(3.7)-ABE編輯效率為(69±3.7)%,而SpCas9-ABE的編輯效率為(48±2.1)%;在GAT PAM位點,xCas9(3.7)-ABE編輯效率為(16±1.5)%,而SpCas9-ABE未檢測到編輯(≤0.1%);在NGC和NGA PAM位點,xCas9(3.7)-ABE編輯效率分別為(21±2.5)%和(43±1.5)%,而SpCas9-ABE的編輯效率分別為(7.0±1.3)%和(22±1.2)%。xCas9 3.7脫靶率很低,xCas9 3.7的PAM序列識別靈活性、酶活性和保真性同時得到優(yōu)化的機制尚不明確。
除了上述對單堿基基因編輯系統(tǒng)的優(yōu)化,國內外的很多研究團隊在其他方面也進行了積極的探索,提高了單堿基編輯系統(tǒng)的精確性[43-45]。
單堿基基因編輯技術自首次報道至今,已經在疾病治療、動物疾病模型制作和藥物篩選等方面得到了廣泛的應用,取得了較好的編輯效果。
人類遺傳疾病中,約2/3是由單堿基突變造成的。在人類單堿基突變相關的疾病中,由C∶G突變?yōu)門∶A導致的疾病占48%,由A∶T突變?yōu)镚∶C導致的占疾病14%[24]。單堿基基因編輯技術為這些疾病的治療提供了有力的支持。PCSK9是高膽固醇血癥的重要靶點,PCSK9敲除可顯著降低血液中低密度脂蛋白膽固醇水平[46]。Chadwick等[47]將可導致PCSK9基因無義突變的BE系統(tǒng)導入成年小鼠的肝中,結果發(fā)現(xiàn),血液中PCSK9蛋白表達水平大幅下降(>50%),膽固醇水平降低約30%,而且未檢測到脫靶。HBB-28(A>G)突變是中國及東南亞β-地中海貧血病患者的主要致病因素。中山大學黃軍就課題組采集HBB-28(A>G)純合體患者的血液細胞和皮膚成纖維細胞,通過核移植技術構建突變胚胎,將BE3和sgRNA注射到核移植胚胎中,胚胎的基因修正效率超過了23%,證實了單堿基基因編輯系統(tǒng)可以針對單堿基突變的人類胚胎基因組進行精確的修復,為點突變遺傳性疾病的治療具有重要的臨床前研究意義[48]。
韓國首爾大學Jin-Soo Kim研究團隊率先利用BE系統(tǒng)進行了動物疾病模型的制備,他們將BE3的mRNA或融合蛋白與靶向抗肌萎縮蛋白基因Dmd以及酪氨酸酶基因tyr的sgRNA,通過電轉染或顯微注射方式導入小鼠的受精卵[49]。結果發(fā)現(xiàn),在靶向Dmd基因的F0代小鼠(9只)中,約50%發(fā)生無義突變,其中1只是純合子突變小鼠,在靶向Tyr基因的F0代小鼠(7只)中,基因編輯效率達100%,其中3只是純合子突變小鼠。利用BE3在非洲爪蟾的早期胚胎中對tyr基因進行單堿基基因編輯,編輯效率為20.5%,且無脫靶突變,這表明單堿基基因編輯技術是建立非洲爪蟾人類點突變疾病模型的有力工具[50]。在兔的疾病模型中,用BE3和ABE7.10系統(tǒng)在囊胚和F0代分別可以實現(xiàn)53%~88%和44%~100%的靶向突變效率,通過有效誘導無義突變和錯義突變,單堿基基因編輯技術在兔子中可以準確模擬人類此類疾病發(fā)病過程[51]。
上海交通大學常興課題組研發(fā)了dCas9-AIDx單堿基編輯系統(tǒng),其靶向性AID介導的堿基突變發(fā)生(targeted AID-mediated mutagenesis,TAM)技術可以將細胞內的特定DNA序列多樣化,從而進行高通量功能獲得性單堿基突變篩選。這一方法可以有效且迅速地模擬腫瘤細胞體內耐藥機制的異質性,從而進行腫瘤耐藥突變的篩選。該課題組用dCas9-AIDx在慢性粒細胞白血病細胞中編輯BCR-ABL,有效鑒定了慢性髓細胞樣白血病細胞中對伊馬替尼(imatinib)抗性的已知突變和新突變[29]。斯坦福大學遺傳學系和藥理學系的研究者報道的CRISPR-X也使用了dCas9和AID突變體,以及攜帶MS2修飾sgRNA,可以同時靶向多個基因組位點。研究者利用CRISPR-X突變了癌癥治療藥物硼波替單抗(替佐米,bortezomib)的靶點——PSMB5,結果從中鑒定了引發(fā)波替單抗耐藥性的已知和全新的突變[30]。由于耐藥金黃色葡萄球菌的出現(xiàn),迫切需要新的治療金黃色葡萄球菌感染的治療手段,研究者利用Cas9n(D10A)和APOBEC1融合形成單堿基編輯系統(tǒng)pnCasSA-BEC,能夠高效地使金黃色葡萄球菌發(fā)生點突變和基因失活,該系統(tǒng)的發(fā)展將極大地加速金黃色葡萄球菌藥物靶點的研發(fā)[52]。
相對于傳統(tǒng)的CRISPR/Cas9編輯技術,單堿基基因編輯技術對于基因組單堿基位點具有更高的編輯效率、更高的精確度和更低的脫靶率,由于不引入DSB,插入/缺失突變的發(fā)生率更低。因此,單堿基編輯技術成為生命科學領域全球研究的熱點。然而,目前所使用的單堿基編輯工具還存在著一些不足。
人類單堿基突變相關的疾病中,還存在G∶C突變?yōu)镃∶G(占11%),T∶A突變?yōu)锳∶T(占7%),A∶T突變?yōu)镃∶G(占6%)和C∶G突變?yōu)锳∶T(占15%)的疾?。?4],但目前的DNA單堿基基因編輯技術無法進行修正。因此,還需要進一步開發(fā)針對各種單堿基突變類型的單堿基編輯工具。
雖然有研究驗證了單堿基基因編輯技術在全基因組水平上的準確性[53],但仍然存在安全風險。主要表現(xiàn)在:①靶位點會產生C到非T或A到非G的轉換;②編輯窗口內非目標C或A堿基的編輯;③靶位點仍會產生極少量的插入/缺失突變;④脫靶效應雖然低,但仍然存在;⑤胞苷脫氨酶和優(yōu)化的大腸桿菌TadA酶,都具有結合DNA進行脫氨基的作用,如果脫氨酶的表達量過高,可能會對基因組的穩(wěn)定性產生不良影響。
雖然xCas9極大拓寬了基因編輯的應用范圍,但也只能夠直接靶向1/4人類基因組序列[41],而且David LIU實驗室僅在基因組的幾十個位點上進行了測試,現(xiàn)在還不能100%確定xCas9將比SpCas9更好,還需更多的實驗驗證。
單堿基基因編輯技術是將Cas9和胞苷脫氨酶或腺苷脫氨酶以及UGI等形成融合蛋白來行使作用,用得較多的是SpCas9,這使其序列組成比較長,如果用常用的基因治療載體——腺相關病毒進行轉染,則腺相關病毒的包裝容量限制了該技術的應用。SaCas9的編碼序列比SpCas9要小23%,這一大小差異使得SaCas9適于以病毒為載體的基因治療[54]。但是,SaCas9的PAM特異性又限制了編輯范圍,或許也可通過定向進化技術,像改造SpCas9那樣來改造SaCas9的PAM特異性。如果不使用病毒載體,則需要積極探索其他途徑,比如基于金納米簇的納米遞送體系[55],以期開發(fā)出更加安全高效的方法。