潘志文,高潔兒,陳偉庭,周 峰,姚 涓,姜大剛
(華南農業(yè)大學 生命科學學院,廣東 廣州 510642)
基因組編輯技術也稱為基因編輯或基因組工程,是指利用人工構建的特異性核酸酶對生物體核酸序列進行堿基替換、敲除和插入,對靶基因進行修飾的技術。在基因編輯過程中利用人工構建的序列特異性核酸酶,通過在生物體基因組(基因)特定位置(靶位點)制造DNA雙鏈斷裂(Double strand break,DSB),進而利用生物體自身的同源重組(Homologous recombination,HR)或非同源末端連接(Non-homologous end joining,NHEJ)修復機制對DNA雙鏈進行修復,實現(xiàn)基因組的定向編輯[1]。
在基因組編輯技術出現(xiàn)前,對基因功能的研究主要通過自然突變、物理或化學誘變、T-DNA隨機插入等方式獲得突變體,通過對突變體的研究獲得突變基因。這一過程耗時、費力,隨機性大,效率較低,無法實現(xiàn)定向對定點基因的精確位置進行修改?;蚪M編輯技術可定向敲除、修改生物體內的某個基因,或向生物體內定向插入某個基因(片段),使生物體獲得新的遺傳性狀。近年來,基因組編輯技術在基因功能研究、動植物育種、疾病治療等方面取得重要研究進展,在全球掀起了研究熱潮[2]。筆者等綜述了基因組編輯技術的類型及其在植物中的應用,以期為后續(xù)相應研究提供參考。
目前基因組編輯技術主要利用鋅指核酸酶(Zinc finger nucleases,ZFNs)[3]、類轉錄激活因子效應物核酸酶(Transcription activator-like effector nucleases,TALENs)[4]及成簇規(guī)律間隔短回文重復與關聯(lián)蛋白(Cluster regularly interspaced short palindromic repeats-associated proteins,CRISPR/Cas)系統(tǒng)[5]3種序列特異性核酸內切酶(Sequence specific nuclease,SSN)實現(xiàn)。
ZFNs是一類包含人工設計、具有特異性識別指定DNA序列功能的鋅指DNA結合域與非特異性的Fok I DNA切割域組成的人工核酸酶。鋅指DNA結合域能特異性識別一段9~12 bp的堿基序列(靶序列)并與之結合,包含一系列串聯(lián)的具有Cys2-His2結構、能識別并結合特定的堿基三聯(lián)體的鋅指蛋白。ZFNs技術需要針對靶位點兩端的雙鏈DNA序列各設計1個ZFN,2個ZFN的特異性DNA結合域會結合到靶位點,當2個識別位點間距為6~8 bp時,2個Fok I DNA切割域結合形成二聚體,對靶位點兩端的雙鏈DNA進行酶切,制造DSB,進而利用HR或NHEJ對基因組進行修飾[3]。
TALENs是一類人工核酸酶,包含具有識別指定DNA序列功能的中央結構域、具有Fok I核酸內切酶功能的C端結構域和具有核定位信號的N端結構域。中央結構域通常包含13~28個類轉錄激活因子效應物(Transcription activator-like effector,TALE)單元,可以識別并結合特定的DNA序列,1個TALE單元通常由34個氨基酸組成,每個TALE單元的第12位和第13位氨基酸為重復可變雙殘基(Repeat variant diresidue,RVD),是變化的并可以結合對應的1個DNA堿基,其余氨基酸序列高度保守,不同的RVD可以使TALE識別1種或多種DNA堿基。N端結構域主要是幫助TALENs定位于細胞核并發(fā)揮轉錄激活作用;C端結構域主要是核酸內切酶Fok I。TALENs與ZFNs類似,同樣需要針對靶位點左右兩端的雙鏈DNA序列各設計1個TALEN,2個TALEN的中央結構域會結合到靶位點兩端,2個C端結構域的Fok I結合形成二聚體,對靶位點兩端的雙鏈DNA進行酶切,制造DSB,進而利用HR或NHEJ對基因組進行修飾[4]。
CRISPR/Cas是原核生物中廣泛存在的識別入侵的外源核酸序列并對其進行針對性破壞的一套抗病毒的系統(tǒng)。CRISPR/Cas系統(tǒng)通常由CRISPR基因座和Cas基因2部分組成,依功能元件可分為2大類5小型(Ⅰ型、Ⅱ型、Ⅲ型、Ⅳ型和Ⅴ型)[6-7],目前應用最廣泛的CRISPR/Cas9屬于第2類Ⅱ型CRISPR/Cas系統(tǒng)[8]。
CRISPR/Cas9系統(tǒng)最先由CRISPR RNAs(crRNAs)、反式作用crRNA(Trans-activating crRNA,tracrRNA)和Cas9蛋白3種元件組成,后經改造,crRNA和tracrRNA融合形成具有特異性識別靶位點功能的向導RNA(Small-guide RNA,sgRNA),與具有核酸內切酶活性的Cas9蛋白組成CRISPR/Cas9系統(tǒng)。Cas9蛋白具有2個酶切活性結構域,即HNH核酸酶結構域和Ruv-C-Like核酸酶結構域,HNH核酸酶結構域負責切割與crRNA互補的堿基序列,Ruv-C-Like核酸酶結構域負責切割與crRNA互補的反義鏈。sgRNA包含長度為20 bp的RNA序列,與目的DNA序列互補,負責識別帶有前間隔序列鄰近基序(Protospacer adjacent motifs,PAM)的靶DNA序列,引導Cas9蛋白的2個結構域對靶位點雙鏈進行切割,制造DSB,進而利用HR或NHEJ對基因組進行修復[9-10]。
CRISPR/Cas9技術由于人工sgRNA構建方便,僅靠sgRNA就可以完成對靶位點的識別,因此效率更高,切割位點更精確[10]。早期的CRISPR/Cas9技術存在一定的脫靶率,近年來,研究人員在對CRISPR/Cas9及其他不同CRISPR系統(tǒng)進行研究,目的是發(fā)現(xiàn)和改造出操作更簡單、編輯效率更高、脫靶效應更低的基因組編輯系統(tǒng),如CRISPR/ Cpf1(Cas12a)系統(tǒng)。
CRISPR/Cpf1是不同于CRISPR/Cas9的第2類Ⅴ型CRISPR系統(tǒng)[8]:Cpf1酶比標準Cas9蛋白小,易于運輸;Cpf1僅需1條較短的crRNA即可形成Cpf1復合物實現(xiàn)對靶位點的識別與剪切;Cpf1復合物切割靶位點雙鏈形成的DSB位點是偏移的,形成“短懸端”(Overhang),不同于Cas9復合物切割靶位點雙鏈的同一位置形成“平端”(Blunt ends),更準確高效地整合DNA片段;Cpf1制造的DSB位點遠離其識別位點,若切割位點靶基因序列發(fā)生突變,允許切割位點再度進行切割,校正基因編輯;Cpf1識別的PAM序列與Cas9不同,為2~3個T堿基,大大擴展了PAM序列和基因組編輯的識別位點范圍;Cpf1能切割DNA與RNA,Cas9只能切割DNA[11-12]。
ZFNs是最早被廣泛應用的基因組定點修飾技術,但設計依賴于目標序列,不能識別任意靶DNA,結合域構建繁瑣、難度大、時間長、脫靶率高、應用受到限制。TALENs是目前商業(yè)化應用比較成功的基因組編輯技術,其識別區(qū)域可以設計成不同長度、識別任意DNA序列的模塊化蛋白,較ZFNs具有更好的靈活性、特異性高、脫靶效應低,但TALENs模塊的設計組裝和篩選過程比較復雜,需大量測序工作,可操作性不高。ZFNs和TALENs技術都是依賴于DNA結合蛋白模塊,而CRISPR/Cas系統(tǒng)僅靠人工合成的sgRNA就可完成對靶位點的識別,設計使用簡單,成本較低,已逐步發(fā)展成基因組編輯方面的主流技術[13]。
由于CRISPR/Cas技術能大大減少植物基因組改變帶來的非預期效應,其突變效率、精確度及安全性更高,耗費時間更少,發(fā)展應用前景巨大。我國的多個實驗室對CRISPR在植物基因組編輯技術研究方面取得了迅猛的發(fā)展,在玉米、水稻、大豆、小麥、油菜等作物的基因功能研究中得到成功應用。
中國科學院遺傳與發(fā)育生物學研究所在植物基因組編輯技術與分子育種等方面取得重要成果。ZHANG等[14]建立了小麥CRISPR/Cas9瞬時表達的基因組編輯體系,通過CRISPR/Cas9對六倍體及四倍體小麥的7個不同基因進行定點敲除,獲得不含外源基因且其他32個潛在脫靶位點均未發(fā)生脫靶效應的T0代小麥純合敲除突變體,證明建立的多倍體小麥CRISPR/Cas9體系具有更高的特異性。LIANG等[15]利用CRISPR/Cas9技術,開發(fā)出將體外轉錄體(In vitro transcripts,IVTs)和核糖核酸復合物(Ribonucleoprotein,RNPs)導入小麥幼胚的基因組編輯體系,應用該方法只需要9~11周即可獲得不含外源DNA的靶向修飾T0代小麥突變體。ZONG等[16]利用Cas9突變體(nCas9-D10A)融合人類胞嘧啶脫氨酶(APOBEC 3A,A3A)和尿嘧啶糖基化酶抑制劑(Uracil glycosylase inhibitor,UGI),成功構建不受GC序列影響具有更高編輯活性的單堿基編輯系統(tǒng)A3A-PBE,在小麥、水稻及馬鈴薯中實現(xiàn)高效的C-T單堿基編輯。
中國科學院上海生命科學研究院ZHANG等[17]構建的新型多重CRISPR/Cas9平臺,采用三重克隆的方法把6個擬南芥靶位點的sgRNA克隆到一個雙元載體中,并在擬南芥中得到共表達,在擬南芥中實現(xiàn)快捷高效地編輯多個目的基因。WANG等[18]在水稻中利用CRISPR/Cpf1系統(tǒng)開發(fā)出簡單高效的多基因位點編輯系統(tǒng),效率達40%以上,同時該系統(tǒng)比CRISPR/Cas9系統(tǒng)更簡便。
華南農業(yè)大學在植物基因組編輯技術利用方面取得了重要進展。XIE等[19]開發(fā)了高效、簡便的CRISPR/Cas9系統(tǒng),并推出了在線基因組編輯工具軟件CRISPR-GE;針對獲得的基因編輯后代的測序,開發(fā)了在線軟件“簡并序列解碼”(Degenerate Sequence Decoding,DSDecode),其對利用TALENs和CRISPR技術進行植物基因組編輯的雙等位基因突變體后代的基因分型非常方便[20-21];ZHU等[22]開發(fā)了基于CRISPR系統(tǒng)的多基因載體系統(tǒng)(TransGene Stacking II,TGS II),用于多基因高效快速組裝及同時轉化植物。劉耀光研究員團隊利用TALENs和CRISPR系統(tǒng)改良基因組編輯的步驟,為植物多基因轉化、復雜代謝途徑的基因表達調控、復雜性狀的遺傳改良與植物分子育種等提供了高效的技術平臺[8]。
由于CRISPR/Cas技術在植物基因組編輯技術方面取得了迅猛的發(fā)展,目前已經在油菜、蘑菇、玉米、水稻等的育種中得到成功應用。
Cibus公司研發(fā)了快速性狀選育系統(tǒng)(Rapid Trait Development System,RTDSTM)專利技術,成功獲得了耐磺酰脲類除草劑的基因組編輯油菜SU CanolaTM,由于SU油菜不含外源基因,已被美國和加拿大政府批準商業(yè)化應用[23],是全球第一個商品化的基因組編輯作物,且SU油菜及配套的除雜草產品受美國種植者的歡迎。蘑菇在采摘后,極易發(fā)生褐變,影響質量;而且蘑菇對磕碰極為敏感,揀貨和包裝過程中的磕碰加速蘑菇腐爛。利用CRISPR/Cas9技術對雙孢菇(Agaricusbisporus)中一類編碼導致褐變的多酚氧化酶(Polyphenol oxidase,PPO)基因家族進行基因組編輯,刪除蘑菇基因組中一個基因的幾個堿基,將這類酶的活性降低了30%,使雙孢菇獲得了抗褐變的能力,由于獲得的蘑菇不含有來源于病毒細菌等的外源DNA,美國農業(yè)部(United States Department of Agriculture,USDA)豁免了對其進行轉基因方面的監(jiān)管[24],也預示著未來將有更多基因組編輯植物產品在接受評估之后走向人們的餐桌。
杜邦先鋒公司的研究人員對玉米ARGOS8基因(一個乙烯反應的負調控因子)的表達進行研究,利用CRISPR/Cas9技術,對ARGOS8基因進行編輯,獲得抗旱高產的基因編輯玉米[25]。美國科迪華農業(yè)技術公司利用CRISPR/Cas9技術,獲得Waxy基因缺失的高產糯玉米品種,且美國、阿根廷、巴西、智利已經允許此項糯玉米商業(yè)化生產,確定不對其進行轉基因生物監(jiān)管[26]。
雜交水稻為我國的糧食安全作出了巨大貢獻,其中兩系雜交水稻占約1/3的種植面積。但是,兩系雜交水稻中溫敏不育系的培育,需要依靠傳統(tǒng)的雜交和回交方法在不同的光、溫條件下進行篩選,花費大量的人力物力和較長的周期。ZHOU等[27]用CRISPR/Cas9系統(tǒng)對我國最廣泛使用的溫敏不育基因TMS5進行定點突變,培育不帶轉基因成分的實用型溫敏不育系,獲得了11個新的不含有轉基因成分的溫敏核雄性不育系,用于快速培育具有商業(yè)化應用價值的兩系溫敏水稻不育系,對雜交水稻育種具有重要影響。
鎘(Cd)是人體非必需元素,隨工業(yè)化進程的加速,土壤和水體受到鎘污染后,可在植物中富集,并通過食物鏈進入人體引起中毒。TANG等[28]利用CRISPR/Cas9系統(tǒng)敲除水稻中的金屬轉運基因OsNramp5,開發(fā)出低鎘積累秈稻新品系,為開發(fā)低鎘污染、安全的秈稻品種提供了一種實用的方法,最大限度地降低糧食中鎘的污染風險,通過基因組編輯技術,減少作物對于有害物質的吸收,確保作物不受有害物質污染,意義重大。綜上,基因組編輯技術在植物應用對于造福人類具有巨大的應用前景。
以CRISPR/Cas技術為代表的基因組編輯技術日益發(fā)展,在植物基因功能研究、遺傳育種等方面有著重要的應用價值,已成為分子生物學領域的重要手段。由于基因組編輯技術的脫靶效應,基因組編輯技術的應用仍受一定限制。CRISPR/Cas技術的出現(xiàn),使得基因組編輯技術的發(fā)展迅速。由于組成CRISPR/Cas的元件構成簡單,僅由Cas蛋白和sgRNA組成,因此,改良途徑也相對簡單,可以通過對sgRNA靶位點識別序列進行優(yōu)化和人工改造或嘗試不同的Cas蛋白等方式。目前,已有對CRISPR/Cas技術優(yōu)化改良的大量報道[8,13]。CRISPR/Cas技術由于其操作設計簡單等諸多優(yōu)點,加上其脫靶改良技術的不斷發(fā)展,被越來越廣泛地應用于各種植物基因組功能研究和作物改良中。
隨著高通量測序技術的發(fā)展與普及,靶位點的分析與選擇和編輯后代基因型分析也將變得更加方便快捷,同時,科學家們針對基因組編輯技術開發(fā)的數據分析和設計軟件系統(tǒng)(如CRISPR-GE、DSDecode等)[19-21]及針對基因組編輯轉化的多基因編輯系統(tǒng)(如TGS II)[22]、單堿基編輯系統(tǒng)(如A3A-PBE)[16]等,都大大加快基因組編輯技術的應用。此外,隨著大數據等技術的發(fā)展,靶位點的選擇及核酸酶的構建會更加容易,基因組編輯技術將更精準、更高效地為人類服務。