劉雅睿
(中國海洋大學(xué) 海洋生命學(xué)院,山東青島 266003)
基因編輯是研究基因功能的重要方法之一,目前研究人員大多使用人工核酸內(nèi)切酶(Engineered Endonuclease,EEN)進(jìn)行基因編輯,常見的EEN包括鋅指核酸內(nèi)切酶(Zinc Finger Endonuclease,ZFN)、類轉(zhuǎn)錄激活因子效應(yīng)物核酸酶(Transcription Activator-Like Effector Nuclease,TALEN)以及CRISPR/Cas(Clustered Regulatory Interspaced Short Palindromic Repeats/CRISPR associated proteins)系統(tǒng)[1]?;诘鞍踪|(zhì)-DNA 識別的ZFN、TALEN 定位新位點(diǎn)時需要設(shè)計復(fù)雜的蛋白質(zhì),因此很難應(yīng)用于高通量技術(shù)。與其相比,基于sgRNA 指導(dǎo)的CRISPR/Cas 系統(tǒng)具有多樣性、模塊化、高效率的特點(diǎn),且易于設(shè)計合成,是基因組編輯及基因表達(dá)調(diào)控方面的理想工具。
CRISPR/Cas9 系統(tǒng)是存在于許多細(xì)菌和大部分古菌中的適應(yīng)性免疫系統(tǒng),可以抵御病毒、質(zhì)粒等外源遺傳物質(zhì)入侵細(xì)胞[2]。CRISPR 系統(tǒng)由多樣的Cas9蛋白和引導(dǎo)RNA(guide RNA,gRNA)組成。引導(dǎo)RNA 包含兩部分,分別是成熟的crRNA(CRISPR RNA)和tracrRNA(trans-activating RNA)。當(dāng)外源遺傳物質(zhì)(如DNA)入侵生物體時,個體的CRISPR 系統(tǒng)會以外源DNA 的原間隔序列鄰近基序(Protospacer Adjacent Motif,PAM)序列為靶點(diǎn),捕獲切割PAM 鄰近的外源DNA,并將其作為間隔序列整合到CRISPR的兩個重復(fù)序列之間,轉(zhuǎn)錄后得到pre-crRNA,再經(jīng)過剪切得到的成熟的crRNA,與tracrRNA 形成雙鏈gRNA 結(jié) 構(gòu)。gRNA 與Cas9 蛋 白 組成 具 有DNA 內(nèi)切酶活性的復(fù)合物,在gRNA 的引導(dǎo)下與外源DNA特異性結(jié)合,并使用Cas9 蛋白的核酸結(jié)構(gòu)域?qū)ν庠碊NA 進(jìn)行切割。
不同生物體內(nèi)的CRISPR 系統(tǒng)有所不同,可以大致分為I 型、Ⅱ型、Ⅲ型三類。其中釀膿鏈球菌(Streptococcus pyogenes)的Ⅱ型CRISPR 系統(tǒng)由成熟的crRNA、tracrRNA 構(gòu)成的sgRNA(single guide RNA)及Cas9 蛋白組成。Cas9-sgRNA 復(fù)合物與目標(biāo)DNA 結(jié)合后,Cas9 蛋白的HNH、RuvC 結(jié)構(gòu)域分別切割與gRNA 互補(bǔ)的DNA 目標(biāo)鏈和非目標(biāo)鏈,導(dǎo)致雙鏈斷裂。如果Cas9 蛋白的HNH 結(jié)構(gòu)域第840 位由組氨酸突變?yōu)楸彼幔襌uvC 結(jié)構(gòu)域第10 位由天冬氨酸突變?yōu)楸彼?,這兩個核酸酶結(jié)構(gòu)域就會處于失活狀態(tài),失去剪切DNA 的能力,通常把這種核酸酶失活的Cas9 蛋白稱為dCas9(deficient Cas9)蛋白。dCas9 雖然失去了剪切DNA 的能力,但依然能在sgRNA 的引導(dǎo)下與DNA 特異性結(jié)合,因此可以用于基因組轉(zhuǎn)錄調(diào)控、表觀遺傳學(xué)修飾、活細(xì)胞成像等領(lǐng)域[3]。本文根據(jù)已有報道,總結(jié)了CRISPR/dCas9 系統(tǒng)在不同領(lǐng)域的研究進(jìn)展及應(yīng)用現(xiàn)狀,并對其未來的研究進(jìn)行展望。
dCas9 是依賴RNA 的DNA 結(jié)合蛋白,可以不改變目標(biāo)基因序列,直接對目標(biāo)基因轉(zhuǎn)錄進(jìn)行修飾及調(diào)控。將dCas9 與不同效應(yīng)物融合進(jìn)行工程化改造,便可以實(shí)現(xiàn)序列特異性基因組調(diào)控。典型應(yīng)用就是CRISPRi(CRISPR interference)和CRISPRa(CRISPR activation)。
CRISPRi 意為CRISPR 干擾技術(shù),可以干擾RNA的轉(zhuǎn)錄。在以細(xì)菌為代表的原核生物中,dCas9可以通過空間位阻單獨(dú)阻斷RNA 聚合酶(RNA Polymerase,RNAP)的轉(zhuǎn)錄延伸,從而阻斷轉(zhuǎn)錄。QI 等[4]的研究表明,CRISPRi的沉默效應(yīng)可以被誘導(dǎo)和逆轉(zhuǎn),且通過全轉(zhuǎn)錄組鳥槍法測序發(fā)現(xiàn)CRISPRi sgRNA 引導(dǎo)的基因沉默具有高度特異性,沒有顯著的脫靶效應(yīng)。而在真核生物中,單一dCas9 的CRISPRi 抑制轉(zhuǎn)錄效率較低,為了提高CRISPRi 效果,可以將dCas9 與抑制轉(zhuǎn)錄的復(fù)合物結(jié)合來沉默基因表達(dá)。如GILBERT等[5]將dCas9 和抑制轉(zhuǎn)錄的Krüppel 相關(guān)框(KRAB)結(jié)構(gòu)域融合,可以有效抑制人類細(xì)胞轉(zhuǎn)錄。
CRISPRa 即通過CRISPR 系統(tǒng)激活或增強(qiáng)轉(zhuǎn)錄。BIKARD 等[6]將RNAP 的ω 亞基融合到dCas9的C 端,這個復(fù)合物可以定向到啟動子區(qū)域,有效募集RNAP 以激活基因表達(dá)。此外,dCas9 還可以與哺乳動物細(xì)胞中的VP64、p65AD 等轉(zhuǎn)錄激活因子相結(jié)合,激活基因表達(dá)。為了提高CRISPRa 的效率,可以同時招募多種轉(zhuǎn)錄激活因子來上調(diào)基因轉(zhuǎn)錄,常見的有協(xié)同激活誘導(dǎo)因子(Synergistic Activation Mediator,SAM)、SunTag、VPR(VP64-p65-Rta)系統(tǒng)。(1)KONERMANN 等[7]設(shè)計的SAM 系統(tǒng)以sgRNA和dCas9 為支架募集多種協(xié)同作用激活因子,在該系統(tǒng)中,dCas9-VP64 與含有兩個MS2 RNA 的sgRNA結(jié)合,形成的MS2-VP64 可以招募同源蛋白MCP,形成MCP-p65-HSF1 激活結(jié)構(gòu)域。(2)SunTag 是一種重復(fù)多肽支架,與dCas9 結(jié)合后,抗GCN4 可以招募多個轉(zhuǎn)錄激活因子放大基因表達(dá)信號。如LIU 等[8]使用dCas9-SunTag-VP64 激活內(nèi)源性O(shè)ct4 和Sox2,觸發(fā)細(xì)胞重編程,誘導(dǎo)產(chǎn)生多功能干細(xì)胞。(3)VPR系統(tǒng)則是將VP64-p65-Rta 串聯(lián)融合后與dCas9 連接,形成三方激活域。CHAVEZ 等[9]的實(shí)驗(yàn)發(fā)現(xiàn)dCas9-VPR 對內(nèi)源基因的激活能力遠(yuǎn)高于dCas9-VP64(22 ~320 倍),且VPR 可通過多基因靶向激活多位點(diǎn),提高整個基因組的表達(dá)水平。
除了可以將單個dCas9 蛋白與轉(zhuǎn)錄抑制或激活因子融合,調(diào)節(jié)某個特異性基因的轉(zhuǎn)錄之外,還可以通過支架RNA(scaffold RNA,scRNA)來對同一細(xì)胞內(nèi)的不同基因進(jìn)行多模式調(diào)控。ZALATAN 等[10]將CRISPR/dCas9 的sgRNA 與RNA 適配體相融合,構(gòu)建scRNA。RNA 適配體可以招募與激活因子或阻遏物融合的RNA 結(jié)合蛋白調(diào)控轉(zhuǎn)錄,通過在每個scRNA 上設(shè)計多個RNA 募集位點(diǎn),便可以獨(dú)立調(diào)整每個靶位點(diǎn)的激活或抑制強(qiáng)度,能同時調(diào)節(jié)多個基因的轉(zhuǎn)錄表達(dá)。
表觀遺傳是指DNA 序列改變之外基因組功能表達(dá)發(fā)生的可遺傳變化,其中以DNA 與組蛋白修飾為代表的染色質(zhì)編輯是表觀遺傳學(xué)領(lǐng)域的重要部分。dCas9 可以用類似調(diào)控靶向基因轉(zhuǎn)錄的方式,招募表觀遺傳修飾域來改變其靶向DNA 位點(diǎn)的表觀遺傳標(biāo)記,從而導(dǎo)致相關(guān)基因表達(dá)的變化。
(1)DNA 甲基化是重要的表觀遺傳標(biāo)記之一,其甲基化活性對目標(biāo)區(qū)域具有特異性,并且可以在有絲分裂中遺傳。VOJTA 等[11]將dCas9 與DNA 甲基轉(zhuǎn)移酶DNMT3A 結(jié)合,其融合蛋白能在以PAM 序列下游27 bp 為中心,約35 bp 寬的區(qū)域中靶向CpG 甲基化,且多個gRNA 可以將dCas9-DNMT3A 復(fù)合物靶向多個相鄰位點(diǎn),使啟動子甲基化水平升高,從而沉默基因表達(dá)。(2)而在DNA 去甲基化方面,Tet雙加氧酶的催化結(jié)構(gòu)域可以氧化甲基形成5-羥甲基胞嘧啶,然后通過DNA 糖基化酶將其恢復(fù)為未修飾胞嘧啶來實(shí)現(xiàn)去主動甲基化。如LIU 等[12]構(gòu)建了dCas9-Tet1 融合蛋白在分裂細(xì)胞中有效靶向去甲基化,激活基因表達(dá);XU 等[13]將MS2 RNA 的兩個拷貝插入到sgRNA 中,dCas9 與Tet 催化域(Tet-CD)連接,兩者融合形成dCas9-Tet1-CD 和MS2-Tet1-CD,可精準(zhǔn)實(shí)現(xiàn)目標(biāo)基因的去甲基化和激活,提高轉(zhuǎn)錄效率。
組蛋白修飾也是重要的表觀遺傳標(biāo)記。組蛋白是DNA 纏繞的線軸,是染色質(zhì)的主要成分。組蛋白修飾包括賴氨酸或精氨酸甲基化、賴氨酸乙酰化、賴氨酸泛素化或絲氨酸磷酸化等,這些修飾能改變?nèi)旧|(zhì)的結(jié)構(gòu)和組織,從而調(diào)節(jié)基因調(diào)控過程。例如組蛋白H3K4 二甲基化和三甲基化以及許多殘基上的乙?;ǔEc活躍轉(zhuǎn)錄的基因有關(guān),而H3K9 和H3K27 二甲基化和三甲基化會壓縮染色質(zhì)使其沉默[14]。THAKORE 等[15]發(fā)現(xiàn)dCas9-KRAB 靶向調(diào)節(jié)珠蛋白基因的H2S 增強(qiáng)子時,會特異性誘導(dǎo)增強(qiáng)子處H3K9me3,使珠蛋白基因表達(dá)沉默;KEARNS 等[16]將從腦膜炎雙球菌(Neisseria meningitidis)中加工得到的Nm dCas9 與組蛋白去甲基化酶LSD1 連接形成Nm dCas9-LSD1 復(fù)合物,靶向作用于小鼠胚胎干細(xì)胞的增強(qiáng)子,發(fā)現(xiàn)dCas9-LSD1 靶向增強(qiáng)子區(qū)域的H3K4me2、H3K27ac 顯著下調(diào),有效抑制了由靶向增強(qiáng)子控制的基因表達(dá);而HILTON 等[17]采用另一種方法,將Sp dCas9 和Nm dCas9 與組蛋白乙酰轉(zhuǎn)移酶p300 的催化核心域(p300core)融合,dCas9-p300core 使增強(qiáng)子和啟動子的H3K27 乙?;黾?,從而增強(qiáng)轉(zhuǎn)錄水平。
CRISPR/dCas9 系統(tǒng)和其他基因編輯技術(shù)一樣存在脫靶效應(yīng),學(xué)者們針對脫靶效應(yīng)的改善也進(jìn)行了大量的工作,如GUILINGER 等[18]將dCas9 與FokI核酸酶結(jié)構(gòu)域融合,嘗試降低其脫靶效應(yīng)。雖然CRISPR/dCas9 系統(tǒng)仍有缺點(diǎn),但它引入可逆DNA 表觀遺傳修飾,調(diào)控多個基因靶向表達(dá)的特性已經(jīng)在基因組成像、植物研究及癌癥治療方面得到了實(shí)際應(yīng)用。
染色質(zhì)的時空組織和動力學(xué)在調(diào)節(jié)基因組功能中起關(guān)鍵作用。目前細(xì)胞成像主要依賴于熒光標(biāo)記的DNA 結(jié)合蛋白,常見的熒光原位雜交技術(shù)(Fluorescent in Situ Hybridization,F(xiàn)ISH)雖然能通過改變核酸探針的堿基序列來與不同目標(biāo)序列匹配,但樣本固定和DNA 變性使FISH 不能實(shí)時成像。而CRISPR 系統(tǒng)既有核酸探針的靈活性,又具有能與DNA 結(jié)合的蛋白,因此CRISPR 系統(tǒng)是核細(xì)胞動態(tài)成像的理想工具。
CHEN 等[19]首次利用CRISPR 系統(tǒng)構(gòu)建了活細(xì)胞成像系統(tǒng),該系統(tǒng)由增強(qiáng)型綠色熒光蛋白(Enhanced Green Fluorescent Protein,EGFP)、dCas9 及結(jié)構(gòu)優(yōu)化的sgRNA 構(gòu)成。研究人員對sgRNA 進(jìn)行了AU 堿基對翻轉(zhuǎn),以去除Pol-Ⅲ終止子,防止轉(zhuǎn)錄過早終止,還擴(kuò)展了結(jié)合dCas9 的發(fā)卡結(jié)構(gòu),這些改造提高了成像效率。該成像系統(tǒng)能可視化重復(fù)或非重復(fù)的基因組序列,報告端粒的長度變化和運(yùn)動,還可以檢測整個細(xì)胞周期基因位點(diǎn)的動態(tài)。TANENBAUM 等[20]使用SunTag 招募多達(dá)24 個綠色熒光蛋白(Green Fluorescent Protein,GFP)拷貝,可以對活細(xì)胞的單個蛋白質(zhì)分子進(jìn)行長期成像。DENG 等[21]發(fā)現(xiàn)體外組裝的熒光dCas9-sgRNA 復(fù)合物可以有效且特異性地在近著絲粒區(qū)、著絲粒、G 富集端粒和編碼基因位點(diǎn)附近標(biāo)記DNA 靶序列,他們將這種方法命名為CASFISH (Cas9-mediated Fluorescence in Situ Hybridization),即Cas9 介導(dǎo)的熒光原位雜交。研究證實(shí),CASFISH 可用于具有多種顏色的多個序列特異性基因組區(qū)域成像,且這些多重標(biāo)記較為穩(wěn)定;學(xué)者們還制備了成年小鼠大腦的低溫恒溫器切片,并對著絲粒和端粒進(jìn)行了CASFISH 測定,表明固定的細(xì)胞和組織也可以通過體外組裝的熒光標(biāo)記的dCas9-sgRNA 復(fù)合物進(jìn)行有效標(biāo)記。WANG 等[22]報道了一種稱為CRISPR 活細(xì)胞熒光原位雜交(CRISPR Live-cell Fluorescent in Situ Hybridization,CRISPR LiveFISH)的實(shí)時成像方法:CRISPR LiveFISH 將dCas9 和熒光標(biāo)記的sgRNA 在體外組成熒光核糖核蛋白(fRNP),通過電穿孔將fRNP 復(fù)合物導(dǎo)入活細(xì)胞中,隨后與DNA 靶序列結(jié)合。CRISPR LiveFISH與活細(xì)胞兼容,可以跟蹤基因組編輯、染色體易位和轉(zhuǎn)錄的實(shí)時動態(tài),且dCas9-gRNA-DNA 復(fù)合物十分穩(wěn)定、不易降解,提高了信噪比,可用于診斷染色體疾病。
CRISPR/dCas9 系統(tǒng)在植物中的研究應(yīng)用以轉(zhuǎn)錄調(diào)控為主。在植物的生長過程中,增強(qiáng)對外界的脅迫耐受性十分重要,而植物的耐受性又受到體內(nèi)復(fù)雜的調(diào)控網(wǎng)絡(luò),包括代謝、信號傳導(dǎo)和轉(zhuǎn)錄調(diào)控之間的多方面相互作用[23]。因此,使用CRISPR/dCas9 調(diào)控部分目標(biāo)基因的轉(zhuǎn)錄可能有利于增強(qiáng)作物的脅迫抗性,從而提高其產(chǎn)量和經(jīng)濟(jì)價值。例如PARK 等[24]使用dCas9-VP16-p65 激活目標(biāo)基因AVP1 轉(zhuǎn)錄,使擬南芥積累更多的K+、Na+,提高了植物對干旱脅迫的耐受性。
除了通用的調(diào)控轉(zhuǎn)錄方法,CRISPR/dCas9 系統(tǒng)還可以與植物轉(zhuǎn)錄效應(yīng)子結(jié)合,特異性地調(diào)控轉(zhuǎn)錄。植物特異性轉(zhuǎn)錄調(diào)節(jié)因子包含了植物獨(dú)有的、高效的轉(zhuǎn)錄調(diào)控序列,在調(diào)節(jié)復(fù)雜的生物過程中起著核心作用。例如乙烯響應(yīng)因子/乙烯響應(yīng)元件結(jié)合蛋白(ERF/EREBP)家族包含的強(qiáng)激活結(jié)構(gòu)域EDLL 和阻遏結(jié)構(gòu)域SRDX,可以與dCas9 融合激活或抑制基因表達(dá)[25]。MORADPOUR 等[26]概述了目前促進(jìn)植物中CRISPR 轉(zhuǎn)錄激活的3 種策略:(1)將各種激活劑與dCas9 串聯(lián),較常用的轉(zhuǎn)錄激活結(jié)構(gòu)域包括dCas9-VP64、dCas9-EDLL 以及將兩者結(jié)合的dCas9-VP64-EDLL;(2)使用修飾的gRNA 支架來招募轉(zhuǎn)錄激活因子,多采用MS2 適配體插入sgRNA 的莖環(huán)形成新的gRNA 支架,構(gòu)建更強(qiáng)的轉(zhuǎn)錄激活系統(tǒng);(3)使用多路轉(zhuǎn)錄激活系統(tǒng)來同步激活植物中的多個基因,如LOWDER 等[27]開發(fā)的高激活效率CRISPR-Act2.0 系統(tǒng),可以上調(diào)單子葉植物和雙子葉植物中的多個基因表達(dá)。
在抑制植物轉(zhuǎn)錄方面,以dCas9 結(jié)合阻遏結(jié)構(gòu)域SRDX 為主,目前已經(jīng)報告了擬南芥中和本塞姆氏煙草中利用dCas9-3xSRDX 抑制轉(zhuǎn)錄的實(shí)例[28-29]。
癌癥是一種以癌基因和腫瘤抑制基因的多種遺傳和表觀遺傳改變?yōu)樘卣鞯募膊 =陙?,癌癥治療策略已經(jīng)從手術(shù)轉(zhuǎn)向有針對性的精準(zhǔn)醫(yī)療。除了遺傳異常外,表觀遺傳失調(diào)是癌癥的共同特征,其中,異常的DNA 甲基化和可逆的組蛋白修飾是與癌癥關(guān)聯(lián)最明顯的表觀遺傳改變,參與腫瘤的發(fā)生、分化和轉(zhuǎn)移[30]。CRISPR/dCas9 作為一種能定向進(jìn)行表觀遺傳編輯的分子工具,可以逆轉(zhuǎn)表觀遺傳學(xué)修飾,在抗癌治療中頗有前景。用于表觀遺傳編輯的表觀遺傳效應(yīng)子大致分為組蛋白和DNA 修飾劑,其酶促反應(yīng)可以催化轉(zhuǎn)錄激活或抑制組蛋白/DNA 修飾。表觀遺傳編輯的第一種策略是僅使用催化結(jié)構(gòu)域來構(gòu)建表觀遺傳效應(yīng)電路,以避免酶的共價變構(gòu)調(diào)節(jié)問題;第二種策略是在真核系統(tǒng)中利用原核DNA 甲基轉(zhuǎn)移酶進(jìn)行修飾[31]。
治療性sgRNA-dCas9 首先應(yīng)用于體外細(xì)胞系。RAHMAN 等[32]總結(jié)了dCas9 對癌癥的體外作用:dCas9 通過與表觀遺傳效應(yīng)子融合形成sgRNAdCAS9-EE,靶向乳腺癌、肺癌、肝癌、結(jié)腸癌、宮頸癌和子宮內(nèi)膜癌癌細(xì)胞的原癌基因(GRN、FHL2、CNKSR1)或抑癌基因(PTEN、BRCA1、CDKN2A、RASSF1、HIC1等),抑制腫瘤的侵襲和遷移。另一方面,CRISPR 系統(tǒng)的內(nèi)在機(jī)制決定了它只能在其靶細(xì)胞內(nèi)部發(fā)揮作用,可以通過物理方法、以腺病毒為代表的病毒載體或合成脂質(zhì)、聚合物和無機(jī)顆粒等非病毒載體這三種方法將sgRNA-dCas9 系統(tǒng)遞送到體內(nèi)。CRISPR/dCas9 的癌癥體內(nèi)治療中可分為三階段[33]:第一階段,藥物在血液循環(huán)過程中保持穩(wěn)定;第二階段,藥物在腫瘤組織中積累;第三階段,藥物進(jìn)入癌細(xì)胞,從核內(nèi)體逸散到細(xì)胞質(zhì),最后進(jìn)入細(xì)胞核調(diào)節(jié)目標(biāo)基因。同時,CRISPR/dCas9 與轉(zhuǎn)錄效應(yīng)物融合后,可以與癌癥治療藥物聯(lián)合發(fā)揮作用,這些藥物的作用機(jī)制是調(diào)節(jié)癌基因和腫瘤抑制基因的表達(dá)或使多重耐藥基因失活[34]。兩者的協(xié)同作用或互補(bǔ)性可以增強(qiáng)治療效果。
本文介紹了CRISPR/dCas9 系統(tǒng)的作用機(jī)制,總結(jié)了近年來CRISPR/dCas9 系統(tǒng)在基因組調(diào)控、表觀遺傳學(xué)修飾,以及其在基因組成像、植物研究、癌癥治療方面的實(shí)際應(yīng)用。隨著修飾工具的優(yōu)化與開發(fā),CRISPR/dCas9 在不同領(lǐng)域得到了更廣泛的應(yīng)用。但CRISPR/dCas9 技術(shù)仍面領(lǐng)著挑戰(zhàn),實(shí)際操作中依舊存在脫靶效應(yīng)、sgRNA 設(shè)計、目標(biāo)位點(diǎn)選擇和sgRNAdCas9 遞送系統(tǒng)方面的難題。隨著科學(xué)家對CRISPR系統(tǒng)原理的理解不斷深入,CRISPR/dCas9 技術(shù)會更為成熟,并在更多的領(lǐng)域中得到應(yīng)用。