林峻, 陳玨, 黃佳敏
(福州大學(xué)生物科學(xué)與工程學(xué)院, 福州大學(xué)應(yīng)用基因組學(xué)研究所, 福建 福州 350108)
基因定向進(jìn)化是一種廣泛應(yīng)用的生物工程策略, 定向進(jìn)化也稱體外進(jìn)化或?qū)嶒?yàn)室進(jìn)化, 在無(wú)需完全了解蛋白質(zhì)結(jié)構(gòu)的情況下, 即可直接改進(jìn)蛋白質(zhì)功能. 定向進(jìn)化的成功主要取決于兩個(gè)方面: 高效構(gòu)建突變文庫(kù)和高通量篩選突變體[1-2]. 研究表明, 單個(gè)氨基酸突變就可以增強(qiáng)蛋白的催化活性或穩(wěn)定性[3], 但目前尚不清楚隨機(jī)突變整個(gè)編碼序列還是僅突變其活性位點(diǎn)更有效[4]. 研究人員已經(jīng)開(kāi)發(fā)出多種策略來(lái)產(chǎn)生分子多樣性, 最廣泛的方法就是隨機(jī)突變. 隨機(jī)突變與高通量篩選相結(jié)合, 是改善蛋白質(zhì)功能或產(chǎn)生人工酶的一種通用策略[5-6].
傳統(tǒng)的定向進(jìn)化要求在一定的范圍內(nèi)突變目標(biāo)核苷酸. 目前, 還沒(méi)有一種高效的方法可以連續(xù)地改變目標(biāo)區(qū)域的所有核苷酸[7-8]. 2018年, Halperin等開(kāi)發(fā)了一種名為EvolvR的新型突變工具[9]. EvolvR將CRISPR/Cas9的特異性識(shí)別元件與易錯(cuò)DNA聚合酶的突變能力結(jié)合起來(lái), 通過(guò)自主設(shè)計(jì)的含20個(gè)堿基的向?qū)NA(sgRNA)來(lái)實(shí)現(xiàn)精準(zhǔn)定位. EvolvR有兩個(gè)重要元件, 一是變體Cas9(nickaseCas9; nCas9)[10], 其RuvC核酸酶結(jié)構(gòu)域具有缺陷, 僅能誘發(fā)DNA單鏈斷裂; 二是直接與nCas9融合的易錯(cuò)聚合酶(PolI3M)[11]. 聚合酶的保真度決定了突變率的高低. 研究表明, PolI3M是PolI中最容易發(fā)生聚合出錯(cuò)的變體. PolI3M包含3個(gè)點(diǎn)突變(D424A、 I709N和A759R), 這些突變會(huì)增加其聚合酶活性的錯(cuò)誤率并消除其校對(duì)活性. 該研究證明了這兩個(gè)元件的融合, 可使PolI3M的突變活性指向nCas9靶向的基因組目標(biāo)位點(diǎn), 而不是在基因組中任意突變DNA. EvolvR可以在研究者選定的可調(diào)控窗口長(zhǎng)度內(nèi), 不斷地使該區(qū)域的核苷酸發(fā)生隨機(jī)變異, 它是CRISPR工具箱中的一種最新的獨(dú)創(chuàng)性工具.
目前, 僅有研究報(bào)導(dǎo)了EvolvR用于抗性基因的突變, 以及串聯(lián)最多2個(gè)sgRNAs以擴(kuò)大突變窗口長(zhǎng)度, 還沒(méi)有EvolvR用于酶定向進(jìn)化的報(bào)道, 也沒(méi)有大于2個(gè)sgRNAs串聯(lián)的應(yīng)用報(bào)道. 因此, EvolvR的實(shí)用性仍然有待商榷.
本研究利用EvolvR突變質(zhì)粒(enCas9-PolI3M-TBD)對(duì)T7 DNA 聚合酶誘導(dǎo)突變, 并嘗試將4個(gè)能高效表達(dá)的 sgRNA 串聯(lián), 觀察其是否能同時(shí)靶向同一基因的不同靶標(biāo)位點(diǎn). T7 DNA 聚合酶是一種分子生物學(xué)基因操作的工具酶, 在末端標(biāo)記、 第二鏈cDNA合成、 長(zhǎng)片段引物延伸等方面均有用途. 對(duì)其進(jìn)行定向進(jìn)化, 可以提高活性、 甚至有可能進(jìn)化出新的生物學(xué)功能. 本研究期望探究EvolvR在酶基因定向進(jìn)化上的潛力, 尤其是多位點(diǎn)同時(shí)編輯, 為將來(lái)更好地利用EvolvR系統(tǒng)打下基礎(chǔ).
1.1.1 菌株與質(zhì)粒
本研究使用的EvolvR質(zhì)粒pEvolvR-enCas9-PolI3M-TBD(Plasmid#113077)和pEvolvR-enCas9-PolI5M(Plasmid # 113078)均購(gòu)于美國(guó)addgene官網(wǎng). 目標(biāo)質(zhì)粒pCDFDuet-T7poly(含噬菌體T7 DNA聚合酶基因)由本實(shí)驗(yàn)室保存. 4個(gè)sgRNA串聯(lián)的基因序列由安徽通用生物有限公司合成.
1.1.2主要工具酶和試劑
研究用的2×TaqMasterMix購(gòu)自北京康為世紀(jì)生物技術(shù)有限公司; Bsm BI、 NEBNext Ultra II Q5 Master Mix和T4 DNA ligase購(gòu)自美國(guó)NEB公司; Tn5轉(zhuǎn)座酶購(gòu)自天津強(qiáng)微特公司; 卡那霉素Kanamycin、 氨芐青霉素Ampicillin、 大觀霉素Spectinomycin以及超級(jí)感受態(tài)細(xì)胞細(xì)胞制備試劑盒均購(gòu)自生物工程(上海)股份有限公司; 蛋白胨、 酵母粉購(gòu)自英國(guó)OXCID公司; 250 bp DNA ladder marker和In-Fusion HD Cloning Kit購(gòu)自寶生物工程(大連)有限公司; TG1感受態(tài)細(xì)胞購(gòu)自上海唯地生物技術(shù)有限公司; 膠回收試劑盒購(gòu)自美國(guó)Thermo Fisher公司.
1.1.3引物序列
實(shí)驗(yàn)所用引物見(jiàn)表1.
表1 實(shí)驗(yàn)所用引物
1.2.1 目標(biāo)質(zhì)粒pTarget的獲取
pCDFDuet-T7poly(大觀霉素抗性, 100 μg·mL-1)質(zhì)粒由本課題組保存. 原始菌種劃線活化培養(yǎng), 挑取單菌落過(guò)夜培養(yǎng), 使用上海生工質(zhì)粒小量提取試劑盒提取質(zhì)粒, 并用Nanodrop 2000 (購(gòu)自美國(guó)Thermo Fisher公司)測(cè)定濃度, -20 ℃保存?zhèn)溆?
表2 質(zhì)粒酶切體系
1.2.2串聯(lián)sgRNA質(zhì)粒的構(gòu)建
將兩種EvolvR質(zhì)粒pEvolvR-enCas9-PolI3M-TBD和pEvolvR-enCas9-PolI5M在平板上劃線活化, 挑取單菌落于LB液體培養(yǎng)基(卡那霉素抗性, 250 μg·mL-1)中過(guò)夜培養(yǎng), 小提質(zhì)粒-20 ℃保存?zhèn)溆? 使用限制性內(nèi)切酶Bsm BI對(duì)載體進(jìn)行酶切, 酶切體系如表2, 酶切反應(yīng)條件為55 ℃反應(yīng)45 min, 然后80 ℃加熱20 min使酶徹底變性. 最后, 膠回收酶切產(chǎn)物, 測(cè)定濃度后-20 ℃保存?zhèn)溆? 利用在線設(shè)計(jì)軟件http://crispr.mit.edu/進(jìn)行sgRNA序列設(shè)計(jì), 4種sgRNA串聯(lián)共表達(dá)結(jié)構(gòu)如下:
J23115 promoter-[Insert 1st gRNA 20N]-Single gRNA body-L3S2P21 terminator-J23116 promoter-[Insert 2nd gRNA 20N]-Single gRNA body-L3S2P56 terminator-J23116 promoter-[Insert 3rd gRNA 20N]-Single gRNA body-L3S2P21 terminator-J23115 promoter-[Insert 4th gRNA 20N]-載體上的Single gRNA body-載體上的TrrnB terminator
在通用生物(安徽)有限公司訂購(gòu)合成上述全基因序列, 在序列兩端添加Bsm BI酶切位點(diǎn), 將該合成基因產(chǎn)物進(jìn)行Bsm BI酶切, 并連入enCas9-poll3M-TBD和enCas9-poll5M膠回收的線性載體上, 連接反應(yīng)體系如表3. 連接體系置于16 ℃過(guò)夜反應(yīng). 轉(zhuǎn)化NEB-10β感受態(tài)細(xì)胞, 轉(zhuǎn)化產(chǎn)物涂抗性平板(卡那霉素)過(guò)夜培養(yǎng). 挑取單菌落送測(cè)序驗(yàn)證, 測(cè)序引物使用PBAD-R反向通用測(cè)序引物, 驗(yàn)證正確后, 提取質(zhì)粒-20 ℃保存?zhèn)溆?
表3 EvolvR線性化載體與串聯(lián)sgRNA酶切產(chǎn)物連接反應(yīng)體系
1.2.3 EvolvR突變條件的確定
本研究采用雙質(zhì)粒共轉(zhuǎn)化方案. 兩種質(zhì)粒的工作濃度控制在100 ng·μL-1, 各取0.5 μL(50 ng)充分混合用于共轉(zhuǎn)化大腸桿菌TG1.
1.2.4利用EvolvR突變質(zhì)粒構(gòu)建目標(biāo)酶的突變文庫(kù)
圖1 突變文庫(kù)的構(gòu)建過(guò)程
目標(biāo)質(zhì)粒(大觀霉素抗性)和4個(gè)sgRNA串聯(lián)表達(dá)的突變質(zhì)粒(卡那霉素抗性)共轉(zhuǎn)化構(gòu)建突變文庫(kù)的過(guò)程如圖1所示. 在突變前將兩個(gè)質(zhì)粒濃度調(diào)整為100 ng·μL-1. 各取50 ng質(zhì)?;旌铣浞郑?共轉(zhuǎn)化至TG1感受態(tài)細(xì)胞. 加入到具有目標(biāo)質(zhì)粒和突變質(zhì)粒兩種抗性的LB液體培養(yǎng)基中震蕩培養(yǎng). 之后再將混合菌液稀釋涂布在含目標(biāo)質(zhì)粒相應(yīng)抗性的平板上, 篩選突變轉(zhuǎn)化子, 送測(cè)序驗(yàn)證突變情況.
1.2.5建庫(kù)高通量測(cè)序分析突變文庫(kù)
從突變反應(yīng)后的菌液(混合文庫(kù))中提取混合質(zhì)粒, 以該質(zhì)粒為模板進(jìn)行PCR反應(yīng), 擴(kuò)增得到突變后的T7poly基因全長(zhǎng). 將其回收, 用1×TE稀釋至50 ng·μL-1并進(jìn)行高通量測(cè)序建庫(kù), 建庫(kù)流程如圖2所示.
圖2 高通量測(cè)序建庫(kù)過(guò)程
配制10.5 μL反應(yīng)體系, 利用Tn5復(fù)合體將DNA片段隨機(jī)打斷, 反應(yīng)體系如表4所示. 之后, 進(jìn)行磁珠分選, 分選目的分子量為350 bp的DNA碎片. 再利用NEBNext Ultra II Q5 Master Mix進(jìn)行擴(kuò)增, 配制20 μL的擴(kuò)增反應(yīng)體系, 如表5所示.
表4 DNA片段化
表5 NEB M0544s酶擴(kuò)增
PCR的反應(yīng)條件: 75 ℃, 3 min; 98 ℃, 30 s; (98 ℃, 10 s; 65 ℃, 1 min 15 s)×15 循環(huán); 65 ℃, 5 min. 對(duì)文庫(kù)擴(kuò)增產(chǎn)物再次進(jìn)行磁珠分選, 分選目的相對(duì)分子質(zhì)量為400 bp的DNA. 分選產(chǎn)物取2 μL樣品進(jìn)行毛管電泳文庫(kù)質(zhì)控. 通過(guò)文庫(kù)質(zhì)控的產(chǎn)物, 使用Illumina Novaseq 6000測(cè)序儀, 在Pair end 150模式下, 對(duì)自建文庫(kù)進(jìn)行高通量測(cè)序.
將poll3M-TBD突變質(zhì)粒作用后的高通量測(cè)序數(shù)據(jù)和poll5M作用后的高通量測(cè)序數(shù)據(jù)進(jìn)行數(shù)據(jù)質(zhì)控分析. 首先, 將rawdata的原始文件上傳至Galaxy網(wǎng)頁(yè)版(https://usegalaxy.org/), 用FastQC(Galaxy Version 0.72)程序得到rawdata的質(zhì)量報(bào)告; 然后用Trim Galore!(Galaxy Version 0.6.3)程序?qū)awdata文件進(jìn)行修剪; 之后用BWA-MEM(Galaxy Version 0.7.17.1)程序?qū)⑿藜艉蟮奈募cT7poly基因全長(zhǎng)序列進(jìn)行比對(duì), 從而得到后續(xù)分析所需要的bam結(jié)果文件. 將該結(jié)果經(jīng)IGV軟件[11]作可視化處理分析.
EvolvR質(zhì)粒酶切電泳圖如圖3所示. 將pUC57-串聯(lián)sgRNA質(zhì)粒也進(jìn)行酶切回收, 純化回收750 bp的目的條帶(見(jiàn)圖4). 將串聯(lián)sgRNA插入酶切回收后的EvolvR質(zhì)粒載體上. EvolvR質(zhì)粒含有綠色熒光蛋白基因, 轉(zhuǎn)化大腸桿菌后, 菌液呈現(xiàn)偏綠色. 酶切質(zhì)粒會(huì)切除綠色熒光蛋白基因, 所轉(zhuǎn)化的菌液就會(huì)失去綠色. 這可作為是否成功構(gòu)建突變質(zhì)粒的一個(gè)判斷依據(jù). 構(gòu)建得到的重組質(zhì)粒送Sanger測(cè)序驗(yàn)證.
圖3 EvolvR質(zhì)粒酶切電泳結(jié)果
圖4 PUC57-串聯(lián)sgRNA質(zhì)粒酶切
針對(duì)目標(biāo)質(zhì)粒pCDFDuet-T7poly, 將4個(gè)能高效表達(dá)的sgRNA串聯(lián), 對(duì)T7poly進(jìn)行隨機(jī)突變. 從enCas9-poll3M-TBD串聯(lián)突變質(zhì)粒作用后的突變混合菌液中提取質(zhì)粒, 進(jìn)行高通量測(cè)序建庫(kù), 文庫(kù)質(zhì)控的結(jié)果如圖5所示. 使用fastQC軟件對(duì)測(cè)序結(jié)果質(zhì)控如圖6所示. 該文庫(kù)數(shù)據(jù)量為0.5 G, 與目標(biāo)序列mapping后得到337 533條reads, 高通量測(cè)序結(jié)果經(jīng)IGV軟件可視化處理分析, 如圖7所示, 發(fā)現(xiàn)4個(gè)串聯(lián)sgRNA有3個(gè)發(fā)揮了作用.
1號(hào)sgRNA靶向區(qū)域, 發(fā)現(xiàn)兩個(gè)位點(diǎn)發(fā)生突變, 343 bp和359 bp存在堿基置換突變. 343 bp(靶向18 bp)的總測(cè)序量為303 032條, 其中有1%的T置換為G. 359 bp(靶向2 bp)的總測(cè)序量為295 672條, 其中有1%的T置換為G. 2號(hào)sgRNA靶向區(qū)域中有一個(gè)位點(diǎn)檢測(cè)到突變. 382 bp(靶向8 bp)的總測(cè)序量為220 823條, 其中有1%的T置換為G. 3號(hào)sgRNA的813 bp(靶向-7 bp)的總測(cè)序量為144 177條, 其中有2%的T置換為G. 為了直觀反映靶向位置的堿基突變, 統(tǒng)計(jì)作圖如圖8所示.
圖5 enCas9-poll3M-TBD串聯(lián)突變質(zhì)粒突變文庫(kù)毛細(xì)管電泳質(zhì)控結(jié)果
圖6 enCas9-poll3M-TBD串聯(lián)突變質(zhì)粒突變文庫(kù)fastQC質(zhì)控圖
圖7 enCas9-poll3M-TBD串聯(lián)突變文庫(kù)高通量測(cè)序結(jié)果經(jīng)IGV軟件可視化處理分析
圖8 enCas9-poll3M-TBD串聯(lián)突變質(zhì)粒突變高通量測(cè)序結(jié)果
從enCas9-poll5M串聯(lián)突變質(zhì)粒作用后的突變混合菌液中提取質(zhì)粒進(jìn)行高通量測(cè)序建庫(kù), 文庫(kù)質(zhì)控的結(jié)果如圖9所示. 該文庫(kù)測(cè)序數(shù)據(jù)量為0.5 G, 與目標(biāo)序列mapping后得到367 001條reads, 文庫(kù)的fastQC質(zhì)控如圖10所示, 高通量測(cè)序結(jié)果經(jīng)IGV軟件可視化處理分析, 如圖11所示. 研究發(fā)現(xiàn), 4個(gè)串聯(lián)sgRNA中只有1個(gè)發(fā)揮了作用, 1號(hào)sgRNA靶向序列的358 bp和359 bp處存在堿基置換突變. 358 bp處覆蓋有的總測(cè)序量為317 084條reads, 其中有1%的T置換為G. 359 bp處覆蓋有的總測(cè)序量為316 898條reads, 其中有1%的T置換為G. 為了直觀反映靶向位置的堿基突變, 統(tǒng)計(jì)作圖如圖12所示. 由此也能判斷enCas9-poll5M突變效率確實(shí)低于enCas9-poll3M-TBD.
定向進(jìn)化是一個(gè)突變和選擇的循環(huán)過(guò)程, 在此過(guò)程中目標(biāo)DNA的序列發(fā)生突變. 不可否認(rèn), 定向進(jìn)化技術(shù)正成為現(xiàn)在及未來(lái)幾年生命科學(xué)研究領(lǐng)域的熱點(diǎn)技術(shù)之一. 定向進(jìn)化技術(shù)在不斷發(fā)展中, EvolvR利用CRISPR/Cas9的特異性與易錯(cuò)DNA聚合酶的突變能力, 可以簡(jiǎn)單快速地構(gòu)建隨機(jī)突變文庫(kù). 它通過(guò)自主設(shè)計(jì)的20 nt向?qū)NA(sgRNA)實(shí)現(xiàn)精準(zhǔn)定位, 一個(gè)sgRNA能靶向一個(gè)靶向位點(diǎn)[12-14].
傳統(tǒng)的定向進(jìn)化技術(shù), 諸如Error-prone PCR和DNA shuffling, 較難對(duì)靶標(biāo)基因的目的區(qū)域進(jìn)行有選擇性的定向進(jìn)化, 且實(shí)驗(yàn)步驟繁瑣, 需要很多分子克隆操作, 門檻高. 而EvolvR技術(shù)利用了CRISPR的靶向能力, 可以針對(duì)靶標(biāo)基因上的特定區(qū)域, 進(jìn)行基因突變, 結(jié)合蛋白結(jié)構(gòu)與功能研究, 無(wú)疑可以更加有目的性和理性地對(duì)目標(biāo)基因進(jìn)行定向進(jìn)化, 大大提高了工作效率. 同時(shí), EvolvR操作簡(jiǎn)便, 只要把目的基因和sgRNA構(gòu)建于質(zhì)粒載體上, 剩余的工作即可交給大腸桿菌, 通過(guò)不停的傳代繁殖, 實(shí)現(xiàn)快速進(jìn)化, 減少了工作量.
圖9 enCas9-poll5M串聯(lián)突變質(zhì)粒突變文庫(kù)毛細(xì)管電泳350 bp文庫(kù)質(zhì)控結(jié)果
圖10 enCas9-poll5M串聯(lián)突變質(zhì)粒突變文庫(kù)fastQC質(zhì)控圖
圖11 enCas9-poll5M串聯(lián)突變文庫(kù)高通量測(cè)序結(jié)果經(jīng)IGV軟件可視化處理分析
圖12 enCas9-poll5M串聯(lián)突變質(zhì)粒突變高通量測(cè)序結(jié)果
本研究旨在探究EvolvR系統(tǒng)在酶定向進(jìn)化中的應(yīng)用, 將原先僅僅用于抗生素耐藥基因進(jìn)化的EvolvR首次嘗試用于酶基因的隨機(jī)誘變, 同時(shí)嘗試擴(kuò)大突變窗口長(zhǎng)度, 將4個(gè)能高效表達(dá)的 sgRNA 串聯(lián)表達(dá), 發(fā)現(xiàn)其具備同時(shí)靶向同一基因的不同靶標(biāo)位點(diǎn)的潛力. 與單個(gè)sgRNA相比, 4個(gè)sgRNA串聯(lián)表達(dá)的突變效率會(huì)明顯降低, 4個(gè)sgRNA里有3個(gè)能檢測(cè)到其發(fā)揮了作用. 本研究的一個(gè)創(chuàng)新點(diǎn)在于選用新型定向進(jìn)化工具EvolvR對(duì)目標(biāo)酶基因序列產(chǎn)生隨機(jī)突變, 嘗試擴(kuò)大突變窗口個(gè)數(shù), 以快速構(gòu)建一個(gè)大型的突變文庫(kù). 本研究揭示了EvolvR技術(shù)具有在目標(biāo)基因的特定區(qū)域大范圍制造基因突變潛力, 證明了EvolvR具有重要的應(yīng)用價(jià)值.