蔡思杰, 張書衍, 王曉微, 郭顯陽, 詹 碩
(1. 沈陽大學 生命科學與工程學院, 遼寧 沈陽 110044;2. 沈陽雙鼎制藥有限公司, 遼寧 沈陽 110179)
轉(zhuǎn)錄激活因子樣效應(yīng)物(TALE)是黃單胞菌分泌的針對特定DNA 序列的蛋白質(zhì)[1-2]。TALE 家族成員包含一個高度保守和重復的區(qū)域,其與DNA 的結(jié)合能力取決于每個模塊重復的第12 和第13 個氨基酸殘基(即重復可變雙氨基酸殘基(RVD))。每個RVD 中都有一個簡單的代碼,用來指定對特定堿基的識別,這決定了TALE 核苷酸結(jié)合的特異性。例如,NI(Asn/Ile)對應(yīng)A,NG(Asn/Gly)對應(yīng)T,HD(His/Asp)對應(yīng)C,NH(Asn/His)對應(yīng)G[3-5]。人工構(gòu)建的帶有功能域的DNA 結(jié)合域(DBD)補充的TALE 可應(yīng)用于基因工程的許多方面,包括用于轉(zhuǎn)錄調(diào)控的轉(zhuǎn)錄因子(TALE-TF)[6-9]和用于基因組編輯的轉(zhuǎn)錄激活因子樣效應(yīng)核酸酶(TALEN)[10-12]。因此,TALE 在基因工程領(lǐng)域發(fā)揮了巨大的作用。
TALE 的脫靶率比目前熱門的 CRISPR/Cas9(Clustered Regularly Interspaced Short Palindromic Repeats/Cas9)[13-15]要低,識別DNA 長度也較長;基因調(diào)控和編輯的位置不受前間區(qū)序列鄰近基序(PAM)的限制;具有更低的非靶點結(jié)合能力,更低的細胞毒性,基于TALE 具有高靶向能力[16],所以,已由法國Cellectis 公司用于生產(chǎn)通用嵌合抗原受體T 細胞[17],并已被批準用于癌癥免疫療法。接受該基因編輯療法的患者已顯示出顯著的治療效果[18]。最重要的是,在設(shè)計和構(gòu)建TALE 時,理論上可以靶向任何DNA序列。但是構(gòu)建TALE 的方法比較繁瑣復雜,而且構(gòu)建的TALE 長度有限,容易脫靶。并且,大多數(shù)研究人員仍然使用軟件來預測TALE 靶向的目標區(qū)域,然后構(gòu)建一個有針對性的TALE。在這種情況下,需要構(gòu)建更多的TALE,構(gòu)建周期太長,效率偏低[19-21]。
本研究發(fā)明了一種新的簡單的TALE 文庫的構(gòu)建方法,設(shè)計了一種可以輕松實現(xiàn)靶向較長DNA 序列的TALE 文庫的方法。該組裝方法是快速且標準化的,能夠精確控制產(chǎn)生的RVD 和整體DNA 結(jié)合域的組成。而且研究人員可以直接將其作為實驗材料,為TALE 研究人員節(jié)省了大量的時間。
金門組裝試劑盒來自Addgene;限制酶BsaI、牛血清白蛋白(BSA)、T4 DNA 連接酶、腺嘌呤核苷三磷酸(ATP)來自NEB 公司;質(zhì)粒核酸安全酶來自Epicentre 公司;BsmBI 來自Thermo Scientific 公司;DH5α感受態(tài)細胞、壯觀霉素、卡那霉素、X-gal、IPTG(Isopropyl β-D-Thiogalactoside,異丙基硫代半乳糖苷)來自南京源恩浩生物試劑;PrimeSTAR?GXL DNA Polymerase 高保真聚合酶混合液來自Takara 公司。
采用基于金門組裝試劑盒優(yōu)化改進的新方法構(gòu)建了18 bp-TALE-VP64 文庫(bp 表示堿基對)。
第1 部分:構(gòu)建含10 個串聯(lián)重復序列(RVDs:NH1-NH10)組合的PFUS-A+10×NH 質(zhì)粒。
步驟1(第1 天,3 h):第1 次金門酶切連接反應(yīng)。將10 個RVD 構(gòu)建模塊質(zhì)粒(NH1 到NH10)各加入150 ng 于0.5 mL 離心管中。然后,加入150 ng pFUS-A 質(zhì)粒、1 μL BsaI、1 μL BSA、1 μL T4 DNA 連接酶、2 μL T4 DNA 連接酶反應(yīng)緩沖液。然后加入蒸餾水,使總反應(yīng)體積達到10 μL。
步驟2(第1 天,10 min):上述反應(yīng)體系混合并短暫旋轉(zhuǎn),渦旋混勻30 s。
步驟3(第1 天,3 h):將反應(yīng)體系在PCR 儀上孵育。孵育條件為37 ℃、5 min 和16 ℃、10 min 共計10 個循環(huán),然后50 ℃、5 min;80 ℃、5 min。
步驟4(第1 天,1 h):反應(yīng)體系(10 μL)加入1 μL 質(zhì)粒核酸安全酶和1 μL 10 mmol·L-1ATP 在37 ℃下孵育1 h。
步驟5(第1 天,4 h):將步驟4 的反應(yīng)體系轉(zhuǎn)化到100 μL DH5α 中,加入溶菌肉湯(LB)液體培養(yǎng)基得到1 mL 該細胞懸液,涂布于LB 瓊脂細菌培養(yǎng)皿(含有壯觀霉素50 μg·mL-1和20 mg·mL-1X-gal) (X-gal是β-半乳糖苷酶的顯色底物)以及0.1 mol·L-1IPTG,由于PFUS-A+10×NH,PFUS-B7+7×NH 和pLR-NH骨架質(zhì)粒都具有壯觀霉素抗性,所以,培養(yǎng)微生物大腸桿菌細胞DH5α,有抗性的說明質(zhì)粒構(gòu)建轉(zhuǎn)染成功,沒有轉(zhuǎn)染成功的沒有抗性,不會生長出菌落。
步驟6(第2 天,6 h):從培養(yǎng)皿上挑選幾個白色菌落,并使用引物pCR8-F1 和pCR8-R1(表1)進行菌落PCR 檢驗。PCR 程序:96 ℃預變性3 min;96 ℃變性20 s,55 ℃退火20 s,72 ℃延伸2 min,進行30 個循環(huán);72 ℃總延伸3 min,4 ℃保存。PCR 檢測正確的菌落經(jīng)過培養(yǎng)、提取,得到PFUS-A+10×NH質(zhì)粒。
表1 質(zhì)粒突變體和菌落PCR的引物Table 1 Primers for plasmid mutation and colony PCR
第2 部分:構(gòu)建含有7 個串聯(lián)重復序列(RVDs:NH1-NH7)組合的PFUS-B7+7×NH質(zhì)粒。
步驟1(第1 天,3 h):取7 個RVD 構(gòu)建質(zhì)粒模塊(NH1 到NH7)各加入150 ng,加入pFUS-B7 質(zhì)粒150 ng、1 μL BsaI、1 μL BSA、1 μL T4 DNA 連接酶、2 μL T4 DNA 連接酶反應(yīng)緩沖液。然后加入蒸餾水,使總反應(yīng)體積達到10 μL。
步驟2(第1 天,10 min):反應(yīng)體系短暫旋轉(zhuǎn)混合,渦旋混勻30 s。
步驟3(第1 天,3 h):將反應(yīng)體系在PCR 儀上孵育,孵育條件為37 ℃、5 min 和16 ℃、10 min 共計10 個循環(huán);然后50 ℃、5 min;80 ℃、5 min。
步驟4(第1 天,1 h):反應(yīng)體系(10 μL)加入1 μL 質(zhì)粒核酸安全酶和1 μL 10 mmol·L-1ATP 在37 ℃下孵育1 h。
步驟5(第1 天,4 h):將步驟4 的反應(yīng)體系轉(zhuǎn)化到100 μL DH5α 感受態(tài)細胞。然后加入LB 培養(yǎng)基得到1 mL 細胞懸液涂布于LB 瓊脂細菌培養(yǎng)皿(含有壯觀霉素50 μg·mL-1和20 mg·mL-1X-gal 以及0.1 mol·L-1IPTG)。
步驟6(第2 天,6 h):從培養(yǎng)皿中挑選幾個白色菌落,使用引物pCR8-F1 和pCR8-R1(見表1)進行菌落PCR 檢測。PCR 程序:96 ℃預變性3 min;96 ℃變性20 s,55 ℃退火20 s,72 ℃延伸1 min,進行30個循環(huán);72 ℃總延伸3 min,4 ℃保存。PCR 檢測正確的菌落經(jīng)過培養(yǎng)、提取,得到PFUS-B7+7×NH 質(zhì)粒。
第3 部分:PFUS-A+10×NH 質(zhì)粒突變體、PFUS-B7+7×NH 質(zhì)粒突變體及pLR-NH 質(zhì)粒突變體的構(gòu)建。
步驟1(第3 天,3 h):PFUS-A+10×NH 質(zhì)粒突變體、PFUS-B7+7×NH 質(zhì)粒突變體、pLR-NH 質(zhì)粒突變體均采用PCR 擴增得到,引物如表1 所示。利用HD-C、NH-G、NG-T 和NI-A 這4 種特殊引物(表1)對PFUS-A+10×NH 質(zhì)粒、PFUS-B7+7×NH 質(zhì)粒、pLR-NH 質(zhì)粒分別進行PCR 擴增。3 個PCR反應(yīng)(240 μL)均包含1 ng 質(zhì)粒、10 μmol·L-1HD-C、10 μmol·L-1NH-G、10 μmol·L-1NG-T、10 μmol·L-1NI-A 和PrimeSTAR?GXL DNA Polymerase 高保真聚合酶混合液。PCR 程序:96 ℃預變性3 min;96 ℃變性20 s,58 ℃退火20 s,72 ℃ 延伸3 min,進行28 個循環(huán);72 ℃總延伸3 min,4 ℃保存。PCR 產(chǎn)物用1% 瓊脂糖凝膠電泳檢測。PCR 產(chǎn)物經(jīng)苯酚/氯仿萃取法純化,用無水乙醇沉淀。PCR產(chǎn)物在水中重懸,3 種PCR 產(chǎn)物即PFUS-A+10×NH 質(zhì)粒突變體、PFUS-B7+7×NH 質(zhì)粒突變體、pLR-NH質(zhì)粒突變體。
第4 部分:構(gòu)建TALE-VP64 文庫(RVDs:NH1-NH17 和pLR-NH)。
步驟1(第3 天,3 h):在20 μL 反應(yīng)體系中,包括150 ng PFUS-A+10×NH 質(zhì)粒突變體,150 ng PFUS-B7+7×NH 質(zhì)粒突變體,150 ng pLR-NH 質(zhì)粒突變體和75 ng TALE-backbone-VP64。加入1 μL BsmBI,1 μL T4 DNA 連接酶、2 μL T4 DNA 連接酶反應(yīng)緩沖液。最后加入蒸餾水使總反應(yīng)體積為20 μL。
步驟2(第3 天,10 min):該反應(yīng)體系短暫旋轉(zhuǎn)混合,渦旋混勻30 s。
步驟3(第3 天,3 h):將反應(yīng)體系在熱循環(huán)PCR 儀上孵育。熱循環(huán)條件為37 ℃、5 min 和16 ℃、10 min,共計10 個循環(huán);然后37 ℃、15 min;80 ℃、5 min。
步驟4(第3 天,4 h):將20 μL 的反應(yīng)體系轉(zhuǎn)化到200 μL DH5α 感受態(tài)細胞中。加入LB 培養(yǎng)基得到1 mL細胞懸液涂布于LB 瓊脂細菌培養(yǎng)皿(含有卡那霉素50 μg·mL-1和20 mg·mL-1X-gal 以及0.1 mol·L-1IPTG)。
步驟5(第4 天,4 h):利用引物TAL-F 和TAL-R(表1)進行菌落PCR 實驗,根據(jù)電泳條帶鑒定陽性菌落。最后PCR 檢測正確的菌落,過夜培養(yǎng)。
步驟6(第5 天,2 h):提取培養(yǎng)的菌液中的質(zhì)粒為18 bp-TALE-VP64 文庫質(zhì)粒表達載體。
經(jīng)過對金門法的優(yōu)化構(gòu)建了TALE 文庫,詳細流程見圖1,此流程顯示了構(gòu)建TALE-VP64 文庫的示例,該質(zhì)粒文庫可以結(jié)合18 bp DNA 長度的目標靶向位點。其中PFUS-A+10×NH 是一種由10 個單體質(zhì)粒和一個骨架質(zhì)粒PFUS-A 在第1 次酶切連接反應(yīng)中制備的質(zhì)粒;PFUS-B7+7×NH 是一種由7 個單體質(zhì)粒和1 個骨架質(zhì)粒PFUS-B7 在第1 次酶切連接反應(yīng)中制備的質(zhì)粒。因此,PFUS-A +10×NH 是表達與N1-N10 核苷酸結(jié)合的氨基酸的質(zhì)粒載體,PFUS-B7+7×NH 是表達與N11-N17 核苷酸結(jié)合的氨基酸的質(zhì)粒載體。編碼與最后一個核苷酸(N18)結(jié)合的氨基酸的序列包含在另一個單體質(zhì)粒(pLR-NH)中。第2 次酶切連接反應(yīng)包含 4 個質(zhì)粒,包括PFUS-A+10×NH 質(zhì)粒突變體(PFUS-A+10×(NH,HD,NG,NI))、PFUS-B7+7×NH 質(zhì)粒突變體(PFUS-B7+7× (NH,HD,NG,NI))、pLR-NH 質(zhì)粒突變體(pLR-NH/HD/NG/NI)和TALE 骨架載體(TALE-backbone-VP64)(見圖2,圖中bp 為堿基對)。
圖1 利用金門法基于4 種特異性引物構(gòu)建TALE-VP64 文庫的流程Fig.1 Flowchart of the construction of TALE-VP64 libraries by the Golden-Gate method based on new specific primers pipeline
圖2 質(zhì)粒圖譜及其組成Fig.2 Plasmids maps and their elements
另外,在構(gòu)建過程中所使作的各種骨架質(zhì)粒圖譜(即突變前質(zhì)粒)見圖2 中PFUS-A+10×NH、PFUS-B7×NH、pLR-NH質(zhì)粒。最后,預計構(gòu)建成功的TALE-VP64 質(zhì)粒文庫具有轉(zhuǎn)染各種細胞的能力,并可以激活下游基因的表達(見圖3),Zhang 等[21]單獨構(gòu)建的TALE-VP64 質(zhì)料轉(zhuǎn)染293T 細胞,確實激活了綠色熒光基因ZsGreen,使綠色熒光蛋白高表達。TALE-VPR 質(zhì)料轉(zhuǎn)染HepG2細胞和PANCl 細胞,分別使得內(nèi)源基因HNF4a 和E47 基因上調(diào), 從而證實了TALE-VP64/VPR 強大的靶向和激活功能。TALE-VP64 文庫中每個DNA 結(jié)合模塊由34個氨基酸組成,其中每個模塊的第12 和13 位氨基酸變化較大,其他氨基酸高度保守,這2 個不保守的氨基酸被命名為重復可變殘基(RVD),RVD 氨基酸對應(yīng)DNA 堿基之間的分子密碼是NI 對應(yīng)A、HD 對應(yīng)C、NG 對應(yīng)T、NH 對應(yīng)G,所有的TALE 由N 末端的轉(zhuǎn)移結(jié)構(gòu)域(AD)組成(圖3)。TALE 的末端轉(zhuǎn)移結(jié)構(gòu)域以及C末端的核定位信號和轉(zhuǎn)錄激活結(jié)構(gòu)域具有高度的保守性,不同成員之間互換這些功能區(qū)域并不影響其正常發(fā)揮作用。TALE-DNA 結(jié)合域與合成的VP64 轉(zhuǎn)錄激活因子融合,該激活因子募集RNA 聚合酶和啟動轉(zhuǎn)錄所需的其他因子,激活下游基因的表達(見圖3)。
圖3 用于基因組工程的TALE-VP64 文庫Fig.3 The TALE -VP64 libraries for genome engineering
第1 部分和第2 部分中從每個平板上選取白色菌落,使用引物pCR8-F1 和pCR8-R1 進行菌落PCR檢驗。條帶應(yīng)達到預期大小(PFUS-A+10×NH 質(zhì)粒約12 kb、PFUS-B7+7×NH 載體約0.8 kb (kb 表示1 000 堿基對)),但一般不可能得到單一的條帶,一般條帶“階梯”從約200 bp 開始,這是正確克隆的標志,是克隆中重復的結(jié)果[22](見圖4 中1 和2 泳道)。
圖4 質(zhì)粒和菌落 PCR 產(chǎn)物的瓊脂糖凝膠電泳結(jié)果Fig.4 Results of agarose gel electrophoresis of plasmid and colony PCR products
第 3 部分中用 4 種特異引物和長鏈高保真 DNA 聚合酶分別擴增 PFUS-A+10×NH 質(zhì)粒、PFUS-B7+7×NH 和pLR-NH 質(zhì)粒(見圖4 中4、6、8 泳道),獲得各個質(zhì)粒載體突變體(見圖4 中3、5、7泳道),由于質(zhì)粒突變體實際是PCR 產(chǎn)物,并且主要是各種質(zhì)粒的混合物,但是也不排除有短鏈的一些PCR 產(chǎn)物,所以,從電泳圖觀察,質(zhì)粒突變體主要條帶的分子量與對應(yīng)的質(zhì)?;疽恢?。
第4 部分中挑取4 個白色菌落用菌落PCR 檢測最終18 bp-TALE-VP64 文庫。全長PCR 產(chǎn)物通常不太突出,大約是2 051 bp,從結(jié)果觀察,主條帶確實在2 051 bp 左右,但是不明顯。而“階梯效應(yīng)”是成功組裝的有力指標[22](見圖4 中9 泳道)。
PFUS-A+10×NH、PFUS-B7+7×NH、pLR-NH 骨架質(zhì)粒分別與各自的質(zhì)粒突變體不同,3 種質(zhì)粒突變體是各自以3 種質(zhì)粒(PFUS-A+10×NH、PFUS-B7+7×NH 和pLR-NH 骨架質(zhì)粒)為模板,加入4 種特異性引物經(jīng)過PCR 反應(yīng)后得到3 種PCR 產(chǎn)物,PFUS-A+10×NH 質(zhì)粒突變體就是PFUS-A+10× (NH,HD,NG,NI 不同排列組合)的混合物,即410種質(zhì)粒的混合物;PFUS-B7+7×NH 質(zhì)粒突變體就是PFUS-B7+7× (NH,HD,NG,NI 不同排列組合)的混合物,即47種質(zhì)粒的混合物;pLR-NH 質(zhì)粒突變體就是pLR-NH、pLR-HD、pLR-NG、pLR-NI 的混合物,即4 種質(zhì)粒的混合物。
將最后提取的18bp-TALE-VP64 質(zhì)粒文庫送基因公司測序,最后得到的測序結(jié)果見圖5,圖中有6 個核苷酸的重復序列(RVDs),顯示“噪聲”信號。RVD結(jié)構(gòu)域預期核苷酸組成與構(gòu)建的18 bp-TALE-VP64 文庫一致(圖5)。通過基因測序驗證了該文庫的所有序列是正確的,并且包含所有可能的DNA 靶點的序列組合,該TALE-VP64 質(zhì)粒文庫對18 個堿基(ATCG)的排列組合都有靶向性,所以就是418,共計68 719 476 736個組合。所以涵蓋了可能的核苷酸DNA 靶點。因為也有很多研究者構(gòu)建針對11 個堿基或者12 個堿基的TALE 文庫質(zhì)粒,由于靶向的堿基越多,脫靶的可能性越小,此處主要是體現(xiàn)該質(zhì)粒文庫的高靶向性。另外從測序結(jié)果觀察,雖然NH 對應(yīng)的序列較多,但是也存在HD、NG、NI 對應(yīng)的序列,由于測序的質(zhì)粒文庫實際是多種質(zhì)粒的混合物,里面相當于418的各種排列組合的質(zhì)粒的混合物。注意觀察峰圖,RVD 對應(yīng)有幾個是雙峰、三峰,所以從測序結(jié)果得出,構(gòu)建的文庫涵蓋了預期的RVD 組成。
圖5 18-bp TALE-VP64 文庫的DNA 測序圖譜Fig.5 DNA sequencing profiles of the 18 bp-TALE-VP64 libraries
先前文獻報道中的構(gòu)建TALE 的方法都是構(gòu)建獨立個體的方法,無論用什么方法來單獨構(gòu)建若干TALE 質(zhì)粒,都不可能形成一個巨大的文庫,這些方法是低效和耗時的。在本研究中,建立了一種基于獨特引物組裝完整、高效的TALE 文庫構(gòu)建的方法,與其他技術(shù)相比[23-24],TALE 靶向DNA 目標的長度可以控制。增加DNA 靶標的長度將獲得更高的特異性,然而,構(gòu)建TALE 文庫的成本和時間也將大大增加;另一種增加文庫靶向DNA 目標長度的方法,不增加額外的實驗負擔或增加復雜性,包括利用RVD特異性。例如,已知RVD-NN 可以同時靶向A 和G,因此,只有4 個模塊(即NH、NI、NG 和HD)可用于組裝完整的TALE 文庫。所以,研究構(gòu)建的這4 個模塊的18 bp-TALE 文庫將產(chǎn)生最多68 719 476 736種組合。靶向DNA 長度更大的TALE 文庫的組裝在實驗上可能很麻煩,在某些情況下,實際上是無法實現(xiàn)的。另一個問題在于,在破譯給定的RVD 序列的TALE-DNA 結(jié)合方面存在一定程度的不確定性,這可能也會使全基因組分析中潛在目標序列的識別復雜化,這個問題可以通過染色質(zhì)免疫共沉淀-測序技術(shù)(ChIP-seq)[25]進行進一步研究。總之,本研究成功建立了一種基于TALE 的多功能文庫的組裝方法,構(gòu)建成功的TALE 文庫可以利用酵母單雜交試驗探索其功能完整性[26]。進一步說明,TALE-DBD 可以完全定制,以靶向任何核苷酸含量(如GC 含量豐富的DNA 區(qū)域)、核苷酸限制(如轉(zhuǎn)錄因子基序)或其他修飾[27-28]。最后,TALE 蛋白的編碼序列易于分離和測序,便于快速識別其靶基因。總之,考慮到該組裝方法的高度模塊化的特性,控制其靶向DNA 長度大小從而調(diào)整其文庫特異性的能力,以及構(gòu)建的文庫的多功能性和方便性,預計未來將有更廣泛的應(yīng)用。
在本研究中,使用TALE 試劑盒和獨特設(shè)計的引物,建立了一種快速構(gòu)建TALE 文庫的新方法。利用該方法構(gòu)建了可靶向18bp-DNA 序列的TALE 文庫,并對其進行了DNA 測序驗證,滿足預期結(jié)果。為基因組調(diào)控和基因組編輯技術(shù)提供了簡單高效的方法和實驗工具。