于慧敏,鄭煜堃,杜巖,王苗苗,梁有向
(清華大學(xué)化學(xué)工程系,教育部工業(yè)生物催化重點實驗室,北京 100084)
近年來,致力于對生物學(xué)元器件進行標(biāo)準(zhǔn)化設(shè)計構(gòu)建,使其未來可以在新型人工生物系統(tǒng)中進行常規(guī)重復(fù)使用的合成生物學(xué)研究在全球范圍內(nèi)方興未艾[1-2]。利用合成生物學(xué)理論與工具,對生物體尤其是微生物及其相關(guān)蛋白(酶)、基因元件與線路等,進行目標(biāo)明確的設(shè)計、重組改造乃至重新合成,對于解決我國與國計民生相關(guān)的生物醫(yī)藥、材料、環(huán)境、能源等重大問題,實現(xiàn)綠色制造和可持續(xù)發(fā)展、實現(xiàn)大健康戰(zhàn)略具有重要的理論意義和實踐價值。
在合成生物學(xué)研究中,基因的精細(xì)表達(dá)調(diào)控是決定研究進程的關(guān)鍵因素;而對于原核微生物,影響基因表達(dá)水平的最重要因素則是決定RNA 聚合酶(RNA polymerase,RNAP)轉(zhuǎn)錄機器識別效率的基因啟動子序列。不同種屬微生物中的不同啟動子序列決定了下游基因的表達(dá)強度及表達(dá)模式(組成型、誘導(dǎo)型),因此成為驅(qū)動基因表達(dá)、調(diào)控基因線路、賦能微生物功能、獲得高產(chǎn)酶與高性能細(xì)胞工廠的合成生物學(xué)核心元件[3]。通過啟動子工程策略對微生物啟動子特征及功能、全新的基因誘導(dǎo)表達(dá)模式進行發(fā)掘與進化改造,使其響應(yīng)不同的物理、化學(xué)信號,實現(xiàn)精細(xì)、動態(tài)、按需調(diào)控目標(biāo)基因(群)表達(dá),已經(jīng)成為目前合成生物學(xué)的研究熱點。
啟動子是一段位于目標(biāo)基因轉(zhuǎn)錄區(qū)上游、能夠與RNA 聚合酶結(jié)合從而實現(xiàn)轉(zhuǎn)錄起始的DNA 序列。在原核微生物中,負(fù)責(zé)執(zhí)行轉(zhuǎn)錄功能的轉(zhuǎn)錄機器——RNA 聚合酶全酶(包含α2、β、β'、ω、σ等亞基)依賴于其中的σ因子,特異性地識別具有特定序列特征的啟動子區(qū)域并與之結(jié)合,從而引發(fā)轉(zhuǎn)錄的開始[4]。為了更好地闡明后文針對啟動子工程研究的各種策略與前沿研究的設(shè)計思想,有必要從啟動子識別與轉(zhuǎn)錄調(diào)控的基本規(guī)律說起。
以大腸桿菌為例,其σ 因子有7 種,分別為:σ70(σD)、σ54(σN)、σ38(σS)、σ32(σH)、σ28(σF)、σ24(σE)和σfecI[5]。其中,σ70被稱為看家σ 因 子(housekeeping σ factor),它負(fù)責(zé)起始細(xì)胞生長相關(guān)的高達(dá)1 000多個基因的轉(zhuǎn)錄;σ54、σ38與σ32分別調(diào)控細(xì)胞的N 代謝基因、細(xì)胞穩(wěn)定期相關(guān)基因以及熱應(yīng)激響應(yīng)基因的轉(zhuǎn)錄。其他σ因子則分別調(diào)控極端熱應(yīng)激響應(yīng)及外細(xì)胞質(zhì)基因、鞭毛以及檸檬酸鐵代謝相關(guān)等基因[6]。不同的σ因子,對應(yīng)識別不同的目標(biāo)基因啟動子。
狹義的啟動子通常是指在轉(zhuǎn)錄起始位點(+1)上游大約10 個及35 個核苷酸(nt)處的兩段DNA短序列(也稱為?10 區(qū)與?35 區(qū);或啟動子核心區(qū)),它們對于不同σ 因子的識別具有決定性的作用[7]。以大腸桿菌啟動子為例,對所有σ70因子識別基因啟動子區(qū)域的統(tǒng)計分析表明,?10 區(qū)與?35區(qū)的一致序列為TATAAT 與TTGACA。這兩段序列之間通常被17 nt 的間隔序列所隔開。17 nt 的間隔序列長度對于大腸桿菌基因的轉(zhuǎn)錄水平十分重要。當(dāng)間隔區(qū)長度長于18 nt或短于16 nt時,RNA聚合酶與啟動子的親和性都會顯著降低,從而調(diào)低基因轉(zhuǎn)錄[7]。此外,有些?35 區(qū)的上游序列能夠與RNA 聚合酶的α 亞基結(jié)合從而影響轉(zhuǎn)錄強度——這些序列被稱作UP元件(UP element)[6,8]。
以大腸桿菌典型的啟動子結(jié)構(gòu)為例,其Plac和Ptrp啟動子、σ70因子識別保守序列、σ54與σ32因子識別保守序列特征如圖1所示[6-11]。
圖1 大腸桿菌代表性啟動子及幾種σ因子的識別保守序列Fig.1 Representative promoters in E.coli and conserved sequences for RNA polymerase sigma factors
再以另一種模式微生物——枯草芽孢桿菌為例,其看家σ 因子識別的啟動子的?10 區(qū)與?35 區(qū)保守序列以及優(yōu)選的間隔區(qū)長度都與大腸桿菌相同[8-9]。但與大腸桿菌不同的是,枯草芽孢桿菌的啟動子還存在一些統(tǒng)計學(xué)特殊規(guī)律,比如,其?48 位大多為保守的T 堿基,?43 位附近富含A 堿基,而?17~?14 位的特征序列則通常為TNTG 等。在其他一些革蘭氏陽性菌中該規(guī)律也存在。此外,枯草芽孢桿菌中還存在特定的、負(fù)責(zé)控制與芽孢形成相關(guān)基因表達(dá)的轉(zhuǎn)錄因子σG,其靶基因的保守?10 區(qū)與?35 區(qū)一致序列變更為CATACTA 與TGAATA,優(yōu)選的間隔區(qū)長度可為17~18 nt[10-11]。
需要進一步強調(diào)的是,對于不同的非模式微生物,由于其看家σ 因子(以及其他σ 因子)可識別的啟動子序列經(jīng)常并不相同,這就決定了在不同微生物種屬之間,乃至同一菌屬但不同種的微生物之間,很多啟動子都無法通用,或者其轉(zhuǎn)錄啟動效果在不同菌種中呈現(xiàn)顯著差異。表1列出了幾種典型模式微生物與非模式微生物的σ70因子偏愛的?35 與?10 核心區(qū)序列。由表可見,盡管大腸桿菌與枯草芽孢桿菌的核心區(qū)保守序列具有相同的序列特征,但其他幾種微生物的核心區(qū)序列均存在一個或多個堿基的差異。
表1 幾種模式/非模式微生物看家σ因子識別的啟動子保守序列比較Tab.1 Some promoter consensus sequences for housekeep?ing σ factors of model/non-model microorganisms
上述不同σ因子特異識別的保守序列差異與微生物細(xì)胞內(nèi)成百上千不同基因的啟動子序列差異,就導(dǎo)致不同微生物基因在表達(dá)時可以形成各自的表達(dá)時間模式與強度模式,這些表達(dá)模式對于合成生物學(xué)研究至關(guān)重要。因此,針對不同微生物尤其是重要的非模式工業(yè)微生物,其σ 因子種類、數(shù)量與特征、受不同σ因子識別調(diào)控從而起始轉(zhuǎn)錄過程的新型啟動子的特征、功能與調(diào)控規(guī)律研究正在受到越來越多的關(guān)注。
此外,按作用強度區(qū)分,啟動子可以分為強啟動子(strong promoter)、中等強度啟動子(moderate promoter)和弱啟動子(weak promoter),其實質(zhì)就是其上述核心區(qū)特征序列與RNA 聚合酶σ 因子的特異性結(jié)合能力存在差異。通常,強啟動子和中強啟動子常用于目標(biāo)基因的高表達(dá),而弱啟動子則用于特定基因的弱化表達(dá),以調(diào)控細(xì)胞內(nèi)物質(zhì)和能量的代謝平衡[17]。
按作用方式區(qū)分,啟動子又可以分為組成型啟動子(constitutive promoter)和誘導(dǎo)型啟動子(inducible promoter)兩大類。其中,組成型啟動子調(diào)控的基因,不需要轉(zhuǎn)錄調(diào)控因子的參與,在細(xì)胞生長過程中即可實現(xiàn)基因的正常轉(zhuǎn)錄與翻譯表達(dá)。而誘導(dǎo)型啟動子,則必須要正調(diào)控或負(fù)調(diào)控蛋白與誘導(dǎo)物(外加化學(xué)試劑或代謝物分子等化學(xué)信號或溫度、光、金屬離子等物理信號)組合的共同作用,才能啟動轉(zhuǎn)錄過程的順利進行。鑒于合成生物學(xué)研究需要對細(xì)胞工廠中錯綜復(fù)雜的代謝途徑與多目標(biāo)基因進行差異化精準(zhǔn)調(diào)控,誘導(dǎo)型啟動子受到更多的關(guān)注,現(xiàn)有誘導(dǎo)型啟動子的按需進化改造、新型誘導(dǎo)型啟動子的發(fā)現(xiàn)、誘導(dǎo)機制解析以及新誘導(dǎo)方式的普適化拓展應(yīng)用等已經(jīng)成為合成生物學(xué)領(lǐng)域的研究前沿與熱點。
誘導(dǎo)型啟動子的負(fù)調(diào)控與正調(diào)控機理以及大腸桿菌最典型的β-半乳糖苷酶基因(lacZ)的負(fù)調(diào)控誘導(dǎo)型啟動子的典型結(jié)構(gòu)特征如圖2所示[6]。
在啟動子的負(fù)調(diào)控方式中,負(fù)調(diào)控蛋白(也稱作阻遏蛋白或抑制子等)對目標(biāo)基因的轉(zhuǎn)錄起負(fù)面的阻遏作用;它通常會結(jié)合到啟動子下游、目標(biāo)基因上游的一段被稱為操縱序列的小DNA 片段上,從而阻止RNA 聚合酶對目標(biāo)基因的正常轉(zhuǎn)錄。而當(dāng)添加外源誘導(dǎo)劑后,誘導(dǎo)劑與負(fù)調(diào)控蛋白具有更強的結(jié)合作用,使其從操縱序列上脫離,繼而基因的正常轉(zhuǎn)錄被開啟[圖2(a)、(b)]。在啟動子的正調(diào)控模式中,情況則恰好相反。調(diào)控蛋白對于目標(biāo)基因的轉(zhuǎn)錄起正向的激活或促進作用(因此有時也稱作activator)。只有當(dāng)誘導(dǎo)劑加入時,誘導(dǎo)劑與調(diào)控蛋白結(jié)合后的復(fù)合物才能夠結(jié)合到操縱序列上,激活或促進下游目標(biāo)基因的轉(zhuǎn)錄。
圖2 誘導(dǎo)型啟動子的負(fù)調(diào)控與正調(diào)控誘導(dǎo)機制以及大腸桿菌乳糖操縱子負(fù)調(diào)控的典型序列(a)無誘導(dǎo)劑條件下的基因調(diào)控;(b)誘導(dǎo)劑加入條件下的基因調(diào)控;(c) β-半乳糖苷酶(LacZ)啟動子的乳糖操縱子負(fù)調(diào)控區(qū)域DNA序列。LacI—阻遏蛋白;lacO—操縱序列;SD序列—基因的核糖體結(jié)合位點(也稱為RBS);Inducer—乳糖操縱子的lacI-lacO體系誘導(dǎo)劑,通常為異丙基-β-D-硫代吡喃半乳糖苷(IPTG)或乳糖(實際為1,6-別乳糖,乳糖的代謝物)Fig.2 Negative and positive regulation mechanism of inducible promoters and the partial sequence of lactose operon(lacO)of E.coli.(a,b)gene regulation mode under inducer-free or inducer-present condition,respectively.(c)partial DNA sequence of inducible promoter of β-galactosidase(LacZ)with negative regulation.LacI—inhibitor(repressor)protein;lacO—operator sequence for repressor binding;SD—Shine-Dalgarno sequence as ribosome biding site(RBS);Inducer—for lacI-lacO system,common inducer is isopropyl-β-Dthiogalactopyranoside(IPTG)or lactose(1,6-allolactose in fact,a metabolite of lactose),respectively
除了上述的正調(diào)控機制和負(fù)調(diào)控機制分別單獨發(fā)揮作用的情況外,原核生物中也有許多誘導(dǎo)型啟動子的調(diào)控作用需要正調(diào)控與負(fù)調(diào)控因子共同作用完成。其中,有的調(diào)控機制只需要2個調(diào)控因子合作,而有的則需要多個正負(fù)調(diào)控因子一起協(xié)作完成。
為了實現(xiàn)關(guān)鍵目標(biāo)基因的優(yōu)化表達(dá),經(jīng)常需要對核心啟動子進行遺傳改造,以實現(xiàn)基因轉(zhuǎn)錄水平的可控調(diào)節(jié)乃至表達(dá)強度的精細(xì)調(diào)控。一般采用如下兩種策略:一是對靶基因自身的內(nèi)源啟動子進行突變改造,或者將啟動子與特定的轉(zhuǎn)錄因子相結(jié)合,從而改變啟動子的強度[18];另一種方式則是將原有的啟動子替換成其他啟動子,從而徹底改變受控基因的表達(dá)譜,實現(xiàn)對關(guān)鍵基因轉(zhuǎn)錄水平的人工控制[19]。如圖3所示。
圖3 啟動子改造的常用有效策略?35和?10—啟動子核心區(qū);+1—轉(zhuǎn)錄起始位點;RBS—核糖體結(jié)合位點;ATG—翻譯起始密碼子Fig.3 Common efficient strategies for promoter engineering?35 and ?10—core elements of promoter;+1—transcription initiation site;RBS—ribosome binding site;ATG—start codon of enzyme translation
在啟動子突變方面,常用方法包括隨機突變與定點突變。例如,可以通過易錯PCR、定點飽和突變乃至創(chuàng)制合成等方式對啟動子的UP 區(qū)或間隔區(qū)進行隨機突變,創(chuàng)制不同強度的啟動子庫,或者創(chuàng)制合成啟動子庫(synthetic promoter libraries,SPL),用于代謝工程中多基因的差異表達(dá)調(diào)控;再結(jié)合高通量篩選方法獲得優(yōu)選的啟動子[19-20]。隨機突變方法的優(yōu)點是能夠得到不同性質(zhì)及強度存在梯度分布的啟動子;其缺點則是工作量大,需要結(jié)合合適的高通量篩選方法才能實現(xiàn)。也可以將目標(biāo)啟動子的核心?10 區(qū)、?35 區(qū)等關(guān)鍵區(qū)域序列向著σ因子識別一致序列的方向突變,從而顯著改變啟動子的活性[14,21-22]。例如,Jiao等通過對枯草芽孢桿菌Pg2 啟動子的核心?10 區(qū)、?35 區(qū)分別進行面向σ因子識別保守序列的單點突變,突變啟動子的強度提高了15 倍[21];在紅色紅球菌啟動子的研究中,同樣獲得了類似的研究結(jié)果[14]。
在啟動子的替換策略中,可供選用的啟動子既可以是自身或者一些種屬相近微生物中已被報道的或被廣泛使用的啟動子(如大腸桿菌中普遍使用的Ptac強啟動子以及枯草芽孢桿菌中常用的P43 啟動子等);也可以通過報告基因表達(dá)的方式對一組候選啟動子的強度進行對比分析,從而得到可以使用的優(yōu)選啟動子[23-24];還可以選用一些噬菌體啟動子、人工構(gòu)建的雜合啟動子等外源啟動子。其中,優(yōu)選的噬菌體啟動子,例如來自T7 噬菌體的T7啟動子、來源于噬菌體SPO-1的Pspac啟動子[25],往往具有強轉(zhuǎn)錄特性。2013 年,Yang等[26]進一步從B.licheniformis基因組中篩選獲得了PluxS 啟動子,活性是P43 啟動子的8 倍。將PluxS 與枯草芽孢桿菌Papr的?10 區(qū)結(jié)合,構(gòu)建的雜合啟動子PlapS,具有更高的轉(zhuǎn)錄活性。尤其是這些外源啟動子不僅可以提高目標(biāo)基因的轉(zhuǎn)錄強度,還可以利用大腸桿菌負(fù)調(diào)控蛋白-操縱子序列(LacI-lacO)等的引入,成功實現(xiàn)人工強啟動子從組成型到誘導(dǎo)型的轉(zhuǎn)變。例如,LacI-T7 系統(tǒng)誘導(dǎo)型雜合啟動子插入枯草芽孢桿菌基因組,能夠?qū)崿F(xiàn)高達(dá)10 000 倍的啟動強度動態(tài)調(diào)控范圍[27]。將紅球菌Rhodococcus rhodochrousJ1中的腈水解酶誘導(dǎo)型啟動子與NitR正調(diào)控蛋白組合成PnitA-NitR雜合元件,成功構(gòu)建了鏈霉菌高效表達(dá)啟動子——以ε-己內(nèi)酰胺為誘導(dǎo)劑,鏈霉菌蛋白表達(dá)量可以達(dá)到可溶蛋白的40%[28]。啟動子替換改造的優(yōu)勢在于針對性強,有時可以大大減少篩選工作量。但另一方面,可供選用的啟動子仍然非常有限,遠(yuǎn)不能滿足快速發(fā)展的合成生物學(xué)研究的需求。
此外,啟動子改造研究也經(jīng)常與核糖體結(jié)合位點RBS的序列優(yōu)化相結(jié)合。例如,通過3條枯草芽孢桿菌內(nèi)源組成型強啟動子序列與3條優(yōu)選RBS序列的隨機突變庫,研究人員篩選獲得了基因表達(dá)水平達(dá)到約14 000 倍動態(tài)調(diào)控區(qū)間的基因工具箱[29]?;诋愒处?0依賴的啟動子可以被鏈霉菌的“看家”σhrdB因子有效識別,Zhao等[30]將大腸桿菌啟動子Ptac的核心區(qū)與變青鏈霉菌啟動子PkasO*R15 的5′-非翻譯區(qū)(5′-UTRs)融合,獲得了改造啟動子Ptac*,其在鏈霉菌S.lividansTK24中的啟動強度達(dá)到Ptac的8.1 倍,以及PkasO*R15的1.7倍。進一步耦合RBS優(yōu)化,優(yōu)選啟動子-RBS組合Ptac*RBS3對報告基因的表達(dá)強度達(dá)到Ptac啟動子的17.6倍。
近年來,隨著合成生物學(xué)的興起以及組學(xué)分析、高通量篩選、人工智能等新興技術(shù)的快速發(fā)展,啟動子改造的新思路和新方法也不斷涌現(xiàn)。Li 等[31]及Shen 等[32]發(fā)現(xiàn),針對啟動子核心區(qū)的間隔序列進行隨機突變或飽和突變,可以獲得具有310倍轉(zhuǎn)錄活性差異的啟動子庫,從而獲得優(yōu)選強啟動子并顯著提高目標(biāo)產(chǎn)物PHB以及P(3HB-co-4HB)的產(chǎn)量。類似地,啟動子上游序列突變對合成啟動子的轉(zhuǎn)錄強度的影響也不容忽視[33]。而針對鏈霉菌啟動子調(diào)控序列進行隨機突變構(gòu)建不同強度的啟動子庫,也成功篩選獲得了一系列強、中、弱轉(zhuǎn)錄活性的鏈霉菌啟動子[34]。進一步地,除了啟動子核心區(qū)序列、上游序列及間隔序列以外,研究人員還發(fā)現(xiàn),位于SD 序列上游的5′-UTR序列結(jié)構(gòu)對于轉(zhuǎn)錄及翻譯效率也具有顯著影響;研究表明,相對于PBAD啟動子,大腸桿菌細(xì)胞內(nèi)104 個天然5′-UTR 序列的啟動子強度在轉(zhuǎn)錄水平上從0.007%到4630%之間變化,而在翻譯水平上則從0.1%到137%之間變化[35]。此外,基于單個啟動子改造研究的突破,串聯(lián)的雙啟動子組合策略也受到重視。研究發(fā)現(xiàn),兩個啟動子之間的間隔序列長度對組合啟動子活性的影響很大,其中80 bp 是優(yōu)選長度[36]。最后,利用組學(xué)數(shù)據(jù)和生物信息學(xué)工具進行啟動子序列識別與改造[37]、強度預(yù)測與RBS 序列優(yōu)選[38]并指導(dǎo)新啟動子發(fā)現(xiàn)、高強度新組成型或誘導(dǎo)型啟動子改造以及目標(biāo)基因的高效表達(dá)等研究策略,已經(jīng)成為今后在合成生物學(xué)等生物技術(shù)領(lǐng)域開展啟動子研究的必要工具。
鑒于誘導(dǎo)型啟動子在合成生物學(xué)、代謝工程和工業(yè)生物發(fā)酵中的重要地位,針對誘導(dǎo)型啟動子的專門研究越來越多,啟動子元件在生物技術(shù)研究與生產(chǎn)實踐中的應(yīng)用前景非常廣闊。研究人員不僅關(guān)注經(jīng)典強啟動子的進一步改造和新用途,比如,T7 轉(zhuǎn)錄系統(tǒng)與T7 噬菌體啟動子在邏輯門與基因線路中的應(yīng)用[39],還關(guān)注各種新型誘導(dǎo)劑的發(fā)現(xiàn)(化學(xué)分子)以及新誘導(dǎo)方式的開發(fā)(物理信號),以滿足日益增長的工程生物學(xué)研究的迫切需要。
迄今為止,從不同微生物來源的菌株中,已經(jīng)發(fā)現(xiàn)大量的新類型誘導(dǎo)型啟動子,受不同化學(xué)誘導(dǎo)劑分子或物理誘導(dǎo)信號的調(diào)控,對目標(biāo)基因進行不同強度的表達(dá)。相關(guān)研究進展總結(jié)見表2。
由表2可見,化學(xué)誘導(dǎo)劑的種類目前已經(jīng)增加到了幾十種。但在工業(yè)生產(chǎn)中真正實現(xiàn)了應(yīng)用的,還比較少??傮w而言,IPTG 類誘導(dǎo)劑仍然最為高效、嚴(yán)謹(jǐn)且應(yīng)用最為廣泛。但I(xiàn)PTG 的高成本問題已經(jīng)稱為制約其進一步推廣的核心因素。有鑒于此,研究者們致力于開發(fā)全新的,兼具高效、嚴(yán)謹(jǐn)且低成本優(yōu)勢的新型誘導(dǎo)型啟動子,目前已經(jīng)取得較好進展。例如,對異丙苯甲酸酯誘導(dǎo)啟動子、ε-己內(nèi)酰胺誘導(dǎo)啟動子等。本文作者課題組正在致力于解析紅色紅球菌中獨特的尿素誘導(dǎo)型強啟動子的誘導(dǎo)機理,一旦獲得成功,有望推廣到其他宿主菌株中獲得普適性應(yīng)用。而營養(yǎng)源饑餓誘導(dǎo)型啟動子(如氮饑餓、磷酸鹽饑餓)、低溶氧誘導(dǎo)啟動子等,也具有工業(yè)化的應(yīng)用潛力與優(yōu)勢。
表2 近年來報道的一些不同微生物來源、不同類型的誘導(dǎo)型啟動子Tab.2 Some inducible promoters reported recently from different microorganisms with diverse mechanisms
物理信號誘導(dǎo)的啟動子也吸引了大量研究者的關(guān)注。比如,溫度誘導(dǎo)啟動子、光誘導(dǎo)啟動子等。其中,微生物溫度誘導(dǎo)啟動子主要分為高溫(熱)誘導(dǎo)和低溫(冷)誘導(dǎo)兩類,其溫敏開關(guān)涵蓋了DNA 型、RNA 型以及蛋白質(zhì)型[69-72]。而光誘導(dǎo)啟動子則分為白光、藍(lán)光、黑暗誘導(dǎo)等多種類型,其調(diào)控蛋白等調(diào)控因子也各有不同[73-75]。盡管這些啟動子在實驗室規(guī)模的研究中已經(jīng)取得了很多令人振奮的突破,但放大到大規(guī)模工業(yè)生產(chǎn)水平,變溫操作的能耗問題以及光誘導(dǎo)信號的液面下衰減問題仍然困擾著產(chǎn)業(yè)界和學(xué)術(shù)界??梢灶A(yù)期,新型分子生物技術(shù)與新型生物裝備的結(jié)合,有望解決上述問題。
相比于誘導(dǎo)型啟動子,組成型啟動子不涉及操縱序列、阻遏蛋白、激活蛋白等轉(zhuǎn)錄調(diào)控元件,因此其工作機制相對簡單,但其在合成生物學(xué)、代謝工程等領(lǐng)域高性能細(xì)胞工廠以及細(xì)胞催化劑的構(gòu)建研究中同樣具有舉足輕重的作用。就方法學(xué)而言,組成型啟動子的改造策略已經(jīng)在前文中充分討論,在此就不再贅述。
目前,針對組成型啟動子的研究熱點,大致可分為兩類,均是基于目前快速突破的基因組、轉(zhuǎn)錄組及蛋白質(zhì)組等組學(xué)測序技術(shù)以及基于計算機輔助的生物信息學(xué)與人工智能技術(shù):一方面是面向基因編輯工具比較匱乏、基因改造相對困難的各種非模式重要工業(yè)微生物或特殊微生物,開展不同強度新啟動子、不同表達(dá)時序新啟動子的
識別發(fā)現(xiàn)及改造研究,乃至不同微生物中RNA 聚合酶σ 因子(或其他重要轉(zhuǎn)錄元件)的種類、功能、基因轉(zhuǎn)錄調(diào)控規(guī)律及其改造方法與應(yīng)用等研究;另一方面則是面向基因背景清晰、基因編輯工具相對成熟的模式微生物(如大腸桿菌、酵母菌),基于生物信息學(xué)及人工智能工具,進行啟動子序列結(jié)構(gòu)基本規(guī)律解析、人工預(yù)測與設(shè)計、人工合成乃至人工智能從頭設(shè)計等研究[14,31,76-82]。
例如,Jiao 等[14]針對在生物催化工業(yè)中具有重要應(yīng)用的非模式微生物紅色紅球菌,通過不同生長階段轉(zhuǎn)錄組的測序分析,獲得了其生長期高表達(dá)基因的啟動子序列特征,發(fā)現(xiàn)了其σA識別啟動子的保守序列。Li 等[31]則針對嗜鹽菌開展了組成型啟動子庫的研究——從高表達(dá)的孔蛋白啟動子出發(fā),針對其核心區(qū)間隔序列突變,獲得了梯級強度的組成型啟動子庫,以滿足細(xì)胞工廠中大量基因的不同表達(dá)強度需要。Trisrivirat 等[78]采用類似的策略構(gòu)建組成型啟動子庫,實現(xiàn)了生物丙烷產(chǎn)量的提高。Sun 等[79]通過采用生物信息學(xué)工具進行RBS 設(shè)計與篩選,并耦合啟動子序列改造,獲得了分枝桿菌的高表達(dá)元件,同時實現(xiàn)了甾醇產(chǎn)量的顯著提升。Liu等[80]通過對酵母菌中TATA-盒與轉(zhuǎn)錄起始位點間序列的隨機突變與篩選,獲得了兩個新的強啟動子并提高了β-胡蘿卜素的產(chǎn)量。Zhang 等[81]基于統(tǒng)計模型預(yù)測,重構(gòu)了谷氨酸棒桿菌的人工合成啟動子庫,獲得了優(yōu)選的串聯(lián)啟動子P70,其強度高達(dá)tac啟動子的1.21 倍。針對大腸桿菌啟動子,Wang等[82]基于機器學(xué)習(xí)算法,實現(xiàn)了大腸桿菌啟動子的AI 從頭設(shè)計。人工智能、生物信息學(xué)與啟動子領(lǐng)域的交叉研究,已經(jīng)成為啟動子工程的新前沿之一。
隨著合成生物學(xué)與人工智能工具的快速發(fā)展,越來越多的開創(chuàng)性研究在啟動子工程領(lǐng)域涌現(xiàn)。具有動態(tài)代謝調(diào)控功能的特殊啟動子的發(fā)現(xiàn)與改造、新性能啟動子元件的人工智能設(shè)計與進化等研究是啟動子工程領(lǐng)域的代表性新前沿。
首先,微生物的胞內(nèi)代謝網(wǎng)絡(luò)十分復(fù)雜,各種代謝物以及功能酶的濃度會隨著時間進行動態(tài)改變,采用常規(guī)的靜態(tài)代謝工程策略,如基因的過表達(dá)(上調(diào))、敲除或弱化表達(dá)(下調(diào))進行代謝流調(diào)控,即使在優(yōu)化調(diào)控條件下,也可能造成菌體在某個時間段發(fā)生代謝失衡,或者有毒中間代謝產(chǎn)物的積累,不利于菌體生長和目標(biāo)產(chǎn)物合成,從而導(dǎo)致產(chǎn)物的產(chǎn)量和得率并不理想。動態(tài)代謝調(diào)控(dynamic regulation)的概念近年來應(yīng)運而生,其核心思想是讓菌體細(xì)胞能夠感應(yīng)到時時變化的環(huán)境狀況或自身的胞內(nèi)信號,并對其做出響應(yīng),調(diào)控相關(guān)代謝反應(yīng)以實現(xiàn)代謝途徑的動態(tài)平衡,進而達(dá)到目標(biāo)產(chǎn)物合成的高產(chǎn)量、高底物轉(zhuǎn)化率的統(tǒng)一。動態(tài)代謝調(diào)控元件的開發(fā)是實現(xiàn)動態(tài)代謝調(diào)控模式的關(guān)鍵,它們一方面具有生物傳感器的功能,另一方面也具有執(zhí)行代謝調(diào)控的功能。在目前已經(jīng)報道的多種元件中,特殊的新模式誘導(dǎo)型啟動子與群體感應(yīng)信號系統(tǒng)、核糖開關(guān)等元件一樣,都是研究人員關(guān)注的重點。例如,?ztürk 等[83]闡述了雙啟動表達(dá)策略的基本原則,以滿足未來動態(tài)代謝工程領(lǐng)域的需求。Landberg 等[84]開發(fā)了一種基因組整合型trp?T7 表達(dá)系統(tǒng),可以實現(xiàn)依賴于色氨酸或酵母提取物濃度的自誘導(dǎo),嚴(yán)謹(jǐn)調(diào)控目標(biāo)基因的表達(dá);用該系統(tǒng)生產(chǎn)L-絲氨酸,補料分批發(fā)酵培養(yǎng)的絲氨酸產(chǎn)量達(dá)到26 g/L。Moreb 等[85]開發(fā)了基于E.coliPhoB 調(diào)控的磷酸鹽饑餓誘導(dǎo)啟動子,能夠在營養(yǎng)豐富培養(yǎng)基和合成培養(yǎng)基中均實現(xiàn)外源蛋白的自誘導(dǎo)嚴(yán)謹(jǐn)調(diào)控,使得外源蛋白在磷酸鹽耗盡時自行啟動高表達(dá),從而實現(xiàn)了細(xì)胞生長與產(chǎn)物合成解耦的兩階段自誘導(dǎo)發(fā)酵培養(yǎng)模式。類似地,Ikegaya 等[86]也報道了來源于紅串紅球菌R.erythropolisN9T-4 的營養(yǎng)匱乏誘導(dǎo)型調(diào)控因子。Liang 等[87]則開發(fā)了基于產(chǎn)物香草醛以及底物阿魏酸濃度的動態(tài)代謝調(diào)控回路,實現(xiàn)了香草醛的高產(chǎn)。
其次,人工智能工具已經(jīng)在越來越多的領(lǐng)域顯示出了強大的功能。在啟動子工程方面,利用機器學(xué)習(xí)新方法進行人工啟動子設(shè)計、創(chuàng)制與優(yōu)化的研究現(xiàn)已蓬勃興起,并取得了突破性的成果。例如,如前所述,Wang 等[82]發(fā)表了基于機器學(xué)習(xí)的大腸桿菌啟動子的AI 從頭設(shè)計框架與活性預(yù)測模型,結(jié)果表明,經(jīng)過兩輪優(yōu)化,70.8%的AI 設(shè)計人工啟動子都可以被證明有效,且其序列與大腸桿菌原基因組序列的相似性很低,說明人類已經(jīng)可以基于機器學(xué)習(xí),創(chuàng)造出有效且可能更高效的啟動子新序列。類似的,van Brempt 等[88]則通過卷積神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)方法,獲得了啟動子序列與功能之間的構(gòu)效關(guān)系信息,成功預(yù)測了大腸桿菌σ70啟動子的轉(zhuǎn)錄起始速率、17 nt 的啟動子間隔區(qū)序列,以及枯草芽孢桿菌3 種不同σ 因子特異性的啟動子序列。Zhao 等[89]通過機器學(xué)習(xí)方法,構(gòu)建了包含3665 個不同序列的人工啟動子庫,其強度變化范圍達(dá)到兩個數(shù)量級,且最強啟動子的轉(zhuǎn)錄活性達(dá)到1 mmol/L IPTG 誘導(dǎo)的T7 啟動子的1.52 倍以上。這些研究工作,將成為人工智能工具在啟動子工程領(lǐng)域深度并全面應(yīng)用的開端。
隨著我國可持續(xù)發(fā)展戰(zhàn)略的加速推進及二氧化碳減排的迫切需求,綠色生物制造產(chǎn)業(yè)正在全面拓展與提升,合成生物學(xué)以及面向產(chǎn)業(yè)化的工程生物學(xué),已經(jīng)被認(rèn)為是本世紀(jì)最重要的生物技術(shù)平臺[1-2,90]。
在微生物中,轉(zhuǎn)錄調(diào)控是實現(xiàn)目標(biāo)基因按需表達(dá)的最基礎(chǔ)、最重要因素之一[76],啟動子則是轉(zhuǎn)錄水平調(diào)控的核心元件[91-92]。基于啟動子的基因高效及精準(zhǔn)表達(dá)調(diào)控在合成生物學(xué)中具有舉足輕重的地位[93-94]。伴隨著合成生物學(xué)新技術(shù)、高通量生物檢測新裝備、單細(xì)胞測序技術(shù)、生物信息學(xué)乃至人工智能等交叉研究領(lǐng)域的協(xié)同發(fā)展,啟動子工程已經(jīng)取得了令人矚目的進展和突破,但同時大量具有挑戰(zhàn)性的科學(xué)問題目前還仍然存在。例如,單一啟動子經(jīng)常發(fā)生的基因泄露表達(dá)及干擾問題,尚缺少根本性的解決方案;大量組成型與誘導(dǎo)型啟動子的強度響應(yīng)范圍仍然不能滿足合成生物學(xué)研究與產(chǎn)業(yè)化生產(chǎn)的需要;眾多有價值的非模式微生物菌株的基本轉(zhuǎn)錄調(diào)控元件、工作原理與調(diào)控規(guī)律還不十分清楚(比如其看家σ因子的啟動子識別保守序列、調(diào)控生長穩(wěn)定期基因表達(dá)及各種環(huán)境響應(yīng)性基因表達(dá)的新σ因子及其保守序列、新型正負(fù)調(diào)控蛋白等);響應(yīng)更多化學(xué)分子與物理信號的新誘導(dǎo)型啟動子的發(fā)現(xiàn)、誘導(dǎo)機制解析與改造應(yīng)用還具有非常廣闊的研究空間;從產(chǎn)業(yè)角度,具有安全、高效、低成本特征的新型誘導(dǎo)劑的開發(fā)及其產(chǎn)業(yè)化應(yīng)用仍然非常有限。此外,在不同微生物種屬之間具有廣譜通用性的啟動子還不多見;多啟動子串聯(lián)協(xié)同強化轉(zhuǎn)錄的研究還剛剛起步;啟動子與反義RNA、核糖開關(guān)、群體感應(yīng)信號等元件協(xié)同實現(xiàn)代謝途徑重構(gòu)優(yōu)化、基因線路設(shè)計構(gòu)建、新型生物傳感器設(shè)計開發(fā)、人工多細(xì)胞體系以及無細(xì)胞體系高效合成目標(biāo)化學(xué)品等研究方興未艾;人工智能從頭設(shè)計啟動子的開創(chuàng)性研究還受限于菌種基因背景清晰度、基因編輯工具可用性、高效性以及新算法的性能與精度以及軟件開發(fā)等問題。總之,啟動子元件的科學(xué)基礎(chǔ)與基因轉(zhuǎn)錄調(diào)控規(guī)律的深入研究、其改造方法與手段的全新突破、各種新型誘導(dǎo)劑分子與誘導(dǎo)模式的創(chuàng)制及產(chǎn)業(yè)化復(fù)雜環(huán)境下的高效且低成本應(yīng)用乃至其調(diào)控動態(tài)化、設(shè)計智能化以及創(chuàng)造性從頭設(shè)計的新發(fā)展,都將是今后一段時間內(nèi)微生物啟動子工程領(lǐng)域的重要研究內(nèi)容[82,88-89,94-100]。
隨著合成生物學(xué)的研究對象逐漸從基因元件與模塊走向全細(xì)胞復(fù)雜代謝線路從頭設(shè)計乃至生物新功能從頭創(chuàng)制,可以預(yù)見,在如下合成生物學(xué)領(lǐng)域,微生物啟動子工程都將發(fā)揮越來越重要的作用,包括:新酶的高表達(dá)與高效制備;全細(xì)胞生物催化;基因線路設(shè)計、動態(tài)代謝調(diào)控以及高性能細(xì)胞工廠創(chuàng)建與優(yōu)化;高靈敏度生物檢測及多功能無細(xì)胞合成體系開發(fā);高效、穩(wěn)定的人工多細(xì)胞體系創(chuàng)制及復(fù)雜環(huán)境應(yīng)用以及各種新興交叉領(lǐng)域,如生物-金屬復(fù)合催化、生物新材料、生物系統(tǒng)自動控制、生物信息學(xué)與AI新工具等等。
綜上所述,啟動子工程,尤其是微生物啟動子工程,將驅(qū)動合成生物學(xué)研究與綠色生物制造技術(shù)的持續(xù)快速發(fā)展,從而為我國綠色化工、環(huán)境保護、醫(yī)藥與大健康、食品及能源等領(lǐng)域的發(fā)展做出不可替代的重要貢獻(xiàn)。
致謝:謹(jǐn)以此文致敬Daniel I.C.Wang 教授在基因工程及生化工程等領(lǐng)域的開創(chuàng)性貢獻(xiàn)。