周嗣杰,鄭 妍,丁明珠,元英進(jìn)
(1.天津大學(xué)化工學(xué)院教育部合成生物學(xué)前沿科學(xué)中心系統(tǒng)生物工程教育部重點實驗室,天津 300072;2.天津大學(xué)合成生物前沿研究院,天津 300072)
“合成生命、設(shè)計生命”是人工細(xì)胞工廠未來發(fā)展的重大方向,合成生物學(xué)以突破傳統(tǒng)生物技術(shù)研究模式,引入工程化概念,強(qiáng)調(diào)標(biāo)準(zhǔn)化、模塊化構(gòu)建,由“探究自然、認(rèn)識生命”到“設(shè)計自然、創(chuàng)造生命”,打破了非生命化學(xué)物質(zhì)和生命物質(zhì)之間的界限。20世紀(jì)以來,以DNA雙螺旋結(jié)構(gòu)和中心法則為代表的傳統(tǒng)生物學(xué)研究取得諸多重大進(jìn)展。1928年,Thomas H.Morgan發(fā)表了名著《基因論》,提出了染色體是基因的載體;1944年,Avery等[1]通過肺炎雙球菌實驗證明DNA是遺傳物質(zhì);1953年,美國科學(xué)家James Watson和英國科學(xué)家Compton Crick發(fā)現(xiàn)DNA的雙螺旋結(jié)構(gòu)[2];1977年,Sanger等[3]首次發(fā)明核酸測序方法;2010年,Venter團(tuán)隊的Gibson等[4]化學(xué)再造人工支原體基因組??茖W(xué)家從認(rèn)識DNA發(fā)展到對DNA的改寫與合成再造,乃至人工細(xì)胞的合成,提升了對生命的干預(yù)和操控能力[3,5]。
人工細(xì)胞工廠已經(jīng)將科學(xué)轉(zhuǎn)變?yōu)槲磥淼闹圃旆妒?,將成為催生生物?jīng)濟(jì)的顛覆性力量。微生物可以制造許多目前工業(yè)制造的產(chǎn)品,人工細(xì)胞工廠提供了從生產(chǎn)香料、紡織品到食物和燃料等幾乎所有人類所需產(chǎn)品的新方法。但人工細(xì)胞工廠仍面臨代謝網(wǎng)絡(luò)復(fù)雜、缺乏理性設(shè)計、試錯成本高以及細(xì)胞改造周期長等瓶頸問題。國內(nèi)外研究者嘗試將化學(xué)、物理學(xué)、計算機(jī)科學(xué)和機(jī)械工程等學(xué)科知識應(yīng)用到細(xì)胞工廠,各個領(lǐng)域的專家協(xié)同合作,不斷拓展和創(chuàng)新,實現(xiàn)人工細(xì)胞工廠更加高效、智能和可持續(xù)的生產(chǎn)方式。多學(xué)科交叉且不斷拓展,可加快人工細(xì)胞工廠的發(fā)展速度,催生人工細(xì)胞工廠會聚式的應(yīng)用范式?;诖耍疚木C述了國內(nèi)外細(xì)胞工廠的柔性化、智能化及自動化等方面的研究成果,以期為相關(guān)研究提供參考。
在整個基因組中快速引入全局變化的技術(shù)對細(xì)胞工廠的發(fā)展特別重要,因為這可以在完全了解所有基因組位點的功能之前就篩選出有利的性狀。與此相反,對觀察到的表型變化與基因型的對應(yīng)分析也可幫助表征單個基因的功能。物理、化學(xué)和轉(zhuǎn)座子誘變技術(shù)已廣泛用于誘變目標(biāo)基因組,并且通常與改變表型的篩選或選擇相結(jié)合加速篩選速度。最近,研究人員開發(fā)出多種成熟有效地用在基因組范圍產(chǎn)生小尺度變異的誘變策略,包括單核苷酸多態(tài)性(SNP)和小片段插入缺失(Indel),已經(jīng)有系統(tǒng)總結(jié)和討論由小尺度變異驅(qū)動的細(xì)胞工廠誘變策略和應(yīng)用的綜述[6-7],在此不加贅述。
細(xì)胞工廠的柔性化主要指細(xì)胞基因組發(fā)生大范圍結(jié)構(gòu)變異,產(chǎn)生基因型多樣性的能力。隨合成生物學(xué)的不斷進(jìn)步和發(fā)展,從頭合成DNA大片段,甚至整個基因組逐漸被實現(xiàn)[8-9]。如,合成酵母基因組國際計劃(Sc2.0)的目標(biāo)是為了獲得一個具有高度適應(yīng)性、靈活性和通用性的釀酒酵母(Saccharomyces cerevisiae)基因組[8,10]。在Sc2.0項目中,在所有非必需基因3′的末端(3′UTR)插入特異性重組位點loxPsym,經(jīng)Cre重組酶誘導(dǎo)后,這些loxPsym位點間會產(chǎn)生包括刪除、反轉(zhuǎn)、復(fù)制和易位等各種重排反應(yīng)(圖1)[9],從而形成包含多樣化的基因型的重排庫[11]。該SCRaMbLE系統(tǒng)(synthetic chromosome rearrangement and modification by loxPsym-mediated evolution)極大地促進(jìn)了酵母的柔性化,可以快速驅(qū)動基因組發(fā)生結(jié)構(gòu)重排[8]?;蛐偷亩鄻有钥赡軐?dǎo)致表型多樣性,并且可以通過一輪或迭代SCRaMbLE和篩選來獲得細(xì)胞工廠所需的性狀[12],如圖2所示。
圖1 基因組重排反應(yīng)原理Fig.1 Mechanisms of genomic rearrangement
圖2 細(xì)胞工廠柔性化誘導(dǎo)篩選過程[12]Fig.2 Induction and screening process for the flexibilization of cell factories[12]
1.1.1 柔性化精準(zhǔn)控制技術(shù)
基因組重排系統(tǒng)依賴β-雌二醇結(jié)合Cre-雌激素結(jié)合結(jié)構(gòu)域(EBD),使Cre重組酶進(jìn)入細(xì)胞核從而發(fā)揮作用。然而,在研究過程中發(fā)現(xiàn),在不存在β-雌二醇的情況下,仍然可以觀測到Cre重組酶具有一定的活性,從而可能導(dǎo)致SCRaMbLE失控,同時產(chǎn)生酵母細(xì)胞基因型和表型的不穩(wěn)定性[9,13-14]。為了解決這個問題,Jia等[15]構(gòu)建用于SCRaMbLE系統(tǒng)的遺傳“與門”控制開關(guān),使其僅在半乳糖和β-雌二醇同時存在的情況下開啟,如圖3(a)所示。pGAL1啟動子是半乳糖誘導(dǎo)型啟動子,即當(dāng)環(huán)境中有葡萄糖時可嚴(yán)格抑制啟動子的活性。因此,當(dāng)用葡萄糖培養(yǎng)基培養(yǎng)含有該質(zhì)粒的合成型酵母時,pGAL1啟動子會受到強(qiáng)烈抑制,導(dǎo)致Cre-EBD的表達(dá)量顯著降低,即使有少量表達(dá)也會與Hsp90結(jié)合從而避免擴(kuò)散進(jìn)入細(xì)胞核;而當(dāng)用半乳糖培養(yǎng)基補(bǔ)加β-雌二醇誘導(dǎo)時,Cre-EBD能正常表達(dá)的同時,繼而進(jìn)入細(xì)胞核,從而引發(fā)合成型基因組重排反應(yīng)。這個遺傳開關(guān)基于pGAL1啟動子的轉(zhuǎn)錄控制和Cre-EBD酶活性的亞細(xì)胞定位控制。
圖3 多種細(xì)胞工廠柔性技術(shù)Fig.3 Flexibility technologies of cell factories
除了上述化學(xué)控制Cre重組酶誘導(dǎo)系統(tǒng)外,Hochrein等[16]開發(fā)了一種光控的SCRaMbLE系統(tǒng)(L-SCRaMbLE),如圖3(b)所示。Cre重組酶的N和C末端分別與植物光感受器蛋白B(PhyB)和它的相互作用因子3(PIF3)融合,當(dāng)它暴露于紅光時,兩種植物來源蛋白質(zhì)PhyB和PIF3之間會發(fā)生相互作用并結(jié)合,使Cre重組酶的兩部分發(fā)生重構(gòu)并恢復(fù)酶活性。該系統(tǒng)不僅可以有效地解決Cre重組酶的泄漏問題,而且還可以在短時間內(nèi)使Cre活性提高。同時,該系統(tǒng)的Cre重組酶活性也可以通過光的誘導(dǎo)時間、光的劑量來控制。上述兩種方法都可以精準(zhǔn)地控制柔性化細(xì)胞工廠。
1.1.2 線性染色體柔性化技術(shù)
對含有單一合成型染色體的細(xì)胞進(jìn)行柔性化誘導(dǎo),已經(jīng)證實SCRaMbLE具備誘導(dǎo)基因組產(chǎn)生刪除、反轉(zhuǎn)、復(fù)制和其他復(fù)雜重排的能力[14]。為了進(jìn)一步探索SCRaMbLE重組系統(tǒng)產(chǎn)生染色體間易位的能力,Richardson等[8]用半乳糖誘導(dǎo)染色體著絲粒牽引染色體的方法來組合多條合成染色體到同一個酵母中,從而產(chǎn)生含多條合成染色體的菌株。對所獲得的攜帶合成型三號染色體(synⅢ)和合成型九號染色體右臂(synⅨR)的菌株進(jìn)行柔性化誘導(dǎo),在細(xì)胞工廠中發(fā)現(xiàn)了先前所未觀察到的易位事件,如圖3(c)所示[17]。
1.1.3 環(huán)形染色體柔性化技術(shù)
除了線性染色體外,Shen等[14]對環(huán)形染色體synⅨR菌株進(jìn)行柔性化誘導(dǎo),通過對64個誘導(dǎo)后的菌落進(jìn)行檢測后發(fā)現(xiàn),其中發(fā)生了復(fù)雜的重排事件,不僅包含有刪除和反轉(zhuǎn)事件,而且還存在高頻率的復(fù)制事件。Wang等[18]對攜帶環(huán)形染色體synⅤ的細(xì)胞進(jìn)行柔性化誘導(dǎo),結(jié)果發(fā)現(xiàn):染色體的拓?fù)浣Y(jié)構(gòu)會對染色體重排的功能產(chǎn)生影響,經(jīng)5輪重排后的ring_synⅤ總長度增加了552 410 bp,占ring_synⅤ的~101.02%;此外,在發(fā)生重排后的菌株中發(fā)現(xiàn)存在非整倍型的染色體Ⅰ、Ⅲ、Ⅵ、Ⅻ、ⅩⅢ和ring_synⅤ??梢?,環(huán)形染色體重排表現(xiàn)出可以持續(xù)產(chǎn)生復(fù)雜基因型的能力,從而有效地增加結(jié)構(gòu)變異的數(shù)量和規(guī)模。與線性染色體的基因組重排相比,環(huán)形染色體重排可能會在柔性化細(xì)胞中產(chǎn)生更多的復(fù)制事件或更為復(fù)雜的染色體重排事件。
1.1.4 細(xì)胞工廠多輪柔性誘導(dǎo)技術(shù)
雖然單輪的柔性誘導(dǎo)技術(shù)可以增加重排事件的多樣性,但是這并不能說明經(jīng)過一次基因組重排實驗就可以得到想要的優(yōu)良性狀。在自然界中,生物的進(jìn)化是一個相當(dāng)漫長的過程。為了快速且持續(xù)地在細(xì)胞群體中獲得基因組重排的多樣性,Jia等[15]在利用“與門”控制開關(guān)的基礎(chǔ)上建立“多輪迭代基因組重排”(multiplex SCRaMbLE iterative cycling),這個重排系統(tǒng)通過對每一輪基因組重排后所篩選到的性狀提升的菌株進(jìn)行新的一輪基因組重排反應(yīng);通過這種迭代基因組重排反應(yīng),逐步且持續(xù)地提高菌株數(shù)量,多輪柔性誘導(dǎo)技術(shù)的具體實驗流程,如圖3(d)所示。該重排系統(tǒng)還適用于單二倍體交替提升細(xì)胞性狀,即在基因組重排過程中獲得的高產(chǎn)二倍體菌株通過減數(shù)分裂篩選產(chǎn)量相對高的孢子,將所篩選到的單倍體菌株與新的單倍體合成型菌株進(jìn)行交配而形成新的二倍體,對其再進(jìn)行柔性化誘導(dǎo)。這樣多輪迭代的過程可以將多個合成型菌株的基因逐步地應(yīng)用到一個細(xì)胞內(nèi),可以擴(kuò)大基因組重排適用菌株的范圍,同時可以獲得更大的基因組重排庫[19-20]。
1.1.5 雜合細(xì)胞工廠柔性技術(shù)
基因組重排過程中必需基因的刪除會導(dǎo)致單倍體合成型細(xì)胞工廠柔性化存在較高的致死率,特別是釀酒酵母菌株的遺傳背景限制了其工業(yè)應(yīng)用。Shen等[14]將合成型酵母基因組的重排系統(tǒng)拓展到雜合二倍體和跨物種二倍體,并且利用基因組重排系統(tǒng)快速驅(qū)動細(xì)胞進(jìn)化,如圖3(e)所示。將具有重排系統(tǒng)的合成型酵母與展現(xiàn)多樣化性狀的野生型酵母進(jìn)行交配獲得二倍體,使得基因組重排系統(tǒng)可以拓展并驅(qū)動雜合二倍體菌株與跨物種二倍體菌株發(fā)生重排反應(yīng)。Shen等[21]通過含有單條合成型染色體(synⅩ)或含有兩條合成型染色體(synⅤ和synⅩ)的單倍體菌株與來自酵母菌株保藏庫(SGRP)中的25株釀酒酵母(S.cerevisiae)和27株單倍體奇藝酵母(S.paradoxus)進(jìn)行交配,總共獲得104株二倍體菌株庫,結(jié)果發(fā)現(xiàn),在二倍體菌株中進(jìn)行柔性化誘導(dǎo)比在單倍體中具有更高的容忍度,即致死率低。另外,Shen等[21]還將一株釀清酒的釀酒酵母Y12與合成型菌株交配,再對獲得雜合二倍體的菌株進(jìn)行細(xì)胞工廠柔性化誘導(dǎo),成功獲得在42 ℃生長加快的重排菌株;為了展示跨物種柔性細(xì)胞工廠的概念,以一株奇藝酵母CBS5829為例,通過雜合細(xì)胞工廠柔性技術(shù),成功獲得具有咖啡因耐受性的重排菌株??梢?雜合二倍體基因組重排與跨物種的基因組重排的開發(fā),一方面可以拓展基因組重排技術(shù)的應(yīng)用范圍和加速工業(yè)微生物性狀的改良,另一方面有助于挖掘新的生物學(xué)知識。
1.1.6 細(xì)胞工廠體外柔性技術(shù)
隨著合成生物學(xué)的快速發(fā)展,復(fù)雜長路徑代謝通路的異源表達(dá)和基因組化學(xué)全合成已成為可能。然而由于生物體本身的復(fù)雜性,多基因相互作用下的大尺度DNA從頭設(shè)計到功能實現(xiàn)依然面臨著巨大挑戰(zhàn)。在構(gòu)建異源代謝通路的過程中,如能賦予合成型DNA遺傳操作靈活的特性,將有助于進(jìn)一步優(yōu)化異源代謝通路。Wu等[22]構(gòu)建了Cre酶與包含多l(xiāng)oxPsym位點DNA的體外反應(yīng)體系,即無細(xì)胞體系,如圖3(f)所示。這個系統(tǒng)可以在試管中產(chǎn)生有效的基因組重排,即包含基因刪除、反轉(zhuǎn)和復(fù)制的多種結(jié)構(gòu)變異文庫,并且可以通過測序技術(shù)直接表征出基因組重排文庫的多樣性。為了進(jìn)一步展示體外基因組重排技術(shù)的優(yōu)勢,Wu等[22]還構(gòu)建β-胡蘿卜素的代謝通路,利用自上而下和自下而上這2種策略,通過相關(guān)轉(zhuǎn)錄單元的重排提高了β-胡蘿卜素的產(chǎn)量。該體外重排系統(tǒng)提供了一種高效、快速的構(gòu)建重排文庫的方法,這對結(jié)構(gòu)變異的基因型和表型的關(guān)聯(lián)分析具有重要意義,同時有助于基因組重排的基礎(chǔ)研究并加快代謝通路的優(yōu)化。異源代謝通路優(yōu)化和底盤工程是實現(xiàn)異源高表達(dá)的兩種關(guān)鍵途徑。Liu等[23]開發(fā)了一個正交的SCRaMbLE系統(tǒng)“SCRaMbLE-in”,可以同時解決這2個問題:先利用重組酶VCre/VloxP、Cre/loxP或Dre/rox來整合代謝路徑的調(diào)控元素,如將啟動子引入目標(biāo)代謝通路并在體外生成重排的代謝庫;然后通過SCRaMbLE-in系統(tǒng)將該重排文庫整合到合成型染色體上,從而實現(xiàn)底盤細(xì)胞的大規(guī)?;蚪M重排。因為這3種重組酶系統(tǒng)是相互正交的,并且異源代謝路徑和底盤細(xì)胞不僅可以分別優(yōu)化,也可以組合優(yōu)化,所以可實現(xiàn)代謝工程的快速優(yōu)化,實現(xiàn)功能模塊的精確重排。該SCRaMbLE-in重排系統(tǒng)已用于提高紫羅蘭素和β-胡蘿卜素的產(chǎn)量,并且實現(xiàn)了異源代謝通路和底盤細(xì)胞的協(xié)同優(yōu)化。
全基因組尺度loxPsym位點介導(dǎo)的基因組柔性化可以產(chǎn)生豐富的基因組結(jié)構(gòu)變異并獲得具有各種基因型和表型的酵母菌株。接下來將重點介紹相關(guān)案例來說明如何通過細(xì)胞柔性化來獲得生長適應(yīng)性以及產(chǎn)物產(chǎn)量提高的優(yōu)良細(xì)胞工廠菌株。
1.2.1 柔性化細(xì)胞提升菌株生長適應(yīng)性
柔性化細(xì)胞技術(shù)在增強(qiáng)細(xì)胞對環(huán)境的耐受性(如高溫、乙酸、堿性、乙醇或木糖等)和耐藥性(如雷帕霉素、潮霉素B或咖啡因等)等方面已經(jīng)建立有效的方法,在此基礎(chǔ)上可增加細(xì)胞工廠在工業(yè)上的應(yīng)用潛力。耐熱性是酵母在工業(yè)上生產(chǎn)乙醇的主要限制因素之一[24]。對酵母的單倍體以及二倍體進(jìn)行柔性化誘導(dǎo)可以使菌株對高溫的耐受性顯著增加。如,Luo等[25]使用ReSCuES的重排篩選方法分離出3株具有耐熱性的單倍體菌株,其中性狀表現(xiàn)最優(yōu)菌株的生長速度比對照菌株提高了(1.28±0.03)倍。Shen等[21]通過對釀酒酵母Y12和synⅩ攜帶的合成型酵母雜交得到的雜合二倍體進(jìn)行柔性化誘導(dǎo),獲得2個可以在42 ℃下正常生長的二倍體菌株,通過全基因組測序分析發(fā)現(xiàn),染色體YJL154C~YJL140W區(qū)域的刪除會導(dǎo)致耐熱性能的提升。對于生長環(huán)境pH的耐受性,Ma等[26]對包含1條(synⅤ)或2條(synⅤ和synⅩ)合成型染色體的單倍體酵母菌株進(jìn)行柔性化誘導(dǎo),總共產(chǎn)生了7個耐堿性增加的菌株;通過耐受菌株結(jié)構(gòu)變異的比較分析后發(fā)現(xiàn),YER161C(SPT2)的刪除可以提高酵母對堿的耐受性。Luo等[25]通過基因組重排產(chǎn)生了3個對醋酸耐受性增加的菌株,與對照菌株相比,其中1株重排菌株在添加醋酸的培養(yǎng)基中生長速度增長了近21倍。除耐熱性和酸堿耐受性外,其他化學(xué)品或者環(huán)境方面的耐受性也可以通過柔性化誘導(dǎo)進(jìn)行提升。Luo等[25]通過ReSCuES重排策略獲得3株具有乙醇耐受性的菌株,經(jīng)研究發(fā)現(xiàn),乙醇耐受性的增加是由ACE2基因的破壞所造成的。Blount等[27]將木糖利用的異源途徑導(dǎo)入含有synⅤ的酵母,并且通過柔性化誘導(dǎo)成功獲得了以木糖為唯一碳源的菌株。
通過細(xì)胞柔性化還可以增強(qiáng)細(xì)胞的藥物耐受性。Li等[28]對雜合二倍體酵母菌株進(jìn)行柔性化誘導(dǎo)獲得了7株雷帕霉素耐藥性增加的菌株,經(jīng)結(jié)構(gòu)變異分析發(fā)現(xiàn),GLN3基因的刪除、合成Ⅹ染色體左臂中的長片段雜合缺失(LOH)、合成Ⅹ染色體的全染色體LOH以及Ⅷ染色體復(fù)制(三倍體)均可以導(dǎo)致合成型酵母對雷帕霉素的耐藥性增加。Shen等[21]通過相同的方法,共獲得10株表現(xiàn)出對咖啡因耐受的菌株,并且通過全基因組測序分析確定了POL32基因的復(fù)制是導(dǎo)致咖啡因耐受性增加的原因。最近,Ong等[29]對含有SynⅡ的合成型單倍體酵母進(jìn)行柔性化誘導(dǎo),從而獲得對潮霉素B的耐受性增強(qiáng)的菌株,并且發(fā)現(xiàn)基因YBR219C和YBR220C的刪除會導(dǎo)致菌株對潮霉素B抗性的增加。
1.2.2 柔性化細(xì)胞提升細(xì)胞工廠的產(chǎn)物產(chǎn)量
柔性化細(xì)胞技術(shù)不僅可以改善菌株的天然表型(耐受性),也可改善菌株生產(chǎn)異源代謝路徑的代謝產(chǎn)物。異源代謝路徑可以通過游離的質(zhì)?;蛘哒系浇湍富蚪M而引入合成型酵母中。柔性化誘導(dǎo)可以通過產(chǎn)生大量結(jié)構(gòu)變化來改變代謝網(wǎng)絡(luò)(如產(chǎn)量相關(guān)基因的刪除、復(fù)制、反轉(zhuǎn)或易位),從而提高目標(biāo)產(chǎn)品的產(chǎn)量。
類胡蘿卜素是重要的抗氧化劑,可以通過顏色變化來篩選產(chǎn)量提升的菌株。Jia等[15]通過對synⅤ染色體進(jìn)行一輪柔性化誘導(dǎo),獲得了5個具有顏色加深的菌株,其中顏色最深的菌株類胡蘿卜素的產(chǎn)量增加到原始菌株的1.5倍;同時發(fā)現(xiàn),基因YEL013W的刪除會導(dǎo)致類胡蘿卜素產(chǎn)量的提升。在此基礎(chǔ)上,Jia等[15]利用“與門”開關(guān)的精確控制和MuSIC重排策略,經(jīng)過5輪迭代循環(huán)柔性化誘導(dǎo),類胡蘿卜素的產(chǎn)量增加到原始菌株的38.8倍(37.39 mg/L)。Wu等[22]在體外使用柔性化誘導(dǎo)來增加β-胡蘿卜素的產(chǎn)量,結(jié)果發(fā)現(xiàn):共有17種獨特的β-胡蘿卜素代謝路徑的不同基因組重排結(jié)構(gòu)被鑒定,最高的β-胡蘿卜素產(chǎn)量為原始β-胡蘿卜素的5.1倍;通過對不同β-胡蘿卜素基因組重排結(jié)構(gòu)的相關(guān)性分析發(fā)現(xiàn),crtI是β-胡蘿卜素代謝途徑中的關(guān)鍵基因,該基因的復(fù)制以及反轉(zhuǎn)都會導(dǎo)致β-胡蘿卜素產(chǎn)量的提升。Liu等[23]利用SCRaMbLE-in重排策略使β-胡蘿卜素的產(chǎn)量提高到原來的2倍(500 μg/L)。Zhang等[30]結(jié)合培養(yǎng)條件的優(yōu)化獲得高產(chǎn)番茄紅素的菌株(41.47 mg/L)。最近,Jia等[31]通過對synⅤ和synⅩ的攜帶菌株進(jìn)行基因組重排,結(jié)果發(fā)現(xiàn),多個基因組重排結(jié)構(gòu)的協(xié)同作用(包含易位和反轉(zhuǎn))使蝦青素的產(chǎn)量提高到原來的2.7倍。
紫色桿菌素是另一種容易篩選的異源代謝產(chǎn)物。Liu等[23]使用SCRaMbLE-in的重排策略實現(xiàn)高效的異源代謝路徑文庫和底盤細(xì)胞文庫的組合構(gòu)建,最終獲得高產(chǎn)紫色桿菌素的菌株,產(chǎn)量提高為原來菌株的17倍(16.8 mg/L)。Wang等[18]對環(huán)形synⅤ染色體進(jìn)行基因組重排產(chǎn)生復(fù)雜的基因組結(jié)構(gòu)變異分析發(fā)現(xiàn),在29種新型結(jié)構(gòu)變異中有11種結(jié)構(gòu)變異可以提高紫色桿菌素前體(PDV)的產(chǎn)量,紫色桿菌素前體的產(chǎn)量最高約增加到出發(fā)菌株的3.48倍;通過比較基因組學(xué)研究發(fā)現(xiàn),基因YEL017C-A、YEL017W、YER151C和YER182W的刪除,可以增加紫色桿菌素前體的產(chǎn)量。Blount等[27]將柔性化誘導(dǎo)與長讀長納米孔測序技術(shù)相結(jié)合,通過對含有synⅤ的菌株進(jìn)行體內(nèi)柔性化誘導(dǎo)后發(fā)現(xiàn),該方法可以快速鑒定發(fā)生基因組重排的菌株并且獲得紫色桿菌素和青霉素的高產(chǎn)菌株。
綜上發(fā)現(xiàn),篩選的菌株因為它們的表型具有不同的顏色而易于篩選。然而,利用大多數(shù)工業(yè)生產(chǎn)相關(guān)的代謝物難以直接篩選出表型提升的菌株[32]。為了解決這個問題,Gowers等[33]將自動化和高通量樣品制備和檢測系統(tǒng)引入細(xì)胞工廠柔性化誘導(dǎo)系統(tǒng)中以擴(kuò)大對難以篩選產(chǎn)物的篩選能力,結(jié)果發(fā)現(xiàn):這種半自動化篩選系統(tǒng)在短時間內(nèi)可鑒定1 000個重排菌株的產(chǎn)量情況,并且分離出具有2~7倍樺木酸產(chǎn)量增加的12個重排菌株;與此同時,通過基因測序分析發(fā)現(xiàn),一個723 bp長度的非編碼區(qū)域的刪除會使樺木酸產(chǎn)量增加3倍。
由此可見,將柔性化細(xì)胞技術(shù)用于開發(fā)具有工業(yè)應(yīng)用價值的優(yōu)質(zhì)細(xì)胞工廠是極具前景的方法。細(xì)胞柔性化的優(yōu)勢體現(xiàn)在可以在短短幾天內(nèi)獲得含不同結(jié)構(gòu)變異的多樣性遺傳庫。更重要的是,因為柔性化細(xì)胞產(chǎn)生變異的原理與其他方法不同,SCRaMbLE系統(tǒng)是與這些現(xiàn)有的基因組進(jìn)化技術(shù)正交的。因此,可以將柔性化細(xì)胞技術(shù)與其他技術(shù)相結(jié)合來加快篩選進(jìn)程。此外,經(jīng)過柔性化的合成型染色體也可以通過CRISPR-Cas9技術(shù)轉(zhuǎn)移到野生型菌株中,它可以將柔性化細(xì)胞產(chǎn)生的特殊表型傳遞給其他野生型酵母,以此擴(kuò)展柔性化細(xì)胞的應(yīng)用[34]。
當(dāng)然,柔性化細(xì)胞目前也存在一些缺點:需要提前在基因組中插入loxPsym位點,而且整個基因組的柔性化效率取決于插入的loxPsym位點的數(shù)量。隨著現(xiàn)代科學(xué)技術(shù)的發(fā)展,合成DNA的價格變得更加便宜,同時也為在基因組上插入loxPsym位點提供了不同的方法。Cre/loxP重排系統(tǒng)已經(jīng)廣泛應(yīng)用于各種生物體,獲得多樣性的柔性化細(xì)胞[35-37]。因此,細(xì)胞柔性化系統(tǒng)很容易推廣到其他工業(yè)生產(chǎn)相關(guān)的微生物體系[38]。
現(xiàn)有的細(xì)胞工廠的元件和模塊主要依賴于人們對天然生物的簡單修改或突變篩選,近年來人工智能技術(shù)的快速發(fā)展在DNA、RNA和蛋白質(zhì)等細(xì)胞工廠的元件和模塊設(shè)計方面顯示了巨大的潛力。雖然數(shù)據(jù)驅(qū)動的智能方法可以從大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,但僅依賴這種方法不僅難以實現(xiàn)對復(fù)雜的生物學(xué)系統(tǒng)指數(shù)級設(shè)計空間的高效搜索,而且也無法確保設(shè)計結(jié)果的安全性和可控性。
為了克服這些問題,結(jié)合數(shù)據(jù)驅(qū)動和知識驅(qū)動的方法顯得至關(guān)重要。人工細(xì)胞設(shè)計需要融合傳統(tǒng)實驗數(shù)據(jù)、生物規(guī)則和專家知識,以實現(xiàn)從基因元件的局部修改到全新創(chuàng)造、從基因網(wǎng)絡(luò)的局部優(yōu)化到整體適配、從基因組的局部替換到從頭設(shè)計合成、從細(xì)胞功能的被動觀測到精準(zhǔn)控制的全面發(fā)展。雙驅(qū)動的優(yōu)勢在于結(jié)合數(shù)據(jù)驅(qū)動和知識驅(qū)動兩者的優(yōu)點。雖然數(shù)據(jù)驅(qū)動方法可以利用大規(guī)模數(shù)據(jù)進(jìn)行模式識別和發(fā)現(xiàn),但是可能會忽略生物學(xué)規(guī)則和約束。而知識驅(qū)動方法基于生物學(xué)規(guī)則和專家知識,可以引導(dǎo)設(shè)計并保證符合生物學(xué)的可行性。通過將兩者優(yōu)點相結(jié)合,研究人員能夠充分利用數(shù)據(jù)的豐富性和知識的指導(dǎo)性,實現(xiàn)高效精準(zhǔn)的篩選和設(shè)計,推動人工細(xì)胞設(shè)計的未來發(fā)展。
基于人工基因組合成的細(xì)胞工廠柔性技術(shù),在實際實驗過程中會產(chǎn)生巨大數(shù)據(jù)集(基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)以及蛋白質(zhì)相互作用信息等)[39-40]。同時,要實現(xiàn)細(xì)胞工廠的按需定制和構(gòu)建,需要在基因元件、基因網(wǎng)絡(luò)和細(xì)胞狀態(tài)等層面全面發(fā)展系統(tǒng)化、跨尺度的合成生物系統(tǒng)智能設(shè)計的理論。將細(xì)胞工廠柔性化與智能化相結(jié)合是未來的趨勢之一,以人工細(xì)胞工廠的多樣化、定制化功能需求為牽引,重點圍繞全新基因元件的智能按需設(shè)計、人工基因網(wǎng)絡(luò)的智能適配優(yōu)化、細(xì)胞狀態(tài)與功能的智能精準(zhǔn)控制3個方面,實現(xiàn)人工細(xì)胞設(shè)計的智能化和可控化,為創(chuàng)造出功能強(qiáng)大、精準(zhǔn)可靠的合成生物系統(tǒng)提供重要的理論依據(jù)和方法支撐,如圖4所示。
圖4 細(xì)胞工廠智能化Fig.4 Intelligentization in cell factories
深度智能學(xué)習(xí)的進(jìn)展使得新建立的模型能夠更好地處理復(fù)雜的DNA序列,捕獲基因組的遠(yuǎn)程相互作用。Avsec等[41]設(shè)計了Enformer模型,以Transformer模塊來代替Basenji2的空洞卷積(dilated convolutions),將模型的感受野擴(kuò)大了5倍,從DNA序列直接預(yù)測長程的增強(qiáng)子-啟動子相互作用,顯著提高了預(yù)測基因表達(dá)和突變效應(yīng)的準(zhǔn)確性。Dalla-Torre等[42]在來自多個物種的 850個基因組基礎(chǔ)上訓(xùn)練了包含25億個參數(shù)的大語言模型Nucleotide Transformer,以此在12個基因組預(yù)測任務(wù)中可以匹配或優(yōu)于基線方法,再對模型進(jìn)行微調(diào)后可以達(dá)到15個。
智能模型能夠幫助研究人員探索、解釋基因組的復(fù)雜調(diào)控。Vaishnav等[43]測定了超過三百萬條攜帶不同80 bp隨機(jī)序列的啟動子在釀酒酵母中的激活同一熒光基因的表達(dá)強(qiáng)度,根據(jù)該數(shù)據(jù)建立了卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型預(yù)測啟動子序列與轉(zhuǎn)錄強(qiáng)度的關(guān)系,進(jìn)而基于模型來研究3種常見分子進(jìn)化模式:遺傳漂變、穩(wěn)定選擇和定向選擇引發(fā)的啟動子表達(dá)差異,以此來展示僅基于DNA序列深度學(xué)習(xí)模型揭示基因調(diào)控序列進(jìn)化規(guī)律的能力。Zrimec等[44]則從基因組和轉(zhuǎn)錄組數(shù)據(jù)中學(xué)習(xí)生成具有目標(biāo)mRNA水平的調(diào)控 DNA序列,結(jié)果發(fā)現(xiàn),57%的設(shè)計序列超過了天然對照的表達(dá)水平。Wei等[45]針對廣泛應(yīng)用于調(diào)控基因的CNN模型,提出全新的神經(jīng)網(wǎng)絡(luò)解釋算法NeuronMotif,對多面神經(jīng)元(multifaceted neuron)的混合模式進(jìn)行解耦,通過反向聚類卷積層特征圖實現(xiàn)逐層“去混合”,將不同的基序(motif)序列進(jìn)行分離,即,NeuronMotif能構(gòu)建基于結(jié)構(gòu)化語法樹的知識提取方法,以此建立從序列中自動歸納轉(zhuǎn)錄因子結(jié)合位點序列motif、組合語法等順式調(diào)控元件調(diào)控規(guī)則,進(jìn)而推動了基因組的透明化進(jìn)程。
AlphaFold2在蛋白質(zhì)單體結(jié)構(gòu)解析領(lǐng)域的成功應(yīng)用加速推進(jìn)蛋白質(zhì)智能化設(shè)計的進(jìn)程?;贏lphaFold2技術(shù),Lin等[46]去除了占用大量推理時間的多序列比對(MSA)過程,首先,在UniRef50數(shù)據(jù)庫上訓(xùn)練了包含1.5億個參數(shù)的掩碼語言模型ESM-2;然后,將ESM-2得到的蛋白質(zhì)序列編碼和注意力層(attention map)接入折疊模塊(Folding Trunk)和結(jié)構(gòu)預(yù)測模塊(Structure Module)來預(yù)測蛋白質(zhì)的全原子結(jié)構(gòu),結(jié)果發(fā)現(xiàn):ESMFold能夠在14.2 s內(nèi)完成384個氨基酸長度的蛋白質(zhì)結(jié)構(gòu)預(yù)測,比單個AlphaFold2模型快6倍;在較短的序列上,ESMFold的速度提升約為原來的60倍。同時發(fā)現(xiàn),ESMFold在CAMEO和CSAP14數(shù)據(jù)集上的表現(xiàn)優(yōu)于僅使用單序列輸入的AlphaFold2和RoseTTAFold模型,但是依然略差于使用MSA的AlphaFold2。
人工智能對未知空間的探索能力越來越多地被應(yīng)用于指導(dǎo)蛋白質(zhì)功能改造方面。Biswas等[47]將長短期記憶網(wǎng)絡(luò)(mLSTM)應(yīng)用于無標(biāo)記的蛋白質(zhì)序列,先通過無監(jiān)督預(yù)訓(xùn)練模型來學(xué)習(xí)蛋白質(zhì)序列的潛在表示,然后利用少量有標(biāo)注功能數(shù)據(jù)進(jìn)行模型微調(diào),結(jié)果發(fā)現(xiàn),在模型的指導(dǎo)下,僅需要驗證低通量的突變序列(N=24/96)即可獲得功能提高的蛋白質(zhì)。Lu等[48]使用基于3D卷積神經(jīng)網(wǎng)絡(luò)的MutCompute算法來指導(dǎo)聚對苯二甲酸乙二酯塑料(PET)降解酶的突變設(shè)計,得到的突變酶Fast-PETase在50 ℃下48 h內(nèi)將未經(jīng)處理的PET包裝盒幾乎完全降解,證明了用酶法降解回收塑料的工業(yè)可行性。
與對現(xiàn)有蛋白的突變改造相比,從頭設(shè)計(de novodesign)則具有更廣闊的應(yīng)用前景和更高的設(shè)計難度。Wang等[49]設(shè)計了功能蛋白從頭設(shè)計的理想方法:①將功能位點以最小變形嵌入蛋白支架中;②在所有可能的支架拓?fù)浜投壗Y(jié)構(gòu)組成中搜索滿足①最佳結(jié)構(gòu);③同時生成主鏈結(jié)構(gòu)和氨基酸序列?;诖耍芯咳藛T結(jié)合結(jié)構(gòu)預(yù)測模型RoseTTAFold,提出了兩種無須預(yù)先指定結(jié)構(gòu)的全新蛋白設(shè)計方法:幻想法(Hallucination)和修復(fù)法(Inpainting)?;孟敕◤碾S機(jī)序列出發(fā),計算與目標(biāo)結(jié)構(gòu)的損失函數(shù),利用梯度或者蒙特卡洛采樣來更新序列。修復(fù)法在結(jié)構(gòu)預(yù)測的訓(xùn)練上添加了序列補(bǔ)全的任務(wù),能夠恢復(fù)缺少序列和結(jié)構(gòu)的連續(xù)短片段。結(jié)合兩種方法,他們成功設(shè)計了新的大腸桿菌鐵蛋白、鈣結(jié)合蛋白、碳酸酐酶Ⅱ和D5-3-酮甾體異構(gòu)酶。Yeh等[50]將family-wide Hallucination應(yīng)用到熒光素酶的從頭設(shè)計上,成功獲得了高選擇性、高熱穩(wěn)定性的LuxSit-i:針對序列的從頭生成,ProteinMPNN使用信息傳遞網(wǎng)絡(luò)從結(jié)構(gòu)出發(fā)設(shè)計蛋白質(zhì)序列,在大腸桿菌中嘗試表達(dá)96條設(shè)計蛋白序列,其中73條可溶且多數(shù)有較高的熱穩(wěn)定性;同時,使用X線晶體學(xué)、冷凍電鏡和功能研究來驗證了ProteinMPNN在蛋白質(zhì)單體、環(huán)狀同源寡聚物、四面體納米粒子和靶結(jié)合蛋白的設(shè)計能力[51]。Huang等[52]設(shè)計的ProDESIGN-LE則從殘基的局部環(huán)境出發(fā)來分配適當(dāng)?shù)臍埢愋?,對于目?biāo)結(jié)構(gòu),通過對每個殘基位置迭代更新獲得最終的設(shè)計序列,結(jié)果發(fā)現(xiàn),設(shè)計的5條CATⅢ酶中的3條可以成功表達(dá)且可溶。
隨著去噪擴(kuò)散概率模型(DDPMs)在圖像和文本生成任務(wù)上取得成功,這一模型也逐漸引入蛋白設(shè)計領(lǐng)域。具體過程是,擴(kuò)散模型在正向擴(kuò)散過程將數(shù)據(jù)逐步添加噪聲,再從反向過程中學(xué)習(xí)如何從高斯隨機(jī)噪聲中去噪恢復(fù)數(shù)據(jù),生成結(jié)果相較于對抗生成網(wǎng)絡(luò)(GAN)、變分自編碼機(jī)(VAE)具有高度的多樣性。基于RoseTTAFold的從頭設(shè)計模型RFdiffusion用3D高斯噪聲對殘基Cα坐標(biāo)進(jìn)行平移擾動,模擬布朗運(yùn)動對旋轉(zhuǎn)矩陣進(jìn)行方向擾動,訓(xùn)練模型在生成過程中逐步從隨機(jī)噪聲中恢復(fù)完整的結(jié)構(gòu),并通過ProteinMPNN設(shè)計結(jié)構(gòu)對應(yīng)的蛋白序列。RFdiffusion設(shè)計了包括無約束單體、高對稱寡聚體、有特定motif的酶和金屬結(jié)合蛋白等多種類型的蛋白[53]。Liu等[54]將SCUBA-D應(yīng)用在DDPM模塊中,加入氨基酸序列語言模型(ESM-1b)來同時進(jìn)行擴(kuò)散訓(xùn)練,并引入了GAN式判別器在訓(xùn)練中提供額外的損失。
Shi等[55]設(shè)計用所有殘基一次更新來取代耗時較長的自回歸生成和擴(kuò)散生成方式,結(jié)果發(fā)現(xiàn),PROTSEED從上下文特征中學(xué)習(xí)幾何約束和相互作用,以此聯(lián)合翻譯蛋白質(zhì)序列與結(jié)構(gòu)。
隨著智能化與自動化的發(fā)展以及代謝數(shù)據(jù)的大量積累,機(jī)器學(xué)習(xí)在途徑優(yōu)化和逆向合成等方面取得了巨大突破。HamediRad等[56]設(shè)計了集成自動化與智能化的BioAutomata平臺來完成合成生物學(xué)的設(shè)計、構(gòu)建、測試和學(xué)習(xí)(DBTL)循環(huán),通過結(jié)合貝葉斯優(yōu)化算法與自動化系統(tǒng)來優(yōu)化番茄紅素在大腸桿菌中的合成途徑,結(jié)果發(fā)現(xiàn):最優(yōu)途徑產(chǎn)生的番茄紅素比使用隨機(jī)采樣法的高1.77倍;BioAutomata的評估驗證的效率至少比基于回歸的優(yōu)化方案提高8倍。Radivojevic'等[57]利用自動推薦工具(ART),以易用直觀的方式提供貝葉斯集成模型來指導(dǎo)代謝工程,使用8種不同的模型對預(yù)測進(jìn)行投票取得較好的結(jié)果。Zhang等[58]結(jié)合了ART和EVOLVE 算法來提高色氨酸生產(chǎn)效率,與已經(jīng)改進(jìn)的參照菌株(ARO4K229L和 TRP2S65R、S76L)相比,產(chǎn)量和生產(chǎn)能力分別提高了74% 和43%。Zheng等[59]則利用簡化分子線性輸入規(guī)范(SMILES)從產(chǎn)物的分子式出發(fā),在33 710條生物反應(yīng)和62 370條有機(jī)反應(yīng)上訓(xùn)練預(yù)測單步逆合成反應(yīng)的Transformer集成模型,然后通過基于與/或樹的搜索算法完成多步合成途徑的構(gòu)建。Sankaranarayanan等[60]用合成規(guī)劃器 ASKCOS 從市售材料開始規(guī)劃多步合成,然后從中識別可以由酶催化的反應(yīng),自動調(diào)用135種常用的生物催化轉(zhuǎn)化反應(yīng),取得較好的結(jié)果。
對人體復(fù)雜代謝網(wǎng)絡(luò)的深入探索同樣需要人工智能發(fā)揮作用。Morselli等[61]結(jié)合圖卷積神經(jīng)網(wǎng)絡(luò)、網(wǎng)絡(luò)擴(kuò)散和網(wǎng)絡(luò)鄰近性,構(gòu)建多模態(tài)集合預(yù)測算法,針對SARS-CoV-2 的預(yù)期療效對6 340種藥物進(jìn)行排名,結(jié)果發(fā)現(xiàn),在成功減少病毒感染的77種藥物中,有 76 種不與 SARS-CoV-2 靶向的蛋白質(zhì)結(jié)合,表明這些藥物依賴于人體調(diào)控網(wǎng)絡(luò)的復(fù)雜機(jī)制,而使用基于對接的策略無法識別網(wǎng)絡(luò)作用。Zheng等[62]構(gòu)建了由82 270個轉(zhuǎn)錄特征組成的數(shù)據(jù)庫ChemPert來研究轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò),結(jié)果發(fā)現(xiàn),響應(yīng)167種非癌細(xì)胞類型中的2 566種特有的干擾因素(藥物、小分子和蛋白質(zhì)配體)以及57 818種擾動物的蛋白質(zhì)靶標(biāo);同時發(fā)現(xiàn),ChemPert提供利用非癌細(xì)胞數(shù)據(jù)集的計算工具來預(yù)測擾動后轉(zhuǎn)錄反應(yīng)或針對所需轉(zhuǎn)錄組的擾動源,與基于癌癥數(shù)據(jù)庫的預(yù)測相比,它能夠更準(zhǔn)確地預(yù)測非癌細(xì)胞中的擾動反應(yīng)和藥物作用。
對底盤細(xì)胞的構(gòu)建、調(diào)控乃至智能化建??赏苿雍铣缮飳W(xué)設(shè)計能力的進(jìn)一步發(fā)展。Thornburg等[63]建立了 JCVI-syn3A 的全細(xì)胞完全動態(tài)動力學(xué)模型 (WCM):首先,利用冷凍電鏡斷層成像技術(shù)確定直徑約為400 nm的細(xì)胞內(nèi)的503個核糖體和細(xì)胞膜的位置坐標(biāo);然后,構(gòu)建核糖體的三維模型,引入隨機(jī)分布于細(xì)胞質(zhì)中的77 000個蛋白質(zhì)、200個mRNA和5 800個tRNA;最后,通過CME-ODE模型模擬細(xì)胞生長周期中濃度和反應(yīng)通量的時間依賴性行為,該實驗揭示了細(xì)胞如何平衡其新陳代謝、遺傳信息傳遞和生長需求。Rukhlenko等[64]構(gòu)建細(xì)胞狀態(tài)轉(zhuǎn)變評估和調(diào)節(jié)(cSTAR)模型,使用組學(xué)數(shù)據(jù)作為輸入,定位細(xì)胞狀態(tài)、建模狀態(tài)轉(zhuǎn)變進(jìn)行并針對性地預(yù)測干預(yù)措施以改變細(xì)胞命運(yùn)決策;在細(xì)胞分化和增殖模型中測試cSTAR后發(fā)現(xiàn),預(yù)測和實驗數(shù)據(jù)之間存在高度相關(guān)性;C.Origami模型結(jié)合DNA序列、CTCF 結(jié)合和染色質(zhì)可及性的數(shù)據(jù)對細(xì)胞類型特異性染色質(zhì)組織進(jìn)行從頭預(yù)測,檢查遺傳變化對染色質(zhì)相互作用的影響。進(jìn)一步,研究人員開發(fā)了評估單個DNA元件如何促進(jìn)染色質(zhì)組織的篩選方法,可以識別決定染色質(zhì)結(jié)構(gòu)的細(xì)胞類型特異性反式作用的調(diào)節(jié)因子[65]。
傳統(tǒng)細(xì)胞工廠改造和篩選面臨代謝網(wǎng)絡(luò)復(fù)雜、缺乏理性設(shè)計、試錯成本高以及底盤生物改造周期長等瓶頸問題,細(xì)胞工廠自動化平臺將自動化、機(jī)器人技術(shù)和細(xì)胞工廠構(gòu)建相結(jié)合,通過導(dǎo)軌和機(jī)械手臂實現(xiàn)自動化操作。這種自動化操作可以提高實驗操作的穩(wěn)定性,相比傳統(tǒng)技術(shù),它能解決操作繁瑣、耗時、易錯和難以規(guī)模化的問題,從而大大提高了研發(fā)效率。同時,細(xì)胞工廠柔性化過程會產(chǎn)生許多中間體的菌株,需要耗費(fèi)大量的時間和精力來進(jìn)行復(fù)雜的基因操作??梢灶A(yù)見,自動化和高通量化在細(xì)胞改造和篩選方面有著巨大的應(yīng)用價值。然而,細(xì)胞工廠自動化是一個交叉領(lǐng)域,涉及機(jī)械工程、自動化、計算機(jī)和生命科學(xué)等多個學(xué)科,需要各方面共同努力,才能向更高程度的自動化方向發(fā)展。
細(xì)胞工廠自動化利用集成的基礎(chǔ)設(shè)施,以實現(xiàn)對生物體進(jìn)行快速設(shè)計、構(gòu)建和測試,用于生物技術(shù)研究和應(yīng)用。為了加強(qiáng)交流合作,推動自動化設(shè)施平臺的發(fā)展,2019年5月,天津大學(xué)和中國科學(xué)院深圳先進(jìn)技術(shù)研究院作為我國兩家發(fā)起單位,與全球16個科研機(jī)構(gòu)成立了“全球合成生物設(shè)施聯(lián)盟”(Global Biofoundry Alliance,GBA)[66],根據(jù)GBA官網(wǎng)顯示,截至2023年6月,GBA成員已達(dá)33個(https:∥www.biofoundries.org),其中有5 家單位來自中國,分別是天津大學(xué)合成生物學(xué)前沿科學(xué)中心、中國科學(xué)院深圳先進(jìn)技術(shù)研究院、中國科學(xué)院天津工業(yè)生物技術(shù)研究所、國家蛋白質(zhì)科學(xué)中心(上海)和浙江大學(xué)杭州國際科創(chuàng)中心[67]。
近年來,美國在合成生物技術(shù)和設(shè)施方面的總投入在120億美元以上,英國在合成生物學(xué)技術(shù)和設(shè)施領(lǐng)域的總投入已經(jīng)超過1.25億英鎊。目前,世界上已有40余套細(xì)胞工廠研究平臺??梢哉f,細(xì)胞工廠研究平臺已經(jīng)成為推動合成生物學(xué)發(fā)展的核心動力。從發(fā)展趨勢看,具體的研究設(shè)施由小到大、由單一到綜合性方向發(fā)展,呈現(xiàn)美中英三足鼎立的競爭態(tài)勢。美國國防部和能源部等國家部委先后部署了一批總計14億美金的項目,主要目的在于適應(yīng)性、規(guī)模化、按需生產(chǎn)種類豐富的高附加值化學(xué)分子和材料,以支撐特種材料、醫(yī)藥等多種產(chǎn)品的快速供應(yīng)。
美國所支持細(xì)胞工廠自動化主要體現(xiàn)在DNA設(shè)計合成、底盤細(xì)胞構(gòu)建和發(fā)酵驗證等。Ginkgo Bioworks目前已投資超7億美元,平臺包含全流程自動化裝置(微生物和哺乳動物)、DNA合成裝置和設(shè)計平臺裝置。Zymergen目前已投資5億美元,建立了世界上最大的宏基因組數(shù)據(jù)庫,目前已被Ginkgo Bioworks收購。Amyris投資超5億美元,通過建立生物鑄造廠將特別設(shè)計的基因線路自動化裝載到活細(xì)胞中,并輔以高通量測試,利用機(jī)器學(xué)習(xí)技術(shù)運(yùn)行DBTL周期循環(huán),來實現(xiàn)工程化的海量試錯以縮短設(shè)計周期,Amyris同樣注重產(chǎn)品,主要服務(wù)于香精香料、化妝品、藥品和營養(yǎng)保健品市場。伊利諾伊大學(xué)的iBioFAB實現(xiàn)了釀酒酵母定向進(jìn)化的自動化操作方法,并用于提高乙酸耐受性能的高通量篩選[68],隨后在2022年實現(xiàn)了質(zhì)粒構(gòu)建的自動化和高通量[69]。英國也布局了多個自動化平臺。英國愛丁堡大學(xué)的EGF 可以實現(xiàn)每周完成2 000個DNA的組裝,通量相當(dāng)于研究人員手工操作的20倍[70]。英、美等國現(xiàn)有的自動化設(shè)施仍存在一定的局限性,許多研發(fā)需求仍未能滿足,相關(guān)領(lǐng)域的發(fā)展仍面臨障礙。2023年3月23日,美國政府公布的《美國生物技術(shù)和向生物制造進(jìn)軍》中明確其發(fā)展目標(biāo),進(jìn)一步支撐細(xì)胞工廠自動化設(shè)施的建設(shè),其中重要的目標(biāo)是20年內(nèi),為應(yīng)對政治沖突和新冠疫情等突發(fā)情況,建立一套先進(jìn)的生物制造平臺,能夠在發(fā)現(xiàn)供應(yīng)鏈缺口的一周內(nèi)給出應(yīng)對策略,并推動80%的生物制造產(chǎn)品產(chǎn)業(yè)化,滿足美國國內(nèi)的需求;在5年內(nèi)通過推進(jìn)和整合數(shù)據(jù)標(biāo)準(zhǔn)和工具,啟動數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè);在20年內(nèi)建立健全生物制造自動化基礎(chǔ)設(shè)施,以實現(xiàn)產(chǎn)品的快速開發(fā)和工藝優(yōu)化。
近幾年國內(nèi)合成生物產(chǎn)業(yè)呈現(xiàn)爆發(fā)式增長,不僅僅是高校等研究機(jī)構(gòu)加快布局自動化細(xì)胞工廠設(shè)施,搭建自動化、高通量技術(shù)平臺的合成生物公司細(xì)胞工廠也不斷涌現(xiàn),如恩和生物、欣貝萊生物、態(tài)創(chuàng)生物、酶賽生物、惠利生物、衍進(jìn)科技和元騰生物等公司[71]。自動化裝置涉及DNA的自動組裝、元件設(shè)計、底盤配對、高通量篩選和發(fā)酵驗證在內(nèi)的多個自動化功能模塊,可以幫助研究人員大幅提高實驗效率,產(chǎn)生的大量高質(zhì)量數(shù)據(jù)同時與智能化相結(jié)合,有望以高通量、低成本、多循環(huán)地實現(xiàn)細(xì)胞工廠構(gòu)建過程中“設(shè)計—構(gòu)建—測試—學(xué)習(xí)”的自動化運(yùn)行,加速合成生物學(xué)在基礎(chǔ)及相關(guān)應(yīng)用領(lǐng)域的研究效率。
細(xì)胞工廠自動化設(shè)施未來的發(fā)展可能需要在以下幾個方面進(jìn)行重點布局:基于細(xì)胞本身具有復(fù)雜的基因調(diào)控網(wǎng)絡(luò)、細(xì)胞代謝過程和動態(tài)的相互作用,開發(fā)高通量基因-表型關(guān)聯(lián)的自動化系統(tǒng);建立協(xié)議、工作流程和數(shù)據(jù)格式的標(biāo)準(zhǔn)化和可重復(fù)性原則,確保不同生物基礎(chǔ)平臺和實驗的結(jié)果一致且可重復(fù);由于語言、方法和觀點的差異,所以自動化設(shè)施平臺需要相關(guān)領(lǐng)域?qū)<颐芮泻献?,跨越?xì)胞工廠自動化跨學(xué)科的差距,達(dá)到有效的學(xué)科融合、知識構(gòu)建和平臺建立。
通過柔性化細(xì)胞產(chǎn)生的多樣化基因型變異庫涉及大量基因座的變化以及在細(xì)胞工廠柔性化過程中會產(chǎn)生許多中間體菌株,需要耗費(fèi)大量的時間和精力來進(jìn)行復(fù)雜的基因操作。同時,細(xì)胞工廠柔性化過程中會產(chǎn)生的巨大數(shù)據(jù)集(基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)、蛋白質(zhì)相互作用信息等),需要分析處理、特征提取并轉(zhuǎn)化為更容易理解的信息。因此,柔性化細(xì)胞工廠與人工智能(AI)/機(jī)器學(xué)習(xí)(ML)相結(jié)合是重要的發(fā)展方向。同時,在這個過程中引入自動化高通量平臺,以此來加快柔性化細(xì)胞工廠所需產(chǎn)生優(yōu)勢菌株的篩選和驗證過程。細(xì)胞工廠自動化平臺可進(jìn)一步推動未來生物設(shè)施平臺的開發(fā)和應(yīng)用。將細(xì)胞工廠的柔性化、自動化、智能化三者結(jié)合,通過加速研發(fā)、創(chuàng)新、再現(xiàn)性、標(biāo)準(zhǔn)化、數(shù)據(jù)驅(qū)動決策、協(xié)作和知識共享等方面融合,可以解決當(dāng)前細(xì)胞工廠面臨的瓶頸問題,如代謝網(wǎng)絡(luò)復(fù)雜、缺乏理性設(shè)計、試錯成本高及底盤生物改造周期長等。
人工細(xì)胞工廠的研究涉及生物學(xué)、化學(xué)、物理學(xué)、計算機(jī)科學(xué)和機(jī)械工程等學(xué)科領(lǐng)域,需要各個領(lǐng)域的專家協(xié)同合作,才能夠推動人工細(xì)胞工廠的發(fā)展。柔性化、自動化、智能化細(xì)胞工廠將是未來合成生物學(xué)領(lǐng)域發(fā)展的顛覆性突破,帶來生命健康、醫(yī)藥、農(nóng)業(yè)和化工等領(lǐng)域的巨大變革,產(chǎn)生難以估量的社會效益和經(jīng)濟(jì)效益。