談浚杰,李明坤,2,孟子汶,2,畢美營,2,韋佳勛,2,汪朝陽,2,應(yīng)明,2*
(1.天津理工大學(xué) 化學(xué)化工學(xué)院 生物制藥工程系,天津 300384;2.天津理工大學(xué) 化學(xué)化工學(xué)院 天津市有機太陽能電池與光化學(xué)轉(zhuǎn)換重點實驗室,天津 300384)
DNA是一種眾所周知的攜帶遺傳信息的天然分子。在過去的三十年中,DNA由于其可預(yù)測和可編程的構(gòu)象、A-T和C-G的Watson-Crick堿基配對原理以及存在豐富的酶等特點,使得用工具來操縱DNA,已被普遍用作核酸納米結(jié)構(gòu)的分子構(gòu)建模塊。DNA結(jié)構(gòu)在分子水平上的可預(yù)測性優(yōu)于構(gòu)建納米結(jié)構(gòu)的任何其他生物分子。此外,DNA納米結(jié)構(gòu)還具有良好的生物相容性、柔韌性、機械穩(wěn)定性、高負載能力、高組織滲透性和足夠的生物流體穩(wěn)定性,這有利于其在體內(nèi)外的應(yīng)用。所有這些特征使得納米核酸結(jié)構(gòu)適用于仿生系統(tǒng)[1]、診斷[2]和人類健康治療[3]。例如,選擇核酸納米結(jié)構(gòu)作為強病毒載體材料。Anderson等人開發(fā)了具有清晰尺寸的自組裝DNA四面體納米顆粒,以將siRNA引入細胞并沉默腫瘤中的靶基因[4]。免疫系統(tǒng)還影響DNA納米結(jié)構(gòu)的體內(nèi)應(yīng)用[5]。使用模擬自身物質(zhì)的“偽裝”DNA納米結(jié)構(gòu)可以幫助它們逃離免疫系統(tǒng)[6-7]。它在疫苗研發(fā)和核酸醫(yī)用生物材料方面發(fā)揮著重要作用。
在先前研究中,SdhC雙鏈DNA用于折疊,通過核酸自組裝成功設(shè)計并獲得預(yù)期邊長19.05 nm的正四面體核酸納米錐[8]。構(gòu)建了一種新的方法,即普通基因的雙鏈DNA可以取代單鏈M13mp18核酸作為DNA折紙的核酸材料。在此基礎(chǔ)上,自主設(shè)計了核酸納米盒的組裝[9]。通過選擇citZ基因并用特定基因位點修飾,通過計算和自組裝獲得邊長為47.29 nm的核酸納米盒,并通過限制酶控制核酸納米盒的開關(guān)。打開的核酸納米盒與在限制位點修飾的質(zhì)?;旌?并在轉(zhuǎn)移到原生質(zhì)體之前與T4連接酶連接。實驗表明,100%的包裹質(zhì)粒被轉(zhuǎn)移到革蘭氏陽性細菌中,這表明核酸納米盒有望成為一種新的藥物載體。
上述研究表明,模塊拼接核酸納米材料的構(gòu)建方法比DNA折紙更為人工,可以使用普通的雙鏈DNA序列作為納米結(jié)構(gòu)的核酸材料,甚至可以定制納米結(jié)構(gòu)并且所構(gòu)建的納米結(jié)構(gòu)更完整。因此,使用“樂高”區(qū)塊拼接將T4噬菌體分為四部分進行區(qū)塊拼接和組裝。首先,選擇人類基因組基因PPIAP5的基因序列作為頭部15個模塊的材料,選擇HSBP1P2的基因序列為衣領(lǐng)中的9個模塊和底板中的6個模塊的素材,選擇NDUFB3P3的基因序列用作鞘中的10個模塊的材料。其次,使用DEADALUS算法,為了使設(shè)計的結(jié)構(gòu)滿足T4噬菌體的大小、構(gòu)建目標結(jié)構(gòu)的所有頂點的空間坐標、頂點之間的連接性以及頂點應(yīng)提供的表面(圖1A、B)。除了提供上述空間信息外,邊長不能小于31 bp,并且是10.5 bp的倍數(shù)。因此,T4噬菌體的最小邊長被設(shè)計為31 bp。最后,使用改進的DEADALUS修改相應(yīng)模塊的原材料,在特定位點添加限制性位點,并拼接每個位點,從而最終形成預(yù)期的T4噬菌體結(jié)構(gòu)。
圖1 DEADALUS算法圖解
在這項研究中,目標是用復(fù)雜的對稱外殼模擬T4噬菌體病毒,大多數(shù)是病毒外殼或二十面體對稱或螺旋對稱,但痘病毒和大型噬菌體病毒不屬于其中任何一種。痘病毒是最大的動物病毒(約400 nm×240 nm×200 nm),外觀呈橢圓形或磚狀,內(nèi)部結(jié)構(gòu)非常復(fù)雜,但大型噬菌體病毒比痘病毒更復(fù)雜。對大腸桿菌T4噬菌體病毒進行了仔細研究。它們的頭部類似于二十面體結(jié)構(gòu),尾部由套環(huán)、中空尾管、圍繞尾管的尾鞘和復(fù)雜的底板組成,頸部將頭部和尾部連接在一起。具有二十面體對稱頭部和螺旋對稱鞘,T4噬菌體病毒(頭部直徑約為85 nm,鞘直徑約為10 nm,長度約為95 nm)具有二元對稱結(jié)構(gòu)。
生成樹程序?qū)⑤斎雴捂溦郫B到目標結(jié)構(gòu)的框架中,并生成折疊所需的訂書釘股線。為了使單個支架鏈能夠形成完整的目標結(jié)構(gòu),必須滿足兩個條件。第一個條件是必須有一個歐拉回路,因為支架的兩端將形成彼此相鄰的支架間隙,并且該間隙必須由多余的縫釘填充。為了確保歐拉電路的存在,當(dāng)每個頂點的階數(shù)為偶數(shù)時,結(jié)構(gòu)中的每條邊可以實現(xiàn)偶數(shù)個雙工。第二個條件是,即使歐拉電路存在,也不能保證所有的歐拉電路都能形成有效的支架結(jié)構(gòu)。為了形成有效的支架結(jié)構(gòu),在設(shè)計曲面屬性元素時,從某個頂點輸入某個頂點。邊的腳手架鏈可以從同一頂點或另一頂點離開。因此,解決支架路徑的問題可以概括為:將邊緣劃分為一個具有零支架交叉或一個支架交叉的邊緣。具有零支架交叉的邊必須連接到每個頂點,并且沒有循環(huán),這滿足生成樹的定義,因此使用生成樹來解決支架布線(圖1C),并且prim算法用于找到最小權(quán)重并重新生成樹(頂點集是V,邊集是e,X是集合V中的任何頂點。算法從頂點X開始,每次選擇一個最接近當(dāng)前頂點集的頂點,并將兩個頂點之間的邊添加到樹t并重復(fù))。
添加偽節(jié)點和支架布線對于零支架交叉的邊,添加一對偽節(jié)點以將邊分成兩半,每一半對應(yīng)于支架交叉的一側(cè)(圖1D)。對于圖形中的每個頂點,將添加一組偽節(jié)點來替換頂點節(jié)點,對于每個面,將放置一個偽節(jié)點,以連接兩個邊界邊并將其與其他邊斷開。添加偽節(jié)點后,定義了腳手架將通過的歐拉電路(圖1E和F),它有兩種電路:順時針布線和逆時針布線。為了最小化骨架的靜電排斥,選擇了逆時針運行支架的路線。生成樹和偽節(jié)點僅與結(jié)構(gòu)相關(guān),與大小無關(guān)。然后,將邊緣的長度引入算法(圖1插圖),并將支架切口位置放置在沒有支架交叉的邊緣上,遠離縫釘切口和交叉點的復(fù)合結(jié)構(gòu)。使用prim算法,根據(jù)邊緣的長度和布線方案對每個支架底座進行編號,并跟蹤其在邊緣上的相對位置。對于每條邊緣,一個核苷酸從5'和3'端突出,算法確定任何給定邊緣上支架片段的長度。
預(yù)測原子級3D結(jié)構(gòu)對于具有支架交叉的邊緣,將兩個31~32 nt縫釘放置在支架交叉處,以充分加強結(jié)合。對于邊緣的其余部分,如有必要,用42 nt縫釘、22 nt或21 nt短縫釘填充(圖1G)。每個縫釘由數(shù)字向量表示,與支架核苷酸配對,然后使用輸入或生成的支架序列與相應(yīng)的支架編號匹配。采用通用算法確定邊緣端點的位置。Dx瓦片可以被視為兩個組合寬度為4 nm(2 nm螺旋間距和2 nm雙工直徑)的平行圓柱體,其可以進一步簡化為具有4 nm寬度的矩形。在理想情況下,這些矩形的角度相交,矩形的寬度相加形成一個N邊正多邊形。多邊形的內(nèi)徑是從邊的中心到邊的垂直距離(s是頂點和DX平鋪邊的起點之間的距離,r是由DX平鋪的寬度形成的多邊形的半徑,θtot是頂點的所有面角之和)。
然而,并不是所有的頂點都有相同的角度,會有骨干延伸或核苷酸重疊的情況,所以定義s=r為角的延伸,并創(chuàng)建一個半徑為r的球體來定義邊緣邊界(是最大的面角度,是DX-tile的寬度)。這種方法適用于所有的規(guī)則結(jié)構(gòu)。
如果設(shè)計完整的結(jié)構(gòu),T4噬菌體結(jié)構(gòu)的設(shè)計需要大于20 000 bp 的支架序列。在實際的實驗組裝過程中,出錯的概率太大,因此使用“樂高”塊拼接將T4噬菌體分為四個部分(頭部、頸部、尾部和底板)。它們各自產(chǎn)生的結(jié)構(gòu)通過限制酶切割和連接,以實現(xiàn)復(fù)雜結(jié)構(gòu)的模塊組裝。因此,算法的改進可以在腳手架序列上添加限制點,因為算法具有腳手架上的基礎(chǔ)序列號,由txt文件生成以檢查基礎(chǔ)是否安排在每種情況和基礎(chǔ)序列的位置,通過查找需要替換的基礎(chǔ)序列的位置,替換相應(yīng)的酶限制位點序列(這里是改進的程序)。
scaf_seq=(″);
replaced_seq=(″);
enzyme_sequence=(″);
len_enzyme=length(replaced_seq);
site_of_enzyme=strfind(scaf_seq,num2str
(replaced_seq))
[m,n]=size(site_of_enzyme);
for i=1:m;
for j=1:n;
if site_of_enzyme(i,j)==1;
scaf_seq(site_of_enzyme(i,j):1:
(len_enzyme+site_of_enzyme(i,j)-1))=enz
yme_sequence
end
end
end
通過DEADALUS算法的應(yīng)用,成功地設(shè)計了T4噬菌體四個模塊的納米結(jié)構(gòu)。根據(jù)算法流程,首先選擇目標結(jié)構(gòu)的幾何模型。因為將噬菌體組裝成模塊,所以完整的噬菌體被分為四個幾何模型。以頭部幾何模型為例,制作了頭部的Schlegel圖,計算了生成樹和支架路徑,添加了偽節(jié)點和縫釘,將A鏈折疊成噬菌體頭部結(jié)構(gòu),如圖2所示。在此基礎(chǔ)上,使用“樂高”積木拼接法,將折疊成頭部結(jié)構(gòu)的長股分成15根梁。每個梁構(gòu)成頭部結(jié)構(gòu)的一個模塊。15個模塊與算法生成的引腳組合,以模塊組裝的方式生成噬菌體頭部結(jié)構(gòu)。其他三種結(jié)構(gòu)類似。軸環(huán)由九個模塊組成,護套由十個模塊構(gòu)成,底板由六個模塊組成。由于組裝的四個模塊需要通過相應(yīng)的黏性端拼接,因此分析了包括四個模塊的梁的限制位置。因為每個模塊之間的連接位置和連接順序是固定的,所以必須將頭部連接到上套環(huán),下套環(huán)必須連接到上護套,下護套必須連接到基板。因此,頭部和軸環(huán)頂部、軸環(huán)下端和護套頂部、護套下端和基板的限制位置應(yīng)相同,三個連接位置的限制位置不應(yīng)相同,以確保每個模塊之間的正確連接。此外,上述三個核酸序列中必須不存在作為每個模塊束的合格限制位點,以防止限制酶切割在每個模塊連接期間不應(yīng)斷裂的束,導(dǎo)致模塊解體。因此,需要三個不同的限制位點,這些位點在三個射束中不存在,使用Snapgene軟件分析限制位點,發(fā)現(xiàn)了三個限制位點,AbsI(CC^TCGAGG)、BbvCI(CC^TCAGC)和XbaI(T^CTAGA)(圖s1顯示了限制位點的位置)。因此,使用改進的DEADALUS算法在四個模塊上添加這些限制點。
(a)噬菌體頭部的算法圖流程:選擇噬菌體頭部模型,投影頭部的施萊格爾圖,計算施萊格爾圖表上的最小生成樹,將平面生成樹轉(zhuǎn)換為3D生成樹,并在非生成樹路由上添加缺口,以定義歐拉電路,根據(jù)邊緣長度和是否有刻痕,在頂點和邊緣添加特定的訂書釘鏈;(b)噬菌體頸部算法流程圖;(c)尾部算法流程圖;(d)底板算法流程圖圖2 模塊算法圖
對于不同的噬菌體模塊,選擇不同的核酸材料以適應(yīng)由梁組成的模塊的長度。對于噬菌體的頭部,選擇PPIAP5,PPIAP5是肽基丙酰異構(gòu)酶A假基因5。PPIAP5的基因ID為122 842,全長574 bp,位于智人14號染色體GRCh38的59 181 571~59 182 144位置,選擇了HSBP1P1,HSBP1P2是熱休克因子結(jié)合蛋白1的假基因2。HSBP1P基因的ID號為326 296,全長538 bp,位于智人4號染色體GRCh38的110 251 617~110 252 126位置,位于智人14號染色體GRCh38的53 011 929~53 012 401位置。這些核酸材料均為假基因,選擇了這三個基因以避免干擾正常轉(zhuǎn)錄。
T4噬菌體的頭部需要長度為8 190 bp的堿基序列,并選擇15個基于PPIAP5的射束。修改了五束,第一束的長度為154 bp。15個分散的射束被大量的針組合以形成噬菌體的頭部模塊。分析后,AbxI限制位點位于頭部E(V14-V19),E(V13-V18),E(V12-V17),E(V16-V21),E(V15-V20)的五個側(cè)面,以連接到頸部。由頭部組成的15個模塊如圖3所示。
圖3 由頭部組成的15個模塊
頸部需要長度為4 752 bp的基礎(chǔ)序列。選擇了基于HSBP1P1的九個波束。修改了六個波束,第一個波束的長度為448 bp。AbxI限制位點位于軸環(huán)E(V20-V29),E(V19-V28),E(V18-V27),E(V17-V26),E(V21-V30)的五側(cè),以連接至頭部,BbvCI限制位點位于頸部E(V25-V4),E(V24-V3),E(V23-V2),E(V22-V1)的四側(cè),以與尾部連接。由頸部組成的15個模塊如圖4所示。
圖4 由頸部組成的15個模塊
尾部需要458 4 bp長度的堿基序列。選擇了基于NDUFB3P3的十個波束。修改了七個波束,修改后的第一個波束為327 bp。BbvCI限制位點位于snath E(V6-V26),E(V9-V27),E(V12-V28),E(V3-V25)和E(V3-V25)的四個側(cè)面,以連接到頸部,XbaI限制位點位于E(V1-V21),E(V4-V22),E(V7-V23),E(V10-V24)的四側(cè),以連接到底板。
底板需要長度為3 168 bp的堿基序列。選擇了基于HSBP1P1的六個波束。修改了三個波束,第一波束的長度為478 bp。XbaI限制部位位于底板E(V15-V19),E(V14-V18),E(V13-V17),E(V16-V20)的四個側(cè)面,以連接到尾部。由底板組成的六個模塊如圖5所示。
圖5 由底板組成的六個模塊
噬菌體的四個結(jié)構(gòu)設(shè)計完成并添加限制位點后,應(yīng)將四個單獨設(shè)計的結(jié)構(gòu)拼接成完整的噬菌體結(jié)構(gòu)?!皹犯摺眳^(qū)塊拼接用于用限制性內(nèi)切酶切割靶結(jié)構(gòu)的限制性位點。由于頭部和頸部、尾部、底板對應(yīng)于粘性末端,因此可以與DNA連接酶連接。一對一連接后,可以形成完整的噬菌體結(jié)構(gòu)。
開發(fā)了一種使用“樂高”塊拼接和DNA納米結(jié)構(gòu)的計算機輔助設(shè)計來模擬T4噬菌體病毒衣殼的自組裝方法,并可以通過這種方法模擬各種形狀的病毒衣殼。基于自主開發(fā)系統(tǒng)的病毒模擬研究可以產(chǎn)生兩種效果:首先,它在DNA設(shè)計理念上取得了突破,并開發(fā)了適合光譜基因的“樂高”塊拼接,這種構(gòu)建方法將為會計納米技術(shù)提供新的學(xué)術(shù)思路;第二,DNA模擬病毒衣殼顆粒的實驗組裝如果成功,將改變創(chuàng)傷疫苗的生產(chǎn)方式,為開發(fā)更多的核酸奠定了基礎(chǔ)。