溫澤宇,宋 昱,宮美娜,劉伊彤,曹洪玉,史麗穎
(1.大連大學(xué)生命科學(xué)與技術(shù)學(xué)院,遼寧 大連 116622)(2.中國醫(yī)學(xué)科學(xué)院醫(yī)藥生物技術(shù)研究所,北京 100050)
2020年2月3日世界衛(wèi)生組織(World Health Organization,WHO)發(fā)布了《國際社會(huì)的戰(zhàn)略防范和應(yīng)對(duì)計(jì)劃》[1],將新型冠狀病毒肺炎(coronavirus disease-2019,COVID-19)疫情列為國際關(guān)注的突發(fā)公共衛(wèi)生事件. 截止2020年7月,新型冠狀病毒已在世界多個(gè)國家地區(qū)爆發(fā),累積確診人數(shù)達(dá)1 400萬余人,累計(jì)死亡人數(shù)多達(dá)60萬余人[2],疫情導(dǎo)致數(shù)百萬人被強(qiáng)制隔離,疫情嚴(yán)重地區(qū)被封鎖,這給人們的生活以及世界經(jīng)濟(jì)帶來了巨大的沖擊與挑戰(zhàn). 面臨全球每日破萬的新增病例,針對(duì)SARS-COV-2的疫苗以及特效藥的研制仍在進(jìn)行中.
SARS-CoV-2屬于β型冠狀病毒,基因組測(cè)序表明,人類嚴(yán)重急性呼吸綜合征冠狀病毒(SARS-CoV)與SARS-CoV-2病毒具有 79%的序列相似性,序列同源性較高. 同時(shí),這種致病性冠狀病毒與蝙蝠冠狀病毒同源性達(dá)96.2%[3-5]. 主蛋白酶(Mpro)作為目前的研究熱點(diǎn)被認(rèn)為在SARS-CoV-2病毒感染人體過程中發(fā)揮著重要作用,Mpro蛋白酶屬于木瓜蛋白酶,SARS-CoV-2的Mpro蛋白酶與SARS-CoV的Mpro蛋白酶具有較高的序列同源性和結(jié)構(gòu)相似性[6-7]. 活性Mpro蛋白酶含有兩個(gè)結(jié)構(gòu)域,參與病毒復(fù)制酶的成熟與加工. 因此Mpro蛋白酶抑制劑可以抑制病毒的復(fù)制,增加宿主對(duì)SARS-COV-2病毒的抗感染能力[8-10]. 此外,Mpro蛋白酶與人類體內(nèi)的蛋白酶相似性很低,所以Mpro蛋白酶抑制劑對(duì)人體的毒性作用很小[11].
目前已有多種蛋白酶抑制劑用于治療病毒引起的肺炎,蛋白酶抑制劑洛匹那韋/利托那韋是人類免疫缺陷病毒(HIV)常用藥物,初步研究表明可用于治療COVID-19患者,但在臨床應(yīng)用中,這些藥物并沒有表現(xiàn)出對(duì)SARS-COV-2病毒很強(qiáng)的治療效果[12-13]. 除此之外,抗病毒藥物氯喹被報(bào)道應(yīng)用于治療SARS-COV-2感染. 但蛋白酶抑制劑洛匹那韋/利托那韋以及氯喹類藥物在治療中使重度患者會(huì)出現(xiàn)消化道不適甚至肝腎功能損傷等不良反應(yīng)[14-15].因此,研發(fā)特異性高且安全的抗SARS-COV-2藥物迫在眉睫. SARS-COV-2病毒首先在中國被報(bào)道,在世界疫情爆發(fā)式增長(zhǎng)的環(huán)境下,中國憑借獨(dú)特的中西醫(yī)結(jié)合治療手法使疫情得到穩(wěn)定控制. 針對(duì)“炎癥因子風(fēng)暴理論”中藥對(duì)SARS-CoV-2病毒感染癥狀控制率達(dá)81.3%,除此之外中藥治療能夠有效地降低輕癥患者向重癥轉(zhuǎn)化的概率. 目前,清肺排毒湯、連花清瘟膠囊以及疏風(fēng)解毒膠囊等中藥處方及藥劑在臨床治療中在重度患者身上取得了較好的療效. 另外許多中藥藥方在預(yù)防SARS-COV-2病毒感染工作中被廣泛應(yīng)用[16-17]. 因此,發(fā)揮中藥的獨(dú)特優(yōu)勢(shì),從傳統(tǒng)中藥中發(fā)現(xiàn)新型SARS-COV-2抑制劑有著重要的意義.
為了滿足目前治療SARS-CoV-2病毒感染藥物的迫切需求,本次研究中,采取計(jì)算機(jī)輔助藥物虛擬篩選的方法對(duì)中藥數(shù)據(jù)庫TCMD進(jìn)行虛擬篩選,酞氨芐西林(Talampicillin)是前期研究發(fā)現(xiàn)與Mpro蛋白酶有較強(qiáng)親和力的上市藥物[18]. 對(duì)比Talampicillin與Mpro蛋白酶活性位點(diǎn)的結(jié)合方式進(jìn)一步篩選出具有抑制Mpro蛋白酶作用的先導(dǎo)化合物,為Mpro蛋白酶抑制劑的開發(fā)提供指導(dǎo)方向(圖1).
所有分子對(duì)接模擬以及自由結(jié)合能計(jì)算工作通過Insight II和Schrodinger 2019完成,利用Paymol軟件進(jìn)行視圖操作.
中藥化學(xué)數(shù)據(jù)庫(traditional chinese medicines database,TCMD)是中科院過程工程研究所分子設(shè)計(jì)課題組在長(zhǎng)期從事藥物設(shè)計(jì)方法研究的背景下,對(duì)數(shù)據(jù)庫工具的國內(nèi)外需求進(jìn)行分析,經(jīng)多年努力研制成功的科學(xué)數(shù)據(jù)庫產(chǎn)品,是一個(gè)支持新藥研發(fā)和中藥現(xiàn)代化研究的新型工具. 本研究中的虛擬篩選對(duì)象即為TCMD數(shù)據(jù)庫中下載的24 000個(gè)中藥分子.
Mpro蛋白酶晶體結(jié)構(gòu)已經(jīng)在公共蛋白數(shù)據(jù)庫發(fā)表,從蛋白質(zhì)數(shù)據(jù)庫(http://www.rcsb.org/pdb/)下載了Mpro蛋白酶晶體結(jié)構(gòu)(PDB:6LU7)[19]. 按照Lipinski規(guī)則、Veber規(guī)則以及TOPKAT預(yù)測(cè)對(duì)數(shù)據(jù)庫進(jìn)行初篩,隨后基于分子對(duì)接方法進(jìn)一步篩選. 對(duì)篩選得到的化合物進(jìn)行互作模式的分析以及自由結(jié)合能計(jì)算,排除假陽性概率.
在Insight II軟件將蛋白晶體結(jié)構(gòu)中的水刪掉,對(duì)蛋白進(jìn)行加氫以及對(duì)蛋白晶體結(jié)構(gòu)中非完整氨基酸殘基進(jìn)行矯正. 中藥數(shù)據(jù)庫中的小分子全部添加氫原子,使所有小分子統(tǒng)一產(chǎn)生三維結(jié)構(gòu),以及生成異構(gòu)體,同時(shí)賦予CHARMm力場(chǎng). 利用Insight II軟件中的LibDock與LigandFit對(duì)數(shù)據(jù)庫進(jìn)行篩選,通過篩選得到的化合物同陽性對(duì)照組采用高精度對(duì)接方法CDOCKER進(jìn)行對(duì)接分析.
受體與配體之間的自由結(jié)合能(ΔGbind)反應(yīng)出復(fù)合物體系的穩(wěn)定性,是判斷化合物針對(duì)靶標(biāo)蛋白是否有活性的重要參考依據(jù). ΔGbind主要有三方面影響因素:氣相自由能(ΔGMM)、溶劑化自由能(ΔGsolv)和系統(tǒng)熵變化(ΔGSA),三者關(guān)系如下方程:
ΔGbind=ΔGMM+ΔGsolv+ΔGSA.
將Mpro蛋白酶晶體結(jié)構(gòu)在Schrodinger 2019進(jìn)行能量最小化處理,篩選得到的小分子配體于“LigPrep”默認(rèn)參數(shù)下進(jìn)行預(yù)處理. Prime MM-GBSA功能可計(jì)算單個(gè)配體與受體蛋白的自由能,選擇溶劑模型為VSGB,采用系統(tǒng)對(duì)配體以及受體氨基酸位置、方向和構(gòu)象采樣方式(hierarchical sampling). 在OPLS_2005力場(chǎng)下,逐一地對(duì)篩選后得到的藥物以及陽性對(duì)照組計(jì)算自由結(jié)合能并分析比較.
中藥數(shù)據(jù)庫TCMD共含有23 000個(gè)中藥分子,化合物的結(jié)構(gòu)決定了其基本特征,基本特征決定了其物理化學(xué)和生物化學(xué)性質(zhì),后者最終決定了它的藥動(dòng)學(xué)和毒性. Lipinski規(guī)則與Veber規(guī)則用于對(duì)數(shù)據(jù)庫進(jìn)行初步篩選,Lipinski規(guī)則包含分子量不大于500;氫鍵供體數(shù)目不超過5;氫鍵受體數(shù)目不超過10;脂水分配系數(shù)不超過5;可旋轉(zhuǎn)鍵的數(shù)量不超過10個(gè)五個(gè)原則. Veber規(guī)則包含可旋轉(zhuǎn)化學(xué)鍵不超過10個(gè);極性表面積不超過140 ?2;氫鍵總數(shù)不超過12個(gè)三個(gè)原則. 化合物如果不滿足以上規(guī)則中的任何一項(xiàng),在生物利用度以及毒性方面就會(huì)存在問題[20]. 通過Lipinski規(guī)則和Veber規(guī)則對(duì)數(shù)據(jù)庫進(jìn)行初篩,可以摒棄那些不能夠成藥的化合物,從而大幅度降低篩選范圍和藥物研發(fā)成本,共14 399個(gè)小分子通過Lipinski規(guī)則和Veber規(guī)則.
初步篩選成功的化合物通過分子對(duì)接方法進(jìn)一步篩選,分子對(duì)接是從整體上考慮配體與受體結(jié)合的效果,能夠較好避免其他方法中容易出現(xiàn)的局部作用較好而整體結(jié)合欠佳的情況. N3肽類抑制劑被證實(shí)可特異性抑制多種冠狀病毒的Mpro蛋白,Xu等研究人員對(duì)SARS-CoV-2-Mpro蛋白和N3肽類抑制劑復(fù)合物進(jìn)行X晶體衍射,結(jié)構(gòu)顯示Mpro蛋白酶底物結(jié)合位點(diǎn)由催化結(jié)構(gòu)域 I和II組成,共晶配體N3作用于催化位點(diǎn). 分子模擬實(shí)驗(yàn)和活性實(shí)驗(yàn)均證明N3可作為Mpro蛋白抑制劑[19]. 本次研究首先通過LibDock進(jìn)行初篩,將Mpro蛋白晶體結(jié)構(gòu)中N3作用位置定義為受體活性位點(diǎn)(X=-10.712,Y=12.411,Z=68.831),活性口袋大小為原配體中心半徑為13 ?范圍內(nèi)的氨基酸. 計(jì)算得到熱區(qū)圖,包含極性和非極性部分,接著不同構(gòu)象的配體分子分別剛性地疊合至熱區(qū)圖以形成比較合適的相互作用,然后進(jìn)行能量?jī)?yōu)化,最后保留打分較高的對(duì)接構(gòu)象. 14 399個(gè)化合物保持其構(gòu)象與Mpro蛋白酶進(jìn)行剛性對(duì)接以進(jìn)行快速篩選. 剩余的化合物在LibDock對(duì)接后,LibScore值分布在157~179. LibScore值可以反應(yīng)出化合物與蛋白受體的結(jié)合效果,將LibScore值由大到小排布后,考慮篩選化合物結(jié)構(gòu)的多樣性以及不同數(shù)值下化合物的數(shù)目、化合物與受體之間的作用力數(shù)量和類型的情況,決定取LibScore值排名前1 000的化合物進(jìn)行 LigandFit 篩選.
Ligandfit具備了受體分子活性位點(diǎn)的自動(dòng)尋找和確認(rèn)、構(gòu)象柔性的多配體對(duì)接以及基于力場(chǎng)的相互作用打分評(píng)價(jià)的功能. 1 000個(gè)化合物置于Mpro蛋白酶活性位點(diǎn)中,LigandFit按照幾何互補(bǔ)、能量互補(bǔ)以及化學(xué)環(huán)境互補(bǔ)的原則對(duì)其構(gòu)象進(jìn)行調(diào)整,找到配體與受體的最佳結(jié)合模式. 采用LigScore1、LigScore2、PLP1、PLP2、Jain、PMF 6種打分函數(shù)對(duì)過濾后的化合物進(jìn)行一致性打分評(píng)價(jià),一致性評(píng)分后,Consensus值可反應(yīng)對(duì)接Pose與蛋白結(jié)合效果,將Consensus值按照由大到小順序排列后,取該值大于等于3的化合物. 基于分子對(duì)接篩選后,獲得235個(gè)化合物.
TOPKAT預(yù)測(cè)原理是通過建立QSTR(定量化合物片段結(jié)構(gòu)-毒性關(guān)系)模型,該模型不僅可以預(yù)測(cè)藥物毒性,還可以評(píng)價(jià)藥物到達(dá)治療靶點(diǎn)的藥理活性濃度. 預(yù)測(cè)過程中采用“最佳預(yù)測(cè)空間”評(píng)估驗(yàn)證技術(shù)來提高預(yù)測(cè)的可靠性,并且預(yù)測(cè)結(jié)果會(huì)返回相似化合物的毒性特性,可從相似化合物的角度來綜合判定預(yù)測(cè)結(jié)果. 從致畸性、致突變性、致癌性3個(gè)方面對(duì)剩余化合物進(jìn)行篩選,選擇具有較低嚙齒動(dòng)物致癌性、較低Ames致突變性以及較低發(fā)育毒性的化合物用于下一步互作模式研究. 最終7個(gè)化合物被預(yù)測(cè)為無致癌性、致畸性和致突變性風(fēng)險(xiǎn),通過TOPKAT測(cè)試,認(rèn)為這7個(gè)化合物是潛在的Mpro抑制劑的先導(dǎo)化合物. 這7個(gè)化合物詳細(xì)的理化信息見表1. 最后對(duì)中藥數(shù)據(jù)庫篩選后得到的這些化合物進(jìn)行分子對(duì)接研究以及自由結(jié)合能的計(jì)算以排除這些化合物中的假陽性概率.
表1 7個(gè)化合物的理化信息Table 1 Physical and chemical information of 7 compounds
酞氨芐西林(Talampicillin)是一種抗革蘭氏陰性菌類上市藥物. Elmezayen等通過分子對(duì)接篩選Mpro蛋白抑制劑,結(jié)果顯示Talampicillin與Mpro蛋白酶有較高的親和力[18]. 本次研究將Talampicillin以及7個(gè)先導(dǎo)化合物通過CDOCKER與Mpro蛋白酶實(shí)現(xiàn)精確對(duì)接,通過分析Talampicillin在Mpro蛋白酶活性口袋的互作模式,對(duì)比7個(gè)先導(dǎo)化合物的作用模式,進(jìn)一步篩選出具有潛在活性的Mpro蛋白酶抑制劑.
如圖2b所示,Talampicillin在Mpro蛋白酶活性口袋中占據(jù)S1、S2以及S3 3個(gè)位點(diǎn),Talampicillin與GLU166形成經(jīng)典的氫鍵作用,HIS164、HIS41以及PRO168與Talampicillin形成碳?xì)滏I作用. 除氫鍵作用外,觀察到Mpro蛋白酶與Talampicillin還存在著廣泛的疏水作用. 如圖2a所示,MET49與Talampicillin結(jié)構(gòu)中S1′片段的苯環(huán)存在π-Alky作用,HIS41與苯環(huán)形成π-π共軛作用,氨基酸PRO168與Talampicillin中S2′片段的苯環(huán)形成π-Alkyl作用,同時(shí)還可以看到Talampicillin與Mpro蛋白酶活性口袋周圍的多個(gè)氨基酸存在范德華力作用. 保留相同參數(shù)設(shè)置,將篩選得到的7個(gè)先導(dǎo)化合物依次對(duì)接于Mpro蛋白酶活性口袋,并與Talampicillin的作用方式進(jìn)行比較(圖2). 如表2所示,7個(gè)先導(dǎo)化合物同Talampicillin都與Mpro蛋白酶活性口袋周圍的氨基酸存在著較多的范德華作用. 7個(gè)化合物形成的氫鍵數(shù)目各不相同,對(duì)比Talampicillin氫鍵作用方式,與CYS143形成經(jīng)典的氫鍵作用是先導(dǎo)化合物之間存在共同作用模式. 不同于Talampicillin,先導(dǎo)化合物中碳?xì)渥饔脙H存在于部分化合物(化合物1、3、4和6),且與其作用的氨基酸各不相同. 對(duì)比Talampicillin與先導(dǎo)化合物發(fā)現(xiàn),與HIS41、PRO168之間的疏水作用方式為兩者共同作用方式. 化合物5與Talampicillin類似,與PRO168形成π-Alkyl作用,另外化合物5中的苯環(huán)與HIS41形成π-π共軛作用. 綜上所述,Talampicillin和先導(dǎo)化合物與Mpro蛋白酶互作模式相似. 化合物與Talampicillin都有較多的范德華作用力,先導(dǎo)化合物間產(chǎn)生經(jīng)典氫鍵作用最多的氨基酸為CYS143,產(chǎn)生疏水作用最多的氨基酸為HIS41、PRO168.
圖2 Talampicillin與Mpro蛋白酶互作模式Fig.2 Interaction mode between Talampicillin and Mpro
表2 Mpro蛋白酶活性位點(diǎn)內(nèi)的相互作用Table 2 Interactions within the Mpro active site
通過對(duì)Talampicillin和先導(dǎo)化合物與Mpro蛋白酶互作模式研究,發(fā)現(xiàn)兩者的作用方式相似. 與陽性對(duì)照組相似的作用模式并不能完全證實(shí)7個(gè)化合物可作為潛在的Mro抑制劑的先導(dǎo)化合物. 所以通過進(jìn)一步分析Talampicillin和先導(dǎo)化合物與Mpro蛋白酶復(fù)合物的自由結(jié)合能,證實(shí)復(fù)合物體系的穩(wěn)定性,排除假陽性概率. 如表3所示,Talampicillin自由結(jié)合能ΔGbind=-58.13 kcal/mol. 從數(shù)據(jù)可以看出與氨基酸的范德華力作用(ΔGbindvdW=-50.60 kcal/mol)對(duì)維持Talampicillin與Mpro蛋白酶復(fù)合物體系穩(wěn)定有很關(guān)鍵的作用,除此之外庫倫能(ΔGbindCoulomb=-15.78)以及親脂性結(jié)合(ΔGbindLipo=-12.25)也穩(wěn)定持續(xù)地維持復(fù)合物的穩(wěn)定性. 先導(dǎo)化合物與Mpro蛋白酶復(fù)合物自由結(jié)合能從-38.83 kcal/mol至-59.06 kcal/mol 不等. 自由結(jié)合能分析得出,化合物1-5自由結(jié)合能的分布同陽性對(duì)照組相似,范德華力為復(fù)合物體系的穩(wěn)定提供主要的能量,庫倫能以及親脂性結(jié)合能貢獻(xiàn)雖比范德華能量低,但依然持續(xù)地維持體系的穩(wěn)定. 其中化合物1(ZINC33830770)與化合物4(ZINC13358899)數(shù)據(jù)顯示出兩者與Mpro蛋白酶復(fù)合物的穩(wěn)定性較強(qiáng). 在Mpro蛋白酶活性口袋中化合物1和化合物4同Talampicillin構(gòu)象相似(圖3a-i),配體結(jié)構(gòu)骨架深入活性口袋并占據(jù)口袋S1、S2和S3位點(diǎn). 不同于Talampicillin氫鍵作用方式,化合物1與THR26和CYS143存在經(jīng)典氫鍵作用. 與Talampicillin類似,化合物1與His41存在疏水作用外,與MET49和CYS145存在π-Alky作用. 化合物4與CYS143存在經(jīng)典氫鍵作用,與HIS163和LEU141存在碳?xì)滏I作用. 與Talampicillin相比,兩者都與PRO168存在疏水作用. 除此之外,化合物4與HIS163和HIS172存在π-Alky作用.
圖3 SARS-CoV-2與Talampicillin(a、d、g)、化合物1(b、e、h)和化合物4(c、f、i)二維及三維作用模式圖Fig.3 2D and 3D interaction mode of SARS-CoV-2 and Talampicillin(a,d,g),compound 1(b,e,h)and compound 4(c,f,i)
表3 Mpro蛋白酶結(jié)合配體MM-GBSA自由結(jié)合能計(jì)算Table 3 MM-GBSA free energy calculations(in kcal/mol)of ligands bound to Mpro kcal/mol
化合物1為靈芝屬三萜類化合物,中藥材靈芝具有免疫刺激作用,可加強(qiáng)人體對(duì)新冠病毒的抗感染能力. 研究報(bào)道該三萜化合物同時(shí)具有抗HIV-1 蛋白酶活性[21]. 而HIV-1蛋白酶抑制劑被報(bào)道用于治療新冠肺炎. 化合物4為杭菊中的活性成分[22],杭菊具有抗菌、抗炎與神經(jīng)保護(hù)等多種活性功能[23]. 中醫(yī)中杭菊可用于疏散風(fēng)熱以及治療溫邪犯肺引起的癥狀. 最后互作模式與自由結(jié)合能的分析增加了篩選結(jié)果的可信度,同時(shí)揭示了化合物1與化合物4具有作為Mpro蛋白酶抑制劑先導(dǎo)化合物的潛力.
中藥治療在這次嚴(yán)峻的全球疫情下取得了良好的療效. 本次研究以Mpro蛋白酶為靶標(biāo)蛋白,從中藥數(shù)據(jù)庫TCMD篩選得到的靈芝屬三萜化合物1(ZINC33830770)與杭菊中的活性化合物4(ZINC13358899)具有較高的活性,且成藥性良好. 化合物1與化合物4與Mpro蛋白酶活性位點(diǎn)作用模式和陽性對(duì)照組 Talampicillin相似,存在氫鍵、疏水作用以及廣泛的范德華力,兩者與Mpro蛋白酶有較強(qiáng)的親和力. 自由結(jié)合能的計(jì)算也揭示了化合物1與化合物4與Mpro蛋白酶復(fù)合體系的穩(wěn)定性較高. 因此,化合物1與化合物4可作為Mpro蛋白酶抑制劑先導(dǎo)化合物進(jìn)行開發(fā)利用.