陳鄭珊,遲象陽(yáng),范鵬飛,張冠英,王美榮,于長(zhǎng)明,陳薇
軍事科學(xué)院軍事醫(yī)學(xué)研究院 生物工程研究所,北京 100071
隨著計(jì)算機(jī)性能不斷增強(qiáng)以及模擬計(jì)算方法不斷成熟,出現(xiàn)了應(yīng)用在生物領(lǐng)域的分子模擬方法,能夠通過(guò)計(jì)算機(jī)模擬對(duì)生物大分子進(jìn)行研究。在眾多的模擬方法中,分子對(duì)接已成為其中最重要和應(yīng)用最廣泛的方法之一。分子對(duì)接主要是考察和預(yù)測(cè)兩個(gè)分子在復(fù)合物中的結(jié)合模式,分子對(duì)接在抗原-抗體的研究中有著重要的應(yīng)用。在抗體-抗原性質(zhì)的研究中,表位信息是研究人員最為關(guān)心的方面之一,相對(duì)于主流的實(shí)驗(yàn)方法,分子對(duì)接模擬在抗原表位 (尤其是空間構(gòu)象性表位)的預(yù)測(cè)和輔助篩選方面具有特別的優(yōu)勢(shì)[1],分子對(duì)接結(jié)果能夠提供對(duì)闡明抗體中和機(jī)制有價(jià)值的線索[2-3]。然而在對(duì)接產(chǎn)生的大量對(duì)接構(gòu)象中,近天然結(jié)構(gòu)占很小的比例,如何將這些結(jié)構(gòu)篩選出來(lái)仍是一個(gè)具有挑戰(zhàn)性的問(wèn)題[4]。相關(guān)工作有所進(jìn)展[5-6],但目前尚無(wú)一個(gè)普適性好、準(zhǔn)確性高的打分函數(shù)可以實(shí)現(xiàn)這一篩選目的。本文將 QSAR的原理應(yīng)用于抗原抗體對(duì)接模擬構(gòu)象的篩選 (近天然結(jié)構(gòu)預(yù)測(cè))。即用數(shù)理統(tǒng)計(jì)方法抽提抗原-抗體復(fù)合物模擬構(gòu)象的近天然程度與其抗原-抗體接觸面的理化特性、能量特性之間的定量變化規(guī)則。通過(guò)對(duì)抗原-抗體接觸面描述符和能量參數(shù)的回歸分析,建立用于篩選近天然構(gòu)象的數(shù)學(xué)模型。所得數(shù)學(xué)模型主要適用于抗原-抗體對(duì)接體系,在測(cè)試集驗(yàn)證和埃博拉病毒的包膜蛋白4G7抗體結(jié)合模式預(yù)測(cè)應(yīng)用中具有較好的表現(xiàn)。
候選的抗原抗體接觸面描述符:①接觸面面積;②接觸面上氫鍵密度;③接觸面上 cation-π密度;④EPII[7](Epitope-paratope interface index);⑤ZDock Score[8](基于格點(diǎn)的幾何互補(bǔ)性打分);⑥ZRank Score[9];⑦ ZRank VdW;⑧ ZRank Elec;⑨ZRank Solv。其中,ZRank Score是ZRank VdW
(Van der Waals energies)、ZRank Elec (Electrostatics energies) 和 ZRank Solv (Desolvation energies) 的線性組合。EPII是抗原-抗體接觸面上氨基酸對(duì)偏好系數(shù)的線性組合:
Ni(x,y)表示氨基酸對(duì)(x,y)在接觸面i上的數(shù)量,F(xiàn)i(x,y)則表示表示氨基酸對(duì)(x,y)在接觸面i上出現(xiàn)的頻率 (注:x表示抗原上的氨基酸,y表示抗體上的氨基酸)。Tharakaraman等[7]統(tǒng)計(jì)了84個(gè)抗原-抗體復(fù)合物結(jié)構(gòu)接觸面上的氨基酸對(duì)出現(xiàn)的頻率,表示為20×20的矩陣RA,作為抗原-抗體接觸面上氨基酸對(duì)偏好系數(shù)矩陣。接觸面上殘基類型的偏好性[10]可能與接觸面上廣泛存在的陽(yáng)離子-π (Cation-π) 相互作用有關(guān)[11],將接觸面上 cation-π密度列為候選的描述符。ZDock Score基于格點(diǎn)算法表征兩個(gè)對(duì)接單體的形狀互補(bǔ)性。ZRank Score表征范德華作用能、靜電作用能和溶劑化作用能的綜合影響。
接觸面描述符及能量參數(shù)⑤⑥⑦⑧⑨由BIOVIA Discovery Studio 4.5軟件平臺(tái)的對(duì)接模擬程序 (ZDOCK[8]) 計(jì)算得到;①②③④是自行使用 Perl語(yǔ)言編寫程序計(jì)算得到,BIOVIA Discovery Studio 4.5軟件[12]的客戶端所提供的應(yīng)用程序編程接口 (Discovery Studio scripting API),相當(dāng)于Perl語(yǔ)言的擴(kuò)展函數(shù)庫(kù),為編寫程序操作生物分子模型及相關(guān)數(shù)據(jù)的處理提供了很大的便利。
將兩個(gè)對(duì)接單體 (即抗原和抗體) 上距離另一個(gè)單體不超過(guò)4.5 ?的氨基酸定義為接觸面氨基酸。將兩個(gè)復(fù)合物結(jié)構(gòu)中接觸面上的相同氨基酸重疊后,計(jì)算接觸面氨基酸上的重原子 (非氫原子) 的RMSD值,即I_RMSD[13]。I_RMSD描述了抗原-抗體接觸面在原子水平上的準(zhǔn)確度。如果某個(gè)模擬對(duì)接結(jié)構(gòu)與相應(yīng)實(shí)驗(yàn)測(cè)定的晶體結(jié)構(gòu) (下載自PDB 數(shù)據(jù)庫(kù)http://www.rcsb.org/) 的I_RMSD小于2.0 ?,則認(rèn)為該模擬對(duì)接結(jié)構(gòu)是近天然結(jié)構(gòu)。
在BIOVIA Discovery Studio 4.5生命科學(xué)分子模擬軟件平臺(tái)上使用 ZDOCK[8]程序進(jìn)行分子對(duì)接得到抗原-抗體反應(yīng)的計(jì)算生成構(gòu)象模型。對(duì)接過(guò)程主要使用抗體的可變區(qū)部分作為受體,使用抗原作為配體。ZDOCK計(jì)算過(guò)程中采用6°歐拉角度進(jìn)行結(jié)合構(gòu)型采樣 (構(gòu)象空間搜索),最終樣本包括54 000個(gè)結(jié)合構(gòu)象模型。
選用由 Hwang等[14]提出的 Protein-Protein Docking Benchmark Version 4.0中的抗原-抗體復(fù)合物結(jié)構(gòu)作為篩選算法的研究對(duì)象。所選用的 37個(gè)抗原-抗體復(fù)合物結(jié)構(gòu)均收集自PDB (Protein data bank)[15],分辨率高于3.25 ?,氨基酸鏈長(zhǎng)度不少于30個(gè)殘基,抗體部分均包含輕鏈和重鏈可變區(qū)。在全部 37個(gè)抗原-抗體復(fù)合物結(jié)構(gòu)中再隨機(jī)選取19個(gè)抗原-抗體復(fù)合物結(jié)構(gòu) (表 1) 用于數(shù)學(xué)模型的訓(xùn)練,其余18個(gè)抗原抗體復(fù)合物結(jié)構(gòu) (表2) 作為測(cè)試對(duì)象。對(duì)于每一個(gè)的抗原-抗體復(fù)合物結(jié)構(gòu),其本身是實(shí)驗(yàn)測(cè)定結(jié)構(gòu),作為標(biāo)準(zhǔn)結(jié)構(gòu)使用,拆分出其兩個(gè)單體 (即抗原和抗體) 進(jìn)行ZDOCK對(duì)接得到54 000個(gè)對(duì)接模擬構(gòu)象 (Decoy model),分別計(jì)算出每個(gè)對(duì)接模擬構(gòu)象與標(biāo)準(zhǔn)結(jié)構(gòu)間的I_RMSD值。從ZDock Score打分排序在前2 000名的對(duì)接模擬構(gòu)象中選取I_RMSD值最小者 (要求其I_RMSD值必須小于2.0 ?) 作為近天然結(jié)構(gòu),如果該 2 000個(gè)對(duì)接模擬構(gòu)象的I_RMSD值均不小于2.0 ?,則以相同標(biāo)準(zhǔn)從全部54 000個(gè)對(duì)接模擬構(gòu)象中選取 I_RMSD值最小者。再對(duì)該2 000個(gè)對(duì)接模擬構(gòu)象進(jìn)行聚類分析,RMSD Cutoff參數(shù)設(shè)定為10.0,即同一個(gè)聚類簇(Cluster) 中的不同構(gòu)象模型間的RMSD值<10 ?,而來(lái)自不同簇間的構(gòu)象模型的RMSD值≥10 ?。聚類分析得到101個(gè)聚類簇,除去近天然結(jié)構(gòu)所在的聚類簇后 (如果近天然結(jié)構(gòu)不屬于任何一個(gè)聚類簇,則除去包含對(duì)接模擬構(gòu)象最少的一個(gè)聚類簇),選取余下100個(gè)聚類簇的代表元作為不合理結(jié)構(gòu)。即從對(duì)接結(jié)果中選出 1個(gè)近天然結(jié)構(gòu)(I_RMSD<2.0 ?) 和 100個(gè)不合理結(jié)構(gòu),并構(gòu)成一個(gè)具有101個(gè)構(gòu)象元素的訓(xùn)練集體系或測(cè)試集體系。總共得到19個(gè)訓(xùn)練集體系和18個(gè)測(cè)試集體系。需要說(shuō)明的是,其中有1個(gè)訓(xùn)練集體系由101個(gè)不合理構(gòu)象組成 (因?yàn)?4 000個(gè)對(duì)接模擬構(gòu)象中的I_RMSD值均不小于2.0 ?)。
通過(guò)BIOVIA Discovery Studio 4.5軟件和自行設(shè)計(jì)編寫的Perl語(yǔ)言程序的計(jì)算得出訓(xùn)練集體系和測(cè)試集體系中所有對(duì)接模擬構(gòu)象的接觸面描述符和能量參數(shù)。在各體系內(nèi)對(duì)各項(xiàng)參數(shù)進(jìn)行標(biāo)準(zhǔn)化(歸一化) 處理,作為數(shù)學(xué)模型的自變量。定義因變量Y,對(duì)于訓(xùn)練集體系中的每一個(gè)對(duì)接模擬構(gòu)象,若該構(gòu)象是近天然結(jié)構(gòu),則Y=1;若該構(gòu)象是不合理結(jié)構(gòu),則Y=0。其中數(shù)據(jù)的批量處理和格式轉(zhuǎn)換等操作也是由自行編寫的Perl語(yǔ)言程序完成。
表1 訓(xùn)練集的19個(gè)抗原-抗體復(fù)合物Table 1 Training dataset of antigen-antibody complexes (total number of complexes=19)
準(zhǔn)備好的訓(xùn)練集體系數(shù)據(jù)中含有一個(gè)定性變量:是否近天然結(jié)構(gòu) (即Y,取值為 0或 1),以及9個(gè)定量變量:①接觸面面積;②接觸面上氫鍵密度;③接觸面上 cation-π密度;④EPII;⑤ZDock Score;⑥ZRank Score;⑦ZRank VdW;⑧ZRank Elec ; ⑨ZRank Solv 。 進(jìn)行 證實(shí) 性 研究 ,以是否近天然結(jié)構(gòu) (Y) 為因變量,以上述9個(gè)定量變量為自變量,擬合logistic回歸模型并采用逐步法篩選變量。P(Y=1)即P(This decoy is native-like)。自變量篩選以及 logistic回歸分析使用專業(yè)的統(tǒng)計(jì)軟件SAS 9.2完成。
表2 測(cè)試集的18個(gè)抗原-抗體復(fù)合物Table 2 Testing dataset of antigen-antibody complexes (total number of complexes=18)
將測(cè)試集體系內(nèi)各個(gè)對(duì)接模擬構(gòu)象的接觸面描述符和能量參數(shù)代入回歸方程中,計(jì)算出各個(gè)構(gòu)象模型的P(This decoy is native-like)值,并在各個(gè)體系內(nèi)按P(This decoy is native-like)由高到低的降序?qū)?gòu)象模型進(jìn)行排序。統(tǒng)計(jì)各個(gè)測(cè)試集體系排名在前5位的對(duì)接構(gòu)象模型中是否存在近天然結(jié)構(gòu),如果存在,則認(rèn)為所建立的數(shù)學(xué)模型適用于該體系,成功篩選出該體系中的近天然結(jié)構(gòu)。采用僅由 ZDock Score或ZRank Score打分排序的方法作為對(duì)照,采用相同的篩選成功與否的認(rèn)定標(biāo)準(zhǔn)。該部分?jǐn)?shù)據(jù)計(jì)算和統(tǒng)計(jì)等處理均由自行編寫的Perl語(yǔ)言程序完成,BIOVIA Discovery Studio 4.5軟件無(wú)相關(guān)功能。
埃博拉病毒的包膜蛋白 (Glycoprotein,GP)在病毒入侵過(guò)程中扮演著關(guān)鍵的角色,是疫苗和抗體研究的重要靶標(biāo)。抗體組合ZMapp (2G4,4G7,13C6)[16]是治療埃博拉病毒感染的雞尾酒療法之一,組成ZMapp的中和抗體就結(jié)合于GP上的表位。使用從PDB數(shù)據(jù)庫(kù)中下載的GP晶體結(jié)構(gòu)[17](PDB ID: 3CSY) 和 4G7電鏡結(jié)構(gòu)[18](PDB ID: 5KEN) 在Discovery Studio 4.5軟件中運(yùn)用ZDOCK程序進(jìn)行對(duì)接模擬。繼而在生成的54 000個(gè)對(duì)接模擬構(gòu)象中取出按ZDock Score排序在前5 000名的構(gòu)象。計(jì)算出這5 000個(gè)構(gòu)象的接觸面描述符和能量參數(shù)并代入數(shù)學(xué)模型中得到P(This decoy is native-like),對(duì)P(This decoy is native-like)值最大的對(duì)接模擬構(gòu)象使用基于機(jī)器學(xué)習(xí)的KFC2算法[19]預(yù)測(cè)抗原在接觸面上的熱點(diǎn)氨基酸 (關(guān)鍵氨基酸)。將篩選出的對(duì)接模擬結(jié)構(gòu)與抗原-抗體復(fù)合物的電鏡結(jié)構(gòu) (PDB ID: 5KEN) 相對(duì)比;將預(yù)測(cè)的抗原上的關(guān)鍵氨基酸與文獻(xiàn)報(bào)道的實(shí)驗(yàn)數(shù)據(jù)相對(duì)比。
利用統(tǒng)計(jì)軟件SAS 9.2進(jìn)行回歸分析,得到的有統(tǒng)計(jì)學(xué)意義的模型自變量:①接觸面面積 (X1);②接觸面上的氫鍵密度 (X2); ③ EPII (X3);④ZDock Score (X4),⑤ ZRank Score (X5),對(duì)各參數(shù)進(jìn)行檢驗(yàn)的P值均小于0.05。由此建立回歸方程:
對(duì)整個(gè)模型進(jìn)行假設(shè)檢驗(yàn),原假設(shè)是所有的回歸系數(shù)都為 0,分別使用似然比、計(jì)分檢驗(yàn)和Wald檢驗(yàn)3種檢驗(yàn)方法,3種方法的P值都小于0.05,可以認(rèn)為該模型是成立的。ROC曲線的曲線下面積為0.994,預(yù)測(cè)概率和觀察響應(yīng)之間的關(guān)聯(lián)性較強(qiáng)。
經(jīng)測(cè)試,在全部18個(gè)測(cè)試體系中,模型成功篩選出了其中的15個(gè)體系中的近天然結(jié)構(gòu)。作為對(duì)照,在全部18個(gè)測(cè)試體系中,ZDock Score打分方法成功篩選出了其中的6個(gè)體系中的近天然結(jié)構(gòu),ZRank Score打分方法僅成功篩選出了其中5個(gè)體系中的近天然結(jié)構(gòu) (表3)。對(duì)于18個(gè)測(cè)試體系 (共包含1 818個(gè)對(duì)接模擬構(gòu)象),該數(shù)學(xué)模型篩選方法的有效性和成功率明顯優(yōu)于 ZDock Score打分方法和ZRank Score打分方法。
表3 測(cè)試集的預(yù)測(cè)結(jié)果Table 3 Prediction results of testing dataset (total number of complexes=19)
文獻(xiàn)[20]報(bào)道抗體4G7結(jié)合在GP Base上,抗原-抗體復(fù)合物電鏡結(jié)構(gòu)和實(shí)驗(yàn)數(shù)據(jù)表明Cys511、Asp552和Cys556是抗原上與抗體結(jié)合密切相關(guān)的關(guān)鍵氨基酸。應(yīng)用數(shù)學(xué)模型得到的排序第一的對(duì)接構(gòu)象模型,其抗原部分的 KFC2熱點(diǎn)氨基酸 (關(guān)鍵氨基酸) 預(yù)測(cè)結(jié)果是 GP上的Asn506、Lys510、Cys511、Pro513、Asn550、Gln551、Asp552、Cys556,預(yù)測(cè)結(jié)果包含了全部3個(gè)文獻(xiàn)報(bào)道的關(guān)鍵氨基酸 (粗體)。運(yùn)用抗原-抗體分子對(duì)接并通過(guò)回歸分析建立的數(shù)學(xué)模型篩選出與電鏡結(jié)構(gòu)相接近的近天然結(jié)構(gòu),有效預(yù)測(cè)出了抗體4G7與相應(yīng)抗原的大致結(jié)合模式和以實(shí)驗(yàn)方法確定的關(guān)鍵氨基酸 (圖1)。
圖1 埃博拉包膜蛋白中和抗體4G7結(jié)合表位的預(yù)測(cè)結(jié)果Fig. 1 Result of predicting epitope of anti-Ebola glycoprotein MAb 4G7. (A) Binding hot spots predicted by KFC Server. Residues critical for MAb 4G7 binding are highlighted in yellow. (B–E) Superposition of docking model and cryo-electron microscopy structure (PDB accession No. 5KEN) on fixed Ebola virus glycoprotein. Docking model is shown with glycoprotein colored green and MAb 4G7 colored yellow in which the heavy chain CDR3 loop is colored in purple. Cryo-electron microscopy structure is shown with glycoprotein colored blue and MAb 4G7 colored brown in which the heavy chain CDR3 loop is colored in red.
定量構(gòu)效關(guān)系方法[21](Quantitative structure activity relationship,QSAR) 采用數(shù)理統(tǒng)計(jì)方法研究和揭示化合物活性與其分子結(jié)構(gòu)或理化特性之間的定量變化規(guī)則,在小分子藥物設(shè)計(jì)中有重要的應(yīng)用。本文將QSAR的原理應(yīng)用于抗原抗體對(duì)接模擬構(gòu)象中近天然結(jié)構(gòu)的篩選。即用數(shù)理統(tǒng)計(jì)方法抽提對(duì)接模擬構(gòu)象的近天然程度與其抗原抗體接觸面的理化特性、能量特性之間的定量變化規(guī)則。經(jīng)回歸分析,選定抗原-抗體接觸面面積、接觸面上氫鍵密度、EPII、ZDock Score和ZRank Score作為數(shù)學(xué)模型的自變量,建立多重 logistic回歸方程。作為自變量的各參數(shù)由 BIOVIA Discovery Studio 4.5軟件平臺(tái)和自行編寫的Perl語(yǔ)言程序計(jì)算得到,并需要進(jìn)行標(biāo)準(zhǔn)化 (歸一化)處理。使用所建立的多重 logistic回歸方程指導(dǎo)從眾多對(duì)接模擬構(gòu)象中篩選出近天然結(jié)構(gòu)取得較為理想的效果。在全部 18個(gè)測(cè)試集體系中,該方法可將其中 15個(gè)體系中的近天然結(jié)構(gòu)排序在前5位,其中12個(gè)體系中的近天然結(jié)構(gòu)排序在第1位,該方法對(duì)抗原-抗體近天然結(jié)構(gòu)的篩選效果優(yōu)于單純使用ZRank Score或ZDock Score打分的排序篩選方法。基于該篩選方法在測(cè)試集驗(yàn)證中的良好表現(xiàn),嘗試將該方法應(yīng)用于埃博拉病毒的包膜蛋白與其中和抗體4G7的結(jié)合模式預(yù)測(cè)。將 GP晶體結(jié)構(gòu)與抗體 4G7的電鏡結(jié)構(gòu)進(jìn)行ZDOCK對(duì)接,只有能夠從生成的54 000個(gè)對(duì)接模擬構(gòu)象中篩選出近天然結(jié)構(gòu),后續(xù)的熱點(diǎn)氨基酸預(yù)測(cè)才能得到較為符合實(shí)際情況的結(jié)果。運(yùn)用該數(shù)學(xué)模型計(jì)算后,取P(This decoy is native-like)值最大的對(duì)接模擬構(gòu)象進(jìn)行 KFC2熱點(diǎn)氨基酸預(yù)測(cè),預(yù)測(cè)出8個(gè)熱點(diǎn)氨基酸,包括了文獻(xiàn)報(bào)道的全部3個(gè)抗原上的關(guān)鍵氨基酸。熱點(diǎn)氨基酸預(yù)測(cè)結(jié)果說(shuō)明該對(duì)接模擬構(gòu)象中抗原-抗體的結(jié)合方式 (尤其是接觸面特征) 是接近真實(shí)情況或具有部分真實(shí)情況特點(diǎn)的。對(duì)抗體4G7大致結(jié)合模式的成功預(yù)測(cè)也在一定程度上說(shuō)明了本文所提出的抗原-抗體近天然結(jié)構(gòu)篩選方法具有可行性與實(shí)用性。
現(xiàn)有生命科學(xué)分子模擬軟件平臺(tái),如Discovery Studio、HADDOCK[22]、RosettaDock[23]、AutoDock[24]、ClusPro[25]、PatchDock[26]、HDOCK[27]等,提供了分子對(duì)接程序及相應(yīng)打分函數(shù)。可以通過(guò)蛋白質(zhì)分子對(duì)接的方法研究蛋白質(zhì)結(jié)合模式,但是對(duì)接過(guò)程中的全構(gòu)象搜索產(chǎn)生成千上萬(wàn)的對(duì)接模擬構(gòu)象,通用的打分函數(shù)很難滿足我們進(jìn)一步準(zhǔn)確篩選出近天然結(jié)構(gòu)的需要。不同類型蛋白質(zhì)的結(jié)合具有各自特點(diǎn)和規(guī)律,可以通過(guò)對(duì)已有同類型蛋白質(zhì)復(fù)合物共晶體結(jié)構(gòu)的分析和統(tǒng)計(jì)得到相應(yīng)的經(jīng)驗(yàn)規(guī)律,而借鑒QSAR原理,運(yùn)用多重回歸分析的數(shù)學(xué)模型是將這些經(jīng)驗(yàn)規(guī)律與已有打分函數(shù)相結(jié)合的有效途徑。本文探索了蛋白質(zhì)結(jié)合表面統(tǒng)計(jì)性、經(jīng)驗(yàn)性特征與ZDOCK、ZRank打分函數(shù)的聯(lián)合使用方法,證明了回歸分析建立的數(shù)學(xué)模型用以打分排序和篩選出近天然對(duì)接模擬構(gòu)象的可行性,為提高使用分子對(duì)接研究蛋白質(zhì)結(jié)合模式的效率和準(zhǔn)確性,提供了可行的思路和方法。
REFERENCES
[1]Huang SY, Bolser D, Liu HY, et al. Molecular modeling of the heterodimer of human CFTR’s nucleotide-binding domains using a protein-protein docking approach. J Mol Graph Modell, 2009, 27(7): 822–828.
[2]Loyau J, Didelot G, Malinge P, et al. Robust antibody-antigen complexes prediction generated by combining sequence analyses, mutagenesis,in vitroevolution, X-ray crystallography andin silicodocking. J Mol Biol, 2015, 427(16): 2647–2662.
[3]Li D, Xu J, Wang Z, et al. Epitope mapping reveals the binding mechanism of a functional antibody cross-reactive to both human and murine programmed death 1. MAbs, 2017, 9(4): 628–637.
[4]Lensink MF, Wodak SJ. Docking and scoring protein interactions: CAPRI 2009. Proteins, 2010, 78(15):3073–3084.
[5]Liang S, Meroueh SO, Wang G, et al. Consensus scoring for enriching near-native structures from protein-protein docking decoys. Proteins, 2009, 75(2): 397–403.
[6]Shimba N, Kamiya N, Nakamura H. Model building of antibody-antigen complex structures using GBSA scores.J Chem Inf Model, 2016, 56(10): 2005–2012.
[7]Tharakaraman K, Robinson LN, Hatas A, et al. Redesign of a cross-reactive antibody to dengue virus with broad-spectrum activity and increasedin vivopotency.Proc Natl Acad Sci USA, 2013, 110(17): E1555–E1564.
[8]Chen R, Li L, Weng ZP. ZDOCK: an initial-stage protein-docking algorithm. Proteins, 2003, 52(1): 80–87.
[9]Pierce B, Weng ZP. ZRANK: reranking protein docking predictions with an optimized energy function. Proteins,2007, 67(4): 1078–1086.
[10]Jones S, Thornton JM. Prediction of protein-protein interaction sites using patch analysis. J Mol Biol, 1997,272(1): 133–143.
[11]Crowley PB, Golovin A. Cation-π interactions in proteinprotein interfaces. Proteins, 2005, 59(2): 231–239.
[12]Accelrys Software Inc. Discovery Studio Modelling Environment. 2012.
[13]Méndez R, Leplae R, de Maria L, et al. Assessment of blind predictions of protein-protein interactions: current status of docking methods. Proteins, 2003, 52(1): 51–67.
[14]Hwang H, Vreven T, Janin J, et al. Protein-protein docking benchmark version 4.0. Proteins, 2010, 78(15):3111–3114.
[15]Rose PW, Prli? A, Altunkaya A, et al. The RCSB protein data bank: integrative view of protein, gene and 3D structural information. Nucleic Acids Res, 2017, 45(D1):D271–D281.
[16]Qiu XG, Audet J, Lv M, et al. Two-mAb cocktail protects macaques against the Makona variant of Ebola virus. Sci Trans Med, 2016, 8(329): 329ra333.
[17]Lee JE, Fusco ML, Hessell AJ, et al. Structure of the Ebola virus glycoprotein bound to an antibody from a human survivor. Nature, 2008, 454(7201): 177–182.
[18]Pallesen J, Murin CD, de val N, et al. Structures of Ebola virus GP and sGP in complex with therapeutic antibodies. Nat Microbiol, 2016, 1(9): 16128.
[19]Zhu XL, Mitchell JC. KFC2: a knowledge-based hot spot prediction method based on interface solvation,atomic density, and plasticity features. Proteins, 2011,79(9): 2671–2683.
[20]Davidson E, Bryan C, Fong RH, et al. Mechanism of binding to Ebola virus glycoprotein by the ZMapp,ZMAb, and MB-003 cocktail antibodies. J Virol, 2015,89(21): 10982–10992.
[21]Cronin MTD, Basketter DA. Multivariate QSAR analysis of a skin sensitization database. SAR QSAR Environ Res, 1994, 2(3): 159–179.
[22]van Zundert GCP, Rodrigues J, Trellet M, et al. The HADDOCK2.2 web server: user-friendly integrative modeling of biomolecular complexes. J Mol Biol, 2016,428(4): 720–725.
[23]Chaudhury S, Berrondo M, Weitzner BD, et al.Benchmarking and analysis of protein docking performance in Rosetta v3.2. PLoS ONE, 2011, 6(8):e22477.
[24]Morris GM, Huey R, Lindstrom W, et al. AutoDock4 and AutoDockTools4: Automated docking with selective receptor flexibility. J Comput Chem, 2009, 30(16):2785–2791.
[25]Kozakov D, Hall DR, Xia B, et al. The ClusPro web server for protein-protein docking. Nat Protoc, 2017,12(2): 255–278.
[26]Schneidman-Duhovny D, Inbar Y, Nussinov R, et al.PatchDock and SymmDock: servers for rigid and symmetric docking. Nucleic Acids Res, 2005, 33(Web Server issue): W363–W367.
[27]Yan Y, Zhang D, Zhou P, et al. HDOCK: a web server for protein-protein and protein-DNA/RNA docking based on a hybrid strategy. Nucleic Acids Res, 2017,45(W1): W365–W373.