焦 娟 ,姜海明 ,李姍珊 ,張立新 ,劉 杰△
1.中國人民解放軍總醫(yī)院第七醫(yī)學中心檢驗科,北京 100700;2.濱州醫(yī)學院煙臺附屬醫(yī)院重癥醫(yī)學科,山東煙臺 264100
冠狀病毒是一類RNA 病毒,通過人的呼吸道或接觸傳播,感染該病毒后常見臨床表現(xiàn)有發(fā)熱,以及咳嗽、氣促和呼吸困難等呼吸道癥狀,嚴重者可導致肺炎、嚴重急性呼吸綜合征、腎衰竭,甚至死亡。
近期,新型冠狀病毒(SARS-CoV-2)疫苗相繼問世(滅活疫苗、腺病毒載體疫苗和mRNA 疫苗等),其作用機制即通過激活人自身的免疫系統(tǒng)來對抗病毒,其主要的作用靶點為分布于病毒表面的突刺糖蛋白(Spike蛋白)。部分學者在SARS-CoV-2致病機制方面的基礎研究也做出了巨大的努力,從最初的SARSCoV-2基因組的測定完成[1],到SARS-CoV-2全病毒三維結構的解析[2],都顯示Spike蛋白是SARS-CoV-2的主要致病因素:Spike蛋白與人體細胞表面血管緊張素轉換酶2(ACE2)的結合介導了SARS-CoV-2對人體細胞的入侵[3-4]。因此SARS-CoV-2的Spike蛋白已經(jīng)成為人們診斷、治療、預防SARS-CoV-2感染的主要靶點。本研究擬通過生物信息學軟件,通過橫向比較和分析SARS-CoV-2的Spike蛋白的二級結構、三級結構和B 細胞表位,探討Spike蛋白潛在的高效免疫表位,為SARS-CoV-2檢測試劑盒、疫苗制備、治療藥物的研發(fā)提供可靠的生物學信息和實驗基礎。
1.1 蛋白結構和序列的選擇 根據(jù)已公布的蛋白結構數(shù)據(jù)庫(https://www.rcsb.org/),比對Spike蛋白相關的結構信息,下載對應的結構信息文件(pdb文件),其登錄號為6XR8/6XRA(SARS-CoV-2),5X58(SARS-CoV),5X59(MERS);同時,下載相對應的氨基酸序列。結合下載的序列,比對GenBank數(shù)據(jù)庫,分別下載各蛋白的完整蛋白序列,其登錄號分別為YP_009724390,P59594.1,AGN70929.1。
1.2 二級結構預測 抗原免疫表位主要位于蛋白質表面,具有較強的親水性,含有或鄰近柔性區(qū)域,易于形成典型的二級結構等。因此分析目的蛋白質的二級結構,對了解其免疫表位分布具有重要的參考作用。本研究應用PHD(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl? page=/NPSA/npsa_phd.html)和Jpred4(http://www.compbio.dundee.ac.uk/jpred/)等在線軟件分別預測目的蛋白質的α螺旋、β折疊、轉角以及卷曲等二級結構的組成。
1.3 B細胞表位預測 根據(jù)目的蛋白的蛋白序列應用在線軟件Bepipred Linear Epitope Prediction 2.0(http://tools.iedb.org/bcell/)分別預測目的蛋白的B細胞表位,該軟件運用隨機森林算法對目的蛋白的表位和非表位氨基酸進行預測,同時利用自身表位數(shù)據(jù)庫對預測序列進行多重優(yōu)化[5]。本研究同時比對目的蛋白的二級結構和三維結構的數(shù)據(jù),進一步篩選優(yōu)勢抗原表位區(qū)段,得出Spike蛋白的優(yōu)勢B細胞免疫表位。
2.1 氨基酸序列分析 Spike蛋白的結構信息非常豐富:目前在蛋白質結構數(shù)據(jù)庫中,Spike蛋白的高分辨結構有上百個,均為冷凍電子顯微解析的結構。這些結構信息顯示,Spike蛋白有多種構象形式:侵染細胞前狀態(tài)、侵染細胞后狀態(tài)和與中和抗體結合狀態(tài)等,這些狀態(tài)為分析Spike蛋白的免疫表位提供了豐富的分析線索。本文以Spike蛋白三維結構為基礎模型,以多種預測軟件為輔助,分析和研究嚴重急性呼吸綜合征冠狀病毒(SARS-CoV)、SARS-CoV-2 和中東呼吸綜合征冠狀病毒(MERS-CoV)共3種冠狀病毒Spike蛋白的B細胞表位信息。首先在GeneBank數(shù)據(jù)庫中下載相關蛋白的一級序列信息:SARS-CoV的Spike蛋白序列(YP_009724390)與SARS-CoV-2的Spike 蛋白(P59594.1)具有76% 同一性,與MERS-CoV的Spike 蛋白具有35%的同一性(AGN70929.1)。
2.2 Spike蛋白二級結構分析 運用PHD 和Jpred4兩種在線軟件,對SARS-CoV、SARS-CoV-2、MERSCoV的Spike蛋白二級結構進行預測。SARS-CoV的Spike 蛋白α 螺旋主要分布于5~11、51~56、409~419、729~769、797~805、849~861、871~1 018、1 129~1 140、1 151~1 184、1 195~1 213等肽段。β折疊分布于146~166、173~178、181~190、198~230、241~258、277~279、309~377、421~428、442~450、465~484、552~582、584~601、610~646、693~724、1 032~1 058、1 075~1 087、1 100~1 115、1 213~1 219、1 247~1 255等肽段。自由卷曲位于α螺旋和β折疊之間。見表1。
表1 3種病毒Spike蛋白二級結構組成(%)
SARS-CoV-2的Spike蛋白α螺旋主要分布于361~371、747~788、815~823、867~879、887~1 035、1 147~1 159、1 175~1 123、1 134~1 151等肽段。β折疊分布于2~8、36~50、61~77、90~108、116~145、167~177、190~206、262~288、298~329、376~381、395~403、418~425、432~437、450~455、507~517、538~577、583~588、595~600、608~613、589~695、711~729、1 048~1 075、1 093~1 105、1 120~1 132、1 151~1 156、1 190~1 195 等肽段。自由卷曲位于α螺旋和β折疊之間。
MERS-CoV的Spike 蛋白α 螺旋主要分布于107~112、225~231、277~281、304~318、405~418、430~436、806~837、846~856、887~895、908~912、941~954、963~1 110、1 230~1 241、1 262~1 285、1 297~1 316等肽段。β折疊分布于2~10、30~35、64~70、84~89、98~104、116~123、129~131、162~172、179~188、202~206、236~242、262~271、287~296、321~337、360~377、399~405、440~449、464~471、478~483、567~576、603~664、670~676、713~718、754~765、779~804、1 121~1 127、1 134~1 151、1 202~1 213、1 317~1 320等肽段。自由卷曲位于α螺旋和β折疊之間。
2.3 B細胞表位預測 運用Bepipred Linear Epitope Prediction 2.0在線軟件,對上述病毒Spike蛋白B細胞表位完成預測,閾值設定為0.5。SARS-CoV的Spike蛋白B 細胞表位區(qū)段分布于16~38、60~84、134~148、173~181、203~212、236~249、317~351、355~412、427~473、505~519、602~630、642~651、663~689、768~796、811~827、1 089~1 100、1 115~1 156、1 234~1 248 等肽段。SARS-CoV-2的Spike蛋白B細胞表位區(qū)段分布于13~37、59~81、138~156、177~189、206~221、250~260、306~322、370~393、409~425、440~450、458~501、516~536、617~632、634~644、656~666、672~690、695~710、786~800、806~816、828~842、1 108~1 118、1 133~1 172、1 198~1 206、1 252~1 263、1 275~1 306等肽段。MERS-CoV的Spike蛋白B 細胞表位區(qū)段分布于16~38、60~84、134~148、173~181、203~212、236~249、317~351、355~412、427~473、505~519、602~630、642~651、663~689、768~796、811~827、1 089~1 100、1 115~1 156、1 234~1 248等肽段。
2.4 結合蛋白三維結構的B細胞表位區(qū)段的篩選以上的表位信息結果均源于軟件的預測,這些結果很可能與實際情況差異較大,因此本研究將以上B細胞表位區(qū)段預測信息,在高分辨的蛋白三維結構和二級結構基礎上,同時結合B細胞抗原表位結構和生化特點,進一步人工篩選SARS-CoV(5X59)[6]、SARSCoV-2(6XR8)[3]、MERS-CoV(5X58)[6]Spike蛋白的B細胞表位區(qū)段,見表2~4。
表2 SARS-CoV(5X59)Spike蛋白的B細胞表位區(qū)段
表3 SARS-CoV-2(6XR8)Spike蛋白的B細胞表位區(qū)段
續(xù)表3 SARS-CoV-2(6XR8)Spike蛋白的B細胞表位區(qū)段
表4 MERS-CoV(5X58)Spike蛋白的B細胞表位區(qū)段
由于蛋白三維結構信息來自于蛋白晶體衍射數(shù)據(jù),因此存在結構密度信息的部分缺失,另一方面,結構密度信息的缺失一般意味著蛋白這部分區(qū)域處于無序排列的狀態(tài),即在周邊的環(huán)境中可以自由擺動或存在結構變化,說明該區(qū)域親水性較強并位于蛋白三維結構的表面。
將B 細胞表位信息,SARS-CoV、SARS-CoV-2、MERS-CoV 3種病毒Spike蛋白的二級結構信息和三級結構信息整合在一起篩選,可提高數(shù)據(jù)分析的可信性。蛋白抗原表位區(qū)段基本分布于蛋白三維結構的表面,與二級結構有所差別。SARS-CoV Spike蛋白抗原表位區(qū)段中卷曲-螺旋占17.0%,卷曲-延伸占50.0%,卷曲占33.0%。SARS-CoV-2 Spike蛋白抗原表位區(qū)段中卷曲-螺旋占22.0%,卷曲-延伸占59.0%,卷曲占19.0%。MERS-CoV Spike蛋白抗原表位區(qū)段中卷曲-螺旋占25%,卷曲-延伸占37.5%,卷曲占37.5%。
綜合分析結果發(fā)現(xiàn),具有優(yōu)勢B細胞表位區(qū)段中存在一定二級結構和一定柔韌性結構組合的占比較高,比如β折疊。這一特點完全符合抗原蛋白B細胞表位的基本特征。
Spike蛋白是SARS-CoV、SARS-CoV-2、MERSCoV 等冠狀病毒關鍵性致病因子。Spike蛋白的結構已經(jīng)較為清晰,其致病的分子機制已較為明了[3-4]:首先,Spike蛋白的受體結合域(RBD)向外伸展與人體細胞表面的ACE2受體結合;其次,RBD 與ACE2的結合啟動了Spike蛋白自身在S位點的剪切作用,使Spike蛋白發(fā)生“脫冠”變化;最后,“脫冠”的Spike蛋白HR 結構域得以暴露出來,在HR 結構域輔助下,病毒完成和人體細胞的融合和遺傳物質的注入過程。因此,Spike蛋白RBD 和ACE2識別和結合,是冠狀病毒侵染細胞的最關鍵環(huán)節(jié),從目前已有的 Spike蛋白-中和抗體的三維結構中,也可以證明這一結論。
在蛋白結構數(shù)據(jù)庫中,SARS-CoV、SARS-CoV-2、MERS-CoV 等病毒的 Spike蛋白和其中和抗體的結構較多,如6NB6/7(SARS-CoV)、6WPT(SARSCoV-2)、7K4N (SARS-CoV-2)、6NB3/4(MERSCoV)等[7-9]。對這些復合體的結構分析后發(fā)現(xiàn),中和抗體與 Spike蛋白表面結合位點主要集中于RBD 結構域和CTD 結構域。同時本研究發(fā)現(xiàn)ACE2 與Spike蛋白結合位點也位于RBD 結構,且與中和抗體的結合位點重疊,這進一步證明了中和抗體在抗病毒時的作用機制。以SARS-CoV-2 Spike蛋白為例,在7KNB結構中,ACE2 結合于449~502aa[10];7K8W結構中,中和抗體結合于444~501aa[11];本研究結果與上述研究結果相似,表明本研究分析結果具有一定的可靠性和前瞻性。
本研究同時發(fā)現(xiàn) Spike蛋白RBD 和CTD 結構中,含有多個優(yōu)勢B 細胞表面抗原表位的多肽區(qū)段,這為檢測試劑、抗體藥物的開發(fā)等提供了較好的作用靶點。然而,冠狀病毒的RBD 結構域、三維結構非常復雜,主要由內部的β折疊和外圍的無規(guī)則卷曲所構成,說明RBD 結構域外圍表面結構十分靈活,RBD 在與ACE2或中和抗體結合時,可能存在局部的構象重建;同時在病毒侵染過程中RBD 本身還會存在巨大的結構變化,使基礎和臨床研究難度大大增加,因此更多的結構和B 細胞表面抗原表位信息將提供更多的研究思路和實驗基礎。