隋雪 姜遠英 閻瀾
(1.第二軍醫(yī)大學藥學院新藥研究中心,上海 200433;2.大連醫(yī)科大學醫(yī)學科學研究院,大連 116044)
白念珠菌是一種條件性致病真菌,與人體共生,然而,當人體變得虛弱易感,白念珠菌就會顯現(xiàn)出強大的致病力,不但能引起宿主黏膜感染,如表皮損傷、腸道菌群失調(diào),甚至能擴散入血,產(chǎn)生威脅生命的侵襲性感染[1-2]。其中,大多數(shù)受感染的宿主都是一些癌癥患者、艾滋病患者、器官移植者、深部外科手術者和廣譜抗生素過量使用者,以及其他先天或后天因素導致的免疫力低下者[3]。近年來,深部白念珠菌感染發(fā)病率逐年升高[4]。然而,治療系統(tǒng)性真菌感染可選的治療方案卻很有限,藥物主要有多烯類(如兩性霉素B和制霉菌素),三唑類(如氟康唑、伏立康唑),丙烯胺類(如特比奈芬),嘧啶類(如氟胞嘧啶)和棘白菌素類(如卡泊芬凈)等[5],菌株耐藥性和藥物毒性成為了臨床治療的潛在問題[6-7]。疫苗作為一種有效、毒副作用小的治療手段將被眾多研究者關注,基于疫苗免疫的預防和治療方案也正成為抵抗白念珠菌感染的新策略。
細胞壁位于白念珠菌細胞的最外層,在真菌的生長繁殖、假菌絲的形成和與宿主的相互作用中發(fā)揮著重要作用,與此同時,真菌的細胞壁是病原體區(qū)別于宿主的獨一無二的部分[8],因此成為了抗真菌藥物的理想靶標。Csp37蛋白是白念珠菌細胞壁蛋白,分子量為37kDa。Sentandreu M[9]等人研究發(fā)現(xiàn),Csp37蛋白在白念珠菌菌絲生長和黏附中發(fā)揮著重要作用,在小鼠尾靜脈注射0.5×106cells或者1×106cells或者1.5×106cells的CSP37基因缺失菌后,與野生型對照組相比,感染小鼠平均存活時間均有所延長,說明CSP37基因敲除能明顯的降低白念珠菌毒力。本研究主要應用生物信息學方法,對白念珠菌細胞壁蛋白Csp37抗原表位進行預測和免疫原性分析,尋找B細胞表位和T細胞表位共有的序列區(qū),探討其作為抗白念珠菌感染疫苗靶點的潛能。
從美國生物信息中心NCBI數(shù)據(jù)庫 (https://www.ncbi.nlm.nih.gov/)下載白念珠菌SC5314的細胞壁蛋白Csp37的氨基酸序列,該序列為全基因組測序預測獲得,Genebank登錄號為KHC71123.1,具體序列見表1。
本研究主要利用計算機軟件和在線分析軟件,具體信息見表2,對白念珠菌細胞壁蛋白Csp37進行抗原表位預測。采用ProtParam在線軟件預測Csp37蛋白的分子量、等電點等理化性質(zhì)。采用SignaIP 3.0和TMHMM在線軟件分別預測Csp37蛋白的信號肽和跨膜區(qū),用GOR4在線軟件分析Csp37蛋白的二級結構。采用DNAStar軟件中的Protean模塊分析Csp37蛋白的氨基酸序列,根據(jù)Kyte-Doolittle方案預測其親水性,Emini方案預測其表面可及性,Karplus-Schulz方案預測其柔韌性,Jameson-Wolf方案預測其抗原性指數(shù),綜合上述參數(shù)預測Csp37蛋白可能的B細胞抗原表位。采用ABCPred和Syfpeithi在線軟件進一步分別預測Csp37蛋白B細胞和T細胞抗原表位。最后,綜合分析B細胞和T細胞共有抗原表位。
表1 Csp37蛋白的氨基酸序列
表2 生物信息學軟件
利用ProtParam網(wǎng)絡服務器分析Csp37蛋白理化性質(zhì),顯示該蛋白分子式為:C1635H2537N453O527S1,原子總數(shù)為5 153個,分子量為37.0 KD,理論等電點為6.57。在氨基酸組成上:Lys (K)有48個,占15.0%,含量最高;其次,Asp (D)有33個,占10.3%;負電荷殘基 (Asp+Glu)總數(shù)為55,正電荷殘基 (Arg+Lys)總數(shù)為54。不穩(wěn)定系數(shù)為24.98,低于閾值40,預測該蛋白為穩(wěn)定蛋白。脂肪系數(shù)為61.96,親水性評估值為-1.147,依據(jù)分值越低親水性越強,分值越高疏水性越強的規(guī)律,預測該蛋白為親水性蛋白。
通過SignaIP 3.0和TMHMM軟件預測Csp37蛋白的氨基酸序列,發(fā)現(xiàn)該蛋白無信號肽、無跨膜區(qū),初步分析該蛋白不是分泌型蛋白。
使用GOR 4在線軟件對Csp37蛋白進行二級結構預測,結果如圖1,發(fā)現(xiàn)α-螺旋占15.8%;β-折疊占28.2%;無規(guī)則卷曲區(qū)域占54.0%,具體數(shù)據(jù)見表3。
預測的結果如圖2所示,圖中柔韌性為有線段標記區(qū)域;抗原指數(shù)、親水性及表面可及性為各自橫線以上部分,當親水性>0,抗原指數(shù)>0,表面可及性>1時,形成表位的可能性大,具體數(shù)據(jù)見表4。
表3 GOR4分析的Csp37蛋白二級結構
表4 DNAStar軟件預測Csp37蛋白的親水性、蛋白表面可及性、可塑性及抗原指數(shù)
圖1 GOR4分析的Csp37蛋白二級結構 圖2 DNAStar軟件預測Csp37蛋白的親水性、蛋白表面可及性、可塑性及抗原指數(shù)
Fig.1Secondary structure of Csp37 using GOR4 analysis (Alpha helix (Hh), Extended strand (Ee), Random coil (Cc))Fig.2DNAStar prediction results of hydrophilicity, surface probability, flexible regions and antigenic index of Csp37
使用在線預測軟件ABCPred預測,每組表位的氨基酸殘基數(shù)選擇默認值16,得分閾值設置為默認值0.54,獲得具體數(shù)據(jù)見表5。氨基酸序列的得分越高,越有可能成為B細胞表位。根據(jù)抗原表位的基本預測原則,即抗原指數(shù)高;親水性、可塑性和表面可及性好;二級結構避免α螺旋和β折疊,優(yōu)選 β轉角和無規(guī)則線圈,得到9個較好的B細胞表位,具體區(qū)域為:19-24,45-48,76-78,100-105,153-158,179-184,222-225,249-252,303-305 aa。
選擇中國各民族中基因頻率較高的HLA-DRB1*0301,利用在線軟件Syfpeithi對Csp37蛋白的T細胞抗原表位親和力進行預測[18],結果顯示評分大于等于18的序列,具體數(shù)據(jù)見表6。其中,評分較高 (≥25)的T細胞表位8個,具體區(qū)域為:97-111,303-317,257-271,299-313,221-235,281-295,137-151,235-249 aa。
綜合B細胞與T細胞抗原表位的預測結果,分析比較,取各項參數(shù)比較相一致的序列,確定Csp37蛋白B細胞和T細胞共同表位5個,具體優(yōu)勢區(qū)域為:45-48,76-78,153-158,222-225,303-305 aa。
隨著抗腫瘤放化療、介入治療、器官移植術后免疫抑制劑的廣泛應用,尤其是艾滋病的流行,免疫功能低下或缺陷的患者數(shù)量不斷增加,侵襲性真菌感染已逐漸成為一種常見病、多發(fā)病,并已成為免疫功能低下人群死亡的主要原因。念珠菌是機會性致病真菌中的主要一屬,其中白念珠菌的毒力最強,感染率最高,引起嚴重的侵襲性念珠菌病,死亡率高達40%。開發(fā)一種有效的毒副作用小的疫苗,對于抗白念珠菌感染的預防和治療具有重要意義。
表5 ABCpred預測Csp37蛋白的B細胞表位
表6Syfpeithi預測Csp37蛋白的HLA-DRB1*0301限制性T細胞表位
Tab.6Prediction of HLA-DRB1*0301 restricted T cell epitopes of Csp37 using Syfpeithi
序號序列起始位點評分1EDAVDNDKNVFVVGI97281GDDVYNDFAKRFDDL303282AIKGVEDAKSNFEKL257272LKLFGDDVYNDFAKR299273YEQAKGDWNKALDDL221263KNQKLKDAQDHFGKS281 264SPNVEVKEKSIFGNW137254LSKQWNDSKKQLNGR235255VDQLKNDADKKINEA159225FEKLSNDLANDASKN268226KQVKNSDVYQKLQSN 74 216DKNVFVVGIQKYIDF 103 216SNDLANDASKNQKLK 272 216LENLKLFGDDVYNDF 296 216NLKLFGDDVYNDFAK 298 217KKADELDKKANEAIN190 208VQPILPRQQHQELAY 24 198QPILPRQQHQELAYQ 25 198VFVVGIQKYIDFVNQ 106 198GIQKYIDFVNQLGEG 110 198YSTVSPNVEVKEKSI 133 198NWFDKSDNKVDQLKN 150 198DHFGKSLENLKLFGD 290 199VENKGSELNNKLTKK 43 189TKKIEEGKKFVNEKT 55 189TESVTKQVKNSDVYQ 69 189NSDVYQKLQSNTEDY 78 189LQSNTEDYKKHVEDA 85 189IDFVNQLGEGKVQTG 115 189DNKVDQLKNDADKKI 156 189QLKNDADKKINEAKD 161 189NKALDDLSKQWNDSK 229 18
近年來,生物信息學廣泛運用于蛋白質(zhì)抗原表位的預測,不僅節(jié)約了科研時間、降低了科研經(jīng)費,而且優(yōu)化了實驗設計。所謂抗原表位是指抗原分子中決定抗原特異性的特殊化學基團,抗原可以借表位與相應抗體或致敏淋巴細胞發(fā)生特異性結合而發(fā)揮免疫效應。理想的抗原表位是兼有B細胞表位和T細胞表位的功能,其中T細胞僅能識別抗原遞呈細胞加工處理的線性表位,B細胞則既可以識別線性表位又可以識別構象表位。正確預測表位和分析蛋白免疫原性將對疫苗和單克隆抗體的研發(fā)具有很大的幫助。
本研究運用多種生物信息學軟件,綜合分析預測了白念珠菌細胞壁蛋白Csp37的抗原表位。首先,了解了該蛋白為親水性蛋白,無信號肽,非跨膜蛋白;其次,優(yōu)選抗原指數(shù)高[19],親水性、柔韌性和表面可能性良好的序列[20],以滿足上述4種中3種條件的序列為初選表位序列,另外,由于α-螺旋、β-折疊的化學鍵能較高 ,不易形成抗原表位,所以應盡量避免,而優(yōu)選β轉角及無規(guī)卷曲等較松散的二級結構[20];最后,將上述獲得的候選表位序列與預測的B細胞表位序列相結合,在輔以預測T細胞表位序列,確定Csp37蛋白B細胞和T細胞共同表位優(yōu)勢區(qū)域。
本研究盡管初步預測了Csp37蛋白的抗原表位,但還是存在很多問題。由于B細胞表位大部分都是構象表位,因此,本研究想通過SWISS-MODEL在線軟件對Csp37蛋白進行三維結構建模[21],但結果發(fā)現(xiàn)Csp37蛋白序列與數(shù)據(jù)庫中模板序列只有不到20%的一致性,獲得的三維結構可信度較低,無法用來作為參考。此外,單參數(shù)預測某一蛋白質(zhì)的抗原表位有一定的局限性,在滿足基本的表位條件下,即至少3個連續(xù)氨基酸以上的序列,最好是6個以上的連續(xù)氨基酸,而且,應該采用多參數(shù)和多方法的綜合預測,但在實施過程中一直沒有絕對的標準,預測條件太嚴格可能得不到序列,預測標準降低又會降低表位預測的準確性和特異性,所以,預測會存在小部分的主觀性,有一定的誤差。最后,表位預測是一種經(jīng)驗性較強的學科,需要對比不同的分析軟件,且對同一性質(zhì)的預測不同軟件基于的原理可能有所不同,進而應用不同方法對同一蛋白的表位預測可能會獲得不完全一致的結果,因此,具體蛋白表位仍需要通過實驗來進行進一步驗證。
整體來說,通過表位預測進行抗白念珠菌感染疫苗或抗體的研究仍然較少,本研究利用生物信息學方法初步分別預測到了白念珠菌細胞壁蛋白Csp37的B 細胞表位9個和T細胞表位8個,以及共有的優(yōu)勢抗原表位5個,發(fā)現(xiàn)該蛋白含有豐富的抗原表位,具有誘導細胞免疫應答和體液免疫應答的潛能,可以據(jù)此設計并合成多肽,作為疫苗研究的新靶點。