郭剛強(qiáng),謝尙丹,葉思思,孫祥威,張良,張麗芳,薛向陽
(1.溫州醫(yī)科大學(xué) 微生物學(xué)與免疫學(xué)教研室 分子病毒與免疫研究所 熱帶醫(yī)學(xué)研究所,浙江 溫州325035;2.溫州醫(yī)科大學(xué) 第二臨床醫(yī)學(xué)院,浙江 溫州 325035;3.溫州醫(yī)科大學(xué)附屬第一醫(yī)院 胃腸外科,浙江 溫州 325015)
·論 著·
人巨細(xì)胞病毒US31基因序列特征分析及B細(xì)胞表位預(yù)測
郭剛強(qiáng)1,謝尙丹2,葉思思1,孫祥威3,張良3,張麗芳1,薛向陽1
(1.溫州醫(yī)科大學(xué) 微生物學(xué)與免疫學(xué)教研室 分子病毒與免疫研究所 熱帶醫(yī)學(xué)研究所,浙江 溫州325035;2.溫州醫(yī)科大學(xué) 第二臨床醫(yī)學(xué)院,浙江 溫州 325035;3.溫州醫(yī)科大學(xué)附屬第一醫(yī)院 胃腸外科,浙江 溫州 325015)
目的:分析人巨細(xì)胞病毒(HCMV)US31基因序列,預(yù)測US31基因編碼蛋白的B細(xì)胞優(yōu)勢表位。方法:基于US31基因編碼蛋白的氨基酸序列,結(jié)合親水性參數(shù)、可及性參數(shù)、抗原性參數(shù)、柔韌性參數(shù)及二級(jí)結(jié)構(gòu)方案對HCMV US31基因編碼各型蛋白的B細(xì)胞表位進(jìn)行預(yù)測,參照已建立的預(yù)測方法綜合評價(jià)US31基因B細(xì)胞優(yōu)勢表位。結(jié)果:US31核苷酸序列變異較少,大部分是同義突變,氨基酸序列高度保守;其編碼蛋白全長為162個(gè)氨基酸,相對分子質(zhì)量20 kD,等電點(diǎn)7.66,為可溶性蛋白,二級(jí)結(jié)構(gòu)中以無規(guī)則卷曲為主。經(jīng)綜合分析,US31基因的B細(xì)胞優(yōu)勢表位可能存在于氨基酸序列N端的5~19、32~47、58~68、110~124區(qū)段。結(jié)論:多參數(shù)預(yù)測HCMV pUS31的B細(xì)胞優(yōu)勢表位,為進(jìn)一步研究蛋白特征、制備單克隆抗體及表位疫苗提供依據(jù)。
人巨細(xì)胞病毒;US31基因;B細(xì)胞表位
人巨細(xì)胞病毒(human cytomegalovirus,HCMV)屬皰疹病毒科β亞科,為雙鏈DNA病毒,基因組全長約230~240 kb,含208個(gè)開放讀碼框,由長獨(dú)特序列(unique long domains,UL)和短獨(dú)特序列(unique short domains,US)2個(gè)片段組成。US31基因是US1基因家族成員,5’端和3’端分別與US30和US32基因相鄰,屬于HCMV增殖非關(guān)鍵病毒基因[1-2]。Burgdorf等[3]利用WTC-F HB5和Q548R IE2 C-F HB5病毒感染和空白感染G0期的HFFs細(xì)胞,芯片分析結(jié)果顯示在Q548R IE2 C-F HB5病毒感染HFFS細(xì)胞96 h和168 h后,US31基因相對于野生型病毒感染96 h的US31基因表達(dá)量,分別上調(diào)了3.5倍和5.7倍,定量PCR再次確證芯片分析結(jié)果,提示突變的Q548R IE2基因巨細(xì)胞病毒能夠上調(diào)US31基因的表達(dá),隨后利用IE2Δ40+60基因缺失的病毒感染HFFs細(xì)胞進(jìn)一步說明并不是IE2 40和IE2 60基因的缺失而是Q548R IE2 86基因的突變上調(diào)了US31基因的表達(dá)。而IE2 86是HCMV增殖性感染的一個(gè)重要蛋白[4],提示US31基因可能在HCMV感染及病毒增殖中發(fā)揮了重要的作用。但US31基因變異及序列特征迄今尚未見研究報(bào)道。本研究在分析US31基因變異及編碼蛋白序列特征基礎(chǔ)上,進(jìn)一步預(yù)測US31基因B細(xì)胞優(yōu)勢表位,為應(yīng)用多肽小片段制備單克隆抗體、表位疫苗及研究其蛋白功能提供重要的依據(jù)。
1.1US31基因序列的獲取 選取HCMV標(biāo)準(zhǔn)株Merlin株進(jìn)行B細(xì)胞表位的預(yù)測,此株分離自英國加的夫1例HCMV先天感染兒童尿液。US31蛋白氨基酸序列由基因組序列推導(dǎo)得出,檢索自Gene Bank(序列號(hào):AY446894),共有486個(gè)核苷酸,編碼162個(gè)氨基酸殘基,相對分子質(zhì)量為20 kD,等電點(diǎn)為7.66。序列如下:MSLLEREESWRRVVDYSHNLWCTCGNWQSHV EIQDEEPNCEQPEPAHWLEYVAVQWQARVRDSHDRWCLCNA WRDHALRGRWGTAYSSGSSASSSGFVAESKFTWWKRLR HSTRRWLFRRRRARYTPSNCGESSTSSGQSSGDESNCSLRTHG VYTRGEQH。另外從NCBI獲取20株HCMV US31基因并轉(zhuǎn)譯為氨基酸序列進(jìn)行序列同源性分析,序列號(hào)分別為:Toledo(GU937742)、3157(GQ221974)、3301(GQ466044)、AD169(FJ527563)、AF1(GU179291)、BE_10_2010(KC519320)、CZ_2_2012(KP745643)、HAN(JX512204)、JHC(HQ380895)、JP(GQ221975)、Merlin(AY446894)、U11(GU179290)、PAV16(KJ872539)、VR1814(GU179289)、Towne(FJ616285)、U8(GU179288)、UKNEQAS1(KJ361971)、BE_5_2011(KP745667)、6397(JX512197)、TR(KF021605)。
1.2pUS31蛋白的二級(jí)結(jié)構(gòu)預(yù)測 結(jié)合EXPASY服務(wù)器提供的GOR4、SOPMA、Scratch Protein Predictor(SPP)程序?qū)S31編碼蛋白全長氨基酸序列進(jìn)行二級(jí)結(jié)構(gòu)的分析。
1.3pUS31蛋白跨膜區(qū)域預(yù)測 應(yīng)用EXPASY服務(wù)器提供的TMHMM、DAS-TMfilter server、HMMTOP程序?qū)S31蛋白跨膜區(qū)域進(jìn)行預(yù)測,以非跨膜區(qū)域作為抗原表位的待選區(qū)。
1.4pUS31蛋白親水性、極性、抗原性、柔韌性和表面可及性的預(yù)測 結(jié)合EXPASY服務(wù)器提供的Hopp & Woods(親水性參數(shù))、Zimmerman(極性參數(shù))和DNAstar軟件的Protein進(jìn)行的Emini(表面可及性參數(shù))、Jameson-Wolf(抗原性參數(shù))、Flexible regions(柔韌性參數(shù))、Kolaskar & Tongaonkar Antigenicity Prediction[5](抗原性指數(shù))和Bepipred Linear Epitope Prediction[6](線性B細(xì)胞表位預(yù)測)方法分析來對US31編碼蛋白的B細(xì)胞表位進(jìn)行預(yù)測。
1.5綜合分析 綜合以上預(yù)測方法,兼顧各項(xiàng)預(yù)測參數(shù)推斷pUS31蛋白B細(xì)胞表位,采用吳玉章等[7]建立的抗原性指數(shù)(antigenic index,AI)綜合評判HCMV pUS31 B細(xì)胞表位的優(yōu)勢區(qū)域。
2.1US31基因序列分析 經(jīng)Clustalx中Do Complete Alignment,BioEdit中Sequence Identity Matrix進(jìn)行多序列比對分析,結(jié)果表明US31核苷酸有存在少數(shù)堿基的變異,但幾乎屬于同義突變,無缺失。除U11株(序列號(hào):GU179290)氨基酸序列第155位Y錯(cuò)義突變?yōu)镃,其他部位與Merlin株序列一致。US31基因核苷酸同源性大小為98.1%~100.0%,氨基酸為99.3%~100.0%,序列高度保守。翻譯后修飾位點(diǎn)顯示:pUS31蛋白含有1個(gè)N-糖基化位點(diǎn),4個(gè)酪蛋白激酶 II磷酸化位點(diǎn),4個(gè)N-十四(烷)酞化位點(diǎn),3個(gè)蛋白激酶C磷酸化位點(diǎn),2個(gè)雙組分核定位信號(hào),修飾位點(diǎn)氨基酸序列高度保守(見圖1)。通過MEGA5軟件的phylogeny,設(shè)置bootstrap值為1 000,我們對20株HCMV US31氨基酸序列進(jìn)行了系統(tǒng)進(jìn)化樹鄰接分析(見圖2),采用Poisson Correction模型,結(jié)果顯示HCMV US31氨基酸序列分為2個(gè)亞型,我們定義為G1和G2型,其中19株屬于G1型,占95.0%,G2型僅1株即U11株,由于核苷酸第464位A突變成G,導(dǎo)致錯(cuò)義突變,僅占5.0%。
2.2pUS31蛋白的二級(jí)結(jié)構(gòu) 采用EXPASY服務(wù)器的GOR4、SOPMA、SPP 3種方案預(yù)測二級(jí)結(jié)構(gòu),提示HCMV US31編碼蛋白的二級(jí)結(jié)構(gòu)中以無規(guī)卷曲為主,少見β-轉(zhuǎn)角、Bend region(見表1)。二級(jí)結(jié)構(gòu)柔性區(qū)域占總氨基酸數(shù)的47.2%,蛋白肽段的柔韌性越大,越易發(fā)生扭曲和折疊,易與抗體嵌合,作為抗原表位的概率也就越高。同時(shí)在這3種方案的預(yù)測結(jié)果中,取至少有2種方案預(yù)測結(jié)果一致的重疊區(qū)為準(zhǔn),且與柔韌性參數(shù)的預(yù)測相結(jié)合,可見無規(guī)則卷曲主要位于N端的1~3、25~28、35~46、79~82、83~87、88~94、122~136、139~151、159~161(見圖3)。
圖1 HCMV US31基因編碼蛋白氨基酸序列線性化比較
圖2 HCMV US31序列種系進(jìn)化樹分析
2.3HCMV pUS31跨膜區(qū)域的預(yù)測 使用EXPASY的TMHMM、DAS-TMfilter server、HMMTOP方法預(yù)測US31跨膜區(qū)域,結(jié)果顯示HCMV pUS31為可溶性蛋白,無跨膜區(qū)。因此選擇US31全部編碼區(qū)氨基酸作為預(yù)測表位的候選區(qū)段。
2.4多參數(shù)預(yù)測US31蛋白表位 按照Hopp &Woods、Zimmerman、Jameson-Wolf、Flexible regions、Emini方案分別預(yù)測US31蛋白的親水性、極性、抗原性、柔韌性和表面可及性。其中高于閾值的肽段即為預(yù)測的抗原表位。綜合分析HCMV pUS31的親水性、極性、柔韌性、表面可及性和抗原性顯示(見圖4和表2):應(yīng)用不同參數(shù)預(yù)測的B細(xì)胞抗原表位肽段略有差異,而氨基酸片段5~19、32~45、58~68、86~96、110~124、140~161在多種預(yù)測方法中一致(AI≥0,親水性指數(shù)≥0,表面可及性指數(shù)≥1,極性指數(shù)≥12)。采用Kolaskar & Tongaonkar Antigenicity Prediction(http://tools. immuneepitope.org/bcell/result)預(yù)測US31蛋白的B細(xì)胞表位,結(jié)果顯示其N端的11~25、27~33、40~56、65~67、98~101、146~154為可能的B細(xì)胞抗原表位(見圖5A和表3)。使用Bepipred Linear Epitope Prediction(http://tools.immuneepitope.org/bcell/result/)預(yù)測分析US31蛋白的抗原性,發(fā)現(xiàn)US31蛋白N端的9~9、32~47、59~62、83~98、123~147、154~161抗原性較強(qiáng)(見圖5B和表4)。
2.5pUS31蛋白表位的綜合預(yù)測 綜合以上預(yù)測方法及吳玉章等[7]的AI計(jì)算方法,計(jì)算臨床分離株HCMV US31蛋白的B細(xì)胞表位平均AI,結(jié)果顯示該蛋白N端的5~19、32~47、58~68、110~124的平均AI較高,提示其可能為B細(xì)胞表位的優(yōu)勢區(qū)域(見表5)。
表1 3種方法預(yù)測HCMV pUS31的二級(jí)結(jié)構(gòu)的構(gòu)成比[n(%)]
圖3 HCMV pUS31二級(jí)結(jié)構(gòu)預(yù)測
圖4 US31蛋白不同參數(shù)預(yù)測結(jié)果
表2 HCMV pUS31親水性、可及性、抗原性、柔韌性及二級(jí)結(jié)構(gòu)參數(shù)
US31基因位于HCMV的短獨(dú)特序列區(qū),與US1基因、US32基因同屬于US1家族[8]。研究發(fā)現(xiàn)US1基因?yàn)榧纯淘缙诨?,US32基因?yàn)橥砥诨蚯遗c病毒的潛伏相關(guān)[9],但目前與其同屬一個(gè)家族的US31基因還未見報(bào)道。盡管US31基因核苷酸序列存在少數(shù)堿基的變異,但幾乎屬于同義突變,氨基酸序列高度保守,不同病毒株US31蛋白氨基酸序列比對顯示,序列同源性高達(dá)99.3%~100.0%,提示US31基因?qū)⑹荋CMV感染診斷的候選基因。
表3 HCMV-US31線性B細(xì)胞表位預(yù)測
表4 HCMV-US31蛋白抗原性分析
圖5 US31蛋白B細(xì)胞抗原表位預(yù)測和抗原性分析
表5 臨床分離株HCMV US31蛋白的B細(xì)胞表位平均AI
不同病毒株US31蛋白翻譯后修飾位點(diǎn)比較顯示,pUS31蛋白含有1個(gè)N-糖基化位點(diǎn),4個(gè)酪蛋白激酶 II磷酸化位點(diǎn),4個(gè)N-十四(烷)酞化位點(diǎn),3個(gè)蛋白激酶C磷酸化位點(diǎn),2個(gè)雙組分核定位信號(hào),修飾位點(diǎn)氨基酸序列均高度保守,提示US31是一個(gè)具有磷酸化修飾調(diào)節(jié)及核定位的病毒蛋白。此外,20株HCMV US31氨基酸序列系統(tǒng)進(jìn)化樹鄰接分析顯示,19株屬于G1型,占95.0%,提示來自不同病毒株的US31基因親緣性較近。Sijmons等[10]對來自不同疾病狀態(tài)的100個(gè)HCMV感染患者進(jìn)行病毒分離與培養(yǎng)、DNA的提取及全基因擴(kuò)增,序列分析顯示US31基因的dN/dS比率為0.030,具有較強(qiáng)的陰性選擇,提示US31基因能夠很好地適應(yīng)人宿主,這些現(xiàn)象說明該結(jié)構(gòu)區(qū)對于HCMV生物學(xué)功能有著重要意義,選擇壓力保留了這段基因的穩(wěn)定性。
應(yīng)用生物信息學(xué)技術(shù)預(yù)測B細(xì)胞表位成為目前發(fā)現(xiàn)新的B細(xì)胞抗原表位的主要方法,并被廣泛應(yīng)用,且均取得了很好的結(jié)果[11-12]。而目前常用的B細(xì)胞線性表位預(yù)測方法主要分為單一參數(shù)預(yù)測方法和多參數(shù)綜合預(yù)測方法。由于各種預(yù)測方法存在差異性和局限性,使得各科研人員預(yù)測準(zhǔn)確性差異較大,故研究者通過不斷地改進(jìn)方法、開發(fā)更好的預(yù)測評價(jià)體系,使B細(xì)胞表位的預(yù)測、評價(jià)更加標(biāo)準(zhǔn)化[13]。本研究結(jié)合單一參數(shù)預(yù)測方法Hopp & Woods、Zimmerman和DNAstar軟件的Protein進(jìn)行的Emini、Jameson-Wolf、Flexible regions、Kolaskar & Tongaonkar Antigenicity Prediction和多參數(shù)綜合預(yù)測方法Bepipred Linear Epitope Prediction分別預(yù)測US31編碼蛋白可能的B細(xì)胞抗原優(yōu)勢表位,篩選采用了多項(xiàng)參數(shù)一致的原則。吳玉章等[7]綜合考慮蛋白質(zhì)的多種性質(zhì)如片段結(jié)構(gòu)、氨基酸側(cè)鏈的排列、構(gòu)象、活動(dòng)性等,通過計(jì)算20種氨基酸在病毒蛋白表位及一般蛋白質(zhì)中頻率的比值,再取對數(shù)即可,建立了一種AI的預(yù)測方法,用以計(jì)算可能的B細(xì)胞優(yōu)勢表位平均AI。通過結(jié)合以上多種預(yù)測方法及吳玉章等的AI計(jì)算方法綜合分析,結(jié)果顯示US31蛋白的氨基酸位置5~19區(qū)段(EREESWRRVV DYSHN)、32~47區(qū)段(EIQDEEPNCEQPEPAH)、58~68區(qū)段(ARVRDSHDRWCL)、110~124區(qū)段(RHSTRRWLF RRRRAR)平均AI較高,可能是B細(xì)胞表位的優(yōu)勢區(qū)段。
綜上,本研究對HCMV US31基因進(jìn)行了序列特征分析及B細(xì)胞表位預(yù)測,一方面有利于認(rèn)識(shí)US31蛋白的結(jié)構(gòu)和理化特性,便于了解US31病毒蛋白的作用,另一方面也有利于為研究者克隆US31基因片段提供依據(jù),為構(gòu)建高效的US31表位疫苗提供基礎(chǔ)。
[1] YU D, SILVA M C, SHENK T. Functional map of human cytomegalovirus AD169 defi ned by global mutational analysis[J]. Proc Natl Acad Sci U S A, 2003, 100(21): 12396-12401.
[2] DUNN W, CHOU C, LI H, et al. Functional profi ling of a human cytomegalovirus genome [J]. Proc Natl Acad Sci U S A, 2003, 100(24): 14223-14228.
[3] BURGDORF S W, CLARK C L, BURGDORF J R, et al. Mutation of glutamine to arginine at position 548 of IE2 86 in human cytomegalovirus leads to decreased expression of IE2 40, IE2 60, UL83, and UL84 and increased transcription of US8-9 and US29-32[J]. J Virol, 2011, 85(21): 11098-11110.
[4] SANDERS R L, CLARK C L, MORELLO C S, et al. Development of cell lines that provide tightly controlled temporal translation of the human cytomegalovirus IE2 proteins for complementation and functional analyses of growth-impaired and nonviable IE2 mutant viruses[J]. J Virol, 2008, 82(14): 7059-7077.
[5] KOLASKAR A, TONGAONKAR P C. A semi-empirical method for prediction of antigenic determinants on protein antigens[J]. FEBS letters, 1990, 276(1-2): 172-174.
[6] LARSEN J E, LUND O, NIELSEN M. Improved method for predicting linear B-cell epitopes[J]. Immunome Res, 2006, 2: 2.
[7] 吳玉章, 朱錫華. 一種病毒蛋白B細(xì)胞表位預(yù)測方法的建立[J]. 科學(xué)通報(bào), 1994, (24): 2275-2279.
[8] VAN DAMME E, VAN LOOCK M. Functional annotation of human cytomegalovirus gene products: an update[J]. Front Microbiol, 2014, 5: 218.
[9] GOODRUM F D, JORDAN C T, HIGH K, et al. Human cytomegalovirus gene expression during infection of primary hematopoietic progenitor cells: a model for latency[J]. Proc Natl Acad Sci U S A, 2002, 99(25): 16255-16260.
[10] SIJMONS S, THYS K, MBONG NGWESE M, et al. Highthroughput analysis of human cytomegalovirus genome diversity highlights the widespread occurrence of gene-disrupting mutations and pervasive recombination[J]. J Virol, 2015, 89: 7673-7695.
[11] 金勁激, 丁玉杰, 王冰冰, 等. MAGE-A家族抗原共同B細(xì)胞表位預(yù)測分析[J]. 溫州醫(yī)學(xué)院學(xué)報(bào), 2013, 43(11): 706-710.
[12] SHEN X, JIN J, DING Y, et al. Novel immunodominant epitopes derived from MAGE-A3 and its signifi cance in serological diagnosis of gastric cancer[J]. J Cancer Res Clin Oncol, 2013, 139(9): 1529-1538.
[13] CHEN P, RAYNER S, HU K H. Advances of bioinformatics tools applied in virus epitopes prediction[J]. Virol Sin, 2011, 26(1): 1-7.
(本文編輯:趙翠翠)
Analysis of the characteristics of gene seguence of human cytomegalovirus US31 and pr edication of B cell epitopes
GUO Gangqiang1, XIE Shangdan2, YE Sisi1, SUN Xiangwei3, ZHANG Liang3, ZHANG Lifang1, XUE Xiangyang1. 1.Department of Microbiology and Immunology, Institute of Molecular Virology and Immunology, Institute of Tropical Medicine, Wenzhou Medical University, Wenzhou, 325035; 2.The Second Clinical College of Wenzhou Medical University, Wenzhou, 325035; 3.Department of General Sur gery, the First Aff liated Hospital of Wenzhou Medical University, Wenzhou, 325015
Objective: To analyze the sequence of human cytomegalovirus US31 gene and predict the B cell epitopes of US31 protein. Methods: The hydrophilicity, accessibility, antigenicity and fl exibility index were used to predict the potential B cell epitopes of protein based on the US31 amino acid sequence. Results: Most amino acid sequence of US31 was highly conserved while only a few strains had variation, and most of them were sense mutation. HCMV pUS31 contained 162 amino acid residues, the relative molecular mass was 20 kD and the isoelectric point was 7.66. It’s a soluble protein and its secondary structure occurred more frequently as random coil region. The predicted B-cell epitopes of the pUS31 might exist at N-terminal of amino acid sequence: 5~19, 32~47, 58~68, 110~124. Conclusion: The B-epitopes of pUS31 are predicted successfully, which provides a theoretic basis for the further study of protein characteristics, development of epitopes based vaccine, and preparation of monoclonal antibody against fusion protein.
human cytomegalovirus; US31 gene; B cell epitopes
R373.9
A
10.3969/j.issn.2095-9400.2016.11.001
2016-04-25
國家自然科學(xué)基金資助項(xiàng)目(81472308,81672707);浙江省大學(xué)生新苗計(jì)劃(2014R413058,2015R413069)。
郭剛強(qiáng)(1992-),男,云南曲靖人,碩士生。
薛向陽,副教授,碩士生導(dǎo)師,Email:wzxxy001@ 163.com。