李彬,石剛,杜宗利,辛?xí)苑?,葉強(qiáng),徐穎華
中國食品藥品檢定研究院 國家衛(wèi)生健康委員會(huì)生物技術(shù)產(chǎn)品檢定方法及其標(biāo)準(zhǔn)化重點(diǎn)實(shí)驗(yàn)室,北京 102629
鉤端螺旋體病是由致病性鉤端螺旋體(簡(jiǎn)稱鉤體)引起的一種急性人獸共患傳染病,也是洪澇、地震等自然災(zāi)害后需重點(diǎn)監(jiān)測(cè)的主要傳染病之一[1]。隨著環(huán)境衛(wèi)生、經(jīng)濟(jì)條件的改善及鉤體疫區(qū)高風(fēng)險(xiǎn)人群疫苗接種率的提高,近30年鉤體病在中國的發(fā)病率和病死率顯著下降[2-3]。由于洪水災(zāi)害及全球氣候變暖等因素,每年仍有不少鉤體感染病例的報(bào)道,在局部地區(qū)甚至出現(xiàn)暴發(fā)流行[4-5],嚴(yán)重威脅人類健康和畜牧業(yè)發(fā)展。
對(duì)流行地區(qū)易感人群、獸類及抗洪救災(zāi)等高危人員進(jìn)行疫苗接種是預(yù)防和控制鉤體病最有效和經(jīng)濟(jì)的手段。中國目前所用預(yù)防鉤體病的疫苗是由幾種不同血清群滅活鉤體混合配制而成的菌體疫苗[3,6]。生產(chǎn)用菌種作為疫苗生產(chǎn)最重要的物質(zhì)基礎(chǔ)直接影響疫苗質(zhì)量。我國鉤體疫苗生產(chǎn)用菌種主要依據(jù)20 世紀(jì)60~70年代各地流行疫區(qū)流行病學(xué)和病原學(xué)調(diào)查結(jié)果篩選而來[3,7],為明確目前鉤體病流行菌株與沿用至今的生產(chǎn)用菌種間的差異,本研究采用高通量測(cè)序技術(shù)對(duì)1 株我國鉤體最主要流行血清群——黃疸出血群菌株進(jìn)行全基因組測(cè)序,并與其相同血清群疫苗株進(jìn)行比較基因組學(xué)分析,明確兩者的差異,探討我國流行鉤體基因組變異特點(diǎn)和流行趨勢(shì),以期為促進(jìn)鉤體疫苗的改進(jìn)提供實(shí)驗(yàn)依據(jù)。
1.1 菌株 2005年分離的致病性黃疸出血群鉤體流行菌株200502(簡(jiǎn)稱流行株200502)由中國食品藥品檢定研究院中國醫(yī)學(xué)細(xì)菌保藏管理中心保存,其多序列位點(diǎn)(MLST)型為ST17,為我國當(dāng)前流行的黃疸出血群中兩個(gè)ST型(ST1和ST17)之一[8]。
1.2 主要試劑 EMJH 培養(yǎng)基購自美國BD 公司;兔血清購自天津市正江現(xiàn)代生物技術(shù)有限公司;DNA提取試劑盒購自德國Qiagen 公司;其他化學(xué)試劑均為國產(chǎn)分析純。
1.3 細(xì)菌培養(yǎng)及DNA 提取 將流行株200502 接種于含10%兔血清的EMJH培養(yǎng)基,于28 ℃培養(yǎng)箱中培養(yǎng)14 d,8 000 ×g離心20 min,收集菌體,用DNA 提取試劑盒提取菌株的全基因組DNA,置-70 ℃保存。
1.4 全基因組測(cè)序及生物信息學(xué)分析 由上海人類基因組研究中心采用Illumina 公司solexa 測(cè)序技術(shù)對(duì)基因組DNA 樣品進(jìn)行全基因組測(cè)序。應(yīng)用velvet 1.2.03軟件對(duì)檢測(cè)數(shù)據(jù)進(jìn)行拼裝,結(jié)合生物信息學(xué)分析軟件Glimmer 3.02,并參考SEED蛋白數(shù)據(jù)庫進(jìn)行基因預(yù)測(cè)、功能注釋及直系同源簇(clusters of orthologous groups,COG)分類。將流行株200502 測(cè)序獲得全基因組序列與同血清群疫苗株56601(簡(jiǎn)稱疫苗株56601)和波氏基因種代表菌株56142(簡(jiǎn)稱波氏代表株56142)進(jìn)行比較基因組學(xué)分析,包括菌株基因種、配對(duì)基因組平均核苷酸一致性(average nucleotide identity,ANI)及共有與特有基因比較分析。以已發(fā)表的疫苗株56601 為參考,對(duì)流行株200502進(jìn)行插入缺失(indel)和單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)分析,以進(jìn)一步了解不同菌株間基因多態(tài)性。同時(shí)為了解黃疸出血群鉤體的分子進(jìn)化發(fā)育情況,選取GenBank 已公布的包括疫苗株56601 在內(nèi)的9株不同基因種的代表性鉤體菌株(見表1)進(jìn)行全基因組水平系統(tǒng)發(fā)育進(jìn)化樹的構(gòu)建和分析。
表1 用于構(gòu)建系統(tǒng)發(fā)育進(jìn)化樹的菌株信息Tab.1 Information of strains used to construct phylogenetic evolutionary tree
2.1 流行株200502 的全基因組特征 流行株200502全基因組序列全長(zhǎng)為4 543 190 bp,預(yù)測(cè)所含編碼基因3 580 個(gè),平均長(zhǎng)度為951 bp,占整個(gè)基因組序列的74.9%,鳥嘌呤(G)和胞嘧啶(C)兩種堿基之和占總堿基比例(即GC 含量)為36.6%?;蚪M中非編碼基因區(qū)域長(zhǎng)度為1 139 012 bp,占整個(gè)基因組序列的25.1%,GC 含量為30.0%。流行株200502基因組中含有IS1533、ISLbp5和IS1501 3個(gè)插入元件。
2.2 流行株200502 全基因組序列基因功能分析 流行株200502全基因組中有1 295個(gè)基因無法進(jìn)行COG分類,2 192 個(gè)基因具有明確的生物學(xué)功能,與細(xì)胞壁、細(xì)胞膜、細(xì)胞外膜生物合成(216 個(gè))、信號(hào)轉(zhuǎn)導(dǎo)機(jī)制(185 個(gè))及氨基酸轉(zhuǎn)運(yùn)和代謝(147 個(gè))相關(guān)基因數(shù)量排前3位,見表2。另外,有200個(gè)(9.1%)未知基因無法獲得功能注釋,有待后續(xù)進(jìn)一步分析。
2.3 比較基因組學(xué)分析 流行株200502 基因組與疫苗株56601 染色體在全基因組水平上表現(xiàn)出較高的共線性和高度的同源性,核苷酸序列呈反向鏡面結(jié)構(gòu),ANI 為99.2%,表明兩菌株基因組結(jié)構(gòu)高度相似;流行株200502 基因組的基因種與疫苗株56601相同,均為L(zhǎng).interrogans基因種;與波氏代表株56142 基因組比較,核苷酸序列呈現(xiàn)結(jié)構(gòu)交叉、共線性較少,ANI僅為80.51%。見圖1。
圖1 黃疸出血群鉤體流行株200502、疫苗株56601 和波氏株56142基因組核苷酸序列的共線性分析Fig.1 Collinearity analysis of genomic nucleotide sequences of Leptospira Icterohaemorrhagiae circulating strain 200502,vaccine strain 56601 and L.borgpetersenii 56142
流行株200502 基因組與疫苗株56601 共有3 245個(gè)同源基因,與波氏代表株56142共有2 679個(gè)同源基因;3 株菌株間共鑒定出2 635 個(gè)同源基因。同時(shí),與各自基因組比較,流行株200502、疫苗株56601 和波氏代表株56142 分別有198、232 和618 個(gè)基因無同源性,表明為各菌株的特有基因,見圖2 和表2。COG 功能注釋顯示,與疫苗株56601 比較,流行株200502 基因組特有的242 個(gè)基因中,74.0%的基因功能未知;在已知功能基因中,與復(fù)制、重組、修復(fù)和信息轉(zhuǎn)導(dǎo)相關(guān)基因數(shù)量均為8個(gè)。
圖2 黃疸出血群鉤體流行株200502、疫苗株56601 和波氏株56142基因組中的共有和特有基因維恩圖Fig.2 Venn diagram of common and unique genes in the genomes of Leptospira Icterohaemorrhagiae circulating strain 200502,vaccine strain 56601 and L.borgpetersenii 56142
表2 黃疸出血群鉤體流行株200502與疫苗株56601基因組的COG分析比較Tab.2 Genomic COG analysis of Leptospira Icterohaemorrhagiae circulating strain 200502 and vaccine strain 56601
2.4 indel和SNP分析 流行株200502中核苷酸序列中共發(fā)現(xiàn)2 005 個(gè)indel 位點(diǎn)和19 799 個(gè)SNP 位點(diǎn),其中編碼區(qū)有8 485 個(gè)同義SNP 位點(diǎn)(syn)和3 484個(gè)非同義SNP 位點(diǎn)(nonsyn),非編碼區(qū)有7 830 個(gè)SNP位點(diǎn)。多數(shù)SNP和indel位點(diǎn)分散在不同區(qū)域和基因中,與菌株的細(xì)胞運(yùn)動(dòng)、信號(hào)轉(zhuǎn)導(dǎo)機(jī)制、防御機(jī)制等相關(guān),另外,還發(fā)現(xiàn)一些已知與鉤體致病相關(guān)的脂蛋白與外膜蛋白,如脂蛋白LipL32 和LipL21 分別存在1 個(gè)和2 個(gè)同義SNP 位點(diǎn),LipL41 含4 個(gè)同義SNP 位點(diǎn)和11 個(gè)非同義SNP 位點(diǎn);外膜蛋白OmpL1發(fā)現(xiàn)存在31個(gè)同義SNP位點(diǎn)和7個(gè)indel位點(diǎn)。
2.5 系統(tǒng)發(fā)育進(jìn)化分析 腐生型Ames 為近祖先菌,位于進(jìn)化樹最外圍,其他致病型與其進(jìn)化距離較遠(yuǎn),形成兩個(gè)最大分支,流行株200502 與L.interrogans(56601)、L.noguchii(56611)和L.kirschneri(56189)3個(gè)基因種進(jìn)化親緣性較近,見圖3。
圖3 不同鉤體基因種的全基因組系統(tǒng)發(fā)育進(jìn)化樹分析Fig.3 Analysis of genome-wide phylogenetic evolutionary tree of various Leptospira gene species
大量國內(nèi)流行病學(xué)研究結(jié)果證實(shí),當(dāng)前我國幾個(gè)鉤體流行地區(qū)流行的鉤體血清群為黃疸出血群[9-11]。近年來,國內(nèi)外研究人員積累了大量致病性鉤體的基因組信息[12-13],同時(shí)在臨床上也有采用高通量測(cè)序技術(shù)進(jìn)行鉤體病診斷的報(bào)道[4,14]。本研究采用高通量測(cè)序技術(shù)和系統(tǒng)生物信息學(xué)分析、解讀了我國近期分離的1 株致病性黃疸出血群菌株的全基因組序列,充實(shí)了基因數(shù)據(jù)庫,全面注釋了基因組中與鉤體生長(zhǎng)發(fā)育、代謝調(diào)控和信號(hào)轉(zhuǎn)導(dǎo)等有關(guān)的基因,為深入了解與早期分離的鉤體疫苗株的全基因組水平差異提供了實(shí)驗(yàn)依據(jù)。
在鉤體疫情嚴(yán)重的泰國,研究人員發(fā)現(xiàn)主要流行鉤體菌株的血清型并無明顯改變,但主要流行菌株與自然環(huán)境宿主相互作用過程中通過適應(yīng)性進(jìn)化,形成了新的ST 基因型(ST34),呈克隆性擴(kuò)張,具有較強(qiáng)的傳播能力,從而引起鉤體病新的流行暴發(fā)[15]。對(duì)中國食品藥品檢定研究院與中國疾控中心傳染病預(yù)防控制所收集的過去50 多年中國不同省市的120 株黃疸出血群鉤體菌株進(jìn)行MLST 多態(tài)性分析,發(fā)現(xiàn)黃疸出血群群內(nèi)分化明顯,共有17 種不同ST基因型[8]。作為遺傳多態(tài)性分析常見兩種位點(diǎn)標(biāo)記,indel 和SNP 位點(diǎn)分析能進(jìn)一步了解不同菌株間的基因多態(tài)性[16],本研究基于全基因組水平的比較基因組分析結(jié)果,進(jìn)一步證實(shí)近期的黃疸出血群流行菌株基因組與分離于1958年的疫苗株56601 之間存在大量的SNP 和indel 位點(diǎn),涉及菌株的細(xì)胞運(yùn)動(dòng)、信號(hào)轉(zhuǎn)導(dǎo)機(jī)制、防御機(jī)制等重要生命活動(dòng)有關(guān)的基因,提示這些差異基因及其編碼產(chǎn)物在當(dāng)前流行克隆群ST17 黃疸出血群鉤體適應(yīng)不同宿主環(huán)境的進(jìn)化過程中發(fā)揮重要作用。因此,上述流行菌株分子基因?qū)用娴牟町悓?duì)致病菌蛋白表達(dá)及其致病性的影響需密切關(guān)注。巴西科學(xué)家發(fā)現(xiàn),其國內(nèi)絕大多數(shù)發(fā)生致病性鉤體肺出血綜合征(leptospiral pulmonary hemorrhage syndrome,LPHS)患者與未發(fā)生LPHS 患者感染的鉤體血清型均為黃疸出血群的哥本哈根型,推測(cè)這些病原菌之間在基因和蛋白表達(dá)水平可能存在一定差異,從而導(dǎo)致引起LPHS的哥本哈根型鉤體菌株致病性和毒力比普通哥本哈根型菌株強(qiáng)[17]。本研究后續(xù)將進(jìn)行不同時(shí)期鉤體流行株的轉(zhuǎn)錄和蛋白表達(dá)差異的研究,分析差異基因和蛋白的功能,評(píng)價(jià)鉤體疫苗對(duì)當(dāng)前鉤體主要流行菌株的免疫保護(hù)性;另外,全基因組序列基因功能分析結(jié)果表明,有較多基因產(chǎn)物被注釋為一般功能預(yù)測(cè)或未知功能,因此可繼續(xù)采用反向疫苗學(xué)的技術(shù)以發(fā)現(xiàn)更多鉤體特異性外膜或表面蛋白抗原[18-19]。同時(shí),基于全基因組水平的系統(tǒng)進(jìn)化發(fā)育分析發(fā)現(xiàn),流行株200502與L.interrogans(56601)、L.noguchii(56189)和L.kirschneri(56611)3 個(gè)基因種進(jìn)化親緣性更近,推測(cè)可能經(jīng)歷相似的進(jìn)化歷程,與這3 個(gè)種菌株的致病性均較強(qiáng)相關(guān)[20]。
綜上所述,本研究從全基因組水平上分析了我國人用鉤體病疫苗株與當(dāng)前流行菌株的差異,為今后鉤體疫苗的改進(jìn)提供了實(shí)驗(yàn)依據(jù),同時(shí)也為未來其他相關(guān)病原體及其疫苗株比較研究提供了新思路。