王鐵霖,李晶,楊玉文,趙廷昌
中國農(nóng)業(yè)科學(xué)院植物保護研究所,植物病蟲害生物學(xué)國家重點實驗室,北京 100193
煙草野火病菌Pseudomonas syringaepv.tabaciyuexi-1信號肽預(yù)測及分析
王鐵霖,李晶,楊玉文,趙廷昌
中國農(nóng)業(yè)科學(xué)院植物保護研究所,植物病蟲害生物學(xué)國家重點實驗室,北京 100193
利用SignalP 4.0、 LipoP 1.0 及TMHMM v2.0對煙草野火病菌Pseudomonas syringaepv.tabaciyuexi-1菌株基因組中信號肽的數(shù)量、長度和氨基酸組成進行了預(yù)測及分類。結(jié)果確定其中432個ORFs (Open reading frame) 所編碼的N 端有信號肽序列,占全部ORFs的8.81%。其中351條分泌型信號肽 (SPI),81條脂蛋白型信號肽 (SPII)。在分泌型信號肽中,信號肽的長度為11~42個氨基酸,以長度為22個氨基酸的信號肽最多。同源性分析結(jié)果顯示,具有相同信號肽序列的不同蛋白序列之間是高度保守的。該研究提供了野火病原菌致病因子的備選基因,提高該病菌致病因子的篩選效率。
Pseudomonas syringaepv.tabaci;信號肽;SignalP 4.0;LipoP 1. 0;TMHMM v2.0
煙草野火病是煙草生產(chǎn)上一種重要的葉部細菌性病害。該病害在苗期、大田期均可發(fā)生,主要危害煙草葉片,也可危害幼莖、蒴果、萼片等器官,給煙草種植業(yè)造成了巨大的經(jīng)濟損失[1-2]。大部分病原菌的毒素、細胞壁降解酶等致病因子為分泌蛋白。而信號肽在分泌蛋白跨膜、 轉(zhuǎn)運及識別植物受體蛋白過程中起著非常重要的作用[3-4]。
信號肽一般由10~40個氨基酸殘基組成,通常大致分為3個區(qū)段:其中N端為堿性氨基末端,通常由帶正電荷的氨基酸組成;中間為疏水中心,主要由20個或以上的中性氨基酸組成;C端為加工區(qū),含有被信號肽酶裂解的部位,其中小分子氨基酸如甘氨酸、丙氨酸、絲氨酸較多[5,6]。
本實驗室對分離自四川越西縣煙草病樣上的一株致病力很強的煙草野火病菌株 yuexi-1進行了全基因組測序, 結(jié)果顯示其基因組含有 5701個開放閱讀框(open reading frame,ORFs)。本研究根據(jù)野火病菌株P(guān)seudomonas syringaepv. tabaciyuexi-1的全基因組測序結(jié)果,利用 3 種在線生物信息學(xué)分析工具 SignalP 4.0、LipoP 1. 0 和 TMHMM v2.0 對該病菌的信號肽進行預(yù)測和分析,為該菌株致病因子的篩選提供備選基因。
從Genbank上獲得Pseudomonas syringaepv. tabaciyuexi-1菌株基因組序列(序列號JWJF00000000) 的fasta 文件和 gb文件。
(1) 使用 SignalP 4.0 (http://www.cbs.dtu.dk/services/SignalP/) 在Gram-negative bacteria選項下預(yù)測 yuexi-1菌株基因組所有ORFs的N端氨基酸序列是否存在信號肽。(2) 使用 LipoP 1.0 (http://www.cbs.dtu.dk/services/LipoP/) 分析N端氨基酸序列,預(yù)測蛋白質(zhì)類型。(3) 使用TMHMM Server v. 2.0 (http://www.cbs.dtu.dk/services/TMHMM/) 驗證預(yù)測結(jié)果。預(yù)測標(biāo)準(zhǔn)根據(jù)相關(guān)文獻執(zhí)行[19~23]。
綜合SignalP 4.0、 LipoP 1. 0和TMHMM Server v.2.0的預(yù)測結(jié)果,對P. syringaepv. tabaciyuexi-1編碼蛋白基因的序列分析結(jié)果如下:
經(jīng)預(yù)測,yuexi-1菌株基因組有432個ORFs具有信號肽,占全部ORFs的8.81%。信號肽所在的ORFs長度最小為41個氨基酸,最大為1649個氨基酸,平均長度為340個氨基酸,ORFs長度分布在101~200個氨基酸范圍內(nèi)數(shù)量最多(圖1) 。
圖1 含信號肽的ORFs長度分布Fig. 1 Length distribution of the ORFs containing signals peptides
信號肽的長度在11~41個氨基酸之間,以21~24個氨基酸居多,其中長度為22個氨基酸的信號肽最多,共66條,占15.30%(圖2)。
圖2 信號肽長度(氨基酸)分布Fig. 2 Length (amino acids) distribution of signal peptide
經(jīng)LipoP 1. 0分析,根據(jù)信號肽氨基酸組成及切割位點信號肽識別序列的不同將信號肽分為4種類型:第一類信號肽酶I型 (SPI) 信號肽最為典型[7-9];第二類為信號肽酶II型 (SPII),通常在脂蛋白中出現(xiàn)[10];第三類為IV型菌毛 (Type IV pilin peptidase);第四類通常與細菌素和信息素的合成有關(guān),由ABC轉(zhuǎn)運系統(tǒng)轉(zhuǎn)運[11-13]。
對P. syringaepv. tabaciyuexi-1菌株中的432條信號肽分類結(jié)果表明,共有351條SPI型信號肽和81條SPII型信號肽。
SPI型信號肽通常在從分泌蛋白被轉(zhuǎn)運至細胞膜途中或轉(zhuǎn)運至細胞膜后,被切割[14,15]。此類信號肽中存在分泌類信號肽 (Sec-type),其典型結(jié)構(gòu): N-端由2~3個帶正電荷的氨基酸 (K或R) 組成,也有的由5~11個帶正電荷的氨基酸組成。N-domain 由平均19個氨基酸構(gòu)成。C-domain (切割位點前3 位的氨基酸) 的典型結(jié)構(gòu)為A-X-A (A 為丙氨酸, X 指任意一種氨基酸)。
在預(yù)測得到的351條SPI型信號肽中,200條信號肽具有A-X-A的典型結(jié)構(gòu),長度在11~41個氨基酸之間。另一類信號肽具有典型的雙精氨酸結(jié)構(gòu),引導(dǎo)分泌蛋白參與雙精氨酸 (Tat) 轉(zhuǎn)運途徑,這一類信號肽具有RR-X-## ( X為任意氨基酸,## 指疏水氨基酸) 的保守序列[16-18]。在P. syringepv.tabaciyuexi-1菌株的基因組中, 有 27 條信號肽具有RR-motif 的保守區(qū)段,其長度在17-42個氨基酸之間。其中17 條信號肽的C-domain 中出現(xiàn)A-X-A 典型結(jié)構(gòu) (表1)。如表 1 所示, 這些信號肽參與ABC蛋白轉(zhuǎn)運途徑等多種不同分泌途徑和相關(guān)酶合成代謝途徑。
表1 具有典型A-X-A結(jié)構(gòu)的RR-motif型信號肽Tab. 1 RR-motif signal peptides with the typical structure of A-X-A
SPII型信號肽也稱為脂蛋白信號肽,其典型結(jié)構(gòu)C-domain為: L-(A /S) -(A /G),在切割位點后+ 1位氨基酸為半胱氨酸(C),這樣就形成了保守的L-(A /S)-(A /G)-C的Li-pobox典型結(jié)構(gòu),該結(jié)構(gòu)使脂蛋白被切割后依然能夠錨定在質(zhì)膜上。該類信號肽通常比分泌型信號肽短。
在P. syringaepv.tabacistrain yuexi-1中,共有81個脂蛋白型信號肽,其長度在14~36個氨基酸之間。其中有 37 (1.32%) 條信號肽具有Li-pobox典型結(jié)構(gòu)(表2)。
表2 煙草野火病菌yuexi-1菌株基因組脂蛋白類型信號肽Tab. 2 Lipoprotein signal peptide in P. syringaepv.tabaci strain yuexi-1
續(xù)表2
續(xù)表2
在P.pv. tabaciyuexi-1菌株的基因組中,存在不同的分泌蛋白具有相同信號肽序列的現(xiàn)象。據(jù)統(tǒng)計,共30條SPI型信號肽和2條SPII型信號肽(表3)存在這種情況,而這些分泌蛋白具有類似的功能描述并參與相同生物過程。我們對含有相同信號肽序列的氨基酸序列進行比對發(fā)現(xiàn),其中8 組分泌蛋白,ORF 的編號分別為:peg.886 與peg.2670,peg.3721 與peg.3724, peg.3810、peg.4062與peg.4068, peg.3812、peg.4064 與 peg.4070, peg.4111 與 peg.4113,peg.170 與peg.4165, peg.2692 與 peg.2779, peg.2796 與 peg.2803,核酸序列比對的一致性在 99%~100%,可能為多拷貝基因。其它含有相同信號肽的蛋白序列的長度和同源性的差異很大,但有功能相近,這些分泌蛋白序列呈現(xiàn)很高的同源性并高度保守,因此判斷這一類基因為平行進化的同源基因。
表3 相同序列信號肽Tab. 3 Signal peptides with the same sequences
本研究運用 3 種生物信息學(xué)分析軟件對P.syringaepv. tabaci yuexi-1 菌株的全基因組序列進行分析。P. syringaepv. tabaciyuexi-1 菌株中共有432條信號肽,其中351條SPI型信號肽和81條SPII型信號肽。通過比較分析,SPII 型信號肽與 SPI 型信號肽存在以下不同:首先,脂蛋白的信號肽,其 C 端包含 Lipobox 共識序列L-(A /S)-(A/G)-C,其結(jié)構(gòu)比分泌信號肽更保守(表 2),說明在脂蛋白的修飾過程中,多肽變化極少。另外,SPI型信號肽平均長度為26 個氨基酸,SPII 型信號肽的平均長度為 20 個氨基酸左右,較 SPI 型信號肽短。
煙草野火病菌 yuexi-1 有較強的致病力,其基因組測序的完成, 使得從全基因組水平分析和研究該菌株的信號肽和分泌蛋白成為可能。本研究中,結(jié)合多種生物信息學(xué)軟件,優(yōu)化預(yù)測方法,對基因組中具有信號肽的分泌蛋白進行了預(yù)測分析,使預(yù)測結(jié)果更準(zhǔn)確,為該菌株基因組特征的描述及該病菌致病機制的研究提供了理論依據(jù)。前期報道,細菌的大多數(shù)分泌蛋白中其致病性關(guān)系密切。其中, 參與 Tat 分泌途徑的RR-motif信號肽與植物病原細菌的致病性關(guān)系尤為密切。Rodríguez等利用生物信息學(xué)軟件對Dickeya dadantii3937的全基因組序列進行信號肽預(yù)測分析,并篩選假定 Tat 底物進行突變體,結(jié)果發(fā)現(xiàn),TatC 突變體的致病力降低[24]。梨火疫病菌 (Erwinia amylovora) Tat途徑中的分泌蛋白參與病菌的生長速度、 致病力生理特性[25]。本研究中,在 yuexi-1信號肽預(yù)測結(jié)果中, 得到 26 條與Tat 系統(tǒng)相關(guān)的信號肽。同時,在分析分泌蛋白功能時發(fā)現(xiàn),預(yù)測得到的信號肽中存在參與 III 型分泌系統(tǒng)等與致病力關(guān)系密切的分泌系統(tǒng),以上所得到的這些信號肽所對應(yīng)的基因是否也與其致病力等密切相關(guān)也需要進一步證實。
盡管本研究利用結(jié)合多種軟件,提高預(yù)測的準(zhǔn)確性,但預(yù)測結(jié)果與實際分泌到菌體外的蛋白在數(shù)量和種類上有一定的差距,在預(yù)測信號肽蛋白中,哪些是真正的分泌蛋白、分泌狀態(tài)及其功能需進一步驗證。后期研究工作中,結(jié)合預(yù)測結(jié)果對感興趣的分泌蛋白進行功能驗證,提高驗證分泌蛋白功能效率。
[1] Gasson M J. Indicator technique for antimetabolic toxin production by phytopathogenic species ofPseudomonas[J].Applied and environmental microbiology, 1980, 39(1): 25-29.
[2] Thomas M D, Uchytil TF, Durbin RD. et al. Inhibition of glutamine synthetase from pea by tabtoxinine-beta-lactam[J]. Plant physiology, 1983, 71(4): 912-5.
[3] Emanuelsson O, von Heijne G. Prediction of organellar targeting signals [J]. Biochimica et Biophysica Acta (BBA)-Molecular Cell Research, 2001, 1541(1): 114-119.
[4] Baldi P, Brunak S, Chauvin Y, et al. Assessing the accuracy of prediction algorithms for classi fi cation: an overview [J].Bioinformatics, 2000, 16(5): 412-424.
[5] Heijne G. Patterns of amino acids near signal‐sequence cleavage sites [J]. European journal of biochemistry, 1983,133(1): 17-21.
[6] Von Heijne G. Signal sequences: the limits of variation [J].Journal of molecular biology, 1985, 184(1): 99-105.
[7] 王鐵霖,嚴婉榮,閆莎莎,等. 瓜類果斑病菌 (Acidovorax citrulli) 基因組信號肽預(yù)測分析[J]. 中國瓜菜, 2012,25(1): 1-6.
[8] Tjalsma H, van den Dolder J, Meijer WJ, et al. The Plasmid-Encoded Signal Peptidase SipP Can Functionally Replace the Major Signal Peptidases SipS and SipT of Bacillus subtilis [J]. Journal of bacteriology, 1999, 181(8):2448-2454 .
[9] Tjalsma H, Zanen G, Venema G, et al. The potential active site of the lipoprotein-speci fi c (type II) signal peptidase of Bacillus subtilis [J]. Journal of Biological Chemistry, 1999,274(40): 28191-28197.
[10] Prágai Z, Tjalsma H, Bolhuis A, et al. The signal peptidase II (Isp) gene of Bacillus subtilis [J]. Microbiology, 1997,143(4): 1327-1333.
[11] Banerjee S, Hansen JN. Structure and expression of a gene encoding the precursor of subtilin, a small protein antibiotic[J]. Journal of Biological Chemistry, 1988, 263(19): 9508-9514.
[12] Paik S H, Chakicherla A, Hansen J N. Identification and characterization of the structural and transporter genes for,and the chemical and biological properties of, sublancin 168, a novel lantibiotic produced by Bacillus subtilis 168[J]. Journal of Biological Chemistry, 1998, 273(36): 23134-23142.
[13] Weiner J H, Bilous P T, Shaw G M, et al. A novel and ubiquitous system for membrane targeting and secretion of cofactor-containing proteins [J]. Cell, 1998, 93(1): 93-101.
[14] Dalbey R E, von Heijne G. Signal peptidases in prokaryotes and eukaryotes-a new protease family [J]. Trends in biochemical sciences, 1992, 17(11): 474-478.
[15] Dalbey R E, Lively M O, Bron S, et al. The chemistry and enzymology of the type I signal peptidases [J]. Protein Science, 1997, 6(6): 1129-1138.
[16] Berks B C, Sargent F, Palmer T. The Tat protein export pathway [J]. Molecular microbiology, 2000, 35(2): 260-274.
[17] Berks B C. A common export pathway for proteins binding complex redox cofactors?[J]. Molecular microbiology,1996, 22(3): 393-404.
[18] Cristóbal S, de Gier J W, Nielsen H, et al. Competition between Sec‐and TAT - dependent protein translocation inEscherichia coli[J]. The EMBO journal, 1999, 18(11):2982-2990.
[19] Petersen T N, Brunak S, von Heijne G, et al. SignalP 4.0:discriminating signal peptides from transmembrane regions[J]. Nature methods, 2011, 8(10): 785-786.
[20] Dyrl?v Bendtsen J, Nielsen H, von Heijne G, et al.Improved prediction of signal peptides: SignalP 3.0[J].Journal of molecular biology, 2004, 340(4): 783-795.
[21] Juncker A S, Willenbrock H, Von Heijne G, et al. Prediction of lipoprotein signal peptides in Gram‐negative bacteria[J]. Protein Science, 2003, 12(8): 1652-1662.
[22] Paetzel M, Dalbey R E, Strynadka NCJ. Crystal structure of a bacterial signal peptidase in complex with a β-lactam inhibitor [J]. Nature, 1998, 396(6707): 186-190.
[23] K?ll L, Krogh A, Sonnhammer ELL. Advantages of combined transmembrane topology and signal peptide prediction-the Phobius web server [J]. Nucleic acids research, 2007, 35(suppl 2): W429-W432.
[24] Rodríguez-Sanz M, Antúnez-Lamas M, Rojas C, et al.The Tat pathway of plant pathogen Dickeya dadantii 3937 contributes to virulence and fi tness [J]. Fems Microbiology Letters,2010,302(2):151-158.
[25] 于洋洋, 劉倩倩, 徐恩麗, 胡白石. 梨火疫病菌(Erwinia amylovora)雙精氨酸運輸系統(tǒng)基因(tatC)的功能分析[J].農(nóng)業(yè)生物技術(shù)學(xué)報, 2011,19 (6): 1081-1088.
Analysis of coding region for proteins containing signal peptides ofPseudomonas syringaepv.tabaciyuexi-1 strain
WANG Tielin, LI Jing, YANG Yuwen, ZHAO Tingchang
State Key Laboratory for Biology of Plant Diseases and Insect Pests, Institute of Plant Protection, Chinese Academy of Agricultural Sciences, Beijing 100193
This paper predicted and analyzed the number, length and amino acid components in the genome ofPseudomonas syringaepv.tabaciyuexi-1, a strain of tobacco fi re blight pathogen, by using SignalP 4.0, LipoP 1.0 and TMHMM v2.0. Results showed that 432 ORFs(8.81% of all the ORFs) contained N- terminal signal peptides, of which 351 signal peptides were SPI type and 81 signal peptides were SPII type. Among the SPI peptides, length was between 11 to 42 amino acids and the majority was 22 amino acids in length. In addition,the proteins that share the same signal peptide sequences were highly conserved in the homologue analysis. This study provided candidate genes for virulence factors of the tobacco fi re blight pathogen, and promoted the efficiency for screening the virulence factors.
Pseudomonas syringaepv.tabaci; signal peptide; SignalP 4.0; LipoP 1. 0; TMHMM v2.0
王鐵霖,李晶,楊玉文,等. 煙草野火病菌Pseudomonas syringaepv. tabaciyuexi-1信號肽預(yù)測及分析[J]. 中國煙草學(xué)報,2016,22(1)
煙草病蟲害檢測與綜合治理重點開放實驗室開放課題經(jīng)費(項目號:bc2011 );中國煙草總公司科技重點項目 (項目號 110201202002 )
王鐵霖,博士,Email:wtl82@163.com
趙廷昌,研究員,Email:zhaotgcg@163.com
2015-04-23
:WANG Tielin, LI Jing, YANG Yuwen, et al. Analysis of coding region for proteins containing signal peptides ofPseudomonas syringaepv.tabaciyuexi-1 strain [J]. Acta Tabacaria Sinica, 2016,22(1)