王鐵霖 嚴(yán)婉榮 閆莎莎 楊玉文 趙廷昌
摘要:利用signal3.0、LipoP和TargetP對(duì)瓜類果斑病菌Acidovorax avenar subsp.citrulli AACOO-1菌株基因組中4709個(gè)ORFs進(jìn)行分析,對(duì)該病菌基因組中信號(hào)肽的數(shù)量、長(zhǎng)度和氨基酸組成進(jìn)行了預(yù)測(cè),并對(duì)其進(jìn)行分類。結(jié)果確定其中476個(gè)0RFs所編碼的N-端有信號(hào)肽序列,占全部ORFs的10.10%。信號(hào)肽長(zhǎng)度為14~48個(gè)氨基酸,以20~35個(gè)氨基酸居多,26個(gè)氨基酸的信號(hào)肽最多。組成信號(hào)肽的氨基酸中,非極性氨基酸占47.80%,極性氨基酸占23.04%,帶負(fù)電荷的酸性氨基酸占15.87%,帶正電荷的堿性氨基酸占8.73%。預(yù)測(cè)的476條信號(hào)肽中,有384條分泌型信號(hào)肽(SPI),40條脂蛋白型信號(hào)肽(SPH),51條TMHI型信號(hào)肽和1條CYT型信號(hào)肽。在分泌型信號(hào)肽中,有96個(gè)信號(hào)肽具有RR-motif的保守區(qū)段。
關(guān)鍵詞:Acidovorax citrulli;信號(hào)肽:分析
細(xì)菌性果斑病是發(fā)生在甜瓜、西瓜等葫蘆科植物上的一種嚴(yán)重的世界性病害。其病原是嗜酸菌屬西瓜種(Acidovorax citrulli)。此病是一種毀滅性病害,一旦發(fā)生可造成嚴(yán)重的經(jīng)濟(jì)損失。2007年1月14日,US DOE Joint Genome Institute的Copeland A,Lucas S等完成對(duì)菌株Acidovorax avenoe subsp.cit-rulli AACOO-1全基因組的測(cè)序工作(NC 008752),其中有4709個(gè)ORFs能夠編碼蛋白。
信號(hào)肽一般由10~60個(gè)氨基酸殘基組成,被1個(gè)疏水中心區(qū)(H-region)分為3個(gè)部分,即N結(jié)構(gòu)域、H結(jié)構(gòu)域、C結(jié)構(gòu)域。疏水中心區(qū)(H-region)主要由疏水氨基酸(亮氨酸L,纈氨酸V,異亮氨酸I)構(gòu)成;C區(qū)有著更強(qiáng)的極性,這個(gè)區(qū)域極性氨基酸(蘇氨酸T,絲氨酸S等)的分布較其他2個(gè)區(qū)更多:N一末端為帶正電荷的堿性氨基酸殘基。疏水中心區(qū)根據(jù)信號(hào)肽氨基酸組成及切割位點(diǎn)信號(hào)肽識(shí)別序列的不同,將信號(hào)肽分為信號(hào)肽酶I型(SPI)、信號(hào)肽酶Ⅱ型(SPII)、CYT型信號(hào)肽及TMHI型信號(hào)肽4種類型。
Signal基于神經(jīng)網(wǎng)絡(luò)方法和隱馬可夫模型2種算法預(yù)測(cè)信號(hào)肽剪切位點(diǎn):LipoP以預(yù)測(cè)SPII型為主,即脂蛋白的數(shù)量、切割位點(diǎn)及切割位點(diǎn)后+2位上氨基酸的種類,同時(shí)根據(jù)分析可以預(yù)測(cè)蛋白質(zhì)的類型;TargetP主要預(yù)測(cè)蛋白質(zhì)到達(dá)的亞細(xì)胞位點(diǎn)。這3種軟件雖然各有側(cè)重。但它們所得到的結(jié)果卻有很大的相關(guān)性,經(jīng)證明對(duì)于信號(hào)肽預(yù)測(cè),蛋白質(zhì)功能和蛋白質(zhì)分泌位點(diǎn)的預(yù)測(cè)簡(jiǎn)單且較為可靠。
本研究利用這3種計(jì)算機(jī)預(yù)測(cè)方法對(duì)植物病原細(xì)菌Acidovorax avenae subsp.citrulli AACOO-1全基因組進(jìn)行信號(hào)肽預(yù)測(cè)分析。
1材料和方法
1.1實(shí)驗(yàn)材料
從NCBI(http://www.ncbi.nlm.nih.gov/nuccore/NC_008752)上獲得Acidovorax avenae subsp.citrulliAACOO-1的全基因組序列、ORFs的功能注釋等相關(guān)信息。
1.2預(yù)測(cè)方法
利用http://www.cbs.dtu.dk/services提供的Sig-nal 3.0、TargetP 1.01和LipoP 1.0分析Acidovoraxavenae subsp.citrulli AACOO-1菌株基因組中全部ORFs的N端氨基酸序列。
(1)Signal 3.0(http://www.cbs.dtu.dk/services/SignalP/)在Gram-negative bacteria狀態(tài)下預(yù)測(cè)所有ORFs的N端氨基酸序列,預(yù)測(cè)是否存在信號(hào)肽。記錄神經(jīng)網(wǎng)絡(luò)方法獲得每個(gè)ORF的Cmax值、Ymax值、Smax值、Smean值、D值及其位點(diǎn)和應(yīng)用隱馬可夫模型的Cmax值及Sprob值。根據(jù)軟件的默認(rèn)選擇,將神經(jīng)網(wǎng)絡(luò)方法分析獲得D值>0.44和隱馬可夫模型獲得的Cmean值>0.5的ORFs確定為具有信號(hào)肽的ORFs。同時(shí),以神經(jīng)網(wǎng)絡(luò)方法分析獲得Ymax的切割位置作為切割位點(diǎn)。
(2)LipoP 1.0(http://www.cbs.dtu.dk/services/LipoP/)分析N端氨基酸序列,預(yù)測(cè)蛋白質(zhì)類型。
(3)TargetP 1.0.1(http://www.cbs.dtu.dk/services/TargetP/)分析Acidovorax avenae subsp.citrulli AACOO-1預(yù)測(cè)分泌蛋白所到達(dá)的亞細(xì)胞位點(diǎn)。
1.3統(tǒng)計(jì)分析
將從Signal,LipoP和TargetP中獲取的數(shù)據(jù)用Excel軟件進(jìn)行相關(guān)數(shù)據(jù)的統(tǒng)計(jì)分析。
2結(jié)果與分析
綜合Signal,LipoP和TargetP預(yù)測(cè)結(jié)果,對(duì)Aci-dovorax avenae subsp.citrulli AACOO-1編碼蛋白基因序列分析結(jié)果如下:
2.1信號(hào)肽數(shù)量和長(zhǎng)度
經(jīng)預(yù)測(cè),有476個(gè)ORFs具有信號(hào)肽,占全部ORFs的10.10%。信號(hào)肽所在的ORFs長(zhǎng)度最小為14個(gè)氨基酸殘基,最大為971個(gè)氨基酸殘基,平均303個(gè)氨基酸殘基,ORFs分布在301-400個(gè)氨基酸范圍內(nèi)數(shù)量最多,201~300個(gè)氨基酸范圍內(nèi)數(shù)量次之,100-400個(gè)氨基酸共占總數(shù)的76.89%(圖1)。信號(hào)肽長(zhǎng)度在14~48個(gè)氨基酸之間,以20~35個(gè)氨基酸居多,其中長(zhǎng)度為26個(gè)氨基酸的信號(hào)肽最多,共34條,占7.14%(圖2)。
2.2信號(hào)肽氨基酸組成
對(duì)組成信號(hào)肽的氨基酸種類作了系統(tǒng)的統(tǒng)計(jì)分析(表1),發(fā)現(xiàn)組成信號(hào)肽的氨基酸中非極性氨基酸占47.80%,極性氨基酸占23.04%:帶負(fù)電荷的酸性氨基酸占15.87%,帶正電荷的堿性氨基酸占8.73%;含量最多的3種氨基酸依次為丙氨酸(A)、亮氨酸(L)和絲氨酸(S),最少的氨基酸是谷氨酸(E);在切割位點(diǎn)-1端的氨基酸中85.8%均為丙氨酸(A),在切割位點(diǎn)+1~+3位中最多的氨基酸也是丙氨酸(A)。
2.3氨基酸種類分析
經(jīng)LipoP分析,根據(jù)信號(hào)肽氨基酸組成及切割位點(diǎn)信號(hào)肽識(shí)別序列的不同將信號(hào)肽分為4種類型:信號(hào)肽酶I型(SPI)、信號(hào)肽酶Ⅱ型(SPII)、CYT型及TMHI型信號(hào)肽。其中384條SPI型信號(hào)肽,40條SPH型信號(hào)肽,51條TMHI型信號(hào)肽和1條CYT型信號(hào)肽。
2.3.1信號(hào)肽酶I型(SPI型)
2.3.1.1分泌類信號(hào)肽(Sec-type) Sec-type的典型結(jié)構(gòu):N-端由2~3個(gè)帶正電荷的氨基酸(K或R)組成,也有的由5~11個(gè)帶正電荷的氨基酸組成。H-domain由平均19個(gè)氨基酸構(gòu)成。C-domain(切
割位點(diǎn)前3位的氨基酸)典型結(jié)構(gòu)為A-X-A(A為丙氨酸,X指任意一種氨基酸)。在預(yù)測(cè)分析的384條SPI型信號(hào)肽中,有265條在C-domain中出現(xiàn)A-X-A典型結(jié)構(gòu),信號(hào)肽長(zhǎng)度在16~50個(gè)氨基酸,其所在ORFs的長(zhǎng)度在62~762個(gè)氨基酸。根據(jù)TargetP的結(jié)果確定,其分泌途徑及亞細(xì)胞位點(diǎn)為s的(即分泌到周質(zhì)空間)占87.32%,m的(即分泌到線粒體中)占9.76%,未確定分泌位點(diǎn)的占2.92%。
2.3.1.2 RR-motif信號(hào)肽RR-motif類信號(hào)肽是指在信號(hào)肽中含有RR-X-##(X為任意氨基酸,##指疏水氨基酸)的保守序列。通過(guò)分析發(fā)現(xiàn)96個(gè)信號(hào)肽具有RR-motif保守區(qū)段信號(hào)肽長(zhǎng)度在20~45個(gè)氨基酸之間。在##中,亮氨酸(L)出現(xiàn)的頻率最高,占32.29%。其中有67個(gè)信號(hào)肽在C-domain(切割位點(diǎn)前3位的氨基酸,即-3~-1位)中出現(xiàn)A-X-A典型結(jié)構(gòu)(表2)。根據(jù)TargetP的結(jié)果確定分泌蛋白的分泌途徑及所到達(dá)的亞細(xì)胞位點(diǎn)為s的占46.27%,m的占52.23%,未確定的占1.49%。
2.3.2脂蛋白型信號(hào)肽SPII型分泌蛋白信號(hào)肽也稱為脂蛋白信號(hào)肽,其典型結(jié)構(gòu)C-domain為:L-(A/S)-(A/G),在切割位點(diǎn)后+1位氨基酸為半胱氨酸(C),這樣就形成了保守的L-(A/S)-(A/G)-C的Li-pobox典型結(jié)構(gòu)。該結(jié)構(gòu)使脂蛋白被切割后依然能夠錨定在質(zhì)膜上。該類信號(hào)肽通常比分泌型信號(hào)肽短。通過(guò)分析預(yù)測(cè)有40條脂蛋白型信號(hào)肽(表3),其長(zhǎng)度在14~33個(gè)氨基酸之間,信號(hào)肽-1~-3位出現(xiàn)的氨基酸種類按數(shù)量多少依次為丙氨酸(A)、亮氨酸(L)、甘氨酸(G)、蘇氨酸(T)、絲氨酸(s)和蛋氨酸(M)。其中具Li-pobox典型結(jié)構(gòu)的信號(hào)肽有23個(gè),共占脂蛋白類信號(hào)肽的57.50%,其酶切位點(diǎn)的-1~-3位字體加粗表示。酶切割位點(diǎn)-1位上的丙氨酸占40.00%,-3位上的亮氨酸占85.00%。
2.3.3 TMHI型信號(hào)肽和CYT型信號(hào)肽經(jīng)預(yù)測(cè),有51條TMH I型信號(hào)肽蛋白,占全部基因組的1.08%,長(zhǎng)度在19-40個(gè)氨基酸之間:有1條CYT型切割位點(diǎn)進(jìn)行預(yù)測(cè),預(yù)測(cè)值表示為Smean和Dscore;后者主要是對(duì)該氨基酸序列是否具有信號(hào)肽進(jìn)行分析和預(yù)測(cè),同時(shí)也對(duì)信號(hào)肽切割位點(diǎn)及分布進(jìn)行預(yù)測(cè),預(yù)測(cè)值表示為Cmax。這幾個(gè)重要參數(shù)在信號(hào)肽的判斷上存在著一定的差異。為了保證結(jié)果的可靠性,選用上述參數(shù)的統(tǒng)一標(biāo)準(zhǔn)進(jìn)行預(yù)測(cè),以便提高預(yù)測(cè)結(jié)果的可靠性。同時(shí),利用不同軟件對(duì)同一基因組進(jìn)行分析,其結(jié)果也會(huì)有所差異,例如。用Signal3.0對(duì)全基因組預(yù)測(cè)有478條
信號(hào)肽。而用LipoP軟件預(yù)測(cè)為476條,Aave-0814(ref 969186)和Aae-4152(ref 972467)沒(méi)有信號(hào)肽結(jié)構(gòu),并且信號(hào)肽長(zhǎng)度預(yù)測(cè)也略有不同。這也是由于不同軟件所使用的算法不同。因此,通過(guò)多種軟件同時(shí)對(duì)1個(gè)基因組蛋白進(jìn)行嚴(yán)格篩選分析,可有效提高預(yù)測(cè)的準(zhǔn)確性,
用TargetP分析Acidovorax avenar subsp.citrulliAACOO-1信號(hào)肽分泌蛋白亞細(xì)胞器分布時(shí)發(fā)現(xiàn),分泌蛋白的分泌途徑及所到達(dá)的亞細(xì)胞位點(diǎn)為S型分泌途徑,即分泌到周質(zhì)空間中占87.32%,M型分泌途徑,即分泌蛋白位于線粒體的占9.76%。未確定的占2.92%。S型分泌途徑占有較大比例,這反映了“革蘭氏陰性菌分泌蛋白通常直接分泌到周質(zhì)空間和細(xì)胞膜外”理論的正確性。
4.結(jié)論
瓜類細(xì)菌性果斑病菌Acidovorax avenae subsp.citrulli AACOO-1作為一種重要的植物病原細(xì)菌,基因組中保留如此眾多的潛在分泌蛋白,表明該類蛋白具有重要的生理功能。本實(shí)驗(yàn)利用Signal 3.0、LipoP和TargetP對(duì)瓜類果斑病菌Acidovorax avenaesubsp.citrulli AACOO-1菌株基因組中4709個(gè)ORFs進(jìn)行分析,對(duì)該病菌基因組中信號(hào)肽的數(shù)量、長(zhǎng)度和氨基酸組成進(jìn)行了預(yù)測(cè),并對(duì)其進(jìn)行了分類。證實(shí)這些蛋白中哪些是真正的分泌蛋白。在什么條件下分泌哪些蛋白到菌體外。并分析分泌到菌體外的蛋白在與寄主、環(huán)境互作中有什么作用,有助于更完整系統(tǒng)地研究該病原菌的基因組特性,同時(shí)對(duì)進(jìn)一步了解該病原菌的生物學(xué)特性、致病性,以及病原與寄主的互作等特性也很有幫助。