訾臣 曾德新 蔣魯巖 袁飛 蔣原 薛峰
摘要[目的]對空腸彎曲菌空腸彎曲菌flaA基因的序列及功能進(jìn)行預(yù)測分析。[方法]分析了多個空腸彎曲菌flaA核酸及氨基酸序列組成和序列差異性;預(yù)測分析了flaA基因密碼子使用偏好性、蛋白結(jié)構(gòu)和功能域、FlaA與相關(guān)功能蛋白的互作情況。
[結(jié)果]不同菌株的flaA基因序列存在差異性,且差異主要存在于序列的中間區(qū)域。不同空腸彎曲菌菌株的同一基因在密碼子選擇上存在差異。FlaA與多個蛋白存在不同形式的相互作用。[結(jié)論]該研究可為空腸彎曲菌flaA基因序列分析和功能研究應(yīng)用提供基礎(chǔ)和依據(jù)。
關(guān)鍵詞空腸彎曲菌;flaA基因;密碼子偏好;蛋白結(jié)構(gòu)域;蛋白互作
中圖分類號S188文獻(xiàn)標(biāo)識碼
A文章編號0517-6611(2017)32-0156-05
Analysis of Gene Sequence and Function Prediction of flaA in Campylobacter jejuni
ZI Chen1,2,ZENG Dexin1,JIANG Luyan1 et al(1.APFIC,Jiangsu EntryExit Inspection and Quarantine Bureau,Nanjing,Jiangsu 210019;2.College of Veterinary Medicine,Nanjing Agricultural University,Nanjing,Jiangsu 210095)
Abstract[Objective] To analyze and predict gene sequence and function of flaA in Campylobacter jejuni.[Method] The composition and variation of multiple nucleotide sequences and amino acid sequences of flaA were analyzed.The analyses of codon preference,protein structure and function domains,and proteinprotein interactions were performed.[Result]Gene sequence of flaA of different strains existed difference,the difference mainly existed in the intermediate region of the sequence.There were differences in codon choice on the same gene of different C.jejuni strains.FlaA interacted with multiple proteins in different forms.[Conclusion]The study provides the basis and foundation for the flaA gene analysis and function research of C.jejuni.
Key wordsCampylobacter jejuni;flaA gene; Codon preference; Protein domain; Protein interaction
基金項(xiàng)目訾臣(1985—),男,山東臨沂人,博士,從事食源性微生物致病機(jī)制研究。
作者簡介國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局科技計(jì)劃項(xiàng)目(2016IK131);江蘇省出入境檢驗(yàn)檢疫局科研項(xiàng)目(2017KJ46);南京農(nóng)業(yè)大學(xué)科研資助項(xiàng)目(804121);質(zhì)檢公益性行業(yè)科研專項(xiàng)(201510038)。
收稿日期2017-09-08
空腸彎曲菌(Campylobacter jejuni,CJ)屬于螺旋菌科彎曲菌屬,為革蘭染色陰性菌,是世界范圍內(nèi)食物源性胃腸炎的主要病原菌之一,該病原菌主要通過禽肉等肉類食物傳播[1]。空腸彎曲菌的致病機(jī)制中會有許多毒力因子的參與,其中鞭毛蛋白是其在動物腸道黏附和定殖的重要功能結(jié)構(gòu)[2]。鞭毛蛋白由2個基因組成,即flaA 和flaB,研究發(fā)現(xiàn)flaA基因與空腸彎曲菌侵襲功能有關(guān)[3]。該研究通過分析多個flaA基因和氨基酸組成特點(diǎn),預(yù)測flaA基因密碼子偏好性特點(diǎn)、亞細(xì)胞定位、蛋白結(jié)構(gòu)和功能域、互作蛋白等,為空腸彎曲菌的flaA遺傳分化和功能研究提供依據(jù)。
1材料與方法
1.1flaA基因序列遺傳差異分析
通過數(shù)據(jù)庫獲得多個菌株完整的flaA基因cds序列,比對分析各菌株核酸序列組成及遺傳信息差異情況。
1.2flaA基因密碼子偏好分析
利用CodonW在線程序[4]分析空腸彎曲菌flaA基因堿基組成、密碼子使用偏好性。
1.3FlaA亞細(xì)胞定位分析
基于SVM分類方法,CELLO軟件基于氨基酸的生理生化特性使用氨基酸組成(the amino acid composition)、二肽成分(the dipeptide composition)、分段氨基酸組成(the partitioned amino acid composition)、序列組成(the sequence composition) 等4種序列編碼策略對FlaA進(jìn)行亞細(xì)胞定位分析[5]。
1.4FlaA蛋白修飾位點(diǎn)及功能域分析
利用在線軟件Motif Scan(http://hits.isbsib.ch/cgi-bin/PFSCAN)預(yù)測NCTC 11168和D2640菌株FlaA蛋白序列修飾位點(diǎn)及結(jié)構(gòu)域情況。
1.5FlaA互作蛋白預(yù)測分析
通過在線軟件STRING(https://stringdb.org/)預(yù)測與空腸彎曲菌FlaA存在相互作用的蛋白,并分析相應(yīng)蛋白的功能特點(diǎn)。
2結(jié)果與分析
2.1空腸彎曲菌flaA基因序列遺傳差異將空腸彎曲菌NCTC 11168菌株的flaA基因序列與NCBI核酸序列數(shù)據(jù)庫進(jìn)行Blast,結(jié)果獲得空腸彎曲菌flaA基因相關(guān)序列共49個,對其進(jìn)行核酸序列與氨基酸序列進(jìn)化樹分析,結(jié)果見圖1、2。與NCTC 11168相比核酸序列遺傳差異最大的是ICDCCJ07001、
圖1空腸彎曲菌flaA基因核酸序列進(jìn)化樹
Fig.1The evolutionary tree of flaA nucleotide sequences of Campylobacter jejuni
RM3196和RM3197(后三者序列完全一致),遺傳距離為0.226,其次為F38011,遺傳距離為0.222,D2640排第4位,為0.214;與NCTC 11168相比氨基酸序列遺傳差異最大的是D2640,遺傳距離為0.199,其次為CDCCJ07001、RM3196和RM3197,遺傳距離為 0.198。
利用Blast比對軟件對所有氨基酸序列比對分析,發(fā)現(xiàn)氨基酸序列差異主要位于序列中部區(qū)域(180 ~ 480 aa),結(jié)果見圖3。
2.2flaA基因密碼子偏好性
通過氨基酸序列的進(jìn)化樹分析可知NCTC 11168和D2677菌株遺傳差異最大。根據(jù)Codon Usage Database數(shù)據(jù)庫可知空腸彎曲菌NCTC 11168菌株的密碼子使用情況,編碼序列中GC含量為30.83%,密碼子第1位堿基GC比例為42.70%,第2、3位分別為30.44%和19.35%。該研究所分析的NCTC 11168和D2640菌株的flaA編碼序列GC比例分別為37.00%、35.24%,均高于基因組水平(表1);flaA基因密碼子第1、2位GC含量均高于基因組水平,尤其是第2位GC含量接近甚至超過第1位的
比例,分別為44.71%、46.02%,該基因堿基成分比例與空
腸彎曲菌基因組水平的堿基使用存在差異。
進(jìn)一步的密碼子偏好性分析發(fā)現(xiàn),NCTC 11168和D2640的flaA基因分別對25和24種密碼子具有偏好性(RSCU>1),存在偏好性差異的密碼子為ATT、ATC、GTA、CCA,其中D2640編碼脯氨酸(CCA-Pro),而NCTC 11168不編碼該氨基酸。flaA基因密碼子第3位偏好使用T,幾乎所有同一密碼子中,均為T3的比例最高,除了NCTC 11168菌株的異亮氨基酸(Ile)偏好使用ATC而不是ATT(表2)。Codon Usage Database數(shù)據(jù)庫中5個空腸彎曲菌株全基因組水平Ile氨基酸的密碼子偏好順序均依次為ATT、ATA、ATC,分析結(jié)果顯示,D2640菌株flaA編碼Ile氨基酸的密碼子偏好性與全基因組水平相同,而NCTC 11168依次為ATC、ATA、ATT,偏好使用ATC編碼Ile氨基酸,說明不同菌株的flaA對Ile氨基酸編碼存在密碼子偏好性差異。
2.3FlaA亞細(xì)胞定位
NCTC 11168菌株FlaA蛋白亞細(xì)胞定位預(yù)測結(jié)果:內(nèi)膜(inner membrane) (0.056),外膜(outer membrane) (1.196),周質(zhì)(periplasmic) (0.075),胞外(extracellular) (3.654),胞質(zhì)(cytoplasmic) (0.019),胞外和外膜定位的預(yù)測值為3.654和1.196,且達(dá)到顯著水平。預(yù)測結(jié)果說明該蛋白為分泌表達(dá)的外膜結(jié)構(gòu)成分,結(jié)果與鞭毛蛋白結(jié)構(gòu)及亞細(xì)胞定位特征一致。
2.4FlaA氨基酸修飾位點(diǎn)和功能域
在2個菌株中預(yù)測到可能發(fā)揮糖基化的天冬酰胺位點(diǎn)數(shù)分別為7和13個,CK2磷酸化位點(diǎn)數(shù)分別為8和9個,PKC磷酸化位點(diǎn)數(shù)分別為12和10個,烷基化位點(diǎn)數(shù)分別為23和26個。NCTC 11168菌株FlaA 的395~457區(qū)域有21個絲氨酸殘基,為絲氨酸富集區(qū)域;D2640菌株在398~641區(qū)域有21個絲氨酸殘基;二者的絲氨酸富集程度高度相似,而兩者在絲氨酸富集區(qū)域其他氨基酸組成差異較大,處于遺傳差異區(qū)域,說明此處富集的絲氨酸在FlaA蛋白功能中具有重要作用。二者具有相同的Flagellin N、Flagellin IN、Flagellin C結(jié)構(gòu)域。Flagellin N和Flagellin C結(jié)構(gòu)域?yàn)閮啥吮J貐^(qū)域,F(xiàn)lagellin IN所處的中間區(qū)域保守性相對較低(圖4和表3)。
2.5FlaA蛋白互作及功能分析
測到空腸彎曲菌FlaA與FliS等10個蛋白存在互相作用(圖5),其中參與鞭毛組分的蛋白有FliS、FlgE2、FliD、FlgE、FlgK、FlhA、FlaG等,Cj1340c是一種運(yùn)動輔助因子(Motility accessory factor),F(xiàn)liA是鞭毛操縱子的RNA聚合酶σ因子,PseE參與蛋白的糖基化修飾?;プ餍问街饕朽徑饔?、融合作用、基因共現(xiàn)等,其中與FliS、PseE、FliD、FlhA、Cj1340C等互作已有相關(guān)試驗(yàn)驗(yàn)證。
3討論
研究發(fā)現(xiàn)通過修復(fù)flaA和flaB突變體中的FlaA功能,鞭毛結(jié)構(gòu)、菌體運(yùn)動力、定殖和侵入以及毒力蛋白分泌等功能都得以恢復(fù),可見鞭毛蛋白基因flaA在空腸彎曲菌腸道致病過程中的重要作用[6]。對其基因序列及相關(guān)功能域等進(jìn)行分析,有利于對其相關(guān)功能的研究。該研究結(jié)合數(shù)據(jù)庫中的序列信息資源,分析多條空腸彎曲菌flaA基因核酸和氨基酸序列組成情況及保守性,結(jié)果發(fā)現(xiàn)不同菌株的flaA基因序列存在差異性,且差異主要存在于序列的中間區(qū)域。
基因編碼信息遵循“中心法則”:由DNA序列轉(zhuǎn)錄為mRNA序列,并最終翻譯成氨基酸序列。每3個核酸組成1個密碼子并決定1個氨基酸,每個氨基酸可對多個密碼子,而特定物種或某些基因的特定位點(diǎn)氨基酸對某種密碼子的使用存在偏好性[7]??漳c彎曲菌flaA基因序列中GC含量高于基因組水平,說明相對于全基因組水平flaA主要偏好使用含G/C的密碼子,而且flaA基因密碼子第1和第2位GC含量均高于基因組水平,第3位偏好使用T。NCTC 11168和D2640的flaA基因存在4個偏好性差異的密碼子,說明不同空腸彎曲菌菌株的同一基因在密碼子選擇上存在差異。對堿基組成和密碼子偏好性進(jìn)行分析,有助于構(gòu)建優(yōu)化的基因外源表達(dá)模型。
氨基酸發(fā)生糖基化/磷酸化/烷基化等修飾會影響蛋白質(zhì)的空間結(jié)構(gòu)形成和功能發(fā)揮。分析結(jié)果顯示flaA基因存在多個修飾和功能位點(diǎn),說明其在合成及功能形成過程中可能受多種形式的氨基酸位點(diǎn)修飾,在其發(fā)揮特定功能中至關(guān)重要。很多蛋白質(zhì)不是獨(dú)立發(fā)揮作用,而需要通過與其他結(jié)構(gòu)蛋白或者功能蛋白直接或間接作用,或形成蛋白質(zhì)復(fù)合物在某些生物過程中發(fā)揮相應(yīng)的生物學(xué)功能。鞭毛由多種結(jié)構(gòu)蛋白組成,在其組成和發(fā)揮功能的過程中有其他多種功能蛋白的參與,因此對FlaA互作蛋白的預(yù)測分析有利于揭示鞭毛的組成情況,有助于其功能機(jī)制的研究。蛋白互作分析結(jié)果顯示,F(xiàn)laA與多個蛋白存在不同形式的相互作用?;プ鞯鞍字饕獮閰⑴c鞭毛組分的蛋白FliS、FlgE2、FliD、FlgE、FlgK、FlhA、FlaG等,這與FlaA及其他鞭毛蛋白在鞭毛組裝及功能發(fā)揮中的作用相一致;與運(yùn)動輔助因子Cj1340c存在相互作用[8],說明FlaA參與鞭毛運(yùn)動過程;FliA是作用于鞭毛操縱子的RNA聚合酶σ因子,分析表明FlaA表達(dá)受FliA調(diào)控;研究認(rèn)為PseE 可能參與了鞭毛蛋白的糖基化修飾[9],這與FlaA糖基化修飾位點(diǎn)的預(yù)測結(jié)果相呼應(yīng),提示對相應(yīng)位點(diǎn)深入研究的必要性和方向性。
對細(xì)菌致病基因遺傳信息和蛋白功能的預(yù)測分析是研究病原菌致病機(jī)制的必要基礎(chǔ),該研究基于空腸彎曲菌flaA基因序列信息,利用多種預(yù)測軟件和分析方法,系統(tǒng)分析了flaA基因序列和功能特點(diǎn),可為其基因功能和致病性研究以及相關(guān)功能基因分析提供基礎(chǔ)依據(jù)。
參考文獻(xiàn)
[1]
BLACK R E,LEVINE M M,CLEMENTS M L,et al.Experimental Campylobacter jejuni infection in humans[J].J Infect Dis,1988,157(3):472-479.
[2] AGUEROROSENFELD M E,YANG X H,NACHAMKIN I.Infection of adult syrian hamsters with flagellar variants of Campylobacter jejuni[J].Infect Immun,1990,58:2214-2219.
[3] WASSENAAR T M,BLEUMINKPLUYM NM,VAN DER ZEIJST B A.Inactivation of Campylobacter jejuni flagellin genes by homologous recombination demonstrates that flaA but not flaB is required for invasion[J].EMBO J,1991,10(8):2055-2061.
[4] PEDEN J F.Analysis of codon usage[D].Nottingham:University of Nottingham,1999.
[5]
YU C S,LIN C J,HWANG J K.Predicting subcellular localization of proteins for Gramnegative bacteria by support vector machines based on n-peptide compositions[J].Protein Sci,2004,13(5):1402-1406.
[6] KONKEL M E,KLENA J D,RIVERAAMILL V,et al.Secretion of virulence proteins from Campylobacter jejuni is dependent on a functionlal flagellar export apparatus[J].J Bacteriol,2004,186(11):3296-3303.
[7] 吳憲明,吳松鋒,任大明,等.密碼子偏性的分析方法及相關(guān)研究進(jìn)展[J].遺傳,2007,29(4):420-426.
[8] GOLDEN N J,ACHESON D W.Identification of motility and autoagglutination Campylobacter jejuni mutants by random transposon mutagenesis[J].Infect Immun,2002,70(4):1761-1771.
[9] MCNALLY D J,HUI J P,AUBRY A J,et al.Functional characterization of the flagellar glycosylation locus in Campylobacter jejuni 81-176 using a focused metabolomics approach[J].J Biol Chem,2006,281(27):18489-18498.