韓長志,祝友朋,許 僖
(西南林業(yè)大學(xué)生物多樣性保護(hù)與利用學(xué)院/云南省森林災(zāi)害預(yù)警與控制重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650224)
【研究意義】為了更好地明確里氏木霉QM6a中碳水化合物活性酶功能和作用,本研究對其進(jìn)行預(yù)測,并對其數(shù)量和特征進(jìn)行分析。【前人研究進(jìn)展】CAZymes是碳水化合物活性酶類(Carbohydrate-Active Enzymes)的簡稱,作為植物絲狀真菌中重要的一類蛋白,在其生長發(fā)育過程中發(fā)揮著重要的作用。碳水化合物結(jié)構(gòu)(功能)活性酶類數(shù)據(jù)庫(Carbohydrate-Active enZYmes Database),作為一個(gè)專業(yè)描述結(jié)構(gòu)相關(guān)的酶催化或者是碳水化合物綁定或者是功能域模塊的數(shù)據(jù)庫,上述基因功能包括修飾、轉(zhuǎn)移以及水解、斷裂糖苷鍵等[1],從而有助于進(jìn)一步解析植物病原菌胞外酶細(xì)胞壁降解酶活性基因的注釋與聚類分析[2]。近些年關(guān)于CAZymes的研究呈現(xiàn)較快的增長[3]。根據(jù)最新研究成果,以涵蓋木質(zhì)纖維素降解所需要的相關(guān)酶類進(jìn)行分類,主要涉及以下6大類,糖苷水解酶(Glycoside Hydrolases, GHs)[4]、糖基轉(zhuǎn)移酶(Glycosyl Transferases, GTs)[5]、多糖裂解酶(Polysaccharide Lyases, PLs)[6]、碳水化合物酯酶(Carbohydrate Esterases, CEs)[6]、輔助酶類家族(Auxiliary Activities, AAs)[7]以及碳水化合物綁定結(jié)構(gòu)(Carbohydrate-Binding Modules, CBMs)[8]。截止2016年5月18日,CAZy數(shù)據(jù)庫中涉及上述類別酶的家族分別有135、98、24、16、13以及74個(gè)?!颈狙芯壳腥朦c(diǎn)】里氏木霉(TrichodermareeseiQM6a)作為重要的產(chǎn)纖維素酶工業(yè)用菌種之一[9],與其他木霉屬真菌所具有的抑菌功能不同,為了更好地解析該工業(yè)菌種與其他木霉內(nèi)在的差異,前期基于真菌分泌蛋白所具有的主要特征,利用SignalP、ProtComp、TMHMM、big-PI Fungal predictor、TargetP等在線分析程序?qū).reeseiQM6a中分泌蛋白進(jìn)行找尋,明確該菌中包括356個(gè)分泌蛋白?!緮M解決的關(guān)鍵問題】本研究基于上述356個(gè)分泌蛋白序列,利用CAT在線CAZymes預(yù)測工具,從而明確T.reeseiQM6a中CAZymes相關(guān)酶的不同亞家族的分布情況,以期為進(jìn)一步開展該菌CAZymes功能研究打下堅(jiān)實(shí)的理論基礎(chǔ)。
前期對T.reeseiQM6a中9143條蛋白序列(http://genome.jgi.doe.gov/TriviGv29_8_2/TriviGv29_8_2.home.html)(BioProject ID為PRJNA183001)進(jìn)行SignalP、ProtComp、TMHMM、big-PI Fungal predictor、TargetP等在線分析,明確其含有356個(gè)分泌蛋白[10]。
利用在線工具CAZymes Analysis Toolkit[2]來開展預(yù)測工作,并對預(yù)測的蛋白進(jìn)行整理、匯總。
通過CAT分析,明確里氏木霉QM6a中有201個(gè)CAZymes,其中,以GH的數(shù)量最多,有93個(gè),占46.27 %,其次是CBM,有52個(gè),占25.87 %,再次為AA、CE、PL、GT(圖1)。同時(shí),除上述含有單種酶特性外,還有部分蛋白具有兩種酶類型,即復(fù)合型,有GH/CBM、CE/CBM、AA/CBM等。由于不同的CAZymes具有不同的功能,因此,具有2種酶類型的蛋白在行使CAZymes功能方面具有多樣性特征。
93個(gè)GH蛋白分別屬于41個(gè)大類,以GH18數(shù)量最多,為8個(gè),其次為GH55、GH27、GH92,數(shù)量分別為7、6、5個(gè)(表1)。有22個(gè)GH類別僅含有1個(gè)蛋白,如GH6、GH7、GH10、GH12、GH13、GH20等,上述類別所占比例為53.66 %,其所含蛋白數(shù)量僅有22個(gè),所占比例僅為23.66 %。上述結(jié)果表明,里氏木霉QM6a中所含糖苷水解酶的類型較多,在行使糖苷水解方面發(fā)揮著重要的作用。
圖1 里氏木霉QM6a中CAZymes的分布Fig.1 Distribution of CAZymes from T. reesei QM6a
續(xù)表1 Continued table 1
不同類別TypeID數(shù)量NumberGH18jgi|Trire2|119859、jgi|Trire2|2735、jgi|Trire2|43873、jgi|Trire2|59791、jgi|Trire2|80833、jgi|Trire2|110317、jgi|Trire2|124043、jgi|Trire2|683478GH20jgi|Trire2|233461GH24jgi|Trire2|108585、jgi|Trire2|1092782GH25jgi|Trire2|1034581GH27jgi|Trire2|55999、jgi|Trire2|65986、jgi|Trire2|72632、jgi|Trire2|59391、jgi|Trire2|72704、jgi|Trire2|750156GH28jgi|Trire2|103049、jgi|Trire2|112140、jgi|Trire2|122780、jgi|Trire2|701864GH30jgi|Trire2|110894、jgi|Trire2|3094、jgi|Trire2|69276、jgi|Trire2|697364GH31jgi|Trire2|822351GH35jgi|Trire2|802401GH39jgi|Trire2|731021GH43jgi|Trire2|120784、jgi|Trire2|121136、jgi|Trire2|68064、3GH45jgi|Trire2|499761GH47jgi|Trire2|45717、jgi|Trire2|51365、jgi|Trire2|810703GH54jgi|Trire2|553191GH55jgi|Trire2|108776、jgi|Trire2|121746、jgi|Trire2|44366、jgi|Trire2|54242、jgi|Trire2|56418、jgi|Trire2|70845、jgi|Trire2|732487GH62jgi|Trire2|762101GH64jgi|Trire2|1236391GH67jgi|Trire2|725261GH74jgi|Trire2|490811GH75jgi|Trire2|42152、jgi|Trire2|66789、jgi|Trire2|703413GH79jgi|Trire2|106575、jgi|Trire2|730052GH81jgi|Trire2|732561GH89jgi|Trire2|697001GH92jgi|Trire2|111733、jgi|Trire2|55733、jgi|Trire2|60635、jgi|Trire2|69493、jgi|Trire2|741985GH95jgi|Trire2|111138、jgi|Trire2|588022GH103jgi|Trire2|1207841GH117jgi|Trire2|1093921GH127jgi|Trire2|1214751GH128jgi|Trire2|596281合計(jì)Total—93
52個(gè)CBM蛋白分屬于13個(gè)大類,以CBM1的數(shù)量最多,為12個(gè),其次是CBM50、CBM32、CBM13,數(shù)量分別為10、7、6個(gè)(表2)。除此之外,里氏木霉QM6a還具有CBM32/CBM13類型,其ID為jgi|Trire2|58880,該蛋白不僅涉及CBM32類別,也涉及CBM13類別,上述研究結(jié)果表明CBM中具體類別不同,其具有的功能也不盡相同。
通過對里氏木霉QM6a中15個(gè)輔助酶家族的分析,發(fā)現(xiàn)以AA2的數(shù)量最多,為4個(gè),其次為AA1、AA7、AA9,均為3個(gè),上述蛋白所占比例高達(dá)86.67 %(表3)。同時(shí),還涉及AA3、AA5等類型的蛋白。
通過對里氏木霉QM6a中14個(gè)CE蛋白的分析,發(fā)現(xiàn)以CE10數(shù)量最多(8個(gè)),其次是CE16(2個(gè)),上述蛋白所占比例高達(dá)71.43 %(表4)。同時(shí),還涉及CE1、CE3、CE5、CE15等蛋白,其數(shù)量均為1個(gè)。
通過對里氏木霉QM6a中5個(gè)多糖裂解酶蛋白的分析,其類別分別為PL1、PL7、PL20,數(shù)量分別為1、2、2個(gè)(表5)。
表2 里氏木霉QM6a碳水化合物綁定結(jié)構(gòu)分布情況
表3 里氏木霉QM6a中AAs的分布情況
通過對里氏木霉QM6a中4個(gè)GT蛋白的分析,其具體類別包括GT2、GT4、GT8以及GT20。在上述每個(gè)類別中,均僅含有1個(gè)蛋白,其ID分別為jgi|Trire2|69061、jgi|Trire2|104461、jgi|Trire2|108655、jgi|Trire2|72379。
表4 里氏木霉QM6a中CE蛋白分布情況
表5 里氏木霉QM6a中PL的分布情況
表6 里氏木霉QM6a中復(fù)合類型蛋白的分布情況
里氏木霉QM6a中除含有典型的GH、CBM、AA、CE、GT以外,還含有一些復(fù)合類別的蛋白,其包括以下幾種類型:AA/CBM、GH/CBM以及CE/CBM等,其中以GH/CBM居多,為14個(gè),所占比例為82.35 %(表6)。
本研究所獲得里氏木霉QM6a中CAZmes,是基于前期通過全基因組序列預(yù)測所獲分泌蛋白,同時(shí),依據(jù)現(xiàn)有網(wǎng)站所獲的CAZymes,上述蛋白是否囊括了里氏木霉QM6a中全部的CAZymes,有待于今后進(jìn)一步通過生物學(xué)試驗(yàn)進(jìn)行驗(yàn)證。同時(shí),前人對于該菌中CAZymes所報(bào)道的數(shù)量均高于本研究所得到的結(jié)果[9],就每一類中的數(shù)量報(bào)道也不盡相同,究其原因,前人所開展CAZymes的具體類別有5個(gè)(GH、PL、CE、CBM、GT),而根據(jù)最新的分類類別有6個(gè)(GH、PL、CE、CBM、GT、AA),造成具體不同類別分項(xiàng)數(shù)量方面的差異。前人對于GH、GT數(shù)量的報(bào)道分別為200、103個(gè)[9],遠(yuǎn)高于本研究所獲得的93、4個(gè),原因如何,有待進(jìn)一步明確。前期對禾谷炭疽菌、希金斯炭疽菌中CAZymes開展的蛋白預(yù)測研究,也存在著數(shù)量方面的差異[11-12]。
隨著大量植物病原菌基因組測序的完成[13-14],通過比較基因組學(xué)分析病原菌的寄生性與基因組變異的關(guān)系已經(jīng)成為研究熱點(diǎn)[15]。一般而言,植物病原絲狀真菌中的CAZymes蛋白可以作為其侵染過程中突破寄主細(xì)胞壁的非常關(guān)鍵的因素之一[16]。前人選擇一些營養(yǎng)類型不同的植物病原真菌全基因組數(shù)據(jù),通過生物信息學(xué)分析[17],明確非活體營養(yǎng)型病原菌基因組較活體營養(yǎng)型病原菌具有更多的CAZymes[16]。前人對于木霉的研究涉及在土壤的定殖規(guī)律、拮抗能力等內(nèi)容[18],然而,里氏木霉QM6a顯然不是植物病原菌,所含有的CAZymes所發(fā)揮的功能與植物病原菌不同,即同一類別蛋白在不同菌中所具有的功能不盡相同。
本研究明確里氏木霉QM6a中含有201個(gè)CAZymes蛋白,可以分為主要類別、復(fù)合類別,其中,主要類別涉及93個(gè)GHs、52個(gè)CBMs以及15個(gè)AAs、14個(gè)CEs、5個(gè)PLs、4個(gè)GTs;復(fù)合類別則涉及15個(gè)GH/CBMs、1個(gè)AA/CBMs以及2個(gè)CE/CBMs。
參考文獻(xiàn):
[1]Cantarel B L, Coutinho P M, Rancurel C, et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics[J]. Nucleic Acids Res, 2009, 37(Database issue): D233-238.
[2]Park B H, Karpinets T V, Syed M H, et al. CAZymes Analysis Toolkit (CAT): web service for searching and analyzing carbohydrate-active enzymes in a newly sequenced organism using CAZy database[J]. Glycobiology, 2010, 20(12): 1574-1584.
[3]Lombard V, Golaconda Ramulu H, Drula E, et al. The carbohydrate-active enzymes database (CAZy) in 2013[J]. Nucleic Acids Res, 2014, 42(Database issue): D490-495.
[4]Bourne Y, Henrissat B. Glycoside hydrolases and glycosyltransferases: families and functional modules[J]. Current Opinion in Structural Biology, 2001, 11(5): 593-600.
[5]Campbell J A, Davies G J, Bulone V, et al. A classification of nucleotide-diphospho-sugar glycosyltransferases based on amino acid sequence similarities[J]. Biochem J, 1997, 326 ( Pt 3):929-939.
[6]Lombard V, Bernard T, Rancurel C, et al. A hierarchical classification of polysaccharide lyases for glycogenomics[J]. Biochem J, 2010, 432(3): 437-444.
[7]Levasseur A, Drula E, Lombard V, et al. Expansion of the enzymatic repertoire of the CAZy database to integrate auxiliary redox enzymes[J]. Biotechnol Biofuels, 2013, 6(1): 41.
[8]Boraston A B, Bolam D N, Gilbert H J, et al. Carbohydrate-binding modules: fine-tuning polysaccharide recognition[J]. Biochem J, 2004, 382(Pt 3): 769-781.
[9]Martinez D, Berka RM, Henrissat B, et al. Genome sequencing and analysis of the biomass-degrading fungusTrichodermareesei(syn.Hypocreajecorina)[J]. Nat Biotechnol, 2008, 26(5): 553-560.
[10]韓長志,王 娟.基于全基因組序列預(yù)測里氏木霉QM6a的分泌蛋白[J].華中農(nóng)業(yè)大學(xué)學(xué)報(bào), 2017, 36(2): 28-32.
[11]韓長志.基于全基因組測序的禾谷炭疽菌中碳水化合物酶類蛋白預(yù)測[J].河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2016, 44(4): 118-124.
[12]韓長志.全基因組預(yù)測希金斯炭疽菌中碳水化合物酶類蛋白[J].江蘇農(nóng)業(yè)科學(xué), 2017, 45(2): 24-28.
[13]聶燕芳,周 淦,黃嘉瑤,等.尖孢鐮刀菌甜瓜?;突蚪M規(guī)模分泌蛋白的預(yù)測與分析[J].華中農(nóng)業(yè)大學(xué)學(xué)報(bào), 2016, 35(3): 24-29.
[14]李云鋒,聶燕芳,王振中.植物病原真菌分泌蛋白質(zhì)組學(xué)研究進(jìn)展[J].微生物學(xué)通報(bào), 2015, 42(6): 1101-1107.
[15]Schmidt S M, Panstruga R. Pathogenomics of fungal plant parasites: what have we learnt about pathogenesis?[J]. Curr Opin Plant Biol, 2011, 14(4): 392-399.
[16]韓長志,許 僖.植物病原絲狀真菌分泌蛋白及CAZymes的研究進(jìn)展[J].南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2017, 41(5): 152-160.
[17]陳相永,陳捷胤,肖紅利,等.植物病原真菌寄生性與分泌蛋白組CAZymes的比較分析[J].植物病理學(xué)報(bào), 2014, 44(2): 163-172.
[18]杜嬋娟,付 崗,潘連富,等.哈茨木霉gz-2菌株在土壤中的定殖規(guī)律研究[J].西南農(nóng)業(yè)學(xué)報(bào), 2016, 29(1): 138-142.