柴倩囡 韓彥弟 張富霞 王文麗 邵莉桃 王璐杰漢佳昕 胡 嬌 牛 鑫,*
(1.河西學院甘肅省應用真菌工程實驗室/甘肅省食用菌遺傳育種重點實驗室/祁連山食用菌產(chǎn)業(yè)協(xié)同創(chuàng)新中心;2.河西學院農(nóng)業(yè)與生態(tài)工程學院;3.河西學院生命科學與工程學院,甘肅 張掖 734000)
我國農(nóng)作物秸稈的產(chǎn)量巨大,每年有8億t左右,約占全球總量的20%[1].秸稈主要由纖維素、半纖維素、木質素及少量細胞壁蛋白組成,其中纖維素約占秸稈干重的40%到50%[1,2].目前,我國秸稈的利用率不高,絕大部分丟棄于農(nóng)田或就地焚燒,不僅污染環(huán)境還浪費自然資源[3,4].纖維素是一種由D型葡萄糖通過β-1,4-糖苷鍵形成的直鏈均聚物,聚合度在3000以上,是自然界中最豐富的可再生資源[5].因此,如何將纖維素轉化為燃料、生物塑料和酶等高附加值產(chǎn)品成為當前研究的熱點,而真菌是生產(chǎn)纖維素酶的首選[6].灰蓋擬鬼傘是一種食用真菌[7],屬于中高溫菌,喜濕熱環(huán)境,簡單易培養(yǎng),僅兩周即可完成整個生活史,其天然培養(yǎng)基為馬糞[8],能夠僅利用稻草秸稈為培養(yǎng)基生長并產(chǎn)生子實體,但因其子實體較小,且易自溶,因此,其栽培和食用價值有限.灰蓋擬鬼傘屬于白腐真菌能降解纖維素和木質素,可用于秸稈或園林綠化廢棄物等的固體發(fā)酵[9].
纖維素酶是多種水解酶的統(tǒng)稱,根據(jù)作用方式和對底物的特異性,可分為內(nèi)切葡聚糖酶(EC 3.2.1.4)、外切葡聚糖酶(EC 3.2.1.74和EC 3.2.1.91)和β-葡糖苷酶(EC 3.2.1.21)[10].內(nèi)切葡聚糖酶通過隨機作用于纖維素鏈生成纖維寡糖,外切葡聚糖酶裂解纖維素鏈末端生成纖維二糖[11].纖維二糖通過纖維二糖酶(亦稱β-葡糖苷酶)水解生成葡萄糖[12].三種酶通過協(xié)同機制高效地分解纖維素類生物質.內(nèi)切葡聚糖酶存在于許多糖基水解酶家族,通常真菌內(nèi)切葡聚糖酶含有CBM1s 模塊,主要分布在GH5、7、9、12和45等家族中[13].GH9家族成員大部分具有纖維素酶活性,GH9糖苷水解酶家族以前被稱為“纖維素酶家族E”[14].一些來自梭狀芽胞桿菌屬(Clostridia)[15]和擬桿菌屬(Bacteroides)[16,17]的GH9成員被證明具有內(nèi)切木葡聚糖酶(EC 3.2.1.151)或混合鍵連的內(nèi)切葡聚糖酶(EC 3.2.1.73)活性.另外,在該家族中成員中也發(fā)現(xiàn)具有外切-β-氨基葡萄糖酶(EC 3.2.1.165)[15,18].GH9家族的所有持續(xù)性內(nèi)切葡聚糖酶都包含一個3c CBM結構,并嚴格地附著在GH9催化結構域的c端.該結構域是活性位點的一部分,并且對持續(xù)水解至關重要[19].CBM3c結構域與纖維素的結合很弱,因為它們?nèi)狈σ恍┍J氐姆枷阕鍤埢?,而這些殘基在3a和3b家族成員中對纖維素結合很重要[20].所有已知的植物纖維素酶都屬于GH9,其他大多數(shù)GH9成員分布在真細菌中,但也有兩個古細菌成員和一些真菌、蚯蚓、節(jié)肢動物、脊索動物、棘皮動物和軟體動物成員中鑒定到GH9家族水解酶.GH9中有兩個亞群E1和E2,E1只包含來自細菌的纖維素酶,包括來自好氧菌和厭氧菌的纖維素酶,E2包含一些細菌和所有非細菌纖維素酶[21].進化研究表明,真核生物GH9成員包含兩個古老的單系群:一個包括所有動物成員,另一個包括所有植物成員[22].所有已知的持續(xù)性內(nèi)切葡聚糖酶基因都屬于E1亞組.迄今為止,已研究的大多數(shù)植物GH9家族水解酶都是內(nèi)切葡聚糖酶(EC 3.2.1.4),對結晶纖維素幾乎沒有活性,但對可溶性纖維素衍生物有明顯的活性,如羧甲基纖維素(CMC)[23].由于GH9酶的廣泛分布和數(shù)量眾多,植物GH9酶可進一步細分為三大類[24],A類蛋白質是膜錨定的,B類蛋白質是分泌性的,C類蛋白質也是分泌性的,但含有家族49碳水化合物結合模塊(CBM49)[25].而對于真菌GH9 家族成員的研究較少.本研究采用生物信息學分析方法,對灰蓋擬鬼傘的GH9 蛋白(Cc_GH9)的基本理化性質、亞細胞定位、信號肽、跨膜結構、二級結構、三級結構、磷酸化位點、糖基化位點、功能結構域、系統(tǒng)發(fā)育和基序進行了分析,為后續(xù)Cc_GH9在灰蓋擬鬼傘纖維素酶參與子實體生長發(fā)育過程機制的研究奠定基礎,也為真菌GH9家族纖維素酶的開發(fā)提供新思路.
試驗中Cc_GH9 序列來源于美國國家生物技術中心(national center for biotechnology information,簡稱NCBI)數(shù)據(jù)庫,蛋白名稱為9 glycosyl hydrolase,序列登錄號為XP_001837301.1(=EAU84918.1).
在NCBI中以“9 glycosyl hydrolase”和“Coprinopsis cinerea”進行檢索,選擇結果中的“Gene”選項,點擊第一個結果“CC1G_00437”,即可獲得Cc_GH9 的基因信息;使用ProtParam(http://web.expasy.org/protparam/)預測Cc_GH9的分子量、等電點、氨基酸含量、不穩(wěn)定指數(shù)和脂肪族系數(shù)等等理化參數(shù);采用SignalP-5.0服務器(http://www.cbs.dtu.dk/services/SignalP/)分析Cc_GH9的信號肽及其剪切位點;利用WoLFPSORT(https://wolfpsort.hgc.jp/)和CELLO v2.5(http://cello.life.nctu.edu.tw/)對Cc_GH9 進行亞細胞定位分析;采用DictyOGlye1.1(http://www.cbs.dtu.dk/services/DictyOGlyc/)預測Cc_GH9 的糖基化位點;采用Sompa(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預測Cc_GH9的二級結構;采用TMHMM 2.0(https://services.healthtech.dtu.dk/service.php?TMHMM-2.0)分析Cc_GH9 的跨膜結構;使用SWISS-MODEL(http://swissmodel.expasy.org/)進行同源建模;使用NCBI 中的保守域數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/Structure/cdd/docs/cdd_search.html)分析Cc_GH9的功能結構域,打開以上網(wǎng)址,粘貼Cc_GH9 氨基酸序列至蛋白或核酸查詢序列(Protein or Nucleotide Query Sequence)文本框點擊提交查詢按鈕即可進入結果頁面;采用MEGA-X中的鄰接(Neighbor-joining,NJ)構建Cc_GH9的系統(tǒng)發(fā)育樹,選擇自舉法(bootstrap method)檢驗系統(tǒng)發(fā)生,自舉重復次數(shù)設置為1000次;利用MEME(http://meme-suite.org/tools/meme)對Cc_GH9進行基序分析.
Cc_GH9的基因位于灰蓋鬼傘基因組序列(NW_003307540.1)中的5號染色體上,基因標簽為CC1G_00437,全長為2298nt(1899563~1901860),含有11 個外顯子,分別為1~289,348~368,419~444,495~543,599~669,726~768,819~1421,1471~1595,1651~1702,1758~1951,2002~2298,編碼基因長1770 nt(圖1),登錄號為XM_001837249,編碼蛋白9 glycosyl hydrolase,登錄號為XP_001837301.該基因5’端為氧化還原酶基因(CC1G_00438),3’端為同化亞硫酸鹽還原酶基因(CC1G_00436).
圖1 灰蓋擬鬼傘GH9家族水解酶基因結構Fig1 Structure of the GH9 family hydrolase(Cc_GH9)gene of Coprinopsis cinerea
使用ProtParam分析Cc_GH9的理化性質,結果表明,Cc_GH9由589個氨基酸組成,其中含量較高的氨基酸組成有丙氨酸(63個,10.7%)、亮氨酸(59個,10.0%)和絲氨酸(47個,8.0%).Cc_GH9的分子量為64997.79u,理論等電點為4.93,序列中含有5個半胱氨酸,可能形成二硫鍵.Cc_GH9蛋白序列中帶負電荷的氨基酸殘基數(shù)為66個,帶正電荷的氨基酸殘基數(shù)為50個,分子式為C2922H4423N761O892S16.假設Cc_GH9的胱氨酸殘基以半胱氨酸的形式出現(xiàn),即形成二硫鍵,其消光系數(shù)為136390L/(mol·cm),吸光度(D280nm)為2.098;如果序列中的二硫鍵全部打開,則Cc_GH9的消光系數(shù)為136140L/(mol·cm),吸光度(D280nm)為2.095.當Cc_GH9的N端為甲硫氨酸時,在哺乳動物的網(wǎng)織紅細胞體外培養(yǎng)的半衰期為30h,在酵母細胞內(nèi)的半衰期大于20h,在大腸桿菌細胞內(nèi)的半衰期大于10h.Cc_GH9的不穩(wěn)定指數(shù)為36.32,小于40,故為穩(wěn)定蛋白.Cc_GH9的脂肪指數(shù)為77.11,其親水性平均值為-0.322,故Cc_GH9為親水性蛋白.
使用SignalP-5.0分析了Cc_GH9蛋白序列的信號肽和剪切位點,N端前21個氨基酸為信號肽序列,剪切位點為ALA-QL(圖2),故而Cc_GH9 可能為分泌性蛋白. 使用WoLFPSORT 和CELLO v.2.5 對Cc_GH9的亞細胞定位進行了預測分析,結果表明最有可能定位在胞外.
圖2 Cc_GH9信號肽分析結果Fig 2 signal peptide analysis results of Cc_GH9
使用TMHMM-2.0分析了Cc_GH9的跨膜螺旋結構(圖3),結果表明含有1個跨膜螺旋,1~555位氨基酸位于膜外部,556~578位氨基酸為跨膜螺旋部分,579~589位氨基酸位于膜內(nèi)部.因此,Cc_GH9可能為跨膜蛋白.
圖3 Cc_GH9的跨膜螺旋結構預測Fig 3 Prediction of transmembrane helices in CC_GH9
利用SOPMA 分析了Cc_GH9 的二級結構(圖4),結果表明其二級結構由α-螺旋(222 個,占37.69%)、延伸鏈(75 個,占12.73%)、β-轉角(16 個,占2.72%)和無規(guī)則卷曲(276 個,占46.86%)組成.因此,無規(guī)則卷曲和α-螺旋是Cc_GH9二級結構中最主要的結構元件.
圖4 Cc_GH9的二級結構預測Fig 4 The secondary structure Prediction of Cc_GH9
使用SWISS-MODEL分析了Cc_GH9的三級結構,得到了3個預測模型,其中以1tf4.1.A為模板的預測模型其全局模型質量評估分數(shù)(GMQE)為0.52,高于其他模板預測模型,更加接近1;而QMEAN得分為-3.10,較其他預測模型更接近于0,表明該模型與實驗結果具有較好的一致性.若QMEAN得分小于-4.0,則表明模型質量與目的蛋白匹配度差.該模型與模板的相似度為39.26%.從Cc_GH9的預測三級結構(圖5A)可以看出,α-螺旋和無規(guī)則卷曲是主要組成結構(圖5A),它們可能對于Cc_GH9結構的穩(wěn)定和酶的功能具有重要意義.
圖5 Cc_GH9的三級結構預測(A)卡通格式(B)表面格式Fig.5 Prediction of tertiary structure of CC_GH9(A)cartoon format(B)surface format
使用NetPhos預測了Cc_GH9氨基酸序列中的磷酸化修飾位點,從圖6可以看出Cc_GH9的氨基酸序列中在29 個絲氨酸(S)上、17 個蘇氨酸(T)上和17 個酪氨酸(Y)上可能發(fā)生磷酸化修飾.使用DictyO?Glyc-1.1 預測了Cc_GH9 氨基酸序列中O-α-N-乙酰葡萄糖胺修飾糖基化位點(圖7),在182 位絲氨酸(S)處可能發(fā)生O-糖基化修飾.
圖6 Cc_GH9的磷酸化位點分析Fig 6 The predited phosphorylation site in Cc_GH9
圖7 Cc_GH9的O-糖基化位點分析Fig 7 The preditedO-glycosylation site in Cc_GH9
使用NCBI中的保守域數(shù)據(jù)庫對Cc_GH9的功能結構域進行了分析(圖8),可以看出Cc_GH9屬于糖基水解酶9 超家族(Glyco_hydro_9 superfamily),Cc_GH9 序列中55~500 位氨基氨酸序列含有Glyco_hy?dro_9 保守結構域,表明該蛋白能夠水解纖維素鏈中的β-1,4-糖苷鍵.但是在325-384 位氨基酸之間存在缺口(gap),表明該蛋白可能在功能方面較其他物種中的GH9蛋白存在差異.
圖8 Cc_GH9的功能結構域分析Fig.8 Functional domain analysis of CC_GH9
使用MAGA-X 對Cc_GH9及其在擔子菌、結合菌、植物、動物和細菌中的同源蛋白進行了系統(tǒng)發(fā)育分析(圖9A),可以看出GH9蛋白的系統(tǒng)發(fā)育基本與其物種分類具有一致性,可以分為真核生物和原核生物組,原核生物酸熱脂環(huán)酸桿菌(Alicyclobacillus acidocaldarius)的GH9成員(ACV59481.1)單獨為一支,可以看作該發(fā)育樹的外群,但是嗜熱醋弧菌(Acetivibrio thermocellus)的GH9蛋白(BAB33148.1)卻與動物組的GH9成員聚為一支.真核生物GH9成員按照“界”分類地位(真菌界、植物界、動物界)可以分為三大支,真菌GH9成員又包括擔子菌和結合菌的GH9成員,植物和動物的GH9成員進化關系較近,可以聚為一大支與真菌GH9成員并列,然而在接合菌卷枝毛霉(Mucor circinelloides)的GH9蛋白(EPB83463.1)未和其他真菌GH9成員聚為一支,卻和動物和植物的GH9成員聚為一支.除小鬼傘Coprinellus angulatus和平田頭菇Agrocybe pediades中含有2個GH9蛋白,絕大多數(shù)擔子菌中僅含有1個GH9蛋白,而結合菌M.circinelloides則含有4個GH9蛋白.擔子菌GH9成員的系統(tǒng)發(fā)育基本與物種的系統(tǒng)發(fā)育一致,如小鬼傘屬和擬鬼傘屬中兩個GH9蛋白對應兩個種,Cc_GH9與擬鬼傘C.marcescibilis的GH9蛋白(TFK29350.1)親緣關系最近,其次是小鬼傘屬,與美味牛肝菌(Boletus edulis)的GH9蛋白(KAF8138651.1)親緣關系最近.
圖9 Cc_GH9的系統(tǒng)發(fā)育(A)及其基序分析(B)Fig 9 Phylogenetic analysis of Cc_GH9(A)and its motif analysis(B)
使用MEME分析了Cc_GH9系統(tǒng)發(fā)育分析所用的GH9蛋白成員氨基酸序列中的基序(圖9B),大多數(shù)GH9蛋白均含有-ENAYVLYGAVVGGPDKRDRFYDIRSDWPQTEVALDYNAPLL-、-LTGGYYDAGDYSKFT?FPLSFTLMSJCWGATDFGKGYDLANQ-和- YWGGDRSIPTPRPVYQINDTNPGTDAAAGTAAAFAACSNLY-等3個基序,在卷枝毛霉M.circinelloides(EPB83463.1)、嗜熱醋弧菌屬A.thermocellus(BAB33148.1)、擬南芥Arabidopsis thaliana(AAC83240.1)和陸地棉Gossypium hirsutum(AAP83128.1)中缺少基序3,而酸熱脂環(huán)酸桿菌Alicyclobacillus acidocaldarius(ACV59481.1)中沒有以上3 個基序,故和其他GH9 蛋白差異較大,進化樹中起到外群的角色.
大部分蕈菌營腐生型營養(yǎng)方式,能夠分泌胞外酶降解大分子的蛋白和多糖生成氨基酸、葡萄糖等能直接吸收利用的小分子物質,其中分泌的纖維素酶能夠將基質中的纖維素組分降解為葡萄糖.灰蓋擬鬼傘是最早基因組測序的傘菌之一,并且作為模式生物,在孢子減數(shù)分裂、菌柄伸長生長以及菌蓋自水解等方面有著廣泛研究[26].灰蓋擬鬼傘的生長周期短,經(jīng)常被當作食用菌生產(chǎn)過程中的雜菌,如與草腐菌草菇或雙孢蘑菇競爭營養(yǎng),因此,鬼傘能夠高效利用秸稈等基質中的纖維素組分.對灰蓋擬鬼傘纖維素酶的研究主要集中在GH6家族的β-葡聚糖酶,日本學者對CcCel6C進行了異源重組表達,并對其晶體結構進行了表征分析[27,28].灰蓋擬鬼傘中含有5個GH6蛋白(CcCel6A,CcCel6B,CcCel6C,CcCel6D和CcCel6E)基因,經(jīng)檢索灰蓋擬鬼傘基因組中僅含有1個GH9蛋白基因.已有文獻表明,GH9蛋白主要存在于細菌、植物中,偶爾也存在于動物中,在真菌中研究較少.棉花內(nèi)切-β-1,4-葡聚糖酶(EG17)屬于GH9家族蛋白,在植物器官的的脫落過程中發(fā)揮一定作用,劉康永等人對其基因進行了克隆和生物信息學分析[29],EG17編碼基因為1533bp,與本研究Cc_GH9編碼基因大小相近;EG17二級結構也主要以無規(guī)則卷曲為主,也與本研究Cc_GH9類似.王麗珊對擬南芥和水稻的GH9家族纖維素酶進行了生物信息學分析[30],這些蛋白大多為穩(wěn)定蛋白,二級結構主要是無規(guī)則卷曲和α-螺旋,大部分是分泌蛋白,這與本研究Cc_GH9 相似,說明GH9 家族蛋白存在保守性,但它們的亞細胞定位于細胞膜或細胞壁,而本研究Cc_GH9定位于胞外.并非所有真菌都含有GH9家族蛋白編碼基因,Hüttner等分析了微小根毛霉(Rhizomucor pusillus)FCH 5.7的基因組,預測獲得2個GH9蛋白編碼基因[31],大部分擔子菌中含有1個該基因,子囊菌中沒有該基因[32].對于真菌GH9蛋白的生理功能目前仍不清楚.對擔子菌黃孢原毛平革菌(Phanerochaete chrysosporium)的有關研究表明,GH9可能與結晶纖維素的降解有關,當P.chryso?sporium在纖維素上生長時,GH9基因表達上調[32].
內(nèi)切葡聚糖酶隨機水解纖維素鏈的內(nèi)部位點,隨后產(chǎn)生不同長度的寡糖,其活性位點形貌特征為一“裂縫”(cleft)或“凹槽”(groove),其開放的表面允許纖維素鏈中的若干糖單元隨機結合[33].本研究中Cc_GH9的三級預測結構的表面格式(圖9B)可以看出,其催化結構域為一“裂縫”.GH9家族內(nèi)切葡聚糖酶通過異頭立體化學的反轉完成催化反應,含有1個保守谷氨酸(Glu)殘基作為催化廣義酸以及結合催化水的2個保守天冬氨酸(Asp)殘基,其中一個作為催化廣義堿[34].已報道的GH9蛋白催化域結構含有一個(α/α)6折疊桶結構,包含一個至少含有6個糖結合位點(-4到+2)的開放活性位點裂縫[35,36].通常持續(xù)性內(nèi)切葡聚糖酶都包含一個3c CBM結構,但是灰蓋擬鬼傘Cc_GH9中缺失該結構域,因此,推測其對結晶纖維素不具有水解活性或者具有微弱水解活性.此外,Cc_GH9在Glyco_hydro_9保守結構域中存在60位氨基酸的缺失,可能導致其結構和活性較其他真菌GH9蛋白不同.通過本研究可以為Cc_GH9基因的克隆及重組表達研究提供指導,比如檢測重組蛋白是否具有水解活性,應當選擇可溶性底物,如羧甲基纖維素或者纖維寡糖等,而不選不溶性的結晶纖維素等作為底物.通過對Cc_GH9的生物信息學預測分析,為灰蓋擬鬼傘纖維素酶的開發(fā)利用提供新的思路.