陳泉冰 曹偉潔 李春,2 呂波
(1.北京理工大學化學與化工學院生物化工研究所醫(yī)藥分子科學與制劑工程工信部重點實驗室,北京 102488;2.清華大學化學工程系,北京 100084)
碳水化合物(carbohydrate)是自然界存在最多、具有廣譜化學結構和生物功能的有機化合物,是生物體能量儲存的重要方式之一,也在維持細胞間通訊、細胞識別和免疫活性的過程中擔當重要信息分子的作用。例如糖蛋白和糖脂類碳水化合物為抗體或其他蛋白質提供了附著點,有助于建立細胞間接觸促進細胞粘附和信號傳遞[1-2]。糖苷水解酶(glycoside hydrolases,GH,EC3.2.1),是碳水化合物代謝的關鍵酶之一,主要參與降解兩個或多個碳水化合物,或者碳水化合物與非碳水化合物之間的糖苷鍵,在動物、植物及微生物的糖和糖綴化合物的水解和合成過程中扮演著不可或缺的角色。蔗糖酶和果聚糖酶等水解酶可水解果聚糖,其產物是原核和真核生物主要的碳能源儲備,也是植物信號通路的重要部分,在感應植物營養(yǎng)狀況方面起著重要作用。內切菊粉酶也可以用來生產具有多種生理功能的低聚果糖,可以改善胃腸道內部的微生物群落,增加腸道菌群中雙歧桿菌等有益菌的數量[3]。甘草酸(GL)是一種重要的五環(huán)三萜類化合物,具有抗菌消炎保肝護肝等醫(yī)用療效。來源于嗜松籃狀菌Li-93(Talaromyces pinophilusLi-93)的β-葡萄糖醛酸苷酶TpGUS79A 可以水解掉甘草酸最外側的β-葡萄糖醛酸基生成單葡萄糖醛酸基甘草次酸(GAMG),其具有更高的藥效和更高的甜度,可以用作抗炎、保肝護肝類藥物的前體和食品添加劑[4-6]。
糖苷水解酶由二糖酶類(蔗糖酶、麥芽糖酶、乳糖酶等)、葡萄糖苷酶類(纖維素酶、α-葡萄糖苷酶、β-葡萄糖苷酶等)和其他類型酶(淀粉酶、半乳糖苷酶、透明質酸酶等)組成,根據對寡糖和糖苷底物切割方式的不同分為內切糖苷酶(endoglycosidase)和外切糖苷酶(exoglycosidases)(表1)。其中內切糖苷酶主要作用位點為寡糖及多糖的內部糖苷鍵,多用于從糖蛋白上切割多糖,例如Endo-β-N-乙酰氨基葡萄糖苷酶(Endo H;EC3.2.1.96)可裂解直接靠近糖蛋白天冬酰胺殘基的兩個 N-乙酰氨基葡萄糖(GlcNAc)亞基之間的鍵。Mitsudome 等[7]從家蠶淋巴中純化的重組 Endo H 可以將高甘露糖型糖蛋白去糖基化,被認為是糖生物學研究的重要工具。外切糖苷酶主要作用于非還原端的糖苷鍵,多用于研究游離多糖的特定端基的切割,比如β-半乳糖苷酶(EC3.2.1.23)可在相對溫和的條件下水解半乳糖和N-乙酰氨基葡萄糖之間的β-1,4 糖苷鍵,Komba 等[8]使用環(huán)狀芽孢桿菌來源的 β-半乳糖苷酶開發(fā)了一種用于高效制備 N-乙酰乳糖胺的策略,為糖苷酶在糖綴化合物的研究中提供思路。
表1 糖苷水解酶的分類Table 1 Classification of glycoside hydrolases
截至2022年1月,碳水化合物數據庫(CAZy)已收錄糖苷水解酶111 萬個(其中未分類2.7 萬個)[9]。根據序列相似性的差異程度,糖苷水解酶被分為173 個糖苷酶家族。GH79 家族作為糖苷酶GH-A 的特殊功能家族,廣泛參與了肝素(HP)和硫酸軟骨素(CS)等抗凝血藥物、抗關節(jié)炎藥物的生物合成,在腫瘤細胞的侵襲與轉移、抗癌藥物的開發(fā)和自身免疫性糖尿病治療方面,成為藥物研究開發(fā)的理想靶標[10]。也在多糖治療心房纖維顫動或心絞痛的細胞間信號傳導等方面受到臨床研究的廣泛關注[11]。此外,肝素衍生自糖醛酸和 N-乙酰氨基葡萄糖殘基,主要涉及生物合成中的多重和隨機酶促修飾的各種取代模式,通過它們在許多生物過程中的結合相互作用來調節(jié)許多重要生物蛋白的活性,例如生長因子、細胞因子、病毒蛋白和凝血因子等[12]。目前,GH79 家族在基因克隆、蛋白功能分析上取了一定的進展,但是對于GH79 家族的多樣性催化機理仍不清楚,識別底物的結構基礎和分子機制尚不清晰。因此,本論文通過對近年來已報道的GH79 家族酶的序列特征、分子結構基礎、蛋白結構演變等方面進行闡述,旨在為后續(xù)的GH79家族的蛋白質工程和功能催化機制的對應關系奠定基礎。
目前,國內外學者鑒定與表征了酸桿菌屬(Acidobacteria)、擬桿菌屬(Bacteroides)和分枝桿菌屬(Mycolicibacillus)等細菌來源[13-14]的GH79 家族的糖苷水解酶(圖1-A)。在絲狀真菌中,已表征的GH79 家族糖苷酶來源主要集中在綠木霉(Trichoderma virens)、黃曲霉(Aspergillus chevalieri)、立枯絲核菌(Zymoseptoria tritici)等霉菌[15]。在高等植物中,主要集中于擬南芥屬(Arabidopsis)[16]、玉米(Zea mays)、鈍稃野大麥(Hordeum spontaneum)和水稻等禾本科植物。在動物細胞方面,GH79 家族的糖苷酶表征主要集中于小鼠(Mus musculus)[17-18]、人源細胞(Homo sapiens)[19]等模式動物細胞,目前部分已表征的、不同來源、功能多樣性的GH79 家族糖苷酶見表2[20]。
表2 GH79 家族不同功能糖苷水解酶Table 2 Different functional glycoside hydrolases of the GH79 family
圖1 GH79 家族糖苷水解酶的分布和催化類型分類Fig.1 Distribution and classification of catalytic types of glycoside hydrolases in the family GH79
根據CAZy 數據庫的功能蛋白注釋,GH79 家族的糖苷酶根據酶所催化的底物類型的不同主要分為以下4 類(圖1-B):(1)EC3.2.1.31,參與β-葡萄糖醛酸苷類的多糖水解,與GH2 家族的葡萄糖醛酸苷酶功能相似,主要水解O-糖苷鍵或S-糖苷鍵,釋放出對應的苷元,廣泛的存在于高等植物、絲狀真菌、細菌和酵母菌中[29,33-34]。(2)EC3.2.1.36,參與透明質酸葡萄糖苷的水解,主要水解葡萄糖醛酸與N-乙酰葡萄糖胺之間的β-1,3 糖苷鍵,廣泛存在于細菌、水蛭和哺乳動物中。(3)EC3.2.1.166,參與硫酸乙酰肝素蛋白聚糖中硫酸乙酰肝素鏈的β-1,4 糖苷鍵的內水解。主要作用在植物多糖、哺乳動物細胞的多糖水解和細胞信號傳導過程,乙酰肝素酶底物譜較廣,硫酸乙酰肝素(HS)是一種糖胺聚糖,是細胞外基質(ECM)的關鍵成分[35-36]。硫酸乙酰肝素(HS)的分解在乙酰肝素酶(HPSE)作用下進行,HPSE 的過表達導致細胞外HS 的分解和儲存的生長因子的釋放,因此與癌癥的轉移密切相關。(4)EC3.2.1.167,參與黃芩苷類化合物的水解[28]。β-葡萄糖醛酸酶已被證明可以從阿拉伯半乳聚糖蛋白中釋放葡萄糖醛酸(GlcUA)和4-O-甲基-GlcA[15,37],來源于黃芩的β-葡萄糖醛酸苷酶可以水解黃酮的7-O-β-葡萄糖醛酸苷,并且參與H2O2的代謝,因此在過氧化物酶反應過程中大量的 H2O2被有效解毒[28]。
從催化底物的鍵選擇性區(qū)分,GH79 家族的β-葡萄糖醛酸苷酶、透明質酸糖苷酶、黃芩苷β-葡萄糖醛酸苷酶僅能水解β-糖苷鍵,起外切糖基的作用,而乙酰肝素酶僅能水解α-糖苷鍵,起內切糖基的作用,對細胞內的長鏈糖類物質起分解作用[27]。從共進化的角度分析,腸道微生物菌群也參與了宿主的代謝調節(jié)和免疫防御,如鏈球菌屬[38-40]、葡萄球菌屬[41-42]、棒狀桿菌屬[43-44]、產堿菌屬[45]等菌屬中存在的β-葡萄糖醛酸苷酶類、多糖類的糖苷水解酶參與碳水化合物和能量代謝,從而有助于抵御致病細菌的入侵。此外,弧菌與魷魚依賴與上皮黏液的共生關系[46],玉米(Zea mays)和玉米瘤黑粉病菌(Sporisorium reilianum)、大麥和網斑病菌(Pyrenophora teres)之間寄生和拮抗作用[47-48],顯示了GH79 家族糖苷酶也可能參與了物種間共生體或水平基因的遷移。
長期以來人們已經注意到催化機制和分子機制對于絕大多數糖苷酶家族以及催化口袋的幾何形狀都是保守的,通過對同一家族的糖苷水解酶進行分子進化分析和結構功能預測,揭示蛋白質之間的共進化關系,深入研究其序列和催化作用機理之間的對應關系,從而拓展其應用范圍。為了進一步揭示GH79 家族不同水解功能的糖苷酶的親緣關系,選擇了來源于動物、植物、真菌、細菌以及同一來源不同反應類型的55 種不同的糖苷酶序列進行分子進化樹分析。通過Clustalx 對GH79 家族已經表征的酶的氨基酸序列進行比對,然后利用Mega 進行分子進化樹的構建和親緣關系分析[49-50],結果如圖2所示。目前,GH79 家族糖苷水解酶的研究主要集中于EC3.2.1.166 反應類型的肝素酶一支,主要行使硫酸肝素蛋白聚糖中硫酸肝素鏈(1 →4)-β-D-糖苷鍵的內切水解功能。例如,Vinader 等[51]研究發(fā)現來源于GH79 家族的乙酰肝素酶通過催化硫酸乙酰肝素的葡萄糖醛酸(GlcUA)和葡萄糖胺(GlcNAc)之間的(1,4)糖苷鍵,生成GlcUA-GlcNAc 的最小二糖單元。目前GH79 家族EC3.2.1.36 反應類型的糖苷酶僅有江南大學的康振教授團隊表征并報道的水蛭透明質酸酶LHyal 一種,可特異性水解透明質酸中的GlcNAc-GlcUA-GlcNAc的β-1,3 糖苷鍵,生成GlcNAc-GlcUA 的二糖單元[27]。其余GH79 家族的糖苷水解酶同源關系較近且集中于EC3.2.1.31 水解類型的β-葡萄糖醛酸苷酶,進化顯示其序列相似度較高,水解方式也大體相同。
圖2 GH79 家族不同功能糖苷水解酶進化樹Fig.2 Phylogenetic tree of glycoside hydrolases with differ-ent functions in the GH79 family
此外,來源于黃芩的黃芩苷β-葡萄糖醛酸酶(EC3.2.1.167)與其他β-葡萄糖醛酸苷酶的水解模式略有差別,能夠催化黃芩苷水解生成對應的黃芩素和β-葡萄糖醛酸,但不能使用甘草甜素、石膏素-3-O-D-葡萄糖醛酸苷、木犀草素-7-O-D-葡萄糖苷和芹菜素-7-O-D-葡萄糖苷作為底物。李春課題組篩選到一株絲狀真菌-嗜松籃狀菌,產生β-葡萄糖醛酸苷酶(TpGUS79A)屬GH79 家族,主要功能是可以特異性水解β-1,3 糖苷鍵將甘草酸轉化成單葡萄糖醛酸基甘草次酸(GAMG),而不會進一步水解GAMG 生成甘草次酸(GA),分子進化樹顯示該酶在GH79 家族糖苷酶水解分類中處于單獨的一個分支,與GH79 家族的鼠李糖基-β-D-葡萄糖醛酸酶(FoBGlcA)、乙酰肝素酶同源性不足30%,推測該家族除了存在糖基識別特異性之外,對苷元的識別也存在一定的特異性。此外,進化樹顯示其中還有很多未被命名的蛋白,這些未命名的蛋白與其他的酶的序列相似性均不高,都在40%以下甚至更低,因此通過序列之間進化關系及親緣遠近推測其催化功能仍然存在一定的盲點。如何通過酶進行序列和結構比對,從而建立GH79 家族功能性的結構特征和氨基酸殘基的識別規(guī)律具有重要的理論研究意義[29]。
從GH79 家族不同功能的糖苷水解酶進化樹可以發(fā)現,該家族不同功能的糖苷水解酶在進化關系上并不具有較強的親緣關系,主要原因是該家族同一功能的糖苷酶來源較為固定且單一,比如乙酰肝素酶均來源于哺乳動物,同時發(fā)現在整個GH79 家族中具有EC3.2.1.167 水解功能的黃芩β-葡萄糖醛酸苷酶(sGUS)和具有EC3.2.1.36 水解功能的透明質酸酶目前均只有一種,因此難以僅從進化關系上推測GH79 家族未知糖苷酶的功能,基因序列同源性低,這可能也是GH79 家族糖苷水解酶催化機制解析進展緩慢的主要原因之一。
目前,糖苷水解酶的催化機制主要有兩種,一種是保留型反應,一種是反轉型反應,其主要區(qū)別在于水解過程中異頭碳構象是否變化(圖3)。保留型反應不會造成異頭碳構象的變化,而反轉型反應會導致異頭碳構象有α 和β 之間的轉化[52-54],反轉型糖苷水解酶的兩個催化殘基之間的距離為7-10 ?,保留糖苷水解酶的距離為5-6 ?[55]?;诎被岬男蛄邢嗨菩?,GH1、GH2、GH3 和GH79 家族糖苷水解酶催化機制比較類似[52-54],比如β-葡萄糖醛酸苷酶在催化糖苷鍵的斷裂時,谷氨酸/天冬氨酸等關鍵殘基參與廣義的酸(堿)催化反應完成,其中一個殘基是質子供體,另一個是親核基團/堿性基團。對GH79 家族已經表征的酶的序列以及已成功鑒定活性中心的TpGUS79A 進行氨基酸的序列比對,序列之間的相似性(similarity)只有30%-48%左右,但均具有GNE 和ETNS 等高度保守的特征功能結構域(圖4),GNE 區(qū)域中的谷氨酸殘基為質子供體,而ETNS 區(qū)域的谷氨酸殘基為親核基團/堿性基團。Michikawa 等[13]解析的首個GH79 家族β-葡萄糖醛酸苷酶(AcGlcA79A)結構顯示,催化殘基為Glu173 和Glu287,分別起酸/堿和親核試劑的作用,且催化位點Glu173 和Glu287 之間的距離為5.25 ?,符合保留型的催化機理。
圖3 糖苷水解酶的催化機制Fig.3 Catalytic mechanism of glycoside hydrolase
圖4 GH79 家族已鑒定活性中心糖苷水解酶的氨基酸序列比對Fig.4 Amino acid sequence alignment of the identified active center glycoside hydrolases of the GH79 family
目前GH79 家族中乙酰肝素酶及大多數動物來源的水解酶多采用內切機制,如Wu 等[56]表征的GH79 家族的人源乙酰肝素酶(HPSE),其催化機制被鑒定為糖苷保留型催化機制,其催化位點分別為Glu343 和 Glu225 殘基,分別在催化過程中行使親核試劑和酸/堿的功能。江南大學康振課題組報道了GH79 家族的水蛭來源的透明質酸酶(LHyal)的晶體結構,其功能是水解透明質酸的β-1,3 糖苷鍵,催化位點分別為位于中央β 折疊上的C 末端的谷氨酸殘基Glu176 和Glu290[27]。與內切機制不同的是,來源于真菌、細菌等GH79 家族的糖苷水解酶采用外切水解機制,例如來源于莢膜酸桿菌的β-D-葡萄糖醛酸苷酶AcGlcA79A[13]和來源于尖孢鐮刀菌的4-O-α-L-鼠李糖基-β-D-葡萄糖醛酸苷酶(FoBGlcA)[21]均具有外切β-葡萄糖醛酸的能力。Kondo 報道的來自尖孢鐮刀菌的4-O-α-L-鼠李糖基-β-D-葡萄糖醛酸苷酶FoBGlcA 可以水解阿拉伯樹膠生成L-鼠李糖和D-葡萄糖醛酸,序列比對表明 FoBGlcA 與已經報道的AcGlcA79A 的序列同源性較低(19%),與GH79 家族其他17 種β-葡萄糖醛酸苷酶相似度僅為4%-20%。序列比對和突變驗證結果顯示,Glu164 和Glu284 分別為FoBGlcA 的催化酸/堿殘基和親核試劑殘基??傮w來說,GH79家族催化特征氨基酸存在高度保守,與 GH-A 家族其他成員水解酶催化特征一致,但僅通過序列相似度推斷GH79 家族是否內切或外切的水解模式目前仍然存在一定的難度。
迄今為止,GH79 家族三級結構解析及結構功能分析進展緩慢。已經成功解析的GH79 家族酶的三維結構僅有5 種。2012年Michikawa 等[13]首次表征了GH79 家族莢膜酸桿菌來源的β-葡萄糖醛酸苷酶AcGlcA79A,其具有β-葡萄糖醛酸的活性,催化效率Km和kcat分別為(0.015±0.001)mmol/L 和(34±1)/s,最適催化溫度和pH 分別為50℃和pH 3.0。通過硒代蛋氨酸結晶衍射方法,獲得了其蛋白結構(PDB ID:3VNY)及其與葡萄糖醛酸(GlcUA)、葡萄糖醛酸-(1-4)-葡萄糖底物分子的復合物晶體結構(PDB ID:3VNZ & 3VO0),分辨率分別為1.50 ?、1.80 ? 和1.90 ?。晶體結構顯示,AcGlcA79A 為單亞基酶,由一條包含488 個氨基酸的多肽鏈和附加的C 末端殘基(476-KLAAALEHHHHHH-488)組成,分子量為52 kD,具有典型的(β/α)8形成的TIM桶狀結構域和8 個β 折疊形成的三明治結構域(圖5)。其中(β/α)8的TIM 桶狀結構域與GH2 家族其他典型的β-葡萄糖醛酸苷酶的催化結構幾何偏差為2.6 ?,具有典型的β-葡萄糖醛酸苷酶的水解能力,其中分別行使催化酸堿和親核攻擊作用的Glu173 和Glu287 位于TIM 桶狀結構域的β4 和β7 折疊上。
2015年格里菲斯大學的Bohlmann 等[14]解析了來源于類鼻疽伯克氏菌乙酰肝素酶(BpHep)的X射線晶體結構(PDB ID:5BWI),分辨率為1.60 ?。這是 GH79 家族報道的首個具有內切水解作用的β-葡萄糖醛酸苷酶的晶體結構。與AcGlcA79A 不同的是,BpHep 為異源二聚體,每個單體分別包含一個(β/α)8的TIM 桶狀的催化域和β 三明治結構域(圖5)。在BpHep 的催化結構域中,催化殘基Glu144和Glu255 分別行使酸堿質子供體和親核試劑的功能。和人源乙酰肝素酶hHep 結構不同的是,BpHep結構中的loop 環(huán)區(qū)Gly66-Thr89 對應于hHep 無活性的接頭結構域(Ser110-Gln157),該loop 可能阻斷了乙酰肝素酶與底物硫酸乙酰肝素(HS)結合位點,在催化過程中必須移除此linker 區(qū)域才能使其與底物硫酸乙酰肝素HS 正確的結合,該loop 環(huán)區(qū)在 AcGlcA79A 的結構中也有類似的存在[56]。該loop結構上的差異可能為GH79 家族糖苷酶底物的特異性識別提供了新的思路。
圖5 GH79 家族已解析結構的蛋白結構示意圖Fig.5 Schematic representation of the resolved protein structures of the GH79 family
2015年約克大學的Davies 團隊成功解析GH79家族人源的乙酰肝素酶(HPSE)(PDB ID:5E9C)的晶體結構,分辨率為1.73 ?。其結構是由兩個不對稱的單個異二聚體構成的異源二聚體,大亞基50 kD,小亞基只有8 kD(圖5)[56]。與前面GH79 家族解析的結構一樣由(β/α)8的TIM 桶狀結構域和β 三明治結構域組成。值得注意的是HPSE 包含6 個N-糖基化位點,均位于50 kD 亞基上。糖鏈存在對蛋白結構的X 射線衍射具有不利影響,作者利用糖苷內切酶H(Endo H)切除了其糖鏈成功獲得了HPSE 的規(guī)則晶體結構。在含有糖鏈修飾的GH79家族的糖苷酶表征方面,Kondo 等[21]利用Endo H糖苷酶處理,通過蒸汽擴散法優(yōu)化晶體結構,解析出了GH79 家族首個來源于尖孢鐮刀菌的β-葡萄糖醛酸苷酶FobglcA(PDB ID:7DFQ)及其與底物4-O-α-L-鼠李糖基-β-D-葡糖醛酸結合的復合物晶體結構(PDB ID:7DFS),分辨率分別為1.51 ? 和1.49 ?。該酶含有3 個糖基化位點,分子量在50 kD左右,為一個單體酶(圖5),該研究進一步豐富了GH79 家族糖基化的β-葡萄糖醛酸苷酶的結構數據庫。此外,2021年江南大學康振教授課題組也成功解析該家族水蛭來源的透明質酸酶(LHyal)的蛋白結構(PDB ID:7EYO),分辨率為1.9 ?(圖5),該酶在氨基酸序列的184 和249 位的存在著兩個N-糖基化。LHyal 具有由(β/α)8的TIM 桶狀結構域和β 三明治結構域組成的GH79 家族的典型結構特征,與GH79 家族其他已解析結構的糖苷酶具有很高的結構相似度。例如與已解析的BpHep 催化結構幾何偏差為1.28 ?,催化殘基Glu176 和Glu290 分別行使酸堿質子供體和親核試劑的功能[27]。盡管LHyal 與其他已報道的GH79 的蛋白相似度很高,但LHyal 的結合口袋的裂縫一側具有一個較長的loop環(huán)(D72-Q104),稱為可變的“外口袋”環(huán)。與該家族已經解析結構的其他四種酶相比,“外口袋”環(huán)的結構可能影響糖苷水解酶切割底物的作用模式,AcGlcA79A 和FoBGlcA 是外切水解酶,其“外口袋”環(huán)N88-R113 和D71-S90 相對較短,形成了額外的翻轉只能容納小分子底物的進入,而 HPSE 的“外口袋”環(huán)D105-N162 通過蛋白水解切除6 kD 接頭肽暴露了結合縫隙,從而具有內切的水解機制(圖6)[27]。該研究為進一步理解GH79 家族的底物的識別機制以及為蛋白的分子進化的關系提供了新的思路。
圖6 GH79 家族蛋白結構已知的具有不同作用模式的“exo-pocket”loop 比較Fig.6 Comparison of “exo-pocket” loops with different modes of action for known structures of GH79 family proteins
目前,許多研究者通過序列比對、分子進化分析和結構解析等策略成功的鑒定了五種的GH79 家族的酶,但由于GH79 家族的序列多樣性豐富,整體的表征的序列樣本數仍不夠,導致GH79 家族的多樣性識別底物的結構基礎和分子機制尚不清晰。如何通過GH79 家族成員的共同序列特征和結構功能特征進行高效的挖掘表征也是亟待解決的問題。例如在序列方面,開發(fā)多數據驅動的組學分析技術,加快基于序列特征的定量化、高通量的挖掘與表征策略,建立樣本-數據-特征的信息流指導的挖掘平臺。在蛋白方面,運用Rosetta 或AlphaFold 等蛋白預測模型,建立多元的催化與結構的對應模型,通過結構特征與功能之間的關聯(lián)性,實現未知蛋白的功能解析與表征。隨著機器學習、組學驅動等技術的進一步發(fā)展,均為GH79 家族β-葡萄糖醛酸酶的系統(tǒng)進化、功能研究提供了新的理論指導和堅實基礎,也為我們了解GUS 酶的蛋白結構和功能的對應關系提供了新的思路和研究方向。