劉璐瑤, 秦洪強(qiáng), 葉明亮*
(1.中國(guó)科學(xué)院大連化學(xué)物理研究所, 中國(guó)科學(xué)院分離分析化學(xué)重點(diǎn)實(shí)驗(yàn)室, 遼寧 大連 116023; 2.中國(guó)科學(xué)院大學(xué), 北京 100049)
蛋白質(zhì)糖基化是一種非常普遍、復(fù)雜和多樣的蛋白質(zhì)翻譯后修飾。在真核生物中,蛋白質(zhì)糖基化過(guò)程主要發(fā)生在內(nèi)質(zhì)網(wǎng)和高爾基體系統(tǒng)內(nèi),有大約200個(gè)糖基轉(zhuǎn)移酶參與,并使得50%~70%的蛋白質(zhì)被糖基化修飾[1]。根據(jù)糖鏈和蛋白質(zhì)連接方式的不同,蛋白質(zhì)糖基化主要分為N-糖基化、O-糖基化、C-糖基化和糖基磷脂酰肌醇(GPI)錨定4大類型,其中對(duì)N-和O-糖基化的研究最為廣泛。在N-糖基化中,糖鏈通過(guò)N-乙酰葡萄糖胺(GlcNAc)與天冬酰胺(Asn)側(cè)鏈氨基共價(jià)結(jié)合,其糖鏈有五糖核心結(jié)構(gòu),糖基化位點(diǎn)具有特定肽段序列Asn-X-Ser/Thr(X≠Pro)。在O-糖基化中,糖鏈通過(guò)與絲氨酸(Ser)或蘇氨酸(Thr)側(cè)鏈羥基共價(jià)結(jié)合,其糖鏈沒有固定的核心結(jié)構(gòu),糖基化位點(diǎn)也沒有保守肽段序列。N-和O-糖基化在蛋白質(zhì)穩(wěn)定性、細(xì)胞內(nèi)和細(xì)胞間信號(hào)轉(zhuǎn)導(dǎo)、激素活化或失活和免疫調(diào)節(jié)等方面起著重要作用[2]。蛋白質(zhì)糖基化的異常表達(dá)也通常預(yù)示著相關(guān)疾病的發(fā)生發(fā)展,比如炎癥、癌癥、遺傳病等。目前,大多數(shù)被批準(zhǔn)臨床使用的腫瘤生物標(biāo)志物是糖蛋白(例如用于肝癌的甲胎蛋白(AFP)、用于卵巢癌的癌抗原125(CA125)、用于結(jié)腸癌的癌胚抗原(CEA)、用于前列腺癌的前列腺特異抗原(PSA)等)或糖抗原(例如用于胃腸癌和胰腺癌的癌抗原19-9(CA19-9)等)[3]。因此,糖蛋白質(zhì)組學(xué)分析對(duì)于疾病的早期篩查和病理研究等非常重要。
基于質(zhì)譜的蛋白質(zhì)組學(xué)技術(shù)為全面分析蛋白質(zhì)及其修飾提供了極好的分析手段。在自下而上的蛋白質(zhì)組學(xué)研究中,單一蛋白質(zhì)或者復(fù)雜生物樣品(細(xì)胞、組織、體液等)的全蛋白通常經(jīng)酶解成肽段后再進(jìn)行高效液相色譜-串聯(lián)質(zhì)譜(HPLC-MS/MS)的鑒定和定量分析。然而,由于糖鏈的多樣性和高度異質(zhì)性,全面分析蛋白質(zhì)糖基化仍具有很大的挑戰(zhàn)。一方面,盡管蛋白質(zhì)糖基化普遍存在,但是糖蛋白相對(duì)于全蛋白的豐度較低,而完整糖肽的含量更低,難以進(jìn)行質(zhì)譜的直接檢測(cè)。因此,為了提高復(fù)雜生物樣品中完整糖肽的豐度,發(fā)展完整糖肽的富集方法具有重要意義。目前,常見的糖肽富集技術(shù)有親水作用色譜法、金屬親和色譜法、凝集素親和色譜法、硼酸化學(xué)法、酶化學(xué)法、酰肼化學(xué)法等等。另一方面,相比于非修飾肽段,糖肽的低離子化效率和糖鏈的高度異質(zhì)性使得完整糖肽的質(zhì)譜表征具有挑戰(zhàn)性。因此,開發(fā)有效的質(zhì)譜碎裂方法和譜圖解析工具對(duì)完整糖肽的綜合分析非常重要。近10年以來(lái),隨著質(zhì)譜技術(shù)的革新,譜圖數(shù)據(jù)的質(zhì)量越來(lái)越高,用于精確解析完整N-和O-糖肽的軟件算法也得到了飛速的發(fā)展[4]。
在本篇綜述中,我們重點(diǎn)關(guān)注用于糖蛋白質(zhì)組學(xué)分析的糖肽富集技術(shù)和譜圖解析方法的最新進(jìn)展:首先介紹幾種不同機(jī)理的完整糖肽富集方法,并重點(diǎn)介紹這些方法最新的技術(shù)進(jìn)展及其應(yīng)用;然后介紹近年來(lái)發(fā)展的完整糖肽質(zhì)譜碎裂方法,并重點(diǎn)介紹完整糖肽的譜圖解析策略和對(duì)應(yīng)的數(shù)據(jù)分析軟件;并對(duì)蛋白質(zhì)糖基化研究的發(fā)展方向進(jìn)行了展望。
基于質(zhì)譜的糖蛋白質(zhì)組學(xué)技術(shù)是分析位點(diǎn)特異性蛋白質(zhì)糖基化的有效手段。為了提高質(zhì)譜分析的靈敏度,從復(fù)雜生物樣本的全蛋白酶解樣品中特異性富集完整糖肽的步驟是必要的[5,6]。近年來(lái),研究人員通過(guò)開發(fā)和改進(jìn)各種富集方法,極大地提高了不同樣本中完整糖肽的富集效率。
親水作用色譜法(hydrophilic interaction liquid chromatography, HILIC)是一種廣譜的富集方法,其通過(guò)糖基化肽段和非糖基化肽段之間極性的差異實(shí)現(xiàn)完整糖肽的分離和富集。與其他富集方法相比,HILIC的優(yōu)勢(shì)是既能保留完整糖肽的結(jié)構(gòu),也能無(wú)偏差地富集所有類型的完整糖肽。但是HILIC的缺點(diǎn)之一是糖肽和非糖肽的共流出導(dǎo)致富集特異性較低,這需要開發(fā)具有更強(qiáng)親水基團(tuán)的HILIC材料來(lái)提高富集效率。目前,應(yīng)用廣泛的HILIC材料有兩性離子功能化材料(如ZIC-HILIC)、碳水化合物功能化材料(如Click Maltose-HILIC)、酰胺功能化材料和基于金屬有機(jī)框架的親水材料(metal-organic frameworks, MOF)等[7-9]。
由于N-和O-糖基化的異質(zhì)性高,通過(guò)糖苷酶(例如PNGase F糖苷內(nèi)切酶)釋放N-糖鏈可以簡(jiǎn)化N-糖基化的分析,但是缺少能釋放O-糖鏈的糖苷酶,因此蛋白質(zhì)O-糖基化的分析具有很大挑戰(zhàn)。最近,You等[10]提出了一個(gè)結(jié)合HILIC富集和化學(xué)法去唾液酸化的策略,通過(guò)在一定程度上簡(jiǎn)化O-糖鏈的方式,提高了鑒定O-GalNAc糖基化的靈敏度。他們將該方法進(jìn)一步應(yīng)用于人血清樣本的分析,較高可信度地鑒定到來(lái)自94個(gè)糖蛋白的185個(gè)O-GalNAc肽段序列。為了深度研究疾病中蛋白質(zhì)糖基化的異常,通常需要對(duì)大量生物樣本進(jìn)行檢測(cè)。因此,在開發(fā)高特異性的富集材料的同時(shí)也需要發(fā)展高重現(xiàn)性、高穩(wěn)定性和易操作性的完整糖肽富集平臺(tái),這對(duì)于支持規(guī)模化的糖蛋白質(zhì)組學(xué)研究非常關(guān)鍵。近期,我們[11]發(fā)展了一種自動(dòng)化的完整糖肽富集方法,該方法通過(guò)配置Click Maltose-HILIC微柱的液相色譜儀實(shí)現(xiàn)了對(duì)微量起始血清酶解液中完整N-糖基化肽段的富集(見圖1)。該方法能從1 μL起始血清中富集并鑒定到近1 200條完整N-糖肽,同時(shí)其定量分析的重現(xiàn)性高,長(zhǎng)期運(yùn)行的穩(wěn)定性好,適合大隊(duì)列樣本的糖蛋白質(zhì)組學(xué)研究。我們進(jìn)一步將該方法應(yīng)用于4例胰腺癌患者血清中位點(diǎn)特異性N-糖基化的分析,發(fā)現(xiàn)患者組IgG1蛋白180號(hào)N-糖基化位點(diǎn)上單巖藻糖無(wú)唾液酸糖型的表達(dá)量顯著低于健康對(duì)照組。
圖1 基于親水作用色譜法的自動(dòng)化完整糖肽富集平臺(tái)[11]
金屬氧化物親和色譜法(metal oxide affinity chromatography, MOAC)和固定金屬離子親和色譜法(immobilized metal ion affinity chromatography, IMAC)是兩種最典型的金屬親和色譜法,它們最早被廣泛地應(yīng)用于蛋白質(zhì)磷酸化肽段的富集;由于糖基化肽段和磷酸化肽段都含有豐富的負(fù)電荷修飾基團(tuán),并且有相似的強(qiáng)親水性,金屬親和色譜法也逐漸應(yīng)用于蛋白質(zhì)糖基化肽段的富集。
MOAC通過(guò)金屬氧化物與修飾肽段之間的配位相互作用實(shí)現(xiàn)糖肽的選擇性富集。二氧化鈦(TiO2)的穩(wěn)定性高和非特異性結(jié)合少,是MOAC中最具代表性的富集材料,能夠選擇性地富集帶唾液酸的完整糖肽。為了提高TiO2對(duì)糖肽的富集能力,段梅等[12]嘗試了將TiO2介孔氣凝膠材料應(yīng)用于糖肽的選擇性富集,發(fā)現(xiàn)其富集性能和選擇性均顯著優(yōu)于商品化納米級(jí)的TiO2顆粒。為了同時(shí)結(jié)合MOAC和HILIC的富集優(yōu)勢(shì),Sun等[13]制備了一種雙功能磁性納米材料(亞氨基二乙酸修飾的磁性二氧化鈦,Fe3O4@TiO2-IDA),實(shí)現(xiàn)了對(duì)復(fù)雜生物樣本中磷酸化肽段和糖基化肽段的分離富集,并從100 μg小鼠大腦樣品的單針LC-MS/MS分析中同時(shí)鑒定到550條磷酸肽和330條完整N-糖肽。
IMAC以過(guò)渡態(tài)金屬陽(yáng)離子(如Fe3+、Ga3+、Zr4+等)作為親和基團(tuán),與帶負(fù)電荷的修飾肽段之間發(fā)生靜電相互作用實(shí)現(xiàn)糖肽的選擇性富集。甘露糖-6-磷酸(M6P)糖基化是一種重要的翻譯后修飾,在將溶酶體水解酶轉(zhuǎn)移到溶酶體中起著至關(guān)重要的作用,而異常M6P修飾與溶酶體儲(chǔ)存疾病(包括阿爾茨海默病和癌癥)有關(guān)。但是M6P修飾的豐度極低,這使得完整M6P糖肽的研究仍然具有挑戰(zhàn)性,因此開發(fā)完整M6P糖肽的富集方法尤為重要。Huang等[14]首先發(fā)現(xiàn)螯合了Ti4+的IMAC(Ti(IV)-IMAC)材料包含大量的磷酸螯合Ti(IV)離子,能通過(guò)靜電相互作用富集磷酸肽;同時(shí)該材料含有大量高度親水的羥基、氨基和磷酸根基團(tuán),能通過(guò)親水相互作用富集糖肽。因而,他們發(fā)現(xiàn)該雙功能Ti(IV)-IMAC材料能有效地富集M6P糖蛋白,并從小鼠5種組織(肝、心、肺、腎、腦)中分析鑒定到來(lái)自81個(gè)M6P糖蛋白的237個(gè)完整M6P糖肽,第一次實(shí)現(xiàn)了小鼠樣本中M6P糖基化的大規(guī)模分析。隨后根據(jù)不同修飾肽段之間靜電特性和親水性的差異,Huang等[15]進(jìn)一步通過(guò)調(diào)控洗脫條件,利用該雙功能Ti(Ⅳ)-IMAC材料實(shí)現(xiàn)了中性糖肽和唾液酸糖肽、單磷酸肽和多磷酸肽的分離,進(jìn)而顯著提高了糖肽、磷酸肽和完整M6P糖肽的覆蓋率和鑒定量(見圖2a)。近期,Yue等[16]發(fā)現(xiàn)Ti(IV)-IMAC材料也能富集復(fù)雜生物樣本中的完整O-糖肽,并且能從0.1 μL人血清中富集約200條完整O-GalNAc糖肽,他們將該方法應(yīng)用于研究人肝癌血清樣本中蛋白質(zhì)O-糖基化的異常變化(見圖2b)。
凝集素親和色譜法(lectin affinity chromatography, LAC)通過(guò)固載在瓊脂糖或者磁珠上的凝集素選擇性地識(shí)別有特定結(jié)構(gòu)的單糖或聚糖實(shí)現(xiàn)完整糖肽的分離和富集。根據(jù)凝集素的特異性,該方法被廣泛地用于特定N-和O-糖蛋白和糖肽的富集。最常用于富集N-糖基化肽段的凝集素有:刀豆蛋白A凝集素(concanavaline A, Con A)能特異性結(jié)合α-甘露糖;小麥胚芽凝集素(wheat germ agglutinin, WGA)能特異性結(jié)合GlcNAc和唾液酸。常用于富集O-GalNAc型糖基化肽段的凝集素有:木菠蘿凝集素(Jacalin)能特異性識(shí)別半乳糖基(β-1,3)N-乙酰半乳糖胺(Gal(β-1,3)GalNAc);野豌豆凝集素(VVA)能特異性識(shí)別α-或β-末端N-乙酰半乳糖胺(GalNAc)。單凝集素親和色譜法通常應(yīng)用于復(fù)雜的生物樣品(如血清、血漿和組織裂解液等),以監(jiān)測(cè)疾病中特定蛋白質(zhì)糖基化的變化。Tsai等[17]建立了一種結(jié)合WGA富集方法和多重反應(yīng)監(jiān)測(cè)(MRM)質(zhì)譜技術(shù)的檢測(cè)方法,通過(guò)鑒定結(jié)直腸癌患者血漿中經(jīng)WGA捕獲的糖蛋白和對(duì)應(yīng)多肽表達(dá)量的變化,從而監(jiān)測(cè)早期結(jié)直腸癌的發(fā)生。相比于單凝集素親和色譜法,多凝集素親和色譜法通過(guò)混合多種凝集素因而能同時(shí)富集更多樣化的蛋白質(zhì)糖基化。Gbormittah等[18]利用組合了Con A、WGA和Jacalin多凝集素親和色譜法的富集平臺(tái),成功地富集和表征了胰腺囊腫液中不同水平的糖蛋白,并用于探索差異表達(dá)蛋白來(lái)區(qū)分黏液性和非黏液性囊腫液。
硼酸化學(xué)法利用硼酸與單糖形成可逆共價(jià)鍵實(shí)現(xiàn)完整糖肽的富集。具體原理是在堿性條件中,硼酸基團(tuán)與糖鏈的順式二醇結(jié)構(gòu)反應(yīng)形成環(huán)狀的硼酸酯,從而捕獲完整糖肽;在酸性條件下,硼酸酯能可逆水解,從而釋放完整糖肽并且不影響糖鏈的結(jié)構(gòu)。由于糖鏈有多羥基的結(jié)構(gòu)特點(diǎn),硼酸化學(xué)法在富集完整糖肽方面具有很大潛力。然而,硼酸和不同糖鏈之間的親和力不同,限制了該方法的普適性。2018年,Xiao等[19]開發(fā)了一種硼酸化合物偶聯(lián)樹枝狀聚合物用于促進(jìn)低豐度糖肽的富集,通過(guò)比較不同硼酸衍生物的富集性能,發(fā)現(xiàn)苯并溴唑能顯著增強(qiáng)復(fù)雜樣品糖肽的覆蓋度。他們利用該方法從人類細(xì)胞(MCF7、HEK 293T和Jurkat)中富集并鑒定到來(lái)自1 906個(gè)蛋白質(zhì)的4 691個(gè)N-糖基化位點(diǎn)。最后他們發(fā)現(xiàn)盡管O-GlcNAc不含順式二醇,但是該方法也能高效地從人類細(xì)胞中富集超過(guò)200個(gè)O-GlcNAc蛋白。近期,Chen等[20]組合使用硼酸化學(xué)法和HILIC兩種方法富集人腦脊液(cerebrospinal fluids, CSF)樣本中的完整N-糖肽,共鑒定到來(lái)自285個(gè)蛋白質(zhì)的511個(gè)糖基化位點(diǎn)和2 893條完整N-糖肽,得到了目前最大的位點(diǎn)特異性N-糖蛋白質(zhì)組學(xué)數(shù)據(jù),他們進(jìn)一步將該方法應(yīng)用于深入分析阿爾茨海默病CSF樣本的N-糖蛋白質(zhì)組學(xué)。
酶化學(xué)法同時(shí)結(jié)合了酶反應(yīng)和化學(xué)反應(yīng)實(shí)現(xiàn)糖基化肽段的識(shí)別、捕獲和釋放,是糖蛋白質(zhì)組常用的研究方法之一。Zheng等[21]設(shè)計(jì)了一種酶化學(xué)法用于富集含Tn抗原(O-GalNAc)的糖蛋白。該方法的原理是利用半乳糖氧化酶將GalNAc上的羥基氧化成醛基,隨后利用酰肼化學(xué)捕獲上述糖肽,最后利用甲氧胺釋放糖肽,實(shí)現(xiàn)含Tn抗原糖蛋白的分離和富集。他們利用該方法從Jurkat細(xì)胞中鑒定到96個(gè)含Tn抗原的糖蛋白。隨后,You等[22]發(fā)展了一種用于富集黏蛋白型核心1結(jié)構(gòu)O-糖肽(mucin-type core-1O-糖肽,也稱為O-GalNAc糖肽)的酶化學(xué)法。在去除了N-糖鏈的血清酶解液樣品中,該方法首先去除糖鏈的唾液酸,使Gal/GalNAc殘基暴露在糖鏈末端,隨后利用半乳糖氧化酶氧化羥基成醛基,酰肼化學(xué)法共價(jià)捕獲醛基,最后使用羥胺及其同系物釋放糖肽。最終他們使用該方法從50 μL人血清中鑒定到來(lái)自38個(gè)糖蛋白的59條O-GalNAc修飾的肽段序列,展現(xiàn)了其在復(fù)雜生物樣本O-糖基化蛋白質(zhì)組中研究的潛力。2018年,Yang等[23]報(bào)道了一種新型的位點(diǎn)特異性提取O-糖肽的方法(簡(jiǎn)稱為EXoO),用于黏蛋白型O-糖基化的大規(guī)模分析。他們首先將多肽的N端經(jīng)還原氨化共價(jià)結(jié)合至一個(gè)固定載體,隨后使用一種特異性蛋白酶(OpeRATOR酶)酶切O-糖基化位點(diǎn)Ser/Thr的N端從而釋放O-糖肽,實(shí)現(xiàn)O-糖肽的選擇性富集。最終,他們利用該方法從人腎臟、T細(xì)胞和血清3種樣本中共鑒定到來(lái)自1 000多個(gè)糖蛋白的超過(guò)3 000個(gè)O-糖基化位點(diǎn)。
酰肼化學(xué)法首先氧化糖鏈上的順式鄰二羥基生成醛基,隨后醛基與酰肼樹脂上的氨基不可逆反應(yīng)形成共價(jià)的腙鍵,實(shí)現(xiàn)糖肽的捕獲;最后N-糖鏈通過(guò)PNGase F酶或者化學(xué)法去除,實(shí)現(xiàn)富集肽段的釋放。在早期受限于質(zhì)譜檢測(cè)技術(shù),質(zhì)譜的碎裂模式和采集速度不適合分析完整糖肽,而酰肼化學(xué)法通過(guò)簡(jiǎn)化蛋白質(zhì)糖基化,在肽段層次有效定位了N-糖基化位點(diǎn),因而得到了廣泛的應(yīng)用。近年來(lái),隨著質(zhì)譜儀的發(fā)展和譜圖解析軟件的開發(fā),實(shí)現(xiàn)了對(duì)完整糖肽的高可信度表征。酰肼化學(xué)法的實(shí)驗(yàn)流程復(fù)雜,尤其是丟失了糖鏈的信息,使其難以應(yīng)用于位點(diǎn)特異性糖型的研究。
多孔石墨碳(porous graphitized carbon, PGC)是一種新型的碳材料[24],其通過(guò)保留傳統(tǒng)反相中不能保留的高極性化合物而實(shí)現(xiàn)糖肽的富集。但是目前PGC對(duì)完整糖肽的保留機(jī)制(偶極、親水性、電荷誘導(dǎo)、分散等)并不是很清楚。Xue等[25]系統(tǒng)地研究和比較了硼酸化學(xué)、ZIC-HILIC和PGC在富集完整N-糖肽方面的性能,發(fā)現(xiàn)硼酸化學(xué)傾向于捕獲高甘露糖型糖肽,ZIC-HILIC富集得到的N-糖肽最多且無(wú)偏向性,而PGC不適合富集肽段序列較長(zhǎng)的糖肽,尤其是胰蛋白酶消化肽段。
生物正交法是一種靶向標(biāo)記和富集糖蛋白的新方法。該方法結(jié)合了代謝標(biāo)記和點(diǎn)擊化學(xué),首先在細(xì)胞培養(yǎng)中引入含有生物正交官能團(tuán)(如疊氮化物、炔烴或酮等)的非天然糖類,對(duì)細(xì)胞內(nèi)糖類化合物進(jìn)行代謝標(biāo)記,隨后通過(guò)點(diǎn)擊化學(xué)反應(yīng)將標(biāo)記的糖蛋白與親和探針共價(jià)結(jié)合,從而實(shí)現(xiàn)糖蛋白的捕獲和富集。Hubbard等[26]將該方法應(yīng)用于富集細(xì)胞表面糖蛋白,并從前列腺癌細(xì)胞株中鑒定到超過(guò)70種細(xì)胞表面糖蛋白。Spiciarich等[27]進(jìn)一步將該方法應(yīng)用于體外培養(yǎng)的人體組織,他們分別對(duì)正常和癌變的前列腺組織進(jìn)行切片和培養(yǎng),并從前列腺癌組織中鑒定出一些高表達(dá)的糖蛋白,拓展了該方法的臨床應(yīng)用。目前該方法廣泛應(yīng)用于糖蛋白層次的富集,在位點(diǎn)特異性蛋白質(zhì)糖基化的鑒定上仍有很大的發(fā)展空間。
在自下而上的糖蛋白質(zhì)組學(xué)中,完整糖肽經(jīng)分離和富集后進(jìn)入高分辨質(zhì)譜儀,得到含豐富碎片離子的譜圖,隨后通過(guò)譜圖解析技術(shù)實(shí)現(xiàn)對(duì)完整糖肽和糖蛋白的表征[28]?;谫|(zhì)譜的糖蛋白質(zhì)組學(xué)方法具有高靈敏度和高質(zhì)量精度等優(yōu)點(diǎn),但是對(duì)位點(diǎn)特異性蛋白質(zhì)糖基化的鑒定和定量依賴于有效的質(zhì)譜分析方法和譜圖解析策略的發(fā)展。如今,這兩項(xiàng)重大突破顯著促進(jìn)了位點(diǎn)特異性完整糖肽的表征,分別是:用于獲得豐富糖鏈和肽段碎片信息的質(zhì)譜解離方法的發(fā)展;用于解析完整糖肽質(zhì)譜譜圖的檢索引擎的開發(fā)[29]。
復(fù)雜生物樣品中的完整糖肽經(jīng)過(guò)分離和富集后,進(jìn)入生物質(zhì)譜進(jìn)行糖蛋白質(zhì)組學(xué)分析。不同類型的生物質(zhì)譜有不同的電離技術(shù)、碎裂方式和數(shù)據(jù)采集模式等,在糖蛋白質(zhì)組學(xué)分析中具有各自的特點(diǎn)與優(yōu)勢(shì)。目前用于糖蛋白質(zhì)組學(xué)分析的質(zhì)譜電離技術(shù)主要有基質(zhì)輔助激光解析電離(matrix-assisted laser desorption/ionization, MALDI)和電噴霧電離(electrospray ionization, ESI)這兩種代表性的軟電離技術(shù)。MALDI-MS是一個(gè)能有效地分析N-糖鏈的質(zhì)譜技術(shù),其操作簡(jiǎn)單快速,并且能分析極微量的樣品,這對(duì)珍貴的臨床樣本來(lái)說(shuō)非常重要。由于腫瘤的發(fā)生發(fā)展伴隨著異常的糖基化修飾,這種異常糖基化一定程度表現(xiàn)在糖蛋白糖鏈豐度的變化,因此利用MALDI-MS能有效地對(duì)糖鏈變化進(jìn)行檢測(cè)。Ren等[30]提出了一個(gè)用于腫瘤篩查的糖鏈生物標(biāo)志物,稱為IgG半乳糖比值(IgG Gal-ratio)。他們通過(guò)MALDI-MS測(cè)定血清IgG中無(wú)半乳糖基糖鏈(G0)、單半乳糖基糖鏈(G1)和雙半乳糖基糖鏈(G2)這3種N-糖鏈的相對(duì)強(qiáng)度,并進(jìn)一步計(jì)算G0/(G1+G2×2)的比值。他們發(fā)現(xiàn)該比值能夠有效地區(qū)分12種癌癥(胃癌、肝癌、肺癌、卵巢癌、結(jié)腸直腸癌、食道癌、胰腺癌、腎癌、前列腺癌、膀胱癌、乳腺癌和宮頸癌)和非癌癥對(duì)照,作為一種用于癌癥篩查的非侵襲性的生物標(biāo)記物有著巨大的潛力。但是MALDI-MS也有著很大的局限性,比如其碎裂能量導(dǎo)致唾液酸和巖藻糖的丟失;分析糖鏈時(shí)不能區(qū)分糖型異構(gòu)體;分析完整糖肽時(shí)不能實(shí)現(xiàn)糖基化位點(diǎn)定位等等。和MALDI-MS相比,ESI-MS在檢測(cè)分析完整糖肽方面有著更廣泛的應(yīng)用,例如強(qiáng)負(fù)電性的唾液酸不能在MALDI-MS中得到良好的信號(hào)響應(yīng)但能在ESI-MS中被檢測(cè)到。尤其是ESI-MS前端串聯(lián)液相色譜(LC-ESI-MS)能夠在線分離復(fù)雜生物樣本,降低了樣品復(fù)雜度,提高了檢測(cè)能力。進(jìn)一步,液相色譜串聯(lián)多級(jí)質(zhì)譜(LC-MSn)能獲得更加豐富的完整糖肽的特征碎片離子,能在蛋白質(zhì)組學(xué)層次實(shí)現(xiàn)完整糖肽的組成和位點(diǎn)的鑒定,進(jìn)一步增加了完整糖肽分析的深度,是目前最可靠的分離同分異構(gòu)體的質(zhì)譜方法。
在糖蛋白質(zhì)組學(xué)質(zhì)譜分析中,完整糖肽同時(shí)含有糖鏈和肽段,經(jīng)質(zhì)譜碎裂后產(chǎn)生碎片離子的形式更加多樣化,包括肽段碎片離子(b/y離子;c/z離子)和糖碎片離子(Y離子)等。完整糖肽分析中常用的質(zhì)譜碎裂方式有碰撞誘導(dǎo)解離(collision-induced dissociation, CID)、高能量碰撞解離(higher-energy collision dissociation, HCD)、電子捕獲解離(electron capture dissociation, ECD)、電子轉(zhuǎn)移解離(electron-transfer dissociation, ETD)、電子轉(zhuǎn)移/高能碰撞解離(electron-transfer/higher-energy collision dissociation, EThcD)等。CID和HCD都是基于碰撞能量再分配的原理碎裂糖鏈和肽段,并主要形成b/y離子和Y離子。完整糖肽中糖苷鍵和肽鍵裂解所需的能量差異大,CID的碎裂能量低,主要碎裂糖苷鍵并產(chǎn)生豐富的Y離子。從CID譜圖中能夠有效地分析糖鏈的組成和結(jié)構(gòu),但是不能獲得糖基化位點(diǎn)和肽段序列的信息,應(yīng)用范圍受限。和CID相比,HCD的碎裂能量更高、能量分布更均勻和激活時(shí)間更短,因此HCD能裂解完整糖肽并產(chǎn)生豐富的b/y離子和Y離子。研究表明,不同的HCD能量裂解完整糖肽所產(chǎn)生的碎片離子種類大不相同,較低HCD能量?jī)A向于產(chǎn)生Y離子,而較高HCD能量?jī)A向于產(chǎn)生b/y離子[31]。因此,與單一HCD能量相比,多級(jí)HCD能量可以產(chǎn)生更豐富的互補(bǔ)碎片離子峰,因而獲得更加詳細(xì)的糖肽結(jié)構(gòu)信息。針對(duì)完整糖肽的肽段碎片離子少、多級(jí)碎裂中鑒定效率低的問題,Qin等[32]報(bào)道了一種基于酶輔助的擬多級(jí)譜策略用于N-完整糖肽的表征。他們通過(guò)匹配完整N-糖肽質(zhì)譜數(shù)據(jù)和去糖基化后的肽段質(zhì)譜數(shù)據(jù)之間的保留時(shí)間、相對(duì)分子質(zhì)量等,確定完整糖肽的肽段序列和糖鏈的組成,實(shí)現(xiàn)完整糖肽的高效鑒定。最后他們將該策略應(yīng)用于人源肝癌和癌旁組織之間N-糖基化的差異分析,共鑒定到4 471個(gè)位點(diǎn)特異性N-糖型,是當(dāng)時(shí)肝組織N-糖蛋白質(zhì)組的最大數(shù)據(jù)集,并篩選到多個(gè)候選差異蛋白,有望提高肝癌診斷的準(zhǔn)確性。ECD和ETD主要碎裂完整糖肽的肽段骨架并產(chǎn)生豐富的c/z離子,有利于糖基化位點(diǎn)和肽段序列的鑒定,是目前完整糖肽結(jié)構(gòu)解析的強(qiáng)大工具之一。但是ECD和ETD裂解完整糖肽時(shí),一方面依賴于母離子的電荷與質(zhì)荷比導(dǎo)致碎裂效率低,另一方面能保持糖鏈結(jié)構(gòu)導(dǎo)致糖鏈碎片離子信息的缺失,使其分析靈敏度差,應(yīng)用受限。隨著技術(shù)的發(fā)展,EThcD是近年來(lái)新的集成碎裂技術(shù)[33],整合了HCD和ETD這兩種碎裂模式的優(yōu)勢(shì),能產(chǎn)生完整糖肽的b/y/c/z多種碎片離子,獲得更加豐富的特征離子信號(hào)用于完整糖肽的結(jié)構(gòu)解析。
受限于早期質(zhì)譜條件,基于質(zhì)譜的糖蛋白質(zhì)組學(xué)研究策略依賴于對(duì)完整糖肽的糖鏈和肽段的分別分析。盡管這種策略能簡(jiǎn)化蛋白質(zhì)糖基化的鑒定,但是缺失糖基化異質(zhì)性和位點(diǎn)特異性等信息,不能實(shí)現(xiàn)完整糖肽的深入分析。隨著完整糖肽富集技術(shù)的優(yōu)化和質(zhì)譜檢測(cè)技術(shù)的革新,糖蛋白質(zhì)組學(xué)分析獲得了豐富的完整糖肽碎片離子,得到了高質(zhì)量的質(zhì)譜數(shù)據(jù)。為了對(duì)這些質(zhì)譜數(shù)據(jù)進(jìn)行自動(dòng)、快速、高靈敏度和高可信度的解析,開發(fā)完整N-和O-糖肽的譜圖解析策略和相應(yīng)數(shù)據(jù)分析軟件有著重要意義。
在N-糖基化中,N-糖鏈存在五糖核心但是其完整結(jié)構(gòu)的多樣性高,使得完整N-糖肽譜圖的復(fù)雜性高,為準(zhǔn)確地解析蛋白質(zhì)N-糖基化數(shù)據(jù)帶來(lái)了困難。相比于N-糖基化,O-糖基化的譜圖解析要更加復(fù)雜,一方面O-糖鏈沒有固定核心結(jié)構(gòu)同時(shí)類型繁多,另一方面一條肽段上可能存在多個(gè)O-糖基化位點(diǎn),這些為高通量分析完整O-糖肽帶來(lái)了極大的挑戰(zhàn)。近年來(lái),針對(duì)完整N-和O-糖肽經(jīng)質(zhì)譜碎裂后獲得的各種碎片離子特征,研究人員開發(fā)了一些譜圖解析策略來(lái)鑒定完整糖肽,以期實(shí)現(xiàn)對(duì)復(fù)雜生物樣本完整糖肽的大規(guī)模分析。
Cheng等[34]開發(fā)了一個(gè)高通量的完整N-糖肽分析軟件平臺(tái)ArMone,用于解析N-糖基化修飾位點(diǎn)以及糖鏈結(jié)構(gòu)。通過(guò)平行的LC-MS/MS分析完整糖肽和其對(duì)應(yīng)的去糖基化肽段,他們發(fā)現(xiàn)這兩類肽段在色譜保留時(shí)間上具有一致性。因此他們首先根據(jù)去糖基化肽段HCD譜圖實(shí)現(xiàn)肽段序列的高可信度鑒定,隨后通過(guò)匹配糖數(shù)據(jù)庫(kù)和含氧鎓離子的完整糖肽HCD譜圖,根據(jù)N-糖鏈的五糖核心確定糖鏈信息,最后實(shí)現(xiàn)完整N-糖肽的鑒定。他們利用該方法從人源胚胎腎細(xì)胞系中鑒定到了2 249條非冗余的糖肽序列及糖鏈結(jié)構(gòu),這是當(dāng)時(shí)最大的完整N-糖肽鑒定數(shù)據(jù)集。Byonic是一個(gè)商用檢索軟件[35],能分別檢索和鑒定完整N-和O-糖肽。它通過(guò)在糖數(shù)據(jù)庫(kù)中添加了人源及哺乳動(dòng)物中常見的N-和O-糖型,將每個(gè)糖型視為譜圖數(shù)據(jù)庫(kù)搜索的可變修飾,從HCD或ETD譜圖中鑒定完整糖肽。GPQuest是一種基于HCD譜圖鑒定位點(diǎn)特異性完整N-糖肽的算法[36]。它首先采用不同的切糖鏈鑒定策略建立了一個(gè)肽段譜圖庫(kù),隨后通過(guò)匹配譜圖庫(kù)和完整糖肽的HCD譜圖鑒定肽段序列,推斷糖鏈質(zhì)量,最后實(shí)現(xiàn)完整糖肽的鑒定。pGlyco是一個(gè)精準(zhǔn)分析N-糖蛋白質(zhì)組學(xué)的軟件[31],它首先利用完整N-糖肽經(jīng)階梯HCD能量碎裂獲得譜圖,通過(guò)與糖數(shù)據(jù)庫(kù)匹配以鑒定糖組成,隨后通過(guò)與蛋白質(zhì)組數(shù)據(jù)庫(kù)匹配以鑒定肽段序列,最后從糖鏈、多肽和糖肽3個(gè)層面綜合控制假陽(yáng)性率,增強(qiáng)了完整N-糖肽鑒定的準(zhǔn)確性(見圖3)。他們利用該數(shù)據(jù)分析平臺(tái)分別分析了5個(gè)小鼠組織(大腦、心臟、肝臟、腎臟、肺)并得到了一個(gè)大規(guī)模的N-糖蛋白質(zhì)組數(shù)據(jù)集,包括了來(lái)自955個(gè)糖蛋白的1 988個(gè)N-糖基化位點(diǎn)上的10 009個(gè)不同的位點(diǎn)特異性N-糖鏈。
圖3 pGlyco 2.0檢索策略用于解析完整N-糖肽HCD譜圖[31]
Mao等[37]提出了一種分析完整O-糖肽HCD譜圖的新方法O-Search,該方法不在Ser/Thr殘基上設(shè)置可變修飾,而是在肽段層次檢測(cè)O-糖基化導(dǎo)致的質(zhì)量偏移,其分析流程主要包含:(1)通過(guò)豐度最高的兩個(gè)鎓離子(HexNAc-2H2O-CH2O+,m/z138.05; HexNAc+,m/z204.09)過(guò)濾譜圖,只保留糖肽譜圖;(2)從糖肽譜圖母離子中扣除可能的O-糖組合的質(zhì)量,同時(shí)移除譜圖中可能存在的Y離子,生成理論去糖峰譜圖;(3)對(duì)所有去糖峰譜圖,不需要設(shè)置任何O-糖基化的可變修飾,進(jìn)行常規(guī)數(shù)據(jù)庫(kù)檢索,得到肽段序列的鑒定(見圖4)。與傳統(tǒng)設(shè)置O-糖基化可變修飾的檢索方法相比,O-Search采用O-糖基化質(zhì)量偏移檢索策略,可以加快檢索速度,提高86%的完整糖肽鑒定量,具有較高的靈敏度。同時(shí),O-Search能夠分析鑒定更多的O-糖結(jié)構(gòu),適合O-糖基化微觀異質(zhì)性的分析。MSFragger-Glyco是一個(gè)用于高靈敏度分析完整N-和O-糖肽的檢索工具[38],它使用了MSFragger開發(fā)的離子索引的開放修飾搜索方法和O-糖基化質(zhì)量偏移檢索策略,對(duì)文獻(xiàn)N-和O-糖蛋白質(zhì)組學(xué)數(shù)據(jù)進(jìn)行再分析,能分別增加80%的注釋N-糖肽譜圖和一倍多的注釋O-糖肽譜圖。O-Pair Search是一種鑒定O-糖肽和O-糖基化位點(diǎn)的方法,它利用了基于碰撞解離和電子解離的質(zhì)譜技術(shù)得到HCD-EThcD成對(duì)譜圖,首先根據(jù)HCD譜圖,通過(guò)離子索引的開放修飾檢索鑒定完整O-糖肽;隨后根據(jù)EThcD譜圖,利用圖論的方法進(jìn)行修飾位點(diǎn)的定位[39]。
圖4 O-search檢索策略用于解析完整O-糖肽HCD譜圖[37]
蛋白質(zhì)糖基化作為一種重要的翻譯后修飾,普遍發(fā)生在細(xì)胞膜蛋白和分泌蛋白中,在生物識(shí)別、信號(hào)轉(zhuǎn)導(dǎo)和細(xì)胞通訊中發(fā)揮了重要的生物學(xué)功能。隨著完整糖肽富集技術(shù)、質(zhì)譜技術(shù)和譜圖解析策略的革新,基于質(zhì)譜的糖蛋白質(zhì)組學(xué)成為分析位點(diǎn)特異性蛋白質(zhì)糖基化的有力工具,并且使不同復(fù)雜生物體系中的糖蛋白質(zhì)組學(xué)得到了越來(lái)越深入的研究。
用于富集完整糖肽的新材料基本都是基于現(xiàn)有的原理,優(yōu)化材料的一些特性,比如親水性、親電性等,從而提高富集性能??紤]到糖蛋白質(zhì)組學(xué)的臨床應(yīng)用,完整糖肽富集新技術(shù)更多地將富集方法整合進(jìn)自動(dòng)化的工作流程,以減少人工操作帶來(lái)的誤差、提高分析重現(xiàn)性和加大實(shí)驗(yàn)效率,使其更適應(yīng)蛋白質(zhì)糖基化相關(guān)的生物標(biāo)志物的發(fā)現(xiàn)和疾病生理病理的研究等。質(zhì)譜方法在近十年得到了飛速的發(fā)展,但適用于蛋白質(zhì)糖基化的質(zhì)譜方法依舊有很大的發(fā)展空間。除了本綜述介紹的質(zhì)譜碎裂方式以外,質(zhì)譜數(shù)據(jù)采集模式,比如數(shù)據(jù)依賴采集(data dependent acquisition, DDA)、數(shù)據(jù)非依賴性采集(data independent acquisition, DIA)、MRM、平行反應(yīng)監(jiān)測(cè)技術(shù)(parallel reaction monitoring technology, PRM)等,在糖蛋白質(zhì)組學(xué)中有很大的應(yīng)用前景。相對(duì)應(yīng)的,隨著糖肽富集效率的提高和質(zhì)譜方法的革新,譜圖解析技術(shù)也得到了飛速的發(fā)展,其中在基于理論碎裂匹配策略或者譜圖庫(kù)匹配策略的完整糖肽鑒定方法中,數(shù)據(jù)分析的通量和假陽(yáng)性的控制都非常關(guān)鍵。綜上所述,糖蛋白質(zhì)組學(xué)的新技術(shù)從富集方法、質(zhì)譜方法、數(shù)據(jù)分析方法等層面都有很大的發(fā)展空間,這些也為糖蛋白質(zhì)組學(xué)應(yīng)用于臨床疾病生物標(biāo)志物的發(fā)現(xiàn)和蛋白質(zhì)糖基化生物功能的探究等生命健康領(lǐng)域提供了強(qiáng)大的支持。