趙曉曉, 胡 昊, 趙雯思,3, 劉 萍, 譚敏佳,3*
(1. 南京中醫(yī)藥大學(xué)新中藥學(xué)院, 江蘇 南京 210023; 2. 中國科學(xué)院上海藥物研究所新藥研究國家重點實驗室, 上海 201203; 3. 中國科學(xué)院大學(xué), 北京 100049)
蛋白質(zhì)C端及其翻譯后修飾(PTMs,如脂質(zhì)化、乙?;⒘姿峄?參與多種生物學(xué)過程,如蛋白質(zhì)定位、蛋白質(zhì)相互作用、維持蛋白質(zhì)穩(wěn)定性等[1-4]。蛋白質(zhì)C端異常會引起代謝性疾病、神經(jīng)退行性疾病、心血管疾病等[5-8]多種疾病。因此,蛋白質(zhì)C端的系統(tǒng)性表征對于生物學(xué)機制的解析具有重要意義。
盡管“鳥槍法”蛋白質(zhì)組學(xué)在全蛋白質(zhì)組分析方面有很大優(yōu)勢,但由于C端肽段占比少、離子化效率低,蛋白質(zhì)C端的分析效率仍比較低。近年來,基于“鳥槍法”蛋白質(zhì)組學(xué)發(fā)展形成的“蛋白質(zhì)C端組學(xué)(C-terminomics)”技術(shù)使系統(tǒng)表征蛋白質(zhì)C端成為可能。該技術(shù)主要有兩種策略:1)通過對蛋白質(zhì)C端羧基進行選擇性標(biāo)記并進行親和富集,直接捕獲蛋白質(zhì)C端的正向富集策略[9-11]; 2)通過化學(xué)衍生化和多種分離技術(shù)去除蛋白N端和內(nèi)部肽段,進一步洗脫獲得蛋白質(zhì)C端的反向富集策略[12,13]。后者不僅可以富集普通C端肽段,還可同時富集蛋白質(zhì)C端α-COOH上含有PTMs的C端肽段。尤其是利用基于聚合物的反向富集策略[14]進行蛋白質(zhì)C端的研究,可以實現(xiàn)多個樣本平行操作,大大提高了樣本的制備通量,并且不需專門的儀器設(shè)備,在普通生化實驗室即可完成,應(yīng)用范圍更加廣泛。
近年來,研究人員基于聚合物富集策略,發(fā)展了多種相關(guān)方法,通過不斷優(yōu)化,改善了C端肽段的鑒定深度[15-20]。Zhang等[18]通過胰蛋白酶(trypsin)切割精氨酸殘基C端(ArgC型酶切)的方式,獲得了369個蛋白質(zhì)C端;Du等[16]通過重組賴氨酰肽鏈內(nèi)切酶(LysC)切割賴氨酸殘基C端(LysC型酶切)的方式,獲得了781個蛋白質(zhì)C端;在本課題組前期LAACTer策略研究[15]中,利用胰蛋白酶鏡像酶(LysargiNase)切割賴氨酸和精氨酸殘基N端(LysN/ArgN型酶切),獲得了834個蛋白質(zhì)C端。這些方法使用不同的特異性酶切方式,因此理論上對C端肽段有著各自獨特的鑒定范圍,具有一定的互補性。而相比之下,基于精氨酸切割(Arg型酶切)的方法對C端肽段的鑒定深度仍有待提高。隨著蛋白質(zhì)C端在疾病中的作用越來越受到關(guān)注,為了鑒定一些重要的蛋白質(zhì)C端,基于Arg型酶切的蛋白質(zhì)C端組學(xué)方法在鑒定深度上亟待進一步突破。
為解決這一問題,本研究對基于Arg型酶切方法進行了優(yōu)化和評估。建立了基于“V型”過濾裝置的“一鍋法”富集平臺,并對蛋白水平乙?;姆磻?yīng)條件進行了系統(tǒng)性的優(yōu)化。提出了過量有機小分子可能是聚合物反向富集策略中干擾C端肽段鑒定的關(guān)鍵因素,針對性地優(yōu)化了基于固相萃取槍頭膜片過濾柱(StageTip)的樣品分離過程,并和已報道的研究結(jié)果進行了對比和評估;探索了使用不同酶切方式與不同肽段衍生化修飾的組合對蛋白質(zhì)C端鑒定數(shù)目和種類的影響,旨在利用“LysargiNase酶切+肽段N端乙酰化”策略進一步擴大蛋白質(zhì)C端的鑒定范圍。
JY92-IIN細胞粉碎機購于寧波新芝科技股份有限公司;5424R高速離心機購于德國Eppendorf AG公司;SPD111V-230真空離心濃縮儀、Q-Exactive質(zhì)譜、Orbitrap Fusion質(zhì)譜、納升液相色譜EASY-nLC 1000購于美國Thermo Fisher Scientific公司。
蛋白酶抑制劑購于瑞士Roche公司;N-羥基琥珀酰亞胺乙酸酯(Ac-NHS)和乙醇胺(EA)購于北京百靈威科技有限公司;LysargiNase和胰蛋白酶購于北京華利世科技有限公司;氯化鈣(CaCl2)、鹽酸胍(GnHCl)、N-羥基琥珀酰亞胺(NHS)和N-(3-(二甲基氨基)丙基)-乙基二亞胺鹽酸(EDC)購于國藥集團化學(xué)試劑有限公司;4-(2-羥乙基)哌嗪-1-乙磺酸(HEPES)、2-(N-嗎啉代)乙磺酸(MES)、氰基硼氫化鈉(NaBH3CN)、二硫蘇糖醇(DTT)、碘乙酰胺(IAA)、三氟乙酸(TFA)、聚丙烯基胺(PAA)、甲醛(HCHO)、甲酸銨(AF)均購于美國Sigma公司。Durashell C18填料購于天津博納艾杰爾科技有限公司;Empore C18固相萃取膜片購于美國3M公司;Amicon Ultra-0.5 filters(10 kDa 截止)超濾管和ZipTip C18脫鹽柱購于美國Millipore公司。
將人HEK 293T細胞培養(yǎng)于含有10%胎牛血清、100 U/mL青霉素和100 mg/L鏈霉素雙抗的DMEM培養(yǎng)基中。向獲得的濕細胞沉淀中加入10倍體積裂解液(3 mol/L GnHCl、100 mmol/L HEPES、2%(質(zhì)量分?jǐn)?shù))蛋白酶抑制劑,pH 7.0),冰上靜置30 min后使用細胞破碎儀進行超聲處理,以15 000 r/min離心10 min,獲取上清。按照BCA方法進行蛋白質(zhì)濃度定量。加入終濃度為5 mmol/L的DTT,于56 ℃反應(yīng)30 min,最后加入終濃度為15 mmol/L的IAA,室溫避光反應(yīng)30 min。
取100 μg還原烷基化后的樣本,用3 mol/L GnHCl和100 mmol/L HEPES,pH 7.0的緩沖液將樣本稀釋至1 μg/μL。然后加入終濃度為5 mmol/L的Ac-NHS(pH 7.0),室溫反應(yīng)30 min,重復(fù)反應(yīng)3次。再加入終濃度為500 mmol/L的氨水(NH3·H2O),室溫反應(yīng)15 min。按蛋白質(zhì)與酶的質(zhì)量比為50∶1添加胰蛋白酶,調(diào)pH 8.0, 于37 ℃孵育16 h。樣品轉(zhuǎn)干后,取10 μg樣本用ZipTip C18脫鹽柱進行除鹽。每組樣本進行2次技術(shù)重復(fù)。
取300 μg還原烷基化后的樣本,置于0.5 mL超濾管中,加入緩沖液A(100 mmol/L HEPES、3 mol/L GnHCl, pH 7.0)至500 μL,在11 600 r/min的轉(zhuǎn)速下超濾至50 μL,重復(fù)兩次。使用緩沖液A調(diào)節(jié)樣本質(zhì)量濃度至1 μg/μL,加入終濃度為5 mmol/L的Ac-NHS,室溫反應(yīng)30 min,重復(fù)反應(yīng)3次。再加入緩沖液B(1 mol/L EA、2 mol/L GnHCl、0.2 mol/L MES, pH 6.0)至500 μL,在11 600 r/min的轉(zhuǎn)速下超濾至50 μL。使用緩沖液B調(diào)節(jié)樣本質(zhì)量濃度至1 μg/μL,加入終濃度為20 mmol/L的NHS和100 mmol/L的EDC,于37 ℃反應(yīng)2 h。再次補加相同終濃度的EDC,反應(yīng)2 h。
在上述樣本中加入胰蛋白酶酶切體系(20 mmol/L HEPES、0.4 mol/L GnHCl, pH 8.0)至500 μL,在11 600 r/min的轉(zhuǎn)速下超濾至50 μL,重復(fù)3次。使用酶切體系調(diào)節(jié)樣本質(zhì)量濃度至1 μg/μL,按蛋白質(zhì)與酶的質(zhì)量比為50∶1添加胰蛋白酶,于37 ℃孵育16 h。再按蛋白質(zhì)與酶的質(zhì)量比為100∶1添加胰蛋白酶,于37 ℃孵育4 h。
在研究不同酶切方式和不同肽段衍生化修飾的組合對C端肽段鑒定數(shù)目和種類影響的實驗中,引入LysargiNase代替胰蛋白酶進行酶切消化,其酶切體系為20 mmol/L HEPES和10 mmol/L CaCl2, pH 8.0,其他條件與胰蛋白酶酶切處理方式相同。
對胰蛋白酶酶切消化產(chǎn)生的肽段分別進行乙酰化和二甲基化反應(yīng)。LysargiNase酶切后的樣本進行同樣的修飾反應(yīng)。對于乙?;揎?加入終濃度為5 mmol/L的Ac-NHS, pH 7.0,室溫反應(yīng)30 min,重復(fù)反應(yīng)3次;對于二甲基化修飾,加入終濃度為20 mmol/L的HCHO和10 mmol/L的NaBH3CN,調(diào)節(jié)pH 6.0,于37 ℃反應(yīng)2 h,再次加入相同濃度的HCHO和NaBH3CN,反應(yīng)2 h。每組樣本進行2次技術(shù)重復(fù)。
將反應(yīng)完畢后的樣本在SPD111V-230真空離心濃縮儀中濃縮至150 μL,各自加入150 μL 2 mol/L PAA、50 μL乙腈以及終濃度為20 mmol/L的NHS和100 mmol/L的EDC,于37 ℃反應(yīng)2 h,補加相同終濃度的EDC,反應(yīng)2 h。在11 600 r/min的轉(zhuǎn)速下離心收集濾液,加入15%(v/v)乙腈水溶液至300 μL,相同轉(zhuǎn)速下離心收集濾液,重復(fù)兩次。將濾液合并轉(zhuǎn)干凍存。
配制堿性溶液體系:溶液A為98%(v/v)乙腈水溶液(含5 mmol/L AF),溶液B為5 mmol/L AF水溶液(pH 10.0)。
堿性StageTip柱的制備:將Empore C18固相萃取膜片置于200 μL槍頭底部,稱取6 mg Durashell C18填料,用200 μL溶液B混勻,加入上述槍頭內(nèi),以1 000 r/min離心5 min,制成StageTip。然后加入200 μL溶液B,以1 000 r/min離心5 min洗滌StageTip柱,再加入溶液A-溶液B (1∶1, v/v)的混合液200 μL,以1 000 r/min離心5 min洗滌StageTip柱,最后加入200 μL溶液A,以1 000 r/min離心10 min洗滌StageTip柱。
基于StageTip柱的樣品分離:將胰蛋白酶酶切后進行二甲基化修飾的樣本用200 μL溶液A溶解后,加入堿性StageTip柱,以1 000 r/min離心10 min,使樣本充分結(jié)合在StageTip柱中的Durashell C18填料上。最后使用5%、10%、15%、20%、25%、30%和80%(v/v)的乙腈水溶液(均含0.1%TFA)各200 μL進行洗脫,將收集的濾液轉(zhuǎn)干后,用ZipTip C18脫鹽柱進行除鹽。
1.8.1乙酰化優(yōu)化實驗
EASY-nLC 1000高效液相色譜串聯(lián)Q-Exactive用于乙?;瘍?yōu)化實驗中的質(zhì)譜檢測。自制C18(粒徑3 μm,孔徑9 nm,美國Dikma Technologies公司)毛細管柱(100 mm×75 μm)。流動相A:2%(v/v)乙腈水溶液(含0.1%(v/v)FA);流動相B:90%(v/v)乙腈水溶液(含0.1%(v/v)FA);流速:300 nL/min。梯度洗脫程序:0~50 min, 5%B~28%B; 50~53 min, 28%B~48%B; 53~56 min, 48%B~80%B; 56~60 min, 80%B。將1.3節(jié)中除鹽轉(zhuǎn)干后的樣本溶于10 μL流動相A中, 以15 000 r/min高速離心,取4.2 μL上清進行上樣分析。
Q-Exactive質(zhì)譜參數(shù)為:一級分辨率為70 000(m/z200);一級自動增益控制(AGC)為1×106;二級自動增益控制為1×106;最大注射時間為60 ms;掃描范圍為m/z350~1 300;電荷狀態(tài)2~5價;碰撞歸一化能量為30%;動態(tài)排除時間60 s;數(shù)據(jù)依賴采集模式為“TOPN”(N=16)。
1.8.2蛋白質(zhì)C端富集實驗
EASY-nLC 1000高效液相色譜-串聯(lián)Orbitrap Fusion用于蛋白質(zhì)C端富集實驗中的質(zhì)譜檢測。流速300 nL/min。梯度洗脫程序:0~13 min, 5%B~7%B; 13~33 min, 7%B~10%B; 33~88 min, 10%B~25%B; 88~110 min, 25%B~45%B; 110~113 min, 45%B~80%B; 113~120 min, 80%B。將1.7節(jié)中除鹽轉(zhuǎn)干后的樣本溶于10 μL流動相A中,以15 000 r/min高速離心,取4.2 μL上清進行上樣分析。
Orbitrap Fusion質(zhì)譜參數(shù)為:一級分辨率為120 000(m/z200);一級自動增益控制(AGC)為5×105;二級自動增益控制為7×103;最大注射時間為50 ms;掃描范圍為m/z300~1 300;電荷狀態(tài)1~6價;碰撞歸一化能量為32%;動態(tài)排除時間60 s;數(shù)據(jù)依賴采集模式為“TOP speed”(循環(huán)時間3 s)。
質(zhì)譜產(chǎn)生的原始數(shù)據(jù)由可以調(diào)用Mascot 2.3.0搜索引擎的Proteome Discoverer 2.2按照UniProt(homosapiens)數(shù)據(jù)庫(版本2018.7, 95 128條序列)進行搜庫。
乙?;瘍?yōu)化實驗中,統(tǒng)計乙酰化標(biāo)記效率的搜庫參數(shù)設(shè)置:酶切方式為胰蛋白酶,最大漏切位點為3個,固定修飾為Cys還原烷基化,可變修飾為Lys/Ser/Thr/Tyr乙?;?、蛋白質(zhì)N端乙?;?、Met氧化。統(tǒng)計蛋白質(zhì)C端數(shù)目的搜庫參數(shù)設(shè)置如下:酶切方式ArgC,最大漏切位點為2個,固定修飾為Cys還原烷基化、Lys乙?;?可變修飾為蛋白質(zhì)N端乙酰化、Met氧化。其他參數(shù)均為一級離子質(zhì)量偏差20 ppm(10-6),二級碎片離子的質(zhì)量偏差0.02 Da。
蛋白質(zhì)C端富集實驗中,搜庫參數(shù)設(shè)置如下:“胰蛋白酶酶切+二甲基化”策略酶切方式為ArgC, “LysargiNase酶切+二甲基化”策略酶切方式為ArgN,兩者的固定修飾均為Met還原烷基化、Asp/Glu乙醇胺修飾、Lys乙?;?、肽段N端二甲基化?!耙鹊鞍酌该盖?乙?;辈呗悦盖蟹绞綖锳rgC, “LysargiNase酶切+乙?;辈呗悦盖蟹绞綖锳rgN,兩者的固定修飾均為Met還原烷基化、Asp/Glu乙醇胺修飾、Lys乙?;?、肽段N端乙酰化。以上4種策略中,可變修飾均為蛋白質(zhì)N端乙醇胺修飾、Met氧化,最大漏切位點為2個,肽段一級離子的質(zhì)量偏差設(shè)為10 ppm,碎片離子的質(zhì)量偏差設(shè)為0.02 Da。
數(shù)據(jù)篩選標(biāo)準(zhǔn):肽譜匹配、肽段及蛋白水平錯誤發(fā)現(xiàn)率(FDR)<0.01,離子分?jǐn)?shù)(ion score)≥20;乙?;瘶?biāo)記實驗中,通過磷酸化修飾功能節(jié)點(ptmRS)≥0.75的標(biāo)準(zhǔn)篩選總肽譜匹配(peptide-spectrum matches, PSMs)計算標(biāo)記效率。
基于聚合物的蛋白質(zhì)C端組學(xué)工作流程涉及多個化學(xué)衍生化步驟(見圖1a),過量的化學(xué)試劑能夠保證反應(yīng)完全進行,但可能也會影響后續(xù)反應(yīng)。為了避免反應(yīng)之間的交叉干擾,通過對Zhang等[18]鑒定蛋白質(zhì)C端實驗流程的改進,建立了“一鍋法”的富集平臺(見圖1b),即在還原烷基化后立即應(yīng)用超濾輔助樣品制備方法(FASP[21])來取代猝滅步驟,從而避免過量的淬滅劑(如二硫蘇糖醇或半胱氨酸等)對下一步乙酰化反應(yīng)的影響。
圖 1 (a)基于聚合物的反向富集流程及(b)C端肽段的“一鍋法”富集平臺Fig. 1 (a) Workflow of polymer-based negative enrichment and (b) platform of one-pot enrichment of C-terminal peptides
圖 2 (a~d)氨基酸殘基上的乙?;瘶?biāo)記效率以及(e)PSMs與(f)蛋白質(zhì)C端的鑒定數(shù)目Fig. 2 (a-d) Acetylation labeling efficiencies on amino acid residues and numbers of identified (e) peptide-spectrum matches (PSMs) and (f) protein C-terminiA: 10 mmol/L Ac-NHS, pH 8.0; B: 10 mmol/L Ac-NHS, pH 7.0; C: 5 mmol/L Ac-NHS, pH 7.0. The experiments in entry Ref. [18], [15], and [24] were performed according to the conditions of the original study.
為了提高樣本的制備效率,嘗試使用濾膜面積更大的“V型”過濾裝置代替原本的平底過濾裝置。當(dāng)樣本體積較大(如500 μL),使用原本的平底過濾裝置,單次溶劑交換過程需要40~50 min,并且濃縮過程中產(chǎn)生的絮狀物或沉淀容易造成濾膜堵塞。而使用“V型”過濾裝置,單次溶劑交換過程僅需約10 min,從而將整個樣品制備時間縮短了4~5 h。并且濾膜位于裝置側(cè)壁,樣本制備過程中不易發(fā)生堵塞。對于200~400 μg的蛋白質(zhì)組,兩種裝置可以提供相似的回收率[21,22]。因此,以下整個研究過程中使用基于“V型”過濾裝置的“一鍋法”樣品制備流程。
蛋白質(zhì)水平賴氨酸乙酰化反應(yīng)是本研究重要的步驟之一,絲氨酸、蘇氨酸、酪氨酸殘基上的副反應(yīng)會導(dǎo)致較高的樣品復(fù)雜度和錯誤鑒定率。為了降低副反應(yīng)的發(fā)生并提高肽段的鑒定數(shù)目,考慮從以下幾個方面對乙?;磻?yīng)條件進行系統(tǒng)性優(yōu)化:1)通過減少反應(yīng)中Ac-NHS的用量以降低副反應(yīng)的標(biāo)記效率;2)根據(jù)以往的報道,蛋白水平乙?;瘶?biāo)記均是在pH 8.0的條件下進行,而堿性條件中組氨酸可能會促進相鄰的羥基與Ac-NHS發(fā)生反應(yīng)[23],嘗試調(diào)節(jié)反應(yīng)的pH值,以減少副反應(yīng)的干擾;3)通過在乙?;瘶?biāo)記后加入終濃度為500 mmol/L的NH3·H2O進行淬滅反應(yīng),在堿性較強的條件下逆轉(zhuǎn)副反應(yīng)的標(biāo)記?;谝陨纤悸?在進行乙酰化反應(yīng)時,分別加入終濃度為10 mmol/L的Ac-NHS(pH 8.0)(條件A)、終濃度為10 mmol/L的Ac-NHS(pH 7.0)(條件B)和終濃度為5 mmol/L的Ac-NHS(pH 7.0)(條件C)。結(jié)果表明,在條件B和條件C中,通過將反應(yīng)pH調(diào)至7.0,并使用NH3·H2O進行淬滅反應(yīng),能夠在保持Lys較高標(biāo)記效率(>98%)(見圖2a)的同時,大幅降低副反應(yīng)的發(fā)生(<4%)(見圖2b~2d)。由于條件C的Ac-NHS用量相對較少,因此后續(xù)實驗選擇條件C作為乙?;揎椀臈l件。
此外,與以往報道[15,18,24]中將Ac-NHS作為乙?;揎椩噭┑姆桨高M行了比較(見圖2b~2d)。結(jié)果顯示,LAACTer方法[15]和Zhang等[18]方法中乙?;母狈磻?yīng)標(biāo)記效率均較高,尤其是Ser的標(biāo)記效率高達8%~12%。Zhou等[24]方法中乙?;母狈磻?yīng)標(biāo)記效率較低,但PSMs數(shù)目明顯減少(見圖2e)。并且使用條件C進行乙酰化反應(yīng)比3種已報道的方案多鑒定到約15%的PSMs,比Zhou等[24]的方法多鑒定到約50%的蛋白質(zhì)C端(見圖2f)。優(yōu)化后的條件能夠使副反應(yīng)的標(biāo)記效率降到最低,且不會影響肽段的鑒定。值得注意的是,這一優(yōu)化不僅有助于C端肽段的可靠鑒定,而且有助于其他Lys?;难芯?如N端組學(xué)[25,26]、乙?;稽c占據(jù)率計算[27,28]、全局組蛋白修飾分析[29,30],以及使用胰蛋白酶進行ArgC型酶切的蛋白質(zhì)組學(xué)研究[31,32]等。
為了提高富集樣本中蛋白質(zhì)C端的鑒定深度,在乙?;瘍?yōu)化結(jié)果的基礎(chǔ)上,以300 μg蛋白質(zhì)為起始量對基于StageTip樣品分離的過程進行了優(yōu)化。首先用200 μL含0.1% TFA的水溶液(pH 3.0)溶解富集后的樣本,加至含0.6 mg Durashell C18填料的酸性StageTip柱(以98%(v/v)乙腈水溶液A′和0.1% TFA水溶液B′代替溶液A、B制備的StageTip柱)進行蛋白質(zhì)C端的鑒定實驗。利用200 μL 20%(v/v)乙腈水溶液(含0.1% TFA)將肽段從StageTip柱中洗脫,在兩次重復(fù)實驗中,C端肽段富集效率達80%和73%,平均鑒定出133條C端肽段,對應(yīng)于113個蛋白質(zhì)C端(見圖3a中TFA-0.6 w/o a-ion)。通過添加a離子進行搜庫(該方式已被證明可以提高C端肽段的鑒定數(shù)目[15,33]),蛋白質(zhì)C端的鑒定數(shù)目有所增加(見圖3a中TFA-0.6),因此后續(xù)的數(shù)據(jù)分析中均考慮添加a離子進行搜庫,但對比LAACTer[15]和Du等[16]的報道,以此方法鑒定的蛋白質(zhì)C端數(shù)目仍然較少。
考慮到肽段水平反應(yīng)中積累了大量有機物(包括乙酰化試劑、有機緩沖劑及其他副產(chǎn)物),尤其是用于肽段與聚合物偶聯(lián)的EDC總量達10~20 mg,這些有機物對肽段的鑒定可能存在多方面的影響,如:1)在脫鹽和nano-LC分離過程中,與Durashell C18填料競爭性結(jié)合,從而導(dǎo)致樣本的嚴(yán)重損失;2)堿性EDC會對肽段信號產(chǎn)生壓制,從而影響檢測靈敏度;3)在數(shù)據(jù)依賴的采集模式中通過占據(jù)MS2的掃描時間,從而減少對肽段的掃描。因此,需要通過對樣品分離過程進行優(yōu)化以減輕這些非肽有機物造成的影響。
由于蛋白質(zhì)C端的α-COOH被酰胺化修飾,推測在堿性環(huán)境中進行樣品分離,C端肽段去質(zhì)子化而極性變小,可能與Durashell C18填料有更高的親和力,因此在洗脫的濾液中能夠鑒定到更多的C端肽段。結(jié)果表明,在1.7節(jié)描述的堿性環(huán)境下進行樣品分離,C端肽段的鑒定數(shù)目約比酸性環(huán)境增加了44%(見圖3a中AF-0.6與TFA-0.6),因此后續(xù)基于StageTip柱的樣本分離過程均在堿性環(huán)境條件下進行。
為了實現(xiàn)肽段和非肽類物質(zhì)更好的分離,同時提升蛋白質(zhì)C端的鑒定數(shù)目,進一步優(yōu)化了StageTip柱的Durashell C18填料用量。結(jié)果表明,相比于使用0.6 mg Durashell C18柱填料進行樣品分離,在使用6 mg柱填料時,蛋白C端的鑒定數(shù)目沒有明顯減少(見圖3a, AF-6),且填料柱體積相對較大,更利于進行將樣本洗脫為多個組分的實驗操作;而使用18 mg柱填料時,大量填料可能由于非特異性吸附作用引起樣品損失,蛋白質(zhì)C端的鑒定數(shù)目約下降了43%(見圖3a, AF-18),不利于后續(xù)進一步的優(yōu)化實驗。
因此,通過使用含6 mg Durashell C18填料的StageTip柱,將樣本依次用5%、10%、15%、20%、25%、30%和80%(v/v)乙腈水溶液(均含0.1% TFA)各200 μL洗脫為7個組分,約93%的蛋白質(zhì)C端僅在一個或兩個組分中鑒定到,表明將樣本洗脫為多個組分后,降低了樣品的復(fù)雜度,達到了比較好的分離效果,更加利于蛋白質(zhì)C端的鑒定。兩次重復(fù)實驗中平均鑒定到616條C端肽段,對應(yīng)547個蛋白質(zhì)C端(見圖3b中7Fr),總數(shù)目約為酸性條件下的4倍。在兩次重復(fù)實驗中,約73%的蛋白質(zhì)C端被鑒定到兩次,皮爾森相關(guān)系數(shù)達0.91,表明實驗的重復(fù)性較好。考慮到蛋白質(zhì)C端數(shù)目約占總PSMs的1%(見圖2e和2f),以300 μg的蛋白質(zhì)組為起始量進行樣品分離過程的優(yōu)化實驗,估計C端肽段僅約為1~3 μg,但將洗脫后的7個組分組合成4個組分(5%、10%+25%、15%+30%、20%+80%)后進行質(zhì)譜分析,鑒定數(shù)目約下降了30%(見圖3b中4Fr),證明了富集后樣本的仍具有較高的復(fù)雜性及需要更高分離度的必要性。
圖 3 (a、b)不同條件下C端肽段和蛋白質(zhì)C端的鑒定數(shù)目以及(c、d)不同策略之間的互補性分析Fig. 3 (a, b) Identification numbers of C-terminal peptides and (c, d) C-termini and complementary analysis of different strategiesa. TFA-0.6 w/o a-ion: 0.1% trifluoroacetic acid (TFA), 0.6 mg Durashell C18, without a-ion; TFA-6: 0.1% TFA, 0.6 mg Durashell C18, with a-ion; AF-0.6: 5 mmol/L ammonium formate (AF), 0.6 mg Durashell C18, with a-ion; AF-6: 5 mmol/L AF, 6 mg Durashell C18, with a-ion; AF-18: 5 mmol/L AF, 18 mg Durashell C18, with a-ion. b. 5%-80%: 5%-80% (v/v) acetonitrile aqueous solution (0.1% TFA); 7Fr: the above seven fractions; 4Fr: the seven fractions combined into four fractions (5%, 10%+25%, 15%+30%, 20%+80%); 7Fr*: only false discovery rate (FDR)<0.01 was required for seven fractions. c. overlap of C-termini identified in this study and LAACTer[15]; d. overlap of C-termini identified in this study and Du’s study[16].
綜上所述,通過將300 μg蛋白質(zhì)組富集的樣品洗脫為7個組分,在兩次重復(fù)實驗中共鑒定出732條C端肽段,對應(yīng)696個蛋白質(zhì)C端,達到本課題組前期LAACTer方法[15]和Du等[16]的鑒定深度(分別鑒定到834和781個蛋白質(zhì)C端)。
與LAACTer策略[15](切割Lys/Arg殘基N端,產(chǎn)生以Lys或Arg開頭且α-N端帶有乙?;揎椀腃端肽段)的研究結(jié)果相比,本研究的策略(切割A(yù)rg殘基C端,產(chǎn)生α-N端帶有二甲基化修飾的C端肽段)鑒定到的蛋白質(zhì)C端種類新增約53%,且重疊部分低于20%,兩者總數(shù)目達1 200以上(見圖3c);與Du等[16]的策略(切割Lys殘基C端,產(chǎn)生α-N端帶有二甲基化修飾的C端肽段)相比,本研究鑒定到的蛋白質(zhì)C端新增約77%,重疊部分低于7%,兩者總數(shù)目達1 380以上(見圖3d)。與Du等[16]的研究(先將蛋白質(zhì)組進行樣品分離,再對每個組分進行富集)相比,本研究中的策略是先進行目的肽段富集再完成樣品分離,避免了樣品損失,大大簡化了操作流程。不同策略中使用不同的蛋白質(zhì)水平衍生化修飾、酶切方式以及肽段N端衍生化方式,產(chǎn)生了含不同α-N末端結(jié)構(gòu)的C段肽段,因此理論上不同策略對蛋白質(zhì)C端的鑒定有著各自獨特的偏好性,兩兩之間的鑒定結(jié)果有所不同,這不僅實現(xiàn)了對蛋白質(zhì)C端的深度鑒定,而且在鑒定范圍上具有獨特性,將為蛋白質(zhì)C端機制的深入研究提供新的有力工具。
值得注意的是,696個蛋白質(zhì)C端是經(jīng)過嚴(yán)格的數(shù)據(jù)篩選得到,即1)肽段水平FDR<0.01; 2)ion score≥20; 3)C端帶有乙醇胺修飾。若按Du等[16]所報道的FDR<0.01的置信標(biāo)準(zhǔn),兩個重復(fù)實驗中平均鑒定到766個蛋白質(zhì)C端,總數(shù)目可達933個(見圖3b, 7Fr*),這是基于聚合物富集C端肽段策略獲得的最大數(shù)據(jù)集之一[15-20]。
圖 4 不同蛋白酶和N端衍生化組合對鑒定蛋白質(zhì)C端的互補性分析Fig. 4 Complementarity of different combinations of proteases and N-terminal modifications on C-terminal identificationa. identified number of C-termini by two repetitions under different strategies; b. overlap of totally identified C-termini; c. correlation of intensity between different experiments; d. comparison of ion scores for peptides commonly identified from indicated methods; e. the MS2 spectra of RLACGVIGAIQ identified by “LysargiNase+acetylation (Ac)”; f. the MS2 spectra of LACGVIGAIQ identified by “trypsin+dimethylation (Dime)”; g. the MS2 spectra of RTLLEQLDDDQ identified by “LysargiNase+Ac”; h. the MS2 spectra of TLLEQLDDDQ identified by “trypsin+Dime”; i. frequency of charge states of the C-terminal peptides; j. frequency of length of the C-terminal peptides; k. frequency of GRAVY score (hydrophilicity is represented by negative value and hydrophobicity is represented by positive value) of the C-terminal peptides; l. frequency of isoelectric point of the C-terminal peptides.
LysargiNase是一種可以特異性切割A(yù)rg和Lys殘基N端的胰蛋白酶鏡像酶[34],可以在酶切所得的肽段N端留下兩種堿性氨基酸。LysargiNase與胰蛋白酶在全蛋白質(zhì)組肽段的鑒定覆蓋范圍具有一定的互補性[34,35],但二者在鑒定Arg特異性酶切所產(chǎn)生的C端肽段上的互補性鮮有研究。同時,考慮到肽段N端的化學(xué)保護基會影響肽段的色譜保留和質(zhì)譜檢測,推測C端肽段N端上不同的衍生化修飾在進行蛋白質(zhì)C端鑒定時可能會存在一定的互補性。
因此,為了進一步擴大蛋白質(zhì)C端鑒定范圍,本研究探索了兩種酶(LysargiNase和胰蛋白酶)和兩種肽段N端衍生化修飾的組合對C端肽段鑒定數(shù)目和種類的影響。在兩次重復(fù)實驗中,通過對未分級分離的C端肽段樣品進行單針質(zhì)譜分析,即僅使用200 μL 20%(v/v)乙腈水溶液(含0.1% TFA)將富集后的樣品從StageTip柱洗脫。在兩次重復(fù)實驗中,4種策略共鑒定到372個蛋白質(zhì)C端。其中“胰蛋白酶+二甲基化”策略鑒定到的蛋白質(zhì)C端數(shù)目共計220個(見圖4a和4b)。新型“LysargiNase+乙?;辈呗栽谇罢卟呗缘幕A(chǔ)上,鑒定到的蛋白質(zhì)C端種類新增105個(見圖4b),兩種策略鑒定的蛋白質(zhì)C端數(shù)目占總數(shù)目的87%,且兩種策略鑒定蛋白質(zhì)C端種類的重疊部分僅為20%(見圖4b),說明兩種策略對于蛋白質(zhì)C端的鑒定范圍具有很強的互補性。
對兩種策略下鑒定到的C端肽段進行對比分析,發(fā)現(xiàn)共有肽段的強度相關(guān)性較差(見圖4c),且離子分?jǐn)?shù)差異較大(見圖4d),表明兩種方法對序列相同的C端肽段具有不同的偏好性。這種偏好性可歸因于兩種方法產(chǎn)生了不同的N末端結(jié)構(gòu):乙?;摩?N端(由“LysargiNase+乙酰化”策略產(chǎn)生)和二甲基化的α-N端(由“胰蛋白酶+二甲基化”策略產(chǎn)生)。一方面,“LysargiNase+乙?;辈呗灾?Arg上胍基強堿性的優(yōu)勢在于較高的離子化效率利于肽段的檢測[36];但該基團的局限可能在于堿性太強而更難碎裂[37,38],從而影響C端肽段的鑒定(見圖4e和4f)。另一方面,“LysargiNase+乙?;辈呗灾笑?N端上的乙酰化修飾通過增強肽段主鏈解離和穩(wěn)定N端碎片離子[39,40],能產(chǎn)生更多的a離子和b離子(見圖4g和4h)。此外,乙?;摩?N端Arg基團的疏水性遠低于二甲基化的α-N端(XLOGP3[41]值分別為-2.84和-0.2),這在很大程度上影響了肽段的色譜保留,從而影響了對蛋白質(zhì)C端的鑒定。
為了深入了解兩種策略對鑒定蛋白質(zhì)C端的偏好性,分析了兩種策略各自“特有的”C端肽段的特征。結(jié)果顯示,“胰蛋白酶+二甲基化”策略更傾向于鑒定長度為11~15的2+肽段(見圖4i和4j)。而“LysargiNase+乙?;辈呗愿鼉A向于鑒定長度為6~15的2+肽段,以及疏水性較低且含有較多酸性殘基的肽段(見圖4k和4l)。
綜上所述,通過使用基于Arg型酶切的新策略“LysargiNase+乙?;?在原有策略“胰蛋白酶+二甲基化”的基礎(chǔ)上進一步擴大了蛋白質(zhì)C端的覆蓋范圍。
本研究通過對基于Arg型酶切的反向富集策略的系統(tǒng)性優(yōu)化,縮短了樣本準(zhǔn)備時間,提升了C端肽段的鑒定深度,并擴大了C端肽段的鑒定范圍。此外,通過與其他鑒定C端肽段的策略相比,本研究在鑒定范圍上具有獨特性,進一步提示,可以采用多種策略聯(lián)用的方式進行蛋白質(zhì)C端的鑒定,用以提升蛋白質(zhì)C端的鑒定“深度”和“廣度”。通過將優(yōu)化后的方法與其他策略結(jié)合,不僅可以高效地用于基于Arg型酶切的蛋白質(zhì)C端組學(xué)深度分析,還可以對不同細胞、組織來源的蛋白質(zhì)C端狀態(tài)進行系統(tǒng)表征,獲得蛋白質(zhì)C端狀態(tài)的全景,將為蛋白質(zhì)C端在生理病理中的分子機制研究提供新的信息。