李倩 馮鈺 譚敏佳 翟琳輝
摘要采用胰蛋白酶(Trypsin)單獨酶切與不同酶量的賴氨酸C端內(nèi)切酶(LysC/trypsin)順序酶切兩種方法, 對293T細胞全蛋白樣本進行酶解消化, 系統(tǒng)評估LysC/trypsin順序酶切與Trypsin單一酶切在蛋白質(zhì)組學(xué)樣本制備中的差別。實驗結(jié)果表明, LysC/trypsin順序酶切不僅能顯著提高肽段和蛋白質(zhì)的鑒定數(shù)目, 同時降低遺漏K酶切位點的數(shù)目及比例, 而且得到的肽段長度有利于質(zhì)譜鑒定, 蛋白質(zhì)覆蓋率明顯提升。 通過對酶的用量進行優(yōu)化對比, 最終確定了LysC/trypsin順序酶切時酶的合理用量。本研究結(jié)果對提高蛋白質(zhì)組學(xué)樣本的制備質(zhì)量以及蛋白質(zhì)的序列鑒定覆蓋度具有指導(dǎo)意義。
關(guān)鍵詞胰蛋白酶; 賴氨酸C端內(nèi)切酶; 順序酶切; 蛋白質(zhì)組學(xué); 液相色譜串聯(lián)質(zhì)譜; 遺漏酶切
1引 言
“鳥槍法”蛋白質(zhì)組學(xué)(Shotgun proteomics)鑒定, 是基于高效液相色譜和質(zhì)譜技術(shù)的“自下而上”(Bottomup)的蛋白質(zhì)組學(xué)分析技術(shù), 具有高靈敏度、高通量的特點[1]。該技術(shù)將蛋白質(zhì)經(jīng)特定蛋白酶酶切消化成肽段, 采用液相色譜串聯(lián)質(zhì)譜技術(shù)(LCMS/MS)進行分析[2], 將檢測到的肽段圖譜與理論圖譜進行匹配, 對蛋白質(zhì)進行定性與定量分析?;谫|(zhì)譜的蛋白質(zhì)組學(xué)研究, 已經(jīng)建立了幾乎完整的酵母蛋白質(zhì)組表達譜[3], 并于2014年繪制了第一張人類蛋白質(zhì)組草圖[4]。目前, 臨床蛋白質(zhì)組學(xué)項目已經(jīng)完成了人類結(jié)直腸癌、乳腺癌、卵巢癌等臨床組織的蛋白質(zhì)組表達譜的分析[5~7]。
近十年來, “鳥槍法”蛋白質(zhì)組學(xué)在細胞裂解、肽段分離、質(zhì)譜碎裂方式、生物信息學(xué)分析手段等[8]方法學(xué)研究上取得了重大進展, 然而在蛋白質(zhì)酶切中仍然多使用單一的蛋白酶—胰蛋白酶(Trypsin)。Trypsin可特異性識別并切割蛋白質(zhì)/多肽鏈中賴氨酸(K)或精氨酸(R)羧基端, 具有極高的位點特異性, 酶切產(chǎn)生的肽段主要以賴氨酸殘基或精氨酸殘基結(jié)尾, 這些肽段在酸性條件下容易帶二價或更高價態(tài)正電荷而被質(zhì)譜檢測, 因此Trypsin在Shotgun proteomics 研究中廣泛使用。然而, Trypsin也存在一些缺陷, 如酶切時切割蛋白質(zhì)不完全[9], 且切割K、R位點的效率不同, 尤其K酶切位點的遺漏酶切比例較高[10]。樣本制備體系中高濃度的鹽、表面活性劑等都可能抑制Trypsin的活性[9]。Trypsin的這些缺陷將直接影響蛋白質(zhì)鑒定的效率、質(zhì)譜分析的重現(xiàn)性和蛋白質(zhì)定量的準確性。
賴氨酸C端內(nèi)切酶(LysC)是特異性識別并切割賴氨酸羧基端的蛋白酶, 在強變性條件下仍然具有酶切活性[10]。LysC與Trypsin聯(lián)用, 能夠在一定程度上克服Trypsin的上述缺陷, 使得蛋白質(zhì)酶切更充分。1999年, Link等[11]首次提出將LysC與Trypsin聯(lián)合用于分析大分子復(fù)合物; 隨后, McDonald等[12]提出LysC/trypsin順序酶切(蛋白先經(jīng)LysC酶切, 再用Trypsin進一步酶切)方法, 用于復(fù)雜的蛋白質(zhì)組學(xué)研究。Wada等[13]比較了十二烷基硫酸鈉聚丙烯酰胺凝膠電泳(SDSPAGE)膠內(nèi)酶切時, LysC/trypsin順序酶切與Trypsin單獨酶切對蛋白鑒定結(jié)果的影響, 結(jié)果表明使用順序酶切得到的肽段長度適宜, 更易于從膠內(nèi)提取出來, 而且更利于質(zhì)譜鑒定。溶液內(nèi)酶切(In solution digestion)由于具有操作簡便、快捷、樣本損失量少等優(yōu)點, 是蛋白質(zhì)組學(xué)研究中最為常用的酶切體系[15]。雖然LysC/trypsin順序酶切已廣泛用于溶液內(nèi)消化[16], 但目前很少有對溶液酶切條件下LysC/trypsin順序酶切與Trypsin單獨酶切進行比較的研究報道。2012年, Wisniewski 等[14]使用FASP(Filter aided sample preparation)方法, 發(fā)現(xiàn)順序酶切得到的肽段總量增加了一倍, 且鑒定到的肽段數(shù)目、蛋白質(zhì)數(shù)目均有顯著增加。但該方法先用LysC在超濾管中對蛋白樣本進行酶切, 之后離心收集酶切的肽段; 然后再向超濾管中加入Trypsin酶進行消化后, 離心收集酶切好的肽段, 最后合并兩次離心得到的肽段樣本。顯然第一次離心收集的肽段因為僅用LysC酶切, 得到的肽段中會含有較多的R位點漏切的肽段, 肽段也較長, 在一定程度上不利于質(zhì)譜檢測。Glatter等[17]研究了溶液內(nèi)LysC/trypsin順序酶切的優(yōu)勢, 認為利用LysC/trypsin順序酶切能得到較多的全酶切肽段, 從而提高可定量蛋白質(zhì)的數(shù)目及定量結(jié)果的準確性, 但該研究并沒有深入分析和探討LysC/trypsin順序酶切在蛋白質(zhì)組樣本鑒定方面的差異。目前, 對于LysC/trypsin順序酶切在蛋白質(zhì)組學(xué)樣本制備中的應(yīng)用仍然缺乏系統(tǒng)、全面的評估。
在順序酶切時, 蛋白質(zhì)與酶的質(zhì)量比不同也可能會影響酶切效果, 常用的LysC質(zhì)量比和Trypsin質(zhì)量比例分別有100∶1和50∶1兩種[18~21]。然而不同酶用量對實驗結(jié)果是否有影響, 合適的酶用量是多少, 尚無詳細和深入的研究報道。
本研究利用溶液內(nèi)酶切方式, 從鑒定到的肽段數(shù)目、蛋白質(zhì)數(shù)目、遺漏酶切位點數(shù)目、K/R遺漏酶切比例以及肽段長度和蛋白質(zhì)覆蓋率等多個方面, 評估了LysC/trypsin順序酶切與Trypsin單獨酶切的特性, 并比較了不同酶用量下對最終蛋白質(zhì)組學(xué)樣本檢測結(jié)果的影響, 優(yōu)化了酶切實驗方案, 不僅大大提高了酶切效率, 而且也顯著提高了蛋白質(zhì)組學(xué)樣本的檢測效率和靈敏度。
2實驗部分
2.1儀器與試劑
Orbitrap Fusion三合一質(zhì)譜儀, EASYnLC 1000納升級液相色譜儀(美國Thermo Fisher Scientific公司); DHP9052電熱恒溫培養(yǎng)箱(上海善志儀器設(shè)備有限公司)。
293T人腎上皮細胞(ATCC細胞庫); DMEM培養(yǎng)基(美國Introvigen公司); 尿素(色譜純)、NH4HCO3、半胱氨酸(純度97%)、色譜純?nèi)宜幔═FA)、質(zhì)譜級甲酸(FA)(德國SigmaAldrich公司); 蛋白酶抑制劑(瑞士Rocher公司); 二硫蘇糖醇(DTT, 純度99%)、碘乙酰胺(IAA, 純度98%)(比利時Acros Organics公司); 增強型BCA蛋白濃度測定試劑盒(江蘇碧云天生物技術(shù)公司); 質(zhì)譜純乙腈(美國Thermo Fisher公司); 質(zhì)譜純LysC、Trypsin(北京華利世科技有限公司); 其它試劑均為色譜純。
2.2實驗方法
293T細胞在含10%胎牛血清(FBS)、1×105 U/L青霉素、100 mg/L鏈霉素的DMEM培養(yǎng)基中常規(guī)貼壁培養(yǎng)。生長至對數(shù)期后, 收集細胞, PBS緩沖溶液洗滌3次, 加入細胞裂解液(8 mol/L 尿素, 100 mmol/L NH4HCO3, 1×蛋白酶抑制劑, pH 8.0), 冰上裂解30 min, 超聲波破碎, 20000 g離心5 min, BCA法測定上清液蛋白質(zhì)濃度。加入5 mmol/L DTT, 56℃ 反應(yīng)30 min; 再加入15 mmol/L IAA, 避光條件下室溫反應(yīng)30 min; 最后加入30 mmol/L半胱氨酸, 室溫反應(yīng)30 min, 終止烷基化反應(yīng)。
酶切消化過程分析進行5組實驗, 第一組為Trypsin單獨酶切(Tryp50/tryp100), 其余四組為不同酶用量組合的LysC/trypsin順序酶切(LysC50/tryp50, LysC50/tryp100, LysC100/tryp50, LysC100/tryp100), 如圖1所示。Trypsin單獨酶切(Tryp50/tryp100)的方法為先將蛋白質(zhì)溶液稀釋4倍, 再按照蛋白質(zhì)與酶質(zhì)量比50∶1加入Trypsin (tryp50), 37℃反應(yīng)16 h后, 按照蛋白質(zhì)與酶質(zhì)量比100∶1補加Trypsin (tryp100), 37℃繼續(xù)反應(yīng)3 h。順序酶切的實驗方法為: 蛋白質(zhì)溶液不經(jīng)稀釋直接按預(yù)定比例(LysC50表示蛋白質(zhì)與LysC的質(zhì)量比為50∶1, LysC100表示蛋白質(zhì)與LysC的質(zhì)量比為100:1)加入LysC, 37℃反應(yīng)3 h, 再將蛋白質(zhì)溶液稀釋4倍, 并按預(yù)定比例加入Trypsin, 37℃繼續(xù)反應(yīng)16 h。每組實驗重復(fù)3次。酶切后的肽段用C18脫鹽柱脫鹽, 轉(zhuǎn)干,
2.3高效液相色譜和質(zhì)譜方法
液相色譜分離分析柱為自制毛細管柱(75 μm×15 cm), 填充C18填料(3 μm粒徑, 100 Dikma Technologies)。流動相A: 甲酸乙腈水=0.1∶2∶98(V/V); 流動相B: 甲酸乙腈水(0.1∶98∶2, V/V)。梯度洗脫: 0~20 min, 8%~13% B; 20~51 min, 13%~26% B; 51~56 min, 26%~45% B; 56~57 min, 45%~80% B; 57~60 min, 80% B。流速: 300 nL/min。
Orbitrap Fusion質(zhì)譜儀, 正離子模式檢測, 離子傳輸毛細管的溫度為300℃, 歸一化碰撞能量為28%。采用數(shù)據(jù)依賴模式(Datadependent acquisition, DDA)進行采集, 包含一次MS全掃描(m/z 350~m/z 1300), 分辨率R=120000(m/z 200), 對其中強度最高的10個峰進行二級MS/MS掃描分析, 動態(tài)排除時間設(shè)置為60 s。
2.4數(shù)據(jù)處理
使用msconvert軟件將質(zhì)譜原始raw文件格式轉(zhuǎn)化為mgf文件。使用Mascot 2.3.0搜索引擎搜索, 蛋白質(zhì)數(shù)據(jù)庫為Uniprot Human(版本: 20130507); 胰酶最大漏切位點數(shù)為2, 母離子質(zhì)量容差為10 ppm, 碎片離子質(zhì)量容差0.5 Da, 固定修飾為半胱氨酸的烷基化修飾, 甲硫氨酸的氧化和蛋白質(zhì)N端的乙?;癁榭勺冃揎?。采用離子分數(shù)20分篩選(cutoff)的方式進行過濾, 控制蛋白水平的FDR(False discovery rate)為1%。
3結(jié)果與討論
3.1鑒定到的肽段數(shù)與蛋白數(shù)
首先對其鑒定到的肽段匹配譜圖數(shù)(Peptidespectrum match, PSM)、非冗余肽段數(shù)目、蛋白獨有肽段數(shù)目和蛋白質(zhì)數(shù)目進行對比分析, 結(jié)果如圖2A和2B所示, LysC/trypsin順序酶切的肽段鑒定數(shù)目、蛋白質(zhì)鑒定數(shù)目等均比Trypsin單獨酶切高, 其中LysC100/tryp50組鑒定到的肽段數(shù)目、蛋白數(shù)目均最高。對順序酶切相比單獨酶切鑒定到的蛋白質(zhì)和肽段提升的比例進行分析(圖2C和圖2D), 發(fā)現(xiàn)LysC100/tryp50組提高的比例為11%~14%, LysC50/tryp50組其次, 提高了4%~7%。表明采用順序酶切能夠使蛋白質(zhì)酶切消化更充分, 從而提高蛋白質(zhì)和肽段的鑒定水平。此外, 研究結(jié)果還顯示, 鑒定到的獨有肽段數(shù)目也顯著增加, 在進行蛋白質(zhì)定量分析時可以進一步提高定量分析結(jié)果的準確性。
對比順序酶切不同組實驗的結(jié)果(LysC50/tryp50組與LysC50/tryp100組, LysC100/tryp50組與LysC100/tryp100 組, 圖2C和圖2D), 發(fā)現(xiàn)當(dāng)增加第二步中使用的Trypsin量時, PSM數(shù)目、肽段鑒定數(shù)目、蛋白質(zhì)鑒定數(shù)目等都有顯著提升, 說明在酶解過程中使用足量的Trypsin, 能進一步確保蛋白質(zhì)的酶切程度, 對于提高蛋白鑒定水平具有顯著意義。但是, 對比LysC50/tryp100組與LysC100/tryp100組、 LysC50/tryp50組與LysC100/tryp50組的結(jié)果發(fā)現(xiàn), 增加第一步LysC酶的用量并不能提高最終的樣本檢測水平, 肽段、蛋白質(zhì)等的鑒定水平反而有所降低。推測是由于隨著第一步LysC酶的用量增加, 導(dǎo)致在第二步加入Trypsin進行酶切時, LysC酶仍然保留有較強的酶切活性, 造成在該環(huán)節(jié)中LysC酶對Trypsin酶發(fā)生了一定的酶切反應(yīng), 從而降低了第二步Trypsin的酶切效率及程度。以上實驗結(jié)果表明, 在進行順序酶切時, 第二步Trypsin酶切環(huán)節(jié)應(yīng)該使用足量的酶, 以保證蛋白質(zhì)被充分消化; 同時第一步加入LysC酶的量不宜過多, 避免其對Trypsin酶的切割, 導(dǎo)致樣本最終的酶解不徹底。
3.2遺漏酶切位點數(shù)目及比例
通過統(tǒng)計了各組實驗結(jié)果中遺漏酶切的位點數(shù)目及比例, 進一步分析LysC/trypsin順序酶切比Trypsin單獨酶切能更有效提高鑒定肽段、蛋白質(zhì)數(shù)目的原因。如圖3所示, 使用Trypsin單獨酶切時, 遺漏酶切位點的比例約為27%, 其中近80%為K遺漏酶切位點, 這與文獻[13]報道的結(jié)果相符。而進行LysC/trypsin順序酶切時, K位點遺漏酶切的比例顯著降低。推測這不僅是由于LysC酶對賴氨酸具有高特異性酶切的特性, 而且在8 mol/L尿素的強變性條件下, 蛋白處于充分伸展?fàn)顟B(tài), 使LysC酶能更加充分的對蛋白質(zhì)進行酶切。因此, LysC酶和Trypsin酶進行順序酶切能顯著降低遺漏酶切位點數(shù)目和K位點遺漏酶切的比例, 從而提高質(zhì)譜鑒定的重現(xiàn)性和定量分析的準確性。
3.3肽段長度分布
利用質(zhì)譜進行蛋白質(zhì)組學(xué)肽段樣本檢測時, 肽段過長或過短都不利于質(zhì)譜檢測與鑒定。對各組實驗鑒定到的肽段長度進行統(tǒng)計分析的結(jié)果如圖4所示。LysC50/tryp50與LysC100/tryp50兩組鑒定到肽段的長度集中在7~21氨基酸殘基(aa), 且此長度區(qū)間的肽段數(shù)目明顯高于其它3組, 而長度大于32 aa的肽段數(shù)目明顯低于其余3組。對比LysC50/tryp50組與LysC50/tryp100組、LysC100/tryp50組與LysC100/tryp100組發(fā)現(xiàn), 當(dāng)?shù)诙絋rypsin酶使用量少時, 樣本中鑒定到的肽段長度普遍較長, 統(tǒng)計分析發(fā)現(xiàn)主要是由于產(chǎn)生的遺漏酶切肽段較多導(dǎo)致的, 這與上文中當(dāng)Trypsin酶的用量減少時導(dǎo)致的遺漏酶切比例升高的現(xiàn)象一致。
3.4蛋白質(zhì)序列覆蓋度
在蛋白質(zhì)組學(xué)數(shù)據(jù)分析中, 蛋白質(zhì)鑒定和定量的準確性與蛋白質(zhì)序列的鑒定覆蓋度密切相關(guān)。分別統(tǒng)計了各實驗組中蛋白序列覆蓋度在20~30%、30~40%、>40%區(qū)間的蛋白數(shù)目, 結(jié)果見圖5。第二步Trypsin使用量較高的兩組(LysC50/tryp50組與LysC100/tryp50組), 在以上蛋白質(zhì)序列覆蓋度區(qū)間的蛋白數(shù)均最高, 說明順序酶切時第二步使用足量的Trypsin能夠增加蛋白質(zhì)的序列覆蓋度, 進一步證明其使得蛋白質(zhì)被酶切的更加完全。此外, 序列覆蓋度較高(>30%)的蛋白質(zhì)中, LysC50/tryp50組的蛋白質(zhì)數(shù)目均低于LysC100/tryp50組的數(shù)目, 提示第一步LysC酶的用量增大會導(dǎo)致第二步Trypsin效率的降低, 從而使得鑒定到的蛋白序列覆蓋度低。
4結(jié) 論
本研究從鑒定蛋白質(zhì)數(shù)目、肽段數(shù)目、遺漏酶切位點數(shù)目與比例、肽段長度和蛋白質(zhì)序列覆蓋度等方面, 對蛋白質(zhì)組學(xué)樣品溶液消化中的順序酶切與單獨酶切方法進行比較。結(jié)果表明, 順序酶切能夠使蛋白質(zhì)被酶切的更完全, 從而降低遺漏酶切位點數(shù)目, 得到的肽段長度有利于進行質(zhì)譜鑒定, 肽段數(shù)目、蛋白質(zhì)數(shù)目以及蛋白質(zhì)序列覆蓋度均有所增加。順序酶切時, 所用的酶量對實驗結(jié)果有顯著影響, 第二步使用足量的Trypsin能夠更充分酶切蛋白質(zhì), 而第一步使用過量的LysC反而會影響到隨后Trypsin的酶切效果, 使得蛋白質(zhì)的酶切程度不徹底。本研究結(jié)果為蛋白質(zhì)組學(xué)研究提供了實驗基礎(chǔ), 對于提高蛋白組學(xué)樣本檢測的效率和靈敏度, 以及蛋白質(zhì)組學(xué)的定量分析準確性具有參考意義。
References
1Malmstrm E, Kilsgrd O, Hauri S, Smeds E, Herwald H, Malmstrm L, Malmstrm J. Nat. Commun., 2016, 7: 10261-10270
2Link A J, Eng J, Schieltz D M, Carmack E, Mize G J, Morris D R, Garvik B M, Yates J R. Nat. Biotechnol., 1999, 17(7): 676-682
3de Godoy L M, Olsen J V, Cox J, Nielsen M L, Hubner N C, Mann M. Nature, 2008, 455(7217): 1251-1254
4Wilhelm M, Schlegl J, Hahne H, Gholami A M, Lieberenz M, Butzmann L, Gerstmair A, Faerber F, Kuster B. Nature, 2014, 509(7502): 582-587
5Zhang B, Wang J, Wang X, Zhu J, Liu Q, Shi Z, Chambers M C, Davies S R, Coffey R J, Slebos R J, Liebler D C. Nature, 2014, 513(7518): 382-387
6Lawrence R T, Perez E M, Hernandez D, Miller C P, Haas K M, Irie H Y, Lee S I, Blau C A, Villen J. Cell. Rep., 2015, 11(4): 630-644
7Lawrence R T, Perez E M, Hernandez D, Miller C P, Haas K M, Irie H Y, Lee S I, Blau C A, Villen J. Nat. Commun., 2016, 7: 12645
8Tsiatsiani L, Heck A J. FEBS. J., 2015, 282(14): 2612-2626
9Saveliev S, Bratz M, Zubarev R. Nat. Methods, 2013, 10 (11): i-ii
10Huesgen P F, Lange P F, Rogers L D. Nat. Methods, 2015, 12(1): 55-58
11Link A J, Eng J, Schieltz D M, Carmack E, Morris D R, Garvik B M, Yates J R. Nat. Biotechnol., 1999, 17(7): 676-682
12McDonald W H, Ohi R, Miyamoto D T, Mitchison T J, Yates J R. Int. J. Mass. Spectrom., 2002, 219: 245-251
13Wada Y, Kadoya M. J. Mass. Spectrom., 2003, 38(1): 117-118
14Wisniewski J R, Mann M. Anal. Chem., 2012, 84(6): 2631-2367
15Wisniewski J R, Zougman A, Nagaraj N, Mann M. Nat. Methods, 2009, 6(5): 359-362
16Scheltema R A, Hauschild J P, Lange O, Makarov A, Mann M. Mol. Cell. Proteomics, 2014, 13(12): 3698-3708
17Glatter T, Ludwig C, Ahrné E, Aebersold R, Heck A J, Schmidt A. J. Proteome Res., 2012, 11(11): 5145-5156
18Mertins P, Mani D R, Ruggles K V, Gillette M A, Paulovich A G, Fenyo D, Ellis M J, Carr S A. Nature, 2016, 534(7605): 55-62
19Cox J, Hein M Y, Luber C A, Paron I, Nagaraj N, Mann M. Mol. Cell. Proteomics, 2014, 13(9): 2513-2526
20Paulo J A, Gigy S P. Proteomics, 2015, 15(23): 474-486
21Hebert A S, Richards A L, Coon J J. Mol. Cell. Proteomics, 2014, 13(1): 339-347
AbstractEndoproteinase LysC/trypsin sequential digestion and trypsin digestion were used in 293T cell proteomics sample preparation and the results of LysC/trypsin sequential digestion and trypsin digestion in proteomics sample preparation was systematically evaluated. It was found that the number of identified peptides and proteins increased significantly, and missed cleavage sites, especially K sites decreased dramatically through LysC/trypsin sequential digestion. And the average sequence coverage of identified proteins in LysC/trypsin sequential digestion sample was higher than that in trypsin digestion sample. Besides, different amount of enzymes was tested to select the optimal usage of enzymes in LysC/trypsin sequential digestion. This study provided the references for proteomics sample preparation.
KeywordsTrypsin; LysC; Sequential digestion; Proteomics; Liquid chromatographytandem mass spectrometry; Missed cleavage