萬磊磊 陳琦 程思明 李水明 王勇
摘 要 以10個唾液樣本為例,唾液經(jīng)氧化石墨烯-磷酸鑭納米復(fù)合材料( LaGM) 方法分離和高分辨串聯(lián)飛行時間質(zhì)譜進(jìn)行多肽鑒定后,使用Peaks studio 8.5(PS)和Protein Pilot Software 4.0(PP)兩種軟件分別進(jìn)行搜庫分析后對比鑒定結(jié)果。研究發(fā)現(xiàn),兩種軟件鑒定出的閾值以上肽段數(shù)量存在差異, PS軟件通常能夠鑒定出更多閾值以上肽段數(shù)目;兩種軟件鑒定出的閾值以上相同肽段在PS中占30%~60%,在PP中占60%~90%,即某些肽段只能被PS或PP一種軟件所鑒定。但是,兩種搜庫結(jié)果在降解蛋白質(zhì)數(shù)目上無明顯規(guī)律,數(shù)目因樣本而異。值得注意的是,如果以PP和PS的陽性結(jié)果相互參照,發(fā)現(xiàn)在一種軟件中閾值以下的肽段,在另一種軟件中也可能是在閾值以上,而且此概率與肽段的打分呈正相關(guān)。研究還發(fā)現(xiàn),兩種軟件對不同長度肽段的鑒定有一定的偏好性: PS鑒定結(jié)果中短肽段較多,而PP軟件可以給出更多的長肽段。比較而言,在PP中,短肽段易出現(xiàn)假陰性,在PS中,長肽段易出現(xiàn)假陰性,而信號的相對強度與閾值無明顯的相關(guān)性。本研究結(jié)果表明,只使用一種軟件進(jìn)行分析,結(jié)果不能準(zhǔn)確地代表多肽組的全部情況,兩種軟件都能提供另一軟件鑒定不到的信息,將兩種軟件結(jié)果綜合分析,能夠得到更為全面的結(jié)果。
關(guān)鍵詞 多肽組; Peaks studio; Protein Pilot; 不確定性; 假陰性
1 引 言
多肽組是指器官、組織、細(xì)胞和體液中的全部內(nèi)源性多肽,包括有特殊功能的活性多肽和蛋白質(zhì)代謝產(chǎn)生的多肽[1,2]。在研究多肽組的成分、功能、變化規(guī)律及其相關(guān)關(guān)系綜合分析中形成多肽組學(xué)[3,4],多肽組可反映生理或者疾病變化過程,在疾病研究中的應(yīng)用主要體現(xiàn)在疾病生物標(biāo)志物的篩選、疾病診斷、療效評價及預(yù)防等方面[5]。提取富集樣品中的多肽后進(jìn)行質(zhì)譜檢測、生物信息學(xué)分析和數(shù)據(jù)挖掘是多肽組學(xué)研究的基本方法[6~8]。
基質(zhì)輔助激光解吸離子化-飛行時間質(zhì)譜(MALDI-TOF-MS)技術(shù)具有快速簡便的特點,將樣品中多肽簡單分離后利用MALDI-TOF-MS分析分子量的技術(shù)路線在多肽組學(xué)研究中被廣泛采用,但相比較而言,納升液相色譜-串聯(lián)質(zhì)譜(nLC-MS/MS)有更高的分離效率和離子化效率,對多肽混合物的分離較好,離子化的競爭作用相對MALDI-TOF-MS更弱,因此MALDI-TOF-MS檢測到的肽段數(shù)目遠(yuǎn)少于nLC-MS/MS?!巴弧狈肿恿坎⒉灰欢ù硪粋€肽段,因此,MALDI-TOF-MS方法獲得多肽組的信息不夠充分。液相色譜-高分辨串聯(lián)質(zhì)譜方法可以克服上述缺點,肽段序列和肽段所歸屬的蛋白質(zhì)可以更準(zhǔn)確地表征多肽組[9~11],但是,由于MALDI-TOF-MS方法簡便快捷,目前應(yīng)用該方法發(fā)現(xiàn)多肽組標(biāo)記物的研究報道較多,而nLC-MS/MS的應(yīng)用在逐步增加。然而,不同搜庫軟件對鑒定結(jié)果的影響尚未引起重視,目前大多數(shù)多肽組學(xué)的研究只用一種搜庫軟件分析多肽組數(shù)據(jù)。Caseiro等[11]利用Protein Pilot (PP)搜庫軟件搜索出1型糖尿病患者唾液中794種不同肽序列; Yin等[12]利用Biotool搜庫軟件搜索小鼠星形膠質(zhì)細(xì)胞中的57種肽。但是對于一種軟件分析是否能涵蓋全部多肽組數(shù)據(jù)仍然存疑。 Parker等[13]使用Byonic和MaxQuant/Andromeda軟件鑒定分析了血漿多肽組的5000多個肽段,但是并未對兩種軟件的數(shù)據(jù)進(jìn)行對比分析。Peaks studio 8.5(PS)是一款通用的商業(yè)蛋白質(zhì)鑒定軟件,Protein Pilot是AB SCIEX公司開發(fā)質(zhì)譜的軟件。這兩種軟件雖然都是將質(zhì)譜數(shù)據(jù)與數(shù)據(jù)庫中理論肽段序列進(jìn)行匹配,根據(jù)匹配正確或者錯誤率對肽段進(jìn)行打分。但是二者的打分機(jī)理有一定差別: Protein Pilot打分采用正確匹配的置信度(conf),體現(xiàn)的是肽段的正確匹配率,通常截取置信度在95分以上的肽段; 而Peaks studio 8.5采用P值打分, 體現(xiàn)的是肽段的錯誤匹配率,通常取錯誤率在0.01以下(-10×lgP=20)的肽段。兩種搜庫軟件對譜圖的使用效率沒有明顯區(qū)別,因為樣品的差異會導(dǎo)致圖譜利用率的差異; 但通常PS搜庫時間相對更短。
本研究隨機(jī)選取10個志愿者的唾液樣本,樣品經(jīng)分離和質(zhì)譜法鑒定多肽后,采用PS和PP兩種軟件分別進(jìn)行分析,比較它們在肽段鑒定數(shù)目、肽段長度和信號強度等方面的異同,從而為如何認(rèn)識單一軟件的搜庫結(jié)果提供參考。
2 實驗部分
2.1 儀器與試劑
Eksigent nanoLC-UltraTM 2D系統(tǒng)、TripleTOF5600高分辨質(zhì)譜儀、Protein Pilot 4.5軟件(美國AB SCIEX公司); Peaks studio 8.5軟件(加拿大BSI公司); Excel VBA編程compare tool 比較程序; 真空冷凍干燥機(jī)(美國Thermo Savant公司)。Pierce TM C18 Tips 固相萃取柱(美國 Thermo Scientific 公司)。氧化石墨烯-磷酸鑭納米復(fù)合材料(LaGM)為本實驗室合成[14]; 甲酸、乙腈(質(zhì)譜純,美國 Sigma Aldrich 公司)。
2.2 多肽富集與液相色譜-Triple-TOF-MS分析
10個唾液樣品來自10名志愿者。每個樣品分別取0.5 mL唾液,利用LaGM磁性納米材料富集分離[15]; 分離后凍干的多肽樣品重新溶解于Nano-RPLC Buffer A中,在線Nano-RPLC液相色譜在Eksigent nanoLC-UltraTM 2D系統(tǒng)( AB SCIEX)上進(jìn)行,溶解后的樣品以2 μL/min的流速上樣到C18預(yù)柱(3 cm ×100 μm, 3 μm, 15 nm)上,然后以相同流速沖洗脫鹽10 min。分析柱是C18反相色譜柱( 75 μm×15 cm, 3 μm, 12 nm, ChromXP Eksigent),梯度洗脫: 70 min 內(nèi)流動相B由5%升高至80%。質(zhì)譜采用TripleTOF 5600系統(tǒng)結(jié)合納升噴霧III 離子源(AB SCIEX, USA),噴霧電壓為2.4 kV,氣簾氣壓為0.2 MPa, 霧化氣壓為34.5 kPa,加熱溫度為150℃,質(zhì)譜掃描方式為信息依賴的采集工作模式(Information dependent analysis, IDA), 一級TOF-MS單張圖譜掃描時間為250 ms,每次IDA循環(huán)最多采集35個電荷為2+~8+,且單秒計數(shù)大于100的二級圖譜,每張二級圖譜的累積時間為80 ms。每次循環(huán)時間固定為2.5 s,碰撞室能量設(shè)定為適用于所有前體離子碰撞誘導(dǎo)解離(CID),動態(tài)排除設(shè)置為11 s。
2.3 數(shù)據(jù)分析條件
質(zhì)譜數(shù)據(jù)分別用Peask studio 8.5和Protein Pilot Software 4.5進(jìn)行搜庫分析,使用uniprot 庫中的Homo sapiens 人種專一數(shù)據(jù)庫。進(jìn)行PS搜庫時分別設(shè)置非酶切、tri-top工具、CID碎片化,翻譯后修飾選擇磷酸化、乙?;?、氧化以及脫氨,并添加突變搜索, 假陽性率(False discovery rate, FDR)控制為 1%; 搜庫完成后,導(dǎo)出保存HTML以及CSV文件[16~18]。 Protein Pilot Software 4.5軟件分析: 檢索參數(shù)設(shè)置為非酶切,檢索方式為徹底分析, FDR控制為1%,分析結(jié)束后保存Excel文件。選取每個樣品的閾值上與閾值下的肽段,將兩種軟件打分閾值上下的肽段進(jìn)行同序列比對,得出交叉肽段。使用Excel表的LEN公式,得出肽段長度,取各種肽段長度的均值。將PS中閾值上下的肽段的Area和PP閾值上下肽段的Signal按照各分?jǐn)?shù)段分類并取平均值。
3 結(jié)果與討論
3.1 兩種軟件檢索出的肽段數(shù)目對比
無論使用何種搜庫軟件,在表征多肽組結(jié)果時,通常只考慮閾值之上的可信肽段。為控制FDR在1%,PS軟件以-10lgP為標(biāo)準(zhǔn),閾值20以上為有效(可信)肽段[17,18],而對于PP軟件,置信度95分以上為有效肽段[17],95分以下的為可疑肽段,通常舍棄。因此,首先對比兩種軟件閾值以上的肽段數(shù)目。如圖1所示,10個樣品中除樣品2外, PS鑒定到閾值以上肽段數(shù)目均多于PP,但個體差異較大。在樣本2中,二者的鑒定數(shù)目接近,分別為964和1192個,相差約11.49%,而在樣本6中,二者給出的肽段數(shù)目分別為1076和451,PS結(jié)果為PP的2.39倍。另一方面,PS給出的可信肽段占總給出肽段的百分比較高(70.24%~86.26%),即對于這10個樣本,PS軟件給出的閾值以上肽段數(shù)目均大于閾值以下的肽段數(shù)目,即可信肽段數(shù)目至少是不可信肽段數(shù)目的2.3倍。相反,PP軟件搜庫結(jié)果中,閾值之上肽段數(shù)目與閾值之下肽段數(shù)目的比值范圍為0.27~1.13,平均值為0.69。換言之,盡管PP軟件給出了更多的肽段數(shù)目,但閾值之下的偏多。如果只考慮閾值之上的肽段,使用PS軟件似乎可以得到更多的肽段信息,但因為兩種方法所給出的分析結(jié)果的交集并不完全重合,還需對結(jié)果進(jìn)行進(jìn)一步分析。
3.2 兩種軟件鑒定到的閾值之上相同肽段的對比
首先,考慮閾值之上肽段在兩種軟件搜庫結(jié)果中的相關(guān)性。如圖2A所示,兩種軟件鑒定出相同肽段在PS中占30%~60%,在PP中占60%~90%。 如圖2B所示,在樣品6中PS和PP分別鑒定到1076和451條(差異最大),相同肽段有411條,分別占PS和PP鑒定肽段的38%和91%,此結(jié)果說明在PS軟件給出的結(jié)果中,有62%是PP未能給出的,而在PP給出的結(jié)果中,9%是PS軟件未能提供的。在樣本8中, 兩種軟件鑒定到的肽段數(shù)目分別為1192和964條(差異最?。餐糠钟?64條,分別占各自閾值以上肽段數(shù)的59%和47%,這意味著對于該樣本,PS鑒定結(jié)果的41%是其特有的,而PP軟件結(jié)果中53%是特有的。總體上,PS中有大約50%的肽段是PP未鑒定到的; 同樣地,PP中有約30%的肽段是PS未能提供的。
值得注意的是,在降解蛋白質(zhì)的水平上,PP和PS兩種軟件也表現(xiàn)出了不同的特點。在PS搜索結(jié)果中,10個樣本的閾值以下肽段所歸屬的蛋白質(zhì)數(shù)目均小于閾值以上肽段所組成蛋白質(zhì)數(shù)目,而且除了樣品2和4外,鑒定到的閾值以上肽段所歸屬的降解蛋白質(zhì)數(shù)目與總降解蛋白質(zhì)數(shù)目相同,提示在這8個樣本中,閾值以下肽段和以上肽段來源于相同蛋白,檢索結(jié)果肽段即使存在可能的假陰性,對定性分析的結(jié)果也沒有影響(圖2A)。而在PP搜庫結(jié)果中,有半數(shù)以上的樣本閾值以下肽段歸屬的蛋白質(zhì)數(shù)目高于閾值以上降解蛋白質(zhì)(圖2B),只有樣本7的閾值以上肽段歸屬蛋白質(zhì)總數(shù)等于總降解蛋白質(zhì)總數(shù)。總之,PS軟件鑒定到更多的肽段,在蛋白質(zhì)水平上的穩(wěn)定性也優(yōu)于PP搜庫結(jié)果。實際工作中, PP中置信度95%以下的結(jié)果是否一定要舍棄還值得商榷。本研究進(jìn)行了深入的對比分析。
3.3 兩種軟件檢測閾值的差異
以上結(jié)果表明,PS搜庫鑒定到了更多的閾值以上肽段。為闡明這種現(xiàn)象是因為兩種軟件算法不同還是閾值標(biāo)準(zhǔn)的差異,將兩種軟件閾值之上和閾值之下的肽段交叉比對。如圖3A所示,在PP閾值以下肽段中,有5%~17%的肽段在PS中是閾值以上的; 同樣地,在PS的閾值以下肽段中,有15%~25%的肽段在PP中是閾值之上,該結(jié)果說明某些肽段序列在兩種軟件中均被檢出,但在閾值標(biāo)準(zhǔn)的設(shè)定上不一致而導(dǎo)致輸出結(jié)果的不同,即某些肽段在一種軟件中的打分為閾值以下,但在另一種軟件中是閾值以上。換言之,如果以這兩種軟件的閾值以上肽段結(jié)果相互參照,則二者都存在一定的假陰性。進(jìn)一步發(fā)現(xiàn),在PP中肽段的假陰性比例與二者的打分正相關(guān),如圖3B所示,將PP閾值下肽段按照conf分?jǐn)?shù)分成(0,50)、(50,80)和(80,95)3段,發(fā)現(xiàn)在50分以下的肽段中,有10%~15%的肽段在PS中是閾值上的,而在80~95分段,有30%~55%的肽段在PS中是閾值上的,提示PP搜庫結(jié)果中80分以上肽段也有一定的可信性; 類似地,在PS搜庫結(jié)果中,-lgP值在15~20之間的肽段有30%~40%在PP中是閾值上的。 產(chǎn)生這樣現(xiàn)象的原因可能因為兩種軟件的原理、算法和打分標(biāo)準(zhǔn)不同[16~17],也可能與實驗條件和譜圖質(zhì)量有關(guān)。
3.4 PS與PP閾值上和閾值下肽段以及其交叉肽段的平均長度對比
如圖4所示,在PP軟件鑒定到的肽段中,閾值以下肽段平均長度大于閾值以上肽段的平均長度,隨著肽段數(shù)目的增加,串聯(lián)質(zhì)譜圖中b和y型離子的連續(xù)性減弱,打分減小; 而在PS軟件中則是相反的結(jié)果,閾值以上肽段平均長度大于閾值以下肽段的平均長度。在PP軟件閾值下的肽段中,有一部分是被PS軟件鑒定的閾值上肽段,值得注意的是,這一部分肽段在所有PP肽段中長度偏短; 而PS閾值以下卻被PP軟件鑒定為閾值以上的肽段,在所有PS肽段中長度較長。該結(jié)果提示在PP鑒定到的短肽段中容易出現(xiàn)假陰性,而在PS鑒定到的肽段中長肽段易出現(xiàn)假陰性??傮w上,PS鑒定到的閾值以上肽段的平均長度小于PP軟件。從閾值以上肽段長度極值上來看,如圖5所示,這10個樣品中,PS最短肽段長度為5~6之間,最長的肽段長度在56~65之間,PP最短肽段長度為6,最長肽段長度在64~81之間。以上結(jié)果說明, PP傾向于鑒定長肽段,相對而言,PS可鑒定更多的短肽段。結(jié)合前面的結(jié)果,在PP鑒定到的閾值下肽段中,打分較高、長度較短的肽段有較大的可能是可信的,同理在PS鑒定到的閾值下肽段中,打分較高、長度較長的肽段可能是可信的。因此,在只能使用一種搜庫軟件時,結(jié)合上述特征有可能降低假陰性。
3.5 PS與PP各分段肽段的信號強度
肽段母離子相對強度與其含量正相關(guān),在PS軟件中用峰面積Area表示,在PP中用信號強度Signal表示。對比各分段肽段的信號強度后發(fā)現(xiàn),即使是置信度很低的肽段也可能有很高的信號強度(表1)。PS軟件相對簡單,-10 lgP數(shù)值大于20的肽段的Area較高; 但是在PP軟件中,閾值以下(95)分?jǐn)?shù)區(qū)間的肽段Signal并沒有明顯地隨Conf分?jǐn)?shù)變化而變化的趨勢(如表1)。此外,在兩種軟件中,一些閾值以上肽段的信號強度也可能小于閾值以下肽段,這提示信號強度與肽段的置信度之間并無必然聯(lián)系,這是因為母離子的強度只是決定串聯(lián)質(zhì)譜圖質(zhì)量的因素之一。本研究僅對比了PS與PP兩種軟件的搜庫差異,然而,多肽組的結(jié)果差異可能產(chǎn)生于分析的各個環(huán)節(jié)。Sun等[19]利用離心+弱陽離子交換方法提取唾液多肽,利用MALDI-TOF-MS和LTQ-Orbitrap-MS兩種質(zhì)譜方法鑒定和SequestTM(IPI Human 3.45)搜庫,給出了REFPFYGDYGSNYL等歸屬于Histatin-1等3個蛋白質(zhì)的4條多肽。而在本研究的分析結(jié)果中,都可以檢測到含有REFPFYGDYGSNYL序列的肽段,但數(shù)目存在較大差異(2~70個)。不同分析結(jié)果之間差別較大也是影響多肽組應(yīng)用的一個關(guān)鍵瓶頸。
4 結(jié) 論
多肽組的分析結(jié)果與數(shù)據(jù)處理方法密切相關(guān),不同分析軟件鑒定出的多肽組結(jié)果有交集,但并不完全一致。在本研究中,多數(shù)樣本中PS軟件鑒定到了更多的肽段數(shù)目,但在鑒定降解蛋白質(zhì)數(shù)目上,PS和PP兩種軟件沒有顯著差別。兩種軟件的分析結(jié)果中,最短肽段長度相近,但PP軟件能夠給出更長的閾值以上肽段。此外,PP搜庫結(jié)果的假陰性也值得注意,即置信度為80%~95%的肽段中,約40%在PS中是閾值以上的肽段??傊?,應(yīng)用這兩種搜庫方法綜合分析、互為補充,能夠提高結(jié)果的準(zhǔn)確性,克服單一方法的局限性,并減小個體差異的影響,使在降解蛋白質(zhì)水平的多肽組結(jié)果更加準(zhǔn)確。
References
1 Yang J, Song Y C, Dang C X, Song T S, Liu Z G, Guo Y M, Li Z F, Huang C. Clin. Exp. Med., 2012, 12(2): 79-87
2 HONG Xiao-Yu, WANG Hao, XU Jing-Ling, LI Shui-Ming, WANG Yong, Chinese J. Anal. Chem.,? 2016,? 44(3): 403-408
洪曉愉, 王 浩, 徐金玲, 李水明, 王 勇. 分析化學(xué),? 2016,? 44(3): 403-408
3 Gelman J S, Sironi J, Castro L M, Ferro E S , Fricker L D. J. Proteome Res.,? 2011,? 10(4): 1583-1592
4 Parker B L, Burchfield J G, Clayton D, Geddes T A, Payne R J, Kiens B, Wojtaszewski J F P, Richter E A, James D E. Mol. Cell. Proteomics.,? 2017,? 16(12): 2055-2068
5 Zhuang B, Hu Y, Fan X M, Zhu J G, Liu H, Gao L, Liang D, Zhang J J, Yu Z B, Han S P. J. Cell. Biochem.,? 2018,? 119(1): 468-477
6 Du Z Q, Hua J, Su X, Song D L. Health,? 2019,? 11(6): 817-826
7 SUN Ting-Ting, ZHANG Le-Le, WANG Qian, LI Chun, CHENG Bei-Jiu, ZHANG Xin. Journal of Plant Physiology,? 2015,? 51(7): 1173-1178
孫婷婷, 張樂樂, 王 倩, 李 純, 程備久, 張 欣.? 植物生理學(xué)報,??? 2015,? 51(7): 1173-1178
8 GU Shu-Qing, ZHAN Li-Na, ZHAO Chao-Min, ZHENG Jiang, CAI Yi-Cun, DENG Xiao-Jun. Chinese Journal of Chromatography,? 2020,? 36(12): 1269-1278
古淑青, 詹麗娜, 趙超敏, 鄭 江, 蔡一村, 鄧曉軍.? 色譜,??? 2018,? 36(12): 1269-1278
9 Dallas D C, Guerrero A, Parker E A, Robinson R C, Gan J N, German J B, Barile D, Lebrilla C B. Proteomics,? 2015,? 15(5-6): 1026-1038
10 Vivian H, Christopher B L, Sonia P, Tomas C, Oliver F. J. Am. Soc. Mass Spectrom.,? 2018,? 29(5): 807-816
11 Caseiro A, Ferreira R, Padro A, Quintaneiro C, Pereira A, Marinheiro R, Vitorino R, Amado F. Proteome Res.,? 2013,? 12(4): 1700-1709
12 Yin P, Knolhoff A M, Rosenberg H J, Millet L J, Gillette M U, Sweedler J V. Proteome Res.? 2012,? 11: 3965-3973
13 Parker B L, Burchfield J G, Clayton D, Geddes T A, Payne R J, Kiens B, Wojtaszewski J F P, Richter E A, James D E. Mol. Cell. Proteomics,? 2017,? 16 (12): 2055-2068
14 XU Jing-Ling, HONG Xiao-Yu, LI Shui-Ming, WANG Yong. Chinese J. Anal. Chem.,? 2016,? 44(12): 1887-1891
徐金玲, 洪曉愉, 李水明, 王 勇.? 分析化學(xué),??? 2016,? 44(12): 1887-1891
15 KONG Xiang-Yi, DU Jian-Shi, XU Jin-Ling, LI Shui-Ming, WANG Yong, ZHAO Qing. Chinese J. Anal. Chem.,? 2019, 47(11): 1816-1822
孔祥怡, 杜建時, 徐金玲, 李水明, 王 勇, 趙 晴.? 分析化學(xué),???? 2019,? 47(11): 1816-1822
16 Chemonges S, Gupta R, Mills P C, Kopp S R, Sadowski P. Proteome Sci.,? 2016,? 15(1): 11-26
17 Zhang J, Xin L, Shan B Z,Chen W W, Xie M J, Yuen Denis, Zhang W M, Zhang Z F, Lajoie G A, Ma B. Mol. Cell. Proteomics,? 2012,? 11(4): M111. 010587
18 Ma B, Zhang K, Hendrie C, Liang C Z, Li M,? Doherty-Kirby A, Lajoie G. Rapid Commun. Mass Spectrome.,? 2003,? 17(20): 2337-2342
19 Sun X Y, Huang X, Tan X, Si Y, Wang X Z, Chen F, Zheng S G. J. Transl. Med.,? 2016,? 14(1): 240
Comparison of Two Different Softwares for
Analyzing Salivary Peptidome
WAN Lei-Lei1,3, CHEN Qi2, CHENG Si-Ming1,3, LI Shui-Ming1,3,4, WANG Yong*1,3,4
1(College of Life and Ocean Science, Shenzhen Key Laboratory of Marine Bioresources and Ecology,
Brain Disease and Big Data Research Institute, Shenzhen University, Shenzhen 518060, China)
2(The Eighth Hospital Affiliated to Sun Yat-Sen University, Shenzhen 518026, China)
3(Shenzhen Bay Laboratory, Shenzhen 518055, China)
4(Shenzhen-Hong Kong Institute of Brain Science-Shenzhen Fundamental Research Institutions, Shenzhen 518060, China)
Abstract In this study, 10 saliva samples were used as data sets. After the saliva sample was separated by graphene oxide-lanthanum phosphate nanocomposite (LaGM) method and identified by high-resolution tandem time-of-flight mass spectrometry, Peaks studio 8.5 (PS) and Protein Pilot Software 4.0 (PP) were used for searching analysis and the identification results were compared. It was found that the number of peptides identified by the two softwares were different. Under the experimental conditions, not only the PS software could usually identify more peptides, but also the results given by the two softwares did not completely overlap, and the same peptides identified by the two softwares occupied 30%-60% in PS and 60%-90% in PP, which meant that some peptides could be only identified by PS or PP software, but at the level of degraded protein, PS method had no obvious advantages. It was worth noting that if the positive results of PP and PS were cross-referenced, peptides below the threshold in one software may be above the threshold in another software, and this probability was positive related to the score of the peptide. Further research also found that the two softwares had a certain preference for identifying peptides of different lengths. The identified results of PS had more short peptides, while PP software could give more long peptides. In comparison, in PP software, short peptides were prone to false negative result, but long peptides were prone to false negative result in PS software. And the intensity of the signal had no obvious correlation with the threshold. This study showed that it was not advisable to use only one kind of software to analyze or only use the same reference result to represent the entire peptidome. Both softwares could identify the information each other that could not be identified by the other software. Cross-referencing the two analysis softwares each other could improve the accuracy of the results.
Keywords Peptidome; Peaks studio; Protein Pilot; Uncertainty; False negative
(Received 10 July 2020; accepted 31 August 2020)
This work was supported by the Shenzhen Science and Technology Innovation Committee (No. JCYJ20170818142154551) and the Shenzhen-Hong Kong Institute of Brain Science-Shenzhen Fundamental Research Institutions (No. 2019SHIBS0003).
2020-07-10收稿; 2020-08-31接受
本文系深圳市科技計劃項目(No. JCYJ20170818142154551)和深港腦科學(xué)創(chuàng)新研究院項目(NO. 2019SHIBS0003)資助
* E-mail:? wyong@szu.edu.cn