陳 雯 劉智文 游小龍 袁分錢(qián) 張 麗 樂(lè) 飛 高 源 饒 軍
皮膚鱗狀細(xì)胞癌(CSCC)是起源于表皮或附屬器角質(zhì)形成細(xì)胞的一類惡性腫瘤,在非黑色素皮膚癌中,其發(fā)病率位列第二[1]。近年來(lái),CSCC發(fā)病率在全球范圍內(nèi)以3%~10%的增幅呈逐年遞增趨勢(shì)。美國(guó)的統(tǒng)計(jì)研究表明其每年新發(fā)患者約20萬(wàn)~40萬(wàn),相關(guān)死亡人數(shù)超過(guò)3000人[2]。早發(fā)現(xiàn)、早診治很大程度上影響CSCC的預(yù)后,并且CSCC多見(jiàn)于老年人,隨著我國(guó)人口老齡化的到來(lái),提高CSCC的早期診治,進(jìn)一步研究其發(fā)病機(jī)制顯得尤為重要。一般認(rèn)為,機(jī)體正常細(xì)胞經(jīng)過(guò)多因素多基因協(xié)同引起細(xì)胞DNA損傷,引起表達(dá)異常,最后導(dǎo)致腫瘤發(fā)生。因此,從基因表達(dá)、蛋白質(zhì)水平研究方向揭示腫瘤的發(fā)生,闡明腫瘤發(fā)生的本質(zhì),對(duì)于腫瘤的早期診斷、鑒別診斷、預(yù)后評(píng)估及早期預(yù)防具有重要的意義[3]。隨著人類基因組計(jì)劃的實(shí)施,蛋白質(zhì)組學(xué)成為生命科學(xué)研究在后基因組時(shí)代的核心內(nèi)容之一[4]。通過(guò)蛋白質(zhì)組學(xué)對(duì)不同時(shí)間和空間上發(fā)揮功能的特定的蛋白質(zhì)組群進(jìn)行研究,進(jìn)而在蛋白質(zhì)的水平上探索其作用模式、功能機(jī)理、調(diào)節(jié)調(diào)控以及蛋白質(zhì)組群內(nèi)的相互作用,從而為臨床診斷、病理研究、藥物篩選、新藥開(kāi)發(fā)、新陳代謝途徑研究等提供理論依據(jù)和基礎(chǔ)。目前基于DIA/SWATH的質(zhì)譜定量技術(shù)研究CSCC患者血清蛋白質(zhì)組學(xué)的報(bào)道國(guó)內(nèi)外尚處于空白階段,因此本研究針對(duì)CSCC患者及其對(duì)照組進(jìn)行全面的蛋白圖譜分析,通過(guò)統(tǒng)計(jì)學(xué)和生物信息學(xué)等方法找出差異性表達(dá)的蛋白,構(gòu)建相關(guān)調(diào)控網(wǎng)絡(luò)圖,從而明確CSCC可能的發(fā)病機(jī)制,為該病的早期診斷和后期治療提供數(shù)據(jù)基礎(chǔ)及策略。
我們收集了2019年1月至2020年6月在我院住院的CSCC患者20例及同期在我院體檢中心常規(guī)體檢的健康人群20例(對(duì)照組)的血清樣本。本研究得到本院醫(yī)學(xué)倫理委員會(huì)的批準(zhǔn),所得研究均知情同意。所有病例首次確診為CSCC并且無(wú)常規(guī)使用藥物或接受治療史。除了CSCC外有其他癌癥或者其他疾病包括哮喘、關(guān)節(jié)炎、高血壓、糖尿病、肝腎疾病史等排除在外。CSCC患者20例和健康人群20例血清樣本最終均混成6個(gè)生物學(xué)重復(fù)。
1.2.1 蛋白提取 分別向待測(cè)的12個(gè)混合的血清樣品中加入0.5 ml的細(xì)胞裂解液(8M UREA,蛋白酶抑制劑,100 mM Tris-HCl pH 7.6)。冰浴超聲15 min后在離心機(jī)上離心15 min,18000 g。接著吸取上清,采用BCA法進(jìn)行蛋白定量。定量后各取20 μg的待測(cè)樣品混合pool后用于后期的建庫(kù)。需要指出的是我們利用超濾管方法將以上待測(cè)樣品和pooled樣品進(jìn)行酶解。
1.2.2 數(shù)據(jù)依賴性采集模式(DDA) 將酶解后的多肽樣本溶解在25 μl的A液(0.1%甲酸的水,含iRT標(biāo)準(zhǔn)肽)中,然后在EASY-nano-LC 色譜系統(tǒng)上進(jìn)樣5 μl。先以4.5 μl/min的流速載樣至預(yù)柱上,而后以300 nl/min的流速在分析柱上進(jìn)行分離。采用Orbitrap Fusion 質(zhì)譜儀完成質(zhì)譜數(shù)據(jù)的采集。
1.2.3 DIA分析 每個(gè)樣品各取2 μg肽段(含iRT 標(biāo)準(zhǔn)肽段)進(jìn)行1次DIA 質(zhì)譜測(cè)試,時(shí)長(zhǎng)2 h,之后同樣在EASY-nano-LC 色譜系統(tǒng)上完成分離。DIA分析時(shí)使用Thermo Orbitrap Fusion Tribrid lumos質(zhì)譜儀進(jìn)行質(zhì)譜數(shù)據(jù)的采集。
1.2.4 蛋白質(zhì)定性定量分析 通過(guò)Protein Discoverer 2.1 SP1軟件DDA譜圖庫(kù),然后將其原始數(shù)據(jù)導(dǎo)入到Spectronout Pulsar X完成蛋白質(zhì)的定性定量分析。定性分析使用Precursor Qvalue Cutoff 0.01;定量參數(shù)為iTR標(biāo)曲采取非線性擬合,使用子離子峰面積,至少選擇三個(gè)子離子的平均強(qiáng)度定量。
1.3.2 生物學(xué)功能分析 利用OmicsBean組學(xué)數(shù)據(jù)整合分析云平臺(tái),對(duì)篩選出的差異蛋白進(jìn)行了基因本體(gene ontology,GO)功能注釋和富集分析。利用KEGG數(shù)據(jù)庫(kù)進(jìn)行Pathway分析確定蛋白質(zhì)參與的最主要生化代謝途徑和信號(hào)轉(zhuǎn)導(dǎo)途徑。借助STRING (http://string.embl.de/) 實(shí)現(xiàn)蛋白相互作用網(wǎng)絡(luò)(PPI)分析。
基于DIA/SWATH的質(zhì)譜定量技術(shù)我們對(duì)12個(gè)樣品進(jìn)行了蛋白圖譜分析,結(jié)果表明人血清中共檢測(cè)到411個(gè)蛋白。接著通過(guò)在線的PANTHER(www.pantherdb.org)系統(tǒng)對(duì)所有的411個(gè)蛋白進(jìn)行功能分類。209個(gè)蛋白根據(jù)進(jìn)化關(guān)系得到注釋,其功能可以歸納為17類,主要為defense/immunity protein (93個(gè)蛋白)、protein-binding activity modulator (28個(gè)蛋白)、protein modifying enzyme (25個(gè)蛋白)和metabolite interconversion enzyme (16個(gè)蛋白)。
通過(guò)對(duì)比6個(gè)CSCC和6個(gè)正常人血清樣品的蛋白圖譜特征,我們發(fā)現(xiàn)共有28個(gè)蛋白具有顯著性差異,差異倍數(shù)范圍在0.46至3.12之間。同時(shí),上調(diào)的19個(gè)蛋白中包括3個(gè)免疫蛋白(IGKV2-29、IGHV3-64和IGKV4-1)以及2個(gè)代謝代謝酶(VNN1和TTR)。而下調(diào)的9個(gè)蛋白中涉及免疫蛋白(IGLV1-40)、蛋白修飾酶(Cathepsin B)和蛋白酶抑制劑(IGFBP2和ITIH3)。進(jìn)一步的聚類分析結(jié)果顯示這些差異蛋白質(zhì)能夠很好地區(qū)分以上兩組血清樣品。
針對(duì)以上28個(gè)具有顯著性差異的蛋白,進(jìn)一步做了GO富集分析,結(jié)果表明:biological process (BP)、cellular component (CC)和molecular function (MF)三個(gè)本體中分別有533個(gè)、62個(gè)和57個(gè)顯著性差異(adjusted P value<0.05)的條目(GO terms)。圖1為 GO 富集分析概圖,展示了 BP、CC 和 MF 三類富集分析顯著性排名前十的條目??梢钥闯觯珺P本體中主要涉及的應(yīng)激反應(yīng)和免疫反應(yīng),包括regulation of response to stimulus(應(yīng)激反應(yīng)調(diào)控)、immune effector process(免疫效應(yīng)過(guò)程)和positive regulation of immune system process(免疫系統(tǒng)過(guò)程的正調(diào)控)等。CC本體中主要富集的是胞外成分,比如extracellular region part(胞外區(qū)部分)、extracellular region(胞外區(qū))和extracellular space(細(xì)胞外空間)等。而對(duì)于MF本體而言,最富集的10個(gè)條目涉及多個(gè)酶活性(比如serine-type endopeptidase activity等)、受體結(jié)合(receptor binding)、蛋白結(jié)合(protein binding)和抗原結(jié)合(antigen binding)。
在生物體內(nèi),不同蛋白相互協(xié)調(diào)行使其生物學(xué)行為,基于Pathway的分析有助于更進(jìn)一步了解其生物學(xué)功能。因此我們也進(jìn)行了Pathway代謝通路富集注釋。如圖2所示,這些差異的蛋白主要顯著地富集在pantothenate and coA biosynthesis(泛酸與輔酶的生物合成)、MAPK signaling pathway(MAPK信號(hào)通路)、propanoate metabolism(丙酸代謝)、propanoate metabolism(丙酮酸代謝)和cysteine and methionine metabolism(半胱氨酸和蛋氨酸代謝)五條代謝通路上。這些代謝通路有3條歸類于新陳代謝組,而剩余2條分別屬于環(huán)境信息處理和人類疾病組。
為了進(jìn)一步了解CSCC的發(fā)生和發(fā)展過(guò)程,基于差異表達(dá)蛋白我們進(jìn)行了蛋白-蛋白相互作用網(wǎng)絡(luò)(PPI)分析。結(jié)果表明共有10條代謝通路和8個(gè)蛋白關(guān)聯(lián)同一個(gè)PPI中,具體包括癌癥相關(guān)的代謝途徑glycolysis/gluconeogenesis、MAPK signaling pathway等,以及與癌癥發(fā)生密切關(guān)聯(lián)的的蛋白CTSB、LDHB等。需要指出的MAPK signaling pathway關(guān)聯(lián)了4個(gè)蛋白(IL1RAP、IGF2、IGFBP2和ITIH3),而LDHB涉及了5個(gè)代謝途徑(glycolysis/gluconeogenesis、pyruvate metabolim、central carbon metabolism in cancer、propanoate metabolism和cysteine and methionine metabolism。
圖1 基于差異蛋白的GO富集分析
1為泛酸與輔酶的生物合成;2為MAPK信號(hào)通路;3為丙酸代謝;4為丙酮酸代謝;5為Ⅱ型糖尿?。?為半胱氨酸和蛋氨酸代謝
對(duì)于蛋白質(zhì)組學(xué)的研究,以前主要采用傳統(tǒng)的數(shù)據(jù)依賴采集(DDA)技術(shù),該技術(shù)對(duì)于成分復(fù)雜的生物樣本蛋白組學(xué)的研究,其應(yīng)用有一定的局限性。本研究將采用可以將整個(gè)質(zhì)譜掃描質(zhì)量范圍分為若干窗口,依次對(duì)每個(gè)窗口的所有離子進(jìn)行碎裂,采集全部子離子信息的數(shù)據(jù)非依賴采集(DIA)定量技術(shù)。相比傳統(tǒng)的DDA定量技術(shù),DIA定量具有可以獲取全部離子,具有更高的蛋白覆蓋度;可重現(xiàn)性高,樣品間具有更高的相關(guān)性;定量準(zhǔn)確度幾乎與MRM技術(shù)相當(dāng);線性動(dòng)態(tài)范圍可跨越4個(gè)數(shù)量級(jí);一次實(shí)驗(yàn)最多可檢測(cè)到5000種以上蛋白并定量的優(yōu)點(diǎn)。我們首次對(duì)CSCC患者和對(duì)照組的血清樣本進(jìn)行了DIA/SWATH分析,期望能更全面地更深入地展示CSCC血清蛋白組的分子特征。研究結(jié)果表明在血清樣本中檢測(cè)并鑒定了411種蛋白,包括蛋白修飾酶、轉(zhuǎn)運(yùn)子、細(xì)胞粘性分子、結(jié)構(gòu)蛋白和防御/免疫蛋白等14類蛋白。與之前的研究相比,我們鑒定出來(lái)的蛋白某種程度上來(lái)說(shuō)種類最廣泛、數(shù)目最多[5]。如此廣泛和深入的蛋白圖譜分析更加有利于我們從分子層面研究CSCC的發(fā)病機(jī)制,通過(guò)發(fā)現(xiàn)相關(guān)生物標(biāo)志物為該病的早期診斷和后期療效評(píng)價(jià)提供數(shù)據(jù)基礎(chǔ)及策略。
血清作為1種平衡穩(wěn)定的體液樣本,被廣泛應(yīng)用于蛋白組學(xué)研究,可以作為很好的生物標(biāo)志物來(lái)源。我們通過(guò)統(tǒng)計(jì)學(xué)方法發(fā)現(xiàn)CSCC患者血清有28個(gè)蛋白顯著性變化,進(jìn)一步的聚類分析結(jié)果表明這些蛋白可以很好的區(qū)分患者和正常樣品。更重要的是在28個(gè)蛋白中,有多個(gè)蛋白據(jù)報(bào)道與癌癥(甚至是CSCC)的發(fā)生發(fā)展密切相關(guān)。比如泛酸酶(VNN1)Vnn1通過(guò)挽救線粒體活性來(lái)抑制Warburg效應(yīng)和肉瘤生存[6]。VNN1過(guò)表達(dá)與直腸癌患者術(shù)前放化療反應(yīng)不良及預(yù)后不良有關(guān)。另外乳酸脫氫酶(LDHB)在腫瘤微環(huán)境中能夠作為腫瘤及其間質(zhì)之間的代謝紐帶,它能夠在腫瘤細(xì)胞中控制腫瘤溶酶體活性和自噬[7]。這些差異蛋白的發(fā)現(xiàn)將對(duì)CSCC的早期疾病診斷、早期發(fā)生及轉(zhuǎn)移等腫瘤標(biāo)志物的鑒定、以及新的臨床治療方案的制定具有非常重要的意義。后續(xù)的生物學(xué)功能分析結(jié)果表明MAPK signaling pathway在CSCC血清中發(fā)生顯著性變化。眾所周知,MAPK 信號(hào)通路在調(diào)節(jié)腫瘤細(xì)胞增生及存活的過(guò)程中起主要作用。近來(lái)研究表明MAPK信號(hào)通路在光化性角化病(actinic keratosis)向CSCC的轉(zhuǎn)化過(guò)程中起重要作用[8]。
綜上所述,本研究發(fā)現(xiàn)CSCC患者血清中28個(gè)差異蛋白,主要參與pantothenate and coA biosynthesis、MAPK signaling pathway、propanoate metabolism、propanoate metabolism和pyruvate metabolism 5條代謝通路。本研究從分子水平探究 CSCC 的發(fā)生、進(jìn)展機(jī)制,為 CSCC 的診斷、靶向藥物研究及判斷預(yù)后提供有價(jià)值的信息。需要指出的是本研究中樣本量較小,后期仍需要通過(guò)大規(guī)模的臨床樣本對(duì)潛在生物標(biāo)志物進(jìn)行驗(yàn)證。