左德筠,王霄霄,王海霞*
(大連大學(xué)研究生學(xué)院,遼寧 大連 116622)
疾病會(huì)導(dǎo)致生物體液和組織中分子指紋圖譜發(fā)生改變,這些變化可以通過分析基因組、蛋白組或者代謝組的成分來衡量。蛋白質(zhì)組學(xué)和代謝組學(xué)分析提供了檢測(cè)疾病發(fā)生的方法,基因分析能找出個(gè)體患某些疾病的傾向,并有助于評(píng)估長(zhǎng)期風(fēng)險(xiǎn)。因此,直接測(cè)定基因、蛋白質(zhì)和代謝物對(duì)于認(rèn)識(shí)疾病和正常狀態(tài)的生物過程至關(guān)重要[1]。
代謝是最基本的生命活動(dòng),是機(jī)體最基礎(chǔ)的物質(zhì)來源和能量來源,同時(shí)也與細(xì)胞的各種物質(zhì)活動(dòng)和功能密切相關(guān)[2]。代謝組學(xué)是生理病理等基礎(chǔ)研究的重要研究部分和內(nèi)容。代謝過程處于生命活動(dòng)的中端,即使在基因和蛋白質(zhì)層面發(fā)生很微小的變化,這些微小變化都會(huì)在代謝層面放大,所以大家認(rèn)為這些代謝這些代謝物的變化可以直接更靈敏的反應(yīng)機(jī)體的狀態(tài)和體征改變,所以它是機(jī)體狀態(tài)很好的指征和指標(biāo)。生物標(biāo)志物是指某種疾病機(jī)體體液或者組織中過度表達(dá)的物質(zhì),可以是單核苷酸、核酸甲基化、mRNA、蛋白質(zhì)或相關(guān)代謝小分子這些物質(zhì)的變化與疾病特征相關(guān)。生物標(biāo)志物可以用于檢測(cè)疾病生物學(xué)行為和預(yù)測(cè)臨床結(jié)果。生物標(biāo)志物應(yīng)該具有疾病特異性,并且受環(huán)境條件或生理因素干擾少。并且易于測(cè)量靈敏度和特異度要高。
發(fā)現(xiàn)新的代謝標(biāo)志物的關(guān)鍵依賴于定量測(cè)定疾病組和正常對(duì)照組樣品中某些或某種代謝物的變化。疾病能引起機(jī)體組織和器官的病理變化,因此作為承擔(dān)細(xì)胞基本功能的蛋白質(zhì)及其代謝小分子也會(huì)發(fā)生相應(yīng)改變。這些改變可以體現(xiàn)在濃度、細(xì)胞的特定部位、相互作用和活性等方面的差異。代謝物的變化和某種疾病之間的相關(guān)性就需要進(jìn)行精準(zhǔn)的定量測(cè)量,這對(duì)于樣本具有一定的統(tǒng)計(jì)學(xué)意義。
代謝組學(xué)是對(duì)生物樣品多個(gè)組混合物的定量分析,描述生物體內(nèi)多種代謝物質(zhì)動(dòng)態(tài)變化的新興科學(xué),是系統(tǒng)生物學(xué)的重要領(lǐng)域。雖然蛋白質(zhì)組學(xué)和基因組學(xué)的巨大進(jìn)步為調(diào)節(jié)細(xì)胞生理過程及病理因素提供了大量的信息,但是深入研究生物系統(tǒng)的功能是通過代謝物濃度和通量來得到的。定量檢測(cè)基因轉(zhuǎn)錄蛋白質(zhì)最終代謝小分子產(chǎn)物,為代謝途徑形成的生化網(wǎng)絡(luò)及其所發(fā)揮的功能提供了重要信息,為進(jìn)一步闡明疾病的發(fā)病機(jī)制提供證據(jù)。
許多先進(jìn)的分析的方法用于生物樣品的復(fù)雜混合物分析,包括血清、血漿、尿液、細(xì)胞和組織等。兩種最常用的方法是質(zhì)譜(MS)和核磁共振(NMR)波譜。它們?cè)诖x物鑒定和濃度測(cè)定方面提供互補(bǔ)。由于實(shí)驗(yàn)應(yīng)用的是質(zhì)譜分析技術(shù),因此在這里具體介紹MS分析。
MS具有高靈敏度(通常是皮克級(jí))和數(shù)據(jù)采集速度,因此是代謝組學(xué)最常用的分析工具之一,它能檢測(cè)超過一千種代謝物特征。其鑒定手段主要基于保留時(shí)間、分子量和質(zhì)譜碎片與純品的色譜圖和碎片信息的比較。近些年基于MS方法的研究大幅增長(zhǎng),MS技術(shù)包括四級(jí)桿、三重四級(jí)桿、飛行時(shí)間(TOF)、離子阱等質(zhì)譜分析儀[3]。先進(jìn)的軟件系統(tǒng)結(jié)合大量數(shù)據(jù)庫(kù)更易于代謝分子的測(cè)定。由于樣品成分太過復(fù)雜,在進(jìn)行MS定量分析之前,通常先分離目標(biāo)代謝產(chǎn)物。因此目前使用質(zhì)譜常與分離技術(shù)相結(jié)合,如液相色譜(LC)和氣相色譜(GC)[4]。MS與色譜聯(lián)合使用的分析平臺(tái)的建立證明其在代謝組學(xué)中是有效的。
從MS獲得光譜數(shù)據(jù)是復(fù)雜的,需要用多元統(tǒng)計(jì)學(xué)分析方法。目前在代謝組學(xué)中,通過定量檢測(cè)體內(nèi)小分子代謝分子水平以及相應(yīng)的數(shù)據(jù)處理方法是主成分分析(PCA),邏輯回歸和偏最小二乘判別分析(PLS-DA)等相關(guān)方法。PCA是無監(jiān)督的方法,常用與數(shù)據(jù)分析的初始階段。之后預(yù)測(cè)模型通常使用監(jiān)督方法,一般常用PLS-DA建立一個(gè)基于矩陣X相對(duì)于矩陣Y的回歸模型,這個(gè)模型包括了每個(gè)樣本的類別信息[5]。邏輯回歸廣泛應(yīng)用于生物醫(yī)學(xué),它有助于選擇出疾病組和對(duì)照組區(qū)別地代謝物。PLS-DA模型一般采用交互驗(yàn)證,即先在內(nèi)部使用相同數(shù)據(jù)集,再在外部使用獨(dú)立數(shù)據(jù)集,這是為了避免過擬合。
我們可以采集疾病組和對(duì)照組樣本,應(yīng)用質(zhì)譜法對(duì)分析其血清中代謝產(chǎn)物;通過數(shù)據(jù)預(yù)處理、多維統(tǒng)計(jì)學(xué)分析(PCA、PLS-DA)在得到的代謝產(chǎn)物分子中選定差異有統(tǒng)計(jì)學(xué)意義的代謝產(chǎn)物分子,并對(duì)其進(jìn)行單維統(tǒng)計(jì)學(xué)分析,隨后與已知代謝組數(shù)據(jù)庫(kù)(XCMS、Melin、HMDB)進(jìn)行比較,得到具有顯著差異的分子式以及所代表的代謝物質(zhì)名稱[6]。最后,將上述確定的差異代謝產(chǎn)物與已知代謝途徑庫(kù)比較,從中挖掘出與原發(fā)性高血壓相關(guān)的異常代謝物及代謝途徑即生物信息學(xué)分析[6],進(jìn)行顯著性差異代謝物通路分析(KEGG通路),獲得相關(guān)代謝標(biāo)志物。如圖:
基于MS定量代謝組學(xué)平臺(tái)的所有技術(shù)的迅速發(fā)展,如質(zhì)譜分析、數(shù)據(jù)處理、數(shù)據(jù)庫(kù)搜索和實(shí)驗(yàn)結(jié)果的生物學(xué)解釋,更方便于研究者使用代謝組學(xué)技術(shù)發(fā)現(xiàn)新的人類疾病相關(guān)生物標(biāo)志物。但是,由于人體樣本具有異質(zhì)性和數(shù)據(jù)平臺(tái)的不統(tǒng)一性,使得研究人員面臨巨大的挑戰(zhàn)。分析復(fù)雜樣品的最佳途徑是密切結(jié)合蛋白質(zhì)組學(xué)和基因組學(xué)研究,開發(fā)綜合分析設(shè)施,以提高發(fā)現(xiàn)生物標(biāo)志物的可信度,并得以進(jìn)行驗(yàn)證。所以自動(dòng)化設(shè)備的創(chuàng)新和發(fā)展是MS應(yīng)用于臨床代謝組學(xué)所必不可少的。
中西醫(yī)結(jié)合心血管病雜志(電子版)2019年17期