国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

代謝組學(xué)信息獲取與數(shù)據(jù)預(yù)處理瓶頸問題探討

2014-09-12 12:16王敏黃寅張偉張尊建許風(fēng)國
藥學(xué)進(jìn)展 2014年2期
關(guān)鍵詞:代謝物組學(xué)樣本

王敏,黃寅,張偉,張尊建*,許風(fēng)國**

(1. 中國藥科大學(xué)藥物質(zhì)量與安全預(yù)警教育部重點實驗室,江蘇 南京 210009;2. 中國藥科大學(xué)天然藥物活性組分與藥效國家重點實驗室,江蘇 南京 210009;3. 澳門科技大學(xué)中藥質(zhì)量研究國家重點實驗室,澳門 519020)

·前沿與進(jìn)展· ADVANCES IN PHARMACEUTICAL SCIENCES

代謝組學(xué)信息獲取與數(shù)據(jù)預(yù)處理瓶頸問題探討

王敏1,2,黃寅1,2,張偉3,張尊建1,2*,許風(fēng)國1,2**

(1. 中國藥科大學(xué)藥物質(zhì)量與安全預(yù)警教育部重點實驗室,江蘇 南京 210009;2. 中國藥科大學(xué)天然藥物活性組分與藥效國家重點實驗室,江蘇 南京 210009;3. 澳門科技大學(xué)中藥質(zhì)量研究國家重點實驗室,澳門 519020)

專題:組學(xué)與網(wǎng)絡(luò)藥理學(xué)

編者按:近年來,隨著醫(yī)藥生命科學(xué)的不斷深入,人們逐漸意識到一些問題:例如,對于腫瘤、心血管疾病、糖尿病及神經(jīng)性疾病等復(fù)雜疾病,僅使用針對單一分子靶點的高特異性化合物難以獲得很好的療效,基于“一個基因,一種藥物,一種疾病”的傳統(tǒng)藥物研發(fā)模式已顯示出其發(fā)展的局限性;又如,中藥化學(xué)成分的復(fù)雜性,導(dǎo)致很多關(guān)鍵性科學(xué)問題(中藥藥效物質(zhì)基礎(chǔ)、作用機制、配伍規(guī)律和毒性機制等)不能得到有效解決,使得中藥現(xiàn)代化的進(jìn)程變得尤為艱難。而組學(xué)(Omics)和生物信息學(xué)(Bioinformatics)等新興學(xué)科的誕生和飛速發(fā)展,為上述難題的攻克提供了可能。2013年10月,由中國科協(xié)主辦、中國藥學(xué)會和《中國天然藥物》編委會承辦的中國科協(xié)第86期“新觀點新學(xué)說”學(xué)術(shù)沙龍在南京召開,多位專家學(xué)者就“網(wǎng)絡(luò)藥理學(xué),中藥現(xiàn)代化的新思路新方法”這一主題展開了交流,為與會代表奉獻(xiàn)了一場思想的盛宴。本刊編輯部特邀出席此次會議的四位專家——中國藥科大學(xué)許風(fēng)國教授、中國科學(xué)院上海藥物研究所周虎研究員、解放軍后勤工程學(xué)院趙靜教授和重慶大學(xué)呂海濤研究員作客本期“前沿與進(jìn)展”欄目,與讀者分享他們在組學(xué)技術(shù)與生物信息學(xué)技術(shù)研究中的成果和思路,為網(wǎng)絡(luò)藥理學(xué)及中藥現(xiàn)代化研究的進(jìn)一步發(fā)展提供寶貴的參考。

經(jīng)過近15年的快速發(fā)展,代謝組學(xué)已逐步成熟并滲透到生命科學(xué)和醫(yī)學(xué)研究領(lǐng)域的各個層面。隨著認(rèn)識的不斷深入,各種影響代謝組學(xué)研究的細(xì)節(jié)因素和技術(shù)瓶頸逐步被揭示。從生物樣品采集與制備、原始數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理和方法學(xué)驗證等方面系統(tǒng)探討了影響代謝組學(xué)研究的主要瓶頸問題,以期推動代謝組學(xué)研究的精細(xì)化和規(guī)范化發(fā)展。

代謝組學(xué);數(shù)據(jù)采集;數(shù)據(jù)預(yù)處理;方法學(xué)驗證

隨著人類科學(xué)研究思維從“點”到“面”再到“系統(tǒng)”的不斷“相位轉(zhuǎn)移”,催生了基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué)等各種組學(xué)技術(shù)。其中代謝組學(xué)主要研究生物體系在內(nèi)、外因素(如遺傳變異、疾病侵襲、藥物干預(yù)、環(huán)境變化等)作用下,所含內(nèi)源性小分子代謝物(一般指相對分子質(zhì)量低于1 000的代謝物)種類、數(shù)量變化的動態(tài)規(guī)律及與生理、病理變化的關(guān)聯(lián)。代謝組學(xué)以生物體內(nèi)參與物質(zhì)傳遞、能量代謝和信息傳導(dǎo)等代謝調(diào)控的全體小分子物質(zhì)即代謝組(metabolome)為研究對象,這些內(nèi)源性小分子代謝物處于生物信息流的末端,它們的整體輪廓包含著基因組(genome)、轉(zhuǎn)錄組(transcriptome)、蛋白質(zhì)組(proteome)變化及相互間協(xié)調(diào)作用的終極信息,能直接反映生物體的表型(phenotype)特征。

代謝組學(xué)從1999年Nicholson提出概念,經(jīng)歷了近15年的快速發(fā)展,目前已逐步成熟并已滲透到生命科學(xué)和醫(yī)學(xué)領(lǐng)域的各個層面,尤其在藥物研發(fā)[1]、疾病診斷[2-4]、藥物毒性和機制研究[5]、植物代謝物研究[6-8]等諸多方面展現(xiàn)出良好的潛能。據(jù)統(tǒng)計,全球每年發(fā)表的代謝組學(xué)相關(guān)SCI論文超過3 000篇。中國學(xué)者對代謝組學(xué)研究也表現(xiàn)出越來越大的熱情,2013年國家自然科學(xué)基金資助代謝組學(xué)相關(guān)研究課題180項,基金資助的總量超過1億元(見圖1)。

圖1 2003—2013年間國家自然科學(xué)基金資助的代謝組學(xué)相關(guān)科研項目數(shù)的逐年統(tǒng)計結(jié)果(數(shù)據(jù)統(tǒng)計截至2013年12月31日)Figure 1 Number of metabolomics-related research projects supported by the National Natural Science Foundation of China between 2003—2013

然而,隨著代謝組學(xué)研究從粗放向精細(xì)的轉(zhuǎn)變,各種影響代謝組學(xué)研究的細(xì)節(jié)因素和技術(shù)瓶頸也逐步被揭示。本文結(jié)合筆者所在課題組在該領(lǐng)域多年的研究成果,從生物樣品采集與制備、原始數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理和方法學(xué)驗證等4個方面系統(tǒng)探討了影響代謝組學(xué)研究的主要瓶頸問題,以期推動代謝組學(xué)研究的精細(xì)化和規(guī)范化發(fā)展。

1 源于樣品的細(xì)節(jié)因素與相關(guān)技術(shù)瓶頸

生物樣品的采集和前處理是代謝組學(xué)研究的初始步驟,生物樣本自身的質(zhì)量往往決定了代謝組學(xué)研究結(jié)果的可靠性和價值。影響生物樣本質(zhì)量的主要因素包括樣本種類、采集時間、采集部位、樣本數(shù)、前處理方式等。尿樣、血清、血漿、組織、細(xì)胞等是代謝組學(xué)研究常用生物樣本,在選取何種生物樣本時,既需充分考慮實驗的目的、分析方法的特點,同時要兼顧實驗動物和人體試驗倫理學(xué)。實驗設(shè)計中需要采集足夠數(shù)量的代表性樣本,減少生物樣品個體差異對分析結(jié)果的影響,應(yīng)充分考慮實驗對象的飲食習(xí)慣、性別、年齡、晝夜節(jié)律。此外,生物樣本前處理方式選擇要綜合考慮簡便性、重現(xiàn)性、代謝物覆蓋廣等因素。

1.1 血樣

作為臨床實驗和病理學(xué)研究最常采用的一種生物樣品,血樣具有易于采集且蘊含代表生物體整體特征的代謝物信息的特點。但是,血樣采集部位、是否加抗凝劑、抗凝劑種類、抗凝劑濃度、放置時間等因素都會影響血樣的質(zhì)量,如在實驗設(shè)計和操作中對這些因素不加嚴(yán)格控制,必將影響代謝組學(xué)研究結(jié)果的可靠性。

血樣采集過程中是否使用抗凝劑是一個需要慎重考慮的問題,抗凝劑對血樣所含代謝物的種類、數(shù)量甚至濃度水平都有較大影響。已有研究揭示,血漿所含代謝物數(shù)量顯著少于血清。在濃度水平方面,小分子多肽、次黃嘌呤、黃嘌呤在血清中含量顯著高于血漿,而溶血磷脂酰肌醇在血清中含量卻顯著低于血漿[9]。Barri等[10]采用UPLCESI-QTOF/MS系統(tǒng)比較血清和分別采用檸檬酸、EDTA和肝素作為抗凝劑得到的血漿樣本間的差異。結(jié)果表明,血清與采用不同抗凝劑制備的血漿樣本在PCA得分圖上存在明顯分界線,且不同抗凝劑所得血漿樣本亦存在一定差異。不同抗凝劑所得血漿樣本不但整體代謝輪廓不同,而且特定代謝物如尿酸、酪氨酸、蛋氨酸、尿苷、腺嘌呤、焦谷氨酸等的濃度水平也彼此間差異顯著。研究還發(fā)現(xiàn)采用檸檬酸和EDTA為抗凝劑時,抗凝劑自身會對共流出物產(chǎn)生離子信號的抑制或增強,影響結(jié)果的重現(xiàn)性,并建議選擇不加抗凝劑的血清樣本或者用肝素血漿樣本進(jìn)行LCESI/MS代謝組學(xué)研究。但肝素血漿并不適于GC-MS代謝組學(xué)分析,Bando等[11]研究表明,當(dāng)采用肝素抗凝制備血漿時,肝素衍生化產(chǎn)物的峰會掩蓋內(nèi)源性代謝物。綜合現(xiàn)階段的研究,血清樣本似乎是LC/MS和GC/MS代謝組學(xué)研究的首選。

對于血樣采集,采血部位、放置時間、麻醉劑等因素也是需要考慮和考察的影響因素[9,11]。已有研究證明靜脈穿刺和毛細(xì)血管采血、腹主動脈和頸靜脈等不同取血方式所得血樣代謝輪廓圖有所差別。血樣放置時間包括3個方面:一是從全血采集到離心分取血清或血漿之間的放置時間;二是從分取血清或血漿到凍存的時間;三是從血樣凍存到代謝組學(xué)分析間的時間。血樣放置時間的長短以及可能產(chǎn)生的影響需要認(rèn)真考察和嚴(yán)格控制。Yin等[12]研究發(fā)現(xiàn),全血室溫放置制備血漿代謝物信號強度減弱,其中64個代謝物發(fā)生顯著性變化,而全血冰浴放置制備血漿4 h內(nèi)穩(wěn)定。血漿樣品凍融4次,代謝輪廓圖僅有很小的變化,表現(xiàn)在個別代謝物上,如左旋肉堿。出于人道主義以及動物倫理學(xué)的要求,在進(jìn)行實驗動物取血時往往會先麻醉,因此麻醉劑種類和濃度也是代謝組學(xué)研究需要考量的因素,Bando等[11]考察了麻醉劑對血漿樣本GC-MS代謝輪廓的影響,發(fā)現(xiàn)麻醉劑的使用僅會減少動物的不適反應(yīng),不會減低個體差異,乳酸含量在應(yīng)激的狀態(tài)(腹主動脈取血、非麻醉狀態(tài))下會顯著增大。對于血樣,溶血是常見現(xiàn)象,溶血程度將嚴(yán)重影響生物標(biāo)記物篩選結(jié)果的可靠性。研究發(fā)現(xiàn),與輕度溶血血漿相比,中度和重度溶血的樣本中69個代謝物發(fā)生顯著性變化,且代謝輪廓圖個體差異大[12]。

1.2 尿樣

尿液是代謝組學(xué)研究中另一個常用的生物樣本,具有非破壞性、可重復(fù)多次采樣以及含有豐富代謝物信息、樣品前處理簡單等特點。在收集尿液時應(yīng)注意控制個體狀態(tài)(如飲食等)、收集的步驟(包括時間、體積和溫度)、防腐劑(如疊氮化鈉、甲醛等)等因素對實驗的干擾。Bando等[11]比較了不同采集時間段和采樣條件對尿液內(nèi)源性物質(zhì)的影響,結(jié)果表明不同采樣間隔(4和24 h)所得尿樣代謝輪廓譜和個體間離散程度有較大區(qū)別,這綜合了晝夜節(jié)律、樣本放置等因素的影響。此外,Bando等還發(fā)現(xiàn),與常溫相比,在冰上收集尿液,個體差異小,更有利于代謝組學(xué)分析。在尿液的收集和保存過程中,為抑制細(xì)菌的生長和微生物降解作用,Want等[13]建議在冰上收集24 h的大鼠尿液,同時在收集容器中加入抑菌劑疊氮化鈉。

2 源于信息獲取的細(xì)節(jié)因素與相關(guān)技術(shù)瓶頸

在代謝組學(xué)研究中,分析方法是連接原始生物樣本和生物標(biāo)記物以及相關(guān)代謝通路的橋梁,因此代謝組學(xué)研究中采集信息的分析方法應(yīng)能夠全面、無偏向性地反映生物樣本的代謝輪廓。一個理想的代謝組學(xué)分析方法或分析策略應(yīng)具備以下幾點:1)無偏向性:涵蓋各種代謝物類型,可測濃度范圍廣泛;2)高通量:樣本處理簡單或者不需要樣品前處理;3)穩(wěn)定性和重現(xiàn)性好;4)可同時定性定量測定代謝物。GC/MS、LC/MS和NMR是目前代謝組學(xué)研究中信息獲取的3種主要分析方法和手段,它們各有優(yōu)缺點,在實際應(yīng)用中,為實現(xiàn)代謝物的更廣覆蓋,這3種方法一般多組合使用。

2.1 基于GC/MS的代謝組學(xué)信息獲取

GC/MS的主要優(yōu)點是靈敏度高,色譜分離重現(xiàn)性和質(zhì)譜檢測重現(xiàn)性高,當(dāng)采用電子轟擊源(EI)時有標(biāo)準(zhǔn)質(zhì)譜圖庫輔助代謝物鑒定,GC/MS成為代謝組學(xué)研究支柱分析平臺之一[14-16]。然而,GC/MS分析對象僅限于揮發(fā)性好和熱穩(wěn)定性高的代謝物,由于大多數(shù)內(nèi)源性代謝物如氨基酸、脂肪酸、胺類、糖類、甾體等是非揮發(fā)性的極性化合物,不能直接進(jìn)樣分析,需要對樣品進(jìn)行化學(xué)衍生化,轉(zhuǎn)化成相應(yīng)的揮發(fā)性衍生物以滿足GC/MS檢測。硅烷化、?;屯榛?種常用的衍生化方式,其中硅烷化適用于所有含活性氫的化學(xué)官能團(如―COOH、―OH、―NH―和―NH2)且相對操作簡易,GC/MS代謝組學(xué)常采用雙(三甲基硅烷基)三氟乙酰胺(BSTFA)和N-甲基-N-(三甲基硅烷基)三氟乙酰胺(MSTFA)試劑進(jìn)行硅烷化[4,17]。由于羰基和BSTFA或MSTFA硅烷化試劑反應(yīng)緩慢且易發(fā)生異構(gòu)化,因此在樣品進(jìn)行硅烷衍生化之前常常先進(jìn)行甲氧胺肟化反應(yīng)。

樣品前處理步驟越多,引入誤差的概率就越大。肟化及硅烷衍生化反應(yīng)過程所涉及的各個因素(如反應(yīng)時間、溫度、衍生化試劑類型等)都會影響GC/MS信息獲取的質(zhì)量,其最為嚴(yán)重的后果就是導(dǎo)致“多峰多來源”的現(xiàn)象。所謂“多峰”是指一個化合物在GC/MS色譜圖上表現(xiàn)為多個色譜峰,而“多來源”是指一個色譜峰來源于幾個不同的化合物。造成GC/MS“多峰多來源”的原因涉及樣品制備和分析整個過程,包括衍生化過程中所產(chǎn)生的副產(chǎn)物,不完全衍生化,溶液中或衍生化過程中化合物構(gòu)型轉(zhuǎn)變,提取、衍生化和氣化室中樣品的降解等[18-19]?!岸喾宥鄟碓础眴栴}已成為GC/MS代謝組學(xué)研究中的一大技術(shù)瓶頸,它既影響后續(xù)數(shù)據(jù)處理,曲解生物標(biāo)記物和代謝通路,又影響代謝組學(xué)結(jié)果生物意義的闡釋。

2.2 基于LC/MS的代謝組學(xué)信息獲取

與GC/MS相比,LC/MS具有分離效能高、分析速度快、檢測靈敏度高的特點,同時不受樣品揮發(fā)性和熱穩(wěn)定性的限制,無需衍生化即可分析體液中的極性化合物,應(yīng)用范圍廣。相對于常規(guī)樣品分析,代謝組學(xué)的研究對象是更為復(fù)雜的生物樣品基質(zhì),如血漿、尿樣、組織等,并且樣品數(shù)量巨大,這就要求液相色譜具有更加高效、快速、靈敏的性能。為滿足上述要求,研究者們常采用小顆粒填料(通常小于2 μm)的超高效液相色譜(UPLC)進(jìn)行生物樣品分析。UPLC與MS聯(lián)用為代謝組學(xué)提供更加高效靈敏的分析平臺。

在目前基于LC-MS的代謝組學(xué)信息獲取中主要技術(shù)挑戰(zhàn)包括兩個方面。1)代謝物的鑒別:不同于GC/MS分析具有標(biāo)準(zhǔn)譜圖庫用于代謝物結(jié)構(gòu)鑒定,LC/MS分析中代謝物的鑒別主要以待測物質(zhì)的準(zhǔn)確質(zhì)荷比為基礎(chǔ),在網(wǎng)絡(luò)數(shù)據(jù)庫[如HMDB(Human Metabolome Database,網(wǎng)址:http://www.hmdb.ca/)等]中進(jìn)行匹配分析,來確定代謝物結(jié)構(gòu),但這種方式極易造成假陽性結(jié)果。LC/MS分析中保留時間和碎片質(zhì)譜圖在不同儀器系統(tǒng)間是不可重現(xiàn)的,這主要是由于液相色譜柱本身的化學(xué)性質(zhì)及儀器廠家的設(shè)計不同導(dǎo)致。因此,在沒有可供定性鑒別的標(biāo)準(zhǔn)譜庫的情況下,代謝物結(jié)構(gòu)解析存在較大的難度。為合理準(zhǔn)確地確證代謝物,首先應(yīng)判斷代謝物的離子類型,再結(jié)合準(zhǔn)確質(zhì)荷比在數(shù)據(jù)庫中進(jìn)行匹配,分析代謝物的二級或多級裂解規(guī)律,初步確證代謝物,最后和標(biāo)準(zhǔn)品或類標(biāo)準(zhǔn)品(即與代謝物具有同一裂解途徑、同一中性丟失或相同離子碎片的物質(zhì))進(jìn)行核對。2)分析方法上對化合物的偏向性:弱極性的化合物,如磷脂、非極性氨基酸,在反相色譜柱(RPLC)保留行為良好,而極性化合物會在死時間出峰,不能很好地分離和檢測。Spagou等[20]比較了25個代謝物在RPLC和親水作用色譜柱(HILIC)上的保留行為,發(fā)現(xiàn)HILIC可以提供在RPLC上保留差的極性化合物的信息,作者認(rèn)為結(jié)合分析RPLC和HILIC的數(shù)據(jù)信息可以更為全面地研究代謝組,但這無疑會成倍地增加代謝組學(xué)研究工作的量和難度。

2.3 基于NMR的代謝組學(xué)信息獲取

作為一種結(jié)構(gòu)分析的有力工具,NMR主要優(yōu)勢在于能夠?qū)悠穼崿F(xiàn)無創(chuàng)性、無偏向性的檢測,樣品不需要繁瑣處理,單位樣品檢測成本低,重現(xiàn)性良好[21]。對于NMR的代謝組學(xué)信息獲取,目前存在的主要問題是由于分段切割積分造成的變量與代謝產(chǎn)物不對應(yīng)性。NMR圖譜分析與信息提取技術(shù)主要采用分段積分(Binning)的方法。在對NMR獲得的數(shù)據(jù)進(jìn)行分析時,首先要根據(jù)檢測樣本的NMR譜圖生成m行(每行代表1個樣本)n列(每列對應(yīng)樣本的1個變量)的原始數(shù)據(jù)矩陣,由于每個樣本數(shù)據(jù)量非常大,為了便于分析,通常需要先將譜圖數(shù)據(jù)分段積分,降低矩陣的維數(shù)。分段積分就是把NMR圖譜按一定的步長(如0.04 ppm)切割成數(shù)百個小單元,并對每個單元進(jìn)行積分,每個單元對應(yīng)1個變量,以此構(gòu)建數(shù)據(jù)矩陣。這種方法存在的最大問題是,它完全由軟件自動完成,可能會把1個完整的信號峰割裂成幾段或者把不同峰的部分積分到一起,得到的變量可能與代謝物沒有直接關(guān)聯(lián)。此外,由于化學(xué)位移易受酸堿度的影響,不同樣本間酸堿度的差異導(dǎo)致了相同信號化學(xué)位移的不同,這就使得NMR數(shù)據(jù)更加敏感復(fù)雜,并最終影響生物標(biāo)記物篩選和生物學(xué)意義的闡釋[22]。

3 源于數(shù)據(jù)預(yù)處理的細(xì)節(jié)因素與相關(guān)技術(shù)瓶頸

采用儀器分析得到的原始圖譜并不能直接用于化學(xué)計量學(xué)分析,還需要對數(shù)據(jù)預(yù)處理。將原始圖譜轉(zhuǎn)變?yōu)閿?shù)據(jù)矩陣,充分抽提所獲數(shù)據(jù)中的潛在信息,消除或減小實驗和分析過程中帶來的誤差是代謝組學(xué)數(shù)據(jù)預(yù)處理的主要目的。代謝組學(xué)數(shù)據(jù)預(yù)處理主要包括以下幾個方面:峰識別、提取、排列、對齊、合并、共有峰篩選等;缺失值的填補;歸一化(normalization);標(biāo)尺化(scaling)等步驟。

隨著代謝組學(xué)的迅猛發(fā)展,用于數(shù)據(jù)前處理的商品化軟件也應(yīng)運而生,由于NMR、GC/MS和LC/MS圖譜中信息表現(xiàn)形式不同,每種軟件的適用對象也不同,例如XCMS、MZmine、Metalign、Metaboanalysist等可處理GC/ MS和LC/MS數(shù)據(jù),MestreNova、Xwin NMR、MestReC、AMIX等可處理NMR數(shù)據(jù)。雖然軟件可輔助進(jìn)行數(shù)據(jù)預(yù)處理,提高效率,但所得結(jié)果的可靠性值得探究。Koh等[23]利用GC/MS分別對混合標(biāo)準(zhǔn)品和實際生物樣本(膀胱癌和健康受試者的尿液)采集數(shù)據(jù),采用Calibration feature、Statistical Compare、MetAlign、 MZmine這幾種軟件對數(shù)據(jù)進(jìn)行預(yù)處理,比較不同軟件的峰對齊準(zhǔn)確性,發(fā)現(xiàn)不同的軟件對混合標(biāo)準(zhǔn)品和實際生物樣品圖譜峰對齊的準(zhǔn)確度都不能達(dá)到100%,且存在差異,對實際生物樣本數(shù)據(jù)處理后所構(gòu)建的OPLS-DA模型的預(yù)測能力也存在差異。這一研究結(jié)果提示商品化軟件的峰對齊算法不同且存在不足,需進(jìn)一步改進(jìn),實際工作中需慎重選擇合適的軟件處理圖譜,或者可采用多種軟件進(jìn)行交互驗證。此外,在軟件自動處理數(shù)據(jù)的基礎(chǔ)上,手動去核對信息,以確保數(shù)據(jù)預(yù)處理的準(zhǔn)確度也是必不可少的環(huán)節(jié)。

3.1 歸一化

生物樣本中代謝產(chǎn)物種類繁多,且濃度差異很大(達(dá)幾個數(shù)量級),從生物學(xué)角度分析,濃度高的代謝物不一定比濃度低的代謝物具有更重要的生理作用;相反,某些低濃度的物質(zhì)可能在指示藥物作用或疾病過程中起著不容忽視的作用。因此,為了保證檢測到的所有代謝物能被公平地分析,需要對數(shù)據(jù)進(jìn)行歸一化。

在尿樣的分析中,相同采集間隔,受飲水量及其他生理因素影響,尿液的體積存在較大的差異,其所含代謝物濃度也會存在較大的差異。因此,需要對數(shù)據(jù)進(jìn)行歸一化處理以消除尿液體積造成的變異。目前尿樣代謝組學(xué)研究主要有4種歸一化方法:體積法、肌苷法、滲透濃度法、總面積法。Warrack等[24]采用高低劑量給藥建立大鼠磷脂質(zhì)病模型(雌雄各半),對收集的尿液進(jìn)行LC-MS分析,比較了不歸一化和分別采用4種歸一化方法構(gòu)建PCA模型的聚類情況,滲透濃度法、總面積法能夠?qū)?組樣品分開,其他3種方法則不能有效區(qū)別4組樣品。

若代謝組學(xué)研究對象是細(xì)胞,那么歸一化以減少細(xì)胞數(shù)目差異所造成的變異也是必要的,Silva等[25]比較了細(xì)胞提取物代謝組學(xué)研究中3種歸一化方法:細(xì)胞計數(shù)法、蛋白含量法及DNA法,DNA法歸一化由于不需要單獨的平行樣品,且在不同細(xì)胞系和時間序列分析的準(zhǔn)確性、重現(xiàn)性都較好,作者推薦使用DNA法對細(xì)胞代謝組學(xué)數(shù)據(jù)進(jìn)行歸一化處理,但如果實驗中使用了破壞細(xì)胞生長周期的DNA破壞劑,此時筆者更推薦使用細(xì)胞計數(shù)法進(jìn)行校正。

3.2 標(biāo)尺化

與歸一化是針對同一樣本不同變量的預(yù)處理方式不同,標(biāo)尺化是針對不同樣本同一變量的處理。生物體在內(nèi)、外因素(如遺傳變異、疾病侵襲、藥物干預(yù)、環(huán)境變化)作用下,代謝物濃度會發(fā)生倍數(shù)級變化,在統(tǒng)計分析前需將所有變量的響應(yīng)強度大小統(tǒng)一在同一個標(biāo)尺上,避免變量自身響應(yīng)強度差異對模型的影響,這個過程即是數(shù)據(jù)標(biāo)尺化的過程。常用的標(biāo)尺化方法有:均值中心法(meancentering)、自標(biāo)尺化(autoscaling)、Pareto scaling、邏輯轉(zhuǎn)換法(log transformation)、Power transformation等[26]。均值中心法是將每個變量減去該變量的平均值,對變量的大小沒做任何變化,即數(shù)值大的變量仍然占有較大的權(quán)重;自標(biāo)尺化以標(biāo)準(zhǔn)差為標(biāo)尺化因子,自標(biāo)尺化后每個變量的標(biāo)準(zhǔn)差為1,具有相同權(quán)重,但是這個方法會放大由于儀器或者其他因素導(dǎo)致的系統(tǒng)偏差;Pareto scaling和自標(biāo)尺化很相似,以標(biāo)準(zhǔn)差的平方根為標(biāo)尺化因子,在一定程度上消除了變量響應(yīng)的影響又不至于放大系統(tǒng)偏差,但是這種方法對變化大的變量很敏感;邏輯轉(zhuǎn)換法不同于上述方法,是對變量的一種非線性轉(zhuǎn)化,可以減少變量的方差差異性,但是無法處理0值變量。對于同一組數(shù)據(jù),Masson等[27]采用均值中心法和Pareto scaling處理后,高豐度變量變異較大,PCA的分類情況過度取決于高豐度的變量,而忽視低豐度變量的分類作用,采用邏輯轉(zhuǎn)換法進(jìn)行標(biāo)尺化之后,數(shù)據(jù)的變異呈均勻分布,高低豐度變量對模型分類貢獻(xiàn)在同一標(biāo)尺上。每一種標(biāo)尺化方法都有其優(yōu)缺點,對于一組數(shù)據(jù),選用合適的標(biāo)尺化方式能在一定程度上確保數(shù)據(jù)分析結(jié)果的合理性。

4 方法學(xué)驗證相關(guān)細(xì)節(jié)因素與技術(shù)瓶頸

方法學(xué)驗證是整個實驗數(shù)據(jù)可靠的基本保證,是基于無歧視分析的非目標(biāo)性代謝組學(xué)和基于目標(biāo)代謝物定量的目標(biāo)性代謝組學(xué)研究的基礎(chǔ)。

目標(biāo)性代謝組學(xué)研究是針對某類生物標(biāo)志物或者某條完整的代謝通路進(jìn)行精細(xì)化、定量化的研究。這類代謝組學(xué)研究大多參考FDA生物樣品分析的方法學(xué)驗證指導(dǎo)原則[2,28],一般從特異性、標(biāo)準(zhǔn)曲線和定量范圍、定量下限、精密度和準(zhǔn)確度、穩(wěn)定性等幾方面考察,這部分方法學(xué)驗證的方法和評價標(biāo)準(zhǔn)都比較成熟明確。

非目標(biāo)性代謝組學(xué)旨在無歧視分析所有內(nèi)源性代謝物,目前主要有GC-MS、LC-MS、NMR這3種分析平臺。NMR是相對穩(wěn)定和可重現(xiàn)的分析方法[22],對于基于LC-MS和GC-MS代謝組學(xué)方法學(xué)驗證,眾多研究者都進(jìn)行了積極的探索,目前主要采用基于質(zhì)控(quality control,QC)樣品的方法學(xué)驗證[20,29-33]。目前主要有3種類型的QC樣品:樣品中各類成分代表性物質(zhì)的混合標(biāo)準(zhǔn)品QC樣品,等量待分析樣品均勻混合的pooled QC樣品及商品化替代QC樣品[4,17]。對于混合標(biāo)準(zhǔn)品QC樣品,一方面由于非目標(biāo)代謝組學(xué)所研究的樣品成分往往是未知的,要獲得各類成分標(biāo)準(zhǔn)品在實際工作中比較困難,另一方面同一類成分選取一兩個成分標(biāo)準(zhǔn)品,并不具有完整的代表性,所以筆者不推薦采用混合標(biāo)準(zhǔn)品QC樣品進(jìn)行方法學(xué)驗證?;趐ooled QC樣品的代謝組學(xué)方法學(xué)驗證在目前代謝組學(xué)研究中應(yīng)用最為廣泛。Pooled QC樣品通過取相同量的待分析樣品(如血漿、尿液等)均勻混合得到,被認(rèn)為可以反映在分析檢測過程中可能遇到的所有成分,代表待分析樣品的平均情況。但是對于大規(guī)模代謝組學(xué)研究,如HUSERMET project,經(jīng)年累月,為確保樣品穩(wěn)定,部分樣品分析和數(shù)據(jù)獲取是在完成所有樣品采集之前進(jìn)行的,pooled QC樣品是無法制備獲取的,此時就采用商品化替代QC樣品。商品化替代QC樣品并不是實際分析樣品,常常會損失一些代謝物信息。

儀器從開機到平衡穩(wěn)定需要一段時間,Spagou等[20]通過PCA模型中的第一主成分時間序列相關(guān)性圖譜(time series dependency of the first component)說明前幾針樣品的保留時間和質(zhì)譜響應(yīng)變異較大,所以一般會在正式開始實驗前進(jìn)5~10針的調(diào)節(jié)QC(conditioning QC)樣品使儀器狀態(tài)達(dá)到穩(wěn)定,以消除保留時間和質(zhì)譜響應(yīng)變異。

在大批量未知樣品分析時,QC樣品被均勻地插入樣品分析過程中,以驗證進(jìn)樣期間分析系統(tǒng)的穩(wěn)定性。常用非監(jiān)督的主成分分析(PCA)的得分圖(score plot)和第一主成分時間序列相關(guān)性圖譜展示分析方法的穩(wěn)定性[20,33]。一個穩(wěn)定的分析方法,QC樣品在PCA得分圖上聚集度較好,然而QC樣品在PCA得分圖上聚集并不一定能說明分析方法穩(wěn)定。因為PCA模型包含未知樣品和QC樣品,若待分析樣品的差異性很大,儀器系統(tǒng)不穩(wěn)定、色譜柱老化等原因造成的微小變異性會被待分析物巨大的差異掩蓋,在PCA得分圖上并不會展現(xiàn)出來。PCA模型中的第一主成分時間序列相關(guān)性圖譜從另一個角度說明分析過程中分析方法的變異,進(jìn)一步確認(rèn)方法的穩(wěn)定性。方法穩(wěn)定可靠的前提下對樣品分析,可以反映遺傳變異、疾病侵襲、藥物干預(yù)、環(huán)境變化等因素所導(dǎo)致的代謝差異,從而找出相應(yīng)的生物標(biāo)記物和代謝通路。

此外,代謝組學(xué)研究中,特別是大規(guī)模大批量代謝組學(xué)研究,例如流行病研究,生物樣品采集后常常不能實時分析,樣品需要先保存起來。另外由于偶發(fā)性的儀器故障等原因,樣品可能需要再次分析。樣品分批后放入進(jìn)樣器中按進(jìn)樣序列分析需等待一段時間。實際工作中應(yīng)根據(jù)具體情況,驗證保存和分析過程中樣品的穩(wěn)定性,選擇性地對生物樣品在進(jìn)樣器、冰凍、凍融條件下以及不同存放時間進(jìn)行穩(wěn)定性考察,以確定樣品的存放條件和時間。

5 展望

目前,代謝組學(xué)研究已逐步成熟,并逐漸實現(xiàn)了從粗放型向精細(xì)化的轉(zhuǎn)變。關(guān)注和研究生物樣品采集與制備、數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理與統(tǒng)計分析以及方法學(xué)驗證每個操作步驟中所包含的“瓶頸問題”,建立通用、可靠、嚴(yán)謹(jǐn)?shù)难芯恳?guī)范,保證代謝組學(xué)研究結(jié)果的可靠性和可重現(xiàn)性是當(dāng)前的首要任務(wù)。

此外,代謝組學(xué)作為系統(tǒng)生物學(xué)的重要組成部分,其未來主要發(fā)展的趨勢還包括:從非目標(biāo)性代謝組學(xué)到目標(biāo)代謝組學(xué),從宏觀到微觀研究;將細(xì)胞、動物研究所獲得研究結(jié)論有效可靠地轉(zhuǎn)化到人體樣本研究;發(fā)展更為廣譜的、原位、即時、通用的檢測方法,同時完成高豐度代謝物和低豐度代謝物的檢測;代謝組學(xué)數(shù)據(jù)與其他組學(xué)(如基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)等)多組學(xué)數(shù)據(jù)的融合、關(guān)聯(lián)分析等。

[1]Zhou W J, Song J Z, Fu W W, et al. Chemical comparison of two dosage forms of Hemp Seed Pills by UHPLC-QTOF-MS/MS and multivariate statistical techniques [J]. J Pharm Biomed Anal, 2013, 84: 59-68.

[2]Struck W, Siluk D, Yumba-Mpanga A, et al. Liquid chromatography tandem mass spectrometry study of urinary nucleosides as potential cancer markers [J]. J Chromatogr A, 2013, 1283: 122-131.

[3]Loftus N J, Lai L, Wilkinson R W, et al. Global metabolite profiling of human colorectal cancer xenografts in mice using HPLC-MS/MS [J]. J Proteome Res, 2013, 12 (6): 2980-2986.

[4]Jiang M, Chen T, Feng H, et al. Serum metabolic signatures of four types of human arthritis [J]. J Proteome Res, 2013, 12 (8): 3769-3779.

[5]Geng L L, Ma C, Zhang L, et al. Metabonomic study of Genkwa Flosinduced hepatotoxicity and effect of herb-processing procedure on toxicity [J]. Phytother Res, 2013, 27(4): 521-529.

[6]Zhu H B, Wang C Y, Qi Y, et al. Fingerprint analysis of Radix Aconiti using ultra-performance liquid chromatography-electrospray ionization/tandem mass spectrometry (UPLC-ESI/MSn) combined with stoichiometry [J]. Talant, 2013, 103: 56-65.

[7]Wolfender J L, Rudaz S, Choi Y H, et al. Plant metabolomics: from holistic data to relevant biomarkers [J]. Curr Med Chem, 2013, 20 (8): 1056-1090.

[8]Sun H, Wang M, Zhang A H, et al. UPLC-Q-TOF-HDMS analysis of constituents in the root of two kinds of Aconitum using a metabolomics approach [J]. Phytochem Anal, 2013, 24 (3): 263-276.

[9]Denery J R, Nunes A A, Dickerson T J. Characterization of differences between blood sample matrices in untargeted metabolomics [J]. Anal Chem, 2010, 83 (3): 1040-1047.

[10]Barri T, Dragsted L O. UPLC-ESI-QTOF/MS and multivariate data analysis for blood plasma and serum metabolomics: effect of experimental artefacts and anticoagulant [J]. Anal Chim Acta, 2013,768: 118-128.

[11]Bando K, Kawahara R, Kunimatsu T, et al. Influences of biofluid sample collection and handling procedures on GC-MS based metabolomic studies [J]. J Biosci Bioeng, 2010, 110 (4): 491-499.

[12]Yin P Y, Peter A, Franken H, et al. Preanalytical aspects and sample quality assessment in metabolomics studies of human blood [J]. Clin Chem, 2013, 59 (5): 833-845.

[13]Want E J, Wilson I D, Gika H, et al. Global metabolic profiling procedures for urine using UPLC–MS [J]. Nat Protoc, 2010, 5 (6): 1005-1018.

[14]Phua L C, Koh P K, Cheah P Y, et al. Global gas chromatography/ time-of-flight mass spectrometry (GC/TOFMS)-based metabonomic profiling of lyophilized human feces [J]. J Chromatogr B, 2013, 937: 103-113.

[15]Liu Y M, Cheng Y, Chen T L, et al. GC/TOFMS analysis of endogenous metabolites in mouse fibroblast cells and its application in TiO2nanoparticle-induced cytotoxicity study [J]. Chromatographia, 2012, 75 (21/22): 1301-1310.

[16]Wei C M, Li Y, Yao H, et al. A metabonomics study of epilepsy in patients using gas chromatography coupled with mass spectrometry [J]. Mol Biosyst, 2012, 8 (8): 2197-2204.

[17]Dunn W B, Broadhurst D, Begley P, et al. Procedures for large-scale metabolic profiling of serum and plasma using gas chromatography and liquid chromatography coupled to mass spectrometry [J]. Nat Protoc, 2011, 6 (7): 1060-1083.

[18]Xu F G, Zou L, Ong C N. Experiment-originated variations, and multi-peak and multi-origination phenomena in derivatization-based GC-MS metabolomics [J]. Trends Analyt Chem, 2010, 29 (3): 269-280.

[19]Xu F G, Zou L, Ong C N. Multiorigination of chromatographic peaks in derivatized GC/MS metabolomics: a confounder that influences metabolic pathway interpretation [J]. J Proteome Res, 2009, 8 (12): 5657-5665.

[20]Spagou K, Wilson I D, Masson P, et al. HILIC-UPLC-MS for exploratory urinary metabolic profiling in toxicological studies [J]. Anal Chem, 2010, 83 (1): 382-390.

[21]Lindon J C, Keun H C, Ebbels T M, et al. The consortium for metabonomic toxicology (COMET): aims, activities and achievements [J]. Pharmacogenomics, 2005, 6 (7): 691-699.

[22]Emwas A H M, Salek R M, Griffin J L, et al. NMR-based metabolomics in human disease diagnosis: applications, limitations, and recommendations [J]. Metabolomics, 2013, 9 (5): 1048-1072.

[23]Koh Y, Pasikanti K K, Yap C W, et al. Comparative evaluation of software for retention time alignment of gas chromatography/time-offlight mass spectrometry-based metabonomic data [J]. J Chromatogr A, 2010, 1217 (52): 8308-8316.

[24]Warrack B M, Hnatyshyn S, Ott K H, et al. Normalization strategies for metabonomic analysis of urine samples [J]. J Chromatogr B, 2009, 877 (5/6): 547-552.

[25]Silva L P, Lorenzi P L, Purwaha P, et al. Measurement of DNA concentration as a normalization strategy for metabolomic data from adherent cell lines [J]. Anal Chem, 2013, 85 (20): 9536-9542.

[26]van den Berg R A, Hoefsloot H C, Westerhuis J A, et al. Centering, scaling, and transformations: improving the biological information content of metabolomics data [J]. BMC genomics, 2006, 7: 142.

[27]Masson P, Spagou K, Nicholson J K, et al. Technical and biological variation in UPLC-MS-based untargeted metabolic profiling of liver extracts: application in an experimental toxicity study on galactosamine [J]. Anal Chem, 2011, 83 (3): 1116-1123.

[28]Huang Y, Tian Y, Li G, et al. Discovery of safety biomarkers for realgar in rat urine using UFLC-IT-TOF/MS and1H NMR based metabolomics [J]. Anal Bioanal Chem, 2013, 405 (14): 4811-4822.

[29]Gika H G, Macpherson E, Theodoridis G A, et al. Evaluation of theflight mass spectrometry [J]. J Pharm Biomed Anal, 2010, 52 (1): 129-135.

[32]Tan Y X, Yin P Y, Tang L, et al. Metabolomics study of stepwise hepatocarcinogenesis from the model rats to patients: potential biomarkers effective for small hepatocellular carcinoma diagnosis [J]. Mol Cell Proteomics, 2012, 11 (2): 1070-1083.

[33]Zelena E, Dunn W B, Broadhurst D, et al. Development of a robust and repeatable UPLC-MS method for the long-term metabolomic study of human serum [J]. Anal Chem, 2009, 81 (4): 1357-1364. repeatability of ultra-performance liquid chromatography–TOF-MS for global metabolic profiling of human urine samples [J]. J Chromatogr B, 2008, 871 (2): 299-305.

[30]Chen Y H, Xu J, Zhang R P, et al. Assessment of data pre-processing methods for LC-MS/MS-based metabolomics of uterine cervix cancer [J]. Analyst, 2013, 138 (9): 2669-2677.

[31]Lv Y H, Liu X R, Yan S K, et al. Metabolomic study of myocardial ischemia and intervention effects of compound Danshen Tablets in rats using ultra-performance liquid chromatography/quadrupole time-of-

[專家介紹] 許風(fēng)國:1980年1月生,博士,教授,江蘇特聘教授,博士生導(dǎo)師。分別于2002年、2005年和2008年獲得中國藥科大學(xué)藥物分析學(xué)專業(yè)學(xué)士、碩士和博士學(xué)位;2008年8月—2012年3月先后在新加坡國立大學(xué)醫(yī)學(xué)院和公共衛(wèi)生學(xué)院從事博士后研究工作;2012年3月全職回國,現(xiàn)任中國藥科大學(xué)藥學(xué)院教授、藥物質(zhì)量與安全預(yù)警教育部重點實驗室“藥物代謝組學(xué)”研究方向?qū)W術(shù)帶頭人。

許風(fēng)國教授現(xiàn)已入選江蘇特聘教授計劃和教育部新世紀(jì)優(yōu)秀人才支持計劃;為江蘇省“創(chuàng)新團隊計劃”領(lǐng)軍人才。主持國家自然科學(xué)基金項目(No.81302733)、教育部科學(xué)技術(shù)研究(科學(xué)技術(shù)類)項目(No.113036A)等國家及省部級科研項目4項;擔(dān)任Bioanalysis雜志(SCI影響因子3.223),Chinese Medical Journal(SCI影響因子0.864),Asian Journal of Chemistry(SCI影響因子0.266)等多家SCI收錄學(xué)術(shù)期刊的編委。已發(fā)表相關(guān)學(xué)術(shù)論文50余篇,其中SCI收錄論文39篇,累計影響因子>100。

許風(fēng)國教授課題組從事藥物代謝組學(xué)與分析毒理學(xué)方面的研究,近年來依托色譜、光譜及其聯(lián)用技術(shù),圍繞代謝性疾病、藥源性疾病,積極開展創(chuàng)新性藥物分析技術(shù)方法與生物學(xué)、醫(yī)學(xué)、化學(xué)、藥理毒理學(xué)的交叉研究,逐步形成穩(wěn)定的“藥物代謝組學(xué)”研究方向,主要研究領(lǐng)域包括:1)疾病及藥物干預(yù)的網(wǎng)絡(luò)靶標(biāo)發(fā)現(xiàn)與驗證;2)藥源性疾病發(fā)生機制與預(yù)測;3)中西藥聯(lián)用減毒增效的作用機制。

Discussion on Bottleneck Problems in Data Acquisition and Pre-Processing of Metabolomics

WANG Min1,2, HUANG Yin1,2, ZHANG Wei3, ZHANG Zunjian1,2, XU Fengguo1,2
(1. Key Laboratory of Drug Quality Control and Pharmacovigilance Affiliated to Ministry of Education, China Pharmaceutical University, Nanjing 210009, China; 2. State Key Laboratory of Natural Medicines, China Pharmaceutical University, Nanjing 210009, China; 3. State Key Laboratory for Quality Research in Traditional Chinese Medicines, Macau University of Science and Technology, Macau 519020, China)

Metabolomics has been matured and penetrated into all aspects of life sciences and medical research after 15 years’ development. With the deepening of understanding, factors influencing metabolomics research were also gradually revealed. In this paper, the main technical bottleneck problems of metabolomics in sample collection & preparation, data acquisition, data pre-processing and method validation have been systematically summarized and discussed, aiming to promote the refinement and standardization development of metabolomics study.

metabolomics;data acquisition; data pretreatment; method validation

Q591

A

1001-5094(2014)02-0081-08

*接受日期:2013-12-07

項目資助:國家自然科學(xué)基金項目(No.81274108, No.81302733); 教育部科學(xué)技術(shù)研究項目(No.113036A);教育部新世紀(jì)優(yōu)秀人才支持計劃(No. NCET-13-1036);江蘇省創(chuàng)新團隊計劃

*通訊作者:張尊建,教授; 研究方向:藥物現(xiàn)代儀器分析; Tel:025-83271454; E-mail:zzj@cpu.edu.cn

**通訊作者:許風(fēng)國,教授,江蘇特聘教授;研究方向:藥物代謝組學(xué)與分析毒理學(xué);Tel:025-83271021; E-mail:fengguoxu@gmail.com

猜你喜歡
代謝物組學(xué)樣本
阿爾茨海默病血清代謝物的核磁共振氫譜技術(shù)分析
影像組學(xué)在腎上腺腫瘤中的研究進(jìn)展
用樣本估計總體復(fù)習(xí)點撥
表面活性劑輔助微萃取-高效液相色譜法測定尿中一氯苯的2種代謝物
噻蟲嗪及其代謝物噻蟲胺在冬棗中的殘留動態(tài)研究
推動醫(yī)改的“直銷樣本”
基于UHPLC-Q-TOF/MS的歸身和歸尾補血機制的代謝組學(xué)初步研究
隨機微分方程的樣本Lyapunov二次型估計
村企共贏的樣本
代謝組學(xué)在多囊卵巢綜合征中的應(yīng)用
高安市| 兰州市| 东乌| 丹东市| 博野县| 扎囊县| 蒙阴县| 金塔县| 肇州县| 潮安县| 吉木乃县| 利川市| 肇庆市| 高台县| 云霄县| 丹棱县| 潞西市| 视频| 怀安县| 开鲁县| 沙河市| 宜良县| 丽江市| 福州市| 呼和浩特市| 醴陵市| 乌拉特中旗| 阿合奇县| 万全县| 肥西县| 石柱| 宜章县| 盘锦市| 尉氏县| 米林县| 永清县| 武乡县| 扎兰屯市| 德安县| 上蔡县| 齐河县|