李憶濤,桑 潮,梁丹丹,陳天璐
慢性炎癥及關(guān)節(jié)功能的喪失是關(guān)節(jié)炎的最主要特點(diǎn)。目前關(guān)節(jié)炎種類超過(guò)了100種,對(duì)社會(huì)及家庭造成了巨大的負(fù)擔(dān)。類風(fēng)濕性關(guān)節(jié)炎(rheumatoid arthritis,RA)是一種常見(jiàn)的自身免疫性疾病,其特點(diǎn)是關(guān)節(jié)組織慢性炎癥[1]。痛風(fēng)性關(guān)節(jié)炎(gout arthritis,GA)則是當(dāng)血液中尿酸水平升高,尿酸會(huì)以結(jié)晶的形式沉積于關(guān)節(jié)處,造成一系列的炎癥反應(yīng)。兩種關(guān)節(jié)炎在病因、臨床表現(xiàn)、實(shí)驗(yàn)室指標(biāo)及治療方案等均有著明顯差異。但是部分RA患者發(fā)病于手指和足趾等小關(guān)節(jié),常表現(xiàn)為關(guān)節(jié)紅腫、疼痛、活動(dòng)障礙等癥狀,嚴(yán)重者可導(dǎo)致患者關(guān)節(jié)畸形,因此臨床上常與GA混淆導(dǎo)致誤診。不同類型的關(guān)節(jié)炎發(fā)病年齡及好發(fā)性別也有著顯著的差異。其中RA好發(fā)于中老年女性,而GA常見(jiàn)于中老年男性[2]。目前基于兩類關(guān)節(jié)炎患者性別和年齡差異的代謝異同的相關(guān)研究成果相對(duì)較少。
多年前,本研究組采用傳統(tǒng)的代謝組學(xué)方法對(duì)RA、GA、強(qiáng)直性脊柱炎和骨關(guān)節(jié)炎的代謝異同進(jìn)行了初步的統(tǒng)計(jì)和分析[3]。由于研究設(shè)計(jì)的不同以及樣本間年齡和性別的差異,尚未針對(duì)RA和GA進(jìn)行深入的研究。本研究利用超高效液相色譜-四級(jí)桿飛行時(shí)間質(zhì)譜聯(lián)用儀(ultra-high performance liquid chromatography quadrupole time of flight mass spectrometry,UPLC-QTOF MS)和氣相色譜-飛行時(shí)間質(zhì)譜聯(lián)用儀(gas chromatography time of flight mass spectrometry,GC-TOF MS)兩種代謝組學(xué)平臺(tái),對(duì)兩種關(guān)節(jié)炎患者血清進(jìn)行全譜分析,通過(guò)與正常人對(duì)照,采用本研究組開(kāi)發(fā)的代謝組學(xué)混雜變量影響消除策略(metabolic confounding effect elimination,MCEE)[4]消除年齡及性別所帶來(lái)的偏倚,觀察RA和GA對(duì)體內(nèi)內(nèi)源性代謝物的影響,尋找出兩種關(guān)節(jié)炎共有和特有的生物標(biāo)志物;并采用貝葉斯網(wǎng)絡(luò)揭示不同代謝物之間存在的潛在的關(guān)系。
1.1 研究對(duì)象 收集北京中日友好醫(yī)院和安徽中醫(yī)藥大學(xué)附屬第一醫(yī)院收治的RA和GA患者。其中RA組,女性27例,年齡(53±8)歲;GA組,男性34例,年齡(51±12)歲;正常對(duì)照組,男性30例,女性30例,年齡(36±12)歲。RA患者符合1987年美國(guó)風(fēng)濕病協(xié)會(huì)(American College of Rheumatology,ACR)修訂的RA診斷標(biāo)準(zhǔn)[5];GA患者符合1977年ACR的GA診斷標(biāo)準(zhǔn)。所有受試者在早餐1 h后靜脈采血3 mL,立即離心(3 500 r/min,4 ℃,10 min),離心后取上清液保存于-80 ℃冰箱,具體樣本收取和處理方法見(jiàn)本課題組先前研究[3]。
1.2 試劑與儀器 儀器為UPLC-QTOF MS(Waters公司,美國(guó))和GC-TOF MS(Agilent公司,美國(guó));Milli-Q超純水儀(Millipore,Bedford MA,美國(guó))。試劑采用色譜純的甲醇和乙醇(Fisher Scientific Worldwide公司,美國(guó));分析純的吡啶、甲酸、甲氧基胺鹽酸鹽、L-2-氯苯丙氨酸、十七烷酸和N,O-雙-三甲基硅烷基-三氟乙酰胺(Sigma-Aldrich公司,美國(guó))。
1.3 樣本分析
1.3.1 GC-TOF MS樣本分析 100 μL血漿樣本加入1 mg/mL的十七烷酸10 μL和0.1 mg/mL的L-2-氯苯丙氨酸水溶液10 μL,隨后加入氯仿:甲醛(1∶3)的混合液300 μL,震蕩30 s后放入-20 ℃的冰箱靜置10 min,接著離心(12 000 r/min,4 ℃,10 min)取上清液300 μL真空干燥處理。GC-TOF MS為不分流進(jìn)樣模式,進(jìn)樣量為1 μL,色譜柱采用DB-5MS(30 mm×0.25 mm×0.25 μm);載氣為流速1.0 mL/mim的氦氣。色譜柱溫度設(shè)置為80 ℃持續(xù)2 min,隨后會(huì)緩慢逐步加熱到295 ℃,保持該溫度8 min。進(jìn)樣口、離子源和接口的溫度分別為:270 ℃、220 ℃和270 ℃,采用EI模式電離,70 eV電子能量,掃描范圍是50~500 m/z,采集的速率是20光譜/s。
1.3.2 UPLC-QTOF MS的樣本分析 100 μL的血漿樣本加入0.03 mg/mL的L-2-氯苯丙氨酸20 μL和水∶甲醇∶乙腈(1∶2∶7)混合液500 μL,震蕩2 min后放入在-20 ℃的冰箱靜置10 min,離心(12 000 r/min,4 ℃,10 min)取上清液200 μL后真空干燥。色譜柱采用ACQUITYBEH C18柱(2.1 mm×100 mm×1.7μm)。流動(dòng)相為A和B兩相,正離子和負(fù)離子的A相分別為0.1%甲酸水溶液和純水,B相分別為乙腈:甲醇(95∶5,含0.1%甲酸)和乙腈:甲醇(95∶5)。采用梯度洗脫。流動(dòng)相的速度為0.4 mL/min,柱子溫度40 ℃,進(jìn)樣的體積為5 μL。質(zhì)譜儀采用的是電噴霧離子源,正負(fù)離子模式。正負(fù)離子模式設(shè)置及具體實(shí)驗(yàn)步驟詳見(jiàn)先前研究[3]。
1.4 統(tǒng)計(jì)分析與方法
1.4.1 數(shù)據(jù)預(yù)處理 所獲得的數(shù)據(jù)通過(guò)ChromaTOF軟件(V3.30,Leco Co.,加拿大)和MarkerLynx App-lications Manager軟件(V4.1,Waters,Manchester,英國(guó))進(jìn)行處理、分析和整合。采用公共數(shù)據(jù)庫(kù)和自建的標(biāo)準(zhǔn)品庫(kù)進(jìn)行物質(zhì)鑒定和確認(rèn)。采用自主研發(fā)的軟件MCEE[4]進(jìn)行基本的預(yù)處理并消除年齡、性別等混雜因素對(duì)代謝譜的影響。
1.4.2 差異代謝物的尋找 采用SIMCA-P 12.0軟件(Umetrics,Umea,瑞典)和SPSS軟件(V19,IBM,New York,美國(guó))進(jìn)行單維和多維的統(tǒng)計(jì)學(xué)分析。差異代謝物的篩選聯(lián)合采用Mann-WitneyU檢驗(yàn)的P值(P<0.05)和正交偏最小二乘法判別分析(orthogonal partial least squares discriminant analysis,OPLS-DA)模型的變量權(quán)重值(variable importance projection,VIP)≥1兩個(gè)指標(biāo)。
1.4.3 貝葉斯網(wǎng)絡(luò) 貝葉斯網(wǎng)絡(luò)是基于概率的不確定的一種推理方法,運(yùn)用條件概率和有向無(wú)環(huán)圖(directed acyclic graph,DAG),描述了變量之間潛在的獨(dú)立和依賴關(guān)系。當(dāng)條件信息不完整、確實(shí)、數(shù)量有限的情況下,貝葉斯網(wǎng)絡(luò)能合理的進(jìn)行學(xué)習(xí)和推理,運(yùn)用條件概率描述節(jié)點(diǎn)及其與父節(jié)點(diǎn)之間的關(guān)系,因此更加科學(xué)的解釋了網(wǎng)絡(luò)節(jié)點(diǎn)變量之間所存在的因果關(guān)系和條件相關(guān)關(guān)系。貝葉斯網(wǎng)絡(luò)利用網(wǎng)絡(luò)圖形結(jié)構(gòu)和網(wǎng)絡(luò)條件參數(shù)確定了隨機(jī)變量x={x1,x2,…,xn}的一個(gè)聯(lián)合概率分布[6],即:
1.4.4 貪婪搜索算法 本研究采用的是貪婪搜索算法[7],貪婪搜索算法的特點(diǎn)是每次搜索僅變動(dòng)一個(gè)向量即貝葉斯網(wǎng)絡(luò)中的箭頭,其具體的過(guò)程如下:①構(gòu)建初始的DAG,并以其中節(jié)點(diǎn)D0作為貪婪搜索的出發(fā)點(diǎn);②計(jì)算結(jié)構(gòu)D0與所有與該結(jié)構(gòu)相差一個(gè)向量的貝葉斯評(píng)分;③在所有潛在結(jié)構(gòu)中,選擇一個(gè)貝葉斯評(píng)分增加量最大的結(jié)構(gòu);④如果貝葉斯評(píng)分不再增加即停止搜索,否則讓③中所選擇的結(jié)構(gòu)重復(fù)步驟②。
典型關(guān)節(jié)炎的貝葉斯網(wǎng)絡(luò)構(gòu)建采用的是基于R軟件的DEAL程序包,該程序包的最大優(yōu)勢(shì)在于可以同時(shí)處理連續(xù)性變量和分類變量,因此可以應(yīng)用于代謝組學(xué)數(shù)據(jù)。運(yùn)用DEAL程序包選擇貪婪搜索算法構(gòu)建出差異代謝物和疾病的貝葉斯網(wǎng)絡(luò)圖。
2.1 代謝組學(xué)輪廓分析 運(yùn)用GC-TOF MS和UPLC-QTOF MS平臺(tái),對(duì)27例RA患者、34例GA患者和60例正常對(duì)照組的血漿樣本進(jìn)行全譜分析,氣相平臺(tái)共獲得308個(gè)特征譜,液相平臺(tái)ES+和ES-分別獲得1 371和6 169個(gè)特征譜,將其分子量和其質(zhì)譜信息分別與標(biāo)準(zhǔn)品庫(kù)進(jìn)行比對(duì),鑒定出175個(gè)代謝物。采用有監(jiān)督的OPLS-DA來(lái)表征3組間的差異,建模后可觀察到明顯的分離趨勢(shì)(圖1)。
圖1 基于OPLS-DA構(gòu)建的典型關(guān)節(jié)炎與對(duì)照組模型的血漿代謝物輪廓散點(diǎn)圖
2.2 差異代謝物的篩選 采用Mann-WitneyU檢驗(yàn)的P<0.05和OPLS-DA模型的VIP值≥1,篩選兩疾病組與對(duì)照組的差異代謝物,其中RA組34個(gè),GA組41個(gè),兩組共有的差異代謝物14個(gè),代謝物主要涉及氨基酸代謝、糖代謝、脂類代謝等多種代謝途徑,具體的代謝物及其變化倍數(shù)(fold change,F(xiàn)C)見(jiàn)表1。
注:#FC=疾病組代謝物平均值/正常組代謝物平均值,*兩個(gè)代謝物雖然為同一種,但兩組FC值不同
2.3 代謝物貝葉斯網(wǎng)絡(luò)圖的構(gòu)建 由DEAL程序包所構(gòu)建的貝葉斯網(wǎng)絡(luò)如圖2,RA組由35個(gè)節(jié)點(diǎn)和若干條向量構(gòu)建的貝葉斯網(wǎng)絡(luò)圖,RA與代謝物色氨酸、順烏頭酸、谷氨酸、甘油醛、蘇氨酸、肌苷等代謝物存在直接相關(guān)關(guān)系。GA組由42個(gè)節(jié)點(diǎn)和若干個(gè)向量組成貝葉斯網(wǎng)絡(luò)圖,GA與天冬氨酸、肌酸、磷酸果糖、甘油醛、組胺、尿酸等代謝物存在直接相關(guān)關(guān)系。RA和GA共有的差異代謝物14個(gè),組成一個(gè)包含15個(gè)節(jié)點(diǎn)的貝葉斯網(wǎng)絡(luò)圖,說(shuō)明兩種典型的關(guān)節(jié)炎發(fā)病可能與天冬氨酸、甘油醛、二羥基富馬酸存在直接關(guān)系,同時(shí)揭示了一些潛在的代謝物之間的相互影響。比如,乳酸可以影響天冬氨酸的代謝,而天冬氨酸可以影響高絲氨酸的代謝;二羥基富馬酸可以影響乳酸的代謝,甘油醛可影響高絲氨酸的代謝,這些潛在的代謝物之間的影響也可能與關(guān)節(jié)炎的發(fā)病密切相關(guān)。
圖2 RA和GA差異代謝物的貝葉斯網(wǎng)絡(luò)圖
在前期研究中,由于年齡和性別的組間差異,未能比較RA和GA的代謝差異。本研究采用研究組近期開(kāi)發(fā)的MCEE算法[4],消除了性別和年齡帶來(lái)的偏倚。通過(guò)差異和網(wǎng)絡(luò)研究可揭示差異代謝物和關(guān)節(jié)炎之間以及不同關(guān)節(jié)炎狀態(tài)下差異代謝物之間潛在的因果關(guān)系,為不同類型關(guān)節(jié)炎發(fā)病機(jī)制和治療靶點(diǎn)的研究提供生物信息學(xué)支持。
免疫紊亂是RA發(fā)病的主要原因,活化的T細(xì)胞及抗原提呈細(xì)胞浸潤(rùn)關(guān)節(jié)滑膜,同時(shí)抗原刺激巨噬細(xì)胞活化從而產(chǎn)生了大量炎癥因子如IL-1、IL-6、TNF-α等[8]。T細(xì)胞糖代謝如圖3,靜息的T細(xì)胞利用葡萄糖的有氧氧化供能,而活化的T細(xì)胞主要供能途徑為糖的無(wú)氧氧化途徑[9-10]。大量T細(xì)胞的活化,需要消耗大量的葡萄糖通過(guò)無(wú)氧呼吸進(jìn)行供能,因此糖酵解途徑活躍,產(chǎn)生大量中間代謝產(chǎn)物,甘油醛含量增加?;罨腡細(xì)胞進(jìn)行無(wú)氧呼吸的增強(qiáng)影響了其三羧酸循環(huán),從而使類風(fēng)濕患者血液中順烏頭酸含量下降。而三羧酸循環(huán)可以抑制糖酵解途徑,因此順烏頭酸可以影響甘油醛的代謝。色氨酸是維持細(xì)胞增值和活化的重要氨基酸,在人體重要的代謝途徑是分解為犬尿酸,該途徑的限速酶是吲哚酸2,3-雙加氧酶(indoleamine 2,3-dioxygenase,IDO),IDO主要表達(dá)于樹(shù)突細(xì)胞、巨噬細(xì)胞和上皮細(xì)胞等細(xì)胞[11]。因此RA促進(jìn)大量巨噬細(xì)胞和樹(shù)突細(xì)胞活化,引起色氨酸代謝增加,體內(nèi)色氨酸含量降低[12]。有研究表明,谷氨酸與RA的發(fā)病有關(guān),RA患者滑囊液中谷氨酸含量升高,主要是通過(guò)滑膜的成纖維細(xì)胞上的谷氨酸受體和轉(zhuǎn)運(yùn)體轉(zhuǎn)運(yùn),增加RA患者骨破壞[13]。
圖3 未活化及活化的T細(xì)胞代謝差異
GA是各種原因?qū)е碌泥堰蚀x障礙,血液中尿酸含量增多,尿酸沉積于關(guān)節(jié)、滑囊、軟骨等組織中,導(dǎo)致反復(fù)發(fā)作的關(guān)節(jié)炎。人體內(nèi)產(chǎn)生尿酸有兩條途徑,一條是通過(guò)外源性食物攝入代謝,占約總量20%;另一條是通過(guò)內(nèi)源性自身合成的嘌呤分解代謝,約占總量80%[14]。嘌呤在人體內(nèi)主要包含兩條合成途徑,從頭合成和補(bǔ)救合成。從頭合成途徑利用天冬氨酸、谷氨酰胺、甘氨酸等原料合成嘌呤,同時(shí)從頭合成的速率受到代謝物的負(fù)反饋調(diào)節(jié)。GA患者從頭合成途徑速率降低,因此血液中的天冬氨酸含量增加。同時(shí),GA也能刺激炎癥反應(yīng)的發(fā)生,有研究表明尿酸鹽受體通過(guò)刺激托爾樣受體-2(Toll-2)和托爾樣受體-4(Toll-4)而激活和活化T細(xì)胞等多種受體,激發(fā)炎癥反應(yīng)[15],導(dǎo)致糖代謝的異常,從而引起血液中磷酸果糖和甘油醛含量的改變,同時(shí)糖的無(wú)氧代謝增強(qiáng),產(chǎn)生大量乳酸。RA和GA均可引起體內(nèi)的炎癥反應(yīng),從而活化T細(xì)胞、巨噬細(xì)胞等細(xì)胞,引起無(wú)氧呼吸鏈上代謝物的含量異常。
傳統(tǒng)的代謝組學(xué)方法只能找出疾病與正常對(duì)照組之間的差異代謝物,而對(duì)于疾病與代謝物之間的因果關(guān)系以及代謝物與代謝物之間關(guān)系的研究一直是代謝組學(xué)數(shù)據(jù)分析領(lǐng)域的關(guān)鍵問(wèn)題。貝葉斯網(wǎng)絡(luò)是基于條件概率和有向無(wú)環(huán)圖來(lái)揭示節(jié)點(diǎn)間的潛在的因果關(guān)系。將貝葉斯網(wǎng)絡(luò)與傳統(tǒng)的代謝組學(xué)差異分析方法結(jié)合起來(lái),有利于獲得疾病和代謝物之間更多且更可靠的關(guān)聯(lián),為后續(xù)的分子實(shí)驗(yàn)提供更多信息和支持。
貝葉斯網(wǎng)絡(luò)是通過(guò)數(shù)學(xué)概率來(lái)推測(cè)代謝物之間的關(guān)系,因此得出來(lái)的網(wǎng)絡(luò)并不是每一條向量都有其生物學(xué)意義;其次,樣本量越高,貝葉斯網(wǎng)絡(luò)節(jié)點(diǎn)越少,所構(gòu)建出來(lái)的網(wǎng)絡(luò)可信度越大,而代謝組學(xué)數(shù)據(jù)集中樣本數(shù)量往往小于變量數(shù)量,網(wǎng)絡(luò)可信度的合理控制是研究的難點(diǎn)之一;最后,本研究的貝葉斯網(wǎng)絡(luò)模型采用的是貪婪搜索算法,還有許多構(gòu)建貝葉斯網(wǎng)絡(luò)的算法如啟發(fā)式搜索算法等,不同算法構(gòu)建的網(wǎng)絡(luò)也有一定的差距。