申楊磊,方龍偉,央 拉,多吉卓瑪,巴桑卓瑪
西藏大學高原健康科學研究中心,西藏拉薩 850000
高原紅細胞增多癥(HAPC)是高原地區(qū)常見的慢性高原病之一,其主要特征為紅細胞過度增生,表現(xiàn)為血紅蛋白濃度顯著增加,其病變多呈慢性過程,后期常伴有全身多系統(tǒng)、器官、組織不同程度損害[1]。
根據(jù)世界衛(wèi)生組織的分類,肺動脈高壓(PH)可分為動脈型PH、左心疾病所致PH、肺臟疾病和(或)低氧所致PH、慢性血栓和(或)栓塞性PH、多種未明機制所致PH 5類[2]。其中高原肺動脈高壓(HAPH)屬于第3類,是由于高原低氧環(huán)境,肺換氣代償性增加、血細胞比容升高、血管收縮引起的一種慢性高原病[3],與HAPC一樣,也是非常典型的危害高原人群健康的疾病,而且現(xiàn)有研究表明,HAPC與PH間存在共同的病理特征:(1)紅細胞與血紅蛋白增加;(2)肺泡壁明顯增厚,纖維增粗,彌散功能下降;(3)肺動脈壓力變化與紅細胞過度增生有關。HAPC的主要表現(xiàn)為紅細胞與血紅蛋白異常增加,對PH的文獻查閱結(jié)果同樣發(fā)現(xiàn)紅細胞與血紅蛋白增加,而紅細胞與血紅蛋白異常增加可對機體心、肺、腎等臟器功能造成損傷。此外,還有學者通過研究過度表達人類促紅細胞生成素(EPO)的轉(zhuǎn)基因小鼠,分析小鼠血液中紅細胞增生情況與肺動脈壓力的變化,發(fā)現(xiàn)PH的發(fā)生與紅細胞過度增生有直接關系[4-5]。有學者研究發(fā)現(xiàn),HAPC患者肺泡壁明顯增厚和纖維增粗,使肺泡間質(zhì)彌散功能下降,紅細胞的過度增加使肺動脈壓力明顯升高[6-8]。以上相關研究均表明HAPC與PH間具有相同的發(fā)病特征。但目前檢索到的HAPC與PH兩種疾病間的相關性研究較少,因此利用生物信息學工具對兩種疾病的相關數(shù)據(jù)進行檢索,篩選出共同的差異基因和信號通路,但因目前數(shù)據(jù)庫中關于HAPH相關基因的數(shù)據(jù)太少,本文就HAPC與PH的基因差異進行比較和分析,旨在為進一步探討HAPC與PH之間發(fā)病機制的異同及關聯(lián)提供理論依據(jù)。
1.1數(shù)據(jù)來源 使用GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)對以人類為研究樣本的HAPC與PH基因數(shù)據(jù)進行檢索,獲取GSE29977[9]、GSE53408[10]、GSE703[11]、GSE113439[12]4個數(shù)據(jù)集,對其研究選擇的樣本與研究方法進行篩選、排除后保留GSE29977與GSE53408數(shù)據(jù)集。GSE29977芯片屬于GPL570平臺[(HG-U133_Plus_2)Affymetrix Human Genome U133 Plus 2.0 Array]基因芯片,共包括10個樣本,其中5例HAPC患者、5例健康對照者;GSE53408芯片屬于GPL6244平臺[(HuGene-1_0-st)Affymetrix Human Gene 1.0ST Array transcript(gene)version]基因芯片,共包括23例樣本,其中12例PH患者與11例健康對照者。
1.2差異基因篩選 通過R語言對數(shù)據(jù)集進行均一化處理后,使用Limma包[13]對數(shù)據(jù)中的差異基因進行篩選,然后在篩選結(jié)果基礎上使用Bonferroni法對P值進行校正,GSE29977數(shù)據(jù)集校正后P值應<0.01;GSE53408數(shù)據(jù)集校正后P值應<0.004 54;差異基因的篩選標準應滿足校正后P值且滿足log2|FC|>1。得到兩個數(shù)據(jù)集中符合標準的差異基因,再繪制韋恩圖進行重疊篩選,得到兩個數(shù)據(jù)集中共同的差異基因。
1.3基因本體(GO)分析、京都基因與基因組百科全書(KEGG)分析、基因富集(GSEA)分析 DAVID數(shù)據(jù)庫(https://david.ncifcrf.gov/)是具有多種生物數(shù)據(jù)和分析工具的軟件,可對目的數(shù)據(jù)進行富集分析,并提供注釋信息。本研究通過DAVID數(shù)據(jù)庫對篩選得到的共同差異基因進行GO分析、KEGG富集分析和功能注釋,篩選條件為P<0.05。GO分析結(jié)果由3個部分構(gòu)成:生物學過程(BP)、分子功能(MF)及細胞成分(CC)。GSEA分析是將所有基因納入研究再篩選出差異顯著的富集通路,篩選條件為P<0.05。
1.4GeneCards分析 GeneCards數(shù)據(jù)庫(https://www.genecards.org/)包括了多種生物的基因數(shù)據(jù)和大量疾病相關基因,該數(shù)據(jù)庫對相關基因進行細致的分類,可以查閱到基因分布的組織、作用途徑和與疾病相關度的得分。故利用GeneCards數(shù)據(jù)庫對篩選到的差異基因進行檢索,觀察差異基因是否與相關疾病的致病基因相符、在人體組織中的分布是否與疾病相關。
2.1HAPC與PH基因篩選 GSE29977數(shù)據(jù)集標準化后進行富集分析,對富集出的差異基因進行篩選,得到1 627個差異基因(815個上調(diào)基因,812個下調(diào)基因),校正后符合篩選閾值(P<0.01;log2|FC|>1)的基因有396個,其中188個上調(diào)基因和208個下調(diào)基因。GSE53408數(shù)據(jù)集標準化后進行富集分析,篩選得到3 455個基因(695個上調(diào)基因,2 760個下調(diào)基因),校正后符合篩選閾值(P<0.004 54;log2|FC|>1)的基因有791個,其中695個上調(diào)基因和96個下調(diào)基因。將兩個數(shù)據(jù)集轉(zhuǎn)換為一致的基因ID并排除其中無名稱基因,對剩余基因使用維恩圖進行重疊篩選,共得到138個共同差異基因,校正后共同的差異基因有11個,分別為內(nèi)皮細胞黏附分子(ESAM)、成纖維細胞生長因子18(FGF18)、主要組織相容性復合體(MHC)Ⅱ類人類白細胞抗原DQB1(HLA-DQB1)、同源異構(gòu)體A7(HOXA7)、POZ/BTB和AT結(jié)合基序鋅指蛋白1(PATZ1)、整合素亞基B4(ITGB4)、甲基硫核糖-1-磷酸異構(gòu)酶(MRI1)、基質(zhì)金屬肽酶8(MMP8)、Caspase12、10號染色體開放閱讀框25(C10orf25)、H因子(CFH)。
2.2GO分析及KEGG分析 對138個差異基因進行功能注釋,然后進行GO分析以及KEGG分析。校正前,BP差異基因主要富集在:中胚層形態(tài)生成、初級胚層形成、原腸胚形成;CC差異基因主要富集在:黏附連接、細胞與細胞連接、蛋白酶體調(diào)控顆粒堿基亞復合物、間質(zhì)矩陣、宿主細胞內(nèi)部分等;MF差異基因主要富集在:激活轉(zhuǎn)錄因子、MHCⅡ類受體活性、UDP葡萄糖基轉(zhuǎn)移酶活性、腺苷脫氨酶活性、磷酸酪氨酸殘基結(jié)合等。KEGG分析提示差異基因主要富集在:內(nèi)質(zhì)網(wǎng)蛋白質(zhì)加工、細胞外基質(zhì)(ECM)受體相互作用、金黃色葡萄球菌感染、半胱氨酸和蛋氨酸代謝等。
先對校正后的11個差異基因進行功能注釋,然后進行GO分析及KEGG分析。BP差異基因主要富集在初級胚層形成、原腸胚層形成,CC差異基因主要富集在MHCⅡ類蛋白復合物、復雜炎性體、核膜,MF差異基因主要富集在MHCⅡ類受體活性、半胱氨酸型內(nèi)肽酶活性參與凋亡信號通路、胰島素樣生長因子Ⅰ結(jié)合等。KEGG分析提示差異基因主要富集在金黃色葡萄球菌感染、細胞黏附分子、肌動蛋白細胞骨架的調(diào)節(jié)。見圖1~4。
圖1 校正前差異基因GO分析結(jié)果
圖2 校正后差異基因GO分析結(jié)果
圖3 校正前差異基因 KEGG分析結(jié)果
圖4 校正后差異基因KEGG分析結(jié)果
2.3GSEA分析 由于得到的數(shù)據(jù)集差異基因較少,進一步使用GSEA分析對差異基因附近的通路進行分析,探索HAPC與PH的共同性。GSE53408數(shù)據(jù)集的GSEA分析結(jié)果顯示只有兩個通路具有顯著差異。細胞周期信號通路具有最高標準化富集得分[NES,NES=2.236 2,P<0.000 1,錯誤發(fā)現(xiàn)的比率(FDR)<0.014],其次為卵母細胞減數(shù)分裂通路(NES=2.014 0,P<0.001 2,FDR<0.027)。GSE29977數(shù)據(jù)集的GSEA分析結(jié)果并未發(fā)現(xiàn)兩種疾病間共同的信號通路,需要在未來進行進一步研究分析。見表1。
表1 GSEA分析篩選GSE29977數(shù)據(jù)集差異富集的信號通路
2.4GeneCards分析 通過GeneCards網(wǎng)站對篩選出的138個共同差異基因和校正后得到的11個差異基因數(shù)據(jù)進行分析。對未校正前篩選到的131個(有7個基因數(shù)據(jù)庫未能識別)共同差異基因檢索結(jié)果顯示,差異基因在人體多個組織均有表達,由于PH屬于心血管系統(tǒng)疾病(或循環(huán)系統(tǒng)疾病),故對心血管系統(tǒng)疾病的分類進行檢索分析,結(jié)果顯示與這131個共同差異基因相關的疾病中包含PH。對篩選到的138個差異基因與人類PH所有相關基因進行比對,結(jié)果顯示相同的基因有60個,與PH高度相關的基因有血管緊張素轉(zhuǎn)換酶(ACE)、微小RNA、SMAD通路蛋白(SMAD)、纖維母細胞生長因子(FGF)、血小板衍生生長因子(PDGF)。
對校正后的11個差異基因進行對比,顯示有5個相同基因:FGF18、HLA-DQB1、PATZ1、MMP8、CFH。結(jié)果在疾病分類中未查閱到PH。對校正后11個差異基因進行檢索,結(jié)果顯示其中4個基因在肺部高表達,包括ESAM、FGF18、HLA-DQB1、PATZ1。PATZ1主要表達于肺莖支氣管中;ESAM表達于肺血管內(nèi)皮細胞表面;HLA-DQB1表達在肺、血液、呼吸道上皮細胞表面、支氣管中部。對相關疾病的分析結(jié)果顯示,高血壓分類與PH相關性評分較高(相關性得分為34.1),故推測HAPC與PH間可能存在相關性。
通過知網(wǎng)和Pubmed兩個數(shù)據(jù)庫對本次篩選出的相關基因進行檢索,發(fā)現(xiàn)與本次篩選結(jié)果相同的基因有ACE、PDGF、HLA-DQB1。研究表明,ACE是腎素-血管緊張素系統(tǒng)產(chǎn)生,具有強烈的血管收縮作用。機體在低氧環(huán)境下促使ACE產(chǎn)生且受低氧誘導因子(HIF)調(diào)控,傅薇[14]研究表明HAPC患者骨髓單個核細胞、骨髓液、血液及骨髓的ACE水平均增高,證明ACE是HAPC的發(fā)生機制之一,同時ACE的同素體ACE2廣泛分布在心、腎、肺等器官,在肺中分布于Ⅰ型肺泡上皮細胞、Ⅱ型肺泡上皮細胞、支氣管上皮細胞、巨噬細胞、肺血管內(nèi)皮細胞、平滑肌細胞。相關研究表明ACE可以促進血管緊張素2(AngⅡ)產(chǎn)生,AngⅡ可以誘發(fā)肺血管內(nèi)平滑肌細胞遷移,刺激炎癥因子、轉(zhuǎn)化生長因子-β(TGF-β)產(chǎn)生,誘導肺實質(zhì)細胞凋亡,AngⅡ還可進一步促進血管收縮及平滑肌細胞生長遷移,加重PH發(fā)生[15]。查閱現(xiàn)有PDGF相關研究結(jié)果顯示,PDGF家族包括PDGFA、PDGFB、PDGFC、PDGFD等。PDGF具有趨化、收縮血管、促進分裂作用,參與磷酸酯酶激活與前列腺素代謝。殷玉娟等[16]研究顯示,HAPC患者血小板活化,PDGF表達升高,血栓形成使得血液成分和血流狀態(tài)改變[17],可以使HAPC患者血氧飽和度下降10%[18],加重血管細胞損傷,促使血栓形成增加,故PDGF是HAPC的發(fā)病原因之一。彭虹艷[19]研究發(fā)現(xiàn),PDGF可以在有氧環(huán)境下促進主動脈血管平滑肌細胞糖酵解增強,PDGF通過PI3K/AKT/mTOR信號通路上調(diào)HIF-1α,使得丙酮酸脫氫酶(PDH)磷酸化活性下降,產(chǎn)生肺動脈平滑肌Warburg效應,使得肺動脈平滑肌異常增殖、肺動脈重構(gòu),證明PDGF在PH的發(fā)生過程中發(fā)揮重要作用。檢索現(xiàn)有與人類白細胞抗原系統(tǒng)(HLA)相關文獻,結(jié)果顯示其具有高度基因多態(tài)性,其中DQA1和DQB1具有多種免疫學功能,且已有研究表明HLA除與免疫系統(tǒng)疾病相關外,還與呼吸系統(tǒng)、消化系統(tǒng)、心血管系統(tǒng)疾病存在相關性[20]。青格樂圖等[21]對青海地區(qū)HAPC患者人類白細胞抗原DQA1(HLA-DQA1)和HLA-DQB1的6個等位基因與健康對照者進行對比,結(jié)果發(fā)現(xiàn)HLA-DQB1與肺動脈高壓的發(fā)生密切相關[22]。通過對已有文獻進行查閱,與本次分析篩選到的差異基因進行對比,結(jié)果顯示有多個已驗證的疾病相關基因,其余未驗證的差異基因需在未來進行實驗驗證。
本研究還存在以下不足:(1)在GEO數(shù)據(jù)庫中檢索到的研究樣本較少;(2)GeneCards在線數(shù)據(jù)庫分析結(jié)果與目前已有的基因研究結(jié)果相符的數(shù)據(jù)較少;(3)GSEA分析結(jié)果未發(fā)現(xiàn)共同的信號通路,需進一步進行分析研究;(4)本研究僅是對GEO數(shù)據(jù)庫中已有的相關研究數(shù)據(jù)進行分析研究,需要進行實驗驗證。
綜上所述,本研究為HAPC與PH的相關研究提供了思路和研究方向,下一步可對篩選的差異基因進一步分析,并進行功能驗證進而探索不同的PH類型與HAPC的相關性。