巴燕娜,蘇麗萍,袁 晴,董?,摗?/p>
(1.第四軍醫(yī)大學西京醫(yī)院臨床免疫科,西安 710032;2.第四軍醫(yī)大學基礎醫(yī)學院生理與病理生理學教研室,西安 710032)
原發(fā)性干燥綜合征(pSS)是一種以淚腺和唾液腺病變及淋巴細胞浸潤為主要特征并由自身免疫反應介導的慢性風濕性炎癥疾病。然而除了外分泌腺體的病變之外,pSS也能影響機體的其他器官,表現出機體體征和癥狀的多樣性[1-2]。研究表明pSS患者死亡主要是由實體腫瘤、感染、淋巴瘤和心血管疾病等因素造成[3]。由于pSS在不同的個體中表現出不同的癥狀,患者預期壽命和原發(fā)病相關[1]。然而,目前對于pSS患者的治療目標只是緩解癥狀、抑制過度的自身免疫反應、損傷預防及生活質量的改善[4],還沒研發(fā)出直接治療pSS的藥物。此外,為了闡明pSS發(fā)病機制,研究人員從細胞分子水平特征上對pSS患者特征進行了大量的研究,研究包括全基因組關聯分析[5]、表觀基因組[6]、轉錄組學[7]、血清標志物的鑒定[8]、代謝組學[9]和免疫表型研究[10]。盡管對pSS的分子特征進行了全面的研究,但是pSS的發(fā)病機制尚不完全清楚,還需要進一步了解和探索[10]。
除了細胞核,線粒體是人體細胞中唯一具有基因組的細胞器。線粒體基因組由37個基因組成,其中的13個基因編碼線粒體自身需要的蛋白質,其他的線粒體所需的蛋白質由核基因組的基因編碼[11]。隨著人們對線粒體的結構和功能研究不斷加深,人們認識到除了為機體提供能量之外,線粒體在鈣離子的穩(wěn)態(tài)、產生活性氧ROS、調控細胞的凋亡以及內質網的應激反應等過程中扮演重要角色[12]。研究發(fā)現,線粒體功能的異常與多數的疾病相關,這些疾病包括阿爾茨海默病、帕金森病等[13-14]。
以往研究[15]闡明維持線粒體的穩(wěn)態(tài)能夠控制自身免疫進程。因此,線粒體功能與機體的自身免疫相關。然而pSS作為一種自身免疫性疾病與線粒體之間的相關機制尚不明確。相關研究表明與凋亡相關的線粒體蛋白細胞色素C和SMAC在pSS患者中高表達,提示細胞色素C和SMAC在pSS的發(fā)生發(fā)展中起重要作用[16]。此外,有研究[17]發(fā)現pSS患者中存在含抗線粒體抗體(AMA),AMA是表現出肝功能異常的pSS患者的血清標志。目前,對于線粒體功能和pSS之間的關系尚不明確,而基于差異表達基因分析的轉錄組學研究有助于發(fā)現線粒體和pSS之間的相關機制,有利于推進pSS相關研究的進展。
1.1材料 線粒體功能相關基因的注釋信息來源于NCBI和MitoMiner數據庫。線粒體功能相關基因包括兩種,一種是線粒體自身編碼的基因,即線粒體基因;另一種是核基因組編碼且編碼蛋白質定位于線粒體的基因,即線粒體相關基因。其中,NCBI數據庫提供的線粒體參考基因組共包含37個線粒體基因。MitoMiner數據庫的IMPI(Integrated Mitochondrial Protein Index)[18]提供了1 626個線粒體功能相關基因,去除13個線粒體基因,線粒體相關基因由1 613個基因組成。本文采用的pSS相關的基因芯片表達譜數據來源于GEO數據庫,樣本來源為細胞毒性CD8+T細胞,樣本量共60例(30例患者,30名健康人),探針54 613個,基因20 486個。線粒體功能相關基因在基因芯片表達譜的檢出情況:數據集GSE84844中包含線粒體相關基因1 537個,線粒體基因6個,檢測率分別為95.29%和16.22%。
1.2方法
1.2.1基因芯片表達譜數據預處理 本文使用的基因表達譜數據來源于Affymetrix平臺檢測的基因芯片數據,其原始數據CEL文件需要經過預處理,以下是數據預處理的步驟:(1)運用RMA算法[19]對原始數據進行歸一化運算并進行以2為底的對數轉換,基因表達值的取值范圍在0~16。(2)利用GEO數據庫中GPL570平臺的注釋信息,將原始表達譜中的探針對應成Entrez Gene ID。在對應的過程中,去除對應到多個Entrez Gene ID的探針及其對應的基因表達值。同時,將多個探針對應成一個Entrez Gene ID的表達值取平均值,得到數據預處理后的基因表達譜。
1.2.2篩選差異表達基因 在pSS組和正常組的樣本中,本文使用的差異基因分析方法為雙總體學生t檢驗和FC(Fold Change)。采用多重檢驗校正的方法Benjamini-Hochberg對P值進行校正,并控制錯誤發(fā)現率(false discovery rate,FDR)。本文設置FDR<0.05且表達值變化1.5倍以上的基因為差異表達基因。
1.2.3KEGG功能富集和GO功能注釋 為了分析差異表達顯著的線粒體功能相關基因涉及哪些生物學通路,從而能進一步分析線粒體的異常可能來源于哪些功能上的異常。本文針對差異表達顯著的線粒體功能相關基因進行KEGG功能富集和GO功能注釋,采用的通路信息和注釋信息分別來源于KEGG(Kyoto Encyclopedia of Genes and Genomes)[20]和GO(Gene Ontology)[21]數據庫。本文基于R語言clusterProfiler包來實現這一過程,設置P<0.05富集的通路和注釋的GO術語具有顯著性。此外,GO注釋過程中的基因功能類型為基因參與的生物學過程。
1.2.4蛋白質互作網絡分析 為了解差異表達顯著的線粒體功能相關基因與其他基因之間相互作用的情況并尋找在蛋白質互作網絡中的Hub節(jié)點即網絡中心節(jié)點,本文采用STEING[22]蛋白質互作數據庫中的蛋白質互作信息進行分析,并采用Cytoscape軟件繪制了蛋白質互作網絡圖。在分析的過程中,本文基于R語言igraph包計算出蛋白質互作網絡中每一個節(jié)點的度、介數和接近中心度,并設置度、介數和接近中心度排名都在前10的節(jié)點為網絡中的Hub節(jié)點。
2.1篩選差異表達基因 本文在pSS組和正常組的基因表達譜中,采用t檢驗和FC的差異基因分析方法設置FDR<0.05且表達值變化1.5倍以上共篩選出347個pSS相關的顯著差異表達基因(見表1)。其中,顯著差異表達的線粒體相關基因有61個。在60個上調的基因中,pSS組相對于正常組基因表達值的倍數變化在2倍以上的基因有UQCRQ、XAF1、NDUFA4、MRPS28、IFIT3、OAS1、IFI6、CMPK2和IFI27,1個下調的基因為MYH9,詳細的信息見表2。其中,倍數變化最大的基因是IFI27即干擾素誘導蛋白27,其FC值為23.35(10.23)。另外,本文使用的基因表達譜數據中檢測了6個線粒體基因,分別為MT-ND6、MT-CO2、MT-ND2、MT-CO1、MT-ND4和MT-ATP6,而MT-ND2基因即泛醌氧化還原酶核心亞基2表現出基因表達值的下調,pSS組的基因表達值是正常組的0.61倍。由此說明了pSS的發(fā)生伴隨著部分線粒體功能相關的基因表達的失調。由此推測線粒體功能的異常在pSS中的發(fā)生發(fā)展中發(fā)揮一定的作用,但具體的機制尚不明確?;鹕綀D見圖1。
表1 pSS組相對于正常組顯著差異表達情況
上調:指pSS組相對于正常組基因表達值的上調,下調:指pSS組相對于正常組基因表達值的下調
2.2差異表達顯著的線粒體功能相關基因的功能富集與功能注釋 為了解線粒體功能相關基因的異常表達會影響機體的哪些生物學通路,圖2和圖3分別展示了對62個差異表達的線粒體功能相關基因進行GO功能注釋和KEGG功能富集的結果。本文設置P<0.05的GO術語和KEGG通路具有顯著性,最終富集到138條GO術語和3條KEGG通路,圖2只展示了最顯著的33條GO術語。從結果可以看出,62個線粒體功能相關基因的異常表達主要影響氧化磷酸化、電子傳遞鏈、質子跨膜運輸、線粒體基因的轉錄和翻譯過程、核苷酸代謝以及細胞色素C的釋放過程等與細胞能量供應、細胞凋亡及核苷酸代謝相關的生物學過程。因此,pSS的發(fā)生、發(fā)展可能會出現線粒體能量供應異常、細胞的凋亡、線粒體基因組轉錄翻譯及核苷酸代謝失控的狀態(tài)。
火山圖展示了20 486個基因在pSS組和正常組中基因表達值的變化情況。紅色的點表示顯著表達上調基因,綠色的點表示顯著表達下調基因,而黑色的點表示表達水平低于給定閾值而被認為沒有顯著差異的基因。橫坐標為log2FC表示pSS組相對于正常組基因表達值的倍數變換經過以2為底的對數轉換,其絕對值越大表示差異越大。縱坐標為-log10FDR表示FDR值經過以10為底的負對數轉換,值越大表示差異越顯著。此外,本文篩選差異表達基因的條件為FDR<0.05且表達值變化1.5倍以上,在圖中表現為3條虛線。兩條垂直的虛線分別表示-log21.5和log21.5,水平虛線為-log100.05
圖1火山圖
表2 倍數變化較大的差異表達顯著的線粒體相關基因
2.3差異表達顯著的線粒體功能相關基因的蛋白質互作網絡 為了解差異表達顯著的線粒體功能相關基因與其他基因之間相互作用情況,圖4展示了62個差異表達的線粒體功能相關基因與其他基因之間的相互作用關系,綠色的點表示表達上調的基因,藍色的點表示表達下調的基因。該蛋白質互作網絡的Hub節(jié)點即度、介數和接近中心度都排在前10的節(jié)點為RPL31、RPS17、ATP5C1和UQCRQ。其中,RPL31、RPS17和UQCRQ為表達上調的線粒體相關基因,ATP5C1并非為差異表達基因。表3展示了蛋白質互作網絡中度、介數、接近中心度排名前10的基因。Hub節(jié)點在網絡中發(fā)揮重要的作用。因此,線粒體功能的異??赡芘cRPL31、RPS17和UQCRQ的失調息息相關,其可能是pSS進展的重要因素。
圖中只展示了最顯著的33條GO術語
圖2 62個顯著差異表達的線粒體功能相關基因注釋GO術語
圖3 62個顯著差異表達的線粒體功能相關基因富集的KEGG通路
綠色表示上調基因;藍色表示下調基因
圖4差異表達顯著的線粒體功能相關基因蛋白質互作網絡圖
自身免疫性疾病pSS的多表征特點是臨床診斷和治療的問題和挑戰(zhàn),pSS發(fā)生的機制尚不明確。有研究表明線粒體功能和機體的自身免疫過程息息相關[15],但線粒體功能和pSS之間的關系尚不明確。為了研究線粒體和pSS之間的關系,本文旨在從轉錄組學的層面利用細胞毒性CD8+T細胞標本的基因表達譜芯片分析線粒體功能相關基因在pSS組和正常組中的差異表達情況。通過t檢驗和FC差異基因分析方法,本文共找出62個線粒體功能相關基因在pSS患者的表達中發(fā)生了失調,其中1個差異表達基因是線粒體自身編碼的基因。這些異常表達的線粒體功能基因主要涉及細胞的能量供應、核苷酸代謝、細胞凋亡(細胞色素C的釋放)和線粒體基因的轉錄和翻譯等生物學過程。由此說明pSS伴隨著上述生物學過程的失調,提示線粒體和pSS發(fā)生發(fā)展之間有關聯。
DisGeNET數據庫[24]提供了和疾病相關基因的數據信息,其提供了78個和pSS相關且在基因表達上出現異常的基因。本文使用的基因芯片數據GPL570平臺檢測的基因中只包含56個pSS相關的基因,進一步分析發(fā)現基因芯片數據中的347個差異表達基因只有4個基因是DisGeNET提供的pSS相關的基因。此外,先前的研究指出OAS1、IFI27和IFIT3這3個差異表達的線粒體功能相關基因與pSS的發(fā)生相關[23,25],而這3個基因不屬于DisGeNET數據提供的78個基因。因此,本文分析的結果中部分的差異表達基因與pSS的發(fā)生相關得到了證實,其余的基因需要進一步的功能性實驗驗證。本文在蛋白質互作網絡分析中識別出RPL31、RPS17、ATP5C1和UQCRQ為網絡中的Hub節(jié)點,其在整個網絡中發(fā)揮重要的作用,這4個基因的異??赡苁蔷€粒體功能異常的重要因素,其異常表達將可能推進pSS的發(fā)生發(fā)展。因此,后續(xù)的功能性實驗首要考慮的基因是上述的4個基因。
此外,本文還存在部分不足的地方。首先,本文基于基因芯片的表達譜數據來分析,由于平臺檢測的基因范圍有限,只檢測了95.29%的線粒體相關基因及16.22%的線粒體基因,其余未檢測到的線粒體功能相關基因并不能說明它們與pSS的發(fā)生和發(fā)展無關。因此,需要有能檢測到這些線粒體相關基因來進一步研究基因的表達異常與pSS之間的關系,以此來建立線粒體和pSS之間的關系。其次,本文是基于轉錄組的層面進行相關研究,尚未考慮在其他組學如基因組、蛋白質組學、代謝組等多維組學層面分析線粒體功能和pSS之間的關系。此外,本文只使用1個基因表達譜數據來進行分析,基于實驗的可重復性考慮,本文的實驗結果有待可重復性驗證或者后續(xù)的功能性實驗進行驗證。最后,本文分析所用的數據是細胞毒性CD8+T細胞的基因表達譜,考慮pSS具有多表征和個體間存在異質性的特點,不同的取樣部位可能導致不同的分析結果。因此,本文分析的結果只適用于部分的pSS患者,并非適用于所有pSS患者。
綜上,本文利用生物信息學的研究方法在轉錄組水平上分析了線粒體功能相關基因在pSS患者的表達情況,發(fā)現線粒體能量供應、線粒體基因組轉錄和翻譯、細胞凋亡及核苷酸代謝等功能的異常與pSS相關。本文的研究結果揭示了線粒體與pSS疾病的相關性,有助于推動線粒體與pSS疾病關聯研究的深入開展。