楊媛媛 黃冠江 陶源
由于耳蝸部位的血液供應相對較脆弱,一旦耳蝸供血障礙易引起耳蝸的病變,從而導致耳蝸性聾[1~4],嚴重的耳蝸性聾患者的最佳治療是人工耳蝸植入術,但至今耳蝸性聾的相關機制仍不十分明確[5,6]。最新研究表明,早期給予外源性腦源性神經因子可有效保護條件敲除縫隙鏈接蛋白26的小鼠耳蝸Corti器及螺旋神經節(jié)細胞的形態(tài),但對于聽功能則無保護作用[7]。Yoshimura等[8]通過基因芯片技術和實時熒光定量PCR,發(fā)現(xiàn)POU4F3、Slc17a8、TMC1及Crym的突變可導致耳蝸性聾。為進一步研究小鼠耳蝸性聾的關鍵通路、差異表達基因(differentially expressed genes,DEGs)及這些基因產物之間的相互作用,本研究采用數(shù)據(jù)庫挖掘的方法進行基因本體分析(gene ontology analysis,GO)、京都基因和基因組百科全書分析(kyoto encyclopedia of genes and genomes, KEGG)、蛋白質互作網絡分析(protein protein interaction network,PPI network)及基因集富集分析(gene set enrichment analysis, GSEA),旨在拓展耳蝸性聾機制的研究思路,并為耳蝸性聾的治療提供參考。
1.1材料 從美國國立生物信息中心(National Center for Biotechnology Information, NCBI)基因表達數(shù)據(jù)庫(gene expression omnibus, GEO)下載小鼠耳蝸性聾基因芯片表達譜數(shù)據(jù)(GSE84735),該芯片數(shù)據(jù)由東京大學的耳鼻咽喉科學者Kashio A和Someya S上傳,采用Affymetrix Mouse Genome 430 2.0 Array平臺,芯片數(shù)據(jù)包含10個樣本,其中,耳蝸性聾小鼠樣本5例(實驗組),對照組小鼠樣本5例,均為2月齡。實驗組小鼠均采用0.15%的GeO2喂養(yǎng)4個月,對照組小鼠采用正常飲食喂養(yǎng)。均經聽性腦干反應檢測證實,GeO2喂養(yǎng)后的實驗組小鼠出現(xiàn)了嚴重的聽力損失,而對照組小鼠無聽力損失,在小鼠6月齡的時候,運用微陣列技術分析CBA小鼠耳蝸基因的表達。
1.2分析方法
1.2.1數(shù)據(jù)處理及差異基因分析 運用R軟件(版本3.5.1)進行基因芯片分析。將原始CEL(CIM Fast Event Language)數(shù)據(jù)導入R軟件,對耳蝸性聾組(實驗組)和正常聽力組(對照組)進行差異比較,應用affyPLM和affy程序包對原始芯片數(shù)據(jù)進行質量控制,用RMA算法對數(shù)據(jù)進行標準化處理;從而應用limma程序包對基因進行篩選,選出差異表達基因(differentially expressed genes,DEGs)。篩選條件:Fold Change的絕對值大于2,且P<0.05,然后,通過R軟件運行gplots程序包,做可視化的火山圖。最后,使用Morpheus (https://software.broadinstitute.org/morpheus/)對排名前50的上調和下調的差異基因做可視化的熱圖。
1.2.2GO分析和KEGG分析 GO是一種常用的注釋基因和識別生物學特性的有效方法[9, 10]。KEGG是一個對基因功能進行系統(tǒng)分析的數(shù)據(jù)庫[11, 12],能對差異基因進行GO富集分析和KEGG通路分析[13]。為了分析差異基因,在戴維數(shù)據(jù)庫(Database for Annotation, Visualization and Integrated Discovery, David) v6.8中,對差異基因進行GO富集分析和KEGG通路分析,且定義P<0.05時具有統(tǒng)計學意義。
1.2.3差異基因互作網絡分析 交互基因的搜索工具(search tool for the retrieval of interacting genes,STRING)數(shù)據(jù)庫是用于評估蛋白質相互作用信息的在線工具,String(版本10.5)涵蓋了來自2 031種生物體的960萬種蛋白質信息。為了評估DEGs之間的交互關系,本研究應用Cytoscape軟件構建蛋白質相互作用網絡(PPI network),使用cytoHubba插件篩選出前10位的關鍵基因,同時使用分子復合檢測(molecular complex detection,MCODE)插件蛋白質相互作用對網絡的模塊進行分析;然后,對MCODE排名第一的模塊進行KEGG通路分析,且定義P<0.05時具有統(tǒng)計學意義。
1.2.4GSEA分析 采用GSEA軟件,對數(shù)據(jù)集GSE84735進行基因集富集分析, Spearman相關系數(shù)為基因和樣本標簽之間的基因的權重[14, 15],按默認的加權富集統(tǒng)計的方法進行富集分析,設置隨機組合次數(shù)為1 000次;當通路的錯誤發(fā)生率(false discovery rate,FDR)<25%且P<0.01時,認為通路具有顯著統(tǒng)計學差異。
2.1差異基因的表達分析結果 通過實驗組與對照組小鼠樣本對比,總共19 191個基因被納入研究?;贔old change的絕對值大于2并P<0.05的標準,篩選出191個DEGs,其中,79個基因為耳蝸性聾的上調DEGs,112個基因為耳蝸性聾的下調DEGs(圖1)。對排名前50的上調和下調的DEGs做可視化的熱圖(圖2)。
圖1 差異基因的火山圖 紅色代表上調的DEGs,藍色代表下調的DEGs
2.2GO分析和KEGG分析結果 上傳所有的DEGs至在線分析工具-David數(shù)據(jù)庫,以識別GO分析和KEGG分析。GO分析結果顯示,在生物過程中,上調的DEGs顯著富集的生物過程包括:蛋白質寡聚化的調節(jié)、先天免疫應答、細胞趨化性、細胞對白細胞介素-1的反應、細胞對脂多糖的反應等(表1);下調的DEGs顯著富集的生物過程包括:有絲分裂核分裂、細胞周期、細胞分裂、染色體分離及紅細胞分化等(表1)。在分子功能(molecular function,MF)方面,上調的DEGs顯著富集的分子功能包括:趨化因子受體結合、鋅離子結合、趨化因子活性、金屬肽酶活性及細胞因子活性;下調的DEGs顯著富集的分子功能包括:微管結合、組蛋白結合、轉錄抑制活性、RNA聚合酶II核心啟動子近端序列特異性結合、轉錄調控區(qū)序列特異性DNA結合及RNA聚合酶II轉錄因子結合等(表1)。此外,在細胞成分(cell component,CC)方面,上調的DEGs顯著富集的細胞成分包括:細胞外空間和細胞外區(qū);下調的DEGs顯著富集的細胞成分包括:著絲粒區(qū)染色體、著絲粒、紡錘體極、染色體及稠密染色體著絲粒等(表1)。
表1 小鼠耳蝸性聾差異表達基因的GO分析
KEGG分析結果顯示,上調的DEGs在腫瘤壞死因子信號通路中富集,而下調的DEGs在細胞周期、孕酮介導的卵母細胞成熟、卵母細胞的減數(shù)分裂及p53信號通路中富集(表2)。
2.3PPI 網絡分析結果 基于String數(shù)據(jù)庫中的信息,使用Cytoscape(版本3.6.1)進行PPI網絡的繪制(圖3),然后,使用插件cytoHubba對關鍵基因進行篩選,排名前10的關鍵節(jié)點(hub)包括Kif11、Cdc20、Cdk1、Bub1b、Ccnb2、Cdca8、Cdca5、Sgol1、Hmmr及Ncapg,其中,Kif11節(jié)點的度(degree)最高,為31。此外,使用插件MCODE對總共91個節(jié)點和516個邊界進行了分析,選擇排名第1的子網絡,分析網絡中涉及的基因的重要通路(圖4,表3),KEGG分析表明,DEGs主要與細胞周期、孕酮介導的卵母細胞成熟、卵母細胞的減數(shù)分裂、p53信號通路及病毒性癌變有關。
表2 小鼠耳蝸性聾差異表達基因的KEGG分析
表3 關鍵子網絡中涉及的基因的重要通路的KEGG分析
圖3 蛋白質相互作用網絡
2.4GSEA分析結果 GSEA分析結果顯示,共有17 541個基因集在小鼠耳蝸性聾表型中表達上調,其中560個FDR<25%,621個P<0.01;共有1 836個基因集在小鼠耳蝸性聾表型中表達下調,其中703個FDR<25%,683個P<0.01;如圖5所示,前三位上調的通路包括樹突狀細胞成熟A(圖5a)、Cronquist Nras信號轉導(圖5b)及反應金屬離子SLC轉運蛋白(圖5c);而前三位下調的通路包括半乳糖代謝(圖5d)、氧化磷酸化(圖5e)及嘌呤代謝(圖5f)。
Qiao等[16]研究了巨細胞病毒對小鼠耳蝸的破壞機制,耳蝸的組織病理學檢查顯示前庭膜中淋巴細胞浸潤水平增加,通過免疫組織化學染色檢測到鼓膜中較高水平的TNF-α和IL-6;Zou等[17]研究了振動引起的聽力損失相關動物模型的細胞和分子機制,證實耳蝸性聾與TNF-α及其受體的上調有關;Riva等[18]同樣驗證了這一觀點;Tadros等[19]研究了隨年齡增長和聽力損失程度加重的小鼠耳蝸中凋亡相關基因的表達,通過基因芯片和實時熒光定量PCR技術,證實耳蝸性聾與P53相關。本研究從GEO數(shù)據(jù)集中表達譜數(shù)據(jù)(GSE84735)檢索到5個小鼠耳蝸性聾的樣本和5個正常聽力的樣本,研究中共確定191個差異表達基因。為了更好地研究DEGs的相互作用,本研究進行了GO分析和KEGG分析;在GO分析中,上調的DEGs主要參與細胞外空間、細胞外區(qū)及CXCR趨化因子受體結合等過程,下調的DEGs主要參與有絲分裂核分裂、細胞周期及細胞分裂等過程;在KEGG分析中,上調的DEGs主要參與腫瘤壞死因子信號通路,下調的DEGs主要參與細胞周期、孕酮介導的卵母細胞成熟、卵母細胞的減數(shù)分裂及p53信號通路等。
圖4 關鍵子網絡
圖5 GSEA分析結果 a、b、c為前三位上調通路,d、e、f為前三位下調通路
本研究還構建了DEGs的PPI網絡,并列出了前10個關鍵基因:Kif11、Cdc20、Cdk1、Bub1b、Ccnb2、Cdca8、Cdca5、Sgol1、Hmmr及Ncapg。Kif11被確定為具有最高連接度的關鍵基因,Kif11是一種蛋白質編碼基因,編碼驅動蛋白樣蛋白家族的運動蛋白,其基因產物的功能包括染色體定位、中心體分離和建立雙極紡錘體。Kovacovicova等[20]的一項研究顯示,Kif11能保持雙極紡錘體結構,促進卵母細胞的成熟;Johnson等[21]的研究表明KIf11參與有絲分裂紡錘體的形成過程,進而促進次級神經元和膠質細胞的發(fā)育。Cdc20一般在細胞周期中調節(jié)多種蛋白相互作用,在染色體分離和有絲分裂結束中具有重要功能[22];其他關鍵基因Cdk1、Bub1b、Ccnb2、Cdca8、Cdca5、Sgol1、Hmmr及Ncapg的研究,目前仍缺乏相關文獻。Buniello等[23]發(fā)現(xiàn)wbp2表達缺失導致小鼠漸進性高頻耳蝸性聾;Menardo等[24]發(fā)現(xiàn)SAMP8菌株能促使小鼠耳聾和耳蝸退化提前出現(xiàn),還原人類耳蝸性聾的過程,促使SAMP8小鼠提前出現(xiàn)耳聾的相關分子機制涉及氧化應激、抗氧化酶水平的改變和復合物I、II和IV的活性降低,同時這些也導致了慢性炎癥和細胞凋亡的發(fā)生。所以,耳蝸性聾的關鍵基因仍需要進一步研究。
本研究差異表達基因工作網絡圖的關鍵子網絡分析顯示耳蝸性聾的差異基因與細胞周期、孕酮介導的卵母細胞成熟、卵母細胞的減數(shù)分裂、p53信號通路及病毒性癌變有關,但相關文獻目前仍缺乏;所以,耳蝸性聾的關鍵基因仍需要進一步研究。GSEA分析的結果顯示,共有17 541個基因集在小鼠耳蝸性聾表型中表達上調,有1 836個基因集在小鼠耳蝸性聾表型中表達下調,同時前三位上調的通路包括樹突細胞成熟、Croonquist Nras信號轉導及反應金屬離子硫蛋白轉運,而前三位下調的通路包括半乳糖代謝、氧化磷酸化及嘌呤代謝。Someya等[25]研究表明耳蝸性聾與氧化磷酸化相關。而其他通路仍需要更多的基礎研究來驗證。然而,本研究也有一些不足:首先,樣本量較小,僅包括5個耳蝸性聾小鼠樣本和5個對照組樣本;第二,分析結果中篩選出的基因及通路超過半數(shù)未在基礎研究中得到驗證,故暫無足夠文獻供分析,需要更多基礎研究來進一步闡明基因集富集分析的結果;第三,本研究的結果全部來源于GEO數(shù)據(jù)庫下載的表達譜數(shù)據(jù),仍需進一步基礎實驗來驗證。
總之,本研究獲得的小鼠耳蝸性聾差異表達基因的生物信息學分析結果,不僅為耳蝸性聾研究方向的擴展提供了新思路,對于其發(fā)病機制及分子靶向治療的研究也具有較好的提示作用。