陳 源,黃正如
葡萄膜黑色素瘤(uveal melanoma,UM)是一種少見的,但也是成人最常見的原發(fā)性眼內(nèi)惡性腫瘤,約占眼部惡性黑色素瘤的85%[1]。UM的治療方式主要有激光、放射治療、眼球摘除及眶內(nèi)容剜除術(shù)。但該病的療效較差、患者生存率較低,5a總生存率為69%,15a為55%,25a為51%[2]。根據(jù)1980年WHO分類法,UM可分為:梭形細胞型、上皮細胞型、混合型和其他型。UM的惡性程度與病理類型有關(guān),以上皮細胞型惡性程度最高,混合細胞型次之,梭形細胞型相對較好[3-4]。UM的基因表達變化與該病的發(fā)展、轉(zhuǎn)移等相關(guān)[5-6]。針對UM的病理分型和基因表達進行研究,對揭示該病的病理機制、治療及預(yù)后具有重要的意義。近年來,基因芯片技術(shù)和生物信息學(xué)分析方法被廣泛應(yīng)用于多種疾病特別是腫瘤的研究中。篩選差異基因(differentially expressed genes,DEGs)及其功能富集分析等生物信息學(xué)方法有助于從基因?qū)用娼沂灸[瘤的病理機制,并為臨床治療及預(yù)后評估提供支持。本研究使用生物信息學(xué)方法,通過對基因芯片數(shù)據(jù)庫進行數(shù)據(jù)挖掘,對上皮型和混合型UM進行了初步探討。
1.1材料數(shù)據(jù)下載所用的數(shù)據(jù)來自美國國立生物技術(shù)信息中心Gene Expression Omnibus(GEO)數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/)。所用數(shù)據(jù)集GSE22138使用的是Affymetrix公司基因芯片,其平臺號為GPL570[HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array。該數(shù)據(jù)集中含有23例混合型及21例上皮細胞型人葡萄膜黑色素瘤的基因芯片信息。
1.2方法
1.2.1差異基因的篩選和功能富集分析GEO2R是GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/geo2r)內(nèi)含的交互式的網(wǎng)絡(luò)工具,能夠通過R語言篩選出不同實驗條件下的差異表達基因。本研究通過GEO2R篩選出上皮型相對于混合型葡萄膜黑色素瘤的差異基因。設(shè)置篩選標準為:logFC≥1及l(fā)ogFC≤-1,P<0.05,挑選出有明顯表達差異且有統(tǒng)計學(xué)意義的基因;再通過R語言作火山圖對結(jié)果進行表達。
1.2.2差異基因的功能富集分析DAVID生物信息數(shù)據(jù)庫(http://david.ncifcrf.gov)是一款在線的整合了生物學(xué)數(shù)據(jù)和分析工具的數(shù)據(jù)庫,該數(shù)據(jù)庫為大規(guī)模的基因或蛋白列表提供系統(tǒng)整合的生物功能注釋信息。京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)是系統(tǒng)分析基因功能的數(shù)據(jù)庫,被廣泛應(yīng)用于整合和解釋基因組測序和其他高通量實驗中得到的大規(guī)模數(shù)據(jù)集。基因本體論(Gene Ontology,GO)是多種生物本體語言中的一種,提供了三層結(jié)構(gòu)的系統(tǒng)定義方式,如生物學(xué)途徑(biological process,BP),細胞組件(cellular component,CC),分子功能(molecular function,MF),用于描述基因產(chǎn)物的功能。本研究通過DAVID數(shù)據(jù)庫對差異基因的功能進行富集分析,取有統(tǒng)計學(xué)差異且排名前10位的富集結(jié)果,通過R語言作氣泡圖對結(jié)果進行表達;并對上調(diào)和下調(diào)的差異基因作表對富集結(jié)果進行表達。P<0.05為差異有統(tǒng)計學(xué)意義。
1.2.3蛋白-蛋白互作網(wǎng)絡(luò)的構(gòu)建和關(guān)鍵基因的篩選及其相互作用分析STRING數(shù)據(jù)庫(http://string-db.org)可用于搜尋已知蛋白質(zhì)之間和預(yù)測蛋白質(zhì)之間的相互作用,便于更加深入地了解蛋白質(zhì)的功能及調(diào)控機制。本研究通過STRING查找差異基因的蛋白-蛋白互作網(wǎng)絡(luò)(protein-protein interaction network,PPI network),以綜合評分>0.4為有統(tǒng)計學(xué)意義。Cytoscape是用于可視化分子互作網(wǎng)絡(luò)的工具,其MCODE插件是基于拓撲結(jié)構(gòu)尋找具有密切相互作用網(wǎng)絡(luò)結(jié)構(gòu)的插件。本研究應(yīng)用Cytoscape中的MCODE插件,以MCODE Scores>5,Degree Cutoff=2,Node Score cutoff=0.2,Max Depth=100及K-Core=2為標準,篩選關(guān)鍵基因。cBioPortal(http://www.cbioportal.org)為癌癥基因組研究提供了一個網(wǎng)頁版面用來瀏覽、可視化和分析多維度的癌癥基因組數(shù)據(jù)。對于調(diào)控網(wǎng)絡(luò)cBioPortal通過基因互作數(shù)據(jù)庫,尋找與候選基因相關(guān)聯(lián)的基因,通過分析互作強弱并構(gòu)建調(diào)控網(wǎng)絡(luò)。本研究應(yīng)用cBioPortal分析和構(gòu)建關(guān)鍵基因的關(guān)聯(lián)基因調(diào)控網(wǎng)絡(luò)。
1.2.4關(guān)鍵基因在UM中的生存分析GEPIA數(shù)據(jù)庫(http://gepia.cancer-pku.cn/)為分析癌癥的差異基因表達、降維分析、相關(guān)性分析、類似基因檢測和生存分析等提供支持。本研究應(yīng)用GEPIA數(shù)據(jù)庫對關(guān)鍵基因在UM中的作用進行了生存分析。
2.1上皮型和混合型人葡萄膜黑色素瘤中的差異基因及其篩選本研究共篩選到UM兩種病理型(上皮細胞型和混合型)之間的差異基因241個。上皮細胞型相對于混合型UM,下調(diào)的差異基因116個和上調(diào)125個(圖1A)。
2.2差異基因的KEGG和GO功能富集分析本研究應(yīng)用網(wǎng)絡(luò)工具DAVID對進入納入標準的差異基因進行了功能富集分析。綜合而言,生物學(xué)途徑(BP),差異基因功能主要富集于細胞粘附、藥物反應(yīng)以及內(nèi)皮細胞的增殖等方面;細胞組件(CC),主要富集于內(nèi)質(zhì)網(wǎng)、細胞質(zhì)、線粒體等;分子功能(MF)主要富集于蛋白質(zhì)同聚活性、微管結(jié)合、TAU蛋白結(jié)合等;KEGG信號通路(KEGG pathway)則主要富集于局部粘附、鈣信號通路、縫隙連接及氨基酸的生物合成等方面(圖1B、C)。分別就上、下調(diào)的差異基因而言,下調(diào)的基因中,BP主要富集于細胞及生物粘附、凋亡、細胞程序性死亡及細胞分化等,CC主要富集于細胞突起、IkappaB激酶復(fù)合物及不溶解組分等,MF主要富集于TAU蛋白結(jié)合、蛋白二聚化、相同蛋白質(zhì)結(jié)合等;上調(diào)的基因,BP主要富集于DNA的解聚、細胞增殖、細胞大分子分解過程、細胞內(nèi)傳遞及對放療的反應(yīng)等,CC主要富集于細胞囊泡、線粒體及其組分、細胞質(zhì)囊及細胞質(zhì)膜結(jié)合囊泡等;MF主要富集于輔酶、核苷及FAD結(jié)合等;KEGG富集于Ca2+信號通路和聚糖生物合成,見表1。
2.3蛋白-蛋白互作網(wǎng)絡(luò)的構(gòu)建和關(guān)鍵基因的篩選及其協(xié)作基因網(wǎng)絡(luò)分析本研究中應(yīng)用Cytoscape對DEGs構(gòu)建PPI的可視化結(jié)果見圖2A,運用MCODE插件篩選出PPI的顯著組件見圖2B,根據(jù)設(shè)置的標準,篩選出的10個關(guān)鍵基因如下:表皮生長因子受體(epidermal growth factor receptor,EGFR)、纖維生長因子13(fibroblast growth factor 13,FGF13)、干擾素α誘導(dǎo)蛋白6(interferon alpha inducible protein 6,IFI6)、干擾素誘導(dǎo)蛋白的四肽重復(fù)序列1(interferon induced protein with tetratricopeptide repeats 1,IFIT1)、ISG15泛素樣修飾劑(ISG15 ubiquitin like modifier,ISG15)、JUN原癌基因AP-1轉(zhuǎn)錄因子亞基(Jun Proto-oncogene,AP-1 transcription factor subunit,JUN)、GTP酶樣發(fā)動蛋白MX(MX Dynamin like GTPase 1,MX1)、2’-5’-寡腺苷酸合成酶1(2’-5’-Oligoadenylate Synthetase 1,OAS1)、SRY盒9(SRY-Box 9,SOX9)、分泌型磷蛋白1(secreted phosphoprotein 1,SPP1)。其中Node Degree最高的為EGFR,具有29個關(guān)聯(lián)節(jié)點,提示該基因在UM中起著樞要作用。通過cBioportal對關(guān)鍵基因的協(xié)作基因網(wǎng)絡(luò)的實現(xiàn)可視化,結(jié)果見圖2C。
2.4關(guān)鍵基因在UM中的生存分析關(guān)鍵基因的表達高低其對UM的生存影響的分析見圖3,結(jié)果表明對于總體生存率(overall survival,OS)而言,EGFR、FGF13、IFI6、IFIT1、ISG15、JUN、MX1、OAS1高表達的人群生存率更低,而基因如SOX9、SPP1高表達的人群則生存率更高。
表1 上調(diào)、下調(diào)差異基因的GO和KEGG通路富集分析
類別注釋倍率P上調(diào)基因生物學(xué)途徑DNA分解代謝過程40.007875生物學(xué)途徑細胞增殖90.00959生物學(xué)途徑細胞大分子分解代謝過程120.009985生物學(xué)途徑胞內(nèi)信號級聯(lián)170.010126生物學(xué)途徑對放療的反應(yīng)60.011711生物學(xué)途徑神經(jīng)元投射的形態(tài)發(fā)生60.015032生物學(xué)途徑細胞運動90.015453生物學(xué)途徑高分子分解過程120.016675生物學(xué)途徑乙酰輔酶A代謝過程30.018718生物學(xué)途徑單糖轉(zhuǎn)運30.018718細胞組件囊泡140.001082細胞組件線粒體部分130.001226細胞組件線粒體180.001977細胞組件細胞質(zhì)囊泡130.002325細胞組件細胞膜結(jié)合囊泡110.006562分子功能輔酶結(jié)合60.008435分子功能核苷結(jié)合200.01345分子功能黃素腺嘌呤二核苷酸結(jié)合40.013617分子功能連接酶活性,形成碳硫鍵30.014906分子功能電子載體活性60.018669KEGG_PATHWAY鈣信號通路60.026148KEGG_PATHWAYO-聚糖生物合成30.033334下調(diào)基因生物學(xué)途徑細胞粘附130.000888生物學(xué)途徑生物粘附130.000899生物學(xué)途徑凋亡調(diào)控140.000917生物學(xué)途徑細胞程序性死亡的調(diào)控140.001005生物學(xué)途徑細胞死亡的調(diào)控140.001039生物學(xué)途徑細胞發(fā)育調(diào)控70.001421生物學(xué)途徑水解酶活性負調(diào)節(jié)40.002946生物學(xué)途徑中性脂質(zhì)代謝過程40.00331生物學(xué)途徑細胞分化過程中的形態(tài)變化70.003403生物學(xué)途徑神經(jīng)元投射發(fā)育70.004302細胞組件細胞投射100.017316細胞組件Ikappab激酶復(fù)合物20.039309細胞組件膜片段100.040116細胞組件不可溶解片段100.048676分子功能Tau蛋白結(jié)合30.000361分子功能蛋白質(zhì)二聚活性100.00551分子功能相同蛋白結(jié)合100.015404分子功能磷脂酰膽堿-甾醇O-?;D(zhuǎn)移酶活性20.030061分子功能細胞骨架蛋白結(jié)合80.033437
UM來源于虹膜、睫狀體及脈絡(luò)膜,根據(jù)1980年WHO分類法,病理分型為梭形細胞型、上皮細胞型、混合細胞型和其他類型:如壞死型、氣球狀細胞型等。其中混合型是指瘤組織由上皮型、梭形細胞、小多邊形細胞等多種形態(tài)的瘤細胞構(gòu)成。梭形細胞型的瘤細胞是一種黏合細胞,具有較強的凝合力,故不易發(fā)生轉(zhuǎn)移;而上皮樣瘤細胞為非黏合細胞,活動度大,凝合力差,很容易發(fā)生轉(zhuǎn)移,其預(yù)后亦更差[3]。既往研究證實基因表達改變與UM的發(fā)展相關(guān):位于內(nèi)質(zhì)網(wǎng)的BAP1,參與泛素化修飾、促進細胞的凋亡;當BAP1發(fā)生突變表達降低時,細胞凋亡受抑制,導(dǎo)致UM的發(fā)生[6]。而SPANX-C在轉(zhuǎn)移性的UM中較非轉(zhuǎn)移表達明顯升高的特點,使該基因成為UM發(fā)生轉(zhuǎn)移的潛在分子標準物[5]。
圖1差異基因及其功能富集分析A:上皮細胞型相較混合型UM,在符合條件logFC≥1及l(fā)ogFC≤-1,P<0.05條件的差異基因中,下調(diào)的基因116個(綠色)和上調(diào)125個(紅色);B:KEGG通路富集分析;C:GO功能富集分析,(1)分子功能富集分析;(2)細胞組件富集分析;(3)生物學(xué)途徑富集分析。
在本研究中,共篩選出差異基因241個。相較于混合型,上皮細胞型UM下調(diào)的基因BP主要富集于細胞及生物粘附、凋亡、細胞程序性死亡及細胞分化等,上調(diào)的基因BP主要富集于DNA的解聚、細胞增殖等,這些功能富集結(jié)果與上皮細胞型UM惡性程度更高,發(fā)展更快且易轉(zhuǎn)移等臨床特征一致。
本研究通過Cytoscape所篩選出10個關(guān)鍵基因,均有與惡性腫瘤相關(guān)的實驗驗證的報道。在PPI中,基因EGFR的Node Degree最高,提示其與UM發(fā)展最為密切。EGFR位于細胞膜表面,是一種跨膜的糖蛋白,當其與相應(yīng)的細胞因子結(jié)合后,則發(fā)生酪氨酸自磷酸化,信號傳導(dǎo)入胞內(nèi),發(fā)生細胞增殖。目前,EGFR與UM癌癥關(guān)系已經(jīng)被實驗所證實[7]。FGF13是纖維生長因子家族成員。FGF家族廣泛參與了有絲分裂和促細胞生存。在乳腺癌的研究[8]中發(fā)現(xiàn)FGF13能夠促進腫瘤的增殖和轉(zhuǎn)移;在子宮頸癌中,高表達FGF13的癌細胞對化療藥物表現(xiàn)出更高的抵抗作用[9]。IFI6由干擾素誘導(dǎo)產(chǎn)生,能夠抑制細胞的凋亡,在乳腺癌的研究[10]中發(fā)現(xiàn)IFI6可通過誘導(dǎo)mROS進而抑制乳腺癌細胞凋亡并促進其轉(zhuǎn)移。而IFIT1的表達增加與鱗狀細胞癌的轉(zhuǎn)移密切相關(guān)[11],同時,該基因亦被認為是乳腺癌的預(yù)后指標之一[12]。ISG15基因編碼的蛋白質(zhì)是一種泛素樣蛋白。研究者在胰腺導(dǎo)管細胞癌的研究中,敲減ISG15后,發(fā)現(xiàn)PDAC細胞受到抑制,提示ISG15具有抑制胰腺導(dǎo)管細胞癌的作用[13]。原癌基因JUN的產(chǎn)物為c-JUN,c-JUN表達增高導(dǎo)致酒精相關(guān)性癌癥發(fā)生率上升[14]。MX1在持續(xù)暴露于紫外線的黑色素瘤細胞中表達明顯升高,該基因的表達上調(diào)能夠抑制黑色素瘤細胞的凋亡,推測該基因與黑色素瘤的發(fā)生發(fā)展相關(guān)[15]。OAS1由干擾素誘導(dǎo)產(chǎn)生,研究報道前列腺癌的發(fā)生與OAS1的基因多態(tài)性相關(guān)[16]。SPP1可以通過促進細胞增殖[17]、腫瘤轉(zhuǎn)移[18]及耐藥[19]促進癌癥的生存及發(fā)展,在SPP1高表達的情況下,其生存率更低。SOX9在肝癌、乳腺癌、膀胱癌及胃癌中表達升高,則患者預(yù)后更差[20]。但本研究中,通過基因SPP1和SOX9在UM中的生存分析,結(jié)果顯示:這兩種基因在高表達時,患者的總體生存率更高,這一結(jié)果不同于兩種基因在其他癌癥中的生存分析結(jié)果,其中原因需待進一步研究。根據(jù)生物信息學(xué)篩選的這10個關(guān)鍵基因,我們查閱文獻,暫未見于上皮型及混合型UM病理分型之間的報道。
圖2蛋白-蛋白互作網(wǎng)絡(luò)的構(gòu)建和關(guān)鍵基因的篩選及其互作基因分析A:差異基因的蛋白互作網(wǎng)絡(luò),黃色為關(guān)鍵基因;B:通過MCODE插件篩選出的關(guān)鍵基因組件;C:關(guān)鍵基因的協(xié)作基因網(wǎng)絡(luò)。
圖3關(guān)鍵基因的表達高低對UM的總體生存率的影響A-H:FGF13、IFI6、EGFR、MX1、IFIT1、ISG15、OAS1、JUN基因高表達時生存率更低,低表達時生存率更高;I,J:SOX9、SPP1基因高表達時生存率更高,低表達時生存率更低。
綜上,本研究通過生物信息學(xué)方法對不同病理類型(混合型、上皮細胞型)UM的差異基因進行了分析,篩選到了241個差異基因,其中關(guān)鍵基因10個,通過對這些基因的分析,對能夠更好地理解發(fā)病機制,對疾病的治療和預(yù)后評估有一定的意義。本研究不足之處在于沒有在梭型細胞型及上皮型UM之間進行分析,其原因是所查的數(shù)據(jù)中無梭形細胞型UM的數(shù)據(jù)。同時,由于本研究納入的樣本量較小,尚需更大規(guī)模的臨床資料及生物學(xué)實驗研究對結(jié)果進行證實。
利益沖突:所有作者均聲明不存在利益沖突。