于 珍, 吳 靜, 張 磊, 劉樹(shù)業(yè)
于珍, 吳靜, 張磊, 劉樹(shù)業(yè), 天津市第三中心醫(yī)院檢驗(yàn)科, 天津市重癥疾病體外生命支持重點(diǎn)實(shí)驗(yàn)室, 天津市人工細(xì)胞工程技術(shù)研究中心, 天津市肝膽疾病研究所 天津市 300170
于珍, 博士, 主要從事消化系統(tǒng)腫瘤的靶向治療研究.
膽管癌是一種異質(zhì)程度極高的惡性腫瘤, 多原發(fā)于膽管上皮細(xì)胞. 其發(fā)病率逐年增加, 患者5年生存率較低, 小于10%. 膽管癌侵襲性強(qiáng), 其發(fā)生可能與膽汁淤積、感染及炎癥相關(guān), 但具體的分子發(fā)病機(jī)制尚不完全清楚. 膽管癌的早期癥狀隱匿, 不易發(fā)現(xiàn), 多數(shù)患者確診時(shí)已是晚期. 對(duì)于晚期膽管癌患者而言, 治療方法有限, 預(yù)后較差. 使用標(biāo)準(zhǔn)化療方案(吉西他濱和順鉑)治療的患者中位總生存期仍不到1年. 靶向治療可有助于改善晚期腫瘤患者的治療效果, 提高患者生活質(zhì)量, 因而獲得廣泛關(guān)注. 而目前, 用于膽管癌的靶向分子療法尚未見(jiàn)批準(zhǔn). 開(kāi)發(fā)有前景的分子靶點(diǎn), 對(duì)于提高膽管癌靶向治療的應(yīng)用前景至關(guān)重要.隨著高通量測(cè)序技術(shù)的不斷完善和發(fā)展, 利用生物信息學(xué)技術(shù)挖掘膽管癌基因組潛在分子靶點(diǎn)成為可能. 本研究中, 我們利用基因表達(dá)綜合(gene expression omnibus, GEO)數(shù)據(jù)庫(kù)中的2組膽管癌表達(dá)譜芯片數(shù)據(jù)進(jìn)行一系列生物信息學(xué)分析, 獲得膽管癌與正常組織的差異表達(dá)基因, 探討樞紐基因在膽管癌發(fā)生發(fā)展中的作用, 為膽管癌的靶向治療提供潛在分子靶點(diǎn).
圖 1 差異基因火山圖. A: GSE26566差異基因火山圖; B: GSE45001差異基因火山圖.
1.1 材料 膽管癌數(shù)據(jù)集來(lái)源于GEO數(shù)據(jù)庫(kù), 編號(hào)分別為GSE26566和GSE45001. GSE26566包含104例膽管癌組織樣本和6例正常膽管組織樣本. GSE45001包括10個(gè)膽管癌組織樣本和10例非腫瘤組織樣本.
1.2 方法
1.2.1 差異表達(dá)基因篩選: 2組原始數(shù)據(jù)集采用GEO2R (http://www.ncbi.nlm.nih.gov/geo/geo2r/)在線分析工具進(jìn)行數(shù)據(jù)處理, 處理后數(shù)據(jù)進(jìn)行差異基因篩選. 調(diào)整后的P值(adj.P)<0.05和|logFC|>1.5作為納入標(biāo)準(zhǔn). 運(yùn)用SangerBox在線軟件作火山圖. 用Venny 2.1.0對(duì)上述2個(gè)數(shù)據(jù)集的差異基因繪制Venn圖取交集.
1.2.2 差異基因功能分析: 使用DAVID(http://david.ncifcrf.gov)在線分析對(duì)篩選出來(lái)的158個(gè)差異基因進(jìn)行GO富集分析, 包括生物學(xué)過(guò)程(biological process, BP)、細(xì)胞組分和定位(cellular component, CC)以及分子功能(molecular function, MF), 同時(shí)進(jìn)行KEGG信號(hào)通路分析.設(shè)置<0.05.
1.2.3 蛋白質(zhì)互作網(wǎng)絡(luò)與樞紐基因分析: 使用STRING 11.5數(shù)據(jù)庫(kù)(https://sring-db.org/)預(yù)測(cè)膽管癌差異基因編碼蛋白間的蛋白質(zhì)互作網(wǎng)絡(luò)(protein protein interaction network, PPI). 通過(guò)Cytoscape 3.7.0軟件MCODE插件獲得PPI中最顯著的核心模塊, 設(shè)置參數(shù)degree cutoff = 2、node score cutoff = 0.2、k-score = 2及max.depth = 100.利用CytoHubba插件Degree算法篩選出核心模塊中前10位有較高連接度的樞紐基因.
1.2.4 樞紐基因表達(dá)驗(yàn)證: 使用GEPIA數(shù)據(jù)庫(kù)(https://gepia.cancer-pku.cn/)對(duì)樞紐基因的mRNA在膽管癌組織及正常組織中實(shí)際表達(dá)水平進(jìn)行驗(yàn)證.
采用Wilcoxon檢驗(yàn)分析膽管癌組織和正常組表達(dá)數(shù)據(jù).<0.05差異有統(tǒng)計(jì)學(xué)意義.
2.1 差異表達(dá)基因篩選結(jié)果 經(jīng)GEO2R分析, 分別從數(shù)據(jù)集GSE26566和GSE45001中提取到差異基因433個(gè)和1660個(gè), 繪制火山圖(圖1), 其中綠色為下調(diào)基因、紅色為上調(diào)基因. 取2個(gè)數(shù)據(jù)集差異表達(dá)基因的交集, 制作Venn圖(圖2), 得到相同差異表達(dá)基因158個(gè), 其中上調(diào)基因53個(gè), 下調(diào)基因105個(gè).
2.2 差異基因GO分析和KEGG分析 GO富集分析結(jié)果顯示這些差異基因主要參與細(xì)胞對(duì)鋅離子反應(yīng)、增長(zhǎng)的負(fù)調(diào)控, 并且參與細(xì)胞粘附、代謝以及蛋白質(zhì)聚合等生物過(guò)程; 主要細(xì)胞成分位于外泌體、胞外區(qū)、彈性纖維、細(xì)胞器膜基質(zhì)及細(xì)胞外基質(zhì); 主要分子功能與結(jié)合肝素、半胱氨酸型內(nèi)肽酶抑制劑活性、蛋白質(zhì)同源二聚化、受體結(jié)合及磷酸吡哆醛結(jié)合等相關(guān)(表1). KEGG信號(hào)通路分析顯示, 這些差異基因主要參與礦物質(zhì)吸收、碳代謝、丙酸代謝、代謝途徑、PPAR信號(hào)通路、脂肪酸降解、細(xì)胞色素P450對(duì)異生物質(zhì)的代謝、化學(xué)致癌、ECM-受體相互作用和糖酵解/糖異生等通路(表2).
表 1 膽管癌差異基因的GO富集分析
條目 通路 基因數(shù) P值hsa04978 礦物質(zhì)吸收 7 2.01E-05 hsa01200 碳代謝 9 1.05E-04 hsa00640 丙酸代謝 5 4.41E-04 hsa01100 代謝途徑 30 5.77E-04 hsa03320 PPAR信號(hào)通路 6 0.001749 hsa00071 脂肪酸降解 5 0.002098 hsa00980 細(xì)胞色素P450對(duì)異生素的代謝 6 0.002715 hsa05204 化學(xué)致癌 6 0.003812 hsa04512 ECM-受體相互作用 6 0.005455 hsa00010 糖酵解/糖異生 5 0.01122
圖 2 GSE26566和GSE45001差異基因Venn圖.
2.3 蛋白互作網(wǎng)絡(luò)與樞紐基因分析 除去游離的蛋白節(jié)點(diǎn), 共有130個(gè)蛋白質(zhì)節(jié)點(diǎn)連接形成382條復(fù)雜的PPI網(wǎng)絡(luò)(圖3).最顯著模塊由17個(gè)重要節(jié)點(diǎn)及127條邊的網(wǎng)絡(luò)構(gòu)成(圖4). 通過(guò)Cytohubba插件Degree算法確認(rèn)樞紐基因, 結(jié)果如圖5, 顯示樞紐基因分別為NUSAP1, TOP2A, RAD51AP1, MCM4, KIAA0101, CDCA5, TYMS, ZWINT, 皆為上調(diào)基因.
2.4 樞紐基因轉(zhuǎn)錄表達(dá)水平驗(yàn)證 通過(guò)GEPIA數(shù)據(jù)庫(kù)驗(yàn)證8個(gè)樞紐基因mRNA的表達(dá)水平. 如圖6所示, 膽管癌組織中NUSAP1, TOP2A, RAD51AP1, MCM4, KIAA0101, CDCA5, TYMS和ZWINT的表達(dá)較正常組織均顯著增加.
膽管癌是僅次于肝細(xì)胞癌的第二大常見(jiàn)肝臟原發(fā)性惡性腫瘤, 也是膽道最常見(jiàn)的惡性腫瘤, 根據(jù)解剖位置可分為肝內(nèi)膽管癌、肝門(mén)周?chē)懝馨┖瓦h(yuǎn)端膽管癌. 膽管癌發(fā)病早期癥狀隱匿, 晚期惡性程度高, 預(yù)后差, 所以尋找有助于治療膽管癌的分子靶點(diǎn)至關(guān)重要.
圖 3 共同差異基因的蛋白質(zhì)互作網(wǎng)絡(luò)圖.
圖 4 蛋白質(zhì)互作網(wǎng)絡(luò)圖中的核心網(wǎng)絡(luò)圖.
本研究中, 我們使用GEO2R分析了GEO數(shù)據(jù)庫(kù)GSE26566和GSE45001兩組數(shù)據(jù)集.獲得差異基因158個(gè), 其中上調(diào)基因53個(gè), 下調(diào)基因105個(gè). 通過(guò)DAVID在線工具對(duì)共同差異基因做GO富集分析, 結(jié)果顯示差異基因主要參與細(xì)胞對(duì)鋅離子反應(yīng)、細(xì)胞增殖的調(diào)控及細(xì)胞粘附、代謝等生物過(guò)程, 富集于外泌體、胞外區(qū)、彈性纖維等區(qū)域, 主要分子功能與結(jié)合肝素、半胱氨酸型內(nèi)肽酶抑制劑活性、蛋白質(zhì)同源二聚化、受體結(jié)合及磷酸吡哆醛結(jié)合等相關(guān). KEGG信號(hào)通路分析表明, 差異基因主要參與礦物質(zhì)吸收、代謝、PPAR信號(hào)通路及脂肪酸降解等過(guò)程.
圖 5 樞紐基因模塊.
經(jīng)Cytoscape軟件篩選, 本研究共得到8個(gè)樞紐基因, 分別是NUSAP1, TOP2A, RAD51AP1, MCM4, KIAA0101, CDCA5, TYMS, ZWINT, 皆為上調(diào)基因. 經(jīng)驗(yàn)證, 這8個(gè)樞紐基因在膽管癌組織中的表達(dá)較正常組織高. NUSAP1編碼核仁和紡錘體相關(guān)蛋白, 參與調(diào)節(jié)紡錘體的組裝和維持正常的胞質(zhì)分裂, 因此是細(xì)胞有絲分裂和增殖的重要調(diào)節(jié)因子. 研究發(fā)現(xiàn), NUSAP1在多種腫瘤中存在過(guò)表達(dá), 包括肝癌、肺腺癌和腎細(xì)胞癌. 另外, NUSAP1的上調(diào)與黑色素瘤和口腔鱗狀細(xì)胞癌的惡性進(jìn)展有關(guān). 因此, NUSAP1可能是一個(gè)潛在的治療靶點(diǎn).DNA拓?fù)洚悩?gòu)酶Ⅱ-α(TOP2A)基因參與調(diào)節(jié)核酸空間結(jié)構(gòu)的動(dòng)態(tài)變化, 其表達(dá)與腫瘤侵襲、復(fù)發(fā)以及不同癌癥的預(yù)后相關(guān), 包括乳腺癌、睪丸畸胎瘤、膀胱移行細(xì)胞癌、腦膜瘤、神經(jīng)膠質(zhì)瘤、肝癌和子宮內(nèi)膜癌. RAD51AP1(RAD51-associated protein 1)基因編碼一種DNA結(jié)合蛋白, 在RAD51介導(dǎo)的同源重組中至關(guān)重要. Obama等研究表明, RAD51AP1參與肝內(nèi)膽管癌的細(xì)胞增殖和DNA修復(fù), 其沉默有助于抑制膽管癌細(xì)胞的生長(zhǎng). MCM4是微染色體維持蛋白家族的成員之一, 具有復(fù)制解旋酶活性, 參與DNA復(fù)制和DNA解旋. 有研究顯示, MCM4的高表達(dá)會(huì)增加多種腫瘤發(fā)病風(fēng)險(xiǎn), 如肝癌、食管癌、乳腺癌等. KIAA0101編碼一種保守的增殖細(xì)胞核抗原結(jié)合蛋白, 與DNA聚合酶競(jìng)爭(zhēng)結(jié)合以調(diào)節(jié)DNA復(fù)制和損傷修復(fù). 據(jù)報(bào)道, KIAA0101基因在乳腺癌和非小細(xì)胞肺癌組織中存在表達(dá)上調(diào), 敲低KIAA0101基因可抑制乳腺癌細(xì)胞的生長(zhǎng), 另外KIAA0101高表達(dá)也與非小細(xì)胞肺癌患者術(shù)后復(fù)發(fā)相關(guān). 細(xì)胞分裂周期相關(guān)蛋白5(CDCA5), 也稱(chēng)為Sororin, 在確保姐妹染色單體的準(zhǔn)確分離方面發(fā)揮著關(guān)鍵作用. 最近的研究表明, CDCA5的高表達(dá)與多種癌癥的腫瘤發(fā)生和組織侵襲相關(guān), 包括口腔鱗狀細(xì)胞癌、非小細(xì)胞肺癌、尿路上皮細(xì)胞癌和胃癌. TYMS編碼胸苷酸合酶, 通過(guò)催化dUMP的甲基化產(chǎn)生dTMP, 在DNA復(fù)制中發(fā)揮重要作用. TYMS的高表達(dá)與許多實(shí)體瘤的發(fā)生存在關(guān)聯(lián), 包括肺癌、乳腺癌、胃癌、結(jié)腸直腸癌和腎細(xì)胞癌等. ZWINT編碼一種調(diào)控著絲點(diǎn)分裂的動(dòng)粒蛋白, 在維持有絲分裂周期過(guò)程中起著至關(guān)重要的作用. 越來(lái)越多的證據(jù)表明, ZWINT 在許多人類(lèi)癌癥中通常高度表達(dá), 并且與預(yù)后不良和早期復(fù)發(fā)有關(guān).
圖 6 樞紐基因在腫瘤組織和正常組織中的表達(dá)驗(yàn)證.
本研究通過(guò)生物信息學(xué)方法從膽管癌組織中篩選出8個(gè)樞紐基因, 與正常組織相比, NUSAP1, TOP2A, RAD51AP1, MCM4, KIAA0101, CDCA5, TYMS, ZWINT在膽管癌中的表達(dá)均上調(diào). 結(jié)果提示, 這8個(gè)樞紐基因可能在膽管癌的發(fā)生發(fā)展中起到關(guān)鍵作用, 為膽管癌的靶向治療提供了理論基礎(chǔ), 但這些基因在膽管癌中的具體機(jī)制和作用仍需要進(jìn)一步實(shí)驗(yàn)驗(yàn)證.
文章亮點(diǎn)
膽管癌是膽道常見(jiàn)的惡性腫瘤, 預(yù)后不佳. 靶向治療是改善膽管癌治療效果的重要手段, 探索新的分子靶點(diǎn)對(duì)于膽管癌靶向治療的研究十分必要.
尋找影響膽管癌發(fā)生和進(jìn)展的樞紐基因?qū)τ陂_(kāi)發(fā)膽管癌靶向治療的靶點(diǎn)具有重要意義.
通過(guò)生物信息學(xué)方法探索膽管癌靶向治療的潛在分子靶點(diǎn).
利用GEO數(shù)據(jù)庫(kù)分析2組膽管癌數(shù)據(jù)集, 得到共同差異表達(dá)基因. 通過(guò)GO富集分析與KEGG通路分析共同差異基因主要參與的生物學(xué)過(guò)程與信號(hào)通路. 基于String數(shù)據(jù)庫(kù)構(gòu)建蛋白質(zhì)互作網(wǎng)絡(luò)圖, 經(jīng)過(guò)Cytoscape軟件篩選樞紐基因, 通過(guò)GEPIA數(shù)據(jù)庫(kù)驗(yàn)證樞紐基因在膽管癌與正常組織中的表達(dá)量.
2組膽管癌數(shù)據(jù)集共包含158個(gè)共同差異表達(dá)基因. GO富集分析及KEGG通路分析結(jié)果顯示, 差異基因主要參與細(xì)胞對(duì)鋅離子反應(yīng), 細(xì)胞增殖與粘附等生物學(xué)過(guò)程, 涉及礦物質(zhì)吸收、代謝、PPAR信號(hào)通路及脂肪酸降解等信號(hào)通路. 最終篩選得到了8個(gè)上調(diào)的樞紐基因, 在膽管癌組織中表達(dá)量顯著高于正常組織.
本研究通過(guò)生物信息學(xué)方法獲得了與膽管癌發(fā)生與進(jìn)展息息相關(guān)的8個(gè)樞紐基因, 分別為NUSAP1, TOP2A, RAD51AP1, MCM4, KIAA0101, CDCA5, TYMS, ZWINT, 可能為膽管癌靶向治療的潛在分子靶點(diǎn).
這8個(gè)樞紐基因?qū)δ懝馨┑挠绊懞蜋C(jī)制需進(jìn)一步通過(guò)實(shí)驗(yàn)驗(yàn)證, 有望為膽管癌靶向治療分子靶點(diǎn)的開(kāi)發(fā)提供新思路.