曹寶全,朱 洪
(昆明醫(yī)科大學(xué)第二附屬醫(yī)院肝膽胰外科一病區(qū),云南 昆明 650000)
肝癌(liver cancer)屬于消化系統(tǒng)最常見(jiàn)的惡性腫瘤,且每年約有60 萬(wàn)患者死于肝癌[1]。從宏觀上看,肝癌可分為原發(fā)性肝癌和繼發(fā)性肝癌,其中原發(fā)性肝癌的比例為75%~90%[2]。雖然肝部分切除和肝移植治療早期肝癌是有效的[3],但由于在疾病早期,患者的癥狀不易引起重視,導(dǎo)致大多數(shù)患者在就診時(shí)已處于肝癌的中晚期,其5 年生存率通常低于30%[4]。因此,尋找肝癌潛在生物標(biāo)志物,對(duì)提高其診斷、治療和預(yù)后具有重要意義。目前,鑒于現(xiàn)有第二代基因診斷技術(shù)的貢獻(xiàn),通過(guò)微陣列技術(shù)分析肝癌的基因表現(xiàn)譜后,發(fā)現(xiàn)很多基因與肝癌的發(fā)展密切相關(guān)[5]。因此,將基因芯片技術(shù)與生物信息學(xué)方法相結(jié)合,可以篩選出在肝癌發(fā)生發(fā)展中起關(guān)鍵作用的基因。本研究利用GEO 數(shù)據(jù)庫(kù)中不同肝癌樣本的基因表達(dá)數(shù)據(jù),研究肝癌與正常肝組織中差異表達(dá)的基因,現(xiàn)報(bào)道如下。
1.1 數(shù)據(jù)來(lái)源 肝癌基因數(shù)據(jù)集GSE121248 的表達(dá)數(shù)據(jù)來(lái)自于GEO 數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo)[6],其中有37 個(gè)肝臟正常組織樣本和70 個(gè)肝癌組織樣本。
1.2 基因篩選 利用R 軟件分析下載的數(shù)據(jù),設(shè)定|logFC|=1,adj.P=0.05,研究在肝癌組織和正常肝組織中差異表現(xiàn)的基因。
1.3 富集分析 差異基因的功能注釋由DAVID(https://david.ncifcrf.gov/,6.8 版)[7]數(shù)據(jù)庫(kù)分析,包括生物過(guò)程、細(xì)胞成分和分子功能,然后對(duì)這些基因進(jìn)行通路富集分析(keoto enclopedia of genes,KEGG),F(xiàn)DR<0.05 被認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
1.4 蛋白質(zhì)相互作用網(wǎng)絡(luò)的建立及篩選關(guān)鍵基因?qū)⒑Y選出的差異基因上傳到String(https://string-db.org/11.0 版本)中[8],并從該數(shù)據(jù)庫(kù)中選擇“Multiplee proteins”,生物種類(lèi)設(shè)定為“Homo Sapines”,minimum required interaction score 設(shè)定為“highest confidence(0.9)”進(jìn)行分析。將得到的數(shù)據(jù)文件輸入到cytoocape(版本3.7.2)軟件中進(jìn)行可視化。然后,利用軟件中APP:cytohubba 的DMNC 和Degree 算法分別進(jìn)行分析,得到關(guān)鍵基因。兩種算法得到的前10 個(gè)基因取交集后得到的共同基因被認(rèn)為是關(guān)鍵基因。
1.5 生存分析 利用數(shù)據(jù)庫(kù)GEPIA(http://gepia.cancer-pku.cn/,基因表達(dá)譜分析)[9]中肝癌患者的臨床資料,繪制K-M 曲線,P<0.05 被認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
2.1 基因篩選結(jié)果 通過(guò)肝癌數(shù)據(jù)集GSE121248 獲得了531 個(gè)差異表達(dá)基因,共有152 個(gè)高表達(dá)mRNAs 和379 個(gè)低表達(dá)mRNAs,見(jiàn)圖1。
圖1 篩選的差異mRNAs 火山圖
2.2 GO 和KEGG 富集分析 DAVID 數(shù)據(jù)庫(kù)分析顯示,531 差異基因的生物學(xué)功能主要富集在炎癥反應(yīng)、氧化過(guò)程和免疫反應(yīng)中;細(xì)胞成分主要集中在細(xì)胞外區(qū)域,分子功能主要集中在氧化還原酶活性、蛋白質(zhì)同源二聚活性、鐵離子結(jié)合和血紅蛋白結(jié)合;富集的主要途徑是化學(xué)致癌性、代謝和抗生素生物合成,見(jiàn)圖2。
圖2 GO 和KEGG 富集分析
2.3 PPI 蛋白質(zhì)相互作用網(wǎng)絡(luò)的構(gòu)建和關(guān)鍵基因篩選 共得到10 種差異基因,分別為T(mén)TK、KIF4A、NUSAP1、MELK、PTTG1、NEK1、NEK1、NEK2、NEK2、PMPK2、KIKG2、CEA2、CEF2、CDK1、CCNB1、CDC20、CCNA2、BUB1B、DLP5、KIF1A、TPX2、KIF20A。在網(wǎng)站上(http://bioinformaticas.psb.gnt.be/webtools/Venn/)制作韋恩圖后,共同的差異基因只有KIF20A,見(jiàn)圖3。
圖3 關(guān)鍵基因篩選
2.4 生存分析 為了進(jìn)一步驗(yàn)證關(guān)鍵基因KIF20A 是否與肝癌的預(yù)后密切相關(guān),利用Gepia 數(shù)據(jù)庫(kù)繪制了肝癌的生存分析曲線,及其在肝癌組織和正常肝組織中的表達(dá),結(jié)果顯示KIF20A 的表達(dá)與肝癌患者的預(yù)后相關(guān),且低表達(dá)與高生存率呈正相關(guān)(P<0.05)。根據(jù)表達(dá)的箱式圖分析結(jié)果,其在肝癌組織的表達(dá)量遠(yuǎn)高于肝臟的正常組織(P<0.05),見(jiàn)圖4。
圖4 GEPIA 數(shù)據(jù)庫(kù)分析結(jié)果
KIF20A(驅(qū)動(dòng)蛋白家族成員20A)是驅(qū)動(dòng)蛋白-6 亞家族成員[10],其表達(dá)水平與癌癥的發(fā)生發(fā)展密切相關(guān)[11]。據(jù)報(bào)道[12,13],KIF20A 可促進(jìn)膀胱癌細(xì)胞的增殖和轉(zhuǎn)移,通過(guò)激活JAK/STAT3 通路促進(jìn)結(jié)腸癌的發(fā)生和發(fā)展。KIF20A 也是不同類(lèi)型乳腺癌的治療靶標(biāo)和預(yù)后生物標(biāo)志物[14],是治療卵巢癌的藥物靶點(diǎn)[15];同時(shí),其可以抑制非小細(xì)胞肺癌細(xì)胞的增殖和遠(yuǎn)處轉(zhuǎn)移,促進(jìn)胃癌的增殖[16]。本研究旨在探討KIF20A 對(duì)肝癌患者預(yù)后的影響,為肝癌靶向基因治療提供理論依據(jù)。
本研究分析了GEO 數(shù)據(jù)庫(kù)的肝癌數(shù)據(jù)集GSE12248 的70 個(gè)肝癌組織樣本和37 個(gè)正常肝組織樣本中的基因表達(dá)數(shù)據(jù),得到了531 個(gè)差異的mRNAs,其中發(fā)揮上調(diào)作用的有152 個(gè),下調(diào)作用的有379 個(gè)。GO 富集分析表明,這些差異表達(dá)基因主要通過(guò)代謝途徑和化學(xué)致癌作用影響細(xì)胞外氧化還原酶活性、免疫反應(yīng)、炎癥反應(yīng)、血紅素結(jié)合和鐵結(jié)合。同時(shí),為了進(jìn)一步篩選出在肝癌發(fā)生發(fā)展中起關(guān)鍵作用的mRNAs,將這531 個(gè)差異基因上傳到String 數(shù)據(jù)庫(kù),構(gòu)建由531 個(gè)點(diǎn)和935 條邊組成的蛋白質(zhì)相互作用網(wǎng)絡(luò),然后將結(jié)果輸入到Cytoscape中進(jìn)行可視化,前10 個(gè)關(guān)鍵基因分別通過(guò)DMNC和Degree 算法得到。經(jīng)過(guò)取交集,結(jié)果發(fā)現(xiàn)只有KIF20A 是肝癌發(fā)生發(fā)展的關(guān)鍵基因。為了進(jìn)一步探討KIF20A 與肝癌預(yù)后的關(guān)系,本研究利用GEPIA數(shù)據(jù)庫(kù)中肝癌患者的臨床資料,繪制了其在肝癌組織和正常肝組織中表達(dá)的箱式圖和K-M 生存曲線,結(jié)果表明KIF20A 在肝癌組織中高表達(dá),其表達(dá)水平與肝癌患者的預(yù)后密切相關(guān)(P<0.05),提示KIF20A 的表達(dá)量越低,肝癌患者的預(yù)后越好,生存時(shí)間越長(zhǎng)。本研究還存在一些不足:①本研究的結(jié)果沒(méi)有得到進(jìn)一步細(xì)胞實(shí)驗(yàn)的驗(yàn)證;②雖然本研究中使用的肝癌數(shù)據(jù)集樣本量不小,但只有一個(gè)數(shù)據(jù)集,尚需要更多的樣本研究結(jié)果來(lái)進(jìn)一步證實(shí)這一結(jié)果;③肝癌的發(fā)生和發(fā)展通常是由多種因素影響,本研究未進(jìn)行單因素分析和多因素分析,只從基因表達(dá)的水平上對(duì)肝癌的發(fā)展做研究。
總之,KIF20A 是該調(diào)控網(wǎng)絡(luò)的核心基因,在肝癌的發(fā)生發(fā)展中起著重要作用,其高表達(dá)與患者生存率低有關(guān),是判斷肝癌預(yù)后的可靠生物標(biāo)志物,可作為肝癌患者藥物治療的靶點(diǎn)。