国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于TCGA數(shù)據(jù)庫(kù)分析肝細(xì)胞癌組織UCK2、PRIM1和DNTM1基因水平對(duì)患者預(yù)后的影響*

2021-09-22 14:55盧秉久
實(shí)用肝臟病雜志 2021年5期
關(guān)鍵詞:差異基因生存率繪制

趙 藝,盧秉久

肝細(xì)胞癌(hepatocellular carcinoma,HCC)的發(fā)生是一個(gè)多因素作用的過程,早期臨床缺乏特殊癥狀,腫瘤具有侵襲性,可能發(fā)生轉(zhuǎn)移,患者就診時(shí)多已發(fā)展到晚期[1,2]?,F(xiàn)階段,治療HCC的方法有多種,其中應(yīng)用較多的包括肝移植、腫瘤切除、栓塞化療、消融等,但這些治療方法的療效不一,患者預(yù)后差。因此,從遺傳學(xué)角度研究HCC發(fā)病的分子機(jī)制,尋找新的腫瘤標(biāo)志物,有助于早期診斷、高精準(zhǔn)度的靶向治療和預(yù)防性治療[3-5]。研究肝癌的發(fā)病原因及分子機(jī)制一直是研究者們努力的方向。研究揭示了肝癌發(fā)病的分子機(jī)制及其與病理學(xué)特征之間的緊密聯(lián)系,他們發(fā)現(xiàn)有PRAF2和GRB2等多種類型的基因突變導(dǎo)致了HCC的發(fā)生[6,7],同時(shí)也有學(xué)者基于基因組學(xué)研究,利用癌癥基因圖譜(The Cancer Genome Atlas,TCGA)和基因水平綜合數(shù)據(jù)庫(kù)(Gene Expression Omnibus, GEO)等數(shù)據(jù)庫(kù)對(duì)HCC的關(guān)鍵基因組變化進(jìn)行了研究[8-10],通過對(duì)TCGA數(shù)據(jù)庫(kù)的挖掘,可以發(fā)現(xiàn)多種HCC致癌基因和抑癌基因,這些基因與HCC的發(fā)生發(fā)展及預(yù)后關(guān)系密切,利用這些數(shù)據(jù)庫(kù)可開展基因組學(xué)相關(guān)研究。本文通過對(duì)TCGA數(shù)據(jù)庫(kù)中HCC癌組織和癌旁組織進(jìn)行基因富集分析(gene set enrichment analysis, GSEA)及對(duì)京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes, KEGG)的通路注釋和富集分析,篩選出HCC組織差異水平密切相關(guān)的DNTM1、PRIM1和UCK2基因,以探討這三種基因?qū)CC的早期診斷和臨床治療提供支持的價(jià)值。

1 資料與方法

1.1 數(shù)據(jù)采集 打開TCGA (https://cancergenome.nih.gov/)數(shù)據(jù)庫(kù),自《癌癥基因組圖集-肝細(xì)胞癌數(shù)據(jù)集》(TCGA-LIHC)收集基因數(shù)據(jù)和臨床數(shù)據(jù)。 從TCGA數(shù)據(jù)庫(kù)中提取HCC癌組織和癌旁組織DNTM1、PRIM1和UCK2 水平的有關(guān)資料,得到癌和癌旁組織的測(cè)序數(shù)據(jù),由MD Anderson Cancer Center對(duì)所有數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化預(yù)處理。同時(shí),下載患者的臨床資料,其中臨床數(shù)據(jù)為L(zhǎng)evel 3 等級(jí)。在TCGA 數(shù)據(jù)庫(kù)中設(shè)定的檢索條件如下:①Cases選項(xiàng),Primary Site: Liver;其余選項(xiàng)以系統(tǒng)默認(rèn)的設(shè)置;②Files 選項(xiàng),Data Category: Transcriptome Profiling,Biospecimen,Clinical;Data Type: Gene Expression Quantification,Biospecimen Supplement,Clinical Supplement; Experimental Strategy: RNA - Seq;Work flow type: HTSeq - Counts,其余選項(xiàng)以系統(tǒng)默認(rèn)的設(shè)置。篩選得到424例有效數(shù)據(jù)文件,其中HCC組織數(shù)據(jù)374 例,癌旁組織數(shù)據(jù)50例。隨后,通過R軟件( https: / /www.r-project.org /) 對(duì)所下載的數(shù)據(jù)進(jìn)行整理,篩選數(shù)據(jù)庫(kù),進(jìn)行臨床病理學(xué)參數(shù)分類,尋找相關(guān)的差異基因,并繪制火山圖和熱圖。

1.2 基因的篩選和生存分析繪制 將差異基因通過除異均值化M值法( trimmed mean of M values,TMM) 對(duì)基因水平進(jìn)行標(biāo)準(zhǔn)化處理,應(yīng)用edgeR包篩選差異基因,采用錯(cuò)誤發(fā)現(xiàn)率 ( false discovery rate,F(xiàn)DR) 對(duì)基因的顯著性進(jìn)行校正。差異水平基因的截?cái)帱c(diǎn)(cut-off value)設(shè)定為: fdr=0.05 ,lgFC=1。應(yīng)用單因素COX分析發(fā)現(xiàn)差異基因?qū)Ω伟┗颊哳A(yù)后的影響,并繪制生存曲線。以基因水平的中位數(shù)為分界,定義HCC組織DNTM1、PRIM1和UCK2基因水平的高低,據(jù)此將樣本分為低水平組和高水平組,同時(shí)繪制Kaplan-Meier曲線。

1.3 統(tǒng)計(jì)學(xué)方法 應(yīng)用R3.5.2軟件進(jìn)行統(tǒng)計(jì)學(xué)分析和相應(yīng)圖形的繪制,應(yīng)用Survival包進(jìn)行單因素和多因素Cox比例回歸模型的篩選,并建立多基因預(yù)后模型。應(yīng)用 Survival ROC包繪制ROC曲線,并計(jì)算曲線下面積(AUC),判斷Cox回歸模型預(yù)測(cè)HCC患者5 a生存率的準(zhǔn)確性。

1.4 差異基因的富集分析 根據(jù)基因水平將患者分成低水平組和高水平組,對(duì)兩組樣品行GSEA富集分析。我們選擇基因集“c2.cp.kegg.v6.2.symbols.gmt”行KEGG富集分析,得到KEGG富集分析結(jié)果。

2 結(jié)果

2.1 差異基因的篩選 在TCGA-LIHC數(shù)據(jù)庫(kù),收集374例HCC組織和50例癌旁組織所對(duì)應(yīng)的臨床和病理學(xué)參數(shù)。同時(shí)對(duì)檢索到的153個(gè)HCC相關(guān)的差異基因 (其中51個(gè)水平下調(diào),102個(gè)水平上調(diào))進(jìn)行了分析,應(yīng)用R軟件的edgeR軟件包研究上述差異基因。對(duì)滿足以下條件:即篩選fdr=0.05和lgFC=1者,根據(jù)篩選結(jié)果繪制火山圖(圖1),圖中紅色數(shù)據(jù)點(diǎn)為滿足篩選條件得到的HCC相關(guān)的差異基因,并對(duì)這些基因進(jìn)行生存分析。

圖1 差異水平基因火山圖橫坐標(biāo)是-lg(P value),縱坐標(biāo)是lgFC;綠色代表下調(diào)基因,紅色代表上調(diào)基因

2.2 生存分析 應(yīng)用R軟件的 Survival軟件包對(duì)生存行單因素COX分析,對(duì)篩選得到的差異基因進(jìn)行生存分析。根據(jù)生存率指標(biāo)風(fēng)險(xiǎn)比值(hazard ratio, Hr),繪制得出森林圖(forest plot,圖2)。除了CYP2C9基因人群生存率降低外,其他基因人群生存率不受影響(Hr>1)。對(duì)單因素分析得到的影響預(yù)后的相關(guān)基因進(jìn)行多因素逐步回歸,以風(fēng)險(xiǎn)值=∑(基因系數(shù)×基因水平)構(gòu)建風(fēng)險(xiǎn)模型,將基因水平的中位數(shù)值設(shè)為閾值,根據(jù)此閾值將患者劃分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,根據(jù)高低風(fēng)險(xiǎn)值繪制Kaplan-Meier曲線,結(jié)果高風(fēng)險(xiǎn)組HCC患者總體生存率顯著低于低風(fēng)險(xiǎn)組患者(圖3)。

圖2 生存率相關(guān)的基因森林圖P<0.001為顯著性差異

圖3 HCC患者K-M生存曲線橫坐標(biāo)是生存時(shí)間,縱坐標(biāo)是生存率。根據(jù)基因水平的中位值,將患者分為高低兩組。紅色代表基因高水平組,藍(lán)色代表低水平組P<0.001為顯著性差異

2.3 診斷性ROC曲線情況 根據(jù)生存分析的結(jié)果,繪制ROC曲線,基于多因素COX回歸模型預(yù)測(cè)的HCC患者預(yù)后風(fēng)險(xiǎn)因素,其AUC = 0.649,大于其他臨床因素的AUC值,進(jìn)一步確認(rèn)了多因素 Cox回歸模型預(yù)測(cè)HCC患者預(yù)后風(fēng)險(xiǎn)的可信性,可以為肝癌患者進(jìn)行個(gè)性化治療提供參考,從而降低患者病死率,改善預(yù)后(圖4)。

圖4 多因素Cox模型分析的針對(duì)性ROC曲線

2.4 對(duì)差異基因進(jìn)行GSEA富集分析的結(jié)果 通過前述研究篩選出的顯著水平性基因DNTM1、PRIM1和UCK2,進(jìn)行GSEA富集分析。GSEA顯示了許多顯著豐富的信號(hào)通路,進(jìn)一步證明了上述基因與HCC發(fā)生及與患者預(yù)后的顯著性關(guān)系,從而揭示了HCC組織DNTM1、PRIM1和UCK2基因水平對(duì)生存的影響(圖5)。

圖5 GSEA富集分析結(jié)果圖形的上半部分是ES值富集的過程,圖形的下半部分是基因在每個(gè)功能的分布情況。在圖形中,不同的顏色代表不同的功能

3 討論

癌癥基因圖譜(TCGA)數(shù)據(jù)庫(kù)容納了比較全面的基因測(cè)序數(shù)據(jù)。在美國(guó)政府的支持下,國(guó)家癌癥研究所和人類基因組研究所聯(lián)合創(chuàng)建了該數(shù)據(jù)庫(kù)。在數(shù)據(jù)庫(kù)中除了包含大量腫瘤基因數(shù)據(jù)外,還有眾多多維度的基因組變化的圖譜。庫(kù)中數(shù)據(jù)涉及到一萬(wàn)多名患者的病變組織和正常組織信息,其中病變組織的類型有三十多種,包括 10種罕見腫瘤類型。該數(shù)據(jù)庫(kù)收集的數(shù)據(jù)很豐富,包括miRNA 序列、mRNA 序列、基因水平和DNA 甲基化相關(guān)數(shù)據(jù)等[11,12]。

中國(guó)的肝癌發(fā)病率居于全球的前列。近年來,高通量測(cè)序技術(shù)的發(fā)展在揭示癌癥發(fā)生發(fā)展過程中基因的異常水平和識(shí)別與癌癥診斷和預(yù)后相關(guān)的生物標(biāo)記物方面起到了至關(guān)重要的作用[13,14]。本研究通過篩選 GSE10186 基因芯片得到差異基因153個(gè),其中上調(diào)基因102個(gè),下調(diào)基因51個(gè)。其中促癌基因 UCK2、DNTM1和PRIM1在GSE10186 芯片癌組織中呈現(xiàn)高水平,表明UCK2、PRIM1和DNTM1基因具有促進(jìn)癌變的作用。抑癌基因CYP2C9在GSE10186 芯片癌組織中呈現(xiàn)低水平,表明CYP2C9基因?qū)Ω伟┯幸种谱饔谩T趯?duì) 89個(gè)差異水平基因進(jìn)行單因素Cox回歸分析篩選出與肝癌患者預(yù)后顯著相關(guān)的基因,在對(duì)374例肝癌患者進(jìn)行風(fēng)險(xiǎn)比值的評(píng)分后,將患者劃分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組并進(jìn)行 Kaplan-Meier 生存分析,結(jié)果表明高風(fēng)險(xiǎn)組肝癌患者總體生存率顯著低于低風(fēng)險(xiǎn)組患者。ROC曲線確認(rèn)了基于多因素COX回歸模型預(yù)測(cè)肝癌患者預(yù)后風(fēng)險(xiǎn)的可信性,可以為肝癌患者進(jìn)行個(gè)性化治療提供參考,從而降低患者的病死率,改善預(yù)后。

迄今為止,已鑒定出三種人尿苷胞苷激酶基因,包括UCK1、UCKL1和UCK2,其中UCK1和UCK2共有約70%的序列同一性[15-16]。UCK1在多種正常人體組織中均有存在,如骨骼肌、心臟、肝臟和腎臟,而UCK2僅在正常人胎盤和睪丸中檢測(cè)到,但其在胰腺腫瘤組織、結(jié)直腸癌組織、神經(jīng)母細(xì)胞瘤和乳腺癌組織上調(diào)[17,18]。因此,UCK2被認(rèn)為是癌癥預(yù)后的生物標(biāo)志物。肝癌組織UCKL1和UCK2水平比鄰近肝組織高,推斷UCK2上調(diào)可能是肝癌的一個(gè)有價(jià)值的預(yù)后指標(biāo)[19]。

DNMT1是哺乳動(dòng)物基因組表觀遺傳修飾中DNA甲基化的關(guān)鍵基因,其編碼的蛋白是一種分子量大且功能復(fù)雜的酶,具有多種調(diào)控功能,參與機(jī)體發(fā)育過程中干細(xì)胞生長(zhǎng)、細(xì)胞增殖、器官發(fā)育、衰老和腫瘤發(fā)生等多個(gè)生物學(xué)過程[20]。學(xué)者在實(shí)驗(yàn)中發(fā)現(xiàn)DNMT1蛋白的高水平能有效預(yù)測(cè)早期胃腸道癌和嚴(yán)重癌前病變,具有潛在的臨床應(yīng)用價(jià)值。DNA在真核細(xì)胞中的復(fù)制是由一個(gè)復(fù)雜的染色體復(fù)制裝置完成的,其中DNA聚合酶α和DNA引物酶是兩個(gè)關(guān)鍵的酶活性成分。DNA引物酶含有PRIM1和PRIM2,前者攜帶有酶和引物,因此具有催化和延伸功能;后者則缺乏酶的活性。DNA在合成過程中,PRIM1 mRNA水平與DNA的復(fù)制進(jìn)程存在著密切的相關(guān)性。在沒有PRIM1酶的情況下,DNA的復(fù)制也難以進(jìn)行,故而此種物質(zhì)對(duì)細(xì)胞增殖具有促進(jìn)作用。目前,該領(lǐng)域的研究在不斷增多,一些報(bào)道中已經(jīng)出現(xiàn)PRIM1基因在不同腫瘤細(xì)胞中作用的相關(guān)內(nèi)容。

根據(jù)TCGA數(shù)據(jù)分析結(jié)果顯示,在肝癌形成過程中,我們發(fā)現(xiàn)了與其密切相關(guān)的信號(hào)通路,確定了UCK2、PRIM1和DNTM1這3個(gè)基因水平與肝癌的相關(guān)性,可作為預(yù)測(cè)肝癌患者預(yù)后的指標(biāo),為肝癌的理論研究和治療提供一定的參考。然而,本文也存在一定的局限性,研究?jī)H基于生物信息學(xué)分析,以后應(yīng)該同時(shí)開展一些臨床和實(shí)驗(yàn)研究,從而證實(shí)這些指標(biāo)的應(yīng)用價(jià)值,為肝癌的診治提供支持。

猜你喜歡
差異基因生存率繪制
Painting ski maps 繪制滑雪地圖
繪制童話
『5年生存率』啥意思
“五年生存率”不等于只能活五年
繪制世界地圖
日本首次公布本國(guó)居民癌癥三年生存率
基于高通量測(cè)序的藥用植物“鳳丹”根皮的轉(zhuǎn)錄組分析
基于高通量測(cè)序的藥用植物“鳳丹”根皮的轉(zhuǎn)錄組分析
紫檀芪處理對(duì)釀酒酵母基因組表達(dá)變化的影響
日本癌癥患者十年生存率達(dá)59%左右
三门峡市| 樟树市| 康马县| 兴山县| 邓州市| 虹口区| 囊谦县| 宜章县| 镇赉县| 东明县| 准格尔旗| 桂平市| 凤冈县| 洛浦县| 绥化市| 垦利县| 米易县| 克山县| 东辽县| 赣榆县| 柳林县| 阿尔山市| 米林县| 社旗县| 故城县| 竹北市| 兴文县| 永修县| 唐山市| 郧西县| 佛坪县| 北宁市| 仪陇县| 乌苏市| 峨边| 临西县| 乐陵市| 蕉岭县| 平舆县| 博罗县| 方城县|