国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于生物信息學(xué)篩選并綜合分析肝細(xì)胞癌關(guān)鍵基因

2022-11-19 08:32白皓天李婭蘭
海南醫(yī)學(xué)院學(xué)報 2022年21期
關(guān)鍵詞:差異基因肝癌可視化

王 銳,白皓天,李婭蘭,楊 婧

(黑龍江中醫(yī)藥大學(xué),黑龍江 哈爾濱 150040)

肝細(xì)胞癌(liver hepatocellular,LIHC)是在全世界范圍內(nèi)對人類生命健康造成重大威脅的消化系統(tǒng)惡性腫瘤之一,近年來全球癌癥統(tǒng)計結(jié)果可以看到,無論是從發(fā)病率還是死亡率角度,肝癌都位居惡性腫瘤榜單榜首,僅次于肺癌、乳腺癌、胃癌等[1],且發(fā)病率逐年增高[2],女性發(fā)病率普遍高于男性,同時男性的死亡率約為女性的2 倍[3]。肝癌一般分為原發(fā)性肝癌和轉(zhuǎn)移性肝癌兩大類[4],原發(fā)性肝癌和LIHC 沒有本質(zhì)區(qū)別,具有難治療、難發(fā)現(xiàn)、易轉(zhuǎn)移、死亡率高等特點,由于LIHC 發(fā)病較為隱匿、所以臨床上發(fā)現(xiàn)的多為晚期患者[5]。目前臨床上治療LIHC 的手段眾多,但是治療效果都不佳,生存率較低,即使是發(fā)達(dá)國家也只有3℅左右的生存率[6]?,F(xiàn)已被廣泛接受的LIHC 發(fā)病因素都是由多個基因參與且受遺傳和環(huán)境雙重影響的復(fù)雜過程,在這些致病因素中,最主要的是乙肝病毒和丙肝病毒[7]。因此研究LIHC 發(fā)病機制以及相關(guān)基因,對于LIHC 的早期診斷及早期治療有一定的促進(jìn)作用。現(xiàn)有文獻(xiàn)報道顯示LIHC 的分子機制主要有原癌基因激活和抑癌基因失活、多重分子信號通路異常活化、相關(guān)蛋白質(zhì)和體內(nèi)生長因子異常表達(dá)等[8]。LIHC 的分子機制較復(fù)雜,目前尚未發(fā)現(xiàn)一條最優(yōu)勢的信號通路,因此近年來越來越多的生物學(xué)分析方法應(yīng)用于癌癥的研究,通過生物信息技術(shù)從基因芯片進(jìn)行挖掘可以從分子層面探索LIHC 的發(fā)病機制。

本文利用基因表達(dá)數(shù)據(jù)庫(gene expression omnibus,GEO)檢索LIHC 基因,對LIHC 相關(guān)表達(dá)基因進(jìn)行篩選、GO 功能和KEGG 功能分析,構(gòu)建差異基因特征與蛋白互作網(wǎng)絡(luò),篩選關(guān)鍵基因,明確關(guān)鍵基因差異表達(dá)、預(yù)后分析以及免疫浸潤情況,為LIHC 的預(yù)后生物標(biāo)志物選擇提供新思路。

1 材料與方法

1.1 微陣列數(shù)據(jù)分析

在GEO 數(shù) 據(jù) 庫(https://www.ncbi.nlm.nih.gov/geo/)中輸入檢索詞“Liver hepatocellular carcinoma”,對GSE109903 基因表達(dá)譜進(jìn)行下載。該表達(dá)譜出自于Affymetrix GPL19057 平臺,F(xiàn)ong EL 提供了此表達(dá)譜。GSE109903 數(shù)據(jù)包含28 個樣本,其中有14 個LIHC 樣品和14 個正常對照樣品。

1.2 篩選差異基因

將下載的樣本數(shù)據(jù)進(jìn)行分組并命名,分別為LIHC 組和對照組,導(dǎo)入BioJupies 對差異基因進(jìn)行處理、篩選。主成分分析是一種被用來識別集中高維數(shù)據(jù)的全局模式的統(tǒng)計方法,通常被用來探索RNA-seq 數(shù)據(jù)集中生物樣本的高度相似性[9]。將經(jīng)過處理的數(shù)據(jù)進(jìn)行下一步篩選以識別差異基因(differentially expressed genes,DEGs)。設(shè)置條件|log2 Fold Change|≥2,經(jīng)過校正之后的數(shù)據(jù)設(shè)定條件P<0.05,進(jìn)而作為篩選條件。

1.3 DEGs 的功能分析及通路分析

GO 分析過程存在于大規(guī)模的功能富集中,是在功能富集研究中常用的研究手段,基因功能可分為以下3 個步驟,生物過程(biological process,BP)、分子功能(molecular function,MF)和細(xì)胞組分(cellular component,CC)。KEGG 數(shù)據(jù)庫在生信分析過程中同樣被廣泛使用,其中含有大量關(guān)于基因組、生物過程以及疾病的數(shù)據(jù)。接著,使用DAVID 數(shù)據(jù)庫,對此研究中的DEGs 進(jìn)行注釋分析和通路富集分析。其中,對GO 分析與KEGG 分析中設(shè)定的篩選條件為P<0.05,基因計數(shù)>5。

1.4 DEGs 特征表達(dá)的可視化

L1000FWD 數(shù)據(jù)庫(https://maayanlab.cloud/l1000fwd/)為16 000 多種藥物和小分子誘導(dǎo)基因表達(dá)特征提供了交互式可視化。并且支持通過不同屬性(如細(xì)胞類型、時間點、濃度)以及藥物屬性對特征進(jìn)行著色,從而對小分子功能與藥物作用方式進(jìn)行分析,以推斷藥物對上述DEGs 之間的親和力[10]。將所得藥物數(shù)據(jù)根據(jù)相似程度得分由高到低進(jìn)行排列。

1.5 PPI 互作網(wǎng)絡(luò)的構(gòu)建

String 數(shù)據(jù)庫(https://string-db.org/)是一個可以將蛋白質(zhì)相互作用進(jìn)行可視化的網(wǎng)站[11],可用于預(yù) 測EMBL 中 基 因 互 作 網(wǎng) 絡(luò) 的 分 析 數(shù) 據(jù) 庫[12],對DEGs 之間的關(guān)系進(jìn)行可視化分析。將所研究基因提交到String 數(shù)據(jù)庫進(jìn)行蛋白互作數(shù)據(jù)分析,設(shè)置高可信互作分值(high confidence:0.500),隱藏沒有互作關(guān)系的節(jié)點,即可得到蛋白網(wǎng)絡(luò)互作圖。篩選與LIHC 相關(guān)性較大的蛋白進(jìn)行下一步的研究。

1.6 關(guān)鍵基因的差異表達(dá)與預(yù)后分析

GEPIA(http://gepia.cancer-pku.cn/index.html)是一個使用標(biāo)準(zhǔn)處理通路的分析工具,由成千上萬的腫瘤和正常組織樣本數(shù)據(jù)構(gòu)成[13]。本研究中,通過GEPIA 對腫瘤和正常組織基因的差異表達(dá)進(jìn)行比較分析,病理階段分析,最后進(jìn)行相關(guān)預(yù)后分析,一般認(rèn)為P<0.05 有顯著差異。

Kaplan-Meier plotter(http://kmplot.com/analysis/index.phpp=service&cancer=liver_rnaseq)繪圖工具可以對21 種腫瘤超過54 000 個基因進(jìn)行生存分析。通過使用Kaplan-Meier plotter 繪圖工具對LIHC 患者體內(nèi)所篩選核心基因的mRNA 表達(dá)情況進(jìn)行預(yù)后分析。 規(guī)定P<0.05 時具有統(tǒng)計學(xué)意義[14]。

1.7 關(guān)鍵基因功能預(yù)測

GeneMANIA(http://www.genemania.org)是一個具備基因信息,并對功能分析的基因進(jìn)行優(yōu)先排序的網(wǎng)站,具有較高的準(zhǔn)確性預(yù)測算法[15]。將所篩選關(guān)鍵基因輸入平臺,分析所篩選關(guān)鍵基因的功能,推斷所基因的預(yù)測價值。

1.8 關(guān)鍵基因表達(dá)與LIHC 免疫浸潤水平關(guān)系

TIMER2.0(https://cistrome.shinyapps.io/timer/)可以通過6 個主要分析模塊系統(tǒng)評估不同免疫細(xì)胞的浸潤情況及其臨床影響[16]。通過“基因模塊”輸入所篩選的關(guān)鍵基因,生成散點圖,觀察其表達(dá)與LIHC 免疫浸潤水平的關(guān)系。

2 結(jié)果

2.1 數(shù)據(jù)處理及DEGs 篩選結(jié)果

在主成分分析中,每一個點代表一個所選擇的樣本,不同顏色代表對照組與模型組,進(jìn)而構(gòu)成了交互式的三維散點圖,其中,如果樣品具有更為相似基因表達(dá)譜,那么在三維空間中距離將會更加接近(圖1)。如圖1 所示,對照組與模型組的表達(dá)相互獨立,從而可以進(jìn)行下一步分析。對所得到的基因文本進(jìn)行處理,篩選共得到1 509 個差異表達(dá)基因,其中包括637 個上調(diào)基因,872 個下調(diào)基因,最后,對所篩選得到的結(jié)果進(jìn)行可視化分析,繪制火山圖及聚類圖(圖2A~C)。

2.2 差異基因GO 功能富集和KEGG 通路分析結(jié)果

在功能富集分析與通路分析過后,對結(jié)果進(jìn)行可視化處理(圖3)。通過對所處理的1 509 個樣品進(jìn)行分析之后,得到了如下結(jié)果。GO 富集分析主要包括3 個組成部分,首先,差異基因所富集的BP包含以DNA 為模板的正向轉(zhuǎn)錄調(diào)控,RNA 聚合酶Ⅱ啟動子的轉(zhuǎn)錄正調(diào)控,以DNA 為模板的正向轉(zhuǎn)錄調(diào)控,核小體裝配,染色質(zhì)裝配,核小體組成,線粒體ATP 合成電子傳遞,蛋白質(zhì)DNA 復(fù)合物組裝,呼吸電子傳遞鏈等;對差異基因的CC 分析主要集中在核體、核染色質(zhì)、染色質(zhì)、黏著斑、核染色質(zhì)部分、核斑點、核質(zhì)部分、線粒體內(nèi)膜、線粒體呼吸鏈復(fù) 合 體Ⅰ、核 外 圍 等;DEGs 的MF 分 析 為RNA 結(jié)合、轉(zhuǎn)錄輔活化蛋白活性、鈣黏著蛋白結(jié)合、RNA 聚合酶Ⅱ核心啟動子近端區(qū)序列特異性DNA 結(jié)合、蛋白激酶結(jié)合、RNA 聚合酶Ⅱ轉(zhuǎn)錄輔助因子活性、激活轉(zhuǎn)錄因子結(jié)合;其次,對DEGs 進(jìn)行通路分析,結(jié)果如下,差異表達(dá)基因主要富集的通路與系統(tǒng)性紅斑狼瘡、酒精中毒等病癥和RNA 聚合酶Ⅰ啟動子 開 放,DNA 甲 基 化,活 化PKN1刺 激AR 調(diào) 節(jié) 基因KLK2和KLK3轉(zhuǎn)錄等過程有關(guān),各通路富集基因及聯(lián)合評分如表所示(表1)。

表1 KEGG 通路分析Tab 1 KEGG pathway analysis

2.3 DEGs 特征表達(dá)的交互性可視化結(jié)果

L1000FWD 平臺可以將16 000 多種藥物和小分子誘導(dǎo)基因表達(dá)特征可視化。將DEGs 導(dǎo)入L1000FWD 平臺后,得到小分子與藥物特征相似度結(jié)果,如表2 所示,與其DEGs 特征相似的藥物主要有CDC 抑制劑、前列腺素、血清素受體拮抗劑、BAF 轉(zhuǎn)錄阻遏抑制劑、酪氨酸磷酸酶抑制劑等。數(shù)據(jù)經(jīng)處理后,以形狀代表時間點,顏色代表所作用細(xì)胞種類,繪制煙火圖(圖4)。

表2 與差異基因特征相似的主要藥物Tab 2 Main drugs with similar characteristics with different genes

2.4 DEGsPPI 網(wǎng)絡(luò)可視化結(jié)果

運用String 數(shù)據(jù)庫對差異表達(dá)基因進(jìn)行PPI 網(wǎng)絡(luò)分析,以探討它們之間潛在的相互作用。如預(yù)期所示,在PPI 網(wǎng)絡(luò)圖中共獲得160 個節(jié)點與200 條連線,去除沒有互作關(guān)系的節(jié)點之后,繪制String 連線圖(圖5)。依據(jù)圖中所示,與LIHC 發(fā)生發(fā)展較為密切 的 基 因 主 要 為EEF1A1、HK2、FAM38A、LAMB3等。

2.5 LIHC 患者EEF1A1 與HK2 的不同表達(dá)情況

通過圖5 可知,其中EEF1A1與14 個相關(guān)蛋白相連接,共有26 條連線;HK2與13 個相關(guān)蛋白相連接,共有24 條連接;FAM83A與8 個相關(guān)蛋白相連接,共有22 條連線;LAMB3與5 個相關(guān)蛋白相連接,共有18 條連線。通過比較其內(nèi)在網(wǎng)絡(luò)作用程度關(guān)系,通過對所篩選的與LIHC 發(fā)生發(fā)展較為密切的基因EEF1A1與HK2進(jìn)行進(jìn)一步分析。

利用GEPIA 數(shù)據(jù)集,比較了LIHC 和正常肝細(xì)胞組織中EEF1A1與HK2的mRNA 表達(dá)。結(jié)果顯示,EEF1A1與HK2在LIHC 組織中的表達(dá)水平高于正常組織(圖6)。接著,繼續(xù)評估EEF1A1與HK2的表達(dá)差異與LIHC 患者病理分期之間的相關(guān)性。由小提琴圖(圖7)可知,EEF1A1與HK2組P均<0.05,結(jié)果均具有統(tǒng)計學(xué)意義。EEF1A1與HK2圖中中心點位置未在同一條直線上,均在第四階段發(fā)生顯著變化,證明基因在此階段產(chǎn)生了重要作用,圖示表明EEF1A1與HK2可能在LIHC 的發(fā)生發(fā)展中起重要作用。

2.6 LIHC 患者EEF1A1 與HK2 表達(dá)的預(yù)后價值

為了評估EEF1A1與HK2的表達(dá)在LIHC 過程中的價值,采用GEPIA 分析EEF1A1、HK2與臨床結(jié)果之間的相關(guān)性。圖8 為無病生存率(diseasefree survival,DFS)和 總 生 存 率(overall survival,OS)曲線。EEF1A1高轉(zhuǎn)錄水平的LIHC 患者(P=0.036)與短期無病生存期顯著相關(guān),同樣,HK2 高轉(zhuǎn)錄水平的LIHC 患者(P=0.02)與短時無病生存期也同樣顯著相關(guān)。證明EEF1A1與HK2均與生存相關(guān)。

此外,筆者還利用Kaplan-Meier plotter 繪圖工具對模型進(jìn)行了亞組分析,以得到EEF1A1與HK2在LIHC 患者中的預(yù)后價值(圖9)。LIHC 患者EEF1A1(HR=0.8,P=0.03)和HK2(HR=1.82,P=0.000 86)mRNA 表達(dá)與短時總生存期顯著相關(guān),這與筆者采用GEPIA 所得到的結(jié)果相同。

2.7 DEGs 功能分析預(yù)測結(jié)果

將EEF1A1與HK2兩個基因分別輸入GENEMIANA 平臺中,經(jīng)處理得到互作網(wǎng)絡(luò)圖(圖10)。由圖可知,其結(jié)果反映了差異表達(dá)基因EEF1A1與HK2的功能和與這兩個基因相似基因的功能。例如CHRM4、EEF1A2和ICA1、GATA1等,這些基因也均在String 網(wǎng)絡(luò)互作圖中有所體現(xiàn)。圖示為所篩選基因與其相似基因功能上相似的部分。主要與翻譯因子活性、分子伴侶介導(dǎo)的自噬、翻譯調(diào)節(jié)器活動、蛋白靶向內(nèi)質(zhì)網(wǎng)和碳水化合物分解代謝過程、嘌呤核苷二磷酸代謝過程、ADP 代謝過程等有關(guān)。其中物理相互作用占比77.64%,基因間相互作用占比2.87%。

2.8 LIHC 患者EEF1A1 與HK2 的免疫細(xì)胞浸潤

免疫細(xì)胞水平與癌細(xì)胞的增殖和發(fā)展有關(guān)。在本研究中,使用TIMER2.0 數(shù)據(jù)庫來探索EEF1A1與HK2免疫細(xì)胞浸潤之間的相關(guān)性。將EEF1A1與HK2輸入TIMER2.0 平臺,結(jié)果如圖11所示。EEF1A1的表達(dá)與LIHC 中B 細(xì)胞、CD8+T 細(xì)胞、CD4+T 細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞的浸潤呈正相關(guān)。HK2的表達(dá)與LIHC 中巨噬細(xì)胞、中性粒細(xì)胞的浸潤呈正相關(guān),與B 細(xì)胞、CD8+T 細(xì)胞、CD4+細(xì)胞和樹突狀細(xì)胞的浸潤無顯著相關(guān)。

3 討論

LIHC 作為對全球人類健康造成巨大危害的惡性腫瘤之一,因其惡性程度高、易復(fù)發(fā)等特點,傳統(tǒng)的治療手段難以提高LIHC 患者的生存率,且受遺傳因素的影響,LIHC 的治療手段受到廣泛的關(guān)注[17,18],因 此 研 究LIHC 的 發(fā) 病 機 制 以 及 相 關(guān) 基 因迫在眉睫。隨著生物信息學(xué)的發(fā)展,通過研究LIHC 的發(fā)生機制,探尋新的靶點,發(fā)明新的治療手段,為患者生存提供重大便利。本研究利用GEO 數(shù)據(jù)庫豐富的數(shù)據(jù)信息,通過生物信息技術(shù)篩選得到差異表達(dá)基因共1 509 個,上調(diào)與下調(diào)基因分別為637、872 個,PPI 網(wǎng)絡(luò)可視化分析篩選出四個與LIHC 存在密切關(guān)系的基因,分別為EEF1A1、HK2、FAM38A、LAMB3。通過節(jié)點關(guān)系比對,明確與LIHC 顯著相關(guān)的核心基因為EEF1A1和HK2。通過GEPIA、Kaplan-Meier plotter 數(shù)據(jù)庫可知,所篩選出的基因與LIHC 的病理分期與預(yù)后有密切聯(lián)系。GeneMANIA 數(shù)據(jù)庫顯示關(guān)鍵基因主要與翻譯因子活性、分子伴侶介導(dǎo)的自噬、翻譯調(diào)節(jié)器活動、蛋白靶向內(nèi)質(zhì)網(wǎng)和碳水化合物分解代謝過程、嘌呤核苷二磷酸代謝過程、ADP 代謝過程等有關(guān)。最后通過Timer2.0 數(shù)據(jù)庫進(jìn)行分析,得知兩個基因與癌變組織中不同的免疫細(xì)胞浸潤呈正相關(guān),進(jìn)一步明確了LIHC 患者EEF1A1 與HK2 的差異表達(dá)、預(yù)后價值和免疫細(xì)胞浸潤情況,結(jié)果顯示EEF1A1與HK2mRNA 在LIHC 中較正常組織中表達(dá)顯著,可能是LIHC 患者生存的潛在預(yù)后生物標(biāo)志物。

EEF1A1是一種觸發(fā)蛋白質(zhì)翻譯延伸的啟動因子[19,20],可以參與細(xì)胞生物學(xué)行為,在多種癌細(xì)胞中表達(dá)顯著且明顯抑制腫瘤細(xì)胞的增殖、侵襲和遷移能力。周淑亭等[21]通過RNA 干擾技術(shù)相關(guān)實驗,探討研究EEF1A1對肝癌Hca-P 細(xì)胞的影響,并進(jìn)一步分析參與調(diào)控的機制,結(jié)果發(fā)現(xiàn),靶向EEF1A1的shRNA 可以降低EEF1A1的表達(dá),低表達(dá)的EEF1A1可以誘導(dǎo)肝癌細(xì)胞凋亡、抑制肝癌細(xì)胞增殖和遷移,調(diào)控機制顯示EEF1A1與ANXA7存在密切關(guān)系,可共同參與調(diào)控腫瘤的發(fā)生。該實驗結(jié)果還顯示EEF1A2的表達(dá)隨著EEF1A1的下降而下降,二者呈高度相關(guān)性。Qiu 等[22]通過利用realtime PCR 和免疫組織法檢測62 個HCC 組織樣品以及LIHC 中EEF1A2的表達(dá),研究結(jié)果發(fā)現(xiàn)EEF1A2可以有效沉默癌細(xì)胞的增殖、遷移和侵襲,促使LIHC 凋亡增加,并誘導(dǎo)細(xì)胞周期停滯。EEF1A2是 通 過 抑 制P13K/Akt/NF-κB 信 號 通 路來降低LIHC 的發(fā)生。HK2為機體糖酵解途徑的第一個關(guān)鍵限速酶,其與線粒體外膜電壓依賴性陽離子通道蛋白相結(jié)合可以促進(jìn)糖酵解的發(fā)生和腫瘤細(xì)胞的形成[23],抑制HK2表達(dá)在腫瘤細(xì)胞和動物模型中都能抑制腫瘤細(xì)胞的增殖,張宇等[24]通過免疫組化法檢測48 例肝癌組織中HK2的表達(dá)量,并且通過統(tǒng)計分析等一系列實驗探究HK2與LIHC 的關(guān)系,結(jié)果發(fā)現(xiàn)HK2在LIHC 組織中表達(dá)較高,可以顯著降低肝癌細(xì)胞的增殖活性,使細(xì)胞周期能夠停滯在S 期,促進(jìn)肝癌細(xì)胞的凋亡,最終證明HK2表現(xiàn)出了較強的抗腫瘤作用,具有一定的臨床意義,也為筆者下一步研究HKs 家族與肝細(xì)胞癌間生存關(guān)系奠定基礎(chǔ)。

綜上所述,本實驗運用生物信息學(xué)結(jié)合基因芯片,探究LIHC 的差異表達(dá)基因,在對基因進(jìn)行初步分析之后,得到基因所參與的信號通路以及功能,進(jìn)一步篩選出關(guān)鍵基因EEF1A1與HK2,為LIHC患者生存提供潛在的預(yù)后生物標(biāo)志物,為LIHC 的臨床治療和機制研究提供理論支持、新思路和方案,但仍需更嚴(yán)謹(jǐn)可靠的實驗進(jìn)行驗證分析。

作者貢獻(xiàn)度說明:

本文設(shè)計思路由王銳、楊婧教授提供;白皓天負(fù)責(zé)靶點篩選、通路分析、差異基因特征表達(dá)分析等過程;李婭蘭負(fù)責(zé)數(shù)據(jù)可視化及數(shù)據(jù)處理。

所有作者聲明不存在利益沖突關(guān)系。

猜你喜歡
差異基因肝癌可視化
基于CiteSpace的足三里穴研究可視化分析
自然資源可視化決策系統(tǒng)
思維可視化
自然資源可視化決策系統(tǒng)
XB130在肝癌組織中的表達(dá)及其對細(xì)胞侵襲、遷移的影響
隱源性肝癌與病毒性肝癌臨床特征比較
基于RNA 測序研究人參二醇對大鼠心血管內(nèi)皮細(xì)胞基因表達(dá)的影響 (正文見第26 頁)
紫檀芪處理對釀酒酵母基因組表達(dá)變化的影響
microRNA在肝癌診斷、治療和預(yù)后中的作用研究進(jìn)展
TACE術(shù)聯(lián)合手術(shù)治療中晚期肝癌患者65例臨床觀察
宝清县| 阳西县| 定结县| 朝阳区| 文山县| 公安县| 长春市| 丹东市| 额尔古纳市| 屏边| 佳木斯市| 梓潼县| 乌恰县| 喀喇| 香河县| 辽宁省| 汶上县| 河源市| 东兴市| 衡阳市| 宜黄县| 新建县| 农安县| 临猗县| 慈溪市| 平山县| 山阳县| 富顺县| 奎屯市| 钟山县| 南和县| 成武县| 阿荣旗| 犍为县| 大石桥市| 涟源市| 江川县| 历史| 邢台市| 濉溪县| 浦东新区|