李樹強
(中國醫(yī)科大學附屬盛京醫(yī)院普通外科,沈陽 110004)
原發(fā)性肝癌是目前我國第四位常見的惡性腫瘤,在腫瘤致死疾病中排第三位,嚴重威脅人們的生命和健康。肝細胞癌 (hepatocellular carcinoma,HCC) 占原發(fā)性肝癌的80%以上,手術切除和肝移植是根治原發(fā)性HCC的主要手段,但是由于早期發(fā)現困難,放化療效果不佳,5年生存率僅為15%[1]。因此,更好地了解HCC發(fā)生的分子機制,發(fā)現影響HCC 5年生存期的關鍵基因,為HCC治療提供新的靶點已成當務之急。
登陸TCGA數據庫 (https://cancergenome.nih.gov)網站下載公開的HCC轉錄組數據和腫瘤樣本臨床數據。其中,生存期>5年 (無論存活與否) 的癌癥樣本43例,生存期<5年 (已死亡) 的癌癥樣本107例。本研究旨在探討影響HCC 5年生存率的關鍵基因,故排除隨訪時間不到5年且存活的樣本。
使用轉錄組數據中的reads count評估基因表達水平,應用R軟件 (3.5.1版本) 中的limma及edgeR軟件包[2]對數據進行標準化及差異表達分析,gplots軟件包對數據進行圖形可視化。篩選log FC絕對值 >2,FDR <0.01的基因為差異表達基因。
DAVID (The Database for Annotation,Visualization and Integrated Discovery) 是一個在線數據庫[3](https://david.ncifcrf.gov),為研究人員提供了一套全面的功能注釋工具,以便理解大量基因背后的生物學意義。應用DAVID分別對上調和下調差異表達基因進行GO (gene ontology) 和 KEGG (Kyoto encyclopedia of genes and genomes) 富集分析,P< 0.05為差異有統(tǒng)計學意義。
將差異基因上傳到STRING數據庫[4](https://string-db.org),選擇置信度> 0.4構建蛋白-蛋白互作(PPI)網絡?;蛟赑PI網絡的連接度 (degree) ≥8且排名前10位的基因定義為候選關鍵基因。
應用在線網站 http://kmplot.com/analysis[5],繪制Kaplan-Meier生存曲線,計算95%置信區(qū)間的危險比和logrankP值,比較不同基因表達水平患者的生存期,篩選并驗證候選關鍵基因是否為真正關鍵基因。
下載數據后進行歸一化、對數化,去掉沒有對應基因注釋信息的探針,如果同一個基因有多個探針表達值,取平均數,去掉重復探針,最終得到包含19 754個基因,150個樣本的表達譜。通過R中edgeR包,log FC絕對值 >2,FDR<0.01為表達差異基因篩選條件,共得到383個差異基因。其中表達上調基因253個,表達下調基因130個,見圖1、2。
圖1 差異表達基因火山圖Fig.1 Volcano plots of differentially expressed genes
圖2 差異表達基因主成分分析Fig.2 Principal component analysis of differentially expressed genes
用DAVID分別對上調和下調差異表達基因進行GO和 KEGG富集分析。得到了Biological process (BP)和KEGG pathway結果 (表1、2)。上調基因BP功能聚類主要集中在“positive regulation of cAMP biosynthetic process”,“synaptic transmission,cholinergic”,“cation transmembrane transport”,“regulation of membrane potential”等。有3種典型的KEGG通路在上調基因中過表達,包括“Neuroactive ligand-receptor interaction”,“Nicotine addiction” 和“GABAergic synapse”。下調基因BP功能主要富集在“potassium ion transport”,“energy reserve metabolic process”和“oxygen transport”等,下調基因在KEGG通路中主要富集在“Salivary secretion”,“cAMP signaling pathway”和“Cardiac muscle contraction”等。由此可見,差異表達基因功能主要富集在與某些神經內分泌調節(jié)有關的生物學過程和通路中,通過膜電位改變,跨膜離子的轉運和突觸傳遞等影響患者5年生存率。
表1 上調差異表達基因的BP及KEGG通路富集分析Tab.1 Enrichment analysis of BP and KEGG pathways of up-regulated differentially expressed genes
表2 下調差異表達基因的BP及KEGG通路富集分析Tab.2 Enrichment analysis of BP and KEGG pathways of down-regulated differentially expressed genes
差異表達基因在PPI網絡的連接度≥8且排名前10位的基因定義為候選關鍵基因,包括GCG、LEP、PTH、HTR5A、CRH、CRHR1、CALCA、ADCY2、GAST和CHGA(圖3)。除LEP為表達下調基因外,其余均為表達上調基因。
圖3 蛋白-蛋白互作網絡 (PPI) 圖Fig.3 Protein-protein interaction network
圖4 肝細胞癌關鍵基因預后分析Fig.4 Prognostic analysis of key genes in hepatocellular carcinoma
繪制Kaplan-Meier生存曲線,結果 (圖4)顯示,除了LEP和CHGA,HCC患者中GCG、PTH、HTR5A、CRH、CRHR1、CALCA、ADCY2和GAST基因的高表達,其總生存率明顯升高,故認為這些差異表達基因可能為HCC患者長期生存的關鍵基因。
HCC是全球第五大常見癌癥,每年約有85萬新發(fā)病例[6],占肝癌的80%以上[7]。HCC通常發(fā)生在肝硬化患者中,越來越多的HCC病例伴有非酒精性脂肪肝,這是肥胖和胰島素抵抗的結果[8]。常用的治療方法有器官移植、手術切除、經動脈化療栓塞、局部射頻消融和局部微波消融等[9]。由于早期沒有臨床癥狀,大多數HCC病例發(fā)現即為晚期,治療療效差。索拉非尼作為不可切除HCC病例的臨床替代藥物,療效一般[10]。因此,從基因水平更好地了解HCC發(fā)生機制,發(fā)現新的治療靶點已成當務之急。
本研究利用TCGA數據庫中HCC mRNA基因及臨床表型信息,通過一系列分析,確定了8個與HCC 5年生存期密切相關的關鍵基因,GCG在糖代謝和體內平衡中起著重要作用[11],PTH通過溶解骨骼中的鹽分和防止腎臟排泄來提高血鈣水平,與前列腺癌侵襲程度相關[12]。HTR5A是一種生物激素,起神經遞質、激素和有絲分裂原的作用。這種受體的活性是由G蛋白介導的,可能通過調節(jié)細胞內Ca2+水平而發(fā)揮作用。CRH所編碼的前蛋白經蛋白水解處理后產生成熟的神經肽激素。應激反應時,這種激素由下丘腦室旁核分泌,與促腎上腺皮質激素釋放受體結合,刺激垂體釋放促腎上腺皮質激素。這種蛋白的顯著減少與阿爾茨海默病有關。CRHR1編碼一種G蛋白耦聯受體,對激活信號轉導通路至關重要,這些通路調節(jié)包括壓力、繁殖、免疫反應和肥胖在內的多種生理過程。最近研究[13]報道,CRH/CRHR1可通過IL-6/JAK2/STAT3信號通路和VEGF誘導的腫瘤血管生成,促進結腸癌細胞增殖。CALCA表達水平與多種腫瘤有關,如胃癌、肺癌和睪丸腫瘤等[14-16]。ADCY2是一種膜相關酶,催化二級信使環(huán)腺苷單磷酸的形成。GAST能刺激胃黏膜產生和分泌鹽酸,胰腺分泌其消化酶。還能刺激平滑肌收縮,促進胃和腸的血液循環(huán)和水分分泌。
綜上所述,本研究應用TCGA數據庫,發(fā)現了8個與HCC 5年生存期有關的關鍵基因,為今后HCC的研究提供了新的方向。本研究僅是通過數據分析初步得到可能有價值的關鍵基因,作用機制尚不清楚,需要后續(xù)實驗加以驗證。