姚佳
【摘? 要】目的:通過對(duì)肝細(xì)胞肝癌的轉(zhuǎn)錄組學(xué)研究,從而對(duì)肝細(xì)胞肝癌的基因組的異質(zhì)性和生物學(xué)機(jī)制有一個(gè)更加全面的理解。方法:對(duì)10例肝細(xì)胞肝癌患者,對(duì)癌及癌旁組織進(jìn)行轉(zhuǎn)錄組測序。結(jié)果:每個(gè)樣本大量的表達(dá)差異的長鏈非編碼RNA(范圍為54到69)和差異表達(dá)的基因(范圍為2971到6910)。共2873個(gè)具有明顯表達(dá)差異的基因,其中上調(diào)1666個(gè),下調(diào)1207個(gè)(差異基因標(biāo)準(zhǔn):FDR<0.001, Foldchang≥2, 存在于5對(duì)樣本以上)。對(duì)差異基因的功能分析結(jié)果顯示:差異基因主要集中在細(xì)胞周期、細(xì)胞粘附、脂代謝和炎癥等功能類和PPRA、P450的代謝、P53和DNA的復(fù)制等信號(hào)通路。此外,每個(gè)樣本發(fā)現(xiàn)了大量的腫瘤特異性突變,其中22.2%位于基因的編碼區(qū),大部分(42.6%)為T:A >C:G這一類型的突變。結(jié)論:對(duì)差異基因的分析顯示主要集中于細(xì)胞周期、PPRA和P53等信號(hào)通路,表明這些信號(hào)通路在肝癌的發(fā)生發(fā)展中起到關(guān)鍵作用。對(duì)于腫瘤特異性突變的分析,高頻的T:A >C:G這一突變類型的發(fā)生,我們推測基因突變主要發(fā)生在RNA編輯這一過程中,這表明RNA編輯對(duì)肝癌的發(fā)生發(fā)展有相當(dāng)大的影響。大量的新的基因事件的發(fā)生,說明肝癌的發(fā)生發(fā)展機(jī)制比以往的理解更為復(fù)雜。
【關(guān)鍵詞】肝癌;轉(zhuǎn)錄組測序;RNA編輯
【中圖分類號(hào)】R158????? 【文獻(xiàn)標(biāo)識(shí)碼】A????? 【文章編號(hào)】1004-7484(2020)09-0288-02
肝細(xì)胞肝癌占了原發(fā)性肝臟腫瘤的80—90%,居全世界腫瘤發(fā)病率的第五位,腫瘤相關(guān)性死亡的第三位[1]。肝細(xì)胞肝癌是一種具有高度侵襲性的腫瘤,盡管采用了以手術(shù)切除為主的一系列綜合治療手段,但是肝癌患者的長期生存率仍然較低[2-3]。肝細(xì)胞肝癌是一種異質(zhì)性疾病,由于基因、表觀遺傳和轉(zhuǎn)錄組水平的改變,使得肝細(xì)胞肝癌的形態(tài)學(xué)和臨床表現(xiàn)多樣性[4] 這些遺傳多樣性嚴(yán)重影響了肝癌的診斷、治療及預(yù)后。
對(duì)于肝細(xì)胞肝癌分子水平的轉(zhuǎn)錄組研究成為了近年研究的熱點(diǎn),并且對(duì)于進(jìn)一步篩選肝癌診斷及復(fù)發(fā)轉(zhuǎn)移相關(guān)的分子、揭示腫瘤的發(fā)生發(fā)展機(jī)制和尋找新的靶向治療位點(diǎn)顯示出了不可估量的潛力。本研究圍運(yùn)用二代測序技術(shù),對(duì)肝細(xì)胞肝癌進(jìn)行深入測序,以尋找新的肝癌診斷及復(fù)發(fā)轉(zhuǎn)移的相關(guān)分子和通路,對(duì)肝細(xì)胞肝癌的分子生物學(xué)機(jī)制有一個(gè)更加全面和深入的理解為目標(biāo)。
1方法及材料:
1.1 收集本院 2015 年 1 月至 2018 年 12月接受肝癌肝切手術(shù)的男性病人,均經(jīng)病理組織學(xué)證實(shí)為原發(fā)性HCC,且均為HBV相關(guān)性肝癌,無合并HCV等其他肝炎病毒感染。臨床病理學(xué)資料完整,包括年齡、性別、術(shù)前AFP水平、有無血管侵犯及遠(yuǎn)處轉(zhuǎn)移、病理分化分級(jí)、腫瘤大小、數(shù)目等。術(shù)前均未行抗腫瘤治療,手術(shù)切除的組織立即冷凍于-80 ℃以用于提取RNA。
1.2 主要試劑:美國Invitrogen 公司Trizol總RNA提取試劑;上海生工生物工程有限公司 DEPC、瓊脂糖;美國Illumina公司DNase I,oligo(dT),fragmentation buffer,random hexamers,緩沖液、dNTPs、RNase H和DNA polymerase I,polyA, QiaQuick PCR試劑盒;其他化學(xué)試劑:氯仿、異丙醇、無水乙醇、甲醇、等均為國產(chǎn)分析試劑。
1.3實(shí)驗(yàn)方法:
1.3.1轉(zhuǎn)錄組測序:RNA-Seq 由深圳華大基因公司所做,簡要步驟如下: 分別提取樣本的總RNA,使用 DNase 消化 DNA 后富集mRNA,用打斷試劑將mRNA打斷成短片段并以此為模板合成 cDNA, 使用試劑盒純化雙鏈 cDNA 再進(jìn)行末端修復(fù)、加 A 尾, 連接接頭后選擇合適的片段大小進(jìn)行PCR擴(kuò)增,構(gòu)建好的文庫用 Agilent 2100 Bioanalyzer 質(zhì)檢合格后,使用 Illumina HiSeqTM 2500 測序儀進(jìn)行測序,上樣量為 50 ng。
1.3.2測序數(shù)據(jù)質(zhì)量評(píng)估及處理
測序得到的原始數(shù)據(jù)為raw data,接下來數(shù)據(jù)處理的步驟:(1)去除含adaptor的reads;(2)去除N的比例大于5%的reads;(3)去除低質(zhì)量reads(質(zhì)量值Q≤15的堿基數(shù)占整個(gè)read的50%以上)。得到Clean data后,我們使用MAQ 軟件將clean reads 與參考序列進(jìn)行比對(duì),每個(gè)read的堿基錯(cuò)配不能大于5個(gè)。
1.3.3差異表達(dá)基因(DEGS)的篩選
對(duì)基因進(jìn)行表達(dá)分析,基因表達(dá)量使用 FPKM( Fragments Per kb per Million reads) 方法計(jì)算,以校正的 P 值( false discovery rate, FDR) ≤0. 05、差
異倍數(shù)的對(duì)數(shù)絕對(duì)值( ︱log2FoldChange︱,︱FC︱) ≥2為閾值,篩選癌和癌旁的DEGS。1.3.4 差異表達(dá)基因的 GO 分析和 KEGG 富集篩選出 DEGs 后,我們對(duì) DEGs 進(jìn)行 GO 和 KEGG 富集分析。
2結(jié)果:
2.1 表達(dá)差異:(圖1)
我們選擇10例肝癌樣本及相應(yīng)的癌旁組織進(jìn)行轉(zhuǎn)錄組測序(RNA-seq),10對(duì)樣本平均生成26 355 902 (range: 25 580 346-27 540 350) reads和2.37(range: 2.30-2.48)Gb的測序數(shù)據(jù)。采用MAQ軟件,平均92.76% (range: 89.37-97.02%)的reads能夠比對(duì)到人類基因組(UCSC version hg19)。通過比對(duì)腫瘤及其配對(duì)癌旁組織的轉(zhuǎn)錄本,我們篩選到每對(duì)肝癌樣本中具有表達(dá)差異的基因(2971 to 6910)。
2.2差異基因及GO和pathway分析
通過將10對(duì)樣本的read比對(duì)到基因組后,計(jì)算他們的表達(dá)量,用RPKM來衡量他們的表達(dá)量。通過將癌和癌旁組織的RPKM值進(jìn)行比較,計(jì)算他們的表達(dá)差異。將10對(duì)樣本的差異基因進(jìn)一步按以下條件篩選:FDR ≤ 0.001,foldchang≥ 2,上調(diào)或者下調(diào)在5對(duì)樣本以上。共獲得2873個(gè)基因,隨后進(jìn)行GO和pathway的分析,結(jié)果表明,差異基因主要集中于細(xì)胞周期的調(diào)控、細(xì)胞粘附、類固醇及脂類代謝、依賴于DNA的修復(fù)及炎癥免疫反應(yīng)等功能類和P53、細(xì)胞周期,PPRA,DNA修復(fù)等信號(hào)通路,具體結(jié)果見圖2及表1。隨后對(duì)于10對(duì)樣本中一致上調(diào)或下調(diào)的106個(gè)基因進(jìn)行聚類,見圖3
2.3 SNP及腫瘤特異性突變:
每個(gè)肝癌樣本平均找到12909(范圍為6877-27970)個(gè)腫瘤特異性點(diǎn)突變,這些突變位點(diǎn)22.2%位于基因編碼區(qū)域(CDS區(qū)),其中946個(gè)為非同義突變。其中42.6%為T:A >C:G(圖4)。
討論:
從分子生物學(xué)的角度講,肝癌和其他腫瘤一樣,是一種復(fù)雜的疾病[4-5]。過去的幾十年的研究已經(jīng)證明,基因的改變?cè)诟伟┑陌l(fā)生發(fā)展因此起著重要的作用[6-8]。對(duì)于肝癌的基因?qū)W特征的更加詳細(xì)的了解,能夠促進(jìn)肝癌在診斷,治療及預(yù)后等方面發(fā)展。本研究中,我們對(duì)10例肝癌及其癌旁組織進(jìn)行了轉(zhuǎn)錄組測序,通過這些數(shù)據(jù)及聯(lián)合分析,我們首先分析了腫瘤及癌旁組織基因的表達(dá)差異,其中有很多基因已經(jīng)被證實(shí)與肝癌的發(fā)生有關(guān),例如血管內(nèi)皮生長因子(VEGF),磷脂酰肌醇蛋白聚糖3(GPC3)[9-11]。同樣,也發(fā)現(xiàn)了很多新的未被注釋的基因被找到,這說明基于轉(zhuǎn)錄組測序來尋找表達(dá)差異的基因是一種更加高效的研究方式。在這些信號(hào)通路中,大部分已經(jīng)被報(bào)道證實(shí)與肝癌的發(fā)展具有密切的關(guān)系,例如細(xì)胞周期的信號(hào)通路、P53、PPAR等[12]。同時(shí),差異基因在一些基本的代謝途徑中被富集,例如,類固醇的代謝、脂肪酸的代謝。特別有趣的是,細(xì)胞色素P450這一信號(hào)通路,許多該家族的基因在肝癌組織中明顯的下調(diào),這與先前關(guān)于肝癌組織中細(xì)胞色素P450分子的活性降低及低表達(dá)相一致[13]??偠灾?,轉(zhuǎn)錄組測序揭示肝癌的發(fā)生涉及到多條關(guān)鍵的細(xì)胞通路,包括細(xì)胞生長相關(guān)的通路,代謝相關(guān)的過程及免疫相關(guān)的調(diào)劑通路。
人類的基因是由多個(gè)外顯子中穿插著內(nèi)含子來構(gòu)成。初級(jí)轉(zhuǎn)錄本RNA通過RNA的剪切的過程,內(nèi)含子被去除,成為一個(gè)成熟的mRNA.通過選擇性剪切的機(jī)制,一個(gè)初級(jí)轉(zhuǎn)錄本能夠生成多個(gè)mRNA[14]。RNA的選擇性剪切起著重要的生物功能,例如膜結(jié)合蛋白IgM和分泌蛋白IgD 是由同一個(gè)初級(jí)轉(zhuǎn)錄本經(jīng)過選擇性剪接所產(chǎn)生[15]。已有許多基于基因組的基礎(chǔ)上,對(duì)于RNA選擇性剪切的研究,這些研究表明人類35-39%的基因至少有一個(gè)選擇性剪切異構(gòu)體[16-19]。一些研究顯示,RNA選擇性剪切頻繁的發(fā)生于腫瘤相關(guān)的基因,例如EGFR,CD44,NER[20-22]。本研究基于基因組學(xué)的基礎(chǔ)上,尋找與肝癌相關(guān)的選擇性剪切事件,作為肝癌診斷的一個(gè)潛在的腫瘤標(biāo)志物。突變位點(diǎn)22.2%位于基因編碼區(qū)域(CDS區(qū))其中42.6%為T:A >C:G,對(duì)于這一現(xiàn)象,合理的解釋為這種類型的點(diǎn)突變發(fā)生在RNA編輯過程中。RNA編輯過程中將腺嘌呤(A)改變?yōu)榇吸S嘌呤核苷酸(I),而后次黃嘌呤核苷酸被翻譯為鳥嘌呤核苷酸(G)[23]。
針對(duì)轉(zhuǎn)錄組數(shù)據(jù)的分析,發(fā)現(xiàn)了大量的新的基因事件的發(fā)生,包括選擇性剪接、腫瘤特異性突變等,說明肝癌的發(fā)生發(fā)展機(jī)制比以往的理解更為復(fù)雜。這一較為全面的肝癌轉(zhuǎn)錄組水平的研究,為我們進(jìn)一步研究肝癌發(fā)病的分子機(jī)制提供了重要的線索和參考價(jià)值。
參考文獻(xiàn)
[1]Lau WY, Lai EC. Hepatocellular carcinoma: current management and recent advances. Hepatobiliary Pancreat Dis Int 2008; 7: 237-257.
[2]Zheng SS, Xu X, Wu J et al. Liver transplantation for hepatocellular carcinoma: Hangzhou experiences. Transplantation 2008; 85: 1726-1732.
[3]Lo CM, Fan ST. Liver transplantation for hepatocellular carcinoma. Br J Surg 2004; 91: 131-133.
[4]Feo F, Frau M, Tomasi ML et al. Genetic and epigenetic control of molecular alterations in hepatocellular carcinoma. Exp Biol Med (Maywood) 2009; 234: 726-736.
[5]Zucman-Rossi J, Laurent-Puig P. Genetic diversity of hepatocellular carcinomas and its potential impact on targeted therapies. Pharmacogenomics 2007; 8: 997-1003.
[6]Acevedo LG, Bieda M, Green R, Farnham PJ. Analysis of the mechanisms mediating tumor-specific changes in gene expression in human liver tumors. Cancer Res 2008; 68: 2641-2651.
[7]Woo HG, Park ES, Lee JS et al. Identification of potential driver genes in human liver carcinoma by genomewide screening. Cancer Res 2009; 69: 4059-4066.
[8]Hoshida Y, Nijman SM, Kobayashi M et al. Integrative transcriptome analysis reveals common molecular subclasses of human hepatocellular carcinoma. Cancer Res 2009; 69: 7385-7392.
[9]Chiang DY, Villanueva A, Hoshida Y et al. Focal gains of VEGFA and molecular classification of hepatocellular carcinoma. Cancer Res 2008; 68: 6779-6788.
[10]Midorikawa Y, Ishikawa S, Iwanari H et al. Glypican-3, overexpressed in hepatocellular carcinoma, modulates FGF2 and BMP-7 signaling. Int J Cancer 2003; 103: 455-465.
[11]Nakatsura T, Yoshitake Y, Senju S et al. Glypican-3, overexpressed specifically in human hepatocellular carcinoma, is a novel tumor marker. Biochem Biophys Res Commun 2003; 306: 16-25.
[12]Iakova P, Timchenko L, Timchenko NA. Intracellular signaling and hepatocellular carcinoma. Semin Cancer Biol 2011; 21: 28-34.
[13]Morgan ET. Down-regulation of multiple cytochrome P450 gene products by inflammatory mediators in vivo. Independence from the hypothalamo-pituitary axis. Biochem Pharmacol 1993; 45: 415-419.
[14]Hastings ML, Krainer AR. Pre-mRNA splicing in the new millennium. Curr Opin Cell Biol 2001; 13: 302-309.
[15]Early P, Rogers J, Davis M et al. Two mRNAs can be produced from a single immunoglobulin mu gene by alternative RNA processing pathways. Cell 1980; 20: 313-319.
[16]Huang YH, Chen YT, Lai JJ et al. PALS db: Putative Alternative Splicing database. Nucleic Acids Res 2002; 30: 186-190.
[17]Modrek B, Resch A, Grasso C, Lee C. Genome-wide detection of alternative splicing in expressed sequences of human genes. Nucleic Acids Res 2001; 29: 2850-2859.
[18]Brett D, Hanke J, Lehmann G et al. EST comparison indicates 38% of human mRNAs contain possible alternative splice forms. FEBS Lett 2000; 474: 83-86.
[19]Mironov AA, Fickett JW, Gelfand MS. Frequent alternative splicing of human genes. Genome Res 1999; 9: 1288-1293.
[20]Wikstrand CJ, Hale LP, Batra SK et al. Monoclonal antibodies against EGFRvIII are tumor specific and react with breast and lung carcinomas and malignant gliomas. Cancer Res 1995; 55: 3140-3148.
[21]Naor D, Nedvetzki S, Golan I et al. CD44 in cancer. Crit Rev Clin Lab Sci 2002; 39: 527-579.
[22]Saito H, Nakatsuru S, Inazawa J et al. Frequent association of alternative splicing of NER, a nuclear hormone receptor gene in cancer tissues. Oncogene 1997; 14: 617-621.
[23]Bass BL. RNA editing by adenosine deaminases that act on RNA. Annu Rev Biochem 2002; 71: 817-846.
基金資助:
2017浙江省教育廳課題(Y201738263)