左靜芝,劉江錫,王 敏,張 磊1,,韓 東,燕憲亮△
1.徐州醫(yī)科大學附屬醫(yī)院急診醫(yī)學科,江蘇徐州 221002;2.徐州醫(yī)科大學研究生院急救與救援醫(yī)學系,江蘇徐州 221004;3.徐州醫(yī)科大學附屬醫(yī)院徐州市急診醫(yī)學重點實驗室,江蘇徐州 221002;4.徐州醫(yī)科大學麻醉學院,江蘇徐州 221002
肝細胞癌(HCC)是一種惡性程度極高、易轉(zhuǎn)移、易復發(fā)的惡性腫瘤,是全世界因癌癥死亡的第二大常見原因[1- 2]。全球每年新增原發(fā)性肝癌患者超過62萬例,我國患者所占比例超過一半,極大地威脅著我國國民健康[3]。目前HCC的發(fā)病機制不清楚,已知的危險因素包括病毒感染、有毒物質(zhì)、代謝改變、肝硬化和吸煙等[3]。在受到這些危險因素中的一種或多種影響后,會出現(xiàn)遺傳和表觀遺傳的改變,可能會打破原癌基因與抑癌基因的平衡,從而導致HCC的發(fā)生[4]。手術切除、移植、靶向治療藥物是目前治療HCC的主要手段,但僅適用于30%~40%的HCC患者,而剩余60%~70%的患者僅適用于姑息和對癥治療[2]。總體來說,HCC患者的5年生存率仍然很低,尤其是晚期肝癌。因此,若能闡明HCC發(fā)生和發(fā)展的分子機制,就能在HCC病變早期發(fā)現(xiàn)疾病,可以增加有效治療的機會,從而提高存活率。
脂蛋白(a)[Lp(a)]是一種主要由肝臟合成的蛋白-脂質(zhì)復合物,有研究表明肝臟疾病患者組的血清Lp(a)水平顯著低于健康組[5-6],提示Lp(a)水平可能在一定程度上可以用于監(jiān)測肝臟疾病。其中血清中Lp(a)的水平70%~90%受Lp(a)基因(LPA)遺傳變異決定[7]。Lp(a)水平在HCC患者血清中明顯增高,且隨臨床分期/級越大,增幅越高,可作為臨床HCC診斷及分期依據(jù)[8]。此外,HCC患者血清載脂蛋白AⅠ和載脂蛋白AⅡ水平顯著降低, 但在HCC患者中發(fā)現(xiàn)前載脂蛋白AⅠ比率增高[9]。在慢性肝炎和HCC中, 血清載脂蛋白AⅠ和Lp(a)水平可以作為診斷肝臟損傷的指標[10]。目前,關于LPA在肝癌中的表達和預后價值研究很少,因此本研究通過生物信息學[7]的方法,評估LPA在HCC中的表達情況,分析LPA對HCC發(fā)生和預后的影響,為HCC發(fā)生、發(fā)展機制研究提供新的理論依據(jù),為臨床治療提供參考。
1.1基因芯片數(shù)據(jù)來源 本次分析的數(shù)據(jù)來源于腫瘤基因組圖譜計劃(TCGA)[11]和基因型組織表達(GTEx)正常組織數(shù)據(jù)庫。TCGA計劃是由美國國家癌癥研究所聯(lián)合國家人類基因組研究所開展的,目的是對20 000多個原發(fā)癌癥標本和33種癌癥類型的匹配正常標本進行分子特征分析,其中包含肝癌組織標本和癌旁正常組織對照標本,包括每一個標本的RNA-seq數(shù)據(jù)、分期、生存時間和狀態(tài)[11]。依據(jù)平臺中的注釋信息,剔除部分缺失生存相關信息或者無法準確進行癌癥分期的標本,共納入HCC標本369例、癌旁正常組織標本159例。
1.2方法
1.2.1LPA在腫瘤組織及癌旁正常組織的表達情況 筆者使用基因表達譜交互分析(GEPIA)平臺[12]分析LPA在33種腫瘤類型及匹配的癌旁正常組織中的表達。這些腫瘤包括腎上腺皮質(zhì)癌(ACC)、膀胱尿路上皮癌(BUCA)、乳腺浸潤癌(BRCA)、宮頸鱗癌和腺癌(CESC)、膽管癌(CHOL)、結(jié)腸癌(COAD)、肝細胞肝癌(LIHC)、肺腺癌(LUAD)、肺鱗癌(LUSC)、間皮瘤(MESO)等[11]。對于參數(shù)選項,筆者使用ANOVA統(tǒng)計方法進行差異基因表達分析,選擇log2(TPM+1)轉(zhuǎn)換后的表達數(shù)據(jù)用于繪圖, |log2FC|截止值為1,Q值截止值為0.01。
1.2.2LPA對HCC患者腫瘤分級和HCC患者總生存期(OS)的影響 GEPIA平臺利用TCGA和GTEx數(shù)據(jù)庫,探討LPA對HCC患者腫瘤分級和HCC患者OS的影響,繪制其與分期相關的小提琴圖和Kaplan-Merier生存曲線,關于生存曲線的假設檢驗,GEPIA考慮的是對數(shù)秩檢驗。為此,本研究選擇了一個基于Cox PH模型的風險比(HR)和95%可信區(qū)間信息(CI)來表示,95%CI為虛線。根據(jù)mRNA表達的中位數(shù)將癌癥患者分為高表達組和低表達組,并用K-M生存曲線進行驗證。因此,LPA表達水平高于和低于50%的標本分別被用作高表達組和低表達組。當P<0.05時為差異有統(tǒng)計學意義。
1.2.3LPA和DNA甲基轉(zhuǎn)移酶(DNMT)、錯配修復基因的相關分析 本研究使用TCGA數(shù)據(jù)庫,下載了HCC中LPA mRNA(LPA-001)的數(shù)據(jù),利用Perl軟件,采用Pearson相關系數(shù)法,對HCC中LPA-001與DNMT、錯配修復基因進行成對基因表達相關分析,其結(jié)果通過circos圖和熱圖[13](使用pheatmap包生成)顯示。通過TCGA數(shù)據(jù),我們確定了LPA mRNA 水平,并將其分別與33種癌癥DNA甲基轉(zhuǎn)移酶[14]進行相關性分析。利用TCGA的表達譜數(shù)據(jù)評估5個MMR基因,即 MLH1、MSH2、MSH6、PMS2和EPCAM突變,分別與33種癌癥組織中LPA表達水平之間的關系,其中相關性水平是使用Pearson 相關系數(shù)計算的,相關級別用r表示。
1.2.4GO功能注釋及KEGG通路富集分析 使用TCGA R軟件,基于 Wallenius non-central hyper-geometric distribution數(shù)學模型,對交集的差異基因進行GO功能注釋和KEGG通路富集分析。GO分為生物過程(BP)、細胞組成(CC)和分子功能(MF)3個部分。在GO和KEGG中搜索生物學過程,尋找顯著性水平集(P<0.05,濃縮分數(shù)>1.5)的途徑。選擇了基于P值的前10個BP、CC和MF進行繪圖。為了進一步明確LPA影響HCC發(fā)生、發(fā)展及預后可能通過哪些通路,將TCGA數(shù)據(jù)庫里面HCC組織與正常組織中的差異基因1,HCC組織中LPA高表達與低表達所得的差異基因2進行比較,得出交集差異基因,對交集差異基因進行GO功能注釋和KEGG通路富集分析。
2.1LPA在腫瘤及癌旁正常組織的表達情況 33種腫瘤組織與癌旁正常組織的LPA mRNA水平表達如圖1所示。結(jié)果顯示,在LIHC、ACC、BUCA及BRCA等癌癥中,癌組織LPA mRNA表達水平均明顯低于癌旁正常組織,差異均有統(tǒng)計學意義(P<0.05)。HCC組織中LPA存在3個轉(zhuǎn)錄本(圖2),其中ENST00000316300.9(LPA-001)表達豐度較高,因此選擇LPA-001作為比較。在HCC組織中LPA-001表達水平明顯低于癌旁正常組織(P<0.05)。
注:使用GEPIA網(wǎng)絡服務器,將TCGA 33種腫瘤類型中癌組織LPA mRNA水平與癌旁正常組織進行比較。每種腫瘤的癌組織或癌旁正常組織的LPA mRNA以圓點表示,對于每個TCGA腫瘤(淺灰色),給出其匹配的正常和GTEx數(shù)據(jù)(深灰色);T為腫瘤;N為正常。Y軸為log2(TPM+1)。X軸為癌組織和癌旁正常組織標本的數(shù)量。
2.2LPA在不同HCC腫瘤分級中的表達 如圖3A所示,LPA的表達與HCC患者腫瘤分級呈負相關(r=-0.18,P=0.01),LPA在HCC患者Ⅰ級、Ⅱ級、Ⅲ級的表達均高于Ⅳ級,表明在HCC早期階段,LPA表達水平比較高,但是到了HCC晚期,其表達水平較低。推測LPA可作為調(diào)節(jié)HCC進展并影響患者預后的潛在標志物。
2.3總體生存分析 為進一步闡明LPA表達水平是否可以影響HCC患者OS,通過GEPIA平臺依據(jù)LPA mRNA高低分組進行生存分析。如圖3B所示,在HCC數(shù)據(jù)中LPA 高表達組(n=182)比LPA低表達組(n=182)預后更好,log-ranking檢驗P=0.014,HR=0.64,LPA 高表達組與HCC患者的總體生存時間較長呈正相關(r=0.20,P=0.005,log-ranking檢驗,P<0.05),結(jié)果表明LPA是反映HCC良好預后的標志物。
注:LPA基因表達時存在3個轉(zhuǎn)錄本,包括ENST00000614786.1(LPA-202)、ENST00000447678.2(LPA-201)及ENST00000316300.9(LPA-001)。A表示ENST00000614786.1(LPA-202)的表達與癌旁正常組織標本的比較;B表示ENST00000447678.2(LPA-201)的表達與癌旁正常組織標本的比較;C表示3種轉(zhuǎn)錄本表達水平的比較。與癌旁正常組織標本相比,肝癌患者癌組織標本中LPA基因轉(zhuǎn)錄本ENST00000614786.1(LPA-202)與ENST00000447678.2(LPA-201)表達無明顯差異,而ENST00000316300.9(LPA-001)有明顯變化,說明ENST00000316300.9(LPA-001)是肝癌患者LPA基因的主要轉(zhuǎn)錄本,其主要構造可通過GEPIA2.0進一步可視化出ENST00000316300.9 (LPA-001)的結(jié)構。
注:A表示TCGA數(shù)據(jù)庫中HCC中LPA mRNA的小提琴圖譜,Y軸代表每個標本相應基因的表達值;B表示LPA基因在HCC中高表達組與低表達組的Kaplan-Meier生存曲線,淺黑線表示LPA高表達組,深黑線表示LPA低表達組,在Kaplan-Meier生存曲線中,LPA高表達組與良好預后相關。
2.4LPA和DNA甲基轉(zhuǎn)移酶相關分析 通過TCGA數(shù)據(jù)確定了LPA mRNA 水平,并將其分別與33種DNNT進行相關性分析,結(jié)果表明HCC組織中LPA mRNA 水平與3種DNMT水平呈負相關,即DNMT2 (r=-0.15,P=0.012)、DNMT3A (r=-0.22,P=5.5E-5)、DNMT3B(r=-0.13,P=0.027),提示LPA表達可能與HCC中DNA甲基化水平呈負相關。
2.5LPA基因和錯配修復基因相關分析 結(jié)果表明,在HCC組織中,LPA mRNA水平與MLH1、MSH2、PMS2、EPCAM等MMR基因表達水平呈負相關(r<0,P<0.05)。
2.6GO功能注釋與KEGG通路富集分析 GO功能注釋分析中,如圖4所示,BP基因富集功能數(shù)包括翻譯起始(translational initiation)、mRNA分解代謝(mRNA catabolic process)、病毒基因表達(viral gene expression)、病毒轉(zhuǎn)錄(viral transcription)等。CC富集功能數(shù)包括焦點粘連(focal adhesion)、細胞底物黏著連接(cell-substrate adherens junction)、細胞底物連接(cell-substrate junction)、核糖體亞基(ribosomal subunit)、胞漿核糖體(cytosolic ribosome)、核糖體(ribosome)等。MF富集功能包括核糖體結(jié)構成分(structural constituent of ribosome)、鈣黏著蛋白結(jié)合(cadherin binding)、細胞附著分子結(jié)合(cell adhesion molecule binding)、輔酶結(jié)合(coenzyme binding)、電子轉(zhuǎn)移活性(electron transfer activity)、核糖核蛋白復合物(ribonucleoprotein complex binding)、未折疊蛋白結(jié)合(unfolded protein binding)、泛素蛋白連接酶結(jié)合(ubiquitin protein ligase binding)、泛素樣蛋白連接酶結(jié)合物(ubiquitin-like protein ligase binding)等。
通過KEGG分析,筆者發(fā)現(xiàn)在HCC與LPA表達相關的基因,主要富集于以下通路:核糖體(ribosome)、氧化磷酸化(oxidative phosphorylation)、脂肪酸降解(fatty acid degradation)、PPAR信號通路(PPAR signaling pathway)、化學致癌作用(chemical carcinogenesis)、鐵死亡(ferroptosis)等30條途徑,見圖5。
注:顯示了HCC中LPA表達相關基因的KEGG通路分析。
肝癌是我國常見的惡性腫瘤之一,患者5年生存率不高[15]。盡管近些年靶向藥物的出現(xiàn)為原發(fā)性肝癌的治療帶來了曙光,但是它的應用仍然有限。原發(fā)性肝癌發(fā)生的分子機制尚需進一步確認,生物信息學可以幫助分析原發(fā)性肝癌基因?qū)用娴淖兓?,探索原發(fā)性肝癌發(fā)生的分子機制,為治療提供理論參考。
在本研究中,筆者分析了LPA在HCC中差異表達特征,評估其表達水平對HCC患者預后的影響。與癌旁正常組織相比,HCC組織中LPA mRNA水平較低。而將HCC患者按腫瘤分級后,發(fā)現(xiàn)隨腫瘤分級增加,LPA mRNA水平逐漸下降,且生存分析中顯示LPA mRNA水平較高與良好預后之間一致關聯(lián)。
臨床研究發(fā)現(xiàn)LPA基因的產(chǎn)物Lp(a)水平與肝臟疾病密切相關,與健康對照組相比,肝炎、肝硬化[5]、慢性遷徙性肝炎、HCC患者Lp(a)水平均較低。同樣在肝臟移植患者中的研究也有類似結(jié)果,肝移植患者術前Lp(a)水平較低,手術后逐漸恢復至穩(wěn)定水平[6]。本研究借助TCGA和GTEx數(shù)據(jù)庫信息,通過GEPIA平臺研究LPA mRNA水平與HCC發(fā)生、發(fā)展、預后的關系,研究證實了HCC組織中LPA的表達譜,并顯示3種LPA mRNA中,LPA基因轉(zhuǎn)錄本ENST0000031 6300.9(LPA-001)在HCC組織中的表達近似豐度最大,較癌旁正常組織下調(diào)。HCC組織中LPA基因轉(zhuǎn)錄本ENST00000614786.1(LPA-202)、ENST00000447678.2(LPA-201)表達與癌旁正常組織相比沒有明顯差異。在HCC患者中,癌組織LPA mRNA水平明顯低于正常組織,且差異有統(tǒng)計學意義(P<0.05)。此項結(jié)果正好與上述臨床研究中觀察到原發(fā)性肝癌患者中血清Lp(a)水平較低相符。
在LPA mRNA水平對HCC患者預后影響的研究中,筆者將HCC患者按腫瘤分級分類,結(jié)果顯示在肝癌早期LPA高表達,隨著腫瘤分級進展,LPA的表達水平逐漸下降,且差異有統(tǒng)計學意義(P<0.05)。盡管Ⅳ級肝癌中LPA水平有所回升,但差異并不顯著,這可能是由于Ⅳ級肝癌樣品數(shù)不足所導致。這表明LPA上調(diào)可能與HCC的進展呈負相關,表明該基因的功能可能是抑制HCC的進展。生存分析結(jié)果表明,數(shù)據(jù)庫中的LPA mRNA水平與HCC的預后有相關性,LPA mRNA水平較高的患者總體生存時間較長,這間接表明LPA與HCC進展相關,可作為HCC患者治療、診斷的預測因子。
表觀遺傳改變在決定基因及其產(chǎn)物何時何地表達的分化程序的建立和調(diào)控中起著至關重要的作用。MLH1、MSH4和RTF2參與了DNA修復,MLH1、MSH4、RPL22L1和RTF2主要影響細胞周期,NHLRC1、HENMT1、LYG1和SMAP1參與代謝過程,NHLRC1和HENMT1與基因表達調(diào)控有關[16]。雖然這些改變不會引起DNA序列的變化,但它們通過改變基因的DNA甲基化模式、microRNA的表達譜、組蛋白的翻譯后修飾和核小體位置,從而調(diào)節(jié)基因的表達[17-18]。在所有生物過程中,表觀遺傳調(diào)控都起著核心作用,還與許多疾病有關,包括HCC[19]、乳腺癌等[17]。到目前為止,已鑒定出4種DNMT (DNMT1、DNMT2、DNMT3A和DNMT3B)和1種DNMT相關蛋白(DNMT3L)[17-18],它們催化S-腺苷基甲硫氨酸(SAM)上的甲基轉(zhuǎn)移到胞嘧啶堿基上。除了在體內(nèi)可能作為RNA甲基轉(zhuǎn)移酶的DNMT2外,所有的DNMT2對于胚胎的存活都是必不可少的,基因組甲基化模式的維持主要由DNMT1介導,它通過細胞世代傳遞表觀遺傳信息,DNMT1的蛋白質(zhì)表達增加與人類HCC的惡性潛能和預后不良密切相關[14]。DNMT3A和DNMT3L一起母體印記基因甲基化,DNMT3B定位于微小的衛(wèi)星重復序列,而且還協(xié)同作用使基因組甲基化。乙型肝炎病毒X蛋白上調(diào)DNMT1、DNMT3A1和DNMT3A2來增加總DNMT活性,可選擇性地促進特定腫瘤抑制基因的區(qū)域甲基化,下調(diào)DNMT3B則誘導了衛(wèi)星2重復序列的整體甲基化不足,最終在表觀遺傳方面導致肝癌發(fā)生[4]。因此,筆者將LPA基因表達與4種DNMT進行相關性分析,結(jié)果表明HCC組織中LPA mRNA水平與DNMT2、DNMT3A、DNMT3B呈負相關,提示在HCC組織中LPA可能通過影響上述3種DNMT,從而進一步影響HCC的發(fā)生。
錯配修復基因在啟動DNA復制過程中涉及錯配核苷酸的切除修復,因此在維持人類基因組DNA的保真度方面起著至關重要的作用[20-22]。這一系統(tǒng)的缺陷導致微衛(wèi)星的幀移位突變,這可能是原癌基因和抑癌基因突變積累的原因,最終導致惡性轉(zhuǎn)化DNA修復缺陷,進而導致許多遺傳癌綜合征和散發(fā)性癌癥。機體內(nèi)參與DNA修復的途徑有5種,包括堿基切除修復、修復非同源末端連接、同源重組修復、錯配修復和核苷酸切除修復。MMR基因是一組遺傳易感基因,MMR的關鍵位點缺失會導致DNA復制錯誤且無法被修復,從而導致基因組中突變的積累,從而增加腫瘤惡變的概率[15]。相關研究表明,MMR基因表達減少與HCC的較高等級之間存在顯著關聯(lián)[23],所有類型HCC中都存在MLH1、MSH2、PMS2的啟動子甲基化[24]。因此,本研究選擇5個MMR基因(MLH1、MSH2、MSH6、PMS2和EPCAM)進行分析,結(jié)果顯示LPA mRNA水平與MLH1、MSH2、PMS2、EPCAM等MMR基因表達水平呈負相關(r<0,P<0.05)。這表明LPA與MLH1、MSH2、PMS2、EPCAM等MMR基因相關,在LPA高表達的HCC組織中,應用鉑類化療藥物可能抑制HCC組織中腫瘤細胞的DNA修復過程,進而抑制腫瘤的進展。
一些研究表明酒精所致的HCC中,乙醛對肝臟有毒,會改變脂質(zhì)體內(nèi)平衡,減少PPAR并增加固醇調(diào)節(jié)元件結(jié)合蛋白的活性,在乙醛和ROS的作用下,形成易于誘變的DNA復合物,干擾甲基化,從而導致與酒精相關的HCC的發(fā)生[21]。同樣,鐵死亡與肝癌發(fā)生,促進靶向藥物索菲替尼耐藥方面密切相關[22]。本研究通過GO富集分析發(fā)現(xiàn),這些差異表達基因主要集中在翻譯起始、mRNA分解代謝、病毒基因表達、病毒轉(zhuǎn)錄、焦點粘連、細胞底物黏著連接、細胞底物連接、核糖體結(jié)構成分、鈣黏著蛋白結(jié)合、細胞附著分子結(jié)合、輔酶結(jié)合、電子轉(zhuǎn)移活性等。KEGG分析也提示差異表達基因主要參與核糖體、氧化磷酸化、脂肪酸降解、PPAR信號通路、化學致癌作用、鐵死亡等途徑。由此推測,LPA有可能通過上述基因、通路,從而影響HCC的發(fā)生、發(fā)展及預后。
綜上所述,LPA在HCC組織中表達水平低,并且其與HCC的發(fā)生、發(fā)展、預后密切相關,可能通過PPAR信號通路、化學致癌作用、鐵死亡等途徑發(fā)生作用,但是這些還需要后續(xù)的真實實驗驗證。