徐鵬,于文強?
①上海市公共衛(wèi)生臨床中心,上海 201508; ②復旦大學 生物醫(yī)學研究院,上海 200032
2019年1月22日,復旦大學于文強實驗室歷時8年研發(fā)的全基因組DNA甲基化檢測新方法“導向定位測序(guide positioning sequencing,GPS)”在線發(fā)表[1],揭示了很多我們不曾想到的規(guī)律。開發(fā)全新的技術困難重重,個中辛酸難以言表。借著文章發(fā)表的契機,我們系統(tǒng)回顧了文章從想法到實現(xiàn)的歷程以及GPS所揭示的重要規(guī)律,希望為大家提供借鑒。
隨著人類基因組計劃的完成,生命科學研究進入了“后基因組時代”,而表觀遺傳學是“后基因組時代”的重要方向。DNA甲基化是表觀遺傳學的核心組成部分,對于正常細胞功能維持、胚胎發(fā)育等生命過程至關重要,堪稱人類基因組的“另外一套密碼”。
對個體中的每種組織細胞而言,DNA幾乎相同,表觀基因組卻差異巨大,而且隨著時間的變化而不同。典型的例子就是通過檢測外周血中特定位置的DNA甲基化竟然可預測一個人的年齡[2]。異常的DNA甲基化與人類許多疾病,尤其是腫瘤的發(fā)生發(fā)展具有密切關系。因此,進行全基因組DNA甲基化的精準檢測和分析無疑對探索腫瘤的發(fā)生、發(fā)展、轉(zhuǎn)移以及開發(fā)新的抗腫瘤策略具有重要意義。
各國科學家紛紛行動。2008年,美國NIH啟動了“表觀基因組學路線圖計劃(Roadmap Epigenomics Project)”,計劃繪制正常細胞、人類胚胎干細胞等多種細胞的表觀基因組。2010年,國際人類表觀基因組聯(lián)盟(International Human Epigenome Consortium,IHEC)建立,旨在檢測250種細胞類型中的至少1 000個表觀基因組。
全基因組DNA甲基化測序是表觀遺傳領域公認的“燒錢游戲”,而且由于比對率不夠高,造成大量的費用浪費。生物體基因組由A、T、C、G四種堿基構成,當DNA被重亞硫酸鹽處理后,未甲基化的C轉(zhuǎn)變?yōu)門,構成DNA的堿基只剩下A、T、G,其復雜度大幅度降低。測序完成后,大部分序列無法與人類參考基因組比對(map),DNA甲基化計算無從談起,而確定重復序列區(qū)域的DNA甲基化狀態(tài)更是全基因組DNA甲基化檢測者的噩夢。早期的全基因組DNA甲基化檢測的比對率不到30 %[3]。以30 %為例,可以理解為花費的100元中只有30元有用,另外70元測到的序列因無法比對而被白白浪費。與此同時,那70元檢測的序列其實是細胞內(nèi)真實存在的,只是因為技術的限制被人為地忽略掉了,因此這種檢測最大的風險可能是“舍本逐末”。考慮到那70 %的真實信息可能也很重要,而當只用30 %的DNA甲基化信息分析時,所得結(jié)論難免偏頗。
科學的進步是循序漸進的。2011年通過檢測大猩猩和人類各4份精子樣本的全基因組DNA甲基化即可以登上《細胞》雜志[4]。可想而知,全基因組DNA甲基化檢測是多少人的夢想,同時你也會覺察到,全基因組DNA甲基化檢測是“富人游戲”。因此,開發(fā)出人人可以負擔的全基因組DNA 甲基化檢測方法就顯得尤為重要。
GPS方法開發(fā)純屬偶然。2009年的一天,于文強教授在尋找線粒體DNA甲基化信息時,發(fā)現(xiàn)幾乎無信息可用。線粒體DNA僅16 kb左右,而當時已進入二代測序時代,如果連一個16 kb的DNA都沒有甲基化信息,并不是因為線粒體DNA甲基化不重要,可能是全基因組DNA甲基化檢測存在問題,而這些問題無疑會阻礙該領域的發(fā)展。合理質(zhì)疑是解決問題的前提,而要解決一個問題,首先要弄清楚導致這個問題的根本原因。已經(jīng)有文獻報道,WGBS測序最主要的問題是序列比對率低和比對準確性差。如果解決了這兩個問題,就很容易突破DNA甲基化檢測的瓶頸。
于文強教授在實驗室下達了開展 DNA甲基化檢測召集令。首先,于文強教授將目前DNA甲基化檢測所有方法的優(yōu)缺點一一羅列,以供參考;然后,他提出如果有誰能夠提出全新的解決方案,實驗室就會給予不同程度的獎勵。為了攻克這個難題,同學們絞盡腦汁。既然DNA甲基化核心問題是比對率低,我們就將重心放在如何提高比對率和準確性上。含有四個堿基的基因組比對沒有問題,我們何不借用雙端測序的優(yōu)勢,讓雙端測序的一端是基因組原序列,另一端是轉(zhuǎn)化后的表觀序列,那問題不就迎刃而解了!我們將這種全基因組 DNA 甲基化檢測方法命名為GPS,即“導向定位測序”(圖1)。該方法目前已經(jīng)獲得國內(nèi)和國際專利。
策略一旦制定,就需要考慮如何實現(xiàn)這一設想。我們想到了T4 DNA聚合酶:在反應體系中沒有dNTP的情況下,可發(fā)揮3' →5'外切酶的活性;當有反應體系中存在dNTP時,可發(fā)揮5' →3'聚合酶活性。不過在反應體系中,我們將dCTP換成甲基化的dmCTP就可以了。這樣一來,所有的DNA片段3'端在重亞硫酸鹽處理后依然保持基因組序列,可用來定位,而5'端就可用來計算甲基化。我們大約用了一個月的時間證明這種策略可行,從而使復雜的全基因組DNA甲基化檢測兩大難題迎刃而解。
做研究的人都知道,要創(chuàng)建一個全新方法并讓它高效工作,談何容易。我們要確定酶的用量、酶切的時間、酶切的溫度,進而對酶的活性進行精準把控。如果把握不好,要么就將DNA全切完了,要么切得很短,3'端無法定位。這期間我們想了好多辦法,難以把握一個精準的度,實驗結(jié)果反復無常,時好時壞。歷經(jīng)艱辛把所有實驗條件穩(wěn)定下來后,實驗數(shù)據(jù)的分析又成了大問題。由于沒有現(xiàn)成的軟件可以用,我們只好根據(jù)實驗設計自己編制分析軟件。大約用了3個月的時間,我們編制出第一版的軟件??僧敱葘y序數(shù)據(jù)時,我們發(fā)現(xiàn)200 G的數(shù)據(jù)需要計算機運行3周,一般的實驗室肯定吃不消。后來又編制了一版基于全新分析策略且需借助超級計算機的計算分析軟件,200 G的數(shù)據(jù)大約運行3天,這解決了數(shù)據(jù)分析的大問題。但我們的本意是開發(fā)人人可用的技術,又有多少實驗室可用超級計算機來分析DNA甲基化呢?于是我們再次編制了一版全新的軟件,目前在普通計算機上,200 G的數(shù)據(jù)運行時間為3天左右。至此,GPS的實驗條件和生物信息學分析軟件已全部優(yōu)化好了。在GPS方法優(yōu)化過程中,不難看出一個全新方法的產(chǎn)生和成熟確實需要花費很多的心思和精力,而這些難題我們都留給了自己。
GPS 檢測全基因組DNA甲基化理論上簡單,操作上易行,其優(yōu)勢不僅想得到,也看得見。
我們從人類參考基因組中隨機生成了100 萬個雙端測序讀長并進行相應的改變,以模擬雙端測序結(jié)果。由于已知這些片段確切的基因組位置,我們可以通過GPS策略計算它們精確比對的概率,進而評估GPS檢測DNA甲基化的準確性。如果使用BSMAP進行序列比對,其比對率僅為66.2 %,而GPS 的比對率高達82.3 %,接近于用Bowtie2進行基因組的比對率——86.3 %。在后續(xù)具體的實際測序和分析中,我們用焦磷酸測序?qū)嶒炓沧C明GPS具有極高的準確性,證明GPS具有精準檢測的先天優(yōu)勢(圖2)。
在對肝細胞實際檢測中,GPS比對率為 80.9 %,比WGBS 的比對率高15 %~20 %,這主要是WGBS數(shù)據(jù)的原理上的復雜度降低所致。在人類參考基因組中DNA雙鏈中有1 170 378 405個胞嘧啶(C)位點,以及56 434 896個CpG位點。以目前常用的基因芯片檢測方法為例,如450 K或850 K芯片,能夠檢測到的甲基化位點僅為45萬個或85萬個,占到人體基因組全部CpG的0.8 %~1.5 %,占全部胞嘧啶的0.04 %~0.07 %,而RRBS能夠檢測的CpG位點約為1 %。WGBS通常能夠覆蓋全部CpG位點的90 %左右,認為可以用來準確評估樣本的DNA甲基化狀態(tài)。在肝細胞中,GPS覆蓋到了54 853 393個CpG位點,覆蓋率高達97 %,同時也覆蓋到了1 123 233 333個胞嘧啶位點,覆蓋率為96 %。從嚴格意義上來講,只有全部確定了人體基因組中每一個胞嘧啶位點的甲基化狀態(tài)才能算是繪制了人體細胞的表觀基因組完整圖譜,我們認為,GPS為我們繪制了第一張人類肝細胞的表觀基因組圖譜(至少是最接近)。
圖1 導向定位測序(guide positioning sequencing,GPS)工作原理[1]
圖2 GPS比WGBS具有更高的比對率[1]
GPS甲基化檢測成本低主要基于GPS的高比對率,同時GPS測序數(shù)據(jù)比對只要超過5層就能夠比較精準地計算出DNA甲基化。而WGBS精準檢測甲基化一般情況下需要超過30層。目前GPS對一個樣本的檢測大約需要200 G的測序數(shù)據(jù),在10×Genomics測序平臺上大約相當于兩條lane的測序數(shù)據(jù),測序成本在1.5萬元左右,況且可以同時獲得基因組和表觀基因組數(shù)據(jù)。
通過比較GPS測序和人類基因組功能區(qū)的分布情況,很清楚地看到,GPS 檢測到的DNA甲基化位點在啟動子區(qū)域和功能基因組元件上沒有分布偏好性。與WGBS相比,GPS對于重復序列、CpG島以及富含GC(GC-rich)區(qū)域(如啟動子區(qū)域)的檢測具有更高的效率(圖3)。這些優(yōu)勢對全基因組的DNA甲基化精準檢測非常重要,可有效避免測序偏差導致結(jié)論的不確定性。例如,腫瘤細胞存在全基因組的DNA低甲基化現(xiàn)象,而偏偏WGBS傾向于檢測DNA的高甲基化區(qū)域,因此依靠WGBS來評估腫瘤細胞的全基因組DNA甲基化狀態(tài)就會高估腫瘤細胞DNA實際的甲基化水平。我們的結(jié)果也證明了這一點(圖3)。
圖3 GPS在全基因組范圍的覆蓋無偏好性,可覆蓋重復序列和富含GC區(qū)域[1]
GPS特別適用于精準檢測等位基因特異性的甲基化(allele-specific methylation,ASM),而ASM檢測有助于回答許多表觀遺傳調(diào)控的關鍵的基礎問題。例如,使用相同的數(shù)據(jù)量,GPS鑒定了1 820個ASM,而WGBS只鑒定了135個。我們也驗證了97 L細胞系中的兩個ASM,它們定位于CCDC97和TOP1MT基因,這些區(qū)域富含轉(zhuǎn)錄因子和DNaseI高敏感位點。因此, GPS更適用于研究基因組和表觀基因組之間的交互作用(crosstalk),而以前這些問題很難研究清楚。
眾所周知,DNA甲基化與基因表達調(diào)控密切相關?;騿幼訁^(qū)域的甲基化高,基因表達降低;啟動子區(qū)域的甲基化低,則基因表達升高。這種調(diào)控規(guī)律深入人心。但如果將一種特定組織細胞中所有啟動子區(qū)域的甲基化狀態(tài)與全部表達基因進行相關分析,發(fā)現(xiàn)二者并沒有顯著相關性,這意味著局部的規(guī)律性并不能代表整體的規(guī)律性。此外,某些基因的啟動子區(qū)域高甲基化并不意味著該基因表達一定降低,即有些基因啟動子區(qū)域的高甲基化,這個基因反而高表達。由此可見,DNA甲基化與基因表達調(diào)控并非我們想象的那么簡單。后來,全基因組DNA甲基化的檢測分析發(fā)現(xiàn),基因體的甲基化與啟動子區(qū)域正好相反,即基因體的高甲基化與基因的高表達有關,反之亦反(圖4)。GPS檢測分析發(fā)現(xiàn),這種規(guī)律也并不總是對的。例如,基因表達FPKM值超過20時,基因體DNA甲基化不再與基因表達正相關。結(jié)果顯示,F(xiàn)PKM值超過20的基因,其基因體甲基化程度更低,長度更短,更為保守,而且主要富集在代謝通路上。
那么問題隨之而來,啟動子和基因體DNA甲基化為何會有截然相反的調(diào)控規(guī)律,它們之間是否存在內(nèi)在的聯(lián)系并共同調(diào)控基因的表達?能否僅僅通過DNA甲基化檢測來精準預測基因的表達情況,而這一點對于評估某些感興趣的基因在特殊樣本(如石蠟樣本)中的表達具有重要意義。
鑒于GPS檢測每一個CpG位點甲基化的精準性,當我們用基因體和啟動子區(qū)域的DNA甲基化差值(MeGDP, methylation of genebody difference to promoter)與基因的表達進行相關性分析時,驚喜地發(fā)現(xiàn)MeGDP與基因表達之間的相關性高達0.67,提示MeGDP可以用來預測基因表達的情況(圖5)。如果利用WGBS測到的數(shù)據(jù)進行計算,得到相關系數(shù)僅為0.33。在其他樣本中應用GPS,也能得到類似的結(jié)果,而WGBS結(jié)果則毫無規(guī)律性可言。由此可見,MeGDP的發(fā)現(xiàn)得益于GPS對甲基化的精準檢測。
圖4 基因表達與啟動子區(qū)域以及基因體DNA甲基化有關[1]
切勿低估MeGDP,除了用于特殊樣本中基因表達的預測,其重要性遠不止于此。腫瘤的發(fā)生與免疫功能紊亂以及代謝異常密切相關,但表觀遺傳因素發(fā)揮了什么作用還有待探究。在肝癌細胞中,因MeGDP降低導致表達下調(diào)的基因主要富集在免疫與刺激反應以及代謝途徑相關基因,而且P值非常低。由此可見,MeGDP可以更好地用來研究腫瘤相關基因的表達調(diào)控與腫瘤各種生物學行為的關系。
圖5 MeGDP、H3K4me3和H3K36me3與基因表達均存在很強相關性
眾所周知,腫瘤發(fā)生與免疫系統(tǒng)紊亂有極大的關系,免疫監(jiān)視系統(tǒng)失衡是腫瘤發(fā)生的重要原因。腫瘤與免疫監(jiān)視系統(tǒng)的相互作用(tumorimmune surveillance network)包含兩層意思:其一是腫瘤細胞自身,其二是人體的免疫系統(tǒng)。但目前為止腫瘤如何逃避免疫系統(tǒng)還是一個謎。一般認為,腫瘤與免疫監(jiān)視系統(tǒng)相互作用的重點是免疫系統(tǒng),即腫瘤中的各種淋巴細胞異常,如火熱的免疫治療正是針對這些“不作為”的免疫細胞。近來有些研究去尋找腫瘤新生抗原(如Neoantigen),理論眾多,但實際應用的并不多。因此有必要重新認識并深入理解腫瘤免疫,尤其是從腫瘤細胞自身來重新詮釋腫瘤免疫。從表觀遺傳的角度,任何細胞都可能具有免疫細胞的特性,因此腫瘤細胞自身免疫相關基因的調(diào)控也是腫瘤免疫調(diào)控的重要組成部分。換言之,對于腫瘤免疫,我們不僅要關注免疫系統(tǒng),更需要關注腫瘤細胞內(nèi)在的天然免疫系統(tǒng)基因的調(diào)控,而腫瘤細胞中內(nèi)在的免疫相關基因的甲基化異常導致的基因沉默也許是腫瘤免疫逃逸的重要原因。
我們的研究結(jié)果表明,由于MeGDP導致的甲基化異常,腫瘤細胞中內(nèi)源性的免疫相關基因被異常甲基化所沉默,使得腫瘤細胞對外界的各種治療或免疫治療沒有反應。據(jù)此,我們推測,腫瘤的免疫耐受與免疫系統(tǒng)中的淋巴細胞可能沒有必然的關系,而由腫瘤細胞自身的表觀遺傳學異常這個內(nèi)因決定。在這個新的腫瘤免疫框架下,尋找預測腫瘤免疫治療的新靶標可能會出現(xiàn)新的轉(zhuǎn)機。
目前PD-1/PD-L1抗體治療的大量腫瘤患者沒有顯著效果,沒有人愿意成為其中的一員。擺在臨床醫(yī)生和廣大患者面前的一個重要且迫切的需求就是找出一個能夠預測PD-1治療有效性的標志物?,F(xiàn)在已經(jīng)存在一些標志物,比如PD-L1的表達量[5],可是在臨床的驗證中發(fā)現(xiàn)它并不好用。有研究認為腫瘤突變負荷(tumor mutation burden,TMB)不錯[6],但TMB并不是免疫治療特有預測標志物,也可以預測其他治療方案的效果。總之,目前的預測免疫治療的有效標志物并不理想。在黑色素瘤病人中,免疫監(jiān)控相關的干擾素IFNG通路基因的突變或拷貝數(shù)丟失使得抗-CALA4反應失效[7]。遺憾的是,IFN通路上60多個基因突變的概率太低,雖然很有意義,但臨床應用十分困難。借助GPS,我們對IFN 通路60多個基因的MeGDP與基因表達分析,發(fā)現(xiàn)MeGDP異常在肝癌細胞中確實可以導致 IFN 通路中的大多數(shù)基因表達下調(diào),進而可能用于PD-1治療效果的預測。如果想進一步破解PD-1治療不佳的魔咒,我們認為DNA甲基化抑制劑可能派得上用場,而且已有研究證明,5-AZA(5-氮雜-2'-脫氧胞嘧啶,一種DNA甲基化轉(zhuǎn)移酶抑制劑)確實與腫瘤細胞自身的免疫激活有關。我們也發(fā)現(xiàn),在5-AZA處理后,免疫相關基因EDNRB、ACP5以及BST2都上調(diào)2~75倍。此外,我們也有理由推測肝癌細胞中的MeGDP的異常模式導致的免疫相關基因沉默是目前肝癌藥物和其他療法不佳的重要因素。
MBS的發(fā)現(xiàn)和定義純屬偶然。MBS即methylation boundary shift,意為甲基化邊界漂移。談到DNA甲基化對基因的調(diào)控,我們大多關注DNA甲基化高和低,因為這直接決定了基因表達的低與高。然而,當我們將正常肝細胞和肝癌細胞的甲基化測序數(shù)據(jù)比對到參考基因組后,在UCSC genome browser站點上發(fā)現(xiàn),與正常肝細胞相比,肝癌細胞中以TSS為中心的啟動子區(qū)域DNA低甲基化范圍在大多數(shù)情況下總是顯示出更廣闊的“V”字形模式(wider opening)。這是巧合還是規(guī)律?我們發(fā)現(xiàn)腫瘤細胞中啟動子區(qū)域確實存在甲基化邊界的漂移(圖6左)。如圖所示,MBS現(xiàn)象在腫瘤細胞中非常清楚。MBS在腫瘤細胞中的出現(xiàn),會有怎樣的生物學功能呢?
MBS所在區(qū)域與H3K4me3高度重疊,但MBS與H3K36me3富集是互斥的(圖6右)。
圖6 97L細胞中MBS、H3K4me3和H3K36me3的分布[1]
我們的結(jié)果表明MBS向基因體方向的漂移與基因的高表達密切關聯(lián)(圖7左)。MYC基因就是一個典型的例子。腫瘤細胞中MYC基因高表達,但其調(diào)控機制很多,而在這里清楚地看到MYC基因的啟動子區(qū)域存在顯著的甲基化邊界漂移(圖7中),而且這種甲基化邊界漂移模式與H3K4me3的峰長相一致(圖7右),說明MBS至少在一定程度上與腫瘤細胞中MYC基因的表達上調(diào)有關。
既然MBS與基因表達有關,那么MBS是否與腫瘤的發(fā)生相關呢?通過對肝癌細胞中異常的MBS模式及相關基因表達進行分析發(fā)現(xiàn),這些基因富集在核糖體和細胞周期相關的通路。白血病細胞與正常造血祖細胞的形態(tài)學鑒定,很重要的一條標準就是細胞核中核仁的數(shù)量。核仁數(shù)量越多,是白血病細胞的可能性就越高,而核仁的增多離不開核糖體相關基因的高表達。如果按照傳統(tǒng)的甲基化調(diào)控理論,可能會認為rRNA基因不受表觀遺傳學調(diào)控,因為所有rRNA基因的啟動子均是低甲基化。而MBS揭示,DNA甲基化的邊界漂移與腫瘤中rRNA的高表達有關。進一步分析發(fā)現(xiàn),在60多個核糖體相關基因中,有48個核糖體基因的表達調(diào)控與MBS相關,而應用WGBS只發(fā)現(xiàn)了7個,再一次印證了GPS檢測甲基化的精準性。可以想象,如果甲基化的檢測準確性存疑,甲基化邊界的漂移鑒定就變成了一項不可能完成的任務。哪怕比較幸運,偶爾在WGBS數(shù)據(jù)中發(fā)現(xiàn)了MBS,但因為在下一個樣本中沒法重復,也很難得到規(guī)律性的結(jié)論。我們在兩個乳腺細胞系MCF-10A以及MCF-10A-1H中進行GPS測序,同樣發(fā)現(xiàn)MBS及相似的調(diào)控規(guī)律,說明MBS調(diào)控具有普遍性。
圖7 MBS與基因表達的相關性[1]
人類基因組中有數(shù)百萬的增強子元件,其中H3K27ac是活性增強子的標簽。既然啟動子區(qū)域存在明顯的MBS,我們自然會想到,作為與啟動子類似的順式調(diào)控元件,增強子是否也受到MBS的調(diào)控。我們的答案是肯定的。在肝細胞和肝癌細胞中,H3K27ac的峰寬也與MBS高度重疊(圖8左),提示MBS與H3K27ac具有相關性,進而對基因表達產(chǎn)生影響。與正常肝細胞相比,肝癌細胞的MBS發(fā)生了顯著的變化,進而引起增強子活性的選擇性丟失或重新獲得,這些增強子變化可導致相應的基因表達發(fā)生變化。我們驚訝地看到許多基因與細胞的身份相關,如肺發(fā)育、免疫細胞激活或其他組織特異性的基因。因此有理由相信,正是由于MBS異常模式導致腫瘤細胞增強子邊界和活性變化,進而促使組織特異性基因表達上調(diào)或下調(diào),引起細胞身份的得與失,而這一切也許在腫瘤發(fā)生和轉(zhuǎn)移過程中與腫瘤細胞特性的形成密切相關。
轉(zhuǎn)移是晚期腫瘤的顯著特征,關于腫瘤轉(zhuǎn)移的假說層出不窮,主要包含腫瘤干細胞理論、腫瘤微環(huán)境理論、上皮-間質(zhì)轉(zhuǎn)化理論、“種子—土壤”學說等10種。經(jīng)驗告訴我們,對于絕大多數(shù)腫瘤而言,一旦轉(zhuǎn)移,留給患者的時間就不多了。到目前為止,腫瘤轉(zhuǎn)移的研究還停留在“假說”階段。換句話說,假說依然是“假”的,并沒有被證實,所以我們對于腫瘤轉(zhuǎn)移依然束手無策。
“同化共生”(assimilated symbiosis),是我們基于我們的研究結(jié)果提出的有關腫瘤轉(zhuǎn)移的一個新概念。腫瘤細胞通過改變身份與特異性轉(zhuǎn)移的器官相互適應,進而在轉(zhuǎn)移的組織器官中與新的環(huán)境“同化共生”,可能是腫瘤轉(zhuǎn)移的新機制。物以類聚,人以群分,腫瘤的發(fā)生和轉(zhuǎn)移也一樣。腫瘤轉(zhuǎn)移是腫瘤治療失敗的重要原因之一,而腫瘤特異性的器官轉(zhuǎn)移機制并不清楚。例如,肝癌容易發(fā)生肺轉(zhuǎn)移,通過分析肝癌細胞97L和肝癌特異性轉(zhuǎn)移到肺的LM3細胞的DNA甲基化模式和基因表達情況,發(fā)現(xiàn)肝細胞特異性的基因表達顯著降低(圖9左),而肺細胞特異性的基因表達上調(diào)(圖9中)。我們認為肝細胞身份丟失和肺細胞身份的獲得是肝癌發(fā)生肺轉(zhuǎn)移的重要原因。在肝癌發(fā)生和轉(zhuǎn)移過程中,伴隨異常的DNA甲基化介導的細胞身份的丟失和獲得,使肺特異性基因表達增加,從而使肝癌細胞獲得了肺細胞的身份,這有助于肝癌細胞在肺的環(huán)境中適應和生存,而這也許是腫瘤轉(zhuǎn)移最重要的原因。簡單地說,就是細胞換了個“馬甲”,從而實現(xiàn)了“同化共生”。
圖8 增強子與MBS具有一致性
圖9 肝癌發(fā)生過程中細胞身份的丟失[1]
和我們預想的一樣,在97L和LM3肝癌細胞系中,肝特異性高表達的基因的數(shù)目分別降低了74 %和80 %。例如:一方面,在97L和LM3細胞中,肝特異性基因ONECUT2表達沉默,這與H3K27ac峰的丟失以及肝特異性增強子區(qū)域DNA甲基化的增加相一致(圖10左);另一方面,在97L和LM3中觀察到肺特異性基因CKS2的表達升高,這與H3K27ac峰的升高以及肺特異性增強子中DNA甲基化的降低相一致(圖10右)。在LM3中肺特異性的基因的表達可以幫助它們更好地在肺環(huán)境中適應和生存,即實現(xiàn)了“同化共生”,而腫瘤細胞身份的丟失以及其他細胞身份的獲得是腫瘤發(fā)生轉(zhuǎn)移的前提條件和重要轉(zhuǎn)折點。
圖10 肝癌發(fā)生和轉(zhuǎn)移過程中肝/肺特異性基因的表達變化[1]
“同化共生”背后的表觀遺傳因素可能是腫瘤發(fā)生特異性器官轉(zhuǎn)移的重要分子機制,這為我們理解腫瘤轉(zhuǎn)移提供了全新的視角。