汪徐春,孫玉潔
南京醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院細(xì)胞生物學(xué)系,江蘇省人類功能基因組學(xué)重點實驗室,江蘇 南京 211166
增強(qiáng)子最早于1981 年由Banerji 等[1]在猿猴空泡病毒SV40的DNA 序列5′端發(fā)現(xiàn),它能使HeLa 細(xì)胞中兔血紅蛋白β1 基因表達(dá)增加200 倍。之后,Gillies 等[2]在哺乳動物免疫球蛋白重鏈基因中也發(fā)現(xiàn)增強(qiáng)子的存在,并且該增強(qiáng)子的功能與序列方向、靶基因啟動子的位置無關(guān)。近年來,人類基因組DNA 元件百科全書(encyclopedia of DNA elements,ENCODE)[3]和表觀遺傳組學(xué)藍(lán)圖計劃[4]揭示了基因組中分布著大量潛在的增強(qiáng)子調(diào)控元件。
基因的轉(zhuǎn)錄失調(diào)是腫瘤發(fā)生和發(fā)展的重要機(jī)制[5],而增強(qiáng)子調(diào)控異常在其中發(fā)揮重要作用[6]。在腫瘤的發(fā)生和發(fā)展過程中,增強(qiáng)子在基因組中的分布發(fā)生動態(tài)變化,即基因組增強(qiáng)子重塑。增強(qiáng)子重塑包括新增強(qiáng)子的形成或原有增強(qiáng)子的消失,進(jìn)而形成新的增強(qiáng)子分布[7-8]。此外,腫瘤細(xì)胞中原有增強(qiáng)子的活性也會異常升高或減弱。無論是增強(qiáng)子重塑還是原有增強(qiáng)子活性的異常,均有可能促進(jìn)癌基因的轉(zhuǎn)錄激活以及抑癌基因的異常失活,成為腫瘤發(fā)生和發(fā)展的重要驅(qū)動因素。
本文簡述了增強(qiáng)子的結(jié)構(gòu)特征、調(diào)控模式,在腫瘤發(fā)生和發(fā)展過程中增強(qiáng)子調(diào)控異常的形成機(jī)制、增強(qiáng)子鑒定的技術(shù)手段及常用數(shù)據(jù)庫,這將有助于從一個不同的視角理解腫瘤發(fā)生發(fā)展的病理機(jī)制,并為增強(qiáng)子的深入研究提供新視野。
增強(qiáng)子是一段能顯著增強(qiáng)靶基因轉(zhuǎn)錄效率的DNA 序列,長度100~2 000 bp[9]。增強(qiáng)子具有特征性組蛋白修飾特征,依據(jù)修飾種類被分為3 種狀態(tài)[10]:①預(yù)激活狀態(tài),僅有H3K4me1(H3 lysine 4 monomethylation)修飾;②活性狀態(tài),既包含H3K4me1 又存在H3K27ac(H3 lysine 27 acetylation)修飾;③靜止?fàn)顟B(tài),同時存在H3K4me1 和H3K27me3(H3 lysine 27 trimethylation)修飾。預(yù)激活和靜止?fàn)顟B(tài)的增強(qiáng)子均無法發(fā)揮促進(jìn)轉(zhuǎn)錄的作用,只有轉(zhuǎn)變?yōu)榛钚誀顟B(tài)才能發(fā)揮調(diào)控功能。
增強(qiáng)子序列中含有不同轉(zhuǎn)錄因子的結(jié)合基序。大多數(shù)轉(zhuǎn)錄因子結(jié)合在染色質(zhì)開放區(qū)域,能夠招募增強(qiáng)子相關(guān)組蛋白修飾酶等改變增強(qiáng)子活性。有些轉(zhuǎn)錄因子作為先驅(qū)轉(zhuǎn)錄因子在沉默的染色質(zhì)區(qū)域結(jié)合,開放染色質(zhì)后招募其他轉(zhuǎn)錄因子形成增強(qiáng)子,調(diào)控胚胎發(fā)育和細(xì)胞分化等生物學(xué)過程[11]。
相當(dāng)一部分增強(qiáng)子具有細(xì)胞特異性,只在特定細(xì)胞類型或細(xì)胞生長發(fā)育的特定階段發(fā)揮調(diào)控功能,這是由細(xì)胞中特異性的蛋白決定的。如心血管譜系特異性轉(zhuǎn)錄因子GATA4(GATA bingding protein 4)作為先驅(qū)因子打開沉默的染色質(zhì)區(qū)域,募集NKX2-5(NK2 homeobox 5)和ETS1(ETS protooncogene 1)形成對心臟發(fā)育至關(guān)重要的增強(qiáng)子[12]。
增強(qiáng)子通過與靶基因啟動子形成染色質(zhì)環(huán)結(jié)構(gòu)上調(diào)靶基因表達(dá)。目前,已報道有多種關(guān)鍵因子參與染色質(zhì)環(huán)的形成,如轉(zhuǎn)錄因子CCCTC結(jié)合因子(CCCTC-binding factor,CTCF)、癌基因c-myc的產(chǎn)物MYC 蛋白以及核基質(zhì)結(jié)合蛋白1(SATB homeobox 1,SATB1)等。基因組中相距一定距離的兩個CTCF可通過凝集素復(fù)合物“擠壓”形成柔性染色質(zhì)環(huán),使處于CTCF結(jié)合位點之間的增強(qiáng)子與靶基因啟動子物理距離接近,再募集中介復(fù)合物促進(jìn)增強(qiáng)子和啟動子接觸,向啟動子傳遞轉(zhuǎn)錄信號[13]。CTCF 和凝集素還是拓?fù)潢P(guān)聯(lián)結(jié)構(gòu)域(topologically assocaited domain,TAD)的重要組成部分。TAD 是染色質(zhì)結(jié)構(gòu)單元,平均大小約1 Mb,能夠限制染色質(zhì)環(huán)的范圍[14]。最近研究發(fā)現(xiàn),遠(yuǎn)端增強(qiáng)子與靶基因啟動子的染色質(zhì)環(huán)是動態(tài)變化的。在小鼠胚胎干細(xì)胞中,凝集素釋放因子WAPL(WAPL cohesin release factor)形成游離的蛋白庫,通過循環(huán)的凝集素蛋白與染色質(zhì)的結(jié)合和釋放介導(dǎo)增強(qiáng)子和啟動子之間動態(tài)的相互作用[15]。而在骨肉瘤細(xì)胞中,增強(qiáng)子和啟動子相互作用區(qū)域MYC 的累積可以加強(qiáng)染色質(zhì)相互作用,增加染色質(zhì)接觸頻率,進(jìn)而驅(qū)動重塑致癌染色質(zhì)[16]。此外,本課題組研究發(fā)現(xiàn),核基質(zhì)結(jié)合蛋白SATB1可以介導(dǎo)BCL2基因3′-UTR內(nèi)的增強(qiáng)子元件與BCL2 基因啟動子區(qū)的染色質(zhì)環(huán)形成,通過上調(diào)BCL2基因表達(dá)調(diào)節(jié)細(xì)胞凋亡[17]。SATB1還可通過形成啟動子-增強(qiáng)子染色質(zhì)環(huán),調(diào)節(jié)參與T細(xì)胞發(fā)育的重要基因BCL6的表達(dá)[18]。
近年來的研究發(fā)現(xiàn),不僅啟動子可以招募RNA聚合酶Ⅱ(RNA polymeraseⅡ,RNAPⅡ)起始基因轉(zhuǎn)錄,部分活性增強(qiáng)子區(qū)域也能夠募集RNAPⅡ轉(zhuǎn)錄形成非編碼RNA 發(fā)揮調(diào)控作用,即增強(qiáng)子RNA(enhancer RNA,eRNA)[19]。eRNA序列通常小于200 bp,非多聚腺苷酸化,具有半衰期短和不穩(wěn)定的特點。由于eRNA 能夠促進(jìn)增強(qiáng)子和啟動子的相互作用,eRNA的表達(dá)水平與增強(qiáng)子的活性高度相關(guān)。如在雌二醇處理的乳腺癌細(xì)胞中,雌激素受體(estrogen receptor,ER)反應(yīng)性增強(qiáng)子轉(zhuǎn)錄的eRNA 可與凝集素相互作用,穩(wěn)定增強(qiáng)子與靶基因啟動子之間形成的染色質(zhì)環(huán),上調(diào)靶基因表達(dá)發(fā)揮促癌作用[20]。
增強(qiáng)子的活性受到眾多因素影響,遺傳變異、表觀修飾異常以及轉(zhuǎn)錄因子異常均可能造成增強(qiáng)子的活性升高或者降低。此外,表觀修飾異常以及轉(zhuǎn)錄因子異常還能導(dǎo)致基因組中增強(qiáng)子的重塑,同時改變多個下游靶基因的表達(dá)水平,從而在腫瘤的發(fā)生和發(fā)展中發(fā)揮重要作用。
增強(qiáng)子序列的遺傳變異包括單核苷酸多態(tài)性和結(jié)構(gòu)變異。單核苷酸多態(tài)性是人類可遺傳變異中最常見的一種。近年來,針對肺癌、乳腺癌、結(jié)腸癌、前列腺癌和胰腺癌等不同惡性腫瘤的全基因組關(guān)聯(lián)研究(genome-wide association study,GWAS)[21]發(fā)現(xiàn)了大量腫瘤風(fēng)險遺傳變異[22-23],其中多數(shù)位于增強(qiáng)子元件內(nèi)部[3]。研究顯示,增強(qiáng)子遺傳變異能夠改變增強(qiáng)子與轉(zhuǎn)錄因子的結(jié)合能力,進(jìn)而增強(qiáng)或削弱其對靶基因的調(diào)控,導(dǎo)致靶基因表達(dá)失調(diào),是惡性腫瘤發(fā)生發(fā)展的重要遺傳基礎(chǔ)之一[24-26]。本課題組研究發(fā)現(xiàn),在13q12.12 染色質(zhì)區(qū)存在1 個肺組織特異性增強(qiáng)子,而其中與肺癌風(fēng)險SNP rs753955(A>G)強(qiáng)連鎖的3 個SNP 可顯著降低該增強(qiáng)子與p53的結(jié)合能力及其對p53蛋白的反應(yīng)性,進(jìn)而抑制其對下游靶基因的調(diào)控活性,促進(jìn)肺特異性致癌物誘導(dǎo)的支氣管上皮細(xì)胞惡性轉(zhuǎn)化[27]。轉(zhuǎn)錄因子NK3 同源盒1(NK3 homeobox 1,NKX3.1)和YY1 結(jié)合基序分別與前列腺癌風(fēng)險SNP rs11672691和其強(qiáng)連鎖的SNP 位點重疊。NKX3.1 和YY1 與野生型SNP 結(jié)合后使相應(yīng)SNP 所在區(qū)域啟動子活性升高,激活長鏈非編碼RNA 前列腺癌轉(zhuǎn)錄本19(prostate cancer associated transcript 19,PCAT19)短亞型的轉(zhuǎn)錄。這兩個SNP 位點的突變使NKX3.1和YY1結(jié)合減弱,導(dǎo)致短亞型的啟動子活性下降,而作為促癌轉(zhuǎn)錄本PCAT19 長亞型的增強(qiáng)子發(fā)揮功能,從而促進(jìn)前列腺癌進(jìn)展[28]。
電子鎖通過RTC時鐘與服務(wù)器進(jìn)行時間同步,每隔60 s生成一個新密碼,用戶通過權(quán)限驗證后從認(rèn)證服務(wù)器獲得密碼并通過鍵盤輸入主控制器,STM32主控制器將輸入密碼與電子鎖當(dāng)前生成動態(tài)密碼進(jìn)行比對,如果匹配則控制繼電器打開電磁鎖,并將開鎖狀態(tài)通過藍(lán)牙模塊發(fā)送至樹莓派核心,輸入錯誤累計3次則報警,圖4為動態(tài)密碼電子鎖程序流程圖。
此外,某些SNP 變異能夠使增強(qiáng)子與轉(zhuǎn)錄因子的結(jié)合能力增強(qiáng),提高增強(qiáng)子活性。如位于19q13侵襲性前列腺癌染色質(zhì)區(qū)域的增強(qiáng)子內(nèi)部SNP 變異增強(qiáng)了轉(zhuǎn)錄因子同源框A2(homeobox A2,HOXA2)與增強(qiáng)子的結(jié)合,升高增強(qiáng)子活性,上調(diào)PCAT19 和CEA 細(xì)胞粘附分子21(CEA cell adhesion molecule 21,CEACAM21)基因的轉(zhuǎn)錄,進(jìn)而促進(jìn)前列腺癌細(xì)胞的侵襲和遷移能力[29]。SNP也可能在增強(qiáng)子區(qū)域引入新的結(jié)合位點,導(dǎo)致活性增強(qiáng)子形成。如神經(jīng)母細(xì)胞瘤保護(hù)性SNP 變異可增進(jìn)轉(zhuǎn)錄因子GATA 的結(jié)合,促進(jìn)H3K27ac 修飾形成活性增強(qiáng)子,增強(qiáng)致癌靶基因轉(zhuǎn)錄發(fā)揮促癌作用[30]。
基因組結(jié)構(gòu)變異通常是指基因組長片段(>50 bp)的序列和位置改變,包括長片段的插入和缺失、基因拷貝數(shù)變異、染色體內(nèi)部或染色體間的易位等不同類型。基因組片段的缺失可破壞細(xì)胞拓?fù)潢P(guān)聯(lián)結(jié)構(gòu)域邊界,使增強(qiáng)子和原癌基因之間的邊界消失,促進(jìn)癌基因表達(dá)[31]。增強(qiáng)子的拷貝數(shù)變異可增加癌基因的表達(dá),促進(jìn)頭頸部鱗狀細(xì)胞癌、肺腺癌等惡性進(jìn)展[32]。
此外,增強(qiáng)子結(jié)構(gòu)變異還會造成“增強(qiáng)子劫持”,即將某一特定的增強(qiáng)子“劫持”到基因組中的其他位置,失去對原有靶基因的調(diào)控,而使新的靶基因表達(dá)明顯增加的現(xiàn)象。2014 年,Northcott 等[33]研究發(fā)現(xiàn)3 亞型髓母細(xì)胞瘤的基因組中9q34 染色質(zhì)區(qū)域發(fā)生長片段缺失、染色體重排等不同類型的結(jié)構(gòu)變異。無論變異類型如何,都會使原本調(diào)控DEAD 盒蛋白31(DEAD-box helicase 31,DDX31)基因的增強(qiáng)子被劫持到生長因子非依賴性1B 轉(zhuǎn)錄抑制因子(growth factor independent 1B transcriptional repressor,GFI1B)基因約31 kb 范圍內(nèi),激活GFI1B癌基因轉(zhuǎn)錄促進(jìn)3 亞型髓母細(xì)胞瘤的發(fā)生。2021年,Montefiori 等[34]研究發(fā)現(xiàn)染色體重排驅(qū)動BCL11轉(zhuǎn)錄因子B(BCL11 transcription factor B,BCL11B)基因與造血祖細(xì)胞中活性增強(qiáng)子在基因組中位置并列,劫持的增強(qiáng)子上調(diào)BCL11B 基因表達(dá)驅(qū)動急性白血病發(fā)生。
組蛋白H3K4me1 修飾是增強(qiáng)子的標(biāo)志。H3K4me1 修飾由賴氨酸甲基轉(zhuǎn)移酶2C(lysine methyltransferase 2C,KMT2C,又稱MLL3)和KMT2D(又稱MLL4)催化完成。而賴氨酸去甲基轉(zhuǎn)移酶1A(lysine demethylase 1A,KDM1A)和KDM1B 介導(dǎo)H3K4去單甲基化。此外,組蛋白H3K27me3修飾是無活性靜止?fàn)顟B(tài)增強(qiáng)子的標(biāo)志,KDM6A 和KDM6B介導(dǎo)H3K27去三甲基化。因此,這些修飾酶基因的缺失或表達(dá)異常增高會導(dǎo)致增強(qiáng)子調(diào)控的異常,使細(xì)胞的轉(zhuǎn)錄模式發(fā)生改變,進(jìn)而促進(jìn)腫瘤的形成和發(fā)展。值得關(guān)注的是,雖然KMT2C 和KMT2D 是特異性的H3K4me1修飾酶,但是研究發(fā)現(xiàn)這兩個基因的缺失均能夠造成增強(qiáng)子區(qū)域H3K4me1 和H3K27ac 信號的同時減弱,提示KMT2C 和KMT2D的修飾功能存在相互依存。在ER陽性的乳腺癌中,KMT2C 缺失導(dǎo)致ERα結(jié)合的促癌增強(qiáng)子H3K4me1和H3K27ac丟失,抑制乳腺癌細(xì)胞增殖[35]。KMT2D缺失使前列腺癌[36]和黑色素瘤[37]細(xì)胞全基因組中H3K4me1和H3K27ac信號減弱,發(fā)揮致癌作用。
此外,在前列腺癌細(xì)胞中,KDM1A 表達(dá)下降會破壞FOXA1 與染色質(zhì)結(jié)合,進(jìn)而下調(diào)雄激素受體(androgen receptor,AR)介導(dǎo)的增強(qiáng)子活性及相應(yīng)基因轉(zhuǎn)錄,顯著降低癌細(xì)胞生長能力[38]。研究發(fā)現(xiàn)KDM6A 能夠通過H3K27me3 去甲基化酶活性非依賴性的方式招募MLL3/4 和p300,實現(xiàn)對增強(qiáng)子活性的調(diào)節(jié)。以骨髓惡性腫瘤為例[39],盡管KDM6A缺失后全基因組H3K27me3 改變不明顯,但是H3K27ac和染色質(zhì)可及性發(fā)生了顯著變化。從機(jī)制上說,KDM6A 抑制致癌因子ETS 與DNA 結(jié)合,當(dāng)KDM6A缺失后基因組中ETS結(jié)合增加,ETS通過招募組蛋白乙酰轉(zhuǎn)移酶促進(jìn)H3K27ac 修飾,升高增強(qiáng)子活性發(fā)揮促癌效應(yīng)。與KDM6A 有所不同,KDM6B 通過抑制H3K27me3 修飾以穩(wěn)定增強(qiáng)子-啟動子相互作用,上調(diào)癌基因MYCN和c-myc轉(zhuǎn)錄,在神經(jīng)母細(xì)胞瘤中發(fā)揮腫瘤促進(jìn)作用[40]。
除了組蛋白甲基化修飾,增強(qiáng)子活性還受組蛋白乙?;揎椀恼{(diào)節(jié)。其中,H3K27ac 修飾與增強(qiáng)子的調(diào)控活性顯著正相關(guān)。研究較多的組蛋白乙酰轉(zhuǎn)移酶是p300(也稱為KAT3B)和環(huán)磷酸腺苷反應(yīng)元件結(jié)合蛋白(cAMP-response element binding protein,CREB)的結(jié)合蛋白(CREB binding protein,CBP,也稱KAT3A)。CBP 由CREBBP 基因編碼,p300 由EP300 基因編碼。CBP 和p300 具有高度保守的結(jié)構(gòu)。它們的乙酰轉(zhuǎn)移酶結(jié)構(gòu)域、乙酰賴氨酸結(jié)合溴結(jié)構(gòu)域幾乎相同。有研究報道p300 缺失會使基因組中H3K27ac 信號減弱,進(jìn)而重塑增強(qiáng)子,使參與細(xì)胞分化和白血病轉(zhuǎn)化的基因表達(dá)受限,從而加速骨髓增生異常綜合征的進(jìn)展[41]。另外,有研究報道在急性淋巴細(xì)胞白血病中,CBP和MYB結(jié)合的增強(qiáng)子共定位,促進(jìn)H3K27ac 富集,上調(diào)增強(qiáng)子活性驅(qū)動癌基因表達(dá)[42]。
DNA甲基化是在基因序列不改變的前提下,通過DNA甲基轉(zhuǎn)移酶介導(dǎo),以s-腺苷甲硫氨酸為甲基供體,將甲基添加到胞嘧啶的第5 位碳原子上,形成5-甲基胞嘧啶的過程。相比于正常組織,腫瘤組織細(xì)胞中基因組DNA 甲基化修飾水平發(fā)生顯著變化[43-44]。研究發(fā)現(xiàn),在腫瘤的進(jìn)展過程中,增強(qiáng)子始終是甲基化改變最大的區(qū)域[45]。腫瘤細(xì)胞中增強(qiáng)子區(qū)域異常低甲基化上調(diào)下游靶基因表達(dá),而異常高甲基化則導(dǎo)致下游靶基因表達(dá)下調(diào),并且增強(qiáng)子甲基化與癌癥基因失調(diào)之間的相關(guān)性顯著高于啟動子甲基化與基因失調(diào)的相關(guān)性[46]。
已知增強(qiáng)子區(qū)域的低甲基化有助于轉(zhuǎn)錄因子結(jié)合進(jìn)而提高增強(qiáng)子的活性。例如,ER陽性的乳腺癌細(xì)胞中增強(qiáng)子區(qū)域的異常低甲基化,可增加ERα、FOXA1 和GATA 結(jié)合蛋白3(GATA binding protein 3,GATA3)與增強(qiáng)子的結(jié)合,激活雌激素依賴性的腫瘤生長基因表達(dá),發(fā)揮促癌作用[47]。Yang等[48]發(fā)現(xiàn)在急性髓性白血病細(xì)胞中,DNA甲基轉(zhuǎn)移酶3A(DNA methyltransferase 3 alpha,DNMT3A)的缺失導(dǎo)致增強(qiáng)子區(qū)域的DNA低甲基化,并促進(jìn)ETS轉(zhuǎn)錄因子FLI1(Fli-1 proto-oncogene,ETS transcription factor)與增強(qiáng)子的結(jié)合,增加其調(diào)控活性,上調(diào)促T 細(xì)胞增殖的靶基因轉(zhuǎn)錄從而促進(jìn)白血病的發(fā)生和發(fā)展。此外,增強(qiáng)子的低甲基化還可通過促進(jìn)eRNA轉(zhuǎn)錄,穩(wěn)定增強(qiáng)子與啟動子的相互作用,發(fā)揮促癌作用[49]。
SWI/SNF家族成員的基因突變或表達(dá)水平異??蓪?dǎo)致增強(qiáng)子活性異常,使下游靶基因轉(zhuǎn)錄失調(diào)進(jìn)而產(chǎn)生致癌效應(yīng)。雖然SWI/SNF 家族蛋白在所有癌癥中的平均突變率約為20%[51],但是單個亞基的突變頻率在不同腫瘤類型中的差異很大。如催化亞基染色質(zhì)亞家族B 調(diào)節(jié)因子1(SWI/SNF related matrix associated actin dependent regulator of chromatin subfamily B member 1,SMARCB1)基因在惡性橫紋肌腫瘤中突變率約95%,主要表現(xiàn)為雙等位基因缺失。野生型SMARCB1蛋白不僅可與p300相互作用促進(jìn)H3K27ac 修飾[52],還可促進(jìn)經(jīng)典BRG/BRM相關(guān)因子復(fù)合物(canonical Brg/Brahma-associated factors,cBAF)的穩(wěn)定性,維持基因組中抑癌功能增強(qiáng)子的活性,進(jìn)而抑制橫紋肌腫瘤的發(fā)生[53]。然而,含ARID 結(jié)構(gòu)域的1A(AT-rich interaction domain 1A,ARID1A)基因在乳腺癌中的突變率僅為5%。野生型ARID1A能在ER結(jié)合的潛在增強(qiáng)子處富集,通過募集組蛋白去乙酰化酶1(histone deacetylase 1,HDAC1)發(fā)揮轉(zhuǎn)錄抑制作用。在ARID1A 基因發(fā)生失活突變后,HDAC1 不再結(jié)合在增強(qiáng)子區(qū)域,使該區(qū)域BRD4結(jié)合增加,乙?;揎椩鰪?qiáng),促進(jìn)腫瘤細(xì)胞生長[54]。有別于SMARCB1 和ARID1A 的作用機(jī)制,SMARCE1 基因在透明細(xì)胞腦膜瘤中的失活突變,能夠降低全基因組中遠(yuǎn)端增強(qiáng)子cBAF 結(jié)合率和DNA 可及性,產(chǎn)生腦膜瘤特征性的轉(zhuǎn)錄圖譜,促進(jìn)腫瘤進(jìn)展[55]。另外,SWI/SNF家族成員催化亞基染色質(zhì)肌動蛋白依賴性調(diào)節(jié)因子4(SWI/SNF related matrix associated actin dependent regulator of chromatin subfamily A member 4,SMARCA4)的異常高表達(dá)促進(jìn)PAX3-FOXO1 融合陽性橫紋肌肉瘤惡性進(jìn)展。SMARCA4 通過促進(jìn)轉(zhuǎn)錄因子MYCN 與增強(qiáng)子的結(jié)合,升高M(jìn)YCN 反應(yīng)性增強(qiáng)子的H3K27ac水平,驅(qū)動靶基因轉(zhuǎn)錄發(fā)揮促癌作用[56]。
CHD 家族成員的基因缺失或異常高表達(dá)也會改變增強(qiáng)子的活性,發(fā)揮促癌作用。其中,CHD1基因在約15%的前列腺癌患者中缺失。野生型CHD1與AR 在前列腺細(xì)胞特異性增強(qiáng)子上共定位。在CHD1 基因丟失后,全基因組中AR 結(jié)合分布改變,使其更傾向于結(jié)合在同源盒蛋白B13(homeobox B13,HOXB13)反應(yīng)性增強(qiáng)子,驅(qū)動致癌途徑激活相關(guān)基因的表達(dá)[57]。CHD8在前列腺癌細(xì)胞中異常高表達(dá),通過與AR直接相互作用,在跨膜絲氨酸蛋白酶2(transmembrane serine protease 2,TMPRSS2)基因的增強(qiáng)子區(qū)域共定位,發(fā)揮促癌效應(yīng)[58]。在橫紋肌肉瘤細(xì)胞中異常高表達(dá)的CHD4蛋白與PAX3-FOXO1蛋白協(xié)同作用,激活增強(qiáng)子上調(diào)癌基因表達(dá)[59]。
轉(zhuǎn)錄因子在調(diào)節(jié)增強(qiáng)子活性中發(fā)揮重要作用。轉(zhuǎn)錄因子的突變、表達(dá)水平異常以及染色體易位形成融合基因后編碼的嵌合轉(zhuǎn)錄因子能夠通過不同機(jī)制,使增強(qiáng)子活性發(fā)生異常,甚至形成增強(qiáng)子重塑現(xiàn)象[60]。
轉(zhuǎn)錄因子突變可影響其與增強(qiáng)子序列及共轉(zhuǎn)錄因子結(jié)合的能力,進(jìn)而改變增強(qiáng)子活性以及基因組增強(qiáng)子重塑。例如,急性髓性白血病中CCAAT增強(qiáng)子結(jié)合蛋白α(CCAAT enhancer binding protein alpha,CEBPα)的突變使其與DNA結(jié)合能力受損,導(dǎo)致UL16 結(jié)合蛋白2(UL16 binding protein 2,ULBP2),ULBP5 和ULBP6 基因的增強(qiáng)子活性下降,使腫瘤細(xì)胞逃避自然殺傷細(xì)胞介導(dǎo)的細(xì)胞裂解[61]。轉(zhuǎn)錄因子p53 DNA 結(jié)合域的突變使之在基因組中的結(jié)合分布發(fā)生改變,通過招募與增強(qiáng)子形成相關(guān)的蛋白,形成新的增強(qiáng)子。在結(jié)直腸癌中,R273H突變型p53 能夠與p65 直接相互作用并在p65 反應(yīng)元件處富集,促進(jìn)新的增強(qiáng)子形成并響應(yīng)腫瘤壞死因子α信號。從機(jī)制上說,一方面由于突變型p53能夠與MLL4 直接相互作用,促進(jìn)基因組中p65 結(jié)合區(qū)域H3K4me1修飾[62]。另一方面,突變型p53可與含溴結(jié)構(gòu)域4(bromodomain containing 4,BRD4)蛋白直接相互作用,富集p65 結(jié)合區(qū)域H3K27ac 信號[63]。此外,突變型p53 可募集RNAPⅡ到新的增強(qiáng)子區(qū)域轉(zhuǎn)錄eRNA,激活癌基因的轉(zhuǎn)錄促進(jìn)結(jié)直腸癌細(xì)胞的侵襲[64]。
腫瘤細(xì)胞中轉(zhuǎn)錄因子的異常高表達(dá)可改變增強(qiáng)子組蛋白修飾調(diào)控增強(qiáng)子活性或者造成增強(qiáng)子重塑。例如,先驅(qū)轉(zhuǎn)錄因子叉頭框蛋白1(forkhead box A1,F(xiàn)OXA1)在ER陽性乳腺癌中異常高表達(dá),通過與MLL3 相互作用,使基因組中ER 結(jié)合區(qū)域H3K4me1 修飾增加,形成新的增強(qiáng)子致使轉(zhuǎn)錄激活,促進(jìn)乳腺癌細(xì)胞增殖[65]。HOXA9異常高表達(dá)招募CEBPα和MLL3/MLL4復(fù)合物,通過形成新的增強(qiáng)子促進(jìn)白血病形成[66]。p63的N 末端亞型ΔNp63可通過招募p300重塑肺干細(xì)胞的增強(qiáng)子,驅(qū)動肺腺癌和鱗癌發(fā)生[7]。此外,轉(zhuǎn)錄因子異常高表達(dá)還能夠顯著增加增強(qiáng)子與癌基因啟動子的相互作用頻率,促進(jìn)腫瘤進(jìn)展[16]。
染色體易位形成融合基因后所編碼的嵌合轉(zhuǎn)錄因子,可通過獲得異常的轉(zhuǎn)錄活性調(diào)節(jié)增強(qiáng)子的活性。例如,正常肌生成早期的轉(zhuǎn)錄因子配對盒基因(paired box,PAX)家族成員和晚期調(diào)節(jié)因子肌源性因子4(myogenin,MYOG)在肌肉發(fā)育過程中的表達(dá)相互排斥。但是,基于染色體易位形成的融合基因PAX3-FOXO1,除了轉(zhuǎn)錄活性比野生型PAX3 高10~100倍之外,還與MYOG等肌源性轉(zhuǎn)錄因子在橫紋肌肉瘤中同時高表達(dá)。二者通過招募BRD4蛋白增強(qiáng)H3K27ac 信號,形成活性增強(qiáng)子,使肌源性轉(zhuǎn)錄失調(diào)促進(jìn)腫瘤發(fā)生[67]。
基因組中增強(qiáng)子的鑒定和功能研究對探討其在腫瘤中的作用具有重要意義。根據(jù)增強(qiáng)子的研究角度將這些研究手段分為兩大類:①增強(qiáng)子及其活性鑒定,這些技術(shù)包括染色質(zhì)免疫共沉淀測序(chromatin immunoprecipitation sequencing,ChIPseq),核酸酶靶向切割與釋放(cleavage under targets and release using,CUT&RUN)以及利用轉(zhuǎn)座酶檢測染色質(zhì)可及性測序(assay for transposase accessible chromatin with high-throughput sequencing,ATAC-seq)技術(shù),大規(guī)模并行報告基因檢測(massively parallel reporter assay,MPRA)和自轉(zhuǎn)錄活性調(diào)控區(qū)域測序(self-transcribing active regulatory region sequencing,STARR-seq),新生RNA 測序(global nuclear runon sequencing,GRO-seq)等;②增強(qiáng)子的靶基因鑒定及其功能研究,這些技術(shù)包括染色質(zhì)構(gòu)象捕獲(capturing chromosome conformation,3C)及其衍生技術(shù),間隔成簇短回文重復(fù)序列-核酸酶9(clustered regularly interspaced short palindromic repeats-associated9,CRISPR-Cas9)和CRISPR-鈍化Cas9(CRISPRdead Cas9,CRISPR-dCas9)等。
隨著對增強(qiáng)子特征的認(rèn)識和高通量技術(shù)的快速發(fā)展,近年來人們主要利用增強(qiáng)子的表觀修飾特征,結(jié)合二代測序的技術(shù)方法對全基因組中潛在增強(qiáng)子進(jìn)行分析和鑒定。最常用的ChIP-seq 技術(shù)是通過富集增強(qiáng)子特征修飾的組蛋白或轉(zhuǎn)錄因子結(jié)合的DNA 序列,再通過測序在全基因組鑒定潛在增強(qiáng)子。2017 年,Skene 等[68]優(yōu)化該技術(shù)開發(fā)出CUT&RUN,CUT&RUN通過微球菌核酸酶進(jìn)行抗體靶向的特定蛋白質(zhì)-DNA 酶切和純化,再測序分析,具有細(xì)胞起始量低、實驗周期短和信噪比高等優(yōu)點。此外,利用ATAC-seq對染色質(zhì)開放區(qū)域的分析有助于增強(qiáng)子的鑒定。Tn5轉(zhuǎn)座酶與Tn5轉(zhuǎn)座子形成轉(zhuǎn)座復(fù)合物,通過切割靶DNA序列將Tn5轉(zhuǎn)座子插入其中。只有DNA 與組蛋白結(jié)合松散時,Tn5 轉(zhuǎn)座酶才能酶切并完成轉(zhuǎn)座。ATAC-seq 利用這一特點,將改造后攜帶測序接頭的Tn5 轉(zhuǎn)座酶加入細(xì)胞核中,Tn5轉(zhuǎn)座酶首先在染色質(zhì)開放區(qū)域進(jìn)行酶切,然后再完成已知測序接頭的轉(zhuǎn)座,通過建庫測序分析染色質(zhì)可及性。有研究者使用ATAC-seq 結(jié)合ChIP-seq對含有間充質(zhì)型胃癌的特征性增強(qiáng)子進(jìn)行全基因組分析[69]。
除了分析鑒定基因組中的增強(qiáng)子,還可利用MPRA、STARR-seq和GRO-seq等技術(shù)直接分析增強(qiáng)子的活性。經(jīng)典的MPRA技術(shù)是先給待測增強(qiáng)子標(biāo)記特有的條形碼序列,再分別將每個增強(qiáng)子克隆到pGL4.23 載體,對應(yīng)的條形碼序列克隆到熒光素酶基因的3′UTR,通過RNA-seq 檢測條形碼序列的豐度來反映增強(qiáng)子的活性。作為MPRA 的升級版,STARR-seq 技術(shù)以增強(qiáng)子序列本身作為條形碼序列,通過自轉(zhuǎn)錄及豐度檢測來反映增強(qiáng)子活性[70]。這兩種方法均是在外源性環(huán)境中批量檢測全基因組具有增強(qiáng)子活性的DNA序列,因此無法反映內(nèi)源性染色質(zhì)環(huán)境的增強(qiáng)子活性。GRO-seq能夠定量活性增強(qiáng)子合成的eRNA。它通過先凍結(jié)胞核內(nèi)轉(zhuǎn)錄過程,再在體外恢復(fù)的方法,使體外合成的新生轉(zhuǎn)錄本中含有NTP 類似物BrU(bromouridine),通過BrU 抗體富集后建庫測序,分析RNA 體外合成的位置和豐度。2020年,Wang等[71]通過分析GRO-seq數(shù)據(jù),在7種腫瘤細(xì)胞系中鑒定了活性增強(qiáng)子。
確定增強(qiáng)子的靶基因是探討增強(qiáng)子生物學(xué)功能的重要環(huán)節(jié)。3C 及其衍生技術(shù)為鑒定增強(qiáng)子的靶基因提供了重要手段[72]。3C 技術(shù)的基本原理:用甲醛固定活細(xì)胞以穩(wěn)定DNA 和蛋白質(zhì)的相互作用后,先用合適的內(nèi)切酶消化DNA,再用連接酶連接,然后通過逆交聯(lián)使DNA 與蛋白質(zhì)分離,提取DNA,最后在連接位點兩側(cè)設(shè)置引物進(jìn)行PCR 反應(yīng),從而定性和定量檢測一對一的增強(qiáng)子啟動子相互作用[17]。高通量染色體構(gòu)象捕獲(high-resolution chromosome conformation capture,Hi-C)技術(shù)的出現(xiàn),使得從全基因組水平分析染色質(zhì)相互作用成為可能。Hi-C 是在3C 技術(shù)的連接步驟中加入生物素標(biāo)記的寡核苷酸,進(jìn)行平末端連接,DNA 純化和超聲后,對寡核苷酸進(jìn)行高通量測序[73]。
利用CRISPR-Cas9技術(shù)敲除細(xì)胞中某段增強(qiáng)子序列或者通過構(gòu)建sgRNA 文庫隨機(jī)敲除基因組中的增強(qiáng)子元件已成為研究增強(qiáng)子功能的重要手段。已有研究利用CRISPR-Cas9 技術(shù)敲除調(diào)控癌基因表達(dá)的增強(qiáng)子,研究增強(qiáng)子在腫瘤發(fā)生中的作用機(jī)制[28]。在CRISPR-Cas9 基礎(chǔ)上發(fā)展起來的CRISPR-dCas9 技術(shù),不僅能直接改變基因組序列,還能在特定位置引入表觀修飾?;贑RISPR/dCas9技術(shù),人們通過增強(qiáng)子CRISPR激活(enhancer CRISPR activation,enCRISPRa)和增強(qiáng)子CRISPR抑制(enhancer CRISPR interference,enCRISPRi)系統(tǒng)在體內(nèi)局部重塑增強(qiáng)子,從而研究增強(qiáng)子的調(diào)控功能[74]。
近年來數(shù)據(jù)庫的開發(fā)和應(yīng)用也為增強(qiáng)子的研究提供了便利,充分利用相關(guān)數(shù)據(jù)庫將大大提高研究效率。研究增強(qiáng)子的常用數(shù)據(jù)庫主要包括:ENCODE 數(shù)據(jù)庫(https://www.encodeproject.org/)和Cistrome數(shù)據(jù)庫(http://cistrome.org/db/#/)[75],其收錄了許多正常組織和腫瘤組織中增強(qiáng)子特征性組蛋白修飾及轉(zhuǎn)錄因子的ChIP-seq 和ATAC-seq 可視化數(shù)據(jù);EnhancerAtlas 數(shù)據(jù)庫(http://www.enhanceratlas.org/)[76]能夠提供人、小鼠、果蠅等9 個物種的增強(qiáng)子注釋;HACER 數(shù)據(jù)庫(http://bioinfo.vanderbilt.edu/AE/HACER/index.html)[77]可通過整合GRO-seq數(shù)據(jù)分析eRNA 鑒定活性增強(qiáng)子。此外,RAEdb 數(shù)據(jù)庫(http://www.computationalbiology.cn/RAEdb/enhancer.html)匯集了MPRA 和STARR-seq 數(shù)據(jù),可用于篩選具有調(diào)控活性的增強(qiáng)子。
增強(qiáng)子作為增強(qiáng)基因表達(dá)的順式調(diào)控元件,其活性異常在惡性腫瘤發(fā)生和發(fā)展中的重要作用已成為腫瘤研究領(lǐng)域的焦點之一。然而,盡管增強(qiáng)子研究在過去幾十年中取得了顯著進(jìn)展,但這一領(lǐng)域仍有很多未知。例如,導(dǎo)致腫瘤基因組中增強(qiáng)子重塑的因素有哪些?增強(qiáng)子重塑與腫瘤發(fā)生發(fā)展有何具體聯(lián)系?增強(qiáng)子如何特異性地識別靶基因發(fā)揮其調(diào)控功能?不同增強(qiáng)子之間如何相互協(xié)調(diào),共同調(diào)節(jié)下游靶基因的表達(dá)?不同腫瘤組織中增強(qiáng)子調(diào)控活性異常的分子機(jī)制和生物學(xué)效應(yīng)有何共性和特異性?eRNA轉(zhuǎn)錄本蘊(yùn)藏的生物學(xué)功能究竟有哪些?超級增強(qiáng)子是如何形成的?未來需要在充分利用大數(shù)據(jù)和分子生物學(xué)技術(shù)的基礎(chǔ)上,圍繞臨床相關(guān)的增強(qiáng)子異常,利用體內(nèi)模型開展深入的研究,從而更好地闡述增強(qiáng)子相關(guān)的基礎(chǔ)理論和臨床問題,這將有助于基礎(chǔ)研究向臨床轉(zhuǎn)化,更好地促進(jìn)腫瘤治療和干預(yù)。