張 茵,王文著,譚政堂,李昶鎣,岳俊杰,郭志云*
(1.西南交通大學(xué)生命科學(xué)與工程學(xué)院,中國四川 成都 610031;2.中國人民解放軍軍事科學(xué)院軍事醫(yī)學(xué)研究院生物工程研究所,中國北京 100071)
增強(qiáng)子是一類具有組織特異性的順式調(diào)控元件,通過富集多種轉(zhuǎn)錄因子調(diào)控基因的表達(dá),并且不受距離和方向的限制。先前研究表明,大多數(shù)活性增強(qiáng)子在轉(zhuǎn)錄因子介導(dǎo)下可轉(zhuǎn)錄出RNA,即增強(qiáng)子RNA(enhancer RNA,eRNA)[1]。已有研究證實(shí)eRNA的表達(dá)量和增強(qiáng)子的活性相關(guān),增強(qiáng)子的表達(dá)失調(diào)會(huì)導(dǎo)致包括乳腺癌在內(nèi)的多種癌癥的發(fā)生[2]。
p53(tumor protein 53)作為一種腫瘤抑制轉(zhuǎn)錄因子參與調(diào)控絕大多數(shù)腫瘤的發(fā)生發(fā)展[3]。研究表明,大部分p53在染色體上的結(jié)合位點(diǎn)除了具有保守的p53模體序列外,還具有增強(qiáng)子的信號特征,并且這些p53結(jié)合的區(qū)域具有增強(qiáng)子的活性[4]。隨后相關(guān)研究進(jìn)一步證實(shí),在阿霉素誘導(dǎo)DNA損傷的情況下,p53的表達(dá)量顯著升高,而且大部分p53都結(jié)合在增強(qiáng)子區(qū)域并起著調(diào)節(jié)增強(qiáng)子活性的能力[5]。
然而,p53如何介導(dǎo)增強(qiáng)子調(diào)控乳腺癌的發(fā)生與發(fā)展以及p53調(diào)控增強(qiáng)子的特征目前尚不清楚。為此,本文分析了乳腺癌細(xì)胞MCF-7中p53的染色質(zhì)免疫沉淀測序(chromatin immunoprecipitation sequencing,ChIP-seq)數(shù)據(jù),發(fā)現(xiàn)結(jié)合p53的增強(qiáng)子(Enhp53)與未結(jié)合p53的增強(qiáng)子(Enhno-p53)在表達(dá)量、組蛋白修飾和轉(zhuǎn)錄因子結(jié)合方面存在顯著差異。同時(shí),我們分析了MCF-7細(xì)胞中p53活性升高前后的RNA-seq數(shù)據(jù),在近端調(diào)控和遠(yuǎn)端調(diào)控兩個(gè)層面上共識別了148對Enhp53-mRNAs。這些mRNA的功能富集分析結(jié)果表明,受Enhp53調(diào)控的mRNA與腫瘤顯著相關(guān),并顯著影響了乳腺癌病人的總生存時(shí)間。綜上所述,p53通過介導(dǎo)增強(qiáng)子調(diào)控參與乳腺癌通路,從而影響腫瘤的發(fā)生與發(fā)展,這一結(jié)果為進(jìn)一步探討轉(zhuǎn)錄因子與增強(qiáng)子的調(diào)控提供了理論依據(jù)與方法基礎(chǔ)。
MCF-7細(xì)胞中的活性增強(qiáng)子來自于HACER數(shù)據(jù)庫(http://bioinfo.vanderbilt.edu/AE/HACER/)[6],MCF-7細(xì)胞中p53的ChIP-seq數(shù)據(jù)來自于SRA(Sequence Read Archive)數(shù)據(jù)庫(SRR287800)[7]。9種組蛋白修飾(包括 H3K4me1、H3K4me2、H3K4me3、H3K9ac、H3K9me2、H3K9me3、H3K27ac、H3K27me3、H4K20me1)和76種轉(zhuǎn)錄因子的ChIP-seq數(shù)據(jù)來自于ENCODE(The Encyclopedia of DNA Elements)項(xiàng)目。MCF-7細(xì)胞在Nutlin處理前后的差異表達(dá)RNA來自于 Léveillé等[8]的研究。MCF-7細(xì)胞在空間上的染色質(zhì)相互作用數(shù)據(jù)來自于4DGenome數(shù)據(jù)庫(https://4dgenome.research.chop.edu/)[9]。
使用FastQC[10]對測序數(shù)據(jù)進(jìn)行質(zhì)量檢測,并用Cutadapt[11]切除引物和質(zhì)量分?jǐn)?shù)低于10的片段。使用Bowtie2[12]將Nutlin處理過的p53 ChIP-seq數(shù)據(jù)匹配到hg19的人類基因組上,并用SAM-tools[13]過濾未匹配的測序片段,隨后使用MACS2[14]的callpeak進(jìn)行peak calling,最后通過deepTools[15]得到p53的bigWig文件。
將MCF-7細(xì)胞中來自HACER數(shù)據(jù)庫的增強(qiáng)子與p53在染色體上的結(jié)合位點(diǎn)進(jìn)行位點(diǎn)匹配,得到結(jié)合p53的增強(qiáng)子(Enhp53),即該增強(qiáng)子受p53調(diào)控。通過ENCODE項(xiàng)目獲得MCF-7細(xì)胞中組蛋白修飾以及轉(zhuǎn)錄因子的ChIP-seq數(shù)據(jù),進(jìn)而使用bwtool[16]分析Enhp53和Enhno-p53中點(diǎn)上下游1 kb內(nèi)的組蛋白修飾和轉(zhuǎn)錄因子結(jié)合情況,并將Enhp53和Enhno-p53的轉(zhuǎn)錄因子結(jié)合信號的均值進(jìn)行比較,比值大于1.2的轉(zhuǎn)錄因子被認(rèn)定為具有協(xié)同p53調(diào)控增強(qiáng)子的功能。
本文通過兩種方法識別Enhp53調(diào)控的差異表達(dá)mRNA。首先,通過4DGenome數(shù)據(jù)庫得到MCF-7細(xì)胞在空間上的染色質(zhì)相互作用數(shù)據(jù),若增強(qiáng)子和mRNA分別位于相互作用的兩個(gè)片段內(nèi),則認(rèn)為該增強(qiáng)子調(diào)控mRNA。其次,若mRNA位于一個(gè)增強(qiáng)子的上下游100 kb內(nèi),則認(rèn)為mRNA受該增強(qiáng)子調(diào)控[17]。
利用R包c(diǎn)lusterProfiler[18]對mRNA進(jìn)行GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析。從TCGA(The Cancer Genome Atlas)數(shù)據(jù)庫獲取乳腺癌的RNA-seq數(shù)據(jù)以及臨床數(shù)據(jù),繪制Enhp53調(diào)控的mRNA的Kaplan-Meier生存曲線[19],P<0.05即認(rèn)為該mRNA對乳腺癌患者的總生存時(shí)間具有顯著影響。
為了探討MCF-7細(xì)胞中受p53調(diào)控的增強(qiáng)子的情況,我們首先從HACER數(shù)據(jù)庫中得到MCF-7細(xì)胞中8 714個(gè)增強(qiáng)子,隨后對MCF-7細(xì)胞中的p53 ChIP-seq數(shù)據(jù)進(jìn)行分析,得到7 784個(gè)p53的結(jié)合位點(diǎn),通過對增強(qiáng)子和p53的結(jié)合位點(diǎn)進(jìn)行位點(diǎn)匹配,最終共識別出459個(gè)Enhp53。通過分析發(fā)現(xiàn),我們識別的增強(qiáng)子普遍具有活性增強(qiáng)子的信號特征,例如:增強(qiáng)子chr7:579 426~579 712具有高水平的H3K27ac和H3K4me1信號以及低水平的H3K4me3信號,這與文獻(xiàn)[20]的報(bào)道相符,并且在增強(qiáng)子區(qū)域富集p53和脫氧核糖核酸酶(deoxyribonuclease,DNase)(圖 1)。
圖1 增強(qiáng)子chr7:579 426~579 712的基因組信息示例圖黃色標(biāo)記增強(qiáng)子的位置,綠色標(biāo)記增強(qiáng)子上的各種信號特征,藍(lán)色代表組蛋白修飾在基因組上的信號分布,紅色代表結(jié)合在DNA上的轉(zhuǎn)錄因子的信號分布。Fig.1 Diagram of genomic information of enhancer chr7:579 426~579 712Yellow marks the position of the enhancer,green marks the various signal features on the enhancer,blue represents the distribution of histone modification signals,and red represents the signal distribution of transcription factors bound to DNA.
先前研究表明,p53可結(jié)合在增強(qiáng)子上調(diào)控腫瘤的發(fā)生與發(fā)展[3]。為了研究p53的結(jié)合對增強(qiáng)子功能的影響,我們以是否結(jié)合p53為標(biāo)準(zhǔn)將增強(qiáng)子分為兩類:Enhp53和Enhno-p53(圖2A)。首先,我們對兩類增強(qiáng)子的表達(dá)量進(jìn)行比較,結(jié)果表明Enhp53的表達(dá)量顯著高于Enhno-p53(圖2B)。研究報(bào)道,活性增強(qiáng)子往往具有多種組蛋白修飾[20],為了研究p53在增強(qiáng)子上的結(jié)合是否會(huì)引起增強(qiáng)子組蛋白修飾信號的變化,我們對Enhp53和Enhno-p53進(jìn)行了組蛋白特征分析。結(jié)果表明,在9種組蛋白修飾中,5種在增強(qiáng)子上出現(xiàn)了明顯的雙峰,分別 是 H3K4me1、H3K4me2、H3K4me3、H3K9ac 和H3K27ac,這5種組蛋白修飾信號在Enhp53上顯著高于 Enhno-p53(圖 2C~G)。
為了進(jìn)一步探明增強(qiáng)子結(jié)合轉(zhuǎn)錄因子的情況以及p53協(xié)同哪些轉(zhuǎn)錄因子共同調(diào)控增強(qiáng)子,我們比較了兩類增強(qiáng)子上轉(zhuǎn)錄因子的結(jié)合情況。結(jié)果表明,這76種轉(zhuǎn)錄因子均在兩類增強(qiáng)子上有結(jié)合信號。通過進(jìn)一步分析轉(zhuǎn)錄因子在兩類增強(qiáng)子上的信號比值,共識別了36個(gè)協(xié)同p53調(diào)控增強(qiáng)子的轉(zhuǎn)錄因子(圖3A),其中GATA3(GATA binding protein 3)、FOXA1(forkhead box A1)以及DPF2(double PHD fingers 2)是增強(qiáng)子上受p53影響最顯著的3個(gè)轉(zhuǎn)錄因子(圖3B~D)。此外,參與增強(qiáng)子和靶基因空間成環(huán)的關(guān)鍵轉(zhuǎn)錄因子CTCF(CCCTC-binding factor)也在Enhp53上具有更強(qiáng)的信號(圖 3E)。
圖2 兩類增強(qiáng)子的p53結(jié)合信號、表達(dá)量以及組蛋白修飾信號的差異(A)兩類增強(qiáng)子結(jié)合p53的差異;(B)兩類增強(qiáng)子的表達(dá)量差異,P值由t檢驗(yàn)計(jì)算得出;(C~G)兩類增強(qiáng)子的多種組蛋白修飾信號差異。Fig.2 Differences between the two types of enhancers in p53-binding signals,expression levels and histone modification signals(A)The difference between the two types of enhancers in p53-binding signals;(B)The difference in expression of the two types of enhancers.The P value is calculated by the t test;(C~G)The differences in multiple histone modification signals on two types of enhancers.
為了探討Enhp53如何參與mRNA的差異表達(dá),我們分析了MCF-7細(xì)胞在Nutlin處理前后的RNA-seq數(shù)據(jù),得到1 817個(gè)差異表達(dá)的mRNA。其中,998個(gè)mRNA顯著上調(diào),819個(gè)mRNA顯著下調(diào)。為了盡可能全面地識別Enhp53調(diào)控的mRNA,我們通過遠(yuǎn)端與近端的增強(qiáng)子-mRNA調(diào)控模式識別Enhp53調(diào)控的mRNA,結(jié)合4DGenome數(shù)據(jù)庫中染色質(zhì)相互作用數(shù)據(jù)和增強(qiáng)子上下游100 kb兩種方法共識別出148組Enhp53-mRNAs,涉及差異表達(dá)的mRNA共120個(gè)。在這些mRNA中,多個(gè)mRNA的表達(dá)量與乳腺癌患者的總生存時(shí)間顯著相關(guān),例如 FOS、FOSL1(FOS like 1)、ARC(activity-regulated cytoskeleton-associated protein)、BTG2(BTG anti-proliferation factor 2)等。其中,在Nutlin處理后升高2.14倍的FOS受到兩個(gè)增強(qiáng)子調(diào)控,分別是chr14:75 649 674~75 650 038以及chr14:75 721 756~75 722 023。通過TCGA中乳腺癌患者的臨床數(shù)據(jù)以及RNA-seq數(shù)據(jù)繪制FOS的Kaplan-Meier生存曲線,結(jié)果表明,FOS的表達(dá)對患者生存時(shí)間有顯著影響,FOS高表達(dá)的患者明顯具有更長的總生存時(shí)間(圖4A)。此外,我們對Enhp53調(diào)控的mRNA進(jìn)行了GO和KEGG富集分析,結(jié)果表明這些基因在DNA損傷、細(xì)胞凋亡以及p53介導(dǎo)的信號轉(zhuǎn)導(dǎo)過程中發(fā)揮著重要作用,并顯著富集在多種癌癥發(fā)生和p53相關(guān)的通路中(圖 4B,C)。
圖3 兩類增強(qiáng)子的轉(zhuǎn)錄因子結(jié)合信號差異(A)兩類增強(qiáng)子的轉(zhuǎn)錄因子結(jié)合信號的比值;(B~E)兩類增強(qiáng)子的多種轉(zhuǎn)錄因子結(jié)合信號差異。Fig.3 Differences in transcription factor binding signals between two types of enhancers(A)The ratio of transcription factor binding signals of the two types of enhancers;(B~E)Differences in multiple transcription factor binding signals of two types of enhancers.
圖4 FOS的生存曲線以及受Enhp53調(diào)控的mRNA的GO和KEGG分析(A)FOS的Kaplan-Meier生存曲線;(B)受Enhp53調(diào)控的mRNA的GO分析;(C)受Enhp53調(diào)控的mRNA的KEGG分析。Fig.4 The survival curve of FOS and GO and KEGG analyses of mRNAs regulated by Enhp53(A)Kaplan-Meier survival curve for FOS;(B)GO analysis of mRNAs regulated by Enhp53;(C)KEGG analysis of mRNAs regulated by Enhp53。
本研究發(fā)現(xiàn),Enhp53和Enhno-p53在表達(dá)量、組蛋白修飾以及轉(zhuǎn)錄因子結(jié)合等方面均存在顯著差異。Enhp53的表達(dá)量顯著高于Enhno-p53,暗示p53的結(jié)合進(jìn)一步促進(jìn)增強(qiáng)子的活性,從而促進(jìn)下游基因的表達(dá)。H3K4me1、H3K4me2、H3K4me3、H3K9ac和H3K27ac均是已被證實(shí)的位于活性增強(qiáng)子上的組蛋白修飾[21],本文研究顯示,這5種組蛋白修飾信號在Enhp53上顯著高于Enhno-p53。上述結(jié)果表明,p53結(jié)合增強(qiáng)子后可能通過改變這些組蛋白修飾信號從而起到調(diào)節(jié)增強(qiáng)子活性的作用。在對比分析中,Enhp53的H3K4me3信號值略高于H3K4me1,造成這一結(jié)果的原因可能是ENCODE項(xiàng)目中不同組蛋白修飾的ChIP-seq數(shù)據(jù)來自不同的實(shí)驗(yàn)室和樣本,存在一定的實(shí)驗(yàn)誤差,因此直接對H3K4me3和H3K4me1的信號值進(jìn)行比較并不準(zhǔn)確。此外,HACER數(shù)據(jù)庫中的增強(qiáng)子是通過CAGE(cap analysis of gene expression)實(shí)驗(yàn)得來的,CAGE識別增強(qiáng)子依靠雙向轉(zhuǎn)錄的RNA,并不依賴組蛋白修飾信號,因此可能包含著未知基因的啟動(dòng)子。已有研究表明,在多個(gè)組織和細(xì)胞中普遍存在的增強(qiáng)子往往具有更高的H3K4me3信號[22],因此可以針對MCF-7細(xì)胞中增強(qiáng)子的特異性進(jìn)行進(jìn)一步的研究。盡管如此,p53的結(jié)合對增強(qiáng)子H3K27ac和H3K4me1的影響顯著大于H3K4me3(圖 2)。
之前的研究表明,增強(qiáng)子通過結(jié)合轉(zhuǎn)錄因子與靶基因的啟動(dòng)子相互作用,從而調(diào)控基因的表達(dá)[23]。文中對兩類增強(qiáng)子上多種轉(zhuǎn)錄因子的結(jié)合信號進(jìn)行了比較,發(fā)現(xiàn)GATA3、FOXA1以及DPF2是增強(qiáng)子上受p53影響最顯著的3個(gè)轉(zhuǎn)錄因子(圖3)。已有研究表明,一部分p53預(yù)先結(jié)合在染色體不可及區(qū)域,在DNA損傷導(dǎo)致p53升高的情況下,這些p53結(jié)合位點(diǎn)的染色體可及性從不可及變成可及[5],而GATA和FOXA家族被證實(shí)可以促進(jìn)染色質(zhì)的開放[24],因此GATA3、FOXA1等轉(zhuǎn)錄因子很有可能參與到p53結(jié)合位點(diǎn)的可及性變化過程中。DPF2在細(xì)胞凋亡過程中發(fā)揮著重要作用[25],而p53在不同的刺激下會(huì)調(diào)節(jié)細(xì)胞周期和細(xì)胞凋亡[26];通過查詢BioGRID數(shù)據(jù)庫(https://thebi ogrid.org/),我們發(fā)現(xiàn)DPF2與p53結(jié)合,因此DPF2和p53可能在細(xì)胞凋亡過程中發(fā)揮協(xié)同作用。此外,CTCF在Enhp53上具有更強(qiáng)的信號,這一結(jié)果暗示p53可能在介導(dǎo)增強(qiáng)子與靶基因空間成環(huán)方面起到一定的作用。綜上所述,p53通過與多種轉(zhuǎn)錄因子直接或間接相互作用調(diào)控增強(qiáng)子活性與染色體的可及性,并且可能參與CTCF介導(dǎo)的染色體成環(huán)。
p53與增強(qiáng)子、靶基因可形成復(fù)雜的調(diào)控網(wǎng)絡(luò)。研究發(fā)現(xiàn),p53除了結(jié)合增強(qiáng)子外,也可能同時(shí)結(jié)合在靶基因的啟動(dòng)子區(qū)域[5]。為了研究結(jié)合在啟動(dòng)子區(qū)域的p53對Enhp53的影響,我們將Enhp53調(diào)控的靶基因的啟動(dòng)子與p53 ChIP-seq數(shù)據(jù)進(jìn)行了位點(diǎn)匹配,結(jié)果顯示25%的受Enhp53調(diào)控的靶基因啟動(dòng)子區(qū)有p53結(jié)合。我們推測這部分基因可能與Enhp53、p53形成前饋環(huán)路,也可能在三維結(jié)構(gòu)上發(fā)生增強(qiáng)子與靶基因啟動(dòng)子成環(huán)從而拉近兩者距離使p53同時(shí)調(diào)控增強(qiáng)子與靶基因啟動(dòng)子,當(dāng)然這些結(jié)論仍需要進(jìn)一步的實(shí)驗(yàn)驗(yàn)證。
另外,本文通過近端和遠(yuǎn)端兩種調(diào)控模式識別了148對Enhp53-mRNAs,其中差異表達(dá)的FOS被兩個(gè)增強(qiáng)子調(diào)控,且FOS與乳腺癌病人的總生存時(shí)間顯著相關(guān)(圖4A)。已有研究表明,在腫瘤細(xì)胞中過表達(dá)FOS可增強(qiáng)細(xì)胞凋亡[27],這暗示FOS可與p53聯(lián)合作用,通過調(diào)節(jié)相關(guān)基因的表達(dá)來發(fā)揮抗腫瘤作用。以上研究表明,p53通過介導(dǎo)增強(qiáng)子調(diào)控參與乳腺癌通路,從而影響腫瘤的發(fā)生發(fā)展,該結(jié)果為進(jìn)一步探討轉(zhuǎn)錄因子與增強(qiáng)子調(diào)控提供了理論依據(jù)與方法基礎(chǔ)。