国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于表觀遺傳學探索玉米雙向啟動子對轉錄的影響

2020-04-23 08:23朱倩潔曹亞欣馬宇馨張林旺邢繼紅董金皋
河北農業(yè)大學學報 2020年1期
關鍵詞:染色質共表達雙向

朱倩潔,曹亞欣,馬宇馨,張林旺,邢繼紅,2,張 康,2,董金皋,2

(1.河北農業(yè)大學 生命科學學院,河北 保定 071000;2.河北省植物生理與分子病理學重點實驗室/河北農業(yè)大學真菌毒素與植物分子病理學實驗室,河北 保定 071000;3.河北省榮軍醫(yī)院,河北 保定 071000)

雙向啟動子 (Bidirectional promoter,BDP) 是位于兩個相鄰且轉錄方向相反的基因之間,能夠同時啟動其兩端結構基因轉錄的一類特殊啟動子。具有雙向啟動子的基因普遍存在與酵母[1]、果蠅[2]、人類[3-4]、植物[5]等真核生物基因組中。研究發(fā)現(xiàn),具有雙向啟動子的基因主要參與人的DNA修復、細胞周期、物質代謝和人類疾病等過程[6-10]。與單向啟動子相比,雙向啟動子可以結合更豐富的RNA聚合酶II,具有更豐富的H3、H3K9和H3K27的乙酰化作用、H3K4me 2/3的甲基化作用[11-12],而H4乙?;饔幂^少,這表明雙向啟動子可能具有獨特的染色質特征。隨著全基因組測序和植物轉錄數(shù)據(jù)的發(fā)布,植物雙向啟動子已經受到了相當大的關注。到目前為止,已經開展了擬南芥[13]、水稻[14]、玉米[15]和楊樹[5]中雙向啟動子的研究。有研究發(fā)現(xiàn)哺乳動物和植物基因組[14,16]中,雙向啟動子具有保守的序列特征。然而,目前還不清楚植物中基因對的雙向轉錄和共表達的表觀遺傳調控機制。

目前的研究發(fā)現(xiàn)ATAC-seq (Assay for Transposase-Accessible Chromatin using Sequencing) 數(shù)據(jù)與基因表達水平呈正相關,其所代表的開放染色質為轉錄因子或增強子等調控因子的結合部位,主要富集在轉錄起始位點 (Transcription start site,TSS) 的上游。組蛋白修飾則主要富集與TSS下游或基因區(qū)域,與基因表達水平之間的關系較為復雜,例如H3K4me3、H3K9ac、H3K27ac與基因的表達水平呈正相關,主要富集于TSS下游;H3K36me3與基因表達水平呈正相關,主要富集于整個基因區(qū)域;H3K27me3與基因表達水平呈負相關,主要富集于整個基因區(qū)。通過開放染色質及不同組蛋白修飾的富集位置及其與基因表達水平的關系可以為雙向啟動子的研究提供很好的研究基礎。

目前,玉米中關于表觀遺傳修飾對雙向啟動子及相關基因表達模式的調控作用尚不清楚。本研究擬利用公共數(shù)據(jù)平臺中的數(shù)據(jù),對易接近染色質區(qū)域(Accessible chromatin region,ACR)和組蛋白修飾對玉米雙向啟動子相關基因轉錄的影響進行分析,明確玉米中表觀遺傳調控與雙向啟動子及相關基因之間的關系,為進一步深入研究雙向啟動子對雙向轉錄基因對的調控功能及其機制奠定基礎。

1 材料與方法

1.1 玉米雙向啟動子的識別

玉米基因組相關信息從玉米基因組注釋數(shù)據(jù)庫(MaizeGDB) 中獲取。確定具有雙向啟動子的基因對中的雙向定向,每個基因對TSS之間的基因間區(qū)域長度為0~1 kb的雙向啟動子 (BDPs)。BDPs分為三類:0~250 bp (BDPs I)、250~500 bp (BDPs II) 和500~1000 bp (BDPs III)。所有被標注為蛋白質編碼基因的基因對都用于下游分析。相比之下,單向啟動子 (Unidirectional promoters, UDPs) 是從單向基因中挑選出來的,其表達水平類似于具有雙向啟動子的基因對,用于與BDPs進行并行分析。利用ATAC-seq數(shù)據(jù),對具有BDPs的ACRs進行分析,獲得ACRs的位置信息。根據(jù)ACRs在BDPs中的分布情況,將所有的玉米BDPs分為四個類別:one mid-ACR,只顯示在BDPs中間的一個峰;bi-ACRs,表示位于BDPs中的兩個單獨或部分重疊的峰;one amesial ACR,只表示在BDPs中不對稱的一個峰;和no ACR,表示在BDPs中沒有發(fā)現(xiàn)峰。

1.2 數(shù)據(jù)收集及整理

收集公共數(shù)據(jù)平臺Gene Expression Omnibus(GEO) 和Sequence Read Archive (SRA)數(shù)據(jù)庫中玉米相關的轉錄組及表觀基因組數(shù)據(jù),并進行整理和挑選。

1.3 數(shù)據(jù)分析

對于公共數(shù)據(jù)平臺下載的數(shù)據(jù),首先利用SRA ToolKit將原始數(shù)據(jù)從SRA格式轉化為fastq格式,然后對數(shù)據(jù)進行質量檢測和去接頭處理獲取高質量的序列。對于ChIP-seq(Chromatin immunoprecipitation sequencing) 和ATAC-seq數(shù)據(jù),利用Bowtie2將其比對到基因組上。隨后,利用MACS軟件對ChIP-seq和ATAC-seq數(shù)據(jù)中組蛋白修飾或易接近染色質的富集位置進行預測。在得到組蛋白修飾或開放染色質的富集位置后,利用軟件對這些富集的位置進行下一步分析。

利用TopHat軟件將RNA-seq數(shù)據(jù)中的序列比對到基因組上,然后用Cufflinks軟件計算基因表達FPKM (Fragments Per Kilobase of exon per Million fragments mapped reads)。

1.4 數(shù)據(jù)可視化

利用Integrative Genomics Viewer基因組瀏覽器將ATAC-seq、ChIP-seq及RNA-seq數(shù)據(jù)上傳至IGV進行可視化,觀察ATAC-seq和ChIP-seq數(shù)據(jù)富集位置與雙向啟動子的關系,進而分析基因表達水平與雙向啟動子的關系。

1.5 共表達分析

玉米相關基因之間的皮爾遜相關系數(shù)來自于玉米共表達網(wǎng)絡數(shù)據(jù)庫 (MCENet)[17]。皮爾遜相關系數(shù)計算兩兩基因間表達的相關性。使用Perl語言中的Statistics::Basic qw (:all) 模塊的correlation函數(shù),依據(jù)兩兩基因的FPKM值進行皮爾遜相關系數(shù)的計算。

1.6 顯著性檢驗

為了確定BDP和UDP之間的基因表達,組蛋白標記和核小體占有率是否顯著差異,進行了雙樣本student t檢驗(Student's t-test)。雙樣本t檢驗是檢驗2個樣本平均數(shù)與其各自所代表的總體的差異是否顯著,一般以P<0.05為有統(tǒng)計學差異,P<0.01為有顯著統(tǒng)計學差異,P<0.001為有極其顯著的統(tǒng)計學差異。

2 結果與分析

2.1 易接近染色質區(qū)域在玉米BDPs中的分布

本研究對玉米基因組中有注釋的基因進行分析,篩選到BDPs I、BDPs II和BDPs III類型的雙向啟動子分別有175、182和309個基因對。利用公共數(shù)據(jù)平臺中玉米的ATAC-seq數(shù)據(jù),對玉米雙向啟動子中易接近染色質區(qū)域 (Accessible Chromatin Region,ACR)的分布情況進行分析。結果發(fā)現(xiàn),ACR在BDPs I、BDPs II和BDPs III類型的雙向啟動子中的分布存在明顯的差別(表1)。其中,BDPs I類型的雙向啟動子中,ACR主要位于雙向啟動子的中間(one mid-ACR),有86個基因對,達到49.14%;其次是no ACR類型,有34個基因對,達到19.43%;bi-ACRs類型僅有13個基因對,為7.43%。BDPs II類型的雙向啟動子中,no ACR類型為主要形式,有54個基因對,為29.67%;其次是one mid-ACR類型,有43個基因對,為23.63%;bi-ACRs類型所占比例較少,有25個基因對,為13.73%。BDPs III類型的雙向啟動子中,no ACR類型也為主要形式,有100個基因對,達到32.36%;其次是bi-ACRs類型,有45個基因對,為14.56%;one mid-ACR類型最少,有32個基因,為10.36%。

表1 BDPs中ACRs的分布Table 1 Distribution of ACRs within BDPs

2.2 ACRs對具有雙向啟動子基因表達的影響

對BDPs與相應基因對的表達水平之間的關系進行分析,發(fā)現(xiàn)具有BDPs I型啟動子的基因對的表達水平明顯高于其它兩種啟動子類型的基因和隨機選擇的單向基因的表達水平,BDPs II中基因對的表達水平也明顯高于BDPs III基因對的表達水平,BDPs III和UDPs之間沒有顯著的區(qū)別(圖1a)。對ACR在雙向啟動子中的分布與基因對的表達水平之間的關系進行分析,發(fā)現(xiàn)one mid-ACR類型雙向啟動子的基因的表達水平最高,其次是bi-ACRs和one amesial ACR類型雙向啟動子的基因,而no ACR類型雙向啟動子的基因的表達水平最低(圖1b)。

圖1 不同類型雙向啟動子相關基因對的表達水平Fig.1 Expression levels of gene pairs associated with bidirectional promoters of different types

此外,在含有 one amesial ACR的BDPs中,靠近ACR的基因的表達水平明顯高于ACR的遠端(p值=4.4e-32,t檢驗);在包含one mid-ACR基因對(p值=1.9e-9,t檢驗)和包含bi-ACRs基因對(p值=3.7e-5,t檢驗)中靠近ACR的基因的表達水平明顯高于ACR的遠端,雖然3種類型的BDPs都具有顯著差異,但是含有 one amesial ACR的BDPs的差異仍明顯高于其他兩種(圖2)。這樣的結果說明BDPs的不同長度影響相關基因對的表達;相對于雙向基因的TSS,ACRs的物理位置可能會影響具有雙向啟動子的基因對的表達。

圖2 不同類型雙向啟動子相關基因對中差異表達水平Fig.2 Differential expression levels of different types of bidirectional promoter related genes

2.3 ACRs對具有雙向啟動子的基因對的共同表達的影響

ACRs的物理位置可能會影響B(tài)DPs的共表達方式,為了驗證這種現(xiàn)象,本研究對ACRs物理分布和BDPs共同表達系數(shù)之間進行了相關性分析。結果表明,具有One mid-ACR的基因對共表達程度最高 (圖3),其中one mid-ACR基因對和one amesial ACR基因對共表達程度具有顯著差異 (p值=0.01,t檢驗)。One mid-ACR 基因對和bi-ACRs 基因對 (p值=0.18,t檢驗),bi-ACRs基因對和one amesial ACR 基因對 (p值=0.49,t檢驗) 不具有顯著差異。這些結果表明,ACRs的物理位置可能會影響具有雙向啟動子的基因對的共同表達。

圖3 ACRs對BDPs共同表達的影響.Fig.3 Effect of the ACRs profile on the co-expression of bidirectional promoter gene pairs

2.4 組蛋白修飾在雙向啟動子附近的分布影響基因的表達

為探索ACRs與基因表達之間的關系, 本研究利用公共數(shù)據(jù)平臺中的RNA-seq 數(shù)據(jù)計算了玉米所有基因的表達值 (FPKM),并按照表達水平將所有基因分成了六組, 其中 FPKM 大于零的基因被平均分成了五組 (表達水平最高的定義為第一組, 反之表達最低的定義為第五組, FPKM 等于零的基因統(tǒng)一定義為第六組)。然后,計算這六組基因周圍ACRs的富集情況(圖4),發(fā)現(xiàn)ACRs在TSS上游的+1核小體位置的分布與基因表達水平呈正相關,并且ACRs富集水平最高點距離TSS越近,基因的表達水平越高(圖4黑點表示)。

圖4 ACRs與基因表達的關系Fig.4 Relationship between ACRs and gene expression

組蛋白修飾在真核生物基因表達過程中發(fā)揮非常重要的作用。為了分析雙向啟動子附近的組蛋白修飾富集情況,對相同組織的組蛋白修飾數(shù)據(jù)進行了分析,其中包括3個與轉錄激活相關的組蛋白修飾(H3K4me3、H3K27ac和H3K9ac) 和一個與轉錄抑制相關的組蛋白修飾 (H3K27me3)。在分析結果中可以發(fā)現(xiàn),ACRs在雙向啟動子中具有明顯的富集,同時,與轉錄激活相關的組蛋白修飾H3K4me3,H3K27ac和H3K9ac在雙向啟動子兩側具有明顯的富集,而轉錄抑制相關組蛋白修飾H3K27me3在雙向啟動子及其附近區(qū)域的分布沒有明顯的富集現(xiàn)象 (圖5)。

圖5 BDPs附近ACRs和不同類型組蛋白修飾的富集水平Fig.5 Enrichment of ACRs and different types of histone modifications near BDPs

為探索雙向啟動子及其附近區(qū)域ACRs所處的物理位置與組蛋白修飾富集水平之間的關系,對不同類型的雙向啟動子附近的組蛋白修飾情況進行了分析,發(fā)現(xiàn)在one mid-ACR和bi-ACRs附近H3K4me3,H3K27ac和H3K9ac顯著的富集在雙向啟動子的兩端的TSS下游,但是one amesial-ACR (3′端TSS) 雙向啟動子附近,H3K4me3、H3K27ac和H3K9ac顯著的與ACR共同富集,而沒有no-ACR一端 (5′端TSS) 的 TSS下游H3K4me3、H3K27ac和 H3K9ac的富集水平顯著降低 (圖6)。H3K27me3則呈現(xiàn)出與H3K4me3、H3K27ac和H3K9ac截然相反的趨勢。這些結果說明雙向啟動子對下游基因的調控作用需要開放染色質與多種組蛋白修飾構成的染色質狀態(tài)共同發(fā)揮作用。

圖6 不同類型BDPs附近組蛋白修飾的富集水平Fig.6 Enrichment of histone modifications near different types of BDPs

3 討論與結論

易接近染色質區(qū)域的敏感性與真核生物基因組中單向基因的表達水平直接相關[18,19]。然而,ACRs與具有雙向啟動子的基因對表達的關系仍不清楚。在本研究中發(fā)現(xiàn)玉米基因組中含有one mid-ACR或bi-ACRs雙向啟動子的基因對具有明顯的共同表達現(xiàn)象,這表明在玉米雙向啟動子中ACRs會影響具有雙向啟動子的基因對的表達模式。在啟動子區(qū)域內的ACRs的對稱位置可能是具有雙向啟動子的基因對共調節(jié)的關鍵參與者。在啟動子區(qū)域中,ACRs通常為RNA聚合酶II和其他轉錄因子的結合區(qū)域,從而參與到基因轉錄的調控過程中[20]。在玉米BDPs中,ACRs (one mid-ACR或bi-ACRs)的對稱分布在基因對的形成中扮演了2個可能的角色。其中一個作用是,ACRs的存在代表了開放染色質區(qū)域,這可能同時促進基因對的表達。另一個作用是由于共享相同的調控元件,基因對的表達可以由相同的轉錄機制控制,具有雙向相等的效率。

在對玉米雙向啟動子進行鑒定時,通過與水稻雙向啟動子相關文獻[14]進行比較后發(fā)現(xiàn),由于玉米基因組要明顯大于水稻基因組,并且玉米基因組中相鄰基因之間的距離顯著大于水稻相鄰基因之間的距離。因此,在玉米基因組中鑒定到小于1000 bp的雙向啟動子數(shù)量也明顯少于水稻。另外,還發(fā)現(xiàn)玉米中mid-ACR或bi-ACRs相關的基因對表達水平存在明顯差異,而之前報道的水稻mid-ACR或bi-ACRs相關基因對之間的表達水平則沒有明顯的差異。猜測可能是基因組之間的差異性導致這種結果的出現(xiàn),當然不排除可能是分析軟件的差異對這種結果的出現(xiàn)造成了一定的影響[21]。

在真核生物中已經深入研究了核小體定位參與基因表達或基因調控的進化[22-24]。然而,關于染色質組織對植物中共表達基因對的調節(jié)的影響知之甚少。組蛋白修飾影響轉錄因子在ACR中的結合,染色質結構在調節(jié)哺乳動物中聚集基因的表達中起關鍵作用,有人提出基因轉錄可以在起始階段或在延長過程中進行調控。兩個步驟都可以受到在啟動子和基因體區(qū)域中的組蛋白修飾的影響。因此,在轉錄起始步驟 (H3K4me3和H3K9/K27ac) 的活性或者在延伸步驟 (H3K27me3) 可以協(xié)調停滯或延長的RNA聚合酶II。BDPs中含有ACR,并且兩側核小體中包含激活相關的組蛋白修飾 (H3K4me3、H3K27me3、H3K9/27ac),才能促進了相應的基因對的表達,表明ACRs的物理位置和周圍的組蛋白修飾在玉米BDPs發(fā)揮功能的過程中起著重要作用。

結合與one mid-ACR和bi-ACRs相關基因的共表達現(xiàn)象,得出結論,轉錄激活相關的組蛋白修飾可能產生有利于基因對共表達的染色質結構。另一方面,發(fā)現(xiàn)ACR與TSS越接近,基因的表達水平越高。綜上所述,本研究結果表明,ACRs的物理位置和組蛋白修飾的富集水平在基因對的共表達過程中起著重要的作用,為進一步探索雙向啟動子在玉米分子育種及抗病過程的功能研究奠定理論基礎。

猜你喜歡
染色質共表達雙向
雙向度的成長與自我實現(xiàn)
染色質開放性與動物胚胎發(fā)育關系的研究進展
哺乳動物合子基因組激活過程中的染色質重塑
UdhA和博伊丁假絲酵母xylI基因共表達對木糖醇發(fā)酵的影響
降低寄遞成本需雙向發(fā)力
用“雙向宮排除法”解四宮數(shù)獨
高世代回交玉米矮稈種質的轉錄組分析
侵襲性垂體腺瘤中l(wèi)ncRNA-mRNA的共表達網(wǎng)絡
豚鼠卵母細胞體外成熟過程中生發(fā)泡染色質構型的變化
完善刑事證據(jù)雙向開示制度的思考
宁河县| 陇川县| 高淳县| 晋江市| 浑源县| 云南省| 建湖县| 绥德县| 耿马| 高邮市| 河池市| 南溪县| 库尔勒市| 苍南县| 沐川县| 腾冲县| 瓮安县| 惠水县| 合作市| 勐海县| 田阳县| 建始县| 南靖县| 唐海县| 台湾省| 陆丰市| 孟州市| 扎鲁特旗| 广南县| 运城市| 巴中市| 博乐市| 嫩江县| 湘阴县| 桂平市| 潼关县| 西城区| 长春市| 焉耆| 汪清县| 焦作市|