蔣正寧,劉大同,張 曉,江 偉,王 玲,李東升,程曉明, 高德榮
(江蘇里下河地區(qū)農(nóng)業(yè)科學研究所/農(nóng)業(yè)部長江中下游小麥生物與遺傳改良重點實驗室,江蘇揚州 225007)
DNA甲基化是生物體內(nèi)一種重要的表觀遺傳修飾手段,在高等真核生物中,DNA 甲基化發(fā)生于胞嘧啶第五位碳原子上形成 5-甲基胞嘧啶(5-methylcytosine,5-meC)[1],DNA甲基化狀態(tài)是由甲基化建立、維持和主動去甲基化動態(tài)調(diào)節(jié)的結(jié)果[2],而DNA 去甲基化則是 DNA 甲基化的相反過程,即 5-甲基胞嘧啶被未修飾的胞嘧啶替代的過程[3]。在植物中,DNA 去甲基化包括 DNA 主動去甲基化和被動去甲基化2 種類型:被動的去甲基化,是由于 DNA 復制過程中甲基轉(zhuǎn)移酶活性的喪失或甲基供體的缺乏導致甲基化無法維持,從而使整個基因組 DNA 甲基化水平降低;DNA 主動去甲基化,則不依賴于DNA復制,即通過5-甲基胞嘧啶 DNA 糖基化酶作用,直接去除 DNA 中甲基化的胞嘧啶[4]。DNA去甲基化不僅對于全基因組表觀遺傳重編程至關重要,在植物發(fā)育過程中還介導轉(zhuǎn)錄因子或基因座特異性基因激活[4]。目前,普遍認為DNA去甲基化的機制有 5 種:依賴DNA 去甲基化酶的堿基切除修復機制、堿基切除修復、甲基胞苷脫氨基耦合G/T 的錯配切除修復、水解作用去甲基化以及氧化去甲基化[5]。在所有的機制中DNA的去甲基化是通過DNA去甲基化酶(dMTase)實現(xiàn)的,DNA去甲基化酶含有最保守的DNA 糖苷酶(HhH-GPD)結(jié)構(gòu)域,具有糖基化酶和脫嘌呤裂合酶活性的雙功能。
目前,在植物中已鑒定6種dMTase,包括轉(zhuǎn)葡萄糖基酶 DME ( demeter) 、 沉默抑制因子 ROS1 (repressor of silencing 1), 以及 類轉(zhuǎn)葡萄糖基酶蛋白 DML2(demeter-like protein 2) 、DML3、DML4和類轉(zhuǎn)葡萄糖基酶DML5[6]。研究表明ROS1和DML在所有的營養(yǎng)組織中表達,包括根和莖的組織,而DME主要在種子發(fā)育中表達[7]。在擬南芥中,DME是孢子體發(fā)育所必需,并在孢子體生命周期中維持干細胞活動起著至關重要的作用[8]。此外,ROS1和DME也參與調(diào)控水稻[9]和大麥的種子發(fā)育[10]。最近,3個水稻dMTase基因(DNG702、DNG701和DNG704)被證實可以對配子體和合子細胞的DNA去甲基化,是合子基因表達和發(fā)育所必需[11];番茄DNA去甲基化酶基因SlDML2與其果實成熟過程中DNA甲基化水平普遍降低密切相關[12]。上述研究表明,dMTase對植物合子發(fā)育和果實成熟起到重要的調(diào)控作用。
此外,植物的生物或非生物應激反應也需要DNA主動去甲基化的調(diào)控。例如,擬南芥可以通過ROS1對RMG1和RLP43基因啟動子的去甲基化激活抗病反應[13],而其DNA 去甲基酶三重突變體rdd(ros1/dml2/dml3)對鐮刀形孢菌表現(xiàn)高度敏感[14];在水稻中,鹽敏感品種IR29在鹽脅迫下誘導dMTase基因(DNG701和DNG710)表達[15];而在煙草中過表達AtROS1,則增加了類黃酮生物合成途徑相關基因和抗氧化途徑相關基因的去甲基化水平,激活了這類抗逆基因的表達,從而導致鹽脅迫耐受性提高[16];此外,DNA去甲基化也在植物熱和干旱脅迫反應的調(diào)控中發(fā)揮作用[17-18]??梢钥闯?DNA去甲基化酶基因在調(diào)節(jié)植物的各類生物學過程中發(fā)揮重要作用。
目前,DNA去甲基化酶(dMTase)基因在很多物種中被廣泛鑒定和分析,這些物種中dMTase 的數(shù)量、保守性、多態(tài)性和功能都存在很大差異。作為重要糧食作物的小麥dMTase基因家族成員尚未被鑒定。本研究基于小麥全基因組測序數(shù)據(jù),利用生物信息學方法對小麥dMTase基因家族進行了全基因組鑒定,分析小麥dMTase基因核苷酸及編碼蛋白的特性及其組織特異性表達模式,并通過轉(zhuǎn)錄組測序及qRT-PCR方法分析小麥dMTase基因在籽粒發(fā)育中的表達特征,為進一步解析小麥dMTase基因功能研究奠定基礎。
從Ensembl Plants數(shù)據(jù)庫 (http://plants.ensembl.org/index thml )下載小麥蛋白序列數(shù)據(jù)、基因組序列和注釋文件,并建立本地數(shù)據(jù)庫。以已知的擬南芥[14]和水稻[19]dMTase基因家族成員蛋白序列作為query 序列,與小麥的蛋白序列進行本地BlastP比對,篩選閾值設為E 利用ExPASy 網(wǎng)站(http://expasy.org/)對小麥dMTase氨基酸序列進行等電點、分子量預測等理化性質(zhì)分析;利用Plant-mPLoc(http://www.csbio.sjtu.edu.cn),對小麥dMTase進行亞細胞定位分析;根據(jù) CDD(https://www.ncbi.nlm.nih.gov/cdd/)所提供的家族成員所含結(jié)構(gòu)域起始位點整理結(jié)構(gòu)域氨基酸序列。利用MEME (http://meme-suite.org/tools/meme) 在線預測dMTase家族蛋白的保守motif,最大發(fā)現(xiàn)數(shù)設為12個,其他參數(shù)設為默認值。使用TBtools[20]軟件對結(jié)構(gòu)域及保守motif位點進行可視化顯示。 從Ensembl Plants數(shù)據(jù)庫中下載擬南芥和水稻dMTase的氨基酸序列,使用Clustal W 軟件進行dMTase同源蛋白的氨基酸序列比對。利用MEGA 11(https://www.megasoftware.net/)軟件構(gòu)建系統(tǒng)進化樹,選擇鄰接法( Neighbor-joining ),bootstrap 方法重復采樣1 000次,其余參數(shù)默認,參考擬南芥和水稻 dMTase基因家族的亞族分類結(jié)果對小麥dMTase 基因家族進行亞族分類,并依據(jù)小麥dMTase染色體位置進行基因命名。利用ITOL(https://itol.embl.de)在線軟件對進化樹進行美化處理。 從Ensembl Plants數(shù)據(jù)庫中下載的小麥基因信息gff3文件中提取dMTase基因染色體位置和基因結(jié)構(gòu)信息,利用GSDS 2.0( http://gsds.cbi.pku.edu.cn )分析小麥 dMTase基因的外顯子和內(nèi)含子分布模式。從相同數(shù)據(jù)庫中下載小麥基因組(DNA)數(shù)據(jù),利用TBtools 軟件截取小麥dMTas基因起始密碼子上游2 000 bp的DNA序列,利用Plant CARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html)工具分析啟動子順式作用元件種類、數(shù)目及功能,并使用 TBtools 軟件進行可視化。 根據(jù)小麥基因組注釋gff3文件獲取dMTase基因家族成員的染色體位置信息,利用TBtools 軟件的MCScanX工具計算并獲取小麥dMTase共線性及基因的串聯(lián)重復信息,并進行對小麥基因的染色體位置信息、共線性關系、串聯(lián)重復信息進行可視化。利用TBtools軟件計算直系同源基因間的同義替換率(Ks) 和非同義替換率(Ka)。通過Ka/Ks 值來評估小麥dMTase 基因在進化過程中受到的選擇壓力影響,Ka/Ks>1、<1或=1分別表示復制基因?qū)κ艿秸蜻x擇、純化選擇和中性進化的影響。 從Wheat Exp數(shù)據(jù)庫(http://www.wheat-expression.com) 檢索小麥RNA-Seq數(shù)據(jù),用TPM(transcripts per million reads)值LogScale標準化后評估小麥基因的轉(zhuǎn)錄本豐度值。用TBtools軟件繪制小麥TadMTase基因表達熱圖。 表1 熒光定量分析引物Table 1 Primers used forreal-time PCR 以7個擬南芥和8個水稻dMTase蛋白為參考序列,結(jié)合BlastP和HMM 模型Pfam(PF00730)HMMER3.0兩種方法搜索小麥dMTase蛋白序列,之后進行序列比對,去除冗余序列后合并,利用Pfam和SMART結(jié)構(gòu)域搜索檢驗候選基因是否含有ENCO3c結(jié)構(gòu)域(ENCO3c包含 HhH-GPD),最終在小麥基因組中共鑒定出18個候選基因,并根據(jù)系統(tǒng)進化關系和其染色體位置進行命名。在ExPASy數(shù)據(jù)庫中對小麥所有dMTase蛋白序列進行理化性質(zhì)預測分析,結(jié)果(表2)表明,小麥dMTase基因家族蛋白氨基酸長度為276 ~1 982個aa,分子量為30.7~ 218.4 kDa。蛋白等電點為6.0 ~ 9.7,均值為7.48,預測大部分為中性蛋白;小麥 dMTase蛋白不穩(wěn)定系數(shù)均大于 40,為不穩(wěn)定蛋白;蛋白親水性(GRAVY)分析顯示小麥所有 dMTase 蛋白都是親水性蛋白。亞細胞定位預測表明,小麥dMTase基因編碼蛋白均定位于細胞核中(表2)。 將檢索到的 18個小麥dMTase基因的蛋白序列,與已知的7個擬南芥dMTase基因[AtDML5b(AT1G05900.1)、AtDML5a(AT2G31450.1)、AtROS1(AT2G36490.1)、AtDML2(AT3G10010.1)、AtDML4(AT3G47830.1)、AtDML3(AT4G34060.3)、AtDME(AT5G04560.1)]和8 個水稻 dMTase 基因[OsROS1a(Os01g11900.1)、OsROS1d(Os02g29230.1)、OsDML3a(Os02g29380.1)、OsDML3b(Os04g28860.1)、OsROS1b(Os05g37350.1)、OsROS1c(Os05g37410.1)、OsDML4(Os06g13070.1)、OsDML5(Os11g16580.1)]共計33 個dMTase基因的蛋白序列進行比對,并構(gòu)建系統(tǒng)進化樹?;谒綩sdMTase分類,將小麥18個dMTase歸屬于ROS1、DML3、DML4和DML5等 4個亞家族。其中ROS1最多,包含9個dMTase基因,其他亞家族各有3個(圖1A)。利用 CDD 對TadMTase進行保守結(jié)構(gòu)域分析,結(jié)果(圖1B)表明,所有的TadMTase均含有ENCO3c保守結(jié)構(gòu)域,ENCO3c結(jié)構(gòu)域行使糖苷酶功能是dMTase 特異性結(jié)構(gòu)域。TadMTase不同亞族所包含的保守結(jié)構(gòu)域種類不同,ROS1和DML3亞族包含3 個共同保守結(jié)構(gòu)域:ENCO3c(包含 HhH-GPD domain)、FES以及RRM_DME結(jié)構(gòu)域。其中小麥TaROS1a-5A/B與擬南芥AtROS1、水稻OsROS1a的ROS1亞家族還包含了一個介導 DNA 結(jié)合活性的Perm-CXXC 結(jié)構(gòu)域。而DML5包含ENCO3c和FES 2個結(jié)構(gòu)域和DML4僅包含1個 ENCO3c結(jié)構(gòu)域。 圖1 TadMTase 進化樹(A)和保守結(jié)構(gòu)域(B)分析 小麥18個DNA去甲基化酶的motif分析如圖2A所示,小麥DNA去甲基化酶基因包含了12個motif結(jié)構(gòu),但不同亞族的所擁有的Motif不同,與其保守結(jié)構(gòu)域一致。如ROS1亞家族的motif組成相同,包含motif 1、2、3、5、6、7、9 、10和11共9個保守motif,組成ENDO3c、FES、Perm-CXXC、RRM_DME 結(jié)構(gòu)域,其中motif1、6、7和9共同構(gòu)成一個保守的ENDO3c糖苷酶結(jié)構(gòu)域。而DML3亞家族包含7個motif,分別是motif 1、2、3、5、7、9和11,它們構(gòu)成了ENDO3c、FES和RRM_DME結(jié)構(gòu)域;DML4亞家族僅包含2個motif結(jié)構(gòu),分別是motif 1和7,它們構(gòu)成了ENDO3c結(jié)構(gòu)域;DML5亞家族包含4個motif結(jié)構(gòu),即motif1、2和9構(gòu)成了ENDO3c和FES結(jié)構(gòu)域。 圖2 TadMTase 基因家族保守基序(A)和基因結(jié)構(gòu)(B) 為進一步闡明小麥TadMTase基因的結(jié)構(gòu)特征,利用 GSDS 2.0研究基因的外顯子-內(nèi)含子結(jié)構(gòu),分析顯示TadMTase亞組間基因結(jié)構(gòu)差異較大,其中ROS1包含18~22個外顯子(圖 2B),DML3包含17個外顯子,DML5包含13個外顯子,而DML4只包含4個外顯子。這與已報道的植物dMTase基因結(jié)構(gòu)相似,進一步說明雖不同物種在進化過程中發(fā)生了分化事件,但其同源基因在分化后仍具有相似結(jié)構(gòu),進一步說明dMTase家族具有其保守性。 利用 Plant CARE 數(shù)據(jù)庫對18個TadMTase基因上游2 000 bp 順勢作用調(diào)控元件分析,共預測出34種CREs順式作用元件(圖3A)。這些CREs除了2 種傳統(tǒng)的啟動子元件(TATA-box,CAAT-box)外,其余32種 CREs大致可以分為4組:植物生長發(fā)育、植物激素響應、光響應以及脅迫響應相關的作用元件(圖3B)。所有已鑒定的小麥TadMTase基因啟動子CREs位點共有460個,其中以光反應因子最多163個(35.43%),其次是激素反應因子144個(31.4%)、植物發(fā)育相關因子77個(16.74%)和脅迫反應因子76個(16.52%)。在TadMTase啟動子中發(fā)現(xiàn)了10種光響應型CREs,其中,G-box 和sp1 CREs較多,普遍存在于TadMTase啟動子,且拷貝數(shù)較多。參與激素信號轉(zhuǎn)導的CREs包括生長素應答(TGA-box)、脫落酸反應(ABRE)、茉莉酸甲酯反應(CGTCA-motif 和 TGACG-motif)、赤霉素反應(GARE-motif 和 P-box)和水楊酸反應(TCA-element)元件。在這些CREs中ABRE、CGTCA、TGACG和TGA基序最為普遍。 TadMTase啟動子還具有多種應激反應調(diào)控元件,如參與低溫應激的 LTR,參與干旱誘導的MBS,涉及防御和應激反應的 TC-rich repeats以及響應厭氧誘導的 ARE 調(diào)控元件。另外,還確定了一些組織特異性的順式調(diào)控元件,例如參與胚乳特異性表達所需的 GCN4_motif 和胚乳負調(diào)控相關的AACA_motif,以及與分生組織特異性激活有關的 CAT-box。此外,還發(fā)現(xiàn)參與玉米蛋白代謝調(diào)控的O2-site??傊?小麥TadMTase啟動子中最常見的順式調(diào)節(jié)元件主要與生理過程有關,例如光信號、激素響應和生長發(fā)育。 利用小麥基因組注釋信息,對18個小麥TadMTase基因進行染色體定位。 結(jié)果表明,TadMTas分布于小麥21條染色體上的15條上(圖4A),其中1A、1B和1D染色體上各有2個,其余3A、3B、3D,4A、4B、4D、5A、5B、5D、7A、7B、7D染色體各有1個TadMTase基因。在小麥A、B 和 D 同源染色體組中,均含有6個基因,說明TadMTase基因在小麥A、B 和 D 同源染色體進化過程中比較保守,不同基因在同源染色體的丟失和保留沒有明顯的偏好現(xiàn)象。利用MSCcanX軟件對小麥全基因組產(chǎn)生的基因復制事件進行分析,結(jié)果發(fā)現(xiàn)18個TadMTase基因都存在與其高度相似的同源序列,并構(gòu)成6個同源基因組,每組均由同源染色體組(A、B、D)上的同源基因組成,且這些同源基因組聚類分析均處于同一進化分支,如:TaDML3a-3A、TaDML3a-3B和TaDML3a-3D(圖1)。同時分析了非同源染色體上的基因串聯(lián)重復,其中在同一染色體上鑒定了3個基因串聯(lián)重復,分別是TaROS1b-1A.1和TaROS1b-1A.2,TaROS1b-1B.1和TaROS1b-1B.2,TaROS1b-1D.1和TaROS1b-1D.2,而非同源的染色體上未發(fā)現(xiàn)基因串聯(lián)重復(圖4A)。 片段復制基因用彩色線條連接; 圓形代表AABBDD(Triticum aestivum)、菱形代表AA(Triticum urartu)、正方形代表DD(Aegilops tauschii)和 三角形代表AABB(Triticum dicoccoides)基因組中的dMTase 基因。 為進一步明確dMTase基因在小麥多倍體形成過程中基因擴張情況,利用TadMTase序列分別檢索了AA(Triticum urartu)二倍體、DD(Aegilops tauschii)二倍體和 AABB(Triticum dicoccoides)四倍體小麥祖先種基因組。結(jié)果表明在祖先種的 AA、DD和AABB 基因組中分別檢索到9、9和18個高度相似的dMTase同源基因,進化樹顯示TadMTase基因在其祖先物種中均有同源基因并在各自的進化分支,結(jié)果揭示在異源六倍體形成過程中存在部分dMTase基因丟失現(xiàn)象(圖4B)。 為了進一步研究這些復制基因?qū)κ艿胶畏N選擇,對小麥TadMTase基因Ks、Ka以及Ka/Ks比值計算。結(jié)果發(fā)現(xiàn)所有小麥TadMTase基因Ka/Ks<1,表明在基因擴張過程中經(jīng)歷了強烈的純化選擇,說明這些基因在進化過程中序列并未發(fā)生太大改變,相似性較高。 為了探討不同生長發(fā)育階段TadMTase基因在小麥中的組織特異性表達模式,利用小麥基因轉(zhuǎn)錄組數(shù)據(jù)庫對 18個小麥TadMTase基因進行檢索,分析了小麥花藥(anth)、第1葉(lea_1)、胚(emb)、胚乳(en)、旗葉(fls)、穎片(glu)、籽粒(grain)、根(root)、莖(stem)和穗(spike)組織的轉(zhuǎn)錄水平,結(jié)果表明(圖5A),小麥dMTase基因在不同組織或器官中的表達模式有明顯的差異,TaROS1a-5A/5B/5D在所有組織中表達活躍,在穗和籽粒中表達量最高,而TaROS1b-1A.1、1B.1在胚組織中表達量較高,在穗和籽粒中也有表達。同時分析了TadMTase基因在籽粒不同發(fā)育時期(花后15、25和35 d)及其胚乳(en)和糊粉層(al)組織不同時期(花后10、20和30 d)表達情況,結(jié)果表明(圖5B)小麥TadMTase基因的ROS1亞家族明顯高于DML亞家族。其中TaROS1b-1A.1、TaROS1a-5A和TaROS1a-5D在籽粒、糊粉層及胚乳中表達量較高。在籽粒發(fā)育階段,TaROS1b-1A.1、TaROS1a-5A和TaROS1a-5D表達量均在花后15 d最高,后逐漸下降。在糊粉層及胚乳發(fā)育階段這3個基因表達量也均是前期高于后期。 小麥組織:花藥、第1葉、胚、胚乳、旗葉、穎片、籽粒、根、莖和穗;dpa為籽粒、糊粉層、胚乳發(fā)育時期(花后天數(shù))。下同。 基于小麥轉(zhuǎn)錄組數(shù)據(jù)中TaROS1a、TaROS1b和TaDML3亞家族基因在小麥籽粒發(fā)育過程中的表達量較高特征,繼續(xù)在不同籽粒品質(zhì)的小麥品種揚麥15(弱筋)和揚麥16(中強筋)進行了轉(zhuǎn)錄組測序分析,結(jié)果顯示(圖6),TaROS1a、TaROS1b和TaDML3亞家族基因在兩種小麥籽粒發(fā)育中表達模式相似,但不同基因間表達量則發(fā)生了明顯分化;TaROS1a-5A/B/D表達最為強烈,在弱筋小麥揚麥15中TaROS1a-5A/B/D表達在15 d達峰值后下降較緩慢,并持續(xù)至25 d后再迅速下降,而在揚麥16中TaROS1a-5A/B/D達峰值后則迅速下降,且TaROS1a-5A/B/D在弱筋小麥品種中表達量高于中強筋揚麥16;TaROS1b亞家族基因表達發(fā)生分化,TaROS1b-1A/B/D.1表達量較高,而TaROS1b-1A/B/D.2幾乎不表達,且TaROS1b-1A/B/D.1在揚麥16中的表達則高于揚麥15;TaDML3表達量較低,且3個同源基因也發(fā)生分化,TaDML3-3A/B有少量表達,而TaDML3-3D則幾乎不表達。 圖6 TadMTase基因在揚麥15(A)和揚麥16(B)籽粒發(fā)育過程中的表達分析 基于TaROS1b-1A.1、TaROS1a-5A和TaROS1a-5D基因在小麥籽粒糊粉層和胚乳發(fā)育過程中的高表達量特征(圖5B),為了進一步驗證轉(zhuǎn)錄組的結(jié)果,根據(jù)獲得的TaROS1b-1A.1、TaROS1a-5A和TaROS1a-5D序列設計引物(表1),用實時熒光定量 PCR方法分析3個基因在花后10、20和30 d籽粒種皮和胚乳組織種的表達情況。結(jié)果顯示(圖7)在種皮發(fā)育20 d時,TaROS1b-1A.1、TaROS1a-5A和TaROS1a-5D表達量均達最高,且TaROS1b-1A.1表達量高于TaROS1a-5A、TaROS1a-5D;在胚乳中,TaROS1b-1A.1和TaROS1a-5A兩基因在20 d時表達量達最高,但TaROS1b-1A.1表達量低于TaROS1a-5A和TaROS1a-5D;在花后10 和20 d,弱筋小麥揚麥15籽粒種皮和胚乳中,3個基因表達量均顯著高于中強筋小麥揚麥16。 字母代表同一時期不同品質(zhì)小麥顯著性差異比較(P<0.05)。 本研究從小麥全基因組數(shù)據(jù)庫中獲得了18 個 dMTase 基因成員,高于其它已報導物種中的基因家族成員數(shù),結(jié)合系統(tǒng)發(fā)育分析,將TadMTases分為兩類(ROS1和DML),其中DML又分為DML3、DML4和DML5。在小麥中沒有發(fā)現(xiàn)DME亞族,這與其他研究發(fā)現(xiàn)的DME亞族基因只在擬南芥等雙子葉中,而在單子葉植物中沒有的結(jié)果一致[21-23]?;陔p子葉植物中DME基因與ROS1基因的高同源性,推測DME基因是在單、雙子葉植物分化后由雙子葉植物內(nèi)部ROS1基因復制產(chǎn)生的新基因[9]。 進化及保守結(jié)構(gòu)域分析表明小麥dMTase與聚類關系較近的擬南芥和水稻dMTase具有相似的保守結(jié)構(gòu),如 ROS1 亞族的AtROS1、OsROS1a 和 TaROS1a-5A/B/D都含有 ENDO3c、FES、Perm-CXXC、RRM_DME 4個相同結(jié)構(gòu)域。然而不同亞族之間保守結(jié)構(gòu)域的個數(shù)和種類差異較大,這是可能是由于物種進化過程中產(chǎn)生基因無功能化、新功能化和亞功能化所致,說明dMTase基因在進化過程中會更加傾向趨異進化[24]。亞細胞定位研究還發(fā)現(xiàn)小麥dMTase均定位于細胞核,與其他植物物種,如擬南芥、水稻、番茄、花生、蓖麻豆、茄子、茶樹和蘭花也被證明位于細胞核內(nèi)的結(jié)果一致。基于亞細胞定位在確定蛋白質(zhì)功能中的重要性,植物dMTase基因的功能可能是保守的。 小麥dMTase在每個亞家族中具有相似的外顯子-內(nèi)含子組成,但ROS1和DML亞家族基因外顯子-內(nèi)含子數(shù)目變化有所差異,其中ROS1b亞家族基因的外顯子-內(nèi)含子數(shù)目為19~21個,而3個DML亞家族(DML3、DML4和DML5)基因均有相同的外顯子-內(nèi)含子,基因結(jié)構(gòu)更為保守。 小麥dMTase基因上游 2 000 bp啟動子序列的順式作用元件分析發(fā)現(xiàn),小麥dMTase的啟動子具有光響應、植物激素響應、脅迫響應和生長發(fā)育 4 類CREs順式作用調(diào)控元件,類似CREs已在其他植物如花生[25]、獼猴桃[26]、山茶花[18]和鐵皮石斛[22]的dMTase基因啟動子區(qū)也報道了ABRE、CGTCA-motif、TGA-element、G-box、sp1、A-box、ARE和CAT-box等元件,表明小麥dMTase基因可能參與了植物的發(fā)育和應激反應調(diào)控。其中TaROS1b-1D.2基因啟動子中還發(fā)現(xiàn)了與種子特異性調(diào)控和胚乳特異性表達相關的CREs,表明TaROS1b-1D.2基因可能參與小麥胚乳發(fā)育的調(diào)控。 進化分析表明小麥dMTase基因在A、B和D部分同源基因組中分布均勻,進化一致。通過小麥與其祖先物種的dMTase基因進化分析發(fā)現(xiàn),小麥dMTase與其祖先種在基因數(shù)量上存在差異,雖然基因總數(shù)可能在小麥異源六倍體形成進化過程中經(jīng)歷了3個二倍體祖先種的兩輪自然加倍,使得基因組也經(jīng)歷了2次擴張,造成dMTase基因數(shù)目增加,但并非3倍增加,存在部分dMTase基因的丟失,其原因可能是由于小麥形成進化過程中染色體重組或基因功能冗余造成。共線分析表明小麥dMTase基因的ROS1b亞家族存在串聯(lián)復制,產(chǎn)生新的功能和亞功能化基因,這為進一步研究不同DNA去甲基化酶基因的作用和機制提供了線索。 基因表達模式可以提供相關基因功能的重要信息,小麥dMTase在組織特異性表達模式分析中,發(fā)現(xiàn)TaROS1a亞家族基因在所有組織中都有較高的表達,在其他植物物種中也發(fā)現(xiàn)了類似的結(jié)果,如花生中的ROS2[25]和DoDML3在鐵皮石斛[22]在所有組織中都有相對較高的表達。而TaROS1b亞家族基因表達存在基因分化和組織特異性,其中TaROS1b-1A.1基因在小麥胚和胚乳中有較高的表達,與其啟動子胚乳特異性表達元件相一致,而該基因的串聯(lián)復制基因TaROS1b-1A/B/D.2在各組織及發(fā)育時期幾乎不表達,說明不同小麥dMTase基因在植物生長發(fā)育過程的在不同發(fā)育階段可能具有獨特的功能,也說明DNA 去甲基化酶基因在進化過程中會更加傾向趨異進化。 研究表明水稻OsROS1aknock-in突變后導致胚乳早期發(fā)育失敗和胚發(fā)育不完全[12], 而OsROS1顯性負突變導致糊粉層增厚,其調(diào)控機制為OsROS1基因的突變,可導致調(diào)控糊粉層發(fā)育相關的轉(zhuǎn)錄因子RISBZ1和RPBF超甲基化,抑制其基因表達,從而導致糊粉層細胞層數(shù)的增加[27]。小麥轉(zhuǎn)錄組數(shù)據(jù)分析表明小麥TaROS1a-5A/D和TaROS1b-1A.1在籽粒及其糊粉層和胚乳中高表達,這也被我們采用qRT-PCR方法證實(如TaROS1b-1A.1和TaROS1a-5A/D)。同時,qRT-PCR表達分析發(fā)現(xiàn)TaROS1b-1A.1和TaROS1a-5A/D在強筋和弱筋品質(zhì)小麥中表達水平也存在一定的差異,推測TaROS1基因可能對小麥胚乳品質(zhì)形成有一定影響。這些發(fā)現(xiàn)提示小麥ROS1基因可能在小麥胚乳和種皮糊粉層的發(fā)育發(fā)揮著和OsROS1同樣的調(diào)控作用。然而,這些基因是如何調(diào)控胚乳和糊粉層的發(fā)育及品質(zhì)形成,需要進一步開展基因功能等相關研究來加以驗證。1.2 小麥 dMTase蛋白理化性質(zhì)、結(jié)構(gòu)域及保守motif預測分析
1.3 系統(tǒng)發(fā)育樹的構(gòu)建、基因結(jié)構(gòu)分析
1.4 TadMTase基因染色體定位、共線性和基因復制事件分析
1.5 TadMTase基因組織表達分析
2 結(jié)果與分析
2.1 TadMTase基因家族成員的篩選及其蛋白理化性質(zhì)分析
2.2 TadMTase基因家族蛋白系統(tǒng)進化樹構(gòu)建及保守結(jié)構(gòu)域分析
2.3 TadMTase基因家族基因結(jié)構(gòu)和啟動子順式作用元件分析
2.4 TadMTase基因染色體定位和基因復制分析
2.5 TadMTase家族基因表達分析
3 討論
3.1 小麥dMTases 的蛋白質(zhì)結(jié)構(gòu)特征
3.2 小麥dMTase的基因結(jié)構(gòu)特征及進化
3.3 小麥dMTase基因的表達與生長發(fā)育的關系