關(guān)鍵詞: 珙桐; MADS-box 基因家族; 花瓣?duì)畎?基因異位表達(dá)
1 引言
花是被子植物特有的生殖器官,其大小、形狀和顏色因物種而異. 植物開花的過程由一系列基因構(gòu)成一個(gè)復(fù)雜的基因調(diào)控網(wǎng)絡(luò)響應(yīng)外界環(huán)境及內(nèi)源的開花信號(hào)而操縱. 編碼一系列轉(zhuǎn)錄因子的MADS-box 基因家族在其中發(fā)揮著重要的作用,參與了從響應(yīng)開花信號(hào)到花原基啟動(dòng)再到花器官身份確立以及花發(fā)育的整個(gè)開花過程.
在植物中具有Ⅰ類和Ⅱ類兩種MADS-box 基因,Ⅰ類MADS-box 基因也稱M 型基因,編碼的蛋白只有SRF-like MADS-box 結(jié)構(gòu)域,根據(jù)其C 末端區(qū)域的保守基序可分為Mα、Mβ 和Mγ 3 類[1]. 植物Ⅱ 類MADS-box 基因也稱MIKC 型基因,其編碼的蛋白除MADS-box 結(jié)構(gòu)域外,還具有I(intervening)、K-box(keratin-like)和C(C-terminal)3 個(gè)結(jié)構(gòu)域[2]. MIKC 型基因又可進(jìn)一步分為MIKCC 型和MIKC*型基因,MIKCC 型基因編碼的蛋白保留了原始的“經(jīng)典結(jié)構(gòu)”, 而MIKC*型蛋白的I 結(jié)構(gòu)域明顯長于MIKCC蛋白,K-box 結(jié)構(gòu)域在序列及長度上也與MIKCC 蛋白存在差異[3]. MIKCC 型基因根據(jù)系統(tǒng)發(fā)育情況可劃分為AG, AGL12, AGL15,AGL17, AGL2/SEP, AGL6, FLC, GGM13,PI/AP3, STMADS11, SQUA, TM3 共12 個(gè)不同的進(jìn)化枝,每個(gè)進(jìn)化枝的基因具有相似的表達(dá)模式和高度相關(guān)的功能.
MADS-box 基因編碼的蛋白在響應(yīng)開花信號(hào)調(diào)控開花時(shí)間,花器官身份決定,種子及果實(shí)發(fā)育以及根的發(fā)育等多方面發(fā)揮重要的調(diào)控作用,其在花器官身份決定中的作用尤其受到關(guān)注. 一朵典型的花通常由四輪花器官按同心圓的形式排列,從外到里分別為萼片、花瓣、雄蕊和心皮. 研究人員們通過突變體植株中花器官的同源轉(zhuǎn)化發(fā)現(xiàn)花器官身份的確立由一系列花器官特征基因指定[4]. 并基于這些基因的突變體表型及遺傳相互作用,經(jīng)過不斷發(fā)展、補(bǔ)充和修訂,最終建立了花器官身份決定的“ABCDE”模型,將這些花器官特征基因分為5 類并對(duì)它們的功能進(jìn)行了描述. 根據(jù)“ABCDE”模型:A 類基因指定萼片的形成;B 類基因和A 類基因共同指定花瓣的形成;B 類基因和C類基因共同指定雄蕊的形成;雌蕊的形成由C 類基因單獨(dú)指定;D 類基因調(diào)控胚珠的發(fā)育;E 類基因參與每一輪花器官的形成[5-8]. 目前已鑒定的所有花器官特征基因中除了 A 功能基因 APETALA2(AP2) 外都編碼 MIKCC 型MADS-box 轉(zhuǎn)錄因子[9, 10]
在花器官身份建成時(shí),花器官特征基因的表達(dá)被限制在特定的器官輪里. 而花器官特征基因在其他的花器官區(qū)域發(fā)生異位表達(dá),能夠?qū)⑵溆绊憯U(kuò)大到不同的花器官輪,從而導(dǎo)致花器官的同源轉(zhuǎn)化[10, 11]. 在矮牽牛和番茄葉中證明了轉(zhuǎn)基因植株異位表達(dá)AG 基因可以將萼片轉(zhuǎn)化為心皮,花瓣轉(zhuǎn)化為雄蕊. AP2 基因在第三輪花器官的表達(dá)導(dǎo)致雄蕊轉(zhuǎn)變?yōu)榛ò辏?2-14]. 在一些花被未分化的單子葉植物中,呈現(xiàn)兩輪一樣的花瓣?duì)罨ū?,例如郁金香?1]和百合[15],在它們的兩輪花被中都檢測(cè)到了B 類基因的表達(dá). 在雙子葉植物中也有這樣的例子,例如枇杷[16]和小花瓜蓮[17]. 除了花器官外,一些物種在苞片中也表現(xiàn)出花瓣的特征,珙桐(Davidia involucrata)的花尤其特別,其花被完全缺失,且花序軸極度縮短形成一個(gè)球形的頭狀花序,使整個(gè)花序看起來像一朵花. 花序外側(cè)生長的一對(duì)(少數(shù)為單瓣或三瓣)白色苞片取代花瓣,以吸引傳粉者和保護(hù)花粉免受雨水的侵襲. 并且隨著花序的生長,苞片有明顯的由葉狀向花瓣?duì)钸^渡的過程. 這些特征表明,珙桐具有較高的科學(xué)價(jià)值,是研究花器官特性在花外建立和花瓣?duì)畎l(fā)育的理想材料.
研究人員已經(jīng)認(rèn)識(shí)到MADS-box 家族基因在珙桐苞片發(fā)育中的重要性,并對(duì)其部分基因進(jìn)行了研究,但僅局限于少數(shù)幾個(gè)基因的克隆及表達(dá)定量[18, 19]. 目前仍需要對(duì)珙桐的MADS-box 基因家族進(jìn)行更全面、系統(tǒng)的研究,以了解其對(duì)其花器官特性和花瓣?duì)畎l(fā)育的影響. 本研究將基于Chen 等[20]發(fā)布的珙桐基因組組裝,在全基因組范圍內(nèi)對(duì)珙桐MADX-box 家族基因進(jìn)行鑒定,并通過與近緣物種的比較探索該基因家族的進(jìn)化. 進(jìn)一步,通過轉(zhuǎn)錄組測(cè)序分析MADS-box 在苞片發(fā)育過程中的表達(dá)模式并預(yù)測(cè)其潛在的靶基因,探究MADS-box 基因家族對(duì)珙桐花瓣?duì)畎纬傻恼{(diào)控機(jī)制,對(duì)被子植物開花調(diào)控網(wǎng)絡(luò)進(jìn)行進(jìn)一步的補(bǔ)充和完善.
2 材料與方法
2. 1 材料
2. 1. 1 植物材料 珙桐苞片及葉片材料取于四川省成都市都江堰龍溪-虹口國家級(jí)自然保護(hù)區(qū).分別于2018 年4 月15 日、4 月22 日、5 月7 日采集開花早、中、晚期的珙桐苞片和葉片(對(duì)應(yīng)的苞片分別為綠色、淡綠色和白色). 根據(jù)時(shí)間由早到晚,將3 個(gè)時(shí)期的苞片和葉片分別標(biāo)記為B-1、B-2、B-3和L-1、L-2、L-3. 每組苞片和葉片各取3 個(gè)生物重復(fù).
2. 1. 2 數(shù)據(jù)來源 本研究使用的珙桐及近緣物種基因組及注釋來源:珙桐全基因組序列和注釋從國家基因組科學(xué)數(shù)據(jù)中心(National GenomeData Center,https://ngdc. cncb. ac. cn/)獲取,登錄號(hào)為GWHABJS00000000[20]. 近緣物種喜樹(Camptotheca acuminata)染色體規(guī)?;蚪M組裝及注釋數(shù)據(jù)從Figshare 數(shù)據(jù)庫獲得[基因組組裝:https://doi. org/10. 6084/m9. figshare. 12570599;注釋:https://doi. org/10. 6084/m9. figshare. 12570614][21]. 藍(lán)果樹(Nyssa sinensis)[22]和山茱萸(Cornus florida)的全基因組信息均從NCBI 數(shù)據(jù)庫下載,登錄號(hào)分別為:GCA_008638375. 1 和GCF_030987335. 1.
2. 2 方法
2. 2. 1 珙桐MADS-box 家族基因鑒定 以擬南芥MADS-box 蛋白序列為參考序列,使用Ge?MoMa-1. 9[23]軟件,通過tblastn 策略在珙桐基因組范圍內(nèi)鑒定可能的MADS-box 基因座位. 基于與Swisse-Prot 數(shù)據(jù)庫的比對(duì)結(jié)果將新基因座位與基因組注釋去冗余獲得候選基因. 將全部候選基因編碼的氨基酸序列使用Interproscan[23],利用Pfam數(shù)據(jù)庫(http://pfam. xfam. org/)進(jìn)行注釋. 提取注釋結(jié)果中包含PF00319(SRF-box)和PF01486(MIKCC 型 K-box)結(jié)構(gòu)域的序列為珙桐MADSbox蛋白序列.
2. 2. 2 珙桐MADS-box 基因系統(tǒng)發(fā)育分析及分類 利用鑒定出來的珙桐MADS-box 基因編碼的最長氨基酸序列進(jìn)行系統(tǒng)發(fā)育分析. 長度大于100aa 的序列與擬南芥MADS-box 基因編碼的蛋白質(zhì)序列一起,利用MAFFT 軟件[24]進(jìn)行多序列比對(duì). 使用ProtTest 3[25]軟件檢測(cè)序列建樹的最佳模型,然后使用RAxML[26]基于最大似然法構(gòu)建ML 進(jìn)化樹,并根據(jù)分析結(jié)果對(duì)MADS-box 基因進(jìn)行分類. 長度小于100aa 的序列與NR 數(shù)據(jù)庫進(jìn)行比對(duì),參考比對(duì)結(jié)果進(jìn)行分類.
2. 2. 3 山茱萸目物種MADS-box 基因家族同源性研究 對(duì)喜樹、藍(lán)果樹、山茱萸使用與珙桐相同的方法分別鑒定物種中的MADS-box 基因并分類. 并將在珙桐及近緣物種中鑒定出來的MADSbox家族基因使用OrthoFinder-v2. 4. 0[27]進(jìn)行同源性分析.
2. 2. 4 珙桐MADS-box 基因家族特征分析 將鑒定出來的珙桐MADS-box 蛋白氨基酸序列利用MEME[28]進(jìn)行motif 預(yù)測(cè). 利用Expasy[29]的Protparam工具(https://web. expasy. org/protparam/)分析編碼蛋白的理化性質(zhì). 另外分別使用TMHMM2. 0[30]和SignalP-6. 0[31]軟件對(duì)蛋白質(zhì)氨基酸序列的跨膜結(jié)構(gòu)域和信號(hào)肽結(jié)構(gòu)進(jìn)行預(yù)測(cè).2. 2. 5 珙桐MADS-box 基因家族進(jìn)化分析 使用MCScanX[32]基于默認(rèn)參數(shù)進(jìn)行物種內(nèi)共線性分析及復(fù)制類型分類. 隨后根據(jù)物種內(nèi)共線性分析得出的共線性基因?qū)?,利用基因的CDS 序列對(duì)共線性基因?qū)χg的堿基非同義替換率(Ka)和同義替換率(Ks)進(jìn)行計(jì)算. 最后對(duì)M type, MIKC*和 MIKCC 三種類型的MADS-box 基因的Ka/Ks進(jìn)行計(jì)算,分析珙桐不同類型MADS-box 基因所受到的選擇壓力.
2. 2. 6 珙桐MADS-box 基因在苞片發(fā)育過程中的表達(dá)模式分析 從三個(gè)發(fā)育時(shí)期的18 例苞片及葉片樣本中提取總RNA 進(jìn)行轉(zhuǎn)錄組測(cè)序. 轉(zhuǎn)錄組文庫構(gòu)建和測(cè)序服務(wù)由華大基因提供,使用BGISEQ-500 測(cè)序平臺(tái)進(jìn)行. 測(cè)序原始數(shù)據(jù)已上傳至國家基因組科學(xué)數(shù)據(jù)中心GSA 數(shù)據(jù)庫(CRA013964),可通過https://ngdc. cncb. ac. cn/gsa 公開訪問. 使用SOAPnuke 短序列過濾軟件和Trimmomatic[33]對(duì)原始數(shù)據(jù)進(jìn)行過濾獲得Cleanreads. 使用HISAT2[34]將Clean reads 比對(duì)到珙桐基因組. 利用Stringtie 軟件[35]對(duì)不同發(fā)育階段的苞片和葉片中的基因表達(dá)進(jìn)行定量分析. 采用DEseq2 軟件[36]進(jìn)行差異表達(dá)分析,差異表達(dá)基因篩選標(biāo)準(zhǔn)為log2FC 絕對(duì)值大于等于1 且FDR 小于0. 01.
2. 2. 7 基因表達(dá)模式的qRT-PCR 驗(yàn)證 qRT-PCR 使用Hieff UNICON? Universal Blue qPCRSYBR Green Master Mix (Yeasen; Shanghai,China)基于CFX Connect Real-Time PCR DetectSystem 平臺(tái)進(jìn)行. 擴(kuò)增程序?yàn)椋?5 ℃預(yù)變性2 min,95 ℃變性10 s,60 ℃退火/延伸30 s,40 個(gè)循環(huán). 使用珙桐β-DiACTIN 基因作為內(nèi)參基因,發(fā)育早期的葉片(L-1)作為對(duì)照組,使用2?ΔΔCt法計(jì)算基因的相對(duì)表達(dá)量. qRT-PCR 使用的引物見表1.2. 2. 8 珙桐MADS-box 轉(zhuǎn)錄因子靶基因預(yù)測(cè) 利用 JASPAR 數(shù)據(jù)庫( https://jaspar. elixir. no/)中擬南芥SVP, AP3, AP1 和SEP3 轉(zhuǎn)錄因子結(jié)合位點(diǎn)的motif 分別在基因轉(zhuǎn)錄起始位點(diǎn)上游2000 bp范圍內(nèi)識(shí)別潛在的結(jié)合位點(diǎn). 然后在轉(zhuǎn)錄調(diào)控區(qū)具有結(jié)合位點(diǎn)的基因中根據(jù)pearson 相關(guān)性系數(shù),篩選與對(duì)應(yīng)珙桐同源基因表達(dá)量相關(guān)性gt;0. 70或lt;-0. 70 且Plt;0. 01 的基因作為珙桐同源轉(zhuǎn)錄因子的潛在靶基因.
3 結(jié)果
3. 1 珙桐MADS-box 基因鑒定及分類
在珙桐基因組中共鑒定出103 個(gè)MADS-box家族基因,將這些基因分別命名為DiMADS1-103,其編碼的蛋白質(zhì)分別命名為DiMADS1-103.根據(jù)系統(tǒng)發(fā)育樹的結(jié)果( 圖1a),參考擬南芥MADS-box 基因家族對(duì)103 個(gè)DiMADSs 進(jìn)行了分類. 結(jié)果表明珙桐含有34 個(gè)M type(Ⅰ類)和69 個(gè)MIKC(Ⅱ 類)基因(圖1b). 其中Ⅰ 類MADS 基因中包含18 個(gè)Mα、8 個(gè)Mβ 和8 個(gè)Mγ 分支基因. Ⅱ類MADS 包括10 個(gè)MIKC*類基因和59 個(gè)MIKCC類基因,每個(gè)MIKCC亞家族有1~9 個(gè)成員(圖1c).可以發(fā)現(xiàn)珙桐在AGL2/SEP 亞家族、SQUA 亞家族以及STMADS11 亞家族中的基因數(shù)量遠(yuǎn)超擬南芥,說明這幾個(gè)MADS-box 基因家族的分支可能在珙桐的進(jìn)化過程中發(fā)生了明顯的擴(kuò)張,并且有可能導(dǎo)致這些基因的功能在珙桐中的進(jìn)一步分化. DiMADS76 由于序列較短,未用于構(gòu)建系統(tǒng)發(fā)育樹. 根據(jù)與Nr 數(shù)據(jù)庫的比對(duì)結(jié)果將其歸類為MIKC*型基因.
3. 2 山茱萸目植物MADS-box 基因家族比較分析
為了進(jìn)一步分析珙桐MADS-box 家族基因的進(jìn)化,以及該基因家族在珙桐及其近緣物種中的變化. 使用了同樣方法分別在喜樹、藍(lán)果樹、山茱萸中鑒定出85、102、103 個(gè)MADS-box 家族基因并命名為CaMADS1-85、NsMADS1-102 和Cf?MADS1-103. 如亞家族基因數(shù)目統(tǒng)計(jì)結(jié)果所示,4個(gè)物種基因數(shù)目的主要差異來源于Ⅰ類MADS 基因的差異. 值得注意的是,珙桐的AGL2/SEP 亞家族和SQUA 亞家族的基因數(shù)目除了之前發(fā)現(xiàn)與擬南芥相比有顯著擴(kuò)張之外,與它的近緣物種相比也存在明顯的擴(kuò)張(圖2a).
對(duì)4 個(gè)物種的MADS-box 基因家族進(jìn)行同源性分析. 共鑒定出63 個(gè)orthogroups,其中有40 個(gè)在4 個(gè)近緣物種中共享,包含68 個(gè)DiMADS、72 個(gè)CaMADS、56 個(gè)CfMADS 和62 個(gè)NsMADS. 珙桐、喜樹、藍(lán)果樹、山茱萸各有24、4、18、38 個(gè)物種特異性基因(圖2b). 說明MADS-box 基因家族在這四個(gè)近緣物種中可能具有不同的進(jìn)化歷史,在功能上也可能存在差異.
根據(jù)所有MADS-box 同源基因構(gòu)建的STAG物種樹顯示,在藍(lán)果樹科中喜樹與藍(lán)果樹的親緣關(guān)系比跟珙桐更近. 而屬于另一個(gè)科的物種山茱萸與其他3 個(gè)物種的親緣關(guān)系最遠(yuǎn)(圖2c). 這與此前Qi 等[37]和Li 等[38]利用葉綠體基因組構(gòu)建的山茱萸目和藍(lán)果樹科的物種系統(tǒng)發(fā)育樹相符合,可以為珙桐的系統(tǒng)發(fā)育分類提供一份來自核基因的證據(jù).
在DiMADSs 編碼的氨基酸序列中共鑒定了15個(gè)保守的 moti(f 圖 3a). 其中 99個(gè) DiMADSs氨基酸序列含有motif 1 或motif 8. 通過SMART[39]進(jìn)行評(píng)估,motif 1 和motif 8 都與SRF 結(jié)構(gòu)域高度相關(guān). 結(jié)合這兩個(gè)motif 在序列上的位置和motif的Seqlogo(圖3b)進(jìn)行推斷,motif 8 可能是MADS結(jié)構(gòu)域的核心區(qū)域. 同樣根據(jù)SMART 評(píng)估,Motif2、4、5 與K-box 結(jié)構(gòu)域高度相關(guān),其中motif 2 為核心區(qū)域. 共有57 條MIKCC 型序列(57/59)包含K-box 結(jié)構(gòu)域. 另外,MIKC*類中的motif 15 也與K-box 結(jié)構(gòu)域相關(guān),但是與motif 2 不同. 并且MIKC*類的SRF 結(jié)構(gòu)域和K-box 結(jié)構(gòu)域之間的插入?yún)^(qū)段明顯比MIKCC 類更長. 這兩點(diǎn)均符合二者的特征差異. 此外,部分進(jìn)化支(或亞家族)還具有其特征性的保守基序. 綜上所述, SRF 結(jié)構(gòu)域是MADS-box 基因家族中最保守的結(jié)構(gòu)域,而K-box是Ⅱ型基因的保守結(jié)構(gòu)域. 序列C 端的保守性在總體上較低,但在其亞家族內(nèi)也有一定程度的保守性.
除了DiMADS76 以外,DiMADSs 的編碼序列(CDS)長度范圍為327 bp 至2070 bp,編碼蛋白的氨基酸殘基數(shù)介于108 至698 之間,分子量介于12883. 13 至77751. 06 kDa 之間. 理論等電點(diǎn)(pI)介于4. 36 至10. 36 之間. 所有DiMADSs 均為親水性蛋白,無信號(hào)肽,多數(shù)為不穩(wěn)定蛋白. 僅有3個(gè)DiMADS 蛋白含有1 到2 個(gè)跨膜結(jié)構(gòu).
DiMADS 基因的染色體定位如圖3c、3d 所示. 103 個(gè)基因中,有95 個(gè)基因定位于珙桐基因組組裝的21 條染色體上,8 個(gè)基因定位于未組裝到染色體的片段上. Chr2、Chr 5、Chr13、Chr21 分布了9 個(gè)及以上的MADS-box 基因,其余染色體上皆分布有1~6 個(gè)MADS-box 基因. MIKCC 類基因分布最為廣泛,除Chr15 和Chr18 外,每條染色體上均有MIKCC類基因的分布.
3. 4 珙桐MADS-box 基因家族進(jìn)化分析
為了進(jìn)一步研究發(fā)生在珙桐MADS-box 基因家族中的復(fù)制事件,對(duì)珙桐基因組進(jìn)行了基因復(fù)制及種內(nèi)共線性分析. 如表2 所示,基因被分為五類. 在珙桐103 個(gè)MADS-box 家族基因中,最多的是由全基因組或片段復(fù)制相關(guān)的基因. 珙桐MADS-box 基因家族中沒有基因被分類為單拷貝基因,這可能與MADS-box 基因家族的起源與擴(kuò)張有關(guān)(表3).
55 個(gè)珙桐MADS-box 家族基因關(guān)聯(lián)于48 個(gè)共線性塊中的66 個(gè)共線性基因?qū)χ校▓D4a),說明某些珙桐MADS-box 基因在進(jìn)化過程中發(fā)生了多次的復(fù)制. 大多數(shù)共線性基因?qū)χ械腄iMADSs屬于同一個(gè)亞家族,在一定程度上說明了亞家族基因結(jié)構(gòu)域保守性的形成原因.
對(duì)DiMADSs 的進(jìn)化壓力進(jìn)行分析發(fā)現(xiàn),僅MIKC* 亞家族的DiMADS71-DiMADS15 和Di?MADS71-Dinv44740. t1( 非MADS)兩對(duì)基因的Ka/Ks 大于2,基因受正選擇,可能正在發(fā)生功能上的分化. 其余基因?qū)χg的Ka/Ks 均小于1,且大多數(shù)基因?qū)Φ腒a/Ks 小于0. 5. 證明絕大多數(shù)珙桐MADS-box 基因受到純化選擇. 對(duì)比Ⅰ型M type基因和Ⅱ 型基因中的MIKC*和MIKCC 類MADSbox基因. M type 類基因和MIKC*類基因的Ka、Ks以及Ka/Ks 均無顯著性差異. MIKCC 類基因的Ka以及Ka/Ks 值顯著低于M type 基因和MIKC*類基因,說明MIKCC 類基因受到更為強(qiáng)烈的純化選擇(圖4b~4d). 這應(yīng)當(dāng)與MIKCC 類基因在高等植物發(fā)育過程中的重要作用有著密切關(guān)聯(lián).
3. 5 DiMADSs 在苞片發(fā)育過程中的表達(dá)模式
苞片是珙桐生殖發(fā)育過程中的一種特殊結(jié)構(gòu). 在生長初期,苞片呈綠色,形狀和顏色與同時(shí)期的葉片相似,二者主要根據(jù)著生位置區(qū)分. 隨著發(fā)育的進(jìn)行,兩個(gè)器官的形態(tài)差異逐漸增大. 為了探究MADS-box 基因在苞片變化中的作用,本研究通過轉(zhuǎn)錄組測(cè)序檢測(cè)了這些基因在花期早、中、晚期的苞片和葉片中的表達(dá)模式. 根據(jù)聚類結(jié)果可以將DiMADSs 的表達(dá)譜分為6 類. 類別Ⅰ和Ⅵ包括2 個(gè)AGL2/SEP 亞家族基因、4 個(gè)SQUA 亞家族基因和1 個(gè)Mβ 亞家族基因,這些基因主要在苞片中表達(dá),在葉片中低表達(dá)或不表達(dá). Ⅲ類基因在葉片發(fā)育的不同階段都有較高水平的表達(dá),但在苞片發(fā)育過程中受到抑制. 在Ⅲ類的8 個(gè)基因中,有6 個(gè)是擬南芥SVP 的同源基因,SVP 在擬南芥中具有抵抗?fàn)I養(yǎng)生長向生殖生長轉(zhuǎn)變的功能. 另外2 個(gè)為擬南芥TM3 類基因AGL42、AGL71 和AGL72 的同源基因,這些基因在擬南芥中與開花整合因子密切相關(guān),參與花轉(zhuǎn)化(圖5a).
對(duì)不同發(fā)育時(shí)期的苞片進(jìn)行比較,在B-1vs.B-2、B-2vs. B-3 以及 B-1vs. B-3 中分別鑒定出8 個(gè)、5 個(gè)以及7 個(gè)差異表達(dá)的DiMADSs. 這一結(jié)果暗示了不同的DiMADS 基因可能在苞片發(fā)育的特定階段發(fā)揮著重要的調(diào)控功能. 進(jìn)一步對(duì)各發(fā)育階段的苞片和葉片的差異表達(dá)基因進(jìn)行分析.在B-1vs. L-1、B-2vs. L-2 和B-3vs. L-3 中分別鑒定出19 個(gè)、22 個(gè)和14 個(gè)差異表達(dá)的DiMADS. 似乎有更多的DiMADS 在發(fā)育的早期和中期決定苞片和葉片的差異. 10 個(gè)基因在3 個(gè)發(fā)育時(shí)期的苞片和葉片中均存在差異表達(dá),其中屬于SQUA 亞家族的DiMADS5、DiMADS13、DiMADS75、Di?MADS83、DiMADS87 和DiMADS88 以及屬于AGL2/SEP 亞家族的DiMADS43 始終在苞片中高表達(dá). 而屬于STMADS11 亞家族的Di?MADS19、DiMADS64、DiMADS78 始終在葉片中高表達(dá).
3. 6 DiMADSs 基因表達(dá)模式的qRT-PCR 驗(yàn)證
隨機(jī)選擇了11 個(gè)具有不同表達(dá)模式的Di?MADS 基因,以珙桐β-DiACTIN 基因作為內(nèi)參基因,以L-1 葉片樣本為對(duì)照組計(jì)算了基因的相對(duì)表達(dá)量. 結(jié)果如圖6 所示,直方圖表示qRT-PCR 檢測(cè)的相對(duì)表達(dá)量,折線圖表示轉(zhuǎn)錄組定量中TPM數(shù)據(jù). 二者之間雖然存在一定的差異,但是考慮到用于測(cè)序的cDNA 和用于qRT-PCR 的cDNA 可能存在批次效應(yīng)帶來的差異,而且這些基因在苞片和葉片中的表達(dá)變化趨勢(shì)與轉(zhuǎn)錄組數(shù)據(jù)基本一致,表明基于轉(zhuǎn)錄組測(cè)序的定量結(jié)果是基本可靠的.
3. 7 DiMADS 轉(zhuǎn)錄因子的靶基因預(yù)測(cè)
在珙桐基因組中分別預(yù)測(cè)了201 個(gè)珙桐AP3-like 轉(zhuǎn)錄因子DiMADS31 的潛在靶標(biāo),1100 個(gè)珙桐AP1-like 轉(zhuǎn)錄因子DiMADS75 的潛在靶基因,182 個(gè)珙桐SEP-like 轉(zhuǎn)錄因子DiMADS43 的潛在靶基因,以及672 個(gè)SVP-like 轉(zhuǎn)錄因子DiMADS36的潛在靶基因. DiMADS31、DiMADS43 以及Di?MADS36 潛在靶基因沒有明顯的功能富集,但Di?MADS75 的潛在靶基因在光合作用以及細(xì)胞氧化還原穩(wěn)態(tài)的生物學(xué)過程(BP)有所富集(圖7). 并且與富集到的光合相關(guān)基因均有極強(qiáng)的負(fù)相關(guān)關(guān)系.
此外,一些DiMADS 基因也是這些轉(zhuǎn)錄因子的潛在靶基因. 另外,DiMADS36 在其自身的轉(zhuǎn)錄調(diào)控區(qū)域也存在結(jié)合位點(diǎn). 這進(jìn)一步說明了珙桐開花的基因調(diào)控相當(dāng)復(fù)雜,這些調(diào)控基因之間可能形成相互的反饋網(wǎng)絡(luò),在不同的發(fā)育階段控制著基因表達(dá)的平衡.
3. 8 潛在靶基因DiSTI 和DiMNS1 的表達(dá)模式
根據(jù)花器官建立的ABCDE 模型,花瓣的性狀由A、B 以及E 類基因共同控制. 并且根據(jù)花的四因子模型. AP3、PI 以及AP1、SEP 將形成轉(zhuǎn)錄因子四聚體結(jié)合兩個(gè)CArG box 介導(dǎo)DNA 環(huán)化并調(diào)控轉(zhuǎn)錄(AP3-PI 形成異源二聚體結(jié)合其中一個(gè)CArG box). 在預(yù)測(cè)的靶基因中有兩個(gè)基因同時(shí)是DiMADS31、DiMADS75、DiMADS43 的潛在靶標(biāo),并且SEP3 和AP1 與AP3 在轉(zhuǎn)錄調(diào)控區(qū)有不同的結(jié)合位點(diǎn),說明AP3-PI-AP1-SEP 轉(zhuǎn)錄因子四聚體有可能結(jié)合到這兩個(gè)基因的轉(zhuǎn)錄調(diào)控區(qū)域并調(diào)控其表達(dá). 這兩個(gè)基因編碼的蛋白分別是STICHEL(STI)蛋白與Mannosyl-oligosaccharide1,2-alpha-mannosidase MNS1( α-1,2-甘露糖苷酶1)的同源物,因此將它們分別命名為DiSTI 和DiMNS1. 以L-1 時(shí)期為對(duì)照組,利用qRT-PCR 檢測(cè)了這兩個(gè)基因在苞片及葉片中的相對(duì)表達(dá)量.結(jié)果表明,這兩個(gè)基因在苞片中的表達(dá)量顯著高于其在葉片中的表達(dá)量( 圖8). DiMADS31,Di?MADS75,DiMADS43 可能促進(jìn)了這兩個(gè)基因在苞片中的表達(dá).
4 討論
目前,MADS-box 基因家族在大量開花物種中的鑒定和克隆以及功能研究證明了其在植物生長發(fā)育及繁殖中的重要調(diào)控作用[14, 40, 41]. 目前關(guān)于被子植物開花調(diào)控的研究雖然已經(jīng)有很多,但開花過程中的復(fù)雜基因調(diào)控網(wǎng)絡(luò)還沒有完全清晰,目前對(duì)花器官特征基因的功能描述也不足以解釋所有自然界中形態(tài)萬千的花. 珙桐作為第三紀(jì)古熱帶孑遺植物,尚有豐富的遺傳資源等待挖掘[42]. 其特殊的花器官結(jié)構(gòu)及苞片結(jié)構(gòu)表明珙桐是研究花器官身份決定的良好材料. 珙桐MADSbox基因家族進(jìn)行鑒定并對(duì)其在苞片發(fā)育過程中的表達(dá)模式進(jìn)行研究,將有助于加深對(duì)被子植物開花調(diào)控網(wǎng)絡(luò)的理解. 此外對(duì)珙桐遺傳資源的保護(hù)、開發(fā)和利用也具有重要的意義.
在本研究中,成功鑒定了103 個(gè)珙桐 MADSbox基因,并分析了這些基因及其編碼蛋白的特征. MADS-box 蛋白作為轉(zhuǎn)錄因子,通過與特定的順式作用元件結(jié)合來調(diào)控下游基因的表達(dá). 對(duì)于結(jié)構(gòu)域的功能,SRF-box(MADS 結(jié)構(gòu)域) 決定了轉(zhuǎn)錄因子與DNA 序列的結(jié)合,而K-box 促進(jìn)MADS-box 轉(zhuǎn)錄因子發(fā)揮功能所必需的二聚化[3].二者的缺失可能導(dǎo)致基因功能的改變或喪失. 在本研究中發(fā)現(xiàn)FLC 亞家族中的DiMADS85 和Di?MADS86 缺失MADS 結(jié)構(gòu)域,并且在不同時(shí)期的苞片和葉片中顯著表達(dá). 研究表明,過表達(dá)截短的轉(zhuǎn)錄因子可能通過競爭性結(jié)合有功能的轉(zhuǎn)錄因子形成無功能的異二聚體而干擾正常功能[43]. FLC亞家族基因是控制開花時(shí)間的抑制因子,通過FT間接抑制下游花器官識(shí)別基因AP1 的表達(dá)[44]. 因此推測(cè)FLC-like 截短基因的表達(dá)可能是影響珙桐特殊花結(jié)構(gòu)的潛在因素. 但其是否參與以及具體如何調(diào)控珙桐開花還有待進(jìn)一步研究.
在基因組水平上比較了4 個(gè)物種的MADSbox基因家族. 除在物種間具有同源性的基因外,每個(gè)物種還存在多個(gè)物種特異性的MADS-box 基因. 這意味著MADS-box 基因家族在這四個(gè)近緣物種的進(jìn)化過程中出現(xiàn)了分歧. 值得注意的是,珙桐的AGL2/SEP 和SQUA 亞家族的基因數(shù)目與擬南芥和近緣物種相比都有顯著的增加. 這兩個(gè)亞家族的成員在擬南芥和其他許多物種中都已被證明在植物開花調(diào)控中發(fā)揮著極其重要的作用.在擬南芥中,SQUA 亞家族包括4 個(gè)成員AP1、CAL、FUL 和AGL79,前三者在調(diào)控花分生組織決定中具有冗余的功能[45, 46]. 而AP1 更是調(diào)控萼片和花瓣發(fā)育所必需的基因[47]. 該亞家族的另一個(gè)同源基因AGL79 也被證明可以通過抑制TFL1的表達(dá)正向調(diào)控開花[48]. AGL2/SEP 亞家族的成員是花器官身份決定的E 類基因,在所有器官輪中發(fā)揮功能,其他花器官特征基因編碼的轉(zhuǎn)錄因子需要與SEP 蛋白結(jié)合形成高階蛋白質(zhì)復(fù)合物才能正確激活下游開花基因的表達(dá)[7, 49]. 珙桐AGL2/SEP 亞家族和SQUA 亞家族的擴(kuò)張,說明與模式種及其近緣物種相比,珙桐對(duì)花分生組織和花器官身份建立可能存在更為復(fù)雜的調(diào)控模式. 后續(xù)可以通過轉(zhuǎn)基因?qū)嶒?yàn)來驗(yàn)證這些復(fù)制產(chǎn)生的旁系同源基因的功能是否發(fā)生了亞功能化,是否具有功能冗余.
本研究通過轉(zhuǎn)錄組測(cè)序和qRT-PCR 驗(yàn)證,發(fā)現(xiàn)AP3(B 類)、AP1(A 類)以及SEP(E 類)的同源基因在苞片中表現(xiàn)出較高的表達(dá)水平. P(I B類)的同源基因在苞片和葉片中持續(xù)表達(dá). 而已有研究表明AP3、PI 與AP1 或SEP3 的異源表達(dá)可以將植物營養(yǎng)葉轉(zhuǎn)化為花瓣?duì)钇鞴伲?, 49, 50]. 據(jù)此推測(cè),珙桐花瓣?duì)畎男纬煽赡苁怯葾P1-like、AP3-like 和SEP-like 的同源基因在苞片中的異位表達(dá)所導(dǎo)致.
進(jìn)一步對(duì)這珙桐這三類轉(zhuǎn)錄因子的靶基因進(jìn)行預(yù)測(cè)并篩選到兩個(gè)可能符合四因子模型[50]調(diào)控的基因DiSTI 和DiMNS1. 通過qRT-PCR 檢測(cè)發(fā)現(xiàn)它們?cè)诎械谋磉_(dá)顯著高于葉片,說明AP1-like、AP3-like 和SEP-like 的同源轉(zhuǎn)錄因子可能促進(jìn)了它們?cè)诎械谋磉_(dá). DiSTI 編碼的STICHEL 蛋白在擬南芥中被證明與毛狀體分支有關(guān)[51],DiMNS1 編碼的α-1,2-甘露糖苷酶則是天冬酰胺(N)- 聚糖的生物合成中的一種關(guān)鍵酶,N-聚糖在植物開花、種子形成以及脅迫響應(yīng)等方面發(fā)揮著重要的作用[52]. 而二者在珙桐苞片發(fā)育中的作用還有待進(jìn)一步探索. 此外,通過靶基因的功能富集發(fā)現(xiàn)珙桐AP1-like 轉(zhuǎn)錄因子DiMADS75可能作為直接的抑制因子,參與調(diào)控部分光合作用相關(guān)基因的表達(dá),抑制了苞片的光合功能. 同時(shí)參與了苞片與葉片發(fā)育細(xì)胞氧化還原穩(wěn)態(tài)相關(guān)基因的表達(dá)調(diào)控.