王紅娟,唐榮莉,蔣曉英,官 玲,雷開榮,黃啟中,林 清
(1. 重慶市農(nóng)業(yè)科學(xué)院生物技術(shù)研究所,重慶 401329;2. 重慶市農(nóng)業(yè)科學(xué)院蔬菜花卉研究所, 重慶 401329)
【研究意義】辣椒(Capsicumsp.)是一類重要的經(jīng)濟(jì)作物,它既能夠滿足全世界人們對(duì)辛辣味的喜愛(ài),同時(shí)還具有非常重要的營(yíng)養(yǎng)價(jià)值和醫(yī)學(xué)價(jià)值。辣椒素類物質(zhì)的合成受遺傳控制,并受栽培環(huán)境的影響。辣椒素類物質(zhì)積累從果實(shí)開始發(fā)育的第10~20天開始,并在綠熟期或轉(zhuǎn)色期達(dá)到最高[1-2]。不同栽培品種的辣椒素類物質(zhì)含量變異極大,其史高維爾指數(shù)(scoville heat unit, SHU)低至0,高達(dá)2.5×106[3]。研究辣椒素生物合成途徑,揭示其調(diào)控因子,可為辣椒生物技術(shù)育種工作提供分子基礎(chǔ)?!厩叭搜芯窟M(jìn)展】辣椒的辣味有無(wú)由位于2號(hào)染色體上的Pun1基因控制[4]。Qin等[5]推測(cè)Pun1基因(AT3)的兩個(gè)拷貝可能協(xié)同作用,共同合成并積累含量不同的辣椒素,決定不同品種辣椒的辣度。通過(guò)轉(zhuǎn)錄水平分析和基因沉默技術(shù),PAL、Ca4H、COMT、KAS、pAMT、AT3、ACL、DHAD、DT和FAT基因被證明參與辣椒素類物質(zhì)的生物合成途徑[6-12]。Mazourek等[13]建立了辣椒素類物質(zhì)生物合成模型(CapCyc Model),共包括52個(gè)候選酶類相關(guān)基因。近年,隨著新一代測(cè)序技術(shù)的迅速發(fā)展和測(cè)序成本的降低,辣椒組學(xué)研究有了重大進(jìn)展[5, 11, 14-17]。研究者通過(guò)轉(zhuǎn)錄組和全基因組分析獲得了CapCyc模型中部分或者全部候選基因[5, 11, 15],通過(guò)對(duì)轉(zhuǎn)錄組數(shù)據(jù)的比較分析發(fā)現(xiàn),參與辣椒素合成途徑的基因呈現(xiàn)組織/發(fā)育階段特異性表達(dá),但是僅有少數(shù)基因在辣椒果實(shí)合成辣椒素階段顯著表達(dá)[5]。這些結(jié)果進(jìn)一步為辣椒素的生物合成提供了重要的候選基因。然而,目前的研究主要關(guān)注辣椒素合成途徑中的結(jié)構(gòu)基因,對(duì)調(diào)控因子的研究相對(duì)較少,目前報(bào)道的只有MYB和ERF 2個(gè)轉(zhuǎn)錄因子家族[18-24]。其中最近的研究表明,一個(gè)R2R3-MYB轉(zhuǎn)錄因子CaMYB31可能是辣椒素類物質(zhì)合成途徑的主要調(diào)控因子,該轉(zhuǎn)錄因子和合成途徑中的Ca4H、COMT、KAS、pAMT和AT3等結(jié)構(gòu)基因的表達(dá)呈正相關(guān),且和果實(shí)發(fā)育過(guò)程中辣椒素和二氫辣椒素的含量也呈正相關(guān)[21-22, 25]。另一個(gè)MYB家族轉(zhuǎn)錄因子CaMYB108受到茉莉酸誘導(dǎo),參與調(diào)控辣椒素類物質(zhì)的合成[24]。此外,Keyhaninejad等[18]研究顯示2個(gè)ERF轉(zhuǎn)錄因子ERF和JERF的表達(dá)與不同辣椒的辣椒素含量正相關(guān),從而推測(cè)其對(duì)辣椒素類物質(zhì)有調(diào)節(jié)功能。毛艷輝[19]通過(guò)表達(dá)分析和基因沉默判定一個(gè)ERF轉(zhuǎn)錄因子(CaERF1)參與辣椒素合成的調(diào)控。酵母雙雜試驗(yàn)顯示JERF與Pun1之間存在相互作用關(guān)系[23]?!颈狙芯壳腥朦c(diǎn)】本研究以高辣和低辣度的2個(gè)一年生辣椒品種為研究對(duì)象,選取品種開始積累辣椒素和高含辣椒素的2個(gè)時(shí)期,利用新一代測(cè)序技術(shù)進(jìn)行RNA-seq測(cè)序。【擬解決的關(guān)鍵問(wèn)題】比較不同辣度的2個(gè)品種及其不同發(fā)育時(shí)期的轉(zhuǎn)錄組數(shù)據(jù),篩選并鑒定差異表達(dá)基因,重點(diǎn)研究差異表達(dá)基因的功能分類,差異表達(dá)基因中的轉(zhuǎn)錄因子家族和CapCyc模型中的候選基因,研究辣椒素合成的調(diào)控機(jī)制,以期為辣椒的生物技術(shù)育種工作提供分子基礎(chǔ)。
本研究使用高辣度的辣椒材料754-3-1-1-1和低辣度的渝椒5號(hào),種子來(lái)源于重慶市農(nóng)業(yè)科學(xué)院蔬菜花卉研究所。754-3-1-1-1為朝天椒優(yōu)良自交系,高效液相色譜測(cè)得辣椒素和二氫辣椒素含量之和為4.61 mg/g,為高辣材料[3]。渝椒5號(hào)是由83-1-1為母本、76-3-1-1為父本配制成的適宜春秋栽培的一代雜種,該品種果實(shí)長(zhǎng)牛角形,微辣。實(shí)驗(yàn)材料露天種植,分別采集花后16 d左右(定義為KS快速生長(zhǎng)期)和花后35 d左右LS綠熟期的果實(shí)。每個(gè)單株為1個(gè)生物學(xué)重復(fù),754-3-1-1-1取3個(gè)生物學(xué)重復(fù),渝椒5號(hào)取1個(gè)生物學(xué)重復(fù)。樣品采集后放入液氮速凍,然后保存于-80 ℃超低溫冰箱中,用于后續(xù)試驗(yàn)。
754-3-1-1-1的3個(gè)生物學(xué)重復(fù)分別編號(hào)為L(zhǎng)754KS1、L754KS2、L754KS3和L754LS1、L754LS2、L754LS3,渝椒5號(hào)2個(gè)時(shí)期分別編號(hào)為YJ5KS和YJ5LS。采用Invitrogen(美國(guó))TRIzol Reagent試劑,參照說(shuō)明書操作規(guī)程提取果實(shí)(包括胎座)總RNA。質(zhì)檢合格后送上海美吉生物醫(yī)藥科技有限公司構(gòu)建RNA-seq文庫(kù),并在Illumina HiSeq 2000平臺(tái)上測(cè)序。
轉(zhuǎn)錄組數(shù)據(jù)通過(guò)美吉生物云平臺(tái)進(jìn)行分析。為保證數(shù)據(jù)質(zhì)量,在分析前對(duì)測(cè)序得到的原始數(shù)據(jù)進(jìn)行過(guò)濾以減少數(shù)據(jù)噪音。過(guò)濾后保留下來(lái)的clean reads與辣椒(C.annuum)參考基因組比對(duì),獲得的Mapped Data用于下一步分析。為鑒定754-3-1-1-1不同生物學(xué)重復(fù)數(shù)據(jù)間的關(guān)系,對(duì)不同生物學(xué)重復(fù)數(shù)據(jù)進(jìn)行主成分分析(PCA)。根據(jù)測(cè)序得到的基因表達(dá)水平的RPKM值[26],通過(guò)Cufflinks軟件進(jìn)行基因差異表達(dá)分析[27]。差異顯著基因篩選標(biāo)準(zhǔn)為|log2(Fold Change)|≥1且P<0.05。然后利用Goatools[28]對(duì)差異表達(dá)基因進(jìn)行GO富集分析。
為了驗(yàn)證RNA-seq數(shù)據(jù)的可靠性,隨機(jī)選擇7個(gè)差異表達(dá)基因進(jìn)行實(shí)時(shí)熒光定量RT-qPCR表達(dá)量驗(yàn)證。利用在線引物設(shè)計(jì)工具Primer-BLAST設(shè)計(jì)引物(表1),內(nèi)參基因選用β-actin。RT-qPCR擴(kuò)增每個(gè)樣品重復(fù)3次。采用2-ΔΔCt方法分別計(jì)算差異表達(dá)基因在2個(gè)辣椒品種的2個(gè)果實(shí)發(fā)育時(shí)期的相對(duì)表達(dá)量[29]。
表1 RT-qPCR分析使用的引物序列
所有樣品均測(cè)序得到超過(guò)4 Mb的原始數(shù)據(jù)。對(duì)原始數(shù)據(jù)進(jìn)行過(guò)濾后,各樣品均有超過(guò)99%的clean reads,低質(zhì)量的reads占比不到1%,說(shuō)明測(cè)序質(zhì)量好。將clean reads與辣椒基因組進(jìn)行比對(duì),除L754KS2和L754LS3 2個(gè)樣品外,其余樣品均有超過(guò)84%的unique reads進(jìn)入后續(xù)分析(表2)。
圖1 754-3-1-1-1生物學(xué)重復(fù)主成分分析Fig.1 Principal component analysis for 754-3-1-1-1 samples
表2 樣本Reads數(shù)分布情況
主成分分析可以降低數(shù)據(jù)的復(fù)雜性,深入挖掘樣品之間的關(guān)系和變異大小。為鑒定754-3-1-1-1果實(shí)發(fā)育的2個(gè)時(shí)期各3個(gè)生物學(xué)重復(fù)轉(zhuǎn)錄組數(shù)據(jù)的關(guān)系,判斷是否存在離群樣品,本研究對(duì)其進(jìn)行主成分分析。結(jié)果發(fā)現(xiàn)754-3-1-1-1LS期的3個(gè)重復(fù)聚在一起,說(shuō)明這3個(gè)樣品的數(shù)據(jù)相似性較高;KS期的2個(gè)重復(fù)(L754KS2和L754KS3)聚在一起,而樣品L754KS1偏離另外2個(gè)重復(fù),屬離群樣品(圖1),故后續(xù)分析不包括樣品L754KS1。
RT-qPCR結(jié)果顯示,除了1個(gè)基因(ID: LOC107868336)在L754LS_vs_YJ5LS對(duì)比中表達(dá)情況不符外,RT-qPCR和RNA-seq測(cè)序得到的基因差異表達(dá)情況一致(圖2)。表明RNA-seq數(shù)據(jù)可靠,可進(jìn)行后續(xù)的差異表達(dá)基因分析。
圖2 差異表達(dá)基因RT-qPCR驗(yàn)證Fig.2 Validation of DEG by RT-qPCR
高辣材料754-3-1-1-1和低辣品種渝椒5號(hào)的KS期和LS期分別設(shè)置4組對(duì)比進(jìn)行基因差異表達(dá)分析。結(jié)果顯示,L754LS_vs_L754KS有139個(gè)基因差異表達(dá),其中17.27%的基因在LS期上調(diào)表達(dá),82.73%的基因下調(diào)表達(dá);YJ5LS_vs_YJ5KS發(fā)現(xiàn)1903個(gè)基因差異表達(dá),其中61.59%的基因在LS期上調(diào)表達(dá),38.41%下調(diào)表達(dá)。L754KS_vs_YJ5KS有5550個(gè)基因差異表達(dá),其中51.17%在753-3-1-1-1中上調(diào)表達(dá),48.83%的基因下調(diào)表達(dá);L754LS_vs_YJ5LS有3220個(gè)基因差異表達(dá),其中55.59%的基因在754-3-1-1-1中上調(diào)表達(dá),44.41%的基因下調(diào)表達(dá)(表3)。除了L754LS_vs_L754KS,其余3組對(duì)比表達(dá)量上調(diào)的基因數(shù)目均多于下調(diào)基因數(shù)目。高辣材料754-3-1-1-1的KS和LS期差異表達(dá)基因最少,僅有139個(gè)。相反,2個(gè)品種在果實(shí)KS期和LS期都有較多的基因差異表達(dá),尤其是L754KS_vs_YJ5KS,有5550之多。這些結(jié)果表明高辣材料754-3-1-1-1果實(shí)發(fā)育前后期基因表達(dá)模式變化較少,而754-3-1-1-1和渝椒5號(hào)兩者間從果實(shí)發(fā)育早期就有較多的基因表達(dá)模式不同。
表3 不同對(duì)比組別的差異表達(dá)基因上調(diào)下調(diào)數(shù)目
借助Venn圖對(duì)2個(gè)品種分別2個(gè)時(shí)期的差異表達(dá)基因進(jìn)行展示(圖3),4組對(duì)比共有的差異表達(dá)基因有12個(gè),高辣和低辣品種共有的差異表達(dá)基因有13個(gè)。L754LS_vs_L754KS有7個(gè)(5%)特有的差異表達(dá)基因,YJ5LS_vs_YJ5KS有429個(gè)(23%)特有的差異表達(dá)基因。2個(gè)品種在KS期有2667個(gè)(48%)特有的差異表達(dá)基因,在LS期有871個(gè)(27%)特有的差異表達(dá)基因。這些結(jié)果表明辣度不同的2個(gè)品種在辣椒素開始合成的時(shí)期有較多的基因表達(dá)模式不同,而隨著果實(shí)的發(fā)育,基因表達(dá)差異變小。
圖3 差異表達(dá)基因的Venn圖Fig.3 Venn diagram of DEG
GO功能富集分析結(jié)果表明,754-3-1-1-1 2個(gè)生長(zhǎng)時(shí)期的差異表達(dá)基因主要富集在轉(zhuǎn)錄調(diào)控區(qū)序列特異性DNA結(jié)合和兒茶酚氧化酶活性(圖4-A);渝椒5號(hào)2個(gè)生長(zhǎng)時(shí)期的差異表達(dá)基因主要富集在多糖代謝過(guò)程、葡聚糖代謝過(guò)程等各類代謝過(guò)程(圖4-B);2個(gè)品種KS期差異表達(dá)基因主要富集在代謝過(guò)程、防御應(yīng)答以及脅迫和刺激應(yīng)答(圖4-C),LS期主要富集在光合作用、光捕獲和蛋白質(zhì)—生色團(tuán)連鎖(圖4-D)。
***表示FDR<0.001,**表示FDR<0.01,*表示FDR<0.05*** indicates FDR<0.001, ** indicates FDR<0.01, * indicates FDR<0.05圖4 差異表達(dá)基因的GO功能富集分析Fig.4 GO enrichment analysis of DEG identified from 4 pair comparisons
本研究從4組對(duì)比數(shù)據(jù)的差異表達(dá)基因中共鑒定到18個(gè)CapCyc模型基因,其中PAL等5個(gè)基因分別有2~3個(gè)拷貝,因此共有24條基因序列差異表達(dá)(表4)。其中L754KS_vs_YJ5KS和 L754LS_vs_YJ5LS 2組對(duì)比中分別有13和17個(gè)CapCyc模型基因差異表達(dá),YJ5LS_vs_YJ5KS對(duì)比發(fā)現(xiàn)3個(gè),L754LS_vs_L754KS未發(fā)現(xiàn)。4個(gè)基因的表達(dá)差異倍數(shù)大于3倍,表達(dá)差異較大。
表4 差異表達(dá)基因中的CapCyc模型基因及其表達(dá)差異情況
續(xù)表4 Continued table 4
此外,本研究從L754LS_vs_L754KS、YJ5LS_vs_YJ5KS、L754KS_vs_YJ5KS和L754LS_vs_YJ5LS 4組對(duì)比數(shù)據(jù)的差異表達(dá)基因中鑒定到MYB家族轉(zhuǎn)錄因子36個(gè),ERF家族轉(zhuǎn)錄因子4個(gè)(表5)。L754KS_vs_YJ5KS差異表達(dá)的轉(zhuǎn)錄因子最多,有25個(gè)(13個(gè)下調(diào),12個(gè)上調(diào));L754LS_vs_YJ5LS次之,有19個(gè)(7個(gè)下調(diào),12個(gè)上調(diào))。其中11個(gè)為2組共有,表達(dá)量差異方向一致的有9個(gè)(表5)。36個(gè)MYB轉(zhuǎn)錄因子中有9個(gè)表達(dá)差異較大,在至少一組對(duì)比中表達(dá)差異超過(guò)5倍,其中LOC107852848在L754LS_vs_YJ5LS對(duì)比中、LOC107874571在L754KS_vs_YJ5KS對(duì)比中差異表達(dá)超過(guò)8倍,LOC107852202在YJ5LS_vs_YJ5KS對(duì)比中差異表達(dá)高達(dá)10.62倍。另有4個(gè)MYB轉(zhuǎn)錄因子(LOC107852599、LOC107879588、LOC107867180和LOC107846862)在除L754LS_vs_L754KS之外的3組對(duì)比中都差異顯著。
表5 差異表達(dá)基因中的MYB和ERF轉(zhuǎn)錄因子及其表達(dá)差異情況
續(xù)表5 Continued table 5
諸多研究已經(jīng)系統(tǒng)地闡述了辣椒素類物質(zhì)的生物合成,并對(duì)其結(jié)構(gòu)基因的功能有了一定的認(rèn)識(shí)。但是對(duì)于不同辣度品種間辣椒素含量差異巨大的原因知之甚少,尤其是對(duì)調(diào)控辣椒素生物合成的轉(zhuǎn)錄因子研究較少[30]。本研究基于RNA-seq測(cè)序技術(shù),對(duì)不同辣度的2個(gè)辣椒品種754-3-1-1-1和渝椒5號(hào)的2個(gè)不同發(fā)育時(shí)期的果實(shí)進(jìn)行轉(zhuǎn)錄組分析。通過(guò)L754LS_vs_L754KS、YJ5LS_vs_YJ5KS、L754KS_vs_YJ5KS和L754LS_vs_YJ5LS 4組數(shù)據(jù)對(duì)比,鑒定了一批差異表達(dá)基因。結(jié)果顯示,除了L754LS_vs_L754KS,其他3組比較表達(dá)量上調(diào)的基因數(shù)目均多于下調(diào)基因數(shù)目。這表明辣度更高的樣本相對(duì)于辣度更低的樣本有更多的基因表達(dá)量升高。高辣材料754-3-1-1-1的KS和LS期差異表達(dá)基因僅有139個(gè),且Venn圖顯示僅有7個(gè)(5%)是這2個(gè)時(shí)期特有,表明高辣材料754-3-1-1-1果實(shí)發(fā)育前后期基因表達(dá)模式變化較少。相反,2個(gè)品種在果實(shí)KS期和LS期都有較多的基因差異表達(dá),尤其是L754KS_vs_YJ5KS,高達(dá)5550個(gè)。Venn圖顯示在KS期有2667個(gè)(48%)特有的差異表達(dá)基因,在LS期有871個(gè)(27%)特有的差異表達(dá)基因。這些結(jié)果顯示754-3-1-1-1和渝椒5號(hào)兩者間在辣椒素開始合成的時(shí)期有較多的基因表達(dá)模式不同,而隨著果實(shí)的發(fā)育,基因表達(dá)差異變小。Zhang等[31]關(guān)于“鬼椒王”研究結(jié)果也顯示同樣的規(guī)律,10 vs 20、20 vs 30、30 vs 40 DPA(花后10、20、30、40 d對(duì)比)差異表達(dá)基因數(shù)量遞減。我們推測(cè)辣椒素含量受果實(shí)發(fā)育早期基因表達(dá)差異的影響更大。
Mazourek等[13]建立了辣椒素類物質(zhì)生物合成模型(CapCyc Model),共包括52個(gè)結(jié)構(gòu)基因。本研究中我們鑒定到18個(gè)CapCyc模型基因在不同辣度和果實(shí)不同發(fā)育時(shí)期中差異表達(dá),其中PAL、CCoAOMT、CCR3個(gè)基因在至少一組對(duì)比中表達(dá)量差異超過(guò)3倍。以往的研究表明辣椒素生物合成途徑中結(jié)構(gòu)基因的表達(dá)水平與辣椒素的含量相關(guān),并受到協(xié)同調(diào)節(jié)[31-32]。并且,QTL定位和GWAS分析表明結(jié)構(gòu)基因能夠控制辣椒素的含量[33]。本研究中,PAL、CCoAOMT和CCR等結(jié)構(gòu)基因差異表達(dá)較大,表明這些基因很可能具有調(diào)控辣椒素合成的作用。
對(duì)辣椒素生物合成途徑調(diào)控因子的研究較少,目前只有2個(gè)R2R3-MYB家族轉(zhuǎn)錄因子CaMYB31、CaMYB108和2個(gè)ERF家族轉(zhuǎn)錄因子被證明是辣椒素類物質(zhì)合成途徑的主要調(diào)控因子[18, 21, 24]。本研究從4組對(duì)比的差異表達(dá)基因中鑒定到36個(gè)MYB家族轉(zhuǎn)錄因子和4個(gè)ERF家族轉(zhuǎn)錄因子,其中包括前人研究中的CaMYB31(LOC107877282)和ERF(LOC107864060)基因。在本研究中,CaMYB31在樣品L754KS中表達(dá)水平較高,在L754LS_vs_L754KS和L754KS_vs_YJ5KS 2組對(duì)比間表達(dá)差異顯著,且差異表達(dá)倍數(shù)均超過(guò)4倍。之前的研究表明CaMYB31與辣椒素合成途徑中的Ca4H、COMT、KAS、pAMT、AT3等結(jié)構(gòu)基因的表達(dá)呈正相關(guān)[21]。本研究發(fā)現(xiàn)pAMT和AT3-D1基因在L754KS_vs_YJ5KS對(duì)比中表達(dá)差異顯著,且差異表達(dá)的方向和CaMYB31一致,表明這2個(gè)基因可能受CaMYB31調(diào)控。此外,我們還發(fā)現(xiàn)9個(gè)轉(zhuǎn)錄因子(7個(gè)MYB家族和2個(gè)ERF家族)在L754KS_vs_YJ5KS和L754LS_vs_YJ5LS 2組對(duì)比中同時(shí)差異表達(dá),且差異方向一致,說(shuō)明這些轉(zhuǎn)錄因子在果實(shí)積累辣椒素的不同時(shí)期都在發(fā)揮作用。
本研究對(duì)2種不同辣度的辣椒材料754-3-1-1-1和渝椒5號(hào)果實(shí)不同發(fā)育時(shí)期的轉(zhuǎn)錄組進(jìn)行了測(cè)序和分析。通過(guò)對(duì)比不同發(fā)育時(shí)期果實(shí)的基因表達(dá)情況,我們推測(cè)果實(shí)發(fā)育早期基因的表達(dá)水平對(duì)辣椒素的含量有更大的影響。PAL、CCoAOMT、CCR等辣椒素合成途徑中的結(jié)構(gòu)基因在不同樣品中差異表達(dá)較大,表明這些基因可能具有調(diào)控辣椒素合成的作用。此外,本研究還鑒定出一批可能參與調(diào)控辣椒素合成的MYB和ERF家族轉(zhuǎn)錄因子,為后續(xù)研究提供參考,也為辣椒的生物技術(shù)育種工作提供分子基礎(chǔ)。