李文靜,趙新穎,紀(jì)萌琦,郭 鑫,郭 紅,鄧志英,田紀(jì)春
(山東農(nóng)業(yè)大學(xué)農(nóng)學(xué)院/作物生物學(xué)國家重點實驗室/小麥品質(zhì)育種研究室/山東小麥玉米周年高產(chǎn)高效生產(chǎn)協(xié)同創(chuàng)新中心,山東泰安 271018)
小麥?zhǔn)鞘澜缰饕募Z食作物之一,全世界有30%以上的人口以小麥為主糧[1]。抽穗期是與小麥適應(yīng)性直接相關(guān)的一個性狀,對小麥適應(yīng)環(huán)境具有至關(guān)重要的作用[2-3]。小麥穗分化期根據(jù)其在分化過程中所出現(xiàn)的形態(tài)特征,可以分為9個時期,依次為莖葉原基分化期、生長錐伸長期、單棱期、二棱期、穎片原基分化期、小花原基分化期、雌雄蕊原基分化期、藥隔形成期和四分體形成期,其發(fā)育進(jìn)程直接影響小麥抽穗開花時間[4-5],其中,二棱期與小麥抽穗期的關(guān)系最密切[6-8]。研究抽穗期不同材料間二棱期差異表達(dá)基因,對挖掘和解析開花期相關(guān)基因、推進(jìn)小麥育種進(jìn)程具有重要價值。
轉(zhuǎn)錄組測序(RNA-seq)技術(shù)可以在沒有完整基因組序列的前提下,對轉(zhuǎn)錄組產(chǎn)物mRNA進(jìn)行高通量測序,全面快速地獲得某一物種特定組織或器官在某一狀態(tài)下的完整表達(dá)信息。作為一種宏觀的整體論方法,轉(zhuǎn)錄組學(xué)改變了以往選定單個基因或少數(shù)幾個基因的研究模式,將植物功能基因組學(xué)研究帶入了一個全新的高速發(fā)展時代。利用該技術(shù),Zhang等[9]以荔枝休眠芽和圓錐花序形成期的花芽為材料,發(fā)現(xiàn)大量差異表達(dá)基因富集在激素代謝和信號轉(zhuǎn)導(dǎo)途徑上;Kumar等[10]以小麥HD2329為材料,檢測到1 525個顯著差異表達(dá)轉(zhuǎn)錄本與高溫脅迫相關(guān),其中27個在高溫脅迫下顯著上調(diào);高溫明顯影響細(xì)胞代謝、蛋白質(zhì)磷酸化和氧化還原過程;Wei等[11]對小麥品種農(nóng)大211的籽粒和莖葉轉(zhuǎn)錄組進(jìn)行高通量測序分析,檢測到61 393個基因參與籽粒發(fā)育過程,其中,7 355個差異表達(dá)基因在籽粒中上調(diào)表達(dá),許多與糖類和蛋白質(zhì)代謝相關(guān)的轉(zhuǎn)錄本和轉(zhuǎn)錄因子在籽粒中大量富集。
小麥基因組比較復(fù)雜,其穗發(fā)育分子機(jī)制的研究進(jìn)展比較緩慢[12-15]。近期,F(xiàn)eng等[16]利用中國春進(jìn)行了小麥花發(fā)育不同階段的轉(zhuǎn)錄組分析,試圖找到特定發(fā)育階段的調(diào)控基因;Wang等[17]測定了90個冬小麥品種二棱期轉(zhuǎn)錄組,并進(jìn)行差異表達(dá)基因與性狀的相關(guān)性分析,發(fā)現(xiàn)了控制小麥穗結(jié)構(gòu)的調(diào)控因子。小麥近等基因系的遺傳背景高度相似,有利于排除背景差異造成的干擾,是解析遺傳機(jī)制的良好材料。因此,本研究擬選取抽穗期明顯不同的兩個近等基因系二棱期幼穗為材料,利用RNA-seq轉(zhuǎn)錄組測序方法篩選差異表達(dá)基因,通過功能注釋與通路分析,建立小麥穗發(fā)育早期的分子學(xué)研究平臺,為解析小麥抽穗期調(diào)控機(jī)制、挖掘小麥抽穗期相關(guān)基因奠定理論基礎(chǔ)。
從BC5的F3群體(由DH60和Y57構(gòu)建,Y57為輪回親本)通過前景和背景標(biāo)記選擇,篩選到背景回復(fù)率接近100%的近等基因系96-2,抽穗期與Y57相差10 d;96-2在四葉期時已達(dá)到二棱期,而Y57則在五葉期時達(dá)到二棱期。以近等基因系Y57(抽穗期196 d)和96-2(抽穗期184 d)為材料,挑選其飽滿無病害的種子在室溫下發(fā)芽后,轉(zhuǎn)移至人工智能氣候箱(浙江寧波江南儀器廠)中4 ℃春化4周。春化完成后,挑選長勢一致的植株種植在山東農(nóng)業(yè)大學(xué)溫室(16 h光/8 h暗,18~25 ℃),單株種植,每個材料種植100 株,3個重復(fù)。白天采取自然光,夜晚用白熾燈補(bǔ)光,使光照時間達(dá)到16 h。植株達(dá)到三葉期時開始觀察幼穗發(fā)育階段。兩天取樣一次,每個材料選取5 株健壯、生長均勻的植株,用解剖針除去葉片,在體視顯微鏡(PS24C)下進(jìn)行觀察,并記錄每個時期幼穗的表型發(fā)育情況。到達(dá)二棱期時,每個材料取25~30個幼穗,立即投放到液氮中,然后保存于-80 ℃冰箱中備用。
采用Trizol提取法分別提取Y57和96-2幼穗總RNA,并用NanoDrop 2000檢測RNA濃度和OD260/OD280、OD260/OD230比值。用Agilent 2000進(jìn)一步檢測RNA濃度和28S/18S比值。每個樣取1 μg總RNA,利用Oligo(dT)的磁珠富集純化mRNA;在富集得到的mRNA中加入fragmentation buffer,將mRNA進(jìn)行隨機(jī)打斷;以打斷的mRNA為模板,用六堿基隨機(jī)引物合成第一條cDNA鏈,然后加入緩沖液、dNTPs、RNase H和DNA polymerase I合成第二條cDNA鏈;利用AMPure XP beads純化cDNA;對純化的雙鏈cDNA再進(jìn)行末端修復(fù)、加A尾并連接測序接頭;用AMPure XP beads選取合適大小的目的片段(300~400 bp),通過PCR得到cDNA文庫。
文庫檢測合格之后,由北京百邁客生物科技有限公司使用HiSeq2500進(jìn)行高通量測序,測序讀長為PE125。將測序得到的Raw data進(jìn)行數(shù)據(jù)過濾(去除測序接頭序列、重復(fù)冗余序列、低質(zhì)量序列),獲得高質(zhì)量序列數(shù)據(jù)clean data。采用TopHat2[18]將各樣品測序得到的clean data與中國春參考基因組進(jìn)行序列比對以獲得mapped data。
從差異表達(dá)基因中挑選2個表達(dá)趨勢不同的基因,利用Primer-NCBI 在線設(shè)計軟件(http://www.ncbi.nlm.nih.gov/tools/primer-blast/)設(shè)計引物,對ID為Traes_5DL_9CC4EC839(F:5′ -TGAAGGCCAAGGTTGAGACA,R:5′-CGCT GGATGAATGCTGGTAGTTG)和Traes_6DL_7892214C8(F:5′-TGCGGGTCAAATGCGTC GTC,R:5′-CCAGAAGTTGCCGTCGTCCAT C)的基因進(jìn)行實時熒光定量PCR 分析。將各樣品的RNA 采用第1 鏈cDNA 合成試劑盒(TaKaRa)反轉(zhuǎn)錄為cDNA,以反轉(zhuǎn)錄產(chǎn)物為模板,以Actin(F:5′-ACCTTCAGTTGCCCAGC AAT-3′; R:5′-CAGAGTCGAGCACAATACC AGTTG-3′)為內(nèi)參,采用QIAGEN 公司的SYBR Green RT-PCR 試劑盒,利用ABI 7500熒光定量PCR儀(ABI )進(jìn)行檢測。反應(yīng)體系20 μL:2×Mix 10 μL,引物各(10 μmol·L-1) 0.4 μL,cDNA 2 μL,ROX校準(zhǔn)液 0.4 μL,6.8 μL ddH2O。反應(yīng)程序:95 ℃ 3 min;95 ℃ 15 s,60 ℃ 30 s,72 ℃ 30 s ,40個循環(huán)。熔解曲線分析:95 ℃ 15 s,60 ℃ 60 s;95 ℃ 30 s,60 ℃ 15 s。 每對引物均設(shè)置空白對照;3次重復(fù)。采用相對定量2-ΔΔCt法進(jìn)行結(jié)果分析。
利用FPKM[19]值反映對應(yīng)基因的表達(dá)量,使用EBSeq[20]進(jìn)行差異表達(dá)基因分析,獲得兩個樣品間的差異表達(dá)基因集。在差異表達(dá)基因檢測過程中,將Fold Change≥2且FDR<0.01作為篩選標(biāo)準(zhǔn)。差異倍數(shù)(fold change)表示兩樣品(組)間表達(dá)量的比值。采用Benjamini-Hochberg法校正差異顯著性P值,得到錯誤發(fā)現(xiàn)率(false discovery rate,FDR)。
使用BLAST軟件將差異表達(dá)基因與Nr(non-redundant protein sequence database in GenBank)、Swiss-Prot(Swiss-Prot protein sequence database) KEGG數(shù)據(jù)庫的序列進(jìn)行比對,獲得注釋信息。利用比對軟件BLASTX,將差異表達(dá)基因與COG(clusters of orthologous groups of proteins)數(shù)據(jù)庫進(jìn)行比對分析,獲得差異表達(dá)基因的COG功能注釋及其分類;利用Blast2GO[21]軟件將差異表達(dá)基因序列與GO(gene ontology)數(shù)據(jù)庫進(jìn)行比對,進(jìn)行功能注釋,然后利用WEGO軟件[22]對GO功能分類統(tǒng)計。將差異表達(dá)基因與KEGG(Kyoto encyclopedia of genes and genomes)數(shù)據(jù)庫進(jìn)行BLASTX比對,獲得差異表達(dá)基因相對應(yīng)的Pathway注釋信息。
Y57與96-2幼穗分化起始時間一致(圖1),均在三葉期開始分化,但Y57的伸長期至單棱期和單棱期至二棱期持續(xù)時間均比96-2相應(yīng)時期長。四葉期時,Y57剛進(jìn)入單棱期,而96-2已處于二棱期;五葉期時,Y57到達(dá)二棱期,96-2已處于雌雄蕊分化期;七葉期時,Y57到達(dá)雌雄蕊分化期,96-2處于藥隔形成期。除了抽穗期以外,其他性狀二者均沒有顯著差異(表1)。
A~D依次為Y57伸長期、單棱期、二棱期、雌雄蕊分化期;E~H依次為96-2伸長期、二棱期、雌雄蕊分化期、藥隔形成期。
A-D indicate elongation stage,single ridge stage,double ridge stage,and pistil and stamen differential stage of Y57,resepectively; E-H indicate elongation stage,double ridge stage,pistil and stamen differential stage,and anther separation stage of 96-2,respectively.
圖1近等基因系幼穗發(fā)育動態(tài)
Fig.1Developmentofyoungspikeofnearisogeniclines
表1 近等基因系(NIL)96-2和Y57表型分析Table 1 Phenotypic data of near-isogenic lines(NIL) 96-2 and Y57
同列數(shù)據(jù)后不同字母表示差異顯著(P<0.05)。
Different letters following data at same column indicate significant differences between NILs at 0.05 level.
通過高通量測序,Y57和96-2分別獲得25 123 097和30 481 790條pair-end read,每個樣品均獲得6.3 G以上的堿基,各樣品Q30堿基百分比均大于85.5%(表2),表明轉(zhuǎn)錄組測序得到的結(jié)果可靠。Y57和96-2與中國春基因組比對成功的read數(shù)量分別為38 021 371和42 375 610,占總read數(shù)的63.11%和69.51%,比對到參考基因組唯一位置的read數(shù)在clean read 中所占的比率分別為56.07%和61.59%(表2),表明兩個樣品的read數(shù)與參考基因組的比對效率較高,可以進(jìn)行下一步分析。
表2 測序數(shù)據(jù)評估及比對分析Table 2 Statistical results of sequencing data
采用FPKM值作為衡量基因表達(dá)水平的指標(biāo),在差異表達(dá)基因檢測過程中,以Y57為對照組,將Fold Change≥2且FDR<0.01作為篩選標(biāo)準(zhǔn)。共篩選出395個差異表達(dá)基因(圖2),其中,上調(diào)和下調(diào)基因分別為138個和257個,與Nr數(shù)據(jù)庫對比得到382個注釋基因。對篩選出的差異表達(dá)基因根據(jù)其相同或相似表達(dá)模式進(jìn)行了聚類分析(圖3),發(fā)現(xiàn)有6種模式,其中,基因在2個材料中的差異表達(dá)主要在前5種模式上。在上調(diào)表達(dá)基因中,表達(dá)量差異最大的2個基因均編碼絲氨酸/蘇氨酸蛋白磷酸酶2A,log2(Y57 FPKM/96-2 FPKM)值分別為7.36和5.74。
對已注釋的382個差異表達(dá)基因進(jìn)行比對和功能注釋,結(jié)果表明,在COG功能分類體系中,共有103個差異表達(dá)基因獲得了功能注釋,涉及20個COG功能類別(圖4)。其中,一般功能基因(general function prediction only)所占比例最大,有25個基因;其次為信號傳導(dǎo)(signal transduction mechanism)和轉(zhuǎn)錄(transcription)相關(guān)基因,分別有15和13個。
火山圖中每個點表示一個基因,紅色點表示基因表達(dá)沒有達(dá)到顯著性差異,藍(lán)色點表示基因表達(dá)達(dá)到顯著性差異。
Each dot indicates one gene. The red dot shows no significant difference of gene expression, and the blue dot is the gene expression with significant difference.
圖2差異表達(dá)基因統(tǒng)計及其火山圖
Fig.2Statisticsofdifferentiallyexpressedgenesanditsvalcanochart
對已注釋的382個差異表達(dá)基因進(jìn)行GO功能注釋和分類統(tǒng)計。共有298個基因獲得GO功能注釋,主要為細(xì)胞組分(cellular component)、分子功能(molecular function)和生物學(xué)過程(biological process) 3大類別,分別包含17、17和20個功能分類(圖5)。在細(xì)胞組分分類中,涉及細(xì)胞組分(cell part)的差異表達(dá)基因(DEG)所占比例最多,占85.23%,其次是涉及細(xì)胞(cell)和細(xì)胞器(organelle)的DEG,分別占80.53%、73.83%;而涉及到細(xì)胞外基質(zhì)部分(extracellular matrix part)、膠原三聚體(collagen trimer)、病毒體(virion)及其組分(virion part)的DEG所占比例最低。在分子功能分類中,與結(jié)合相關(guān)的DEG所占比例最多,占64.42%,其次是與催化活性(catalytic activity)和核酸結(jié)合轉(zhuǎn)錄因子活性(nucleic acid binding transcription factor activity)相關(guān)DEG,分別占45.97%和12.08%。在生物學(xué)過程中,與細(xì)胞進(jìn)程(cellular process)相關(guān)的DEG所占比例最多,占75.50%,其次為與代謝過程(metabolic process)相關(guān)的DEG,占74.16%;而與生物附著(biological adhesion)和運(yùn)動力(locomotion)相關(guān)DEG所占比例不到0.1%。
將382個已注釋的差異表達(dá)基因與KEGG數(shù)據(jù)庫進(jìn)行比對,共有63個基因富集到35個KEGG通路中,其中,在光合作用-天線蛋白(photosynthesis-antenna protein,ko00196)和甘油磷脂代謝(glycerophospholipid metabolism,ko00564)通路上的富集基因顯著高于其他通路(P<0.05)。進(jìn)一步分析發(fā)現(xiàn),富集在光合作用-天線蛋白通路上的差異表達(dá)基因均上調(diào)表達(dá)(表3),涉及穗發(fā)育的代謝途徑主要有植物生理節(jié)律(ko04712)、淀粉與糖代謝(ko00500)、光合作用(Photosynthesis)和植物激素信號轉(zhuǎn)導(dǎo)(ko04075)途徑。
對在nr數(shù)據(jù)庫中得到功能注釋的差異表達(dá)基因進(jìn)行分析,發(fā)現(xiàn)功能注釋為轉(zhuǎn)錄因子的差異表達(dá)基因有19個(表4)。6 個差異表達(dá)基因?qū)儆赪RKY轉(zhuǎn)錄因子家族,它們在Y57中的表達(dá)量均顯著小于96-2。屬于Myb家族(4 個)、AP2/ERF家族(4 個)和C3H家族(2 個)的差異表達(dá)基因均下調(diào)。兩個MADS-box 基因表達(dá)趨勢相反,一個上調(diào)一個下調(diào)。這些家族轉(zhuǎn)錄因子調(diào)控植物多個生長發(fā)育過程,部分基因影響植物抽穗開花時間和花器官的形成。
不同的顏色表示每個基因表達(dá)水平的高低。
Different colours mean different gene expression levels.
圖3近等基因系間差異表達(dá)基因的熱點圖
Fig.3Heatmapofthedifferentexpressiongenesofthetwonearisogeniclines
A:RNA加工與修飾; B:染色質(zhì)結(jié)構(gòu)與變化; C:能量產(chǎn)生與轉(zhuǎn)化; D:細(xì)胞周期調(diào)控與分類,染色體重排; E:氨基酸運(yùn)輸與代謝; F:核苷酸轉(zhuǎn)運(yùn)輸與代謝; G:碳水化合物運(yùn)輸與代謝; H:輔酶運(yùn)輸與代謝; I:脂質(zhì)轉(zhuǎn)運(yùn)與代謝; J:翻譯,核糖體結(jié)構(gòu)與生物合成; K:轉(zhuǎn)錄; L:復(fù)制、重組與修復(fù); M:細(xì)胞壁、膜生物發(fā)生; N:細(xì)胞運(yùn)動; O:蛋白質(zhì)翻譯后修飾與轉(zhuǎn)運(yùn),分子伴侶; P:無機(jī)離子轉(zhuǎn)運(yùn)與代謝; Q:次生代謝物合成、運(yùn)輸與代謝; R:一般功能; S:功能未知; T:信號轉(zhuǎn)導(dǎo); U:細(xì)胞內(nèi)運(yùn)輸,分泌和囊泡運(yùn)輸; V:防御機(jī)制; W:細(xì)胞外基質(zhì)結(jié)構(gòu); Y:核結(jié)構(gòu); Z:細(xì)胞骨架。
A:RNA processing and modification; B:Chromatin structure and dynamics; C:Energy production and conversion; D:Cell cycle control,cell division,chromosome partitioning; E:Amino acid transport and metabolism; F:Nucleotide transport and metabolism; G:Carbohydrate transport and metabolism; H:Coenzyme transport and metabolism; I:Lipid transport and metabolism; J:Translation,ribosomal structure and biogenesis; K:Transcription; L:Replication,recombination and repair; M:Cell wall/membrane/envelope biogenesis; N:Cell motility; O:Posttranslational modification,protein turnover,chaperones; P:Inorganic ion transport and metabolism; Q:Secondary metabolites biosynthesis,transport and catabolism; R:General function prediction only; S:Function unknown; T:Signal transduction mechanisms; U:Intracellular trafficking,secretion,and vesicular transport; V:Defense mechanisms; W:Extracellular structures; Y:Nuclear structure; Z:Cytoskeleton.
圖4差異表達(dá)基因COG功能分類
Fig.4COGfunctionclassificationofdifferentiallyexpressedgenes
C1:細(xì)胞組分; C2:細(xì)胞; C3:細(xì)胞器; C4:膜; C5:細(xì)胞器部分; C6:細(xì)胞膜部分; C7:大分子復(fù)合物; C8:胞外區(qū); C9:細(xì)胞連接; C10:膜封閉腔; C11:胞外區(qū)要素; C12:核仁; C13:細(xì)胞外基質(zhì); C14:細(xì)胞外基質(zhì)部分; C15:病毒體; C16:病毒體組分; C17:膠原三聚體; M1:結(jié)合; M2:催化活性; M3:轉(zhuǎn)運(yùn)活性; M4:核酸結(jié)合轉(zhuǎn)錄因子活性; M5:電子載體活性; M6:結(jié)構(gòu)分子活性; M7:分子轉(zhuǎn)導(dǎo)活性; M8:受體活性; M9:酶調(diào)節(jié)活性; M10:抗氧化活性; M11:蛋白結(jié)合轉(zhuǎn)錄因子活性; M12:營養(yǎng)庫活性; M13:鳥苷酸交換因子活性; M14:金屬伴侶活性; M15:翻譯調(diào)節(jié)活性; M16:蛋白標(biāo)簽; M17:通道調(diào)節(jié)活性; B1:細(xì)胞反應(yīng)過程; B2:代謝過程; B3:單生物體過程; B4:刺激應(yīng)答; B5:生物學(xué)調(diào)控; B6:組織或生物起源細(xì)胞組件; B7:發(fā)育過程; B8:定位; B9:多細(xì)胞生物體過程; B10:生殖生長過程; B11:多生物體過程; B12:信號; B13:生長; B14:免疫系統(tǒng)過程; B15:生殖; B16:節(jié)律過程; B17:生物附著; B18:生物階段; B19:運(yùn)動; B20:細(xì)胞致死。
C1:Cell part; C2:Cell; C3:Organelle; C4:Membrane; C5:Organelle part; C6:Membrane part; C7:Macromolecular complex; C8:Extracellular region; C9:Cell junction; C10:Membrane-enclosed lumen; C11:Extracellular region part; C12:Nucleoid; C13:Extracellular matrix; C14:Extracellular matrix part; C15:Virion; C16:Virion part; C17:Collagen trimer; M1:Binding; M2:Catalytic activity; M3:Transporter activity; M4:Nucleic acid binding transcription factor activity; M5:Electron carrier activity; M6:Structural molecule activity; M7:Molecular transducer activity; M8:Receptor activity; M9:Enzyme regulator activity; M10:Antioxidant activity; M11:Protein binding transcription factor activity; M11:Protein binding transcription factor activity; M12:Nutrient reservoir activity; M13:Guanyl-nucleotide exchange factor activity; M14:Metallochaperone activity; M15:Translation regulator activity; M16:Protein tag; M17:Channel regulator activity; B1:Cellular process; B2:Metabolic process; B3:Single-organism process; B4:Response to stimulus; B5:Biological regulation; B6:Cellular component organization or biogenesis; B7:Developmental process; B8:Localization; B9:Multicellular organismal process; B10:Reproductive process; B11:Multi-organism process; B12:Signaling; B13:Growth; B14:Immune system process; B15:Reproduction; B16:Rhythmic process; B17:Biological adhesion; B18:Biological phase; B19:Locomotion; B20:Cell killing.
表4 編碼為轉(zhuǎn)錄因子的差異表達(dá)基因Table 4 Differentially expressed genes encoding transcription factors
從差異表達(dá)基因中挑選4個表達(dá)明顯不同的基因進(jìn)行驗證,其中2個是表達(dá)趨勢不同的基因(Traes_5DL_9CC4EC839和Traes_6DL_7892214C8),另外2個是表達(dá)量顯著不同的基因(Traes_5DL_52EC7112A和Traes_3DS_92091AAD4)。利用實時熒光定量PCR分析這4個基因在2個材料中的相對表達(dá)水平,對轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行可靠性驗證。結(jié)果發(fā)現(xiàn),4個基因的轉(zhuǎn)錄組測序結(jié)果與熒光定量結(jié)果一致(圖6);通過對三個不同發(fā)育時期的轉(zhuǎn)錄組測序基因表達(dá)水平和基因相對表達(dá)量的相關(guān)性分析可知,Traes_5DL_9CC4EC839和Traes_6DL_7892214C8基因在YM57和96-2中的相關(guān)系數(shù)分別為0.951,0.644,0.994和0.961; Traes_3DS_92091AAD4和Traes_5DL_52EC7112A.2基因在YM57和96-2中的相關(guān)系數(shù)分別為1、0.667、1和0.762,都達(dá)顯著水平,表明轉(zhuǎn)錄組測序結(jié)果可靠。
A、C、E、G為轉(zhuǎn)錄組測序結(jié)果,B、D、F、H為RT-PCR結(jié)果; A和B是基因Traes_5DL_9CC4EC839的驗證結(jié)果;C和D是基因Traes_6DL_7892214C8的驗證結(jié)果;E和F是基因Traes_3DS_92091AAD4的驗證結(jié)果;G和H是Traes_5DL_52EC7112A.2基因的驗證結(jié)果;4L、5L、7L分別代表四葉期、五葉期、七葉期。
A,C,E,G are the result of transcriptome sequencing;B,D,F,H are the result of qRT-PCR; A and B are the result of the gene Traes_5DL_9CC4EC839;C and D are the result of the gene Traes_6DL_7892214C8; E and F are the result of the gene Traes_3DS_92091AAD4;G and H are the result of the gene Traes_5DL_52EC7112A.2; 4L,5L,7L are the 4th leaf age,the 5th leaf age,the 7th leaf age,respetively.
圖6轉(zhuǎn)錄組測序結(jié)果與RT-PCR結(jié)果比較
Fig.6ComparisonofRNA-seqversusqRT-PCRdataforselectedgenes
生產(chǎn)上普遍種植的小麥?zhǔn)钱愒戳扼w,含有A、B、D三個基因組,基因組大約17 G。普通小麥的形成涉及3個原始祖先物種和兩次天然雜交,烏拉爾圖、擬斯卑爾托山羊草和粗山羊草分別是小麥A、B、D基因組的供體[23]。雖然目前A和D基因組測序和草圖繪制已經(jīng)完成[24-25],與水稻、玉米等作物相比,小麥分子基礎(chǔ)研究還很薄弱,遺傳背景了解還比較少。近幾年來基于Illumina 測序平臺的RNA-seq技術(shù)已成為快速而全面地建立植物分子基礎(chǔ)平臺的有力工具[26-27]。
小麥穗發(fā)育是一個受多基因和環(huán)境調(diào)控的復(fù)雜過程,二棱期是與小麥抽穗期關(guān)系最密切的時期。本研究利用RNA-seq測序技術(shù)獲得Y57和96-2比對到參考基因組(中國春)上的reads數(shù)分別為38 021 371和42 375 610,但是2個材料在二棱期僅篩選出395個差異表達(dá)基因,其中上調(diào)基因138個,下調(diào)基因257個。這也說明了Y57和96-2遺傳背景高度一致,減少了遺傳背景對差異表達(dá)基因篩選的影響。而Feng等[16]利用普通小麥中國春進(jìn)行了小麥花不同發(fā)育時期的轉(zhuǎn)錄組分析,其中找到在二棱期特異表達(dá)的基因464個,這些基因主要富集在核酸綁定(nucleic acid binding)、轉(zhuǎn)錄調(diào)控活性(transcription regulator activity)、轉(zhuǎn)錄因子活性(transcription factor activity)及DNA綁定等功能。將本研究找到的這些差異基因在Nr數(shù)據(jù)庫進(jìn)行注釋,其中382個基因獲得了功能注釋;有298個基因獲得GO功能注釋,這些差異表達(dá)基因的功能也主要集中在結(jié)合(binding)、催化活性(catalytic activity)和核酸結(jié)合轉(zhuǎn)錄因子活性(nucleic acid binding transcription factor activity)等方面,與Feng等[16]研究結(jié)果類似。Wang等[17]利用90個冬小麥品種在二棱期早期及小穗原基形成期進(jìn)行了轉(zhuǎn)錄組分析,并將獲得的差異表達(dá)基因與穗部相關(guān)性狀進(jìn)行了相關(guān)性分析,發(fā)現(xiàn)小穗數(shù)與基因表達(dá)水平呈顯著相關(guān),其次是小花數(shù)和穗粒數(shù); 由此可知,二棱期是小麥穗部發(fā)育形成的關(guān)鍵時期。對本研究獲得的差異基因進(jìn)行COG功能注釋,有103個基因獲得COG功能注釋,只有63個基因被注釋到KEGG代謝通路中。注釋基因信息之所以缺失,一方面可能是因為小麥基因組測序還沒有完成,無法對整個基因組進(jìn)行功能注釋; 另一方面,目前對小麥轉(zhuǎn)錄組學(xué)研究還處于初級階段,現(xiàn)在的研究主要集中在小麥抗逆性方面[14,28],基因功能注釋信息不夠豐富,生物信息數(shù)據(jù)庫還不夠完善,部分序列或基因無法獲得相應(yīng)的功能注釋信息。
本研究發(fā)現(xiàn),Traes_5DL_52EC7112A和Traes_3DS_92091AAD4為絲氨酸/蘇氨酸蛋白磷酸酶2A同源基因,且它們在Y57中幾乎不表達(dá)而在96-2中表達(dá)量較高。Janssens等[29]和Yu等[30]都表明絲氨酸/蘇氨酸蛋白磷酸酶2A(PP2A)在信號轉(zhuǎn)導(dǎo)和細(xì)胞生長、分化方面起重要的調(diào)控作用,能夠促進(jìn)植物生長發(fā)育。擬南芥的PP2A顯著影響生長素轉(zhuǎn)運(yùn)[31]。由此推測,這兩個基因可能與小麥幼穗分化有關(guān),對小麥抽穗期有正調(diào)控作用。
本研究中,差異表達(dá)基因中有多個WRKY、MADS-box、Myb-like和ERF/AP2轉(zhuǎn)錄因子。ERF/AP2和WRKY轉(zhuǎn)錄因子是許多植物生長發(fā)育過程,如應(yīng)答生物和非生物脅迫、種子萌發(fā)、ABA信號轉(zhuǎn)導(dǎo)等的主要調(diào)控因子。Kiseleva等[32]認(rèn)為ERF/AP2和WRKY轉(zhuǎn)錄因子可能影響小麥抽穗期,在大豆[33]和芒草[34]中也發(fā)現(xiàn)了控制開花期的WRKY轉(zhuǎn)錄因子。已有大量研究證明MADS-box基因家族參與生長點的確定、春化過程、開花時間調(diào)控和果實成熟等多個重要發(fā)育過程[35-37]。在擬南芥中發(fā)現(xiàn)Myb-like家族轉(zhuǎn)錄因子是晝夜節(jié)律鐘和花青素合成途徑中的調(diào)控因子[38],晝夜節(jié)律鐘可以通過調(diào)控下游基因的表達(dá)控制植物開花時間。Myb-like家族轉(zhuǎn)錄因子對小麥抽穗期的作用還需要進(jìn)一步研究。
在生物體內(nèi),不同的基因產(chǎn)物相互協(xié)調(diào)行使生物學(xué)功能,對差異表達(dá)基因的通路注釋分析有助于進(jìn)一步解讀基因的功能。本研究KEGG分析結(jié)果表明,差異表達(dá)基因顯著富集在光合作用-天線蛋白和甘油磷脂代謝通路上。篩選到參與光合作用-天線蛋白通路中的Lhca2、Lhcb1、Lhcb2、 Lhcb3和Lhcb4差異表達(dá)基因均上調(diào)表達(dá)。它們是光系統(tǒng)Ⅰ和光系統(tǒng)Ⅱ的組成部分,參與光吸收和光信號轉(zhuǎn)導(dǎo)。在光周期控制開花反應(yīng)中,植物通過光受體感受外界的光信號并將光信號傳遞到晝夜節(jié)律鐘系統(tǒng)控制植物的開花時間[39],推測這些基因可能通過光周期途徑正調(diào)控小麥抽穗期。對甘油磷脂代謝通路對穗發(fā)育的影響還有待于進(jìn)一步研究。本研究還對差異表達(dá)基因進(jìn)行了GO和COG功能分類,差異表達(dá)基因主要涉及植物生長發(fā)育細(xì)胞部分、結(jié)合、細(xì)胞運(yùn)輸過程、代謝過程、信號轉(zhuǎn)導(dǎo)機(jī)制和轉(zhuǎn)錄等,說明參與小麥幼穗分化前期差異表達(dá)基因主要集中于細(xì)胞內(nèi),DNA、RNA和蛋白質(zhì)等代謝旺盛,為細(xì)胞分裂、生長和分化提供信息、能量和物質(zhì)基礎(chǔ)。