李元君,王國平,牛永志,鄭昀曄,張立猛
玉溪中煙種子有限責(zé)任公司,云南玉溪 653100
種子是最基本的農(nóng)業(yè)生產(chǎn)資料,種子成熟時(shí)大量合成蛋白質(zhì)、淀粉和脂類等貯藏化合物,為下一代植物生長提供物質(zhì)基礎(chǔ)[1]。煙草種子粒徑小、繁殖系數(shù)高,但在繁種收獲后需經(jīng)過貯藏階段才會投入使用[2]。大量研究表明,在貯藏過程中,種子時(shí)刻受到外界環(huán)境因素的影響,種子內(nèi)部不斷進(jìn)行新陳代謝活動,種子活力下降,因此,煙草種子貯藏環(huán)境的溫度、濕度及貯藏時(shí)間等關(guān)鍵因素的控制,貯藏后種子質(zhì)量的優(yōu)劣,對保障煙葉生產(chǎn)具有重要意義。
隨著研究的深入,對于種子貯藏研究已經(jīng)從生理生化分析發(fā)展到了功能基因和蛋白的挖掘,已有研究表明種子貯藏過程中眾多基因或蛋白發(fā)生了變化,例如:ABI3[3]、ATHB25[4]等激素相關(guān)基因,OsALDH7[5]、PLDα1[6]等活性氧相關(guān)基因以及一些基因組修復(fù)[7]、種皮結(jié)構(gòu)[8]等基因。此外,多肽是在生命過程起著極其重要作用的一類化合物[9],迄今在生物體內(nèi)發(fā)現(xiàn)的多肽已達(dá)數(shù)萬種,其廣泛參與和調(diào)節(jié)機(jī)體內(nèi)各系統(tǒng)、器官、組織和細(xì)胞的功能活動。研究也表明植物多肽參與受精授粉、根系發(fā)育、葉片發(fā)育等眾多生物過程[10-12]。王國平等[13]基于多肽組學(xué)分析了煙草種子萌動前后的蛋白與多肽變化,并篩選出一個(gè)能夠促進(jìn)種子萌發(fā)的新型多肽。但目前對多肽的研究和認(rèn)識遠(yuǎn)遠(yuǎn)不夠,對于種子成熟、貯藏相關(guān)的多肽研究還未見報(bào)道。
本研究通過轉(zhuǎn)錄組與多肽組手段,研究貯藏期間煙草種子內(nèi)部基因和多肽的表達(dá)差異與功能注釋,挖掘調(diào)控種子貯藏活性的關(guān)鍵多肽,為指導(dǎo)種子貯藏提供理論依據(jù)和研究基礎(chǔ)。
供試材料煙草云煙105種子于2020年采收于西雙版納冬繁基地。
1.2.1 種子的貯藏
將種子置于溫度18℃,空氣相對濕度40%以下的條件貯藏[14]。10 d 后開始取樣,之后每隔2 周取樣,80 d 后,每隔4 周取樣,樣品種子進(jìn)行發(fā)芽檢測。
1.2.2 種子發(fā)芽檢測
在培養(yǎng)皿中墊海綿和濾紙,加入自來水,每個(gè)培養(yǎng)皿均勻播入100 粒種子,加蓋。將培養(yǎng)品置于人工氣候室,在溫度25℃,每天光照12 h 的條件下發(fā)芽,發(fā)芽期間保持濾紙濕潤。從第4 d 起每天記錄發(fā)芽種子數(shù)(以露出子葉計(jì)為種子發(fā)芽),連續(xù)記錄14 d。每個(gè)處理3 個(gè)重復(fù),統(tǒng)計(jì)發(fā)芽勢、發(fā)芽率。計(jì)算方法:發(fā)芽勢(%)=(第7 d 發(fā)芽種子數(shù)/供試種子數(shù))×100%;發(fā)芽率(%)=(第14 d 發(fā)芽種子數(shù)/供試種子數(shù))×100%[1]。
1.2.3 轉(zhuǎn)錄組檢測與分析
取貯藏前后的種子樣品,用振蕩研磨儀將種子樣品磨碎后,采用Trizol 法提取總RNA(Invitrogen,Carlsbad, CA, USA),使用試劑盒去除rRNA,然后通過帶有Oligo(dT)的磁珠富集具有polyA 尾巴的真核mRNA 后,用緩沖液把mRNA 打斷。以片段化的mRNA 為模版,隨機(jī)寡核苷酸為引物,合成cDNA。cDNA 經(jīng)過末端修復(fù)、加A 尾并連接測序接頭,用AMPure XP beads 篩選200 bp 左右的cDNA,進(jìn)行PCR擴(kuò)增,最終獲得文庫。
為減少無效數(shù)據(jù)帶來的分析干擾,利用fastp[15]過濾掉(1)含adapter 的;(2)含(N)比例大于10%的;(3)全部都是A 堿基的以及(4)質(zhì)量值Q≤20的堿基數(shù)占整條read 的50%以上的低質(zhì)量數(shù)據(jù),得到clean read。然后使用HISAT2[16]將整理好的數(shù)據(jù)和煙草參考基因組( https://solgenomics.net/organism/Nicotiana_tabacum/genome)進(jìn)行比對,用RSEM[17]軟件作表達(dá)量分析,最后使用DESeq2[18]進(jìn)行差異表達(dá)和基因富集分析。
1.2.4 多肽組檢測及分析
1.2.4.1 樣品制備
種子樣品研磨后加入裂解液(1%SDS, 8 mol/L urea, 1xProtease Inhibitor Cocktail(Roche Ltd.Basel,Swizerland)),振蕩研磨3*400 s,冰上裂解30 min。高速離心15 min(4℃, 15000 rpm),取上清。用10K超濾管(Millipore,Billerica)于4℃下8000 g離心30 min去除高分子量的蛋白,然后采用 C18 除鹽柱(MonoSpin C18, GL)對樣品進(jìn)行除鹽并用真空濃縮儀抽干,于-80℃條件下保存待檢。
1.2.4.2 多肽定性定量及差異分析
樣品由配備在線納噴離子源的LC-MS/MS進(jìn)行分析。得到的串聯(lián)質(zhì)譜圖經(jīng)過PEAKS Studio version X+(Bioinformatics Solutions Inc., Waterloo, Canada)分析后用PEAKS DB 搜索煙草基因組數(shù)據(jù)庫,設(shè)置None enzyme 即非酶切。搜庫參數(shù)碎片離子質(zhì)量容許誤差:0.02 Da,母離子質(zhì)量容許誤差:7 ppm,可變修飾:Oxidation (M) 15.99,Acetylation (Protein N-term)42.01。肽段卡值為:-10lgP≥20。根據(jù)搜庫結(jié)果對多肽進(jìn)行定性定量分析。
同時(shí),根據(jù)多肽定量結(jié)果,篩選出比較組間豐度發(fā)生顯著變化的多肽,差異分析閾值:差異倍數(shù)(Fold change,F(xiàn)C)的絕對值大于1.2 倍,P值<0.05,并要求特異性肽段Unique Peptides≥1。
1.2.4.3 生物學(xué)信息分析
由于多肽序列較短,且數(shù)據(jù)庫中對多肽的注釋較低,為完整了解多肽的生物學(xué)功能,使用Blast2GO[19]version 5 對鑒定出的所有多肽所屬的蛋白進(jìn)行GO 和KEGG 注釋,以差異蛋白為測試集,全基因組編碼蛋白為背景,基于超幾何分布檢驗(yàn)對差異基因進(jìn)行GO和KEGG 代謝通路富集分析。
由圖1 可知,剛收獲的云煙105 種子發(fā)芽率達(dá)到90%以上,與優(yōu)質(zhì)種子發(fā)芽率95%以上的標(biāo)準(zhǔn)相比,仍然偏低。其發(fā)芽勢僅為65%,與優(yōu)質(zhì)種子發(fā)芽勢92%以上的標(biāo)準(zhǔn)相比,明顯偏低。在貯藏溫度18℃條件下,隨著貯藏時(shí)間的增加,種子發(fā)芽率略微升高,而發(fā)芽勢顯著升高,貯藏到大概200 d 以上的種子發(fā)芽勢已經(jīng)達(dá)到90%以上,發(fā)芽率和發(fā)芽勢均趨于穩(wěn)定。說明云煙105 種子剛收獲后活力較低,經(jīng)過一段時(shí)間貯藏后活力增高。
分別對貯藏200 d 以上的種子(V6)和剛收獲的種子(V7)進(jìn)行轉(zhuǎn)錄組測序,PCA 分析顯示兩組樣品間差異性較好,可用于后續(xù)分析(圖2)。設(shè)置差異基因篩選標(biāo)準(zhǔn)為FDR<0.05 且|log2FC|>1,共獲得45712個(gè)基因,264 個(gè)差異基因(圖3),其中有186 個(gè)基因上調(diào)表達(dá)、78 個(gè)基因下調(diào)表達(dá)。可以看出種子經(jīng)過長期貯藏后,成熟更加充分并趨于穩(wěn)定,相應(yīng)的基因以下調(diào)表達(dá)為主。
圖2 貯藏前后種子中基因成分分析PCA 圖Fig.2 PCA of differentially expressed genes in seeds before and after storage
對貯藏前后種子差異基因的GO 富集分析結(jié)果顯示,差異基因可以注釋到47 個(gè)GO 二級單元條目中,代謝過程(GO:0008152,50%)、細(xì)胞過程(GO:0009987,46.59%)、單生物過程(GO:0044699,45.83%);細(xì)胞組分(GO:0044464,28.03%)、細(xì)胞膜(GO:0016020,20.83%);催化活性(GO:0003824,49.62%)、結(jié)合(GO:0005488,39.77%)的差異基因數(shù)占總差異基因數(shù)百分比較高(圖4A)。分別在3 個(gè)ontology 中篩選Q 值最小的前20 個(gè)GO term(圖4B、C、D),可以看出差異基因主要富集在生物過程條目的硫酸鹽同化(GO:0000103)、脂肪酸代謝(GO:0006631)、脫落酸轉(zhuǎn)運(yùn)(GO:0080168)、刺激應(yīng)答(GO:0043207)、防御反應(yīng)(GO:0006952)、單羧酸代謝過程(GO:0032787)、脂質(zhì)代謝(GO:0006629)等過程;細(xì)胞組分條目的細(xì)胞連接(GO:0030054)、細(xì)胞膜(GO:0016020)、膜的固有成分(GO:0031224)等;分子功能條目中的硫氧還 蛋 白 活 性( GO:0004604 )、 鐵 離 子 結(jié) 合(GO:0005506)、氧化還原酶活性(GO:0016705)等。對貯藏前后種子差異基因進(jìn)行KEGG 富集分析,篩選Q 值最小的前20 個(gè)途徑(圖4E),差異基因主要富集在次生代謝物的生物合成(Biosynthesis of secondary metabolites)、硫代謝(Sulfur metabolism)、脂肪酸延長(Fatty acid elongation)、氨基酸合成(Amino acid metabolism)、植物激素信號轉(zhuǎn)導(dǎo)( Plant hormone signal transduction)等。
圖4 差異表達(dá)基因的GO 和KEGG 富集分析Fig.4 GO and KEGG enrichment analyses of differentially expressed genes
分別對貯藏200 d 以上的種子(V6)和剛收獲的種子(V7)進(jìn)行多肽的提取,并進(jìn)行質(zhì)譜鑒定。通過PCA 分析顯示兩組樣品間差異性較好,可用于后續(xù)分析(圖5)。對獲得的質(zhì)譜圖與蛋白質(zhì)數(shù)據(jù)庫進(jìn)行比對分析(-10lgP≥20,F(xiàn)DR≤0.01),獲得匹配質(zhì)譜圖數(shù)2589 個(gè),共匹配到特異肽段1052 個(gè),蛋白質(zhì)數(shù)量385個(gè)。鑒定獲得的肽段主要集中在6~23 個(gè)氨基酸范圍內(nèi),占全部鑒定肽段的96%以上。最終在貯藏前后種子樣品中共篩選(P值<0.05)到256 個(gè)差異多肽,其中138 個(gè)多肽上調(diào)表達(dá),118 個(gè)多肽下調(diào)表達(dá)(圖6A)??梢钥闯龇N子經(jīng)過長期貯藏后,相應(yīng)的多肽以下調(diào)表達(dá)為主,這與基因表達(dá)規(guī)律一致。
圖5 貯藏前后種子中多肽樣品成分分析PCA 圖Fig.5 PCA of differentially expressed peptides in seeds before and after storage
圖6 貯藏前后種子差異多肽Fig.6 Differentially expressed peptide in seeds before and after storage
貯藏前后種子樣品中共篩選256 個(gè)差異多肽,這些差異多肽共匹配到125 個(gè)蛋白。對這些蛋白進(jìn)行GO 富集分析,結(jié)果顯示,共注釋到41 個(gè)GO 二級單元條目,其中差異多肽數(shù)占總差異多肽數(shù)百分較高分的條目分別是單生物過程(13.67%)、代謝過程(12.89%)、細(xì)胞過程(9.38%);細(xì)胞組分(8.98%)、細(xì)胞器(6.25%);催化活性(10.55%)、結(jié)合(9.77%)等(圖7A)。分別在3 個(gè)ontology中篩選Q 值最小的前20 個(gè)GO 條目,可以看出差異較大的多肽主要富集在生物過程條目的胚胎發(fā)育(GO:0009790)、種子發(fā)育(GO:0048316)、種子休眠的胚胎發(fā)育終止(GO:0009793)等;細(xì)胞組分條目的外膜(GO:0031975)、核膜(GO:0005635)、液泡(GO:005773)等;以及分子功能條目的氧化還原酶活性(GO:0016491 )、 過氧化物酶活性(GO:0051213)、裂解酶活性(GO:0016829)、脂質(zhì)結(jié)合(GO:0008289)等(圖7B、C、D)。對貯藏前后種子差異多肽所屬蛋白進(jìn)行KEGG 富集分析,篩選Q 值最小的前20 個(gè)途徑,可以看出差異多肽主要富集在脂肪酸代謝、過氧化酶體、α-亞麻酸代謝、乙醛酸和二羧酸代謝、碳代謝等通路(圖7E)。
圖7 差異多肽所屬蛋白的GO 和KEGG 富集分析Fig.7 GO & KEGG enrichment analysis of differentially expressed peptide matched proteins
本研究在貯藏前后種子中共檢測到差異基因264個(gè)、差異多肽256 個(gè),差異多肽匹配到的蛋白125。將差異基因和差異多肽所屬蛋白集合取交集,獲得1個(gè)交集基因,即Nitab4.5_0000072g0130(圖8)。該基因?yàn)轭A(yù)測的枯草菌素樣蛋白酶SBT1.3(Subtilisin-like protease SBT1.3),主要作用為蛋白水解,具有絲氨酸型內(nèi)肽酶活性。
圖8 貯藏前后種子中差異表達(dá)基因和蛋白韋恩圖Fig.8 Venn diagram of differentially expressed genes and proteins in seeds before and after storage
為了進(jìn)一步篩選目標(biāo)多肽,從獲得的256 個(gè)差異多肽所屬蛋白中繼續(xù)篩選具有信號肽、蛋白長度不超過250 個(gè)氨基酸的蛋白,定義為目標(biāo)多肽[13]。最終獲得含信號肽的2 個(gè)多肽分子,且長度均不超過250 個(gè)氨基酸。其中Nitab4.5_0008018g0020,長度為142 個(gè)氨基酸,是類2S 富硫種子貯藏蛋白2(2S sulfur-rich seed storage protein 2-like),而另一個(gè)Nitab4.5_0002257g0090,長度為199 個(gè)氨基酸,則無注釋信息。這兩個(gè)多肽可能在種子成熟或貯藏過程起重要作用,后續(xù)可進(jìn)一步驗(yàn)證其功能。
種子貯藏伴隨種子內(nèi)部一系列生理生化活性指標(biāo)的變化,如脂肪氧化酶活性、抗氧化酶活性和非酶類抗氧化劑的種類和含量[20]。隨著貯藏時(shí)間的延長,種子活力或種子壽命逐漸降低。本研究使用的試驗(yàn)材料為煙草云煙105 的種子,剛收獲的云煙105 種子發(fā)芽率在90%以上,與優(yōu)質(zhì)種子發(fā)芽率95%以上的標(biāo)準(zhǔn)相比,仍然偏低,而發(fā)芽勢與優(yōu)質(zhì)種子發(fā)芽勢92%以上的標(biāo)準(zhǔn)相比,明顯偏低,經(jīng)過200 多天貯藏后,種子的發(fā)芽率和發(fā)芽勢不斷提高到90%以上并趨于穩(wěn)定,種子活力提高。這一現(xiàn)象與一般認(rèn)為的種子貯藏規(guī)律相反,考慮可能與種子后熟有關(guān)。種子后熟指的是種子形態(tài)成熟后被收獲,并與母株脫離,但種子內(nèi)部的生理生化過程仍然繼續(xù)進(jìn)行,直到生理成熟。煙草種子的采收時(shí)間主要是根據(jù)果皮顏色判斷,果皮達(dá)到黃褐色為最佳成熟采收時(shí)間[21],而云煙105 的種子之所以活力還偏低,可能是未達(dá)到生理成熟導(dǎo)致。本研究的轉(zhuǎn)錄組和多肽組數(shù)據(jù)也表明,隨著種子的成熟,其基因和多肽主要以下調(diào)為主,說明種子代謝活躍度降低,成熟更加充分并趨于穩(wěn)定。
本研究從轉(zhuǎn)錄組和多肽組層面解析種子貯藏前后的基因與多肽表達(dá)差異并進(jìn)行GO 和KEGG 富集分析。差異基因和差異多肽主要富集到脂肪酸代謝、過氧化物酶代謝、脂質(zhì)代謝、激素信號、防御反應(yīng)等途徑。研究表明,煙草種子油含量較高,占到種子總量的33.6%~39.4%[22],種子成熟過程中油脂的代謝也相對活躍[23]。隨著種子的成熟穩(wěn)定,對外界環(huán)境的抗性也逐漸增強(qiáng),其中抗氧化酶活性起著重要作用[24]。此外,激素也是種子成熟、萌發(fā)的重要調(diào)控因子[25]。因此,本研究結(jié)果也充分說明了煙草種子貯藏過程中富集到的主要途徑與種子成熟穩(wěn)定密切相關(guān)。本研究進(jìn)一步篩選到 2 個(gè)目標(biāo)多肽,其中Nitab4.5_0008018g0020是類2S 富硫種子貯藏蛋白2,與種子成熟過程的營養(yǎng)積累有關(guān), 另一個(gè)Nitab4.5_0002257g0090則無注釋信息,有待進(jìn)一步研究。此外,目前關(guān)于種子的后熟研究主要集中在赤霉素的合成、脫落酸的抑制、細(xì)胞分裂促進(jìn)等分子機(jī)制研究[26],多肽對種子休眠的解除及后熟過程的調(diào)控等多肽組研究仍然空白,本研究篩選的目標(biāo)多肽分子在種子后熟過程中是否具有調(diào)控作用還有待進(jìn)一步研究。
本研究對貯藏前后煙草種子的基因和多肽進(jìn)行了篩選,差異基因和差異多肽主要富集到脂肪酸代謝、過氧化物酶代謝、脂質(zhì)代謝、激素信號、防御反應(yīng)等與種子成熟穩(wěn)定密切相關(guān)的途徑。此外,本研究篩選到2 個(gè)與種子成熟及老化相關(guān)的目標(biāo)多肽,為后續(xù)的深入研究奠定了基礎(chǔ)。