萬 柔,胡亞平,景文軒,胡 博,郭起榮
(南京林業(yè)大學(xué) a.林學(xué)院;b.南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心,江蘇 南京 210037)
單倍體(Haploid)是指體細胞染色體數(shù)為本物種配子染色體數(shù)的生物個體。相較于多倍體,單倍體因為單純的遺傳特性、獨特的表型特性以及材料難獲得而長期受到研究工作者的特殊重視。自1922年在曼陀羅Daturastramonium中首次發(fā)現(xiàn)天然單倍體植物以來[1],單倍體的研究一直是研究的熱點。在自然界中,特別是裸子植物由于受到內(nèi)、外刺激而形成單倍體植株的頻率極低,很不易見[2]。應(yīng)用于人工誘導(dǎo)單倍體的方法主要有花藥培養(yǎng)、孤雌生殖等[3]。單倍體一則可以顯著地縮短育種年限,加快育種進程[4-5],二則對純系的單倍體種質(zhì)材料的遺傳改造更具實踐意義,更是解密高度雜合的植物基因組的理想材料[6-9],吸引著越來越多的研究人員致力于單倍體的工作。
隨著倍性的改變,植物基因組的結(jié)構(gòu)和基因的表達會發(fā)生一系列的變化,如DNA序列消除、染色體重組、基因的非加性表達、表觀遺傳修飾等?,F(xiàn)有研究表明,植物中不同物種的倍性效應(yīng)都不一樣,倍性材料間的生物效應(yīng)并非簡單地表現(xiàn)為倍數(shù)關(guān)系,而是表現(xiàn)出復(fù)雜的劑量效應(yīng)關(guān)系[10]。與高倍性的植物相比,一些物種的低倍性植物往往表現(xiàn)出較弱的生長活力,這種活力的降低反映在較小的體型,較慢的生長速度和較少的次級代謝物方面。在作物方面,多倍體技術(shù)已被用于開發(fā)更多的優(yōu)勢品種,如新型四倍體水稻(Neotetraploid rice)、十倍體草莓Fragariaananassa等。但是四倍體蘋果(Malus×homea)和四倍體黎檬Citruslimonia的體型都比二倍體小[11-12]。
銀杏Ginkgobiloba是第四紀冰川運動后遺留下來的裸子植物中最古老的孑遺植物,被稱為“活化石”。從18世紀開始,銀杏從中國經(jīng)過日本和韓國傳到歐洲[13],作為重要的經(jīng)濟樹種廣泛應(yīng)用于日常生產(chǎn)和生活中,在觀賞、食用、生態(tài)、經(jīng)濟、醫(yī)療等方面都具有很高的應(yīng)用價值[14-15]。2016年,通過大規(guī)模流式細胞儀篩查,銀杏的不同倍性在2016年由薩里克大學(xué)Petr教授等[16-17]發(fā)現(xiàn),隨后與其合作,多份倍性材料在中國被發(fā)現(xiàn),也引進了多份資源。其中,銀杏單倍體表現(xiàn)為葉片面積較小,光合作用、糖酵解/糖異生和類黃酮生物合成途徑等的基因集顯著下調(diào)表達,表現(xiàn)為凈光合速率、類黃酮含量也顯著低于二倍體,PAL、PAM和OTM1可能是其類黃酮調(diào)控的樞紐基因[18-19]。
本研究采用DIA定量蛋白質(zhì)組學(xué)技術(shù),開展銀杏天然單倍體和二倍體的蛋白質(zhì)組學(xué)差異分析,以揭示單倍體銀杏種質(zhì)性狀變異的內(nèi)在機制。這是繼銀杏倍性發(fā)現(xiàn)之后,首次對銀杏單倍體進行蛋白質(zhì)組學(xué)探索。
2019年底,從馬薩里克大學(xué)植物園獲得銀杏單倍體‘Rocky’和二倍體‘Maronia’的穗條,接穗長度一致,保留兩芽,于2020年3月在南京林業(yè)大學(xué)銀杏種質(zhì)資源圃中的同一批實生苗砧木上進行嫁接。2021年8月底,此時銀杏功能葉生長成熟,生物量、類黃酮含量等經(jīng)濟性狀表現(xiàn)最旺盛,采集嫁接成活后的單倍體、二倍體的接穗成熟葉片,重復(fù)采樣3次,立即投入液氮中冷凍保存?zhèn)錁印?/p>
選取經(jīng)過iST樣本前處理試劑盒(PreOmics,德國)處理好的樣品,液氮研磨,取適量磨樣,加入50 μL裂解液,在95 ℃、1 000 rpm轉(zhuǎn)速下加熱10 min。待樣品冷卻至室溫,加入胰蛋白酶消化緩沖液,于37 ℃、500 rpm轉(zhuǎn)速下振蕩孵育2 h后,加入終止緩沖液結(jié)束酶解反應(yīng)。再用試劑盒中的iST cartridge進行肽段除鹽,2×100 μL緩沖液洗脫,洗脫后的肽段真空抽干,-80 ℃下保存。
肽段物用緩沖液A(20 mM甲酸銨水溶液,用氨水調(diào)節(jié)pH至10.0)重新溶解后,用Ultimate 300系統(tǒng)(ThermoFisher scientific,MA,USA)連接反向柱(XBridge C18 column,4.6 mm×250 mm,5 μm,(Waters Corporation,MA,USA)進行高pH分離,分離使用的緩沖液B線性梯度為40 min內(nèi)5%升至45%(緩沖液B由80%ACN中加入20 mM甲酸銨,用氨水調(diào)節(jié)pH至10.0)。柱流速維持在1 mL/min,柱溫維持在30 ℃。收集fractio 6個,在真空濃縮儀中干燥,待用。
將除鹽凍干后的肽段重溶于solvent A(0.1%甲酸水溶液)后,經(jīng)由配備在線納噴離子源的LC-MS/MS分析。Orbitrap Lumos質(zhì)譜儀在數(shù)據(jù)依賴采集模式下運行,采集自動在MS和MS/MS間切換。原始數(shù)據(jù)通過Spectronaut X(Biognosys AG)合并,用Uniprot進行搜庫分析。同時,設(shè)置母離子、肽段水平的假陽性率(FDR)都為1%,搜索污染序列庫,判斷樣本是否存在污染,設(shè)置Trypsin酶解。
各樣品加入30 μL solvent A(0.1%甲酸水溶液),制成懸浮液。取出9 μL,加入1 μL 10×iRT肽段,混合,用nano-LC分離,經(jīng)串聯(lián)EASYnLC 1200系統(tǒng)的Orbitrap Lumos質(zhì)譜儀(Thermo Fisher Scientific,MA,USA)分析??偣采蠘? μL(分析柱Acclaim PepMap C18,75 μm×25 cm),在5%~35%的緩沖液B(0.1%甲酸ACN溶液)中梯度分離2 h。柱流量控制在200 nL/min,電噴霧電壓2 kV。質(zhì)譜參數(shù):1)MS掃描范圍350~1 500 m/z,分辨率120 000,AGC target 4e6,最大注入時間50 ms;2)HCD-MS/MS分辨率30 000,AGCtarget 1e6,碰撞能量32,能量增加5%;3)可變窗口采集設(shè)置60個,每窗口串口重疊1 m/z。
采用Biognosys的QuiC軟件對原始質(zhì)譜數(shù)據(jù)進行質(zhì)控;采用Pulsar軟件對DDA采集模式得到的數(shù)據(jù)進行建庫[20]。根據(jù)DDA參考數(shù)據(jù)庫,對得到的DIA數(shù)據(jù)進行蛋白鑒定,差異蛋白GO注釋在http://www.geneontology.org網(wǎng)站,KEGG分析在http://www.kegg.jp網(wǎng)站進行。亞細胞定位使用Wolfpsort(https://www.genscript.com/wolf-psort.html)系統(tǒng),采用String構(gòu)建蛋白質(zhì)互作網(wǎng)絡(luò)[21],使用Cytoscape進行可視化[22],使用GSEA V2.2.4軟件進行蛋白富集分析。
在“1% FDR”過濾標(biāo)準下,統(tǒng)計蛋白及肽段數(shù)量,一共鑒定到27 250條肽段和6 036個蛋白。鑒定到的蛋白質(zhì)所含肽段的數(shù)量分布情況如圖1。從圖1可見,肽段的數(shù)目與蛋白質(zhì)的匹配數(shù)量呈反向關(guān)系,肽段1~10匹配的蛋白質(zhì)數(shù)量依次減少,最多的是1肽段的1 311個,占總鑒定蛋白質(zhì)數(shù)量的22.69%;大于10個肽段的蛋白質(zhì)數(shù)量有571個。
圖1 肽段數(shù)量分布Fig.1 Distribution of number of peptide segments
對6個試驗樣品的蛋白質(zhì)豐度值進行皮爾森(Pearson)相關(guān)性分析,結(jié)果表明重復(fù)樣本之間的皮爾森相關(guān)系數(shù)較高,說明生物學(xué)重復(fù)中存在高度的相關(guān)性,保證了試驗結(jié)果的可靠性(圖2)。
圖2 Pearson相關(guān)系數(shù)熱圖Fig.2 Heat map of Pearson correlation coefficient
本次試驗從單倍體銀杏中鑒定到6 012個蛋白,二倍體銀杏鑒定到6 005個蛋白。其中,有5 981個共有蛋白,31個蛋白是單倍體所特有的,24個蛋白是二倍體所特有的。
以二倍體為對照,選取|log2FC|≥1,F(xiàn)DR<0.05的蛋白作為差異表達蛋白(DEPs),可見在單倍體銀杏中共鑒定出686個差異表達蛋白,其中的397個(占57.87%)蛋白的表達上調(diào),289個(占42.13%)蛋白的表達下調(diào)(圖3)。GO富集分析結(jié)果表明,DEPs富集在137個生物過程(Biological process,BP),38個細胞成分(Cellular component,CC)和78個分子功能(Molecular function,MF)中。進一步分析發(fā)現(xiàn)主要富集于DNA模板的轉(zhuǎn)錄和起始(DNAtemplated transcription,initiation)、葉綠素代謝過程(Chlorophyll metabolic process)、含卟啉化合物的代謝過程(Porphyrin-containing compound metabolic process)(圖4)。
圖3 差異蛋白分析Fig.3 Differential proteins analysis
圖4 差異蛋白GO富集Fig.4 Differential protein GO enrichment
通過KEGG Pathway顯著性富集分析,可了解DEPs參與的最主要生化代謝通路和信號轉(zhuǎn)導(dǎo)途徑。分析顯示,有通路注釋的263個候選蛋白富集在97個KEGG通路中,注釋蛋白數(shù)目最多的通路是代謝途徑(Metabolic pathways),蛋白顯著富集在核糖體(Ribosome),有25個下調(diào)和3個上調(diào)蛋白,其次是單萜生物合成(Monoterpenoid biosynthesis)、角質(zhì)栓質(zhì)和蠟質(zhì)合成(Cutin,suberine and wax biosynthesis)和卟啉與葉綠素代謝(Porphyrin and chlorophyll metabolism)(圖5)。
圖5 差異蛋白KEGG富集Fig.5 Differential protein KEGG enrichment
將篩選出來的差異表達蛋白通過細胞定位來預(yù)測蛋白質(zhì)發(fā)揮功能的運作環(huán)境。由圖6可知,差異蛋白亞細胞定位主要在10個亞細胞區(qū)室中:葉綠體、細胞質(zhì)、細胞核、線粒體、細胞質(zhì)膜、細胞外、液泡膜、細胞骨架、內(nèi)質(zhì)網(wǎng)、過氧物酶。其中,葉綠體和細胞質(zhì)所占的比例大,分別為37%和29%,為差異表達蛋白主要的亞細胞定位分布點;其次是細胞核,線粒體等亞細胞結(jié)構(gòu),這些細胞結(jié)構(gòu)的蛋白表達水平也容易受倍性變化的影響,而這些場所是光合作用、蛋白質(zhì)合成、細胞復(fù)制、活性氧產(chǎn)生的主要場所。
圖6 差異蛋白亞細胞定位Fig.6 Subcellular localization of differential proteins
為進一步揭示銀杏單倍體與二倍體差異蛋白質(zhì)的調(diào)控功能,探究其分子機制,根據(jù)差異富集結(jié)果繪制了蛋白互作網(wǎng)絡(luò)圖(圖7)。由圖7可知,差異蛋白的互作網(wǎng)絡(luò)涉及26個蛋白的226條相互作用關(guān)系,分布在3個代謝通路上。其中,大部分蛋白屬于核糖體(Ribosome)通路,F(xiàn)AR5與CYP86B1屬于角質(zhì)、栓質(zhì)和蠟質(zhì)合成(Cutin,suberine and wax biosynthesis)通路,CBR3與MNR1屬于單萜生物(Monoterpenoid biosynthesis)合成通路。角質(zhì)、栓質(zhì)和蠟質(zhì)合成通路與單萜生物合成通路通過CYP86B1互作。核糖體通路中3個蛋白質(zhì)上調(diào),其余19個蛋白質(zhì)均下調(diào),說明核糖體代謝通路互作的蛋白質(zhì)表達量下降。
圖7 差異蛋白互作網(wǎng)絡(luò)Fig.7 Interaction network diagram of differential proteins
GSEA富集分析能彌補傳統(tǒng)富集分析對微效蛋白的有效信息挖掘不足等問題,可以更全面地解釋功能通路的調(diào)節(jié)作用。為此,本研究對單倍體銀杏中上調(diào)表達的蛋白質(zhì)進行了GSEA-KEGG富集分析,發(fā)現(xiàn)氨基酸的生物合成(Biosynthesis of amino acids)、代謝途徑(Metabolic pathways)和次生代謝物合成(Biosynthesis of secondary metabolites)3條代謝通路被富集,且均顯示出上調(diào)表達的趨勢(圖8);此外,還發(fā)現(xiàn)代謝途徑、碳素代謝(Carbon metabolism)、次生代謝物合成和內(nèi)質(zhì)網(wǎng)蛋白加工(Protein processing in endoplasmic reticulum)4條在單倍體銀杏中下調(diào)表達的富集蛋白質(zhì)(圖9)。
圖8 上調(diào)蛋白GSEA分析Fig.8 GSEA of up-regulated DEPs
圖9 下調(diào)蛋白GSEA分析Fig.9 GSEA of down-regulated DEPs
代謝途徑、次級代謝產(chǎn)物的生物合成途徑的富集差異蛋白在上調(diào)、下調(diào)表中均有富集,是銀杏單倍體蛋白組的重要調(diào)控特征。
蛋白質(zhì)組是基因表達的直接產(chǎn)物,執(zhí)行細胞的生物功能并體現(xiàn)蛋白質(zhì)的表達規(guī)律[23],蛋白質(zhì)組學(xué)的研究有助于揭示研究對象的特殊形態(tài)和性狀的相應(yīng)機制。最近,將蛋白質(zhì)組學(xué)技術(shù)應(yīng)用于白花泡桐Paulowniafortunei四倍體、青楊‘哲引3號楊’(P.pseudosimonii×nigra)ב北京楊’(P.×beijingensis)雜種三倍體、橡膠樹Hevea brasiliensis四倍體等[24-26],林木單倍體的研究少,數(shù)據(jù)庫不完整,對銀杏單倍體進行蛋白質(zhì)表達特性研究具有重要的科學(xué)意義。
植物倍性變化后往往能引起生理代謝物質(zhì)含量和成分的改變[27],已有轉(zhuǎn)錄組研究發(fā)現(xiàn),單倍體銀杏的類黃酮含量較二倍體低,差異基因在類黃酮生物合成通路中下調(diào)表達[18]。蛋白質(zhì)組研究結(jié)果表明,銀杏單倍體差異蛋白主要富集于代謝途徑、次級代謝產(chǎn)物的生物合成中。本研究發(fā)現(xiàn)的蛋白質(zhì)組變化趨勢與生理指標(biāo)與轉(zhuǎn)錄水平表達的變化趨勢是一致的,從蛋白組學(xué)角度闡明了銀杏單倍體的類黃酮含量低的機理。
單倍體一般表現(xiàn)為葉片窄薄、色淺等[28],冬棗Ziziphusjujube單倍體與其二倍體對比就表現(xiàn)為葉片窄薄,葉色淺且生長緩慢[28]。葉綠體的發(fā)育是影響葉色的最主要因素之一,葉綠體中葉綠素改變會導(dǎo)致葉色發(fā)生變化,從而影響到光合作用。已有研究發(fā)現(xiàn),單倍體銀杏的葉面積(7.9±0.5 cm2)顯著小于二倍體(17.6±1.1 cm2),單倍體銀杏光合作用的凈光合速率顯著低于二倍體[18]。本研究進一步發(fā)現(xiàn),差異蛋白定位主要集中在葉綠體中,而蛋白質(zhì)的功能與其在細胞中的亞細胞定位密切相關(guān)[30],認為是銀杏單倍體葉片葉綠體中的蛋白質(zhì)影響了葉色。
核糖體由核糖體蛋白與核糖體RNA共同組成,負責(zé)蛋白質(zhì)的合成,與DNA修復(fù)和調(diào)控細胞分裂、增殖、分化有關(guān)。單倍體銀杏核糖體途徑在差異蛋白質(zhì)互作網(wǎng)絡(luò)表達中下調(diào),表明單倍體銀杏的核糖體途徑受到抑制,可能與單倍體生長勢弱的性狀相關(guān)。在玉米H99、B73單倍體葉片的可溶性糖含量和可溶性蛋白含量的研究中,也表現(xiàn)出這樣的核糖體途徑差異基因表達結(jié)果。
在本試驗的蛋白組學(xué)分析中,獲得了大量的銀杏單倍體差異蛋白質(zhì)信息,但只是對單倍體銀杏最終呈現(xiàn)的蛋白表達量進行定性定量研究,分析了銀杏單倍體的表型及生理差異的調(diào)控機制。事實上,植物倍體差異的生物學(xué)過程受到很多因素影響,如染色質(zhì)重塑、組蛋白變異、翻譯后修飾等[31]。蛋白質(zhì)組學(xué)研究的深入對揭示蛋白質(zhì)的磷酸化、糖基化和甲基化等修飾調(diào)控植物生長發(fā)育至關(guān)重要,都需要在下一步的研究中予以關(guān)注。
利用表觀基因組學(xué)、表型組學(xué)和基因組編輯等方法可以對銀杏單倍體特征進行系統(tǒng)深入研究。選取重要的功能或者通路相關(guān)的蛋白進行研究,探究重要蛋白質(zhì)表達量與植物生長表型、代謝物含量之間的變化關(guān)系以及這些變化關(guān)系在植物體內(nèi)的作用機制,對候選蛋白進行基因克隆和功能驗證,以確定調(diào)控單倍體銀杏的關(guān)鍵蛋白,為基因工程育種提供分子基礎(chǔ)。
單倍體種質(zhì)資源的基因組學(xué)研究正在大力開展,單倍體是基因組測序、序列拼接、演化分析等遺傳學(xué)研究和基因組學(xué)研究的優(yōu)良材料。使用單倍體植物材料破譯復(fù)雜的參考基因組已經(jīng)在馬鈴薯、杜仲和甘蔗等上實現(xiàn),特別是在高度復(fù)雜的基因組樹種中,利用單倍型基因組解析復(fù)雜的性狀調(diào)控機制和調(diào)控位點的精細定位已經(jīng)取得了成功,為銀杏單倍體基因組的破解和應(yīng)用提供了重要參考[6,32]。單倍體是完善銀杏高度雜合、超大巨型基因組的完美材料,通過破譯銀杏單倍體材料的T2T基因組,可以進一步提高銀杏現(xiàn)有的參考基因組的質(zhì)量,有助于研究銀杏的長壽命、高材質(zhì)、優(yōu)景觀,以及珍貴藥用功能成分如黃酮類、萜類、聚戊烯類等的生物代謝與合成機制。
本研究從蛋白質(zhì)組水平分析了銀杏單倍體的蛋白質(zhì)差異表達情況,在銀杏單倍體中鑒定到6 012個蛋白,31個蛋白是單倍體所特有的;獲得686個表達差異蛋白,其中57.87%的蛋白表達上調(diào),42.13%的蛋白表達下調(diào),主要富集在參與代謝途徑、葉綠素代謝過程和核糖體途徑;37%的差異蛋白定位在葉綠體和細胞質(zhì)亞細胞區(qū)域,差異蛋白的互作網(wǎng)絡(luò)涉及26個蛋白的226條相互作用關(guān)系,分布在3個代謝通路上;發(fā)現(xiàn)了核糖體途徑的差異蛋白質(zhì)網(wǎng)絡(luò)作用,GSEA富集表明差異蛋白參與代謝途徑、次級代謝產(chǎn)物的生物合成途徑;單倍體銀杏葉小、類黃酮低等性狀的關(guān)鍵原因是調(diào)控通路如代謝途徑、葉綠素代謝過程和核糖體途徑發(fā)揮作用。