牛 娜 劉 震 黃鵬翔,3 朱金勇 李志濤 馬文婧 張俊蓮,3 白江平,* 劉玉匯,*
1 甘肅農(nóng)業(yè)大學農(nóng)學院,甘肅蘭州 730070;2 甘肅省干旱生境作物學重點實驗室 / 甘肅省作物遺傳改良與種質(zhì)創(chuàng)新重點實驗室,甘肅蘭州 730070;3 甘肅農(nóng)業(yè)大學園藝學院,甘肅蘭州 730070
糖基轉(zhuǎn)移酶家族(glycosyltransferase,GTs)是專門負責催化糖基化反應(yīng)的酶類,它們將活性糖基從糖基供體轉(zhuǎn)移到糖基受體,并形成糖苷鍵,產(chǎn)物包括寡糖、多糖、各種復合糖(糖蛋白、糖脂)和多種多樣的糖苷化合物(如花色苷、黃酮糖苷、白藜蘆醇糖苷等)[1]。根據(jù)蛋白氨基酸序列的相似性,GTs被分為100多個亞家族[2]。其中一些家族的結(jié)構(gòu)特征及其功能有被報道。Yin等[3]研究發(fā)現(xiàn),糖基轉(zhuǎn)移酶家族8 (GT8)基因家族的蛋白含有一個Glyco-transf-8結(jié)構(gòu)域(約256個氨基酸),其中一些GT8基因參與植物細胞壁的生物合成。
半乳糖基轉(zhuǎn)移酶基因(GAUT)屬于GT8基因家族,它編碼的半乳糖醛酸轉(zhuǎn)移酶(GAUT,alphagalacturonosyltransferase, EC2.4.1.43)與果膠和半纖維素生物合成密切相關(guān)[4-5]。Sterling等[6]在擬南芥中共鑒定出15個GAUT家族成員,分為3個分支:GAUT-A(AtGAUT1~AtGAUT7)、GAUT-B (AtGAUT8~AtGAUT11)和GAUT-C (AtGAUT12~AtGAUT15)。Mohnen等[7]研究表明,GAUT1是參與果膠合成的半乳糖醛酸轉(zhuǎn)移酶。GAUT4沉默的番茄植株果實表現(xiàn)出果膠成分的改變,積累的淀粉減少,果膠的數(shù)量減少,除其在果膠生物合成中的作用外,GAUT4還干擾了碳的代謝和分配[5]。GAUT13與GAUT14位于高爾基體中,參與了植物的發(fā)育過程,例如促進了花粉管壁和營養(yǎng)體細胞壁中果膠和木聚糖的合成[8]。GbGAUT32和GbGAUT04在海島棉纖維發(fā)育過程中發(fā)揮著重要作用[9]。然而,GAUT基因在馬鈴薯中的功能尚不明確。鑒于GAUT基因在植物生長發(fā)育中發(fā)揮重要的作用,本研究從馬鈴薯全基因組水平對GAUT基因家族成員的數(shù)目、染色體上的分布特征、基因結(jié)構(gòu)、理化性質(zhì)、蛋白質(zhì)保守結(jié)構(gòu)域的組成和基因間的親緣關(guān)系進行了全面的鑒定和分析,同時利用RNA-seq數(shù)據(jù)篩選出可能參與雙單倍體馬鈴薯DM的不同器官發(fā)育和響應(yīng)非生物脅迫的StGAUT基因,并進一步對3個不同顏色馬鈴薯品種的薯皮及薯肉中的StGAUT基因表達進行分析,獲得了可能參與花色素苷生物合成的StGAUT基因,旨在為進一步研究GAUT基因家族成員的功能提供理論基礎(chǔ)。
研究材料為3種不同顏色的馬鈴薯品種,包括‘黑美人’ (紫皮紫肉)、‘新大坪’ (白皮白肉)和‘鈴田紅美’ (紅皮紅肉)。所有試驗材料在甘肅省定西市農(nóng)業(yè)科學研究院試驗田種植。每個品種取6個新鮮塊莖(直徑約4~5 cm),蒸餾水沖洗干凈后,用手術(shù)刀將塊莖薯皮分離取樣,距離薯皮組織至少5 mm取薯肉,并將薯肉切成薄塊。樣品立即冷凍在液氮中,存放在-80℃的冰箱中以備使用。
馬鈴薯基因組信息、蛋白質(zhì)和CDS序列及染色體位置等信息均下載自在線數(shù)據(jù)資源(PGSC, https://solanaceae.plantbiology.msu.edu/pgsc_download.shtml)。采用2種方法鑒定馬鈴薯GAUT家族成員:(1) 在Pfam數(shù)據(jù)庫(http://pfam.xfam.org/)下載GAUT保守結(jié)構(gòu)域(PF01501)作為模板序列,利用HMM3.0(http://hmmer.org/download.html)比對,得到可能含有該保守結(jié)構(gòu)域的候選成員。(2) 采用BLASTP方法[10](閾值設(shè)為E≤1e-5):利用已知的15個擬南芥AtGAUT成員[6]氨基酸序列,在馬鈴薯全基因組(PGSC_DM_4.03)范圍內(nèi)進行比對以獲取StGAUT成員。將上述2種比對方法獲得的候選成員去除重復,進一步利用在線網(wǎng)站SMART (http://smart.emblheidelberg.de/)和NCBI (https://www.ncbi.nlm.nih.gov/)刪除不含或者缺失GAUT結(jié)構(gòu)域的候選成員,最終獲得馬鈴薯GAUT基因家族成員。
使用Expasy網(wǎng)站(https://www.expasy.org/vg/index/Protein)計算StGAUT成員的氨基酸數(shù)量、蛋白質(zhì)分子量(molecular weight,MW)和理論等電點(isoelectric point, pI)[11-12]。利 用CELLO網(wǎng) 站(http://cello.life.nctu.edu.tw/)對蛋白質(zhì)進行亞細胞定位預測[13]。使用MEME程序(http://meme-suite.org/tools/meme)分析所有StGAUT蛋白序列中的基序(motif),參數(shù)如下:最大基序數(shù)設(shè)為10,最佳序列寬度為50~100個氨基酸殘基,任意重復次數(shù)[14]。利用Gene Structure Display Server (GSDS 2.0 https://gsds.cbi.pku.edu.cn/)[15]圖形化顯示StGAUT的基因結(jié)構(gòu)。
根據(jù)StGAUT家族成員在染色體上的位置信息,利用MapChart軟件繪制StGAUT基因的染色體位置圖和相對距離。StGAUT基因的串聯(lián)重復事件由以下2個條件確定:(1) 短序列的長度覆蓋了長序列的70%以上;(2) 2個對齊序列的相似性大于70%[16-17]。串聯(lián)重復是指2個基因位于同一染色體片段中,距離小于100 kb,且它們之間的基因個數(shù)≤5[18]。用MCScanX分析了馬鈴薯基因的重復事件[19],并用Circis v0.69[20]繪圖。為進一步估計StGAUT的重復事件,使用KaKs calculator 2.0[21]計算非同義替換率(Ka)和同義替換率(Ks)。
利用ClustalW軟件對新鑒定的馬鈴薯GAUT氨基酸序列以及已知的15個擬南芥GAUT氨基酸序列[6]進行多序列比對,利用MEGA7.0軟件[22]構(gòu)建無根系統(tǒng)發(fā)育樹(最大似然法和1000次迭代bootstrap測試)。
采用RNA提取試劑盒DP419 (天根生化科技(北京)有限公司)提取總RNA,之后利用瓊脂糖凝膠電泳和Nanodrop ND-2000 (Nanodrop Technologies,美國)分光光度計檢測RNA的完整性和濃度。使用帶有g(shù)DNase的快速RT試劑盒KR116 (天根生化科技(北京)有限公司)進行基因組DNA污染的消除和第一鏈cDNA的合成。使用(天根生化科技(北京)有限公司)的SuperReal PreMix Plus (SYBRGreen FP205)試劑盒在CFX96 (Bio-Rad,美國)上進行qPCR,采用3次生物學重復。反應(yīng)體系為20 μL,包含2 μL cDNA (50 ng μL-1)、上下引物(10 μmol L-1)各0.6 μL、2×SYBRGreen MasterMix 10 μL、ddH2O 6.8 μL。qPCR反應(yīng)條件為95℃預變性30 s;95℃變性下5 s,60℃退火30 s,40個循環(huán);65~95℃條件下檢測熔點曲線。通過分析cDNA梯度稀釋的標準曲線獲得每個基因的擴增效率,利用2–ΔΔCt方法計算基因的相對表達水平,以StEF-1α(AB061263)作為內(nèi)參基因[23],使用Origin 2018繪圖。由生工生物工程(上海)股份有限公司設(shè)計并合成引物,引物名稱及序列詳見表1。
表1 qPCR引物序列Table 1 Primers for qPCR used in this study
利用PGSC的Illumina RNA-seq數(shù)據(jù),分析DM馬鈴薯中的StGAUT基因在非生物脅迫下(鹽處理:150 mmol L-1NaCl;甘露醇誘導干旱脅迫處理:260 μmol L-1甘露醇;熱處理:35℃)和不同組織(未成熟果實、成熟果實、心皮、花瓣、葉柄、花、匍匐莖、雄蕊、萼片、塊莖、芽、根和葉)中的表達模式。使用TBtools軟件繪制表達量的熱圖[24]。
對3個不同顏色馬鈴薯品種‘新大坪’、‘黑美人’和‘鈴田紅美’薯皮和薯肉的18個樣品進行RNA-seq文庫的構(gòu)建,利用Ilumina HiSeq高通量測序平臺對構(gòu)建的cDNA文庫進行測序,由百邁客生物科技有限公司負責完成RNA-seq文庫的構(gòu)建和測序。測序獲得的Raw date提交至NCBI (Project ID PRJNA 541919)。
以RNA-seq數(shù)據(jù)為基礎(chǔ),分析StGAUT基因在‘新大坪’的皮和肉(XDS、XDF)、‘黑美人’的皮和肉(HMS、HMF)以及‘鈴田紅美’的皮和肉(LTS、LTF)中的表達。
通過生物信息學方法共鑒定出44個候選StGAUT基因,利用Smart和NCBI在線軟件剔除不含完整Glyco_transf_8保守結(jié)構(gòu)域的序列,最終確定出41個StGAUT家族成員。
由染色體定位(圖1)可知,40個StGAUT基因(PG0004427尚未定位)不均勻地分布在10條染色體上,其中1號和2號染色體上StGAUT基因分布最多(分別為8個),4號染色體次之(7個),而在8號和11號染色體上沒有StGAUT基因的分布。1號、3號、4號、7號染色體上的StGAUT基因主要分布在染色體的遠端。
由圖2可知,55個GAUT (除At2G38650外)共分為4個亞組,其中有11個StGAUT屬于8亞組,12個StGAUT屬于C II亞組,7個StGAUT和4個AtGAUT屬于C III亞組,11個StGAUT和10個AtGAUT屬于C IV亞組。C I、C II亞組中只包含StGAUT。
由表2可知,StGAUT家族成員的氨基酸長度和理化性質(zhì)存在較大的差異。這些蛋白質(zhì)的氨基酸殘基長度為90個(PG0012098)至688個氨基酸(PG0000010),分子量為10,714.47 kD (PG0012098)至78,728.64 kD (PG0014677),等電點(pI)的范圍為5.48 (PG0003522)到10.39 (PG0012098)。10個(PG0003522、PG0015490、PG0001183、PG0016880、PG0046135、PG0005216、PG0010088、PG0024800、PG0014401、PG0024623) GAUT氨基酸序列理論等電點在酸性范圍內(nèi),其余都在堿性范圍內(nèi),說明StGAUT蛋白質(zhì)分子富含堿性氨基酸。同時,利用在線軟件CELLO v.2.5對41個家族成員的進行亞細胞定位預測發(fā)現(xiàn),4個家族成員定位于細胞核中,17個位于細胞膜中,11個位于線粒體中,6個位于細胞質(zhì)中,3個位于細胞外。
表2 StGAUT基因家族理化性質(zhì)及亞細胞定位Table 2 Physicochemical properties and subcellular location of StGAUT gene family
(續(xù)表2)
對41條StGAUT基因的氨基酸序列進行系統(tǒng)進化樹分析(圖3-A),將其分為4個亞組,C I、C II、C III、C IV亞組,分別包含11個、12個、7個和11個基因。基因結(jié)構(gòu)圖(圖3-B)顯示,7個StGAUT基因不含內(nèi)含子,9個StGAUT基因只含有1個內(nèi)含子,6個StGAUT基因含有2個內(nèi)含子,其余基因含有3~9個內(nèi)含子。此外,同一亞組的StGAUT基因表現(xiàn)出相似的基因結(jié)構(gòu)。
使用在線MEME程序?qū)tGAUT成員的氨基酸序列進行分析發(fā)現(xiàn),StGAUT結(jié)構(gòu)域存在多種組成形式,如motif 1和motif 2、motif 3和motif 5。motif 3主要位于GAUT的C端,motif 1主要位于GAUT的N端。由圖3-C可知,一個亞組中的大部分StGAUT具有相似的motif組成,motif 5、motif 8、motif 9為C II亞組所特有,motif 10是C IV亞組所特有的??偟膩碚f,一個亞組成員的motif組成相對保守,基因結(jié)構(gòu)則較為相似,可以進一步證明進化分析的可靠性。
在植物基因組進化中,串聯(lián)重復和片段重復有助于擴展基因家族的新成員和新功能。為研究StGAUT基因的重復事件,本研究分析了StGAUT基因家族中的片段重復和串聯(lián)重復,共鑒定出12對片段重復基因(21/41,56.09%),其中2號染色體上的片段重復基因最多,共有6個片段重復基因(圖4和表3)。每一對片段重復基因均屬于同一亞組,其中C I亞組的片段重復基因最多(5對)。表明,片段復制在StGAUT基因家族的擴展中發(fā)揮著重要作用。
非同義替換率(Ka)和同義替換率(Ks)是評價重復事件正向選擇壓力的基礎(chǔ)。Ka/Ks值為1表示自然選擇,Ka/Ks<1表示純化選擇,Ka/Ks>1表示正選擇。重復基因的結(jié)果表明,片段重復基因Ka/Ks在0.0330~0.8173之間,平均值是0.2199。所有重復事件基因的Ka/Ks值均小于1,說明這些基因均在純化選擇的作用下進化(表3)。
表3 StGAUT片段重復基因的Ka/Ks比值Table 3 Ka/Ks ratios of tandemly and segmentally duplicated StGAUT
由圖5可知,PG0000827、PG0017341、PG0020 103、PG0024800在所有的組織中表達量均很高(FPKM>5),PG0018996、PG0018997在所有的組織中均低表達(FPKM<2)。一些StGAUT基因表現(xiàn)出組織特異性的表達模式,例如PG0007896在雄蕊中特異性高表達(FPKM>100);PG0001396和PG0001444在匍匐莖中高表達(FPKM>80);PG0003843只在雄蕊和成熟的花中特異性表達(FPKM>30),而在其他的組織中則完全不表達(FPKM=0)。
為研究StGAUT基因?qū)Ψ巧锩{迫的響應(yīng),進一步分析了鹽脅迫(150 mmol L-1NaCl)、干旱脅迫(260 μmol L-1甘露醇)和熱脅迫(35℃)下StGAUT的表達模式(圖6)。結(jié)果表明,與對照相比,在鹽脅迫、干旱脅迫和熱脅迫處理下,分別有5個、6個、14個StGAUT基因差異表達(FPKM>1和|log2FC|>1),其中4個StGAUT基因(PG0001396、PG0005216、PG0012098和PG0022608)在3種非生物脅迫下均差異表達,2個StGAUT基因(PG0008015、PG0007896)在2種非生物脅迫下差異表達,9個StGAUT基因只響應(yīng)一種非生物脅迫。這些StGAUT可能參與了馬鈴薯對非生物脅迫的響應(yīng),值得我們進一步研究。
由圖7可知,在薯皮中有6個StGAUT基因不表達(FPKM=0),5個StGAUT基因表達水平較低(FPKM<1)。與‘新大坪’的白色薯皮(XDS)相比,有6個StGAUT基因在紅色和紫色薯皮中差異表達(FPKM>1和|log2FC|>1),其中4個StGAUT基因在彩色薯皮中上調(diào)表達,PG0005216、PG0007896和PG0027950在‘黑美人’的紫色薯皮(HMS)中上調(diào)表達,PG0008015在‘鈴田紅美’的紅色薯皮(LTS)中上調(diào)表達;2個StGAUT基因在彩色薯皮中下調(diào)表達,其中PG0024782在HMS和LTS中下調(diào)表達,PG0017341只在HMS中下調(diào)表達。
在薯肉中有4個StGAUT基因未表達(FPKM=0),11個StGAUT基因的FPKM值小于1。與‘新大坪’的薯肉(XDF)相比,在‘黑美人’的薯肉(HMF)和‘鈴田紅美’的薯肉(LTF)中,分別有5個和8個StGAUT基因表達上調(diào)(FPKM>1和|log2FC|>1),其中2個基因(PG0020103、PG0024800)在HMF和LTF均上調(diào)表達,3個基因(PG0011872、PG0016880、PG0027950)在HMF中上調(diào)表達,6個基因(PG0001388、PG0003522、PG0024623、PG0024824、PG0025139、PG2003179)在LTF中上調(diào)表達。此外,與XDF相比LTF中有2個基因(PG0022608、PG0001396)下調(diào)表達(FPKM>1和|log2FC|>1),這2個基因都屬于C I亞組。
為驗證RNA-seq數(shù)據(jù)的可靠性,我們選取了8個在彩色馬鈴薯薯皮和薯肉中FPKM值較高的StGAUT基因進行qPCR分析(圖8)。結(jié)果表明,qPCR表達模式與RNA-Seq數(shù)據(jù)集一致,彩色馬鈴薯品種RNA-seq數(shù)據(jù)集與qPCR的線性關(guān)系為y=1.7097x+0.3585,R2= 0.8268,呈現(xiàn)了較高的相關(guān)性。
本研究對馬鈴薯GAUT基因家族進行了全基因組分析,共鑒定了41個StGAUT,多于擬南芥(15個)、番茄(17個)和棉花(37個) GAUT基因家族成員。分析了馬鈴薯和擬南芥的GAUT基因之間的進化關(guān)系,以鑒定StGAUT基因的進化和可能的功能。進一步分析了StGAUT基因成員的基因結(jié)構(gòu)、保守基序組成、染色體定位和基因重復事件,以及GAUT基因在馬鈴薯不同組織部位、非生物脅迫下和彩色馬鈴薯品種薯皮和薯肉中的表達模式。對StGAUT基因的功能分化有了更深入的了解,為進一步研究馬鈴薯基因家族提供了綜合信息。
StGAUT基因家族發(fā)生了擴張,可能是導致StGAUT基因家族比擬南芥和番茄的龐大的原因。串聯(lián)重復和片段復制是植物基因家族擴張的主要方式[25]。這些基因通過串聯(lián)重復和片段復制保留在植物基因組中,在對環(huán)境刺激的適應(yīng)性反應(yīng)中起重要作用[26-27]。本研究發(fā)現(xiàn),片段重復是StGAUT基因家族主要的擴張方式。我們對StGAUT基因家族中的基因重復事件進行分析,共鑒定出12對片段重復基因,大多片段重復基因位于C I亞組,并且在2號染色體上的片段重復基因最多。因此,片段重復可能對StGAUT基因家族的擴張起主導作用。
基因重復事件中一些正在進化的新成員可能失去其原有的功能成為偽基因,或獲得新功能已增強植物適應(yīng)性[28]。在本研究中,我們發(fā)現(xiàn)了一些片段重復基因,存在截然不同的表達模式,如PG0003522和PG0015490是一對片段重復基因,PG0003522在LTF中 上 調(diào) 表 達(FPKM>1和|log2FC|>1),而PG0015490在LTF中則完全不表達(FPKM=0)。PG0001396和PG0022608是一對片段重復基因,它們在鹽脅迫和干旱脅迫下均上調(diào)表達。
我們可以通過了解已知家族成員的功能來確認直系和旁系同源基因的功能,因為同一個亞組成員可能具有共同的進化起源和保守功能。根據(jù)系統(tǒng)發(fā)育比較分析,一些StGAUT基因與AtGAUT基因的直系同源物在不同的亞組中聚集在一起。例如,PG0019228、PG0014401與GAUT12(At5G54690)聚集在一起,表明可能參與細胞壁多糖的合成。PG0020103、PG0001388、PG0024824、PG0024623與GAUT8(AT3G25140)、GAUT9(At3G02350)、GAUT10(At2G20810)、GAUT11(At1G18580)聚集在一起,表明可能參與果膠或木聚糖的生物合成[29]。通過對外顯子和內(nèi)含子的研究,有助于我們進一步了解家族成員基因結(jié)構(gòu)和功能的差異[30]。StGAUT基因家族的外顯子數(shù)量介于1~10之間,且位于同一分支的StGAUT基因具有相似的外顯子數(shù)量和排列模式。StGAUT蛋白保守結(jié)構(gòu)域也表現(xiàn)出類似的結(jié)果。說明同一亞組內(nèi)的成員較為保守。
基因的組織特異性表達可初步預測其相應(yīng)的功能[31]。通過對StGAUT基因在馬鈴薯不同組織中的表達譜分析發(fā)現(xiàn),有的基因只在某一組織中表達,例如PG0003843和PG0014637是C I亞組中同一簇的一對片段重復基因,他們均在雄蕊和成熟的花中特異性表達;PG2003179和PG0007896屬于C IV亞組同一簇的一對片段重復基因,它們在雄蕊里面特異性表達。因此,這些基因可能與馬鈴薯雄蕊的生長發(fā)育有關(guān)。Fabiana等[5]研究發(fā)現(xiàn),SlGAUT4基因在發(fā)育器官中的表達水平較高,是決定番茄植株生長和果實產(chǎn)量的關(guān)鍵。與SlGAUT4同源的馬鈴薯PG0027227在花瓣中特異性表達,說明PG0027227可能與馬鈴薯植株生長發(fā)育有關(guān)。AtGAUT12(At5G 54690)參與擬南芥細胞壁多糖的合成[32],在本研究中,與AtGAUT12同源的一對片段重復基因PG0014401和PG0019228在匍匐莖和未成熟的果實中特異性表達,它們的功能有待進一步研究。
GAUT基因參與非生物脅迫的相關(guān)研究尚未見報道。本研究發(fā)現(xiàn)了一些響應(yīng)多種非生物脅迫(鹽、甘露醇、熱)的StGAUT基因,如PG0001396和PG0022608是C I亞組的一對片段重復基因,它們在鹽脅迫和干旱脅迫下均上調(diào)表達(FPKM>1和|log2FC|>1),PG0001396在熱脅迫下上調(diào)表達,而PG0022608則下調(diào)表達。此外,我們發(fā)現(xiàn)34.15%(14/41)的StGAUT基因在熱脅迫下差異表達。這些StGAUT基因可能參與了對非生物脅迫的響應(yīng),它們的功能有待進一步研究。
同時,本研究發(fā)現(xiàn)了一些StGAUT基因可能參與花色素苷的合成,例如一對片段重復基因PG0001396和PG0022608在紅色的薯肉中均下調(diào)表達(FPKM>1和|log2FC|>1),PG0027950在紫色薯皮薯肉中都上調(diào)表達(FPKM>1和|log2FC|>1)。綜上所述,StGAUT基因家族成員可能在馬鈴薯的器官發(fā)育、抵御非生物脅迫和花色素苷的合成方面發(fā)揮著重要的作用。
本研究在全基因組水平上鑒定并分析了41個StGAUT基因,不均勻的分布在10條染色體上。基于高度保守的基因結(jié)構(gòu)和基序,把StGAUT基因劃分為4個亞組。共線性分析表明,片段重復事件在StGAUT基因家族的擴展中起著至關(guān)重要的作用。根據(jù)Ka/Ks比率,這些基因?qū)υ诩兓x擇下進化。