李 穩(wěn),杜晶晶,牟惠冰,王曉敏,周廣燦,2
(1.菏澤學(xué)院農(nóng)業(yè)與生物工程學(xué)院(牡丹學(xué)院),山東 菏澤 274015; 2.菏澤學(xué)院牡丹研究院,山東 菏澤 274015)
超長鏈脂肪酸(Ultra-Long Chain Unsaturated Fatty Acids)是指主鏈碳原子數(shù)≥18個的脂肪酸,在植物的生長發(fā)育中起著重要的作用[1].植物中超長鏈脂肪酸是由錨定在內(nèi)質(zhì)網(wǎng)膜上的脂肪酰-CoA延長酶復(fù)合體催化合成.脂肪酰-CoA延長酶復(fù)合體由四種酶組成,其中β-酮酯酰-CoA合酶(β-Ketoacyl-CoA Synthase, KCS)是催化超長鏈脂肪酸碳鏈延長反應(yīng)的限速酶,并控制著合成超長鏈脂肪酸的種類[2-5].編碼β-酮酯酰-CoA合酶的基因家族被命名為KCS基因家族.KCS基因在植物中起源極早,而且從綠藻類植物中的單拷貝狀態(tài)通過基因復(fù)制擴(kuò)張成為被子植物中20~30個成員的基因家族[6].隨著基因的復(fù)制及不同基因拷貝上變異的積累,KCS家族基因成員發(fā)生了功能的分化,表現(xiàn)出合成產(chǎn)物的特異性[7-9],并且具有組織與器官的表達(dá)特異性[10-11].
牡丹(PaeoniasuffruticosaAndr.)為芍藥科(Paeoniaceae)芍藥屬(Paeonia)多年生落葉灌木.作為中國的國花,牡丹既是一種極具觀賞性的花卉,又是一種食材和藥材[12].此外,油用牡丹產(chǎn)油率高,富含亞麻酸、亞油酸和油酸等超長鏈不飽和脂肪酸,是一種優(yōu)質(zhì)的木本油料作物[13-14].目前關(guān)于牡丹中超長鏈脂肪酸合成的研究以及牡丹基因組中KCS家族基因的存在情況及其分子演化特征研究的較少.因此,本文運用基礎(chǔ)生物信息學(xué)的方法,從牡丹基因組中鑒定其編碼的KCS家族基因,分析和預(yù)測KCS基因在牡丹進(jìn)化過程中的演化特征,探討牡丹籽油富含不飽和脂肪酸的分子基礎(chǔ),為后期油用牡丹的分子遺傳育種提供理論指導(dǎo).
在國家基因庫生命大數(shù)據(jù)平臺(China National GeneBank DataBase, CNGBdb)下載牡丹(Paeoniasuffruticosa)基因組測序、組裝和注釋文件(https://db.cngb.org/search/project/CNP0000281/)[15].
1.2.1 牡丹KCS基因的鑒定
參考Guo等人[6]的方法鑒定牡丹基因組中KCS基因.鑒定采用基于隱馬爾科夫模型(Hidden Markov Models)的HMM search和本地BLAST(Basic Local Alignment Search Tool)兩種方法鑒定牡丹中的KCS基因.首先以Pfam(http://pfam.sanger.ac.uk/)數(shù)據(jù)庫中KCS基因的3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C結(jié)構(gòu)域 (Pfam: PF08541)和Type Ⅲ polyketide synthase-like結(jié)構(gòu)域 (Pfam: PF08392)的HMM 模型作為問詢序列,對牡丹基因組中注釋的蛋白序列進(jìn)行第一輪搜索,參數(shù)設(shè)定為程序默認(rèn).同時,使用KCS基因編碼的氨基酸序列對牡丹基因組中注釋的蛋白質(zhì)序列進(jìn)行BLASTp 搜索,E-value設(shè)為1.最后將HMM search和BLAST 方法獲得的序列整合并去除重復(fù)序列后,提交在線Pfam(http://pfam.sanger.ac.uk/)進(jìn)一步驗證是否每條序列中都存在3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C結(jié)構(gòu)域和Type Ⅲ polyketide synthase-like結(jié)構(gòu)域(E-value 設(shè)為0.0001).
1.2.2 牡丹KCS基因編碼蛋白質(zhì)的理化性質(zhì)分析
對獲得的牡丹KCS基因,利用 ProtParam(http://web.expasy.org/protparam/)對其編碼氨基酸序列的理化性質(zhì)進(jìn)行預(yù)測,包括氨基酸長度、分子質(zhì)量、等電點和不穩(wěn)定系數(shù)等.
1.2.3 KCS基因序列比對和系統(tǒng)演化樹的構(gòu)建
運用ClustalW軟件,參數(shù)設(shè)定為默認(rèn)值對提取得到的氨基酸序列進(jìn)行排序,隨后使用MEGA6.0軟件進(jìn)行手動校正以提高序列文件質(zhì)量.最后使用Phyml程序中Maximum likelihood(ML,最大似然法)進(jìn)行系統(tǒng)發(fā)育分析.以擬南芥(Arabidopsis thaliana)的KCS基因為參考序列,構(gòu)建牡丹KCS基因的演化關(guān)系樹.內(nèi)部節(jié)點的可靠性使用SH-aLRT(Shimodaira-Hasegawa approximate likelihood ratio test)計算方法進(jìn)行評估[16].
1.2.4 牡丹KCS基因編碼蛋白質(zhì)的結(jié)構(gòu)域和保守基序分析
利用在線軟件https://www.ebi.ac.uk對鑒定的牡丹KCS基因編碼蛋白質(zhì)中的3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C結(jié)構(gòu)域和Type Ⅲ polyketide synthase-like結(jié)構(gòu)域分析并記錄它們的大小和位置.通過在線軟件MeMe(http://meme.nbcr.net/meme/intro.html)分析牡丹KCS基因的保守氨基酸基序,參數(shù)預(yù)測數(shù)目設(shè)為10,其他參數(shù)均為默認(rèn)設(shè)置,觀察保守基序在 MADS-box 基因上的分布位置.
通過HMM和BLASTp搜索在牡丹基因組中共鑒定出13個KCS基因.它們編碼蛋白質(zhì)的氨基酸數(shù)目差異較大(見表1),例如:psu.T.00030776.1中含有274個氨基酸,而psu.T.00028502.1中含有967個氨基酸.在這13個KCS基因編碼的蛋白質(zhì)中,psu.T.00023496.1的等電點最低(5.63),其余編碼蛋白質(zhì)的等電點較高,其中psu.T.00007518.1的最高為9.52.psu.T.00007518.1、psu.T.00020981.1、psu.T.00030776.1、psu.T.00030825.1和psu.T.00031480.1的不穩(wěn)定系數(shù)均大于40,為不穩(wěn)定蛋白,其余均為穩(wěn)定蛋白.
表1 牡丹基因組中的KCS基因及其編碼蛋白質(zhì)的性質(zhì)
以擬南芥基因組中的KCS基因為參照,利用Maximum likelihood(ML,最大似然法)構(gòu)建牡丹基因組中的KCS基因的系統(tǒng)發(fā)育樹.由圖1可知,演化樹由6個演化分支(Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ和Ⅵ)組成,其中只有演化分支Ⅰ、Ⅱ、Ⅲ和Ⅴ中含有牡丹KCS基因,演化分支Ⅳ和Ⅵ中無牡丹KCS基因.演化分支I中含有psu.T.00024222.1;演化分支Ⅱ中含有psu.T.00002829.1、psu.T.00009670.1、psu.T.00019588.1、psu.T.00020981.1、psu.T.00023496.1和psu.T.00028502.1;演化分支Ⅲ中含有psu.T.00021950.1;演化分支Ⅴ中含有psu.T.00030776.1、psu.T.00030825.1、psu.T.00031480.1、psu.T.00007518.1和psu.T.00007901.1.對演化樹進(jìn)一步分析發(fā)現(xiàn),psu.T.00007901.1的進(jìn)化分支最長,表明該基因的進(jìn)化速率較高.
圖1 牡丹基因組中KCS基因的系統(tǒng)發(fā)育樹
注:以擬南芥基因組中的KCS基因為參照,運用ML法構(gòu)建的演化樹,Bootstrap=1 000.括號中的數(shù)字表示該演化分支中含有的牡丹KCS基因數(shù)目.
牡丹基因組中的13個KCS基因均包含3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C結(jié)構(gòu)域和Type Ⅲ polyketide synthase-like結(jié)構(gòu)域,如圖2所示.Type Ⅲ polyketide synthase-like結(jié)構(gòu)域的大小為150~290個氨基酸,3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C結(jié)構(gòu)域的大小為80個氨基酸左右.
圖2 牡丹KCS基因編碼蛋白質(zhì)的功能結(jié)構(gòu)域及位置
KCS基因編碼蛋白質(zhì)序列的保守基序預(yù)測結(jié)果表明,如圖3所示,牡丹KCS基因編碼蛋白序列中的保守基序的種類和數(shù)量是不同的.KCS基因編碼蛋白質(zhì)基序較為相似的KCS基因組成同一或演化關(guān)系較近的演化分支,如圖1和圖3所示,不同演化分支或演化關(guān)系較近的演化分支中KCS基因的相似性較低.其中,牡丹KCS基因psu.T.00007901.1編碼蛋白質(zhì)的保守氨基酸基序數(shù)量最少為3個,與牡丹其他KCS基因成員差別較大,這一結(jié)果與系統(tǒng)演化關(guān)系分析結(jié)果相符.在13個牡丹KCS基因編碼蛋白質(zhì)中均含有motif 1,位于3-Oxoacyl-[acyl-carrier-protein (ACP)]synthase Ⅲ C功能結(jié)構(gòu)域中.此外,該結(jié)構(gòu)域中還有motif 3和motif 10、motif 2、motif 4、motif 5、motif 6、motif 7、motif 8和motif 9分布在Type Ⅲ polyketide synthase-like功能結(jié)構(gòu)域中.
圖3 牡丹KCS 基因編碼蛋白質(zhì)保守基序圖
KCS家族基因在調(diào)控超長鏈脂肪酸合成中起著關(guān)鍵的作用,在多種油料作物中已被發(fā)現(xiàn)和克隆.然而,關(guān)于牡丹基因組中KCS家族基因的存在情況還鮮有報道.本文通過同源比對鑒定牡丹基因組中的KCS基因,并通過生物信息學(xué)相關(guān)軟件對該基因編碼蛋白質(zhì)的理化性質(zhì)、功能結(jié)構(gòu)域和演化關(guān)系等進(jìn)行分析,這些初步分析的結(jié)果有助于該類基因編碼蛋白質(zhì)的功能研究.
牡丹基因組中共含有13個KCS基因,數(shù)目多于最基部植物無油樟(11個)和薔薇分支基部物種葡萄(8個)[6].雖然牡丹基因組中KCS基因的數(shù)目多于無油樟和葡萄,但相對于兩者的基因組大小(無油樟:748 Mb;葡萄490 Mb),牡丹基因組(牡丹:13.8 Gb)中KCS基因的豐度較低.此外,植物基因組中的KCS基因數(shù)量與物種基因組大小無關(guān).例如:模式植物擬南芥的基因組大小為125 Mb,編碼21個KCS基因[17],大豆的基因組大小為1 100 Mb,編碼27個KCS基因[6].十字花科植物蕪菁基因組中KCS基因的數(shù)目是目前已知最多的(31個)[6],但其基因組大小僅為485 Mb.
KCS基因在植物中的起源極早,而且在植物的系統(tǒng)演化過程中逐步擴(kuò)張,從綠藻類植物中的單拷貝狀態(tài)通過基因復(fù)制擴(kuò)張成為被子植物中20~30個成員的基因家族[6].目前對KCS基因家族的研究主要集中在十字花科植物中,通過與擬南芥的21個KCS基因構(gòu)建演化關(guān)系樹,牡丹基因組中的13個KCS基因可組成4個演化分支(如圖1所示),其中演化分支II中含有的KCS基因數(shù)目最多(6個).從結(jié)構(gòu)域和氨基酸基序保守性結(jié)果來看,同一演化分支中的KCS基因結(jié)構(gòu)較相似,推測其功能應(yīng)該較為類似.演化分支Ⅳ和Ⅵ中僅分別含有擬南芥的FAE1-LIKE亞類KCS基因和CER6亞類KCS基因,如圖1所示.2016年,Guo等人研究表明FAE1-LIKE亞類KCS基因是十字花科植物特有的[6],而CER6亞類KCS基因可能在牡丹的演化歷程中發(fā)生了基因丟失.
作為新興的木本油料作物,牡丹種子不但含油量高,而且富含亞麻酸、亞油酸和油酸等超長鏈不飽和脂肪酸.研究牡丹KCS基因的演化特征可以進(jìn)一步發(fā)掘牡丹KCS基因的功能,加深對其脂肪酸合成機(jī)制的了解,為油用牡丹的分子遺傳育種提供一定的理論指導(dǎo).