郝青婷,劉寶玲,吉夏潔,李潤植,薛金愛
(山西農(nóng)業(yè)大學(xué)分子農(nóng)業(yè)與生物能源研究所,山西太谷030801)
陸地棉KASII酶蛋白結(jié)構(gòu)分析
郝青婷,劉寶玲,吉夏潔,李潤植,薛金愛
(山西農(nóng)業(yè)大學(xué)分子農(nóng)業(yè)與生物能源研究所,山西太谷030801)
β-酮脂酰-ACP合成酶II(KASII)(EC:2.3.1.179)是控制植物細(xì)胞脂肪酸合成和16C與18C脂肪酸比值的關(guān)鍵酶,亦是植物油脂代謝修飾的分子靶標(biāo)。應(yīng)用基因組學(xué)分析工具從陸地棉(Gossypium hirsutum)基因組鑒定獲得一個與已知KASII高度同源的棉花KASII基因GhKASII,編碼576個氨基酸肽鏈,其分子量為61.8 kDa,理論等電點為8.83。蛋白結(jié)構(gòu)預(yù)測分析顯示,GhKASII蛋白為可溶性酶蛋白,具有質(zhì)體轉(zhuǎn)運肽,定位于質(zhì)體中;GhKASII蛋白二級結(jié)構(gòu)主要形式為α-螺旋(32.99%)和無規(guī)則卷曲(36.63%)。3D結(jié)構(gòu)模擬表明,GhKASII蛋白為同源二聚體,由2個相同的亞基構(gòu)成,空間構(gòu)型為緊密的心形結(jié)構(gòu)。蛋白序列多重比對發(fā)現(xiàn),GhKASII與雷蒙德氏棉、亞洲棉、可可樹的KASII蛋白親緣關(guān)系較近,植物KASII蛋白C端保守性高,N端變異大。GhKASII蛋白保守的酶催化活性域位于318~334位(氨基酸殘基),其關(guān)鍵酶活位點是位于327位的半胱氨酸。研究結(jié)果可為深入解析棉花等油料作物的脂肪酸生物合成機(jī)制及油脂遺傳改良提供科學(xué)參考。
陸地棉;β-酮脂酰-ACP合成酶II(KASII);油脂;生物信息學(xué)
脂肪酸組成決定著植物油脂的理化性質(zhì)和用途。高等植物細(xì)胞中脂肪酸從頭合成主要發(fā)生在質(zhì)體中[1],涉及到一系列酶促反應(yīng)。脂肪酸從頭合成的前體物質(zhì)是乙酰-輔酶A(acetyl-CoA),其在乙酰輔酶A羧化酶(ACCase)催化下合成丙二酰-輔酶A(malonyl-CoA),再進(jìn)一步在丙二酰輔酶A:?;d體蛋白S-丙二?;D(zhuǎn)移酶(MAT)催化下,丙二?;晦D(zhuǎn)移到?;d體蛋白(ACP)上,生成丙二酰-ACP,作為合成脂肪酸的碳供體。丙二酰-ACP經(jīng)脂肪酸合酶復(fù)合體(FAS)催化,進(jìn)行連續(xù)循環(huán)的聚合反應(yīng),每次循環(huán)增加2個碳的?;兼?,直至合成含有ACP的飽和脂肪酸16∶0-ACP和18∶0-ACP,其中,催化16∶0-ACP生成18∶0-ACP的是β-酮脂酰-ACP合成酶II(KASII)。16∶0-ACP生成18∶0-ACP可在?;?ACP硫酯酶(FAT)催化下,將脂肪酸從ACP上釋放出來,再在酰基CoA合成酶(ACS)的作用下生成16∶0-CoA和18∶0-CoA,并從質(zhì)體轉(zhuǎn)出進(jìn)入內(nèi)質(zhì)網(wǎng),參與膜脂和三酰甘油(TAG)等合成。因此,KASII是決定植物細(xì)胞內(nèi)16C和18C脂肪酸比值大小的關(guān)鍵酶。一些研究還顯示,KASII參與植物對低溫環(huán)境的響應(yīng)以及與植物生長發(fā)育狀況密切相關(guān)[2]。然而,高等植物KASII基因突變通常是致死突變,這限制了有關(guān)KASII基因及其編碼蛋白功能的深入研究和在脂質(zhì)代謝工程中的應(yīng)用[3]。
棉花既是優(yōu)異纖維作物,也是重要的油料作物。陸地棉剝殼后棉籽的棉仁油分含量能夠達(dá)到30%~40%,棉籽油有較高的營養(yǎng)價值,是優(yōu)質(zhì)的食用油[4],棉籽油含有豐富的人體所必需的不飽和脂肪酸,如亞油酸(C18∶2)的含量可達(dá)50%以上(54%),是所有食用油中含量最高的;另外還含有油酸(C18∶1,占18%)和亞麻油酸(C18∶3,約占1%)等不飽和脂肪酸。陸地棉棉籽仁中脂肪酸的含量不僅高于油菜和大豆,并且不含有對人體有害的芥酸[5]。棉籽油除了可以用于生活食用油外,還是重要的化學(xué)工業(yè)原料[6],可用于制取生物柴油[7]。解析參與棉花脂肪酸生物合成的關(guān)鍵酶蛋白及其作用機(jī)制,可為棉籽油品質(zhì)改良及油脂產(chǎn)品的開發(fā)提供科學(xué)指導(dǎo)。已有棉花和其他植物KASII基因克隆的報道[1],但對KASII酶蛋白結(jié)構(gòu)特征還知之甚少。新近公布的陸地棉基因組序列[8],為深入研究參與油脂等代謝各類基因及其編碼蛋白的功能奠定了序列平臺。
本研究利用基因組學(xué)工具,從陸地棉基因組中鑒定獲得棉花GhKASII基因,并對編碼酶蛋白的理化性質(zhì)、亞細(xì)胞定位、蛋白序列及3D結(jié)構(gòu)特征、酶活性域和關(guān)鍵酶活位點等蛋白結(jié)構(gòu)信息和系統(tǒng)發(fā)育進(jìn)行了預(yù)測分析,結(jié)果將為未來全面研究棉花GhKASII基因及其編碼蛋白質(zhì)在油脂合成途徑中行使功能的具體分子機(jī)制,以及該酶基因在高值油脂品種培育的代謝工程中應(yīng)用等奠定基礎(chǔ)。
1.1 數(shù)據(jù)來源
在NCBI的Genbank數(shù)據(jù)庫中查找到擬南芥KASII基因(β-酮脂酰-ACP合成酶Ⅱ基因)(Genbank ID:AF318307.1),通過Blastp比對在棉花數(shù)據(jù)庫(https://www.cottongen.org/)中,得到與之高度同源的KASII蛋白序列,并且通過NCBI CDD數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml)鑒定為真正的棉花β-酮脂酰-ACP合成酶Ⅱ蛋白序列(圖1),該蛋白序列將用于后續(xù)分析。
陸地棉KASII基因的cDNA及其蛋白序列(Genbank ID:KF611921.1/AIL53811.1)和另外19個物種的KASⅡ蛋白序列均來源于NCBI(http://www. ncbi.nlm.nih.gov/)中的Genbank數(shù)據(jù)庫,其相應(yīng)的蛋白序列及Genbank號分別為:可可(Theobroma cacao,XP_007012567.2)、亞洲棉(Gossypium arboreum,XP_017620024.1)、雷蒙德氏棉(Gossypium raimondii,XP_012463810.1)、落花生(Arachis duranensis,XP_015972847.1)、紫蘇(Perilla frutescens,AAC04692.1)、桑樹(Morus notabilis,XP_010089666. 1)、麻風(fēng)樹(Jatropha curcas,XP_012077111.1)、葡萄(Vitis vinifera,XP_002276214.1)、向日葵(Helianthus annuus,ABI18155.1)、亞麻薺(Camelina sativa,NP_ 001289900.1)、蓖麻(Ricinus communis,AAA33872. 1)、油棕(Elaeis oleifera,AAF26738.2)、芝麻(Sesamum indicum,XP_011093876.1)、巨桉(Eucalyptus grandis,AAF26738.2)、胡楊(Populus euphratica,XP_011039936.1)、芥菜型油菜(Brassica napus,AA F61739.1)、擬南芥(Arabidopsis thaliana,AAK69603. 1)、大豆(Glycine max,KASIIA,AAW88763.1;KASIIB,AAW88762.1)、紅花(Carthamus tinctorius,AGC65509.1)。
1.2 數(shù)據(jù)分析方法
利用美國國家生物技術(shù)信息中心NCBI的ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)工具在線分析棉花GhKASII基因的ORF[9];利用Ex-Pasy的ProtParam(http://web.expasy.org/protparam/)在線工具分析GhKASII編碼蛋白的氨基酸組成、數(shù)目、蛋白質(zhì)相對分子質(zhì)量、理論等電點、原子數(shù)量和原子組成、半衰期、疏水指數(shù)等理化性質(zhì)[9];通過在線工具Target P 1.1 Server(http://www.cbs.dtu.dk/services/TargetP-1.1/)對該蛋白進(jìn)行亞細(xì)胞定位;使用在線網(wǎng)站TMHMM[10](http://www.cbs.dtu.dk/services/ TMHMM/)和ProtScale(http://web.expasy.org/protsc-ale/)分析其跨膜結(jié)構(gòu)和疏水區(qū);運用SOPMA(http://metadatabase.org/wiki/SOPMA)預(yù)測GhKASII的二級結(jié)構(gòu);使用SWISS-MODEL網(wǎng)站(http://swissmodel.expasy.org/)對GhKASII的三級結(jié)構(gòu)進(jìn)行同源建模,并在Rasmol軟件查看其三維構(gòu)型;使用Genedoc和MEGA6.06軟件對GhKASII和另外19個物種的KASII蛋白進(jìn)行ClustalW多序列比對;并采用鄰接法(Neighbor-Joining,N-J)構(gòu)建無根系統(tǒng)發(fā)育樹,自舉檢驗值設(shè)為1 000個循環(huán),采用p-distance模式。
2.1 陸地棉GhKASII蛋白理化性質(zhì)分析
陸地棉GhKASII基因編碼序列全長為2268bp,使用在線開放閱讀框工具ORF Finder分析,其開放閱讀框(ORF)的長度為1 731 bp,得到的氨基酸序列全長為576個氨基酸,起始密碼子和終止密碼子分別為ATG,TAA。陸地棉GhKASII基因編碼的蛋白質(zhì)含有C,H,O,N,S共5種原子,其分子式為C2702H4270N772O815S37,分子量為61.8 kDa,理論等電點為8.83,摩爾消光系數(shù)為51880,酸性氨基酸有48個,堿性氨基酸有58個,即帶電荷的氨基酸占氨基酸總數(shù)的比例為18.4%。含量較高的氨基酸及其比例分別為Gly,10.1%;Ala,9.7%;Ser,8.9%;Leu,7.5%;Asn,6.1%;Val,5.9%,甲硫氨酸(Met)位于序列的氨基端。該蛋白質(zhì)的不穩(wěn)定指數(shù)為42.36,在生理條件下為不穩(wěn)定蛋白(一般小于40視為穩(wěn)定)。
2.2 陸地棉KASII蛋白的基礎(chǔ)結(jié)構(gòu)分析
經(jīng)過TargetP 1.1分析,陸地棉GhKASII蛋白含有葉綠體轉(zhuǎn)運肽,cTP值為0.818(大于0.73),定位于質(zhì)體中。該蛋白不存在跨膜現(xiàn)象,N端存在葉綠體轉(zhuǎn)運肽剪切位點,說明該蛋白在細(xì)胞質(zhì)核糖體上合成后通過轉(zhuǎn)運肽引導(dǎo)進(jìn)入質(zhì)體中,然后催化16∶ 0-ACP脂酰鏈的羧基端延長為18∶0-ACP。經(jīng)疏水性檢測分析(圖2),結(jié)果發(fā)現(xiàn),該GhKASII多肽鏈中分值最低的氨基酸是Arg精氨酸(-3.222),親水性最強(qiáng);分值最高的是甘氨酸(2.378),疏水性最強(qiáng)。該蛋白有3個明顯的親水區(qū),分別為:121~142位氨基酸,244~263位氨基酸,372~394位氨基酸,與上述GhKASII蛋白的親水性相一致。
2.3 陸地棉KASII蛋白序列的高級結(jié)構(gòu)分析
運用SOPMA在線預(yù)測軟件對棉花KASII蛋白進(jìn)行二級結(jié)構(gòu)的預(yù)測(圖3),構(gòu)成該蛋白質(zhì)二級結(jié)構(gòu)的主要形式為:α-螺旋占32.99%,延伸鏈占20.66%,無規(guī)則卷曲占36.63%,而β-轉(zhuǎn)角所占的比例較少,僅為9.72%。使用在線工具Swiss-model通過同源建模的方式對陸地棉KASII三級結(jié)構(gòu)進(jìn)行預(yù)測(圖4),結(jié)果顯示,陸地棉KASII蛋白的氨基酸序列與模板序列的一致性達(dá)到47.16%,整體呈現(xiàn)為一個緊密的心形結(jié)構(gòu),X-射線晶體衍射發(fā)現(xiàn),該蛋白是同源二聚體,由2個相同的亞基組成。
2.4 陸地棉KASII蛋白的氨基酸多序列比對
使用Genedoc軟件對陸地棉與其他物種KASII蛋白進(jìn)行多序列比對分析,結(jié)果顯示,這些植物的KASII蛋白與陸地棉KASII蛋白均具有較高的同源性,序列一致性可達(dá)到75%以上。結(jié)合Blastp分析表明,與GhKASII蛋白序列相似性最高的是雷蒙德式棉和亞洲棉的KASII序列,相似度為99%,與可可的相似度為90%,其次是亞麻薺,相似度是80%。可見,不同植物的KASII蛋白的功能區(qū)極其保守,但是肽鏈的N端在序列長度和氨基酸組成上有著很大的差異(圖5),且因物種不同而序列差異大小都不相同。在PROSITE數(shù)據(jù)庫中分析GhKASII的氨基酸序列發(fā)現(xiàn),其存在一個酶催化活性區(qū)域,位于318~334位氨基酸(GPNYSISTACATSNFCI),327位的半胱氨酸是關(guān)鍵的酶活位點,已有人在花生的KASII蛋白序列中發(fā)現(xiàn)了相同活性位點的存在[11]。多序列分析結(jié)果發(fā)現(xiàn),所有物種都有該段保守區(qū)段,催化脂肪酸碳鏈的延長。推測,由于β-酮脂酰-ACP合成酶是植物油脂代謝過程中十六碳脂肪酸碳鏈延長的關(guān)鍵催化劑,因此,其序列的穩(wěn)定遺傳性和物種間進(jìn)化趨同性明顯表現(xiàn)出其結(jié)構(gòu)與功能的重要性。
2.5 陸地棉KASII蛋白系統(tǒng)進(jìn)化分析
進(jìn)化樹是在使用MEGA 6.06軟件進(jìn)行Clustal W多序列比對基礎(chǔ)上,運用鄰接法(Neighbor-Joining,即N-J法)設(shè)置,重復(fù)循環(huán)數(shù)為1 000,構(gòu)建系統(tǒng)發(fā)育樹,結(jié)果如圖6所示。依據(jù)系統(tǒng)發(fā)育關(guān)系,從上往下可大體劃分為7組,陸地棉KASII蛋白與同屬錦葵科的亞洲棉、雷蒙德氏棉及梧桐科的可可的KASII蛋白聚類在一起,它們同屬于錦葵目,說明這些KASII蛋白更多參與植物體內(nèi)脂肪酸鏈的延長反應(yīng),在影響植物體內(nèi)不同鏈長脂肪酸的比例方面起著至關(guān)重要的作用。植物間這種序列、結(jié)構(gòu)和功能分化如此明顯的現(xiàn)象與各物種在漫長進(jìn)化過程中適應(yīng)不同環(huán)境、執(zhí)行不同的功能有著密切的聯(lián)系。
β-酮脂酰-ACP合成酶II(KASII)主要存在于植物和細(xì)菌中,是脂肪酸合成途徑中催化16∶0-ACP延長為18∶0-ACP的關(guān)鍵酶,是決定最終油脂成分用途的關(guān)鍵因素。除此之外,脂肪酸可以通過不同代謝途徑形成一組功能相關(guān)、結(jié)構(gòu)各異的化合物,這些化合物可以作為信號分子,控制相關(guān)基因的轉(zhuǎn)錄,調(diào)節(jié)相關(guān)蛋白質(zhì)的表達(dá),從而提高植物對不良環(huán)境的免疫能力,增強(qiáng)植物對傷、病、凍害等脅迫的抗性[12]。目前,關(guān)于KASII研究較多的是擬南芥和油菜[13-15],但國內(nèi)外對它的研究相對較少。本研究對KASII及其編碼的蛋白的結(jié)構(gòu)和理化性質(zhì)的分析和預(yù)測將為深入系統(tǒng)地了解該酶提供一定的參考作用。本研究結(jié)果表明,陸地棉KASII蛋白分子量為61.8 kDa,活性最適pH為8.83,并且含有大量的中性小分子氨基酸,如Gly,Ala和Ser;該蛋白被預(yù)測帶有一個葉綠體轉(zhuǎn)運肽,合成后將進(jìn)入質(zhì)體發(fā)揮作用,是一個非跨膜的親水性蛋白;KASII蛋白是以同源二聚體的形式存在,整體呈一個緊密的心形結(jié)構(gòu);與GhKASII序列相似性最高的是雷蒙德式棉和亞洲棉,高達(dá)99%,并含有一個活性位點,除雷蒙德式棉和亞洲棉外,GhKASII與可可也有較近的親緣關(guān)系。
早在1980年,JEFFREY等[16]就詳細(xì)研究了大腸桿菌KASII蛋白的結(jié)構(gòu),酶學(xué)和遺傳學(xué)特點,隨后的相關(guān)研究也是以細(xì)菌為主。本研究對油料作物陸地棉KASII單個蛋白進(jìn)行了一系列生物信息學(xué)分析,將為后期繼續(xù)研究陸地棉β-酮脂酰-ACP合成酶II基因家族控制油料作物16C脂肪酸和18C脂肪酸的合成比例及影響油料作物油脂用途等提供一系列理論基礎(chǔ),從而在分子水平上通過基因工程對陸地棉的油脂合成途徑進(jìn)行遺傳改良,最終提高油脂的產(chǎn)量和品質(zhì),獲得所需要的產(chǎn)物。因此,本研究所做的一系列上游分析為后續(xù)的實驗驗證該蛋白的表達(dá)和功能提供了較好的參考價值。
[1]董佳,魏利斌,胡艷,等.棉花4個脂肪酸合成相關(guān)基因的克隆和表達(dá)特征分析[J].作物學(xué)報,2010(12):2084-2090.
[2]SELCUK ASLAN,PER HOFVANDAER,PARESH DUTTA,et al. Transient silencingof the KASII genes is feasible in Nicotiana benthamiana for metabolic engineeringof waxester composition[J].Scientific Report,2015,11:1.
[3]禹山林,楊慶利,任增凱,等.花生β-酮脂酰-ACP合成酶Ⅱ基因的克隆與表達(dá)分析[C]//科技部863計劃現(xiàn)代農(nóng)業(yè)技術(shù)領(lǐng)域辦公室.全國植物分子育種研討會摘要集.北京:科技部863計劃現(xiàn)代農(nóng)業(yè)技術(shù)領(lǐng)域辦公室,2009:1-2.
[4]李文峰,李超,周治國,等.基于異速生長關(guān)系的棉籽油分含量模擬模型[J].作物雜志,2012(1):22-25.
[5]沈端莊,錢思穎,劉桂林,等.陸地棉棉仁蛋白質(zhì)、脂肪及脂肪酸含量[J].作物品種資源,1987(4):21-22,40.
[6]徐鵬,張香桂,沈新蓮.棉籽營養(yǎng)品質(zhì)性狀的研究進(jìn)展[J].江蘇農(nóng)業(yè)學(xué)報,2009(5):1173-1177.
[7]張歡,孟永彪.用棉籽油制備生物柴油[J].化工進(jìn)展,2007(1):86-89.
[8]TIANZHEN Z,YAN H,WENKAI J,et al.Sequencing of allotetraploid cotton(Gossypium hirsutum L.acc.TM-1)provides a resource for fiber improvement[J].Nature Biotechnology,2015,33:531-537.
[9]肖向文,朱奇朗,劉海峰,等.棕色棉D(zhuǎn)FR基因的克隆與生物信息學(xué)分析[J].生物技術(shù)通報,2014(5):90.
[10]謝冰心.擬南芥SPO11基因的生物信息學(xué)分析[D].鄭州:鄭州大學(xué),2014:33-34.
[11]禹山林.花生脂肪酸代謝關(guān)鍵酶基因的克隆與表達(dá)分析[D].南京:南京農(nóng)業(yè)大學(xué),2008.
[12]劉麗,趙鵬,王丹,等.棉花3個脂肪酸碳鏈延長基因的cDNA克隆和表達(dá)分析[J].中國農(nóng)業(yè)科學(xué),2013(17):3523-3533.
[13]MACKINTOSH ROBERT W,HARDIE D GRAHAME,SLABAS ANTONI R,et al.A new assay procedure induction of β-ketoacyl-ACP synthase I and II,and the complete purification of β-ketoacyl-ACP synthase I fromdevelopingseeds ofoil seed rape(Brassica napus)[J].Biochimica et Biophysica Acta,1989,1002:114-124.
[14]ANTONI R SLABAS,DIANA CHASE,IKUO NISHIDA,et al. Molecular cloning of higher-plant 3-oxoacyl-(acyl carrier protein)reductase[J].Biochemical Journal,1992,283:321-326.
[15]HIROKAZU HALOZAKI,JONG I P,MAKOTO ENDO,et al.Expression and development function of the 3-ketoacyl-ACP synthase2 gene in Arabidopsis thaliana[J].Genes&Genetic Systems,2008,83:143-152.
[16]JEFFREY L GARWIN,AMY L KLAGESG,JOHN E CRONAN J R.Structural,enzymatic,and genetic studies of β-Ketoacyl-Acyl carrier protein synthases I and II ofEscherichia coli[J].The Journal ofBiological Chemistry,1980,255(24):11949-11956.
Protein Structure Analysis of a KASII Enzyme inGossypium hirsutum
HAOQingting,LIUBaoling,JI Xiajie,LI Runzhi,XUE Jin'ai
(Institute ofMolecular Agriculture and Bioenergy,Shanxi Agricultural University,Taigu 030801,China)
β-ketoacyl-ACP synthase II(KASII)(EC:2.3.1.179)is a key enzyme responsible for fatty acid synthesis and the ratio of16C/18C fatty acid in plant cells.It is also the molecular target for lipid metabolism modification.In this study,genomics analysis tools were employed to obtain a GhKASII gene from upland cotton(Gossypium hirsutum)genome,which was highly homologous to the known KASII genes.GhKASII gene encoded 576-amino acid peptide with a predicted molecular mass of about 61.8 kDa and a PI of 8.83. Protein structure prediction showed that GhKASII protein was a soluble protein with a plastid transit peptide,and located in the plastid. Secondarystructure ofGhKASII were made up of α-helices(32.99%)and random coils(36.63%).Three-dimensional(3D)structure modeling revealed that the GhKASII protein was a homodimer consisting oftwo same subunits,and the spatial configuration was a tightly heart-shaped structure.Multiple sequence alignment showed that GhKASII was much closely to the KASII proteins from Raymond cotton,Asian cotton and cacaotree evolutionally.The C-terminus ofKASII proteins was highlyconserved whereas N-terminus was highly variable.The enzyme-active domain of GhKASII protein was located between 318 and 334 amino acid residues with the conserved Cys(327)as the key active site.The results of the study will provide a scientific reference for further understanding the fatty acid biosynthesis mechanismand genetic improvement ofcotton and other oil crops.
Gossypium hirsutum;β-ketoacyl-ACP synthase II(KASII);lipid;bioinformatics
S562
A
1002-2481(2017)04-0505-05
10.3969/j.issn.1002-2481.2017.04.04
2016-12-28
國家自然科學(xué)基金項目(31501323);國家“948”項目(2014-Z39);山西省煤基重點科技攻關(guān)項目(FT-2014-01);山西省科技專項(201603D312005)
郝青婷(1992-),女,山西平遙人,在讀碩士,研究方向:分子遺傳與基因工程。薛金愛為通信作者。