綦洋 王柬鈞 桑園園 沈玲玲 申穎 曹雪 劉振寧
摘要:生長素(IAA)是一種重要的植物內(nèi)源激素,YUCCA基因作為IAA生物合成的限速酶編碼基因,在植物生長發(fā)育過程中起著重要的調(diào)控作用。為深入研究大白菜YUCCA基因家族的功能,利用生物信息學(xué)分析對(duì)大白菜中YUCCA基因家族成員進(jìn)行全基因組水平鑒定,并對(duì)其基因組信息、蛋白質(zhì)生理生化特征、基因結(jié)構(gòu)、保守結(jié)構(gòu)域、系統(tǒng)進(jìn)化樹等方面進(jìn)行研究。結(jié)果表明,在大白菜基因組中共鑒定出19個(gè)YUCCA基因,可以聚類到2個(gè)大的分支,Clade Ⅰ和Clade Ⅱ;YUCCA基因在大白菜10條染色體上呈不均勻分布,并有1對(duì)基因以串聯(lián)重復(fù)現(xiàn)象在染色體上分布;基因結(jié)構(gòu)分析表明大白菜YUCCA基因一般含有0~3個(gè)數(shù)量不等的內(nèi)含子;對(duì)大白菜YUCCA蛋白質(zhì)氨基酸序列多重比對(duì)的分析表明大白菜YUCCA蛋白質(zhì)存在高度保守的FAD結(jié)合位點(diǎn)(一致序列為GAGPxG)和NADPH結(jié)合位點(diǎn)(一致序列為GxGNSG);通過MEME軟件對(duì)大白菜YUCCA蛋白質(zhì)模體(motif)的預(yù)測(cè)還發(fā)現(xiàn)12個(gè)比較保守的motif。上述研究結(jié)果為大白菜YUCCA基因功能的研究奠定了一定的基礎(chǔ)。
關(guān)鍵詞:大白菜;YUCCA;基因家族;生物信息學(xué)分析
中圖分類號(hào): S634.101? 文獻(xiàn)標(biāo)志碼: A? 文章編號(hào):1002-1302(2019)03-0049-06
生長素(IAA)作為一種重要的植物內(nèi)源激素,在植物的生長發(fā)育過程中起著關(guān)鍵的調(diào)控作用[1]。依賴色氨酸的IPA(吲哚丙酸)途徑是生長素合成的主要途徑,以色氨酸為前體合成的IPA在黃素單加氧酶(YUCCA)的催化下生成IAA,這一過程也是IAA生物合成的限速步驟[2-3]。該途徑產(chǎn)生的生長素是維管系統(tǒng)發(fā)生、花發(fā)育、胚胎和種子形成等生物學(xué)過程所必需的[4-5]。
YUCCA酶是含黃素的單氧化酶,黃素單加氧酶屬于FMOs(flavin-containing monooxygenase)酶類,由YUCCA基因家族編碼。植物中第一個(gè)功能被鑒定的FMOs就是YUCCA基因編碼的蛋白質(zhì)[6]。YUCCA基因最初是從IAA含量降低的擬南芥顯性突變體中克隆鑒定的[6]。擬南芥YUCCA基因家族有11個(gè)基因成員,在生長素生物合成和調(diào)控過程中起著關(guān)鍵作用。35S啟動(dòng)子驅(qū)動(dòng)YUCCA1基因在擬南芥中過表達(dá),轉(zhuǎn)基因植株中生長素水平稍有提高,并伴隨著下胚軸伸長、子葉偏上性和頂端優(yōu)勢(shì)增強(qiáng)等表型[6]。后續(xù)研究表明,在水稻、馬鈴薯和草莓等植物中過表達(dá)YUCCA基因也都可以產(chǎn)生類似的生長素過量產(chǎn)生的表型[7-9]。對(duì)yuc基因功能缺失突變體的研究則進(jìn)一步證明了YUC基因家族在生長素合成和植物生長發(fā)育過程中的重要作用。研究表明,擬南芥中單個(gè)YUC基因失活并沒有表現(xiàn)出明顯的發(fā)育缺陷,而yuc1、yuc4雙突變體表現(xiàn)為維管組織減少,不能產(chǎn)生正常的花序,yuc1、yuc2、yuc4、yuc6 4突變體植株的表型更為嚴(yán)重。當(dāng)用YUC的啟動(dòng)子啟動(dòng)iaaM基因在擬南芥體內(nèi)表達(dá)時(shí)則可以恢復(fù)由YUC突變引起的表型,外源施加生長素卻不能恢復(fù)這種表型[4]。這些結(jié)果說明,由YUC參與的生長素合成途徑對(duì)于植物的生長發(fā)育是必需的。在單子葉植物水稻中克隆到了7個(gè)YUCCA基因家族成員,過表達(dá)OsYUCCA1的水稻表現(xiàn)出生長素表型,而表達(dá)反義OsYUCCA1的水稻則表現(xiàn)出與水稻生長素不敏感突變體相似的缺陷表型[10]。同樣在單子葉植物中,玉米YUCCA基因?qū)ζ浠ㄐ虬l(fā)育極其重要,其突變體spi1表現(xiàn)為葉腋分生組織的發(fā)育缺陷[11]。
作為生長素生物合成的限速酶編碼基因,YUCCA基因得到了較為深入的研究。其中對(duì)擬南芥[4]、水稻[10]、玉米[11]和楊樹[12]等為代表的模式植物中YUCCA基因家族進(jìn)行了全基因組水平上的鑒定和分析。另外,對(duì)小麥[13]、煙草[14]、草莓[9]和長春花[15]等物種中的YUCCA基因也進(jìn)行了基因克隆和功能研究。大白菜是我國北方乃至東南亞地區(qū)的重要蔬菜作物,南北各地均有栽培,也是我國種植面積最大的蔬菜作物。而目前未見關(guān)于大白菜YUCCA基因的研究報(bào)道。大白菜(Chiifu-401-42)全基因組測(cè)序的完成使得對(duì)大白菜中相關(guān)基因家族的鑒定和功能分析成為可能[16]。
本研究利用生物信息學(xué)方法對(duì)大白菜YUCCA基因家族成員進(jìn)行了鑒定和基因組注釋,并分析了其基因結(jié)構(gòu)和保守域,以期為進(jìn)一步對(duì)大白菜YUCCA基因功能的研究奠定一定的基礎(chǔ)。
1 材料與方法
1.1 數(shù)據(jù)來源
首先,利用已知擬南芥YUCCA蛋白質(zhì)的氨基酸序列作為種子序列,在大白菜數(shù)據(jù)庫(http://brassicadb.org/brad/)中進(jìn)行Blast P比對(duì)搜索篩選候選蛋白質(zhì)。其次,為保證候選蛋白質(zhì)沒有被遺漏,利用搜索到的YUCCA蛋白質(zhì)的氨基酸序列對(duì)大白菜基因組數(shù)據(jù)庫進(jìn)行2次Blast P比對(duì)搜索。最后,再利用Pfam數(shù)據(jù)庫、SMART數(shù)據(jù)庫和NCBI的保守域數(shù)據(jù)庫分析候選蛋白質(zhì)的保守域以驗(yàn)證YUCCA蛋白質(zhì)鑒定的準(zhǔn)確性。
1.2 試驗(yàn)方法
1.2.1 YUCCA基因的基因組信息和染色體定位 YUCCA基因的序列和基因組信息通過大白菜基因組數(shù)據(jù)庫獲得,并根據(jù)每一個(gè)YUCCA基因在染色體上的物理位置和染色體長度,利用Mapinspect軟件將YUCCA基因定位到對(duì)應(yīng)的染色體上。
1.2.2 YUCCA蛋白質(zhì)的生理生化分析 YUCCA蛋白質(zhì)的分子量和等電點(diǎn)通過ExPASy(http://www.expasy.ch/tools/pi_tool.html)進(jìn)行預(yù)測(cè)。亞細(xì)胞定位通過ProtComp 9.0進(jìn)行預(yù)測(cè)(http://www. linux1.softberry.com/berry.phtml)。
1.2.3 大白菜YUCCA基因的基因結(jié)構(gòu)、保守域和系統(tǒng)進(jìn)化樹分析 GSDS網(wǎng)站(http://gsds1.cbi.pku.edu.cn/)用來繪制YUCCA基因的外顯子-內(nèi)含子結(jié)構(gòu)圖。對(duì)YUCCA蛋白質(zhì)的氨基酸序列進(jìn)行多重比對(duì),使用DNAman軟件完成。MEME網(wǎng)站(http://meme.sdsc.edu/meme/meme.html)用來預(yù)測(cè)YUCCA蛋白質(zhì)氨基酸序列中的保守模體(motif),然后使用TBools軟件進(jìn)行繪制輸出。對(duì)進(jìn)化樹的構(gòu)建,首先利用MEGA5.0軟件內(nèi)置的Clustal W對(duì)大白菜和擬南芥蛋白質(zhì)的氨基酸序列進(jìn)行多重比對(duì)(空格罰分設(shè)置為10,空格擴(kuò)展罰分設(shè)置為0.2),然后將比對(duì)好的序列用于進(jìn)化樹構(gòu)建,進(jìn)化樹使用鄰接法(neighbor-joining method)構(gòu)建,采用泊松校正,成對(duì)刪除和1 000次重復(fù)等建樹參數(shù)[17]。
2 結(jié)果與分析
2.1 大白菜YUCCA基因家族的鑒定和注釋
根據(jù)擬南芥YUCCA蛋白質(zhì)的氨基酸序列,對(duì)大白菜數(shù)據(jù)庫進(jìn)行Blast P搜索比對(duì),在大白菜基因組中共鑒定到19個(gè)YUCCA基因家族成員(表1)。19個(gè)ENT基因的開放閱讀框在660 bp到1 326 bp,編碼的氨基酸序列長度為219到441個(gè)氨基酸,相應(yīng)的蛋白質(zhì)分子量在25.0 ku到49.7 ku。其中BrYUCCA10的開放閱讀框和編碼的氨基酸序列長度最長,而BrYUCCA19的開放閱讀框和編碼的氨基酸序列長度最短。等電點(diǎn)(pI)在5.83到9.46之間,其中BrYUCCA19的等電點(diǎn)最低,BrYUCCA15的等電點(diǎn)最高。另外,筆者所在課題組利用ProtComp 9.0軟件對(duì)YUCCA蛋白質(zhì)的亞細(xì)胞定位進(jìn)行了預(yù)測(cè),結(jié)果表明所有的YUCCA蛋白質(zhì)均定位于細(xì)胞質(zhì)中。
對(duì)大白菜YUCCA基因染色體定位(圖1)的研究表明,18個(gè)YUCCA基因均能定位到大白菜染色體基因組上,只有BrYUCCA4暫時(shí)定位在Scaffold000111上。YUCCA基因在大白菜的10條染色體上呈現(xiàn)明顯的不均勻分布,其中第6號(hào)染色體上存在最多的5個(gè)YUCCA基因,第9和10號(hào)染色體上存在3個(gè)YUCCA基因,第1、2和8號(hào)染色體上均存在2個(gè)YUCCA基因,第5號(hào)染色體上僅存在1個(gè)YUCCA基因,而在3、4和7號(hào)染色體上則沒有分布。另外,BrYUCCA18(Bra018763)和BrYUCCA19(Bra018761)在第6號(hào)染色體上僅間隔1個(gè)基因座,為明顯的1對(duì)串聯(lián)重復(fù)基因。
2.2 大白菜YUCCA基因結(jié)構(gòu)分析
為研究大白菜YUCCA的基因結(jié)構(gòu),根據(jù)大白菜基因組信息獲取了每一個(gè)YUCCA基因的基因組和CDS序列信息,并繪制了其外顯子-內(nèi)含子基因結(jié)構(gòu)圖(圖2)。結(jié)果表明,BrYUCCA基因含有0~3個(gè)數(shù)量不等的內(nèi)含子,外顯子-內(nèi)含子數(shù)量相對(duì)較少。其中只有BrYUCCA19沒有內(nèi)含子,BrYUCCA1、BrYUCCA2、BrYUCCA17和BrYUCCA18均只含有1個(gè)內(nèi)含子,BrYUCCA3~BrYUCCA9含有2個(gè)內(nèi)含子,BrYUCCA10~BrYUCCA16含有3個(gè)內(nèi)含子。另外,通過對(duì)基因結(jié)構(gòu)圖和基因進(jìn)化樹的比較分析, 也發(fā)現(xiàn)聚類到較近的進(jìn)化樹分枝上的基因,親緣關(guān)系越近,其基因結(jié)構(gòu)和內(nèi)含子數(shù)量也越相似。
2.3 大白菜YUCCA蛋白質(zhì)的氨基酸序列多重比對(duì)和保守域分析
為進(jìn)一步研究大白菜YUCCA蛋白質(zhì)的保守結(jié)構(gòu)域,使用DNAman軟件對(duì)YUCCA蛋白質(zhì)的氨基酸序列進(jìn)行了多重比對(duì)(圖3)。比對(duì)結(jié)果表明,大白菜YUCCA蛋白質(zhì)的氨基酸序列還是比較保守的,均含有黃素單加氧酶共有的黃素嘌呤二核苷酸(FAD)結(jié)合位點(diǎn)(FAD-binding site)和還原型輔酶Ⅱ結(jié)合位點(diǎn)(NADPH-binding site)。擬南芥中共有11個(gè)YUCCA蛋白質(zhì),其FAD-binding site一致序列為GxGPxG,NADPH-binding site一致序列為GxGNSG。本研究中19個(gè)大白菜YUCCA蛋白質(zhì)的FAD-binding site一致序列為GAGPxG,NADPH-binding site一致序列為GxGNSG,說明大白菜和擬南芥中這2個(gè)位點(diǎn)是高度保守的。另外,利用MEME軟件對(duì)大白菜YUCCA蛋白質(zhì)保守motif的預(yù)測(cè)分析(圖4),鑒定到12個(gè)比較保守的motif(motif 1~12),其中motif 5為FAD結(jié)合位點(diǎn),motif 2為NADPH結(jié)合位點(diǎn),其余10個(gè)motif具體的生物學(xué)功能還有待于進(jìn)一步研究(圖5)。
2.4 大白菜YUCCA基因的系統(tǒng)發(fā)育分析和分類
為進(jìn)一步分析大白菜YUCCA基因的親緣關(guān)系和進(jìn)化模式,筆者所在課題組選取大白菜、擬南芥、楊樹、水稻和玉米這5個(gè)代表性陸生植物物種中YUCCA蛋白質(zhì)的氨基酸序列,使用MEGA 5.0軟件構(gòu)建了NJ進(jìn)化樹并對(duì)YUCCA基因進(jìn)行了聚類分析(圖6)。結(jié)果表明,這5個(gè)物種中的60個(gè)YUCCA基因可以聚類到2個(gè)大的分支,Clade Ⅰ和Clade Ⅱ。分支
Clade Ⅰ中基因數(shù)量較少,但也可以細(xì)分為3個(gè)小的分支,Clade Ⅰ-1、Clade Ⅰ-2和Clade Ⅰ-3,其中BrYUCCA17位于分支Clade Ⅰ-2,BrYUCCA18和BrYUCCA19位于分支Clade Ⅰ-3。1個(gè)玉米YUCCA基因被單獨(dú)聚類到了分支Clade Ⅰ-1中。值的注意的是在整個(gè)分支Clade Ⅰ中沒有聚類到水稻的YUCCA基因。分支Clade Ⅱ中基因數(shù)量較多,可以分為Clade Ⅱ-A、Clade Ⅱ-B、Clade Ⅱ-C和Clade Ⅱ-D 4個(gè)分支。Clade Ⅱ-A又可以分成3個(gè)小的分支,Clade Ⅱ-A1、Clade Ⅱ-A2和Clade Ⅱ-A3,雙子葉植物和單子葉植物的YUCCA基因在該分支中具有明顯地差異,其中Clade Ⅱ-A1和Clade Ⅱ-A2這2個(gè)分支只包含擬南芥、大白菜和楊樹雙子葉植物的YUCCA基因,而水稻和玉米單子葉植物的YUCCA基因均被聚類到了Clade Ⅱ-A3中。Clade Ⅱ-B又可以分成2個(gè)小的分支,Clade Ⅱ-B1和Clade Ⅱ-B2,該分支與 Clade Ⅱ-A不同,均包含上述5個(gè)物種的YUCCA基因。分支Clade Ⅱ-C包含水稻和楊樹各1個(gè)基因,而分支 Clade Ⅱ-D也是單子葉植物特有的分支,只包含水稻和玉米的YUCCA基因。
3 結(jié)論與討論
本研究根據(jù)擬南芥YUCCA蛋白質(zhì)的氨基酸序列,通過對(duì)大白菜數(shù)據(jù)庫進(jìn)行Blast P搜索比對(duì),在大白菜基因組中共鑒定到19個(gè)YUCCA基因家族成員,并對(duì)其家族成員進(jìn)行基因注釋、基因結(jié)構(gòu)、保守結(jié)構(gòu)域及系統(tǒng)發(fā)育等方面的分析,為后續(xù)大白菜YUCCA基因功能研究提供了一定的基礎(chǔ)信息。
大白菜和擬南芥在完成分化之前發(fā)生過3次全基因組復(fù)制事件(α、β、γ復(fù)制事件)。而后大白菜和擬南芥出現(xiàn)分化,大白菜基因組在大約540~900萬年前又發(fā)生了全基因組3倍化事件[16,18-20]。筆者所在課題組在大白菜基因組中共鑒定出19個(gè)YUCCA基因,擬南芥、楊樹、水稻和玉米的基因組中分別有11、11、7、12個(gè)YUCCA基因,說明大白菜YUCCA基因家族伴隨著全基因組復(fù)制出現(xiàn)了擴(kuò)增。BrYUCCA18和BrYUCCA19為一對(duì)串聯(lián)重復(fù)基因,說明串聯(lián)復(fù)制也是大白菜YUCCA基因家族基因擴(kuò)增的一種方式?;蚩梢酝ㄟ^多種方式進(jìn)行擴(kuò)增,包括全基因組復(fù)制、串連復(fù)制、片段復(fù)制和逆轉(zhuǎn)座復(fù)制等。大白菜YUCCA基因家族成員具體的基因擴(kuò)增方式還有待于進(jìn)一步深入研究。另外,根據(jù)大白菜YUCCA基因的系統(tǒng)發(fā)育分析,擬南芥YUCCA2基因在大白菜基因組中沒有找到相對(duì)應(yīng)的同源基因,說明該基因在擬南芥和大白菜物種分化后發(fā)生了基因丟失事件,但其具體的基因丟失機(jī)制還不清楚。本研究選取3個(gè)雙子葉和2個(gè)單子葉植物的YUCCA基因家族成員構(gòu)建了系統(tǒng)進(jìn)化樹,將YUCCA基因家族分成2個(gè)大的分支,Clade Ⅰ和Clade Ⅱ,但是在分支Clade Ⅰ中不存在任何一個(gè)水稻YUCCA基因家族成員,而玉米則有3個(gè)YUCCA基因家族成員被聚類到了Clade Ⅰ中。發(fā)生這種現(xiàn)象的原因可能是分支Clade Ⅰ中的水稻YUCCA基因在長期進(jìn)化過程中發(fā)生了丟失,也可能是水稻YUCCA基因和其他幾個(gè)物種親緣關(guān)系較遠(yuǎn)導(dǎo)致沒能聚類到一個(gè)分支,具體原因還需要進(jìn)一步研究證實(shí)。
參考文獻(xiàn):
[1]Zhao Y D. Auxin biosynthesis and its role in plant development[J]. Annual Review of Plant Biology,2010,61(1):49-64.
[2]Mashiguchi K,Tanaka K,Sakai T,et al. The main auxin biosynthesis pathway in Arabidopsis[J]. Proceedings of the National Academy of Sciences,2011,108(45):18512-18517.
[3]Dai X H,Mashiguchi K,Chen Q G,et al. The biochemical mechanism of auxin biosynthesis by an Arabidopsis YUCCA flavin-containing monooxygenase[J]. Journal of Biological Chemistry,2013,288(3):1448-1457.
[4]Cheng Y F,Dai X H,Zhao Y D. Auxin biosynthesis by the YUCCA flavin monooxygenases controls the formation of floral organs and vascular tissues in Arabidopsis[J]. Genes & Development,2006,20(13):1790-1799.
[5]Cheng Y F,Dai X H,Zhao Y D. Auxin synthesized by the YUCCA flavin monooxygenases is essential for embryogenesis and leaf formation in Arabidopsis[J]. Plant Cell,2007,19(8):2430-1439.
[6]Zhao Y D,Christensen S K,F(xiàn)ankhauser C,et al. A role for flavin monooxygenase-like enzymes in auxin biosynthesis[J]. Science,2001,291(5502):306-309.
[7]游小慶,桑賢春,趙芳明,等. 水稻窄葉突變體nal7(t)的遺傳分析與基因定位[J]. 分子植物育種,2010,8(2):240-244.
[8]Kim J I,Baek D,Park H C,et al. Overexpression of Arabidopsis YUCCA6 in potato results in high-auxin developmental phenotypes and enhanced resistance to water deficit[J]. Molecular Plant,2013,6(2):337-349.
[9]Liu H,Xie W F,Zhang L,et al. Auxin biosynthesis by the YUCCA6 flavin monooxygenase gene in woodland strawberry[J]. Journal of Integrative Plant Biology,2014,56(4):350-363.
[10]Yamamoto Y,Kamiya N,Morinaka Y,et al. Auxin biosynthesis by the YUCCA genes in rice[J]. Plant Physiology,2007,143(3):1362-1371.
[11]Gallavotti A,Barazesh S,Malcomber S,et al. Sparse inflorescence 1 encodes a monocot-specific YUCCA-Like gene required for vegetative and reproductive development in maize[J]. Procnatlacadsciusa,2008,105(39):15196-15201.
[12]Ye X,Kang B G,Osburn L D,et al. Identification of the flavin-dependent monooxygenase-encoding YUCCA gene family in Populus trichocarpa and their expression in vegetative tissues and in response to hormone and environmental stresses[J]. Plant Cell,Tissue and Organ Culture,2009,97(3):271-283.
[13]郭慶東,李 娜,惠文榮,等. 小麥TaYUC10基因種子特異表達(dá)載體構(gòu)建及小麥遺傳轉(zhuǎn)化[C]. 全國小麥基因組學(xué)及分子育種大會(huì), 2015.
[14]高玉龍,宋中邦,李文正,等. 兩個(gè)煙草YUCCA6基因的克隆及分析[J]. 分子植物育種,2016,14(6):1376-1381.
[15]許 菲,張 穎,潘琪芳,等. 長春花黃素單加氧酶基因的克隆與組織表達(dá)分析[J]. 上海交通大學(xué)學(xué)報(bào),2014,32(4):1-7.
[16]Wang X W,Wang H Z,Wang J,et al. The genome of the mesopolyploid crop species Brassica rapa[J]. Nature Genetics,2011,43(10):1035-1157.
[17]Saitou N,Nei M. The neighbor-joining method:a new method for reconstructing phylogenetic trees[J]. Molecular Biology and Evolution,1987,4(4):406-425.
[18]Blanc G,Wolfe K H. Widespread paleopolyploidy in model plant species inferred from age distributions of duplicate genes[J]. Plant Cell,2004,16(7):1667-1678.
[19]Blanc G,Hokamp K,Wolfe K H. A recent polyploidy superimposed on older large-scale duplications in the Arabidopsis genome[J]. Genome Research,2003,13(2):137-144.
[20]Lysak M A,Koch M A,Pecinka A,et al. Chromosome triplication found across the tribe Brassiceae[J]. Genome Research,2005,15(4):516-525.武鳳霞,應(yīng)夢(mèng)真,李吉進(jìn),等. 不同施肥種類對(duì)玉米產(chǎn)量及土壤性狀的影響[J]. 江蘇農(nóng)業(yè)科學(xué),2019,47(3):55-60.