国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

蒺藜苜蓿SBP—box轉(zhuǎn)錄因子基因家族全基因組分析

2018-05-08 11:11李月穎李菁劉長寧

李月穎 李菁 劉長寧

摘 要 從全基因組水平研究蒺藜苜蓿SBP-box轉(zhuǎn)錄因子基因家族,系統(tǒng)地鑒定出22個SBP-box家族基因,根據(jù)基因結(jié)構(gòu)分析、結(jié)構(gòu)域的差異和系統(tǒng)發(fā)育分析將這些SBP-box基因分成5個亞家族.基因比較分析表明SBP-box基因家族擴(kuò)張主要是通過部分復(fù)制及串聯(lián)重復(fù)事件來實(shí)現(xiàn)的.基因表達(dá)模式分析表明蒺藜苜蓿SBP-box基因具有器官特異性并且參與干旱脅迫反應(yīng).這些結(jié)果為進(jìn)一步研究蒺藜苜蓿SBP-box 家族基因的功能與進(jìn)化提供理論參考.

關(guān)鍵詞 SBP-box轉(zhuǎn)錄因子;進(jìn)化分析;基因表達(dá)模式;蒺藜苜蓿

中圖分類號 Q349+.13文獻(xiàn)標(biāo)識碼 A文章編號 1000-2537(2017)06-0024-10

Abstract This study conducted a genome-wide investigation of the SBP-box gene family in Medicago truncatula. A total of 22 SBP-box genes were systematically identified from Medicago truncatula and classified into 5 subfamilies according to the gene structure analysis, motif analysis and phylogeny relationship. Further genome comparison analysis revealed that segmental duplication and tandem duplication were two important ways for SBP-box genes to extend in the Medicago truncatula genome. Results from expression profile analysis revealed that SBP-box genes have the organ-specificity and were involved in drought stress responses. The data presented here should provide a theoretical foundation for verifying the function and evolution of SBP-box genes in Medicago truncatula.

Key words SBP-box transcription factors; phylogeny analysis; gene expression patterns; Medicago truncatula

轉(zhuǎn)錄因子(Transcription Factors)也稱反式作用因子,是指能夠與真核基因啟動子區(qū)域中順式作用元件發(fā)生特異性相互作用的DNA結(jié)合蛋白.它們通過彼此之間以及與其他相關(guān)蛋白之間的相互作用,參與決定基因在何種組織與何種發(fā)育階段開始轉(zhuǎn)錄,或者參與基因應(yīng)答外界環(huán)境因素所導(dǎo)致的轉(zhuǎn)錄,在調(diào)節(jié)植物防衛(wèi)病原微生物和響應(yīng)外界環(huán)境脅迫中發(fā)揮重要作用[1].SBP-box基因家族編碼的SBP轉(zhuǎn)錄因子是植物所特有的一類轉(zhuǎn)錄因子.這些基因都有編碼DNA結(jié)合結(jié)構(gòu)域的保守核苷酸序列,又稱為SBP盒(SBP-box)基因.SBP-box基因首先是在金魚草(Antirrhinum majus)中識別并結(jié)合MADS-box基因SQUAMOSA啟動子的一個體外實(shí)驗(yàn)中被發(fā)現(xiàn)而得到確認(rèn)的[2].自此之后,SBP-box基因在擬南芥、玉米、白樺等植物中相繼被分離出來[3-5],并且對其功能進(jìn)行了很多研究.

Birkenbihl等[6]在擬南芥中發(fā)現(xiàn)了16個SBP-box基因,將它們命名為SPL1-SPL16.這些基因編碼的蛋白質(zhì)能夠特異結(jié)合在AP1基因(SQUAMOSA在擬南芥中的同源基因)的啟動子區(qū)段.SPL3和SPL8在擬南芥中能夠分別影響植株的成花轉(zhuǎn)變和花粉囊的發(fā)育[7];SPL5和SPL15兩個基因能夠控制擬南芥的生殖生長;SPL14是該基因家族中序列最長的基因之一,近來被認(rèn)為參與受到真菌毒素FB1誘導(dǎo)的細(xì)胞程序性死亡的過程[8];AtSPL2在擬南芥AtJMT超量表達(dá)植株中響應(yīng)茉莉酸甲酯介導(dǎo)的抗病途徑[9].玉米中LIGULELESS1(LG1)基因缺失突變體的葉耳和葉舌不能形成[4].Wang等[10]發(fā)現(xiàn)在TGA1基因的啟動子和編碼序列中幾個核苷酸的改變與玉米花序結(jié)構(gòu)有關(guān). 2015年Tan等和2016年Song等的研究也分別表明白菜和菊花中的SBP基因具有響應(yīng)激素處理及非生物脅迫的功能[11-12].

SBP蛋白雖然在一級結(jié)構(gòu)上很多樣化,但是它們都有一個高度保守的DNA結(jié)合結(jié)構(gòu)域(全稱DBD),該區(qū)域有約76個氨基酸殘基長,即SBP結(jié)構(gòu)域.這一結(jié)構(gòu)域包括兩個典型的C3H和C2HC型的鋅指結(jié)構(gòu)(Zn-finger structure)[13]和C末端的一段高度保守的雙向核定位信號(Nuclear Localization Signal,NLS)[6].Zn2+和核定位信號在蛋白與DNA結(jié)合過程中是必需的,C端的NLS與C2HC型鋅指結(jié)構(gòu)序列部分重疊,具有引導(dǎo)SBP-box基因進(jìn)入細(xì)胞核從而對其下游基因的轉(zhuǎn)錄表達(dá)進(jìn)行調(diào)控的功能.另外,現(xiàn)在發(fā)現(xiàn)的SBP基因中,有一部分還擁有高度保守的miR156/miR157識別位點(diǎn)[14].

豆科(Leguminosae)是種子植物第三大科,是人類及動物獲取食物和營養(yǎng)來源的重要科屬之一[15].蒺藜苜蓿是豆科苜蓿屬一年生植物,由于其具有生育期短、二倍體、自花授粉、基因組較小且遺傳轉(zhuǎn)化效率高等特點(diǎn)被作為豆科基因組學(xué)和生物學(xué)的模式植物進(jìn)行研究[16].蒺藜苜蓿全基因組測序已經(jīng)完成,使得利用生物信息學(xué)手段研究該物種基因家族系統(tǒng)演化及功能成為可能.截至目前,在全基因組水平對蒺藜苜蓿SBP-box基因家族的研究尚未見報道.本研究利用生物信息學(xué)手段,從全基因組水平篩選和鑒定蒺藜苜蓿SBP-box基因,并利用生物信息及系統(tǒng)發(fā)育分析方法進(jìn)行比較基因組學(xué)研究,以探究蒺藜苜蓿SBP-box基因家族系統(tǒng)進(jìn)化關(guān)系、基因結(jié)構(gòu)及保守基序的差異和變化以及基因家族的復(fù)制特點(diǎn);同時基于對基因家族的進(jìn)化分析,結(jié)合表達(dá)譜的數(shù)據(jù)對蒺藜苜蓿SBP-box家族基因功能進(jìn)行深入研究,以期闡明蒺藜苜蓿SBP-box家族基因在生長、發(fā)育及防御等方面的生物學(xué)功能,從而為豆科基因資源的開發(fā)和利用提供理論基礎(chǔ),實(shí)現(xiàn)豆科經(jīng)濟(jì)作物中重要基因的克隆及功能研究并為豆科育種的快速發(fā)展和其他遺傳研究提供現(xiàn)實(shí)可行的依據(jù).

1 材料方法

1.1 數(shù)據(jù)來源

本研究蒺藜苜蓿蛋白質(zhì)數(shù)據(jù),編碼序列數(shù)據(jù)以及全基因組數(shù)據(jù)下載于JCVI數(shù)據(jù)庫(Mtruncatula_198;http://ftp.jpi-psf.org/pub/compgen/phytozome/v9.0/Mtruncatula)[17];擬南芥SBP-box家族蛋白序列和基因序列下載于擬南芥全基因組數(shù)據(jù)庫(TAIR 9.0,http://www.arabidopsis.org/)[18];蒺藜苜?;蛐酒磉_(dá)數(shù)據(jù)來自諾貝爾基金會蒺藜苜蓿基因表達(dá)圖譜數(shù)據(jù)庫(http://mtgea.noble.org/v3/)[19-20].

1.2 蒺藜苜蓿SBP-box家族成員鑒定

擬南芥的SBP-box家族成員共17個蛋白序列作為query sequence執(zhí)行本地BLASTP[21](e-value設(shè)置為1×10-5)搜索蒺藜苜蓿的蛋白序列;同時在Pfam數(shù)據(jù)庫(http://pfam.sanger.ac.uk/search)中下載了SBP-box結(jié)構(gòu)域的HMM文件(PF03110),利用HMMER (v3.1b2,http://hmmer. org)構(gòu)建隱馬爾科夫模型(Hidden Markov Model,HMM,)在蒺藜苜蓿蛋白數(shù)據(jù)庫搜索含有SBP-box結(jié)構(gòu)域的候選序列(E-value設(shè)為1).將第一步和第二步的結(jié)果合并并且去冗余,去冗余后假定的蒺藜苜蓿的蛋白序列放到SMART[22](http://smart.embl-heidelberg.de/)和NCBI Conserved Domains[23](http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml)在線工具中進(jìn)一步檢查是否具有SBP結(jié)構(gòu)域,手工去除冗余和不完整讀碼框的序列,最終得到蒺藜苜蓿的SBP-box基因.利用 ExPASy Proteomics Server[24](http://prosite.expasy.org/)對所有蒺藜苜蓿SBP-box蛋白氨基酸序列進(jìn)行相對分子質(zhì)量、等電點(diǎn)預(yù)測.利用softberry (http:// linux1.softberry.com/berry.phtml)中的The ProtComp 9.0 進(jìn)行SBP-box蛋白的亞細(xì)胞定位預(yù)測.

1.3 SBP家族系統(tǒng)發(fā)育樹構(gòu)建

利用ClustalX (v2.1)[25]對擬南芥和蒺藜苜蓿SBP蛋白進(jìn)行多序列聯(lián)配比對分析,比對結(jié)果使用 MEGA[26](v6.0)進(jìn)行系統(tǒng)進(jìn)化分析.發(fā)育樹構(gòu)建采用鄰接法(The Neighbour Joining,NJ),檢驗(yàn)參數(shù)Boot-strapping重復(fù)1 000次.

1.4 蒺藜苜蓿SBP-box基因結(jié)構(gòu)分析以及SBP-box蛋白保守功能基序預(yù)測

利用在線工具 Gene Structure Display Server(GSDS; v2.0; http://gsds.cbi.pku.edu.cn/)[27]分析SBP-box家族基因結(jié)構(gòu).在線工具M(jìn)otif Elicitation tool(MEME; v4.11.2; http://meme-suite.org/tools/meme)[28]可以很好地分析基因的基序.本研究將蒺藜苜蓿SBP-box蛋白序列提交到MEME網(wǎng)站預(yù)測SBP-box基因的基序.預(yù)測基序的數(shù)量為10;基序的長度為20~200;基序重復(fù)的數(shù)量為“any”.

1.5 蒺藜苜蓿SBP-box家族染色體定位及復(fù)制分析

利用Phytozome植物全基因組數(shù)據(jù)庫(http://phytozome.jgi.doe.gov/pz/portal.html)[29]確定SBP-box基因在染色體上的位置,并使用MapInspect工具(http://www.plantbreeding.wur.nl/uk/software_mapinspect.html)標(biāo)出每個蒺藜苜蓿SBP-box基因在染色體組上的位置,從而得到每個SBP-box基因在基因組中的分布情況.利用MCScanx[30]進(jìn)行基因家族的復(fù)制分析.判定基因復(fù)制事件的條件基于植物基因組復(fù)制數(shù)據(jù)庫(the Plant Genome Duplication Database)[31]的鑒定方法即基因重復(fù)事件必須同時滿足以下條件[32]:(1)兩個基因序列相互匹配部分的長度大于較長序列長度的80%;(2)兩個基因序列相互匹配部分的相似性大于80%;(3)緊密相連的基因中,只參與一次復(fù)制事件.同時結(jié)合基因在染色體上的位置,判斷發(fā)生了串聯(lián)復(fù)制還是片段復(fù)制.

1.6 蒺藜苜蓿SBP-box基因家族表達(dá)模式分析

根據(jù)蒺藜苜蓿SBP-box基因?qū)?yīng)的CDS序列,在蒺藜苜?;蛐酒脚_BLAST搜索其對應(yīng)的探針,探針的表達(dá)量數(shù)據(jù)包括蒺藜苜蓿的根部(root)、葉柄(petiole)、芽(bud)、莖(stem)、花(flower)、果莢(pod)、種子(seed)的不同發(fā)育階段,以及根和莖中SBP-box基因在干旱脅迫下的表達(dá)量.通過R軟件對SBP-box基因的表達(dá)數(shù)據(jù)進(jìn)行正則化并運(yùn)用Pheatmap程序包對正則化的蒺藜苜蓿SBP-box基因表達(dá)數(shù)據(jù)進(jìn)行聚類分析.

2 結(jié)果與分析

2.1 蒺藜苜蓿SBP-box 基因家族的鑒定以及蛋白質(zhì)的理化性質(zhì)分析

為了鑒定蒺藜苜蓿SBP-box基因家族,同時使用BLASTP以及HMM搜索蒺藜苜蓿中的蛋白序列來找出包含SBP-box結(jié)構(gòu)域的蛋白.為了進(jìn)一步確定結(jié)果的可靠性,使用SMART和NCBI Conserved Domains檢驗(yàn)SBP-box結(jié)構(gòu)域的存在,刪除不具有SBP-box保守結(jié)構(gòu)域的序列.最后在蒺藜苜蓿中共鑒定出23個SBP-box蛋白,這些蛋白隸屬22個基因,使用物種名的縮寫作為前綴,給每一個SBP-box蛋白命名.系統(tǒng)性地評估了這些SBP-box蛋白的基本性質(zhì),包括預(yù)測蛋白質(zhì)的長度、相對分子質(zhì)量、等電點(diǎn)以及亞細(xì)胞定位.這些SBP-box蛋白序列的長度為144到1 026個氨基酸殘基;利用在線工具ExPASy對蒺藜苜蓿SBP-box蛋白質(zhì)相對分子質(zhì)量、理論等電點(diǎn)系數(shù)進(jìn)行分析發(fā)現(xiàn),23個SBP-box中07D(MtSBP3)相對分子質(zhì)量最大,為112 971;最小的61D(MtSBP5)為16 950;這些基因的理論等電點(diǎn)變異相對較小,從5.4(MtSBP2B)到9.2(MtSBP6)不等;利用在線工具softberry進(jìn)行蛋白質(zhì)的亞細(xì)胞定位預(yù)測與它的轉(zhuǎn)錄因子家族的角色相對應(yīng),有13個SBP-box定位到細(xì)胞核上(表 1).

2.2 蒺藜苜蓿SBP-box基因家族的進(jìn)化分析

為了解蒺藜苜蓿SBP-box基因家族成員的系統(tǒng)進(jìn)化關(guān)系,利用蒺藜苜蓿SBP-box蛋白保守結(jié)構(gòu)域構(gòu)建系統(tǒng)進(jìn)化樹,包括22個蒺藜苜蓿SBP-box蛋白以及17個擬南芥SBP-box蛋白,系統(tǒng)進(jìn)化分析將這些SBP-box蛋白分為5個亞家族,命名為A,B,C,D以及E(圖 1).5個亞家族又可以分為兩類,相較于亞家族A,B,C和E,亞家族D的蛋白包含了相對較長的氨基酸序列,這說明這兩類之間可能存在一些功能差異性.亞家族 D包含4個蒺藜苜蓿SBP-box蛋白以及4個擬南芥的SBP-box蛋白,其中AtSPL14以及AtSPL16分別為SPL1-Related2 protein (SPL1R2)以及SPL1-Related3 protein(SPL1R3),所以與AtSPL1具有更近的親緣關(guān)系.亞家族A,B,C和E包含19個蒺藜苜蓿SBP-box蛋白以及13個擬南芥SBP-box蛋白,亞家族A,B及C均同時含有蒺藜苜蓿和擬南芥的SBP-box蛋白,亞家族E只含有3個擬南芥的SBP-box蛋白.

2.3 蒺藜苜蓿SBP-box基因家族基因結(jié)構(gòu)以及蛋白質(zhì)保守基序分析

內(nèi)含子外顯子結(jié)構(gòu)和內(nèi)含子類型與數(shù)量是一個基因家族典型的進(jìn)化印跡.進(jìn)一步探究蒺藜苜蓿SBP-box基因家族的22條序列以及擬南芥中SBP-box基因家族17條序列的基因結(jié)構(gòu),發(fā)現(xiàn)系統(tǒng)進(jìn)化樹同一分枝的基因結(jié)構(gòu)比較相似而不同分枝之間的基因結(jié)構(gòu)有所差異.蒺藜苜蓿SBP-box轉(zhuǎn)錄因子基因家族的內(nèi)含子數(shù)目為1~10不等(圖 2).通過統(tǒng)計發(fā)現(xiàn),在蒺藜苜蓿中,有4個蒺藜苜蓿SBP-box基因家族成員含有1個內(nèi)含子(比例18.1%);5個蒺藜苜蓿SBP-box基因家族成員含有2個內(nèi)含子(比例22.7%);7個蒺藜苜蓿SBP-box基因家族成員含有3個內(nèi)含子(比例31.8%);2個蒺藜苜蓿SBP-box基因家族成員含有4個內(nèi)含子(比例9.09%);還有4個蒺藜苜蓿SBP-box基因家族成員含有8個以上的內(nèi)含子(比例18.1%).進(jìn)一步分析發(fā)現(xiàn),亞家族D的蒺藜苜蓿SBP-box基因家族成員內(nèi)含子數(shù)目大于亞家族A,B,C及E分支,且外顯子-內(nèi)含子結(jié)構(gòu)相似,基因結(jié)構(gòu)比較復(fù)雜,MtSBP4含有8個內(nèi)含子,其余基因含有9個內(nèi)含子.相反的,A,B,C及E亞家族含有較少的內(nèi)含子,除了AtSPL7含有9個內(nèi)含子外,其余的基因僅有1~4個內(nèi)含子.使用MEME分析工具對所有的蒺藜苜蓿SBP-box蛋白序列進(jìn)行預(yù)測,結(jié)果顯示10個保守功能基序都具有統(tǒng)計顯著性,每個保守基序的e-value都小于1e-300(圖3).蒺藜苜蓿SBP-box基因保守基序的預(yù)測大部分支持SBP-box轉(zhuǎn)錄因子基因家族系統(tǒng)發(fā)育分析的分類.這些保守基序的序列特征以及氨基酸長度如圖3所示.其中motif2,motif1以及motif4是存在于所有蒺藜苜蓿SBP-box蛋白N端的保守SBP結(jié)構(gòu)域,蒺藜苜蓿的每個亞家族中都有一些基序具有亞家族特異性.motif3,motif7,motif8,motif10,motif5,motif9以及motif6是亞家族D中特有的基序,亞家族D中的蒺藜苜蓿SBP-box蛋白與AtSPL14(SPL1-Related2 protein (SPL1R2)),AtSPL1及AtSPL12比較相似,AtSPL16缺少motif7.與基因結(jié)構(gòu)相對應(yīng),A,B,C和E亞家族含有比較統(tǒng)一且簡單的蛋白保守基序.亞家族特有的基序可能在亞家族的功能特異性中具有重要作用.

2.4 蒺藜苜蓿SBP-box基因家族在染色體上的分布與重復(fù)

為了探究蒺藜苜蓿SBP-box基因家族的擴(kuò)增和進(jìn)化可能的機(jī)制,本研究對蒺藜苜蓿SBP-box基因進(jìn)行染色體定位分析,通過提取蒺藜苜蓿SBP-box基因的染色體定位信息,得到23個SBP-box基因在蒺藜苜蓿染色體上的定位圖(圖4).23個SBP-box基因不均勻地分布在7條染色體上,每條染色體分布有1~6個SBP-box基因,其中:8號染色體最多,為6個基因;其次是2號和7號染色體,均為4個基因;5號染色體最少,只有1個基因.使用MapInspect軟件繪制蒺藜苜蓿SBP-box基因在染色體上的分布,同時檢驗(yàn)SBP-box基因家族的復(fù)制事件,蒺藜苜蓿SBP-box基因轉(zhuǎn)錄因子家族的片段復(fù)制和串聯(lián)重復(fù)的基因?qū)Ψ謩e使用細(xì)線以及黃棕色方框進(jìn)行標(biāo)示.利用染色體片段、基因組重復(fù)區(qū)信息,共發(fā)現(xiàn)21對發(fā)生片段重復(fù)和串聯(lián)重復(fù)的同源基因(圖4),它們的序列同源性較高,其中19對重復(fù)基因?qū)Πl(fā)生片段重復(fù)(占所有復(fù)制基因?qū)Φ?0.5%),發(fā)生片段復(fù)制的基因?qū)Ψ植加诔齺喖易錏之外的系統(tǒng)發(fā)育分枝的各個亞家族(包括A—D),它們的分布有一定的分支偏好性.大約63.2%(19對片段復(fù)制基因中的12對)分布在相同的系統(tǒng)發(fā)育亞家族中,這可能是由蒺藜苜蓿基因組的多倍化過程導(dǎo)致;另外兩對基因MtSBP20/MtSBP21和MtSBP21/MtSBP22發(fā)生了串聯(lián)復(fù)制,且這兩對基因均位于亞家族B,串聯(lián)重復(fù)的基因?qū)哂泻芨叩男蛄邢嗨菩?,往往高?0%.

2.5 蒺藜苜蓿SBP-box基因家族的表達(dá)分析

本研究收集了蒺藜苜蓿不同組織器官(結(jié)節(jié)、根、莖、葉、花和豆莢以及種子的不同發(fā)育階段)的表達(dá)數(shù)據(jù).然后使用層次聚類來表現(xiàn)豆科4個物種中的SBP-box基因在不同組織器官的表達(dá)模式.如圖5(彩圖見封三)所示,對于蒺藜苜蓿SBP-box基因,它們被聚類為低表達(dá)量(MtSBP17,MtSBP13,MtSBP12以及MtSBP21)、表達(dá)量有變化(MtSBP8,MtSBP9,MtSBP14,MtSBP2B和MtSBP16)以及高表達(dá)量(MtSBP19,MtSBP1,MtSBP2A,MtSBP3和MtSBP4)3種模式,不同組織器官表達(dá)量的分析表明大部分蒺藜苜蓿SBP-box基因家族成員的表達(dá)不具有組織特異性,在包括組織器官的生長發(fā)育以及種子的生長發(fā)育中都發(fā)揮重要的作用;但部分基因具有組織特異性如MtSBP19在種子發(fā)育的不同階段表達(dá)量差異很大,MtSBP2B/MtSBP14在豆莢中表達(dá)量較高,而MtSBP16在根中表達(dá)量較高.結(jié)合基因復(fù)制的結(jié)果發(fā)現(xiàn),發(fā)生片段復(fù)制的基因?qū)?,它們傾向于表現(xiàn)出不同的表達(dá)模式.在蒺藜苜蓿中總共有19個發(fā)生片段復(fù)制的基因?qū)?,本研究收集?對的表達(dá)數(shù)據(jù),其中6對表現(xiàn)出不同的表達(dá)模式聚類,例如MtSBP9/MtSBP13與MtSBP17/MtSBP19,所有這些結(jié)果表明片段復(fù)制的基因參與了植物生長發(fā)育的不同過程.同時本研究分析了在干旱脅迫2,3,4,7,10以及14 d豆科SBP-box基因在根和莖中的的表達(dá)量變化,通過繪制熱圖發(fā)現(xiàn),莖中MtSBP9對干旱有顯著響應(yīng).根中MtSBP2B以及MtSBP16對干旱也有顯著響應(yīng),表明多個SBP-box基因參與了逆境脅迫應(yīng)答.

3 討論

SBP-box基因是在研究花形成路徑的基因調(diào)控網(wǎng)絡(luò)中發(fā)現(xiàn)的,因此被認(rèn)為和花的發(fā)育密切相關(guān),在近幾年的研究中發(fā)現(xiàn)SBP-box基因有著廣泛的生物學(xué)功能[33-34].隨著基因組測序的發(fā)展,SBP-box基因的功能在各種植物中被研究.然而,SBP-box基因在蒺藜苜蓿中的功能至今仍不清楚.本研究運(yùn)用生物信息學(xué)手段,采用結(jié)構(gòu)域搜索的方法,利用已知基因所編碼蛋白質(zhì)中的結(jié)構(gòu)域?yàn)闄z索序列,對蒺藜苜蓿SBP-box基因家族全基因組進(jìn)行分析,共鑒定出22個蒺藜苜蓿SBP-box基因家族基因,這些基因編碼的蛋白質(zhì)序列中均包含高度保守的SBP結(jié)構(gòu)域.蒺藜苜蓿SBP-box家族成員多于在擬南芥和水稻基因組中鑒定出的17和19個基因[35-36].

通過序列比對和系統(tǒng)進(jìn)化方法,確定了蒺藜苜蓿SBP-box基因家族的分類和進(jìn)化關(guān)系.根據(jù)系統(tǒng)發(fā)生樹將SBP-box基因家族分成了5個亞家族.通過系統(tǒng)進(jìn)化樹分析得出, SBP-box基因在進(jìn)化上表現(xiàn)出差異性,暗示其基因功能的多樣性;同時每一亞家族的基因間保守性基序的結(jié)構(gòu)和順序相似,表明同一亞家族中的基因可能具有類似的功能.外顯子內(nèi)含子結(jié)構(gòu)分析表明,處在相同亞家族內(nèi)的蒺藜苜蓿SBP-box基因大部分具有相同的外顯子內(nèi)含子結(jié)構(gòu).SBP-box結(jié)構(gòu)域的進(jìn)化可能與基因結(jié)構(gòu)的多樣化有關(guān).蒺藜苜蓿中所有的SBP蛋白都具有完整且高度保守的SBP區(qū)(即兩個鋅指結(jié)構(gòu)和一個雙向核定位信號);在擬南芥及蒺藜苜蓿中序列較長的SBP蛋白,尤其是超過1 000個氨基酸殘基的SBP蛋白,除了保守的SBP結(jié)構(gòu)域還含有一些其他的區(qū)域,如亞家族D中的家族成員,這些區(qū)域可以促進(jìn)SBP蛋白進(jìn)入核內(nèi),進(jìn)一步通過翻譯后修飾而被調(diào)控,從而影響它進(jìn)入核的水平和與DNA結(jié)合的水平[6],進(jìn)一步影響基因在不同生物過程的表達(dá)水平.同源性分析是一種相對快速有效了解基因結(jié)構(gòu)、功能和進(jìn)化的方法[37].因此,蒺藜苜蓿SBP基因的功能可以通過與研究相對通透的模式植物擬南芥進(jìn)行同源性分析而推測得到.分布在同一亞家族的蒺藜苜蓿以及擬南芥SBP-box基因家族成員可能具有相同的功能.但這些基因的功能需要進(jìn)一步的試驗(yàn)驗(yàn)證.

基因復(fù)制對基因家族的進(jìn)化具有重要的意義,主要是因?yàn)榛驈?fù)制可為新基因的產(chǎn)生提供最原始的材料,而新基因的產(chǎn)生則促使其產(chǎn)生新的功能[38].植物基因的復(fù)制主要有3種方式:片段復(fù)制、串聯(lián)復(fù)制、轉(zhuǎn)座事件如逆轉(zhuǎn)錄轉(zhuǎn)座和重復(fù)轉(zhuǎn)錄等.片段復(fù)制是最主要的方式,因?yàn)榇蟛糠种参锝?jīng)歷了染色體加倍過程,并在基因組中保留了大量重復(fù)的染色體片段[39].本研究分析發(fā)現(xiàn)蒺藜苜蓿的SBP-box基因家族主要是通過片段復(fù)制進(jìn)行擴(kuò)張.之前的研究表明SPL4/SPL5,SPL9/SPL15以及SPL1/SPL12很可能是通過基因組水平重復(fù)而產(chǎn)生[40],在本研究中,它們分別分布于亞家族E,C以及D;同時SPL4/SPL5,SPL9/SPL15很可能于蕓薹屬(Brassica)植物分化之前就已經(jīng)存在,所以本研究推測亞家族E和C中的蒺藜苜蓿SBP-box基因家族成員存在較早;擬南芥中SPL10/SPL11具有相同的基因結(jié)構(gòu),且序列高度相似(82.1%),在染色體上彼此相鄰,它們可能是通過串聯(lián)重復(fù)機(jī)制產(chǎn)生,對應(yīng)的蒺藜苜蓿中發(fā)生串聯(lián)復(fù)制的SBP-box家族成員MtSBP20/MtSBP21以及MtSBP21/MtSBP22也分布在亞家族B中,且具有較高的同源性.擬南芥中SPL01/SPL12,AtSPL14(SPL1-Related2 protein (SPL1R2)),AtSPL16(SPL1-Related3 protein (SPL1R3))和蒺藜苜蓿中的4個家族成員MtSBP1,MtSBP2A,MtSBP3以及MtSBP4構(gòu)成了亞家族D,這個家族的基因結(jié)構(gòu)比較復(fù)雜并且含有除了SBP保守結(jié)構(gòu)域之外的其他的保守基序,這可能為這一家族適應(yīng)新的功能和進(jìn)化提供了條件.

本研究利用生物信息學(xué)方法進(jìn)行組織特異性表達(dá)模式分析,發(fā)現(xiàn)蒺藜苜蓿基因組中重復(fù)的基因發(fā)生了功能分歧.本研究收集到7對發(fā)生片段復(fù)制的蒺藜苜蓿SBP-box基因家族成員的表達(dá)數(shù)據(jù),其中6對表現(xiàn)出不同的表達(dá)模式聚類,所有這些結(jié)果表明片段復(fù)制的基因參與了植物生長發(fā)育的不同過程.亞家族D中發(fā)生復(fù)制的基因?qū)tSBP1/MtSBP2A具有共同的表達(dá)模式,這種表達(dá)模式可能意味著其中一個基因的表達(dá)已經(jīng)不占主導(dǎo)地位,或者是生物界常見的冗余現(xiàn)象.也有復(fù)制基因?qū)哂胁煌谋磉_(dá)模式,如位于亞家族A中的MtSBP13以及亞家族B中的MtSBP14,可能意味著基因家族成員正在不斷分化.

本研究揭示了蒺藜苜蓿SBP-box基因家族的起源、擴(kuò)增與進(jìn)化及可能的功能分化,為后續(xù)深入探究蒺藜苜蓿SBP-box基因家族的生物學(xué)功能提供了理論參考,并為豆科育種和其他遺傳研究提供相關(guān)依據(jù).相信隨著基因組和轉(zhuǎn)錄組數(shù)據(jù)的積累,對于蒺藜苜蓿SBP-box基因家族的了解將會越來越全面和深入.

參考文獻(xiàn):

[1] JIN J, ZHANG H, KONG L, et al. PlantTFDB 3.0: a portal for the functional and evolutionary study of plant transcription factors[J]. Nucleic Acids Res, 2014,42(D1): D1182-D1187.

[2] KLEIN J, SAEDLER H, HUIJSER P. A new family of DNA binding proteins includes putative transcriptional regulators of the Antirrhinum majus floral meristem identity gene SQUAMOSA[J]. Mol Gen Genet, 1996,250(1):7-16.

[3] CARDON G H, HHMANN S, NETTESHEIM K, et al. Functional analysis of the Arabidopsis thaliana SBP-box gene SPL3: A novel gene involved in the floral transition[J]. Plant J, 1997,12(2):367-377.

[4] BECRAFT P W, BONGARD-PIERCE D K, SYLVESTER A W, et al. The liguleless-1 gene acts tissue specifically in maize leaf development[J]. Dev Bio, 1990,141(1):220-232.

[5] LNNENP M, JNNEN I, HLTT-Vuori M, et al. A new SBP-box gene BpSPL1 in silver birch (Betula pendula)[J]. Physiol Plant, 2004,120(3):491-500.

[6] BIRKENBIHL R P, JACH G, SAEDLER H, et al. Functional dissection of the plant-specific SBP-domain: overlap of the DNA-binding and nuclear localization domains[J]. J Mol Biol, 2005,352(3):585-596.

[7] SCHMID M, UHLENHAUT N H, GODARD F, et al. Dissection of floral induction pathways using global expression analysis[J]. Development, 2003,130(24):6001-6012.

[8] UNTE U S, SORENSEN A-M, PESARESI P, et al. SPL8, an SBP-box gene that affects pollen sac development in Arabidopsis[J]. Plant Cell, 2003,15(4):1009-1019.

[9] JUNG C, YEU S Y, KOO Y J, et al. Transcript profile of transgenic Arabidopsis constitutively producing methyl jasmonate[J]. J Plant Biol, 2007,50(1):12-17.

[10] WANG H, NUSSBAUM-WAGLER T, LI B, et al. The origin of the naked grains of maize[J]. Nature, 2005,436(7051):714-719.

[11] TAN H W, SONG X M, DUAN W K, et al. Genome-wide analysis of the SBP-box gene family in Chinese cabbage (Brassica rapa subsp. pekinensis)[J]. Genome, 2015,58(11):463-477.

[12] SONG A, GAO T, WU D, et al. Transcriptome-wide identification and expression analysis of chrysanthemum SBP-like transcription factors[J]. Plant Physiol Biochem, 2016,102:10-16.

[13] YAMASAKI K, KIGAWA T, INOUE M, et al. A novel zinc-binding motif revealed by solution structures of DNA-binding domains of Arabidopsis SBP-family transcription factors[J]. J Mol Biol, 2004,337(1):49-63.

[14] MUNUSAMY P, ZOLOTAROV Y, METEIGNIER L V, et al. De novo computational identification of stress-related sequence motifs and microRNA target sites in untranslated regions of a plant translatome[J]. Sci Rep, 2017,7:43861.

[15] AKIBODE S, MAREDIA M K. Global and regional trends in production, trade and consumption of food legume crops: department of agricultural, food, and resource economics[M]. East Lansing: Michigan State University, 2012.

[16] TANG H, KRISHNAKUMAR V, BIDWELL S, et al. An improved genome release (version Mt4. 0) for the model legume Medicago truncatula[J]. BMC Genomics, 2014,15(1):312.

[17] YOUNG N D, DEBELL F, OLDROYD G E, et al. The Medicago genome provides insight into the evolution of rhizobial symbioses[J]. Nature, 2011,480(7378): 520-524.

[18] LAMESCH P, BERARDINI TZ, LI D, et al. The Arabidopsis Information Resource (TAIR): improved gene annotation and new tools[J]. Nucleic Acids Res, 2012,40(D1):D1202-D1210.

[19] BENEDITO V A, TORRES-JEREZ I, MURRAY J D, et al. A gene expression atlas of the model legume[J]. Plant J, 2008,55(3):504-513.

[20] HE J, BENEDITO V A, WANG M, et al. The Medicago truncatula gene expression atlas web server[J]. BMC Bioinf, 2009,10:441.

[21] BORATYN G M, CAMACHO C, COOPER P S, et al. BLAST: a more efficient report with usability improvements[J]. Nucleic Acids Res, 2013,41(W1):W29-W33.

[22] LETUNIC I, DOERKS T, BORK P. SMART 7: recent updates to the protein domain annotation resource[J]. Nucleic Acids Res, 2012,40(D1):D302-D305.

[23] MARCHLER-BAUER A, DERBYSHIRE M K, GONZALES N R, et al. CDD: NCBIs conserved domain database[J]. Nucleic Acids Res, 2015,43(D1):D222-D226.

[24] ARTIMO P, JONNALAGEDDA M, ARNOLD K, et al. ExPASy: SIB bioinformatics resource portal[J]. Nucleic Acids Res, 2012,40(W1):W597-W603.

[25] THOMPSON J D, GIBSON T, HIGGINS D G. Multiple sequence alignment using ClustalW and ClustalX[J]. Curr Protoc Bioinf, 2002,2(3):1-22.

[26] TAMURA K, STECHER G, PETERSON D, et al. MEGA6: molecular evolutionary genetics analysis version 6.0[J]. Mol Biol Evol, 2013,30(12): 2725-2729.

[27] HU B, JIN J, GUO A Y, et al. GSDS 2.0: an upgraded gene feature visualization server[J]. Bioinformatics, 2015,31(8):1296-1297.

[28] BAILEY T L, JOHNSON J, GRANT C E, et al. The MEME suite[J]. Nucleic Acids Res, 2015,43(W1):W39-W49.

[29] GOODSTEIN D M, SHU S, HOWSON R, et al. Phytozome: a comparative platform for green plant genomics[J]. Nucleic Acids Res, 2012,40(D1):D1178-D1186.

[30] WANG Y, TANG H, DEBARRY J D, et al. MCScanX: a toolkit for detection and evolutionary analysis of gene synteny and collinearity[J]. Nucleic Acids Res, 2012,40(7):e49-e49.

[31] LEE T H, TANG H, WANG X, et al. PGDD: a database of gene and genome duplication in plants[J]. Nucleic Acids Res, 2013,41(D1):D1152-D1158.

[32] ZHOU T, WANG Y, CHEN J Q, et al. Genome-wide identification of NBS genes in japonica rice reveals significant expansion of divergent non-TIR NBS-LRR genes[J]. Mol Genet Genomics, 2004,271(4):402-415.

[33] MANNING K, TR M, POOLE M, et al. A naturally occurring epigenetic mutation in a gene encoding an SBP-box transcription factor inhibits tomato fruit ripening[J]. Nat Genet, 2006,38(8): 948-952.

[34] WANG Y, HU Z, YANG Y, et al. Function annotation of an SBP-box gene in Arabidopsis based on analysis of co-expression networks and promoters[J]. Int J Mol Sci, 2009,10(1):116-132.

[35] GUO A Y, ZHU Q H, GU X, et al. Genome-wide identification and evolutionary analysis of the plant specific SBP-box transcription factor family[J]. Gene, 2008,418(1):1-8.

[36] YANG Z, WANG X, GU S, et al. Comparative study of SBP-box gene family in Arabidopsis and rice[J]. Gene, 2008,407(1):1-11.

[37] LYONS E, PEDERSEN B, KANE J, et al. Finding and comparing syntenic regions among Arabidopsis and the outgroups papaya, poplar, and grape: CoGe with rosids[J]. Plant Physiol, 2008,148(4):1772-1781.

[38] RENSING S A. Gene duplication as a driver of plant morphogenetic evolution[J]. Curr Opin Plant Biol, 2014,17:43-48.

[39] WANG Y, WANG X, PATERSON A H. Genome and gene duplications and gene expression divergence: a view from plants[J]. Ann N Y Acad Sci, 2012,1256(1):1-14.

[40] ZHANG B, LIU X, ZHAO G, et al. Molecular characterization and expression analysis of Triticum aestivum squamosa-promoter binding protein-box genes involved in ear development[J]. J Integr Plant Biol, 2014,56(6):571-581.

龙陵县| 汽车| 军事| 宁津县| 吉首市| 兴海县| 灌阳县| 襄樊市| 哈密市| 安岳县| 瑞安市| 体育| 盐津县| 平顺县| 磐石市| 长沙市| 佛坪县| 永登县| 甘肃省| 望谟县| 张掖市| 平塘县| 清新县| 射阳县| 喀喇沁旗| 柞水县| 兴义市| 常州市| 阿巴嘎旗| 威信县| 抚松县| 达州市| 阿尔山市| 巴东县| 华亭县| 海原县| 沿河| 裕民县| 泗洪县| 大田县| 濉溪县|