胡風(fēng)越,劉廷武,周曼麗,周穎君,周 芮,楊立明,紀(jì)劍輝
(淮陰師范學(xué)院生命科學(xué)學(xué)院,江蘇淮安223300)
在植物的轉(zhuǎn)錄因子家族中,研究得較為全面的是與逆境相關(guān)的轉(zhuǎn)錄因子,如 ABF、MYB、NAC、DREB、DOF、WRKY 等轉(zhuǎn)錄因子家族,對這些轉(zhuǎn)錄因子相關(guān)基因的恰當(dāng)?shù)霓D(zhuǎn)化運(yùn)用,可以提高植物對逆境脅迫的耐受性[1-6]。Trihelix轉(zhuǎn)錄因子是與抗逆相關(guān)的轉(zhuǎn)錄因子家族之一,目前在擬南芥、水稻、棉花、高粱等植物中均有相關(guān)研究。研究顯示,擬南芥中有30個Trihelix轉(zhuǎn)錄因子,而水稻中含有31個[7]。此外,由于Trihelix轉(zhuǎn)錄因子在光應(yīng)答反應(yīng)、植物生長發(fā)育和逆境脅迫中顯著的調(diào)控作用[8-12],它們對生產(chǎn)實(shí)踐中的品種改良應(yīng)用具有重要意義。二穗短柄草由于具有植株矮小、生育期短、遺傳轉(zhuǎn)化率高以及其與小麥基因組相似度高達(dá)95%、能同樣感染小麥易感的各種細(xì)菌的特點(diǎn),成為繼擬南芥和水稻之后新型模式植物的理想植株,并能有效彌補(bǔ)模式植物水稻的不足[13-14]。本研究利用生物信息學(xué)分析手段,對二穗短柄草Trihelix轉(zhuǎn)錄因子家族基因進(jìn)行結(jié)構(gòu)特征、進(jìn)化情況及染色體定位等分析,并對該基因家族在水稻、二穗短柄草以及玉米等物種染色體區(qū)段的復(fù)制作了分析,以期更全面地了解禾本科植物Trihelix基因家族。1 材料與方法
在植物轉(zhuǎn)錄因子數(shù)據(jù)庫(Plant Transcription Factor Database,簡稱TFDB)中獲取水稻、二穗短柄草、玉米、高粱及擬南芥中的Trihelix基因序列,隨后對相關(guān)數(shù)據(jù)進(jìn)行整合分析,利用Pfam方法在水稻中檢測是否存在此家族蛋白的特征結(jié)構(gòu)域,借助同樣的方法,完成對Trihelix特殊結(jié)構(gòu)域的序列篩選,進(jìn)而得到不同物種Trihelix蛋白的全部序列[15]。利用ExPASy數(shù)據(jù)庫(http://www.expasy.org/)對二穗短柄草Trihelix蛋白的分子量、染色體位置、等電點(diǎn)等基因組信息進(jìn)行在線分析[16]。
根據(jù) Trihelix家族保守結(jié)構(gòu)域特點(diǎn),在 MEME程序(http://meme.nbcr.net/meme/cgi- bin/meme.cgi)中,將參數(shù)設(shè)置成“any”,設(shè)定這些基序的長度為10~200,預(yù)期有20個基序[17],來分析其蛋白質(zhì)保守基序。
首先對Trihelix家族特殊保守結(jié)構(gòu)域的氨基酸進(jìn)行多序列聯(lián)配分析,應(yīng)用Cluster 3.0軟件分析所得結(jié)果,隨后借助Mega軟件(http://www.megasoftware.net/)對二穗短柄草Trihelix保守結(jié)構(gòu)域作進(jìn)一步分析,Bootstrap的值設(shè)定成1 000[18],隨后將 Mega 程序分析的結(jié)果借助 WebLogo 3.3 軟件進(jìn)行圖示化,即可驗(yàn)證轉(zhuǎn)錄因子保守域的分析結(jié)果。依據(jù)二穗短柄草Trihelix特殊結(jié)構(gòu)域分析的方法和步驟,采用鄰接法構(gòu)建出水稻、擬南芥、玉米、二穗短柄草和高粱中該家族的系統(tǒng)進(jìn)化樹[19],發(fā)現(xiàn)在不同物種中,Trihelix家族均主要分為5個亞類。這一結(jié)果顯示,在植物不同物種中,Trihelix轉(zhuǎn)錄因子家族基因仍具有較高的保守性。
利用植物基因組復(fù)制數(shù)據(jù)庫(PGDD,網(wǎng)址為 http://chibba.agtec.uga.edu/duplication/)對所選的 Trihelix 基因各自所在染色體區(qū)段的線性復(fù)制情況[20]進(jìn)行分析,將所有存在染色體復(fù)制關(guān)系的數(shù)據(jù)進(jìn)行整理,借助基因染色體定位軟件MapInspect完成圖示化;此外,按照上述方法將二穗短柄草與水稻、二穗短柄草與高粱、二穗短柄草與玉米的Trihelix基因利用植物基因組復(fù)制數(shù)據(jù)庫進(jìn)行線性復(fù)制關(guān)系分析,相關(guān)結(jié)果借助Circos軟件進(jìn)行圖示化[21],便可直觀地看出所需檢測的染色體之間的同源性關(guān)系。
在二穗短柄草基因組數(shù)據(jù)庫中共鑒定出28個Trihelix轉(zhuǎn)錄因子。對其蛋白質(zhì)大小、分子量、等電點(diǎn)以及染色體位置等基本信息進(jìn)行分析,結(jié)果顯示其中氨基酸序列最長的有975個,最短的有128個,分子量為 14.01~96.63 ku,等電點(diǎn)為3.976 3~11.578 9。蛋白結(jié)構(gòu)域保守型分析結(jié)果顯示,氨基酸殘基色氨酸(Trp,簡稱 W)-2、W -63、半胱氨酸(Cys,簡稱C)-99(2、63、99分別表示在此氨基酸序列上的第2、63、99位)具有極高保守性(圖1),且短柄草所有Trihelix轉(zhuǎn)錄蛋白中均包含典型的螺旋-環(huán)-螺旋保守結(jié)構(gòu)。
依據(jù)Trihelix蛋白保守序列特點(diǎn),在MEME程序中采用鄰接法構(gòu)建了二穗短柄草Trihelix基因家族的進(jìn)化樹(圖2),結(jié)果將二穗短柄草Trihelix基因家族分為5個亞類。在數(shù)量分布上,亞家族Ⅳ中含有最少的Trihelix轉(zhuǎn)錄因子,而亞家族Ⅴ含有的Trihelix轉(zhuǎn)錄因子最多;在分支結(jié)構(gòu)上,亞家族Ⅰ和Ⅱ的同源關(guān)系相對較近,且可看出在亞家族Ⅴ上的Bradi3g45230基因與其他Trihelix基因的親緣關(guān)系較遠(yuǎn)。此外,對水稻、擬南芥、二穗短柄草和高粱中的Trihelix蛋白進(jìn)行聚類分析發(fā)現(xiàn),Trihelix家族均分為5個亞類(Ⅰ~Ⅴ)(圖3),且每個亞類中均有Trihelix轉(zhuǎn)錄因子分布,由此可清晰地看出各物種中Trihelix轉(zhuǎn)錄因子之間的同源關(guān)系。高粱、玉米的Trihelix基因進(jìn)化距離較長,分別有近71%、69%的基因在進(jìn)化樹的末端才分支,因而推測這2個物種Trihelix基因的進(jìn)化較晚,其次是二穗短柄草和擬南芥,最早的是水稻。
基于MEME程序的蛋白結(jié)構(gòu)域分析結(jié)果顯示,二穗短柄草的28個Trihelix轉(zhuǎn)錄因子同樣可被分為5個亞家族,與上述進(jìn)化樹分析結(jié)果一致。就同一亞家族內(nèi)結(jié)構(gòu)特點(diǎn)分析可知:亞家族Ⅰ中都含有保守基序Motif2、Motif1和Motif5,親緣關(guān)系更為接近的Bradi3g46210和Bradi5g11070基因表達(dá)蛋白的C端都含有Motif16;亞家族Ⅱ中共有的保守基序與亞家族Ⅰ相比不含有Motif5;亞家族Ⅲ中均存在Motif1和Motif8;亞家族Ⅳ的顯著特征是含有1段由Motif3、Motif1和Motif12相鄰構(gòu)成的保守序列;亞家族Ⅴ中親緣關(guān)系較近的Bradi3g00697、Bradi5g17150、Bradi1g77610 和 Bradi3g30457均含有Motif 3,均與Motif19緊密相鄰,且后3種Trihelix轉(zhuǎn)錄因子的同源性更高。在不同亞家族之間,根據(jù)Motif5和Motif2判斷亞家族Ⅰ和亞家族Ⅱ在系統(tǒng)發(fā)生上親緣關(guān)系更接近。此外,在所有Trihelix轉(zhuǎn)錄因子中Motif1蛋白序列高度保守(圖4)。
用Mapinspect軟件分析圖示,可見二穗短柄草的28個保守Trihelix基因在5條染色體上均有分布(圖5),在3號染色體上分布最多,有9個Trihelix基因,而在1號和4號染色體上最少,僅有3個。并且,Trihelix基因在同一染色體上還存在聚集現(xiàn)象。如在3號染色體上9個Trihelix基因聚集在3個區(qū)段,分別位于0.27、32、46 Mb附近;而5號染色體上所有Trihelix基因均聚集在11~28 Mb區(qū)段,即位于染色體長臂區(qū)段。
由于高粱、水稻和玉米均為單子葉植物,其相互之間親緣較近,所以通過比較二穗短柄草與這三者之間的染色體復(fù)制情況,可以分析Trihelix基因在種內(nèi)和種間的進(jìn)化軌跡。復(fù)制分析結(jié)果見圖6,可見二穗短柄草的染色體有5對,首先,其自身同一亞家族的Trihelix基因會形成復(fù)制關(guān)系,其次,二穗短柄草與高粱(10對染色體)、水稻(12對染色體)和玉米(10對染色體)也形成了線性復(fù)制。據(jù)此可推測,在物種進(jìn)化過程中可能發(fā)生了染色體加倍、易位,以及基因的復(fù)制、重排、缺失和一些同源基因的丟失等進(jìn)化事件。
Trihelix轉(zhuǎn)錄因子又稱為GT因子家族[22-23],因其含有3個螺旋環(huán)的特殊保守結(jié)構(gòu)而得名,并且其結(jié)構(gòu)與MYB轉(zhuǎn)錄因子家族極為相似,但因連接helix的結(jié)構(gòu)不同(“環(huán)”或“轉(zhuǎn)角”)而造成功能上的差異,在系統(tǒng)發(fā)生上,Trihelix轉(zhuǎn)錄因子可能來源于1 個 MYB -like基因[24-25]。
Trihelix轉(zhuǎn)錄因子最初只在植物中發(fā)現(xiàn),后來有研究推測可能在人類和果蠅中也存在,陸婷婷研究表明,Trihelix轉(zhuǎn)錄因子在動物和植物中有不同的結(jié)構(gòu),絕大多數(shù)植物Trihelix蛋白為單Trihelix功能域蛋白,而動物中單Trihelix功能域占少數(shù),取而代之出現(xiàn)了3個Trihelix功能域蛋白和6個Trihelix功能域蛋白,且多伴有其他功能域如SCAN功能域[由C2H2鋅指蛋白家族成員SRE-ZBP、Ctfin51、AW-1(ZNF174)和Number 18組成],以輔助調(diào)節(jié)動物的生長代謝過程[26]。而在功能上,植物中Trihelix轉(zhuǎn)錄因子主導(dǎo)光應(yīng)答、植物生長發(fā)育中的蛋白表達(dá)調(diào)控以及與抗干旱、耐鹽、冷害、病害等逆境脅迫應(yīng)答相關(guān)[11,27-28],動物中 Trihelix蛋白輔助調(diào)控生長代謝,具體功能仍待探索。
本研究通過對二穗短柄草Trihelix轉(zhuǎn)錄因子的生物信息學(xué)分析,共鑒定出5個亞家族共28個Trihelix轉(zhuǎn)錄因子基因,水稻中是5個亞類31個Trihelix轉(zhuǎn)錄因子基因,二穗短柄草中Trihelix轉(zhuǎn)錄因子數(shù)量雖不及水稻,但從聚類分析結(jié)果來比較,仍具有較高的相似性。水稻、高粱和玉米Trihelix多基因進(jìn)化關(guān)系構(gòu)建結(jié)果同時表明,Trihelix在物種間的進(jìn)化晚于在物種內(nèi)的進(jìn)化;此外,依據(jù)Trihelix轉(zhuǎn)錄因子在系統(tǒng)進(jìn)化樹上的進(jìn)化距離,推測Trihelix在高粱和玉米中的進(jìn)化最晚,在二穗短柄草和擬南芥中次之,最早是在水稻中,但此結(jié)論需要進(jìn)一步研究證實(shí)。
綜上,通過對單子葉禾本科模式植物二穗短柄草的生物信息學(xué)研究,分析其Trihelix轉(zhuǎn)錄因子家族基因的鑒定、結(jié)構(gòu)特征、進(jìn)化特點(diǎn)、染色體定位及復(fù)制情況,從而對禾本科植物的Trihelix轉(zhuǎn)錄因子有更全面的了解,為小麥等其他未測序物種的基因功能分析奠定了基礎(chǔ)。