唐文武 吳秀蘭 李桂花
摘要:【目的】利用生物信息學分析蕓薹屬作物MS1基因的結構功能,為作物雜種優(yōu)勢利用提供理論參考?!痉椒ā恳詳M南芥花粉發(fā)育關鍵基因AtMS1為參考序列,通過BLAST比對獲得同源基因序列,運用生物信息學方法對其編碼氨基酸序列進行預測分析?!窘Y果】從甘藍型油菜、白菜、甘藍等蕓薹屬作物基因組中獲得4條同源序列,與AtMS1基因的相似性在88.0%以上,均含有3個外顯子,其CDS序列長度均為2004 bp,編碼667個氨基酸。4個蕓薹屬作物MS1蛋白均含有1個植物同源結構域(Plant homeodomain,PHD),屬于親水性不穩(wěn)定蛋白,定位于細胞核,磷酸化以絲氨酸(Ser)為主,以蘇氨酸(Thr)和酪氨酸(Tyr)為輔;二級結構均由α-螺旋、β-轉角、延伸鏈和無規(guī)則卷曲組成,其中α-螺旋所占比例最高,在40.00%以上,β-轉角所占比例最低,僅為10.00%左右;其三級結構大致相同,均為球狀的功能結構域。4個蕓薹屬作物MS1蛋白和AtMS1蛋白序列的相似性為95.69%。4個蕓薹屬作物MS1蛋白的PHD結構域序列高度保守,僅有3個位點氨基酸殘基存在差異。19個不同植物的MS1同源蛋白聚為兩大類,其中琴葉擬南芥、亞麻薺、蘿卜的MS1蛋白與4個蕓薹屬作物MS1蛋白及擬南芥AtMS1蛋白聚為一類,均屬于十字花科植物,即MS1蛋白的聚類結果與植物系統(tǒng)分類結果相吻合?!窘Y論】蕓薹屬作物MS1基因屬于PHD-finger基因家族,其序列高度保守,參與調控花粉發(fā)育成熟過程。
關鍵詞:蕓薹屬;MS1基因;生物信息學;花粉發(fā)育;同源序列
中圖分類號:S634.03 文獻標志碼:A 文章編號:2095-1191(2017)12-2122-07
0引言
【研究意義】雄性不育是植物有性繁殖過程中雄蕊發(fā)育異常引起無法授粉結實的現(xiàn)象,而花粉敗育是雄性不育的表型特征,因此揭示花粉發(fā)育分子調控機理是了解雄性不育的關鍵。十字花科蕓薹屬作物存在明顯的雜種優(yōu)勢,通過雄性不育系生產(chǎn)F1代種子是利用雜種優(yōu)勢的主要手段(唐文武等,2005)。目前,蕓薹屬的甘藍(Brassica oleracea L.)、白菜(B.rapa L.)和甘藍型油菜(B.napus L.)存在豐富的雄性不育變異材料,主要為核不育、細胞質不育及核質互作不育類型,在生產(chǎn)上已得到較好地利用,但其雄性不育的分子調控機理尚不明確。十字花科鼠耳芥屬(擬南芥屬)的擬南芥(Arabidopsis thaliana L.)作為模式植物,其花粉發(fā)育分子調控機理與雄性不育研究較深入,研究發(fā)現(xiàn)大多數(shù)從擬南芥克隆獲得的育性調控基因在其他植物中均有同源基因,且表現(xiàn)出高度的進化保守性和相似的結構功能(Ma et al.,2015)。因此,以擬南芥相關研究為基礎,預測分析蕓薹屬植物同源基因的結構功能,對了解油菜、甘藍、白菜等作物的雄性不育分子機理及其雜種優(yōu)勢利用具有重要意義。【前人研究進展】花粉發(fā)育是高度復雜的生物學過程,由造孢細胞分化成花粉母細胞,經(jīng)減數(shù)分裂形成四分體,然后在絨氈層酶的作用下形成單核的自由小孢子,再經(jīng)過兩次有絲分裂,最終發(fā)育成成熟的花粉粒,任何環(huán)節(jié)發(fā)生異常均可能導致雄性不育(McCormick,1993;Hong et al.,2012;Zhang et al.,2017a)。此外,花粉壁構成異常(Shi et al.,2011;Aloisi et al.,2016)及其最內(nèi)層的絨氈層細胞發(fā)育不完全(Li et al.,2011;Ma et al.,2015)也是花粉敗育的主要原因。至今,已從擬南芥克隆獲得13個雄性不育相關基因,其中擬南芥MS1基因(AtMS1)是調控花粉形成的關鍵基因(Re-imegfird et al.,2017),主要在四分體至小孢子釋放期表達,其編碼含植物同源結構域(Plant homeodo-main,PHD)的核蛋白,與花粉壁構成及其絨氈層發(fā)育密切相關(no et al.,2002;Yang et al.,2007)。水稻PTCl基因為AtMS1同源基因,同樣編碼含PHD結構域的核蛋白,表現(xiàn)出相似的調控絨氈層細胞發(fā)育和花粉壁構成的功能,且PTC1基因能與擬南芥突變體atms1實現(xiàn)部分遺傳互補,說明在單子葉植物和雙子葉植物中均存在一個控制雄蕊程序化發(fā)育的PTC1/MS1開關(Li et al.,2011;Zhang et al.,2017b)。由于擬南芥突變體armsl在表型方面僅表現(xiàn)花粉敗育,植株形態(tài)與花器官生長發(fā)育均正常(Wilson et al.,2001),因此AtMSl基因在生產(chǎn)上具有較高應用價值?!颈狙芯壳腥朦c】蕓薹屬植物作為重要的油料與蔬菜作物種質來源,尤其隨著白菜(Wang et al.,2011)、油菜(Chalhoub et al.,2014)和甘藍(Liu et al.,2014)全基因組序列的公布,其雄性不育的分子生物學研究已成為熱點,但鮮見蕓薹屬作物雄性不育相關基因的研究報道?!緮M解決的關鍵問題】以AtMSl基因序列為參考,搜索并下載其同源序列,利用生物信息學方法對其編碼蛋白質的理化性質、二級結構、三級結構、功能結構域及進化關系進行預測分析,為蕓薹屬作物雄性不育的分子機制和核不育系創(chuàng)制工作提供參考。
1材料與方法
1.1數(shù)據(jù)來源
從擬南芥TAIR網(wǎng)站(http:∥www.arabidopsis.org/)下載其花粉發(fā)育關鍵基因AtMS1的基因序列,其序列號為AT5G22260。以AtMS1基因序列為參考,在NCBI數(shù)據(jù)庫(https:∥www.ncbi.nlm.nih.gov/)和蕓薹屬BRAD基因組數(shù)據(jù)庫(http:∥brassicadb.org/brad/)中進行BLAST比對,設篩選標準為序列相似性≥88.0%。
1.2生物信息學分析
采用ProtParam進行蛋白質理化性質預測,利用SignalP 4.1進行蛋白質信號肽預測,以ProtScale進行蛋白親/疏水性分析,利用WoLF PSORT進行亞細胞定位預測,通過SOPMA在線工具進行蛋白二級結構預測,以SWISS-MODEL進行三級結構預測,利用NetPhos 3.1進行蛋白質的磷酸化位點預測,采用SMART進行蛋白質保守結構域預測,并以DNAman和MEGA 5.2進行不同物種的同源蛋白多重比較和構建系統(tǒng)發(fā)育進化樹。
2結果與分析
2.1 AtMS1基因同源序列獲取
從蕓薹屬作物基因組中獲得4個與AtMSl基因序列相似性大于88.0%的同源序列,其中2條序列來自甘藍型油菜(B.napus),分別位于A基因組的3號和10號染色體,將其命名為BnMS1A03(序列號106443696)和BnMSlAl0(序列號106370785);1條序列來自白菜(B.rapa),位于A基因組的10號染色體,命名為BrMS1A10(序列號103845560);1條序列來自甘藍(B.oleracea),位于C基因組的9號染色體,將其命名為BoMS1C09(序列號106316680)。這4個基因均含有3個外顯子,其CDS序列長度均為2004 bp,編碼667個氨基酸。
2.2 MS1蛋白的理化性質及亞細胞定位預測結果
蛋白質理化性質預測結果如表1所示,4個MS1基因所編碼蛋白的分子量約76.5 kD,不穩(wěn)定指數(shù)均超過41.00,屬于不穩(wěn)定蛋白;理論等電點(pI)以BoMS1C09最低(8.17),以BrMs1A10最高(8.47);脂肪氨基酸系數(shù)以BoMS1C09和BnMslA03最高(89.81),以BnMS1A10最低(86.01);疏水性系數(shù)均為負值(-0.319~-0.356),屬于親水性蛋白;均定位于細胞核。
2.3 MS 1蛋白的保守結構域及磷酸化位點分析結果
由圖1可知,4個MSl蛋白均含1個PHD結構域,且PHD結構域均位于661-657 aa,其前端有一個低復雜區(qū)。同樣,AtMSl蛋白僅含1個PHD結構域,位于616~662 aa。由此推測,MSl蛋白屬于PHD-fmger蛋白家族成員,N_PHD結構域在蕓薹屬進化中高度保守。PHD結構域含Cys4-His-Cys3(C4-HC3)鋅結合基序,其形態(tài)一般為球狀,能結合2個鋅離子而保持穩(wěn)定的空間結構,在基因轉錄和染色質狀態(tài)調控方面發(fā)揮重要作用(張帆等,2009)。
4個MS1蛋白磷酸化位點預測結果顯示,其均含有較多的磷酸化位點,以絲氨酸(Ser)磷酸化位點最多,其中又以BrMS1A10最多(30個位點),BoMS1C09和BriMS1A03最少(26個位點);其次是蘇氨酸(Thr)磷酸化位點,以BnMS1A10最多(17個位點),BoMS1C09最少(12個位點);以酪氨酸(Tyr)磷酸化位點最少,其中BoMS1C09最多(8個位點),而BrMS1A10和BnMS1A10最少(6個位點)(圖2)??梢?,MS1蛋白的磷酸化以Ser為主,以Thr和Tyr磷酸化為輔。
2.4 MS1蛋白的二、三級結構預測結果
二級結構預測結果如表2所示,4個MS1蛋白的二級結構均由α-螺旋、β-轉角、延伸鏈和無規(guī)則卷曲組成,其中α-螺旋為主要結構元件,所占比例均在40.00%以上,可能與此類蛋白含有PHD結構域和亮氨酸(Leu)拉鏈的結構有關,而β-轉角所占比例最低,僅為10.00%左右。對4個MS1蛋白進行同源建模,預測其三級結構。結果顯示,4個MS1蛋白均含有一個PHD結構域,位于616~652 aa,具有典型的C4HC3鋅結合基序;三級結構大致相同,均為球狀的功能結構域(圖3),有利于特異性識別組蛋白H3K4的甲基化密碼,從而發(fā)揮基因轉錄調控功能。
2.5 MS1蛋白的同源性分析結果
利用DNAMAN對擬南芥、白菜、甘藍和油菜中的MS1蛋白進行多序列比對分析,結果如圖4所示,5個MS1蛋白的氨基酸序列相似性為95.69%,表明其同源性極高,其中4個蕓薹屬作物MS1蛋白的氨基酸序列相似性更高,達98.39%。4個蕓薹屬作物MS1蛋白雙序列比對結果顯示,BoMS1C09與BnMS1A03的氨基酸序列相似性最高,達99.55%,BrMs1A10與BnMS1A10的氨基酸序列相似性也高達98.35%。擬南芥AtMS1與4個蕓薹屬作物MS1蛋白的雙序列比對結果顯示,AtMS1與BrMs1A10、BoMS1C09、BnMS1A03、BnMS1A10的氨基酸序列相似性分別為88.15%、88.44%、88.59%和88.59%,表明十字花科植物MS1基因進化中,擬南芥與蕓薹屬作物的親緣關系較遠,而3個蕓薹屬作物(白菜、甘藍和甘藍型油菜)的親緣關系較近。
由圖4還可知,5個MS1蛋白PHD結構域的序列高度保守,僅有3個位點氨基酸殘基存在差異。方框內(nèi)的7個半胱氨酸(Cys)和1個組氨酸(His)構成了C4HC3鋅結合基序,PHD結構域的共有序列為C-X1-C-X12-C-X2-C-X4-H-X2-C-X14-C-X2-C,與張帆等(2009)的研究結果一致。PHD結構域Cys C2與C3之間的12個氨基酸殘基形成Loopl,而C5與C6之間的14個氨基酸殘基形成Loop2,每環(huán)各與1個鋅離子結合形成穩(wěn)定的Cross-brace拓撲結構,此類PHD結構域能與特異的核蛋白相互作用,進而調節(jié)基因轉錄表達。同時Cys之間及Cys與His之間的氨基酸較保守,與Bienz(2006)的研究結果一致。表明MS1蛋白在進化過程中其序列高度保守性,不易發(fā)生變異,以確保其花粉育性調控功能的穩(wěn)定性。
2.6 MS1同源基因的系統(tǒng)進化分析結果
通過NCBI等數(shù)據(jù)庫檢索,從豆科的木豆(Caja-nus cajan)、鷹嘴豆(Cicer arietinum)、綠豆(Hgna radiata)、薔薇科的森林草莓(Fragaria vesca)、梅花(Prunus mume)、茄科的煙草(Nicotiana tabacum)、楊柳科的胡楊(Populus euphratica)、梧桐科的可可(Theobroma cacao)、鼠李科的棗(Ziziphus Jujuba)、錦葵科的陸地棉(Gos~pium hirsutum)、胡桃科的核桃(Juglans regia)及十字花科琴葉擬南芥(Arabidop-sis lyrata)、亞麻薺(Camelina sativa)、蘿卜(Rapha-nus sativus)等植物中獲得MS1同源蛋白氨基酸序列,均含PHD結構域,被預測為雄性不育的同源蛋白序列。將其與AtMS1和4個蕓薹屬MS1蛋白(BnMS1A03、BnMSlA10、BrMS1A10和BoMS1C09)進行聚類分析并構建系統(tǒng)發(fā)育進化樹,設自舉值(Bootstrap)為1000。結果如圖5所示,19個MS1同源蛋白聚為兩大類,其中琴葉擬南芥、亞麻薺和蘿卜的MS1蛋白與4個蕓薹屬MS1蛋白及AtMS1蛋白聚為一類,均屬于十字花科植物;其他科的植物MS1蛋白聚為另一類,其中豆科的木豆、鷹嘴豆和綠豆的MS1蛋白聚為一小簇,薔薇科森林草莓、梅花與鼠李科棗的MS1蛋白聚為一小簇,而錦葵科的陸地棉、梧桐科的可可與楊柳科的胡楊MS1蛋白聚為一小簇。該聚類結果與植物系統(tǒng)分類關系、進化歷程基本吻合,因此該類蛋白可用于植物親緣關系鑒定及遺傳進化分析。
3討論
PHD是真核生物中廣泛存在的一種進化保守的鋅指結構域,目前在400多種真核生物蛋白質中均有發(fā)現(xiàn)(Kaadige and Ayer,2006),由50~80個氨基酸殘基組成,具有典型的C4HC3鋅結合基序,其7個半胱氨酸殘基和1個組氨酸殘基結合2個鋅離子而形成2個環(huán),促使整個結構域保持穩(wěn)定并發(fā)揮調節(jié)功能(Townsley et al.,2004)。PHD結構域是14種已知的鋅指結構域中的一種,作為組蛋白密碼的解讀器之一,在基因轉錄調控、細胞周期調控等過程發(fā)揮重要作用。但這些研究主要集中在人類、小鼠等動物上,在植物研究較少,包括PHD-finger基因家族蛋白在植物開花調控、逆境脅迫應答等方面的研究。PHD-finger基因家族在植物開花調控方面發(fā)揮重要作用,如在擬南芥春化途徑中,含PHD結構域的春化不敏感蛋白(VIN3)能通過對開花抑制基因FLC的染色質組蛋白進行甲基化、乙?;裙矁r修飾,使得FLC染色質從松弛狀態(tài)轉為凝縮狀態(tài),通過關閉FLC轉錄活性而促進開花(Kim and Sung,2017);擬南芥At-MS1基因編碼含PHD結構域的核蛋白與花粉壁構成及其絨氈層發(fā)育有關(Ito et al.,2007;Yang et al.,2007);水稻PTC1基因編碼含有PHD結構域的核蛋白調控花粉壁構成及絨氈層細胞發(fā)育,形成控制雄蕊程序化發(fā)育的PTC1/MS1開關(Li et al.,2011;Zhang et al.,2017b)。PHD-finger基因家族蛋白在生物逆境應答方面也發(fā)揮重要作用,如水稻OsPHD1在逆境環(huán)境下表達量明顯升高,且轉基因水稻通過調節(jié)OsPHD1基因表達量來調控其抗逆性(劉雨等,2011);玉米PHD-finger基因家族在玉米發(fā)育過程中廣泛表達,其中有15個基因可能與逆境脅迫應答密切相關(Wang et al.,2015)。也有研究表明,在擬南芥雄蕊減數(shù)分裂前期Ⅰ至中期Ⅰ中,染色質蛋白MMD1/DUET中的MMD1蛋白PHD結構域在染色體壓縮及與甲基化的組蛋白尾結合中發(fā)揮重要功能作用(Wang et al.,2016)。本研究以AtMS1基因為參考,從NCBI數(shù)據(jù)庫中篩選獲得蕓薹屬植物(甘藍型油菜、白菜和甘藍)的MS1同源基因,其編碼蛋白均含有PHD結構域,屬于PHD-fmger基因家族成員(Wilson et al.,2001),定位于細胞核內(nèi),與AtMS1蛋白(Ye et al.,2010)和水稻PTC1蛋白(Li et al.,2011)的亞細胞定位結果一致。
PHD-finger基因家族蛋白主要通過甲基化、磷酸化、乙酰化、泛素化等方式修飾組蛋白,從而改變?nèi)旧|的狀態(tài)而參與基因的轉錄調控,如動物ME-KK1蛋白的PHD結構域具有E3泛素連接酶活性,能介導ERK1的泛素化和降解(馬紅輝等,2008);PHD結構域能特異識別并結合組蛋白H3K4進行甲基化修飾,從而發(fā)揮基因轉錄調控功能,如腫瘤抑制蛋白ING家族的PHD結構域能識別H3K4me2/3,并將復合物結合在D1啟動子上,從而抑制基因轉錄(Shi et al.,2006)。磷酸化作為重要的蛋白修飾方式,由激酶和磷酸酶分別催化磷酸化和去磷酸化反應,在花藥發(fā)育過程中參與不同信號轉導(Yang et al,2015),但鮮見蛋白磷酸化與花粉發(fā)育相關性的研究報道。本研究中4個蕓薹屬作物MS1蛋白含有較多的磷酸化位點,且各蛋白的磷酸化以Ser為主,以Thr和Tyr磷酸化為輔,但由于蛋白磷酸化具有短暫性、高動態(tài)性及低豐度等特點,因此MS1蛋白的生物學功能與各位點的磷酸化修飾相關性尚需進一步研究。
4結論
蕓薹屬作物MSl基因屬于PHD-finger基因家族,其序列高度保守,參與調控花粉發(fā)育成熟過程。