帥敏敏,張啟香,黃有軍
(浙江農(nóng)林大學(xué) 林業(yè)與生物技術(shù)學(xué)院,浙江 杭州 311300)
CONSTANS(CO)基因是植物響應(yīng)光周期調(diào)控的重要基因,位于生物鐘的輸出途徑上,能正調(diào)控下游開花基因SOC1和FT,進(jìn)而調(diào)控植物開花。PUTTERILL等[1]首先在擬南芥Arabidopsis thaliana中分離出CO基因,反轉(zhuǎn)錄PCR(RT-PCR)檢測(cè)到CO基因在根和葉中表達(dá)。ONOUCHI等[2]對(duì)花椰菜Brassica oler-acea 花葉病毒 35S(Cauliflower mosaic virus 35S,CaMV 35S)融合 CO(35S:CO)轉(zhuǎn)化擬南芥研究發(fā)現(xiàn), CO蛋白會(huì)誘導(dǎo)早花和喪失光周期敏感性。進(jìn)一步研究發(fā)現(xiàn)[3],CO在染色體上的位置介于生物節(jié)律鐘基因和下游開花基因之間,可將光信號(hào)轉(zhuǎn)變?yōu)殚_花信號(hào)。對(duì)擬南芥CO基因過表達(dá)研究[1]發(fā)現(xiàn),CO基因過表達(dá)的植株比野生型提前開花,表明CO蛋白的活性決定開花時(shí)間;但這種調(diào)控在不同成員間并不一致,過表達(dá)COL1和COL2對(duì)植株開花時(shí)間沒有影響[4],過表達(dá)COL9則導(dǎo)致開花延遲,但COL9缺失突變體在長日照下又表現(xiàn)為早花,說明COL9不但抑制CO基因表達(dá)調(diào)控開花時(shí)間,同時(shí)下調(diào)FT的表達(dá)水平從而延遲成花轉(zhuǎn)變[5]。COL3在擬南芥光形態(tài)建成時(shí)起正調(diào)控作用,促進(jìn)側(cè)根生長和花色素苷積累,并調(diào)節(jié)長日照敏感植物的花芽分化[6]。從形態(tài)來看,CO基因常以多拷貝的形式存在,如擬南芥的CO家族有17個(gè)成員[7],水稻Oryza sativa中有16個(gè)成員[8],甘藍(lán)型油菜Brassica napus中也克隆到4個(gè)CO同源基因[9]。但各CO家族成員的功能存在明顯差異。葡萄Vitis vinifera的VvCOL1主要在芽休眠過程中起作用,表明該基因參與光周期,控制芽休眠的誘導(dǎo)和維持[10]。擬南芥中過表達(dá)衣藻Chlamydomonas reinhardtii的CrCO會(huì)表現(xiàn)出早花表型,結(jié)合衣藻的研究發(fā)現(xiàn):CrCO對(duì)淀粉的合成和細(xì)胞分裂有調(diào)節(jié)功能,推測(cè)CO在高等植物中可能仍保持調(diào)節(jié)淀粉合成[11]。大麥Hordeum vulgare的HvCO1和Hd1基因與CO親緣關(guān)系最近,可以通過激活HvFT1誘導(dǎo)大麥開花[8],但在轉(zhuǎn)基因擬南芥中則丟失該功能[12]。擬南芥co突變體過表達(dá)牽?;↖pomoea nil的PnCO基因可促進(jìn)植物開花[13]。黑麥草Lolium perenne的LpCO可以互補(bǔ)擬南芥co突變體的晚花表型[14],甜菜Beta vulgaris的BvCO1可以修復(fù)擬南芥co-2突變體的晚花表型[15]。大豆Glycine max的GmCO9影響根的發(fā)育,與種子的成熟密切相關(guān)[16]。毛果楊Populus trichocarpa的PtCO促使植株提前開花,也可調(diào)控植株的生長和芽的分化[17]。本研究以14個(gè)已被測(cè)序的物種為試驗(yàn)材料,通過生物信息學(xué)手段,從外顯子-內(nèi)含子結(jié)構(gòu)、基因重復(fù)、基因差異表達(dá)分析等3個(gè)方面開展CO家族研究,為探討不同家族成員的潛在功能提供依據(jù)。
從植物基因組數(shù)據(jù)Phytozome(http://www.phytozome.net)中下載其中13個(gè)物種的全基因組序列、蛋白質(zhì)及對(duì)應(yīng)編碼序列(coding sequence,CDS),分別為藻類植物1種,苔蘚植物1種,蕨類植物1種,被子植物9種(長日照植物、短日照植物和日中性植物各3種),以無油樟Amborella trichopoda作為被子植物的對(duì)照。此外裸子植物1種(挪威云杉Picea abies),其相應(yīng)序列來源于http://congenie.org。
數(shù)據(jù)查找步驟:①從PFAM蛋白質(zhì)數(shù)據(jù)庫獲得CO結(jié)構(gòu)域的隱馬爾可夫模型(PF06203和PF00643)并作為查詢序列,得到的數(shù)據(jù)儲(chǔ)存于Windows平臺(tái)環(huán)境下構(gòu)建的各個(gè)物種全基因組氨基酸序列的本地?cái)?shù)據(jù)庫中。②利用HMMER軟件包的hmmsearch程序,默認(rèn)參數(shù)條件下在本地?cái)?shù)據(jù)庫進(jìn)行BLASTP搜索,篩選出符合E-value≤0.01的蛋白質(zhì)序列作為CO候選同源蛋白。③將備選CO基因的CDS序列通過BLASTN的比對(duì),在全基因組核酸序列中搜索,獲得CO在染色體上準(zhǔn)確定位信息。④在PFAM蛋白質(zhì)數(shù)據(jù)庫和SMART蛋白質(zhì)數(shù)據(jù)庫下對(duì)搜索得到的所有同源候選基因蛋白質(zhì)序列進(jìn)行鑒定,剔除不含CO(PF06203和PF00643)結(jié)構(gòu)域的氨基酸序列。以此完成各個(gè)物種CO家族所有成員的鑒定。
利用MUSCLE的默認(rèn)參數(shù)進(jìn)行蛋白質(zhì)多序列比對(duì)分析;使用MEGA 7.0對(duì)完成比對(duì)的蛋白質(zhì)序列構(gòu)建系統(tǒng)進(jìn)化樹;構(gòu)建方法選用鄰近法(NJ);距離模型采用泊松矯正;空位缺失數(shù)據(jù)的處理采用兩兩刪除;系統(tǒng)發(fā)育統(tǒng)計(jì)的可靠性檢測(cè)采用bootstrap分析,使用1 000次重復(fù)。
利用在線軟件GSDS(Gene Structure Display Server)比較CO家族成員的CDS序列和基因序列,分析CO家族基因的外顯子-內(nèi)含子組成和分布,結(jié)合系統(tǒng)發(fā)育分析,探究CO在基因結(jié)構(gòu)上的進(jìn)化規(guī)律。
利用植物基因組PGDD數(shù)據(jù)庫(http://chibba.agtec.uga.edu/duplication/)搜索染色體上的共線性片段,分析含有的CO基因的共線性區(qū)段,研究CO家族不同成員的相互聯(lián)系和進(jìn)化過程。
搜索14個(gè)物種的國際核酸序列數(shù)據(jù)庫(NCBI,https://www.ncbi.nlm.nih.gov/),發(fā)現(xiàn)水稻關(guān)于繁殖發(fā)育的轉(zhuǎn)錄組數(shù)據(jù)最為完整。利用GEO數(shù)據(jù)庫(GSE56463)下載水稻8個(gè)不同時(shí)期不同部位(花芽、花、開花前的旗葉、開花后的旗葉、開花前的根、開花后的根、未成熟種子、成熟種子)的植物組織轉(zhuǎn)錄組數(shù)據(jù)(RNA-seq)。轉(zhuǎn)錄組數(shù)據(jù)全部采用FPKM標(biāo)準(zhǔn)化后的值。以水稻為例,從轉(zhuǎn)錄水平重點(diǎn)分析CO家族不同成員在花發(fā)育和種子形成過程中的表達(dá)變化,從而探討它們可能的生物學(xué)功能。
搜索14個(gè)物種蛋白質(zhì)數(shù)據(jù)庫中的CO家族成員,共鑒定出159個(gè)含有CO結(jié)構(gòu)域的蛋白質(zhì)序列。結(jié)果表明:CO常以多拷貝的形式存在于植物中,與以往的研究一致[8]??截悢?shù)最多的物種是大豆,鑒定出25個(gè)家族成員。其次在胡蘿卜Daucus carota,小立碗蘚Physcomitrella patens,菜豆Phaseolus vulgaris,番茄Solanum lycopersicum,黃瓜Cucumis sativus和蓖麻Ricinus communis中,分別鑒定到18,15,13,13,12和10個(gè)拷貝。在小麥,無油樟和卷柏Selaginella moellendorffii中,也發(fā)現(xiàn)了5,5和4個(gè)CO基因家族成員。挪威云杉和衣藻中拷貝數(shù)最少,各存在3個(gè)成員。
使用鄰近法對(duì)得到的14個(gè)物種159個(gè)CO蛋白序列構(gòu)建系統(tǒng)發(fā)育進(jìn)化樹。由生成的無根系統(tǒng)進(jìn)化樹(圖1)可知,植物CO家族在進(jìn)化中具有多樣性,大部分同一譜系的物種基因都能聚類在同一進(jìn)化枝上。根據(jù)結(jié)構(gòu)域特征,選取支持度高且結(jié)構(gòu)穩(wěn)定的3個(gè)亞家族(分別命名為B1,B2和B3)作為后續(xù)研究CO基因的基礎(chǔ)框架。其中B1亞家族含2個(gè)B-box結(jié)構(gòu)域和1個(gè)CCT結(jié)構(gòu)域;B2亞家族含1個(gè)B-box結(jié)構(gòu)域,1個(gè)CCT結(jié)構(gòu)域和1個(gè)鋅指結(jié)構(gòu);B3亞家族含1個(gè)B-box結(jié)構(gòu)域和1個(gè)CCT結(jié)構(gòu)域。
圖1 CO家族成員的系統(tǒng)發(fā)育樹Figure 1 Phylogenetic tree of CO family members
CO家族成員的預(yù)測(cè)結(jié)構(gòu)(圖2)顯示,多數(shù)物種的CO基因中存在2~4個(gè)外顯子,同一亞家族內(nèi)基因的外顯子-內(nèi)含子結(jié)構(gòu)和長度高度相似,說明這些物種的CO基因家族成員之間的親緣關(guān)系也較近,同時(shí)也證實(shí)了CO基因家族系統(tǒng)進(jìn)化樹的可信度。具體而言,B1亞家族中的大多數(shù)基因含2個(gè)外顯子,1個(gè)內(nèi)含子;B2亞家族中則表現(xiàn)為每個(gè)CO基因含4個(gè)外顯子和3個(gè)內(nèi)含子,且排列相位表現(xiàn)出“0,0,2”規(guī)律;B3亞家族相對(duì)較為復(fù)雜,多數(shù)的CO基因含有2個(gè)外顯子,部分含有4個(gè)外顯子,但也有例外,如CrCO3基因,不僅長度較大,還發(fā)現(xiàn)存在14個(gè)外顯子和13個(gè)內(nèi)含子,體現(xiàn)在系統(tǒng)進(jìn)化樹中則出現(xiàn)CrCO3分化為獨(dú)立的進(jìn)化枝。研究還發(fā)現(xiàn),CO基因包含大量的相位為0的內(nèi)含子,表明外顯子改組可能在CO基因的進(jìn)化中起著一定的作用,而外顯子的插入和內(nèi)含子的刪除可以認(rèn)為是形成多元化的CO基因以及功能差異的CO蛋白的原因之一。
對(duì)擬南芥、菜豆、蓖麻3種植物CO家族的基因復(fù)制事件的研究可以用來檢測(cè)CO基因家族中遺傳差異間的聯(lián)系和相應(yīng)的擴(kuò)張模式,CO家族的成員可作為錨定基因研究所在染色體區(qū)段的分子進(jìn)化歷史。染色體定位分析(圖3,圖4)表明,絕大多數(shù)的CO基因在基因組中是隨機(jī)分布的,僅在少數(shù)位點(diǎn)形成串聯(lián)的基因簇,因此大規(guī)模的基因復(fù)制事件可能在CO基因家族的進(jìn)化過程中扮演著重要的角色。共線性分析發(fā)現(xiàn),擬南芥、菜豆和蓖麻的染色體區(qū)域間存在強(qiáng)烈且保守的共線性。由圖3和圖4可知:擬南芥CO家族所在的共線性區(qū)域最多有22對(duì)基因;菜豆和蓖麻內(nèi)部也存在廣泛的共線性情況,例如Pv-CO5-PvCO7,RcCO5-RcCO10;此外,擬南芥與菜豆和蓖麻之間的共線性情況也非常普遍,例如At-COL3-RcCO1,AtCOL3-PvCO1,PvCO7-RcCO4。根據(jù)這些基因的共線性分析結(jié)果可推測(cè),CO家族中重復(fù)基因的擴(kuò)張與基因組重復(fù)有著密切的聯(lián)系。
圖2 B1,B2和B3亞家族CO基因外顯子和內(nèi)含子分布Figure 2 Exon-intron structures of CO genes in B1,B2 and B3 subfamily
圖3 物種內(nèi)CO家族成員的共線性分析Figure 3 Synteny analysis of CO family genes in species
圖4 物種之間CO家族基因共線性分析Figure 4 Synteny analysis of CO family genes among species
基因表達(dá)的差異性反映了基因的功能分化。水稻轉(zhuǎn)錄組表達(dá)譜顯示(圖 5),CO基因在花芽、花、根、旗葉和種子中都有表達(dá),以O(shè)sCO3,OsCO6,OsCO7,OsCO8,OsCO9,OsCO11,OsCO12和Os-CO16這8個(gè)基因的表達(dá)量較高,尤其是在開花后的根和開花前后的旗葉中的表達(dá)量更為明顯。具體來看,OsCO3和OsCO6基因在花芽到花的轉(zhuǎn)變過程、開花前后的根和旗葉中的表達(dá)量升高,在根中的表達(dá)量升高,在乳粒(未成熟的種子)到成熟種子的過程中表達(dá)量下降,說明OsCO3和OsCO6基因負(fù)向調(diào)控花芽到花的轉(zhuǎn)變過程。OsCO8在花芽到花的轉(zhuǎn)變過程、開花前后的根、開花前后的旗葉和乳粒到成熟種子的過程中表達(dá)量都呈現(xiàn)上升趨勢(shì),說明OsCO8對(duì)花的發(fā)育以及果實(shí)成熟有重要的調(diào)控作用。OsCO12在花芽到花的轉(zhuǎn)變過程、開花前后的根和乳粒到成熟種子的過程中表達(dá)量上升,在開花前后的旗葉中的表達(dá)量下降,說明OsCO12對(duì)水稻花的發(fā)育起著最為關(guān)鍵的調(diào)控作用。OsCO7,OsCO9和OsCO11基因在花芽到花的轉(zhuǎn)變過程、開花前后的旗葉和乳粒到成熟種子的過程中表達(dá)量下降,在開花前后的根中的表達(dá)量明顯上升,說明OsCO7,OsCO9和OsCO11基因可以正向調(diào)控花芽到花的轉(zhuǎn)變過程。OsCO16在花芽到花的轉(zhuǎn)變過程中表達(dá)量下降,在開花前后的根和旗葉、乳粒到成熟種子的過程中表達(dá)量上升,說明OsCO16對(duì)花的發(fā)育和果實(shí)成熟有重要的調(diào)控作用。水稻中不同CO基因在不同時(shí)期不同組織器官中的表達(dá)量不同,表明同一家族不同基因之間存在功能上的差異。
圖5 水稻CO基因的表達(dá)譜Figure 5 Expression profile of CO gene in rice
CO基因是植物光周期途徑中調(diào)控開花時(shí)間的重要基因。光周期途徑中,PHYA,CRY1和CRY2基因相互作用,影響GI等生物節(jié)律鐘基因,促進(jìn)CO基因的表達(dá);CO編碼轉(zhuǎn)錄因子作用于FT[18],使FT從維管束組織轉(zhuǎn)移到莖頂端分生組織,致使花器官發(fā)育[19]。通過對(duì)14個(gè)物種的CO基因的分析,本研究發(fā)現(xiàn):CO基因常以多拷貝的形式存在于植物中,與已有研究結(jié)果一致[20];親緣關(guān)系較近的物種,其CO基因的相似性較高;CO基因在裸子植物和被子植物、雙子葉植物與單子葉植物、不同科和不同屬植物之間都存在明顯分化,表明CO基因在植物進(jìn)化中既相對(duì)保守又不斷進(jìn)化,其進(jìn)化過程與整個(gè)物種進(jìn)化過程相對(duì)同步,說明CO基因可能對(duì)植物進(jìn)化起到了重要作用。研究發(fā)現(xiàn):?jiǎn)巫尤~植物發(fā)生過2次基因組重復(fù)[21],一半的水稻基因組基因來源于基因組重復(fù)[22]。對(duì)水稻的基因表達(dá)分析發(fā)現(xiàn):CO基因在花、葉、根和莖中都有表達(dá),OsCO3的表達(dá)量在花芽到花的轉(zhuǎn)變過程中上升,推測(cè)OsCO3負(fù)調(diào)控花芽到花的轉(zhuǎn)變過程,與KIM等[23]發(fā)現(xiàn)的OsCO3通過負(fù)調(diào)控Hd3a和FT-like(FTL)的表達(dá)延遲短日照下水稻開花的結(jié)果一致;OsCO7基因在花芽到花的轉(zhuǎn)變過程中表達(dá)量下降,說明OsCO7正調(diào)控Hd3a的表達(dá),促進(jìn)短日照下水稻的開花,與XUE等[24]研究結(jié)果一致。在短日照條件下,水稻的Hd1抑制Hd3a的轉(zhuǎn)錄從而控制開花轉(zhuǎn)型[25],這一結(jié)果和擬南芥CO基因在短日照條件下促進(jìn)FT的表達(dá)控制開花轉(zhuǎn)型相反,說明CO基因?qū)τ诨ㄑ康交ǖ陌l(fā)育起到重要調(diào)控作用,進(jìn)一步證實(shí)了水稻不同CO基因在功能上存在差異。本研究結(jié)果有助于更加深入地了解CO基因家族成員的潛在功能,為CO基因在光周期途徑中調(diào)控成花發(fā)育過程提供理論依據(jù)。