田郎 譯
(中國熱帶農(nóng)業(yè)科學(xué)院橡膠研究所,海南儋州 571700)
森林覆蓋了地球陸地表面的30%(大約38億hm2)。廣袤的森林不僅蘊(yùn)含著豐富的生物多樣性,而且也給人類帶來眾多的利益和好處,如清潔的空氣和水,木材,纖維,以及燃料等。據(jù)估計(jì),全世界的工業(yè)原料中略四分之一均來源于森林資源。各種樹體高大且生命周期極為漫長的森林喬木其龐大的野生種群幾乎遍及世界的各個(gè)大陸,而且它們?cè)诓煌谝荒晟荼局参锏倪x擇壓下一直生存繁衍至今。這些木本物種在生長發(fā)育過程中廣泛涉及到與季節(jié)變化相適應(yīng)的次生生長,信號(hào)轉(zhuǎn)導(dǎo),水分及養(yǎng)分長距離分配輸送,營養(yǎng)物儲(chǔ)藏,以及代謝物再分配等。不僅如此,這些多年生木本物種還需要在不斷變化的物理及生物脅迫下于固定地點(diǎn)生存繁衍數(shù)達(dá)百年以上,這也使得它們與眾多生命周期短的植物明顯有所不同??傊?,林木物種這些有別于其它生物的特點(diǎn),尤其是它們高大的樹體及漫長的營養(yǎng)生長期給人們研究其生物學(xué)特性的細(xì)胞及分子學(xué)機(jī)制帶來了巨大的困難和挑戰(zhàn)。為了在了解較為深入的木本模式植物中開展和加強(qiáng)此方面的研究,我們對(duì)黑三角葉楊,也即毛果楊(Populus trichocarpaTorr.&Gray)進(jìn)行了全基因組序列測定,并將其與其它已測序的植物基因組進(jìn)行比較分析。我們選擇毛果楊作為基因組測序的模式植物,一方面是因?yàn)樵撐锓N基因組大小適中,同時(shí)也因?yàn)槠渖L迅速,實(shí)驗(yàn)操控較易,并已具備一系列可資利用的遺傳學(xué)工具。楊屬植物表型各異,通過種間雜交有助于開展一系列與生長速度,植株高度,木材性質(zhì),以及紙質(zhì)相關(guān)的重要經(jīng)濟(jì)性狀的遺傳作圖。迄今為止,楊樹中已有很多數(shù)量性狀基因座被作圖定位,并已初步建立外源基因的遺傳轉(zhuǎn)化體系。在適宜的條件下,楊樹經(jīng)4~6a的營養(yǎng)生長即可進(jìn)行有性繁殖,通過新品種的選育和推廣可以有效地促進(jìn)楊樹種植業(yè)的可持續(xù)發(fā)展。最后,鑒于楊樹生長迅速,通過對(duì)植株的木質(zhì)素纖維素成分進(jìn)行熱化學(xué)或生化轉(zhuǎn)換,有望為人類提供寶貴的可再生能源,進(jìn)而也有效地減少大氣溫室氣體的排放。
本研究以黑三角葉楊(毛果楊)的一個(gè)雌性單株,即“Nisqually 1”為材料,采用全基因組鳥槍法測序及組裝策略進(jìn)行基因組序列測定。測序顯示,大約760萬個(gè)末端測序片斷的Q20(或以上)總讀長為4 200Mb,平均每個(gè)約553pb。這些片段隨后被組裝進(jìn)2 447個(gè)較大的序列骨架中。之后,根據(jù)這些序列骨架并結(jié)合遺傳及物理圖譜最終獲得該物種覆蓋區(qū)域達(dá)410Mb的全基因組序列草圖。根據(jù)序列骨架的覆蓋深度(約7.5倍)及非細(xì)胞器隨機(jī)序列的總數(shù),楊屬基因組的大小估計(jì)約為485±10Mb(±SD),這與過去用細(xì)胞遺傳學(xué)方法估計(jì)的大?。s550Mb)基本一致。此外,幾乎所有推定的蛋白質(zhì)編碼區(qū)均得到與其匹配的楊屬cDNA 序列的證實(shí),而已知的楊屬cDNA 序列中95%以上也都能與這些蛋白質(zhì)編碼基因相匹配。細(xì)胞遺傳學(xué)證據(jù)顯示,大約75Mb未組裝的基因組序列與該基因組大約30%的異染色質(zhì)含量基本相符。同時(shí),采用熒光染料4′,6′-二脒基-2-苯基吲哚對(duì)前期及中期染色體進(jìn)行染色觀察的結(jié)果也證實(shí),楊屬基因組的常染色質(zhì)含量平均為(69.5±0.3)%,其中,連鎖群Ⅰ(LGⅠ)所含常染色質(zhì)的比例[(66.4±1.1%)]顯著低于其它18條染色體[(69.7±0.03)%,P ≤0.05]。相比之下,擬南芥的染色體大約含有93% 的常染色質(zhì)。未組裝的隨機(jī)序列源自細(xì)胞器DNA 變異體(包括新近的核轉(zhuǎn)位),高度重復(fù)的基因組DNA,冗余的單倍型片段(因廣泛的序列多態(tài)性及等位異型分離所得),以及模板DNA 污染物(如用于模板制備的葉片及根組織中的內(nèi)生菌)。相應(yīng)于葉綠體及線粒體基因組的末端讀序分別被組裝進(jìn)157 和803kb 的環(huán)形基因組。對(duì)于已組裝的410Mb骨架序列,我們隨后將其錨定到序列標(biāo)記遺傳圖上。本研究利用356個(gè)微衛(wèi)星標(biāo)記成功地將155個(gè)序列骨架(335Mb)定位到19個(gè)染色體連鎖群。這些作圖微衛(wèi)星標(biāo)記中的絕大多數(shù)(91%)與組裝序列存在共線性。在實(shí)現(xiàn)序列重建的該19個(gè)染色體中,最小的染色體,即LGIX 79厘摩(cM)為兩個(gè)序列骨架(12.5Mb)所覆蓋,而最大的染色體,即LGI(265cM)則為21個(gè)序列骨架(35.5Mb)所覆蓋。此外,我們還利用雌株無性系Nisqually-1的細(xì)菌人工染色體(BAC)文庫(大約9.5倍基因組覆蓋率)構(gòu)建了基于BAC指紋重疊群的物理圖譜,并將2 460個(gè)BAC重疊群標(biāo)定在了相應(yīng)的染色體上,同時(shí)各成對(duì)的BAC末端讀序也被有效地用于基因組序列的大規(guī)模組裝拼接。結(jié)合遺傳和物理圖譜,410Mb已組裝的序列中將近385Mb被定位到各染色體連鎖群上。象擬南芥屬(Arabidopsis)這類主要行自花授粉的物種或生態(tài)型其等位多態(tài)性水平通常較低。與其相比,楊屬物種大都雌雄異株,行專性異交。這種強(qiáng)制性異交習(xí)性,加上風(fēng)媒傳粉及風(fēng)傳羽毛種子,使得它們?cè)谶z傳上高度雜合并呈現(xiàn)出廣泛的個(gè)體內(nèi)遺傳多樣性,同時(shí)種群之間也存在高水平的基因流。本研究中,我們?cè)陔s合的Nisqually-1基因組中共鑒定出1 241 251 個(gè)單核苷酸多態(tài)性(SNPs)或小插入/缺失多態(tài)性(indels)位點(diǎn),其頻率約為每千堿基對(duì)2.6個(gè)。這些多態(tài)性位點(diǎn)中的絕大多數(shù)(83%)出現(xiàn)在該基因組的非編碼區(qū)(表1)。外顯子中的indels或SNPs可分別導(dǎo)致移碼或產(chǎn)生無義終止密碼子,這意味著這些基因的無效等位基因有可能出現(xiàn)在其單倍型組合之中。當(dāng)然,有些多態(tài)性只是因序列組裝而產(chǎn)生的人工假象,盡管采用嚴(yán)格的SNP鑒定標(biāo)準(zhǔn)已最大程度地降低了此類錯(cuò)誤的發(fā)生。
表1 Nisqually-1基因組中單核苷酸多態(tài)性(SNPs)及插入/缺失多態(tài)性(indels)的來源及頻率。
本研究中,我們采用一系列基于從頭預(yù)測、同源性以及表達(dá)序列標(biāo)簽(EST)的基因識(shí)別法在楊屬核基因組中初步推定出一個(gè)包括45 555個(gè)基因位點(diǎn)的蛋白質(zhì)編碼基因參考集。此外,有101個(gè)葉綠體基因及52個(gè)線粒體基因也分別被注釋。為了幫助基因的注釋,我們還對(duì)來自Nisqually-1全長富集cDNA 文庫的4 664個(gè)全長序列進(jìn)行了GeneCalling分析?;蝾A(yù)測之前,首先鑒定并掩蔽重復(fù)序列,同時(shí)去除該參考基因集中的轉(zhuǎn)座元件。鑒于目前我們所構(gòu)建的僅是楊屬基因組序列的草圖,故該參考基因集有望在今后得以進(jìn)一步修正和完善。
大約89%的預(yù)測基因與國家生物技術(shù)信息中心(NCBI)的非冗余(NR)蛋白集同源期望值(E)≤1×10-8,其中60%具有高度同源性,它們涵蓋了同源基因及NR 蛋白質(zhì)匹配長度的75%。在預(yù)測出的楊屬基因中將近12%(5 248)與擬南芥基因無相似性(E≤1×10-3),而擬南芥基因中則僅有9%(2 321)與預(yù)測的楊屬基因不存在相似性。與擬南芥無相似性的5 248個(gè)楊屬基因中有1 883個(gè)在人工閱讀收集的楊屬EST 數(shù)據(jù)集中找到其表達(dá)的證據(jù),這些表達(dá)基因中有274 個(gè)在NR 數(shù)據(jù)庫中未搜索到匹配序列(E≥1×10-3)。全基因組寡核苷酸微陣列分析進(jìn)一步提供了所有預(yù)測基因基于不同組織特異性表達(dá)的證據(jù)。就來自節(jié)、節(jié)間、幼嫩葉片及成熟葉片組織的合并樣本而言,該參考基因集的表達(dá)比例為53%。此外,有20%首次被注釋并且不包括在該參考集內(nèi)的基因也檢測到了雜交信號(hào),這表明楊屬基因組中可能還存在4 000個(gè)其它基因或基因片段。通過雙向BLAST 最佳匹配搜索,我們?cè)跅顚俸蛿M南芥屬中鑒定出了13 019對(duì)直系同源基因,這些同源基因?qū)Φ男蛄幸恢滦云骄_(dá)到93%,其中11 654對(duì)基因的序列一致性超過基因長度的90%,僅有156對(duì)同源基因的序列一致性在50%以下。到2006年6 月1 日,大約有10%的基因(4 378)已得到人工驗(yàn)證和確認(rèn)。
楊屬與擬南芥屬之間的進(jìn)化分歧大約發(fā)生在1億~1.2億年之前。通過對(duì)楊屬基因組的分析,我們成功地檢測到了發(fā)生年代相對(duì)更近的一次全基因組復(fù)制事件,該次復(fù)制事件幾乎影響到了楊屬基因組的92%。在楊屬基因組中,我們共鑒定出了將近8 000對(duì)年代相近的旁系同源基因(不包括串聯(lián)或局部重復(fù))。之后,我們根據(jù)4重簡并密碼位(第3 密碼位)上發(fā)生的顛換型替代(4DTV)估測累積的核苷酸分歧度,并以此推算重復(fù)基因的相對(duì)年代。結(jié)果顯示,經(jīng)多重替換校正后的4DTV 峰值明顯出現(xiàn)于0.0916±0.0004之處,而這正意味著著重復(fù)基因的一次爆發(fā)性產(chǎn)生。對(duì)來自楊屬和柳屬(源自柳屬EST)的1 825對(duì)直系同源基因進(jìn)行比較的結(jié)果也表明,該兩屬植物共同經(jīng)歷了這次全基因組復(fù)制事件。此外,柳屬和楊屬相似的核型及遺傳圖譜的共線性也明顯支持這一結(jié)論,即兩屬物種經(jīng)歷過同一次大規(guī)?;蚪M復(fù)制事件。
如果我們僅僅利用十字花科中觀察到的同義替換率或者是根據(jù)擬南芥與水稻種系分化的同義率建立楊屬進(jìn)化的分子鐘,則據(jù)此我們將得出這樣的結(jié)論,即楊屬中觀察到的這次基因組復(fù)制事件其發(fā)生年代非常之晚,正如Sterk所報(bào)道的那樣,距今大約僅800萬~1300 萬年。然而,化石記錄顯示,楊屬與柳屬的進(jìn)化分歧發(fā)生在6 000~6 500萬年之前。因此,楊屬分子鐘的速率應(yīng)當(dāng)大約僅為擬南芥屬分子鐘的六分之一(即6千萬~6.5千萬年除以800萬~1300萬年)。事實(shí)上,在楊屬葉綠體及線粒體基因組中也曾發(fā)現(xiàn)過性質(zhì)上類似的分子鐘速率減慢的現(xiàn)象。由于楊樹是一種生命周期極為漫長并可行營養(yǎng)繁殖的物種,這有可能使其為多個(gè)世代提供配子。一個(gè)單一的楊樹基因型可作為無性系在人工培植下存留數(shù)千年之久,因此我們建議從這樣一些非常古老的個(gè)體反復(fù)提供“古代配子”,由此將有可能解釋序列進(jìn)化速度顯著下降的原因。由于分子鐘速率減慢,楊樹基因組因此與祖先的真薔薇類基因組更相類似。
為了檢驗(yàn)6 000萬~6 500萬年前基因的爆發(fā)性產(chǎn)生是否緣于一次單獨(dú)的全基因組復(fù)制事件,或者是緣自多次幾乎同步但又獨(dú)立發(fā)生的復(fù)制事件,我們參考Hokamp等的算法對(duì)楊屬基因組中保留的同線性區(qū)段進(jìn)行了鑒定。結(jié)果顯示,在4DTV 大約0.09處檢測到的最大的同線性板塊涵蓋了765對(duì)旁系同源基因。在本次復(fù)制事件中產(chǎn)生的同線性板塊總共包含了32 577個(gè)基因,而其中一半又包含在長于142個(gè)旁系同源基因?qū)Φ耐€性區(qū)段之中。當(dāng)將同樣的算法應(yīng)用于隨機(jī)洗牌的基因時(shí),重復(fù)區(qū)段所含基因數(shù)通常少于8~9個(gè),這表明這些重復(fù)基因的產(chǎn)生緣自一次單獨(dú)的全基因組復(fù)制事件,我們將其成為“楊柳科”復(fù)制事件。
由于本次“楊柳科”復(fù)制事件的發(fā)生,幾乎使得每一個(gè)楊屬基因組的作圖區(qū)段內(nèi)都含有一個(gè)在基因組其它區(qū)域也對(duì)應(yīng)存在的旁系同源區(qū)段。分析顯示,經(jīng)全基因組復(fù)制之后的所有染色體連鎖群中,有兩組各含4個(gè)連鎖群的染色體(第一組包括連鎖群II、V、VII及XIV,第二組包括連鎖群I、XI、IV 及IX)均可通過其端部同源區(qū)段的依次相連而形成明顯的風(fēng)鈴狀圖案。此外,有幾個(gè)染色體似乎經(jīng)歷過輕微的重組交換。再者,連鎖群I似乎是染色體多次重排(涉及到三次大的染色體串聯(lián)融合)的結(jié)果。以上結(jié)果表明,楊屬物種祖先的染色體基數(shù)為10。經(jīng)全基因組復(fù)制產(chǎn)生的各重復(fù)染色體在歷經(jīng)其后的基因組重構(gòu)及二倍體化過程之后最終演變形成該物種目前所具有的染色體連鎖群,其中包括4對(duì)幾乎完全旁系同源的染色體(連鎖群VI、VIII、X、XII、XIII、XV、XVI、XVIII及XIX);2組各含4條且每條都含有一個(gè)末端易位的染色體(連鎖群I、II、IV、V、VII、IX、XI及XIV);以及2 條分別與連鎖群I及VII最末端(一端)同源的染色體(連鎖群III及XVII)。多個(gè)楊屬物種遺傳圖譜間的共線性表明,基因組重構(gòu)發(fā)生在現(xiàn)代楊屬物種演化形成之前。
從旁系同源基因?qū)Φ?DTV 值分布還可看出,它們大部分都落入峰值為0.364±0.001 的4DTV 值區(qū)間內(nèi),這顯然是楊屬基因組經(jīng)歷過的另一次更為古老的大規(guī)模復(fù)制事件所留下的痕跡。這次復(fù)制事件大約覆蓋了楊屬基因組的59%,而這些雙拷貝區(qū)段包含了基因組大約16%的基因。由于這次復(fù)制事件發(fā)生在前,故之后所發(fā)生的楊柳科復(fù)制事件重疊在其上,這也使得楊屬基因組的每一個(gè)區(qū)域有可能被4個(gè)這樣的區(qū)段所覆蓋。與此相似,擬南芥屬基因組在發(fā)生十字花科特有的“α”復(fù)制事件之前,也曾經(jīng)歷過一次更為古老的“β”復(fù)制事件。
我們下一步要問的是擬南芥屬“β”復(fù)制事件與楊屬4DTV 大約0.36這次復(fù)制事件是否是:(1)在二者最后一個(gè)共同的真薔薇類祖先發(fā)生進(jìn)化分歧后各自獨(dú)立發(fā)生的全基因組復(fù)制事件,或者(2)為二者共同經(jīng)歷過的一次發(fā)生在某一祖先物種中的復(fù)制事件(即發(fā)生在真薔薇I類和II類分化之前)。該兩個(gè)假設(shè)對(duì)于楊屬和擬南芥屬之間同源性的解釋和判定具有非常大的影響。在第一種情況下,一個(gè)物種的每1個(gè)基因組區(qū)段與另一個(gè)物種的4個(gè)區(qū)段同源;而在第二種情況下,每1個(gè)區(qū)段僅與另一個(gè)物種的2個(gè)區(qū)段同源。我們通過對(duì)分別取自楊屬和擬南芥屬以及取自二者之間的同源基因?qū)﹂g相對(duì)距離的比較對(duì)這些假設(shè)進(jìn)行過驗(yàn)證,大體上接受以上第二種假設(shè),不過我們并不能否認(rèn)第一種假設(shè)。我們僅能得出這樣的結(jié)論,即楊屬該次基因組復(fù)制發(fā)生在非??拷嫠N薇I類和II類發(fā)生種系分化的年代,并略為支持這是該兩屬植物共同經(jīng)歷過的一次復(fù)制事件。這種時(shí)間上的巧合無疑增加了該次復(fù)制事件與真薔薇類植物(或許核心真雙子葉植物)在演化早期迅速發(fā)生多樣化之間存在因果聯(lián)系的可能性。我們將這次楊屬/擬南芥屬復(fù)制事件稱為真薔薇”復(fù)制事件。需要強(qiáng)調(diào)指出的是,楊柳科復(fù)制事件與擬南芥屬基因組中觀察到的該次“真薔薇”復(fù)制事件并無任何關(guān)聯(lián),也即它們是各自獨(dú)立發(fā)生的兩次全基因組復(fù)制事件。
盡管楊屬的蛋白質(zhì)編碼基因大大地多于擬南芥屬,但兩個(gè)基因組在蛋白質(zhì)庫(Prints,Prosite,Pfam,ProDom,以及SMART)中所反映出的結(jié)構(gòu)域的相對(duì)頻率卻基本相似。不過,就大多數(shù)兩屬共有的結(jié)構(gòu)域而言,楊屬與擬南芥屬的比率為1.4∶1至1.8∶1。不過在楊屬中,一些與抗病及抗蟲性,分生組織發(fā)育,以及代謝物及養(yǎng)分運(yùn)輸有關(guān)的基因及基因結(jié)構(gòu)域呈現(xiàn)出明顯高的異常值。例如,就抗病及抗蟲性而言,楊屬和擬南芥屬中富亮氨酸重復(fù)的比數(shù)為1 271∶527,NB-ARC 結(jié)構(gòu)域?yàn)?02∶141,奇異果甜蛋白為55∶24;就分生組織發(fā)育而言,兩屬NAC轉(zhuǎn)錄因子的比數(shù)為157∶100;就代謝物及養(yǎng)分運(yùn)輸而言,二者寡肽轉(zhuǎn)運(yùn)蛋白包括依賴質(zhì)子的寡肽轉(zhuǎn)運(yùn)蛋白(POT)及寡肽轉(zhuǎn)運(yùn)蛋白(OPT)家族的比數(shù)為129∶61,鉀轉(zhuǎn)運(yùn)蛋白為30∶13。
與擬南芥屬相比,楊屬中的有些結(jié)構(gòu)域明顯偏低。例如,擬南芥屬中的F 框結(jié)構(gòu)域就為楊屬的兩倍(624∶303),而F 框結(jié)構(gòu)域與基于泛素-26S蛋白酶體途徑的蛋白質(zhì)降解代謝有著直接的關(guān)聯(lián)。很多泛素結(jié)合結(jié)構(gòu)域也同樣如此,如楊屬和擬南芥屬中Ulp1蛋白酶家族及C 端催化結(jié)構(gòu)域的比數(shù)僅為10∶63。此外,該兩屬中的環(huán)指結(jié)構(gòu)域又幾乎相等(503∶407),這表明兩種植物的蛋白質(zhì)降解代謝途徑存在一定程度的分歧。
為了鑒定來自共同的真薔薇類祖先的保守基因,結(jié)合采用多種方法(包括核苷酸分歧度,序列同線性,以及雙向最佳BLAST 匹配分析)對(duì)楊屬和擬南芥屬基因集進(jìn)行了比較。真薔薇類祖先的基因組至少含有11 666個(gè)蛋白質(zhì)編碼基因,同時(shí)還含有一些數(shù)量尚不確定的其它基因,這些基因或者在該兩個(gè)或一個(gè)種系中被丟失,或者未能檢測到其同源性。這些基因?qū)嶋H上就是每一個(gè)完整植物基因組中通常由1至4個(gè)成員構(gòu)成的基因家族的祖先,它們?cè)跅顚俸蛿M南芥屬中各占28 257和17 521個(gè)?;蚣易辶斜砜蓮木W(wǎng)站www.phytozome.net獲取。該兩個(gè)基因組中那些不能用真薔薇類植物基因進(jìn)行預(yù)測的序列通常是一些不完整的基因片段或者很難對(duì)其加以歸類,而且我們也不能確切地推斷這些基因的種間同源性。它們中包括楊屬和(或)擬南芥屬中尚未被鑒定或者快速進(jìn)化的基因,以及一些未被很好預(yù)測的基因。
根據(jù)一系列可公開獲取的RNA 檢測算法(包 括 tRNAScan-SE,INFERNAL, 以 及snoScan),我們?cè)跅顚僦需b定出了817個(gè)假定的RNAs;22個(gè)U1,26個(gè)U2,6個(gè)U4,23個(gè)U5,以及11 個(gè)U6剪接體snRNAs(細(xì)胞核小RNAs);339個(gè)假定的C/D 框snoRNAs(核仁小RNAs);以及88個(gè)假定的H/ACA 框snoRNAs。所有57個(gè)可能的反密碼子tRNAs也都被發(fā)現(xiàn)。此外,還檢測出了1個(gè)硒代半胱氨酸t(yī)RNA,并有2個(gè)可能的抑制型tRNA(反密碼子與終止密碼子結(jié)合)被鑒定。楊屬中的tRNA 基因幾乎為擬南芥屬的1.3 倍之多。相比擬南芥屬而言,楊屬中tRNA 的拷貝數(shù)與預(yù)測基因中氨基酸的存在呈顯著正相關(guān)。分析結(jié)果顯示,楊屬與擬南芥屬中snRNAs數(shù)的比率也達(dá)到1.3 到1.0,不過,楊屬中U1、U2以及U5 豐度均明顯超高而U4 豐度偏低。此外,在擬南芥中不曾檢測到U14。當(dāng)然,楊屬中的SnRNAs及snoRNAs目前并未得到實(shí)驗(yàn)上的證實(shí)。
在楊屬中我們共鑒定出了169個(gè)代表21個(gè)家族的microRNA(miRNA,微小RNA)基因。在擬南芥屬中,該21個(gè)家族僅包含91個(gè)miRNA基因,這意味著它們?cè)跅顚僦袛U(kuò)張了1.9倍。所有21個(gè)miRNA 家族的調(diào)控靶標(biāo)在擬南芥和楊屬中似乎都具有保守性。與miRNA 基因本身相似,在楊屬中預(yù)測出的這些miRNA 的靶基因的數(shù)量(147個(gè))較之?dāng)M南芥屬(89)也擴(kuò)張了1.65倍。同樣,楊屬中那些介導(dǎo)RNA 干擾(RNAi)的基因(21個(gè))其豐度也明顯高于擬南芥屬(11個(gè))兩屬中AGO1類蛋白基因數(shù)分別為7 和3;RNA解旋酶為2和1;HEN 蛋白為2和1;HYL1類似物(雙鏈RNA 結(jié)合蛋白)為9和5。
基于Smith-Waterman算法(E≤10-25)我們?cè)跅顚僦泄茶b定出1 518個(gè)含有2個(gè)或多個(gè)基因的串聯(lián)重復(fù)序列。這些序列的基因總數(shù)為4 839個(gè),而串聯(lián)重復(fù)區(qū)段的總長也達(dá)47.9Mb,占楊屬基因組的15.6%。按照同一鑒定標(biāo)準(zhǔn),擬南芥屬中共檢測出1 366 個(gè)串聯(lián)重復(fù)區(qū)段,其總長為32.4Mb,占整個(gè)基因組的27%。就單個(gè)串聯(lián)重復(fù)序列中的基因數(shù)而言,通常遠(yuǎn)不止2個(gè),這樣的重復(fù)序列在楊屬和擬南芥屬中分別有958和805個(gè)。與楊屬相比,擬南芥屬中存在大量含有6個(gè)或更多個(gè)基因的串聯(lián)重復(fù)序列。因此,擬南芥屬中的串聯(lián)重復(fù)相對(duì)楊屬顯得更為常見。導(dǎo)致這一狀況的部分原因可能是來自全基因組鳥槍法測序的串連重復(fù)難以被組裝,尤其當(dāng)串聯(lián)重復(fù)基因具有高度保守性時(shí)更是如此。當(dāng)然,也仰或是楊屬基因組重排的速率要慢于擬南芥屬,這與我們的觀察結(jié)果相符,即楊屬的染色體重排比之?dāng)M南芥屬要少,而且核苷酸取代速率也更慢。
在某些情況下,該兩個(gè)物種中的基因均高度重復(fù),而且有些串聯(lián)重復(fù)在楊屬與擬南芥屬分開之前即已存在。在楊屬單個(gè)這樣的序列中,串聯(lián)重復(fù)的最高次數(shù)達(dá)24 次,該序列中含有與S-位點(diǎn)特異性糖蛋白高度同源的基因。擬南芥屬中同樣鑒定出這類以串聯(lián)重復(fù)存在的基因,其1號(hào)染色體上還發(fā)現(xiàn)一個(gè)重復(fù)14次的最大串聯(lián)重復(fù)區(qū)段。利用InterPro數(shù)據(jù)庫,我們?cè)谠搩蓚€(gè)物種串聯(lián)重復(fù)基因中鑒定出的最常見的結(jié)構(gòu)域是一個(gè)絲氨酸/蘇氨酸蛋白激酶活性部位(IPR008271)結(jié)構(gòu)域。兩物種共有的其它結(jié)構(gòu)域還有富亮氨酸重復(fù)(IPR007090,最初來自抗病串聯(lián)重復(fù)基因),三角狀五肽重復(fù)RNA 結(jié)合蛋白(IPR002885),以及尿苷二磷酸(UDP)-葡糖醛酸基/UDP-葡糖基轉(zhuǎn)移酶結(jié)構(gòu)域(IPR002213)。
相比之下,有些基因在一個(gè)物種基因組中以串聯(lián)重復(fù)高度擴(kuò)張,而在另一個(gè)物種中則并不如此。例如,在擬南芥屬中最常見的串聯(lián)重復(fù)基因之一是F-框基因,總共有342個(gè)同類基因存在于其串聯(lián)重復(fù)序列中,最大的串聯(lián)重復(fù)區(qū)段含有24個(gè)F-框基因。但楊屬的串聯(lián)重復(fù)序列僅含有37個(gè)F-框基因,且最大的重復(fù)區(qū)段僅含3個(gè)此類基因。
在楊屬中,來自19個(gè)不同組織EST 文庫的66個(gè)“楊柳科事件”重復(fù)基因?qū)Γㄕ伎偟?.3%)中有20個(gè)基因?qū)Τ尸F(xiàn)差異表達(dá)(每文庫在EST 頻率上出現(xiàn)顯著偏差)。而18個(gè)“真薔薇事件”重復(fù)基因?qū)Γㄕ伎偟?.7%)中也有11 個(gè)基因?qū)υ诿课膸斓腅ST 頻率上存在顯著差異。許多在一個(gè)或多個(gè)取樣文庫中豐度超高的重復(fù)基因?qū)ι婕暗降鞍踪|(zhì)之間的互作(如膜聯(lián)蛋白)或蛋白質(zhì)折疊(如親環(huán)蛋)。在最佳BLAST 匹配分析中,成對(duì)的真薔薇基因集相對(duì)表現(xiàn)出更大程度的分化。以上結(jié)果均支持某些楊屬重復(fù)基因?qū)Υ嬖诠δ鼙磉_(dá)分化的假設(shè)。
為了進(jìn)一步檢驗(yàn)重復(fù)基因間在基因表達(dá)上的差異,我們對(duì)涉及45 555個(gè)楊屬預(yù)測基因的全基因組寡核苷酸微陣列數(shù)據(jù)進(jìn)行了深入分析。結(jié)果顯示,來自楊柳科復(fù)制事件的重復(fù)基因?qū)ζ洳町惐磉_(dá)性(平均為5%)明顯低于來自真薔薇復(fù)制事件的重復(fù)基因?qū)Γㄆ骄?1%),這再次表明保留下來的旁系同源基因?qū)υ诠δ苌先蕴幱诓粩喾只^程之中,而源自真薔薇復(fù)制事件的重復(fù)基因?qū)t已累積了更多的功能表達(dá)差異。這種差異也能夠體現(xiàn)在基因的絕對(duì)表達(dá)水平上,而且可能在兩次重復(fù)事件之間有序變化。此外我們還發(fā)現(xiàn),在木材形成器官中差異表達(dá)更為明顯。在節(jié)和節(jié)間兩種器官中,源自真薔薇復(fù)制事件的重復(fù)基因中分別有近14%和13%(2 632個(gè)基因?qū)Γ┏霈F(xiàn)差異表達(dá),而在根及幼嫩葉片中僅有8%或以下存在表達(dá)差異。
楊屬是一個(gè)具有高度多態(tài)性的植物類群,甚至在同一植株體內(nèi)也存在大量單核苷酸多態(tài)性位點(diǎn)(SNPs)(表1)。非同義與同義替換率的比值(ω=dN/dS)常被用作衡量個(gè)體內(nèi)等位基因所受選擇限制程度的指標(biāo)。分析結(jié)果顯示,所有基因的dN 總平均值為0.0014,dS 值為0.0035,總的ω 值為0.40,這表明楊屬基因組中的大多數(shù)編碼區(qū)更多的是受到純化選擇。對(duì)于大多數(shù)有著密切關(guān)聯(lián)的旁系同源基因而言,ω 與4DTV 距離之間存在顯著負(fù)相關(guān)(r=-0.034,P=0.028),這與新近重復(fù)基因因功能冗余性而存在較高水平非同義多態(tài)性的預(yù)期也相一致。與此類似,那些具有新近串聯(lián)重復(fù)的基因(4DTV ≤0.2)其ω 也顯著高于那些不存在任何新近串聯(lián)重復(fù)的基因(Wilcoxon秩和檢驗(yàn),Z=8.65,P≤0.0001)。
從串聯(lián)重復(fù)基因得出的結(jié)果明顯符合重復(fù)基因加速進(jìn)化的預(yù)期。不過,就來自全基因組復(fù)制事件的旁系同源基因?qū)Χ运媒Y(jié)果與該預(yù)期并不相符,而來自于楊柳科及真薔薇復(fù)制事件的旁系同源基因其非同義替換率實(shí)際上也低于那些不存在相應(yīng)旁系同源序列的基因。得出這種相反結(jié)論的一個(gè)可能原因是,一些明顯的單拷貝基因由于快速形成的假基因而呈現(xiàn)出超高豐度。然而,實(shí)際情況似乎并不如此,我們以基因大小,同義替換率,以及最小遺傳距離為協(xié)變量,以ω 為反應(yīng)變量對(duì)關(guān)系最為密切的旁系同源基因進(jìn)行方差分析,其結(jié)果也證實(shí)了這一點(diǎn)。因此,那些不存在任何來自楊柳科及真薔薇復(fù)制事件的旁系同源物的基因所受選擇限制的程度相對(duì)較低,而保留有來自全基因組復(fù)制事件的旁系同源物的基因則顯然受到較強(qiáng)的純化選擇。Chapman 等最近提出了一個(gè)功能緩沖的概念用以解釋擬南芥和稻屬中源自全基因組復(fù)制的旁系同源物其突變檢出率出現(xiàn)類似下降的原因。楊屬物種的營養(yǎng)繁殖習(xí)性或許也能強(qiáng)化重復(fù)基因中核苷酸序列的保守性,因?yàn)橹貜?fù)基因間的互補(bǔ)效應(yīng)可使因有害體細(xì)胞突變積累導(dǎo)致的基因功能喪失降低到最小程度。
幾個(gè)基因家族的擴(kuò)張對(duì)于楊屬物種的進(jìn)化起到了十分重要的作用。
5.3.1 木質(zhì)素纖維素壁的形成 由維管形成層活動(dòng)引起的次生木質(zhì)部的周年發(fā)育是木本植物最為顯著的生物學(xué)特性之一。我們?cè)跅顚僦泄茶b定出大約20個(gè)直接參與或與纖維素生物合成有關(guān)的擬南芥基因或基因家族的直系同源物。擬南芥基因組中含有78個(gè)纖維素合成相關(guān)基因,與之相比,楊屬基因組含有93個(gè)這樣的基因。擬南芥基因組中存在6類共10個(gè)已知參與纖維素微纖絲生物合成的CesA(纖維素合成酶)編碼基因,而楊屬基因組含有18個(gè)CesA 基因,其中包括CesA7及CesA8 同系物的重復(fù)復(fù)制。擬南芥CesA4、CesA7以及CesA8 基因的楊屬同系物在木質(zhì)部發(fā)育及應(yīng)拉木形成期間協(xié)同表達(dá)。此外,有一對(duì)CesA 基因似乎僅出現(xiàn)在楊屬基因組中,而擬南芥屬中未發(fā)現(xiàn)其任何同系物。許多其它類型的纖維素生物合成相關(guān)基因,如KOR、SuSY、COBRA、FRA2均以重復(fù)對(duì)的形式出現(xiàn)在楊屬基因組中,而在擬南芥中則僅有單個(gè)復(fù)制。例如,COBRA 是纖維素生物發(fā)生過程中的一種調(diào)節(jié)因子,它在擬南芥屬中為單復(fù)制基因,但在楊屬中則有4個(gè)復(fù)制基因。
楊屬中所有已確認(rèn)的半纖維索生物合成基因大體上均與擬南芥屬相似。不過,與擬南芥屬相比,楊屬基因組含有更多編碼α-L-巖藻糖苷酶的基因,而編碼α-L-巖藻糖基轉(zhuǎn)移酶的基因則相對(duì)較少,這與楊屬的木葡聚糖海藻糖含量低于擬南芥屬也相一致。木質(zhì)素為細(xì)胞壁中含量僅次于纖維索的第二大組成成分,它是由木質(zhì)素單體(羥基肉桂醇)構(gòu)成的一種極為復(fù)雜的多聚物。細(xì)胞產(chǎn)生的木質(zhì)素逐漸沉積到次生壁的纖維素/半纖維素微纖絲間并與之結(jié)合從而使其硬化加厚。通過與已知的擬南芥屬苯丙烷類及木質(zhì)素基因進(jìn)行序列比對(duì),我們鑒定出了整套34個(gè)楊屬苯丙烷類及木質(zhì)素生物合成基因。編碼這些酶的楊屬基因家族其數(shù)量通常多于擬南芥屬(分別為34 和18個(gè))。唯一的一個(gè)例外是肉桂醇脫氫酶(CAD),該酶在楊屬中為單基因編碼,而在擬南芥屬中則被兩個(gè)基因所編碼。CAD 在火炬松中也僅被單基因編碼。楊屬兩個(gè)與木質(zhì)素相關(guān)的C4H 基因在木質(zhì)素形成相關(guān)組織中呈現(xiàn)出強(qiáng)烈的協(xié)同表達(dá)效應(yīng),而3個(gè)C3H 基因則明顯呈現(xiàn)互斥性表達(dá)模式。
5.3.2 次生代謝 楊屬植物能產(chǎn)生大量非結(jié)構(gòu)性的富碳次生代謝物,而且這些代謝產(chǎn)物在豐度,脅迫誘導(dǎo)性,以及在對(duì)植株生長及寄主-害蟲互作的影響上均存在廣泛的變異。莽草酸-苯丙烷類來源的酚酯,酚苷,以及縮合單寧及其黃酮類前體是這些次生代謝物中含量最為豐富的的種類,僅酚苷和縮合單寧即占到葉片干重的35%,而且楊屬植株的芽、樹皮及根也都富含這兩種物質(zhì)。
類黃酮生物合成基因在擬南芥屬中已得到詳盡注釋。除了類黃酮合成酶之外,幾乎所有這些基因都為單拷貝基因。相比之下,楊屬中除查耳酮異構(gòu)酶,類黃酮3′-羥化酶,以及黃烷酮3-羥化酶之外,其余皆為多個(gè)基因所編碼。例如,控制類黃酮生物合成關(guān)鍵步驟的查耳酮合成酶基因其數(shù)量在楊屬至少已擴(kuò)增到了6個(gè)。再者,楊屬基因組還含有黃酮合成酶II(細(xì)胞色素登錄號(hào)CYP98B)及類黃酮3′,5′-羥化酶(CYP75A12及CYP75A13)兩個(gè)基因,但該兩個(gè)基因在擬南芥屬中皆缺如。此外,楊屬基因組含有三個(gè)無色花色素還原酶編碼基因,此酶催化縮合單寧前體2,3-反式-黃烷-3-醇的形成,但擬南芥屬中缺乏該立體構(gòu)型的前體物。擬南芥基因組中還鑒定出了32個(gè)涉及次生代謝的萜類合成酶(TPS)基因,與此相比,楊屬基因組至少含有47個(gè)TPS基因,這表明楊屬植物普遍都有合成萜類次生代謝物的能力。
擬南芥基因組中已有大量類苯基丙烷類似途徑的酶被注釋,編碼CAD(肉桂醇脫氫酶)的基因家族即是其中之一。楊屬除了涉及木質(zhì)素生物合成的單個(gè)CAD 基因之外,還鑒定出了幾個(gè)其它進(jìn)化支的CAD 類似物(CADL)基因,其中的大多數(shù)又屬于一個(gè)較大并含有多功能乙醇脫氫酶相關(guān)酶類的亞家族。基因組比較分析清楚地表明,楊屬CADL 基因家族存在選擇性擴(kuò)張和保留。例如,楊屬基因組含有7個(gè)CADL編碼基因(Poptr-CADL1~PoptrCADL7),它們與擬南芥中明顯具有苯甲醇脫氫酶活性的BAD1 及BAD2 基因密切相關(guān)。BAD1 及BAD2 已知可為病原體所誘導(dǎo),這表明該組楊屬基因,同時(shí)包括楊屬SAD(即芥子醇脫氫酶,一種早先已被鑒定為對(duì)芥子醛具有特異性催化功能的CAD 酶)基因可能涉及到楊屬植株對(duì)病原體的化學(xué)防御。
5.3.3 病害抗性 多年生植物在其生長發(fā)育過程中隨時(shí)都有遭受病菌及植食動(dòng)物侵害的可能,而漫長的世代間隔周期使得這類植物在進(jìn)化速度上也難以與病原微生物及害蟲相比擬。除了利用加厚的細(xì)胞壁及合成的次生代謝物作為抵御微生物和害蟲的第一道防線之外,植物還進(jìn)化出了各種病害抗性(R)基因以對(duì)抗病菌的侵襲。
已鑒定出的最大一類R 基因所編碼的產(chǎn)物為含有一個(gè)核苷酸結(jié)合部位(NBS)及羧端富亮氨酸重復(fù)區(qū)(LRR)的胞內(nèi)蛋白質(zhì)。NBS類R 基因家族也是楊屬中最大的一類抗病基因,其中包括399個(gè)成員,幾乎為擬南芥屬的兩倍之多。NBS家族還可進(jìn)一步區(qū)分為多個(gè)具有不同結(jié)構(gòu)域組成的亞家族,其中包括64個(gè)TIR-NBS-LRR 基因,10個(gè)截短的TIR-NBS基因(缺少LRR),233 個(gè)非TIR-NBS-LRR基因,以及17個(gè)先前在擬南芥屬中未被發(fā)現(xiàn)但同樣含有TIR 及NBS的罕見基因(即含有TNLT,TNLN,或TCNL 結(jié)構(gòu)域的基因)(表2)。5類編碼TNL 蛋白質(zhì)的抗病基因均含有一個(gè)預(yù)測的N 端核定位信號(hào)。楊屬中非TIR-NBS-LRR基因的數(shù)量也多于擬南芥屬(分別為209和57 個(gè))。在擬南芥屬中未被發(fā)現(xiàn)的40個(gè)非TIR-NBS 基因各都帶有一個(gè)N 末端BED DNA-結(jié)合鋅指結(jié)構(gòu)域,而稻屬Xa1 基因中也發(fā)現(xiàn)有這種結(jié)構(gòu)域。這些發(fā)現(xiàn)表明,楊屬中發(fā)生了結(jié)構(gòu)域選配。楊屬中的大多數(shù)NBS-LRR(大約65%)以單個(gè)或串聯(lián)重復(fù)的形式存在,而這些基因間成對(duì)遺傳距離的分布則表明,該家族近期曾發(fā)生過基因擴(kuò)張。更確切地說,相較于55%的胞外LRR 受體類似物激酶基因,僅10%的NBS-LRR 基因與真薔薇及楊柳科這兩次全基因組復(fù)制事件有關(guān)。
已被鑒定為R 基因新成員的幾個(gè)保守的信號(hào)組件,如RAR1,EDS1,PAD4,以及NPR1在楊屬中均含有多個(gè)相應(yīng)的同系物。例如,在水楊酸生物合成上游起著重要作用的PAD4基因,以及NPR1基因,一種參與水楊酸下游應(yīng)答的重要調(diào)控因子在楊屬中即分別具有2個(gè)和5個(gè)拷貝。擬南芥中幾乎所有已知控制病害抗性信號(hào)傳導(dǎo)的基因在楊屬中均存在其假定的直系同源物。楊屬中的β-1,3-葡聚糖酶及幾丁質(zhì)酶基因數(shù)量也多于擬南芥屬(分別為131和73個(gè))??偟膩碚f,楊屬中R 基因及其信號(hào)組件之間存在明顯的結(jié)構(gòu)及遺傳多樣性,這表明,與基因組的其它部分有所不同,種群的同期多樣化選擇在楊屬抗病基因的進(jìn)化中起著十分重要的作用。這種多樣化也說明,借助R 基因介導(dǎo)的信號(hào)傳導(dǎo)提高對(duì)生物攻擊免疫應(yīng)答及其檢測的能力對(duì)于生命周期長達(dá)數(shù)十年的楊屬植物可能終生都至關(guān)重要。
表2 楊屬、擬南芥屬及稻屬中編碼相似植物R 蛋白基因的數(shù)量
5.3.4 膜轉(zhuǎn)運(yùn)蛋白 楊屬植物在其漫長的生長發(fā)育過程中必須借助一系列膜轉(zhuǎn)運(yùn)蛋白才能有效地實(shí)現(xiàn)年際、季節(jié)乃至?xí)円归g的代謝轉(zhuǎn)變及碳氮營養(yǎng)物質(zhì)的調(diào)動(dòng)分配。相對(duì)擬南芥屬而言,楊屬基因組中編碼轉(zhuǎn)運(yùn)蛋白的基因家族成員在總體上明顯有所擴(kuò)張(楊屬和擬南芥屬中分別為1 722及959個(gè))。楊屬中,包括編碼三磷酸腺苷結(jié)合盒蛋白(ABC 轉(zhuǎn)運(yùn)蛋白,226 個(gè)基因),主要易化子超家族蛋白(MFS蛋白,187個(gè)基因),藥物/代謝物轉(zhuǎn)運(yùn)蛋白(108個(gè)基因),氨基酸/生長素透性酶(95個(gè)基因),以及寡肽轉(zhuǎn)運(yùn)蛋白(POT 蛋白,90個(gè)基因)在內(nèi)的5個(gè)基因家族所占轉(zhuǎn)運(yùn)蛋白基因總數(shù)的比例達(dá)40%以上。楊屬中幾個(gè)大的基因家族,如編碼POT(為擬南芥屬的4.3倍),谷氨酸門控離子通道(3.7 倍),鉀吸收透性酶(2.3倍),以及ABC 轉(zhuǎn)運(yùn)蛋白(1.9倍)的家族均出現(xiàn)了數(shù)量上的擴(kuò)張。我們?cè)跅顚僦羞€鑒定出了一個(gè)由5個(gè)假定的水通道蛋白構(gòu)成且擬南芥中所不存在的亞基因家族。此外,楊屬基因組還含有7個(gè)以前僅在真菌中發(fā)現(xiàn)過的跨膜受體基因,以及2個(gè)被鑒定為菌根特異性磷酸鹽轉(zhuǎn)運(yùn)蛋白的基因,這說明菌根共生在該長壽物種的礦質(zhì)營養(yǎng)上具有重要作用。膜轉(zhuǎn)運(yùn)蛋白數(shù)量的擴(kuò)張對(duì)于楊屬植物適應(yīng)養(yǎng)分有限的森林土壤,水分及代謝物的長距離運(yùn)輸和儲(chǔ)藏,次生代謝物的分泌和移動(dòng),以及調(diào)節(jié)病原體產(chǎn)生的次生代謝物或其它有毒化合物無疑起到了巨大作用。
5.3.5 植物激素 生理及分子學(xué)研究均已證實(shí)了激素調(diào)節(jié)在植物發(fā)育過程中的重要性。生長素,赤霉素,細(xì)胞分裂素,以及乙烯應(yīng)答在林木生物學(xué)上尤其令人關(guān)注。
很多情況下生長素應(yīng)答都受生長素應(yīng)答因子(ARF)轉(zhuǎn)錄因子所控制,該轉(zhuǎn)錄因子與相應(yīng)的AUX/IAA 受體蛋白一起調(diào)節(jié)生長素應(yīng)答靶基因。利用已知及預(yù)測的ARF 蛋白序列進(jìn)行系統(tǒng)發(fā)生學(xué)研究的結(jié)果顯示,楊屬和擬南芥屬ARF基因家族自它們的共同祖先發(fā)生分歧以來均各自獨(dú)立發(fā)生了基因數(shù)量的擴(kuò)張。楊屬中達(dá)6個(gè)重復(fù)的ARF基因均編碼在擬南芥中僅為單拷貝的ARF 基因的同系物,其中包括 ARF5(MONOPTEROS),這是生長素介導(dǎo)的信號(hào)傳導(dǎo)及木質(zhì)部發(fā)育所需的一種重要基因。此外,有5個(gè)擬南芥屬ARF基因含有4個(gè)或更多個(gè)預(yù)測的楊屬ARF基因旁系同源物。與ARF 基因有所不同,和擬南芥屬相比,楊屬中的AUX/IAA 基因并未發(fā)生明顯擴(kuò)張(分別為35和29個(gè))。令人感興趣的是,擬南芥屬中有4個(gè)AUX/IAA 基因在楊屬中不存在任何明顯的直系同源物,這無疑顯示出它們?cè)跀M南芥屬中的功能特異性。
赤霉素(GAs)對(duì)木材及根系發(fā)育過程的的多個(gè)階段都具有調(diào)節(jié)作用,其中包括木質(zhì)部纖維的伸長。在所有赤霉素生物合成及信號(hào)傳導(dǎo)基因中,楊屬GA20-氧化酶家族是唯一一個(gè)在數(shù)量上大約兩倍于擬南芥屬的基因家族,這表明源自楊柳科復(fù)制事件的大多數(shù)重復(fù)基因已經(jīng)被丟失。GA20-氧化酶能催化有活性的赤霉素GA1 及GA4的生成。補(bǔ)充較多的GA20-氧化酶基因?qū)τ跅顚僦参锎紊举|(zhì)部及纖維細(xì)胞的發(fā)育可能具有重要意義。
細(xì)胞分裂素被認(rèn)為除控制一般細(xì)胞的分裂之外也控制木材形成相關(guān)細(xì)胞的同一性及增殖。就編碼與細(xì)胞分裂素內(nèi)穩(wěn)態(tài)相關(guān)的異戊烯轉(zhuǎn)移酶(IPT)及細(xì)胞分裂素氧化酶的基因家族而言,家族成員的總數(shù)在楊屬與擬南芥屬之間大體相當(dāng),盡管IPT 亞家族似乎也存在種系特異性擴(kuò)張。細(xì)胞分裂素信號(hào)傳導(dǎo)途徑主要借助雙組分磷酸化系統(tǒng)進(jìn)行信號(hào)傳導(dǎo)。在該傳導(dǎo)系統(tǒng)中,雙組分雜合受體借助含組氨酸的磷酸傳遞中間體(HPt)實(shí)現(xiàn)磷酸基團(tuán)從組氨酸激酶(即信號(hào)受體)到響應(yīng)調(diào)節(jié)蛋白(RR)的轉(zhuǎn)移,磷酸化的RR 則進(jìn)一步參與其后的一系列級(jí)聯(lián)反應(yīng)。有分析顯示,編碼雙組分信號(hào)受體的一個(gè)基因家族(如CKI1)其成員數(shù)量在楊屬中明顯擴(kuò)張(楊屬和擬南芥屬中分別4個(gè)和1個(gè))。與擬南芥屬相比,楊屬中編碼最近剛鑒定出的假HPt及非典型RR 的基因家族也明顯呈現(xiàn)超量表達(dá)(在楊屬中分別增加2.5和4.0倍),而該兩個(gè)基因家族均涉及細(xì)胞分裂素信號(hào)傳導(dǎo)的負(fù)調(diào)控,看來這與楊屬中細(xì)胞分裂素信號(hào)傳導(dǎo)系統(tǒng)復(fù)雜性的增加是相一致的。
楊屬和擬南芥屬基因組所含三個(gè)與乙烯生物合成有關(guān)的酶的數(shù)量幾乎相等,不過楊屬中涉及乙烯感受及信號(hào)傳導(dǎo)的基因的數(shù)量則明顯較多。例如,楊屬中含有7個(gè)預(yù)測的乙烯受體基因,而擬南芥屬中只有2個(gè);組成型三重反應(yīng)激酶(僅在受體的下游起作用)在楊屬中為4個(gè)基因所編碼,而擬南芥屬中僅被1個(gè)基因編碼。
楊屬中乙烯響應(yīng)元件結(jié)合因子(ERF)蛋白(為AP2/ERF家族的一個(gè)亞家族)的數(shù)量也多于擬南芥屬(分別為172和122個(gè))。ERF轉(zhuǎn)錄因子數(shù)量的增加可能與木本植物有賴乙烯的一些特殊生理過程有關(guān),例如應(yīng)拉木形成以及休眠的確立。
毛果楊全基因組序列圖譜的成功構(gòu)建使我們得以有機(jī)會(huì)對(duì)對(duì)該物種進(jìn)行初步的比較基因組學(xué)分析。楊屬物種在歷經(jīng)全基因組復(fù)制,染色體重排,以及串聯(lián)重復(fù)等一系列復(fù)雜事件之后方演化形成我們現(xiàn)在所觀察到的基因組。楊屬與擬南芥屬在基因含量上的差異使得我們對(duì)導(dǎo)致它們之間在生活史上區(qū)別如此之大的可能的分子基礎(chǔ)無疑有了更進(jìn)一步的認(rèn)識(shí),盡管一些與基因含量無關(guān)的因子(如調(diào)節(jié)元件,miRNAs,翻譯后修飾,或表觀遺傳修飾)也可能起著同樣甚至更重要的作用。借助楊屬基因組序列,研究者們現(xiàn)在不但能夠了解到一些超出擬南芥屬基因組范圍之外的其它信息,而且還可根據(jù)楊屬基因組序列的特點(diǎn)深入探索多年生植物木材形成,養(yǎng)分和水分運(yùn)輸,樹冠發(fā)育,以及病害抗性的內(nèi)在機(jī)制。同時(shí),進(jìn)一步開展楊屬與其它不同植物間基因組的比較分析還將有效地促進(jìn)這些物種基因組結(jié)構(gòu)及基因家族進(jìn)化的研究。業(yè)已知道,楊屬植物的遺傳及群體生物學(xué)特性使其種群內(nèi)存在著大量的等位基因變異。由于楊屬物種在繁殖上行專性異型雜交,故其所含隱性等位基因以雜合狀態(tài)保留在基因組內(nèi)。充分挖掘和利用楊屬基因組序列所蘊(yùn)含的各種信息資源將有助于我們從具有不同生態(tài)適應(yīng)性的楊屬野生群體中有效地鑒定、分離及利用各種優(yōu)良、有用的等位變異。這些變異基因作為重要的分子資源在生物技術(shù)應(yīng)用,可替代能源開發(fā),以及減輕人為的環(huán)境破壞等方面都具有不可小視的作用。最后,楊屬植物作為很多生態(tài)系統(tǒng)的關(guān)鍵物種其基因組圖譜的構(gòu)建及利用無疑會(huì)對(duì)所在整個(gè)生態(tài)體系的研究產(chǎn)生深遠(yuǎn)影響。
(全文譯自SCIENCE,VOL313,15.SEPTEMBER,2006.)