羅 寶,譚永俊,唐志東
(湖南農(nóng)業(yè)大學油料作物研究所,長沙410128)
比較基因組學就是利用共同的標記構建圖譜或?qū)Σ煌锓N基因組相應部分(或全部)區(qū)域進行測序,從結構關系、相對位置、基因數(shù)目等方面進行分析,以揭示不同物種之間的基因家族成員數(shù)目和排列的異同[1]。1930年,基于種間雜種的細胞遺傳學分析建立了蕓薹屬作物的禹氏三角,遺傳作圖分析進一步驗證了6個蕓薹屬栽培種的親緣關系[2~5]。三角關系的建立,顯示了蕓薹屬各物種及其變種的親緣關系,從而為種間基因交流及遠緣雜交提供了理論基礎,指導并加快了重要蕓薹屬作物的遺傳改良。筆者主要總結了甘藍型油菜(B.napus,AACC,2n=38)與白菜(B.rapa,AA,2n=20)、甘藍(B.oleracea,CC,2n=18)3個物種間的基因組比較研究進展。
Morinaga等[6]早期對蕓薹屬二倍體和異源四倍體作物單倍體雜交的減數(shù)分裂過程研究發(fā)現(xiàn),3個基因組有共同的起源,比較發(fā)現(xiàn)A、C基因組的染色體的親緣關系更近[7]。Harrison和 Heslop-Harrison[8]利用FISH技術從甘藍和白菜中獲得的近著絲粒區(qū)域的兩端DNA分子的重復序列做探針,對3個基本種和3個復合種進行了定位分析,結果表明DNA重復序列均可以定位在白菜和甘藍的大部分染色體上,可是信號在黑芥上則顯得很微弱,同樣表明了A、C基因組的染色體的親緣關系更近。Snowdown等[9~11]用GISH 技術發(fā)現(xiàn)在甘藍型油菜中很難區(qū)分A基因組和C基因組,說明兩個亞基因組有很高的同源性;同期使用FISH技術,用rDNA做探針,分別與白菜、甘藍、甘藍型油菜有絲分裂的中期的基因組雜交,發(fā)現(xiàn)在3個物種中每條染色體都能發(fā)現(xiàn)信號,并且在復合體中可以區(qū)分兩個亞基因組,但統(tǒng)計發(fā)現(xiàn),復合體中的信號數(shù)少于兩個基本種的信號數(shù)之和,由此表明,兩個基因組自然加倍后發(fā)生了染色體變異;之后使用5srDNA和25srDNA做探針,結合DAPI染色法,可更加清晰地將兩個基因組在復合種中區(qū)分開來,并且還可以看到二者的同源區(qū)域,與二倍體比較發(fā)現(xiàn)在復合種中有些rDNA增加或者丟失了一些拷貝。很顯然細胞學觀察不僅費時費力,也很容易出錯,因此必須用簡單可靠的技術方法來推動比較基因組學的研究。
20世紀90年代末期,相關學者使用同套類型的標記對十字花科蕓薹族的3個二倍體物種的基因組及由它們之間衍生出來的多倍體基因組進行了比較作圖研究,結果如表 1。Slocum 等[12]、Song等[13]、Landry 等[14]最早分別以 RFLP 標記發(fā)表了甘藍、白菜、甘藍型油菜的遺傳圖譜,圖譜之間發(fā)現(xiàn)同一個基因內(nèi)35%~40%的探針有多個座位。使用同套探針在不同物種進行遺傳作圖發(fā)現(xiàn),白菜和甘藍之間在堿基序列和基因拷貝數(shù)之間存在很高的相似性,相關比較作圖還發(fā)現(xiàn)這兩個二倍體物種與甘藍型油菜對應的亞基因組有很高的共線性[5,15]。Lagercrantz[16]研究發(fā)現(xiàn)3個基因組有廣泛的共線性,并且同一基因組內(nèi)每個區(qū)段一般可以在其他物種找到幾個相應的同源區(qū)段。Parkin等認為A基因組與C基因組親緣關系最近,與B基因組最遠(圖1)。以上結果闡明了蕓薹屬A、C基因組在個別物種的保守性,也揭示基因組進化過程中發(fā)生的多倍化事件和廣泛的基因重排現(xiàn)象。
表1 蕓薹屬白菜、甘藍與甘藍型油菜比較作圖的部分研究結果
圖1 A、B、C基因組比較遺傳作圖常見的3種情況
作為模式植物的擬南芥與蕓薹屬作物同一家族,親緣關系非常近。2000年,擬南芥基因組完成測序[24],從蕓薹屬種間比較作圖延伸到與擬南芥基因組的比較做圖,這樣有利于加快研究蕓薹屬作物的基因組結構特征和進化過程。通過對甘藍與擬南芥的比較作圖研究,Kowalski等[25]發(fā)現(xiàn),盡管自從甘藍與擬南芥分化后發(fā)生了染色體大規(guī)模的重排,兩者之間發(fā)現(xiàn)了11個3.7~49.6 cM不等的保守區(qū)段,甘藍基因組的29.9%區(qū)域及擬南芥基因組的24.6%區(qū)域都是由這些保守區(qū)段組成的,在甘藍基因組中還發(fā)現(xiàn)部分擬南芥區(qū)段有3個重復,還發(fā)現(xiàn)至少有9個倒位和17個易位存在。進一步研究發(fā)現(xiàn),甘藍和擬南芥之間存在廣泛的共線性,但共線性區(qū)域的重復次數(shù)目前還無法確定,大部分研究認為共線性區(qū)域在二倍體基本種中傾向于有3個拷貝,從而大致認為蕓薹屬由一個六倍體祖先演化而來[18,19,26,27]。Schranz 等[28]在蕓薹屬作物比較研究中發(fā)現(xiàn),擬南芥(Arabidopsis lyrata,n=8)和白芥(Capsella rubella,n=8)更適合作蕓薹屬比較基因組研究的祖先種,這一點與Parkin等[20]結果不一致。他們將擬南芥基因組劃分24個保守區(qū)段,古染色體組在進化過程中發(fā)生了染色體融合、易位及倒位、片段重排等事件,形成了染色體數(shù)為5且含一套24區(qū)段的擬南芥,以及染色體數(shù)為10并且含大約3套24區(qū)段的白菜。Parkin等[20]使用經(jīng)過測序的1 000個多個RFLP標記構建好的甘藍型油菜圖譜與擬南芥基因組進行比對,發(fā)現(xiàn)若將擬南芥基因組劃分21個區(qū)段,則每個區(qū)段平均有6個重復區(qū)段在油菜遺傳圖譜上。孫思龍[29]對白菜、甘藍和擬南芥比較研究發(fā)現(xiàn),與白菜類似,甘藍基因組同樣發(fā)生過三倍化事件,在甘藍中找到3個甚至更多個重復的擬南芥保守區(qū)段。二者比較研究表明,甘藍基因組部分染色體結構與白菜類似,這暗示著與白菜分開進化之后甘藍基因組并未發(fā)生大的結構變化,另一部分染色體結構與白菜相比卻發(fā)生了大的變化,這極有可能與甘藍中染色體的斷裂、融合重排有關。最近,Wang等[30]對甘藍的物理圖譜與擬南芥的比較發(fā)現(xiàn),67%的重疊群能夠與擬南芥基因組比對成功,其中96%在擬南芥基因組的常染色質(zhì)區(qū)域,3.5%(含重復序列)在近著絲粒區(qū)域,另外發(fā)現(xiàn)在擬南芥與甘藍分化后,染色體組可能發(fā)生過39次斷裂事件。Jiang等[31]通過將白菜的BCA重疊群錨定到甘藍型油菜的遺傳圖譜進而分別從結構和功能分析了白菜A基因組和甘藍型油菜An之間的共線性關系,研究表明祖先種在共線性區(qū)域每個區(qū)段在A基因組都有3份重復,此外在兩物種中,只發(fā)現(xiàn)5%的基因組區(qū)域發(fā)生了染色體倒位、染色體間和染色體內(nèi)的易位事件,由此認為二者在基因組結構上并未發(fā)生較大的變化。
Osborn等[32]在白菜、甘藍型油菜和擬南芥開花基因的比較定位上發(fā)現(xiàn),油菜兩個主效QTL同樣能夠在白菜中找到,并認為甘藍型油菜需要春化的基因來源于白菜;與擬南芥基因組的比較QTL定位發(fā)現(xiàn),兩個主效QTL區(qū)域與擬南芥5號染色體頂端區(qū)域呈共線性關系,而此區(qū)域包含了FLC,F(xiàn)Y和CO基因,另一對QTL區(qū)間則與擬南芥4號染色體同源,由此認為蕓薹屬控制開花的基因可能是擬南芥調(diào)控開花的基因(FLC和FRI)。Long等[33]在研究油菜控開花期QTL的定位中發(fā)現(xiàn),擬南芥的28%花期同源基因可以通過電子定位到甘藍型油菜QTL的置信區(qū)間內(nèi),9%的同源基因則可比對到置信區(qū)間鄰近兩側,另外發(fā)現(xiàn)一個BnFLC10分別在春油菜種植環(huán)境和冬油菜種植環(huán)境分別定位到N10和N16的QTL簇中。Zhao等[34]利用擬南芥脂肪酸代謝途徑的同源基因開發(fā)特異標記定位到油菜的遺傳圖譜上,比較作圖找到33個共線性區(qū)域,將近一半的同源位點落在線性區(qū)域內(nèi),結合含油量的QTL定位發(fā)現(xiàn),14個與脂肪酸代謝相關的基因位點落在QTL的置信區(qū)間內(nèi),這表明擬南芥與油菜在脂肪酸調(diào)控位點上廣泛保守,Arti Sharma等[35]認為在擬南芥、白菜、蓖麻和大豆中控制脂肪酸合成的主效基因如硬脂酰脫氫酶、FatB、FAD2、FAD3、DGAT存在著豐富的結構變異,這也導致這些物種在脂肪酸組成上的差異。Ding等[36]在甘藍型油菜產(chǎn)量和磷吸收等相關性狀的QTL定位發(fā)現(xiàn),161個與擬南芥同源的基因與定位的45個QTL有關,其中4個與磷吸收有關的基因標記定位在QTL置信區(qū)間。Xia等[37]在甘藍型油菜兩個隱性核不育基因BnMs4和BnRf的精細定位研究發(fā)現(xiàn),擬南芥3號染色體上存在與這兩個基因微觀共線性的區(qū)域。Wang等[38]在全基因組水平比較白菜與擬南芥中硫苷代謝途徑相關基因的同源性,分別發(fā)現(xiàn)了白菜中102個候選基因和擬南芥52個直系同源基因與硫苷合成有關,并且大部分基因在白菜只有一個拷貝,與其他報道一樣,兩者之間在硫苷代謝途徑存在廣泛共線性。在抗病研究方面,Saito 等[39]和 Suwabe 等[40]在白菜抗根腫病QTL定位中發(fā)現(xiàn),2個QTL(Crr1,Crr2)位置都含有擬南芥4號染色體的一個同源區(qū)段,而這個區(qū)段包含了大量的基因簇MRCs,另外一個QTL則位于擬南芥3號染色體一個臂的端部,以上結果表明白菜抗根腫病基因與擬南芥基因同源。Mayerhofer等[41]在抗黑脛病基因的定位研究中發(fā)現(xiàn),LmR1和ClmR1兩個基因在甘藍型油菜基因組中有嚴格的基因組間和基因組內(nèi)重復,通過微觀共線性發(fā)現(xiàn),位于第7連鎖群的位點與擬南芥1號染色體末端區(qū)域同源,只是在擬南芥中該區(qū)域發(fā)生了倒位。其他方面,Muangprom等[42]在研究白菜類作物矮化基因定位發(fā)現(xiàn),位于白菜基因組R6連鎖群末端的DWF2基因與擬南芥2號染色體的頂端區(qū)域具有同源性。至今已有數(shù)以百計的控制各種農(nóng)藝品質(zhì)性狀QTL被精確定位在高質(zhì)量的遺傳圖上(http://www.gramene.org/qtl/),但是由于目前蕓薹屬作物只有白菜基因組剛完成,各實驗室利用的分子標記沒有通用性,構建的圖譜密度也不均一,利用的群體也都集中于常規(guī)人工群體(如F2、RIL、NIL),因此比較QTL定位還只是初步階段。基于此,一方面應該利用通用性標記構建更加高密度高質(zhì)量的遺傳圖譜,同時利用擬南芥和白菜基因組信息,構建白菜全基因組物理圖譜和轉錄圖譜,進而加快白菜基因組信息的注釋和結構分析,另一方面則對數(shù)量性狀遺傳模型進行研究,結合生物數(shù)學,環(huán)境因子作用,生化代謝機制,對各種數(shù)據(jù)類型都能分析并且準確易操作的QTL定位軟件,可以預見,蕓薹屬作物的分子設計育種將迎來一個嶄新活躍的時機。
早期蕓薹屬物種細胞學的研究奠定了物種間親緣關系的基本構架,使各物種間遠緣雜交能夠獲得理論支撐。20世紀90年代開始,分子標記技術的應用在物種遺傳作圖、分子標記輔助育種、QTL定位、比較作圖、染色體結構與進化等研究方面發(fā)揮了巨大的作用,2000年擬南芥基因組的測序[43]、2011年4月琴葉擬南芥的全基因組測序[44]、2011年白菜的基因組完成測序并釋放全部信息[45],都提供了海量的基因組信息資源。常見的蕓薹屬基因組資源網(wǎng)站有:英國Rothamsted Research(http://www.brassica.info/);中國農(nóng)業(yè)科學院花卉蔬菜所(http://brassicadb.org/brad/index.php);英國 John Inner Center(http://brassica.bbsrc.ac.uk/);美國JCVI中心(http://www.jcvi.org/cms/404)。加快這些資源向栽培作物轉移則變得極為緊要,現(xiàn)全球范圍內(nèi)蕓薹屬學者正在合作的項目“國際蕓薹屬基因組項目”(Multinational Brassica Genome Project,簡稱 MBGP),“蕓薹科植物圖譜比對項目”(Brassicaceae Map Alignment Project,簡稱BMAP)正是順應這些問題來開展研究的。可以預見,蕓薹屬作物將和禾本科植物水稻一樣,重要的染色體結構進化機制得到解析,重要的農(nóng)藝品質(zhì)性狀基因被克隆,為蕓薹屬分子育種改良提供堅固的平臺。
[1] 李媛媛,傅廷棟,馬朝芝.蕓薹屬植物比較基因組學研究進展[J].植物學通報,2007,24(2):200-207.
[2] Parkin I,Sharpe A,Keith D,et al.Identification of the A and C genomes of amphidiploid Brassica napus(oilseed rape)[J].Genome,1995,38(6):1122 -1131.
[3] Panjabi P,Jagannath A,Bisht NC,et al.Comparative mapping of Brassica juncea and Arabidopsis thaliana using Intron Polymorphism(IP)markers:homoeologous relationships,diversification and evolution of the A,B and C Brassica genomes[J].BMC Genomics,2008,9(1):113.
[4] Suwabe K,Morgan C,Bancroft I.Integration of Brassica A genome genetic linkage map between Brassica napus and B.rapa[J].Genome,2008,51(3):169 -176.
[5] Bohuon EJR,Keith D,Parkin IAP et al.Alignment of the conserved C genomes of Brassica oleracea and Brassica napus[J].Theoretical and Applied Genetics,1996,93(5):833-839.
[6] Morinaga T.Interspecific hybridization in Brassica.IV.The cytology of F1 hybrid of B.carinata and some other species with 10 chromosomes[J].Cytologia,1931,3:77-83.
[7] Attia T,R9bbelen G.Cytogenetic relationship within cultivated Brassica analyzed in amphihaploids from the three diploid ancestors[J].Canadian Journal of Genetics and Cytology,1986,28(3):323-329.
[8] Harrison G,Heslop-Harrison J.Centromeric repetitive DNA sequences in the genus Brassica[J].Theoretical and Applied Genetics,1995,90(2):157-165.
[9] Snowdon R,K9hler W,F(xiàn)riedt W,et al.Genomic in situ hybridization in Brassica amphidiploids and interspecific hybrids[J].Theoretical and Applied Genetics,1997,95(8):1320-1324.
[10] Snowdon R,K9hler W,K?hler A.Chromosomal localization and characterization of rDNA loci in the Brassica A and C genomes[J].Genome,1997,40(4):582 -587.
[11] Snowdon R,F(xiàn)riedrich T,F(xiàn)riedt W,et al.Identifying the chromosomes of the A-and C-genome diploid Brassica species B.rapa(syn.campestris)and B.oleracea in their amphidiploid B.napus[J].Theoretical and Applied Genetics,2002,104(4):533-538.
[12] Slocum M,F(xiàn)igdore S,Kennard W,et al.Linkage arrangement of restriction fragment length polymorphism loci in Brassica oleracea[J].Theoretical and Applied Genetics,1990,80(1):57-64.
[13] Song K,Suzuki J,Slocum M,et al.A linkage map of Brassica rapa(syn.campestris)based on restriction fragment length polymorphism loci[J].Theoretical and Applied Genetics,1991,82(3):296-304.
[14] Landry BS,Hubert N,Etoh T,et al.A genetic map for Brassica napus based on restriction fragment length polymorphisms detected with expressed DNA sequences[J].Genome,1991,34(4):543-552.
[15] Hoenecke M,Chyi Y.Comparison of Brassica napus and B.rapa genomes based on restriction fragment length polymorphism mapping[A].Proceedings of the 8thInternational rapeseed congress[C].1988:1102 -1107.
[16] Lagercrantz U,Lydiate DJ.Comparative genome mapping in Brassica[J].Genetics,1996,144(4):1903.
[17] Lan TH,Paterson AH.Comparative mapping of quantitative trait loci sculpting the curd of Brassica oleracea[J].Genetics,2000,155(4):1927.
[18] Lukens L,Zou F,Lydiate D,et al.Comparison of a Brassica oleracea genetic map with the genome of Arabidopsis thaliana[J].Genetics,2003,164(1):359 -372.
[19] Parkin IAP,Sharpe A,Lydiate D.Patterns of genome duplication within the Brassica napus genome[J].Genome,2003,46(2):291-303.
[20] Parkin IAP,Gulden SM,Sharpe AG,et al.Segmental structure of the Brassica napus genome based on comparative analysis with Arabidopsis thaliana[J].Genetics,2005,171:765 -781.
[21] Xu J,Qian X,Wang X,et al.Construction of an integrated genetic linkage map for the A genome of Brassica napus using SSR markers derived from sequenced BACs in B.rapa[J].BMC Genomics,2010,11(1):594.
[22] Wang J,Lydiate DJ,Parkin IAP,et al.Integration of linkage maps for the Amphidiploid Brassica napus and comparative mapping with Arabidopsis and Brassica rapa[J].BMC Genomics,2011,12(1):101.
[23]Parkin I.Chasing ghosts:comparative mapping in the Brassicaceae[J].Genetics and Genomics of the Brassicaceae,2011:153-170.
[24]Arabidopsis GI.Analysis of the genome sequence of the flowering plant Arabidopsis thaliana[J].Nature,2000,408:796.
[25] Kowalski SP,Lan TH,F(xiàn)eldmann KA,et al.Comparative mapping of Arabidopsis thaliana and Brassica oleracea chromosomes reveals islands of conserved organization[J].Genetics,1994,138(2):499.
[26] Lan TH,DelMonte TA,Reischmann KP,et al.An EST-enriched comparative map of Brassica oleracea and Arabidopsis thaliana[J].Genome Research,2000,10(6):776.
[27] Babula D,Kaczmarek M,Barakat A,et al.Chromosomal mapping of Brassica oleracea based on ESTs from Arabidopsis thaliana:complexity of the comparative map[J].Molecular Genetics and Genomics,2003,268(5):656-665.
[28] Schranz ME,Lysak MA,Mitchell-Olds T.The ABC’s of comparative genomics in the Brassicaceae:building blocks of crucifer genomes[J].Trends in Plant Science,2006,11(11):535-542.
[29] 孫思龍.白菜,甘藍與擬南芥比較基因組分析[D].北京:中國農(nóng)業(yè)科學院,2011.
[30] Wang X,Torres M,Pierce G,et al.A physical map of Brassica oleracea shows complexity of chromosomal changes following recursive paleopolyploidizations[J].BMC Genomics,2011,12(1):470.
[31] Jiang C,Ramchiary N,Ma Y,et al.Structural and functional comparative mapping between the Brassica A genomes in allotetraploid Brassica napus and diploid Brassica rapa[J].Theoretical and Applied Genetics,2011,123(6):927-941.
[32] Osborn T,Kole C,Parkin I,et al.Comparison of flowering time genes in Brassica rapa,B.napus and Arabidopsis thaliana[J].Genetics,1997,146(3):1123.
[33] Long Y,Shi J,Qiu D,et al.Flowering time quantitative trait loci analysis of oilseed Brassica in multiple environments and genomewide alignment with Arabidopsis[J].Genetics,2007,177(4):2433.
[34] Zhao J,Huang J,Chen F,et al.Molecular mapping of Arabidopsis thaliana lipid-related orthologous genes in Brassica napus[J].Theoretical and Applied Genetics,2011,24(2):1 -15.
[35] Sharma A,Chauhan RS.In Silico identification and comparative genomics of candidate genes involved in biosythesis and accumulation of seed oil in plants[J].Comparatine and functional genomics,2012,(1):1155.
[36] Ding G,Zhao Z,Liao Y,et al.Quantitative trait loci for seed yield and yield-related traits,and their responses to reduced phosphorus supply in Brassica napus[J].Annals of Botany,2012.
[37] Xia S,Cheng L,Zu F,et al.Mapping of BnMs4 and BnRf to a common microsyntenic region of Arabidopsis thaliana chromosome 3 using intron polymorphism markers[J].Theoretical and Applied Genetics,2012,124(7):1193 -1200.
[38] Wang H,Wu J,Sun S,et al.Glucosinolate biosynthetic genes in Brassica rapa[J].Gene,2011,487(2):135-142.
[39] Saito M,Kubo N,Matsumoto S,et al.Fine mapping of the clubroot resistance gene,Crr3,in Brassica rapa[J].Theoretical and Applied Genetics,2006,114(1):81 -91.
[40] Suwabe K,Tsukazaki H,Iketani H,et al.Simple sequence repeat-based comparative genomics between Brassica rapa and Arabidopsis thaliana:the genetic origin of clubroot resistance[J].Genetics,2006,173(1):309.
[41] Mayerhofer R,Wilde K,Mayerhofer M,et al.Complexities of chromosome landing in a highly duplicated genome:toward map-based cloning of a gene controlling blackleg resistance in Brassica napus[J].Genetics,2005,171(4):1977.
[42] Muangprom A,Osborn T.Characterization of a dwarf gene in Brassica rapa,including the identification of a candidate gene[J].Theoretical and Applied Genetics,2004,108(7):1378-1384.
[43] Kaul S,Koo HL,Jenkins J,et al.Analysis of the genome sequence of the flowering plant Arabidopsis thaliana[J].Nature,2000,408:796.
[44] Hu TT,Pattyn P,Bakker EG,et al.The Arabidopsis lyrata genome sequence and the basis of rapid genome size change[J].Nature Genetics,2011,43(5):476 -481.
[45] Wang X,Wang H,Wang J,et al.The genome of the mesopolyploid crop species Brassica rapa[J].Nature Genetics,2011,43(10):1035-1039.