郭麗麗 李昱瑩 郭大龍 侯小改
(河南科技大學(xué)農(nóng)學(xué)院/牡丹學(xué)院,洛陽 471023)
遺傳圖譜(Genetic map)或連鎖圖譜(Linkage map)或遺傳連鎖圖譜(Genetic linkage map),是以遺傳標(biāo)記間重組頻率為基礎(chǔ)的染色體或基因組內(nèi)位點(diǎn)相對位置的線性排列圖[1]?;ɑ苤参镞z傳連鎖圖譜構(gòu)建是開展分子標(biāo)記輔助育種的重要工具,可將遺傳圖譜上的分子標(biāo)記作為框架,標(biāo)記和定位植物體內(nèi)質(zhì)量性狀和數(shù)量性狀基因座[2]。高密度遺傳圖譜是輔助基因組測序序列組裝的重要工具[3],進(jìn)而實(shí)現(xiàn)較為精細(xì)的比較基因組分析[4]。通過整合遺傳圖譜內(nèi)種質(zhì)的基因分型,可以解析基因組連鎖不平衡規(guī)律,為開展全基因組關(guān)聯(lián)分析[5]提供研究基礎(chǔ)。高密度遺傳圖譜還可通過整合物理圖譜和遺傳圖譜,加速主效關(guān)鍵基因和目標(biāo)性狀QTL圖位克隆進(jìn)程,從而有效提高育種效率和改良品種[6]。
分子標(biāo)記是以核苷酸序列變異為基礎(chǔ),直接反應(yīng)DNA水平遺傳多態(tài)性的遺傳標(biāo)記。計算分子標(biāo)記間的重組率,基于重組率構(gòu)建遺傳連鎖圖譜,特別是高密度遺傳圖譜,是進(jìn)行遺傳分析和QTL定位的重要手段,是促進(jìn)種質(zhì)資源性狀改良的有效途徑[7]。單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)是基因組水平上由單個核苷酸變異引起的DNA序列多態(tài)性,變異類型和變異頻率豐富[8]。高通量測序技術(shù)的快速發(fā)展和成本的不斷降低,使SNP標(biāo)記在高密度遺傳圖譜構(gòu)建研究中的應(yīng)用越來越廣泛[9]。
遺傳圖譜作為分子標(biāo)記輔助育種技術(shù)的重要工具,對重要花卉植物的新品種選育具有重要的指導(dǎo)意義。目前重要花卉植物如牡丹、梅花、月季、菊花、蘭花、荷花、桂花等高遺傳圖譜的構(gòu)建研究已有報道,但圖譜精密度尚無法滿足精細(xì)定位研究的要求。百合、紫薇、郁金香、向日葵等花卉植物高密度遺傳圖譜構(gòu)建研究還相對較少,制約了花卉植物分子標(biāo)記輔助育種研究的進(jìn)程。因此,本文概述了高密度遺傳圖譜構(gòu)建流程及作圖方法(圖1),綜述了重要傳統(tǒng)木本花卉和草本花卉植物遺傳圖譜構(gòu)建研究進(jìn)展,討論了重要花卉植物高密度遺傳圖譜構(gòu)建存在的主要問題,對今后重要花卉植物遺傳圖譜構(gòu)建研究的發(fā)展方向及其在育種中的應(yīng)用前景進(jìn)行了展望,以期為花卉植物目標(biāo)性狀QTL定位、輔助基因組組裝、比較基因組學(xué)、圖位克隆、分子標(biāo)記輔助育種等研究提供參考。
遺傳圖譜構(gòu)建首先需要構(gòu)建一個親本差異顯著的分離群體,通過對分離群體進(jìn)行多態(tài)性標(biāo)記篩選、個體掃描和連鎖分析,使用作圖軟件確定連鎖群中標(biāo)記的相對順序和遺傳距離,利用群體內(nèi)染色體交換重組,構(gòu)建完整的遺傳圖譜[1]。作圖群體是影響遺傳圖譜構(gòu)建質(zhì)量的重要因素,作圖群體的親本選擇、群體類型、群體大小、分子標(biāo)記種類及遺傳距離估計均影響遺傳圖譜的構(gòu)建效果[10]。
圖1 高密度遺傳圖譜構(gòu)建策略
構(gòu)建遺傳圖譜的作圖群體時,雜交組合親本間的遺傳差異應(yīng)盡量大,方可獲得足夠的DNA序列差異。親本間遺傳差異過大,則使雜種染色體間的配對及重組受到抑制[11],導(dǎo)致連鎖座位間重組率偏低,引起偏分離現(xiàn)象,降低遺傳圖譜的可靠性和適用范圍,還會造成雜種后代結(jié)實(shí)率下降,甚至不育,影響分離群體的構(gòu)建[12]。雙親間遺傳差異過小,則親本間多態(tài)性水平較低,導(dǎo)致獲得相對飽和連鎖圖的難度增加[13]。因此,選擇親本時應(yīng)兼顧親本差異性和后代可育性,同時盡量選擇純度高的材料并通過自交進(jìn)行純化[14]。
遺傳圖譜構(gòu)建采用的作圖群體主要有F1群體、F2群體、重組自交系群體(Recombinant inbred lines,RIL)[15]、回 交 群 體(Backcross,BC)[16]、加倍單倍體群體(Doubled haploid,DH)[17]、近等基因系群體(Near-isogenic lines,NILs)[18]、殘留異質(zhì) 系 群 體(Residual heterozygous lines,RHLs)[19]、導(dǎo)入系群體(Introgressive lines,ILs)[20]等。木本植物世代周期長,雜交結(jié)實(shí)率低,獲得具有顯著孟德爾遺傳特征的高世代群體較難;多數(shù)木本植物自交不親和及組培體系不完善,導(dǎo)致F2、BC、DH、RIL等群體不適于其遺傳圖譜構(gòu)建;木本植物遺傳背景復(fù)雜,雜合度高,基因組大,重復(fù)序列多,均制約其遺傳圖譜構(gòu)建研究的深入開展[21]。F1群體是木本植物遺傳圖譜構(gòu)建采用較為廣泛的作圖群體[22]。F2群體在楊樹、桉樹等速生林木遺傳圖譜構(gòu)建上的應(yīng)用較多[13]。半同胞家系(Half-sib family)群體的構(gòu)建無需人工雜交,花粉來源清楚的半同胞家系可用于林木遺傳圖譜的構(gòu)建[23]。母本減數(shù)分裂形成的大配子體(Macrogametophytes)其分離和重組交換不受近交和自由授粉家系的影響,可用于針葉樹種的遺傳圖譜構(gòu)建研究[24]。
作圖群體的大小是遺傳圖譜分辨率和精度的決定因素。群體越小,圖譜精度越低,檢測到的重組圖距偏大,導(dǎo)致QTL定位時檢測不到重組事件,引起標(biāo)記偏分離現(xiàn)象的產(chǎn)生,造成圖譜誤差較大。群體越大,檢測到的重組圖距越小,有利于緊密連鎖位點(diǎn)的區(qū)分。群體太大,則增加實(shí)驗(yàn)費(fèi)用及工作量。開展遺傳圖譜構(gòu)建研究時,應(yīng)根據(jù)群體類型、作圖目標(biāo)、親本間雜合度及標(biāo)記分離情況等確定群體大小。以基因組序列分析和基因克隆為目的的遺傳圖譜構(gòu)建,需要較大的作圖群體;QTL定位分析時宜選擇包含150個單株的隨機(jī)小群體構(gòu)建骨架連鎖圖譜,對性狀進(jìn)行精細(xì)定位時可通過增大群體數(shù),對目標(biāo)連鎖群進(jìn)行加密[25]。近年來,通過增大作圖群體提高遺傳圖譜精密度的研究日益增多。
基于高通量測序技術(shù)的SNP標(biāo)記開發(fā),可短時間、低成本、高通量完成基因組DNA分型,有助于快速準(zhǔn)確的找到變異位點(diǎn),估算等位基因頻率[26]。全基因組測序(Genome sequencing)、簡化基因組測 序(Reduced-representation genome sequencing,RRGS)和轉(zhuǎn)錄組測序(Transcriptome sequencing)是開發(fā)SNP標(biāo)記的主要高通量測序技術(shù)。隨著越來越多植物全基因組測序的完成,使基于全基因組測序的重測序技術(shù)構(gòu)建高密度遺傳圖譜應(yīng)用越來越廣泛。而大部分多年生木本植物基因組龐大且復(fù)雜,全基因組測序成本太高,使重測序技術(shù)在其遺傳圖譜構(gòu)建中的應(yīng)用受到限制,重測序技術(shù)較為適用于規(guī)模較小的自然群體、骨干親本和極端混池測序(Bulked segregant analysis,BSA)[27]。
RRGS技術(shù)不受參考基因組限制,利用限制性內(nèi)切酶對基因組DNA進(jìn)行酶切,僅富集具有限制性酶切位點(diǎn)的基因組片段,極大的降低了基因組復(fù)雜度和測序數(shù)據(jù)量,且采集盡可能覆蓋全基因組的遺傳變異信息,解決了高成本重測序技術(shù)的局限性[28]。RRGS技術(shù)主要有(1)簡化文庫(Reduced representation libraries,RRLs)[29]和簡化多態(tài)序列復(fù)雜性(Complexity reduction of polymorphic sequences,CroPS)[30];(2)限制性酶切位點(diǎn)關(guān)聯(lián)DNA測序(Restriction-site-associated DNA sequencing,RADseq):RAD(Restriction-site associated DNA)[31]、ddRAD[32]、2b-RAD[33]、SLAF-Seq(Specific-locus amplified fragment sequencing)[34];(3)低 覆 蓋 基因分型文庫:多元鳥槍法基因分型(Multiplexed shotgun genotyping,MSG)[35]和基于測序的基因分型(Genotyping by sequencing,GBS)[36]。CroPS適用于基因組含有大量重復(fù)序列且DNA多態(tài)性較低的物種,GBS和RAD-seq適用于大樣本和復(fù)雜基因組物種[37]。
構(gòu)建遺傳圖譜時需要將分子標(biāo)記劃分成若干連鎖群,每個連鎖群中的標(biāo)記排序后確定標(biāo)記位點(diǎn)在遺傳連鎖群上的位置,標(biāo)記間的位置以遺傳距離表示[38]。常用的作圖軟件主要有Mapmaker[39]、JoinMap[40]、FsLinkageMap[41]等。但是,由于同一作圖軟件并不能包含所有的分離類型,不同軟件構(gòu)建的遺傳圖譜也存在差異,應(yīng)根據(jù)實(shí)際情況選擇適合的軟件。
以牡丹“鳳丹白”M24ד紅喬”雜交,構(gòu)建包含195個子代的F1群體為作圖群體,采用SLAFseq簡化基因組測序技術(shù),構(gòu)建了首張牡丹高密度遺傳連鎖圖譜,該圖譜含5個連鎖群,1189個SNP標(biāo)記和72個SSR標(biāo)記,遺傳圖距1061.94 cM,標(biāo)記間平均遺傳圖距0.84 cM,最大連鎖群306.85 cM,最小連鎖群96.32 cM[42]。以“鳳丹”ד新日月錦”F1群體為作圖群體(120個子代),采用GBS技術(shù)構(gòu)建了包含3868個SNP標(biāo)記和35個SSR標(biāo)記的高密度遺傳圖譜,總遺傳圖距13175.5 cM,覆蓋5個連鎖群,連鎖群平均長度2635.1 cM,標(biāo)記數(shù)變化范圍322-1224,平均標(biāo)記位點(diǎn)773.6個,標(biāo)記間平均距離3.406 cM,基因組覆蓋范圍1428.378 cM-3786.571 cM[2]。以“青龍禾墨池”ד墨子蓮”雜交獲得F1分離群體為材料,采用RAD-seq技術(shù)構(gòu)建牡丹高密度遺傳圖譜,該圖譜分別覆蓋父母本965.69 cM和870.21 cM,標(biāo)記間平均間隔分別0.66 cM和1.10 cM[43]。
通過‘Red New Dawn’(RND)בMorden Centennial’(MC)雜交,構(gòu)建了包含177個子代的F1作圖群體,構(gòu)建了月季高密度遺傳圖譜,該圖譜含有1929個SNP標(biāo)記,覆蓋25個連鎖群,遺傳圖距765.5 cM,平均標(biāo)記距離0.9 cM[44]。采用GBS技術(shù)構(gòu)建月季F1分離群體J06-20-14-3בLittle Chief’(J14-3×LC),J06-20-14-3בVineyard Song‘(J14-3×VS)和‘Old Blush’בRed Fairy’(OB×RF)的整合高密度遺傳圖譜,該圖譜包含3527個SNP標(biāo)記,標(biāo)記間平均距離0.25 cM,遺傳圖距892.2 cM,覆蓋7個連鎖群,連鎖群大小95-167 cM,最大連鎖群LG7(167 cM),標(biāo)記密度最高(6標(biāo)記/cM)且平均距離最?。? cM/bin標(biāo)記)的連鎖群為LG2,遺傳缺口最大的連鎖群為LG5(11.2 cM)。整合圖譜長度比單個圖譜增加近390 cM,圖譜密度和標(biāo)記間平均距離有所改善,標(biāo)記密度和標(biāo)記順序可靠性得到提高[45]。使用RAD-seq技術(shù)構(gòu)建了Rosa chinensis‘Old Blush’和R. wichuraiana‘Basyes Thornless’回交群體BC1F1(152個子代)的高密度連鎖圖譜,該圖譜包含2213個標(biāo)記,分布在7個連鎖群上,遺傳圖譜總長度為1027.425 cM,標(biāo)記間平均距離0.96 cM,將1.21/23.14 Mb(12.18/44.52%)未組裝‘Old Blush’的scaffolds錨定到7條pseudochromosomes上[46]。
采用RAD-seq簡化基因組測序技術(shù),在含190個子代的梅花“粉瓣”ד扣子玉蝶”F1群體中,檢測到1484個SNP標(biāo)記,構(gòu)建了包含8個連鎖群的梅花高密度遺傳圖譜,總遺傳圖距780.9 cM,標(biāo)記間平均距離為0.5 cM,錨定513條梅花基因組組裝序列,覆蓋基因組84%[47]。該遺傳圖譜輔助梅花全基因組組裝,提高了梅花基因組組裝質(zhì)量[3]。利用梅花品種“六瓣”ד粉臺垂枝”含387個子代的F1作圖群體,采用SLAF-seq技術(shù)構(gòu)建了梅花高密度遺傳圖譜,圖譜包含8個連鎖群,8007個遺傳標(biāo)記,標(biāo)記間平均距離0.195 cM,遺傳總圖距為1550.62 cM,SNP標(biāo)記在F1群體中的平均完整度為96%,垂枝性狀定位在7號染色體10.54 Mb-11.68 Mb之間,10個SNP分子標(biāo)記與梅花垂枝性狀緊密連鎖[48]。
采用桂花‘Wan Yin Gui’(Albus Group)為父本,‘Huang Chuan Jin Gui’(Luteus Group)為母本,構(gòu)建了包含129個子代的F1作圖群體,使用SLAFseq技術(shù)構(gòu)建了桂花高密度遺傳圖譜,該圖譜包含14189個高質(zhì)量SLAF標(biāo)記,分布在23個遺傳連鎖群上,總長度2962.46 cM,相鄰標(biāo)記間平均距離0.21 cM[49]。
“中國古代蓮”×美洲黃蓮‘AL1’雜交構(gòu)建F1作圖群體(51個子代)[50],基于RAD-seq技術(shù)構(gòu)建了蓮高密度遺傳連鎖圖譜,使用美洲黃蓮‘AL1’遺傳圖譜錨定“中國古代蓮”基因組圖譜框架序列,3603個SNP標(biāo)記將234個individual scaffold sequence錨定在9個megascaffolds,覆蓋基因組67%[51]。以較大的“中國古代蓮”×美洲黃蓮‘AL1’F1群體(80個后代)為材料[52],以“中國古代蓮”基因組為參考序列[53],利用RAD-seq技術(shù)構(gòu)建美洲黃蓮‘AL1’的高密度遺傳圖譜,該圖譜由1515個SNP標(biāo)記組成,分布在10個連鎖群上,基因組覆蓋長度563.6 cM,平均圖距0.38 cM。通過‘Man tian xing’בJu wu ba’F1群體自交,獲得F2作圖群體(96個子代),采用ddRAD-seq技術(shù)構(gòu)建高密度遺傳圖譜,圖譜包含8971 SNP標(biāo)記,覆蓋8個連鎖群,遺傳圖距581.3 cM,平均標(biāo)記間隔為0.74 cM,錨定基因組框架序列809個,wild sacred蓮花基因組覆蓋度70.6%[54]。采用‘Chinese Tai-zi’ בThailand Chiang Mai’ F2作圖群體(181個子代),基于RADseq技術(shù)構(gòu)建N. nucifera高密度遺傳圖譜,輔助‘Chinese Tai-zi’基因組組裝,使基因組scaffold N50從0.989 Mb 增加至1.48 Mb,提高了基因組組裝質(zhì)量[55]。中國蓮“金秋”(多瓣)ד白花建蓮”(少瓣)構(gòu)建F2 作圖群體(121個子代),采用全基因組重測序技術(shù)構(gòu)建了中國蓮高密度遺傳圖譜,圖譜由8個連鎖群組成,包含1939個區(qū)間標(biāo)記和79596個SNPs標(biāo)記,標(biāo)記平均圖距為0.49 cM,遺傳圖距總長度為772.92 cM,連鎖群平均長度為96.61 cM[56]。
采 用 菊 花DB36451×DB39287(P2) 雜交F1群體(406個子代)構(gòu)建六倍體菊花(Chrysanthemum×morifolium,2n=6x=54) 的高密度遺傳連鎖圖譜,該圖譜包含30312個SNP標(biāo) 記,覆 蓋9個 連 鎖 群[57]。通 過Chrysanthemum×Morifolium‘Candy’(雙 花/扁 平花)和Chrysanthemum×Morifolium‘225’(單花/管狀花)雜交,獲得包含305個個體的F1作圖群體,使用SLAF-seq技術(shù)構(gòu)建菊花高密度遺傳連鎖圖譜,圖譜包含6452個標(biāo)記,總遺傳圖距4301.5 cM,平均距離為0.76 cM;LG平均長度159.315 cM,包含270個標(biāo)記,跨度為120.84 cM;最長連鎖群LG9包括299個標(biāo)記,遺傳圖譜距離263.37 cM,平均標(biāo)記間距離0.88 cM;最短連鎖群LG18含147個標(biāo)記,遺傳圖譜距離84.66 cM,平均標(biāo)記間距離0.58 cM;LG2遺傳缺口最大(18.92 cM),LG20中遺傳缺口最?。?.23 cM)[58]。
通過蘭花‘Dendrobium nobile’בDendrobium wardianum’雜交構(gòu)建包含100個子代的F1作圖群體,采用RNA-seq技術(shù)鑒定到9645個有效多態(tài)性SNP標(biāo)記,構(gòu)建了蘭花高密度整合遺傳圖譜,圖譜覆蓋19個連鎖群,總遺傳圖距為3612.12 cM,平均標(biāo) 記間隔為0.41 cM[59]。利用‘Dendrobium moniliforme’בD. officinale’雜交,獲得含111個后代的F1作圖群體[60],采用SLAF-seq技術(shù)構(gòu)建了蘭花高密度遺傳連鎖圖譜,圖譜包含8573個SNP標(biāo)記,分布在19個連鎖群上,總遺傳圖距為2737.49 cM,標(biāo)記間平均遺傳距離為0.32 cM[61]。
通過單瓣矮牽牛×重瓣矮牽牛雜交獲得F1群體,從F1群體中隨機(jī)選取一株重瓣后代為父本,選擇一株單瓣后代為母本,雜交獲得F2群體,從F2群體中選取50株單瓣和51株重瓣植株,以此作為作圖群體,采用全基因組重測序技術(shù),構(gòu)建了矮牽牛高密度遺傳連鎖圖譜。使用Join Map4.1構(gòu)建的遺傳圖譜包含4474個標(biāo)記,總遺傳距離2022.786 cM,平均遺傳距離0.758 cM;使用Lepmap構(gòu)建的遺傳圖譜包含8030個標(biāo)記,總遺傳距離453.39 cM,平均遺傳距離1.00 cM,重瓣性狀定位在LG5[62]。
以康乃馨‘85-11’בPretty Favvare’雜交F2作圖群體為材料,采用ddRAD-seq技術(shù)構(gòu)建了康乃馨高密度遺傳圖譜,該圖譜包含285個SSR和2119個SNP標(biāo)記,覆蓋15個連鎖群,遺傳圖距為971.5 cM,標(biāo)記間平均距離為0.4 cM[63]。
全基因組測序、簡化基因組測序、RNA-Seq等高通量測序技術(shù)的飛速發(fā)展,為分子標(biāo)記開發(fā)提供了成本更低更高效的手段。梅花[3]、菊花[64]、蓮花[53,65-67]、牡丹[68]、桂花[69]、康乃馨[70]、蘭花[71-73]、矮牽牛[74]等基因組的發(fā)布,有利于基于全基因組重測序的高密度遺傳圖譜構(gòu)建研究的深入開展,有利于推動花卉植物生物學(xué)和分子育種研究的進(jìn)程。然 而,目 前 牡 丹[2,42-43]、月 季[44-46]、梅 花[47-48]、桂花[49]、蓮花[51,54-56]、菊花[57-58]等重要觀賞植物所構(gòu)建的遺傳圖譜,其精密度尚無法滿足精細(xì)定位及圖位克隆研究的需求,百合、紫薇、郁金香、向日葵等重要觀賞植物高密度遺傳圖譜構(gòu)建尚見未開展,制約了觀賞植物分子育種研究進(jìn)程。今后應(yīng)加大基于大群體、多群體、高世代群體及野生資源為親本群體的高密度遺傳圖譜構(gòu)建研究,提升現(xiàn)有遺傳圖譜的精密度,使其應(yīng)用于精細(xì)定位和圖位克隆等研究。種質(zhì)資源的商業(yè)化開發(fā)與應(yīng)用,導(dǎo)致其遺傳變異特性的局限性,探索原始野生種的基因遺傳變異對促進(jìn)遺傳改良具有重要意義。