羅含敏 熊發(fā)前 丘立杭 劉 菁 段維興高軼靜 覃夏燕 吳建明 李楊瑞 劉俊仙
(1廣西壯族自治區(qū)農業(yè)科學院甘蔗研究所,530007,廣西南寧;2農業(yè)農村部廣西甘蔗生物技術與遺傳改良重點實驗室/廣西甘蔗遺傳改良重點實驗室,530007,廣西南寧;3廣西壯族自治區(qū)農業(yè)科學院經濟作物研究所,530007,廣西南寧)
甘蔗(Saccharum officinarumssp.)被廣泛種植于熱帶和亞熱帶地區(qū),不僅是重要的禾本科糖料作物,也是重要的生物質與能源作物和經濟作物[1-2]。廣西是我國最大的甘蔗生產基地,自2000年以來,種植面積占我國糖料作物總面積的 70%以上,另外,甘蔗糖占我國食糖總量的90%以上,因此,甘蔗產業(yè)對保障國家蔗糖供給安全有著舉足輕重的作用。
甘蔗栽培由新植和宿根組成,國內的一般可收獲3年(1年新植和2年宿根),而國外多數產蔗國多于3年。其單產為單位面積有效蔗莖的總重量,由株高、分蘗、莖徑、錘度和單莖重等多基因調控的重要數量性狀組成[3-4],因此,確保甘蔗種植穩(wěn)產增產的重要途徑之一是培育優(yōu)良新品種,高產、高糖、宿根性好和抗性強等優(yōu)良性狀需綜合兼顧,不同時代甘蔗品種的更迭對提高甘蔗產量意義非凡[5]。然而,甘蔗新品種選育和改良主要采用傳統(tǒng)的有性雜交程序(圖1),該程序存在選育周期長、經驗性居多和效率低等問題,育成1個甘蔗新品種需要8~10年,甚至更長的時間。此外,甘蔗栽培種的基因組高度雜合,染色體呈非整倍性[6],而當前甘蔗高貴化育種的遺傳基礎狹窄[7-8],這些加大了甘蔗品種選育和遺傳改良的難度[9]。雖然可通過近緣屬和遠緣屬雜交引入更多的優(yōu)異基因資源以拓寬甘蔗遺傳基礎[10-11],但重要數量性狀在甘蔗雜交后代中易受環(huán)境因子影響而表現不穩(wěn)定[12-13],這也加劇了甘蔗品種選育難度。由此可知,甘蔗常規(guī)品種選育的瓶頸顯而易見。目前,隨著分子生物學及基因組學技術和手段的快速發(fā)展,甘蔗栽培種R570和細莖野生種割手密(Saccharum spontaneumL. AP85-441)基因組的公布[6,14],且越來越多甘蔗栽培品種(系)RNA-Seq數據的發(fā)表[15-18],給基于大數據挖掘與開發(fā)甘蔗性狀相關的分子標記在甘蔗育種上的利用帶來了新的希望和機遇。雖然基于基因組的分子標記極大地促進了重要作物農藝性狀的遺傳選育[19],然而,甘蔗分子標記輔助育種仍面臨著許多挑戰(zhàn)。本文通過分析甘蔗分子標記輔助育種的現狀及其瓶頸,總結應用于甘蔗的分子標記種類及其存在的問題,闡明分子標記在甘蔗遺傳連鎖圖譜構建中的作用及其研究狀況,進而從甘蔗產量與蔗糖分性狀相關 QTL的定位、甘蔗主要抗病基因的定位及其在抗病分子育種中的應用概況、關聯分析方法在甘蔗重要農藝性狀研究中的應用等方面對性狀相關的分子標記進行綜述,為分子標記技術助力甘蔗新品種選育和提高育種效率提供理論參考。
圖1 甘蔗新品種的常規(guī)雜交選育流程Fig.1 The process of conventional cross breeding for new sugarcane varieties
分子標記輔助育種技術可提高作物育種效率,也能準確地進行目標農藝性狀的定向選擇。雖然分子標記在甘蔗及其種質遺傳多樣性研究中已有許多報道,但目前只有抗褐銹病基因標記能夠應用于甘蔗分子標記輔助育種中[20]。究其原因主要有 4點,一是甘蔗遺傳背景復雜且基因組高度雜合與龐大,二是甘蔗高貴化代表性品種全基因組序列尚未測序并組裝完成,三是缺乏簡單實用高效的 DNA分子標記,四是遺傳連鎖圖譜構建密度極度不飽和。這些是導致甘蔗種質資源的分子精準鑒定和評價、高密度遺傳連鎖圖譜的構建、重要性狀QTL精細定位、關鍵基因的圖位克隆以及與之緊密連鎖的分子標記開發(fā)等都存在困難的原因,因此,很難真正達到甘蔗分子標記輔助育種和分子聚合育種的目的。
目前,雖然有越來越多與甘蔗相關的轉錄組測序(RNA-Seq)報道,但甘蔗基因組的de novo測序及其組裝尚未完成,而已公布的相關甘蔗基因組在育種研究工作中的應用有待挖掘。因此,為了加快甘蔗分子育種的進程,針對目標性狀開發(fā)簡單、實用和高效的分子標記十分必要。目前應用在甘蔗種質資源分子鑒定和評價上的分子標記技術有RAPD[21]、ISSR[22]、AFLP[23]、SRAP[24]和 SCoT[25],雖然這些分子標記技術在甘蔗DNA多態(tài)性檢測上發(fā)揮著重要作用,也可用于甘蔗種質資源的遺傳多樣性分析和構建其DNA身份證數據庫,但RAPD技術的重復性較差[26],AFLP技術的操作流程較復雜且對科研人員及實驗儀器設備要求較高[27],ISSR[22]、SRAP[28]和 SCoT[29]雖然操作簡單但多態(tài)性不夠豐富,且都是顯性分子標記技術,擴增條帶數較多,PCR擴增結果易受環(huán)境影響,其重復性和穩(wěn)定性不夠好。許多研究表明,SSR標記在甘蔗上有豐富的多態(tài)性,已被廣泛應用于甘蔗遺傳多樣性分析[30]、分子遺傳連鎖圖譜構建[31-32]和QTL定位[33],雖然國內外已開發(fā)出了數量較多的甘蔗SSR標記引物對,但開發(fā)效率相對較低?,F今,隨著高通量測序技術的快速發(fā)展和測序成本的大幅下降,轉錄組測序或者簡化基因組測序在規(guī)?;_發(fā)甘蔗SSR標記上有巨大潛力,但甘蔗基因組龐大且復雜(約10Gb),目前開發(fā)出來的SSR標記引物對數量還遠遠不夠,且在任意2份甘蔗材料之間具有多態(tài)性的SSR標記引物數量更是有限。此外,擴增出來的片段大小差異小,需要通過較為復雜的后期技術和手段(如聚丙烯酰胺凝膠電泳或毛細管電泳等)分離。這些缺點嚴重制約了分子標記在甘蔗種質資源的精準鑒定及評價、高密度遺傳連鎖圖譜的構建、重要性狀的 QTL定位、基因的圖位克隆以及分子標記輔助育種中的應用。
高密度和高分辨率的遺傳連鎖圖譜是進行數量性狀基因精細定位(quantitative trait loci,QTL)、分子標記輔助選擇育種、重要基因克隆及比較基因組研究的基礎[34]。雖然分子標記技術的開發(fā)與應用促進了甘蔗屬作物遺傳連鎖圖譜的構建,但由于甘蔗屬及其近緣屬一般為復雜的多倍體或高度雜合的非整倍性多倍體作物,染色體數多達100~150條,基因組龐大且高度雜合,因此,其遺傳連鎖圖譜的構建研究滯后于其他作物[31,35-37]。據保守估計,由于甘蔗的基因組遺傳距離為17 000~18 000cM[37-38],理論上構建1個平均距離為10cM的飽和遺傳連鎖圖譜,大概需要1700~1800個單雙劑量標記。目前,甘蔗遺傳連鎖圖譜的構建主要利用RFLP、RAPD、SSR和AFLP分子標記技術。
割手密最早的遺傳圖譜是通過RFLP分子標記技術構建的[39],該圖譜包含216個單劑量標記(single dose marker,即只在父本或母本一方存在的標記)和44個連鎖群。利用RAPD分子標記技術構建的割手密遺傳連鎖圖譜包含279個單劑量標記和42個連鎖群[40]。然而,通過整合這2種分子標記技術構建的割手密遺傳連鎖圖譜則包含442個單劑量標記和64個連鎖群[41],其密度和分辨率明顯優(yōu)于單一的分子標記技術。以此估算割手密無性系“SES208”(2n=80)的基因組長度為3300cM,而通過單一RAPD分子標記技術推斷的僅為 2550cM[40],其基因組大小顯然與甘蔗屬預計相差甚遠。由此可見,利用單一的分子標記技術構建的甘蔗遺傳連鎖圖譜的基因組覆蓋率小,無法精細定位。
在栽培甘蔗分子遺傳連鎖圖譜方面,分子標記SSR和AFLP整合用于構建甘蔗雜交父母本和甘蔗栽培品種雜交后代[37,42],以及甘蔗商業(yè)品種Co419與野生種割手密Y75-1-2的雜交F1和回交BC1群體的遺傳連鎖圖譜的構建[31],將新型分子標記技術TRAP(target region amplified polymorphism)融入這 2種技術整合體系后,以美國路易斯安那州主栽品種LCP85-384作為遺傳材料構建的遺傳連鎖圖譜包含1111個多態(tài)性標記,其中有773個為單劑量標記,分布在108個連鎖群上,總遺傳距離為12 313cM[32],這間接證實甘蔗基因組龐大的事實[6]。另外,新型分子標記EST-SSR與AFLP聯合構建的甘蔗栽培品種(IAC66-6×TUC71-7)后代遺傳連鎖圖譜的總遺傳距離也有4843.19cM[43]??梢?,新型分子標記技術的研發(fā)及多種分子標記技術的聯合應用對構建甘蔗高密度遺傳連鎖圖譜意義重大。
綜上可知,單一分子標記技術的應用對甘蔗屬遺傳連鎖圖譜構建的貢獻有限,而不同分子標記技術的整合應用效果更為明顯。此外,不同甘蔗種屬間及其雜交后代的遺傳距離差異很大,這暗示甘蔗基因組極其復雜多變,對構建高密度和高分辨率遺傳連鎖圖譜造成極大挑戰(zhàn),重要農藝性狀功能基因精細定位的難度較大。
產量和糖分相關性狀一直是甘蔗育種研究的熱點,實現高產、高糖也是甘蔗育種和栽培技術的瓶頸[44-45]。雖然分子標記技術的快速發(fā)展給作物遺傳連鎖圖譜的構建提供了可靠的技術支撐,且利用分子標記開展性狀相關QTL定位的報道并不鮮見,也在甘蔗屬作物上得到了應用[46],但目前國內外關于甘蔗產量和糖分相關性狀 QTL定位的報道相對較少。
Ming等[47]利用甘蔗栽培種與割手密雜交后代的分離群體構建了包含735個RFLP標記的遺傳連鎖圖譜,結合2年表型數據的統(tǒng)計分析和遺傳標記的連鎖分析,定位到了甘蔗產量、糖分、莖重、有效莖數、纖維含量和灰分含量等性狀的QTL。Pinto等[48]利用優(yōu)良種質SP80-180(父本)和SP80-4966(母本)的雜交后代群體為材料,也構建了2年生育期的甘蔗RFLP遺傳連鎖圖譜,并定位了120個與單位面積含糖量和產糖量、纖維含量以及蔗莖產量相關的QTL,其中有26個QTL在2年中均有定位到,有32個QTL僅在宿根蔗中定位到,此外,還鑒定了50個與這4個性狀具有雙基因上位互作的標記,進一步分析發(fā)現,1個與蔗糖合成相關的QTL與蔗莖產量呈負相關,但與單位面積含糖量和產糖量呈正相關。由于數量性狀在甘蔗雜交后代中易受環(huán)境影響,表現不穩(wěn)定[12-13],故檢測中不能忽略QTL、收獲年限和種植地點之間交互作用的影響。針對這一問題,Pastina等[49]提出了一種聯合區(qū)間作圖法與混合模型分析法對甘蔗多重–多年收獲–多點試驗數據的QTL檢測策略,通過該策略發(fā)現甘蔗分離群體后代在2個試驗點下連續(xù)3年收獲的46個QTL,其中13個為蔗莖產量,14個為糖產量,11個為纖維分,8個為蔗糖分。另外,這些QTL受收獲互作、地理位置互作及二者均互作的影響均達顯著水平。在甘蔗的3個生育周期中,Singh等[50]對7個不同地理環(huán)境下甘蔗產量相關性狀開展了更加全面細致的定位,連鎖分析發(fā)現雜交后代分離群體中有8個群體與母本Co86011連鎖,16個群體與父本CoH70連鎖,基于SSR分子標記構建了總長為2606.77cM的遺傳連鎖圖譜,還精細定位到了31個與父母本在遺傳影響上一致的QTL,分別是2個苗期錘度 QTL、7個田間錘度 QTL、6個蔗糖分QTL、4個有效莖數QTL、1個莖長QTL、3個莖粗QTLs、6個節(jié)間數QTL和2個綠葉片數QTL,其中與糖含量性狀相關 QTL連鎖的 SSR標記在UGSM31548和 UGSM31649之間,這暗示甘蔗農藝性狀標記的遺傳距離比較大。
然而,Hoarau等[51]以甘蔗栽培種R570的自交系群體為標記對象,利用1000個AFLP標記構建了覆蓋R570一半基因組的遺傳連鎖圖譜,并定位到了4個甘蔗重要農藝性狀的QTL,包括株高、莖數、莖徑和錘度相關,這些 QTL的個體差異解析了整個表型變異的3%~7%,且可能受40個假定的數量性狀等位基因(quantitative trait allele,QTA)調控。為了更加精準地挖掘甘蔗產量相關 QTL的連鎖基因,Balsalobre等[52]構建了基于223個連鎖群體測序基因分型(genotyping-by-sequencing,GBS)數據的QTL遺傳連鎖圖譜,通過GBS測序分析開發(fā)了3433到15906個高質量的標記,利用其中的 993個單劑量標記累積繪制的圖長為3682.04cM,平均標記密度為3.70cM,定位到了7個產量構成性狀相關的QTL,并關聯到可溶性固體含量QTL和纖維含量QTL的候選基因。
總之,雜交后代分離群體密度及其個體間遺傳差異大小與遺傳連鎖圖譜的總遺傳距離和平均標記密度密切關聯,而甘蔗雜交后代分離群體個體差異大致使其分子標記間隔距離較大,這給控制甘蔗重要性狀 QTL的主效基因定位和挖掘帶來了許多困難。
目前,隨著氣候的變化,全球蔗區(qū)甘蔗病害嚴重頻發(fā),對產量和蔗糖分造成了不可逆轉的損失[53-56]。因此,甘蔗抗病育種迫在眉睫,然而抗病品種的選育進展緩慢。褐銹病是甘蔗最嚴重的葉部病害之一,自Daugrois等[57]報道,Bru1為甘蔗抗褐銹病的主效基因后,Asnaghi等[58]采用AFLP分子標記/BSA測序的聯合方法獲得了Bru1基因目標區(qū)域的分子標記,在該基因兩側共獲得8個AFLP遺傳標記,而其中與Bru1基因最近的2個遺傳標記的遺傳距離分別為1.9和2.2cM。McIntyre等[59]利用甘蔗抗性基因類似物的序列對遺傳圖譜進行標記驗證,共檢測到31個標記,其中3個標記與甘蔗抗褐銹病顯著相關,還定位到解釋甘蔗抗褐銹病 7%~18%表型變異的 QTL[60]。Raboin等[61]利用抗病品種 MQ76-53和感病品種 R570雜交后代的分離群體作為材料,綜合運用AFLP、SSR和RFLP技術構建了由 424個單劑量標記組成的 MQ76-53遺傳連鎖圖譜,定位到了1個新的抗褐銹病的主效QTL和1個微效QTL,但與主效QTL最近的AFLP遺傳標記(acgcta16)的距離有23cM。可見,這些與Bru1基因相關的遺傳標記的分辨率不高,相關的QTL所解析的表型變異也大,在抗銹病育種材料篩選的難度較大。隨著生物技術的發(fā)展,Asnaghi等[62]和Le Cunff等[63]均運用比較基因組學策略來加密甘蔗目的基因的遺傳圖譜,最終獲得Bru1基因區(qū)域內高分辨率遺傳圖譜,并將Bru1基因定位于甘蔗第7條染色體0.42cM區(qū)域內,發(fā)現該區(qū)域與高粱第4號染色體上的約225kb區(qū)域和水稻第2號染色體短臂上的600kb區(qū)域具有高度同線性,這是目前與Bru1基因共分離最近的遺傳標記距離,分別達到0.28和0.14cM的高分辨率。說明基于同源功能基因序列靶向開發(fā)目標標記是可行的,這對于缺乏參考基因組的作物具有借鑒意義。
迄今,隨著甘蔗抗褐銹病Bru1基因被廣泛地深入研究,這一抗性標記的開發(fā)也逐漸被成功應用于甘蔗分子標記輔助育種中,并陸續(xù)被法國[64]、美國[65-66]、阿根廷[67]、中國[68-72]、巴西[73]等國家的科研工作者應用于分子育種研究,這意味著在甘蔗抗銹病育種中邁出了堅實的一步,并給其他農藝性狀的分子標記輔助育種提供了參考。
黃點病是僅次于褐銹病的葉部嚴重病害,Aljanabi等[33]利用抗病品種“M134/75”和感病品種“R570”雜交的227個后代個體作為作圖群體,利用AFLP和SSR標記構建了包含557個單劑量標記的甘蔗栽培種M134/75的遺傳連鎖圖譜,并在連鎖群LG87上定位到了一個抗甘蔗黃點病主效基因CIR12284,該基因位于標記aagctt3和actctc10之間,而與距離最近的actctc10標記的遺傳距離也有14cM。而Parmessur等[74]通過融入EST-SSR分子標記對 227個作圖群體進行了基因分型,再經過RAD-seq測序分析得到含528個單劑量標記和2777個RAD-seq標記的甘蔗M134/75的遺傳連鎖圖譜,經Software Joinmap 4.1分析后產生總長8277cM(2046標記)由286個連鎖群組成的圖譜,隨后,基于EST-SSR分子標記在M134/75的LG28上鑒定到1個抗黃點病的主效QTL,其最近的遺傳標記距離為5cM,分辨率提高超過2.5倍,且這個QTL解析了30%的表型變異??梢?,采用不同的標記技術,靶向基因遺傳標記距離的差距較大,這可能與物種染色體的倍性及復雜度有關。
據不完全統(tǒng)計[75],黑穗病是我國甘蔗生產上最主要的病害,發(fā)生嚴重年份造成甘蔗產量損失達20%~50%,蔗糖分降低 0.3%~0.5%(絕對值),宿根蔗受害尤為嚴重??购谒氩「收嵝缕贩N的選育是減輕黑穗病對甘蔗產業(yè)危害的根本途徑,但由于甘蔗遺傳背景復雜,迄今為止,關于甘蔗抗黑穗病基因的定位、克隆及其分子標記輔助育種的研究進展十分緩慢,相關的研究報道甚少[76]。許莉萍等[77]結合RAPD技術和BSA法,獲得了1個與甘蔗抗黑穗病生理小種2基因連鎖的分子標記,并將其轉化為SCAR標記。高軼靜等[78]則通過SSR技術與BSA法的整合,獲得了1個與甘蔗抗黑穗病基因連鎖的SSR標記。
根據孟德爾和摩爾根提出的遺傳定律,調控甘蔗重要性狀的遺傳基因既存在分離與自由組合,也會發(fā)生連鎖與互換,而甘蔗基因組龐大且高度雜合,染色體存在非整倍性現象,控制重要性狀的基因發(fā)生連鎖遺傳的概率較高。雖然已有不少研究者針對甘蔗屬重要性狀進行了遺傳連鎖圖譜構建和QTL定位研究,但農藝性狀一般受多個數量性狀位點或基因共同調控[79],理論上發(fā)生連鎖基因的不平衡遺傳在甘蔗上的體現更為突出[80-81]。然而,基于連鎖不平衡(linkage disequilibrium,LD)的性狀關聯分析在甘蔗上的研究報道較少。
起初,Jannoo等[82]對59份甘蔗商業(yè)品種材料進行LD分析,通過38個RFLP探針揭示出這些材料間DNA的多態(tài)性,發(fā)現33個基因座與42例雙位點事件有關聯,且它們間的遺傳距離大多不超過10cM,相對應的等位基因在起源品種中至少有1個被發(fā)現,這暗示它們存在血緣關系,即當基因座緊密相連時,由此產生的優(yōu)異等位基因組合在隨后的雜交中得以維持,也證實了基于LD在分子標記與甘蔗農藝性狀之間進行關聯分析的可行性。隨后,Raboin等[83]對基于LD的關聯分析在繪制甘蔗基因組圖譜上的價值進行了評估,以品種“R570”為對照,使用42對AFLP標記引物對72個甘蔗現代栽培種進行了親緣關系分析,基于1537個多態(tài)性標記的關聯分析結果顯示,許多連鎖標記因遺傳多倍性而無法被識別。然而,就共分離群體而言,同一個被分配的標記,這些甘蔗現代栽培種樣本的LD關聯分析結果和對照種后代的遺傳連鎖分析表現出一樣的效果,說明甘蔗現代栽培種性狀的LD關聯分析不受遺傳多倍性的影響。另外,Wei等[84]運用1068個AFLP標記和141個SSR標記對154份甘蔗品系進行關聯分析,通過回歸分析獲得了與澳大利亞4種最重要甘蔗病害關聯的分子標記,其中,4個標記解釋了甘蔗白葉病和根腐病32%的表型變異,5個標記解釋了甘蔗斐濟病26.2%的表型變異,11個標記解釋了甘蔗抗黑穗病 58.6%的表型變異(其中4個效應較大的標記解釋了53.7%的表型變異),同時還提出種群結構在標記–性狀關聯分析中應該被考慮。
近年來,Banerjee等[85]利用基因組的123條ESTSSR引物對印度亞熱帶蔗區(qū)的102個甘蔗品種進行群體結構、親緣關系和標記–性狀 LD關聯分析等研究,發(fā)掘了989個SSR標記位點。隨后,基于混合線性模型分析,分別鑒定了4個和7個與莖徑、株高及有效莖數顯著相關的標記,另外,有 15個標記連續(xù)3年穩(wěn)定地解釋了57%的有效莖數、34%的莖粗、27%的莖長、20%的蔗糖分含量和19%的節(jié)數等甘蔗產量和蔗糖性狀變異,進一步指出甘蔗家系分組的群體結構對利用基于基因數據的關聯分析進行品種選育至關重要,這一觀點與Wei等[84]一致。Singh等[86]也利用LD關聯作圖法獲得4個可解釋甘蔗抗赤腐病10%~16%表型變異的SSR標記,并通過EST測序與高粱基因組進行共線性比對以鑒定其候選基因,發(fā)現標記位點對應的基因編碼重要的植物防御相關蛋白,認為它們可能是潛在的抗性候選基因。
Fickett等[87]利用基于全基因組關聯分析(genome wide association study,GWAS)開發(fā)的SNP和InDel標記對甘蔗的11個產量性狀和蔗糖分性狀進行研究,發(fā)現56個標記與蔗糖分性狀顯著相關,且在多個性狀上也表現出一致的顯著性,隨后,這些標記在更加多樣化的群體中得到了驗證,可用于甘蔗品系的分子標記輔助選育,Racedo等[80]和Yang等[81]的研究結果可作為最新的佐證。You等[88]也基于 SNP標記技術開發(fā)出了甘蔗高通量100K SNP矩陣試劑盒,用于構建3個甘蔗親本的遺傳連鎖圖譜,并對來自這3個親本雜交及自交的469份后代材料進行關聯分析,鑒定出了27個抗病基因,其中18個與SCYLV(Sugarcane yellow leaf virus)抗性相關的QTL關聯,此外,這469份材料基因分型的結果顯示,樣本 SNP多態(tài)性的比例高達77.04%。可見,SNP陣列可作為高度多倍體甘蔗高通量基因分型的有效遺傳標記工具,將在重要性狀的關聯分析及其調控基因挖掘上發(fā)揮巨大作用[89]。
基因組是作物分子育種研究的關鍵,也是突破傳統(tǒng)育種的重要基礎。甘蔗分子標記輔助育種進展十分緩慢,其真正原因在于甘蔗遺傳背景復雜且基因組龐大與高度雜合,甘蔗高貴化代表性品種全基因組尚未測序并組裝完畢,缺乏高質量甘蔗參考基因組序列,進而導致本身或借鑒其他作物基于基因組的許多分子標記的開發(fā)和應用難度大,標記的分辨率和精確性普遍較低。當前在甘蔗遺傳研究上應用最多的是SSR分子標記,但多數集中在遺傳多樣性分析[90]和真假雜種鑒定上[91],關于其他傳統(tǒng)分子標記技術的應用研究也有不少報道,然而,這些分子標記技術普遍存在通量低、分辨率和多態(tài)性不高等問題,嚴重制約其應用于甘蔗分子育種,尤其是性狀關聯優(yōu)異基因的精細定位。最近,Yang等[92]開始嘗試利用 GBS測序技術篩選出甘蔗抗性相關基因并進行了SNP標記開發(fā),將這些標記在F1群體中進行驗證,關聯得到2個與抗橙銹病QTL顯著相關的SNP標記。
隨著甘蔗屬相關全基因組序列圖譜的陸續(xù)公布,如甘蔗栽培種 R570的單倍體基因組序列[6]和甘蔗細莖野生種單倍體割手密AP85-441的全基因組序列[14],使得高通量開發(fā)SSR和SNP標記成為可能。但我們初步研究發(fā)現,當將這2個基因組序列作為甘蔗參考基因組時,基于樣本與參考基因組的比對結果開發(fā)的 SNP標記質量并不高,應用效果也不好。只有在獲得了高質量甘蔗參考基因組序列的前提下,通過重測序和簡化基因組測序(如SLAF、RAD和GBS)等高通量基因分型手段和生物信息學對甘蔗遺傳群體及其自然群體的重要性狀進行基因定位和關聯作圖,才能準確并高通量地挖掘出其中的變異組成,進而高效地開發(fā)相應的遺傳標記(如SNP、InDel、SV、PAV和CNV),再結合群體結構聚類分析和表型組學分析的精準鑒定,采用連鎖分析或者關聯分析篩選出與甘蔗重要農藝性狀緊密連鎖的分子標記。
高密度的遺傳連鎖圖譜和高分辨率的遺傳標記是甘蔗分子標記輔助育種研究取得突破的關鍵。關聯分析則是重要性狀相關標記精準鑒定的重要手段,然而,重要性狀的基因解析需要高質量且精細的全基因組序列圖譜,即精準挖掘與性狀關聯標記的候選基因是甘蔗分子設計育種或者分子標記輔助育種策略的突破。目前,在甘蔗上,只能通過BSA法、蛋白質組、RNA-seq和代謝組測序等多種組學方法,鑒定出可能的候選基因,然后對其進行多重qRT-PCR表達驗證來篩選關鍵基因,并對關鍵基因進行轉基因功能驗證或基因編輯研究。利用高通量測序技術對甘蔗重要性狀進行連鎖和關聯分析,就目前擁有的高質量甘蔗參考基因組而言[6,14],仍存在測序成本偏高的問題,由于甘蔗基因組龐大(約10Gb),約為水稻(400Mb)的25倍,目前水稻完全可以通過高通量測序技術完成各種性狀的基因定位研究,但甘蔗的定位難度很大?,F今,高通量測序技術的迅速發(fā)展和成本不斷降低以及表型組學的興起,使得甘蔗重要性狀基因的挖掘及其分子標記開發(fā)成為可能。這些技術將促進與甘蔗重要性狀緊密連鎖的分子標記和關鍵基因的編輯研究應用于甘蔗分子標記輔助育種和遺傳改良中,從而提高甘蔗育種效率和準確性。