馬世鵬 張?jiān)讫?段民孝 易紅梅 許理文 葛建镕 范亞明 趙怡錕 田紅麗 楊 揚(yáng) 霍永學(xué) 王鳳格 王 蕊* 李 莉
(1.中國農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,北京 100193; 2.北京市農(nóng)林科學(xué)院 玉米研究所,北京 100097)
玉米(Zea
mays
L.)作為全球重要的作物及研究模式植物,在常規(guī)育種過程中純系的獲得至少需要2~4年,耗費(fèi)大量人力與資源。DH群體作為永久遺傳群體,可以在不同的環(huán)境或年限進(jìn)行重復(fù)試驗(yàn),保證結(jié)果的準(zhǔn)確性,被廣泛應(yīng)用到玉米、小麥、水稻等作物QTL定位研究中。染色體重組交換既是進(jìn)化的根本動(dòng)力也是形成遺傳多樣性的根本原因。群體中個(gè)體出現(xiàn)的有效重組交換可以提高QTL精確定位的效力,同時(shí)也為育種工作提供了遺傳基礎(chǔ)。已有研究證實(shí)染色體上交換重組熱區(qū)由甲基化、雌雄配子體等因素共同決定。而由于低重組交換區(qū)域缺乏重組交換,有害突變會(huì)在此類區(qū)域世代積累,導(dǎo)致使用傳統(tǒng)育種手段消除有害突變非常困難。因此從遺傳作圖和建立育種群體2個(gè)角度都需要明確DH群體的重組交換規(guī)律。偏分離現(xiàn)象是指位點(diǎn)基因型頻率不符合孟德爾分離比例的情況,逐漸被公認(rèn)為是物種進(jìn)化的重要?jiǎng)恿χ弧T谑褂梅肿訕?biāo)記繪制不同遺傳群體遺傳圖譜過程中,普遍會(huì)發(fā)現(xiàn)偏分離現(xiàn)象。Lu等研究將多數(shù)偏分離標(biāo)記聚集的染色體區(qū)域稱為分離畸變區(qū)域(Segregation distortion regions,SDRs)。隨著高密度SNP芯片在遺傳群體中的應(yīng)用,為全基因組水平呈現(xiàn)遺傳群體的偏分離現(xiàn)象提供了機(jī)會(huì)。SNP標(biāo)記作為第三代分子標(biāo)記,不僅具有數(shù)量多、分布廣、多平臺(tái)數(shù)據(jù)易整合等優(yōu)勢(shì),而且可以利用基因芯片和測(cè)序技術(shù)完成高密度位點(diǎn)的基因分型,使結(jié)果更加準(zhǔn)確。其中芯片比起基于測(cè)序基因分型(genotyping-by-sequencing,GBS),具有成本低、流程成熟簡(jiǎn)單、數(shù)據(jù)運(yùn)算量小等優(yōu)點(diǎn);與低深度測(cè)序相比,芯片使用固定的檢測(cè)位點(diǎn),注釋信息詳細(xì),參考資料豐富。北京市農(nóng)林科學(xué)院玉米研究所報(bào)道了Maize6H-60K SNP芯片研制過程及其在玉米種質(zhì)資源評(píng)估、分子鑒定、分子育種中的應(yīng)用。數(shù)據(jù)分型是基因芯片技術(shù)的一個(gè)重要環(huán)節(jié), 其可靠性與準(zhǔn)確性直接影響芯片的推廣應(yīng)用,基因分型技術(shù)的必要手段便是利用分子標(biāo)記實(shí)現(xiàn)對(duì)基因型數(shù)據(jù)的準(zhǔn)確采集,低質(zhì)量的基因型數(shù)據(jù)會(huì)影響統(tǒng)計(jì)效力和偏差判斷,但大多數(shù)遺傳研究默認(rèn)采集的基因型數(shù)據(jù)是準(zhǔn)確的,例如在QTL定位研究中,基因分型錯(cuò)誤導(dǎo)致稀有等位基因的分析結(jié)果穩(wěn)定性較低;在繪制SNP高密度連鎖圖譜過程中,基因分型錯(cuò)誤還會(huì)導(dǎo)致計(jì)算連鎖不平衡和標(biāo)記遺傳距離出現(xiàn)偏差。雖然芯片技術(shù)發(fā)展逐漸成熟,已形成高通量、自動(dòng)化、標(biāo)準(zhǔn)化的流程,然而基因分型錯(cuò)誤仍然是目前高密度芯片應(yīng)用過程中主要問題之一。目前,缺乏精準(zhǔn)采集基因分型數(shù)據(jù)的研究,削弱了研究結(jié)果的可信度。而DH群體具有背景高度純合的特點(diǎn),預(yù)期只包括2 種純合基因型,分型結(jié)果的可預(yù)測(cè)性強(qiáng),在研究基因分型問題上發(fā)揮著獨(dú)特的作用。
目前,大部分研究?jī)H報(bào)道個(gè)別的重組交換熱點(diǎn)及分離畸變區(qū)域,利用精準(zhǔn)分型的高密度SNP芯片解析DH群體遺傳規(guī)律的研究鮮見報(bào)道。本研究針對(duì)DH群體背景高度純合的特點(diǎn),利用Maize6H-60K高密度SNP芯片及自主研發(fā)的精準(zhǔn)分型策略得到DH群體的精準(zhǔn)分型數(shù)據(jù),旨在精準(zhǔn)解析DH群體重組交換及分離規(guī)律,以期為玉米DH群體在育種中的應(yīng)用提供參考。
試驗(yàn)材料包括209份‘先玉335’DH群體及‘先玉335’雙親‘PH6WC’和‘PH4CV’,由北京市農(nóng)林科學(xué)院玉米研究所提供,用于分析該群體的遺傳規(guī)律。另設(shè)置17份在不同芯片板上的試驗(yàn)重復(fù),用于驗(yàn)證精準(zhǔn)分型結(jié)果的重復(fù)性和準(zhǔn)確性。
1
.2
.1
樣品準(zhǔn)備和芯片試驗(yàn)使用改良CTAB法提取基因組DNA并去除RNA,用1%瓊脂糖凝膠電泳和紫外分光光度計(jì)(Nanodrop 8000,美國Thermo Fisher公司)檢測(cè)DNA質(zhì)量和濃度,確保DNA主帶清晰無降解,并統(tǒng)一稀釋到50 ng/μL備用。
利用Maize6H-60K芯片對(duì)供試樣品進(jìn)行高密度基因分型(GeneTitan平臺(tái),Affymetrix)。試驗(yàn)流程參照Affymetrix公司提供的操作指南(https:∥www.thermofisher.cn獲得),完成DNA擴(kuò)增、片段化及沉淀、干燥、懸浮、質(zhì)量控制及變性、雜交、清洗、染色、掃描等流程。
1
.2
.2
初始基因分型使用Axiom Analysis Suite軟件(Thermo Fisher Scientific Affymetrix,V4.0.3.3,以下簡(jiǎn)稱AxAS軟件)分析原始信號(hào)CEL文件并獲得基于軟件的基因分型結(jié)果。使用Best practices workflow流程分析,其中自交系分析參數(shù)選擇16,對(duì)所有樣品進(jìn)行分型,其他閾值參數(shù)為默認(rèn)參數(shù)Diploid.v4(https:∥www.thermofisher.cn獲得)。
1
.2
.3
精準(zhǔn)分型策略使用本實(shí)驗(yàn)室研發(fā)的精準(zhǔn)分型策略對(duì)篩選后的所有位點(diǎn)重新分型。精準(zhǔn)分型策略主要步驟為:
1)使用高斯混合模型進(jìn)行聚類。首先對(duì)原始熒光信號(hào)S
進(jìn)行標(biāo)準(zhǔn)化處理:使用S
、S
定義原始熒光信號(hào)A、B的值,并且分別定義二維坐標(biāo)系X
、Y
。用N
(N
,N
)定義標(biāo)準(zhǔn)化計(jì)算后的S
、S
,其中N
、N
的轉(zhuǎn)換公式如下:N
=logS
-logS
(1)
N
=(logS
+logS
)/
2(2)
其次對(duì)位點(diǎn)數(shù)據(jù)進(jìn)行高斯混合模型,使用貝葉斯信息準(zhǔn)則以及“肘部原則”進(jìn)行評(píng)估,確定最優(yōu)聚類數(shù)并導(dǎo)出分型結(jié)果。
2)依據(jù)歷史數(shù)據(jù)確定基因分型。根據(jù)骨干自交系聚類結(jié)果統(tǒng)計(jì)了芯片所有位點(diǎn)純合聚類的中心點(diǎn)坐標(biāo)和標(biāo)準(zhǔn)差范圍。參照自交系中心點(diǎn)坐標(biāo)預(yù)測(cè)DH群體純合聚類中心點(diǎn)坐標(biāo),剩余的數(shù)據(jù)點(diǎn)根據(jù)Y
軸相對(duì)坐標(biāo)區(qū)分雜合和缺失:Y
Y
)(3)
Y
>Average(Y
+Y
)(4)
式中:Y
為缺失數(shù)據(jù)中心點(diǎn)的N
;Y
為雜合數(shù)據(jù)中心點(diǎn)的N
;Y
為AA純合數(shù)據(jù)中心點(diǎn)的N
;Y
為BB純合數(shù)據(jù)中心點(diǎn)的N
。3)分型結(jié)果驗(yàn)證。根據(jù)同一聚類的樣品橫縱坐標(biāo)值分別計(jì)算平均值和方差,篩選差異較大的個(gè)別位點(diǎn)進(jìn)行人工審核。
χ
檢驗(yàn),判斷標(biāo)記發(fā)生分離的比例和方向。適用于DH群體遺傳研究的標(biāo)記特征為雙親具有不同的等位基因,且基因芯片分型為2個(gè)清晰的聚類,分別為AA和BB純合子(圖1(a))。剔除不涉及分型問題和遺傳規(guī)律的3種類型位點(diǎn):1)由于樣品混雜、剩余變異等原因,出現(xiàn)雜合聚類的標(biāo)記(圖1(b));2)單態(tài)型位點(diǎn)(圖1(c));3)樣品缺失率>5%的標(biāo)記(圖1(d))。最終從61 214個(gè)SNPs中保留19 620個(gè)SNPs,其中由于質(zhì)量差而被剔除的標(biāo)記僅占總標(biāo)記的1.93%,說明Maize6H-60K芯片原始數(shù)據(jù)質(zhì)量高,能夠用于后續(xù)研究。
將篩選出的SNP標(biāo)記分型誤判原因主要?dú)w納為3種類型:1)將雜合聚類誤判為純合聚類(圖2(a));2)缺失數(shù)據(jù)誤判為純合聚類(圖3(a));3)雜合和缺失的聚類被誤判為2種純合聚類(圖4(a))。
使用精準(zhǔn)分型策略對(duì)19 620個(gè)SNPs重新聚類,通過比較AxAS軟件與精準(zhǔn)分型結(jié)果顯示2種不同分型錯(cuò)誤的SNP標(biāo)記均能正確分型(圖2~圖4)。出現(xiàn)在雜合基因型位置的數(shù)據(jù)點(diǎn)被正確判斷為雜合聚類(圖2(b)),且當(dāng)出現(xiàn)缺失數(shù)據(jù)和雜合基因型數(shù)據(jù)時(shí),不會(huì)和純合基因型聚類混淆(圖3(b)和圖4(b))。通過比對(duì)不同芯片板上的試驗(yàn)重復(fù)評(píng)估精準(zhǔn)分型結(jié)果的一致性,結(jié)果顯示重復(fù)樣品間平均差異標(biāo)記數(shù)為1.8 個(gè),一致性達(dá)到99.9%,其中5對(duì)結(jié)果一致性達(dá)到100%。以上說明精準(zhǔn)分型數(shù)據(jù)具有更高的準(zhǔn)確性和穩(wěn)定性。
進(jìn)一步剔除精準(zhǔn)分型校正后出現(xiàn)缺失和雜合數(shù)據(jù)的標(biāo)記,最終得到入選標(biāo)記為18 947個(gè)SNPs,約占芯片全部位點(diǎn)的31%。入選標(biāo)記在全基因組上的分布與染色體長(zhǎng)度呈正相關(guān),在1號(hào)染色體分布的個(gè)數(shù)最多為2 940,10號(hào)染色體最少為1 357個(gè),標(biāo)記間的平均距離為0.097~0.118 Mb(表1),除染色體著絲粒附近區(qū)域外均勻覆蓋染色體(圖5),說明入選標(biāo)記能夠有效跟蹤基因組所有區(qū)段的重組交換。
由圖6和圖7可知,只有1號(hào)染色體發(fā)生2次交換的個(gè)體比例(33%)高于發(fā)生1次交換的個(gè)體比例(29%)(圖6);在2~9號(hào)染色體上發(fā)生1次交換的個(gè)體比例最高(46%~35%);有12%~34%的個(gè)體在單條染色體上不發(fā)生交換,其中6號(hào)染色體最高(34%),其次為10號(hào)染色體(29%)。10條染色體的平均交換次數(shù)與染色體長(zhǎng)度呈正相關(guān),從1號(hào)染色體的1.84次到10號(hào)染色體的1.03次不等(圖7),其中6號(hào)染色體平均交換次數(shù)小幅度降低。
紅色三角形表示AA基因型,藍(lán)色三角形表示BB基因型,黃色圓形表示AB基因型,灰色方塊表示缺失數(shù)據(jù)點(diǎn)。下同。 Red triangular represents AA genotype, blue triangular represents BB genotype, yellow circle represents AB genotype, gray square represents the missing data points. The same below.圖1 SNP基因芯片的標(biāo)記表現(xiàn)類型Fig.1 Performance types of markers on SNP gene array
黑色星形標(biāo)識(shí)代表聚類中心點(diǎn)。下同。 Black star logo represents the cluster center. The same below.圖2 AX-91094685的AxAS軟件(a)和精準(zhǔn)(b)分型對(duì)比Fig.2 Comparison of AxAS software (a) and precise (b) typing of AX-91094685
圖3 AX-108052387的AxAS軟件(a)和精準(zhǔn)(b)分型對(duì)比Fig.3 Comparison of AxAS software (a) and precise (b) typing of AX-108052387
圖4 AX-108103101的AxAS軟件(a)和精準(zhǔn)(b)分型對(duì)比Fig.4 Comparison of AxAS software (a) and precise (b) typing of AX-108103101
表1 SNP標(biāo)記在基因組上的分布
Table1 Distribution of SNP markers in the genome
染色體Chromosome標(biāo)記數(shù)量Number ofmarkers起始物理位置(Mb)Start physicalposition終止物理位置(Mb)End physicalposition區(qū)間大小/MbInterval size平均距離/MbAveragedistanceChr 12 940.0000.086299.773299.6870.101Chr 22 245.0000.133237.791237.6580.106Chr 32 159.0000.304232.221231.9170.104Chr 42 047.0002.838241.304238.4660.116Chr 52 126.0000.098217.799217.7010.097Chr 61 563.0000.363168.385168.0220.107Chr 71 574.0000.036176.810176.7740.112Chr 81 474.0000.021174.923174.9020.118Chr 91 519.0000.314156.873156.5590.101Chr 101 357.0001.284149.576148.2920.109
以1 Mb為窗口大小,計(jì)算每個(gè)窗口的標(biāo)記密度。 Take 1 Mb as the window size, the marker density was calculated for each window.圖5 入選標(biāo)記分布密度Fig.5 Distribution density of markers on the genome
圖6 10條染色體中發(fā)生不同交換重組次數(shù)的個(gè)體占比Fig.6 Proportion of individuals with different number of recombination exchanges on 10 chromosomes
圖7 10條染色體重組交換次數(shù)Fig.7 Number of recombination exchanges of 10 chromosomes
由圖8可知,該DH群體重組交換主要特征包括:1)染色體端粒區(qū)域主要為高頻交換區(qū),但6號(hào)染色體短臂端粒區(qū)域與其他染色體端粒區(qū)域相比重組交換頻率較低。2)1~6號(hào)染色體的長(zhǎng)臂較長(zhǎng),交換頻率從著絲粒到端粒呈現(xiàn)“先上升,再下降,再上升”的特點(diǎn),但4號(hào)染色體的長(zhǎng)臂區(qū)域存在一個(gè)低頻交換區(qū)。3)根據(jù)10條染色體上的交換點(diǎn)位置和交換頻率分為2種模式:一是1號(hào)和6號(hào)染色體出現(xiàn)大量的低頻交換點(diǎn);二是3和8號(hào)染色體出現(xiàn)少量高頻交換點(diǎn)。
紅色線代表染色體著絲粒區(qū)域。 The red line represents the centromere region of the chromosome.圖8 全基因組重組交換點(diǎn)位置及次數(shù)Fig.8 Location and number of genome-wide recombination exchange points
P
<0.05),3號(hào)染色體偏向父本的標(biāo)記數(shù)達(dá)到1 439個(gè)(P
<0.05)(表2)。在10條染色體著絲粒附近區(qū)域,由于發(fā)生低頻次、低密度的交換,分離曲線變化較為平緩。在非著絲粒區(qū)域存在明顯的分離拐點(diǎn),該區(qū)域分離曲線劇烈變化且由于出現(xiàn)高頻次、高密度的交換,有接近50%理論分離系數(shù)的趨勢(shì)。本研究采用的標(biāo)記強(qiáng)篩選模式可發(fā)現(xiàn)AxAS軟件分型錯(cuò)誤的標(biāo)記,通過精準(zhǔn)分型策略自動(dòng)化獲得大量位點(diǎn)的準(zhǔn)確分型,可精準(zhǔn)地解析DH群體遺傳規(guī)律。AxAS軟件導(dǎo)致分型結(jié)果錯(cuò)誤的原因主要有2個(gè):一是軟件在分型過程中沒有預(yù)先設(shè)置參照,對(duì)于基因型出現(xiàn)的位置沒有預(yù)期判斷;二是使用軟件預(yù)設(shè)的自交系分析參數(shù)16,默認(rèn)將基因型分成兩個(gè)純合聚類,當(dāng)數(shù)據(jù)出現(xiàn)缺失或者雜合基因型時(shí),軟件很難識(shí)別并且出現(xiàn)聚類紊亂的問題。分型錯(cuò)誤會(huì)導(dǎo)致后續(xù)遺傳分析無法獲得準(zhǔn)確的結(jié)果:第一,標(biāo)記中的雜合分型或缺失分型被統(tǒng)計(jì)為純合分型時(shí),會(huì)導(dǎo)致純合基因型統(tǒng)計(jì)錯(cuò)誤,統(tǒng)計(jì)交換次數(shù)和標(biāo)記分離系數(shù)出現(xiàn)偏差。第二,精準(zhǔn)分型策略使群體分型準(zhǔn)確性大幅提高,群體分離結(jié)果中出現(xiàn)的拐點(diǎn)等規(guī)律為真實(shí)數(shù)據(jù)的呈現(xiàn),繪制的分離曲線更加平滑。第三,當(dāng)分型數(shù)據(jù)表現(xiàn)非預(yù)期規(guī)律的現(xiàn)象時(shí),無法對(duì)大量標(biāo)記進(jìn)行人工校對(duì)。而選擇直接刪除標(biāo)記,會(huì)導(dǎo)致標(biāo)記數(shù)量減少,獲得信息不全面。
宋偉等使用Maize SNP3072芯片對(duì)回交群體進(jìn)行分子輔助背景選擇,共發(fā)現(xiàn)104個(gè)標(biāo)記在雙親間存在多態(tài)性,篩選的雙親互補(bǔ)位點(diǎn)數(shù)量十分有限。因此使用高質(zhì)量、高密度的基因芯片能夠保證篩選足夠的雙親互補(bǔ)標(biāo)記用于后續(xù)研究分析,尤其對(duì)于近等基因系、派生品種等背景高度近似的樣品可提供更多的信息。本研究使用的Maize6H-60K芯片基數(shù)大、密度高,經(jīng)過強(qiáng)篩選模式仍獲得高質(zhì)量、高密度、雙親互補(bǔ)的可用位點(diǎn),SNP標(biāo)記在全基因組上分布均勻,能夠滿足后續(xù)遺傳規(guī)律研究。
黑色虛線代表理論分離水平,紅色虛線代表卡方檢驗(yàn)顯著水平P=0.05,豎直線代表染色體的著絲粒區(qū)域。 The black dashed line represents the theoretical separation level, the red dashed line represents the chi-square test significance level P=0.05, and the vertical line represents the centromeric region of the chromosome.圖9 DH群體染色體分離曲線Fig.9 Chromosome separation curve of DH population
錯(cuò)誤的基因分型會(huì)在作物遺傳改良中帶來嚴(yán)重的后果,因此在遺傳和育種研究中需要高度重視采集數(shù)據(jù)后的精準(zhǔn)分型問題。本研究發(fā)現(xiàn)在使用AxAS軟件默認(rèn)的自交系參數(shù)時(shí),會(huì)將數(shù)據(jù)分為2種純合聚類,可能出現(xiàn)雜合和缺失數(shù)據(jù)聚類錯(cuò)誤。
表2 SNP標(biāo)記分離情況統(tǒng)計(jì)
Table 2 Statistics of separation of SNP markers
染色體Chromosome偏母本型Toward female parent偏父本型Toward male parent中間型Intermediate type位點(diǎn)數(shù)量Numberof loci位點(diǎn)占比/%Percentof loci位點(diǎn)數(shù)量Numberof loci位點(diǎn)占比/%Percentof loci位點(diǎn)數(shù)量Numberof loci位點(diǎn)占比/%Percentof lociChr 11 465.049.8178.06.11 297.044.1Chr 21 268.055.222.01.01 006.043.8Chr 346.02.11 439.064.5746.033.4Chr 4722.035.2117.05.71 210.059.1Chr 5319.014.319.00.91 887.084.8Chr 6491.031.41.00.11 072.068.5Chr 741.02.60.00.01 532.097.4Chr 815.01.01 145.077.4320.021.6Chr 92.00.1239.015.71 277.084.1Chr 10188.03.90.00.01 168.086.1
注:加粗文本表示染色體偏離方向。
Note:The text in bold indicates that the chromosome is segregation distortion.
DH群體便具有背景高度純合的特點(diǎn),較少出現(xiàn)雜合基因型,因此可以準(zhǔn)確判斷位點(diǎn)基因分型結(jié)果是否準(zhǔn)確。由于在制備群體過程中串粉、機(jī)械混雜等因素,以及仍然存在的剩余變異,個(gè)別位點(diǎn)不可避免會(huì)出現(xiàn)雜合基因型,因此在本研究中刪除出現(xiàn)雜合的位點(diǎn)以減少對(duì)后續(xù)計(jì)算分離系數(shù)的干擾。
對(duì)測(cè)序數(shù)據(jù)和芯片數(shù)據(jù)的填充算法已有研究結(jié)果表明,SNP在基因組上覆蓋度較高的前提下,基因型填充的錯(cuò)誤率主要取決于SNP分型錯(cuò)誤率,但關(guān)于降低SNP分型錯(cuò)誤率鮮有報(bào)道。本研究結(jié)果表明AxAS軟件分型將缺失或者雜合基因型誤判為純合基因型,影響SNP芯片原始數(shù)據(jù)的準(zhǔn)確率,加大了數(shù)據(jù)填充的難度,進(jìn)一步導(dǎo)致對(duì)群體結(jié)構(gòu)分析的偏差。當(dāng)出現(xiàn)基因型錯(cuò)誤數(shù)據(jù)時(shí),軟件并不會(huì)自動(dòng)識(shí)別矯正,相反在使用單倍型進(jìn)行填充的過程中還會(huì)誤導(dǎo)對(duì)下游基因型的推測(cè),進(jìn)而放大基因型錯(cuò)誤。本研究使用的精準(zhǔn)分型策略能夠有效防止出現(xiàn)DH群體分型錯(cuò)誤,降低后續(xù)基因型芯片數(shù)據(jù)填充的難度。
本研究在DH群體上首先探索SNP標(biāo)記精準(zhǔn)分型策略的可行性,玉米自交系與DH群體的基因型主要為純合和少量雜合,同樣可以使用精準(zhǔn)分型策略以提高自交系的分型準(zhǔn)確性和分析精度。當(dāng)對(duì)回交群體、玉米雜交種等材料分型時(shí),由于新增了雜合基因型,精準(zhǔn)分型策略還需進(jìn)一步測(cè)試與完善。精準(zhǔn)分型策略還有望為其他高通量分型平臺(tái)解決基因分型問題提供思路?;蛐酒脚_(tái)和KASP平臺(tái)都通過原始熒光信號(hào)值聚類分型,并轉(zhuǎn)化為二維可視圖像。但KASP平臺(tái)通常使用少量標(biāo)記對(duì)大量樣品進(jìn)行基因分型,因此SNP分型錯(cuò)誤率對(duì)KASP結(jié)果的影響更大。根據(jù)精準(zhǔn)分型策略,在KASP平臺(tái)基因分型過程中參考?xì)v史分型數(shù)據(jù)有望改善基因分型結(jié)果。
本研究結(jié)果發(fā)現(xiàn),隨著染色體長(zhǎng)度的減少,染色體交換頻率降低,因此平均交換次數(shù)也不斷降低。6號(hào)染色體的交換點(diǎn)數(shù)量少、短臂端粒區(qū)域與重組交換效率偏低、染色體完整度最高均說明該區(qū)段具有特殊結(jié)構(gòu),楊秀燕等研究表明玉米6號(hào)染色體短臂存在隨體結(jié)構(gòu),隨體被認(rèn)為是高度惰性的異染色質(zhì),基本沒有功能基因的存在。通過掌握群體重組交換情況,能夠全面解析DH群體基因組變異規(guī)律,從基因組水平上獲得目標(biāo)區(qū)段變異個(gè)體,并且能夠有效控制群體規(guī)模,篩選預(yù)期材料進(jìn)行田間測(cè)配。
在玉米中,F(xiàn)、RIL等群體中被報(bào)道出現(xiàn)偏分離現(xiàn)象,并且主要與配子體基因有關(guān),已有研究證實(shí)配子體基因與偏分離熱點(diǎn)區(qū)域有部分重疊。通過DH群體分離曲線說明,誘導(dǎo)系誘導(dǎo)且自然加倍的玉米DH群體在個(gè)別染色體上存在明顯的偏分離現(xiàn)象,而劉玉強(qiáng)等研究報(bào)道化學(xué)加倍的DH群體沒有出現(xiàn)偏分離現(xiàn)象,因此,加倍方式也是影響偏分離的因素之一。其他原因還包括配子和合子的選擇、母質(zhì)效應(yīng)、群體類型、環(huán)境因素、標(biāo)記類型和基因分型錯(cuò)誤等。該DH群體出現(xiàn)偏分離現(xiàn)象可能經(jīng)過環(huán)境及非環(huán)境因素對(duì)無害等位基因雙重篩選導(dǎo)致。單倍體植株對(duì)田間環(huán)境耐受性低,非理想環(huán)境對(duì)雙親不同的適應(yīng)能力進(jìn)行選擇,因此表現(xiàn)出染色體整體偏向一個(gè)親本,且在不同染色體上偏向不同的親本。染色體的大片段偏離與群體田間表型性狀不存在高度的相關(guān)性,因?yàn)橹旮?、容重等性狀都是多基因控制,并未受到環(huán)境選擇,所以田間表型并沒有在群體內(nèi)表現(xiàn)出偏分離。另外值得注意的是偏分離回歸現(xiàn)象,即端粒區(qū)域的曲線總有回歸到理論分離水平的趨勢(shì)。偏分離回歸現(xiàn)象與端粒區(qū)域交換頻率顯著高于著絲粒區(qū)域相關(guān),猜測(cè)高頻交換點(diǎn)為偏分離的回歸提供了可能,需進(jìn)一步試驗(yàn)探究。
目前,永久性遺傳群體主要包括DH和RIL群體,相較于F等臨時(shí)性群體更加適合完成多年限、多試驗(yàn)點(diǎn)的重復(fù)研究。DH技術(shù)能夠最大程度縮短育種時(shí)間,降低育種成本,目前已被廣泛應(yīng)用于大規(guī)??焖偕a(chǎn)自交系。在構(gòu)建DH群體進(jìn)行遺傳分析時(shí),可以根據(jù)初步定位信息設(shè)計(jì)不同的遺傳群體規(guī)模。若目標(biāo)區(qū)域初步定位在端粒高交換區(qū)域,則使用較小的群體規(guī)模即可獲得交換單株;如果想獲得低交換區(qū)的變異,就需要擴(kuò)大群體規(guī)模,并且結(jié)合高密度標(biāo)記篩選跟蹤目標(biāo)區(qū)域是否發(fā)生交換。配合使用Maize6H-60K等高密度芯片進(jìn)行DH群體背景掃描,以規(guī)避群體配制過程中存在的偏分離的問題,明確群體分離特征并合理使用。
通過結(jié)合Maize6H-60K芯片和精準(zhǔn)分型策略能夠?qū)崿F(xiàn)玉米DH群體基因型數(shù)據(jù)的高質(zhì)量采集。該DH群體10條染色體平均交換次數(shù)范圍為1.84~1.03次,10條染色體著絲粒和6號(hào)染色體的隨體等異染色質(zhì)區(qū)域的重組交換點(diǎn)個(gè)數(shù)和頻率明顯減少。玉米DH群體通過誘導(dǎo)系誘導(dǎo)且自然加倍后,1、2、3、8號(hào)染色體存在明顯的偏分離現(xiàn)象。10條染色體的分離曲線是連續(xù)的,分離曲線在端粒區(qū)域有回歸到理想分離水平的趨勢(shì)。利用獲得的重組交換及分離規(guī)律可用于控制田間育種提高從DH群體中篩選到預(yù)期育種材料的準(zhǔn)確性。