国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

結(jié)合輔助性狀的玉米全基因組選擇預(yù)測(cè)力評(píng)估

2023-06-08 23:09:05焦宇馨張宇翔楊文艷經(jīng)思宇尹玉琳劉暢王欣徐辰武徐揚(yáng)
關(guān)鍵詞:玉米

焦宇馨 張宇翔 楊文艷 經(jīng)思宇 尹玉琳 劉暢 王欣 徐辰武 徐揚(yáng)

摘要: 多性狀聯(lián)合全基因組選擇能夠有效利用性狀間的遺傳相關(guān)和環(huán)境相關(guān),有望提高表型預(yù)測(cè)的準(zhǔn)確性。本研究提出了結(jié)合輔助性狀的全基因組選擇策略,以來(lái)源廣泛的342份玉米自交系為試驗(yàn)材料,對(duì)其進(jìn)行基因分型測(cè)序(GBS)并分析其農(nóng)藝性狀,對(duì)每個(gè)目標(biāo)性狀均基于輔助性狀及其組合進(jìn)行預(yù)測(cè),利用五倍交叉驗(yàn)證法評(píng)價(jià)其預(yù)測(cè)力。結(jié)果表明,利用與目標(biāo)性狀相關(guān)性較高的輔助性狀可較大程度地提升預(yù)測(cè)力,尤其是對(duì)于低遺傳力性狀;隨著輔助性狀個(gè)數(shù)的增加,預(yù)測(cè)力也隨之增加。進(jìn)一步比較了5種統(tǒng)計(jì)模型結(jié)合輔助性狀的全基因組選擇的表型預(yù)測(cè)力,總體而言,再生核希爾伯特空間(RKHS)模型和貝葉斯B(BayesB)模型的預(yù)測(cè)效果較優(yōu),而極端梯度提升(XGBOOST)模型的預(yù)測(cè)效果較差。本研究結(jié)合輔助性狀有效提高了玉米全基因組選擇的預(yù)測(cè)準(zhǔn)確性,為玉米的全基因組選擇育種提供新的思路和參考。

關(guān)鍵詞: 玉米;全基因組選擇;輔助性狀;預(yù)測(cè)力

中圖分類(lèi)號(hào): S513;Q943 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1000-4440(2023)02-0313-08

Predictability of maize genome-wide selection combined with auxiliary traits

JIAO Yu-xin1,2, ZHANG Yu-xiang 1,2, YANG Wen-yan1,2, JING Si-yu1,2, YIN Yu-lin 1,2, LIU Chang1,2,WANG Xin1, XU Chen-wu1,2, XU Yang1,2

(1.Jiangsu Key Laboratory of Crop Genomics and Molecular Breeding/Key Laboratory of Plant Functional Genomics of the Ministry of Education/ Jiangsu Key Laboratory of Crop Genetics and Physiology, Agricultural College of Yangzhou University, Yangzhou 225009, China;2.Jiangsu Co-innovation Center for Modern Production Technology of Grain Crops, Yangzhou University, Yangzhou 225009, China)

Abstract: Multi-trait genomic selection can use genetic and environmental correlations between traits, which holds great promise to improve the prediction accuracy. This study proposed a genomic prediction strategy using auxiliary traits. A total of 342 maize inbred lines from a diversity panel were used as test materials. Genotyping by sequencing (GBS) was performed and six agronomic traits were measured in the field. Each target trait was predicted based on auxiliary traits and their combinations. The predictability was evaluated using five-fold cross-validation. The results showed that the use of auxiliary traits highly correlated with target traits greatly improved predictability and low-heritability traits could benefit more from auxiliary traits. As the number of auxiliary traits increased, the predictability also increased. We also compared the prediction performance of five different models combined with auxiliary traits. Overall, reproducing kernel Hilbert space (RKHS) model and BayesB model performed well, while extreme gradient boosting (XGBOOST) model performed worst. This study improves the accuracy of genomic prediction and provides new ideas and references for genomic selection breeding of maize.

Key words: maize;genomic selection;auxiliary traits;predictability

玉米是中國(guó)最重要的糧食作物之一,為保障國(guó)家糧食安全作出重要貢獻(xiàn)?!笆濉币詠?lái),中國(guó)培育了一批優(yōu)良的玉米品種,其豐產(chǎn)性和穩(wěn)產(chǎn)性得到了明顯提升[1]。然而與一些發(fā)達(dá)國(guó)家相比,中國(guó)玉米平均單產(chǎn)偏低,生產(chǎn)成本高,競(jìng)爭(zhēng)力不強(qiáng)。中國(guó)玉米育種仍以常規(guī)技術(shù)為主,存在預(yù)見(jiàn)性差、周期長(zhǎng)、效率低等突出問(wèn)題[2]。隨著高通量測(cè)序技術(shù)的不斷發(fā)展,全基因組選擇育種技術(shù)已成為玉米精準(zhǔn)育種的重要手段和發(fā)展方向。

全基因組選擇(GS)是根據(jù)訓(xùn)練群體基因型與表型間的關(guān)聯(lián)構(gòu)建統(tǒng)計(jì)模型,從而對(duì)未知表型的候選群體進(jìn)行表型預(yù)測(cè)和選擇[3]。GS在獲取樣本基因型時(shí)就可對(duì)其育種值進(jìn)行評(píng)估,能夠大幅提升選擇準(zhǔn)確性和育種效率,縮短育種周期,實(shí)現(xiàn)從經(jīng)驗(yàn)育種至精準(zhǔn)育種的飛躍[4]。一些發(fā)達(dá)國(guó)家玉米商業(yè)化育種起步相對(duì)較早,全球種業(yè)企業(yè)如科迪華公司等已運(yùn)用GS技術(shù)提高玉米品種選育效率??频先A公司和先正達(dá)公司利用全基因組選擇技術(shù)分別培育的抗旱玉米品種AQUAmax和Artesian已進(jìn)入市場(chǎng)。國(guó)際玉米小麥改良中心在全球玉米育種計(jì)劃中納入全基因組選擇[5]。GS技術(shù)雖然為玉米育種提供了新的契機(jī),但是對(duì)受環(huán)境影響較大的數(shù)量性狀來(lái)說(shuō),其預(yù)測(cè)準(zhǔn)確性仍較低[6-7]。GS方法的改進(jìn)一直是GS研究的重要課題,也是對(duì)品種進(jìn)行精準(zhǔn)選擇的關(guān)鍵。

目前GS通常針對(duì)單個(gè)性狀進(jìn)行預(yù)測(cè)和選擇,而忽視了多個(gè)關(guān)聯(lián)性狀間的遺傳基礎(chǔ)[8]。多性狀聯(lián)合GS不僅能夠獲取性狀間的遺傳相關(guān),還能獲取性狀間的環(huán)境相關(guān),有望提升表型預(yù)測(cè)的準(zhǔn)確性,尤其是一些低遺傳力的性狀[9-10]。在育種研究中,可能會(huì)面臨一些性狀難以測(cè)量或觀測(cè)成本高昂的問(wèn)題,可以考慮結(jié)合較易測(cè)量的性狀去輔助預(yù)測(cè)較難鑒定的性狀。本研究擬以來(lái)源廣泛的342份玉米自交系為試驗(yàn)材料,對(duì)其進(jìn)行基因分型測(cè)序(GBS)并分析產(chǎn)量相關(guān)性狀,開(kāi)展結(jié)合輔助性狀的全基因組選擇研究,利用交叉驗(yàn)證評(píng)估結(jié)合不同輔助性狀的全基因組選擇預(yù)測(cè)的效果,進(jìn)一步比較5種不同統(tǒng)計(jì)模型對(duì)預(yù)測(cè)準(zhǔn)確性的影響,以期為提高玉米全基因組選擇的準(zhǔn)確性提供技術(shù)支撐。

1 材料與方法

1.1 供試材料與試驗(yàn)設(shè)計(jì)

試驗(yàn)材料為342份來(lái)自熱帶、亞熱帶和溫帶的玉米自交系。試驗(yàn)材料于2015年、2016年和2017年在海南省江蘇南繁中心種植。田間試驗(yàn)采用隨機(jī)區(qū)組設(shè)計(jì),2次重復(fù),每份材料重復(fù)種植2行,行長(zhǎng)3.00 m,行距0.50 m,株距為0.25 m。

1.2 基因型分型與表型鑒定

在玉米成熟期,每份材料隨機(jī)選取6株測(cè)量株高(PH),并選取6個(gè)長(zhǎng)勢(shì)一致的果穗,測(cè)定穗行數(shù)(ERN)、行粒數(shù)(KNR)、穗長(zhǎng)(EL)、穗粗(ED)、穗粒質(zhì)量(KW)。利用R語(yǔ)言lme4軟件包,計(jì)算3個(gè)環(huán)境(2015年、2016年、2017年)下表型數(shù)據(jù)的最佳線性無(wú)偏估計(jì)值用于后續(xù)分析。性狀廣義遺傳力的計(jì)算公式為:H22g/(σ2g2ε/l),式中,σ2g為遺傳方差;σ2ε為殘差方差;l為環(huán)境個(gè)數(shù),方差由R語(yǔ)言lme4軟件包估計(jì)。對(duì)全部自交系進(jìn)行基因分型測(cè)序(GBS),根據(jù)質(zhì)控標(biāo)準(zhǔn)最小等位基因頻率(MAF)>0.05及缺失率<10%,過(guò)濾后獲得108 193個(gè)單核苷酸多態(tài)性(SNP)標(biāo)記用于后續(xù)分析。

1.3 結(jié)合輔助性狀的全基因組選擇預(yù)測(cè)模型

本研究所使用的基因組最佳線性無(wú)偏預(yù)測(cè)(Genomic best linear unbiased prediction,GBLUP)模型如下:

其中,m為全部標(biāo)記數(shù)目;Zk為n個(gè)個(gè)體在第k個(gè)標(biāo)記的基因型向量;K為親緣關(guān)系矩陣;φ2為多基因方差,方差組分可由限制性極大似然法估計(jì)。

進(jìn)行輔助性狀的全基因組選擇預(yù)測(cè)時(shí),所有輔助性狀的表型值均需要進(jìn)行標(biāo)準(zhǔn)化和中心化,輔助性狀為某一單一性狀或不同性狀的組合。

1.4 模型比較

本研究進(jìn)一步比較了5種統(tǒng)計(jì)模型進(jìn)行輔助性狀全基因組選擇預(yù)測(cè)的效果,5種統(tǒng)計(jì)模型包括基因組最佳線性無(wú)偏預(yù)測(cè)(Genomic best linear unbiased prediction,GBLUP)模型、再生核希爾伯特空間(Reproducing kernel Hilbert space,RKHS)模型、最小絕對(duì)收縮與選擇算子(Least absolute shrinkage and selection operator,LASSO)模型、貝葉斯B(BayesB)模型、極端梯度提升(Extreme gradient boosting, XGBOOST)模型,所有計(jì)算運(yùn)用R語(yǔ)言包predhy實(shí)現(xiàn)。其中XGBOOST模型的學(xué)習(xí)率設(shè)置為0.07,迭代次數(shù)設(shè)置為1 000;RKHS模型采用多核模型,迭代次數(shù)設(shè)置為1 500,老化(BurnIn)設(shè)置為500,其余參數(shù)均采用默認(rèn)值。

1.5 預(yù)測(cè)力評(píng)估

本研究基于五倍交叉驗(yàn)證法評(píng)估預(yù)測(cè)力,即將樣本隨機(jī)劃分為5等份,將4份作為訓(xùn)練集,1份用作驗(yàn)證集。預(yù)測(cè)力采用預(yù)測(cè)值與實(shí)際觀測(cè)值的決定系數(shù)表示。為了避免隨機(jī)干擾,重復(fù)交叉驗(yàn)證過(guò)程20次,以預(yù)測(cè)力的平均值作為評(píng)價(jià)預(yù)測(cè)準(zhǔn)確性的指標(biāo)。

2 結(jié)果與分析

2.1 農(nóng)藝性狀的描述性統(tǒng)計(jì)及相關(guān)分析

對(duì)玉米自交系的6個(gè)農(nóng)藝性狀[穗行數(shù)(ERN)、行粒數(shù)(KNR)、穗粗(ED)、穗長(zhǎng)(EL)、株高(PH)、穗粒質(zhì)量(KW)]進(jìn)行描述性統(tǒng)計(jì)分析,結(jié)果(表1)表明,所有農(nóng)藝性狀在自交系間均有豐富變異,變異系數(shù)都高于0.10,其中KW的變異系數(shù)最高,為0.30,ED的變異系數(shù)最低,為0.11。遺傳力分析結(jié)果表明,6個(gè)農(nóng)藝性狀的遺傳力變化范圍為0.33~0.66,其中KNR的遺傳力最低,ERN的遺傳力最高。對(duì)6個(gè)農(nóng)藝性狀進(jìn)行相關(guān)分析,表2顯示,除ERN與EL、ED與KNR之間不存在顯著相關(guān)外,其余性狀間均存在顯著正相關(guān),其中KW與KNR的相關(guān)系數(shù)最高,達(dá)到0.650。

2.2 結(jié)合輔助性狀的全基因組選擇預(yù)測(cè)力

為了研究結(jié)合輔助性狀的玉米全基因組選擇的預(yù)測(cè)效果,本研究基于GBLUP模型,對(duì)每個(gè)目標(biāo)性狀采用輔助性狀及其組合的全基因選擇的預(yù)測(cè),利用五倍交叉驗(yàn)證法評(píng)價(jià)預(yù)測(cè)力,并與目標(biāo)性狀自身全基因組選擇的預(yù)測(cè)效果進(jìn)行比較。結(jié)果(圖1、圖2)表明,大部分輔助性狀及其組合均可提高目標(biāo)性狀的預(yù)測(cè)力。預(yù)測(cè)ERN時(shí),單一輔助性狀中,以ED為輔助性狀時(shí)預(yù)測(cè)力最高,為0.560,以PH為輔助性狀時(shí)預(yù)測(cè)力最低,僅為0.367;多性狀輔助預(yù)測(cè)時(shí),以ED、EL和KNR聯(lián)合輔助時(shí)的預(yù)測(cè)力最高,為0.590。預(yù)測(cè)KNR時(shí),單一輔助性狀中,以KW為輔助性狀時(shí)預(yù)測(cè)力最高,為0.477,以ED為輔助性狀預(yù)測(cè)力最低,僅為0.105;多性狀輔助預(yù)測(cè)時(shí),以ERN、ED、EL、PH、KW聯(lián)合輔助時(shí)的預(yù)測(cè)力最高,為0.683。預(yù)測(cè)ED時(shí),單一輔助性狀中,以KW為輔助性狀時(shí)預(yù)測(cè)力最高,為0.591,以EL為輔助性狀時(shí)預(yù)測(cè)力最低,為0.377;多性狀輔助預(yù)測(cè)時(shí),以ERN、KNR、EL和KW聯(lián)合輔助時(shí)的預(yù)測(cè)力最高,為0.779。預(yù)測(cè)EL時(shí),單一輔助性狀中,以KNR為輔助性狀時(shí)預(yù)測(cè)力最高,為0.581,以ED為輔助性狀時(shí)預(yù)測(cè)力最低,為0.280;多性狀輔助預(yù)測(cè)時(shí),以ERN、KNR、ED、PH、KW聯(lián)合輔助時(shí)的預(yù)測(cè)力最高,為0.639。預(yù)測(cè)PH時(shí),單一輔助性狀中,以KW為輔助性狀時(shí)預(yù)測(cè)力最高,為0.449,以ERN為輔助性狀時(shí)預(yù)測(cè)力最低,為0.394;多性狀輔助預(yù)測(cè)時(shí),以KNR、EL和KW聯(lián)合輔助時(shí)的預(yù)測(cè)力最高,為0.452。預(yù)測(cè)KW時(shí),單一輔助性狀中,以KNR為輔助性狀時(shí)預(yù)測(cè)力最高,為0.625,以PH為輔助性狀時(shí)預(yù)測(cè)力最低,為0.366;多性狀輔助預(yù)測(cè)時(shí),以KNR、ED、EL和PH聯(lián)合輔助時(shí)的預(yù)測(cè)力最高,為0.848。對(duì)于ERN、KNR、ED、EL、PH和KW,與未結(jié)合輔助性狀的目標(biāo)性狀本身預(yù)測(cè)力相比,采取最佳輔助性狀組合預(yù)測(cè)時(shí),預(yù)測(cè)力分別提高了0.212、0.577、0.373、0.345、0.060和0.526。從結(jié)果中可以發(fā)現(xiàn),基于那些與目標(biāo)性狀相關(guān)性較高的輔助性狀,可在較大程度上提高預(yù)測(cè)力。例如,KW與KNR的相關(guān)系數(shù)最高,基于單一輔助性狀預(yù)測(cè)KW時(shí),以KNR為輔助性狀的預(yù)測(cè)力最高,而預(yù)測(cè)KNR時(shí),以KW為輔助性狀的預(yù)測(cè)力最高;ED與KNR不存在顯著相關(guān),基于單一輔助性狀預(yù)測(cè)ED時(shí),以KNR為輔助性狀的預(yù)測(cè)力低于ED自身預(yù)測(cè)力,預(yù)測(cè)KNR時(shí),以ED為輔助性狀的預(yù)測(cè)力也低于KNR自身預(yù)測(cè)力。

2.3 輔助性狀數(shù)目對(duì)全基因組選擇預(yù)測(cè)力的影響

為了了解輔助性狀數(shù)目對(duì)目標(biāo)性狀全基因組選擇預(yù)測(cè)力的影響,本研究評(píng)估了采用1至5個(gè)輔助性狀全基因組選擇的預(yù)測(cè)力,結(jié)果(圖3)表明,對(duì)于所有目標(biāo)性狀,隨著輔助性狀數(shù)目的增加,預(yù)測(cè)力提高。對(duì)于ERN、KNR、ED、EL、PH和KW,相比目標(biāo)性狀自身全基因組選擇預(yù)測(cè)力,采用1個(gè)輔助性狀時(shí),平均預(yù)測(cè)力分別提高了12.95%、139.36%、13.74%、32.82%、6.76%和52.53%;采用2個(gè)輔助性狀時(shí),平均預(yù)測(cè)力分別提高了27.29%、271.27%、35.54%、66.64%、9.98%和93.39%;采用3個(gè)輔助性狀時(shí),平均預(yù)測(cè)力分別提高了39.22%、387.38%、56.93%、93.96%、11.80%和124.53%;采用4個(gè)輔助性狀時(shí),平均預(yù)測(cè)力分別提高了47.51%、480.42%、75.60%、111.30%、12.48%和147.44%;采用5個(gè)輔助性狀時(shí),平均預(yù)測(cè)力分別提高了53.03%、546.76%、91.12%、117.56%、12.63%和163.67%。

2.4 不同GS模型對(duì)全基因組選擇預(yù)測(cè)力的影響

上述研究結(jié)果表明,采用GBLUP模型結(jié)合輔助性狀全基因組選擇時(shí),對(duì)目標(biāo)性狀預(yù)測(cè)力有較大幅度提升,為了探究合適的預(yù)測(cè)模型,本研究進(jìn)一步比較了GBLUP、BayesB、LASSO、RKHS和XGBOOST這5種GS模型對(duì)于結(jié)合全部輔助性狀全基因組選擇對(duì)目標(biāo)性狀的預(yù)測(cè)力。結(jié)果(圖4)表明,預(yù)測(cè)ERN時(shí),BayesB、GBLUP、RKHS模型預(yù)測(cè)效果最優(yōu),預(yù)測(cè)力分別為0.604、0.596和0.594,LASSO、XGBOOST模型預(yù)測(cè)效果較差,預(yù)測(cè)力分別為0.510和0.497;預(yù)測(cè)KNR時(shí),RKHS模型預(yù)測(cè)效果最優(yōu),預(yù)測(cè)力為0.714,XGBOOST模型預(yù)測(cè)效果較差,預(yù)測(cè)力為0.534;預(yù)測(cè)ED時(shí),BayesB、RKHS模型預(yù)測(cè)效果最優(yōu),預(yù)測(cè)力分別為0.795和0.789,XGBOOST模型預(yù)測(cè)效果最差,預(yù)測(cè)力為0.617;預(yù)測(cè)EL時(shí),RKHS、BayesB、GBLUP模型預(yù)測(cè)效果最優(yōu),預(yù)測(cè)力分別為0.648、0.646和0.637,XGBOOST模型預(yù)測(cè)效果最差,預(yù)測(cè)力為0.513;預(yù)測(cè)PH時(shí),RKHS、BayesB、GBLUP模型預(yù)測(cè)效果最優(yōu),預(yù)測(cè)力分別為0.472、0.464和0.453,LASSO模型預(yù)測(cè)效果最差,預(yù)測(cè)力為0.367;預(yù)測(cè)KW時(shí),RKHS模型預(yù)測(cè)效果最優(yōu),預(yù)測(cè)力為0.845,XGBOOST模型預(yù)測(cè)效果最差,預(yù)測(cè)力為0.756。總體而言,RKHS模型和BayesB模型的預(yù)測(cè)效果較優(yōu),XGBOOST模型的預(yù)測(cè)效果較差。

3 討論

本研究開(kāi)展了結(jié)合輔助性狀的玉米GS預(yù)測(cè)力研究,有效提升了全基因組選擇的準(zhǔn)確性,主要原因是該策略能夠利用性狀間的相關(guān)性,因此預(yù)測(cè)效果與性狀間的相關(guān)性存在一定的關(guān)聯(lián)。利用與目標(biāo)性狀相關(guān)性較高的輔助性狀可以最大程度地提高全基因組選擇預(yù)測(cè)力,利用與目標(biāo)性狀不相關(guān)的輔助性狀可能反而會(huì)降低全基因組選擇對(duì)目標(biāo)性狀的預(yù)測(cè)力。在作物育種研究中,一些性狀較難獲取,如產(chǎn)量、抗逆、根系性狀等,如果采用同一群體的其他相關(guān)性狀進(jìn)行輔助預(yù)測(cè),能夠有效降低育種成本,具有重要的實(shí)際應(yīng)用價(jià)值。在利用輔助性狀全基因組選擇時(shí),低遺傳力性狀預(yù)測(cè)力的提升相比于高遺傳力性狀更為明顯,穗行數(shù)、穗粗和株高的遺傳力均大于0.5,采用全部輔助性狀全基因組選擇預(yù)測(cè)時(shí),它們的預(yù)測(cè)力提升幅度均小于100%,而行粒數(shù)、穗長(zhǎng)和穗粒質(zhì)量的遺傳力均小于0.5,采用全部輔助性狀全基因組選擇預(yù)測(cè)時(shí),它們的預(yù)測(cè)力提升幅度均大于100%。這可能是因?yàn)榈瓦z傳力性狀更易被環(huán)境因素影響,而結(jié)合輔助性狀全基因組選擇時(shí),有效借助了性狀間的相關(guān)環(huán)境信息。

本研究分析了不同輔助性狀數(shù)目和統(tǒng)計(jì)模型對(duì)預(yù)測(cè)力的影響。有研究結(jié)果表明,在多性狀聯(lián)合分析中,輔助性狀數(shù)目達(dá)到一定數(shù)量后,繼續(xù)增加的輔助性狀對(duì)單個(gè)特定性狀預(yù)測(cè)力提升的貢獻(xiàn)較低,并且隨著輔助性狀數(shù)目的增加,運(yùn)算復(fù)雜度會(huì)大大增加[11]。在本研究中,盡管個(gè)別單一輔助性狀也能較大程度提升預(yù)測(cè)力,但總體而言隨著輔助性狀數(shù)目的增加,預(yù)測(cè)準(zhǔn)確性也隨之增加,采用更多輔助性狀能夠更大幅度提升對(duì)目標(biāo)性狀預(yù)測(cè)的準(zhǔn)確性。本研究的優(yōu)勢(shì)在于將輔助性狀視為固定效應(yīng),因而增加輔助性狀幾乎不影響模型運(yùn)算效率。在全基因組選擇中,通過(guò)獲取更多的相關(guān)表型信息輔助預(yù)測(cè)目標(biāo)性狀,有望進(jìn)一步提高預(yù)測(cè)力。統(tǒng)計(jì)模型是影響GS準(zhǔn)確性的關(guān)鍵因素[12],本研究比較了GBLUP、BayesB、LASSO、RKHS和XGBOOST這5種GS模型結(jié)合輔助性狀全基因組選擇的預(yù)測(cè)效果,整體而言,RKHS模型和BayesB模型的預(yù)測(cè)效果較優(yōu),而XGBOOST模型的預(yù)測(cè)效果較差。BayesB模型能夠?qū)Υ蟛糠治稽c(diǎn)的效應(yīng)進(jìn)行壓縮,因此更適于捕獲顯著位點(diǎn)效應(yīng)[13-14]。有研究結(jié)果表明,BayesB模型對(duì)基因的數(shù)量較為敏感,當(dāng)性狀由少數(shù)效應(yīng)較大的基因控制時(shí),預(yù)測(cè)力較高,當(dāng)性狀由許多微效基因控制時(shí),預(yù)測(cè)力有所降低[15]。RKHS模型的主要優(yōu)勢(shì)是擅于捕獲一些非加性效應(yīng)[16]。XGBOOST是經(jīng)典的機(jī)器學(xué)習(xí)算法,其預(yù)測(cè)力較低的原因可能是計(jì)算復(fù)雜度較高且調(diào)參數(shù)難度較大,易造成過(guò)擬合。

4 結(jié)論

本研究提出了結(jié)合輔助性狀的玉米GS育種新策略,以來(lái)源廣泛的342份玉米自交系為試驗(yàn)材料,對(duì)其進(jìn)行GBS并鑒定6個(gè)農(nóng)藝性狀,對(duì)每個(gè)目標(biāo)性狀均基于輔助性狀及其組合進(jìn)行預(yù)測(cè),利用五倍交叉驗(yàn)證法評(píng)價(jià)預(yù)測(cè)力。結(jié)果表明,利用與目標(biāo)性狀相關(guān)性較高的輔助性狀可較大程度地提高預(yù)測(cè)力;低遺傳力性狀的預(yù)測(cè)力提升相比高遺傳力性狀更為明顯;隨著輔助性狀個(gè)數(shù)的增加,目標(biāo)性狀的預(yù)測(cè)準(zhǔn)確性也隨之增加。本研究進(jìn)一步比較了5種GS模型結(jié)合輔助性狀的全基因組選擇的預(yù)測(cè)力,總體而言,RKHS模型和BayesB模型預(yù)測(cè)效果較優(yōu),而XGBOOST模型預(yù)測(cè)效果較差。本研究有效提升了玉米表型預(yù)測(cè)的準(zhǔn)確性,尤其對(duì)于一些低遺傳力性狀,研究結(jié)果能為玉米的GS育種提供重要支撐。

參考文獻(xiàn):

[1] 王振華,劉文國(guó),高世斌,等. 玉米種業(yè)的昨天、今天和明天[J]. 中國(guó)畜牧業(yè), 2021(19): 26-32.

[2] 黎 裕,徐辰武,秦 峰,等. 玉米生物育種:現(xiàn)狀與展望[J]. 中國(guó)基礎(chǔ)科學(xué), 2022, 24(4): 18-28.

[3] MEUWISSEN T H, HAYES B J, GODDARD M E. Prediction of total genetic value using genome-wide dense marker maps[J]. Genetics, 2001, 157(4): 1819-1829.

[4] XU Y, LIU X, FU J, et al. Enhancing genetic gain through genomic selection: from livestock to plants[J]. Plant Communications, 2020, 1(1). DOI:10.1016/j.xplc.2019.100005.

[5] ZHANG X, P?REZ-RODR?GUEZ P, BURGUE?O J, et al. Rapid cycling genomic selection in a multiparental tropical maize population[J]. G3, 2017, 7(7): 2315-2326.

[6] MILLET E J, KRUIJER W, COUPEL-LEDRU A, et al. Genomic prediction of maize yield across European environmental conditions[J]. Nat Genet, 2019, 51: 952-956.

[7] ALLIER A, TEYSSEDRE S, LEHERMEIER C, et al. Genomic prediction with a maize collaborative panel: identification of genetic resources to enrich elite breeding programs[J]. Theoretical and Applied Genetics, 2020, 133(1): 201-215.

[8] SCUTARI M, HOWELL P, BALDING D J, et al. Multiple quantitative trait analysis using bayesian networks[J]. Genetics, 2014, 198(1): 129-137.

[9] HENDERSON C, QUAAS R. Multiple trait evaluation using relatives records[J]. Journal of Animal Science, 1976, 43(6): 1188-1197.

[10]HAYASHI T, IWATA H. A Bayesian method and its variational approximation for prediction of genomic breeding values in multiple traits[J]. BMC Bioinformatics, 2013, 14. DOI: 10.1186/1471-2105-14-34.

[11]SCHULTHESS A W, WANG Y, MIEDANER T, et al. Multiple-trait- and selection indices-genomic predictions for grain yield and protein content in rye for feeding purposes[J]. Theoretical and Applied Genetics, 2016, 129(2): 273-287.

[12]CROSSA J, PEREZ-RODRIGUEZ P, CUEVAS J, et al. Genomic selection in plant breeding: methods, models, and perspectives[J]. Trends Plant Science, 2017, 22(11): 961-975.

[13]GONZ?LEZ-RECIO O, FORNI S. Genome-wide prediction of discrete traits using Bayesian regressions and machine learning[J]. Genetics Selection Evolution, 2011, 43(1). DOI: 10.1186/1297-9686-43-7.

[14]P?REZ P, CAMPOS G D L. Genome-wide regression and prediction with the BGLR statistical package[J]. Genetics, 2014, 198(2): 483-495.

[15]WANG X, YANG Z F, XU C W. A comparison of genomic selection methods for breeding value prediction[J]. Science Bulletin, 2015, 60(10): 925-935.

[16]DE LOS CAMPOS G, GIANOLA D, ROSA G J, et al. Semi-parametric genomic-enabled prediction of genetic values using reproducing kernel Hilbert spaces methods[J]. Genetics Research, 2010, 92(4): 295-308.

(責(zé)任編輯:王 妮)

猜你喜歡
玉米
掰玉米
收玉米啦!
玉米苗發(fā)黃怎么辦
玉米接連暴跌 真的要崩盤(pán)?
當(dāng)前玉米追肥要注意啥
玉米適當(dāng)晚收好處多
童年的烤玉米
我們都是“玉米人”
幽默大師(2020年5期)2020-06-22 08:19:18
我的玉米送給你
玉米
大灰狼(2018年6期)2018-07-23 16:52:44
闻喜县| 社会| 尤溪县| 方城县| 惠安县| 建水县| 十堰市| 乌鲁木齐县| 宣威市| 津南区| 田阳县| 尼勒克县| 台前县| 冷水江市| 北京市| 安溪县| 郸城县| 璧山县| 静宁县| 饶阳县| 芮城县| 曲靖市| 巴东县| 福鼎市| 和林格尔县| 巴林左旗| 平泉县| 曲靖市| 长兴县| 长治市| 四会市| 衢州市| 桃源县| 阿勒泰市| 通河县| 郸城县| 西乡县| 阿拉善左旗| 宁河县| 共和县| 剑川县|