原紅軍,曾興權(quán),徐其君,王玉林,扎 桑,尼瑪扎西
(1.省部共建青稞和牦牛種質(zhì)資源與遺傳改良國(guó)家重點(diǎn)實(shí)驗(yàn)室, 西藏拉薩 850002; 2.西藏自治區(qū)農(nóng)牧科學(xué)院 農(nóng)業(yè)研究所,西藏拉薩 850002; 3.西藏自治區(qū)農(nóng)牧研究院,西藏拉薩 850002)
青稞(HordeumvulgareL.) 作為大麥屬重要的農(nóng)作物,廣泛分布于全球各地,如歐洲、美國(guó)和澳洲等地,在我國(guó)主要分布在西藏及其周邊地區(qū)。研究發(fā)現(xiàn),西藏地區(qū)是世界栽培大麥的重要起源中心之一[1]。因其具有對(duì)高原極端氣候環(huán)境的適應(yīng)性,在距今約4 000年前,青稞就已作為藏區(qū)人民重要的糧食作物得到廣泛種植。目前,青稞在西藏地區(qū)種植面積超過(guò)70%的耕作面積[2]。青稞的β-葡聚糖(β-glucan) 含量較高,有重要的營(yíng)養(yǎng)價(jià)值和保健功能。
種質(zhì)資源的遺傳多樣性和親緣關(guān)系評(píng)估,對(duì)特異種質(zhì)的選擇和利用具有重要意義。在喜馬拉雅地區(qū),青稞具有豐富的種質(zhì)資源,已有許多關(guān)于喜馬拉雅地區(qū)的大麥資源遺傳多樣性的探究。在尼泊爾境內(nèi),不同青稞地方種質(zhì)的農(nóng)藝性狀和抗病性具有顯著的差異[3]。Pandey等[4]研究發(fā)現(xiàn),青稞群體結(jié)構(gòu)可能與資源的地理分布有關(guān)。已有研究所涉及資源群體較小,其結(jié)果可能具有一定的局限性。
尼瑪扎西等[2]對(duì)西藏青稞品種拉薩勾芒進(jìn)行了全基因組測(cè)序,并繪制了青稞參考基因組草圖,這對(duì)青稞重要性狀QTL定位、基因挖掘以及青稞遺傳改良具有重要的意義。植物中常用的QTL定位方法主要是連鎖分析(linkage mapping)和關(guān)聯(lián)分析(association mapping),連鎖分析基于雙親分離群體,關(guān)聯(lián)分析則利用自然資源群體[5]。相比而言,全基因組關(guān)聯(lián)分析(genome-wide association study, GWAS)的功能更為強(qiáng)大和高效,在較低成本條件下,可實(shí)現(xiàn)對(duì)QTL的高精度解析[6]?;谧匀毁Y源群體的GWAS能將鑒定到的QTL通過(guò)分子標(biāo)記輔助育種,利于篩選含優(yōu)良等位基因的材料,加速青稞育種進(jìn)程[7]。核心種質(zhì)可以較小的群體代表絕大多數(shù)遺傳變異類型,是GWAS研究的重要內(nèi)容之一。研究者已經(jīng)利用核心自然群體對(duì)水稻[8-9]、玉米[10]、油菜[11]和花生[12]等重要農(nóng)作物進(jìn)行了QTL定位,發(fā)現(xiàn)了大量主效QTL和基因。
本研究擬利用95對(duì)SSR引物對(duì)1 220份來(lái)源廣泛的青稞種質(zhì)材料進(jìn)行基因型分析,分析其遺傳多樣性及親緣關(guān)系、群體結(jié)構(gòu)及遺傳分化,構(gòu)建一套合適的青稞核心種質(zhì),對(duì)其更有效利用和篩選優(yōu)良親本提供參考。
以來(lái)自全球共計(jì)22個(gè)國(guó)家和地區(qū)的1 220份青稞為材料,其中,1 055份材料來(lái)自西藏,30份來(lái)自青海,28份來(lái)自四川等地,74份國(guó)外材料分別來(lái)自歐洲、加拿大和澳大利亞等地。所有材料均由中國(guó)農(nóng)業(yè)科學(xué)院國(guó)家種質(zhì)資源平臺(tái)提供。
1.2.1 SSR基因型分析
對(duì)每個(gè)種質(zhì)材料采用修改的CTAB(Cetyltrimethylammonium bromide)法[13],隨機(jī)選擇一個(gè)單株的幼嫩葉片提取DNA。利用1%的瓊脂糖膠和lambda DNA,評(píng)估DNA的提取質(zhì)量。利用本課題組前期開發(fā)的95對(duì)高質(zhì)量SSR引物[14]對(duì)所有1 220份青稞材料進(jìn)行基因型分析。PCR產(chǎn)物利用毛細(xì)管電泳(ABI3730 Genetic Analyzer Applied Biosystems)進(jìn)行檢測(cè)。采用GeneMarker V2.1軟件鑒定SSR引物的不同等位變異。為了避免SSR同源片段的影響,本研究將SSR等位變異進(jìn)行二進(jìn)制編碼(1和0),記為該等位變異出現(xiàn)與否[15]。每對(duì)SSR引物的統(tǒng)計(jì)參數(shù)為不同等位變異的平均值。
1.2.2 遺傳多樣性分析
統(tǒng)計(jì)每對(duì)SSR引物的等位變異數(shù)目(allelic count)、基因多態(tài)性(Gene diversity)、多態(tài)性信息含量(Polymorphism information index, PIC) 和香農(nóng)系數(shù)(Shannon index)。其中,變異數(shù)、基因多態(tài)性和PIC值采用PowerMarker V3.51軟件計(jì)算[16]。香農(nóng)系數(shù)利用PopGene V1.31軟件包計(jì)算[17]。考慮群體大小對(duì)多樣性統(tǒng)計(jì)的影響,利用R程序包計(jì)算每個(gè)位點(diǎn)的等位變異豐度(allelic richness)。利用R程序中的t.test函數(shù)評(píng)估不同多樣性參數(shù)在亞群間的差異顯著性[18]。
1.2.3 群體結(jié)構(gòu)和分化分析
采用STRUCTURE V2.2軟件[19]對(duì)1 220份青稞材料的群體結(jié)構(gòu)進(jìn)行分析。假定亞群數(shù)目K為1~10,每個(gè)K值進(jìn)行5次模擬運(yùn)算,每次模擬進(jìn)行10 000次預(yù)迭代(length of burn-in period)和10 000次馬科夫鏈蒙特卡羅迭代(Markov chain monte carlo,MCMC),模型設(shè)定為混合和頻率相關(guān)模型。依據(jù)軟件輸出的后驗(yàn)概率值[LnP(D)]和連續(xù)兩個(gè)LnP(D)間的變化速率(△K)[20]確定最合適的亞群數(shù)。計(jì)算每個(gè)品種源于不同亞群的概率,當(dāng)某亞群對(duì)應(yīng)值最大時(shí)[21],相應(yīng)品種被劃分到該亞群。
利用R程序的prcomp函數(shù)對(duì)1 220份青稞材料進(jìn)行主成分分析(principal component analysis, PCA),分析材料間的遺傳相似性。利用R程序的Chisq.test函數(shù)來(lái)評(píng)估群體結(jié)構(gòu)和材料來(lái)源(geographic origin)的相關(guān)性。采用Arlequin V3.1[22]進(jìn)行分子方差分析(analysis of molecular variance, AMOVA)和pairwiseFST分析,用其評(píng)估不同亞群間的遺傳分化程度,通過(guò)1 000 次排列檢驗(yàn)來(lái)評(píng)估群體遺傳分化差異顯著性。
1.2.4 核心種質(zhì)構(gòu)建
利用R軟件包c(diǎn)orehunter[23]從1 220個(gè)青稞材料中構(gòu)建一套核心種質(zhì)。軟件包同時(shí)考慮樣本間距離(average entry-to-nearest-entry distance)和基因多態(tài)性,最優(yōu)核心種質(zhì)將實(shí)現(xiàn)有效平衡等位變異多樣性和遺傳差異。通過(guò)500次蒙特卡洛隨機(jī)抽樣,分析青稞核心種質(zhì)與等樣本隨機(jī)群體的多樣性差異。采用R程序t.test函數(shù)計(jì)算五個(gè)農(nóng)藝性狀(穗長(zhǎng)、芒長(zhǎng)、株高、穗粒數(shù)和千粒重)在核心種質(zhì)和1 220份材料間的差異顯著性。
通過(guò)MCMC模擬,當(dāng)亞群數(shù)K逐漸增加時(shí),貝葉斯模型輸出的后驗(yàn)概率[LnP(D)]值呈逐步增加趨勢(shì)(圖1),并且LnP(D)值最明顯的變化發(fā)生在K由1 到2的過(guò)程中。分析貝葉斯后驗(yàn)概率的變化速率(△K)發(fā)現(xiàn),△K在K為2時(shí)出現(xiàn)峰值(圖 2)。綜合兩種方法,1 220份青稞可被劃分為兩個(gè)主要的亞群A1和A2(圖3)。A1亞群包含192個(gè)青稞品系,其中,29個(gè)品系來(lái)自歐洲和中亞地區(qū),15個(gè)品系來(lái)自加拿大,13個(gè)來(lái)自墨西哥,9個(gè)來(lái)自澳大利亞,其余126個(gè)品系約有117個(gè)來(lái)自西藏地區(qū)。A2亞群包含1 028個(gè)青稞品系,其中,938個(gè)來(lái)自西藏地區(qū),52個(gè)來(lái)自青海(29)和四川(23)地區(qū),3個(gè)來(lái)自甘肅(2)、貴州(1),約9個(gè)來(lái)自加拿大和墨西哥等地。
圖1 群體結(jié)構(gòu)分析中貝葉斯模型后驗(yàn)概率LnP(D)分布圖Fig.1 Posterior probability of Bayesian model [LnP(D)] in population structure analysis
圖2 貝葉斯模型后驗(yàn)概率變化速率(△K)分布圖Fig.2 Changing rate of posterior probability(△K)
△K在K為4時(shí)出現(xiàn)了第二個(gè)峰值(圖2),1 220份 青稞可進(jìn)一步被劃分為4個(gè)亞群B1~B4。B4亞群包含194個(gè)材料,包括A1亞群的192個(gè)材料以及2個(gè)加拿大材料。A2亞群則被進(jìn)一步被劃分為3個(gè)小亞群B1、B2、B3(圖3)。通過(guò)主成分分析(PCA),第一和第二主成分(principal component)分別能解釋1 220份青稞種質(zhì)6.64%和4.96%的遺傳變異。A1和A2亞群的青稞材料具有較明顯的遺傳分化,而B1~B3亞群間的遺傳距離相對(duì)較近(圖4)。主成分分析結(jié)果與群體材料來(lái)源具有較好的吻合度。
利用AMOVA和pairwiseFST分析青稞不同亞群間的遺傳分化發(fā)現(xiàn),不同亞群間遺傳分化程度差異顯著(P<0.001),A1和A2亞群間的遺傳分化能解釋17.39%的群體方差,而B1~B4亞群間的遺傳分化能解釋14.99%的群體方差(表1)。A1和A2亞群的分化系數(shù)FST為0.174(表2),表明我國(guó)和國(guó)外青稞種質(zhì)因地理隔離和適應(yīng)性等原因,具有明顯的遺傳差異。不同B亞群間的遺傳分化程度各不相同,其中,B4與B1、B2、B3亞群的分化系數(shù)較大(FST=0.191~0.198),而B1、B2、B3亞群間的分化系數(shù)較小(FST=0.105~0.131,表2)。這表明分布于我國(guó)不同地區(qū)的青稞種質(zhì)間存在一定程度的遺傳差異,由于生態(tài)環(huán)境和育種需求等因素,其差異相對(duì)較小。
圖3 1 220份青稞種質(zhì)資源群體結(jié)構(gòu)分析。Fig.3 Admixture Proportion of 1 220 hulless barley accessions
圖4 青稞群體主成分分析Fig.4 Principal component analysis of hulless barley germplasm
表1 青稞群體分子方差分析Table 1 Analysis of molecular variance(AMOVA) among subpopulations in hulless barley
表2 不同青稞亞群間的分化系數(shù)Table 2 Genetic differentiation(FST) between hulless barley subpopulations
95對(duì)SSR引物共檢測(cè)到451個(gè)等位變異,每引物平均檢測(cè)到4.74個(gè)等位變異,變化范圍為1~19?;蚨鄻有云骄鶠?.22,變化范圍為0.02~0.50。多態(tài)性信息含量平均為0.18,變化范圍為0.04~0.80。等位變異豐度平均為0.37(表3)。A1亞群共檢測(cè)到418個(gè)等位變異,每對(duì)引物平均檢測(cè)到4.40個(gè)等位基因;而A2亞群共檢測(cè)到423個(gè)等位變異,每對(duì)引物平均檢測(cè)到4.45個(gè)等位變異。A1和A2群體間的SSR等位變異差異不顯著;其基因多樣性、多態(tài)性信息含量、香農(nóng)系數(shù)和最小等位基因頻率均差異顯著。A2亞群的群體數(shù)約為A1亞群的5倍,A1亞群的變異豐度約是A2亞群的5倍。這表明A2亞群不同材料間的等位變異冗余度較高,具有進(jìn)一步篩選有代表性材料的空間。在B1~B4亞群中,B4亞群多樣性顯著高于其他亞群。B2亞群包括517個(gè)青稞材料,共檢測(cè)到402個(gè)等位變異,等位變異豐度為0.78,約為B1和B2亞群的二分之一(表 3)。該結(jié)果表明,A2亞群中青稞材料的高冗余度主要由B2亞群材料導(dǎo)致。
表3 青稞不同亞群遺傳多樣性Table 3 Diversity statistics of subpopulations in hulless barley
分析樣本間遺傳距離和基因多態(tài)性,從1 220個(gè)青稞材料中篩選并構(gòu)建出一個(gè)青稞核心種質(zhì)群體,該群體包含300份材料,其中,163個(gè)材料來(lái)自A1亞群,占A1亞群材料數(shù)的84.9%;137個(gè)材料來(lái)自A2亞群,占A2亞群材料數(shù)的13.3%。
通過(guò)蒙特卡洛模擬實(shí)驗(yàn)發(fā)現(xiàn),從1 220個(gè)青稞材料中隨機(jī)抽取300個(gè)材料能攜帶平均415個(gè)等位變異,變異范圍為400~432,而青稞核心種質(zhì)共攜帶444個(gè)等位變異,二者差異極顯著(P<0.001)。青稞核心種質(zhì)的基因型多樣性指數(shù)平均為0.235,極顯著高于隨機(jī)群體(P<0.001)。青稞核心種質(zhì)材料間的歐氏距離平均約為11.4,比原始群體間的歐式距離(8.2)明顯升高(圖5a)。說(shuō)明該青稞核心種質(zhì)能有效地代表1 220份原始材料。結(jié)合群體結(jié)構(gòu)來(lái)看,在A1和B4亞群上,核心種質(zhì)的遺傳多樣性與原始群體沒(méi)有明顯差別,核心種質(zhì)的多樣性提升主要來(lái)自于A2亞群的變化(圖5b)。與此同時(shí),最小等位變異頻率在核心種質(zhì)中也同樣存在大幅提升,這也是群體多樣性增加的一個(gè)重要原因。
青稞核心種質(zhì)的穗長(zhǎng)、芒長(zhǎng)、株高、穗粒數(shù)和千粒重均值與原始群體并無(wú)顯著差別(表4,P>0.05)。這表明青稞核心種質(zhì)構(gòu)建并未影響原始群體的表型分布。青稞核心種質(zhì)的芒長(zhǎng)和株高的標(biāo)準(zhǔn)差為2.89和21.49,分別為原始群體的95.7%和94.8%,而穗長(zhǎng)、穗粒數(shù)和千粒重的標(biāo)準(zhǔn)差為1.82、18.62和6.03,為原始群體的1.08~1.18倍。該研究結(jié)果表明,青稞核心種質(zhì)保留了原始群體絕大多數(shù)的表型變異,并因有效去除冗余材料,更有利于育種工作進(jìn)行。
a:核心種質(zhì)和原始群體的歐式距離分布圖;b:核心種質(zhì)和原始群體不同多樣性參數(shù)的比較a:The distribution of Euclidean distances for core set and raw set;b:Comparison of genetic diversity between core set and raw set.
表4 青稞核心種質(zhì)與原始群體的農(nóng)藝性狀比較Table 4 Comparison of agronomic traits between hulless barley core set and raw population
國(guó)內(nèi)外有眾多研究者對(duì)不同來(lái)源的青稞種質(zhì)的遺傳多樣性進(jìn)行過(guò)研究。楊 菁等[24]利用7個(gè)SSR引物對(duì)青海省42份栽培青稞進(jìn)行遺傳了多樣性分析,每個(gè)SSR引物平均檢測(cè)到3個(gè)等位變異。范志芬等[25]利用30個(gè)SSR引物對(duì)64份青藏高原栽培青稞種質(zhì)進(jìn)行分析,發(fā)現(xiàn)栽培青稞有豐富的遺傳多樣性,平均每個(gè)SSR引物檢測(cè)到4.4個(gè)等位變異。楊 平等[26]對(duì)四川高原的25份青稞育成品種進(jìn)行SRAP分子標(biāo)記分析,每個(gè)SRAP平均檢測(cè)到5.2個(gè)等位變異,表明四川高原的青稞具有較高的遺傳多樣性。Pandey等[4]利用42個(gè)SSR引物對(duì)107個(gè)尼泊爾青稞材料進(jìn)行基因型分析,發(fā)現(xiàn)尼泊爾青稞種質(zhì)也具有較高的遺傳多樣性。
本研究中,1 220份青稞材料共檢測(cè)到451個(gè)等位變異,每個(gè)SSR引物平均檢測(cè)到4.7個(gè)等位變異。該結(jié)果比SRAP多態(tài)性水平略低,這可能是不同分子標(biāo)記的擴(kuò)增效率差異導(dǎo)致的。不同研究差異的可能原因如下:1)不同研究所用SSR引物的差異;2)擴(kuò)增與檢測(cè)手段存在差異;3)研究群體遺傳背景的差異。隨著青稞參考基因組的公布和高通量基因型分析技術(shù)的發(fā)展,大麥已經(jīng)開發(fā)出基于Illumina平臺(tái)的9K iSelect SNP芯片。這預(yù)示著高通量SNP分析技術(shù)的發(fā)展,對(duì)青稞的基因型鑒定、遺傳多樣性分析和重要性狀關(guān)聯(lián)分析具有重要的意義。
在農(nóng)作物育種中,核心種質(zhì)的篩選對(duì)雜交親本組配和大規(guī)模種子庫(kù)保種具有重要意義。核心種質(zhì)能在一個(gè)較小的群體中最大化保留該群體的遺傳多樣性,從而提高育種效率。本研究從廣泛收集的1 220份青稞種質(zhì)資源中,通過(guò)評(píng)估其遺傳多樣性和群體結(jié)構(gòu),構(gòu)建了一個(gè)青稞核心種質(zhì)群體。該青稞核心種質(zhì)群體保留了原始群體98%的遺傳變異信息,極大地降低了材料間的冗余度,顯著提高了群體多樣性水平。除此之外,本青稞核心種質(zhì)顯著地提升了群體最小等位基因頻率(MAF),這為后續(xù)基于核心種質(zhì)的GWAS研究以及分子育種奠定了堅(jiān)實(shí)的基礎(chǔ)。