周萍萍 顏紅海,3,* 彭遠英
基于高通量GBS-SNP標記的栽培燕麥六倍體起源研究
周萍萍1,2顏紅海1,2,3,*彭遠英2,*
1西華師范大學生命科學學院, 四川南充 637009;2四川農業(yè)大學小麥研究所, 四川成都 611130;3西華師范大學組織修復材料工程技術中心, 四川南充 637009
栽培六倍體燕麥是世界重要糧食作物, 理清其起源對燕麥種質資源的高效利用和保護具有重要意義。本研究利用GBS (genotyping by sequencing)對27份來自中國的大粒裸燕麥材料測序, 結合先前發(fā)表的包括6個六倍體燕麥種在內的66份燕麥材料的GBS數據進行SNP挖掘。UNEAK管道挖掘共計得到MAF大于0.5, call rate大于0.95的SNP標記8902個。進一步剔除缺失值大于0.15的4個燕麥材料后, 對其余89份材料進行PCA分析、STRUCTURE分析以及UPGMA聚類分析。結果表明, 在野生種中, 除外, 大多數來自同一物種的材料聚為一類, 不同物種間能夠較好地分開, 表明這些物種之間存在較強的遺傳分化。聚類分析將供試材料分為分別代表野生種和栽培種的2支, 表明野生種和栽培種之間存在明顯的遺傳差異; 在栽培種中,與具有較高的遺傳多樣性, 分散在不同的類群中, 二者未出現明顯的遺傳分化, 具有較高的遺傳同質性,ssp. nuda與親緣關系較近, 但存在一定的遺傳分化, 因此形成獨立的類群。值得注意的是, 來自野生種的材料被分在2個類群中, 其中來自西南亞地區(qū)(伊朗-伊拉克-土耳其地區(qū))的居群與和聚在一起, 揭示此地區(qū)的居群可能是和的祖先種。野生種顯示出與較高的遺傳同質性, 因此將其作為的亞種較為合理。本研究為栽培六倍體燕麥起源提供了理論依據。
栽培六倍體燕麥; GBS測序; 馴化; 起源; SNP標記
普通栽培六倍體燕麥(L.)隸屬于禾本科(Poaceae), 燕麥屬(L.), 是一種重要的糧飼兼用型作物, 因具有較高的營養(yǎng)價值[1], 應用價值得到不斷提升,然而由于產量較低, 其在全球的種植面積不斷下滑[2], 因此, 加強新品種選育是燕麥發(fā)展亟待解決的關鍵問題。野生資源是作物改良的優(yōu)質基因庫, 在燕麥中, 一些野生資源中的優(yōu)質基因已通過雜交成功轉移到栽培燕麥, 培育出一些優(yōu)良的燕麥新品種[3-5]。然而, 通過雜交、回交等方式難以導入單個優(yōu)異基因, 往往伴隨著連鎖累贅等問題[6]。且2個親本間的親緣關系越遠, 越難打破目標基因與非目標基因間的連鎖, 使得連鎖累贅效應更加突出[7]。因此, 了解燕麥屬物種種間親緣關系, 尤其是野生六倍體與栽培六倍體燕麥之間的親緣關系對野生六倍體種質資源的利用和保護, 以及燕麥育種具有重要的理論和現實意義。
燕麥屬中包含多種六倍體物種, 但關于其分類還存在諸多爭議?,F今廣泛采用的是Baum[8]的分類系統(tǒng), 將六倍體燕麥分為7個物種。然而該分類并未得到其他分類學家的完全認同[7,9]。如Baum[8]將所有栽培六倍體燕麥歸為, 而Coffman[3,10]認為栽培六倍體燕麥至少存在2個物種, 即和。此外, 我國學者將起源于我國的裸粒型栽培六倍體燕麥(大粒裸燕麥)視為一個獨立的物種[11], 而多數西方學者則將其作為的一個亞種(ssp.nuda)[8-9]。目前比較認同的六倍體物種有、、,和(包括大粒裸燕麥)。
目前, 關于栽培六倍體燕麥的起源還存在很大爭議。多數研究認為栽培六倍體燕麥起源于地中海沿岸和亞洲西南地區(qū)[12-13], 但其基因組起源存在單親起源和多親起源兩種觀點[14]。單親起源認為栽培六倍體燕麥起源于某個共同的六倍體祖先親本, 包括[15]、s[3,10]以及[16]在內的物種都被認為是栽培六倍體燕麥的祖先種; 多親起源則認為栽培六倍體燕麥有多個的祖先親本[14]。最初,被認為是栽培六倍體燕麥的祖先,是的衍生種。Ladizinsky[15]觀察到的小花軸斷裂方式和相似, 因此支持來源于的觀點;與在小花軸斷裂方式十分相似, 因此認為a是傳播到地中海后, 與基因融合的產物。然而, Coffman[10]認為栽培六倍體燕麥來源于, 而則是的衍生物。Loskutov[13]認為所有六倍體物種均起源于一種大粒型的, 由于穎果性狀上的突變, 從而衍生出栽培種, 以及另外一個野生種;在東擴的過程中突變產生小粒型的, 其進一步在穎果脫落方式上產生突變, 由此得到雜草型的;在東擴過程中產生早熟的春性物種。此外, Baum[16]根據形態(tài)學特征將作為可能的祖先種。
綜上可知, 盡管前人就栽培六倍體燕麥的祖先進行了研究, 但仍不明確。同時, 上述研究大多基于形態(tài)學特征, 易受環(huán)境影響, 不能完全真實反映物種間的親緣關系。DNA分子標記是目前生物學研究最重要的工具之一, 已廣泛用于包括物種親緣關系研究在內的各類研究。近年來發(fā)展起來的基于二代測序技術的DNA標記技術為大規(guī)模標記開發(fā)提供了可能。GBS (genotyping by sequencing)是一種基于二代測序技術的簡化基因組測序技術, 具有通量高, 成本低的優(yōu)點, 已經成功應用于燕麥標記開發(fā)[17-20]。在之前的研究中, 我們利用GBS技術對燕麥屬物種的親緣關系進行了系統(tǒng)研究, 揭示了六倍體燕麥的D基因組起源[19]。然而并未對燕麥屬六倍體物種的關系進行系統(tǒng)分析。本研究對包括6個物種和1個亞種(ssp. nuda)在內的93份六倍體燕麥材料的親緣關系和群體結構進行了深入分析, 旨在為六倍體燕麥之間的親緣關系、栽培六倍體燕麥的起源提供分子學證據, 同時為燕麥野生種質資源保護和利用提供理論依據。
93份燕麥材料, 除根據Coffman[3]的分類標準視為獨立物種外, 均采用Baum[8]的分類系統(tǒng)。所有供試材料種子均來自加拿大植物基因資源庫(Plant Gene Resources of Canada, PGRC), 美國農業(yè)部種質資源信息網絡(the United States Department of Agriculture Germplasm Resources Information Network, USDA-GRIN), 以及中國國家種質資源庫(Chinese Crop Germplasm Resources Information System, CGRIS)。詳細信息見表1。
除27份來自中國的大粒裸燕麥外, 其余66份燕麥材料的GBS數據來自Yan等[19]。中國大粒裸燕麥材料DNA提取自幼嫩葉片。采用凱杰公司的植物基因組DNA提取試劑盒(DNAeasy Plant Mini kits, Qiagen Inc, Canada)進行。參見Huang等[17]I-I雙酶切法構建GBS文庫。文庫構建完成后, 送至Illumina公司的HighSeq2500平臺進行雙端測序。
表1 六倍體燕麥種質材料的種名、材料編號、來源地及種質類型
(續(xù)表1)
a除外, 其余物種采用Baum[8]的命名系統(tǒng),則根據Coffman[3]分類依據作為獨立物種處理。b以CN、PI、ZY開頭的材料分別來自PRGC、USDA-GRIN以及CGRIS。除來自CGRIS的材料外, 其余材料的GBS數據來自Yan等[19]。
aThe classification system of Baum[8]is adopted with the exception of species, which is considered as an independent species in this study based on Coffman[3].bThe accessions with number beginning with CN, PI, and YZ are obtained from PGRC, USDA-GRIN, and CGRIS, respectively. All GBS data with exception of those from taxa kept in CGRIS are obtained from Yan et al.[19]
目前尚無燕麥參考基因組, 因此本研究基于無參方式進行SNP標記挖掘。研究表明, 目前廣泛采用的2種無參分析管道STACKS和UNEAK中, 后者獲得的標記更多, 準確率更高[21]。因此本研究采用UNEAK管道[22]進行SNP標記分析。UNEAK管道參數設定為容錯率(error tolerance rate) 0.02[17], 單個Tag最小檢出率10次, 最小等位基因頻率(minor allele frequency, MAF) 0.05。數據分析完成后, 利用TASSEL 3.0軟件[23]進行位點和材料篩選, 即將缺失值大于5%的位點, 以及缺失值大于15%的材料剔除。
分別采用主成分分析(principal component analysis, PCA)以及基于模型的聚類方法探究各材料間的群體結構。PCA分析在TASSEL 3.0[23]中完成, 以相關系數矩陣為基礎, 缺失值以平均值代替, 其余參數采用默認設置。基于模型分析的聚類分析則在STRUCTURE 2.3.4[24]中完成。STRUCTURE分析采用祖先模型中的混合模型(admixture model)。隨后進行馬爾科夫鏈蒙特卡羅(Markov Chain Monte Carlo, MCMC)迭代分析, 設置Burn-in長度為5000, 計入迭代分析的MCMC長度為20,000。設置值為1~12, 每個值獨立運算5次, 取5次獨立運算的平均值為每個個體在個群體中的分布比例。根據Evanno等[25], 在在線軟件STRUCTURE HARVESTER[26]中進行最佳值判別。最后, 根據每份材料的遺傳組成進行群體劃分, 即與特定亞群遺傳相似性比例(Q值)大于0.5的材料劃分到相應亞群中, 與任何亞群的Q值低于0.5的材料視為混合個體(mixed), 不進行群體劃分。采用基于歐氏距離的非加權組平均法(unweighted pair-group method with arithmetic means, UPGMA)進行聚類分析。聚類分析在R軟件[27]中完成。
TASSEL-UNEAK管道分析共計得到151,386個SNP標記, 經群體水平篩選后, 得到MAF大于0.05, 且call rate大于0.95的SNP標記8902個。獲得的8902個標記的MAF區(qū)間分布不盡相同(圖1)。MAF位于0.4~0.5的標記數量最多, 為3118個, 占比達到35.0%。供試93燕麥材料中, 2份來自(CN21269, PI 560776), 1份來自(CN 63917), 以及1份來自的材料(CN 24168)缺失值大于15%不納入后續(xù)分析, 其余材料則用于群體結構分析和系統(tǒng)發(fā)育樹構建。
前5個主成分累積變異貢獻率達到44.06%, 前2個主成分變異貢獻率分別為21.06%和10.38%, 因此對前2個主成分作圖。由圖可知 (圖2), 在野生種中, 除了外, 其余物種之間存在明顯的遺傳差異, 各自聚在一起, 并且顯示出與栽培種較強的遺傳分化; 而來自的材料則大體分為2個類群, 一個類群包含來自不同地區(qū)的7份材料, 并與野生種緊密聚在一起; 另一類群同樣包含7份材料, 這些材料分別來自伊拉克(CN 20234、CN 20235、CN 20239、CN 20242、CN 20280)、伊朗(CN 19991)和土耳其(CN 24842), 在PC1上顯示出與栽培種和較近的遺傳距離; 另外2份材料則與野生種和關系較近。在栽培種中, 來自和的材料則較為分散, 表現出較高的遺傳多樣性, 而大粒裸燕麥ssp. nuda則顯示出較低的遺傳多樣性, 與和1份聚在一起, 形成較為緊密的一個類群。
圖1 獲得的GBS-SNP標記在不同MAF區(qū)間的分布
柱狀圖上面的數字表示占所獲的GBS標記的百分比。
The number above each bar represents the percentage of distribution of MAF of obtained GBS markers.
圖2 基于8902個GBS標記的89份燕麥材料的PCA分析
Delta在=4時出現明顯轉折(圖3-A), 達到最大值, 表明供試材料的最佳類群數為4。在=4時, 各材料分組見圖3-B。G1包含27份材料, 主要由六倍體野生種組成, 其中包括9份、5份、5份, 以及全部的, 此外還包括3份栽培燕麥(2份以及1份), 這表明野生種和栽培種之間存在較強的遺傳分化; G2由20份材料組成, 主要由普通栽培燕麥(15/22)組成, 此外, 還包括2份、1份, 以及2份ssp. nuda; G3由14份材料構成, 包括7份、5份, 以及2份, 這些中, 有5份來自伊拉克, 1份來自伊朗, 1份來自土耳其, 表明這些地區(qū)的與和具有較近的親緣關系; G4則全由大粒裸燕麥(25/27)組成, 表明大粒裸燕麥與其他栽培燕麥存在一定的遺傳分化。此外, 3份來自(1份)和(2份)的材料由于其與任何群體的遺傳相似性比例均低于0.5, 因此被劃歸為混合個體, 不做任何分類。
UPGMA聚類分析將供試燕麥分為2個大類(圖4), 分別代表野生種(W)和栽培種(C)。W支又分為3個亞支。W1支主要包括、、以及, 此外還包括2份和1份, 來自、的種質展現出較強的遺傳同質性, 各自聚為一個分支; 2份分別來自阿爾及利亞和埃塞俄比亞的和1份來自美國的與1份來自美國的野生種聚為一個小支, 表明這3份栽培燕麥與有較近的親緣關系。來自摩洛哥、阿爾及利亞、土耳其、以色列和黎巴嫩的顯示出與較近的親緣關系, 聚為亞支W2。同樣地, 5份來自伊拉克和2份分別來自土耳其和伊朗的顯示出與和較近的親緣關系, 共同組成了亞支W3。C支進一步分為2個亞支(C1和C2)。一支由大粒裸燕麥(ssp. nuda)組成(C1), 另一支則由和組成(C2)。在裸燕麥內也出現一定的分化, 來自陜西、青海, 以及部分來自云南、山西和河北的材料聚為一個亞支, 而來自內蒙古和其他地區(qū)的裸燕麥則形成另一個分支。
圖3 基于8902個GBS標記的STRUCTURE分析
A: Delta在=4時達到最大值。B: 最佳(4)時分組情況。每種顏色代表一個類群(=4), 每條豎線代表一個燕麥材料。
A: the delta K value reaches to the peak with=4. B: the grouping results at the optimal(4) value. Each color represents a group. Each vertical bar represents one of.
圖4 基于UPGMA方法的系統(tǒng)發(fā)育樹
目前, 關于栽培六倍體燕麥的起源還存在爭議。起初,被認為是栽培六倍體燕麥的祖先種。這一觀點得到Ladizinsky[15]的認同, 其比較了與的馴化特征以及氣候適應性, 認為前者是的起源, 并且推測另一個栽培燕麥源于對的基因滲入。而其他學者則根據和栽培燕麥之間的形態(tài)學特征, 以及其雜交后代的遺傳分化比例等認為所有栽培六倍體燕麥均起源于[3,10]。本研究中, 群體結構和聚類分析結果均表明, 除外, 大部分野生種和栽培種間存在明顯的遺傳分化, 但有7份分別來自伊拉克、伊朗、土耳其的與部分和聚在一起, 顯示出較近的親緣關系。這個結果與Zhou等[12]的結果相一致, 其利用RAPD標記研究和栽培燕麥的關系時發(fā)現, 大多數栽培燕麥(21/24)與來自伊朗、伊拉克和土耳其的聚在一起。上述結果表明栽培燕麥和可能起源于西南亞(伊朗-伊拉克-土耳其)地區(qū)的。值得注意的是, 在聚類分析中, 有2份來自阿爾及利亞和埃塞俄比亞的, 以及1份來自美國的與1份來自美國的野生種具有較近的親緣關系(圖4)。據Souza和Sorrells[28]報道, 這份應該來自歐洲地區(qū)。同時美洲并非燕麥的起源中心, 燕麥最早由歐洲傳入美洲, 因此野生種也應由此傳入美洲。關于與栽培種的關系有以下2種可能。第一種可能是, 不同地區(qū)的栽培六倍體由不同的野生種馴化而來,是栽培燕麥可能的祖先之一。事實上,一直以來都被認為是栽培燕麥的祖先種, 這主要是因為在很多燕麥種植地中均能發(fā)現, 同時,與存在很多相似的表型特征[8, 15]。第二種可能是, 在燕麥栽培過程中,與栽培燕麥之間發(fā)生了基因滲入。如上所述, 在栽培燕麥地塊中, 總能發(fā)現的存在, 這為它們之間進行基因滲入提供了條件。
栽培六倍體燕麥中, 關于與的關系還未有一致觀點。最早提出的是Koch[29]。這一分類得到Coffman[3,10]的認同, 并認為起源于。Loskutov[13]則根據大多數中存在7C-17染色體間異位, 而只有少數存在這一異位這一結果, 認為和是獨立進化的兩支,是向地中海東擴的結果, 而則來自亞洲西南地區(qū)的。然而的獨立物種地位并未得到其他學者的支持。Baum[8]認為當屬的亞種, 而這一分類體系得到大多數北美學者的認同。本研究中,和表現出高度的遺傳同質性(圖3和圖4), 并未表現出群體分化。似乎支持Baum的觀點。然而, 需要注意的是, 本研究中所用的多為選育品種, 因此遺傳背景較為復雜, 這從一定程度上削弱了與其他物種間的群體結構差異, 因此關于物種地位還需要加入更多遺傳背景單一的地方品種進行深入研究。
關于大粒裸燕麥, 多數西方學者認為其是的一種變異形式, 從而將其作為的一個亞種。而多數中國學者則認為大粒裸燕麥的獨立物種地位[11]。本研究中, 大粒裸燕麥與其他野生物種分開, 而與聚為一個大支, 表明其與具有較近的親緣關系, 可能來源于, 或由一個共同祖先馴化而來。同時, 從本研究結果可以看到, 大粒裸燕麥單獨聚為一個亞支, 表現出與其他栽培燕麥之間一定的遺傳分化(圖3和圖4), 這與Baohong等[30]的研究結果不同, 其利用RAPD標記研究了普通栽培燕麥和大粒裸燕麥sspnuda的遺傳多樣性, 結果表明二者并未出現明顯的遺傳分化, 且大粒裸燕麥sspnuda與北歐的普通栽培燕麥遺傳相似性較高。由于本研究供試的大粒裸燕麥sspnuda是來源于中國的地方品種, 因此這種遺傳差異不排除由于材料的地域來源引起。關于栽培燕麥中大粒裸燕麥sspnuda的分類地位和物種定位, 有待收集更多栽培皮燕麥和裸燕麥的全面系統(tǒng)研究。
本研究中, 除外, 其他野生六倍體物種表現出較強的遺傳分化, 來自同一物種的材料多聚為一類。值得注意的是,與聚為一類, 而表現出與栽培燕麥較遠的親緣關系, 因而不支持Baum[16]提出的關于是栽培六倍體燕麥祖先物種的觀點。事實上, 形態(tài)學證據表明與具有高度的遺傳相似性, 因此被Malzew[31]作為的亞種ssp. septentrionalis。而Baum[8]以漿片、中胚層細胞形態(tài)為依據將作為獨立物種而分類。這一分類未得到其他學者的廣泛認同。因此, 將作為的亞種更為合理。
[1] Kong L, Huo H, Mao P. Antioxidant response and related gene expression in aged oat seed., 2015, 6: 158
[2] FAOSTATS. http://faostat.fao.org/. 2016
[3] Coffman F A. Oat History, Identification and Classification. Washington D. C: US Department of Agriculture, Agricultural Research Service. 1977. pp 3–30
[4] Cox D J, Frey K J. Improving cultivated oats (L.) with alleles for vegetative growth index fromL.1984, 68: 239–245
[5] Branson C V, Frey K J. Recurrent selection for groat oil content in oat., 1989, 29: 1382–1387
[6] Zamir D. Improving plant breeding with exotic genetic libraries., 2001, 2: 983–989
[7] Loskutov I G, Rines H W.. In: Kole C, ed. Wild Crop Relatives: Genomic and Breeding Resources. Heidelberg: Springer Press, 2011. pp 109–183
[8] Baum B R. Oats: Wild and Cultivated. A Monograph of the GenusL. (Poaceae). Ottawa: Minister of Supply and Services Press, 1977.
[9] Ladizinsky G. Studies in Oat Evolution. A Man’s Life with(Springer Briefs in Agriculture). Heidelberg: Springer Press, 2012. pp 1–18
[10] Coffman F A. Origin of cultivated oats., 1946, 38: 983–1002
[11] 鄭殿升, 張宗文. 大粒裸燕麥(莜麥)(L.)起源及分類問題的探討. 植物遺傳資源學報, 2011, 5: 667–670. Zheng D S, Zhang Z W. Discussion on the origin and taxonomy of naked oat (L.)., 2011, 5: 667–670 (in Chinese with English abstract)
[12] Zhou X, Jellen E N, Murphy J P. Progenitor germplasm of domisticated hexaploid oat., 1999, 39: 1208–1214
[13] Loskutov I G. On evolutionary pathways ofspecies., 2008, 55: 211–220
[14] 劉青, 劉歡, 林磊. 燕麥屬系統(tǒng)學研究進展. 熱帶亞熱帶植物學報, 2014, 5: 516–524 Liu Q, Liu H, Lin L. Research advances on systematics of(Pooideae, Poaceae)., 2014, 5: 516–524 (in Chinese with English abstract)
[15] Ladizinsky G. The domestication and history of oats. In: Mattsson B, Lyhagen R, eds. Proceedings of the 3rd International Oat Conference, Lund, Sweden. Svalof AB, 1988. pp 7–12
[16] Baum B R. Extrapolation of the predomesticated hexaploid cultivated oats., 1973, 27: 518–523
[17] Huang Y F, Poland J A, Wight C P, Tinker N A. Using genotyping-by-sequencing (GBS) for genomic discovery in cultivated oat., 2014, 9: e102448
[18] Chew P, Meade K, Hayes A, Harjes C, Bao Y, Beattie A D, Puddephat I, Gusmini G, Tanksley S D. A study on the genetic relationships oftaxa and the origins of hexaploid oat., 2016, 129: 1405–1415
[19] Yan H, Bekele W A, Wight C P, Peng Y, Langdon T, Latta R G, Fu Y B, Diederichsen A, Howarth C J, Jellen E N, Boyle B, Wei Y, Tinker N A. High-density marker profiling confirms ancestral genomes ofspecies and identifies D-genome chromosomes of hexaploid oat., 2016, 129: 2133–2149
[20] Chaffin A S, Huang Y F, Smith S, Bekele W A, Babiker E, Gnanesh B N, Foresman B J, Blanchard S G, Jay J J, Reid R W, Wight C P, Chao S, Islamovic E, Kolb F L, McCartney C, Mitchell F J W, Beattie A D, Bjornstad A, Bonman J M, Langdon T, Howarth C J, Brouwer C R, Jellen E N, Klos K E, Poland J A, Hsieh T F, Brown R, Jackson E, Schlueter J A, Tinker N A. A consensus map in cultivated hexaploid oat reveals conserved grass synteny with substantial subgenome rearrangement., 2016, 9. doi: 10.3835/plantgenome2015.10.0102.
[21] Torkamaneh D, Laroche J, Belzile F. Genome-wide SNP calling from genotyping by sequencing (GBS) data: a comparison of seven pipelines and two sequencing technologies., 2016, 11: e0161333
[22] Lu F, Lipka A E, Glaubitz J, Elshire R, Cherney J H, Casler M D, Buckler E S, Costich D E. Switchgrass genomic diversity, ploidy, and evolution: novel insights from a Nnetwork-based SNP discovery protocol., 2013, 9: 139–147
[23] Bradbury P J, Zhang Z, Kroon D E, Casstevens T M, Ramdoss Y, Buckler E S. TASSEL: software for association mapping of complex traits in diverse samples., 2007, 23: 2633–2635
[24] Pritchard J, Stephens M, Donnelly. Inference of population structure using multilocus genotype data., 2000, 155: 945–959
[25] Evanno G, Regnaut S, Goudet J. Detecting the number of clusters of individuals using the software STRUCTURE: a simulation study., 2005, 14: 2611–2620
[26] Earl D A, Vonholdt B M. STRUCTURE HARVESTER: a website and program for visualizing STRUCTURE output and implementing the Evanno method., 2012, 4: 359–361
[27] R Core Team. R: a language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. http://www.R-project.org. 2016.
[28] Souza E, Sorrells M E. Relationships among 70 north American oat germplasms: I. cluster analysis using quantitative characters., 1991, 31: 599–605
[29] Koch. K. Beitr?ge zu einer flora des orients., 1948, 21: 289–443
[30] Baohong G, Zhou X, Murphy J P. Genetic variation within Chinese and Western cultivated oat accessions., 2003, 31: 339–346
[31] Malzew A. Wild and cultivated oats: Sectio Eu Avena Griseb.,,1930, 38: 473–506 (in Russian with English abstract)
Hexaploid ancestor of cultivated hexaploid oats inferred from high throughput GBS-SNP markers
ZHOU Ping-Ping1,2, YAN Hong-Hai1,2,3,*, and PENG Yuan-Ying2,*
1College of Life Sciences, China West Normal University, Nanchong 637009, Sichuan, China;2Triticeae Research Institute, Sichuan Agricultural University, Chengdu 611130, Sichuan, China;3Collaboration and Innovation Center of Tissue Repair Material Engineering Technology, China West Normal University, Nanchong 637009, Sichuan, China
Cultivated hexaploid oat is one of the most important cereal crops in the word, clearing its hexaploid ancestor would substantially improve the utilization efficiency of the genetic resources of oat, and therefore provide theoretical reference for oat germplasm conservation. In this study, 27 naked oats originated from China were sequenced by using GBS (genotyping by sequencing). SNPs were calling by combining the previously published GBS data of another 66 hexaploid oats including six species using UNEAK pipeline. A total of 8902 SNPs with MAF > 0.5, call rate > 0.95 were obtained. Four taxa with missing value greater than 15% were excluded for further analyses. Finally, 89 oat taxa meeting the requirement were used for PCA, STRUCTURE and UPGMA clustering analyses. All three analyses revealed some consistent results as follows: most wild hexaploid oats with the exception ofshowed strong genetic differentiations among each other, resulting in a grouping by species. Clustering analysis divided all the taxa into two clusters representing wild species and cultivated species, respectively, indicating some significant genetic differences existed between this two types of hexaploids. Within cultivated hexaploid oats,showed a high degree of genetic homogeneity with, while naked oats differed from the others and formed an independent subcluster with close relationships with. The taxa from the wild hexaploid specieswere mainly subdivided into two groups. Notably, these accessions oforiginated from western Asia (Iran-lraq-Turkey region) were clustered with the cultivated oatsand, suggesting thatandmight be derived from progenitor germplasm from Iran-lraq-Turkey region. Another wild hexaploid speciesshowed high degree of genetic homogeneity with, is better to consider as a subspecies of. This research contributes to clarifying the hexaploid origin of cultivated hexaploid oats.
cultivated hexaploid oat; GBS; domestication; origin; SNPs
本研究由國家自然科學基金項目(31571739)和西華師范大學博士科研啟動基金(17E081)項目資助。
This study was supported by the National Natural Science Foundation of China (31571739) and the Doctoral Scientific Research Foundation of West China Normal University (17E081).
顏紅海, E-mail: Honghai_yan@outlook.com; 彭遠英, E-mail: yy.peng@hotmail.com
E-mail: 410792146@qq.com
2018-12-24;
2019-05-12;
2019-07-06.
10.3724/SP.J.1006.2019.81091
URL: http://kns.cnki.net/kcms/detail/11.1809.s.20190706.0909.002.html