魏大勇 崔藝馨 梅家琴 湯青林 李加納 錢 偉,*
?
油菜種子含油量GWAS分析及位點(diǎn)整合系統(tǒng)構(gòu)建
魏大勇1,2,3崔藝馨3,4梅家琴3,4湯青林1,2李加納3,4錢 偉3,4,*
1西南大學(xué)園藝園林學(xué)院, 重慶 400715;2南方山地園藝學(xué)教育部重點(diǎn)實(shí)驗(yàn)室, 重慶 400715;3西南大學(xué)農(nóng)學(xué)與生物科技學(xué)院, 重慶 400715;4西南大學(xué)現(xiàn)代農(nóng)業(yè)科學(xué)研究院, 重慶 400715
含油量是油菜最重要的性狀之一, 目前已有較多的油菜種子含油量定位研究, 然而各研究系統(tǒng)相對(duì)獨(dú)立, 群體與標(biāo)記的差別使得難以比較不同研究結(jié)果。本研究連續(xù)4年種植了一個(gè)含308份材料的油菜自然群體, 結(jié)合60K SNP芯片數(shù)據(jù)對(duì)種子含油量進(jìn)行了全基因組關(guān)聯(lián)分析(GWAS), 并將所鑒定的顯著位點(diǎn)與早前2個(gè)自然群體及10個(gè)分離群體鑒定到的位點(diǎn)進(jìn)行全基因組比較與整合。結(jié)果顯示, 通過GWAS共檢測到8個(gè)與種子含油量顯著關(guān)聯(lián)的位點(diǎn), 單個(gè)位點(diǎn)解釋的表型變異度為3.22%~5.13%; 結(jié)合其他12個(gè)群體的定位結(jié)果, 共獲得193個(gè)油菜含油量整合位點(diǎn), 分布于油菜的所有19條染色體, A亞基因組平均每條染色體有13個(gè)位點(diǎn), 顯著高于C亞基因組(7個(gè))。對(duì)不同群體鑒定結(jié)果的比較發(fā)現(xiàn), 7個(gè)整合區(qū)間能在至少3個(gè)群體中被檢測到, 均位于A亞基因組染色體(A01、A02、A03、A06、A08、A09和A10)上, 其中有3個(gè)與C亞基因組上的區(qū)間存在同源性, 在這3個(gè)區(qū)間中共鑒定到26個(gè)已知的油脂代謝相關(guān)基因。本研究將193個(gè)位點(diǎn)錨定到法國公布的甘藍(lán)型油菜參考基因組, 構(gòu)建了一個(gè)可視的油菜種子含油量位點(diǎn)全基因組整合系統(tǒng), 可為油菜種子含油量重要位點(diǎn)的確定提供幫助, 并為制定提高油菜種子含油量的育種方案提供參考。
甘藍(lán)型油菜; 種子含油量; 全基因組關(guān)聯(lián)分析; QTL; 整合系統(tǒng)
我國目前食用植物油自給率不足40%, 60%以上依賴進(jìn)口, 嚴(yán)重威脅著國家食用油供給安全[1]。菜籽油是健康的食用植物油, 是發(fā)展生物柴油最具潛力的原料。甘藍(lán)型油菜(L.)是我國主要的油料作物, 種植面積和總產(chǎn)均居世界首位[2], 美國農(nóng)業(yè)部(http://apps.fas.usda.gov/ psdonline/)最新數(shù)據(jù)顯示, 2016—2017年度我國油菜播種面積大約為700萬公頃, 產(chǎn)量大約為1350萬噸, 缺口依然很大, 油菜籽進(jìn)口量可能達(dá)到450萬噸[3]。因此, 油菜種子含油量研究對(duì)于提高油菜含油量、緩解我國油料產(chǎn)業(yè)和食用植物油的短缺具有重要意義。
油菜種子含油量是一個(gè)由多基因控制的復(fù)雜數(shù)量性狀, 易受環(huán)境影響[4-6]。前人通過基于分離群體的QTL定位和基于自然群體的SNP鑒定, 將油菜種子含油量相關(guān)位點(diǎn)錨定在19條染色體上[7-16]。分離群體QTL定位中, Delourme等[7]利用DY和RNSL 2個(gè)雙單倍體(doubled haploid, DH)群體, 發(fā)現(xiàn)一個(gè)位點(diǎn)在兩群體A03連鎖群上能同時(shí)被檢測到; Yan等[8]以黃籽高油GH06和黑籽低油P174構(gòu)建重組自交系(recombinant inbred lines, RIL)群體GP-RIL, 檢測到11個(gè)QTL, 單個(gè)位點(diǎn)可解釋5.19%~13.57%的表型變異; Shi等[9]利用一個(gè)重新構(gòu)建的F2(reconstructed, RC-F2)群體, 在3個(gè)環(huán)境下檢測到43個(gè)QTL; Zhao等[11]利用歐洲春性品種Sollux和中國半冬性品種Gaoyou兩個(gè)種子高含油量油菜品種構(gòu)建SG-DH群體, 檢測到9個(gè)顯著的QTL, 共解釋57.79%的表型變異; Sun等[10]以中國半冬性高油材料Zy036和低油材料51070為親本構(gòu)建Z5-DH群體, 結(jié)合3年3點(diǎn)表型數(shù)據(jù), 共檢測到12個(gè)QTL, 其中位于A02和A09染色體的QTL能被重復(fù)檢測到; Wang等[12]利用種子含油量差異大于10%的2個(gè)中國油菜品種構(gòu)建KN-DH群體, 在11條染色體上共檢測到24個(gè)整合的QTL; Jiang等[13]以歐洲冬性品種Tapidor和中國半冬性品種寧油7號(hào)為親本構(gòu)建TH-DH群體, 共識(shí)別46個(gè)QTL, 分布在16條染色體上, 其中18個(gè)QTL在早前報(bào)道的多個(gè)群體中得到驗(yàn)證; Javed等[14]利用加拿大2個(gè)春性材料構(gòu)建PT-DH群體, 檢測到14個(gè)QTL, 其中A10染色體上的1個(gè)QTL解釋26.99%的表型變異; Fu等[16]以歐洲冬性品種Express和中國半冬性品種SWU07為親本構(gòu)建ES-DH群體, 在中國和德國2個(gè)環(huán)境下共鑒定到19個(gè)QTL。
隨著甘藍(lán)型油菜參考基因組的公布[17]和基因組測序費(fèi)用的持續(xù)降低, 基于自然群體的全基因組關(guān)聯(lián)分析(genome-wide association study, GWAS)已被廣泛用于解析復(fù)雜農(nóng)藝性狀的研究[15-16,18-20]。在油菜種子含油量方面, Liu等[15]基于油菜60K SNP芯片, 通過3種模型在521份油菜自然群體中鑒定到50個(gè)與種子含油量顯著相關(guān)的SNP, 共解釋80%的表型變異, 其中新發(fā)現(xiàn)29個(gè)位點(diǎn); Fu等[16]通過標(biāo)記-性狀關(guān)聯(lián)分析在142份油菜自然群體中, 鑒定到23個(gè)位點(diǎn)。
上述油菜種子含油量性狀的定位研究彼此相對(duì)獨(dú)立, 群體分類、標(biāo)記名稱和QTL閾值的設(shè)定等不盡相同, 更缺乏一個(gè)參考系統(tǒng)對(duì)不同群體定位結(jié)果比較分析。本研究一方面采用一個(gè)甘藍(lán)型油菜自然群體, 結(jié)合60K SNP芯片和4年的表型數(shù)據(jù)進(jìn)行種子含油量GWAS分析, 鑒定與種子含油量相關(guān)的SNP位點(diǎn); 另一方面將本研究鑒定的顯著SNP位點(diǎn)與185個(gè)前人報(bào)道的整合位點(diǎn)(來源于2006—2017年的10個(gè)分離群體和2個(gè)自然群體)錨定到法國公布的甘藍(lán)型油菜品種“Darmor-”的基因組上, 對(duì)不同群體、不同環(huán)境和不同分析方法鑒定的位點(diǎn)進(jìn)行全基因組水平比較分析。本研究可為通過分子標(biāo)記輔助選擇提高油菜種子含油量提供參考。
308份具有廣泛變異的甘藍(lán)型油菜(L.)自交系由重慶市油菜工程技術(shù)研究中心提供, 于2013—2016連續(xù)4年種植于中心試驗(yàn)地(重慶北碚), 3行區(qū)播種, 每行10株, 每年2次田間重復(fù), 田間管理按照當(dāng)?shù)爻R?guī)方式進(jìn)行。采用福斯(FOSS)近紅外光譜分析儀(NIR System, TR-3750)測定上述自然群體的自交種子含油量, 每份材料測定3株, 每袋樣品重復(fù)測定2次。采用SAS軟件(版本9.13)[21]對(duì)表型數(shù)據(jù)進(jìn)行方差分析。
魏大勇等[22]對(duì)該自然群體材料進(jìn)行了基因型分型和群體結(jié)構(gòu)分析?;蛐头中头椒ㄊ? 于苗期提取每份材料的DNA, 利用Illumina公司開發(fā)的60K SNP芯片進(jìn)行雜交, 得到的SNP探針序列與法國公布的甘藍(lán)型油菜品種“Darmor-”的基因組V4.1 (http://www.genoscope.cns.fr/ brassicanapus/data/)進(jìn)行本地BlastN, 獲得23 489個(gè)定位到唯一染色體上的SNP用于群體結(jié)構(gòu)分析和本研究的GWAS。群體結(jié)構(gòu)分析顯示, 308份油菜被分為3個(gè)亞群, 亞群1主要由冬性材料構(gòu)成, 亞群2主要是春性材料, 而半冬性材料主要構(gòu)成了亞群3, 該結(jié)果與生態(tài)類型基本一致[22]。
利用R語言的GenABEL包[23]對(duì)多年多點(diǎn)自然群體材料的種子含油量進(jìn)行GWAS分析, 采用主成分分析(principal component analysis, PCA) +親緣關(guān)系(kinship, K)的混合線性模型(mixed linear model, MLM)對(duì)性狀和標(biāo)記進(jìn)行關(guān)聯(lián)位點(diǎn)的檢測, 閾值設(shè)定為< 4.26×10–5(1/所使用的標(biāo)記, –lg=4.37)。通過R語言的p.adjusted命令計(jì)算假陽性率(false discovery rate, FDR)。將與顯著SNP處于同一單體型塊(2> 0.5)的區(qū)間定義為候選關(guān)聯(lián)區(qū)間, 在此區(qū)間參考以下標(biāo)準(zhǔn)預(yù)測候選基因: (1)在甘藍(lán)型油菜或擬南芥參考基因組上與性狀相關(guān)的已知功能的基因; (2) SNP直接落在基因內(nèi)部; (3)參考已報(bào)道QTL定位的結(jié)果。
收集了從2006—2017年共10個(gè)分離群體和2個(gè)自然群體的種子含油量定位結(jié)果[7-16], 對(duì)于分離群體, 將QTL區(qū)間側(cè)翼引物序列與法國公布的油菜基因組V4.1進(jìn)行本地BlastN, 記錄比對(duì)到唯一染色體物理位置的標(biāo)記, 若物理位置存在交集, 則對(duì)標(biāo)記進(jìn)行整合。對(duì)于自然群體, 直接記錄與表型顯著關(guān)聯(lián)的SNP位置。將上述所有位點(diǎn)利用Perl語言, 整合在Circos圖上[24], 對(duì)不同研究者定位的結(jié)果進(jìn)行比較分析。
連續(xù)4年的表型鑒定, 油菜自然群體的種子含油量存在廣泛變異, 變異范圍介于24.50%~ 49.91%, 各年度變異系數(shù)介于8.79%~10.24% (表1)。頻率分布顯示, 4年的種子含油量均表現(xiàn)為連續(xù)的近正態(tài)分布(圖1), 表明油菜種子含油量是一個(gè)數(shù)量性狀, 受多基因控制。方差分析結(jié)果表明, 基因型、環(huán)境以及基因型與環(huán)境互作間都存在顯著差異(<0.01), 年度間的相關(guān)性達(dá)到顯著水平(= 0.31~0.57,<0.01), 說明該性狀易受環(huán)境影響, 但材料之間的比較具有一定的穩(wěn)定性。
為了降低年際間的環(huán)境影響, 采用Merk等[25]方法對(duì)4年表型數(shù)據(jù)進(jìn)行最佳線性無偏預(yù)測(best linear unbiased prediction, BLUP), 估計(jì)種子含油量的BLUP值, 同時(shí)結(jié)合自然群體的SNP基因型數(shù)據(jù)進(jìn)行GWAS分析。
GWAS分析共檢測到8個(gè)SNP與種子含油量顯著關(guān)聯(lián), 分別分布在A02、A03、A05和C02染色體上, 單個(gè)位點(diǎn)解釋的表型變異為3.22%~ 5.13% (表2), Q-Q (quantile-quantile)圖顯示該模型很好地控制了假陽性概率的產(chǎn)生(圖2)。根據(jù)位點(diǎn)間的連鎖不平衡(2> 0.5), 在上述8個(gè)SNP構(gòu)成的單體型塊內(nèi)預(yù)測到6個(gè)候選基因, 除了候選基因, 其他5個(gè)都屬于已知的油脂代謝相關(guān)基因。
表1 308份自然群體中油菜種子含油量的表型變異
圖1 種子含油量的頻率分布
表2 GWAS結(jié)果和候選基因預(yù)測
對(duì)本研究及2006—2017年已報(bào)道的與油菜種子含油量相關(guān)的10篇文獻(xiàn)進(jìn)行整理(表3), 用10個(gè)分離群體(包括8個(gè)DH群體、1個(gè)RIL群體和1個(gè)RC-F2群體)共檢測到105個(gè)整合的位點(diǎn), 平均每個(gè)群體11個(gè), TN-DH群體鑒定到的位點(diǎn)最多(27個(gè))。用3個(gè)自然群體共鑒定到88個(gè)位點(diǎn), 平均每個(gè)自然群體18個(gè)。所有193個(gè)位點(diǎn)在油菜的19條染色體上都有分布, 其中A03染色體分布最多(25個(gè)), C05染色體分布最少(2個(gè)), A亞基因組每條染色體平均有13個(gè), 顯著高于C亞基因組的7個(gè)。
對(duì)A和C亞基因組上的整合區(qū)間比較發(fā)現(xiàn), 2個(gè)亞基因組上存在12組部分同源的整合區(qū)間, 分別分布在A01/C01 (3組)、A02/C02 (2組)、A03/ C03 (1組)、A05/C05 (1組)、A08/C03 (1組)、A08/ C08 (2組)、A09/C08 (1組)和A10/C09 (1組)(圖3)。
圖2 種子含油量的全基因組關(guān)聯(lián)分析
a: 種子含油量的曼哈頓圖, 水平黑色虛線表示閾值(1/23490, –lg= 4.37); b: 估計(jì)閾值的Q-Q圖。
a: Manhattan plot of seed oil content, the horizontal dashed black line represents the significant threshold (1/23490, –lg= 4.37); b: Q-Q plot of estimated threshold.
圖3 全基因組組水平展示不同油菜群體種子含油量的定位結(jié)果
(a)染色體數(shù)目; (b)參考基因組所有基因的熱圖(窗口大小為500 kb); (c)已知的1663個(gè)油分代謝相關(guān)基因; (1) DY-DH群體; (2) RNSL-DH群體; (3) GP-RIL群體; (4) RC-F2群體; (5) SG-DH群體; (6) Z5-DH群體; (7) KN-DH群體; (8) TN-DH群體; (9)PT-DH群體; (10) 521份自然群體1; (11) 521份自然群體2; (12) 521份自然群體3; (13) ES-DH群體; (14) 142份自然群體4; (15) 308份自然群體。中間不同顏色線條表示A和C亞基因組上存在同源關(guān)系的12組整合區(qū)間。
(a) chromosome number; (b) heat map of all genes in reference genome (window size is 500 kb); (c) 1663 known oil metabolic genes; (1) DY-DH population; (2) RNSL-DH population; (3) GP-RIL population; (4) RC-F2population; (5) SG-DH population; (6) Z5-DH population; (7) KN-DH population; (8) TN-DH population; (9) PT-DH population; (10) 521 natural population 1; (11) 521 natural population 2; (12) 521 natural population 3; (13) ES-DH population; (14) 142 natural population 4; (15) 308 natural population 5. Lines in the middle indicate the homology of integrated loci between the A and the C subgenomes.
對(duì)不同群體鑒定的位點(diǎn)比較分析發(fā)現(xiàn), 7個(gè)整合區(qū)間至少在3個(gè)不同群體中都能重復(fù)檢測到(視為遺傳較穩(wěn)定的位點(diǎn)), 分別位于A01、A02、A03、A06、A08、A09和A10染色體(表4)。其中位于A02、A08和A10染色體上的3個(gè)區(qū)間, 分別能在C2、C8和C9染色體找到部分同源的整合區(qū)間(圖4)。在7個(gè)整合的區(qū)間共發(fā)現(xiàn)44個(gè)已知的油脂代謝相關(guān)基因[17], 其中上述3個(gè)區(qū)間含26個(gè)。
表4 甘藍(lán)型油菜遺傳穩(wěn)定的種子含油量位點(diǎn)染色體分布及油脂代謝相關(guān)基因
1)參考Chalhoub等[17]文獻(xiàn)中所報(bào)道的基因。1)Known genes related to oil metabolism according to Chalhoub et al.[17]
甘藍(lán)型油菜種子含油量的定位已有很多報(bào)道[4, 6-16], 但缺乏一個(gè)共同的參考系統(tǒng), 不同研究結(jié)果的比較有較大難度。Jiang等[13]將3個(gè)分離群體(DY、RNSY和SG-DH群體)的標(biāo)記與TN-DH群體整合, 構(gòu)建了一個(gè)包含12條染色體的QTL定位整合系統(tǒng), 檢測到12個(gè)整合的QTL區(qū)間。但該QTL系統(tǒng)使用的是遺傳距離, 并不能與自然群體的定位結(jié)果有效整合。本研究利用法國公布的油菜參考基因組信息, 將自己的種子含油量定位結(jié)果與其他12個(gè)不同群體的定位結(jié)果整合, 構(gòu)建了一個(gè)含193個(gè)油菜種子含油量位點(diǎn)的全基因組整合系統(tǒng)(簡稱為整合系統(tǒng))。該整合系統(tǒng)的特點(diǎn)在于, 根據(jù)物理位置對(duì)多個(gè)研究中的含油量位點(diǎn)進(jìn)行比較, 能準(zhǔn)確和直觀地判斷位點(diǎn)間的位置關(guān)系。比如該系統(tǒng)發(fā)現(xiàn)12對(duì)整合區(qū)間在A和C亞基因組存在部分同源性, 除了A10/C09上的一對(duì)是在同一個(gè)群體中鑒定到的[16], 其余都是來自于不同群體的鑒定結(jié)果, 這說明該整合系統(tǒng)確實(shí)可以對(duì)不同研究做出充分的比較(不受群體與標(biāo)記類型的限制)。
該系統(tǒng)可以直觀體現(xiàn)各位點(diǎn)被不同研究鑒定出的概率, 從而為確定位點(diǎn)的重要程度(提高種子含油量的潛力)提供參考。根據(jù)該整合系統(tǒng), 我們發(fā)現(xiàn)7個(gè)被多個(gè)群體重復(fù)鑒定到的區(qū)間, 其中3個(gè)區(qū)間在C亞基因組上能找到同源的區(qū)間, 說明這些區(qū)間可能相對(duì)普遍存在于油菜中, 它們對(duì)油菜種子含油量可能有比較重要的貢獻(xiàn), 因此對(duì)這些位點(diǎn)的精細(xì)定位和功能基因鑒定, 對(duì)于解析油菜種子含油量的調(diào)控機(jī)制有重要意義。
甘藍(lán)型油菜A亞基因組上存在的含油量位點(diǎn)數(shù)目顯著高于C亞基因組, 并且被多個(gè)群體重復(fù)鑒定到的位點(diǎn)都分布在A亞基因組上, 這種情況的出現(xiàn)可能與油菜的起源與馴化有關(guān)。油菜起源于白菜(, AA)與甘藍(lán)(, CC)的雜交與染色體加倍[26], 與甘藍(lán)相比, 白菜籽粒具有更多對(duì)含油量有利的性狀, 如種皮更薄、色澤更淺等, 因此油菜從誕生之初就可能在A和C亞基因組上存在不對(duì)等的影響含油量的位點(diǎn)數(shù)。此外, 在自然條件下以及人類的馴化過程中, 甘藍(lán)型油菜很容易與各類白菜雜交, 從而使更多的A基因組遺傳成分滲透到甘藍(lán)型油菜中, 并且對(duì)性狀有利的位點(diǎn)在馴化過程中得以保留。而甘藍(lán)型油菜與甘藍(lán)雜交困難, 即使從C基因組上找到有利位點(diǎn), 其向甘藍(lán)型油菜中導(dǎo)入或滲透也存在一定難度。與此同時(shí), 油菜群體遺傳學(xué)研究發(fā)現(xiàn), C亞基因組連鎖不平衡衰退距離顯著高于A亞基因組[27-28], 可能導(dǎo)致C亞基因組上含油量相關(guān)位點(diǎn)缺乏變異, 沒有被檢測到。
綜上所述, 從鑒定現(xiàn)有遺傳穩(wěn)定位點(diǎn)的功能基因、聚合多個(gè)現(xiàn)有的含油量位點(diǎn)、由親本物種(甚至其他物種)中導(dǎo)入新的優(yōu)異位點(diǎn)(基因)、打破油菜C亞基因組強(qiáng)選擇瓶頸等入手, 油菜的種子含油量有望得到進(jìn)一步提高。
將GWAS檢測到的8個(gè)與油菜種子含油量顯著關(guān)聯(lián)的位點(diǎn)與其他12個(gè)油菜群體的定位結(jié)果整合, 構(gòu)建了一個(gè)包含193個(gè)油菜種子含油量位點(diǎn)的基因組圖, 鑒定到7個(gè)遺傳穩(wěn)定的含油量區(qū)間, 為提高油菜種子含油量育種提供了參考。
[1] 王漢中. 我國油菜產(chǎn)業(yè)發(fā)展的歷史回顧與展望. 中國油料作物學(xué)報(bào), 2010, 32: 300–302 Wang H Z. Review and future development of rapeseed industry in China., 2010, 32: 300–302 (in Chinese with English abstract)
[2] 李殿榮, 鄭磊, 李少欽. 近十三年我國冬油菜新品種單產(chǎn)與含油量的變化分析. 種子, 2014, 33: 96–100 Li D R, Zheng L, Li S Q. The development analysis on yield and oil content of winter rapeseed varieties inL. from 2000 to 2012 in China., 2014, 33: 96–100 (in Chinese with English abstract)
[3] Hu Q, Hua W, Yin Y, Zhang X, Liu L, Shi J, Zhao Y, Qin L, Chen C, Wang H. Rapeseed research and production in China., 2017, 5: 127–135
[4] 李超, 李波, 曲存民, 閻星穎, 付福友, 劉列釗, 諶利, 李加納. 兩種環(huán)境下甘藍(lán)型油菜含油量的差值QTL分析. 作物學(xué)報(bào), 2011, 37: 249–254Li C, Li B, Qu C M, Yan X Y, Fu F Y, Liu L Z, Chen L, Li J N. Analysis of difference QTLs for oil content between two environments inL., 2011, 37: 249–254 (in Chinese with English abstract)
[5] 劉后利. 油菜遺傳育種學(xué). 北京: 中國農(nóng)業(yè)大學(xué)出版社, 2000. pp 146–154 Liu H L. Genetics and Breeding in Rrapeseed. Beijing: Chinese Agricultural Universitatis Press, 2000. pp 146–154 (in Chinese with English abstract)
[6] 馬珍珍, 李加納, Wittkop B, Frauen M, 閻星穎, 劉列釗, 肖陽. 甘藍(lán)型油菜籽粒含油量、蛋白質(zhì)、纖維素及半纖維素含量QTL分析. 作物學(xué)報(bào), 2013, 39: 1214–1222 Ma Z Z, Li J N, Wittkop B, Frauen M, Yan X Y, Liu L Z, Xiao Y. QTL mapping for oil, protein, cellulose, and hemicellulose contents in seeds ofL., 2013, 39: 1214–1222 (in Chinese with English abstract)
[7] Yan R, Falentin C, Huteau V, Clouet V, Horvais R, Gandon B, Specel S, Hanneton L, Dheu J E, Deschamps M, Margale E, Vincourt P, Renard M. Genetic control of oil content in oilseed rape (L.)., 2006, 113: 1331–1345
[8] Yan X Y, Li J N, Fu F Y, Jin M Y, Chen L, Liu L Z. Co-location of seed oil content, seed hull content and seed coat color QTL in three different environments inL., 2009, 170: 355–364
[9] Shi J, Li R, Zou J, Yan L, Meng J. A dynamic and complex network regulates the heterosis of yield-correlated traits in rapeseed (L.)., 2011, 6: e21645
[10] Sun M, Hua W, Liu J, Huang S, Wang X, Liu G, Wang H. Design of new genome- and gene-sourced primers and identification of QTL for seed oil content in a specially high-oilcultivar., 2012, 7: e47037
[11] Zhao J, Huang J, Chen F, Xu F, Ni X, Xu H, Wang Y, Jiang C, Wang H, Xu A, Huang R, Li D, Meng J. Molecular mapping oflipid-related orthologous genes in., 2012, 124: 407–421
[12] Wang X, Hao W, Yan L, Li D, Yin Y, Tian J, Li C, Liu L, Zhao W, Zhao Y. Identification of QTLs associated with oil content in a high-oilcultivar and construction of a high-density consensus map for QTLs comparison in., 2013, 8: e80569
[13] Jiang C, Shi J, Li R, Long Y, Wang H, Li D, Zhao J, Meng J. Quantitative trait loci that control the oil content variation of rapeseed (L.)., 2014, 127: 957–968
[14] Javed N, Geng J, Tahir M, McVetty P B E, Li G, Duncan R W. Identification of QTL influencing seed oil content, fatty acid profile and days to flowering inL., 2015, 207: 191–211
[15] Liu S, Fan C, Li J, Cai G, Yang Q, Wu J, Yi X, Zhang C, Zhou Y. A genome-wide association study reveals novel elite allelic variations in seed oil content of Brassica napus., 2016, 129: 1203–1215
[16] Fu Y, Zhang D, Gleeson M, Zhang Y, Lin B, Hua S, Ding H, Frauen M, Li J, Qian W, Yu H. Analysis of QTL for seed oil content inby association mapping and QTL mapping., 2017, 213: 17
[17] Chalhoub B, Denoeud F, Liu S, Parkin I A, Tang H, Wang X, Chiquet J, Belcram H, Tong C, Samans B, Correa M, Da Silva C, Just J, Falentin C, Koh C S, Le Clainche I, Bernard M, Bento P, Noel B, Labadie K, Alberti A, Charles M, Arnaud D, Guo H, Daviaud C, Alamery S, Jabbari K, Zhao M, Edger P P, Chelaifa H, Tack D, Lassalle G, Mestiri I, Schnel N, Le Paslier M C, Fan G, Renault V, Bayer P E, Golicz A A, Manoli S, Lee T H, Thi V H, Chalabi S, Hu Q, Fan C, Tollenaere R, Lu Y, Battail C, Shen J, Sidebottom C H, Wang X, Canaguier A, Chauveau A, Berard A, Deniot G, Guan M, Liu Z, Sun F, Lim Y P, Lyons E, Town C D, Bancroft I, Wang X, Meng J, Ma J, Pires J C, King G J, Brunel D, Delourme R, Renard M, Aury J M, Adams K L, Batley J, Snowdon R J, Tost J, Edwards D, Zhou Y, Hua W, Sharpe A G, Paterson A H, Guan C, Wincker P. Early allopolyploid evolution in the post-Neolithicoilseed genome., 2014, 345: 950–953
[18] Li F, Chen B Y, Xu K, Wu J F, Song W L, Bancroft I, Harper A L, Trick M, Liu S Y, Gao G Z, Wang N, Yan G X, Qiao J W, Li J, Li H, Xiao X, Zhang T Y, Wu X M. Genome-wide association sudy dissects the genetic architecture of seed weight and seed quality in rapeseed (L.)., 2014, 21: 355–367
[19] Wei D, Cui Y, He Y, Xiong Q, Qian L, Tong C, Lu G, Ding Y, Li J, Jung C, Qian W. A genome-wide survey with different rapeseed ecotypes uncovers footprints of domestication and breeding., 2017, 68: 4791–4801
[20] Wei L, Jian H, Lu K, Filardo F, Yin N, Liu L, Qu C, Li W, Du H, Li J. Genome-wide association analysis and differential expression analysis of resistance to Sclerotinia stem rot in., 2015: 1–13
[21] SASV9.13 software. SAS Institute, Cary, NC, USA, 2005
[22] 魏大勇, 譚傳東, 崔藝馨, 吳道明, 李加納, 梅家琴, 錢偉. 甘藍(lán)型油菜CMS育性恢復(fù)位點(diǎn)的全基因組關(guān)聯(lián)分析. 中國農(nóng)業(yè)科學(xué), 2017, 50: 802–819 Wei D Y, Tan C D, Cui Y X, Wu D M, Li J N, Mei J Q, Qian W. Genome-wide association study of the fertility restorer loci forCMS in rapeseed (L.)., 2017, 50: 802–819 (in Chinese with English abstract)
[23] Aulchenko Y S, Ripke S, Isaacs A, Van Duijn C M. GenABEL: an R library for genome-wide association analysis., 2007, 23: 1294–1296
[24] Krzywinski M, Schein J, Birol I, Connors J, Gascoyne R, Horsman D, Jones S J, Marra M A. Circos: an information aesthetic for comparative genomics., 2009, 19: 1639–1645
[25] Merk H L, Yarnes S C, Van Deynze A, Tong N K, Menda N, Mueller L A, Mutschler M A, Loewen S A, Myers J R, Francis D M. Trait diversity and potential for selection indices based on variation among regionally adapted processing tomato germplasm., 2012, 137: 427–437
[26] NU. Genomic analysis inwith special reference to the experimental formation ofand peculiar bode of fertilization., 1935, 7: 389–452
[27] Qian L, Qian W, Snowdon R J. Sub-genomic selection patterns as a signature of breeding in the allopolyploidgenome., 2014, 15: 1170
[28] Wang N, Li F, Chen B, Xu K, Yan G, Qiao J, Li J, Gao G, Bancroft I, Meng J, King G J, Wu X. Genome-wide investigation of genetic changes during modern breeding of., 2014, 127: 1817–1829
Genome-wide Association Study on Seed Oil Content in Rapeseed and Construction of Integration System for Oil Content Loci
WEI Da-Yong1,2,3, CUI Yi-Xin3,4, MEI Jia-Qin3,4, TANG Qing-Lin1,2, LI Jia-Na3,4, and QIAN Wei3,4,*
1College of Horticulture and Landscape Architecture, Southwest University, Chongqing 400715, China;2Key Laboratory of Horticulture Science for Southern Mountainous Regions, Ministry of Education, Chongqing 400715, China;3College of Agronomy and Biotechnology, Southwest University, Chongqing 400715, China;4Academy of Agricultural Sciences, Southwest University, Chongqing 400715, China
Genetic loci for oil content, one of the most important traits of rapeseed (L.), have been widely studied, however, comparisons were difficult to be carried out among studies due to different mapping populations and molecular marker systems. In the present study, a 60KSNP array was applied in the genome-wide association study (GWAS) using a natural rapeseed population which was comprised of 308 accessions and grown for four consecutive years to identify loci for seed oil content. An integration system was built by anchoring the present loci and previous loci that identified onto the rapeseed genome in other studies using ten segregation populations and two natural populations. A total of eight SNPs significantly associated with seed oil contents of rapeseed were detected in our study, explaining 3.22%–5.13% of the phenotypic variance each SNP. Combining the data from other 12 populations, 193 integrated loci were identified, spreading on all 19 chromosomes ofwith more loci distributed on A subgenome (13 loci/chromosome) than C subgenome (seven loci/chromosome). Seven integrated intervals from A subgenome (chromosome A01, A02, A03, A06, A08, A09, and A10) were identified in at least three populations, of which three were homologous to intervals on C subgenome, with 26 known genes associated with seed oil metabolism. The 193 loci were anchored to the reference genome ofvar. Darmor-, resulting in a visualized genome-wide integrated system for seed oil content loci. This study is helpful to determine the important seed oil content loci and to make the optimal breeding strategy to increase oil content in rapeseed.
; seed oil content; genome-wide association study; QTL; integrated system
2018-01-30;
2018-06-09;
2018-06-11.
10.3724/SP.J.1006.2018.01311
錢偉, E-mail: qianwei666@hotmail.com, Tel: 023-68250701
E-mail: swuwdy@swu.edu.cn
本研究由西南大學(xué)博士基金項(xiàng)目(SWU118010), 國家自然科學(xué)基金項(xiàng)目(31601333), 國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973計(jì)劃)項(xiàng)目(2015CB150201)和中央高?;究蒲袠I(yè)務(wù)專項(xiàng)(XDJK2017B036)資助。
This study was supported by the Doctoral Fund of Southwest University (SWU118010), the National Natural Science Foundation of China (31601333), the National Basic Research Program of China (973 Program) (2015CB150201), and the Fundamental Research Funds for Central Universities (XDJK2017B036).
URL: http://kns.cnki.net/kcms/detail/11.1809.S.20180611.0904.006.html