周慶紅,周燦,鄭偉,付東輝
(1江西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院/作物生理生態(tài)與遺傳育種教育部重點(diǎn)實(shí)驗(yàn)室,南昌 330045;2江西省紅壤研究所,江西進(jìn)賢 331717)
甘藍(lán)型油菜角果長(zhǎng)度全基因組關(guān)聯(lián)分析
周慶紅1,周燦1,鄭偉2,付東輝1
(1江西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院/作物生理生態(tài)與遺傳育種教育部重點(diǎn)實(shí)驗(yàn)室,南昌 330045;2江西省紅壤研究所,江西進(jìn)賢 331717)
【目的】挖掘與油菜角果長(zhǎng)度性狀顯著相關(guān)的 SNP位點(diǎn)及候選基因,為揭示油菜角果長(zhǎng)度性狀的遺傳基礎(chǔ)和分子機(jī)制提供理論依據(jù),為油菜產(chǎn)量分子標(biāo)記輔助選擇育種奠定基礎(chǔ)?!痉椒ā吭诮鬓r(nóng)業(yè)大學(xué)試驗(yàn)地和江西省紅壤研究所試驗(yàn)地 2個(gè)環(huán)境下考察 300份甘藍(lán)型油菜自交系的角果長(zhǎng)度性狀,利用簡(jiǎn)化基因組測(cè)序技術(shù)(specific locus amplified fragment sequencing,SLAF-seq)對(duì)300份甘藍(lán)型油菜自交系基因組DNA進(jìn)行測(cè)序并分析,利用獲得的均勻分布于甘藍(lán)型油菜基因組上的201 817個(gè)群體SNP(single nucleotide polymorphism,SNP)對(duì)角果長(zhǎng)度性狀進(jìn)行全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS),探測(cè)與油菜角果長(zhǎng)度顯著相關(guān)的SNP位點(diǎn),并基于群體連鎖不平衡分析結(jié)果搜尋顯著SNP位點(diǎn)兩側(cè)100 kb范圍內(nèi)的基因,通過(guò)BLAST獲得關(guān)聯(lián)區(qū)域內(nèi)基因的注釋信息,根據(jù)注釋信息找出與性狀相關(guān)的候選基因?!窘Y(jié)果】農(nóng)大試驗(yàn)地角果長(zhǎng)度表型變異幅度為46.35—107.07 mm;紅壤所試驗(yàn)地角果長(zhǎng)度表型變異幅度為39.41—101.35 mm,兩性狀在2個(gè)環(huán)境下均表現(xiàn)出廣泛表型變異。通過(guò)一般線性模型(general linear model,GLM)關(guān)聯(lián)分析,農(nóng)大環(huán)境下共檢測(cè)到121個(gè)角果長(zhǎng)度顯著關(guān)聯(lián)的SNP位點(diǎn),分布在A04、A06、A08、A09、C02、C03、C06和C09等8條染色體上,其中,A09染色體上分布最多(83個(gè)SNP),紅壤所環(huán)境下檢測(cè)到22個(gè)角果長(zhǎng)度顯著關(guān)聯(lián)的SNP位點(diǎn),其中,1個(gè)在C09染色體上,其余21個(gè)均分布于A09染色體,在兩地探測(cè)到20個(gè)一致性SNP位點(diǎn);通過(guò)混合線性模型(mixed linear model,MLM)分析,農(nóng)大環(huán)境下共檢測(cè)到5個(gè)角果長(zhǎng)度顯著關(guān)聯(lián)的SNP位點(diǎn),其中,3個(gè)SNP位點(diǎn)與紅壤所環(huán)境下檢測(cè)到3個(gè)SNP位點(diǎn)一致,所有位點(diǎn)均位于A09染色體上。對(duì)MLM關(guān)聯(lián)分析得到的顯著SNP位點(diǎn)兩側(cè)100 kb區(qū)域內(nèi)基因進(jìn)行搜尋并進(jìn)行功能注釋,發(fā)現(xiàn)多個(gè)候選基因參與調(diào)節(jié)碳水化合物的運(yùn)輸與合成、花器官和種子的發(fā)育、信號(hào)轉(zhuǎn)導(dǎo)等, 它們可能通過(guò)上述功能影響油菜角果的生長(zhǎng),導(dǎo)致角果長(zhǎng)度的差異。【結(jié)論】通過(guò)GLM和MLM兩種分析方法探測(cè)到多個(gè)與油菜角果長(zhǎng)度性狀顯著關(guān)聯(lián)的基因位點(diǎn),并在顯著性位點(diǎn)附近搜尋到相關(guān)候選基因。
甘藍(lán)型油菜;全基因組關(guān)聯(lián)分析;角果長(zhǎng)度;SNP位點(diǎn);候選基因
【研究意義】油菜(主要指甘藍(lán)型油菜)是中國(guó)重要的油料作物。目前,菜籽油消費(fèi)約占中國(guó)食用植物油總消費(fèi)量的35%,但中國(guó)食用植物油60%以上卻依賴進(jìn)口[1],油菜產(chǎn)量的高低直接影響中國(guó)食用植物油的供給,因此,如何提高油菜產(chǎn)量一直是油菜育種和栽培最重要的目標(biāo)。角果長(zhǎng)度是油菜籽粒產(chǎn)量的重要決定因素和育種目標(biāo)性狀,明確其遺傳基礎(chǔ)對(duì)油菜產(chǎn)量提升具有重要意義?!厩叭搜芯窟M(jìn)展】角果對(duì)油菜產(chǎn)量形成起重要決定作用,它不僅是油菜吸收和積累葉片制造的光合產(chǎn)物的庫(kù)器官,而且還是為種子發(fā)育提供營(yíng)養(yǎng)的源器官[2]。在種子發(fā)育后期,油菜功能葉面積快速減少,綠色角果的光合作用成為種子發(fā)育所需營(yíng)養(yǎng)的主要來(lái)源[3]。另外,角果細(xì)胞壁還會(huì)傳送信號(hào)來(lái)調(diào)節(jié)油菜籽粒的填充速率及營(yíng)養(yǎng)物質(zhì)的再分配[4]。一般來(lái)說(shuō),較長(zhǎng)角果相對(duì)較短角果來(lái)說(shuō),會(huì)產(chǎn)生更多和更大的種子[5],通過(guò)特長(zhǎng)角果油菜品種培育可以提高油菜的產(chǎn)量潛力[6]。在油菜高產(chǎn)育種中角果長(zhǎng)度常被作為產(chǎn)量相關(guān)性狀進(jìn)行考察[7]。油菜的角果長(zhǎng)度是受多基因控制的數(shù)量性狀,前人采用雙親作圖群體對(duì)角果長(zhǎng)度性狀進(jìn)行了QTL定位研究,鑒定出多個(gè)控制角果長(zhǎng)度性狀變異的QTL,目前已在甘藍(lán)型油菜 15條染色體上探測(cè)到 30個(gè)以上角果長(zhǎng)度QTL,解釋的表型貢獻(xiàn)率從5.5%—53.4%不等[8-10]。但由于傳統(tǒng)QTL定位方法需要構(gòu)建專門(mén)的作圖群體,檢測(cè)到的等位基因位點(diǎn)僅來(lái)源于雙親材料,檢測(cè)到的基因位點(diǎn)數(shù)目偏少,因此應(yīng)用較為有限?!颈狙芯壳腥朦c(diǎn)】全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)是利用自然群體探測(cè)物種的遺傳變異,進(jìn)而挖掘與復(fù)雜農(nóng)藝性狀相關(guān)的遺傳位點(diǎn)的研究方法,具有不需構(gòu)建作圖群體和一次性可同時(shí)檢測(cè)多個(gè)等位基因位點(diǎn)的優(yōu)勢(shì),近年來(lái)已在水稻、玉米、小麥、大麥、擬南芥等作物中均有廣泛研究[11]。近幾年許多學(xué)者利用新開(kāi)發(fā)的蕓薹屬60K SNP(single nucleotide polymorphism)芯片技術(shù),對(duì)油菜籽粒產(chǎn)量及品質(zhì)相關(guān)性狀開(kāi)展了全基因組關(guān)聯(lián)分析研究,獲得了較多新的控制油菜相關(guān)性狀的基因位點(diǎn)[12-15]。而隨著甘藍(lán)型油菜基因組測(cè)序的完成[16],利用高通量數(shù)據(jù)對(duì)油菜復(fù)雜性狀開(kāi)展 GWAS研究越來(lái)越便利,SLAF-seq(specific-locus amplified fragment sequencing)技術(shù)作為一種新發(fā)展的簡(jiǎn)化基因組測(cè)序技術(shù),通過(guò)限制性內(nèi)切酶消化基因組 DNA,選取一定長(zhǎng)度的片段進(jìn)行測(cè)序,降低了基因組的復(fù)雜度,并且不依賴基因組序列,一次測(cè)序可以獲得數(shù)以百萬(wàn)計(jì)的SNP[17],另外,與芯片相比,高通量測(cè)序可以檢測(cè)基因組上未知變異位點(diǎn)中新的SNP,因而,采用SLAF-seq技術(shù)開(kāi)發(fā)SNP并用于全基因組關(guān)聯(lián)分析有望探測(cè)到較多 SNP位點(diǎn)和候選基因?!緮M解決的關(guān)鍵問(wèn)題】本研究以來(lái)源廣泛的300份甘藍(lán)型油菜自交系為關(guān)聯(lián)分析研究群體,并采用前期基于SLAF-seq技術(shù)開(kāi)發(fā)的201 817個(gè)SNP標(biāo)記對(duì)甘藍(lán)型油菜角果長(zhǎng)度性狀進(jìn)行全基因組關(guān)聯(lián)分析,旨在挖掘與之顯著相關(guān)的SNP位點(diǎn)及候選基因,為油菜產(chǎn)量分子標(biāo)記輔助選擇育種和油菜產(chǎn)量性狀遺傳調(diào)控提供理論依據(jù)。
1.1 試驗(yàn)材料
以300份具有獨(dú)立來(lái)源的甘藍(lán)型油菜自交系為材料,所有材料均由江西農(nóng)業(yè)大學(xué)作物生理生態(tài)與遺傳育種教育部重點(diǎn)實(shí)驗(yàn)室提供。
1.2 田間試驗(yàn)和數(shù)據(jù)統(tǒng)計(jì)
2014年9月28日,將300份甘藍(lán)型油菜自交系分別同時(shí)播種于江西農(nóng)業(yè)大學(xué)農(nóng)學(xué)試驗(yàn)田(簡(jiǎn)稱JXAU)和江西省紅壤研究所油菜試驗(yàn)田(簡(jiǎn)稱JXIRS),隨機(jī)區(qū)組設(shè)計(jì),每份材料種植一個(gè)小區(qū),每個(gè)小區(qū)種植3行,行距40 cm,株距20 cm,條播,于5—7葉期定苗,兩地各2個(gè)重復(fù)。田間管理同常規(guī)生產(chǎn),確保同一地區(qū)所有材料的生長(zhǎng)環(huán)境一致。待成熟時(shí),每小區(qū)取十株長(zhǎng)勢(shì)一致的植株,每株選取主花序中部的20個(gè)角果進(jìn)行角果長(zhǎng)度測(cè)量[18]。利用Excel和 DPS統(tǒng)計(jì)分析軟件對(duì)所得性狀的測(cè)定值進(jìn)行統(tǒng)計(jì)分析,包括計(jì)算每個(gè)表型性狀的平均值、標(biāo)準(zhǔn)差、變異系數(shù)等。
1.3 基因型測(cè)序分型
利用簡(jiǎn)化基因組測(cè)序技術(shù)(specific locus amplified fragment sequencing,SLAF-seq)對(duì)300份甘藍(lán)型油菜自交系基因組DNA進(jìn)行測(cè)序并分析。具體做法是以公開(kāi)的甘藍(lán)型油菜品種“Darmor-Bzh”的基因組測(cè)序信息為參考[16],進(jìn)行電子酶切預(yù)測(cè),根據(jù)酶切方案選擇原則確定以RsaⅠ+HaeⅢ進(jìn)行酶切,篩選酶切片段長(zhǎng)度在 314—414 bp的序列并定義為SLAF標(biāo)簽,結(jié)合通過(guò)生物信息學(xué)分析,共獲得529 080個(gè)SLAF標(biāo)簽,其中多態(tài)性的SLAF標(biāo)簽共有238 711個(gè),由此得到1 197 282個(gè)群體SNP。再根據(jù)次等位基因頻率(minor allele frequency,MAF)>0.05和完整度(即非N的SNP位點(diǎn)數(shù)占總SNP位點(diǎn)的比例)>0.8對(duì)SNP進(jìn)行篩選,最終得到均勻分布于甘藍(lán)型油菜19條染色體上的201 817個(gè)高質(zhì)量且位置唯一的群體SNP用于后續(xù)分析(數(shù)據(jù)在另文中待發(fā)表)。
1.4 連鎖不平衡分析
通過(guò)在同一個(gè)染色體的SNP組合,分析SNP在所有樣品中的連鎖情況和LD衰退距離,其連鎖強(qiáng)度以D′或r2表示,采用PLINK2軟件(http://www.coggenomics.org/plink2/)分析所有材料的連鎖不平衡和LD衰退情況。依據(jù)PURCELL等[19]報(bào)道,參數(shù)設(shè)定為:MAF>0.05,r2,ld-window 999999,ld-window-r20。本研究選用r2等于0.1的數(shù)據(jù)作為連鎖不平衡的衰減(LD decay)的數(shù)值[20]。
1.5 角果長(zhǎng)度性狀全基因組關(guān)聯(lián)分析
基于前期DNA測(cè)序開(kāi)發(fā)的201 817個(gè)群體SNP,利用TASSEL軟件[21]的GLM模型和MLM模型得到與2個(gè)性狀的關(guān)聯(lián)值,通過(guò)SPAGeDi[22]軟件計(jì)算樣品間親緣關(guān)系K,通過(guò) admixture軟件[23]計(jì)算樣品群體結(jié)構(gòu)Q,一般線性模型使用Q群體結(jié)構(gòu)信息,而混合線性模型使用Q+K即群體結(jié)構(gòu)和親緣關(guān)系的信息?;诠剑╕=Xα+Qβ+Kμ+e)(X為基因型,Y為表型),計(jì)算最終每個(gè) SNP位點(diǎn)所對(duì)應(yīng)的關(guān)聯(lián)值 P。利用GGplot2軟件[24]做出 Quantile-Quantile散點(diǎn)圖(Q-Q plot),利用QQman繪制曼哈頓(Manhattan)圖[25],用Manhattan圖來(lái)顯示關(guān)聯(lián)分析后每個(gè)位點(diǎn)的顯著性,其中,Manhattan圖顯著關(guān)聯(lián)SNP閾值取為0.1/SNP總數(shù)目的負(fù)對(duì)數(shù),本試驗(yàn)計(jì)算結(jié)果約等于6.2,極顯著位點(diǎn)閾值為多重假設(shè)檢驗(yàn)(FDR檢驗(yàn))的顯著性閾值。
1.6 候選基因預(yù)測(cè)
將與角果長(zhǎng)度性狀緊密連鎖的SNP位點(diǎn),根據(jù)序列位置將其定位到油菜基因組參考物理圖譜上[16]?;谌后w連鎖不平衡分析結(jié)果確定搜尋每個(gè) SNP位點(diǎn)兩側(cè)100 kb范圍內(nèi)的基因,利用BLAST軟件將關(guān)聯(lián)區(qū)域內(nèi)基因分別與NR、SwissProt、GO、COG、KEGG數(shù)據(jù)庫(kù)比對(duì),獲得關(guān)聯(lián)區(qū)域內(nèi)基因的注釋信息,根據(jù)注釋信息找出與性狀相關(guān)的候選基因。
2.1 甘藍(lán)型油菜角果長(zhǎng)度性狀表型統(tǒng)計(jì)及方差分析
從表1中可以看出,農(nóng)大試驗(yàn)地中所有材料的平均角果長(zhǎng)度為70.72 mm,變異幅度在46.35—107.07 mm,變異系數(shù)為 16.47%,正態(tài)性檢驗(yàn)結(jié)果為W=0.946329,P=0.000001,所有材料的表型值在農(nóng)大試驗(yàn)地表現(xiàn)出極顯著差異。紅壤所試驗(yàn)地中平均角果長(zhǎng)度為67.60 mm,變異幅度在39.41—101.35 mm,變異系數(shù)為17.41%,正態(tài)性檢驗(yàn)結(jié)果為W=0.987718,P=0.011974,材料表型值在紅壤所試驗(yàn)地差異顯著,頻次分布圖具有顯著的正態(tài)分布特征(圖 1),表明角果長(zhǎng)度性狀為典型的數(shù)量性狀,采用GWAS分析方法可有效進(jìn)行該性狀的基因定位。
兩地試驗(yàn)的方差分析結(jié)果顯示(表 2),角果長(zhǎng)度性狀在300份基因型材料中表現(xiàn)出極顯著差異,基因型方差所占總表型方差比例為13.70%,角果長(zhǎng)度性狀在兩地的平均遺傳力為0.6057,材料間的遺傳差異較大;角果長(zhǎng)度性狀在2個(gè)試驗(yàn)地環(huán)境下表現(xiàn)出極顯著差異,環(huán)境效應(yīng)方差占總表型方差比例為83.92%,說(shuō)明環(huán)境因素對(duì)甘藍(lán)型油菜角果長(zhǎng)度性狀具有重要影響。另外,該性狀基因型與環(huán)境互作方差同樣達(dá)到極顯著差異,但角果長(zhǎng)度性狀在區(qū)組(重復(fù))間差異未達(dá)到顯著水平。
表1 油菜角果長(zhǎng)度性狀統(tǒng)計(jì)分析Table 1 Statistical analysis of silique length traits of rapeseed
圖1 油菜角果長(zhǎng)度性狀頻次分布Fig. 1 Frequency distribution of silique length of B. napus
表2 兩地試驗(yàn)角果長(zhǎng)度性狀的方差分析Table 2 Variance analysis of silique length in two places
2.2 甘藍(lán)型油菜角果長(zhǎng)度性狀全基因組關(guān)聯(lián)分析
圖2 GLM和MLM兩種模型下角果長(zhǎng)度性狀GWAS Q-Q Plot圖Fig. 2 Quantile-quantile plots of estimated-lg (P) from association analysis of silique length using two models with GLM and MLM
通過(guò)GLM模型對(duì)角果長(zhǎng)度性狀進(jìn)行全基因組關(guān)聯(lián)分析(圖2、圖3,表3和表4),在農(nóng)大試驗(yàn)地中共探測(cè)到121個(gè)顯著相關(guān)的SNP位點(diǎn),其中,包括66個(gè)為極顯著相關(guān)SNP位點(diǎn)(P<4.96E-08)和55個(gè)顯著相關(guān) SNP位點(diǎn)(P<4.96E-07),在 A04、A06、A08、A09、C02、C03、C06和C09等8條染色體均有分布,其中A09染色體上分布最多(83個(gè))。在紅壤所試驗(yàn)地共探測(cè)到22個(gè)顯著相關(guān)的SNP位點(diǎn),包括12個(gè)極顯著和10個(gè)顯著相關(guān)的SNP位點(diǎn),其中,1個(gè)在C09染色體上,其余21個(gè)SNP均分布于A09染色體,通過(guò) GLM方法在兩試驗(yàn)地探測(cè)到 20個(gè)一致性SNP位點(diǎn)。
從表圖3和5可以看出,通過(guò)MLM模型在農(nóng)大試驗(yàn)地中共找到5個(gè)顯著相關(guān)的SNP位點(diǎn),其中包括4個(gè)極顯著(P<4.96E-08)和1個(gè)顯著(P<4.96E-07)相關(guān)的SNP位點(diǎn),單個(gè)SNP解釋的表型貢獻(xiàn)率(R2)的變異為 0.1153—0.1377,最小等位基因頻率變異范圍為0.2266—0.2992。紅壤所試驗(yàn)地中共找到3個(gè)顯著相關(guān)的SNP位點(diǎn)(P<4.96E-07),這三個(gè)位點(diǎn)與農(nóng)大試驗(yàn)地試驗(yàn)結(jié)果一致,單個(gè)SNP解釋的表型貢獻(xiàn)率(R2)的變異為0.1020—0.1037。且所有位點(diǎn)均都位于A09染色體上。
通過(guò)GLM和MLM兩種模型對(duì)甘藍(lán)型油菜角果長(zhǎng)度性狀進(jìn)行全基因組關(guān)聯(lián)分析比較結(jié)果表明,GLM關(guān)聯(lián)分析模型在多條染色體上探測(cè)到顯著性 SNP位點(diǎn),且多數(shù)分布在A09染色體上;而MLM關(guān)聯(lián)分析模型由于綜合考慮了群體結(jié)構(gòu)和親緣關(guān)系2個(gè)方面,因此檢測(cè)到的位點(diǎn)較少,且全部分布在 A09染色體上,說(shuō)明 A09染色體上很有可能主要分布有控制油菜角果長(zhǎng)度的等位基因位點(diǎn)及候選基因。
2.3 LD分析及候選基因挖掘
利用全基因組獲得的201 817個(gè)SNP標(biāo)記對(duì)300份甘藍(lán)型油菜自交系品種的 LD進(jìn)行分析,得到LD-decay衰減曲線(圖4),從A和C亞基因組各條染色體LD衰退曲線可以看出(圖4-a和圖4-b),在r2=0.1時(shí),A05染色體衰退最快,衰退距離為1.5 kb,而A01、A04、A06衰退也較快,衰退距離均小于50 kb。在C亞基因組中,C09衰退最快,r2=0.1時(shí)衰退距離為4.5 kb,其余染色體衰退較慢。
圖3 角果長(zhǎng)度性狀全基因組關(guān)聯(lián)分析Manhattan圖Fig. 3 Manhattan of GWAS for silique length of B. napus
表3 農(nóng)大試驗(yàn)地角果長(zhǎng)度顯著關(guān)聯(lián)SNP位點(diǎn)(GLM)Table 3 SNPs associated with silique length in JXAU (GLM)
續(xù)表3 Continued table 3
表4 紅壤所試驗(yàn)地角果長(zhǎng)度顯著關(guān)聯(lián)SNP位點(diǎn)(MLM)Table 4 SNPs associated with silique length in JXIRS (MLM)
表5 角果長(zhǎng)度顯著關(guān)聯(lián)SNP位點(diǎn)(MLM)Table 5 SNPs associated with silique length (MLM)
圖4 甘藍(lán)型油菜A和C基因組不同染色體的LD衰減Fig. 4 LD decay of different chromosomes for A and C subgenomes in B. napus
采用GLM和MLM兩種方法均在A09染色體上找到與油菜角果長(zhǎng)度顯著關(guān)聯(lián)的SNP位點(diǎn),因此,對(duì)A09位點(diǎn)兩側(cè)進(jìn)行角果長(zhǎng)度候選基因預(yù)測(cè)較為可靠,通過(guò)LD分析表明,A09染色體的LD衰退距離為95.02 kb,所以本試驗(yàn)確定對(duì)顯著關(guān)聯(lián)SNP位點(diǎn)兩側(cè)100 kb進(jìn)行基因搜尋并進(jìn)行功能注釋。
在甘藍(lán)型油菜A09染色體的Bn-A09-p27767046、Bn-A09-p27948857和Bn-A09-p28156822 3個(gè)SNP標(biāo)記位點(diǎn)附近共搜尋到125個(gè)基因,Bn-A09-p27767046位點(diǎn)附近有搜尋到41個(gè)基因,在Bn-A09-p27948857位點(diǎn)附近搜尋到28個(gè)基因,在Bn-A09-p28156822位點(diǎn)附近搜尋到56個(gè)候選基因(具體數(shù)據(jù)未列出)。對(duì)上述基因進(jìn)行基于油菜候選基因序列及擬南芥同源基因的功能預(yù)測(cè),結(jié)果表明,在上述候選基因中存在40個(gè)與碳水化合物的運(yùn)輸及合成、細(xì)胞伸長(zhǎng)與分裂、花粉管伸長(zhǎng)、花器官發(fā)育、種子發(fā)育、信號(hào)轉(zhuǎn)導(dǎo)、脅迫響應(yīng)等重要的生理過(guò)程相關(guān)的基因(部分結(jié)果見(jiàn)表6)。它們可能通過(guò)上述功能影響油菜花序或角果的發(fā)育,導(dǎo)致角果長(zhǎng)度的差異。
油菜籽粒直接由種子數(shù)目、大小和重量構(gòu)成,這些種子構(gòu)成要素都和角果長(zhǎng)度直接相關(guān)。甘藍(lán)型油菜角果長(zhǎng)度與每角果粒數(shù)和粒重顯著相關(guān)[26-27],LIU等[28]研究表明角果長(zhǎng)度主要通過(guò)調(diào)控光合產(chǎn)物的積累來(lái)影響油菜粒重。隨著DNA分子標(biāo)記技術(shù)的發(fā)展,自20世紀(jì)90年代以來(lái),已有眾多研究人員陸續(xù)開(kāi)展油菜角果長(zhǎng)度的QTL定位研究,如CHEN等[29]利用甘藍(lán)型油菜雜交組合Quantum×No.2717-17的DH和F2群體進(jìn)行產(chǎn)量及其構(gòu)成因子QTL定位,共在A01、A09、A10、C01、C02、C05和C07染色體上找到11個(gè)與角果長(zhǎng)度性狀顯著關(guān)聯(lián)的QTL。袁澤俊等[30]對(duì)油菜角果長(zhǎng)度進(jìn)行了QTL定位和遺傳分析,結(jié)果在A09染色體上檢測(cè)到4個(gè)與角果長(zhǎng)度相關(guān)的QTL。ZHANG等[31]利用甘藍(lán)型油菜品系Y106與HZ396為親本構(gòu)建了DH群體,通過(guò)QTL元分析共檢測(cè)到6個(gè)QTL與角果長(zhǎng)度有關(guān),但在A09染色體上未發(fā)現(xiàn)與角果長(zhǎng)度有關(guān)的QTL。而YANG等[9]通過(guò)兩年的田間試驗(yàn)在186個(gè)油菜重組自交系(RIL)的作圖群體中A09染色體上探測(cè)到10個(gè)角果長(zhǎng)度QTL,其中一個(gè)主效QTL解釋表型變異率為53.4%,另外在A01、C02、C03和C04染色體上也發(fā)現(xiàn)存在角果長(zhǎng)度QTL。漆麗萍[10]檢測(cè)到11個(gè)與角果長(zhǎng)度性狀相關(guān)的QTL,分別分布在A01、A07、A09和A10染色體上。本研究對(duì)300份甘藍(lán)型油菜的角果長(zhǎng)度性狀進(jìn)行全基因組關(guān)聯(lián)分析,通過(guò)GLM 模型在農(nóng)大環(huán)境下挖掘了與油菜角果長(zhǎng)度顯著關(guān)聯(lián)的SNP位點(diǎn)121個(gè),在紅壤所試驗(yàn)地環(huán)境下找到22個(gè),在 A04、A06、A08、A09、C02、C03、C06和C09等8條染色體均有分布,其中A09染色體上分布較為集中,與上述研究比較,本研究找到的角果長(zhǎng)度性狀關(guān)聯(lián)的SNP位點(diǎn)數(shù)較多。而通過(guò)MLM模型在2個(gè)環(huán)境下都僅在A09染色體上找到與角果長(zhǎng)度顯著關(guān)聯(lián)的SNP位點(diǎn),以往研究也多在A09染色體上有類似發(fā)現(xiàn),這表明A09染色體上確實(shí)存在控制油菜角果長(zhǎng)度的基因位點(diǎn)。
表6 角果長(zhǎng)度顯著關(guān)聯(lián)SNP標(biāo)記區(qū)間候選基因Table 6 candidate genes related with silique length in the intervals of significant association SNP markers
關(guān)于調(diào)控角果長(zhǎng)度的候選基因方面的研究較少,LIU等[28]在A09染色體的p33066395位點(diǎn)附近發(fā)現(xiàn)控制角果長(zhǎng)度的Auxin-response factor 18(ARF18),并進(jìn)一步通過(guò)轉(zhuǎn)錄組分析發(fā)現(xiàn)該基因可以在角果壁中通過(guò)調(diào)控植物激素合成來(lái)控制角果細(xì)胞壁的生長(zhǎng)。本研究通過(guò)對(duì)A09染色體上角果長(zhǎng)度顯著關(guān)聯(lián)的SNP位點(diǎn)兩側(cè)的基因進(jìn)行搜尋,通過(guò)位置比較分析,檢測(cè)到多個(gè)與ARF18不同的新的角果長(zhǎng)度相關(guān)的候選基因。如候選基因GSBRNA2T00049485001,其擬南芥的同源基因?yàn)?CP12-2,與碳水化合物合成代謝有關(guān)[32]。而GSBRNA2T00092005001候選基因與花粉管伸長(zhǎng)有關(guān),其擬南芥同源基因?yàn)镾YP73(Syntaxin of plants 73)[33]。而候選基因GSBRNA2T00006774001通過(guò)與玉米基因組比對(duì)發(fā)現(xiàn)為一類伸展蛋白相關(guān)的基因,它是細(xì)胞壁中的主要結(jié)構(gòu)蛋白,對(duì)植物的形態(tài)及正常生長(zhǎng)發(fā)育都具有重要作用[34]。GSBRNA2T00049416001是與器官發(fā)育有關(guān)的基因,屬于F-box蛋白家族,是植物泛素酶體的重要組成部分,通過(guò)泛素化途徑參與到多種細(xì)胞通路,比如花器官發(fā)育、信號(hào)轉(zhuǎn)導(dǎo)、脅迫響應(yīng)等重要的生理過(guò)程[35]。GSBRNA2T00049503001候選基因的同源基因?yàn)锳RR20,能夠促進(jìn)植物種子的發(fā)育[36]。上述基因是否對(duì)角果長(zhǎng)度起作用還有待于進(jìn)一步功能驗(yàn)證。
采用GLM模型分析在南昌和進(jìn)賢兩環(huán)境下分別探測(cè)到121和22個(gè)與油菜角果長(zhǎng)度顯著關(guān)聯(lián)的SNP位點(diǎn),兩地檢測(cè)到的相同SNP位點(diǎn)為20個(gè)。采用MLM模型分析在兩地分別探測(cè)到5個(gè)和3個(gè)SNP位點(diǎn),其中3個(gè)SNP位點(diǎn)兩地一致。所有兩地一致性SNP位點(diǎn)均都位于A09染色體上,基于LD分析結(jié)果對(duì)A09染色體上顯著性SNP位點(diǎn)兩側(cè)100 kb區(qū)域內(nèi)基因進(jìn)行搜尋并進(jìn)行功能注釋,發(fā)現(xiàn)多個(gè)候選基因參與調(diào)節(jié)碳水化合物的運(yùn)輸與合成、花器官和種子的發(fā)育、信號(hào)轉(zhuǎn)導(dǎo)等過(guò)程, 它們可能通過(guò)上述功能影響油菜角果的生長(zhǎng),導(dǎo)致角果長(zhǎng)度的差異。
[1] 張永霞, 趙鋒, 張紅玲. 中國(guó)油菜產(chǎn)業(yè)發(fā)展現(xiàn)狀、問(wèn)題及對(duì)策分析.世界農(nóng)業(yè), 2015, 4: 96-99, 203-204. ZHANG Y X, ZHAO F, ZHANG H L. The current situation, problem and solutions of China’s rape industry. World Agriculture, 2015, 4: 96-99, 203-204. (in Chinese)
[2] BENNETT E J, ROBERTSs J A, WAGSTAFF C. The role of the pod in seed development: Strategies for manipulating yield. New Phytologist, 2011, 190(4): 838-853.
[3] KING S P, LUNN J E, FURBANK R T. Carbohydrate content and enzyme metabolism in developing canola siliques. Plant Physiology, 1997, 114(1): 153-160.
[4] 丁秀琦. 白菜型春油菜角果和種子性狀研究. 中國(guó)油料, 1996, 18(4): 28-30. DING X Q. Study on characters of silique and seed in spring rape (Brassica campestris). Oil Crops of China, 1996, 18(4): 28-30. (in Chinese)
[5] ?ZER H, ORAL E. Relationships between yield and yield components on currently improved spring rapeseed cultivars. Turkish Journal of Agriculture and Forestry, 1999, 23(6): 603-608.
[6] 國(guó)審長(zhǎng)角果大粒型高產(chǎn)雙低油菜華雙 4號(hào). 農(nóng)村實(shí)用技術(shù)與信息, 2006(4): 37. National registered long-pod, large-grain, high-yield rape cultivar‘Huashuang 4’ with double low content. Rural Practical Technology and Information, 2006(4): 37. (in Chinese)
[7] AYTAC Z, KINACI G. Genetic variability and association studies of some quantitative characters in winter rapeseed (Brassica napus L.). African Journal of Biotechnology, 2009, 8(15): 3547-3554.
[8] ZHANG L, YANG G, LIU P, HONG D, LI S, HE Q. Genetic and correlation analysis of silique-traits in Brassica napus L. by quantitative trait locus mapping. Theoretical and Applied Genetics, 2011, 122(1): 21-31.
[9] YANG P, SHU C, CHEN L, XU J, WU J, LIU K. Identification of a major QTL for silique length and seed weight in oilseed rape (Brassica napus L.). Theoretical and Applied Genetics, 2012, 125(2): 285-296.
[10] 漆麗萍. 甘藍(lán)型油菜株型與角果相關(guān)性狀的 QTL分析[D]. 武漢:華中農(nóng)業(yè)大學(xué), 2014. QI L P. QTL analysis for the traits associated with plant architecture and silique in Brassica napus L.[D]. Wuhan: Huazhong Agricultural University, 2014. (in Chinese)
[11] HUANG X, HAN B. Natural variations and genome-wide association studies in crop plants. Annual Review of Plant Biology, 2014, 65: 531-551.
[12] LI F, CHEN B, XU K, GAO G, YAN G, QIAO J, LI J, LI H, LI L, XIAO X. A genome-wide association study of plant height and primary branch number in rapeseed (Brassica napus). Plant Science, 2016, 242: 169-177.
[13] LUO X, MA C, YUE Y, HU K, LI Y, DUAN Z, WU M, TU J, SHEN J, YI B, FU T. Unravelling the complex trait of harvest index in rapeseed (Brassica napus L.) with association mapping. BMC Genomics, 2015, 16: 379-388.
[14] LI F, CHEN B, XU K, WU J, SONG W, BANCROFT I, HARPER A L, TRICK M, LIU S, GAO G, WANG N, YAN G, QIAO J, LI J, LI H, XIAO X, ZHANG T, WU X. Genome-wide association study dissects the genetic architecture of seed weight and seed quality in rapeseed (Brassica napus L.). DNA Research, 2014, 21(4): 355-367.
[15] HATZIG S V, FRISCH M, BREUER F, NESI N, DUCOURNAU S, WAGNER M H, LECKBAND G, ABBADI A, SNOWDON R J. Genome-wide association mapping unravels the genetic control of seed germination and vigor in Brassica napus. Front Plant Science, 2015, 6: 221-233.
[16] CHALHOUB B, DENOEUD F, LIU S, PARKIN I A, TANG H, WANG X, CHIQUET J, BELCRAM H, TONG C, SAMANS B, CORREA M, DA SILVA C, JUST J, FALENTIA C, KOH C S, LE CLAINCHE I, BERNARD M, BENTO P, NOEL B, LABADIE K, ALBERTI A, CHARLES M, ARNAUD D, GUO H, DAVIAUD C, ALANERY S, JABBARI K, ZHAO M, EDGER P P, CHELAIFA H, TACK D, LASSLLE G, MESTIRI I, SCHNEL N, LE PASLIER M C, FAN G, RENAULT V, BAYER P E, GOLICZ A A, MANOLI S, LEE T H, THI V H, CHALABI S, HU Q, FAN C, TOLLENAERE R, LU Y, BATTAIL C, SHEN J, SIDEBOTTOM C H, WANG X, CANAGUIER A, CHAUVEAU A, BERARD A, DENIOT G, GUAN M, LIU Z, SUN F, LIM Y P, LYONS E, TOWN D, BANCROFT I, WANG X, MENG J L, MA J, PIRES J C, KING G J, BRUNEL D, DELOURME R, RENARD M, AURY J M, AADAMS K L, BATLEY J, SNOWDON R J, TOST J, EDWARDS D, ZHOU Y, HUA W, SHARP A G, PATERSON A H, GUAN C, WINCKER P. Early allopolyploid evolution in the post-Neolithic Brassica napusoilseed genome. Science, 2014, 345(6199): 950-953.
[17] SUN X, LIU D, ZHANG X F, LI W B, LIU H, HONG W G, JIANG C B, GUAN N, MA C X, ZENG H P, XU C H, SONG J, HUANG L, ZHENG H K. SLAF-seq: An efficient method of large-scale De novo SNP discovery and genotyping using high-throughput sequencing. PloS ONE, 2013, 8(3): e58700.
[18] 陸光遠(yuǎn), 伍曉明, 陳碧云. 油菜種質(zhì)資源描述規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn). 北京: 中國(guó)農(nóng)業(yè)出版社, 2007. LU G Y, WU X M, CHEN B Y. Descriptors and Data Standard for Rapeseed (Brassica spp.). Beijing: China Agriculture Press, 2007. (in Chinese)
[19] PURCELL S, NEALE B, TODD-BROWN K, THOMAS L, FERREIRA M, BENDER D, MALLER J, SKLAR P, de BAKKER P, DALY M J, SHAM P C. PLINK: A tool set for wholegenome association and population-based linkage analyses. The American Journal of Human Genetics, 2007, 81(3): 559-575.
[20] ZONDERVAN K T, CARDON L R. The complex interplay among factors that influence allelic association. Nature Reviews Genetics, 2004(2): 89-100.
[21] BRADBURY P J, ZHANG Z, KROON D E, CASSTEVENS T M, RAMDOSS Y, BUCKLER E S. TASSEL: Software for association mapping of complex traits in diverse samples. Bioinformatics, 2007, 23(19): 2633-2635.
[22] HARDY O J, VEKEMANS X. SPAGeDi: A versatile computer program to analyze spatial genetic structure at the individual or population levels. Molecular Ecology Notes, 2002, 2(4): 618-620.
[23] ALEXANDER D H, NOVEMBRE J, LANGE K. Fast model-based estimation of ancestry in unrelated individuals. Genome Research, 2009, 19(9): 1655-1664.
[24] GINESTET C. ggplot2: Elegant graphics for data analysis. Journal of the Royal Statistical Society: Series A, 2011, 174(1): 245-246.
[25] TURNER S D. qqman: An R package for visualizing GWAS results using QQ and manhattan plots. BioRxiv, 2014: 005165.
[26] CHAY P, THURLING N. Identification of genes controlling pod length in spring rapeseed, Brassica napus L., and their utilization for yield improvement. Plant Breeding, 1989, 103(1): 54-62.
[27] DIEPENBROCK W. Yield analysis of winter oilseed rape (Brassica napus L.): A review. Field Crops Research, 2000, 67(1): 35-49.
[28] LIU J, HUA W, HU Z, YANG H L, ZHANG L, LI R J, DENG L B, SUN X C, WANG X F, WANG H Z. Natural variation in ARF18 gene simultaneously affects seed weight and silique length in polyploid rapeseed. Proceedings of the National Academy of Sciences of the USA, 2015, 112(37): E5123-E5132.
[29] CHEN W, ZHANG Y, LIU X, CHEN B, TU J X, FU T D. Detection of QTL for six yield-related traits in oilseed rape (Brassica napus) using DH and immortalized F2populations. Theoretical and Applied Genetics, 2007, 115(6): 849-858.
[30] 袁澤俊. 油菜A9染色體角果長(zhǎng)和千粒重主效QTL的驗(yàn)證[D]. 武漢: 華中農(nóng)業(yè)大學(xué), 2013. YUAN Z J. Confirmation of the major QTL for silique length and seed weight on chromosome A9 of Brassica napus [D]. Wuhan: Huazhong Agricultural University, 2013. (in Chinese)
[31] ZHANG L, LI S, CHEN L, YANG G. Identification and mapping of a major dominant quantitative trait locus controlling seeds per silique as a single Mendelian factor in Brassica napus L.. Theoretical and Applied Genetics, 2012, 125(4): 695-705.
[32] FERMANI S, TRIVELLI X, SPARLA F, THUMIGER A, CALVARESI M, MARRI L, TROST P. Conformational selection and folding-upon-binding of intrinsically disordered protein CP12 regulate photosynthetic enzymes assembly. Journal of Biological Chemistry, 2012, 287(25): 21372-21383.
[33] WANG Y, ZHANG W Z, SONG L F, ZOU J J, SU Z, Wu W H. Transcriptome analyses show changes in gene expression to accompany pollen germination and tube growth in Arabidopsis. Plant Physiology, 2008, 148(3): 1201-1211.
[34] STIEFEL V, RUIE-AVILA L, RAZ R, VALLES M P, GOMEZ J, PAGES M, NELSON T. Expression of a maize cell wall hydroxyprolinerich glycoprotein gene in early leaf and root vascular differentiation. The Plant Cell, 1990, 2(8): 785-793.
[35] GONZALEZ, Z H, ROMPA U, PETERS J L, BHATT A M, WAGSTAFF C, STEAD A D, ROBERTS J A. HAWAIIAN SKIRT: An F-box gene that regulates organ fusion and growth in Arabidopsis. Plant Physiology, 2007, 144(3): 1370-1382.
[36] LI H, XU T, LIN D, WEN M, XIE M, DUCLERCQ J, BENKOVA E. Cytokinin signaling regulates pavement cell morphogenesis in Arabidopsis. Cell Research, 2013, 23(2): 290-299.
(責(zé)任編輯 李莉)
Genome Wide Association Analysis of Silique Length in Brassica napus L.
ZHOU QingHong1, ZHOU Can1, ZHENG Wei2, FU DongHui1
(1College of Agronomy, Jiangxi Agricultural University/The Key Laboratory of Crop Physiology, Ecology and Genetic Breeding, Ministry of Education, Nanchang 330045;2Jiangxi Institute of Red Soil, Jinxian 331717, Jiangxi)
【Objective】The objective of this study is to detect the SNP loci and determine related candidate genes affecting the silique length of B. napus significantly to reveal its genetic basis and molecular mechanism, and lay a foundation for the marker assisted selection in high yield breeding of B. napus. 【Method】In this study, the phenotype of silique length was investigated at two environments (JXAU of Nanchang and JXIRS of Jinxian) with 300 accessions of B. napus, combining with the 201,817 SNPs developed from specific locus amplified fragment sequencing (SLAF-seq) technology, the genome-wide association analysis wasproceeded to detect the SNP loci affecting the silique length significantly, and the regions were scanned with 100 kb apart from the loci of SNP associated dramatically with silique length based on linkage disequilibrium analysis, and finally the candidate genes were predicted with relation to silique length by BLAST analysis.【Result】The variation ranges of silique length in the two places were 46.35-107.07 mm and 39.41-101.35 mm, respectively, which both showed extensive phenotypic variation in two environments. In addition, a total of 121 SNP loci in JXAU correlatively with silique length were excavated by general linear model (GLM), which distributed on A04, A06, A08, A09, C02, C03, C06 and C09 chromosomes, and the largest number of SNPs (83) was on A09 chromosome. Otherwise, 22 SNPs in JXIRS with 1 on C09 and 21 on A09 were detected, and there were 20 consensus SNPs under two environments. Besides, 5 SNPs in JXAU and 3 SNPs (P<4.96E-07) in JXIRS all distributed on A09 chromosome were detected respectively using the mixed linear model (MLM), three of which were consistent in two environments. There were 40 candidate genes screened in the candidate regions with 100 kb apart from the positions of SNPs associated significantly with silique length, functional analyses showed that these genes involved in regulation of carbohydrate transportation and synthesis, flower and seed development, signal transduction and etc., which might result in the variation of silique length through affecting the growth and development of silique in B. napus. 【Conclusion】The SNP loci and candidate genes related closely with silique length of B. napus were detected in this study, thus providing a theoretical basis for the seed yield regulatory network of B. napus and molecular assisted selection of high-yield breeding of rapeseed.
Brassica napus; Genome-wide association study; silique length; SNP locus; candidate gene
2016-07-19;接受日期:2016-10-17
國(guó)家自然科學(xué)基金(31360342)
聯(lián)系方式:周慶紅,E-mail:qinghongzhou@126.com。通信作者付東輝,E-mail:fudhui@163.com