鄭洪亮,孫世臣,丁國(guó)華,王彤彤,趙宏偉,王敬國(guó),劉化龍,韓 笑,鄒德堂,來(lái)永才
(1.黑龍江省農(nóng)業(yè)科學(xué)院博士后科研工作站,哈爾濱 150086;2.東北農(nóng)業(yè)大學(xué)寒地糧食作物種質(zhì)創(chuàng)新與生理生態(tài)教育部重點(diǎn)實(shí)驗(yàn)室,哈爾濱 150030;3.黑龍江省農(nóng)業(yè)科學(xué)院,哈爾濱 150086)
淀粉作為稻米主要成分,占稻米干重90%左右,其組分主要包括直鏈淀粉和支鏈淀粉,其中直鏈淀粉含量是影響水稻蒸煮食味品質(zhì)重要因素,研究認(rèn)為稻米直鏈淀粉含量、結(jié)構(gòu)和組成影響膠稠度、糊化溫度[1],且稻米蒸煮食味與直鏈淀粉含量呈顯著負(fù)相關(guān),與膠稠度呈顯著正相關(guān)[2]。因此,挖掘稻米直鏈淀粉含量QTLs/基因,對(duì)于改良稻米品質(zhì)具有重要意義。
稻米直鏈淀粉含量是由多基因控制的數(shù)量性狀,利用正向遺傳學(xué)和反向遺傳學(xué)方法挖掘到與直鏈淀粉含量相關(guān)QTLs/基因。目前,已利用傳統(tǒng)QTL分析方法從32個(gè)遺傳群體中定位直鏈淀粉含量相關(guān)QTL 141個(gè)[3],但由于不同研究人員采用試驗(yàn)材料遺傳背景差異較大,且選用分子標(biāo)記不同,導(dǎo)致定位結(jié)果差異較大。李修平等進(jìn)一步采用元分析方法對(duì)141個(gè)QTL構(gòu)建一致性圖譜,最終映射得到30個(gè)“一致性”QTL[3]。目前,已克隆水稻直鏈淀粉相關(guān)基因11個(gè),包括位于第6染色體上的顆粒結(jié)合型淀粉合成酶基因Wx,也是公認(rèn)的水稻直鏈淀粉含量主效基因[4],位于第6和第8染色體上與可溶性淀粉合成酶相關(guān)的3個(gè)基因SSSI[5]、SSIIa[6]和SSIIIa[7],位于第1、3、5、7、8、9染色體上與ADP葡萄糖焦磷酸化酶相關(guān)的6個(gè)基因[8]:AGPL1、AGPL2、AGPL3、AGPL4、AGPS1、AGPS2a,以及位于第2染色體上與淀粉分支酶相關(guān)的基因SBEIIb[9]。但以上研究結(jié)果對(duì)于解析稻米直鏈淀粉含量復(fù)雜的遺傳基礎(chǔ)仍不充分。
除傳統(tǒng)QTL分析外,全基因組關(guān)聯(lián)分析是另外一種解析復(fù)雜性狀遺傳基礎(chǔ)的重要方法,具有群體構(gòu)建簡(jiǎn)單,表型變異豐富,且可在同一位點(diǎn)上分析多個(gè)等位基因,定位精度高等優(yōu)勢(shì)。目前稻米品質(zhì)相關(guān)研究應(yīng)用廣泛,如Chen等利用收集世界各地527份水稻品種為試驗(yàn)材料,結(jié)合3 916 415個(gè)SNP對(duì)稻谷籽粒4種貯藏蛋白作全基因組關(guān)聯(lián)分析,共檢測(cè)到34個(gè)位點(diǎn)與4種貯藏蛋白顯著關(guān)聯(lián),其中有28個(gè)位點(diǎn)與已知QTLs/基因處于相同或相近位置[10]。Qiu等以272份秈稻品種構(gòu)成的自然群體為試驗(yàn)材料,利用18 824個(gè)高質(zhì)量SNP對(duì)粒長(zhǎng)、粒寬、長(zhǎng)寬比、粒厚、千粒重、堊白度、堊白率、糙米率等10個(gè)性狀作全基因組關(guān)聯(lián)分析,共檢測(cè)到38個(gè)顯著關(guān)聯(lián)QTL,其中有5個(gè)QTL為已知QTLs/基因[11]。但利用全基因組關(guān)聯(lián)分析研究粳稻直鏈淀粉含量遺傳基礎(chǔ)及基因挖掘的報(bào)道較少。
本研究以收集的295份溫帶粳稻種質(zhì)組成的自然群體為試驗(yàn)材料,于2019~2020年測(cè)定稻米直鏈淀粉含量,結(jié)合高通量測(cè)序獲得788 396個(gè)多態(tài)性SNP作GWAS分析,并針對(duì)重要QTL區(qū)間挖掘候選基因,以期為解析粳稻直鏈淀粉含量遺傳機(jī)制及利用分子育種手段改良稻米品質(zhì)奠定基礎(chǔ)。
以國(guó)內(nèi)外收集的295份溫帶粳稻種質(zhì)構(gòu)成的自然群體為試驗(yàn)材料,國(guó)內(nèi)材料主要來(lái)自于黑龍江、吉林、遼寧和寧夏,國(guó)外材料主要來(lái)自于日本、韓國(guó)、朝鮮和俄羅斯。具體材料明細(xì)見(jiàn)表1。
表1 295個(gè)粳稻品種具體信息Table 1 Detailed information of 295 japonica rice varieties
2019~2020年將所有供試材料種植于東北農(nóng)業(yè)大學(xué)阿城實(shí)驗(yàn)實(shí)習(xí)基地水稻試驗(yàn)基地,4月15日播種,5月20日插秧,插秧密度為30 cm×16.7 cm,4行區(qū),每行40株,田間采用隨機(jī)區(qū)組設(shè)計(jì),3次重復(fù),田間管理同當(dāng)?shù)卮筇锷a(chǎn)。于水稻成熟后收獲籽粒,置于40℃烘箱中烘干48 h至水分含量為14%,經(jīng)糙米機(jī)、精米機(jī)及磨粉機(jī)加工后,用于稻米直鏈淀粉含量測(cè)定,測(cè)定方法參照國(guó)家標(biāo)準(zhǔn)(GB/T17891-2017)[12]。
續(xù)表
續(xù)表
本研究所用自然群體基因型數(shù)據(jù)獲取及群體結(jié)構(gòu)、親緣關(guān)系、連鎖不平衡分析等工作前期實(shí)驗(yàn)室已完成,具體分析過(guò)程及結(jié)果如下:①利用Illumina HiSeq XTen平臺(tái)作高通量測(cè)序,平均測(cè)序深度14.62×,以粳稻品種日本晴(IRGSP-1.0)為參考基因組,采用BWA軟件序列比對(duì),采用GATK軟件“Best Practice”作群體SNP檢測(cè),共獲得3 437 749個(gè)多態(tài)性SNP標(biāo)記,進(jìn)一步利用Plink軟件作數(shù)據(jù)質(zhì)控,最終篩選出最小等位基因頻率(MAF)>5%,且缺失率(Missing data)<20%的788 396個(gè)SNP用于后續(xù)分析;②利用ADMIXTURE軟件分析群體結(jié)構(gòu)[13],結(jié)果表明,當(dāng)K=3時(shí),群體CV值最小,因此將群體劃分為3個(gè)亞群,并將其對(duì)應(yīng)Q矩陣用于后續(xù)關(guān)聯(lián)分析;③利用Tassel 5.0軟件評(píng)估群體材料間親緣關(guān)系[14],結(jié)果表明,親緣關(guān)系系數(shù)小于0.1材料占78.8%,>0.5材料僅有0.4%,因此本研究所用群體材料間親緣關(guān)系較遠(yuǎn),對(duì)后續(xù)GWAS分析結(jié)果影響較??;④利用PopLDdecay軟件計(jì)算得到水稻全基因組r2值[15],依據(jù)Huang等方法[16],將r2衰減到最大值一半時(shí)對(duì)應(yīng)的物理距離作為L(zhǎng)D衰減距離,經(jīng)計(jì)算,位點(diǎn)間最大r2值為0.84,群體LD衰減距離為109.7 kb。
利用Tassel 5.0軟件混合線性模型(Q+K)對(duì)稻米直鏈淀粉含量作GWAS分析[14],采用Li等方法通過(guò)GEC軟件計(jì)算有效獨(dú)立SNP數(shù)目,最終將P<5.46×10-6作為顯著性關(guān)聯(lián)閾值[17]。如果在LD區(qū)間內(nèi)有多個(gè)顯著SNP存在,則將這些SNP視為同一個(gè)QTL,結(jié)果中僅列出P值最小的SNP作為峰值SNP,且峰值SNP貢獻(xiàn)率代表QTL貢獻(xiàn)率,以峰值SNP位置上下游分別增加109.7 kb(LD衰減距離)作為QTL區(qū)間范圍。GWAS分析結(jié)果的曼哈頓圖和Q-Q圖使用R語(yǔ)言中“qqman”軟件包繪制。
將兩年共同檢測(cè)且不含已知基因的QTL作為重要QTL,根據(jù)區(qū)間內(nèi)基因注釋結(jié)果,分析區(qū)間內(nèi)所有基因單倍型。具體操作過(guò)程參考文獻(xiàn)[18]:①根據(jù)水稻注釋數(shù)據(jù)庫(kù)(http://rapdb.dna.affrc.go.jp/)獲取QTL區(qū)間內(nèi)全部基因;②利用水稻3K RGP的Rice SNP-Seek Database網(wǎng)站提取所有基因非同義突變SNP[19],結(jié)合QTL區(qū)間內(nèi)所有SNP確定本研究自然群體最終非同義突變SNP;③對(duì)具有非同義突變SNP的所有候選基因作單倍型分析;④對(duì)不同單倍型(≥10份材料)直鏈淀粉含量作方差分析,篩選出具有顯著性差異基因,并結(jié)合基因功能注釋和前人研究結(jié)果確定候選基因。
通過(guò)測(cè)定2019~2020年295份粳稻材料直鏈淀粉含量。結(jié)果表明,直鏈淀粉含量在兩年內(nèi)均表現(xiàn)出豐富的表型變異且趨勢(shì)一致,總體上,2020年各品種直鏈淀粉含量略高于2019年,兩年平均值分別為19.96%和20.37%,變異范圍分別為15.21%~25.34%和15.55%~25.68%,變異系數(shù)分別為12.12%和11.59%(見(jiàn)表2)。自然群體偏度值和峰度值絕對(duì)值均小于1,表明直鏈淀粉含量?jī)赡瓯硇头植汲式普龖B(tài)分布,符合典型數(shù)量性狀遺傳特征(見(jiàn)圖2)。
圖2 粳稻群體中直鏈淀粉含量頻率分布Fig.2 Frequency distribution of the amylose content in 295 japonica rice
表2 295份粳稻種質(zhì)直鏈淀粉含量表型值統(tǒng)計(jì)分析Table 2 Phenotypic analysis of amylose content in 295 japonica rice germplasms
利用Tassel 5.0軟件混合線性模型(MLM)對(duì)295份粳稻品種直鏈淀粉含量作全基因組關(guān)聯(lián)分析,曼哈頓圖和QQ散點(diǎn)圖(見(jiàn)圖3)。在顯著性閾值P<5.46×10-6條件下,2019~2020兩年共檢測(cè)到與直鏈淀粉含量相關(guān)QTL 12個(gè),分布在水稻第3、4、11和12染色體上,貢獻(xiàn)率范圍為8.78%~11.62%。2019年和2020年均檢測(cè)到7個(gè)QTL,其中qAAC4-2和qAAC12-2在兩年中重復(fù)檢測(cè)到,qAAC4-2表型貢獻(xiàn)率兩年中分別為11.12%和9.15%,qAAC12-2表型貢獻(xiàn)率兩年中分別為10.62%和10.30%。根據(jù)全基因組LD衰減距離,最終將qAAC4-2和qAAC12-2分別定位于水稻第4和12染色體20.27~20.49 Mb和19.14~19.36 Mb(見(jiàn)表3)。
表3 粳稻淀粉相關(guān)性狀顯著相關(guān)位點(diǎn)Table 3 Significant correlation loci of starch related traits in japonica rice
圖3 粳稻直鏈淀粉含量全基因組關(guān)聯(lián)分析結(jié)果曼哈頓圖和QQ散點(diǎn)圖Fig.3 Manhattan plot and quantile-quantile(Q-Q)plots of genome-wide association studies for the amylose content in 295 japonica rice
針對(duì)兩年中同時(shí)檢測(cè)到的2個(gè)QTL(qAAC4-2和qAAC12-2)區(qū)間內(nèi)所有基因分析單倍型。qAAC4-2位于水稻第4染色體20.27~20.49 Mb區(qū)間內(nèi),該區(qū)間包含32個(gè)基因,單倍型分析結(jié)果表明,共有6個(gè)基因不同單倍型直鏈淀粉含量存在顯著差異(見(jiàn)圖4a~f)。
圖4 候選基因不同單倍型之間直鏈淀粉含量箱線圖Fig.4 Boxplots of amylose content between different haplotypes of candidate genes
LOC_Os04g33520非同義突變SNP分為兩種單倍型,Hap2(CA)顯著大于Hap1(TG)(見(jiàn)圖4a);LOC_Os04g33590被非同義突變SNP分為兩種單倍型,Hap2(A)顯 著 大 于Hap1(G)(見(jiàn) 圖4b);LOC_Os04g33640非同義突變SNP分為兩種單倍型,Hap2(T)極顯著大于Hap1(G)(見(jiàn)圖4c);LOC_Os04g33660被非同義突變SNP分為兩種單倍型,Hap2(G)顯著大于Hap1(A);LOC_Os04g33700被非同義突變SNP分為兩種單倍型,Hap2(CCTACC)顯著大于Hap1(TACGTG);LOC_Os04g33710非同義突變SNP共分為兩種單倍型,Hap2(CT)顯著大于Hap1(AG)(見(jiàn)表4)。
表4 候選基因單倍型分組及每種單倍型SNP組成Table 4 Candidate gene haplotype group and the composition of each haplotype SNP
根據(jù)基因功能注釋(見(jiàn)表5),LOC_Os04g33640編碼糖苷水解酶,即一種水解糖苷鍵的酶[22],該酶對(duì)糖和糖綴合物水解與合成具有調(diào)節(jié)作用[23],推測(cè)其可能影響淀粉鏈長(zhǎng)度和分支[24],進(jìn)而影響直鏈淀粉及支鏈淀粉含量。因此,推測(cè)LOC_Os04g33640最可能為qAAC4-2候選基因。另外一個(gè)QTL,qAAC12-2位于水稻第12染色體19.14~19.36 Mb區(qū)間內(nèi),該區(qū)間包含27個(gè)基因,單倍型分析結(jié)果表明,該QTL區(qū)間內(nèi)所有基因不同單倍型直鏈淀粉含量差異不顯著。
表5 候選基因基因注釋Table 5 Candidate gene of gene annotation
稻米直鏈淀粉含量除受遺傳因素控制外,溫度、光照、海拔等環(huán)境因素及施肥、收獲時(shí)期、貯藏時(shí)間、碾磨精度等農(nóng)藝措施均對(duì)直鏈淀粉含量有影響[25]。本研究以295份粳稻種質(zhì)為試驗(yàn)材料,于2019年和2020年種植于阿城基地,從測(cè)定的稻米直鏈淀粉含量看,2019年直鏈淀粉含量平均值為19.96%,變異范圍為15.21%~25.34%,2020年直鏈淀粉含量平均值為20.37%,變異范圍為15.55%~25.68%,其海拔、施肥、收獲時(shí)期、貯藏時(shí)間、碾磨精度等均不存在差異,而溫度和光照在年際間有較大差異,根據(jù)試驗(yàn)地氣象數(shù)據(jù)統(tǒng)計(jì),2019年和2020年4~9月份≥10℃活動(dòng)積溫和日照時(shí)數(shù)分別為2 764℃、1 272.3 h和2 922℃、1 301.3 h,可知2020年活動(dòng)積溫和日照時(shí)數(shù)比2019年分別增加158℃和29 h。說(shuō)明溫度和光照對(duì)稻米直鏈淀粉含量略有影響,且稻米直鏈淀粉含量隨活動(dòng)積溫和日照時(shí)數(shù)增加而有所提高。
長(zhǎng)期以來(lái)針對(duì)稻米直鏈淀粉含量遺傳基礎(chǔ)解析開(kāi)展大量研究,除已克隆主效基因Wx外,近年來(lái)通過(guò)遺傳群體和自然群體鑒定到眾多QTLs/基因。根據(jù)國(guó)家水稻數(shù)據(jù)中心基因數(shù)據(jù)庫(kù)(http://www.ricedata.cn/gene/)和水稻QTL數(shù)據(jù)庫(kù)(https://archive.gramene.org/qtl/)公布信息,將本研究檢測(cè)到的12個(gè)與直鏈淀粉相關(guān)QTL與前人結(jié)果作比較,發(fā)現(xiàn)部分QTL與前人已定位QTL位于相同、相近區(qū)間或包含已克隆淀粉相關(guān)基因。如Fan等通過(guò)秈稻品種珍汕97和H94雜交得到的F1構(gòu)建雙倍單倍體(DH)群體為試驗(yàn)材料[20],利用水稻218個(gè)SSR標(biāo)記位點(diǎn),檢測(cè)到兩個(gè)與直鏈淀粉含量相關(guān)QTL(AQGA007,AQGA017),分別與本研究2019年檢測(cè)到的qAAC3和2020年檢測(cè)到的qAAC12-3位于相同區(qū)間。另外,本研究2020年檢測(cè)到與直鏈淀粉含量相關(guān)QTL(qAAC4-1)區(qū)間內(nèi)包含可溶性淀粉合酶Ⅲ基因OsSSIIIb,與Zhao等研究結(jié)果一致[21]。表明本研究全基因組關(guān)聯(lián)分析的檢測(cè)結(jié)果具有較高準(zhǔn)確性,同時(shí)也縮小已定位QTL區(qū)間。
由于傳統(tǒng)基因圖位克隆需耗費(fèi)大量人力和時(shí)間,因此克隆影響復(fù)雜性狀QTL一直是植物遺傳學(xué)家和分子生物學(xué)家面臨的重大挑戰(zhàn)。采用GWAS方法作QTL分析,并針對(duì)QTL區(qū)間內(nèi)所有基因作單倍型分析,篩選出不同單倍型表型值之間存在顯著性差異候選基因,再結(jié)合基因注釋和前人研究結(jié)果挖掘候選基因,可提高候選基因篩選效率及準(zhǔn)確性[26]。本研究針對(duì)兩年共同檢測(cè)到且不含已知基因的兩個(gè)重要QTL(qAAC4-2、qAAC12-2)分析候選基因單倍型,結(jié)果發(fā)現(xiàn)qAAC12-2區(qū)間內(nèi)所有基因不同單倍型直鏈淀粉含量差異不顯著,而qAAC4-2區(qū)間內(nèi)共有6個(gè)基因不同單倍型直鏈淀粉含量存在顯著差異,其中編碼糖苷水解酶的LOC_Os04g33640,對(duì)糖和糖綴合物水解與合成具有調(diào)節(jié)作用。研究表明,α-淀粉酶和β-葡萄糖苷酶均含有這種糖基水解酶結(jié)構(gòu)域,可水解淀粉產(chǎn)生糊精、低聚糖和單糖,從而降低淀粉積累[23-24]。因此,推測(cè)LOC_Os04g33640可能具有類似α-淀粉酶功能。下一步將重點(diǎn)針對(duì)LOC_Os04g33640開(kāi)展轉(zhuǎn)基因功能驗(yàn)證和分子育種利用,為粳稻品質(zhì)改良提供理論依據(jù)。