代力強,吳 律,董青松,閆 鴿,曲 靜,王丕武
(吉林農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,吉林 長春130118)
粒長是玉米產(chǎn)量性狀遺傳改良的主要目標(biāo)之一。選擇相對較長的玉米籽粒,對提高玉米的單產(chǎn)水平具有重要意義。已有的研究表明,籽粒長度是高度遺傳的數(shù)量性狀,受環(huán)境的影響較小[1-3]。2005年樊慶琦等[4]采用多世代聯(lián)合分析方法對普通玉米籽粒長度進(jìn)行遺傳分析,認(rèn)為玉米粒長表現(xiàn)為主基因+多基因的混合遺傳,只是在不同遺傳背景的材料中控制籽粒長度的主基因數(shù)目表現(xiàn)出一定的差異。2011年P(guān)eng等[5]對2個F2:3玉米家系群體的研究結(jié)果顯示,不同基因型玉米的粒長間存在著極顯著差異,廣義遺傳力最高可達(dá)到0.89,表明該性狀主要受到遺傳因素的控制。2012年Macke[6]對12個美國玉米自交系及其雜交后代進(jìn)行研究,認(rèn)為玉米粒長性狀的基因效應(yīng)以加性為主并具有較高的遺傳力,后代選擇有效。所以在組配籽粒較深且產(chǎn)量高的玉米雜交種時,可選擇粒長較長的玉米自交系。然而,控制玉米籽粒生長發(fā)育的因素較多且復(fù)雜,粒長發(fā)育形成的遺傳機制尚不明確,還需進(jìn)一步對其分子機理進(jìn)行研究并找到相關(guān)的主效基因。
目前,科學(xué)家主要應(yīng)用SSR和SNP等分子標(biāo)記技術(shù)對玉米粒長性狀進(jìn)行QTL定位。2012年曹曉良等[7]以“農(nóng)系531”和“SIL8”雜交所衍生的200個F2:3家系為作圖群體,利用238對SSR標(biāo)記共定位得到3個玉米粒長的QTL位點,最高可解釋17.34%的表型貢獻(xiàn)率。2014年Zhang等[8]利用SSR標(biāo)記技術(shù)對243個永久F2代自交系進(jìn)行遺傳作圖,經(jīng)過兩年兩點的試驗共檢測出4個控制玉米粒長發(fā)育的QTL,這些位點分布在第3、第5和第10號染色體上。2016年Chen等[9]采用GBS簡易基因組測序技術(shù)對173個重組自交系進(jìn)行基因分型,在6個環(huán)境下共定位得到4個玉米粒長的QTL,解釋的表型變異率在6.2%~8.0%。2016年Qin等[10]以Mo17和黃早四雜交所衍生的3個回交群體作為研究對象,利用SSR標(biāo)記對之前得到的粒長QTL進(jìn)行精細(xì)定位,結(jié)果顯示,主效qKL1.07位點的遺傳距離已縮小至1.6 Mb,為進(jìn)一步挖掘相關(guān)的功能基因提供了依據(jù)。
盡管上述研究獲得了大量控制玉米粒長性狀的數(shù)量性狀位點。但由于受到標(biāo)記密度的影響,所檢測到的QTL置信區(qū)間仍然較大,給后續(xù)功能基因的發(fā)掘帶來了很大困難。所以,本研究采用第2代測序技術(shù)對80個核心玉米自交系進(jìn)行基因組重測序,利用得到的高密度SNP標(biāo)記對玉米籽粒長度的全基因組進(jìn)行關(guān)聯(lián)分析,篩選與粒長顯著關(guān)聯(lián)的SNP,深度挖掘玉米種質(zhì)中控制粒長發(fā)育的優(yōu)異等位基因,為分子標(biāo)記輔助選擇籽粒長、產(chǎn)量高的玉米材料及克隆相關(guān)的功能基因奠定基礎(chǔ)。
本研究收集并篩選了80個核心玉米自交系作為關(guān)聯(lián)群體,主要包含了在吉林省玉米育種中應(yīng)用較多的自交系和近5年來在東北推廣面積較大的玉米雜交種親本。這些自交系的名稱及系譜來源見表1。在2014年和2015年分別將其種植在吉林省長春市和梅河口市。采用完全隨機區(qū)組設(shè)計,3行區(qū),行長3 m,行距0.65 m,株距20 cm,設(shè)3次重復(fù),兩年的田間管理相同。
表1 80個核心玉米自交系的名稱及系譜來源Table 1 Names and pedigree sources of 80 elite inbred lines
表1(續(xù)) Contiued table 1
當(dāng)玉米達(dá)到完熟期后每小區(qū)隨機摘取10個果穗,風(fēng)干后考種。按照以下公式計算玉米籽粒長度:粒長(cm)=(穗粗-軸粗)/2。其中穗粗和軸粗均為果穗中部的測量結(jié)果,每個果穗重復(fù)測量3次。各小區(qū)的粒長平均值用于后續(xù)的統(tǒng)計分析。
使用SPSS 19.0(IBM Corp.,Armonk,NY,USA)軟件分別對粒長數(shù)據(jù)進(jìn)行描述性統(tǒng)計分析、方差分析和相關(guān)分析。按照Knapp等[11]提出的公式計算廣義遺傳力。
采用康為世紀(jì)植物基因組DNA提取試劑盒提取80個玉米自交系葉片基因組DNA。用1%瓊脂糖凝膠電泳、NanoDrop1000檢測DNA質(zhì)量,合格的DNA樣品用于構(gòu)建基因組文庫,并利用Illumina Hiseq PE150進(jìn)行測序。將獲得的高質(zhì)量測序數(shù)據(jù)通過BWA軟件[12]比對到玉米自交系B73的參考基因組RefGen_v3(ftp://ftp.ensemblgenomes.org/pub/plants/release-29/fasta/zea_mays/dna/)上,比對結(jié)果經(jīng)SAMTOOLS軟件[13]去除重復(fù),并利用貝葉斯模型進(jìn)行群體SNP的檢測。采用最小等位基因頻率≥0.05、SNP檢測缺失率<0.1等過濾條件進(jìn)行篩選,最終獲得1 490 007個高質(zhì)量的SNP,用于后續(xù)的全基因組關(guān)聯(lián)分析。
應(yīng)用軟件PLINK[14],通過LD測量參數(shù)r2(r2≥0.1)計算關(guān)聯(lián)群體全基因組的平均LD衰減距離。運用FarmCPU方法[15]對高質(zhì)量的SNP標(biāo)記與籽粒長度數(shù)據(jù)間進(jìn)行全基因組關(guān)聯(lián)分析,其中關(guān)聯(lián)群體的親緣關(guān)系與5個代表群體結(jié)構(gòu)的最大主成分,分別隨機選取10% 的SNP標(biāo)記,運用GAPIT軟件[16]進(jìn)行計算。采用Bonferroni法[17]對多重假設(shè)檢驗得到的P值進(jìn)行校正,用以降低假陽性關(guān)聯(lián)結(jié)果,最終確定當(dāng)-lgP≥6時,判定SNP標(biāo)記與玉米粒長性狀關(guān)聯(lián)顯著。在顯著性SNP位點的LD范圍內(nèi)(本試驗所用關(guān)聯(lián)群體平均LD衰減距離為5.2 kb)對控制粒長發(fā)育的候選基因進(jìn)行掃描。候選基因的注釋功能及相關(guān)信息參照玉米遺傳學(xué)及基因組學(xué)數(shù)據(jù)庫(http://www.maizegdb.org/)和美國國立生物技術(shù)信息中心網(wǎng)站(http://www.ncbi.nlm.nih.gov/)。
如表2所示,在2014年和2015年不同地點種植玉米自交系的籽粒長度變異范圍在0.56~1.14 cm,標(biāo)準(zhǔn)差分別為0.11,0.15,0.12和0.14,說明玉米籽粒長度的遺傳變異較大。通過方差分析得到的F值顯示,不同玉米自交系的粒長間達(dá)到極顯著差異水平(P<0.01);基因型與環(huán)境互作方差為0.023(P<0.01)。利用Knapp等[11]提出的公式計算玉米籽粒長度的廣義遺傳力為83.67%,與前人的研究結(jié)果[2,5,18]相近,說明該性狀可以有效地通過表型進(jìn)行選擇。Pearson相關(guān)分析表明,不同環(huán)境下的玉米籽粒長度間達(dá)到極顯著正相關(guān)(P<0.01)。
表2 80份玉米自交系籽粒長度的統(tǒng)計分析Table 2 Statistics of kernel lengths of 80 elite maize inbred lines in two years
注:**表示在P=0.01水平顯著。
Note: **indicates significance atP=0.01.
利用重測序得到的1 490 007個高質(zhì)量的SNP標(biāo)記對玉米粒長關(guān)聯(lián)群體全基因組的LD進(jìn)行估計。如圖1所示,當(dāng)r2=0.1時,關(guān)聯(lián)群體全基因組的平均LD衰減距離約為5.2 kb,該結(jié)果小于已有研究得到的LD長度[19-20],說明本研究所用的關(guān)聯(lián)群體具有較快的LD衰減速率。
圖1 玉米粒長關(guān)聯(lián)群體全基因組范圍內(nèi)的連鎖不平衡衰減Fig.1 Linkage disequilibrium decay across whole genome of maize kernel length association panels
本研究采用FarmCPU方法對80個玉米自交系的籽粒長度進(jìn)行全基因組關(guān)聯(lián)分析,結(jié)果顯示除了2014年在長春未檢測到與目標(biāo)性狀顯著關(guān)聯(lián)的標(biāo)記外,其余3個環(huán)境下共檢測到16個與玉米粒長顯著關(guān)聯(lián)(P<10-6)的SNP(圖2)。這些標(biāo)記分布在第1、第2、第3、第7和第10號染色體上,解釋的表型變異率在1.68%~27.61% (表3),其中位于染色體框10.03的SNP解釋的表型變異率最低,而位于染色體框3.04物理位置為74171556的SNP解釋的表型變異率最高,達(dá)到27.61%。同樣位于染色體框3.04,物理位置為110936416的SNP標(biāo)記在2015年的2個地點均被檢測到,且該標(biāo)記在長春環(huán)境下具有最小的P值,說明其與籽粒長度關(guān)聯(lián)最顯著。
表3 與玉米籽粒長度顯著關(guān)聯(lián)的SNP位點(P<10-6)Table 3 SNPs identified to be associated with maize kernel length (P<10-6)
注:已有研究中定位的粒長QTL與本研究檢測到的顯著性SNP具有一致性。
Note: There exists consistency between significant SNPs and QTL interval reported in previous studies.
在5.2 kb的連鎖不平衡范圍內(nèi),對16個與玉米粒長顯著關(guān)聯(lián)(P<10-6)的SNP位點進(jìn)行掃描分析,共得到3個候選基因(表3),其中GRMZM2G018607和GRMZM2G034882的基因座內(nèi)各包含1個顯著性SNP,它們均位于基因的外顯子區(qū)域且為同義突變?;騁RMZM2G018607的編碼產(chǎn)物是一個ABCF4轉(zhuǎn)運蛋白(ABC transporter F family member 4),該蛋白質(zhì)包含ABCF_EF-3和ABC_tran_Xtn 2種結(jié)構(gòu)域,可能參與調(diào)節(jié)應(yīng)激相關(guān)蛋白的翻譯合成過程[23]。基因GRMZM2G034882預(yù)測編碼1種WIP2互作蛋白(WPP domain-interacting protein 2),這種產(chǎn)物作為植物特有的外層核膜蛋白,在將RanGAP錨定在核膜上及維護(hù)細(xì)胞核形態(tài)的過程中發(fā)揮作用[24-25]?;騁RMZM2G322641編碼1個含DUF2346結(jié)構(gòu)域的蛋白質(zhì),目前該蛋白家族成員的生物學(xué)功能還未知。
關(guān)聯(lián)群體的連鎖不平衡水平不僅決定了全基因組關(guān)聯(lián)分析的定位精度,而且對所選用的標(biāo)記數(shù)量、密度以及所采取的試驗方案等都會產(chǎn)生較大影響。2013年劉化龍等[26]研究認(rèn)為,種質(zhì)資源的連鎖不平衡與其地理起源密切相關(guān),群體遺傳進(jìn)化上的差異最終導(dǎo)致了LD的差異。2013年Romay等[19]利用681 257個SNP標(biāo)記對2 815份來自美國玉米種質(zhì)資源庫的自交系進(jìn)行了連鎖不平衡分析,結(jié)果顯示當(dāng)r2=0.1時,整個群體的LD衰減距離在10 kb左右,其中熱帶玉米種質(zhì)的LD接近于整個群體的連鎖不平衡水平,而其他SS、NSS和ExPVP群體的LD衰減距離則達(dá)到50 kb以上。2012年Wang等[20]以144份我國玉米雜交種親本作為研究群體,采用45 868個SNP對其全基因組的連鎖不平衡進(jìn)行分析,認(rèn)為關(guān)聯(lián)群體的平均LD衰減距離在200 kb左右,其中衰減最慢的染色體甚至達(dá)到了750 kb。該結(jié)果遠(yuǎn)大于本研究得到的5.2 kb的衰減距離,這可能是由于前者所選擇的親本自交系群體中基因或染色體片段受到的選擇強度較大所致;另外,本試驗采用的核心玉米自交系數(shù)量小于上述研究,供試種質(zhì)的遺傳構(gòu)成較復(fù)雜,這也可能是導(dǎo)致群體LD衰減較快的另一個主要原因。
自2011年Tian等[27]將全基因組關(guān)聯(lián)分析用于玉米莖葉夾角的定位研究以來,該技術(shù)在玉米主要病害、開花期和抗逆性等其他復(fù)雜性狀的遺傳解析中也得到了廣泛應(yīng)用[28-30]。本研究采用FarmCPU方法對由80個核心玉米自交系組成的關(guān)聯(lián)群體進(jìn)行了全基因組關(guān)聯(lián)分析,在4個環(huán)境下共檢測到16個與玉米粒長顯著關(guān)聯(lián)(P<10-6)的SNP標(biāo)記。這些位點中有7個位于前人已定位的粒長QTL置信區(qū)間內(nèi)[7,21-22]。其中位于染色體框7.02(物理位置為96607424和111201213)、10.04(物理位置為124464498)及3.04(物理位置為74171556)的4個顯著性SNP與Chen等[21]定位的籽粒長度QTL具有一致性;位于染色體框7.02,10.03(物理位置為37333210)和10.04的4個顯著性SNP,與陳哲等[22]利用176個F2:3家系為作圖群體定位的結(jié)果相吻合。2012年曹曉良等[7]利用1個F2:3分離群體在umc1917-umc1603處定位到粒長的QTL,本研究檢測到的位于染色體框1.05的2個顯著性SNP也在該區(qū)間的物理位置內(nèi)。另外,2009年李永祥等[31]對玉米籽粒構(gòu)型性狀與產(chǎn)量性狀進(jìn)行相關(guān)性分析得出,玉米粒長與單穗產(chǎn)量的相關(guān)系數(shù)最高,達(dá)到了0.64,說明籽粒長度對玉米產(chǎn)量具有較大的貢獻(xiàn)。所以,本研究對這16個顯著性SNP與前人定位的產(chǎn)量性狀QTL[32-36]進(jìn)行比對,發(fā)現(xiàn)除了位于染色體框3.08及10.03的3個SNP外,其余的標(biāo)記位點均位于已有產(chǎn)量性狀的QTL置信區(qū)間內(nèi),說明控制這2個性狀的基因可能存在連鎖關(guān)系,或者在這些染色體熱點區(qū)域有控制玉米產(chǎn)量及籽粒長度的多效基因存在。
近年來,盡管研究者利用不同的分子標(biāo)記技術(shù)定位了較多的控制玉米籽粒構(gòu)型性狀的數(shù)量性狀位點[7-10],但從這些位點中挖掘控制玉米粒長的功能基因還未見報道。本研究對16個與玉米籽粒長度顯著關(guān)聯(lián)(P<10-6)的SNP位點進(jìn)行掃描分析,共得到3個候選基因?;騁RMZM2G018607編碼一個ABCF4轉(zhuǎn)運蛋白,該產(chǎn)物與ABC轉(zhuǎn)運蛋白家族的其他成員有所不同,僅位于細(xì)胞質(zhì)中,蛋白質(zhì)無跨膜區(qū)域,因而不具有轉(zhuǎn)運功能[37]。2011年Zeng等[23]對scord5和ila-3 2種擬南芥突變體進(jìn)行研究得出,ABCF家族蛋白AtABCF3是細(xì)菌觸發(fā)氣孔關(guān)閉反應(yīng)的重要組成部分,它可能在氣孔關(guān)閉的早期反應(yīng)通路中通過調(diào)節(jié)應(yīng)激相關(guān)蛋白的翻譯合成而發(fā)揮作用?;騁RMZM2G034882預(yù)測編碼一種含有SMC_prok_A結(jié)構(gòu)域的WIP2互作蛋白,它通過與特定的內(nèi)層核膜蛋白進(jìn)行互作,從而將其本身及RanGAP固定在核膜上,之后RanGAP催化RanGTPase對結(jié)合的GTP進(jìn)行快速水解,精確調(diào)控核質(zhì)間RanGTP和RanGDP的濃度梯度,有效促進(jìn)細(xì)胞內(nèi)的核質(zhì)運輸、紡錘體組裝、核膜重建和異染色質(zhì)的組裝等[38-39]。2012年Zhou等[25]對3種wip擬南芥突變體的葉片表皮細(xì)胞進(jìn)行DAPI熒光成像觀察得出,與野生型植株相比,突變體葉片表皮細(xì)胞的細(xì)胞核長度顯著降低,說明WIP2互作蛋白在維持細(xì)胞核特定形態(tài)的過程中也扮演著重要角色。基因GRMZM2G322641編碼一個含有DUF2346結(jié)構(gòu)域的未知功能蛋白。通過對其cDNA序列進(jìn)行BLAST分析,結(jié)果顯示在水稻、高粱和谷子等主要農(nóng)作物的基因組中均發(fā)現(xiàn)GRMZM2G322641的直系同源基因,說明該基因的存在比較普遍,其生物學(xué)功能及參與的代謝途徑還需要進(jìn)一步驗證研究。
候選基因的鑒定與所用的關(guān)聯(lián)群體和多態(tài)性標(biāo)記密度有直接關(guān)系。在不同的關(guān)聯(lián)群體中等位基因頻率有所差異,這種差異可能導(dǎo)致在特定基因組區(qū)域中多態(tài)性位點的不一致,從而使關(guān)聯(lián)分析的結(jié)果不同[40]。另外,隨著高通量測序技術(shù)的快速發(fā)展,應(yīng)用不同測序技術(shù)獲得的多態(tài)性信息含量差異較大,較高的標(biāo)記密度在解析玉米復(fù)雜性狀的遺傳結(jié)構(gòu)時具有更好的分辨率。所以,本研究采用第二代測序技術(shù)對由80個核心玉米自交系組成的關(guān)聯(lián)群體進(jìn)行重測序,經(jīng)過全基因組關(guān)聯(lián)分析共得到3個候選基因,其可能與玉米籽粒長度緊密相關(guān),為進(jìn)一步研究玉米粒長的遺傳機理奠定了前期基礎(chǔ)。