常 瑋,王 娟,黃志剛,陳吉寶
(南陽師范學(xué)院 農(nóng)業(yè)工程學(xué)院,河南 南陽 473061)
?
利用超級集群分離分析法鑒別大豆增變基因
常 瑋,王 娟,黃志剛,陳吉寶
(南陽師范學(xué)院 農(nóng)業(yè)工程學(xué)院,河南 南陽 473061)
【目的】 利用大豆基因組Wm82.a2.v1及HapMap數(shù)據(jù)來鑒別大豆中可能存在的增變基因?!痉椒ā?將大豆HapMap數(shù)據(jù)(包含19 652份大豆種質(zhì)在52 041個位點上的分型結(jié)果)預(yù)處理后,利用改進的超級集群分離分析法,選取滑動窗口大小、步長及閾值大小為參數(shù),對預(yù)處理后的大豆種質(zhì)數(shù)據(jù)進行分析,測算大豆點突變比率及突變熱點區(qū)數(shù)目,并將點突變比率及突變熱點區(qū)數(shù)目與分子標(biāo)記進行關(guān)聯(lián)性分析,從強關(guān)聯(lián)區(qū)內(nèi)挖掘候選增變基因,用大豆基因組Wm82.a2.v1對其功能進行初步推測?!窘Y(jié)果】 大豆HapMap數(shù)據(jù)預(yù)處理后,15 391份大豆種質(zhì)點突變比率為0.089~0.531,平均變異率為0.261;突變熱點區(qū)數(shù)目為5~1 324個,平均每份種質(zhì)包含347.8個突變熱點區(qū)。超級集群分離分析結(jié)果表明,Gm16上的29 153 474-30 604 603 bp和Gm17上的12 133 293-12 147 725 bp片段為與點突變比率和突變熱點區(qū)數(shù)目2個表型同時存在強關(guān)聯(lián)的區(qū)域;其中Gm16上的Glyma16g26440.1和Gm17上的Glyma17g15420.1同屬于nudix水解酶基因家族,推測其與基因組突變有關(guān)?!窘Y(jié)論】Glyma16g26440.1和Glyma17g15420.1 2個nudix水解酶基因家族成員都與點突變比率和突變熱點區(qū)數(shù)目存在強關(guān)聯(lián),可作為大豆基因組候選增變基因。
大豆;突變熱點;增變基因;超級集群分離分析;nudix水解酶基因
大豆是重要的油料作物和植物蛋白的主要來源。目前大豆育種的常規(guī)方法是將兩親本進行雜交,再通過后代連續(xù)的自交選擇獲得新的大豆種質(zhì)。由于大豆異花授粉難度很大,與玉米等作物相比,無法產(chǎn)生較為豐富的變異類型,而通過化學(xué)或物理的方式進行人工誘變,可以獲得較為豐富的變異類型。但限于突變率較低的原因,人工誘變?nèi)晕茨塬@得廣泛應(yīng)用。因此通過研究增變基因來提高大豆突變率,將會大大促進大豆突變育種的發(fā)展。
在生物學(xué)中,突變是指細(xì)胞中的遺傳物質(zhì)(如染色體DNA、細(xì)胞質(zhì)DNA以及其他遺傳單元)發(fā)生改變的自然過程。它包括單個堿基改變所引起的點突變或多個堿基的缺失、重復(fù)和插入。突變通常是由輻射、化學(xué)誘變劑或一些可移動遺傳原件,如轉(zhuǎn)座子的插入及刪除引起的DNA序列改變[1-2]。從理論上講,DNA分子上每一個堿基都可能發(fā)生突變,但實際上突變部位并非完全隨機分布,因為DNA分子上的各個部分有著不同的突變頻率,某些部位的突變頻率明顯高于平均數(shù),這些部位就稱為突變熱點[3]。對突變熱點的研究,不僅可以揭示突變產(chǎn)生的機制,還可以闡明某一目標(biāo)蛋白功能域(Functional domains)所具有的功能[4-5]。p53蛋白是迄今為止研究最多的一種抑癌蛋白,在調(diào)控機體代謝、生殖方面以及腫瘤發(fā)生中發(fā)揮著重要作用。TP53突變在腫瘤發(fā)生中比較常見,且不同位點的點突變產(chǎn)生了多種形式的突變p53蛋白[6-7]。不僅如此,植物基因組上也存在在著突變熱點。例如,在大豆中,脂氧合酶基因Lox1和Lox2存在突變熱點區(qū)[8]。此外,對人類及大豆等HapMap數(shù)據(jù)的分析發(fā)現(xiàn),突變位點的非隨機分布還表現(xiàn)在同一物種的不同個體間,例如大豆種質(zhì)PI479750所包含的突變位點數(shù)目是PI416792的6倍[9]。
目前,對于突變熱點形成的原因仍未完全明了。有研究指出,在人類基因的突變熱點中,C∶G二核苷酸更容易發(fā)生突變,這是因為5-甲基胞嘧啶(MeC)經(jīng)脫氨基作用就轉(zhuǎn)變成胸腺嘧啶(T),這樣,在DNA修復(fù)系統(tǒng)不完善的情況下,G∶C配對就可能變成G∶T錯配,從而引起基因突變[10-11]。還有證據(jù)表明,在短的連續(xù)重復(fù)序列處容易發(fā)生插入或缺失突變,如鼠傷寒沙門氏菌hisD3052的基因序列上CGCGCGCG重復(fù)區(qū)域易發(fā)生二堿基對缺失[12];其產(chǎn)生機制可能是由于短的同源重復(fù)序列之間發(fā)生了重組[13],或DNA聚合酶在短重復(fù)序列之間發(fā)生了滑移[14]。此外,突變熱點還與突變劑種類有關(guān),如Lox2基因第8外顯子上存在γ射線敏感位點,而在人工培育的哺乳動物細(xì)胞中,TP53上含有MeC的嘧啶二聚體更容易在紫外線照射下發(fā)生突變,從而誘發(fā)皮膚癌[8,15]。在上述研究的基礎(chǔ)上,Rogozin等[16]對突變熱點周圍序列特征進行了詳細(xì)論述,總結(jié)了18種易突變模體(Mutable motif)。
除DNA結(jié)構(gòu)的影響外,在生物體內(nèi),還存在著一種與突變發(fā)生和抑制相關(guān)的基因,稱為增變基因(Mutators)。增變基因通常與DNA修復(fù)有關(guān),例如人類的DNA聚合酶β和載脂蛋白B mRNA編輯酶(Apolipoprotein B mRNA editing enzyme,catalytic polypeptide-like,APOBEC)[17-18]。Jonathan等[19]總結(jié)了原核生物和真核生物中的增變基因,并闡述了其在逆境脅迫中的功能。在植物中也有類似功能的增變基因,如擬南芥中的AtMSH2已經(jīng)被證實具有穩(wěn)定基因組結(jié)構(gòu)和增變的效應(yīng)[20]。但大豆中還未發(fā)現(xiàn)此類基因。
采用集群分離分析法(Super Bulked Segregant Analysis,BSA)進行功能基因挖掘已經(jīng)積累了許多成功的案例[21]。然而,由于傳統(tǒng)的BSA方法只能對由少數(shù)個體組成的集群進行分析,因此檢測效力較低,且容易產(chǎn)生假陽性結(jié)果。例如,在傳統(tǒng)BSA研究中,由10個個體組成的混合群體,如果其中某個個體的基因型與其他個體基因型不同,則不能判定該位點是否與性狀相關(guān)聯(lián)。而超級集群分離分析法(Super Bulked Segregant Analysis,Super-BSA)是基于HapMap數(shù)據(jù)進行的,混合群體內(nèi)每個個體的基因型均為已知,因此可以根據(jù)某位點不同基因型的比率來進行關(guān)聯(lián)性分析,提高了檢測效力[22]。
本研究以大豆基因組Wm82.a2.v1及HapMap數(shù)據(jù)為基礎(chǔ),采用Super-BSA的理論及算法,對大豆不同個體間單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)熱點區(qū)及數(shù)目差異產(chǎn)生的機制進行遺傳分析,同時挖掘具有增變基因效應(yīng)的候選基因,以期為大豆突變育種研究提供參考。
1.1 數(shù)據(jù)來源及預(yù)處理
大豆基因組Wm82.a2.v1,用于基因組定位及功能基因注釋,下載于phytozome網(wǎng)站(http://phytozome.jgi.doe.gov/,2014-01-24更新)[23]。大豆HapMap數(shù)據(jù)(包含19 652份大豆種質(zhì)在52 041個位點上的分型結(jié)果)來源于SoyBase(http://soybase.org/snps)[9],用于數(shù)據(jù)挖掘。應(yīng)用Plink version 1.07的質(zhì)量控制功能來進行大豆HapMap數(shù)據(jù)的預(yù)處理[24],處理標(biāo)準(zhǔn)如下:剔除頻率(Minor Allele Arequency,MAF)小于1%的稀有位點,缺失超過5%、且違背Hardy-Weinberg平衡(P<1×10-6)的SNP位點,以及缺失基因型、雜合基因型和未知基因型總數(shù)大于10%的種質(zhì)。
1.2 數(shù)據(jù)標(biāo)準(zhǔn)化及點突變比率的計算
采用Perl腳本對經(jīng)質(zhì)量控制后的大豆HapMap數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,計算每份大豆種質(zhì)的點突變比率(R_snp)。數(shù)據(jù)標(biāo)準(zhǔn)化方法如下:剔除雜合基因型及未知基因型,統(tǒng)計每個位點上不同基因型數(shù)目,并將其中數(shù)目最多的基因型作為背景,記作‘0’;另外一種基因型作為突變,記作‘1’。
在此基礎(chǔ)上計算每份大豆種質(zhì)的點突變比率,計算方法如下:
R_snp=Sum1/(Sum1+Sum0)。
式中:Sum1和Sum0分別為某份大豆種質(zhì)在所有剩余位點中所包含的基因型為‘1’和‘0’的數(shù)目。
1.3 突變熱點區(qū)的確定
點突變熱點區(qū)的確定采用滑動窗口法進行。首先以每份大豆種質(zhì)為單位,根據(jù)標(biāo)準(zhǔn)化的數(shù)據(jù)及不同位點的位置信息,利用R程序統(tǒng)計相鄰兩位點間距大小的分布情況,并繪制概率密度函數(shù)曲線,同時利用quantile()函數(shù)求得累積概率為0.95時所對應(yīng)的間距大小,并以此為窗口大小。以5%窗口大小為步長,并以該窗口內(nèi)所包含SNP位點數(shù)期望值的倍數(shù)作為熱點區(qū)判斷的閾值,計算方法如下:
Thotspot=N+Wlength/μlen。
其中:Thotspot為熱點區(qū)判斷的閾值,Wlength為窗口大小,μlen為所有位點間距的均值,N取自然數(shù)。
根據(jù)N值及窗口大小和步長,確定不同閾值條件下每份大豆種質(zhì)所包含的熱點區(qū)的數(shù)目。將不同閾值條件下所得到的突變熱點區(qū)數(shù)目與點突變比率進行簡單相關(guān)分析,滿足相關(guān)系數(shù)>0.5的最大自然數(shù)即為最終的N值,并依此求得Thotspot。
1.4 點突變比率及突變熱點區(qū)數(shù)目的超級集群分離分析
以點突變比率及熱點區(qū)數(shù)目為表型,設(shè)這2個表型在大豆種質(zhì)群體中的分布符合高斯混合模型(Gaussian Mixture Model,GMM),采用R程序中的EM算法來進行GMM的參數(shù)估計,再根據(jù)參數(shù)估計的結(jié)果計算混合分布兩側(cè)各組分所占比例為90%的分位數(shù),并以此為依據(jù)進行分群。
在上述分群的基礎(chǔ)上,參考Super-BSA的理論方法,采用改進的算法進行點突變比率及熱點區(qū)數(shù)目與分子標(biāo)記的關(guān)聯(lián)性分析[22]。具體做法為:分別計算2集群(L集群和H集群)內(nèi)每個位點上基因型‘1’和‘0’的比值R,分母為0時,比值計為1 000;根據(jù)分群標(biāo)準(zhǔn),統(tǒng)計L集群內(nèi)R大于9、同時H集群內(nèi)R小于1/9,或L集群內(nèi)R小于1/9、同時H集群內(nèi)R大于9的位點,即為關(guān)聯(lián)位點。
1.5 候選基因的挖掘及其功能注釋
根據(jù)集群分離分析結(jié)果,以連續(xù)存在3個以上關(guān)聯(lián)位點的區(qū)域為強關(guān)聯(lián)區(qū),并將強關(guān)聯(lián)區(qū)內(nèi)所包含的基因作為候選基因,最后根據(jù)大豆基因組注釋信息對候選基因進行功能注釋。
2.1 大豆HapMap數(shù)據(jù)預(yù)處理及點突變比率的計算
經(jīng)預(yù)處理,最終可以用于分析的大豆HapMap數(shù)據(jù)包含15 391份大豆種質(zhì)在42 449個位點上的分型結(jié)果。由于突變發(fā)生的概率很低,故將每個位點上基因型比例小于50%的位點作為突變點。經(jīng)統(tǒng)計,大豆種質(zhì)間點突變比率R_snp為0.089~0.531,平均變異率為0.261;但個體間變異率差異很大,變異系數(shù)為27.3%,且呈混合分布模式(圖1)。
2.2 大豆種質(zhì)突變熱點區(qū)數(shù)目的確定
經(jīng)計算,用于分析的15 391份大豆種質(zhì)中95%的突變熱點間距不超過54 784.6 bp(圖2),故本研究的窗口大小確定為Wlength=54 800 bp,步長為2 740 bp。
相鄰兩位點間距的平均值(μlen)為 11 092 bp,則一個窗口范圍內(nèi)所包含的點突變數(shù)目的期望值Esnp=Wlength/μlen=4.94≈5個,說明突變熱點判定閾值Thotspot的取值范圍為大于5的一切自然數(shù)。本研究擬通過點突變比率和突變熱點區(qū)數(shù)目2個表型來探討突變熱點的產(chǎn)生機制,為了盡量消除點突變比率對突變熱點區(qū)數(shù)目的影響,以滿足2個表型間相關(guān)系數(shù)>0.5的最大自然數(shù)為最終的N值。經(jīng)計算,最終的閾值Thotspot=13,此時點突變比率與突變熱點區(qū)數(shù)目2個表型間的相關(guān)系數(shù)為0.53。根據(jù)上述參數(shù)統(tǒng)計每份大豆種質(zhì)的突變熱點數(shù)分布情況,以大豆種質(zhì)PI416792染色體Gm01為例,其突變熱點數(shù)如圖3所示。
圖 1 15 391份大豆種質(zhì)點突變比率的分布
圖 2 15 391份大豆種質(zhì)突變熱點間距的分布
圖 3 大豆種質(zhì)PI416792染色體Gm01的突變熱點分布
Fig.3 Number of mutation hotspots of PI416792 on Gm01
經(jīng)統(tǒng)計,15 391份大豆種質(zhì)的突變熱點區(qū)數(shù)目為5~1 324個,平均每份種質(zhì)包含347.8個突變熱點區(qū)。個體間的變異程度遠(yuǎn)大于點突變比率,其變異系數(shù)為62.4%,但也呈混合分布模式(圖4)。
圖 4 15 391份大豆種質(zhì)突變熱點區(qū)數(shù)目分布
Fig.4 Number distribution of mutation hotspots among 15 391 soybean accessions
2.3 大豆種質(zhì)點突變比率及突變熱點區(qū)數(shù)目的關(guān)聯(lián)位點挖掘
2.3.1 混合群體分群 如圖1和圖4所示,15 391份大豆種質(zhì)的點突變比率及突變熱點區(qū)數(shù)目均呈混合分布模式。為了能客觀地分群,采用EM算法進行GMM參數(shù)估計。通過參數(shù)估計,可將點突變比率及突變熱點區(qū)數(shù)目2個表型分為高均值群體和低均值群體(圖5)。以突變熱點區(qū)數(shù)目為例,其分布可看作由2個高斯分布組成,根據(jù)2個峰值的位置及群體標(biāo)準(zhǔn)差,初始值設(shè)置為:均值μ=(200,400),標(biāo)準(zhǔn)差δ=(100,200),權(quán)重α=(0.3,0.7);經(jīng)過36輪循環(huán),各參數(shù)趨于穩(wěn)定,將初始值最終修正為:μ=(211.8,485.9),δ=(91.7,220.1),α=(0.50,0.50)。采用同樣的方法,確定組成點突變比率分布的2個高斯分布參數(shù)為:μ=(0.197,0.260),δ=(0.029,0.067),α=(0.52,0.48)。
最后,根據(jù)GMM參數(shù)估計結(jié)果進行分群,經(jīng)計算,突變熱點區(qū)數(shù)目<160的大豆種質(zhì)有超過90%來自低均值群體(μ=211.8),而突變熱點區(qū)數(shù)目為340~720的大豆種質(zhì)有超過90%的來自于高均值群體(μ=485.9)。根據(jù)同樣的判定方法,確定點突變比率<0.193的大豆種質(zhì)有超過90%的個體來自低均值群體(μ=0.197),而點突變比率>0.247的大豆種質(zhì)有超過90%的個體來自于高均值群體(μ=0.260)。
圖 5 基于GMM參數(shù)估計結(jié)果的大豆種質(zhì)突變熱點區(qū)數(shù)目(a)及點突變比率(b)的群體分布
2.3.2 關(guān)聯(lián)位點的確定 根據(jù)上述分群結(jié)果,分別統(tǒng)計2種表型的低均值和高均值群體內(nèi)2種基因型‘1’和‘0’的比值,進行標(biāo)記位點與表型的關(guān)聯(lián)性分析。以連續(xù)存在3個以上關(guān)聯(lián)位點的區(qū)間為強關(guān)聯(lián)區(qū),最終在Gm16、Gm17和Gm19上各獲得1個與點突變率存在強關(guān)聯(lián)的區(qū)間,范圍分別為29 144 428-30 604 603,12 107 463-12 147 725和45 000 827-45 178 132 bp;在Gm16和Gm17上各獲得1個與突變熱點區(qū)數(shù)目存在強關(guān)聯(lián)的區(qū)間,范圍為29 153 474-20 604 603和12 133 293-12 210 561 bp(表1)。
表 1 大豆種質(zhì)點突變比率及突變熱點區(qū)數(shù)目的強關(guān)聯(lián)區(qū)標(biāo)記信息匯總
注:*表示不滿足判定條件標(biāo)記的關(guān)聯(lián)系數(shù),N表示不相關(guān),Y表示相關(guān)。
Note:* indicates the non-compliance association coefficient,N denotes no and Y denotes yes.
2.4 大豆種質(zhì)增變候選基因的挖掘及其功能注釋
2.4.1 候選基因的挖掘 根據(jù)關(guān)聯(lián)位點的挖掘結(jié)果,以大豆種質(zhì)點突變比率和突變熱點區(qū)數(shù)目2個表型同時定位到的區(qū)間,即二者結(jié)果的交集進行獲選基因的挖掘。結(jié)果顯示,Gm16上的29 153 474-30 604 603 bp和Gm17上的12 133 293-12 147 725 bp片段所包含的編碼序列為候選基因。其中,Gm16上包含115個候選基因(Glyma16g25185.1~Glyma16g26500.1);Gm17上包含103個候選基因(Glyma17g15380.1~Glyma17g15490.1)。由于篇幅有限,本研究只列出部分候選基因,結(jié)果見表2。
2.4.2 候選基因的功能注釋 參考大豆基因組Wm82.a2.v1所包含的信息對上述基因進行功能注釋,結(jié)果見表2。由表2可見,Gm16上的Glyma16g26440.1和Gm17上的Glyma17g15420.1同屬于nudix水解酶基因家族,Gm16上的Glyma16g25330.1和Gm17上的Glyma17g15530.1同屬于α/β-水解酶家族,其他基因都僅在其中一個染色體區(qū)間存在。進一步的功能分析表明,nudix水解酶家族基因編碼蛋白為具有不同程度底物特異性的水解酶,可以水解包括核苷二磷酸、核苷三磷酸及RNA帽等一系列有機焦磷酸鹽[25]。這些功能均與基因組突變有關(guān),因此將Glyma16g26440.1和Glyma17g15420.1作為大豆基因組候選增變基因。
表 2 大豆種質(zhì)部分增變候選基因及其功能注釋信息
注:加粗字體表示在2條染色體上同時挖掘到的屬于同一基因家族的基因。
Note:The bold font indicates the genes identified on both chromosomes and belong to the same gene family.
3.1 研究大豆增變基因的意義
隨著很多植物全基因組測序的完成,世界上許多實驗室迅速展開了大規(guī)模建立突變體庫的工作,這直接促進了植物基因功能研究及作物性狀改良的發(fā)展[26-27]。植物的自發(fā)突變率很低,通過化學(xué)手段、物理手段可以有效提高其突變率,但仍然需要構(gòu)建龐大的突變體庫來進行突變體的篩選。例如,趙永亮等[28]利用EMS處理玉米自交系黃早4和7922的成熟花粉,在全部2 754個EMS誘變后代M2果穗中,發(fā)現(xiàn)白色胚乳基因y1的突變體有97個[28]。通過研究增變基因來提高植物突變率,將大大促進作物突變育種的發(fā)展,特別是像大豆這種異花授粉難度很大的作物。
3.2 改進的超級集群分離分析法的優(yōu)點
為了更好地進行數(shù)據(jù)挖掘,本研究在Super-BSA方法的基礎(chǔ)上進行了如下改進。第一,為了準(zhǔn)確描述突變熱點這一表型,采用滑動窗口法來定義突變熱點,同時采用突變熱點區(qū)數(shù)目來反映某個體突變程度的高低。所謂的突變熱點區(qū)數(shù)目,即在基因組上以單位步長移動窗口,滿足一個窗口內(nèi)所包含的突變點數(shù)目超過閾值的窗口的數(shù)目,這一數(shù)值是突變熱點區(qū)數(shù)目及突變熱點區(qū)長度平衡后的結(jié)果,可以客觀地反映每個個體的突變情況;第二,在進行閾值確定時,以滿足突變熱點區(qū)數(shù)目與點突變比率相關(guān)系數(shù)大于0.5的最大自然數(shù)為選擇標(biāo)準(zhǔn),目的是降低點突變比率對突變熱點區(qū)數(shù)目的干擾,從而更準(zhǔn)確地進行基因定位;第三,與其他研究直接選擇群體兩端相同數(shù)目個體進行分群[22]不同的是,本研究首先采用EM算法來估計組成混合分布中的每種高斯分布,再根據(jù)混合分布中某類個體所占的比率進行分群。這樣不僅可以做到客觀分群,還可為下一步的關(guān)聯(lián)位點分析判定標(biāo)準(zhǔn)的選擇提供參考。本研究所采用的改進的Super-BSA方法也可以擴展到其他物種的不同性狀研究中。
3.3 大豆增變候選基因的功能
本研究利用大豆基因組Wm82.a2.v1及HapMap數(shù)據(jù),采用Super-BSA鑒定出2個同屬于nudix水解酶基因家族的基因Glyma16g26440.1和Glyma17g15420.1。研究表明,在大腸桿菌中,nudix的直系同源基因MutT具有抑制基因突變的功能[29]。而植物中,由于nudix水解酶的底物特異性,其功能已經(jīng)延伸到細(xì)胞響應(yīng)調(diào)控的各個方面[30-32],但植物nudix水解酶基因與基因突變的關(guān)系尚不明確,而本研究的結(jié)果將為這一問題的闡明提供理論依據(jù)。
本研究發(fā)現(xiàn),不同的大豆種質(zhì)的點突變比率及突變熱點區(qū)數(shù)目存在較大差異,如點突變比率為0.089~0.531,突變熱點區(qū)數(shù)目為5~1 324個。因此可以將點突變比率和突變熱點區(qū)數(shù)目作為表型用于分析與大豆突變相關(guān)的基因,且這2個表型皆符合GMM模型,通過參數(shù)估計,可分別將以上2個表型分為高均值群體和低均值群體,此分群結(jié)果可作為Super-BSA的分群依據(jù)。通過位點與性狀的關(guān)聯(lián)性分析,分別在Gm16和Gm17上定位到與2個表型同時存在強關(guān)聯(lián)性的位點,共包含218個候選基因,其中,Gm16上的Glyma16g26440.1和Gm17上的Glyma17g15420.1同屬于nudix水解酶基因家族,可作為大豆基因組候選增變基因進行進一步的研究。
[1]Aminetzach Y T,Macpherson J M,Petrov D A.Pesticide resistance via transposition-mediated adaptive gene truncation inDrosophila[J].Science,2005,309(5735):764-767.
[2]Burrus V,Waldor M K.Shaping bacterial genomes with integrative and conjugative elements [J].Res Microbiol,2004,155(5):376-386.
[3]Benzer S.On the topography of the genetic fine structure [J].Proc Natl Acad Sci USA,1961,47(3):403-415.
[4]Suckow J,Markiewicz P,Kleina L G,et al.Genetic studies of the Lac repressor:ⅩⅤ.4000 single amino acid substitutions and analysis of the resulting phenotypes on the basis of the protein structure [J].J Mol Biol,1996,261(4):509-523.
[5]Betz A G,Neuberger M S,Milstein C.Discriminating intrinsic and antigen-selected mutational hotspots in immunoglobulin V genes [J].Immunol Today,1993,14(8):405-411.
[6]陸思千,賈舒婷,羅 瑛.突變p53功能研究新進展與個性化的腫瘤治療新策略 [J].遺傳,2011,33(6):539-548.
Lu S Q,Jia S T,Luo Y.Recent advances in mutant p53 and novel personalized strategies for cancer therapy [J].Hereditas,2011,33(6):539-548.
[7]Krawczak M,Smith-Sorensen B,Schmidtke J,et al.Somatic spectrum of cancer-associated single basepair substitutions in theTP53 gene is determined mainly by endogenous mechanisms of mutation and by selection [J].Hum Mutat,1995,5(1):48-57.
[8]Lee K J,Hwang J E,Velusamy V,et al.Selection and molecular characterization of a lipoxygenase-free soybean mutant line induced by gamma irradiation [J].Theor Appl Genet,2014,127(11):2405-2413.
[9]Song Q,Hyten D L,Jia G,et al.Development and evaluation of SoySNP50K,a high-density genotyping array for soybean [J].PLoS One,2013,8(1):e54985.
[10]Cooper D N,Youssoufian H.The CpG dinucleotide and human genetic disease [J].Hum Genet,1988,78(2):151-155.
[11]Krawczak M,Ball E V,Cooper D N.Neighboring nucleotide effects on the rates of germ-line single-base-pair substitution in human genes [J].Am J Hum Genet,1998,63(2):474-488.
[12]Isono K,Yourno J.Chemical carcinogens as frameshift mutagens:SalmonellaDNA sequence sensitive to mutagenesis by polycyclic carcinogens [J].Proc Natl Acad Sci U S A,1974,71(5):1612-1617.
[13]Ehrlich S D,Bierne H,d’Alencon E,et al.Mechanisms of illegitimate recombination [J].Gene,1993,135(1/2):161-166.
[14]Tran H T,Degtyareva N P,Koloteva N N,et al.Replication slippage between distant short repeats inSaccharomycescerevisiaedepends on the direction of replication and theRAD50 andRAD52 genes [J].Mol Cell Biol,1995,15(10):5607-5617.
[15]You Y H,Li C,Pfeifer G P.Involvement of 5-methylcytosine in sunlight-induced mutagenesis [J].J Mol Biol,1999,293(3):493-503.
[16]Rogozin I B,Pavlov Y I.Theoretical analysis of mutation hotspots and their DNA sequence context specificity [J].Mutat Res,2003,544(1):65-85.
[17]鄭乃剛,高涵昌,吳景蘭,等.野生型DNA聚合酶β轉(zhuǎn)染Eca-109細(xì)胞后增變基因表型變化 [J].鄭州大學(xué)學(xué)報(醫(yī)學(xué)版),2008,43(6):1085-1090.
Zheng N G,Gao H C,Wu J L,et al.Changes of mutator phenotypes in Eca-109 cells transfected with wild type DNA polymerase beta [J].Journal of Zhengzhou University (Medical Sciences),2008,43(6):1085-1090.
[18]Roberts S A,Lawrence M S,Klimczak L J,et al.An APOBEC cytidine deaminase mutagenesis pattern is widespread in human cancers [J].Nat Genet,2013,45(9):970-976.
[19]Jonathan G,Avraham A L.Stress,mutators,mutations and stress resistance [M]//Pareek A,Sopory S K,Bohnert H,et al.Abiotic stress adaptation in plants. [s.l.]:Springer Netherlands,2010:471-483.
[20]Hoffman P D,Leonard J M,Lindberg G E,et al.Rapid accumulation of mutations during seed-to-seed propagation of mismatch-repair-defectiveArabidopsis[J].Genes Dev,2004,18(21):2676-2685.
[21]廖 毅,孫保娟,孫光聞,等.集群分離分析法在作物分子標(biāo)記研究中的應(yīng)用及問題分析 [J].分子植物育種,2009,7(1):162-168.
Liao Y,Sun B J,Sun G W,et al.The application and key problems of bulked segregant analysis on the research of molecular marker in crop [J].Molecular Plant Breeding,2009,7(1):162-168.
[22]Takagi H,Abe A,Yoshida K,et al.QTL-seq:rapid mapping of quantitative trait loci in rice by whole genome resequencing of DNA from two bulked populations [J].Plant J,2013,74(1):174-183.
[23]Schmutz J,Cannon S B,Schlueter J,et al.Genome sequence of the palaeopolyploid soybean [J].Nature,2010,463(7278):178-183.
[24]Purcell S,Neale B,Todd-Brown K,et al.PLINK:a tool set for whole-genome association and population-based linkage analyses [J].Am J Hum Genet,2007,81(3):559-575.
[25]McLennan A G.The nudix hydrolase superfamily [J].Cell Mol Life Sci,2006,63(2):123-143.
[26]張帆濤,方 軍,孫昌輝,等.水稻矮稈突變體dtl1的分離鑒定及其突變基因的精細(xì)定位 [J].遺傳,2012,34(1):81-88.
Zhang F T,Fang J,Sun C H,et al.Characterisation of a rice dwarf and twist leaf 1 (dtl1) mutant and fine mapping ofDTL1 gene [J].Hereditas,2012,34(1):81-88.
[27]徐建龍,王俊敏,駱榮挺,等.空間誘變水稻大粒型突變體的遺傳育種研究 [J].遺傳,2002,24(4):431-433.
Xu J L,Wang J M,Luo R T,et al.Studies of inheritance and application in rice breeding of large grain mutant induced in space environment [J].Hereditas,2002,24(4):431-433.
[28]趙永亮,宋同明,馬惠平.利用花粉化學(xué)誘變快速創(chuàng)造特用玉米新種質(zhì) [J].作物學(xué)報,1999,24(2):157-161.
Zhang Y L,Song T M,Ma H P.The quick development of specialty corn by chemical mutagenesis of pollen [J].Acta Agronomica Sinica,1999,24(2):157-161.
[29]Nakabeppu Y,Sakumi K,Sakamoto K,et al.Mutagenesis and carcinogenesis caused by the oxidation of nucleic acids [J].Biol Chem,2006,387(4):373-379.
[30]Yoshimura K,Shigeoka S.Versatile physiological functions of the Nudix hydrolase family inArabidopsis[J].Biosci Biotechnol Biochem,2015,79(3):354-366.
[31]Muthuramalingam M,Zeng X,Iyer N J,et al.A GCC-box motif in the promoter of nudix hydrolase 7 (AtNUDT7) gene plays a role in ozone response ofArabidopsisecotypes[J].Genomics,2015,105(1):31-38.
[32]Fonseca J P,Dong X.Functional characterization of a Nudix hydrolase AtNUDX8 upon pathogen attack indicates a positive role in plant immune responses [J].PLoS One,2014,9(12):e114119.
Identification of mutators in soybean genome by super bulked segregant analysis
CHANG Wei,WANG Juan,HUANG Zhigang,CHEN Jibao
(College of Agricultural Engineering,Nanyang Normal University,Nanyang,Henan 473061,China)
【Objective】 In this study,the soybean genome Wm82.a2.v1 and HapMap were used to identify the potential mutators.【Method】 After pretreatment,the soybean HapMap data (comprising 52 041 genotype from 19 652 soybean germplasm) were used for association loci mining by improved Super-BSA method with selected size of the sliding window,step size and threshold parameters.The candidate genes associated with both point mutation rate and the number of mutation hotspots were considered as soybean mutators.All these genes are used for functional prediction by the soybean genome Wm82.a2.v1.【Result】 After the pretrtatment of HapMap data,15 391 individuals were retained.Among these,the range of mutation rate was 0.089-0.531 with an average mutation rate of 0.261,and the range of number of mutation hotspots was 5-1 324 with a mean of 347.8.Super bulked segregant analysis also showed that the intervals 29 153 474-30 604 603 bp on Gm16 and 12 133 293-12 147 725 bp on Gm17 were two regions with strong associations with both phenotypes.Glyma16g26440.1 on Gm16 andGlyma17g15420.1 on Gm17 belonged to the nudix hydrolase superfamily involving in genome mutations.【Conclusion】 The two members of nudix hydrolase (Glyma16g26440.1 andGlyma17g15420.1) were associated with mutation rate and the number of mutation hotspots,and could be considered as candidate soybean mutators for further studies.
soybean;mutation hotspots;mutators;Super-BSA;nudix hydrolase genes
時間:2016-10-20 16:36
10.13207/j.cnki.jnwafu.2016.12.010
2015-07-10
南陽師范學(xué)院科研基金項目(ZX2015012)
常 瑋(1984-),男,黑龍江齊齊哈爾人,講師,博士,主要從事大豆分子育種研究。
陳吉寶(1969-),男,河南南陽人,副教授,碩士生導(dǎo)師,主要從事作物種質(zhì)資源研究。
Q319.32;S565.1
A
1671-9387(2016)12-0064-09
網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/61.1390.S.20161020.1636.020.html