孫 倩 鄒枚伶 張辰笈,4 江思容,5 Eder Jorge de Oliveira張圣奎 夏志強,3,4,* 王文泉,3,4,5,* 李有志
1 廣西大學生命科學與技術學院 / 亞熱帶農(nóng)業(yè)生物資源保護與利用國家重點實驗室, 廣西南寧 530004; 2 中國熱帶農(nóng)業(yè)科學院熱帶生物技術研究所, 海南???571101; 3 中國熱帶農(nóng)業(yè)科學院熱帶生物組學大數(shù)據(jù)中心, 海南???571101; 4 海南大學, 海南???70203; 5 南京農(nóng)業(yè)大學, 江蘇南京 210095; 6 Embrapa Mandioca e Fruticultura, Cruz das Almas, Bahia 44380-000, Brazil; 7 齊魯工業(yè)大學, 山東濟南 250306
木薯(Manihot esculentaCrantz) 是大戟科(Euphorbiaceae)木薯屬(ManihotP. Mill.)的多年生灌木植物, 具有高生物量、抗貧瘠、抗病蟲能力強等特點, 被廣泛種植于亞、非、美三洲等多個國家或地區(qū)[1]。木薯起源于亞馬遜河流域, 于19 世紀20 年代傳入中國, 最初種植于廣東省, 之后逐漸在海南、廣西、貴州、云南等地大量種植。它是世界三大薯類作物之一, 同時也是世界上第六大糧食作物, 僅次于小麥、水稻、玉米、馬鈴薯和大麥[2]。其用途廣泛, 除可食用、飼用外, 還可用于生產(chǎn)加工, 如造紙、紡織、生物燃料等[3]。木薯塊根還可用于提取淀粉, 加工成薯條、面包, 以及生產(chǎn)燃料乙醇等; 莖稈可用來進行木薯繁殖、粉碎還田、做燃料等; 葉片可作蔬菜食用或喂魚、養(yǎng)蠶等[4]。
木薯基因組具有高度雜合的特性, 原因是其異花授粉, 且長期進行無性繁殖。由于基因組的高度雜合, 從而增加了木薯遺傳變異的多樣性, 這些多樣性可為木薯育種人員提供更多可選擇的良好親本,但同時由于木薯的基因組高度雜合、親緣關系不清晰、遺傳改良周期長等特點也增加了育種的工作難度[5]。目前已有一些利用相關序列擴增多態(tài)性(sequence-related amplified polymorphism, SRAP)、簡單重復序列(simple sequence repeat, SSR)、擴增片段長度多態(tài)性 (amplified fragment length polymorphism, AFLP)、單核苷酸多態(tài)性(single nucleotide polymorphisms, SNP)等分子標記進行木薯遺傳多樣性的研究。Fregene 等[6]利用SSR 標記對來源于哥倫比亞、巴西和秘魯?shù)鹊氐哪臼淼胤狡贩N的種質(zhì)資源多樣性評價發(fā)現(xiàn), 不同國家來源的木薯種質(zhì)的遺傳多樣性水平都很高, 其中來自巴西和哥倫比亞材料的基因多樣性水平最高。Alex 等[7]利用13 對SSR
標記對巴西多地的傳統(tǒng)甜木薯品種的群體結(jié)構(gòu)和遺傳多樣性評估結(jié)果顯示, 該群體的遺傳多樣性平均值為0.5407, 范圍為0.3138 (GA21)~0.6502(GA140), 表明該群體的遺傳變異性寬泛。Carvalho等[8]采用SSR 標記和RAPD 標記的研究中發(fā)現(xiàn), 巴西的木薯種質(zhì)資源的地理來源和遺傳聚類具有顯著正相關關系。
豐富木薯種質(zhì)資源的遺傳多樣性, 并對其遺傳背景和性狀進行綜合評價, 發(fā)掘控制優(yōu)良性狀的優(yōu)異等位基因, 對今后木薯育種具有重大意義。全基因組關聯(lián)分析(genome-wide association study,GWAS)能夠鑒定目的表型性狀與遺傳標記或基因間的關系, 并檢測出控制相關性狀的優(yōu)良等位基因位點[9]。而進行關聯(lián)分析需要先評估實驗群體的遺傳多樣性、遺傳結(jié)構(gòu)及親緣關系[10]。但目前利用 SNP 和 InDel 標記對木薯進行遺傳多樣性、親緣關系及群體結(jié)構(gòu)分析等的相關研究還鮮為報道。
本研究擬利用SNP 和InDel 分子標記, 對由巴西Embrapa 機構(gòu)提供的來源于巴西多地的192 份木薯種質(zhì)資源進行遺傳多樣性和群體結(jié)構(gòu)分析。本研究將為以后木薯育種親本選配提供材料和理論指導, 也可為下一步通過關聯(lián)分析發(fā)掘控制木薯種質(zhì)中優(yōu)良性狀的優(yōu)異等位基因提供理論依據(jù),從而促進利用分子標記輔助選擇技術培育木薯新品種。
供試木薯材料共192 份, 均為巴西栽培種木薯(表1)。
表1 192 份木薯栽培種Table 1 List of 192 cassava cultivars
采用改良的CTAB 法[11]提取木薯葉片的基因組DNA, 經(jīng)1%的瓊脂糖凝膠電泳檢測及濃度測定后,將工作液濃度稀釋到100 ng μL-1, -20℃保存。然后利用AFSM[12]技術對192 份木薯DNA 樣品使用96孔PCR 板分別構(gòu)建EcoR I-MspI 和EcoR I-HpaII文庫, 單克隆檢測達到要求后, 將相應的EcoR IMspI 和EcoR I-HpaII 文庫按1∶1 比例混合成1 個文庫, 總共192 個樣本, 構(gòu)建了2 個AFSM 文庫, 并利用Hiseq 2500 對構(gòu)建好的測序文庫進行雙端150 bp 測序。
利用Perl 腳本(http://afsmseq.sourceforge.net/)對原始測序數(shù)據(jù)進行過濾, 同時統(tǒng)計測序得到的總reads 數(shù), 再將reads 根據(jù)AFSM 技術設計的Barcodes分配到每個個體中, 并統(tǒng)計每個個體的reads 數(shù)[12]。使用Bowtie 2 軟件[13]將優(yōu)化后的測序reads 比對到木薯AM560 參考基因組[14], 再使用SAMtools[15]和VCFtools (http://vcftools.sourceforge.net/)檢測 SNP和InDels 位點?;谀臼鞟M560 參考基因組V6.1,利用snpEff 軟件[16]識別其變異位置(間隔區(qū)、非翻譯區(qū)/UTR、基因上游區(qū)或基因下游區(qū))、變異類型(同義突變和錯義突變、移碼突變和非移碼突變), 同時對其進行注釋。
先利用 PHYLIP (http://evolution.genetics.washington.edu/phylip.html)計算樣品的遺傳距離矩陣,然后用Notepad++軟件將遺傳距離矩陣的文件調(diào)整成合適的格式, 采用鄰接法構(gòu)建系統(tǒng)進化樹結(jié)構(gòu),生成tree 文件后, 再使用iTOL (https://itol.embl.de/)繪制進化樹圖。通過GCTA 軟件[17]利用檢測出的SNP 對參試木薯群體材料進行主成分分析(PCA)。再使用R 軟件計算各個主成分的向量, 繪制PCA散點圖。
此外, 使用ADMIXTURE 軟件[18]進行群體結(jié)構(gòu)分析, 估算出最佳群體亞群數(shù)。先用PLINK 軟件[19]調(diào)整ADMIXTURE 軟件的輸入文件格式, 并輸入文件, 然后將亞群數(shù)K值范圍設置為1~12, 根據(jù)得到的cross-validation error 值選擇合適的亞群數(shù)K值,利用各個材料占各亞群的遺傳成分系數(shù)(Q)構(gòu)成群體遺傳結(jié)構(gòu)矩陣。
利用VCFtools 軟件(https://vcftools.github.io/index.html)計算群體遺傳多樣性指數(shù)(π)和群體分化指數(shù)(Fst)[20]。根據(jù)Wright 的研究, 當群體分化指數(shù)(Fst)等于0 或1 時, 分別表明亞群間沒有分化, 或亞群間完全分化。而當0 < Fst < 0.05、0.05 ≤ FST <0.15、0.15 ≤ FST < 0.25, 或0.25 ≤ FST < 1 時,則分別表明亞群間具有較弱、中等、比較強或非常強的遺傳分化[21]。
通過對192 份巴西栽培種木薯基因組DNA 進行AFSM 建庫及測序, 總共得到了155 G 數(shù)據(jù), 過濾后得到134 G 數(shù)據(jù), 893,020,018 條reads。再利用木薯參考基因組 AM560 V6.1, 通過 SAMtools 和VCFtools 軟件對192 份木薯樣品基因組進行掃描,得到796,006 個SNPs 和116,821 個InDels。
通過哈迪溫伯格檢測(HWE)>0.001、次等位基因頻率(MAF)≥0.05 過濾, 并舍去低質(zhì)量的變異位點后, 僅保留了9443 個高質(zhì)量的變異位點(7946 個SNPs 和1997 個InDels)用于后續(xù)分析。其中, 3287個SNPs 和InDels 位于基因間隔區(qū), 4005 個SNPs 和InDels 位于基因上游區(qū), 471 個SNPs 和InDels 位于基因下游區(qū), 2 個SNPs 和InDels 位于5′端UTR。845個SNPs 和InDels 屬于錯義突變, 745 個SNPs 和InDels 屬于同義突變, 417 個SNPs 和InDels 屬于移碼突變, 另有171 個SNPs 和InDels 屬于其他類型突變(表2)。
表2 SNPs 和InDels 的統(tǒng)計Table 2 Summary of SNPs and InDels
通過ADMIXTURE 軟件利用9943 個高質(zhì)量的SNPs 和InDels 分子標記對192 份巴西栽培種木薯進行群體遺傳結(jié)構(gòu)分析。將亞群數(shù)K值范圍設置為1 ~1 2, 計算不同K值下的交叉驗證錯誤率(cross-validation error, CV error)。當K從1 到2 時, CV error 值迅速減小;K從2 到4 時, CV error 值又逐漸增加; 當K從4 到9 時, CV error 值逐漸減小并趨于平緩; 當K大于9 時, CV error 值又出現(xiàn)一定的增幅(圖1-a)。說明在K等于9 時, CV error 值最小, 因此巴西栽培種木薯群體可分為 9 個亞群(Subgroup 1~Subgroup 9)。
192 份巴西木薯可以被分為9 個亞群, 再根據(jù)每個個體在這9 個亞群的Q 值, 將每個個體歸類到Q值最大所在的亞群(圖1-b)。9 個亞群中分別含有3份、22 份、27 份、6 份、20 份、25 份、24 份、12份和53 份材料。
主成分分析以所有的高質(zhì)量SNPs 和InDels 為基礎, 通過R 軟件分析繪圖, 得到如下結(jié)果: 該木薯群體的9 個亞群在PC1 軸上可以看出一定的分布差距, 大部分亞群可以聚類在一起, 該結(jié)果說明聚類結(jié)果與群體結(jié)構(gòu)的劃分具有一致性(圖1-c)。
由圖2 可知, 聚類結(jié)果與群體結(jié)構(gòu)的劃分相一致, 亞群1、亞群2、亞群4、亞群6 和亞群8 能較好地分別聚在一起, 而其他亞群樣品大致能聚在一起, 且樣品間有一定的交叉。巴西木薯各栽培種之間并未聚類到一起, 可能是由于木薯栽培歷史比較短, 來源于巴西多地的木薯栽培種還未產(chǎn)生明顯的分化。
利用9943 個高質(zhì)量的SNPs 和InDels, 通過計算遺傳多樣性指數(shù)(π), 評估巴西栽培種木薯群體和各個亞群的遺傳多樣性。通過vcftools 計算發(fā)現(xiàn), 巴西栽培種木薯群體的遺傳多樣性指數(shù)為0.274, 亞群1~9 的遺傳多樣性指數(shù)在0.192~0.289 之間, 其中亞群1 具有最低的遺傳多樣性指數(shù)(0.192), 亞群7、亞群2、亞群6 和亞群3 具有相對較高的遺傳多樣性指數(shù), 分別達到0.284、0.281、0.264 和0.261, 而亞群5 具有9 個亞群中最高的遺傳多樣性指數(shù)(0.289)(表3)。說明巴西栽培種木薯群體具有相對較高的遺傳多樣性水平。
利用群體分化指數(shù)(Fst)評估巴西栽培木薯亞群間的差異程度(表4)發(fā)現(xiàn), 除亞群1 和亞群4 之間有較強遺傳分化外, 其他亞群之間均為中等或較弱遺傳分化, 亞群間的遺傳分化指數(shù)在0.031~0.152 之間。其中, 亞群8 與其他各亞群之間均為中等分化;而除亞群4 與亞群1 外, 亞群4 和亞群1 分別與其他各亞群之間也均為中等分化。表明, 除亞群1 與亞群4 間遺傳分化較強、親緣關系較遠外, 其余各亞群間的為中等或較弱遺傳分化程度, 即亞群間的親緣關系相對均較近。
另外, 本研究對試驗所用的巴西栽培木薯的遺傳距離分析發(fā)現(xiàn), 這些木薯種質(zhì)間的遺傳距離為0.084~0.297, 平均遺傳距離為 0.228。其中, BGM 1883 與Valencia 遺傳距離最近(0.084); BGM0640 與BRSJari 遺傳距離最遠(0.297)。
表3 遺傳多樣性指數(shù)(π)的統(tǒng)計Table 3 Statistics of genetic diversity index (π)
表4 群體分化指數(shù)(Fst)的統(tǒng)計Table 4 Statistics of population differentiation index (Fst)
研究表明, 基因型與性狀之間會產(chǎn)生假關聯(lián),其原因可能是群體結(jié)構(gòu)分層、等位基因分布不均等[22]。為了消除造成關聯(lián)分析不準確的因素, 我們需要先對試驗群體進行群體結(jié)構(gòu)分析。本研究利用ADMIXTURE 軟件對巴西木薯自然群體的群體結(jié)構(gòu)分析表明, 當K=9 時, CV error 值最小, 由此將192份木薯種質(zhì)劃分為9 個亞群, 該結(jié)果與聚類分析、主成分分析的結(jié)果大概相符, 它們之間相互補充及印證, 說明該木薯群體的遺傳結(jié)構(gòu)較為可靠。在這9個亞群中, 群體分化指數(shù)在0.03~0.15 之間, 且大部分亞群間的群體分化指數(shù)均小于0.09, 表明該木薯群體存在一個中等偏弱的遺傳分化。前人的研究結(jié)果顯示, 中國熱帶農(nóng)業(yè)科學院熱帶品種資源種質(zhì)圃收集的158 份木薯種質(zhì)的群體分化指數(shù)在0.03~0.07之間[23]; 在其他地區(qū)的栽培木薯中, 群體分化指數(shù)在0.01~0.05 之間[14], 表明國內(nèi)收集的木薯遺傳分化程度較低。比較看來, 本研究中的巴西木薯種質(zhì)的群體分化指數(shù)高于國內(nèi)收集的木薯種質(zhì), 可挑選優(yōu)質(zhì)巴西木薯品種并引進中國, 從而豐富已有的木薯種質(zhì)資源。
本研究對遺傳多樣性指數(shù)(π)進行了計算, 從而評估該木薯群體的遺傳多樣性。Ramu 等[14]的研究表明, 來源于不同地區(qū)(尼日利亞、哥倫比亞、巴西等地)的國外栽培木薯的遺傳多樣性指數(shù)為0.0036,低于其祖先(M. esculentassp.flabellifolia, π =0.0051); Fregene 等[6]對來源于哥倫比亞、巴西和秘魯?shù)鹊氐哪臼淼胤狡贩N的種質(zhì)資源多樣性評價發(fā)現(xiàn),巴西和哥倫比亞的木薯種質(zhì)具有最高的遺傳多樣性水平; 在張圣奎對中國熱帶農(nóng)業(yè)科學院熱帶品種資源種質(zhì)圃收集的158 份木薯種質(zhì)的遺傳多樣性研究中發(fā)現(xiàn), 該群體的遺傳多樣性指數(shù)為1.21×10-4, 表明該群體的遺傳多樣性較低[23], 同時也表明目前國內(nèi)的木薯種質(zhì)資源豐富度較為缺乏。本研究發(fā)現(xiàn),該巴西木薯群體中各亞群的遺傳多樣性指數(shù)在0.19~0.29 之間, 平均遺傳多樣性指數(shù)為0.248, 說明巴西木薯群體的遺傳多樣性較為豐富, 可引進部分優(yōu)良巴西種質(zhì)以豐富國內(nèi)的木薯種質(zhì)資源。除此之外, 樣本之間的親緣關系也會對關聯(lián)分析的結(jié)果造成一定的影響。本研究對192 份木薯種質(zhì)間的遺傳距離進行分析, 從而評估不同材料之間的親緣關系,結(jié)果發(fā)現(xiàn)這些木薯種質(zhì)的平均遺傳距離為0.228。
本研究利用9943 個高質(zhì)量的SNPs 和InDels 對192 份巴西Embrapa 機構(gòu)提供的木薯種質(zhì)進行了和群體遺傳結(jié)構(gòu)分析。遺傳多樣性分析結(jié)果顯示, 巴西木薯群體的遺傳多樣性水平較為豐富, 高于中國和哥倫比亞等地區(qū); 群體遺傳結(jié)構(gòu)分析結(jié)果顯示,該群體被劃分為9 個亞群, 此結(jié)果與主成分分析及聚類分析結(jié)果基本一致。另外, 該木薯群體的分化程度較低, 但高于國內(nèi)的木薯種質(zhì)資源。遺傳距離分析顯示, BGM1883 與 Valencia 遺傳距離最近,BGM0640 與BRSJari 遺傳距離最遠。該研究將為之后關聯(lián)分析挖掘優(yōu)良基因及引進優(yōu)良巴西木薯種質(zhì)提供依據(jù)。