何旭東,鄭紀(jì)偉,教忠意,竇全琴,黃利斌
(江蘇省林業(yè)科學(xué)研究院,江蘇 南京 211153)
櫟樹是殼斗科(Fagaceae)櫟屬(Quercus)植物的統(tǒng)稱。櫟樹是殼斗科中分化最晚、進化程度最高的類群,全世界有450余種,主要分布于北緯16°~62°地區(qū),在美國、俄羅斯和中國等地區(qū)資源最為豐富[1]。我國約有櫟樹51種,除新疆僅有栽培種外,其余各省均有自然分布[2]。櫟樹以落葉或常綠喬木為主,通常認(rèn)為華北地區(qū)為落葉櫟的分布中心,云貴高原為常綠櫟的分布中心[3]。櫟樹是亞熱帶至溫帶闊葉森林重要的建群種和優(yōu)勢種,在森林生態(tài)系統(tǒng)中起著不可替代的作用。櫟樹木材堅硬,紋理美觀,為珍貴用材樹種;其樹形高大,葉色多變,也是重要的園林觀賞樹種;同時其樹皮、樹葉、果實等還可作為不同用途的工業(yè)原料[4-5]。
盡管我國櫟樹種質(zhì)資源豐富,但大多處于野生狀態(tài),以天然次生林為主,并與其他樹種相互混雜,在種質(zhì)資源挖掘與品種選育方面幾乎為空白,導(dǎo)致鄉(xiāng)土櫟樹在優(yōu)質(zhì)用材及園林綠化應(yīng)用方面較國外差距較大[6-7]。自20世紀(jì)90年代末,中國林業(yè)科學(xué)研究院與江蘇省林業(yè)科學(xué)研究院等科研單位陸續(xù)開展系統(tǒng)性的國外櫟樹引種研究,引進了納塔櫟(Q.nuttallii)、舒瑪櫟(Q.shumardii)、柳葉櫟(Q.phellos)、北方紅櫟(Q.rubra)、弗吉尼亞櫟(Q.virginiana)等樹種,對其生長性、適應(yīng)性、抗逆性和觀賞性等進行了評價[8-12],并對無性繁殖技術(shù)進行了研究[13]。但總體而言,國內(nèi)對引種櫟樹的研究仍局限于常規(guī)育種方面,對國外不同櫟樹種質(zhì)資源的遺傳基礎(chǔ)及親緣關(guān)系方面的研究依然比較缺乏。
遺傳多樣性是物種進化和適應(yīng)的基礎(chǔ),是抵抗環(huán)境變化的重要保障。遺傳多樣性水平的高低體現(xiàn)物種對環(huán)境變化的適應(yīng)能力,是物種長期存活的決定因素之一。此外,遺傳多樣性也是遺傳結(jié)構(gòu)研究的核心內(nèi)容,而遺傳結(jié)構(gòu)的研究對于種質(zhì)資源的挖掘、利用和保護具有極其重要的理論與實踐意義[14-16]。國內(nèi)外利用分子標(biāo)記技術(shù)對多個櫟樹種[17-25]進行了遺傳多樣性與遺傳結(jié)構(gòu)等研究。此外,國外還對分布于美洲大陸的多種櫟樹進行了群體多樣化的研究[26-27]。本研究選取江蘇省林業(yè)科學(xué)研究院前期引進的6個舒瑪櫟種源,采用SLAF-seq技術(shù)開發(fā)一批SNP標(biāo)記,并對不同種源舒瑪櫟群體進行遺傳多樣性與遺傳結(jié)構(gòu)分析,以期為舒瑪櫟資源引進、種質(zhì)保存以及品種選育提供理論依據(jù),也為其他珍貴彩色櫟樹樹種的開發(fā)利用提供有益參考。
供試材料為江蘇省林業(yè)科學(xué)研究院前期從美國引進的6個舒瑪櫟種源,每個種源包含5個單株,共30個個體(表1)。此外,還選取5個納塔櫟個體作為外類群一并進行分析。所有個體均定植于江蘇省林業(yè)科學(xué)研究院種質(zhì)資源圃內(nèi)。
采集所有個體幼嫩葉片,利用試劑盒(天根生化生物工程有限公司,DP305)提取DNA。用質(zhì)量分?jǐn)?shù)0.8%瓊脂糖凝膠電泳檢測DNA的質(zhì)量,Nanodrop檢測DNA的濃度,-20 ℃保存?zhèn)溆谩?/p>
表1 試驗材料Table 1 Experimental materials
利用北京百邁客生物科技有限公司自主研發(fā)的特異性位點擴增片斷測序(specific-locus amplified fragment sequencing,SLAF-seq)技術(shù)對35個個體進行測序[28]。采用無參考基因組方案,確定限制性內(nèi)切酶為RsaI,將酶切片段長度在314~414 bp的序列定義為SLAF標(biāo)簽。對SLAF標(biāo)簽進行3′端加A處理,連接Dual-index測序接頭建庫測序。為評估建庫實驗的準(zhǔn)確性,選用水稻品種‘日本晴’(Oryzasativa‘Nipponbare’,基因組大小為374.30 Mbp,http://rapdb.dna.affrc.go.jp/)作為對照,測序平臺為Illumina HiSeq 2500。對測序得到的原始數(shù)據(jù)進行識別、過濾、質(zhì)檢、評估等分析,獲取各個個體的序列(reads)。
將各個體的reads根據(jù)相似性進行聚類,聚類到一起的reads來源于一個SLAF標(biāo)簽。因同一個SLAF標(biāo)簽在不同個體間序列相似度遠高于不同SLAF標(biāo)簽間的相似度,因此將在不同個體間有序列差異的SLAF標(biāo)簽定位為多態(tài)性標(biāo)簽。以每個SLAF標(biāo)簽中測序深度最高的序列類型作為參考序列,利用bwa將測序reads比對到參考序列上[29],使用GATK和samtools兩種方法開發(fā)SNP[30-31],將兩種方法得到的SNP標(biāo)記交集作為最終可靠的SNP標(biāo)記集合,并以完整度>0.8、最小等位基因頻率(MAF)>0.05為標(biāo)準(zhǔn)進行過濾。
利用GenAlex 6.5[32]軟件計算各個種源有效等位基因數(shù)(Ne)、多態(tài)位點比例(PPL)、觀測雜合度(Ho)、期望雜合度(He)、多態(tài)信息含量(PIC)、香農(nóng)指數(shù)(I)、基因多樣性指數(shù)(H)等遺傳多樣性參數(shù);利用Arlequin 3[33]軟件計算群體內(nèi)近交系數(shù)(FIS)、群體間遺傳分化系數(shù)(FST)以估計群體遺傳分化程度,并進行分子方差分析(analysis of molecular variance,AMOVA)以檢測群體內(nèi)和群體間遺傳變異情況;利用MEGA X(https://www.megasoftware.net)軟件基于Neighbor-joining算法(Kimura 2模型,1 000次bootstrap)構(gòu)建群體進化樹;利用Admixture[34]軟件分析群體結(jié)構(gòu),設(shè)定群體分群數(shù)(K值)為1~10進行聚類,根據(jù)ΔK峰值的位置來確定分群數(shù);利用Cluster X軟件進行主成分分析并聚類。
利用SLAF測序技術(shù)對35個櫟樹個體進行高通量測序,共獲得50.4 Mb酶切reads,按不同群體統(tǒng)計相關(guān)指標(biāo)。如不同種源櫟樹SLAF標(biāo)簽與SNP標(biāo)記統(tǒng)計(表2)所示。
表2 不同種源櫟樹SLAF標(biāo)簽與SNP標(biāo)記統(tǒng)計Table 2 Statistics of SLAF tags and SNP markers for different provenances of Quercus spp.
7個群體Q30值變化范圍為90.24%~95.12%,最高為PA群體,最低為NT群體,平均為93%,表明測序質(zhì)量較好。GC含量最高為OH群體(39.35%),最低為PA群體(38.49%),平均為38.9%。酶切共獲得4 256 436個多態(tài)性的SLAF標(biāo)簽,最多的TX群體平均每個個體134 816.4個,最少的NT群體平均每個個體107 005.2個。每個群體的測序深度從10.62至12.38不等,平均為11。舒瑪櫟各個群體中個體平均SNP數(shù)量相差不大,LA群體中每個個體SNP數(shù)量最多,平均為259 700.2個,TX群體最少,平均為236 358個;納塔櫟群體中每個個體SNP數(shù)量平均為200 735個。各群體間SNP完整度變化范圍為65.85%~85.20%,平均為79.29%,SNP雜合率變化范圍為8.67%~16.01%,平均為14.15%,均為LA群體最大,NT群體最小。
舒瑪櫟群體遺傳多樣性分析結(jié)果(表3)顯示:6個種源平均有效等位基因數(shù)為1.31個;多態(tài)性位點比例平均為49.21%,最高為PA種源(57.44%),最低為OH種源(43.34%);各種源間觀測雜合度與期望雜合度變化范圍不大,分別為0.13~0.16和0.17~0.21;PIC值變化范圍為0.13~0.17,平均為0.15;香農(nóng)指數(shù)PA種源最高,為0.39,OH種源最低,為0.30,平均為0.34;各種源間Nei’s基因多樣性指數(shù)變化范圍較小,平均為0.09;群體內(nèi)的近交系數(shù)最大為MO與MS種源,為0.26,最低為LA與OH種源,為0.10,種源間平均為0.19。
表3 不同種源舒瑪櫟群體遺傳多樣性Table 3 Genetic diversity of the six different provenances of Quercus shumardii
舒瑪櫟不同種源間的Nei’s遺傳距離變化范圍為0.08~0.18,其中MS種源與TX種源遺傳距離最遠,為0.18,LA種源與MO種源以及MO種源與PA種源遺傳距離最近,為0.08(表4)。不同種源群體間遺傳分化系數(shù)FST變化范圍為0.15~0.39,其中TX種源與MS種源以及TX種源與OH種源群體間遺傳分化系數(shù)最高,為0.39;其次為OH種源與MS種源以及TX種源與LA種源,為0.35;PA種源與MO種源群體間遺傳分化系數(shù)最低,為0.15。由分子方差分析(AMOVA)可知,舒瑪櫟遺傳變異主要來自群體內(nèi)(84.88%),群體間的遺傳變異占總變異的15.12%(表5)。
表4 不同種源舒瑪櫟群體間Nei’s遺傳距離與遺傳分化系數(shù)Table 4 Pairwise differentiation (FST) and genetic distance among provenances of Quercus shumardii
表5 不同種源舒瑪櫟群體分子方差分析Table 5 Analyses of molecular variances of the six different provenances of Quercus shumardii
利用Admixture軟件分析舒瑪櫟群體遺傳結(jié)構(gòu),分別假設(shè)舒瑪櫟30個個體的分群數(shù)(K值)為1~10進行聚類,根據(jù)交叉驗證錯誤率的谷值確定最優(yōu)分群數(shù)為3(圖1A),表明30個個體來自3個類群。如圖1B所示,本研究的30個個體可以劃分為3個群,類群1(紅色基因池)主要包括TX種源,類群2(綠色基因池)主要包括LA、MO、OH和PA種源,類群3(黃色基因池)主要包括MS種源。
為進一步探討舒瑪櫟不同種源個體間的親緣關(guān)系,以5個納塔櫟個體作為外類群,使用群體SNP標(biāo)記計算個體間遺傳距離,并利用MAGA軟件基于neighbor-joining算法構(gòu)建30個舒瑪櫟個體的進化樹,同時利用Cluster X軟件進行主成分分析(圖2)。如圖2A所示,35個櫟樹個體聚成兩大類,其中外類群納塔櫟5個個體單獨聚成一類,30個舒瑪櫟個體聚成一大類,與傳統(tǒng)的分類學(xué)一致。6個種源的舒瑪櫟群體也基本各自單獨聚成一小類。圖2B所示的三維主成分聚類圖也可以輔助親緣關(guān)系分析,通過空間距離的遠近判斷不同個體間的親緣關(guān)系。
圖1 舒瑪櫟群體最佳類群數(shù)與遺傳結(jié)構(gòu)Fig.1 The rational groups number and genetic structure of Quercus shumardii
圖2 35個櫟樹個體進化樹(A)與主成分分析(B)Fig.2 Phylogenetic tree and principal components analyses of 35 individuals of Quercus
利用SLAF-seq技術(shù)對美國引進的6個種源舒瑪櫟群體進行遺傳多樣性和遺傳結(jié)構(gòu)分析,旨在開發(fā)一批可用的SNP標(biāo)記,為舒瑪櫟種質(zhì)資源的開發(fā)、利用與保護提供理論依據(jù),也為其他珍貴彩色樹種的研究提供有益參考。因受前期引種條件限制,本研究中舒瑪櫟群體每個種源只有5個個體,樣本量較小,部分研究結(jié)果可能不能完全反映不同種源間大空間尺度的群體遺傳多樣性與遺傳結(jié)構(gòu)的真實情況,但有研究表明,較小的群體仍可有效地估算遺傳多樣性等相關(guān)參數(shù)[35]。如在Q.susber遺傳多樣性與遺傳結(jié)構(gòu)研究中,6個群體的樣本量均為5個個體,3個群體的樣本量為8~10個[17];在細(xì)葉桉(Eucalyptustereticornis)9個群體遺傳多樣性分析中,其中1個群體只有4個樣本,3個群體包含5個樣本,1個群體有7個樣本[35];在木荷(Schimasuperba)遺傳多樣性分析中,多個群體的樣本量也都在10個以下[36]。總體而言,群體中個體數(shù)量多少為宜沒有明確的定論,Singh等[37]認(rèn)為有的群體5~6個個體即可滿足遺傳多樣性分析的需要,有的群體則需要12個以上的個體,而且樣本量的大小也與物種本身的生物學(xué)特性以及取樣策略有關(guān)。
多態(tài)性位點比例是反映遺傳多態(tài)性的重要指標(biāo)。本研究中舒瑪櫟群體的平均多態(tài)性SNP位點比例為49.21%,高于ISSR標(biāo)記檢測的Q.susber(36.99%)[17]與蒙古櫟(Q.mongolica)(45.24%)[38]群體,略低于ISSR標(biāo)記檢測的Q.libani(52.61%)群體[21],而在Q.infectoria群體中,基因組SSR標(biāo)記平均多態(tài)性位點比例高達100%,葉綠體SSR標(biāo)記卻只有19.19%,可能是由于葉綠體SSR過于保守,標(biāo)記本身多態(tài)性較低造成。期望雜合度He常用來衡量群體遺傳多樣性的高低,He越高,群體一致性就越低,遺傳多樣性就越豐富。本研究中,舒瑪櫟群體平均期望雜合度He為0.19,遠低于SSR標(biāo)記檢測的Q.infectoria(平均He為0.75)[19]、Q.rubra和Q.ellipsoidalis(平均He為0.78)[20]以及栓皮櫟(Q.variabilis)(平均He為0.707)[22]群體。推測一方面可能與樣本大小有關(guān),另一方面可能與標(biāo)記類型有關(guān),如同樣采用SNP標(biāo)記檢測的油棕群體(平均He為0.29~0.32)[39]和榔榆(Ulmusparvifolia)群體(平均He為0.33)[40],其He值與本研究較為接近。類似的,又如多態(tài)信息含量PIC值,SSR標(biāo)記[22]也明顯高于SNP標(biāo)記[39-40]。此外,本研究中舒瑪櫟群體的香農(nóng)指數(shù)I平均為0.34,高于ISSR標(biāo)記檢測的Q.susber(I= 0.168)[17]與Q.libani群體(I= 0.25)[21],而基因組SSR標(biāo)記檢測的Q.infectoria群體I值高達1.55,葉綠體SSR標(biāo)記I值卻只有0.09。前期的研究結(jié)果也表明:當(dāng)某一標(biāo)記的等位基因變異數(shù)較多時,檢測的有效等位基因、雜合度、香農(nóng)指數(shù)等參數(shù)也較高[14]。由此可見,標(biāo)記類型與效率對遺傳多樣性參數(shù)估算的影響較大,一般應(yīng)選擇多態(tài)性較高的標(biāo)記才能最大程度地揭示群體遺傳多樣性的真實水平。
F統(tǒng)計量可以反映群體遺傳結(jié)構(gòu)的變化,主要受突變、交配、漂變及選擇等因素的影響,一般用群體內(nèi)近交系數(shù)FIS、群體總近交系數(shù)FIT和遺傳分化系數(shù)FST來衡量。本研究中,舒瑪櫟各種源平均近交系數(shù)FIS為0.19,明顯高于Q.semiserrata(平均FIS為0.01)[18]與栓皮櫟(平均FIS為0.044)[22]群體,推測可能是由于樣本量較小、個體間親緣關(guān)系較近造成的。本研究中,不同種源群體間遺傳分化系數(shù)FST變化范圍為0.15~0.39,也高于Q.semiserrata(平均FST為0.12)[18]、Q.ellipsoidalis(平均FST為0.04)[20]以及栓皮櫟(平均FST為0.063)[22]群體。通常認(rèn)為FST值為0.15~0.25,群體間存在較大遺傳分化;FST值在0.25以上,群體間有很大的遺傳分化[41]。由方差A(yù)MOVA分析也可以看出,舒瑪櫟群體間變異貢獻率達到15.12%,表明群體間存在較大的遺傳分化。此外,舒瑪櫟群體的遺傳變異主要來源于個體間,因此在舒瑪櫟品種選育工作中,應(yīng)側(cè)重于群體內(nèi)單個優(yōu)樹的選擇。