李 敏,郭 聰,王 瑩,李玉娟,談 峰,張 健(江蘇沿江地區(qū)農(nóng)業(yè)科學(xué)研究所, 江蘇 南通 226541)
【研究意義】土壤鹽堿化問(wèn)題廣泛存在于世界各國(guó)和各地區(qū)1]。據(jù)統(tǒng)計(jì),全世界有各種鹽堿地約 9.5×108hm2,占全球陸地面積的10 %[2]。目前我國(guó)鹽堿地面積約為1 億多公頃,其中沿海灘涂面積達(dá) 267 ×104hm2以上,并以每年1333.33 hm2的速度增長(zhǎng),是非常重要的土地資源[3]。由于鹽堿地含鹽量分布不均,沿海灘涂土地資源一直不能得到充分利用,因此需要選育出強(qiáng)耐鹽堿、速生、高產(chǎn)值的林木良種,為我國(guó)沿海地區(qū)開(kāi)發(fā)構(gòu)建綠色生態(tài)屏障起到重要的作用。柳樹(shù)歸屬于楊柳科(Salicaceae)柳屬(Salix),包括垂柳和旱柳,全球約520余種,其中在中國(guó)發(fā)現(xiàn)250余種柳樹(shù)品種,是我國(guó)重要的鄉(xiāng)土樹(shù)種之一[4]。柳樹(shù)具有喜光耐寒,喜濕亦能耐干早,易成活,易繁殖抗性強(qiáng)等特性。同時(shí),柳樹(shù)在鹽堿地及水體修復(fù)、水土保持和重金屬污染土壤,城市園林綠化,工業(yè)用材林、生物質(zhì)能源林及編織等方面具有廣闊的應(yīng)用前景[5]?!厩叭搜芯窟M(jìn)展】柳樹(shù)已經(jīng)在遺傳多樣性和群體遺傳結(jié)構(gòu)、遺傳圖譜的構(gòu)建、QTL定位等方面取得了重大的成果。Barke等[6]發(fā)現(xiàn)了AFLP條帶在柳樹(shù)遺傳多樣性等方面比RAFD的穩(wěn)定性高。SSR標(biāo)記開(kāi)發(fā)耗費(fèi)巨大,但是它是比較高效、快捷的分子標(biāo)記手段之一。Hanley等[7]在柳樹(shù)上開(kāi)發(fā)了一批SSR分子標(biāo)記,但并沒(méi)有公布其序列。2005年南京林業(yè)大學(xué)也開(kāi)發(fā)了一些柳樹(shù)SSR,加上NCBI網(wǎng)上檢索出來(lái)的幾條柳樹(shù)SSR,總共有68對(duì)柳樹(shù)SSR[8]。完整、高密度的遺傳連鎖圖譜對(duì)柳樹(shù)遺傳育種有很大的重要性。一個(gè)完整的遺傳連鎖圖譜能夠有效的鑒定出與植物生長(zhǎng)發(fā)育、基因型與環(huán)境互作等相關(guān)的QTL,為育種工作提供重要的基礎(chǔ)。首張柳樹(shù)遺傳圖譜是由Tsarouhas[9]的研究團(tuán)隊(duì)利用父本Bjorn (S.viminalis×S.schwerinii)與母本78183 (S.viminalis)雜交獲得的87個(gè)個(gè)體為群體成功構(gòu)建,其中AFLP標(biāo)記有325個(gè),RFLP標(biāo)記有38個(gè),用于作圖的群體共有87個(gè)個(gè)體。首張喬木柳遺傳連鎖圖譜的構(gòu)建由Barcaccia等[10]研究者完成,他們利用白柳與爆竹柳相互雜交所得到的69個(gè)個(gè)體,利用雙點(diǎn)擬測(cè)交法進(jìn)行構(gòu)建,其中包AFLP標(biāo)記242個(gè),SAMPL標(biāo)記50個(gè)。Hanley等[7]利用嵩柳的一個(gè)全同胞家系的66個(gè)個(gè)體作為作圖群體,通過(guò)雙電擬側(cè)交法構(gòu)建了親本圖譜,并整合得到一張嵩柳遺傳連鎖圖譜,其中包含AFLP標(biāo)記291個(gè),SSR標(biāo)記39個(gè)。Berlin等[11]采用SNP和AFLP兩種分子標(biāo)記,構(gòu)建了兩張均包含19個(gè)主連鎖群的高密度柳樹(shù)S1和S3遺傳連鎖圖譜。QTL定位是輔助育種的直接手段之一。目標(biāo)性狀相關(guān)的QTL在不同的時(shí)間、不同的處理表現(xiàn)出不同的作用效率,能夠?yàn)橄嚓P(guān)性狀早期鑒定和基因克隆等研究奠定了基礎(chǔ)。Tsarouhas等[9]通過(guò)他們構(gòu)建的遺傳連鎖圖譜,發(fā)現(xiàn)了11個(gè)與高生長(zhǎng)、莖段直徑、高徑比、萌枝數(shù)以及花期葉芽數(shù)量相關(guān)的QTLs。Tsarouhas等[12]通過(guò)AFLP標(biāo)記在一個(gè)柳樹(shù)家系(n=82)中通過(guò)AFLP標(biāo)記鑒別出了6個(gè)QTLs。Gunter等[13]通過(guò)RAPD技術(shù)在嵩柳全同胞家系中鑒別到了1個(gè)與雌性性別決定位點(diǎn)連接的遺傳標(biāo)記?!颈狙芯壳腥朦c(diǎn)】本研究以195份喬木柳F1代群體和兩親本資源為材料,采用通量高、準(zhǔn)確性高、成本低、周期短的SLAF-seq 高通量測(cè)序技術(shù),篩選特異長(zhǎng)度的DNA片段,構(gòu)建SLAF-seq 文庫(kù),通過(guò)高通量測(cè)序獲得海量序列,再進(jìn)行軟件分析比對(duì),獲得多態(tài)性SLAF 標(biāo)簽,在多態(tài)性SLAF 標(biāo)簽上開(kāi)發(fā)一批穩(wěn)定性高、特異性強(qiáng)的SNP 位點(diǎn)?!緮M解決的關(guān)鍵問(wèn)題】這將為特異性SNP 標(biāo)記的開(kāi)發(fā)、高密度遺傳連鎖圖譜的構(gòu)建、資源鑒定分析和重要農(nóng)藝性狀的關(guān)聯(lián)分析奠定基礎(chǔ)。
母本:敏鹽旱柳‘沿江柳’,父本:耐鹽旱柳‘9901’及雜交的F1代遺傳群體經(jīng)親本鑒定195株。
采用改良的CTAB 法提取F1群體的基因組DNA。用1 %的瓊脂糖凝膠電泳法檢測(cè)DNA 條帶的有無(wú),DNA 的濃度和純度通過(guò)ND-1000 分光光度計(jì)來(lái)檢測(cè)。
根據(jù)其基因組大小以及GC 含量等信息,選取三角葉楊(Populustrichocarpa)基因組(http://www.ncbi.nlm.nih.gov/assembly/GCF_000002775.3)作為參考基因組進(jìn)行電子酶切預(yù)測(cè),確定用HaeIII 和Hpy166 II 酶切組合進(jìn)行試驗(yàn)。雙酶切檢測(cè)合格的F1基因組DNA,再對(duì)得到的SLAF 標(biāo)簽(長(zhǎng)度為314~364 bp 的片段)進(jìn)行3′端加A、連接Dual-index 測(cè)序接頭、PCR 擴(kuò)增、片段篩選等處理后構(gòu)建旱柳SLAF 文庫(kù)。
文庫(kù)質(zhì)檢合格后,SLAF標(biāo)簽通過(guò)IlluminaHiSeq 2500平臺(tái)(Illumina, San Diego, CA, USA)進(jìn)行測(cè)序。為檢測(cè)實(shí)驗(yàn)流程的合理性,選用水稻(Oryzasativa)(http://rice.plantbiology.msu.edu/)作為對(duì)照(Control),并對(duì)水稻進(jìn)行相同的處理、建庫(kù)和測(cè)序。測(cè)序所得到的原始數(shù)據(jù)通過(guò)Dual-index 識(shí)別并得到各樣品的reads,然后評(píng)估過(guò)濾完接頭測(cè)序的reads 的質(zhì)量和數(shù)據(jù)量。
將各個(gè)樣品的序列的相似度進(jìn)行聚類,同一個(gè)SLAF 標(biāo)簽中序列是聚類在一起的,不同SLAF 標(biāo)簽的相似度比同一SLAF標(biāo)簽在不同樣品間的序列相似度低。一個(gè)SLAF 標(biāo)簽的不同樣品間序列有差異即可定義為多態(tài)性SLAF 標(biāo)簽。根據(jù)篩選標(biāo)準(zhǔn)MAF>0.05,利用SLAF 標(biāo)簽統(tǒng)計(jì)SNP 位點(diǎn)信息。
表1 根據(jù)酶切方案設(shè)計(jì)預(yù)測(cè)信息Table 1 Information prediction according to the enzyme digestion method
表2 Control 測(cè)序reads 比對(duì)結(jié)果統(tǒng)計(jì)表Table 2 Results statistics of control sequenced reads alignment (%)
根據(jù)目前已公布的柳樹(shù)的基因組大小為429 Mb,選擇同科基因組大小相似的三角葉楊基因組(大小為404 Mb,GC 含量為33.64 %)作為參考基因組,并進(jìn)行電子酶切預(yù)測(cè),選擇的酶組合為HaeIII 和Hpy166 II,定義SLAF 標(biāo)簽為酶切片段長(zhǎng)度在314~364 bp 的序列,可預(yù)測(cè)到126 008 個(gè)SLAF 標(biāo)簽,位于重復(fù)序列區(qū)的SLAF 標(biāo)簽比例為1.60 %(表1)。
以水稻作為對(duì)照物種,通過(guò)評(píng)估監(jiān)控水稻測(cè)序數(shù)據(jù)的實(shí)驗(yàn)過(guò)程,進(jìn)一步評(píng)估酶切方案的有效性與酶切的效率。通過(guò)SOAP[14]軟件對(duì)水稻基因組(大小為382M)的測(cè)序reads與參考基因組進(jìn)行比對(duì)(表2),得到雙端比對(duì)效率為96.67 %,酶切效率為92.06 %,比對(duì)效率基本正常,SLAF建庫(kù)正常。
為保證項(xiàng)目分析質(zhì)量,選取reads 的長(zhǎng)度為100 bp*2,用于后續(xù)評(píng)估和分析的數(shù)據(jù)。
圖1 測(cè)序質(zhì)量值分布 Fig.1 Sequencing mass distribution map
首先,通過(guò)測(cè)序質(zhì)量值的分布檢查來(lái)評(píng)估堿基的準(zhǔn)確性。高通量單堿基錯(cuò)誤率(e)通常使用測(cè)序質(zhì)量值(Q)來(lái)表示,堿基錯(cuò)誤率越低,所對(duì)應(yīng)的測(cè)序質(zhì)量的數(shù)值就越高,公式為Q=-10×log10e。若某個(gè)堿基測(cè)序出錯(cuò)概率為0.001,則該堿基的測(cè)序質(zhì)量值為30。母本樣品(FP)測(cè)序質(zhì)量值分布情況如圖1所示。
其次通過(guò)堿基分布檢查來(lái)檢測(cè)有無(wú)GC 、AT分離現(xiàn)象。這種分離現(xiàn)象可能會(huì)通過(guò)測(cè)序或建庫(kù)產(chǎn)生,從而影響后續(xù)分析。PCR擴(kuò)增和酶切位點(diǎn)都會(huì)影響SLAF-seq 測(cè)序reads(基因組DNA 的酶切片段)上堿基的分布,因此堿基分布會(huì)呈現(xiàn)不同程度的波動(dòng)。母本樣品(FP)測(cè)序堿基分布情況如圖2所示。
最后對(duì)各樣品的測(cè)序數(shù)據(jù)(表3)進(jìn)行統(tǒng)計(jì): 本試驗(yàn)中樣品共獲得472.53Mreads 數(shù)據(jù),測(cè)序平均Q30為90.15 %,平均GC含量為38.14 %。水稻測(cè)序獲得0.40Mreads 的數(shù)據(jù)量可用于評(píng)估實(shí)驗(yàn)建庫(kù)準(zhǔn)確性的。
根據(jù)等位基因數(shù)和基因序列之間的差異,對(duì)所有樣品所開(kāi)發(fā)的SLAF標(biāo)簽(277 333個(gè))進(jìn)行多態(tài)性分析,共得到多態(tài)性標(biāo)簽,非多態(tài)性標(biāo)簽,重復(fù)性標(biāo)簽3 種類型的SLAF 標(biāo)簽,其中多態(tài)性SLAF 標(biāo)簽共有99 526 個(gè),比例達(dá)到35.89 %(表4)。對(duì)99 526個(gè)多態(tài)性SLAF標(biāo)簽按照遺傳學(xué)通用的等位編碼規(guī)則進(jìn)行編碼,有58 763個(gè)標(biāo)簽成功編碼,為構(gòu)建遺傳圖譜進(jìn)一步對(duì)SLAF標(biāo)簽進(jìn)行過(guò)濾,最終獲得6744個(gè)SLAF標(biāo)簽(表5)。進(jìn)一步進(jìn)行SNP 位點(diǎn)的開(kāi)發(fā),在各連鎖群上共開(kāi)發(fā)得到9488 個(gè)SNP 位點(diǎn)(圖3)。
圖2 堿基含量分布Fig.2 Distribution diagram of base content
表3 測(cè)序數(shù)據(jù)統(tǒng)計(jì)Table 3 Statistics for sequencing data
表4 SLAF標(biāo)簽分類Table 4 SLAF label classification
表5 用于圖譜構(gòu)建的SLAF標(biāo)簽類型統(tǒng)計(jì)Table 5 SLAF tag type statistics for map building
SLAF-seq 技術(shù)是高通量測(cè)序技術(shù),根據(jù)設(shè)定的預(yù)酶切方案,獲得特異長(zhǎng)度的片段,采用雙端測(cè)序特定酶切片段,這種測(cè)序方法可重復(fù)性高,可以在短時(shí)間內(nèi)獲得遍布整個(gè)基因組的海量信息,以實(shí)現(xiàn)候選功能區(qū)的精細(xì)定位。這種技術(shù)開(kāi)發(fā)標(biāo)記具有密度大,一致好,成本低等特點(diǎn),并且SALF分子標(biāo)記多數(shù)為SNP,少量的Indel。目前已成功應(yīng)用于多種動(dòng)植物中,蘇文瑾等[15]通過(guò)SLAF-seq技術(shù)測(cè)序,共獲得了260 000個(gè)多態(tài)性SLAF 標(biāo)簽,并開(kāi)發(fā)了795 794個(gè)高質(zhì)量的SNP標(biāo)記。陳士強(qiáng)等[16]運(yùn)用這項(xiàng)技術(shù)開(kāi)發(fā)了偃麥草第7 染色體上抗小麥赤霉病的特異分子標(biāo)記。Li等[17]運(yùn)用此技術(shù)獲得了9948 個(gè)大豆多態(tài)SLAF 標(biāo)記。 Wei 等[18]運(yùn)用SLAF-seq 技術(shù)開(kāi)發(fā)出黃瓜的5044 個(gè)SLAF 多態(tài)標(biāo)記。本研究利用SLAF-seq技術(shù)對(duì)195個(gè)柳樹(shù)F1代群體和兩親本測(cè)序,獲得472.53 Mb的讀長(zhǎng)信息,利用所獲得的讀長(zhǎng)信息開(kāi)發(fā)出277 333個(gè)SLAF 標(biāo)簽,其中多態(tài)性SLAF 標(biāo)簽共有99 526個(gè),從99 526個(gè)多態(tài)性SLAF 標(biāo)簽上共計(jì)開(kāi)發(fā)獲得9488個(gè)SNP標(biāo)記,所獲得的數(shù)據(jù)量能夠用來(lái)進(jìn)行特異性SNP標(biāo)記的驗(yàn)證與開(kāi)發(fā)。今后,可利用所開(kāi)發(fā)的SNP標(biāo)記,聯(lián)系群體中不同個(gè)體的表型,關(guān)聯(lián)定位與某性狀緊密連鎖的分子標(biāo)記,進(jìn)而可以實(shí)現(xiàn)優(yōu)良基因的精細(xì)定位。
通過(guò)對(duì)三角葉楊基因組序列進(jìn)行電子酶切預(yù)測(cè),最終選擇的酶切組合為HaeIII和Hpy166II酶,定義長(zhǎng)度為314~364 bp的酶切片段序列為SLAF標(biāo)簽,預(yù)測(cè)可得SLAF標(biāo)簽126 008個(gè)。通過(guò)評(píng)估監(jiān)控對(duì)照物種水稻的測(cè)序數(shù)據(jù)的實(shí)驗(yàn)過(guò)程,結(jié)果可得HaeIII和Hpy166II酶的酶切效率為92.06 %,比對(duì)效率正常,SLAF建庫(kù)正常。通過(guò)測(cè)序數(shù)據(jù)的統(tǒng)計(jì)和評(píng)估,可以得到本次測(cè)序共獲得472.53 Mb的讀長(zhǎng)信息,測(cè)序平均Q30位90.15 %,平均GC含量為38.14 %。通過(guò)信息分析,共獲得277 333個(gè)SLAF標(biāo)簽,其中多態(tài)性SLAF標(biāo)簽有99 526個(gè),比例達(dá)到35.89 %,用于遺傳圖譜構(gòu)建的標(biāo)簽有6744個(gè)。通過(guò)99 526個(gè)多態(tài)性SLAF標(biāo)簽,共計(jì)開(kāi)發(fā)了9488個(gè)SNP標(biāo)記,可以用來(lái)完成后續(xù)群體進(jìn)化分析和特異性SNP標(biāo)記的開(kāi)發(fā)。
圖3 各連鎖群上SNP標(biāo)記的數(shù)目Fig.3 Number of SNP tags on each chain group
參考文獻(xiàn):
[1]Munns R, Tester M. Mechanisms of salinity tolerance[J]. Annual Review of Plant Biology, 2008, 59: 651-681.
[2]Dupuy L, Fourcaud T, Stokes A. A numerical investigation into the influence of soil type and root architecture on tree anchorage[J]. Plant and Soil, 2005, 278(1/2): 119-134.
[3]孟慶峰. 蘇北灘涂鹽漬土壤質(zhì)量及植物品質(zhì)調(diào)控機(jī)制研究[D]. 中國(guó)科學(xué)院博士研究生論文,2012.
[4]施士爭(zhēng). 柳樹(shù)的園林應(yīng)用類型與改良[J]. 西北林學(xué)院學(xué)報(bào),2008,23(4):200-204.
[5]Li M, Yu C M, Wang Y Y, et al. Cloning and Characterisation of Two H+Translocating Organic Pyro-phosphatase Genes inSalixand Their Expression Differences in Two Willow Varieties with Different Salt Tolerances[J]. Current Genomics, 2014, 15(5): 341-348.
[6]Barker J H, Matthes M, Arnold G M, et al. Characterisation of genetic diversity in potential biomass willows (Salixspp.) by RAPD and AFLP analyses[J]. Genome, 1999, 42(2): 173-183.
[7]Hanley S, Barker J, VanOoijen J W, et al. A genetic linkage Map of willow (Salixviminalis) based on AFLP and microsatellite markers[J]. Theoretical and Applied Genetics, 2002(105): 1087-1096.
[8]劉恩英.簸箕柳×綿毛柳遺傳框架圖譜的構(gòu)建[D].南京: 南京林業(yè)大學(xué), 2008.
[9]Tsarouhas V, Gullberg U, Lagercrantz U. An AFLP and RFLP Linkage map and quantitative trait locus (QTL) analysis of growth traits inSalix[J]. Theoretical and Applied Genetics, 2002(105): 277-288.
[10]Barcaccia G, Meneghetti S, Albertini E, et al. Linkage mapping in tetraploid willows:Segregation of molecular markers and estimation of linkage phases support an allotetraploid structure forSalixalbaSalixfragilis interspecific hybrids[J]. Heredity, 2003(90): 169-180.
[11]Berlin S, Lagercrantz U, Arnold S, et al. High-density linkage Mapping and evolution of paralogs and orthologs inSalixandPopulus[J]. BMC Genomics, 2010(11): 129-143.
[12]Tsarouhas V, Gullberg U, Lagercrantz U.Mapping of quantitative Trait loci controlling timing of bud flush inSalix[J]. Hereditas, 2003, 138(3): 172-178.
[13]Gunter L E, Roberts G T, Lee K, et al. The development of two Flanking SCAR markers linked to a sex determination locus inSalixviminalisL.[J]. J Hered, 2003, 94(2):185-189.
[14]Heffner E L, Sorrells M E, Jannink J L. Genomic selection for crop improvement[J]. Crop Science, 2009, 49(1):1-12.
[15]蘇文瑾,趙 寧,雷 劍,等. 基于SLAF-seq技術(shù)的甘薯SNP位點(diǎn)開(kāi)發(fā)[J]. 中國(guó)農(nóng)業(yè)科學(xué),2016,49(1):27-34.
[16]陳士強(qiáng),秦樹(shù)文,黃澤峰,等. 基于SLAF-seq技術(shù)開(kāi)發(fā)長(zhǎng)穗偃麥草染色體特異分子標(biāo)記[J]. 作物學(xué)報(bào), 2013,39(4):727-734.
[17]Li B, Tian L, Zhang J Y, et al. Construction of a high-density genetic map based on large-scale markers developed by specific length amplified fragment sequencing (SLAF-seq) and its application to QTL analysis for isoflavone content inGlycinemax[J]. BMC Genomics, 2014, 15: 1086.
[18]Wei Q Z, Wang Y Z, Qin X D, et al. An SNP-based saturated genetic map and QTL analysis of fruit-related traits in cucumber using specific-length amplified fragment (SLAF) sequencing[J]. BMC Genomics, 2014, 15: 1158.