龐貞武,劉鑫,孫雪陽,蘭俊,陳德文
?
SLAF-seq技術(shù)在鑒別桉樹品種中的應(yīng)用
龐貞武,劉鑫,孫雪陽,蘭俊,陳德文
(廣西國有東門林場,廣西 扶綏 532108)
本文嘗試采用一種簡化基因組測序技術(shù)(SLAF-seq)對2個(gè)尾巨桉無性系品種進(jìn)行分子鑒定。實(shí)驗(yàn)共獲得32.69 M reads的測序數(shù)據(jù),測序質(zhì)量值分布檢查結(jié)果Q30為95.28%,堿基分布檢查結(jié)果GC含量為40.61%;通過生物信息學(xué)分析共開發(fā)SLAF標(biāo)簽857 589個(gè)。樣品間SNP多態(tài)性比較結(jié)果表明,A1與A2、A3的基因型一致SNP比例分別為35.81%、77.27%,達(dá)到區(qū)分不同無性系品種的實(shí)驗(yàn)設(shè)計(jì)預(yù)期。
尾巨桉;無性系;分子鑒定;SLAF-seq技術(shù)
桉樹是桃金娘科(Myrtaceae) 桉屬() 樹種,是重要的短周期工業(yè)原料林樹種,在熱帶、亞熱帶和溫帶地區(qū)廣為種植[1],桉樹人工林給我國帶來了巨大的經(jīng)濟(jì)效益、社會(huì)效益和生態(tài)效益[2]。桉樹良種無性系在我國廣西、廣東、海南等華南地區(qū)大面積推廣種植,種苗市場需求量大,提供相應(yīng)種苗的苗圃和組培廠數(shù)量很多。因主要推廣種植的良種無性系如尾巨桉() DH32-29、DH32-26、DH32-28等桉樹基因來源于廣西國有東門林場,而一些沒有獲得使用授權(quán)的生產(chǎn)單位為謀取種苗市場利益采取魚目混珠的手段,以非良種桉樹無性系進(jìn)行種苗生產(chǎn),這些種苗在苗期的外觀上與用良種無性系系生產(chǎn)的種苗差異很小,難以分辨,導(dǎo)致企業(yè)維權(quán)和相關(guān)部門執(zhí)法困難,進(jìn)而影響了造林戶種植效益和我國造林良種率的提高。因而,探討在植物遺傳物質(zhì)層面采用分子檢測手段進(jìn)行桉樹無性系種苗品種鑒定具有現(xiàn)實(shí)的意義。目前的文獻(xiàn)報(bào)道也有這方面的嘗試,如周長品等[3]利用SNaPshot技術(shù)對桉樹SNP 復(fù)合分型檢測體系的研究、SILVA-JUNIOR等[4]發(fā)掘SNP位點(diǎn)并開發(fā)SNP 檢測芯片、劉海龍[5-6]等利用 ISSR 標(biāo)記和ITS序列分析技術(shù)進(jìn)行桉樹無性系鑒定、劉果等[7]利用SSR 標(biāo)記進(jìn)行桉樹樹種精準(zhǔn)鑒定。SLAF-seq(Specific Locus Amplified Fragment Sequencing)技術(shù)是一項(xiàng)簡化基因組測序技術(shù),該技術(shù)可以用較低的花費(fèi)實(shí)現(xiàn)全基因組范圍的標(biāo)記開發(fā)和分型,是目前最熱門的標(biāo)記分型技術(shù)之一。本文嘗試探討SLAF-seq技術(shù)用于桉樹無性系種苗品種鑒定的可行性。
無性系品種分別為尾巨桉DH32-28(東門28)、DH32-29(東門29),實(shí)驗(yàn)材料為苗期的新鮮嫩葉,取自廣西國有東門林場苗木中心苗圃。
1.2.1 實(shí)驗(yàn)設(shè)計(jì)
分別以A1、A2、A3標(biāo)記采集的樣品作為3個(gè)處理,A1為尾巨桉東門28,A2為尾巨桉東門29,A3為尾巨桉東門28(作為對照)。在A1、A2、A3每個(gè)處理的樣品中,各從5株不同組培苗上取相同數(shù)量嫩葉,5株苗的葉片混合在一起。取樣后用錫箔紙包裹并標(biāo)注,立即液氮速凍,保存于液氮中。
1.2.2 DNA提取與檢測
采用CTAB法提取DNA。DNA檢測樣量:200 ~ 500 ng; Marker為λDNA/HindIII(或其他有20 Kb以上條帶的DNA Ladder);瓊脂糖凝膠濃度:0.8% ~ 1.0%;電泳條件:電壓3 ~ 4 V·cm-1,時(shí)間40 min。獲得的基因組DNA樣品濃度≥20 ng·ul-1,樣品總量≥2μg(不包括樣品檢測損耗);樣品純度OD260/280為1.7 ~ 2.2。樣品送至專業(yè)機(jī)構(gòu)(北京百邁客生物科技有限公司)委托采用SLAF-seq技術(shù)進(jìn)行簡化基因組測序。
1.2.3 簡化基因組測序主要實(shí)驗(yàn)流程
根據(jù)選定的最適酶切方案,對檢測合格的各樣品基因組DNA分別進(jìn)行酶切實(shí)驗(yàn)。對得到的酶切片段(SLAF標(biāo)簽)進(jìn)行3′端加A處理、連接Dual-index測序接頭、PCR 擴(kuò)增、純化、混樣、切膠選取目的片段,文庫質(zhì)檢合格后用Illumina HiSeqTM 進(jìn)行測序。利用 Dual-index 對測序得到的原始數(shù)據(jù)進(jìn)行識別,得到各個(gè)樣品的酶切片段(reads)。對過濾完接頭的測序 reads 進(jìn)行測序質(zhì)量和數(shù)據(jù)量的評估。通過reads間聚類的方法,在待測樣品中開發(fā)SLAF標(biāo)簽(經(jīng)過SLAF-seq建庫產(chǎn)生的特異酶切片段,一個(gè)酶切片段就是一個(gè)SLAF標(biāo)簽),尋找在樣品間存在多態(tài)性的SNP(單核苷酸多態(tài))標(biāo)簽。
本實(shí)驗(yàn)樣品共獲得32.69 M reads測序數(shù)據(jù)。堿基識別(Base Calling)過程中每個(gè)堿基都會(huì)得到一個(gè)測序質(zhì)量值,用于評估該堿基的準(zhǔn)確性。測序質(zhì)量值是評估高通量單堿基錯(cuò)誤率的重要指標(biāo),該值越高對應(yīng)的堿基測序錯(cuò)誤率越低。從表1可知,測序平均Q30達(dá)95.15%。
堿基類型分布檢查用于檢測有無AT、GC 分離現(xiàn)象,而這種現(xiàn)象可能是測序或者建庫所帶來的,并且會(huì)影響后續(xù)分析。由于SLAF-seq測序reads為基因組DNA的酶切片段,其堿基分布會(huì)受到酶切位點(diǎn)和PCR 擴(kuò)增的影響,堿基分布會(huì)呈現(xiàn)不同程度的波動(dòng)。表1的數(shù)據(jù)表明,堿基分布檢查平均GC含量為40.07%。
表1 各樣品測序數(shù)據(jù)統(tǒng)計(jì)表
說明:1.Q30為測序質(zhì)量值大于或等于30的堿基所占百分比;2.GC為測序結(jié)果中G和C兩種堿基所占總堿基的百分比。
經(jīng)過生物信息學(xué)分析,本項(xiàng)目共開發(fā) 857 589個(gè)SLAF 標(biāo)簽,具體統(tǒng)計(jì)見表2。
表2 SLAF 標(biāo)簽統(tǒng)計(jì)
SNP的檢測主要使用GATK 軟件工具包實(shí)現(xiàn),以保證檢測得到的SNP的準(zhǔn)確性并得到最終的SNP位點(diǎn)集。主要檢測過程首先使用GATK進(jìn)行InDel Realignment,即對存在插入缺失比對結(jié)果附近的位點(diǎn)進(jìn)行局部重新比對,校正由于插入缺失引起的比對結(jié)果錯(cuò)誤;其次使用GATK和Samtools 進(jìn)行變異檢測,主要包括SNP和InDel;第三根據(jù)GATK和 samtools分別得到的變異中將位點(diǎn)一致的部分作為最終的變異位點(diǎn)用于后續(xù)分析。具體流程參考GATK官方網(wǎng)站的Best Practice。所有樣品的SNP 統(tǒng)計(jì)信息見表3。
對3個(gè)樣品間的多態(tài) SNP 進(jìn)行兩兩比較,表4為 A1 分別與A2、A3比較的差異結(jié)果。A1與A2的基因型一致的SNP比例為35.81%,A1與A3的基因型一致的SNP比例為77.27%。
表3 樣品檢測的SNP統(tǒng)計(jì)
表4 樣品間的SNP多態(tài)性
本研究結(jié)果表明,A1與樣品A3 的基因型一致的SNP占兩樣品間總SNP比例為77.27%,遠(yuǎn)高于A1與A2的基因型一致SNP 比例,因而它們是同一個(gè)品種的可能性最高,這與實(shí)驗(yàn)設(shè)計(jì)A1為尾巨桉東門28、A2為尾巨桉東門29、A3為尾巨桉東門28(作為對照)的品種設(shè)置是一致的。由此可初步推測,通過應(yīng)用SLAF-seq技術(shù)獲得尾巨桉不同無性系SNP分子標(biāo)記的多態(tài)性差異從而進(jìn)行桉樹無性系品種鑒定具有一定的可行性和可靠性,且應(yīng)用該簡化測序技術(shù)測序費(fèi)用較低,為相關(guān)企業(yè)和單位通過遺傳分子手段維權(quán)提供了便捷且成本相對低廉的途徑,因而值得進(jìn)行更深入廣泛的應(yīng)用性研究。
[1] 祁述雄.中國桉樹(第2版)[M].北京:中國林業(yè)出版社, 2002.
[2] 楊民勝,謝耀堅(jiān),劉杰鋒.中國桉樹研究三十年: 1981—2010[M].北京:中國林業(yè)出版社,2011.
[3] 周長品,翁啟杰,甘四明,等.應(yīng)用SNaPshot 技術(shù)對桉樹SNP的檢測[J].南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2018,42(4):83-88.
[4] SILVA-JUNIOR O B,FARIA D A,GRATTAPAGLIA D. A flexible multi-species genome-wide 60K SNP chip developed from pooled resequencing of 240tree genomes across 12 species[J].New Phytologist, 2015, 206(4):1527-1540.
[5] 劉海龍,王以紅,陳博雯,等.利用ISSR標(biāo)記方法鑒定5個(gè)桉樹優(yōu)良無性系[J].西部林業(yè)科學(xué),2011,40(3):66-68.
[6] 劉海龍,陳曉明,覃子海,等.ITS序列在桉樹種質(zhì)資源鑒定中的應(yīng)用研究[J].西部林業(yè)科學(xué),2010,39(4):85-88.
[7] 劉果,謝耀堅(jiān),吳志華,等.SSR 標(biāo)記在桉樹樹種精準(zhǔn)鑒定中的應(yīng)用分析[J].熱帶亞熱帶植物學(xué)報(bào), 2018,26(2):116-124.
Application of SLAF-seq Technology in Identification ofVarieties
PANG Zhenwu, LIU Xin, SUN Xueyang, LAN Jun, CHENG Dewen
(,,,)
In this paper, molecular identification of twoclones was performed using a simplified genome sequencing technology: SLAF-seq. In these experiments, the sequencing data of 32.69 M reads was obtained, the sequencing quality value distribution test result Q30 was 95.28%, and the base distribution test result GC content was 40.61%. A total of 857 589 SLAF labels were developed using bioinformatics analysis. The results of the comparison of SNP polymorphisms between samples showed that the proportions of A1, A2 and A3 with the same genotype were 35.81% and 77.27% respectively, which reached the expectation of the experimental design to distinguish different clonal varieties.
; clone; molecular identification; SLAF-seq technology
S722.3+7
A
龐貞武(1981― ),男,碩士,工程師,主要從事林業(yè)種苗生產(chǎn)技術(shù)研究