崔明明,陶 靜,宗世祥
基于轉錄組的沙棘木蠹蛾簡單重復序列特征分析
崔明明,陶 靜,宗世祥*
(北京林業(yè)大學林木有害生物防治北京市重點實驗室,北京 100083)
為開發(fā)沙棘木蠹蛾微衛(wèi)星信息,利用已獲得的轉錄組數據,對其EST-SSR位點進行發(fā)掘,進而分析其特征。結果發(fā)現含SSR的序列5126條,識別的SSR總數為7499個,SSR出現頻率為51.41%。微衛(wèi)星序列主要以單堿基重復為主,發(fā)生頻率為39.52%。研究共發(fā)現77種堿基重復基元,所占比例最高的為(A/T)n(73.74%),其次是(AT/AT)n(3.37%)。微衛(wèi)星多為重復次數為10且長度為10 bp的短序列。研究結果為沙棘木蠹蛾的SSR分子標記研究,遺傳多樣性分析,種群遺傳結構以及關鍵性狀基因的發(fā)掘等研究奠定基礎。
沙棘木蠹蛾;轉錄組;微衛(wèi)星
簡單重復序列(simple sequence repeat,SSR)又稱作微衛(wèi)星(microsatellites),普遍存在于真核生物基因組,是由若干個堿基組成的簡單串聯重復序列。SSR標記是分子標記手段的一種?,F有常用的分子標記手段,包括RFLP,RAPD,ISSR,AFLP,SSR,SNPs等,都各有其優(yōu)缺點(閆華超等,2006),相比之下,SSR標記具有數量豐富、分布廣泛、共顯性遺傳、多態(tài)性豐富等特點,且試驗成本低,結果相對穩(wěn)定,操作簡單,是遺傳學背景研究非常有效的工具,被公認為是遺傳學研究中最理想的分子標記手段之一(Liuetal., 2013),已被廣泛應用于種群遺傳多樣性分析、動植物分類和進化、遺傳圖譜的構建、基因定位和克隆、分子標記輔助育種、品種鑒定等領域(Lietal., 2002;Varshneyetal., 2005)。
SSR按來源分,有基因組SSR(g-SSR)和轉錄組來源的SSR(EST-SSR)(王東等,2014)。與g-SSR相比,EST-SSR標記無需構建基因組文庫、雜交、測序,避免了大量人力、物力和時間的投入,同時EST反映了基因組的編碼區(qū)域,直接獲得生物個體基因表達信息,因此EST-SSR多態(tài)性可能與基因功能直接相關(Eujayletal., 2002)。目前,昆蟲中已有黑翅土白蟻Odontotermesformosanus(Huangetal., 2012)、煙粉虱Bemisiatabaci(Xieetal., 2012),細梢小卷蛾Rhyacionialeptotubula(Zhuetal., 2013)、黃粉蟲Tenebriomolitor(Zhuetal., 2013)、扶桑綿粉蚧Phenacoccussolenopsis(羅梅等,2014)、云南切梢小蠹Tomicusyunnanensis(袁遠等,2014)、綠豆象Callosobruchuschinensis(Duanetal., 2014)、粘蟲Mythimnaseparate(胡艷華等,2015)、溝眶象Eucryptorrhynchuschinensis(武政梅等,2016)等借助現有的轉錄組數據成功開發(fā)了EST-SSR。
沙棘木蠹蛾Eogystiahippophaecolus(Huaetal., 1990)是我國重要的鉆蛀性害蟲,主要分布在內蒙、遼寧、山西、陜西、寧夏和甘肅等地,以幼蟲鉆蛀并取食沙棘Hippophaerhamnoides的根部和干部進行危害,可導致沙棘整株枯死,嚴重影響了沙棘林的經濟和生態(tài)效益(路常寬等,2004;宗世祥等,2005a,2005b,2005c)。目前,有關沙棘木蠹蛾的研究主要在生物學生態(tài)學特性,災害監(jiān)測和控制技術策略上,關于該昆蟲遺傳信息的研究僅見陶靜等利用AFLP分子標記分析其種群遺傳多樣性和遺傳結構的報道(Taoetal., 2012)。沙棘木蠹蛾SSR分子標記的開發(fā),能進一步揭示沙棘木蠹蛾的遺傳背景。此外,本課題組已經完成了對沙棘木蠹蛾的轉錄組測序及組裝,得到了質量較高的轉錄組數據,為開發(fā)EST-SSR提供了豐富的資源。為此,本研究基于沙棘木蠹蛾轉錄組數據發(fā)掘SSR位點,分析其組成及分布特征,為進一步利用SSR分子標記分析其種群間的遺傳結構和遺傳分化以及構建遺傳圖譜奠定基礎,也將為其功能基因的開發(fā)利用、比較基因組學的研究等提供依據。
1.1 材料來源
1.1.1 供試蟲源與處理
沙棘木蠹蛾幼蟲采自中國東北部遼寧省建平縣。經過72 h的饑餓處理,用無菌水清洗干凈蟲體,液氮速凍后存于-80℃冰箱。利用液氮研磨法磨碎昆蟲樣本,用TRIzol法提取RNA,使用RNeasy Plus Mini Kit(No.74134;Qiagen,Hilden,Germany)試劑盒。提取的RNA用Nanodrop 8000(Thermo,Waltham,MA,USA)檢測濃度和A260/A280的值,經檢測合格的樣品進行下一步的測序工作。
1.1.2 轉錄組數據來源
測序工作由北京百邁克生物科技有限公司完成。原始數據已上傳到Sequence Read Archive(SRA)數據庫,登錄號為SRR4409152。
1.1.3 沙棘木蠹蛾EST-SSR的篩選
利用MISA軟件(MicroSAtellite identification tool, http://www.pgrc.Ipk-gatersleben.de/misa/),對篩選得到的1 kb以上的Unigene序列進行SSR位點搜索和分析。所檢測SSR位點包括單堿基重復、二堿基重復、三堿基重復、四堿基重復、五堿基重復和六堿基重復6類。篩選標準為單堿基重復至少10次,二堿基重復至少6次,三堿基至六堿基的最少重復均為5次。復合SSR兩個位點間最大間隔堿基數為100。
2.1 沙棘木蠹蛾EST-SSR位點的數量與分布
對篩選得到的1 kb以上的Unigene共14587條序列進行SSR分析。結果,包含SSR的序列有5126條,識別的SSR總數為7499個,其中3497條 Unigene只包含單個SSR位點,有1629條序列包含1個以上的SSR的序列。SSR發(fā)生頻率(含有SSR的Unigene數目與總Unigene的數目之比)為35.14%,SSR出現頻率(檢出SSR個數與總Unigene數目之比)為51.41%。平均每隔2568.01 bp就含有1個SSR位點。沙棘木蠹蛾轉錄組中SSR位點的序列總長度達到81383.15 bp,SSR 位點平均長度為20.86 bp,一至六堿基重復的SSR位點的平均長度分別為9.80、13.05、15.33、19.33、25.67、42.00 bp(表1)。
表1 沙棘木蠹蛾SSR 不同重復基元分布情況Table 1 Distribution of different repeat motifs in Eogystia hippophaecolus transcriptome
2.2 沙棘木蠹蛾EST-SSR基元類型和比例
沙棘木蠹蛾EST-SSR重復類型豐富,單核苷酸至六核苷酸重復都可以發(fā)現。從SSR位點數量上看,出現最多的為單核苷酸重復,占總SSR位點數量的76.88%,其次是二、三核苷酸重復,分別占11.64%和10.68%,四、五、六核苷酸重復類型的數量很少,總計不足1% (表1)。
轉錄組SSR中共觀察到77種重復基元,單核苷酸至六核苷酸種類分別有2、9、30、32、5、1種。在這77種重復基元中,以單堿基重復基元A/T數量占絕對優(yōu)勢,占總SSR的73.74%;其次是二堿基重復AT/AT以及單堿基重復G/C所占比例較高,分別為3.37%和3.13%;二堿基重復基元中,以AT/AT和TA/TA較多,占二堿基重復SSR總數的54.80%。在三堿基重復基元中GCG/CGC出現次數多占三堿基重復SSR的15.07%,其次是ATT/AAT、GGC/GCC和TAT/ATA,分別為12.08%、10.96%和8.72%;其他四堿基至六堿基重復基元類型雖多,但數量均較少,出現頻率均較低。不同類型的SSR重復基元的分布見圖1。
2.3 EST-SSR基元長度和重復次數
在識別的SSR的長度分布上,由于單堿基重復序列占的比重較大,基元長度為10 bp的占50.45%,長度為11 bp的占15.43%,其次是長度為12 bp(10.46%)和15 bp(8.01)的基元(見圖2)?;闹貜痛螖瞪希灾貜?0次的基元數量最多(54.02%),其次是重復11次(16.73%),重復6次(7.20%)和12次(5.26%)的基元。不同重復次數的位點個數分布見圖3。
圖1 基于重復基元類型的微衛(wèi)星分布Fig.1 Microsatellites distribution on different repeat motifs
圖2 沙棘木蠹蛾EST-SSR的長度分布圖Fig.2 Length distribution of EST-SSR in Eogystia hippophaecolus transcriptome
圖3 沙棘木蠹蛾EST-SSR重復次數分布圖Fig.3 Distribution of EST-SSR repeat frequency in Eogystia hippophaecolus transcriptome
隨著二代測序的發(fā)展,SSR的發(fā)掘不再局限于構建SSR富集文庫方法以及高通量發(fā)掘已測得物種基因組的方法,越來越多的基于轉錄組數據庫高通量篩選微衛(wèi)星的研究結果表明,開發(fā)轉錄組數據是一種高通量發(fā)掘SSR的有效方法(Lovinetal., 2009;Arthoferetal., 2011;Baietal., 2011)。
本研究通過對沙棘木蠹蛾轉錄組數據的篩選,從14587條Unigene中共識別了7499個SSR位點,分布在5126條Unigene序列上。SSR發(fā)生頻率為35.14%,SSR出現頻率為51.41%。平均每隔2568.01 bp就含有1個SSR位點,SSR位點平均長度為20.86 bp。沙棘木蠹蛾的轉錄組SSR出現頻率相較于其他昆蟲差異較大,如黑翅土白蟻轉錄組SSR出現頻率為9.98%(Huangetal., 2012),煙粉虱為5.07%(Xieetal., 2012),細梢小卷蛾為3.09%(Zhuetal., 2013),粘蟲為1.93%(胡艷華等,2015),溝眶象的10.36%(武政梅等,2016)。出現該現象的可能原因為:一是物種的特異性,可能沙棘木蠹蛾SSR的數量較為豐富;二是構建轉錄組的方法不同造成轉錄組數據的差異,比如,構建轉錄組選用的昆蟲蟲態(tài)和數量上、測序和組裝所設置的參數的不同,都將造成轉錄組本身的Unigene數量上的差異;三是SSR位點的搜索方法或計算標準不同造成統(tǒng)計結果的差異,比如,本研究對轉錄組數據中長度在1 kb以上的Unigene進行的SSR高通量的發(fā)掘,篩選標準為單堿基重復至少10次,即SSR長度最小設置為10 bp。相對于溝眶象的類似研究中,同樣是長度在1 kb以上的Unigene進行的搜索,篩選標準為單堿基重復至少12次,但SSR長度最小設置為12 bp,而單堿基重復的數量又相對較多,造成了結果的較大差異。而對于扶桑綿粉蚧(羅梅等,2014)、云南切梢小蠹(袁遠等,2014)的研究,均是搜索轉錄組數據中所有的Unigene進行SSR的發(fā)掘,且SSR長度最小設置為12 bp,這就引起了差異較大的比較結果。綜上三個原因,在進行類似研究的比較分析時,要基于參數設置基本相同的前提下,或者將參數列出以作為參考。
在發(fā)掘得到的沙棘木蠹蛾轉錄組SSR中,單堿基重復類型的數量最高,二、三堿基的數量相當。而綠豆象(Duanetal., 2014)、云南切梢小蠹(袁遠等,2014)、溝眶象(武政梅等,2016)等昆蟲的 EST-SSR主要以三堿基重復為主。這是由于本研究篩選標準為單堿基重復至少10次,本研究中SSR長度為10 bp的總數占到50%以上,因此單堿基重復SSR數量在本研究中占到絕對優(yōu)勢。本研究中SSR重復基元中所占比例最高的為A/T,所占比為73.74%。即使將篩選標準設置為單堿基重復至少12次,A/T所占比例達30.34%,在此篩選標準下占比依然最高,這與黃粉蟲(Zhuetal., 2013)、云南切梢小蠹(袁遠等,2014)、扶桑綿粉蚧(羅梅等,2014)的轉錄組中SSR的分析結果近似。
SSR標記作為一種高效的分子標記手段,其缺點是SSR標記具有特異性,必須進行PCR檢測進行驗證(李明芳和鄭學勤,2004)。因此,在后期開發(fā)沙棘木蠹蛾SSR分子標記上,要對SSR重復單元前后的序列設計引物,并對其穩(wěn)定性和多態(tài)性進行驗證。
本研究基于轉錄組數據進行沙棘木蠹蛾EST-SSR的高通量發(fā)掘,并對發(fā)掘到的EST-SSR的特征進行了分析,結果得到了在種類和數量上均較為豐富的EST-SSR,進一步證明了利用轉錄組數據發(fā)掘SSR是一種高效可行的方法。研究結果豐富了沙棘木蠹蛾的分子標記,對其種群遺傳結構、種群遺傳多樣性以及功能基因的開發(fā)利用、比較基因組學的研究都具有重要的參考價值。
References)
Arthofer W, Steiner FM, Schlick-Steiner BC.Rapid and cost-effective screening of newly identified microsatellite loci by high-resolution melting analysis [J].MolecularGeneticandGenomics, 2011, 286 (3): 225-235.
Bai X, Mamidala P, Rajarapu SP,etal.Transcriptomics of the bed bug (Cimexlectularius) [J].PLoSONE, 2011, 6 (1): e16336.
Duan CX, Li DD, Sun SL,etal.Rapid development of microsatellite markers forCallosobruchuschinensisusing Illumina paired-end sequencing [J].PLoSONE, 2014, 9 (5): e95458.
Eujayl I, Sorrells M, Banm M,etal.Isolation of EST-derived microsatellite markers for genotyping the A and B genomes of wheat [J].TheoreticalandAppliedGenetics, 2002, 104 (2): 399-407.
Hu YH, Li M, Zhang HF,etal.The information analysis of SSR loci in theMythimnaseparate(Walker) transcriptome [J].JournalofShanxiAgriculturalUniversity, 2015, 35 (5): 484-489.[胡艷華, 李敏, 張虎芳, 等.粘蟲轉錄組中SSR位點的信息分析[J].山西農業(yè)大學學報, 2015, 35 (5): 484-489]
Huang Q, Sun P, Zhou X,etal.Characterization of head transcriptome and analysis of gene expression involved in caste differentiation and aggression inOdontotermesformosanus(Shiraki) [J].PLoSONE, 2012, 7 (11): e50383.
Li MF, Zheng XQ.Research progress of methods of SSR primers development [J].Hereditas, 2004, 26 (5):769-776.[李明芳, 鄭學勤.開發(fā)SSR引物方法之研究動態(tài)[J].遺傳, 2004, 26 (5): 769-776.]
Li YC, Korol AB, Fahima T,etal.Microsatellites: Genomic distribution, putative functions and mutational mechanisms: A review [J].MolecularEcology, 2002, 11 (12): 2453-2465.
Liu T, Zhu S, Fu L,etal.Development and characterization of 1827 expressed Sequence tag-derived simple sequence repeat markers for ramie (BoehmerianiveaL.Gaud) [J].PLoSONE, 2013, 8 (4): e60346.
Lovin DD, Washington KO, Bruyn B,etal.Genome-based polymorphic microsatellite development and validation in the mosquitoAedesaegyptiand application to population genetics in Haiti [J].BMCGenomics, 2009, 10: s590.
Lu CK, Luo YQ, Zong SX,etal.Adult behaviors and sex attraction ofHolcocerushippophaecolus[J].JournalofBeijingForestryUniversity, 2004, 26 (2): 79-83.[路常寬, 宗世祥, 駱有慶, 等.沙棘木蠹蛾成蟲行為學特征及性誘效果研究[J].北京林業(yè)大學學報, 2004, 26 (2): 79-83.]
Tao J, Chen M, Zong SX,etal.Genetic structure in the seabuckthorn carpenter moth (Holcocerushippophaecolus) in China: The role of outbreak events, geographical and host factors [J].PLoSONE, 2012, 7 (1): e30544.
Varshney RK, Graner A, Sorrells ME.Genic microsatellite markers in plants: Features and applications [J].TrendsinBiotechnology, 2005, 23 (1): 48-55.
Wang D, Cao LY, Gao JP.Data mining of simple sequence repeats inCodonopsispilosulatranscriptome [J].ChineseTraditionalandHerbalDrugs, 2014, 46 (8): 2390-2394.[王東, 曹玲亞, 高建平.黨參轉錄組中SSR位點信息分析[J].中草藥, 2014, 46 (8): 2390-2394]
Wu ZM, Gao P, Wen JB.Analysis of microsatellites’ characteristics inEucryptorrhynchuschinensis[J].JournalofEnvironmentalEntomology, 2016, 38 (5): 979-983.[武政梅, 高朋, 溫俊寶.溝眶象轉錄組微衛(wèi)星特征分析[J].環(huán)境昆蟲學報, 2016, 38 (5): 979-983]
Xie W, Meng QS, Wu QJ,etal.Pyrosequencing theBemisiatabacitranscriptome reveals a highly diverse bacterial community and a robust system for insecticide resistance [J].PLoSONE, 2012, 7 (4): e35181.
Yan HC, Gao L, Li GL.Application and development of molecular markers [J].BiologyBulletin, 2006, 41 (2): 17-19.[閆華超, 高嵐, 李桂蘭.分子標記技術的發(fā)展及應用[J].生物學通報, 2006, 41 (2): 17-19.]
Yuan Y, Zhang LF, Wu GX,etal.High-throughput discovery microsatellites inTomicusyunnanenss(Coleoptera: Scolytonae) [J].JournalofEnvironmentalEntomology, 2014, 36 (2): 166-170.[袁遠, 張麗芳, 吳國星, 等.云南切梢小蠹微衛(wèi)星的高通量發(fā)掘[J].環(huán)境昆蟲學報, 2014, 36 (2): 166-170]
Zhu JY, Li YH, Yang S,etal.De novo assembly and characterization of the global transcriptome forRhyacionialeptotubulausing Illumina paired-end sequencing [J].PLoSONE, 2013, 8 (11): e81096.
Zhu JY, Wu GX, Yang B.High-throughput discovery of SSR genetic markers in the yellow mealworm beetle,Tenebriomolitor(Coleoptera: Tenebrionidae), from its transcriptome database [J].ActaEntomologicaSinica, 2013, 56 (7): 724-728.
Zong SX, Jia FY, Luo YQ,etal.Harm characteristics and population dynamics ofHolcocerushippophaecolus[J].JournalofBeijingForestryUniversity, 2005, 27 (1): 70-74.[宗世祥, 賈峰勇, 駱有慶, 等.沙棘木蠹蛾危害特性與種群數量的時空動態(tài)的研究[J].北京林業(yè)大學學報, 2005, 27 (1): 70-74]
Zong SX, Luo YQ, Xu ZC,etal.Geostatistical analysis on spatial distribution ofHolcocerushippophaecoluseggs and larvae [J].ActaEcologicaSinica, 2005, 25 (4): 831-836.[宗世祥, 駱有慶, 許志春, 等.沙棘木蠹蛾卵和幼蟲空間分布的地統(tǒng)計學分析[J].生態(tài)學報, 2005, 25 (4): 831-836]
Zong SX, Yao GL, Luo YQ,etal.Niche of main boring pests inHippophaerhamnoidea[J].ActaEcologicaSinica, 2005, 25 (12): 3264-3270.[宗世祥, 姚國龍, 駱有慶, 等.沙棘主要蛀干害蟲種群生態(tài)位[J].生態(tài)學報, 2005, 25 (12): 3264-3270]
Feature analysis of simple sequence repeats inEogystiahippophaecolustranscriptome
CUI Ming-Ming, TAO Jing, ZONG Shi-Xiang*
(Beijing Key Laboratory for Forest Pest Control, Beijing Forestry University, Beijing 100083, China)
In order to exploit SSR information ofEogystiahippophaecolus, we identify EST-SSR loci and analyze their features according to the transcriptome ofE.hippophaecolus.Results show 5126 unigenes contain 7499 SSR loci in total (51.41%).Mononucleotide repeats predominated with an occurrence frequency of 39.52%.There are 77 kinds of repeat motifs existing inE.hippophaecolustranscriptome.(A/T)n (73.74%) is most frequent in all the repeat types, and next is (AT/AT)n (3.37%).Most of the SSR are less than ten times of repetition and are 10 bp in length.The results should contribute to researches in SSR marker, genetic diversity, population genetic structure and genomic signatures identification inE.hippophaecolus.
Eogystiahippophaecolus; transcriptome; microsatellites
崔明明,陶靜,宗世祥.基于轉錄組的沙棘木蠹蛾簡單重復序列特征分析[J].環(huán)境昆蟲學報,2017,39(3):605-610.
國家自然基金面上項目(31470651)
崔明明,女,碩士研究生,研究方向為昆蟲分子生物學
*通訊作者Author for correspondence,E-mail: zongsx@126.com
Received: 2017-01-01;接受日期Accepted: 2017-02-23
Q963;S433.3
A
1674-0858(2017)03-065-06