楊 尉,司圓圓,許瑞雯,陳興漢
陽江職業(yè)技術(shù)學院,廣東 陽江 529566
疣吻沙蠶 (Tylorrhynchusheterochaetus) 又名疵吻沙蠶,屬環(huán)節(jié)動物門、多毛綱、葉須蟲目、沙蠶科,俗稱禾蟲、流蜞,在中國東南沿海河口地區(qū)的泥沙質(zhì)淺灘或稻田中廣泛分布[1-2]。作為一種經(jīng)濟價值極高的多毛類,其味道鮮美且營養(yǎng)豐富,是中國廣東、廣西、福建、香港、澳門及東南亞各地獨具特色的水產(chǎn)品,素有“水中冬蟲夏草”之美譽[2-3]。更重要的是,疣吻沙蠶與水稻具有天然的共生關(guān)系,發(fā)展疣吻沙蠶稻田綜合種養(yǎng)模式可顯著增加水稻種植的經(jīng)濟效益[4]?!八?疣吻沙蠶”生態(tài)綜合種養(yǎng)技術(shù)正日趨成熟,自2021 年起連續(xù)3 年入選廣東省農(nóng)業(yè)主推技術(shù),在助力鄉(xiāng)村振興、保障國家糧食安全等方面應(yīng)用潛力巨大。然而,疣吻沙蠶具有生境狹窄、種群地理隔離、群體恢復(fù)力低等物種特性,受棲息地破壞、過度捕撈、環(huán)境污染等因素的影響其自然種群呈逐年衰退的趨勢,在有些地區(qū)甚至已經(jīng)絕跡[4-5]。在突破疣吻沙蠶全人工繁殖技術(shù)的基礎(chǔ)上,近年已實現(xiàn)其苗種的規(guī)模化培育,增養(yǎng)殖業(yè)的發(fā)展以及技術(shù)的革新培育了大量的人工繁育群體,但因遺傳育種研究的滯后,疣吻沙蠶種質(zhì)開始出現(xiàn)生長性能及抗逆性下降等退化現(xiàn)象[4]。為建立疣吻沙蠶資源管理策略并促進其可持續(xù)開發(fā)利用,特別是避免常年的產(chǎn)業(yè)化增養(yǎng)殖引起遺傳結(jié)構(gòu)單一化,防止人工繁育群體污染自然種群,有必要采用分子手段科學地分析及評估其種質(zhì)現(xiàn)狀,揭示種群遺傳多樣性水平與遺傳結(jié)構(gòu),并以此指導新品種的培育與遺傳改良研究。
目前,國內(nèi)外針對疣吻沙蠶的研究主要集中在形態(tài)學、生活史、繁殖生物學、增養(yǎng)殖技術(shù)、營養(yǎng)與活性成分分析等方面[3,5]。Chen 等[5-6]完成了疣吻沙蠶線粒體基因組測序,并基于線粒體COI 序列分析了7 個地理群體的遺傳結(jié)構(gòu),除此之外,遺傳學相關(guān)的研究鮮有報道;分子遺傳信息的匱乏制約了疣吻沙蠶資源保護利用研究的深入開展。微衛(wèi)星標記具有多態(tài)性豐富、共顯性遺傳、基因組覆蓋廣泛等優(yōu)點[7],該技術(shù)操作簡便、檢測周期短、穩(wěn)定性高、重復(fù)性好,已廣泛應(yīng)用于譜系鑒定、親緣關(guān)系檢測、遺傳多樣性分析、種質(zhì)資源評價、遺傳圖譜構(gòu)建及基因定位等領(lǐng)域[8]。基因組survey 是利用高通量測序技術(shù)實施小片段、低深度測序,然后基于Lander-Waterman 模型進行k-mer 分析,并根據(jù)k-mer 頻率和深度的統(tǒng)計結(jié)果評估物種基因組的大小與復(fù)雜程度等關(guān)鍵特征[9]。基因組survey 不僅能為全基因組測序及高質(zhì)量組裝提供科學依據(jù),而且對無參考基因組序列的物種而言,利用基因組survey 數(shù)據(jù)大規(guī)模開發(fā)微衛(wèi)星標記是當前最高效的策略之一,較傳統(tǒng)方法具有效率高、周期短、成本低的優(yōu)勢[9]?;蚪M微衛(wèi)星鑒定研究在水產(chǎn)經(jīng)濟動物中已廣泛開展,篩選的標記獲得了良好的遺傳分析效果。例如,張永德等[9]在卵形鯧鲹 (Trachinotus ovatus) 基因組survey 數(shù)據(jù)中檢測到190 121 個微衛(wèi)星位點并成功開發(fā)了多態(tài)分子標記,為全基因組測序與組裝、漁業(yè)資源保護利用及良種選育奠定了基礎(chǔ);上官清等[10]分析了斑鱧 (Channamaculata) 基因組微衛(wèi)星特征,并篩選到20 個多態(tài)性位點用于群體遺傳多樣性和遺傳結(jié)構(gòu)分析,為該物種的遺傳監(jiān)測、親緣關(guān)系鑒定、種質(zhì)資源養(yǎng)護及管理提供了技術(shù)支持。
本研究對疣吻沙蠶基因組進行低深度高通量測序,通過k-mer 分析預(yù)測基因組大小、雜合度和重復(fù)比例等信息,對測序數(shù)據(jù)初步組裝后搜索組裝序列中的微衛(wèi)星位點,分析其特征與分布規(guī)律,初步驗證標記的有效性和多態(tài)性,以期指導基因組精細圖譜的繪制,并為群體遺傳學研究提供可靠的標記資源。
疣吻沙蠶采集自陽江市廣東陽海農(nóng)業(yè)技術(shù)發(fā)展有限公司疣吻沙蠶增養(yǎng)殖試驗基地(111°55'23"E、21°49'16"N) 保種的越南海防群體。用于基因組測序的疣吻沙蠶幼體用適量無菌水洗滌3 次,解剖后剪取體壁肌肉組織裝入2 mL 凍存管,液氮速凍后置于-80 ℃保存。微衛(wèi)星標記多態(tài)性驗證群體的30 尾個體經(jīng)無菌水洗滌后,解剖剪取體壁肌肉組織,置于體積分數(shù)為95%的乙醇中在-20 ℃下保存。
運用苯酚-氯仿法提取疣吻沙蠶基因組DNA,經(jīng)1.0% (w) 瓊脂糖凝膠電泳檢測完整度后,用NanoDrop 2000 超微量分光光度計 (ThermoFisher,美國) 檢測濃度和純度。利用Covaris 超聲波破碎儀將基因組DNA 片段化,篩選合適長度的DNA片段,經(jīng)末端修復(fù)、加A 尾、添加測序接頭、純化及PCR 擴增等步驟建立350 bp 小片段文庫。測序文庫經(jīng)Qubit 2.0 (ThermoFisher,美國) 和Agilent 2100 Bioanalyzer (Agilent,美國) 檢測濃度和插入片段大小后,用Illumina HiseqTMX Ten 平臺進行雙末端測序?;蚪M測序工作委托北京諾禾致源科技股份有限公司完成。原始數(shù)據(jù)經(jīng)質(zhì)控和過濾后,用GCE 1.0.0[11]軟件對有效數(shù)據(jù)進行k-mer 分析。運用SOAPdenovo 2.01[12]軟件,選擇k-mer=41 將有效數(shù)據(jù)組裝至contig 和scaffold 級別,并統(tǒng)計GC 含量和覆蓋深度等信息。
使用MISA (Microsatellite identification tool) 軟件(http://pgrc.ipk-gatersleben.de/misa/misa.html)在長度大于500 bp 的序列中搜索微衛(wèi)星位點。運行參數(shù)為:重復(fù)基序長度1~6 bp,單堿基重復(fù)次數(shù)≥12 次,二堿基重復(fù)次數(shù)≥6 次,三堿基、四堿基重復(fù)次數(shù)≥5 次,五堿基、六堿基重復(fù)次數(shù)≥4 次;將間隔區(qū)域長度小于100 bp 的相鄰微衛(wèi)星歸為1 個復(fù)合型位點?;谖⑿l(wèi)星側(cè)翼序列,用Primer 5[13]批量設(shè)計引物,主要參數(shù)為:引物長度18~27 bp,擴增產(chǎn)物100~300 bp,退火溫度(Tm) 55~65 ℃,GC 含量40%~60%,正、反向引物退火溫差≤5 ℃;盡量避免出現(xiàn)發(fā)卡結(jié)構(gòu)、二聚體、錯配和引物二聚體;每個微衛(wèi)星位點生成3~5 對候選引物。隨機選取50 對微衛(wèi)星引物委托生工生物工程(上海)股份有限公司合成。
使用天根生化科技(北京)有限公司的海洋動物組織基因組DNA 提取試劑盒從疣吻沙蠶體壁肌肉組織中提取基因組DNA。PCR 反應(yīng)體系為20 μL,正、反向引物 (10 μmol·L-1) 各0.5 μL,DNA 模板(15 ng·μL-1) 1.0 μL,2×PCR Mix 10 μL,用超純水補至20 μL。擴增反應(yīng)由Bio-Rad My Cycler Thermal Cycler (Bio-Rad,美國) 完成,運行程序為:95 ℃預(yù)變性5 min;95 ℃變性30 s,59~60 ℃退火30 s,72 ℃延伸30 s,25 個循環(huán);72 ℃延伸5 min。PCR 產(chǎn)物先進行1.5% (w) 瓊脂糖凝膠電泳分析,參照預(yù)期片段大小篩選出有效擴增引物。有效擴增引物加熒光接頭后 (正向引物5'端添加FAM 熒光素),在30 尾疣吻沙蠶個體的基因組DNA 中擴增以驗證其多態(tài)性。PCR 產(chǎn)物送至上海翼禾應(yīng)用生物技術(shù)有限公司用3730XL 測序分析儀 (Applied Biosystems,美國) 進行毛細管電泳分析,使用GeneMapper 3.2 軟件 (Applied Biosystems,美國) 進行基因分型。
使用Excel 2016 軟件完成微衛(wèi)星位點分布特征信息的統(tǒng)計分析和圖表繪制。微衛(wèi)星發(fā)生頻率=含微衛(wèi)星的序列總數(shù)/序列總數(shù)×100%;微衛(wèi)星出現(xiàn)頻率=微衛(wèi)星總數(shù)/序列總數(shù)×100%;微衛(wèi)星豐度(個·Mb-1)=微衛(wèi)星總數(shù)/序列總長度[14]。用GenAlEx 6.5 軟件[15]計算等位基因數(shù) (Na)、有效等位基因數(shù)(Ne)、觀測雜合度 (Ho)、期望雜合度 (He)、多態(tài)信息含量 (PIC)。用Genepop 在線軟件 (https://genepop.curtin.edu.au/) 檢驗位點間的連鎖不平衡及群體的哈迪-溫伯格平衡 (Hardy-Weinberg Equilibrium,HWE),并用Bonferroni 法對顯著性閾值進行校正。
低深度高通量測序產(chǎn)生的原始數(shù)據(jù)經(jīng)質(zhì)控后共獲得57.48 Gb 有效數(shù)據(jù),堿基錯誤率為0.05%,Q20 和Q30 分別為95.56%和89.70%,表明基因組測序質(zhì)量較高 (表1)。對有效數(shù)據(jù)進行k-mer 分析(k=17),結(jié)果顯示在深度為57 時出現(xiàn)主峰值(圖1),總k-mer 為44 257 233 158,排除錯誤k-mer的誤差影響后得到修正的基因組大小為759.53 Mb,雜合率為1.41%,重復(fù)序列比例為45.92%。選擇k-mer=41 將有效讀段初步組裝至contig 和scaffold 水平,最終獲得的contig 總長度為821 637 022 bp,最大長度為84 713 bp,N50 為548 bp;scaffold 總長度為840 375 821 bp,最大長度為89 326 bp,N50 為662 bp。
表1 疣吻沙蠶基因組 survey 測序數(shù)據(jù)統(tǒng)計Table 1 Statistics of genomic survey sequencing data of T.heterochaetus
圖1 疣吻沙蠶基因組 k-mer 種類頻率分布Fig.1 Frequency distribution of k-mer species in genome of T.heterochaetus
用MISA 軟件在109 881 條組裝序列中檢測到130 216 個微衛(wèi)星位點,長度共計2 341 179 bp;微衛(wèi)星發(fā)生頻率5.04%,出現(xiàn)頻率5.97%,分布豐度為154.9 個·Mb-1。疣吻沙蠶微衛(wèi)星位點以單堿基和二堿基重復(fù)最為豐富,分別有45 582 和42 298 條,各占35.00%和32.48%;其次是三堿基重復(fù) (18 782條),占14.42%;六堿基數(shù)量最少,僅占2.44%(圖2)。微衛(wèi)星序列的重復(fù)數(shù)范圍為4~56 拷貝,主要集中在4~18 拷貝,重復(fù)19 次及以上的有3 703 條,僅占3.50%;單堿基重復(fù)以12~16 次最常見 (40 706條,89.30%),二堿基重復(fù)集中在6~18 次 (42 035條,99.38%),三堿基重復(fù)以5~12 次為主 (18 526條,98.64%),四堿基重復(fù)以5~10 次為主 (12 173條,98.91%),而五堿基和六堿基重復(fù)主要為4~8 次 (共11 176 條,99.37%) (圖2—圖3)。
圖2 疣吻沙蠶基因組 6 種類型微衛(wèi)星的數(shù)量與比例Fig.2 Number and proportion of six motif types of microsatellite loci in genome of T.heterochaetus
圖3 疣吻沙蠶基因組微衛(wèi)星重復(fù)數(shù)分布特征Fig.3 Distribution pattern of microsatellite repeat number in genome of T.heterochaetus
疣吻沙蠶基因組微衛(wèi)星共包含320 種重復(fù)基序類型:單堿基2 種、二堿基4 種、三堿基10 種、四堿基31 種、五堿基91 種、六堿基182 種。單堿基重復(fù)基序拷貝數(shù)集中在12~15 次,以C/G 為主,占比58.02%;二堿基重復(fù)拷貝數(shù)多為6~10 次,以AT/AT 最為豐富,占比62.38%,其次是AC/GT(27.37%)、AG/CT (10.22%),而CG/CG 數(shù)量稀少(0.02%);在三堿基重復(fù)中,拷貝數(shù)多為5~12 次,占比最高的是AAT/ATT,有6253 條 (33.29%),其次是ATC/GAT (32.15%),而CCG/CGG 數(shù)量最少,僅占0.06%;四堿基拷貝數(shù)多為5~8 次,優(yōu)勢重復(fù)基序是AAAT/ATTT,有3567 條 (28.98%),其次是AATC/GATT (14.08%)、ACTC/GAGT(9.60%)、ATCC/GGAT (7.38%);五堿基、六堿基拷貝數(shù)集中在4~7 次,優(yōu)勢重復(fù)基序分別是AAAAT/ATTTT (17.07%) 和AACCCT/AGGGTT (11.73%)(圖4)。
根據(jù)重復(fù)序列長度可將微衛(wèi)星位點分為兩類:一類是長度達20 bp 及以上的高度多態(tài)I 型,另一類則是長度介于12~19 bp 的中度多態(tài)II 型[16]。疣吻沙蠶基因組微衛(wèi)星位點的長度分布區(qū)間為12~336 bp,I 型微衛(wèi)星位點有43 240 條,占33.21%,剩余的II 型位點占66.79%;絕大部分I 型微衛(wèi)星位點的長度為20~39 bp,超過50 bp 的位點僅占0.51% (圖5-a)。進一步分析發(fā)現(xiàn),在I 型微衛(wèi)星位點中,二、三、四、五堿基是最主要的重復(fù)類型,占85.92%,在后續(xù)多態(tài)標記的篩選中有較高的開發(fā)價值(圖5-b)。
圖5 疣吻沙蠶基因組微衛(wèi)星長度分布特征注:a.不同長度區(qū)間微衛(wèi)星數(shù)量及比例;b.不同類型微衛(wèi)星長度分布特征。Fig.5 Distribution pattern of length of microsatellite loci genome of T.heterochaetusNote: a.Number and percentage of microsatellite loci at different length intervals; b.Length distribution of the six motif types of microsatellite loci.
使用Primer 5 成功對37 370 個微衛(wèi)星位點設(shè)計了引物。隨機選取50 個位點合成引物并進行PCR 驗證,共獲得41 對 (82%) 有效擴增引物,表明MISA 軟件鑒定的微衛(wèi)星位點具有較高有效性。多態(tài)性篩選結(jié)果顯示,15 個 (30%) 微衛(wèi)星位點的引物表現(xiàn)出穩(wěn)定且可重復(fù)的多態(tài)性 (表2,圖6)。在30 尾疣吻沙蠶中,15 對引物共檢測到87 個等位基因,平均等位基因數(shù)5.800,等位基因頻率為0.060~0.400,其中ThGM021 位點的等位基因數(shù)最少 (Na=2.000),ThGM004 位點的等位基因數(shù)最多(Na=12.000)。Ne為1.164~6.713,平均值為3.328;Ho為0.050~0.879,平均值為0.487;He為0.141~0.789,平均值為0.561;PIC 為0.136~0.776,平均值為0.511 (表3)。在15 個位點中,8 個屬高度多態(tài)性位點 (PIC>0.5),5 個屬中度多態(tài)性位點(0.25<PIC≤0.5),2 個屬低度多態(tài)性位點 (PIC≤0.25),表明該群體的遺傳多樣性較豐富。經(jīng)Bonferroni 校正后,有3 個位點 (ThGM006、ThGM011、ThGM040) 偏離HWE,其中ThGM040 屬于高度多態(tài)性位點。各位點間無連鎖不平衡現(xiàn)象。
表2 疣吻沙蠶 15 對多態(tài)微衛(wèi)星引物信息Table 2 Information of 15 polymorphic microsatellite loci in genome of T.heterochaetus
表3 15 個多態(tài)微衛(wèi)星位點在疣吻沙蠶群體中的遺傳特征Table 3 Genetic characteristics of 15 polymorphic microsatellite loci in a T.heterochaetus population
圖6 部分多態(tài)微衛(wèi)星標記的毛細管電泳分型結(jié)果Fig.6 A set of polymorphic microsatellite loci visualized by high-resolution capillary electrophoresis
不同物種間基因組的大小和復(fù)雜程度有明顯差異,會直接影響到測序策略的選擇及基因組的組裝效果。因此,進行全基因組測序前須先評估物種基因組的基本特征。疣吻沙蠶基因組survey 測序及k-mer 分析估計其基因組為759.53 Mb,遠大于水蛭 (Helobdellarobusta)[17]和寬體金線蛭 (WhitmaniaPigra)[18]等所有已報道的蛭綱物種,也較多毛綱的海蠕蟲 (Capitellateleta)[17]、歐文蟲 (Owenia fusiformis)[19]、巨型管蟲 (Riftiapachyptila)[20]、Lamellibrachialuymesi[21]的大;與寡毛綱通俗腔蚓(Metaphirevulgaris)[22]及多毛綱搓稚蟲 (Streblospio benedicti)[23]的大小 (約0.7 Gb) 相當;但明顯小于安德愛勝蚓 (Eiseniaandrei)[24]、赤子愛勝蚓 (E.fetida)[25],以及多毛綱的旋鰓蟲(Spirobranchuslamarcki)[26]和深海管蟲 (Paraescarpiaechinospica)[27](1.0~1.3 Gb)。物種間基因組大小的差異性在一定程度上與重復(fù)序列比例的高低有關(guān)。疣吻沙蠶基因組的重復(fù)序列比例 (45.92%) 低于旋鰓蟲[26]和深海管蟲[27],但顯著高于海蠕蟲[17]、巨型管蟲[20],以及所有已公布的蛭綱動物 (重復(fù)比例均低于34%)[15-18];其基因組雜合率 (1.41%) 與安德愛勝蚓[24]和赤子愛勝蚓[25]相當,遠遠高于L.luymesi(0.60%)[21]、搓稚蟲 (0.29%)[23]與深海管蟲 (0.63%)[27],是目前已報道的雜合率最高的多毛類。此外,組裝的contig和scalffold 總長分別為821 637 022 和840 375 821 bp,N50 分別為548 和662 bp,提示過高的雜合率會造成組裝序列長度大于預(yù)估基因組大小,并導致顯著偏低的N50 指標[28]。綜上所述,疣吻沙蠶基因組屬復(fù)雜基因組類型,繪制染色體級別高質(zhì)量全基因組圖譜應(yīng)優(yōu)先考慮“PacBio+Illumina+Hi-C”策略。該研究數(shù)據(jù)為后續(xù)全基因組測序與組裝提供了基礎(chǔ)資料。
水生動物基因組中單堿基重復(fù)微衛(wèi)星占優(yōu)勢的現(xiàn)象較少,已報道的有中華絨螯蟹 (Eriocheirsinensis)[29]、鯉 (Cyprinuscarpio)[30]、脊尾白蝦 (Exopalaemoncarinicauda)[31]和胡鯰 (Clariasbatrachus)[32]。在疣吻沙蠶基因組中檢測到 130 216 個微衛(wèi)星位點,位點數(shù)量隨重復(fù)基序堿基數(shù)的增加而迅速減少,單堿基重復(fù)微衛(wèi)星最豐富 (35.00%),其次為二堿基重復(fù) (32.48%)、三堿基重復(fù) (14.42%),這與以二堿基或三堿基為優(yōu)勢類型的魚[9,33-35]、蝦[36-37]、貝類[38]明顯不同,特別是與親緣關(guān)系較近的蛭類、寡毛類相比也表現(xiàn)出較大差異。寬體金線蛭[39]、天錫杜拉蚓 (Drawidagisti)[40]基因組中三堿基重復(fù)占絕對優(yōu)勢,主要基序類型分別是AAT、ATA 和ATT、AAT。王斌等[41]對4 種蛭類的轉(zhuǎn)錄組數(shù)據(jù)進行分析,同樣發(fā)現(xiàn)三堿基重復(fù)微衛(wèi)星占優(yōu)勢,在寬體金線蛭中甚至高達68.00%。作為最特殊的微衛(wèi)星重復(fù)類型,三堿基重復(fù)微衛(wèi)星可形成復(fù)雜的環(huán)-折疊構(gòu)型來穩(wěn)定DNA 結(jié)構(gòu),從而更有利于轉(zhuǎn)錄過程中的解旋和蛋白質(zhì)識別[33]。此外,疣吻沙蠶轉(zhuǎn)錄組中二堿基AT/TA 重復(fù)基序頻率 (32.19%) 最高,單堿基A/T 重復(fù)類型(21.17%)其次,之后是三堿基AGC/GCT (29.06%) 基序 (未發(fā)表數(shù)據(jù)),表明微衛(wèi)星類型特征在轉(zhuǎn)錄組和基因組水平上存在差異,類似的差異性在圓鰭魚 (Cyclopteruslumpus)[42]、凡納濱對蝦[36,43]、寬體金線蛭[39,41]中也被證實。不同物種表現(xiàn)出不同的微衛(wèi)星優(yōu)勢類型分布規(guī)律,可能與其進化水平有關(guān)。
疣吻沙蠶基因組微衛(wèi)星核心區(qū)集中在4~18 拷貝,隨著重復(fù)次數(shù)的增加,微衛(wèi)星數(shù)量呈顯著降低趨勢,這可能與重復(fù)單元長度的不斷增加使得微衛(wèi)星穩(wěn)定性降低或基序高頻次重復(fù)導致更高的突變率有關(guān)[44]。進一步分析發(fā)現(xiàn),二堿基至六堿基微衛(wèi)星重復(fù)單元中A/T 含量顯著高于G/C 含量,即微衛(wèi)星序列表現(xiàn)出明顯的A/T 堿基優(yōu)勢,這與許多水生動物如脊尾白蝦[31]、凡納濱對蝦[36]、蝦夷扇貝 (Mizuhopectenyessoensis)[38]、寬體金線蛭[39]及舊金山灣鹵蟲 (Artemiafranciscana)[45]中的研究結(jié)果一致。早期觀點認為,微衛(wèi)星富含A/T 的原因可能是由于CpG 甲基化后的C 易脫氨基轉(zhuǎn)變?yōu)門,導致G/C 比例不斷縮小,而突變的A/T 堿基類型相應(yīng)增多[33];后來卻發(fā)現(xiàn)這也可能與微衛(wèi)星位點的產(chǎn)生方式,即與DNA 的復(fù)制滑動存在一定關(guān)系[29,46]。微衛(wèi)星富含A/T 的原因可能是A/T 含量高則Tm值降低,其序列容易發(fā)生DNA 解鏈,并通過復(fù)制滑動機制和重組機制產(chǎn)生高A/T 含量的重復(fù)類型的概率更高[38]。
微衛(wèi)星是重要的分子遺傳學研究工具,開發(fā)多態(tài)標記是其廣泛應(yīng)用的關(guān)鍵。與傳統(tǒng)方法相比,基于高通量測序技術(shù)開發(fā)微衛(wèi)星標記更具優(yōu)勢,產(chǎn)生的基因組或轉(zhuǎn)錄組數(shù)據(jù)是標記開發(fā)的重要資源。然而與轉(zhuǎn)錄組微衛(wèi)星相比,基因組微衛(wèi)星的多態(tài)性往往更高且分布更廣泛,可獲得更優(yōu)的基因組覆蓋率[42]。Temnykh 等[16]認為長度≥20 bp 的微衛(wèi)星位點多態(tài)性較高,長度10~20 bp 的為中等多態(tài)性,小于10 bp 的多態(tài)性低。在疣吻沙蠶基因組中共篩選到43 240 條序列長度≥20 bp 的I 型微衛(wèi)星位點,占比超過33%,遠高于其轉(zhuǎn)錄組序列中20%的I 型位點比例 (未發(fā)表數(shù)據(jù))。挑選50 個微衛(wèi)星位點進行有效性及多態(tài)性驗證,有41 個 (82%)位點的引物可擴增出特異性條帶,其中15 個 (30%)表現(xiàn)出穩(wěn)定且可重復(fù)的多態(tài)性。疣吻沙蠶基因組多態(tài)微衛(wèi)星標記的篩選成功率與卵形鯧鲹[9]、凡納濱對蝦[36]、寬體金線蛭[39]中的結(jié)果相當。由此可見,疣吻沙蠶微衛(wèi)星標記篩選成功率較高,獲得的微衛(wèi)星位點具有良好的開發(fā)潛力,是豐富且可靠的標記資源。
用微衛(wèi)星標記開展群體遺傳分析時,一般認為有效等位基因數(shù)越接近觀測等位基因數(shù),群體等位基因分布就越均勻;然而在實際分析中,通常會將全部條帶視為有效等位基因,無效等位基因過剩便會造成等位基因分布不均[47]。從疣吻沙蠶基因組篩選的15 個多態(tài)微衛(wèi)星位點中,僅3 個位點(ThGM021、ThGM035、ThGM041) 的等位基因數(shù)接近有效等位基因數(shù),提示大部分位的等位基因分布不均,這可能是因為驗證群體的樣本容量偏小引起了主效等位基因的缺失[9]。有研究表明,群體的最小樣本容量一般與遺傳分析選用的參數(shù)有關(guān)。利用He、PIC 以及香農(nóng)指數(shù)等評估遺傳多樣性時,群體樣本容量達到27 便能使分析結(jié)果接近總體水平的95%;但選擇Na時,樣本容量則需達到52 以上[48]。疣吻沙蠶的群體樣本量為30,故而選擇He、PIC 可更好地評價微衛(wèi)星位點的多態(tài)性。15個位點的平均Ho(0.487)、平均He(0.561)和平均PIC (0.511)共同表明,疣吻沙蠶驗證群體具有較豐富的遺傳多樣性,這與Chen 等[5]利用COI 標記的分析結(jié)果并不完全一致,可能是因為微衛(wèi)星屬于核標記,多態(tài)性更高且受選擇性作用更小,其揭示遺傳變異的靈敏度高于線粒體標記。通常認為,PIC 越接近1,則群體雜合個體的比例越大、多態(tài)性越高:PIC<0.25 為低度多態(tài)性,0.25≤PIC<0.5 為中度多態(tài)性,PIC≥0.5 為高度多態(tài)性[47]。在15 個多態(tài)微衛(wèi)星位點中,僅2 個為低度多態(tài)性,其余13 個 (86.7%) 均為高度或中度多態(tài)性。因此,基于疣吻沙蠶基因組序列篩選的微衛(wèi)星標記多態(tài)性高且遺傳信息豐富,可為群體遺傳分析、種質(zhì)資源評價、分子育種研究提供優(yōu)質(zhì)工具。
疣吻沙蠶基因組屬于高雜合、高重復(fù)的復(fù)雜基因組,其微衛(wèi)星位點的類型豐富且具備較好的多態(tài)性潛能,可作為有效資源用于微衛(wèi)星標記的大規(guī)模開發(fā),對種質(zhì)資源評價與保護利用、種群遺傳學以及分子育種研究具有實際價值。