邰如玉 許 建 江炎亮 張瀚元 白慶利 楊世勇 徐 鵬,5 趙紫霞①
(1.上海海洋大學(xué)水產(chǎn)科學(xué)國家級實(shí)驗(yàn)教學(xué)示范中心 上海 201306;2.中國水產(chǎn)科學(xué)研究院農(nóng)業(yè)農(nóng)村部水生動(dòng)物基因組學(xué)重點(diǎn)實(shí)驗(yàn)室 漁業(yè)生物技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室 北京 100141;3.中國水產(chǎn)科學(xué)研究院黑龍江水產(chǎn)研究所 哈爾濱 150070;4.四川農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院 雅安 625014;5.廈門大學(xué)海洋與地球?qū)W院 福建省海洋生物資源開發(fā)利用協(xié)同創(chuàng)新中心 廈門 361102)
鮭鱒是鮭科(Salmonidae)多種魚類的統(tǒng)稱,是冷水魚主要養(yǎng)殖品種,在中高端水產(chǎn)品市場中占據(jù)了重要份額。我國有良好的冷水資源以及多樣化的鮭鱒養(yǎng)殖品種,除年產(chǎn)量最高的虹鱒(Oncorhynchus mykiss)外,還有銀鮭(Oncorhynchus kisutch) (又稱“銀大麻哈魚”)、山女鱒(Oncorhynchus masou masou)、美洲紅點(diǎn)鮭(Salvelinus fontinalis)(商品名“七彩鮭”)、白斑紅點(diǎn)鮭(商品名“白點(diǎn)鮭”)(Salvelinus leucomaenis)等均已形成了一定的養(yǎng)殖規(guī)模(孫大江等, 2010; 戶國等,2012)。
由于各種鮭鱒養(yǎng)殖品種對生境的要求類似,我國鮭鱒養(yǎng)殖的地域比較集中,往往同一育苗場或養(yǎng)殖場同時(shí)養(yǎng)殖多種鮭科魚類,這些養(yǎng)殖物品種主要集中于大麻哈魚屬(Oncorhynchus)和紅點(diǎn)鮭屬(Salvelinus),但除虹鱒外,其他鮭鱒養(yǎng)殖種現(xiàn)有的基因組資源和遺傳分析工具十分有限,以往的遺傳分析主要基于線粒體 DNA(Yuet al, 2010)和微衛(wèi)星標(biāo)記(Smallet al,2010; Naishet al, 2013)來開展,通常標(biāo)記數(shù)量較少,基因組覆蓋度較低,并且針對不同的物種需要開發(fā)不同的標(biāo)記,通用性較低。
本研究基于虹鱒 57K單核苷酸多態(tài)性(Single nucleotide polymorphism, SNP)芯片(Paltiet al, 2015),致力于開發(fā)常見鮭鱒養(yǎng)殖種間通用的分子標(biāo)記,形成小型 SNP芯片,從而利用同一套分子標(biāo)記和檢測方法,實(shí)現(xiàn)對多個(gè)鮭鱒養(yǎng)殖物種的遺傳分析,將有利于顯著降低遺傳檢測成本、簡化技術(shù)人員培訓(xùn)流程、提升科學(xué)養(yǎng)殖管理效率。
山女鱒、美洲紅點(diǎn)鮭、白斑紅點(diǎn)鮭采自中國水產(chǎn)科學(xué)研究院黑龍江水產(chǎn)研究所渤海冷水性魚試驗(yàn)站,銀鮭采自四川省都江堰市三文魚養(yǎng)殖基地和中國水產(chǎn)科學(xué)研究院房山試驗(yàn)基地。每個(gè)群體或家系各采樣20尾,剪取尾鰭貼于干燥的濾紙上,56℃烘干6 h,常溫保存。
使用海洋動(dòng)物基因組 DNA提取試劑盒(天根生化)提取基因組 DNA,1%瓊脂糖凝膠電泳檢測 DNA完整性,NanoDrop 8000超微量紫外可見光分光光度計(jì)(Thermo Fisher)檢測DNA純度和濃度。
對山女鱒、美洲紅點(diǎn)鮭、白斑紅點(diǎn)鮭、銀鮭4個(gè)群體進(jìn)行線粒體控制區(qū)測序,檢測個(gè)體單倍型,每個(gè)群體選取DNA質(zhì)量高、具有不同單倍型的8個(gè)樣本用于57K虹鱒SNP芯片(Affymetrix)分型,分別記為OK1~8(銀鮭),OM1~8(山女鱒),SF1~8(美洲紅點(diǎn)鮭),SL1~8(白斑紅點(diǎn)鮭)。分型實(shí)驗(yàn)由紐勤生物科技(上海)有限公司完成,使用 SNPolisher軟件(Affymetrix)讀取分型數(shù)據(jù)。使用PLINK 1.09(http://pngu.mgh.harvard.edu/purcell/plink/)(Purcellet al, 2007)進(jìn)行分型結(jié)果過濾、統(tǒng)計(jì)和連鎖不平衡(Linkage disequilibrium, LD)檢驗(yàn),個(gè)體質(zhì)控標(biāo)準(zhǔn)設(shè)為Call rate (CR)>80%,位點(diǎn)質(zhì)控標(biāo)準(zhǔn)設(shè)為CR>97%。
96個(gè)SNP位點(diǎn)由Fluidigm公司設(shè)計(jì)合成探針,使用 EP1平臺及 96.96動(dòng)態(tài)芯片(Fluidigm)開展分型檢測。檢測樣本共計(jì)96尾,包括進(jìn)行過高通量SNP芯片檢測的樣本32尾,以及新增銀鮭樣本64尾,其中,新增樣本包含銀鮭養(yǎng)殖家系6個(gè),每個(gè)家系樣本各8尾(記為OK9~56),以及養(yǎng)殖家系候選親本16尾(記為OK57~72),其中,部分家系互為半同胞,其真實(shí)親本為5尾雌魚和3尾雄魚。通過Fluidigm SNP genotyping analysis software 4.1軟件讀取分型結(jié)果,質(zhì)控閾值設(shè)為85,對缺失和低質(zhì)量分型數(shù)據(jù)進(jìn)行人工復(fù)檢。使用Cervus 3.0.7進(jìn)行遺傳多態(tài)性統(tǒng)計(jì),并對48尾銀鮭樣本(OK9~56)進(jìn)行親權(quán)鑒定(Kalinowskiet al,2007)。使用Structure 2.3.4 (http://pritch.bsd.uchicago.edu/structure.html),對 32尾鮭鱒群體樣本(OK1~8、OM1~8、SF1~8和 SL1~8)進(jìn)行群體遺傳結(jié)構(gòu)分析(Falushet al, 2003; Hubiszet al, 2009)。
使用虹鱒57K SNP芯片,對國內(nèi)4個(gè)代表性鮭鱒養(yǎng)殖群體樣本進(jìn)行分型檢測,包括大麻哈魚屬的山女鱒、銀鮭,以及紅點(diǎn)鮭屬的美洲紅點(diǎn)鮭和白斑紅點(diǎn)鮭,每個(gè)群體選取8尾個(gè)體。該芯片共包含虹鱒多態(tài)性位點(diǎn)57,501個(gè),32尾個(gè)體全部通過CR>80%的質(zhì)控標(biāo)準(zhǔn),即每尾個(gè)體分型成功的位點(diǎn)數(shù)均大于80%。位點(diǎn)質(zhì)控標(biāo)準(zhǔn)設(shè)為CR>97%,即僅統(tǒng)計(jì)基因型無缺失的位點(diǎn)。各群體多態(tài)性位點(diǎn)統(tǒng)計(jì)結(jié)果如表1所示,其中,群體間分型位點(diǎn)比例波動(dòng)較小,在 65.96%~74.19%范圍內(nèi),但多態(tài)性位點(diǎn)比例差異很大,銀鮭群體內(nèi)僅有9.01%的多態(tài)性位點(diǎn),而美洲紅點(diǎn)鮭群體內(nèi)多態(tài)性位點(diǎn)比例達(dá)到45.99%。
圖1以韋恩圖的形式展示了4個(gè)鮭鱒群體間多態(tài)性 SNP位點(diǎn)的分布,包括群體間共享的和群體特異性的多態(tài)位點(diǎn),其中,4個(gè)群體共享的多態(tài)性位點(diǎn)有89個(gè)。為了避免基因組內(nèi)緊密連鎖的位點(diǎn)同時(shí)入選,在32尾鮭鱒個(gè)體中對共享多態(tài)性位點(diǎn)進(jìn)行LD檢驗(yàn),剔除R2值高于0.3的位點(diǎn)4個(gè)。根據(jù)共享多態(tài)性位點(diǎn)側(cè)翼序列設(shè)計(jì)Fluidigm分型探針,進(jìn)一步剔除探針設(shè)計(jì)失敗位點(diǎn)6個(gè),獲得用于構(gòu)建鮭鱒通用SNP芯片的共享多態(tài)性位點(diǎn)79個(gè)。由于位點(diǎn)數(shù)目不足96個(gè),從山女鱒、美洲紅點(diǎn)鮭和白斑紅點(diǎn)鮭3個(gè)群體共享的448個(gè)多態(tài)性位點(diǎn)中選取補(bǔ)充位點(diǎn) 17個(gè),選擇標(biāo)準(zhǔn)為:經(jīng)LD檢驗(yàn),與已入選位點(diǎn)間R2值低于0.3,并能夠成功設(shè)計(jì)分型探針。96個(gè)入選位點(diǎn)的側(cè)翼序列及基因組定位信息見表1。最終入選的芯片位點(diǎn)中,編號OS-79及以前的位點(diǎn),為4群體共享多態(tài)位點(diǎn),編號OS-80及以后的位點(diǎn),為3群體共享多態(tài)位點(diǎn)。
表1 鮭鱒代表性群體多態(tài)性SNP位點(diǎn)數(shù)目和比例Tab.1 Number and percentage of polymorphic SNPs in representative Salmonid populations
圖1 國內(nèi)4個(gè)代表性鮭鱒養(yǎng)殖群體的多態(tài)性SNP位點(diǎn)韋恩圖Fig.1 Venn diagram for distribution of shared polymorphic SNPs among 4 representative salmonid populations in China
使用構(gòu)建的鮭鱒通用型低通量SNP芯片對96尾鮭鱒養(yǎng)殖個(gè)體進(jìn)行分型檢測,在總計(jì)9216個(gè)分型反應(yīng)中,分型成功率為97.48%,檢測樣本中,32尾個(gè)體與高通量芯片檢測樣本相同,其檢測結(jié)果一致性為96.55%。各位點(diǎn)遺傳多態(tài)性統(tǒng)計(jì)結(jié)果見表2。
基于鮭鱒通用型低通量 SNP芯片分型數(shù)據(jù),應(yīng)用Cervus 3.0.7軟件對來自6個(gè)家系的48尾銀鮭個(gè)體進(jìn)行親權(quán)鑒定,將同批次檢測的其他48尾鮭鱒樣本均作為待分析親本群體,結(jié)果表明,無論是單親本鑒定還是雙親本鑒定,基于96個(gè)位點(diǎn)分型數(shù)據(jù)的親權(quán)鑒定結(jié)果均與真實(shí)系譜相符。
根據(jù)表 2中列出的各位點(diǎn)第一親本非排除率(Non-exclusion probability for first parent, NE-1P)和雙親非排除率(Non-exclusion probability for parent pair,NE-PP),計(jì)算得該芯片用于單親本親權(quán)鑒定的NE-1P值為4.120×10–4,用于雙親本親權(quán)鑒定的NE-PP值為6.219×10–12。圖 2展示了該芯片用于 48尾銀鮭子代親權(quán)鑒定的對數(shù)優(yōu)勢比(Logarithm of odds, LOD)值,由圖2可見,所有子代樣本的檢測結(jié)果都落在可靠象限內(nèi)。
基于鮭鱒通用型低通量 SNP芯片分型數(shù)據(jù),應(yīng)用 Structure軟件對來自國內(nèi) 4個(gè)代表性鮭鱒養(yǎng)殖群體的32尾個(gè)體開展遺傳結(jié)構(gòu)分析。圖3展示了假定祖源群體數(shù)(K)分別為2和4時(shí)的Structure遺傳結(jié)構(gòu)圖,圖中不同顏色代表不同的祖源成分。
表2 鮭鱒通用型低通量SNP芯片位點(diǎn)遺傳多態(tài)性統(tǒng)計(jì)Tab.2 Genetic polymorphism of markers in the salmonid 96 SNP array
K=2的假設(shè)下,所有樣本以屬為分類階元進(jìn)行聚類,而K=4的假設(shè)下,樣本以種為分類階元進(jìn)行聚類。每尾樣本中占主導(dǎo)地位的遺傳組分與個(gè)體所屬的分類階元相符,同時(shí)包含少量其他遺傳組分,2組分析結(jié)果都顯示,銀鮭樣本 OK2、OK7,山女鱒樣本OM1、OM7,美洲紅點(diǎn)鮭樣本SF8、白斑紅點(diǎn)鮭樣本SL2、SL6為非主導(dǎo)遺傳組分占比較高的個(gè)體。
各種鮭科魚類物種間親緣關(guān)系較近,基因組序列相似性較高,因而具有大量共享的分子標(biāo)記。梁利群等(2004)從50個(gè)虹鱒微衛(wèi)星標(biāo)記中篩選出12個(gè)在黑龍江烏蘇里白鮭(Coregonus ussuriensis)自然群體中具有多態(tài)性的標(biāo)記用于遺傳多樣性分析。魯翠云等(2016)從150個(gè)虹鱒微衛(wèi)星標(biāo)記中篩選出48個(gè)在白斑紅點(diǎn)鮭養(yǎng)殖群體中具有多態(tài)性的標(biāo)記,并開展了群體遺傳結(jié)構(gòu)分析。目前,虹鱒的全基因組測序已經(jīng)完成,并開發(fā)了多種通量的SNP分型芯片等遺傳分析工具,建立了基于基因組信息的現(xiàn)代化育種、育苗體系。本研究基于這些新開發(fā)的虹鱒基因組信息資源,開展了共享標(biāo)記篩查,使用虹鱒高通量 SNP芯片,在國內(nèi)代表性鮭鱒養(yǎng)殖群體中對 57,501個(gè)標(biāo)記進(jìn)行了分型檢測。
圖3 國內(nèi)4個(gè)代表性鮭鱒養(yǎng)殖群體遺傳結(jié)構(gòu)分析Fig.3 Structure analysis for 4 representative salmonid populations in China
結(jié)果顯示,在跨物種檢測中,標(biāo)記分型成功比例和多態(tài)比例都明顯低于虹鱒樣本。在相同的質(zhì)控標(biāo)準(zhǔn)(CR > 97%)下,該芯片在不同虹鱒群體中的分型位點(diǎn)數(shù)為49,299~49,468個(gè)(Paltiet al, 2015),而在其他鮭鱒養(yǎng)殖物種中的分型位點(diǎn)數(shù)僅為37,926~42,658個(gè);各虹鱒群體中多態(tài)性位點(diǎn)比例在 21.5%~92.8%范圍內(nèi)波動(dòng)(Paltiet al, 2015),而在其他鮭鱒養(yǎng)殖群體中的多態(tài)性位點(diǎn)比例僅為9.01%~45.99%。但由于SNP標(biāo)記的總量巨大,基因組覆蓋度高,在基因組編碼區(qū)和非編碼區(qū)都有大量分布,這些物種間共享的 SNP仍能提供較為豐富的遺傳多態(tài)信息,鯉高通量 SNP芯片也曾被成功應(yīng)用于鯽(Carassius auratus)、草魚(Ctenopharyngodon idellus)等8種近緣魚類遺傳分析中(Xuet al, 2014)。由表1可見,跨物種分型成功位點(diǎn)數(shù)目與目標(biāo)物種間的親緣關(guān)系相關(guān),山女鱒、銀鮭與虹鱒同屬于大麻哈魚屬,親緣關(guān)系較近,因此,分型位點(diǎn)數(shù)略高于美洲紅點(diǎn)鮭和白斑紅點(diǎn)鮭;而多態(tài)性位點(diǎn)數(shù)目主要取決于群體本身的遺傳多樣性,雖然銀鮭與虹鱒親緣關(guān)系更近,但其多態(tài)位點(diǎn)比例遠(yuǎn)低于與虹鱒親緣關(guān)系較遠(yuǎn)的美洲紅點(diǎn)鮭,表明采樣的銀鮭群體遺傳多樣性較低,亟待改善。
Fluigidm低通量分型平臺有48.48和96.96兩種芯片,分別適用于48和 96個(gè)位點(diǎn)的同時(shí)分型。Xu等(2017)使用48.48芯片構(gòu)建了鯉(Cyprinus carpio)低密度 SNP芯片,該芯片在用于家系親權(quán)鑒定時(shí)的準(zhǔn)確率為94%。Liu等(2016)構(gòu)建虹鱒低密度SNP芯片則使用了96.96芯片,結(jié)果表明,當(dāng)使用其中68個(gè)位點(diǎn)開展家系親權(quán)鑒定時(shí),結(jié)果準(zhǔn)確率為 100%,僅使用48個(gè)位點(diǎn)時(shí),準(zhǔn)確率為 99.2%,當(dāng)位點(diǎn)數(shù)下降到 36個(gè)時(shí),準(zhǔn)確率降至 92.5%。Harlizius等(2011)就 SNP芯片在杜洛克豬商品群體親權(quán)鑒定中的應(yīng)用開展過更為細(xì)化的統(tǒng)計(jì)分析,當(dāng)候選親本中僅包含真實(shí)親本(n=66)時(shí),60個(gè)SNP位點(diǎn)即可實(shí)現(xiàn)100%準(zhǔn)確的親權(quán)鑒定,而當(dāng)候選親本中混入了大量干擾個(gè)體(n=304)時(shí),則需要80個(gè)SNP位點(diǎn)來實(shí)現(xiàn)100%準(zhǔn)確的親權(quán)鑒定。鑒定的準(zhǔn)確性受到子代樣本數(shù)目、候選親本數(shù)目,以及群體遺傳結(jié)構(gòu)、分型位點(diǎn)在群體中的多態(tài)性等多種因素影響,而本研究試圖構(gòu)建多物種通用的 SNP芯片,還需要考慮部分位點(diǎn)可能在待測物種或群體中分型失敗的可能性,因此,采用96.96芯片,通過檢測略高于必要數(shù)目的 SNP位點(diǎn),來保障分析結(jié)果的可靠性。
本研究經(jīng)過高通量SNP芯片分型篩查,獲得4個(gè)鮭鱒養(yǎng)殖群體共享的多態(tài)性標(biāo)記共89個(gè),涵蓋了大麻哈魚屬和紅點(diǎn)鮭屬各2個(gè)物種,推測這些位點(diǎn)在鮭科常見養(yǎng)殖物種中都具有較高的通用性,可以作為鮭鱒通用型SNP芯片構(gòu)建的候選位點(diǎn)??紤]到共享位點(diǎn)篩查所用的銀鮭群體遺傳多樣性較低,可能導(dǎo)致多態(tài)性位點(diǎn)發(fā)掘不充分,從其他3個(gè)群體共享的多態(tài)性位點(diǎn)中選取了補(bǔ)充位點(diǎn),補(bǔ)足96個(gè)位點(diǎn)用于芯片構(gòu)建。
為了驗(yàn)證所構(gòu)建的低通量 SNP芯片分型結(jié)果準(zhǔn)確性,使用該芯片對高通量SNP芯片檢測過的32尾樣本進(jìn)行了重復(fù)檢測,結(jié)果一致性為 96.55%,不一致的位點(diǎn)主要表現(xiàn)為分型失敗,結(jié)果缺失。由此可見,F(xiàn)luidigm低通量 SNP芯片在鮭鱒樣本檢測中的分型準(zhǔn)確性較高。
高通量芯片分型結(jié)果顯示,OK1~8樣本所屬的銀鮭群體遺傳多樣性不足,因此,在低通量芯片樣本選擇時(shí),從另一個(gè)銀鮭養(yǎng)殖群體中采集了親本及子代樣本共計(jì) 64尾,即 OK9~72,以驗(yàn)證該芯片在銀鮭中的適用性。分型結(jié)果顯示,初篩銀鮭群體中不具有多態(tài)性的17個(gè)位點(diǎn)中,有12個(gè)在新的銀鮭樣本中表現(xiàn)出多態(tài)性,證明芯片的位點(diǎn)選擇是成功的,入選位點(diǎn)在鮭科不同物種中均具有較高的多態(tài)性。
虹鱒低通量芯片的研究結(jié)果顯示(Liuet al,2016),在用于親權(quán)鑒定時(shí),Cervus軟件的準(zhǔn)確率略高于其他同類軟件。將同批次分型的其他鮭鱒樣本均作為候選親本,應(yīng)用Cervus 3.0.7軟件開展親權(quán)鑒定,結(jié)果表明,基于該芯片分型結(jié)果能夠準(zhǔn)確重現(xiàn)復(fù)雜家系的真實(shí)系譜。親權(quán)鑒定的準(zhǔn)確性通過LOD值來反映,表示假設(shè)為真與假設(shè)為假的概率之比的 Log10對數(shù)值,當(dāng)LOD值為0時(shí),假設(shè)成立的概率為50%,當(dāng)LOD為正值時(shí),認(rèn)為假設(shè)成立,即存在親子關(guān)系。由圖2可見,多數(shù)子代個(gè)體與軟件預(yù)測的親本間配對或配組的LOD值均遠(yuǎn)大于零,特別是雙親鑒定時(shí),所有配組的LOD值均高于18以上,表明親權(quán)鑒定結(jié)果準(zhǔn)確性很高。
除系譜鑒定外,該芯片還能夠應(yīng)用于群體遺傳資源分析,如圖3中的示例,基于96個(gè)SNP位點(diǎn)的基因頻率分布,反映群體間的遺傳組分構(gòu)成和遺傳關(guān)系,篩查群體內(nèi)部具有獨(dú)特遺傳組成的離群個(gè)體。在水產(chǎn)養(yǎng)殖業(yè)中,準(zhǔn)確的系譜鑒定為科學(xué)制種和育種方案的規(guī)劃奠定了基礎(chǔ)(李東宇等, 2016),基于分子標(biāo)記的群體遺傳分析還可應(yīng)用于種質(zhì)資源評估(王軍等,2018)、增殖放流效果評估(司飛等, 2017)等多個(gè)領(lǐng)域,因此,本研究構(gòu)建的鮭鱒通用型低密度 SNP具有較為廣泛的應(yīng)用前景,能夠?yàn)轷q鱒制種、育種和引種等科學(xué)決策提供基因組信息參考。