趙紫霞 許 建 吳碧銀, 曹頂臣 白慶利 徐 鵬 馬卓君
(1. 中國水產(chǎn)科學(xué)研究院, 北京 100141; 2. 上海海洋大學(xué)水產(chǎn)科學(xué)國家級實(shí)驗(yàn)教學(xué)示范中心, 上海 201306; 3. 中國水產(chǎn)科學(xué)研究院黑龍江水產(chǎn)研究所, 哈爾濱 150070; 4. 廈門大學(xué)海洋與地球?qū)W院, 福建省海洋生物遺傳育種重點(diǎn)實(shí)驗(yàn)室, 廈門 361102)
作為漁業(yè)資源養(yǎng)護(hù)的有效措施之一, 廣泛實(shí)施的增殖放流活動(dòng)在保障漁業(yè)可持續(xù)發(fā)展、改善水域生態(tài)環(huán)境方面取得了積極成效[1—3], 而放流個(gè)體的準(zhǔn)確識(shí)別是增殖放流效果評估的重要技術(shù)環(huán)節(jié)[4]。在早期增殖放流操作中, 多使用掛牌和剪鰭等物理標(biāo)記法, 或者注射化學(xué)染料和熒光染料等化學(xué)標(biāo)記法來標(biāo)記識(shí)別放流個(gè)體, 需在放流前對苗種個(gè)體進(jìn)行操作, 造成一定的物理損傷, 放流后也可能存在標(biāo)記脫落、鰭條復(fù)生和染料褪色等風(fēng)險(xiǎn)導(dǎo)致無法識(shí)別。
隨著核酸檢測技術(shù)的飛速發(fā)展和基因組序列資源的大量發(fā)掘, DNA分子標(biāo)記成為具備大規(guī)模應(yīng)用可能的放流個(gè)體識(shí)別技術(shù)[5,6], 無須標(biāo)記或檢測待放流苗種, 而僅需檢測放流苗種親本的遺傳信息并構(gòu)建數(shù)據(jù)庫, 通過放流后野外捕撈個(gè)體的親子鑒定, 即可識(shí)別其中的放流個(gè)體并開展系統(tǒng)評估, 制定科學(xué)的增殖放流方案。此外, 捕撈個(gè)體的分子標(biāo)記檢測信息還可以應(yīng)用于群體遺傳學(xué)分析, 以監(jiān)測野外種群遺傳結(jié)構(gòu)及其年際變化[7]。
微流控(Microfluidics)是在微米尺度空間中對10–9至10–18L體積的微量流體進(jìn)行精確操控處理的技術(shù)系統(tǒng)[8], 可將生物、化學(xué)等分析實(shí)驗(yàn)中的樣品制備、反應(yīng)、分離和檢測等基本操作單元集成到同一塊芯片上進(jìn)行, 又稱為“芯片實(shí)驗(yàn)室”(Lab-on-achip)。核酸檢測是微流控芯片的典型應(yīng)用領(lǐng)域之一[9], 包括以數(shù)字聚合酶鏈?zhǔn)椒磻?yīng)(digital Polymerase Chain Reaction, dPCR)為代表的核酸絕對定量分析, 以及不同通量的分子標(biāo)記分型檢測等。微流控芯片具有集成化、自動(dòng)化和微型化的特點(diǎn), 用于分子標(biāo)記分型時(shí), 能夠大幅縮減手動(dòng)加樣次數(shù)和人工判讀環(huán)節(jié), 具有快速、高效、避免人為失誤和交叉污染的優(yōu)點(diǎn), 在處理大規(guī)模樣本時(shí)還具有低成本優(yōu)勢。
本研究擬針對增殖放流個(gè)體識(shí)別的應(yīng)用場景,開發(fā)基于微流控芯片的單核苷酸多態(tài)性(Single Nucleotide Polymorphism, SNP)標(biāo)記分型系統(tǒng), 以中國土著鮭科魚類細(xì)鱗鮭(Brachymystax lenok)等樣本為例, 測試其用于親權(quán)鑒定和群體遺傳分析的可靠性。
細(xì)鱗鮭、哲羅鮭(Hucho taimen)、山女鱒(Oncorhynchus masou masou)和美洲紅點(diǎn)鮭(Salvelinus Fontinalis)養(yǎng)殖群體樣本采自中國水產(chǎn)科學(xué)研究院黑龍江水產(chǎn)研究所渤海冷水性魚類試驗(yàn)站、中國水產(chǎn)科學(xué)研究院房山試驗(yàn)基地、北京市懷柔區(qū)和四川省都江堰市冷水魚養(yǎng)殖場。細(xì)鱗鮭野生群體樣本采自黑龍江蘿北江段、烏蘇里江虎頭江段、鴨綠江丹東江段和額爾齊斯河布爾津河段。剪尾鰭貼至干燥濾紙上, 56℃烘干6h, 常溫暫存。
使用海洋動(dòng)物基因組DNA提取試劑盒(天根生化)提取待測個(gè)體鰭條DNA, 通過瓊脂糖凝膠電泳檢測核酸完整性, 使用Nano Drop 8000紫外可見光分光光度計(jì)(Thermo Fisher)檢測核酸濃度。
使用Axiom 57K虹鱒(Oncorhynchus mykiss)芯片(Affymetrix)檢測細(xì)鱗鮭、哲羅鮭、山女鱒和美洲紅點(diǎn)鮭個(gè)體各8尾, 分型實(shí)驗(yàn)由紐勤生物科技(上海)有限公司完成, 使用Affymetrix Power Tools和SNPolisher軟件(Affymetrix)讀取分型數(shù)據(jù)。使用PLINK 1.09軟件[10]進(jìn)行分型結(jié)果過濾、統(tǒng)計(jì)、哈迪溫伯格平衡(Hardy-Weinberg Equilibrium, HWE)和連鎖不平衡(Linkage Disequilibrium, LD)檢驗(yàn), 個(gè)體質(zhì)量控制標(biāo)準(zhǔn)和位點(diǎn)質(zhì)量控制標(biāo)準(zhǔn)均設(shè)為分型率(Call Rate, CR)>80%, 入選多態(tài)性位點(diǎn)標(biāo)準(zhǔn)設(shè)為最小等位基因頻率(Minor Allele Frequency, MAF>5%, HWE閾值設(shè)為P>0.05, LD閾值設(shè)為r2<0.2。
使用Primer Premier 6.0軟件評估設(shè)計(jì)SNP擴(kuò)增引物和分型探針, 每個(gè)SNP位點(diǎn)設(shè)計(jì)2條擴(kuò)增引物和2條分型探針, 其中特異性靶標(biāo)擴(kuò)增引物(Specific Target Amplification, STA)和位點(diǎn)特異性引物(Locus Specific Primer, LSP)分別位于SNP位點(diǎn)上下游側(cè)翼序列, 2條等位基因特異性探針(Allele Specific Probe, ASP)的3′端位于突變位點(diǎn), 分別對應(yīng)兩種基因型, 擴(kuò)增引物和分型探針由富魯達(dá)(上海)公司和生工生物工程(上海)公司合成。使用EP1平臺(tái)及SNPtype 96.96動(dòng)態(tài)芯片(Fluidigm)開展分型檢測,檢測樣本共計(jì)192個(gè), 包括有準(zhǔn)確系譜記錄的細(xì)鱗鮭家系子代96尾, 候選親本36尾, 野外捕撈個(gè)體11尾, 使用前述Axiom 57K虹鱒芯片檢測過的驗(yàn)證樣本48尾, 以及無模板對照1個(gè)。通過Fluidigm SNP genotyping analysis software 4.1軟件讀取分型結(jié)果,質(zhì)控閾值設(shè)為85, 對缺失和低質(zhì)量分型數(shù)據(jù)進(jìn)行人工復(fù)檢。使用CERVUS 3.0.7軟件[11]進(jìn)行遺傳多態(tài)性統(tǒng)計(jì), 并對96尾細(xì)鱗鮭家系子代樣本進(jìn)行親權(quán)鑒定。使用STRUCTURE 2.3.4軟件[12]進(jìn)行群體遺傳結(jié)構(gòu)分析。
使用Axiom 57K虹鱒芯片[13]檢測4個(gè)物種32尾個(gè)體樣本, 所有個(gè)體全部通過CR>80%的質(zhì)控標(biāo)準(zhǔn)。所檢測的4個(gè)物種分屬鮭科內(nèi)的4個(gè)屬, 包括哲羅鮭屬(哲羅鮭)、大麻哈魚屬(山女鱒)、紅點(diǎn)鮭屬(美洲紅點(diǎn)鮭)和細(xì)鱗鮭屬(細(xì)鱗鮭)各1種, 以種屬為基本單元篩查多態(tài)性SNP位點(diǎn), 在該芯片包含的57501個(gè)虹鱒SNP標(biāo)記中, 獲得多態(tài)性位點(diǎn)共計(jì)35346個(gè)。屬間多態(tài)性SNP位點(diǎn)的分布如圖 1所示,包括群體間共享的和群體特異性的多態(tài)位點(diǎn), 其中4個(gè)屬共享的多態(tài)性位點(diǎn)847個(gè), 用作微流控芯片備選位點(diǎn)。
圖1 鮭科魚類4個(gè)屬間共享多態(tài)性SNP位點(diǎn)韋恩圖Fig. 1 Venn diagram for distribution of shared polymorphic SNPs among 4 genera of salmonid family
圖2顯示了847個(gè)共享多態(tài)性SNP位點(diǎn)在32尾樣本群體中的MAF分布, 結(jié)果顯示有356個(gè)位點(diǎn)的MAF值等于0.5, 數(shù)目占到多態(tài)性位點(diǎn)總數(shù)的42.0%,表現(xiàn)出異于正常分布的特征。提取原始分型數(shù)據(jù)可見, 大量MAF值等于0.5的位點(diǎn)在32尾檢測個(gè)體中全部表現(xiàn)為雜合子。以同一物種群體為基本單元進(jìn)行HWE檢驗(yàn)(圖 3), 在微流控芯片備選位點(diǎn)中剔除顯著偏離HWE的位點(diǎn)397個(gè)。
圖2 共享多態(tài)性SNP位點(diǎn)在48尾鮭科魚類樣本中的最小等位基因頻率分布Fig. 2 Minor Allele Frequency (MAF) distribution of the shared polymorphic SNPs among 48 salmonid samples genotyped
圖3 共享多態(tài)性SNP位點(diǎn)在4個(gè)鮭科魚類群體中的哈迪溫伯格平衡檢驗(yàn)P值分布Fig. 3 P value distribution for Hardy-Weinberg Equilibrium(HWE) of the shared polymorphic SNPs in 4salmonid populations genotyped
在32尾樣本群體中進(jìn)行LD檢驗(yàn), 檢測基因組內(nèi)緊密連鎖的位點(diǎn), 剔除r2值高于0.2的位點(diǎn)126個(gè)。從剩余324個(gè)共享多態(tài)性位點(diǎn)中, 挑選側(cè)翼序列GC含量適中、能成功設(shè)計(jì)SNPtype分型探針的位點(diǎn)96個(gè), 用于微流控芯片構(gòu)建, 入選位點(diǎn)及其側(cè)翼序列信息見表 1。
表1 微流控芯片96個(gè)SNP位點(diǎn)的序列信息Tab. 1 Sequences of the 96 SNP markers for the microfluidic chip
續(xù)表1
續(xù)表1
續(xù)表1
使用SNPtype 96.96微流控芯片對表 1所列96個(gè)SNP位點(diǎn)完成分型檢測, 共檢測191尾鮭鱒個(gè)體樣本, 以及用滅菌去離子水代替?zhèn)€體DNA的無模板對照樣本1個(gè)。圖 4以位點(diǎn)HOBS-01為例展示分型結(jié)果, G基因型使用SNPtype-FAM探針(494/518 nm),T基因型使用SNPtype-HEX探針(535/556 nm),GG、GT 和TT三種基因型樣本各自成簇分布, 并與無模板對照樣本顯著區(qū)分。在總計(jì)18336個(gè)分型反應(yīng)中, 分型成功18084個(gè), 分型成功率為98.63%。SNPtype 96.96微流控芯片檢測樣本中48尾個(gè)體與Axiom芯片檢測樣本相同, 對應(yīng)4608個(gè)分型反應(yīng)的檢測結(jié)果一致性為97.92%, 不一致的情況主要表現(xiàn)為某一種芯片分型失敗, 結(jié)果缺失。
圖4 微流控芯片位點(diǎn)HOBS-01在191尾鮭科魚類樣本中的分型結(jié)果Fig. 4 Genotyping results for SNP HOBS-01 of the microfluidic chip in 191salmonid samples
基于SNPtype 96.96微流控芯片分型數(shù)據(jù), 使用CERVUS 3.0.7軟件對96尾細(xì)鱗鮭子代樣本和36尾候選親本進(jìn)行親權(quán)鑒定, 并與系譜記錄進(jìn)行比較,結(jié)果表明無論是單親本鑒定還是雙親本鑒定, 基于96個(gè)位點(diǎn)分型數(shù)據(jù)的親權(quán)鑒定結(jié)果均與真實(shí)系譜相符。計(jì)算各位點(diǎn)第一親本非排除率(Non-exclusion probability for first parent , NE-1P)和雙親非排除率(Non-exclusion probability for parent pair, NEPP), 將芯片上96個(gè)位點(diǎn)同時(shí)用于單親本親權(quán)鑒定的NE-1P值為4.362×10–4, 同時(shí)用于雙親本親權(quán)鑒定的NE-PP值為6.538×10–12。
個(gè)體親權(quán)鑒定的準(zhǔn)確性通過對數(shù)優(yōu)勢比(Logarithm of odds, LoD)值來反映, 表示假設(shè)為真與假設(shè)為假的概率之比的對數(shù)值, 當(dāng)LoD值為0時(shí), 假設(shè)成立的概率為50%;當(dāng)LoD為正值時(shí), 認(rèn)為假設(shè)為真的概率高于假設(shè)為假的概率, 通常設(shè)定LoD值高于3.1為閾值, 判定存在親子關(guān)系。根據(jù)NE-1P值和NE-PP值, 計(jì)算每尾子代個(gè)體與單親配對和雙親配組的LoD值(圖 5), 所有LoD值均遠(yuǎn)大于零, 所有子代樣本的檢測結(jié)果都落在可靠象限內(nèi)。
圖5 基于微流控芯片分型結(jié)果的96尾細(xì)鱗鮭家系子代樣本的親權(quán)鑒定準(zhǔn)確性分析Fig. 5 Parent assignment analysis for 96 B. lenok offsprings based on genotyping results of the microfluidic chip
基于SNPtype 96.96微流控芯片分型數(shù)據(jù), 使用STRUCTURE軟件對47尾不同來源的細(xì)鱗鮭樣本開展遺傳結(jié)構(gòu)分析, 包括采自4個(gè)水域的野外捕撈個(gè)體11尾, 以及用于增殖放流的養(yǎng)殖群體雌性親本22尾, 雄性親本14尾。圖 6展示了假定祖源群體數(shù)(K)為4的STRUCTURE遺傳結(jié)構(gòu)圖, 樣本呈現(xiàn)出按自然群體聚類的特征, 黑龍江、烏蘇里江、鴨綠江和額爾齊斯河野生群體各自對應(yīng)一種祖源成分, 而養(yǎng)殖群體遺傳組成以烏蘇里江來源為主, 混雜少量其他祖源成分。
圖6 基于微流控芯片分型結(jié)果的47尾細(xì)鱗鮭樣本遺傳結(jié)構(gòu)分析Fig. 6 STRUCTURE analysis of 47 B. lenok individuals based on genotyping results of the microfluidic chip
低密度SNP分型芯片已經(jīng)在多個(gè)水產(chǎn)養(yǎng)殖物種中設(shè)計(jì)成功[14—17], 并應(yīng)用于育種核心群體的親權(quán)鑒定、混合家系育種方案設(shè)計(jì)和遺傳參數(shù)估計(jì), 但在用于增殖放流的漁業(yè)物種中尚無報(bào)道。本課題組曾將虹鱒SNP應(yīng)用于我國常見鮭科養(yǎng)殖物種的遺傳多態(tài)性檢測[17], 成功開發(fā)低通量SNP芯片[18],可用于4個(gè)物種共享多態(tài)性SNP位點(diǎn)的分型檢測,但其檢測范圍局限于大麻哈魚屬和紅點(diǎn)鮭屬物種,未能涵蓋中國土著鮭科魚類如細(xì)鱗鮭和哲羅鮭等,而在漁業(yè)資源增殖放流實(shí)踐中, 為避免造成外來物種入侵風(fēng)險(xiǎn), 放流對象以我國土著魚類為主[3,19,20]。因此, 需針對增殖放流物種對象, 重新篩選適宜的SNP位點(diǎn)開展芯片設(shè)計(jì)。
本研究基于前一芯片應(yīng)用經(jīng)驗(yàn)開展了位點(diǎn)遴選。在前一芯片設(shè)計(jì)中, 用于共享多態(tài)性位點(diǎn)發(fā)掘的樣本群體遺傳多樣性較低, 例如銀鮭(Oncorhynchus kisutch)群體中多態(tài)性位點(diǎn)僅占9.01%, 導(dǎo)致最終獲得的可用于探針設(shè)計(jì)的共享多態(tài)位點(diǎn)數(shù)目較少(89個(gè))[18]。本研究中挑選了遺傳多樣性較為豐富的群體用于備選位點(diǎn)篩查, 所獲得的共享多態(tài)性位點(diǎn)數(shù)目明顯增加(847個(gè), 圖 1), 使得芯片位點(diǎn)可以采用更嚴(yán)謹(jǐn)?shù)娜脒x標(biāo)準(zhǔn), 并將側(cè)翼序列擴(kuò)增效率不高或不適宜設(shè)計(jì)探針的位點(diǎn)剔除, 最終使微流控芯片的分型成功率提高到98.63%。
由圖 1顯示的4個(gè)屬間共享多態(tài)性位點(diǎn)分布情況可見, 屬間共享多態(tài)性位點(diǎn)數(shù)目主要取決于采樣群體自身的遺傳多樣性, 多態(tài)性位點(diǎn)豐富的群體與其他群體間的共享多態(tài)性位點(diǎn)數(shù)目較多, 而與其種屬系統(tǒng)發(fā)育關(guān)系無關(guān), 以細(xì)鱗鮭為例, 雖然細(xì)鱗鮭屬與哲羅鮭屬的親緣關(guān)系更近, 而與大麻哈魚屬和紅點(diǎn)鮭屬親緣關(guān)系較遠(yuǎn)[21], 但被測的細(xì)鱗鮭群體與山女鱒(5541)和美洲紅點(diǎn)鮭(10836)共享的多態(tài)性位點(diǎn)數(shù)卻多于哲羅鮭(3562)。
對847個(gè)共享多態(tài)性SNP位點(diǎn)的等位基因頻率分析(圖 2)顯示, 有高達(dá)42.0%的位點(diǎn)MAF值等于0.5, 其中大部分位點(diǎn)在所有被測個(gè)體中均表現(xiàn)為雜合子, 即基因型頻率異常??紤]到鮭科魚類共同祖先曾經(jīng)在約9500萬年前經(jīng)歷過全基因組復(fù)制事件[22], 基因組內(nèi)的旁系同源序列極其豐富, 這些雜合子基因型可能并非來自同源染色體上的等位基因, 而是由目標(biāo)位點(diǎn)的旁系同源序列導(dǎo)致的干擾性檢測結(jié)果。在所使用的虹鱒57K芯片設(shè)計(jì)中[13], 曾經(jīng)通過雙單倍體群體檢測, 成功排除了虹鱒基因組內(nèi)的旁系同源序列變異(Paralogous sequence variant, PSV)位點(diǎn), 而本檢測將虹鱒芯片應(yīng)用于近緣鮭科物種檢測, PSV再次大量出現(xiàn)。HWE檢驗(yàn)的原理是通過檢測基因頻率和基因型頻率的平衡關(guān)系來進(jìn)行群體遺傳分析, 因而在本研究檢測的非自然交配群體中, 也可以用于排除PSV位點(diǎn)。對獲得的共享多態(tài)性位點(diǎn)做HWE檢驗(yàn), 剔除了顯著偏離HWE的位點(diǎn)。為了保證位點(diǎn)的基因組覆蓋度, 通過LD檢驗(yàn)剔除了緊密連鎖的位點(diǎn)。多個(gè)物種中的前期研究已表明[18,23], 96位點(diǎn)低密度芯片是魚類親權(quán)鑒定和個(gè)體識(shí)別的優(yōu)選位點(diǎn)數(shù)目, 最終從備選位點(diǎn)中選擇96個(gè)高質(zhì)量位點(diǎn)用于微流控芯片設(shè)計(jì)。
SNPtype微流控體系基于集成流體通路(Integrated fluidic circuit, IFC)構(gòu)建, 在同一個(gè)控制系統(tǒng)下, 將微流控通道、控制閥門和多個(gè)反應(yīng)艙集成在同一張芯片上, 首先使用STA引物和LSP引物對模板DNA進(jìn)行PCR擴(kuò)增反應(yīng), 擴(kuò)增產(chǎn)物與2條ASP探針分別雜交, 檢測雜交后的熒光信號。純合子將檢出其等位基因探針對應(yīng)的熒光標(biāo)記信號, 而雜合子同時(shí)顯示兩種熒光標(biāo)記物信號, 圖 4以1個(gè)GT顛換型SNP位點(diǎn)HOBS-01為例, 展示了192個(gè)樣本的微流控芯片分型結(jié)果, 以無模板對照為信號基線, 3種基因型樣本各自聚群, 并能夠清晰區(qū)分。
圖5和圖 6以細(xì)鱗鮭為檢測對象, 分別展示了應(yīng)用微流控分型系統(tǒng)在親本鑒定和群體遺傳評估中的兩個(gè)應(yīng)用實(shí)例。在干擾親本存在的條件下, 通過96個(gè)SNP位點(diǎn)分型結(jié)果可將96尾細(xì)鱗鮭子代個(gè)體分配至其真實(shí)親本, 無論單親本鑒定還是雙親本鑒定結(jié)果均落在可靠象限內(nèi)(圖 5), 能夠準(zhǔn)確重現(xiàn)復(fù)雜家系的真實(shí)系譜, 并滿足對野外捕撈個(gè)體是否來源于增殖放流苗種進(jìn)行溯源的統(tǒng)計(jì)學(xué)要求。針對遺傳差異顯著的4個(gè)細(xì)鱗鮭群體, 基于96個(gè)SNP位點(diǎn)分型結(jié)果也可開展初步的群體遺傳學(xué)分析, 區(qū)分其祖源成分, 并用于放流群體的種質(zhì)來源和遺傳結(jié)構(gòu)評估(圖 6)。
過去三十余年中, 基于核酸分析的親權(quán)鑒定主要使用微衛(wèi)星標(biāo)記[24]。然而, 伴隨著下一代測序技術(shù)的蓬勃發(fā)展, 海量SNP標(biāo)記的開發(fā)正在逐漸變革分子遺傳領(lǐng)域的技術(shù)方案選擇。由于微衛(wèi)星標(biāo)記在基因組內(nèi)的數(shù)量和分布相對有限, 且新標(biāo)記的開發(fā)驗(yàn)證成本較高, 因而備選標(biāo)記數(shù)量較少, 很難針對特定檢測場景需求, 實(shí)現(xiàn)個(gè)性化位點(diǎn)組合的精準(zhǔn)設(shè)計(jì)。而SNP標(biāo)記在基因組中廣泛存在, 來源于公共數(shù)據(jù)庫的二代測序數(shù)據(jù)和開放獲取的高通量芯片工具提供了海量的候選SNP位點(diǎn), 且SNP標(biāo)記具有易于自動(dòng)化、標(biāo)準(zhǔn)化分析, 代際遺傳突變速率較低等優(yōu)點(diǎn)[24—26], 研究者一直對基于SNP標(biāo)記的遺傳分析應(yīng)用寄予厚望。本研究提供了針對鮭科魚類增殖放流評估場景的技術(shù)解決方案及其應(yīng)用實(shí)例,有力拓展了SNP標(biāo)記分型技術(shù)在分子檢測領(lǐng)域的應(yīng)用前景。
基于微流控芯片構(gòu)建包含96個(gè)鮭科共享多態(tài)性位點(diǎn)的SNP分型系統(tǒng), 可成功開展細(xì)鱗鮭復(fù)雜家系的親權(quán)鑒定和群體遺傳結(jié)構(gòu)初步評估, 適合應(yīng)用于鮭科魚類增殖放流個(gè)體識(shí)別和種群遺傳結(jié)構(gòu)動(dòng)態(tài)評估, 以及在此基礎(chǔ)上開展的增殖放流效果評估。