肖海霞 阿布來提·蘇來曼 托乎提·阿及德 努爾尼薩·莫拉尼亞孜 張國庭 帕熱哈提江·吾甫爾 王 瓊 蘇玲玲 謝立榮 劉應(yīng)進 買買提·克玉木 田可川 劉武軍
(1新疆畜牧科學(xué)院畜牧研究所,新疆烏魯木齊 830011;2新疆畜牧科學(xué)院,新疆烏魯木齊 830011;3新疆農(nóng)業(yè)大學(xué),新疆烏魯木齊 830052)
中國是世界上畜禽遺傳資源最豐富的國家之一,《國家畜禽遺傳資源品種名錄(2021版)》已確定948個畜禽品種。畜禽資源是中國種業(yè)創(chuàng)新、打贏種業(yè)翻身仗的根基。當(dāng)前,組織開展的第3次全國畜禽遺傳資源普查為摸清畜禽和蜂、蠶遺傳資源家底,發(fā)掘一批新資源,科學(xué)評估資源珍貴稀有程度和瀕危狀況,實現(xiàn)應(yīng)收盡收、應(yīng)保盡保,打好種業(yè)翻身仗奠定種質(zhì)資源基礎(chǔ)。我國現(xiàn)有24個驢品種,新疆主要有和田青驢、吐魯番驢和新疆驢3個地方品種和1個注冊的商標(biāo)品牌——疆岳驢。疆岳驢是1958—2003年新疆喀什地區(qū)岳普湖縣先后8次從陜西省引進優(yōu)質(zhì)關(guān)中驢和當(dāng)?shù)氐胤狡贩N新疆驢進行雜交改良,形成具有適應(yīng)性強、耐粗飼、抗病力強、生產(chǎn)性能較高的良種驢,深受各地農(nóng)牧民喜愛,已被全國20多個省區(qū)引作種畜,但至今未進行品種審定[1]。
SLAF-seq(specific?locus amplified fragment sequenc?ing)[2]是一種基于高通量測序為基礎(chǔ)的酶切簡化基因組技術(shù),可快速鑒定出高密度的SNP位點,并在此基礎(chǔ)上進行系統(tǒng)發(fā)生樹分析、群體結(jié)構(gòu)分析、遺傳圖譜整合、QTL定位等后期分析。SLAF-seq簡化基因組測序在生物遺傳多樣性方面得到了較為廣泛的運用[3]。雖然目前SLAFseq技術(shù)在驢上的應(yīng)用尚無報道,但該技術(shù)對于植物或者動物的DNA測序流程、基因分型以及隨后的序列分析均無差異[4]。因此,本文采用簡化基因組測序技術(shù)(SLAFseq),選擇足夠多的疆岳驢樣本,獲得高密度覆蓋全基因組的SNP標(biāo)記,通過SNP標(biāo)記進行疆岳驢群體遺傳學(xué)研究,以期為疆岳驢的關(guān)聯(lián)遺傳學(xué)研究、定位重要乳用性狀相關(guān)基因、優(yōu)質(zhì)資源開發(fā)利用和培育新品種(配套系)奠定堅實基礎(chǔ)。
1.1 試驗材料新疆喀什地區(qū)岳普湖縣新疆金陽光畜牧養(yǎng)殖有限公司125頭疆岳驢頸靜脈采血3~5 mL,檸檬酸鈉抗凝,-20 ℃保存。
1.2 試驗方法
1.2.1 SLAF-seq簡化基因組測序 利用天根血液基因組DNA提取試劑盒提取樣品基因組DNA。經(jīng)質(zhì)檢合格后,選擇最適的酶切方案酶切驢樣品DNA。將獲得的SLAF標(biāo)簽(酶切片段)的3′端處理連接Dual-index[5]測序接頭、PCR擴增和純化、樣品混合和凝膠切割,以選擇目標(biāo)片段,然后鑒定文庫,并通過illuminahiseq測序。
1.2.2 SNP質(zhì)控 用BWA[6]將測序讀取并與參考基因組進行比較,GATK[7]和samtools[8]用于開發(fā)SNP,根據(jù)完整度>0.5,MAF>0.05過濾。
1.2.3 統(tǒng)計分析 通過MEGA5[9]軟件的neighbor-joining算法,構(gòu)建樣品的群體進化樹。通過admixture[10]軟件,分析樣品的群體結(jié)構(gòu),分別假設(shè)樣品的分群數(shù)(K值)為1~10,進行聚類。對聚類結(jié)果進行交叉驗證,根據(jù)交叉驗證錯誤率的谷值確定最優(yōu)分群數(shù)。通過EIGENSOFT[11]軟件,進行主成分分析(PCA),得到樣品的主成分聚類情況。使用SPAGeDi[12]軟件可以對自然群體個體間的親緣關(guān)系進行估計。當(dāng)2個材料之間的親緣關(guān)系值<0時,則直接定義為0。
2.1 疆岳驢基因組SNP標(biāo)記的開發(fā)與篩選對疆岳驢基因組進行電子酶切預(yù)測,最終確定使用RsaI+EcoRVHF@酶切,酶切片段長度為364~394 bp的序列定義為SLAF 標(biāo)簽,預(yù)測SLAF 標(biāo)簽數(shù)為234 762 個。試驗中RsaI+EcoRV-HF@酶切酶切效率是95.24%,共得到1 318.13M reads。通過生物信息學(xué)分析,獲得1 416 014個SLAF 標(biāo)簽,平均測序深度為880.87 x,其中多態(tài)性的SLAF標(biāo)簽共有900 598個,共得到4 887 196個SNP標(biāo)記(圖1)。
圖1 SNP在染色體上的分布
2.2 系統(tǒng)發(fā)育分析基于MEGA5軟件的neighbor-joining
算法,構(gòu)建125頭疆岳驢的群體進化樹。由圖2可知,125頭疆岳驢聚集為2個大的分支:1個分支79頭聚集在一起,親緣關(guān)系較近;另1分支46頭聚集在一起,親緣關(guān)系較近。這2個分支親緣關(guān)系較遠。
圖2 125頭疆岳驢的系統(tǒng)進化樹
2.3 遺傳結(jié)構(gòu)分析基于SNP,通過admixture軟件計算樣品的群體結(jié)構(gòu)Q[13]。分別假設(shè)125個樣品的分群數(shù)(K值)為1~10,進行聚類,根據(jù)各個K值對應(yīng)的交叉驗證錯誤率位置來確定分群數(shù),擁有最低交叉驗證錯誤率K值的分群數(shù)為最優(yōu)分群數(shù),結(jié)果顯示當(dāng)K值為2時峰值最低(圖3),說明當(dāng)把樣品分為2個群來計算群體結(jié)構(gòu)Q時最優(yōu)。
圖3 125頭疆岳驢的群體結(jié)構(gòu)與聚類分析結(jié)果
2.4 PCA分析PCA能對樣本的具體分組及親緣關(guān)系情況進行評估,并查看樣本在結(jié)果中的分布是否與試驗設(shè)計及表型一致。125頭疆岳驢PCA聚類見圖4,樣本比較清晰的分成2個大群,群內(nèi)空間距離較近,關(guān)系比較接近;群間空間距離較遠,親緣關(guān)系較遠。這與系統(tǒng)發(fā)育樹結(jié)果相一致。
圖4 125頭疆岳驢PCA聚類圖
2.5 親緣關(guān)系分析使用SPAGeDi軟件可以對群體間的親緣關(guān)系進行估計,結(jié)果顯示125頭疆岳驢親緣關(guān)系在0.4和1.0頻率最高,提示可分為2個群體,進一步佐證了進化樹、PCA的聚類結(jié)果,Kinship值的頻率分布見圖5。
圖5 125頭疆岳驢親緣關(guān)系頻率分布
我國是世界上畜禽遺傳資源最豐富的國家之一,數(shù)量眾多、特點突出的種質(zhì)資源是加快畜禽種質(zhì)創(chuàng)新、培育國內(nèi)產(chǎn)業(yè)優(yōu)勢、實現(xiàn)多元化發(fā)展不可或缺的戰(zhàn)略性資源。目前,國家畜禽遺傳資源品種名錄(2021年版)確定了948個畜禽品種,這些珍貴的基因是畜禽育種和種業(yè)創(chuàng)新的基礎(chǔ)素材。由于畜禽遺傳資源屬于可變性和可更新資源,一直處于動態(tài)變化中。摸清并掌握畜禽種質(zhì)資源家底,及時了解畜禽資源的動態(tài)變化,將為行業(yè)管理、科學(xué)研究和產(chǎn)業(yè)發(fā)展提供基礎(chǔ)支撐。當(dāng)前,組織開展的第三次全國畜禽遺傳資源普查將依托畜禽保種養(yǎng)殖場全面系統(tǒng)開展生產(chǎn)性能測定,在分子水平上收集整理有關(guān)遺傳信息,推動建立畜禽品種DNA特征庫,國家畜禽遺傳資源委員會對新發(fā)現(xiàn)的遺傳資源將按規(guī)定及時進行鑒定評估。發(fā)掘種質(zhì)資源和優(yōu)異基因,將為中國畜禽種業(yè)自主創(chuàng)“芯”做好準(zhǔn)備。通過資源調(diào)查和科學(xué)評估,摸透并掌握這些品種和特性,對當(dāng)前乃至未來產(chǎn)業(yè)發(fā)展具有重要價值。
世界毛驢資源也很豐富,共有194個品種,其中我國有24個地方驢品種(主要分大、中、小型驢3種)。新疆主要有3個地方品種(和田青驢、吐魯番驢和新疆驢)和1個品牌(疆岳驢)。疆岳驢是20世紀(jì)50年代以來先后8次引進關(guān)中驢對新疆驢進行雜交改良、橫交固定、選育提高[15]、培育而成的優(yōu)良高產(chǎn)大型役肉兼用型驢,具有適應(yīng)性強、耐粗飼、抗病力強、生產(chǎn)性能較高等特點,深受各地農(nóng)牧民喜歡。最初曾被稱為“岳普湖關(guān)中驢”、“關(guān)新驢”,現(xiàn)被稱為“疆岳驢”,主要分布于喀什地區(qū)岳普湖、伽師、巴楚、疏勒、英吉沙、喀什等縣市[16-18]。岳普湖縣是疆岳驢的發(fā)源地且飼養(yǎng)數(shù)量較多,2000年疆岳驢作為1個品牌通過國家商標(biāo)管理局注冊命名,2004年7月岳普湖縣被農(nóng)業(yè)部特產(chǎn)之鄉(xiāng)暨宣傳活動組織委員會命名為“中國毛驢之鄉(xiāng)”[19-20],但至今未進行品種審定。陸東林等[1]通過介紹新疆疆岳驢的培育過程、中心分布區(qū)、外貌特征、體尺體重、生產(chǎn)性能、飼料飼養(yǎng)、遺傳育種等研究進展情況,建議運用現(xiàn)代遺傳育種技術(shù),加強優(yōu)良性能基因的篩選和種驢培育,開展系統(tǒng)的選育和純繁,為疆岳驢的品種鑒定和審定奠定基礎(chǔ)。
簡化基因組測序技術(shù)(specific?locus amplified frag?ment sequencing,SLAF-seq),利用限制性內(nèi)切酶對基因組進行酶切,產(chǎn)生一定大小的片段,構(gòu)建測序文庫,對酶切后產(chǎn)生的SLAF標(biāo)記進行高通量測序[21]。黃倫[22]以四川省38個樣點蜜蜂為主要研究對象,利用SLAF-seq簡化基因組測序技術(shù)共獲得268 631個SLAF標(biāo)簽,標(biāo)簽的平均測序深度為253.24 x,其中,多態(tài)性SLAF標(biāo)簽有189 234個,共獲得1 018 013個SNP標(biāo)記。樊英智[23]通過對6個不同類型的中國家驢品種群體進行全基因組混池重測序共獲得700多萬個單核普酸多態(tài)性(SNPs)變異信息。王文浩[21]基于酶切的SLAF-seq簡化基因組測序技術(shù)測定391只11世代的京海黃雞,共得到103 680個SLAF標(biāo)記和90 030個SNPs。本研究通過SLAF-seq簡化基因組測序技術(shù)獲得1 416 014個SLAF標(biāo)簽,平均測序深度為880.87 x,其中多態(tài)性的SLAF標(biāo)簽共有900 598個,共得到4 887 196個SNPs。楊虎等[24]利用8個微衛(wèi)星標(biāo)記檢測了新疆3個地方驢品種的遺傳多樣性,計算了各群體的平均遺傳雜合度(h)、多態(tài)信息含量(PIC)和群體間遺傳距離。這說明新疆地方驢遺傳多樣性豐富,群體遺傳變異程度較高,育種潛力大。聚類分析表明和田驢先與喀什驢聚為一類,然后與吐魯番驢聚類,與史料及地理分布一致。Li等[25]使用SLAF-seq技術(shù)做出了包含20個連鎖群的5 785個SLAFs的大豆的高密度遺傳圖譜,該圖譜將有效促進大豆?jié)撛谥匾r(nóng)業(yè)性狀相關(guān)基因和QTLs的鑒定。黃倫[22]基于SLAF-seq基礎(chǔ)上進行群體遺傳學(xué)分析發(fā)現(xiàn),四川地區(qū)中蜂從分子水平上明顯分為6個種群:阿壩種群、甘孜1種群、甘孜2種群、涼山攀枝花種群、四川盆地。樊英智[23]在全基因組混池重測的基礎(chǔ)上進行的主成分分析(PCA)顯示關(guān)中驢與和田青驢先聚在一起且它們與庫倫驢遺傳距離很近,其他3個品種驢與關(guān)中驢、和田青驢、庫倫驢距離都較遠且它們之間也相距較遠。本研究通過MEGA5軟件的neighbor-joining算法,構(gòu)建125頭疆岳驢的群體進化樹發(fā)現(xiàn)其中79頭為1個分支,46頭為另外1個分支。分支內(nèi)親緣關(guān)系較近,分支間親緣關(guān)系較遠;通過admixture軟件對聚類結(jié)果進行交叉驗證,通過主成分分析(PCA)分析進行評估,使用SPAGeDi軟件進一步佐證了125頭疆岳驢驢分成了2個群體,這可能與該公司外購驢有關(guān),形成了純種疆岳驢和雜種的疆岳驢2個群體。這個結(jié)果為疆岳驢的鑒定和申報新品種(配套系)奠定了堅實的基礎(chǔ)。
應(yīng)用SLAF-seq簡化基因組測序技術(shù)對125頭疆岳驢血液DNA進行檢測,獲得4 887 196個疆岳驢的群體SNP標(biāo)記;通過系統(tǒng)發(fā)育、遺傳結(jié)構(gòu)、PCA和親緣關(guān)系分析發(fā)現(xiàn)125頭疆岳驢分成2個群體,為爭取在第三次全國畜禽遺傳資源普查申報新培育品種(配套系)和疆岳驢重要性狀QTL定位奠定基礎(chǔ)。