李聯(lián)萍,陳寧博,雷初朝*
(1.青海省海西州動(dòng)物疫病預(yù)防控制中心,青海 德令哈 817099;2.西北農(nóng)林科技大學(xué)動(dòng)物科技學(xué)院,陜西 楊凌 712100)
因不同的形態(tài)特征和生活習(xí)性,家牛分為無肩峰的普通牛(Bostaurus)和有肩峰的瘤牛(Bosindicus)兩個(gè)牛種。普通牛主要分布在整個(gè)歐亞大陸、非洲北部和非洲西部;瘤牛主要分布在印度次大陸、東南亞和東亞南部,在中東和非洲南部及美洲也有分布。隨著測序技術(shù)發(fā)展和測序成本的降低,全基因組遺傳變異的檢測主要經(jīng)歷了基因芯片和重測序兩個(gè)階段。目前在豬、牛、羊、馬、雞等畜禽進(jìn)行了廣泛系統(tǒng)的全基因組重測序研究,取得了許多令人矚目的科研成果。本文將從通過基因芯片和重測序技術(shù)研究世界家牛的起源、遺傳多樣性以及原牛和近緣野牛對家牛的漸滲進(jìn)行綜述,以期為今后家牛重要經(jīng)濟(jì)性狀相關(guān)功能基因的定位、家牛的起源和馴化研究提供參考。
牛的基因芯片主要有50 K和770 K 2種,其中50 K的芯片應(yīng)用最廣泛。牛單倍型計(jì)劃聯(lián)盟(The Bovine HapMap Consortium)構(gòu)建了牛的SNP數(shù)據(jù)庫,定制了包含37 470個(gè)SNP的芯片,應(yīng)用于19個(gè)品種共497頭牛的遺傳結(jié)構(gòu)分析,使用InSTRUCT軟件估計(jì)不同祖先群體的結(jié)果表明,不同牛品種的聚類結(jié)果與已知牛品種的馴化歷史相似,普通牛和瘤牛分別在近東和印度次大陸?yīng)毩ⅠZ化,非洲普通牛和歐洲普通??赡茉隈Z化早期或馴化前就已經(jīng)分化[1]。Decker等[2]采用牛50 K SNP芯片對全世界134個(gè)品種1 543個(gè)個(gè)體的43 043個(gè)SNP位點(diǎn)進(jìn)行分析,將全世界家牛劃分為非洲普通牛、歐亞普通牛和亞洲瘤牛三大類群。普通牛和瘤牛在馴化后隨著農(nóng)業(yè)社會的擴(kuò)張和人類的活動(dòng)而遷徙。普通牛和瘤牛之間可以雜交并且沒有生殖隔離,因此隨著群體的擴(kuò)散,不同的普通牛和瘤牛群體之間發(fā)生廣泛的融合。在非洲,瘤牛血統(tǒng)的滲入,導(dǎo)致部分非洲牛為普通牛與瘤牛的雜種;在亞洲中部則發(fā)現(xiàn)明顯的歐亞普通牛和印度瘤牛的雜交群體;在歐洲,短角牛對歐洲牛的品種形成具有一定的影響;歐洲南部的意大利和西班牙普通牛擁有非洲普通牛和瘤牛的血統(tǒng),表明羅馬人將近東具有混合血統(tǒng)的家牛帶入歐洲南部;在亞洲,牛的近緣亞種對瘤牛有較大的影響,如巴厘牛對中國南方的海南牛有明顯的滲入。Gautier等[3]通過50 K芯片對法國牛的分析也得出相同的結(jié)論。盡管非洲普通牛和歐亞大陸的普通牛分化程度非常高,但是泛基因組SNP研究結(jié)果顯示,三個(gè)大陸的普通牛都來自于一個(gè)唯一的祖先,證實(shí)普通牛在中東獨(dú)立馴化。隨著農(nóng)業(yè)的擴(kuò)張,中東馴化的普通牛在向非洲和東亞遷移的過程中可能吸收了少量的當(dāng)?shù)卦?,使原牛的基因組進(jìn)入了現(xiàn)代家牛的基因池中。McTavish等[4]研究發(fā)現(xiàn),美洲新大陸的家牛屬于1493年西班牙人帶來的歐洲普通牛的后代,這些普通牛在引入美洲前,已經(jīng)含有非洲普通牛的血統(tǒng)。隨后美洲又從印度引進(jìn)了更加適應(yīng)南美氣候的瘤牛,故美洲家牛為歐洲普通牛、非洲普通牛和瘤牛的混合起源,具有豐富的遺傳多樣性。Yurchenko等[5]通過比較俄羅斯18個(gè)牛品種和世界上135個(gè)品種的遺傳多樣性,研究了俄羅斯當(dāng)?shù)嘏5淖嫦群蜌v史。發(fā)現(xiàn)大部分俄羅斯牛品種和歐洲普通牛品種擁有共同的祖先,只有少量品種和亞洲普通牛共享祖先,其中雅庫特牛屬于一個(gè)高度分化的品種。Gao等[6]對中國20個(gè)地方牛品種進(jìn)行50 K芯片分析,發(fā)現(xiàn)中國地方黃牛品種擁有普通牛和瘤牛的祖先成分,北方黃牛含有10% 以下的瘤牛血統(tǒng),西南地區(qū)的黃牛含有90% 的瘤牛血統(tǒng);且發(fā)現(xiàn)中國南方黃牛均有不同程度的爪哇牛和大額牛的滲入,西藏牛則有零星的牦牛基因組滲入。Chen等[7]利用77 K芯片對秦川牛的起源進(jìn)行分析,發(fā)現(xiàn)秦川牛屬于瘤牛和普通牛的混合起源,并伴有少量的爪哇牛血統(tǒng)。由于牛的基因芯片是基于歐洲普通牛參考基因組設(shè)計(jì)的,具有很大的偏向性,并不適于研究其他地域家牛的遺傳多樣性和起源。例如印度瘤牛和中國瘤牛。而利用全基因組數(shù)據(jù)可以獲得更多的基因組信息,從而更加精確地闡述家牛的遺傳多樣性和起源。
2003年9月,“?;蚪M工程”正式啟動(dòng),歷時(shí)6年,牛的基因組序列終于呈現(xiàn)在世人面前[8]。牛基因組包含22 000個(gè)基因,通過比對基因同義突變和非同義突變的比例,發(fā)現(xiàn)在多個(gè)免疫基因上存在選擇信號。Gibbs等[9]利用這個(gè)參考基因組設(shè)計(jì)了牛的SNP芯片,對19個(gè)牛品種進(jìn)行SNP分型,發(fā)現(xiàn)馴化和人工選擇導(dǎo)致普通牛的有效群體大小不斷下降。自2003年?;蚪M測序計(jì)劃實(shí)施以來,先后公布了多個(gè)版本的參考基因組,分別為:2018年新組裝和注釋的ARS-UCD1.2,2014年的UMD 3.1.1和Bostaurus5.0,可以在多個(gè)公共數(shù)據(jù)庫查詢。UMD 3.1.1版本的基因組包含85 046個(gè)蛋白,26 410個(gè)基因和10 047個(gè)假基因[10]。為了更快地提高家牛的遺傳進(jìn)展,歐美發(fā)達(dá)國家牽頭實(shí)施了“千牛基因組”計(jì)劃,現(xiàn)已進(jìn)行到第7輪?!扒;蚪M”計(jì)劃旨在提供一個(gè)基因組變異數(shù)據(jù)庫,對用于全基因組關(guān)聯(lián)分析和基因組選育的數(shù)據(jù)進(jìn)行填充。自從2012年“千牛基因組”計(jì)劃實(shí)施以來,其測序的樣本數(shù)已經(jīng)從第1輪的3個(gè)品種234頭種公牛鑒定出28.3 M SNPs 到第6輪的2 700頭(大于100個(gè)普通牛和瘤牛品種),鑒定出大于88 M 高質(zhì)量的 SNPs,該計(jì)劃已經(jīng)收集了涵蓋全世界不同區(qū)域家牛的全基因組數(shù)據(jù)。2014 年,“千?;蚪M”計(jì)劃組織者通過分析荷斯坦牛、弗萊維赫牛、娟珊牛和安格斯牛種公牛的重測序數(shù)據(jù),共發(fā)現(xiàn)28.3 M的SNPs,其中每1 kb雜合位點(diǎn)為1.44。利用重測序數(shù)據(jù)找到一個(gè)隱性胚胎致死的突變,一個(gè)導(dǎo)致軟骨發(fā)育異常的顯性突變,同時(shí)也對幾個(gè)復(fù)雜性狀如產(chǎn)奶量和卷毛性狀進(jìn)行了全基因組關(guān)聯(lián)分析,并找到其因果突變位點(diǎn)[11]。緊接著全世界科學(xué)家對各自國家的牛品種,如:日本見島牛[12]、口之島牛[13]、韓國斑紋牛[14]、韓國韓牛[15]、中國南陽牛[16]、中國延邊牛[14]、非洲5個(gè)牛品種[17]、美洲瘤牛[18-19]、伊比利亞牛[20]、北歐牛[21]等肉牛品種進(jìn)行了全基因組重測序分析。阿爾伯塔大學(xué)的加拿大肉?;蚪M計(jì)劃[22],對397頭普通牛(包括肉用和乳用品種)進(jìn)行了全基因組測序,這些結(jié)果將為肉牛的基因組選育提供重要數(shù)據(jù)。Lee等[15]對1頭韓牛公牛進(jìn)行全基因組分析,發(fā)現(xiàn)大量SNPs和Indels位點(diǎn)。Kawahara-Miki等[13]對1頭日本地方牛公牛進(jìn)行全基因組分析,發(fā)現(xiàn)6.3 M的SNPs,其中5.5 M是新的SNPs,表明該品種與歐洲家牛完全不同。Tsuda等[12]對日本和牛的原始牛種見島牛進(jìn)行重測序,發(fā)現(xiàn) 6.54 M的SNPs,并在313個(gè)基因中發(fā)現(xiàn)400個(gè)見島牛特異的錯(cuò)義突變。Choi等[14]分別對10頭韓牛和10頭延邊牛進(jìn)行全基因組比較分析,發(fā)現(xiàn)17 M的SNPs,其中22.3% 是新的SNPs,并發(fā)現(xiàn)PPP1R12A是一個(gè)潛在的影響牛肌內(nèi)脂肪含量的基因。Rosse等[18]對1頭巴西的Guzera牛進(jìn)行全基因組測序,發(fā)現(xiàn)純合的2 M SNPs和463 158 個(gè)InDels,共發(fā)現(xiàn)1 069個(gè)新的非同義突變、剪切突變和編碼區(qū)插入缺失,這些變異位于935個(gè)基因內(nèi),參與細(xì)胞信號、環(huán)境適應(yīng)、感官和免疫系統(tǒng)相關(guān)信號通路。Kim等[17]對非洲大陸5個(gè)地方群體48頭家牛的全基因組進(jìn)行重測序,發(fā)現(xiàn)非洲瘤牛具有很高的遺傳多樣性,找到非洲牛受選擇的基因組區(qū)域,為了解非洲牛廣泛的適應(yīng)性提供了全基因組水平的證據(jù),對非洲大陸家牛可持續(xù)發(fā)展提供了遺傳學(xué)依據(jù)。Liao等[19]對瘤牛品種Gir牛3頭種公牛的全基因組變異進(jìn)行分析,發(fā)現(xiàn)9.99 M的SNPs和604 308個(gè)InDels;并檢測到79個(gè)受選擇信號,這些信號區(qū)域包含一些重要的抗病基因家族;另外一些區(qū)域包含促分裂原激活蛋白激酶,該酶直接參與滲透壓和熱應(yīng)激引起的反應(yīng),與瘤牛的耐熱性相關(guān)。Mei等[23]對中國6個(gè)地方黃牛品種(37頭秦川牛,2頭南陽牛,2頭魯西牛,1頭延邊牛,2頭雷瓊牛,2頭云南牛)共46個(gè)個(gè)體進(jìn)行全基因組分析,表明中國黃牛屬于瘤牛和普通牛的混合起源;但由于該文主要研究秦川牛的遺傳多樣性和受選擇信號,找到一些與毛色及產(chǎn)肉性狀相關(guān)的受選擇基因。Weldenegodguad等[21]對俄羅斯最北部的三個(gè)品種進(jìn)行測序,共發(fā)現(xiàn)17.45 M的SNPs,說明雅庫特牛比歐洲普通牛擁有更多的品種特異性變異和遺傳多樣性,并發(fā)現(xiàn)一些與亞北極環(huán)境適應(yīng)相關(guān)的受選擇基因。Chen等[24]通過全基因組測序,首次證明全世界家牛至少可以分為5個(gè)類群,即:歐洲普通牛、歐亞普通牛、東亞普通牛、中國瘤牛和印度瘤牛。歐洲普通牛血統(tǒng)主要分布在歐洲西部的牛種中;歐亞普通牛血統(tǒng),主要分布在歐亞大陸;地理位置相分離的西藏和亞洲東北部的品種形成了一個(gè)獨(dú)特的東亞普通牛;瘤牛分為中國瘤牛和印度瘤牛兩個(gè)類群。中國地方黃牛品種主要來源于3個(gè)祖先血統(tǒng):東亞普通牛、歐亞普通牛和中國瘤牛。家牛的祖先原牛在史前廣泛的分布在整個(gè)歐亞大陸,并且形成不同的群體。除了家牛之外,還有其他牛亞科動(dòng)物也與家牛的棲息地相互重疊,并且都可以與普通牛和瘤牛雜交,因此牛亞科的其他動(dòng)物對家牛的遺傳多樣性有獨(dú)特的貢獻(xiàn)。
通過對線粒體基因組的研究,已經(jīng)證明現(xiàn)代和古代普通牛中發(fā)現(xiàn)少量歐洲原牛的線粒體單倍型P,說明歐洲北部、中部或東部的原牛對馴化的家牛有基因滲入[25]。隨著全基因組測序技術(shù)的發(fā)展,科學(xué)家希望能復(fù)原更多古代原牛的DNA,并與現(xiàn)代牛的參考基因組進(jìn)行比對。2015年,Park等[26]對一頭距今6 750年的英國歐洲原牛樣本進(jìn)行了重測序。通過分析這頭原牛的基因組數(shù)據(jù),并將其與73頭現(xiàn)代牛的基因組數(shù)據(jù)相比較,發(fā)現(xiàn)這頭歐洲原牛對現(xiàn)代歐洲普通牛具有明顯的基因滲入。英國的Highland、Dexter、Kerry、Welsh Black和White Park牛品種都擁有該原牛的血統(tǒng),而歐洲其他國家的牛種則沒有受到該原牛的影響,表明古代不同地域的原牛會對當(dāng)?shù)嘏F贩N產(chǎn)生影響。英國當(dāng)?shù)卦5臐B入事件證明,不同的原牛群體對古代馴化的家牛群體有基因貢獻(xiàn)而且很好地保留在現(xiàn)代牛的基因組中。Upadhyay等[20]通過基因芯片技術(shù)進(jìn)一步研究了英國原牛對歐洲現(xiàn)代普通牛的影響,證明歐洲原牛和愛爾蘭當(dāng)?shù)卦4嬖诨蚪涣鳎瑫r(shí)也證明伊比利亞半島上的家牛和原牛也有基因交流,表明歐洲原牛曾在歐洲有廣泛分布。
家牛的遺傳多樣性主要來自于兩個(gè)可雜交的牛種—普通牛和瘤牛。亞洲還馴化了其他牛亞科動(dòng)物,包括在青藏高原及周邊地區(qū)的牦牛、印度東北部、中國云南及緬甸的大額牛、印度尼西亞的爪哇牛,這些動(dòng)物的棲息地都與瘤牛和普通牛的棲息地相互重疊,因?yàn)檫@三種動(dòng)物都可以與普通牛和瘤牛雜交,因此亞洲地區(qū)的一些牛品種屬于混合起源,對家牛的遺傳資源有獨(dú)特的貢獻(xiàn)。有關(guān)家牛與近緣牛種的線粒體DNA結(jié)果已經(jīng)證明亞洲家牛與牦牛和爪哇牛都曾雜交過;大量基于線粒體DNA、Y染色體、微衛(wèi)星標(biāo)記的研究證明爪哇牛與瘤牛之間存在基因滲入。Medugorac等[27]通過對2頭蒙古牦牛的重測序數(shù)據(jù)和76頭牦牛高密度芯片的基因分型,發(fā)現(xiàn)這76頭家養(yǎng)牦牛在1 500年前受到黃牛的影響,基因組中大約保留了約1.3%的黃?;蚪M,這些滲入?yún)^(qū)域包含大量與神經(jīng)系統(tǒng)發(fā)育相關(guān)的基因,這對于選育脾性溫和的牦牛具有重要作用。該研究還發(fā)現(xiàn)牦牛的無角性狀來自蒙古牛。Hartat等[28]提出爪哇牛是瘤牛的部分祖先,從基因組水平證明印度尼西亞的Ongole牛是爪哇牛和瘤牛的雜交后代,并證明印尼現(xiàn)代牛中攜帶有非洲普通牛和瘤牛的基因組成分。Wangkumhang等[29]通過50K芯片分析發(fā)現(xiàn),泰國牛中存在一些特異的SNPs,提出東南亞瘤牛特異的SNPs可能來自一個(gè)未知的或者已經(jīng)滅絕的祖先。最新的研究結(jié)果表明,牛屬不同牛種之間存在廣泛的基因交流,這對于不同牛屬動(dòng)物適應(yīng)不同生存環(huán)境具有重要作用[30]。研究發(fā)現(xiàn)瘤牛與大額牛、瘤牛與巴厘牛、普通牛與牦牛、普通牛與歐洲野牛之間存在廣泛的基因組滲入。瘤牛到半野生的大額牛和巴厘牛的滲入基因中存在許多與神經(jīng)和免疫系統(tǒng)相關(guān)的基因。通過與牦牛雜交,西藏牛獲得部分牦?;?,提高了西藏牛對青藏高原低氧環(huán)境的適應(yīng)性[30]。Chen等[24]發(fā)現(xiàn)中國黃牛與近緣牛種存在廣泛的基因交流,中國瘤?;蚪M中保留了約2.93%的爪哇牛血統(tǒng),西藏普通牛中保留了約1.2%的牦牛血統(tǒng);富集分析表明爪哇牛對中國瘤牛的滲入?yún)^(qū)域主要富集在感官和免疫相關(guān)通路,牦牛對西藏牛的滲入片段主要富集在嗅覺、抗病和免疫等通路;在家牛從馴化中心擴(kuò)散到其他地域的過程中,家牛不斷吸收了當(dāng)?shù)卦5难y(tǒng)和近緣野牛的滲入導(dǎo)致了不同地方品種獨(dú)特的基因組遺傳多樣性;同時(shí)這些滲入事件使當(dāng)?shù)仄贩N快速適應(yīng)了當(dāng)?shù)氐臉O端環(huán)境,說明基因交流是家牛適應(yīng)環(huán)境的重要方式之一。
隨著二代測序成本的不斷降低和三代測序技術(shù)的更新,利用全基因組重測序技術(shù)對于檢測家牛全基因組中的序列變異和結(jié)構(gòu)變異將更加全面和精確;除了商業(yè)品種和培育品種的重測序數(shù)據(jù)不斷增加,世界各地當(dāng)?shù)丶遗F贩N的基因組數(shù)據(jù)的不斷公布將更有利于研究世界家牛的遺傳多樣性;同時(shí)隨著動(dòng)物考古學(xué)和古DNA處理和分析方法的不斷進(jìn)步,有助于更深入解析家牛起源和品種的形成。