張 毅,孫東曉,肖 煒,張勝利
(1.中國農(nóng)業(yè)大學動物科學技術學院,北京 100193;2.北京市畜牧總站,北京 100107)
近幾十年來,奶牛通過高強度選擇,產(chǎn)奶性能大幅提高,然而在育種過程中,對種公牛的選擇總局限在少數(shù)優(yōu)秀家系,奶?;驇熘饾u縮小。同時,人工授精技術的廣泛使用使優(yōu)秀種公牛的使用頻率增加,奶牛群體近交程度不斷增加。美國奶牛育種委員會統(tǒng)計,1960—2017年,荷斯坦牛作為奶牛主導品種,單產(chǎn)從6 334 kg增加到12 723 kg,同時平均近交系數(shù)以每年約0.12%的速率遞增,2017年達7.24%(圖1)?;蚪M選擇育種技術雖然理論上可以減緩近交[1],但由于公牛早期選擇和世代間隔縮短,實際近交增加速度更快[2]。伴隨群體近交積累,隱性有害基因純合概率增加,遺傳缺陷發(fā)病風險隨之增加。
近年來,基因組測序技術的發(fā)展及?;蚪MSNP芯片的出現(xiàn)[3]不僅提高了傳統(tǒng)基因定位的效率,還催生了新的定位策略,鑒定出多種導致胚胎死亡或犢牛出生缺陷的有害基因。本文將從常見遺傳缺陷種類、缺陷基因來源和傳遞方式、基因定位和分子檢測方法、對奶牛生產(chǎn)影響及管理策略等方面,概述荷斯坦牛遺傳缺陷基因的研究進展,并展望遺傳缺陷基因育種應用的方向。
國際上,在荷斯坦牛公牛系譜中標注的常見遺傳缺陷共11種(表1)。
1.1 已鑒定的單基因遺傳缺陷
1.1.1 尿苷酸合酶缺乏癥(Deficiency of Uridine-5’-Monophophate Synthase,DUMPS)DUMPS可導致隱性純合的后代胚胎早期死亡[4-5]?;疾倥1憩F(xiàn)為尿苷酸合酶(UMPS)活性下降,酶作用底物4-羧基尿嘧啶(乳清酸)水平顯著提高[4]。其分子遺傳機制是牛1號染色體上UMPS基因第5外顯子1個C/T突變,使編碼精氨酸的密碼子突變?yōu)榻K止密碼子,導致原編碼產(chǎn)物C末端缺失76個氨基酸[6]。
1.1.2 并趾癥(Mulefoot)并趾癥也稱單蹄癥(Syndactyly),臨床癥狀為牛蹄發(fā)育過程中融合,犢牛單蹄,一只或多只腳趾上生出多余的腳趾,跛行和站立不穩(wěn),最常見于前肢,但也有四肢全部并趾[7]。其分子機制為牛15號染色體LRP4基因上的2個連續(xù)點突變(GC/AT),導致2個氨基酸從天冬氨酸和甘氨酸,突變?yōu)橘嚢彼岷桶腚装彼醄8]。
1.1.3 白細胞黏附缺陷癥(Bovine Leukocyte Adhesion Deficiency,BLAD)BLAD于1983年發(fā)現(xiàn),患病犢牛表現(xiàn)食欲下降、生長發(fā)育受阻、持續(xù)性或反復性炎癥,多數(shù)患病牛出生后在短期內死亡[9]。其致病機理為牛1號染色體上CD18(ITGB2)基因第383位堿基發(fā)生了A/G的錯義突變,其編碼的氨基酸由天冬氨酸變?yōu)楦拾彼?,致使白細胞表面的整合素表達明顯減少或缺乏而引起臨床發(fā)病[10]。
1.1.4 脊椎畸形綜合癥(Complex Vertebral Malformation,CVM)CVM最早于2001年報道,患病犢牛表現(xiàn)為體重減輕、脊椎畸形、腿部肌腱萎縮等癥狀,導致母牛妊娠期流產(chǎn)、早產(chǎn)、死產(chǎn),或犢牛出生后短期內死亡[11]。其致病機理是牛3號染色體上SLC35A3基因的第559位堿基發(fā)生了G/T的錯義突變,其編碼的氨基酸由纈氨酸變?yōu)楸奖彼?,導致編碼溶質載體家族35A3功能障礙,從而引起臨床發(fā)病[12]。
1.1.5 短脊柱綜合癥(Brachyspina,BS)BS最早于2006年發(fā)現(xiàn),對患病死胎解剖顯示,患病牛發(fā)育遲緩,頸椎和胸椎嚴重縮短,胸椎前有刺狀突起,四肢細長,外形像麋鹿[13]。BS致病機理是牛21號染色體上FANCI基因發(fā)生了一段3 329 bp缺失,組成FANCI基因的37個外顯子中25~27號外顯子丟失,第28號外顯子提前出現(xiàn)終止密碼,引起了無義介導的RNA衰退[14]。
1.2 遺傳缺陷單倍型 單倍型是在同一染色體上多個位點等位基因的組合,常作為一個整體進行遺傳[15]。2011年,3種導致荷斯坦牛胚胎死亡的單倍型(HH1、HH2和HH3)被最早鑒定出來[16],后續(xù)還發(fā)現(xiàn)了HH4、HH5及HCD。盡管這些缺陷單倍型的致病基因后續(xù)已研究明確,但命名仍沿用最早的名稱。
1.2.1 HH1(Holstein Lethal Haplotype 1)HH1胚胎致死單倍型起初被定位于牛5號染色體58~66 Mb位置區(qū)域(UMD 3.0 genome assembly)[16]。之后,Adams等[17-18]通過全基因組重測序發(fā)現(xiàn)在APAF1(Apoptotic Peptidase Activating Factor 1)基因上存在1個C/T無義突變,使編碼谷氨酸的密碼子突變?yōu)榻K止密碼子,導致APAF1基因編碼的蛋白質缺失約1/3;APAF1編碼蛋白是細胞色素C介導的細胞凋亡途徑的必需分子,在胚胎發(fā)育中發(fā)揮重要作用,因此該突變很可能是HH1的致病位點。
1.2.2 HH2(Holstein Lethal Haplotype 2)HH2胚胎致死單倍型最早被定位于牛1號染色體92~97 Mb位置區(qū)域(UMD 3.0 genome assembly)[16]。2014年,McClure等[19]通過外顯子測序技術將HH2致病位點的區(qū)域縮小到牛1號染色體94.86~96.55 Mb位置。目前HH2遺傳缺陷單倍型的分子機制尚不明確。
表1 荷斯坦牛常見遺傳缺陷的分子機制
1.2.3 HH3(Holstein Lethal Haplotype 3)HH3胚胎致死單倍型起初被定位于牛8號染色體90~95 Mb位置區(qū)域(UMD 3.0 genome assembly)[16]。2014年,McClure等[19]通過外顯子測序技術發(fā)現(xiàn)牛8號染色體SMC2(Structural Maintenance of Chromosomes 2)基因上1個T/C突變,導致編碼的氨基酸由苯丙氨酸突變?yōu)榻z氨酸。SMC2基因在染色體結構維持和DNA修復中起關鍵作用,突變導致SMC2基因功能異常,最終導致胚胎死亡。同年,Daetwyler等[20]通過分析234頭公牛的全基因組測序數(shù)據(jù)也定位到HH3致因突變。
1.2.4 HH4(Holstein Lethal Haplotype 4)2013年,F(xiàn)ritz等[21]通過分析法國荷斯坦牛SNP芯片數(shù)據(jù)及全基因組測序數(shù)據(jù),確定了HH4胚胎致死單倍型的致病機理,即牛1號染色體的GART(Glycinamide Ribonucleotide Transformylase)基因編碼區(qū)內的A/C突變,導致編碼氨基酸從天冬氨酸突變?yōu)樘K氨酸。由于GART基因編碼甘氨酰胺核苷酸轉甲酰基轉移酶,而該物質在嘌呤的生物合成中起關鍵作用,發(fā)生突變后GART功能喪失,嘌呤無法合成,最終導致胚胎在妊娠早期死亡[21]。
1.2.5 HH5(Holstein Lethal Haplotype 5)2013年,Cooper等[22]將HH5胚胎致死單倍型位點定位在牛9號染色體。之后,致病機理被確認為牛9號染色體上1個長達138 kb的缺失,其中包含整個TFB1M(Dimethyl-Adenosine Transferase 1)基因[23]。TFB1M對于線粒體中啟動蛋白翻譯起決定性作用,該突變導致胚胎在妊娠前60 d內發(fā)生死亡[24]。
1.2.6 HCD(Holstein Haplotype for Cholesterol Deficiency)HCD最早由德國學者在2015年報道,表現(xiàn)為犢牛慢性腹瀉、生長受阻,繼發(fā)肺炎、水腫等癥狀,一般在出生后3周到6月內死亡,血液化學分析顯示患病犢牛血漿膽固醇濃度明顯降低[25]。起初定位的HCD單倍型位于11號染色體74.5~77.0 Mb[25],后續(xù)研究證明其分子機理為APOB(Apolipoprotein B)基因內,發(fā)生1 299 bp內源性逆轉錄酶病毒LTR的插入(ERV2-1),造成牛APOB蛋白從4 567個氨基酸截短至135個氨基酸[23,26]。APOB基因編碼載脂蛋白B,它是膽固醇和低密度脂蛋白的主要載脂蛋白,突變使其無法實現(xiàn)生理學功能[23,26]。
2.1 缺陷基因的來源 DNA作為遺傳信息載體,在從親代向子代傳遞過程中,并非100%保守,而是以極低概率(2.2×10-9)[27]發(fā)生突變。新產(chǎn)生的突變大多為中性,但也存在有利或有害的突變。根據(jù)群體遺傳學理論,有害突變純合子因繁殖力和生活力下降,會被自然選擇逐漸清除,但在遺傳漂變和選擇搭車效應(即因與有利突變處于密切連鎖狀態(tài),被同時選擇而提高頻率)的作用下,少部分突變在群體中以雜合子形式存在。研究顯示,每個人的基因組中包含約100個使基因喪失功能的有害突變[28],每頭牛攜帶的有害基因數(shù)目與人相近[29]。遺傳缺陷通常指對家畜個體造成嚴重影響的有害突變,表現(xiàn)為身體結構的缺陷或生理功能的障礙。
2.2 缺陷基因的遺傳模式 目前常見的奶牛缺陷基因均受單基因控制,呈常染色體隱性遺傳模式,遵循孟德爾遺傳規(guī)律。1個基因座具有2個等位基因(野生型和缺陷型),缺陷型等位基因的攜帶者表現(xiàn)正常,但攜帶者之間交配,后代1/4概率為缺陷純合子(圖2)。
遺傳缺陷的共同特征是呈家系遺傳,每種缺陷基因均可以追溯到共同祖先。荷斯坦牛常見11種遺傳缺陷的祖先公牛出生在1947年(Mutefoot)到1991年(HCD)(表2)。由于這些共同祖先或其直系后代曾經(jīng)為著名公牛,使遺傳缺陷廣泛擴散。例如,BLAD祖先為出生于1952年的美國公?!癘sborndale Ivanhoe”,在美國基因組數(shù)據(jù)庫中,其子代種公牛達到137頭,孫代種公牛934頭[30]。其兒子“Penstate Ivanhoe Star”(1963年出生)及孫子“Carlin-M Ivanhoe Bell”(1974年出生)均為世界知名公牛,且共同攜帶CVM和BLAD,隨著遺傳物質貿易使缺陷基因廣泛擴散。1999年丹麥荷斯坦牛CVM攜帶率高達31%[12],2003年德國荷斯坦牛CVM攜帶率為13.2%[31];1993年丹麥荷斯坦牛BLAD攜帶率高達21.5%[32],德國為11.6%[33]。
CVM和BLAD 2種遺傳缺陷在20世紀90年代的流行,給世界荷斯坦牛育種敲響警鐘,之后各國開始重視奶牛群體遺傳多樣性。后續(xù)新發(fā)現(xiàn)的遺傳缺陷(BS、HH1-5、HCD),單個基因頻率都并不高(< 5%)(表2)。然而,由于常見缺陷基因有十個之多,奶牛群體的缺陷基因總體攜帶率居高不下。如美國農(nóng)業(yè)部對87萬頭荷斯坦牛統(tǒng)計顯示,26%的奶牛攜帶至少1種常見缺陷基因[30],凸顯了遺傳缺陷基因風險管理的重要性。
定位缺陷基因和挖掘診斷標記是遺傳缺陷研究的關鍵。20世紀90年代,分子標記和基因克隆技術發(fā)展,開啟了奶牛遺傳缺陷基因定位的研究。研究人員最早利用候選基因分析揭示了BLAD[10]和DUMPS[6]的致病機理。采用基于微衛(wèi)星標記的全基因組掃描(Whole-Genome Scan)及位置候選基因分析策略,Mulefoot[8,34]和CVM[12]的分子機理先后被確定。但由于這種經(jīng)典基因定位的技術局限,需要積累多世代樣本和大量分子實驗工作,研究周期往往需要數(shù)年。
2009年之后,?;蚪MSNP芯片面世[3]加速了遺傳缺陷基因定位進程。利用高密度基因組標記,不僅提高了傳統(tǒng)基因定位的效率,還催生了新的定位策略。
3.1 純合定位(Autozygosity Mapping)純合定位是挖掘隱性遺傳疾病的傳統(tǒng)策略,其原理是假設發(fā)病個體(隱性純合子)共享一段相同的染色體純合區(qū)域。Charlier等[14]利用6個發(fā)病個體和15個正常個體的54K芯片數(shù)據(jù),通過純合定位將短脊柱綜合癥(BS)基因鎖定于2.46 Mb染色體區(qū)域,進而利用全基因組測序挖掘出致因突變。
3.2 純合子缺失(Loss of Homozygosity)定位 2011年,VanRaden等[16]最早提出通過檢測純合子缺失來挖掘遺傳缺陷基因。對大規(guī)模奶牛SNP芯片數(shù)據(jù)(荷斯坦牛58 452頭,娟姍牛5 288頭,瑞士褐牛1 991頭)分析發(fā)現(xiàn),一些基因組單倍型片段在群體中頻率很高,但沒有純合子出現(xiàn),說明其純合致死;將這些單倍型片段與奶牛繁殖性狀進行關聯(lián)分析,發(fā)現(xiàn)攜帶者之間交配會顯著降低母牛受胎率,據(jù)此在3個奶牛品種中定位到5種遺傳缺陷單倍型[16]。隨著奶牛基因組選擇技術的廣泛應用和基因組標記數(shù)據(jù)積累,這種檢測哈代溫伯格平衡偏離程度的策略,被證明是挖掘胚胎致死遺傳缺陷的高效方法[21,22,25,35]。
最近幾年,隨著全基因組測序成本降低,加快了從基因定位到確定致因突變的過程。特別是千?;蚪M計劃實施[20],為挖掘致因突變提供了有力基因組數(shù)據(jù)資源,多種新的奶牛遺傳缺陷基因相繼被發(fā)現(xiàn)。
分子標記技術尚未出現(xiàn)之前,判斷公牛是否攜帶遺傳缺陷基因需要測交,將待測公牛與已知攜帶者母?;蛘邤y帶者公牛的女兒交配,從而確定公?;蛐蚚36]。如今,隨著遺傳缺陷的致因突變或連鎖標記被揭示,可以建立分子檢測方法,從而準確判定個體的缺陷基因攜帶狀態(tài)。目前有2種策略,即基于單倍型的檢測和針對突變位點的檢測。
表2 荷斯坦牛常見遺傳缺陷名稱、隱性純合子表型、共同祖先和基因頻率
4.1 單倍型檢測 單倍型檢測是利用基因組SNP信息,通過單倍型分析對缺陷基因等位基因進行推斷[16],其特點是充分利用了奶?;蚪M選擇育種中積累的現(xiàn)成數(shù)據(jù),不需要額外的分子檢測;同時,不論SNP芯片版本和標記密度是否一致,都可以通過基因型填充和單倍型分析,較為準確地推斷各種缺陷基因的狀態(tài)[37]。然而,其本質上是利用缺陷基因突變周邊的標記對缺陷等位基因的間接推斷,準確性受標記連鎖不平衡程度影響。例如對HCD的分析發(fā)現(xiàn),致病單倍型與一個健康單倍型完全一致,必需輔以系譜分析才能推測攜帶狀態(tài)[25]。這反映出單倍型推斷的局限性,故有學者建議對重要種公牛,在單倍型推斷基礎上,仍需要分子檢測驗證[23]。
4.2 直接分子檢測 根據(jù)致因突變類型特點,可以開發(fā)不同檢測方法(表3)。
針對單個位點的分型,經(jīng)典的方法有PCR產(chǎn)物電泳檢測[26,38]、PCR-RFLP[10,21,39]等,使用常規(guī)儀器即可完成檢測,成本較低。但適用性有明顯局限,需設計等位基因特異性引物,或者必需被酶切位點所識別,且需要多個實驗步驟、耗時長。一些基于熒光信號的檢測方法,例如TaqMan探針法[14,40]、高分辨熔解曲線法[23]、KASP方法[41],靈敏性和準確性更高,是當前遺傳變異分型的主流方法;因其在PCR過程中或在PCR之后采集熒光信號即可分型,沒有額外的實驗步驟,故耗時較短。
針對多位點的分型,目前流行的方法是Mass Array核酸質譜分析[19]及微流控芯片[42]。前者通過引物延伸與時間飛行質譜技術結合實現(xiàn)等位基因判型。由于檢測過程需要多重PCR,故對引物設計有較高的要求。后者是SNP分型技術和微流控芯片技術結合的新型檢測手段,將點樣、反應、檢測等基本操作單元集成到一塊微米尺度的芯片上,自動完成分析全過程[42]。最近,該方法被用于對8種常見奶牛遺傳缺陷的分型[43]。
遺傳缺陷所引起的經(jīng)濟損失主要體現(xiàn)在胚胎發(fā)育失敗、新生犢牛死亡以及母牛流產(chǎn)導致的生產(chǎn)性能和利用價值降低等。
5.1 對生產(chǎn)的影響
5.1.1 對母牛繁殖力影響 繁殖力一直是高產(chǎn)奶牛管理和選育的難題。胚胎死亡是繁殖力降低的原因之一。有研究報道1980—2006年,荷斯坦母牛產(chǎn)犢率從55%降低到40%,而早期胚胎死亡發(fā)生的頻率則由28%增長到43%[44]。常見的11種遺傳缺陷中,HH1-5、DUMPS、CVM和BS隱性純合時均導致胚胎死亡,母牛流產(chǎn)。
對美國荷斯坦牛的統(tǒng)計顯示,風險交配(母牛的父親及母牛的與配公牛均為攜帶者)與非風險交配(均為非攜帶者)相比,HH1、HH2、HH3分別導致妊娠率降低3.1%、3.0%、3.2%,死胎率增加0.7%、1.8%、1.0%[16]。法國荷斯坦牛5種遺傳缺陷(HH1、HH3、HH4、BS、CVM)頻率為1.7%~4.6%,風險交配較非風險交配的母牛產(chǎn)犢率降低0.35%~9.89%[21]。德國荷斯坦牛5種遺傳缺陷(HH1-5)在2012—2014年出生母牛中的頻率為0.88%~3.29%,除HH2之外的4種遺傳缺陷,風險交配較非風險交配導致56 d非返情率和90 d非返情率下降1.6%~9.2%,而HH2因頻率較低而統(tǒng)計不顯著[45]。
5.1.2 對犢牛健康影響 CVM和BS缺陷基因純合子除導致胚胎死亡之外,有部分胎兒可以出生,但因骨骼發(fā)育畸形而死亡[12,14]。Mulefoot缺陷基因導致犢牛蹄畸形,出生后立即淘汰[8]。BLAD[10]和HCD[25]分別導致犢牛免疫缺陷和膽固醇代謝缺陷,出生數(shù)周內死亡。
5.1.3 其他影響 一些初步研究發(fā)現(xiàn),DUMPS和HCD缺陷等位基因并非完全隱性,缺陷基因對攜帶者的生化指標有一定影響。DUMPS攜帶者牛的一些組織表現(xiàn)出酶活性降低,導致泌乳牛的乳及尿中4-羧基尿嘧啶(乳清酸)水平升高[46]。HCD攜帶者公牛與純合子公牛相比,血液甘油三酯(TAG)、磷脂(PL)、總膽固醇(TC)顯著低,但沒有出現(xiàn)任何消化不良的臨床癥狀,說明攜帶者有維持膽固醇和脂蛋白生物合成的能力[47]。但在人類上的研究顯示,APOB基因變異導致家族性低β脂蛋白血癥(FHBL),攜帶者雖然一般無癥狀,但更易于出現(xiàn)脂肪肝和腸道吸收不良[48]。因此HCD對奶牛的影響仍有待深入研究。
表3 遺傳缺陷基因的分子檢測方法
5.2 遺傳缺陷基因帶來的經(jīng)濟損失 將胚胎死亡帶來的經(jīng)濟損失量化,來源分2個部分:一是使母牛受孕(人工授精)的成本,二是增加產(chǎn)犢間隔的成本。研究發(fā)現(xiàn),盡管HH1-5均能夠引起胚胎死亡,但所造成的經(jīng)濟損失并不相同,因該基因在妊娠過程中造成胚胎死亡的時間而異,HH1、HH2導致胚胎56~90 d死亡,而HH3、HH4、HH5造成胚胎在56 d前死亡。據(jù)測算,使母牛懷孕的平均成本為15歐元,而妊娠期間母牛每天飼養(yǎng)成本1.3歐元,由此估計HH1和HH2經(jīng)濟損失為97歐元,HH3、HH4和HH5為70歐元[45]。在美國,母牛流產(chǎn)的經(jīng)濟損失測算為200美元/頭,犢牛早期(假設平均21日齡)死亡損失342美元(出生犢牛300美元+每天2美元),據(jù)此估計美國奶牛生產(chǎn)中因常見遺傳缺陷造成的損失為1 074萬美元/年[30]。若加上因母牛流產(chǎn)及犢牛死亡造成的獸醫(yī)治療費用,實際損失會更高。
對缺陷基因的遺傳管理有兩種簡單做法。第一,在配種中完全不考慮遺傳缺陷,這顯然會造成損失,特別是對于母牛小群體,若所用種公牛有限,攜帶者公牛會快速提升群體缺陷基因頻率和經(jīng)濟風險。第二,完全避免使用遺傳缺陷攜帶者公牛,這樣縮小了可用公牛的范圍,使雖攜帶遺傳缺陷基因但綜合遺傳性能很高的公牛沒有得到充分利用,導致遺傳進展降低。對奧地利Fleckvieh牛的研究顯示,如果完全棄用6種遺傳缺陷攜帶者,將導致遺傳進展減少7%,生產(chǎn)效益降低9%[49]。
隨著越來越多的奶牛遺傳缺陷被發(fā)現(xiàn),完全直接淘汰遺傳缺陷攜帶者既不現(xiàn)實也不經(jīng)濟[50],合理做法是充分考慮多個遺傳缺陷基因,通過科學選配降低缺陷基因純合概率,實現(xiàn)效益最大化。
對于單個缺陷基因的管理,行之有效的辦法是避免攜帶者交配,從而控制因風險交配而產(chǎn)生缺陷基因純合子。針對多個缺陷基因,相關學者提出2種新策略。一種是用遺傳指數(shù)(Genetic Index,GI)來選擇母牛,其中所考慮的遺傳特征既包括缺陷基因也包括有利基因(如無角),GI綜合了各個遺傳特征的基因型、等位基因頻率和經(jīng)濟加權;而對公牛一方,仍根據(jù)綜合育種值來選擇,以保持較快的群體選擇進展[45]。另一種是兼顧近交和遺傳缺陷基因的選配策略,即針對任何一個交配組合,估計后代育種值為雙親育種值的均值(Parent Average,PA)減去近交罰分及遺傳缺陷罰分[37];該策略綜合考慮多基因效應、近交及遺傳缺陷基因型,理論上更合理。
世界范圍內,以奶牛為引領的動物育種產(chǎn)業(yè)已進入基因組選擇時代,遺傳改良速率實現(xiàn)前所未有的提高,動物生產(chǎn)性能將繼續(xù)提升。同時,基因組學及功能基因組學的深入發(fā)展,反向遺傳學、表觀遺傳學、基因編輯技術方興未艾,將使人們能夠準確、快速鑒定出更多有害突變。這不僅有助于理解生物的基因組進化和重要表型遺傳機制,還為選育更健康的動物提供了可能。此外,在基于基因組信息的選種和選配策略中,如何優(yōu)化考慮多基因效應和少數(shù)遺傳缺陷有害基因及有利基因(如酪蛋白基因、無角基因),將是今后奶牛遺傳缺陷基因應用研究的重要領域。