葉 健,周 梅,王 靜 ,徐成良 ,王重龍*
(1.安徽省農(nóng)業(yè)科學(xué)院畜牧獸醫(yī)研究所,豬分子數(shù)量遺傳學(xué)安徽省農(nóng)業(yè)科學(xué)院重點實驗室,畜禽產(chǎn)品安全工程安徽省重點實驗室,安徽合肥 230031;2.農(nóng)業(yè)農(nóng)村部豬肉質(zhì)量安全控制重點實驗室,安徽亳州 236700;3.溫氏食品集團股份有限公司,廣東新興 527400)
跨群體遺傳評估指聯(lián)合處于不同地理位置或不同亞群的動物,利用表型、系譜或基因型等信息對合并群體進行聯(lián)合評估,提高選擇準(zhǔn)確性和選擇強度,最終達到提高遺傳進展的目的。在豬育種中,由于受到資金、土地、環(huán)保、疫病、生產(chǎn)模式和生產(chǎn)管理水平等因素影響,單場飼養(yǎng)動物群體規(guī)模受到限制。由于單場規(guī)模的限制,針對單一群體的育種工作,常會面臨選擇強度較低、群體變異較小等問題,使得此類種豬群體遺傳進展較慢,育種基礎(chǔ)逐漸變窄。因此,探索不同群體或亞群之間的聯(lián)合遺傳評估,促進種豬育種單位之間的遺傳交流,有利于整體育種效率的提升。
當(dāng)前全球的種豬育種模式,一類是以跨國育種公司為主導(dǎo),該類公司將其育種核心群全球布局;另一類是中小企業(yè)或家庭農(nóng)場的聯(lián)合育種,這種模式一般是以國家或者行業(yè)協(xié)會為主導(dǎo)。在我國,這兩種模式處于并行發(fā)展的階段[1],前者以溫氏種豬公司為例,無論是其育種技術(shù)的研發(fā)和應(yīng)用,還是其育種核心群體的布局和建設(shè),都處于行業(yè)領(lǐng)先水平;后者以中小企業(yè)為主,通過遴選國家級生豬核心育種場實現(xiàn)全國或區(qū)域聯(lián)合育種,擴大了核心母豬群體,使得整體遺傳聯(lián)系和表型進展得以快速提升[2]。
在種豬遺傳評估中,如何聯(lián)合不同群體或亞群進行遺傳分析,是大公司以及中小企業(yè)在育種工作中共同面臨的問題;加之非洲豬瘟影響,會促進育種核心群的分點布局。因此,如何利用好跨群體遺傳評估,是一項重要的研究內(nèi)容,而群體間遺傳聯(lián)系是跨群體聯(lián)合遺傳評估的基礎(chǔ)。本文綜述了當(dāng)前應(yīng)用較多的基于表型和系譜信息的評價群體遺傳聯(lián)系的方法,介紹了基于基因組信息來評價基因組遺傳聯(lián)系的方法,并闡述了不同評價方法在奶牛和豬育種中的應(yīng)用,以期為推動聯(lián)合遺傳評估提供參考。
1.1 基于表型和系譜信息 不同種豬群體之間的關(guān)聯(lián)度的大小是評價能否聯(lián)合遺傳分析的基礎(chǔ),關(guān)聯(lián)度影響各場個體估計育種值比較的準(zhǔn)確性。用預(yù)測誤差方差(Prediction Error Variance of Difference,PEVD)評價不同場或群體組關(guān)聯(lián)性是理想的度量方法,不同場之間通過比較所有個體兩兩配對的平均預(yù)測誤差方差來表示,計算公式(1):
但是,在大規(guī)模的遺傳評估計劃中,可能是2 個場的大量個體進行配對,也可能有數(shù)個場之間的個體進行兩兩比對,這樣計算非常耗時。
目前常用關(guān)聯(lián)率(Connectedness Rating,CR)來度量,其利用混合線性模型,將場效應(yīng)設(shè)置為固定效應(yīng),計算場效應(yīng)估計值的方差和協(xié)方差,并利用公式(2)來計算:
其中,Var(hi),Var(hj)和cov(hij)分別是相應(yīng)場效應(yīng)的方差和協(xié)方差。
Kennedy 等[3]的模擬研究表明,CR 計算結(jié)果和PEVD 之間的相關(guān)程度達到0.995,原因可能是對于每個配對比較來說,個體EBV 差異的預(yù)測誤差方差(PEV)可以分為2 部分。一部分與個體本身及其親屬有關(guān),這部分取決于每個EBV 的PEV,2 個個體的相關(guān)程度和個體與場效應(yīng)之間的協(xié)方差;另一部分與場效應(yīng)本身有關(guān),包括場效應(yīng)估計值的方差和不同場效應(yīng)間的協(xié)方差。計算2 個場個體的PEVD 時,第一部分個體本身及其親屬有關(guān)的部分,在所有配對進行平均后會相互抵消;第二部分中與場效應(yīng)有關(guān)的部分是相同的,所以PEVD 近似等于2 個場效應(yīng)的估計值的PEV,即場間關(guān)聯(lián)率[4]。
有研究表明,隨著場間關(guān)聯(lián)率的提升,場間EBV比較的誤差方差逐漸降低,在關(guān)聯(lián)率達到3%時,誤差方差達到0.5 左右[5]。不同群體間聯(lián)合遺傳評估需要的關(guān)聯(lián)水平取決于場或同期組的大小、顯著水平、需要檢測出的EBV 平均差異值以及殘差方差,樣本含量越大,相同的檢測差異比例、需要的關(guān)聯(lián)率水平越低;且隨著樣本含量的上升,CR 的大小越來越依賴于遺傳聯(lián)系[4]。
2.2 基于基因組信息 近年來,以基因組選擇技術(shù)為代表的分子育種技術(shù)在豬育種中逐步應(yīng)用,該技術(shù)利用覆蓋全基因組的遺傳標(biāo)記,將標(biāo)記信息與表型信息建立關(guān)聯(lián),以此來實現(xiàn)對個體種用價值進行更加準(zhǔn)確地評定。在聯(lián)合遺傳評估中,利用基因組信息,也將能夠更加準(zhǔn)確和及時地評估不同群體或不同亞群之間的遺傳聯(lián)系。
基于單核苷酸多態(tài)(SNP)標(biāo)記信息的基因組聯(lián)合育種,其準(zhǔn)確性依賴于與數(shù)量性狀基因座(QTL)或致因突變位點(QTN)處于連鎖不平衡(LD)的標(biāo)記位點在不同群體中連鎖模式存在相似性。參考群與驗證群遺傳聯(lián)系越緊密,參考群遺傳標(biāo)記的估計效應(yīng)在驗證群中使用,育種值估計的準(zhǔn)確性越高[6]。評估群體之間的遺傳相似性有多種方法:
不同群體之間相同標(biāo)記的LD 之間的相關(guān)性,可用來評估群體間的遺傳相似性,以此來從側(cè)面反映不同群體聯(lián)合遺傳評估EBV 準(zhǔn)確性的高低。也可根據(jù)標(biāo)記之間LD 衰減的特征,來評估群體之間聯(lián)合遺傳評估所需的最少標(biāo)記數(shù)[7]。處于同一染色體2 個標(biāo)記位點之間的LD 水平,常用r 來表示[8],計算公式(3):
其中,pA1B1是基因座A 上等位基因1 和基因座B 上等位基因1 同時出現(xiàn)的頻率,pA1是基因組A 上等位基因1 出現(xiàn)的頻率。
另外,在群體遺傳學(xué)中,評價不同群體之間的遺傳聯(lián)系,常用的表達方式還有主成分分析(PCA)、進化分析(系統(tǒng)發(fā)生樹)和admixture 分析(structure 圖)。此外,也可通過比較Fst指數(shù)來評價群體的分化程度,來間接反映群體之間的親緣關(guān)系。
PCA 的思想是將數(shù)據(jù)的n 維特征映射到k 維上(k<n),k 維是全新的正交特征,以此來達到減少特征數(shù)、減少冗余和減少過渡擬合的目的,一般用影響最大的因素PC1 和PC2 做二維圖形,直觀展示群體之間的遺傳聯(lián)系,如圖1 所示[9]。系統(tǒng)發(fā)生樹用以反映具有共同祖先的各物種相互間的演化關(guān)系,在樹形結(jié)構(gòu)中,其用枝長的累計距離來反映樣本差異的大小,如圖2 所示[10]。Structure 圖(圖3)能夠反映不同群體之間遺傳物質(zhì)的交流情況[11],該方法將群體預(yù)分為若干個亞群,并假設(shè)各個亞群內(nèi)部應(yīng)該符合哈代-溫伯格平衡,且采用貝葉斯算法,對每個模擬的分組值產(chǎn)生一個最大似然值,該值越大,說明對應(yīng)的分組值越接近真實群體的情況。當(dāng)分組值不斷增加,會出現(xiàn)一個飽和的最大似然值,該點對應(yīng)的分組值所生成的圖即為最合適的模擬圖。Fst指數(shù)利用種群期望雜合度和亞群預(yù)計雜合度,來計算反映群體的基因雜合性水平,以此來衡量種群分化程度。
在跨群體基因組選擇研究中,上述指標(biāo)常作為定性的指標(biāo)加以利用,用以反映和比較群體之間的混雜程度。如對墨西哥奶牛群體的研究表明,不同生產(chǎn)系統(tǒng)的奶牛有共同的祖先,但存在不同的遺傳特性[12];此外,在對不同來源奶牛群體的育種值進行聯(lián)合遺傳評估中,通過比較不同聯(lián)合群體的LD 相關(guān)和主成分,解釋了不同群體構(gòu)成育種值估計準(zhǔn)確性差異的原因[13]。
為了更加清晰跨群體遺傳評估的應(yīng)用和研究現(xiàn)狀,下文以跨群體聯(lián)合遺傳評估較多的奶牛群體為例,闡述當(dāng)前奶牛聯(lián)合育種的進展,并以此為參照,探討聯(lián)合育種在豬育種中的應(yīng)用前景,為下一步研究指明方向。
2.1 奶牛 在奶牛育種中,主導(dǎo)的奶牛品種是荷斯坦牛,又由于該奶牛的主選性狀均集中在產(chǎn)奶量和乳成分上,因此,在基于該品種及其相似性狀的選育上,主要的聯(lián)合育種策略是聯(lián)合組建大規(guī)模的參考群體,利用該群體能夠?qū)?biāo)記效應(yīng)進行更加準(zhǔn)確的估計,當(dāng)前較為成功的是美國-加拿大以及歐洲奶牛聯(lián)合育種[14]。在其他奶牛品種,如西門塔爾牛和瑞士褐牛的遺傳改良中,也在借鑒荷斯坦奶牛聯(lián)合育種的做法,通過聯(lián)合不同國家相同品種的參考群來提高基因組選擇的準(zhǔn)確性。該策略已然成為聯(lián)合遺傳評估的主流方法[15]。
在聯(lián)合不同群體構(gòu)建參考群的過程中,聯(lián)合基因組育種值評估準(zhǔn)確性差異的原因也是較多研究的對象。如前所述的LD 之間的相關(guān)、PCA 和admixture 分析等,是主要的研究方法。有研究分析了法國、美國和中國參考群體之間兩兩聯(lián)合遺傳分析,育種值評估準(zhǔn)確性差異的原因,結(jié)果顯示法國和美國群體聯(lián)合分析有較高的準(zhǔn)確性,而與中國群體聯(lián)合分析,準(zhǔn)確性偏低,原因是法國和美國群體相同位點LD 值相關(guān)性更大,PCA 聚類更加緊密[13];此外,針對墨西哥奶牛群體的遺傳分析表明,該奶牛群體遺傳背景與引進的加拿大和美國奶牛群體存在遺傳交流[16]。
另外,針對不同品種的跨群體遺傳評估,也有相關(guān)報道。De Roos 等[7]研究分析了不同奶牛群體間的連鎖不平衡程度,以荷斯坦奶牛和娟珊牛為例,至少300K的標(biāo)記位點才能夠滿足聯(lián)合遺傳評估的需要;Pryce 等[16]評估了聯(lián)合3 個品種牛與單一品種牛育種值估計的差異,結(jié)果表明不同品種聯(lián)合構(gòu)建參考群,育種值估計的準(zhǔn)確性更高。無論是不同品種還是品系,基于單核苷酸多態(tài)(SNP)的跨群體聯(lián)合遺傳評估,單一群體與不同群體之間親緣關(guān)系的遠近,其本質(zhì)在于QTL 的效應(yīng)在不同群體之間的相似性以及與其連鎖的SNP 的LD 水平,SNP 在不同群體的多態(tài)性也是影響聯(lián)合遺傳分析的因素之一[15]。因此,在跨群體聯(lián)合遺傳評估之前,需要更多關(guān)注群體結(jié)構(gòu)和目標(biāo)性狀的遺傳特性,這樣才能夠更有方向性,保證結(jié)果的可信度和可應(yīng)用性。
2.2 豬 由奶牛聯(lián)合遺傳評估的研究和應(yīng)用進展可知,聯(lián)合構(gòu)建參考群是其跨群體遺傳評估的主要方式,并結(jié)合群體遺傳學(xué)手段(如LD、PCA 和進化分析等)來輔助評估育種值估計的差異性,豬聯(lián)合育種也可以借鑒這種方式。然而在豬育種中,金字塔式的育種體系和多品種多品系多目標(biāo)性狀的特點給豬聯(lián)合育種帶來更大的復(fù)雜性。
我國當(dāng)前開展的種豬聯(lián)合育種工作,場間聯(lián)系性的評價指標(biāo)為場間關(guān)聯(lián)率,通過全國以及區(qū)域水平核心種豬場育種水平的提升以及場與場之間的遺傳交流的開展,聯(lián)合育種取得了一些成績,部分場之間已經(jīng)達到聯(lián)合遺傳評估的要求[2,17]。然而,基于基因組信息的聯(lián)合育種工作才剛剛起步,2017 年,我國啟動了基因組選擇聯(lián)合育種計劃,以期通過利用基因組水平的分子標(biāo)記信息,將能夠更加準(zhǔn)確和及時地評估不同群體或亞群之間的遺傳聯(lián)系,助推聯(lián)合遺傳評估工作的開展,提升種豬水平。
在我國種豬跨群體基因組聯(lián)合遺傳評估中,目前主要研究對象是不同公司相似來源背景的種豬群體。有研究以北京周邊三家養(yǎng)豬公司的大白豬群體為研究對象,結(jié)果顯示在系譜間關(guān)聯(lián)較少的情況下,多場基因組聯(lián)合遺傳評估育種值估計的準(zhǔn)確性高于單場,并克服了場間常規(guī)遺傳評估育種值無法比較等缺點[18]??梢娫谪i中,借鑒了許多奶牛聯(lián)合遺傳評估構(gòu)建混合參考群的做法。此外,結(jié)合豬育種特點,采用雜交群體構(gòu)建基因組選擇參考群體,以此來對純種群體進行選擇[19];或以純種群體構(gòu)建的參考群預(yù)測雜交群體[20]?;蛲ㄟ^分析不同地理位置和飼養(yǎng)管理環(huán)境下基因組與環(huán)境的互作,以此對參考群構(gòu)成進行優(yōu)化,這些研究都有利于更好的開展豬的跨群體聯(lián)合遺傳評估。
在豬育種中,存在許多跨群體聯(lián)合遺傳評估的問題,如雜交群體信息的利用、降低核心群到商品群的遺傳滯后性和不同品系間進行聯(lián)合遺傳評估等,利用基因組信息為解決這些問題提供了更好的手段。