李 恒,字向東
(西南民族大學動物科學國家民委重點實驗室,四川成都 610041)
山羊(Capra hircus)是最古老的家養(yǎng)動物之一,起源于扎格羅斯山脈附近(伊朗地區(qū)),馴化時間大約是一萬年前的新石器時代[1],此時人類生活方式由狩獵轉(zhuǎn)向農(nóng)耕[2],山羊能為人類提供穩(wěn)定的肉、奶、毛皮等生活物資,逐漸在經(jīng)濟、文化、宗教上與人類文明建立起密切的關系[3]。隨著人類的遷移和商業(yè)貿(mào)易,山羊迅速傳播到世界各地。根據(jù)聯(lián)合國糧農(nóng)組織統(tǒng)計,全世界有超過579 個山羊品種,山羊存欄量10 億只,中國和印度的山羊共占世界存欄量的32%。
基因組學是解析生物表型變異和遺傳基礎的重要學科,可對生物基因序列進行定位與功能分析[4]。全基因組測序是研究該學科的重要手段,主要集中在從頭組裝測序和重測序2 個方面。其中,重測序手段最為常見,可對已知基因組序列物種的個體或群體進行表型變異分析[5]。為實現(xiàn)早期選擇,降低育種成本,加速山羊的改良進程,本文總結(jié)了山羊全基因組測序相關理論成果,旨在為后續(xù)山羊功能基因組學研究提供基礎資料,為山羊分子育種工作提供新視角。
2013 年,Dong 等[6]利用新一代測序、全基因組酶切圖譜等技術對云南黑山羊進行深度測序,從頭組裝了首個山羊參考基因組序列CHIR_1.0,完成基因組的結(jié)構(gòu)和功能注釋工作,其中Contig N50 為18 720 bp,Scaffoled N50 為16.3 Mb。2014 年,Du 等[7]利用輻射雜交圖譜等數(shù)據(jù)對CHIR_1.0 進行優(yōu)化,獲得了更準確、更完整的山羊參考基因組 CHIR_2.0(表1)。2015 年,Dong 等[8]又對伊朗野山羊(Capra aegagrus,bezoar)從頭組裝測序,構(gòu)建了野山羊的參考基因組,并家養(yǎng)山羊代表品種的重測序數(shù)據(jù)分析進行比較,發(fā)現(xiàn)毛色相關基因ASIP存在拷貝數(shù)變異(拷貝數(shù)越高,毛色越淺),CACNA1C與HTR3A基因分別在野山羊和家山羊中快速進化,行為變化由警覺到溫順,推測與馴化有關。2017 年,隨著三代測序技術的逐漸成熟,BickHart 等[9]結(jié)合二代 Illumina、三代 Pacbio 單分子測序、光學圖譜BioNano 和Hi-C 等技術對圣克利門蒂山羊進行從頭組裝,獲得了僅含663 個空白序列的高質(zhì)量山羊基因組精細圖譜ARS1。與之前的組裝版本CHIR_1.0 和CHIR_2.0 相比,ARS1 完善組裝了高度重復的著絲粒和端粒區(qū)域,解決了超過1 kb 的重復結(jié)構(gòu),不僅為山羊的基因組表型分析提供高質(zhì)量的遺傳信息,也為其他物種基因組的裝配提供參考。
表1 山羊不同版本的參考基因組比較
2.1 生理特征 山羊的馴化是多起源的[10-11]。馴化后的山羊隨著人類活動快速擴散并成功適應不同生態(tài)地區(qū),極具地域特色。如生存在炎熱沙漠地區(qū)的Draa 山羊頻繁喘息,為解釋這一現(xiàn)象,Benjelloun 等[12]對Black、Draa 和Northern 3 個種群共36 只山羊全基因組掃描分析,在Draa 山羊群體中發(fā)現(xiàn)呼吸系統(tǒng)調(diào)節(jié)和氣體交換類別的GO 條目富集,可能與Draa 山羊利用喘氣散熱有關。西藏絨山羊可在高寒缺氧的惡劣生存環(huán)境中生存繁衍,為闡釋其表型適應的遺傳機制,Song 等[13]對330 只絨山羊外顯子進行測序分析,結(jié)果表明,EPAS1、PTPRJ、DSG3等心血管系統(tǒng)相關基因可能在高海拔適應性中發(fā)揮重要作用。后續(xù)針對低海拔和高海拔山羊種群的DSG3基因16 個外顯子重測序分析也佐證了這一觀點[14]。也有研究發(fā)現(xiàn),CDK2、SOCS2、NOXA1、ENPEP基因也與高海拔適應性密切相關[15]。土著山羊雖生產(chǎn)性能較低,但對當?shù)貝毫拥纳姝h(huán)境或特定的疾病具有耐受性。據(jù)報道,烏干達本土山羊增強自身免疫能力以抵御非洲熱帶環(huán)境中寄生蟲的感染[16];韓國本地山羊群體中發(fā)現(xiàn)了抗腰麻痹病基因(CCR3、CLNK、HM13、IGSF10、ROBO1)和抗沙門桿菌及革蘭氏陰性菌基因(NTMLBP、BPI)[17-18]。這些遺傳標記均是山羊種質(zhì)保護的重要遺傳資源,為山羊品種改良及育種計劃提供了重要基礎。
2.2 羊絨性狀 山羊絨素有軟黃金之稱,其價值由顏色、長度、細度和產(chǎn)量決定。羊絨顏色是單基因控制的質(zhì)量性狀,但其長度、直徑與產(chǎn)量都屬于多基因控制的數(shù)量性狀。因此,探明羊絨性狀的遺傳機制難度較大。
Wang 等[15]對8 個不同地區(qū)的家養(yǎng)山羊品種(太行黑山羊、藏山羊、內(nèi)蒙古絨山羊、陜北絨山羊、安哥拉山羊、波爾山羊、嶗山奶山羊和貴州小山羊)進行表型分析時,鑒定了羊絨性狀候選基因LHX2、FGF9與WNT2。Li 等[19]在80 個絨山羊個體中也掃描到FGF5、ROCK1、PRKCD、SGK3等多個羊絨性狀的候選基因。絨由山羊的次級毛囊產(chǎn)生,LHX2基因調(diào)控毛發(fā)產(chǎn)生與再生[20],其循環(huán)表達參與山羊次級毛囊的發(fā)育[21];FGF9 能夠促進毛囊損傷后的再生[22];WNT2參與毛囊的啟動[23];ROCK在調(diào)節(jié)人角質(zhì)細胞的增殖和終末分化[24-25],這些基因均可能是調(diào)控羊絨周期生長的關鍵基因。白絨因具有極大的可染性被視為最珍貴的羊絨,因此,白色被毛顏色基因MC1R和調(diào)節(jié)毛發(fā)長度的基因FGF5[26]與絨山羊的選擇目的(白色和長纖維)一致。Zhang 等[27]實驗表明,PRDM6基因可能與羊絨性狀有關,但因基因組測序的樣本量過小,該基因未得到明確的功能注釋。此外,66K SNP 捕獲芯片雖在內(nèi)蒙古絨山羊(二狼山型)群體中篩選出AKT1、ALX4、HK1和NT-34 個絨毛細度性狀的候選基因[28]。但目前商業(yè)化山羊SNP 芯片均是基于少數(shù)幾個品種全基因組測序數(shù)據(jù)設計而成,并不適配所有山羊品種。因此,全基因組測序研究的不斷深入有利于商業(yè)化SNP 芯片的設計,從而提高山羊性狀全基因組關聯(lián)分析結(jié)果的準確性。
為加速高產(chǎn)絨山羊品種選育進程,吳海青等[29]在同一群體中選擇高產(chǎn)絨量(>1 000 g)和低產(chǎn)絨量(<480 g)的母羊各3 只進行基因組重測序,選擇性消除分析高產(chǎn)組和低產(chǎn)組的全基因組數(shù)據(jù)發(fā)現(xiàn),CUL1、FBXL3、YY1和EZH2基因參與調(diào)控絨山羊次級毛囊發(fā)育的重要信號通路。
羊絨品質(zhì)直接受遺傳因素影響,不同品種的羊絨品質(zhì)差異極顯著[30]。除遺傳因素調(diào)控外,環(huán)境和營養(yǎng)對羊絨的品質(zhì)和產(chǎn)量影響顯著[31-32]。上述研究加深了人們對羊絨性狀的了解,但并未完全解析羊絨性狀的遺傳基礎。因此,對受外界因素影響的絨山羊次級毛囊進行轉(zhuǎn)錄組分析可能是強有力的手段[33-34]。蛋白質(zhì)是生物體內(nèi)生理功能的執(zhí)行者,毛囊以及皮膚中微環(huán)境對絨毛的生長發(fā)育、凋亡至關重要。利用蛋白組學了解毛囊生長周期相關的功能蛋白對絨毛的性狀、產(chǎn)量和質(zhì)量的調(diào)節(jié)也具有十分重要的意義[35]。
2.3 繁殖性狀 繁殖特征是山羊產(chǎn)業(yè)重要的經(jīng)濟指標。山羊的繁殖性狀是多基因和多因素共同調(diào)控的數(shù)量性狀,遺傳力較低,采用傳統(tǒng)的育種技術很難對其改良。目前我國只有濟寧青山羊、大足黑山羊、川中黑山羊等少數(shù)幾個高繁殖力山羊品種,探明山羊繁殖性狀的遺傳機理對山羊的分子育種具有理論指導意義。
近年來雖然已發(fā)現(xiàn)較多與繁殖相關的候選基因,但山羊的繁殖力研究未取得突破性進展。其原因可能是山羊繁殖性狀涉及多個基因、位點的相互作用[36]。因此,利用全基因組測序技術分析多基因與多位點對繁殖性狀的調(diào)控作用尤為必要。Lai 等[37]分別對嶗山奶山羊高、低繁殖力的2 個極端種群進行基因組重測序,分別鑒定12 458 711 和12 423 128 個SNP,CCNB2、AR、ADCY1、DNMT3B、SMAD2、AMHR2、ERBB2、FGFR1、MAP3K12和THEM4在高繁殖力組中被特異性選擇,KDM6A、TENM1、SWI5和CYM在低繁殖力組中被特異性選擇。Lai 等[37]還認為基因外顯子區(qū)域SNP 可能對山羊產(chǎn)羔數(shù)至關重要,統(tǒng)計分析非同義突變的同源SNP 發(fā)現(xiàn)高繁殖力組中僅鑒定出SETDB2基因c.C1540T 非同義突變,且該突變可能由人工選擇壓力導致;2 組共有候選基因的多個非同義SNP 在群體間具有較強的遺傳分化,如低繁殖力組CD3D基因中c.A65G,高繁殖力組CDH26基因中c.A1063G、c.G1035A、c.T1034C,以及EML1基因c.G560A 突變,均可能在奶山羊繁殖力調(diào)控中發(fā)揮重要作用。也有研究表明,基因表達調(diào)控的轉(zhuǎn)錄起始位點(TSSs)周圍SNP 分布和基因組拷貝數(shù)變異(CNVs)也可能影響嶗山奶山羊產(chǎn)羔數(shù)[38-39]。
以大足黑山羊為實驗動物,在第3 胎產(chǎn)羔數(shù)的基礎上,分別構(gòu)建高產(chǎn)山羊群體(產(chǎn)羔3~5 只)和低產(chǎn)山羊群體(產(chǎn)羔1~2 只)基因組混池,通過混池重測序掃描山羊重要基因組區(qū)域及與產(chǎn)羔數(shù)相關的候選基因,共鑒定96 個候選基因,包括NR6A1、STK3、IGF2BP2、AR、HMGA2、NPTX1、ANKRD17、DPYD、CLRB、PPP3CA、PLCB1、STK3和HMGA2,通過信號通路的功能分類與注釋對候選基因進行分析發(fā)現(xiàn),一些新的候選基因富集在生殖相關的通路中,如雌激素信號通路和卵母細胞減數(shù)分裂[40]。Wang 等[41]對濟寧青山羊群體按第1 胎產(chǎn)羔數(shù)1、2、3 只分成3 組進行全基因組掃描,具有最高選擇特征的候選基因雙羔組為KIT、KCNH7、KMT2E,3 羔組為PAK1、PRKAA1、SMAD9,同時,在細胞程序性死亡參與細胞發(fā)育的功能條目和胰島素受體調(diào)控的通路中,42 個候選基因的表達最為豐富,其中還包括類固醇代謝過程的生殖相關通路和激素刺激的細胞反應。這些候選基因涉及到山羊產(chǎn)羔數(shù)的調(diào)節(jié),多個基因富集在雌激素信號通路和類固醇代謝過程的生殖相關通路中,暗示激素參與調(diào)節(jié)山羊產(chǎn)羔數(shù)的重要性。這些候選基因的發(fā)現(xiàn)拓展了人們對繁殖力遺傳基礎的認識,為繁殖性狀的研究提供重要線索。
山羊的季節(jié)性繁殖雖沒有綿羊明顯,但發(fā)情配種也多集中在秋季。光照信息通過視覺接收后經(jīng)視交叉上核傳入松果體,調(diào)節(jié)松果體褪黑素的分泌[42-44]。褪黑素調(diào)控下丘腦-垂體-性腺軸調(diào)節(jié)促卵泡素(FSH)和促黃體素(LH)等激素的釋放,從而影響配子的發(fā)生與性腺生殖激素分泌[45-46]。因此,季節(jié)性光照是決定山羊季節(jié)性繁殖活動的重要因素。管代祿[47]對年光照時間差異極顯著的大足黑山羊(1 279 h)與內(nèi)蒙古絨山羊(3 000~3 400 h)進行全基因組測序,篩選到光感受活性和藍光感受活性的關鍵基因BIRC6可能是調(diào)控山羊季節(jié)性繁殖的關鍵基因。下丘腦是調(diào)控動物季節(jié)性繁殖的關鍵部位,不同光照時長條件下的山羊下丘腦轉(zhuǎn)錄組中差異表達基因TACR1、TACR2、TACR3在山羊季節(jié)性繁殖活動中可能發(fā)揮重要作用[48]。
Guo 等[49]利用比較種群基因組學在多胎美姑黑山羊群體中發(fā)現(xiàn)的基因KHDRBS2;Berihulay 等[50]在埃塞俄比亞本地山羊群體基因組數(shù)據(jù)掃描到強選擇信號基因CAMK2D、KANK4 NIN、RSPH6A和UGT2A2;努比亞山羊、隆林山羊和努隆雜交山羊F1代家系的表型差異基因ADAM2、ADAM18、AZIN2和RAN[51],均在山羊的繁殖過程中發(fā)揮重要作用。SRD5A2、MSMB、STAR和3BHSD等基因以及多個miRNA 在卵巢中的高表達與金堂黑山羊的多羔性狀相關[52-53]。
綜上,山羊高繁性狀調(diào)控基因的高通量測序挖掘雖取得較大進展,但并未找其主效基因。筆者認為其原因是山羊的繁殖性狀由多個主效基因共同調(diào)控,各主效基因間可能存在平行或者互作關系。因此,山羊繁殖性狀的候選基因調(diào)控網(wǎng)絡的構(gòu)建,仍有待基因組測序工作的深入挖掘。
2.4 產(chǎn)肉性狀與產(chǎn)奶性狀 隨著人們生活水平的提高,纖維細嫩、營養(yǎng)豐富、風味獨特的羊肉逐漸受到人們的喜愛。山羊的產(chǎn)肉性狀是重要的經(jīng)濟性狀。Zhang 等[27]對不同用途的品種山羊(雷州山羊、薩能奶山羊和遼寧絨山羊)進行全基因組測序,發(fā)現(xiàn)在肉用山羊群體中強選擇信號基因(HMGXB3、SLC26A2、HITA1、SLC35A3、LPR4等)。除部分基因參與山羊的體型大小和骨骼發(fā)育[54],剩余基因具體功能還需進一步探明,可能與參考山羊基因組功能和結(jié)構(gòu)并未完全注釋有關,但這些基因也為肉用山羊的經(jīng)濟性狀研究提供了新思路。TGF4、ACACA、LPL基因是努比亞山羊的產(chǎn)肉性狀的關鍵調(diào)控基因[51]。之前研究表明,TGF4基因與西門塔爾牛的屠宰率和凈肉率性狀顯著相關[55],ACACA是反芻動物肌肉沉積的主要因素,其表達水平與總脂肪酸和反式脂肪酸呈正相關[56],LPL基因編碼甘油三酯水解為游離脂肪酸的關鍵酶。TGF4、ACACA和LPL基因可能分別在努比亞山羊的產(chǎn)肉率、肉品質(zhì)和風味方面發(fā)揮重要作用。
奶是人類膳食中一種重要的蛋白來源,其含有豐富的營養(yǎng)成分與生物活性物質(zhì),對新生哺乳動物的健康成長至關重要。乳脂、乳蛋白是衡量產(chǎn)奶性狀的重要指標。瑪哈巴[57]初步鑒定5 個調(diào)控山羊產(chǎn)奶性狀的候選基因,后續(xù)利用這些基因的保守SNP 位點擴群驗證,與產(chǎn)奶量關聯(lián)分析的結(jié)果提示EIF4G1、VPS13C均可能是調(diào)控山羊產(chǎn)奶性狀的關鍵基因,且EIF4G1基因中g.9003G>A 位點有望作為奶山羊高產(chǎn)量的分子遺傳標記。也有研究發(fā)現(xiàn),RPL3、VPS13C等基因?qū)λ_能奶山羊的泌乳至關重要[27]。
迄今為止,肉用山羊與奶山羊群體的全基因組測序研究較少,需進一步深入。蛋白組學、轉(zhuǎn)錄組學分析技術的應用,也有利于山羊產(chǎn)肉、產(chǎn)奶性狀功能基因的挖掘與定位[58-61]。
目前,基因組測序工作雖可深層次揭示山羊基因組蘊藏的遺傳信息,加深人們對山羊基因組和功能關系的認識,但部分工作仍有待推進:①山羊參考基因組需繼續(xù)完善;②消除假陽性信號、精確鑒定山羊性狀調(diào)控基因的大樣本深度測序工作有待進行;③基于基因組測序已公布的SNP 位點和候選基因等遺傳標記應用于山羊奶、肉品質(zhì)的改良等品種培育工作,還需不斷實踐驗證;④為闡明山羊性狀的復雜遺傳機制,以全基因組測序為基礎,多組學協(xié)同構(gòu)建和完善“突變-基因-表達-蛋白”生物過程的工作有待開展。多組學時代下的生命科學研究,全基因組測序不僅是探究生物表型變異的技術手段,更是多組學協(xié)同闡釋遺傳變異機理工作的基石??煽紤]大規(guī)模深入開展全基因組測序研究,從而發(fā)揮其基石作用,加速山羊分子育種進程。