許靜漪,徐昊祺,胡麗蓉,張 帆,高 清,羅漢鵬,張海亮,師 睿,李 想,劉 林,郭 剛,王雅春*
(1.中國農(nóng)業(yè)大學動物科學技術學院 農(nóng)業(yè)農(nóng)村部動物遺傳育種與繁殖(家畜)重點實驗室,畜禽育種國家工程實驗室,北京100193; 2.新疆農(nóng)業(yè)大學動物科學學院,烏魯木齊 830052;3.北京奶牛中心,北京 100194; 4.北京首農(nóng)畜牧發(fā)展有限公司,北京 100029)
奶業(yè)是健康中國、強壯民族不可或缺的產(chǎn)業(yè),中國不僅是世界牛奶產(chǎn)量第三大經(jīng)濟體,而且也已經(jīng)成長為世界第一大乳制品進口貿(mào)易國[1]。為了滿足消費者對牛奶及乳制品的需求,在過去的幾十年間,奶牛育種者們對奶牛的產(chǎn)奶性能進行了大幅度的選育,但也導致了繁殖力、抗病力的下降,嚴重阻礙了奶業(yè)的可持續(xù)發(fā)展。隨著平衡育種理念廣泛應用于實際選育,越來越多的性狀,如繁殖、長壽等功能性狀得到了育種工作者和牧場生產(chǎn)經(jīng)營者的關注。
本課題組前期對中國荷斯坦牛的多項繁殖性狀進行了全基因組關聯(lián)分析(genome-wide association study,GWAS),獲得了一系列的候選基因。通過蛋白互作網(wǎng)絡(protein-protein interaction networks,PPI)分析,發(fā)現(xiàn)MET(MET proto-oncogene, receptor tyrosine kinase)基因與多個候選基因存在互作關系,表明該基因可能是影響中國荷斯坦牛繁殖性狀的重要基因。MET是一種原癌基因,又稱c-MET。牛的MET基因包含21個外顯子和20個內(nèi)含子,其cDNA全長4.8 kb,包含4 152 bp的開放閱讀框,編碼由1 384個氨基酸組成的Met蛋白[2]。Met蛋白是一種由二硫鍵連接的異二聚體組成的酪氨酸激酶,由190 ku的前體裂解為成熟的胞外α鏈和較長的跨膜β鏈[3]。已有研究證明,肝細胞生長因子(hepatocyte growth factor,HGF)為Met的唯一配體[4-5]。Met與HGF結(jié)合能夠激活多種信號轉(zhuǎn)導通路,誘導多種生物反應,如增殖、凋亡抑制、運動、細胞外基質(zhì)侵襲和血管生成的激活[6-10]。Parrott和Skinner[11]研究發(fā)現(xiàn),MET與牛卵泡發(fā)育有關,HGF與Met在牛卵泡發(fā)育過程中高度表達,HGF由卵泡膜細胞表達,作用于卵泡膜細胞和顆粒細胞上的Met,雌激素和促黃體生成素(luteinizing hormone,LH)通過調(diào)節(jié)局部HGF的產(chǎn)生間接控制卵泡發(fā)育,促進顆粒細胞的增殖,從而促進卵泡生長。此外,HGF能夠直接降低牛和大鼠顆粒細胞中芳香化酶活性的基礎水平,并且降低促卵泡激素(follicle stimulating hormone,F(xiàn)SH)對芳香化酶活性的刺激,同時HGF通過抑制LH間接抑制孕酮等類固醇激素的合成,負向調(diào)節(jié)顆粒細胞的功能[11]。
眾多研究表明,MET基因與奶牛的泌乳性能也具有潛在聯(lián)系。Accornero等[12]通過細胞試驗證明,MET的mRNA在牛乳腺上皮細胞系中高表達,且其表達量是同等條件下小鼠乳腺上皮細胞系的2倍。HGF與Met結(jié)合后,可激活絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)通路以促進細胞增殖通路和蛋白激酶B(protein kinase B,PKB or Akt)通路進而抑制細胞凋亡[13],從而誘導牛乳腺上皮細胞的增殖[12],在三維支架中還可觀察到HGF與Met有助于乳腺導管的形成和分支[13],進一步促進乳腺的發(fā)育和成熟。研究表明,在成年牛乳腺上皮細胞周期性的發(fā)育、退化和恢復階段可夠檢測到Met的表達,而在泌乳階段不表達;在乳腺肌上皮細胞中,整個生長周期均能檢測到Met的表達[2]。此外,Met蛋白激活下游PI3K-AKT-mTOR通路控制脂肪酸和蛋白質(zhì)的合成、葡萄糖代謝及攝取過程[14-15],參與乳腺上皮細胞的功能分化和乳汁合成的代謝途徑。因此,MET基因在奶牛泌乳系統(tǒng)的發(fā)育、乳腺組織周期性退化與恢復過程、乳成分合成中發(fā)揮著重要的作用。
綜上,MET基因不僅在奶牛卵泡發(fā)育過程中發(fā)揮著重要的功能,還對奶牛乳腺組織的恢復和發(fā)育有著關鍵的作用。目前,大量對MET基因多態(tài)性的研究集中在其對人癌癥細胞增殖和分化以及靶向治療等方面[16-17],在牛中僅有少量針對生理功能的研究,尚未見對基因多態(tài)性及其與生產(chǎn)、功能性狀的關聯(lián)進行挖掘。本研究旨在檢測中國荷斯坦牛群體中MET基因的單核苷酸多態(tài)(single nucleotide polymorphisms,SNP),并進一步篩選與繁殖及泌乳性狀關聯(lián)的重要SNPs,為奶牛個體選育策略的制定提供理論依據(jù)。
1.1.1 DNA池的構(gòu)建 選取70頭無親緣關系的中國荷斯坦牛公牛構(gòu)建DNA池,凍精樣品由北京奶牛中心提供。采用高鹽法[18]提取基因組DNA,使用Nanodrop 2000檢測濃度后調(diào)整為100 ng·μL-1,并隨機將樣品分成3個DNA池(20、20、30頭),-40 ℃保存?zhèn)溆谩?/p>
1.1.2 多態(tài)位點的篩查 參考MET基因的DNA序列(Ensembl數(shù)據(jù)庫:ENSBTAG00000006161),共設計24對引物(部分引物序列見表1),涵蓋該基因全部外顯子、部分內(nèi)含子及上下游側(cè)翼區(qū)各2 000 bp。
表1 MET基因部分引物信息
采用混池測序法對MET基因進行多態(tài)性篩選。PCR反應體系為25 μL:包含DNA混池樣(100 ng·μL-1)1 μL,1×CataAmp Taq Plus PCR Mix(北京開拓賽思生物技術有限公司,北京,中國)22 μL,上、下游引物(10 μmol·μL-1)各1 μL。PCR反應條件:預變性(2 min,98 ℃);變性(10 s,98 ℃),退火(30 s,溫度梯度55~58 ℃),延伸(10 s,72 ℃),循環(huán)35次;終延伸(1 min,72 ℃)。PCR產(chǎn)物經(jīng)2%瓊脂糖凝膠檢測后,送至北京擎科生物科技有限公司測序。最后利用R語言中的“sangerseqR”包對測序結(jié)果進行可視化,并計算重疊峰中兩個峰的比值,以比值0.1為閾值篩選潛在的多態(tài)位點,確定MET基因的19個SNPs。選取SNP中峰值比例高、物理位置間距遠、位于基因特殊區(qū)域的7個SNPs用于后續(xù)大群分型。
1.2.1 DNA的提取及基因分型 根據(jù)70頭公牛的后裔記錄,挑選北京地區(qū)8個牛場(金銀島、半截河、南三、渠頭、長三、長四、金星和中以)1 160頭健康荷斯坦母牛為研究對象,使用一次性采血針和抗凝真空采血管采集試驗牛尾根靜脈血約10 mL,使用天根血液基因組DNA提取試劑盒(DP318,北京天根生化科技有限公司,北京,中國)提取DNA,隨后利用Nanodrop 2000測定其濃度和純度,并通過2%的瓊脂糖凝膠電泳鑒定DNA片段完整性后,存放于-40 ℃冰箱中。
對7個候選SNPs設計檢測引物和通用引物(表2),采用競爭性等位基因特異性PCR(kompetitive allele-specific PCR,KASP)進行大群分型。本部分試驗委托中玉金標記(北京)生物技術股份有限公司完成。
表2 多態(tài)位點競爭性等位基因特異性PCR(KASP)分型引物信息
1.2.2 繁殖與泌乳性狀的估計育種值 課題組前期收集北京地區(qū)1998—2018年共4 272 839條奶牛生產(chǎn)性能測定(dairy herd improvement,DHI)日記錄,利用單性狀動物模型進行遺傳評估,獲得所需繁殖和泌乳性狀的EBV[19-20]。繁殖性狀包括初產(chǎn)日齡(age at the first calving,AFC)、初配日齡(age at the first service,AFS)、產(chǎn)犢至首次配種間隔(the interval from calving to the first insemination,ICF)、青年牛首末配種間隔(the interval from the first to last insemination in heifers,IFL_H)、經(jīng)產(chǎn)牛首末配種間隔(the interval from the first to last insemination in cows,IFL_C)共5個性狀;泌乳性狀包括產(chǎn)奶量(milk yield,MY)、乳脂率(fat percentage,F(xiàn)P)、乳脂量(fat yield,F(xiàn)Y)、乳蛋白率(protein percentage,PP)、乳蛋白量(protein yield,PY)和體細胞評分(somatic cell score,SCS)共6個性狀,其中FY、PY、SCS 3個性狀分別由FP、PY、體細胞數(shù)(somatic cell count,SCC,千·mL-1)3個性狀轉(zhuǎn)化得到,性狀轉(zhuǎn)化公式為:
1.2.3MET基因多態(tài)性位點及單倍型與繁殖和泌乳性狀估計育種值關聯(lián)分析 使用Haploview(version 4.2)軟件對MET基因的7個SNPs進行連鎖不平衡分析,以頻率0.05為閾值篩選高度連鎖的重要單倍型,獲得單倍型塊及對應單倍型。采用SAS 9.2軟件的GLM過程對SNPs與5個繁殖和6個泌乳性狀的EBV進行單位點和雙倍型關聯(lián)分析,模型為:
Yij=μ+Gi+eij
其中,Yij為個體繁殖性狀(AFC、AFS、ICF、IFL_H、IFL_C)或泌乳性狀(MY、PP、PY、FP、FY、SCS)的估計育種值(estimated breeding values,EBV);μ為群體均值;Gi為基因型或單倍型效應;eij為隨機殘差效應。采用Bonferroni法進行多重比較,結(jié)果以“最小二乘均值±標準差”表示,P<0.05為顯著,P<0.01為極顯著。
1.3.1 生物信息學預測 使用“TFBSTools”R包[21]對MET基因上游突變位點附近潛在結(jié)合的轉(zhuǎn)錄因子進行預測,通過在線預測網(wǎng)站RNAfold[22-23]對位于外顯子的突變位點進行mRNA二級結(jié)構(gòu)預測。
1.3.2MET基因多態(tài)與基因表達量的關聯(lián)分析MET基因的表達量數(shù)據(jù)來自轉(zhuǎn)錄組測序,為課題組前期所積累。采用Trizol法從血液樣品中提取總RNA,使用NanoDrop 2000檢測RNA的濃度和純度,而RNA的完整性通過1%瓊脂糖凝膠電泳進行檢測。OD260 nm/OD280 nm比值為1.8~2.0,電泳條帶無明顯降解即符合送樣條件。構(gòu)建cDNA文庫后采用Illumina Novaseq 6000測序平臺進行雙端測序。對RNA測序得到的數(shù)據(jù)進行分析,包括質(zhì)量控制、比對參考基因組、表達量分析等,最終獲得234個樣品中基因的表達量數(shù)據(jù)。隨后,匹配這234個樣品對應的SNPs位點及雙倍型。采用SAS 9.2軟件的GLM過程對SNP與MET基因表達量進行單位點和雙倍型關聯(lián)分析,模型為:
Yijkm=μ+Gi+Yj+Pk+Dijkm+Lijkm+Mijkm+eijkm
其中,Yijkm為MET基因表達量;μ為群體均值;Gi為基因型或單倍型效應;Yj為年季效應;Pk為胎次效應;Dijkm為妊娠天數(shù)效應;Lijkm為泌乳天數(shù)效應;Mijkm為7日平均泌乳量效應;eijkm為隨機殘差效應。采用Bonferroni法進行多重比較,結(jié)果以“最小二乘均值±標準差”表示,P<0.05為顯著,P<0.01為極顯著。
2%的瓊脂糖凝膠電泳結(jié)果顯示,24對引物的擴增條帶大小均符合預期,其中MET-18、MET-19、MET-20的PCR產(chǎn)物電泳結(jié)果見圖1。
M.DNA相對分子質(zhì)量標準;18/19/20表示引物序號,每個引物同時擴增3份產(chǎn)物,其DNA模板分別混池1、混池2、混池3
根據(jù)測序峰圖的重疊峰情況,本研究共篩選到了19個候選SNPs(表3),均已被dbSNP數(shù)據(jù)庫所收錄,其中有16個SNPs位于內(nèi)含子,1個SNP位于外顯子,2個SNPs位于上游側(cè)翼區(qū)。用于后續(xù)大群分型的7個SNPs的測序峰圖見圖2。
表3 MET基因候選多態(tài)性位點信息
箭頭表示SNPs所在的位置
通過KASP分型技術獲得了7個SNPs在1 160個體中的基因型數(shù)據(jù),群體遺傳學分析顯示(表4),MET基因7個SNPs最小等位基因頻率(minor allele frequency,MAF)的范圍為0.184~0.419,其多態(tài)性信息含量(polymorphism information content,PIC)均位于0.25~0.5之間,表明這些位點為中度多態(tài);此外,這些SNPs哈代溫伯格平衡(H-D平衡)的P值均大于0.05,表明均處于哈代溫伯格平衡狀態(tài);SNPs的遺傳雜合度(heterozygosity,He)低于遺傳純合度(1-He),說明其在測定群體中變異較??;有效等位基因數(shù)(Ne)除g.51736640A>C較小,其余SNPs均大于1.50,說明這些位點的等位基因在測驗群體中分布均勻。
表4 中國荷斯坦牛MET基因7個SNPs位點遺傳多樣性
單標記與部分繁殖性狀的關聯(lián)分析及多重比較結(jié)果顯示(表5),MET基因的7個SNPs均與繁殖性狀IFL_H_EBV關聯(lián)顯著(P<0.05),位于上游調(diào)控區(qū)的g.51737889T>C、g.51736640A>C兩個SNPs與AFC_EBV顯著關聯(lián)(P<0.05),與IFL_C_EBV極顯著關聯(lián)(P<0.01),其余位點關聯(lián)不顯著(P>0.05);位于上游調(diào)控區(qū)的g.51737889T>C位點3種基因型AFC_EBV差異極顯著(P<0.01),總體呈現(xiàn)GA>AA>GG的趨勢,表明具有等位基因A的個體初產(chǎn)日齡較小,為有利等位基因;同樣位于上游調(diào)控區(qū)的g.51736640A>C位點3種基因型間IFL_C_EBV差異極顯著(P<0.01),總體趨勢為TT>GT>GG,與該位點IFL_H_EBV趨勢一致,GG基因型經(jīng)產(chǎn)牛首末配種間隔更短,為有利基因型;位于外顯子的g.51660569G>A位點的TT基因型IFL_H_EBV顯著高于CC個體(P<0.05),TC基因型型IFL_H_EBV最低,總體趨勢為TT>CC>TC,該位點雜合子TC為有利基因型。
表5 MET基因SNPs多態(tài)與部分繁殖性狀EBV的關聯(lián)分析結(jié)果
MET基因單標記與部分泌乳性狀的關聯(lián)分析及多重比較結(jié)果顯示(表6),除g.51737889T>C外,其余6個SNPs位點均與PP_EBV顯著相關(P<0.05),g.51736640A>C與PP_EBV、FP_EBV、SCS_EBV均呈現(xiàn)顯著相關(P<0.05),g.51737889T>C與SCS顯著相關,其余位點關聯(lián)不顯著(P>0.05);g.51737889T>C位點的AA基因型SCS_EBV極顯著高于GG基因型(P<0.01),GA基因型SCS_EBV顯著高于GG基因型(P<0.05),表現(xiàn)為AA>GA>GG,說明等位基因A導致體細胞評分的升高,屬于不利等位基因;g.51736640A>C中GT基因型與GG基因型FP_EBV差異顯著(P<0.05),GG基因型與GT基因型SCS_EBV差異極顯著(P<0.01),趨勢表現(xiàn)為GT>TT>GG,GT基因型個體FP_EBV和PP_EBV較低而體細胞評分最高,該GT雜合基因型為不利基因型;g.51665308_51665316 dup中雙插入(EE)基因型PP_EBV極顯著低于雙缺失(FF)基因型(P<0.01),表現(xiàn)為FF>EF>EE,雙插入純合子(EE)基因型個體PP_EBV最低,為不利基因型;g.51660569G>A中CC基因型與TT、TC基因型PP_EBV差異極顯著(P<0.01),表現(xiàn)為TT>TC>CC,CC基因型個體SCS_EBV最低,但FP_EBV、PP_EBV也最低,為不利基因型。
表6 MET基因SNPs多態(tài)與部分泌乳性狀EBV的關聯(lián)分析結(jié)果
連鎖不平衡分析結(jié)果如圖3所示,7個SNPs可形成2個單倍型塊。第1個單倍型塊(BLOCK1)包含5個SNPs,g.51666651G>C至g.51645814C>T具有較緊密的連鎖關系,其中g.51666651G>C與g.51665308_51665316dup緊密連鎖,D′=1.000,r2=1.000;g.51666651G>C與g.51640656C>A緊密連鎖,D′=1.000,r2=1.000;g.51665308_51665316dup與g.51640656C>A緊密連鎖,D′=1.000,r2=1.000;g.51660569G>A與g.51645814C>T緊密連鎖,D′=1.000,r2=0.998,H1為優(yōu)勢單倍型,頻率為0.689;第2個單倍型塊(BLOCK2)包含2個SNP,g.51737889T>C與g.51736640A>C具有較緊密的連鎖關系,D′=0.995,r2=0.318(r2<0.330),H4為優(yōu)勢單倍型,頻率為0.583。
方塊顏色表示連鎖程度,顏色越深,連鎖程度越高;方塊中數(shù)值為位點間相關性值的百分數(shù),無數(shù)值代表兩位點完全連鎖
雙倍型關聯(lián)分析結(jié)果及多重比較結(jié)果顯示(表7),MET基因的BLOCK1僅與繁殖性狀IFL_C_EBV關聯(lián)顯著(P<0.05),與其余繁殖性狀關聯(lián)不顯著(P>0.05);BLOCK2與AFC_EBV關聯(lián)顯著(P<0.05),與IFL_H_EBV和IFL_C_EBV關聯(lián)極顯著(P<0.001),與AFS_EBV、ICF_EBV關聯(lián)不顯著(P>0.05);BLOCK1中H1H1與H1H3兩雙倍型IFL_C_EBV之間存在顯著差異(P<0.05),總體上呈現(xiàn)H2H2>H3H3>H1H1>H1H2>H1H3>H2H3的趨勢,H2H3雙倍型個體的IFL_C_EBV最小,為優(yōu)勢雙倍型;BLOCK2中IFL_C_EBV總體趨勢為H6H6>H5H6>H4H6>H5H5>H4H4>H4H5,H4H4、H4H5與H4H6、H6H6雙倍型IFL_H_EBV之間差異極顯著(P<0.01),趨勢為H6H6>H4H6>H5H6>H5H5>H4H5>H4H4,H4H4雙倍型個體AFC_EBV、IFL_H_EBV均為最低,為優(yōu)勢雙倍型。
表7 MET基因單倍型塊多態(tài)與部分繁殖性狀的關聯(lián)分析結(jié)果
不同雙倍型的泌乳性狀EBV多重比較結(jié)果顯示(表8),MET基因的BLOCK1僅與泌乳性狀PP_EBV關聯(lián)極顯著(P<0.001),與其余繁殖性狀關聯(lián)不顯著(P>0.05);BLOCK2與FY_EBV關聯(lián)顯著(P<0.05),與PP_EBV和SCS_EBV關聯(lián)極顯著(P<0.01),與MY_EBV、PY_EBV、FP_EBV關聯(lián)不顯著(P>0.05);BLOCK1中H2H3雙倍型PP_EBV與H1H1、H1H2差異極顯著(P<0.01),總體趨勢為H1H1>H1H2>H1H3=H3H3>H2H2>H2H3;BLOCK2中H4H6與H5H5雙倍型PP_EBV差異極顯著(P<0.01),H5H5與H4H4、H6H6雙倍型PP_EBV之間存在顯著差異(P<0.05),總體趨勢表現(xiàn)為H6H6>H4H6>H5H6>H4H4>H4H5>H5H5,F(xiàn)Y_EBV趨勢為H6H6>H5H6>H4H4>H4H6>H4H5>H5H5,H4H4與H4H6雙倍型SCS_EBV差異極顯著(P<0.01),H4H4與H5H6雙倍型SCS_EBV差異顯著(P<0.05),表現(xiàn)為H5H6>H4H6>H6H6>H5H5>H4H5>H4H4,H6H6雙倍型個體具有PP_EBV、FY_EBV最高,SCS_EBV居中,為優(yōu)勢雙倍型。
表8 MET基因單倍型塊多態(tài)與部分泌乳性狀EBV的關聯(lián)分析結(jié)果
2.5.1 基序(motif)分析 g.51737889T>C與g.51736640A>C位點均位于MET基因轉(zhuǎn)錄起始位點(TSS)上游約2 000 bp左右,推測可能通過影響轉(zhuǎn)錄因子與MET上游序列結(jié)合進而影響MET基因的表達,所以進行了motif分析。預測結(jié)果表明(圖4a和4b),當g.51737889T>C位點的等位基因為A時,存在72個獨有的轉(zhuǎn)錄因子,如BARX1和FOXO6等與間質(zhì)細胞向上皮細胞轉(zhuǎn)化調(diào)節(jié)的重要轉(zhuǎn)錄因子;當?shù)任换驗镚時,僅有4種獨有的轉(zhuǎn)錄因子,如STAT家族和HIC2等與基因激活、新陳代謝相關的轉(zhuǎn)錄因子。當g.51736640A>C位點的等位基因為G時,存在9個獨有的轉(zhuǎn)錄因子,如SIX1、VDR、RUNX3與細胞增殖、分化相關的重要轉(zhuǎn)錄因子;當?shù)任换驗門時,有20種轉(zhuǎn)錄因子,如NR1I3等與葡萄糖代謝、脂質(zhì)代謝等相關的重要轉(zhuǎn)錄因子。
2.5.2 mRNA結(jié)構(gòu)預測 g.51660569G>A位點位于MET基因第6外顯子,推測其可能是通過影響mRNA的二級結(jié)構(gòu),進而影響基因表達,所以進行了結(jié)構(gòu)預測。預測結(jié)果表明(圖4c),當?shù)任换驗镃時,mRNA二級結(jié)構(gòu)如左圖所示,最小自由能(minimum free energy,MFE)為-165.69 kJ·mol-1,當?shù)任换驗門時,mRNA二級結(jié)構(gòu)如右圖所示,MFE為-153.97 kJ·mol-1。因此,當g.51660569G>A位點等位基因為C時,MFE更低,形成的mRNA結(jié)構(gòu)更穩(wěn)定。
2.5.3MET基因多態(tài)與基因表達量的關聯(lián)分析 關聯(lián)分析結(jié)果及不同基因型的基因表達量多重比較結(jié)果顯示(圖4d),位于上游調(diào)控區(qū)的g.51737889T>C、g.51736640A>C兩個SNPs與基因表達量關聯(lián)極顯著(P<0.01),位于內(nèi)含子的g.51640656C>A與基因表達量關聯(lián)顯著(P<0.05),其余4個SNPs與基因表達量關聯(lián)不顯著但具有顯著趨勢(0.05
C位點GG與AA基因型個體的基因表達量差異極顯著(P<0.01),總體呈現(xiàn)GG>GA>AA的趨勢,具有等位基因G的個體MET基因表達量高;同樣位于上游調(diào)控區(qū)的g.51736640A>C位點GG與GT基因型的基因表達量差異顯著(P<0.05),總體趨勢為GG>TT>GT,具有等位基因G的個體MET基因表達量高;位于外顯子的g.51660569G>A位點多態(tài)與基因表達量存在顯著趨勢,趨勢為TT>CC>TC;位于內(nèi)含子的g.51640656C>A位點的3種基因型基因表達量差異不顯著(P>0.05),總體趨勢為GG>TT>TG,GG基因型個體MET基因表達量最高。
關聯(lián)分析結(jié)果及不同雙倍型的基因表達量多重比較結(jié)果顯示(圖4e),兩個單倍型塊與基因表達量關聯(lián)均顯著(P<0.05),但各雙倍型之間基因表達量無顯著差異(P>0.05),總體趨勢為BLOCK1:H2H2>H1H1>H1H3>H1H2>H2H3,BLOCK2:H5H5>H4H4>H4H5>H4H6>H5H6>H6H6。BLOCK1中H2H2雙倍型的個體MET基因表達量高;BLOCK2中H5H5雙倍型個體MET基因表達量最高。
a. g.51737889T>C與g.51736640A>C不同等位基因結(jié)合轉(zhuǎn)錄因子預測結(jié)果;b. 部分轉(zhuǎn)錄因子示例;c. g.51660569G>A不同等位基因mRNA二級結(jié)構(gòu)預測結(jié)果,圈處為多態(tài)位點;d. MET基因單位點多態(tài)與基因表達量的關聯(lián)分析結(jié)果:*. P<0.05,**. P<0.01,NS. P>0.05;e. MET基因雙倍型多態(tài)與基因表達量的關聯(lián)分析結(jié)果
本研究通過混池測序法,鑒定到MET基因在中國荷斯坦牛中共有19個SNPs,其中16個SNPs位于內(nèi)含子,2個SNPs位于上游調(diào)控區(qū),1個SNP位于外顯子,表明該基因內(nèi)含子區(qū)存在豐富的遺傳變異。隨后,篩選出7個SNPs進行基因分型,并與繁殖性狀、泌乳性狀和基因表達量進行關聯(lián)分析,發(fā)現(xiàn)MET基因7個SNPs與中國荷斯坦牛繁殖和泌乳性狀存在顯著的相關性。研究發(fā)現(xiàn),Met蛋白可以促進顆粒細胞的增殖,影響卵泡發(fā)育[11]。研究發(fā)現(xiàn),Met蛋白可激活誘導牛乳腺上皮細胞和導管增殖的通路,促進乳腺的發(fā)育和成熟,間接調(diào)控葡萄糖攝取和代謝、蛋白質(zhì)合成等生理過程[13-15]。本研究中,位于上游調(diào)控區(qū)的g.51737889T>C位點與AFC、IFL_H、IFL_C、SCS等4個性狀的EBV具有顯著或極顯著的相關性,且GG基因型AFC、IFL_H、IFL_C、SCS等性狀EBV最低;同樣位于上游調(diào)控區(qū)的g.51736640A>C位點與AFC、IFL_H、IFL_C、PP、FP、SCS等6個性狀的EBV具有顯著或極顯著的相關性,且GG基因型AFC、IFL_H、IFL_C、SCS等性狀EBV最低,PP、FP等性狀EBV最低;位于外顯子的g.51660569G>A位點的TC基因型AFC較低,IFL_H、IFL_C等性狀EBV最低。本研究所關注5個繁殖性狀的EBV越小,配種時間越短,個體繁殖性能越好,能夠保證奶牛養(yǎng)殖的經(jīng)濟效益[24]。對于產(chǎn)奶性狀,除SCS外,其余5個性狀的EBV越高,個體產(chǎn)奶性能越好。因此,g.51737889T>C位點GG基因型個體同時具有較好的繁殖性能和泌乳性能;g.51736640A>C位點GG基因型個體繁殖性能較好,但泌乳性能相對較差;g.51660569G>A位點TC基因型個體具有較好的繁殖性能。上述3個SNPs位點可作為中國荷斯坦牛繁殖和產(chǎn)奶性狀的候選位點,應被重點關注。
此外,位于內(nèi)含子的g.51640656C>A位點與IFL_H_EBV關聯(lián)顯著,與PP_EBV關聯(lián)極顯著,且與SCS_EBV存在顯著關聯(lián)趨勢,該位點TG基因型IFL_H、IFL_C、FP最低,PP、SCS較低,具有該基因型個體的繁殖性能較好,但泌乳性能相對較差。
g.51737889T>C和g.51736640A>C兩位點均位于MET基因轉(zhuǎn)錄起始位點(transcription start site,TSS)上游約2 000 bp左右,研究表明,基因上游調(diào)控區(qū)多態(tài)性位點通過影響轉(zhuǎn)錄因子的結(jié)合調(diào)控基因表達[25]。在Campbell等[26]的研究中,在人MET基因啟動子區(qū)(-20 bp)證明存在核心啟動子區(qū)域,并且能夠通過與SP-1、AP-2、PC-4的結(jié)合影響啟動子活性。為進一步探究這兩個突變位點的潛在作用機制,本研究進行了基序分析,結(jié)果表明,當g.51737889T>C位點的等位基因為G時,富集的多種轉(zhuǎn)錄因子與基因激活和新陳代謝相關;當此位點的等位基因為A時,富集的多種轉(zhuǎn)錄因子與間質(zhì)上皮分化有關。推測,該SNP的GG基因型能夠招募與基因激活相關的轉(zhuǎn)錄因子結(jié)合序列,促進MET基因的表達,最終導致該基因型個體繁殖和泌乳性能表現(xiàn)優(yōu)異。該位點與MET基因表達量的關聯(lián)分析結(jié)果證明,g.51737889T>C位點GG基因型個體的MET基因表達量最高,且與其他基因型存在顯著差異。同樣,當g.51736640A>C位點的等位基因為G時,富集的多種轉(zhuǎn)錄因子與細胞增殖、分化相關;當此位點的等位基因為T時,富集的多種轉(zhuǎn)錄因子與葡萄糖代謝、脂質(zhì)代謝有關。推測,該SNP的GG基因型能夠招募與細胞分化相關的轉(zhuǎn)錄因子結(jié)合序列,促進MET基因的表達,最終導致該基因型個體繁殖性能表現(xiàn)優(yōu)異。后續(xù)的分析中,g.51736640A>C位點GG基因型個體的MET基因表達量最高,且與其他基因型存在顯著差異,更進一步證明了此猜測。
g.51660569G>A為同義突變位點,參與編碼Met蛋白第598位天冬氨酸,位于胞內(nèi)近膜區(qū)。有研究表明,同義突變影響核糖體運輸、蛋白質(zhì)折疊以及細胞適應過程[27-28],所以對該位點進行了mRNA結(jié)構(gòu)預測。結(jié)果表明,g.51660569G>A位點不同基因型mRNA二級結(jié)構(gòu)無明顯差異,但等位基因為C時,mRNA的MFE更低,結(jié)構(gòu)更加穩(wěn)定。推測是該位點的同義突變通過改變mRNA的二級結(jié)構(gòu),進而影響mRNA穩(wěn)定性,延長半衰期,提高基因表達量,使不同基因型個體MET基因表達量存在差異,造成了其在卵泡和乳腺發(fā)育過程的差異。但該位點多態(tài)與基因表達量的關聯(lián)不顯著,預測結(jié)果并不能完全解釋雜合子基因型個體繁殖和泌乳性能表現(xiàn)優(yōu)異?;虻谋磉_存在時空特異性[29],研究表明,Met的激活通過自分泌或旁分泌的方式啟動[17],且Met主要通過改變蛋白活性影響表型,而不是基因表達[30]。部分研究也表明,在乳腺發(fā)育階段,Met蛋白高度表達,mRNA表達量很低,在哺乳期MetmRNA快速降解[2,31-32]。此次RNA提取樣品來自于泌乳牛尾根血液,并非卵巢或乳腺組織,這可能是表達量檢測結(jié)果與預測結(jié)果不一致的原因。此外,研究表明,內(nèi)含子SNP能夠通過影響可變剪切來影響基因表達[33-34],或通過形成lncRNA調(diào)控基因表達[35];g.51640656C>A位點多態(tài)與基因表達量關聯(lián)顯著,TG基因型表達量最低。但該SNP并非已證實的可變剪切位點,推測該位點對繁殖和產(chǎn)奶性狀的影響可能與內(nèi)含子形成的lncRNA有關,有待進一步驗證。
研究表明,基因?qū)Ρ硇偷挠绊懣赡苁艿蕉鄠€突變位點的共同作用[29,36]。本研究中,在中國荷斯坦牛群體中MET基因的7個SNPs共形成2個單倍型塊,g.51666651G>C、g.51665308_51665316 dup、g.51660569G>A、g.51640656C>A、g.51645814C>T共5個SNPs緊密連鎖形成BLOCK1,g.51737889T>C與g.51736640A>C兩個SNPs緊密連鎖形成BLOCK2。BLOCK2與AFC、IFL_H、IFL_C、PP、FY、SCS多個繁殖、泌乳性狀EBV關聯(lián)顯著,且與PY、FP兩個泌乳性狀EBV關聯(lián)存在顯著趨勢。BLOCK2的2個SNPs g.51737889T>C與g.51736640A>C均位于上游調(diào)控區(qū),這2個SNPs位點各自與多個繁殖、泌乳性狀EBV顯著相關。
另外,一個單倍型塊上的多個突變會對性狀產(chǎn)生更大的影響[37]。H4H4正是g.51737889T>C與g.51736640A>C兩個SNPs的優(yōu)勢基因型GG基因型的組合,H4H5是g.51737889T>C的雜合GA基因型與g.51736640A>C的GG優(yōu)勢基因型的組合;H4H4與H4H5個體排在AFC、IFL_H、IFL_C 3種繁殖性狀EBV最低的前三名;H4H4的PP_EBV第三高,F(xiàn)Y_EBV第二高,SCS_EBV最低。H4H4雙倍型個體具有較好的繁殖和泌乳性狀。且與基因表達量關聯(lián)分析結(jié)果也證明,H4H4雙倍型個體基因表達量最高,充分驗證了g.51737889T>C與g.51736640A>C兩位點等位基因G對中國荷斯坦牛繁殖及泌乳性能的影響。
本研究獲得了中國荷斯坦牛MET基因的多態(tài)性圖譜,MET基因的7個SNPs及其形成的2個單倍型塊與繁殖、泌乳性狀存在顯著或極顯著關聯(lián)。位點g.51737889T>C和g.51736640A>C可能通過改變轉(zhuǎn)錄因子結(jié)合影響基因的表達,對MET的表達量有顯著影響;位點g.51660569G>A對mRNA的二級結(jié)構(gòu)無顯著影響但不同等位基因?qū)ψ钚∽杂赡墚a(chǎn)生影響。上述3個位點可作為奶牛繁殖和泌乳性狀的候選位點重點關注,研究結(jié)果為中國荷斯坦牛高產(chǎn)高效選育提供了可用的遺傳標記。