梁莎莎,龐春英,鄧廷賢,陸杏蓉,段安琴,馬小婭,方艷艷,梁賢威
(中國農業(yè)科學院廣西水牛研究所,廣西水牛遺傳繁育重點實驗室,南寧 530001)
水牛以耐粗飼而著稱,具有適應性強、耐高溫高濕、抗病力強和易飼養(yǎng)等特點。水牛奶含有較高的乳脂肪(8.0%)、乳蛋白(4.5%)、不飽和脂肪酸,以及較低的磷脂和膽固醇水平[1],具有重要的經濟價值。然而水牛平均產奶量卻遠低于荷斯坦奶牛,因此,提高水牛泌乳性能至關重要,挖掘與產奶性狀相關的候選基因有助于改善水牛泌乳性能。
主要促進因子超家族成員2a(major facilitator superfamily domain containing 2a,MFSD2A)是一種膜轉運蛋白,屬于次級轉運蛋白的主要促進因子超家族[2-3]。Sánchez-Campillo等[4]研究發(fā)現,母體血液中MFSD2A的水平可作為一種潛在的生物標記物,用于早期檢測妊娠期間MFSD2A表達紊亂及其對兒童神經發(fā)育的影響。脂質組學分析表明,MFSD2A基因敲除小鼠大腦中二十二碳六烯酸(DHA)水平顯著降低,并伴有海馬區(qū)和小腦區(qū)神經細胞丟失,以及認知障礙和嚴重焦慮[5]。作為一種脂質轉運蛋白,MFSD2A在哺乳動物主要促進劑超家族(MFS)成員中是獨一無二的,通常運輸可溶性底物[6]。MFSD2A在脂肪代謝和能量消耗中具有潛在的作用,有研究表明MFSD2A基因敲除小鼠(禁食20 h)與野生型小鼠相比,空腹血漿甘油三酯(TG)顯著降低[7],而甘油三酯也是乳脂的重要組成部分,因此MFSD2A基因有可能對乳汁中的乳脂含量產生影響。但是目前鮮有MFSD2A基因在哺乳動物產奶性狀方面的研究,在水牛上的更是寥寥無幾。水牛MFSD2A基因定位于6號染色體,全長12 791 bp,共有14個外顯子。本試驗利用PCR擴增技術對水牛MFSD2A基因各個外顯子及部分內含子序列進行SNP位點篩選,利用Sequenom MassARRAY SNP飛行時間質譜技術對突變位點進行基因型檢測,研究MFSD2A基因多態(tài)性及其與乳脂率等產奶性狀的關聯性,旨在從分子水平挖掘與產奶性狀相關的標記,為水牛產奶性狀的分子標記輔助選擇提供理論基礎。
于廣西水牛研究所種畜場隨機選取383頭飼養(yǎng)管理水平一致的水牛,其中包含3個純種(摩拉水牛、尼里-拉菲水牛和地中海水牛)以及2個雜交品種(摩拉尼里雜交水牛和地中海雜交水牛)。采取頸靜脈采血方式,每個個體抽取5 mL血液保存于真空采血管中(含EDTA抗凝劑),4 ℃保存。此外收集其中315頭水牛的產奶性狀表型數據(305 d產奶量、乳脂率、乳蛋白率和乳尿素氮)用于統計分析。
動物血液基因組DNA提取試劑盒購自天根生物科技(北京)有限公司;PremixTaq酶購自TaKaRa公司。
采用動物血液基因組DNA提取試劑盒進行水牛基因組DNA樣本的抽提,并結合NanoDrop2000紫外分光光度計和1.0%瓊脂糖凝膠電泳進行基因組DNA樣本的質控。質控后的基因組DNA樣本稀釋至30~50 ng/μL,隨機選取50個樣本,每個樣本取10 μL混合作為DNA混合池。
參考GenBank數據庫中水牛MFSD2A基因序列(登錄號:XM_025289025.1),使用Primer Premier 3.0軟件設計該基因14個外顯子(包含每個外顯子上下游200 bp的內含子序列)的引物序列,以水牛DNA樣本混合池為模板進行PCR擴增。引物信息見表1。引物均由深圳華大基因生物科技公司合成。PCR反應體系50 μL:DNA模板1 μL,PremixTaq酶25 μL,上、下游引物各2 μL,ddH2O 20 μL。PCR反應程序:94 ℃預變性3 min;94 ℃變性30 s,60 ℃退火30 s,72 ℃延伸30 s,共35個循環(huán);72 ℃延伸8 min。取10 μL PCR擴增產物進行1.0%瓊脂糖凝膠電泳檢測后,委托深圳華大基因生物科技公司進行測序。
表1 水牛MFSD2A基因SNP篩選引物信息Table 1 Primer information for SNP screening of MFSD2A gene in buffalo
使用DNA Star-SeqMan軟件對序列峰圖進行比對分析,篩選SNP位點。將檢測合格的383個DNA樣本送至北京康普森生物技術有限公司,利用Sequenom MassARRAY飛行時間質譜技術對篩選的SNP位點進行分型。相關分型引物序列見表2,引物均由深圳華大基因生物科技公司合成。
表2 用于SNP分型的擴增引物和延伸引物Table 2 Amplification primers and extension primers for SNP genotyping
1.5.1 產奶數據整理 使用Excel對產奶數據進行整理,胎次水平依據自然胎次劃分,前7個胎次用1、2、3、4、5、6、7(超過7的也劃為7胎次)表示;季節(jié)按春季(3~5月)、夏季(6~8月)、秋季(9~11月)和冬季(12~次年2月)劃分為4個季度;305 d產奶量按照《中國水牛科學》[8]中的校正方法進行校正。
1.5.2 遺傳多樣性分析 使用genetics R語言程序包計算多態(tài)位點的等位基因頻率、基因型頻率、群體雜合度(heterozygosity,He)和多態(tài)信息含量(polymorphism information content,PIC),并進行Hardy-Weinberg平衡檢驗。
1.5.3 SNP位點不同基因型與水牛產奶性狀的關聯分析 采用SAS 9.4軟件的GLM過程對產奶性狀和MFSD2A基因突變位點基因型進行關聯分析。關聯分析模型為:Yijklm=μ+Gi+Pj+Sk+Dl+Am+eijklm。其中,Yijklm為產奶性狀表型記錄;μ為群體平均值;Gi為基因效應;Pj為胎次效應;Sk為季節(jié)效應;Dl為泌乳天數效應;Am為年齡效應;eijklm為隨機殘差。各項產奶數據使用最小二乘均值±標準差表示,以P<0.05為差異顯著性判斷標準。
1.5.4 連鎖不平衡及單倍型分析 使用Haploview4.2軟件對符合Hardy-Weinberg平衡的SNP位點進行連鎖不平衡(LD)及單倍型分析,單倍型模塊劃分按照四配子法則(four gamete rule)。單倍型與水牛產奶性狀的關聯分析方法同1.5.3。
將測序結果結合DNA Star-SeqMan軟件比對后,在水牛MFSD2A基因上共發(fā)現了7個SNPs位點,分別位于內含子1(g.568 C>G 和g.701 A>G)、內含子2(g.3203 T>G和g.3326 G>A)、內含子6(g.8290 T>C和g.8523 C>G)和內含子8(g.9138 G>T)(圖1)。
針對篩選出的7個SNPs位點,使用Sequenom MassARRAY飛行時間質譜技術對其進行基因分型。由圖2可知,所有的SNPs位點中均檢測出3種常見基因型,平均檢測率為99.37%。以g.568 C>G為例,結果顯示未檢測出基因型的2頭,檢出CC野生型純合子243頭,CG突變型雜合子124頭,GG突變型純合子14頭。
由表3可知,g.568 C>G位點的CC為優(yōu)勢基因型,C為優(yōu)勢等位基因;g.701 A>G位點的AA為優(yōu)勢基因型,A為優(yōu)勢等位基因;g.3203 T>G位點的TT為優(yōu)勢基因型,T為優(yōu)勢等位基因;g.3326 G>A位點的GA為優(yōu)勢基因型,G為優(yōu)勢等位基因;g.8290 T>C位點的TT為優(yōu)勢基因型,T為優(yōu)勢等位基因;g.8523 C>G位點的CG為優(yōu)勢基因型,C為優(yōu)勢等位基因;g.9138 G>T位點的GT為優(yōu)勢基因型,G為優(yōu)勢等位基因。這7個SNPs位點的最小等位基因頻率(MAF)均>0.1,PIC均在0.25~0.4之間,屬于中度多態(tài);經χ2適合性檢測表明,除g.8290 T>C外,其余位點均處于Hardy-Weinberg平衡狀態(tài)(P>0.05)。
圖1 水牛MFSD2A基因SNPs位點測序峰圖Fig.1 Sequencing peak map of SNPs site of MFSD2A gene in buffalo
使用SAS 9.4軟件對MFSD2A基因的7個SNPs位點不同基因型與水牛305 d產奶量、乳脂率、乳蛋白率和乳尿素氮這4個產奶性狀的最小二乘均值進行關聯分析,結果見表4。由表4可知,這7個SNPs位點與305 d產奶量均顯著關聯,其中g.568 C>G、g.701 A>G、g.8523 C>G位點的GG基因型和g.3326 G>A位點的AA基因型個體305 d產奶量的最小二乘均值均超過2 700 kg,且顯著高于其他基因型(P<0.05);而3種基因型中突變雜合子基因型個體的305 d產奶量最低。
g.568 C>G和g.701 A>G位點與乳脂率顯著關聯,乳脂率依次為突變純合子>野生純合子>突變雜合子,且突變純合子(GG)和野生純合子(CC和AA)個體的乳脂率均分別顯著高于對應的突變雜合子(CG和GA)個體(P<0.05)。
g.568 C>G、g.701 A>G、g.3326 G>A、g.8290 T>C和g.8523 C>G與乳蛋白率均顯著關聯,其中g.568 C>G 和g.3326 G>A的野生純合子個體乳蛋白率均顯著高于突變雜合子個體(P<0.05),g.8290 T>C和g.8523 C>G的突變雜合子乳蛋白率顯著高于野生純合子(P<0.05)。這7個SNPs位點與乳尿素氮均無顯著關聯(P>0.05)。
表4 MFSD2A基因SNPs位點不同基因型與水牛產奶性狀的關聯分析Table 4 Association analysis of different genotypes of MFSD2A gene SNPs with milk production traits in buffalo
續(xù)表
對處于Hardy-Weinberg平衡狀態(tài)的6個SNPs進行后續(xù)分析,由圖3可知,g.568 C>G、g.701 A>G和g.3203 T>G可組成一個單倍型模塊(Block 1),g.8523 C>G和g.9138 G>T可組成另一個單倍型模塊(Block 2)。其中,g.568 C>G和g.701 A>G、g.568 C>G和g.3326 G>A、g.8523 C>G和g.9138 G>T的r2分別為0.87、0.37和0.48,均>0.33,處于強連鎖不平衡狀態(tài)。
A,連鎖不平衡單倍型塊圖(D’值):格子中的數字為D’×100的值,無數字的表示D’=1;B,連鎖不平衡單倍型塊圖(r2值):格子中的數字為r2×100的值,根據r2值判斷位點之間的連鎖不平衡狀態(tài),r2=0表示完全連鎖平衡,r2>0.33表示強連鎖不平衡,r2=1表示完全連鎖不平衡 A,LD-Block (D’):The number in the grid is the value of D’×100,no value means D’=1;B,LD-Block (r2): The number in the grid is the value of r2×100,the linkage among SNPs was evaluated by the value of r2,r2=0 indicated no linkage or linkage equilibrium,r2>0.33 indicated strong linkage,r2=1 indicated full linkage圖3 水牛MFSD2A基因6個SNPs位點連鎖不平衡分析Fig.3 Analysis of linkage disequilibrium of six SNPs of MFSD2A gene in buffalo
如表5所示,Block 1和Block 2的SNPs各能形成3種單倍型。分別對這2個單倍型模塊的6種單倍型與水牛產奶性狀進行關聯分析,結果如表6所示,Block 1中的H1(CAG)單倍型個體乳蛋白率顯著高于H2(CAT)和H3(GCT)(P<0.05);Block 2中的D3(GG)單倍型個體305 d產奶量極顯著高于D1(CG)和D2(CT)型(P<0.01)。
表5 水牛MFSD2A基因單倍型及其頻率Table 5 Haplotype and frequency of MFSD2A gene in buffalo
表6 水牛MFSD2A基因單倍型與水牛產奶性狀的關聯分析Table 6 Association analysis of MFSD2A gene haplotype and milk production traits in buffalo
MFSD2A是一個營養(yǎng)調節(jié)基因,在動物生長發(fā)育、運動功能和脂肪代謝中發(fā)揮著多種作用。MFSD2A基因敲除小鼠肝臟脂肪代謝正常,但全身能量消耗增加。與野生型小鼠相比,MFSD2A基因敲除的小鼠更小、更瘦,并降低了血清、肝臟和棕色脂肪甘油三酯[7]。目前對MFSD2A的研究更多集中于人類大腦和眼睛等器官的發(fā)育和疾病中,在哺乳動物產奶性狀方面的功能尚不清楚,本試驗利用PCR擴增技術及Sequenom MassARRAY SNP飛行時間質譜技術在水牛MFSD2A基因內含子序列中篩選出7個SNPs位點。內含子在真核生物基因組序列中占比很大,是基因組中重要的組成部分。一般來說,內含子區(qū)域承受的選擇壓力要遠遠低于外顯子區(qū)域,因此變異程度高于編碼序列[9]。內含子作為非編碼序列通常被認為是不會行使功能的,但有研究表明內含子與基因表達、細胞骨架構建和動態(tài)變化密切相關[10]。內含子及被剪接體切除的內含子會影響mRNA代謝的許多過程[11]。而內含子區(qū)域的SNP位點有可能通過影響剪切位點活性來影響基因功能,剪切位點的失活可能會影響堿基的翻譯和蛋白質序列。
遺傳多樣性分析結果顯示,g.8290 T>C位點偏離Hardy-Weinberg平衡狀態(tài),可能是受到了突變、選擇和遺傳漂移等影響。這7個SNPs位點PIC均在0.25~0.5之間,表明這些SNPs位點處于中度多態(tài),有較大遺傳變異性和選擇潛力。進一步對其不同基因型與水牛產奶性狀進行關聯分析,結果顯示純合子的基因型在305 d產奶量和乳脂率的選擇上更有優(yōu)勢。
連鎖不平衡是指2個或多個基因座上等位基因非隨機關聯現象[12],某些等位基因常常隨機關聯在一起,同時遺傳給后代,這些等位基因組成的單倍型在群體中出現的頻率較高,引起連鎖不平衡。種群中的連鎖不平衡會受到如種群結構、遷移、選擇、遺傳漂移、突變和重組率等因素影響[13]。連鎖不平衡圖譜的開發(fā)和群體水平單倍型模塊的表征有助于候選基因和候選區(qū)域的研究[13],也有助于理解表型和基因之間非線性關聯的本質?;虻倪B鎖不平衡分析基于隨機分布狀態(tài)下的實際單體型頻率與預期頻率之間的差異來實現的,以D’和r2(取值范圍為0~1)來表示位點間的連鎖不平衡程度[14],D’=1、r2=1則表示基因座處于完全連鎖不平衡狀態(tài)。本試驗選擇使用r2而不是D’來評估連鎖不平衡是因為與D’相比,在有限的樣本數中r2受等位基因頻率的影響較小,D’在小樣本數和低頻率等位基因中往往被高估[15-17]。對水牛MFSD2A基因符合Hardy-Weinberg平衡的6個SNPs位點進行連鎖不平衡分析,結果顯示,g.568 C>G和g.701 A>G位點處于極強連鎖不平衡狀態(tài)(D’=1,r2=0.87),這也解釋了這2個SNPs位點基因型頻率相似和關聯分析結果一致的現象。
單倍型是指單個染色體上等位基因的組合,換句話說,是指同一親本來源的等位基因[18]。雖然本研究在MFSD2A基因單個SNP位點不同基因型與水牛產奶性狀關聯分析中找到了許多顯著關聯的基因型,但單個SNP研究不全面且繁瑣,由于SNPs位點之間可能通過連鎖共同遺傳而發(fā)揮作用,因此利用單倍型分析可避其不足[19]。本試驗的單倍型分析結果發(fā)現了2個單倍型模塊,共形成6種單倍型。分別對這6種單倍型與水牛產奶性狀進行關聯分析,結果發(fā)現Block 1中的H1(CAG)單倍型乳蛋白率顯著高于H2(CAT)和H3(GCT),Block 2中的D3(GG)單倍型305 d產奶量顯著高于D1(CG)和D2(CT)型,因此H1和D3單倍型是提高水牛305 d產奶量和乳蛋白率的有利單倍型。
主要促進因子超家族(MFS)是最大和最多樣化的膜轉運蛋白[20],作為單一轉運體、聯合轉運體和反向轉運體,在細胞內外運輸物質[21]。MFS轉運蛋白包括MFSD1、MFSD2A、MFSD2B和MFSD3等,它們可以運輸寡糖、單糖、藥物、酶輔因子、多肽、氨基酸、維生素、堿基、核苷、核苷酸、生色團、有機和無機陰離子等[22]。與大多數其他MFS成員運輸糖和氨基酸等水溶性配體不同,MFSD2A是第一個被發(fā)現唯一轉運脂質的成員,這意味著MFSD2A具有獨特的結構特征和轉運機制[23]。在本試驗中發(fā)現了與水牛乳脂率顯著關聯的MFSD2A基因SNPs位點,還發(fā)現了其他與產奶量和乳蛋白率相關的SNPs位點和單倍型,雖然乳脂率的變化會影響乳蛋白率和產奶量,但這其中的調控機制尚不明確,后續(xù)還需要進行進一步的研究。在今后的選擇過程中,應考慮優(yōu)勢等位基因的固定,以提高水牛產奶性能。但由于本試驗中的樣本量較少,需要進一步在大群體中去驗證,以鑒定這些SNPs位點是否可以作為影響水牛產奶性能的有效分子標記,為今后開展水牛標記輔助選擇育種研究提供可靠的理論基礎。
本試驗共檢測到MFSD2A基因7個SNPs位點,與305 d產奶量均顯著關聯,g.568 C>G和g.701 A>G位點與乳脂率顯著關聯,g.568 C>G、g.701 A>G、g.3326 G>A、g.8290 T>C和g.8523 C>G與乳蛋白率顯著關聯,這7個SNPs位點與乳尿素氮均無顯著關聯。純合子的基因型在高305 d產奶量和乳脂率的選擇上更有優(yōu)勢,H1(CAG)和D3(GG)單倍型是提高水牛305 d產奶量和乳蛋白率的有利單倍型。本試驗結果對今后開展水牛標記輔助選擇育種研究具有一定參考意義。