施俊安,劉凌斌,王麗輝
(1.重慶市畜牧科學院,重慶 402460;2.西南大學動物科學技術學院,重慶 400715)
全基因組關聯(lián)分析(Genome-wide association analysis,GWAS)是以生物體基因組中的單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)為分子遺傳標記,在全基因組水平上進行對照分析或相關性分析,通過比較發(fā)現(xiàn)影響復雜性狀的基因變異的一種新策略。GWAS的概念最早是由N.Risch等[1]提出。N.Risch等[1]研究指出,不同位點和復雜疾病之間的連鎖研究結(jié)果缺乏可復現(xiàn)性,利用候選基因關聯(lián)分析的效果要優(yōu)于發(fā)現(xiàn)主基因連鎖分析,復雜疾病遺傳學需要通過大規(guī)模關聯(lián)分析。隨后首次在植物[2]和人類[3]上的研究分別揭示了與海甜菜生長性狀相關的2個擴增片段長度多態(tài)性標記和人類視網(wǎng)膜黃斑病變相關的SNPs,之后GWAS技術開始被大范圍運用在生物研究領域中。
我國地形地勢多種多樣,造就了很多適應不同環(huán)境的家禽地方遺傳資源,地方品種有著肉質(zhì)鮮美多汁、抗逆性強、適應性強等優(yōu)點。隨著國民消費水平的提高,對蛋和肉的需求增多,同時加之外來品種市場的沖擊,使得地方品種生長緩慢、飼料報酬低、產(chǎn)蛋性能差等劣勢也突顯出來。隨著高通量測序技術和生物信息學技術高速發(fā)展,相關育種新技術在家禽領域也積累了大量研究成果。本文對近年來國內(nèi)外GWAS相關研究進行綜述,以期為家禽新品種選育和分子遺傳改良提供有效參考。
GWAS是以生物體基因組中數(shù)以百萬計的SNP為分子遺傳標記,在全基因組水平上進行對照分析或相關性分析,從而發(fā)現(xiàn)影響復雜性狀的基因變異的一種新策略。通過高通量和大數(shù)據(jù)為家禽遺傳改良提供方法指導,根據(jù)連鎖不平衡原理,在全基因組范圍搜索關聯(lián)度高于隨機關聯(lián)的基因序列,隨后在統(tǒng)計學理論的指導下,對結(jié)果進行分析并找到候選標簽的一種方法。
根據(jù)研究策略不同,GWAS研究可分為單階段設計和多階段設計。單階段設計需要的樣本群體很大,每個樣本均要進行SNP分型,針對不同研究性狀進行SNP相關性分析,需要投入大量資金,適用于基因組小的低等生物;多階段設計先在小樣本群體通過設置相對寬松的閾值篩選顯著SNPs,隨后在大群體針對這些顯著SNPs,進行分型研究,最后結(jié)合兩次結(jié)果分析統(tǒng)計,常用于人類復雜疾病研究[4-5]。根據(jù)研究對象不同,GWAS研究可以分為對照-病例分析、隨機群體關聯(lián)分析和不同家系關聯(lián)分析。這些方法本質(zhì)上均是比較同一性狀的不同表型分組之間的基因差異,對變異位點進行基因分型和頻率統(tǒng)計,進而篩選出基因變異和表型之間的最強關聯(lián)。根據(jù)研究性狀不同,質(zhì)量性狀一般采用Logistic回歸模型;數(shù)量性狀則采用線性模型。GWAS檢測技術主要包括三種。(1)基因芯片。該技術經(jīng)歷了三代變遷,DNA芯片和SNP芯片如今應用廣泛,可以檢測基因突變位點和新的SNPs,但是需要已知基因組序列。(2)簡化基因組。測序覆蓋范圍小,只有5%左右,會丟失大量有效SNP信息。(3)基因組重測序。重測序技術不需要已知基因組信息,通過對物種基因組重測序獲得大量變異信息,隨著測序深度增加對SNP的定位精度也增加[6]。GWAS的優(yōu)點主要有:(1)不需要已知功能基因位置信息便可進行基因組區(qū)域定位,通過基因功能注釋精確定位相關SNP和候選基因;(2)有助于發(fā)現(xiàn)新的生物學機制;(3)研究群體多樣化,不局限于樣本個體間有關系的群體;(4)數(shù)據(jù)方便共享和公開,可用的數(shù)據(jù)有助于新的發(fā)現(xiàn)[7]。缺點主要有:(1)結(jié)果受測序深度影響很大,不同測序深度得到的結(jié)果不盡相同;(2)大部分鑒定的單個SNP對性狀貢獻很低,是否具有實際意義有待更深地考究;(3)表型是受基因和環(huán)境共同影響的,可能同一群體在不同環(huán)境下性狀表現(xiàn)不同,GWAS在這種情況下普適性不足;(4)GWAS研究需要大量物力和財力投入。
2007年首篇家禽生長相關GWAS通過鑒定極端表型的雄性肉雞腹部脂肪百分比相關的SNPs,發(fā)現(xiàn)上位效應是雜種優(yōu)勢和隱性等位基因表達的共同潛在機制[8],在肥胖差異選擇下脂肪形成相關信號通路基因處于強選擇狀態(tài)[9]。孵化后雞心臟甲基化與孵化時蛋殼溫度和環(huán)境中CO2濃度相關,可能通過轉(zhuǎn)錄因子結(jié)合和基因差異甲基化影響心臟生長發(fā)育[10],TNFSF11與腸道長度、肝臟和胗或肺的重量顯著相關[11]。對肉雞和蛋雞進行GWAS篩選,發(fā)現(xiàn)基因主要富集在肌肉系統(tǒng)過程和離子轉(zhuǎn)運的負調(diào)控過程[12];基于單倍型對雞的胴體和生長性狀進行GWAS,檢測到腹脂沉積相關基因SHH和骨骼發(fā)育相關基因TNFRSF1B[13],通過檢測數(shù)量性狀基因座(Quantitative trait locus,QTL)定位了JDP2、PLCG1和HNF4a等調(diào)控脂肪沉積潛在候選基因[14];GJA1表達變化趨勢和胸肌發(fā)育過程中重量變化趨勢是一致的[15],RBPJ可能與雞的生長相關[16]。采食行為對體重的影響是最直接的,MINR和HTR2A是采食的主效基因,通過調(diào)節(jié)采食影響雞的生長[17];低剩余采食量雞可能通過減少細胞活動、免疫反應和體力活動的能量消耗優(yōu)化能量利用[18],gga-miR-15a上游13.55~45.16 kb區(qū)域與飼料轉(zhuǎn)化效率顯著相關[19]。通過比較180只雄性肉雞的生長性狀、飼料效率性狀和代謝效率性狀發(fā)現(xiàn)5個代 謝 效率性 狀 相關QTL[20];G.C.M.Moreira等[21]揭示了雞飼料效率和體重性狀之間的基因組關聯(lián)并發(fā)現(xiàn)11個基因與成骨、骨骼肌發(fā)育、生長、能量代謝和脂質(zhì)代謝相關?;驎ㄟ^多種途徑影響蛋雞骨強度[22],GAG1L與骨密度相關,RANKL、ADAMTS和SOST可作為雞骨質(zhì)疏松的候選基因[23],同時MXRA8促進小腿骨發(fā)育[24],F(xiàn).Tarsani等[25]對肉仔雞體重進行GWAS發(fā)現(xiàn)14個體重相關基因。對純種汶上肉雞[26]和京海黃雞[27]進行GWAS,分別檢測到體重相關SNP和基因LDB2和INTS6,對4個中國地方雞品種進行GWAS,發(fā)現(xiàn)多基因基礎和可變遺傳結(jié)構(gòu)導致雞體重具有復雜性[28]。生長發(fā)育是一個復雜的生物進程,生長是發(fā)育的物質(zhì)基礎,發(fā)育成熟狀況也反映了生長的量變,機體的正常發(fā)育需要所有器官系統(tǒng)的協(xié)同發(fā)展,因此可以從局部到整體進行基因功能探究。
隨著肉雞體重越來越大,肉品質(zhì)的保持便顯得尤為重要,劉大鵬等[29]利用“北京鴨×野鴨”的雜交F2代 進 行GWAS,發(fā) 現(xiàn)SERP1、SELENOT、EIF2A、TSC22D2、SIAH2是鴨胸肌肉色性狀潛在候選基因,并確定SELENOT是影響肌肉黃度的候選基因,BCMO1與胸肌肉色性狀相關[30];PIK3C2A、MAP3K13和LOC10174362可以作為屠體性狀的候選基因[31];ATP11A是脂肪型北京鴨屠體重、全凈膛重、半凈膛重和翅重性狀的候選基因[32]。在京海黃雞上發(fā)現(xiàn)FAM184B、QDPR和LDB2等基因和屠宰性狀相關[33],同時FAM124A、QDPR和LDB2等與上市體重存在相關[34],PGO2、SMARCA2和ZNF302等 和 翅 重 顯 著 相 關[35],LOC101747478、CBLN2、HPGDS等與肉質(zhì)性狀相關[36],GRIK1、NCAPG和KCNIP4等 與 體 組 成 相關[37]。隨著人們消費習慣的升級,現(xiàn)有肉雞品種遠遠不能滿足多元化需要以及不斷發(fā)展的市場需求,高度專門化新品系的培育及優(yōu)質(zhì)高效的新品種(配套系)的組建是未來雞育種目標的方向,這些候選基因的鑒定為后續(xù)的標記輔助選擇和分子育種改良提供有效參考。
對白來航蛋雞和矮腳褐殼蛋雞進行GWAS表明多個SNP顯著影響產(chǎn)蛋和蛋品質(zhì)[38],發(fā)現(xiàn)產(chǎn)蛋相關基因CDK1[39];FAM184B[40]等多個基因可能對京海黃雞繁殖性狀有著不同程度影響[41]。Shen M.M.等[42]通過GWAS定位了5個基因決定輸卵管特征,可以增進對輸卵管發(fā)育分子調(diào)控的理解;連鎖分析發(fā)現(xiàn)MIR1809、MIR6612和MIR6671影響北京油雞性腺發(fā)育[43];在對白來航雞和東鄉(xiāng)綠殼蛋雞進行遺傳差異的鑒別中發(fā)現(xiàn),ROBO1基因與卵泡發(fā)育有關[44]。一項京紅蛋雞產(chǎn)蛋性狀GWAS表明RAPGEF6和產(chǎn)蛋后期產(chǎn)蛋率顯著相關[45],且3號和13號染色體上有12個SNP與產(chǎn)蛋后期受精率顯著相關[46]。DTNC2H1和TLL1分別與俄羅斯白雞初產(chǎn)日齡和蛋重相關[47],GTF2A1、CLSPN和CALM1影響產(chǎn)蛋性狀[48],對東鄉(xiāng)綠殼蛋雞和白來航雞的生長和產(chǎn)蛋性狀進行GWAS,找到性染色體上DGKQ可能與類固醇激素系統(tǒng)相互作用影響25~45周總產(chǎn)蛋數(shù)[16]。小黃卵泡數(shù)量和DCLK1、NBEA和SMAD9有關,AMH和RGS3可以作為小黃卵泡預后生物標志物[49],POLA1和PDK3等是產(chǎn)蛋數(shù)相關候選基因[50]。一個蛋的生產(chǎn)從排卵至產(chǎn)出整個過程每一環(huán)節(jié)都很重要,通過對相關性狀進行進一步遺傳改良必定會提升家禽繁殖性能。
蛋品質(zhì)性狀主要包括外部品質(zhì)和內(nèi)部品質(zhì)[51],外部品質(zhì)主要包括蛋殼厚度、蛋殼強度、蛋殼顏色、蛋殼光滑度以及蛋的形狀等,內(nèi)部品質(zhì)主要包括蛋白濃度、蛋黃顏色以及營養(yǎng)素含量和膽固醇含量等[52]。對褐殼蛋雞系一個獨特資源群體進行GWAS,發(fā)現(xiàn)第2、12和17號染色體上QTL區(qū)域分別與蛋白高度(AH)、殼色(ESC)和產(chǎn)蛋量相關[53];MSX2在蛋白質(zhì)形成過程中間接影響AH和哈夫單位,而RHOA通過系統(tǒng)發(fā)育過程影響ESC[54]。在蛋殼強度方面,A.Wolc等[55]研究發(fā)現(xiàn)CAPN等多個與蛋殼形成相關的基因,SLC25A32被證實是形成斑點蛋的候選基因之一[56];對蛋殼超微結(jié)構(gòu)進行GWAS,檢測到719、784、1個和10個SNP分別與蛋殼厚度(EST)、有效層厚度(ET)、乳頭層厚度(MT)和乳頭密度(MD)顯著相關,ABCC9可能調(diào)控EST和ET,而ITM2C和KNDC1分 別 影 響MT和MD[57]。SHROOM3作為細胞骨架蛋白編碼基因,對蛋重有著顯著影響,ARL8A參與GTPase信號通路影響蛋殼厚度,HAS2與蛋殼顏色存在相關性[16],AJAP1表達量的高低決定綠殼蛋藍色深淺[58]。需求決定市場,市場決定研究方向,通過GWAS可以顯著推動蛋品質(zhì)性狀的后期選育,以滿足人們多樣化需求。
種蛋受精率和孵化率直接決定下一批雛禽的生產(chǎn)性能和企業(yè)產(chǎn)能,樊慶燦[59]發(fā)現(xiàn)PCNX和CDCA7是京海黃雞蛋孵化率相關候選基因,曹海月等[60]對比寧海黃雞和廣西黃雞找到ST8SIA1、ENC1、LOC101750905與死胚蛋數(shù)、受精率、入孵蛋孵化率和受精蛋孵化率相關。但從僅有的少量結(jié)果看來,孵化相關性狀的研究并不充分,需要進一步提高質(zhì)與量,才能在將來推動孵化性狀的遺傳改良。
細胞介導免疫會導致細胞內(nèi)抗原破壞和宿主細胞的清除,使得動物可以抵抗外源性抗原,一項在雞上的細胞介導免疫應答GWAS發(fā)現(xiàn)UBASH3B、CRTAM和MRPL21等基因在抗原加工呈遞、中間絲和蛋白絲途徑顯著富集[61]。鑰孔血藍蛋白(Keyhole limpet hemocyanin,KLH)與天然抗體(Natural antibodies,NAb)的結(jié)合水平與雞存活率相關,TLR1A和KLH-Blinding IgM NAb濃度顯著相關,通過對KLH結(jié)合的NAb進行選擇性育種可以提高雞綜合抗性進而提高其存活率[62],JARID2、RBMS3、GPC3和TRIB2與白來航雞免疫性狀相關[44]。禽流感、新城疫、寄生蟲病和腹水綜合征等是家禽生產(chǎn)中常見疾病,它們每年給養(yǎng)禽業(yè)造成了巨大的經(jīng)濟損失。雞對高致病性禽流感的抗性是一個復雜的多基因性狀且存在群體特異性[63],因此并不能很好地預測其遺傳多樣性[64],Sun Y.等[65]定位了兩個禽流感病毒抗體效價相關的基因LYRM4和KTN1。Z染色體上存在179 kb區(qū)域,含有3個SNP與紅細胞體積分布寬度相關,該指標和機體貧血相關,代表了機體血液攜氧能力的強弱,當機體含氧量不足時會導致肺動脈壓升高、右心室肥大、腹腔和心周積液,誘發(fā)腹水綜合征,MC4R和CDH6可以作為該病的候選基因[66],MC4R在動脈壓調(diào)節(jié)中發(fā)揮重要作用,CDH6對胚胎期腎小泡和近端小管發(fā)育至關重要,其異常表達將導致肉雞腹水綜合征進展過程中凝血異常和肺部血管病變。對雞進行新城疫疫苗免疫后發(fā)現(xiàn)ROBO1和ROBO2對新城疫病毒抗體應答顯著相關[67];雞白痢是一種雛雞易感的疾病,NKTR基因和該病顯著相關[68],F(xiàn)BXW7、LRBA與該病感染后沙門氏菌抵抗顯著相關[69],TRAF3和ggamir-489與宿主載體狀態(tài)顯著相關。雞腸道微生物GWAS發(fā)現(xiàn)感染白痢鏈球菌后宿主腸道微生物區(qū)系發(fā)生變化且存在多個免疫相關基因突變[70]。新城疫感染熱應激雞發(fā)現(xiàn)CAMK1d、CCDC3和TIRAP等基因與抗體效價相關[71];感染慢性新城疫病毒之后應激過程中CHORDC1影響生長,JAZF1與感染后雞的生長速率顯著相關[72]。首個馬立克氏病耐藥位點的研究定位了SMOC1和PTPN3與馬立克氏病抵抗顯著相關[73]。G.Banos等[74]利用GWAS結(jié) 合 全 基 因組測序檢測到與多個疾病相關的基因,研究表明MAP3K4和絳蟲抵抗相關,PTPN1和NFATC2與傳染性法氏囊病毒集體應答相關[75]。免疫和疾病是一對不可分割的關系,針對不同疾病需要免疫系統(tǒng)表達不同的基因,但也有少量基因具有多效性,可以對多種疾病發(fā)生免疫反應,在一定程度上具有廣譜效應。
GWAS是基因水平的研究策略,可以找到與家禽外貌特征相關的基因,這些研究在很大程度上對家禽外貌選育起到了積極的推動作用。阿勞卡納雞所特有的兩個Iroquois同源異型體基因Irx1和Irx2的錯誤表達是產(chǎn)生無尾性狀的基礎[76]。羽毛是一種復雜的皮膚衍生物,對禽類來說極其重要,決定了禽類通訊、防水和調(diào)節(jié)體溫的能力,HOXB8在羽毛發(fā)育中有著重要作用[77],SPEF2和PRLR可以作為壽光雞羽速表型的候選基因[78]。雞面頰本身的顏色影響著胴體外觀,EDN3與信陽綠殼蛋雞的面部色素沉著相關[79];耳垂也是雞面頰兩側(cè)的一個重要結(jié)構(gòu),其顏色和自身血管密度息息相關,PIK3CB、TP63和B4GALT1通過調(diào)節(jié)耳垂血管密度直接導致白色耳垂[80];雞的羽毛顏色由真黑素和類黑色素的比例決定,NUAK1和SHH在胚胎期神經(jīng)嵴細胞或成黑素細胞的發(fā)育中發(fā)揮作用,進而影響真黑素的色素沉著[81],對江西省9個地方品種黑羽的種群結(jié)構(gòu)進行研究,發(fā)現(xiàn)9個黑羽候選基因[82],GRM5是雞羽毛顏色相關的新候選基因[83],2號染色體上CA-BLES1可作為背羽顏色變異的候選基因[84],CCDC171對鵪鶉羽毛顏色存在顯著影響[85];足羽作為一種多基因性狀,在家雞和野生鳥類中存在,其特征是踝部和足部的羽毛部分或完全發(fā)育,PITX1和TBX5的異常表達和足羽形成有關,其中PITX1通過轉(zhuǎn)錄調(diào)控影響足羽,而TBX5是足羽發(fā)育的關鍵決定因子[86]。Sun H.Y.等[87]找到參與雞輪廓羽毛密度遺傳控制的5個候選基因,KRT75L4缺失突變導致麒麟雞生長出卷曲羽毛,降低了羽毛覆蓋率和雞對熱環(huán)境的適應力[88]。VPS36可能對雞冠性狀有影響[89],冠的顏色和產(chǎn)蛋量間存在著一定關聯(lián)[90],EDN3和BMP7在雞的不同顏色冠中存在表達差異,深色冠和雞低產(chǎn)蛋量的高發(fā)生率相關。異常表型研究中發(fā)現(xiàn)AOX1和ADAMTSL3調(diào)控區(qū)突變導致垂冠[91],LMBR1與多趾畸形相關[92],STMN1等與喙畸形顯著相關[93]。從家禽外貌特征的研究來看,我國有著得天獨厚的優(yōu)勢,有很多的地方品種,其體型外貌均各有特色,是一個有著豐富多樣性的基因庫,存在著很大的開發(fā)潛力。
除了常見生產(chǎn)性狀,在其他方面也篩到了候選基因,對7種鳥類和哺乳動物進行GWAS,發(fā)現(xiàn)多個基因與雞馴化后的行為表型相關[94],如SORCS2通過調(diào)節(jié)多巴胺能通路和神經(jīng)生長因子在雞的攻擊行為中發(fā)揮著重要作用[95],SLC12A9和GNG2與參與啄羽和攻擊行為的單胺信號轉(zhuǎn)導通路相關[96]。FOXG1是藏雞適應高海拔低氧環(huán)境主要候選基因[97];白來航蛋雞1號染色體上存在兩個與熱應激病死率相關的區(qū)域[98];在臺灣一個本地肉雞品系2號染色體上發(fā)現(xiàn)15個顯著的SNP與熱應激條件下的體溫相關[99]。鑒定發(fā)現(xiàn)LRRK2等基因影響血漿極低密度脂蛋白[100],另外,CPNE4的表達影響井陘黃雞肌糖原代謝[101]。
隨著科技不斷進步,GWAS也衍生出了針對性不同的技術,包括代謝組GWAS、基因表達GWAS和單倍型GWAS等檢測方法[102];越來越多定制芯片的問世,使得全基因組測序所需資金逐步降低,推動了不同物種的基因組測序工作日漸完備。家禽領域全基因組測序也得到了充分發(fā)展,把本文中涉及到的家禽生產(chǎn)性狀和相關候選基因的關系繪制成網(wǎng)絡圖,見圖1。
圖1 家禽主要經(jīng)濟性狀與候選基因
從圖1中可以看到家禽的生長、肉質(zhì)、繁殖、免疫等性狀均受到多個基因影響,說明這些性狀是數(shù)量性狀,由多個基因共同調(diào)控;同時也存在一個基因?qū)鄠€性狀的現(xiàn)象,說明這些基因具有多效性,能影響或調(diào)控多個性狀的形成,這也從側(cè)面反映這些性狀涉及的生理生化過程是相互聯(lián)系和相互依賴的。由于GWAS是大范圍的檢測,只提示某些基因與目標性狀具有關聯(lián)性,但候選基因在性狀發(fā)生發(fā)展中的具體作用機制還需大量功能試驗探究;另一方面,伴隨著技術和統(tǒng)計學方法不斷優(yōu)化,GWAS必然需要不斷推陳出新,以適應未來更多的樣本量和更復雜的群體分層結(jié)構(gòu)。