韓俊杰++王昊龍++李衛(wèi)華
摘要:關(guān)聯(lián)分析技術(shù)在植物中的應(yīng)用較晚,近些年才在植物數(shù)量性狀和植物遺傳育種研究中得以應(yīng)用。關(guān)聯(lián)分析以連鎖不平衡作圖(LD mapping)為基礎(chǔ),用來(lái)鑒定植物性狀與目標(biāo)基因之間的關(guān)系。關(guān)聯(lián)分析有很明顯的應(yīng)用優(yōu)勢(shì),它不僅不需要特殊的構(gòu)圖群體,而且還能夠同時(shí)對(duì)多個(gè)基因位點(diǎn)進(jìn)行檢測(cè),精度非常高。由于其良好的實(shí)用性,關(guān)聯(lián)分析技術(shù)已經(jīng)成為國(guó)際基因組學(xué)的研究熱點(diǎn)。介紹了LD的定義和度量方法,綜述了基于分子標(biāo)記的關(guān)聯(lián)分析在植物遺傳中的應(yīng)用,并對(duì)其在遺傳學(xué)中的應(yīng)用和發(fā)展作了展望。
關(guān)鍵詞:植物;分子標(biāo)記;關(guān)聯(lián)分析;連鎖不平衡;遺傳學(xué);應(yīng)用
中圖分類(lèi)號(hào): Q78文獻(xiàn)標(biāo)志碼: A文章編號(hào):1002-1302(2016)02-0013-05
關(guān)聯(lián)分析又稱(chēng)連鎖不平衡作圖(linkage disequilibrium mapping,LD mapping),是建立在連鎖不平衡的基礎(chǔ)上用于鑒定群體內(nèi)目標(biāo)性狀與遺傳標(biāo)記相關(guān)關(guān)系的方法[1]。關(guān)聯(lián)分析最早在人類(lèi)疾病的研究中得以應(yīng)用,并取得了豐碩的成果,目前在人類(lèi)不同致病基因方面已有許多成功的報(bào)道[2]。在動(dòng)物中的應(yīng)用也相對(duì)較多,如在奶牛、魚(yú)、羊、豬、雞中的應(yīng)用等。然而,由于目前對(duì)植物基因組LD結(jié)構(gòu)的認(rèn)識(shí)還不夠全面,導(dǎo)致關(guān)聯(lián)分析在植物中的應(yīng)用相對(duì)較少[3]。但是,隨著生物信息學(xué)、統(tǒng)計(jì)學(xué)和基因組學(xué)技術(shù)的快速發(fā)展,關(guān)聯(lián)分析也已成功應(yīng)用到許多植物上,如玉米、小麥、擬南芥、大麥、大豆等。近年來(lái),許多植物的全基因組測(cè)序已經(jīng)完成,這極大地促進(jìn)了基因組學(xué)的發(fā)展,特別是近年來(lái)大量單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP)標(biāo)記的開(kāi)發(fā),關(guān)聯(lián)分析在植物關(guān)鍵基因的發(fā)掘上更是得到了廣泛的應(yīng)用,可為植物分子育種提供標(biāo)記,在國(guó)際上已經(jīng)成為熱點(diǎn)研究方向。
關(guān)聯(lián)分析通過(guò)群體上的進(jìn)化歷史和重組,可以在序列水平上來(lái)研究復(fù)雜的數(shù)量性狀,因此與其他分析手段相比,關(guān)聯(lián)分析有其獨(dú)特的優(yōu)勢(shì):(1)所需時(shí)間短,用自然群體作為材料,不需要專(zhuān)門(mén)構(gòu)建,且有較大的選擇范圍,相對(duì)于數(shù)量性狀基因座(QTL)至少需要2年以上的群體能節(jié)約大量的時(shí)間;(2)檢測(cè)范圍大,同一座位的不同基因可以用來(lái)同時(shí)檢測(cè),而QTL作圖只能檢測(cè)來(lái)自雙親的2個(gè)等位基因;(3)準(zhǔn)確度高,QTL作圖精度一般在10~30cM左右,很少能在基因水平上被標(biāo)記,而關(guān)聯(lián)分析可達(dá)到單基因的水平[4-5],如Gebhardt等利用關(guān)聯(lián)分析方法將馬鈴薯抗晚瘟病基因RI定位在0.2cM的基因組區(qū)段內(nèi)[6]。在植物相關(guān)研究中,由于其雜交方式和重復(fù)類(lèi)型都可以得到人為有效控制,因此關(guān)聯(lián)分析在植物中的應(yīng)用比在動(dòng)物中的吸引力更高。
作物很多重要的農(nóng)藝性狀(如株高、產(chǎn)量、營(yíng)養(yǎng)品質(zhì)和抗病性等)都屬于數(shù)量性狀,了解這些數(shù)量性狀的遺傳規(guī)律對(duì)作物的改良有重要意義。目前,人們主要是通過(guò)全基因組圖譜和QTL定位來(lái)了解植物數(shù)量性狀,而關(guān)聯(lián)分析是QTL定位的有效手段,在分子育種中發(fā)揮了重要作用。近年來(lái),隨著新一代分子標(biāo)記——SNPs標(biāo)記技術(shù)的出現(xiàn)以及植物基因組測(cè)序技術(shù)日趨成熟,植物遺傳學(xué)研究已經(jīng)進(jìn)入基因組研究時(shí)代。如今,在許多重要作物中都已經(jīng)應(yīng)用到關(guān)聯(lián)分析技術(shù)[7-8],不僅應(yīng)用到模式植物、三大糧食作物,還在甘蔗、大豆、馬鈴薯、甜菜、番茄和向日葵等其他植物中得到大量的應(yīng)用。
1關(guān)聯(lián)分析的統(tǒng)計(jì)學(xué)意義
1.1LD連鎖不平衡
Jennings于21 世紀(jì)初期提出了LD這一概念[9],這是自然選擇中的一種現(xiàn)象。在某一群體中,如果2個(gè)等位基因同時(shí)出現(xiàn)的概率與期望值不相同時(shí),那么它們就處于LD狀態(tài)。連鎖不平衡和遺傳連鎖是不相同的,遺傳連鎖指的是由于物理作用而導(dǎo)致的不同位點(diǎn)不分開(kāi)的現(xiàn)象,而連鎖不平衡則是等位基因間的作用。當(dāng)2個(gè)基因位點(diǎn)緊密連鎖時(shí),就會(huì)導(dǎo)致LD值處在比較高的水平。關(guān)聯(lián)分析是基于LD的,對(duì)LD結(jié)構(gòu)的了解是關(guān)聯(lián)分析的前提。因此影響LD的因素同樣影響關(guān)聯(lián)分析的結(jié)果,這些因素有選擇、突變、重組、遺傳漂變、群體混合等。選擇、遺傳漂變和群體混合會(huì)增加LD程度,使關(guān)聯(lián)分析的精確性降低;而突變和重組由于多態(tài)性位點(diǎn)的產(chǎn)生而破壞LD狀態(tài),因此突變和重組是影響LD的2個(gè)最主要的因素。標(biāo)記類(lèi)型也是LD的1個(gè)影響因素,Remington等用SSR標(biāo)記和SNPs對(duì)來(lái)自全世界的102份常用玉米育種自交系全基因組標(biāo)記的LD大小進(jìn)行了研究,結(jié)果表明SSR標(biāo)記檢測(cè)的LD水平明顯偏高,這說(shuō)明在反映群體演化中SSR標(biāo)記更有說(shuō)服力[10]。另外,授粉方式也是影響LD的因素,一般而言異花授粉重組率高于自花授粉,其LD水平相較于自花授粉作物要低,所以異化授粉作物作關(guān)聯(lián)分析的效果要好于自花授粉作物。
1.2LD度量
LD統(tǒng)計(jì)的是2個(gè)不同位點(diǎn)在實(shí)際觀測(cè)中同時(shí)出現(xiàn)的頻率與隨機(jī)分離時(shí)期望同時(shí)出現(xiàn)的頻率之間的差異,即D。假設(shè)有2個(gè)連鎖的位點(diǎn)A、B,則A、a和B、b是其4種等位基因,頻率分別為φA、φa、φB、φb;AB、aB、Ab、ab的頻率分別為φAB、φaB、φAb、φab。那么D的計(jì)算公式為:Dab=φAB-φAφB。D=0時(shí),2個(gè)基因座位處于連鎖平衡狀態(tài);D=1時(shí),2個(gè)基因座完全關(guān)聯(lián);0 [JZ(]γ2=D2 /(φAφaφBφb);[JZ)][JY] (1) [JZ]D′=D2/min(φAφb,φaφB)(D<0); 或: [JZ(]D′=D2/min(φAφB,φaφb)(D>0)。 [JZ)][JY] (2) D′、γ2代表的意義是不同的,它們的取值范圍都是0~1。D′僅包括重組史,對(duì)于一些稀有的等位基因來(lái)說(shuō),D′可能比較大,有較高的LD水平。在小樣本研究中,由于這4種等位基因相互組合的可能性較小,D′不能準(zhǔn)確反映群體LD水平。γ2包括重組史、突變史,γ2可以反映標(biāo)記是否與QTL有關(guān),因此在關(guān)聯(lián)分析中通常用γ2來(lái)表示群體的LD水平[12]。而在實(shí)際的統(tǒng)計(jì)過(guò)程中,發(fā)生的頻率低于0.05或0.1的變異基本上都是可以忽略不計(jì)的。
由于不同作物群體的LD程度是不同的,而這恰恰是影響關(guān)聯(lián)分析有效性的主要因素。對(duì)LD結(jié)構(gòu)有效利用,變異位點(diǎn)與表型性狀關(guān)聯(lián),作出更加精確的高分辨率圖譜,在生物基因組的研究上意義重大。在關(guān)聯(lián)分析研究中,LD弱的群體找到與目的基因連鎖的標(biāo)記相對(duì)較為容易,易于實(shí)現(xiàn)精確作圖;LD強(qiáng)的群體,找到與目標(biāo)基因緊密連鎖的標(biāo)記較為困難,不易于實(shí)現(xiàn)精確作圖。
2關(guān)聯(lián)分析的研究方法
目前關(guān)聯(lián)分析常用的研究方法有2種:全基因組掃描和候選基因途徑。全基因組掃描是在標(biāo)記水平上對(duì)一些突變位點(diǎn)進(jìn)行掃描,這些突變位點(diǎn)可能造成表型變異;而候選基因途徑則是通過(guò)統(tǒng)計(jì)分析將那些與目標(biāo)性狀相關(guān)的等位基因從種質(zhì)資源中挖掘出來(lái),是在基因序列水平上進(jìn)行的。
2.1全基因組掃描的關(guān)聯(lián)分析
在全基因組范圍內(nèi)對(duì)分子標(biāo)記進(jìn)行掃描,將所得分子標(biāo)記數(shù)據(jù)與表型性狀進(jìn)行關(guān)聯(lián)分析。本方法需要的標(biāo)記密度很高,如大量的簡(jiǎn)單序列重復(fù)(SSR)、SNP標(biāo)記等,但是不需要對(duì)研究對(duì)象再作任何假設(shè),直接對(duì)全基因組的DNA變異進(jìn)行研究。但是全基因組關(guān)聯(lián)分析花費(fèi)巨大、耗時(shí)較多,目前完成起來(lái)困難重重。
對(duì)野生甜菜的研究是全基因組關(guān)聯(lián)分析的最早應(yīng)用[13]。在試驗(yàn)中發(fā)現(xiàn),甜菜抽薹基因B與440個(gè)擴(kuò)增片段長(zhǎng)度多態(tài)性(AFLP)標(biāo)記中的2個(gè)顯著相關(guān),并且存在1個(gè)與B基因緊密連鎖的標(biāo)記。這一結(jié)果表明,關(guān)聯(lián)分析可以用來(lái)發(fā)掘與目的基因連鎖的分子標(biāo)記。此后越來(lái)越多的人通過(guò)關(guān)聯(lián)分析的手段在全基因組水平上對(duì)不同作物的不同性狀進(jìn)行分析,以期發(fā)掘出與性狀緊密連鎖的標(biāo)記位點(diǎn)。Huang等對(duì)水稻進(jìn)行全基因組關(guān)聯(lián)分析,在950個(gè)品種中分別檢測(cè)出32、10個(gè)與開(kāi)花期、產(chǎn)量性狀顯著相關(guān)的位點(diǎn)[14]。Weng等用41 101個(gè)SNP 對(duì)284個(gè)玉米自交系進(jìn)行全基因組關(guān)聯(lián)分析,鑒定出105個(gè)與株高相關(guān)的遺傳位點(diǎn),并借助關(guān)聯(lián)分析進(jìn)行精心作圖,實(shí)現(xiàn)了抗玉米絲黑穗病主效位點(diǎn)精細(xì)定位[15]。張煥欣等同樣用41 101個(gè)SNP 標(biāo)記對(duì)203份玉米自交系進(jìn)行全基因組關(guān)聯(lián)分析,發(fā)現(xiàn)9個(gè)與穗行數(shù)顯著關(guān)聯(lián)的SNP[16]。連鎖分析、關(guān)聯(lián)分析都可以進(jìn)行QTL定位,而連鎖分析檢測(cè)到的QTL數(shù)目一般少于關(guān)聯(lián)分析;2種方法檢測(cè)到的QTL在位置上有相當(dāng)一部分具有一致性。這也表明,進(jìn)行全基因組的關(guān)聯(lián)分析是對(duì)植物數(shù)量性狀研究的一條有效途徑。由于全基因組關(guān)聯(lián)分析可以同時(shí)對(duì)很多個(gè)基因位點(diǎn)進(jìn)行檢測(cè),并且不需要對(duì)特定的基因位點(diǎn)進(jìn)行假設(shè),因此全基因組關(guān)聯(lián)分析可以大大減少所需成本,加快植物分子育種的研究進(jìn)程。
2.2候選基因的關(guān)聯(lián)分析
候選基因的關(guān)聯(lián)分析對(duì)性狀的表型鑒定數(shù)據(jù)和候選基因的多態(tài)性進(jìn)行關(guān)聯(lián)分析,將對(duì)目標(biāo)性狀有貢獻(xiàn)的等位基因從基因水平上發(fā)掘出來(lái),一般涉及候選基因的功能預(yù)測(cè)。這需要對(duì)目標(biāo)基因有一定的了解,目前應(yīng)用比較多,特別是在多基因控制的性狀(如抗病性、抗逆性)研究中具有十分重要的作用。
候選基因關(guān)聯(lián)分析在植物上的應(yīng)用起步較晚。2001年,Thornsberry等第1次將關(guān)聯(lián)分析應(yīng)用到對(duì)玉米基因的研究中[17],這意味著關(guān)聯(lián)分析可用于驗(yàn)證基因功能和發(fā)掘新基因,為植物數(shù)量性狀研究提供了新的思路?;诤蜻x基因關(guān)聯(lián)分析在玉米上的研究或許能作為典型代表。Tian等為鑒定影響玉米花期性狀的遺傳位點(diǎn),選用含5 000個(gè)重組自交系(RIL)的玉米巢式作圖群體作關(guān)聯(lián)分析,成功鑒定出其候選基因[18]。Salvi等對(duì)參與玉米開(kāi)花期的基因[WTBX][STBX]Vgt1[WTBZ][STBZ]也進(jìn)行了基于候選基因策略的關(guān)聯(lián)分析[19-20]。在研究與淀粉代謝有關(guān)的關(guān)鍵酶基因及其核苷酸LD的基礎(chǔ)上,Wilson等選擇6個(gè)基因的不同區(qū)域進(jìn)行關(guān)聯(lián)分析,發(fā)現(xiàn)有4個(gè)與玉米籽粒各成分和淀粉糊化特性的一些指標(biāo)呈顯著相關(guān)[21]。于永濤運(yùn)用候選基因關(guān)聯(lián)分析法,選出了94份能代表我國(guó)玉米核心種質(zhì)的自交系,采用關(guān)聯(lián)分析方法鑒定候選基因[WTBX][STBX]rab17[WTBZ][STBZ]并成功檢測(cè)到6個(gè)與表型性狀相關(guān)的位點(diǎn)[22]。Ravel等以控制高分子谷蛋白亞基的2個(gè)QTL位點(diǎn)為候選基因,對(duì)113份小麥進(jìn)行關(guān)聯(lián)分析,發(fā)現(xiàn)其中1個(gè)QTL位點(diǎn)與所測(cè)性狀存在顯著關(guān)聯(lián)[23]。Zheng等使用7個(gè)與小麥品質(zhì)相關(guān)的候選基因?qū)?6份小麥栽培種和高代品系進(jìn)行關(guān)聯(lián)分析發(fā)現(xiàn),個(gè)體親緣關(guān)系分析可以起到改進(jìn)小麥品質(zhì)性狀關(guān)聯(lián)分析的效果[24]。另外,基于候選基因的關(guān)聯(lián)分析在大麥、高粱、棉花、番茄等作物中也多見(jiàn)報(bào)道。
對(duì)于全基因組序列已經(jīng)獲得的材料,可以先通過(guò)QTL把候選基因在基因序列上的位置縮小,然后利用生物信息學(xué)手段排除多的冗余序列,再對(duì)候選基因進(jìn)行關(guān)聯(lián)分析,這樣就可以比較快速地找到目標(biāo)性狀的候選基因。
3基于分子標(biāo)記的關(guān)聯(lián)分析及在植物研究中的應(yīng)用
全基因組關(guān)聯(lián)分析需要大量的分子標(biāo)記,隨著許多物種測(cè)序工作的逐步完成,各種標(biāo)記類(lèi)型的大量開(kāi)發(fā),關(guān)聯(lián)分析在鑒定植物數(shù)量性狀上將表現(xiàn)出更大的應(yīng)用潛力。目前,已有很多分子標(biāo)記在植物性狀關(guān)聯(lián)分析中得到成功應(yīng)用。
3.1AFLP標(biāo)記與關(guān)聯(lián)分析
在植物研究中,首次運(yùn)用全基因組掃描方法進(jìn)行關(guān)聯(lián)分析的是2001年Hansen等對(duì)野生甜菜生長(zhǎng)習(xí)性的研究[13]。2004年,Kraakman等對(duì)春大麥品種產(chǎn)量特征作關(guān)聯(lián)分析時(shí),發(fā)現(xiàn)所用的236個(gè)AFLP標(biāo)記中有8個(gè)與產(chǎn)量相關(guān)聯(lián),有5個(gè)與產(chǎn)量穩(wěn)定性相關(guān)聯(lián)[25]。在2006年,Kraakman等又利用148份春大麥栽培種的部分性狀與AFLP標(biāo)記進(jìn)行LD作圖,找到與性狀對(duì)應(yīng)的標(biāo)記位點(diǎn),證明LD作圖是尋找標(biāo)記位點(diǎn)的另一種重要途徑[26]。王蕾等以215份芝麻核心種質(zhì)為材料進(jìn)行芝麻素、芝麻酚林與SSR、AFLP、SRAP標(biāo)記的關(guān)聯(lián)分析,發(fā)現(xiàn)33個(gè)標(biāo)記位點(diǎn)與供試群體的芝麻素、芝麻酚林極顯著關(guān)聯(lián),與芝麻酚林極顯著關(guān)聯(lián)的8個(gè)位點(diǎn)中有1個(gè)AFLP標(biāo)記[27]。楊鑫雷等以陸地棉和海島棉為材料,設(shè)計(jì)20對(duì)AFLP引物,共發(fā)現(xiàn)有125個(gè)位點(diǎn),用這些位點(diǎn)與不同的農(nóng)藝性狀進(jìn)行關(guān)聯(lián),發(fā)現(xiàn)有15個(gè)位點(diǎn)與不同的性狀有著顯著相關(guān)性,其中6個(gè)AFLP位點(diǎn)可以用于分子標(biāo)記輔助育種[28]。AFLP標(biāo)記用到的選擇引物較少,并且可以在短時(shí)間內(nèi)檢測(cè)大量的位點(diǎn),作為一種高密度標(biāo)記系統(tǒng),結(jié)合關(guān)聯(lián)分析應(yīng)用時(shí),可以作為全基因組作圖和基因定位的一種補(bǔ)充手段,依然具有很大的應(yīng)用價(jià)值。
3.2限制性片段長(zhǎng)度多態(tài)性(RFLP)標(biāo)記與關(guān)聯(lián)分析
由于RFLP分子標(biāo)記有限,因此其應(yīng)用也是有限的,只能作為一種初級(jí)工具使用。Beer等利用64個(gè)燕麥地方品種分析13個(gè)QTL區(qū)域的RFLP位點(diǎn)與表型的相關(guān)性,在未考慮群體結(jié)構(gòu)的前提下檢測(cè)到了較多的顯著關(guān)聯(lián)[29]。RFLP雖然應(yīng)用有限,但是其結(jié)果穩(wěn)定、重復(fù)性好,在關(guān)聯(lián)分析中應(yīng)用時(shí),仍然可以作為分子標(biāo)記輔助育種的手段。而且在鑒定外源染色體、確定易位系的易位斷點(diǎn)、定位外源基因和水稻秈粳分類(lèi)及度量秈粳分化程度等方面也有很好的應(yīng)用。
3.3SSR標(biāo)記與關(guān)聯(lián)分析
SSR標(biāo)記在關(guān)聯(lián)分析中的應(yīng)用較多,在不同的作物中都有大量應(yīng)用,并取得了豐碩的研究成果。2006年,F(xiàn)lavio等為了驗(yàn)證已開(kāi)發(fā)的18個(gè)SSR標(biāo)記和籽粒性狀之間的關(guān)系,采用不同的小麥品種進(jìn)行關(guān)聯(lián)分析,發(fā)現(xiàn)其中有3個(gè)標(biāo)記與籽粒寬度存在顯著關(guān)聯(lián)[30]。Parisseaux等利用全基因組掃描,對(duì)與玉米不同性狀相關(guān)的QTL進(jìn)行圖譜定位查詢,將1 266個(gè)玉米品種自交系分為A~I(xiàn) 9個(gè)組,并對(duì)不同的組進(jìn)行7年多地點(diǎn)試驗(yàn),用SSR標(biāo)記對(duì)相關(guān)性狀進(jìn)行關(guān)聯(lián)分析,發(fā)現(xiàn)與株高、黑穗病抗性、籽粒含水量相關(guān)聯(lián)的SSR標(biāo)記分別有37、24、44個(gè)[31]。Malysheva-Otto 等對(duì)953個(gè)大麥栽培種進(jìn)行研究,用48個(gè)SSR標(biāo)記分析了它們?cè)谌旧w上的LD水平,發(fā)現(xiàn)LD衰減的距離在 1~150cM,這表明其標(biāo)記位點(diǎn)之間連鎖不緊密,LD水平較高[32]。劉新倫等對(duì)小麥99個(gè)SSR標(biāo)記作關(guān)聯(lián)分析發(fā)現(xiàn),有16個(gè)標(biāo)記與麥長(zhǎng)管蚜抗性相關(guān)聯(lián)[33]。孫曉棠等對(duì)456 份水稻材料的144個(gè)SSR標(biāo)記與紋枯病抗性進(jìn)行關(guān)聯(lián)分析表明,有13個(gè)標(biāo)記位點(diǎn)與紋枯病抗性顯著關(guān)聯(lián),并發(fā)現(xiàn)3個(gè)新的抗病相關(guān)位點(diǎn)[34]。范虎等利用SSR標(biāo)記對(duì)大豆不同的農(nóng)藝性狀進(jìn)行關(guān)聯(lián)分析,共獲得51個(gè)與籽粒和花期等性狀相關(guān)聯(lián)的位點(diǎn),其中與QTL定位一致的有16個(gè)[35]。左巧美等研究發(fā)現(xiàn),有40個(gè)SSR位點(diǎn)與大豆生育期性狀關(guān)聯(lián),與光溫反應(yīng)值相關(guān)的位點(diǎn)有5個(gè)[36]。同樣是對(duì)大豆相關(guān)性狀的關(guān)聯(lián)分析,王歡等研究發(fā)現(xiàn),有33個(gè)SSR標(biāo)記位點(diǎn)與大豆花莢脫落性顯著相關(guān)[37]。陳氏秋江等對(duì)不同地區(qū)的540份水稻品種用262個(gè)SSR標(biāo)記進(jìn)行基因組變異掃描檢測(cè)到與粒長(zhǎng)、粒寬、粒厚顯著相關(guān)的標(biāo)記位點(diǎn)分別有45、7、11個(gè)[38]。賀道華等利用132個(gè)SSR標(biāo)記,對(duì)92份栽培棉花進(jìn)行全基因組掃描,獲得了21個(gè)與棉花纖維品質(zhì)相關(guān)的SSR位點(diǎn)[39]。邵冰欣等利用SSR分子標(biāo)記對(duì)134份陸地棉栽培種進(jìn)行檢測(cè),共檢測(cè)出148個(gè)多態(tài)性位點(diǎn),涉及246個(gè)等位變異,關(guān)聯(lián)分析共發(fā)現(xiàn)與棉花耐鹽性狀相關(guān)的SSR分子標(biāo)記位點(diǎn)有8個(gè)[40]。這些研究表明,關(guān)聯(lián)分析在探究標(biāo)記與相關(guān)性狀的關(guān)聯(lián)性、發(fā)掘功能位點(diǎn)的研究中具有重要作用。
3.4SNP標(biāo)記與關(guān)聯(lián)分析
單核苷酸多態(tài)性是由單堿基的轉(zhuǎn)化、顛換,以及單堿基的插入和缺失等改變引起的[41],作為第3代標(biāo)記類(lèi)型,它比RFLP、SSR標(biāo)記等更有優(yōu)勢(shì),是目前所有標(biāo)記類(lèi)型中精確度最高的標(biāo)記類(lèi)型。隨著大量SNP標(biāo)記的開(kāi)發(fā),基于SNP標(biāo)記的關(guān)聯(lián)分析成為研究植物數(shù)量性狀的重要手段。
Christian等利用56 110個(gè)SNP 標(biāo)記對(duì)289份玉米自交系的表型和生理性狀進(jìn)行全基因組關(guān)聯(lián)分析,最后找到15個(gè)SNP標(biāo)記與生理性狀顯著關(guān)聯(lián)[42]。Aranzana等為了研究擬南芥的花期和抗病性與SNP位點(diǎn)的相關(guān)性,利用覆蓋全基因組的2 553個(gè)SNP標(biāo)記作關(guān)聯(lián)分析,結(jié)果表明有4個(gè)基因與目標(biāo)性狀存在關(guān)聯(lián)[43]。姚玉瑩對(duì)水稻作全基因組關(guān)聯(lián)分析,發(fā)現(xiàn)在檢測(cè)到的48個(gè)SNPs中有6個(gè)與水稻種質(zhì)資源農(nóng)藝性狀顯著相關(guān)[44]。Beló等鑒定出了與油酸含量相關(guān)的主效位點(diǎn)[45],采用全基因組掃描的方法,對(duì)553份優(yōu)良自交系的 8 950 個(gè)SNP位點(diǎn)與油酸性狀進(jìn)行關(guān)聯(lián)分析表明,1個(gè)油酸去飽和酶基因[WTBX][STBX]fad2[WTBZ][STBZ]與油酸含量相關(guān)聯(lián)。任鳳陽(yáng)用玉米10條染色體上的35 171個(gè)SNP標(biāo)記對(duì)172 份玉米自交系在干旱脅迫條件下的相對(duì)發(fā)芽率、相對(duì)活力指數(shù)以及綜合指標(biāo)進(jìn)行關(guān)聯(lián)分析,發(fā)現(xiàn)與3個(gè)指標(biāo)相關(guān)聯(lián)的標(biāo)記有114個(gè),其中20個(gè)SNP標(biāo)記與相對(duì)發(fā)芽率關(guān)聯(lián)、53個(gè)SNP標(biāo)記與相對(duì)活力指數(shù)關(guān)聯(lián)、41個(gè)SNP 標(biāo)記與綜合指標(biāo)關(guān)聯(lián)[46]。Hao等對(duì)191個(gè)大豆地方品種的209個(gè)單倍型和1 536個(gè)SNP位點(diǎn)分析,得到與產(chǎn)量性狀顯著相關(guān)的19個(gè)SNP標(biāo)記位點(diǎn)[47]。姜曉東等通過(guò)對(duì)58份大麥品種中[WTBX][STBX]Amy6-4[WTBZ][STBZ]基因核苷酸多態(tài)性與α-淀粉酶活性的關(guān)聯(lián)分析發(fā)現(xiàn),[WTBX][STBX]Amy6-4[WTBZ][STBZ] 基因的7個(gè)SNP 位點(diǎn)及其構(gòu)成的單倍型均與酶活性無(wú)關(guān)聯(lián)性[48]。
在植物遺傳研究中,各種類(lèi)型的分子標(biāo)記不斷被發(fā)現(xiàn),特別是SNP高密度圖譜構(gòu)建,對(duì)目標(biāo)QTL的定位越來(lái)越精細(xì)。關(guān)聯(lián)分析在QTL定位中的應(yīng)用也日趨成熟,已經(jīng)由最初應(yīng)用于候選基因的功能驗(yàn)證發(fā)展為全基因組關(guān)聯(lián)分析,成為挖掘作物數(shù)量性狀新基因的強(qiáng)力工具。如在玉米的研究中,美國(guó)農(nóng)業(yè)部建立了代表全球玉米種質(zhì)多樣性的巢式關(guān)聯(lián)圖譜群體,并通過(guò)全基因組關(guān)聯(lián)分析鑒定了1批與農(nóng)藝性狀相關(guān)的QTL。目前,基于分子標(biāo)記的關(guān)聯(lián)分析已經(jīng)得到了十分廣泛的應(yīng)用,通過(guò)關(guān)聯(lián)分析可以找到與性狀相關(guān)的位點(diǎn)、實(shí)現(xiàn)標(biāo)記的精確定位,也能夠?qū)蜻x基因進(jìn)行多態(tài)性分析、驗(yàn)證候選基因功能。利用連鎖分析作圖,一般其QTL位點(diǎn)目的基因之間的圖距都比較大,而關(guān)聯(lián)分析鑒定標(biāo)記則可以達(dá)到單基因水平,使精度得到很大的提升,在分子標(biāo)記輔助育種(molecular assisted selection,MAS)中可極大地提高選擇的目的性和準(zhǔn)確性,進(jìn)而提高育種效率。分子標(biāo)記在關(guān)聯(lián)分析中的應(yīng)用價(jià)值巨大,可以明確目的基因與目標(biāo)性狀之間的內(nèi)在關(guān)系、鑒定評(píng)價(jià)多個(gè)基因等。通過(guò)關(guān)聯(lián)分析對(duì)大量等位基因分析,不但有助于了解不同基因變異對(duì)基因功能的影響,同時(shí)還可以通過(guò)基因變異發(fā)現(xiàn)最適合的等位基因,為深入了解植物數(shù)量性狀、作物數(shù)量性狀的遺傳改良提供新的手段。
另外,關(guān)聯(lián)分析在功能基因的驗(yàn)證上也得到了很好的應(yīng)用。由于植物的很多性狀都屬于數(shù)量性狀,由多個(gè)途徑共同控制,很難通過(guò)轉(zhuǎn)化的方法予以驗(yàn)證。例如著名的“黃金水稻”,通過(guò)把控制類(lèi)胡蘿卜素合成的4個(gè)基因同時(shí)轉(zhuǎn)入水稻,才獲得了能合成類(lèi)胡蘿卜素的黃金水稻。在對(duì)目的基因的代謝網(wǎng)絡(luò)不清楚的情況下,可以用關(guān)聯(lián)分析技術(shù)來(lái)驗(yàn)證,例如Palaisa對(duì)維生素A的2個(gè)限速酶基因[WTBX][STBX]Y1、PSY2[WTBZ][STBZ]在黃色玉米(含類(lèi)胡蘿卜素)、白色玉米(不含類(lèi)胡蘿卜素)中進(jìn)行分析發(fā)現(xiàn),[WTBX][STBX]Y1[WTBZ][STBZ]基因是控制類(lèi)胡蘿卜素的關(guān)鍵基因,[WTBX][STBX]PSY2[WTBZ][STBZ]則可能是假基因[49]。
4存在的問(wèn)題與展望
對(duì)植物基因組的研究目前正由簡(jiǎn)單性狀到復(fù)雜性狀過(guò)渡,傳統(tǒng)的QTL已經(jīng)逐漸失去優(yōu)勢(shì),建立在“自然群體”上的關(guān)聯(lián)分析則成為研究的熱點(diǎn)。但是,關(guān)聯(lián)分析仍然存在一些問(wèn)題,如關(guān)聯(lián)分析數(shù)據(jù)量太大,而統(tǒng)計(jì)處理的方法還有待提高;群體結(jié)構(gòu)的影響;另外,對(duì)于遺傳多樣性不高的群體,關(guān)聯(lián)分析作圖并不理想。然而,隨著各種生物學(xué)手段和生物技術(shù)得到飛速發(fā)展、基因型分析技術(shù)和高通量測(cè)序技術(shù)的不斷提高,關(guān)聯(lián)分析必將在植物遺傳學(xué)研究中發(fā)揮更為重要的作用。與此同時(shí),關(guān)聯(lián)分析在植物種質(zhì)資源的遺傳改良和種質(zhì)創(chuàng)新領(lǐng)域也有重大應(yīng)用價(jià)值,關(guān)聯(lián)分析的應(yīng)用大大加快了種質(zhì)資源的研究進(jìn)程(如核心種質(zhì)資源庫(kù)的構(gòu)建)。關(guān)聯(lián)分析技術(shù)雖然已有多項(xiàng)成功運(yùn)用的報(bào)道,但是在植物上的應(yīng)用還是相對(duì)較少,因此在植物遺傳領(lǐng)域具有巨大的應(yīng)用價(jià)值和發(fā)展?jié)摿Α?/p>
[HS2][HT8.5H]參考文獻(xiàn):[HT8.SS]
[1][ZK(#]Flint-Garcia S A,Thornberry J M. Structure of linkage disequilibrium in plants[J]. Annual Review of Plant Biology,2003,54(1):357-374.
[2]Gibbs R A,Belmont J W,Hardenbol P,et al. The international HapMap project[J]. Nature,2003,426(6968):789-796.
[3]Flint-Garcia S A,Anne-Céline T,Yu J,et al. Maize association population:a high-resolution platform for quantitative trait locus dissection[J]. The Plant Journal:for Cell and Molecular Biology,2005,44(6):1054-1064.
[4]Flint-Garcia S A,Thornberry J M. Structure of linkage disequilibrium in plants[J]. Annual Review of Plant Biology,2003,54(4):357-374.
[5]Yu J,Buckler E S. Genetic association mapping and genome organization of maize[J]. Current Opinion in Biotechnology,2006,17(2):155-160.
[6]Gebhardt C,Ballvora A,Walkemeier B,et al. Assessing genetic potential in germplasm collections of crop plants by marker-trait association:a case study for potatoes with quantitative variation of resistance to late blight and maturity type[J]. Molecular Breeding,2004,13(1):93-102.
[7]Breseghello F,Sorrells M E. Association analysis as a strategy for improvement of quantitative traits in plants[J]. Crop Science,2006,46(3):1323-1330.
[8]Gupta P K,Rustgi S,Kulwal P L. Linkage disequilibrium and association studies in higher plants: Present status and future prospects[J]. Plant Molecular Biology,2005,57(4): 461-485.
[9]Jennings H S. The numerical results of diverse systems of breeding,with respect to two pairs of characters,linked or independent,with special relation to the effects of linkage[J]. Genetics,1917,2(2):97.
[10][ZK(#]Remington D L,Thornsberry J M,Matsuoka Y,et al. Structure of linkage disequilibrium and phenotypic associations in the maize genome[J]. Proceedings of the National Academy of Sciences of the United States of America,2001,98(20):11479-11484.
[11]Devlin B,Risch N. A comparison of linkage disequilibrium measures for fine-scale mapping[J]. Genomics,1995,29(2):311-322.
[12]Balding D J. A tutorial on statistical methods for population association studies[J]. Nature Reviews Genetics,2006,7(10):781-791.
[13]Hansen M,Kraft T,Ganestam S,et al. Linkage disequilibrium mapping of the bolting gene in sea beet using AFLP markers[J]. Genetical Research,2001,77(1):61-66.
[14]Huang X,Zhao Y,Wei X,et al. Genome-wide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm[J]. Nature Genetics,2012,44(1):32-39.
[15]Weng J F,Xie C X,Hao Z F,et al. Genome-wide association study identifies candidate genes that affect plant height in Chinese elite maize (Zea mays L.) inbred lines[J]. PLoS One,2011,6(12):e29229.
[16]張煥欣,翁建峰,張曉聰,等. 玉米穗行數(shù)全基因組關(guān)聯(lián)分析[J]. 作物學(xué)報(bào),2014,40(1):1-6.
[17]Thornsberry J M,Goodman M M,Doebley J,et al. Dwarf8 polymorphisms associate with variation in flowering time[J]. Nature Genetics,2001,28(3):286-289.
[18]Tian F,Badbury P J,Brown P J,et al. Genome-wide association study of leaf architecture in the maize nested association mapping population[J]. Nature Genetics,2011,43(2):159-162.
[19]Salvi S,Sponza G,Morgante M,et al. Conserved noncoding genomic sequences associated with a flowering-time quantitative trait locus in maize[J]. Proceedings of the National Academy of Sciences of the United States of America,2007,104(27):11376-11381.
[20]Ducrocq S,DVeyrieras J B M. Key impact of [WTBX][STBX]Vgt1[WTBZ][STBZ] on flowering time adaptation in maize:evidence from association mapping and ecogeographical information[J]. Genetics,2008,178(4):2433-2437.
[21]Wilson L M,Whitt S R,Ibán[DD(-1*3][HT6]~[DD)]ez A M,et al. Dissection of maize kernel composition and starch production by candidate association[J]. The Plant Cell,2004,16(10):2719-2733.
[22]于永濤.玉米核心自交系群體結(jié)構(gòu)及耐旱相關(guān)候選基因rab17的等位基因多樣性分析[D]. 北京:中國(guó)農(nóng)業(yè)科學(xué)院,2006.
[23]Ravel C,Praud S,Murigneux A,et al. Identification of Glu-B1-1 as a candidate gene for the quantity of high-molecular-weight glutenin in bread wheat (Triticum aestivum L.) by means of an association study[J]. Theoretical & Applied Genetics,2006,112(4):738-743.
[24]Zheng S S,Byrne P F,Bai G H,et al. Association analysis reveals effects of wheat glutenin alleles and rye translocations on dough-mixing properties[J]. Journal of Cereal Science,2009,50(2):283-290.
[25]Kraakman A T W,Niks R E,van den Berg P M M M,et al. Linkage disequilibrium mapping of yield and yield stability in modern spring barley cultivars[J]. Genetics,2004,168(1):435-446.
[26]Kraakman A T W,Martinez F,Mussiraliev B,et al. Linkage disequilibrium mapping of morphological,resistance,and other agronomicallly relevant traits in modern spring barley cultivars[J]. Molecular Breeding,2006,17(1):41-58.
[27]王蕾,黎冬華,齊小瓊,等. 芝麻核心種質(zhì)芝麻素和芝麻酚林的關(guān)聯(lián)分析[J]. 中國(guó)油料作物學(xué)報(bào),2014,36(1):32-37.
[28]楊鑫雷,周曉棟,劉恒蔚,等. AFLP標(biāo)記與棉花重要農(nóng)藝性狀的關(guān)聯(lián)研究[J]. 棉花學(xué)報(bào),2013,25(3):211-216.
[29]Beer S C,Siripoonwiwat W,ODonoughue L S,et al. Associations between molecular markers and quantitative traits in an oat germplasm pool:can we infer linkages?[J]. Journal of Agricultural Genomics,1997,3:1-16.
[30]Flavio B,Sorrells M E. Association mapping of kernel size and milling quality in wheat(Triticum aestivum L.) cultivars[J]. Genetics,2006,172(2):1165-1177.
[31][JP3]Parisseaux B,Bernardo R. In silico mapping of quantitative trait loci in maize[J]. Theoretical and Applied Genetics,2004,109(3):508-514.
[32]Malysheva-Otto L V,Ganal M W,Rder M S. Analysis of molecular diversity,population structure and linkage disequilibrium in a worldwide survey of cultivated barley germplasm (Hordeum vulgare L.)[J]. BMC Genetics,2006,7(2):1-14.
[33]劉新倫,李志超,王亞娟,等. 抗麥長(zhǎng)管蚜小麥的遺傳多樣性及SSR標(biāo)記與麥長(zhǎng)管蚜抗性的關(guān)聯(lián)分析[J]. 農(nóng)業(yè)生物技術(shù)學(xué)報(bào),2015(3):291-301.
[34]孫曉棠,盧冬冬,歐陽(yáng)林娟,等. 水稻紋枯病抗性關(guān)聯(lián)分析及抗性等位變異發(fā)掘[J]. 作物學(xué)報(bào),2014,40(5):779-787.
[35]范虎,文自翔,王春娥,等. 中國(guó)野生大豆群體農(nóng)藝加工性狀與SSR關(guān)聯(lián)分析和特異材料的遺傳構(gòu)成[J]. 作物學(xué)報(bào),2013,39(5):775-788.
[36]左巧美.大豆生育期的遺傳變異、QTL定位和關(guān)聯(lián)分析[D]. 南京:南京農(nóng)業(yè)大學(xué),2011.
[37]王歡,孫霞,岳巖磊,等. 東北春大豆花莢脫落性狀與SSR標(biāo)記的關(guān)聯(lián)分析[J]. 土壤與作物,2014,3(1):32-40.
[38]陳氏秋江,黨小景,劉強(qiáng)明,等. 水稻籽粒性狀的SSR關(guān)聯(lián)分析[J]. 中國(guó)水稻科學(xué),2014,28(3):243-257.
[39]賀道華,邢宏宜,趙俊興,等. 棉花資源群體結(jié)構(gòu)的推測(cè)與纖維品質(zhì)的關(guān)聯(lián)分析[J]. 西北農(nóng)林科技大學(xué)學(xué)報(bào):自然科學(xué)版,2011,39(1):103-112.
[40]邵冰欣,王紅梅,趙云雷,等. 陸地棉耐鹽性狀與SSR分子標(biāo)記的關(guān)聯(lián)分析[C].呼和浩特:中國(guó)棉花學(xué)會(huì)2014年年會(huì),2014.
[41]Brookes A J. The essence of SNPs[J]. Gene,1999,234(2):177-186.
[42]Christian R,Jan L,Angelika C E,et al. Genome-wide association mapping of leaf metabolic profiles for dissecting complex traits in maize[J]. Proceedings of the National Academy of Sciences of the United States of America,2012,109(23):8872-8877.
[43]Aranzana M J,Kim S,Zhao K Y,et al. Genome-wide association mapping in Arabidopsis identifies previously known flowering time and pathogen resistance genes[J]. PLoS Genetics,2005,1(5):e60.
[44]姚玉瑩.水稻核心種質(zhì)抗倒特性及其主要農(nóng)藝性狀的全基因組關(guān)聯(lián)分析[D]. 武漢:華中農(nóng)業(yè)大學(xué),2014.
[45]Beló A,Zheng P Z,Luck S,et al. Whole genome scan detects an allelic variant of [WTBX][STBX]fad2[WTBZ][STBZ] associated with increased oleic acid levels in maize[J]. Molecular Genetics & Genomics,2008,279:1-10.
[46]任鳳陽(yáng).玉米自交系萌發(fā)特性的評(píng)價(jià)及SNP關(guān)聯(lián)分析[D]. 泰安:山東農(nóng)業(yè)大學(xué),2014.
[47]Hao D,Cheng H,Yin Z T,et al. Identification of single nucleotide polymorphisms and haplotypes associated with yield and yield components in soybean(Glycine max) landraces across multiple environments[J]. Theoretical and Applied Genetics,2012,124(3):447-458.
[48]姜曉東,郭剛剛,張京.[WTBX][STBX]Amy6-4[WTBZ][STBZ]基因遺傳多樣性及其與α-淀粉酶活性的關(guān)聯(lián)分析[J]. 作物學(xué)報(bào),2014,40(2):205-213.
[49]Palaisa K A,Morgante M,Williams M,et al. Contrasting effects of selection on sequence diversity and linkage disequilibrium at two phytoene synthase loci[J]. Plant Cell,2003,15(8):1795-1806.