(湖南農(nóng)業(yè)大學(xué),長沙410128)
作物遺傳育種研究進(jìn)展Ⅱ.作物有利基因鑒定和等位基因發(fā)掘
劉 忠 松
(湖南農(nóng)業(yè)大學(xué),長沙410128)
解析作物性狀的遺傳調(diào)控機(jī)制是提高育種選擇準(zhǔn)確性的基礎(chǔ),而鑒定控制性狀的基因及其等位變異是解析作物性狀的遺傳結(jié)構(gòu)的基礎(chǔ)。簡略介紹了基因鑒定的圖位克隆方法、基于分離群體混合測序的鑒定方法、基于大量種質(zhì)的基因組重測序GWAS方法和RNA測序方法,同時介紹了從種質(zhì)資源中通過同源克隆方法發(fā)掘等位基因的方法,為科學(xué)有效利用最佳等位基因進(jìn)行作物遺傳改良提供依據(jù)。
作物;性狀;遺傳結(jié)構(gòu);基因鑒定;等位基因發(fā)掘
傳統(tǒng)育種根據(jù)性狀表現(xiàn)進(jìn)行選擇。生物任何性狀都是基因型、環(huán)境及其互作的結(jié)果。同一基因型在不同環(huán)境下表現(xiàn)不同,不同基因型在某種環(huán)境條件下又可能有相同表現(xiàn)。因此導(dǎo)致依據(jù)表型進(jìn)行育種選擇不夠準(zhǔn)確。要提高育種選擇的準(zhǔn)確性,除了應(yīng)嚴(yán)格控制試驗(yàn)環(huán)境外,對作物性狀的遺傳調(diào)控機(jī)制應(yīng)有更好的了解,對選擇方法應(yīng)加以改進(jìn)。
從遺傳的角度來看,作物性狀可分為質(zhì)量性狀和復(fù)雜性狀(數(shù)量性狀)。質(zhì)量性狀在群體中可以分為不同類型,但遺傳簡單,表現(xiàn)為少數(shù)基因控制,受環(huán)境影響?。粡?fù)雜性狀表現(xiàn)為連續(xù)變異,受多基因控制,受環(huán)境影響大。不管是哪種類型的性狀,其形成都是生物生長發(fā)育過程基因表達(dá)的結(jié)果,實(shí)際上都涉及到多個基因。
為什么有些性狀表現(xiàn)為簡單遺傳的質(zhì)量性狀,而其他性狀表現(xiàn)為多基因控制的復(fù)雜性狀,這與性狀的遺傳結(jié)構(gòu)有關(guān)。如果控制某個性狀的多個基因是按照反應(yīng)順序先后發(fā)揮作用,這種性狀的遺傳結(jié)構(gòu)就是線性結(jié)構(gòu)(圖1a)。線性結(jié)構(gòu)是遺傳結(jié)構(gòu)中最簡單的類型,如果其中某個反應(yīng)的基因突變喪失了功能,將導(dǎo)致整個鏈條崩潰,性狀完全改變,如水稻半矮稈基因sd-1(即GA20OX2)突變,導(dǎo)致有活性的赤霉素不能合成,植株顯著變矮。如果一個性狀的形成不僅需要一些基因順序發(fā)揮作用,而且還受到其他基因(如轉(zhuǎn)錄因子基因)的調(diào)控,這種調(diào)控基因不一定只調(diào)控一個反應(yīng),能調(diào)控多個甚至全部反應(yīng),這種性狀的遺傳結(jié)構(gòu)可叫做分枝結(jié)構(gòu)(圖1b)。如果調(diào)控基因突變,將導(dǎo)致受其調(diào)控的基因表達(dá)改變,最終導(dǎo)致性狀表達(dá)改變,如最近揭示的水稻新矮稈基因D53,在沒有獨(dú)角金內(nèi)酯(Strigolactones)時抑制獨(dú)角金內(nèi)酯信號傳導(dǎo)途徑,但在有獨(dú)角金內(nèi)酯時,D53蛋白會被矮稈基因D3介導(dǎo)泛素化而降解,盡管D3、D14和D53突變體株高都表現(xiàn)為簡單遺傳,但D3和D14基因的狀態(tài)影響D53基因作用的發(fā)揮。許多性狀的形成不僅涉及到多個基因,而且還涉及多條途徑,不同途徑之間還存在交叉、互作,使得性狀的遺傳結(jié)構(gòu)十分復(fù)雜,如同一張網(wǎng)絡(luò),這種性狀遺傳結(jié)構(gòu)可叫做網(wǎng)絡(luò)結(jié)構(gòu)(圖1c)。如水稻矮稈性狀除了赤霉素合成和信號傳導(dǎo)途徑、獨(dú)角金內(nèi)酯合成和信號傳導(dǎo)途徑外,還發(fā)現(xiàn)d2、d11、d61和d62等矮稈突變與油菜素內(nèi)酯合成和信號傳導(dǎo)途徑有關(guān),另有數(shù)十個突變體形成矮稈的機(jī)制尚不清楚,水稻控制植株高度的網(wǎng)絡(luò)結(jié)構(gòu)尚未建立。具有網(wǎng)絡(luò)遺傳結(jié)構(gòu)的性狀,影響性狀表達(dá)的基因作用有大有小,方向也并不完全一致,有些可能是正向的,有些可能是負(fù)向的。改良具有網(wǎng)絡(luò)遺傳結(jié)構(gòu)的性狀,鑒定控制性狀形成的基因,發(fā)掘基因的等位變異是重要基礎(chǔ)。
圖1 性狀遺傳結(jié)構(gòu)的類型
連鎖作圖和關(guān)聯(lián)作圖都能初步定位控制性狀的基因,但要最終鑒定控制性狀基因的經(jīng)典方法是圖位克?。?,2]。隨著越來越多的作物有參考基因組序列,基因鑒定方法正在發(fā)生革命性的轉(zhuǎn)變,利用新一代測序方法直接進(jìn)行基因組(重)測序鑒定和轉(zhuǎn)錄組測序鑒定基因?qū)絹碓搅餍小?/p>
1.1 圖位克隆鑒定有利基因
圖位克隆鑒定有利基因的基礎(chǔ)是基因定位即找到與性狀緊密連鎖的標(biāo)記。基因定位有連鎖分析(家系分析)和關(guān)聯(lián)分析(群體分析)兩條途徑。連鎖分析需要構(gòu)建性狀分離的作圖群體,對群體進(jìn)行標(biāo)記基因型分析和目標(biāo)性狀鑒定,找到目標(biāo)性狀兩側(cè)的標(biāo)記,界定控制目標(biāo)性狀的基因組區(qū)域。為了加速這一過程,現(xiàn)多采用分離群體兩極植株、F2代隱性植株和F1或近等基因系(NIL)進(jìn)行分析?;虺醪蕉ㄎ唬ǖ侥骋蝗旧w)后,還需要開發(fā)新標(biāo)記,利用大的分離群體(精細(xì)定位群體大小估算公式:N=Log(1P)/Log{1-[T-marker×3/λT]/100R},式中N為預(yù)測的群體大??;P為期望成功概率;T-marker是期望定位基因(兩個標(biāo)記之間)的精度(kb);λT為在兩翼標(biāo)記之間期望找到的重組單株數(shù)目;R為重組頻率(kb/cM)[3]。如假設(shè)P=0.95、λT=9、T-marker=40 kb、R=250 kb/cM,則N=Log(1-0.95)/Log{1-[40×3/9]/25 000}=5 616)進(jìn)行精細(xì)定位,縮小目標(biāo)基因所在的基因組區(qū)域。單核苷酸多態(tài)性(SNP)芯片的開發(fā)和應(yīng)用使得基因定位速度顯著加快、分辨率顯著提高。隨著遺傳標(biāo)記的增加、加密,關(guān)聯(lián)分析已越來越多地用來鑒定控制目標(biāo)性狀的基因。關(guān)聯(lián)分析利用不同基因位點(diǎn)等位基因間的連鎖不平衡(Linkage disequilibrium,LD)關(guān)系,進(jìn)行標(biāo)記與性狀的相關(guān)性分析,以達(dá)到鑒定控制目的性狀基因(或基因組區(qū)段)的目的。關(guān)聯(lián)分析不需構(gòu)建作圖群體,而是利用自然形成的種質(zhì)資源,分辨率更高,基因定位更精確,且可同時檢測出一個基因的多個等位基因。但應(yīng)注意種質(zhì)資源的選擇,防止因群體結(jié)構(gòu)帶來的假關(guān)聯(lián)結(jié)果。
用精細(xì)定位的兩側(cè)標(biāo)記或共分離標(biāo)記篩選該作物的基因組文庫(如BAC文庫),構(gòu)建BAC重疊群,重疊群的BAC測序,所得到的序列用于基因預(yù)測,預(yù)測的基因進(jìn)行轉(zhuǎn)基因遺傳互補(bǔ)功能驗(yàn)證。有參考基因組序列的作物(如水稻)可利用精細(xì)定位標(biāo)記直接確定目標(biāo)基因候選區(qū)域,分析候選區(qū)域的基因,直接進(jìn)行基因測序和比較,可鑒定出目的基因。
對于復(fù)雜性狀,找到控制該性狀的多個基因組區(qū)域(或數(shù)量性狀位點(diǎn),即QTL)后,需要從所有QTLs中選擇貢獻(xiàn)大的QTL,培育目標(biāo)QTL的NIL,用含目標(biāo)QTL的NIL與輪回親本雜交培育分離群體,進(jìn)行精細(xì)定位和后續(xù)步驟,也能克隆控制主效QTL的基因。
1.2 基因組(重)測序鑒定有利基因
近十多年,由于二代、三代基因組測序技術(shù)的迅猛發(fā)展,作物基因組測序也取得了前所未有的進(jìn)步,繼2002年完成水稻全基因組序列草圖之后,高粱、玉米、大豆、馬鈴薯、粟、鷹嘴豆、木薯、芝麻、甜菜等作物以及普通小麥A和D基因組、四倍體棉花D基因組供體野生種的基因組序列[4]的基因組測序相繼完成,為利用分離群體的單株或極端個體混合樣本測序鑒定有利基因奠定了基礎(chǔ)。
通過大量(100~1 000份)種質(zhì)基因組重測序進(jìn)行全基因組關(guān)聯(lián)(GWAS)分析鑒定控制重要農(nóng)藝性狀的基因已在水稻、玉米和粟等作物上應(yīng)用。GWAS分析能找到控制性狀的候選基因[5~7]。
通過基因組測序鑒定有利基因的策略已開發(fā)出SHOREmap、NGM、MutMap和NIKS等幾種方法。這些方法都是通過分離F2代群體混合高通量測序、測序結(jié)果與參考基因組序列連配鑒定SNP,根據(jù)SNP頻率確定候選區(qū)域,進(jìn)一步進(jìn)行候選區(qū)域基因的功能分析驗(yàn)證。
SHOREmap法[8]利用大量(500株)F2代突變表型植株混合DNA進(jìn)行深度(22倍)測序,測序得到的短序列利用短序列分析線SHORE與參考基因組序列連配,分析雙親等位基因的相對頻率,用染色體作橫坐標(biāo)、等位基因相對頻率作縱坐標(biāo)繪圖(SHOREmap區(qū)間圖)。由于理論上與目標(biāo)基因不連鎖的基因來自雙親的等位基因頻率相等,只有與目標(biāo)基因緊密連鎖的基因,其等位基因頻率偏向親本之一(突變體類型),染色體上這個等位基因偏向某個親本的狹窄區(qū)域就是候選基因所在區(qū)域。將候選區(qū)域鑒定出的突變輸入SHOREmap“注釋功能”,將根據(jù)離等位基因分布峰的距離排列堿基替換、預(yù)測堿基改變的效應(yīng),找到候選區(qū)域、候選基因。
NGM法[9,10]利用F2代小群體(實(shí)用80株植株,推薦可用50株)混合DNA進(jìn)行高通量深度測序,所得到的短序列利用Maq短序列作圖軟件包與參考基因組序列進(jìn)行連配,鑒定出SNPs,并用統(tǒng)計(jì)值CHD鑒定SNP類型。如果CHD值接近0,說明測序結(jié)果與參考序列完全一致,該SNP位點(diǎn)為親本純合類型,如果CHD值接近0.5,說明該SNP位點(diǎn)為雜合類型,如果CHD值接近1,說明測序結(jié)果完全不同于參考序列,該SNP位點(diǎn)為突變純合類型,只有CHD值為1的SNP代表真正的突變或連鎖的突變位點(diǎn)。通過全基因組掃描缺乏CHD值為0.5、富集CHD值為1的染色體區(qū)段,并根據(jù)與參考基因組序列的差異程度鑒定候選基因區(qū)域,對候選區(qū)域的非同義SNP進(jìn)行進(jìn)一步驗(yàn)證。
MutMap法[11]是將野生型與純合隱性突變體雜交,所得F1植株自交產(chǎn)生F2代,從大約20株隱性純合的F2植株提取DNA混合,將混合DNA用新一代測序技術(shù)進(jìn)行10倍或更高倍數(shù)覆蓋的測序,通過序列連配分析突變體與野生型在單核苷酸多態(tài)性(SNP)、刪除插入(InDel)等方面的差異。理論上,只有基因本身或其附近的SNP在100%的序列讀段中表現(xiàn)出差異,而不是隨機(jī)分布的50%。將突變體類型SNP的讀段數(shù)目與總的讀段數(shù)目之比叫做SNP指數(shù),靠近目標(biāo)基因的SNP指數(shù)應(yīng)為1,而不連鎖的SNP指數(shù)應(yīng)為0.5,通過全基因組篩選,指數(shù)為1的一連串SNP所在區(qū)域理論上應(yīng)包含目標(biāo)基因,因?yàn)?0倍覆蓋隨機(jī)出現(xiàn)SNP指數(shù)為1的概率為(0.5)10即10-3。在水稻連續(xù)4個以上SNPs具有SNP指數(shù)為1的概率≤2.3×10-9。找到一連串SNP指數(shù)為1的SNPs后,仔細(xì)檢查其蛋白質(zhì)編碼區(qū)SNP是否發(fā)生了非同義替代。鑒定出候選基因之后,如同圖位克隆鑒定一樣,也需要進(jìn)行遺傳互補(bǔ)功能驗(yàn)證。對于不易發(fā)生重組的染色體區(qū)域如著絲粒區(qū)域,為了促進(jìn)重組、交換,需要將F2植株自交獲得大量F3代,用F3代進(jìn)行分析。
NIKS法[12]直接測定野生型和突變體的基因組序列覆蓋25倍以上,然后用Jellyfish軟件計(jì)數(shù)各自樣本測序序列中長度為k聚(k-mer,應(yīng)短于測序讀長,可采用多個不同k值,作者測序讀長為33 nt,實(shí)際采用31 nt)序列的數(shù)目,繪制k-mer序列頻率分布柱狀圖,鑒定樣本特有的k-mer序列,將各樣本的k-mer序列歸并為種子序列,野生型和突變體的種子序列配對,其中一個代表野生等位基因,一個代表突變等位基因,然后選擇與種子序列對至少共有一個k-mer的序列對進(jìn)行組裝,延長種子序列到數(shù)百bp長度(圖2)。鑒定出突變位點(diǎn)后,注釋突變對基因功能的影響。作者指出,雜合突變會影響種子序列對的鑒定,重復(fù)序列區(qū)域的突變不能用NIKS法鑒定,對于多態(tài)性密度高的材料應(yīng)采用Cortex軟件計(jì)數(shù)k-mer序列,為了減少需鑒定的突變數(shù)目,也可用突變體與野生型雜交F2代的混合DNA進(jìn)行測序,或用2個以上不同等位基因的材料直接測序,然后找出同一基因中不同的突變。
圖2 NIKS法鑒定突變基因的基本程序
1.3 轉(zhuǎn)錄組測序鑒定有利基因
有人估測,人類已對玉米基因組的4%進(jìn)行了選擇。根據(jù)已注釋基因估測玉米轉(zhuǎn)錄組只占基因組的4%。轉(zhuǎn)錄組測序更容易,在性狀表達(dá)差異的材料中找到的差異表達(dá)基因有可能是控制該性狀的基因。通過轉(zhuǎn)錄組測序不僅能鑒定出調(diào)控基因,而且能揭示該性狀形成的途徑。
轉(zhuǎn)錄組測序鑒定差異表達(dá)基因時,提取野生型和突變體性狀表達(dá)組織的總RNA進(jìn)行RNA深度測序(100倍),所得到的序列組裝成unigenes,比較unigenes在野生型和突變體之間的表達(dá)量差異,結(jié)合KEGG分析、代謝產(chǎn)物分析等鑒定出候選關(guān)鍵基因。對于候選基因,可以利用轉(zhuǎn)錄組測序獲得的序列設(shè)計(jì)引物進(jìn)行擴(kuò)增,比較基因組多態(tài)性和表達(dá)差異,驗(yàn)證候選基因的功能和影響的步驟[13]。如劉顯軍等通過轉(zhuǎn)錄組測序分析控制芥菜型油菜種皮顏色的基因[14]。
由于基因突變、基因重組、轉(zhuǎn)座子轉(zhuǎn)座等原因,生物不僅不斷產(chǎn)生新的基因,而且原有基因可能形成新的變異類型(如堿基改變、序列插入或刪除)即新的等位基因,使得一個基因可能有多個等位基因,如水稻“綠色革命”半矮稈基因sd-1已發(fā)現(xiàn)4個等位基因。不同等位基因的功能有時并不完全相同,如基因編碼區(qū)的變異可能導(dǎo)致基因功能完全喪失,而基因調(diào)控區(qū)的改變可能只影響該基因的表達(dá)模式,因此育種上選擇出最佳等位基因具有重要意義。
遺傳學(xué)通過遺傳互補(bǔ)試驗(yàn)確定基因是否等位,關(guān)聯(lián)作圖通過對自然群體的分析能鑒定出等位基因。隨著越來越多的有利基因被鑒定、克隆,利用已克隆基因的序列,通過同源克隆挖掘種質(zhì)資源中蘊(yùn)藏的大量新等位基因已成為一種簡便易行的方法。
同源克隆法發(fā)掘等位基因的基本程序見圖3[15]。在等位基因發(fā)掘之前,需要確定目標(biāo)性狀,用最小的種質(zhì)(核心種質(zhì))代表最大的遺傳多樣性,對擬用種質(zhì)資源在適當(dāng)環(huán)境下進(jìn)行準(zhǔn)確的性狀鑒定,并且了解控制該性狀的遺傳結(jié)構(gòu)、關(guān)鍵基因及其作用大小,根據(jù)前人研究結(jié)果選擇目標(biāo)基因,并查詢同種作物或近緣植物有關(guān)該基因的序列。進(jìn)行等位基因發(fā)掘時,設(shè)計(jì)擴(kuò)增基因全長序列的引物,需要找到基因的保守區(qū)域,以便設(shè)計(jì)的引物適合在近緣植物中擴(kuò)增出同源基因,不同引物對至少重疊100~200 bp,使擴(kuò)增產(chǎn)物能覆蓋基因編碼區(qū)和上游調(diào)控區(qū)域,擴(kuò)增產(chǎn)物測序應(yīng)采用單擴(kuò)增子,用性狀高表達(dá)的種質(zhì)的擴(kuò)增子測序,建立同時包含多態(tài)性與表型數(shù)據(jù)、分類規(guī)范、連接方便的數(shù)據(jù)庫。為了比較種質(zhì)間同源基因序列的差異,可用ClustalW、BioEdit等軟件進(jìn)行分析。除了擴(kuò)增產(chǎn)物測序外,TILLING分析也能檢測等位基因的點(diǎn)突變(SNP多態(tài)性)。如Bhullar等采用同源克隆法從1 320份小麥種質(zhì)中發(fā)現(xiàn)7個新的抗白粉?。≒owdery mildew)Pm3等位基因[16]。
圖3 同源克隆法發(fā)掘等位基因的基本程序
隨著全基因組測序成本的降低,群體基因組學(xué)迅速發(fā)展,對大量種質(zhì)資源進(jìn)行重測序也正在成為挖掘種質(zhì)資源中蘊(yùn)藏的新等位基因的一條途徑。
[1] Peters JL,Cnudde F,Gerats T.Forward genetics and map -based cloning approaches[J].Trends Plant Sci,2003,8:484-491.
[2] Lee J,Koh HJ.Gene identification using rice genome sequences[J].Genes Genom,2013,35:415-424.
[3] Dinka SJ,Campbell MA,Demers T,et al.Predicting the size of the progeny mapping population required to positionally clone a gene[J].Genetics,2007,176:2035-2054.
[4] Bolger ME,Weisshaar B,Scholz U,et al.Plant genome sequencing—applications for crop improvement[J]. Curr Opinion Biotech,2014,26:31-37.
[5] Han B,Huang X.Sequencing-based genome-wide association study in rice[J].Curr Opinion Plant Biol,2013,16:133-138.
[6] Huang X,Wei X,Sang T,et al.Genome-wide association studies of14 agronomic traits in rice land races[J]. Nat Genet,2010,42:961-967.
[7] Huang X,Zhao Y,Wei X,et al.Genome-wide associa-tion study of flowering time and grain yield traits in a worldwide collection of rice germplasm[J].Nat Genet,2012,44:32-39.
[8] Schneeberger K,Ossowski S,Lanz C,et al.SHOREmap:simultaneousmapping and mutation identification by deep sequencing[J].Nat Methods,2009,6:550-551.
[9] Austin RS,Vidaurre D,Stamatiou G,etal.Next-generation mapping of Arabidopsis genes[J].Plant J,2011,67:715-725.
[10]Austin RS,Chatfield SP,Desveaux D,etal.Next-generation mapping of genetic mutations using bulk population sequencing[J].Methods in Molecular Biology,2014,1062:301-315.
[11]Abe A,Kosugi S,Yoshida K,et al.Genome sequencing reveals agronomically important loci in rice using MutMap[J].Nat Biotechnol,2012,30:174-178.
[12]Nordstr?m KJ,Albani MC,James GV,et al.Mutation identification by direct comparison of whole-genome sequencing data from mutant and wild-type individuals using k-mers[J].Nat Biotechnol,2013,31:325-330.
[13]Hirsch CN,Buell CR.Tapping the promise of genomics in specieswith complex,non-model genomes[J].Annu Rev Plant Biol,2013,64:89-110.
[14]Liu XJ,Lu Y,Yuan Y,et al.De novo transcriptome of Brassica juncea seed coat and identification of genes for the biosynthesis of flavonoids[J].PLoS One,2013,8(8):71-110.
[15]Kumar GR,Sakthivel K,Sundaram RM,et al.Allelemining in crops:prospects and potentials[J].Biotechnol Adv,2010,28:451-61.
[16]Bhullar NK,Street K,Mackay M,et al.Unlocking wheat genetic resources for themolecular identification of previously undescribed functional alleles at the Pm3 resistance locus[J].PNAS,2009,106:9519-9524.
“作物鎘污染防控技術(shù)研討會”在長沙召開
簡訊
鎘(Cd),一種生物蓄積性強(qiáng)、毒性持久、具有“三致”作用的劇毒元素。攝入過量的鎘對人體的危害極其嚴(yán)重。許多研究表明,我國部分地區(qū)的稻米鎘含量超標(biāo)(0.2 mg/kg)。如何消減稻米中鎘的積累,現(xiàn)已成為保障糧食質(zhì)量安全的一項(xiàng)首要科學(xué)任務(wù)。
2014年3月3日,湖南省作物學(xué)會組織相關(guān)領(lǐng)域的專家在湖南農(nóng)業(yè)大學(xué)召開了“水稻鎘污染防控技術(shù)研討會”,來自全省的20多位專家教授出席會議。會上代表們討論了輻污染防控技術(shù),如阻斷污染源、低鎘型水稻品種的篩選與培育、降低土壤中鎘的有效性、采用農(nóng)藝措施調(diào)控水稻植株對鎘的吸收與在籽粒中的積累等。代表們認(rèn)為鎘污染治理是一項(xiàng)世界性難題,需摸清其影響機(jī)理,采用協(xié)同研究攻關(guān),做好長期探索的規(guī)劃。(敖和軍)
S330
:A
1001-5280(2014)02-0226-05
10.3969/j.issn.1001-5280.2014.02.28
2014 02- 21
劉忠松(1963-),男,湖南常寧人,博士,教授,從事作物遺傳育種研究與教學(xué)。