蔣 偉 潘哲超 包麗仙 周福仙 李燕山 隋啟君,* 李先平,*
1 云南省農(nóng)業(yè)科學(xué)院經(jīng)濟(jì)作物研究所, 云南昆明 650205; 2 云貴高原馬鈴薯與油菜科學(xué)觀測(cè)實(shí)驗(yàn)站, 云南昆明 650200
晚疫病是馬鈴薯的主要病害, 每年可造成我國(guó)馬鈴薯減產(chǎn)約10%~15%, 經(jīng)濟(jì)損失高達(dá)20億美元。西南地區(qū)低溫高濕的氣候環(huán)境, 晚疫病發(fā)生更嚴(yán)重,馬鈴薯減產(chǎn)可達(dá) 15%~40%[1-2]。提高品種晚疫病抗性是馬鈴薯育種重要目標(biāo)之一, 而挖掘持久、高抗的晚疫病抗性基因?qū)︸R鈴薯抗病育種具有重要的意義。
20世紀(jì)50年代, 育種家將野生種Solanum demissum的抗性基因?qū)氲皆耘喾N中, 但抗性很快被新出現(xiàn)的晚疫病生理小種克服[3-4]。目前已經(jīng)鑒定并克隆到一些對(duì)晚疫病表現(xiàn)出廣譜抗性的R基因。通過(guò)構(gòu)建BAC文庫(kù)和長(zhǎng)片段PCR擴(kuò)增的方法, 從野生種S. bulbocastanum中克隆了第1個(gè)馬鈴薯晚疫病廣譜抗性基因RB或Rpi-blb1[5-6]。通過(guò)構(gòu)建S. bulbocastanum作圖群體, 利用AFLP分子標(biāo)記, 克隆到另1個(gè)廣譜抗性基因Rpi-blb2[4]。利用野生種S. venturii的 5個(gè)作圖群體, 結(jié)合分離群體分組分析法(bulked segregant analysis, BSA)找到與抗性基因連鎖的AFLP分子標(biāo)記, 通過(guò)構(gòu)建BAC文庫(kù)從而克隆了廣譜抗性基因Rpi-vnt1[7]。對(duì)含有廣譜抗性基因R8分子標(biāo)記或QTL位點(diǎn)的群體構(gòu)建BAC文庫(kù), 通過(guò)酶切PCR克隆到了該基因[8-9]。上述這些基因的鑒定主要是通過(guò)構(gòu)建遺傳群體、分子標(biāo)記定位獲得, 而通過(guò)自然群體全基因組關(guān)聯(lián)分析定位晚疫病抗性基因的研究較少。
本研究選擇的自然群體引自國(guó)際馬鈴薯中心,該中心從19世紀(jì)80年代起以淘汰馬鈴薯晚疫病垂直抗性而保留其水平抗性為目的, 篩選了一批群體材料。因此, 該群體中很可能保留著晚疫病廣譜抗性基因。通過(guò)對(duì)四倍體馬鈴薯群體連續(xù)2年的田間晚疫病抗性評(píng)價(jià), 結(jié)合群體簡(jiǎn)化基因組測(cè)序獲得大量的SNP位點(diǎn), 進(jìn)行全基因組關(guān)聯(lián)分析挖掘晚疫病抗性相關(guān)的遺傳位點(diǎn)和候選基因, 旨在為晚疫病抗性品種選育和抗病機(jī)理研究提供一定的理論和材料基礎(chǔ)。
引自國(guó)際馬鈴薯中心的288份四倍體馬鈴薯晚疫病抗性群體材料(表1), 感病對(duì)照為Desiree (D214)。群體A中晚疫病抗性來(lái)源為改良的S. demissum衍生抗性, 包括來(lái)自安第斯栽培種S. tuberosumgroupsandigena、phureja和stenotomum, 以及野生種S.acaule和S. bulbocastanum抗性的材料 8份; 群體B3來(lái)源于群體A, 但篩選保留表現(xiàn)出晚疫病水平抗性的資源材料 82份; 群體 B1來(lái)自S. tuberosumgroupsandigena的材料15份; 群體LTVR具有馬鈴薯病毒病(PVY、PVX和PLRV)抗性、生長(zhǎng)期短和適應(yīng)溫暖環(huán)境特性的材料111份; 群體B3-HT結(jié)合群體B3的晚疫病抗性、北美和歐洲品種的耐熱性以及群體LTVR特性的材料34份; 群體B3-LTVR包括群體B3和群體LTVR的雜交后代22份; 群體BW具有細(xì)菌性枯萎病抗性的材料 12份; 群體PREBRED具有從野生種導(dǎo)入到四倍體B3或LTVR中的晚疫病抗性材料1份; VARIETY表示馬鈴薯品種 3份[10]。
2015—2016年, 群體材料種植于云南省曲靖市會(huì)澤縣試驗(yàn)基地(26o06'N, 103o22'E), 海拔 2650 m。每個(gè)材料種植1行10株, 行距為0.7 m, 株距為0.3 m, 種植3次重復(fù)。采用Alpha試驗(yàn)設(shè)計(jì)(CIP提供軟件), 整個(gè)生長(zhǎng)季進(jìn)行正常中耕、施肥管理等, 但不噴灑殺菌類(lèi)農(nóng)藥。
調(diào)查田間晚疫病發(fā)病比率。發(fā)現(xiàn)初始病株, 每7 d調(diào)查1次, 共調(diào)查8次, 計(jì)算AUDPC和sAUDPC值。利用Microsoft Excel對(duì)所觀測(cè)到的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。
式中,n表示總的調(diào)查次數(shù),xi表示第i次調(diào)查的晚疫病嚴(yán)重程度,ti表示第i次調(diào)查的時(shí)間。
利用 CTAB法提取 DNA, 檢測(cè)合格后利用Illumina HiSeq2500測(cè)序儀(Illumina, Inc; San Diego,CA, USA)測(cè)序。以馬鈴薯S. chacoenseM6的基因組測(cè)序信息為參考[11], 利用北京百邁客生物有限公司自主研發(fā)的簡(jiǎn)化基因組測(cè)序流程 SLAF-seq[12]進(jìn)行電子酶切預(yù)測(cè), 根據(jù)最佳酶切方案選擇RsaI+HaeIII進(jìn)行酶切, 酶切長(zhǎng)度在314~414的序列被定義為SLAF標(biāo)簽, 獲得多態(tài)性標(biāo)簽1,032,778個(gè)。以馬鈴薯S. chacoenseM6為參考基因組, 利用BWA軟件[13]將 reads比對(duì)到參考基因組上, 利用 GATK[14]和SAMtools[15]軟件篩選SNP。根據(jù)完整度大于0.8, 次要基因頻率大于0.05過(guò)濾后, 得到353,753個(gè)SNP位點(diǎn)進(jìn)行后續(xù)的分析。
基于SNP位點(diǎn), 利用TASSEL軟件[16]的混合線性模型(compressed mixed linear model, CMLM), 通過(guò)公式y(tǒng)= Xα+Qβ+Kμ+e得到關(guān)聯(lián)值。公式中, 通過(guò)Admixture軟件[17]計(jì)算樣品群體結(jié)構(gòu) Q矩陣,SPAGeDi軟件[18]計(jì)算樣品間親緣關(guān)系K矩陣, X為基因型矩陣, y為表型, 最終獲得每個(gè)SNP位點(diǎn)的關(guān)聯(lián)值, 并計(jì)算它們的P值。以 AUDPC_2015、AUDPC_2016、sAUDPC_2015、sAUDPC_2016, 以及這 2年的 AUDPC和 sAUDPC平均值即AUDPC_Mean和 AUDPC_Mean為表型數(shù)據(jù), 共分析6個(gè)性狀。對(duì)這些性狀利用GLM、MLM、CMLM、FASTLMM和EMMAX五種模型進(jìn)行關(guān)聯(lián)分析。利用 GGplot2軟件[19]繪制 Quantile-Quantile散點(diǎn)圖(Q-Qplot), 利用 QQman軟件繪制曼哈頓圖(Manhattan), 展示關(guān)聯(lián)分析顯著的SNP位點(diǎn)。
對(duì)6個(gè)性狀在5種模型下獲得的顯著水平是0.1和0.01的關(guān)聯(lián)SNP位點(diǎn)進(jìn)行注釋。選取這些位點(diǎn)前后100 kb范圍內(nèi)的基因, 利用BLAST軟件分別與NR、SwissProt、GO、COG和KEGG數(shù)據(jù)庫(kù)進(jìn)行比對(duì), 獲得關(guān)聯(lián)區(qū)域內(nèi)基因注釋信息, 并根據(jù)注釋信息尋找與晚疫病抗性相關(guān)的候選基因。
表1 自國(guó)際馬鈴薯中心引進(jìn)的288份馬鈴薯群體材料Table 1 288 potato population resources from CIP
(續(xù)表 1)
(續(xù)表 1)
通過(guò)對(duì)288份馬鈴薯資源材料連續(xù)2年的晚疫病田間抗性評(píng)價(jià)發(fā)現(xiàn), 晚疫病抗性評(píng)價(jià)值 AUDPC和 sAUDPC呈連續(xù)分布。2015年所有材料的AUDPC平均值為2244.1, 范圍是121.3~4740.8, 變異系數(shù)為 61.73%, sAUDPC平均值為 3.9, 范圍是0.2~8.3, 變異系數(shù)為 61.56%; 2016年所有材料的AUDPC平均值為1228.5, 范圍是72.7~3371.3, 變異系數(shù)為80.47%, sAUDPC平均值為3.6, 范圍是0.2~9.5,變異系數(shù)為80.21%。表明該群體表現(xiàn)出晚疫病抗性廣泛的遺傳差異, 且受多基因控制, 屬于數(shù)量性狀遺傳。相關(guān)性分析中, 2015—2016年AUDPC值相關(guān)系數(shù)為0.8988, 高度線性相關(guān); sAUDPC值相關(guān)系數(shù)為0.8974,高度線性相關(guān)(圖1)。表明2年間群體材料田間晚疫病抗性表現(xiàn)一致, 抗性穩(wěn)定。
5種模型下對(duì)6個(gè)性狀分析的QQ圖結(jié)果表明,在所有模型下關(guān)聯(lián)到顯著相關(guān)的SNP位點(diǎn)都是可靠的(圖2是2個(gè)性狀A(yù)UDPC_mean和sAUDPC_mean在 5種模型下的 QQ圖)。在 5種分析模型下, 共關(guān)聯(lián)到與6種晚疫病抗性性狀顯著相關(guān)(顯著水平為 0.1和 0.01)的 SNP位點(diǎn) 82個(gè)(表 2和圖 3)。其中, 6個(gè)SNP位點(diǎn)分布在3號(hào)染色體(圖3-A, B); 3個(gè) SNP位點(diǎn)分布在 4號(hào)染色體(圖 3-A, B); 1個(gè)SNP位點(diǎn)分布在5號(hào)染色體(圖3-B, C); 分別有2個(gè)SNP位點(diǎn)分布在6號(hào)、7號(hào)染色體(圖3-A, B, D);66個(gè) SNP位點(diǎn)分布在 9號(hào)染色體(圖 3-A~D); 各有1個(gè)SNP位點(diǎn)分布在11號(hào)和12號(hào)染色體(圖3-A,B, D)。在82個(gè)SNP位點(diǎn)中, 20個(gè)SNP位點(diǎn)在所有模型分析中, 2種顯著水平情況下, 與所有性狀都相關(guān)。它們是31,375,673 (第9個(gè))、31,707,832(第 23 個(gè))、32,382,888 (第 25 個(gè))、32,973,114 (第35 個(gè))、33,118,463 (第 36 個(gè))、33,145,927 (第 38個(gè))、33,148,740 (第 39 個(gè))、33,156,262 (第 40 個(gè))、33,211,574 (第 43 個(gè))、33,244,698 (第 48 個(gè))、33,283,731 (第 49 個(gè))、33,283,949 (第 50 個(gè))、33,451,096 (第 53 個(gè))、33,480,937 (第 55 個(gè))、34,959,324 (第 62 個(gè))、35,060,347 (第 66 個(gè))、35,065,836 (第 67 個(gè))、35,123,523 (第 72 個(gè))、35,212,534 (第 77 個(gè))、35,256,410 (第 80 個(gè))。同一性狀下, GLM模型分析定位到的SNP位點(diǎn)數(shù)目最多,而 MLM 模型分析定位到的 SNP位點(diǎn)數(shù)目最少。在GLM 模型下分析, 顯著水平為 0.1時(shí)定位到與AUDPC_Mean相關(guān)的SNP位點(diǎn)數(shù)目(74個(gè))最多(表2)。
本研究在82個(gè)關(guān)聯(lián)SNP位點(diǎn)上下游區(qū)域100 kb,共檢測(cè)到922個(gè)候選基因。其中, 460個(gè)候選基因在所有分析(60種)中都存在, 其余基因在2~56種分析中出現(xiàn)。根據(jù)基因組注釋, 篩選出54個(gè)已知或可能與晚疫病抗性相關(guān)的基因(表3)。其中, 23個(gè)基因?yàn)榭剐曰虬ㄍ硪卟】剐曰騌1同源基因、Sw-5同源基因(R8)和Rpi-vnt1以及編碼多效性耐藥蛋白基因; 5個(gè)基因編碼MAPK蛋白和WRKY轉(zhuǎn)錄因子;1個(gè)基因參與茉莉酸途徑; 3個(gè)基因與水楊酸途徑相關(guān); 6個(gè)基因是病程相關(guān)的基因; 3個(gè)基因參與苯基丙酸類(lèi)合成途徑; 其他與晚疫病抗性相關(guān)的基因如HMGR基因(2個(gè))、細(xì)胞色素P450 (21個(gè))。
表2 6個(gè)馬鈴薯晚疫病抗性性狀在不同分析模型和顯著水平下的顯著關(guān)聯(lián)標(biāo)記Table 2 Significant correlation markers of six phenotype of potato resistance to late blight under different analytical models and significant levels
(續(xù)表 2)
(續(xù)表 2)
本研究采用了5種模型對(duì)基因組數(shù)據(jù)和表型數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析。GLM 模型(general linear model)采用Q矩陣[16], MLM模型(mixed linear model)采用Q+K矩陣[16], CMLM模型(compressed mixed linear model)算法介于GLM和MLM之間, 尋找最優(yōu)算法壓縮計(jì)算時(shí)間[20], EMMAX模型(efficient mixed model association eXpedited)在MLM模型基礎(chǔ)上校正關(guān)聯(lián)群體的群體結(jié)構(gòu)和遺傳親緣關(guān)系并加速這種運(yùn)算過(guò)程[21-22], FASTLMM (factored spectrally transformed linear mixed model)同樣修正了MLM模型的運(yùn)算公式, 提高運(yùn)算速度[23]。盡管不同的模型存在差異, 但是在所有模型下分析的表型性狀得到的結(jié)果都比較可靠(圖2)。5種模型下共關(guān)聯(lián)到82個(gè)SNP位點(diǎn), 而同一性狀、同樣的顯著水平下, GLM模型分析關(guān)聯(lián)到的SNP位點(diǎn)數(shù)量明顯多于其他模型(表2)。與晚疫病抗性相關(guān)的候選基因中, 關(guān)聯(lián)到48個(gè) SNP位點(diǎn), 其中 13個(gè)(第 6、14、16、31、32、56、60、65、68、69、70、75和81號(hào)) SNP位點(diǎn)只在GLM模型下關(guān)聯(lián)到, 16個(gè)SNP位點(diǎn)在所有模型到關(guān)聯(lián)到, 剩余的19個(gè)SNP位點(diǎn)在2~4個(gè)模型下獲得。因此, 利用多種模型分析能關(guān)聯(lián)到更多可能與晚疫病抗性相關(guān)的候選基因。
栽培馬鈴薯晚疫病抗性主要來(lái)自安第斯栽培種S. tuberosumAndigenum group (包括andigena、phureja和stenotomun)[24-26], 并通過(guò)導(dǎo)入野生種如S.demissum[27]、S. venturii[7]、S. bulbocastanum[28]等的抗性基因不斷改良馬鈴薯栽培種的晚疫病抗性。盡管?chē)?guó)際馬鈴薯中心通過(guò)不斷的輪回選擇創(chuàng)制了一批晚疫病水平抗性群體[29], 但是這批材料中可能仍存在垂直抗性基因(R1-R11)[30]。本研究所用的試驗(yàn)材料即是來(lái)自國(guó)際馬鈴薯中心篩選的水平抗性群體,并且關(guān)聯(lián)到12個(gè)R1類(lèi)似基因, 3個(gè)番茄斑萎病抗性基因, 4個(gè)Rpi-vnt1抗性基因以及4個(gè)多效性耐藥蛋白基因。
植物中抗性基因編碼的最大的一類(lèi)蛋白具有核苷酸結(jié)合位點(diǎn)和亮氨酸重復(fù)結(jié)構(gòu)(nucleotide-binding site plus leucine-rich repeat, NB-LRR)[31], 而目前已知的馬鈴薯晚疫病抗性基因編碼的都是NB-LRR蛋白[32]。R1基因定位在5號(hào)染色體上, 是植物抗性基因亮氨酸zipper/NBS/LRR中的一員[33]。根據(jù)前人的研究, 至少有4個(gè)抗性基因位于9號(hào)染色體, 分別是R8[8-9]、R9a[34]、Rpi-vnt1[7]和Rpi-moc1[35], 這 4 個(gè)基因均位于 9號(hào)染色體長(zhǎng)臂末端, 而且遺傳距離比較近[34,36]。本研究所關(guān)聯(lián)到的12個(gè)R1類(lèi)似基因位于9號(hào)染色體, 其長(zhǎng)度為 35.34 Mb, 而關(guān)聯(lián)到的 SNP的位置在 34.8 Mb左右, 因此, 這些抗性基因肯定不是R1, 而可能是已克隆的R8或其他抗性基因。Sw-5是番茄中一類(lèi)廣譜抗性的番茄斑萎病(ToMV)抗性基因[37], 位于 9號(hào)染色體上的抗性基因R8與Sw-5同源, 而Rpi-vnt1與番茄中另1個(gè)ToMV持久抗性基因 Tm-22同源[7,38]。本研究中另外關(guān)聯(lián)到與RPi-vnt1基因類(lèi)似的基因, 其位置在32.5 Mb附近,而關(guān)聯(lián)到的ToMV抗性基因位于34.7 Mb左右, 根據(jù)R8與Rpi-vnt1的遺傳位置[36],Rpi-vnt1在R8的上方, 因此關(guān)聯(lián)到位于32.5 Mb的基因可能是Rpi-vnt1,而位于34.7 Mb的基因可能是R8。多效性耐藥蛋白是一類(lèi) ABC轉(zhuǎn)運(yùn)蛋白, 可參與到擬南芥[39](PEN3)和小麥[40](Lr34)中非宿主抗性和對(duì)病原菌的持久抗性中。馬鈴薯中的多效性耐藥蛋白也可參與到晚疫病菌的侵染過(guò)程中, 但是具體怎么調(diào)節(jié)這個(gè)過(guò)程尚不清楚[41]。本研究關(guān)聯(lián)到的多效性耐藥蛋白基因位于 31.7 Mb左右, 其對(duì)馬鈴薯晚疫病抗性貢獻(xiàn)的大小, 有待進(jìn)一步研究。
?
?
?
本研究所用材料主要是表現(xiàn)出晚疫病水平抗性,即非R基因主導(dǎo)的持久抗性[29]。還存在其他途徑影響晚疫病抗性[42-43], 包括參與信號(hào)轉(zhuǎn)導(dǎo)和基因調(diào)控、茉莉酸途徑、水楊酸途徑、病程相關(guān)基因、苯基丙酸類(lèi)合成途徑、HMGR基因和細(xì)胞色素P450。馬鈴薯中MAPK激酶和WRKY轉(zhuǎn)錄因子可參與植物對(duì)晚疫病菌的防御過(guò)程如StMPK1[44]、StWRKY8[45]、StWRKY1[46]。本研究在 7號(hào)染色體上關(guān)聯(lián)到 1個(gè)MAPK基因和WRKY基因, 在3號(hào)染色體上關(guān)聯(lián)到3個(gè)WRKY基因, 它們對(duì)晚疫病水平抗性的貢獻(xiàn)有待進(jìn)一步研究。激素信號(hào)在植物病害防御中發(fā)揮著重要作用, 植物激素茉莉酸和水楊酸代謝途徑中的因子不同程度地參與到馬鈴薯晚疫病水平抗性中[47-49]。本研究中關(guān)聯(lián)到 1個(gè)與茉莉酸代謝途徑可能相關(guān)和3個(gè)與水楊酸代謝途徑可能相關(guān)的基因, 在其他馬鈴薯晚疫病抗性全基因組關(guān)聯(lián)分析和 QTL定位研究中也定位到與茉莉酸和水楊酸代謝途徑相關(guān)的基因[50-51]。有趣的是, 本研究中關(guān)聯(lián)到 3個(gè)參與苯基丙酸類(lèi)合成途徑的查爾酮合成酶基因(CHS), 位于9號(hào)染色體。馬鈴薯中CHS基因至少有6個(gè)拷貝,研究較多的是位于5號(hào)染色體的CHS基因參與馬鈴薯塊莖中花青素合成[52-54]。但是, 查爾酮合成酶能夠參與植物病害防御反應(yīng)[55-56], 表明位于 9號(hào)染色體的CHS基因可能是構(gòu)成馬鈴薯晚疫病水平抗性因素之一。其他基因包括與病程相關(guān)的基因、HMGR基因和細(xì)胞色素 P450都有報(bào)道可以參與植物病害防御過(guò)程, 但是在馬鈴薯晚疫病水平抗性中所起的作用是不清楚的, 而本研究關(guān)聯(lián)到的基因可以為馬鈴薯晚疫病水平抗性的形成機(jī)理提供參考[42,57-59]。
基于5種模型的GWAS結(jié)果, 共檢測(cè)到82個(gè)與晚疫病抗性顯著相關(guān)的SNP位點(diǎn), 其中48個(gè)位點(diǎn)關(guān)聯(lián)到可能與晚疫病抗性相關(guān)的候選基因, 包括R1同源基因、Sw-5同源基因(R8)、Rpi-vnt1基因、與信號(hào)轉(zhuǎn)導(dǎo)相關(guān)的MAPK基因、WRKY基因、參與植物激素茉莉酸和水楊酸代謝相關(guān)的基因、參與苯基丙酸類(lèi)合成途徑的查爾酮酶基因和其他病程相關(guān)的基因、HMGR基因以及細(xì)胞色素P450基因。