李雪微,郭超程,宋瑤,高長(zhǎng)斌,張小康,熊秋芳,劉克德
1.華中農(nóng)業(yè)大學(xué)作物遺傳改良國(guó)家重點(diǎn)實(shí)驗(yàn)室,武漢 430070;2.武漢市農(nóng)業(yè)科學(xué)院蔬菜研究所,武漢 430345;3.武漢萊菔農(nóng)業(yè)科技有限公司,武漢 430345
蘿卜(Raphanus sativusL.)是十字花科蘿卜屬1年生或2年生草本植物,是我國(guó)秋、冬季的主要蔬菜之一。葉片是植物進(jìn)行光合作用及蒸騰作用的主要場(chǎng)所。蘿卜葉形各異,根據(jù)葉緣形狀及裂刻深淺可大致分為花葉(羽狀深裂或全裂)和板葉(全緣或葉緣淺裂)2 種類型[1-2]。研究表明,花葉透光性好,空氣流通性強(qiáng),可減輕病蟲危害,提高作物的品質(zhì)與產(chǎn)量,是植物適應(yīng)環(huán)境的重要表現(xiàn)[3-4]。因此,葉形是蘿卜重要的產(chǎn)量性狀。此外,蘿卜花葉對(duì)板葉為顯性,在生產(chǎn)上常作為指示性狀用于雜種純度鑒定,是蘿卜育種的重要性狀之一[5]。然而,目前關(guān)于蘿卜花葉性狀的遺傳機(jī)制尚不明確。
近年來,隨著蘿卜參考基因組的公布及高通量測(cè)序技術(shù)的發(fā)展,蘿卜重要性狀的遺傳及基因定位研究有了較大的進(jìn)展,但多集中在根部性狀如根部形態(tài)、色澤等,未見花葉基因的相關(guān)報(bào)道[6]。十字花科植物葉緣裂刻基因(花葉基因)的定位主要集中蕓薹屬植物白菜(Brassica rapa)[7]、甘藍(lán)型油菜(B.napus)[8-9]和甘藍(lán)(B. oleracea)[10]。前人研究表明,蘿卜(2n=18,RR)與蕓薹屬植物親緣關(guān)系近,蘿卜基因組與擬南芥基因組(2n=10)及蕓薹屬物種基因組如白菜基因組(2n=20,AA)之間存在較好的共線性關(guān)系,這些共線性區(qū)塊可為蘿卜重要性狀QTLs的候選基因鑒定提供幫助[11-13]。本研究以胞質(zhì)雄性不育材料WA(板葉)為母本、恢復(fù)系材料J4(花葉)為父本構(gòu)建F2葉形分離群體,利用BSA 結(jié)合GBS 的極端混池測(cè)序法(bulked segregant analysis sequencing,BSA-seq)對(duì)蘿卜花葉基因進(jìn)行初定位,通過將蘿卜全基因組與甘藍(lán)型油菜全基因組進(jìn)行共線性比對(duì),并結(jié)合基因功能注釋確定蘿卜花葉性狀的候選基因,旨在為蘿卜花葉基因克隆、葉形改良及輔助選育蘿卜花葉品種奠定基礎(chǔ)。
以胞質(zhì)雄性不育材料WA(板葉)為母本,恢復(fù)系材料J4(花葉)為父本,構(gòu)建F2群體,用于花葉性狀的遺傳分析和基因定位研究。11個(gè)蘿卜栽培品種(7個(gè)花葉品種與4 個(gè)板葉品種)用于候選基因的序列分析。供試材料均由武漢市農(nóng)業(yè)科學(xué)院蔬菜研究所蘿卜育種室提供。
蘿卜植株長(zhǎng)至5~6 片真葉時(shí)進(jìn)行葉形調(diào)查。F2單株表型鑒定時(shí)要先對(duì)單株編號(hào)并掛牌,每個(gè)單株的表型分別調(diào)查3次,確保表型無誤后計(jì)算F2群體的葉形分離比,并進(jìn)行卡方檢驗(yàn)。
按照掛牌順序進(jìn)行取樣,每個(gè)單株約取0.25 g幼嫩葉片,放入96 孔深孔板內(nèi)。采用改良的CTAB 法提取DNA,并用瓊脂糖凝膠電泳檢測(cè)所提DNA的質(zhì)量。根據(jù)F2群體表型,隨機(jī)選取20個(gè)花葉單株DNA和20 個(gè)板葉單株DNA,經(jīng)Qubit 測(cè)定濃度后,將20個(gè)花葉單株的DNA 和20個(gè)板葉單株的DNA 分別等質(zhì)量混合構(gòu)成花葉DNA 混池(Bulk 1,BK1)和板葉DNA 混池(Bulk 2,BK2),并將終質(zhì)量濃度調(diào)整至25 ng/μL。
用Chen 等[14]的方法構(gòu)建簡(jiǎn)化基因組測(cè)序文庫(kù)。即用SacⅠ和MseⅠ對(duì)親本和2 個(gè)混池的基因組DNA 分別進(jìn)行雙酶切,然后分別連接上含有不同標(biāo)簽序列的接頭。將帶有不同標(biāo)簽的連接產(chǎn)物混合成1個(gè)測(cè)序文庫(kù),經(jīng)PCR 產(chǎn)物回收試劑盒(Qiagen)純化濃縮后在2%的瓊脂糖凝膠上電泳分離,并用膠回收試劑盒(Qiagen)將220~500 bp的片段進(jìn)行回收。利用PCR 反應(yīng)給每個(gè)混合測(cè)序文庫(kù)引入與Illumina flow cell上固定的寡核苷酸互補(bǔ)配對(duì)的序列,PCR 產(chǎn)物經(jīng)瓊脂糖凝膠電泳分離后用膠回收試劑盒回收目標(biāo)片段。構(gòu)建好的測(cè)序文庫(kù)在HiSeq 4000 平臺(tái)上進(jìn)行測(cè)序。
用 FastQC(https://www.bioinformatics.babraham.ac.uk/projects/fastqc/)檢測(cè)測(cè)序原始序列的質(zhì)量,并用Trimmomatic[15]軟件進(jìn)行質(zhì)量控制。質(zhì)控后的數(shù)據(jù)經(jīng)BWA 比對(duì)到蘿卜參考基因組(http://radish-genome.org/)上,再用 GATK[16]提取全基因組變異信息,用ANNOVAR[17]對(duì)變異信息進(jìn)行注釋。BWA 和Samtools 分析均使用默認(rèn)參數(shù),GATK使用的過濾參數(shù)為“QUAL <30.0 || QD <4.0 ||FS > 60.0||MQ < 40.0 ”。
以蘿卜參考基因組作為參考,利用QTLseqr 軟件[18]計(jì)算每個(gè)多態(tài)性位點(diǎn)在2 個(gè)混池中的SNP-index 及Δ(SNP-index)。使用滑窗分析方法計(jì)算500 kb 區(qū)段內(nèi)SNP-index 及Δ(SNP-index)的均值,并對(duì)其在染色體上的分布作圖,步長(zhǎng)2 Mb。兩池中差異較大的區(qū)段即為蘿卜花葉基因的候選區(qū)段。
利用MCScanX[19]分析蘿卜基因組與甘藍(lán)型油菜基因組的共線性關(guān)系。并對(duì)蘿卜花葉基因定位區(qū)間內(nèi)的共線性區(qū)段進(jìn)行基因功能注釋,預(yù)測(cè)蘿卜花葉候選基因。
基于蘿卜參考基因組,在Rs390250全長(zhǎng)、上游1 kb 和下游 200 bp 處共設(shè)計(jì) 3 對(duì)引物(Rs-1F/Rs-1R、Rs-2F/Rs-2R、Rs-3F/Rs-3R)分別對(duì)親本進(jìn)行PCR 擴(kuò)增。PCR 產(chǎn)物直接進(jìn)行測(cè)序,并利用Sequencher(GeneCodes,USA)軟件進(jìn)行測(cè)序序列的比對(duì)與變異位點(diǎn)檢測(cè)。針對(duì)親本序列間存在的664 bp插入變異(Indel664)開發(fā)成分子標(biāo)記(Rs-3F/Rs-2R),擴(kuò)增F2群體中表型為板葉(隱性)的單株,檢測(cè)該候選基因是否與花葉性狀共分離。引物序列見表1。
表1 Rs390250擴(kuò)增引物Table 1 Primers for Rs390250 amplification
當(dāng)植株長(zhǎng)到5~6 片真葉時(shí),采用Trizol Reagent方法分別提取花葉與板葉親本真葉的RNA,2%瓊脂糖凝膠電泳檢測(cè)RNA 的質(zhì)量并用Nanodrop(Thermo Scientific,USA)檢測(cè)RNA 純度。利用RevertAid First strand cDNA synthesis kit(Thermo Scientific,USA)合成cDNA 的第一鏈作為模板,進(jìn)行親本的RT-PCR 反應(yīng),檢測(cè)候選基因Rs390250的表達(dá)水平。Rs390250基因特異性引物Rsa 來自https://biodb.swu.edu.cn/qprimerdb/[20],Actin[6]作為對(duì)照基因(引物序列見表1)。
利用MEGA7 軟件對(duì)已報(bào)道的多個(gè)控制葉緣裂刻的LMI1-like基因進(jìn)行氨基酸序列比對(duì),并對(duì)來自蕓薹屬植物和蘿卜的基因序列進(jìn)行系統(tǒng)發(fā)育分析。統(tǒng)計(jì)方法選用最大似然法,系統(tǒng)發(fā)育測(cè)驗(yàn)釆用“Bootstrap”重復(fù)1 000 次。Rs390250的氨基酸序列在http://radish-genome.org/下載。來自擬南芥、白菜、甘藍(lán)及甘藍(lán)型油菜的基因序列在http://brassicadb.org/brad/下載,其余基因的序列在 NCBI(https://www.ncbi.nlm.nih.gov/genbank/)通過 Genbank 號(hào)[ChLMI1(KF939590) ,RCO(LMI1-like2,KF939591) ,LMI1-like3(KF939592) ,CaLMI1(PHT71668) ,CgRCO(KM214233) ,CrRCO(KM214232)]檢索并下載。
親本J4 葉緣鋸齒銳尖,部分裂刻直達(dá)中脈,表現(xiàn)為花葉;親本W(wǎng)A 葉緣有小齒近全緣,表現(xiàn)為板葉(圖1)。F1植株全為花葉,裂刻深度介于雙親中間。F2群體共287 個(gè)單株,其中花葉有219 株,板葉有68株,花葉與板葉的分離比為3.22∶1,符合預(yù)期的孟德爾分離比(χ2=0.227<3.84),表明花葉性狀受1 對(duì)基因控制,花葉對(duì)板葉呈不完全顯性。
圖1 蘿卜葉形Fig.1 The leaf shape of Raphanus sativus L.
利用BSA-seq[21]分別對(duì)花葉和板葉親本及BK1和BK2進(jìn)行簡(jiǎn)化基因組測(cè)序。花葉親本J4和板葉親本W(wǎng)A分別獲得2 500 383和3 453 168條雙端序列,花葉混池BK1 和板葉混池BK2 分別得到2 851 995和4 844 581 條序列。將親本及2 個(gè)混池的序列分別比對(duì)到蘿卜參考基因組,經(jīng)質(zhì)量控制及親本的基因型篩選后,共得到4 543 個(gè)高質(zhì)量多態(tài)性位點(diǎn),包括3 851 個(gè) SNP(single nucleotide polymorphism)位點(diǎn)和692個(gè)Inde(lInsertion/Deletion)位點(diǎn)。利用QTLseqr軟件分別計(jì)算 BK1 和 BK2 的 SNP-index 及 Δ(SNP-index)(移動(dòng)窗口為2 Mb)(圖2),結(jié)果顯示在 R7 染色體 66 425~7 968 993 bp 區(qū)間內(nèi)Δ(SNP-index)超過閾值0.5(P=0.000 1),表明蘿卜花葉基因可能位于該區(qū)間內(nèi)。
圖2 BSA-seq定位蘿卜花葉基因Fig.2 Genetic mapping of leaf shape gene by BSA-seq
通過將蘿卜全基因組與甘藍(lán)型油菜全基因組進(jìn)行共線性分析,發(fā)現(xiàn)位于蘿卜R7 染色體花葉候選區(qū)間0.87~1.32 Mb 與油菜A10 染色體的16.35~16.80 Mb 存在很好的共線性(圖3)。甘藍(lán)型油菜中存在類似的花葉變異,油菜花葉基因BnLL1.LMI1(BnaA10g26320D)和BnA10.LMI1(BnaA10g26330D)都位于該共線性染色體區(qū)段[7-9]。根據(jù)蘿卜參考基因組對(duì)該區(qū)段內(nèi)的70 個(gè)基因進(jìn)行注釋分析發(fā)現(xiàn),Rs390250(899 863~901 651 bp)與油菜花葉基因BnaA10g26320D、BnaA10g26330D及擬南芥AT5G037 90(LMI1,Late Meristem Identity1)是直向同源基因,都屬于HD-ZipⅠ家族,編碼 HD-ZipⅠ(the classⅠhomeodomain leucine-zipper)轉(zhuǎn)錄因子。在擬南芥葉發(fā)育調(diào)控網(wǎng)絡(luò)中,LMI1位于分生組織調(diào)節(jié)因子LFY(Leafy)下游,誘導(dǎo)CAL(Cauliflower)基因表達(dá),影響擬南芥鋸齒葉的形成[22]。因而,我們推測(cè)Rs390250為控制蘿卜花葉的候選基因。
圖3 蘿卜花葉基因候選區(qū)間的共線性分析Fig.3 The collinearity analysis in the candidate interval of the lobed-leaf gene
Rs390250基因全長(zhǎng)1 789 bp,由3 個(gè)外顯子和2個(gè)內(nèi)含子組成,編碼220個(gè)氨基酸。根據(jù)蘿卜參考基因組,分別擴(kuò)增了親本Rs390250翻譯起始點(diǎn)(translation start site,TSS)上游1 kb 及編碼區(qū)序列,并進(jìn)行PCR 產(chǎn)物測(cè)序。序列比對(duì)發(fā)現(xiàn),在基因的開放閱讀框(open reading frame)內(nèi)存在 3 個(gè) SNP(G84C、A177T 和T425C)。其中,A177T 為同義突變(synonymous mutation),而 G84C 和 T425C 是非同義突變(non-synonymous mutation)(圖4A、B)。在啟動(dòng)子區(qū),位于 TTS 上游-418 bp 處,J4 存在 149 bp 的插入序列,其中130 bp 與插入位點(diǎn)后的130 bp 序列重復(fù)。另外,在J4 的第一內(nèi)含子內(nèi)還存在664 bp 的插入序列(圖4A)。該插入序列兩側(cè)存在9 bp 目標(biāo)信號(hào)復(fù)制(target sigte duplicate)序列GTTTTTAAA,插入序列兩端存在4 bp 的末端反向重復(fù)序列(GAGTTATTCTTGGGTTCACCCCCTAGGGT -GAACCTTTAGGTTCACC)。檢索轉(zhuǎn)座子數(shù)據(jù)庫(kù)(http://pmite.hzau.edu.cn)[23],發(fā)現(xiàn)該 664 bp 的插入序列屬于Mutator類轉(zhuǎn)座子。
為了檢測(cè)該轉(zhuǎn)座子是否與花葉基因共分離,在664 bp 插入序列兩側(cè)設(shè)計(jì)引物(Rs-3F/Rs-2R),擴(kuò)增F2群體內(nèi)的68 個(gè)隱性單株(板葉表型),瓊脂糖膠檢測(cè)發(fā)現(xiàn)這68 個(gè)單株的基因型同母本(WA)相同,且比J4 擴(kuò)增片段小了約700 bp,即都不含有這664 bp的插入(圖4C),這表明該基因在群體內(nèi)同花葉性狀共分離。RT-PCR分析發(fā)現(xiàn),Rs390250的轉(zhuǎn)錄水平在WA 和J4 的真葉內(nèi)無明顯差異(圖4D),表明葉形變異可能與啟動(dòng)子及內(nèi)含子中的插入序列無關(guān)。
Rs390250編碼 HD-ZipⅠ(the class I homeodomain leucine-zipper)轉(zhuǎn)錄因子。HD-ZipⅠ蛋白由同源異型域(homeodomain,HD)與緊隨其后的亮氨酸拉鏈(leucine zipper,LZ)結(jié)構(gòu)域組成。LZ 結(jié)構(gòu)域具有多個(gè)亮氨酸,能形成二聚體結(jié)構(gòu)幫助HD-Zip 蛋白識(shí)別目標(biāo)DNA,對(duì)HD-ZipⅠ轉(zhuǎn)錄因子的功能發(fā)揮具有重要作用[24]。本研究中,位于Rs390250第 3 外顯子的非同義突變位點(diǎn)T425C 將導(dǎo)致該位點(diǎn)編碼的絲氨酸(serine,S)變?yōu)榱涟彼幔╨eucine,L),且該位點(diǎn)恰位于LZ 結(jié)構(gòu)域內(nèi)(圖4B)。這表明,該位點(diǎn)的突變可能破壞了LZ 結(jié)構(gòu)域的形成,進(jìn)而對(duì)HD-ZipⅠ轉(zhuǎn)錄因子的功能造成影響。為驗(yàn)證以上猜想,本研究對(duì)多個(gè)已報(bào)道的控制葉緣裂刻的LMI1-like基因在LZ 結(jié)構(gòu)域上的氨基酸序列進(jìn)行比對(duì),并將Rs390250與擬南芥LMI1-like基因及蕓薹屬物種報(bào)道的花葉基因進(jìn)行系統(tǒng)發(fā)育分析。結(jié)果顯示,所有花葉基因同Rs390250-J4 在該位點(diǎn)上都翻譯為S,僅WA 翻譯為L(zhǎng),表明該位點(diǎn)的S 為保守氨基酸(圖5A),且該基因同BnaA10g26320D屬于RCO(reduced complexity,LMI1-like2)類型(圖5B)。進(jìn)一步對(duì)來自11 個(gè)蘿卜栽培品種的Rs390250序列進(jìn)行擴(kuò)增并進(jìn)行Sanger測(cè)序,結(jié)果顯示,所有板葉品種在該位點(diǎn)上基因型為T/T,花葉材料在該位點(diǎn)上表現(xiàn)為C/C 或C/T(表2)。綜上,T425C 可能是導(dǎo)致蘿卜葉形變異的關(guān)鍵位點(diǎn)。
表2 11個(gè)蘿卜栽培品種的表型與基因型Table 2 The genotype of the 425th nucleotide in the coding sequence of Rs390250 from 11 radish varieties
花葉是十字花科植物廣泛存在的一種類型。LMI1是調(diào)控?cái)M南芥葉緣發(fā)育的重要基因。近年來,十字花科蕓薹屬植物中定位到的控制葉緣裂刻的基因(花葉基因)有Bra009510(B. rapa)、BnaA10g26320D和BnaA10g26330D(B. nupus)、Bol010029和Bol010030(B. oleraceavar .acephala DC.),以上基因都是At5g03790(LMI1)的同源基因,這表明LMI1-like基因在十字花科植物里主要控制葉緣裂刻的發(fā)生,功能相對(duì)保守。
本研究通過將同屬十字花科植物的蘿卜參考基因組與甘藍(lán)型油菜參考基因組進(jìn)行共線性分析,在初定位區(qū)間內(nèi)發(fā)現(xiàn) 1 個(gè)LMI1-like基因(Rs390250),注釋分析和序列分析結(jié)果表明其可能是控制蘿卜花葉的候選基因。系統(tǒng)發(fā)育分析結(jié)果表明Rs390250屬于RCO類型,前人研究顯示RCO控制復(fù)葉的小葉形成,將RCO導(dǎo)入擬南芥中,植株葉緣出現(xiàn)明顯的裂刻[25-26]。蘿卜和油菜的葉片都屬于簡(jiǎn)單葉,BnaA10g26320D已被證實(shí)是控制甘藍(lán)型油菜裂葉的關(guān)鍵基因[8],這表明RCO類基因在簡(jiǎn)單葉中也能控制葉緣的發(fā)育。此外,前人研究結(jié)果顯示BnaA10g26320D在Yuye87(裂葉親本)和Zheyou 50(淺裂親本)中表達(dá)量差異很大;BnaA10g26330D在以上材料中表達(dá)量較低且無明顯變化,但在HY(裂)和J9707(淺裂)中差異顯著[8-9],這2 個(gè)基因控制的葉形變異都被認(rèn)為是因順式調(diào)控引起的不同等位基因效應(yīng)造成的。本研究中,Rs390250在板葉和花葉親本中的表達(dá)量無明顯差異,而位于第二外顯子的非同義突變位點(diǎn)T425C恰好位于LZ 結(jié)構(gòu)域內(nèi),且導(dǎo)致保守氨基酸的改變,這對(duì)HD-ZIP 蛋白的功能可能造成影響。故本研究認(rèn)為該位點(diǎn)的變異可能是造成蘿卜葉形變異的關(guān)鍵原因。本研究結(jié)果可為進(jìn)一步解析蘿卜花葉性狀的形成和RCO類基因的作用機(jī)制進(jìn)而為葉形的改良及輔助選育蘿卜花葉品種奠定基礎(chǔ)。