唐征 昂海燕 裴徐梨 荊贊革
摘 要 為更好地從分子水平了解青花菜,對青花菜進行線粒體基因組組裝,并對其序列特征進行分析。青花菜線粒體基因組大小為219 964 bp,GC含量為45.25%。線粒體基因組注釋到61個基因,包括33個編碼蛋白基因,23個tRNA基因,3個rRNA基因和2個假基因。其中8個基因的核苷酸多樣性較高;24個基因無核酸多樣性。變異數(shù)量最多的基因是? rrn26、 rrn18和 atp1,其變異數(shù)量分別為326、277和136。密碼子偏好性分析結(jié)果顯示RSCU值>1的密碼子有29個,大多以A/U堿基結(jié)尾,表明其密碼子更偏向于A/U結(jié)尾?;蚪M序列中共檢測到345個重復(fù)序列,包括170個正向重復(fù)序列和175個回文重復(fù)序列。青花菜與花椰菜的線粒體基因組具有極好的共線性,且基因的位置基本一致。青花菜線粒體和葉綠體基因組中共檢測到22條同源片段。同源片段總長度為13 355 bp,平均607? bp。
關(guān)鍵詞 青花菜;線粒體基因組;組裝;序列分析
線粒體是真核生物不可或缺的細(xì)胞器,是呼吸作用和能量轉(zhuǎn)換的重要場所。植物線粒體基因組進化慢,保守性高,是對物種進行進化分析的理想工具,可提供系統(tǒng)發(fā)育關(guān)系、分子進化及物種診斷等信息。自1997年擬南芥線粒體基因組公布以后,研究人員陸續(xù)完成了很多重要物種的線粒體基因組測序工作,截至2023年1月,己經(jīng)有超過3 000多個植物線粒體基因組序列在NCBI中收錄。
目前,植物線粒體基因組的研究主要集中在基因組大小、基因注釋、密碼子偏好性、散在重復(fù)序列、核酸多態(tài)性、線粒體結(jié)構(gòu)比較[1-3]、葉綠體和線粒體同源序列比較[4]、細(xì)胞質(zhì)雄性不育[5]、遺傳多樣性[6]以及系統(tǒng)發(fā)育分析[7-8]等方面。陳寶玉[9]利用二代測序技術(shù)對‘紅頰草莓線粒體基因組進行測序和拼接,其大小為109 851 bp,GC含量41.95%,注釋到25個基因。栽培萵苣和野生萵苣線粒體的比較分析發(fā)現(xiàn)其編碼基因富含? A/T堿基,密碼子偏好性較弱[10]。辣椒細(xì)胞質(zhì)雄性不育系種質(zhì)HNUCA00HG的線粒體基因組大小為564 124 bp,注釋出77個已知功能基因。同另外兩份不育系的線粒體基因組比較發(fā)現(xiàn)3個不育系的線粒體可能來自同一個祖先,但明顯差異[5]。基于甜瓜線粒體基因組開發(fā)SSR標(biāo)記,對甜瓜種質(zhì)資源進行遺傳多樣性分析,結(jié)果發(fā)現(xiàn)粗網(wǎng)紋厚皮甜瓜類型形成一個獨立的分支,其他分支與品種來源相關(guān)[11]。
青花菜(Brassica oleracea L. var. italica)是十字花科蕓薹屬甘藍種的一個變種,為一二年生植物。目前,關(guān)于青花菜線粒體基因組的相關(guān)研究還很少。本研究通過組裝青花菜線粒體基因組,獲得其完整序列,能夠更好地從分子水平探究青花菜的遺傳和進化等問題,對研究其系統(tǒng)發(fā)育關(guān)系具有重大意義。
1 材料與方法
1.1 供試材料、DNA提取及測序
以青花菜高代自交系‘KU20-7為試驗材料。提取幼嫩葉片的DNA,于南京集思慧遠生物科技有限公司進行高通量測序。
1.2 青花菜線粒體基因組序列的組裝與注釋
使用CANU軟件拼接3代數(shù)據(jù)得到contig序列,利用blast將conting比對到公布植物的線粒體基因組,比對上的conting為種子序列,使用原始數(shù)據(jù)對序列進行延伸和環(huán)化。使用NextPolish對結(jié)果進行校正,最后手動校正獲得最終的組裝結(jié)果。
使用blast對青花菜線粒體基因進行比對注釋;使用tRNAscanSE(http://lowelab.ucsc.edu/tRNAscan-SE/)對tRNA進行注釋;使用OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)進行青花菜線粒體基因組圖譜的繪制。利用自行編寫的Perl腳本篩選青花菜線粒體基因的 CDS區(qū)域,并計算密碼子偏好性。
1.3 青花菜線粒體基因組核酸多樣性Pi分析
使用MAFFT軟件對不同物種的同源基因序列進行全局比對,采用dnasp5計算每個基因的Pi值,繪制直觀圖。
1.4 青花菜線粒體基因組散在重復(fù)序列分析
將vmatch v2.3.0軟件與Perl腳本相結(jié)合,以長度≥30 bp,海明距離=3為標(biāo)準(zhǔn),來鑒定青花菜線粒體基因組的散在重復(fù)序列。
1.5 青花菜線粒體序列同源及共線性分析
使用Mauve(http://darlinglab.org/mauve)軟件默認(rèn)參數(shù),對青花菜、花椰菜(? KJ820683.1)、甘藍( KU831325.1)、歐洲油菜( AP018473.1)、埃塞俄比亞芥( JF920287.1)、擬南芥( LUHQ01000021.1)、黑芥( NC029182.1)和蕪青( NC-049892.1)等近源物種進行基因組比對,并對其共線性進行分析。
1.6 青花菜線粒體和葉綠體同源序列比較
使用blast軟件,設(shè)置相似度為70%,E-value為1×10-5查找青花菜葉綠體與線粒體之間的同源序列,利用circos將其可視化。
2 結(jié)果與分析
2.1 青花菜線粒體基因組組裝與注釋
青花菜線粒體基因組大小為219 964 bp,A含量為27.49%,T含量為27.26%,C含量為? 22.98%,G含量為22.27%,GC含量為45.25%(圖1)。線粒體基因組共注釋到61個基因:33個編碼蛋白基因,23個tRNA基因,3個rRNA基因,和2個假基因。青花菜線粒體基因組中33個蛋白編碼基因總長 29 055 bp,其中? rrn26最長為3 148 bp, atp9和 Rp110最短,為225 bp。
在注釋到的61個基因中,復(fù)合系統(tǒng)Ⅰ(NADH dehydrogenase)的基因有9個;復(fù)合系統(tǒng)Ⅲ的基因為cob;復(fù)合系統(tǒng)Ⅳ的基因有 cox1、 cox2和 cox3;ATP合酶基因有 atp1、 atp4、 atp6、 atp8和 atp9;核糖體RNA的基因有 rrn5、 rrn18和? rrn26;轉(zhuǎn)運RNA的基因有trnC-GCA、trnD-GTC、trnE-TTC、trnG-GCC、trnH-GTG、trnI-AAT、trnK-TTT、trnL-CAA、trnM-CAT、trnN-GTT、trnP-TGG、trnQ-TTG、trnS-GCT、trnS-GGA、trnS-TGA、trnT-GGT、trnW-CCA和trnY-GTA;ccmB、ccmC、ccmFc和ccmFn?? 4個基因參與調(diào)控細(xì)胞色素c的生物合成;另外, rpl2、 rpl5、 rpl10、 rpl16、 rps12、 rps14、 rps3、 rps4和 rps7基因用于編碼核糖體蛋白,余下的基因如matR基因可編碼成熟酶,mttB基因可編碼轉(zhuǎn)運子。青花菜線粒體基因組中共有11個基因含有內(nèi)含子(表1)。
2.2 青花菜線粒體基因組密碼子偏好性分析
密碼子偏好性分析結(jié)果表明: RSCU值>1的密碼子有29個,其中以A/U堿基結(jié)尾的有27個,在青花菜線粒體基因組中的密碼子更偏向于A/U堿基結(jié)尾。61個基因共有9 209個密碼子(除終止密碼子外),精氨酸(Arg)、亮氨酸(Leu)和絲氨酸(Ser)的密碼子使用量最相近,其中亮氨酸(Leu)的密碼子是使用最多的,共995個,約占總密碼子數(shù)的10.80%;半胱氨酸(Cys)的密碼子是使用最少的,共127個,約占總密碼子數(shù)的? 1.38%。丙氨酸的密碼子GCU和組氨酸的密碼子CAU在青花菜線粒體基因組的使用量最高,偏好性明顯;甲硫氨酸的密碼子AUG和色氨酸的密碼子UGG在青花菜線粒體基因組中無偏好性(表2)。
2.3 青花菜線粒體基因組核酸多樣性分析
cox2、 rrn18、? rrn26、? nad2、 atp1、 cox3、trnL-CAA和ccmFC基因的核苷酸多樣性較高; trnH-GTG、trnS-TGA、? nad6、trnM-CAT、ccmB、trnC-GCA、trnP-TGG、trnE-TTC、trnW-CCA、trnS-GCT、trnH-GTG、 rpl10、trnQ-TTG、trnM-CAT、? nad4L、trnY-GTA、trnK-TTT、 rpl16、trnS-GGA、trnG-GCC、 atp9、 rrn5、 atp8和trnM-CAT基因無核酸多樣性。變異數(shù)量較多基因為? rrn26、 rrn18和 atp1,變異數(shù)量分別為326、277和136。7個基因的變異數(shù)量大于10小于100,21個基因的變異數(shù)量小于10,24個基因不存在變異(表3)。
2.4 青花菜線粒體基因組散在重復(fù)序列分析
青花菜線粒體基因組共鑒定到345個重復(fù)序列,包括170個正向重復(fù)和175個回文重復(fù)。其中30~39 bp范圍內(nèi)的分布數(shù)量最多;40~49 bp范圍內(nèi)的分布數(shù)次之。長度為70~79 bp、80~89 bp、90~99 bp和>200 bp范圍內(nèi)的重復(fù)序列中的散在重復(fù)序列分布數(shù)量較少(表4)。
2.5 青花菜線粒體序列同源及共線性分析
線粒體基因組序列同源比對及共線性分析表明:青花菜與花椰菜的線粒體基因組相似度最高,與甘藍較近,而與其他幾個物種相似度相對較遠。青花菜與花椰菜的線粒體基因組具有極好的共線性,且基因的排列順序基本一致。同甘藍線粒體基因組相比較,可觀察到大片段的倒位(圖2)。
2.6 青花菜葉綠體和線粒體同源序列分析
青花菜線粒體和葉綠體基因組中共檢測到22條同源片段(圖3)。同源片段總長度為13 355 bp,平均607? bp。序列長度最長為2 186 bp,最短的僅為42 bp。從長度分布上看,>1 000 bp的有6條,介于100~1 000 bp的有7條,小于100 bp的有9條。7條同源片段E值最小,為零;2條同源片段E值最大,為3.24×10-12。E值為0的同源片段其Bit-score值1 074~3 827,均大于? 1 000;E值較大且長度較短的同源片段其Bit-score值較小,介于73.1~163。
3 討? 論
采用形態(tài)學(xué)方法進行分類和系統(tǒng)發(fā)育研究中,由于受到主觀性和環(huán)境因素的影響,容易得到不一致的結(jié)論。自2008年以來,第三代測序技術(shù)應(yīng)運而生,其長測序讀長,有效解決了第二代測序讀長短和系統(tǒng)偏向性的問題[12]。本研究采用第二代+三代測序技術(shù)對青花菜進行線粒體基因組測序,構(gòu)建了青花菜線粒體基因組圖譜,注釋了61個基因,明確了青花菜線粒體基因組結(jié)構(gòu)與特征,為之后深入研究青花菜的系統(tǒng)進化提供理論基礎(chǔ)。
本研究組裝的青花菜線粒體基因組大小為219 964 bp,參考已公開的花椰菜(219 962 bp)和甘藍(219 975 bp)線粒體基因組的大小,筆者認(rèn)為此次組裝的青花菜線粒體基因組完整度高,且組裝質(zhì)量高。同其近源物種相比較,甘藍類作物線粒體基因組大小基本相同,而親緣關(guān)系稍遠的歐洲油菜(227 181 bp)、埃塞俄比亞芥(232 241 bp)、擬南芥(213 235 bp)和黑芥(232 407 bp)均比青花菜略大一些。參照前人研究結(jié)果,不同種類植物的線粒體基因組大小差異較大。本研究中選用的幾個物種的大小總體差異不大,可能是由于其為近源物種,線粒體的性質(zhì)相近造成的。青花菜線粒體基因組的GC含量為45.25%,也符合被子植物GC 含量的一般規(guī)律。于前人研究結(jié)果相符,植物線粒體基因組的GC含量隨著進化而趨于穩(wěn)定[13]。
有研究表明同源重組是mtDNA快速進化的原因,無論是再塑造還是維持基因組方面[14]。本研究對青花菜線粒體基因多樣性進行了研究,結(jié)果表明:? cox2、 rrn18、? rrn26、? nad2、 atp1、 cox3、trnL-CAA和ccmFC基因的核酸變異度較高,其中? rrn26、 rrn18和 atp1中核酸變異度基因數(shù)最多。這為進一步研究同源重組對青花菜mtDNA快速進化提供了一些新的見解。
參考文獻 Reference:
[1] 葉麗云,孟國良,何小芳,等.靈芝屬不同種線粒體基因組比較分析[J].基因組學(xué)與應(yīng)用生物學(xué),2022,41(8):1723-1731.
YE L Y,MENG G L,HE X F,et al. Comparative analysis of mitochondrial genomes among Ganoderma species[J].Genomics and Applied Biology,2022,41(8):1723-1731.
[2]李玉秋,趙洪錕,譚 化,等.八種植物線粒體基因組結(jié)構(gòu)特征分析與比較[J].生物技術(shù)通報,2011(10):156-162.
LI Y Q,ZHAO H K,TAN H,et al.Analysis and comparison on characteristic of mitochondrial genome of eight plant[J].Biotechnology Bulletin,2011(10):156-162.
[3]桂松濤,吳智華,張洪源,等.構(gòu)建蓮線粒體基因組圖譜揭示其進化特征[C].2016年全國植物生物學(xué)大會摘要集,2016:104.
GUI S T,WU ZH H,ZHANG H Y,et al. Construction of lotus mitochondrial genome map to reveal its evolutionary characteristics[C].2016 National Plant Biology Conference abstract set,2016:104.
[4]王 遂.白樺全基因組測序及分析[D].哈爾濱:東北林業(yè)大學(xué),2019.
WANG S.Whole-genome sequencing and analysis of betula platyphylla[D]. Harbin:Northeast Forestry University,2019.
[5]李彩朝,Gagoshidze Zakaria,金威恒,等.辣椒新細(xì)胞質(zhì)雄性不育線粒體基因組的測序及分析[J].分子植物育種,2022,20(16):5250-5257.
LI C CH,ZAKARIA G,JIN W H,et al.Sequencing and?? analysis of a new cytoplasmic male sterility mitochondrial genome in pepper[J]. Molecular Plant Breeding,2022,? 20(16):5250-5257.
[6]ZHAN A,BAILEY S A,HEATH D D,et al.Performance comparison of genetic markers for high-throughput sequencing-based biodiversity assessment in complex communities[J].Molecular Ecology Resources,2014,14:1049-1059.
[7]劉 磊.基于不同基因組序列的十字花科分子系統(tǒng)發(fā)育研究[D]. 武漢:武漢大學(xué),2012.
LIU L.Molecular? phylogetic relationships of Brassicaceae species inferred from various genomic sequences[D].Wuhan:Wuhan University,2012.
[8]方津津,圖爾蓀阿依·排祖拉,古麗米熱·艾尼瓦爾,等.拉普蘭松蘿(Usnea lapponica)線粒體基因組特征及其系統(tǒng)進化研究[J].基因組學(xué)與應(yīng)用生物學(xué),2022,42(1):73-83.
FANG J J,PAYZULLA T,ANWAR G,et al. Mitochondrial genome characteristics and phylogeny of Usnea lapponica[J].Genomics and Applied Biology,2022,42(1):73-83.
[9]陳寶玉.‘紅頰草莓線粒體基因組測序及序列分析[D].?? 南京:南京農(nóng)業(yè)大學(xué),2018.
CHEN B Y. Mitochondrial genome sequencing and sequence analysis of fragaria x ananassa ‘Benihoppe9[D].Nanjing:Nanjing Agricultural University,2018.
[10] 張 揚,孫曙光,李 晴,等.萵苣線粒體基因組密碼子使用偏好性分析[J].河南農(nóng)業(yè)科學(xué),2022,51(10):114-124.
ZHANG Y,SUN SH? G,LI Q,et al.Codon usage bias?? analysis of cultivated and wild lettuce mitochondrial?? genomes [J].Henan Agricultural Science,2022,51(10):114-124.
[11]張躍建,壽偉松,沈 佳.甜瓜(Cucumis melo L.)線粒體基因組標(biāo)記的開發(fā)及應(yīng)用[J].分子植物育種,2020,18(12):3980-3994.
ZHANG Y J,SHOU W S, SHEN J.Development and application of mitochondrial SSR markers in Cucumis melo L[J]. Molecular Plant Breeding, 2020,18(12):3980-3994.
[12]王久利,鄭 旭,鄧因子.暴馬丁香的葉綠體基因組特征分析[J].阜陽師范大學(xué)學(xué)報(自然科學(xué)版),2022,39(1):55-64.
WANG J L,ZHENG X,DENG Y Z.Characterization of chloroplast genome of Syringa reticulata subsp.amurensis[J].Journal of Fuyang Normal University(Natural Science Edition),2022,39(1):55-64.
[13]葉 楠.銀杏線粒體基因組研究[D]. 南京:南京林業(yè)大學(xué),2018.
YE N.Study on mitochondrial genome of Ginkgo biloba[D].Nanjing:Nanjing Forestry University,2018.
[14]JOS M,GUALBERTO,DARIA M,et al.The plant mitochondrial genome:dynamics and maintenance[J].Biochimie,2014,100:107-120.
Mitochondrial Genome Assembly and Sequence Characterization in Broccoli
TANG Zheng 1,ANG Haiyan 2,PEI Xuli 2 and JING Zange 2
(1.Wenzhou Vocational College of Science and Technology,Southern Zhejiang Key Laboratory of Crop Breeding,Wenzhou
Zhejiang 325006,China; 2.School of Agriculture and Life Science,Kunming University,Kunming 650214,China)
Abstract In order to better understand it at the molecular level,the mitochondrial genome of broccoli was assembled,and its sequence characteristics were also analyzed in this study. The mitochondrial genome was 219 964 bp,with a GC content of 45.25% in broccoli. 61 genes were annotated,including 33 protein-coding genes,23 tRNA genes,3 rRNA genes,and 2 pseudo genes. Among these genes,eight genes had high nucleotide diversity,while 24 genes had no nucleic acid diversity. The genes?? rrn26,? rrn18 and? atp1? had the most variants,with the number of variants being 326,277 and 136,respectively. The codon preference analysis showed that there were 29 codons with RSCU>1,most of them ending with A/U base,indicating that the codon usage tended towards more frequently ending in A/U base. A total of 345 repeats were detected in mitochondrial genome,including 170 forward repeats and 175 palindromic repeats. The mitochondrial genomes of broccoli and cauliflower exhibited excellent collinearity,and the sequence of genes was basically the same.The gene location was also consistent. A total of 22 homologous fragments were detected in the mitochondrial and chloroplast genome in broccoli. The total length of these homologous fragments was?? 13 355 bp,with an average of 607? bp.
Key words Broccoli;Mitochondrial genome; Assemble; Sequential analysis
Received? 2023-02-14??? Returned 2023-04-14
Foundation item Joint Basic Research Project for Universities in Yunnan Province(Part)(No.2018FH001-044); Youth Project of Basic Research Project of Yunnan Department of Science and Technology(No.2019-1-C-25318000002236); Natural Science Foundation of Zhejiang Province(No.LY18C150006); Subject of Major Science and Technology Special Project in Zhejiang Province Agriculture(Vegetable New Variety Breeding)(No.2021C02065-4-2);Wenzhou Science and Technology Project(No.2019ZX007-2).
First author TANG? Zheng,male,master,associate professor.Research area:molecular biology in vegetables. E-mail:wztangzheng@aliyun.com
Corresponding?? author JING? Zange,male,Ph.D,associate research fellow.Research area:molecular biology in vegetables.E-mail:jingzange@aliyun.com
(責(zé)任編輯:潘學(xué)燕 Responsible editor:PAN Xueyan)