申 欣, 田 美, 孟學(xué)平, 程漢良, 李士虎
(淮海工學(xué)院 海洋學(xué)院, 江蘇 連云港 222005)
與單個基因或者基因的片段相比, 線粒體基因組是一個完整的體系, 具有信息量豐富和系統(tǒng)發(fā)育樹結(jié)構(gòu)穩(wěn)定等優(yōu)點(diǎn), 在過去的十幾年間已被廣泛應(yīng)用于后生動物分子系統(tǒng)演化和種群遺傳的研究[1-2]。尾索動物隸屬于脊索動物門(Chordata)、尾索動物亞門(Tunicata或者Urochordata), 為海洋生境中所特有的生物類群, 廣泛棲息于世界各大海洋中, 從潮間帶至深海均有分布。由于尾索動物在后生動物進(jìn)化中處于特殊的關(guān)鍵位置, 其在免疫學(xué)、胚胎發(fā)育學(xué)、細(xì)胞學(xué)等各個學(xué)科領(lǐng)域?qū)ρ芯考棺祫游锏钠鹪磁c系統(tǒng)發(fā)育都有著不可取代的作用[3-4]。在GenBank線粒體基因組的數(shù)據(jù)庫中, 目前有12個尾索動物的線粒體基因組全序列。作者在12個尾索動物線粒體基因組研究的基礎(chǔ)上, 全面分析此類群線粒體基因組的基本特征、基因排列、蛋白質(zhì)編碼基因、選擇壓力、變異位點(diǎn)和分子系統(tǒng)發(fā)育等。
從GenBank線粒體基因組數(shù)據(jù)庫中檢索、下載得到12個尾索動物線粒體基因組全序列。分別是隸屬于海鞘綱(Ascidiacea)、內(nèi)性目(Enterogona)的燈泡簇海鞘(Clavelina lepadiformis)、群體海鞘(Diplosoma listerianum)、胃海鞘(Aplidium conicum)、黑色次口海鞘(Phallusia fumigata)、具疣次口海鞘(Phallusia mammilata)、玻璃海鞘(Ciona intestinalis)和薩氏海鞘(Ciona savignyi), 褶鰓目(Stolidobranchia)的真海鞘(Halocynthia roretzi)、莫馬斯赫海鞘(Herdmania momus)、小海鞘(Microcosmus sulcatus)和皺瘤海鞘(Styela plicata)以及樽海鞘綱(Thaliacea)的樽海鞘(Doliolum nationalis)[5-11]。
為了檢驗(yàn)選擇壓力對于尾索動物(以玻璃海鞘屬為代表)線粒體基因組的影響, 通過 Clustal X[12]對線粒體基因組蛋白質(zhì)編碼基因的核苷酸序列進(jìn)行多重序列比對。同義替換率(Ks)和非同義替換率(Ka)通過PAML[13]和DnaSP 4.10.7[14]進(jìn)行了估算。
分別以12個尾索動物、2個玻璃海鞘屬物種(玻璃海鞘和薩氏海鞘)和 2個次口海鞘屬物種(黑色次口海鞘和具疣次口海鞘)線粒體基因組作為數(shù)據(jù)群進(jìn)行了基因變異位點(diǎn)分析, 蛋白質(zhì)編碼基因和核糖體RNA基因的核苷酸序列通過Clustal X[12]進(jìn)行多重序列比對。然后通過DnaSP 4.10.7[14]分析了線粒體基因組主編碼基因變異位點(diǎn)特征。
線粒體基因組 12個蛋白質(zhì)編碼基因(由于部分物種atp8缺失, 所以將其排除在外)的氨基酸序列通過Clustal X[12]進(jìn)行多重序列比對。然后, 通過兩種方法(貝葉斯法和最大似然法)進(jìn)行系統(tǒng)發(fā)育重建,使用的軟件分別為MrBayes[15]和PHYML[16]。在貝葉斯分析中, 馬爾可夫鏈需要運(yùn)行1 000 000個世代(構(gòu)樹頻率=1000世代), 從而保證達(dá)到收斂, 并估算貝葉斯的先驗(yàn)概率(以 BPP表示)。在最大似然法中,通過自展法(Bootstrap=1000)評估節(jié)點(diǎn)的可靠性(以BPM表示)。
在脊椎動物線粒體基因組中,nad6基因和一系列轉(zhuǎn)運(yùn)RNA基因通常在負(fù)鏈上編碼。在頭索動物線粒體基因組中, 也存在與脊椎動物線粒體基因組類似的基因分布特征[17-18]。然而, 12個尾索動物線粒體基因組的所有基因均在同一鏈上編碼, 這與脊椎動物、頭索動物線粒體基因組的基因分布特征顯著不同。
尾索動物線粒體基因組長度介于13 648bp(群體海鞘)和 16 351bp(樽海鞘)之間。尾索動物線粒體基因組的基因組成與后生動物線粒體基因組標(biāo)準(zhǔn)的基因組成并不完全一致, 存在轉(zhuǎn)運(yùn)RNA基因數(shù)目的增加, 同時在燈泡簇海鞘、薩氏海鞘和真海鞘的線粒體基因組中缺乏atp8基因(表1)。線粒體基因組主編碼鏈的A+T含量差別很大, 最高的達(dá)到80.8%(群體海鞘), 最低的僅為52.9%(具疣次口海鞘)。尾索動物線粒體基因組的基本特征見表1。
表1 尾索動物線粒體基因組的基本特征Tab. 1 Basic features of tunicates mitochondrial genomes
在12個尾索動物線粒體基因組中, 發(fā)生了大規(guī)模的基因重排。即使排除容易發(fā)生易位的轉(zhuǎn)運(yùn)RNA基因, 它們的基因排列順序也顯著不同(圖 1)。在同屬物種的線粒體基因組中, 也存在主編碼基因的基因重排和基因缺失。在玻璃海鞘屬, 與玻璃海鞘線粒體基因組相比, 薩氏海鞘的nad1基因發(fā)生易位, 同時atp8基因發(fā)生了缺失(圖1)。在次口海鞘屬, 僅存在 2個保守的基因區(qū)塊: (1)cox2-cob和(2)nad2-nad4L-cox3, 而其他基因的排列順序均發(fā)生了改變(圖1)。
與尾索動物線粒體基因組相比, 在頭索動物線粒體基因組中, 基因排列順序較為保守[17-18]。盡管2個類群(尾索動物和頭索動物)均為脊椎動物的近親,但在線粒體基因組基因排列的特征上卻有如此顯著的差別, 說明在2個類群之間, 線粒體基因組的進(jìn)化機(jī)制和選擇壓力可能會存在明顯差異, 在今后應(yīng)該得到進(jìn)一步的關(guān)注和探究。
圖1 尾索動物線粒體主編碼基因的基因排列(不包含轉(zhuǎn)運(yùn)RNA基因)Fig. 1 Gene order of tunicates mitochondrial major coding genes (transfer RNA genes are excluded)
在 3個物種(燈泡簇海鞘、薩氏海鞘和真海鞘)的線粒體基因組中存在atp8基因的缺失, 其余的 9個物種均包含后生動物線粒體基因組標(biāo)準(zhǔn)的13個蛋白質(zhì)編碼基因。在樽海鞘線粒體基因組的蛋白質(zhì)編碼基因中, 最為常用的起始密碼子為“TTG”; 而在11個海鞘綱物種的線粒體蛋白質(zhì)編碼基因中,“ATG”出現(xiàn)的比例最高。除了這兩種起始密碼子外, 同時還存在“ATA”、“ATT”和“GTG”等3種起始密碼子。真海鞘線粒體基因組所有的蛋白質(zhì)編碼基因均以完全終止密碼子“TAA”或者“TAG”終止, 余下的 11個物種部分蛋白質(zhì)編碼基因中, 存在不完全的終止密碼子(“TA-”或者“T-”)(表2)。尾索動物線粒體基因組蛋白質(zhì)編碼基因所編碼的氨基酸數(shù)目并不保守。群體海鞘的cox2基因編碼313氨基酸, 比薩氏海鞘的cox2基因超出 92個氨基酸;而同時, 玻璃海鞘的nad2基因編碼 369個氨基酸,與群體海鞘的nad2基因相比, 多了83個氨基酸(表2)。
為了分析尾索動物線粒體基因組蛋白編碼基因的選擇壓力, 統(tǒng)計了玻璃海鞘和薩氏海鞘蛋白質(zhì)編碼基因的同義替換率(Ks)和非同義替換率(Ka)。2個玻璃海鞘線粒體基因組 12個蛋白質(zhì)編碼基因的Ka/Ks比值都低于1(介于0.0927和0.6752之間), 顯示出一定的負(fù)(純化)選擇(圖 2)。其中,nad6基因的Ka/Ks比值最高(0.6752), 其次是nad3和nad2基因(分別為 0.4321和 0.3916), 因此表明, 在 13個蛋白質(zhì)編碼基因中,nad6、nad3和nad2基因承受較小的選擇壓力和功能束縛。同時,cox1基因的Ka/Ks比值最低(0.0927), 其次是nad1和cob基因(分別為0.1353和 0.1484), 從而說明, 在尾索動物線粒體基因組中,cox1、nad1和cob基因承受較強(qiáng)的選擇壓力和功能束縛。
表2 尾索動物線粒體基因組蛋白質(zhì)編碼基因的氨基酸數(shù)量及起始、終止密碼子Tab. 2 Amino acids number, initiation and termination codons in protein-coding genes of tunicates mitochondrial genomes
圖2 玻璃海鞘線粒體基因組蛋白質(zhì)編碼基因的Ka/Ks分析Fig. 2 The ratio of Nonsynonymous and synonymous substitutions rates (Ka/Ks)was estimated in protein-coding genes of Ciona mitochondrial genomes
在種群遺傳學(xué)的研究中, 選擇合適的分子標(biāo)記至關(guān)重要。以12個尾索動物、2個玻璃海鞘屬物種(玻璃海鞘和薩氏海鞘)和 2個次口海鞘屬物種(黑色次口海鞘和具疣次口海鞘)線粒體基因組作為數(shù)據(jù)群,分別進(jìn)行了基因變異位點(diǎn)分析。在尾索動物線粒體基因組14個主編碼基因中,cox1基因最為保守, 變異位點(diǎn)的比例為61.57%。Cob、cox2-3、nad1和lrRNA等 5個基因變異位點(diǎn)的比例介于 70%~80%;atp6、nad3-5、srRNA和nad4L等6個基因變異位點(diǎn)的比例介于 80%~90%;nad2和nad6變異位點(diǎn)的比例超過90%(表3)。變異位點(diǎn)數(shù)最多的基因?yàn)閚ad5基因(1120個), 其次為nad4和cox1基因, 變異位點(diǎn)數(shù)分別達(dá)到1005和 931個。因此, 在尾索動物種群遺傳的研究中,nad5和nad4基因可以作為備選的分子標(biāo)記。
表3 尾索動物線粒體基因組蛋白質(zhì)編碼基因和核糖體RNA基因的變異位點(diǎn)分析Tab. 3 Analysis of different loci of protein-coding genes and ribosomal RNA gene in tunicates mitochondrial genomes
在玻璃海鞘屬線粒體基因組的主編碼基因中,cox1和cox2基因最為保守, 變異位點(diǎn)的比例分別為16.21%和18.85%; 變異位點(diǎn)數(shù)最多的基因?yàn)閚ad5基因(462個), 其次為nad4基因(331個)(表4)。與玻璃海鞘屬線粒體基因組類似, 在次口海鞘屬線粒體基因組主編碼基因中,cox2和cox1基因最為保守, 變異位點(diǎn)的比例分別為23.68%和23.97%; 變異位點(diǎn)數(shù)最多的基因?yàn)閚ad5基因(618個), 其次為nad4基因(527個)(表5)。因此, 在玻璃海鞘和次口海鞘種群遺傳的研究中,nad5和nad4仍然可以作為備選的分子標(biāo)記。
表4 玻璃海鞘屬線粒體基因組蛋白質(zhì)編碼基因和核糖體RNA基因的變異位點(diǎn)分析Tab. 4 Analysis of different loci of protein-coding genes and ribosomal RNA gene in Ciona mitochondrial genomes
表5 次口海鞘屬線粒體基因組蛋白質(zhì)編碼基因和核糖體RNA基因的變異位點(diǎn)分析Tab. 5 Analysis of different loci of protein-coding genes and ribosomal RNA gene in Phallusia mitochondrial genomes
綜上所述, 在尾索動物種群遺傳的研究中,nad5和nad4可以作為備選的分子標(biāo)記, 用于分析不同物種之間的遺傳多樣性, 為其生物多樣性的保護(hù)及合理利用其生物資源提供更多保障。
目前在國際上, 基于線粒體基因組數(shù)據(jù)分析尾索動物內(nèi)部的系統(tǒng)發(fā)育關(guān)系才剛剛興起[5,8], 對 12個尾索動物線粒體基因組進(jìn)行全面的系統(tǒng)發(fā)育分析尚未見報道。作者基于12個線粒體基因組蛋白質(zhì)編碼基因的氨基酸序列, 通過兩種方法(貝葉斯法和最大似然法)所構(gòu)建系統(tǒng)發(fā)育樹的拓?fù)浣Y(jié)構(gòu)完全一致(圖 3)。從系統(tǒng)發(fā)育樹的結(jié)果可以看出, 尾索動物分為兩個分支: 海鞘綱和樽海鞘綱(BPP=100,BPM=100)。在海鞘綱內(nèi)部, 小海鞘、皺瘤海鞘、真海鞘和莫馬斯赫海鞘聚為一支, 從而支持褶鰓目為單系群(BPP=100, BPM=100)。具疣次口海鞘和黑色次口海鞘單獨(dú)聚為一支(BPP=100, BPM=100), 從而導(dǎo)致內(nèi)性目并非單系群。線粒體基因組的數(shù)據(jù)支持尾索動物在科級的親緣關(guān)系為: (((柄海鞘科+芋海鞘科)+(((三段海鞘科+星骨海鞘科)+簇海鞘科)+玻璃海鞘科))+長紋海鞘科)+海樽科(圖3)。
圖3 基于線粒體基因組蛋白質(zhì)編碼基因的氨基酸序列構(gòu)建的系統(tǒng)發(fā)育樹Fig. 3 Phylogenetic tree based on aligned amino acids sequences from mitochondrial protein coding genes
作者在12個尾索動物線粒體基因組全序列的基礎(chǔ)上, 全面分析尾索動物線粒體基因組的基本特征、基因排列、蛋白質(zhì)編碼基因、選擇壓力、變異位點(diǎn)和分子系統(tǒng)發(fā)育等。12個尾索動物線粒體基因組的所有基因均在同一鏈上編碼, 這與脊椎動物、頭索動物線粒體基因組的基因分布特征顯著不同。尾索動物線粒體基因組的基因組成與后生動物線粒體基因組標(biāo)準(zhǔn)的基因組成并不完全一致, 存在轉(zhuǎn)運(yùn)RNA基因數(shù)目的增加, 同時在燈泡簇海鞘、薩氏海鞘和真海鞘的線粒體基因組中缺乏atp8基因。在12個尾索動物線粒體基因組中, 發(fā)生了大規(guī)模的基因重排, 即使在同屬物種的線粒體基因組中, 也存在主編碼基因的基因重排和基因缺失。尾索動物線粒體基因組蛋白質(zhì)編碼基因使用的起始密碼子、終止密碼子及氨基酸長度存在差異。2個玻璃海鞘線粒體基因組12個蛋白質(zhì)編碼基因的Ka/Ks比值都低于 1(介于0.0927和0.6752之間), 顯示出一定的負(fù)選擇。在尾索動物群體遺傳的研究中,nad5和nad4可以作為備選的分子標(biāo)記, 用于分析不同物種和種群之間的生物多樣性?;诰€粒體基因組蛋白質(zhì)編碼基因的氨基酸序列, 支持將尾索動物分為兩個分支: 海鞘綱和樽海鞘綱。尾索動物在科級的親緣關(guān)系為: (((柄海鞘科+芋海鞘科)+(((三段海鞘科+星骨海鞘科)+簇海鞘科)+玻璃海鞘科))+長紋海鞘科)+海樽科。
[1]Shen X, Ma X, Ren J, et al. A close phylogenetic relationship between Sipuncula and Annelida evidenced from the complete mitochondrial genome sequence ofPhascolosoma esculenta[J]. BMC Genomics, 2009, 10:136.
[2]Shen X, Ren J F, Cui Z X, et al. The complete mitochondrial genomes of two common shrimps (Litopenaeus vannameiandFenneropenaeus chinensis)and their phylogenomic considerations[J]. Gene, 2007,403(1-2): 98-109.
[3]Dehal P, Satou Y, Campbell R K, et al. The draft genome ofCiona intestinalis: insights into chordate and vertebrate origins[J]. Science, 2002, 298(5601): 2157-2167.
[4]Delsuc F, Brinkmann H, Chourrout D, et al. Tunicates and not cephalochordates are the closest living relatives of vertebrates[J]. Nature, 2006, 439(7079): 965-968.
[5]Singh T R, Tsagkogeorga G, Delsuc F, et al. Tunicate mitogenomics and phylogenetics: peculiarities of theHerdmania momusmitochondrial genome and support for the new chordate phylogeny[J]. BMC Genomics,2009, 10: 534.
[6]Gissi C, Pesole G, Mastrototaro F,et al. Hypervariability of ascidian mitochondrial gene order: exposing the myth of deuterostome organelle genome stability[J].Molecular Biology and Evolution, 2010, 27(2):211-215.
[7]Iannelli F, Griggio F, Pesole G, et al. The mitochondrial genome ofPhallusia mammillataandPhallusia fumigata(Tunicata, Ascidiacea): high genome plasticity at intra-genus level[J]. BMC Evolutionary Biology, 2007,7:155.
[8]Yokobori S, Oshima T, Wada H. Complete nucleotide sequence of the mitochondrial genome ofDoliolum nationaliswith implications for evolution of urochordates[J]. Molecular Phylogenetics and Evolution, 2005,34(2): 273-283.
[9]Gissi C, Iannelli F, Pesole G. Complete mtDNA ofCiona intestinalisreveals extensive gene rearrangement and the presence of an atp8 and an extra trnM gene in ascidians[J]. Journal of Molecular Evolution, 2004,58(4): 376-389.
[10]Yokobori S, Watanabe Y, Oshima T. Mitochondrial genome ofCiona savignyi(Urochordata, Ascidiacea,Enterogona): comparison of gene arrangement and tRNA genes with Halocynthia roretzi mitochondrial genome[J]. Journal of Molecular Evolution, 2003,57(5): 574-587.
[11]Yokobori S, Ueda T, Feldmaier-Fuchs G, et al. Complete DNA sequence of the mitochondrial genome of the ascidianHalocynthia roretzi(Chordata, Urochordata)[J]. Genetics 1999, 153(4): 1851-1862.
[12]Thompson J D, Gibson T J, Plewniak F. The CLUSTAL_X windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools[J]. Nucleic Acids Res, 1997, 25(24): 4876-4882.
[13]Yang Z. PAML 4: phylogenetic analysis by maximum likelihood[J]. Mol Biol Evol, 2007, 24(8): 1586-1591.
[14]Rozas J, Sanchez-DelBarrio J C, Messeguer X, et al.DnaSP, DNA polymorphism analyses by the coalescent and other methods[J]. Bioinformatics,2003,19(18):2496-2497.
[15]Ronquist F, Huelsenbeck J P. MrBayes 3: Bayesian phylogenetic inference under mixed models[J]. Bioinformatics, 2003, 19(12): 1572-1574.
[16]Guindon S, Gascuel O. A simple, fast and accurate algorithm to estimate large phylogenies by maximum likelihood[J]. Syst Biol, 2003, 52(5): 696-704.
[17]Nohara M, Nishida M, Miya M. Evolution of the mito-chondrial genome in cephalochordata as inferred from complete nucleotide sequences from two epigonichthys species[J]. Journal of Molecular Evolution, 2005, 60(4):526-537.
[18]Kon T, Nohara M, Yamanoue Y, et al. Phylogenetic position of a whale-fall lancelet (Cephalochordata)inferred from whole mitochondrial genome sequences[J].BMC Evolutionary Biology, 2007, 7: 127.