韓耀全 黃勵 朱瓊?cè)A 吳偉軍 何安尤 施軍 李育森
摘要:[目的]研究暗色唇鯪(Semilabeo obsodrus)的分子遺傳學特性,為暗色唇鯪種質(zhì)資源遺傳多樣性分析和分子標記研究提供基礎數(shù)據(jù)。[方法]利用高通量第二代測序技術,構(gòu)建暗色唇鯪線粒體基因組全序列,分析序列的結(jié)構(gòu)特征。[結(jié)果]暗色唇鯪的線粒體基因組全序列長度16598~16599bp,GC含量42.65%~42.7%,共含有13個蛋白編碼基因、22個tRNA、2個rRNA(12s-rRNA和16S-rRNA)以及1個控制區(qū)。線粒體基因組除ND6外,GC-skew值均為負值,COXI、ND3以及ND6的AT-skew值為負值,其余基因的AT-skew值均為正值。暗色唇鯪的13個蛋白編碼基因氨基酸總長為3794aa,偏好密碼子(RSCU>2)分別是終止密碼子Arg(CGA)、Gly(GGA)、Leu(CTA)、Pro(CCA)、Ser(TCA)以及終止密碼子Stp(TAA)。暗色唇鯪(唇鯪屬Semilabeo)與泉水魚PJeudogyrinocheilusprochilus的親緣關系最近,和卷口魚Ptychidiojordani、直口鯪Rectorisposehensis、異華鯪Parasinilabeoassimilis存在較高的親緣關系。[結(jié)論]暗色唇鯪的線粒體基因組結(jié)構(gòu)和基因排列順序與魚類基因組典型結(jié)構(gòu)和排列一致。
關鍵詞:暗色唇鯪;線粒體基因組;結(jié)構(gòu)特征;系統(tǒng)發(fā)育
中圖分類號:Q 173;Q959.46+8文獻標志碼:A 文章編號:1008-0384(1020)02-0130-10
0 引言
(研究意義)暗色唇鯪(Semilabeo o℃ums Lin,1981)系鯉形目Cypriniformes鯉科Cyprinidea野鯪亞科Labeoninae唇鯪屬Semilabeo Peters魚類,地方名豬嘴魚、假沒六魚、馬鼻勾等。僅分布于珠江水域及紅河水域干支流,包括我國廣西、貴州、云南及越南部分地區(qū),是優(yōu)質(zhì)、上等經(jīng)濟魚類,已被列為《中國瀕危動物紅皮書》易危和《世界自然保護聯(lián)盟(IUCN)》瀕危物種,受威脅程度較高。隨著保護生物多樣性意識的提高,珍稀唇鯪屬魚類的資源保護和增殖研究工作受到重視。近年來,線粒體基因組研究技術日趨成熟,其結(jié)構(gòu)簡單、編碼區(qū)域高度保守、重組率低、拷貝數(shù)高等特征使其逐漸成為研究魚類群體遺傳結(jié)構(gòu)、系統(tǒng)進化關系和開展魚類分子標記的首選載體。通過研究暗色唇鯪的線粒體基因組序列結(jié)構(gòu)特征,可為暗色唇鯪種質(zhì)資源多樣性分析和分子標記研究提供基礎數(shù)據(jù)。(前人研究進展)唇鯪在馴養(yǎng)繁殖等方面已取得了豐富的研究成果,暗色唇鯪在馴養(yǎng)繁殖方面的研究工作也相繼開展并取得少量成果,但研究報告僅見關于暗色唇魚精子冷凍保存研究及表型形態(tài)分析,或僅為相關魚類志的收錄介紹,或僅是對暗色唇鯪瀕危程度的分析、水域漁業(yè)資源調(diào)查的捕獲記錄等。線粒體基因組作為研究DNA復制和轉(zhuǎn)錄的良好模型,在遺傳和進化領域分子標記具有較高應用價值,近年來被廣泛應用于生物學的許多領域。司從利等對暗色唇鯪親緣關系較近的泉水魚Pseudogyrinocheilus prochilus開展了線粒體方面的相關研究。(本研究切入點)關于暗色唇鯪分子遺傳學的研究成果較少,目前未見其線粒體基因組特征相關研究。(擬解決的關鍵問題)本研究利用高通量第二代測序技術進行測序,組裝與注釋暗色唇鯪線粒體基因組序列,構(gòu)建系統(tǒng)發(fā)育進化樹,并分析其序列結(jié)構(gòu)特征及相關參數(shù)。
1 材料與方法
1.1 試驗材料
根據(jù)暗色唇鯪的分類鑒定依據(jù),分別隨機選取在云南省曲靖市紅水河上游支流(YN)、貴州省黔西南州紅水河上游支流(GZ)、廣西壯族自治區(qū)河池市柳江上游支流(GX)采集獲得的鮮活暗色唇鯪中各1例,測量表型性狀及相關數(shù)據(jù)后,采集尾鰭并用去離子水沖洗,置于無水乙醇中-20℃冰柜保存?zhèn)錅y。
1.2全基因組DNA提取
3例暗色唇鯪全基因組DNA的提取依據(jù)北京康為世紀生物科技有限公司的海洋動物基因組DNA提取試劑盒(CW2089)說明流程進行。提取后的DNA采用l%瓊脂凝膠電泳檢測基因組DNA的純度和完整性,Qubit.0Flurometer(Life Technologies,CA,USA)檢測樣品濃度。
1.3 全基因組二代測序
檢測合格的DNA樣品分別采用Covaris超聲波破碎儀隨機分割成長度為350bp左右的片段,構(gòu)建小片段基因組DNA測序文庫,文庫構(gòu)建流程參照NEB Next Ultra DNA Library Prep Kit for Illumina(NEB,USA)文庫構(gòu)建試劑盒說明書進行。文庫構(gòu)建完成后以qPCR方法和Agilent 2100Bioanalyzer進行質(zhì)控。對質(zhì)檢合格的DNA文庫采用Illumina Hiseq4000高通量測序平臺進行測序,測序策略為PEl50(Pair-End 150),每例樣品測序數(shù)據(jù)量不少于2Gb.
1.4 線粒體基因組的組裝與注釋
1.4.1線粒體基因組組裝 Illumina HiSeq 4000測序平臺所得原始下機序列,稱之為Raw reads,通過去低質(zhì)量序列、去接頭污染等過程完成數(shù)據(jù)處理得到高質(zhì)量的序列,稱之為Clean reads.去低質(zhì)量序列的判斷原則:當任一測序read中N含量超過該read堿基數(shù)的10%時,去除此Paired reads;當任一測序read中含有的低質(zhì)量(Q≤5)堿基數(shù)超過該條read堿基數(shù)的50%時,去除此Paired reads.后續(xù)所有分析都是基于Clean reads進行。根據(jù)序列的overlap關系和插入片段的大小關系,采用SPAdes v.3.5.0軟件(http://cab.spbuxu/software/spades/)對高通量測序的短片段序列(Clean reads)進行拼接組裝,最終得到完整的暗色唇鯪線粒體基因組序列。序列結(jié)果SQN文件已上傳至NCBI數(shù)據(jù)庫,YN、GZ及GX暗色唇鯪的GeneBank登錄號分別為:MN229747、MN229748、MN229749.
1.4.2線粒體基因組注釋利用DOGMA (http://dogma.ccbb.utexas.edu/)和ORF Finder(https://www.ncbi.nlm.nih.gov/orffmder/)對線粒體基因組進行注釋。對注釋的初步結(jié)果,運用Blastn和Blastp(https://blast.ncbi.nlm.nih.gov/Blast.cgi)的方法與已報道的近緣物種線粒體基因組編碼蛋白和rRNA進行比對,驗證結(jié)果的準確性并進行修正。tRNA的注釋采用tRNAsean-SE2.0(http://lowelab.ucsc.edu/tRNAscan-SE/)和ARWEN(Versionl.2http://mbio-serv2.mbioekol.lu.se/ARWEN/)進行,舍去長度不合理和結(jié)構(gòu)不完整的tRNA,并生成tRNA二級結(jié)構(gòu)圖。GC偏移率(GC-skew)和AT偏移率(AT-skew)分別采用如下公式計算:GC-skew=(G-C)/(G+C),AT-skew=(A-T)/(A+T)。相對同義密碼子使用度(RSCU:Relative synonymous codonusage)計算參照Sharp PM等的公式進行分析。
1.5系統(tǒng)進化樹構(gòu)建
目前已公開發(fā)布的野鯪亞科(Labeoninae)魚類約有26個屬近300個種。研究以NCBI(https://www.nebi.nlm.nih.gov/)上已發(fā)布完整線粒體基因組的野鯪亞科的10個屬18個種進行系統(tǒng)進化樹構(gòu)建。選擇編碼基因的核酸序列和蛋白序列分別采用MUSCLEv.3.8.31(http://www.drive5.com/muscle/)軟件進行多物種間單個基因的多序列比對。采用jModelTest2.1.7(https://code.google.com/p/jmodeltest2/)軟件對所選序列DNA進行核酸模型測試,AIC最小值為最佳模型。采用RAxML8.1.5(https://sco.h-its.org/exelixis/web/software/raxml/index.html)軟件,最大似然法(Maximum Likelihood method,ML法)構(gòu)建系統(tǒng)發(fā)育樹,Bootstrap值設置為1000.
2 結(jié)果與分析
2.1 線粒體基因組的組成及其特征
3例暗色唇鯪線粒體全基因組高通量測序,最終組裝得到的線粒體基因組全序列長度,以及G堿基與C堿基占總堿基數(shù)的比例分別為:16598bp和42.7%(YN)、16598bp和42.66%(GZ)、16599bp和42.65%(GX),均含有13個蛋白編碼基因,22個tRNA,2個rRNA(12S-rRNA和16S-rRNA)以及1個控制區(qū)。3例物種的線粒體基因組除ND6外,GC-skew值都為負值,COXI、ND3以及ND6的AT-skew為負,其余基因的AT-skew值均為正值(表1-4)。暗色唇鯪22個tRNA長度66~76bp不等,除tRNA-Ser(GCT)外,其他21個tRNA都具有典型的三葉草結(jié)構(gòu),其線粒體基因組結(jié)構(gòu)和基因排列順序與大部分的魚類基因組典型結(jié)構(gòu)和排列一致(圖1)。
2.2密碼子使用頻率(RSCU)
不同生物乃至同一物種不同基因間其同義密碼子的使用頻率存在差異,具有一定的偏愛性,暗色唇鯪線粒體密碼子的使用同樣具有偏好性(CodonUsage Bias)。暗色唇鯪13個蛋白編碼基因氨基酸總長為3794aa,偏好密碼子(RSCU>2)分別是終止密碼子Arg(CGA)、Glv(GGA)、Leu(CTA)、Pro(CCA)、Ser(TCA)以及終止密碼子Sip(TAA)。暗色唇鯪的偏好密碼子使用情況見表5和圖2.
2.3系統(tǒng)進化分析
該研究系統(tǒng)發(fā)育樹的構(gòu)建核苷酸采用的最優(yōu)模型是GTR+I+g.進化樹結(jié)果顯示目標物種暗色唇鯪與NCBI已公布的暗色唇鯪Semilabeo ObSCHrHS(NC037408)以及泉水魚Pseudogyrinocheilusprochilus(NC024588)聚為一支(圖3)。物種進化樹分析結(jié)果顯示暗色唇鯪(唇鯪屬Semilabeo)與泉水魚Pseudogyrino-cheilusprochilus的親緣關系最近,和卷口魚Ptychidiojordani、直口鯪Rectorisposehensis、異華鯪Parasinilabeoassimilis的親緣關系較近。該結(jié)論與相關魚類志對暗色唇鯪所屬的分類結(jié)果相吻合。
3 討論
3.1 暗色唇鯪的線粒體基因組特征
對暗色唇鯪的線粒體基因組的測序分析顯示,3例物種線粒體相似性在99.67%~99.78%,基因組十分保守,在全基因組范圍內(nèi)序列高度相似,這與其他魚類線粒體基因組的保守性研究結(jié)果一致。3例暗色唇鯪蛋白序列、tRNA長度、rRNA長度以及control region區(qū)長度均一致。13個蛋白編碼基因同大多數(shù)硬骨魚類一樣含有ATG和GTG兩種起始密碼子,COXl基因使用GTG作為起始密碼子,而其他12個基因的起始密碼子均為ATg.3例暗色唇鯪的終止密碼子也是2種,分別為TAA和TAG,其中ND2、ND3、ND6采用TAG為終止密碼子,NDl、COXI、ATP8、ATP6、COXIII、ND4L以及ND5這6個基因采用TAA為終止密碼子,其余3個基因(COXII,ND4和Cytb)使用不完整的T作為終止密碼子,這類含有不完整終止密碼子的基因?qū)⒃谵D(zhuǎn)錄后加工的過程中加入polyA,從而構(gòu)成完整的“TAA”終止密碼子,線粒體基因組結(jié)構(gòu)和基因排列順序與大部分典型的脊椎動物魚類一致。
3.2 不同地域暗色唇鯪的線粒體基因組差異探析
由于線粒體具有高度保守性,COXI、CYTB等基因常用作分子標記用于魚類物種的鑒定,線粒體基因組序列除了用于物種鑒定外,在種質(zhì)資源多樣性分析方面也應用廣泛,該研究測序分析的3個樣品分別來自相距甚遠的3個省區(qū)不同水域,經(jīng)線粒體全基因組差異比較分析,云南水域和貴州水域樣品之間有51個SNP差異,不存在插入和缺失突變,序列相似性99.69%。云南水域和廣西水域樣品之間存在54個SNP和1個堿基插入缺失,序列相似性99.67%。貴州水域和廣西水域樣品之間存在37個SNP和1個堿基插入缺失,序列相似性99.78%。該研究3例暗色唇鯪的所有編碼基因都存在一定的個體差異,推測暗色唇鯪在不同地理間具有一定的差異性,這些可作為暗色唇鯪種質(zhì)資源多樣性分析的重要分子標記。由于該研究樣品稀有,測試案例有限,后續(xù)有待對更多不同地理位置的物種進行測序,以期得到更加豐富和科學可靠的分子標記。