毛明光 顧 杰 劉瑞婷 陳 雨 吳玲梅 姜志強 蔣潔蘭
(1. 大連海洋大學農(nóng)業(yè)農(nóng)村部北方海水增養(yǎng)殖重點實驗室, 大連 116023; 2. 中國科學院水生生物研究所, 武漢 430072)
太平洋鱈(Gadus macrocephalus)又稱大頭鱈,隸屬于鱈形目(Gadiformes)、鱈科(Gadidae)、鱈屬(Gadus), 屬冷水性底層魚類, 是重要的海洋經(jīng)濟魚類[1—3]。近年來, 由于過度捕撈及環(huán)境污染等問題,黃渤海域的太平洋鱈產(chǎn)量顯著下降, 美國、加拿大等國也對太平洋鱈的捕撈量開始了嚴格的限制[4,5]。
目前, 對太平洋鱈的研究主要集中在人工繁殖和免疫學[6—10]。此外, 尹偉力等[11]設(shè)計了鱈物種特異性PCR鑒定方法以區(qū)分包括太平洋鱈在內(nèi)的鱈制品與其他魚類制品。1987年, Grant等[12]的研究顯示, 日本海和黃渤海不同海域的太平洋鱈在某些基因位點存在明顯差異, 推測太平洋鱈雖然屬于洄游性魚類, 但這種洄游是一種短距離洄游, 造成了較小范圍內(nèi)的地理隔離。由于樣品數(shù)量較少,Grant等[12]無法明確劃分地理隔離的界限。另一方面, 太平洋鱈溯源以及與其他鱈科魚類的進化關(guān)系仍是值得探討的問題之一。脊椎動物線粒體DNA因具有自主復制、結(jié)構(gòu)緊密、編碼效率高、無重組現(xiàn)象、無組織特異性、進化速率快以及遵循嚴格的母系遺傳等特點, 被廣泛地應用于系統(tǒng)發(fā)育、物種分類和群體遺傳進化等領(lǐng)域中[13]。本研究通過第二代測序技術(shù)獲得太平洋鱈線粒體全基因組序列, 并對該線粒體全基因組序列進行分析, 為進一步研究鱈系統(tǒng)進化關(guān)系、鱈魚種屬間分類提供依據(jù), 并且為系統(tǒng)研究因地理隔離而引發(fā)太平洋鱈線粒體變異等問題提供重要數(shù)據(jù)支持。
本實驗所用的太平洋鱈捕自大連旅順海域。解剖并采集太平洋鱈肌肉、肝臟組織后用去離子水沖洗, 液氮速凍, 轉(zhuǎn)移至-80℃冰箱冷凍保存。
組織DNA提取按照北京艾德萊生物科技有限公司DNA快速提取試劑盒說明進行。采用NV 3000微量分光光度計檢測DNA濃度, 1%瓊脂糖凝膠電泳檢測DNA的質(zhì)量和完整性。
首先根據(jù)近緣物種序列設(shè)計簡并引物(表 1),使用LATaqpolymerase進行PCR擴增。PCR程序為: 94℃ 30s, 50℃退火30s, 72℃延伸1min/kb。直接用PCR產(chǎn)物在ABI 3730全自動測序儀中測序, 使用DNAstar軟件對測序結(jié)果進行拼接組裝, 并人工分析調(diào)整, 最終補全序列。將太平洋鱈線粒體全基因序列上傳至NCBI數(shù)據(jù)庫, 獲得GenBank序列號為KY296294。
使用GENEIOUS R8軟件進行線粒體基因組注釋。利用軟件MITOS Web Server (http://mitos.bioinf.uni-leipzig.de/index.py)[14]進行轉(zhuǎn)運RNA(tRNA)及核糖體RNA(rRNA)注釋, 基于已有的鱈科魚類線粒體基因組進行比對, 對蛋白質(zhì)編碼基因(Protein coding genes, PCGs)以及D-Loop區(qū)進行注釋。利用MEGA 7.0軟件進行線粒體DNA序列的堿基組成特征、密碼子使用情況以及堿基偏移度分析。
表 1 太平洋鱈線粒體基因組全序列擴增使用的引物序列Tab. 1 Sequences of primers used in amplification of the complete mitochondrial genome in G. macrocephalus
使用在線tRNAscan-SE軟件對太平洋鱈線粒體tRNA基因進行定位, 并使用The mfold Web Server(http://unafold.rna.albany.edu)在線軟件對線粒體tRNA的二級結(jié)構(gòu)進行預測。
為了分析鱈科魚類的系統(tǒng)發(fā)育關(guān)系, 從Gen-Bank中下載相關(guān)的線粒體全序列或部分序列, 以斑馬魚(Danio rerio, NC002333)和紅鰭東方鲀(Takifugu rubripes, NC004299)等線粒體基因組全序列為外群, 使用MEGA 7.0軟件構(gòu)建進化樹, 分別構(gòu)建11種鱈科魚類線粒體基因組全序列和Cytb基因序列系統(tǒng)進化樹。本研究所使用的基因組具體信息見表 2。
本研究采用第二代基因測序技術(shù), 獲得太平洋鱈線粒體全基因組序列, 其長度為16569 bp。與大多數(shù)脊椎動物線粒體組成相似, 太平洋鱈線粒體全基因組序列包含了13個PCGs、22個tRNA基因、2個rRNA基因和1個D-Loop (圖 1)。PCGs、rRNA基因、tRNA基因和D-Loop區(qū)分別占整個線粒體長度的69.26%、15.79%、9.30%和5.26%。太平洋鱈線粒體包括D-Loop區(qū)在內(nèi)的各基因大小、位點、排列順序與大多數(shù)脊椎動物相同, 但D-Loop區(qū)序列長度有較大差異, 同源性相對較低。除tRNA-Gln、tRNA-Trp、tRNA-Ala、tRNA-Asn、tRNA-Cys、tRNA-Ser、tRNA-Glu和tRNA-Pro以及NAD6基因在H-鏈編碼外其余基因及tRNA均在L-鏈編碼(表 3)。
太平洋鱈線粒體全基因組的A+T含量達到57.3%, 明顯高于C+G的含量, 呈現(xiàn)AT偏向性, 并且本文所選物種均有不同程度的AT偏向(表 4)。太平洋鱈線粒體全基因組堿基含量由高到低依次為:T(29.4%)>A(27.9%)>C(25.9%)>G(16.9%), A+T-skew%堿基組成和G+C-skew% 堿基組成分別為-0.026和-0.211。另外, 本文中所選鱈科魚類除藍鱈和生活在淡水中的江鱈外, 其余種類線粒體基因組堿基組成均顯示出較弱的AT負偏斜現(xiàn)象(A+T-skew%<0), 而外群中除大菱鲆外均顯示AT正偏斜現(xiàn)象。文中各鱈科魚類線粒體基因組中胸腺嘧啶(T)含量最高的要屬黑線鱈(30.6%), 而最低的為藍鱈(27.1%)(表 4)。
太平洋鱈線粒體基因組13個蛋白質(zhì)編碼基因中的12個基因(NAD1、NAD2、COX1、COX2、ATP8、ATP6、COX3、NAD3、NAD4L、NAD4、NAD5和Cytb)在L鏈上編碼蛋白, 僅NAD6在H鏈上編碼。編碼基因擁有2種典型的起始密碼子(GTG和ATG), 除COX1基因使用GTG作為起始密碼子, 其余所有蛋白質(zhì)編碼基因均采用ATG作為起始密碼子。終止密碼子的使用情況則有較大的變化。太平洋鱈線粒體有5種終止密碼子(TAG、AGA、TAA、AGG、T--)(表 3), 其中TAG為NAD1、NAD2、COX1和NAD3基因的終止密碼子; AGA為COX2、NAD4基因的終止密碼子; TAA為ATP8、ATP6、COX3、NAD4L和NAD5基因的終止密碼子;AGG為NAD6基因的終止密碼子; Cytb基因則使用不完全的T作為終止密碼子。其中AGG與AGA在哺乳動物線粒體中作為終止密碼子使用更為常見。
表 2 線粒體系統(tǒng)發(fā)育分析所用基因組Tab. 2 The complete mitochondrial genomes used in phylogenetic analysis
13個蛋白編碼基因序列總長度為11444 bp, 除了終止密碼子外共有3815個密碼子。使用MEGA 7.0軟件分析密碼子平均使用頻率和相對同義密碼子平均使用頻率(表 5)。太平洋鱈線粒體基因組13個蛋白質(zhì)編碼基因中存在32個偏好密碼子(RSCU密碼子), 其中第三位點為A或T(U)的密碼子普遍具有較高的使用頻率。除了CAU(H)、CGU(R)、AGU(S)、GGU(G)和CCA(P)、AGA(*)密碼子之外, 密碼子第三位堿基為A或T的密碼子RSCU均大于1, 密碼子第三位點對A、T的偏好性與蛋白質(zhì)編碼基因密碼子的第三位點對A、T偏向性相一致。
圖 1 太平洋鱈線粒體基因組結(jié)構(gòu)Fig. 1 Schematic Map of the mitochondrial genome of G. macrocephalus
對太平洋鱈線粒體22個tRNA基因的定位以及二級結(jié)構(gòu)進行預測分析, 結(jié)果表明22個tRNA基因分布于13個蛋白質(zhì)編碼基因之間, 大小從67到74 bp不等, 總長度為1540 bp(表 3)。通過比對發(fā)現(xiàn), 太平洋鱈相鄰tRNA基因之間存在相互折疊的現(xiàn)象, 如tRNA-Ile和tRNA-Gln、tRNA-Gln和tRNA-Met、tRNA-Thr和tRNA-Pro之間, 相互折疊的核苷酸數(shù)目不定, 1—2個較為多見, 最長可達74 bp。22個tRNA中13個由L-鏈編碼, 其他9個則由H-鏈編碼(表 3)。所有的tRNA基因序列的A+T堿基含量低于控制區(qū), 高于蛋白質(zhì)編碼區(qū)和rRNA區(qū)。tRNA二級結(jié)構(gòu)預測結(jié)果顯示, tRNA-Phe、tRNA-Val、tRNALeu等21個tRNA基因均形成典型的三葉草結(jié)構(gòu), 而tRNA-Ser(GCT)基因缺失二氫尿嘧啶臂(DHU臂) (圖2)。
表 3 太平洋鱈線粒體基因注釋結(jié)果Tab. 3 The result of the complete mitochondrial genome annotation for G. macrocephalus
線粒體基因組中的非編碼區(qū)是不參與編碼基因, 而是調(diào)節(jié)線粒體DNA復制和轉(zhuǎn)錄的片段, 主要分布于L-鏈復制起始區(qū)和各個tRNA基因之間, 其中位于tRNA和tRNA之間的稱為D-Loop區(qū)。根據(jù)結(jié)構(gòu)組成和分布位置的不同, 非編碼區(qū)可分為基因間隔序列區(qū)和基因序列重疊區(qū)。在太平洋鱈線粒體中共尋找到11處重疊區(qū), 序列總長度達43 bp, 最大重疊堿基數(shù)為10 bp, 位于ATP6基因和ATP8基因之間, 最小重疊堿基數(shù)為1 bp。非編碼區(qū)有12個基因間隔序列, 長度在1—74 bp不等, 其中最長的間隔位于tRNA-Thr基因和tRNA-Pro基因之間, 長達74 bp。在tRNA-Asn基因和tRNA-Cys基因之間尋找到能夠啟動L-鏈復制的序列(OL), 該序列由14 bp的莖和13 bp的環(huán)組成, 并且在5′端有一段短的序列5′-GCCGG-3′(圖 3)。
表 4 太平洋鱈及其他物種線粒體基因組堿基組成比較Tab. 4 Comparison of base composition in mitochondrial genome between G. macrocephalus and other species
表 5 太平洋鱈13個編碼蛋白編碼基因密碼子使用頻率Tab. 5 Total codon average usage in the thirteen protein-coding genes for G. macrocephalus
圖 2 太平洋鱈tRNA-Ser(GCT)二級結(jié)構(gòu)預測圖Fig. 2 The second structures of the tRNA-Ser(GCT) genes in G.macrocephalus mitogenome
富含A+T的控制區(qū)在調(diào)控線粒體DNA的復制和轉(zhuǎn)錄中起到重要的作用。本研究中太平洋鱈控制區(qū)顯示出相對不穩(wěn)定性, 與哺乳動物相比只能鑒定到一個與CSB-2相對應的保守序列CSB(圖 4)。在太平洋鱈D-Loop區(qū)發(fā)現(xiàn)與終止結(jié)合序列區(qū)(Terminal associated sequences, TAS)共有序列相似的序列且包含保守的5個核苷酸5′-TACAT-3′, 該序列可以形成發(fā)夾結(jié)構(gòu), 是D環(huán)DNA終止的候選位點。另外太平洋鱈D環(huán)含有一個17 bp的嘧啶序列。
以斑馬魚和紅鰭東方鲀等幾種常見經(jīng)濟魚類作為外群, 采用最大似然法(Maximum Likelihood,ML), 構(gòu)建幾種鱈科魚類的系統(tǒng)進化樹(圖 5)。藍鱈、北鱈、杜氏銀大眼鱈、江鱈與斜帶石斑魚、斑馬魚、大菱鲆等經(jīng)濟魚種聚為一大支, 而紅鰭東方鲀與其他海水性鱈魚聚為一大支。傳統(tǒng)觀點所認為的3種真鱈(太平洋鱈、格陵蘭鱈、大西洋鱈)并沒有匯聚成一個分支, 北極鱈與太平洋鱈和大西洋鱈兩種真鱈匯成一支, 而格陵蘭鱈則與阿拉斯加狹鱈以及挪威狹鱈匯成一個大支。另外江鱈雖然作為鱈科魚類, 但進化分析結(jié)果顯示, 江鱈、藍鱈和杜氏銀大眼鱈3種鱈科魚類與其他鱈科魚類進化關(guān)系相對疏遠。
Cytb基因因為存在于所有魚類線粒體中, 且進化速度適中, 在一定的進化尺度內(nèi)不會受到飽和效應的影響, 常被作為分析物種種間和屬間差異的依據(jù)[15]。以Cytb基因采用鄰接法構(gòu)建的進化樹則更符合傳統(tǒng)分類學的觀點(圖 6)。在淡水環(huán)境中生活的江鱈與其他鱈科魚類進化關(guān)系較為疏遠, 但仍然與其他鱈科魚類聚為一大支。
圖 3 L-鏈復制起始區(qū)莖環(huán)結(jié)構(gòu)Fig. 3 Stem-loop structure of L-strand replication initiation region
圖 4 太平洋鱈D-Loop區(qū)序列Fig. 4 Schematic map characterizing of the control region of G. macrocephalus
圖 5 基于線粒體基因組全序列構(gòu)建的ML進化樹Fig. 5 Phylogenetic tree based on the ML analysis of the whole mitochondrial genome
通過研究太平洋鱈線粒體基因組堿基組成發(fā)現(xiàn)其基因組成與其他典型脊椎動物相似, 并且呈明顯的AT偏向性, 其他魚類中也同樣報道了此類的AT偏向性, 只是含量因物種的差異而有所區(qū)別[16]。連總強等[16]指出大多數(shù)魚類L-鏈編碼了tRNAGln、tRNA-Ala、tRNA-Asn、tRNA-Cys、tRNATyr、tRNA-Ser(UCN)、tRNA-Glu和tRNA-Pro 8個tRNA以及ND6基因, 其余tRNA均在H-鏈編碼, 但本研究中太平洋鱈H-鏈只編碼了tRNA-Gln、tRNATrp、tRNA-Ala、tRNA-Asn、tRNA-Cys、tRNASer、tRNA-Glu和tRNA-Pro以及NAD6基因, 其他tRNA均在L-鏈編碼, 似乎恰好與大多數(shù)魚類不同。此外, tRNA-Thr和tRNA-Pro之間出現(xiàn)74 bp的基因間隔區(qū), 在其他魚類中同樣存在這種現(xiàn)象,Christoph等[17]在鲅鯛(Petrochromis trewavasae)線粒體中發(fā)現(xiàn)最長為4 bp的折疊區(qū), 與本文相比只在折疊的堿基數(shù)目方面存在差異。此間隔區(qū)未發(fā)現(xiàn)與H鏈或L鏈復制相關(guān)的起始序列。在tRNA-Asn基因和tRNA-Cys基因之間發(fā)現(xiàn)的OL序列主要功能是調(diào)節(jié)L-鏈的復制[18], 此序列在哺乳動物和其他魚類線粒體控制區(qū)中都存在[19,20]。
圖 6 采用鄰接法構(gòu)建的鱈科魚類Cytb基因進化樹Fig. 6 Phylogenetic tree based on the NJ analysis of the Cytb genes
太平洋鱈線粒體基因組蛋白質(zhì)編碼基因中, 起始密碼子與大多數(shù)魚類一致, 均使用2種密碼子(ATG和GTG), 但是終止密碼子則與大多數(shù)硬骨魚不同[16], 除了TAA、TAG、TAA和T--四種終止密碼子外, 出現(xiàn)了以AGA和AGG為終止密碼子的情況。其中,COX2和NAD4基因以AGA為終止密碼子,NAD6基因以AGG為終止密碼子。這2種密碼子多在哺乳動物線粒體中使用, 而太平洋鱈線粒體中使用這兩種密碼子預示著太平洋鱈在進化過程中與哺乳動物進化方式更為相似。在堿基偏移方面,除了生活在南半球的藍鱈以及淡水類江鱈, 其他魚類均表現(xiàn)出弱AT負偏移, 并且作為外群物種中的大菱鲆同樣表現(xiàn)出弱AT偏移, 但生活在熱帶和亞熱帶海域的斜帶石斑魚卻沒有這種現(xiàn)象, 推測A+T-skew%的偏移很可能與物種生活的地理位置以及環(huán)境溫度有關(guān), 甚至可能涉及蛋白質(zhì)編碼的方向。Mclean等[21]通過檢測9種真細菌中GC和AT偏斜情況, 發(fā)現(xiàn)AT偏斜與轉(zhuǎn)錄復制的方向有關(guān), 這或許可以解釋上文中提及到的太平洋鱈大量tRNA和基因在L-鏈編碼的原因。同時根據(jù)Weber等[22]對黑腹果蠅(Drosophila melanogaster)內(nèi)含子中AT偏斜差異的研究, 發(fā)現(xiàn)其可能控制著物種之間的物理距離。本文所涉及的鱈科魚類的地理隔離是否也是由AT偏斜控制的尚需探究。
線粒體12S rRNA和16S rRNA的功能主要決定于其二級結(jié)構(gòu)。太平洋鱈rRNA的序列十分保守,與其他已報道的硬骨魚類十分相似, 如蘭州鲇[16]。本研究中22個tRNA基因中除了tRNA-Ser(GCT)外, 其余均形成典型的三葉草結(jié)構(gòu)。tRNA缺少DHU臂,在DHU臂的位置上形成一個單環(huán)結(jié)構(gòu)。此種情況在魚類線粒體中較為常見。Cheng等[23]研究證明這種缺失DHU臂的tRNA可以調(diào)整結(jié)構(gòu)形態(tài), 并不會影響其進入核糖體以及攜帶并轉(zhuǎn)運氨基酸等功能。
魚類線粒體控制區(qū)包含: 終止序列區(qū)(TAS)、中央保守區(qū)、H-鏈復制起始區(qū)(OH)等保守序列[24],而本文中太平洋鱈線粒體控制區(qū)中僅含有一個與CSB-2相對應的保守序列CSB和一個與TAS功能類似的序列TAS*(圖 4)。TAS*雖然在結(jié)構(gòu)上與其他魚類不同, 但此序列可以形成發(fā)夾結(jié)構(gòu)同時含有保守的五核苷酸序列5′-TACAT-3′, 是D-Loop區(qū)DNA終止的候選位點[25]。太平洋鱈D-Loop區(qū)中的17 bp嘧啶序列, 是線粒體單鏈結(jié)合蛋白(Single strand DNA-binding protein, mtSSB)假定結(jié)合位點。這種蛋白特異性結(jié)合單鏈嘧啶區(qū)域, 被認為在DNA復制調(diào)節(jié)過程中起作用。Johansen等[25]在大西洋鱈中分別發(fā)現(xiàn)了17和27 bp的嘧啶序列, 以及位于D-Loop區(qū)5′端的4個完美重復序列。太平洋鱈控制區(qū)沒有發(fā)現(xiàn)存在于大西洋鱈控制區(qū)的27 bp的嘧啶序列以及5′端的4個完美重復序列。在大西洋鱈線粒體控制區(qū)發(fā)現(xiàn)的重復序列只是DNA重復復制的結(jié)果, 據(jù)此推測雖然太平洋鱈線粒體基因組在控制區(qū)與其他魚類存在較大差異, 但是在具有關(guān)鍵功能的序列上通常是保守的或具有相似的代替序列,似乎太平洋鱈在進化的過程中更加傾向于功能上的完整, 而非結(jié)構(gòu)上的相似。這些D-Loop序列的獨特性是否是導致太平洋鱈與其他鱈魚地理隔絕的另一個原因, 目前尚沒有明確的觀點。
線粒體基因組相關(guān)基因或結(jié)構(gòu)已經(jīng)被廣泛應用于系統(tǒng)發(fā)育、物種分類等不同研究領(lǐng)域[26]。本研究以最大似然法構(gòu)建線粒體全基因組進化樹(圖5)并沒有顯示出與傳統(tǒng)分類學觀點相似的結(jié)果。其中被認為是真鱈的太平洋鱈、大西洋鱈與格陵蘭鱈并沒有出現(xiàn)在同一支中, 生存環(huán)境更加苛刻的北極鱈則取代了格陵蘭鱈的位置, 并且同為江鱈的3個不同樣本在該進化樹中也在不同分支中。以線粒體全基因組構(gòu)建的進化樹可信度較差, 原因可能是這些魚類線粒體中非編碼區(qū)存在大量的變異。太平洋鱈存在長達74 bp的基因間隔區(qū)和差異較大的D-Loop區(qū)。而無論以何種方法構(gòu)建進化樹, 其原理都是檢測各個堿基的替換率, 而非編碼區(qū)的變異則會將線粒體整體進化水平夸大。鑒于太平洋鱈和其他鱈之間, 尤其是與大西洋鱈線粒體基因組有著非常高的同源性, 所以采用Cytb基因作為進化樹分析的依據(jù)(圖 6)。分析結(jié)果顯示, 與大西洋鱈相比, 太平洋鱈與格陵蘭鱈在系統(tǒng)進化上更為親近,這似乎也能解釋為什么太平洋鱈和大西洋鱈在D-Loop區(qū)上有如此巨大的差異。
線粒體基因組進化速度快于物種進化速度, 另外不同地理分布有可能造成動物體DNA的變異, 如太平洋鱈和大西洋鱈2個物種, DNA序列同源性很高, 單獨比較分析某一個編碼基因時差別更小, 但是它們往往在生活習性等方面有著較大的區(qū)別。目前的技術(shù)發(fā)展水平很難分析這些線粒體基因組,尤其是控制區(qū)上的微小變化所導致的結(jié)果, 進一步分析線粒體基因組的變異不僅可以分析不同物種之間的遺傳關(guān)系, 還可為解決因不同地理分布而導致物種之間的變異等問題提供數(shù)據(jù)支持。