国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高橋仁蚧線粒體全基因組測序與分析

2022-05-19 06:05盧聰聰張江濤黃曉磊
昆蟲學(xué)報 2022年4期
關(guān)鍵詞:密碼子線粒體測序

鄧 鋆, 王 剛, 盧聰聰, 張江濤, 黃曉磊,*

(1.福建農(nóng)林大學(xué)植物保護學(xué)院, 閩臺作物有害生物生態(tài)防控國家重點實驗室, 福州 350002;2.江西農(nóng)業(yè)大學(xué)林學(xué)院, 鄱陽湖流域森林生態(tài)系統(tǒng)保護與修復(fù)國家林業(yè)和草原局重點實驗室, 南昌 330045)

線粒體是真核生物細胞中具有獨立遺傳物質(zhì)的細胞器,是細胞制造能量的場所,參與細胞分化、細胞信息傳遞和細胞凋亡等過程(潘寶平和卜文俊, 2005; Cameron, 2014)。截至2020年,在GenBank數(shù)據(jù)庫中已發(fā)布489種半翅目(Hemiptera)昆蟲完整線粒體基因組。作為半翅目一員,蚧總科(Coccoidea)現(xiàn)已知35科8 310種蚧蟲(García Moralesetal., 2016),但在GenBank數(shù)據(jù)庫中僅有3個蚧蟲完整的線粒體基因組序列,均為蚧科(Coccidae)物種(Dengetal., 2019; Luetal., 2020; Xuetal., 2021)。相比現(xiàn)有的蚧蟲物種數(shù)量,蚧蟲線粒體基因組的測序工作明顯滯后,GenBank數(shù)據(jù)庫中嚴重缺少除cox1基因外的其他蚧蟲線粒體標記基因數(shù)據(jù),這阻礙了分子進化、系統(tǒng)發(fā)育和生物地理學(xué)等相關(guān)工作在蚧蟲中的開展,也阻礙了線粒體基因組在半翅目昆蟲研究中進一步的應(yīng)用。Deng等(2019)公布首個蚧蟲即日本龜蠟蚧Ceroplastesjaponicus完整的線粒體基因組序列,并于2020年完整注釋了蚧科咖啡黑盔蚧Saissetiacoffeae線粒體基因組,彌補了GenBank數(shù)據(jù)庫因長期缺失蚧蟲線粒體基因組數(shù)據(jù)而造成的空白(Luetal., 2020)。研究發(fā)現(xiàn)蚧蟲線粒體基因組中存在高度的基因重排現(xiàn)象、高AT含量以及非典型的tRNAs二級結(jié)構(gòu)(例如縮減tRNAs,主要表現(xiàn)在缺失DHU臂或TΨC臂)(Luetal., 2020)。事實上,GenBank數(shù)據(jù)庫缺失的不僅僅是完整的蚧蟲線粒體基因組序列,數(shù)據(jù)庫中只有兩條超過5 000 bp的部分線粒體基因序列。這些現(xiàn)象反映想要獲得完整的蚧蟲線粒體基因組可能具有較高的難度。

高橋仁蚧Aclerdatakahashii隸屬于半翅目蚧總科仁蚧科(Aclerdidae),分布在巴西、中國、埃及、印度、印度尼西亞、馬來西亞、美國等14個國家和地區(qū),涵蓋古北界、新北界、東洋界、新熱帶界(García Moralesetal., 2016)。高橋仁蚧各齡期均生活在植物的葉鞘下,寄主主要為禾本科芒屬Miscanthus、甘蔗屬Saccharum、粽葉蘆屬Thysanolaena植物(García Moralesetal., 2016)。本研究對高橋仁蚧粒體基因組進行二代高通量測序,獲得其完整的線粒體基因組序列,對其堿基組成、密碼子使用情況、tRNA結(jié)構(gòu)進行了預(yù)測分析,并基于線粒體基因組13個蛋白編碼基因構(gòu)建半翅目系統(tǒng)發(fā)育樹。研究結(jié)果將為蚧總科分類及仁蚧科線粒體基因組研究提供科學(xué)依據(jù)。

1 材料與方法

1.1 昆蟲樣本采集與DNA的提取

本研究所用的高橋仁蚧成蟲樣本于2019年8月5日采集自福建省建甌市云際山公園內(nèi)(27°1′19″N, 118°18′36″E),利用《中國動物志》(王子清, 2001)進行形態(tài)鑒定。測序樣本置于95%的酒精中-80℃保存。使用DNeasy DNA Extraction Kit試劑盒(Qiagen, Hilden, 德國)提取10頭成蟲混合樣本的總DNA,經(jīng)NanoDrop 2000分光光度計和1%的瓊脂糖凝膠電泳檢測總DNA的質(zhì)量和濃度。

1.2 高通量測序及線粒體基因組的拼接

將1.1節(jié)質(zhì)量合格濃度大于2 μg的DNA樣本送至北京諾禾致源科技股份有限公司進行高通量測序,構(gòu)建350 bp的短片段文庫,利用Illumina HiSeq測序平臺進行雙末端(paired-end, PE)測序。 將下機的原始數(shù)據(jù)去接頭和質(zhì)控。利用NOVOPlasty 3.7.1(Dierckxsensetal., 2017)軟件以該物種線粒體cox1基因片段為種子序列進行線粒體基因組的拼接,在K-mer=23, 27, 33下均獲一條長為16 599 bp的成環(huán)序列;為保證拼接的準確性,使用MEGAHIT 1.0(Lietal., 2016)對clean data進行從頭組裝,建立本地Blast數(shù)據(jù)庫,提取一條長為16 735 bp的線粒體基因組序列;隨后將兩種軟件所拼接的序列進行比對驗證,未發(fā)現(xiàn)有堿基不同。最終使用Pilon 1.3.2(Walkeretal., 2014)對16 599 bp拼接序列進行校正,獲得高橋仁蚧線粒體基因組全長序列。

1.3 線粒體基因組的注釋與序列分析

利用MITOS2在線服務(wù)器(Berntetal., 2013)對獲得的線粒體基因組序列進行初步注釋。剩余未發(fā)現(xiàn)的tRNA由ARWEN 1.2注釋(Laslett and Canb?ck, 2008)。使用TRF(Tandem Repeats Finder)在線服務(wù)器(https:∥tandem.bu.edu/trf/trf.html)查找串聯(lián)重復(fù)序列(Benson, 1999)。運用Phylosuite 1.2.1(Zhangetal., 2020)分析核苷酸密碼子使用頻率和核酸組成。利用公式AT-skew=(A-T)/(A+T)和GC-skew=(G-C)/(G+C)分別計算AT偏斜和GC偏斜,使用OGDRAM在線可視化軟件繪制高橋仁蚧線粒體全基因組(Greineretal., 2019)。

1.4 系統(tǒng)發(fā)育分析

從GenBank數(shù)據(jù)庫中下載半翅目15科31種已報道的線粒體全基因組序列,基于13個蛋白編碼基因,在Phylosuite軟件中使用MACSE 2.03(Ranwezetal., 2018)進行序列多重比對,并進行串聯(lián),獲得蛋白編碼基因核苷酸序列數(shù)據(jù)集。以蜚蠊目維州散白蟻Reticulitermesvirginicus線粒體全基因組為外群,應(yīng)用IQ-TREE1.6.8(Nguyenetal., 2015)和MrBayes 3.2.6(Ronquistetal., 2012)分別構(gòu)建最大似然法(maximum likelihood, ML)和貝葉斯推斷法(Bayesian inference, BI)系統(tǒng)發(fā)育樹。IQ-TREE系統(tǒng)樹分支節(jié)點的置信水平用ultrafast bootstrap approximation approach (UFBoot)(重復(fù)抽樣10 000次)估計。利用ModelFinder(Kalyaanamoorthyetal., 2017)篩選出最佳核苷酸替換模型為GTR+I+G+F,MrBayes在GTR+I+G+F模型進行貝葉斯推斷,運算2 000 000代,每1 000代抽樣一次,burn-in參數(shù)設(shè)置為25%。

2 結(jié)果

2.1 高橋仁蚧線粒體基因組結(jié)構(gòu)和堿基組成

高橋仁蚧線粒體基因組序列全長16 599 bp(GenBank登錄號: MW839575),由一段控制區(qū)和37個基因(13個蛋白編碼基因、22個tRNA基因和2個rRNA基因)組成,呈閉合雙鏈環(huán)狀的DNA分子結(jié)構(gòu)(圖1)。通常將多數(shù)編碼基因所在的鏈定義為主要編碼鏈J鏈(majority strand),則另外一條鏈定義為次要編碼鏈N鏈(minority strand)。線粒體基因組中9個蛋白編碼基因(cox1,cox2,cox3,cob,atp8,atp6,nad2,nad3和nad6)和14個tRNA基因(trnM,trnW,trnL2,trnK,trnD,trnG,trnR,trnS1,trnE,trnN,trnA,trnI,trnT和trnS2)在J鏈上,剩余14個編碼基因在N鏈上。線粒體基因組中A, T, C和G堿基含量分別為47.54%, 36.97%, 11.05%和4.44%??侫+T含量為84.51%,AT偏斜為0.125,呈現(xiàn)明顯的AT偏向性(表1)。線粒體基因組中共有9處基因重疊(表2),共76 bp,其中最長的重疊區(qū)域位于trnE-trnF之間,為37 bp;其次位于trnI-nad2之間,長為15 bp。存在基因間隔區(qū)24個,共1 250 bp;最長間隔區(qū)在trnT-cob處,長度為184 bp。最短間隔區(qū)位于trnN-trnQ處長度為2 bp。無間隔無重復(fù)區(qū)有4處(表2)。

圖1 高橋仁蚧線粒體基因組結(jié)構(gòu)Fig.1 Structure of the mitochondrial genomeof Aclerda takahashii

表1 高橋仁蚧線粒體基因組核苷酸組成Table 1 Nucleotide composition of the mitochondrial genome of Aclerda takahashi

續(xù)表1 Table 1 continued

表2 高橋仁蚧線粒體基因組結(jié)構(gòu)Table 2 Organization of the mitochondrial genome of Aclerda takahashii

2.2 高橋仁蚧線粒體蛋白質(zhì)編碼基因和相對同義密碼子使用頻率(RSCU)

高橋仁蚧線粒體基因組中13個蛋白編碼基因序列總長為10 632 bp,約占線粒體基因組全序列的64.05%。nad5的序列最長,為1 620 bp。atp8的序列最短,長141 bp;均采用標準的起始密碼子(ATN)和終止密碼子(TAA),其中,3個蛋白編碼基因(cox1,atp8和atp6)的起始密碼子為ATA, 5個蛋白編碼基因(cox2,cox3,cob,nad1和nad4)的起始密碼子為ATG,其余5個蛋白編碼基因的起始密碼子為ATT(表2)。共有62個不同的密碼子,其中有5個密碼子使用次數(shù)最多:AUA(Met)439次,AUU(Ile)408次,UUU(Phe)390次,UUA(Leu2)366次和AAU(Asn)260次。氨基酸占比由高到低的排序為Met(13.62%),Ile(12.89%),Phe(12.21%),Leu2(11.95%)和Asn(9.23%)(圖2)。

圖2 高橋仁蚧線粒體基因組的相對同義密碼子使用頻率(RSCU)Fig.2 Relative synonymous codon usage (RSCU) in the mitochondrial genome of Aclerda takahashii

2.3 高橋仁蚧線粒體基因組tRNA基因和rRNA基因

22個tRNA基因中,MITOS2成功注釋了15個,剩余7個由ARWEN注釋;長度變化范圍在48(trnM)~79 bp(trnE)之間;只有10個tRNA基因(trnR,trnN,trnC,trnE,trnI,trnL1,trnL2,trnK,trnF和trnM)的二級結(jié)構(gòu)是典型的三葉草結(jié)構(gòu),其余12個皆為非典型的結(jié)構(gòu):trnY和trnW缺失DHU臂,trnS1和trnS2的DHU臂和TΨC臂缺失,剩下8個tRNA基因都缺失TΨC臂。此外在一些tRNA基因的氨基酸接受臂上出現(xiàn)堿基錯配現(xiàn)象,例如trnR(U-U),trnE(U-U),trnN(A-A)以及trnF(U-C)。除了trnN的反密碼子臂上出現(xiàn)1處堿基錯配現(xiàn)象(C-A),其余都能形成完全配對的臂(圖3)。

圖3 高橋仁蚧線粒體基因組tRNA基因二級結(jié)構(gòu)Fig.3 Secondary structure of tRNA genes in the mitochondrial genome of Aclerda takahashii

2.4 系統(tǒng)發(fā)育

運用最大似然法和貝葉斯推斷法構(gòu)建的系統(tǒng)發(fā)育樹均展示了相同的拓撲結(jié)構(gòu)(圖4),并且每個分支節(jié)點上都有高的支持率(自舉值>65,后驗概率>0.90)。二者結(jié)果充分展示了這些總科的如下系統(tǒng)發(fā)育關(guān)系:(((跳蝽總科(Saldoidea)+細蝽總科(Leptopodoidea))+(臭蟲總科(Cimicoidea)+獵蝽總科(Reduvioidea)))+(角蟬總科(Membracoidea)+(蠟蟬總科(Fulgoroidea)+(木虱總科(Psylloidea)+(粉虱總科(Aleyrodoidea)+(蚜總科(Aphidoidea)+蚧總科(Coccoidea)))))))。兩個系統(tǒng)發(fā)育樹展示蚧科的日本龜蠟蚧C.japonicus、咖啡黑盔蚧S.coffeae、朝鮮球堅蚧Didesmococcuskoreanus均分布在一個分支上,高橋仁蚧作為仁蚧科代表,單獨形成一個分支。

圖4 最大似然法構(gòu)建的基于線粒體基因組的13個蛋白質(zhì)編碼基因核苷酸序列的半翅目系統(tǒng)發(fā)育樹Fig.4 Phylogenetic tree of Hemiptera based on the sequences of 13 protein-coding genesof mitochondrial genome using maximum likelihood method節(jié)點旁左側(cè)數(shù)字代表Bootstrap支持率,右側(cè)數(shù)字代表貝葉斯后驗概率。Numbers on nodes refer to bootstrap support values (left) and Bayesian posterior probabilities (right).

3 討論

高橋仁蚧tRNA二級結(jié)構(gòu)具有特殊性,一部分tRNA無法通過MITOS2得到注釋(表2)。主要是由于這些tRNA是非典型的三葉草結(jié)構(gòu),缺失DHU臂或TΨC臂,其中tRNAser(S1)和tRNAser(S2)更是同時缺失DHU臂和TΨC臂(圖3)。同時在部分tRNA的氨基酸臂上,有個別堿基不配對,這些原因?qū)е买幌x的tRNA無法通過線粒體注釋軟件MITOS2準確注釋。一般情況下,動物的trnS1(AGN)通常會缺失DHU臂,而不具有經(jīng)典的三葉草結(jié)構(gòu)(Boore, 1999)。這種trnS1缺失DHU臂的現(xiàn)象在半翅目中均有發(fā)現(xiàn)(郭仲龍和袁明龍, 2016),白背飛虱Sogatellafurcifera的線粒體基因組的2個trnS基因和1個trnG基因也有缺臂的現(xiàn)象存在(Zhangetal., 2014)。在高橋仁蚧基因組中存在嚴重的tRNA缺臂現(xiàn)象,22個tRNA中的12個均存在缺臂現(xiàn)象(圖3),這一現(xiàn)象在蚧科的線粒體基因組中也有發(fā)現(xiàn)(Luetal., 2020)。然而在其他類群的昆蟲中,大量tRNA的缺臂現(xiàn)象鮮有發(fā)生(Luetal., 2020)。類似的報道主要來自于線蟲(Jühlingetal., 2012; Lorenzetal., 2017)、螨類(Xueetal., 2016; 趙亞男和李朝品, 2020)和蛛形綱動物(Masta and Boore, 2008)。在后生動物中,線粒體tRNA通過編譯可以修復(fù)這些缺失的臂,形成典型的三葉草結(jié)構(gòu)的tRNA(Lavrovetal., 2000; Segoviaetal., 2011)。這種轉(zhuǎn)錄后的編譯可能廣泛存在于仁蚧科的類群中。同時,我們也發(fā)現(xiàn)高橋仁蚧線粒體蛋白編碼基因具有很強的密碼子偏好性(圖2),這與半翅目其他昆蟲的密碼子使用情況類似(Luetal., 2020)。

半翅目昆蟲的AT含量一般在70%~80%之間,最低AT含量的半翅目線粒基因組為粉虱科Bemisiaafer(65.67%),最高的是粉虱科Aleurodicusdugesii(86.33%)(Wangetal., 2015)。其中胸喙亞目(Sternorrhyncha)是半翅目4個亞目中AT含量最高的亞目,平均AT含量達到80.97%(郭仲龍和袁明龍, 2016)。目前GenBank中最高AT含量(88.02%)的昆蟲線粒體基因組為膜翅目錘角細蜂科Trichopriadrosophilae線粒體基因組(GenBank登錄號: NC_048491)。作為胸喙亞目的一員,3個已知的蚧蟲線粒體基因組AT含量均超過了80.00%(Dengetal., 2019; Luetal., 2020),高橋仁蚧的AT含量達到84.51%(表1)。超高的AT含量造成測序上的困難,AT重復(fù)片段以及poly (A)的特殊結(jié)構(gòu)經(jīng)常導(dǎo)致一代測序的質(zhì)量不佳,出現(xiàn)套峰或測序信號的衰減中斷。在高橋仁蚧的線粒體基因組中,一個非常極端的例子是在nad5基因的位置上,連續(xù)出現(xiàn)了31個A堿基,這或可以解釋為何沒有一個蚧蟲線粒體基因組是通過一代測序獲得的原因。二代測序技術(shù),也就是高通量測序技術(shù),本身由于對于GC有偏好性,導(dǎo)致在AT含量高的地方往往測序覆蓋度不一致,甚至缺失覆蓋(Chenetal., 2013; Browneetal., 2020)。這導(dǎo)致利用二代測序技術(shù)拼接蚧蟲線粒體基因組時,獲得的線粒體基因組常碎片化。再加上由于蚧蟲本身個體小,采集困難,易被寄生蜂寄生(Dengetal., 2012),這些原因都導(dǎo)致很難獲得完整蚧蟲基因組,也成為GenBank數(shù)據(jù)庫中嚴重缺少蚧蟲線粒體基因組數(shù)據(jù)的主要原因。

在構(gòu)建的半翅目代表物種系統(tǒng)發(fā)育樹上(圖4),仁蚧科與蚧科物種親緣關(guān)系最近,這與之前基于18S rRNA, 28S rRNA和EF-1α的3個核基因片段的蚧總科系統(tǒng)發(fā)育研究的結(jié)果(Vea and Grimaldi, 2016)一致。由于蚧蟲線粒體基因組數(shù)據(jù)有限,在蚧蟲中基于線粒體多基因的系統(tǒng)發(fā)育研究還有待開展。已知的蚧蟲線粒體基因組構(gòu)建的系統(tǒng)發(fā)育樹也無法真實反映蚧蟲的進化的格局和系統(tǒng)發(fā)育關(guān)系。半翅目蚧總科中線粒體基因組數(shù)據(jù)的缺乏,嚴重阻礙了對蚧蟲本身以及整個半翅目昆蟲利用線粒體基因組開展進化、系統(tǒng)發(fā)育和生物地理等問題的研究,獲得更多不同科的蚧蟲線粒體基因組序列將成為解決這一問題的關(guān)鍵。

本研究獲得了高橋仁蚧線粒體基因組全序列,是仁蚧科首個線粒體基因組序列,提供了仁蚧科線粒體基因結(jié)構(gòu)和組成的基礎(chǔ)數(shù)據(jù),為后續(xù)獲得仁蚧科更多物種的線粒體基因組提供了參考。

猜你喜歡
密碼子線粒體測序
線粒體自噬在腸缺血再灌注損傷中的作用及機制研究進展
不同組織來源線粒體提取效率和質(zhì)量的差異研究
紫九牛葉綠體基因組密碼子偏好性分析
線粒體自噬在纖維化疾病中作用的研究進展
木薯葉綠體基因組密碼子偏好性分析
新一代高通量二代測序技術(shù)診斷耐藥結(jié)核病的臨床意義
宏基因組測序輔助診斷原發(fā)性肺隱球菌
生物測序走在前
新型密碼子、反密碼子、氨基酸對應(yīng)盤
MFN2調(diào)控線粒體動態(tài)變化的研究進展
崇礼县| 百色市| 石首市| 灵川县| 淮北市| 西和县| 阳信县| 甘肃省| 东平县| 萨迦县| 五台县| 三门县| 双流县| 合作市| 塔城市| 嫩江县| 焦作市| 宜州市| 柘城县| 濮阳市| 武陟县| 大庆市| 抚顺县| 崇信县| 习水县| 宜春市| 扎赉特旗| 车致| 宜阳县| 克山县| 蕉岭县| 沽源县| 郴州市| 克什克腾旗| 浏阳市| 手游| 望江县| 阳信县| 金乡县| 万年县| 南岸区|