国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

滅字脊虎天牛線粒體基因組密碼子使用偏好性分析

2023-08-23 15:44付興飛李亞麒程金煥李貴平李亞男黃家雄胡發(fā)廣
關(guān)鍵詞:同義密碼子堿基

付興飛,李亞麒,程金煥,李貴平,李亞男,黃家雄,楊 旸,胡發(fā)廣

(云南省農(nóng)業(yè)科學(xué)院 熱帶亞熱帶經(jīng)濟(jì)作物研究所,云南 保山 678000)

全球絕大多數(shù)生物20類(lèi)標(biāo)準(zhǔn)氨基酸僅有64個(gè)密碼子編碼,除蛋氨酸Met和色氨酸Trp外,每種氨基酸對(duì)應(yīng)2~6個(gè)密碼子,這種編碼同一種氨基酸的不同密碼子稱(chēng)為同義密碼子[1-2],而同義密碼子間使用頻率不同的現(xiàn)象,被稱(chēng)為密碼子偏好性[3]。在自然界中,密碼子偏好性非常普遍,且受多種因素影響,其中突變壓力和自然選擇被認(rèn)為是密碼子偏好性形成的關(guān)鍵因素,但在不同物種間有所差異,如在籽粒莧(Amaranthus hypochondriacus)中突變壓力是主導(dǎo)因素,而在杧果(Mangifera indica)中自然選擇是主導(dǎo)因子[4-5]。密碼子偏好性研究在揭示物種進(jìn)化關(guān)系、提高外源基因表達(dá)、基因組特征以及生態(tài)適應(yīng)性等方面具有重要意義。

昆蟲(chóng)線粒體基因是獨(dú)立于細(xì)胞核染色體外的一組基因組,大小在15~18 kp,是一種外環(huán)為重鏈、內(nèi)環(huán)為輕鏈的環(huán)形雙鏈DNA結(jié)構(gòu),其線粒體基因組含13個(gè)保守蛋白質(zhì)編碼基因PGGs、22個(gè)tRNA、2個(gè)rRNA基因及一段控制區(qū)[6]。由于線粒體基因組通過(guò)母系遺傳,其具有進(jìn)化速率快、基因排序保守等特點(diǎn),在系統(tǒng)發(fā)育和種群遺傳等方面的應(yīng)用也逐漸廣泛[7]。何積翠等[8]在線粒體基因的使用模式上開(kāi)展了大量研究,有效揭示了形成密碼子偏好性的原因,也為進(jìn)一步了解系統(tǒng)發(fā)育和種群進(jìn)化等提供了理論依據(jù),但研究對(duì)象主要集中于農(nóng)作物及水生生物。在昆蟲(chóng)方面,趙婉清等[9]通過(guò)對(duì)獵蝽科11亞科30屬代表物種的線粒體基因組同義密碼子相對(duì)使用頻率RSCU進(jìn)行對(duì)比,發(fā)現(xiàn)以A/U結(jié)尾的密碼子的使用頻率高于G/C結(jié)尾的,與昆蟲(chóng)線粒體基因組的高AT特性保持一致。

滅字脊虎天牛(Xylotrechus quadripes)又稱(chēng)咖啡滅字虎天牛,隸屬于鞘翅目(Coleoptera)天???Cermbycidae),是危害亞洲咖啡產(chǎn)區(qū)小粒咖啡的重大型蛀干害蟲(chóng),因其以幼蟲(chóng)在2年生及以上咖啡主干內(nèi)蛀食為害,導(dǎo)致咖啡植株受害部以上生長(zhǎng)不良或死亡,造成咖啡減產(chǎn),對(duì)海拔1200 m以下咖啡園構(gòu)成了巨大的威脅[10]。線粒體作為主要ATP生產(chǎn)中心,在發(fā)育和代謝中具有重要作用,并且由于其母系遺傳,還可以為具有高表達(dá)水平和生物遏制的轉(zhuǎn)基因開(kāi)辟策略[2]。然而,關(guān)于滅字脊虎天牛線粒體基因組密碼子偏好性的分析至今尚未開(kāi)展。因此,本研究以滅字脊虎天牛線粒體基因組序列為研究對(duì)象,利用Codon W 1.4.2、Excel 2020、Origin 2022及PASW Statistics 20.0等軟件探究滅字脊虎天牛線粒體基因組密碼子偏好性,揭示影響密碼子使用模式及其偏好性的形成因素,以期為了解滅字脊虎天牛線粒體的基因組特性和進(jìn)化方向提供科學(xué)依據(jù)。

1 材料與方法

1.1 數(shù)據(jù)來(lái)源

在NCBI數(shù)據(jù)庫(kù)中以滅字脊虎天牛的拉丁名(Xylotrechus quadripes)為關(guān)鍵詞進(jìn)行檢索,下載相關(guān)的線粒體基因組序列及其編碼區(qū)(Coding DNA sequence,CDS),下載的基因組序列全長(zhǎng)為24859 bp,共選取16條長(zhǎng)度大于300 bp,且以ATG為開(kāi)始,TAG、TAA、TGA結(jié)尾,內(nèi)部不存在終止密碼子的非重復(fù)基因序列用于數(shù)據(jù)分析[11]。

1.2 分析方法

1.2.1 密碼子組成分析 使用Codon W 1.4.2軟件對(duì)16條非重復(fù)基因序列的有效密碼子使用個(gè)數(shù)(Effective number of codon,ENC)、同義密碼子使用度(Relative synonymous codon Usage,RSCU)、最優(yōu)密碼子頻率(Frequency of optimal codon,F(xiàn)op)、密碼子適應(yīng)指數(shù)(Codon adaption index,CAI)、第3位密碼子各堿基含量(T3s、A3s、G3s、C3s)、總GC含量以及密碼子第1~3位上堿基GC含量(GC、GC1、GC2、GC3)及同義密碼子第3位堿基的GC含量(GC3s),GC12(GC1、GC2的平均值)、芳香族氨基酸比例(Aromo)、基因編碼序列長(zhǎng)度(L)進(jìn)行計(jì)算,并使用PASW Statistics 20.0軟件對(duì)滅字脊虎天牛線粒體基因組偏好性相關(guān)參數(shù)進(jìn)行相關(guān)性分析,揭示彼此之間的關(guān)系。

1.2.2 中性繪圖分析 以GC3為X軸,CC12為Y軸繪制16條非重復(fù)基因序列的二維散點(diǎn)圖,根據(jù)散點(diǎn)在對(duì)角線上的分布情況,初步判斷密碼子偏好性的形成因素。當(dāng)散點(diǎn)沿對(duì)角線分布,回歸系數(shù)接近1時(shí),表明兩者的差異基本一致,密碼子不同位置上的堿基構(gòu)成無(wú)差異,該基因主要受到突變動(dòng)力的影響,受自然選擇的影響較小;若散點(diǎn)沒(méi)有沿對(duì)角線分布,回歸系數(shù)接近0,則表明兩者的差異較大,該基因受到自然選擇的影響[12]。

1.2.3 ENC-plot繪圖分析 ENC-plot繪圖分析可以辨析密碼子偏好性,ENC值(20~61)越接近20,密碼子受突變動(dòng)力的影響越大;越接近61,則受自然選擇的影響越大[13]。以滅字脊虎天牛線粒體基因組各CDS序列中GC3為X軸,有效密碼子數(shù)為Y軸繪制散點(diǎn)圖,并根據(jù)式(1)計(jì)算ENC值,在散點(diǎn)圖中形成ENC值的期望線。

1.2.4 PR2-plot繪圖分析 PR2-plot繪圖分析可以揭示密碼子第3位上4種堿基(A、T、G、C)間的組成偏差對(duì)密碼子偏好性是否產(chǎn)生影響。以G3/(G3+C3)和A3/(A3+T3)分別為X軸和Y軸進(jìn)行繪圖,圖的中心點(diǎn)表示堿基A=T、G=C(密碼子無(wú)偏向性和突變),從中心點(diǎn)發(fā)出的矢量表示該堿基偏移的程度和方向[14]。

1.2.5 最優(yōu)密碼子分析 以ENC為標(biāo)準(zhǔn),對(duì)所有參試基因按降序進(jìn)行排序,分別選取兩級(jí)10%的基因建立高低偏好性庫(kù),并計(jì)算ΔRSCU(高低兩組相減的RSCU值)。以ΔRSCU≥0.08的密碼子為高表達(dá)密碼子,同時(shí)為高頻和高表達(dá)的為最優(yōu)密碼子[5]。

2 結(jié)果與分析

2.1 密碼子堿基組成

由表1可知:滅字脊虎天牛線粒體基因組中密碼子上的GC含量存在差異,全部CDS密碼子GC含量為38.18%~47.56%,平均含量為42.66%;平均含量排序?yàn)镚C3>GC1>GC2,不同位置上GC含量不均衡;密碼子第3位核苷酸堿基含量排序?yàn)锳3s>T3s>G3s>C3s;ENC值的范圍在50.08~57.26,平均值為54.51,接近61;CAI值范圍在0.175~0.216,平均值為0.190;Fop在0.365~0.468,平均值為0.400,均接近0。綜上表明,滅字脊虎天牛線粒體基因組密碼子的偏好性較弱,傾向于以A/T結(jié)尾的密碼子。

表1 滅字脊虎天牛線粒體基因組密碼子偏好性相關(guān)參數(shù)

由表2可知,GC與GC2、GC3呈極顯著正相關(guān),GC2與GC3呈極顯著正相關(guān),但GC2、GC3與GC1無(wú)顯著相關(guān)關(guān)系,這表明密碼子的第2、3位堿基組成較為相似,與第1位堿基的組成差異較大,存在明顯位置效應(yīng);ENC與GC2、CAI與GC12均呈極顯著正相關(guān),但ENC、CAI與GC1、GC3無(wú)明顯的相關(guān)關(guān)系,這表明第2位堿基對(duì)密碼子偏好性影響更顯著;密碼子適應(yīng)指數(shù)CAI 與GC、G3s、ENC、Fop 呈顯著正相關(guān),F(xiàn)op與GC、GC2、GC3、C3s、CAI、GC12呈顯著正相關(guān),與A3s和T3s呈顯著負(fù)相關(guān),這表明基因的表達(dá)水平和密碼子使用偏好性程度均會(huì)受到核苷酸組成的影響。

表2 滅字脊虎天牛線粒體基因組密碼子偏好性參數(shù)相關(guān)分析

2.2 中性繪圖分析

可以通過(guò)中性繪圖分析揭示GC3與GC12的相互關(guān)系,由此反映滅字脊虎天牛線粒體基因組密碼子使用模式中自然選擇和突變壓力之間的均衡性。由圖1可知,該基因組中GC3含量分布范圍介于39%~47%,GC12含量分布范圍介于37.52%~42.98%。GC3與GC12之間無(wú)顯著相關(guān)性(R=0.229,P=0.393)。這表明密碼子第3個(gè)位置上的堿基組成不同,GC含量水平高度保守,密碼子偏好性更多地受自然選擇的影響。

圖1 滅字脊虎天牛線粒體基因組中性繪圖分析

2.3 ENC-plot繪圖分析

由圖2可知,全部基因處于期望曲線之下,實(shí)際ENC值與預(yù)期ENC值具有一定距離。對(duì)ENC比值頻率進(jìn)行分析,在4個(gè)區(qū)間范圍內(nèi)的16個(gè)基因與期望值差異較大(表3)。綜上表明,滅字脊虎天牛密碼子使用偏好性受多種因素的影響(如突變壓力),但自然選擇仍是關(guān)鍵因子。

圖2 滅字脊虎天牛線粒體基因組ENC-pot繪圖分析

表3 滅字脊虎天牛線粒體基因組有效密碼子數(shù)比值頻數(shù)分析

2.4 PR2-plot繪圖分析

通過(guò)PR2-plot繪圖探究4個(gè)密碼子編碼的氨基酸家族中第3位上嘌呤和嘧啶分布情況(圖3)。結(jié)果表明,第一、二、三、四象限分別有1、6、6、3個(gè)基因,主要分布在第二和第三象限內(nèi),堿基T的使用頻率高于A的,堿基C的使用頻率高于G的。這表明自然選擇是影響滅字脊虎天牛線粒體基因組密碼子偏好性的關(guān)鍵因素,同時(shí)也可能有其他因素的參與。

圖3 滅字脊虎天牛線粒體基因組密碼子奇偶偏好性分析

2.5 同義密碼子相對(duì)使用度分析

同義密碼子相對(duì)使用頻率分析結(jié)果表明(表4),RSCU值小于1.00的有UUU、CUU、CUC等33個(gè)密碼子,使用偏好性較弱,出現(xiàn)頻率低;RSCU值等于1的有AUG、GCA、UGG等3個(gè)密碼子,無(wú)使用偏好性;RSCU值大于1的有UUC、UUA、CUC等28個(gè)密碼子,使用偏好性強(qiáng),其中,AGA、AGG這2個(gè)密碼子的RSCU值超過(guò)1.6,使用偏好性較強(qiáng)。在28個(gè)高頻密碼子中,以A/U結(jié)尾19個(gè),其中U結(jié)尾10個(gè);以G/C結(jié)尾9個(gè),其中C結(jié)尾5個(gè)。這表明滅子脊虎天牛線粒體基因組密碼子傾向于以A/U結(jié)尾,更傾向于以U結(jié)尾。

表4 滅字脊虎天牛線粒體基因同義密碼子相對(duì)使用度

2.6 最優(yōu)密碼子確定

由表5可知,ΔRSCU≥0.08的高表達(dá)密碼子有28個(gè),其中以A結(jié)尾8個(gè),U結(jié)尾10個(gè),G結(jié)尾5個(gè),C結(jié)尾5個(gè)。最優(yōu)密碼子共17個(gè),分別為AUA、CUG、UUG、UUC、GUU、CCA、CCU、UCU、AGU、GAU、CAA、CAU、UAA、AGA、AGG、GGA、ACU,其中以A結(jié)尾6個(gè),以U結(jié)尾7個(gè),以G結(jié)尾3個(gè),以C結(jié)尾1個(gè)。

表5 滅字脊虎天牛線粒體基因組最優(yōu)密碼子

3 討論與小結(jié)

第3位堿基作為同義密碼子的主要區(qū)別[8]。本研究的結(jié)果顯示:GC3(49.14%)與GC2(35.53%)具有顯著相關(guān)性,與GC1(47.14%)無(wú)顯著相關(guān)性;同義密碼子相對(duì)使用頻率分析中,RSCU>1.0的密碼子共有28個(gè),其中以A/U結(jié)尾的密碼子有19個(gè);通過(guò)高頻(RSCU)和高表達(dá)(ΔRSCU≥0.08)密碼子共同確定最優(yōu)密碼子,本研究最終篩選出最優(yōu)密碼子17個(gè),分別為AUA、CUG、UUG、UUC、GUU、CCA、CCU、UCU、AGU、GAU、CAA、CAU、UAA、AGA、AGG、GGA、ACU,其中最優(yōu)密碼子主要以A(6個(gè))和U(7個(gè))結(jié)尾,均表明滅字脊虎天牛線粒體基因組密碼子偏好使用A/U結(jié)尾。該結(jié)果與趙婉清等[9]的研究結(jié)果一致,其研究發(fā)現(xiàn)獵蝽科11亞科30屬代表物種的線粒體基因組A/U結(jié)尾的密碼子使用頻率高于G/C結(jié)尾的。而這種線粒體基因組密碼子使用規(guī)律在水生動(dòng)物或節(jié)肢動(dòng)物中也具有相似性,例如:瓜螺(Melo melo)、橫脊新獵蝽(Neocentrocnemis stali)、海南桿蝓獵蝽(Ischnobaenella hainana)、圓臀大黽蝽(Aquarius paludum)等[8-9,15]。ENC值、CAI值、Fop均可以揭示密碼子偏好性的強(qiáng)弱,也是判斷密碼子偏好性受自然選擇和突變動(dòng)力影響的關(guān)鍵指標(biāo)[13];CAI值和Fop值越靠近0,說(shuō)明密碼子偏好性越弱[16-17]。本研究的調(diào)查結(jié)果表明,滅字脊虎天牛線粒體基因組ENC平均值為54.5,與61更近,CAI和Fop的平均值分別為0.190和0.400,均接近0,這3個(gè)指標(biāo)均顯示了滅字脊虎天牛線粒體基因組密碼子偏好性較弱。

密碼子偏好性受突變壓力、自然選擇、堿基組成、tRNA、關(guān)聯(lián)突變和鏈不對(duì)稱(chēng)等多種因子的影響[18-20],但對(duì)于絕大多數(shù)物種而言自然選擇和突變壓力是影響密碼子偏好性的關(guān)鍵因子[2]。本研究結(jié)果表明,ENC與GC3和GC3s間無(wú)顯著相關(guān)性,說(shuō)明堿基組成并不是滅字脊虎天牛線粒體基因組密碼子偏好性的主要影響因子。此外,原曉龍等[14]對(duì)云南藍(lán)果樹(shù)(Nyssa yunnanensis)葉綠體基因組密碼子偏好性分析中發(fā)現(xiàn),基因長(zhǎng)度對(duì)密碼子偏好性也有影響。本研究通過(guò)基因長(zhǎng)度與其他指標(biāo)的相關(guān)性分析表明,基因長(zhǎng)度與其他指標(biāo)間無(wú)顯著相關(guān)性,說(shuō)明了基因長(zhǎng)度對(duì)滅字脊虎天牛線粒體基因組密碼子偏好性幾乎沒(méi)有影響。通過(guò)ENC繪圖、中性繪圖、PR2奇偶偏移分析表明,滅字脊虎天牛線粒體基因組密碼子偏好性的形成受自然選擇和突變動(dòng)力等因素共同影響,但自然選擇仍是主導(dǎo)因素。

本研究首次針對(duì)滅字脊虎天牛線粒體基因組密碼子偏好性進(jìn)行系統(tǒng)性研究,但缺少對(duì)虎天牛屬其余物種的比較分析,因此,也未能確定滅字脊虎天牛與其他虎天牛屬物種的密碼子偏好性是否具有一致性,下一步可對(duì)虎天牛屬的其他物種進(jìn)行密碼子偏好性研究,進(jìn)一步揭示虎天牛屬物種線粒體基因組密碼子偏好性的原因,最終確定導(dǎo)致同屬間不同物種密碼子偏好性差異的因素是否相同,以期為明確虎天牛屬系統(tǒng)發(fā)生關(guān)系奠定科學(xué)基礎(chǔ)。

滅字脊虎天牛線粒體基因組密碼子偏好性較弱,偏好以A/U結(jié)尾的密碼子,自然選擇是導(dǎo)致滅字脊虎天牛線粒體基因組密碼子偏好性的關(guān)鍵因子。通過(guò)高頻和高表達(dá)密碼子確定滅字脊虎天牛線粒體基因組最優(yōu)密碼子16個(gè),最優(yōu)密碼子多以A/U結(jié)尾。本研究結(jié)果可以為了解滅字脊虎天牛線粒體基因組特性和進(jìn)化方向等提供參考依據(jù)。

猜你喜歡
同義密碼子堿基
應(yīng)用思維進(jìn)階構(gòu)建模型 例談培養(yǎng)學(xué)生創(chuàng)造性思維
密碼子與反密碼子的本質(zhì)與拓展
until用法鞏固精練
中國(guó)科學(xué)家創(chuàng)建出新型糖基化酶堿基編輯器
生命“字母表”迎來(lái)4名新成員
生命“字母表”迎來(lái)4名新成員
西夏文《同義》重復(fù)字研究
10種藏藥材ccmFN基因片段密碼子偏好性分析
西夏文《同義》考釋三則
茶樹(shù)CsActin1基因密碼子偏性分析