国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

金銀花大毛花葉綠體基因組密碼子的偏好性分析

2023-05-04 05:30:16張加強(qiáng)劉慧春許雯婷周江華朱開(kāi)元
關(guān)鍵詞:毛花密碼子葉綠體

張加強(qiáng),劉慧春,王 杰,許雯婷,周江華,朱開(kāi)元,*

(1.浙江省園林植物與花卉研究所,浙江 杭州 311251; 2.浙江省麗水市遂昌縣農(nóng)作物技術(shù)推廣中心,浙江 遂昌 323300)

遺傳密碼是蛋白質(zhì)和核酸在生物體遺傳信息傳遞過(guò)程中的橋梁。除了一些只有一種遺傳密碼的氨基酸外,大多數(shù)氨基酸具有不止一種遺傳密碼,即密碼子具有簡(jiǎn)并性。編碼相同氨基酸的不同密碼子稱(chēng)為同義密碼子。不同物種或者同一物種的同義密碼子的使用頻率不同。這種現(xiàn)象稱(chēng)為密碼子使用偏好性[1-2]。密碼子使用偏好性廣泛存在于多種生物中,成因復(fù)雜,它受環(huán)境因素、堿基突變、自然選擇、基因漂移以及基因組大小、GC含量、蛋白質(zhì)結(jié)構(gòu)和tRNA豐度和基因表達(dá)水平等因素的影響[3-5]。研究表明,密碼子使用偏好性反映了物種或基因的起源、進(jìn)化和突變模式,對(duì)基因功能和蛋白質(zhì)表達(dá)有較大影響[6]。因此,密碼子使用偏好性可為物種分類(lèi)和分子進(jìn)化提供重要的見(jiàn)解。

葉綠體作為植物重要的半自主細(xì)胞器,在光合作用、碳同化和次生代謝產(chǎn)物的生物合成中起著重要的作用[7]。因此,葉綠體具有獨(dú)立于核基因組的遺傳系統(tǒng),擁有獨(dú)立的復(fù)制、轉(zhuǎn)錄和翻譯機(jī)制。研究表明,大多數(shù)植物葉綠體基因組的范圍從100 kb到200 kb,具有典型的4部分結(jié)構(gòu),包括一個(gè)大單拷貝區(qū)(LSC)、一個(gè)小單拷貝區(qū)(SSC)和兩個(gè)反向重復(fù)區(qū)(IR),通常含有110~130個(gè)基因[8-9]。由于葉綠體基因組結(jié)構(gòu)穩(wěn)定、基因含量保守、分子進(jìn)化緩慢,因此被廣泛應(yīng)用于植物系統(tǒng)進(jìn)化研究和物種鑒定[10-11]。近年來(lái),隨著高通量測(cè)序技術(shù)的發(fā)展,越來(lái)越多的植物葉綠體基因組信息,被添加到NCBI數(shù)據(jù)庫(kù)中[12-13]。目前,葉綠體中許多基因的生物學(xué)功能逐漸被揭示。例如,salt1的突變會(huì)影響葉綠體的發(fā)育,從而導(dǎo)致質(zhì)體發(fā)育缺陷[14];PTAC10對(duì)葉綠體發(fā)育和葉色有重要影響[15];RsgA在維持正常葉綠體形態(tài)方面起著關(guān)鍵作用[16]。研究表明,對(duì)于葉綠體基因組的研究,除了能提高對(duì)植物生物系統(tǒng)發(fā)育和進(jìn)化的認(rèn)識(shí)外,還具有重要的轉(zhuǎn)化應(yīng)用意義,即葉綠體基因工程,例如提供針對(duì)生物或非生物脅迫的保護(hù)以及在可食用植物中開(kāi)發(fā)疫苗和生物藥物[17-18]。同時(shí),葉綠體表達(dá)的轉(zhuǎn)基因的母系遺傳可以避免核轉(zhuǎn)基因系統(tǒng)中花粉逃逸引起的生物安全問(wèn)題[19-20]。

在葉綠體基因工程中,外源基因的整合以及用于高效表達(dá)轉(zhuǎn)化載體的開(kāi)發(fā)是兩個(gè)關(guān)鍵步驟。研究表明,葉綠體基因組的密碼子使用偏好性受到基因表達(dá)水平等因素的影響[21]。為了構(gòu)建成熟穩(wěn)定的葉綠體轉(zhuǎn)基因體系,很有必要對(duì)目標(biāo)基因或受體植物的密碼子偏好性進(jìn)行分析。目前,關(guān)于植物葉綠體基因組密碼子偏好性的研究,多集中于杓蘭[11]、牡丹[13]、蝴蝶蘭[22]、陸地棉[23]、杧果[24]、豆蔻屬[25]和籽粒莧[26]等物種中,而國(guó)內(nèi)外關(guān)于金銀花葉綠體基因組密碼子偏好性的研究則鮮有報(bào)道。

金銀花(LonicerajaponicaThunb.)為忍冬科植物忍冬的干燥未開(kāi)放花蕾或帶初開(kāi)的花,是我國(guó)傳統(tǒng)藥用植物,具有清熱解毒、疏散風(fēng)熱的功效,長(zhǎng)期以來(lái)被用于治療各種疾病,現(xiàn)代藥理研究表明,金銀花提取物具有抗炎、抗病毒、抗菌、抗氧化、保護(hù)肝和抗腫瘤等許多藥理活性。同時(shí),還被廣泛用于健康食品、健康茶、飲料和葡萄酒生產(chǎn)中[27]。金銀花來(lái)源復(fù)雜,全世界忍冬屬約有200種,中國(guó)有98種,其中可供藥用品種達(dá)47種。金銀花藥材來(lái)源主要以大毛花、四季花、雞爪花、北花一號(hào)和九豐一號(hào)等栽培品種為主。由于人們引種頻繁,加之受到長(zhǎng)期自然環(huán)境和人工定向培育,形成了數(shù)量眾多的農(nóng)家栽培品種或品系,其藥材產(chǎn)量與質(zhì)量均有差異,這也給金銀花的基原物種鑒定帶來(lái)許多困難,而葉綠體基因組可作為物種鑒定的“超級(jí)條形碼”在物種分類(lèi)和鑒定方面具有巨大優(yōu)勢(shì),已應(yīng)用于忍冬屬物種親緣關(guān)系的鑒定中[10]。金銀花大毛花是我國(guó)金銀花主流栽培品種之一,同時(shí),大毛花也是優(yōu)良的親本材料,九豐一號(hào)就是通過(guò)秋水仙素誘導(dǎo)二倍體大毛花莖尖選育出的同源四倍體[28]。本研究團(tuán)隊(duì)完成了金銀花大毛花葉綠體基因組的高通量測(cè)序,并已提交至NCBI GenBank數(shù)據(jù)庫(kù)。目前尚未有關(guān)于金銀花大毛花葉綠體基因組的密碼子使用偏好性的相關(guān)報(bào)道。本研究通過(guò)對(duì)金銀花大毛花葉綠體基因組密碼子使用模式和影響因素的分析,確定了金銀花大毛花葉綠體基因組的最佳密碼子,旨在為金銀花大毛花葉綠體基因組的應(yīng)用和研究提供科學(xué)參考。

1 材料與方法

從NCBI數(shù)據(jù)庫(kù)中下載完整的金銀花大毛花葉綠體基因組序列(GenBank:MZ779026.1),序列長(zhǎng)度為155 151 bp,包含81條蛋白編碼基因。為了避免出現(xiàn)樣本誤差,進(jìn)一步進(jìn)行過(guò)濾,去掉長(zhǎng)度小于300 bp和重復(fù)基因序列,最終獲得50條蛋白編碼基因用于后續(xù)分析。

1.1 密碼子偏好性分析

使用Codon W,EMBOSS在線程序(http://www.bioinformatics.nl/emboss-explorer)分析過(guò)濾后的編碼序列[29],計(jì)算各個(gè)基因的密碼子在第3位堿基組成上的A、G、C、T含量,分別記為A3、G3、C3、T3;并且統(tǒng)計(jì)樣本的總GC含量以及密碼子第1位、第2位和第3位堿基組成的GC含量,同義密碼子第3位的G+C含量,分別記為GC、GC1、GC2、GC3和GC3s;計(jì)算出同義密碼子的相對(duì)使用頻率(relative synonymous codon usage,RSCU);有效密碼子數(shù)(effective number of codons,ENc);密碼子適應(yīng)指數(shù)(codon adaptation index,CAI)等密碼子使用偏好性度量指標(biāo)。

1.2 中性繪圖

在中性圖繪制時(shí),首先計(jì)算GC1與GC2的平均值,計(jì)作GC12,再以各基因的GC3為橫坐標(biāo),GC12為縱坐標(biāo)繪制二維散點(diǎn)圖,并對(duì)二者的相關(guān)性進(jìn)行分析。若GC3與GC12相關(guān)性顯著,說(shuō)明密碼子的使用偏好性主要受突變的影響;若兩者的相關(guān)性不顯著,說(shuō)明選擇對(duì)密碼子使用偏好性影響較大[30]。

1.3 ENc-plot繪圖分析

以ENc為縱坐標(biāo),GC3為橫坐標(biāo),進(jìn)行ENc繪圖分析,同時(shí),標(biāo)準(zhǔn)曲線根據(jù)公式ENc=2+GC3+29/[GC32+(1-GC3)2]計(jì)算獲得。若基因位點(diǎn)分布于標(biāo)準(zhǔn)曲線附近時(shí),密碼子使用偏好性主要受突變的影響;若基因位點(diǎn)分布遠(yuǎn)離標(biāo)準(zhǔn)曲線,則密碼子使用偏好性主要受到選擇的影響[31-32]。

1.4 PR2-plot分析

PR2-plot分析又名奇偶偏好(PR2)分析,在進(jìn)行PR2-plot圖分析中,以G3/(G3+C3)為橫坐標(biāo),A3/(A3+T3)為縱坐標(biāo)進(jìn)行繪圖分析。平面圖中每個(gè)基因的堿基組成顯示在一個(gè)平面上,中心點(diǎn)代表密碼子無(wú)偏使用時(shí)的狀態(tài),即A=T和C=G,并且其余點(diǎn)和中心點(diǎn)之間的矢量距離表示偏倚的程度和方向[33]。

1.5 對(duì)應(yīng)性分析

基于金銀花大毛花的50個(gè)葉綠體基因的RSCU值,將各個(gè)基因在一個(gè)59維的向量空間進(jìn)行分布[25-26]。使用SPSS 19.0軟件進(jìn)行對(duì)應(yīng)性分析,并對(duì)第一軸(primary shaft)與GC1、GC2、GC3、GC3s、GC、ENc和CAI的相關(guān)分析[34]。

1.6 最優(yōu)密碼子確定

以ENc為標(biāo)準(zhǔn),將金銀花大毛花50條蛋白編碼基因的ENc值進(jìn)行排序,分別從ENc最高值和最低值兩端選取10%作為高表達(dá)、低表達(dá)組,求兩者間的RSCU差值(ΔRSCU),同時(shí)將RSCU>1且ΔRSCU>0.08的密碼子定義為最優(yōu)密碼子[34]。

1.7 統(tǒng)計(jì)分析

使用SPSS 19.0 軟件進(jìn)行GC1、GC2、GC3、GC3s、GC、ENc、CAI等度量參數(shù)間的相關(guān)性分析。在中性圖分析時(shí),GC3與GC12之間的相關(guān)性,使用SPSS 19.0軟件進(jìn)行雙尾檢驗(yàn)[35]。

2 結(jié)果與分析

2.1 密碼子的組成特征

由表1可知,金銀花大毛花的葉綠體基因組去除重復(fù)序列和長(zhǎng)度小于300 bp的蛋白編碼序列后,共獲得50條蛋白編碼基因,編碼氨基酸序列長(zhǎng)度為64~798,平均長(zhǎng)度340。GC含量范圍在32.50%~46.04%,GC的平均含量為39.18%。其中,GC1>GC2>GC3,三者的平均含量分別為47.66%、39.82%和30.05%。表明金銀花大毛花葉綠體基因組的GC含量在密碼子3個(gè)位置上的分布并不均勻,存在密碼子使用偏好性。ENc是衡量密碼子使用偏好性的一個(gè)重要指標(biāo),其取值范圍為20~61,常以ENc值45作為區(qū)分偏好性強(qiáng)弱的標(biāo)準(zhǔn)。ENc值越低,說(shuō)明偏好性越強(qiáng);越高偏好性則越低。由表1可知,金銀花大毛花葉綠體基因組各基因的ENc值介于38.38~59.11,平均值為48.81,其中,基因的ENc值大于45就有42個(gè),表明金銀花大毛花葉綠體基因組密碼子的使用偏好性較弱。

由表2可知,相關(guān)分析結(jié)果顯示,GC1除了與ENc未達(dá)到顯著相關(guān)外,與GC2、GC3、GC3s、GC和CAI均達(dá)到顯著或極顯著水平,其相關(guān)系數(shù)分別0.385 1、0.336 5、0.373 4、0.826 7和0.441 2。GC也是除了與ENc未達(dá)到顯著相關(guān)外,與GC1、GC2、GC3、GC3s和CAI均達(dá)到顯著或極顯著水平,其相關(guān)系數(shù)分別0.826 7、0.747 1、0.559 1、0.572 3和0.342 9。GC3與GC3s達(dá)到極顯著水平,相關(guān)系數(shù)為0.951 3。這表明密碼子的堿基組成對(duì)金銀花大毛花葉綠體基因組密碼子的使用偏好性產(chǎn)生重要的影響,有必要進(jìn)一步進(jìn)行密碼子使用模式的探討。

表2 密碼子數(shù)各位置GC含量、數(shù)量與ENc值的相關(guān)性分析Table 2 Correlation analysis of GC content, quantity and ENc value of different position codon numbers

2.2 同義密碼子相對(duì)使用度分析

由表3可知,RSCU值分析表明,金銀花大毛花葉綠體基因組密碼子的RSCU變化范圍分別為0.33~1.81,最低RSCU值屬于編碼Leu的CTG,最高RSCU值屬于編碼Leu的TTA。RSCU>1.00的密碼子共有30個(gè)。其中,28個(gè)以A和T結(jié)尾,占93.33%,表明金銀花大毛花葉綠體基因組偏向于使用以A或T結(jié)尾的同義密碼子。

表3 金銀花大毛花葉綠體組的同義密碼子的使用頻率Table 3 The frequency of synonymous codons (RSCU) in chloroplast of Lonicera japonica cv. Damaohua

2.3 中性繪圖分析

如圖1所示,中性繪圖分析表明,GC12的取值范圍在0.347 9~0.550 4,GC3的取值范圍在0.228 0~0.376 2,基因分布于中線對(duì)角線上方,GC12與GC3的相關(guān)系數(shù)為0.258,雙尾檢驗(yàn)未達(dá)到顯著水平,回歸曲線斜率為0.328 7,表明這兩者之間的相關(guān)性很弱。因此,說(shuō)明選擇對(duì)金銀花大毛花葉綠體基因組密碼子使用偏好性的影響更大。

圖1 中性繪圖分析Fig.1 Neutrality plot analysis

2.4 ENc-plot 繪圖分析

如圖2所示,ENc的取值范圍為38.38~59.11,平均值為48.81;GC3s的取值范圍為0.197 7~0.360 8,平均值為0.269 6。圖2顯示,大部分基因分布在期望曲線附近,ENc實(shí)際值與ENc預(yù)期值之間的差異較小,說(shuō)明葉綠體基因組密碼子使用偏好性主要來(lái)源于突變的影響。

圖2 ENc與GC3s關(guān)聯(lián)分析Fig.2 Analysis of ENc and GC3s relationship

2.5 偏倚性分析

如圖3所示,各基因不均勻地分布于平面圖的4個(gè)區(qū)域內(nèi),并且基因在平面圖右下方分布較多。這表明金銀花大毛花葉綠體基因組密碼子第3位堿基使用G的頻率高于C,使用T的頻率高于A,密碼子的使用存在偏好性。因此,金銀花大毛花葉綠體基因組密碼子的使用不僅受到選擇的影響,還受到突變壓力的影響。

圖3 PR2 bias-plot 分析Fig.3 Analysis of PR2 bias

2.6 對(duì)應(yīng)性分析

基于金銀花大毛花的50個(gè)葉綠體基因的RSCU值的對(duì)應(yīng)性分析(COA)結(jié)果顯示,前4軸分別解釋了12.30%、10.40%、8.30%和7.30%的差異,4軸累積解釋的總差異為38.30%。說(shuō)明第一軸(Axis1)對(duì)金銀花大毛花葉綠體基因組密碼子偏好性的影響最大。此外,Axis1與GC1、GC2、GC3、GC3s、GC、ENc和CAI的相關(guān)系數(shù)分別為-0.026、0.208、-0.032、-0.096、0.084、-0.139和0.067,均未達(dá)到顯著水平。因此,表明除了選擇和突變外,還有更多的因素參與金銀花大毛花葉綠體基因組密碼子使用模式的形成。分別以第1軸和第2軸為橫坐標(biāo)、縱坐標(biāo),將各基因分布于平面上(圖4),可以看出,各基因分布較為分散,表明在金銀花大毛花葉綠體基因組中這些基因密碼子的使用模式差異較大。

圖4 基于 RSCU 的對(duì)應(yīng)性分析Fig.4 Corresponding analysis based on RSCU

2.7 基因表達(dá)水平對(duì)密碼子使用偏好性的影響

金銀花大毛花CAI的取值范圍為0.100~0.285 0,平均值為0.169(表1),表明金銀花大毛花的基因表達(dá)水平比較低。由表2可知,CAI與GC1以及GC的相關(guān)系數(shù)分別為0.441 2和0.342 9,均達(dá)到顯著或極顯著水平,表明基因表達(dá)水平對(duì)金銀花大毛花葉綠體基因組密碼子偏好性具有顯著的影響。GC1和GC含量高,并且基因表達(dá)水平高,密碼子使用偏好性的程度就越高。

2.8 最優(yōu)密碼子分析

根據(jù)高、低表達(dá)樣本庫(kù)中密碼子的RSCU值和ΔRSCU值來(lái)確定金銀花大毛花葉綠體基因組的最優(yōu)密碼子(表4),確定了5個(gè)最優(yōu)密碼子,分別為編碼異亮氨酸的ATA,編碼絲氨酸的TCT、TCA和AGT以及編碼甘氨酸的GGA。所有的最優(yōu)密碼子均以A/T結(jié)尾。

3 討論

密碼子使用偏好性是生物在長(zhǎng)期的進(jìn)化過(guò)程中形成的一個(gè)重要特征。其中,GC含量、GC3含量、GC3s含量和ENc等常被作為量化密碼子使用偏性的重要參數(shù)[5,21]。與核基因組相比,葉綠體基因組結(jié)構(gòu)穩(wěn)定,分子量小,具有高度保守性,尤其是GC含量在不同物種之間大多比較保守。前人研究發(fā)現(xiàn),在葉綠體基因組中,基因的GC含量一般低于40%,如擬南芥(37.10%)、玉米(39.60%)、陸地棉(37.89%)、刺榆(37.32%)、草果(36.0%)、杧果(37.9%)[23-24];且GC含量在同一屬不同物種之間也大多比較保守,如豆蔻屬(37.22%~37.31%)、旋覆花屬(37.71%~37.72%)、忍冬屬(38.31%~38.59)、牡丹屬(38.3%~38.4%)、鼠尾草屬(36.20%~37.99%)[10,12-13,25]。本研究金銀花大毛花葉綠體基因組GC含量為39.18%,GC1、GC2和GC3含量分別為47.66%、39.82%和30.05%,ENc值為48.81。因此,金銀花大毛花葉綠體基因組密碼子的使用偏好性較弱。同時(shí),篩選出金銀花大毛花葉綠體基因組中RSCU>1有30個(gè)密碼子,其中28個(gè)密碼子以A/T結(jié)尾。金銀花大毛花葉綠體基因組密碼子偏好A/T結(jié)尾。在陸地棉[23]、杧果[24]等雙子葉植物中也存在這種現(xiàn)象,單子葉植物和雙子葉植物之間的密碼子使用偏性具有物種特異性。單子葉植物密碼子使用偏好以G/C結(jié)尾,甲基化水平是影響單子葉植物的密碼子使用偏好G/C結(jié)尾的重要原因[36]。

此外,突變和選擇壓力是影響密碼子使用偏好性的重要因素。在不同植物之間葉綠體基因組密碼子偏好性,受到影響因素也有所不同。豆蔻屬[25]、杓蘭[11]、杧果[24]、翠雀[30]、涼粉草[37]主要是受到選擇的作用;而籽粒莧[26]、沙棘[35]、咖啡[38]和銀白楊[39]主要是受到突變的作用;蝴蝶蘭[22]、陸地棉[23]則受到突變和選擇等多重因素的共同影響。結(jié)合中性繪圖分析、ENc-plot分析和PR2-plot分析發(fā)現(xiàn),金銀花大毛花葉綠體基因組密碼子使用偏好性受到突變和選擇等諸多因素的共同影響。密碼子使用模式可能影響基因的表達(dá),并且基因表達(dá)水平越高,密碼子偏好性越強(qiáng),這與前人的研究結(jié)果一致[6]。

目前對(duì)于最優(yōu)密碼子的界定標(biāo)準(zhǔn),報(bào)道并不完全一致。有些學(xué)者以ENc值大小,各取10%建立高低樣本庫(kù),計(jì)算兩個(gè)樣本組密碼子的ΔRSCU值獲得[11,23,26,37];而另一些學(xué)者按CAI值大小排列,各選出5%建立高低表達(dá)庫(kù),計(jì)算兩組的ΔRSCU值求得[40]。兩種方法均能獲得比較好的研究結(jié)果。由于最優(yōu)密碼子采用的界定標(biāo)準(zhǔn)不同,這也是造成最優(yōu)密碼子及其數(shù)量在不同物種間又有所不同的重要原因。本研究共篩選出5個(gè)最優(yōu)密碼子,且密碼子均以A或T結(jié)尾。這一現(xiàn)象與已見(jiàn)報(bào)道的絕大多數(shù)藻類(lèi)和高等植物葉綠體基因的最優(yōu)密碼子結(jié)果相一致[34],這與葉綠體基因組保守性有關(guān)。本研究確定了金銀花大毛花葉綠體基因組的最優(yōu)密碼子,可為基因工程中外源基因的密碼子改造及其表達(dá)研究提供重要的參考。

猜你喜歡
毛花密碼子葉綠體
密碼子與反密碼子的本質(zhì)與拓展
毛花苷丙與胺碘酮治療快速型心房纖顫伴急性左心衰的效果對(duì)比
10種藏藥材ccmFN基因片段密碼子偏好性分析
中成藥(2018年7期)2018-08-04 06:04:10
毛花獼猴桃葉的鑒別研究
南方紅豆杉葉綠體非編碼序列PCR體系優(yōu)化及引物篩選
嗜酸熱古菌病毒STSV2密碼子偏嗜性及其對(duì)dUTPase外源表達(dá)的影響
花椰菜 “毛花”成因初探
茶樹(shù)葉綠體DNA的PCR-RFLP反應(yīng)體系優(yōu)化
煙草葉綠體密碼子的偏好性及聚類(lèi)分析
鈣過(guò)量對(duì)茶樹(shù)光合特性及葉綠體超微結(jié)構(gòu)的影響
刚察县| 开阳县| 巢湖市| 黑龙江省| 新巴尔虎右旗| 溧水县| 西乡县| 阿拉善右旗| 行唐县| 平原县| 景泰县| 宿迁市| 济源市| 浦北县| 黄平县| 西安市| 南宫市| 汾阳市| 晋州市| 城步| 温泉县| 赤城县| 塔河县| 新疆| 若羌县| 故城县| 嘉义县| 上思县| 林西县| 郁南县| 探索| 筠连县| 唐海县| 赣榆县| 常宁市| 宽城| 逊克县| 乐陵市| 宁德市| 邵武市| 乌拉特前旗|