龔明貴 白娜 李影 姜霞
摘要:以硬頭黃竹葉綠體基因組為研究對象,使用CodonW、CUSP以及R語言等軟件分析密碼子偏好性形成的主要原因。結(jié)果表明:(1)硬頭黃竹葉綠體基因組密碼子的平均GC含量為39.59%,且GC1>GC2>GC3,表明密碼子偏好使用以A/U結(jié)尾的堿基;(2)硬頭黃竹大多數(shù)有效密碼子數(shù)(ENC)在35以上,適應(yīng)指數(shù)(CAI)為0.166,說明其密碼子偏好性較弱;(3)中性繪圖分析、ENC-plot和PR2-plot分析表明,自然選擇對硬頭黃竹葉綠體基因組密碼子使用偏好性產(chǎn)生重要影響;(4)最終篩選出硬頭黃竹葉綠體基因組有GCA、GCU、GAU、GGU及AAA等14個最優(yōu)密碼子,多數(shù)以A/U結(jié)尾。本研究結(jié)果可為硬頭黃竹葉綠體基因組水平上的研究提供依據(jù)。
關(guān)鍵詞:硬頭黃竹;密碼子偏好性;葉綠體基因組;最優(yōu)密碼子
中圖分類號:S188? 文獻(xiàn)標(biāo)志碼:A
文章編號:1002-1302(2024)03-0067-06
葉綠體是植物體內(nèi)進(jìn)行能量轉(zhuǎn)換和光合作用的場所[1]。植物葉綠體中含有一套獨(dú)立的遺傳物質(zhì),其規(guī)模小、拷貝數(shù)多、遺傳特性穩(wěn)定,且含有大量的遺傳信息[2]。葉綠體基因組編碼與光合作用有關(guān)的蛋白質(zhì),含有豐富的遺傳信息[3]。密碼子是維系蛋白質(zhì)與DNA之間的橋梁,也是識別和傳遞生物體遺傳信息的載體[4]。密碼子的使用偏好性是指不同種類的生物在蛋白質(zhì)翻譯過程中傾向于使用特定的簡并密碼子的現(xiàn)象[5]。在物種演變過程中,密碼子的使用偏好性體現(xiàn)為受到自然選擇和突變的影響不同[6]。不同物種密碼子的偏好性有較大差異,因此,對物種密碼子偏好性的分析,可為利用基因工程技術(shù)改良植物等研究奠定理論基礎(chǔ)[7]。
硬頭黃竹(Bambusa rigida)屬于竹亞科簕竹屬的中型叢生竹種,其適應(yīng)性強(qiáng)、產(chǎn)量高,是優(yōu)質(zhì)紙漿原料,桿材堅(jiān)固厚實(shí),經(jīng)濟(jì)價(jià)值高[8],在我國廣東、貴州、四川、廣西、江西等省大量分布[9]。目前,未曾有針對硬頭黃竹葉綠體基因組密碼子使用偏好性的研究報(bào)道,本研究以硬頭黃竹葉綠體基因組序列為研究對象,對其密碼子偏好性使用模式進(jìn)行分析,以期得到影響硬頭黃竹葉綠體基因組密碼子偏好性的主要因素,并篩選出其最優(yōu)密碼子,為后續(xù)葉綠體基因工程中提高外源基因在載體內(nèi)表達(dá)等研究提供理論基礎(chǔ)。
1 材料與方法
1.1 葉綠體基因組序列的獲取
從NCBI數(shù)據(jù)庫中獲取硬頭黃竹葉綠體基因組編碼區(qū)的CDS序列,硬頭黃竹(GenBank登錄號:MT648824.1)有84條CDS序列。為了減少取樣誤差,利用生物信息學(xué)軟件(Geneious)剔除長度<300 bp 的CDS序列,最終硬頭黃竹保留56條CDS序列用于后續(xù)分析。
1.2 分析方法
1.2.1 密碼子組成分析
運(yùn)用CodonW 1.4.2計(jì)算有效密碼子數(shù)(ENC)和適應(yīng)指數(shù)(CAI)等。通過在線軟件CUSP計(jì)算密碼子第1、2、3位堿基的GC含量(GC1、GC2、GC3)以及平均GC含量(GCall),然后利用SPSS 25.0、Excel 2019及R語言等數(shù)據(jù)處理軟件對數(shù)據(jù)進(jìn)行分析處理。
1.2.2 相對同義密碼子使用度分析
運(yùn)用CodonW 1.4.2對同義密碼子相對使用度(RSCU)進(jìn)行計(jì)算分析,RSCU值是指該密碼子的實(shí)際使用頻率與其理論使用頻率的比值[10]。若密碼子的使用沒有偏好性,則RSCU=1。當(dāng)RSCU>1時,表明該密碼子為使用較多的密碼子,反之亦然。
1.2.3 中性繪圖分析
中性繪圖分析可對影響葉綠體基因組密碼子使用偏好性的主要因素進(jìn)行首次分析判斷。以GC3為x坐標(biāo),GC12(GC1和GC2的平均值)為y坐標(biāo),利用Excel 2019繪制散點(diǎn)圖,對GC3和GC12的相關(guān)性進(jìn)行分析。若回歸系數(shù)接近于1,則GC12和GC3相關(guān)性顯著,3個位置堿基組成相似,說明基因突變是影響密碼子使用偏好性的主要因素,反之,3個位置堿基組成有較大差別,則說明自然選擇是主要因素。
1.2.4 ENC-plot繪圖分析
ENC-plot繪圖分析用于判斷突變在密碼子使用偏好性中的影響,可將密碼子偏好性情況進(jìn)行圖片可視化。散點(diǎn)圖和曲線圖組成ENC-plot分析圖,以GC3為x坐標(biāo),ENC值為y坐標(biāo),利用R語言構(gòu)建散點(diǎn)圖,并在散點(diǎn)圖中添加ENC值的標(biāo)準(zhǔn)曲線,標(biāo)準(zhǔn)曲線公式:ENC=2+GC3+29/[GC23+(1-GC3)2][11]。若基因位點(diǎn)靠近或在標(biāo)準(zhǔn)曲線上,則密碼子使用偏好性主要由突變決定;若基因位點(diǎn)遠(yuǎn)離標(biāo)準(zhǔn)曲線,則主要由自然選擇決定。
1.2.5 PR2-plot偏倚分析
計(jì)算各基因中密碼子的第3位上A、T、C、G的含量,以G3/(G3+C3)為x坐標(biāo),A3/(A3+T3)值為y坐標(biāo),繪制散點(diǎn)圖并對其進(jìn)行分析,圖中的中心點(diǎn)代表A和T、C和G的使用頻率一樣,表明密碼子使用偏好性是由基因突變造成的[12]。
1.2.6 最優(yōu)密碼子分析
將ENC值作為衡量密碼子偏好性的重要指標(biāo),ENC值與密碼子的偏好性呈負(fù)相關(guān),選取升序排列后的ENC值的前后兩端各10%的基因,并以此為基礎(chǔ)建立高、低表達(dá)基因庫[13]。根據(jù)CodonW軟件計(jì)算2個表達(dá)庫中密碼子的RSCU值和ΔRSCU值(ΔRSCU=RSCU高表達(dá)-RSCU低表達(dá)),同時滿足高頻密碼子和高表達(dá)密碼子(ΔRSCU≥0.08)2個條件的為最優(yōu)密碼子。
2 結(jié)果與分析
2.1 密碼子組成分析
運(yùn)用CUSP和CodonW 1.4.2分析硬頭黃竹葉綠體基因組CDS序列的堿基組成(表1),硬頭黃竹的T3S、A3S、C3S、G3S分別為44.98%、41.81%、18.30%、18.11%,T3S和A3S遠(yuǎn)高于G3S和C3S,表明硬頭黃竹葉綠體基因組密碼子的第3位堿基以A/U結(jié)尾為主。硬頭黃竹的ENC值為50.60,適應(yīng)指數(shù)(CAI)為0.166,表明硬頭黃竹葉綠體基因組密碼子偏好性比較弱。
硬頭黃竹葉綠體基因組密碼子的平均GC含量為39.59%,且GC1(47.50%)>GC2(39.89%)>GC3 (31.38%)(表1),ENC值的范圍為39.04~61.00,共有49條CDS序列的ENC值大于45,在密碼子上GC未均勻分布(表2)。根據(jù)ENC值及3個位置的GC含量的相關(guān)性分析(表3)發(fā)現(xiàn):ENC值與GC1、GC2相關(guān)性不顯著,與GC3相關(guān)性極顯著,說明密碼子使用偏好性形成中GC3的影響作用大于GC1、GC2。
2.2 相對同義密碼子使用度分析
對硬頭黃竹葉綠體基因組蛋白編碼序列RSCU分析(表4)表明,在硬頭黃竹中編碼亮氨酸(Leu)的密碼子UUA表現(xiàn)最明顯,其RSCU值為1.93,其次是編碼丙氨酸(Ala)的密碼子GCU和編碼精氨酸(Arg)的AGA,兩者的RSCU值都是1.73。表中為硬頭黃竹葉綠體基因組密碼子56條CDS序列的RSCU值,從中篩選出32個高頻密碼子,其中以A、U、C、G結(jié)尾的密碼子分別有13、16、2、1個,說明硬頭黃竹葉綠體基因組密碼子偏好以A和U結(jié)尾。
2.3 中性繪圖分析
中性繪圖分析結(jié)果(圖1)表明,硬頭黃竹GC12、GC3的數(shù)值范圍分別為32.68%~52.03%、23.42%~51.11%。Pearson相關(guān)系數(shù)分別為0.314、0.138,進(jìn)一步說明GC12和GC3的相關(guān)性不顯著?;貧w系數(shù)分別為0.265 8、0.412 8,說明硬頭黃竹受自然選擇影響壓力較大。
2.4 ENC-plot繪圖分析
ENC值的大小可表明密碼子偏好性的強(qiáng)弱,ENC>35表明密碼子偏性弱[14]。分析結(jié)果(圖2)
顯示,硬頭黃竹葉綠體基因組的ENC值基本上都>35,說明其密碼子偏好性較弱。硬頭黃竹只有少數(shù)基因位于期望曲線上或其附近,實(shí)際ENC值和預(yù)期ENC值相差不大,說明該部分基因的密碼子偏好性主要受突變的影響;多數(shù)基因離標(biāo)準(zhǔn)曲線距離較遠(yuǎn),實(shí)際ENC值和預(yù)期ENC值有差距,說明該部分基因的密碼子偏好性主要受自然選擇的影響。分析結(jié)果顯示,硬頭黃竹的葉綠體基因組密碼子偏好性主要受到自然選擇的影響。
2.5 PR2-plot繪圖分析
對硬頭黃竹葉綠體基因組的第3位堿基T3/A3和G3/C3的關(guān)系進(jìn)行奇偶校驗(yàn)分析。PR2-plot分析結(jié)果(圖3)顯示,基因位點(diǎn)在平面圖4個區(qū)域內(nèi)分布并不均勻,在A3/(A3+T3)<0.5和G3/(G3+C3)>0.5區(qū)域范圍內(nèi)分布最多,表明第3位堿基使用頻率為T>A、G>C,表明密碼子的第3位堿基在選擇上具有偏好性,同時說明硬頭黃竹葉綠體基因組密碼子的使用主要受自然選擇的影響。
2.6 最優(yōu)密碼子的確定
對硬頭黃竹的ENC值進(jìn)行升序排列,前10%為高表達(dá)基因,后10%為低表達(dá)基因,從硬頭黃竹葉綠體基因組中得到6個高表達(dá)基因rps18、rpl16、psbA、rps14、petB、ndhA和6個低表達(dá)基因rpl2、ycf3、cemA、ndhE、atpE、infA。對RSCU和ΔRSCU進(jìn)行計(jì)算(表5),硬頭黃竹葉綠體基因組有32個高頻密碼子,篩選出GCU、GAU等20個高表達(dá)密碼子,最終確定14個密碼子作為硬頭黃竹葉綠體基因組的最優(yōu)密碼子,分別為GCA、GCU、GAU、GGU、AAA、UUA、CCA、CCU、CGA、CGU、UCC、ACU、GUA、GUU,這13個最優(yōu)密碼子13個以A/U結(jié)尾,1個以C結(jié)尾。
3 討論與結(jié)論
基因組數(shù)據(jù)為密碼子偏好性的分析提供有力支撐,堿基的組成情況也會影響密碼子的偏好性,密碼子的使用偏好性會受到自然選擇或突變的影響[15-16]。本研究對硬頭黃竹葉綠體基因組密碼子進(jìn)行使用偏好性分析,篩選出了56條CDS序列,分析表明GC1>GC2>GC3,可見密碼子在3個位置上的分布并不均勻,密碼子偏好使用以A或U結(jié)尾的堿基。這與復(fù)羽葉欒樹(Koelreuteria bipinnata Franch.)[17]和千果欖仁(Terminalia myriocarpa van Huerck et Muell.-Arg.)[18]等植物葉綠體基因組密碼子偏好性較為相似,也說明這些植物葉綠體基因組密碼子的使用模式相似且高度保守。利用ENC值可以判斷密碼子偏好性的程度,當(dāng)ENC>35時,說明密碼子偏好性比較弱;反之,說明偏好性強(qiáng)[19],本研究得出硬頭黃竹葉綠體基因組中多數(shù)ENC值>35,表明硬頭黃竹葉綠體基因組密碼子使用偏好性較弱。
為了更清楚影響密碼子使用偏好性的因素,本研究對硬頭黃竹葉綠體基因組密碼子進(jìn)行了中性繪圖、ENC-plot以及PR2-plot分析。在中性繪圖分析中,硬頭黃竹的回歸系數(shù)為0.265 8,說明硬頭黃竹更多受到自然選擇的影響;在ENC-plot分析中,硬頭黃竹的多數(shù)基因離標(biāo)準(zhǔn)曲線距離較遠(yuǎn),實(shí)際ENC值和預(yù)期ENC值存在差異,表明了這些基因的密碼子偏好特性主要受自然選擇的制約;在PR2-plot繪圖分析中,硬頭黃竹葉綠體基因組的大部分基因都在平面圖的右下方,這表明4個堿基的使用頻率不同,即T>A、G>C,同時表明硬頭黃竹葉綠體基因組密碼子的使用更多的是受自然選擇的影響。結(jié)合以上分析得出結(jié)論:影響硬頭黃竹葉綠體基因組密碼子偏好性的主要原因是自然選擇。這與美國紅梣(Fraxinus pennsylvanica Marsh.)[20]、降香黃檀(Dalbergia odorifera)[19]以及云南油杉(Keteleeria evelyniana)[21]等植物研究結(jié)果基本一致。但在乳油木(Vitellaria paradoxa C.F. Gaertn)[22]和銀白楊(Populus alba)[23]等植物中影響密碼子偏好性的因素主要為突變,說明密碼子的使用偏好性受選擇和突變等多種因素影響。
本研究利用RSCU、ENC值篩選出GCA、GCU、GAU以及GGU等14個最優(yōu)密碼子,最優(yōu)密碼子大部分以A或U結(jié)尾。在硬頭黃竹與抽筒竹[24]、毛竹[25]等其他禾本科植物的葉綠體基因組密碼子偏好性的比較中,具有高度一致的密碼子偏好性及使用模式,都是以A或U結(jié)尾。然而,在毛竹全基因組的最優(yōu)密碼子多以G、C結(jié)尾,這與硬頭黃竹葉綠體基因組中的最優(yōu)密碼子不同,可反映出核基因組和葉綠體基因組在密碼子偏好性方面不同。
本研究基于硬頭黃竹葉綠體基因組CDS序列,對硬頭黃竹的葉綠體基因組進(jìn)行密碼子組成、中性繪圖、PR2-plot繪圖及ENC-plot繪圖等分析比較,最終得出自然選擇為影響硬頭黃竹葉綠體基因組密碼子的使用偏性的主要因素。篩選出硬頭黃竹葉綠體基因組有14個最優(yōu)密碼子,為后續(xù)硬頭黃竹葉綠體基因工程中提高外源基因在載體內(nèi)的表達(dá)等研究提供理論基礎(chǔ)。
參考文獻(xiàn):
[1]丁 銳,胡 兵,宗小雁,等. 杓蘭葉綠體基因組密碼子偏好性分析[J]. 林業(yè)科學(xué)研究,2021,34(5):177-185.
[2]Wright F.The ‘effective number of codons used in a gene[J]. Gene,1990,87(1):23-29.
[3]畢毓芳,溫 星,潘雁紅,等. 葉綠體DNA條形碼在林木中的應(yīng)用及研究進(jìn)展[J]. 分子植物育種,2020,18(16):5444-5452.
[4]周 濤,楊 林,舒軍霞,等. 3種含笑屬植物葉綠體基因組密碼子偏好性分析[J]. 西部林業(yè)科學(xué),2022,51(3):91-100.
[5]Dang Y K,Dong Y Y,Ren G P. Codon codes:codon usage bias influences many levels of gene expression[J]. Scientia Sinica Vitae,2019,49(7):839-847.
[6]趙 英,付海天,金 剛,等. 木薯葉綠體基因組密碼子偏好性分析[J]. 江西農(nóng)業(yè)學(xué)報(bào),2022,34(4):46-52.
[7]辛雅萱,黎若竹,李 鑫,等. 杧果葉綠體基因組密碼子使用偏好性分析[J]. 中南林業(yè)科技大學(xué)學(xué)報(bào),202 1(9):148-156,165.
[8]王路君,蔡春菊,唐曉鹿,等. 硬頭黃竹地上生物量分配特征及模型構(gòu)建[J]. 南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),202 5(1):189-196.
[9]何 川,劉 渝. 硬頭黃竹竹材物理力學(xué)性質(zhì)研究[J]. 世界竹藤通訊,2012,10(3):19-22.
[10]毛立彥,黃秋偉,龍凌云,等. 7種睡蓮屬植物葉綠體基因組密碼子偏好性分析[J]. 西北林學(xué)院學(xué)報(bào),2022,37(2):98-107.
[11]楊 林,譚 萍,姜月影,等. 3種木蓮屬瀕危藥用植物葉綠體基因組密碼子偏好性分析[J]. 中國中醫(yī)藥信息雜志,2022,29(8):93-99.
[12]唐曉芬,陳 莉,馬玉韜. 密碼子使用偏性量化方法研究綜述[J]. 基因組學(xué)與應(yīng)用生物學(xué),2013,32(5):660-666.
[13]尚明照,劉 方,華金平,等. 陸地棉葉綠體基因組密碼子使用偏性的分析[J]. 中國農(nóng)業(yè)科學(xué),201 4(2):245-253.
[14]Jiang Y,Deng F,Wang H L,et al. An extensive analysis on the global codon usage pattern of baculoviruses[J]. Archives of Virology,2008,153(12):2273-2282.
[15]李顯煌,楊生超,辛雅萱,等. 燈盞花葉綠體基因組密碼子偏好性分析[J]. 云南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)),2021,36(3):384-392.
[16]侯 哲,婁曉鳴,李 昂,等. 11種唐松草屬(Thalictrum)rbcL基因的密碼子偏好性研究[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(3):46-53.
[17]肖明昆,聶愷宏,沈紹斌,等. 復(fù)羽葉欒樹葉綠體基因組密碼子偏好性分析[J]. 西南林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)),2023,43(3):56-63.
[18]余 瀟,趙振寧,杜 春.千果欖仁葉綠體基因組特征及密碼子偏好性分析[J]. 山西農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,42(6):81-92.
[19]原曉龍,李云琴,張勁峰,等. 降香黃檀葉綠體基因組密碼子偏好性分析[J]. 廣西植物,202 1(4):622-630.
[20]柳燕杰,田旭平,李 倩. 美國紅梣葉綠體基因組密碼子偏好性分析[J]. 江蘇農(nóng)業(yè)科學(xué),2020,48(15):83-88.
[21]李江飛,王 瑜,顏廷雨,等. 云南油杉葉綠體基因組密碼子偏好性分析[J]. 中南林業(yè)科技大學(xué)學(xué)報(bào),2022,42(4):30-39.
[22]原曉龍,李云琴,張勁峰,等. 乳油木葉綠體基因組密碼子偏好性分析[J]. 分子植物育種,2020,18(17):5658-5664.
[23]Raubeson L A,Peery R,Chumley T W,et al. Comparative chloroplast genomics:analyses including new sequences from the angiosperms Nuphar advena and Ranunculus macranthus[J]. BMC Genomics,2007,8:174.
[24]李江平,秦 政,國春策,等. 抽筒竹葉綠體基因組的密碼子偏好性分析[J]. 竹子學(xué)報(bào),2019,38(2):79-87.
[25]黃笑宇,許在恩,郭小勤.基于全基因組的毛竹同義密碼子使用偏好性分析[J]. 浙江農(nóng)林大學(xué)學(xué)報(bào),2017,34(1):120-128.