国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

馬尾松轉(zhuǎn)錄組密碼子使用偏好性及其影響因素*

2020-06-02 03:52朱沛煌朱靈芝季孔庶
林業(yè)科學(xué) 2020年4期
關(guān)鍵詞:異源密碼子堿基

朱沛煌 陳 妤 朱靈芝 李 榮 季孔庶

(南京林業(yè)大學(xué) 林木遺傳與生物技術(shù)省部共建教育部重點實驗室 南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心 南京 210037)

密碼子(codon)是中心法則的重要組成部分,同時也是生物遺傳和變異的最基本單元。4種堿基排列組成的三聯(lián)體密碼子共有64個,除3個終止密碼子外,其余61個密碼子編碼構(gòu)成天然蛋白質(zhì)的20種氨基酸,對應(yīng)同一種氨基酸的多個密碼子,稱為同義密碼子(賴瑞聯(lián)等,2019)。生物體對同義密碼子的使用并非完全隨機,而是具有密碼子使用偏好性(codon usage bias,CUB)。不同物種、器官、核基因與細(xì)胞器基因之間都存在不同的密碼子使用偏好模式,選擇不同同義密碼子,密碼子不會改變氨基酸序列,但可以影響蛋白表達水平(劉慧等,2017)。

馬尾松(Pinusmassoniana)是中國南方廣泛分布的用材樹種,同時又是分布最廣泛的產(chǎn)脂樹種(楊章旗,2015)。馬尾松生長速度快,纖維含量高,纖維結(jié)構(gòu)優(yōu)良,常被用于紙漿原料(吳曉剛等,2019)。中國松脂產(chǎn)量占全球總產(chǎn)量的60%以上,馬尾松松脂產(chǎn)量約占中國松脂總產(chǎn)量的90%,是中國林業(yè)在全球最有影響力的大宗出口工業(yè)產(chǎn)品(吳東山等,2019)。此外,馬尾松在森林資源發(fā)展以及森林生態(tài)服務(wù)功能等方面也發(fā)揮著重要作用,具有巨大的生態(tài)價值(楊章旗等,2012)。國家“十一五”計劃以來,眾多學(xué)者在馬尾松分子遺傳育種領(lǐng)域進行了研究,馬尾松生長發(fā)育相關(guān)基因PmRCA、PmFLO/LFY等(潘婷等,2015;郭天瑋等,2015),材性相關(guān)基因PmCAD、PmCOMT等(張逢凱等,2014;吳曉剛等,2019),產(chǎn)脂相關(guān)基因PmAPS等(王穎等,2014),松材線蟲抗性相關(guān)基因PmACRE等(李慧敏等,2018)相繼被克隆和鑒定。由于目前馬尾松轉(zhuǎn)基因技術(shù)平臺建立遇到了瓶頸,其相關(guān)研究只能借助其他異源物種,如煙草(Nicotianatabacum)和擬南芥(Arabidopsisthaliana)等(郭天瑋等,2015;陳曉明等,2018),且無法預(yù)測馬尾松功能基因在異源物種中的表達效率高低。因此,對馬尾松和異源轉(zhuǎn)化物種同義密碼子使用頻率的了解有利于功能基因在異源物種細(xì)胞中高效率表達,從而為馬尾松分子育種領(lǐng)域的瓶頸問題突破提供幫助。以轉(zhuǎn)錄組為基礎(chǔ)的馬尾松密碼子偏好性研究目前尚未見報道,其他針葉樹種密碼子偏好性相關(guān)研究亦罕見報道,本研究可為馬尾松及其他針葉樹種功能基因的異源表達提供一定的指導(dǎo)作用。

本研究以王曉峰等(2013)馬尾松轉(zhuǎn)錄組數(shù)據(jù)(National Omics Data Encyclopedia:OEZ004657)為基礎(chǔ),利用CodonW、EMBOSS軟件對馬尾松轉(zhuǎn)錄組密碼子使用偏好特征及其偏好性形成的影響因素進行分析,以期為馬尾松分子育種提供支持。

1 材料與方法

1.1 植物材料

選取南京林業(yè)大學(xué)苗圃7年生馬尾松的嫩葉和嫩莖作為植物材料,提取總RNA并通過Illumina平臺進行RNA-seq高通量測序與數(shù)據(jù)分析。參考張?zhí)?2017)編寫的Perl程序,從組裝的CDS(coding sequence 編碼序列)序列中篩選出長度大于300 bp,以ATG起始并以TGA、TAG或TAA結(jié)尾的編碼蛋白質(zhì)的完整CDS序列。擬南芥、煙草、歐洲山楊(Populustremula)、釀酒酵母(Saccharomycescerevisiae)、大腸桿菌(Escherichiacoli)的密碼子使用頻率數(shù)據(jù)來源于在線數(shù)據(jù)庫Codon Usage Database(http: //www.kazusa.or.jp/codon/)。

1.2 方法

1.2.1 密碼子使用偏好性參數(shù)分析 利用CodonW1.4.4軟件與EMBOSS在線軟件的CUSP程序(http: //emboss.toulouse.inra.fr/cgi-bin/emboss/cusp)分析馬尾松轉(zhuǎn)錄組密碼子使用偏好性數(shù)據(jù),包括:密碼子3個位置的GC含量(GC1s、GC2s、GC3s)、密碼子適應(yīng)指數(shù)(codon adaptative index,CAI)、密碼子偏好指數(shù)(codon bias index,CBI)、密碼子使用頻率(frequency of codon usage)、有效密碼子數(shù)目(effective number of codon,ENc)以及同義密碼子相對使用度(relative synonymous codon usage,RSCU)。

1.2.2 中性繪圖分析 密碼子3個位置發(fā)生突變導(dǎo)致的結(jié)果并不一致,第1、2位上發(fā)生的突變通常是非同義突變,可能導(dǎo)致蛋白質(zhì)功能改變,而第3位上的突變通常是同義突變(劉慧等,2017)。中性繪圖分析(neutrality plot)以各CDS密碼子第1、2位平均GC含量GC12為縱坐標(biāo),GC3s為橫坐標(biāo),通過GC12和GC3s的相關(guān)性來分析密碼子使用偏好性形成的主要因素。如果GC12和GC3s相關(guān)性顯著,即密碼子3個位置堿基組成無差異,說明密碼子偏好性形成主要受突變影響;反之,密碼子第3位堿基組成與第1、2位有差異,說明密碼子偏好性形成主要受自然選擇的影響。

1.2.3 ENc-GC3s關(guān)聯(lián)分析 ENc-GC3s關(guān)聯(lián)分析以各CDS的ENc值為縱坐標(biāo)、GC3s為橫坐標(biāo),通過對各CDS實際ENc值與根據(jù)其GC3s計算的理論ENc值(Wright,1990)比較,分析密碼子偏好性形成的主要原因。如果CDS點分布在標(biāo)準(zhǔn)曲線附近,一般認(rèn)為其密碼子偏好性主要受突變影響,若CDS點遠(yuǎn)離標(biāo)準(zhǔn)曲線,一般認(rèn)為其密碼子偏好性主要受自然選擇影響。ENc理論值公式:ENc=2+GC3s+29/[GC3s2+(1-GC3s)2]。

1.2.4 偏倚分析 偏倚分析(PR2-plot analysis)以A3s/(A3s+T3s)為縱坐標(biāo)、G3s/(G3s+C3s)為橫坐標(biāo),通過對各CDS點與坐標(biāo)圖中心點(0.5,0.5)的距離分布分析密碼子第3位上偏好性形成的主要原因。若CDS點距離中心點近,通常認(rèn)為密碼子第3位偏好性主要受突變影響,反之更可能受到自然選擇影響。

1.2.5 最優(yōu)密碼子分析 根據(jù)各CDS的ENc值排序,選擇上下限10%各559個CDS作為高低表達樣本計算并比較RSCU值,選擇ΔRSCU(高低表達樣本RSCU的差值)大于0.08且RSCU在高表達基因子集中大于1.0的密碼子作為最優(yōu)密碼子(Jiangetal.,2008;劉慧敏等,2016;胡福初等,2017)。

1.2.6 密碼子頻率分析 密碼子使用頻率是異源表達基因的重要參考因素,密碼子偏好性差異過大將影響表達效率(Qinetal.,2013)。通過2種生物密碼子使用頻率的比值,可以分析其密碼子偏好性差異,從而確定是否適合進行異源表達。

2 結(jié)果與分析

2.1 序列篩選與密碼子偏好性分析

利用Perl腳本從馬尾松轉(zhuǎn)錄組拼接序列中篩選獲得5 592條符合要求的CDS序列,共包含2 350 008個密碼子,并利用CodonW、EMBOSS軟件對篩選后的CDS序列進行密碼子偏好性分析。結(jié)果表明,所有CDS序列的GC1s、GC2s、GC3s分別為51.91%、41.42%、38.95%,平均GC含量為44.09%,其中有5 007條CDS的平均GC含量在40%~50%,占總數(shù)的89.54%,表明馬尾松編碼蛋白質(zhì)的密碼子比較偏好A/T堿基;3個密碼子位置的GC含量由高到低依次為 GC1s>GC2s>GC3s,并且其中GC3s含量在30%~50%的序列占所有CDS的94.28%,GC3s平均值更低于40%,表明馬尾松密碼子3個位置的堿基組成并不均衡,密碼子第3位尤為偏好A/T堿基。

理論ENc值范圍在20~61之間,ENc值越趨近20,說明同義密碼子選擇范圍越小,密碼子越具有偏倚性,反之說明密碼子偏倚性越小。Wright(1990)和Jiang等(2008)將ENc值35作為偏倚性強弱分別的標(biāo)準(zhǔn)。馬尾松各CDS的ENc值范圍在27.08~61之間,ENc值小于35的CDS序列僅有5條,ENc值大于47的CDS序列占到總數(shù)的92.90%,說明馬尾松轉(zhuǎn)錄本CDS密碼子總體上偏倚性較小。

CDS序列所有密碼子中,RSCU≥1的密碼子有32個,其中第3位為G/C的只有5個,而第3位為A/T的為27個,說明馬尾松第3位是A/T的密碼子出現(xiàn)頻率更高,是馬尾松偏好的密碼子,而大部分G/C結(jié)尾的密碼子是馬尾松非偏好密碼子。

2.2 中性繪圖分析

中性繪圖分析結(jié)果如圖1所示,CDS點大都集中于回歸曲線附近(y=-0.008 4x+0.480 2),GC12與GC3s 相關(guān)性系數(shù)為-0.008 4(r2=0.000 3),密碼子3個位置上的堿基組成差異極小,第1、2位密碼子與第3位密碼子堿基組成幾乎沒有相關(guān)性,表明馬尾松轉(zhuǎn)錄組密碼子使用偏好性主要受突變壓力影響。

圖1 馬尾松轉(zhuǎn)錄組中性繪圖分析

2.3 ENc-GC3s關(guān)聯(lián)分析

ENc-GC3s關(guān)聯(lián)分析結(jié)果如圖2所示,馬尾松大部分CDS點沿理論ENc值標(biāo)準(zhǔn)曲線分布或落在附近,表明這些基因?qū)嶋HENc值與理論ENc值相近,密碼子偏好性較弱,主要受突變壓力影響;另外有少數(shù)CDS點落在理論ENc值曲線的下方,即其實際ENc值與理論ENc值差異較大,其密碼子偏好性形成更可能受自然選擇影響,通過與GenBank數(shù)據(jù)庫比對發(fā)現(xiàn)這些基因主要包括NADH脫氫酶亞基、鋅指蛋白、賴氨酸組氨酸轉(zhuǎn)運體蛋白、泛素蛋白以及一些功能未知蛋白。

圖2 馬尾松轉(zhuǎn)錄組ENc-GC3s關(guān)聯(lián)分析

2.4 偏倚分析

偏倚分析結(jié)果(圖3)顯示了馬尾松轉(zhuǎn)錄組密碼子第3位堿基的使用情況,圖中大部分CDS點處在中心點稍右下位置,說明馬尾松密碼子第3位更偏好T/G堿基。馬尾松轉(zhuǎn)錄組大部分CDS點位于中心點附近,說明大部分馬尾松基因密碼子第3位嘌呤與嘧啶出現(xiàn)頻率相對接近,密碼子偏好性主要受突變影響;還有少數(shù)CDS點出現(xiàn)在遠(yuǎn)離中心點的位置,說明這些馬尾松基因密碼子第3位某個堿基出現(xiàn)頻率非常高或者非常低,其偏好性可能主要受自然選擇影響,通過與GenBank數(shù)據(jù)庫比對發(fā)現(xiàn)這些基因主要包括鈣結(jié)合蛋白、鋅指蛋白以及一些未知功能蛋白。

圖3 馬尾松轉(zhuǎn)錄組PR2-plot分析

2.5 轉(zhuǎn)錄組最優(yōu)密碼子分析

以ENc值作為衡量依據(jù)排序,前后各10%的CDS序列作為馬尾松高低表達基因樣本進行RSCU值計算和分析,如果密碼子的使用沒有偏好性,則該密碼子的RSCU值應(yīng)當(dāng)?shù)扔?,當(dāng)某一密碼子的RSCU值大于1或小于1時,表示該密碼子為使用相對較多或較少的密碼子(李慧娟等,2017)。結(jié)果如表1所示,轉(zhuǎn)錄組高低表達基因樣本之間的ΔRSCU值差異較小(-0.48~0.62),表明馬尾松密碼子偏好性較弱。通過比較RSCU和ΔRSCU值,除去終止密碼子確定了TTA、CAA、TGT、GGT等27個馬尾松最優(yōu)密碼子(表1)。這27個最優(yōu)密碼子中有25個第3位均為A/T,僅有2個密碼子TTG與AGG第3位為G,沒有以C結(jié)尾的最優(yōu)密碼子,這與其所有密碼子第3位GC含量小于AT含量的整體情況十分一致。

2.6 密碼子使用頻率分析

一般認(rèn)為,密碼子使用頻率比值在0.5~2.0之間表示物種間密碼子偏好性差異不明顯(賴瑞聯(lián)等,2019;范三紅等,2003)。馬尾松與3種植物以及2種微生物密碼子使用頻率的比值如圖4所示。馬尾松與煙草、擬南芥和歐洲山楊3種模式植物之間的絕大部分密碼子使用偏好性差異很小,馬尾松密碼子與3種模式植物密碼子使用頻率比值范圍分別為:馬尾松/煙草0.48~1.49,馬尾松/擬南芥0.50~1.64,馬尾松/歐洲山楊0.58~3.00,其中最低為擬南芥CCG(0.50),最高為歐洲山楊CGG(3.00),除歐洲山楊CGG外,3種模式植物其他密碼子使用頻率比值都在0.5~2.0之間,其中0.75~1.49之間的密碼子頻率比值占總數(shù)的89.1%。與3種植物相比,馬尾松與大腸桿菌、釀酒酵母2種微生物密碼子使用偏好性的差異較大,尤其與大腸桿菌密碼子偏好性差異很大,可能與大腸桿菌為原核生物有關(guān);而與釀酒酵母密碼子偏好性差異小于大腸桿菌,可能由于釀酒酵母為真核生物。密碼子使用頻率分析表明,馬尾松基因在其他模式植物或微生物內(nèi)異源表達或遺傳轉(zhuǎn)化驗證基因功能時,煙草和釀酒酵母是較為理想的選擇。

表1 馬尾松轉(zhuǎn)錄組最優(yōu)密碼子分析①

①* 表示最優(yōu)密碼子。RSCU表示同義密碼子相對使用度,ΔRSCU表示高表達基因RSCU與低表達基因RSCU的差值。* means the major preference codons.RSCU means relative synonymous codon usage, and ΔRSCU means difference RSCU of high expressed genes and low expressed genes.

圖4 馬尾松轉(zhuǎn)錄組與模式生物基因組密碼子使用頻率比較

3 討論

異源表達基因時,除宿主、啟動子等因素外,基因編碼區(qū)的序列也會影響蛋白表達,如密碼子偏愛性、mRNA二級結(jié)構(gòu)等(蔡海鶯等,2013)。密碼子使用偏好性是生物在進化過程中受到突變和自然選擇等影響的綜合結(jié)果,Sharp等(1994)研究表明,基因表達受到密碼子偏好性的調(diào)控,最優(yōu)密碼子可以提高翻譯的效率和準(zhǔn)確率。異源基因表達時,將目的基因的原有密碼子優(yōu)化成目標(biāo)異源物種的優(yōu)勢密碼子,可以提高基因的表達效率。Jabeen等(2010)發(fā)現(xiàn)植物原生質(zhì)體中密碼子優(yōu)化后的cryAb基因表達水平提高了4~6倍??墁摤摰?2016)發(fā)現(xiàn)密碼子優(yōu)化后的無花果曲霉(Aspergillusficuum)phyA基因在大豆(Glycinemax)中有更高的活性。

本研究以馬尾松轉(zhuǎn)錄組數(shù)據(jù)為對象,篩選出5 592條完整CDS序列,利用密碼子分析軟件對密碼子的堿基構(gòu)成與其他參數(shù)進行計算分析,結(jié)果表明,馬尾松總體上偏好使用第3位堿基為A/T的密碼子。葉友菊等(2018)對馬尾松葉綠體基因組45個基因CDS分析表明馬尾松葉綠體基因密碼子GC3s為29.68%,偏好使用第3位堿基為A/T的密碼子,這與本研究馬尾松轉(zhuǎn)錄組CDS分析結(jié)果相似;羅群鳳等(2018)也得到極為相似的結(jié)果。Murray等(1989)研究發(fā)現(xiàn)雙子葉植物偏好使用第3位堿基為A/T的密碼子,而單子葉植物偏好第3位堿基為G/C的密碼子。曲俊杰等(2017)與陳哲等(2017)分別對單子葉植物香蕉(Musanana)和菠蘿(Ananascomosus)的基因組密碼子分析,發(fā)現(xiàn)其GC3s含量分別為52.9%和55.4%,更偏好使用第3位堿基為G/C的密碼子;賴瑞聯(lián)等(2019)與陸育生等(2018)分別對雙子葉植物橄欖(Canariumalbum)和黃皮(Clausenalansium)轉(zhuǎn)錄組密碼子分析,發(fā)現(xiàn)它們的GC3s含量分別為37.7%和40.0%。這幾種植物與更多其他植物密碼子分析的結(jié)果基本支持了Murray等(1989)的觀點。劉寧等(2013)對裸子植物紅豆杉屬(Taxus)52條CDS的密碼子分析表明其偏好使用第3位為A/T的密碼子,與擬南芥等雙子葉植物相近。馬尾松與雙子葉植物的密碼子使用偏好性相似而與單子葉植物不同,暗示馬尾松基因在擬南芥、歐洲山楊等雙子葉植物中更可能獲得高效異源表達;而在小麥(Triticumaestivum)、水稻(Oryzasativa)等單子葉植物中表達可能需要根據(jù)異源植物的密碼子偏好性對馬尾松基因進行適當(dāng)?shù)拿艽a子優(yōu)化。

生物基因組或轉(zhuǎn)錄組中具有低ENc值的基因需要的同義密碼子數(shù)量少,更能代表該生物編碼密碼子的使用偏好性。根據(jù)ENc值上下限10%的基因樣本計算ΔRSCU值,得到的27個最優(yōu)密碼子中有25個第3位堿基是A/T,而所有編碼氨基酸的61個密碼子中總共含有29個A/T結(jié)尾的密碼子,其中25個為馬尾松的最優(yōu)密碼子,充分表明了馬尾松偏好選擇A/T結(jié)尾密碼子的特點,進一步表明偏好G/C結(jié)尾密碼子的物種外源基因需在馬尾松細(xì)胞具有高表達效率,需對基因編碼區(qū)進行密碼子優(yōu)化,盡量選擇第3位為A/T的同義密碼子。

密碼子使用偏好性的形成是突變壓力和自然選擇共同作用的結(jié)果。中性繪圖、偏倚分析與關(guān)聯(lián)分析表明,大多數(shù)馬尾松基因密碼子的使用偏好性主要受突變壓力影響,而少數(shù)基因受到自然選擇作用影響,如NADH脫氫酶亞基,以及具有特殊結(jié)構(gòu)的鋅指蛋白等。根據(jù)密碼子使用頻率分析,馬尾松與煙草、擬南芥和歐洲山楊的密碼子偏好性的差異較小,僅擬南芥和歐洲山楊各1個密碼子與馬尾松密碼子使用頻率比值在0.5~2.0范圍以外,其中煙草最適合馬尾松異源植物表達,木本模式植物歐洲山楊也較為合適。陳曉明等(2018)在擬南芥中異源表達馬尾松萜類合成途徑關(guān)鍵酶基因PmGGPPS,并檢測到轉(zhuǎn)化植株較野生型二萜組分顯著提高。郭天瑋等(2015)將馬尾松花發(fā)育相關(guān)基因PmFLO/LFY轉(zhuǎn)入煙草,發(fā)現(xiàn)可促使煙草花期提前。目前已有在微生物構(gòu)建蒎烯等松脂組分異源生物合成的報道,但大多未進行密碼子優(yōu)化(陳天華等,2019;馮紅茹等,2015)。根據(jù)本試驗結(jié)果,馬尾松基因在釀酒酵母中表達效果可能優(yōu)于大腸桿菌,如選擇大腸桿菌對馬尾松基因做原核表達,需對馬尾松基因做密碼子優(yōu)化并人工合成具有大腸桿菌同義密碼子偏好性的馬尾松基因片段作為前提。本試驗結(jié)果初步揭示了馬尾松密碼子特性,可為進一步深入馬尾松分子水平的研究提供幫助。

4 結(jié)論

馬尾松整體密碼子GC含量為44.95%,尤為偏好第3位為A/T的密碼子,所有密碼子第3位GC含量僅為38.95%。共篩選出27個馬尾松最優(yōu)密碼子,其中25個密碼子第3位為A/T。中性繪圖、ENc-GC3s、偏倚性分析結(jié)果認(rèn)為馬尾松密碼子使用偏好性形成主要受突變影響,其次受自然選擇等多重作用方式共同作用。可選擇煙草作為馬尾松基因異源表達的優(yōu)選植物體,若選擇微生物異源表達馬尾松基因,釀酒酵母較大腸桿菌可能更適合。

猜你喜歡
異源密碼子堿基
近岸水體異源遙感反射率產(chǎn)品的融合方法研究
基于EM-PCNN的果園蘋果異源圖像配準(zhǔn)方法
應(yīng)用思維進階構(gòu)建模型 例談培養(yǎng)學(xué)生創(chuàng)造性思維
密碼子與反密碼子的本質(zhì)與拓展
臉譜與假面 異源而殊流
中國科學(xué)家創(chuàng)建出新型糖基化酶堿基編輯器
新型密碼子、反密碼子、氨基酸對應(yīng)盤
生命“字母表”迎來新成員
生命“字母表”迎來4名新成員
基于SSR分子標(biāo)記的Nicotiana tobacum–N. plumbaginifolia異源染色體植株的鑒定與篩選