曾 林 ,黃彬茹 ,趙春麗 ,王 曉 ,賴鐘雄 *,劉生財(cái) *
(1.福建農(nóng)林大學(xué)園藝學(xué)院,福建福州 350002;
2.福建農(nóng)林大學(xué)園藝植物生物工程研究所,福建福州 350002)
莧菜(Amaranthus tricolor)也叫雁來(lái)紅、米莧、青香莧等,原產(chǎn)中國(guó)、印度及東南亞等地。莧菜中含有豐富的類黃酮、甜菜色素等次生代謝物,具有一定的保健功能[1],并且莧菜還擁有生長(zhǎng)周期短、抗逆性強(qiáng)等優(yōu)點(diǎn),因此,莧菜得到了國(guó)內(nèi)外許多研究學(xué)者的關(guān)注[2]。此外,張媛媛等[3]研究發(fā)現(xiàn),莧菜的愈傷組織中也蘊(yùn)含著豐富的次生代謝物質(zhì),說(shuō)明莧菜的愈傷組織也具有很大的研究前景。
苯丙氨酸解氨酶(phenylalaniammonia-lyase,PAL)是苯丙烷代謝途徑中的關(guān)鍵酶和限速酶,苯丙烷代謝途徑的不同去向?qū)Υ紊x物質(zhì)的積累以及生理生化作用具有很大程度的影響[4],所以PAL對(duì)類黃酮的產(chǎn)生、植物色素的形成、植物細(xì)胞分化以及木質(zhì)化過(guò)程、參與植物抗逆境性等方面都有重要作用,可預(yù)見(jiàn)其未來(lái)在醫(yī)學(xué)、保健以及食品工業(yè)等領(lǐng)域都具有誘人的發(fā)展前景[5]。
自然界中生物的基因往往對(duì)密碼子的使用存在一定的偏好性,而密碼子使用的偏好性能夠反映物種或基因的起源、進(jìn)化規(guī)律和突變方式,同時(shí)對(duì)基因功能分析、蛋白質(zhì)表達(dá)和蛋白質(zhì)結(jié)構(gòu)研究等具有重要參考價(jià)值[6]。該研究主要進(jìn)行莧菜AtPAL基因密碼子偏好性分析、與其他物種PAL基因密碼子偏好性的對(duì)比分析,以及與大腸桿菌、酵母菌等模式生物基因組密碼子偏好性的比較分析,可為莧菜AtPAL基因選擇異源表達(dá)受體和表達(dá)系統(tǒng)提供理論基礎(chǔ),也為密碼子的優(yōu)化提供依據(jù)。
莧菜AtPAL基因由福建農(nóng)林大學(xué)園藝植物生物工程研究所實(shí)驗(yàn)室以‘大紅’莧菜為原材料克隆而出(GenBank登錄號(hào):MK574874),其 ORF(開(kāi)放閱讀框)區(qū)長(zhǎng)度為2142 bp,共編碼713個(gè)氨基酸,杏(Prunus armeniaca)、菠菜(Spinacia oleracea)、一品紅(Euphorbia pulcherrima)、葡萄(Vitis vinifera)、番茄(Solanum lycopersicum)、甜菜(Beta vulgaris)、玉米(Zea mays)、高粱(Sorghum bicolor)、毛白楊(Populus tomentosa)、康乃馨(Dianthus caryophyllus)、煙草(Nicotiana tabacum)、擬南芥(Arabidopsis thaliana)、水稻(Oryza sativa)、甘蔗(Saccharum officinarum)等物種PAL基因序列來(lái)源于 GenBank(https://www.ncbi.nlm.nih.gov/genbank/); 擬 南 芥(Arabidopsis thaliana)、煙草(Nicotiana tabacum)、大腸桿菌(Escherichia coli)、酵母菌(Yeast)、番茄(Solanum lycopersicum)等模式生物的密碼子偏好性數(shù)據(jù)均來(lái)源于密碼子使用數(shù)據(jù)庫(kù)(http://www.kazusa.or.jp/codon/)。主要用到 codon W、SPSS(IBM SPSS Statistics 23)、MEGA7.0、Origin(OriginPro2017)等軟件,以及EMBOSS在線程序(http://vm-bioinfo.toulouse.inra.fr/emboss)中的CUSP進(jìn)行數(shù)據(jù)分析,數(shù)據(jù)的匯總統(tǒng)計(jì)主要用到Excel軟件。
運(yùn)用codon W軟件分析得到莧菜AtPAL基因CDS 區(qū)的A3s、C3s、T3s、G3s(分別表示密碼子中第 3位上腺嘌呤、胞嘧啶、胸腺嘧啶和鳥(niǎo)嘌呤的含量)、CAI(密碼子適應(yīng)指數(shù))、ENc(有效密碼子數(shù))、RSCU值(同義密碼子相對(duì)使用度)等密碼子偏好性指標(biāo);運(yùn)用EMBOSS在線程序中的CUSP進(jìn)行分析,得到莧菜PAL基因CDS區(qū)各個(gè)密碼子的Frequency(密碼子使用頻率)、Fraction(單個(gè)密碼子在其同義密碼子中出現(xiàn)的比例)、GC1s(密碼子中第1位堿基的GC含量)、GC2s、GC3s、GC含量等偏好性指標(biāo);所得數(shù)據(jù)運(yùn)用Excel軟件進(jìn)行制表匯總。用同樣的方法,分析得到其他物種PAL基因的相關(guān)密碼子偏好性指標(biāo);以各個(gè)物種的RSCU值以及PAL基因CDS序列為數(shù)據(jù)基礎(chǔ),利用SPSS及MEGA軟件對(duì)不同物種進(jìn)行聚類分析;運(yùn)用SPSS和Origin軟件進(jìn)行不同物種間PAL基因的中性分析、ENc與GC3s關(guān)聯(lián)性分析、以及奇偶偏好(PR2)分析;通過(guò)將莧菜PAL基因密碼子偏好性與不同模式生物基因組密碼子偏好性進(jìn)行對(duì)比分析,來(lái)確定莧菜AtPAL基因最佳的異源表達(dá)受體。
ENc值是指基因序列的有效密碼子數(shù),可以檢測(cè)某一基因?qū)γ艽a子的偏好程度,數(shù)值大小范圍為20(每個(gè)氨基酸只使用1個(gè)密碼子)到 61(各個(gè)密碼子被均衡使用),數(shù)值越小,表明該基因的密碼子使用偏好性越強(qiáng)[7-8]。除此之外,ENc值的大小還可以體現(xiàn)出基因的表達(dá)水平,一般來(lái)說(shuō),ENc值越大,則基因的表達(dá)水平越低,ENc值小于30的可預(yù)測(cè)為高表達(dá)基因,大于55的可預(yù)測(cè)為低表達(dá)基因[9]。CAI指實(shí)際編碼該蛋白的所有密碼子對(duì)于完全使用最優(yōu)密碼子編碼該蛋白情況下的適應(yīng)性指數(shù),一般與密碼子偏好性呈正相關(guān),常用來(lái)衡量基因表達(dá)水平的高低[10],該值大小范圍為0~1,越接近0則表明其基因表達(dá)水平以及密碼子偏好性越弱[11]。
使用CUSP在線程序分析得到莧菜AtPAL基因的GC含量、GC3s含量,使用codon W軟件分析得到莧菜AtPAL基因的ENc值以及CAI值,結(jié)果顯示,莧菜AtPAL基因的ENc值為53.64,比較接近55,說(shuō)明莧菜AtPAL基因的表達(dá)水平和密碼子偏好性均較弱;GC含量為48.27%,即G+C的含量占48.27%,A+T的含量占51.73%,含量上比較接近,說(shuō)明莧菜AtPAL基因略偏好使用A/T堿基,GC3s含量為48.88%,低于50%,說(shuō)明莧菜AtPAL基因更偏好使用以A/T結(jié)尾的密碼子;CAI值為0.220,遠(yuǎn)小于1,也進(jìn)一步說(shuō)明了莧菜AtPAL表達(dá)水平較弱。另外,莧菜AtPAL基因密碼子在第3位堿基上各種堿基的含量為A3s(0.280)、T3s(0.363)、C3s(0.339)、G3s(0.261),說(shuō)明莧菜AtPAL基因在密碼子的選用上最偏好選用以T結(jié)尾的密碼子。
RSCU值是指某一密碼子所使用的頻率與其在無(wú)偏使用時(shí)期望頻率之間的比值[12],能夠更直觀的體現(xiàn)出密碼子使用的偏好性程度[9]。若基因?qū)δ骋幻艽a子使用沒(méi)有偏好性,則該密碼子的RSCU值等于1,若某一密碼子的RSCU值大于1,則表示對(duì)該密碼子具有一定的偏好性。Frequency(密碼子使用頻率)是指在1000個(gè)密碼子中某一密碼子出現(xiàn)的次數(shù);Fraction值是指某一密碼子在其同義密碼子中出現(xiàn)的比例(即一個(gè)氨基酸對(duì)應(yīng)的所有同義密碼子的Fraction值加和為1),這2個(gè)值也能在一定程度上反映出基因密碼子使用偏好性。
通過(guò)codonW軟件和CUSP在線程序分析得到莧菜AtPAL基因各個(gè)密碼子的RSCU值、Frequency值、Fraction值(表 1),結(jié)果顯示,RSCU值大于 1的密碼子總共有27個(gè),說(shuō)明莧菜PAL基因CDS區(qū)對(duì)這27個(gè)密碼子具有一定的使用偏好性,RSCU值大于 1.5 的密碼子有 GCT、TTG、CTT、CCT、AGA、TCA、AGC、ACT等8個(gè),即表示莧菜PAL基因?qū)@8個(gè)密碼子具有較強(qiáng)的偏好性,其中編碼精氨酸的AGA密碼子RSCU值為最高,達(dá)到2.06,說(shuō)明莧菜AtPAL基因在選擇編碼精氨酸的同義密碼子時(shí)最偏好使用AGA密碼子。另外,TTT、TTC、TGG(剔除起始密碼子ATG后)等3個(gè)密碼子的RSCU值為1,即說(shuō)明莧菜AtPAL基因?qū)@3個(gè)密碼子沒(méi)有使用的偏好性。所分析的密碼子中,只有編碼蘇氨酸的ACG密碼子RSCU值為0,其余59個(gè)密碼子(剔除3個(gè)終止密碼子和1個(gè)起始密碼子)的RSCU值均不為0,說(shuō)明莧菜AtPAL基因編碼區(qū)沒(méi)有使用ACG這個(gè)密碼子,且在密碼子的使用上偏好性較弱,與分析ENc值時(shí)所得結(jié)論一致。27個(gè)RSCU值大于1的密碼子中有15個(gè)是以A/T結(jié)尾的,8個(gè)RSCU值大于1.5的密碼子中有6個(gè)是以A/T結(jié)尾的,這也說(shuō)明了莧菜AtPAL基因在密碼子的使用上,偏好選擇以A/T結(jié)尾的密碼子,與前面分析GC含量時(shí)得出的結(jié)論一致。另外發(fā)現(xiàn),RSCU值大的密碼子其Frequency值以及Fraction值往往也較大,這也說(shuō)明了密碼子的Frequency值和Fraction值可在一定程度上反映出密碼子使用的偏好性。
2.3.1 不同物種間ENc值、CAI值以及GC含量分析。利用codon W軟件分析各個(gè)物種PAL基因CDS區(qū)序列得到表2的結(jié)果,結(jié)果顯示,PAL基因的ENc值、GC含量、GC3s含量、CAI值在單子葉植物與雙子葉植物之間均存在明顯的差異。11種雙子葉植物的ENc值范圍為46.46~54.42,均值為51.08,比較接近55,說(shuō)明在雙子葉植物中PAL基因的表達(dá)水平和密碼子使用的偏好性普遍較弱;而4種單子葉植物的ENc值均較低,均值為29.35,低于30,說(shuō)明在單子葉植物中PAL基因的表達(dá)量普遍偏高,并且密碼子使用偏好性也較強(qiáng)。
11種雙子葉植物的GC含量范圍為42.46%~51.77%,均值為46.86%,GC3s含量范圍為38.58%~57.99%,均值為46.28%,且除杏和康乃馨以外,其余9種雙子葉植物的GC以及GC3s含量均在50%以下,說(shuō)明PAL基因在雙子葉植物中普遍略偏好使用A/T堿基,并且偏好使用以A/T結(jié)尾的密碼子,與Murray等[13]研究發(fā)現(xiàn)的雙子葉植物密碼子使用規(guī)律相符;4種單子葉植物的GC含量、GC3s含量均高于0.5,均值分別是67.65%(GC含量)、96.40%(GC3s含量),說(shuō)明在單子葉植物中,PAL基因普遍偏好使用G/C堿基,尤其對(duì)以A/T結(jié)尾的密碼子有著極強(qiáng)的偏好性。另外,除番茄外的14個(gè)物種GC1含量均在50%以上,且15個(gè)物種的GC2含量均在50%以下,說(shuō)明PAL基因無(wú)論是在雙子葉植物中還是在單子葉植物中均普遍偏好使用第1位堿基為G/C、第2位堿基為A/T的密碼子,但在第1位堿基上,單子葉植物對(duì)G/C堿基的偏好程度比雙子葉植物要強(qiáng)(單雙子葉植物GC1含量均值分別為62.73%、52.99%)。
11種雙子葉植物CAI值均較低,值的范圍為0.193~0.239,范圍波動(dòng)較小,均值為0.217,與1相差較大,因此,也進(jìn)一步說(shuō)明在雙子葉植物中PAL基因的表達(dá)水平和密碼子使用的偏好性普遍較弱;而4種單子葉植物,除高粱以外的物種CAI值均高于0.3,均值為0.309,說(shuō)明PAL基因在單子葉植物中的基因表達(dá)水平以及密碼子使用偏好性普遍高于雙子葉植物。
2.3.2 基于PAL基因密碼子偏好性及基因編碼區(qū)的聚類分析?;?5種不同物種的RSCU值,利用SPSS軟件計(jì)算不同物種間的歐式平方距離系數(shù),歐式平方距離系數(shù)的數(shù)值越大,則表示物種間相關(guān)基因密碼子使用偏好性差異越大,所得結(jié)果如表3所示。結(jié)果表明,任意一種雙子葉植物與任意一種單子葉植物(水稻、甘蔗、玉米、高粱)間的歐式平方距離系數(shù)均較大,說(shuō)明PAL基因密碼子使用偏好性在單子葉植物和雙子葉植物之間存在很大的差異。但11種雙子葉植物兩兩之間或是4種單子葉植物兩兩之間,其歐式平方距離系數(shù)均較小;同屬石竹目的4個(gè)物種(莧菜、甜菜、菠菜、康乃馨)兩兩之間的歐式平方距離系數(shù)都在14.000以下,同為藜科的甜菜和菠菜之間的歐式平方距離系數(shù)只有6.088,同屬禾本科的甘蔗、玉米、水稻、高粱兩兩之間的歐式平方距離系數(shù)也均在11.000以下,而親緣關(guān)系遠(yuǎn)的物種間的歐式平方距離系數(shù)普遍相對(duì)較高,說(shuō)明PAL基因密碼子使用偏好性與物種間的親緣關(guān)系有一定的聯(lián)系,親緣關(guān)系近的物種往往密碼子使用的偏好性差異也較小,但并不絕對(duì),比如屬于楊柳科的毛白楊與屬于藜科的菠菜,兩者在親緣關(guān)系上相差較大,但歐式平方距離系數(shù)卻只有5.845,表示兩者PAL基因在密碼子的使用偏好性上差異較小,這說(shuō)明一些物種在進(jìn)化過(guò)程中其PAL基因可能會(huì)形成獨(dú)特的密碼子使用偏好性。
基于不同物種間密碼子使用偏好性的歐氏平方距離系數(shù)進(jìn)行聚類分析,以每條基因作為一個(gè)對(duì)象,將密碼子的RSCU值作為變量,采用59個(gè)密碼子(剔除3個(gè)終止密碼子,1個(gè)起始密碼子ATG以及編碼色氨酸的TGG)的RSCU值對(duì)其密碼子使用偏性進(jìn)行分析[14]。基因間的距離規(guī)定為基因同義密碼子相對(duì)使用度的歐氏平方距離[15],對(duì)于基因X與基因Y,其密碼子使用距離D的計(jì)算公式為:
為了使同類樣品之間的離差平方和最小,而類與類之間的離差平方和最大,使用了離差平方和法計(jì)算類與類間的距離[16],通過(guò)聚類分析得到圖1的樹(shù)狀圖。結(jié)果顯示,進(jìn)化樹(shù)將15個(gè)物種劃分成了單子葉植物和雙子葉植物2個(gè)大類,玉米、甘蔗、水稻和高粱4種單子葉植物聚為一個(gè)大類,其余的11種雙子葉植物聚為一個(gè)大類;在雙子葉植物中,同屬藜科的菠菜、甜菜與屬于楊柳科的毛白楊聚為一小類,同屬石竹目的莧菜和康乃馨也單獨(dú)聚為一個(gè)小類,但是也發(fā)現(xiàn)同屬石竹目的4個(gè)物種(莧菜、甜菜、菠菜、康乃馨)并沒(méi)有完全單獨(dú)聚為一個(gè)小類別。因此,在一定程度上可以說(shuō)明,親緣關(guān)系近的物種其PAL基因往往具有相似的密碼子使用偏好性,但并非絕對(duì),某些物種的PAL基因在進(jìn)化過(guò)程中可能會(huì)形成獨(dú)特的密碼子使用偏好性。
圖1 基于PAL基因同義密碼子相對(duì)使用度的聚類樹(shù)狀圖
基于不同物種PAL基因CDS區(qū)序列,使用MEGA7.0進(jìn)行系統(tǒng)進(jìn)化樹(shù)的構(gòu)建,結(jié)果如圖2所示。從進(jìn)化樹(shù)所呈現(xiàn)的結(jié)果可以看出,15個(gè)物種同樣被分為2個(gè)大類,同為單子葉植物的玉米、高粱、甘蔗、水稻單獨(dú)聚為一大類,其余的11種雙子葉植物聚為另一個(gè)大類;在雙子葉植物中,同屬石竹目的菠菜、甜菜、莧菜、康乃馨單獨(dú)聚成了一小類,其中同為藜科的甜菜和菠菜更是單獨(dú)聚為了一個(gè)小類。因此,在一定程度上能夠說(shuō)明無(wú)論是在單子葉植物中或是雙子葉植物中,親緣關(guān)系越近的2個(gè)物種其PAL基因密碼子使用的偏好性往往越相似,而且相較于基于RSCU值聚類分析的結(jié)果,基于CDS區(qū)序列聚類分析的結(jié)果與傳統(tǒng)意義上的物種分類更為接近,與賴瑞聯(lián)等[17]在研究龍眼TIR1基因時(shí)所得結(jié)論相符。
圖2 基于PAL基因CDS序列構(gòu)建的系統(tǒng)進(jìn)化樹(shù)
表3 不同物種間PAL基因密碼子使用偏性的歐式平方距離系數(shù)
在進(jìn)化過(guò)程中基因?qū)γ艽a子的使用偏好性往往受諸多因素影響,分析密碼子第1、2、3位上GC含量間的相關(guān)性,可以在一定程度上判別影響密碼子使用偏好性的因素[18]。一般認(rèn)為,若GC12(GC1與GC2加和的平均值)與GC3的含量存在相關(guān)性,則表示在進(jìn)化過(guò)程中基因?qū)γ艽a子的使用偏好性主要受突變壓力的影響,若不存在相關(guān)性則表示主要受自然選擇壓力的影響[19],根據(jù)這個(gè)結(jié)論,在進(jìn)行中性分析時(shí)以不同物種的GC12含量作為縱坐標(biāo),不同物種的GC3含量作為橫坐標(biāo)[20],利用Origin軟件進(jìn)行中性繪圖,所得結(jié)果如圖3所示。從中性分析的結(jié)果圖可以看出,GC12與GC3存在極顯著的相關(guān)性(r=0.946,P<0.01),說(shuō)明在進(jìn)化過(guò)程中突變壓力是影響PAL基因密碼子使用偏好性的主要因素。
圖3 不同物種PAL基因中性繪圖分析
研究表明,基因的ENc值與GC3含量之間的期望曲線能夠在一定程度上反映出影響基因?qū)γ艽a子使用偏好性的因素,若某一基因位點(diǎn)落在期望曲線上,則表示影響該基因密碼子使用偏好性的因素是突變壓力;若不在期望曲線上,則表示該基因受到突變壓力、自然選擇壓力或其他一些因素的影響[21-22]。此外,還有研究發(fā)現(xiàn),當(dāng)GC3含量取值分布范圍較廣時(shí),則主要是突變壓力影響密碼子的偏好性[23]。從圖4的結(jié)果來(lái)看,發(fā)現(xiàn)該研究的15個(gè)物種的PAL基因全都分布在期望曲線的下方,大部分都較靠近期望曲線分布,也存在少部分距離期望曲線較遠(yuǎn)的點(diǎn),另外GC3含量的分布范圍為0.386~0.969,分布較廣,說(shuō)明總體而言PAL基因在密碼子的使用偏好性上主要受突變壓力的影響,但也存在其它一些因素影響著PAL基因密碼子使用偏好性,與中性分析的結(jié)果一致。
圖4 不同物種PAL基因ENc與GC3s的關(guān)系
奇偶分析(PR2)主要用于分析密碼子第3位上嘌呤含量與嘧啶含量的關(guān)系[24],一般認(rèn)為,如果基因密碼子偏好性只受到突變壓力的影響,那么基因密碼子在第3位上的堿基A和T與G和C的使用頻率應(yīng)該是相等的,即A3/(A3+T3)=0.5,G3/(C3+G3)=0.5。從圖5可以發(fā)現(xiàn),15個(gè)物種PAL基因密碼子第3位上的A3/(A3+T3)值均小于0.5,并且,所有物種的G3/(C3+G3)值均偏離0.5,因此,可以進(jìn)一步說(shuō)明PAL基因密碼子偏好性除受突變壓力影響外,還可能受如自然選擇壓力[25]等其他一些因素的影響。
圖5 不同物種PAL基因奇偶偏好(PR2)分析
不同物種的密碼子使用頻率比值可以反映出物種間密碼子使用偏性的差異,若比值大小在0.5~2則代表物種間密碼子偏好性比較相似,若不在這個(gè)范圍內(nèi)則表示物種間的密碼子偏性差異較大[14]。大腸桿菌是常見(jiàn)的原核表達(dá)系統(tǒng),酵母菌是常見(jiàn)的真核表達(dá)系統(tǒng),擬南芥、煙草、番茄則常作為遺傳轉(zhuǎn)化的受體,表4列出了莧菜AtPAL基因密碼子使用頻率與大腸桿菌、酵母菌、擬南芥、煙草、番茄等生物密碼子使用頻率的比值,結(jié)果顯示,大于2或小于0.5的比值個(gè)數(shù)分別有:擬南芥8個(gè)、煙草10個(gè)、番茄13個(gè)、大腸桿菌20個(gè)、酵母菌17個(gè),即說(shuō)明對(duì)于擬南芥、煙草、番茄3種模式生物而言,擬南芥基因組密碼子的使用偏性與莧菜AtPAL基因密碼子的使用偏性差異最小,因此擬南芥是3種模式植物中最適合作為莧菜AtPAL基因遺傳轉(zhuǎn)化受體的植物;而對(duì)于大腸桿菌和酵母菌而言,酵母表達(dá)系統(tǒng)要優(yōu)于大腸桿菌表達(dá)系統(tǒng),即酵母菌更適合作為莧菜AtPAL基因的表達(dá)載體。
表4 莧菜AtPAL基因密碼使用偏好性與5種常見(jiàn)模式生物基因組密碼子使用偏好性比較
該研究發(fā)現(xiàn),莧菜AtPAL基因GC含量為48.27%,GC3s含量為48.88%,表明莧菜AtPAL基因偏好使用A/T堿基,且偏好使用以A/T結(jié)尾的密碼子;ENc值為 53.64,較接近 55,CAI值為 0.220,較接近0,說(shuō)明莧菜AtPAL基因的表達(dá)水平和密碼子偏好性均較弱。分析莧菜AtPAL基因RSCU值發(fā)現(xiàn),具有使用偏好性的密碼子有27個(gè)(RSCU>1),其中GCT、TTG、CTT、CCT、AGA、TCA、AGC、ACT 等 8 個(gè)密碼子具有較強(qiáng)的使用偏好性(RSCU>1.5);對(duì)比不同物種間PAL基因密碼子偏好性發(fā)現(xiàn),PAL基因在雙子葉植物中普遍略偏好使用A/T堿基,并且偏好使用以A/T結(jié)尾的密碼子,而在單子葉植物中普遍略偏好使用G/C堿基,并且較偏好使用以G/C結(jié)尾的密碼子。2種聚類分析結(jié)果均表明,PAL基因密碼子使用偏性與物種間親緣關(guān)系存在一定聯(lián)系,親緣關(guān)系近的物種,其PAL基因密碼子使用偏好性也往往較相似,但并非絕對(duì),基于RSCU值聚類分析的結(jié)果中發(fā)現(xiàn),參與甜菜色素代謝的莧菜和參與花青素代謝的康乃馨、杏等物種聚為一類,莧菜、菠菜、甜菜3種參與甜菜色素代謝的植物并沒(méi)有完全聚為一類,而是與參與花青素代謝的植物混聚在一起,出現(xiàn)這樣的聚類結(jié)果,很可能說(shuō)明苯丙烷代謝通路是植物體中很重要的一條代謝通路,參與甜菜色素代謝和參與花青素代謝的植物的PAL基因都具有很強(qiáng)的保守性,因而石竹目的植物并沒(méi)有單獨(dú)的聚在一起。除此之外,還可能與一些物種在進(jìn)化過(guò)程中形成了獨(dú)特的密碼子偏好性,花青素代謝和甜菜素色代謝可能具有共同的起源[26]等原因有關(guān)。
不同物種間PAL基因的中性分析、ENc與GC3關(guān)聯(lián)性分析、PR2分析結(jié)果表明,影響PAL基因密碼子偏好性的主要因素是突變壓力,其他一些因素也對(duì)其有一定的影響,如自然選擇壓力、基因長(zhǎng)度等。
莧菜AtPAL基因密碼子偏好性與大腸桿菌、酵母菌、擬南芥、煙草、番茄等模式生物基因組密碼子偏好性對(duì)比結(jié)果表明,擬南芥是3種模式植物中最適合作為莧菜AtPAL基因遺傳轉(zhuǎn)化受體的植物,酵母菌比大腸桿菌更適合作為莧菜AtPAL基因的表達(dá)載體,若要使用大腸桿菌作為莧菜AtPAL基因的表達(dá)載體,還需要針對(duì)大腸桿菌對(duì)密碼子的使用偏好性對(duì)莧菜AtPAL基因進(jìn)行密碼子的優(yōu)化。該研究結(jié)果可作為莧菜AtPAL基因進(jìn)行異源表達(dá)時(shí),選擇合適受體及表達(dá)系統(tǒng)的理論基礎(chǔ),同時(shí)也能夠?yàn)榍{菜AtPAL基因密碼子的優(yōu)化提供依據(jù)。