郭媛婷 楊玉潔 胡曉艷 杜淑輝
關鍵詞:δ8-FAD2;密碼子使用偏好性;油料作物;非油料作物
隨著人們對食品健康的關注度越來越高,油脂作為食品必不可少的成分,得到了廣泛的社會關注。不飽和脂肪酸(如油酸、亞油酸)可保持細胞膜的相對流動性、有效降低血液膽固醇和甘油三酯含量,人體若缺乏此類脂肪酸,膽固醇便會和一些飽和脂肪酸進行結合,沉積于血管壁,逐漸形成動脈粥樣硬化,引發(fā)心腦血管疾病[1]。植物中不飽和脂肪酸分布廣泛,如花生、大豆、油菜、油橄欖中含有豐富的亞油酸、亞麻酸以及其他不飽和脂肪酸[2-3],且各種植物中油酸及亞油酸含量與比例并不相同,如核桃中亞油酸含量可以高達70%[4];花生中油酸含量為35%~80%,亞油酸變含量為1%~40%[5];而油菜中油酸含量可達60%,亞油酸僅占12%~24%[6]。
脂肪酸去飽和酶(FAD2)是一種常見的脫氫酶,存在于細胞內質網的表面,調控植物中各種不飽和脂肪酸的合成,故FAD2基因直接決定了植物體儲存脂中不飽和脂肪酸的含量與比例[7-9],然而,F(xiàn)AD2基因并非聚集于油料作物中,而是普遍存在于各種植物中[8],且不同類型植物中FAD2基因序列編碼存在著差異。據(jù)報道,基因序列對密碼子的使用不是完全隨機的,而是具有一定的偏好性,合成某種蛋白質的基因序列對同義密碼子的使用頻率不同,會造成mRNA轉錄產生的蛋白數(shù)量發(fā)生顯著變化。研究發(fā)現(xiàn),酸棗[10]、銀杏[11]等中已被檢測出較弱的密碼子偏好性;而在油茶[12]、棉花[13]中發(fā)現(xiàn),自然選擇的影響對其密碼子偏好性的形成起到很大作用。近年來,對不同植物中某一特定基因的密碼子使用偏好的探索已成為基因研究的熱點。朱靈芝等[14]進行馬尾松PmDXR基因密碼子偏好性分析,得出其密碼子偏好性較弱、偏好使用A/T結尾的密碼子結論。吳彥慶等[15]對不同植物中花的APETALA1基因密碼子使用模式進行比較,結果發(fā)現(xiàn),芍藥和牡丹AP1基因的密碼子使用特點相似,碧桃和蘋果AP1基因的密碼子使用特點相似。然而,目前大多對密碼子偏好性的研究都只從親緣關系的層面討論植物密碼子使用偏好性規(guī)律的相似性[16-17],未有提及木本與草本植物的密碼子使用模式是否也有規(guī)律可循;此外,對于FAD2基因的研究也多在論述其功能作用[7-9],少有學者探討油料與非油料植物中的FAD2基因在序列結構中是否存在差異。
本研究在FAD2基因家族中挑選出δ8-FAD2基因,通過對比分析15種不同類型植物的基因序列,對其密碼子使用偏好性及其影響因素進行分析,旨在明確草本與木本、油料與非油料作物中δ8-FAD2基因密碼子的使用偏好成因及其差異,從而為理解不同物種的基因結構與進化關系,并進一步通過基因調控改良油料作物品質提供研究基礎。
1 材料和方法
1.1 序列數(shù)據(jù)來源
目前,GenBank數(shù)據(jù)庫中來自不同物種的δ8-FAD2基因序列共166條。為明確草本與木本、油料與非油料作物內δ8-FAD2基因密碼子的使用偏好性及其影響因素的差異,本試驗選取15種代表性植物作為研究對象,具體序列信息如表1所示。
1.2 密碼子使用偏好性分析
1.2.1 堿基組成偏好性分析 使用CodonW1.4.2軟件對15個基因序列的堿基組成進行分析,并計算各基因的GC含量(GC)、密碼子第3位的GC含量(GC3)、密碼子末位堿基使用頻率(T3、C3、A3、G3)、最優(yōu)密碼子的使用頻率(Fop)、密碼子適應指數(shù)(CAI)及密碼子偏愛指數(shù)(CBI)[18]。通過對15種植物的綜合比較分析,評估δ8-FAD2基因的堿基組成偏好性與不同植物中同一基因的堿基組成差異性。
1.2.2 有效密碼子分析 有效密碼子(effectivenum?berofcodons,ENC)可用于反映各同義密碼子的使用偏好度,取值范圍為20~61,ENC值越小偏好性越強,基因表達量也越高,因此,通過比較ENC值大小可以得出內源基因表達量的相對高低[15]。
1.2.3 相對同義密碼子使用度分析 相對同義密碼子使用度(RelativeSynonymousCodonUsage,RSCU)是密碼子實際使用值與無偏好值之比[19]。RSCU=1表示所有同義密碼子被均衡使用,無偏好性;RSCU<1表示密碼子使用頻率較低,反之則偏高;RSCU>1.6表示該密碼子有極強偏好性[20]。
1.2.4 最優(yōu)密碼子分析 利用MicrosoftExcel對CodonW計算得到的數(shù)據(jù)進行相關性分析和不同氨基酸最優(yōu)密碼子確定。將基因序列參照ENC值由高到低進行排序,選取ENC值最低的5個基因作為高偏好組,最高的5個基因為低偏好組,分別計算2組的RSCU值,記作RSCUhigh和RSCUlow,計算二者差值ΔRSCU值。將同時滿足ΔRSCU>0.08和RSCU值>1的密碼子視為最優(yōu)密碼子[21]。
1.3 ENC-plot繪圖分析
ENC-GC3關聯(lián)圖可用來判斷基因密碼子使用偏好性的壓力來源。已知標準曲線為:ENC=2+GC3+29/(GC3?+(1-GC3)?)[22]。若ENC繪圖中所有點分布在標準曲線上或分布于標準曲線附近,則密碼子使用偏好只受到突變壓力影響;若這些點分布于標準曲線外,則認為密碼子使用偏好受到自然選擇及其他因素影響[23-24]。
1.4 PR2-plot分析
PR2-plot繪圖可用來判斷基因密碼子第3位點堿基的使用偏性情況。為便于分析不同植物δ8-FAD2基因密碼子第3位點使用偏好,以G3/(G3+C3)值為橫坐標、A3/(A3+T3)值為縱坐標繪制直角坐標系,當A=T,G=C時,坐標為(0.50,0.50),過此坐標分別作垂直于橫縱坐標的直線,將坐標軸第1象限分成4個區(qū)域[25]。若點分布于中心點附近,則說明密碼子使用偏好性主要受到了堿基突變的影響;若分布于直線上部區(qū)域,表明該基因密碼子末位堿基使用頻率A高于T;若分布在直線的左部區(qū)域,則表明末位堿基C高于G。
1.5 統(tǒng)計分析
利用R軟件繪制不同植物RSCU值的聚類熱圖[15]。基于15種植物δ8-FAD2不同RSCU值使用SPSS26.0軟件進行聚類分析[17],使用MEGA-X軟件對不同物種δ8-FAD2完整基因編碼序列進行對比,并對其聚類分析[26]。
2 結果與分析
2.1 不同植物δ8-FAD2基因的密碼子堿基組成
15種植物δ8-FAD2基因密碼子使用參數(shù)如表2所示。
使用CodonW1.4.2軟件對15種植物δ8-FAD2基因完整編碼序列進行分析統(tǒng)計,結果表明(表2),在密碼子末位堿基的選擇上,除高粱使用C3頻率最高外,其余14種植物皆為T3頻率最高,且C3和G3頻率都較低;GC值變化范圍為0.342~0.592,平均值為0.433,GC3值變化范圍0.305~0.568,平均值為0.409。除高粱的δ8-FAD2基因GC含量和GC3大于0.5,其余14種植物均小于0.5,說明這14種植物δ8-FAD2基因密碼子偏好使用AT,且偏好以A或T結尾。15種植物的ENC值范圍為47.200~58.030,平均為52.448,說明這15種植物δ8-FAD2基因的密碼子使用偏好性都較弱。
2.2 最優(yōu)密碼子確定
對15種植物δ8-FAD2基因所有氨基酸不同密碼子的含量以及RSCU值進行統(tǒng)計,結果顯示(表3),除起始密碼子(AUG、UGG)和終止密碼子(UAA、UAG、UGA)以外,δ8-FAD2基因偏好使用的密碼子共有26個,其中,23個以U、A結尾,僅有3個以G、C結尾,AGA、UCU和GUU表現(xiàn)為較強偏好性?;讦?-FAD2基因中各氨基酸不同密碼子含量的差異,在氨基酸水平上,得到了17個優(yōu)勢密碼子,分別為GCU、AGA、AAU、GAU、UGU、CAA、GGA、CAU、AUU、UUG、AAA、UUU、CCU、UCU、ACA、UAU、GUU。
從圖1可以看出,不同植物δ8-FAD2基因最優(yōu)密碼子存在一定差異,開心果、美國山核桃、角豆樹、大豆、野大豆、甘藍的最優(yōu)密碼子為AGG,棉花、木薯、桑樹的最優(yōu)密碼子為AGA,豌豆和花生的最優(yōu)密碼子為UCU,而核桃、高粱、向日葵、油菜的最優(yōu)密碼子分別為GGA、UUG、GUU和CCG。
對δ8-FAD2基因高偏好組和低偏好組進行分析結果表4所示。其中,有27個密碼子RSCU>1,表現(xiàn)為較高使用偏性,23個密碼子ΔRSCU>0.08,具有高表達性。同時滿足2個條件的密碼子有21個,視為δ8-FAD2基因的最優(yōu)密碼子。
2.3 ENC-plot繪圖分析
ENC-plot繪圖可以對15種植物δ8-FAD2基因的實際ENC值與ENC期望曲線進行比較,結果顯示(圖2),15種植物δ8-FAD2基因的實際ENC值與期望值都存在一定差異,全部分布于ENC期望曲線下方,說明這些物種δ8-FAD2基因密碼子使用偏好性的形成都受到了自然選擇的影響。木本油料作物的ENC值大都偏離標準曲線且分布相對集中,而草本油料作物的ENC值分布差異較大,如向日葵、油菜等接近期望曲線,而大豆、花生等卻偏離嚴重,說明木本植物受到選擇壓力情況相似,而不同種類草本植物受到的突變壓力與選擇壓力不盡相同;非油料作物的ENC值均偏離期望曲線,說明大多非油料作物δ8-FAD2基因密碼子使用偏好性的主導因素是選擇壓力。
2.4 PR2-plot分析
PR2-plot繪圖可用來比較不同植物δ8-FAD2基因密碼子第3位堿基的使用偏好性情況,若點落于x=0.5的直線上,表示密碼子第3位G和C的使用頻率相同;若點落于y=0.5的直線上,則表示密碼子第3位A和T的使用頻率相同。分析統(tǒng)計15種植物δ8-FAD2基因的密碼子使用情況(圖3),發(fā)現(xiàn)除桑樹密碼子第3位對A或T、G或C沒有選擇偏好性,其余物種皆偏離中心點(0.5,0.5),且集中分布在右下部分,因此,幾乎所有物種的δ8-FAD2基因密碼子使用偏好性皆很大程度上受自然選擇的影響,密碼子末位堿基使用頻率G高于C,T高于A。非油料作物相對更接近“x=0.5”和“y=0.5”2條輔助線,說明非油料作物在密碼子第3位點堿基的選擇上偏好性較弱。
2.5 不同植物δ8-FAD2基因密碼子使用模式的系統(tǒng)關系
基于RSCU值構建δ8-FAD2基因進化樹,結果如圖4所示。圖4-A反映了密碼子相對使用度的相似性,有相同密碼子使用偏好的物種離得更近,而有些親緣關系接近的植物卻并有著相似的密碼子使用偏好。例如甘藍單獨分為一類,而非與油菜等親緣物種歸為一類,其余14種植物又分為2類,高粱單獨為一類?;?5種植物δ8-FAD2基因完整序列構建的系統(tǒng)進化樹(圖4-B)則更能反映出物種基因序列相似性,親緣關系接近的分為一類。由此可見,許多物種的分類在2個聚類中并不完全相同。然而,無論哪種分類方式,都有將木本植物單獨劃分出來的趨勢,而草本植物中許多物種雖然親緣關系較接近,在2個分類結果中卻差異較大,表明物種間的親緣關系并不是密碼子使用偏好性的決定性因素。
3 結論與討論
由于同義密碼子的差異集中表現(xiàn)于密碼子末位堿基,且密碼子此位點選擇壓力較小,因此,常把GC3用于密碼子使用模式分析[10]。ENC值同樣是評價基因密碼子偏好性的重要參考指標[27]。本研究表明,15種植物中,草本植物δ8-FAD2基因序列長度普遍大于木本植物,而密碼子GC含量和GC3除高粱外都小于0.5,使用多種方式統(tǒng)計優(yōu)勢密碼子,結果都表現(xiàn)為此基因偏好使用AT堿基,且偏好用A或T結尾,這一結果與晁岳恩等[28]的研究結果類似,是由于15種植物中僅高粱是禾本科植物,禾本科植物密碼子偏好以G或C結尾,而雙子葉作物則更偏好使用以A或T結尾的密碼子[29]。15種植物δ8-FAD2基因ENC平均值為52.448,說明此基因密碼子使用偏好性弱,這與前人的研究結果一致[30]。
本研究表明,15種植物δ8-FAD2基因密碼子使用情況有較大差異,自然選擇和堿基突變的影響是造成不同物種同一基因密碼子使用出現(xiàn)偏差的主要原因[23,31]。在ENC-plot繪圖分析中,油料木本植物除棉花外都偏離ENC標準曲線且分布相對集中,可能是由于木本植物受到選擇壓力情況相似,具有相似的密碼子使用偏好,而棉花作為唯一一種1年生木本植物,生命周期短且基因序列相對其他木本植物較長,可以積累更多的變異,密碼子使用偏好性被強烈的堿基突變左右。1年生草本油料植物如油菜、向日葵的ENC值接近預期曲線,密碼子使用偏好性的主導因素是堿基突變,而豆科植物如大豆、花生等因受到長期定向選擇育種而遠離標準曲線[32-33]。此外,其他非油料作物除高粱外的ENC值均偏離期望曲線,說明大多數(shù)非油料作物密碼子使用偏好性的主導因素是選擇壓力,這便導致非油料作物密碼子使用偏好性遠小于油料作物。PR2-plot繪圖中,多數(shù)物種密碼子末位堿基的使用都受到了自然選擇的影響,且非油料作物的密碼子第3位堿基的選擇上偏好性較弱,因此得出,油料作物δ8-FAD2基因密碼子使用偏好性強于非油料作物,這與ENC-plot繪圖分析結果一致。
本研究結果表明,15種不同類型植物δ8-FAD2基因密碼子使用偏好差異較大,油料作物的密碼子使用偏好性要強于非油料作物,木本植物間其密碼子偏好性的受壓力情況基本類似,草本植物間各不相同,而大家普遍認為的物種間的親緣關系并非密碼子使用偏好性的決定性因素。由此推斷,植物中δ8-FAD2基因的改變或許會間接改變其脂肪酸組分與油脂含量,要解決這個問題仍需今后進一步驗證與分析。深入了解δ8-FAD2基因密碼子使用偏好性有助于進一步理解脂肪酸轉化與累積規(guī)律,通過基因調控改良油料作物質量,為尋找和培育更加優(yōu)質的油料作物提供了方向。