昌 西,裴 悅,胡 凡,任苗苗,王 彤,聶小軍
(1.西藏農(nóng)牧學(xué)院植物科學(xué)與技術(shù)學(xué)院,西藏林芝 860000;2.西北農(nóng)林科技大學(xué)農(nóng)學(xué)院,陜西楊凌 712100)
RNA編輯(RNA editing)是指DNA在轉(zhuǎn)錄形成mRNA過程中,由于核苷酸的插入、缺失或替換而使得原有的遺傳信息發(fā)生改變的生物學(xué)現(xiàn)象[1]。大量研究發(fā)現(xiàn),RNA編輯是一種常見的RNA水平修飾,是增加基因轉(zhuǎn)錄和功能多樣性的重要形式,一個基因序列通過編輯修飾,可以合成多個不同的蛋白質(zhì),從而參與控制不同的性狀或者生物學(xué)過程[2-3]。自1986年,RNA編輯現(xiàn)象首次在錐蟲的線粒體中被發(fā)現(xiàn)以來[4],人們圍繞RNA編輯已經(jīng)開展了大量的研究工作,發(fā)現(xiàn)RNA編輯現(xiàn)象廣泛存在于各種生物體中,包括動物、植物、真菌和細菌,表明RNA編輯可能是生物在長期進化過程中形成的一種保守的遺傳信息擴展機制[5-8]。據(jù)報道,真核生物大約35%的基因存在基因編輯現(xiàn)象,不僅細胞核中三類RNA編碼基因(mRNA、tRNA和rRNA)存在RNA編輯現(xiàn)象,細胞器(包括線粒體和葉綠體)基因組也存在大量的RNA編輯現(xiàn)象,并在轉(zhuǎn)錄后水平調(diào)控基因轉(zhuǎn)錄、翻譯效率及時序特異性表達等方面發(fā)揮了重要作用[9-10],如玉米葉綠體基因rpl2,其起始密碼子為ACG,必須發(fā)生C到T的編輯才能形成正確的起始密碼子ATG,起始轉(zhuǎn)錄和翻譯[11]。
葉綠體是植物細胞所特有的細胞器,是植物光合作用的主要器官,其具有自身的基因組并半自主地進行轉(zhuǎn)錄和翻譯,在很多生理生化過程中發(fā)揮了重要作用[12-13]。因此,對植物葉綠體基因組中的RNA編輯進行系統(tǒng)分析和研究不僅有利于探究RNA編輯發(fā)生的分子機制和進化意義,也有利于解析葉綠體RNA編輯參與植物生長發(fā)育調(diào)控的生物學(xué)功能。1991,Hoch等[11]首次在植物葉綠體基因組中發(fā)現(xiàn)了RNA編輯現(xiàn)象。隨后,研究者們對陸生植物葉綠體RNA編輯開展了大量研究工作,尤其是對ndhB基因研究較為深入[14-15]。研究發(fā)現(xiàn),在高等被子植物中,ndhB基因存在約15個編輯位點,但低等植物中其編輯位點顯著減少,比如在松葉蕨類植物中只有1個位點,在地錢類植物中僅有2個位點,在蕨類植物中有4個位點。在被子植物葉綠體基因組中,通常具有約30個編輯位點[16-17],Corneille等[18]在水稻葉綠體中發(fā)現(xiàn)了21個編輯位點,在玉米葉綠體中發(fā)了26個編輯位點,其中18個位點為兩者共有;Kerstin等[19]利用RT-PCR技術(shù)對黑麥葉綠體的編輯位點進行了分析,共從33個轉(zhuǎn)錄本中鑒定發(fā)現(xiàn)31個編輯位點,其中5個是黑麥特有的;鄧?yán)罾さ萚20]通過對小麥返白系葉綠體RNA編輯位點進行分析,發(fā)現(xiàn)了分布于14個基因的28個位點。
青稞(HordeumvulgareLinn.var.nudum Hoork.f.)又稱裸大麥,是青藏高原一種重要的傳統(tǒng)糧食作物,具有悠久的栽培歷史[21-22]。其在分類學(xué)上屬于禾本科大麥屬,是大麥的一種特殊類型,因其脫粒時內(nèi)外穎和穎果容易分離,籽粒為裸露,故稱裸大麥。青稞作為青藏高原的特色作物,現(xiàn)已成為藏區(qū)種植業(yè)、糧食生產(chǎn)與加工領(lǐng)域中占有支柱地位的主要作物[23]。青稞不僅是藏民族的主要糧食,同時也是釀造(青稞酒)的原料及牲畜的飼料,由于其籽粒蘊含豐富的礦物質(zhì)、蛋白質(zhì)、賴氨酸和β-葡聚糖,青稞逐漸成為新興保健食品的主要原料[24]。與其他禾本科作物相比,青稞表現(xiàn)出更強的抗旱、抗寒、耐鹽堿和耐瘠薄等優(yōu)良特性。因此,青稞不僅為藏區(qū)人民的經(jīng)濟發(fā)展做出了非常大的貢獻,而且為作物抗逆遺傳改良提供了重要的基因庫[25]。目前,青稞全基因組測序已經(jīng)完成,為開展青稞基因組學(xué)研究提供了必要的序列資源和信息,推動青稞基礎(chǔ)研究進入到組學(xué)時代[26]。同時,青稞的葉綠體基因組也已測定[27],為鑒定青稞葉綠體基因組RNA編輯位點奠定了基礎(chǔ)。鑒于目前有關(guān)青稞葉綠體RNA編輯的研究還未見報道,本研究首先通過生物信息學(xué)方法對青稞葉綠體基因組中的RNA編輯位點進行預(yù)測,然后結(jié)合RT-PCR技術(shù)對預(yù)測結(jié)果進行驗證,最后將青稞與栽培大麥、野生大麥及其他麥類作物葉綠體RNA編輯位點進行比較,以期從RNA編輯視角揭示青稞的起源和進化關(guān)系,為研究青稞葉綠體RNA編輯的生物學(xué)功能奠定基礎(chǔ),也為進一步揭示RNA編輯的作用機制提供有益信息。
本研究以青稞主栽品種藏青2000為試驗材料。將其室內(nèi)發(fā)芽后,正常培養(yǎng)至三葉期,采集幼嫩葉片,并保存在-80 ℃冰箱中備用。
1.2.1 青稞及栽培大麥、野生大麥葉綠體基因組RNA編輯位點的預(yù)測
首先,從NCBI數(shù)據(jù)庫中下載青稞的葉綠體基因組序列(序列號為KT962228.1),根據(jù)注釋信息,提取其蛋白質(zhì)編碼基因并去冗余,得到76個蛋白質(zhì)編碼基因;然后將這些序列提交到Prep-Cp數(shù)據(jù)庫[28],對其RNA編輯位點進行預(yù)測。同時下載栽培大麥(EF115541.1)和野生大麥(KC912689.1)的葉綠體基因組序列,提取所有蛋白質(zhì)編碼序列并去除冗余后,也采用同樣方法進行RNA編輯位點的預(yù)測。
1.2.2 青稞DNA及總RNA的提取
取0.2 g葉片,在液氮中研磨成精細粉末,采用改良的CTAB法[29]提取樣品的DNA;采用TRizol法(Life technology,USA)提取樣品的總RNA,經(jīng)紫外分光光度計測定樣品濃度及瓊脂糖凝膠電泳檢測后-80 ℃保存?zhèn)溆谩?/p>
1.2.3 青稞總RNA的純化及cDNA的合成
將提取的RNA樣品經(jīng)DNaseⅠ(TaKaRa,大連)37 ℃處理30 min,去除其中可能存在的DNA污染,然后加入等體積的酚/氯仿(苯酚∶氯仿=25∶24)抽提,獲得純化后的總RNA,并取 1 μL用于cDNA的合成。反轉(zhuǎn)錄采用PrimeScriptTMRT Reagent Kit進行(TaKaRa,大連),具體步驟參見說明書。最后,將得到的反轉(zhuǎn)錄產(chǎn)物保存于-20 ℃?zhèn)溆谩?/p>
1.2.4 青稞葉綠體基因RNA編輯位點的PCR驗證
為檢驗預(yù)測到的編輯位點準(zhǔn)確性,將所有預(yù)測的分布于15個基因的編輯位點進行RT-PCR驗證。根據(jù)編輯位點上下游序列,利用Primer 5.0設(shè)計相應(yīng)的引物(見表1)進行PCR擴增。PCR體系為20 μL,包括10 μL 2×Mix,8 μL ddH2O,1 μL上述步驟得到的cDNA,目標(biāo)基因上下游引物各0.5 μL。PCR程序為:94 ℃ 5 min;94 ℃ 30 s,50~60 ℃ 30 s,72 ℃ 1 min,共34個循環(huán);最后72 ℃ 5 min。同時以青稞DNA為模板,采用同樣引物和程序進行PCR擴增。PCR產(chǎn)物用純化回收試劑盒(天根,北京)回收后直接進行雙向測序(生工,上海)。用Seqman 11.2軟件對測序結(jié)果進行拼接,用 BioEdit 7.2.6工具比對每個基因的DNA和cDNA序列,最后手工校對和分析其中的RNA編輯位點。
表1 RT-PCR和PCR擴增所用引物序列信息
1.2.5 RNA編輯對蛋白結(jié)構(gòu)的影響
選取驗證后發(fā)生編輯的葉綠體基因,將其編輯前后的蛋白序列分別采用在線工具TMHMM Server V.2.0(http://genome.cbs.dtu.dk/services/TMHMM/)和NPS(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_server.html)對其蛋白質(zhì)跨膜區(qū)段和蛋白質(zhì)二級結(jié)構(gòu)域進行預(yù)測和比較,初步分析RNA編輯對其編碼蛋白結(jié)構(gòu)的影響。
1.2.6 禾本科作物葉綠體基因RNA編輯位點間的比較
將預(yù)測獲得的青稞葉綠體RNA編輯位點,與已報道的小麥[20]、野生二粒小麥[30]、粗山羊草[31]、黑麥[19]、大麥[3]、玉米[32]、水稻[18]、甘蔗[33]等禾木科作物的葉綠體編輯位點進行比較,分析麥類及其他禾本科作物葉綠體編輯位點的異同,鑒定保守位點。
將從NCBI數(shù)據(jù)庫下載的青稞76個非冗余葉綠體基因組蛋白質(zhì)編碼基因遞交到Prep-Cp數(shù)據(jù)庫進行RNA編輯位點的預(yù)測(表2)。結(jié)果發(fā)現(xiàn),在青稞葉綠體基因組中共預(yù)測到35個編輯位點,所有的編輯位點均發(fā)生了從C到U的變化;在76個蛋白編碼基因中,發(fā)生RNA編輯的有15個基因;所有的編輯均引起了氨基酸的變化,氨基酸轉(zhuǎn)變類型有7種,分別為H→Y、L→F、P→S、P→L、S→F、S→L、T→M,其中S→L和P→L兩種轉(zhuǎn)變形式出現(xiàn)次數(shù)最多,這與其他禾本科葉綠體基因組RNA編輯的組成特征相似[30-31]。在發(fā)生編輯的所有基因中,ndhB的編輯位點數(shù)最多,達9個;之后依次是rpoC2,有5個位點;rpoB和ndhA分別有4個位點,ndhF和rpoB分別有2個位點,其余的基因均為1個編輯位點(表2)。對編輯發(fā)生的密碼子位置進行分析發(fā)現(xiàn)這些編輯位點中有4個發(fā)生于于密碼子的第一位,剩余的31個均位于密碼子的第二位,在密碼子第三位沒有編輯現(xiàn)象的發(fā)生。
為了驗證所預(yù)測的編輯位點是否為真實發(fā)生的編輯,采用PCR和RT-PCR方法對所預(yù)測的35個位于15個基因的青稞葉綠體RNA編輯位點進行了擴增及測序(圖1)。結(jié)果發(fā)現(xiàn),其中的10個基因中的18個位點DNA和cDNA堿基不一致,被證實確實發(fā)生了RNA水平的序列改變,即RNA編輯(圖2)。所有這18個被驗證的位點均被前期生物信息分析方法所預(yù)測到,沒有發(fā)現(xiàn)新的未被預(yù)測到的編輯位點(表2),表明保守位點的生物信息預(yù)測的結(jié)果具有一定的準(zhǔn)確性。其中ndhB基因預(yù)測的9個編輯位點均證實為真實存在的編輯位點(表2),暗示RNA編輯對nhdB基因生物學(xué)功能的正常發(fā)揮可能具有重要的調(diào)控作用。
M:DL2000; 1~6分別是基因ndhF、petB、rpl2、rpl20、rpoA和ycf3的擴增產(chǎn)物。
M:DL2000 marker; 1-6 indicate PCR products ofndhF,petB,rpl2,rpl20,rpoAandycf3,respectively.
圖1 部分基因的RT-PCR電泳圖譜
Fig.1 Electrophoresis of the PT-PCR proclucts of 6 chloroplast genes in hulless barley
為了明確RNA編輯對蛋白質(zhì)結(jié)構(gòu)的影響,我們進一步對未編輯和編輯后其所編碼蛋白質(zhì)的二級結(jié)構(gòu)進行了預(yù)測。結(jié)果表明,在所有可能發(fā)生RNA編輯的基因中,基因ndhD、rpl2、atpA、atpB發(fā)生編輯后的α螺旋減少;而基因petB、rps8、ndhA的α螺旋則相對增多;其中基因rpl2和atpB的無規(guī)卷曲數(shù)在發(fā)生編輯后有所減少,其他5個基因的無規(guī)卷曲數(shù)量均有增加;另外,基因rpl2、petB、rps8的延伸鏈數(shù)量在RNA編輯后有所增加,其余4個基因的延伸鏈數(shù)量減少(圖3)。以上預(yù)測結(jié)果說明,RNA編輯的發(fā)生會影響蛋白質(zhì)的二級結(jié)構(gòu),因此在編輯發(fā)生后,由于蛋白質(zhì)結(jié)構(gòu)的變化,可能導(dǎo)致相應(yīng)的生理生化反應(yīng)發(fā)生變化從而最終影響基因生物學(xué)功能的表達。對基因跨膜結(jié)構(gòu)域的預(yù)測結(jié)果表明,基因ndhA與ndhB在RNA編輯發(fā)生后,均發(fā)生了較顯著的變化,即分別多出了3處和1處跨膜結(jié)構(gòu)域(圖4)。
表2 青稞葉綠體基因RNA編輯位點預(yù)測與驗證
Y表示實驗驗證的編輯位點;N表示實驗驗證未發(fā)生編輯的位點。
Y represents the validated RNA editing sites by RT-PCR while N represents the non-validated site.
圖2 青稞ndhB和ndhD基因的序列比對及RNA編輯位點的鑒定
A,B,C,D,E,F,G分別為編輯前的ndhD,rpl2,atpA,atpB,petB,rps8和ndhA基因編碼蛋白的二級結(jié)構(gòu); a,b,c,d,e,f,g分別為編輯后的ndhD,rpl2,atpA,atpB,petB,rps8和ndhA基因編碼蛋白的二級結(jié)構(gòu)。
A to G indicate secondary structures of coding proteins before editing ofndhD,rpl2,atpA,atpB,petB,rps8andndhArespectively; a to g indicates secondary structures of coding proteins after editing ofndhD,rpl2,atpA,atpB,petB,rps8andndhA,respectively.
圖3 RNA編輯對基因編碼蛋白二級結(jié)構(gòu)的影響
Fig.3 Predicted secondary structures of seven proteins encoded by seven edited genes
比較分析青稞與栽培大麥以及野生大麥的RNA編輯位點的異同,發(fā)現(xiàn)青稞與栽培大麥的RNA編輯位點分布和組成完全一致,均有分布于15個基因中的35個編輯位點,而野生大麥只有34個RNA編輯位點;相比于栽培大麥和青稞,野生大麥中缺少了ndhA-563編輯位點(表3)。結(jié)合前人研究結(jié)果,比較青稞與其他七個禾本科物種的葉綠體RNA編輯位點的異同,發(fā)現(xiàn)在這8個物種中有atpA-1、ndhA-2、ndhB-2等13個位點均發(fā)生了完全編輯,暗示這些位點在禾本科物種進化中具有較高的保守性;而ndhK-1只在黑麥中發(fā)生了編輯,其他7個物種中均未發(fā)生編輯,表明其為黑麥所特異的編輯位點(表3)。
作為一種非常重要的轉(zhuǎn)錄后基因表達調(diào)控方式,RNA編輯極大地豐富了生物體的遺傳信息。在高等植物中,RNA編輯主要在葉綠體等細胞器基因組中發(fā)生。大量研究發(fā)現(xiàn),RNA編輯在植物生長發(fā)育、逆境響應(yīng)等生理生化過程中起著重要的調(diào)控作用。發(fā)現(xiàn)和鑒定RNA編輯位點是開展RNA編輯生物學(xué)功能相關(guān)研究的前提。本研究首先利用生物信息學(xué)方法,采用Prep-Cp數(shù)據(jù)庫預(yù)測得到了青稞葉綠體基因組中可能發(fā)生了RNA編輯的位點,然后基于預(yù)測結(jié)果,通過分子克隆方法對這些預(yù)測的編輯位點進行了實驗驗證。預(yù)測發(fā)現(xiàn),青稞葉綠體基因組的76個蛋白編碼基因中,有15個發(fā)生了RNA編輯,共包含35處編輯位點,而其中18個被實驗證實,暗示生物信息學(xué)預(yù)測雖然為RNA編輯的發(fā)掘與鑒定提供了一個高效、簡便的方法,但對預(yù)測結(jié)果需要進一步的實驗驗證才能保證結(jié)果的準(zhǔn)確性[30-31]。同時發(fā)現(xiàn),所有編輯位點均為胞嘧啶到尿嘧啶的變換,而且編輯位點主要發(fā)生于密碼子第二位堿基,第一位堿基變換頻率次之,而第三位沒有發(fā)現(xiàn)編輯位點,這與前人對禾本科植物葉綠體RNA編輯組成特征分析的結(jié)果相一致[34]。進一步分析還發(fā)現(xiàn),RNA編輯的發(fā)生會造成相應(yīng)的氨基酸發(fā)生改變;最常見的改變是從絲氨酸(Ser,S)到亮氨酸(Leu,L)的轉(zhuǎn)變,這與早前高等植物的葉綠體RNA編輯的特征一致[35-36]。同時,這也表明由RNA編輯所導(dǎo)致的基因個體間翻譯的蛋白質(zhì)可能存在差異,從而使得基因組具有了遺傳多樣性。RNA編輯引起相應(yīng)的蛋白結(jié)構(gòu)發(fā)生變化,由此或?qū)⒃斐傻鞍坠δ馨l(fā)生變化,而蛋白質(zhì)功能的變化如何影響或調(diào)控植株的生長發(fā)育,還有待我們更深入的研究。
圖4 RNA編輯對基因ndhA和ndhB編碼蛋白的跨膜結(jié)構(gòu)域的影響
表3 青稞與野生大麥、栽培大麥及其他7種禾本科植物葉綠體基因RNA編輯位點的比較
編輯位點列中大寫字母代表該堿基發(fā)生了編輯;+表示完全編輯;-表示未發(fā)生編輯,DNA序列中為C;(-)表示未發(fā)生編輯,DNA序列中為T;+a表示部分編輯;空格表示編輯情況未知。
Capital letters in editing site indicate edited bases;+ indicates complete editing;- indicates no editing and C encoded in DNA;(-)indicates no editing and T encoded in DNA;+a indicates partial editing;Blank indicates unknown editing.