徐 悅,王 希,申子萌,5
(1黑龍江大學(xué)現(xiàn)代農(nóng)業(yè)與生態(tài)環(huán)境學(xué)院/中國(guó)農(nóng)業(yè)科學(xué)院甜菜研究所,哈爾濱 150080;2黑龍江省普通高等學(xué)校甜菜遺傳育種重點(diǎn)實(shí)驗(yàn)室/黑龍江省甜菜工程技術(shù)研究中心,哈爾濱 150080;3國(guó)家糖料改良中心/中國(guó)農(nóng)業(yè)科學(xué)院北方糖料作物資源與利用重點(diǎn)開放實(shí)驗(yàn)室,哈爾濱 150080;4上海信致醫(yī)藥科技有限公司,上海 200000;5中資藍(lán)天生態(tài)科技(北京)有限公司,北京 100083)
可變剪接又稱選擇性剪接(Alternative Splicing,AS),指在一個(gè)mRNA 前體中通過(guò)不同的剪接方式產(chǎn)生不同的mRNA 異構(gòu)體的過(guò)程。它是真核生物中常見(jiàn)的生物學(xué)事件,是生物體產(chǎn)生多種蛋白質(zhì)的一個(gè)重要機(jī)制。在高等真核生物中,可變剪接的基本機(jī)制是相似的,然而,植物和動(dòng)物之間在基因結(jié)構(gòu)、剪接和轉(zhuǎn)錄機(jī)制方面存在著大量的差異,與之相關(guān)的可變剪接的調(diào)控也是植物特有的[1],如誘導(dǎo)開花、響應(yīng)非生物脅迫、節(jié)律現(xiàn)象等[2-4]。隨著高通量測(cè)序技術(shù)的發(fā)展,越來(lái)越多的可變剪接事件在高等植物中被發(fā)現(xiàn)。以植物為對(duì)象展開可變剪接的研究有助于幫助我們對(duì)花發(fā)育、脅迫響應(yīng)、生理適應(yīng)等多種過(guò)程的深入了解。我們可進(jìn)一步了解其性狀及關(guān)鍵基因的分子機(jī)制,為研究植物可變剪接提供新的思路。本研究介紹了可變剪接的多樣性、基本機(jī)制、研究方法以及擬南芥、大豆、水稻、玉米、甘藍(lán)型油菜可變剪接的最新進(jìn)展,發(fā)現(xiàn)了可變剪接與植物生長(zhǎng)發(fā)育、晝夜節(jié)律等方面存在一定相關(guān)性,在基因調(diào)控、蛋白質(zhì)多樣性和復(fù)雜性方面也發(fā)揮著重要作用,為未來(lái)深入研究植物可變剪接提供了幫助。
可變剪接在動(dòng)植物細(xì)胞中都有發(fā)生,可分為7 種類型(圖1):內(nèi)含子保留(Intron Retention,IR)、外顯子跳躍(Exon Skipping,ES)、互斥外顯子(Mutually Exclusive Exon,MEE)、5’端可變剪接(Alternative 5’splice Site,A5SS)、3’端可變剪接(Alternative 3’splice Site,A3SS)、首部外顯子可變剪接(Alternative First Exon,AFE)、尾部外顯子可變剪接(Alternative Last Exon,ALE)。植物中出現(xiàn)最多的類型是內(nèi)含子保留,如水稻基因中內(nèi)含子保留占可變剪接事件總數(shù)的47%以上[5],擬南芥基因中內(nèi)含子保留事件的發(fā)生約為56%[6]。
圖1 可變剪接的類型
前體mRNA 的剪接對(duì)真核基因組編碼信息的準(zhǔn)確表達(dá)起到關(guān)鍵作用。剪接過(guò)程包括識(shí)別剪接位點(diǎn)、形成剪接復(fù)合體、剪切內(nèi)含子、連接外顯子及其產(chǎn)物、復(fù)合體解散。整個(gè)過(guò)程是由剪接體執(zhí)行的,剪接體由5個(gè)小核糖核蛋白復(fù)合體(snRNPs)和非snRNP蛋白因子組成[7]。剪切位點(diǎn)的選擇不僅取決于核心剪接體成分,而且在很大程度上還取決于其他RNA 結(jié)合蛋白,主要是富含絲氨酸/精氨酸(SR)的蛋白質(zhì)和異質(zhì)核糖核蛋白(hnRNPs),它們與位于內(nèi)含子或外顯子的順式調(diào)控元件結(jié)合,從而激活或抑制剪接。SR蛋白和hnRNPs都參與了除剪接之外的轉(zhuǎn)錄后調(diào)控的各個(gè)步驟[8-10]。
可變剪接的分析及鑒定方法主要有表達(dá)序列標(biāo)簽(EST)[11-13]、cDNA微陣列技術(shù)、生物芯片法[14]、第二代測(cè)序[15]、單分子測(cè)序等。
用表達(dá)序列標(biāo)簽可以發(fā)現(xiàn)新的可變剪接位點(diǎn),但準(zhǔn)確程度要依賴EST序列數(shù)據(jù)的質(zhì)量,還要對(duì)結(jié)果進(jìn)行生物學(xué)的分析驗(yàn)證[16]。Modrek等[17]提出了EST數(shù)據(jù)預(yù)測(cè)可變剪接事件的局限性,如序列質(zhì)量好壞不定,不能覆蓋全部基因等。Sablok等[18]使用表達(dá)序列標(biāo)簽的方法,比較了蘋果、葡萄、甜橙和草莓不同果樹的可變剪接事件,分別鑒定到蘋果有2039 個(gè)可變剪接事件,葡萄有2454個(gè),甜橙有1425個(gè),草莓有444個(gè)。
cDNA 微陣列技術(shù)可大規(guī)模的進(jìn)行可變剪接分析,并且剪接效率和準(zhǔn)確性較EST 也有了大幅提升,但其設(shè)計(jì)過(guò)程和數(shù)據(jù)處理都比較復(fù)雜[19-21]。
基于生物芯片技術(shù)的研究方法主要有剪接連接點(diǎn)芯片技術(shù)和外顯子芯片技術(shù)兩種類型。利用外顯子與外顯子連接部分的片段作為探針而設(shè)計(jì)的芯片可以用來(lái)驗(yàn)證特定可變剪接的發(fā)生,并研究其表達(dá)特性,適合全基因組范圍的研究[22]。
第二代測(cè)序技術(shù)具有定量更準(zhǔn)確、可重復(fù)性更高、適用范圍更廣、分析更加可靠等優(yōu)點(diǎn),為基因組和轉(zhuǎn)錄組的深入硏究提供了可能[23-25]。全基因組測(cè)序的成本也隨著第二代測(cè)序技術(shù)的發(fā)展而逐步降低。轉(zhuǎn)錄組高通量測(cè)序?qū)τ谘芯靠勺兗艚蛹捌湔{(diào)節(jié)來(lái)說(shuō)是一個(gè)強(qiáng)有力的實(shí)驗(yàn)工具,但同時(shí)也必須要有特殊的分析方法和工具。RNA-Seq測(cè)序提供了深度的轉(zhuǎn)錄組數(shù)據(jù),可以用于識(shí)別比對(duì)組之間差異的可變剪接事件。
單分子測(cè)序技術(shù)又稱第三代測(cè)序技術(shù),測(cè)序速度極快,能夠直接對(duì)RNA 進(jìn)行測(cè)序,不需要逆轉(zhuǎn)錄[26-29]。操作過(guò)程簡(jiǎn)單,能夠較準(zhǔn)確的預(yù)測(cè)可變剪接事件,但目前單分子測(cè)序技術(shù)的數(shù)據(jù)較少,很難得到廣泛的應(yīng)用。
研究表明,60%的擬南芥內(nèi)含子都經(jīng)歷了可變剪接[30]。截至2004年,擬南芥中可變剪接的基因達(dá)到了291 個(gè),共形成679 個(gè)轉(zhuǎn)錄本[31]。Werneke 等[32]最早發(fā)現(xiàn)RCA基因可以在擬南芥的葉片中發(fā)生可變剪接,形成了44 kd和47 kd兩個(gè)同源體,并且這兩個(gè)同源體都能夠催化Rubisco的活性。邢永強(qiáng)等[33]通過(guò)GEO數(shù)據(jù)庫(kù)的RNA-seq 數(shù)據(jù),使用SUPPA2 等工具識(shí)別了擬南芥的種子、根、葉、花、花梗、節(jié)間、長(zhǎng)角果7種組織的可變剪接事件,鑒定擬南芥不同組織的可變剪接事件,結(jié)果表明,內(nèi)含子保留是可變剪接類型中占比最多的,而互斥外顯子占比最低,這也證實(shí)了內(nèi)含子保留是植物可變剪接事件中發(fā)生最多的類型。花和花梗上發(fā)生的可變剪接事件最多,而節(jié)間和長(zhǎng)角果只鑒定了少量的可變剪接事件,進(jìn)一步分析出可變剪接可對(duì)擬南芥花器官的生長(zhǎng)發(fā)育起到一定的調(diào)控作用,為研究可變剪接與植物基因生物學(xué)的關(guān)系提供了幫助。
Shen 等[34]使用高通量測(cè)序鑒定了28 個(gè)不同發(fā)育階段的大豆樣品,包括子葉、根、枝、葉、花、豆莢,還有處于不同發(fā)育階段的種子,最終發(fā)現(xiàn)超過(guò)63%的基因都經(jīng)歷了可變剪接。在分析的154469 個(gè)可變剪接事件中,內(nèi)含子保留是最豐富的類型,占所有事件的26.47%,而外顯子跳躍只占8.89%,這與擬南芥的觀察結(jié)果一致??勺兗艚釉谳^老發(fā)育階段的組織中發(fā)生的數(shù)量較低,多發(fā)生在較年輕發(fā)育階段的組織中。在剪接位點(diǎn)方面,GT-AG位點(diǎn)在所有可變剪接類型中所占比例最高,而GC-AG 是第二常見(jiàn)的剪接位點(diǎn),這也與其他植物相一致[35-36]。通過(guò)計(jì)算分析表明,可變剪接的頻率和類型的變化與基因特征和基因轉(zhuǎn)錄水平的變化顯著相關(guān)。研究表明,基因結(jié)構(gòu)和轉(zhuǎn)錄水平的變化可能在調(diào)控可變剪接中起重要作用。
Wei等[37]對(duì)節(jié)水抗旱水稻(WDR)保持系HuHan2B和輪回親本HanfengB 的轉(zhuǎn)錄組序列進(jìn)行了可變剪接復(fù)雜性分析。內(nèi)含子保留是水稻可變剪接的主要類型,占可變剪接觀察事件的42%。差異表達(dá)分析顯示,轉(zhuǎn)錄本在不同的品種和條件下會(huì)優(yōu)先表達(dá)。根據(jù)基因本體論預(yù)測(cè),HuHan2B干旱誘導(dǎo)轉(zhuǎn)錄產(chǎn)物的生物學(xué)功能在轉(zhuǎn)錄調(diào)控、葉綠體成分和非生物刺激反應(yīng)等基因中顯著富集,而在生殖發(fā)育過(guò)程中主要富集于HanFengB。此外,一些基因被證實(shí)以干旱誘導(dǎo)的方式積累新的剪接轉(zhuǎn)錄本。這些結(jié)果表明,HuHan2B 和HanFengB具有相似的可變剪接特征,但在轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)中可變剪接含量增加的基因子集可能有助于通過(guò)育種提高水稻保持系HuHan2B 的抗旱性。研究結(jié)果表明,可變剪接的復(fù)雜性通過(guò)一個(gè)多外顯子基因的轉(zhuǎn)錄本的選擇性表達(dá),促進(jìn)了遺傳網(wǎng)絡(luò)的協(xié)同調(diào)控。
Lu等[38]報(bào)道了水稻中可變剪接的基因比例較高,58%的可變剪接相關(guān)基因具有多個(gè)可變剪接事件,導(dǎo)致單個(gè)基因產(chǎn)生大量轉(zhuǎn)錄本。他們還證明了水稻中59%的可變剪接事件是特異性的。對(duì)可變剪接基因的基因結(jié)構(gòu)分析表明,水稻中76%的可變剪接事件發(fā)生在蛋白質(zhì)編碼區(qū)??勺兗艚釉谒净蛘{(diào)控、蛋白質(zhì)多樣性和復(fù)雜性方面也起著重要作用。
玉米55.3%的基因都會(huì)受到可變剪接的影響[39]。Tian 等[40]在熱帶玉米系CML288 中鑒定了3 個(gè)ZmCCA1 剪接異變體,他們通過(guò)同源克隆和3’RACE技術(shù)證實(shí)了ZmCCA1 經(jīng)歷了豐富的可變剪接。可變剪接可能受到組織類型、光周期和非生物脅迫的影響。通過(guò)克隆ZmCCA1剪接變異體,得到了一個(gè)高度保守的N末端和不同的C末端,它們受光周期、組織類型和干旱脅迫的影響。此外,ZmCCA1基因的可變事件可能發(fā)生物種特異性。因此,此研究為了解玉米ZmCCA1在玉米抗旱性中的作用奠定了基礎(chǔ),為進(jìn)一步揭示玉米赤霉病的晝夜節(jié)律、可變剪接和非生物脅迫提供了新的證據(jù)[41-42]。
可變剪接是調(diào)控植物對(duì)非生物脅迫反應(yīng)的重要機(jī)制[43-46]。肖燕等[47]在研究甘藍(lán)型油菜響應(yīng)低氮脅迫時(shí)發(fā)現(xiàn),甘藍(lán)型油菜在經(jīng)過(guò)3 h和72 h的低氮處理后,地上部和地下部都發(fā)生了可變剪接。這一發(fā)現(xiàn)說(shuō)明甘藍(lán)型油菜可以利用可變剪接的調(diào)控積極適應(yīng)低氮脅迫。
研究發(fā)現(xiàn),甘藍(lán)型油菜生長(zhǎng)發(fā)育對(duì)硼的需求遠(yuǎn)高于其他品種。韓林宏等[48]和Gu 等[49]使用高效品種Qingyou10 和低效品種Westar10 進(jìn)行對(duì)比實(shí)驗(yàn)。2 個(gè)品種無(wú)論是在缺硼還是硼充足的情況下,內(nèi)含子保留和3’端可變剪接都比其他類型的可變剪接多。在缺硼條件下,甘藍(lán)型油菜的可變剪接事件有明顯的上升,表明可變剪接可能是轉(zhuǎn)錄后調(diào)控基因表達(dá)的重要方式,可變剪接的增加可以提高分子的可塑性以適應(yīng)非生物脅迫。
隨著生物信息學(xué)、轉(zhuǎn)錄組學(xué)、測(cè)序技術(shù)的不斷進(jìn)步,越來(lái)越多的剪接體被發(fā)現(xiàn),植物的可變剪接也取得了一些新的成果。深入研究植物基因的可變剪接,將會(huì)為提高植物抗逆性、農(nóng)作物產(chǎn)量等提供幫助??勺兗艚訑?shù)據(jù)庫(kù)也在更新豐富,研究者應(yīng)結(jié)合基因特征提高預(yù)測(cè)可變剪接事件的準(zhǔn)確度。雖然目前已經(jīng)發(fā)現(xiàn)了很多剪接異變體,但對(duì)其生理功能卻知之甚少,值得進(jìn)一步研究。