崔俊霞,魏康寧,謝伊源,王 麗,李用芳
(河南師范大學(xué) 生命科學(xué)學(xué)院,河南 新鄉(xiāng) 453007)
MicroRNA(miRNA)是一類真核生物體內(nèi)普遍存在的具有重要調(diào)控功能的內(nèi)源非編碼小分子RNA (sRNA),長(zhǎng)度在20~24 nt[1]。植物miRNA與植物的生長(zhǎng)、發(fā)育、代謝以及脅迫存在著密切的聯(lián)系[2],預(yù)測(cè)并驗(yàn)證miRNA調(diào)控的靶基因是闡明miRNA在生物體內(nèi)功能的前提。植物miRNA主要通過(guò)剪切機(jī)制導(dǎo)致靶基因被降解,也可通過(guò)抑制翻譯對(duì)靶基因進(jìn)行調(diào)控,個(gè)別miRNA還可以通過(guò)誘導(dǎo)靶基因DNA甲基化來(lái)調(diào)控靶基因的表達(dá)[3]。在這3種機(jī)制中,miRNA介導(dǎo)的靶基因被剪切和翻譯被抑制方面的研究較為深入,因此,可以根據(jù)miRNA對(duì)靶基因的作用方式對(duì)靶基因進(jìn)行試驗(yàn)驗(yàn)證。簡(jiǎn)要介紹了植物miRNA產(chǎn)生過(guò)程的最新研究進(jìn)展以及靶基因的預(yù)測(cè)方法,重點(diǎn)綜述了植物miRNA靶基因的驗(yàn)證方法,旨在更深入地研究植物miRNA介導(dǎo)的轉(zhuǎn)錄后調(diào)控機(jī)制,并為利用miRNA改良植物品種提供理論指導(dǎo)。
植物MIRNA(miRNA基因)首先在細(xì)胞核內(nèi)由Ⅱ型RNA聚合酶(Pol Ⅱ)轉(zhuǎn)錄出能形成發(fā)夾結(jié)構(gòu)的初級(jí)轉(zhuǎn)錄物pri-miRNA[4-5],再在以DCL1 (Dicer-like 1)、HYL1(Hyponastic leaves 1)和SE (Serrate)為核心組分的切割復(fù)合體的作用下經(jīng)第一次剪切形成pre-miRNA,經(jīng)第二次剪切形成miRNA∶miRNA*復(fù)合體[6-8]。該復(fù)合體在甲基轉(zhuǎn)移酶HEN1 (Hua enhancer 1)作用下3′端被甲基化[9],然后在HASTY蛋白的作用下被釋放到細(xì)胞質(zhì)中[10-11]。復(fù)合體miRNA∶miRNA*轉(zhuǎn)運(yùn)到細(xì)胞質(zhì)后,成熟的miRNA與AGO1 (Argonaute 1)蛋白結(jié)合形成RNA誘導(dǎo)沉默復(fù)合體(RNA-induced silencing complex,RISC),miRNA通過(guò)堿基互補(bǔ)配對(duì)方式引導(dǎo)RISC識(shí)別靶基因并對(duì)靶基因進(jìn)行調(diào)控,而miRNA*則被降解[12-14](圖1)。然而近年研究發(fā)現(xiàn),有些miRNA*的豐度比miRNA還高,甚至可調(diào)控靶基因并導(dǎo)致靶基因被剪切,表明miRNA*不僅僅是miRNA的伴隨鏈,可能還有其他生物學(xué)功能[15-19]。
圖1 植物miRNA的轉(zhuǎn)錄、成熟及對(duì)靶基因的調(diào)控作用
植物miRNA基因是一種非編碼基因,近年來(lái)的研究發(fā)現(xiàn),miRNA基因同編碼基因一樣也受到多種因子的調(diào)控。有些因子參與pri-miRNA的轉(zhuǎn)錄過(guò)程,如轉(zhuǎn)錄因子共激活因子Mediator 有助于Pol Ⅱ結(jié)合到MIRNA的啟動(dòng)子區(qū)域[20],轉(zhuǎn)錄因子NOT2(Negative on TATA less 2)、CCD5(Cell division cycle 5)及延伸復(fù)合體(Elongation complex)與Pol Ⅱ相互作用,可促進(jìn)MIRNA的轉(zhuǎn)錄[21-23],此外,激酶CDKF;1(Cyclin-dependent kinase F;1)和CDKD (Cyclin-dependent kinase D)可通過(guò)磷酸化影響Pol Ⅱ的活性[24](圖1)。另外一些因子參與miRNA的成熟過(guò)程,HYL1 有助于DCL1的精準(zhǔn)剪切,最近研究表明,其活性和穩(wěn)定性受磷酸化影響,CPL(C-terminal domain phosphatase-like)和PP4 (Protein phosphatase 4)通過(guò)對(duì)HYL1脫磷酸化穩(wěn)定HYL1,從而促進(jìn)miRNA的產(chǎn)生[25-26],RCF3 (Regulator of CBF gene expression 3) 可促進(jìn)CPL對(duì)HYL1的脫磷酸化作用[27]。而激酶MPK3(Mitogen-activated protein kinase 3)和SnRK2 (SNF1-related protein kinase subfamily 2) 對(duì)HYL1的作用與CPL和PP4正好相反[28-29]。COP1 (Constitutive photomorphogenic 1) 受光信號(hào)影響在細(xì)胞質(zhì)和細(xì)胞核中的移動(dòng)也會(huì)影響HYL1的穩(wěn)定性和生物活性[30](圖1)。
此外,還有多種影響mRNA轉(zhuǎn)錄、拼接和成熟的蛋白質(zhì)對(duì)miRNA的產(chǎn)生也有調(diào)控作用。Yu 等[31]根據(jù)作用特點(diǎn)將這些蛋白質(zhì)分為2類:一類參與從pri-miRNA到miRNA的加工過(guò)程,如帽子結(jié)合蛋白CBP80、CBP20[22],STA1 (Stabilized 1)[32],SICKLE[33],RNA結(jié)合蛋白TOUGH和AtGRP7 (Glycine-rich RNA-binding protein 7)[34-35],PINP1 (PSR1-interacting protein 1)[36],MOS2 (Modifier of SNC1,2)[37],這些蛋白質(zhì)基因突變導(dǎo)致體內(nèi)miRNA豐度比野生型低,但miRNA前體累積;而另一類蛋白質(zhì)基因的突變不僅導(dǎo)致miRNA的量減少,而且pri-miRNA的豐度也降低,PRL1(Protein pleiotropic regulatory locus 1) 和DDL (DAWDLE)[21-23]則屬于這一類,這些基因不僅影響MIRNA的轉(zhuǎn)錄,也可能參與pri-miRNA的后續(xù)加工。
通常情況下植物miRNA與靶位點(diǎn)序列有著完美或近乎完美的互補(bǔ)配對(duì),因此可以采用生物信息學(xué)方法預(yù)測(cè)靶基因[38]。預(yù)測(cè)的標(biāo)準(zhǔn)是根據(jù)兩者的互補(bǔ)程度,通過(guò)罰分機(jī)制進(jìn)行預(yù)測(cè)。在miRNA-靶位點(diǎn)之間1個(gè)錯(cuò)配堿基對(duì)罰分為1,G∶U搖擺配對(duì)罰分為0.5。在miRNA的2~12 nt的核心區(qū)域不允許超過(guò)1個(gè)錯(cuò)配堿基對(duì),在10位和11位不允許有錯(cuò)配或G∶U配對(duì),當(dāng)miRNA與靶位點(diǎn)的罰分≤4時(shí),認(rèn)為該mRNA是miRNA的潛在靶位點(diǎn)[39-40]。miRU是第1個(gè)預(yù)測(cè)植物miRNA靶基因的軟件[41],該軟件后來(lái)升級(jí)為psRNATarget[42]。多種軟件如Psrobot[40]、Targetfinder[43]、Target-align[44]、 p-TAREF[39]等陸續(xù)被研發(fā)用于植物miRNA靶基因的預(yù)測(cè)。此外,植物miRNA靶基因數(shù)據(jù)庫(kù)PMTED (Plant miRNA target expression database)不僅可用于檢索和分析miRNA靶基因的表達(dá)情況,還可用于預(yù)測(cè)新miRNA的靶基因并了解靶基因的表達(dá)信息[45]。這些軟件為系統(tǒng)研究miRNA分子的功能提供了極大的便利,但是生物信息學(xué)預(yù)測(cè)的靶基因中存在大量的假陽(yáng)性[46]。而有些真正的靶基因錯(cuò)配罰分高達(dá)5.5,甚至有些在miRNA的10位和11位之間存在錯(cuò)配或G∶U配對(duì)[47],因此預(yù)測(cè)植物miRNA靶基因的標(biāo)準(zhǔn)直接影響到預(yù)測(cè)結(jié)果的可信度。若采用罰分≤4,將丟失一些真正的靶基因,但若采用罰分<6,預(yù)測(cè)的靶基因中相當(dāng)一部分并不是真正的靶基因,所以理論上預(yù)測(cè)的靶基因尚有待于進(jìn)一步的試驗(yàn)驗(yàn)證。
植物miRNA靶基因的驗(yàn)證可以從miRNA對(duì)靶基因的作用方式入手。由miRNA介導(dǎo)的靶基因被剪切,可以用RLM-5′RACE(RNA ligase-mediated 5′rapid amplification of cDNA ends)[44]和降解組測(cè)序(Degradome sequencing)進(jìn)行驗(yàn)證[48-50]。而miRNA介導(dǎo)的翻譯被抑制則主要采用報(bào)告基因系統(tǒng)進(jìn)行驗(yàn)證,根據(jù)驗(yàn)證靶基因的試驗(yàn)體系,又可分為瞬時(shí)共表達(dá)[47-51]和轉(zhuǎn)基因系統(tǒng)[52]。
miRNA介導(dǎo)的靶基因mRNA被降解時(shí)會(huì)產(chǎn)生2個(gè)片段(5′剪切片段和3′剪切片段),其中3′剪切片段比較穩(wěn)定,有一個(gè)暴露的5′單磷酸基團(tuán)和polyA尾巴。RLM-5′RACE和降解組測(cè)序均利用這2個(gè)特點(diǎn)對(duì)靶基因進(jìn)行驗(yàn)證,并可對(duì)靶基因的剪切位點(diǎn)進(jìn)行精準(zhǔn)定位。
RLM-5′RACE的原理是用RNA連接酶在3′剪切片段的5′磷酸基團(tuán)處連接一個(gè)RNA接頭,然后用 Oligo(dT) 或基因特異性引物(GSP)進(jìn)行反轉(zhuǎn)錄,再用與RNA接頭對(duì)應(yīng)的上游引物和基因特異性下游引物擴(kuò)增mRNA斷口附近的核苷酸序列,進(jìn)一步通過(guò)克隆和測(cè)序分析來(lái)判斷斷口是否是miRNA的剪切位點(diǎn),從而確定是否是miRNA的靶基因[48,53]。該方法具有相對(duì)簡(jiǎn)單、方便快捷等優(yōu)點(diǎn),已被廣泛應(yīng)用于植物miRNA靶基因的驗(yàn)證。但由于其驗(yàn)證結(jié)果單一,每個(gè)試驗(yàn)只能驗(yàn)證1個(gè)靶基因,如果要同時(shí)對(duì)多個(gè)或大量靶基因進(jìn)行分析驗(yàn)證時(shí),則存在工作量大、費(fèi)時(shí)費(fèi)力的缺點(diǎn),隨后發(fā)展起來(lái)的降解組文庫(kù)測(cè)序分析則克服了這一弊端。
降解組測(cè)序技術(shù)結(jié)合了RLM-5′RACE、高通量測(cè)序和生物信息學(xué)分析的優(yōu)勢(shì),可以對(duì)細(xì)胞或組織中miRNA介導(dǎo)的mRNA 的3′剪切片段進(jìn)行深度分析[49-50]。Zhai等[54]對(duì)該技術(shù)進(jìn)一步改進(jìn),將index序列引入不同文庫(kù)中,因此可將多個(gè)降解組文庫(kù)混合后測(cè)序。降解組測(cè)序技術(shù)包括文庫(kù)構(gòu)建、高通量測(cè)序和生物信息學(xué)分析。與RLM-5′RACE一樣,首先連接一個(gè)RNA接頭,該RNA接頭的特點(diǎn)是3′端有IIS型限制性內(nèi)切酶MmeⅠ的識(shí)別位點(diǎn),經(jīng)反轉(zhuǎn)錄得到cDNA和PCR簡(jiǎn)單擴(kuò)增,然后用MmeⅠ對(duì)PCR產(chǎn)物進(jìn)行酶切,再將此片段與3′雙鏈DNA 接頭連接并進(jìn)行 PCR擴(kuò)增,經(jīng)純化即得到降解組文庫(kù)(圖2)。再經(jīng)高通量測(cè)序即可得到整個(gè)轉(zhuǎn)錄組水平miRNA剪切位點(diǎn)下游20~21個(gè)核苷酸序列[49-50]。
圖2 降解組文庫(kù)的構(gòu)建
高通量測(cè)序產(chǎn)生的海量降解組序列需要結(jié)合生物信息學(xué)分析才能確定miRNA的靶標(biāo)mRNA。目前常用的分析降解組文庫(kù)的生物信息學(xué)軟件有CleaveLand和SeqTar (SEQuencing-based sRNA TARget prediction),兩者均是將降解組文庫(kù)序列與待測(cè)物種的基因組序列或mRNA 數(shù)據(jù)庫(kù)比對(duì),舍棄不能匹配的序列,保留匹配的序列。其目的是將降解組序列匹配到待測(cè)物種的mRNA上,從而得到被剪切的mRNA的完整序列,由剪切位點(diǎn)向mRNA的5′端延伸即可得到完整的sRNA候選互補(bǔ)序列,再將此序列與測(cè)序物種的miRNA數(shù)據(jù)庫(kù)比對(duì),根據(jù)miRNA與靶位點(diǎn)的互補(bǔ)程度和第10位附近剪切信號(hào)強(qiáng)度確定潛在的miRNA靶基因[55-56]。CleaveLand嚴(yán)格限制了miRNA與靶位點(diǎn)間的堿基錯(cuò)配數(shù)目,不允許miRNA在10~11位與其靶基因存在錯(cuò)配或者G∶U搖擺配對(duì);而SeqTar放寬了miRNA與靶位點(diǎn)互補(bǔ)配對(duì)出現(xiàn)錯(cuò)配的限定條件,允許miRNA的第10~11位存在錯(cuò)配或G∶U搖擺配對(duì),并允許 miRNA有效剪切位點(diǎn)可對(duì)應(yīng)于miRNA第9、10位及11位[56],這意味著CleaveLand會(huì)忽略一些真正的靶基因,而SeqTar通過(guò)放寬的標(biāo)準(zhǔn)可找到比CleaveLand更多的miRNA靶基因。
降解組測(cè)序是近年來(lái)研究植物miRNA靶基因的主要技術(shù),具有高通量、高效率、低成本的特點(diǎn),利用該技術(shù)已成功分析驗(yàn)證了擬南芥[49]、大豆[50]、水稻[47]、玉米[57]等20多種植物miRNA的靶基因[58-60]。
瞬時(shí)表達(dá)是一種高效的活體驗(yàn)證體系。應(yīng)用瞬時(shí)共表達(dá)(Transient co-expression)驗(yàn)證miRNA與目的基因相互關(guān)系的原理是miRNA對(duì)靶基因的負(fù)調(diào)控作用,如果目的基因是miRNA的靶基因,則其表達(dá)蛋白質(zhì)的量將受到過(guò)量表達(dá)的miRNA的限制,反之則不受影響。試驗(yàn)過(guò)程包括將miRNA前體和目的基因分別插入超表達(dá)載體,然后轉(zhuǎn)化到農(nóng)桿菌中,用注射或浸染方法使農(nóng)桿菌感染煙草葉片下表皮細(xì)胞,之后即可檢測(cè)外源基因的表達(dá)或蛋白質(zhì)水平[47,51,56]。浸染時(shí)不僅有miRNA前體和目的基因共同浸染,同時(shí)有miRNA前體、目的基因和空載體單獨(dú)浸染作為對(duì)照,可用Northern blot或RT-qPCR來(lái)檢測(cè)目的基因mRNA表達(dá)水平的變化[47,56]。植物miRNA主要介導(dǎo)靶基因被降解,但是也存在翻譯被抑制的現(xiàn)象,有些miRNA對(duì)翻譯的抑制強(qiáng)度遠(yuǎn)遠(yuǎn)高于miRNA介導(dǎo)的靶基因降解[11,61],對(duì)于此類miRNA的靶基因可應(yīng)用Western blot 技術(shù)進(jìn)行驗(yàn)證,然而由于特異性抗體的限制,miRNA介導(dǎo)的靶基因翻譯抑制主要是通過(guò)報(bào)告基因系統(tǒng)來(lái)驗(yàn)證。
雙熒光素酶(Dual-luciferase)報(bào)告基因早已被廣泛用于驗(yàn)證動(dòng)物miRNA對(duì)靶基因的翻譯抑制[62]。報(bào)告基因載體中含有2種能同時(shí)表達(dá)的熒光素酶基因,包括螢火蟲螢光素酶基因(Fireflyluciferase,F(xiàn)-luc)和海腎螢光素酶基因(Renillaluciferase,R-luc),F(xiàn)-luc為主要報(bào)告基因,R-luc為內(nèi)參報(bào)告基因。若目的基因片段被過(guò)量表達(dá)的miRNA抑制,則F-luc的翻譯受阻,而R-luc的翻譯不受影響,此時(shí)F-luc/R-luc活性比值下降,從而可以確定miRNA對(duì)目的基因具有直接調(diào)控作用。Liu等[51,57]根據(jù)植物miRNA與靶基因相互作用的特點(diǎn)構(gòu)建了2個(gè)雙熒光素酶表達(dá)載體系統(tǒng),一個(gè)是將miRNA 靶位點(diǎn)序列插入F-luc的編碼區(qū),另一個(gè)是將miRNA 靶位點(diǎn)序列插入F-luc的3′UTR區(qū)(www.addgene.org,載體編號(hào)為55206、55207)。試驗(yàn)方法與前述的瞬時(shí)共表達(dá)一樣,在煙草葉片細(xì)胞中進(jìn)行,但是在構(gòu)建表達(dá)載體時(shí)僅僅是將靶位點(diǎn)序列而非靶基因的序列克隆到表達(dá)載體中[51,57]。該技術(shù)的優(yōu)勢(shì)在于miRNA與靶基因的相互作用不僅可以在蛋白質(zhì)水平(F-luc/R-luc活性)檢測(cè),而且還可以在mRNA水平(RT-qPCR)進(jìn)行定量。此外,該方法是通過(guò)檢測(cè)2種熒光素酶報(bào)告基因的蛋白質(zhì)或mRNA水平來(lái)評(píng)判,因此該檢測(cè)方法對(duì)所有的miRNA與靶位點(diǎn)都適用。
由于瞬時(shí)共表達(dá)不需要將外源基因整合到宿主染色體上,所以不受基因的位置效應(yīng)和基因沉默的影響,因此具有操作簡(jiǎn)單、周期短、見效快和表達(dá)效率高的優(yōu)勢(shì),且瞬時(shí)共表達(dá)不會(huì)產(chǎn)生可遺傳的子代,生物安全性高,所以在分子生物學(xué)研究中被廣泛應(yīng)用。但這種方法與RLM 5′ RACE一樣每次只能驗(yàn)證miRNA的單一靶基因,不適用于大量靶基因的驗(yàn)證,此外該技術(shù)根據(jù)miRNA與靶基因的負(fù)相關(guān)性判斷目的基因是否是miRNA的靶基因,無(wú)法對(duì)miRNA的靶位點(diǎn)進(jìn)行準(zhǔn)確定位。
Sunkar等[52]確認(rèn)了miR398的靶基因Cu/Zn超氧化物歧化酶基因CSD1和CSD2,首次揭示了miRNA與脅迫的關(guān)系。通過(guò)對(duì)擬南芥轉(zhuǎn)基因過(guò)量表達(dá)突變的miR398或?qū)iR398具有抗性的CSD2,驗(yàn)證了miR398對(duì)CSD的轉(zhuǎn)錄后調(diào)控。賈小云等[63]以轉(zhuǎn)基因番茄和野生番茄為材料,揭示了miR828與其靶基因SlMyb7-like的相關(guān)性。Chuck等[64]在柳枝稷中過(guò)量表達(dá)玉米miR156基因,結(jié)果發(fā)現(xiàn),柳枝稷營(yíng)養(yǎng)生長(zhǎng)階段延長(zhǎng)且不開花,驗(yàn)證了其靶基因SPL調(diào)控生長(zhǎng)發(fā)育進(jìn)程。然而由于轉(zhuǎn)基因需要周期長(zhǎng),該技術(shù)較少用于驗(yàn)證miRNA靶基因,其主要用途是靶基因的功能驗(yàn)證。
迄今為止,有關(guān)植物miRNA分析研究的報(bào)道很多,針對(duì)miRNA靶基因的預(yù)測(cè)及分析工具也不斷涌現(xiàn),這在一定程度上可以幫助人們挖掘miRNA的靶基因,但是如何提高預(yù)測(cè)靶基因的準(zhǔn)確性是各種預(yù)測(cè)工具面臨的共同問(wèn)題。由于靶基因的試驗(yàn)驗(yàn)證技術(shù)要求高、費(fèi)時(shí)費(fèi)力、花費(fèi)大,通過(guò)試驗(yàn)驗(yàn)證的miRNA靶基因大多屬于保守型miRNA的靶基因,而驗(yàn)證的非保守型miRNA靶基因的數(shù)目非常有限,靶基因的驗(yàn)證已成為研究和應(yīng)用miRNA的瓶頸。雙熒光素酶報(bào)告基因系統(tǒng)能有效檢測(cè)miRNA是否在翻譯水平對(duì)靶基因有抑制作用,但是目前尚缺乏有效的從整體水平研究植物miRNA介導(dǎo)的翻譯抑制的技術(shù)。降解組測(cè)序能有效地分析整個(gè)轉(zhuǎn)錄組水平miRNA介導(dǎo)的靶基因降解,但由于降解組測(cè)序只能得到20~21個(gè)有效堿基序列,有些片段能同時(shí)定位到多個(gè)位點(diǎn),這些無(wú)法準(zhǔn)確定位的潛在靶基因以及降解組分析預(yù)測(cè)的新靶基因還有待于采用RLM 5′RACE或瞬時(shí)共表達(dá)技術(shù)進(jìn)一步驗(yàn)證,因此多種手段的綜合利用是驗(yàn)證植物miRNA靶基因的趨勢(shì)。此外,已驗(yàn)證的靶基因多是大量表達(dá)的保守型miRNA的靶基因,如何發(fā)現(xiàn)并驗(yàn)證低豐度miRNA的靶基因則是今后努力的方向。