李祥,劉龍,安世恒,關(guān)若冰
(河南省害蟲(chóng)綠色防控國(guó)際聯(lián)合實(shí)驗(yàn)室/河南農(nóng)業(yè)大學(xué)植物保護(hù)學(xué)院,河南鄭州,450002)
成熟的microRNA(miRNA)長(zhǎng)度約為18~35 nt,不具有開(kāi)放閱讀框(ORF),因而不能編碼蛋白質(zhì),其序列在不同物種的基因進(jìn)化上高度保守,并且在生物發(fā)育過(guò)程中miRNAs的表達(dá)表現(xiàn)出明顯的組織特異性和時(shí)間特異性(Jonas and Izaurralde,2015;Lukasik and Zielenkiewicz,2016)。miRBase Sequence Database(http://www.mirbase.org/)作為最大的miRNA信息存儲(chǔ)數(shù)據(jù)庫(kù),目前已收錄了超過(guò)48860個(gè)miRNA成熟體序列,涵蓋了包括動(dòng)物、植物和微生物在內(nèi)的271個(gè)物種(Kozomara et al.,2019)。
生物體內(nèi)絕大多數(shù)基因可能受到miRNA的調(diào)控,且同一miRNA可能調(diào)控多個(gè)功能相似甚至功能完全不相關(guān)基因的表達(dá)(Seitz and Pinzón,2017)。準(zhǔn)確識(shí)別miRNA的靶基因是明確其功能必不可少的環(huán)節(jié)。但目前,還沒(méi)有十分準(zhǔn)確、有效的預(yù)測(cè)手段,已明確了靶基因的miRNA也比較有限,不足以對(duì)后續(xù)研究提供充足的參考信息,極大限制了mi-RNA的相關(guān)研究和生產(chǎn)應(yīng)用。本研究概述了miRNA的特征、在細(xì)胞內(nèi)的形成過(guò)程、對(duì)靶基因的調(diào)控機(jī)制及其在生物體內(nèi)的功能,尤其是miRNA在昆蟲(chóng)生長(zhǎng)、發(fā)育以及植物-病原物互作中的關(guān)鍵作用,并討論了miRNA作為生物農(nóng)藥的研發(fā)潛力。在此基礎(chǔ)上,進(jìn)一步從軟件預(yù)測(cè)和試驗(yàn)分析等角度詳細(xì)論述了miRNA靶基因預(yù)測(cè)和驗(yàn)證的方法及其優(yōu)、缺點(diǎn),并指出當(dāng)前研究的不足和未來(lái)的發(fā)展方向,為今后miRNA相關(guān)研究和生產(chǎn)應(yīng)用方面提供一些思路。
生物體內(nèi)的少數(shù)miRNAs轉(zhuǎn)錄于編碼基因的內(nèi)含子區(qū)域,其產(chǎn)生會(huì)被所在基因的轉(zhuǎn)錄行為所影響;而大多數(shù)miRNAs來(lái)源于基因間的序列,通常擁有獨(dú)立的啟動(dòng)子及調(diào)控元件(Chang et al.,2015)。當(dāng)轉(zhuǎn)錄因子與miRNA轉(zhuǎn)錄序列的調(diào)控位點(diǎn)結(jié)合后,會(huì)激活RNA聚合酶II(RNA polymerase II)并在細(xì)胞核內(nèi)生成初級(jí)轉(zhuǎn)錄物,即初級(jí)miRNA(Primary miRNA,pri-miRNA)(Roden et al.,2017;Creugny et al.,2018)。有研究證實(shí),極少數(shù)pri-miRNA(如pri-mir-634)是在RNA聚合酶III的催化作用下形成(Paraboschi et al.,2017)。
miRNA成熟體的形成通常需要pri-miRNA經(jīng)過(guò)2次剪切。在動(dòng)物細(xì)胞核中,pri-miRNAs在Drosha蛋白的作用下,首先被剪切形成miRNA前體(Precursor miRNA,pre-miRNA)(Lee et al.,2003;Roden et al.,2017)。Drosha蛋白隸屬于核糖核酸酶III(RNase III)家族,通常存在于細(xì)胞核內(nèi),能特異性的識(shí)別雙鏈RNA結(jié)構(gòu)并將其剪切成3′端具有2個(gè)突出堿基的產(chǎn)物(Lee and Shin,2018)。pre-miRNA的長(zhǎng)度一般為60~80 nt,可形成典型的莖—環(huán)結(jié)構(gòu)以維持較低的自由能(Creugny et al.,2018)。核質(zhì)轉(zhuǎn)運(yùn)蛋白Exportin5(Exp5)是一種Ran-GTP依賴(lài)性蛋白,能識(shí)別并結(jié)合pre-miRNA的莖—環(huán)末端結(jié)構(gòu),并將剪切好的pre-miRNA運(yùn)出細(xì)胞核。進(jìn)入細(xì)胞質(zhì)后,GTP發(fā)生去磷酸化反應(yīng)變?yōu)镚DP,同時(shí)釋放pre-miRNA(Kim et al.,2016)。在此過(guò)程中,Exp5不僅承擔(dān)了運(yùn)輸功能,還保護(hù)著pre-miRNA不被其他酶類(lèi)降解(Zeng and Cullen,2006;Wu et al.,2018)。
在細(xì)胞質(zhì)中,RNase III家族的另一個(gè)成員Dicer將對(duì)pre-miRNA進(jìn)行第二次剪切,形成一個(gè)不穩(wěn)定的miRNA:miRNA*復(fù)合體(Sand,2014)。在此過(guò)程中,TRBP(Transactivation-response RNA-binding protein)和PACT(Protein kinase R-activating protein)兩類(lèi)輔助蛋白能大幅提高Dicer對(duì)miRNA:miRNA*復(fù)合體的親和力并從中挑選出合適的miRNA成熟體;其中,TRBP負(fù)責(zé)對(duì)底物進(jìn)行識(shí)別和定位(Komori et al.,2020),PACT則促進(jìn)了Dicer的剪切過(guò)程(Wilson et al.,2015)。在miRNA:miRNA*復(fù)合體中,穩(wěn)定性較高的miRNA即成為miRNA成熟體,并將協(xié)同AGO、Dicer等蛋白共同形成miRNA沉默誘導(dǎo)復(fù)合體(miRNA-induced silencing complex,miRISC),另一個(gè)miRNA則會(huì)在細(xì)胞內(nèi)被迅速降解(Krol et al.,2010;Carthew et al.,2017)。如果這兩個(gè)miRNAs的5'末端的穩(wěn)定性相近,則有可能形成2種不同的miRNA成熟體以及相應(yīng)的miRISC(Sheu-Gruttadauria and MacRae,2018)(圖1)。
植物miRNA的形成方式與動(dòng)物存在明顯的差異,最典型的差異是植物中不存在Drosha或與其同源的蛋白(Chorostecki et al.,2017)。但在擬南芥()中 發(fā) 現(xiàn) 了Dicer的 同 源 物DCL1,并證明了DCL1主要在細(xì)胞核內(nèi)表達(dá),并參與了pre-miRNA和miRNA成熟體的形成過(guò)程(Suarez et al.,2015),因而推測(cè)DCL1表現(xiàn)出類(lèi)似Drosha或Dicer的功能。需要注意的是,植物miRNA通常在細(xì)胞核內(nèi)被加工成熟,而動(dòng)物miRNA的成熟通常發(fā)生在細(xì)胞質(zhì)中,進(jìn)一步佐證了上述推斷。此外,植物中HYL1的功能與動(dòng)物中的TRBP和PACT相似,均發(fā)揮協(xié)同催化的作用;植物中HST則是Exp5的同源物,被認(rèn)為是miRNA-miRNA*復(fù)合體運(yùn)出細(xì)胞核的載體蛋白(Mengistu and Tenkegna,2021)。
圖1 miRNA在動(dòng)物體內(nèi)的生物合成過(guò)程(Ameres and Zamore,2013)Fig.1 miRNA biogenesis process in animals(Ameres and Zamore,2013)
成熟的miRNA會(huì)協(xié)同AGO、Dicer、TRBP、PACT等元件形成miRISC,并通過(guò)對(duì)mRNA進(jìn)行降解或翻譯抑制兩種不同的作用機(jī)制來(lái)實(shí)現(xiàn)其沉默效應(yīng)(Tang,2005;Liu et al.,2017)。miRNA與靶基因序列的互補(bǔ)程度則決定了具體的調(diào)控機(jī)制。
大多數(shù)植物miRNA與其靶標(biāo)mRNA的序列幾乎完全互補(bǔ),其作用機(jī)制與siRNA形成的RISC相類(lèi)似(郝大海和龔明,2020),即與mRNA結(jié)合后,miRISC引導(dǎo)其中的外切酶和內(nèi)切酶同時(shí)作用,降解所在的mRNA。反應(yīng)完成后,miRISC被完整的釋放出來(lái)并參與下一個(gè)剪切事件(Samad et al.,2017)。值得注意的是,植物miRNA與靶基因的結(jié)合位點(diǎn)可能存在于整個(gè)mRNA序列;而動(dòng)物miRNA的結(jié)合位點(diǎn)通常定位在mRNA的3'UTR。與植物不同的是,動(dòng)物miRNA僅在靠近5'端的少數(shù)序列與靶基因完全互補(bǔ),而其余序列的互補(bǔ)程度則很低,使得miRNA在動(dòng)物體內(nèi)的主要作用方式為翻譯抑制。目前普遍認(rèn)為在動(dòng)物體內(nèi)miRISC能在不破壞mRNA結(jié)構(gòu)的前提下,抑制其翻譯過(guò)程中的某個(gè)階段,導(dǎo)致無(wú)法合成或減少合成相應(yīng)的蛋白產(chǎn)物(Ameres and Zamore,2013;Gebert and Macrae,2019)。動(dòng)物中多數(shù)miRNAs與靶標(biāo)mRNA的結(jié)合位點(diǎn)位于3'UTR,極大降低了靶基因的預(yù)測(cè)范圍。但越來(lái)越多的研究報(bào)道指出,miRNA-mRNA的結(jié)合位點(diǎn)也可能存在于靶基因的編碼區(qū)(CDS)和5'UTR(Baizhigitova et al.,2018),這使得研究者需要重新評(píng)估和審視以前的研究。
目前對(duì)于miRNA的功能研究主要采用反向遺傳學(xué)的方法。一方面通過(guò)突變靶基因的結(jié)合位點(diǎn)來(lái)觀(guān)察miRNA的結(jié)合情況以及相應(yīng)的表型變化,另一方面通過(guò)過(guò)表達(dá)或抑制miRNA的表達(dá)水平來(lái)觀(guān)察所造成的影響(Gebert et al.,2019)。大多數(shù)miRNAs行使調(diào)控作用時(shí),往往是微調(diào)(Fine-tune)靶基因的表達(dá)水平使其維持適宜的表達(dá)豐度,因此,改變miRNA的表達(dá)量并不一定能觀(guān)察到十分明顯的表型變化。在探索miRNA的功能時(shí),研究者通常采用高通量測(cè)序加生物信息學(xué)分析的方法,明確miRNA的時(shí)空表達(dá)特性,并根據(jù)miRNA與mRNA的序列互補(bǔ)程度和結(jié)合穩(wěn)定性預(yù)測(cè)其靶基因,然后結(jié)合分子生物學(xué)手段對(duì)miRNA與mRNA的互作關(guān)系進(jìn)行驗(yàn)證,并根據(jù)靶基因的作用判斷miRNA的功能。
植物miRNA與靶基因的結(jié)合序列幾乎完全互補(bǔ),極大提高了靶基因預(yù)測(cè)的準(zhǔn)確性(崔俊霞等,2018)。已知的植物miRNA靶基因中,很多都是在生長(zhǎng)發(fā)育中起關(guān)鍵調(diào)控作用的轉(zhuǎn)錄因子基因(Zhang et al.,2006a;Reichel et al.,2015)。Pandey等(2019)指出,植物miRNA可通過(guò)抑制細(xì)胞分化過(guò)程中的關(guān)鍵基因控制植物細(xì)胞發(fā)育的方向。動(dòng)物miRNA的功能鑒定相對(duì)困難。由于“不完全匹配”的機(jī)制,動(dòng)物miRNA的靶基因預(yù)測(cè)會(huì)產(chǎn)生大量的假陽(yáng)性結(jié)果,必須經(jīng)過(guò)嚴(yán)格的試驗(yàn)驗(yàn)證才能確定。與植物一樣的是,動(dòng)物miRNA的靶基因中也包含大量轉(zhuǎn)錄因子基因,并在生物體生長(zhǎng)發(fā)育過(guò)程中發(fā)揮重要功能(Vorozheykin and Titov,2020)。更多的研究表明,miRNA表現(xiàn)出能調(diào)控大多數(shù)生理和病理過(guò)程的潛力,包括發(fā)育階段的劃分、干細(xì)胞分化、神經(jīng)發(fā)育、細(xì)胞生長(zhǎng)和凋亡、激素分泌、脂類(lèi)代謝、病變和癌癥等(Llave and Carrington,2002;Vikram et al.,2015)。此外,不同外部因子或內(nèi)部生理變化所導(dǎo)致的表達(dá)差異暗示了miRNA具有更廣泛的作用。近年來(lái),生物信息學(xué)分析結(jié)果表明,miRNA具有多元化的調(diào)控路徑,甚至具備調(diào)控所有生理活動(dòng)的潛力(Gebert and Macrae,2019)。
作為生物體內(nèi)一類(lèi)重要的調(diào)控因子,miRNA廣泛參與了昆蟲(chóng)的生長(zhǎng)發(fā)育、生殖、代謝、免疫防御等絕大多數(shù)的生理生化過(guò)程。在果蠅中,通過(guò)敲除AGO蛋白阻止miRNAs發(fā)揮功能,能顯著抑制其卵母細(xì)胞的形成(Azzam et al.,2012),且構(gòu)建基因缺失的突變品系能阻礙果蠅卵母細(xì)胞的成熟(Nakahara et al.,2005)。在褐飛虱()中抑制基因的表達(dá),獲得了與果蠅相似的表型(Zhang et al.,2013)。、等通過(guò)調(diào)節(jié)Notch信號(hào)通路和骨形態(tài)發(fā)生蛋白信號(hào)通路中關(guān)鍵基因的表達(dá),可阻止果蠅的生殖干細(xì)胞(Germline stem cells)分 化(Poulton et al.,2011;Li et al.,2012),而啟動(dòng)生殖干細(xì)胞的分化也同樣需要miRNA的調(diào)控(如)(Pek et al.,2009)。昆蟲(chóng)神經(jīng)系統(tǒng)發(fā)育同樣需要miRNA的參與,如(Li and Carthew,2005)、(Loya et al.,2009)、(Weng and Cohen,2012)等;缺失這些miRNAs的表達(dá)則會(huì)導(dǎo)致神經(jīng)退行性功能缺失、神經(jīng)干細(xì)胞分化異常、信號(hào)傳導(dǎo)受阻等發(fā)育或功能缺陷。是參與昆蟲(chóng)邊界形成的關(guān)鍵基因之一,能通過(guò)抑制基因的表達(dá)從而阻止果蠅翅芽盤(pán)(Wing imaginal discs)的細(xì)胞增殖;基因被抑制后,其靶基因大量表達(dá),該基因又進(jìn)一步促進(jìn)了翅芽盤(pán)上背—腹軸向的分化(Becam et al.,2011)?;虻臅r(shí)序性表達(dá)從時(shí)間維度上控制了翅芽盤(pán)上的細(xì)胞增殖,缺失的果蠅翅尺寸會(huì)明顯減?。–aygill and Johnston,2008)。
miRNA對(duì)昆蟲(chóng)變態(tài)發(fā)育中的激素代謝、蛻皮行為、組織降解和重建同樣具有重要的調(diào)控作用(Ylla et al.,2016;Belles,2017)。在果蠅的整個(gè)發(fā)育過(guò)程中,多個(gè)miRNAs的表達(dá)水平與蛻皮和變態(tài)過(guò)程密切相關(guān)。蛻皮激素功能通路中的關(guān)鍵基因能顯著上調(diào)、、等基因的表達(dá)水平,并抑制基因的表達(dá),共同維護(hù)蛻皮過(guò)程的有序進(jìn)行(Sempere et al.,2002,2003)。能靶向果蠅中蛻皮激素的受體基因,從而形成一個(gè)反饋調(diào)控環(huán),以維持蛻皮激素的適宜滴度并適時(shí)啟動(dòng)或終止相應(yīng)的蛻皮過(guò)程(Varghese and Cohen,2007)。在家蠶()中,同樣能作用于蛻皮激素調(diào)控網(wǎng)絡(luò)的多個(gè)基因和步驟,共同維持生長(zhǎng)發(fā)育的有序性(He et al.,2019a,2019b)。通過(guò)負(fù)調(diào)控轉(zhuǎn)錄因子dLMO來(lái)控制果蠅翅發(fā)育過(guò)程的細(xì)胞凋亡,塑造適宜的翅形(Epstein et al.,2017);在褐飛虱的長(zhǎng)、短翅型分化和發(fā)育中,基因能響應(yīng)寄主營(yíng)養(yǎng)水平和胰島素受體基因的信號(hào)調(diào)控,通過(guò)調(diào)節(jié)基因的適宜表達(dá)水平來(lái)促進(jìn)種群向長(zhǎng)翅化或短翅化發(fā)展(Li et al.,2021)。這也間接說(shuō)明miRNA對(duì)昆蟲(chóng)生理生化過(guò)程的調(diào)控作用存在一定的保守性,在今后的應(yīng)用實(shí)踐中,應(yīng)經(jīng)過(guò)合理的篩選和驗(yàn)證,基于miRNA調(diào)控作用的藥劑開(kāi)發(fā)可兼顧特異性和廣譜性雙重優(yōu)勢(shì)。
miRNA不僅通過(guò)作用于轉(zhuǎn)錄因子來(lái)調(diào)控植物自身的生長(zhǎng)發(fā)育,還參與植物與病原物的“斗爭(zhēng)”。這些致病微生物通過(guò)表達(dá)或誘導(dǎo)寄主植物表達(dá)某些miRNAs來(lái)抑制寄主的免疫防御,協(xié)同致病過(guò)程(Umbach and Cullen,2009)。例如丁香假單胞菌()侵染擬南芥時(shí),通過(guò)誘導(dǎo)寄主過(guò)表達(dá)來(lái)抑制自身防御基因和的轉(zhuǎn)錄,關(guān)閉植物的免疫過(guò)程(Niu et al.,2016)。黃瓜花葉病毒(Cucumber mosaic virus)通過(guò)編碼一種2b蛋白與寄主植物的AGO1蛋白競(jìng)爭(zhēng)性結(jié)合,從而阻礙植物對(duì)自身miRNA的加工和修飾,導(dǎo)致由miRNA介導(dǎo)的寄主防御反應(yīng)受到抑制(Zhang et al.,2006b)。另一方面,植物在抵御致病微生物的侵染時(shí),會(huì)有目的地上調(diào)或下調(diào)一些內(nèi)源性miRNAs的表達(dá),用于激活自身免疫系統(tǒng),以提高對(duì)病原物的抗性。當(dāng)煙草受到煙草花葉病毒(Tobacco mosaic virus)侵染時(shí),通過(guò)降低自身的表達(dá)水平來(lái)促進(jìn)免疫基因的表達(dá),以抵御該病毒(Jiang et al.,2019)。
利用基因編輯或轉(zhuǎn)基因技術(shù),可有目的地使植物過(guò)表達(dá)某些特定的miRNAs,從而沉默病原物的關(guān)鍵致病基因。該項(xiàng)技術(shù)已應(yīng)用于水稻、番茄、煙草等作物的品種選育(Schwab et al.,2006;Ossowski et al.,2008)。例如,在煙草基因組中插入人工構(gòu)建的miRNA前體序列,使其特異性地過(guò)表達(dá)目的miRNA片段,可以沉默馬鈴薯Y病毒(Potato virus Y)的致病基因HC-Pro和馬鈴薯X病毒(Potato virus X)中的致病基因p25,最終削弱這兩種病毒對(duì)煙草的致病能力(Ai et al.,2011)。針對(duì)田間多種病害混合發(fā)生的現(xiàn)狀,可以針對(duì)病原物致病基因的保守序列構(gòu)建miRNA表達(dá)載體,以拓寬農(nóng)作物的抗病譜(Zheng and Qu,2015)。
隨著高通量測(cè)序技術(shù)和生物信息學(xué)的發(fā)展,生物中大量miRNA被相繼鑒定出來(lái)。一些miRNAs通過(guò)作用于昆蟲(chóng)、植物或病原微生物中的關(guān)鍵基因,從而調(diào)控昆蟲(chóng)的生長(zhǎng)發(fā)育和植物-病原物的互作過(guò)程,在農(nóng)業(yè)害蟲(chóng)防治和植物抗病免疫等方面顯示出非常好的應(yīng)用潛力?;赗NA沉默技術(shù)的生物農(nóng)藥研發(fā)也因此成為可持續(xù)植保發(fā)展的熱點(diǎn)研究領(lǐng)域。但如何從包含成百上千個(gè)miRNAs的生物轉(zhuǎn)錄組中準(zhǔn)確篩選和鑒定出對(duì)靶標(biāo)基因具有調(diào)控作用的mi-RNA成為限制該領(lǐng)域發(fā)展的一個(gè)難題。早在21世紀(jì)初期,Lai(2002)比對(duì)了果蠅中調(diào)控基因和基因的11個(gè)miRNAs,結(jié)果發(fā)現(xiàn)二者的miRNAs 5'端的前8個(gè)堿基(實(shí)際為靠近5'端的6個(gè)堿基)與靶基因序列能精確互補(bǔ),稱(chēng)這些堿基為種子序列(Seed region),并推測(cè)種子序列是miRNA發(fā)揮轉(zhuǎn)錄后調(diào)控作用的關(guān)鍵因素。這一發(fā)現(xiàn)確立了以種子序列為依據(jù)進(jìn)行miRNA靶基因預(yù)測(cè)的計(jì)算機(jī)理論基礎(chǔ)。迄今為止,尚未發(fā)現(xiàn)比利用種子序列進(jìn)行預(yù)測(cè)更準(zhǔn)確的手段。近十幾年來(lái),逐步確立了以種子序列為核心,miRNA-mRNA復(fù)合體的熱穩(wěn)定性和二級(jí)結(jié)構(gòu)為依據(jù)的理論體系,并誕生多種各具特色的預(yù)測(cè)軟件(Chen et al.,2018)。
miRanda是首個(gè)以miRNA與潛在靶基因之間熱力學(xué)穩(wěn)定性為依據(jù)進(jìn)行預(yù)測(cè)的軟件,該軟件不受物種限制,還可在Windows、Linux等多種操作平臺(tái)上進(jìn)行不聯(lián)網(wǎng)運(yùn)行(Ahmadi et al.,2013)。miRanda強(qiáng)調(diào)miRNA與靶基因互補(bǔ)序列在進(jìn)化上的保守性,主要參考miRNA 5'端序列與靶序列之間C:G、A:U、G:U的配對(duì)情況進(jìn)行熱穩(wěn)定性評(píng)估,并構(gòu)建出相應(yīng)的打分矩陣,同時(shí)根據(jù)miRNA 5'端和3'端各自的互補(bǔ)特性進(jìn)行區(qū)別評(píng)分。用戶(hù)還可根據(jù)實(shí)際需要自行定義閾值,從而篩除不穩(wěn)定的復(fù)合體(Ahmadi et al.,2013;程爽等.,2018)。此后,更多基于熱力學(xué)穩(wěn)定性的miRNA靶基因預(yù)測(cè)軟件被相繼開(kāi)發(fā)。例如,RNAhybrid算法強(qiáng)調(diào)根據(jù)結(jié)合能來(lái)推算最佳結(jié)合位點(diǎn),并獲得最穩(wěn)定的配對(duì)模式,避免了miRNA和靶基因之間形成無(wú)關(guān)的復(fù)合體結(jié)構(gòu)(Krüger and Rehmsmeier,2006;Pio et al.,2014)。PITA算法僅根據(jù)靶基因的3′UTR對(duì)已形成穩(wěn)定二級(jí)結(jié)構(gòu)的序列進(jìn)行剔除(Beretta et al.,2017;Kertesz et al.,2017),但出現(xiàn)跨度較大的互補(bǔ)配對(duì)情況或較大的二級(jí)結(jié)構(gòu)時(shí),該算法會(huì)產(chǎn)生一部分假陽(yáng)性結(jié)果。
基于miRNA與靶基因的作用方式,以及不同miRNAs間的序列比對(duì)分析,Miranda等(2006)開(kāi)發(fā)了第二代預(yù)測(cè)軟件——RNA22。該軟件是首個(gè)不使用同源保守信息進(jìn)行預(yù)測(cè)的軟件,具有很強(qiáng)的靈活性,可將靶點(diǎn)的預(yù)測(cè)范圍延伸至整個(gè)mRNA序列。RNA22以Rfam 3.0數(shù)據(jù)庫(kù)中miRNA成熟體為訓(xùn)練集合,采用一種模糊匹配的模式進(jìn)行預(yù)測(cè)。該算法將供試序列分割成靶點(diǎn)島(Target island),并依次評(píng)估與miRNA的結(jié)合情況來(lái)尋找假定結(jié)合位點(diǎn)(Miranda et al.,2006;Plotnikova and Skoblov,2018)。
種子序列通常在物種之間的保守性很高,研究者可根據(jù)靶基因序列的同源性進(jìn)行預(yù)測(cè)。TargetScan是目前使用頻率最高的預(yù)測(cè)軟件。該算法提出了“假陽(yáng)性率”的概念,并根據(jù)物種之間的保守性原則對(duì)預(yù)測(cè)結(jié)果進(jìn)行二次評(píng)估(Agarwal et al.,2015)。TargetScan首先搜索并比對(duì)不同物種之間的mRNA 3'UTR序列的保守區(qū)域,然后根據(jù)miRNA與潛在靶標(biāo)的3'UTR及其周?chē)蛄械幕パa(bǔ)程度進(jìn)行綜合評(píng)估(Lewis et al.,2005;Wu et al.,2017)。該算法以保守性為主要依據(jù),其局限性在于不能對(duì)具有物種特異性的互補(bǔ)情況進(jìn)行有效預(yù)測(cè)。TargetScan S則是在TargetScan基礎(chǔ)上進(jìn)行了優(yōu)化,不再對(duì)miRNA非種子序列區(qū)域與靶序列匹配的自由能進(jìn)行評(píng)估,而是增加對(duì)人類(lèi)、鼠、狗、雞等一些進(jìn)化距離較遠(yuǎn)的物種進(jìn)行保守性分析,進(jìn)一步提高了預(yù)測(cè)的準(zhǔn)確性(Huang et al.,2019)。
miRNA不僅可調(diào)控多個(gè)mRNAs,也可作用于同一mRNA的多個(gè)位點(diǎn)。基于此現(xiàn)象,對(duì)多個(gè)結(jié)合位點(diǎn)進(jìn)行同時(shí)預(yù)測(cè)時(shí),可通過(guò)增加信噪比參數(shù)對(duì)預(yù)測(cè)結(jié)果進(jìn)行適當(dāng)?shù)睾Y除。盡管這種算法可能會(huì)過(guò)濾一些真實(shí)靶標(biāo),但其優(yōu)勢(shì)在于預(yù)測(cè)結(jié)果更加準(zhǔn)確(Ritchie et al.,2009a,2009b)。PicTar主要應(yīng)用于脊椎動(dòng)物和無(wú)脊椎動(dòng)物中的miRNA靶基因預(yù)測(cè),是多靶標(biāo)和多結(jié)合位點(diǎn)預(yù)測(cè)的代表算法。該算法不僅能同時(shí)評(píng)估多個(gè)結(jié)合位點(diǎn),還對(duì)miRNA-mRNA結(jié)合能力進(jìn)行綜合評(píng)估,甚至允許種子序列出現(xiàn)不完全匹配的情況,并進(jìn)行區(qū)別打分(Sarker et al.,2011)。此外,該算法還考慮了結(jié)合位點(diǎn)的保守性因素,并關(guān)聯(lián)了多個(gè)網(wǎng)站的miRNA信息數(shù)據(jù)庫(kù)。
一些miRNA通過(guò)降解mRNA來(lái)阻斷其翻譯過(guò)程(Ameres and Zamore,2013;Samad et al.,2017),因此,在miRNA表達(dá)活躍的區(qū)域,相應(yīng)的靶基因表達(dá)水平通常較低。檢測(cè)特定組織中miRNA與mRNA表達(dá)量的關(guān)系,也是靶基因篩選的一個(gè)重要手段(Jing et al.,2016;Ye et al.,2019)。該方法不同于匹配原則的算法,可以對(duì)基于序列互補(bǔ)原則而獲得的結(jié)果進(jìn)行二次篩選,另一個(gè)優(yōu)勢(shì)在于不單純依賴(lài)于3′UTR進(jìn)行預(yù)測(cè)。但在動(dòng)物中,一些miRNAs并不能直接影響mRNA的表達(dá)水平,或者影響十分微弱,導(dǎo)致很多真實(shí)的結(jié)果被忽視,此時(shí)可用檢測(cè)相關(guān)蛋白的表達(dá)水平代替對(duì)mRNA的檢測(cè)。
miRNA參與了生物體內(nèi)大多數(shù)的生理生化過(guò)程(Llave and Carrington,2002;Lim et al.,2005),因此,可根據(jù)其功能分類(lèi)對(duì)無(wú)關(guān)的預(yù)測(cè)結(jié)果進(jìn)行剔除。mirBridge算法錨定一組或一類(lèi)已知功能的mRNA,有針對(duì)性的對(duì)這些潛在靶標(biāo)進(jìn)行排查(Tsang et al.,2010)。此算法適用于一些具有特殊功能的基因或通路研究,但對(duì)于尚未進(jìn)行功能劃分的miRNA和mRNA無(wú)法預(yù)測(cè)。
隨著miRNA-mRNA互作研究成果的不斷積累,一些研究者或機(jī)構(gòu)建立了多種miRNA數(shù)據(jù)庫(kù),以整合miRNA及其靶基因的相關(guān)信息。starBase(http://starbase.sysu.edu.cn/)網(wǎng)站較為全面的收錄了由miRNA介導(dǎo)的mRNA降解組和CLIP-Seq等高通量測(cè)序數(shù)據(jù),包含了miRNA-mRNA、miRNA-lncRNA、miRNA-ceRNA等多種互作模式下的miRNA靶標(biāo)信息。ChIPBase(http://deepbase.sysu.edu.cn/chipbase/)偏向于探討miRNA的轉(zhuǎn)錄和轉(zhuǎn)錄后調(diào)控作用,構(gòu)建了比較系統(tǒng)的“轉(zhuǎn)錄因子-miRNA-靶基因”調(diào)控網(wǎng)絡(luò)。Tarbase(http://microrna.gr/tarbase/)側(cè)重于收集已被試驗(yàn)證實(shí)過(guò)的miRNA靶基因信息。此外,PMRD主要收錄植物miRNA的數(shù)據(jù)信息,miRGator v2.0則重點(diǎn)整合了疾病相關(guān)miRNA的研究結(jié)果。鑒于miRNA在序列和功能方面的保守性,收錄的研究結(jié)果被廣泛借鑒于當(dāng)前的研究。但受限于miRNA相關(guān)研究的不系統(tǒng)性,這些網(wǎng)站建立的數(shù)據(jù)庫(kù)仍不夠全面。
盡管目前已存在大量各具特色的預(yù)測(cè)軟件,但這些算法主要依賴(lài)于miRNA與靶基因的互補(bǔ)潛力進(jìn)行預(yù)測(cè),并強(qiáng)調(diào)種子序列的重要性。由于miRNAmRNA復(fù)合體允許一定程度的錯(cuò)配、跳躍、G:U配對(duì)的情況出現(xiàn),在很大程度上會(huì)出現(xiàn)許多錯(cuò)誤的預(yù)測(cè)結(jié)果。在實(shí)際研究中,需要對(duì)預(yù)測(cè)的結(jié)果進(jìn)行進(jìn)一步分析和驗(yàn)證。
miRNA的靶基因驗(yàn)證試驗(yàn)最初是以線(xiàn)蟲(chóng)體為研究對(duì)象,通過(guò)構(gòu)建miRNA缺失的突變體以獲得相反表現(xiàn),從而證明miRNA與mRNA的調(diào)控關(guān)系(Lee et al.,1993)。這種方法受基因編輯技術(shù)等因素的局限,無(wú)法在生物中推廣使用。Vatolin等(2006)、Andachi(2008)將一段已知序列的特異性接頭連接至miRNA后進(jìn)行反轉(zhuǎn)錄和擴(kuò)增,進(jìn)一步通過(guò)定量分析或高通量測(cè)序的方法成功鑒定出、LIN-14等靶基因。
當(dāng)前驗(yàn)證miRNA與靶基因的互作關(guān)系時(shí),通常是人為構(gòu)建出一套表達(dá)系統(tǒng)用于模擬相應(yīng)的調(diào)控過(guò)程,并檢測(cè)mRNA表達(dá)的蛋白產(chǎn)物含量。報(bào)告基因檢測(cè)系統(tǒng)是驗(yàn)證miRNA與靶基因互作時(shí)最常見(jiàn)的研究手段。當(dāng)miRNA與mRNA上的作用位點(diǎn)結(jié)合后,能有效抑制其翻譯過(guò)程,并顯著減少蛋白產(chǎn)物的含量(Huang et al.,2020;Li et al.,2021)。將包含潛在結(jié)合位點(diǎn)的一部分或全部序列連接至報(bào)告基因(通常為熒光素酶基因)CDS的下游,并將構(gòu)建好的重組質(zhì)粒導(dǎo)入細(xì)胞系內(nèi)進(jìn)行表達(dá);同時(shí)將miRNA的模擬物或表達(dá)載體共同轉(zhuǎn)染至細(xì)胞系中,經(jīng)過(guò)一段時(shí)間后檢測(cè)熒光強(qiáng)度或者熒光素酶的活性。為核實(shí)miRNA與靶基因的作用位點(diǎn),還可將結(jié)合位點(diǎn)序列進(jìn)行突變,從而反向觀(guān)察結(jié)合情況,檢測(cè)報(bào)告基因的表達(dá)水平,用以驗(yàn)證預(yù)測(cè)位點(diǎn)的真?zhèn)危≧itchie et al.,2010;Ye et al.,2019)。當(dāng)細(xì)胞系內(nèi)源表達(dá)的miRNAs包含供試miRNA時(shí),也可通過(guò)外源轉(zhuǎn)入miRNA的抑制劑(如Inhibitors或Sponge vectors)對(duì)其表達(dá)進(jìn)行抑制(Tang et al.,2017;Zhang et al.,2018)。經(jīng)過(guò)miRNA處理后的細(xì)胞系,報(bào)告基因表達(dá)的蛋白產(chǎn)物可通過(guò)Western雜交、免疫組化、流式細(xì)胞術(shù)等方法進(jìn)行定量分析(任禹珂等,2021)。需要指出的是,報(bào)告基因檢測(cè)系統(tǒng)中miRNA和結(jié)合序列是在人工干預(yù)的異源系統(tǒng)里進(jìn)行相互作用,而在活體中miRNA和靶基因的表達(dá)均存在時(shí)空特異性;克隆到載體上的序列可能會(huì)因?yàn)槎?jí)結(jié)構(gòu)發(fā)生變化而產(chǎn)生假陽(yáng)性或假陰性的結(jié)果;細(xì)胞系內(nèi)復(fù)雜多樣的生理生化過(guò)程也可能會(huì)干擾試驗(yàn)結(jié)果。
病蟲(chóng)害的頻繁發(fā)生一直是限制農(nóng)業(yè)發(fā)展的重要難題?;瘜W(xué)農(nóng)藥是當(dāng)前防治病蟲(chóng)害的主要手段,但其不合理的使用造成了嚴(yán)重的環(huán)境問(wèn)題和人畜安全問(wèn)題。選育抗病蟲(chóng)品種往往費(fèi)時(shí)費(fèi)力,難以滿(mǎn)足生產(chǎn)的迫切需求?;赗NA沉默技術(shù)的RNA生物農(nóng)藥的研發(fā)帶來(lái)了新的農(nóng)藥革命,該方法可用于殺蟲(chóng)劑、殺菌劑、除草劑等多種新型農(nóng)藥的研制,并兼具特異性強(qiáng)、環(huán)境友好等特點(diǎn),為可持續(xù)植保的發(fā)展提供了新的途徑(Dhandapani et al.,2019;Niehl and Heinlein,2019)。
鑒于miRNA在動(dòng)物和植物中的重要功能,開(kāi)發(fā)miRNA生物農(nóng)藥成為未來(lái)病蟲(chóng)害防治的重要選擇。如何使目的miRNA成功作用于靶標(biāo)生物,是利用該技術(shù)進(jìn)行病蟲(chóng)害防治的關(guān)鍵。目前主要總結(jié)了兩種miRNA遞送方式:一種是利用轉(zhuǎn)基因或基因編輯技術(shù)使植物內(nèi)源表達(dá)目的miRNA片段,待病原物侵染或昆蟲(chóng)取食時(shí),miRNA進(jìn)入有害生物體內(nèi)發(fā)揮相應(yīng)的功能,該方式被稱(chēng)為寄主誘導(dǎo)的基因沉默(Hostinduced gene silencing);另一種方式是將體外合成的功能性miRNA經(jīng)過(guò)穩(wěn)定性處理制作成相應(yīng)的殺菌劑或殺蟲(chóng)劑,直接施用在作物上,該方式被稱(chēng)為噴灑誘導(dǎo)的基因沉默(Spray-induced gene silencing)(Wang and Jin,2017;Zotti et al.,2018)。迄今為止,至少有5項(xiàng)基于RNAi原理的生物農(nóng)藥獲準(zhǔn)在田間投入使用,展現(xiàn)出了良好的應(yīng)用前景。但需要指出的是,并不是所有的植物都能通過(guò)轉(zhuǎn)基因技術(shù)培育商業(yè)化的抗病蟲(chóng)品種,也不可能做到同時(shí)防治多種病蟲(chóng)害。對(duì)于外源施用的RNA生物農(nóng)藥,除了較高的生產(chǎn)成本外,在田間的穩(wěn)定性和持效性也一直是研究人員需要解決的難題。此外,為了避免脫靶效應(yīng)和潛在的安全風(fēng)險(xiǎn),miRNA的序列設(shè)計(jì)和靶基因的篩選均必須經(jīng)過(guò)嚴(yán)密的科學(xué)論證。
經(jīng)過(guò)十余年的發(fā)展,miRNA靶基因的預(yù)測(cè)和鑒定已發(fā)展成為一門(mén)較為系統(tǒng)的學(xué)科,為miRNA的功能鑒定和應(yīng)用研發(fā)提供了便利。本研究對(duì)當(dāng)前mi-RNA靶基因預(yù)測(cè)和驗(yàn)證的研究方法進(jìn)行較為系統(tǒng)地概述和比較,不僅指出這些方法的優(yōu)勢(shì)和特色,還認(rèn)識(shí)到當(dāng)前研究手段的不足。通常,miRNA-mRNA復(fù)合體的形成需要考慮時(shí)間和空間上的特異性,因此,基于序列匹配的算法預(yù)測(cè)實(shí)際上并不能真實(shí)反應(yīng)生物體內(nèi)的相互作用模式?,F(xiàn)有的預(yù)測(cè)方法是在不丟失真實(shí)靶標(biāo)的原則下盡量剔除無(wú)關(guān)結(jié)果,但受限于目前的miRNA理論研究的不足,想要兼顧預(yù)測(cè)的靈敏度和精確度仍有較大的距離。鑒于各種算法各有其利弊,學(xué)者們通常利用多個(gè)算法或手段分別進(jìn)行預(yù)測(cè)后,再對(duì)結(jié)果集合進(jìn)行比對(duì)。
對(duì)于今后miRNA靶基因預(yù)測(cè)領(lǐng)域的發(fā)展,可著重關(guān)注以下3個(gè)方面:(1)miRNA和mRNA的互補(bǔ)配對(duì)要考慮表達(dá)時(shí)間和空間上的一致性;(2)盡管已有不少算法增加了RNA二級(jí)結(jié)構(gòu)分析,但對(duì)于較長(zhǎng)序列的結(jié)構(gòu)預(yù)測(cè)仍缺乏準(zhǔn)確性,預(yù)測(cè)時(shí)也沒(méi)有考慮規(guī)避蛋白結(jié)合位點(diǎn)等功能區(qū)域;(3)miRNA-mRNA復(fù)合體的形成及穩(wěn)定性機(jī)制方面的研究仍不夠完善,現(xiàn)有的理論基礎(chǔ)不能很好的支撐新算法的研發(fā)。在驗(yàn)證預(yù)測(cè)結(jié)果時(shí),還應(yīng)注意以下情況:(1)miRNA過(guò)表達(dá)時(shí)通常能使其表達(dá)水平上調(diào)成百上千倍,可能會(huì)引起一些副作用并干擾了其他內(nèi)源基因的表達(dá);(2)人工干預(yù)下的靶基因驗(yàn)證系統(tǒng)往往忽略了miRNA和mRNA的組織特異性表達(dá)特性;(3)改變miRNA的表達(dá)水平可能導(dǎo)致上千個(gè)基因的轉(zhuǎn)錄水平發(fā)生變化,但這種變化可能來(lái)自于靶基因變化而引起的間接調(diào)控;(4)不同miRNA在與靶基因結(jié)合過(guò)程中可能存在競(jìng)爭(zhēng)或者協(xié)同作用,單一改變某個(gè)miRNA的含量可能無(wú)法模擬出真實(shí)的情況;(5)miRNA對(duì)靶基因的上調(diào)作用在目前的研究中往往被忽視。