姜雪鷗,鐘金城
(動物遺傳育種學(xué)國家民委-教育部重點(diǎn)實(shí)驗(yàn)室,西南民族大學(xué),四川成都610041)
小分子DNA(miRNA)是一類存在于動植物體內(nèi)、大小為21~25 nt的內(nèi)源性非編碼單鏈小分子RNA,對生物體轉(zhuǎn)錄后的基因表達(dá)調(diào)控起關(guān)鍵作用[1]。1993年,首次在秀麗隱桿線蟲中發(fā)現(xiàn)miRNA let-4;7年后,在果蠅中發(fā)現(xiàn)第2個miRNA let-7。在進(jìn)化中的保守性分析使科學(xué)家驚異地發(fā)現(xiàn)miRNA let-7的形成至少需要有Drosha/DGCR8(Pasha)、Dicer等2種RNA酶(RNaseⅢ)的參與。Drosha/DGCR8定位于細(xì)胞核內(nèi),它能剪切miRNA前體轉(zhuǎn)錄物(pri-miRNA),從而釋放出具有發(fā)夾結(jié)構(gòu)、大小為70 nt左右的pre-miRNA,后者在轉(zhuǎn)運(yùn)受體Exportin-5(Exp5)的作用下被轉(zhuǎn)運(yùn)至細(xì)胞質(zhì),然后被胞質(zhì)中的另一種RNaseⅢ蛋白Dicer剪切,最終被加工成成熟的miRNA[2]。動物的miRNA位于前體mRNA的內(nèi)含子中,這種安排將使mRNA基因和內(nèi)含子中miRNA共同轉(zhuǎn)錄。近年來,發(fā)現(xiàn)和鑒定的miRNAs越來越多,但植物miRNAs僅占很小一部分,且主要集中于擬南芥和水稻等少數(shù)模式植物中,植物miRNA的靶基因大多編碼轉(zhuǎn)錄因子,與植物的生長、發(fā)育密切相關(guān);而在動物和人中發(fā)現(xiàn)大量miRNA,已證實(shí)在動物的生長、發(fā)育和疾病發(fā)生等過程中起重要作用。
近幾年來,人們對miRNA的研究方興未艾,進(jìn)展十分迅速。有一些研究報道指出,miRNA在調(diào)節(jié)植物對環(huán)境脅迫如干旱、鹽害和養(yǎng)分的脅迫反應(yīng)等方面起著重要的作用[3]。成熟的miRNA先與一種稱為RNA誘導(dǎo)沉默復(fù)合體(RNA-induced silencing complex,RISC)的復(fù)合物結(jié)合,再特異性地與目標(biāo)mRNA結(jié)合,引起靶mRNA的降解。由于植物miRNA與其靶mRNA具有很高的堿基互補(bǔ)性,因而植物miRNA的作用方式可能更像小分子RNA干涉(small interfering RNA,siRNA),即RNA干涉對靶基因進(jìn)行降解,miRNA所調(diào)節(jié)的靶基因控制著植物的根、葉、花等形態(tài)發(fā)生,細(xì)胞分化,輸導(dǎo)組織形成等植物生長發(fā)育的各個方面,大多數(shù)miRNA通過調(diào)節(jié)轉(zhuǎn)錄因子影響細(xì)胞分化和器官發(fā)生[4]。
與植物相反,在動物細(xì)胞中大多數(shù)miRNA與其靶mRNA并不完全互補(bǔ),miRNA則通過與對應(yīng)mRNA的3′端非翻譯區(qū)(3′UTR)結(jié)合阻止轉(zhuǎn)錄后的翻譯,從而起到調(diào)節(jié)基因表達(dá)的作用。對動物的研究,從線蟲時序發(fā)育中l(wèi)in-4、let-7的功能被揭示以來,miRNA功能研究不斷得益于miRNA基因功能喪失的突變體。bantam基因突變果蠅由于細(xì)胞數(shù)量減少(而不是細(xì)胞體積減?。┒斐杀纫吧偷膫€體小,相反,bantam過量表達(dá)則會導(dǎo)致果蠅翅膀和眼組織過度生長[5]。此后,Brennecke[6]等證實(shí)bantam miRNA通過控制前凋亡基因hid來促進(jìn)細(xì)胞增殖和抑制凋亡。mir-14的缺陷加速了由細(xì)胞死亡激活劑Reaper誘導(dǎo)的細(xì)胞死亡,并導(dǎo)致了應(yīng)急反應(yīng)和脂肪代謝缺陷[7],發(fā)現(xiàn)mir-14與細(xì)胞凋亡和脂肪代謝有關(guān)。而迄今為止,已經(jīng)預(yù)測出上千個哺乳動物miRNA的靶基因,它們對參與調(diào)控基因有著很強(qiáng)的嗜性,例如F$′G參與翻譯抑制的蛋白、miRNA的組成成分和編碼的轉(zhuǎn)錄因子的基因等,但也有許多編碼結(jié)構(gòu)蛋白和酶的基因,暗示miRNA在多種生理過程中具有調(diào)控作用。
在人類miRNA的研究中,Calin等[8]發(fā)現(xiàn)約有50%的miRNAs基因位于與腫瘤相關(guān)的染色體區(qū)域內(nèi),如染色體發(fā)生雜合性缺失的區(qū)域、發(fā)生重排和擴(kuò)增及斷裂點(diǎn)的區(qū)域等,提示miRNA基因的表達(dá)可能與腫瘤發(fā)生相關(guān)。此外,已有研究表明,miRNA對細(xì)胞的增殖、分化、凋亡和癌癥發(fā)生有重要的調(diào)控作用[9],其在正常組織和腫瘤組織中的表達(dá)有著顯著差異,有些miRNA會在腫瘤組織中有低表達(dá),有些則在腫瘤組織中有高表達(dá)[10],這說明miRNA在腫瘤發(fā)生過程中起了至關(guān)重要的作用。Calin等[11]研究發(fā)現(xiàn)患有一種成年型B細(xì)胞慢性淋巴型白血病(CLL)的病人常有mir-15a、mir-16基因簇的缺失或表達(dá)下調(diào),65%的CLL病人、50%的外套細(xì)胞淋巴瘤病人、16%~40%的骨髓瘤病人、60%的前列腺癌病人中有13 q14位點(diǎn)的缺失,顯示miRNA可能起到抑癌基因作用。進(jìn)一步研究發(fā)現(xiàn)mir-15a和mir-16可通過抑制BCL-2基因的表達(dá)水平而阻止癌癥的發(fā)生。Lu等[12]研究發(fā)現(xiàn),較少的miRNAs(約200個)表達(dá)譜就可以對人類癌癥進(jìn)行診斷和分類,與mRNA表達(dá)譜(5%)相比,其準(zhǔn)確度高達(dá)70%。近來發(fā)現(xiàn)的一簇miRNA,mir-17-92多順反子,定位于人B細(xì)胞瘤中DNA擴(kuò)增區(qū)域,對其研究結(jié)果表明,mir-17-92簇可能為潛在的致癌基因。Takamizawa[13]等發(fā)現(xiàn),肺癌患者中 let-7miRNA 表達(dá)水平降低,且let-7水平降低的患者在手術(shù)切除后存活時間更短;此外,在體外高表達(dá)let-7的肺腺癌細(xì)胞系A(chǔ)549可抑制肺癌細(xì)胞的生長。Johnson[14]等研究表明,let-7 miRNA在線蟲和人瘤細(xì)胞系中負(fù)調(diào)控RasGTP酶癌基因家族,暗示let-7可能是腫瘤抑制基因。Chan[15]等發(fā)現(xiàn)mir-21在惡性腦瘤和神經(jīng)膠質(zhì)細(xì)胞瘤中顯著高表達(dá),并且mir-21可能通過阻止關(guān)鍵凋亡相關(guān)基因的表達(dá)而促進(jìn)惡性表型。
miRNA除了在多細(xì)胞生物中發(fā)揮重要的調(diào)節(jié)作用外,還廣泛存在于單細(xì)胞生物中。單細(xì)胞生物中的miRNA,都可在體內(nèi)和體外對靶標(biāo)mRNA進(jìn)行切割,這與植物中發(fā)現(xiàn)的miRNA一致,但與多細(xì)胞生物中的miRNA具有顯著差異,這提示miRNA通路形成于這兩條進(jìn)化支系分離之前,而且單細(xì)胞生物中的miRNA是獨(dú)立進(jìn)化而來的[16]。近年來的研究表明,一些病毒也編碼大量的miRNAs,它們在病毒的復(fù)制和感染過程中發(fā)揮著至關(guān)重要的作用[17]。
自從第一個miRNA發(fā)現(xiàn)以來,已經(jīng)出現(xiàn)了多種鑒定、預(yù)測、分析miRNA的方法,這些方法各有優(yōu)缺點(diǎn),主要有以下幾種方法。
該方法是首先從細(xì)胞組織中提取總RNA,用聚丙烯酰胺凝膠進(jìn)行電泳,回收大小為20~25個核苷酸的RNA分子,利用T4連接酶,直接將人工合成的3′和5′接頭連接到RNA上,經(jīng)PCR反轉(zhuǎn)錄擴(kuò)增這些序列,建立miRNAs的cDNA文庫,進(jìn)行克隆、測序,然后用生物信息學(xué)軟件定位其在基因組中的位置,并驗(yàn)證是否具有發(fā)夾結(jié)構(gòu)的前體和該發(fā)夾結(jié)構(gòu)在其它物種中的保守性,最后將具有發(fā)夾結(jié)構(gòu)的小分子RNA進(jìn)行Northern雜交等來檢測其表達(dá)情況,將符合miRNA標(biāo)準(zhǔn)的小分子RNA鑒定為新的 miRNA[18]。
表1 第一代miRNA靶基因預(yù)測軟件
表2 第二代miRNA靶基因預(yù)測軟件
動植物中的miRNA可以用直接克隆的方法加以鑒定。一些實(shí)驗(yàn)室已經(jīng)建立了不同組織、不同發(fā)育時期或不同生長條件下的miRNA基因文庫[21]。但該方法對低豐度miRNAs的鑒定卻相當(dāng)困難,且不可避免大量的重復(fù)測序[22]。由于大部分成熟的miRNAs序列是高度保守的,所以可以通過表達(dá)序列標(biāo)簽(EST)和基因組序列(GSS)的生物信息學(xué)比對,來搜索或預(yù)測在其他生物中的未知miRNAs,再根據(jù)miRNAs與靶基因mRNAs完全或部分互補(bǔ)的特性預(yù)測其靶基因[23]。實(shí)驗(yàn)證明,生物信息學(xué)方法是預(yù)測和發(fā)現(xiàn)新的miRNA的一個有效方法,它是以基因組序列和計算機(jī)程序鑒定為基礎(chǔ)的方法[24]。目前,通過各種計算機(jī)軟件以及其他計算工具已經(jīng)成功地預(yù)測和鑒定了動植物中的大多數(shù)miRNA[25]。近年來,許多實(shí)驗(yàn)室開發(fā)出了應(yīng)用于預(yù)測miRNA及其靶基因的計算機(jī)軟件(表 1,表 2)[26],這些軟件各有優(yōu)缺點(diǎn),主要依據(jù)miRNA靶位點(diǎn)的保守性、miRNA與其靶位點(diǎn)的互補(bǔ)性、miRNA-mRNA雙鏈之間的熱穩(wěn)定性及附近序列的二級結(jié)構(gòu)等信息編寫其程序。其中TargetScan提出了“種子區(qū)”的概念,增加了預(yù)測的精確度;miRanda是將miRNA-mRNA之間的序列匹配,保守性及熱穩(wěn)定性作為計算參數(shù),有比較好的檢出率,但是假陽性率也較高;DIANA-microT則主要考慮miRNA調(diào)控單個靶基因的情況,同時考慮中央突起以及miRNA在3′端與mRNA的結(jié)合;RNAhybrid的研究重點(diǎn)在RNA二級結(jié)構(gòu)預(yù)測方面,能夠更快速準(zhǔn)確地計算miRNA-mRNA雙鏈的自由能,降低了假陽性率;部分學(xué)者的研究結(jié)果顯示,PicTar和TargetScan這兩種軟件的預(yù)測方法、預(yù)測的靶位點(diǎn)在整體上是相似的,而與其他多數(shù)軟件的預(yù)測結(jié)果則相去甚遠(yuǎn)。但RNA22與其他算法不同,不考慮物種間的保守性,檢出率較高。通過比較分析這些miRNA和靶基因預(yù)測軟件,大致可將其分為第一代和第二代兩大類預(yù)測軟件。第一代miRNA及其靶基因預(yù)測軟件主要側(cè)重以下3點(diǎn):①靶基因非翻譯區(qū)的跨物種保守性;②靶基因與種子序列的互補(bǔ)性;③miRNA靶基因二聚體熱力學(xué)穩(wěn)定性。而第二代預(yù)測軟件是在第一代預(yù)測軟件的基礎(chǔ)上大多從“突破物種間保守”來設(shè)計的,如microTar、miTarget等引入了機(jī)器學(xué)習(xí)方法來提取特征參數(shù),嘗試從統(tǒng)計學(xué)的角度更好地反應(yīng)miRNA與靶基因相互作用的真實(shí)過程,以彌補(bǔ)保守性這個限制而丟失了的靶基因,取得了一定程度的成功。目前,很難評價哪種方法是最好的。盡管各種方法的基本原理都是相關(guān)的,但由于動物miRNA的靶位點(diǎn)很小,而且miRNA與靶位點(diǎn)是不完全互補(bǔ),因此計算方法中極小的差別就能產(chǎn)生相差很遠(yuǎn)的預(yù)測結(jié)果。并且對于計算位點(diǎn)保守性的得分標(biāo)準(zhǔn),3′UTR的鄰位序列的定義和分析以及對3′UTR的長度和其核苷酸組成考慮等,不同方法間都有顯著的差異,這也會造成結(jié)果的差異。
目前已鑒定的miRNA無論是在植物,還是動物中,其數(shù)目都非常的有限。因此,還有許多其他的miRNA有待于發(fā)現(xiàn)并闡明其功能。例如,現(xiàn)已有研究人員對于牛、羊、豬、家犬、大猩猩等哺乳動物的miRNA,在NCBI數(shù)據(jù)庫中注冊了其分子信息,可對這些哺乳動物進(jìn)行深入的研究,這些miRNA在其各個時期都可能起著重要的作用,也可對其他物種進(jìn)行研究,這為遺傳學(xué)提供了新的研究方向與思想;而針對miRNA在一些疑難疾病,特別是腫瘤和癌癥的發(fā)病機(jī)理中,隨著研究的不斷深入,這類小分子在生命活動中具有廣泛的調(diào)節(jié)功能,同時有助于闡明藥物反應(yīng)的個體機(jī)制,也為藥物設(shè)計與針對性治療提供了潛在目標(biāo)。
目前,一些實(shí)驗(yàn)室已經(jīng)建立了不同組織、不同發(fā)育時期或不同生長條件下的miRNA基因文庫,發(fā)現(xiàn)了許多miRNA。但在其功能的分析、最終的表型與表達(dá)等方面的研究,還是較少的,一方面是因?yàn)檠芯縨iRNA的成本太高,所需時間較長;另一方面是還沒有真正地找到一種符合多數(shù)miRNA的研究方案。如何建立一種高效、準(zhǔn)確地搜尋miRNA的方法是當(dāng)前的研究重點(diǎn)。生物體中已知miRNA通常用的是直接克隆、芯片技術(shù)等生物學(xué)實(shí)驗(yàn)方法加以鑒定、驗(yàn)證的。其中直接克隆法針對鑒定那些高豐度的miRNAs有顯著的效果,而對于豐度低、具有組織和階段表達(dá)特異性的miRNA,以及由于自身的物理因素(如轉(zhuǎn)錄后修飾等)[19]而很難通過克隆的方法得到的miRNA,都很難用克隆方法進(jìn)行鑒定,而且不可避免大量的重復(fù)測序,所以通過建cDNA文庫的方法尋找miRNA具有明顯的局限性。此外,一些內(nèi)源性的miRNA以及mRNA和其他非編碼RNA的降解產(chǎn)物對克隆也具有一定的干擾作用[20]。而芯片技術(shù)的應(yīng)用是通過雜交,發(fā)現(xiàn)大量的miRNA分子,從而可以對這些被發(fā)現(xiàn)的miRNA分子進(jìn)行下一步的分析,但是這種方法的缺點(diǎn)是無法直接得到miRNA靶基因、基因位置和前體序列等信息[27],這會影響對miRNA分子研究的后續(xù)工作。大部分成熟miRNAs序列在生物中是高度保守的。近年來,通過生物信息學(xué)方法來進(jìn)行分析和預(yù)測,除了在對比過程中就能了解前體信息外,還能了解到其靶基因信息,而所得到的miRNA候選基因序列,大多都與已知的miRNAs序列高度相似,這說明根據(jù)miRNA的保守性和物種之間基因組的同源性,用生物信息學(xué)理論和方法篩選、尋找新的miRNA候選序列的方法能夠在較短時間里尋找出一定量的新miRNA分子,速度快、通量大,是一條在生物體內(nèi)尋找到更多miRNA分子的新思路和有效途徑。但是生物信息學(xué)方法也有不足之處,雖經(jīng)多年來的發(fā)展,同源序列搜索法已經(jīng)取得了很大成功,然而要搜索與已知miRNAs/per-miRNAs在序列上和結(jié)構(gòu)上同源的miRNAs/per-miRNAs,需有已知的miRNAs/per-miRNAs為參照,對于不與已知miRNAs/per-miRNAs同源的miRNAs/permiRNAs則行不通。
綜上所述,無論是單純的生物實(shí)驗(yàn)方法還是生物信息學(xué)方法,對于miRNA的研究都有優(yōu)缺點(diǎn),生物信息學(xué)分析得到的結(jié)果還需進(jìn)一步的生物學(xué)實(shí)驗(yàn)驗(yàn)證,如果能夠充分地把計算機(jī)、生物信息學(xué)等預(yù)測方法和生物學(xué)實(shí)驗(yàn)方法相互補(bǔ)充和有機(jī)結(jié)合,不但能夠減少miRNA靶基因?qū)ふ业拿つ啃?,?jié)約實(shí)驗(yàn)成本,而且可以使人們能夠更有針對性地研究感興趣的miRNA,更加準(zhǔn)確方便地闡明其在生命活動中的功能與意義。
目前,已對牛、羊、豬、家犬、人、大猩猩等哺乳動物的miRNA進(jìn)行了較多的研究,在NCBI數(shù)據(jù)庫中注冊了其分子信息。通過對牛和羊已經(jīng)注冊的miRNA序列進(jìn)行分析得到的一些篩選標(biāo)準(zhǔn)為:①新預(yù)測miRNA的前體能折疊成發(fā)夾二級結(jié)構(gòu);②新預(yù)測的miRNA與成熟的miRNA只能存在0~3個堿基差異;③在miRNA中不能存在環(huán)狀結(jié)構(gòu);④miRNA中的A+U含量在30%~70%之間;⑤miRNA與其互補(bǔ)序列的差異不能多于6個;⑥發(fā)夾結(jié)構(gòu)必須有較小的自由能。符合以上標(biāo)準(zhǔn)的序列可為以后預(yù)測到牛、羊等動物基因組中新的miRNA序列。
但在動植物中目前已鑒定出的miRNA,其數(shù)目非常有限。還有許多miRNA有待于發(fā)現(xiàn)并闡明其功能,這可能是今后遺傳學(xué)、醫(yī)學(xué)研究的一個新方向和熱點(diǎn)。
[1]Bartel D P.MicroRNAs:Genomics,biogenesis,mechanism,and function[J].Cell,2004,116(2):281-297.
[2]Dugas D V,Bartel B.MicroRNA regulation of gene expression in plants[J].Current Opinion in Plant Biology,2004,7(5):512-520.
[3]Jung J H,Seo P J,Park C M.MicroRNA biogenesis and function in higher plants[J].Plant Biotechnology Reports,2009,3(2):111-126.
[4]Jones-Rhoades M W,Bartel D P,Bartel B.MicroRNAs and their regulatory roles in plants[J].Annual Review of Plant Biology,2006,57:19-53.
[5]Hipfner D R,Weigmann K,Cohen S M.The Bantam gene regulates Drosophila growth[J].Genetics,2002,161:15-27.
[6]Brennecke J,Hipfner D R,Stark A,et al.Bantam encodes a developmentaly regulated microRNA that controls cell proliferation and regulates the proapoptotic gene hid in Drosophila[J].Cell,2003,113(1):25-36.
[7]Xu P,Vernooy S Y,Guo M,et al.The Drosophila microRNA mir-14 suppresses cell death and is required for normal fat metabolism[J].Current Biology,2003,13(9):790-795.
[8]Calin G A,Sevignani C,Dumitru C D,et al.Human microRNA genesare frequently located at fragile sites and genomic regions involved in cancers[J].Proceedings of the National Academy of Sciences of the United States of America,2004,101(9):2999-3004.
[9]Hwang H W,Mendell J T.MicroRNAs in cell proliferation,cell death,and tumorigenesis[J].British Journal of Cancer,2006,94(6):776-780.
[10]王杰,李杰,魯風(fēng)民.MicroRNA在腫瘤方面的研究進(jìn)展[J].國際遺傳學(xué)雜志,2007,30(4):293-297.
[11]Calin G A,Dumitru C D,Shimizu M,et al.Frequent deletions and down regulation of micro-RNA genes miR15 and miR16 at 13q14 in chroniclymphocyticleukemia[J].ProceedingsoftheNationalAcademyof Sciences of the United States of America,2002,99(24):15524-15529.
[12]He L,Thomson J M,Hemann M T,et al.A microRNA polycistron as a potential human oncogene[J].Nature,2005,435(7043):828-833.
[13]Takamizawa J,Konishi H,Yanagisawa K,et al.Reduced expression of the let-7 microRNAs in human lung cancers in association with shortened postoperative survival[J].Cancer Research,2004,64(11):3753-3756.
[14]Johnson S M,Grosshans H,Shingara J,et al.RAS is regulated by the let-7 microRNA family[J].Cell,2005,120(5):635-647.
[15]Chan J A,Krichevsky A M,Kosik K S.MicroRNA-21 is an antiapoptotic factor in human glioblastoma cells[J].Cancer Research,2005,65(14):6029-6033.
[17]Zhao T,Li G,Mi S,et al.A complex system of small RNAs in the unicellular green alga Chlamydomonas reinhardtii[J].Genes&Development,2007,21(10):1190-1203.
[18]趙樸,鄭玉姝,劉興友.病毒編碼的miRNAs研究進(jìn)展[J].中國生物雜志,2007,27(8):92-95.
[19]李成梅,鄭繼剛,杜桂森.miRNA:一種新的基因表達(dá)調(diào)節(jié)子[J].遺傳,2004,26(1):133-136.
[20]Yang Z,Ebright Y W,Yu B,et al.HEN1 recognizes 21~24 nt small RNA duplexes and deposits methyl group onto the 2′OH of the 3′terminal nucleotide[J].Nucleic Acids Research,2006,34(2):667-675.
[21]Wang J F,Zhou H,Chen Y Q,et al.Identification of 20 microRNAs from Oryza sativa[J].Nucleic Acids Research,2004,32(5):1688-1695.
[22]Arazi T,Talmor-Neiman M,Stav R,et al.Cloning and characterization of micro-RNAs from moss[J].the Plant Journal,2005,43(6):837-848.
[23]Zhang B H,Pan X P,Cannon C,et al.Conservation and divergence of plant microRNA genes[J].the Plant Journal,2006,46(2):243-259.
[24]Li W,Ruan K.MicroRNA detection by microarray[J].Analytical and Bioanalytical Chemistry,2009,394(4):1117-1124.
[25]Xie F L,Huang S Q,Guo K,et al.Computational identification of novel microRNAs and targets in Brassica napus[J].Febs Letters,2007,581(7):1464-1474.
[26]Qiu C X,Xie F L,Zhu Y Y,et al.Computational identification of microRNAs and their targets in Gossypium hirsutum expressed sequence tags[J].Gene,2007,395(1):49-61.
[27]夏偉,曹國軍,邵寧生.MicroRNA靶基因的尋找及鑒定方法研究進(jìn)展[J].中國科學(xué),2009,39(1):121-128.
[28]趙東宇,王巖,羅迪.生物信息學(xué)中的MicroRNA預(yù)測研究[J].吉林大學(xué)學(xué)報,2008,26(3):276-280.