馬名陽 安雯雯 景芙蓉 周學(xué)
【摘 ?要】MicroRNA(簡稱miRNA)是一類長度為22nt的編碼小分子RNA,在基因表達調(diào)控中發(fā)揮重要作用。miRNA在基因組中存在位置偏好性,一部分miRNA位于基因間區(qū),而另一些miRNA基因位于蛋白質(zhì)編碼基因的內(nèi)含子中,少數(shù)位于外顯子中,稱之為基因內(nèi)miRNA。可變剪接(也稱選擇性剪接,alternative splicing,AS)是指對同一基因的mRNA前體的不同剪接方式,即一種基因能產(chǎn)生多種mRNA。研究發(fā)現(xiàn),miRNA與基因的選擇性剪接密切相關(guān),有些miRNA位于基因的可變剪接區(qū)域。論文利用生物信息學(xué)方法對位于可變剪接區(qū)域miRNA特征進行分析。
【Abstract】MicroRNAs (miRNAs) are endogenous noncoding RNAs with about 22 nucleotides in length, and play important role in gene expression regulation. MiRNAs have a favorable position in the genome. Some miRNAs are located in intergenic regions, while others are located in introns of protein-coding genes, and a few are located in exons, which are called intracellular miRNAs. Alternative splicing (alternative splicing, AS) refers to different splicing of the precursor mRNA of the same gene, that is one gene can produce multiple mRNAs. MiRNAs have been found to be closely related to the selective splicing of genes, with some miRNAs located in the variable splicing region of genes. This paper analyzes the characteristics of miRNA located in the variable splicing region by bioinformatics method.
【關(guān)鍵詞】MicroRNA;可變剪接;特征;生物信息學(xué)
【Keywords】 MicroRNA; alternative splicing; characteristic; bioinformatics
【中圖分類號】Q-33 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻標志碼】A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號】1673-1069(2020)01-0156-02
1 引言
選擇性剪接是指對同一基因的mRNA前體的不同剪接方式,即一種基因能產(chǎn)生多種mRNA?;虻倪x擇性剪接主要包括以下幾種形式:①外顯子跳躍(exon skipping);②選擇性5或3可變剪接(alternative 5 or 3 splicing);③互斥外顯子(mutually exclusion exons);④內(nèi)含子保留(intron retention);⑤選擇性起始(alternative initiation);⑥選擇性終止(alternative termination)等。選擇性剪接增加了蛋白質(zhì)的多樣性和基因表達的復(fù)雜程度,對基因表達的精細調(diào)控、細胞分化與組織發(fā)育、凋亡等方面都起著重要的作用[1],并且與生物進化也息息相關(guān)[2],在復(fù)雜的生命現(xiàn)象中發(fā)揮著重要作用。越來越多的研究發(fā)現(xiàn)選擇性剪接還與人類健康與疾病關(guān)系密切[3]。
MicroRNA(簡稱miRNA)是一類長度為21~25nt,主要通過作用在靶標基因mRNA的3端非編碼區(qū)(3UTR)抑制蛋白質(zhì)翻譯或降解mRNA,從而發(fā)揮重要的調(diào)控功能[4]。研究表明,miRNA參與生命過程中一系列重要的進程,在控制發(fā)育過程、細胞增殖和凋亡、器官發(fā)育、心血管發(fā)育、免疫細胞形成等過程中都起著重要的作用。miRNA在基因組中分布存在位置偏好性,部分miRNA基因分布于基因組中的基因間區(qū)(intergenic region),而另一些miRNA基因位于蛋白質(zhì)編碼基因的內(nèi)含子中,少數(shù)位于外顯子中,稱之為基因內(nèi)miRNA(intragenic miRNA)。迄今為止,已有不少研究成果顯示,miRNA與基因的選擇性剪接密切相關(guān)。
2 材料與方法
2.1 數(shù)據(jù)收集
miRNA序列及位置信息從miRBase數(shù)據(jù)庫(Release 19)下載獲得。基因可變剪接位置信息通過檢索Ensembl和UCSC數(shù)據(jù)庫獲得。
2.2 可變剪接區(qū)序列特征分析
利用在線Oligo Calc程序?qū)衜iRNA的內(nèi)含子或外顯子的GC含量進行預(yù)測和統(tǒng)計,同時計算miRNA序列的GC含量作為比較。利用CpGi130和CpGProD程序?qū)?nèi)含子/外顯子序中CpG島進行預(yù)測。從UCSC數(shù)據(jù)庫Table browser程序獲取序列SNP信息,miRNA上分布的SNP位點利用miRNASNP程序預(yù)測。
2.3 可變剪接區(qū)剪接調(diào)控功能元件預(yù)測
利用FAS-ESS web serve、ESEfinder等軟件對可變剪接區(qū)域參與的剪接調(diào)控的功能元件及作用的剪接因子進行預(yù)測。
2.4 可變內(nèi)含子miRNA作用靶基因預(yù)測及功能分析
可變內(nèi)含子miRNA作用靶基因數(shù)據(jù)從miRTarBase數(shù)據(jù)庫下載獲得。同時利用DAVID數(shù)據(jù)庫提供的基因功能注釋工具對預(yù)測的靶基因的功能和參與調(diào)控通路進行分析。
3 結(jié)果與分析
3.1 可變內(nèi)含子區(qū)域miRNA的鑒定
根據(jù)miRBase數(shù)據(jù)庫提供的注釋信息,統(tǒng)計miRNA的位置信息,總計獲得了1171個miRNA位于基因內(nèi)。根據(jù)Ensembl和UCSC數(shù)據(jù)庫提供的基因發(fā)生可變剪接位置信息與miRNA位置信息利用程序進行比對,鑒定位于可變剪接區(qū)域的miRNA。為了預(yù)測的可靠性,同時通過文獻調(diào)研及將miRNA前體序列與基因不同轉(zhuǎn)錄本進行比對,進一步確定位于可變剪接區(qū)域的miRNA。最終獲得433個miRNA位于基因的可變剪接區(qū)域,涉及366個host基因。其中人21個miRNA位于16個宿主基因的可變內(nèi)含子區(qū)域,其中包括1個miRNA簇mir-17/20a/18a/19a/19b-1,位于基因C13orf25上。
3.2 位于可變剪接區(qū)域miRNA及可變剪接基因特征分析
對內(nèi)含子miRNA的宿主基因序列特征進行分析,人16個宿主基因含有轉(zhuǎn)錄本的數(shù)目為2~58,含有miRNA的轉(zhuǎn)錄本數(shù)目為2~29,其中DDR1基因有58個轉(zhuǎn)錄本。對miRNA在宿主基因不同轉(zhuǎn)錄本上分布特征分析,人轉(zhuǎn)錄本的外顯子數(shù)目2~38,內(nèi)含子平均長度為1087bp,絕大多數(shù)miRNA位于基因第1個外顯子中,外顯子的平均長度875bp,分析過程中發(fā)現(xiàn)hsa-mir-4721位于TUFM基因轉(zhuǎn)錄本的3UTR區(qū)域。
3.3 可變剪接區(qū)域序列GC含量、CpG島及SNP分布特征分析
利用在線Oligo Calc程序?qū)iRNA及miRNA所在的內(nèi)含子或外顯子的GC含量進行分析,結(jié)果顯示,人miRNA所在內(nèi)含子或外顯子的GC含量分布在36%~78%,平均GC含量為58%,miRNA前體序列GC含量分布在38%~81%,平均GC含量為58%。同時,對內(nèi)含子/外顯子中CpG島進行預(yù)測,結(jié)果在人18個轉(zhuǎn)錄本內(nèi)含子/外顯子中總計預(yù)測到30個CpG島,序列平均長度為928bp。
通過對人miRNA所在的內(nèi)含子或外顯子中分布SNP位點分析,人21個miRNA中有12個miRNA所在的15個轉(zhuǎn)錄本對應(yīng)的內(nèi)含子/外顯子中分布有58個SNP位點,SNP位點分布的數(shù)目為1~11。
3.4 可變剪接區(qū)域參與的剪接調(diào)控的功能元件及剪接因子的作用位點預(yù)測
可變剪接位點的選擇受到結(jié)合到非剪接位點RNA元件的剪接因子的多重調(diào)節(jié),參與可變剪接調(diào)節(jié)的RNA元件包括ESE、ISE、ESS、ISS,剪接因子包括SR和hnRNP家族蛋白等多種因子。利用ESEfinder等軟件對miRNA所在的可變剪接區(qū)域參與的剪接調(diào)控的功能元件及作用的剪接因子進行預(yù)測。結(jié)果人miRNA所在的內(nèi)含子/外顯子中都預(yù)測出五種剪接因子的結(jié)合位點,五種剪接因子分別為SRSF1、SRSF1 (IgM-BRCA1)、SRSF2、SRSF5、SRSF6,結(jié)合位點序列分別為“CACACGA”“CACACGA”“GTCCCCTG”“CCACACG”“TACGTC”等。
3.5 可變內(nèi)含子miRNA靶標基因預(yù)測及功能分析
miRNA主要通過與靶mRNA之間的互補配對切割信使RNA或抑制翻譯這兩種轉(zhuǎn)錄后調(diào)控機制,實現(xiàn)下調(diào)靶基因表達。論文從miRTarBase數(shù)據(jù)庫下載實驗驗證的人miRNA作用的靶基因??傆嫬@得了9615個miRNA-target作用的關(guān)系,進一步分析發(fā)現(xiàn)人miRNA作用的靶標數(shù)量為1~1825,作用在每個靶基因上miRNA數(shù)目為1~30。分析發(fā)現(xiàn)宿主基因與內(nèi)含子miRNA及靶基因間存在復(fù)雜的調(diào)控關(guān)系,例如,PTBP1是hsa-mir-4745的宿主基因,同時是hsa-miR-17作用的靶基因;REXO1基因能同時被宿主基因hsa-mir-1909作用,hsa-mir-1909同時也能作用在hsa-mir-589的宿主基因FBXL18。為了更好地理解miRNA作用的靶基因的功能,利用DAVID數(shù)據(jù)庫提供的基因功能注釋工具對預(yù)測的靶基因的功能和參與調(diào)控通路進行分析,結(jié)果表明,靶基因參與的生物進程中包括參與轉(zhuǎn)錄調(diào)節(jié)、調(diào)節(jié)細胞凋亡、調(diào)節(jié)細胞增殖、參與蛋白質(zhì)的泛素化等。通過KEGG通路分析發(fā)現(xiàn),miRNA靶基因參與了46個通路,包括:VEGF信號通路、Wnt信號通路、B細胞受體調(diào)控通路等。
4 結(jié)論
本文通過生物信息學(xué)方法對位于可變剪接區(qū)域miRNA的特征進行分析,研究結(jié)果對發(fā)現(xiàn)可變剪接與可變剪接區(qū)miRNA的內(nèi)在聯(lián)系,以及對深入揭示miRNA與可變剪接在癌癥基因表達調(diào)控中的作用機制具有重要的科學(xué)意義。
【參考文獻】
【1】Black DL.Mechanisms of alternative pre-messenger RNA splicing[J].Annu Rev Biochem,2003(72):291-336.
【2】Blencowe BJ.Alternative splicing: new insights from global analyses[J].Cell 2006,126(1):37-47.
【3】Tollervey JR,Wang Z,Hortobagyi T,et al.Analysis of alternative splicing associated with aging and neurodegeneration in the human brain[J].Genome Res 2011,21(10):1572-1582.
【4】Bartel DP.MicroRNAs:target recognition and regulatory functions[J].Cell 2009,136(2):215-233.