国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫(kù)的研究

2019-07-17 04:46楊宵月李建偉
醫(yī)學(xué)信息 2019年12期
關(guān)鍵詞:生物信息學(xué)

楊宵月 李建偉

摘要:人類疾病與長(zhǎng)鏈非編碼RNA(LncRNA)的調(diào)控功能異常具有密切關(guān)系。近年來,出現(xiàn)了許多LncRNA-人類疾病關(guān)聯(lián)數(shù)據(jù)庫(kù),為識(shí)別LncRNA調(diào)控人類疾病的功能提供了極大便利。本文對(duì)多個(gè)主流LncRNA調(diào)控人類疾病關(guān)聯(lián)數(shù)據(jù)庫(kù)作一綜述,為該領(lǐng)域的進(jìn)一步研究提供參考。

關(guān)鍵詞:長(zhǎng)鏈非編碼RNA;LncRNA-疾病關(guān)聯(lián)關(guān)系;生物信息學(xué)

中圖分類號(hào):TP311.131 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? DOI:10.3969/j.issn.1006-1959.2019.12.010

文章編號(hào):1006-1959(2019)12-0028-03

Abstract:Human diseases are closely related to the abnormal regulation of long-chain non-coding RNA (LncRNA). In recent years, many LncRNA-human disease association databases have emerged, which have greatly facilitated the recognition of LncRNA regulation of human disease. This article reviews a number of mainstream LncRNA regulatory human disease association databases and provides a reference for further research in this field.

Key words:Long-chain non-coding RNA;LncRNA-disease association;Bioinformatics

長(zhǎng)鏈非編碼RNA(long non-coding RNA,LncRNA)是一類核苷酸長(zhǎng)度大于200的非編碼RNA分子。由于其不能編碼蛋白質(zhì),LncRNA一直被認(rèn)為是基因轉(zhuǎn)錄過程中的副產(chǎn)物[1]。隨著對(duì)LncRNA的不斷研究,發(fā)現(xiàn)LncRNA雖不編碼蛋白,但可參與細(xì)胞凋亡、分化、自噬、代謝以及腫瘤發(fā)生的各個(gè)階段等多種重要的調(diào)控過程[2]。LncRNA的研究發(fā)展迅速,但絕大部分LncRNA在疾病中的調(diào)控功能仍不明確。大量研究表明[3,4],人類疾病與LncRNAs的調(diào)控功能異常具有密切關(guān)系,明確LncRNAs在疾病中的調(diào)控作用,對(duì)在分子水平上理解疾病的產(chǎn)生、發(fā)展機(jī)制,對(duì)于復(fù)雜疾病的診斷、治療均具有重要意義。目前,研究LncRNA調(diào)控功能的方法主要包括傳統(tǒng)生物實(shí)驗(yàn)方法和現(xiàn)代的生物信息學(xué)計(jì)算方法。傳統(tǒng)的生物實(shí)驗(yàn)方法鑒定LncRNAs功能,結(jié)果雖然準(zhǔn)確、可靠,但存在實(shí)驗(yàn)周期時(shí)間長(zhǎng)、費(fèi)用較高等問題[5]。隨著高通量測(cè)序技術(shù)的不斷發(fā)展,越來越多的LncRNAs被發(fā)現(xiàn),大量的LncRNAs功能需要被明確。傳統(tǒng)的生物實(shí)驗(yàn)方法顯然不能勝任,必須采用快速、高效的計(jì)算方法對(duì)已發(fā)現(xiàn)的LncRNAs調(diào)控人類疾病關(guān)系進(jìn)行數(shù)據(jù)挖掘,進(jìn)而推測(cè)LncRNAs功能[6]。本文對(duì)多個(gè)主流LncRNA調(diào)控人類疾病關(guān)聯(lián)數(shù)據(jù)庫(kù)作一綜述,旨在為該領(lǐng)域的進(jìn)一步研究提供參考。

1常見LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫(kù)

近年來,相繼出現(xiàn)了一些收集、整理LncRNA調(diào)控人類疾病關(guān)聯(lián)數(shù)據(jù)庫(kù),為識(shí)別LncRNA調(diào)控人類疾病的功能提供了極大便利。常見LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫(kù)(按發(fā)布時(shí)間排序)見表1,包括軟件名稱、發(fā)布時(shí)間、數(shù)據(jù)庫(kù)優(yōu)缺點(diǎn)等,為研究者選擇LncRNA調(diào)控人類疾病關(guān)聯(lián)數(shù)據(jù)庫(kù)提供便利,同時(shí)有助于研究者快速了解該領(lǐng)域的研究進(jìn)展。

2常見LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫(kù)具體介紹

2.1 LncRNADisease ?2012年,Chen G等[7]收集PubMed數(shù)據(jù)庫(kù)中文獻(xiàn)報(bào)道的LncRNA調(diào)控人類疾病關(guān)系,開發(fā)了首個(gè)LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫(kù)——LncRNADisease。該數(shù)據(jù)庫(kù)收集了480個(gè)有實(shí)驗(yàn)支持的LncRNA調(diào)控疾病關(guān)系條目,以及478個(gè)LncRNA與其他生物分子相互作用的條目,涉及128個(gè)人類LncRNAs。LncRNADisease對(duì)每個(gè)LncRNA-疾病關(guān)聯(lián)數(shù)據(jù)都給出了原始文章的PubMed超鏈接,并標(biāo)注了LncRNA-疾病關(guān)聯(lián)的詳細(xì)信息,包括基因組信息、序列信息、功能失調(diào)類型等。LncRNADisease數(shù)據(jù)庫(kù)規(guī)范了LncRNA和疾病的名稱,共涉及166種疾病。LncRNADisease還收集了LncRNA在各種分析分子水平上的調(diào)控對(duì)象。此外,還提出一種預(yù)測(cè)新LncRNA-疾病關(guān)聯(lián)關(guān)系的生物信息學(xué)方法,并將預(yù)測(cè)的1564個(gè)LncRNA-疾病關(guān)聯(lián)關(guān)系整合到數(shù)據(jù)庫(kù)中。

2.2 Lnc2Cancer ?Ning S等[8]于2015年建立了專門收集LncRNA-癌癥關(guān)聯(lián)關(guān)系的、且有實(shí)驗(yàn)支持的LncRNA數(shù)據(jù)庫(kù)——Lnc2Cancer。該庫(kù)中的LncRNA數(shù)據(jù)來源于PubMed數(shù)據(jù)庫(kù)中已發(fā)表的1500余篇相關(guān)文獻(xiàn)。通過手工檢索和整理的方式,該數(shù)據(jù)庫(kù)在531種LncRNAs和86種人類癌癥范圍內(nèi),共收集了1057個(gè)LncRNA-癌癥關(guān)聯(lián)關(guān)系數(shù)據(jù)。庫(kù)中每個(gè)關(guān)聯(lián)數(shù)據(jù)包括LncRNA與癌癥的名稱、LncRNA序列及位置信息、LncRNA表達(dá)模式、實(shí)驗(yàn)技術(shù)、LncRNA功能描述、PubMed數(shù)據(jù)庫(kù)超鏈接和其他注釋信息等。Lnc2Cancer的用戶界面友好,方便用戶檢索和下載數(shù)據(jù),并允許用戶在線提交新驗(yàn)證的LncRNA-癌癥關(guān)聯(lián)關(guān)系數(shù)據(jù)。用戶通過分析來自Lnc2Cancer的數(shù)據(jù),可進(jìn)一步挖掘這些數(shù)據(jù)中隱藏的一些重要信息,構(gòu)建LncRNA-癌癥二分網(wǎng)絡(luò),更加系統(tǒng)地分析LncRNAs對(duì)癌癥的調(diào)控作用。

2.3 TANRIC ?TANRIC是2015年由Li J等[9]開發(fā)的研究LncRNAs在癌癥中調(diào)控功能及臨床診療價(jià)值的數(shù)據(jù)分析和可視化平臺(tái)。它收集并分析了20種癌癥患者中LncRNA表達(dá)譜數(shù)據(jù),共包含8000多個(gè)來自于TCGA和其它數(shù)據(jù)集的樣本。TANRIC包括6個(gè)模塊:摘要、可視化、下載、My LncRNA、分析所有LncRNA和細(xì)胞系中的LncRNA。TANRIC將LncRNAs表達(dá)數(shù)據(jù)與臨床和基因組數(shù)據(jù)相結(jié)合,使得研究人員能夠在臨床和其他分子數(shù)據(jù)背景下,快速、直觀地分析癌癥的LncRNA特征。TANRIC的開發(fā)者還鑒定了大量具有潛在生物醫(yī)學(xué)標(biāo)記的LncRNAs,其中許多顯示與已明確的治療靶標(biāo)和跨腫瘤類型的生物標(biāo)記,或者跨細(xì)胞系的藥物敏感性強(qiáng)烈相關(guān)。TANRIC極大地促進(jìn)了與LncRNA相關(guān)的生物學(xué)發(fā)現(xiàn)和臨床應(yīng)用。

2.4 LnCaNet ?2016年1月,Liu Y等[10]在對(duì)LncRNA和非鄰近癌基因之間相互作用進(jìn)行搜索和分析的基礎(chǔ)上,開發(fā)了一個(gè)收錄LncRNA共表達(dá)數(shù)據(jù)的數(shù)據(jù)庫(kù)——LnCaNet。LnCaNet共收集了2922個(gè)匹配的癌癥基因組圖譜TCGA樣品,包含了來源于9641個(gè)LncRNAs和2544個(gè)癌癥基因的8494907個(gè)有意義的共表達(dá)對(duì)。LnCaNet整合了來自公共數(shù)據(jù)庫(kù)的10個(gè)癌癥基因列表,分別計(jì)算了11種TCGA癌癥類型中所有LncRNA的共表達(dá)?;?10個(gè)共表達(dá)網(wǎng)絡(luò)的分析結(jié)果,LnCaNet確定了17個(gè)與11種癌癥細(xì)胞外空間相關(guān)的常見調(diào)節(jié)對(duì)。LnCaNet致力于為L(zhǎng)ncRNA和癌癥基因建立全面的網(wǎng)絡(luò)資源,包括綜合癌癥基因列表、預(yù)先計(jì)算的LncRNA與癌基因之間的共表達(dá)、泛癌LncRNA表達(dá)網(wǎng)、LncRNA-癌癥基因相互作用對(duì)。LnCaNet為研究者深入分析LncRNA調(diào)控功能提供了重要參考。

2.5 LincSNP 2.0 ?LincSNP 2.0是2016年5月由Ning S等[11]開發(fā)的一個(gè)數(shù)據(jù)庫(kù),它是首個(gè)專門用于存儲(chǔ)和注釋人類LncRNA與其轉(zhuǎn)錄因子結(jié)合位點(diǎn)(TFBSs)中的與疾病關(guān)聯(lián)的單核苷酸多態(tài)性(SNP)數(shù)據(jù),以期幫助用戶確認(rèn)新的與疾病關(guān)聯(lián)的SNP數(shù)據(jù)。LincSNP 1.0[14]創(chuàng)建于2014年5月,LincSNP 2.0是其更新版。LincSNP 2.0中的LncRNA來源于5個(gè)數(shù)據(jù)庫(kù),包括Ensembl[15]、LncRBase[16]、NONCODE[17]、LNCipedia[18]和GENCODE[19]。LincSNP 2.0中,含有809451個(gè)與疾病相關(guān)的SNP和244545個(gè)人類LncRNA,涉及9種類型的LncRNA,包含58個(gè)具有實(shí)驗(yàn)支持的SNP-LncRNA-疾病關(guān)聯(lián)。為了方便用戶更好地使用LincSNP 2.0中的數(shù)據(jù),該數(shù)據(jù)庫(kù)還為用戶提供了3種在線檢索和分析數(shù)據(jù)的工具,分別為L(zhǎng)inc-Mart、Linc-Browse和Linc-Score。

2.6 Lnc2Catlas ?Lnc2Catlas是一個(gè)從不同方面收集并且定量化表示LncRNA-癌癥關(guān)聯(lián)關(guān)系的數(shù)據(jù)庫(kù)[12]。該數(shù)據(jù)庫(kù)從LncRNA二級(jí)結(jié)構(gòu)擾動(dòng)、LncRNA-蛋白質(zhì)相互作用和共表達(dá)網(wǎng)絡(luò)三個(gè)方面數(shù)值化評(píng)價(jià)LncRNA對(duì)癌癥的調(diào)控作用。Lnc2Catlas共收錄27670個(gè)具有明確注釋的LncRNAs,包含了247124個(gè)LncRNA-SNP關(guān)聯(lián)關(guān)系、超過200萬(wàn)個(gè)LncRNA-蛋白質(zhì)相互作用關(guān)系和6902個(gè)共表達(dá)簇?cái)?shù)據(jù)。Lnc2Catlas構(gòu)建相關(guān)LncRNA、SNP和蛋白質(zhì)的調(diào)控關(guān)系網(wǎng)絡(luò),從多角度分析LncRNA與癌癥之間的定量關(guān)系,這使得最終分析結(jié)果更加準(zhǔn)確、可信。

2.7 LncRNADisease2.0 ?LncRNADisease2.0是LncRNADisease的更新版,由Bao Z等[13]在2018年7月建立。LncRNADisease 2.0記錄了20多萬(wàn)個(gè)LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù)。它共收集了來自PubMed的12000余篇文獻(xiàn),包含10564個(gè)實(shí)驗(yàn)支持的LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù)和1004個(gè)實(shí)驗(yàn)支持的circRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù)。數(shù)據(jù)庫(kù)中還包含195395個(gè)預(yù)測(cè)的LncRNA-疾病關(guān)聯(lián)關(guān)系,其中23102個(gè)關(guān)聯(lián)關(guān)系至少可被2種算法預(yù)測(cè)。相對(duì)于第一個(gè)版本的LncRNADisease,LncRNADisease 2.0具有明顯的改進(jìn):①實(shí)驗(yàn)支持和/或計(jì)算支持的LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)量超過第一版40倍;②提供了LncRNA,mRNA和miRNA之間的轉(zhuǎn)錄調(diào)控關(guān)系;③將疾病名稱映射到MeSH數(shù)據(jù)庫(kù)[20],為每個(gè)LncRNA-疾病關(guān)聯(lián)關(guān)系提供數(shù)量化的置信度分?jǐn)?shù);④增加了環(huán)狀RNA(circRNAs)與疾病之間的關(guān)聯(lián)關(guān)系數(shù)據(jù)。LncRNADisease 2.0是收集LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù)較全的數(shù)據(jù)庫(kù)之一。

3總結(jié)

本文介紹了7個(gè)LncRNA調(diào)控人類疾病關(guān)聯(lián)數(shù)據(jù)庫(kù),每個(gè)數(shù)據(jù)庫(kù)都有其特點(diǎn)和適用范圍。研究人員需要根據(jù)自己的需求和想法,選擇適合的數(shù)據(jù)庫(kù),才能有助于分析和研究。該類數(shù)據(jù)庫(kù)還有很多需要改進(jìn)和完善發(fā)展的方面:①研究人員搜集了大量的LncRNA-疾病關(guān)聯(lián)數(shù)據(jù),但目前還沒有一個(gè)權(quán)威、統(tǒng)一和系統(tǒng)的數(shù)據(jù)庫(kù)包含已有的全部LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù),大部分?jǐn)?shù)據(jù)庫(kù)都在按照自己的組織方式不斷的維護(hù)和更新,用戶常常需要分析多個(gè)數(shù)據(jù)庫(kù)才能得到比較準(zhǔn)確、權(quán)威的結(jié)果;②LncRNA與人類疾病的關(guān)系是一個(gè)計(jì)較系統(tǒng)復(fù)雜的問題,尚有許多新的LncRNA-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù)屬性沒有被發(fā)現(xiàn),這需要研究人員持續(xù)地探索和研究,不斷更新數(shù)據(jù)的組織方式,并在大量相關(guān)數(shù)據(jù)中發(fā)現(xiàn)新的LncRNA調(diào)控疾病的規(guī)律;③目前建立的LncRNA數(shù)據(jù)庫(kù)一般包括LncRNA-miRNA、蛋白質(zhì)結(jié)合互作、相鄰基因共表達(dá)、疾病上下調(diào)等功能分析,但LncRNA的其他多種重要調(diào)節(jié)功能仍沒有被收集,如作為增強(qiáng)子參與調(diào)控基因的表達(dá)、通過修飾染色體參與表觀調(diào)節(jié)等。目前還沒有類似數(shù)據(jù)庫(kù)收集LncRNA的這方面數(shù)據(jù),這在一定程度上限制了對(duì)LncRNA調(diào)控功能的深入分析。

隨著越來越多的研究者關(guān)注并且投身到LncRNA調(diào)控人類疾病關(guān)系數(shù)據(jù)庫(kù)的研究中,我們相信未來會(huì)有更加全面、高效、易用的數(shù)據(jù)庫(kù)出現(xiàn),服務(wù)于LncRNA調(diào)控功能研究。

參考文獻(xiàn):

[1]Clark MB,Mattick JS.Long noncoding RNAs in cell biology[J].Semin Cell Dev Biol,2011,22(4):366-376.

[2]Mercer TR,Dinger ME,Mattick JS.Long non-coding RNAs:insights into functions[J].Nat Rev Genet,2009,10(3):155-159.

[3]周眾.LncRNA-基因調(diào)控關(guān)系的生物信息學(xué)數(shù)據(jù)庫(kù)構(gòu)建及分析預(yù)測(cè)[D].中國(guó)科學(xué)技術(shù)大學(xué),2016.

[4]林陳勝,阮寧生,張彥定.長(zhǎng)鏈非編碼RNA數(shù)據(jù)庫(kù)資源[J].中國(guó)生物化學(xué)與分子生物學(xué)報(bào),2016,32(6):599-606.

[5]Moran VA,Perera RJ,Khalil AM.Emerging functional and mechanistic paradigms of mammalian long non-coding RNAs[J].Nucleic Acids Res,2012,40(14):6391-6400.

[6]夏天,肖丙秀,郭俊明.長(zhǎng)鏈非編碼RNA的作用機(jī)制及其研究方法[J].遺傳,2013,35(3):269-280.

[7]Chen G,Wang Z,Wang D,et al.LncRNADisease:a database for long-non-coding RNA-associated diseases[J].Nucleic Acids Res,2013,41(D1):D983-D986.

[8]Ning S,Zhang J,Wang P,et al.Lnc2Cancer:a manually curated database of experimentally supported LncRNAs associated with various human cancers[J].Nucleic Acids Res,2016,44(D1):D980-D985.

[9]Li J,Han L,Roebuck P,et al.TANRIC:an interactive open platform to explore the function of LncRNAs in cancer[J].Cancer Res,2015,75(18):3728-3737.

[10]Liu Y,Zhao M.LnCaNet:pan-cancer co-expression network for human LncRNA and cancer genes[J].Bioinformatics,2016,32(10):1595-1597.

[11]Ning S,Yue M,Wang P,et al.LincSNP 2.0:an updated database for linking disease-associated SNPs to human long non-coding RNAs and their TFBSs[J].Nucleic Acids Res,2017,45(D1):D74-D78.

[12]Ren C,An G,Zhao C,et al.Lnc2Catlas:an atlas of long noncoding RNAs associated with risk of cancers[J].Sci Rep,2018,8(1):1909.

[13]Bao Z,Yang Z,Huang Z,et al.LncRNADisease 2.0:an updated database of long non-coding RNA-associated diseases[J].Nucleic Acids Res,2019,47(D1):D1034-D1037.

[14]Ning S,Zhao Z,Ye J,et al.LincSNP:a database of linking disease-associated SNPs to human large intergenic non-coding RNAs[J].BMC Bioinformatics,2014,15(1):152.

[15]Flicek P,Ahmed I,AmodeMR,et al.Ensembl 2013[J].Nucleic Acids Res,2013,41(D1):D48-D55.

[16]Chakraborty S,Deb A,Maji RK,et al.LncRBase:an enriched resource for LncRNA information[J].PLoS One,2014,9(9):e108010.

[17]Fang S,Zhang L,Guo J,et al.NONCODEV5:a comprehensive annotation database for long non-coding RNAs[J].Nucleic Acids Res,2018,46(D1):D308-D314.

[18]Volders PJ,Helsens K,Wang X,et al.LNCipedia:a database for annotated human LncRNA transcript sequences and structures[J].Nucleic Acids Res,2013,41(D1):D246-D251.

[19]Harrow J,F(xiàn)rankish A,Gonzalez JM,et al.GENCODE:the reference human genome annotation for The ENCODE Project[J].Genome Res,2012,22(9):1760-1774.

[20]Lipscomb CE.Medical Subject Headings(MeSH)[J].Bull Med Libr Assoc,2000,88(3):265-266.

收稿日期:2019-3-12;修回日期:2019-3-22

編輯/杜帆

猜你喜歡
生物信息學(xué)
淺談醫(yī)學(xué)院校生物信息學(xué)專業(yè)青年教師規(guī)范培訓(xùn)模式的建立
“PBL+E—learning”教學(xué)模式探索
移動(dòng)教學(xué)在生物信息學(xué)課程改革中的應(yīng)用
案例教學(xué)法在《生物信息學(xué)》本科教學(xué)中的應(yīng)用
微生物二元網(wǎng)絡(luò)作用關(guān)系研究
玛纳斯县| 德江县| 钟祥市| 华亭县| 蒲江县| 阿城市| 彩票| 永胜县| 庆安县| 万宁市| 托里县| 牙克石市| 兰考县| 台北县| 四川省| 南木林县| 新沂市| 临猗县| 延寿县| 磐石市| 石河子市| 于田县| 延长县| 德阳市| 讷河市| 昌都县| 鸡东县| 科技| 德格县| 灌南县| 古蔺县| 苏尼特右旗| 微博| 涿鹿县| 龙游县| 莱州市| 子长县| 阿克陶县| 长治县| 昌吉市| 富蕴县|