国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向腫瘤精準(zhǔn)醫(yī)學(xué)的綜合數(shù)據(jù)資源TCGA及其相關(guān)在線分析工具推薦

2018-03-21 05:09:54,睿,,,,
關(guān)鍵詞:數(shù)據(jù)類型基因組癌癥

, ,睿,, ,,

癌癥是一種極為復(fù)雜的人類疾病,涉及基因組的多種動態(tài)變化[1]。每種類型的癌癥,發(fā)生的遺傳畸變都是獨(dú)特的,包括體細(xì)胞突變、拷貝數(shù)變異、基因表達(dá)譜差異和表觀遺傳改變。因此需要更好地理解腫瘤的各種遺傳變化,才能更好地對其進(jìn)行診斷、治療和預(yù)防。全基因組測序和生物信息技術(shù)的發(fā)展為癌癥基因組研究提供了新的線索[2]。典型的綜合數(shù)據(jù)資源是癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)項(xiàng)目,它收集整理了大量癌癥基因組數(shù)據(jù),并利用新的基因組分析技術(shù)以加速對癌癥的全面了解。

TCGA數(shù)據(jù)庫的目標(biāo)是完成一套完整的與所有癌癥基因組改變相關(guān)的“圖譜”,旨在獲得癌癥生物學(xué)的新見解,從而有助于癌癥的治療。該項(xiàng)目是2006年由美國國立衛(wèi)生研究院牽頭的一項(xiàng)大型癌癥基因組計(jì)劃,自2008年開始有階段性成果發(fā)表[3],2009年繼續(xù)投資2.75億美元,增加了多種類型的癌癥數(shù)據(jù),到2014年已收集了36類癌癥數(shù)據(jù),包括臨床數(shù)據(jù)、DNA、RNA、蛋白質(zhì)等多層次的數(shù)據(jù)。在數(shù)據(jù)生成方面,該項(xiàng)目取得了無可爭議的成功。隨著樣品采集、測序和分析技術(shù)的快速發(fā)展,TCGA收錄的腫瘤相關(guān)數(shù)據(jù)呈指數(shù)增長。目前,新成立的NCI Genomics Data Commons將TCGA的數(shù)據(jù)整合在該門戶網(wǎng)站中,并且為基因組數(shù)據(jù)用戶提供了交互式支持和更清晰友好的界面。

我們可以用前所未有的微觀視角來看待癌癥,但是還沒有達(dá)到能夠解釋這種疾病的全貌的程度,對其發(fā)病機(jī)制亦不完全清楚。而TCGA數(shù)據(jù)已被用于發(fā)現(xiàn)新的突變,確定內(nèi)在的腫瘤類型,確定泛癌相似性和差異性,同時(shí)收集腫瘤演變的證據(jù)。目前已經(jīng)開發(fā)了大量針對TCGA數(shù)據(jù)的生物信息學(xué)工具,反映出TCGA數(shù)據(jù)資源的重要性。

1 TCGA數(shù)據(jù)介紹

為了全面分析癌癥基因組圖譜,TCGA應(yīng)用基于微陣列和下一代測序方法的高通量技術(shù),產(chǎn)生了癌癥的多種數(shù)據(jù)類型信息。

TCGA中的癌癥數(shù)據(jù)通過各種標(biāo)識符(ID)進(jìn)行識別和編目(表1),每種癌癥類型都包括體細(xì)胞突變、拷貝數(shù)、基因表達(dá)、miRNA表達(dá)、DNA甲基化、逆轉(zhuǎn)蛋白相位陣列(RPPA)和臨床信息。除原始排序文件外(表2),每種數(shù)據(jù)類型都包括可供公開下載的原始數(shù)據(jù)和已處理的數(shù)據(jù)。

表1 TCGA數(shù)據(jù)庫中的ID號

表2 數(shù)據(jù)類型和可獲取水平

2 TCGA數(shù)據(jù)在線分析工具

目前TCGA數(shù)據(jù)分析很復(fù)雜,涉及多個(gè)步驟,為獲得有意義的生物學(xué)結(jié)果,需要仔細(xì)考慮分析每個(gè)步驟,并將特定工具應(yīng)用于某些實(shí)驗(yàn)?zāi)P?。為現(xiàn)有數(shù)據(jù)開發(fā)相關(guān)的探索工具,需要實(shí)驗(yàn)科學(xué)家和計(jì)算科學(xué)家之間的協(xié)調(diào)。然而,實(shí)驗(yàn)科學(xué)家很難使用計(jì)算科學(xué)家開發(fā)的計(jì)算工具,因?yàn)檫@些計(jì)算工具需要數(shù)據(jù)準(zhǔn)備以及安裝和使用打包軟件,而且某些軟件往往只適用于某些特定平臺或操作系統(tǒng)。一些更高級的計(jì)算工具往往難以理解或使用,從而限制了其應(yīng)用。不過有基于網(wǎng)絡(luò)的工具可以提供方便的計(jì)算解決方案,幫助實(shí)驗(yàn)科學(xué)家使用和分析復(fù)雜的癌癥基因組數(shù)據(jù)。這些工具幫助無生物信息學(xué)背景的生物學(xué)家和醫(yī)學(xué)家獲得更多的生物學(xué)和醫(yī)學(xué)見解,但是選擇適當(dāng)?shù)墓ぞ卟⒉皇且豁?xiàng)簡單的任務(wù),對于沒有經(jīng)驗(yàn)的用戶來說尤其如此。

本文整理了一個(gè)基于網(wǎng)絡(luò)的可用于分析TCGA數(shù)據(jù)的公開工具列表,并將這些工具進(jìn)行分類以便更好地進(jìn)行查詢和使用。

表3顯示了基于網(wǎng)絡(luò)工具的32個(gè)在線分析資源,它們代表了當(dāng)前可用于分析TCGA數(shù)據(jù)的主要資源。為了進(jìn)一步區(qū)分和指導(dǎo)這些工具的選擇,本文將所有資源工具分為全局分析工具、目標(biāo)分析工具和輔助分析工具三大類。

表3 針對TCGA數(shù)據(jù)的在線分析資源

全局分析工具能夠檢查癌癥基因組的整體特征,可以成為剛剛開始研究癌癥基因組數(shù)據(jù)研究人員的寶貴資源。全局分析工具有兩種類型即Ⅰ型和Ⅱ型,前者僅提供全局分析,后者則提供除全局分析之外的選定目標(biāo)分析。

目標(biāo)分析工具是研究人員最常使用的基于網(wǎng)絡(luò)的公共工具。這些工具可以令研究人員深入分析具體的基因或者基因集,甚至miRNA等研究對象,方便使用者調(diào)查癌癥數(shù)據(jù)中自己感興趣的目標(biāo)。

基于公共網(wǎng)絡(luò)的輔助分析工具可以將TCGA數(shù)據(jù)轉(zhuǎn)換為易于訪問、瀏覽和下載的在線資源。這些數(shù)據(jù)可以幫助用戶補(bǔ)充實(shí)驗(yàn)結(jié)果或者提供額外的證據(jù)和解釋,幫助研究人員更全面地分析自己的研究和促進(jìn)生物學(xué)發(fā)現(xiàn)。

3 TCGA數(shù)據(jù)在線分析工具推薦

首先可以由本文的分類區(qū)分不同工具的使用類型,縮小選擇范圍;然后根據(jù)實(shí)際需要結(jié)合具體研究(如數(shù)據(jù)來源、數(shù)據(jù)類型、分析方法、研究目的),選擇具體的工具進(jìn)行進(jìn)一步的分析。以下是對TCGA數(shù)據(jù)進(jìn)行不同分析時(shí)建議選擇的一些工具,但這些工具都不能完全取代先進(jìn)的計(jì)算和統(tǒng)計(jì)方法,只是為研究人員提供一些使用幫助,擴(kuò)展他們癌癥組學(xué)、癌癥復(fù)雜性和癌癥網(wǎng)絡(luò)等方面的相關(guān)知識。

3.1 突變分析

有10種在線工具(Broad GDAC Firehose,Cancer3D,cbioportal,CELLX,IntOGen,TANRIC,TCGA Clinical Explorer,TCGA4U,UCSC Xena和Vanno)可以進(jìn)行突變分析。一般來說,推薦使用cbioportal,因其包含多種癌癥類型和多種可視化分析功能,功能強(qiáng)且易于使用。

3.2 相關(guān)性分析

有17種在線工具(Broad GDAC Firehose,Cancer Landscapes,canEvolve,cbioportal,CELLX,GDISC,GEPIA,MethHC,MEXPRESS,OASISPRO,Regulome Explorer,TANRIC,TCGA Clinical Explorer,TCGA NG-CHM,TCPA,Wanderer和Zodiac)可以進(jìn)行相關(guān)性分析。總的來說,推薦使用麻省理工學(xué)院和哈佛大學(xué)Broad研究所研發(fā)的Broad GDAC Firehose,因其有多種分析算法供用戶使用,功能全面,且包含多種分析工具。

3.3 差異分析

有12種在線工具(Broad GDAC Firehose,canEvolve,cbioportal,CELLX,GEPIA,MEXPRESS,OncoScape,TANRIC,TCGA4U,TCPA,UALCAN和Wanderer)可以進(jìn)行差異分析,一般推薦使用分析基因表達(dá)譜的工具GEPIA。差異分析是該工具的主要分析功能,其在線分析界面簡單易懂,非常易于理解和使用。

3.4 通路分析

有8種在線工具(Broad GDAC Firehose,Cancer Landscapes,canEvolve,MethHC,OncoScape,PathwayMapper,Regulome Explorer和TCGA NG-CHM)可以進(jìn)行通路分析。推薦使用Broad GDAC Firehose和OncoScape,前者分析方法豐富,后者簡單直觀。

3.5 生存分析

有16種在線工具(Broad GDAC Firehose,Cancer Landscapes,canEvolve,cbioportal,CELLX,GDISC,GEPIA,KMplotter,OASISPRO,PROGgeneV2,TANRIC,TCGA Clinical Explorer,TCGA4U,TCPA,UALCAN和UCSC Xena)可以進(jìn)行生存分析。如果僅想進(jìn)行單一的生存分析,推薦使用PROGgeneV2,因其具有廣泛的數(shù)據(jù)來源和多種可選參數(shù)設(shè)置。

3.6 泛癌分析

有8種在線工具(Broad GDAC Firehose,CancerLandscapes,cbioportal,IntOGen,Regulome Explorer,TCGA NG-CHM,UCSC Xena和Zodiac)可以進(jìn)行泛癌癥分析(pan-cancer analysis)。一般來說,推薦使用cbioportal和Cancer Landscapes,前者收集了來自泛癌研究的大量樣本且擁有強(qiáng)大的分析能力;后者的癌癥圖譜模型中包含了泛癌模型,可以直接用于分析。

4 總結(jié)

科學(xué)家們開發(fā)出多種生物信息學(xué)工具進(jìn)行數(shù)據(jù)挖掘和分析,以便尋找新發(fā)現(xiàn)。不久的將來,新發(fā)現(xiàn)將有助于診斷、治療和預(yù)防癌癥。TCGA提供的癌癥基因組學(xué)數(shù)據(jù)可以系統(tǒng)地揭示癌癥分子生物學(xué)的新圖景。這些大量公開可用的數(shù)據(jù),為世界各地的研究人員提供了癌癥遺傳學(xué)的知識來源,結(jié)合多種分析有助于開發(fā)個(gè)性化癌癥藥物。本文全面整理了基于網(wǎng)絡(luò)的公共可用的在線分析資源和工具,可以幫助研究人員方便地查找和使用合適的工具,增進(jìn)他們對癌癥基因組學(xué)的理解。

猜你喜歡
數(shù)據(jù)類型基因組癌癥
牛參考基因組中發(fā)現(xiàn)被忽視基因
詳談Java中的基本數(shù)據(jù)類型與引用數(shù)據(jù)類型
如何理解數(shù)據(jù)結(jié)構(gòu)中的抽象數(shù)據(jù)類型
留意10種癌癥的蛛絲馬跡
癌癥“偏愛”那些人?
海峽姐妹(2018年7期)2018-07-27 02:30:36
對癌癥要恩威并施
特別健康(2018年4期)2018-07-03 00:38:08
不如擁抱癌癥
特別健康(2018年2期)2018-06-29 06:13:42
基因組DNA甲基化及組蛋白甲基化
遺傳(2014年3期)2014-02-28 20:58:49
有趣的植物基因組
基因組生物學(xué)60年
且末县| 南开区| 永康市| 新安县| 锡林浩特市| 和林格尔县| 景宁| 海南省| 板桥市| 休宁县| 巫山县| 德昌县| 彭阳县| 永年县| 塔城市| 刚察县| 深泽县| 临汾市| 称多县| 兴安县| 成武县| 铜陵市| 平定县| 平安县| 聊城市| 喀喇沁旗| 黔南| 永春县| 华池县| 高唐县| 湟中县| 洛阳市| 离岛区| 安庆市| 安岳县| 深泽县| 兰西县| 来安县| 兴和县| 澄江县| 彭州市|