国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

如何挖掘HPA數(shù)據(jù)庫中研究數(shù)據(jù)并生成結(jié)果表達(dá)圖

2022-02-23 10:24蘇永發(fā)陳金圖
關(guān)鍵詞:頁面圖譜癌癥

蘇永發(fā),陳金圖

(福建醫(yī)科大學(xué)附屬泉州第一醫(yī)院檢驗(yàn)科,福建 泉州 362000)

蛋白質(zhì)是人體一切器官、組織、細(xì)胞甚至亞細(xì)胞的重要組成成分。解決人類所有蛋白質(zhì)在器官、組織、細(xì)胞和亞細(xì)胞水平上的空間分布,將進(jìn)一步增加我們對(duì)人類健康和疾病生物學(xué)的理解。

隨著眾多公共數(shù)據(jù)庫的建立和開放,越來越多的研究者可以從中直接獲取大數(shù)據(jù),方便研究者的后續(xù)工作。HPA數(shù)據(jù)庫是一個(gè)用于癌癥和正?;虮磉_(dá)譜分析和交互分析的web服務(wù)器,幫助臨床科研愛好者更高效的利用公共數(shù)據(jù)資源。本文通過初步介紹HPA數(shù)據(jù)庫公共網(wǎng)頁各個(gè)模塊的功能,讓HPA網(wǎng)頁式的交互界面使用更簡(jiǎn)單。

1 H P A簡(jiǎn)介與檢索方法

1.1 簡(jiǎn)介 HPA數(shù)據(jù)庫官方網(wǎng)站:www.proteinatlas.org利用各種組學(xué)技術(shù)致力于提供全部24000種人類蛋白質(zhì)的組織和細(xì)胞分布信息。地圖集被定義為提供全面信息的、可視化的地圖或圖表的集合。HPA采用該種方法,將人類蛋白質(zhì)圖譜分為六個(gè)獨(dú)立的部分:組織圖譜[1-2]顯示了蛋白質(zhì)在人體所有主要組織和器官中的分布,細(xì)胞圖譜[3]顯示了蛋白質(zhì)在單細(xì)胞中的亞細(xì)胞定位,病理譜譜[4]顯示了蛋白質(zhì)水平對(duì)癌癥患者生存的影響。HPA的第19個(gè)版本新增了三個(gè)模塊:大腦圖譜,血液圖譜和代謝圖譜(圖1)。

圖1 HPA首頁界面及搜索結(jié)果界面

1.2 方法HPA提供兩種不同的方式訪問該頁面。最直接的方法是直接搜索功能,可用于自由文本的搜索,比如通過基因名稱、EnsEM BLe基因編號(hào)和抗體編號(hào)等進(jìn)行查詢。以CCNB1為例進(jìn)行搜索(圖1),我們獲得3個(gè)搜索結(jié)果。HPA網(wǎng)站還可以提供更精確的搜索。Fields提供多項(xiàng)選擇,我們可以按照需要目的性地進(jìn)行搜索。比如通過蛋白質(zhì)表達(dá)水平和蛋白質(zhì)分類信息等進(jìn)行高級(jí)查詢。它不僅能夠包含(或排除)定位于特定組織或細(xì)胞器的蛋白質(zhì),而且還可以通過結(jié)合多種標(biāo)準(zhǔn)(例如添加依賴于細(xì)胞周期的標(biāo)準(zhǔn))來優(yōu)化搜索亞細(xì)胞表達(dá)和RNA表達(dá)。搜索結(jié)果將會(huì)生成一個(gè)以基因?yàn)橹行牡慕Y(jié)果列表并提供更全面的信息。通過在頁面上相應(yīng)的縮略圖,我們可以在不同的子圖譜上進(jìn)行切換。

第二種方法是通過登錄頁面(圖2A),其提供了蛋白質(zhì)組的交互式知識(shí)章節(jié)。如圖顯示,組織圖譜和細(xì)胞圖譜的登入頁面包含有許多可點(diǎn)擊的圖像和表格等,其包含對(duì)組織/細(xì)胞器的簡(jiǎn)要說明。登入頁面的一個(gè)關(guān)鍵性就是交互性,每個(gè)圖像、數(shù)字或圖解都是可點(diǎn)擊的,直接鏈接到相應(yīng)基因列表、特定組織或細(xì)胞圖像。

圖2 組織圖譜登陸界面及細(xì)胞登陸界面

2 圖譜分類與數(shù)據(jù)下載

2.1 組織圖譜 在主要的圖集中我們可以查到相關(guān)的RNA-Seq數(shù)據(jù),組織圖譜上的每個(gè)基因頁面都進(jìn)行了全面的信息總結(jié),包含相應(yīng)的mRNA和蛋白質(zhì)表達(dá)水平[1]。針對(duì)76種不同的細(xì)胞類型、對(duì)應(yīng)于涵蓋人體所有主要部位的44種未患病的人體組織類型進(jìn)行了分析,數(shù)據(jù)以基于組織的蛋白質(zhì)表達(dá)水平注釋的形式呈現(xiàn)。GENERAL INFORMATION從Ensembl、蛋白質(zhì)分類、預(yù)測(cè)定位和轉(zhuǎn)錄水平等方面對(duì)基因信息進(jìn)行了總結(jié)(圖3A)。Show more可提供更多基因信息,并且“i”符號(hào)都能夠進(jìn)行點(diǎn)擊,它提供了簡(jiǎn)短的描述幫助用戶進(jìn)行理解。Human Protein Atlas Information針對(duì)HPA生成的RNA-Seq數(shù)據(jù)、GTEx數(shù)據(jù)庫[5]和FANTOM5數(shù)據(jù)庫[6]進(jìn)行描述。根據(jù)表達(dá)模式,HPA將所有人類蛋白質(zhì)編碼基因進(jìn)行分類,包括全部表達(dá)、組織富集、組織增強(qiáng)、混合表達(dá)和未檢測(cè)到等[7]。此外,其他欄目還提供相關(guān)詳細(xì)信息。根據(jù)共同的功能特征,將被分析的組織分為13個(gè)不同的組,每組都可以單擊以訪問包含的組織列表(圖3B)。圖3C顯示了在不同組織中蛋白質(zhì)的表達(dá)水平和mRNA的表達(dá)水平。單擊組織名稱或豎狀條,可訪問詳細(xì)數(shù)據(jù)頁面。

圖3 以CCNB1基因?yàn)槔慕M織圖譜頁面布局

每個(gè)組織都有一個(gè)提供詳細(xì)數(shù)據(jù)的獨(dú)立頁面,顯示了染色圖像以及被分析的細(xì)胞類型的表達(dá)水平。此處用睪丸作為示例,實(shí)驗(yàn)中使用的三種不同抗體各顯示三張圖像(圖4A),該蛋白質(zhì)的表達(dá)在在輸精管的細(xì)胞亞群中高度表達(dá),而在間質(zhì)細(xì)胞中未檢測(cè)到。所有圖像均可被單擊放大成高分辨率視圖(圖4B),允許在鄰近細(xì)胞的背景下對(duì)蛋白質(zhì)表達(dá)進(jìn)行可視化觀察。圖4C提供RNA表達(dá)數(shù)據(jù)的詳細(xì)信息。TESTIS-HPA RNA-seq提供了組織切片圖像,包括樣本中存在的細(xì)胞類型的估計(jì)分值。這使用戶有可能評(píng)估和進(jìn)一步了解基于不同細(xì)胞類型混合的RNA表達(dá)數(shù)據(jù),并將信息與細(xì)胞類型特定的蛋白質(zhì)表達(dá)譜進(jìn)行比較。HUMAN SUBPROTEOMES提供一個(gè)亞蛋白質(zhì)組登入頁面,其概述了某些功能性基因組,如可用藥蛋白質(zhì)組和癌癥蛋白質(zhì)組等(圖2A)。進(jìn)入亞蛋白質(zhì)組鏈接頁面的網(wǎng)絡(luò)圖顯示了不同組織中富集基因之間的分布。紅色節(jié)點(diǎn)代表組織富集基因的數(shù)量,橙色節(jié)點(diǎn)代表組織富集的基因數(shù)量(圖5)。 紅色和橙色節(jié)點(diǎn)的大小與節(jié)點(diǎn)內(nèi)顯示的基因數(shù)量有關(guān)。每個(gè)節(jié)點(diǎn)都是可進(jìn)行點(diǎn)擊的,并產(chǎn)生所有富集基因的列表。

圖4 以CCNB1為例的組織圖譜詳細(xì)數(shù)據(jù)

2.2 病理圖譜 目前的《癌癥圖譜》包含20種最常見的蛋白質(zhì)表達(dá)數(shù)據(jù),與組織圖譜相一樣,在組織芯片基礎(chǔ)上使用進(jìn)行免疫組化染色。在《病理圖譜》中,在癌癥基因組圖譜的全基因組表達(dá)數(shù)據(jù)的基礎(chǔ)上,采用系統(tǒng)水平方法對(duì)人類基因組的臨床結(jié)局進(jìn)行分析。來自HPA的RNA序列數(shù)據(jù)和8000名個(gè)體癌癥患者(包括20種主要癌癥類型中的17種)被用于確定每種癌癥類型中每個(gè)基因的RNA表達(dá)水平與總生存時(shí)間之間的相關(guān)性。有超過500000個(gè)Kaplan-Meier圖無偏倚地對(duì)預(yù)后基因進(jìn)行鑒定。預(yù)后基因被分為有利基因(RNA高表達(dá)與較長(zhǎng)的生存時(shí)間成正相關(guān))和不利基因(RNA高表達(dá)較長(zhǎng)的生存時(shí)間成負(fù)相關(guān))。與其他癌癥相比,研究者可以識(shí)別某些癌癥類型中升高的基因。研究還表明,個(gè)體腫瘤的基因表達(dá)模式存在較大差異,可能超過不同腫瘤類型間的差異。這些數(shù)據(jù)可用于為癌癥患者生成個(gè)性化的基因組級(jí)代謝模型,以識(shí)別與腫瘤生長(zhǎng)有關(guān)的關(guān)鍵基因。PROGNOSTIC SUMMARYi呈現(xiàn)了與癌癥類型相關(guān)的預(yù)后基因Kaplan-Meier繪制(圖6A)。RNA EXPRESSION OVERVIEW顯示了17種癌癥的mRNA表達(dá)水平(圖6B)。PROTEIN EXPRESSIONi展示了免疫組化染色的癌癥組織的圖像,并總結(jié)了使用免疫組化分析的不同癌癥類型的蛋白表達(dá)水平(圖6C)。每個(gè)癌癥組織都有一個(gè)詳細(xì)的數(shù)據(jù)頁,提供生存分析數(shù)據(jù)和每個(gè)患者的RNA表達(dá)水平(圖6D),以及可點(diǎn)擊的免疫組織化學(xué)癌癥組織的圖像(圖6E)。以MKI67癌基因?yàn)槔?,如圖顯示該基因的高表達(dá)與肝、腎和胰腺癌的預(yù)后有關(guān)(圖6F)。

圖6 以CCNB1為例的病理圖譜頁面布局

2.3 細(xì)胞圖譜 細(xì)胞圖譜包含了12,003個(gè)蛋白質(zhì)的空間分布,這些蛋白質(zhì)被定位到32個(gè)亞細(xì)胞結(jié)構(gòu),進(jìn)而對(duì)13個(gè)主要細(xì)胞器蛋白質(zhì)組進(jìn)行描述。IF圖像的高分辨率允許檢測(cè)單個(gè)細(xì)胞之間的信號(hào)變化。這些細(xì)胞間的變化可能是信號(hào)強(qiáng)度的變化,表明不同細(xì)胞中蛋白質(zhì)的豐度不同,或者蛋白質(zhì)的定位在不同的細(xì)胞中是不同的。HPA使用兩種不同的方法來尋找蛋白質(zhì)表達(dá)的細(xì)胞周期依賴性:首先,在U-2 OS FUCCI細(xì)胞系[8-9]中對(duì)選定的蛋白質(zhì)進(jìn)行染色。第二種方法是基于微管和核的特征解析細(xì)胞周期位置的創(chuàng)新計(jì)算模型。這些細(xì)胞按標(biāo)準(zhǔn)方法進(jìn)行染色,抗體用綠色表示,紅色表示微管,黃色表示內(nèi)質(zhì)網(wǎng),藍(lán)色表示細(xì)胞核。Human Protein Atlas INFORMATIONi一欄匯總了實(shí)驗(yàn)生成的數(shù)據(jù),包括基于細(xì)胞系中TPM值的RNA表達(dá)類別(以與RNA組織類別相同的方式計(jì)算)和單細(xì)胞變異等。自定義數(shù)據(jù)是Cell Atlas新增的功能之一。它們鏈接到附屬的研究項(xiàng)目,并提供正常細(xì)胞圖譜數(shù)據(jù)之外的其他信息。

圖7A/B顯示了56種細(xì)胞系中CCNB1基因的mRNA表達(dá)情況,利用12種顏色來區(qū)別這些條狀圖區(qū)分不同器官來源。將鼠標(biāo)懸停在一個(gè)細(xì)胞株上,將顯示RNA-Seq的結(jié)果和關(guān)于該細(xì)胞株的詳細(xì)信息。此處,高分辨率IF圖像顯示了不同細(xì)胞系中蛋白質(zhì)的亞細(xì)胞定位。細(xì)胞圖譜所使用的細(xì)胞系是根據(jù)RNA表達(dá)水平從22個(gè)系中選出的,但始終以U-2 OS作為參考。IF染色主要采用多聚甲醛固定步驟,利用激光共聚焦掃描顯微鏡上對(duì)細(xì)胞手動(dòng)或自動(dòng)成像[10]。圖像包括四個(gè)通道(感興趣的蛋白、細(xì)胞核標(biāo)記、微管和ER),可以自由進(jìn)行開關(guān)。此外,還有一些信號(hào)強(qiáng)度通道,它們顯示細(xì)胞面積和細(xì)胞周期位置。研究者可以同時(shí)選擇三個(gè)圖像進(jìn)行比較??梢酝ㄟ^單擊復(fù)選框或拖放大圖上的縮略圖選中,所有圖片也可以點(diǎn)擊放大查看,如圖7C所示。圖8顯示U-2 OS FUCCI細(xì)胞系中的IF染色情況。G1期的Cdt1(紅色)和S與G2期的Geminin(綠色)(圖8A)顯示CCNB1表達(dá)在S/G2期(圖8B)達(dá)到峰值。The organelle proteome的登錄頁是所有細(xì)胞器和亞結(jié)構(gòu)蛋白質(zhì)組的摘要,它們?cè)诩?xì)胞圖譜中被描述。由于大多數(shù)蛋白質(zhì)是在兩個(gè)或兩個(gè)以上的細(xì)胞器中被檢測(cè)到的,因此有一個(gè)登陸頁專門介紹這種多位點(diǎn)蛋白質(zhì)組。

圖7 以CCNB1基因?yàn)槔募?xì)胞圖譜頁面布局

圖8 U-2 OS FUCCI細(xì)胞系中的IF染色情況

2.4 大腦圖譜 《大腦圖譜》通過整合三種哺乳動(dòng)物物種(人、豬和小鼠)的數(shù)據(jù)探索了哺乳動(dòng)物大腦中的蛋白質(zhì)表達(dá)。圖9A顯示了CCNB1在人、豬和小鼠大腦不同區(qū)域的表達(dá)情況。我們可以從中獲得一系列大腦樣本的mRNA表達(dá)數(shù)據(jù),這些樣本來自10個(gè)大腦主要區(qū)域,包括垂體和視網(wǎng)膜等。該圖集分析了來自整個(gè)小鼠大腦切片上的271個(gè)基因,從中我們可獲得高分辨率的免疫熒光圖像,探索蛋白質(zhì)在小鼠大腦中的位置。我們可以通過點(diǎn)擊組織名稱或條狀圖訪問樣本數(shù)據(jù)。以NECAB1基因(神經(jīng)元鈣結(jié)合相關(guān)蛋白)為例,神經(jīng)元亞群在整個(gè)大腦中顯示出明顯的體樹突狀免疫反應(yīng)性。圖像9B顯示了老鼠大腦海馬區(qū)神經(jīng)元亞群的蛋白質(zhì)位置。

圖9 CCNB1在人、豬和小鼠大腦不同區(qū)域的表達(dá)情況

2.5 血液圖譜 《血液圖譜》提供了有關(guān)人類血液的細(xì)胞類型和蛋白質(zhì)組的數(shù)據(jù),提供了通過細(xì)胞分選分離出的18種單血細(xì)胞類型的轉(zhuǎn)錄組學(xué)數(shù)據(jù),包括各種B細(xì)胞和T細(xì)胞等。血液蛋白質(zhì)組由基于質(zhì)譜的蛋白質(zhì)組學(xué)和/或基于抗體的免疫分析確定的血液蛋白質(zhì)濃度數(shù)據(jù)表示。此外,該圖集還對(duì)人類分泌體進(jìn)行了分類,并對(duì)人類預(yù)測(cè)的分泌蛋白進(jìn)行了注釋,試圖確定哪些基因會(huì)積極地分泌到人類血液中,哪些基因在諸如消化系統(tǒng)等。圖10A顯示血細(xì)胞類型表達(dá)概述顯示了來自三個(gè)不同來源的RNA-seq數(shù)據(jù):HPA數(shù)據(jù)、Monaco scaled和Schmiedel scaled生成的數(shù)據(jù),其顏色編碼是基于血液細(xì)胞類型譜系。我們可以通過單擊組織名稱或欄訪問詳細(xì)的數(shù)據(jù)頁。

圖10 血液圖譜的頁面布局

2.6 代謝圖譜 組織圖譜的內(nèi)容已擴(kuò)展到代謝圖譜,從而能夠在人類代謝網(wǎng)絡(luò)的背景下探索蛋白質(zhì)功能和基因表達(dá)。代謝圖譜可用于超過120種不同的代謝途徑或子系統(tǒng),每個(gè)圖都描繪了蛋白質(zhì)與所涉及的生化反應(yīng)之間的聯(lián)系。每個(gè)通路圖都伴隨著一個(gè)熱圖,詳細(xì)描述了37種不同組織類型中所有參與代謝通路的蛋白質(zhì)的mRNA水平。如圖11A所示代謝通路圖是由個(gè)別路徑組織的,以方便代謝區(qū)域的可視化,更多的細(xì)節(jié)和完全互動(dòng)的路徑圖可以在metabolicatlas.org上找到。圖11B描述了代謝圖譜中完整的通路詳細(xì)列表和每個(gè)通路中涉及的酶的數(shù)量。

圖11 代謝圖譜的頁面布局

2.7 數(shù)據(jù)下載 在搜索頁面上列出的數(shù)據(jù)與當(dāng)前搜索結(jié)果相對(duì)應(yīng)的基因可以以不同的格式下載,包括XML、RDF和TAB。HPA還提供不同的可下載文件,包含來自組織的完整初級(jí)蛋白質(zhì)數(shù)據(jù),病理和細(xì)胞圖譜等,以及組織和細(xì)胞中的RNA表達(dá)水平。所有可下載的文件都可以在www.proteinatlas.org/about/download網(wǎng)站找到。

3 討論

目前,生命科學(xué)和醫(yī)學(xué)已進(jìn)入大數(shù)據(jù)驅(qū)動(dòng)的革新時(shí)代?;虮磉_(dá)譜在生物學(xué)、醫(yī)學(xué)等多個(gè)領(lǐng)域發(fā)揮著重要作用。網(wǎng)絡(luò)上的分子生物學(xué)數(shù)據(jù)庫種類多及涉及面廣。HPA網(wǎng)站有著數(shù)以百萬計(jì)的高分辨率圖片,從該網(wǎng)站下載下來的數(shù)據(jù)可作為參考數(shù)據(jù)集進(jìn)行大規(guī)模生物信息學(xué)分析。本文初步介紹了HPA網(wǎng)站的基本功能。隨著更多感興趣的研究者的使用,我們相信HPA的更多功能會(huì)被挖掘,以便于研究者的使用,從而減輕科研工作者壓力,提高工作效率。

猜你喜歡
頁面圖譜癌癥
刷新生活的頁面
體檢發(fā)現(xiàn)的結(jié)節(jié),離癌癥有多遠(yuǎn)?
答案
繪一張成長(zhǎng)圖譜
癌癥“偏愛”那些人?
對(duì)癌癥要恩威并施
不如擁抱癌癥
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
主動(dòng)對(duì)接你思維的知識(shí)圖譜
雜草圖譜
万州区| 保靖县| 达拉特旗| 开封市| 新昌县| 呼和浩特市| 宜春市| 连山| 兖州市| 石景山区| 拉萨市| 泰宁县| 城固县| 栾城县| 郯城县| 水城县| 科技| 铁岭市| 乌兰浩特市| 宿州市| 闵行区| 西青区| 藁城市| 榆中县| 巴中市| 淅川县| 陵川县| 疏勒县| 岳阳县| 海城市| 揭西县| 锦州市| 曲靖市| 洞头县| 元阳县| 扬州市| 儋州市| 千阳县| 留坝县| 靖远县| 施秉县|