国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于不同標(biāo)準(zhǔn)化假設(shè)分析癌基因組甲基化譜

2011-08-13 07:34吳瑞紅程立新李朋飛王明月王晨光
關(guān)鍵詞:原始數(shù)據(jù)位數(shù)甲基化

王 棟 吳瑞紅 程立新 李朋飛 王明月 李 賓 王晨光 郭 政*

1(電子科技大學(xué)生命學(xué)院,成都 610054)

2(哈爾濱醫(yī)科大學(xué)生物信息科學(xué)與技術(shù)學(xué)院,哈爾濱 150086)

引言

異常的DNA甲基化與癌的發(fā)生發(fā)展密切相關(guān)[1-2],因此在全基因組范圍內(nèi)識(shí)別癌相關(guān)的差異甲基化基因可以分析疾病發(fā)生的分子機(jī)制,發(fā)現(xiàn)用于疾病診斷與藥物靶設(shè)計(jì)的生物學(xué)標(biāo)志[3]。然而,利用甲基化芯片檢測的高通量數(shù)據(jù)往往受諸如試劑與檢測批次、不同操作者等多種因素的影響[4-5]。通常認(rèn)為,這些技術(shù)變異可能降低檢測生物信號(hào)的統(tǒng)計(jì)效能[6]。為了排除這些技術(shù)變異的影響,針對基因表達(dá)譜數(shù)據(jù)處理開發(fā)的標(biāo)準(zhǔn)化方法(如分位數(shù)標(biāo)準(zhǔn)化[7]和中值標(biāo)準(zhǔn)化[8]等)常被應(yīng)用于處理甲基化譜數(shù)據(jù)。這些標(biāo)準(zhǔn)化方法將所有樣本的信號(hào)值都標(biāo)準(zhǔn)化到相同的分布,或者使之具有相同的中值,為此通常需要假設(shè)在疾病樣本中差異表達(dá)的基因很少,并且差異高表達(dá)和低表達(dá)的基因數(shù)目大致相等[5]。然而,最近的研究顯示,在癌表達(dá)譜中包含大量上調(diào)表達(dá)的基因。采用這些傳統(tǒng)假設(shè)的標(biāo)準(zhǔn)化方法,會(huì)失查很多與癌相關(guān)的上調(diào)差異表達(dá)基因,并且發(fā)現(xiàn)很多假的下調(diào)差異表達(dá)基因[9],因此需要采用不依賴于如前所述假設(shè)的數(shù)據(jù)標(biāo)準(zhǔn)化方法,如最小變化集(least variant set,LVS)等[10]。通過分析低通量癌基因組甲基化譜數(shù)據(jù),有研究者認(rèn)為癌基因組呈現(xiàn)廣泛的低甲基化狀態(tài)[11-12],因此在癌樣本和正常樣本中的甲基化信號(hào)歸一化的標(biāo)準(zhǔn)化方法可能會(huì)扭曲真實(shí)的生物學(xué)信號(hào)。對此問題,研究者并未達(dá)成共識(shí)。一些研究人員在分析DNA甲基化譜數(shù)據(jù)時(shí)選擇不進(jìn)行標(biāo)準(zhǔn)化處理[13-14],而大部分研究者仍然采用常規(guī)的標(biāo)準(zhǔn)化方法對甲基化譜數(shù)據(jù)進(jìn)行預(yù)處理[15-16]。不同的處理方法可能對篩選差異甲基化基因等后續(xù)分析有重要的影響,有必要進(jìn)行全面的評(píng)估。

在本研究中,通過分析4種癌型的各2套甲基化譜數(shù)據(jù),發(fā)現(xiàn)癌樣本與正常樣本的原始信號(hào)值(beta值)的中值無顯著差異?;谠夹盘?hào)值和分位數(shù)標(biāo)準(zhǔn)化后信號(hào)值篩選出來的差異甲基化基因交疊比例很高,并且改變方向(高甲基化或低甲基化)的高度一致?;诜治粩?shù)標(biāo)準(zhǔn)化后信號(hào)值可以篩選出更多的差異甲基化基因,而且這些基因的改變方向與其對應(yīng)原始信號(hào)的改變方向高度一致,提示采用分位數(shù)標(biāo)準(zhǔn)化可以提高識(shí)別差異甲基化基因的統(tǒng)計(jì)效能,且并未對甲基化數(shù)據(jù)造成嚴(yán)重的偏倚。此外,由同一種癌型的不同數(shù)據(jù)集得到的差異甲基化基因,其改變方向呈現(xiàn)高度的一致性,提示利用甲基化譜可以可靠地發(fā)現(xiàn)癌癥中甲基化的改變方向。

1 材料與方法

1.1 數(shù)據(jù)

本研究所用數(shù)據(jù)來自高通量基因表達(dá)數(shù)據(jù)庫(Gene Expression Omnibus,GEO)[17]和癌癥基因組圖譜數(shù)據(jù)庫(The Cancer Genome Atlas,TCGA)[18],如表1所示。所有的數(shù)據(jù)都產(chǎn)生自 Illumina HumanMethylation27 BeadChip平臺(tái)。去除性染色體上的位點(diǎn)后,共包括26486個(gè)位點(diǎn),涉及13890個(gè)基因。對于來自癌癥基因組圖譜中的數(shù)據(jù)集,使用了該數(shù)據(jù)庫中定義的 Level2數(shù)據(jù),包含探針甲基化(M)與非甲基化(U)信號(hào)強(qiáng)度值、探針與基因的對應(yīng)關(guān)系。甲基化程度Beta值的計(jì)算采用Beta=M/(U+M+100)[14]。

由于甲基化譜中的數(shù)據(jù)可能受到不同批次和不同實(shí)驗(yàn)室等因素的影響[4],本研究采取如下的標(biāo)準(zhǔn)選取數(shù)據(jù)集:選擇包含不少于10對(癌及癌旁正常組織的配對)樣本的數(shù)據(jù)集,每個(gè)數(shù)據(jù)集中的全部癌癥與正常配對樣本來自同一個(gè)批次及同一個(gè)實(shí)驗(yàn)室,對每個(gè)癌型選取兩個(gè)具有最大樣本量的數(shù)據(jù)集。數(shù)據(jù)集采用如下的命名規(guī)則:癌型(配對樣本數(shù))。通過篩選,最終采用了結(jié)腸癌、肺癌、腎癌和胃癌的甲基化數(shù)據(jù) (見表1)。

表1 4種癌型的甲基化數(shù)據(jù)Tab.1 The methylation datasets for four cancer types

1.2 分位數(shù)標(biāo)準(zhǔn)化算法

分位數(shù)標(biāo)準(zhǔn)化算法的目的,是使所有樣本中探針強(qiáng)度的分布具有一致的分位數(shù)[7]。假設(shè)有 M張芯片(樣本),每張芯片上有 N個(gè)探針,則構(gòu)造一個(gè)N×M維的探針強(qiáng)度矩陣E,通過將矩陣的每個(gè)列向量按大小排秩,得到矩陣E1。然后,對E1的每行取均值,得到參考向量。最后,將參考向量中的探針表達(dá)值對應(yīng)到E中每個(gè)列向量的原有秩次上,這樣所有樣本中的探針強(qiáng)度就保持了一致的分布[7]。如圖1所示,原始數(shù)據(jù)中不同樣本間整體甲基化水平波動(dòng)較大,通過分位數(shù)標(biāo)準(zhǔn)化,可以使不同樣本間高通量甲基化數(shù)據(jù)信號(hào)更加一致。通常認(rèn)為,如此標(biāo)準(zhǔn)化后,可以消除技術(shù)變異對高通量甲基化數(shù)據(jù)所帶來的影響,使得數(shù)據(jù)具有較好的可比性。

有研究顯示,分位數(shù)標(biāo)準(zhǔn)化算法能夠獲得與其他復(fù)雜的標(biāo)準(zhǔn)化算法相同甚至更好的效果[19];又由于其計(jì)算簡單,因而被廣泛采用。值得注意的是,由于在高通量芯片數(shù)據(jù)中復(fù)雜的技術(shù)噪聲難以準(zhǔn)確估計(jì)[19],對標(biāo)準(zhǔn)化算法的評(píng)價(jià)通常只是經(jīng)驗(yàn)性的,而并不能夠根據(jù)其數(shù)學(xué)原理做簡單的解釋。

圖1 甲基化數(shù)據(jù)。(a)標(biāo)準(zhǔn)化前;(b)標(biāo)準(zhǔn)化后Fig.1 The methylation datasets before.(a)and after;(b)normalization

1.3 預(yù)處理與差異甲基化基因的篩選方法

每套數(shù)據(jù)都采用兩種處理方法:一是對樣本進(jìn)行分位數(shù)標(biāo)準(zhǔn)化,使beta值在所有的樣本間都具有相同的分布[7];二是不對 beta值進(jìn)行標(biāo)準(zhǔn)化處理。對于有多個(gè)甲基化檢測位點(diǎn)的基因,保留所有檢測位點(diǎn)具有一致的甲基化改變方向的基因。對每種癌型的兩套數(shù)據(jù),只將其中篩選出來的基因交集作為后續(xù)分析。

采用配對 t檢驗(yàn)識(shí)別差異甲基化基因,并用Benjamini-Hochberg方法來控制多重檢驗(yàn)的錯(cuò)誤發(fā)現(xiàn)率[20]。

1.4 一致性分析

對于得到的兩個(gè)差異基因列表,采用基因重合比例(percentage of overlapping genes,POG)指標(biāo),評(píng)價(jià)兩個(gè)癌基因列表的一致性[21]。如果長度為 L1的列表1與長度為L2的列表2有k個(gè)交疊的基因,那么從列表1到列表2方向的基因重合比例得分為k/L1,即POG12=k/L1,從列表2到列表1方向的基因重合比例得分為k/L2,即POG21=k/L2。同時(shí),還計(jì)算了列表1中的差異甲基化基因在列表2中的方向改變一致的比例(P1),列表2中找到的差異甲基化基因在列表1中方向改變一致的比例(P2)。采用伯努利(Bernoulli)檢驗(yàn),判斷一致性得分顯著性水平。

對采用同一種方法在同一種癌型的不同數(shù)據(jù)集中選擇的差異甲基化基因列表,采用同樣的方法來評(píng)價(jià)其改變方向的一致性得分及其顯著性。

2 結(jié)果

2.1 標(biāo)準(zhǔn)化對甲基化數(shù)據(jù)信號(hào)的影響

在每套數(shù)據(jù)集中,首先對每個(gè)樣本取其所有檢測位點(diǎn)的原始 beta值的中值,然后利用配對秩和(wilcoxon ranksum)檢驗(yàn)分析正常樣本和癌癥樣本的beta值的中值有無顯著差別。在這8套數(shù)據(jù)中,均未發(fā)現(xiàn)顯著差異(P>0.05)??刂棋e(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)為 0.01,采用配對 t檢驗(yàn),在每套數(shù)據(jù)中篩選差異甲基化基因;再使用基因重合比例指標(biāo),評(píng)估采用原始數(shù)據(jù)和分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)篩選出的差異甲基化基因的一致性。結(jié)果顯示(見表 2),在各數(shù)據(jù)集中,POG12的指標(biāo)為 80% ~96%,即有80% ~96%的由采用原始數(shù)據(jù)篩選出來的差異甲基化基因包括在由分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)篩選出的差異甲基化基因中。例如,在 kidney100數(shù)據(jù)中,采用原始數(shù)據(jù)篩選到了3274個(gè)差異甲基化基因,其中有2992(89%)個(gè)包括在由分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)篩選出的3451個(gè)差異甲基化基因中,并且這些共同篩選到的2992個(gè)基因在標(biāo)準(zhǔn)化前后的甲基化改變方向相同。但是,在各數(shù)據(jù)集的原始數(shù)據(jù)中篩選出來的差異甲基化基因中,有4% ~20%的基因沒有在分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)中被篩選出來。因此,雖然正常和癌樣本的beta值的中值差別不顯著,但是數(shù)據(jù)標(biāo)準(zhǔn)化過程仍然可能會(huì)影響部分基因的顯著性判斷,在減少技術(shù)變異的同時(shí)也可能增加一定的偏倚[22]。

POG21指標(biāo)為72% ~88%,反映在各數(shù)據(jù)集中有12~28%的采用分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)篩選出來的差異甲基化基因,沒有在原始數(shù)據(jù)中篩選出來。為了分析在一套數(shù)據(jù)中由分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)單獨(dú)篩選出來的差異甲基化基因是否確實(shí)為反映癌與正常樣本差異的生物學(xué)有效信號(hào),分析這些基因在關(guān)于同種癌型另外一套獨(dú)立非數(shù)據(jù)集中原始信號(hào)的改變方向。假設(shè)如果這些被判斷為差異甲基化的基因其實(shí)是與疾病狀態(tài)無關(guān)的隨機(jī)錯(cuò)誤,則它們的差異改變方向?qū)⒉粫?huì)在獨(dú)立實(shí)驗(yàn)中被保留下來。分析結(jié)果顯示:對各癌型,在一套數(shù)據(jù)中由分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)單獨(dú)篩選出來的差異甲基化基因,在另外一套數(shù)據(jù)中原始信號(hào)改變方向的一致性為80% ~99%(見表3),均顯著高于隨機(jī)期望值50%(伯努利檢驗(yàn),P<0.001)。例如,在 kidney100數(shù)據(jù)中,采用分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)單獨(dú)找到529個(gè)差異甲基化基因,其中的470(89%)個(gè)基因的改變方向在kidney78數(shù)據(jù)的原始數(shù)據(jù)中得到驗(yàn)證,顯著高于隨機(jī)期望(伯努利檢驗(yàn),P<0.001)(見表3)。因此,大部分在各套數(shù)據(jù)中采用分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)篩選出的差異甲基化,確實(shí)為反映癌與正常樣本差異的生物學(xué)有效信號(hào)。

在各套數(shù)據(jù)中,采用原始數(shù)據(jù)篩選出的差異甲基化基因數(shù)目,都少于采用分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)篩選出的差異甲基化基因,提示在原始數(shù)據(jù)中篩選差異基因的統(tǒng)計(jì)效能可能較低。例如,TUSC2(tumor suppressor candidate 2)和TUSC3(tumor suppressor candidate 3)在兩套腎癌的分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)中,均被判斷為差異高甲基化基因,而采用原始數(shù)據(jù)分析均未能夠?qū)⑦@兩個(gè)基因判斷為差異甲基化基因。已經(jīng)有研究證實(shí),TUSC2和 TUSC3均為抑癌基因,它們的高表達(dá)可以誘導(dǎo)細(xì)胞凋亡,而高甲基化狀態(tài)可以抑制這兩個(gè)基因的表達(dá)從而促進(jìn)癌癥的發(fā)展[23-24]。再如,WIF1(WNT inhibitory factor 1)在兩套腎癌的分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)中,均被判斷為差異高甲基化基因;而采用原始數(shù)據(jù)分析均未將這個(gè)基因判斷為差異甲基化基因。已有研究證實(shí),WIF1的高表達(dá)可以抑制細(xì)胞生長和促進(jìn)細(xì)胞凋亡,發(fā)揮抑癌基因的作用;而在高甲基化狀態(tài)時(shí),則不能發(fā)揮抑癌作用[25-26]。

采用原始數(shù)據(jù)和分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)分別篩選出差異甲基化基因,其改變方向具有高度的一致性,P1和P2指標(biāo)為99% ~100%(見表2)。例如,在胃癌的兩套數(shù)據(jù)中,采用原始數(shù)據(jù)和分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù),分別篩選出的差異表達(dá)基因的改變方向完全一致。

表2 在標(biāo)準(zhǔn)化與非標(biāo)準(zhǔn)化數(shù)據(jù)中篩選的差異甲基化基因改變方向的一致性Tab.2 The consistency of methylation states of DM genes separately selected from the normalized and non-normalized data

表3 由分位數(shù)標(biāo)準(zhǔn)化額外篩選出的差異基因在獨(dú)立數(shù)據(jù)中甲基化狀態(tài)的一致性Tab.3 The consistency of methylation states of DM genes solely selected by the Quantile method in one dataset with their methylation states in another independent data

但是,值得注意的是,在結(jié)腸癌、肺癌和腎癌中,在經(jīng)過分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)篩選出的差異甲基化基因中,約有1%基因的甲基化狀態(tài)與原始數(shù)據(jù)中信號(hào)的改變方向相反。因此,數(shù)據(jù)標(biāo)準(zhǔn)化過程也可能會(huì)出現(xiàn)一定的過標(biāo)準(zhǔn)化現(xiàn)象,從而產(chǎn)生錯(cuò)誤的結(jié)果。

2.2 差異甲基化基因識(shí)別的可重復(fù)性

由于大部分由采用原始數(shù)據(jù)篩選出來的差異甲基化基因包括在由分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)篩選出的差異甲基化基因的列表中,所以只評(píng)價(jià)采用分位數(shù)標(biāo)準(zhǔn)化數(shù)據(jù)處理識(shí)別差異甲基化基因的可重復(fù)性。對每種癌型的兩套數(shù)據(jù)分別采用分位數(shù)標(biāo)準(zhǔn)化處理后,所獲得的差異甲基化基因的甲基化改變方向高度一致(見表4)。例如,在腎癌兩套數(shù)據(jù)中,都被識(shí)別為差異甲基化的2876個(gè)基因的甲基化改變方向全部相同(伯努利檢驗(yàn),P<0.001)。另外,95%以上的僅在一套數(shù)據(jù)中找到的差異甲基化基因在另一套數(shù)據(jù)中有相同的改變方向,反映這些基因在另一套數(shù)據(jù)中存在著有效的生物信號(hào)。例如,有575個(gè)基因僅在kidney100數(shù)據(jù)中被判斷為差異甲基化基因,但是其中的567個(gè)(99%)基因在kidney78數(shù)據(jù)中具有相同的甲基化改變方向,顯著高于隨機(jī)期望(伯努利檢驗(yàn),P <0.001)。

因此,在關(guān)于一種癌型的不同的高通量數(shù)據(jù)集中,識(shí)別的差異甲基化基因有高度的可重復(fù)性。這個(gè)結(jié)果也提示,在小樣本數(shù)據(jù)中找到的差異甲基化基因相對少的原因可能是:由于嚴(yán)格的控制多重檢驗(yàn)假陽性的統(tǒng)計(jì)過程,降低了識(shí)別差異甲基化基因的統(tǒng)計(jì)效能[21,27]。

3 討論與結(jié)論

數(shù)據(jù)標(biāo)準(zhǔn)化,是利用基因甲基化譜識(shí)別差異甲基化基因等后續(xù)分析的基礎(chǔ)。在分析低通量癌基因組甲基化數(shù)據(jù)時(shí),一些研究者發(fā)現(xiàn)癌基因組呈現(xiàn)廣泛的低甲基化現(xiàn)象[12],因此認(rèn)為傳統(tǒng)的標(biāo)準(zhǔn)化方法可能會(huì)扭曲真實(shí)的甲基化信號(hào)[28]。然而,低通量甲基化譜數(shù)據(jù)并不一定能夠準(zhǔn)確反映全基因組的甲基化特點(diǎn),可能會(huì)產(chǎn)生偏倚。通過分析關(guān)于4種癌型的各兩套高通量全基因組的甲基化譜數(shù)據(jù),發(fā)現(xiàn)在癌癥和正常樣本中,探針信號(hào)的中值分布并沒有顯著的差別,提示癌癥和正常樣本的基因組整體甲基化狀態(tài)并無顯著差別。另外,由于存在檢測變異(噪聲),采用原始數(shù)據(jù)篩選差異甲基化基因的統(tǒng)計(jì)效能可能會(huì)降低,從而會(huì)導(dǎo)致許多差異甲基化基因不能被篩選出來,而經(jīng)過分位數(shù)標(biāo)準(zhǔn)化后可以篩選出更多的差異甲基化基因。值得強(qiáng)調(diào)的是,在一套數(shù)據(jù)集中,經(jīng)過分位數(shù)標(biāo)準(zhǔn)化后額外找到的差異甲基化基因,與在同種癌型的獨(dú)立數(shù)據(jù)集中的原始信號(hào)的改變方向有高度的一致性,具有顯著的非隨機(jī)性,反映了這些差異甲基化基因在獨(dú)立數(shù)據(jù)中存在著明確的生物信號(hào)。這些結(jié)果說明,采用分位數(shù)標(biāo)準(zhǔn)化方法,可以提高識(shí)別差異甲基化基因的統(tǒng)計(jì)效能。因此,在正常樣本和癌癥樣本中,對于信號(hào)值的中值無顯著差別的甲基化譜數(shù)據(jù),建議采用針對基因表達(dá)譜數(shù)據(jù)處理開發(fā)的標(biāo)準(zhǔn)化方法。但是,在結(jié)腸癌、肺癌和腎癌中,發(fā)現(xiàn)有1%經(jīng)過分位數(shù)標(biāo)準(zhǔn)化后篩選出的差異甲基化基因,其甲基化狀態(tài)與原始數(shù)據(jù)中信號(hào)的改變方向相反。因此,數(shù)據(jù)標(biāo)準(zhǔn)化過程也可能會(huì)產(chǎn)生過標(biāo)準(zhǔn)化現(xiàn)象,從而導(dǎo)致產(chǎn)生1%左右的假陽性結(jié)果,需要將其去除。

分析也顯示,許多基因僅在研究同種癌型的一套數(shù)據(jù)中發(fā)生了顯著的甲基化改變,而未能夠在另外一套數(shù)據(jù)集中被識(shí)別為差異甲基化。這種表面的低重復(fù)性,可能來源于甲基化變化在個(gè)體間的生物學(xué)變異與異質(zhì)性、嚴(yán)格的統(tǒng)計(jì)控制與較小的樣本量所產(chǎn)生的低統(tǒng)計(jì)效能等因素[21,27]。特別地,在癌基因組中,異常的DNA甲基化改變可以被當(dāng)作生物標(biāo)記,用來預(yù)測癌癥后果和尋找藥物靶點(diǎn)[3];而統(tǒng)計(jì)效能的下降,會(huì)導(dǎo)致在不同數(shù)據(jù)中選擇少數(shù)最顯著的基因作為標(biāo)記變得很不穩(wěn)定[29]。為了評(píng)價(jià)來自研究同種癌型的不同實(shí)驗(yàn)所識(shí)別的最顯著的差異甲基化基因的可重復(fù)性,有必要考慮它們的功能相關(guān)關(guān)系,以及甲基化改變方向的一致性,而不是簡單地計(jì)算它們本身的重合率[30]。值得注意的是,實(shí)驗(yàn)設(shè)計(jì)的缺陷如實(shí)驗(yàn)中存在批次效應(yīng)(即與生物學(xué)無關(guān)因素的變異和樣本類別顯著相關(guān)),很可能會(huì)導(dǎo)致不可靠的生物學(xué)結(jié)論[4]。例如,在錯(cuò)誤地整合存在批次效應(yīng)的不同批次的甲基化數(shù)據(jù)時(shí),很可能會(huì)錯(cuò)誤地判斷差異甲基化基因的改變方向[4]。因此,應(yīng)該更加注重優(yōu)化實(shí)驗(yàn)設(shè)計(jì),嚴(yán)格地使技術(shù)變異隨機(jī)分布在不同的生物組中,并且在各組中檢測足夠多的樣本[31]。

[1]Melnikov A, Scholtens D, Godwin A, et al. Differential methylation profile of ovarian cancer in tissues and plasma[J].J Mol Diagn,2009,11(1):60-65.

[2]Shaknovich R,Geng H,Johnson NA,et al.DNA methylation signatures define molecular subtypes of diffuse large B-cell lymphoma[J].Blood,2010,116(20):e81-e89.

[3]Lugthart S,F(xiàn)igueroa ME,Bindels E,et al.Aberrant DNA hypermethylation signature in acute myeloid leukemia directed by EVI1[J].Blood,2011,117(1):234-241.

[4]Leek JT, Scharpf RB, Bravo HC, et al. Tackling the widespread and critical impact of batch effects in high-throughput data[J].Nat Rev Genet,2010,11(10):733-739.

[5]Quackenbush J. Microarray data normalization and transformation[J].Nat Genet,2002,32 Suppl:496-501.

[6]Larsson O,Wennmalm K,Sandberg R.Comparative microarray analysis[J].OMICS,2006,10(3):381-397.

[7]Bolstad BM,Irizarry RA,Astrand M,et al.A comparison of normalization methods for high density oligonucleotide array data based on variance and bias[J].Bioinformatics,2003,19(2):185-193.

[8]Ron-Bigger S,Bar-Nur O,Isaac S,et al.Aberrant epigenetic silencing of tumor suppressor genes is reversed by direct reprogramming[J].Stem Cells,2010,28(8):1349-1354.

[9]Wang Dong,Cheng Lixin,Wang Mingyue,et al.Extensive increase of microarray signals in cancers calls for novel normalization [J]. Computational Biology and Chemistry,2011,35(3):126-130.

[10]Calza S, Valentini D, Pawitan Y. Normalization of oligonucleotide arrays based on the least-variant set of genes[J].BMC Bioinformatics,2008,9:140.

[11]Esteller M.Epigenetics in cancer[J].N Engl J Med,2008,358(11):1148-1159.

[12]Feinberg AP,Vogelstein B.Hypomethylation distinguishes genes of some human cancers from their normal counterparts[J].Nature,1983,301(5895):89-92.

[13]Christensen BC,Houseman EA,Marsit CJ,et al.Aging and environmental exposures alter tissue-specific DNA methylation dependent upon CpG island context[J].PLoS Genet,2009,5(8):e1000602.

[14]O'Riain C,O'shea DM,Yang Y,et al.Array-based DNA methylation profiling in follicular lymphoma[J].Leukemia,2009,23(10):1858-1866.

[15]Rakyan VK, Down TA, Maslau S, et al. Human agingassociated DNA hypermethylation occurs preferentially at bivalent chromatin domains[J].Genome Res,2010,20(4):434-439.

[16]Teschendorff AE,Menon U,Gentry-Maharaj A,et al.Agedependent DNA methylation of genes that are suppressed in stem cells is a hallmark of cancer[J].Genome Res,2010,20(4):440-446.

[17]Barrett T,Troup DB,Wilhite SE,et al.NCBI GEO:archive for high-throughput functional genomic data[J].Nucleic Acids Res,2009,37(Database Issue):D885-D890.

[18]Comprehensive genomic characterization defines human glioblastoma genes and core pathways[J].Nature,2008,455(7216):1061-1068.

[19]Reimers M.Making informed choices about microarray data analysis[J]. PLoS Computational Biology,2010,6(5):e1000786.

[20]Benjamini Y,Hochberg Y.Controlling the false discovery rate:a practical and powerful approach to multiple testing[J].Journal of the Royal Statistical Society. Series B(Methodological),1995,57(1):289-300.

[21]Zhang Min,Yao Chen, Guo Zheng,et al.Apparently low reproducibility of true differential expression discoveries in microarray studies[J].Bioinformatics,2008,24(18):2057-2063.

[22]Rocke DM, Ideker T, Troyanskaya O, et al. Papers on normalization,variable selection,classification or clustering of microarray data[J].Bioinformatics,2009,25(6):701.

[23]Ivanova AV,Ivanov SV,Prudkin L,et al.Mechanisms of FUS1/TUSC2 deficiency in mesothelioma and its tumorigenic transcriptional effects[J].Mol Cancer,2009,8:91.

[24]Guervos MA,Marcos CA,Hermsen M,et al.Deletions of N33,STK11 and TP53 are involved in the development of lymph node metastasis in larynx and pharynx carcinomas[J].Cell Oncol,2007,29(4):327-334.

[25]Kawakami K, Hirata H, Yamamura S, et al. Functional significance of Wnt inhibitory factor-1 gene in kidney cancer[J].Cancer Res,2009,69(22):8603-8610.

[26]Urakami S,Shiina H,Enokida H,et al.Wnt antagonist family genes as biomarkers for diagnosis,staging,and prognosis of renal cell carcinoma using tumor and serum DNA[J].Clin Cancer Res,2006,12(23):6989-6997.

[27]Carvajal-Rodriguez A,de Una-Alvarez J,Rolan-Alvarez E.A new multitest correction(SGoF)that increases its statistical power when increasing the number of tests[J]. BMC Bioinformatics,2009,10:209.

[28]Laird PW.Principles and challenges of genome-wide DNA methylation analysis[J].Nat Rev Genet,2010,11(3):191-203.

[29]Deng Dajun,Liu Zhaojun,Du Yantao.Epigenetic alterations as cancer diagnostic,prognostic,and predictive biomarkers[J].Adv Genet,2010,71:125-176.

[30]Zhang Min, Zhang Lin, Zou Jinfeng, et al. Evaluating reproducibility of differential expression discoveries in microarray studies by considering correlated molecular changes[J].Bioinformatics,2009,25(13):1662-1668.

[31]Ein-Dor L,Zuk O,Domany E.Thousands of samples are needed to generate a robust gene list for predicting outcome in cancer[J].Proc Natl Acad Sci U S A,2006,103(15):5923-5928.

猜你喜歡
原始數(shù)據(jù)位數(shù)甲基化
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
五次完全冪的少位數(shù)三進(jìn)制展開
連續(xù)自然數(shù)及其乘積的位數(shù)分析
受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
全新Mentor DRS360 平臺(tái)借助集中式原始數(shù)據(jù)融合及直接實(shí)時(shí)傳感技術(shù)實(shí)現(xiàn)5 級(jí)自動(dòng)駕駛
肝癌組織hSulf-1基因表達(dá)與其甲基化狀態(tài)的關(guān)系
應(yīng)用磁珠法檢測并提取尿液游離甲基化DNA
SOX30基因在結(jié)直腸癌中的表達(dá)與甲基化分析
遙感衛(wèi)星CCD相機(jī)量化位數(shù)的選擇
全甲基化沒食子兒茶素沒食子酸酯的制備
富民县| 兰州市| 德化县| 华容县| 湘阴县| 鸡泽县| 潜江市| 鄂尔多斯市| 凉山| 邓州市| 东丽区| 桐乡市| 涟源市| 前郭尔| 吉林省| 南岸区| 新乐市| 永新县| 新沂市| 富裕县| 宁乡县| 永城市| 二连浩特市| 洪洞县| 清水县| 濮阳县| 四平市| 丹东市| 峨眉山市| 广东省| 运城市| 南部县| 罗源县| 南宁市| 武强县| 泰来县| 恩施市| 晴隆县| 五指山市| 合山市| 独山县|