張?jiān)旅?, 羅雅琴 , 鄭偉 , 徐杰 , 董雪燕 , 李善琛 , 王敬毅
1.山東中醫(yī)藥大學(xué),濟(jì)南 250000;
2.山東中醫(yī)藥大學(xué)附屬醫(yī)院,濟(jì)南 250000
急性髓系白血?。╝cute myelogenous leukemia,AML)是骨髓造血干/祖細(xì)胞的惡性克隆性疾病,其特征為髓系祖細(xì)胞快速大量增殖并逐漸取代骨髓正常造血細(xì)胞。其臨床主要表現(xiàn)為貧血、出血、發(fā)熱和感染,該病多具有病情急重、難以控制、容易復(fù)發(fā)、預(yù)后兇險(xiǎn)等臨床特點(diǎn),對(duì)人類的生命健康造成了嚴(yán)重的威脅。已有研究認(rèn)為,染色體數(shù)量或者結(jié)構(gòu)異常、基因突變或表達(dá)水平的異常導(dǎo)致細(xì)胞過(guò)度增殖、分化受阻以及凋亡受抑制是AML發(fā)病的主要機(jī)制。而這些過(guò)程中,細(xì)胞信號(hào)傳導(dǎo)通路以及細(xì)胞周期調(diào)控異常是白血病發(fā)生過(guò)程中的關(guān)鍵事件。當(dāng)前AML的治療手段包括化療、造血干細(xì)胞移植和生物治療,這些治療手段使AML的治愈率能夠達(dá)到50%[1],但是AML發(fā)展迅速,發(fā)病原因及機(jī)制較為復(fù)雜,其高度異質(zhì)性導(dǎo)致AML化療后易復(fù)發(fā)[2]。因此,深入研究AML的發(fā)生發(fā)展機(jī)制,探究新的分子標(biāo)志物對(duì)于提高藥物的治療效果以及改善AML患者的預(yù)后具有重要意義。有研究表明,長(zhǎng)鏈非編碼RNA(long non-coding RNA,lncRNA)對(duì)微小RNA(microRNA,miRNA)具有海綿吸附作用,可以作為內(nèi)源RNA(competitive endogenous RNA,ceRNA)與miRNA競(jìng)爭(zhēng)性結(jié)合,從而影響miRNA與mRNA的結(jié)合,調(diào)控腫瘤的發(fā)生、發(fā)展和轉(zhuǎn)移[3]。但是,許多l(xiāng)ncRNAs在AML發(fā)生發(fā)展中的生物學(xué)作用及臨床意義還有待進(jìn)一步研究。為此,本研究通過(guò)生物信息學(xué)的方法分析AML相關(guān)的差異表達(dá)基因,并構(gòu)建lncRNA-miRNA-mRNA的競(jìng)爭(zhēng)性內(nèi)源RNA調(diào)控網(wǎng)絡(luò),分析差異表達(dá)基因的生物學(xué)功能及AML發(fā)病的潛在機(jī)制,旨在為發(fā)現(xiàn)AML發(fā)病新的潛在機(jī)制及治療靶點(diǎn)提供理論依據(jù)。
GEO數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)是一個(gè)國(guó)際公共數(shù)據(jù)庫(kù),收錄了來(lái)自世界各國(guó)研究機(jī)構(gòu)提交的高通量基因表達(dá)數(shù)據(jù)[4]。在GEO數(shù)據(jù)庫(kù)中分別檢索AML相關(guān)的mRNA、miRNA、lncRNA芯片,獲得編號(hào)為GSE142698、GSE142699、GSE96535的芯片原始數(shù)據(jù)。GSE142698芯片數(shù)據(jù)48例樣本中包含AML患者24例,正常對(duì)照組24例;GSE142699芯片數(shù)據(jù)48例樣本中包含AML患者24例,正常對(duì)照組24例;GSE96535芯片數(shù)據(jù)18例樣本中包含AML患者6例,急性淋巴細(xì)胞白血病(acute lymphoblastic leukemia, ALL)患者6例,正常對(duì)照組6例。
1.2.1差異表達(dá)基因的篩選 應(yīng)用GEO數(shù)據(jù)庫(kù)中GEO2R功能分析上述數(shù)據(jù)的差異基因(differential genes,DEGs),利用Excel表格篩選出|log2foldchange(log2FC)|>1且P<0.05的差異RNA,然后使用VLOOKUP函數(shù)將各個(gè)探針名轉(zhuǎn)化為基因名,應(yīng)用SangerBox繪制火山圖對(duì)RNA的分布情況進(jìn)行直觀展示,將差異表達(dá)倍數(shù)絕對(duì)值前30的RNA繪制熱圖進(jìn)行展示。
1.2.2基因功能注釋 在線生物信息學(xué)分析工具DAVID[5](https://david.ncifcrf.gov/)收集了大量的基因生物功能和信號(hào)傳導(dǎo)通路研究信息,能夠富集分析大規(guī)模的基因,并注釋其生物學(xué)功能和信號(hào)通路途徑。為進(jìn)一步研究AML的發(fā)病機(jī)制,以P<0.05為標(biāo)準(zhǔn)利用DAVID對(duì)初步篩選的差異mRNA進(jìn)行基因本體(GO)分析,以評(píng)估生物過(guò)程(biological process,BP)、細(xì)胞成分(cellular constituent,CC)和分子功能(molecule function,MF)注釋的富集程度,京都基因和基因組百科全書(shū)(Kyoto Encyclopedia of Genes and Genomes,KEGG)分析用于注釋與這些差異mRNA相關(guān)的信號(hào)通路,利用Sanger軟件繪制氣泡圖進(jìn)行富集結(jié)果的直觀展示。
1.2.3蛋白質(zhì)相互作用網(wǎng)絡(luò)的構(gòu)建與分析 將所得29個(gè)DEGs導(dǎo)入STRING在線軟件中,得出PPI關(guān)系,并以TSV格式導(dǎo)出,再將得到的源文件導(dǎo)入Cytoscape軟件,以相關(guān)參數(shù)自由度(degree centrality,DC),介數(shù)(betweenness centrality,BC)為條件進(jìn)行關(guān)鍵基因(Hub基因)的篩選。
1.2.4預(yù)測(cè)與差異表達(dá)miRNAs相關(guān)聯(lián)的mRNAs和lncRNAs 在miRWalk數(shù)據(jù)庫(kù)中預(yù)測(cè)與差異表達(dá)miRNAs相關(guān)聯(lián)的mRNAs。利用Spongescan數(shù)據(jù)庫(kù)預(yù)測(cè)與AML相關(guān)miRNAs調(diào)控的lncRNAs。
1.2.5ceRNA調(diào)控網(wǎng)絡(luò)的構(gòu)建 為了進(jìn)一步提高生物信息分析的可靠性,我們將預(yù)測(cè)得到的mRNAs和lncRNAs與用GEO2R分析得到的差異RNA取交集,并將重疊的RNA作為進(jìn)一步分析的差異表達(dá)mRNAs(DEmRNAs)和差異表達(dá)lncRNAs(DElncRNAs)。隨后建立了匹配的DElncRNADEmiRNA對(duì)和DEmiRNA-DEmRNA對(duì)。根據(jù)ceRNA理論構(gòu)建lncRNA-miRNA-mRNA網(wǎng)絡(luò),對(duì)于給定的共表達(dá)lncRNA-mRNA對(duì),篩選其中與某一共同miRNA負(fù)性共表達(dá)的lncRNA-mRNA對(duì),確定該lncRNA-miRNA-mRNA為共表達(dá)競(jìng)爭(zhēng)的三聯(lián)體。將上述所有共表達(dá)競(jìng)爭(zhēng)的三聯(lián)體構(gòu)建成lncRNA-miRNA-mRNA網(wǎng)絡(luò),并使用Cytoscape軟件進(jìn)行可視化。本研究的分析流程如圖1所示。
圖1 本研究流程圖Fig. 1 Flow chart of this study
利用GEO2R(∣log2FC∣>1,P<0.05)分析差異表達(dá)的mRNAs、miRNAs及l(fā)ncRNAs,在公共數(shù)據(jù)集GSE142698中共篩選得到29個(gè)顯著差異的mRNAs,其中18個(gè)基因表達(dá)上調(diào)、11個(gè)基因表達(dá)下調(diào);在公共數(shù)據(jù)集GSE142699中篩選得到70個(gè)差異顯著的miRNAs,與健康對(duì)照組相比,AML樣本中有31個(gè)miRNA過(guò)表達(dá)、39個(gè)miRNA表達(dá)下調(diào);在公共數(shù)據(jù)集GSE96535中得到20 005個(gè)差異顯著的lncRNAs,包括10 248個(gè)上調(diào)lncRNA和9 757個(gè)下調(diào)lncRNA。所有mRNAs、miRNAs及l(fā)ncRNAs分布情況的火山圖如圖2所示,差異表達(dá)倍數(shù)絕對(duì)值前30的RNA熱圖如圖3所示。
圖2 mRNAs、miRNAs及l(fā)ncRNAs分布情況的火山圖Fig. 2 Volcano map of distribution of mRNAs, miRNA and lncRNAs
圖3 差異表達(dá)倍數(shù)絕對(duì)值前30的RNA熱圖Fig. 3 Heat map of Top30 absolute value differential expression multiple
DEmRNA被分為3個(gè)功能組,在生物過(guò)程組中,DEmRNA主要富集于細(xì)胞增殖負(fù)調(diào)控、蛋白磷酸化、細(xì)胞分裂、周期蛋白依賴的絲氨酸/蘇氨酸激酶活性的調(diào)節(jié);在細(xì)胞組分組中,DEmRNA主要富集于細(xì)胞核、核質(zhì)和細(xì)胞質(zhì)中;在分子功能組中,DEmRNA主要富集于蛋白結(jié)合功能、ATP結(jié)合功能和激酶活性功能。KEGG分析顯示其潛在的生物學(xué)功能,共獲得了23條顯著富集的通路。功能注釋用SangerBox繪制氣泡圖進(jìn)行結(jié)果可視化處理如圖4所示,DEmRNAs顯著富集于細(xì)胞衰老、PI3K-Akt信號(hào)通路、癌癥通路、T細(xì)胞受體信號(hào)通路等。
圖4 DEmRNA基因功能注釋氣泡圖Fig. 4 Bubble diagram of DEmRNA gene function annotation
利用String在線工具對(duì)差異表達(dá)基因構(gòu)建PPI網(wǎng)絡(luò),使用Cytoscape檢測(cè)PPI中DEGs之間的潛在相關(guān)性(圖5),其中藍(lán)色為下調(diào)基因,紅色為上調(diào)基因;以相關(guān)參數(shù)自由度(DC)、介數(shù)(BC)為條件篩選出5個(gè)核心基因(圖6),分別為MYB、GATA2、CDK4、PKMYT1、CCNB1,均為上調(diào)基因。
圖5 蛋白互作網(wǎng)絡(luò)圖Fig. 5 PPI net work
圖6 PPI互作網(wǎng)絡(luò)篩選出的核心基因Fig. 6 Hub gene screened from PPI net work
miRWalk是一個(gè)綜合型的miRNA靶基因數(shù)據(jù)。利用miRWalk數(shù)據(jù)庫(kù)預(yù)測(cè)與差異表達(dá)miRNAs相關(guān)聯(lián)的mRNAs,得到15 804個(gè)預(yù)測(cè)的mRNAs,與用GEO2R分析的差異mRNAs取交集,最后得到25個(gè)mRNAs。利用Spongescan數(shù)據(jù)庫(kù)預(yù)測(cè)與AML相關(guān)miRNAs調(diào)控的lncRNAs共71個(gè),與通過(guò)基因芯片分析得出的差異lncRNAs取交集得到6個(gè)lncRNAs。使用Cytoscape(v3.7.1)構(gòu)建了包含25個(gè)mRNA、21個(gè)miRNA和6個(gè)lncRNA的lncRNA-miRNA-mRNA調(diào)控關(guān)系網(wǎng)絡(luò),如圖7所示。
圖7 競(jìng)爭(zhēng)性內(nèi)源RNA網(wǎng)絡(luò)圖Fig. 7 Competitive endogenous RNA networks
急性髓系白血病是一種由髓系造血祖細(xì)胞異常增殖和分化引起的高度異質(zhì)性的惡性克隆性疾病。治療AML的方法主要有化療、靶向治療和造血干細(xì)胞移植等。目前大部分AML患者尤其是青年患者的首選治療方法仍然是化療,對(duì)于中高?;颊邅?lái)說(shuō),不進(jìn)行移植的治療復(fù)發(fā)率高達(dá)60%~70%,而且化療會(huì)帶來(lái)嚴(yán)重的毒副作用[6]。
在當(dāng)前的生物醫(yī)學(xué)領(lǐng)域研究中,數(shù)據(jù)分析技術(shù)在生物學(xué)信號(hào)通路的研究、代謝機(jī)制和人類疾病的診斷、治療、預(yù)后判斷中發(fā)揮著重要的作用[7]。ceRNA調(diào)控網(wǎng)絡(luò)理論指出,各種RNA共享共同的miRNA 應(yīng)答元件(microRNA response element,MRE),這使它們能夠競(jìng)爭(zhēng)性地結(jié)合miRNA實(shí)現(xiàn)相互調(diào)控。ceRNA網(wǎng)絡(luò)已被證明在基因表達(dá)的轉(zhuǎn)錄后調(diào)控中普遍存在,其在多種疾病特別是腫瘤中的作用已引起廣泛關(guān)注。為了更好地了解AML的異?;虮磉_(dá)調(diào)控機(jī)制,本研究分析了多個(gè)數(shù)據(jù)庫(kù),獲得了AML中異常表達(dá)的內(nèi)源性RNA,建立了ceRNA調(diào)控網(wǎng)絡(luò)。
本研究篩選出MYB、GATA2、CDK4、PKMYT1、CCNB1 5個(gè)核心基因,差異基因顯著富集于細(xì)胞增殖的負(fù)調(diào)控、蛋白磷酸化、細(xì)胞分裂、周期蛋白依賴的絲氨酸/蘇氨酸激酶活性的調(diào)節(jié)功能,在細(xì)胞組分組中,差異基因主要富集于細(xì)胞核、核質(zhì)和細(xì)胞質(zhì)中。在分子功能組中,差異基因主要富集于蛋白結(jié)合、ATP結(jié)合和激酶活性。KEGG分析顯示,差異基因顯著富集于細(xì)胞衰老、PI3K-Akt信號(hào)通路、癌癥通路、T細(xì)胞受體信號(hào)通路等。本研究構(gòu)建了包含25個(gè)mRNA、21個(gè)miRNA和6個(gè)lncRNA的CeRNA網(wǎng)絡(luò)。
MYB是一種廣泛存在于真核生物、進(jìn)化上高度保守的原癌基因。有臨床研究表明,MYB可以作為一種轉(zhuǎn)錄因子,直接調(diào)控多種與腫瘤轉(zhuǎn)移有關(guān)的基因,從而影響癌細(xì)胞的侵襲、增殖過(guò)程,并參與AML的發(fā)生、發(fā)展、轉(zhuǎn)移過(guò)程[8]。GATA2編碼一種造血轉(zhuǎn)錄因子,且在多種造血細(xì)胞的發(fā)育中起重要作用,是AML的易感基因[9]。程凱等[10]研究發(fā)現(xiàn),在K562細(xì)胞中敲降GATA2后,MYB表達(dá)同時(shí)下降,證明了GATA2對(duì)MYB有調(diào)控作用并且在血細(xì)胞中起重要作用。CCNB1即G2/有絲分裂特異性細(xì)胞周期蛋白B1,主要在G2/M期表達(dá),是有絲分裂中的一種監(jiān)測(cè)蛋白,對(duì)于控制G2/M(有絲分裂)過(guò)渡的細(xì)胞周期至關(guān)重要[11]。有研究證實(shí),CCNB1在許多預(yù)后較差的癌癥如卵巢癌、口腔鱗狀細(xì)胞癌以及非小細(xì)胞肺癌中過(guò)表達(dá)[12-14]。PKMYT1是Wee家族的一種蛋白激酶,其通過(guò)磷酸化Tyr14/Tyr15和磷酸化CDK1-cyclinB復(fù)合物而失活CDK1-cyclinB復(fù)合物,是細(xì)胞周期的負(fù)調(diào)控因子。先前的研究表明,上調(diào)的PKMYT1在肝癌、結(jié)腸癌、膠質(zhì)母細(xì)胞瘤等惡性腫瘤的進(jìn)展中發(fā)揮重要作用[15-18]。
通過(guò)CeRNA網(wǎng)絡(luò)的構(gòu)建,我們推測(cè)lncRNA MUC19通過(guò)競(jìng)爭(zhēng)性結(jié)合miRNA hsa-miR-125a-5p、hsa-miR-145a-5p而減少GATA2和CDK6與miRNA的結(jié)合從而上調(diào)GATA2和CDK6的表達(dá)水平;lncRNA DYNCC2-DT通過(guò)競(jìng)爭(zhēng)性結(jié)合miRNA hasmiR-185-5p而減少I(mǎi)L3RA與miRNA的結(jié)合從而上調(diào)IL3RA的水平。GATA2是重要的正常造血調(diào)節(jié)因子,主要在早期造血干/祖細(xì)胞中表達(dá)。髓樣分化過(guò)程中,GATA2表達(dá)下調(diào),而GATA2在白血病中的高表達(dá)則反映了造血干/祖細(xì)胞分化、發(fā)育阻滯,幼稚白血病細(xì)胞增多[19]。CDK4、CDK6屬于細(xì)胞周期蛋白依賴性激酶CDKs家族,如果CDKs表達(dá)異常,就會(huì)引起細(xì)胞周期紊亂,從而導(dǎo)致腫瘤的發(fā)生[20]。已有研究發(fā)現(xiàn),CDK6在膀胱癌、結(jié)腸癌和卵巢癌[21-23]等多種癌癥中高表達(dá)。IL3RA(CD123)是白細(xì)胞介素3(interleukin-3,IL-3)受體的α亞基,其調(diào)節(jié)造血細(xì)胞的增殖、存活和分化。IL3RA已經(jīng)被發(fā)現(xiàn)在多種類型的白血病中表達(dá),如AML、B-祖細(xì)胞急性淋巴細(xì)胞白血?。˙acute lymphoblastic leukemia, B-ALL)、T細(xì)胞白血?。═ cell acute lymphoblastic leukemia, T-ALL)和慢性淋巴細(xì)胞白血病(chronic lymphocytic leukemia, CLL)。有實(shí)驗(yàn)表明,使用中性抗IL3RA抗體和asIL3RA抗體偶聯(lián)毒素靶向IL3RA表達(dá)細(xì)胞,在AML模型中顯示出對(duì)生存的有益影響[24]。越來(lái)越多的證據(jù)表明,IL3RA在白血病干細(xì)胞中高表達(dá),而在正常造血干細(xì)胞中不表達(dá),并且在AML中與治療反應(yīng)、微小殘留病檢測(cè)和預(yù)后有關(guān)[25-27]。因此我們推測(cè)lncRNA MUC19、DYNCC2-DT可能以ceRNA的模式調(diào)控基因的表達(dá)從而影響了AML的進(jìn)展。
綜上所述,通過(guò)預(yù)測(cè)成功地構(gòu)建了AML中l(wèi)ncRNA相關(guān)的ceRNA調(diào)控網(wǎng)絡(luò),揭示了lncRNA可能通過(guò)miRNA間接調(diào)控差異表達(dá)的mRNA而參與AML的發(fā)病過(guò)程,為AML的作用機(jī)理研究提供了新的思路,同時(shí)為其治療提供了潛在的靶點(diǎn)。