林思敏,藍(lán)智賢,姚翔,王馨珂
消化系統(tǒng)腫瘤(Digestive system neoplasms, DSNs)是全世界癌癥相關(guān)死亡的主要原因。2018年因消化系統(tǒng)腫瘤死亡人數(shù)達(dá)到3,056,412例死亡,占總死亡人數(shù)的32%[1]。其中包括結(jié)直腸癌、胃癌、肝癌、食管癌和胰腺癌,均為常見的腫瘤。雖然近年來消化系統(tǒng)腫瘤診斷和治療的方法有所改善,但是預(yù)后仍然很差。因此,尋找有效的診斷、治療及預(yù)后預(yù)測(cè)靶點(diǎn)仍是目前的研究重點(diǎn)。
非編碼RNA(non-coding RNA, ncRNA)約占98%的基因轉(zhuǎn)錄產(chǎn)物,包括微小RNA(micro RNA, miRNA)和長(zhǎng)鏈非編碼RNA(long non-coding RNA, lncRNA),其中約有93%的轉(zhuǎn)錄本為lncRNA[2]。LncRNA是一類轉(zhuǎn)錄本長(zhǎng)度超過200 nt、不編碼蛋白的RNA,通常位于細(xì)胞核和細(xì)胞質(zhì)中。lncRNA與小分子RNA相比,序列更長(zhǎng)、空間結(jié)構(gòu)也較為復(fù)雜,參與表達(dá)調(diào)控的機(jī)制也更具有多樣性和復(fù)雜性。盡管目前只有一小部分lncRNA的功能有相關(guān)報(bào)道,但可以明確的是lncRNA可以通過多種途徑調(diào)控腫瘤的發(fā)生、發(fā)展過程[3]。
LncRNA SNHG6(small nucleolar RNA host gene 6, U87HG)屬于5’基因家族,編碼兩個(gè)非編碼RNA:由內(nèi)含子編碼的SNORD87[4]和外顯子編碼的SNHG6 RNA。人類SNHG6 RNA最長(zhǎng)的ORF起始于第二個(gè)AUG密碼子(第136位點(diǎn)),包括一個(gè)很弱的翻譯碼(GGUGUAUGA),包括其他起始密碼子為GUG,UUG,CUG和ACG的ORF,均不編碼任何可以生成蛋白質(zhì)的短肽。因此SNHG6 RNA不編碼任何蛋白質(zhì),是一個(gè)長(zhǎng)鏈非編碼RNA[5]。研究發(fā)現(xiàn)SNHG6在多種消化系統(tǒng)腫瘤中表達(dá)上調(diào),促進(jìn)腫瘤增殖、侵襲和轉(zhuǎn)移[6-14]。本文旨在通過StarBase數(shù)據(jù)庫(kù)分析lncRNA SNHG6在消化系統(tǒng)腫瘤中的表達(dá)及可能的下游調(diào)控機(jī)制,為消化系統(tǒng)腫瘤的治療及預(yù)后分析提供新的理論依據(jù)。
從StarBase數(shù)據(jù)庫(kù)(http://starbase.sysu.edu.cn)中的Pan-Cancer模塊分析中選擇“Gene Differential Expression”,以“SNHG6”為關(guān)鍵詞進(jìn)行檢索,得到SNHG6在食管癌、結(jié)腸癌、膽管癌、肝癌、胰腺癌、胃癌中的表達(dá)數(shù)據(jù)。
從StarBase數(shù)據(jù)庫(kù)RNA-RNA模塊分析中選擇“l(fā)ncRNA-RNA”,在Query Gene中以“SNHG6”關(guān)鍵詞進(jìn)行檢索,得到SNHG6可能直接結(jié)合的下游RNA數(shù)據(jù);同時(shí)在RBP-Target模塊分析中選擇“RBP-lncRNA”,在Target Gene中以“SNHG6”為關(guān)鍵詞進(jìn)行檢索,得到SNHG6可能結(jié)合的上游基因。
將兩種方法得到的相關(guān)靶基因去重,分別刪除無對(duì)應(yīng)名稱的基因片段后,得到274個(gè)SNHG6相關(guān)靶基因。利用生物學(xué)信息注釋數(shù)據(jù)庫(kù)DAVID(https://david.ncifcrf.gov)對(duì)所有靶基因進(jìn)行功能富集分析(GO, gene ontology)和通路富集分析(KEGG,KEGG pathway analysis),以此找出最顯著的可能作用機(jī)制。
通過功能富集分析發(fā)現(xiàn)SNHG6可能與EIF4A3基因相互作用。利用StarBase數(shù)據(jù)庫(kù)Pan-Cancer模塊分析中選擇“RNA-RNA CoExpression”分析SNHG6和EIF4A3基因在不同消化系統(tǒng)腫瘤中的相互關(guān)系。
通過StarBase數(shù)據(jù)庫(kù)分析EIF4A3在不同消化系統(tǒng)腫瘤中的表達(dá),同時(shí)利用Pan-Cancer分析模塊中“Gene Survival Analysis”分析EIF4A3在不同消化系統(tǒng)腫瘤中的預(yù)后。
StarBase數(shù)據(jù)Pan-Cancer模塊中,通過TCGA數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/)獲得各種腫瘤的表達(dá)數(shù)據(jù),每個(gè)基因的表達(dá)值由RNA-seq數(shù)據(jù)通過log2(FPKM+0.01)獲得。
StarBase數(shù)據(jù)庫(kù)中“Gene Differential Expression”分析表明6在除了胰腺癌以外的消化系統(tǒng)腫瘤中均為高表達(dá)(圖1)。
通過“l(fā)ncRNA-RNA”及“RBP-lncRNA”兩種分析,我們得到和SNHG6相關(guān)靶基因共274個(gè),GO TERM功能富集分析發(fā)現(xiàn)其中結(jié)合蛋白(Binding Protein)主要集中在mRNA的相關(guān)過程,包括剪切、轉(zhuǎn)運(yùn)或轉(zhuǎn)錄的調(diào)控(圖2);KEGG信號(hào)通路富集分析發(fā)現(xiàn)主要和剪切體、RNA轉(zhuǎn)運(yùn)、核糖體以及mRNA監(jiān)測(cè)相關(guān)通路有關(guān)(圖3)。說明SNHG6主要調(diào)控轉(zhuǎn)錄及轉(zhuǎn)錄前相關(guān)機(jī)制。同時(shí)我們發(fā)現(xiàn)EIF4A3基因在其多種KEGG信號(hào)通路中均有參與,因此我們對(duì)EIF4A3基因進(jìn)行進(jìn)一步的研究。
通過“RNA-RNA CoExpression”分析,我們發(fā)現(xiàn)在肝癌中SNHG6與EIF4A3明顯正相關(guān)(圖4,n=374,r=0.257,P<0.001),而在其他消化系統(tǒng)腫瘤中未見明顯相關(guān)性(P>0.05)。因此我們推測(cè)在肝癌中SNHG6通過與EIF4A3直接作用,調(diào)控相關(guān)下游通路。
通過“Gene Differential Expression”分析發(fā)現(xiàn)EIF4A3基因在肝癌中高表達(dá)(圖5),并且提示預(yù)后較差(圖6,P=0.0054)。
A:SNHG6在食管癌中高表達(dá);B:SNHG6在結(jié)腸癌中高表達(dá);C:SNHG6在胰腺癌中無明顯差異;D:SNHG6在肝癌中高表達(dá)
圖2 SNHG6靶基因功能富集分析
圖3 SNHG6靶基因KEGG通路富集分析
圖4 肝癌中SNHG6與EIF4A3基因正相關(guān)
消化系統(tǒng)腫瘤是一組最常見的惡性腫瘤,指在消化系統(tǒng)多個(gè)部位發(fā)展的腫瘤,包括胃、結(jié)直腸、肝臟及胰腺。近年來雖然分子生物學(xué)的進(jìn)步已經(jīng)很大程度上提高了消化系統(tǒng)腫瘤的診斷、治療以及預(yù)防,但是因?yàn)樗鼈兊膼盒猿潭雀?、轉(zhuǎn)移速度快,而導(dǎo)致較高的死亡率。因此,研發(fā)新的分子靶標(biāo)尤其是預(yù)后相關(guān)分子,對(duì)制定更有效的治療策略至關(guān)重要[15]。
圖5 EIF4A3基因在肝癌中高表達(dá)
圖6 EIF4A3基因在肝癌中提示較差預(yù)后(P=0.0054)
人類RNA可分為編碼RNA及無編碼蛋白能力的非編碼RNA,前者在人體龐大的RNA體系中僅占約1%,這意味著非編碼RNA占據(jù)主要部分[2]。非編碼RNA包括管家基因(housekeeping noncoding RNAs)及調(diào)控基因(regulatory noncoding RNAs)兩大類。管家基因有核糖體RNA(rRNAs)、轉(zhuǎn)錄RNA(tRNAs)、小核RNA(small nuclear RNAs)、核仁小RNA(small nucleolar RNAs, snoRNAs);調(diào)控基因則分為miRNA、小干擾RNA(siRNAs)、Piwi相關(guān)RNA(piRNAs)[16-17]。
其中長(zhǎng)鏈非編碼RNA是指RNA大小超過200個(gè)核苷酸且無蛋白編碼能力的RNA,曾一度被認(rèn)為是基因組轉(zhuǎn)綠的“噪音”,并不具有生物學(xué)功能。隨著對(duì)長(zhǎng)鏈非編碼RNA的深入研究,人們發(fā)現(xiàn)長(zhǎng)鏈非編碼RNA可以通過與其他RNA、蛋白質(zhì)、染色體等相互作用參與轉(zhuǎn)錄調(diào)控、轉(zhuǎn)錄后調(diào)控、表觀遺傳、剪接等調(diào)控腫瘤細(xì)胞增殖分化、遷移侵襲、EMT過程等。
小核仁RNA(snoRNA)是一類小的非編碼RNA分子,它們集中在核仁中并具有穩(wěn)定的代謝。作為真核細(xì)胞核仁中的小的非編碼RNA,snoRNA的長(zhǎng)度為60~300個(gè)核苷酸(nt)。它們的主要功能是參與細(xì)胞質(zhì)中rRNA和其他RNA的轉(zhuǎn)錄后修飾,例如假尿苷酸化和2’-O-甲基化。通過snoRNA加工后與核仁中的核糖體蛋白結(jié)合,然后通過進(jìn)一步復(fù)雜的成熟和轉(zhuǎn)運(yùn)過程離開細(xì)胞核,最終在細(xì)胞質(zhì)中形成成熟的功能性核糖體。核糖體作為蛋白質(zhì)合成的位點(diǎn),幾乎控制細(xì)胞中的所有蛋白質(zhì)合成。因此很明顯,snoRNA對(duì)細(xì)胞生長(zhǎng)甚至其他重要活動(dòng)極為重要。
大多數(shù)snoRNA由宿主基因編碼并從中加工前mRNA的內(nèi)含子。宿主基因內(nèi)含子snoRNA屬于編碼50個(gè)末端的一類基因寡嘧啶(50TOP)mRNA。50TOP mRNAs很大程度上編碼參與翻譯的技術(shù),如核糖體蛋白和反式累積數(shù)據(jù)[14]。研究表明50TOP基因,包括snoRNA宿主基因,在控制細(xì)胞存活和發(fā)揮作用中發(fā)揮作用細(xì)胞凋亡和編碼必需的蛋白質(zhì)或轉(zhuǎn)錄本核糖體生物發(fā)生或功能?;顒?dòng)過度的核糖體生物發(fā)生在癌癥中被廣泛觀察到;這種觀察已部分發(fā)生歸因于Pol I增加的rDNA轉(zhuǎn)錄。除了snoRNA參與癌癥發(fā)展外,有研究表明snoRNA宿主基因(SNHG)也可能導(dǎo)致腫瘤發(fā)生。
已知的SNHGs有20余種[18-22],如: SNHG1在可以通過內(nèi)源性競(jìng)爭(zhēng)相應(yīng)microRNA在食管癌、肝癌及鼻咽癌中促進(jìn)腫瘤進(jìn)展[19, 23-24];SNHG5在胃癌組織中被發(fā)現(xiàn)可與MTA2相互作用抑制MTA2從胞質(zhì)到胞核的過程,使得MTA2留滯于細(xì)胞質(zhì)中,從而干預(yù)核苷酸重構(gòu)及組蛋白H3去乙?;龠M(jìn)腫瘤細(xì)胞遷徙轉(zhuǎn)移;同時(shí)SNHG5過表達(dá)的腫瘤細(xì)胞中與侵襲相關(guān)的蛋白如P21、和E-鈣粘蛋白顯著升高,而MMP9、MMP1、EGRF表達(dá)顯著下降[18, 25];高表達(dá)的SNHG15在胃癌細(xì)胞中也可作為腫瘤細(xì)胞增殖與侵襲的分子標(biāo)志之一[26-27]。
已有研究發(fā)現(xiàn)SNHG6在多種消化系統(tǒng)腫瘤中高表達(dá),發(fā)揮了促癌基因的作用[6-14,28-29]。為了探討SNHG6在消化系統(tǒng)腫瘤中的可能作用機(jī)制,我們通過StarBase數(shù)據(jù)庫(kù)對(duì)SNHG6在消化系統(tǒng)腫瘤中的表達(dá)進(jìn)行分析,發(fā)現(xiàn)SNHG6在除了胰腺癌以外的消化系統(tǒng)腫瘤中均高表達(dá)。同時(shí)對(duì)其下游作用機(jī)制做了初步的探討,發(fā)現(xiàn)SNHG6可能的下游通路主要集中于mRNA的相關(guān)過程,包括剪切、轉(zhuǎn)運(yùn)或轉(zhuǎn)錄的調(diào)控。其中EIF4A3與其有密切關(guān)系。因此我們推測(cè)SNHG6可能通過與EIF4A3直接作用,調(diào)控相關(guān)下游通路。
EIF4A3編碼DEAD盒蛋白家族的成員。以保守基序Asp-Glu-Ala-Asp(DEAD)為特征的DEAD盒蛋白是推定的RNA解旋酶。它們涉及許多涉及RNA二級(jí)結(jié)構(gòu)改變的細(xì)胞過程,例如翻譯起始,核和線粒體剪接,以及核糖體和剪接體組裝?;谒鼈兊姆植寄J?,該家族的一些成員被認(rèn)為參與胚胎發(fā)生,精子發(fā)生和細(xì)胞生長(zhǎng)和分裂。由該基因編碼的蛋白質(zhì)是核基質(zhì)蛋白質(zhì)。其氨基酸序列與翻譯起始因子DEAD盒蛋白家族的另外兩個(gè)成員eIF4AI和eIF4AII的氨基酸序列高度相似[30]。
通過StarBase數(shù)據(jù)庫(kù),我們發(fā)現(xiàn)EIF4A3在肝癌中高表達(dá),并且與SNHG6表達(dá)呈正相關(guān)性,同時(shí)提示了較差預(yù)后。因此我們推測(cè)在肝癌中,SNHG6可能通過與EIF4A3結(jié)合,調(diào)控肝癌發(fā)生發(fā)展。這可能為肝癌的診斷及預(yù)后評(píng)估,提供一定的理論依據(jù)。
綜上所述,長(zhǎng)鏈非編碼RNA SNHG6在多種消化系統(tǒng)腫瘤中高表達(dá),發(fā)揮促癌基因的作用,可能通過與EIF4A3基因相互作用,促進(jìn)肝癌發(fā)生發(fā)展,提示不良預(yù)后。