馮偉,宗煒,鞠少卿
(南通大學(xué)附屬醫(yī)院醫(yī)學(xué)檢驗(yàn)科,江蘇南通 226001)
胃癌(gastric cancer, GC)是起源于胃粘膜上皮的惡性腫瘤,死亡率位于全球惡性腫瘤的第三位[1]。GC的發(fā)生、發(fā)展是一個(gè)多階段、多因素的病理過程[2]。臨床診斷主要依靠影像學(xué)檢查、病理活檢以及血清標(biāo)志物檢測,但早期胃癌診斷的陽性率較低,易造成漏診、誤診。近年來研究表明,包括GC在內(nèi)的許多腫瘤組織中存在大量的非編碼RNA,其中關(guān)于LncRNA、miRNA和mRNA研究最為豐富[3]。ceRNA假說最早是由Salmena等[4]提出,其認(rèn)為任何含有miRNA反應(yīng)元件(miRNA response elements,MREs)的基因都可以通過MRES與miRNA結(jié)合,從而影響其轉(zhuǎn)錄表達(dá)。LncRNAs廣泛分布于真核細(xì)胞中,具有多種MREs,能夠競爭性結(jié)合miRNAs。因此,深入挖掘胃癌中“LncRNA-miRNA-mRNA”的ceRNA調(diào)控網(wǎng)絡(luò),為胃癌診治提供新的依據(jù)和靶點(diǎn),具有巨大的臨床應(yīng)用價(jià)值和廣泛的前景。
本研究擬聯(lián)合TCGA和GEO數(shù)據(jù)庫進(jìn)行基因篩選,挖掘胃癌中差異表達(dá)的LncRNAs、miRNAs以及mRNAs,構(gòu)建ceRNA調(diào)控網(wǎng)絡(luò);利用DAVID數(shù)據(jù)庫對(duì)ceRNA調(diào)控網(wǎng)絡(luò)中的差異mRNAs進(jìn)行GO分析以及KEGG分析,探究差異基因在胃癌發(fā)生、發(fā)展中的潛在調(diào)節(jié)機(jī)制;利用熒光定量PCR對(duì)部分差異基因進(jìn)行臨床標(biāo)本驗(yàn)證。
1.1數(shù)據(jù)下載 利用TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)下載人類胃癌的RNA-Seq和miRNA-Seq的Count數(shù)據(jù),其中包含343例胃癌組織樣本和30例胃正常組織樣本;利用GEO數(shù)據(jù)庫(https://www.ncbi.nih.gov/geo/)下載GSE93415數(shù)據(jù)集的miRNA芯片數(shù)據(jù),其中包含20對(duì)胃癌組織樣本和癌旁組織樣本。
1.2差異基因篩選 利用edgeR函數(shù)包對(duì)TCGA數(shù)據(jù)整理分析,篩選并確定差異表達(dá)的LncRNAs、mRNAs和miRNAs;利用limma函數(shù)包對(duì)GEO數(shù)據(jù)整理分析,篩選并確定差異表達(dá)的miRNAs。差異基因篩選條件:(1)對(duì)LncRNAs和mRNAs差異表達(dá)倍數(shù)取對(duì)數(shù):|logFC|>2,P<0.05;(2)對(duì)miRNAs差異表達(dá)倍數(shù)取對(duì)數(shù):|logFC|>1,P<0.05。錯(cuò)誤發(fā)現(xiàn)率(FDR)用于校正所有P值的統(tǒng)計(jì)學(xué)意義;鑒于GEO數(shù)據(jù)庫胃癌組織樣本量偏少,|logFC|>2,P<0.05的DEmiRNAs數(shù)量較少,篩選|logFC|>1,P<0.05的DEmiRNAs進(jìn)行后續(xù)研究。
1.3ceRNA網(wǎng)絡(luò)構(gòu)建 基于ceRNA理論,利用miRcode數(shù)據(jù)庫預(yù)測與miRNAs存在調(diào)控關(guān)系的LncRNAs;利用starBase數(shù)據(jù)庫預(yù)測與miRNAs存在調(diào)控關(guān)系的mRNAs;將預(yù)測結(jié)果分別與數(shù)據(jù)庫篩選出的差異表達(dá)的LncRNAs和mRNAs取交集,將TCGA數(shù)據(jù)庫與GEO數(shù)據(jù)庫中差異表達(dá)的miRNAs取交集;利用Cytoscape軟件將差異表達(dá)的LncRNAs、miRNAs和mRNAs三者的調(diào)控網(wǎng)絡(luò)可視化。
1.4富集分析 利用DAVID數(shù)據(jù)庫對(duì)25個(gè)mRNAs進(jìn)行功能富集分析和通路富集分析,根據(jù)篩選條件(P<0.05)對(duì)分析結(jié)果進(jìn)行匯總,結(jié)果以氣泡圖呈現(xiàn)。
1.5表達(dá)量驗(yàn)證 利用血清RNA提取試劑盒(北京百泰克生物技術(shù)公司)提取總RNA,使用逆轉(zhuǎn)錄試劑盒(美國Thermo Fisher Scientific公司)和特異引物合成互補(bǔ)DNA(cDNA)。采用LightCycler 480實(shí)時(shí)熒光定量儀(Roche公司)檢測DELncRNAs的相對(duì)表達(dá)量,LncRNAs引物序列見表1。選擇18S內(nèi)參對(duì)LncRNAs的表達(dá)量進(jìn)行標(biāo)準(zhǔn)化,采用2-ΔΔCt法計(jì)算相對(duì)表達(dá)量。
表1 LncRNAs引物序列
2.1差異基因篩選 根據(jù)設(shè)定的篩選條件,分別從TCGA數(shù)據(jù)庫中獲得高表達(dá)的LncRNAs 895個(gè),低表達(dá)的LncRNAs 207個(gè),高表達(dá)的mRNAs 937個(gè),低表達(dá)的mRNAs 740個(gè), 高表達(dá)的miRNAs 180個(gè),低表達(dá)的miRNAs 60個(gè);從GEO數(shù)據(jù)庫中獲得高表達(dá)的miRNAs 49個(gè),低表達(dá)的miRNAs 23個(gè)。對(duì)TCGA數(shù)據(jù)庫和GEO數(shù)據(jù)篩選的差異miRNAs取交集,得到18個(gè)共同的miRNAs,其中上調(diào)的miRNAs 12個(gè),下調(diào)的miRNAs 6個(gè)。
2.2ceRNA網(wǎng)絡(luò)構(gòu)建 將miRcode數(shù)據(jù)庫、TCGA數(shù)據(jù)庫和GEO數(shù)據(jù)庫三者聯(lián)合篩選差異LncRNAs,得到52個(gè)LncRNAs。利用starBase數(shù)據(jù)庫和TCGA數(shù)據(jù)庫篩選差異mRNAs,得到25個(gè)mRNAs。最終,將52個(gè)LncRNAs、18個(gè)miRNAs以及25個(gè)mRNAs進(jìn)行ceRNA網(wǎng)絡(luò)的構(gòu)建(圖1),ceRNA調(diào)控網(wǎng)絡(luò)見表2。
注:菱形、圓形和矩形分別表示LncRNAs、mRNAs和miRNAs;紅色表示高表達(dá),藍(lán)色表示低表達(dá)。
表2 ceRNA調(diào)控網(wǎng)絡(luò)
2.3基因功能和通路富集分析 利用DAVID數(shù)據(jù)庫進(jìn)行GO分析,結(jié)果發(fā)現(xiàn)存在6個(gè)生物學(xué)過程,包括受體配體激活、信號(hào)受體激活、絲氨酸型肽酶激活、絲氨酸水解酶激活、化學(xué)排斥物激活以及跨膜受體蛋白絡(luò)氨酸激酶激活等(P<0.05,圖2A);KEEG通路分析結(jié)果涉及癌癥中的轉(zhuǎn)錄調(diào)節(jié)失調(diào)、癌癥中的miRNAs(P<0.05,圖2B)。
注:A,DEmRNAs的GO分析氣泡圖;B,DEmRNAs的KEGG分析氣泡圖。
2.4血清驗(yàn)證差異LncRNAs 利用熒光定量PCR檢測胃癌患者血清中差異LncRNAs的相對(duì)表達(dá)水平,結(jié)果顯示,Linc00052、Linc00365和Linc00330在胃癌患者和健康人血清樣本中存在明顯差異(P<0.05),但Linc00184在胃癌患者和健康人血清樣本中的差異無統(tǒng)計(jì)學(xué)意義(圖3)。
圖3 胃癌患者血清中DELncRNAs的表達(dá)水平
胃癌的發(fā)生、發(fā)展是一個(gè)多基因參與的、多水平調(diào)控的復(fù)雜過程。絕大多數(shù)胃癌患者早期無明顯癥狀,易與胃炎、胃潰瘍等胃良性疾病混淆。胃癌診斷主要依靠影像學(xué)檢查以及實(shí)驗(yàn)室檢測,但傳統(tǒng)實(shí)驗(yàn)室檢查不能滿足臨床需求[5]。近年來,國內(nèi)外研究表明,異常表達(dá)的ncRNAs不僅可以作為疾病的早期篩查指標(biāo),還能作為患者預(yù)后監(jiān)測及治療的靶點(diǎn),為癌癥患者帶來了新的希望[6-7]。
本研究通過對(duì)現(xiàn)有胃癌樣本基因表達(dá)譜進(jìn)行篩選,結(jié)合樣本的臨床病理數(shù)據(jù),分析各基因差異表達(dá)水平以及患者生存預(yù)后,根據(jù)“高表達(dá)LncRNA-低表達(dá)miRNA-高表達(dá)mRNA”和“低表達(dá)LncRNA-高表達(dá)miRNA-低表達(dá)mRNA”這兩種調(diào)控軸構(gòu)建ceRNA網(wǎng)絡(luò),筆者篩選出潛在的ceRNA調(diào)控網(wǎng)絡(luò),并發(fā)現(xiàn)部分ceRNA調(diào)控網(wǎng)絡(luò)已有相關(guān)研究發(fā)表。Teng 等[8]研究發(fā)現(xiàn),LncRNA NKX2-1-AS1能夠競爭性結(jié)合miR-145-5p,從而促進(jìn)SERPINE1的表達(dá),激活VEGFR-2信號(hào)通路,促進(jìn)胃癌的惡性進(jìn)展。Piao等[9]研究發(fā)現(xiàn),Linc00184同樣能夠競爭性結(jié)合miR-145,促進(jìn)ANGPT2表達(dá),促進(jìn)胃癌細(xì)胞的生長和上皮-間質(zhì)轉(zhuǎn)化(EMT)。Yan等[10]研究發(fā)現(xiàn),Linc00365在胃癌中的表達(dá)降低,而低表達(dá)的Linc00365能夠抑制胃癌細(xì)胞增殖,其進(jìn)一步通過機(jī)制研究發(fā)現(xiàn),Linc00365能夠抑制NF-κB信號(hào)通路,從而抑制胃癌的惡性進(jìn)展。以上研究均表明,生物信息學(xué)預(yù)測能夠?qū)Π┌Y的基礎(chǔ)研究有所啟發(fā),同時(shí)還能為癌癥新的診治靶點(diǎn)和思路提供理論支撐,使得后續(xù)的基礎(chǔ)驗(yàn)證和臨床研究更具有針對(duì)性,能夠避免盲目的實(shí)驗(yàn)探究并減少科研資源的浪費(fèi)。
雖然生物信息學(xué)對(duì)科學(xué)研究有很大的幫助,但其仍有一定的局限性,例如,芯片分析結(jié)果的質(zhì)量存在一定差異,以及易與實(shí)際實(shí)驗(yàn)驗(yàn)證存在一定誤差等。因此,生物信息學(xué)分析的結(jié)果最終需要大量的臨床及基礎(chǔ)實(shí)驗(yàn)進(jìn)行驗(yàn)證。筆者針對(duì)部分差異表達(dá)的LncRNAs設(shè)計(jì)了特異的引物(表2),并利用熒光定量PCR在胃癌患者血清樣本中進(jìn)行驗(yàn)證,結(jié)果顯示,Linc00052、Linc00330、Linc00365在胃癌患者血清樣本中的表達(dá)水平與芯片結(jié)果一致,但Linc00184的表達(dá)水平差異無統(tǒng)計(jì)學(xué)意義,且表達(dá)水平與芯片結(jié)果并不一致,可能由于樣本量較少的原因,也可能由于芯片結(jié)果主要來源于胃癌組織,其表達(dá)水平可能與血清樣本存在一定的差異。后期,我們將針對(duì)構(gòu)建的ceRNA調(diào)控網(wǎng)絡(luò)進(jìn)行基礎(chǔ)實(shí)驗(yàn)驗(yàn)證,特別是針對(duì)目前在胃癌中暫無相關(guān)研究的Linc00330,進(jìn)一步擴(kuò)大樣本量和樣本類型,收集胃良性病變的血清和組織樣本,同時(shí)在不同胃癌細(xì)胞系進(jìn)行體內(nèi)外功能驗(yàn)證,或許能夠?yàn)槲赴┑脑\斷和治療提供新的依據(jù)。