王 濤,侯潤(rùn)博,潘 鑫
(錦州醫(yī)科大學(xué)醫(yī)療學(xué)院醫(yī)學(xué)系1,醫(yī)學(xué)技術(shù)系2,遼寧 錦州 121013)
Ⅰ型糖尿病作為一種慢性疾病主要是由胰島β細(xì)胞受損引起,胰腺或胰島移植可以徹底根治,但是由于供體缺乏以及免疫排斥大大限制該治療方案的臨床應(yīng)用[1,2],干細(xì)胞分化為胰島素分泌細(xì)胞(insulinproducing cells,IPCs)再行移植,有望成為Ⅰ型糖尿病治療的新策略[3,4]。miRNA 作為一類小的非編碼RNA,其長(zhǎng)度大約在22 個(gè)核苷酸左右,能夠與靶mRNA 3’端非翻譯區(qū)互補(bǔ),進(jìn)而降解或阻止該mRNA 翻譯出蛋白質(zhì),實(shí)現(xiàn)轉(zhuǎn)錄后水平的基因表達(dá)調(diào)控[5,6]。生物信息學(xué)通過(guò)整合多個(gè)學(xué)科領(lǐng)域信息和知識(shí),能夠整體層面揭示疾病或生物過(guò)程的復(fù)雜分子機(jī)制[7],而且其通過(guò)對(duì)已有實(shí)驗(yàn)數(shù)據(jù)的分析,能夠減少重復(fù)實(shí)驗(yàn)所帶來(lái)的資源浪費(fèi)。GEO 數(shù)據(jù)庫(kù)是生物信息學(xué)研究重要的中心資源之一,其存儲(chǔ)大量高通量數(shù)據(jù),但是大部分?jǐn)?shù)據(jù)并未被充分利用[8]。目前,運(yùn)用生物信息學(xué)分析干細(xì)胞向IPCs 誘導(dǎo)分化過(guò)程中miRNA-mRNA 的調(diào)控網(wǎng)絡(luò)報(bào)道較少見(jiàn)。因此,本研究運(yùn)用生物信息學(xué)方法分析干細(xì)胞向IPCs 誘導(dǎo)分化過(guò)程中的mRNA 表達(dá)譜,并構(gòu)建miRNAmRNA 調(diào)控網(wǎng)絡(luò)。
1.1 一般資料 通過(guò)NCBI 的GEO 數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)檢索人胚胎干細(xì)胞(human embryonic stem cells,hESCs)向IPCs 誘導(dǎo)分化過(guò)程中mRNA 表達(dá)譜的相關(guān)數(shù)據(jù),最終只有GSE42094 數(shù)據(jù)集符合要求,該數(shù)據(jù)集基于GPL10558 平臺(tái),包含23 個(gè)樣本數(shù)據(jù)(GSM1032319-41),涉及未分化hESCs(WA09)、IPCs 分化的5 個(gè)時(shí)期、胰腺內(nèi)胰島和胎胰。
1.2 數(shù)據(jù)處理與差異表達(dá)分析 選擇GSE42094 數(shù)據(jù)集內(nèi)的未分化hESCs 和IPCs 分化的5 個(gè)時(shí)期進(jìn)行研究,進(jìn)入“Analyze with GEO2R”項(xiàng)目,點(diǎn)擊“Define groups”設(shè)定分組,其中,hESCs 組包含3 個(gè)樣本,Diff1 組3 個(gè),Diff2 組3 個(gè),Diff3 組2 個(gè),Diff4 組2個(gè),IPCs 組3 個(gè),對(duì)6 組數(shù)據(jù)進(jìn)行差異表達(dá)分析,篩選標(biāo)準(zhǔn)設(shè)定為adj.P<0.05。
1.3 GO 功能和KEGG 路徑顯著性分析 為分析差異表達(dá)基因的潛在生物學(xué)功能,選用DAVID(https://david.ncifcrf.gov/tools.jsp)數(shù)據(jù)庫(kù)進(jìn)行功能富集分析,主要分析GO 功能以及KEGG 路徑2 個(gè)方面,以P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
1.4 蛋白互作網(wǎng)絡(luò)分析 為分析差異表達(dá)基因的相互作用及其調(diào)控網(wǎng)絡(luò),選用STRING(https://stringdb.org/)數(shù)據(jù)庫(kù)進(jìn)行蛋白互作網(wǎng)絡(luò)PPI 分析,選擇Homo sapiens 作為“Organism”的條件,其余參數(shù)均為系統(tǒng)默認(rèn)設(shè)置。
1.5 miRNA 預(yù)測(cè) 針對(duì)差異表達(dá)基因預(yù)測(cè)其靶miRNA,選用miRTarBase(https://mirtarbase.cuhk.edu.cn/)數(shù)據(jù)庫(kù),選擇reporter assay、western blot、qPCR 和microarray 四種實(shí)驗(yàn)驗(yàn)證的miRNA-mRNA 靶向匹配作為預(yù)測(cè)miRNA 的入選標(biāo)準(zhǔn),并應(yīng)用Cytoscape 9.1.0 軟件對(duì)miRNA-mRNA 的調(diào)控網(wǎng)絡(luò)進(jìn)行可視化。
1.6 預(yù)測(cè)miRNA 的驗(yàn)證 將預(yù)測(cè)的miRNA 與PMID:20 735 361[9]的Table S4 數(shù)據(jù)取交集進(jìn)行驗(yàn)證,該研究主要分析miRNA 在人胚胎T3 干細(xì)胞向胰腺胰島樣細(xì)胞團(tuán)分化過(guò)程中的表達(dá),其Table S4 結(jié)果顯示出胚胎T3 干細(xì)胞(hES-T3 cells grown on mouse embryonic fibroblast feeder,T3ES)、胚胎內(nèi)胚層(embryoid bodies differentiated from T3 cells,T3EB)和胰腺胰島樣細(xì)胞團(tuán)(pancreatic islet-like cell clusters derived from T3 cells,T3pi)三組標(biāo)準(zhǔn)化的miRNA 表達(dá)量。
2.1 差異表達(dá)基因 通過(guò)對(duì)GSE42094 的6 組樣本數(shù)據(jù)分析,差異表達(dá)基因的前250 個(gè)被顯示,除去沒(méi)有名稱和重復(fù)的基因,共得到188 個(gè)。進(jìn)一步對(duì)hESCs和IPCs 兩組數(shù)據(jù)分析得到差異表達(dá)基因,并與上述188 個(gè)基因取交集后,選取誘導(dǎo)后上調(diào)和下調(diào)的各前10 個(gè)差異表達(dá)基因進(jìn)行后續(xù)研究,見(jiàn)表1。該20個(gè)基因代表整個(gè)hESCs 向IPCs 誘導(dǎo)過(guò)程中表達(dá)量差異最具有統(tǒng)計(jì)學(xué)意義的基因。
表1 誘導(dǎo)后上調(diào)和下調(diào)的前10 個(gè)差異表達(dá)基因
2.2 GO 功能和KEGG 路徑顯著性分析 通過(guò)對(duì)誘導(dǎo)后上調(diào)和下調(diào)的各前10 個(gè)差異表達(dá)基因進(jìn)行GO 功能和KEGG 路徑顯著性分析,發(fā)現(xiàn)上調(diào)基因在“外泌體”和“胞外”比較集中,主要涉及“谷胱甘肽代謝”和“PPAR 信號(hào)通路”,而下調(diào)基因在“基因表達(dá)調(diào)控”“內(nèi)胚層的決定”以及“成體干細(xì)胞種群維持”比較集中。
2.3 蛋白互作網(wǎng)絡(luò)分析 通過(guò)PPI 分析發(fā)現(xiàn)10 個(gè)上調(diào)基因中有6 個(gè)基因所表達(dá)的蛋白質(zhì)具有相互作用,有2 個(gè)基因顯示二者間直接作用(GSTA1 和GSTA2),剩余兩個(gè)沒(méi)有關(guān)聯(lián)(圖1A)。而下調(diào)的10 個(gè)基因中LOC729860 和UCA1 在STRING 數(shù)據(jù)庫(kù)中沒(méi)有收錄,其余8 個(gè)基因中有5 個(gè)表達(dá)的蛋白質(zhì)具有相互作用,剩余3 個(gè)沒(méi)有關(guān)聯(lián)(圖1B)。將上調(diào)和下調(diào)的基因進(jìn)行融合分析,發(fā)現(xiàn)下調(diào)基因KLKB1 能夠與上調(diào)基因FGG 直接進(jìn)行蛋白相互作用,且上調(diào)基因蛋白互作網(wǎng)絡(luò)通過(guò)VTN 與下調(diào)基因網(wǎng)絡(luò)的POU5F1 直接作用,將兩個(gè)網(wǎng)絡(luò)相關(guān)聯(lián)(圖1C)。
圖1 蛋白互作網(wǎng)絡(luò)分析
2.4 miRNA-mRNA 調(diào)控網(wǎng)絡(luò) 通過(guò)miRTarBase 數(shù)據(jù)庫(kù)查找靶向作用于差異表達(dá)基因的miRNA,選擇reporter assay、western blot、qPCR 和microarray 4 種實(shí)驗(yàn)驗(yàn)證的miRNA-mRNA 靶向匹配作為預(yù)測(cè)miRNA 的入選標(biāo)準(zhǔn),發(fā) 現(xiàn) CDH17、APOA2、FAM162B、GSTA2、LOC729860、UTF1、KLKB1 等7個(gè)基因沒(méi)有對(duì)應(yīng)miRNA 調(diào)控,而APOA1、TTR、PPP1R16B、RPL36A 4 個(gè)基因雖有相應(yīng)miRNA 調(diào)控,但不滿足設(shè)定的入選標(biāo)準(zhǔn),因此,該11 個(gè)基因在應(yīng)用Cytoscape 9.1.0 軟件進(jìn)行miRNA-mRNA 調(diào)控網(wǎng)絡(luò)可視化過(guò)程中,未有miRNA 呈現(xiàn),其余9 個(gè)基因共對(duì)應(yīng)23 個(gè)預(yù)測(cè)的miRNA。其中,DNMT3B 基因顯示有10 個(gè)miRNA 調(diào)控其表達(dá),NANOG 基因有9個(gè),而SPINK1 和UCA1 基因僅各有1 個(gè)miRNA調(diào)控其表達(dá),且該2 個(gè)基因與miRNA-mRNA 調(diào)控網(wǎng)絡(luò)沒(méi)有直接關(guān)聯(lián)。進(jìn)一步分析發(fā)現(xiàn)miR-335-5p能夠調(diào)控VTN、NANOG、POU5F1 和DNMT3B 4 個(gè)基因的表達(dá)(圖2),其中VTN 為上調(diào)基因(圖3A),NANOG、POU5F1 和DNMT3B 為下調(diào)基因(圖3B~圖3D)。
圖2 miRNA-mRNA 調(diào)控網(wǎng)絡(luò)
圖3 GEO2R 所示基因的表達(dá)量
2.5 預(yù)測(cè)miRNA 的驗(yàn)證 將預(yù)測(cè)的miRNA 與PMID:20 735 361 的Table S4 數(shù)據(jù)取交集,得到21 個(gè)驗(yàn)證的miRNA,剩余2 個(gè)預(yù)測(cè)的miRNA(miR-200b-3p和miR-144-3p)未被驗(yàn)證,可見(jiàn)絕大部分預(yù)測(cè)的miRNA 得到驗(yàn)證,亦即存在于干細(xì)胞及其誘導(dǎo)分化的過(guò)程中(表2),同時(shí)表明基于4 種實(shí)驗(yàn)預(yù)測(cè)miRNA 的方法具備一定的可信度。表2 顯示miR-302a-3p、miR-34a-5p、miR-34c-5p、miR-29b-3p、miR-375 和miR-29a-3p 表達(dá)量誘導(dǎo)分化后顯著降低,而miR-134-5p、miR-335-5p 和miR-26a-5p 表達(dá)量隨著誘導(dǎo)分化進(jìn)程逐漸升高,其中miR-335-5p表達(dá)量的逐漸升高與NANOG、POU5F1 和DNMT3B表達(dá)量的逐漸降低(圖3B~圖3D)形成對(duì)照,提示二者之間存在靶向關(guān)系且為負(fù)性調(diào)控。結(jié)合圖2 進(jìn)一步分析發(fā)現(xiàn)上調(diào)基因與下調(diào)基因網(wǎng)絡(luò)通過(guò)多個(gè)miRNA 相關(guān)聯(lián),其中上調(diào)基因VTN 通過(guò)miR-26b-5p和miR-335-5p 與下調(diào)基因網(wǎng)絡(luò)多個(gè)基因關(guān)聯(lián),并且VTN 通過(guò)miR-26b-5p 與GSTA1 和GSTA2 的二者間直接作用相關(guān)聯(lián)。上調(diào)基因FGG 通過(guò)miR-29家族(miR-29a-3p、29b-3p、29c-3p)與下調(diào)基因DNMT3B 相關(guān)聯(lián),提示miRNA 通過(guò)靶向不同表達(dá)類型的基因進(jìn)而調(diào)控干細(xì)胞的誘導(dǎo)分化進(jìn)程。
表2 PMID:20 735 361 數(shù)據(jù)驗(yàn)證預(yù)測(cè)的miRNA
表2 (續(xù))
2.6 miR-335-5p 的結(jié)構(gòu)和功能信息 運(yùn)用miRBase數(shù)據(jù)庫(kù)(https://www.mirbase.org/)檢索miR-335-5p的結(jié)構(gòu)信息,其前體hsa-mir-335 的序列及其莖環(huán)結(jié)構(gòu)如圖4A 所示,標(biāo)紅部分為成熟miR-335-5p 的序列(16-UCAAGAGCAAUAACGAAAAAUGU-38)。進(jìn)一步檢索發(fā)現(xiàn)前體hsa-mir-335 在169 篇文獻(xiàn)中被提及,共涉及864 個(gè)詞句,其詞匯云如圖4B 所示,可見(jiàn)其在癌癥和腫瘤方向研究最廣泛,其次就是誘導(dǎo)和分化等方向,與本研究的方向相符。
圖4 miR-335-5p 的結(jié)構(gòu)和功能信息
本研究為分析hESCs 向IPCs 誘導(dǎo)分化過(guò)程中的mRNA 表達(dá)譜,采用生物信息學(xué)方法篩選GEO數(shù)據(jù)庫(kù)內(nèi)的數(shù)據(jù)集得到GSE42094,該數(shù)據(jù)集包含未分化hESCs、IPCs 分化的5 個(gè)時(shí)期、胰腺內(nèi)胰島和胎胰等樣本數(shù)據(jù)。本研究選擇與研究目的直接相關(guān)的未分化hESCs 和IPCs 分化的5 個(gè)時(shí)期來(lái)研究,通過(guò)數(shù)據(jù)庫(kù)自帶軟件GEO2R 對(duì)數(shù)據(jù)進(jìn)行分析,得出差異表達(dá)的mRNA 共188 個(gè),分別選取誘導(dǎo)后上調(diào)和下調(diào)的各前10 個(gè)差異表達(dá)基因作為后續(xù)研究。
通過(guò)GO 功能和KEGG 路徑顯著性分析,發(fā)現(xiàn)下調(diào)基因多涉及基因表達(dá)調(diào)控以及多能干細(xì)胞調(diào)控信號(hào)通路等與干細(xì)胞誘導(dǎo)分化機(jī)制相關(guān)的內(nèi)容,而上調(diào)基因涉及內(nèi)容則比較寬泛。進(jìn)一步分析差異表達(dá)基因的相互作用,發(fā)現(xiàn)上調(diào)基因蛋白互作網(wǎng)絡(luò)與下調(diào)基因網(wǎng)絡(luò)通過(guò)上調(diào)基因VTN 和下調(diào)基因POU5F1 的直接作用而相關(guān)聯(lián),提示VTN 和POU5F1 基因可能為該蛋白互作網(wǎng)絡(luò)的核心基因。玻連蛋白(Vitronectin,VTN)是一種細(xì)胞外基質(zhì)糖蛋白,屬于整合素家族成員之一,其在傷口愈合和凝血過(guò)程中起著重要作用,進(jìn)一步研究發(fā)現(xiàn)其參與多種生物學(xué)過(guò)程包括細(xì)胞粘附和遷移[10-12],也能夠通過(guò)JNK 和ERK 信號(hào)通路誘導(dǎo)INS-1 細(xì)胞的增殖[13]。本研究發(fā)現(xiàn)玻連蛋白在Diff3 組表達(dá)量開(kāi)始升高,在IPCs 組達(dá)到峰值,表明其參與干細(xì)胞的誘導(dǎo)分化過(guò)程。POU5F1 又稱OCT4,是一種維持干細(xì)胞多能性的轉(zhuǎn)錄因子[14,15],其與NANOG 在胚胎早期發(fā)育中起著關(guān)鍵作用,并可作為胚胎干細(xì)胞的標(biāo)志物以及干性維持[16,17]。本研究發(fā)現(xiàn)hESCs 組POU5F1 表達(dá)量最高,隨著誘導(dǎo)進(jìn)程逐漸下降,在Diff3 組表達(dá)量就已經(jīng)處于較低水平。
構(gòu)建miRNA-mRNA 調(diào)控網(wǎng)絡(luò),發(fā)現(xiàn)miR-335-5p能夠調(diào)控VTN、NANOG、POU5F1 和DNMT3B 基因的表達(dá),其中VTN 為上調(diào)基因,NANOG、POU5F1 和DNMT3B 為下調(diào)基因。有學(xué)者研究發(fā)現(xiàn)在糖尿病模型GK 大鼠的胰島內(nèi)miR-335-5p 表達(dá)量顯著增高,其能夠直接靶向抑制Stxbp1 mRNA 的表達(dá),進(jìn)一步研究發(fā)現(xiàn)miR-335-5p 在INS-1 832/13 細(xì)胞內(nèi)的過(guò)表達(dá)能夠抑制葡萄糖刺激的胰島素分泌[18]。Tang XW 等[19]發(fā)現(xiàn)在妊娠期糖尿病小鼠中過(guò)表達(dá)miR-335-5p 能夠抑制VASH1 的表達(dá)進(jìn)而降低胰島素釋放的水平,并通過(guò)激活TGF-β 信號(hào)通路誘發(fā)胰島素抵抗。最近,Li G 等[20]研究發(fā)現(xiàn)miR-335-5p 能夠下調(diào)SLC2A4 基因表達(dá)進(jìn)而抑制胰腺細(xì)胞的生長(zhǎng),與二型糖尿病的進(jìn)展密切相關(guān)。但是,miR-335-5p是否參與干細(xì)胞誘導(dǎo)分化為IPCs 未見(jiàn)報(bào)道。
通過(guò)將預(yù)測(cè)的miRNA 與文獻(xiàn)PMID:20 735 361數(shù)據(jù)取交集,得到18 個(gè)驗(yàn)證的miRNA,miR-335-5p包含其中,結(jié)果顯示miR-335-5p 在內(nèi)胚層階段(T3EB)其表達(dá)量升高2 倍多,至胰腺胰島樣細(xì)胞團(tuán)階段(T3pi)升高接近5 倍,可見(jiàn)其在整個(gè)干細(xì)胞及其誘導(dǎo)分化過(guò)程中均有表達(dá),且隨著誘導(dǎo)分化進(jìn)程逐漸升高,表明miR-335-5p 不但參與糖尿病的發(fā)生進(jìn)展,而且參與干細(xì)胞誘導(dǎo)分化為IPCs 的整個(gè)過(guò)程。
綜上所述,本研究共篩選得到差異表達(dá)的基因188 個(gè),分別選取誘導(dǎo)后上調(diào)和下調(diào)的各前10 個(gè)進(jìn)行分析,發(fā)現(xiàn)上調(diào)基因蛋白互作網(wǎng)絡(luò)通過(guò)VTN 與下調(diào)基因網(wǎng)絡(luò)的POU5F1 直接作用,將兩個(gè)網(wǎng)絡(luò)相關(guān)聯(lián)。miRNA-mRNA 調(diào)控網(wǎng)絡(luò)發(fā)現(xiàn)miR-335-5p 能夠調(diào)控VTN、NANOG、POU5F1 和DNMT3B 4 個(gè)基因的表達(dá),進(jìn)一步驗(yàn)證發(fā)現(xiàn)miR-335-5p 表達(dá)量隨著誘導(dǎo)分化進(jìn)程逐漸升高,與NANOG、POU5F1 和DNMT3B 表達(dá)量逐漸降低形成對(duì)照,提示二者之間存在靶向關(guān)系且為負(fù)性調(diào)控。因此,該miRNAmRNA 調(diào)控網(wǎng)絡(luò)顯示miR-335-5p 靶向多個(gè)基因參與hESCs 向IPCs 誘導(dǎo)分化過(guò)程。