国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

糖尿病腎病核心基因的篩選與鑒定

2024-05-10 02:32吳曉俊倪飛雪徐玉雪
關(guān)鍵詞:差異基因靶點(diǎn)核心

吳曉俊,倪飛雪,徐玉雪

糖尿病腎病(diabetic kidney disease, DKD)是糖尿病發(fā)展的常見并發(fā)癥,主要特征是尿白蛋白、腎小球過濾功能障礙,是終末期腎病的主要原因,嚴(yán)重增加了糖尿病患者的死亡率[1]。腎小球的功能障礙在DKD的病程發(fā)展中起著重要的作用,高濃度的血糖可誘導(dǎo)氧化應(yīng)激、細(xì)胞凋亡[2]、免疫反應(yīng)[3]等。近年來(lái),內(nèi)皮素拮抗劑、腎素-血管緊張素-醛固酮系統(tǒng)阻滯劑、血管緊張素轉(zhuǎn)換酶抑制劑等的研究進(jìn)展,為DKD的治療提供了方向[4]。目前仍缺乏對(duì)DKD病理機(jī)制和藥物靶點(diǎn)的探究,且臨床治療結(jié)果不理想[5]。然而,生物信息學(xué)的發(fā)展為疾病研究提供了新的視角[6]。基于對(duì)DKD腎小球基因表達(dá)矩陣進(jìn)行的加權(quán)共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis,WGCNA)、最小絕對(duì)收縮和選擇算法(least absolute shrinkage and selection operator,LASSO)、特征選擇之支持向量機(jī)遞歸特征消除(support vector machine-recursive feature elimination,SVM-RFE)等分析方法,有助于對(duì)DKD的機(jī)制進(jìn)行深入研究,篩選核心生物學(xué)標(biāo)志物與治療靶點(diǎn),尋找與DKD相關(guān)的潛在治療基因。

1 材料與方法

1.1 數(shù)據(jù)資料來(lái)源使用基因表達(dá)數(shù)據(jù)庫(kù)(GEO)(https://www.ncbi.nlm.nih.gov/geo/),搜索關(guān)鍵詞“Diabetic kidney disease”和“Homo sapiens”,選擇“Expression profiling by array”以獲得DKD的mRNA微陣列基因表達(dá)矩陣。篩選得到了GSE47183和GSE30528及對(duì)應(yīng)數(shù)據(jù)平臺(tái)文件(包括30個(gè)正常對(duì)照樣本,23個(gè)DKD腎小球樣本),運(yùn)用R(4.2.1)將基因表達(dá)數(shù)據(jù)整合并進(jìn)行生物信息學(xué)分析。GEO屬于公共數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)中涉及的患者已獲得倫理批準(zhǔn),因此本研究不涉及倫理問題及其他利益沖突。

1.2 生物信息學(xué)數(shù)據(jù)分析使用R中的limma包對(duì)數(shù)據(jù)歸一化處理,通過WGCNA分別對(duì)GSE47183和GSE30528數(shù)據(jù)聚類分析,篩選與疾病具有顯著相關(guān)性的核心基因集,并通過韋恩圖(Veen diagram,Veen)對(duì)基因集進(jìn)行重疊,對(duì)共有的顯著核心基因使用LASSO和SVM-RFE算法進(jìn)一步分析,篩選目標(biāo)核心基因。同時(shí),為了得到與目標(biāo)核心基因相關(guān)的藥物靶點(diǎn),運(yùn)用基因藥物分析網(wǎng)絡(luò)分析(https://dgidb.genome.wustl.edu/)預(yù)測(cè)基因藥物作用靶點(diǎn),并且使用基因集合富集分析(gene set enrichment analysis,GSEA)篩選目標(biāo)核心基因可能參與調(diào)控的信號(hào)通路。

1.3 RNA提取及實(shí)時(shí)熒光定量PCR使用南京諾唯贊RNA抽提試劑盒(L/N 7E632K2)提取高脂飲食(high-fat diet,HFD)喂養(yǎng)糖尿病小鼠與同齡健康C57小鼠腎臟組織總mRNA,使用Takara試劑盒將RNA逆轉(zhuǎn)錄為模板cDNA,檢測(cè)樣本量為1 μg,依照SYBR Ex Tap Ⅱ試劑說明書進(jìn)行擴(kuò)增,β-actin為內(nèi)參,驗(yàn)證核心基因足細(xì)胞標(biāo)記蛋白(NPHS1)、Ⅰ型膠原蛋白α2鏈(collagen type I alpha 2 chain,COL1A2)、轉(zhuǎn)化生長(zhǎng)因子β誘導(dǎo)蛋白(transforming growth factor beta induced,TGFBI)、分化集群48(cluster of differentiation 48,CD48)、1號(hào)染色體開放閱讀框21(chromosome 1 open reading frame 21,C1orf21)在腎臟中的基因表達(dá)水平。

1.4 統(tǒng)計(jì)學(xué)處理差異表達(dá)水平使用R(4.2.1)及GraphPad Prime 8.0統(tǒng)計(jì)分析,使用t檢驗(yàn),以標(biāo)準(zhǔn)誤差(SEM)表示平均值的誤差,P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。

2 結(jié)果

2.1 差異基因mRNA的篩選和分析提取GEO數(shù)據(jù)庫(kù)GSE30528和GSE47183中DKD腎小球的mRNA數(shù)據(jù),作火山圖分析。結(jié)果表明,DKD數(shù)據(jù)GSE30528共有317個(gè)具有顯著性差異的基因(P.adj<0.05, |log2FC|>1),235個(gè)基因表達(dá)下調(diào)(綠色),82個(gè)基因表達(dá)上調(diào)(紅色)(圖1A)。GSE47183數(shù)據(jù)共有209個(gè)具有顯著表達(dá)的差異基因(P.adj<0.05, |log2FC|>1),100個(gè)基因表達(dá)下調(diào)(綠色),109個(gè)基因表達(dá)上調(diào)(紅色)(圖1B)。使用Veen圖重疊差異基因,62個(gè)差異基因在兩個(gè)數(shù)據(jù)庫(kù)均表達(dá)(圖1C)。對(duì)此62個(gè)差異基因進(jìn)行KEGG分析,結(jié)果顯示這些差異基因與細(xì)胞外基質(zhì)(extracellular matrix,ECM)受體相互作用,PI3K-Akt信號(hào)通路具有顯著相關(guān)性。GO結(jié)果表明,差異基因主要與細(xì)胞因子的正調(diào)節(jié)具有相關(guān)性,主要在細(xì)胞外間質(zhì)結(jié)構(gòu)成分中起作用(圖2B-2D)。

圖1 差異基因的提取

圖2 差異基因KEGG和GO分析

2.2 WGCNA篩選疾病核心基因?qū)KD表達(dá)矩陣GSE30528和GSE47183分別用R(limma包)對(duì)數(shù)據(jù)歸一化,皮爾遜相關(guān)系數(shù)對(duì)樣品聚類,進(jìn)行WGCNA,篩選與疾病關(guān)系密切相關(guān)的核心基因。軟闕值分別為16和12時(shí),滿足R2=0.9的無(wú)標(biāo)度的網(wǎng)絡(luò)拓?fù)潢P(guān)系(圖3A、3B)。將數(shù)據(jù)集的鄰接矩陣轉(zhuǎn)換為TOM矩陣,對(duì)樣本聚類,構(gòu)建WGCNA網(wǎng)絡(luò)(圖3C),篩選出不同顏色的模塊基因集。值得關(guān)注的模塊分別是GSE30528的ME turquoise(r=0.93,P=5e-10)和GSE47183的ME blue(r=0.72,P=5e-6),其與疾病狀態(tài)最具有關(guān)聯(lián)性(圖3D)。同時(shí),證實(shí)了兩個(gè)模塊(turquoise模塊,blue模塊)中基因集的相關(guān)性和顯著性,turquoise模塊:Cor=0.92,P=3.8e-172(GSE30528),blue模塊:Cor=0.63,P=2.7e-21(GES47183),見圖3E、3F。分別將GSE30528、GSE47183的顯著性差異基因與WGCNA篩選的核心基因使用Veen圖重疊篩選,富集出37個(gè)核心基因(圖4A),對(duì)兩組數(shù)據(jù)進(jìn)行合并,熱圖展現(xiàn)每個(gè)基因的表達(dá)水平,共有10個(gè)基因表達(dá)下調(diào)(藍(lán)色),27個(gè)基因表達(dá)上調(diào)(紅色)(圖4B)。

圖3 WGCNA篩選疾病核心基因

圖4 核心基因的篩選和展示

2.3 機(jī)器學(xué)習(xí)算法篩選特征基因?qū)?7個(gè)核心基因使用LASSO模型算法,繪制LASSO回歸圖形和交叉驗(yàn)證圖形,篩選出6個(gè)特征基因(圖5A、5B)。同時(shí),使用SVM-RFE算法對(duì)37個(gè)核心基因進(jìn)行過濾,篩選特征基因的最優(yōu)組合,10個(gè)特征基因被顯著富集(圖5C、5D)。Veen圖對(duì)兩種算法的核心基因取交集,共同篩選出5個(gè)目標(biāo)核心基因,這5個(gè)重疊交叉的核心基因?qū)⑹沁M(jìn)一步研究的重點(diǎn)(圖5E)。

圖5 目標(biāo)核心基因的篩選

2.4 目標(biāo)核心基因的表達(dá)水平及相關(guān)性將GEO數(shù)據(jù)庫(kù)中的GSE30528和GSE47183數(shù)據(jù)合并,共有30個(gè)正常腎小球樣本,23個(gè)DKD腎小球樣本,分析5個(gè)核心基因在數(shù)據(jù)中的表達(dá)情況。結(jié)果表明,CD48、COL1A2、TGFBI的表達(dá)水平顯著升高,NPSH1、C1orf21的表達(dá)水平顯著降低(P. adj<0.05, |log2FC|>1)(圖6A-6E)。皮爾森相關(guān)性分析確定5個(gè)基因間的相關(guān)性(圖6F)?;诓町惢蚣瘶?gòu)建的邏輯回歸模型,繪制的受試者工作特征曲線(receiver operating characteristic curve,ROC)顯示,5個(gè)核心基因的ROC曲線下面積(area under the receiver operating characteristic curve,AUC)均大于0.8(圖7A-7E),進(jìn)一步表明這些核心基因可能與DKD疾病具有密切關(guān)系。

圖6 目標(biāo)核心基因的表達(dá)水平及皮爾森相關(guān)性分析

圖7 目標(biāo)核心基因的ROC曲線

2.5 核心基因的生物學(xué)功能和通路分析使用GSEA進(jìn)行數(shù)據(jù)分析(c2.cp.all基因集作富集使用),結(jié)果顯示NPHS1在細(xì)胞外機(jī)制及細(xì)胞交流信號(hào)通路顯著富集(圖8A),COL1A2主要與整合素細(xì)胞表面互作相關(guān)(圖8B),CD48在自然殺傷細(xì)胞毒性和細(xì)胞表面相互作用中起作用(圖8C),而TGFBI與ECM糖蛋白和整合素途徑有關(guān)(圖8D)。然而C1orf21的研究目前匱乏,功能尚不明確,無(wú)法進(jìn)行GSEA富集。

圖8 目標(biāo)基因的GSEA分析

2.6 目標(biāo)核心基因生物學(xué)驗(yàn)證為進(jìn)一步研究目標(biāo)基因在DKD的表達(dá),使用HFD(加小劑量鏈脲佐菌素)誘導(dǎo)的糖尿病小鼠腎臟組織,檢測(cè)5個(gè)核心基因(NPHS1、CD48、COL1A2、TGFBI、C1orf21)表達(dá)水平,如圖9所示,NPHS1表達(dá)降低(圖9A),CD48表達(dá)升高(圖9B),而COL1A2、TGFBI和C1orf21的表達(dá)則無(wú)顯著變化(圖9C-9E)。結(jié)果表明,NPHS1和CD48符合上述的生物信息學(xué)分析結(jié)果,它們可能與DKD的發(fā)生和發(fā)展具有密切關(guān)系。

圖9 核心基因mRNA表達(dá)水平

2.7 核心基因的藥物治療與靶點(diǎn)預(yù)測(cè)為了研究核心基因?qū)KD的有效治療,進(jìn)行了目標(biāo)基因的基因-藥物的靶點(diǎn)預(yù)測(cè),以及指導(dǎo)mRNA合成的有效miRNA,通過基因藥物相互作用網(wǎng)站預(yù)測(cè)基因靶點(diǎn)。僅預(yù)測(cè)出LOSARTAN以NPHS1為靶點(diǎn)發(fā)揮治療作用(圖10A)。使用3種軟件(miRanda、miRDB、TargetScan)分析NPHS1合成相關(guān)的miRNA,結(jié)果表明,多種miRNA直接指導(dǎo)NPHS1的合成(圖10B)。

圖10 核心基因藥物及靶點(diǎn)預(yù)測(cè)

3 討論

DKD是導(dǎo)致腎衰竭的主要原因。盡管目前對(duì)于DKD疾病已有較清晰的了解,但是DKD的治療方法十分有限,具體病理機(jī)制仍不甚清楚[7]。近年來(lái),基于mRNA微陣列分析技術(shù)的生物信息學(xué)迅速發(fā)展,為探究疾病發(fā)展的分子機(jī)制起到指導(dǎo)作用。在本研究中,通過GEO公共數(shù)據(jù)采用WGCNA對(duì)數(shù)據(jù)進(jìn)行分類,篩選出37個(gè)與DKD具有密切相關(guān)性的顯著性差異基因,包括10個(gè)下調(diào)基因和27個(gè)上調(diào)基因。對(duì)此37個(gè)差異基因采用LASSO、SVM-RFE機(jī)器算法及皮爾森相關(guān)性分析進(jìn)一步篩選出與DKD具有密切關(guān)聯(lián)性的5個(gè)核心基因(NPHS1、COL1A2、CD48、TGFBI、C1orf21),并通過HFD造模糖尿病小鼠腎臟組織的RNA檢測(cè),進(jìn)一步驗(yàn)證了核心基因的表達(dá)情況。

對(duì)核心基因的GSEA分析結(jié)果發(fā)現(xiàn),NPHS1與NEPH1信號(hào)通路及細(xì)胞交流呈負(fù)相關(guān)。有研究[8]表明,NEPH1是免疫球蛋白超家族中的一員,在結(jié)構(gòu)上與腎素相關(guān),誘導(dǎo)細(xì)胞黏附。NPHS1和NEPH1的基因產(chǎn)物Nephrin和NEPH1是Ig超家族的足細(xì)胞膜蛋白,NPHS1的缺乏會(huì)嚴(yán)重導(dǎo)致尿蛋白癥,使疾病迅速惡化[9]。在DKD中,分析結(jié)果表明,COL1A2的表達(dá)與DKD細(xì)胞外基質(zhì)及細(xì)胞表面整合素相互作用顯著相關(guān),COL1A2是I型膠原的成員,屬纖維化基因,因此COL1A2的高表達(dá)與DKD中的腎纖維化有關(guān)[10]。有證據(jù)指出COL1A2的表達(dá)與DKD中由高糖誘導(dǎo)的炎癥反應(yīng)具有顯著相關(guān)性[11],針對(duì)COL1A2的治療,是DKD管理的潛在干預(yù)策略,然而,在糖尿病小鼠腎臟組織中,COL1A2卻沒有顯著變化。與此同時(shí),越來(lái)越多的研究[12]發(fā)現(xiàn),DKD的發(fā)展中存在著免疫機(jī)制的參與,T淋巴細(xì)胞、B淋巴細(xì)胞、巨噬細(xì)胞等與DKD密切相關(guān),CD48主要參與自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性及反應(yīng)體細(xì)胞表面相互作用(圖8C)。CD48是信號(hào)淋巴細(xì)胞激活分子家族的成員,參與免疫細(xì)胞的黏附和激活[13],在DKD中的高表達(dá)激活了自然殺傷細(xì)胞的活力,引起了免疫細(xì)胞的激活。同樣的,TGFBI是轉(zhuǎn)化因子誘導(dǎo)蛋白,參與細(xì)胞的生長(zhǎng)、分化以及細(xì)胞黏附等。在腫瘤研究中,TGFBI在很大程度上促進(jìn)了腫瘤細(xì)胞的進(jìn)展[14],在DKD中卻沒有報(bào)道。然而,TGFBI能夠調(diào)控ECM糖蛋白,而ECM蛋白與脂肪組織相關(guān),并調(diào)節(jié)炎癥、纖維化、血管生成和代謝惡化[15]。因此推測(cè)TGFBI的表達(dá)調(diào)節(jié)DKD中的腎纖維化和免疫炎癥具有密切關(guān)系,但本研究顯示,TGFBI在HFD小鼠腎臟組織中并沒有發(fā)生顯著變化。除此之外,發(fā)現(xiàn)C1orf21同樣是被顯著富集出的基因,C1orf21是一個(gè)目前還未功能注釋的非特征性蛋白質(zhì)編碼基因。針對(duì)C1orf21的研究十分匱乏,其表達(dá)差異意味著1號(hào)染色體的功能性障礙,這有待于進(jìn)一步研究確認(rèn)。綜上所述,NPHS1、CD48、COL1A2、TGFBI、C1orf21基因可能與DKD具有密切相關(guān)性,通過參與細(xì)胞表面相互作用,影響免疫細(xì)胞的激活、細(xì)胞黏附以及促進(jìn)腎纖維化影響疾病的惡化。而基因靶點(diǎn)藥物和有效miRNA的預(yù)測(cè)為研究DKD的治療提供了重要指導(dǎo)。本研究表明,COL1A2、CD48與DKD的發(fā)展具有顯著相關(guān)性,而針對(duì)NPHS1的基因靶點(diǎn)藥物治療及miRNA的預(yù)測(cè)在DKD中有可能作為重要的突破點(diǎn)。

猜你喜歡
差異基因靶點(diǎn)核心
我是如何拍攝天和核心艙的
近觀天和核心艙
你好!我是“天和”核心艙
維生素D受體或是糖尿病治療的新靶點(diǎn)
腫瘤免疫治療發(fā)現(xiàn)新潛在靶點(diǎn)
基于RNA 測(cè)序研究人參二醇對(duì)大鼠心血管內(nèi)皮細(xì)胞基因表達(dá)的影響 (正文見第26 頁(yè))
紫檀芪處理對(duì)釀酒酵母基因組表達(dá)變化的影響
心力衰竭的分子重構(gòu)機(jī)制及其潛在的治療靶點(diǎn)
SSH技術(shù)在絲狀真菌功能基因篩選中的應(yīng)用
氯胺酮依賴腦內(nèi)作用靶點(diǎn)的可視化研究