国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于生物信息學(xué)和機(jī)器學(xué)習(xí)的心肌梗死后心室重構(gòu)關(guān)鍵基因的篩選

2022-10-13 12:58李興淵朱明軍彭廣操王建茹
關(guān)鍵詞:心室心肌細(xì)胞標(biāo)志物

李興淵,朱明軍,彭廣操,王建茹

河南中醫(yī)藥大學(xué)第一附屬醫(yī)院心內(nèi)科 鄭州 450000

心肌梗死(myocardial infarction,MI)作為冠心病中最危險(xiǎn)的類型,是當(dāng)前全球范圍內(nèi)人類死亡的主要原因之一[1-4]。隨著溶栓、冠脈介入等治療手段的應(yīng)用和普及,MI的病死率顯著下降,但MI后心力衰竭和不良心血管事件的風(fēng)險(xiǎn)明顯增加;MI后心室重構(gòu)(ventricular remodeling post-myocardial infarction,VRpMI)是導(dǎo)致上述風(fēng)險(xiǎn)的重要病理基礎(chǔ)[1-6]。VRpMI是指MI后心肌細(xì)胞、非心肌細(xì)胞和細(xì)胞外基質(zhì)發(fā)生改變,導(dǎo)致心室持續(xù)發(fā)生形狀和功能上的病理性改變,表現(xiàn)為左心室擴(kuò)大、左心室射血分?jǐn)?shù)降低和(或)局部室壁活動(dòng)異常等[4-5]。研究[2,6]顯示,近半數(shù)的MI患者在MI后1 a內(nèi)出現(xiàn)了心室重構(gòu)且大多發(fā)生在前3個(gè)月。臨床上,常通過(guò)生化指標(biāo)、超聲心動(dòng)圖、心臟磁共振成像等手段診斷和評(píng)估VRpMI,但仍缺乏更準(zhǔn)確的評(píng)估方法或體系[4,7]。因此,積極探索VRpMI病理過(guò)程中潛在的生物標(biāo)志物及病理機(jī)制,從而挖掘有效的診斷、防治心室重構(gòu)的方法,具有重要意義。

隨著高通量測(cè)序技術(shù)的發(fā)展和推廣應(yīng)用,許多疾病病理過(guò)程中的轉(zhuǎn)錄組等信息可被獲取,這些海量的數(shù)據(jù)將極大地助力人類深入探索疾病的發(fā)生、發(fā)展和轉(zhuǎn)歸等的機(jī)制和規(guī)律[8-9]。加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis,WGCNA)作為生物信息學(xué)中一種高頻運(yùn)用的方法,常用于分析樣本性狀與基因間的關(guān)聯(lián)模式,在篩選疾病生物標(biāo)志物或潛在防治靶點(diǎn)方面表現(xiàn)出了明顯優(yōu)勢(shì),現(xiàn)已在多種疾病中成功應(yīng)用[10-11]。機(jī)器學(xué)習(xí)作為人工智能的一個(gè)子集,已被廣泛應(yīng)用于多個(gè)醫(yī)學(xué)領(lǐng)域[12-13]。在心血管方面,機(jī)器學(xué)習(xí)已被應(yīng)用于探索疾病生物標(biāo)志物、發(fā)病機(jī)制、治療靶點(diǎn)、預(yù)測(cè)生存結(jié)局及保健等方面[13-16]。本研究基于高通量測(cè)序數(shù)據(jù),利用生物信息學(xué)和機(jī)器學(xué)習(xí)相結(jié)合的方法,篩選VRpMI病理過(guò)程中潛在的生物標(biāo)志物及分子機(jī)制,以期為VRpMI的防治提供新的思路。

1 材料與方法

1.1 數(shù)據(jù)來(lái)源及預(yù)處理從GEO數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/geo/)中下載GSE132143數(shù)據(jù)集。提取數(shù)據(jù)集中NextSeq 500測(cè)序系統(tǒng)檢測(cè)的健康人心室組織(正常組,12個(gè)樣本)和VRpMI患者心室組織(VRpMI組,20個(gè)樣本)的轉(zhuǎn)錄組信息?;谌祟悈⒖蓟蚪MGRCh38,提取“gene_biotype”為“protein_coding”的注釋信息,將健康人和VRpMI患者心室組織轉(zhuǎn)錄組測(cè)序數(shù)據(jù)的基因ID轉(zhuǎn)化為基因名,剔除基因數(shù)為0的基因后將數(shù)據(jù)保存為“human_MI.txt”文件,用于后續(xù)篩選差異表達(dá)基因(differentially expressed gene,DEG)。同時(shí),下載GSE132143數(shù)據(jù)集中豬(n=9)MI后6個(gè)月左室梗死區(qū)和梗死遠(yuǎn)端區(qū)域組織的測(cè)序數(shù)據(jù),并使用edgeR包中calcNormFactors函數(shù)的TMM算法對(duì)測(cè)序數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化校正,保存為“Swine_MI_6m.txt”文件。此外,下載基因芯片數(shù)據(jù)集GSE775及其平臺(tái)文件GPL81-57556,該數(shù)據(jù)集為不同時(shí)間點(diǎn)正常小鼠(n=3)和VRpMI小鼠(n=3)左室心肌組織基因表達(dá)數(shù)據(jù),分別提取MI后48 h和8周的數(shù)據(jù),并取以2為底的對(duì)數(shù),然后分別保存為“mouse_MI_48h.txt”和“mouse_MI_8w.txt”文件。

1.2 DEG的篩選利用edgeR包,以|log2[差異倍數(shù)(fold change,FC)]|>2和校正后的P<0.05為閾值,對(duì)“human_MI.txt”文件中的表達(dá)數(shù)據(jù)進(jìn)行分析,篩選DEG,并利用ggplot2和pheatmap包進(jìn)行可視化處理。

1.3 WGCNA將“human_MI.txt”文件中各樣本中基因的基因數(shù)轉(zhuǎn)換成TPM模式,并保存為“data_tpms.txt”文件,然后對(duì)樣本進(jìn)行聚類并剔除離群樣本,形成數(shù)據(jù)矩陣。利用WGCNA包計(jì)算最佳軟閾值并據(jù)此將數(shù)據(jù)矩陣依次轉(zhuǎn)化為鄰接矩陣、TOM矩陣,進(jìn)而進(jìn)行基因聚類;將模塊基因數(shù)目設(shè)為30,通過(guò)動(dòng)態(tài)剪切樹(shù)法識(shí)別基因模塊,對(duì)相似模塊進(jìn)行聚類和合并;計(jì)算基因模塊與組別信息之間的相關(guān)系數(shù)及P值,選擇與正常組樣本正相關(guān)性最強(qiáng)的基因模塊進(jìn)行后續(xù)分析。

1.4 重要DEG的篩選以及疾病本體(disease ontology,DO)和基因功能富集分析利用venn包將1.2中篩選出的DEG和1.3中選出的與正常組樣本正相關(guān)性最強(qiáng)的模塊中的基因取交集,獲取重要DEG。分別利用enrichDO函數(shù)、clusterProfiler包對(duì)重要DEG進(jìn)行DO富集分析、GO分析和KEGG通路富集分析。

1.5 關(guān)鍵基因的篩選及驗(yàn)證分別利用基于glmnet包的最小絕對(duì)值收斂和選擇算子(least absolute shrinkage and selection operator,LASSO)算法和基于e1071包的支持向量機(jī)-遞歸特征消除(support vector machine-recursive feature elimination,SVM-RFE)算法從重要DEG中篩選特征基因,然后利用venn包對(duì)兩者取交集,獲得關(guān)鍵基因。同時(shí),基于正常組和VRpMI組心室關(guān)鍵基因的表達(dá)量,利用ROC曲線評(píng)價(jià)關(guān)鍵基因診斷VRpMI的效能;分別從“mouse_MI_48h.txt”、“mouse_MI_8w.txt”和“Swine_MI_6m.txt”文件中提取關(guān)鍵基因的表達(dá)量,進(jìn)行組間比較,采用pROC包繪制關(guān)鍵基因的ROC曲線,并用這些外部數(shù)據(jù)來(lái)評(píng)價(jià)關(guān)鍵基因的診斷效能。

1.6 關(guān)鍵基因的基因集富集分析(gene set enrichment analysis,GSEA)以關(guān)鍵基因在“data_tpms.txt”文件中所有樣本表達(dá)量的中位數(shù)為依據(jù),將文件中的關(guān)鍵基因分為高表達(dá)組和低表達(dá)組。利用GSEA 4.1.0軟件,選擇c2.cp.kegg.v7.4.symbols作為參考基因集進(jìn)行GSEA。以標(biāo)準(zhǔn)化富集得分的絕對(duì)數(shù)>1、名義P值<0.05和錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,FDR)<0.25為閾值篩選陽(yáng)性基因集。

2 結(jié)果

2.1 DEG的篩選結(jié)果差異分析共篩選出716個(gè)DEG,其中上調(diào)585個(gè),下調(diào)131個(gè)(圖1)。

上:火山圖(藍(lán)點(diǎn)為下調(diào)的DEG,灰點(diǎn)為表達(dá)無(wú)差異的基因,紅點(diǎn)為上調(diào)的DEG);下:前20個(gè)上調(diào)、下調(diào)DEG的熱圖

2.2 WGCNA結(jié)果從1~20中選取軟閾值開(kāi)展網(wǎng)絡(luò)拓?fù)浞治?,?dāng)軟閾值為7時(shí)能夠使鄰接函數(shù)較好滿足無(wú)尺度條件且R2>0.8(圖2A、B)。隨后,利用動(dòng)態(tài)剪切樹(shù)法得到6個(gè)基因模塊(圖2C)。圖2D展示了6個(gè)基因模塊與組別信息之間的相關(guān)系數(shù)及P值,其中棕色模塊與組別信息的相關(guān)性最高(|r|=0.85,P<0.001),共包括7 288個(gè)基因(圖2D、E)。因此,選擇棕色模塊中的基因開(kāi)展后續(xù)研究。

A:軟閾值參數(shù)與尺度獨(dú)立性分析;B:軟閾值參數(shù)與平均連接性分析;C:基因聚類樹(shù)與基因模塊;D:臨床性狀與基因模塊的相關(guān)性熱圖;E:棕色模塊與正常組性狀的散點(diǎn)圖

2.3 重要DEG的篩選以及DO和基因功能富集分析如圖3A所示,棕色模塊中的7 288個(gè)基因與716個(gè)DEG取交集后獲得355個(gè)重要DEG。DO富集分析結(jié)果(圖3B)顯示,依據(jù)BH法校正后的P<0.05,共富集到了24種疾病(圖中展示20種),包括動(dòng)脈粥樣硬化、動(dòng)脈粥樣硬化性心血管疾病、牙周病、肺疾病、腦梗死等。GO富集分析結(jié)果(圖3C)顯示,依據(jù)P<0.05確定了492個(gè)GO條目。生物學(xué)過(guò)程條目370條,主要涉及藥物分解代謝過(guò)程、免疫反應(yīng)、炎癥反應(yīng)等;細(xì)胞組分條目32條,主要涉及含細(xì)胞外基質(zhì)的膠原蛋白、胞質(zhì)囊泡腔、運(yùn)輸囊泡等。分子功能條目90條,主要涉及細(xì)胞外基質(zhì)結(jié)構(gòu)成分、晚期糖基化終產(chǎn)物(receptor for advanced glycation end,RAGE)受體結(jié)合、血紅素結(jié)合等。KEGG富集分析結(jié)果(圖3D)顯示,依據(jù)P<0.05共映射出15條信號(hào)通路,包括蛋白質(zhì)消化吸收,鞘脂代謝,Apelin、PI3K-Akt、松弛素和Ras信號(hào)通路等。

2.4 關(guān)鍵基因的篩選及驗(yàn)證如圖4A、B、C所示,采用LASSO算法從355個(gè)重要DEG中篩選出了10個(gè)特征基因,采用SVM-RFE算法則篩選出了6個(gè)特征基因,兩者取交集后鑒定出神經(jīng)元正五聚蛋白2(neuronal pentraxin 2,NPTX2)為關(guān)鍵基因。其log2FC=-2.442,F(xiàn)DR<0.001,提示其在VRpMI中低表達(dá)。

A:LASSO算法篩選的特征基因;B:SVM-RFE算法篩選的特征基因;C:兩種機(jī)器學(xué)習(xí)算法篩選關(guān)鍵基因的韋恩圖

NPTX2在小鼠MI后48 h和8周時(shí)表達(dá)水平較正常小鼠心肌組織低(圖5A、B);豬MI后心肌梗死區(qū)域NPTX2的表達(dá)水平較心肌遠(yuǎn)端區(qū)域低(圖5C)?;诮】等撕蚔RpMI患者心室組織轉(zhuǎn)錄組測(cè)序數(shù)據(jù)(內(nèi)部數(shù)據(jù))繪制診斷VRpMI的ROC曲線,AUC(95%CI)為0.996(0.984~1.000),表明NPTX2具有良好的診斷效能(圖6A)。利用小鼠、豬MI模型數(shù)據(jù)分別對(duì)NPTX2的診斷效能進(jìn)行外部驗(yàn)證,結(jié)果表明NPTX2在兩個(gè)數(shù)據(jù)集的AUC(95%CI)值分別達(dá)到了0.972(0.895~1.000)和0.963(0.882~1.000),診斷效能較高(圖6B、C)。

A、B:分別為正常小鼠和MI小鼠48 h和8周心肌組織NPTX2的表達(dá);C:豬MI模型心肌遠(yuǎn)端區(qū)域和梗死區(qū)域NPTX2的表達(dá)

A、B、C:基于人、小鼠、豬的數(shù)據(jù)所得的NPTX2的ROC曲線

2.5 關(guān)鍵基因的GSEANPTX2在低表達(dá)組中未富集到陽(yáng)性基因集;在高表達(dá)組中富集到了19個(gè)陽(yáng)性基因集,主要涉及心肌收縮、氨基酸代謝、鞘脂類代謝、細(xì)胞凋亡、谷胱甘肽代謝、煙酸鹽和煙酰胺代謝等(圖7)。

3 討論

VRpMI可導(dǎo)致心功能惡化、心力衰竭、惡性心律失常,甚至心源性死亡,是影響MI后心臟事件發(fā)生率和遠(yuǎn)期預(yù)后的主要因素。現(xiàn)階段的研究[7,17]發(fā)現(xiàn)心肌肥大、心肌纖維化、炎癥免疫反應(yīng)、能量代謝紊亂、細(xì)胞凋亡、自噬和焦亡、神經(jīng)內(nèi)分泌系統(tǒng)的激活等介導(dǎo)了VRpMI,但其詳細(xì)的作用機(jī)制仍不清楚。因此,積極闡釋VRpMI的病理機(jī)制,對(duì)于預(yù)防、延緩甚至逆轉(zhuǎn)心室重構(gòu)至關(guān)重要。

本研究共鑒定出355個(gè)重要DEG,它們可通過(guò)調(diào)控炎癥免疫反應(yīng)、細(xì)胞外基質(zhì)結(jié)構(gòu)成分、Apelin、PI3K-Akt、松弛素等通路和生物學(xué)功能介導(dǎo)VRpMI的病理過(guò)程。研究[18]顯示,Apelin具有抗氧化應(yīng)激、抗腎素血管緊張素醛固酮系統(tǒng)、正性肌力等作用,參與了心肌肥厚、心力衰竭、高血壓、動(dòng)脈粥樣硬化、VRpMI等疾病的病理過(guò)程,Apelin介導(dǎo)的藥物治療可能會(huì)在VRpMI患者中發(fā)揮重要作用。PI3k-Akt信號(hào)通路是多個(gè)小分子藥物治療VRpMI的靶點(diǎn),其參與VRpMI的主要病理機(jī)制與抗氧化應(yīng)激、調(diào)控自噬水平、減少心肌細(xì)胞凋亡和炎癥反應(yīng)等有關(guān)[19-21]。此外,松弛素可通過(guò)減少心肌細(xì)胞凋亡和心肌纖維化膠原沉積來(lái)延緩VRpMI[22]。通過(guò)文獻(xiàn)復(fù)習(xí),我們不難發(fā)現(xiàn)這些重要DEG介導(dǎo)VRpMI的分子機(jī)制與既往文獻(xiàn)報(bào)道的結(jié)果存在一些吻合,這在一定程度上佐證了本研究結(jié)果的科學(xué)性和準(zhǔn)確性。

VRpMI可分為早期和晚期重構(gòu),早期重構(gòu)常在MI后72 h內(nèi)發(fā)生,以梗死面積擴(kuò)大和心室腔擴(kuò)張、心肌細(xì)胞壞死及心肌頓抑等為特點(diǎn);晚期重構(gòu)通常在數(shù)周內(nèi)發(fā)生,可以延續(xù)數(shù)月甚至1 a,以心肌細(xì)胞肥大、凋亡和彌漫性纖維化等為主要表現(xiàn)[4]。目前,VRpMI的診斷尚無(wú)統(tǒng)一明確的標(biāo)準(zhǔn),一些生物標(biāo)志物如N末端B型利鈉肽前體、半乳糖凝集素-3、可溶性ST2等在預(yù)測(cè)VRpMI方面表現(xiàn)出一定的應(yīng)用價(jià)值[4,23]。本研究利用 LASSO、SVM-RFE算法從355個(gè)重要DEG中鑒定出了1個(gè)VRpMI的潛在生物標(biāo)志物NPTX2,并發(fā)現(xiàn)其在早期重構(gòu)和晚期重構(gòu)階段均處于低表達(dá)水平。同時(shí),本研究繪制了依據(jù)內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)的NPTX2診斷VRpMI的ROC曲線,發(fā)現(xiàn)AUC值均大于0.9,說(shuō)明NPTX2在診斷VRpMI方面具有良好的效能。

NPTX2又稱調(diào)節(jié)神經(jīng)元活動(dòng)的正五聚蛋白,為正五聚蛋白的一個(gè)超家族成員,是一種分泌性糖蛋白。Hsu等[24]于1995年首次報(bào)道了NPTX2基因,發(fā)現(xiàn)其位于人染色體7q21.3-q22.1,長(zhǎng)度為11 000 bp,含有4個(gè)內(nèi)含子。NPTX2在人體分布廣泛,涉及腦、心、肝、胰、睪丸等多種器官,但起初其功能研究多集中于神經(jīng)系統(tǒng)[25]。近年來(lái),隨著研究的不斷深入,發(fā)現(xiàn)NPTX2與焦慮[26]、遺傳額顳葉癡呆[27]、血管性癡呆[28]、阿爾茨海默病[29-30]、癌癥[31]等多種疾病密切相關(guān),甚至可以作為它們的生物標(biāo)志物。本研究創(chuàng)新性地確證了NPTX2在MI組織低表達(dá),可能是VRpMI潛在的生物標(biāo)志物。為了進(jìn)一步闡釋NPTX2介導(dǎo)VRpMI病理過(guò)程可能的作用機(jī)制,本研究對(duì)NPTX2開(kāi)展了單基因GSEA。結(jié)果提示,NPTX2可能通過(guò)調(diào)控心肌收縮、氨基酸代謝、鞘脂類代謝、細(xì)胞凋亡、谷胱甘肽代謝、煙酸鹽和煙酰胺代謝等信號(hào)通路介導(dǎo)VRpMI的病理過(guò)程。心肌細(xì)胞減少為VRpMI的主要原因之一,而心肌細(xì)胞凋亡是導(dǎo)致心肌細(xì)胞數(shù)量減少的重要原因。研究[32-33]顯示,NPTX2低表達(dá)可促進(jìn)骨肉瘤細(xì)胞和胃癌細(xì)胞的凋亡;而其過(guò)表達(dá)可誘導(dǎo)神經(jīng)膠質(zhì)瘤細(xì)胞和胰腺癌細(xì)胞的凋亡[34-35]。以上結(jié)果提示,NPTX2可調(diào)控細(xì)胞凋亡,并表現(xiàn)出了雙重性的特點(diǎn)?,F(xiàn)階段,除了細(xì)胞凋亡外,我們尚未見(jiàn)NPTX2調(diào)控其他信號(hào)通路的相關(guān)報(bào)道。

本研究尚存在一定的局限性,主要體現(xiàn)在以下方面:①目前,在GEO數(shù)據(jù)庫(kù)中滿足研究疾病為VRpMI、檢測(cè)組織為人心肌組織的樣本偏少,且數(shù)據(jù)集單一,最終導(dǎo)致本研究納入分析的樣本量有限。②VRpMI與性別、年齡、糖尿病、高血壓、血脂異常、心肌梗死部位、是否為多支血管病變以及是否合并瓣膜病等因素密切相關(guān),但由于GSE132143數(shù)據(jù)集中樣本臨床信息不完善,導(dǎo)致在WGCNA時(shí)無(wú)法分析基因模塊與以上臨床信息的關(guān)聯(lián)性,限制了后續(xù)有針對(duì)性的研究。③基于有限的樣本量,為了保證結(jié)果的可靠性和精準(zhǔn)性,本研究分別采用了WGCNA、LASSO和SVM-RFE算法來(lái)鑒定關(guān)鍵基因;同時(shí),利用小鼠和豬的數(shù)據(jù)對(duì)挖掘出的關(guān)鍵基因在VRpMI病理過(guò)程中的表達(dá)水平和診斷效能進(jìn)行了外部驗(yàn)證。即使如此,本研究結(jié)果仍需在后續(xù)臨床實(shí)踐過(guò)程中進(jìn)行佐證。

總之,本研究利用不同的機(jī)器學(xué)習(xí)算法和生物信息學(xué)相結(jié)合的方法,發(fā)現(xiàn)NPTX2在VRpMI病理過(guò)程中處于低表達(dá)水平,確定了其可能為VRpMI的潛在生物標(biāo)志物。本研究結(jié)果為后續(xù)進(jìn)一步深入探索VRpMI的病理機(jī)制、開(kāi)發(fā)新型診斷生物標(biāo)志物及VRpMI的治療提供了新的思路和切入點(diǎn)。

猜你喜歡
心室心肌細(xì)胞標(biāo)志物
炎性及心肌纖維化相關(guān)標(biāo)志物在心力衰竭中的研究進(jìn)展
多項(xiàng)腫瘤標(biāo)志物聯(lián)合檢測(cè)在健康體檢中的應(yīng)用價(jià)值
Lorenz散點(diǎn)圖結(jié)合逆向技術(shù)快速識(shí)別起搏器基本功能
起搏器融合波排除的心電圖表現(xiàn)
基于TCGA數(shù)據(jù)庫(kù)分析、篩選并驗(yàn)證前列腺癌診斷或預(yù)后標(biāo)志物
微小核糖核酸-125b-5p抑制Caspase 2蛋白酶活性緩解脂多糖誘導(dǎo)的心肌細(xì)胞凋亡和氧化應(yīng)激的研究
FGF21作為運(yùn)動(dòng)因子在有氧運(yùn)動(dòng)抑制心梗心肌細(xì)胞凋亡中的作用及其機(jī)制探討
人造鰩魚(yú)
三七二醇對(duì)缺氧/復(fù)氧心肌細(xì)胞的保護(hù)機(jī)制及HSP70表達(dá)影響的研究△
冠狀動(dòng)脈疾病的生物學(xué)標(biāo)志物
柳江县| 厦门市| 利津县| 垦利县| 游戏| 黄冈市| 平和县| 昆山市| 东兴市| 克什克腾旗| 叶城县| 始兴县| 横山县| 陇南市| 肃北| 通河县| 余江县| 新建县| 双城市| 阿城市| 灵丘县| 泗阳县| 穆棱市| 克山县| 平安县| 凌云县| 正定县| 商南县| 田阳县| 锡林浩特市| 泊头市| 神农架林区| 河曲县| 甘孜县| 莎车县| 长治市| 西华县| 罗平县| 阿克苏市| 常熟市| 大安市|