国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機器學習算法的鐵死亡相關(guān)基因膿毒癥診斷模型

2023-11-08 11:09:34韓冰趙穎穎馬銘玉王巖杜佳欣杜麗娟孫同文
河南醫(yī)學研究 2023年20期
關(guān)鍵詞:膿毒癥基因算法

韓冰,趙穎穎,馬銘玉,王巖,杜佳欣,杜麗娟,孫同文

(鄭州大學第一附屬醫(yī)院 綜合ICU,河南 鄭州 450000)

膿毒癥是人體對各種感染反應(yīng)失調(diào)后出現(xiàn)的危及生命的器官功能障礙,是急危重癥醫(yī)學面臨的重要臨床問題,其病死率高達25%,即使存活的患者中仍有約23%出現(xiàn)認知障礙[1-3]。因此,早期識別并及時治療對膿毒癥患者預(yù)后改善尤為重要,但目前C反應(yīng)蛋白、降鈣素原及白介素-6等對膿毒癥的識別仍缺乏特異性[4]。鐵死亡是一種與氧化應(yīng)激反應(yīng)和胱氨酸代謝密切相關(guān)的脂質(zhì)活性氧積累驅(qū)動的鐵依賴的細胞死亡形式,在形態(tài)學、生物學及基因水平上不同于凋亡、自噬等其他形式的調(diào)節(jié)性細胞壞死[5]。研究表明鐵死亡在細胞代謝、氧化還原狀態(tài)以及退行性疾病、癌癥等方面發(fā)揮重要作用[6],但鐵死亡在膿毒癥方面的研究尚有限。本研究利用生物信息學分析膿毒癥患者鐵死亡相關(guān)基因并構(gòu)建診斷模型,為早期識別和治療膿毒癥提供新思路。

1 資料與方法

1.1 資料來源

本研究從基因表達綜合(Gene Expression Omnibus,GEO)數(shù)據(jù)庫獲取含有膿毒癥患者和健康人外周血微陣列芯片數(shù)據(jù)的GSE65682、GSE28750和GSE95233數(shù)據(jù)集;其中GSE65682數(shù)據(jù)集中含有480例膿毒癥患者和41例健康人;GSE28750數(shù)據(jù)集中含有10例膿毒癥患者和20例健康人;GSE95233數(shù)據(jù)集中含有51例膿毒癥患者和22例健康人。

1.2 數(shù)據(jù)集處理及鐵死亡基因差異表達分析

利用R軟件(版本4.1.2)通過穩(wěn)健多陣列平均算法對GSE65682、GSE28750和GSE95233數(shù)據(jù)集進行預(yù)處理和歸一化。使用R中l(wèi)imma包對歸一化后的GSE65682數(shù)據(jù)集中的膿毒癥患者和健康人進行鐵死亡相關(guān)基因差異表達分析,以P<0.05和|logFC|>1作為篩選差異基因的閾值,其中l(wèi)ogFC>1為上調(diào)基因,<-1為下調(diào)基因。

1.3 機器學習算法

支持向量機遞歸特征消除(support vector machine recursive feature elimination,SVM-RFE)是一種強大的特征選擇算法,它結(jié)合了支持向量機分類和遞歸特征消除,其工作原理是迭代地從輸入數(shù)據(jù)集中刪除信息最少的特征,直至達到所需的特征數(shù)量。最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,Lasso)回歸是一種線性回歸方法,它將L1正則化應(yīng)用于回歸系數(shù),產(chǎn)生稀疏模型并有助于避免過度擬合。本研究首先利用SVM-RFE算法選取了可以有效識別膿毒癥的鐵死亡基因,然后通過Lasso回歸進一步減少特征數(shù)量并提高預(yù)測模型的準確性。

1.4 診斷模型構(gòu)建及評估

根據(jù)Lasso回歸系數(shù)構(gòu)建膿毒癥診斷模型,使用受試者工作特征(receiver operating characteristic,ROC)曲線和曲線下面積(area under the curve,AUC)評估該模型的性能;并用GSE28750和GSE95233數(shù)據(jù)集對模型進行驗證。

1.5 差異基因功能和通路富集分析

通過CIBERSORT分析免疫細胞與納入預(yù)測模型中的鐵死亡基因的關(guān)系;根據(jù)Lasso回歸構(gòu)建預(yù)測模型計算風險評分,并根據(jù)中位數(shù)分為高低組,通過R中clusterProfiler包分別進行基因集富集分析(gene set enrichment analysis,GSEA)和基因集變異分析(gene set variation analysis,GSVA)。利用Kaplan-Meier曲線分析模型中鐵死亡基因在數(shù)據(jù)集GSE65682膿毒癥患者中的預(yù)后價值。

1.6 統(tǒng)計學分析

本研究所有數(shù)據(jù)處理與分析均通過R軟件(版本4.1.2)完成,兩組連續(xù)性變量間的比較則使用Wilcoxon秩和檢驗,并通過獨立t檢驗估計正態(tài)分布變量的統(tǒng)計顯著性。生存分析基于R包survival,Lasso回歸分析基于R包glmnet,Kaplan-Meier生存曲線和對數(shù)秩檢驗(log-rank test)用于評估生存差異。Spearman相關(guān)性分析用于計算不同分子之間的相關(guān)系數(shù)。P<0.05為差異有統(tǒng)計學意義。

2 結(jié)果

2.1 膿毒癥患者鐵死亡相關(guān)基因差異表達分析

通過分析GSE65682數(shù)據(jù)集中41例正常人和480例膿毒癥患者中306個鐵死亡相關(guān)基因,鑒定出34個差異表達基因(differentially expressed gene,DEG),其中19個高表達,15個低表達(圖1A和1B)。進一步分析DEG之間的相關(guān)性,結(jié)果表明34個DEG相互之間高度相關(guān)(圖1C);同時網(wǎng)絡(luò)分析結(jié)果表明膿毒癥與多個鐵死亡基因變化相關(guān)(圖1D)。

A火山圖顯示膿毒癥中306個鐵死亡相關(guān)基因,其中下調(diào)基因15個,上調(diào)基因19個;B熱圖顯示膿毒癥患者中差異表達的鐵死亡基因聚類情況;C膿毒癥患者中鐵死亡DEG之間存在高度相關(guān)性;D網(wǎng)絡(luò)圖顯示鐵死亡基因在膿毒癥中存在多種基因變化,其中*P<0.05,**P<0.01,***P<0.001。

2.2 基于機器學習構(gòu)建膿毒癥診斷模型

為構(gòu)建鐵死亡相關(guān)基因集識別膿毒癥的模型,本研究首先利用SVM-RFE確定34個DEG中錯誤率最低的前8個基因,FXN、KLF2、LCN2、NR1D2、PGD、TRIB2、TXN和MTF1(圖2A和圖2B);然后應(yīng)用Lasso回歸算法對這8個基因進行進一步分析,最終明確了一組具有非零系數(shù)的7個基因,FXN、KLF2、LCN2、NR1D2、PGD、TRIB2和TXN(圖2C和2D),且相互之間存在高度相關(guān)性(圖2F)。根據(jù)機器學習算法獲得這7個基因的系數(shù)(圖2E)構(gòu)建診斷預(yù)測模型。該模型可有效診斷膿毒癥,AUC為1,比單個基因識別膿毒癥的能力更高(圖3A和圖3B)。進一步分析表明KLF2、NR1D2、FXN、TRIB2在膿毒癥患者中低表達,而LCN2、PGD、TXN則高表達(圖3C),Lasso預(yù)測模型評分中膿毒癥患者得分高于正常人(圖3D),P<0.05。

A和B顯示SVM-RFE篩選錯誤率最低的前8個基因;C和D顯示Lasso回歸最終明確了一組具有非零系數(shù)的7個基因;E顯示納入模型的7個基因的風險系數(shù);F顯示納入模型的7個基因之間存在高度相關(guān)性。

A和B顯示模型在數(shù)據(jù)集GSE65682中可以有效診斷膿毒癥,AUC=1,比單個基因診斷效能更高;C和D顯示納入模型的7個基因和模型評分在數(shù)據(jù)集GSE65682中膿毒癥患者和健康人中的表達情況,****P<0.000 1。

2.3 模型驗證

為了進一步驗證預(yù)測模型的性能,本研究將該模型應(yīng)用于GEO的另外2個獨立的數(shù)據(jù)集(GSE95233和 GSE28750),ROC曲線顯示AUC分別為0.82和1(圖4A和4C);且膿毒癥患者中Lasso預(yù)測模型評分高于正常人(圖4B和圖4D)。

A和C顯示模型在GSE95233和GSE28750中可以有效診斷膿毒癥,AUC分別為0.82和1;B和D在GSE95233和GSE28750數(shù)據(jù)集中模型評分膿毒癥高于正常人,****P<0.000 1。

2.4 7個基因的生物學功能及預(yù)后價值

本研究進一步分析7個基因在膿毒癥患者中與免疫細胞相關(guān)性,結(jié)果表明其與嗜酸性粒細胞、巨噬細胞、漿細胞等免疫細胞相關(guān)(圖5A);同時GSEA分析表明其多與抗原處理和呈遞及自身免疫性疾病等通路相關(guān)(圖5B);GSVA分析表明其多與自身免疫性疾病及代謝性通路等相關(guān)(圖5C)。為了解7個基因在膿毒癥患者中的預(yù)后價值,分析GSE65682數(shù)據(jù)集7個基因的生存曲線,結(jié)果表明高表達KLF2、NR1D2、FXN和TRIB2的患者預(yù)后差,高表達LCN2的患者預(yù)后較好(圖5D),P<0.05。

A顯示納入模型的7個基因與免疫亞群細胞相關(guān)性分析;B顯示在數(shù)據(jù)集GSE65682中膿毒癥患者的GSEA分析;C顯示在數(shù)據(jù)集GSE65682中膿毒癥患者的GSVA分析;D為在數(shù)據(jù)集GSE65682中膿毒癥患者7個基因的生存曲線。

3 討論

膿毒癥是感染后引起的一種急危重癥,早期診斷和及時干預(yù)可有效降低膿毒癥的病死率[4,7-8]。然而,由于膿毒癥患者感染的病原微生物多種多樣、個體存在差異、缺乏特異性的臨床特征等原因,膿毒癥的早期診斷和預(yù)后預(yù)測仍存在困難。本研究利用生物信息學分析GEO數(shù)據(jù)庫中膿毒癥和正常人的鐵死亡DEG 34個,進一步利用機器學習SVM-RFE和Lasso回歸算法篩選7個基因構(gòu)建診斷模型,并通過ROC曲線評估模型的性能;最后分析模型中鐵死亡基因的生物學功能及對膿毒癥患者的預(yù)后價值。

膿毒癥主要因病原體及機體之間異常免疫反應(yīng)失衡后細胞線粒體功能障礙、誘導(dǎo)細胞死亡及器官微循環(huán)障礙等機制引起[9-10]。鐵死亡則是細胞內(nèi)脂質(zhì)氧化物代謝障礙后依賴鐵離子而發(fā)生的一種程序性細胞死亡;細胞發(fā)生鐵死亡后會釋放大量免疫原性物質(zhì),增加炎癥反應(yīng)加重細胞死亡,進而誘發(fā)多器官衰竭[11]。本研究分析膿毒癥患者和正常人之間鐵死亡基因差異表達,結(jié)果表明在膿毒癥患者中有19個基因高表達和15個基因低表達,提示鐵死亡可能在膿毒癥患者的疾病進程中發(fā)揮重要作用。

目前臨床上主要通過生物標志物如C反應(yīng)蛋白、降鈣素原等結(jié)合傳統(tǒng)評分模型如全身炎癥反應(yīng)綜合征標準、快速序貫器官衰竭評分、改良早期預(yù)警評分等來預(yù)測和診斷膿毒癥,但這些方法缺乏特異性和時效性,不能及時診斷膿毒癥[4,12]。機器學習是目前醫(yī)學上最常用的分析龐大數(shù)據(jù)的新型統(tǒng)計學方法,包括決策樹、SVM-RFE及深度學習等,可通過篩選臨床特征和測序數(shù)據(jù)進而構(gòu)建預(yù)測模型[12]。Desautels等[13]通過機器學習算法利用重癥監(jiān)護醫(yī)學信息數(shù)據(jù)庫MIMIC-Ⅲ中膿毒癥患者的心率、血壓、體溫、格拉斯哥昏迷評分和年齡等建立了預(yù)測模型,AUC高達0.88,高于傳統(tǒng)的評分模型。本研究利用GEO數(shù)據(jù)庫中膿毒癥和正常人外周血芯片測序數(shù)據(jù),結(jié)合機器學習算法SVM-RFE和Lasso回歸算法最終篩選出鐵死亡基因FXN、KLF2、LCN2、NR1D2、PGD、TRIB2和TXN構(gòu)建模型,其在數(shù)據(jù)集GSE65682、GSE28750和GSE95233中ROC的AUC分別為1、1和0.82;表明該模型可有效識別膿毒癥,為膿毒癥的早期診斷提供了新思路。

LCN2是一種固有免疫蛋白,其在鐵穩(wěn)態(tài)、感染和炎癥中的作用已被廣泛研究[14]。Huang等[15]在細菌內(nèi)毒素誘導(dǎo)的膿毒癥心力衰竭小鼠模型中發(fā)現(xiàn)心肌組織的LCN2表達量上調(diào),而LCN2缺陷小鼠的心臟損傷較輕,且體外細胞實驗證實外源性LCN2可通過增加不穩(wěn)定鐵池促進心肌細胞H9C2鐵死亡。Srinivasan等[16]研究表明在膿毒癥中LCN2可通過鐵介導(dǎo)的氧化應(yīng)激調(diào)控宿主促炎細胞因子的表達。KLF2是一種髓樣細胞促炎激活的負向調(diào)節(jié)因子,是體內(nèi)先天免疫反應(yīng)的關(guān)鍵決定因素,在患有急性或慢性炎癥性疾病的人群中KLF2表達水平降低30%至50%[17]。研究表明膿毒癥患者中KLF2的表達也降低[18],且與膿毒癥相關(guān)急性腎損傷相關(guān)[19]。NR1D2是一種配體激活轉(zhuǎn)錄因子,屬于孤兒核激素受體超家族成員,可參與機體代謝、炎癥反應(yīng)、生物節(jié)律及自噬等過程[20]。Lachmann等[21]發(fā)現(xiàn)在膿毒癥休克患者中NR1D2表達降低。PGD即磷酸葡萄糖脫氫酶,參與磷酸戊糖途徑,調(diào)節(jié)機體能量代謝[22]。近期研究表明在肺腺癌中PGD的表達與腫瘤突變負荷呈正相關(guān),且可通過鐵死亡調(diào)控免疫應(yīng)答[23]。TRIB2是一種假激酶,其主要功能是作為分子適配器調(diào)控蛋白的泛素化,在肝癌和銀屑病中可通過鐵死亡影響疾病的進程[24-25]。TXN即硫氧還原蛋白,可作為細胞因子減輕炎癥反應(yīng),在無菌性炎癥中抑制組織損傷中的鐵死亡[26]。在膿毒性腦病的小鼠模型中TXN表達上調(diào),且減輕焦亡相關(guān)蛋白及炎癥因子[27]。FXN是一種線粒體蛋白,可以調(diào)節(jié)鐵穩(wěn)態(tài)和線粒體功能,是鐵死亡的關(guān)鍵調(diào)節(jié)因子,在多種腫瘤的發(fā)生發(fā)展過程中發(fā)揮作用[28]。由此可見納入模型的7個基因都直接或間接參與鐵死亡,并在腫瘤、炎癥及膿毒癥中發(fā)揮作用。

免疫反應(yīng)失調(diào)是膿毒癥重要發(fā)病機制之一,膿毒癥患者的免疫狀態(tài)可能是影響預(yù)后的重要因素[29]。本研究分析模型中基因與免疫細胞的相關(guān)性,結(jié)果表明模型中的基因與嗜酸性粒細胞、巨噬細胞、漿細胞等免疫細胞高度相關(guān),同時進一步對模型中的基因進行GSEA和GVSA分析,結(jié)果表明其主要富集在免疫和代謝等通路,提示膿毒癥患者中免疫異常,且可能發(fā)生鐵死亡,進而影響疾病進程。對模型中的基因進行生存分析,結(jié)果表明高表達KLF2、NR1D2、FXN和TRIB2的患者預(yù)后差,高表達LCN2的患者預(yù)后較好,這進一步說明納入模型的基因具有較好的臨床預(yù)測價值。但本研究仍有一定局限性,一是本研究僅利用GEO數(shù)據(jù)庫中的數(shù)據(jù)進行分析,缺乏臨床驗證;二是GEO數(shù)據(jù)庫的數(shù)據(jù)缺少臨床資料信息如心率、血壓等;三是因為數(shù)據(jù)庫中只有膿毒癥和健康人的數(shù)據(jù),為此建立的模型可更好地識別膿毒癥,AUC高達1,但是現(xiàn)實中有多種炎癥反應(yīng)階段的患者,這對機器學習模型是一個挑戰(zhàn)。下一步將完善本中心膿毒癥患者數(shù)據(jù),同時也納入多種全身炎癥性疾病患者,完善膿毒癥預(yù)測模型。

4 結(jié)論

本研究利用GEO數(shù)據(jù)庫基于機器學習SVM-RFE和Lasso回歸算法構(gòu)建膿毒癥診斷模型,可很好地識別膿毒癥患者;且納入模型的基因?qū)δ摱景Y患者的預(yù)后具有指導(dǎo)意義,為臨床上早期識別和及時治療膿毒癥提供理論基礎(chǔ)。

猜你喜歡
膿毒癥基因算法
Frog whisperer
血清IL-6、APC、CRP在膿毒癥患者中的表達及臨床意義
基于MapReduce的改進Eclat算法
修改基因吉兇未卜
奧秘(2019年8期)2019-08-28 01:47:05
Travellng thg World Full—time for Rree
膿毒癥的病因病機及中醫(yī)治療進展
進位加法的兩種算法
創(chuàng)新基因讓招行贏在未來
商周刊(2017年7期)2017-08-22 03:36:21
一種改進的整周模糊度去相關(guān)算法
基因
宕昌县| 张家川| 通城县| 成都市| 界首市| 阿瓦提县| 宜城市| 沧源| 如东县| 洪雅县| 民和| 开原市| 临邑县| 合川市| 德江县| 霍城县| 闻喜县| 普陀区| 浙江省| 临江市| 玉门市| 西畴县| 德庆县| 南靖县| 交城县| 康马县| 邹城市| 萨迦县| 漳浦县| 海原县| 长丰县| 重庆市| 大连市| 天等县| 调兵山市| 鲁甸县| 岫岩| 科尔| 正定县| 寿阳县| 阿拉尔市|