顧楊,劉勛,區(qū)綺云,張娜,李涵,秦偉強(qiáng),李莉*
膿毒癥是一種常見(jiàn)的危及生命的綜合征,是全球發(fā)病率和死亡率的主要原因。由于治療費(fèi)用的增加,它已經(jīng)成為一個(gè)主要的全球衛(wèi)生負(fù)擔(dān),并造成住院時(shí)間及次數(shù)顯著增加[1]??焖俚卦u(píng)估膿毒癥的嚴(yán)重程度、死亡風(fēng)險(xiǎn)和治療策略的及時(shí)調(diào)整在降低膿毒癥的總體死亡率和成本負(fù)擔(dān)方面將會(huì)發(fā)揮重要作用。膿毒癥的根本發(fā)病環(huán)節(jié)及作用機(jī)制錯(cuò)綜復(fù)雜,尤其是免疫機(jī)制在膿毒癥的發(fā)生發(fā)展中尤為重要。比如免疫細(xì)胞—T、B 淋巴細(xì)胞凋亡以及骨髓來(lái)源的抑制細(xì)胞(MDSC)是膿毒癥患者免疫抑制發(fā)展的主要貢獻(xiàn)者[2,3]。趨化因子CX3CL1 在膿毒性休克的患者中表達(dá)升高,而其受體CX3CR1 下降的增加則與患者預(yù)后不良直接相關(guān)[4]。除此之外,調(diào)控免疫檢查點(diǎn)在膿毒癥誘導(dǎo)的免疫抑制中亦扮演重要角色,如免疫檢查點(diǎn)蛋白程序性細(xì)胞死亡-1 的表達(dá)增強(qiáng)會(huì)不同程度地造成T 細(xì)胞凋亡、淋巴細(xì)胞減少及白細(xì)胞吞噬能力受損等[5]。因此,免疫細(xì)胞和免疫微環(huán)境在膿毒癥演變進(jìn)程中的作用越來(lái)越受到科學(xué)領(lǐng)域的重視。近年來(lái),人工智能在預(yù)測(cè)各種疾病預(yù)后的應(yīng)用中越來(lái)越多,并且有研究顯示深度學(xué)習(xí)作為人工智能的一個(gè)子學(xué)科,它能夠利用數(shù)據(jù)和算法來(lái)模擬人類學(xué)習(xí),并且?guī)椭幚泶罅繑?shù)據(jù),洞察有意義的信息模式,從而協(xié)助診斷、預(yù)測(cè)和治療膿毒癥[6]。本研究借助深度學(xué)習(xí)開(kāi)發(fā)基于膿毒癥免疫細(xì)胞浸潤(rùn)豐度的臨床預(yù)測(cè)模型,希望為提高臨床醫(yī)師評(píng)估膿毒癥患者預(yù)后的能力帶來(lái)新的契機(jī)。
本研究從GEO 基因表達(dá)數(shù)據(jù)庫(kù)中搜索含有28 天生存狀態(tài)的膿毒癥患者的數(shù)據(jù)集,最終選取前瞻性隊(duì)列研究(MARS 研究,GSE65682)[7],將患者以9∶1 的比例隨機(jī)分為訓(xùn)練組和驗(yàn)證組,同時(shí)進(jìn)行基因表達(dá)矩陣的數(shù)據(jù)質(zhì)控,使用主成分分析進(jìn)行批次效應(yīng)的去除,以及剔除離群值。本研究遵循TRIPOD 報(bào)告指南開(kāi)發(fā)和驗(yàn)證模型,已通過(guò)中山大學(xué)孫逸仙紀(jì)念醫(yī)院倫理委員會(huì)的倫理批準(zhǔn)(倫理號(hào)為:SYSEC-KY-KS-2020-122)。
我們基于外周血基因表達(dá)量,使用gsvaR 包中的ssGSEA 算法計(jì)算膿毒癥患者個(gè)體外周血免疫細(xì)胞的浸潤(rùn)豐度[8]。ssGSEA 是基于免疫細(xì)胞的特定基因組,將基因表達(dá)譜轉(zhuǎn)化為膿毒癥個(gè)體患者中免疫細(xì)胞群的浸潤(rùn)豐度,以此得到表達(dá)矩陣,其中列是每個(gè)免疫細(xì)胞的ssGSEA 分?jǐn)?shù),行是患者ID。將每列的免疫細(xì)胞豐度作為特征變量,聯(lián)合28 d生存狀態(tài),以及生存時(shí)間作為生存分析模型的輸入層。
在本研究中,將DeepSurv[9]用于分析患者的28 d 生存率,這是一種可以預(yù)測(cè)個(gè)體生存風(fēng)險(xiǎn)值的深度學(xué)習(xí)算法。采用Python 3.7.11 中的Tensor-Flow 2.2.0 框架搭建深度生存分析環(huán)境,此后在生存分析中使用深度前饋神經(jīng)網(wǎng)絡(luò)和Cox 比例風(fēng)險(xiǎn)模型,從而構(gòu)建了膿毒癥的深度神經(jīng)網(wǎng)絡(luò)生存模型(sepsis DeepSurv Net,seDNT)。seDNT 模型包含一個(gè)特征輸入層,輸入層節(jié)點(diǎn)數(shù)為預(yù)后影響因素的個(gè)數(shù);一個(gè)含有2 層多節(jié)點(diǎn)結(jié)構(gòu)的隱藏層,該隱藏層具有完全連接的前饋神經(jīng)網(wǎng)絡(luò),該隱藏層是模型的關(guān)鍵,需要調(diào)節(jié)相關(guān)參數(shù),關(guān)鍵參數(shù)有學(xué)習(xí)率、學(xué)習(xí)率衰減、激活函數(shù)選擇、正則化及優(yōu)化方法等;模型的最后是使用對(duì)數(shù)風(fēng)險(xiǎn)函數(shù)計(jì)算個(gè)體的風(fēng)險(xiǎn)評(píng)分,并將該評(píng)分作為一個(gè)單節(jié)點(diǎn)的輸出層。得到輸出層的風(fēng)險(xiǎn)評(píng)分后,根據(jù)受試者工作特征(receiver operating characteristic,ROC)曲線計(jì)算最佳截?cái)嘀?,將患者分為高風(fēng)險(xiǎn)評(píng)分和低風(fēng)險(xiǎn)評(píng)分的亞組,應(yīng)用Kaplan-Meier 生存分析評(píng)估seDNT 模型預(yù)測(cè)膿毒癥患者14 天、28 天生存的風(fēng)險(xiǎn)預(yù)測(cè),以及ROC 曲線下的面積(area under the ROC curve,AUC)進(jìn)行模型預(yù)測(cè)性能的評(píng)價(jià)。
根據(jù)風(fēng)險(xiǎn)評(píng)分高低分組,使用R 軟件的limma、ggplot2 包進(jìn)行基因的差異表達(dá)分析及可視化,使用clusterProfiler 包基于基因本體論(Gene Ontology,GO)及京都基因和基因組百科全書(shū)(Kyoto Encyclopedia for Genes and Genomes,KEGG)進(jìn)行基因集的功能注釋及通路富集分析,進(jìn)一步了解seDNT 模型內(nèi)在機(jī)制。最后,將免疫檢查點(diǎn)[10]、趨化因子[11]與免疫細(xì)胞、風(fēng)險(xiǎn)評(píng)分進(jìn)行相關(guān)性分析,更深層次地增加深度生存模型的可解釋性。
計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差()表示;分類數(shù)據(jù)以n(%)表示,組間比較采用χ2檢驗(yàn);采用Kaplan-Meier 法計(jì)算生存率,組間比較采用log-rank 檢驗(yàn)。在訓(xùn)練隊(duì)列中采用Cox 比例風(fēng)險(xiǎn)回歸分析影響生存的因素,計(jì)算風(fēng)險(xiǎn)比(hazard ratio,HR)及其對(duì)應(yīng)的95%置信區(qū)間(confidence interval,CI)。采用R 4.1.2 軟件中的survival 包構(gòu)建多因素Cox 回歸模型。本研究以雙側(cè)P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
這項(xiàng)研究初步篩選了802 位膿毒血癥患者,每位患者具有24 646 個(gè)核酸探針,預(yù)處理后獲得包含11 503 個(gè)基因的表達(dá)矩陣,對(duì)表達(dá)矩陣進(jìn)行過(guò)濾和樣本聚類以去除批次效應(yīng),剔除數(shù)據(jù)集中顯著的離群樣本,最終得到符合標(biāo)準(zhǔn)479 例膿毒血癥患者,將其以9:1 的比例隨機(jī)分為訓(xùn)練組和驗(yàn)證組,其中訓(xùn)練組由431 名膿毒血癥患者組成,驗(yàn)證組由48 名膿毒血癥患者組成。
基于431 名膿毒血癥患者,通過(guò)ssGSEA 計(jì)算28 個(gè)免疫細(xì)胞豐度,根據(jù)其免疫細(xì)胞豐度進(jìn)行評(píng)分構(gòu)建seDNT 模型,seDNT 模型最優(yōu)網(wǎng)絡(luò)設(shè)置:輸入層有28個(gè)節(jié)點(diǎn),隱藏層有兩層(第一隱藏層有32個(gè)節(jié)點(diǎn),第二隱藏層有16 個(gè)節(jié)點(diǎn)),輸出層有1 個(gè)節(jié)點(diǎn);學(xué)習(xí)率為0.01,學(xué)習(xí)率衰減為1.0(圖1)。根據(jù)免疫細(xì)胞豐度風(fēng)險(xiǎn)評(píng)分模型計(jì)算患者個(gè)體的風(fēng)險(xiǎn)評(píng)分,并根據(jù)最佳的截?cái)嘀?,將患者分為低風(fēng)險(xiǎn)評(píng)分組(101人)與高風(fēng)險(xiǎn)評(píng)分組(330人),在訓(xùn)練組中,風(fēng)險(xiǎn)評(píng)分(deepscore)與28 天生存期具有良好相關(guān)性,其在預(yù)測(cè)膿毒癥患者14 天和28 天生存期的AUC 分別為0.912 和0.936,其風(fēng)險(xiǎn)比(HR)=0.022,95%CI=0.013~0.038,P<0.005(圖2),這表明在預(yù)測(cè)膿毒癥患者28 天生存率方面差異有統(tǒng)計(jì)學(xué)意義。在驗(yàn)證組中,同樣應(yīng)用seDNT 模型計(jì)算風(fēng)險(xiǎn)評(píng)分,發(fā)現(xiàn)deepscore 與28 天生存期相關(guān)(14 天和28 天生存期的AUC 分別為0.822 和0.777),其風(fēng)險(xiǎn)比(HR)=0.07,95%CI=0.008~0.063,P<0.005(圖3)。
圖1 seDNT 模型框架
圖2 訓(xùn)練組的KM 生存曲線和AUC
圖3 驗(yàn)證組的KM 生存曲線和AUC
同樣基于訓(xùn)練隊(duì)列431 名膿毒血癥患者,將28 個(gè)免疫細(xì)胞做生存分析曲線,根據(jù)單因素及多因素篩選最終選出6 個(gè)免疫細(xì)胞(P<0.05)(圖4)用于構(gòu)建Cox 回歸模型(圖5)。根據(jù)相應(yīng)的回歸系數(shù),建立風(fēng)險(xiǎn)評(píng)分方程。Cox 模型方程:coxscore=活化樹(shù)突狀細(xì)胞*0.341-未成熟B 細(xì)胞*1.363-巨噬細(xì)胞*0.707+肥大細(xì)胞*0.56-調(diào)節(jié)性T 細(xì)胞*0.716。
圖4 預(yù)測(cè)膿毒癥患者生存的單變量和多變量Cox 回歸分析的森林圖
圖5 6 個(gè)顯著的免疫細(xì)胞的KM 生存圖
將seDNT 模型和Cox 模型中的deepscore 和coxscore 的28 天生存期計(jì)算AUC,其AUC 分別為0.807 和0.705,深度學(xué)習(xí)算法seDNT 模型的AUC優(yōu)于Cox 比例回歸風(fēng)險(xiǎn)模型(均P<0.05)(圖6),這表明seDNT 模型在預(yù)測(cè)膿毒血癥患者28 天生存率方面具有良好的靈敏度和特異性,且seDNT 模型優(yōu)于常規(guī)的多因素Cox 模型評(píng)分預(yù)測(cè)患者死亡率及預(yù)后評(píng)價(jià)指標(biāo)。
圖6 比較seDNT 與COX 比例風(fēng)險(xiǎn)模型在AUC 方面的預(yù)測(cè)性能
本研究根據(jù)免疫細(xì)胞豐度計(jì)算deepscore 從而建立seDNT 模型,其模型可良好預(yù)測(cè)患者膿毒癥28 天生存率,這說(shuō)明了該模型預(yù)測(cè)膿毒癥患者生存與免疫微環(huán)境特征明顯相關(guān),可進(jìn)一步探討差異表達(dá)基因及其相關(guān)生物標(biāo)志物分子和免疫通路等,以及尋找deepscore 與免疫檢查點(diǎn)及趨化因子相關(guān)性。
故將訓(xùn)練隊(duì)列中431 例膿毒癥患者根據(jù)seDNT模型計(jì)算每位患者的deepscore,并根據(jù)ROC 曲線取最佳截?cái)嘀担瑢⒒颊叻譃閐eepscore 高(102)/低(329)表達(dá)組。從中篩選出455 個(gè)差異基因,包括285 個(gè)上調(diào)基因和170 個(gè)下調(diào)基因。進(jìn)一步采用火山圖對(duì)該數(shù)據(jù)進(jìn)行可視化處理,其中上調(diào)基因主要有TNFSF12、CALHM2、TGFBI、FBP1、CX3CR1,下調(diào)基因主要有TUBG2、ELL2、TUBG1、TMEM57、BCAM(圖7)。
圖7 訓(xùn)練組中低風(fēng)險(xiǎn)和高風(fēng)險(xiǎn)表型之間的DEGs 火山圖
選擇膿毒血癥患者中顯著升高的285 個(gè)差異基因進(jìn)行GO 基因功能注釋,GO 富集分析差異基因的生物學(xué)過(guò)程(biological process,BP),提示它們的功能可能主要富集在以下幾個(gè)方面:細(xì)胞殺傷、白細(xì)胞的粘附、T 細(xì)胞活化、T 細(xì)胞活化的調(diào)節(jié)等;細(xì)胞組分(cellular component,CC)變化的差異基因主要富集主要在初級(jí)溶酶體、嗜苯胺藍(lán)粒、特異性顆粒等;分子功能(molecular function,MF)變化的差異基因主要富集于調(diào)節(jié)蛋白激酶活性、MHC 蛋白結(jié)合、激酶調(diào)節(jié)活性等功能上(圖8)。其次通過(guò)對(duì)KEGG 信號(hào)通路的富集分析可顯示:P53 信號(hào)通路、卟啉代謝、氮代謝等(圖9)。基于GO 基因集進(jìn)行GSEA(基因集富集)分析,適應(yīng)性免疫應(yīng)答、細(xì)胞表面受體信號(hào)通路、免疫應(yīng)答、固有免疫應(yīng)答、免疫反應(yīng)調(diào)節(jié)為GO 富集的主要生物學(xué)功能(圖10)。
圖8 GO 富集分析(生物過(guò)程[BP],細(xì)胞成分[CC]和分子功能)
圖9 KEGG 基因集富集分析
圖10 GSEA 富集分析顯示免疫通路顯著富集
將訓(xùn)練隊(duì)列中431 例膿毒血癥患者進(jìn)一步尋找免疫細(xì)胞浸潤(rùn)與免疫檢查點(diǎn)相關(guān)性得到如圖所示(圖11),將免疫檢查點(diǎn)與deepscore 進(jìn)行相關(guān)性分析,發(fā)現(xiàn)免疫檢查點(diǎn)CD160 與deepscore 相關(guān)性最高,其兩者相關(guān)性曲線相關(guān)系數(shù)r=-0.16(P<0.05)(圖12),說(shuō)明CD160 與deepscore 呈負(fù)相關(guān),因此CD160 與活化CD8 T 細(xì)胞水平高的患者總生存期延長(zhǎng)。繼續(xù)尋找趨化因子與免疫細(xì)胞浸潤(rùn)之間相關(guān)性如圖所示(圖13),將趨化因子與deepscore 進(jìn)行相關(guān)性分析,發(fā)現(xiàn)差異基因CX3CR1 與deepscore 相關(guān)性最高,其兩者相關(guān)性曲線相關(guān)系數(shù)r=-0.18(P<0.05)(圖14),說(shuō)明CX3CR1 與deepscore 呈負(fù)相關(guān),CX3CR1 與MDSC 高表達(dá)患者28天生存期較長(zhǎng)。
圖11 免疫檢查點(diǎn)與免疫細(xì)胞及deepscore 的相關(guān)性熱圖
圖12 顯示免疫檢查點(diǎn)相關(guān)性排序的棒棒糖圖
圖13 趨化因子與免疫細(xì)胞及deepscore 的相關(guān)性熱圖
圖14 顯示趨化因子相關(guān)性排序的棒棒糖圖
膿毒癥是臨床危重癥患者常見(jiàn)并發(fā)癥之一,與機(jī)體免疫功能及代謝異常有關(guān),細(xì)胞因子風(fēng)暴被認(rèn)為是引發(fā)膿毒癥炎癥的原因,常常識(shí)別和誘導(dǎo)復(fù)雜的細(xì)胞內(nèi)信號(hào)通路,激活這些多種信號(hào)通路最終導(dǎo)致幾種常見(jiàn)的基因表達(dá),這些基因涉及炎癥、適應(yīng)性免疫和細(xì)胞代謝等[10]。與此同時(shí),各種黏附分子和趨化因子隔離以及激活中性粒細(xì)胞進(jìn)入靶器官,可進(jìn)一步加重炎癥和炎性損傷。因此可以基于膿毒癥相關(guān)基因、信號(hào)通路、免疫細(xì)胞、免疫檢查點(diǎn)及趨化因子等進(jìn)行生存預(yù)測(cè)。本研究基于深度學(xué)習(xí)算法DeepSurv 根據(jù)免疫細(xì)胞豐度建立了可預(yù)測(cè)膿毒血癥患者生存預(yù)后風(fēng)險(xiǎn)評(píng)分模型。無(wú)論是在訓(xùn)練隊(duì)列還是在驗(yàn)證隊(duì)列中,seDENT 預(yù)測(cè)膿毒癥患者28 天生存率方面具有顯著統(tǒng)計(jì)學(xué)差異,同時(shí)其模型具有良好的靈敏度及特異性。
膿毒癥一直是臨床所面臨的一個(gè)重要問(wèn)題,早期識(shí)別、及時(shí)治療對(duì)膿毒癥意義重大,目前有許多膿毒癥相關(guān)生存預(yù)測(cè)模型,如基于調(diào)節(jié)性T 細(xì)胞中單個(gè)免疫檢查點(diǎn)PD-1 的過(guò)度表達(dá)可以預(yù)測(cè)膿毒癥患者預(yù)后,其驗(yàn)證膿毒癥患者28天死亡率能力(AUC=0.792)[12],其預(yù)測(cè)能力仍比我們建立seDNT模型預(yù)測(cè)能力低,這表明膿毒癥其發(fā)病機(jī)制復(fù)雜,尤其是免疫機(jī)制,我們采用檢測(cè)多個(gè)免疫細(xì)胞豐度,并且驗(yàn)證膿毒癥是多個(gè)免疫細(xì)胞、免疫檢查點(diǎn)及差異基因共同參與。而并非單獨(dú)一個(gè)指標(biāo)所涵蓋,這也表明我們seDNT模型更具有全面性和準(zhǔn)確性。
膿毒癥其特征是同時(shí)出現(xiàn)的過(guò)度炎癥與免疫抑制之間發(fā)生不平衡。與過(guò)度炎癥有關(guān)的不同細(xì)胞類型和中介網(wǎng)絡(luò)中包括白細(xì)胞(中性粒細(xì)胞、巨噬細(xì)胞、自然殺傷細(xì)胞)、內(nèi)皮細(xì)胞、細(xì)胞因子、補(bǔ)體產(chǎn)物等。其免疫抑制涉及不同的細(xì)胞類型和特征,與免疫細(xì)胞凋亡增強(qiáng)、T 細(xì)胞衰竭、通過(guò)表觀遺傳學(xué)改變細(xì)胞重編程以及活化細(xì)胞表面分子表達(dá)減少有關(guān)。細(xì)胞凋亡主要發(fā)生在CD4+T 細(xì)胞、CD8+T 細(xì)胞、B 細(xì)胞、自然殺傷(NK)細(xì)胞中[5]。最近的研究表明,調(diào)控免疫檢查點(diǎn)在膿毒癥誘導(dǎo)的免疫抑制中起重要作用,其中CD160 主要表達(dá)在NK 細(xì)胞、T 細(xì)胞以及腸內(nèi)皮細(xì)胞表達(dá),尤其是在具有高殺傷活性的NK 細(xì)胞中高表達(dá),其中包括NKT 細(xì)胞、CD8+CD28 調(diào)節(jié)性T 細(xì)胞等[13]。
除此之外,還有一些文獻(xiàn)暗示其他檢查點(diǎn)調(diào)節(jié)因子在免疫抑制中的作用,如T 細(xì)胞上表達(dá)結(jié)合B 細(xì)胞活化抗原B7-2(CD86)的檢查點(diǎn)調(diào)節(jié)因子等[14]。當(dāng)膿毒癥患者發(fā)生過(guò)度炎癥,趨化因子將會(huì)與其受體結(jié)合,趨化白細(xì)胞至炎癥部位,在炎癥過(guò)程中發(fā)揮中心作用。當(dāng)細(xì)胞因子和趨化因子的暴發(fā)性釋放引起的廣泛炎癥時(shí),將會(huì)導(dǎo)致器官損傷。有研究表明,趨化因子CX3CR1 可以通過(guò)調(diào)節(jié)炎性因子釋放以及免疫功能紊亂參與膿毒癥發(fā)生、發(fā)展的病理生理過(guò)程[15-17]。
本研究仍存在一定的局限性,應(yīng)用深度學(xué)習(xí)算法DeepSurv 構(gòu)建生存預(yù)測(cè)模型,但并未進(jìn)行外部隊(duì)列驗(yàn)證,后續(xù)可增加外部隊(duì)列驗(yàn)證對(duì)以上模型進(jìn)行獨(dú)立的分析以評(píng)估其準(zhǔn)確性,并且檢驗(yàn)其模型在當(dāng)前實(shí)踐中具有有效性,此外,需要進(jìn)一步實(shí)驗(yàn)來(lái)驗(yàn)證本文所探討與膿毒癥相關(guān)基因、信號(hào)通路、免疫細(xì)胞、免疫檢查點(diǎn)及趨化因子等相關(guān)作用及其聯(lián)系。
綜上所述,本研究基于深度學(xué)習(xí)算法DeepSurv建立可預(yù)測(cè)膿毒癥患者生存預(yù)后的seDNT 模型,預(yù)測(cè)變量根據(jù)免疫細(xì)胞豐度較Cox 預(yù)測(cè)模型可以更好地預(yù)測(cè)膿毒血癥患者28 天生存率??梢栽缙谠\斷、積極識(shí)別其嚴(yán)重程度,以便于臨床醫(yī)師及早干預(yù),這對(duì)膿毒癥患者的生存預(yù)后有著重大意義。同時(shí)也證明了深度學(xué)習(xí)算法可以提供一種新穎的預(yù)測(cè)模型,通過(guò)預(yù)測(cè)模型能更快速、更好地幫助臨床醫(yī)師作出治療決策。