基于機器學(xué)習(xí)算法術(shù)后急性腎損傷風(fēng)險預(yù)測模型建立

2023-08-03 07:20孫義竹李雨捷黃家號宋艾璘

臨床軍醫(yī)雜志 2023年7期

梁浩, 孫義竹, 李雨捷, 黃家號, 宋艾璘, 舒欣, 易斌

陸軍軍醫(yī)大學(xué)第一附屬醫(yī)院麻醉科,重慶 400038

術(shù)后急性腎損傷(postoperative acute kidney injury,PO-AKI)是圍術(shù)期常見并發(fā)癥,會導(dǎo)致血漿廢物積累及細(xì)胞外液容量和電解質(zhì)失調(diào),與病死率增加及住院時間延長相關(guān)[1-2]。有研究報道,PO-AKI的發(fā)生率為5%～42%,因研究定義和手術(shù)類型而異[3-4]。影響PO-AKI發(fā)生的危險因素包括年齡、基線估計腎小球率過濾(esti mated glomerularfiltrationrate,eGFR)、合并癥(糖尿病和高血壓等)、高危手術(shù)、敗血癥、低白蛋白血癥和貧血等。目前,PO-AKI診斷中應(yīng)用較為廣泛的是改善全球腎病預(yù)后組織(KDIGO)的診斷標(biāo)準(zhǔn),但其診斷依賴血清肌酐變化,遲滯于腎功能損害,難以早期及時發(fā)現(xiàn)[5]。多個團隊收集圍術(shù)期數(shù)據(jù),開發(fā)了PO-AKI風(fēng)險預(yù)測模型預(yù)測心臟術(shù)后AKI[6-9]。Gameiro等[10]開發(fā)PO-AKI風(fēng)險預(yù)測模型預(yù)測腹部大手術(shù)PO-AKI風(fēng)險,Lee等[11]開發(fā)PO-AKI風(fēng)險預(yù)測模型預(yù)測肝移植手術(shù)術(shù)后發(fā)生AKI的風(fēng)險。目前,機器學(xué)習(xí)被廣泛應(yīng)用于疾病預(yù)測[12-13]。有研究報道,機器學(xué)習(xí)算法在AKI預(yù)測方面性能優(yōu)于傳統(tǒng)回歸模型[14-18]。但現(xiàn)有的將機器算法應(yīng)用于PO-AKI預(yù)測領(lǐng)域主要局限于心臟手術(shù),尚缺乏全手術(shù)類型PO-AKI的風(fēng)險預(yù)測模型。本研究基于機器學(xué)習(xí)算法,構(gòu)建預(yù)測全手術(shù)類型PO-AKI的風(fēng)險預(yù)測模型,并探討模型效能,同時建立PO-AKI網(wǎng)頁預(yù)測模型,以期早期識別高?；颊?為優(yōu)化圍術(shù)期患者管理路徑提供參考?，F(xiàn)報道如下。

1 對象與方法

1.1 數(shù)據(jù)來源本研究數(shù)據(jù)來源于國內(nèi)3家不同區(qū)域大型綜合醫(yī)院開發(fā)的多中心數(shù)據(jù)庫。本研究通過3家醫(yī)院倫理委員會批準(zhǔn),包括陸軍軍醫(yī)大學(xué)附屬西南醫(yī)院(2014年1月至2019年6月,倫理審查批件號:KY201936)、四川大學(xué)附屬華西醫(yī)院(2019年5月至2020年1月,倫理審查批件號:2021-349)、中山大學(xué)附屬第一醫(yī)院(2019年6月至2019年12月,倫理審查批件號:2019-385)。

1.2 納入與排除標(biāo)準(zhǔn) 納入標(biāo)準(zhǔn):年齡≥18歲;住院手術(shù)。排除標(biāo)準(zhǔn):術(shù)前腎小球濾過率(glomerular filtration rate,GFR)輕度以上降低[定義為eGFR≤60 ml/(min·1.73 m2)];手術(shù)次數(shù)≥2次;住院期間死亡;接受腎移植受體手術(shù);接受局部麻醉或監(jiān)護麻醉;術(shù)前或術(shù)后7 d內(nèi)血肌酐檢驗值缺失;重要病歷資料缺失>30%。按照納入、排除標(biāo)準(zhǔn),共篩選出635例AKI患者納入PO-AKI組。采用病例對照研究設(shè)計方案,按陽性∶陰性=1∶3比例傾向匹配同期手術(shù)后未發(fā)生AKI的1905例患者納入非PO-AKI組。

1.3 數(shù)據(jù)收集收集手術(shù)患者常見臨床指標(biāo)。一般資料包括年齡、性別、體質(zhì)量指數(shù)(body mass index,BMI);既往史包括術(shù)前腎功能史、吸煙史、飲酒史、過敏史、輸血史、高血壓史、糖尿病史、心臟病史;手術(shù)相關(guān)信息包括麻醉方式、手術(shù)類型、手術(shù)時長和急診情況。實驗室檢驗包括白細(xì)胞計數(shù)、紅細(xì)胞計數(shù)、血小板計數(shù)、血紅蛋白、紅細(xì)胞比容、淋巴細(xì)胞計數(shù)、國際標(biāo)準(zhǔn)化比值、活化部分凝血活酶時間、凝血酶時間、白蛋白、谷丙轉(zhuǎn)氨酶、谷草轉(zhuǎn)氨酶、堿性磷酸酶、總蛋白、白球比值、總膽紅素、血肌酐、血尿素、血尿酸、血糖、鉀離子、鈉離子。

1.4 數(shù)據(jù)預(yù)處理采用多重插補方法對缺失率<30%的指標(biāo)進(jìn)行填補。對于連續(xù)性變量,用range函數(shù)縮放,處理后的數(shù)據(jù)取值0～1,以消除指標(biāo)之間不同量綱的影響。對于分類變量,行One-Hot編碼,使用N位狀態(tài)寄存器對N個狀態(tài)進(jìn)行編碼,每個狀態(tài)均有獨立的寄存器位,使之更符合機器學(xué)習(xí)計算過程,以提高計算效率。數(shù)據(jù)處理后,各指標(biāo)處于同一數(shù)量級。將納入統(tǒng)計的數(shù)據(jù)按7∶3的比例隨機拆分為建模組(n=1 778)和驗證組(n=762)。建模組中,采用Smote采樣改善數(shù)據(jù)不平衡情況,使用LASSO方法進(jìn)行特征選擇,以篩選獨立且有效的危險因素,從而確定預(yù)測指標(biāo)。

1.5 模型開發(fā) 在建模組中,輸入預(yù)測指標(biāo),使用R軟件‘caret’包中包含的6種代表性模型算法進(jìn)行模型訓(xùn)練,模型算法分別為梯度提升模型(gradient boosting model,GBM)、廣義線性模型(generalize linear model,GLM)、K-近鄰(K-nearest neighbor,KNN)、樸素貝葉斯(naive bayes,NB)、神經(jīng)網(wǎng)絡(luò)(neural network,NNET)、支持向量機(support vector machine linear,SVM)。每種模型在建立時均使用了10折交叉驗證并迭代了5次,以增強模型性能。機器學(xué)習(xí)數(shù)據(jù)預(yù)處理、模型開發(fā)、驗證由R軟件(4.3.0版本)完成。

1.6 模型評估在驗證組中,采用受試者工作特征曲線下面積(area under the receiver operating characteristic curve,AUC)、敏感度、特異度、準(zhǔn)確度和F1分?jǐn)?shù)(精確率和召回率的一種加權(quán)平均)評估各模型的預(yù)測效能。

1.7 模型網(wǎng)頁建立通過對多個模型的綜合評估,確定適合PO-AKI的最佳預(yù)測模型,并使用Python軟件的‘shinydashboard’包將模型映射到網(wǎng)頁,通過輸入患者預(yù)測指標(biāo)信息即可出現(xiàn)患PO-AKI的風(fēng)險概率,從而量化結(jié)果風(fēng)險。

2 結(jié)果

2.1 兩組患者一般資料比較兩組患者年齡、性別、吸煙史、飲酒史、過敏史、輸血史、高血壓史、糖尿病史、心臟病史、麻醉方式、手術(shù)類型、手術(shù)時長、紅細(xì)胞計數(shù)、血小板計數(shù)、血紅蛋白、紅細(xì)胞比容、淋巴細(xì)胞計數(shù)、活化部分凝血活酶時間、血清白蛋白、谷丙轉(zhuǎn)氨酶、谷草轉(zhuǎn)氨酶、堿性磷酸酶、總蛋白、白球比值、血肌酐、血糖、鈉離子比較,差異有統(tǒng)計學(xué)意義(P<0.05)。見表1。

表1 兩組患者一般資料比較/例(百分率/%)

2.2 特征變量篩選結(jié)果使用LASSO回歸分析選取特征系數(shù)在一個方差范圍內(nèi)仍不為0的變量,最終有意義的變量如下。(1)一般信息:年齡、BMI;(2)既往史:慢性腎病1期、吸煙史、飲酒史、輸血史、過敏史、糖尿病史、心臟病史;(3)手術(shù)相關(guān)指標(biāo):急診、手術(shù)類型、手術(shù)時長;(4)實驗室檢驗:白細(xì)胞計數(shù)、紅細(xì)胞計數(shù)、血小板計數(shù)、淋巴細(xì)胞計數(shù)、國際標(biāo)準(zhǔn)化比值、活化部分凝血活酶時間、凝血酶時間、谷草轉(zhuǎn)氨酶、堿性磷酸酶、總蛋白、白球比值、總膽紅素、血肌酐、血尿素、血尿酸、血糖、鉀離子、鈉離子、紅細(xì)胞比容。見表2。

表2 LASSO特征選擇結(jié)果及系數(shù)

2.3 模型預(yù)測性能及驗證結(jié)果基于NNET算法開發(fā)的模型在驗證組獲得了最佳的鑒別能力(AUC為0.942,95%可信區(qū)間0.926～0.958)和最佳的F1分?jǐn)?shù)(0.759)。模型綜合性能比較見表3。6種機器學(xué)習(xí)算法模型在驗證組的受試者工作特征曲線見圖1。

圖1 6種機器學(xué)習(xí)模型在驗證組的受試者工作特征曲線圖

表3 機器學(xué)習(xí)預(yù)測模型綜合性能比較

2.4 網(wǎng)頁模型建立基于NNET算法開發(fā)的預(yù)測模型被映射到網(wǎng)頁(https://lh123.shinyapps.io/nnet1poaki/),在預(yù)測網(wǎng)頁界面輸入患者術(shù)中特征信息后,點擊預(yù)測即可出現(xiàn)該患者發(fā)生PO-AKI的概率。見圖2。

圖2 基于NNET模型的PO-AKI預(yù)測網(wǎng)頁

3 討論

PO-AKI是常見的圍術(shù)期并發(fā)癥,此類患者住院時間更長,醫(yī)療費用更高,且更可能進(jìn)展成為慢性腎病。有研究報道,輕微的PO-AKI與患者的存活率降低有關(guān)[19]。PO-AKI病理生理機制復(fù)雜,目前尚未完全清楚,已知低灌注、缺血再灌注損傷、神經(jīng)激素激活、炎癥、腎毒素暴露可能與PO-AKI有關(guān)[20]。機器學(xué)習(xí)算法在醫(yī)學(xué)影像、疾病的分類和預(yù)測、藥物反應(yīng)和治療策略等方面被廣泛應(yīng)用[21]。

有研究表明,結(jié)合機器學(xué)習(xí)可以實現(xiàn)早期預(yù)測AKI[5]。機器學(xué)習(xí)算法已經(jīng)應(yīng)用于ICU患者[22]、住院患者[23]、燒傷患者[24-25]、肝腎綜合征患者[26]、行冠脈造影術(shù)患者[27]后等人群AKI風(fēng)險預(yù)測,但仍缺乏全手術(shù)類型PO-AKI方面的研究。

本研究基于已發(fā)表的國內(nèi)外文獻(xiàn),篩選出研究相關(guān)的指標(biāo),再經(jīng)過LASSO方法進(jìn)行特征選擇并且進(jìn)行交叉驗證,結(jié)果發(fā)現(xiàn),年齡、BMI、吸煙史、飲酒史、過敏史、輸血史、糖尿病史、心臟病史、慢性腎病1期、手術(shù)時長、急診手術(shù)、手術(shù)類型、白細(xì)胞計數(shù)、紅細(xì)胞計數(shù)、血小板計數(shù)、紅細(xì)胞比容、國際標(biāo)準(zhǔn)化比值、活化部分凝血活酶時間、凝血酶時間、谷草轉(zhuǎn)氨酶、堿性磷酸酶、總蛋白、白球比值、總膽紅素、血肌酐、血尿素、血尿酸、血糖、鉀離子、鈉離子可能與PO-AKI的發(fā)生有關(guān)。其中,血肌酐水平是PO-AKI的診斷指標(biāo),也是AKI程度的分期標(biāo)準(zhǔn),可用于指導(dǎo)AKI治療[28]。多項研究表明,年齡、BMI、手術(shù)時長、急診是AKI的獨立危險因素[29-31]。有研究表明,糖尿病、基線eGFR是PO-AKI的危險因素[30]。吸煙史、心臟病史、紅細(xì)胞計數(shù)、血尿酸與AKI的關(guān)系也有相關(guān)研究闡明[31-33]。

本研究基于GBM、GLM、KNN、NB、NNET及SVM算法構(gòu)建了住院手術(shù)PO-AKI的風(fēng)險預(yù)測模型,并比較了這6種模型的預(yù)測效能。目前,這6種算法是應(yīng)用較為廣泛的集成學(xué)習(xí)算法。GBM能精確地找到分割點,但數(shù)據(jù)對計算機空間的消耗大;GLM可解釋性較強,但當(dāng)某些特征相關(guān)性較強時,其他特征的重要性將被削弱;KNN理論簡單,新數(shù)據(jù)可以直接加入數(shù)據(jù)集而不必進(jìn)行重新訓(xùn)練,但在樣本不平衡時,預(yù)測偏差較大;NB在處理大規(guī)模的訓(xùn)練集時能有效選出相對較少的特征數(shù),但在樣本屬性有關(guān)聯(lián)時其效果較差;NNET分類準(zhǔn)確度高,學(xué)習(xí)能力極強,但在學(xué)習(xí)過程中無法觀察中間結(jié)果,存在黑盒效應(yīng);SVM在處理非線性、小樣本及二分類數(shù)據(jù)時有優(yōu)勢,但是對缺失數(shù)據(jù)敏感且在大規(guī)模樣本中難以實施[21,34-35]。本研究中,KNN模型AUC為0.793,敏感度為74.2%,特異度為70.6%,F1分?jǐn)?shù)為0.565,準(zhǔn)確度為71.5%,在6種模型中預(yù)測效能最差;而NNET模型AUC為0.942,敏感度為85.3%,特異度為86.9%,F1分?jǐn)?shù)為0.759,準(zhǔn)確度為86.5%,該模型區(qū)分度好。本研究存在局限性:首先,數(shù)據(jù)集雖然來自3家國內(nèi)大型綜合醫(yī)院,但均為回顧性信息;其次,本研究使用了31個特征指標(biāo)構(gòu)建模型和預(yù)測網(wǎng)頁,應(yīng)用于臨床時不夠簡便;最后,由于病例資料丟失,未納入美國麻醉醫(yī)師協(xié)會分級、術(shù)中尿量、手術(shù)失血量、術(shù)中血壓等特征。因此,后續(xù)應(yīng)開展前瞻性、篩選指標(biāo)數(shù)量精簡且納入更多術(shù)中相關(guān)特征的研究。

綜上所述,本研究采用AKI最新定義(KDIGO標(biāo)準(zhǔn))基于多個機器學(xué)習(xí)算法用多中心數(shù)據(jù)開發(fā)PO-AKI預(yù)測模型,綜合比較了各模型的預(yù)測性能和臨床實用性,最終篩選出了基于NNET算法開發(fā)的最佳預(yù)測模型,搭建預(yù)測網(wǎng)頁,以量化PO-AKI風(fēng)險,對手術(shù)患者進(jìn)行早期風(fēng)險分層,為指導(dǎo)圍術(shù)期AKI評估和預(yù)防性治療提供可能。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于機器學(xué)習(xí)算法術(shù)后急性腎損傷風(fēng)險預(yù)測模型建立

1 對象與方法

2 結(jié)果

3 討論