鄔金鳴 孫海霞 王嘉陽 錢 慶
(1.中國(guó)醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院醫(yī)學(xué)信息研究所醫(yī)學(xué)數(shù)據(jù)共享研究室,北京 100020; 2.中國(guó)醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院醫(yī)學(xué)信息研究所醫(yī)學(xué)智能計(jì)算研究室,北京 100020;3.中國(guó)醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院醫(yī)學(xué)信息研究所,北京 100020)
急性腎損傷(acute kidney injury, AKI)是一種發(fā)病率高、病死率高、臨床不良事件發(fā)生率高的危急重病癥[1],在重癥監(jiān)護(hù)病房(intensive care unit,ICU)中全球發(fā)病率為5.7%~67%[2],病死率高達(dá)50%[3]。AKI發(fā)病群體日趨老齡化,隨年齡增長(zhǎng), 人體腎臟結(jié)構(gòu)和功能老化, AKI發(fā)生率也顯著增加[4]。國(guó)內(nèi)一項(xiàng)調(diào)查[5]顯示, 60歲以上AKI患者占院內(nèi)AKI總數(shù)的52.2%。
急性腎損傷臨床實(shí)踐指南(kidney disease improving global outcomes,KDIGO)[6]指出,相較于確診AKI后再治療,事先識(shí)別高風(fēng)險(xiǎn)患者,提前干預(yù)將優(yōu)化預(yù)后結(jié)果。特別對(duì)于重癥患者,進(jìn)入ICU的最初幾個(gè)小時(shí)是AKI診療的黃金時(shí)間,這段時(shí)間的診斷和用藥可以影響AKI的發(fā)生和發(fā)展[7],早期干預(yù)可縮短ICU住院時(shí)間,降低病死率。理想情況下應(yīng)實(shí)時(shí)檢測(cè)和監(jiān)控患者腎功能,以便發(fā)生AKI時(shí)即刻診斷,及時(shí)調(diào)整藥物劑量和臨床治療。目前,AKI的診斷主要基于血清肌酐(serum creatinine,Scr)的上升或尿量的下降,但兩者皆具有明顯局限性,老年患者尿量常受利尿劑、尿路梗阻等因素影響,Scr也并非反映腎功能變化的敏感指標(biāo),因此可能導(dǎo)致延遲診斷[8]。
近年來,隨著醫(yī)院信息系統(tǒng)的快速發(fā)展,大量蘊(yùn)含高價(jià)值信息的電子病歷數(shù)據(jù)得以累積,機(jī)器學(xué)習(xí)等數(shù)據(jù)挖掘技術(shù)也愈發(fā)成熟,這為基于數(shù)據(jù)驅(qū)動(dòng)的方法預(yù)測(cè)患者AKI風(fēng)險(xiǎn)提供了可能。AKI風(fēng)險(xiǎn)預(yù)測(cè)是指預(yù)測(cè)個(gè)體在未來某個(gè)時(shí)期發(fā)生發(fā)展AKI(或相關(guān)事件)的風(fēng)險(xiǎn)概率,即根據(jù)某個(gè)人群定義,例如ICU老年人群,針對(duì)某個(gè)預(yù)測(cè)目標(biāo),如AKI發(fā)病,設(shè)定特定的時(shí)間窗口,包括數(shù)據(jù)采集時(shí)間窗和預(yù)測(cè)時(shí)間窗,預(yù)測(cè)目標(biāo)的發(fā)生概率。依此識(shí)別出高風(fēng)險(xiǎn)患者,可更好地對(duì)患者提供干預(yù)和護(hù)理,進(jìn)而改善患者預(yù)后,特別是若在AKI的早期可逆轉(zhuǎn)階段能夠及時(shí)發(fā)現(xiàn),從而可預(yù)防其進(jìn)展為腎衰竭以及避免后期需要的透析治療[6]。
因此,本研究旨在基于電子病歷,面向重癥老年患者進(jìn)行AKI連續(xù)風(fēng)險(xiǎn)預(yù)測(cè),探索符合臨床應(yīng)用場(chǎng)景的早期連續(xù)動(dòng)態(tài)預(yù)測(cè)框架的可行性,識(shí)別最早有效預(yù)測(cè)時(shí)間窗和數(shù)據(jù)采集策略,以促進(jìn)機(jī)器學(xué)習(xí)在臨床決策支持中的應(yīng)用。具體為每隔6 h采集患者入ICU后的電子病歷數(shù)據(jù),分別基于當(dāng)前單位時(shí)間數(shù)據(jù)和累積數(shù)據(jù),利用邏輯回歸(Logistic regression,LR)、隨機(jī)森林(random forest, RF)、支持向量機(jī)(support vector machines,SVM)和輕量梯度提升機(jī)(light gradient boosting machine,LightGBM)4種經(jīng)典機(jī)器方法建模連續(xù)預(yù)測(cè)重癥老年患者未來48 h的AKI發(fā)病風(fēng)險(xiǎn)。
1.1.1 面向不同人群的AKI預(yù)測(cè)研究
為識(shí)別患者AKI發(fā)病風(fēng)險(xiǎn)以指導(dǎo)臨床決策,諸多研究面向不同人群基于電子病歷數(shù)據(jù)構(gòu)建AKI預(yù)測(cè)模型。如Kristovic等[9]應(yīng)用邏輯回歸方法構(gòu)建了心臟手術(shù)后患者AKI預(yù)測(cè)模型,且基于KDIGO標(biāo)準(zhǔn)[6]對(duì)不同AKI分期進(jìn)行了預(yù)測(cè),模型曲線下面積(area under curve,AUC)達(dá)到0.78;Lee等[10]應(yīng)用7種機(jī)器學(xué)習(xí)方法與邏輯回歸方法構(gòu)建肝移植后AKI預(yù)測(cè)模型,對(duì)比發(fā)現(xiàn)梯度提升機(jī)(gradient boosting machine,GBM)實(shí)現(xiàn)最佳預(yù)測(cè)性能;Kate等[11]應(yīng)用邏輯回歸、支持向量機(jī)、決策樹和樸素貝葉斯方法構(gòu)建住院老年患者的AKI預(yù)測(cè)模型,發(fā)現(xiàn)邏輯回歸效果最好,但AUC僅為0.66;Flechet等[12]應(yīng)用隨機(jī)森林方法開發(fā)面向成人ICU患者的在線AKI預(yù)測(cè)模型。
1.1.2 不同預(yù)測(cè)策略的AKI預(yù)測(cè)研究
現(xiàn)有研究的預(yù)測(cè)時(shí)間點(diǎn)多設(shè)置在AKI發(fā)病前n天,如Mohamadlou等[13]應(yīng)用提升樹(boosted ensembles of decision trees)方法在AKI發(fā)病前12、24、48、72 h進(jìn)行預(yù)測(cè)。但該建模過程確定評(píng)估測(cè)試集時(shí)應(yīng)用了未知的發(fā)病時(shí)間,不可避免地導(dǎo)致實(shí)驗(yàn)結(jié)果優(yōu)于臨床應(yīng)用。相比之下將患者入院第n天作為預(yù)測(cè)節(jié)點(diǎn)較能符合臨床應(yīng)用場(chǎng)景,如Sanchez-Pinto等[14]應(yīng)用重癥兒童患者入ICU后的前12 h的數(shù)據(jù)進(jìn)行AKI早期預(yù)測(cè),Zimmerman等[15]、Sun等[16]、Li等[17]應(yīng)用成年患者入ICU后的前24 h的數(shù)據(jù)預(yù)測(cè)未來48 h AKI發(fā)病風(fēng)險(xiǎn)。然而,更為符合臨床應(yīng)用需求的是不拘泥于固定時(shí)間點(diǎn)的連續(xù)動(dòng)態(tài)預(yù)測(cè),即指運(yùn)用患者入院期間隨時(shí)間更新的生命體征和實(shí)驗(yàn)室值等來連續(xù)預(yù)測(cè)患者AKI風(fēng)險(xiǎn),如Chiofolo等[18]使用隨機(jī)森林開發(fā)了AKI預(yù)測(cè)模型,用于輸出ICU患者從入院到出院的連續(xù)AKI風(fēng)險(xiǎn)評(píng)分分?jǐn)?shù), 將應(yīng)用視角轉(zhuǎn)向了連續(xù)預(yù)測(cè),當(dāng)前該方面研究尚處于起步階段。
1.1.3 現(xiàn)狀分析
當(dāng)前AKI預(yù)測(cè)研究具有以下兩個(gè)特點(diǎn):①現(xiàn)有研究與及時(shí)識(shí)別重癥老年患者AKI風(fēng)險(xiǎn)的需求之間存在差距?,F(xiàn)有研究[8,19-22]多集中在心臟手術(shù)患者,其他大型手術(shù)后患者[23-24](例如肝移植[25])、腎毒性藥物患者[26-28]、妊娠后患者[29]等人群。目前心臟手術(shù)或腎毒性藥物引起的AKI預(yù)測(cè)研究相對(duì)較多,重點(diǎn)關(guān)注ICU內(nèi)特定年齡段的早期AKI風(fēng)險(xiǎn)預(yù)測(cè)的研究不足。盡管ICU人群特別是ICU老年患者具有較高AKI風(fēng)險(xiǎn),但面向該人群的預(yù)測(cè)研究卻較少,而且因?yàn)槿巳禾禺愋裕嫦蚱渌巳旱腁KI預(yù)測(cè)模型并不完全適用于ICU老年患者群體。②現(xiàn)有研究與不拘泥于固定時(shí)間點(diǎn)的連續(xù)動(dòng)態(tài)預(yù)測(cè)需求之間存在差距?,F(xiàn)有研究多關(guān)注模型預(yù)測(cè)性能的提高,未深入探討其預(yù)測(cè)策略是否充分考慮臨床需求。少有AKI預(yù)測(cè)研究重點(diǎn)關(guān)注隨著時(shí)間推移和患者體征變化的AKI連續(xù)動(dòng)態(tài)預(yù)測(cè)。不管是從臨床應(yīng)用角度還是實(shí)際病情變化追蹤角度,隨著患者病情體征變化的連續(xù)動(dòng)態(tài)預(yù)測(cè)更符合實(shí)際臨床應(yīng)用的需求,也更符合預(yù)測(cè)邏輯。此外,根據(jù)KDIGO[6]的指導(dǎo),大多數(shù)研究將預(yù)測(cè)時(shí)間節(jié)點(diǎn)設(shè)定于進(jìn)入ICU后的48 h,并不能滿足AKI臨床診斷的早期預(yù)測(cè)需求。
本研究采用重癥監(jiān)護(hù)醫(yī)學(xué)信息數(shù)據(jù)庫(Medical Information Mart for Intensive Care,MIMIC)-Ⅲ 數(shù)據(jù)[30],MIMIC-Ⅲ數(shù)據(jù)庫是由麻省理工學(xué)院計(jì)算生理學(xué)實(shí)驗(yàn)室、哈佛醫(yī)學(xué)院貝斯以色列女執(zhí)事醫(yī)學(xué)中心和飛利浦醫(yī)療聯(lián)合開發(fā)的多參數(shù)重癥監(jiān)護(hù)數(shù)據(jù)庫,包含了2001年至2012年來自貝斯以色列女執(zhí)事醫(yī)學(xué)中心46 000多位ICU患者的近6萬份臨床數(shù)據(jù),包括患者詳細(xì)人口學(xué)信息、生理生化檢查、診斷信息、醫(yī)療干預(yù)記錄等。MIMIC-Ⅲ結(jié)構(gòu)規(guī)范,數(shù)據(jù)記錄較為全面,具有開放性,已廣泛應(yīng)用于ICU相關(guān)疾病研究[31]。本研究應(yīng)用2016年發(fā)布的MIMIC-Ⅲ v1.4版本。
數(shù)據(jù)納入標(biāo)準(zhǔn):① 年齡≥60歲;② 入ICU初始血清肌酐測(cè)量值<4 mg/dL;③ ICU入住時(shí)間≥72 h;④入ICU診斷中沒有終末期腎病。本研究利用的研究信息不含有使受試者的身份被直接識(shí)別或通過與其相關(guān)的識(shí)別物識(shí)別的信息,屬于免除倫理審查。作為歷史性研究可免除研究對(duì)象知情同意。
本研究設(shè)計(jì)3個(gè)實(shí)驗(yàn)?zāi)繕?biāo):① 探索以6 h為單位預(yù)測(cè)重癥老年患者在未來48 h的AKI發(fā)病風(fēng)險(xiǎn);② 探索現(xiàn)有模型可實(shí)現(xiàn)何種程度的早期預(yù)測(cè);③ 比較各預(yù)測(cè)模型基于當(dāng)前單位時(shí)間窗內(nèi)數(shù)據(jù)和歷史累積數(shù)據(jù)的AKI預(yù)測(cè)效果。
針對(duì)實(shí)驗(yàn)?zāi)繕?biāo)①和②,以Toma?ev等[32]基于美國(guó)老兵數(shù)據(jù)庫的AKI連續(xù)預(yù)測(cè)研究為參考,將1 d以6 h為單位進(jìn)行劃分,預(yù)測(cè)任務(wù)的數(shù)據(jù)采集窗設(shè)置為[0, 6 h]、[6 h, 12 h]、[12 h, 18 h]、[18 h, 24 h]……其中0是指入ICU時(shí)間。提前48至72 h預(yù)測(cè)AKI事件[33],本研究將預(yù)測(cè)時(shí)間窗設(shè)為預(yù)測(cè)點(diǎn)之后的48 h,并以6 h為單位應(yīng)用移動(dòng)滑窗法持續(xù)推進(jìn),如圖1所示。
圖1 第1種數(shù)據(jù)采集時(shí)間窗:當(dāng)前數(shù)據(jù)Fig.1 The first data collection window: current data
針對(duì)實(shí)驗(yàn)?zāi)繕?biāo)③,對(duì)比既有數(shù)據(jù)采集時(shí)間窗[6 n h, 6(n+1) h](n≥0),另設(shè)數(shù)據(jù)采集時(shí)間窗[0, 6(n+1) h],如[0, 6 h]、[0, 12 h]、[0, 18 h]、[0, 24 h] (n≥0),如圖2所示。比較相同模型在n取值相同的情況下(如[6 h, 12 h]和[0, 12 h])的預(yù)測(cè)效果差異。
圖2 第2種數(shù)據(jù)采集時(shí)間窗:累積數(shù)據(jù)Fig.2 The second method of data collection window: accumulated data
當(dāng)前,KDIGO[6]被用作國(guó)際急性腎損傷判斷共識(shí),本研究遵循該標(biāo)準(zhǔn)將AKI定義為以下任一情況:①Scr 48 h內(nèi)升高達(dá)≥ 0.3 mg/dL (>26.5 μmol/L);②Scr在7 d內(nèi)升高基礎(chǔ)值的≥1.5倍;③尿量<0.5 mL·kg-1·h-1,持續(xù)6 h。本研究定義結(jié)局指標(biāo)時(shí),將當(dāng)前單位時(shí)間內(nèi)的患者Scr最小值作為基線數(shù)值,判斷未來48 h之內(nèi)Scr最大值與基線值之差是否≥ 0.3 mg/dL (> 26.5 μmol/L),或是否大于基線值的1.5倍。鑒于每個(gè)患者可能多次出入ICU,但并不一定每次都發(fā)生AKI,本研究將ICU病程記錄分為AKI組和非AKI組,而非直接對(duì)患者分組[15]。
依據(jù)KDIGO標(biāo)準(zhǔn)[6]及研究同類,本研究選取31個(gè)預(yù)測(cè)變量,包括:①人口學(xué)信息:包括年齡、性別;②生理指標(biāo):包括心率平均值/最大值(min-1)、收縮壓最小值/平均值(mmHg,1 mmHg=0.133 kPa)、舒張壓平均值/最大值(mmHg)、體溫最大值(℃)、血氧飽和度最小值/平均值(%)、尿量平均值(mL);③常用的實(shí)驗(yàn)室檢查:包括白細(xì)胞計(jì)數(shù)最大值/最小值(μL-1)、血清肌酐最小值/最大值(mg/dL)、血紅蛋白最小值/最大值(g/dL)、血小板計(jì)數(shù)最小值(μL-1)、碳酸氫鹽最大值/最小值(mg/dL)、血清鈣最小值(mg/dL)、血清鉀最大值(mg/dL)、尿素氮最大值(mg/dL) 、血糖最大值(mg/dL)、凝血酶原時(shí)間最小值/最大值(s)、腎小球?yàn)V過率估算值(estimated glomerular filtration rate,eGFR)、國(guó)際標(biāo)準(zhǔn)化比值最小值/最大值(international normalized ratio,INR);④相關(guān)干預(yù):是否進(jìn)行機(jī)械通氣。
本研究選擇預(yù)測(cè)變量時(shí)未考慮慢性合并癥(如糖尿病),因?yàn)閷?duì)于患有多種病癥的重癥患者,當(dāng)前的實(shí)驗(yàn)室檢測(cè)或生命體征值相比慢性病對(duì)預(yù)測(cè)AKI的作用更明顯[11]。此外,Ataei等[34]指出中性粒細(xì)胞明膠酶相關(guān)脂質(zhì)運(yùn)載蛋白(neutrophil gelatinase-associated lipocalin, NGAL)和胱抑素C(cystatin C)是AKI的早期預(yù)測(cè)指標(biāo),且支持更準(zhǔn)確、敏感的預(yù)測(cè),因MIMIC-Ⅲ數(shù)據(jù)中暫無相關(guān)記錄,故未采用。
1.6.1 缺失值處理
由于Scr值和尿量是判斷AKI最重要的指標(biāo),本研究首先排除Scr值和尿量缺失的所有數(shù)據(jù)。若一條信息中,各項(xiàng)指標(biāo)的缺失項(xiàng)大于50%,則認(rèn)為本條數(shù)據(jù)信息量不足,進(jìn)行刪除?;颊邤?shù)據(jù)是基于不定期測(cè)量,一天中并非每6 h都有新測(cè)值,但預(yù)測(cè)模型以固定的6 h間隔持續(xù)推進(jìn)。未有新測(cè)量值的變量取前一單位時(shí)間窗中的對(duì)應(yīng)值,若仍缺失,則應(yīng)用基于鏈?zhǔn)椒匠痰亩嘀夭逖a(bǔ)(multivariate imputation by chained equations,MICE)方法處理。本研究?jī)?yōu)先選擇前值填充,是因醫(yī)學(xué)數(shù)據(jù)缺失值一般為非隨機(jī)缺失,當(dāng)患者某些指標(biāo)正?;蜈呌诜€(wěn)定時(shí)便不再測(cè)量,因而前值更能代表當(dāng)前狀態(tài)。
1.6.2 數(shù)據(jù)轉(zhuǎn)換
將文本類型數(shù)據(jù)轉(zhuǎn)換成數(shù)值類型,如女性、男性分別用1、2表示。在數(shù)值類型數(shù)據(jù)中,不同的生理生化指標(biāo)的范圍跨度不同,建模前對(duì)其進(jìn)行歸一化處理,加快運(yùn)算速度,提高模型表現(xiàn)。電子病歷是含有時(shí)間屬性的時(shí)態(tài)數(shù)據(jù),本研究采用最近值(most recent)方法處理連續(xù)型時(shí)態(tài)數(shù)據(jù),即取數(shù)據(jù)采集時(shí)間窗中離預(yù)測(cè)點(diǎn)最近的值作為特征取值;采用匯聚[35](aggregated)方法處理離散型時(shí)態(tài)數(shù)據(jù),即如表示機(jī)械通氣與否的二分類變量中,在數(shù)據(jù)采集窗口中的任何一個(gè)時(shí)間段進(jìn)行了機(jī)械通氣,該變量取為1,否則取為0。
1.6.3 平衡性處理
本數(shù)據(jù)的自然特性決定了非AKI患者的比例要高于AKI患者的比例,在不同的時(shí)間窗采集數(shù)據(jù)集中,AKI和非AKI的比例約為1∶3。嚴(yán)重失衡的樣本會(huì)導(dǎo)致機(jī)器學(xué)習(xí)過程中采集到更多非AKI的特性,并在最終預(yù)測(cè)時(shí)傾向于將AKI預(yù)測(cè)為非AKI患者。為了避免樣本失衡導(dǎo)致的誤分類,本實(shí)驗(yàn)采用訓(xùn)練集劃分模型集成方法解決數(shù)據(jù)不平衡問題,即將訓(xùn)練集中非AKI組樣本有放回抽樣為3份,每一份與所有AKI樣本組合成3個(gè)新平衡訓(xùn)練集,將其分別用于訓(xùn)練不同分類算法。最后每種分類算法相應(yīng)得到3個(gè)訓(xùn)練模型,其結(jié)果由3個(gè)模型的平均加權(quán)確定。
盡管有研究[27]利用了許多不同的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方法進(jìn)行AKI預(yù)測(cè)研究,深度學(xué)習(xí)在預(yù)測(cè)能力方面并未展示出絕對(duì)優(yōu)勢(shì)。因此本研究選用了3個(gè)AKI預(yù)測(cè)研究中常見且預(yù)測(cè)能力優(yōu)秀、魯棒性高的機(jī)器學(xué)習(xí)模型, LR、RF、SVM,以及一個(gè)新型基于樹形結(jié)構(gòu)的梯度提升框架LightGBM[36]。
(1)LR:一種對(duì)數(shù)線性模型。多元Logistic 回歸中一個(gè)事件發(fā)生的對(duì)數(shù)概率為:log[p(x)/1-p(x)]=β0+β1X1+…+βpXp,則事件發(fā)生的概率為:p(X)=eβ0+β1X1+···+βpXp/(1+eβ0+β1X1+···+βpXp)[37]。
(2)SVM:一種二分類模型,基本模型是定義在特征空間上的間隔最大的線性分類器。支持向量機(jī)可以形式化為一個(gè)求解凸二次規(guī)劃的問題,也等價(jià)于正則化的合頁損失函數(shù)的最小化問題,支持向量機(jī)的學(xué)習(xí)算法是求解凸二次規(guī)劃的最優(yōu)化算法[38]。
(3)RF:是一個(gè)樹型分類器{h(x,βk),k=1…}的集合。其中基分類器h(x,βx)是用分類與回歸樹(classification and regression tree,CART)算法構(gòu)建的未剪枝的分類回歸樹, 輸出采用簡(jiǎn)單多數(shù)投票法[39]。
(4)LightGBM:其思想是利用弱分類器迭代訓(xùn)練得到最優(yōu)模型,并采用梯度提升算法減少結(jié)構(gòu)分?jǐn)?shù)的計(jì)算量,在此基礎(chǔ)上,采用基于直方圖的算法選擇分割點(diǎn),并且使用leaf-wise 策略替代level-wise 分裂子節(jié)點(diǎn),可簡(jiǎn)化計(jì)算并提高準(zhǔn)確率[37]。
LR、SVM和RF模型采用Python工具包Scikit-learn運(yùn)算,LightGBM應(yīng)用LightGBM 工具包建模預(yù)測(cè)。不同時(shí)間窗設(shè)定收集的數(shù)據(jù)都被隨機(jī)拆分成80%的訓(xùn)練集和20%的測(cè)試集。為保證數(shù)據(jù)可靠性,采用五折交叉驗(yàn)證評(píng)價(jià)模型性能,評(píng)價(jià)指標(biāo)選擇AUC、精確性(precision)、召回率(recall),評(píng)價(jià)指標(biāo)值越大,表征模型的預(yù)測(cè)性能越好。
共1 1261條ICU診療記錄符合納入標(biāo)準(zhǔn)。本實(shí)驗(yàn)數(shù)據(jù)中,患者人口統(tǒng)計(jì)學(xué)信息完整,而某些生理指標(biāo)和實(shí)驗(yàn)室檢查記錄存在缺失。在患者進(jìn)入ICU前期,各項(xiàng)指標(biāo)都會(huì)被密切監(jiān)測(cè),患者體征平穩(wěn)之后醫(yī)生會(huì)根據(jù)患者情況篩選某些重要指標(biāo)繼續(xù)監(jiān)測(cè)或?qū)δ承┲笜?biāo)的測(cè)量逐漸稀疏甚至停止監(jiān)控與病情相關(guān)性低的指標(biāo),因此隨著時(shí)間推移,數(shù)據(jù)中會(huì)出現(xiàn)越來越多的缺失值。故在不同數(shù)據(jù)采集時(shí)間窗中,數(shù)據(jù)缺失情況不同。本研究刪除了缺失值50%以上的診療記錄,最終不同數(shù)據(jù)窗下訓(xùn)練模型所用的記錄數(shù)不同。對(duì)于每個(gè)數(shù)據(jù)采集時(shí)間窗內(nèi)采集的ICU診療記錄,依據(jù)患者在未來48 h內(nèi)是否會(huì)發(fā)生AKI分為AKI組以及非AKI組,詳見表1。
表1 不同數(shù)據(jù)采集窗中診療記錄數(shù)Tab. 1 Number of medical records in different data collection windows
表2和表3分別展示了[6n h, 6(n+1) h](n=0,1,2,3)數(shù)據(jù)采集窗下,4種預(yù)測(cè)模型的AUC值以及精確度/召回率值。表4和表5分別展示了[0, 6(n+1) h] (n=0,1,2,3)數(shù)據(jù)采集窗下,各預(yù)測(cè)模型的性能評(píng)價(jià)指標(biāo)。為了更直觀地對(duì)比不同數(shù)據(jù)采集窗下的各模型預(yù)測(cè)效果,本研究選擇受試者工作特征(receiver operating characteristic,ROC)曲線進(jìn)行可視化展示,直觀評(píng)估分類器預(yù)測(cè)能力。AUC即為ROC曲線到x軸之間的面積,ROC曲線下面包含的面積越大則表明預(yù)測(cè)效果越好。圖3~6分別對(duì)比了LightGBM、RF、SVM和LR中應(yīng)用當(dāng)前單位時(shí)間數(shù)據(jù)與應(yīng)用累積數(shù)據(jù)進(jìn)行預(yù)測(cè)的性能差異。藍(lán)色曲線代表模型基于當(dāng)前6 h數(shù)據(jù)的預(yù)測(cè)效果,橙色曲線代表模型使用累積前6n h數(shù)據(jù)的預(yù)測(cè)效果。
圖3 LR在6個(gè)不同數(shù)據(jù)采集窗下的ROC曲線Fig.3 ROC curve of LR models in 6 different data collection windows
表2 [6n h, 6(n+1) h]數(shù)據(jù)采集窗下預(yù)測(cè)模型AUC值Tab. 2 AUC values of predictive models using data in time window [6n h, 6(n+1) h]
表3 [6n h, 6(n+1) h]數(shù)據(jù)采集窗下預(yù)測(cè)模型精確度/召回率值Tab. 3 Precision/recall values of predictive models using data in time window [6n h, 6(n+1) h]
表4 [0, 6(n+1) h]數(shù)據(jù)采集窗下預(yù)測(cè)模型AUC值Tab. 4 AUC values of predictive models using data in time window [0, 6(n+1) h]
表5 [0, 6(n+1) h]數(shù)據(jù)采集窗下預(yù)測(cè)模型精確度/召回率值Tab. 5 Precision/recall values of predictive models using data in time window [0, 6(n+1) h]
針對(duì)實(shí)驗(yàn)?zāi)繕?biāo)①,即以6 h為單位預(yù)測(cè)重癥老年患者在未來48 h的AKI發(fā)病風(fēng)險(xiǎn),本研究應(yīng)用LR、SVM、RF和LightGBM建模實(shí)現(xiàn)。在應(yīng)用當(dāng)前數(shù)據(jù)、累積數(shù)據(jù)的不同預(yù)測(cè)策略中,通過ROC曲線可以看出,LightGBM的預(yù)測(cè)效果明顯優(yōu)于另外3個(gè)模型,且性能良好,AUC值都達(dá)到了0.845以上,精確度和召回率分別達(dá)到了0.820、0.803以上。在基于當(dāng)前數(shù)據(jù)預(yù)測(cè)時(shí),即[6n h, 6(n+1)h],隨時(shí)間窗的推移,LightGBM的預(yù)測(cè)效果持續(xù)提升,在[18 h,24 h]數(shù)據(jù)采集窗下得到最優(yōu)預(yù)測(cè)效果,即在精確度/召回率為0.899/0.953的情況下AUC達(dá)0.925。實(shí)驗(yàn)結(jié)果表明應(yīng)用LightGBM面向老年重癥患者進(jìn)行AKI連續(xù)風(fēng)險(xiǎn)預(yù)測(cè)具有一定可行性。在兩種預(yù)測(cè)策略中,RF、SVM、LR的AUC在0.645~0.716之間,雖然隨時(shí)間推移預(yù)測(cè)效果有所提升,但最好效果只是RF在精確度/召回率為0.725/0.699情況下AUC達(dá)到0.716,它們顯示出了一定的預(yù)測(cè)能力但尚未達(dá)到在真實(shí)場(chǎng)景中應(yīng)用的水平。此外,分析隨時(shí)間推移模型預(yù)測(cè)效果有所提升的情況,可能潛在AKI患者的病情隨時(shí)間推進(jìn)愈發(fā)累積,此時(shí)生理指標(biāo)或?qū)嶒?yàn)室檢查值的預(yù)測(cè)性能增強(qiáng)。
圖4 SVM在6個(gè)不同數(shù)據(jù)采集窗下的ROC曲線Fig.4 ROC curve of SVM models in 6 different data collection windowsSVM: support vector machines;ROC:receiver operating characteristic.
圖5 RF在6個(gè)不同數(shù)據(jù)采集窗下的ROC曲線Fig.5 ROC curve of RF models in 6 different data collection windows RF: random forest;ROC:receiver operating characteristic.
圖6 LightGBM 在6個(gè)不同數(shù)據(jù)采集窗下的ROC曲線Fig.6 ROC curve of LightGBM models in 6 different data collection windows LightGBM:light gradient boosting machine;ROC:receiver operating characteristic.
針對(duì)實(shí)驗(yàn)?zāi)繕?biāo)②,即探索現(xiàn)有模型可實(shí)現(xiàn)何種程度的早期預(yù)測(cè)。實(shí)驗(yàn)顯示僅用患者入ICU后的第1個(gè)6 h數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí),LightGBM依然在精確度/召回率為0.849/0.837的情況下達(dá)到了0.845的AUC,即LightGBM的預(yù)測(cè)能力和準(zhǔn)確度在此場(chǎng)景下表現(xiàn)較好,甚至高于其應(yīng)用[0, 12 h]、[0, 18 h]、[0, 24 h]數(shù)據(jù)所獲得的AUC。ICU老年患者發(fā)生AKI非常普遍,越早預(yù)測(cè)越能為臨床醫(yī)師爭(zhēng)取寶貴時(shí)間及時(shí)進(jìn)行臨床干預(yù),本研究表明利用患者入ICU后的前6 h數(shù)據(jù)進(jìn)行AKI早期預(yù)測(cè)切實(shí)可行,而當(dāng)前研究多采用入ICU后的前24 h數(shù)據(jù)進(jìn)行預(yù)測(cè)且AUC為0.57~0.92[15-17],利用LightGBM可以將觀察時(shí)間窗縮減為原來的四分之一就可以達(dá)到0.845的AUC。
針對(duì)實(shí)驗(yàn)?zāi)繕?biāo)③,比較各預(yù)測(cè)模型基于當(dāng)前數(shù)據(jù)和累積數(shù)據(jù)的AKI預(yù)測(cè)效果。LightGBM預(yù)測(cè)模型,基于累積數(shù)據(jù)預(yù)測(cè)結(jié)果的AUC值、準(zhǔn)確率、精確度等評(píng)估指標(biāo)均低于基于當(dāng)前數(shù)據(jù)預(yù)測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果表明,并非收集數(shù)據(jù)越多越好,可能當(dāng)前單位時(shí)間內(nèi)的測(cè)量值更能代表或預(yù)示患者的狀態(tài),而加入歷史累積數(shù)據(jù)可能產(chǎn)生預(yù)測(cè)噪聲。但在RF、SVM、LR模型中,基于累積數(shù)據(jù)預(yù)測(cè)結(jié)果比應(yīng)用當(dāng)前數(shù)據(jù)的預(yù)測(cè)效果好,AUC、精確度和召回率均有所提升。這提示不同模型對(duì)數(shù)據(jù)的接收能力和適用性不同,在選擇模型分析數(shù)據(jù)時(shí)應(yīng)考慮此差異性。
在數(shù)據(jù)收集方面,選取了6 h作為數(shù)據(jù)收集的變化時(shí)間窗,但I(xiàn)CU患者的各項(xiàng)生理指標(biāo)會(huì)隨著時(shí)間的推移和病情的發(fā)展不斷地變化。針對(duì)實(shí)驗(yàn)?zāi)繕?biāo)①,下一步工作將探索實(shí)現(xiàn)更小時(shí)間間隔的連續(xù)預(yù)測(cè),同樣每次采集6 h數(shù)據(jù),但以更短時(shí)間間隔移動(dòng)滑窗推進(jìn),如每隔3 h、1 h、15 min進(jìn)行1次預(yù)測(cè),甚至探索實(shí)時(shí)計(jì)算預(yù)測(cè)以更好支持臨床決策。針對(duì)實(shí)驗(yàn)?zāi)繕?biāo)②,在[6n h, 6(n+1) h]數(shù)據(jù)采集窗下,LightGBM、SVM及LR均表明隨移動(dòng)滑窗推進(jìn),預(yù)測(cè)效果越好,且各模型的AUC在[18 h,24 h]數(shù)據(jù)采集窗中表現(xiàn)最高。本研究中數(shù)據(jù)采集窗的設(shè)置局限于入ICU第1天,可能一些重要指標(biāo)的測(cè)量會(huì)放置在一天中最后1個(gè)單位時(shí)間里,導(dǎo)致[18 h,24 h]窗口預(yù)測(cè)效果最好。筆者將在下步研究中探索模型在 [24 h, 30 h]、[30 h, 36 h]、 [36 h,42 h]等窗口中的預(yù)測(cè)性能。未來工作也將向前壓縮數(shù)據(jù)采集窗,如探索ICU前3個(gè)小時(shí)、前1個(gè)小時(shí)數(shù)據(jù)是否勝任AKI早期預(yù)測(cè)任務(wù)。
患者在ICU期間的用藥、手術(shù)等事件也會(huì)對(duì)AKI的發(fā)生和預(yù)測(cè)產(chǎn)生影響,本實(shí)驗(yàn)中并未做深入研究。由于未使用非結(jié)構(gòu)化數(shù)據(jù),預(yù)測(cè)變量里沒有考慮患者其他慢性病或者診療手段帶來的影響。MIMIC-Ⅲ的時(shí)間跨度為12年,12年間診療方法和記錄習(xí)慣都可能產(chǎn)生變化,利用大時(shí)間跨度的數(shù)據(jù)擁有大數(shù)據(jù)量?jī)?yōu)勢(shì)的同時(shí)可能會(huì)導(dǎo)致數(shù)據(jù)缺乏時(shí)間維度上的一致性。
本研究應(yīng)用最近值、匯聚方法處理電子病歷中時(shí)態(tài)數(shù)據(jù),本質(zhì)上采用了單一值形式,即將單個(gè)特征值作為含有時(shí)間信息的特征的取值,并未將時(shí)態(tài)信息納入到風(fēng)險(xiǎn)決策中,未考慮時(shí)間的前后聯(lián)系。下步工作將考慮基于時(shí)序(temporal)方法[35]處理時(shí)序數(shù)據(jù),即通過堆疊多個(gè)測(cè)量點(diǎn)值,或通過模型將前后時(shí)間的狀態(tài)關(guān)聯(lián)起來。另外,循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)模型是一類用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),不同于前饋神經(jīng)網(wǎng)絡(luò),其可利用內(nèi)部記憶來處理任意時(shí)序的輸入序列,下步研究將基于RNN開展AKI的連續(xù)預(yù)測(cè)。
本研究基于MIMIC-Ⅲ電子病歷運(yùn)用4種機(jī)器學(xué)習(xí)方法探索了重癥老年患者早期AKI連續(xù)風(fēng)險(xiǎn)預(yù)測(cè),分別基于以6 h為單位的當(dāng)前數(shù)據(jù)和累積數(shù)據(jù)持續(xù)推進(jìn),連續(xù)預(yù)測(cè)患者在未來48 h的AKI發(fā)病情況。實(shí)驗(yàn)結(jié)果表明,應(yīng)用LightGBM進(jìn)行老年重癥患者AKI連續(xù)風(fēng)險(xiǎn)預(yù)測(cè)具有一定可行性,RF、SVM、LR模型在連續(xù)預(yù)測(cè)中展現(xiàn)了相應(yīng)的預(yù)測(cè)能力但尚未達(dá)到在真實(shí)場(chǎng)景中應(yīng)用的水平。應(yīng)用患者入ICU后的前6 h數(shù)據(jù)進(jìn)行AKI早期預(yù)測(cè)切實(shí)可行,對(duì)比傳統(tǒng)的24 h預(yù)測(cè)大大延長(zhǎng)了醫(yī)生治療的反應(yīng)時(shí)間。此外,研究顯示不同模型對(duì)數(shù)據(jù)的接收能力和適用性不同,LightGBM青睞于當(dāng)前數(shù)據(jù),其他3種模型青睞于累積數(shù)據(jù)。
利益沖突所有作者均聲明不存在利益沖突。
作者貢獻(xiàn)聲明錢慶: 提出研究思路,設(shè)計(jì)研究方案;孫海霞:設(shè)計(jì)研究方案,論文修改;鄔金鳴:分析數(shù)據(jù)、論文撰寫與修改;王嘉陽:數(shù)據(jù)采集與實(shí)驗(yàn)、數(shù)據(jù)分析。
首都醫(yī)科大學(xué)學(xué)報(bào)2022年4期