鄭 詩 梅游英 王詣涵 潘若玲 南曉領(lǐng)
溫州市中西醫(yī)結(jié)合醫(yī)院血液凈化中心,325000 浙江 溫州
血管通路是血液透析患者賴以生存的生命線[1],自體動(dòng)靜脈內(nèi)瘺(arteriovenous fistulas,AVF)因其操作簡便、費(fèi)用低、預(yù)后良好等諸多優(yōu)勢,已成為長期血液透析患者的最佳血管通路類型[2-3]。但AVF并非終身使用,其可因各種原因引起血管狹窄或者閉塞,從而導(dǎo)致內(nèi)瘺失功。研究表明AVF失功是導(dǎo)致血液透析患者預(yù)后不良的重要原因之一[4]。因此,了解AVF失功的危險(xiǎn)因素并構(gòu)建其相關(guān)預(yù)測模型,對預(yù)防和早期干預(yù)AVF失功至關(guān)重要。隨機(jī)森林模型作為一種新興的、靈活度高的機(jī)器學(xué)習(xí)算法,與logistic回歸等傳統(tǒng)分類算法相比具有抗噪聲、高準(zhǔn)確性、可評估各個(gè)特征的重要性及不依賴于全部數(shù)據(jù)特征等優(yōu)點(diǎn)[5-7]。本研究分別采用隨機(jī)森林算法和logistic回歸模型構(gòu)建維持性血液透析患者AVF失功預(yù)測模型,并對其應(yīng)用效果進(jìn)行比較分析,為早期預(yù)防AVF失功的發(fā)生提供參考依據(jù)。
以2017年5月至2020年11月在溫州市某中西醫(yī)結(jié)合醫(yī)院血液凈化中心進(jìn)行維持性血液透析的患者為研究對象。
納入標(biāo)準(zhǔn): 1)入院年齡>18歲;2)在該院單上臂首次造瘺,且行頭靜脈-橈動(dòng)脈端側(cè)吻合形成AVF者;3)AVF術(shù)后 1個(gè)月以上者。
排除標(biāo)準(zhǔn):1)于外院行 AVF成形術(shù)者;2)改用腹膜透析等腎臟替代治療方式而放棄使用AVF者;3)既往行血管內(nèi)手術(shù)者。
采用統(tǒng)一設(shè)計(jì)的個(gè)案數(shù)據(jù)表,對研究對象的資料進(jìn)行回顧性收集。
1)一般資料,包括性別、年齡、體質(zhì)量指數(shù)(BMI)、吸煙史、糖尿病史、高血壓史及Charlson合并癥指數(shù)[8];
2)透析資料,包括透析中低血壓、透析脫水量;
3)實(shí)驗(yàn)室指標(biāo),包括血紅蛋白濃度、嗜酸性粒細(xì)胞、血小板計(jì)數(shù)及紅細(xì)胞比容;
4)生化及凝血相關(guān)指標(biāo),包括鈣磷乘積、C反應(yīng)蛋白、凝血酶原時(shí)間、纖維蛋白原以及國際標(biāo)準(zhǔn)化比值;
5)營養(yǎng)指標(biāo),包括營養(yǎng)風(fēng)險(xiǎn)指數(shù)、血漿白蛋白、堿性磷酸酶、甘油三酯以及膽固醇。
AVF失功定義為開始透析后發(fā)生至少以下1種情況[9]:
1)觸診內(nèi)瘺震顫減弱或無法觸及,聽診血管雜音無法聞及;
2)血流量過低(<200 mL/min)無法滿足透析需要,血管彩色多普勒超聲檢查提示通路狹窄(血管狹窄程度≥50%,或吻合口直徑<2.0 mm、內(nèi)瘺靜脈直徑<2.7 mm)。
共558例維持性血液透析患者納入最終研究。發(fā)生AVF失功的患者96例,其中男性56例,女性40例,年齡范圍42~87歲,平均年齡(56.88 ± 15.21)歲;未發(fā)生AVF失功的患者462例,其中男性240例,女性222例,年齡范圍35~82歲,平均年齡 (51.10±13.91)歲。
單因素分析結(jié)果顯示,年齡(χ2=-3.640) 、有吸煙史(χ2=8.266) 、糖尿病史 (χ2=18.521)、鈣磷乘積(t=-4.332)、營養(yǎng)風(fēng)險(xiǎn)指數(shù)(t=8.830)以及透析中低血壓(χ2=5.552)在血透患者動(dòng)靜脈內(nèi)瘺正常組與失功組的組間差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。見表1。
表1 血透患者AVF失功危險(xiǎn)因素的單因素分析
共有395個(gè)訓(xùn)練集用于建立隨機(jī)森林模型。根據(jù)基尼指數(shù)減少平均值對23個(gè)變量進(jìn)行排序,營養(yǎng)風(fēng)險(xiǎn)指數(shù)、堿性磷酸酶、年齡、血小板計(jì)數(shù)、紅細(xì)胞比容為預(yù)測血透患者動(dòng)靜脈內(nèi)瘺失功發(fā)生重要性前5位指標(biāo)。見表2。當(dāng)決策樹數(shù)量為31時(shí)隨機(jī)森林預(yù)測誤差曲線趨于平穩(wěn),可得到最優(yōu)模型,此時(shí)袋外錯(cuò)誤率為6.83%。見圖1。
表2 各變量基尼指數(shù)減少平均值情況及重要性排序
圖1 隨機(jī)森林預(yù)測誤差與決策樹數(shù)量的動(dòng)態(tài)變化關(guān)系
2.4 多因素logistic 回歸分析結(jié)果
以年齡、吸煙史、糖尿病史、鈣磷乘積、營養(yǎng)風(fēng)險(xiǎn)指數(shù)及透析中低血壓作為自變量,以血透患者是否發(fā)生動(dòng)靜脈內(nèi)瘺失功為因變量進(jìn)行多因素logistic回歸分析。變量賦值見表3。結(jié)果顯示,年齡、吸煙史、糖尿病史、鈣磷乘積升高以及透析中低血壓是血透患者動(dòng)靜脈內(nèi)瘺失功發(fā)生的危險(xiǎn)因素(P<0.05),而營養(yǎng)風(fēng)險(xiǎn)指數(shù)升高是血透患者動(dòng)靜脈內(nèi)瘺失功發(fā)生的保護(hù)因素(P<0.001)。見表4。
表3 變量賦值表
表4 血透患者AVF失功的多因素logistic回歸分析
采用測試集數(shù)據(jù)比較2種模型對血透患者動(dòng)靜脈內(nèi)瘺失功的預(yù)測效果。隨機(jī)森林預(yù)測模型的特異度、陰性預(yù)測值低于logistic預(yù)測模型;敏感度、準(zhǔn)確性、陽性預(yù)測值高于logistic預(yù)測模型。見表5。
表5 兩種模型的預(yù)測性能比較
隨機(jī)森林預(yù)測模型的AUC為 0.911(95%CI:0.857~0.964,P<0.001),見圖2。logistic回歸預(yù)測模型的AUC為0.755(95%CI:0.649~0.862,P<0.001),見圖3。隨機(jī)森林預(yù)測模型的AUC大于logistic回歸預(yù)測模型的AUC(Z=2.600,P=0.009) 。
圖2 基于隨機(jī)森林預(yù)測模型的ROC曲線
圖3 基于logistic預(yù)測模型的ROC曲線
本文基于隨機(jī)森林模型和多因素logistic回歸模型建立AVF失功的預(yù)測模型,結(jié)果表明隨機(jī)森林算法可以有效地區(qū)分可能發(fā)生AVF失功的個(gè)體和不會(huì)發(fā)生AVF失功的個(gè)體,且其預(yù)測準(zhǔn)確性高于logistic回歸模型。此外,隨機(jī)森林預(yù)測模型結(jié)果顯示,營養(yǎng)風(fēng)險(xiǎn)指數(shù)、堿性磷酸酶、年齡、血小板計(jì)數(shù)、紅細(xì)胞比容、鈣磷乘積、C反應(yīng)蛋白、凝血酶原時(shí)間、性別、甘油三酯等為預(yù)測血透患者AVF失功發(fā)生重要性位列前10的因素。logistic回歸模型結(jié)果可根據(jù)效應(yīng)值的大小直觀地解釋營養(yǎng)風(fēng)險(xiǎn)指數(shù)、年齡、吸煙史、糖尿病史、鈣磷乘積以及透析中低血壓等因素與發(fā)生AVF失功風(fēng)險(xiǎn)間的關(guān)系,且其在特異度、陰性預(yù)測值等模型性能指標(biāo)上的表現(xiàn)優(yōu)于隨機(jī)森林預(yù)測模型。
營養(yǎng)風(fēng)險(xiǎn)指數(shù)作為一個(gè)評估營養(yǎng)評分的客觀指標(biāo),可能是預(yù)測AVF失功發(fā)生的最重要因素。隨著營養(yǎng)狀態(tài)的惡化,血管內(nèi)皮受損、修復(fù)功能障礙,內(nèi)源性凝血途徑由于膠原暴露而被激活,這些變化均可促使血栓形成[10-11]。湯睿瑩等[11]應(yīng)用競爭風(fēng)險(xiǎn)模型探討血透中心老年患者AVF失功的危險(xiǎn)因素,發(fā)現(xiàn)較低的營養(yǎng)風(fēng)險(xiǎn)指數(shù)是導(dǎo)致老年患者AVF失功的獨(dú)立危險(xiǎn)因素;本研究進(jìn)一步表明營養(yǎng)風(fēng)險(xiǎn)指數(shù)可作為全年齡段患者發(fā)生AVF失功的獨(dú)立預(yù)測指標(biāo)。研究還顯示維持性血液透析患者發(fā)生AVF失功的風(fēng)險(xiǎn)每增加1歲就會(huì)增加0.035倍的風(fēng)險(xiǎn)。研究通過多因素logistic回歸模型表明糖尿病史是AVF失功的獨(dú)立危險(xiǎn)因素。機(jī)制研究表明糖尿病與AVF失功的發(fā)生與其致動(dòng)脈粥樣硬化和胰島素抵抗有關(guān);這可以通過增強(qiáng)凝血因子及血小板功能加速血栓形成[12]。吸煙作為公認(rèn)的心血管疾病和靜脈血栓形成危險(xiǎn)因素[13-14],在本研究中也被證實(shí)與AVF失功發(fā)生有關(guān);可能是因?yàn)殚L期吸煙損害內(nèi)皮細(xì)胞的抗凝功能,從而導(dǎo)致AVF血栓形成和失功。鈣磷代謝紊亂是慢性腎臟疾病患者常見的并發(fā)癥,鈣磷乘積升高可以促進(jìn)血管平滑肌細(xì)胞增殖,血管鈣化加速,繼而影響血管舒縮功能,使血管狹窄或閉塞[15]。本研究中AVF失功組患者的鈣磷乘積顯著高于正常組,也證實(shí)了鈣磷代謝紊亂與AVF失功發(fā)生有關(guān)。1項(xiàng)納入12篇病例對照研究的meta分析發(fā)現(xiàn)透析中低血壓患者發(fā)生AVF失功的風(fēng)險(xiǎn)是其他患者的3.27倍[9],本研究通過多因素logistic回歸模型也表明透析中低血壓是AVF失功的危險(xiǎn)因素,其可能與血漿滲透壓相對快速變化有關(guān)[16]。
本研究有以下幾點(diǎn)優(yōu)勢:首先,研究使用隨機(jī)森林來預(yù)測維持性血液透析患者發(fā)生AVF失功的風(fēng)險(xiǎn),隨機(jī)森林可將所有可能風(fēng)險(xiǎn)因素納入分析,然后篩選出重要變量并建立預(yù)測模型,使模型的預(yù)測更加準(zhǔn)確;此外,建立預(yù)測模型的所需數(shù)據(jù)可在臨床中獲取,并有助于臨床醫(yī)護(hù)人員迅速評估個(gè)體發(fā)生AVF失功的風(fēng)險(xiǎn),并對高危個(gè)體實(shí)施個(gè)性化干預(yù)。本研究局限性:鑒于本研究為一項(xiàng)單中心研究,可能導(dǎo)致建立的模型在其他人群中使用效果不佳;同時(shí)本研究建立基于隨機(jī)森林算法和logistic回歸模型構(gòu)建的維持性血液透析患者AVF失功預(yù)測模型,仍需通過多中心、前瞻性研究進(jìn)一步驗(yàn)證。
綜上所述,隨機(jī)森林模型相較于logistic 回歸模型對AVF失功發(fā)生總體預(yù)測效果好,但logistic回歸模型能直觀地解釋結(jié)果,兩種模型可互為補(bǔ)充,從各個(gè)方面描述影響AVF失功發(fā)生的因素及作用。