国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機(jī)器學(xué)習(xí)在腦卒中預(yù)測中的研究進(jìn)展

2022-11-03 04:27:28李潔潔張雁儒李昊楊越
河南醫(yī)學(xué)研究 2022年20期
關(guān)鍵詞:機(jī)器向量森林

李潔潔,張雁儒,李昊,楊越

(河南理工大學(xué) 醫(yī)學(xué)院,河南 焦作 454000)

腦卒中是一項(xiàng)影響國計(jì)民生的公共衛(wèi)生問題,是全球第二大致死原因,每年約有660萬人死于腦卒中,嚴(yán)重影響患者的生命和生活質(zhì)量[1]。近年來,機(jī)器學(xué)習(xí)作為一門交叉學(xué)科,被廣泛應(yīng)用于醫(yī)學(xué)領(lǐng)域。利用機(jī)器學(xué)習(xí)對(duì)腦卒中進(jìn)行及時(shí)的預(yù)測,具有重要的臨床意義,可以幫助醫(yī)護(hù)人員做出臨床決策,優(yōu)化醫(yī)療資源配置,對(duì)患者危的險(xiǎn)因素及時(shí)干預(yù),降低腦卒中的患病率和致死率。

因此,了解機(jī)器學(xué)習(xí)在腦卒中研究中的應(yīng)用進(jìn)展,可以為機(jī)器學(xué)習(xí)的進(jìn)一步應(yīng)用提供參考。本文重點(diǎn)對(duì)近年來機(jī)器學(xué)習(xí)在腦卒中復(fù)發(fā)、預(yù)后和恢復(fù)預(yù)測方面進(jìn)行綜述。

1 機(jī)器學(xué)習(xí)算法的應(yīng)用

機(jī)器學(xué)習(xí)是一門研究如何使用計(jì)算機(jī)程序模擬人類學(xué)習(xí)活動(dòng)的學(xué)科[2],是人工智能的一個(gè)重要子集,主要用于分析結(jié)構(gòu)化數(shù)據(jù)[3]。在大數(shù)據(jù)時(shí)代,機(jī)器學(xué)習(xí)算法的使用大大提高了分析海量臨床數(shù)據(jù)的能力,將醫(yī)生從大量信息中拯救出來,有助于快速做出臨床決策。它在生產(chǎn)率、效率和醫(yī)療服務(wù)的地域覆蓋范圍等方面的提升[4],也是醫(yī)療人員研究機(jī)器學(xué)習(xí)的重要原因。

通過文獻(xiàn)檢索,發(fā)現(xiàn)將機(jī)器學(xué)習(xí)用于腦卒中研究始于2005年[5]。腦卒中研究中多是不平衡數(shù)據(jù),而機(jī)器學(xué)習(xí)方法是預(yù)測不平衡數(shù)據(jù)的有效工具[6],彌補(bǔ)了這種不對(duì)稱。通過回顧性或前瞻性研究,將數(shù)據(jù)分為訓(xùn)練集和測試集,開發(fā)出基于不同機(jī)器學(xué)習(xí)算法的預(yù)測模型。通過兩種方法對(duì)開發(fā)出的預(yù)測模型的性能進(jìn)行評(píng)價(jià):一種與傳統(tǒng)腦卒中預(yù)測評(píng)分相比較;另一種與不同機(jī)器學(xué)習(xí)算法所建立的預(yù)測模型比較。評(píng)價(jià)標(biāo)準(zhǔn):受試者工作特征曲線下面積(area under the curve,AUC)、特異度、敏感度、準(zhǔn)確性、召回率、F1-score等。在評(píng)價(jià)結(jié)果上,利用機(jī)器學(xué)習(xí)算法開發(fā)的預(yù)測模型的性能要優(yōu)于傳統(tǒng)預(yù)測模型[7-8]。在不同數(shù)據(jù)樣本下,同一機(jī)器學(xué)習(xí)算法會(huì)得到不同的預(yù)測效果,性能高低也不同。根據(jù)機(jī)器學(xué)習(xí)的常用算法,列出被比較算法,匯總關(guān)于腦卒中最優(yōu)機(jī)器學(xué)習(xí)算法的AUC值和樣本量大小,具體如表1所示。

目前,機(jī)器學(xué)習(xí)在腦卒中的研究頗多,也被證明對(duì)腦卒中研究有重大價(jià)值[14-16]。如預(yù)測藥物治療效果[17-18]、腦卒中后肺炎[19]、預(yù)測腦卒中最終病變[20]、辨別缺血性腦卒中亞型[21]、對(duì)腦卒中患者進(jìn)行焦慮分析[22]等。機(jī)器學(xué)習(xí)的主要任務(wù)是預(yù)測,因此,本文重點(diǎn)探討腦卒中復(fù)發(fā)、預(yù)后及恢復(fù)預(yù)測。

表1 腦卒中最優(yōu)機(jī)器學(xué)習(xí)算法

2 腦卒中患者復(fù)發(fā)預(yù)測研究

有研究證明,至少1/6的腦卒中患者會(huì)在5 a內(nèi)復(fù)發(fā)[23]。腦卒中一旦復(fù)發(fā),就意味著神經(jīng)功能受損更加嚴(yán)重、家庭負(fù)擔(dān)更加巨大??刂聘哐獕?、糖尿病、脂質(zhì)代謝、抽煙、喝酒等[24-26]危險(xiǎn)因素一直是臨床常用的降低復(fù)發(fā)率的方法,因此有必要根據(jù)患者的一般資料進(jìn)行危險(xiǎn)因素預(yù)測。一般情況下,1~2個(gè)危險(xiǎn)因素可誘導(dǎo)腦卒中患者復(fù)發(fā),而大數(shù)據(jù)下的機(jī)器學(xué)習(xí)可以處理危險(xiǎn)因素間的復(fù)雜關(guān)系,處理分析能力更加優(yōu)異。

利用機(jī)器學(xué)習(xí)算法對(duì)患者進(jìn)行30 d、90 d、1 a以及更長期腦卒中復(fù)發(fā)預(yù)測,結(jié)果顯示,在不同的數(shù)據(jù)和時(shí)間長度下,相同的機(jī)器學(xué)習(xí)算法可有不同的性能表現(xiàn)。有研究發(fā)現(xiàn),使用隨機(jī)森林、梯度增強(qiáng)機(jī)、極端梯度提升、支持向量機(jī)和邏輯回歸5種機(jī)器學(xué)習(xí)算法對(duì)電子健康記錄的患者數(shù)據(jù)進(jìn)行30 d模型開發(fā)。結(jié)果顯示,采用rose采樣的極端梯度提升在AUC方面性能最好,AUC為0.74(95% CI為0.64~0.78)[27]。Xu等[28]對(duì)腦卒中患者進(jìn)行了90 d再入院風(fēng)險(xiǎn)預(yù)測,極端梯度提升預(yù)測能力高于隨機(jī)森林模型,預(yù)測模型的AUC為0.782。Hung等[29]預(yù)測90 d最優(yōu)模型時(shí),使用了8種機(jī)器學(xué)習(xí)算法,包括C4.5、分類和回歸樹、K近鄰、邏輯回歸、多層感知器、Na?ve Bayes、隨機(jī)森林和支持向量機(jī),最終認(rèn)為最優(yōu)模型是Na?ve Bayes模型,其AUC為0.661。但Chan[30]通過交叉驗(yàn)證,人工神經(jīng)網(wǎng)絡(luò)型預(yù)測1 a卒中復(fù)發(fā)的中位敏感度、特異度、準(zhǔn)確性和AUC分別為75%、75%、75%和77%,其預(yù)測性能優(yōu)于支持向量機(jī)和Na?ve Bayes分類器。Abedi等[31]進(jìn)行了一項(xiàng)預(yù)測5 a卒中復(fù)發(fā)研究,使用6種算法(logistic回歸、極端梯度提升、梯度增強(qiáng)機(jī)、隨機(jī)森林、支持向量機(jī)、決策樹)預(yù)測卒中復(fù)發(fā)情況。結(jié)果顯示,6種模型均可應(yīng)用于長期卒中復(fù)發(fā)的預(yù)測,但預(yù)測時(shí)間越長,性能越低。如1 a預(yù)測窗口的最佳AUC為0.79,2、3、4、5a預(yù)測窗口的最佳AUC分別為0.70、0.73、0.73、0.69,呈下降趨勢(shì)。

3 腦卒中患者預(yù)后預(yù)測研究

對(duì)腦卒中患者進(jìn)行預(yù)后是困難的,但同時(shí)又很必要。利用機(jī)器學(xué)習(xí)對(duì)腦卒中患者進(jìn)行預(yù)后預(yù)測在長期決策、患者治療、醫(yī)療資源等方面起著重要作用。醫(yī)護(hù)決策者在機(jī)器學(xué)習(xí)制定計(jì)劃的基礎(chǔ)上,更好地預(yù)測每個(gè)患者的患病程度,將患者家庭情況和經(jīng)濟(jì)條件考慮在內(nèi),與患者、親屬和醫(yī)院共同作出和護(hù)理決策,制定個(gè)性化干預(yù),改善預(yù)后。

利用5種算法[12](正則化邏輯回歸、支持向量機(jī)、隨機(jī)森林、極端梯度提升、K近鄰)預(yù)測預(yù)后的研究中,正則化邏輯回歸的效能最好,AUC為0.86,支持向量機(jī)的AUC排第2名,為0.85,所有機(jī)器學(xué)習(xí)模型的AUC均達(dá)到0.8以上,比傳統(tǒng)評(píng)分預(yù)測模型準(zhǔn)確性高。例如,在Chiu等[32]和Heo等[11]的研究中,將機(jī)器學(xué)習(xí)預(yù)測模型分別與DRAGON評(píng)分和ASTRAL評(píng)分相比,結(jié)果顯示機(jī)器學(xué)習(xí)預(yù)測模型的性能優(yōu)于后者。Li等[33]的研究發(fā)現(xiàn)5個(gè)機(jī)器學(xué)習(xí)模型(邏輯回歸、支持向量機(jī)、隨機(jī)森林分類器、極端梯度提升和全連接深度神經(jīng)網(wǎng)絡(luò))的性能差別不大,驗(yàn)證了機(jī)器學(xué)習(xí)算法優(yōu)于血管事件總健康風(fēng)險(xiǎn)評(píng)分和NADE列線圖。Abedi等[34]利用電子健康記錄的數(shù)據(jù),基于logistic回歸、極端梯度提升和隨機(jī)森林3種機(jī)器學(xué)習(xí)模型預(yù)測缺血性腦卒中后的短期和長期病死率。結(jié)果顯示,3種模型的AUC在0.76~0.81之間,隨機(jī)森林模型在1個(gè)月時(shí)表現(xiàn)最佳,AUC為0.82。開發(fā)的機(jī)器學(xué)習(xí)模型的性能可以通過數(shù)據(jù)的繼續(xù)訓(xùn)練而不斷提高。有研究使用3種機(jī)器學(xué)習(xí)模型(支持向量機(jī)、隨機(jī)森林和人工神經(jīng)網(wǎng)絡(luò))和混合人工神經(jīng)網(wǎng)絡(luò),進(jìn)行10次重復(fù)保留和10次交叉驗(yàn)證進(jìn)行評(píng)估,開發(fā)的機(jī)器學(xué)習(xí)模型的AUC均超過0.94。再通過增加后續(xù)數(shù)據(jù),預(yù)測能力提高到0.97[35]。

4 腦卒中患者恢復(fù)預(yù)測研究

卒中后出院的患者需要長期鍛煉以恢復(fù)肢體功能。出院后的護(hù)理若不成系統(tǒng),會(huì)導(dǎo)致醫(yī)療費(fèi)用增加以及面臨再次入院的風(fēng)險(xiǎn)。機(jī)器學(xué)習(xí)算法可以幫助患者預(yù)測醫(yī)療資源需求,幫助護(hù)理人員做出匹配的康復(fù)計(jì)劃,使有限的醫(yī)療資源達(dá)到最佳配置。

Thakkar等[13]利用K近鄰和人工神經(jīng)網(wǎng)絡(luò)算法預(yù)測腦卒中患者恢復(fù)功能,K近鄰模型的預(yù)測精度為85.42%,AUC為0.89,人工神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度為81.25%,AUC為0.77,證明K近鄰模型性能優(yōu)于人工神經(jīng)網(wǎng)絡(luò)。有研究采用決策樹、Na?ve Bayes、K近鄰、線性判別分析、AdaBoost、支持向量機(jī)、logistic回歸和隨機(jī)森林8種機(jī)器學(xué)習(xí)方法,8種機(jī)器學(xué)習(xí)模型的AUC在0.830~0.887之間,其中隨機(jī)森林表現(xiàn)最好,AUC為0.887[36]。在識(shí)別腦卒中患者的日常生活依賴性時(shí),分類回歸樹模型的準(zhǔn)確率為0.830,可以作為預(yù)測模型[37]。開發(fā)深度神經(jīng)網(wǎng)絡(luò)、邏輯回歸和隨機(jī)森林的3種預(yù)測模型中,深度神經(jīng)網(wǎng)絡(luò)模型預(yù)測上下肢功能的AUC分別為0.906和0.822,高于其他模型的AUC值[38]。對(duì)腦卒中患者回家可能性的分析中,機(jī)器學(xué)習(xí)算法建立了決策樹、線性判別分析、K近鄰、支持向量機(jī)和隨機(jī)森林5種模型,基于同一數(shù)據(jù)集構(gòu)建分類系統(tǒng)進(jìn)行準(zhǔn)確率、AUC值、F1評(píng)分以及敏感度等比較,結(jié)果顯示,就模型性能而言,支持向量機(jī)(AUC為0.91)和K近鄰(AUC為0.88)為優(yōu)異的候選算法[9]。綜上,在進(jìn)行恢復(fù)預(yù)測研究時(shí),可以使用K近鄰、深度神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林等算法。

5 總結(jié)和展望

先進(jìn)的機(jī)器學(xué)習(xí)算法有潛力改善醫(yī)療保健的獲取和公平,降低醫(yī)療成本,降低診斷錯(cuò)誤或差異,提高效率,改善醫(yī)療服務(wù)。機(jī)器學(xué)習(xí)在預(yù)測方面發(fā)揮越來越重要的積極作用,但也要正視其自身固有的弊端。利用機(jī)器學(xué)習(xí)背后可能引起某些群體的歧視及偏見[39],引發(fā)倫理問題,要求醫(yī)生具備相關(guān)技能和倫理方面的知識(shí)。另外,機(jī)器學(xué)習(xí)性能高低取決于輸入數(shù)據(jù)是否適合。不同數(shù)據(jù)集下的模型的性能不同,有時(shí)這些驗(yàn)證研究會(huì)產(chǎn)生相互矛盾的結(jié)果。數(shù)據(jù)量的大小影響算法的性能,通常情況下,數(shù)據(jù)量越多,模型算法的性能越好。大數(shù)據(jù)環(huán)境下,電子健康記錄可以提供海量的數(shù)據(jù),機(jī)器學(xué)習(xí)算法與電子健康記錄相結(jié)合可為機(jī)器學(xué)習(xí)預(yù)測工具的開發(fā)提供平臺(tái)。應(yīng)根據(jù)數(shù)據(jù)集的特點(diǎn)選擇最優(yōu)的機(jī)器學(xué)習(xí)算法,在提升預(yù)測模型性能的同時(shí)可適當(dāng)增加數(shù)據(jù)訓(xùn)練和交叉驗(yàn)證。機(jī)器學(xué)習(xí)正不斷以一種潛在的革命方式,為醫(yī)患帶來新的體驗(yàn)。

猜你喜歡
機(jī)器向量森林
機(jī)器狗
向量的分解
機(jī)器狗
聚焦“向量與三角”創(chuàng)新題
未來機(jī)器城
電影(2018年8期)2018-09-21 08:00:06
哈Q森林
哈Q森林
哈Q森林
向量垂直在解析幾何中的應(yīng)用
哈Q森林
汉寿县| 咸丰县| 洛南县| 镇沅| 皋兰县| 揭西县| 库尔勒市| 上蔡县| 黔西| 泰来县| 旺苍县| 新平| 庄河市| 吉林省| 罗山县| 平南县| 汉沽区| 新沂市| 交口县| 扎赉特旗| 文水县| 墨玉县| 自治县| 万州区| 黄石市| 乌拉特中旗| 宁波市| 娄烦县| 天峨县| 兴国县| 温泉县| 株洲市| 达拉特旗| 徐闻县| 台南县| 阿拉善右旗| 曲松县| 万荣县| 宁乡县| 乐平市| 浦城县|