国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Keras的LSTM模型的心肌梗死患者發(fā)病預(yù)測

2022-09-22 07:48劉志雄潘媛媛
電腦知識與技術(shù) 2022年23期
關(guān)鍵詞:標(biāo)簽心肌梗死預(yù)測

劉志雄,潘媛媛,2

(1.皖南醫(yī)學(xué)院醫(yī)學(xué)信息學(xué)院,安徽蕪湖 241002;2.皖南醫(yī)學(xué)院健康大數(shù)據(jù)挖掘與應(yīng)用研究中心,安徽蕪湖 241002)

1 相關(guān)問題提出

心肌梗死(AMI)是冠狀動脈急性、持續(xù)性缺血缺氧所引起的心肌壞死。約半數(shù)以上的急性心肌梗死患者,在起病前1—2天或1—2周有前驅(qū)癥狀,其前驅(qū)癥狀需要得到患者以及家屬重視,最常見的是原有的心絞痛加重,心絞痛發(fā)作時(shí)間延長,或患者對硝酸甘油效果變差;或一些繼往無心絞痛者,突然出現(xiàn)長時(shí)間心絞痛或出現(xiàn)不規(guī)律的頻繁心絞痛癥狀。心肌梗死可并發(fā)心律失常、導(dǎo)致患者休克或心力衰竭,其癥狀嚴(yán)重,??晌<吧??;颊咭坏┐_診心肌梗死,病情難以控制或無法預(yù)測其發(fā)病時(shí)間,導(dǎo)致患者傷亡高。中國近年來心絞痛患者人數(shù)呈明顯上升趨勢,且40歲以下中年人群發(fā)病率呈逐年上升趨勢,每年新發(fā)至少50萬,現(xiàn)有患者至少200萬,心肌梗死作為老年人常見病,其發(fā)病率高,發(fā)病后會對患者造成不可逆的傷害。

關(guān)于疾病發(fā)生預(yù)測的研究一直是各領(lǐng)域研究的熱點(diǎn),目前國內(nèi)的心肌梗死疾病預(yù)測大多數(shù)針對預(yù)后治療和疾病死亡率,2020年有學(xué)者通過Logistic回歸分析急性ST段抬高型心肌梗死患者(STEMI)PCI術(shù)后6月發(fā)生不良心血管事件(MACE)的危險(xiǎn)因素[2];在心肌梗死領(lǐng)域,學(xué)者通過獲取Holter文件、心率變異SDNN及超聲心動圖檢測的左室射血分?jǐn)?shù)、左室舒張末期直徑的參數(shù),對患者進(jìn)行隨訪,采用變量回歸分析得到室性早搏后竇性心律震蕩現(xiàn)象的減弱或消失是急性心肌梗死后患者死亡的獨(dú)立預(yù)測指標(biāo)[3];在疾病預(yù)測領(lǐng)域也有學(xué)者采用回顧性分析,探討SYNTAX積分和Gensini評分對急性ST段抬高心肌梗死(STEMI)患者遠(yuǎn)期預(yù)后的預(yù)測價(jià)值[4].

基于深度學(xué)習(xí)的模型正在革命性地改變部分領(lǐng)域,它能夠解決涉及大量快速變化的高維數(shù)據(jù)[5]。深度學(xué)習(xí)模型的搭建也成為熱門應(yīng)用。神經(jīng)網(wǎng)絡(luò)與預(yù)測臨床事件的遞歸神經(jīng)網(wǎng)絡(luò)(RNN)模型被發(fā)現(xiàn)相對于其他傳統(tǒng)的方法更準(zhǔn)確,但不容易解釋。長短時(shí)記憶網(wǎng)絡(luò)(LSTM)是近年來應(yīng)用于臨床數(shù)據(jù)的一種遞歸神經(jīng)網(wǎng)絡(luò),用于學(xué)習(xí)醫(yī)學(xué)概念的低維表示,并對特定臨床措施活動的時(shí)間序列進(jìn)行分類處理,LSTM對于時(shí)間序列的處理準(zhǔn)確度高,模型更易被大眾接受,因此,LSTM現(xiàn)在被廣泛應(yīng)用于時(shí)間序列分析預(yù)測。相比較RNN而言,LSTM可以保存數(shù)據(jù)更久,其時(shí)間梯度損失較慢,LSTM使得計(jì)算機(jī)對語言的處理不再停留在簡單的字面匹配層面,而是進(jìn)一步深入到語義理解的層面。

心肌梗死涵蓋人體系統(tǒng)范圍廣、病因復(fù)雜,因此,針對心肌梗死的研究進(jìn)展一直比較緩慢,并且心肌梗死的研究主要集中于病理學(xué)、臨床醫(yī)學(xué)、生物化學(xué)和分子生物學(xué)等醫(yī)學(xué)或生命學(xué)領(lǐng)域,計(jì)算機(jī)科學(xué)領(lǐng)域的研究相較不多。本項(xiàng)目將基于LSTM算法,關(guān)注在未確診病情狀況下,通過對患者出現(xiàn)心肌梗死早期癥狀進(jìn)行研究,預(yù)測患者患有心肌梗死的概率。

2 基于Keras的LSTM模型

長短期記憶網(wǎng)絡(luò)(Long—Short Term Memory,LSTM)在1997年提出的。LSTM模型是RNN模型的一種。LSTM由于其設(shè)計(jì)特點(diǎn),適合對時(shí)間序列進(jìn)行建模預(yù)測,如文本數(shù)據(jù)、圖片數(shù)據(jù)、時(shí)間序列數(shù)據(jù)。RNN模型在處理長期記憶時(shí)[6],存在嚴(yán)重的梯度消失問題,因此RNN模型很難處理長序列的數(shù)據(jù)或RNN模型在處理長序列的數(shù)據(jù)時(shí)準(zhǔn)確度斷崖式下降。為了解決這一問題,從RNN模型上衍生出了LSTM模型,它解決了常規(guī)RNN模型的梯度消失問題,使得模型在進(jìn)行長序列數(shù)據(jù)預(yù)測時(shí),能夠表現(xiàn)出更好的效果,因此LSTM模型受到了廣泛的應(yīng)用。

2.1 LSTM網(wǎng)絡(luò)

LSTM模型的結(jié)構(gòu)相對于RNN較為復(fù)雜,LSTM模型的細(xì)胞結(jié)構(gòu)是隊(duì)列結(jié)構(gòu),LSTM模型是若干個(gè)細(xì)胞串聯(lián)而成,在進(jìn)行模型訓(xùn)練或數(shù)據(jù)預(yù)測時(shí),數(shù)據(jù)從第一個(gè)細(xì)胞進(jìn)入,在細(xì)胞內(nèi)存在激活函數(shù),遺忘門等細(xì)胞內(nèi)容,數(shù)據(jù)被當(dāng)前細(xì)胞處理之后,將得到一個(gè)輸出結(jié)果并將輸出結(jié)果傳遞至下一個(gè)細(xì)胞,下一個(gè)細(xì)胞將對傳入的數(shù)據(jù)進(jìn)行同樣的處理,直至最后一個(gè)細(xì)胞將最終結(jié)果輸出。在訓(xùn)練LSTM模型的過程中,數(shù)據(jù)通過細(xì)胞后,得出最終結(jié)果,LSTM模型會將該結(jié)果與真實(shí)結(jié)果進(jìn)行比對,同時(shí)LSTM會通過比對的結(jié)果,對細(xì)胞內(nèi)部的參數(shù)進(jìn)行調(diào)整、優(yōu)化,使LSTM模型下一次輸出的結(jié)果與真實(shí)結(jié)果更加相近。但訓(xùn)練過程中,為了防止出現(xiàn)結(jié)果過擬合,LSTM模型會在每次訓(xùn)練時(shí),會使用正則化防止過擬合。LSTM模型細(xì)胞結(jié)構(gòu)如圖1所示。

1)細(xì)胞狀態(tài)

LSTM模型每個(gè)細(xì)胞都擁有自己的細(xì)胞狀態(tài),細(xì)胞狀態(tài)為LSTM訓(xùn)練過程中,該細(xì)胞輸出的值,在數(shù)據(jù)完整地通過一次所有細(xì)胞,細(xì)胞狀態(tài)會根據(jù)此次結(jié)果進(jìn)行更新優(yōu)化,細(xì)胞狀態(tài)的優(yōu)化調(diào)整直至訓(xùn)練結(jié)束或細(xì)胞狀態(tài)達(dá)到最佳。

2)遺忘門

遺忘門是控制是否遺忘信息的“決策機(jī)構(gòu)”。遺忘門為當(dāng)前細(xì)胞輸入內(nèi)容,即為上一細(xì)胞的輸出結(jié)果。細(xì)胞并不能直接處理上一個(gè)細(xì)胞的輸出結(jié)果,在實(shí)際的模型中,細(xì)胞的輸入以及細(xì)胞的輸出具有很大的差異,遺忘門會對上一細(xì)胞的輸出結(jié)果進(jìn)行函數(shù)變換,將上一個(gè)細(xì)胞的結(jié)果轉(zhuǎn)化成可用的細(xì)胞輸入。遺忘門的公式如式(1)所示。ht,xt為兩個(gè)向量合并,Wf為函數(shù)的權(quán)重,σ是細(xì)胞的激活函數(shù)(sigmoid函數(shù)),bf是函數(shù)偏置量。

3)輸入門

輸入門由兩個(gè)部分組成,第一部分使用了sigmoid激活函數(shù),輸出為it。第二部分為使用了tanh激活函數(shù),輸出為at。輸出門的公式如式(2)與式(3)所示。

公式中Wi,Ui,Ua,Wa為權(quán)重,bf為函數(shù)的偏置量。

4)細(xì)胞狀態(tài)更新

細(xì)胞狀態(tài)更新是輸出門之前重要的一環(huán),遺忘門與輸入門的結(jié)果都會作用于細(xì)胞狀態(tài),細(xì)胞狀態(tài)的更新將決定該模型的優(yōu)劣,當(dāng)訓(xùn)練結(jié)束后,細(xì)胞狀態(tài)停止更新。細(xì)胞狀態(tài)更新公式如式(4)與式(5)所示。?為Hadamard積,Ct-1為前一時(shí)刻細(xì)胞狀態(tài),Ct為當(dāng)前時(shí)刻細(xì)胞狀態(tài)。

5)輸出門

輸出門分為兩個(gè)部分,第一部分如式(6)所示,第二部分如式(7)所示。輸出門最終結(jié)果為當(dāng)前時(shí)刻的輸出。

2.2 基于Keras的LSTM神經(jīng)網(wǎng)絡(luò)模型

Keras是基于TensorFlow框架和Theano的深度學(xué)習(xí)庫,是由Python語言編寫而成的神經(jīng)網(wǎng)絡(luò)API,Keras具有很多優(yōu)勢:原型快速且簡易,對初學(xué)者友好;模塊化結(jié)構(gòu),Keras內(nèi)模型獨(dú)立,損失函數(shù),優(yōu)化函數(shù),激活函數(shù)模塊可根據(jù)需求直接進(jìn)行調(diào)用,數(shù)據(jù)處理效果理想;模型擴(kuò)展性好,添加新模塊容易,只需要仿照現(xiàn)有的模塊編寫新的類或函數(shù);模型與Python協(xié)作性好,Keras無需單獨(dú)的模型配置文件,模型內(nèi)容在代碼可以直接體現(xiàn),因此模型調(diào)試擴(kuò)展很方便。

3 心肌梗死的LSTM模型實(shí)現(xiàn)

利用LSTM模型實(shí)現(xiàn)對心肌梗死的發(fā)病預(yù)測,將數(shù)據(jù)集劃分為訓(xùn)練集與測試集,通過訓(xùn)練集訓(xùn)練LSTM模型,多次訓(xùn)練得出最優(yōu)的訓(xùn)練模型,再用測試集測試訓(xùn)練出的LSTM模型,得出模型對心肌梗死患者發(fā)病預(yù)測的準(zhǔn)確率,選擇準(zhǔn)確度最高的模型,模型準(zhǔn)確率是判斷模型優(yōu)劣的重要指標(biāo)。

3.1 數(shù)據(jù)介紹

該數(shù)據(jù)集包括Age,Sex,Cp等等14個(gè)標(biāo)簽,該標(biāo)簽內(nèi)容呈時(shí)間序列,時(shí)間間隔為3個(gè)月。數(shù)據(jù)部分如表1所示,數(shù)據(jù)部分標(biāo)簽的意義如下。

表1 數(shù)據(jù)集(部分)

Cp:經(jīng)歷過的胸痛類型(值1:典型心絞痛,值2:非典型性心絞痛,值3:非心絞痛,值4:無癥狀)。

Trestbps:患者的靜息血壓(入院時(shí)的毫米汞柱)。

Chol:患者的膽固醇測量值,單位:mg/dl。

3.2 數(shù)據(jù)分析及處理

對各項(xiàng)標(biāo)簽進(jìn)行相關(guān)性分析,可以得出各個(gè)標(biāo)簽對最終結(jié)果的相關(guān)性,以此為依據(jù),可以排除部分無相關(guān)性的數(shù)據(jù),這種做法可以提高模型的準(zhǔn)確性,分析結(jié)果如圖2所示,其中1代表該標(biāo)簽與患者患病完全正相關(guān),-1代表該標(biāo)簽與患者患病完全負(fù)相關(guān)。

圖2 相關(guān)性分析

由圖2知:是否患病和Cp、Thalach、Slope等標(biāo)簽正相關(guān),和Eang、Oldpeak、Ca、Thal等標(biāo)簽負(fù)相關(guān)。選取與患病相關(guān)性較高標(biāo)簽進(jìn)行下一步處理,同時(shí)去掉與患病相關(guān)性較低的標(biāo)簽。進(jìn)一步處理相關(guān)性最較高的標(biāo)簽與患者患病的關(guān)系,Thalach(靜息血壓)與Target關(guān)系,如圖3所示。Cp(胸痛類型)與Target關(guān)系,如圖4所示。

圖3 Thalach相關(guān)性

從圖3中橙色點(diǎn)分布情況可知,Thalach越大,患病的人數(shù)更多。而在運(yùn)動中產(chǎn)生胸痛的人中(Target值為1),該類人群存在許多胸痛現(xiàn)象,該類人群心率比較高,大部分集中在120~150之間,對于并沒有心臟病的人群,該人群僅僅心率較高,并未產(chǎn)生胸痛。由圖4知,胸痛類型1、2、3患病概率更大[7]。

圖4 Cp相關(guān)性

3.3 模型搭建

使用Keras建立LSTM模型包括數(shù)據(jù)預(yù)處理、定義模型、訓(xùn)練模型、評估模型以及使用模型進(jìn)行預(yù)測。數(shù)據(jù)預(yù)處理階段,提取數(shù)據(jù)集中相關(guān)性較高的若干特征標(biāo)簽,為該數(shù)據(jù)集生成DataFrame類型數(shù)據(jù),作為序列索引,提取出Target用作Y標(biāo)簽,即結(jié)果標(biāo)簽。對提取出的數(shù)據(jù)進(jìn)行非空處理,填補(bǔ)缺失的數(shù)據(jù),并對其中Trestbps、Chol等特征標(biāo)簽歸一化處理,將數(shù)據(jù)映射至(0,1)范圍內(nèi),如果不對數(shù)據(jù)進(jìn)行歸一化處理,模型的LOSS將會很大,模型訓(xùn)練效果也會很不理想。將處理后的數(shù)據(jù)劃分?jǐn)?shù)據(jù)集,設(shè)置標(biāo)志dataFlag=0.7,標(biāo)志前數(shù)據(jù)為訓(xùn)練集,標(biāo)志后為測試集。xtrain={x1,x2,x3,...x0.8*len}和xtest={x0.8*len+1,...xlen-1xlen}。數(shù)據(jù)處理完成后,定義、構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò),本次實(shí)驗(yàn)采用了Keras中Sequential層次模型,采用層層線性疊加構(gòu)架激活函數(shù)為relu函數(shù),評估函數(shù)為MSE(均方誤差)。輸入處理好的訓(xùn)練集數(shù)據(jù)進(jìn)入模型,訓(xùn)練迭代128次,若訓(xùn)練損失函數(shù)較低,將提前結(jié)束訓(xùn)練。訓(xùn)練結(jié)束后,對模型進(jìn)行測試,輸入測試集數(shù)據(jù)進(jìn)入模型,分析測試結(jié)果,得出結(jié)果參數(shù)。

3.4 實(shí)驗(yàn)結(jié)果分析

本次使用采用了對比實(shí)驗(yàn),選取卷積神經(jīng)網(wǎng)絡(luò)RNN是深度學(xué)習(xí)常用算法之一,屬于多層前饋網(wǎng)絡(luò),使用訓(xùn)練完成的LSTM神經(jīng)網(wǎng)絡(luò)模型與RNN卷積神經(jīng)網(wǎng)絡(luò)模型對同一組數(shù)據(jù)進(jìn)行預(yù)測,對比預(yù)測結(jié)果。

1)評估標(biāo)準(zhǔn)

使用均方誤差(MSE),檢測模型預(yù)測值與真實(shí)值之間的差異,MSE公式如式(8)所示。

損失函數(shù)(LOSS),損失函數(shù)可以用來評估模型的預(yù)測值和真實(shí)值不一致程度,LOSS函數(shù)可以很好地反映該模型訓(xùn)練結(jié)果是否準(zhǔn)確。LOSS公式如式(9)所示。

2)實(shí)驗(yàn)結(jié)果分析

本節(jié)將通過MSE與LOSS兩種評估方法,去對比LSTM模型與RNN模型對本數(shù)據(jù)集的處理效果。在LSTM模型中,一共訓(xùn)練了100次,BitchSize為訓(xùn)練集的長度,優(yōu)化器為Adam。

LSTM模型的MSE為0.332,RNN模型的MSE為0.711。LSTM模型的LOSS為0.0604,RNN模型的MSE為0.351。

表2 實(shí)驗(yàn)結(jié)果比對

從實(shí)驗(yàn)評估標(biāo)準(zhǔn)看,LSTM模型的預(yù)測精度更高。

4 結(jié)束語

本文基于LSTM模型,通過對心肌梗死患者在不同時(shí)間的生命體征數(shù)據(jù)進(jìn)行相關(guān)性分析,擇取與心肌梗死發(fā)病相關(guān)性較高的若干項(xiàng)標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練。利用LSTM模型對處理后的數(shù)據(jù)進(jìn)行訓(xùn)練并對實(shí)現(xiàn)心肌梗死發(fā)病預(yù)測,得到發(fā)病預(yù)測結(jié)果。將上述結(jié)果與RNN模型預(yù)測結(jié)果進(jìn)行對比,對比結(jié)果顯示:LSTM模型對心肌梗死發(fā)病預(yù)測結(jié)果準(zhǔn)確更高,模型擬合性更優(yōu),LSTM模型可用于心肌梗死發(fā)病率預(yù)測。

猜你喜歡
標(biāo)簽心肌梗死預(yù)測
無可預(yù)測
選修2-2期中考試預(yù)測卷(A卷)
選修2-2期中考試預(yù)測卷(B卷)
無懼標(biāo)簽 Alfa Romeo Giulia 200HP
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
標(biāo)簽化傷害了誰
急性心肌梗死合并心力衰竭的護(hù)理
基于多進(jìn)制查詢樹的多標(biāo)簽識別方法
中醫(yī)藥防治心肌梗死:思考與展望
替格瑞洛在老年心肌梗死急診冠狀動脈介入治療中的作用研究