摘? 要:動(dòng)態(tài)心電圖,即使用動(dòng)態(tài)心電圖儀監(jiān)控患者日常生活的24小時(shí)或者更長(zhǎng)的時(shí)間中的心率活動(dòng)情況所得到的波形圖。動(dòng)態(tài)心電圖在臨床上已由單導(dǎo)、雙導(dǎo)發(fā)展為十二導(dǎo)聯(lián)全記錄。為了準(zhǔn)確預(yù)測(cè)不同心電圖的心電信息,研究并提出了一種利用改進(jìn)深度學(xué)習(xí)網(wǎng)絡(luò),對(duì)十二導(dǎo)聯(lián)心電信號(hào)進(jìn)行心律失常的自動(dòng)診斷,考慮到心電信號(hào)前后的相關(guān)性,提出利用LSTM網(wǎng)絡(luò)結(jié)合CNN深度學(xué)習(xí)框架,并融合批歸一化提高模型計(jì)算效率和準(zhǔn)確性,最終達(dá)到很好的效果。
關(guān)鍵詞:心電圖;心律失常;長(zhǎng)短期記憶;深度學(xué)習(xí)
Abstract:Dynamic electrocardiogram (Holter),that is,the waveform chart obtained by monitoring the heart rate activity of patients in 24 hours or more in their daily life by using dynamic electrocardiograph. Dynamic electrocardiogram (Holter) has been developed from single lead and double lead to 12-lead full recording. In order to accurately predict the ECG information of different electrocardiograms,an improved deep learning network is proposed to automatically diagnose arrhythmia of 12-lead ECG signals. Considering the correlation between ECG signals,LSTM network combined with CNN deep learning framework is proposed,and batch normalization is integrated to improve the calculation efficiency and accuracy of the model,and finally achieve good results.
Keywords:electrocardiogram;arrhythmia;long-term and short-term memory;deep learning
0? 引? 言
心臟內(nèi)部的活動(dòng)會(huì)產(chǎn)生的一系列活動(dòng)在體表會(huì)形成不同的電位差,這些電位差被稱為電信號(hào)。心電圖儀則是通過(guò)將正負(fù)兩電極置于人體的任何兩點(diǎn),再與心電圖儀連接,描記出此人的心電圖(ECG)。
目前國(guó)際上通用的動(dòng)態(tài)十二導(dǎo)聯(lián)心電圖是對(duì)傳統(tǒng)的心電圖進(jìn)行改進(jìn)的方法,通過(guò)將電極分別置于人體的十二個(gè)部位來(lái)獲得人體心率活動(dòng)的情況,描述十二個(gè)部位的代號(hào)分別為:Ⅰ、Ⅱ、Ⅲ、avR、avL、avF、V1、V2、V3、V4、V5、V6。
醫(yī)學(xué)上,心電圖的作用在于醫(yī)生可以通過(guò)它來(lái)判斷患者的心臟是否存在病灶。與大多數(shù)時(shí)間序列類似,手動(dòng)分析ECG信號(hào)的主要問(wèn)題在于:從業(yè)人員難以檢測(cè)和分類信號(hào)中不同的波形和形態(tài),在診斷過(guò)程中既耗時(shí)又可能產(chǎn)生差錯(cuò)[1]。
因此,研究人員想到了利用計(jì)算機(jī)來(lái)對(duì)心電圖進(jìn)行分析、預(yù)測(cè),由此判斷患者心臟是否存在病灶。
在以往文獻(xiàn)中多數(shù)研究者采用了機(jī)器學(xué)習(xí)的方法對(duì)心電圖進(jìn)行分析[2,3],常規(guī)的方法包括支持向量機(jī)[4]、決策樹(shù)[5]和CNN[6]、LSTM[7]等,同時(shí)他們?cè)诜治銮埃捎昧诵〔ㄗ儞Q[8]、圖形識(shí)別[9]、模板匹配[10]、能量閾值[11]等方法,但這些方法依舊存在缺陷,尚不成熟。
基于北京郵電大學(xué)信息網(wǎng)絡(luò)中心進(jìn)行的深度學(xué)習(xí)實(shí)驗(yàn)課題,本文提出了一種基于十二導(dǎo)聯(lián)心電圖的心率失常快速分類方法,筆者為了實(shí)現(xiàn)更快捷準(zhǔn)確的進(jìn)行心率判斷,根據(jù)心電圖自身的前后依賴特性,以及考慮到數(shù)據(jù)量大小以及神經(jīng)網(wǎng)絡(luò)的深度,在容易出現(xiàn)過(guò)擬合和梯度消失的問(wèn)題上,將卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)合,并引入批歸一化(Batch Normalization,BN)算法,用于解決以上問(wèn)題。分類器是基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)以及卷積神經(jīng)網(wǎng)絡(luò)(CNN)所設(shè)計(jì)。將十二導(dǎo)聯(lián)心電圖的數(shù)據(jù)作為分類器的輸入,將數(shù)據(jù)通過(guò)LSTM與池化處理,并在原有的基礎(chǔ)上增加了批歸一化層,以診斷結(jié)果為輸出,加快模型擬合速度并且提高了模型準(zhǔn)確率,使準(zhǔn)確率達(dá)到99.55%。
1? 方法
1.1? 數(shù)據(jù)預(yù)處理
在信號(hào)采集的過(guò)程中,由于外界等各種原因,采集到的信號(hào)會(huì)伴隨有噪音,這些噪音的存在會(huì)對(duì)最后實(shí)驗(yàn)的結(jié)果準(zhǔn)確性造成影響,因此為了提高ECG信號(hào)的信噪比,進(jìn)而提高實(shí)驗(yàn)的準(zhǔn)確性,在數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)之前,應(yīng)先對(duì)其進(jìn)行降噪處理,本文采用小波降噪的方法。如圖1所示,小波降噪后的信號(hào)保留了原有信號(hào)中的有用數(shù)據(jù),在一定程度上消除了部分噪音。
1.2? 長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)
長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)(LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)的變體,是為了解決RNN中存在的長(zhǎng)期依賴而設(shè)計(jì)出的人工神經(jīng)網(wǎng)絡(luò)。與經(jīng)典RNN有所不同的是,LSTM突破性的引入了門機(jī)制和記憶單元,為由于梯度消失和梯度爆炸問(wèn)題導(dǎo)致的常規(guī)RNN網(wǎng)絡(luò)在長(zhǎng)期依賴問(wèn)題中的困境提供了解決方法。
LSTM由遺忘門(forget gates)、輸入門(input gates)和輸出門(output gates)三種門結(jié)構(gòu)保存歷史信息,相關(guān)公式為:
其中,ft是遺忘門t時(shí)刻的狀態(tài)值,it是輸入門t時(shí)刻的狀態(tài)值,W和b分別為對(duì)應(yīng)的權(quán)值和偏置,σ為參數(shù),xt是t時(shí)刻輸入的數(shù)據(jù),Ct是t時(shí)刻記憶單元的值, 表示輸入門t時(shí)刻記憶單元的候選信息,ot是輸出門t時(shí)刻的狀態(tài)值,ht是t時(shí)刻LSTM的輸出狀態(tài)值,其中記憶單元的狀態(tài)值是由輸入門和遺忘門共同調(diào)節(jié)。
1.3? 最大池化
池化(Pooling)是卷積神經(jīng)網(wǎng)絡(luò)中一個(gè)重要的部分,用于提取大量高緯度輸入數(shù)據(jù)的關(guān)鍵部分,來(lái)縮小模型大小,提高計(jì)算速度,同時(shí)提高被提取特征的魯棒性。其中最大池化(Max Pooling)為最常見(jiàn)的一種池化操作,將輸入數(shù)據(jù)根據(jù)設(shè)定的卷積核劃分為等大的幾個(gè)區(qū)域,輸出每個(gè)區(qū)域的最大值,并將這些最大值重新組合成為一個(gè)新的數(shù)據(jù),池化層(Pooling Layer)可以不斷減小數(shù)據(jù)大小,在深度學(xué)習(xí)中有效控制數(shù)據(jù)量和計(jì)算量,從而防止模型過(guò)擬合,如圖2所示,為一次簡(jiǎn)單的最大池化操作示例,其中使用的為2×2卷積核,每一不同顏色的區(qū)域?yàn)槊看尾煌木矸e操作區(qū)域。
1.4? 批歸一化
批歸一化是谷歌公司在2015年提出的一個(gè)深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的技巧,把數(shù)據(jù)分成小批進(jìn)行隨機(jī)梯度下降,并且在每一批數(shù)據(jù)前向傳遞時(shí),對(duì)其進(jìn)行歸一化處理[13]。該算法不僅加快了深度神經(jīng)網(wǎng)絡(luò)模型收斂的速度,而且在一定程度上緩解了神經(jīng)網(wǎng)絡(luò)中數(shù)據(jù)分布分散的問(wèn)題,使得模型更加穩(wěn)定,提高網(wǎng)絡(luò)泛化能力。該算法還可以作為神經(jīng)網(wǎng)絡(luò)中的一層放在激活函數(shù)之前,流程主要為:對(duì)每一批次的訓(xùn)練數(shù)據(jù)計(jì)算獲得其均值和方差,并歸一化,最后對(duì)處理過(guò)的數(shù)據(jù)進(jìn)行尺度變換和偏移,使其適應(yīng)神經(jīng)網(wǎng)絡(luò)。
2? 模型構(gòu)建
本文使用的是LSTM網(wǎng)絡(luò)和CNN結(jié)合并引入BN算法的方式,將十二導(dǎo)聯(lián)心電圖輸入數(shù)據(jù),看作多通道一維數(shù)據(jù),因此本文使用的是一維卷積層和一維池化層提取心電信號(hào)。
構(gòu)建模型如圖3所示,輸入層的輸入維度為5 000× 12,由卷積層捕捉數(shù)據(jù)的大量局部關(guān)聯(lián)信息,并且使用批歸一化提高計(jì)算速度并提高模型魯棒性;由長(zhǎng)短期記憶層提取時(shí)序特征,并將這兩個(gè)特征融合到全連接層,最后通過(guò)Softmax層的激活函數(shù)進(jìn)行輸出,加入批歸一層提高計(jì)算效率,并降低過(guò)擬合可能性。
3? 實(shí)驗(yàn)結(jié)果與分析
3.1? 實(shí)驗(yàn)平臺(tái)及評(píng)價(jià)指標(biāo)
實(shí)驗(yàn)平臺(tái)的硬件配置為2.4 GHz Intel Core i5,圖形卡為Intel Iris Plus Graphics 655(顯存1 536 MB),內(nèi)存32 GB,操作系統(tǒng)為MacOS 10.14.6,模型基于Python語(yǔ)言的Keras框架實(shí)現(xiàn)。
在心電圖判斷模型中,一般使用準(zhǔn)確率、特異性和靈敏度為指標(biāo)對(duì)模型進(jìn)行判斷?;煜仃嚲褪欠謩e統(tǒng)計(jì)模型的歸錯(cuò)部分和歸對(duì)部分的觀測(cè)值的個(gè)數(shù),將結(jié)果反映在一張表格中,混淆矩陣的每一列代表了預(yù)測(cè)的類別,每一列的總數(shù)表示了預(yù)測(cè)為該類的數(shù)目,每一行代表著對(duì)應(yīng)數(shù)據(jù)的真實(shí)類別,每一行的總數(shù)表示對(duì)應(yīng)數(shù)據(jù)為該類的數(shù)目。
準(zhǔn)確率(Acc)表示對(duì)于給定的測(cè)試集,模型準(zhǔn)確分類的概率;特異性(Spe)表示負(fù)例被模型準(zhǔn)確預(yù)測(cè)的概率;靈敏度(Sen)表示正例被模型正確分類的概率。
3.2? 結(jié)果分析
圖4中的混淆矩陣表示本文所用模型的判斷結(jié)果。
其中這18類分別為竇性心律、竇性心動(dòng)過(guò)緩、竇性心動(dòng)過(guò)速、T波改變、電軸左偏、電軸右偏、竇性心律不齊、右束支傳導(dǎo)阻滯、室性早搏、完全性右束支傳導(dǎo)阻滯、左心室高電壓、房性早搏、ST-T改變、ST段改變、一度房室傳導(dǎo)阻滯、不完全性右束支傳導(dǎo)阻滯、心房顫動(dòng)、快速心室率。
可以注意到,由于數(shù)據(jù)樣本數(shù)量的不平衡,模型對(duì)0、1、11、12的識(shí)別能力較好,這幾種類別分別代表竇性心律、竇性心動(dòng)過(guò)緩、房性早搏和ST-T改變。
表2總結(jié)了本文所提出的方法和其他文獻(xiàn)中已有的判斷方法的結(jié)果,從表中可看出,本文提出方法的數(shù)據(jù)預(yù)測(cè)能力更占優(yōu)勢(shì)。
4? 結(jié)? 論
傳統(tǒng)學(xué)習(xí)方法分析心電信息主要分為特征提取以及分類兩部分,其中分類一般采用傳統(tǒng)機(jī)器學(xué)習(xí)方法或者傳統(tǒng)CNN模型,前者為線性方法,容易造成特征的缺失,后者手段單一,并且容易學(xué)習(xí)效率和準(zhǔn)確率都無(wú)法達(dá)到預(yù)期效果,本文采用LSTM與CNN結(jié)合,并創(chuàng)造性地引入BN算法的方式,既提高了計(jì)算速度,又克服了傳統(tǒng)方法的缺陷,并且模型本身已有特征提取功能,并且很好地提取了數(shù)據(jù)上下文信息,最終達(dá)到的測(cè)試結(jié)果的準(zhǔn)確率為99.55%,特異性為99.81%,靈敏度為98.66%。
本文提出的方法同時(shí)具有推廣性和現(xiàn)實(shí)價(jià)值,適用范圍廣。在之后的研究中,深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化以及與醫(yī)療相關(guān)知識(shí)的學(xué)習(xí)都需要進(jìn)一步優(yōu)化,如在LSTM基礎(chǔ)上添加Attention機(jī)制,解決輸入序列較長(zhǎng)時(shí)最終難以獲得合理的向量表示的問(wèn)題。
參考文獻(xiàn):
[1] ANNAM J R,SURAMPUDI B R. AAMI Based ECG Heart-Beat Time-Series Clustering Using Unsupervised ELM and Decision Rule [C]//International Conference on Information Technology.IEEE,2017.
[2] ESMAILI A,KACHUEE M,SHABANY M. Nonlinear Cuffless Blood Pressure Estimation of Healthy Subjects Using Pulse Transit Time and Arrival Time [J].IEEE Transactions on Instrumentation and Measurement,2017,66(12):3299-3308.
[3] DASTJERDI A E,KACHUEE M,SHABANY M. Non-invasive blood pressure estimation using phonocardiogram [C]//IEEE International Symposium on Circuits & Systems.IEEE,2017.
[4] 王金海,史夢(mèng)穎,張興華.基于EMD和ApEn特征提取的心律失常分類研究 [J].儀器儀表學(xué)報(bào),2016,37(S1):168-173.
[5] PECCHIA L,MELILLO P,SANSONE M,et al. Discrimination Power of Short-Term Heart Rate Variability Measures for CHF Assessment [J].IEEE Transactions on Information Technology in Biomedicine,2012,15(1):40-46.
[6] ACHARYA U R,OH S L,HAGIWARA Y,et al. A deep convolutional neural network model to classify heartbeats [J].Computers in Biology and Medicine,2017,89(16):389-396.
[7] KIRANYAZ S,INCE T,HAMILA R,et al. Convolutional Neural Networks for patient-specific ECG classification [C]//Proceedings of the 37th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC).Milan,Italy:IEEE,2015.
[8] STOJANOVIC R,KARADAGLIC D,MIRKOVI? M,et al. A FPGA system for QRS complex detection based on Integer Wavelet Transform [J].Measurement ence Review,2011,11(4):131-138.
[9] CHRISTOV I,GóMEZ-HERRERO G,KRASTEVA V,et al. Comparative study of morphological and time-frequency ECG descriptors for heartbeat classification [J].Medical Engineering & Physics,2006,28(9):876-887.
[10] NAKAI Y,IZUMI S,NAKANO M,et al. Noise tolerant QRS detection using template matching with short-term autocorrelation [C]//Proceedings of the 36th Annual International Conference of the IEEE Engineering in Medicine and Biology Society.Chicago:IEEE,2014:250-255.
[11] CHOUHAN V S,MEHTA S S. Detection of QRS Complexes in 12-lead ECG using Adaptive Quantized Threshold [J].International Journal of Computer Ence & Network Security,2008(1):155-163.
[13] IOFFE S,SZEGEDY C. Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shift [J/OL].arXiv:1502.03167 [cs.LG].(2015-02-11).https://arxiv.org/abs/1502.03167.
[14] 吳浪,曾超.EMD分解與IIR濾波器在心電信號(hào)預(yù)處理的應(yīng)用研究 [J].福建電腦,2015,31(6):97-98.
[15] HANNUN A Y,RAJPURKAR P,HAGHPANAHI M,et al. Cardiologist-level arrhythmia detection and classification in ambulatory electrocardiograms using a deep neural network [J].Nature Medicine,2019,25(1):65-69.
[16] 張異凡,黃亦翔,汪開(kāi)正,等.用于心律失常識(shí)別的LSTM和CNN并行組合模型 [J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2019,51(10):76-82.
作者簡(jiǎn)介:余天效(1996—),女,漢族,湖北襄陽(yáng)人,碩士研究生,研究方向:機(jī)器學(xué)習(xí)。