張 繁,尹 鑫,徐宇揚(yáng),郝鵬翼
(1.浙江工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,浙江 杭州 310023;2.吉林大學(xué)軟件學(xué)院,吉林 長春 130000)
隨著我國城市化進(jìn)程的推進(jìn)和生活條件的改善,心血管疾病在我國的發(fā)生率及死亡率逐步上升。心電圖(electrocardiogram,ECG)作為一項(xiàng)簡單、快速、非侵入式的檢查方式,被廣泛作為心血管疾病的初步檢查手段。標(biāo)準(zhǔn)的心電圖一般由12 條導(dǎo)聯(lián)組成,每條導(dǎo)聯(lián)以電信號(hào)的方式記錄著心臟不同方向的跳動(dòng)情況,從而綜合反映心臟的健康狀況。而每條導(dǎo)聯(lián)又由若干個(gè)心跳波形構(gòu)成,一個(gè)標(biāo)準(zhǔn)的心跳波形主要由P 波段、QRS 波群、T 波段組成,如圖1 所示。這些波段以固定的順序出現(xiàn),記錄著心臟的健康狀況。若出現(xiàn)異常波形則表明心臟產(chǎn)生病變,如心肌梗死可產(chǎn)生ST 段壓低、ST 段抬高、T 波倒置等異常波形,所以心跳波形對(duì)于分析心電圖具有重要意義。然而,逐一分析心電圖中的心跳波形是一項(xiàng)十分耗時(shí)、費(fèi)力的任務(wù),且對(duì)于醫(yī)生的經(jīng)驗(yàn)要求較高,還存在誤診的可能性。所以需要自動(dòng)化的分析檢測系統(tǒng)以輔助醫(yī)生分析心電信號(hào),從而做出更客觀、更準(zhǔn)確地判斷。一般分3 步進(jìn)行心跳信號(hào)分類:①心電信號(hào)預(yù)處理;②特征提取;③心跳分類。對(duì)于信號(hào)預(yù)處理,由于從患者身上采集的原始心電信號(hào)包含眾多噪聲,比如存在基線偏移、電力線干擾、肌電干擾等[1],所以獲得干凈、清晰的心電信號(hào)對(duì)于自動(dòng)檢測系統(tǒng)至關(guān)重要,許多研究者提出了不同的信號(hào)去噪方法。文獻(xiàn)[2]通過設(shè)置不同閾值,采用離散小波變換的方法消除原始信號(hào)中的基線偏移和高頻噪聲,但會(huì)影響原始信號(hào)中的低頻部分。文獻(xiàn)[3]使用經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)和自適應(yīng)均值濾波器的算法消除心電信號(hào)中的多種噪聲,并能保持QRS波群特征的相對(duì)完好。對(duì)于特征提取與心跳分類,由于心跳信號(hào)之間的差異較小,所以設(shè)計(jì)能夠提取有效、關(guān)鍵特征的提取器至關(guān)重要。文獻(xiàn)[4]采用同步壓縮變換的算法計(jì)算心跳信號(hào)的相位信息作為特征,然后使用支持向量機(jī)(support vector machine,SVM)分類器對(duì)4 種心律不齊進(jìn)行分類。文獻(xiàn)[5]利用基于多尺度能量和特征空間的方法來提取多尺度小波能量和特征值作為診斷特征,然后使用SVM分類器對(duì)多種心肌梗死進(jìn)行分類。然而這種傳統(tǒng)的,需要人為設(shè)計(jì)的特征提取方式不僅要求算法的設(shè)計(jì)人員對(duì)于心血管疾病有著充分的認(rèn)識(shí)和理解,而且最終提取到的特征存在一定的人為主觀性,且特征提取過程較為繁雜。所以近年來利用深度學(xué)習(xí)技術(shù)自動(dòng)提取特征的方式開始興起。文獻(xiàn)[6]回顧了利用深度學(xué)習(xí)分析生物信號(hào)(包括心電信號(hào))的53篇文章后發(fā)現(xiàn),利用深度學(xué)習(xí)技術(shù)有著明顯的優(yōu)勢。文獻(xiàn)[7]利用一個(gè) 34 層的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)自動(dòng)提取特征后對(duì)心跳信號(hào)進(jìn)行分類,最終結(jié)果優(yōu)于6 位心臟疾病專家的平均表現(xiàn)。文獻(xiàn)[8]設(shè)計(jì)了一個(gè)10 層端到端的CNN 對(duì)12 導(dǎo)聯(lián)心電信號(hào)進(jìn)行心肌梗死的分類。文獻(xiàn)[9]將CNN 與長短期記憶網(wǎng)絡(luò)(long short term memory,LSTM)結(jié)合起來,提取特征后利用全連接層對(duì)多種心律不齊進(jìn)行分類。
圖1 標(biāo)準(zhǔn)心跳示意圖[10] Fig.1 Standard heart beat figure[10]
通過上述回顧可發(fā)現(xiàn),多數(shù)研究者均使用單導(dǎo)聯(lián)或雙導(dǎo)聯(lián)的信號(hào)來進(jìn)行心跳分類[2-4,7-9,11-19],只有少數(shù)同時(shí)使用多導(dǎo)聯(lián)信息[5,20-22]。文獻(xiàn)[23]通過將多導(dǎo)聯(lián)心跳信號(hào)特征進(jìn)行堆疊后利用隨機(jī)森林(randomized forests,RF)和多層感知機(jī)(multi-layer perceptron,MLP)對(duì)多種心律不齊進(jìn)行分類。對(duì)于使用多導(dǎo)聯(lián)信號(hào)的研究,其均分別提取各導(dǎo)聯(lián)心跳特征,然后再進(jìn)行特征融合,這樣雖然能夠獲得較為全面的特征,但大大增加了算法的復(fù)雜度,并且在一定程度上忽略了不同導(dǎo)聯(lián)心跳信號(hào)的相關(guān)性。此外,由于心跳信號(hào)有特征分布不均勻,變化幅度不一的特點(diǎn),并認(rèn)為文獻(xiàn)[5,24]中多尺度的思路有助于全面挖掘出心跳信號(hào)中的特征信息,所以本文提出了一個(gè)基于多尺度特征提取的多導(dǎo)聯(lián)心跳信號(hào)分類方法,將來自不同導(dǎo)聯(lián)的心跳信號(hào)縱向堆疊后形成信號(hào)矩陣,利用3 種不同尺度的一維卷積提取特征,然后進(jìn)行不同尺度的特征融合,最后利用全連接層進(jìn)行分類。本文方法在公開數(shù)據(jù)庫PhysioNet[25]中的MIT-BIH Arrhythmia Database,MIT-BIH Supraventricular Arrhythmia Database 和St Petersburg INCART 12-lead Arrhythmia Database 數(shù)據(jù)集上分別進(jìn)行了心跳信號(hào)的“正常-異常”分類和心跳信號(hào)的多分類,對(duì)于“正常-異?!狈诸?,其準(zhǔn)確率、召回率、精確率、F1 值均達(dá)到了99%以上;對(duì)于多類別分類,其平均準(zhǔn)確率、召回率、精確率和平均F1 值能達(dá)到99.5%左右。相較于以往的心跳分類研究,本文方法不僅利用多導(dǎo)聯(lián)心跳信號(hào)組成信號(hào)矩陣以提取更加全面的特征,而且采用3 種不同大小的一維卷積核以提取多尺度的特征,最終達(dá)到現(xiàn)今最優(yōu)秀的分類性能。
本文提出了一個(gè)基于多尺度特征提取的多導(dǎo)聯(lián)心跳信號(hào)分類方法(multi-scale net,MSNet),其能有效提取心跳信號(hào)中的特征并進(jìn)行準(zhǔn)確分類。對(duì)于一個(gè)心電信號(hào)樣本,可分3 步進(jìn)行處理:信號(hào)預(yù)處理、心跳特征提取、特征融合與分類,圖2 為網(wǎng)絡(luò)的整體結(jié)構(gòu)。
圖2 網(wǎng)絡(luò)結(jié)構(gòu)示意圖 Fig.2 The overall structure figure of the network
本文提出的心跳信號(hào)分類方法以接收多導(dǎo)聯(lián)心跳信號(hào)堆疊矩陣作為輸入,假設(shè)導(dǎo)聯(lián)數(shù)量為l,單個(gè)心跳信號(hào)的長度為n,則輸入矩陣為
其中,nclass為類別數(shù)量;oi=1 為該心跳信號(hào)屬于類別i(i∈[1,nclass])。
已知卷積網(wǎng)絡(luò)結(jié)構(gòu)是最常使用且效果優(yōu)異的 特征提取器。而在卷積網(wǎng)絡(luò)結(jié)構(gòu)中,最核心的是其卷積層,憑借著局部連接和權(quán)重共享的思想,卷積操作能夠有效降低參數(shù)量,加快計(jì)算速度的同時(shí),擁有非常優(yōu)秀的特征提取能力。本文心跳信號(hào)Ml×n的特點(diǎn)是寬度大于高度,即n>l,且屬于時(shí)序信號(hào),不適合使用二維卷積,所以采用一維卷積的方式提取特征。為了將原始信息投射到更高維度的特征空間以利于后續(xù)的多尺度特征提取,本文首先使用2個(gè)一維卷積塊對(duì)輸入矩陣Ml×n進(jìn)行處理,得到特征矩陣F。由于心跳波形的生理特征,信息量分布不均勻,主要體現(xiàn)在QRS 波群上,并認(rèn)為單一大小(單尺度)的卷積核無法提取全面的特征,而多種大小(多尺度)的卷積核可以較好地應(yīng)對(duì)心跳波形的變化,有效提升特征提取能力。所以可用3 種大小的卷積核分別對(duì)F進(jìn)行進(jìn)一步的特征提取,對(duì)應(yīng)于圖2,路徑A使用的卷積核大小為3,得到的特征向量為Fα,其維度為α×1;路徑B使用的卷積核大小為5,得到的特征向量為Fβ,其維度為β×1;路徑C使用的卷積核大小為7,得到的特征向量為Fγ,其維度為γ×1。
該研究中的一維卷積塊由一維卷積層、批量標(biāo)準(zhǔn)化層、激活層和池化層組成,一維殘差卷積塊是串聯(lián)2 個(gè)一維卷積塊并添加殘差連接[26]。圖3 為一維卷積的具體流程,v和y分別為輸入、輸出矩陣中的具體數(shù)值,w為卷積核的權(quán)重,r和c分別為輸入矩陣的行和列(若以第一個(gè)卷積層為例,則可以理解為堆疊導(dǎo)聯(lián)數(shù)量和單個(gè)心跳信號(hào)的長度,即r=l,c=n)。輸入矩陣在經(jīng)過一維卷積后,輸出矩陣的高度(行)r'為卷積核的數(shù)量,寬度(列)c'為:(K為卷積核的大小,即尺度;P為填充數(shù)量;S為步伐)。批量標(biāo)準(zhǔn)化[27]是神經(jīng)網(wǎng)絡(luò)訓(xùn)練中常用的手段,在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,隱藏層的數(shù)據(jù)分布會(huì)發(fā)生偏移,從而導(dǎo)致模型收斂緩慢。所以在每一層使用批量標(biāo)準(zhǔn)化操作將數(shù)據(jù)分布偏移的現(xiàn)象進(jìn)行一定糾正,避免梯度消失,使網(wǎng)絡(luò)的訓(xùn)練更容易。本文使用ReLu 激活函數(shù)增加模型的非線性因素,最后使用最大池化過濾掉冗余特征,進(jìn)一步降低模型的參數(shù)量。
圖3 一維卷積示意圖 Fig.3 One dimensional convolution process figure
對(duì)心跳信號(hào)使用3 種不同大小卷積核,可分別得到3 種不同尺度的特征向量Fα,Fβ,Fγ。目前常用的特征融合方式主要為2 種:①將多個(gè)特征向量進(jìn)行點(diǎn)對(duì)點(diǎn)的求和,形成新的特征向量,這種方式要求多個(gè)特征向量的維度完全一致,即融合前后維度保持一致,不會(huì)增加模型的參數(shù)量,對(duì)計(jì)算友好;②將多個(gè)特征向量按照某一維度進(jìn)行拼接,從而得到新的特征向量,該方式僅需保證特征向量在拼接方向上的維度一致,且最大限度保留原始特征的相對(duì)獨(dú)立性,缺陷是特征融合后維度增加。本文考慮到心跳信號(hào)的長度較短,且經(jīng)過多層卷積后得到的特征向量維度較小,并且不同尺度特征向量的維度不完全一致,所以采用拼接的方式進(jìn)行特征融合,最后將拼接后的特征向量作為全連接層進(jìn)行最終的分類,融合特征可表示為
其中,符號(hào)⊕為向量拼接。
本文采用MIT-BIH Arrhythmia Database (MIT_ ARR),MIT-BIH Supraventricular (MIT_SUP)以及St.Petersburg Institute of Cardiological Technics 12-lead Arrhythmia Database (INCART) 3 個(gè)公開數(shù)據(jù)集分別進(jìn)行模型的訓(xùn)練與測試。其中,只有INCART 數(shù)據(jù)集有12 條導(dǎo)聯(lián)數(shù)據(jù)(I,II,III,aVR,aVL,aVF,V1,V2,V3,V4,V5,V6),其余2 個(gè)數(shù)據(jù)集均僅有2 條導(dǎo)聯(lián)數(shù)據(jù),MIT_ARR 為II 和V1 導(dǎo)聯(lián),MIT_SUP 為ECG1 和ECG2(官方未說明具體導(dǎo)聯(lián))。3 個(gè)數(shù)據(jù)集在心跳總樣本量、各類心跳樣本量以及采樣頻率均有一定差異,見表1。MIT_ARR數(shù)據(jù)集包含48 個(gè)樣本,每個(gè)樣本的采樣頻率和采集時(shí)間分別為360 Hz 和30 min,本文使用數(shù)量相對(duì)較多的6 種類型心跳,具體為正常心跳(N)、室性早搏心跳(V)、右束支傳導(dǎo)阻滯心跳(R)、左束支傳導(dǎo)阻滯心跳(L)、房性早搏心跳(A)和起搏心跳(/),共計(jì)92 520 個(gè)心跳樣本。MIT_SUP 數(shù)據(jù)集包含78 個(gè)樣本,每個(gè)樣本的采集頻率和采集時(shí)間分別為125 Hz 和30 min,本文使用正常心跳(N)、室性早搏心跳(V)、室上性早搏心跳(S)以及孤立的QRS 偽影(|)4 種類型的186 564 個(gè)心跳樣本。INCART 數(shù)據(jù) 集包含75 個(gè)樣本,采樣頻率和采樣時(shí)間分別為257 Hz 和30 min,使用正常心跳(N)、室性早搏心跳(V)、右束支傳導(dǎo)阻滯心跳(R)和房性早搏心跳(A)4 種類型,共計(jì)165 174 個(gè)心跳樣本。
表1 3個(gè)公開數(shù)據(jù)集介紹 Table 1 Introduction of the three public data set
本研究的預(yù)處理可分為3 步:基線校準(zhǔn)、振幅歸一化、心跳分離。
(1) 基線校準(zhǔn)。心電信號(hào)在采集時(shí)會(huì)受到呼吸、移動(dòng)等外部因素的影響,從而產(chǎn)生不同程度的基線偏移,所以本文采用中值濾波的方式對(duì)其進(jìn)行矯正,圖4 為基線校正的前后對(duì)比圖,紅色波形為原始信號(hào),綠色波形為使用中值濾波后,可以在看到矯正基線的同時(shí),不影響信號(hào)中其他特征。
圖4 基線矯正前后對(duì)比圖((a)原始信號(hào)(存在基線偏移);(b)基線矯正后;(c)基線矯正前后對(duì)比) Fig.4 Comparison between before baseline drift correction and after baseline drift correction ((a) Original signal (with baseline drift);(b) After baseline drift correction; (c) Comparison between before correction and after correction)
(2) 振幅歸一化。不同數(shù)據(jù)集,不同導(dǎo)聯(lián)中的信號(hào)數(shù)值范圍有較大浮動(dòng),不利于后續(xù)的特征提取。所以本文使用文獻(xiàn)[19]中的算法對(duì)原始心跳信號(hào)進(jìn)行歸一化。計(jì)算方式如下
其中,x為原始信號(hào)值;xp為處理后的信號(hào)值;min和max 分別為原始心跳信號(hào)中的最小、最大值;newmin 和newmax 分別表示歸一化后信號(hào)值的最小、最大值,在本研究中,newmin 和newmax 為0 和1。
(3) 分離心跳。由于本文內(nèi)容是對(duì)心跳信號(hào)進(jìn)行分類,而公開數(shù)據(jù)集提供的數(shù)據(jù)為長時(shí)間采集的導(dǎo)聯(lián)信號(hào),所以需要從導(dǎo)聯(lián)中分離出單個(gè)心跳。一般分為2 步:首先檢測出信號(hào)中R 點(diǎn)的位置,然后設(shè)定單個(gè)心跳的長度即可分離出心跳。本文使用的3 個(gè)公開數(shù)據(jù)集均已利用文獻(xiàn)[28]的算法較為準(zhǔn)確地檢測出R 點(diǎn)并標(biāo)注其類別,根據(jù)其標(biāo)注的相鄰心跳的R-R 間隔時(shí)間,確定每個(gè)數(shù)據(jù)集的心跳長度。具體來說,MIT_ARR,MIT_SUP 和INCART 數(shù)據(jù)集中的心跳長度分別為230,150 和160。圖5 為3個(gè)數(shù)據(jù)集的單心跳示意圖。
圖5 單個(gè)心跳示意圖 Fig.5 Figure of a single heartbeat ((a) MIT_ARR; (b) MIT_SUP;(c) INCART)
為了充分評(píng)估模型的性能,可使用以下4 個(gè)通用的指標(biāo):準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)以及F1 值(F1_Score)。其具體計(jì)算方式為
其中,TN,TP,F(xiàn)N,F(xiàn)P分別為真陰性、真陽性、假陰性、假陽性。值得注意的是,在心跳信號(hào)多分類任務(wù)中,對(duì)于特定類別的心跳,只需計(jì)算其召回率、精確率以及F1 值,然后通過加權(quán)平均計(jì)算上述指標(biāo)的平均值,可更好地綜合評(píng)價(jià)模型性能。以平均召回率為例,即
其中,Recalli為i類別的召回率;Wi為i類別的樣本量占總樣本量的比例。
本文采用了3 個(gè)公開數(shù)據(jù)集,為了保證實(shí)驗(yàn)結(jié)果的準(zhǔn)確性和可信度,采用五折交叉驗(yàn)證的方式進(jìn)行結(jié)果評(píng)估,即對(duì)于每個(gè)數(shù)據(jù)集,可將所有樣本平均分為5 份,并且保證每份的各類樣本數(shù)量比例一致,每次選取其中4 份作為訓(xùn)練集,一份作為驗(yàn)證集,重復(fù)5 次,最后將平均分?jǐn)?shù)作為模型的評(píng)價(jià)指標(biāo)。為了加快模型訓(xùn)練時(shí)的收斂速度,本文將學(xué)習(xí)率調(diào)整為余弦衰減[29]的方式,即
其中,Lre為當(dāng)前訓(xùn)練輪次的學(xué)習(xí)率;e為當(dāng)前訓(xùn)練輪次;E為訓(xùn)練的總輪數(shù);Lri為初始學(xué)習(xí)率。
本文所有實(shí)驗(yàn)均在Linux 平臺(tái)上借助深度學(xué)習(xí)框架PyTorch 完成,硬件具體配置為:英特爾9 900 K處理器,英偉達(dá)2080Ti 顯卡以及32 GB 內(nèi)存。
本實(shí)驗(yàn)將3 個(gè)公開數(shù)據(jù)集的心跳數(shù)據(jù)分為正常與異常心跳2 類。數(shù)據(jù)中除正常心跳外其他類型均認(rèn)定為異常心跳。對(duì)于每個(gè)數(shù)據(jù)集均使用了3 種方法進(jìn)行實(shí)驗(yàn)。方法1 采用文獻(xiàn)[9]方法,其將每個(gè)心跳信號(hào)分為3 段,對(duì)于每一段首先使用一維卷積提取特征,然后將各段特征拼接后輸入LSTM 網(wǎng)絡(luò),進(jìn)行心跳最終的分類。方法2 采用本文多尺度特征提取網(wǎng)絡(luò)結(jié)構(gòu),將單個(gè)心跳信號(hào)作為網(wǎng)絡(luò)的輸入,簡稱MSNet (單心跳)。方法3 是在方法2 的基礎(chǔ)上,將網(wǎng)絡(luò)輸入改為多導(dǎo)聯(lián)心跳信號(hào)堆疊矩陣Ml×n,簡稱MSNet (堆疊心跳)。表2 為3 種方法在公開數(shù)據(jù)集上進(jìn)行“正常-異?!狈诸惖慕Y(jié)果。整體而言,3 種方法在3 個(gè)數(shù)據(jù)集上均取得較為優(yōu)異的表現(xiàn),方法1 在數(shù)據(jù)集MIT_ARR 上準(zhǔn)確率達(dá)到了98.59%,召回率、精確率、F1 值分別達(dá)到了97.58%,97.59%,97.58%,在數(shù)據(jù)集INCART 上準(zhǔn)確率能夠達(dá)到99.07%。方法2 較方法1 在3 個(gè)數(shù)據(jù)集上均有明顯的提升,在MIT_SUP 數(shù)據(jù)集上,準(zhǔn)確率提升了1.98%,召回率提升了2.01%,精確率提升了11.82%,F(xiàn)1 值提升了6.6%。獲得明顯提升的原因是方法1 中使用的單一尺度的卷積無法很好的適應(yīng)不同類型心跳信號(hào)的變化,而方法2 使用3 種不同尺度的一維卷積可以充分提取心跳信號(hào)中的特征,進(jìn)而提升分類效果。方法3 相較于方法2 也有一定程度的提升,在數(shù)據(jù)集MIT_ARR 上準(zhǔn)確率提升了0.86%,召回率提升了2.11%,精確率提升了0.89%,F(xiàn)1 值提升了1.51%。提升原因是本文方法在利用多尺度卷積提取心跳信號(hào)更全面特征的同時(shí)考慮到不同導(dǎo)聯(lián)間心跳信號(hào)可能存在關(guān)聯(lián)性,于是使用多導(dǎo)聯(lián)心跳信號(hào)堆疊矩陣作為模型的輸入,最終獲得了最為優(yōu)異的分類表現(xiàn)。此外,方法1 和方法2 對(duì)于MIT_ARR 數(shù)據(jù)集中不同導(dǎo)聯(lián)的心跳信號(hào)分類表現(xiàn)存在一定差異。2 種方法對(duì)于II 導(dǎo)聯(lián)心跳信號(hào)的分類效果優(yōu)于V1 導(dǎo)聯(lián)心跳信號(hào)的分類效果。圖6 為3 個(gè)數(shù)據(jù)集中各導(dǎo)聯(lián)的質(zhì)量情況??梢钥闯鲈贛IT_ARR 數(shù)據(jù)集中,II 導(dǎo)聯(lián)質(zhì)量要明顯優(yōu)于V1 導(dǎo)聯(lián)質(zhì)量,II 導(dǎo)聯(lián)波形清晰,無較大噪聲,而V1 導(dǎo)聯(lián)波形雜亂,有明顯噪聲。而在MIT_SUP 與INCART 數(shù)據(jù)集中,2 條導(dǎo)聯(lián)的質(zhì)量情況相差不大,雖然有一定低頻噪聲,但整體波形均較為清晰。所以認(rèn)為方法1 和方法2 對(duì)MIT_ARR 數(shù)據(jù)集中V1導(dǎo)聯(lián)心跳信號(hào)分類效果下降是因?yàn)槠湫盘?hào)質(zhì)量下降明顯。但即使在信號(hào)質(zhì)量較差的情況下,方法2仍能獲得98.66%的準(zhǔn)確率,說明其擁有較為優(yōu)秀特征提取能力和抗干擾能力。
表2 3種方法在公開數(shù)據(jù)集上的“正常-異?!狈诸惐憩F(xiàn) Table 2 Performance of three methods on public data set to distinguish“Normal-Abnormal”
圖6 3 個(gè)公開數(shù)據(jù)集中導(dǎo)聯(lián)情況((a) MIT_ARR 數(shù)據(jù)集中II,V1 導(dǎo)聯(lián)情況;(b) MIT_SUP 數(shù)據(jù)集中ECG1,ECG2導(dǎo)聯(lián)情況;(c) INCART 數(shù)據(jù)集中II,V1 導(dǎo)聯(lián)情況) Fig.6 Leads in three public data set ((a) Lead II and V1 in MIT_ARR data set;(b) Lead ECG1 and ECG2 in MIT_SUP data set;(c) Lead II and V1 in INCART data set)
通過實(shí)驗(yàn)可知本文方法對(duì)于心跳信號(hào)二分類擁有優(yōu)異的性能。另使用本文方法對(duì)3 個(gè)數(shù)據(jù)集中的心跳信號(hào)進(jìn)行多分類,見表3~5。
表3 MIT_ARR 數(shù)據(jù)集多分類結(jié)果 Table 3 Performance of multi-type classification on MIT_ARR data set
對(duì)于MIT_ARR 數(shù)據(jù)集,表3 對(duì)其樣本量較多的6 類心跳進(jìn)行了分類,其判別正常心跳的召回率為99.72%,精確率為99.63%,F(xiàn)1 值可達(dá)99.67%。
對(duì)于MIT_SUP 數(shù)據(jù)集,表4 對(duì)4 類心跳進(jìn)行分類,其中對(duì)于正常心跳判別較為優(yōu)秀,召回率達(dá)到了98.98%、精確率為98.78%、F1 為98.88%,但對(duì)于室上性早搏心跳、室性早搏心跳和孤立的QRS偽影判別效果不夠理想,其原因可能為:①原始數(shù)據(jù)采樣率僅為125 Hz,明顯低于MIT_ARR 的360 Hz和INCART 的257 Hz,蘊(yùn)含的信息量驟減,使模型無法提取有效的特征以很好的區(qū)分不同類型心跳;②數(shù)據(jù)集中所有樣本的2 條導(dǎo)聯(lián)可能不一致,即對(duì)于第m份樣本,其2 條導(dǎo)聯(lián)可能為I 和II,而對(duì)于第n份樣本,其2 條導(dǎo)聯(lián)可能為V1 和V2,不確定的導(dǎo)聯(lián)堆疊不利于模型提取有效特征。
表4 MIT_SUP 數(shù)據(jù)集多分類結(jié)果 Table 4 Performance of multi-type classification on MIT_SUP data set
對(duì)于INCART 數(shù)據(jù)集,表5 對(duì)其4 類心跳進(jìn)行分類,其中在正常、室性早搏、右束支傳導(dǎo)阻滯心跳的判別上表現(xiàn)優(yōu)異,對(duì)于正常心跳,召回率為99.83%,精確率為99.90%,F(xiàn)1 值為99.86%。
表5 INCART 數(shù)據(jù)集多分類結(jié)果 Table 5 Performance of multi-type classification on INCART data set
從上述心跳信號(hào)的“正常-異常”分類與多分類的結(jié)果看,本文方法在3 個(gè)數(shù)據(jù)集上均取得了優(yōu)異的表現(xiàn)。表6 為近年在心跳分類方向上的方法及其性能表現(xiàn)。文獻(xiàn)[17]將一維的心跳信號(hào)通過算法轉(zhuǎn)換為二維的心跳圖片,然后對(duì)心跳圖片進(jìn)行數(shù)據(jù)增強(qiáng),最后使用二維卷積提取特征并分類,在MIT_ARR 數(shù)據(jù)集上達(dá)到了99.05%的準(zhǔn)確率,但其召回率僅為97.85%。文獻(xiàn)[18]設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)31層的一維殘差網(wǎng)絡(luò)來對(duì)MIT_ARR 數(shù)據(jù)集中的心跳信號(hào)分類,其能達(dá)到較高的準(zhǔn)確率(99.06%),但召回率不夠理想。文獻(xiàn)[19]通過獨(dú)立成分分析(independent component analysis,ICA)與主成分分析(principal component analysis,PCA)提取心跳信號(hào)中的特征,最后使用SVM 分類,在MIT_ARR 數(shù)據(jù)集上獲得了98.63%的準(zhǔn)確率。文獻(xiàn)[23]首先計(jì)算出各條導(dǎo)聯(lián)中心跳信號(hào)的10 種特征,利用堆疊的方式進(jìn)行特征融合,然后利用PCA 對(duì)特征矩陣進(jìn)行降維,最后利用RF 和MLP 組成級(jí)聯(lián)分類器對(duì)上述特征進(jìn)行分類。其在MIT_SUP 和INCART 數(shù)據(jù)集上均取得了優(yōu)異的表現(xiàn),其中在INCART 數(shù)據(jù)集上的表現(xiàn)要略微高于本文方法。其方法有效性的關(guān)鍵在于通過特征融合的方式充分利用了多導(dǎo)聯(lián)心跳信號(hào)的特征。而本文的方法同樣使用多導(dǎo)聯(lián)心跳信號(hào),并且利用一維殘差卷積的方式自動(dòng)提取特征并控制參數(shù)量,使用全連接層進(jìn)行最終的分類。總之,本文方法在大大簡化處理流程的同時(shí)取得了優(yōu)異的分類性能。
表6 近年心跳分類研究總結(jié) Table 6 Conclusionof the recent years’ heartbeat researches
本文提出了基于多尺度特征提取的多導(dǎo)聯(lián)心跳信號(hào)分類方法(MSNet)。方法流程可分為:心跳信號(hào)預(yù)處理、特征提取、特征融合與分類。在MIT_ARR,MIT_SUP 和INCART 3 個(gè)心電公開數(shù)據(jù)集上進(jìn)行了充分的實(shí)驗(yàn),對(duì)于心跳信號(hào)“正常-異?!狈诸悾贛IT_ARR 和INCART 數(shù)據(jù)集上準(zhǔn)確率、召回率等指標(biāo)均達(dá)到99%以上。對(duì)于心跳信號(hào)的多分類,在MIT_ARR 和INCART 數(shù)據(jù)集上的平均準(zhǔn)確率、平均召回率等指標(biāo)也達(dá)到99.5%左右。相較于其他方法,本文方法的優(yōu)勢在于:①充分考慮并利用多導(dǎo)聯(lián)信息;②只采用少量信號(hào)處理手段,一定程度上簡化了預(yù)處理流程;③采用3 種不同大小的一維卷積自動(dòng)提取心跳信號(hào)特征,無需憑借人為主觀因素設(shè)計(jì)特征提取算法,并且克服了單一大小卷積提取特征不全面的劣勢。未來將繼續(xù)研究如何緩解各類心跳樣本分布不均的問題,提高模型對(duì)極少樣本量類別的判別效果,使模型能夠達(dá)到臨床應(yīng)用的標(biāo)準(zhǔn)。