龔玉曉, 高淑萍
(西安電子科技大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 西安 710126)
根據(jù)世界衛(wèi)生組織提供的資料顯示,心血管疾病是危害人類生命最嚴(yán)重的疾病之一, 每年因心血管疾病死亡的人數(shù)約占世界死亡人數(shù)的1/3[1].心電圖(electrocardiogram,ECG)以其簡(jiǎn)單、無(wú)創(chuàng)的特點(diǎn)[2]被廣泛應(yīng)用于診斷各種心臟異常、預(yù)測(cè)心血管發(fā)病率和死亡率.其診斷需要臨床醫(yī)生仔細(xì)檢查和識(shí)別搏動(dòng)間和搏動(dòng)內(nèi)的模式,這個(gè)過(guò)程既耗時(shí)又容易出錯(cuò)[3].因此,設(shè)計(jì)一種高準(zhǔn)確率、低漏診率的心電信號(hào)分類算法顯得尤為重要.
目前,國(guó)內(nèi)外研究者們已提出了多種心電信號(hào)分類算法,可分為基于波形形態(tài)、波形特征和深度學(xué)習(xí)三類.基于波形形態(tài)的分類算法是利用心電圖的P波、T波以及QRS波群等特征進(jìn)行分類.例如,李勝藍(lán)等[4]使用形態(tài)學(xué)方法對(duì)QRS波群進(jìn)行描述,提取了有效特征信息,并使用模糊網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)對(duì)心律失常進(jìn)行識(shí)別,在4類心律失常識(shí)別中達(dá)到了95.87%的準(zhǔn)確率.但該分類算法對(duì)噪聲敏感,準(zhǔn)確率較低,不利于應(yīng)用于實(shí)際.基于波形特征的分類算法是通過(guò)高階統(tǒng)計(jì)特征[5]、 Hermite系數(shù)[6]、 小波變換[7]等算法提取心電信號(hào)特征,再通過(guò)多層感知機(jī)或支持向量機(jī)(support vector machine,SVM)等算法進(jìn)行分類.例如,Mondéjar-Guerra等[8]通過(guò)小波變換、局部二值模式和高階統(tǒng)計(jì)特征進(jìn)行特征提取,并使用SVM進(jìn)行分類,在4類心電信號(hào)分類中達(dá)到了94.5%的準(zhǔn)確率.但此類分類算法需要較多的先驗(yàn)知識(shí),且魯棒性較差,也不利于廣泛應(yīng)用于實(shí)際.基于深度學(xué)習(xí)的分類算法是通過(guò)搭建端到端的神經(jīng)網(wǎng)絡(luò)進(jìn)行分類,其具有較好的特征提取能力和泛化能力,越來(lái)越多的研究者將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、殘差網(wǎng)絡(luò)(residual network,ResNet)、長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)等應(yīng)用在心電信號(hào)分類領(lǐng)域中.例如,陳鵬等[9]提出了一種基于GAN和2DCNN的心電信號(hào)分類算法(GAN+2DCNN),該算法通過(guò)GAN生成高質(zhì)量合成樣本,實(shí)現(xiàn)了二維心電圖的樣本類別平衡,實(shí)驗(yàn)驗(yàn)證了樣本類別平衡有助于提高分類性能.Sowmya等[10]提出了一種基于LSTM和CNN的混合神經(jīng)網(wǎng)絡(luò)心律失常識(shí)別模型(CNN+LSTM),該模型可以自動(dòng)提取信號(hào)的空間特征和時(shí)間特征,實(shí)驗(yàn)驗(yàn)證了其比單一CNN模型的分類性能好.Zhang[11]提出了一種基于CNN和LSTM_ATTENTION的混合神經(jīng)網(wǎng)絡(luò)心電信號(hào)分類算法(CNN+LSTM_ATTENTION),該算法在預(yù)處理階段使用小波閾值變換和合成少數(shù)類過(guò)采樣技術(shù)(synthetic minority over-sampling technique,SMOTE)進(jìn)行去噪處理與樣本類別平衡,并將注意力機(jī)制嵌入到LSTM上為重要時(shí)間特征賦予較大權(quán)重,在MIT-BIH心律失常數(shù)據(jù)庫(kù)上取得了較好的分類性能.郭煒倫等[12]提出了一種基于SE-CNN-LSTM的心電信號(hào)識(shí)別算法,該算法將壓縮激勵(lì)(squeeze-and-excitation,SE)模塊嵌入到CNN和LSTM中進(jìn)行心電信號(hào)的分類,在MIT-BIH心律失常數(shù)據(jù)庫(kù)上取得了95.8%的準(zhǔn)確率.由于CNN在深層網(wǎng)絡(luò)結(jié)構(gòu)中需要訓(xùn)練大量可學(xué)習(xí)參數(shù),且容易出現(xiàn)梯度消失和網(wǎng)絡(luò)退化等現(xiàn)象,許多研究者也常使用ResNet代替CNN進(jìn)行空間特征提取,其可以減輕深度網(wǎng)絡(luò)的訓(xùn)練難度.例如,Han等[13]提出了一種多導(dǎo)聯(lián)殘差神經(jīng)網(wǎng)絡(luò)心電圖識(shí)別模型(ML-ResNet),其考慮了心電信號(hào)的多導(dǎo)聯(lián),提高了算法的泛化性能,在PTB數(shù)據(jù)庫(kù)中取得了95.49%的準(zhǔn)確率.秦博等[14]提出將殘差結(jié)構(gòu)和注意力機(jī)制結(jié)合進(jìn)行心電圖分類(ResNet+AM),其使用注意力機(jī)制解決了ResNet對(duì)任何位置特征相同處理的問(wèn)題,大大提高了樣本數(shù)量少的類別敏感性.
上述基于深度學(xué)習(xí)的分類算法雖然取得了較好的分類結(jié)果,但仍存在一些不足之處:① 當(dāng)以一維心電信號(hào)作為輸入時(shí),需要在預(yù)處理階段進(jìn)行小波變換[15]或其他去噪操作,其通常需要大量先驗(yàn)知識(shí)且去除噪聲后可能會(huì)改變心電信號(hào)的含義.② 當(dāng)以二維圖像作為輸入時(shí),需要將一維心電信號(hào)數(shù)據(jù)轉(zhuǎn)化為二維圖像,并建立多個(gè)復(fù)雜的生成模型進(jìn)行數(shù)據(jù)類別平衡,操作繁瑣且模型復(fù)雜耗時(shí),不利于應(yīng)用于實(shí)際.對(duì)此,本文根據(jù)心電信號(hào)的特點(diǎn)對(duì)深度殘差收縮網(wǎng)絡(luò)(deep residual shrinkage network,DRSN)進(jìn)行改進(jìn),使其可以在高噪聲心電信號(hào)中提取重要局部特征并達(dá)到自動(dòng)去除噪聲的目的,并將改進(jìn)深度殘差收縮網(wǎng)絡(luò)(improved DRSN,IDRSN)與SMOTE、LSTM結(jié)合,提出了一種基于改進(jìn)深度殘差收縮網(wǎng)絡(luò)(IDRSN)的心電信號(hào)分類算法DRSL.該算法不僅可以降低樣本數(shù)量少的類別漏診率,還能降低預(yù)處理操作的復(fù)雜性,同時(shí)也避免了因網(wǎng)絡(luò)層加深造成的網(wǎng)絡(luò)退化現(xiàn)象.
為了加強(qiáng)深度神經(jīng)網(wǎng)絡(luò)從含噪聲信號(hào)中提取有用特征的能力,Zhao等[16]以殘差網(wǎng)絡(luò)為基礎(chǔ),融合注意力機(jī)制和軟閾值函數(shù),提出了DRSN,其結(jié)構(gòu)圖如圖1所示.該網(wǎng)絡(luò)結(jié)構(gòu)是在經(jīng)典殘差網(wǎng)絡(luò)的輸出之前嵌入一個(gè)壓縮激勵(lì)和軟閾值化子網(wǎng)絡(luò).其中ResNet[17-18]可以解決網(wǎng)絡(luò)層加深導(dǎo)致的梯度消失和網(wǎng)絡(luò)退化問(wèn)題.SE網(wǎng)絡(luò)[19]通過(guò)學(xué)習(xí)通道特征的相關(guān)性評(píng)估通道的重要程度,從而得到一組閾值.軟閾值函數(shù)[20]通過(guò)將部分特征置為0實(shí)現(xiàn)對(duì)噪聲和冗余信息的抑制.具體實(shí)現(xiàn)過(guò)程如下:
① ResNet變換 使用堆疊兩層卷積而成的ResNet學(xué)習(xí)殘差信息,記ResNet的輸入特征為X=[x1,x2,…,xC],X∈H×W×C,第一層卷積輸出特征為U′=[u′1,u′2,…,u′C″],第二層卷積特征輸出為U=[u1,u2,…,uC′],U∈H′×W′×C′,即SE單元的輸入特征.
u′C″=vC″*X,uC′=vC′*U′,
(1)
其中,H,W,C分別表示特征矩陣的高度、寬度和通道數(shù);*表示卷積乘號(hào);vC″和vC′分別為兩次卷積的二維卷積核.
② 壓縮操作Fsq使用絕對(duì)值函數(shù)與全局平均池化(GAP)將每個(gè)通道上的全局空間特征通過(guò)空間維度H′×W′壓縮生成通道描述符,該描述符的統(tǒng)計(jì)信息表示此通道的全局特征,從而得到一個(gè)1×1×C′的通道統(tǒng)計(jì)量A.A的第C′個(gè)元素計(jì)算如下:
(2)
③ 激勵(lì)操作Fex通過(guò)sigmoid映射的門控機(jī)制對(duì)通道之間的相關(guān)性進(jìn)行計(jì)算,得到每個(gè)通道的閾值算子α(如式(3)所示).為了限制模型的復(fù)雜度以及強(qiáng)化泛化能力,使用兩個(gè)全連接用于降維和升維.
α=Fex(A,WA)=σ(g(A,WA))=σ(WA2δ(WA1,A)),α∈C′,
(3)
其中,δ為ReLU映射;WA1,WA2分別是降維和升維層的可學(xué)習(xí)參數(shù),WA1∈C′/r×C′,WA2∈C′×C′/r,r為降維層的縮放比,該參數(shù)用于降低計(jì)算量.
④ 閾值計(jì)算 將通道特征AC′和閾值算子αC′乘積得到該通道的閾值tC′(如式(4)所示),從而得到通道閾值T=[t1,t2,…,tC′]∈C′.該閾值是通過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練自主學(xué)習(xí)得到的,其不需要先驗(yàn)知識(shí)人工設(shè)置,閾值的高低與通道特征的重要程度成正相關(guān),閾值越接近0,通道特征越不重要.
tC′=αC′AC′.
(4)
(5)
其中,sgn(·)表示符號(hào)函數(shù).
(6)
為了解決循環(huán)神經(jīng)網(wǎng)絡(luò)梯度消失或爆炸和長(zhǎng)期依賴問(wèn)題,Hochreiter等[21]提出了LSTM模型,其引入了門控機(jī)制和細(xì)胞狀態(tài)兩個(gè)概念.LSTM單元結(jié)構(gòu)如圖2所示.LSTM單元[22]由三種不同的門和兩種不同的狀態(tài)組成:輸入門it,遺忘門ft,輸出門ot,細(xì)胞狀態(tài)ct和隱藏狀態(tài)ht.其中輸入門it決定哪些信息應(yīng)該被添加到當(dāng)前細(xì)胞狀態(tài)中;遺忘門ft用來(lái)丟棄前一刻細(xì)胞狀態(tài)中無(wú)用的信息;輸出門ot決定當(dāng)前細(xì)胞狀態(tài)中哪些信息應(yīng)該被輸出;輸入門it和遺忘門ft共同更新t時(shí)刻的細(xì)胞狀態(tài)ct;輸入門it、遺忘門ft和輸出門ot共同決定t時(shí)刻輸出的隱藏狀態(tài)ht.LSTM單元一次更新過(guò)程如下:
(7)
其中,⊙為Hadamard積,σ和tanh為非線性激活函數(shù),
(8)
式中,Wxf,Whf,Wxi,Whi,Wxo,Who,Wxc,Whc為權(quán)重矩陣;bf,bi,bo,bc為偏差向量.
圖1 DRSN結(jié)構(gòu)圖Fig. 1 The structure of DRSN
圖2 LSTM單元內(nèi)部結(jié)構(gòu)圖Fig. 2 The internal structure of an LSTM unit
DRSN網(wǎng)絡(luò)的提出是應(yīng)用于機(jī)械故障檢測(cè)中,處理的是機(jī)械振動(dòng)信號(hào),其閾值是自動(dòng)獲取的,不需要人工設(shè)置.大量實(shí)驗(yàn)證明了其對(duì)含有噪聲的數(shù)據(jù)訓(xùn)練效果好.心電信號(hào)是一種頻率范圍為0.05~100 Hz的非線性毫伏級(jí)別生理信號(hào),在采集過(guò)程中會(huì)產(chǎn)生基線漂移、工頻干擾和肌電干擾等噪聲[23],研究者通常需要在預(yù)處理階段對(duì)這些噪聲進(jìn)行處理.因此,本文首先使用SMOTE對(duì)小樣本類別數(shù)據(jù)進(jìn)行數(shù)據(jù)擴(kuò)充.其次根據(jù)心電信號(hào)自身特點(diǎn)以及其與機(jī)械振動(dòng)信號(hào)的不同之處對(duì)DRSN網(wǎng)絡(luò)進(jìn)行改進(jìn),使其可以在高噪聲心電信號(hào)中提取重要局部特征并達(dá)到自動(dòng)去除噪聲的目的.將改進(jìn)DRSN與LSTM結(jié)合,提出了一種基于IDRSN的心電信號(hào)分類算法DRSL.
IDRSN的結(jié)構(gòu)如圖3所示,其中IDRSN(a)網(wǎng)絡(luò)用于前后通道數(shù)一致時(shí),可用于提取深層特征;IDRSN(b)網(wǎng)絡(luò)用于通道數(shù)不一致時(shí),可用于減低模型復(fù)雜度.主要改進(jìn)之處如下:
① 機(jī)械信號(hào)值是連續(xù)跳躍變化的,平均池化可以統(tǒng)計(jì)機(jī)械信號(hào)中跳躍值的平均情況.而心電信號(hào)數(shù)據(jù)是連續(xù)且呈現(xiàn)近似周期性變化的,在一個(gè)心拍周期內(nèi)有持續(xù)增長(zhǎng)到波峰再下降的情況,故在壓縮操作Fsq中使用全局最大池化(GMP)代替GAP(如式(9)所示),其有利于提取通道數(shù)中的波峰特征.
AC′=Fsq(uC′)=max(uC′(i,j)),A∈C′.
(9)
② 考慮到心電信號(hào)部分波段電壓值為負(fù)數(shù),本文使用LeakyReLU激活函數(shù)代替ReLU函數(shù)(如式(10)所示),保留心電信號(hào)的負(fù)值特征以及避免網(wǎng)絡(luò)的稀疏性.
(10)
③ 由于心電信號(hào)是一維數(shù)據(jù),所有網(wǎng)絡(luò)層在訓(xùn)練時(shí)均使用一維類型,在ResNet變換中卷積層的卷積核大小取(3,1),其可以加快訓(xùn)練速度,縮短訓(xùn)練時(shí)間.
圖4直觀地展現(xiàn)了DRSL分類算法的結(jié)構(gòu)流程.DRSL網(wǎng)絡(luò)主要由輸入層、1個(gè)CNN層、10個(gè)IDRSN層、1個(gè)LSTM層和2個(gè)dense層組成,每層結(jié)構(gòu)詳細(xì)描述如下:
輸入層 將預(yù)處理后的心電心拍數(shù)據(jù)與SMOTE合成心拍數(shù)據(jù)進(jìn)行融合,作為DRSL網(wǎng)絡(luò)的輸入.其可以使訓(xùn)練樣本達(dá)到類別平衡狀態(tài),從而降低樣本數(shù)量少的類別漏診率.
CNN層 對(duì)輸入的心拍數(shù)據(jù)使用一維CNN層和max pooling層提取特征.為了避免第一次卷積提取的信息丟失,在max pooling層后使用tanh函數(shù)作為激活函數(shù).
(a) IDRSN(a)結(jié)構(gòu)圖(a) The structure of IDRSN(a)
(b) IDRSN(b)結(jié)構(gòu)圖(b) The structure of IDRSN(b)圖3 IDRSN結(jié)構(gòu)圖Fig. 3 The structure of IDRSN
IDRSN層 心電信號(hào)具有高噪聲且不同類別心拍之間存在明顯的局部性差異,在CNN層后使用IDRSN(a)網(wǎng)絡(luò)和IDRSN(b)網(wǎng)絡(luò)交替堆疊的10層IDRSN網(wǎng)絡(luò)來(lái)學(xué)習(xí)心電信號(hào)的局部特征.
LSTM層 心電信號(hào)具有時(shí)序性,在IDRSN層后使用LSTM用于挖掘心電信號(hào)的時(shí)間特征.
Dense層 該層可以綜合LSTM層輸出的主要特征信息并輸出最終的分類結(jié)果.
圖4 DRSL算法流程圖Fig. 4 The flow chart of the DRSL algorithm
DRSL算法步驟如下:
Step1(數(shù)據(jù)預(yù)處理) 對(duì)心電信號(hào)數(shù)據(jù)進(jìn)行歸一化,心拍分割,訓(xùn)練集樣本類別平衡等預(yù)處理操作.其中,采用分層采樣方法將樣本類別平衡前的心拍數(shù)據(jù)按7∶1∶2的比率劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集.
Step2(訓(xùn)練DRSL網(wǎng)絡(luò)) 將類別平衡后的訓(xùn)練集數(shù)據(jù)輸入到DRSL網(wǎng)絡(luò)中,并使用Adam優(yōu)化器進(jìn)行訓(xùn)練.
Step3(調(diào)節(jié)網(wǎng)絡(luò)層數(shù)與超參數(shù)) 訓(xùn)練DRSL網(wǎng)絡(luò)得到驗(yàn)證集數(shù)據(jù)的loss值以及準(zhǔn)確率,根據(jù)其變化趨勢(shì)以及數(shù)值大小調(diào)整網(wǎng)絡(luò)中的卷積核個(gè)數(shù),卷積窗口大小,神經(jīng)元數(shù)量,訓(xùn)練批大小,迭代次數(shù),學(xué)習(xí)率等超參數(shù),并反復(fù)實(shí)驗(yàn)確定超參數(shù)值和網(wǎng)絡(luò)層數(shù),減少無(wú)用的學(xué)習(xí),從而得到最佳DRSL模型.
Step4(輸出分類結(jié)果) 將測(cè)試集數(shù)據(jù)輸入到訓(xùn)練好的DRSL模型中,得到分類結(jié)果.
本文實(shí)驗(yàn)數(shù)據(jù)來(lái)自MIT-BIH心律失常數(shù)據(jù)集[24],該數(shù)據(jù)集包含48條時(shí)長(zhǎng)為30 min、采樣頻率為360 Hz的心電信號(hào)記錄.每條心電信號(hào)記錄均是由兩個(gè)導(dǎo)聯(lián)組成,兩位專家對(duì)其進(jìn)行R峰標(biāo)記和注釋.由于102,104,107和217這4條心電信號(hào)記錄包含起搏器節(jié)律,因此本文使用44條記錄中的MLII導(dǎo)聯(lián)心電信號(hào)記錄作為本文的數(shù)據(jù)集,并按照美國(guó)醫(yī)療儀器促進(jìn)協(xié)會(huì)標(biāo)準(zhǔn)(association for the advancement of medical instrumentation,AAMI)[24]將心律失常分為4種類別:正常心跳(N)、室上性異位心跳(S)、室性異位心跳(V)和融合心跳(F).具體分類標(biāo)準(zhǔn)如表1所示.
本文使用混淆矩陣以及分類性能評(píng)價(jià)指標(biāo)對(duì)心電信號(hào)分類性能進(jìn)行評(píng)估,其中混淆矩陣可以清晰地展現(xiàn)出每個(gè)類別的詳細(xì)分類結(jié)果.具體分類性能評(píng)價(jià)指標(biāo)[25]有:準(zhǔn)確率(accuracy,Acc)、敏感性(sensitivity,Sen)、特異性(specificity,Spec)和陽(yáng)性預(yù)測(cè)值(positive predictive value,PPV).4個(gè)性能評(píng)價(jià)指標(biāo)值均為越接近1分類性能越好,其中敏感性指標(biāo)值對(duì)小樣本類別分類性能影響較大,具體計(jì)算如下:
(11)
(12)
(13)
(14)
式中,NTP指樣本實(shí)際屬于目標(biāo)類別,分類結(jié)果也屬于目標(biāo)類別的心拍數(shù);NFN指樣本實(shí)際屬于目標(biāo)類別,分類結(jié)果不屬于目標(biāo)類別的心拍數(shù);NTN指樣本實(shí)際不屬于目標(biāo)類別,分類結(jié)果也不屬于目標(biāo)類別的心拍數(shù);NFP指樣本實(shí)際不屬于目標(biāo)類別,分類結(jié)果屬于目標(biāo)類別的心拍數(shù).
Step1(歸一化) 為消除不同被測(cè)主體造成的影響, 對(duì)心拍數(shù)據(jù)進(jìn)行min-max歸一化處理, 具體計(jì)算 如下:
(15)
其中,xt為心電信號(hào)數(shù)值,xmax和xmin分別是心電信號(hào)數(shù)值的最大值和最小值.
Step2(心拍分割) 根據(jù)專家標(biāo)記的R峰信息對(duì)心電信號(hào)進(jìn)行心拍分割,每個(gè)心拍由300個(gè)采樣點(diǎn)組成(R峰前110個(gè)采樣點(diǎn),R峰后189個(gè)采樣點(diǎn)),每條心電記錄的前3個(gè)心拍和最后1個(gè)心拍舍棄.根據(jù)AAMI標(biāo)準(zhǔn),本文提取了正常心跳(N)、室上性異位心跳(S)、室性異位心跳(V)和融合心跳(F)4種類別的100 588個(gè)心拍,如表1所示.
Step3(數(shù)據(jù)集劃分) 隨機(jī)選擇20 000個(gè)N類樣本與全部的S、 V、 F類樣本作為實(shí)驗(yàn)數(shù)據(jù)集, 并按照 7∶1∶2分層采樣劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,如表2所示.
Step4(訓(xùn)練集樣本平衡) 使用SMOTE技術(shù)[26]將訓(xùn)練集中的S、 V、 F類樣本數(shù)量擴(kuò)充到14 000個(gè)使訓(xùn)練集達(dá)到樣本平衡,如表2所示.
表2 類別平衡前后的數(shù)據(jù)集
在DRSL網(wǎng)絡(luò)訓(xùn)練過(guò)程中有許多超參數(shù),這些超參數(shù)的設(shè)置會(huì)影響最終的分類結(jié)果.本文在已有文獻(xiàn)[27]的超參數(shù)設(shè)計(jì)基礎(chǔ)上,利用驗(yàn)證集loss值與實(shí)驗(yàn)法找到DRSL網(wǎng)絡(luò)的最優(yōu)超參數(shù),其中IDRSN模塊的壓縮激勵(lì)操作中的縮放比為r=16時(shí),模型在復(fù)雜度和精度之間可以取得較好的平衡[19].具體超參數(shù)設(shè)置如表3所示,其中Ffilter表示卷積核數(shù),Dcs表示卷積窗口大小,padding表示填充方式,kernel_regularizer表示正則化方式, pooling_size表示池化層大小,strides表示步長(zhǎng),a表示激活函數(shù),Cout表示輸出的通道數(shù)量,units表示神經(jīng)元數(shù)量.
表3 DRSL網(wǎng)絡(luò)的超參數(shù)設(shè)置
本文利用Adam優(yōu)化器和交叉熵?fù)p失函數(shù)求解模型的最優(yōu)權(quán)重矩陣以及偏差向量,共迭代20次,每批次訓(xùn)練64個(gè)樣本.初始學(xué)習(xí)率為0.002,迭代次數(shù)每增加10次,學(xué)習(xí)率變?yōu)樵瓉?lái)的0.1倍,可減少因輪數(shù)增加導(dǎo)致網(wǎng)絡(luò)陷入局部最優(yōu)的問(wèn)題.使用L2正則化以避免網(wǎng)絡(luò)過(guò)擬合,其權(quán)重衰減系數(shù)設(shè)置為0.000 1.在GAP層中使用LeakyReLU激活函數(shù),保留心電信號(hào)負(fù)值特征,避免神經(jīng)元無(wú)法學(xué)習(xí)的問(wèn)題.
本文使用SMOTE對(duì)訓(xùn)練集進(jìn)行樣本類別平衡,驗(yàn)證集和測(cè)試集不做處理,以體現(xiàn)模型真實(shí)的泛化能力,類別平衡數(shù)據(jù)如表2所示.將類別平衡數(shù)據(jù)輸入到DRSL網(wǎng)絡(luò)中訓(xùn)練,為了使模型簡(jiǎn)單的同時(shí)又能夠提取到深層特征,最終設(shè)置10層IDRSN提取空間特征.為了縮短網(wǎng)絡(luò)訓(xùn)練時(shí)間,設(shè)置epoch為20,訓(xùn)練過(guò)程中的loss值(Lloss)變化和準(zhǔn)確率變化如圖5和圖6所示.可以看出,該模型結(jié)構(gòu)對(duì)該數(shù)據(jù)集的訓(xùn)練收斂速度快且無(wú)大幅度震蕩,在15次迭代之后loss值和準(zhǔn)確率均趨于水平狀態(tài),模型擬合效果較好.
圖5 Loss值與迭代次數(shù)的關(guān)系圖6 準(zhǔn)確率與迭代次數(shù)的關(guān)系Fig. 5 Relationships between the training loss Fig. 6 Relationships between the accuracy and the number of iteration times and the number of iteration times
將測(cè)試集數(shù)據(jù)輸入到訓(xùn)練好的DRSL模型中得到分類結(jié)果,其混淆矩陣如圖7所示.通過(guò)觀察可以看出,DRSL算法在該數(shù)據(jù)集上可以正確識(shí)別大多數(shù)的心電樣本類別.通過(guò)計(jì)算性能評(píng)價(jià)指標(biāo)得到各類別的δAcc,δSen,δSpec,δPPV值,其中各性能評(píng)價(jià)指標(biāo)的平均值作為總體評(píng)價(jià)結(jié)果.由表4可知,平均δAcc,δSen,δSpec,δPPV值分別為98.98%,95.02%,99.11%,94.34%.由于F類的真實(shí)訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)最少,其敏感性和陽(yáng)性預(yù)測(cè)值均不到90%,S類與N類波形差異較小,部分S類被劃分為N類,造成其敏感性僅達(dá)到95.5%.
圖7 混淆矩陣Fig. 7 Confusion matrix
表4 DRSL算法在測(cè)試集上的分類結(jié)果
為驗(yàn)證DRSL模型和IDRSN模型的有效性,本文進(jìn)行了一組模型結(jié)構(gòu)消融實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表5所示,其中加黑部分為最優(yōu)值,后同.該消融實(shí)驗(yàn)是基于DRSN、IDRSN和本文所提出的DRSL三種模型展開(kāi)的.IDRSN是根據(jù)心電信號(hào)特點(diǎn)對(duì)DRSN進(jìn)行改進(jìn)得到的模型,通過(guò)對(duì)比可以看出其提高了準(zhǔn)確率、敏感性和特異性.DRSL是通過(guò)IDRSN模塊從高噪聲的心電信號(hào)中提取重要局部特征,然后使用LSTM獲得特征中的長(zhǎng)期依賴關(guān)系,其獲得了最優(yōu)的準(zhǔn)確率,相對(duì)于單一的IDRSN模型也獲得了更好的敏感性和特異性,降低了漏診率.
表5 DRSL算法與其消融實(shí)驗(yàn)的總體分類性能比較
為了驗(yàn)證DRSL算法的有效性,本文將其與文獻(xiàn)[9,11-12]中的算法進(jìn)行對(duì)比,為了使比較結(jié)果更具有說(shuō)服力,所有算法均在表2數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),需要樣本平衡的算法均僅對(duì)訓(xùn)練集進(jìn)行平衡,保持驗(yàn)證集和測(cè)試集一致.總體性能比較結(jié)果如表6所示,對(duì)比文獻(xiàn)[9,11-12]中的算法,本文所提的DRSL算法具有最優(yōu)的準(zhǔn)確率、特異性以及陽(yáng)性預(yù)測(cè)值,僅敏感性低于CNN+LSTM_ATTENTION算法,由于本文算法可降低預(yù)處理操作的復(fù)雜性,且分類性能不受IDRSN層數(shù)的加深的影響,因此本文算法更適合應(yīng)用于實(shí)際.
表6 DRSL算法與其他算法的總體分類性能比較
由于S類心電信號(hào)與正常心電信號(hào)(N類)的差異較小,若算法對(duì)S類的識(shí)別較差,則對(duì)患者而言是非常危險(xiǎn)的[25],因此正確識(shí)別S類心電信號(hào)類別也是檢驗(yàn)算法有效性的重要指標(biāo).表7為上述6種算法的S類分類性能的比較結(jié)果.通過(guò)觀察得知本文所提的DRSL算法具有最好的準(zhǔn)確率和敏感性,特異性和陽(yáng)性預(yù)測(cè)值僅低于IDRSN算法.由于漏診率是醫(yī)務(wù)人員最關(guān)注的評(píng)價(jià)指標(biāo),而DRSL算法比IDRSN算法的敏感性高2.51%,因此本文算法對(duì)S類分類總體更優(yōu).
表7 DRSL算法與其他算法的S類分類性能比較
面對(duì)高噪聲、大規(guī)模、類別不平衡的一維心電信號(hào)數(shù)據(jù)集,本文提出了一種基于IDRSN的心電信號(hào)分類算法DRSL.該算法使用SMOTE解決了心電數(shù)據(jù)類不平衡問(wèn)題,降低了樣本數(shù)量少的類別漏診率.根據(jù)心電信號(hào)特點(diǎn)改進(jìn)了DRSN模型,使其可以在高噪聲信號(hào)中提取重要局部特征達(dá)到自動(dòng)去除噪聲的目的,降低了預(yù)處理操作過(guò)程的復(fù)雜性,同時(shí)也避免了因網(wǎng)絡(luò)層加深造成的網(wǎng)絡(luò)退化現(xiàn)象.最后,結(jié)合LSTM提取了局部特征的依賴關(guān)系.在MIT-BIH數(shù)據(jù)集上進(jìn)行了分類實(shí)驗(yàn),實(shí)驗(yàn)表明,DRSL算法可以有效地提高分類準(zhǔn)確率、敏感性、特異性和陽(yáng)性預(yù)測(cè)值,分類總體性能優(yōu)于其他5種算法.
本文在預(yù)處理階段將心電信號(hào)按心拍進(jìn)行了等長(zhǎng)分割,忽略了心拍與心拍之間的特征信息,且在實(shí)際臨床診斷時(shí)不同心拍的長(zhǎng)度是非等長(zhǎng)的.因此,研究使用非等長(zhǎng)心電信號(hào)作為模型輸入的識(shí)別分類算法是筆者下一步的工作.