周金治,鄭淋文,黃 靜, 涂道鑫,賴健瓊
(1.西南科技大學(xué) 信息工程學(xué)院,四川 綿陽 621000;2.特殊環(huán)境機(jī)器人技術(shù)四川省重點(diǎn)實(shí)驗(yàn)室,四川 綿陽 621000)
隨著微機(jī)電系統(tǒng)(MEMS)技術(shù)、物聯(lián)網(wǎng)(IoT)技術(shù)的發(fā)展,低能耗的微小傳感器已經(jīng)能完成信息采集、處理、無線通信等多種功能,無線軀感網(wǎng)應(yīng)運(yùn)而生,并得到了迅猛發(fā)展,在醫(yī)療護(hù)理和智能家居等領(lǐng)域都有廣闊的應(yīng)用前景[1]。
由于穿戴式設(shè)備資源受限,對算法的時間和空間復(fù)雜度要求較高,使得面向軀感網(wǎng)(body sensor network,BSN)的心電(electrocardiograph,ECG)分析方法研究的難點(diǎn)主要在于精確、實(shí)時的波形識別和特征提取[2]。文獻(xiàn)[3]采用自適應(yīng)加窗二樣條小波來定位R波位置,同時解決QRS波抖動的問題,應(yīng)用差分閾值方法來確定ECG波群的邊界值,提取出ECG的時頻域特征。文獻(xiàn)[4]將二維主分量判別法(2D-PCA)和能量百分比法結(jié)合起來對12導(dǎo)聯(lián)高頻ECG信號進(jìn)行融合特征提取,提取出HF-ECG的全局特征和本征向量。文獻(xiàn)[5]利用Baum-Welch算法優(yōu)化離散隱形馬爾科夫模型參數(shù),采用Viterbi 算法提取出ECG特征。文獻(xiàn)[6]利用長短時記憶(long short term memory,LSTM)網(wǎng)絡(luò)捕捉ECG序列的前后依賴關(guān)系,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)取出信號的局部相關(guān)特征,同時完成特征提取和分類。在上述特征提取算法中,小波變換(WT)算法實(shí)現(xiàn)復(fù)雜,主成分特征值分解具有局限性,馬爾科夫模型中的狀態(tài)轉(zhuǎn)換概率矩陣的存儲復(fù)雜率較高,神經(jīng)網(wǎng)絡(luò)訓(xùn)練需要大量的計(jì)算參數(shù)和設(shè)備的存儲能力,無法應(yīng)用于受限設(shè)備中。
自編碼器(auto encoders,AEs)是一種可從無標(biāo)簽數(shù)據(jù)中自動學(xué)習(xí)數(shù)據(jù)特征的神經(jīng)網(wǎng)絡(luò),相比于CNN和循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN),網(wǎng)絡(luò)層少,實(shí)現(xiàn)簡單。本文面向軀感網(wǎng)中ECG特征提取性能的要求,提出一種高效、高準(zhǔn)確率的ECG融合特征分析方法。采用Pan-Tompkins算法進(jìn)行快速Q(mào)RS波群識別,并提取出時域特征。應(yīng)用堆疊稀疏自編碼器(sparse AEs,SAEs)進(jìn)行深度特征提取,最后以融合特征表征ECG信號。在SAEs訓(xùn)練模式中以單圖方式訓(xùn)練,采用Adam優(yōu)化器,捆綁權(quán)重,可大大減少模型訓(xùn)練時間。
特征的提取是ECG智能分析診斷模型的基礎(chǔ)和核心,特征質(zhì)量的高低決定著后續(xù)分類結(jié)果和心血管疾病的診斷效果。為了得到更好的分類效果,往往組合運(yùn)用多種類型特征集合[7]。本文采用時域特征和深度特征組合的方式進(jìn)行單導(dǎo)聯(lián)特征提取。
在穿戴式健康監(jiān)測系統(tǒng)中,傳感器節(jié)點(diǎn)需要將采集到的ECG信號,通過無線傳送至監(jiān)控中心或顯示設(shè)備,為進(jìn)一步的分析與診斷提供依據(jù)。因此,對于ECG波形檢測,需要正確性與實(shí)時性的統(tǒng)一[8]。Pan-Tompkins(PT)算法具有魯棒性強(qiáng),計(jì)算量低的特點(diǎn),被廣泛應(yīng)用于穿戴式ECG設(shè)備的波形檢測當(dāng)中[9]。因此本文選用PT算法來檢測QRS波群。具體步驟如下:
1)帶通濾波器:級聯(lián)了低通濾波器和高通濾波器,可降低信號噪聲干擾,僅在單位圓上具有極點(diǎn)和零點(diǎn),通帶設(shè)計(jì)靈活。其低通濾波器的為整系數(shù),可以降低計(jì)算復(fù)雜度。截止頻率約為11 Hz,增益為36 dB,有6個樣本的延遲,傳遞函數(shù)H(z)=(1-z-6)2/(1-z-1)2。高通濾波器的截止頻率為5 Hz,16個樣本延遲,傳遞函數(shù)H(z)=(-1+32z-16+z-32)/(1-z-1)。
2)微分:主要用于濾除輸入的直流分量,高頻獲得線性增益。可看作一個高通濾波器,有2個樣本的延遲。傳遞函數(shù)為H(z)=(-z-2-2z-1+2z+z2)/8。
3)平方:可以確保每個樣本值都為正數(shù),增強(qiáng)P,T波和QRS波斜率,凸顯Q,S波。具體計(jì)算y(n)=x2(n)。
4)滑窗積分:通過微分后,QRS波群將產(chǎn)生許多波,采用滑窗積分可將其進(jìn)行平滑輸出,并得到R波斜率以及其他波形特征信息。計(jì)算方式:y(n)=[x(n-(N-1))+x(n-(N-2))+…+x(n)]/N。式中,N為滑動窗口內(nèi)采樣點(diǎn)的數(shù)量,N過大時,會將QRS波和T波復(fù)合在一起,N過小時,會在QRS波群中產(chǎn)生很多峰值?;瑒臃e分有21個樣本延遲。
5)自適應(yīng)閾值:PT算法采用雙閾值檢測QRS波群。令SPKI代表QRS波群峰值,NPKI代表非QRS波群峰值,THRESHOLD I1為閾值1,THRESHOLD I2為閾值2。閾值1用于搜索濾波后的ECG信號,閾值2搜索滑窗積分產(chǎn)生的信號。如果峰值大于閾值1,則判定為SPKI,否則為NPKI。PEAKI 表示總體的峰值。閾值更新方式:SPKI=0.125PEAKI+0.875SPKI,if PEAKI is signal peak;NPKI=0.125PEAKI+0.875SPKI,if PEAKI is signal peak;THRESHOLD I1=NPKI+0.25(SPKI-NPKI);THRESHOLD I2=0.5THRESHOLD I1。
利用PT算法檢測到QRS波群后,提取出R-R間期、Q-R間期、R-S間期、R波幅值和QRS波斜率作為時域特征。
有研究表明,稀疏的表達(dá)往往比其他的表達(dá)要更有效[10]。SAEs是通過在自編碼器(AEs)的誤差函數(shù)中添加散度來對隱含層進(jìn)行稀疏性約束,改善發(fā)現(xiàn)數(shù)據(jù)隱藏結(jié)構(gòu)的性能,同時加快模型收斂。對于輸入ECG數(shù)據(jù)x={x1,x2,…,xT+D},T代表訓(xùn)練樣本,D代表測試樣本。為了避免模型出現(xiàn)過擬合,本文在誤差函數(shù)中加入正則項(xiàng)。以Sigmoid為激活函數(shù),均方誤差為損失函數(shù),SAEs的誤差函數(shù)表達(dá)式如下
(1)
(2)
SAEs隱含層的輸出為所提取到的ECG抽象特征,特征向量的表達(dá)式為
(3)
圖1 堆疊SAEs單圖訓(xùn)練
將訓(xùn)練過程分為兩個階段:第一階段跳過隱含層2和隱含層3的輸出層,訓(xùn)練隱含層1和輸出層的權(quán)重和偏置,輸出層與棧式自編碼器的輸出層具有相同的權(quán)重和偏置;第二階段凍結(jié)隱含層1,訓(xùn)練隱含層2和隱含層3的權(quán)重和偏置,使得隱含層3盡可能逼近隱含層1。為了避免反復(fù)計(jì)算隱含層1的輸出,在第一階段結(jié)束時使用整個訓(xùn)練集計(jì)算,在第二階段只需輸入隱含層1的緩存輸出,可大大提高模型性能和減少訓(xùn)練時間。
為了降低堆疊SAEs的算法復(fù)雜度,提高效率,在算法進(jìn)行訓(xùn)練和微調(diào)時,采用Adam進(jìn)行參數(shù)尋優(yōu)。Adam算法[11]實(shí)現(xiàn)簡單,計(jì)算高效,對內(nèi)存需求少,梯度對角縮放具有不變性,對超參數(shù)具有較好的解釋性,經(jīng)驗(yàn)值能解決大多數(shù)問題。
本文利用PT進(jìn)行ECG信號的特征點(diǎn)識別與切割,提取出5維時域特征;通過歸一化和標(biāo)準(zhǔn)化后,存儲為行向量的形式。利用堆疊SAEs網(wǎng)絡(luò)對統(tǒng)一長度的ECG信號進(jìn)行深度特征提取,提取出10維深度特征,也存儲為行向量的形式。然后以向量張成的方式進(jìn)行特征融合,得到一個15維的特征行向量來表征ECG信號。
本文實(shí)驗(yàn)平臺為Intel Core i5—3230M,CPU主頻為2.6 GHz,64位Window10操作系統(tǒng) MATLAB2016a。仿真數(shù)據(jù)來自MIT-BIH心律失常數(shù)據(jù)庫中100#,105#,111#,114#,116#,118#,201#,203#,207#,210#,213#,215#,228#,232#樣本。按照數(shù)據(jù)庫中專家的標(biāo)注信息,在融合特征末尾添加類別標(biāo)簽向量為Y=[Y1,Y2,…,Y5],Yi取值為1或0,代表是否屬于第i類ECG類型。
PT算法利用斜率、振幅和寬度信息對QRS波群進(jìn)行快速檢測,如圖2所示為119#樣本中一段波形檢測的實(shí)驗(yàn)圖。
圖2中(a)為原始信號,(b)~(d)分別為經(jīng)過帶通、微分和平方后的信號,(e)為最后識別的結(jié)果圖,黑色虛線代表噪聲,淺灰色虛線表示自適應(yīng)閾值,深灰色虛線代表信號電平,圓圈為R波位置。
圖2 PT算法波形定位
本文分別對時域、深度以及融合特征的有效性進(jìn)行測試。分類器采用基于高斯徑向基核函數(shù)(RBF)的支持向量機(jī)(SVM),懲罰因子c為2.863 3, 核參數(shù)g為4.542 3。堆疊SAEs的權(quán)重衰減參數(shù)λ=0.000 1,稀疏參數(shù)ρ=0.05,懲罰稀疏β=3,網(wǎng)絡(luò)結(jié)構(gòu)為:200—100—50—10—50—100—200,輸入為200個采樣點(diǎn)的連續(xù)ECG信號,取R波峰值前后各100個采樣點(diǎn),第四層10個單元為深度特征。實(shí)驗(yàn)中采用5折交叉驗(yàn)證方法,訓(xùn)練數(shù)據(jù)量為28 660,測試數(shù)據(jù)量為7 165。實(shí)驗(yàn)結(jié)果如表1所示。
從表1中可以看出,時域特征的平均識別率為67.23 %,識別率征不高是因?yàn)檫x取的特僅從時域方面描述,維度較少。深度特征的平均識別率為94.29 %,說明本文使用深度特征是有效的。利用融合特征進(jìn)行分類時,融合特征較單一特征的識別率均有所提高,其中較時域特征平均提升了30.58 %,較深度特征提升了3.52 %,平均識別率達(dá)到了97.81 %。表明利用時域特征和深度特征進(jìn)行融合表征ECG信號的方法是有效的。
表1 融合特征交叉驗(yàn)證結(jié)果
表2是本文融合特征提取與其他文獻(xiàn)結(jié)果進(jìn)行對比。通過數(shù)據(jù)分析,在相同分類器的情況下,本文采用的融合特征總體效果更好,平均識別率為97.81 %,能達(dá)到較為理想的效果。
表2 與其他研究結(jié)果的對比
為了突出本文SAEs的特點(diǎn),在訓(xùn)練時通過限制計(jì)算機(jī)的CPU個數(shù)和性能,來證明模型在受限設(shè)備上的適應(yīng)能力。與其他兩個模型的訓(xùn)練時間對比結(jié)果如圖3所示。圖中模型1為Adam單圖訓(xùn)練方式,模型2為采用梯度下降(gradient descent,GD)進(jìn)行單圖訓(xùn)練,模型3為SGD傳統(tǒng)訓(xùn)練方式。從圖3中可以看出,模型3訓(xùn)練消耗的時間最長,使用Adam優(yōu)化器比SGD優(yōu)化器時的訓(xùn)練時間更短,表明本文采用的優(yōu)化器和訓(xùn)練方式能有效減少模型的訓(xùn)練時間,優(yōu)化模型性能,在受限設(shè)備上也具有較好的適應(yīng)能力。
圖3 模型訓(xùn)練時間對比
本文提出一種面向軀感網(wǎng)的ECG融合特征分析方法。采用PT算法進(jìn)行快速波形檢測并提取出時域特征,利用堆疊SAEs對連續(xù)ECG信號進(jìn)行深度特征提取,并在模型中加入正則項(xiàng),捆綁編解碼權(quán)重,以單圖方式進(jìn)行訓(xùn)練,應(yīng)用Adam優(yōu)化器進(jìn)行參數(shù)尋優(yōu)。實(shí)驗(yàn)結(jié)果表明:本文的融合特征能有效表征ECG信號,在五種心律識別中達(dá)到97.81 %的識別率,模型總體訓(xùn)練時間也大幅減少,適合于資源受限的可穿戴式健康監(jiān)測系統(tǒng)。