国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于三域特征提取和GS-SVM的ECG信號智能分類技術(shù)研究

2020-04-01 03:08方紅幃佃松宜
關(guān)鍵詞:頻域時域分類器

方紅幃, 趙 濤, 佃松宜

(四川大學(xué)電氣工程學(xué)院, 成都 610065)

1 引 言

心電圖(Electrocardiogram,ECG)是醫(yī)生診斷患者是否患有心臟病的關(guān)鍵,一個完整的心跳包括P、Q、R、S、T和U波等幾部分,它們都反映一定的生理信息.醫(yī)生可以根據(jù)各部分的波形異常來判斷一個人是否生病.醫(yī)生對ECG的解讀往往是基于經(jīng)驗的,他們的判斷依賴于ECG信號中基于時域的一些病因的描述,實(shí)際上除了時域,還可以從其他域如頻域、小波域等去診斷ECG信號.為了幫助醫(yī)生快速做出判斷,提高患者的就診效率,本文對ECG信號的智能分類技術(shù)進(jìn)行了研究.

ECG信號的分類是模式識別中的一個很好的課題,許多學(xué)者對此進(jìn)行了研究.對于原始ECG信號,已有學(xué)者采用小波變換[1-2],中值濾波和陷波濾波器[3],稀疏導(dǎo)數(shù)分解[4]等方法去噪,但這些方法往往不能同時去除工頻干擾,基線漂移,肌電干擾等噪聲.去噪后的信號用于提取特征,有學(xué)者用時域特征分析[1,5],頻域及時頻域特征分析[4],小波域特征分析[2,3,6],主成分分析(Principal Component Analysis,PCA)[1,7]及獨(dú)立主成分分析(Independent Principal Component Analysis,ICA)[7]等方法.然而,這些方法提取的特征比較片面,不能全面的表達(dá)ECG信號.特征提取的目的是為了更好地將ECG信號分類,常用的方法有支持向量機(jī)(Support Vector Machine,SVM)[1,2,5,7-9],隨機(jī)森林[4],神經(jīng)網(wǎng)絡(luò)[6],深度置信網(wǎng)絡(luò)和主動學(xué)習(xí)[9]等,但是對于一種分類方法,如何選擇合適的參數(shù)或?qū)W習(xí)框架以達(dá)到最好的分類效果也是一個難題.

本文采用連續(xù)小波變換(Continuous Wavelet Transform, CWT)對原始ECG信號進(jìn)行預(yù)處理,可同時去除各種干擾.然后從時域、頻域和小波域中分別提取特征,把這些特征歸一化后結(jié)合GS-SVM(基于網(wǎng)格搜索的SVM)對ECG信號進(jìn)行分類.最后用基于混淆矩陣的評價指標(biāo)來評價算法的性能.

本文提出的ECG信號檢測方法主要包括ECG信號的獲取、預(yù)處理及分割、特征提取和歸一化,最后采用GS-SVM進(jìn)行分類.整個流程圖如圖1所示.

圖1 ECG信號分類流程Fig.1 The process of ECG signal classification

本文的數(shù)據(jù)來源于MIT/BIH的心律失常數(shù)據(jù)庫.該數(shù)據(jù)庫包含48組30 min ECG信號,ECG數(shù)據(jù)采樣頻率為360 Hz.每組數(shù)據(jù)都從兩個引導(dǎo)通道收集.讀取48組ECG數(shù)據(jù),選擇合適的數(shù)據(jù)量進(jìn)行研究.標(biāo)定正?!狽;左束支傳導(dǎo)阻滯—L;右束支傳導(dǎo)阻滯—R;所有其他ECG信號類型為“其他”—“O”,數(shù)據(jù)集劃分如表1所示.

表1 MIT/BIH數(shù)據(jù)庫中數(shù)據(jù)集劃分

直接從MIT-BIH心律失常數(shù)據(jù)庫中獲取的原始ECG信號,存在電力線頻率干擾、基線漂移、肌電圖干擾等不可忽略的干擾因素,需要進(jìn)行預(yù)處理.采用CWT對原始信號進(jìn)行去噪[10]預(yù)處理,CWT的實(shí)質(zhì)是對ECG原始信號的濾波,對于有限能量信號f(t),其基于母波Ψ的CWT可表示為

(WΨf)(a,b)=

(1)

其中,a∈R+為縮放因子;b∈R,為平移因子.本文選用墨西哥草帽函數(shù)為母波,其定義為

(2)

墨西哥草帽函數(shù)無限光滑即無窮次可微,因此它不對單獨(dú)的噪聲點(diǎn)敏感[11],而其獨(dú)特的時域特性,使得ECG信號的Q、R、S等特征點(diǎn)突出.由圖2可以看出,圖2(a)中ECG信號在處理前存在嚴(yán)重的基線漂移和一定的干擾. 圖2(b)中處理后的ECG信號基與零縱軸對齊,ECG圖像變得更加平滑,處理后的信號便于進(jìn)一步處理和分析.

接下來,本文采用Pan和Tompkins提出的實(shí)時QRS波檢測算法[12]來檢測ECG信號中的QRS波.該算法對MIT/BIH異常心律數(shù)據(jù)的檢測準(zhǔn)確率達(dá)到99.3%.一個心拍周期的主要能量集中在QRS段,通過分割心拍可以去除冗余信息.檢測到R峰值后,取R峰值前25點(diǎn)和R峰值后44點(diǎn)的數(shù)據(jù),共70點(diǎn)數(shù)據(jù)片段代替一個心拍周期信號.

圖2 原始ECG信號和預(yù)處理過ECG信號

2.2 特征提取

將ECG信號的特征從時域、頻域和小波域中提取出來,從各個域獲取信號特征,以便準(zhǔn)確分類.

(1) 時域特征.不同類型的ECG信號在直觀的波形上有一定的差異,可以從其波形中提取一些形態(tài)特征.對于每個信號段xn,其R峰振幅作為振幅特征.

Ampn=Max(xn)

(3)

每個信號段的標(biāo)準(zhǔn)差σn反映了信號在均值附近的波動程度.

(4)

其中,μ表示信號段均值.

峰值因子CFn表示峰值與有效值的比值.

(5)

其中,RMS(xn)表示信號段的均方根;peak(xn)是信號段的峰值.

形狀因子SFn是一種受物體形狀影響,但不受其維度影響的值.

(6)

其中,Mean(|xn|)是信號段的幅值均值.

脈沖因子IFn,其表示波形的沖擊程度,對R波形的檢測比較敏感.

(7)

(2) 頻域特征.為了提取ECG信號的頻域特征,首先對ECG信號進(jìn)行快速離散傅里葉變換(Fast Fourier Transform, FFT).FFT是離散傅里葉變換(Design for Testability, DFT)的快速算法,對于ECG信號片段xn(i),i=1,2,…,70,其FFT可表示為

(8)

其中,WL=e-2πM,Xn(m)是ECG信號片段的頻域表達(dá)式,其中m=1,2,…,L,表示譜線數(shù).

在頻域信息中,可以得到頻率與幅值之間的關(guān)系.在頻域中,QRS波位于高頻區(qū),而P波和T波位于低頻區(qū).不同類型的ECG信號在頻率分量上存在較大差異.根據(jù)高頻和低頻的幅值差,選擇了能夠反映這些幅值差的一些特征.本文選取頻譜均值、頻譜標(biāo)準(zhǔn)差、頻譜偏度和頻譜峰度作為頻域的4個特征.

頻譜均值SMn為頻率幅值譜的平均值.

(9)

頻譜標(biāo)準(zhǔn)差SSDn表示信號在均值周圍波動的程度.

(10)

頻譜偏度SDn和頻譜峭度SKn是從概率論和統(tǒng)計學(xué)角度定義的波形分布概率的描述式.

(11)

(12)

(3) 小波域特征.當(dāng)被觀測對象是具有多個動作電位的重復(fù)信號時,如ECG信號,小波域特征可以識別高頻信號的相對分布[13].本文采用小波包分解(WPD)對ECG信號進(jìn)行小波域分析.WPD是離散小波變換(DWT)的經(jīng)典推廣,它將頻帶劃分為若干層,并對一般小波分析中未細(xì)分的高頻部分進(jìn)行分解.圖3為三層小波包分解樹示意圖.S表示分解前的原始信號;A表示分解后的高頻信號;D表示分解后的低頻信號,腳標(biāo)表示分解的層數(shù).

圖3 3層小波包分解樹

本文選取“Shannon”熵類型,以“db6”為母波,對ECG信號進(jìn)行四級分解[3].通過計算第四層小波包系數(shù)的奇異值、標(biāo)準(zhǔn)差和最大值[14],可以得到三種小波域特征信息.由于第四層有16個頻段,總共可以得到48個特征.設(shè)第四層分解得到的系數(shù)為ζ1,i=1,2,…,16.

奇異值SVDn反映了矩陣的固有特性,在信號處理、統(tǒng)計等領(lǐng)域有著重要的應(yīng)用.奇異值具有良好的穩(wěn)定性,它不會隨著矩陣元素的微小變化而發(fā)生劇烈的變化.對于同一種ECG信號,其奇異值具有很高的相似性,很容易區(qū)分不同類型的心律.

SVDn=svd[ζ1,ζ2,...,ζ16]n

(13)

最大值MAXn是從第4層分解系數(shù)中直接選取的最大值.

MAXn=max[ζ1,ζ2,...,ζ16]n

(14)

標(biāo)準(zhǔn)差STDn來描述第4層分解系數(shù)的離散程度.

STDn=std[ζ1,ζ2,...,ζ16]n

(15)

綜上所述,表2列出了從3個域中提取的所有特征.

表2從時域、頻域、小波域提取的特征

Tab.2Allfeaturesextractedfromt-domain,f-domain,w-domain

特征種類特征名表達(dá)式時域特征幅值f1=Ampn標(biāo)準(zhǔn)差f2=σn峰值因子f3=CFn形狀因子f4=SFn脈沖因子f5=IFn頻域特征頻率均值f6=SMn頻率標(biāo)準(zhǔn)差f7=SSDn頻率偏度f8=SDn頻率峭度f9=SKn小波域特征奇異值f10~f15=SVDn最大值f16~f31=MAXn標(biāo)準(zhǔn)差f32~f57=STDn

特征值之間差異很大,如果將這些特征直接輸入到經(jīng)典算法中,算法的權(quán)值在收斂過程中會發(fā)生振蕩,容易收斂到局部最優(yōu)結(jié)果.為了避免這種情況,將采用以下方法進(jìn)行歸一化.

(16)

其中,j=1,2,3,…,57.處理后的特征值在-1~1范圍內(nèi),這將大大提高學(xué)習(xí)算法的收斂能力.

2.4 GS-SVM

雖然SVM已成功地應(yīng)用于ECG信號檢測,但如何選擇最優(yōu)參數(shù)一直是一個難題.對于給定的訓(xùn)練集D={(x1,y1),(x2,y2),…,(xn,yn)},yi∈{-1,1},i=1,2,3,…,n,其中,xn是輸入,yn是對應(yīng)的輸出,SVM滿足如下表達(dá)式[15-17].

subjecttoyi(wΤΨ(xi)+b)≥

1-ζi,ζi≥0.

(17)

其中,Ψ(xi)函數(shù)將xi映射到一個更高維的空間,C>0是誤差項的懲罰因子.SVM目的是在高維空間中找到一個邊界最大的線性劃分超平面wTxi+b=0.在本文中,RBF核(k(xixk)=exp(-λ‖xi-xk‖2))作為核函數(shù),其中,λ為核函數(shù)參數(shù).對于整個算法,懲罰因子C和核函數(shù)參數(shù)λ的選取決定著算法的性能,為了獲取最優(yōu)參數(shù),本文運(yùn)用網(wǎng)格搜索法(GS)[18]來獲取最優(yōu)參數(shù),可以同時對C與λ搜索,搜索過程中它們相互獨(dú)立,能使算法達(dá)到全局最優(yōu).GS-SVM的流程如下所示.

步驟1:選擇測試集與訓(xùn)練集.

步驟2:粗略選取能決定C與λ搜索范圍的兩個參數(shù)β∈[βmin,βmax]和ε∈[εmin,εmax],β和ε為在各自固定步長下的取值.

步驟4:將SVM中C與λ參數(shù)設(shè)置為Pk,結(jié)合訓(xùn)練集對SVM進(jìn)行訓(xùn)練,利用測試集輸出得到分類正確率,將最高正確率對應(yīng)的Pk記錄下來.

步驟5:搜索結(jié)束時,如果最高正確率對應(yīng)的Pk不落在由C與λ搜索范圍組成的網(wǎng)格邊界上,此時則得到了最優(yōu)的C與λ,算法結(jié)束;否則要重新選定σ和ε,確保搜索結(jié)束時Pk落在網(wǎng)格邊界內(nèi),回到步驟3.

混淆矩陣常用于表示分類的結(jié)果,從中可以知道有多少樣品是正確分類的及一些其他的細(xì)節(jié).表3為ECG信號分類的混淆矩陣.

表3 混淆矩陣

根據(jù)混淆矩陣,列出7個評價指標(biāo)如表4所示,用來評估分類器性能.

表4 評價指標(biāo)

3.2 仿真結(jié)果與分析

GS-SVM結(jié)合三域特征的ECG信號分類算法是在Matlab平臺上實(shí)現(xiàn)的.利用訓(xùn)練集訓(xùn)練SVM分類器,通過測試集輸出分類器的準(zhǔn)確率,整個參數(shù)搜索過程可以用圖4中的三維網(wǎng)格圖表示.網(wǎng)格處的紅點(diǎn)位置標(biāo)記著最高分類準(zhǔn)確率,同時也對應(yīng)著最優(yōu)的C與λ.

圖4 搜索最優(yōu)C與λ的三維網(wǎng)格

Fig.4 Three-dimensional grid graph of searching the optimalCandλ

為了探索不同域的特征對分類結(jié)果的影響,利用每一類特征、每兩類特征和所有三類特征分別結(jié)合GS-SVM對ECG信號進(jìn)行分類,以獲得分類準(zhǔn)確率和特征種類關(guān)系的折線圖如圖5所示,圖中ft、ff、fw分別表示提取自時域、頻域、小波域的特征.由折線圖可知,如果僅利用一種特征來對ECG信號分類,小波域特征的效果最好,這是因為它對ECG信號的解釋最為細(xì)致.時域特征有著最差的效果,這也解釋著醫(yī)生如果僅憑時域經(jīng)驗準(zhǔn)則來分析ECG信號,結(jié)果可能會出現(xiàn)較大的偏差.但是對于分類器而言,時域信號對于提升ECG信號分類正確率還是有一定的幫助.

將測試集輸入到最優(yōu)參數(shù)配置的SVM中,得到表5所示的混淆矩陣.該矩陣詳細(xì)的展示了4類ECG信號的分類情況.

圖 5 三類特征對分類器的影響Fig.5 Effect of three types of features on classifier

表5提出的方法的混淆矩陣

Tab.5Confusionmatrixofproposedmethod

注釋類別預(yù)測類別NLR“O”總數(shù)N298931333 026L12 4020252 428R002 120602 180“O”1517562 8552 943總數(shù)3 0052 4222 1772 97310 577

基于混淆矩陣,計算各性能評價參數(shù)如表6所示.SPC、REC、PRE、NPV分別表示每一種ECG信號的分類效果,例如REC表示該種信號TP的占有率,也表示其召回率.OA、OE和F1分?jǐn)?shù)是分類器的總體評價,例如F1分?jǐn)?shù)是REC和PRE的調(diào)和平均值,越接近1,就表示分類器效果越好.

表 6 每個類別的性能評估

3.3 結(jié)果比較

表7給出了本文方法與其他文獻(xiàn)中方法的ECG信號分類結(jié)果對比.在文獻(xiàn)[7]中,用主成分分析(PCA)和核獨(dú)立成分分析(KICA)特征提取ECG信號特征,再采用基于遺傳算法優(yōu)化的SVM算法(GA-SVM)將ECG信號分為了5類,其準(zhǔn)確率為97.78%,但樣本僅為720個心拍;在文獻(xiàn)[2]中,用Hermit函數(shù)對ECG信號進(jìn)行變換,提取系數(shù)再結(jié)合一些時域特征作為總的特征,利用基于粒子群算法優(yōu)化的塊神經(jīng)網(wǎng)絡(luò)(PSO-BBNN),將ECG信號分為5類,分類正確率為97%;在文獻(xiàn)[19,20]中,提取了ECG信號的時間域波形間隔特征和紋理特征,利用基于遺傳蝙蝠優(yōu)化算法的支持向量神經(jīng)網(wǎng)絡(luò)(GB-SVNN),將ECG信號分為心律失?;驘o心律失常信號,其準(zhǔn)確率為96.96%;在文獻(xiàn)[1]中,從ECG信號中提取了高階譜(HOS)特征,然后經(jīng)過PCA降維,最后利用最小二乘支持向量機(jī)(LS-SVM)將ECG信號分為5類,準(zhǔn)確率為93.48%;在文獻(xiàn)[6]中,利用WPD結(jié)合統(tǒng)計方法提取特征,利用基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)(GA-BPNN)將ECG信號分為了6類,得到了97.78%的正確率,但仿真中僅用到300個實(shí)驗數(shù)據(jù). 在文獻(xiàn)[20]中,研究了三種監(jiān)督分類算法,多層感知器(MLP),SVM以及徑向基函數(shù)和概率神經(jīng)網(wǎng)絡(luò)(RBFNN,PNN)對ECG信號分類的效果,結(jié)合基于形態(tài)學(xué)和時間序列的時域特征,將ECG信號分為3類,分類精度最高為97.14%.其中,文獻(xiàn)[6-7]里的實(shí)驗數(shù)據(jù)不夠多,得到的分類器不能認(rèn)為具有較好的泛化能力和魯棒性.本文提出的方法對ECG信號三域特征進(jìn)行了研究,利用GS-SVM對MIT/BIH中48個文件的ECG信號分類,得到準(zhǔn)確率為98.02%,該方法取得較高的準(zhǔn)確性,較多的實(shí)驗數(shù)據(jù)也保證了分類器的泛化能力和魯棒性.

表7 與其他文獻(xiàn)結(jié)果對比

4 結(jié) 論

本文提出了一種基于三域特征提取和GS-SVM的ECG信號檢測方法.時域特征是ECG信號基于時間序列的形態(tài)學(xué)描述;頻域特征描述ECG信號的頻率統(tǒng)計學(xué)特征;小波域特征是低頻和高頻中沒有反映出來的細(xì)節(jié)信息.ECG信號可被這些特征充分地表示,將GS-SVM與這些特征相結(jié)合,實(shí)現(xiàn)了ECG信號的智能分類,該方法可以有效地幫助醫(yī)生對患者進(jìn)行診斷.

猜你喜歡
頻域時域分類器
OFDM 系統(tǒng)中的符號時域偏差估計
學(xué)貫中西(6):闡述ML分類器的工作流程
改進(jìn)的浮體運(yùn)動響應(yīng)間接時域計算方法
基于頻域的聲信號計權(quán)改進(jìn)算法
基于樸素Bayes組合的簡易集成分類器①
基于復(fù)雜網(wǎng)絡(luò)理論的作戰(zhàn)計劃時域協(xié)同方法研究
一種自適應(yīng)子融合集成多分類器方法
網(wǎng)絡(luò)分析儀時域測量技術(shù)綜述
頻域稀疏毫米波人體安檢成像處理和快速成像稀疏陣列設(shè)計
網(wǎng)絡(luò)控制系統(tǒng)有限頻域故障檢測和容錯控制