石 屹,金登男
(華東理工大學(xué) 信息科學(xué)與工程學(xué)院,上海 200237)
心電圖(ECG)是檢驗(yàn)心血管疾病的一種很有效的方法,伴隨著計(jì)算機(jī)技術(shù)的發(fā)展,計(jì)算機(jī)輔助心電信號(hào)檢測(cè)已經(jīng)逐漸融入到了醫(yī)生的日常診斷過(guò)程中。ECG模式分類(lèi)主要的兩個(gè)部分是特征提取和分類(lèi),大多數(shù)的ECG 特征提取可以通過(guò)傅里葉變換[1]等方法獲得較準(zhǔn)確的頻域信息[2-3]和時(shí)域信息[4],但是這種方法對(duì)于心電波形的形態(tài)特征提取的效果較差,提取的特征向量不能準(zhǔn)確的反應(yīng)出波形的形態(tài)特征,并且容易受到噪聲的干擾?;贖ermite函數(shù)的ECG 特征提取方法[5]雖然可以在高階的Hermite函數(shù)下達(dá)到較好的效果,但是由于函數(shù)的階數(shù)較高和時(shí)間較長(zhǎng)等因素還需要進(jìn)一步改善。KPL 特征提?。?]、小波分析[7]和基于向量機(jī)分類(lèi)[8]方法雖然各有特點(diǎn),但從準(zhǔn)確性和抗干擾性上都存在不足[9]。不確定性推理模型[10]等基于知識(shí)模型的應(yīng)用為獲取診斷過(guò)程中隱含和潛在的知識(shí)提供了有效途徑。但是,領(lǐng)域知識(shí)完整性和不確定性問(wèn)題仍然是此類(lèi)方法研究中的難點(diǎn)。本文提出了一種新的心電信號(hào)波形形態(tài)的特征提取方法,目標(biāo)是準(zhǔn)確的提取心電波形的形態(tài)特征,并且減小噪聲帶來(lái)的干擾。結(jié)合之前做過(guò)的心電信號(hào)形態(tài)特征[11]以及神經(jīng)網(wǎng)絡(luò)分類(lèi)[12]的研究,論文針對(duì)心電信號(hào)分段結(jié)合貝塞爾曲線(xiàn)來(lái)提取心電信號(hào)的特征,大大提高了心電信號(hào)特征提取的準(zhǔn)確度和效率,并且使用自組織神經(jīng)網(wǎng)絡(luò)針對(duì)提取的特征進(jìn)行分類(lèi),把形態(tài)相似的波形聚合到一起,達(dá)到了較好的效果。
ECG 是使用心電采集儀器(如心電監(jiān)護(hù)儀)記錄人體心臟電位變化,并據(jù)此應(yīng)用于臨床心臟疾病監(jiān)護(hù)、診斷的可見(jiàn)圖形記錄,主要分為P 波、QRS 波、ST 波和U 波(見(jiàn)圖1)。P波位于一次心動(dòng)周期的開(kāi)始,表示心房除極過(guò)程。QRS波群是主要結(jié)構(gòu),反映心室除極全過(guò)程。T 波反映了心室快速?gòu)?fù)極。PR 段、PR 間期、ST 段、QT 間期等則反映了心臟各項(xiàng)功能交替的時(shí)間。
圖1 心電信號(hào)波形
ECG 屬于典型的視覺(jué)信息,醫(yī)學(xué)專(zhuān)家對(duì)其判讀的過(guò)程中融入了大量經(jīng)驗(yàn)知識(shí)。醫(yī)生們主要依據(jù)是ECG 波形的形態(tài),主要是P波段、QRS波段和ST 段來(lái)進(jìn)行診斷的。
心電信號(hào)數(shù)據(jù)庫(kù):MIT-BIH 心率失常數(shù)據(jù)庫(kù)包含有48組30分鐘的心電圖記錄。每條記錄包含兩個(gè)導(dǎo)聯(lián)的數(shù)據(jù),采樣頻率為360Hz。MIT-BIH 數(shù)據(jù)庫(kù)包含10 萬(wàn)條以上心拍,且每個(gè)心拍都經(jīng)過(guò)兩位及以上專(zhuān)家獨(dú)立標(biāo)注,MITBIH 數(shù)據(jù)庫(kù)包括了基本上全部類(lèi)型的心電信號(hào)波形,并且噪聲相對(duì)較少,可以使用濾波算法對(duì)噪聲較大的波形先進(jìn)行預(yù)處理,過(guò)濾出高頻的噪聲信號(hào),對(duì)波形的整體形態(tài)不會(huì)有很大的影響。
本文的實(shí)驗(yàn)將主要針對(duì)MIT-BIH 數(shù)據(jù)庫(kù)進(jìn)行。
基于貝賽爾曲線(xiàn)的分段特征提取分為三個(gè)部分,一個(gè)是波形的分段,然后對(duì)分段的波形進(jìn)行貝塞爾特征提取,最后把分段信息和貝塞爾特征提取的信息結(jié)合起來(lái)作為ECG的波形特征。對(duì)波形分段的是為了降低波形的復(fù)雜程度,這樣在做貝塞爾特征提取的時(shí)候可以達(dá)到更高的精確度并且獲得更快的速度。
ECG分段分為兩個(gè)步驟:首先,根據(jù)醫(yī)學(xué)上的概念進(jìn)行ECG 波段的分割;然后基于波段分離基礎(chǔ)上的貝塞爾曲線(xiàn)分段,這樣可以獲得更快的特征提取速度以及精確程度。
按照醫(yī)學(xué)上的波形分段把波形分成P 波、QRS波以及T 波。分段可以使用麻省理工學(xué)院提供的ECGPuwave工具[13]。P波和T 波作為一次心跳的起始波和恢復(fù)波,其標(biāo)準(zhǔn)形態(tài)比較簡(jiǎn)單,而QRS波則相對(duì)復(fù)雜,下面主要就QRS波的分段及特征提取來(lái)介紹基于貝塞爾曲線(xiàn)的特征提取。
QRS波段的基本形態(tài)如圖3的實(shí)線(xiàn)部分??梢灾苯邮褂迷嫉腝RS波段進(jìn)行貝塞爾特征提取,但是因?yàn)镼RS波段的頻率較高,很大程度上的影響到了波形特征提取的效果。針對(duì)這樣的情況,對(duì)QRS波段再進(jìn)行分段來(lái)提高貝塞爾特征提取的效率和精確程度。
假設(shè)圖2的實(shí)線(xiàn)波形為QRS的標(biāo)準(zhǔn)波形,對(duì)現(xiàn)有的波形進(jìn)行濾波和歸一化處理后都可以近似達(dá)到這樣波形形態(tài)。對(duì)波形進(jìn)行變化率分析(圖2虛線(xiàn))后可以得出波形高頻分量的集中位置,結(jié)合原始波形數(shù)據(jù),根據(jù)差值原則取R點(diǎn)周?chē)鷮?dǎo)數(shù)為零的點(diǎn)為分割點(diǎn),把波形分成4段(見(jiàn)圖3)。然后根據(jù)貝塞爾特征提取的原理,分別對(duì)4段波形進(jìn)行特征提取。
2.2.1 貝塞爾曲線(xiàn)
貝塞爾曲線(xiàn)是圖形學(xué)和數(shù)值分析中常用的參數(shù)曲線(xiàn),它根據(jù)曲線(xiàn)的首末點(diǎn)和中間的控制點(diǎn)來(lái)構(gòu)成曲線(xiàn)。其中起重要作用的是位于曲線(xiàn)中央的控制線(xiàn)。這條線(xiàn)是虛擬的,中間與貝塞爾曲線(xiàn)交叉,兩端是控制端點(diǎn)。移動(dòng)兩端的端點(diǎn)時(shí)貝塞爾曲線(xiàn)的曲率(彎曲的程度)也會(huì)發(fā)生對(duì)應(yīng)的變化,移動(dòng)中間點(diǎn)時(shí),貝塞爾曲線(xiàn)在起始點(diǎn)和終止點(diǎn)鎖定的情況下做均勻移動(dòng)。
任意一條m 階的貝塞爾曲線(xiàn)可以用如下的方程描述
式中:q(ti)——ti點(diǎn)對(duì)應(yīng)的插值,m——貝塞爾曲線(xiàn)的階數(shù),Pk——第k個(gè)控制點(diǎn)。如果要在首末點(diǎn)插入n個(gè)插值點(diǎn),那么參數(shù)ti就需要均勻的分成n-1段間隔,并且每段間隔的ti值都要在0到1之間。因此,三階貝塞爾曲線(xiàn)的方程如下
傳遞首尾點(diǎn)的值(P0和P3),擬合后得到曲線(xiàn)中間的控制點(diǎn)(P1和P2),由此來(lái)確定曲線(xiàn)的形態(tài)。因?yàn)榉侄魏蟮男碾娦盘?hào)特征去除了頻率變化率較大的波形的干擾,針對(duì)每段的曲線(xiàn),可以使用貝塞爾曲線(xiàn)對(duì)每一段進(jìn)行擬合,從而提取曲線(xiàn)的控制點(diǎn)并整合作為波形的特征。
2.2.2 最小二乘法貝塞爾擬合
對(duì)于貝塞爾擬合的輸入數(shù)據(jù),可以把輸入的第一點(diǎn)和最后一點(diǎn)作為擬合的第一個(gè)和最后一個(gè)控制點(diǎn),也可以通過(guò)定義初始的分割點(diǎn)可以把輸入分割成段來(lái)處理。擬合的目標(biāo)是使用最小二乘法確定三階貝塞爾曲線(xiàn)的中間控制點(diǎn)P1和P2。使用最小二乘法可以求出使擬合曲線(xiàn)和原始曲線(xiàn)誤差最小的控制點(diǎn)的位置。對(duì)于曲線(xiàn)上的n個(gè)點(diǎn),pi和q(ti)分別是原始數(shù)據(jù)和擬合數(shù)據(jù),最小二乘法可以表示如下
帶入三階貝塞爾曲線(xiàn)方程,可得
其中P1和P2滿(mǎn)足
設(shè)參數(shù)
則可求出貝塞爾曲線(xiàn)的控制點(diǎn)
求出貝塞爾曲線(xiàn)的控制點(diǎn)后,可以使用控制點(diǎn)來(lái)擬合原始的心電信號(hào)波形。
假設(shè)心電信號(hào)的原始波形為O={p1,p2,…pn}我們使用三階貝塞爾曲線(xiàn)進(jìn)行擬合。輸入為心電信號(hào)的分割點(diǎn)和最大允許的誤差,心電信號(hào)根據(jù)分割點(diǎn)來(lái)確定分段的個(gè)數(shù),對(duì)每一段都使用三階貝塞爾曲線(xiàn)進(jìn)行擬合,生成擬合的曲線(xiàn)數(shù)據(jù)Q={q1,q2,…qn},然后使用最小二乘法測(cè)量原始數(shù)據(jù)和擬合數(shù)據(jù)的誤差,迭代進(jìn)行直到誤差達(dá)到標(biāo)準(zhǔn)范圍內(nèi)。
擬合的過(guò)程中使用分割擬合的策略。當(dāng)三階貝塞爾擬合不能達(dá)到標(biāo)準(zhǔn)誤差范圍內(nèi),則自動(dòng)對(duì)原始的數(shù)據(jù)進(jìn)行分割,自動(dòng)增加分割點(diǎn),再對(duì)分割后的數(shù)據(jù)進(jìn)行擬合,直到擬合的數(shù)據(jù)達(dá)到標(biāo)準(zhǔn)誤差范圍內(nèi)。
自組織神經(jīng)網(wǎng)絡(luò)(self-organization mapping net)是基于競(jìng)爭(zhēng)式學(xué)習(xí)的一種網(wǎng)絡(luò),它是一種無(wú)指導(dǎo)的聚類(lèi)方法。它的基本特點(diǎn)是在樣本群中競(jìng)爭(zhēng)尋找相似的特征、規(guī)則或是聯(lián)系,然后再將這些有共同特色的樣本聚集成同類(lèi)。假設(shè)輸出神經(jīng)元之間互相競(jìng)爭(zhēng),在競(jìng)爭(zhēng)的神經(jīng)元中,只有一個(gè)最終會(huì)被激發(fā),而其他的神經(jīng)元將會(huì)被抑制,然后在下一輪競(jìng)爭(zhēng)中,之前被激發(fā)的神經(jīng)元才會(huì)進(jìn)行調(diào)整(學(xué)習(xí)),被抑制的神經(jīng)元保持不變,最終產(chǎn)生穩(wěn)定的分類(lèi)網(wǎng)絡(luò)。自組織神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖4所示。
圖4 自組織神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)
輸入層神經(jīng)元和輸出層的神經(jīng)元相互連接。輸入神經(jīng)元的個(gè)數(shù)由輸入個(gè)數(shù)決定,輸出層的神經(jīng)元要根據(jù)實(shí)際情況來(lái)指定。一般來(lái)說(shuō),輸出層的神經(jīng)元個(gè)數(shù)遠(yuǎn)多于輸入層的神經(jīng)元個(gè)數(shù)。
自組織神經(jīng)網(wǎng)絡(luò)聚類(lèi)的方法是為輸入神經(jīng)元和輸出神經(jīng)元找到最佳的匹配,最佳匹配的輸出神經(jīng)元和樣本特征之間距離最小。即若第n個(gè)樣本的獲勝單元為i,則有
式中:Xn——第n個(gè)輸入樣本向量,Wj——第j個(gè)輸出神經(jīng)元的相連的權(quán)向量。
SOM 網(wǎng)絡(luò)的學(xué)習(xí)算法過(guò)程如下:
(1)網(wǎng)絡(luò)初始化。對(duì)輸出層每個(gè)節(jié)點(diǎn)權(quán)重Wj賦初值,定義結(jié)束條件。
(2)將訓(xùn)練數(shù)據(jù)樣本的特征值逐一輸入自組織神經(jīng)網(wǎng)絡(luò),對(duì)每一個(gè)樣本執(zhí)行步驟3~6。
(3)計(jì)算輸出層和輸入層之間的神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)距離。
(4)修改神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)的權(quán)值。
(5)調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),降低鄰域大小。
(6)迭代結(jié)束,檢查推出條件(達(dá)到最大迭代次數(shù)),否則重復(fù)步驟2。
心電信號(hào)實(shí)驗(yàn)數(shù)據(jù)取自MIT-BIH 心律失常標(biāo)準(zhǔn)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)中共有48組病人的心電信號(hào),包含了幾乎所有種類(lèi)的心電信號(hào)數(shù)據(jù)。這些心電信號(hào)的記錄中通常會(huì)摻雜一些噪聲,對(duì)數(shù)據(jù)處理帶來(lái)了困難。本實(shí)驗(yàn)的心電信號(hào)對(duì)象是以R 峰為標(biāo)志的前后200個(gè)采樣點(diǎn),共112605 段波形,這些采樣點(diǎn)波形已經(jīng)包含了心電信號(hào)的所有形態(tài)特征。
首先使用小波分析對(duì)波形進(jìn)行濾波處理,過(guò)濾掉心電信號(hào)的高頻噪聲。然后使用MIT 提供的ECGPuwave方法選取出每段波形QRS波。
針對(duì)QRS波段的R點(diǎn),分別計(jì)算R點(diǎn)周?chē)嚯x最近的極值點(diǎn)。在計(jì)算極值點(diǎn)的過(guò)程中有可能受到噪聲信號(hào)的影響,比如對(duì)于圖5中灰色的波形的T 波處,突然的高頻噪聲對(duì)波形的形態(tài)產(chǎn)生了影響,因此在判斷極值點(diǎn)的過(guò)程中要結(jié)合平滑函數(shù)來(lái)計(jì)算極值點(diǎn)。本實(shí)驗(yàn)在計(jì)算極值點(diǎn)的過(guò)程中采用5點(diǎn)平均法平滑R點(diǎn)周?chē)臄?shù)據(jù),當(dāng)確定了距離R點(diǎn)最近的極值點(diǎn)后恢復(fù)成原始波形。此方法保證了心電信號(hào)分段的準(zhǔn)確性,在之后的三階貝塞爾擬合的過(guò)程中使用原始的波形又可以確保波形形態(tài)特征的準(zhǔn)確性。
圖5 5點(diǎn)平均處理的心電信號(hào)
完成心電信號(hào)的分段之后使用三階貝塞爾函數(shù)分別對(duì)每段波形進(jìn)行特征提取。貝塞爾擬合的輸入為分段波形信號(hào)。因?yàn)橹暗姆侄我呀?jīng)保證了每段的心電信號(hào)的形態(tài)相對(duì)單一,因此貝塞爾擬合函數(shù)不需要額外的增加分割點(diǎn)。
使用三階貝塞爾函數(shù)進(jìn)行特征提取的結(jié)果如圖6所示,可以看出根據(jù)特征點(diǎn)還原的波形和原始波形基本相同,折線(xiàn)為波形控制點(diǎn)連線(xiàn)。使用三階貝塞爾曲線(xiàn)擬合之后,原始波形的誤差被有效的抑制,而且控制點(diǎn)很好的表述了波形的形態(tài)信息。因此三階貝塞爾擬合的特征提取達(dá)到了很好的效果。
圖6 三階貝塞爾擬合
采用三階貝塞爾函數(shù)對(duì)5000個(gè)心電信號(hào)波形采樣進(jìn)行分段擬合,最終得到擬合的均方誤差如圖7所示,可以看出三階貝塞爾函數(shù)對(duì)心電信號(hào)分段擬合達(dá)到了很好的效果。
圖7 貝塞爾擬合均方誤差
提取三階貝塞爾擬合的控制點(diǎn)的24個(gè)特征,使用自組織神經(jīng)網(wǎng)絡(luò)進(jìn)行分類(lèi)。把24個(gè)特征作為神經(jīng)網(wǎng)絡(luò)輸入,映射到6*6的二維輸出上。使用Hextop作為自組織神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),設(shè)置初始的鄰域足夠大,使神經(jīng)網(wǎng)絡(luò)有足夠的空間訓(xùn)練調(diào)整。使用自組織神經(jīng)網(wǎng)絡(luò)對(duì)心電信號(hào)分類(lèi)的結(jié)果如圖8所示。
圖8 自組織神經(jīng)網(wǎng)絡(luò)分類(lèi)
通過(guò)擴(kuò)大自組織神經(jīng)網(wǎng)絡(luò)的輸出神經(jīng)元可以映射更多的聚類(lèi)中心,從而達(dá)到更好的分類(lèi)效果,但是另一方面,過(guò)多的輸出也會(huì)對(duì)醫(yī)生的識(shí)別造成困難,6*6的輸出作為類(lèi)別數(shù)和準(zhǔn)確度的權(quán)衡,在現(xiàn)階段達(dá)到了很好的效果。
通過(guò)對(duì)醫(yī)學(xué)專(zhuān)家診斷心電圖的思維過(guò)程和統(tǒng)計(jì)學(xué)的分析,本文提出了一種以醫(yī)生經(jīng)驗(yàn)為基礎(chǔ),基于心電信號(hào)分段特征提取的方法,結(jié)合三階貝塞爾函數(shù)和自組織神經(jīng)網(wǎng)絡(luò)的心電信號(hào)分類(lèi)方法。從MIT-BIH 數(shù)據(jù)的實(shí)驗(yàn)結(jié)果來(lái)看,分段提取的貝塞爾特征可以很好描述心電信號(hào)的特征,結(jié)合自組織神經(jīng)網(wǎng)絡(luò)可以達(dá)到較好的分類(lèi)效果。
與已有的心電信號(hào)模式分類(lèi)方法相比,本文的創(chuàng)新在于:第一,重視統(tǒng)計(jì)數(shù)據(jù)和經(jīng)驗(yàn)知識(shí)在計(jì)算機(jī)中的表示;第二,突破了心電信號(hào)模式分類(lèi)器特征表示方式單一的局限,使用分段的方式更加準(zhǔn)確的描述心電信號(hào)的特征,構(gòu)造出了更有效的心電信號(hào)特征空間。第三,研究工作面向?qū)嶋H應(yīng)用,具有明確的背景和真實(shí)的臨床數(shù)據(jù)支持。
本文提出的方法是分類(lèi)模型中引入形態(tài)特征的初步嘗試。在接下來(lái)的工作中,我們將繼續(xù)圍繞實(shí)際心電信號(hào)診斷過(guò)程,重點(diǎn)考慮經(jīng)驗(yàn)知識(shí)在計(jì)算機(jī)的表達(dá)和表示,從而進(jìn)一步完善心電信號(hào)波形的分類(lèi)。
[1]SHANG Yu,XU Ting,HE Yonghui.The applications of the fractional fourier transform in the ECG processing[J].Electronic Science and Technology,2011,24(8):116-118(in Chinese).[尚宇,徐婷,何永輝.分?jǐn)?shù)階傅里葉變換在心電信號(hào)處理中的應(yīng)用[J].電子科技,2011,24(8):116-118.]
[2]WANG Liping,ZHU Jiangchao,SHEN Min.An electrocardiogram classification method combining morphology features[C]//Chongqing:Pattern Recognition,2010:1-5(in Chinese).[王麗蘋(píng),朱江超,沈蜜.一種結(jié)合形態(tài)特征的心電圖模式分類(lèi)方法[C].重慶:全國(guó)模式識(shí)別學(xué)術(shù)會(huì)議,2010:1-5.]
[3]Kuo Kuang Jen.ECG feature extraction and classification using cepstrum and neural networks[J].Journal of Medical and Biological Engineering,2007,28(1):31-37.
[4]Mahesh A Nair.ECG feature extraction using time frequency analysis[M].Germany:Springer,2010:461-466.
[5]Park K S,Cho B H,Lee D H.Hierarchical support vector machine based heartbeat classification using higher order statistics and hermite basis function[J].Computers in Cardiology,2008,14(3):229-232.
[6]LI Xuehua,MO Zhiwen,SHU Lan.The research of KPL feature extraction method for ECG recognition[J].Microcomputer Information,2009,1(27):3-5(in Chinese).[李學(xué)華,莫智文,舒蘭.KPL特征提取在心電識(shí)別中的應(yīng)用研究[J].微計(jì)算機(jī)信息,2009,1(27):3-5.]
[7]Llamedo Soria M.An ECG classification model based on multilead wavelet transform features[C]//Durham,NC:Computers in Cardiology,2007:105-108.
[8]JIANG Xing,ZHANG Liqing,ZHAO Qibin,et al.ECG arrhythmias recognition system based on independent component analysis feature extraction[C]//IEEE Region 10Conference TENCON.Hong Kong:IEEE Press,2006:1-4.
[9]Karpagachelvi S.ECG feature extraction techniques a survey approach[J].International Journal of Computer Science and Information Security,2010,8(1):76-82.
[10]WANG Liping,SHEN Mi,TONG Jiafei,et al.A uncertain reason method for abnormal ECG detection[C]//IEEE International Symposium on IT in Medicine &Education.JiNan:IEEE Press.2009:1091-1096.
[11]ZHAO Xudong,JIN Dengnan.Extraction method based on construction operator and morphological characteristics of waves[J].Computer Era,2007(12):1-3(in Chinese).[趙旭東,金登男.基于結(jié)構(gòu)算子的波形形態(tài)特征提取方法的研究[J].計(jì)算機(jī)時(shí)代,2007(12):1-3.]
[12]WANG Jinjun,JIN Dengnan.Research on pattern classification of DCG based on NN[J].Computer Applications and Software,2006,23(3):83-85(in Chinese).[王進(jìn)軍,金登男.應(yīng)用神經(jīng)網(wǎng)絡(luò)的理論對(duì)動(dòng)態(tài)心電信號(hào)模式分類(lèi)的研究[J].計(jì)算機(jī)應(yīng)用于軟件,2006,23(3):83-85.]
[13]MIT-BIH ECGPuwave Tool[EB/OL].[2010-01-01].http://www.physionet.org/physiotools/ecgpuwave/.