孫樹平,楊文博,董增奇,張弼強(qiáng),黃婷婷
南陽理工學(xué)院,河南南陽473000
根據(jù)國家心血管中心組織所編寫的《中國心血管病報(bào)告2018》[1],我國居民心血管疾病致死連續(xù)多年位居中國居民非傳染病死亡原因首位。2016年,農(nóng)村因心血管疾病死亡人數(shù)占全部因病死亡的45.50%,城市心血管疾病死亡人數(shù)占全部因病死亡的43.16%。隨著心血管疾病患病率及死亡率持續(xù)上升,2019年全國心血管疾病患者人數(shù)已達(dá)到2.9 億。我國的心血管疾病防治工作正面臨嚴(yán)峻挑戰(zhàn)。
心電圖是一種廣泛應(yīng)用于分析心臟功能基本生理信號(hào)的技術(shù)[2-3]。傳統(tǒng)心血管疾病診斷治療依靠患者的心電圖記錄,可供診斷的心電記錄通常需30 min以上,短時(shí)心電記錄不足以給醫(yī)生提供足夠診斷心血管疾病的信息。然而在長期心電記錄分析中,逐個(gè)節(jié)拍檢查是繁瑣和費(fèi)時(shí)的。因此,隨著計(jì)算機(jī)技術(shù)、數(shù)字信號(hào)處理手段等技術(shù)的不斷發(fā)展,借助計(jì)算機(jī)和數(shù)字信號(hào)處理手段對(duì)心電圖信號(hào)進(jìn)行檢測、處理和分析已逐步取代傳統(tǒng)診斷方式。然而無論是哪種分析方式,其診斷準(zhǔn)確率都取決于心電特征提取的準(zhǔn)確率。
長期心電記錄中R 峰自動(dòng)定位是診斷心臟疾病的重要步驟,R 峰定位的準(zhǔn)確率直接影響到心電特征提取效率以及準(zhǔn)確性[4-5]。國內(nèi)外學(xué)者做了大量R 峰定位的研究,基于小波變換[6-7]、數(shù)字濾波器[8]、數(shù)學(xué)形態(tài)學(xué)[9]、導(dǎo)數(shù)[10]、S 變換[11]、全變分去噪[12]和自適應(yīng)閾值[13]的R 峰自動(dòng)定位方法被廣泛應(yīng)用。自動(dòng)定位R 峰過程主要包含兩部分:心電信號(hào)預(yù)處理和R 峰自動(dòng)定位[14-16]。預(yù)處理過程是利用各種信號(hào)處理方法來增強(qiáng)QRS 復(fù)波群復(fù)雜度和抑制各種因素造成的噪聲,然而大部分方法都存在缺陷,例如漏檢和誤檢依賴于數(shù)字濾波器帶寬的選擇,使用小波變換時(shí)母小波的尺度選擇也是難題。
在實(shí)際應(yīng)用中,能有效同時(shí)提高或降低噪聲的綜合預(yù)處理技術(shù)是有難度的。一個(gè)肌肉的突然抖動(dòng)或者是呼吸的變化都會(huì)引起心電信號(hào)波形變化。除了噪聲之外,心電信號(hào)本身的多變性也給R峰的精準(zhǔn)定位造成很大困難。例如負(fù)極性的R 峰、低振幅的QRS 復(fù)波群、R-R 間隔突然增寬或縮短、出現(xiàn)具有高能量T 波以及嚴(yán)重的基線漂移等,解決上述問題是R峰自動(dòng)定位的重點(diǎn)。
本文提出一種基于高斯模型的心電特征提取方法,首先采用短時(shí)修正希爾波特變換(STMHT)算法自動(dòng)定位R峰并對(duì)其進(jìn)行修正,以求達(dá)到更高的準(zhǔn)確率。在得到精確的R峰位置后,將連續(xù)的心電記錄分割為獨(dú)立的心電節(jié)拍。然后為每個(gè)節(jié)拍建立高斯模型,模型參數(shù)就是需提取的心電特征。
心電特征提取可由圖1所述內(nèi)容進(jìn)行闡述,其內(nèi)容為:首先對(duì)心電信號(hào)進(jìn)行預(yù)處理,其次對(duì)R 峰進(jìn)行定位和修正,最后基于高斯模型提取心電特征;具體結(jié)構(gòu)如圖1所示。
圖1 心電特征提取流程框圖Fig.1 Flowchart of electrocardiogram(ECG)feature extraction
本研究實(shí)驗(yàn)過程所采用的心電記錄來自MIT-BIH心律失常數(shù)據(jù)庫,它包含48組連續(xù)測量30 min的雙通道心電記錄,采樣頻率為360 Hz。這些心電記錄包含正常的心電信號(hào)、高能量的P峰和T峰信號(hào)、負(fù)極性的QRS復(fù)波群、低能量的QRS復(fù)波群、時(shí)間間隔長的QRS復(fù)波群、振幅突然變化的QRS復(fù)波群、多種形式的室性早搏、長時(shí)間的停搏以及其它不規(guī)則的心率。
在心電信號(hào)測量中,由于采集設(shè)備以及采集個(gè)體差異性的限制等原因,最終得到的心電信號(hào)記錄存在大量噪聲,其波形存在不同的變化。影響R 峰自動(dòng)定位的噪聲主要有:工頻干擾噪聲、基線漂移噪聲以及肌電干擾噪聲等。預(yù)處理的最終目標(biāo)是濾除心電記錄中的噪聲。工頻干擾噪聲是由市電系統(tǒng)所造成的噪聲干擾;基線漂移噪聲是在采集心電信號(hào)的過程中因采集人呼吸產(chǎn)生的噪聲,基線漂移造成信號(hào)的突然變化,會(huì)拉高或降低P-QRS-T 波的振幅。基線漂移噪聲頻率受到呼吸頻率的影響,通常集中在[0.05,2](單位Hz)。肌電干擾噪聲是由于在采集心電信號(hào)的過程中,被采集人肢體活動(dòng)或其他情況造成采集電極區(qū)域肌肉電位變化產(chǎn)生的,肌電干擾噪聲的形態(tài)非常雜亂,其頻率范圍較為廣泛[1,1 000](單位Hz)。為去除這些噪聲,本文采用小波分解的濾波方法,保留心電信號(hào)頻率在[11.25,22.5](單位Hz)的成分以降低R峰定位的難度。心電信號(hào)原始波形如圖2 所示,其去除基線漂移效果如圖3 所示。
圖2 心電信號(hào)原始波形圖Fig.2 Original waveform of ECG signals
圖3 心電信號(hào)去除基線漂移圖Fig.3 ECG signals after baseline drift removal
心電信號(hào)特征提取的效率和準(zhǔn)確率取決于R峰自動(dòng)定位的準(zhǔn)確率,為了獲得精準(zhǔn)的R峰位置,本文采用了一種STMHT的R峰自動(dòng)定位算法[17]。在心電信號(hào)預(yù)處理后對(duì)經(jīng)過濾波處理的原始心電記錄進(jìn)行平滑包絡(luò)提取,然后通過希爾伯特變換的正過零點(diǎn)確定R峰位置。經(jīng)實(shí)驗(yàn)驗(yàn)證,在原始心電信號(hào)圖中采用希爾伯特變換正過零點(diǎn)所確定的R峰位置與數(shù)據(jù)庫中給出的R峰注釋位置存在一定偏移。因此筆者在希爾伯特變換正過零點(diǎn)所確定的R峰位置前后25個(gè)樣本點(diǎn)內(nèi)尋找正向能量最高的峰作為真正的R峰位置[18]。經(jīng)算法自動(dòng)定位的R峰與數(shù)據(jù)庫中注釋的R峰位置誤差在100 ms以內(nèi)即視為定位準(zhǔn)確[19]?;赟TMHT算法的R峰自動(dòng)定位結(jié)果片段如圖4所示。
圖4 心電信號(hào)R峰定位Fig.4 R-peak location of ECG signals
經(jīng)過與注釋位置的對(duì)比,本研究所采用的算法定位的R峰具有很高的準(zhǔn)確率,但仍然存在少量的漏判R 峰、誤判R 峰以及極性誤判的R 峰,因此需對(duì)這些定位不精確的R峰進(jìn)行修正。
1.3.1 增補(bǔ)漏判R峰經(jīng)初步定位后R峰有時(shí)會(huì)出現(xiàn)漏判R峰現(xiàn)象,具體表現(xiàn)為漏判位置相鄰兩個(gè)R峰R-R間隔過大。由于心電信號(hào)具有不確定性,判斷R-R間隔大小不宜采用固定閾值。本文采用統(tǒng)計(jì)學(xué)知識(shí),統(tǒng)計(jì)整個(gè)約30 min心電信號(hào)的時(shí)間間隔并繪制箱形圖,所有的上離群點(diǎn)即為R-R間隔過大的位置。根據(jù)箱形圖所反映的結(jié)果,筆者有充分理由懷疑上離群點(diǎn)所對(duì)應(yīng)的R峰與前一個(gè)R峰之間存在漏判R峰。
在找到漏判R 峰可能存在的位置之后則需要檢測是否真的漏判以及如何增補(bǔ)。R 峰是每個(gè)心電節(jié)拍中能量最高、突變最快的特征波形,因此假設(shè)在離群點(diǎn)所對(duì)應(yīng)點(diǎn)的R 峰與其前一個(gè)R 峰之間能量最高的峰為漏判R 峰。之后檢驗(yàn)此R 峰是否為真正R 峰。在這里同樣引用統(tǒng)計(jì)學(xué)知識(shí),真正的R峰其能量值應(yīng)該不小于其相鄰兩個(gè)R峰能量值較小R峰的0.36倍。假如此處R峰能量大于能量較小R峰的0.36倍,則此位置應(yīng)添加一個(gè)R峰;反之則保留原狀態(tài)。漏判R峰的記錄片段如圖5 所示。該片段內(nèi)R-R 間隔的箱型圖如圖6 所示。添加漏判R 峰及判斷添加的R 峰是否為真正的R 峰結(jié)果如圖7 所示。圖7 添加的4 個(gè)R峰經(jīng)過再次判斷后,能量值過低的3 個(gè)最終沒有添加。
圖5 漏判R峰示意圖Fig.5 Schematic diagram of false negative R-peak
圖6 R-R間隔箱形圖Fig.6 Box-plot of R-R interval
圖7 添加R峰示意圖Fig.7 Schematic diagram of R-peak addition
1.3.2 刪除誤判R 峰除了漏判R 峰,另一個(gè)突出問題為誤判R峰,具體表現(xiàn)為誤判位置的R峰與相鄰兩個(gè)R 峰其中的一個(gè)距離過近。R-R 間隔是否過近利用生理不應(yīng)期(即在0.25 s 內(nèi)心臟一定不會(huì)跳動(dòng)兩次)進(jìn)行判斷[20]。當(dāng)出現(xiàn)R-R 間隔小于0.25 s 時(shí),必定有一個(gè)R 峰不是真正R 峰。通常R 峰是節(jié)拍中能量最高的峰,因此能量較小的R峰為誤判R峰。在前文增補(bǔ)漏判R峰的過程中做過能量的判斷,如果一個(gè)R 峰的能量小于相鄰兩個(gè)R 峰中能量較小R 峰的0.36 倍,則此R 峰不是真正的R 峰。即初步定位的R峰中能量較小的R 峰可能是誤判R 峰。利用上述條件,檢測整個(gè)完整的30 min 心電信號(hào)記錄,將能量值過低的R峰刪除。
如圖8 所示為心電記錄123 的片段,上方圖是基于STMHT 算法定位R 峰的結(jié)果,虛線框所圈位置是誤判R峰現(xiàn)象,雖然能量較低的R峰位置確實(shí)是過零點(diǎn),但是其與后邊的R 峰間隔只有118 ms,不滿足生理不應(yīng)期條件,在圖中被刪除。
圖8 刪除誤判R峰示意圖Fig.8 Schematic diagram of deleting misjudged R-peak
1.3.3 反向R 峰修正在心電信號(hào)中會(huì)出現(xiàn)一些負(fù)極性QRS 復(fù)波群,這些位置的R 峰初步定位為正極性能量最大峰。這里引入Q峰、S峰、T峰輔助修正。極性誤判分為R 峰和Q 峰錯(cuò)位以及R 峰和S 峰錯(cuò)位兩種情況。前文已經(jīng)提到通常在每個(gè)心電節(jié)拍中R 峰能量最高,然而在出現(xiàn)負(fù)極性的QRS 復(fù)波群時(shí),能量最高的峰不一定是R 峰。因此利用各峰能量比例關(guān)系進(jìn)行修正。
首先是R峰和Q峰錯(cuò)位,具體表現(xiàn)為初步定位的R 峰能量比Q 峰能量低。然而在負(fù)極性QRS 復(fù)波群中并非Q 峰能量高就可將R 峰漂移至Q 峰。通過將實(shí)驗(yàn)中得到的Q 峰和R 峰與MIT-BIH 心律失常數(shù)據(jù)庫中Q 峰和R 峰標(biāo)準(zhǔn)位置對(duì)比統(tǒng)計(jì)分析,得出結(jié)論為:當(dāng)Q 峰能量大于R峰能量1.85倍時(shí)將R峰漂移至Q 峰,反之則保留原狀態(tài)。其次是R 峰和S 峰錯(cuò)位,其判斷準(zhǔn)則為:在S 峰能量大于R 峰能量的1.19 倍條件下,若R 峰能量是T 峰能量的0.96~1.50 倍,則將R峰漂移至S峰,反之則R峰和S峰保持原狀態(tài);在S峰能量小于R 峰能量的1.19 倍條件下,若Q 峰能量為T峰能量的2.15~29倍,則R 峰漂移至S 峰,反之則保留原狀態(tài)。
如圖9 上方圖所示為心電記錄221 的片段,可以看到出現(xiàn)了3個(gè)負(fù)極性的QRS波群,但是都被定位在了正方向,下方圖即為修正示意圖。
圖9 反向R峰修正示意圖Fig.9 Schematic diagram of reverse R-peak correction
1.3.4 流程框圖基于高斯模型的心電特征提取流程圖如圖10 所示,流程圖參數(shù)及意義如表1 所示。其中Ry、Qy、Sy、Ty分別為R、Q、S、T 峰的峰高(振幅),RQi為第i個(gè)心電節(jié)拍中R 峰與Q 峰振幅的差值,RSi為第i個(gè)心電節(jié)拍中R峰與S峰振幅的差值。
圖11a 是一個(gè)心電節(jié)拍的散點(diǎn)圖以及由散點(diǎn)圖擬合出的心電高斯模型。由于實(shí)驗(yàn)所采用的心電記錄都是連續(xù)的心電記錄,因此建立心電高斯模型應(yīng)分為兩個(gè)步驟:心電節(jié)拍切割和高斯模型擬合。
1.4.1 心電節(jié)拍切割每一組心電記錄都是獨(dú)一無二的,因?yàn)椴杉瘜?duì)象的年齡、工作環(huán)境、身體狀況、采集設(shè)備、采集環(huán)境等都會(huì)影響到最終采集到的心電信號(hào)。以MIT-BIH 心律失常數(shù)據(jù)庫中的心電記錄為例,48 組記錄同樣是采集30 min 的連續(xù)心電記錄,心電節(jié)拍最少的117 記錄僅僅只有1 535 個(gè)節(jié)拍,而心電節(jié)拍最多的215 記錄卻有33 363 個(gè)節(jié)拍。目前使用較為廣泛的方法是針對(duì)心電中基準(zhǔn)點(diǎn)進(jìn)行檢測。首先對(duì)心電信號(hào)進(jìn)行變換或?yàn)V波,突出心電的部分,然后通過基于自適應(yīng)閾值的算法來識(shí)別基準(zhǔn)點(diǎn)[21]。但是由于不同的心電記錄在形態(tài)、能量以及持續(xù)時(shí)間方面的特點(diǎn)都存在很大的差異性,采用相同的檢測方法檢測所有的基準(zhǔn)點(diǎn)具有很大的挑戰(zhàn)性。本文不再利用檢測基準(zhǔn)點(diǎn)分割心電節(jié)拍,利用前文得到的R 峰位置,將所得R 峰間期按2:1 的比例切割[22],切割點(diǎn)即為心電節(jié)拍起止位置。前文未曾引用的P峰即為Q峰前邊1/3間隔位置中能量最高的峰。
1.4.2 建立心電高斯模型將經(jīng)過R 峰自動(dòng)定位的心電信號(hào)進(jìn)行精準(zhǔn)的心電節(jié)拍切割后,利用高斯函數(shù)對(duì)每一個(gè)心電節(jié)拍進(jìn)行曲線擬合,將心電記錄統(tǒng)一為一維多元高斯函數(shù)。下面將介紹高斯擬合算法。
圖10 心音特征提取流程圖Fig.10 Flowchart of ECG feature extraction
表1 流程圖參數(shù)及意義Tab.1 Flowchart parameters and the corresponding meaning
高斯擬合算法原理:
其中,A為峰高,μ為峰的中心,σ為高斯曲線的半高寬度,簡稱峰寬。對(duì)式(1)取對(duì)數(shù):
將函數(shù)系數(shù)分別設(shè)為b1、b2和b3,則:
圖11 心音節(jié)拍的高斯模型示意圖Fig.11 Schematic diagram of the Gaussian model of ECG beat
因此式(2)可以表示為:
高斯函數(shù)擬合表示為:
若y的數(shù)據(jù)長度為n,則式(6)表示為:
計(jì)算可得:
1.4.3 心電特征提取為每個(gè)心電節(jié)拍擬合高斯模型之后,心電信號(hào)特征波形P 波、QRS 波和T 波的位置已經(jīng)確定,此時(shí)可以進(jìn)行精確的特征提取。主要特征包括R-R 間隔、QRS 復(fù)波群寬度、R 峰幅值、P-T 間隔以及Q-R 間隔和Q-S 間隔。根據(jù)心電記錄105 的一個(gè)心電節(jié)拍建立高斯模型如圖12 所示,所提取的特征參數(shù)如表2 所示。圖11b 是P 波、QRS 波和T 波的高斯模型,提取3個(gè)模型的參數(shù)即為心電特征參數(shù)數(shù)據(jù)。
根據(jù)定位的結(jié)果以及國內(nèi)外參考文獻(xiàn),計(jì)算了3個(gè)定量結(jié)果:通過算法定位正確的R峰(TP)、通過算法未定位到的R峰(FN)和通過算法定位錯(cuò)誤的R峰(FP)。評(píng)估R峰自動(dòng)定位算法的性能參數(shù)有靈敏度(Se)、正預(yù)測值(+P)和檢測錯(cuò)誤率(DER),通過下式計(jì)算:
算法的整體性能是通過檢測精度(ACC)來衡量的,檢測精度的定義為:
通過本文提出的方法對(duì)MIT-BIH 心律失常數(shù)據(jù)庫的原始心電圖記錄進(jìn)行R 峰自動(dòng)定位。該方法產(chǎn)生79 個(gè)漏判R 峰和140 個(gè)誤判R 峰,總共定位錯(cuò)誤219 次。但是根據(jù)正常心電記錄和病理心電記錄特點(diǎn)的差異,以及信號(hào)噪聲的不同,心電圖記錄個(gè)體定位準(zhǔn)確率從98.99%到100%不等。
如圖12 所示為心電記錄105 的片段擬合高斯模型結(jié)果圖。從圖中的結(jié)果來看,擬合出的高斯模型和原始記錄近乎完全相同。高斯模型的參數(shù)有峰高、峰位和峰寬,對(duì)應(yīng)到心電信號(hào)中即為振幅、位置和持續(xù)時(shí)間。圖12 中模型部分參數(shù)如表2 所示。對(duì)應(yīng)到心電信號(hào)中分別是每個(gè)節(jié)拍的P 波、T 波和QRS波群的峰高A、峰的中心μ和峰寬σ。
圖12 擬合高斯模型結(jié)果圖Fig.12 Result of fitted Gaussian model
本文采用MIT-BIH心率失常數(shù)據(jù)庫對(duì)本文研究進(jìn)行驗(yàn)證,其中R峰平均檢測精度為99.80%,并確定了以6個(gè)高斯函數(shù)為每個(gè)心電節(jié)拍建立模型,其獲得的模型擬合相似指標(biāo)達(dá)98.90%,從而利用高斯模型的參數(shù)定義并提取每個(gè)心電節(jié)拍特征數(shù)據(jù)。本研究后續(xù)將采用機(jī)器學(xué)習(xí)算法對(duì)心電特征進(jìn)行模式識(shí)別,進(jìn)而為醫(yī)護(hù)人員提供更為直接的心臟病診斷參考信息。
表2 高斯模型參數(shù)Tab.2 Gaussian model parameters