朱超,劉文彥,王璐,徐禮勝,張書琪,周樹然,張良鈺
東北大學 a.中荷生物醫(yī)學與信息工程學院;b.計算機科學與工程學院,遼寧 沈陽 110169
心血管疾病占非傳染性疾病死亡總數(shù)的46%,是該類型疾病死亡的主要原因[1]。心血管疾病是世界范圍具有普遍性的疾病,死亡人數(shù)仍在攀升,相關的診治與預防關乎全人類的身體健康。而心電(Electrocardiogram,ECG)信號被廣泛應用于心血管疾病的相關研究中,基于心電信號的提取和分析對于疾病的診斷和治療有著極其重要的作用[2]。1901年,荷蘭醫(yī)生與生理學家Einthoven發(fā)表了第一篇介紹記錄高保真人體心電圖的弦線電流計論文,標志著心電圖學的誕生[3]。直到現(xiàn)在,醫(yī)學界仍廣泛使用心電圖作為心臟相關疾病診斷與治療的輔助手段。但對于一些相關的突發(fā)性疾病的病兆捕獲需要采取長時間連續(xù)觀察,動態(tài)心電采集可以實現(xiàn)日常行為下長時間的心電信號采集,克服了常規(guī)靜態(tài)采集在時間與空間上的局限性,并且,對心臟生理的持續(xù)監(jiān)測有利于心血管疾病的早期發(fā)現(xiàn)。美國物理學Holter博士將無線電廣播發(fā)射技術應用于心電圖遙測研究[4],于1957年發(fā)明了動態(tài)心電圖[5]。這種基于動態(tài)心電圖的監(jiān)護系統(tǒng)可以利用隨身攜帶的采集盒持續(xù)監(jiān)測長達24 h甚至更長時間的心電數(shù)據(jù),美國心臟協(xié)會將這種可以長時間記錄動態(tài)心電圖的系統(tǒng)命名為Holter系統(tǒng)[6]。Holter技術的投入使用,不但解決了常規(guī)采集技術的局限問題,還滿足了日益上升的社區(qū)與家庭醫(yī)療需求,動態(tài)心電的研究也逐漸發(fā)展起來。而動態(tài)心電信號質(zhì)量的好壞,直接影響著動態(tài)心電信號的應用及后續(xù)研究的判斷,因此,提高動態(tài)心電信號質(zhì)量評估的可靠性和精確度極為重要。
總結(jié)現(xiàn)有研究,心電質(zhì)量評估技術研究按方法的不同,可以分為基于單一指標的評估、基于多指標的評估以及其他評估方法:
(1)基于單一指標的評估方法。早期的心電質(zhì)量評估技術大多基于單一指標,如通過對心電信號的相鄰QRS波形面積的比較,以累積直方圖的形式實現(xiàn)對心電信號的質(zhì)量評估。隨著后期信號處理的研究與發(fā)展,方法更加多元化,且各有優(yōu)勢,但由于沒有有機地結(jié)合起來,因而單一指標的評估方法逐步被后續(xù)方法取代。
(2)基于多指標的評估方法。該方法基于已有的評估指標或者在此基礎上稍加改進的新指標,對心電信號進行綜合評價。評價方法大致上有單步處理與多步處理兩大類。單步處理指的是一次性、同時對指標進行處理。例如,LI等[7]對12導聯(lián)分別提取現(xiàn)有的6個質(zhì)量指標,再對標準數(shù)據(jù)庫中的數(shù)據(jù)基于機器學習方法將信號按質(zhì)量好壞分類。另外,李橋等[8]依據(jù)時域波形、統(tǒng)計學以及算法匹配,提出多種質(zhì)量評估指數(shù),并按照閾值的方法進行融合,得到用于綜合評估的指標。多步處理則是分步驟對信號質(zhì)量進行評估,各步驟有獨立的評估標準,并且評估結(jié)果會影響到下一步。例如,Chudacek等[9]對多導聯(lián)信號進行基于5種參數(shù)的評估,對每個導聯(lián)信號中的信號段,如果被任何一個參數(shù)評估為差,則被判定為“不可接受”的信號,繼續(xù)下一段信號的評估,否則進行其他參數(shù)的評估。
(3)其他評估方法。其他評估方法則視實際問題而定。其中,具有代表性的是噪聲分類評估方法,這種方法與上述基于多指標的多步評估方法有一定的相似,也是基于分步驟完成。例如Johannesen[10]首先對信號噪聲分類并設定“可遺棄”信號的閾值,對分類按一定的順序進行預處理。在每一步中,先判斷是否為“可遺棄”信號,對剩下的信號進行去噪,接著對下一個分類進行去噪處理,以此類推,最后匯總得到質(zhì)量結(jié)果。
心電質(zhì)量評估技術依據(jù)研究對象的不同,可以分成兩大類:靜態(tài)心電信號質(zhì)量評估與動態(tài)心電信號質(zhì)量評估。其中,動態(tài)心電信號質(zhì)量評估又可以分為實時短時分析與離線長時分析。靜態(tài)心電信號主要含有4種基本噪聲:呼吸或動作引起的基線漂移、設備采集中引入的工頻干擾、肌肉收縮引起的肌電干擾以及因素復雜的隨機噪聲。相關研究已經(jīng)很成熟,并且,在前面對評估技術中不同方法的描述中,大部分都能很好地應用于靜態(tài)心電信號的采集。然而,動態(tài)心電信號中噪聲種類更復雜,例如,運動偽跡的引入對動態(tài)心電信號的研究引入更大的挑戰(zhàn)。盡管PhysioNet通過2011年的Computing in Cardiology挑戰(zhàn)賽,吸收了許多優(yōu)秀的動態(tài)心電質(zhì)量評估方法,但是實驗數(shù)據(jù)與測試數(shù)據(jù)均來自于類似短程心電信息監(jiān)測系統(tǒng),評估質(zhì)量的標準是對一組短時間12導聯(lián)數(shù)據(jù)同時評分,不適用于長時間離線評估。因此,動態(tài)心電信號本身的復雜性以及監(jiān)測過程中可能存在的多種干擾使得特征提取與分析的準確性難以保證,進而影響后續(xù)判斷,使得動態(tài)心電的應用受到局限,動態(tài)信號質(zhì)量的評估技術仍存在需要研究與改進的地方。本文旨在提出一種能將動態(tài)心電信號按質(zhì)量好壞進行區(qū)分的評估方法,以期提高分析的效率和精確度。
采集對象為22~25歲的5名健康男性、5名健康女性,遵循自愿參與原則,采集對象均為在校研究生且都知情。采集過程分為基本動作與特殊動作,基本動作包括靜坐、靜臥、站立、彎腰、行走以及上下樓梯等,特殊動作包括慢跑、騎單車以及打乒乓球等。本文采集時基本動作定為靜坐3 min和行走3 min,特殊動作定為慢跑4 min,每組數(shù)據(jù)長度為10 min,共采集10組數(shù)據(jù)。實驗設計包含了這些動作之間的銜接動作,例如從靜坐到站立過程中的起立動作,從行走到慢跑之間的加速動作,這些動作基本上概括了日常生活中必不可少的行為,盡可能地反映真實情況,為日常行為下動態(tài)心電信號的分析提供必備基礎。
采集設備為ST-1212型號心電工作站(理邦精密儀器股份有限公司,深圳),可以實時顯示心電圖并導出原始的心電信號數(shù)據(jù)做離線分析,見圖1。采樣頻率為500 Hz,采用Mason-Likar導聯(lián)方式采集[11],見圖2。
圖1 動態(tài)心電采集設備圖
圖2 導聯(lián)放置及設備穿戴方式
外層指標一般是檢錯指標,例如,電極片脫落、導聯(lián)線接錯等,導致心電波形失真或者完全消失。對于外層的不可用信號,因為失去了有效信息,一般無法還原,因而直接忽略;可用信號,表示信號質(zhì)量并沒有完全被噪聲或者干擾湮沒,可以對內(nèi)層進行質(zhì)量好與壞的區(qū)分,好的信號可以直接解讀,壞的信號可以通過相關處理獲取有用信息。
本文僅針對電極片脫落進行指標提取。電極脫落對應的心電信號特征可以描述為一階導數(shù)持續(xù)為0的信號段[12],PR段和ST段分別屬于PR間期和QT間期的一部分,并且在正常生理情況下,PR段和ST段是呈等電位(也稱作等位線),PR間期持續(xù)時間在0.12~1.20 s,而QT間期持續(xù)時間在0.30~0.44 s[13]。國內(nèi)研究人員對30例正常人的心電圖進行研究,提出PR間期和ST段的指標分別是(200.6±20.8)和(6.7±22.0)ms[14]。由于正常心電信號中存在的等電位對電極脫落的判斷造成不可避免的干擾,因此,為了能準確檢出故障并避免丟失有用信息,需要設定閾值時間,大于這個時間的信號值一階導數(shù)持續(xù)為0,則判斷為電極脫落發(fā)生。初步設定電極脫落閾值時間為0.22 s。
圖3 電極脫落實驗數(shù)據(jù)
標準心電波形圖中[15],P波反映左右心房的除極化過程,波形的寬度在0.08~0.11 s,幅度不超過0.25 mV。PR間期指的是心房除極開始至心室除極的時間。QRS波群反映左右心室除極化的過程,對正常成人而言,其范圍為0.06~0.10 s。QT間期表示心室肌除極和復極過程所需總時間,其長短與心率密切相關:心率越快,QT間期越短,反之則越長。U波是繼T波后出現(xiàn)的寬而低的波,波幅多在0.05 mV以下,波寬約0.20 s,發(fā)生機制尚不明確。
采集一組手動撕去電極貼片的實驗數(shù)據(jù),繪制實驗結(jié)果,見圖3,圖中波形保持水平的三段是需要被“排查”的電極脫落處,在相應數(shù)據(jù)處標為紅色。
其中,圖3是檢測后部分被檢測數(shù)據(jù)的截取圖。被標記的數(shù)據(jù)表示被檢出的電極脫落發(fā)生處,可以發(fā)現(xiàn)脫落處被完整標記出來。而脫落處兩端處信號有幅值振蕩劇烈甚至達到飽和,這是由于手動撕取以及重新貼回動作中會存在不可避免的延時,由于與實際現(xiàn)象有一定偏差,本文暫不作研究。圖3則是數(shù)據(jù)整體檢測情況,與設想結(jié)果一致,電極片脫落處都較好地被檢出。
為了驗證該方法的可行性,重新采集一組含有電極片脫落數(shù)據(jù),并對該數(shù)據(jù)進行測試。繪制實驗結(jié)果,見圖4。
圖4 增加電極脫落發(fā)生次數(shù)后的檢測結(jié)果
可見,在每一處電極片發(fā)生脫落處都能準確檢測出,則信號s第k點處電極脫落指標為:
其中,電極未發(fā)生脫落,表示可用信號,結(jié)果為1,發(fā)生脫落,表示不可用信號,結(jié)果為0。
從單一指標的合理性、復雜性以及指標間的互補性與一致性關系提出選取原則,從時域分析、頻域兩個角度分析選取指標[16]。
2.2.1 基于時域分析的指標
信號的波動可以拆分為波動的輪廓與波動的細節(jié),波動輪廓可以用基線漂移情況來衡量,而波動細節(jié)則可以用接近一個(或多個)心動周期中波形上下幅值差來獲得相對幅值變化。結(jié)合現(xiàn)有理論與方法,提出基線漂移程度指標與幅值變化程度指標,分別用實際采集的數(shù)據(jù)對波動輪廓和波動細節(jié)進行驗證。
基于小波變換的基線漂移程度指標獲取方法是,運用小波變換法分解動態(tài)心電信號,通過重構得到表征信號基線漂移情況的重構信號,再對重構信號進行加窗處理,從而獲取用于評價基線漂移情況的指標[17-19]。算法如下:
對信號bs進行加窗處理,第i個窗內(nèi)基線漂移指標bSQI:
bs表征信號s基線波動情況,α為靜止狀態(tài)下心電信號基線值標準。選取實驗中有明顯基線漂移成分的3組數(shù)據(jù)為例,加窗長度與窗移長度均為1 s,見圖5。從3組數(shù)據(jù)圖中可以看到,信號沒有明顯基線漂移干擾時,指標值維持在一個穩(wěn)定的水平,若其中出現(xiàn)了孤立點,這些孤立點對應的信號段中都有輕微的基線漂移干擾;在基線漂移劇烈處,指標值大于這個穩(wěn)定水平且出現(xiàn)嚴重偏移。整體來看,基線漂移程度指標能夠很好地表征信號中基線漂移情況,信號段中基線漂移程度越嚴重,則對應的基線漂移指標值越大。
幅值變化程度指標的上包絡與下包絡可以描述為信號波動區(qū)間的上限值與下限值,由上下包絡差求得的指標可以用于衡量信號波形中幅值的相對變化,從波動細節(jié)上來評估信號的質(zhì)量。本文采用加窗后信號段的極大值與極小值來粗略估計包絡差指標,算法如下:對原始信號s行加窗處理,求得窗內(nèi)信號幅值最大值Max(si)與最小值Min(si),對波形幅值的變化區(qū)間進行限定,第i個窗內(nèi)幅值變化指標aSQI為:
圖5 三組實驗數(shù)據(jù)原信號、基線漂移指標值分布與幅值變化程度指標值分布
選取實驗出現(xiàn)幅值波動劇烈的3組數(shù)據(jù)為例,加窗長度與窗移長度均為1 s,結(jié)果見圖5。從3組數(shù)據(jù)圖中可以看到,信號波形中幅值波動不明顯時,指標值保持為一個較低的穩(wěn)定水平,一些孤立點出現(xiàn)在幅值發(fā)生突變的地方;在幅值波動劇烈的信號段,指標值通常高于穩(wěn)定水平。整體來看,幅值變化程度指標能夠很好地表征信號中幅值波動的情況,當幅值的波動范圍增大時,則對應的幅值變化指標隨之增大。
2.2.2 基于頻域分析的指標
功率譜估計是頻域分析方法中具有代表性的方法之一,功率譜反映的是信號的功率P在頻域中隨頻率ω的分布情況,利用頻段的差異區(qū)分心電信號中不同頻率成分。動態(tài)心電信號中噪聲成分復雜,提取不同噪聲的含量作為相關指標的方法難以實現(xiàn),而整個心動周期信號寬度大致為0~(58±19)Hz[20],用整體減去QRS波形所在頻段的成分,可以從頻域角度粗略估計噪聲成分。本文從算法簡易性出發(fā),選取基于快速傅里葉變換的方法進行功率譜估計,計算如下:
對原始信號s行加窗處理,為了避免基線漂移的干擾,選取有效頻段為5~35 Hz,并計算功率譜密度值。將整體成分減去有效頻段成分,得到第i個窗內(nèi)頻率成分指標fSQI(i):
由于數(shù)據(jù)包含的噪聲類型不確定,因而對整體含噪水平進行評估,任意選取一組數(shù)據(jù)為例,為了方便比較,將指標值進行歸一化,見圖6。
圖6 實驗數(shù)據(jù)與頻率成分指標值分布
本文采用分步及多指標融合的方法對動態(tài)心電信號進行融合[21]。指標的融合分兩層進行,外層與內(nèi)層之間,使用乘法合成法,由于電極片脫落指標并未對信號進行加窗處理,暫不考慮對乘法合成法進行加權;內(nèi)層指標采用基于信息熵加權的加法合成法[22-23]。
其中,Max(y)和Min(y)用于設定進行無量綱化后數(shù)值波動的范圍,取+1和-1,得到歸一化后第i個窗內(nèi)的指標nbSQI(i)、naSQI(i)以及nfSQI(i)。
熵權屬于信息量權,由于數(shù)據(jù)量較大且大部分非整數(shù),按某數(shù)據(jù)點在數(shù)據(jù)區(qū)間所對應的概率值計算其概率。例如,數(shù)據(jù)值區(qū)間[a,b]對應的概率為Pa,b,若x∈[a,b],則x的概率為:
N與Na,b分別代表數(shù)據(jù)個數(shù)與落入[a,b]區(qū)間中數(shù)據(jù)的個數(shù)。設第i個指標Ii有n個元素,對指標按照下式求得信息熵為:
Norm()即第(1)步中的歸一化處理結(jié)果,P()表示求概率,1/log(N)用于轉(zhuǎn)換度量單位。
權重系數(shù)除了需要滿足收斂性,還需要體現(xiàn)出在整體中的比重情況。對m個指標,ωi是第i個指標的熵值HIi所對應的權重系數(shù),通??梢圆捎孟率角蟮渺貦啵?/p>
按 照 式 (6)、(7)、(8)求 得nbSQI(i)、naSQI(i)以 及nfSQI(i)對應的熵權值為ωb(i)、ωa(i)以及ωf(i)。
采用加法合成法,得到內(nèi)層融合指標:
由于日常行為下長時間采集的動態(tài)心電信號的研究有限,缺乏金標準,現(xiàn)今的研究主要基于閾值來判定質(zhì)量好壞,本文采用基于區(qū)間估計的方法進行閾值設定。區(qū)間估計是參數(shù)估計的一種,它依據(jù)既定概率值構建包含待估計參數(shù)在內(nèi)的區(qū)間,這個概率值又稱之為置信水平,而區(qū)間則稱之為置信區(qū)間[24]。粗略估計,當樣本數(shù)量變大時,這個區(qū)間會更窄,得到的估計值更接近真值,能有效應用于長時間的信號采集之中,解決了經(jīng)驗閾值因為數(shù)據(jù)量大時會引入更多變動而導致準確性下降的問題。本文假設穩(wěn)定水平即均值μ,那么對待估計參數(shù)μ,初步選取α=0.05求的置信區(qū)間[Tl,Tu]則區(qū)分信號好壞的閾值為Tu,得到內(nèi)層指標:
其中,為了方便區(qū)分結(jié)果,好的質(zhì)量打分為1,壞的質(zhì)量打分為0.6。
對內(nèi)層與外層之間采用乘法合成法,得到基于多指標融合的動態(tài)心電信號質(zhì)量評估指標為[25-26]:
其中k為數(shù)據(jù)點數(shù)。
以一個完整的心動周期波形為鑒別單位,鑒定要點是P、T波以及QRS波群是否完整,并以此為金標準。選用準確度(Accuracy),靈敏度(Sensitivity)進行心電質(zhì)量綜合評估[27]。定義如下:
真陽性(True Positive,TP)指金標準與評估方法一致評定質(zhì)量為好的信號段中心動周期個數(shù)。假陽性(False Positive,F(xiàn)P)指金標準判斷為差但卻被算法評估為好的信號段中心動周期個數(shù)。真陰性(True Negative,TN)指金標準和評估方法均判斷質(zhì)量為差的信號段中心動周期個數(shù)。假陰性(False Negative,F(xiàn)N)指金標準判斷為好但卻被算法評估為差的信號段中心動周期個數(shù)。準確度越高,說明評估方法越接近真實情況;靈敏度越高,說明質(zhì)量好的信號被檢出得越精確。
為了說明本文評估方法的可行性,選取一組數(shù)據(jù),使用本文的評估方法與經(jīng)驗閾值法進行對比驗證,見圖7~8。
通過人工復核作為金標準進行核對,可見在圖中A處,經(jīng)驗閾值法出現(xiàn)了漏檢;在圖中B處,經(jīng)驗閾值法檢出結(jié)果與本文提出的區(qū)間估計法相比較為粗糙,在靠后的信號段中,將較好的信號劃分到了質(zhì)量差的信號中。并且,從方法的可延續(xù)性來講,區(qū)間估計法融合時,只需直接添加合理的指標進行計算即可,而經(jīng)驗閾值法在添加指標時,還需調(diào)整單一指標和融合時的閾值,經(jīng)過對比,得出本文提出的評估方法是可行的,評估結(jié)果更加精確。
圖7 經(jīng)驗閾值法的評估結(jié)果
圖8 區(qū)間估計法的評估結(jié)果
本文仿照標準數(shù)據(jù)庫的金標準確定方法,邀請了6名志愿者對10組數(shù)據(jù)進行評估。其中,3名有一定的心電圖閱讀經(jīng)驗,對另外3名做簡單的讀圖方法指導與說明。每個評估人員對每組數(shù)據(jù)中的信號按心動周期逐一識讀,并且獨立完成評估工作。分別對兩種評估方法求TP、TN、FP與FN值,最后求平均值以降低人為判斷的干擾,對于爭議大的結(jié)果,由共同協(xié)商來確定。分別計算得到兩種質(zhì)量評估方法結(jié)果,為了更清晰地對比,使用SPSS 19.0軟件采用χ2檢驗的方法對兩種評估的結(jié)果進行統(tǒng)計學分析比較,結(jié)果見表1。
表1 區(qū)間估計閾值法與經(jīng)驗閾值法的比較(周期數(shù))
由表中數(shù)據(jù)可得,采用經(jīng)驗閾值法在準確度和靈敏度方面均有所下降。由差值可得,真陽性的變化比較明顯,說明經(jīng)驗閾值法在評估過程中,對質(zhì)量好的信號判斷有誤,會影響到最終的評定結(jié)果,不符合實際應用中的要求。相比之下,采用基于區(qū)間估計的閾值法進行指標融合能很好地適應于數(shù)據(jù)的變化,無需做出人為的調(diào)整即可獲得較好的結(jié)果。在準確度和靈敏度方面,χ2檢驗所計算的P值均小于0.05,說明區(qū)間估計法與經(jīng)驗閾值法結(jié)果具有明顯的差異,基于區(qū)間估計方法的準確性更好,并且在質(zhì)量好的信號檢出方面的能力較為突出??傊?,區(qū)間估計法優(yōu)于經(jīng)驗閾值法,前者更加準確。
本文基于對現(xiàn)實問題的分析,提出了將動態(tài)心電信號按質(zhì)量好壞區(qū)分的區(qū)間估計的評估方法。利用Holter系統(tǒng)采集長時間動態(tài)心電數(shù)據(jù),通過對實際數(shù)據(jù)進行離線分析,從時域波形以及頻域成分兩個角度提取相應的指標,將加法合成法以及乘法合成法運用到指標融合之中,再利用區(qū)間估計原理得到評定信號好壞的閾值,不僅解決了經(jīng)驗閾值的局限性,而且降低了人為因素的影響,能夠準確地獲取質(zhì)量好的信號,實現(xiàn)智能評估。最后,再從準確度和靈敏度兩個方面,比較區(qū)間估計法與經(jīng)驗閾值法,結(jié)果表明區(qū)間估計法(準確度96.24%、靈敏度97.83%)明顯優(yōu)于經(jīng)驗閾值法(準確度92.39%、靈敏度95.16%),評估結(jié)果更加精確。