王旭文
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
?
基于多變量符號轉(zhuǎn)移熵的心電信號研究
王旭文
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
復(fù)雜度理論已成為研究生理電信號的熱點,而符號轉(zhuǎn)移熵是一種反映系統(tǒng)混亂程度的非線性指標(biāo)。文章在原有多變量轉(zhuǎn)移熵的基礎(chǔ)上提出了多變量符號轉(zhuǎn)移熵,對傳統(tǒng)時間序列靜態(tài)劃分方法做出了改進,即將時間序列使用動態(tài)自適應(yīng)分割的方式進行符號化。應(yīng)用該算法對正常人和冠心病患者的心電信號進行分析,在實驗中選取最佳的導(dǎo)聯(lián)對,結(jié)果表明該算法能夠顯著區(qū)分正常人和冠心病患者,對原始心電時間序列疊加上高斯噪聲后依然可靠有效。
生理電信號;多變量符號轉(zhuǎn)移熵;動態(tài)自適應(yīng)分割
人體最重要的生理信號就是電信號,電信號會隨著時間的變化而產(chǎn)生瞬時的變化,這是因為人體的生理狀態(tài)和病理狀態(tài)是不同的。符號轉(zhuǎn)移熵作為一個生理電信號特征,在生理電活動信號的特征提取與分析中發(fā)揮了越來越重要的作用[1]。
從臨床醫(yī)學(xué)方面來說,心電信號是心臟電活動體表的綜合反映,因此,臨床心電圖檢驗對于檢測和診斷心臟疾病有著十分重要的意義,并且對生命信息科學(xué)也有著十分重要的研究價值。
本文首先提出多變量符號轉(zhuǎn)移熵算法,該算法主要用來分析心電信號的多變量符號轉(zhuǎn)移熵值,采用自適應(yīng)動態(tài)化方法劃分時間序列[2]。然后通過正常人與冠心病患者的心電數(shù)據(jù)對比,傳統(tǒng)算法與所提算法對比,以及疊加與不疊加高斯噪聲對比,表明所提算法具有良好性能[3]。
1.1 多變量轉(zhuǎn)移熵
1.2 原始序列符號化
符號動力學(xué)是研究符號動力系統(tǒng)的一種復(fù)雜抽象的數(shù)學(xué)理論。在符號動力學(xué)系統(tǒng)中,系統(tǒng)的狀態(tài)可以表示成有限個抽象符號的無窮序列。
符號時間序列分析方法是指把原始的時間序列轉(zhuǎn)化成由若干個符號組成的時間序列,然后進行分析的一種“粗略”方法[4]。在把原始時間序列符號化的進程中,時間序列會不可避免地失去一部分細節(jié)信息。盡管失去了一部分的細節(jié)信息,原始時間序列的動力學(xué)特征還是保存了下來。在計算中使用符號化后的符號序列來代替原始的時間序列,會極大地提高計算數(shù)值的速度。
對原始時間序列進行符號化分析的過程中,最關(guān)鍵的是采取什么樣的方式來對原始時間序列的值劃分相應(yīng)的符號區(qū)域,然后把原始時間序列轉(zhuǎn)化成符號序列,有些符號動力學(xué)分析方法首先采用靜態(tài)范圍來劃分符號區(qū)域,然后再進行符號的轉(zhuǎn)化。
1.3 改進的多變量符號轉(zhuǎn)移熵
在過去的20年,許多傳統(tǒng)的算法都可以用來估計時間序列的復(fù)雜性,如維度和Lyapunov指數(shù)等。這些算法雖然都能夠正確地估計復(fù)雜性,但是它們通常都需要很長的數(shù)據(jù)集來統(tǒng)計結(jié)果,不便于在臨床上研究和應(yīng)用。
使用動態(tài)自適應(yīng)的方法來劃分原始時間序列能夠更精確地捕捉時間序列中的動力學(xué)特征。動態(tài)自適應(yīng)劃分方法如下:
對于一個N點的時間序列u:u={u(i):1≤i≤N}。對于時間序列u(i),在時間序列中嵌入m維相空間:
X(i)=[u(i),u(i+L),…,u(i+(m-1)L)]
(1)
其中m是嵌入維數(shù),L是時間延遲。當(dāng)時間延遲L選取為1時,m維向量的個數(shù)是N-m+1。對于任意一個m維向量,基本尺度BS是通過m維向量相鄰兩點之間差值的均方根計算的:
(2)
(3)
圖1 序列符號化示意圖
改進的多變量符號轉(zhuǎn)移熵是指原始時間序列使用動態(tài)自適應(yīng)進行劃分,然后對符號化后的序列,利用多變量符號轉(zhuǎn)移熵進行分析[6]。
2.1 實驗數(shù)據(jù)
使用從醫(yī)院臨床診斷中采集得到的正常人與冠心病患者的原始心電信號的時間序列。該庫中記錄了包括12個導(dǎo)聯(lián)信號(Ⅰ,Ⅱ,Ⅲ,aVR,aVL,aVF,V1,V2,V3,V4,V5,V6)的多參數(shù)腦電數(shù)據(jù),該信號的記錄長度均大于1 min,采樣周期為512 Hz。
從正常人的心電數(shù)據(jù)和冠心病患者的心電數(shù)據(jù)中分別隨機選取20個人的心電數(shù)據(jù)。選用的數(shù)據(jù)是分別從正常人心電和冠心病患者心電數(shù)據(jù)中取aVL、aVF、I 3個導(dǎo)聯(lián)信號,即在已知I的條件下,計算aVL→aVF的多變量符號轉(zhuǎn)移熵(由實驗證實,aVL、aVF、I導(dǎo)聯(lián)具有較好的區(qū)分度,故選擇aVL、aVF、I導(dǎo)聯(lián)作為研究對象)。將這兩組數(shù)據(jù)分別記為樣本“正?!奔皹颖尽肮谛摹薄?/p>
2.2 實驗方法
首先讀取各組原始數(shù)據(jù)中有效的心電時間序列,對原始心電數(shù)據(jù)進行符號化處理,然后對符號化后的時間序列計算其多變量符號轉(zhuǎn)移熵值,對計算出來的結(jié)果使用SPSS統(tǒng)計分析軟件進行顯著性查驗來驗證該算法的有效性[7]。
2.3 實驗結(jié)果與分析
從“正?!迸c“冠心”樣本中對每個個體的腦電信號序列每隔一個周期取一個點,取出全部的心電時間序列。對已經(jīng)取出的心電時間序列,取長度為L=160的原始心電時間序列來計算心電數(shù)據(jù)的多變量符號熵。
對每個時間原始序列作符號化處理,計算每組時間序列長度為160的多變量符號轉(zhuǎn)移熵值,并把計算的每個個體中的各個多變量符號轉(zhuǎn)移熵值取平均作為這個個體最終的符號轉(zhuǎn)移熵值。最后對這20個正常人和20個冠心病患者的多變量符號轉(zhuǎn)移熵值進行平均,得到轉(zhuǎn)移熵值。結(jié)果如圖2所示。
圖2 不同導(dǎo)聯(lián)組下多變量符號轉(zhuǎn)移熵值比較
由圖2知正常人和冠心病患者在不同的導(dǎo)聯(lián)組下心電信號的多變量符號轉(zhuǎn)移熵的結(jié)果比較(橫軸坐標(biāo)表示的含義是:1—Ⅲ-> aVR |I, 2—aVL ->aVF|I, 3—V1-> V2|I, 4—V3-> V4|I, 5—V5-> V6|I)。在5組導(dǎo)聯(lián)信號中,計算正常人與冠心病患者心電信號的多變量符號轉(zhuǎn)移熵中導(dǎo)聯(lián)aVL和導(dǎo)聯(lián)aVF在導(dǎo)聯(lián)I條件下多變量符號轉(zhuǎn)移熵值的差值最大,由此可見信號區(qū)分度最好,所以取aVL和aVF以及I導(dǎo)聯(lián)組數(shù)據(jù)作為分析對象。
對正常人與冠心病患者的心電信號的多變量符號轉(zhuǎn)移熵值進行基本研究后,根據(jù)平均值與方差繪制成圖,如圖3所示。
圖3 正常人和冠心病患者多變量符號轉(zhuǎn)移熵比較
使用SPSS統(tǒng)計分析軟件對提出的算法的準確性及有效性進行進一步驗證,將計算結(jié)果進行獨立T檢驗分析[8]。結(jié)果如表1所示。
表1 正常人和冠心病患者改進多變量符號
轉(zhuǎn)移熵顯著性差異
Leven方差相等性檢驗均值相等的t檢驗F顯著性tdfSig.(雙側(cè))平均差假設(shè)方差相等1.6110.2123.163380.0034.5834假設(shè)方差不等3.16336.5600.0034.5834
由表1可知,t=3.163,Sig=0.003<0.05, 這說明正常人與冠心病患者心電信號的多變量符號轉(zhuǎn)移熵的差異性非常顯著,該算法可以有效地區(qū)分正常人與冠心病患者。
對樣本“正?!焙汀肮谛摹钡男碾姅?shù)據(jù)采用傳統(tǒng)符號化計算的多變量符號轉(zhuǎn)移熵和改進的多變量符號轉(zhuǎn)移熵比較,分析對比結(jié)果如圖4所示。
圖4 傳統(tǒng)與改進多變量符號轉(zhuǎn)移熵值比較
圖4表明無論是正常人還是冠心病患者,改進算法的熵值均大于傳統(tǒng)算法的熵值,而且可以有效區(qū)分正常人和冠心病患者,說明改進的多變量符號轉(zhuǎn)移熵在心電信號上優(yōu)于傳統(tǒng)的多變量符號轉(zhuǎn)移熵。
對原始的心電時間序列疊加上高斯白噪聲后[9],使用改進多變量符號轉(zhuǎn)移熵算法計算正常人及冠心病患者心電信號的多變量符號轉(zhuǎn)移熵值,與未疊加高斯噪聲的多變量符號轉(zhuǎn)移熵值對比,結(jié)果如圖5所示。
圖5 改進多變量符號轉(zhuǎn)移熵算法健壯性分析
由圖5可知,疊加上高斯白噪聲后正常人及冠心病患者的多變量符號轉(zhuǎn)移熵值并沒有太大的變化,這說明改進的多變量符號轉(zhuǎn)移熵算法穩(wěn)健性高。
本文提出的多變量符號轉(zhuǎn)移熵算法,目的是為了計算電信號原始時間序列的多變量符號轉(zhuǎn)移熵值,來區(qū)分正常人及患者。應(yīng)用多變量符號轉(zhuǎn)移熵在心電信號上,能實現(xiàn)預(yù)想的效果,對心電信號的研究及臨床輔助診斷都有很大的幫助。
但是,該算法還有很多的不足和改進空間。一方面,多變量符號轉(zhuǎn)移熵可以應(yīng)用在更廣泛的生理信號領(lǐng)域,比如腦電信號;另一方面,理論研究還需要與實際臨床醫(yī)學(xué)疾病的診斷和醫(yī)治進行更為密切的結(jié)合,進一步提高算法和研究的實際應(yīng)用價值及可操作性。
[1] 王俊. ECG 信號的非線性特性研究[D].南京:南京大學(xué), 2005.
[2] WESSEL N, ZIEHMANN C, KURTHS J, et al. Short-term forecasting of life-threatening cardiac arrhythmias based on symbolic dynamics and finite-time growth rates[J]. Physical Review E Statistical Physics Plasmas Fluids & Related Interdisciplinary Topics, 2000, 61(1):733-741.
[3] 宋愛玲, 黃曉林, 司峻峰,等. 符號動力學(xué)在心率變異性分析中的參數(shù)選擇[J]. 物理學(xué)報,2011,60(2):120-127.
[4] 曹雪虹,張宗橙.信息論與編碼[M].北京:清華大學(xué)出版社,2004.
[5] 井曉茹.基于符號轉(zhuǎn)移熵和平均能量耗散的睡眠分期分析[D].南京:南京郵電大學(xué),2012.
[6] FERNANDO L D S.EEG and MEG:relevance to neuroscience[J]. Neuron, 2013, 80(5):1112-1128.
[7] FEIGE B, VODERHOLZER U, RIEMANN D, et al. Independent sleep EEG slow-wave and spindle band dynamics associated with 4 weeks of continuous application of short-half-life hypnotics in healthy subjects[J]. Scandinavian Journal of Public Health, 1999, 110(11):1965-1974.
[8] 陳志云, 袁華萍, 李敬紅,等. 動態(tài)心電圖學(xué)在現(xiàn)代診療中的進展[J]. 中國醫(yī)學(xué)文摘:內(nèi)科學(xué), 2004(1):100-101.
[9] 陳天華, 韓力群, 鄭彧. 心電信號噪聲的數(shù)字濾波研究[J]. 微計算機信息, 2008,24(18):252-254.
王旭文(1992 -),女,碩士,主要研究方向:通信與信號處理。
Research on physiological signals based on multivariable symbols transition entropy
Wang Xuwen
(College of Communication & Information Engineering, Nanjing University of Posts & Telecommunications, Nanjing 210003, China)
Using complexity theory to study the physiological signals has become a hot spot.The symbolic transfer entropy is a nonlinear system indicator to reflect the degree of chaos, which can be used as a characteristic of physiological signals.The paper adopts multivariable symbols transition entropy based on the multivariable transfer entropy,to improve traditional time series static partition method using dynamic adaptive segmentation.Using this algorithm to analysis the ECG of people both normal and coronary heart disease patients. In the experiment by selecting the best lead pair to determine the improved algorithm can significantly distinguish between normal subjects and patients with coronary heart disease.And the original sequence is superimposed on the gauss noise result that the algorithm is still reliable and effective.
physiological signals ; multivariable symbols transition entropy;dynamic adaptive segmentation
TN911.23
A
10.19358/j.issn.1674- 7720.2016.23.017
王旭文. 基于多變量符號轉(zhuǎn)移熵的心電信號研究[J].微型機與應(yīng)用,2016,35(23):59-61,68.
2016-08-04)