林 娟, 趙治棟, 孫淑強
基于稀疏編碼的手指心電信號身份識別算法*
林 娟1, 趙治棟2, 孫淑強2
(1.杭州電子科技大學 通信工程學院,浙江 杭州 310018;2.杭州電子科技大學 電子信息學院,浙江 杭州 310018)
研究了心電(ECG)信號在身份識別中的應用,提出了基于過完備字典下稀疏編碼的手指心電身份識別認證算法。在預處理階段,對ECG信號進行預處理消噪,去除心電信號里的噪聲、基線漂移和心率變異的干擾。在特征提取階段,提取單周期心電信號構成特征向量并構建字典模型,用核奇異值分解(KSVD)訓練成冗余字典,然后對每一部分特征向量進行稀疏編碼,實現在該字典上的稀疏表示。在分類識別階段,利用得到的稀疏系數矩陣構建特征模板向量作為特征參數。通過歐氏距離匹配輸出個體身份信息,實現個體身份識別認證。通過兩個手指心電信號數據庫對該算法進行了性能測試,獲得了較高的識別率。
手指心電信號; 稀疏編碼; 稀疏系數矩陣; 歐氏距離
心電信號(ECG)是人類較早研究并應用于醫(yī)學臨床的生物電信號之一,從不同層面上反映了心臟的生理和病理狀態(tài),在臨床心診斷中得到了廣泛應用。近年來越來越多的專家學者把目光投到了用ECG進行身份識別上,它最早由Biel L等人[1]在2001年提出,利用ECG的波形信息(振幅,斜率,特征點之間的時間距離等)作為特征實現了個體的身份識別。隨著半導體、微電子和集成電路技術的發(fā)展,無需導電膠的小體積、低功耗和易集成心電采集芯片已經出現,ECG的采集方式也從多導聯(lián)到單導聯(lián),從胸、四肢到手指等的拓展。
2008年,Chan A D C等人[2]采用兩個Ag/AgCl按鈕電極從50受測者的手指上采集90s的心電信號,檢測出QRS波群,最后通過殘差百分比、相關系數、基于小波的距離測量等完成分類識別,識別率分別為75 %,82 %,95 %;2012年,Louren?o等人[3]利用Ag/AgCl干電極從32個受測者的手指上采集心電信號,濾波后檢測出QRS波群進行分割、時間和幅值歸一化得到標準心電信號,取5個連續(xù)的分割后的心電信號的平均波作為模板,分別通過最近鄰分類器和支持向量機完成識別,識別率為93.75 %和90.63 %;2013年,Silva H P等人[4]在Louren?o等人[3]工作基礎上,首次提出將分割后的心電信號送入異常值去除系統(tǒng)剔除異常心跳,然后通過支持向量機完成識別;2014年,Silva等人[5]將Ag/AgCl干電池和Electrolycra電極分別放置于手掌上和手指上成功采集到心電信號,并將采集到的信號收集于CYBHi數據集中。
本文提出了一種基于冗余字典下稀疏編碼的心電身份識別方法,實驗證明用本文方法得到的身份識別率高達98.333 %。
稀疏編碼是一種模擬哺乳動物視覺系統(tǒng)主視皮層V1區(qū)簡單細胞感受野的人工神經網絡方法,該方法具有空間局部性、方向性和頻域的帶通性,是一種自適應的圖像統(tǒng)方法,目前,稀疏編碼方法在盲源信號分離、語音信號處理、自然圖像去噪及特征提取和模式識別等方面已取得了很好的進展,本文提出了一種基于冗余字典下稀疏編碼的心電身份識別方法,通過對心電信號進行稀疏表示之后得到的稀疏系數對測試者的身份進行分類識別。
本文算法流程圖如圖1所示。
圖1 基于超完備字典下稀疏編碼的手指心電身份識別算法流程圖
對心電信號進行特征提取之前,需要先進行去噪、R點檢測及單周期劃分,得到一系列的單周期手指心電波群,然后對其進行取平均,得到平均單周期的歸一化心電信號,最后對信號進行稀疏編碼得到稀疏系數作為特征值用歐氏距離匹配算法進行分類識別。
1.1 基于單周期信號特征向量K-SVD算法
稀疏的數學定義為:一個信號中僅有的少數采樣點為非零的,而其他采樣點都為零,則這個信號是稀疏的[7]。1993年,Mallat S G和Zhang Z[8]提出了信號在冗余字典上分解的思想。稀疏表示使得信號的很多重要信息只集中在少量原子上,然后用這些少量原子線性表示測試者的心電信號,求出其稀疏系數,這些非零系數對應的原子揭示了信號的特征。
字典是稀疏分解的基礎,其性質直接影響稀疏分解的效果, 2005年Aharon M等人[9]提出了一種K-SVD算法,為稀疏表示設計過完備字典,在K-SVD算法訓練得到的字典基礎上,通過稀疏分解去除圖像中存在的零均值高斯白噪聲。
本文提出用基于單周期信號特征向量的K-SVD字典學習方法,正交匹配跟蹤(orthogonal matching pursuit,OMP)稀疏編碼,這些算法常用于壓縮感知和圖像去噪方面[10],ECG信號在去噪之后,在采樣率為1 000 Hz時,信號以R點為中心進行分割,分別向前向后各取200個點和399個點,這樣可以得到一系列長度為m(m=600)的單周期信號,把這些一系列單周期信號特征向量作為樣本集,初始化冗余字典。整個算法可分為兩步,首先是稀疏編碼(sparse co-ding):固定字典D,通過目標函數(1)采用OMP匹配追蹤算法找到樣本的最佳稀疏矩陣;然后字典更新(dictionary update):按列更新字典,依據是MSE最小的原則,通過奇異值分解(SVD)循序的更新每一列和該列對應的稀疏系數矩陣的值
(1)
本文中稀疏系數模型可以描述為
y=Dα=[d1,…,di,…,dN][α1,…,αi,…αN]T
(2)
式中y∈Rm×1為一測試單周期信號,D為訓練字典,由N個訓練信號的單周期波形組成,di=[di1,…,dik]∈Rm×k為第i訓練個體的所有k段單周期訓練信號,dij為第i個訓練個體的第j段單周期波形,α為待求的稀疏解,αi=[αi1,…,αik]∈R1×k為第i個人的稀疏系數。對于任意一段測試信號yi可近似的由該訓練字典中的原子線性組合而成,即
yi=Dα+ε=d11α11+…+dikαik+,…,+dNkαNk+ε
(3)
理性情況下,通過稀疏算法求得的稀疏解α=[α11,…,αi1,…,αik,…,αNk]T中,只有與第i類個體相對應的稀疏不為零,其他的系數αjk(j≠i)全為零或者接近于零,即測試信號由相對較大的那一部分稀疏值線性表示。
為了減少稀疏編碼的運行時間,可以通過降維技術將訓練字典和測試信號分別進行降維處理,以減少數據中的冗余信息。本文采用主成分分析(principal component analysis,PCA)降維的方法對原始數據進行簡化,訓練數據經過PCA降維處理之后,維數大大降低,減少了手指心電身份識別時間。
任選CYBHi數據庫中的55個測試者進行稀疏分解,訓練時長18 s,通過去噪、單周期提取以及PCA降維后組成特征向量,通過KSVD以及OMP進行稀疏分解之后,分解結果如圖2,圖3所示。
圖2 同一個人不同心跳信號的稀疏系數
圖3 不同人心跳信號的稀疏系數
由圖2和圖3可以看出,心電信號經過OMP稀疏分解之后得到的稀疏系數大部分為零,僅有少數的幾個值接近于1,稀疏效果很好,而且同一個人即使不同心跳信號經過稀疏分解之后得到的稀疏系數也很相近,而不同的人稀疏分解之后得到的稀疏系數值有很大差異,這樣測試信號就可以由訓練字典和非零的稀疏系數值線性表示,從而實現個體的身份識別。
1.2 歐氏距離匹配算法
歐氏距離(Euclidean distance)也稱為歐幾里得度量、歐幾里得距離,它是在m維空間中兩個點之間的真實距離,在二維空間中歐氏距離就是兩點之間的直線段距離。本文由上節(jié)步驟得到稀疏系數矩陣組成的特征向量作為分類器的特征,用歐氏距離為度量函數,當輸入的手指心電信號的特征向量與訓練集中的特征向量的距離越小,說明這兩個樣本最相近。這里歐氏距離的公式為
(4)
式中X為手指心電信號特征向量訓練集中的樣本,Y為待識別人的手指心電信號的特征向量。
識別時,計算出訓練集中的模板Xi與未知模板Xu之間的歐氏距離,當得到最小歐氏距離時,未知樣本Wu被判別為與Wi屬于同一個人的樣本
(5)
對上述提出的基于稀疏編碼的心電身份識別方法,通過MatlabR2007軟件驗證算法的有效性和可靠性,討論測試時間固定為9s的條件下,不同的訓練時間,不同的特征值個數以及不同的參數設置對身份識別的影響。實驗中的數據來自于CheckYourBiosignalHereinitiative(CYBHi)數據庫[5]和SurfaceECGdata[2]數據庫,受測者的人數分別為60,55,一共115人,全部為健康個體。
2.1 不同的訓練時間對身份識別的影響
一般來說,訓練時間過短的話,每個樣本中得到的單周期心電信號個數比較少,不能很準確的表征個體,但是,如果訓練時間過長,就會使得存儲信號空間增大,處理信號時間花費更過的時間,所以需要討論訓練時間對心電識別和識別時間的影響。令測試時間固定為9s,訓練時間分別為9,12,15,18,20s,選取2個數據庫的115個個體進行測試。
從圖4(a)可以看出,隨著訓練時間的增長,識別率呈現增長的姿勢,并最終得到很高的值100 %,在訓練時長為20s時,兩個數據庫的身份識別率都達到100 %。從圖4(b)可以看出,隨著訓練時間的增長個體識別時間也呈上升趨勢。綜合考慮,訓練時間設置為18s比較好。
圖4 不同訓練時長對識別率和總識別時間的影響
2.2 PCA不同特征值對身份識別的影響
由2.1小節(jié)里的圖4可以看出,隨著訓練時間的增加贈的識別時間也在增加,當樣本持續(xù)增加時,識別時間也會加大,為了避免上述情況的發(fā)生,采用PCA對數據樣本進行降維。設定特征值個數分別為10,20,30,40,50,對識別率和個體識別時間的變化進行討論,選取2個數據庫的115個個體進行測試。
由圖5(a)可以看出,一開始隨著特征值的增加識別率增加,但當特征值取到30的時候,識別率達到最大之后便趨于穩(wěn)定,結合看圖5(b),隨著特征值的增加個體識別時間也在增加,當特征值小于30的時候,雖然識別時間相對較短但是識別率沒有達到最理想的狀態(tài),所以綜合考慮,特征值個數取30的時候,識別效果最好。
圖5 不同的特征值個數對識別率和總識別時間的影響
2.3 不同識別算法對身份識別率的影響
基于手指心電的身份識別算法近年來取得了很大發(fā)展,各種識別算法也是層出不窮,對識別算法的要求也隨之增高,身份識別率的大小和識別時間的長短決定著算法的實用性和有效性,本文找了相同數據庫下不同文獻中的算法作對比,如表1所示。
表1 手指心電不同識別方法比較
方法數據庫(大小)識別算法識別率/%文獻[2]SurfaceECGdata(50)MeanECG+小波距離測度89文獻[4]CYBHi(37)MeanECG+SVM90.9文獻[11]CYBHi(56)SurfaceECGdata(50)廣義S變換+ZM96.498本文算法CYBHi(55)SurfaceECGdata(60)超完備字典下OMP+歐氏距離10098.333
本文利用超完備字典下的OMP算法進行心電身份識別,實驗參數設置為:訓練時長18 s,測試時長9 s,單周期信號PCA降維之后特征值個數為30,采用OMP進行稀疏分解,通過歐氏距離匹配算法進行分類識別,該算法在不同數據庫中的識別性能如表2所示。
表2 本文提出的算法在不同數據庫中的識別性能
手指心電信號數據庫受測人數身份識別率/%個體識別時間/sCYBHi551000.601表面ECG數據6098.3330.857
從表2可以看出,本文提出的算法在兩個手指心電信號數據庫中的個體身份識別率都很高,而且高識別率條件下識別時間很短,該算法可以很好地應用到系統(tǒng)及生活當中。
基于手指心電信號的身份識別具有廣闊的應用范圍,與臨床上相比,從手指上采集心電信號降低了其入侵水平,提高了以ECG為基礎的身份識別的實用性和用戶對其的接受能力。本文提出了基于冗余字典下稀疏分解的手指心電個體身份識別算法,通過實驗證明,該方法原理簡單,識別速度快,特別實在PCA降維之后,在調高速率的同時也保證了識別率的穩(wěn)定,更重要的是,在個體數很多的條件下仍能在較短的時間內得到較高的識別率,具有具有實用性和有效性。
[1] Biel L,Pettersson O,Philipson L,et al.ECG analysis:A new approach in human identification[J].IEEE Transactions on Instrumentation and Measurement,2001,50(3):808-812.
[2] Chan A D C,Hamdy M M,Badre A,et al.Wavelet distance mea-sure for person identification using electrocardiograms[J].IEEE Transactions on Instrumentation and Measurement,2008,57(2):248-253.
[3] Lourenco A,Silva H,Fred A.ECG-based biometrics:A real time classification approach[C]∥Proceedings of the 22nd IEEE International Workshop on Machine Learning for Signal Processing,Santander,Spain,2012.
[4] Silva H P D,Fred A,Lourenco A,et al.Finger ECG signal for user authentication:Usability and performance[C]∥2013 IEEE the Sixth International Conference on Biometrics:Theory,Applications and Systems,2013.
[5] Silva H P D,Lourenco A,Fred A,et al.Check your biosignals here:A new dataset for off-the-person ECG biometrics[J].Computer Methods and Programs in Biomedicine,2014,113(2):503-514.
[6] 薛纏明,李麗宏.小波分析在激光測距傳感器中的應用[J].傳感器與微系統(tǒng),2015,34(6):151-152.
[7] Hung S,Jan J C.Machine learning in engineering analysis and design: An integrated fuzzy neural network learning model[J].Computer-Aided Civil and Infrastructure Engineering,1999,14(3):207-219.
[8] Mallat S G,Zhang Z.Matching pursuits with time-frequency dictionaries[J].IEEE Transactions on Signal Processing,1993,41(12):3397-3415.
[9] Aharon M,Elad M.K-SVD and its non-negative variant for dictionary design[C]∥Proceedings of SPIE,The International Society for Optical Engineering,2005:327-339.
[10] 沈小正,王 彪.基于壓縮感知理論的聲矢量陣方位估計方法[J].傳感器與微系統(tǒng),2016,35(7):35-37.
[11] 鄒申申,趙治棟,袁昌成.基于廣義S變換和香農熵的手指心電信號身份識別算法研究[C]∥2015浙江省信號處理學會2015年學術年會論文集,2015.
Algorithm for finger-ECG signal identity recognition based on sparse coding*)
LIN Juan1, ZHAO Zhi-dong2, SUN Shu-qiang2)
(1.School of Communication Engineering,Hangzhou Dianzi University, Hangzhou 310018,China; 2.School of Electronic Information,Hangzhou Dianzi University,Hangzhou 310018,China)
Application of ECG signal in identity recognition is studied and is proposed,sparse coding algorithm based on complete dictionary.In preprocessing stage,denoise noises in ECG like baseline wander and interference of heart rate variability.In feature extraction stage,extract single periodic signal to form feature vectors.Utilize the feature vectors to build the dictionary model and then be trained to be redundant dictionary by KSVD.Then every part of feature vectors is used for sparse coding,implement sparse representation in the dictionary. In classification stage,utilize sparse coefficient matrix to build characteristic template vector and use it as characteristic parameters.Then matched output individual identity information through Euclidean distance realize personal identity authentication.Performance test on the proposed algorithm is carried out through two fingers ECG database named CYBHi and surface ECG data and won high recognition rate.
finger ECG; sparse coding; sparse coefficient matrix; Euclidean distance
10.13873/J.1000—9787(2017)02—0142—04
2016—11—29
國家自然科學基金資助項目(61571173);浙江省自然科學基金資助項目(LY14F010021);浙江省公益性技術應用研究計劃資助項目(2015C31086,2015C31085);浙江智慧城市區(qū)域協(xié)同創(chuàng)新中心資助項目
R 318
A
1000—9787(2017)02—0142—04