孫科學(xué),魏 敏,宋江珉,李子炎,成雨含
(1.南京郵電大學(xué) 電子科學(xué)與工程學(xué)院,江蘇 南京 210023;2.江蘇省射頻集成與微組裝工程實驗室,江蘇 南京 210023;3.南京郵電大學(xué) 信息化建設(shè)與管理辦公室,江蘇 南京 210023)
雙聲道心音能量熵比的提取與識別研究
孫科學(xué)1,2,魏 敏1,宋江珉1,李子炎1,成雨含3
(1.南京郵電大學(xué) 電子科學(xué)與工程學(xué)院,江蘇 南京 210023;2.江蘇省射頻集成與微組裝工程實驗室,江蘇 南京 210023;3.南京郵電大學(xué) 信息化建設(shè)與管理辦公室,江蘇 南京 210023)
研究了雙聲道心音的能量熵比提取與分類識別的基本原理和實現(xiàn)方法。分析了心音信號特性及提取雙聲道心音特征值的可行性和必要性。為了減少特征值的計算量,又能使特征值體現(xiàn)出時域和頻域的不同特點,提出了雙聲道心音能量熵比的概念并詳細地闡述了其計算過程。分別取單聲道心音時域能量熵比和頻域能量熵比,雙聲道心音的能量熵比為兩個單聲道心音能量熵比的均值。將雙聲道的能量熵比作為特征值識別雙聲道心音。然后通過相似距離法針對雙聲道心音能量熵比進行雙聲道心音的分類識別。實驗結(jié)果表明,雙聲道心音能量熵比能全面地反映雙聲道心音的時頻域特點,不僅有利于心音的分類識別,而且降低了特征值的維度,使得計算量減小,提高了識別效率和實用性。
雙聲道心音;能量熵比;相似距離;分類識別
生物特征識別技術(shù)是利用計算機技術(shù)對人的生理特征或行為特征進行檢測并鑒定身份的技術(shù)。選擇合適的生物特征對身份鑒定的結(jié)果有至關(guān)重要的作用。從廣義上講,生物特征可以分為與生俱來的生理特征和后天的行為特征[1]。心音和已有的語音、指紋、視網(wǎng)膜等常見的生物特征一樣,有不易被遺忘、竊取和破解的特點,具有較高的保密性和安全性,近年來國際上也開始采用心音作為一種生物特征來進行身份識別。
心音信號是人體最重要的生理特征之一,它是由心動周期中心肌收縮舒張、瓣膜啟閉以及血液沖擊心室壁和大動脈等引起的機械振動而產(chǎn)生的[2-4]。從物理上看,它反映了心臟和心血管系統(tǒng)機械運動的狀況,包含心臟各部分如心房、心室、大血管、心血管及各個瓣膜功能狀態(tài)的大量的生理信息。這些信息時刻都在變化,對于個體來說都是獨一無二、各不相同的。由此可見,心音信號具有普遍、獨立、唯一的特點。心音在時頻域具備穩(wěn)定性和可采集性,這使得它能夠作為生物特征被識別和研究。這不僅為身份識別提供了新思路,也推動了臨床醫(yī)學(xué)中心音聽診的發(fā)展。
目前已有不少國內(nèi)外學(xué)者針對心音信號的采集、預(yù)處理、特征提取方法以及身份識別方法進行了研究。John C.Wood等對第一心音的時域和頻域的動態(tài)特性進行了深入研究[5];成謝鋒等不僅采用獨立子波函數(shù)算法提取心音特征,對基于數(shù)據(jù)融合的三段式心音身份識別技術(shù)等也進行了研究[6-7],還將心音分析識別系統(tǒng)與LabVIEW平臺和Android平臺相結(jié)合,大大提高了心音在實際生活中的應(yīng)用范圍[8-9]。
但大多數(shù)研究是針對單聲道心音的特征提取進行,只能對采集的一路心音信號進行分析處理,不能全面及時地反映心臟在同一時刻不同部位的情況,有一定局限性。而雙聲道[10]心音可同時在心臟的不同部位采集兩路心音信號,使得采集到的信息更加豐富、全面、完整。所使用的雙聲道心音是通過兩個心音傳感器同時采集兩路心音作為左右聲道得到的。通過對兩路心音同時提取時頻能量熵比,并將兩路心音各自的特征值融合后采用相似距離法進行識別,能提高識別的準(zhǔn)確性和可靠性,對心音身份識別具有積極意義。
針對雙聲道心音的特征提取問題,引入雙聲道心音能量熵為特征值,提出了雙聲道心音的分類識別算法,并通過實驗對該算法進行驗證。
心音的特征參數(shù)可以有效地體現(xiàn)不同個體心音的特點,因此合適的特征參數(shù)在心音特征提取和分類識別研究中具有非常重要的作用。選擇適當(dāng)?shù)奶卣鲄?shù)可以提高心音的識別率。特征參數(shù)選取應(yīng)遵循以下原則:不同個體之間的心音距離要盡可能大,同時同一個人的心音之間的距離應(yīng)盡可能小;要在保證提高識別率的情況下,盡可能減少特征參數(shù)的維數(shù),從而減少特征參數(shù)的計算量,這樣不僅便于實現(xiàn)、方便存儲數(shù)據(jù),也提高了識別效率。
心音信號的特征一般分為時域特征參數(shù)和頻域特征參數(shù)。為了更好地反映出心音信號在時頻域的特征,以將時域和頻域中S1心音和S2心音相融合的雙聲道心音能量熵比作為特征值,對雙聲道心音進行分類識別。
熵具有非線性的特點,被廣泛應(yīng)用于概率論、生命科學(xué)等領(lǐng)域,近年來也被用于心電信號的研究中。Pincus[11]于1991年提出了近似熵(Approximate Entropy,ApEn)理論。近似熵具有運算簡單、抗噪聲等優(yōu)點[12]。已嘗試采用ApEn作為特征值進行提取,但是,近似熵統(tǒng)計量很容易導(dǎo)致結(jié)果不一致。于是采用更為簡單且能充分反映信號能量概率分布均勻程度的能量熵[13]表征心音在時域和頻域的能量分布情況。能量熵的熵值大小反映了信號能量概率分布的均勻程度,心音在時域和頻域的能量分布具有獨立性和隨機性,能量熵能體現(xiàn)出個體心音能量分布的微小差異。第一心音和第二心音的能量熵比為無量綱值,使得數(shù)據(jù)存儲和運算更為簡便。且相對于能量,熵值在某些情況下具有更好的魯棒性。
心音信號的時域波形包含著個體的生物特征,是身份識別的重要依據(jù),存在客觀真實性。但如果直接將采集到的心音信號用于身份識別或是采用智能處理方法自動提取特征值,不僅計算量較大,也使得后期的信號更加復(fù)雜。由于心音信號具有周期性且為時變信號,第一、二心音信號S1和S2的開始與終止特征明顯且在S1和S2期間不會產(chǎn)生突變,而第三、四心音S3和S4的信號較弱。如果以一個固定的且較短的時間窗觀察心音信號,則可以得到一系列近似穩(wěn)定的信號,即心音信號變成時準(zhǔn)穩(wěn)定的,所以可用心音信號子波族去合成模擬一組心音。根據(jù)心音的特性,采用一種心音信號模型[14]來簡化心音信號。
設(shè)原始心音信號為{x(1),x(2),…,x(N)},按照以下步驟計算時域和頻域能量熵。
一個周期的心音信號由第一、第二心音S1、S2和第三、第四心音S3、S4以及心音雜音S5組成,因此一個周期的心音信號可近似表示為:
c4is4(n)+c5is5(n))
(1)
根據(jù)心音的物理特性,心臟收縮產(chǎn)生的第一心音S1和心臟舒張產(chǎn)生的第二心音S2都能通過胸腔傳到體表。實驗結(jié)果表明,S1和S2的能量會隨著心臟收縮和舒張的強度的變化而發(fā)生變化,但二者能量的比值基本保持恒定,這個比值可以作為生物特征進行識別。因此采用S1心音和S2心音的能量比作為信號的參數(shù)特征。第i個周期中的時域第一和第二心音的幅值比即FSR,體現(xiàn)了第一心音和第二心音在時域的能量分布,則時域能量熵比可描述為:
(2)
S1與S2心音的能量比是一個無量綱值,對于每個人來說,其值可看成近似不變的。若心音數(shù)據(jù)庫較小,用FSR作為心音特征是簡單可行的,但較小的心音數(shù)據(jù)庫不滿足廣泛應(yīng)用的要求;而當(dāng)心音數(shù)據(jù)庫較大時,會出現(xiàn)多個個體FSR值近似或相同的情況,降低了識別率。
(3)
考慮到提取和識別特征值的運算速度,決定采用較為簡單快捷的融合算法。由于心音時域和頻域中的特點對識別分類的影響同樣重要,且時域和頻域的能量熵比都為無量綱值,因此采用加權(quán)平均融合的方法將時頻域中的能量熵比進行融合,融合后的單聲道心音能量熵比可表示為:
(4)
圖1 雙聲道心音能量熵比的提取過程
身份識別是在已經(jīng)建立的生物特征數(shù)據(jù)庫中找到與待識別用戶相匹配的用戶,以確定待識別用戶的身份。因此心音身份識別過程也應(yīng)分為兩步:一是通過心音傳感器采集用戶的心音信號數(shù)據(jù),并對原始心音信號進行預(yù)處理,然后提取特征值,將特征值和用戶信息存儲在模板數(shù)據(jù)中,并建立雙聲道心音數(shù)據(jù)庫;二是在心音識別階段,采集待識別用戶的心音并對心音進行處理,將心音特征值與數(shù)據(jù)庫中的模板一一比對,以確認待識別用戶的身份。因此心音識別過程簡單來講就是一個模板匹配的過程,就是讓計算機通過信號分析處理判別被識別用戶的身份,在建立較大心音數(shù)據(jù)庫的前提下,使用機器識別身份或心音聽診較人工而言更加快速準(zhǔn)確。在心音識別領(lǐng)域,不同的特征提取方法對應(yīng)著不同的識別方法。比如基于距離的識別方法和基于神經(jīng)網(wǎng)絡(luò)的識別方法。雖然具體實現(xiàn)時存在差異,但基本的技術(shù)是類似的。
根據(jù)心音分類識別的基本方法,需要將待識別人的心音特征與心音數(shù)據(jù)庫中的特征模板進行匹配,再根據(jù)相關(guān)判別法則,判斷待識別的心音屬于心音數(shù)據(jù)庫中的哪個用戶,以便確認其身份。模式識別方法大致有如下幾種:歐氏距離法、高斯混合模型(GMM)和矢量量化(VQ)法、相似距離法和神經(jīng)網(wǎng)絡(luò)識別法等。采用相似距離法[15]來度量兩個信號譜之間的距離。
設(shè)標(biāo)準(zhǔn)組的心音信號為ci(t),待識別信號為sj(t),則相似距離定義為:
(5)
通過定義相似距離來辨別兩個心音信號。辨別方法如下:ci(t)與sj(t)之間的相似距離dk越小,則ci(t)與sj(t)越相似;當(dāng)dk=0時,ci(t)=sj(t),表示待識別信號與標(biāo)準(zhǔn)信號相同。將待識別的心音信號與數(shù)據(jù)庫中的心音信號一一對應(yīng)進行模式匹配,可找出它們的相似距離。
具體的雙聲道心音分類識別過程如下:首先采集20路單聲道心音(即10組雙聲道心音樣本)建立心音數(shù)據(jù)庫,然后根據(jù)心音信號的周期性,對各組雙聲道心音的兩路心音分別截取5個單周期樣本并計算出5個雙聲道心音能量熵比,取其平均值作為此類心音的中心。最終得到10個雙聲道心音樣本的類中心。測試時,要先計算出待識別的雙聲道心音信號的能量熵比,再求出數(shù)據(jù)庫中各個類中心特征值與待識別特征值之間的相似距離,最后將待識別雙聲道心音歸為對應(yīng)相似距離最小的那一類中。
完成心音的分類識別后,需要對識別方法進行評價。心音身份識別有這兩種形式的評價指標(biāo):身份確認和身份辨識。在一對多的情況下,即從心音數(shù)據(jù)庫中的眾多用戶中確認待識別用戶的對應(yīng)身份,采用識別率來表示以雙聲道心音能量熵比作為特征值進行識別的準(zhǔn)確程度。
正確識別率(Correct Recognition Rate,CRR)[13]可用來評價系統(tǒng)性能優(yōu)劣,如式(6)所示:
(6)
其中,Cn為被正確識別的樣本數(shù)量;Tn為測試樣本總數(shù)量。
在實驗測試中,已知每組待識別用戶的身份,同時也記錄模板匹配的結(jié)果,檢測心音身份識別的結(jié)果是否可靠,并對所有測試結(jié)果的正確性做出統(tǒng)計。
采用的心音數(shù)據(jù)庫來源于實測的10個正常人的20路心音信號,其中每個人采集兩路心音信號,采樣頻率為8 kHz。心音信號的采集過程易受到外界因素的影響,引入了各種噪聲,因此在提取特征值之前需要進行預(yù)處理,主要包括歸一化和低通濾波去噪[16]??紤]到心音的頻率特點,心音信號的頻率約為10~1 000 Hz,主要集中在300~500 Hz之間。其中第一心音S1主要集中在中低頻范圍,且具有持續(xù)時間長、音調(diào)低等特點,其波峰的低頻范圍為10~50 Hz,中頻范圍為50~140 Hz;而第二心音S2在低中高頻范圍內(nèi)都有分布,持續(xù)時間短,頻率高,其波峰的低頻范圍為10~80 Hz,中頻范圍為80~200 Hz,高頻范圍為220~400 Hz。這里主要對中低頻范圍的心音進行預(yù)處理,因此將低通濾波的截止頻率設(shè)定為150 Hz。
特征值提取過程僅以雙聲道中的一路心音為例,其他路心音信號的特征值提取過程依此類推。由圖2可看出,第一心音和第二心音幅度的最大值,通過Matlab讀取最大值即可計算出第一心音和第二心音的幅值比即時域能量熵比。然后使用傅里葉變換,將上述經(jīng)過預(yù)處理后的第一心音和第二心音分別變換到頻域中,其頻譜如圖2(a)、(b)所示。再通過Matlab得到幅頻圖上S1和S2幅度的最大值,即可計算出頻域能量熵比和時頻能量熵比。來源于同一人的另一路心音也采用同樣的方式計算出時頻能量熵比,最后將兩路心音的時頻能量熵比進行融合,得到最終的雙聲道心音特征值。
圖2 第一心音和第二心音的幅頻特性圖
待識別心音也按上述方法提取特征值后,將待識別特征值與數(shù)據(jù)庫中的特征值進行匹配,計算待識別心音特征值與數(shù)據(jù)庫中每個類中心之間的相似距離。測試時,共進行了20次識別實驗,實驗數(shù)據(jù)如表1所示。表1中只選取前5個樣本。實驗結(jié)果表明,在20次實驗中,使用雙聲道心音能量熵比作為特征值進行識別,其中有17次能將待識別雙聲道心音成功匹配給原本被采集心音的用戶,CRR可達85%,基本達到了可實際應(yīng)用的階段。由此可以看出,該方法在保證識別率的情況下,減小了數(shù)據(jù)計算量和復(fù)雜度,提高了識別速度。
表1 實驗數(shù)據(jù)
提出了一種針對雙聲道心音的特征提取和分類識別方法。通過分析心音信號在時頻域的不同特點,提出使用雙聲道心音能量熵比作為雙聲道心音的特征值,并具體闡述了雙聲道心音能量熵比的概念和計算方法。雙聲道心音能量熵比不僅能體現(xiàn)出心音的時頻域特性,有利于心音分類識別,而且降低了特征值的維度,減小了計算量,提高了識別效率和實用性。另外,通過相似距離法對心音進行分類識別,使得計算代價減小,在保證識別率的前提下,大大提高了識別速度。實驗結(jié)果表明,使用雙聲道心音能量熵比作為雙聲道心音特征值具有較高的可靠性和可操作性,為心音身份識別的實際應(yīng)用和心音信號的識別研究開辟了新途徑。
[1] 孫冬梅,裘正定.生物特征識別技術(shù)綜述[J].電子學(xué)報,2001,29(12A):1744-1748.
[2] Monali U M,Aparana R S.Review on heart sound analysis technique[C]//Proceedings of international conference on internet computing and information communications.India:[s.n.],2014:93-101.
[3] Chen D,Durand L G,Lee H C.Time-frequency analysis of the first heart sound.Part1:simulation and analysis[J].Medical and Biological Engineering and Computing,1997,35(4):306-310.
[4] Wood J C,Barry D T.Time-frequency analysis of the first heart sound[J].IEEE Engineering in Medicine & Biology,1995,14(2):144-151.
[5] Wood J C,Buda A J,Barry D T.Time-frequency transforms:a new approach to first heart sound frequency dynamics[J].IEEE Transactions on Biomedical Engineering,1992,39(7):730-740.
[6] 馬 勇,成謝鋒.獨立函數(shù)元:模型、方法和應(yīng)用[J].物理學(xué)報,2014,63(6):357-363.
[7] 成謝鋒,馬 勇,張少白,等.基于數(shù)據(jù)融合的三段式心音身份識別技術(shù)[J].儀器儀表學(xué)報,2010,31(8):1712-1719.
[8] 張會香,成謝鋒.LabVIEW平臺上的心音分析虛擬儀器設(shè)計[J].計算機技術(shù)與發(fā)展,2010,20(11):217-220.
[9] 成謝鋒,劉 偉.基于Android平臺的心音識別系統(tǒng)的研究[J].計算機技術(shù)與發(fā)展,2015,25(2):152-155.
[10] 李俊梅,俞 锫.雙聲道立體聲拾音技術(shù)研究[J].北京廣播學(xué)院學(xué)報:自然版,2001(2):34-40.
[11] Pincus S M.Approximate entropy as a measure of system complexity[J].Proceedings of the National Academy of Sciences of the United States of America,1991,88(6):2297-2301.
[12] 趙海龍,穆志純.基于小波變換和LDA/FKT及SVM的人耳識別[J].儀器儀表學(xué)報,2009,30(11):2273-2278.
[13] 張小薊,張 歆,孫進才.基于IMF能量熵的目標(biāo)特征提取與分類方法[J].計算機工程與應(yīng)用,2008,44(4):68-69.
[14] 成謝鋒,馬 勇,劉 陳,等.心音身份識別技術(shù)的研究[J].中國科學(xué):信息科學(xué),2012,42(2):237-251.
[15] 成謝鋒,傅女婷.心音身份識別綜述[J].上海交通大學(xué)學(xué)報,2014,48(12):1745-1750.
[16] 朱冰蓮,劉 倩.心音信號的自適應(yīng)小波去噪[J].計算機技術(shù)與發(fā)展,2006,16(10):83-84.
ResearchonFeatureExtractionandIdentificationwithSpecificEntropyofDualTrackHeartSound
SUN Ke-xue1,2,WEI Min1,SONG Jiang-min1,LI Zi-yan1,CHENG Yu-han3
(1.School of Electronic Science and Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210023,China;2.Jiangsu Province Engineering Lab of RF Integration & Micropackage,Nanjing 210023,China;3.Office of Informatization and Management,Nanjing University of Posts and Telecommunications,Nanjing 210023,China)
The fundamental principle and implementation method of extracting energy entropy ratio and classification recognition from the dual track heart sound are researched.The feasibility and necessity of characteristics of heart sound and extracting dual track heart sound features have been analyzed.In order to reduce the calculation of eigenvalue and show its characteristics in time and frequency domain,the concept of energy entropy ratio for dual track heart sound is presented and its computational process is discussed in detail.After calculating the energy entropy ratio of the mono heart sounds in time and frequency domain,the dual track heart sound energy entropy ratio is the average of them.Then the method of similarity distance is applied to classify and recognize the dual track heart sound.The experimental results show that the characteristics in time-frequency domain of dual track heart sound can be reflected comprehensively by the energy entropy ratio,which is not only beneficial to the recognition of heart sound,reducing the eigenvalue dimensions,but also make it possible to reduce amount of calculation and improve the recognition efficiency and practicality.
dual track heart sound;energy entropy ratio;similarity distance;classification recognition
TP311.1
A
1673-629X(2017)12-0166-04
10.3969/j.issn.1673-629X.2017.12.036
2016-03-03
2016-06-22 < class="emphasis_bold">網(wǎng)絡(luò)出版時間
時間:2017-08-01
國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃(SZDG2016009);江蘇省高校自然科學(xué)研究面上項目(15KJD510001);南京郵電大學(xué)實驗室工作研究重點課題(2016XSG02)
孫科學(xué)(1981-),男,副教授,研究方向為電子電路設(shè)計、智能信號處理嵌入式系統(tǒng)與通信軟件設(shè)計。
http://kns.cnki.net/kcms/detail/61.1450.TP.20170801.1550.028.html