張書(shū)文 侯 猛 劉澤華 張錦龍
(河南大學(xué)物理與電子學(xué)院 開(kāi)封 475001)
隨著新冠疫情在全球范圍內(nèi)的肆虐,許多患有呼吸問(wèn)題的病人需要不斷監(jiān)測(cè)其呼吸狀態(tài)。當(dāng)病人出現(xiàn)呼吸異常的情況需要及時(shí)向醫(yī)生問(wèn)診。醫(yī)護(hù)人員通過(guò)分析病人的呼吸情況可以找尋和分析病人出現(xiàn)這種呼吸狀況的原因。呼吸聲的診斷一般使用聽(tīng)診器來(lái)獲取聽(tīng)診信息,但是傳統(tǒng)聽(tīng)診器存在著很大的局限性。人耳能夠聽(tīng)取的聲音頻率范圍為20~20000 Hz,而醫(yī)院所用的聽(tīng)診器因?yàn)樵?00 Hz左右會(huì)產(chǎn)生低頻響應(yīng),所以會(huì)導(dǎo)致誤差的產(chǎn)生,使醫(yī)護(hù)人員不能獲取到500~2000 Hz 以外的有效信息[1]。而且診斷結(jié)果的準(zhǔn)確性與醫(yī)護(hù)人員的專業(yè)經(jīng)驗(yàn)與相關(guān)參數(shù)有關(guān)。在初級(jí)診斷治療階段,初級(jí)醫(yī)生識(shí)別聽(tīng)診聲的正確率一般從20%~80%不等。而導(dǎo)致高誤診率的原因有很多,例如漏診、錯(cuò)診和延誤等。
病人的呼吸道出現(xiàn)異常呼吸聲的原因很多,例如氣道痙攣或者水腫、異物阻塞、肺部呼吸道感染等。由于每個(gè)病人的體質(zhì)和呼吸道受損情況不同,其表現(xiàn)出的呼吸聲也會(huì)有所不同。通過(guò)呼吸特征可以分辨病人的肺部情況,為病人的病情做出診斷。常見(jiàn)的肺部聽(tīng)診聲包括:支氣管呼吸聲、濕羅聲、干羅聲、胸膜摩擦聲、哮鳴聲等[2]。
張偉君[3]通過(guò)功率譜方法和線性預(yù)測(cè)方法對(duì)呼吸聲進(jìn)行分類(lèi),其分類(lèi)的準(zhǔn)確性會(huì)隨呼吸聲混合的不同類(lèi)型變化。當(dāng)鼾聲與羅聲混合時(shí),其識(shí)別準(zhǔn)確度僅有25%。崔星星[4]通過(guò)使用支持向量機(jī)(Support vector machine,SVM)和后向傳播(Back propagating,BP)神經(jīng)網(wǎng)絡(luò)對(duì)呼吸聲的分類(lèi)進(jìn)行研究,雖然該方法能取得較為準(zhǔn)確的識(shí)別,但是其計(jì)算識(shí)別過(guò)程較為復(fù)雜,且并未實(shí)現(xiàn)便攜式檢測(cè)系統(tǒng)研制。本文使用聚偏二氟乙烯(Polyvinylidene difluoride,PVDF)薄膜傳感器采集呼吸聲,采集的呼吸聲經(jīng)過(guò)處理之后可以提取Mel 頻率倒譜系數(shù)(Mel frequency cepstral coefficients,MFCC)。提取的特征值可以判斷識(shí)別病人的呼吸狀態(tài),且采集的呼吸聲可以通過(guò)存儲(chǔ)介質(zhì)存儲(chǔ)起來(lái),以便為醫(yī)護(hù)人員分析一段時(shí)間內(nèi)的呼吸狀態(tài)提供參考。
PVDF 傳感器是一種獨(dú)特的柔性動(dòng)態(tài)應(yīng)變傳感器,適合應(yīng)用于人體表面以及人體內(nèi)部聲音信號(hào)的采集[5]。其原理是當(dāng)PVDF傳感器在受到拉伸或者彎曲之后,薄膜上下電極表面會(huì)產(chǎn)生一個(gè)電信號(hào),該信號(hào)與拉伸或者彎曲的形變成比例。圖1 和圖2為MEAS 公司生產(chǎn)的兩種不同制造工藝的PVDF傳感器。
圖1 PVDF 薄膜傳感器類(lèi)型1Fig.1 PVDF sensors Type1
圖2 PVDF 薄膜傳感器類(lèi)型2Fig.2 PVDF sensors Type2
常見(jiàn)的聲音采集拾聲器有電容式、駐極體式、動(dòng)圈式等。但是這些聲頻采集拾聲器對(duì)人體呼吸聲信號(hào)采集都存在一定的局限性,例如采集的聲頻范圍小、功放后聲頻混亂、安裝不適宜等。此外采聲效果接近PVDF 薄膜傳感器的電容式拾聲器因具有造價(jià)昂貴、結(jié)構(gòu)復(fù)雜等特點(diǎn)所以不適合長(zhǎng)時(shí)間反復(fù)采集人體微弱的體聲信號(hào)。電容式駐極體傳感器和PVDF 薄膜傳感器雖然都具有體積小的優(yōu)點(diǎn),但電容式駐極體傳感器不具有柔性,且其在低頻信號(hào)的采集效果并不理想。綜上,PVDF 薄膜傳感器是最適合采集人體呼吸聲的傳感器,它可以避免以上傳統(tǒng)聲頻采集裝置的缺點(diǎn),因此可以應(yīng)用于醫(yī)學(xué)呼吸聲監(jiān)護(hù)。本文所述的PVDF薄膜傳感器檢測(cè)裝置采用的是第一種傳感器。該傳感器采集人體的呼吸聲信號(hào)效果最好,分辨率最高,最適宜與人體皮膚組織接觸[6]。該傳感器采集信號(hào)的下限頻率很低,信號(hào)的頻率范圍為8 Hz~2.2 kHz,其靈敏度為40 V/mm,電子噪聲的典型值為1 mV。
人的說(shuō)話聲可以通過(guò)聲調(diào)以及發(fā)音方式來(lái)區(qū)分,但呼吸聲不能使用這些特點(diǎn)進(jìn)行區(qū)分[7]。在人體呼吸過(guò)程中,氣流經(jīng)過(guò)呼吸道會(huì)與呼吸道的組織以及氣管相互作用產(chǎn)生聲音。病人的呼吸道或者肺部可能有病變(例如分泌物、氣泡等)產(chǎn)生,這導(dǎo)致氣流在流經(jīng)呼吸道時(shí)會(huì)產(chǎn)生異常聲音[8]。這些異常聲音并沒(méi)有聲調(diào)及發(fā)音方式的不同,只是其在產(chǎn)生方式不同。人耳可以區(qū)分出來(lái)這些異常呼吸聲,所以可以將呼吸聲經(jīng)過(guò)類(lèi)似人耳聽(tīng)覺(jué)的Mel濾波器分析之后可以提取聲音特征進(jìn)行區(qū)分。根據(jù)這些特征可以分辨這些異常呼吸聲。
每種聲音的不同可以根據(jù)其聲音的頻譜圖來(lái)區(qū)分,頻譜圖中包含聲音的特征[9]。圖3 中列出了正常呼吸聲和幾種異常氣道聲的頻譜圖。紅線為正常呼吸聲的頻譜圖,其表示健康人呼吸道以及肺部沒(méi)有任何病變的呼吸聲。綠線為支氣管呼吸聲的頻譜圖,其形成原因主要有肺組織實(shí)變、肺內(nèi)大空腔、壓迫性肺不張等原因。藍(lán)線為濕羅聲的頻譜圖,其形成原因是氣流通過(guò)呼吸道分泌物(如滲出液、痰液、血液等)形成的水泡致其破裂產(chǎn)生聲音或氣體流經(jīng)分泌物粘連而陷閉的肺泡和細(xì)支氣管時(shí)致其重新充氣張開(kāi)產(chǎn)生聲音。濕羅聲的細(xì)分種類(lèi)很多,包括粗濕羅聲、中濕羅聲和細(xì)濕羅聲等,藍(lán)線顯示的是其中一種。黃線為干羅聲的頻譜圖,其形成原因是氣體通過(guò)狹窄的支氣管或震動(dòng)了黏液弦而產(chǎn)生的聲音。其細(xì)分種類(lèi)也有多種,其包含哮笛聲、憨聲等,黃線所示僅為其中的一種類(lèi)型。
圖3 4 種不同典型聲音的頻譜圖Fig.3 Spectrograms of four different typical sounds
聲音頻譜包絡(luò)含有共振峰信息。而提取呼吸聲的特征值重點(diǎn)就在于如何提取頻譜包絡(luò)[10]。頻譜圖反映的是整個(gè)聲音信號(hào)的頻譜分布,但是人耳的聽(tīng)覺(jué)感知不是整個(gè)頻譜范圍,而是在某些特定的頻譜范圍。MFCC是最常見(jiàn)的語(yǔ)聲特征。MFCC模擬了人耳的聽(tīng)覺(jué)特性,將原始頻譜經(jīng)過(guò)Mel 頻譜變換之后轉(zhuǎn)化為基于Mel 頻譜的非線性頻譜進(jìn)行分析[11]。這樣做的好處是對(duì)呼吸聲信號(hào)進(jìn)行降維,更容易得到呼吸聲信號(hào)的特征值[12]。
Mel 濾波器將信號(hào)的不同頻率映射到Mel 頻率,以此來(lái)模擬人耳的聽(tīng)覺(jué)系統(tǒng)。式(1)是兩者的變換關(guān)系:
式(1)中,f對(duì)應(yīng)的是輸入聲音信號(hào)的頻率,fMel表示經(jīng)過(guò)Mel 變換的聽(tīng)覺(jué)感知頻率。圖4 為Mel 濾波器組在人耳感知范圍內(nèi)的頻響圖。從圖4 中可以看出濾波器組對(duì)低頻段更加敏感并且其分布更加密集。這一分布情況與人耳的感覺(jué)特性是一致的[13]。
圖4 Mel 濾波器組Fig.4 Filter banks
對(duì)信號(hào)進(jìn)行倒譜分析需要經(jīng)過(guò)如下的過(guò)程:
(1) 人體的呼吸聲在一個(gè)呼吸周期內(nèi)是一種非平穩(wěn)時(shí)變信號(hào)。對(duì)呼吸聲音進(jìn)行預(yù)加重、分幀和加窗處理之后可以將信號(hào)認(rèn)為是一種平穩(wěn)時(shí)不變信號(hào)[14]。這些處理可以提升信號(hào)中的高頻部分,突出高頻的共振峰,同時(shí)也可以減少信號(hào)的頻譜泄露。
(2) 對(duì)經(jīng)過(guò)預(yù)處理之后的信號(hào)進(jìn)行快速傅里葉變換(Fast Fourier transform,FFT)將時(shí)域信號(hào)轉(zhuǎn)化為頻域信號(hào):
式(2)中,x(m)為經(jīng)過(guò)預(yù)處理之后的聲頻離散序列,X(k)為經(jīng)過(guò)FFT變換的頻域信號(hào)。
(3) 對(duì)輸入呼吸聲所在的頻域范圍內(nèi)設(shè)置一系列的濾波器,這些濾波器組成Mel 濾波器組。其濾波器的設(shè)置滿足式(3)中的關(guān)系:
式(3)中,k指的輸入信號(hào)的頻譜分量,m指第M個(gè)濾波器,f(m)指濾波器的中心頻率。這里濾波器組個(gè)數(shù)m設(shè)置為26。
(4) 根據(jù)式(4)計(jì)算每個(gè)濾波器輸出的對(duì)數(shù)能量。然后根據(jù)式(5)做離散余弦變換(Discrete Cosine transform,DCT),進(jìn)而得到具有13 個(gè)維度的Mel倒譜系數(shù)。
式(5)中,M為濾波器的個(gè)數(shù),n為DCT計(jì)算之后的特征個(gè)數(shù)。
經(jīng)過(guò)以上計(jì)算得到的Mel 倒譜系數(shù)可以作為該呼吸聲的特征值。該特征值后續(xù)可以作為動(dòng)態(tài)時(shí)間規(guī)整(Dynamic time warping,DTW)處理的數(shù)據(jù)內(nèi)容。
提取呼吸聲的MFCC 特征值會(huì)得到一個(gè)隨時(shí)間變化特征的序列,但由于不同個(gè)體在呼吸過(guò)程中,其呼吸時(shí)間長(zhǎng)短并不是固定的。為了計(jì)算特征序列的相似性,需要使特征序列保有最大的相似度。因此需要DTW 自動(dòng)扭曲時(shí)間序列,也即對(duì)時(shí)間片段進(jìn)行局部縮放,此時(shí)計(jì)算的兩段序列相似度(序列距離)更為準(zhǔn)確。圖5 顯示的是兩個(gè)序列波形相似但是時(shí)間軸上未對(duì)齊的片段在經(jīng)過(guò)DTW處理之后尋找到相似對(duì)齊點(diǎn),其中虛線指示的為序列對(duì)齊點(diǎn)。
圖5 聲音信號(hào)的DTW 處理Fig.5 DTW processing of sound signal
假設(shè)匹配A(a1,a2,a3,···,ai,···,an)和B(b1,b2,b3,···,bj,···,bm)兩個(gè)序列的相似性,為了對(duì)齊兩個(gè)序列,需要構(gòu)造一個(gè)矩陣網(wǎng)格C,該網(wǎng)格由矩陣元素C(i,j)構(gòu)成,C(i,j) 表示序列aj與bj的歐氏距離,該網(wǎng)格中存在一個(gè)最短路徑使得距離累加值Dist 最小。該累加值也就是兩個(gè)聲音序列的相似值。
經(jīng)過(guò)DTW處理之后的時(shí)間片段可以減少因呼吸速率及發(fā)音震動(dòng)緩急產(chǎn)生的特征值誤差。通過(guò)將不同語(yǔ)聲以及自身的MFCC特征序列進(jìn)行DTW處理可以得到DTW 矩陣(歐幾里得相似距離矩陣)和相似值(距離)。由DTW 矩陣得到的相似值可以表明不同語(yǔ)聲信號(hào)的相似性,所以該矩陣可以作為K 最臨近(K-nearest-neighbor,KNN)劃分樣本空間的依據(jù)。
采集的呼吸聲音進(jìn)行Mel 倒譜系數(shù)的計(jì)算提取之后,需要使用某種方式對(duì)呼吸聲音進(jìn)行分類(lèi)。由于異常呼吸聲音的樣本采集較為困難,不能提取大量數(shù)據(jù)。尤其是針對(duì)于卷積神經(jīng)網(wǎng)絡(luò)這種需要大量數(shù)據(jù)進(jìn)行迭代回歸等方式。所以選擇KNN 算法進(jìn)行呼吸聲音的分類(lèi)。
KNN 算法的核心思想是當(dāng)一個(gè)樣本空間k個(gè)最鄰近的樣本中大多數(shù)屬于某個(gè)類(lèi)別,則樣本也屬于這個(gè)類(lèi)別,并具有該類(lèi)別的特征。KNN 方法主要依據(jù)的是靠周?chē)邢薜泥徑臉颖?,而不是靠判別類(lèi)域的方法來(lái)確定所屬類(lèi)別的,因此對(duì)于類(lèi)域的交叉或者重疊較多的待分樣本集來(lái)說(shuō),KNN方法較其他方法更為適合。
KNN 算法的原理有兩種,一種是蠻力實(shí)現(xiàn)原理,另一種是KD 樹(shù)實(shí)現(xiàn)原理。蠻力實(shí)現(xiàn)原理是計(jì)算預(yù)測(cè)樣本與所有訓(xùn)練集中的樣本距離d。這種方式對(duì)于樣本特征數(shù)過(guò)多時(shí)時(shí)間耗費(fèi)較大,因此只適合樣本較少的簡(jiǎn)單模型中。
第二種KD樹(shù)實(shí)現(xiàn)原理并不是直接對(duì)樣本進(jìn)行測(cè)試與分類(lèi),而是先對(duì)訓(xùn)練集建模,建立的模型就是KD 模型,然后在對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)。圖6 為KD 樹(shù)的計(jì)算流程圖,KD 數(shù)采用的是從樣本的N為特征數(shù)量中取方差最大的第k個(gè)特征值作為根節(jié)點(diǎn),然后根據(jù)此根節(jié)點(diǎn),將數(shù)據(jù)按大于還是小于劃分為左右子樹(shù),最后通過(guò)同樣的辦法遞歸形成KD樹(shù)。
圖6 KD 樹(shù)計(jì)算流程圖Fig.6 KD tree calculation flowchart
傳統(tǒng)聲頻采集裝置對(duì)微弱的體聲信號(hào)采集達(dá)不到要求,其采集效果往往不是很理想。而本文提出的使用PVDF 薄膜傳感器來(lái)采集呼吸聲信號(hào)的檢測(cè)系統(tǒng)采集聲頻信號(hào)分辨率高,可以檢測(cè)到低頻小信號(hào)。
圖7 是該呼吸檢測(cè)系統(tǒng)的實(shí)物圖。該系統(tǒng)采用36 V 供電電壓、3300 mAh 電池容量的鋰電池為整個(gè)系統(tǒng)供電。電源經(jīng)過(guò)直流降壓之后給PVDF薄膜傳感器提供10 V 的工作電壓。此設(shè)計(jì)電路最大可以同時(shí)為4 組聲頻采集電路供電,可以為后續(xù)采集多個(gè)不同部位的體聲信號(hào)進(jìn)行擴(kuò)展。
圖7 檢測(cè)系統(tǒng)實(shí)物圖Fig.7 Picture of detection system
該系統(tǒng)還包括聲頻采集部分和數(shù)據(jù)處理部分。圖8 是該檢測(cè)系統(tǒng)采集和處理結(jié)構(gòu)圖。PVDF薄膜傳感器采集的模擬聲頻信號(hào)經(jīng)過(guò)VS1053b 芯片轉(zhuǎn)化為數(shù)字信號(hào),轉(zhuǎn)化后的數(shù)字信號(hào)經(jīng)過(guò)以STM32ZET6 作為主控和處理的芯片進(jìn)行計(jì)算和存儲(chǔ)。
圖8 檢測(cè)系統(tǒng)采集和處理結(jié)構(gòu)圖Fig.8 Detection system acquisition and processing structure diagram
存儲(chǔ)的聲頻信號(hào)由PC 端的程序進(jìn)行KNN 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練,進(jìn)而得到該分類(lèi)的網(wǎng)絡(luò)模型。
項(xiàng)目組與河南大學(xué)第一附屬醫(yī)院展開(kāi)合作,對(duì)近三個(gè)月呼吸科內(nèi)出現(xiàn)呼吸聲異常的病人與正常呼吸人群進(jìn)行數(shù)據(jù)采集。在測(cè)量過(guò)程中,測(cè)量結(jié)果的準(zhǔn)確性會(huì)受到使用者操作方式、外部噪聲環(huán)境和采集部位等因素的干擾。因此在采集過(guò)程中,需要將病人隔離到一個(gè)安靜的房間內(nèi),然后將檢測(cè)裝置的PVDF 薄膜傳感器用醫(yī)用繃帶固定到被采集人喉嚨部位,啟動(dòng)設(shè)備,進(jìn)行呼吸聲的采集。該過(guò)程中盡量保持采集部位一致,減少因采集部位不同給實(shí)驗(yàn)結(jié)果造成的影響。最終采集的數(shù)據(jù)會(huì)被保存到系統(tǒng)的存儲(chǔ)器中。
使用呼吸聲檢測(cè)裝置總共采集了673個(gè)聲頻數(shù)據(jù),除去聲頻數(shù)據(jù)中存在異常或者呼吸特征不明顯的37 個(gè)呼吸聲,實(shí)際參與分類(lèi)標(biāo)號(hào)的共636 個(gè)。樣本聲頻數(shù)據(jù)包含163 個(gè)正常呼吸聲,162 個(gè)支氣管聲,156個(gè)干羅聲,155個(gè)濕羅聲。這些數(shù)據(jù)需要經(jīng)過(guò)KNN 進(jìn)行訓(xùn)練之后建立模型才能對(duì)呼吸聲進(jìn)行預(yù)測(cè)分類(lèi),因此這些數(shù)據(jù)也需要根據(jù)一定的依據(jù)劃分為訓(xùn)練集和驗(yàn)證集[15]。除此之外,為了驗(yàn)證模型的泛化能力,還需要除了訓(xùn)練集和驗(yàn)證集以外的聲頻數(shù)據(jù)對(duì)模型的分類(lèi)準(zhǔn)確率進(jìn)行測(cè)試。
該檢測(cè)系統(tǒng)中選取了4 種呼吸聲(不同病人所產(chǎn)生的)作為該識(shí)別的種類(lèi)。圖9 顯示了這幾種呼吸聲的MFCC 特征分布圖。MFCC 特征分布圖描述的是在一個(gè)完整的呼吸過(guò)程中特征值隨著時(shí)間變化的倒譜系數(shù)圖。圖9(a)為正常呼吸聲的MFCC圖,圖9(b)為支氣管呼吸聲的MFCC 圖,圖9(c)為濕羅聲的MFCC圖,圖9(d)為干羅聲的MFCC圖。
圖9 呼吸聲音的MFCC 特征圖組Fig.9 MFCC feature maps group for breathing sounds
從4 個(gè)特征圖中可以發(fā)現(xiàn),不同聲音中其MFCC 特征具有很大的差異,其在頻域上體現(xiàn)在不同頻率的包絡(luò)值不同。對(duì)于特征值來(lái)說(shuō),其反應(yīng)呼吸聲的能量在人耳感知域的分布情況。
由于呼吸聲采集較為困難,呼吸聲樣本數(shù)據(jù)較少,為了使KNN 有較高的分類(lèi)準(zhǔn)確率,同時(shí)避免由于在劃分訓(xùn)練集和測(cè)試集產(chǎn)生的片面誤差,需要對(duì)數(shù)據(jù)集進(jìn)行K折交叉驗(yàn)證,通過(guò)嘗試?yán)貌煌挠?xùn)練集和測(cè)試集來(lái)提高系統(tǒng)模型的可靠性。
K折交叉驗(yàn)證的過(guò)程是首先將全部樣本(4 種不同類(lèi)型呼吸聲)按同比例劃分成k個(gè)大小相等的樣本子集;然后依次遍歷這k個(gè)子集,每次把當(dāng)前子集作為驗(yàn)證集,其余所有樣本作為訓(xùn)練集,進(jìn)行模型的訓(xùn)練和評(píng)估;最后把k次評(píng)估指標(biāo)的平均值作為最終的評(píng)估指標(biāo)。在后續(xù)的KNN 分類(lèi)測(cè)試中,K折交叉驗(yàn)證的k值選擇為經(jīng)典值10。為了使采集數(shù)據(jù)更方便的劃分,將采集的聲頻樣本數(shù)據(jù)隨機(jī)剔除12 個(gè),剔除后的聲頻樣本數(shù)據(jù)620 個(gè)。最終樣本聲頻數(shù)據(jù)包含正常呼吸聲160 個(gè),支氣管聲160 個(gè),干羅聲150個(gè),濕羅聲150個(gè)。
KNN 分類(lèi)測(cè)試中選取KNN 的k值為5,選取最近5 個(gè)臨近對(duì)象,并采用KD 樹(shù)作為最近臨近的算法,然后根據(jù)這5 個(gè)臨近對(duì)象標(biāo)記的平均值作為預(yù)測(cè)分類(lèi)的結(jié)果。經(jīng)過(guò)K折交叉驗(yàn)證之后可以得到10組分類(lèi)模型的準(zhǔn)確率(圖10)。該四分類(lèi)模型的平均準(zhǔn)確率為89.84%,且當(dāng)k值為5時(shí),模型的識(shí)別效果最好,其準(zhǔn)確率為93.5%。
圖10 四分類(lèi)10 折交叉驗(yàn)證準(zhǔn)確率圖Fig.10 The 10-fold cross validation accuracy of four categories
為探究KNN 模型識(shí)別準(zhǔn)確率是否會(huì)與分類(lèi)的類(lèi)型數(shù)量有關(guān)系,另取正常呼吸聲和支氣管聲音進(jìn)行對(duì)比實(shí)驗(yàn),對(duì)以上相同的樣本數(shù)據(jù)進(jìn)行同樣的處理,其測(cè)試結(jié)果如圖11所示。
圖11 四分類(lèi)10 折交叉驗(yàn)證準(zhǔn)確率圖Fig.11 The 10-fold cross validation accuracy of two categories
從圖11 測(cè)試結(jié)果可以看出二分類(lèi)模型的平均準(zhǔn)確率為96.56%,當(dāng)K為2 時(shí),模型的識(shí)別效果最好,可以達(dá)到100%。通過(guò)對(duì)比測(cè)試結(jié)果圖10和圖11可以看出,當(dāng)呼吸分類(lèi)種類(lèi)減少時(shí),模型的分類(lèi)準(zhǔn)確率會(huì)大幅度上升,從四分類(lèi)模型平均準(zhǔn)確率89.84%上升到二分類(lèi)模型平均準(zhǔn)確率96.56%。
為了驗(yàn)證由KNN 訓(xùn)練得到的模型是否具有優(yōu)良的泛化能力,使用呼吸聲檢測(cè)裝置采集了50 名包含呼吸聲異常病人(非測(cè)試集和驗(yàn)證集中被采集的人員)的呼吸聲,并由上述所得k為5 的四分類(lèi)模型進(jìn)行呼吸聲分類(lèi)識(shí)別,測(cè)試結(jié)果如表1 所示。從表1 中數(shù)據(jù)可看出,基于K折交叉驗(yàn)證和KNN 識(shí)別模型的準(zhǔn)確率對(duì)該50 人測(cè)試樣本的識(shí)別準(zhǔn)確率為94%,與四分類(lèi)K折交叉驗(yàn)證中模型時(shí)最佳準(zhǔn)確率(k=5) 93.5%基本保持一致,因此該識(shí)別方法表現(xiàn)出了較好的泛化能力,可以作為識(shí)別和分類(lèi)異常呼吸聲的方法。
表1 測(cè)試結(jié)果Table 1 Test results
將基于KNN 識(shí)別方法的準(zhǔn)確率與雙譜法[16]、SVM[4]、小波+LDA[17]、功率譜法及線性預(yù)測(cè)法[3]進(jìn)行呼吸聲識(shí)別的結(jié)果進(jìn)行比較,其結(jié)果如表2 所示。通過(guò)對(duì)比幾種識(shí)別方法的正確率可得,在這幾種方法中,KNN 識(shí)別正確率次于小波+LDA 方法的識(shí)別正確率,但高于其他呼吸聲的識(shí)別方法。小波+LDA 方法雖然準(zhǔn)確率較高,但其時(shí)間復(fù)雜度O(k×n)卻會(huì)隨著其迭代次數(shù)而大幅增加,因此其迭代收斂速度低于KNN的時(shí)間復(fù)雜度O(n)。綜上,雖然KNN 識(shí)別正確率不如小波+LDA 方法,但是其計(jì)算過(guò)程及處理速度卻遠(yuǎn)遠(yuǎn)快于小波+LDA 方法,同時(shí)KNN也能保持較高的識(shí)別率。
表2 不同方法的識(shí)別正確率Table 2 Recognition accuracy of different methods
綜合來(lái)看,通過(guò)該方法檢測(cè)與分類(lèi)的正確率會(huì)隨著種類(lèi)的細(xì)分程度而改變,但其正確率均在85%以上,且比功率譜法及線性預(yù)測(cè)方法識(shí)別分類(lèi)的準(zhǔn)確率高,因此具有較高的可行性和一致性。此外該檢測(cè)設(shè)備具備操作方法簡(jiǎn)單、計(jì)算速度快、攜帶方便等優(yōu)點(diǎn),該方法也可以為其他人體微弱體聲采集和分析提供可以套用的范例。
為了能夠識(shí)別和分類(lèi)人體微弱的呼吸聲信號(hào),本文使用柔性PVDF 薄膜傳感器對(duì)微弱信號(hào)進(jìn)行采集,然后對(duì)采集的呼吸聲信號(hào)進(jìn)行特征提取和識(shí)別分類(lèi)。在呼吸聲識(shí)別和分類(lèi)過(guò)程中使用KNN 算法不但可以達(dá)到較高的準(zhǔn)確率,又可以保持較快的識(shí)別速度。因此該系統(tǒng)可以為實(shí)時(shí)采集和分析人體微弱的體聲信號(hào)提供一種很好的實(shí)例方法。
目前本檢測(cè)系統(tǒng)還處于實(shí)驗(yàn)室研發(fā)階段,投入實(shí)際使用還需大量臨床數(shù)據(jù)和不斷改進(jìn)檢測(cè)裝置。例如,在本系統(tǒng)測(cè)試與采集過(guò)程中,采集聲音的部位是病人喉嚨部位。在后續(xù)測(cè)試和補(bǔ)充階段,該裝置將會(huì)放置于病人的胸部,模擬醫(yī)生聽(tīng)到的聽(tīng)診聲。此外該系統(tǒng)目前采集的聲頻會(huì)受到環(huán)境與使用者的操作等影響,這些影響均會(huì)導(dǎo)致實(shí)際采集信號(hào)與病人呼吸聲存在偏差。為解決以上問(wèn)題,目前已經(jīng)與河南大學(xué)第一附屬醫(yī)院展開(kāi)合作,針對(duì)問(wèn)題提出相關(guān)的解決方案,更好地完善該系統(tǒng),為醫(yī)護(hù)人員以及病人提供醫(yī)療便利。