馮冰,李紹滋
(廈門大學(xué) 信息科學(xué)與技術(shù)學(xué)院,福建 廈門 361000)
在傳統(tǒng)中醫(yī)學(xué)中,作為中醫(yī)四診之一的脈診扮演了相當(dāng)重要的角色,傳統(tǒng)中醫(yī)師通過手指感知病人的脈動來獲取脈搏信息,從而對人體器官的健康狀況進(jìn)行判斷。中醫(yī)師之所以能夠做到這點,是因為脈診是對人的整體健康狀況進(jìn)行考察的一種信息獲取方式,在臨床診斷中,脈診扮演了非常重要的角色,兼具研究和現(xiàn)實意義。脈搏信號是一種人體生物信號,其中包含了大量人體生物信息。從中醫(yī)的觀點來看,個體脈搏信息中的內(nèi)容,很多都能直接被解讀為單個個體的生理或者病理的信息[1]。因此,通過脈搏信號,我們可以了解個體身體的狀況和變化。脈搏信息也能夠為我們進(jìn)行疾病的診斷提供一些基礎(chǔ)的信息。
然而長期以來,脈診都依賴于醫(yī)生在病患身上采集信息之后,進(jìn)行主觀地判斷。當(dāng)然,在中醫(yī)的研究上為了便于記憶,醫(yī)師們將這些判斷形象化為一些“脈象”。但是在臨床診斷和教學(xué)中,醫(yī)生與醫(yī)生之間對于脈象的體會不同,會導(dǎo)致他們對病人脈象的區(qū)分標(biāo)注不同,也就是說,因為醫(yī)生的個體差異,比如個人經(jīng)驗的多寡,個人主觀的因素,都會導(dǎo)致脈象判斷的不同[2-3]。因此,這對于脈診的客觀化,以及中醫(yī)的客觀化,都是一個大的制約。
隨著中醫(yī)客觀化工作的推進(jìn),脈診技術(shù)也越來越走向客觀化和儀器化。然而,如何對儀器所檢測和收集到的信息進(jìn)行解讀,卻又回到了原來脈診診斷主觀化的問題上來。因為傳統(tǒng)的機(jī)器學(xué)習(xí)方法,依賴于對大量的脈診數(shù)據(jù)進(jìn)行標(biāo)注,然后再利用標(biāo)注的數(shù)據(jù),從中學(xué)習(xí)到特征,從而構(gòu)建起一個脈診診斷的智能算法。假若標(biāo)注的過程不夠客觀,就難免影響到最后的分類效果。
本文提出的方法,是先對脈搏信號數(shù)據(jù)進(jìn)行預(yù)處理(去基線漂移和歸一化),然后提取特征,最后用FCM聚類算法進(jìn)行聚類,將結(jié)果與粗分類的結(jié)果進(jìn)行對比。本文旨在提出一個無監(jiān)督的客觀化方法。在中醫(yī)專家對數(shù)據(jù)進(jìn)行標(biāo)注之前,先根據(jù)信號的特征,進(jìn)行粗線條的分類,為客觀化提供依據(jù)。如果在更大規(guī)模的數(shù)據(jù)支持下,對特征進(jìn)行進(jìn)一步地優(yōu)化,有理由預(yù)期無監(jiān)督聚類分析可以得到更好的效果。
脈診信號的模式分類研究,在脈診客觀化的過程中,扮演了核心的位置。脈診信號的自動識別以及準(zhǔn)確分類,是完成相關(guān)模式分類工作的預(yù)備條件?,F(xiàn)階段,在提取脈象信號特征的方法上,較常采用的是時域分析法[4],但脈象信號的時域特征存在一些自身的問題,如差異性小,區(qū)分脈象較為困難。所以,大多數(shù)研究人員都通過在時域特征之上結(jié)合頻域特征的方法來獲取脈象的特征頻譜,從而將可顯著區(qū)分的特征從信號的頻域中找出,其中較為常用的方法為功率譜分析與倒譜分析[5]。
此外,為了更好地梳理脈象特征和生理病理兩者間的關(guān)聯(lián),以做到令脈診技術(shù)進(jìn)一步客觀化、智能化,很多學(xué)者也做了大量的研究工作。李娜等[6]對支氣管哮喘與慢性胃炎患者脈圖的比較研究,提取時域分析特征,通過實驗證明了支氣管哮喘與慢性胃炎在“寸”部存在脈圖時域特征差異之間的相關(guān)性。張冬雨等[7]提出了兩類基于ERP彈性測量距離的脈搏信號形態(tài)分類方法,用于脈搏信號的分類。實驗證明,同現(xiàn)有的脈搏信號分類方法相比,他所提出的彈性核函數(shù)——高斯彈性測度距離核函數(shù)。對脈搏信號的分類和復(fù)雜時間序列的分類,都展現(xiàn)出較好的效果。
在神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用到中醫(yī)客觀化的大背景下,用計算機(jī)進(jìn)行脈診特征分析,帶來了進(jìn)一步的效率和準(zhǔn)確性的提升。人工神經(jīng)網(wǎng)絡(luò)是一種自適應(yīng)的非線性動力系統(tǒng),目前有不少學(xué)者利用人工神經(jīng)網(wǎng)絡(luò)對脈搏信號進(jìn)行分類和識別,也取得了不錯的效果。如郭紅霞等[8]提出的基于小波包分析和BP神經(jīng)網(wǎng)絡(luò)的中醫(yī)脈象識別方法,利用小波變換具有揭示信號時頻兩域細(xì)節(jié)和局部特征的能力,提出了將脈象信號的小波包分析和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合以達(dá)到識別中醫(yī)脈象的目的。小波包分解中的第3層從低頻到高頻的8個頻帶的信號能量,被用作脈沖識別的輸入層,脈沖信號通過小波包分析,然后輸入神經(jīng)網(wǎng)絡(luò)。通過該算法,步長函數(shù)和迭代的改進(jìn)不僅縮短了網(wǎng)絡(luò)訓(xùn)練時間,而且還利用小波包分解系數(shù)進(jìn)行重建信號,并在此基礎(chǔ)上獲得更好的結(jié)果。此外,Zhang等[9]也通過小波變換提取時域和頻域信息,進(jìn)行了相似的實驗,通過更細(xì)致地調(diào)校,網(wǎng)絡(luò)的正確識別率有了進(jìn)一步的提升。
然而,在上述方法中,無一不嚴(yán)重依賴于大量中醫(yī)專家對脈搏數(shù)據(jù)的分類和標(biāo)記,然而正如前文所提及,醫(yī)生之間因為個體差異或者主觀因素,會對脈象的判斷有所不同,當(dāng)數(shù)據(jù)量大,且分別來自不同醫(yī)生的標(biāo)注時,難免出現(xiàn)標(biāo)注不準(zhǔn)確的情況。這樣的狀況,對目前的中醫(yī)客觀化,特別是脈診的客觀化,起到了阻礙的作用。如果我們可以提出一種方法,減少人的主觀判斷信號的成分,直接從脈搏信息中進(jìn)行特征提取,然后通過聚類的方法進(jìn)行粗分類,這樣的方法具備一定的理論價值。在當(dāng)下醫(yī)療資源不均衡發(fā)展的現(xiàn)狀中,醫(yī)學(xué)儀器價格逐漸走低,而醫(yī)學(xué)專家數(shù)量卻十分有限,在解決醫(yī)療資源不匹配的問題上,粗分類可以扮演一個先期分診的作用,使得它同時還具有一定實用價值。
文中提出的特征提取和分類的方法,是由3個主要步驟構(gòu)成的:數(shù)據(jù)的預(yù)處理、特征提取過程和聚類過程。在這里,首先選擇一個較好的特征來代言脈搏信號的相關(guān)數(shù)據(jù),然后從訓(xùn)練數(shù)據(jù)中以一種無監(jiān)督的形式,來進(jìn)行聚類。
脈象信號是一種相當(dāng)復(fù)雜的生物醫(yī)學(xué)信號,它的特點包括背景噪聲大以及隨機(jī)性強(qiáng)。脈象,體現(xiàn)了人身中的各類復(fù)雜的生理狀態(tài)周期,它反映了人們在外部環(huán)境以及內(nèi)部生理特征綜合作用下的整體生理變化。因此,脈象信號具有非線性、整體性和可調(diào)性等特點。由于脈象信號受整體環(huán)境影響較大,不可避免的結(jié)果就是采集到的脈搏信號會因呼吸和儀器本身而引起基線漂移。目前,基線漂移的去除方法有很多種,如小波變換法、自適應(yīng)濾波、插值擬合法、滑動平均濾波等[10-12]。其中被最廣泛應(yīng)用的是離散小波變換法,不過離散小波變換法因為具有對平移的高度敏感性以及容易出現(xiàn)頻率混疊等缺點,為實驗增加了一些不確定性因素。為了克服以上缺點,本論文則選取了雙樹復(fù)小波變換法來進(jìn)行基線漂移的去除工作。
雙樹復(fù)小波(dual-tree complex wavelet transform)的概念最早由金斯伯里(Kingsbury)率先提出,該算法在雙樹濾波基礎(chǔ)之上,又進(jìn)行了一層優(yōu)化,使其不單具備了一般復(fù)小波算法的優(yōu)點,還可以完全重構(gòu)原始信號,它屬于對一維雙樹復(fù)小波的一種推廣。
一維雙樹復(fù)小波:
由一維雙樹復(fù)小波推廣,其中雙樹實小波為
雙樹復(fù)小波方法采用了二叉樹結(jié)構(gòu)的兩路變換,一樹生成變換的實部,一樹生成虛部(如圖1所示)。該方法的思路主要是:首先對于第1層進(jìn)行分解,如果兩樹濾波器間的延遲恰好等于一個采樣間隔,那么就可通過區(qū)別b樹種第1層的二抽取令其正好采樣到a樹種因二抽取所丟掉的采樣值。
圖 1 雙樹復(fù)小波二叉樹結(jié)構(gòu)Fig. 1 Double tree complex wavelet binary tree structure
好的數(shù)據(jù)預(yù)處理,對脈搏信號的要求比較高,要求獲取的脈搏信號穩(wěn)定性比較好,并且具有比較好的可重復(fù)性。在單個個體的同一體質(zhì)條件下,脈搏信號能夠保持一定的持續(xù)性和穩(wěn)定性。在這樣的條件下,我們實施以去除基線漂移的處理,使得后續(xù)的信號分析工作成為可能。
原始的脈搏信號是不適合作為分類器的直接輸入信息的,首先因為原始信號在未經(jīng)處理前,維度過高,且有噪聲干擾;其次沒有進(jìn)行歸一化,相似性不易被捕捉到。為了改善后續(xù)的分析和識別,我們先將原始脈搏信號進(jìn)行去噪處理,然后進(jìn)行歸一化過程,再利用一些通用的波形信號特征學(xué)習(xí)的手段,將波形信號轉(zhuǎn)換成時空序列的表示,是數(shù)據(jù)預(yù)處理過程中很重要的一個步驟。在本文的實驗中,首先基于小波變換,用非線性閾值法,從而對脈象信號進(jìn)行一個去噪處理,然后再進(jìn)行一個歸一化的過程:我們將抽樣頻率統(tǒng)一調(diào)整為128 Hz每個心動周期,即將信號進(jìn)行預(yù)處理之后,再進(jìn)一步做一個歸一化處理,其中包括對數(shù)據(jù)進(jìn)行補(bǔ)零,然后將一個心動周期中的脈搏波信號長度進(jìn)行調(diào)整,最后統(tǒng)一為128點。圖2為補(bǔ)零操作完成后的一個心動周期,其中縱軸代表信號強(qiáng)度,橫軸則示意了每個周期內(nèi)采樣點的數(shù)目(在圖中第68個采樣點后補(bǔ)零至第128個采樣點)。
圖 2 脈搏信號歸一化單心動周期Fig. 2 Pulse signal normalized single cardiac cycle
多種時域分析和頻域分析的手段,比如經(jīng)驗?zāi)B(tài)分解方法、傅里葉變換和小波分析都被廣泛地應(yīng)用于脈搏信號的基本分析過程中[13]。尤其是傅里葉分析、小波分析這樣的頻域分析方法,對周期性的信號進(jìn)行數(shù)值分析,將脈搏信號中復(fù)雜的周期性變化進(jìn)行分解,得到不同頻率的頻譜變化,這樣的做法,利用了脈象信號自身的周期性,很好地抓住了脈搏信號中的特點,從而使得后續(xù)的工作可以把從其間得到的頻譜數(shù)據(jù)與人體的生理和病理相關(guān)狀態(tài)關(guān)聯(lián)起來[14-15]。
本文將采用梅爾倒譜系數(shù)這樣更成熟而且高層的特征。在語音處理領(lǐng)域,梅爾倒譜系數(shù)(MFCC)是一個非常常用而且成熟的特征[16]。該特征根據(jù)人耳聽覺的特征要點,用Mel標(biāo)度頻率域提取出來的倒譜參數(shù),進(jìn)行非線性轉(zhuǎn)換,從而做到使得“處理之后的特征”,與“人類的真實聽覺特征”相符。其優(yōu)點在于:當(dāng)用于信噪比較低的狀況時,仍可做到較好的識別性能。MFCC這種特征的優(yōu)良性質(zhì),在于它對于信號的性質(zhì)并沒有過高的要求,對于輸入的信號也沒有太多的預(yù)設(shè)和限定。所以MFCC特征與其他特征相比,具有更好的魯棒性。因此本文選用它來對脈診的輸入信號進(jìn)行特征提取的處理。
倒譜分析可以分為3步過程,首先,將原波形信號經(jīng)過傅里葉變換得到頻譜:
在兩邊取自然對數(shù):
最后在兩邊取逆傅里葉變換得到
式中:x[k]就是倒譜,e[k]與h[k]分別是倒譜的高頻和低頻部分,其中的低頻部分h[k]也就是本文真正關(guān)心的描述性特征。只需將頻譜通過一組Mel濾波器就得到Mel頻譜,在Mel頻譜上面獲得的倒譜系數(shù)h[k]就稱為Mel頻率倒譜系數(shù)。
MFCC特征的特點,是在頻率坐標(biāo)軸上非均勻的濾波。具體來說:在低頻區(qū)有很多濾波器,分布較為密集,而在高頻區(qū)域,濾波器的數(shù)目就變得較少,分布也變得稀疏(如圖3)。這樣的特點,可以把特征的關(guān)注點放在某些特定的頻率,比較符合脈診信號在中醫(yī)診斷中的特點,因此可以較好地抓住相關(guān)信號的本質(zhì)特征。
因為脈象識別本質(zhì)上是一個模式識別問題,而在模式識別問題中,特征的提取是其中的關(guān)鍵一環(huán)。因此,在對原始的脈搏信號特征化過程中,選擇時域信號當(dāng)中最能夠反映脈象的形態(tài)特點的參數(shù),是一個關(guān)鍵點。在這里選取MFCC提取的特征作為輸入向量,是為了更好地進(jìn)行下一步,即脈診信號的聚類工作。
圖 3 MFCC非線性頻譜(橫軸與縱軸分別代表頻率與濾波)Fig. 3 MFCC non-linear spectrum (horizontal for frequency, vertical for filter)
在前述過程中,通過對數(shù)據(jù)進(jìn)行一些基本處理,提取出了信號的高層特征。整個流程(如圖4)的最后一步是聚類過程。在聚類過程中,使用了Fuzzy C-means (FCM)聚類算法,它允許同一數(shù)據(jù)屬于多個不同的類。FCM算法與K-means算法的不同,在于同一個數(shù)據(jù)并不單獨(dú)屬于一個分類,而是可能屬于幾個分類。
圖 4 脈象信號處理流程Fig. 4 Structure model of group organizations
傳統(tǒng)的聚類算法通常需要預(yù)先確定聚類中心的數(shù)量,其缺點是容易降低聚類結(jié)果的客觀性,不僅如此,傳統(tǒng)算法得到的結(jié)果也容易陷入局部最優(yōu)解。而本文采用的模糊C均值(fuzzy c-means,F(xiàn)CM)算法,與傳統(tǒng)的算法相比,在客觀性上進(jìn)行了提升。它首先執(zhí)行優(yōu)化的模糊目標(biāo)函數(shù)計算,以獲得單個采樣點相對于每個類別中心的隸屬度,并以此來進(jìn)一步確定這個采樣點的歸屬。FCM在不少應(yīng)用領(lǐng)域均被采用,比如醫(yī)學(xué)診斷和目標(biāo)識別等[17-18]。
FCM算法的做法,是首先將n個向量xi(i=1,2, · ··,n)分為c個模糊群,并找出每個群的聚類中心,接下來非相似性指標(biāo)的計算價值函數(shù),令這些聚類中心能使價值函數(shù)達(dá)到最小。傳統(tǒng)聚類算法(含K-means算法等),可以被稱作是硬聚類算法HCM(hard clustering method),而FCM算法與HCM這樣的硬聚類算法之間的重要區(qū)別,是在FCM采用了模糊的劃分,從而使得單個給定采樣點均使用[0,1]的隸屬度數(shù)值,來明確其歸屬單個群的狀況。與前面介紹的模糊劃分相同,整體分類中的隸屬度矩陣U也是由取值在[0,1]的元素構(gòu)成的。同時,歸一化的規(guī)則明確了單個數(shù)據(jù)集的所相加得到的隸屬度總和必須等于1。
式中:uij表示了第j個元素屬于第i個類群的隸屬度值。因此,F(xiàn)CM的目標(biāo)函數(shù)就是:
式中:uij的取值在[0,1];ci則表示模糊群第I類的聚類中心,dij=||ci-xj||則計算了第I類聚類中心與第j個采樣點之間的歐式L2距離;此外m∈[1,∞)則是一個指數(shù)加權(quán)。
為了求出FCM目標(biāo)函數(shù)的最小值,可以將其轉(zhuǎn)換成下列函數(shù),以進(jìn)行最小化的求解:
式中:λj,j=,它們是拉格朗日乘子的n個約束條件。接下來,需要對所有的輸入?yún)⒘窟M(jìn)行求導(dǎo),從而令式(9)取得最小值,可以得到:
由上述求得的解不難看出,模糊c均值聚類算法可以被歸結(jié)為一個簡單的迭代過程。
本文所選用的實驗環(huán)境是MATLAB運(yùn)行在2.8 GHz Intel i5 CPU,8 GB內(nèi)存平臺下。本實驗中采用的樣本是69名健康大學(xué)生的脈搏數(shù)據(jù),其中脈搏數(shù)據(jù)的頻率為60~80次/min,而頻率則主要分布在0~40 Hz的區(qū)間范圍內(nèi),原始數(shù)據(jù)的采樣頻率為 512 Hz。通過降頻處理,將原512 Hz頻率的數(shù)據(jù)降低到了128 Hz。在預(yù)處理的過程中,進(jìn)行了歸一化和去均值,然后將一個心動周期中的脈搏波信號長度進(jìn)行調(diào)整,最后通過補(bǔ)零統(tǒng)一調(diào)整為128點。為了將無監(jiān)督聚類的效果進(jìn)行評估,將歸一化之后的信號進(jìn)行粗分類為標(biāo)記的4種基本類型(如圖5),再通過聚類的方法進(jìn)行試驗。
在實驗中,通過對比不同的特征源,分別使用基于線性距離度量特征(LD)、功率譜分析(PSA)、線性預(yù)測編碼(LPC)、線性預(yù)測倒譜系數(shù)(LPCC)獲取的特征,與MFCC倒譜分析獲取的特征進(jìn)行對比;同時使用傳統(tǒng)的硬聚類的方法(k-MEANS、KNN)與模糊C均值的效果進(jìn)行對比。
圖 5 單脈搏信號粗分類基本類型Fig. 5 Structure model of group organizations
另一方面,還比較了隸屬度值對聚類結(jié)果的影響。隸屬度函數(shù)A(x)越接近于1,表示x屬于A的程度越高,A(x)越接近于0,則表示x屬于A的程度越低。使用取值于區(qū)間[0,1]的隸屬函數(shù)A(x)是FCM中最常用的,但是如果我們放寬FCM隸屬度以及其歸一化的條件,令所有的樣本針對各個類的隸屬度的總和值可以大于1,這樣的改變,是否可以獲得較好的結(jié)果呢?
在實驗中,對比了當(dāng)模糊C均值的隸屬度等于1時,和當(dāng)我們放寬條件,允許模糊C均值的隸屬度值大于1時的結(jié)果。實驗的結(jié)果顯示,使用倒譜分析獲取的特征源以及模糊C均值的方法進(jìn)行聚類,對于脈象的識別準(zhǔn)確率相對較高(如表1)。同時我們觀察到,當(dāng)放寬隸屬度的條件,允許模糊C 均值的隸屬度值大于1時,實驗效果會更好一些。
表 1 多聚類方案與特征源實驗效果對比Table 1 Comparison experiment of multi-clustering scheme and feature source %
此外,單獨(dú)考察了效果較好的3類特征提取方案(MFCC、FFT和LPC),觀察它們在相同的聚類方案(FCM,隸屬度>1)情況下,對每個單脈搏信號的準(zhǔn)確分類數(shù)量(圖6)??梢杂^察到,選用MFCC倒譜分析獲取的特征,配合以模糊C均值的聚類方案,在所有的單個脈搏信號粗分類上,都獲得了較佳的效果。
圖 6 3種特征方案對單脈搏信號的準(zhǔn)確分類數(shù)量Fig. 6 Accurate classification of single pulse signals by three feature schemes
在中醫(yī)研究中,脈象是對人體機(jī)能的狀況進(jìn)行分析的重要指標(biāo)之一。一個有經(jīng)驗的中醫(yī),可以通過脈象的模式變換,判斷出病癥的緊迫性、位置和相應(yīng)的性征。脈診的客觀化也是中醫(yī)客觀化研究中的一個重點。本文提出的一種客觀化的方法,首先是通過脈象信號取漂移預(yù)處理,然后進(jìn)行歸一化,再通過頻域信息特征的提取和分析,然后用其作為脈象信號識別過程中的輸入向量,再采用模糊C均值的聚類方法,對脈象的信號進(jìn)行識別。作為一種無監(jiān)督的分析方法,它可以在沒有中醫(yī)專家的參與下,進(jìn)行脈象信號的粗分類的識別。也可以作為有監(jiān)督時特征提取的依據(jù),進(jìn)行進(jìn)一步優(yōu)化研究。
本文旨在提出了一個無監(jiān)督的脈診客觀化方法。在中醫(yī)專家對數(shù)據(jù)進(jìn)行標(biāo)注之前,先根據(jù)信號的特征,進(jìn)行粗線條分類,為客觀化提供依據(jù)。同時,在解決醫(yī)療資源不匹配的問題上,粗分類可以扮演一個先期分診的作用,可以用于人群分類的脈診預(yù)判斷(比如孕婦與非孕婦,心臟病人與心臟健康人群)。在大數(shù)據(jù)的時代背景下,在醫(yī)院擁有更大規(guī)模的數(shù)據(jù)情況后,可以將無監(jiān)督的算法進(jìn)一步細(xì)化,從而為節(jié)省醫(yī)療資源,提高分診效率,做出進(jìn)一步的貢獻(xiàn)。