閆成起,趙利華,陳夢(mèng)婕,周 軍
(1.上海交通大學(xué) 電子信息與電氣工程學(xué)院 電子系,上海 200240;2.上海交通大學(xué)醫(yī)學(xué)院附屬兒童醫(yī)院,上海 200062)
肌電(Electromyography,EMG)信號(hào)的周期起始點(diǎn)檢測(cè)是指從采集的肌電信號(hào)序列中判斷出每一步的起始時(shí)刻,它是肌電信號(hào)應(yīng)用于智能假肢控制、康復(fù)訓(xùn)練和診斷評(píng)估的重要條件。人們?cè)谛凶邥r(shí),雙腿交替邁動(dòng)表現(xiàn)出明顯的周期性,因此借助人體步行運(yùn)動(dòng)的生理學(xué)特點(diǎn),研究人員采用加速度傳感器、壓力板以及三維步態(tài)采集系統(tǒng)判斷周期的起始位置[1-3],利采用左腿脛骨前肌(Left leg Tibialis Anterior,LTA)的表面肌電信號(hào)(Surface Electromyography,SEMG)分析周期起始位置。從單條腿獲取的SEMG信號(hào)來(lái)看,LTA 從上一次活動(dòng)開始到再一次活動(dòng)持續(xù)的時(shí)間定義為一個(gè)跨步周期,每個(gè)跨步周期可看作是一個(gè)步態(tài)活動(dòng)段[4-5]。步態(tài)活動(dòng)段是神經(jīng)系統(tǒng)、骨關(guān)節(jié)系統(tǒng)和相關(guān)肌肉協(xié)同調(diào)節(jié)的結(jié)果。因此,研究步態(tài)活動(dòng)段對(duì)腦癱病情診斷和髖關(guān)節(jié)脫位患者在術(shù)后康復(fù)訓(xùn)練中具有重要的指導(dǎo)意義和評(píng)估價(jià)值[6-7]。
由于采集方法、系統(tǒng)以及實(shí)驗(yàn)環(huán)境的差異,SEMG 信號(hào)的周期起始點(diǎn)檢測(cè)方法的評(píng)價(jià)指標(biāo)并不統(tǒng)一,文獻(xiàn)[8]提出的基于奇異譜的變化點(diǎn)分析方法取得了較好的效果,但是當(dāng)信號(hào)受到噪聲干擾時(shí),該方法檢測(cè)誤差較大。近年來(lái),隨著非線性方法的研究,一些能夠描述肌電非線性特征的周期起始點(diǎn)檢測(cè)算法應(yīng)運(yùn)而生[9-11]。最常用的有綜合輪廓算法[12](Integrated Profile,IP)、基于樣本熵(Sample-Entropy,SampEN)的活動(dòng)段檢測(cè)算法[13-14]和基于非線性能量算子(Smoothed Nonlinear Energy Operator,SNEO)的峰值檢測(cè)算法[15-16]。IP 算法的起始點(diǎn)檢測(cè)使用極值算法,在輪廓特征不規(guī)律的條件下該算法效果不佳。SampEN 算法和SNEO 算法的起始點(diǎn)檢測(cè)效果依賴閾值的選取,而肌電信號(hào)的非平穩(wěn)性會(huì)影響閾值的選取,使得檢測(cè)效果不夠穩(wěn)定。
本文提出一種基于統(tǒng)計(jì)聚類算法的步態(tài)周期起始點(diǎn)檢測(cè)方法。使用BP-AR-HMM(Beta Process Autogressive Hidden Markov Model)[17-19]挖掘步態(tài)過程的狀態(tài)序列,通過多個(gè)SEMG 信號(hào)的差異性標(biāo)注對(duì)應(yīng)肌肉在步態(tài)中的狀態(tài),使用k均值聚類算法[20]識(shí)別肌肉活動(dòng)段,并且結(jié)合滑動(dòng)窗投票(Smooth)方法實(shí)現(xiàn)周期起始位置的標(biāo)注,定量分析算法預(yù)測(cè)的準(zhǔn)確性。
步態(tài)周期起始位置檢測(cè)算法流程如圖1 所示。首先對(duì)SEMG 信號(hào)進(jìn)行降噪及標(biāo)準(zhǔn)化處理,減少噪聲對(duì)模型性能的影響,然后將多個(gè)SEMG 信號(hào)序列共同作為BP-AR-HMM 模型的輸入,標(biāo)注出SEMG信號(hào)對(duì)應(yīng)的LTA 肌肉在正常行走中的狀態(tài)變化過程,模型輸出為肌肉的狀態(tài)序列和對(duì)應(yīng)狀態(tài)的方差參數(shù),但是模型輸出的肌肉狀態(tài)較多而且很多持續(xù)時(shí)間太短,不利于分析和周期起始位置的確定,而在步態(tài)中肌肉對(duì)應(yīng)的狀態(tài)是緩慢變化的,代表相鄰狀態(tài)方差比較接近,因此利用k-means 方法聚類狀態(tài)對(duì)應(yīng)的方差參數(shù),使肌肉狀態(tài)分為活躍狀態(tài)和不活躍狀態(tài),將肌肉活躍狀態(tài)的起始位置作為步態(tài)周期的初始值。SEMG 信號(hào)是一類非平穩(wěn)信號(hào),會(huì)存在很短的肌肉活動(dòng)狀態(tài),進(jìn)而影響模型對(duì)起始位置的檢測(cè)效果,所以通過滑動(dòng)窗方法平滑這些狀態(tài)來(lái)提高模型性能。
圖1 基于聚類方法的步態(tài)周期起始點(diǎn)檢測(cè)算法流程Fig.1 Procdure of gait cycle starting point detection algorithm based on clustering method
BP-AR-HMM 模型旨在發(fā)現(xiàn)不同序列之間的共享模式,本文應(yīng)用該方法得到步態(tài)中SEMG 信號(hào)對(duì)應(yīng)肌肉的變化規(guī)律。概率圖模型結(jié)構(gòu)如圖2 所示。
圖2 BP-AR-HMM 模型結(jié)構(gòu)Fig.2 Structure of BP-AR-HMM model
模型主要包含Beta-Bernoulli 過程和AR-HMM模型兩部分:
1)AR-HMM 模型:因?yàn)椴綉B(tài)數(shù)據(jù)是一維時(shí)間序列而且可以很直觀地分解成一系列動(dòng)作,一般采用HMM模型描述肌肉隱狀態(tài)和步態(tài)數(shù)據(jù)之間的關(guān)系。然而,HMM 模型假設(shè)在給定隱狀態(tài)條件下,步態(tài)數(shù)據(jù)之間是相互獨(dú)立的,這種假設(shè)不符合步態(tài)數(shù)據(jù)產(chǎn)生的真實(shí)過程,為了能更好地建模步態(tài)變化過程,本文加入了r階AR 模型,使觀測(cè)數(shù)據(jù)同時(shí)受隱狀態(tài)和前r時(shí)刻觀測(cè)數(shù)據(jù)的影響,整個(gè)過程如式(1)~式(3)所示:
其中,et(zt)~N(0,Σzt),Ak是滯后矩陣,F(xiàn)(·)是指數(shù)分布,πk是轉(zhuǎn)移分布,θk={Ak,Σk}是狀態(tài)k的發(fā)射參數(shù)。
2)Beta-Bernoulli 過程:Beta 過程用來(lái)發(fā)現(xiàn)步態(tài)序列中可能模式的集合,Beta 過程的隨機(jī)測(cè)度定義為,其中wk為模式θk的發(fā)生概率。Bernoulli 過程描述時(shí)間序列i和狀態(tài)k的關(guān)系yi=,fik表示序列i是否包含狀態(tài)k,它依賴于Beta過程的wk參數(shù),即:
在步態(tài)序列中,假設(shè)肌肉在活躍狀態(tài)下SEMG信號(hào)的能量不會(huì)發(fā)生突變。BP-AR-HMM 模型參數(shù)Σ為狀態(tài)方差集合,通過觀察狀態(tài)方差在步態(tài)數(shù)據(jù)中的變化,發(fā)現(xiàn)當(dāng)肌肉活動(dòng)時(shí)對(duì)應(yīng)狀態(tài)集合中的各狀態(tài)方差相距較近。為了能夠更好地識(shí)別肌肉活動(dòng)段,本文使用k-means 算法聚類狀態(tài)方差參數(shù),利用歐式距離度量?jī)蓚€(gè)狀態(tài)相似程度,最終將狀態(tài)集合聚類為兩種模式C={-1,1},其中,1 代表肌肉活躍狀態(tài),-1 代表肌肉不活躍狀態(tài),根據(jù)C與原狀態(tài)集合的對(duì)應(yīng)關(guān)系,得到步態(tài)序列。
在步態(tài)過程中,肌電信號(hào)會(huì)存在時(shí)間很短的抖動(dòng)狀態(tài),在步態(tài)序列中表現(xiàn)為肌肉活躍模式,會(huì)影響周期起始位置標(biāo)注。通過選取合適大小的滑動(dòng)窗,計(jì)算窗內(nèi)每個(gè)狀態(tài)的樣本點(diǎn)數(shù)量,選擇包含樣本點(diǎn)最多的狀態(tài)為整個(gè)滑動(dòng)窗對(duì)應(yīng)的肌肉狀態(tài),來(lái)消除抖動(dòng)狀態(tài)的影響。在實(shí)驗(yàn)中發(fā)現(xiàn)抖動(dòng)狀態(tài)持續(xù)時(shí)間不超過周期時(shí)間的10%,正常兒童平均周期約為1.3 s,所以最終設(shè)置窗口大小為0.13 s。
本文實(shí)驗(yàn)共使用12 名兒童的SEMG 信號(hào)數(shù)據(jù),其中,5 位髖脫位患者,7 位正常兒童。根據(jù)研究需要,選取的實(shí)驗(yàn)對(duì)象符合以下條件:1)可以獨(dú)立行走;2)無(wú)患有影響下肢運(yùn)動(dòng)障礙的疾病。所有數(shù)據(jù)的使用得到上海市兒童醫(yī)院的授權(quán)和同意,實(shí)驗(yàn)通過倫理委員會(huì)審查,符合自愿原則并且被試者知曉實(shí)驗(yàn)內(nèi)容和步驟。
為得到高質(zhì)量數(shù)據(jù),實(shí)驗(yàn)前對(duì)皮膚以及電極貼片都經(jīng)過標(biāo)準(zhǔn)化處理,減少皮膚噪聲的干擾。在實(shí)驗(yàn)過程中,由家長(zhǎng)和主治醫(yī)生協(xié)助兒童完成指定動(dòng)作。實(shí)驗(yàn)動(dòng)作包括站立、環(huán)繞步態(tài)分析室以正常速度行走及轉(zhuǎn)彎。使用Noraxon Gait Analysis System采集SEMG 信號(hào)數(shù)據(jù),設(shè)置采樣頻率為1 500 Hz,多次采集LTA 的SEMG 信號(hào)后選擇較好的三段步態(tài)數(shù)據(jù),每段數(shù)據(jù)長(zhǎng)度為5 個(gè)周期。
首先分析單個(gè)SEMG 信號(hào)在整個(gè)聚類算法中的變化,如圖3 所示,縱軸對(duì)應(yīng)序列算法的3 個(gè)步驟,實(shí)線箭頭為周期起始位置的真值,虛線箭頭為模型預(yù)測(cè)的起始位置。BP-AR-HMM 模型將SEMG 信號(hào)標(biāo)注為一系列狀態(tài),即代表肌肉變化的隱狀態(tài)序列,能夠描述步態(tài)中SEMG 信號(hào)的變化規(guī)律??梢钥闯鲇械暮谏珷顟B(tài)持續(xù)時(shí)間很短,而該狀態(tài)對(duì)于分析肌電信號(hào)或者周期識(shí)別沒有太多的幫助,并且主要目的是通過識(shí)別肌肉活動(dòng)狀態(tài)來(lái)進(jìn)一步識(shí)別周期。通過對(duì)比各個(gè)狀態(tài)的方差可以發(fā)現(xiàn),肌肉活動(dòng)時(shí)各個(gè)狀態(tài)對(duì)應(yīng)的方差較為接近。通過k-means 算法聚類狀態(tài)集合的方差參數(shù)將方差相近的狀態(tài)聚為同一模式,最后得到只有兩種模式的步態(tài)序列,結(jié)合肌電圖發(fā)現(xiàn)黑色代表肌肉活動(dòng)狀態(tài),白色代表不活躍狀態(tài),如圖3 中k-means 對(duì)應(yīng)的序列可以看出,會(huì)存在時(shí)間持續(xù)很短的黑色狀態(tài),而該狀態(tài)會(huì)影響到周期識(shí)別,利用滑動(dòng)窗方法將持續(xù)時(shí)間較短的黑色狀態(tài)進(jìn)一步平滑后得到Smooth 對(duì)應(yīng)的步態(tài)序列,肌肉活動(dòng)段的起始位置即為周期的開始時(shí)刻(如黑色虛線箭頭所示)。
圖3 LTA 信號(hào)的分析過程Fig.3 Analysis process of LTA signal
本文使用預(yù)測(cè)誤差(error)[11]指標(biāo)定量分析算法對(duì)肌電信號(hào)周期的預(yù)測(cè)準(zhǔn)確性,具體定義如式(5)所示:
其中,period 為以truth 為真實(shí)起始值對(duì)應(yīng)的周期時(shí)間,predict 為周期起始位置預(yù)測(cè)值,error 值越大,誤差越大。
本文研究基于統(tǒng)計(jì)聚類方法對(duì)周期檢測(cè)的實(shí)用性,不同方法的預(yù)測(cè)誤差如表1 所示。其中,表中數(shù)字為(Mean+Std),Mean 為誤差均值,Std 為預(yù)測(cè)誤差集合的標(biāo)準(zhǔn)差,誤差均值反映模型對(duì)所有樣本預(yù)測(cè)的準(zhǔn)確性,而標(biāo)準(zhǔn)差代表預(yù)測(cè)誤差在誤差均值附近波動(dòng)的大小,反映模型預(yù)測(cè)的穩(wěn)定性。
表1 不同檢測(cè)算法的預(yù)測(cè)精度比較Table 1 Comparison of prediction accuracy of different detection algorithms %
從表1 可以看出,本文方法預(yù)測(cè)正常兒童周期起始位置誤差最小,平均預(yù)測(cè)誤差為2.15%,SampEN算法的誤差較高,而且對(duì)于正常兒童基于聚類方法的標(biāo)準(zhǔn)差最小,說明算法穩(wěn)定性較高。不同算法對(duì)于髖脫位兒童的周期預(yù)測(cè)誤差均高于正常兒童,因?yàn)闊o(wú)論是基于聚類的算法還是本文比較的3 種算法都是通過識(shí)別肌肉活動(dòng)狀態(tài)來(lái)識(shí)別周期起始位置,而髖關(guān)節(jié)脫位兒童的步態(tài)穩(wěn)定性較差,所以會(huì)造成識(shí)別的不準(zhǔn)確,同時(shí)由于SEMG 信號(hào)采集過程中噪聲的影響,也會(huì)增大預(yù)測(cè)誤差。最后通過t 檢驗(yàn)方法得到的本文方法在正常兒童數(shù)據(jù)中的預(yù)測(cè)準(zhǔn)確率要明顯優(yōu)于其他3 種檢測(cè)方法(p<0.05),而在髖脫位兒童數(shù)據(jù)中的預(yù)測(cè)誤差沒有明顯差異。
本文提出一種基于聚類算法的運(yùn)動(dòng)周期檢測(cè)方法,應(yīng)用BP-AR-HMM 模型得出步態(tài)中SEMG 信號(hào)對(duì)應(yīng)肌肉的變化規(guī)律,并結(jié)合滑動(dòng)窗投票方法實(shí)現(xiàn)周期起始位置的標(biāo)注。實(shí)驗(yàn)結(jié)果表明,本文方法對(duì)正常兒童步態(tài)數(shù)據(jù)的周期起始值預(yù)測(cè)準(zhǔn)確性較高。但該方法對(duì)于髖脫位兒童的周期檢測(cè)誤差較大,主要原因?yàn)轶y脫位兒童的SEMG 信號(hào)不夠穩(wěn)定,同時(shí)信號(hào)采集環(huán)境和設(shè)備都會(huì)影響最終的檢測(cè)效果,且本文只使用了一塊肌肉的SEMG 信號(hào)確定步態(tài)周期的起始位置,而步態(tài)是由多塊肌肉共同作用的結(jié)果,使用單一肌肉不能準(zhǔn)確地檢測(cè)步態(tài)周期,下一步將嘗試使用多塊肌肉的SEMG 信號(hào)來(lái)提高檢測(cè)準(zhǔn)確性。