田浪博,趙耀,邱月,胡命嘉,宮玉琳
(長春理工大學(xué) 電子信息工程學(xué)院,長春 130022)
手在人們的日常生產(chǎn)生活中扮演著不可或缺的角色,是人體與外界交流的媒介之一,因此上肢殘缺喪失了日常生活的能力,降低了生活的幸福感。得益于人工智能、深度學(xué)習(xí)等技術(shù)的迅猛發(fā)展,智能假肢開始出現(xiàn)在殘疾人群的日常生活中,有效改善了肢體殘疾人群的生活質(zhì)量。表面肌電信號(Surface Electromyography Signal,sEMG)能有效地反映出人體在動作的生理變化,在智能假肢控制領(lǐng)域意義重大[1]。
表面肌電(sEMG)信號是骨骼肌收縮時,在皮膚表面利用肌電傳感器以無創(chuàng)的方式記錄下來的生物電信號,其中蘊含著豐富的與神經(jīng)肌肉活動、運動意圖相關(guān)的信息,成為控制假手的理想信號源[2-3]。利用特征提取和模式識別技術(shù),對不同手勢動作過程中產(chǎn)生的肌電信號實現(xiàn)自動識別、分類,這正是基于sEMG實現(xiàn)智能假手控制的關(guān)鍵所在[4]。
目前,基于表面肌電信號的手臂動作識別主要分為上肢大幅度動作模式和手指精細(xì)動作兩種。文獻(xiàn)[5]對小臂旋前/后、腕部彎曲/伸展等8種上肢大幅度動作模式進(jìn)行分類,其正確識別率達(dá)到73%~97%。文獻(xiàn)[6]對8通道的sEMG提取時域特征,再結(jié)合粒子群(PSO)優(yōu)化算法和蟻群(ACO)優(yōu)化算法,利用SVM、LDA以及樸素貝葉斯(NB)搭建手勢分類模型,其準(zhǔn)確率最高達(dá)到了95%。
根據(jù)現(xiàn)階段研究現(xiàn)狀,本文提出一種基于多通道表面肌電信號的手勢識別研究方案。利用優(yōu)化后的支持向量機(jī)對多種手指動作進(jìn)行分類,搭建手勢分類識別模型,為后續(xù)智能假肢的實時控制奠定基礎(chǔ)。
以往文獻(xiàn)在獲取sEMG數(shù)據(jù)時,多為自行設(shè)定手勢動作,采用不同種肌電電極獲取動作時產(chǎn)生的表面肌電信號,對手勢動作以及信號采集缺少規(guī)范性的設(shè)定,本文截取了Ninapro數(shù)據(jù)庫的部分?jǐn)?shù)據(jù)進(jìn)行實驗分析。NinaPro數(shù)據(jù)庫[7]是一個基于多種稀疏多通道肌電信號的手勢識別的標(biāo)準(zhǔn)數(shù)據(jù)集,其主旨是為科研人員提供實驗數(shù)據(jù),方便實驗的進(jìn)行。
本文選用了數(shù)據(jù)庫中DB5數(shù)據(jù)的部分進(jìn)行實驗,具體手勢動作如圖1所示。DB5數(shù)據(jù)集是由雙MYO臂環(huán)完成信號采集,單個臂環(huán)包含有8個通道,其采樣頻率為200 Hz。數(shù)據(jù)集中包含有10個健全測試者右利手的52種手勢動作,每種動作重復(fù)6次且每次持續(xù)5 s,為降低采集過程中測試者的肌肉疲勞程度,每次動作后休息3 s。
圖1 Ninapro數(shù)據(jù)庫部分動作示意圖
sEMG是一種及其微弱的信號,易受到電路以及外界環(huán)境的干擾,其中以工頻干擾、基線漂移等干擾最為嚴(yán)重[8]。其頻譜范圍在0~1 000 Hz之間且主要能量集中在20~200 Hz之間,由于MYO臂環(huán)系統(tǒng)已完成50 Hz的工頻率波,因此再對信號進(jìn)行截止頻率為20 Hz的巴特沃斯高通濾波。
sEMG中的一次完整動作包括有活動段信號和靜息段信號兩個部分?;顒佣涡盘枮榧∪膺\動時產(chǎn)生的生理電信號,平均能量高,而靜息段信號為肢體放松時產(chǎn)生的電信號,其中包含有肢體的噪聲信號,且平均能量低[9]。為降低噪聲對實驗結(jié)果的影響以及模型的數(shù)據(jù)處理量,本文選用移動平均能量法與閾值法進(jìn)行活動段檢測,具體步驟如下:
(1)先計算各通道sEMG信號序列St(i)的差分平方和的均值,得到信號瞬時平均能量Saver(i),其中N為MYO臂環(huán)的通道總數(shù),i為當(dāng)前信號序列的標(biāo)號,t的取值范圍為1≤t≤N,如式(1)所示:
(2)取固定窗口長為L=128的移動窗對瞬時能量按照式(2)依次計算窗長內(nèi)的能量均值:
(3)設(shè)置合適的能量幅度閾值YZ對經(jīng)移動平均后的能量均值進(jìn)行判別,如式(3)所示,保留大于閾值的信號點,將低于閾值的信號點置零,依此確定活動段的起始點與終止點,同時設(shè)定活動段長度閾值TH,將小于TH的活動段作為判斷錯誤舍棄。
特征提取在手勢識別中是不可或缺的一部分,能更大程度上展現(xiàn)不同手勢動作間的區(qū)別,提高動作的識別率。目前常用的特征種類包含有時域、頻域、時頻域特征、非線性分析以及參數(shù)模型五大類[10]。
本文選取了時域特征中的絕對均值(MAV)、波形長度(WL)、均方根(RMS)、過零點數(shù)(ZC)、斜率符號變化(SSC)以及小波包系數(shù)能量作為特征參數(shù)。其中5種時域特征如式(4)-式(8)所示:
sEMG中蘊含的動作特征信息是由原始信號和小波包基函數(shù)共同決定的。不同的小波包基的性質(zhì)各不相同,反映信號特征的能力也不相同。以往研究表明,Daubechies系列基函數(shù)與運動單元動作電位的形狀最為相似[11],故本文選擇Db2作為小波包基函數(shù),提取小波包系數(shù)的能量作為時頻域特征,為降低數(shù)據(jù)處理量,本文對肌電信號進(jìn)行2層分解。小波包系數(shù)的計算如下:
其中,h(m-2l)和g(m-2l)是尺度級數(shù)p下的兩組函數(shù);p代表級數(shù)。
SVM的基本理論是通過尋找最優(yōu)分類面來實現(xiàn)對未知樣本數(shù)據(jù)的分類。即在特征空間中尋找一個最優(yōu)分類超平面,使兩類樣本特征的幾何間隔最大。在線性可分的情況下,將最優(yōu)分類超平面ω×xi+b=0歸一化后,對樣本集數(shù)據(jù)(xi,yi),i=1,2,…,n,x∈Rd,y?[-1,+1]進(jìn)行分類為兩樣本數(shù)據(jù)到超平面的幾何距離。分類間隔最大就等價于最小化‖ω‖,因此得到一個帶約束的優(yōu)化問題:
其中,ω為最優(yōu)超平面的法向量;b為閾值;b∈Rd。
對于SVM的線性不可分問題,應(yīng)當(dāng)引入松弛變量φi≥0(i=1,2,…,n)和懲罰函數(shù)C,則超平面的求解公式為:
映射核函數(shù)選用高斯徑向基核函數(shù):
其中,σ為核函數(shù)參數(shù)。
3.2.1 Grid Search-SVM原理
影響SVM分類器性能的關(guān)鍵參數(shù)是懲罰函數(shù)C和核函數(shù)參數(shù)g,其中C表示模型對誤差的容忍度[12]。C值太大容易導(dǎo)致過擬合的現(xiàn)象,使得測試集的數(shù)據(jù)分類效果不佳;C值太小容易導(dǎo)致欠擬合,模型不能有效捕捉樣本的數(shù)據(jù)特征,泛化能力變差。g是選擇RBF函數(shù)作為kernel后,該函數(shù)自帶的一個參數(shù),隱含地決定了數(shù)據(jù)映射到新的特征空間后的分布,g越大,支持向量越少,g值越小,支持向量越多。g值過大過小,表明原始樣本被映射至并不適用的高維空間,無法建立較優(yōu)的分類模型。
Grid Search是用在Libsvm中的參數(shù)搜索方法,在C和g組成的二維參數(shù)矩陣中,依次搜索網(wǎng)格內(nèi)所有點進(jìn)行取值,對于取定的C和g利用K-CV方法取得在此組C和g下訓(xùn)練集驗證分類準(zhǔn)確率,最終取得使訓(xùn)練集驗證分類準(zhǔn)確率最高的那組C和g作為最佳參數(shù)。使用Grid Search算法可以達(dá)到全局最優(yōu),且C和g相互獨立[13-14]。
3.2.2 Grid Search-SVM模型建立
在模型的建立過程中,導(dǎo)入提取的特征參數(shù),在進(jìn)行歸一化處理后,引入RBF核函數(shù),將特征參數(shù)映射到高維空間,再進(jìn)行SVM模型訓(xùn)練,參數(shù)尋優(yōu)以及模型驗證,整個版型的預(yù)測模型如圖2所示。
(1)選定訓(xùn)練集與測試集,對數(shù)據(jù)集進(jìn)行劃分。
(2)樣本數(shù)據(jù)預(yù)處理:為避免各個樣本因子之間量級的差異,減少樣本之間的相互影響,同時保證程序運行收斂加快,需對樣本因子進(jìn)行歸一化處理。
其中,x、min(x)、max(x)分別是原始樣本數(shù)據(jù)及其最小值、最大值;max(y)、min(y)分別為歸一化后樣本的最大值與最小值。
(3)引入徑向基核函數(shù)RBF,通過調(diào)整g參數(shù)實現(xiàn)樣本從低維空間到高維空間的映射,從而實現(xiàn)線性可分。
(4)使用二度Grid Search算法進(jìn)行SVM模型訓(xùn)練及C和g參數(shù)尋優(yōu)。粗略搜索階段:定義初始網(wǎng)格,設(shè)置大步距,獲得局部最優(yōu)參數(shù)區(qū)間;精細(xì)搜索階段:以最優(yōu)參數(shù)組為搜索中心,設(shè)置小步距,不斷擴(kuò)大搜索范圍,逐步跳出局部最優(yōu),獲得全局最優(yōu)解,從而實現(xiàn)分類效果最優(yōu)。
由1.2節(jié)分析中,在已完成50 Hz工頻陷波的基礎(chǔ)上,對肌電信號進(jìn)行高通濾波,濾除20 Hz以下部分。圖3為原始信號的時域圖和已完成濾波后信號的時域圖,圖4為原始信號的頻譜圖和已完成濾波后信號的頻譜圖。由圖3、圖4可知,通過高通濾波能有效地濾除部分噪聲,對后續(xù)動作的高效識別奠定了基礎(chǔ)。
圖3 濾波前后信號時域圖
圖4 濾波前后信號頻譜示意圖
根據(jù)1.3節(jié)所述原理,通過設(shè)置能量幅度閾值YZ,舍棄部分由噪聲影響而誤判的動作活動段,再通過活動段長度閾值TH將由肢體抖動而誤判的活動段濾除,進(jìn)一步提高手勢分類的正確率。圖5、圖6為取閾值前后動作段的能量幅度圖。
圖5 信號能量均值幅度圖
圖6 取閾值后能量均值幅度圖
在經(jīng)Grid Search對SVM優(yōu)化的過程中,本文具體進(jìn)行以下操作:
(1)首先設(shè)定參數(shù)C和g的初始網(wǎng)格搜索范圍及其初始步長。其中,C和g的初始網(wǎng)格搜索范圍為[2-10,210],初始步長設(shè)定為4,通過交叉驗證方法獲得小范圍最優(yōu)參數(shù)。
(2)在初始小范圍的最優(yōu)參數(shù)中,再進(jìn)行精確網(wǎng)格搜索,其中C的網(wǎng)格搜索范圍為[2-2,24],g的網(wǎng)格搜索范圍為[2-4,24],搜索步長設(shè)為0.02。
(3)將最終得到最優(yōu)C和g導(dǎo)入到SVM的參數(shù)組,最終建立最優(yōu)的Grid Search-SVM動作分類模型。
如圖7所示,當(dāng)訓(xùn)練數(shù)據(jù)占比為66.7%,是否經(jīng)過優(yōu)化,動作分類模型的實驗結(jié)果。在SVM分類器未經(jīng)優(yōu)化時,準(zhǔn)確率僅為73.61%;在通過Grid Search對SVM分類器優(yōu)化后,準(zhǔn)確率達(dá)到了90%。
圖7 分類模型試驗結(jié)果
如圖8所示為當(dāng)訓(xùn)練數(shù)據(jù)占比為88.3%,是否完成優(yōu)化,動作分類模型的實驗結(jié)果。在SVM分類器未經(jīng)優(yōu)化時,準(zhǔn)確率為77.78%;在Grid Search對SVM分類器完成參數(shù)尋優(yōu)后,優(yōu)化后的分類模型準(zhǔn)確率達(dá)到了97.22%。
圖8 分類模型試驗結(jié)果
由圖7、圖8可知,未經(jīng)優(yōu)化時,SVM分類器的平均識別率為72.24%,在Grid Search對SVM完成優(yōu)化后,分類模型的平均識別率達(dá)到了93.61%。由此可見Grid Search能對SVM分類器有較好的優(yōu)化作用。優(yōu)化后的動作分類模型達(dá)到了實驗的標(biāo)準(zhǔn),也為后續(xù)實時控制假肢提供了實驗經(jīng)驗。
從上述研究結(jié)果總結(jié)發(fā)現(xiàn),SVM作為分類器能有效的對各種動作進(jìn)行分類,但分類效果不甚理想。經(jīng)Grid Search對SVM分類器進(jìn)行參數(shù)尋優(yōu)后,分類器能有效的區(qū)分各種動作。但在實驗過程中,實驗處理時間較長,未能達(dá)到實時控制假肢動作的要求,需要在后續(xù)實驗過程進(jìn)行有效解決。