国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于人工魚群算法-極限學(xué)習(xí)機的多手勢精準識別

2022-01-10 10:26:14來全寶胡玉舸孟慶豐
工程設(shè)計學(xué)報 2021年6期
關(guān)鍵詞:手勢時域權(quán)值

來全寶,陶 慶,胡玉舸,孟慶豐

(新疆大學(xué)機械工程學(xué)院,新疆烏魯木齊 830047)

隨著我國老齡化人口數(shù)量的急劇增加,因中風而偏癱的患者逐年遞增。根據(jù)臨床實踐,患者主動積極地參與康復(fù)訓(xùn)練對其受損神經(jīng)系統(tǒng)功能康復(fù)有重要作用[1]。為了提高患者主動訓(xùn)練的積極性以及解決人工協(xié)助的上肢手部康復(fù)訓(xùn)練治療的長期性和單一性問題,通過提取并解碼人體表面肌電信號(surface electromyography,SEMG)來獲取患者的訓(xùn)練意圖,并將其融入上肢手部康復(fù)訓(xùn)練器,這有利于大腦神經(jīng)的重塑,從而促進肢體的康復(fù)。手勢的精準識別是利用康復(fù)機器人進行訓(xùn)練的首要條件,因此探究手勢識別方法的多樣性和準確性是十分有必要的。肢體肌肉收縮產(chǎn)生的肌電信號中蘊藏著大量與神經(jīng)活動有關(guān)的信息,且具有較高的信噪比。人體上肢運動方式不同,對應(yīng)運動肌肉產(chǎn)生的肌電信號也有所不同,故可通過提取某些特征信號來對肢體的運動模式進行分類。目前,關(guān)于利用肌電信號對人體動作模式進行識別的研究已取得較多成果,但針對手勢識別的研究仍不夠深入,且大部分研究僅集中于少量手勢的識別。例如:趙詩琪等[2]結(jié)合Fisher Score特征降維方法與機器學(xué)習(xí)對4種手勢進行了識別,識別準確率為99.24%;Zhang等[3]運用神經(jīng)網(wǎng)絡(luò)對5種手勢進行了識別,平均識別準確率達98.7%;Yang等[4]運用高斯混合模型-隱馬爾可夫模型(Gaussian mixture model-hidden Markov model,GMM-HMM)識別了6種手勢,識別準確率達99%。隨著手勢種類的增多,各分類模型的識別準確率有所下降[5]。例如:Guo等[6]對8種人體上肢動作進行了識別,平均識別準確率僅為73.1%~97.7%;Leon等[7]結(jié)合時頻域特征對9種手勢進行了識別,識別準確率僅為94%;Lian等[8]采用K最近鄰和決策樹算法對10種手勢進行了識別,平均識別準確率僅為89%;Schabron等[9]采用神經(jīng)網(wǎng)絡(luò)對9種手勢進行了識別,最高識別準確率為90.3%;Liang等[10]通過結(jié)合原始肌電信號和包絡(luò)信號,基于監(jiān)督學(xué)習(xí)和單變量特征對9種手勢進行了識別,最高識別準確率為95%。綜上所述,多手勢識別的準確率還有待提高,為進一步滿足患者肢體康復(fù)的需求,研究準確率高的多手勢識別方法十分重要?,F(xiàn)階段的手勢識別大多是先通過采集受試者的SEMG以提取簡單的時域、頻域或時頻域特征,然后采用反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)[11]、支持向量機(support vector machine,SVM)[12]和極 限學(xué)習(xí) 機(extreme learning machine,ELM)[13]等分類模型進行識別。但上述方法均存在不足之處,其中:BP神經(jīng)網(wǎng)絡(luò)在識別手勢時存在準確率低的劣勢;SVM具有很多未知參數(shù),其在手勢識別訓(xùn)練時需要大量樣本來進行參數(shù)辨識;ELM與傳統(tǒng)的單隱層前饋神經(jīng)網(wǎng)絡(luò)(singlehidden layer feedforward neural network,SLFN)相比,具有運算速度快、識別精度高等優(yōu)點,但ELM的隨機性對其泛化性和精度有較大影響[14]。

基于此,筆者綜合ELM的隨機性以及特征組合和滑動窗口等對數(shù)據(jù)樣本的影響,選取最優(yōu)特征組合與最優(yōu)滑動窗口,提出一種基于人工魚群算法(artificial fish swarms algorithm,AFSA)優(yōu)化的ELM的多手勢精準識別方法,以提高多手勢識別準確率。首先,選取通過主成分分析(principal components analysis,PCA)降維處理后的最優(yōu)特征組合與最優(yōu)滑動窗口;然后,采用AFSA搜尋ELM的最優(yōu)輸入權(quán)值和隱含閾值,以提高其分類準確率;最后,利用AFSA優(yōu)化的ELM(AFSA-ELM)分類模型對8種手勢進行識別,并與BP神經(jīng)網(wǎng)絡(luò)分類模型和未優(yōu)化的ELM分類模型進行比較,以驗證所提出方法的精準性。

1 AFSA優(yōu)化ELM

1.1 AFSA介紹

AFSA是一種通過設(shè)立人工魚群模擬真實魚群的覓食、聚群和追尾等行為,由局部到全局逐步尋優(yōu),最終得到整體最優(yōu)解的算法。圖1所示為人工魚的視野V和移動步長S示意圖。當人工魚視野范圍內(nèi)位置XV處的食物濃度大于當前位置X處時,人工魚將向前一步到達位置Xm處;否則向視野范圍內(nèi)的其他位置(如XV1和XV2)進行搜索。

圖1 人工魚視野和移動步長示意Fig.1 Schematic diagram of visual field and moving step of artificial fish

如圖1所示,n條人工魚的當前位置X=(x1,x2,…,xn),其視野范圍內(nèi)的某一位置 XV=(xV1,xV2,…,xVn),則搜尋過程可表示為:

式中:random(?1,1)為[?1,1]內(nèi)的隨機數(shù)。

1.2 ELM參數(shù)優(yōu)化

ELM是一種全連接單隱層網(wǎng)絡(luò),分為輸入層、隱含層和輸出層,各層神經(jīng)元的數(shù)量分別為w、l和p。將ELM訓(xùn)練過程簡化成矩陣求逆問題,以有效提升其學(xué)習(xí)速度。ELM的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

圖2 ELM的網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Network structure of ELM

根據(jù)圖2,ELM分類模型可表示為:

式中:βi為第i個隱含層到輸出層的權(quán)值;f()為隱含層激活函數(shù);ωi為輸入層到第i個隱含層的權(quán)值,即輸入權(quán)值;bi為第i個隱含層節(jié)點的閾值,即隱含閾值;Q為訓(xùn)練樣本的輸入,Q=(q1,q2,…,qw)T;Y為訓(xùn)練樣本的輸出,Y=(y1,y2,…,yp)T。

ELM固有的隨機性是指在構(gòu)建ELM分類模型時,其輸入權(quán)值和隱含閾值是通過程序隨機選取的,從而導(dǎo)致分類結(jié)果不理想。本文采用AFSA來優(yōu)化ELM的參數(shù),以構(gòu)建最優(yōu)的AFSA-ELM分類模型。具體流程如下:將ELM的輸入權(quán)值和隱含閾值作為AFSA的搜尋個體,將ELM的訓(xùn)練樣本期望輸出與實際輸出的均方根誤差作為AFSA的適應(yīng)度函數(shù),得到的適應(yīng)度函數(shù)值越小表明優(yōu)化后的輸入權(quán)值和隱含閾值越理想,即得到的AFSA-ELM分類模型越優(yōu),識別準確率越高。利用AFSA優(yōu)化ELM參數(shù)的具體流程如圖3所示。其中:σ為擁擠度因子,T為嘗試次數(shù),d為迭代次數(shù),D為最大迭代數(shù)。

圖3 AFSA優(yōu)化ELM參數(shù)的具體流程Fig.3 Specific process of ELM parameters optimized by AFSA

2 SEMG采集與預(yù)處理

2.1 SEMG采集

采用葡萄牙Plux公司生產(chǎn)的八通道無線表面肌電測量系統(tǒng)和上海勵圖醫(yī)療器材有限公司生產(chǎn)的LT-7型理療電極片,利用5個信號通道對4名在校大學(xué)生(2名男性,2名女性,年齡為(20±3)歲,手部正常均無骨折受傷經(jīng)歷)進行SEMG采集,分別對握拳、展拳、伸一指、伸兩指、伸三指、伸四指、六手型和八手型等8種常用手勢對應(yīng)的SEMG進行采集。具體的實驗過程如下:實驗開始前,預(yù)先清潔受試者皮膚并用醫(yī)用酒精擦拭相關(guān)肌肉群,然后將表面肌電測量系統(tǒng)的電極片(采樣頻率為1 000 Hz)粘貼在受試者左臂皮膚表面的5個位置處,分別為指淺屈肌、肱橈肌、指伸肌、尺側(cè)腕伸肌和肱側(cè)腕屈肌處;實驗開始后,令受試者肘部搭在辦公桌上,前臂和手部保持豎直放松,按照提示分別做上述8種手勢,且做相同手勢時保持手部姿態(tài)和力度大小、方向一致,對不同手勢下的SEMG進行采集。對每名受試者采集20組信號,共采集80組數(shù)據(jù);每采集4組信號休息5 min,以保證數(shù)據(jù)不受疲勞等因素的影響。其中1名受試者的手勢識別實驗現(xiàn)場如圖4所示。鑒于各受試者前期經(jīng)過多次訓(xùn)練,男性與女性的動作姿態(tài)、力度控制較為一致,各受試者間差異性較小。

圖4 手勢識別實驗現(xiàn)場Fig.4 Gesture recognition experiment site

2.2 SEMG預(yù)處理

SEMG的頻率一般為0~500 Hz,且主要頻率為10~300 Hz,其容易受到噪聲的干擾,故須對SEMG進行去噪處理,旨在調(diào)整基線漂移、去除頻率較高的噪聲信號以及消除50 Hz工頻干擾的影響。在本文中,首先去除50 Hz工頻干擾的影響,然后采用四階巴特沃斯帶通濾波器濾除基線噪聲的干擾,濾波器的帶通頻率取30~150 Hz。在完成濾波操作后,采用活動段檢測技術(shù)截取做手勢時的SEMG,即截取肌肉收縮發(fā)力時(活動段)的SEMG,與活動段相對應(yīng)的是肌肉處于靜息放松狀態(tài)下的非活動段。只有準確標記活動段的起止點,才能有效提取信號以識別手勢。本文采用滑動窗口法對SEMG進行處理,窗口總長度為128 ms,滑動窗長度為64 ms,活動段起止點的判斷閾值由多次測試確定,即取5個采樣通道平均能量和最大值的0.06h倍(h為經(jīng)驗取值);采用連續(xù)5次超越閾值法來確定活動段的起止點,為避免截取活動段信號時丟失有效的信號,在活動段起止點前后進行數(shù)據(jù)補充,以最大限度地保留有效信號。圖5所示為八手型手勢對應(yīng)的活動段SEMG截取結(jié)果,其中采樣點數(shù)被壓縮了64倍。

圖5 八手型手勢對應(yīng)的活動段SEMG截取結(jié)果Fig.5 SEMG interception results of active segment corresponding to eight-hand gesture

3 組合特征提取與滑動窗口優(yōu)化

僅經(jīng)過預(yù)處理的SEMG是無法用于手勢識別的,須提取可表征不同手勢之間的特點和區(qū)別的有用信息,這些有用信息統(tǒng)稱為特征,多個特征組合成特征向量。目前,被廣泛使用的SEMG特征的提取方法有以下幾種:時域特征提取、頻域特征提取和時頻域特征提取等。其中時域特征提取便捷,計算迅速,信息量大且全面,故本文以時域特征為研究對象,即分別提取SEMG的平均絕對值(mean absolute vlaue,MAV)、均方根值(root mean square,RMS)、方差(variance,VAR)和波形長度(waveform length,WL)等4個特征值,以從強度、波動性等不同方面來描述SEMG。上述4個特征值的計算式分別為:

式中:M、R、V和W分別為平均絕對值、均方根值、方差和波形長度;N為活動段內(nèi)有效的采樣點數(shù);ak為活動段內(nèi)第k個采樣點的SEMG幅值。

3.1 特征組合的優(yōu)化選擇

在手勢識別中,對特征進行優(yōu)化組合與降維處理可顯著提高手勢識別準確率。通過分析可知,基于時域特征的手勢識別準確率偏低,而綜合了頻域特征與時頻特征的識別效果也依然不佳??紤]到SEMG的非線性與混沌性,本文引入非線性特征——樣本熵E[2],樣本熵的維數(shù)為2。每個通道提取5個特征(4個時域特征和1個樣本熵),則5個通道信號的特征組合成一個25維的特征向量P,可表示為:

向量維度過大時存在信息冗余,使得計算時間過長,可用性比較差。本文采用PCA對上述25維特征向量進行降維處理,提取主成分后按貢獻率進行排序,并選取貢獻率最大的前3列主成分,從而將25維降到3維。基于上述方法,對8個手勢對應(yīng)的SEMG的特征組合進行優(yōu)化選擇,結(jié)果如圖6所示,圖中x、y、z分別對應(yīng)前3列主成分。其中,圖6(a)為基于PCA降維處理的時域特征散點圖,圖6(b)為基于PCA降維處理的樣本熵散點圖,圖6(c)為基于PCA降維處理的時域特征和樣本熵散點圖。從圖中可以清晰地看出,采用圖6(c)方案時8個手勢的特征可被明顯區(qū)分,同時可縮短運算時間。

圖6 不同手勢對應(yīng)的特征散點圖Fig.6 Feature scatter diagram corresponding to different gestures

3.2 滑動窗口優(yōu)化處理

在完成活動段檢測后,采用滑動窗口法提取各手勢對應(yīng)的活動段信號的時域特征。滑動窗口法的原理如圖7所示,即利用滑動窗對截取的活動段SEMG進行有效壓縮,以用于后續(xù)的手勢識別。圖中:K表示滑動窗長度,H表示增量窗長度。

圖7 滑動窗口法原理示意Fig.7 Schematic diagram of sliding window method

本文先隨機選擇滑動窗長度K=256 ms,增量窗長度H=128 ms進行時域特征提取,但識別結(jié)果并不理想。為了尋找更優(yōu)的滑動窗,基于多個滑動窗進行時域特征提取實驗。為避免康復(fù)機器人控制器出現(xiàn)延時,將滑動窗長度保持在300 ms以下[15],并用隱含節(jié)點數(shù)為50的ELM分類模型(由于AFSA-ELM分類模型的時間成本較高,而ELM分類模型與AFSA-ELM的識別結(jié)果呈正相關(guān)且識別速度快,選用ELM可快速找到最優(yōu)的滑動窗)進行手勢識別,結(jié)果如表1所示,表中平均識別率為10次測試結(jié)果的平均值。

由表1可知,滑動窗的選取對手勢識別結(jié)果的影響較大,識別準確率差值高達12.6%。根據(jù)所得結(jié)果,選擇K=128 ms,H=64 ms的滑動窗為最優(yōu)滑動窗進行特征提取。

表1 基于不同滑動窗的手勢識別準確率Table 1 Gesture recognition accuracy based on different sliding windows

3.3 最優(yōu)特征組合與最優(yōu)滑動窗驗證

為了驗證所選最優(yōu)特征組合與最優(yōu)滑動窗的優(yōu)勢,結(jié)合時域特征、樣本熵和時域特征+樣本熵(均經(jīng)PCA降維處理)以及K=32 ms,H=16 ms的滑動窗,利用ELM分類模型對8種手勢進行識別,并與基于K=128 ms,H=64 ms的最優(yōu)滑動窗的識別結(jié)果進行比較。選用K=32 ms,H=16 ms的滑動窗進行對比的原因是表1結(jié)果顯示基于該滑動窗的識別效果僅次于基于最優(yōu)滑動窗的。基于不同特征和滑動窗的手勢識別結(jié)果如表2所示。

表2 基于不同特征組合和滑動窗的手勢識別結(jié)果Table 2 Gesture recognition results based on different feature combinations and sliding windows

從表2可以看出,當特征組合及滑動窗選擇不理想時,手勢的識別準確率是偏低的,而基于本文所選的最優(yōu)特征組合與最優(yōu)滑動窗的手勢識別結(jié)果較為理想,對8種手勢的識別準確率高達95.8%,充分說明了選擇的合理性。由此說明,單一特征無法完全表征手勢,而融合多個特征的特征組合可全面表征手勢,但提取過多的特征會增加運算時間,因此有必要選擇合適的特征組合。此外,選擇合適的滑動窗也可進一步提升識別準確率。

4 AFSA-ELM分類模型的構(gòu)建與結(jié)果分析

4.1 AFSA-ELM分類模型的構(gòu)建與應(yīng)用

根據(jù)上述方法,設(shè)人工魚的數(shù)量n=10,最大迭代數(shù)D=5次,人工魚視野V=100,移動步長S=2,利用AFSA對ELM的輸入權(quán)值和隱含閾值進行尋優(yōu)。當尋優(yōu)次數(shù)達到所設(shè)的最大迭代數(shù)時,尋優(yōu)終止并輸出最優(yōu)的輸入權(quán)值和隱含閾值。需要注意的是,AFSA參數(shù)的選取對最終手勢識別結(jié)果的影響較小,但人工魚數(shù)量和迭代次數(shù)較大會導(dǎo)致尋優(yōu)時間急劇增加,不利于運算?;贏FSA的ELM參數(shù)尋優(yōu)迭代過程如圖8所示。

圖8 基于AFSA的ELM參數(shù)尋優(yōu)迭代過程Fig.8 Iterative process of ELM parameter optimization based on AFSA

基于建立的AFSA-ELM分類模型,取80%的SEMG作為訓(xùn)練數(shù)據(jù),20%作為測試數(shù)據(jù)。將訓(xùn)練數(shù)據(jù)輸入AFSA-ELM分類模型,以對該模型進行訓(xùn)練,而后將測試數(shù)據(jù)輸入訓(xùn)練好的AFSA-ELM分類模型,以對8種手勢進行識別,結(jié)果如圖9所示,其中縱坐標中的1—8分別對應(yīng)8種手勢。由圖9可知,AFSA-ELM分類模型對8種手勢的識別準確率高達97.4%。

圖9 8種手勢的識別效果對比Fig.9 Comparison of recognition effect of eight gestures

4.2 不同分類模型的對比分析

為了驗證所構(gòu)建的AFSA-ELM分類模型的優(yōu)勢,分別與BP神經(jīng)網(wǎng)絡(luò)(輸入層節(jié)點數(shù)為3,隱含層節(jié)點數(shù)為20,輸出層節(jié)點數(shù)為8,傳遞函數(shù)為Sigmoid型)分類模型和未優(yōu)化的ELM分類模型進行對比,結(jié)果如表3所示。表中識別準確率由10次測試結(jié)果的平均值與其標準差組成。

表3 基于不同分類模型的手勢識別準確率對比Table 3 Comparison of gesture recognition accuracy based on different classification models %

由表3可知,AFSA-ELM分類模型對8種手勢的識別準確率明顯高于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)分類模型,提高了3.5%;相比于未優(yōu)化的ELM分類模型,提高了1.6%。這主要是因為BP神經(jīng)網(wǎng)絡(luò)易陷入過學(xué)習(xí),導(dǎo)致整體識別結(jié)果不理想,而未優(yōu)化的ELM由于參數(shù)的隨機性大,使得識別穩(wěn)定性較差。這充分說明了優(yōu)化后ELM的輸入權(quán)值和隱含閾值較優(yōu),使得識別結(jié)果得到了明顯改善,由此驗證了AFSA-ELM分類模型的精準性。

對于本文所研究的手勢離線識別方法,除了考慮分類模型的識別效果外,訓(xùn)練和識別時間也是衡量分類模型優(yōu)劣的重要指標。分類模型的訓(xùn)練和識別時間越短,表明其響應(yīng)速度越快。對上述3種分類模型的訓(xùn)練和識別時間進行分析,結(jié)果如表4所示。其中AFSA的尋優(yōu)時間未計入。

表4 不同分類模型的訓(xùn)練和識別時間對比Table 4 Comparison of training and recognition time of different classification models 單位:ms

由表4可知,BP神經(jīng)網(wǎng)絡(luò)分類模型的訓(xùn)練和識別時間遠超過未優(yōu)化的ELM分類模型,充分證明了ELM分類模型的有效性。在對比AFSA-ELM分類模型與ELM分類模型時,考慮到SEMG的特征數(shù)據(jù)量龐大,而AFSA尋優(yōu)需要一定時間,故暫將尋優(yōu)過程排除在外,直接選擇AFSA優(yōu)化好的ELM分類模型進行訓(xùn)練和識別。結(jié)果表明,AFSA-ELM分類模型的訓(xùn)練和識別時間較ELM分類模型分別少62 ms和2.55 ms。由于本文未考慮AFSA-ELM分類模型的尋優(yōu)時間,其僅可用于對識別精度要求較高的離線分析,后續(xù)在實時、在線識別的應(yīng)用上須作進一步改進。

5 結(jié)論

為了提高多手勢的識別準確率,結(jié)合特征組合與滑動窗口法,提出了一種基于AFSA優(yōu)化的ELM的多手勢精準識別方法。結(jié)果表明,將樣本熵引入時域特征組合并結(jié)合PCA降維處理時,ELM分類模型的識別準確率較高;搭配最優(yōu)的滑動窗(滑動窗長度K=128 ms,增量窗長度H=64 ms)時,ELM分類模型的識別效果可進一步改善;所構(gòu)建的AFSA-ELM分類模型對8種常用手勢的識別準確率高達97.4%,優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和未優(yōu)化的ELM分類模型。后續(xù)可將AFSA-ELM分類模型應(yīng)用于機械運動控制、外骨骼控制等領(lǐng)域[16-17]。

猜你喜歡
手勢時域權(quán)值
一種融合時間權(quán)值和用戶行為序列的電影推薦模型
CONTENTS
CONTENTS
挑戰(zhàn)!神秘手勢
V字手勢的由來
基于時域信號的三電平逆變器復(fù)合故障診斷
勝利的手勢
基于權(quán)值動量的RBM加速學(xué)習(xí)算法研究
基于極大似然準則與滾動時域估計的自適應(yīng)UKF算法
基于時域逆濾波的寬帶脈沖聲生成技術(shù)
新民市| 禄劝| 鲁山县| 临沧市| 嘉峪关市| 新源县| 通江县| 廊坊市| 马山县| 宜兰县| 左权县| 麻城市| 筠连县| 和硕县| 双辽市| 东海县| 高淳县| 桦甸市| 自贡市| 麻栗坡县| 开远市| 博白县| 靖西县| 盱眙县| 荃湾区| 且末县| 公安县| 昌平区| 邻水| 万全县| 金昌市| 南通市| 沙田区| 贺州市| 阳城县| 平顶山市| 墨玉县| 肥东县| 黑山县| 兴城市| 满洲里市|