国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于LSTM神經(jīng)網(wǎng)絡(luò)的仿人機器人循環(huán)步態(tài)的生成方法

2020-12-21 09:55于建均左國玉阮曉鋼
北京工業(yè)大學學報 2020年12期
關(guān)鍵詞:步態(tài)步行神經(jīng)網(wǎng)絡(luò)

于建均, 李 晨, 左國玉, 阮曉鋼, 王 洋

(北京工業(yè)大學信息學部, 北京 100124)

雙足機器人相較于輪式機器人具有良好的環(huán)境適應性且因其具有類人的結(jié)構(gòu)可以代替人類在危險、復雜的場景中工作. 因此雙足機器人被廣泛應用在搶險救災、生活服務(wù)等場景下. 但因其雙足式結(jié)構(gòu)的不穩(wěn)定性在移動時易產(chǎn)生晃動甚至摔倒等問題,在雙足機器人研究領(lǐng)域中,循環(huán)步態(tài)規(guī)劃使機器人能完成長時間穩(wěn)態(tài)步行,因而成為該領(lǐng)域中主要的研究方向之一.

人類在完成一系列步行動作時的平衡性好且能長時間穩(wěn)定步行,其姿態(tài)、各個關(guān)節(jié)的角度、零力矩點(zero moment point,ZMP)等數(shù)據(jù)均被認為最優(yōu). 因此,模仿人體步行動作的方式被廣泛使用到仿人機器人的步態(tài)規(guī)劃中. 目前,人體步行的示教數(shù)據(jù)大多采用體感攝影機(如Kinect、Wil)的方式采集[1-3],但這種方式受到拍攝視野的限制,無法采集多個步態(tài)周期的人體示教數(shù)據(jù). 在機器人完成長時間的步行動作時由多個單步態(tài)周期循環(huán)(或拼接)得到的關(guān)節(jié)角度序列會使機器人在運動過程中出現(xiàn)震動或摔倒的情況. 因此,雙足機器人的循環(huán)步態(tài)規(guī)劃是機器人完成長時間穩(wěn)態(tài)步行任務(wù)的基礎(chǔ). 左國玉等[4]將仿袋鼠機器人簡化為倒立擺模型,并使用混合粒子群算法優(yōu)化線性二次型完成機器人的站立平衡控制,但其模型簡單,遷移至仿人機器人中不能保證機器人動作的擬人性;Ibrahim等[5]通過對人體步行過程中單腳支撐(single support phase,SSP)和雙腳支撐(double support phase,DSP)2個關(guān)鍵過程的分析(通過Kinect采集示教數(shù)據(jù))以及反饋線性化的方式,使用多項式擬合關(guān)節(jié)角度軌跡函數(shù)的方式完成雙足機器人的步態(tài)循環(huán),但由于線性擬合在SSP和DSP過程中會出現(xiàn)擬合誤差大,導致機器人產(chǎn)生晃動的問題;Kao-Shing 等[6]利用強化學習的方式學習Kinect體感采集器捕捉的人體步行動作的關(guān)鍵幀,完成各個關(guān)節(jié)角度的規(guī)劃,使仿人機器人實現(xiàn)長時間穩(wěn)定步行,但是由于其采取的是無監(jiān)督的強化學習的方法,步行動作的自然性和擬人性有所不足. 因此,需采取模仿精度更高的循環(huán)步態(tài)規(guī)劃方法使雙足機器人完成步行任務(wù). 由于人體在步行運動過程中的關(guān)節(jié)角度序列是時間序列,考慮通過采集多個單個人體步態(tài)周期的時間序列數(shù)據(jù)并對其進行學習,對時間序列進行多個步態(tài)周期的準確預測實現(xiàn)雙足機器人的步態(tài)循環(huán). 長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)由Sepp等[7]提出,解決了傳統(tǒng)時間序列預測工具循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的梯度消失和梯度爆炸問題,因此可以對RNN無法預測10個以上時間點的序列進行準確預測[8-9]. Wang等[10]利用2個LSTM神經(jīng)網(wǎng)絡(luò)分別完成對人體運動的識別和預測生成; Chellali等[11]利用LSTM神經(jīng)網(wǎng)絡(luò)對仿人機器人上肢各個關(guān)節(jié)的位置進行預測,進而對上肢動作姿態(tài)預測,完成“拍手游戲”; Dickson等[12]使用LSTM神經(jīng)網(wǎng)絡(luò)對6個動作進行上肢10個關(guān)節(jié)角度的聯(lián)合學習和分類模仿.

從目前的研究現(xiàn)狀可以看出,雖然體感攝影機Kinect受到視野限制出現(xiàn)采集示教數(shù)據(jù)不充足的問題,但其成本較低且Kinect-V2所采集的25個骨骼點信息,能充分滿足一般仿人機器人(如NAO機器人)的自由度控制要求,因此若可解決示教數(shù)據(jù)不足的問題,Kinect仍是一種能有效采集人體動作示教數(shù)據(jù)的方式,依然可以在模仿學習的領(lǐng)域被研究和應用.

本文考慮通過LSTM神經(jīng)網(wǎng)絡(luò)預測生成多個步態(tài)周期的仿人機器人步行關(guān)節(jié)角度序列,從而得到仿人機器人的循環(huán)步態(tài). 首先,通過Kinect體感采集器獲取多次人體步行動作的時間序列數(shù)據(jù),并經(jīng)拼接和平滑處理過后,得到原始樣本集. 其次,由于初始樣本集為一維時間序列,但仿人機器人在步行時各個關(guān)節(jié)受多種因素影響,因此只通過目標值對關(guān)節(jié)角度序列進行長時間預測,序列的細節(jié)很難被學習,且精確度不足. 通過C-C方法得到相空間重構(gòu)的時間延遲和嵌入維數(shù),進行相空間重構(gòu),可得到一維關(guān)節(jié)角度序列的多維特征值,與目標值一起構(gòu)成樣本集,可明顯提升關(guān)節(jié)角度預測的準確性. 最后,使用此樣本集對基于LSTM神經(jīng)網(wǎng)絡(luò)的仿人機器人步行動作關(guān)節(jié)序列預測模型進行訓練,使其預測生成多個步態(tài)周期的關(guān)節(jié)角度時間序列.

1 基于相空間重構(gòu)的示教數(shù)據(jù)預處理

Kinect-V2是一款成本較低的人機交互設(shè)備,所采集的人體步行動作的示教信息可以很好地滿足仿人機器人的自由度控制要求(Kinect:25個,仿人機器人:20~25個),但由于其視野有限,對于人體步行動作(同一個示教者,步幅相同,步態(tài)周期相同)只能采集1.0~1.5個步態(tài)周期的示教數(shù)據(jù). 考慮采集多次人體步行示教數(shù)據(jù),經(jīng)過仿人機器人步態(tài)平衡模型映射,并使用拼接平滑的方式(直接循環(huán))進行仿人機器人步態(tài)循環(huán),但由于這種方法存在2次采集過渡階段關(guān)節(jié)角度序列出現(xiàn)震蕩的問題,因此,需要對關(guān)節(jié)角度序列進行預測生成來解決此問題. 考慮通過上述直接循環(huán)得到的關(guān)節(jié)角度序列作為初始樣本集,但直接使用它作為樣本集進行預測,由于只有目標值無其他特征值,預測精度不足以控制仿人機器人完成長時間穩(wěn)定步行動作,因此,利用相空間重構(gòu)的方法獲取樣本的更多特征值,以提高預測模型的精度.

1.1 多次人體示教數(shù)據(jù)采集

使用Kinect 2.0在其視野范圍內(nèi)對人體的步行動作進行捕捉,得到人體全身25個骨骼點的軌跡,并記錄其三維坐標(x,y,z). 由于Kinect是一款非專業(yè)的體感攝影機,因此需要對其記錄的骨骼點軌跡進行平滑處理. 通過空間向量法對人體骨骼點進行計算得到示教步行動作的各個關(guān)節(jié)角度的時間序列. 利用先前的研究成果[13]可以直接泛化得到使仿人機器人NAO穩(wěn)定步行的關(guān)節(jié)驅(qū)動角度序列. 將得到的多次采集的示教數(shù)據(jù)進行映射泛化,獲取機器人驅(qū)動關(guān)節(jié)角度進行拼接并平滑處理得到的關(guān)節(jié)角度,以在步行過程中對平衡性影響最大的髖關(guān)節(jié)俯仰角和踝關(guān)節(jié)滾動角為例,見圖1、2.

從圖2中可以看出,雖然直接拼接并進行平滑處理的方法可以得到多個步態(tài)周期循環(huán)的關(guān)節(jié)角度序列,然而在拼接處(紅圈標注)會出現(xiàn)明顯的震蕩. 由于采集2次示教數(shù)據(jù)時,第1次采集的終止點非下一次的起始點,因此使用這樣的關(guān)節(jié)角度序列驅(qū)動仿人機器人完成步行動作容易令機器人在拼接處出現(xiàn)晃動甚至摔倒的現(xiàn)象. 因此要使仿人機器人完成長時間的穩(wěn)定步行,需對關(guān)節(jié)角度序列進行預測并解決相鄰2次數(shù)據(jù)采集過渡處的波動問題.

1.2 基于相空間重構(gòu)的數(shù)據(jù)預處理

關(guān)節(jié)角度序列本身受無奇異位姿、ZMP判據(jù)、運動協(xié)調(diào)關(guān)系和關(guān)節(jié)角度范圍等多種因素影響,采集到的仿人機器人步行關(guān)節(jié)角度時間序列是一維時間序列.

x1={x1(1),x1(2),…,x1(500)}x2={x2(1),x2(2),…,x2(500)}

(1)

式中:x1為圖1中仿人機器人在行走時直接循環(huán)左腳踝關(guān)節(jié)滾動角的時間序列;x2為圖2中的仿人機器人在行走時直接循環(huán)左腿髖關(guān)節(jié)時間序列(分別有500個時間步驟). 因此在對關(guān)節(jié)角度進行預測之前,需要對該關(guān)節(jié)角度的一維時間序列進行逆推即相空間重構(gòu)的預處理,從而得到關(guān)節(jié)角度序列的其他特征值,提高模型預測準確性.

根據(jù)相空間重構(gòu)理論[13]的嵌入定理可知,對一維時間序列(Kinect采集的仿人機器人步行動作的關(guān)節(jié)角度數(shù)據(jù)即為一維時間序列)嵌入合適的維數(shù)m和時間延遲τ,重構(gòu)后的相空間與原系統(tǒng)具有相同的動力學結(jié)構(gòu).

由于m和τ具有較強的關(guān)聯(lián)性,二者的選擇不應相互獨立,且m和τ的確定很大程度上影響了之后模型預測的準確度,一般采用C-C方法[14]來同時計算合適的嵌入維數(shù)和時間延遲,首先定義關(guān)聯(lián)積分

(2)

式中:N為關(guān)節(jié)角度序列長度即500;M=N-(m-1)t是相空間重構(gòu)后相空間中的狀態(tài)點的個數(shù);t為子序列個數(shù);s為序列標號.

C-C方法的本質(zhì)[15]是計算嵌入維數(shù)m后與原序列的差值并求得最小值(最小化重構(gòu)后的多維序列的關(guān)聯(lián)性和原序列的關(guān)聯(lián)性的差異). 從而求得最佳的嵌入維數(shù)m和時間延遲τ,具體步驟為:

將仿人機器人的步行動作關(guān)節(jié)角度序列分為t個子序列,表達式為

{x(1),x(1+t),…,x(1+(m-1)t)} {x(2),x(2+t),…,x(2+(m-1)t)} ? {x(t),x(2t),…,x(mt)}

(3)

定義目標函數(shù)

(4)

定義差量

ΔS(m,N,r,t)= max{S(m,N,r,t)}-min{S(m,N,r,t)}

(5)

該量度量了關(guān)于半徑r的最大偏差,它的最小值對應了S的零點(由于實際的時間序列有限長,各個子序列非獨立同分布,因此實際求取到的S難以求得對所有半徑r的零點及它們所對應的m和τ).

(6)

通過C-C方法,確定關(guān)節(jié)角度序列的m和τ后,可以完成仿人機器人步行動作關(guān)節(jié)角度的1維時間序列進行相空間重構(gòu),從而得到5維的時間序列,其中1維是關(guān)節(jié)角度的目標值,剩余4維是重構(gòu)后的特征,踝關(guān)節(jié)重構(gòu)的相空間表達式為

Y1(ti)=x(ti),x(ti+4),x(ti+8),…,x(ti+20),i=1,2,…

(7)

髖關(guān)節(jié)重構(gòu)后的相空間表達式為

Y2(ti)=x(ti),x(ti+8),x(ti+16),…,x(ti+40),i=1,2,…

(8)

式中Y(ti)為m維相空間的第i個相點.

相空間重構(gòu)后的5維時間序列構(gòu)成最終樣本集,對時間預測模型進行訓練,由于特征增多可以明顯提升模型預測精度.

2 仿人機器人步行動作關(guān)節(jié)角度序列預測模型的建立

獲取仿人機器人步行動作的關(guān)節(jié)角度序列及其特征序列構(gòu)成的樣本集后,搭建結(jié)構(gòu)合理、精度較高且能預測多個時間步驟(長時間)的關(guān)節(jié)角度序列的模型成為使仿人機器人能夠完成長時間平穩(wěn)步行的主要問題,對關(guān)節(jié)角度序列的長時間準確預測可以解決直接循環(huán)方法在2次采集過渡階段出現(xiàn)的不平滑而使機器人在動作中出現(xiàn)晃動和摔倒的問題.

2.1 LSTM神經(jīng)網(wǎng)絡(luò)的基本原理

LSTM神經(jīng)網(wǎng)絡(luò)解決了RNN梯度消失和梯度爆炸的問題,使該結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)能學習到時間序列的長期依賴,其神經(jīng)元結(jié)構(gòu)見圖5.

其中,遺忘門的結(jié)構(gòu)表達式為

ft=σ(Wf·([ht-1,xt]+bf))

(9)

(10)

(11)

式中:Wc為細胞狀態(tài)權(quán)值;bc為細胞狀態(tài)偏置;it為輸入門的輸出;ht為LSTM神經(jīng)元輸出.

細胞狀態(tài)和遺忘門結(jié)構(gòu)的引進,解決了傳統(tǒng)RNN的梯度消失和爆炸問題. 這樣的前向結(jié)構(gòu)是LSTM 神經(jīng)網(wǎng)絡(luò)對多維時間序列的前后關(guān)系進行學習的必要條件.

由于仿人機器人步行動作關(guān)節(jié)角度序列需要精準控制,希望LSTM神經(jīng)網(wǎng)絡(luò)盡可能準確地生成多個步態(tài)周期的關(guān)節(jié)角度時間序列(但不能過擬合導致學習到過渡階段的波動). 而預測序列的準確性則是由訓練神經(jīng)網(wǎng)絡(luò)時的誤差隨時間反向傳播機制決定.

因此定義神經(jīng)網(wǎng)絡(luò)的目標函數(shù)為誤差函數(shù)E,定義

E=ht-yt

(12)

式中yt為樣本集中序列的真實值.

(13)

得到各個門結(jié)構(gòu)及細胞狀態(tài)各個時刻的偏差后,可以根據(jù)其定義,得到各個權(quán)重的偏差

(14)

通過上述誤差往回傳播的方法可以使LSTM在訓練過程中通過自己預測的值與真實值之間的偏差去更新權(quán)值,使網(wǎng)絡(luò)可以精準地學習時間序列并進行預測.

2.2 基于LSTM神經(jīng)網(wǎng)絡(luò)的仿人機器人步行動作關(guān)節(jié)角度序列預測模型

針對仿人機器人步行動作關(guān)節(jié)角度序列的預測問題,LSTM神經(jīng)網(wǎng)絡(luò)可以學習關(guān)節(jié)角度時間序列的各種特征,并根據(jù)這些特征對關(guān)節(jié)角度序列做出多個時間步驟的預測,從而實現(xiàn)仿人機器人步態(tài)循環(huán)的目的.

LSTM神經(jīng)網(wǎng)絡(luò)是通過分析時間序列的前后關(guān)系的原理對序列進行預測的. 因此對于類似股價這樣無周期性規(guī)律的時間序列預測效果并不理想. 從圖1、2中可以看出,仿人機器人在步行時,關(guān)節(jié)角度曲線呈現(xiàn)明顯周期性. 因此,對于步行動作的關(guān)節(jié)角度序列,經(jīng)過1個周期以上的樣本的訓練,在預測時LSTM網(wǎng)絡(luò)可以準確預測生成出多個步態(tài)周期的關(guān)節(jié)角度序列. 除周期性外,關(guān)節(jié)角度序列的前后關(guān)系明顯,在進行預測時也能夠提升網(wǎng)絡(luò)的預測效果,且預測生成的序列利用神經(jīng)網(wǎng)絡(luò)的泛化能力,忽略了在2次測量過渡階段的抖動. 基于以上3點,使用LSTM神經(jīng)網(wǎng)絡(luò)進行關(guān)節(jié)角度序列的預測,可以保證仿人機器人在平地能進行平穩(wěn)、長時間步行.

由1.2節(jié)的內(nèi)容可知,仿人機器人關(guān)節(jié)角度的1維時間序列通過相空間重構(gòu)后得到5維的關(guān)節(jié)角度序列,即2.1節(jié)中時間序列的xt,并結(jié)合步行動作的關(guān)節(jié)角度的目標值即2.1節(jié)中樣本集的真實值yt,構(gòu)成LSTM神經(jīng)網(wǎng)絡(luò)的樣本集,并通過該樣本集訓練仿人機器人步行動作關(guān)節(jié)角度序列預測模型,使之能完成關(guān)節(jié)角度的預測任務(wù).

分別以單層、雙層、三層的LSTM層數(shù)及每層不同的神經(jīng)元的網(wǎng)絡(luò)結(jié)構(gòu)預測仿人機器人步行動作的關(guān)節(jié)角度序列,其實驗結(jié)果如表1所示.

表1 不同結(jié)構(gòu)的LSTM預測仿人機器人步行動作關(guān)節(jié)角度誤差對比

從表1中可以看出,使用LSTM神經(jīng)網(wǎng)絡(luò)預測仿人機器人步行動作關(guān)節(jié)角度序列時,網(wǎng)絡(luò)層數(shù)為2時誤差最小,準確度最高,且隨每層神經(jīng)元數(shù)量的增加,預測精度明顯提高. 但在實驗中發(fā)現(xiàn),在每層神經(jīng)元數(shù)量增加到300及以上時,會出現(xiàn)過擬合現(xiàn)象,見圖6. 因此,仿人機器人步行動作關(guān)節(jié)角度序列預測模型選取的LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為:每層200個神經(jīng)元的兩層網(wǎng)絡(luò).

在每層LSTM層后加入Dropout層有效起到了防止過擬合的作用. 誤差過大會導致各個關(guān)節(jié)角度之間不能協(xié)同動作,導致機器人在步行時出現(xiàn)動作不協(xié)調(diào)、晃動摔倒的現(xiàn)象. 而過擬合則會將樣本集拼接處的特征也學習到,這樣生成的關(guān)節(jié)角度序列就失去了意義(與樣本集拼接的方式無差異).

訓練優(yōu)化算法為Adam算法,它結(jié)合了適應梯度算法(為每一個參數(shù)保留一個學習率)和均方根傳播(將每一個參數(shù)的學習率進行自適應)的特性,計算梯度的指數(shù)移動指數(shù),既控制過擬合現(xiàn)象的發(fā)生又增加網(wǎng)絡(luò)預測序列的準確性. 損失函數(shù)為MSE函數(shù)(均方誤差函數(shù))與權(quán)重衰減項的組合. MSE函數(shù)提高預測的準確性,加入權(quán)重衰減項則是防止了過擬合現(xiàn)象的發(fā)生,其整體結(jié)構(gòu)如圖7所示.

經(jīng)上述過程構(gòu)建出的仿人機器人步行動作關(guān)節(jié)角度預測模型,經(jīng)過示教數(shù)據(jù)的訓練,可準確預測仿人機器人多個步態(tài)周期的步行動作關(guān)節(jié)角度,驅(qū)動仿人機器人完成長期穩(wěn)定的步行動作,實現(xiàn)仿人機器人的步態(tài)循環(huán).

3 實驗和結(jié)果分析

為了驗證上述方法的有效性,設(shè)計實驗步驟和環(huán)境如下:

1)使用Kinect多次采集人體步行動的示教數(shù)據(jù)并利用仿人機器人步態(tài)平衡模型泛化出仿人機器人的步行關(guān)節(jié)角度序列數(shù)據(jù),并將多次采集泛化得到的機器人關(guān)節(jié)角度序列進行拼接和平滑處理,得到各個關(guān)節(jié)角度序列的原始樣本集.

2)使用相空間重構(gòu)的方法對原始樣本集進行進一步預處理,從原始樣本集的1維機器人步行動作的關(guān)節(jié)角度時間序列中提取更多特征值,構(gòu)成最終的樣本集.

3)用樣本集中的5維時間序列(第1列為關(guān)節(jié)角度序列的目標值,其余4列為相空間重構(gòu)后得到的特征值)對搭建好的LSTM神經(jīng)網(wǎng)絡(luò)進行20個時期的訓練,并在訓練完成后,對之后的多個步態(tài)周期的關(guān)節(jié)角度序列進行預測.

4)將本文方法和不經(jīng)過相空間重構(gòu)的方法以及單層LSTM神經(jīng)網(wǎng)絡(luò)、三層神經(jīng)網(wǎng)絡(luò)(多層)的效果進行對比,體現(xiàn)本文方法的優(yōu)越性.

5)使用預測得到的各個關(guān)節(jié)角度的時間序列在WEBOTS仿真平臺中驅(qū)動NAO仿人機器人完成長時間的穩(wěn)定步行,體現(xiàn)本文方法的有效性. 整體結(jié)構(gòu)流程圖如圖8所示.

3.1 用于仿人機器人步行動作關(guān)節(jié)角度序列預測的LSTM神經(jīng)網(wǎng)絡(luò)的訓練與測試

選擇仿人機器人在步行過程中對人體平衡最重要的髖關(guān)節(jié)俯仰角和踝關(guān)節(jié)滾動角作為研究對象,由于人體(仿人機器人同樣)左右對稱因此以左腿髖關(guān)節(jié)俯仰角和左腳踝關(guān)節(jié)滾動角為例. 采集10次的人體步行動作的關(guān)節(jié)角度的時間序列,并通過仿人機器人步態(tài)平衡模型泛化得到仿人機器人步行動作的關(guān)節(jié)角度數(shù)據(jù),經(jīng)拼接和平滑處理后2個關(guān)節(jié)角度各自有500個時間步驟的時間序列作為初始樣本集. 通過1.2節(jié)中所述的相空間重構(gòu)的方法獲取4維的特征值序列(加入關(guān)節(jié)角度目標值序列后共5維),時間延遲τ為4,組成最終的樣本集. 前75%作為訓練集,后25%作為測試集. 對LSTM神經(jīng)網(wǎng)絡(luò)進行訓練,通過20個時期的訓練,以其中1個關(guān)節(jié)角度(左腳踝關(guān)節(jié)滾動角)為例,LSTM神經(jīng)網(wǎng)絡(luò)的均方誤差變化曲線如圖9所示.

經(jīng)過訓練后,利用樣本集中的25%的測試集對LSTM神經(jīng)網(wǎng)絡(luò)的效果進行評估,為了驗證本文方法的優(yōu)越性,使用本文搭建的LSTM神經(jīng)網(wǎng)絡(luò)對原始數(shù)據(jù)集(不經(jīng)過相空間重構(gòu))進行預測,對比2種方法的效果,2種方法的預測效果如表2所示,沒有經(jīng)過相空間重構(gòu)的LSTM神經(jīng)網(wǎng)絡(luò)預測曲線如圖10、11所示,經(jīng)相空間重構(gòu)后的關(guān)節(jié)角度曲線如圖12、13所示.

表2 LSTM預測仿人機器人步行動作關(guān)節(jié)角度誤差

NAO機器人髖關(guān)節(jié)俯仰角變化范圍為-1.770~0.484,踝關(guān)節(jié)滾動角變化范圍為-0.769~0.398. 從表2中可以看出,經(jīng)LSTM神經(jīng)網(wǎng)絡(luò)預測得到多個步態(tài)周期的關(guān)節(jié)角度的時間序列,與沒有經(jīng)過相空間重構(gòu)相比,由于獲取了更多的特征值,均方誤差有了明顯下降,預測精度更高.

從圖10~11可以看出對沒有經(jīng)過相空間重構(gòu)的關(guān)節(jié)角度序列,由于是1維時間序列,預測精度不足,對關(guān)節(jié)角度序列的一些細節(jié)不能很好地學習,而經(jīng)過相空間重構(gòu)后,由于有了更多特征值,對關(guān)節(jié)角度序列的一些細節(jié)也能夠充分學習. 使用LSTM神經(jīng)網(wǎng)絡(luò)預測多個步態(tài)周期的關(guān)節(jié)角度序列,LSTM記憶關(guān)節(jié)角度序列的特性使直接循環(huán)關(guān)節(jié)角度序列所出現(xiàn)2次測量過渡時的起始點非終止點的問題得到解決(預測得到的時間序列不存在拼接處不平滑問題),關(guān)節(jié)角度序列在步態(tài)周期的過渡階段平滑連接,使仿人機器人在長時間的步行動作中不會出現(xiàn)晃動或摔倒的問題.

與傳統(tǒng)的基于人體示教數(shù)據(jù)的仿人機器人步態(tài)規(guī)劃算法[16]相比,本文提出的基于LSTM神經(jīng)網(wǎng)絡(luò)的仿人機器人循環(huán)步態(tài)生成方法能有效增加機器人模仿人體步行動作的周期數(shù),且不會出現(xiàn)直接循環(huán)單次采集的人體示教數(shù)據(jù)產(chǎn)生的拼接處不平滑的問題(如圖12、13所示). 從而保證機器人能夠完成長時間穩(wěn)定步行的任務(wù).

3.2 WEBOTS平臺下的仿人機器人步行仿真

為了驗證本文方法的有效性,使用上述方法得到的各個關(guān)節(jié)角度的時間序列(主要為下肢的10個關(guān)節(jié)角度,左右腿各5個分別為:膝關(guān)節(jié)俯仰角,踝關(guān)節(jié)俯仰角和滾動角,髖關(guān)節(jié)俯仰角和滾動角)去驅(qū)動WEBOTS仿真平臺中的NAO機器人使其進行長時間的步行動作,其零力矩點信息(判定機器人是否動態(tài)穩(wěn)定的判據(jù))如圖14所示,其動作姿態(tài)如圖15、16所示.

從NAO機器人的姿態(tài)可以看出,NAO機器人在長時間的步行過程中,機器人姿態(tài)穩(wěn)定,不會出現(xiàn)晃動或摔倒的情況,使用本文方法預測得到仿人機器人步行動作的關(guān)節(jié)角度的時間序列能有效地驅(qū)動NAO機器人進行長時間穩(wěn)定步行動作.

4 結(jié)論

1) 通過相空間重構(gòu)對多次采集的人體步行動作關(guān)節(jié)角度序列(經(jīng)過仿人機器人步態(tài)平衡模型泛化得到仿人機器人的關(guān)節(jié)角度序列)處理,得到仿人機器人完成步行動作時關(guān)節(jié)角度時間序列的更多特征值.

2) 使用雙層LSTM神經(jīng)網(wǎng)絡(luò)(每層200個神經(jīng)元)進行預測,可以得到多個步態(tài)周期的關(guān)節(jié)角度的時間序列,解決了由于Kinect攝影機視野限制導致的、仿人機器人不能模仿人體完成長時間穩(wěn)定步行動作任務(wù)的問題.

3) 通過對比經(jīng)過相空間重構(gòu)和不經(jīng)過相空間重構(gòu)的樣本集進行預測的效果以及使用預測得到的機器人關(guān)節(jié)序列在WEBOTS平臺上驅(qū)動NAO機器人,觀察其運動效果,驗證本文方法的有效性和優(yōu)越性.

4) 下一步的工作希望利用LSTM聯(lián)合多個序列聯(lián)合分類學習的功能[17],對多種步態(tài)示教動作的各個關(guān)節(jié)角度信息進行聯(lián)合學習,進行分類以及模仿完成各種步態(tài)的長時間穩(wěn)定步行以完善仿人機器人對人體步行動作的學習任務(wù)[18-19].

猜你喜歡
步態(tài)步行神經(jīng)網(wǎng)絡(luò)
基于步態(tài)參數(shù)分析的老年跌倒人群步態(tài)特征研究
基于神經(jīng)網(wǎng)絡(luò)的船舶電力系統(tǒng)故障診斷方法
特別策劃《步態(tài)分析研究綜述》
魔方小區(qū)
MIV-PSO-BP神經(jīng)網(wǎng)絡(luò)用戶熱負荷預測
基于改進Hopfield神經(jīng)網(wǎng)絡(luò)的對地攻擊型無人機自主能力評價
步行回家
基于神經(jīng)網(wǎng)絡(luò)的中小學生情感分析
步態(tài)識人
玛沁县| 株洲县| 临泽县| 湾仔区| 洪江市| 锡林浩特市| 太原市| 革吉县| 建湖县| 锦屏县| 齐齐哈尔市| 龙陵县| 道真| 平潭县| 弥渡县| 太白县| 石屏县| 始兴县| 新化县| 宁都县| 临海市| 大同县| 万全县| 康定县| 咸宁市| 浙江省| 博乐市| 随州市| 鄯善县| 犍为县| 天气| 金溪县| 洛浦县| 云霄县| 清涧县| 西丰县| 淮滨县| 安仁县| 赣榆县| 额敏县| 邛崃市|