呂亞輝, 嚴雨靈
(上海工程技術大學 航空運輸學院, 上海 201620)
隨著機器人人機交互技術的發(fā)展,通過手勢來控制機器人運行已經(jīng)可以實現(xiàn),相比于人工編程控制機器人,使用自然手勢對工業(yè)機器人進行示教可以降低對操作人員的要求,不需要機器人編程的知識也可以完成對機器人的控制與示教。如蔣穗峰[1]等用稀疏自編碼網(wǎng)絡與Softmax分類器結合的方法對手勢圖像進行識別,過程包含預訓練和微調,操作員可以在不佩戴任何設備、任意位置和環(huán)境下都可分割出手勢圖像。陳暢[2]等使用Leap Motion傳感器獲取手勢坐標動態(tài),以使機器人運動,實現(xiàn)移動、抓取和放置等動作。
為實現(xiàn)手勢軌跡控制機器人,需要處理離散性較大的初始軌跡路徑,降低沖擊提高效率和穩(wěn)定性,對于需要機器人進行重復性的工作時更需要對機器人路徑進行優(yōu)化。如付榮等[3]使用遺傳算法進行時間最優(yōu)軌跡規(guī)劃,使用2個適應度函數(shù)尋找最優(yōu)3-5-3插值多項式,得到了時間最優(yōu)的軌跡。但是該方法并未考慮沖擊,其結果中可以發(fā)現(xiàn)加加速度有很大突變,具有較大的沖擊,不僅對機器人的工作精度有影響,還會縮短使用壽命[4]。為了解決這種問題,文獻[5]中進行最優(yōu)沖擊軌跡規(guī)劃,采用S型曲線對B樣條進行插補,沖擊明顯減小。除此之外為了在要求運動穩(wěn)定性的前提下尋找最優(yōu)時間軌跡,Lin[6]使用PSO算法和類聚合算法在關節(jié)空間進行規(guī)劃,通過優(yōu)化軌跡中所安插的節(jié)點求得最優(yōu)沖擊軌跡。
本文針對工業(yè)機器人的沖擊優(yōu)化問題,在獲取初始手勢軌跡后,進行濾波去噪,之后根據(jù)需要選擇關鍵點,以Z型路徑為例,根據(jù)其曲率特征選取4個關鍵點,使用粒子群算法對原手勢軌跡進行沖擊優(yōu)化。獲得了在機器人關節(jié)空間約束范圍內的沖擊優(yōu)化軌跡,并在Epson機器人上進行實驗,結果表明,沖擊優(yōu)化軌跡比原手勢軌跡運行時間短且沖擊力小。
完整手勢識別包括對手勢的初始分割、跟蹤、手勢分析與理解,為實現(xiàn)手勢的人機交互需要對手勢進行理解及控制反饋[7],對手勢分割進行識別匹配,根據(jù)不同的手勢匹配不同的機器人動作,跟蹤手勢軌跡,并對機器人進行控制。
本文使用手勢識別設備跟蹤手勢軌跡以獲取軌跡信息,即使用Leap Motion設備的手勢提取。為研究工業(yè)機器人跟蹤手勢的軌跡問題,僅提取手勢中的食指坐標信息,本文中以食指隨機走Z字型為例(由于手勢提取設備由下而上采取,坐標為鏡面相反關系),其所提取路徑凸顯如圖1所示。圖中反Z字型與原手勢橫坐標相反成鏡面反射,且該Z型軌跡上存在微小偏移,手指運動中即使無意,手勢軌跡也會出現(xiàn)顫抖。
圖1 手勢軌跡坐標
為了將手勢提取軌跡應用于工業(yè)機器人,需要對路徑進行濾波去噪平滑,根據(jù)手勢速度及采點速度確定中值及均值濾波的范圍空間,文中取各點上下相鄰5個數(shù)的中值或均值。如圖2、圖3所示,分別為均值濾波和中值濾波去噪后的結果,由圖2中可知中值濾波取相鄰數(shù)的中值在大部分位置去噪平滑時能一定程度保留原軌跡信息,但在拐點處處理不如均值濾波。均值濾波在其它位置匹配度不如中值濾波,兩者均僅處理相近點的去噪不能對整體Z型軌跡平滑。
上節(jié)對手勢軌跡進行了去噪優(yōu)化,但若應用在高速且重復運行的工業(yè)機器人上,為降低沖擊力及其產生的磨損,需要對上節(jié)所得軌跡選取關鍵點,并在6軸機器人關節(jié)空間進行時間-沖擊最優(yōu)軌跡規(guī)劃。對于不同的生產方案擁有不同的軌跡路徑,選擇沖擊優(yōu)化的關鍵點也不同,本文以Z型軌跡為例進行沖擊優(yōu)化,至少選取起點、終點及2處拐點4處關鍵點,實際工業(yè)生產中應隨必經(jīng)關鍵點位置數(shù)量決定。
圖2 中值濾波處理
圖3 均值濾波處理
為實現(xiàn)關節(jié)空間時間-沖擊最優(yōu)軌跡規(guī)劃,以選取4處特征點為例。曲線擬合法和離散結構法是提取離散曲線特征點的常用方法。前者通過對給定點擬合近似函數(shù),再估算給定點的幾何特征;后者直接運用微分幾何理論,計算離散點幾何特征。本文采用第二種方法來提取離散空間曲線的幾何特征。對于文中非閉合曲線,首末2點必須被選取為特征點,設置曲率閾值,將所有點中曲率大于設定閾值的點選取為特征點。2拐點由去噪后的手勢軌跡曲線為基礎,以公式(1)獲取曲線中曲率最大的2處拐點。
(1)
其中,y′、y″分別為基于離散點序號的各對應坐標關系的一階導數(shù)和二階導數(shù),其對所有離散點計算得,在287個離散點中獲取第84點和第191點2處特征點,結合首末2點,對此4處關鍵點進行關節(jié)空間沖擊優(yōu)化,即取坐標(-175,-117,0),(37,-136,0),(-212,6,0),(64,-16,0)。4點位置以Epson C3機器人為例,對其逆運動學求解,獲得4點處6軸角度見表1。其中,第四軸主要控制繞Z軸旋轉,Z型軌跡未涉及,故均為起點0。對于關節(jié)空間沖擊最優(yōu),即對關節(jié)軸的沖擊力優(yōu)化。
表1 關節(jié)空間坐標點
為實現(xiàn)手勢軌跡沖擊優(yōu)化,本文采用5-5-5插值多項式曲線。付榮[2]等使用3-5-3多項式插值曲線對時間最優(yōu)軌跡規(guī)劃,但其兩段時間相連接處的沖擊未考慮在內,為對原軌跡進行沖擊優(yōu)化,本文構造5-5-5插值多項式,其中5次多項式可以保證軌跡連接處的加速度連續(xù),其多項式通式為:
Xi1=ai6+ai5t1+ai4t12+ai3t13+ai2t14+ai1t15
(2)
Xi2=ai12+ai11t2+ai10t22+ai9t23+ai8t24+ai7t25
(3)
Xi3=ai18+ai17t3+ai16t32+ai15t33+ai14t34+ai13t35
(4)
其中Xij為第i個軸的第j段的角度,在點對點的軌跡規(guī)劃中起點和終點的角度、角速度、角加速度已知,且路徑點Xi20、Xi30已知,則可根據(jù)時間t1、t2、t3獲得多項式系數(shù),并由角度位移的5次多項式求導計算該段時間內的速度、加速度和加加速度。根據(jù)每段時間段的對應關系則可有下列矩陣與系數(shù)a的關系式,如公式(5)~(7)所示:
(5)
(6)
A*a=b
(7)
其中,a為5次多項式系數(shù),r0、r1、r2、r3分別為該軸起點、第一點、第二點、終點的角度,由于矩陣的特性要求每步運算時需要考慮矩陣A的可逆性。
為尋找最優(yōu)時間-沖擊軌跡規(guī)劃,Gasparetto等[3]給予每個優(yōu)化目標相應的權重,將其轉化為單目標。通過調整時間、沖擊2個優(yōu)化目標的權重,獲得了保證沖擊較小的同時也保證了速度的提高,運動時間有較大縮短。文獻[8]中將時間、加速度和沖擊作為對象進行混合最優(yōu)軌跡規(guī)劃。本文對粒子的加加速度與最大加加速度約束的差值加權,并與總時間求和作為適應度函數(shù),如公式(8)所示:
f1=Wt(t1+t2+t3)+Wv*|Vmax-maxVi|+
Wa*|amax-maxa|+Wj*|jmax-maxj|
(8)
而當該次迭代的全局最優(yōu)解不滿足約束,則需對該單維時間段進行修正調整,以滿足約束條件的最短時間為全局最優(yōu)解而進入下次迭代,其修正函數(shù)如公式(9)所示:
f2=Wt*(t1+t2+t3)+Wv*|maxVi|+
Wa*|maxa|+Wj*|maxj|
(9)
粒子群優(yōu)化算法是一種基于群體智能的全局進化優(yōu)化算法,模擬鳥群覓食行為,種群個體之間通過相互協(xié)作來尋求最優(yōu)解,每個優(yōu)化問題的潛在解都是搜索空間中的一個粒子。每個粒子具有位置和速度2個特征,粒子的位置坐標對應的目標函數(shù)值即可作為該粒子的適應度,算法通過適應度來衡量粒子的優(yōu)劣。在每一次迭代中,粒子通過跟蹤2個“極值”來更新自己。第一個極值就是粒子本身所找到的最優(yōu)解,叫做個體極值pBest;另一個極值是整個種群目前找到的最優(yōu)解,這個極值是全局極值gBest。在找到這2個最優(yōu)值時,粒子根據(jù)公式(10)~(11)更新速度和位置:
vt+1=W*vt+C1*rand*(pbestt-xt)+
C2*rand*(gbestt-xt)
(10)
xt+1=xt+vt+1
(11)
其中,W為慣性權重,是上次粒子速度對此次粒子速度的影響程度。Kennedy提出作為收縮因子,使其隨迭代減小粒子震蕩,從而加快收斂速度。對于慣性權重,本文采用隨迭代次數(shù)而自適應變化的時變權重如公式(12)所示:
(12)
其中,i為當前迭代次數(shù),T為總迭代次數(shù),當k>1時,慣性權重隨迭代次數(shù)由1降為0.3,且前期降低較慢,即慣性權重在迭代前期受上次粒子速度影響較大,而在迭代后期影響程度迅速減小,可在一定程度防止粒子群過早收斂,且不影響迭代后期的搜索精度。 具體算法流程如下:
(1)初始化粒子。設定粒子數(shù)和其維數(shù),粒子以3段時間t組成三維粒子;
(2)計算粒子的適應度。根據(jù)粒子的3段時間帶入式(5)~(7)可求出系數(shù)向量a,并由此帶入式(2)~(4)分別求出3段時間內的最大速度、最大加速度、最大加加速度,以式(8)為適應度函數(shù)求取個體極值pBest和全局極值gBest;
(3)判斷全局最優(yōu)解是否超出最大約束,若未超出最大約束,則以式(8)為適應度函數(shù)對3段時間以進行迭代,求得新的粒子,并對所得結果與原粒子群所得結果的適應度值進行比較。選取適應度值較低的為當前迭代所得粒子群;若超出最大約束,則對超出的該單維時間段進行以式(9)為適應度函數(shù)迭代選取新的滿足約束的全局最優(yōu)解;
(4)判斷是否達到終止條件,若否,則返回(2);
(5)以滿足pipper準則的機器人為例,前3軸可確定機械手末端位置,則根據(jù)路徑規(guī)劃是否有姿態(tài)變化選擇6軸角度或3軸角度優(yōu)化,并分別對所需求解的6個軸或3個軸求取最優(yōu)解,并選取每段時間的最大值作為最終最優(yōu)時間,以最終3段時間帶入各軸軌跡點要求內,求得最優(yōu)軌跡。
選取工業(yè)機器人其中第一關節(jié)軸為例,使用粒子群算法對該組關鍵點進行最優(yōu)時間-沖擊規(guī)劃,其迭代過程如圖4 所示。就其迭代效果對比可發(fā)現(xiàn),自適應粒子群算法相比于一般粒子群算法全局搜索更快,且不影響最終搜索精度。
圖4 迭代收斂效果
將PSO算法應用于機器人6軸關節(jié)上,以加速度為10 m/s2、加加速度為50 m/s3為約束,分別求得6軸3段最優(yōu)時間,每段時間選取6軸中最長時間,獲得3段時間:0.842 0 s、0.710 1 s、1.234 8 s,總時間2.786 9 s。并以公式(2)~(3)對該3段時間對6軸求得最終軌跡,得迭代效果如圖5所示,其中角度以弧度為單位表示。
由圖中可知,第三個關鍵點處加加速度有突變,但大小均未超過30 rad/s3,沖擊較小。其最終優(yōu)化結果軌跡如圖6所示,其中Z軸存在0.2 mm波動,屬于空間曲線。
(a) 角度曲線
(b) 角速度曲線
(c) 角加速度曲線
(d) 角加加速度曲線
Fig.5Optimalcurveofangle,velocity,accelerationandjerkunderthesix-axisconstraintoftherobot
圖6 最終沖擊優(yōu)化軌跡
為降低工業(yè)機器人重復生產行為的沖擊和磨損、簡化機器人沖擊優(yōu)化軌跡的編程,本文通過Leap Motion獲取手勢坐標信息,在使用均值濾波和中值濾波對原離散軌跡進行去噪平滑后,以曲率選取的關鍵點為例,使用粒子群算法進行關節(jié)空間時間-沖擊最優(yōu)軌跡規(guī)劃。結果表明,優(yōu)化后的軌跡在不影響時間的情況下,大幅降低了機器人運動的沖擊力。對于本文中自適應的粒子群優(yōu)化算法,相比于一般粒子群優(yōu)化算法,在不影響搜索精度和全局性的情況下,前期搜索速度更快。