国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于神經(jīng)網(wǎng)絡(luò)參數(shù)自學(xué)習(xí)的阻抗控制*

2024-01-27 06:43:36黨選舉袁以坤
關(guān)鍵詞:穩(wěn)態(tài)阻尼神經(jīng)網(wǎng)絡(luò)

黨選舉,袁以坤

(桂林電子科技大學(xué)電子工程與自動化學(xué)院,桂林 541004)

0 引言

隨著電子信息技術(shù)的發(fā)展,機(jī)器人被廣泛用于各種重復(fù)性高的作業(yè)場景。如基于力控制的機(jī)器人打磨,其具有高效性、高精度、穩(wěn)定性好、安全性高等特點(diǎn)[1]。對于機(jī)器人的力控制,普遍采用阻抗控制方法。阻抗控制將機(jī)器人末端與環(huán)境之間的力與位置聯(lián)系起來,通過末端的作用力反饋調(diào)整末端位置實(shí)現(xiàn)力的控制[2-3]。傳統(tǒng)的阻抗控制在剛度固定的平面環(huán)境下效果顯著,但對于剛度變化和環(huán)境位置未知的情況效果不理想。

為了能夠讓阻抗控制能夠適應(yīng)復(fù)雜未知的環(huán)境,國內(nèi)外學(xué)者一直致力于阻抗控制的改進(jìn)研究。WEI等[4]考慮到機(jī)器人末端位移的誤差對力的影響,基于模型自適應(yīng)的方法補(bǔ)償末端位置,從而實(shí)時(shí)調(diào)整末端位置以實(shí)現(xiàn)恒力的控制,但它需要調(diào)整的參數(shù)過多,參數(shù)的選取是否合適對于系統(tǒng)的影響很大。李德昀等[5]引入自適應(yīng)模糊滑??刂破餮a(bǔ)償時(shí)間延時(shí)估計(jì)產(chǎn)生的估計(jì)誤差,抵消動力學(xué)模型中的非線性因子和不確定因素對系統(tǒng)的干擾。XU等[6]提出了一種基于動態(tài)神經(jīng)網(wǎng)絡(luò)的自適應(yīng)阻抗控制方法,用于多物理約束下的冗余機(jī)器人,為了在環(huán)境模型未知的情況下提供最佳接觸性能,提出了一種自適應(yīng)阻抗學(xué)習(xí)方法,以實(shí)現(xiàn)機(jī)器人與環(huán)境之間的最佳交互。LORIS等[7]基于阻抗控制方法,設(shè)計(jì)了一種模型預(yù)測控制器,利用Q學(xué)習(xí)方法對于模型預(yù)測控制器求解,然后在線優(yōu)化阻抗參數(shù)。張世玉等[8]提出一種改進(jìn)型自抗擾阻抗控制策略。該策略通過自抗擾控制器生成新期望力,調(diào)整機(jī)器人末端工具坐標(biāo)系的位置,實(shí)現(xiàn)精確的力跟蹤。

上述文獻(xiàn)從參考位置誤差、時(shí)間延時(shí)產(chǎn)生的誤差、阻抗參數(shù)不合適、期望力誤差等方面對傳統(tǒng)阻抗控制方法進(jìn)行改進(jìn),實(shí)現(xiàn)了對力的控制,但設(shè)計(jì)的方法,在控制系統(tǒng)的動態(tài)性能,有待進(jìn)一步提高。本文在自適應(yīng)阻抗控制的基礎(chǔ)上,設(shè)計(jì)了調(diào)節(jié)參數(shù)神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的阻抗控制算法,通過機(jī)器人末端力反饋信息,結(jié)合神經(jīng)網(wǎng)絡(luò)在線學(xué)習(xí),實(shí)時(shí)最優(yōu)阻尼參數(shù),適應(yīng)復(fù)雜未知的接觸環(huán)境,實(shí)現(xiàn)了打磨過程中力的有效控制。

1 阻抗控制系統(tǒng)分析

1.1 機(jī)器人環(huán)境動力學(xué)模型

為了研究整個(gè)打磨系統(tǒng),需將機(jī)器人與環(huán)境看作一個(gè)動態(tài)系統(tǒng)來建模分析。一般情況下,工具末端與打磨器件的環(huán)境動力學(xué)模型可以表示為:

(1)

式中:Fe表示工件與機(jī)器人末端的作用力,Be、Ke分別表示環(huán)境的阻尼和剛度參數(shù),X和Xe分別表示工具的實(shí)際位置和環(huán)境表面的位置。

由于機(jī)器人末端移動速度緩慢,環(huán)境模型可以簡化為“彈簧”模型,該模型由機(jī)器人末端、環(huán)境位移和環(huán)境接觸面的作用力之間的關(guān)系表示:

(2)

1.2 阻抗控制誤差分析

阻抗控制是建立接觸力和位置的動態(tài)關(guān)系模型,并通過調(diào)節(jié)阻抗模型參數(shù)改變其動態(tài)特性,確保機(jī)器人在環(huán)境中能夠表現(xiàn)出良好的柔順性。阻抗控制可以看作是質(zhì)量-阻尼-彈簧模型:

(3)

式中:Xe為環(huán)境位置,X為機(jī)械臂末端實(shí)際位置,Md、Bd、Kd分別代表目標(biāo)阻抗模型的慣性、阻尼和剛度,Fe為末端接觸力,Fd為期望力。阻抗控制框圖如圖1所示。

圖1 阻抗控制框圖

為了簡化后續(xù)計(jì)算,對式(3)進(jìn)行拉普拉斯變換得出式(4)。

(4)

假設(shè)機(jī)械臂在工作過程中,忽略機(jī)器人內(nèi)環(huán)位置控制對于系統(tǒng)的影響,計(jì)算機(jī)械臂末端實(shí)際力與期望力之間的差值ef,則:

ef=Fd-Ke(X-Xe)=Fd+KeXe-Ke[Xd+h(s)ef]

(5)

將式(5)進(jìn)一步化簡:

(6)

當(dāng)機(jī)械臂在穩(wěn)定狀態(tài)下運(yùn)行時(shí),速度和加速度的大小均看成0,由此可得機(jī)械臂末端接觸力跟蹤的穩(wěn)態(tài)誤差為:

(7)

式中:keq目標(biāo)阻抗和環(huán)境的等效剛度參數(shù)。

(8)

則可知機(jī)械臂與環(huán)境的實(shí)際接觸力的大小為:

(9)

由上式可知,機(jī)械臂末端的實(shí)際接觸力大小F是參考軌跡Xd和期望接觸力Fd的函數(shù)。當(dāng)參考軌跡Xd滿足如下表達(dá)式:

(10)

從式(10)可知,當(dāng)接觸力穩(wěn)態(tài)誤差ess=0時(shí),需準(zhǔn)確獲得接觸面的環(huán)境位置Xe和剛度大小Ke,進(jìn)而計(jì)算出參考軌跡Xd。

但在實(shí)際打磨加工過程中,工件的剛度和環(huán)境位置難以精確獲取,得到的實(shí)際接觸力并非期望接觸力,因此需要進(jìn)行位置調(diào)節(jié)。機(jī)械臂在實(shí)際打磨加工過程中,被加工工件的剛度一般較大,較小的位置誤差也會帶來較大的接觸力穩(wěn)態(tài)誤差,并且加工環(huán)境一般都是未知可變的,實(shí)際接觸力難以精確跟蹤期望接觸力,這將直接影響打磨效果。

為了解決在未知環(huán)境下,環(huán)境參數(shù)變化引起的打磨力精度問題,通過構(gòu)造神經(jīng)網(wǎng)絡(luò)自適應(yīng)地修正參數(shù),實(shí)時(shí)跟蹤環(huán)境剛度變化和位置變化,實(shí)現(xiàn)對期望力的精準(zhǔn)控制。

2 基于神經(jīng)網(wǎng)絡(luò)參數(shù)自學(xué)習(xí)的阻抗控制

2.1 阻尼自適應(yīng)的阻抗控制

阻抗控制中可以通過調(diào)整慣性、阻尼、剛度參數(shù)使機(jī)器人適應(yīng)環(huán)境參數(shù),由于固定的參數(shù)只能適用于一種固定環(huán)境,對于剛度變化或復(fù)雜曲面環(huán)境力誤差大跟蹤能力差。動態(tài)的調(diào)整阻抗控制參數(shù)可以使機(jī)器人的動態(tài)特性適應(yīng)環(huán)境的變化,保證系統(tǒng)的穩(wěn)定性和減小穩(wěn)態(tài)誤差。WEI等[9]采用阻尼自適應(yīng)阻抗控制,基于參考模型自適應(yīng)得出李雅普諾夫函數(shù),通過穩(wěn)定性證明得出阻尼補(bǔ)償量ΔB(t)與ΔX、ΔF的函數(shù)關(guān)系。

(11)

阻尼自適應(yīng)的阻抗控制相比傳統(tǒng)的阻抗控制性能有所提高,但是對于曲面環(huán)境的收斂能力還是不足并且超調(diào)過大。

2.2 基于神經(jīng)網(wǎng)絡(luò)參數(shù)自學(xué)習(xí)的阻抗控制

式(11)揭示阻尼參數(shù)受多因素及多因素組合影響,表現(xiàn)出阻尼與多因素特征之間的關(guān)系。

將式(11)化簡得:

(12)

式中:ω1、ω2、ω3、ω4為調(diào)節(jié)參數(shù)。

根據(jù)式(12),本文基于影響阻尼補(bǔ)償?shù)亩喾N因素構(gòu)建調(diào)節(jié)參數(shù)神經(jīng)網(wǎng)絡(luò),通過神經(jīng)網(wǎng)絡(luò)在線學(xué)習(xí)式(12)中的調(diào)節(jié)參數(shù),使得阻尼補(bǔ)償參數(shù)達(dá)到最優(yōu),從而使阻尼參數(shù)在不同打磨環(huán)境下保持最優(yōu),其中激勵(lì)函數(shù)反映了阻尼變化多因素特征,結(jié)構(gòu)如圖2所示。選取神經(jīng)網(wǎng)絡(luò)的多個(gè)激勵(lì)函數(shù)如式(13)所示。

圖2 阻尼自適應(yīng)中用于調(diào)節(jié)參數(shù)神經(jīng)網(wǎng)絡(luò)

(13)

圖2中3層神經(jīng)網(wǎng)絡(luò)由輸入層、中間層、輸出層構(gòu)成,將影響阻尼補(bǔ)償?shù)囊蛩卦O(shè)置為激活函數(shù),調(diào)節(jié)參數(shù)為權(quán)重,通過神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)調(diào)整權(quán)重,該神經(jīng)網(wǎng)絡(luò)的前向傳播為式(12)。

將神經(jīng)網(wǎng)絡(luò)的性能指標(biāo)函數(shù)設(shè)置為:

(14)

基于梯度下降法,由于每個(gè)權(quán)重在整個(gè)系統(tǒng)中的占比不同,其重要程度不同。本文采用了獨(dú)立設(shè)置學(xué)習(xí)率的方法,在每個(gè)權(quán)重調(diào)整中設(shè)置單獨(dú)的學(xué)習(xí)率參數(shù)更新為:

(15)

式中:η為學(xué)習(xí)率,α為動量因子。

整體的系統(tǒng)框圖如圖3所示,將當(dāng)前位置和速度信息作為神經(jīng)網(wǎng)絡(luò)輸入信號,神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)計(jì)算出的阻抗參數(shù)傳入阻抗控制器,進(jìn)而計(jì)算出末端位置增量,通過位置到力的變換,實(shí)現(xiàn)對于力的控制。

圖3 調(diào)節(jié)參數(shù)神經(jīng)網(wǎng)絡(luò)系統(tǒng)框圖

3 仿真驗(yàn)證

在仿真實(shí)驗(yàn)中,只需要考慮末端位置與力的關(guān)系,將六自由度機(jī)器人簡化為二自由度[10]如圖4所示。

圖4 二自由度機(jī)器人與環(huán)境接觸模型

采用文獻(xiàn)[11]中的機(jī)器人模型,其中,取l1和l2為1 m,m1=10 kg,m2=5 kg。位置環(huán)PID控制的比例參數(shù)kp=85 000,積分參數(shù)ki=120和微分參數(shù)kd=85。設(shè)置初始參考位置為0.866 m,在各個(gè)環(huán)境中設(shè)置阻抗參數(shù)的初始值均為Md=[1 1]Bd=[90 90]Kd=[50 50]。本文提出的神經(jīng)網(wǎng)絡(luò)參數(shù)自學(xué)習(xí)算法中的學(xué)習(xí)率η在以下范圍內(nèi)選取都能實(shí)現(xiàn)未知環(huán)境下力的有效跟蹤,η1∈[0.3,0.5],η2∈[0.3,0.5],η3∈[0.2,0.4],η4∈[0.6,0.9]。本次仿真設(shè)置學(xué)習(xí)率為η=[0.5 0.5 0.35 0.9],動量因子α=0.5。

為了與經(jīng)典的阻抗控制,甘亞輝等[10]提出的自適應(yīng)變阻抗控制對比,通過恒力跟蹤仿真實(shí)驗(yàn)和動態(tài)力跟蹤仿真實(shí)驗(yàn),驗(yàn)證本文所提的調(diào)節(jié)參數(shù)神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的阻抗控制在不同環(huán)境下的力跟蹤能力。

3.1 恒力跟蹤仿真實(shí)驗(yàn)

恒力跟蹤仿真實(shí)驗(yàn)?zāi)M多種不同環(huán)境,分別是環(huán)境剛度突變的平面、環(huán)境剛度固定的斜面、環(huán)境剛度固定的曲面、環(huán)境剛度突變的曲面及剛度動態(tài)變化的曲面環(huán)境。設(shè)置期望力Fd=30 N。

(1)在接觸面為平面環(huán)境下,驗(yàn)證在剛度突變時(shí),所提出的算法是否具有魯棒性,Ke的變化如式(16)所示。

(16)

測試結(jié)果如圖5所示,圖中顯示各控制算法的力跟蹤效果。從圖中得知,傳統(tǒng)的阻抗控制和自適應(yīng)阻抗控制的超調(diào)太大,并且存在一定的穩(wěn)態(tài)誤差,本文提出的算法超調(diào)明顯降低,穩(wěn)態(tài)誤差明顯減小。

(a) 環(huán)境剛度突變接觸面為平面的力跟蹤效果 (b) 環(huán)境剛度為6000 N/m時(shí)力跟蹤效果

(2)在接觸面為斜面的環(huán)境下,剛度Ke=8000 N/m,驗(yàn)證效果如圖6所示。從圖中可以看出本文提出的算法超調(diào)小,無穩(wěn)態(tài)誤差。

圖6 剛度固定接觸面為斜面的力跟蹤效果

(3)在接觸面為曲面環(huán)境下,剛度固定Ke=8000 N/m,測試結(jié)果如圖7所示。從圖中得知,傳統(tǒng)的阻抗控制和自適應(yīng)控制都有不小的超調(diào),并且有明顯的穩(wěn)態(tài)誤差。

圖7 剛度固定接觸面為曲面的力跟蹤效果 圖8 環(huán)境剛度接觸面同時(shí)變化時(shí)力的跟蹤效果

(4)在接觸面和剛度同時(shí)正弦變化的環(huán)境下,力跟蹤效果圖如圖8所示。

圖8中傳統(tǒng)阻抗控制方法和自適應(yīng)阻抗控制方法的超調(diào)都過大,有明顯穩(wěn)態(tài)誤差。

由上述實(shí)驗(yàn)可得出如下結(jié)論:對于剛度固定的平面環(huán)境,傳統(tǒng)阻抗控制和自適應(yīng)控制都能夠達(dá)到預(yù)期的力跟蹤效果,但是超調(diào)都過大。對于斜面或是更為復(fù)雜的曲面而言,傳統(tǒng)阻抗控制和自適應(yīng)阻抗控制都存在一定的穩(wěn)態(tài)誤差,并且在控制過程中超調(diào)過大。而本文提出的控制方法,在這些環(huán)境中都可以達(dá)到預(yù)期的控制效果實(shí)現(xiàn)柔順控制。具體參數(shù)比較如表1所示。表中σ為超調(diào)量,ess為穩(wěn)態(tài)誤差,單位N。

表1 各種算法在不同接觸環(huán)境下的恒力跟蹤效果

通過數(shù)值比較,本文提出的算法相比傳統(tǒng)阻抗控制,在剛度突變的平面環(huán)境穩(wěn)態(tài)誤差降低了99.23%,動態(tài)性能超調(diào)量下降了13.22%,剛度固定斜面環(huán)境,穩(wěn)態(tài)誤差下降低了94.03%,超調(diào)量下降了18.62%,剛度固定曲面環(huán)境,穩(wěn)態(tài)誤差下降低了92.87%,超調(diào)量下降了18.95%,剛度接觸面同時(shí)變化環(huán)境,穩(wěn)態(tài)誤差下降低了89.16%,超調(diào)量下降了18.79%。

3.2 動態(tài)力跟蹤仿真實(shí)驗(yàn)

在實(shí)際打磨過程中還存在力變化情況,模擬3種力變化情況,分別是:

(1)期望力突變,初始期望力Fd=30 N,運(yùn)行4 s后期望力突變Fd=40 N。

(2)期望力斜坡增長,Fd=30+2*tN。

(3)期望力正弦變化,Fd=25+5*sin(t) N。

各個(gè)算法在以上環(huán)境中的控制效果如圖9~圖11所示。從圖中得知,傳統(tǒng)阻抗控制和自適應(yīng)阻抗控制在力跟蹤方面都存在不足,系統(tǒng)動態(tài)性能有很大超調(diào)和一定的穩(wěn)態(tài)誤差,相比本文提出的算法超調(diào)小,穩(wěn)態(tài)誤差幾乎為0,力跟蹤能力更優(yōu)。具體參數(shù)如表2所示。

表2 各種算法在動態(tài)期望力下的力跟蹤效果

(a) 固定剛度突變期望力的力跟蹤效果 (b) 期望力30 N力的力跟蹤效果

圖10 固定剛度斜坡期望力的力跟蹤效果 圖11 固定剛度正弦期望力的力跟蹤效果

4 結(jié)論

為了解決工業(yè)機(jī)器人打磨中環(huán)境剛度變化或接觸面未知情況下機(jī)器人難以實(shí)現(xiàn)打磨有效的力跟蹤問題,本文提出了一種控制參數(shù)神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的阻抗控制方法。仿真結(jié)果表明,對剛度變化環(huán)境、環(huán)境位置變化環(huán)境和變力跟蹤等情況,相比于傳統(tǒng)的阻抗控制方法,本文所提出的算法提高了打磨系統(tǒng)的穩(wěn)定性和魯棒性,降低了系統(tǒng)的超調(diào)和穩(wěn)態(tài)誤差,能有效地實(shí)現(xiàn)力控制。

猜你喜歡
穩(wěn)態(tài)阻尼神經(jīng)網(wǎng)絡(luò)
可變速抽水蓄能機(jī)組穩(wěn)態(tài)運(yùn)行特性研究
碳化硅復(fù)合包殼穩(wěn)態(tài)應(yīng)力與失效概率分析
N維不可壓無阻尼Oldroyd-B模型的最優(yōu)衰減
關(guān)于具有阻尼項(xiàng)的擴(kuò)散方程
具有非線性阻尼的Navier-Stokes-Voigt方程的拉回吸引子
電廠熱力系統(tǒng)穩(wěn)態(tài)仿真軟件開發(fā)
煤氣與熱力(2021年4期)2021-06-09 06:16:54
元中期歷史劇對社會穩(wěn)態(tài)的皈依與維護(hù)
中華戲曲(2020年1期)2020-02-12 02:28:18
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
具阻尼項(xiàng)的Boussinesq型方程的長時(shí)間行為
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
嘉义市| 康马县| 东乡| 水城县| 马公市| 曲沃县| 卓资县| 云霄县| 普定县| 湘阴县| 昌邑市| 南江县| 黑龙江省| 陕西省| 姚安县| 卢龙县| 佛坪县| 红桥区| 浦江县| 驻马店市| 富川| 贵溪市| 冕宁县| 昭平县| 博罗县| 同江市| 丰宁| 比如县| 澎湖县| 甘谷县| 邵阳县| 德化县| 通州区| 翁源县| 阿拉善右旗| 库伦旗| 甘肃省| 天镇县| 东兰县| 米易县| 大港区|