国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

輪式機(jī)器人縱向滑移迭代學(xué)習(xí)軌跡跟蹤控制

2022-09-19 01:08游東亞崔立志卜旭輝趙栩楊
電光與控制 2022年9期
關(guān)鍵詞:范數(shù)移動(dòng)機(jī)器人軌跡

游東亞, 崔立志, 卜旭輝, 趙栩楊, 侯 銳

(河南理工大學(xué),河南 焦作 454000)

0 引言

輪式移動(dòng)機(jī)器人的應(yīng)用范圍比較廣泛,相比于其他類型機(jī)器人具有更好的靈活性和較大的活動(dòng)范圍。輪式移動(dòng)機(jī)器人是一個(gè)典型的時(shí)變、強(qiáng)耦合非線性復(fù)雜系統(tǒng),實(shí)現(xiàn)對(duì)其精確和快速的控制是機(jī)器人完成任務(wù)的前提。目前對(duì)于移動(dòng)機(jī)器人控制研究多是假設(shè)滿足車輪“純滾動(dòng)無滑動(dòng)”即完美運(yùn)行狀態(tài),但輪式機(jī)器人在實(shí)際工作中,由于道路濕滑、泥濘或者車輪轉(zhuǎn)彎,很容易產(chǎn)生滑移(包括縱向、橫向滑移)從而嚴(yán)重影響機(jī)器人的控制效果,甚至導(dǎo)致機(jī)器人失控,執(zhí)行任務(wù)失敗,因此研究移動(dòng)機(jī)器人的滑移問題對(duì)提高機(jī)器人控制效果有著重要意義。

當(dāng)前有些文獻(xiàn)針對(duì)機(jī)器人及其滑移問題做出一些研究,文獻(xiàn)[1]借助鏈?zhǔn)较到y(tǒng)理論,將帶有滑移擾動(dòng)的系統(tǒng)運(yùn)動(dòng)模型轉(zhuǎn)化為一個(gè)受擾鏈?zhǔn)侥P?,然后設(shè)計(jì)變結(jié)構(gòu)魯棒控制器;文獻(xiàn)[2]針對(duì)輪式機(jī)器人縱向滑移參數(shù)未知的軌跡跟蹤控制問題設(shè)計(jì)了滑模觀測(cè)器并進(jìn)行估計(jì),通過低通濾波器減少抖振;文獻(xiàn)[3]利用兩個(gè)未知縱向滑移參數(shù)描述機(jī)器人左、右輪的縱向打滑程度,并設(shè)計(jì)自適應(yīng)反饋控制律,應(yīng)用極點(diǎn)配置方法在線調(diào)整控制器增益;文獻(xiàn)[4]研究了未知輪子滑移干擾問題,設(shè)計(jì)了自抗擾反步控制器對(duì)打滑干擾進(jìn)行實(shí)時(shí)估計(jì)與補(bǔ)償;文獻(xiàn)[5-6]針對(duì)多移動(dòng)機(jī)器人編隊(duì)控制問題,分別提出了任意初始條件下的迭代學(xué)習(xí)編隊(duì)控制算法和滑移擾動(dòng)下的自適應(yīng)編隊(duì)控制算法。當(dāng)前移動(dòng)機(jī)器人承擔(dān)較多的是一些重復(fù)性或者不適合人類工作的任務(wù)(如后勤物流、軍事巡邏、外星空間巡視等)。復(fù)雜的工作環(huán)境使得機(jī)器人受到干擾較多。文獻(xiàn)[7-9]提出基于滑模、反步法和自適應(yīng)的機(jī)器人軌跡跟蹤控制;文獻(xiàn)[10-11]提出兩種迭代學(xué)習(xí)魯棒優(yōu)化算法,并應(yīng)用于受擾移動(dòng)機(jī)器人;文獻(xiàn)[12-15]研究機(jī)器人迭代學(xué)習(xí)控制的非完全重復(fù)、輸入受限等問題。

本文針對(duì)移動(dòng)機(jī)器人在縱向滑移干擾下執(zhí)行軌跡跟蹤控制問題,在受到不同的縱向滑移干擾時(shí),對(duì)機(jī)器人系統(tǒng)設(shè)計(jì)采用開閉環(huán)P型迭代學(xué)習(xí)控制器,通過嚴(yán)格證明給出收斂條件,說明在縱向滑移干擾時(shí)仍然保持有效控制,通過實(shí)例仿真證明控制律的有效性。

1 問題描述

常見的輪式移動(dòng)機(jī)器人簡(jiǎn)化模型如圖1所示,其中,(m(t),n(t))為對(duì)應(yīng)t時(shí)刻的機(jī)器人系統(tǒng)參考點(diǎn)的笛卡爾坐標(biāo),θ(t)為航向角。

圖1 輪式機(jī)器人簡(jiǎn)化模型Fig.1 Simplified model of wheeled robot

(1)

當(dāng)僅考慮出現(xiàn)縱向滑移(即車輪線速度大于或等于車體前進(jìn)速度)時(shí),在橫向仍滿足約束

(2)

在執(zhí)行軌跡跟蹤任務(wù)時(shí),不同路況會(huì)遭遇不同的縱向滑移,考慮一般的情況,即η為關(guān)于時(shí)間t的函數(shù)η(t)。左右車輪實(shí)際輸入為ul(t),ur(t)與輸出[v(t)w(t)]T存在以下關(guān)系,即

(3)

結(jié)合式(1)和式(3)得出滑移干擾下移動(dòng)機(jī)器人的離散運(yùn)動(dòng)學(xué)模型為

(4)

式中:Δt為采樣時(shí)間;t∈N,為離散時(shí)間,令

考慮機(jī)器人重復(fù)軌跡跟蹤過程,第k次跟蹤可以表示為

xk(t+1)=xk(t)+h(t)B(xk(t),t)uk(t)

(5)

式中,k∈N+,為跟蹤次數(shù)。

2 控制律設(shè)計(jì)與收斂性分析

2.1 隨時(shí)間變化的滑移擾動(dòng)下的軌跡跟蹤

做出以下定義且系統(tǒng)滿足以下假設(shè)。

假設(shè)1 滑移參數(shù)||h(t)||有界,滿足||h(t)||≤bh,輸入有界||uk(t)||≤bu。

假設(shè)2 每次跟蹤初始狀態(tài)滿足xd(0)=xk(0)。

假設(shè)3 滿足Lipschitz條件(Lipschitz Condition)||B(x1(t),t)-B(x2(t),t)||≤kB||x1(t)-x2(t)||。

假設(shè)4 存在控制輸入ud(t)滿足對(duì)于給定期望軌跡xd(t)有

xd(t+1)=xd(t)+h(t)B(xd(t),t)ud(t)。

(6)

注:假設(shè)1對(duì)滑移參數(shù)有界是系統(tǒng)可控前提,輸入?yún)?shù)進(jìn)行有界,滿足實(shí)際系統(tǒng)要求;假設(shè)2對(duì)初始位置進(jìn)行界定,此條件包含一大類系統(tǒng);假設(shè)3中Lipschitz條件使得系統(tǒng)參數(shù)變化不至于過大;假設(shè)4為受控系統(tǒng)的基本假設(shè),上述對(duì)控制系統(tǒng)的假設(shè)具有合理性。

針對(duì)參數(shù)不確定系統(tǒng)式(5)的特點(diǎn)適合采用無模型控制律,設(shè)計(jì)P型迭代學(xué)習(xí)控制律

uk+1(t)=uk(t)+L(t)δxk(t+1)+Γ(t)δxk+1(t)

(7)

式中,L(t),Γ(t)為適當(dāng)維數(shù)的增益矩陣,滿足||L(t)||≤bL,||Γ(t)||≤bΓ。

收斂性分析如下。

定義1向量函數(shù)Θ:{0,1,2,…,T}的a范數(shù)定義為||Θ||a=(1/a)t||Θ(t)||,1

定義2令δxk(t)=xd(t)-xk(t),δuk(t)=ud(t)-uk(t)分別表示k次跟蹤的狀態(tài)誤差和輸入誤差。

定義3B(xk(t),t)是系統(tǒng)矩陣函數(shù),B(xd(t),t)-B(xk(t),t)記為B(δxk(t)),對(duì)于任意的t∈N+,k∈N+滿足||B(xk(t),t)||≤bB。

定理1對(duì)于系統(tǒng)式(5),采用式(6)的迭代學(xué)習(xí)控制算法,若系統(tǒng)滿足||I-L(t)h(t)B(xk(t),t)||≤ρ<1,I表示單位矩陣,則系統(tǒng)輸入uk(t)與系統(tǒng)狀態(tài)xk(t)隨著跟蹤次數(shù)k的增加收斂于期望值。

證明:

由式(7)和定義2有

δuk+1(t)=δuk(t)-L(t)δxk(t+1)-Γ(t)δxk+1(t)

(8)

由式(6)和定義2取范數(shù)有

||δxk(t+1)||≤δxk(t)+||h(t)||||B(xk(t),t)||·||δuk(t)||+||h(t)||||B(δxk(t))||||ud(t)||

(9)

由式(6)、式(8)和定義2合并取范數(shù)得

||δuk+1(t)||≤||I-L(t)h(t)B(xk(t),t)||||δuk(t)||+||L(t)||||δxk(t)||+||L(t)||||h(t)||·||B(δxk(t),t)||||ud(t)||+||Γ(t)||||δxk+1(t)||

(10)

令||I-L(t)h(t)B(xk(t),t)||≤ρ,利用假設(shè)3由式(10)整理得

||δuk(t+1)||≤ρ||δuk(t)||+bL(1+bhkBbu)·||δxk(t)||+bΓ||δxk+1(t)||

(11)

對(duì)于式(9),由于假設(shè)1有

||δxk(t+1)||≤||δxk(t)||+bhkB||δxk(t)||||uk(t)||+bhbB||δuk(t)||≤(1+bhkBbu)||δxk(t)||+bhbB||δuk(t)||

(12)

令c1=1+bhbukB,利用假設(shè)2由式(12)遞推得

(13)

由式(11)、式(13)得

(14)

式中:c2=bL(1+bhkB·bu);c3=bΓ。

對(duì)式(14)兩邊同時(shí)乘以(1/a)t,令a≥c1>1,取范數(shù)并結(jié)合不等式有

(15)

利用等比數(shù)列求和公式及遞推迭代整理可得

(16)

式中

(17)

同理,對(duì)式(13)取a范數(shù)

(18)

(19)

證畢。

以上證明了在滑移參數(shù)h(t)的影響下,系統(tǒng)狀態(tài)和系統(tǒng)輸入可以收斂到期望值,顯然,當(dāng)h(t)為定常值時(shí)仍然滿足上述證明過程。

2.2 隨迭代次數(shù)變化的滑移擾動(dòng)下的軌跡跟蹤

進(jìn)一步分析當(dāng)?shù)欉^程中滑移參數(shù)隨迭代次數(shù)可變,令hk(t)表示第k次跟蹤t時(shí)刻的滑移參數(shù)。分析此種狀態(tài)下的軌跡跟蹤控制,為了減少設(shè)計(jì)復(fù)雜性采用上文所設(shè)計(jì)的迭代學(xué)習(xí)控制律。系統(tǒng)和理想狀態(tài)表示為

xk(t+1)=xk(t)+hk(t)B(xk(t),t)uk(t)

(20)

xd(t+1)=xd(t)+hk(t)B(xd(t),t)ud(t)

(21)

同理有

δuk+1(t)=[I-L(t)hk(t)B(xk(t),t)]δuk(t)-L(t)[δxk(t)+hk(t)B(δxk(t),t)ud(t)]-Γ(t)δxk+1(t)

(22)

||δxk(t+1)||≤||δxk(t)||+||hk(t)||·||B(xk(t),t)||δuk(t)+||hk(t)||·||B(δxk(t))||||ud(t)||

(23)

由||hk(t)||>≤bh,||B(xk(t),t)||≤bB有

||hk(t)B(xk(t),t)||≤bhbB。

(24)

注:假設(shè)5要求hk(t)B(xk(t),t)隨k→∞而收斂,這一假設(shè)對(duì)hk(t)有了進(jìn)一步限制。

收斂性分析如下。

定理2對(duì)于系統(tǒng)式(20)采用控制律式(7),如果對(duì)于任何一個(gè)給定t∈N存在迭代序列{φs(t):s∈N+}且φ0(t)=0,有0<φs+1(t)-φs(t)≤τ(t),τ(t)∈N。對(duì)于任意s∈N+,滿足

做以下引理[12]。

證明:

利用數(shù)學(xué)歸納法有

3)t+1時(shí),由式(23)有||δxk(t+1)||≤||δxk(t)||

證畢。

與時(shí)間變化的滑移參數(shù)相比,迭代可變滑移參數(shù)要求滿足hk(t)B(xk(t),t)隨k→∞而收斂,從推導(dǎo)過程看仍然可以達(dá)到零跟蹤誤差。

3 仿真實(shí)例

從仿真結(jié)果上看,跟蹤次數(shù)增加,機(jī)器人系統(tǒng)位置和方向角的誤差迅速減小,在迭代至50次時(shí)已經(jīng)基本達(dá)到較低水平,至200次時(shí)已經(jīng)基本收斂于零。

情況1) 機(jī)器人軌跡跟蹤過程滑移參數(shù)取定值,令η(t)=5,仿真結(jié)果如圖2所示。

圖2 滑移參數(shù)為定值時(shí)跟蹤軌跡和誤差曲線Fig.2 Tracking trajectory and error curve when slippage parameter is fixed

情況2) 機(jī)器人軌跡跟蹤過程滑移參數(shù)隨時(shí)間變化令η(t)=0.025t+5,仿真結(jié)果如圖3所示。

圖3 滑移參數(shù)時(shí)間可變,跟蹤軌跡和誤差曲線Fig.3 Tracking trajectory and error curve when slippage parameter is time-variable

情況3) 控制器參數(shù)選擇與情況1),2)相同也滿足定理2,由于要求收斂,軌跡跟蹤滑移參數(shù)取ηk=0.5·e-k+1,仿真結(jié)果如圖4所示。

圖4 滑移參數(shù)迭代可變,迭代200次跟蹤軌跡和誤差曲線Fig.4 Tracking trajectory and error curve after 200 iterations when slippage parameter is iteratively variable

情況4) 為了對(duì)比控制效果,根據(jù)本文建立的機(jī)器人模型,設(shè)計(jì)PID控制器,為了公平起見,采用與迭代學(xué)習(xí)控制相同的采樣率,滑移參數(shù)取定值與情況1)相同,控制參數(shù)設(shè)置為P=1.1,I=0.1,D=0。仿真結(jié)果如圖5所示。

情況5) 采用與迭代學(xué)習(xí)控制相同的采樣率,滑移參數(shù)取隨時(shí)間變化值與情況2)相同,控制參數(shù)設(shè)置為P=0.91,I=0.2,D=0。仿真結(jié)果如圖6所示。

圖6 滑移參數(shù)為時(shí)間可變,PID控制方法的跟蹤軌跡和誤差曲線Fig.6 Tracking trajectory and error curve of PID control method when slippage parameter is time-variable

由圖2-圖4可以看出,在固定滑移率、時(shí)間變化滑移率、迭代變化滑移率3種滑移干擾下移動(dòng)機(jī)器人軌跡跟蹤,雖然誤差在初始狀態(tài)相對(duì)較大,但隨著迭代次數(shù)增加,誤差迅速減小,在迭代200次時(shí),圖2-圖4的坐標(biāo)誤差和角度誤差分別達(dá)到0.2 m,0.1 rad以下,隨著迭代次數(shù)增加,誤差會(huì)持續(xù)趨近于零,從軌跡圖上來看完成了軌跡跟蹤任務(wù)。根據(jù)本文建立的滑移狀態(tài)下的機(jī)器人模型,設(shè)計(jì)PID控制策略,在相同的滑移參數(shù)下進(jìn)行仿真,由于PID控制方法沒有學(xué)習(xí)能力,所以本文選擇跟蹤一次,仍然可以與之對(duì)比。從圖5、圖6的跟蹤效果來看,固定滑移率的干擾下PID控制的角度誤差在0.6 rad左右,坐標(biāo)誤差達(dá)到0.45 m。時(shí)間可變的滑移率干擾下,PID控制的坐標(biāo)誤差在2.8 m左右,角度誤差達(dá)到約0.8 rad。

4 結(jié)束語

本文在移動(dòng)機(jī)器人運(yùn)動(dòng)學(xué)方程中引進(jìn)縱向滑移參數(shù),設(shè)計(jì)P型開閉環(huán)迭代控制律,通過詳細(xì)理論推導(dǎo)給出收斂的充分條件,隨著迭代次數(shù)增加,跟蹤誤差逐漸趨近于零,理論的推導(dǎo)也給出了控制器參數(shù)的選定依據(jù),從時(shí)間變化延展到迭代可變的滑移干擾,考慮復(fù)雜的工作狀態(tài),擴(kuò)大了應(yīng)用范圍。通過固定滑移、時(shí)變滑移和迭代變化滑移3種情況下的仿真證明了不同滑移參數(shù)影響下控制律的有效性,可以完成軌跡跟蹤任務(wù),并通過與其他控制律的比較,體現(xiàn)迭代學(xué)習(xí)控制在重復(fù)性軌跡跟蹤任務(wù)應(yīng)用時(shí)的效果。

猜你喜歡
范數(shù)移動(dòng)機(jī)器人軌跡
移動(dòng)機(jī)器人自主動(dòng)態(tài)避障方法
解析幾何中的軌跡方程的常用求法
基于同倫l0范數(shù)最小化重建的三維動(dòng)態(tài)磁共振成像
移動(dòng)機(jī)器人路徑規(guī)劃算法綜述
向量范數(shù)與矩陣范數(shù)的相容性研究
軌跡
軌跡
基于四元數(shù)卷積神經(jīng)網(wǎng)絡(luò)的移動(dòng)機(jī)器人閉環(huán)檢測(cè)
基于改進(jìn)強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人路徑規(guī)劃方法
基于加權(quán)核范數(shù)與范數(shù)的魯棒主成分分析
寿光市| 新邵县| 龙州县| 广东省| 济南市| 兴城市| 望谟县| 法库县| 东源县| 澎湖县| 江源县| 泌阳县| 麟游县| 通河县| 于都县| 石狮市| 福建省| 商水县| 沾化县| 许昌县| 安图县| 紫云| 万州区| 上杭县| 迁西县| 绥江县| 达孜县| 梁山县| 奈曼旗| 申扎县| 罗源县| 广河县| 蛟河市| 洛宁县| 绵竹市| 聂拉木县| 西乌珠穆沁旗| 汕头市| 天全县| 富宁县| 延津县|