国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)驅(qū)動高階學(xué)習(xí)律的輪式移動機(jī)器人軌跡跟蹤控制

2021-03-31 03:18李佳偉林娜池榮虎
關(guān)鍵詞:驅(qū)動輪輪式移動機(jī)器人

李佳偉 林娜 池榮虎

0 引言

隨著機(jī)器人技術(shù)的快速發(fā)展和社會的不斷進(jìn)步,輪式移動機(jī)器人(Wheeled Mobile Robot,WMR)憑借簡單的機(jī)械結(jié)構(gòu)、穩(wěn)定的運(yùn)行狀態(tài)和強(qiáng)大的環(huán)境適應(yīng)能力等獨(dú)特的優(yōu)勢不僅被廣泛應(yīng)用于汽車生產(chǎn)和農(nóng)產(chǎn)品種植等領(lǐng)域,在國家安全和空間探索等方面也發(fā)揮著重要作用[1-3].由于輪式移動機(jī)器人在各領(lǐng)域的廣泛應(yīng)用,其運(yùn)動控制的關(guān)鍵問題包括路徑規(guī)劃、路徑跟蹤和運(yùn)動避障等引起了研究人員的廣泛關(guān)注.其中,路徑跟蹤[4-6]已成為當(dāng)前研究的熱點(diǎn)之一.

WMR本質(zhì)上是一個強(qiáng)耦合、欠驅(qū)動、多變量非線性系統(tǒng)[6-8],其軌跡跟蹤控制器設(shè)計存在許多困難和問題,許多專家學(xué)者對此做了大量的研究工作.考慮到輪式移動機(jī)器人操作過程中未知的參數(shù)變化和外部干擾,文獻(xiàn)[9]提出了一種基于改進(jìn)非線性狀態(tài)觀測器的開關(guān)增益自適應(yīng)滑模控制器;文獻(xiàn)[10]提出了一種基于神經(jīng)網(wǎng)絡(luò)優(yōu)化的魯棒模型預(yù)測控制方法,提高了模型預(yù)測控制的計算效率.

值得注意的是,目前大部分的研究工作都是基于模型的控制方法以實(shí)現(xiàn)路徑跟蹤,控制性能取決于模型精度,因此很難滿足實(shí)際工作要求.同時,數(shù)據(jù)驅(qū)動控制[11-14](Data-Driven Control,DDC)在處理復(fù)雜動態(tài)過程的控制問題方面變得越來越流行,技術(shù)的進(jìn)步使得獲取和存儲操作數(shù)據(jù)變得更加容易.DDC設(shè)計的原理是利用從實(shí)際系統(tǒng)中獲得的測量數(shù)據(jù)來設(shè)計控制器,而不使用任何顯式的辨識模型信息.

在實(shí)際工況中,WMR經(jīng)常需要執(zhí)行重復(fù)的任務(wù)[15],如播種和噴灑作業(yè)的農(nóng)用車輛和無人清掃車清掃公園環(huán)境路面、智能機(jī)器人執(zhí)行搜索和巡邏任務(wù)等.在有限的時間內(nèi),它的工作環(huán)境和期望軌跡是重復(fù)不變的.對于重復(fù)運(yùn)行的系統(tǒng),迭代學(xué)習(xí)控制[16-19](Iterative Learning Control,ILC)提供了一種新的控制器設(shè)計思想,它可以在固定的時間間隔內(nèi),通過利用之前迭代的誤差信息來更新當(dāng)前輸入,實(shí)現(xiàn)控制性能改善.

目前,WMR的ILC設(shè)計也已經(jīng)有一些報道.文獻(xiàn)[20]通過引入自適應(yīng)遺忘因子,提出了一種開環(huán)PD型ILC控制器,增強(qiáng)了ILC的魯棒性和穩(wěn)定性;文獻(xiàn)[21]設(shè)計了一種新的迭代學(xué)習(xí)算法,突破了傳統(tǒng)ILC中對參考軌跡和初始位置每次迭代必須相同的限制.然而,目前大多數(shù)ILC控制方法的學(xué)習(xí)增益往往是固定不變的,而且控制過程中只使用前一次迭代的控制信息.

基于以上分析,本文針對重復(fù)運(yùn)行的WMR系統(tǒng)提出了一種高階迭代學(xué)習(xí)控制方法.首先,建立WMR聯(lián)合直流電機(jī)的運(yùn)動學(xué)方程,引入迭代動態(tài)線性化方法(Iterative Dynamic Linearization,IDL)[22-23],將WMR系統(tǒng)表示為線性輸入輸出數(shù)據(jù)模型;其次,通過設(shè)計含有附加輸入信息的目標(biāo)函數(shù),建立了高階學(xué)習(xí)控制律,利用參數(shù)更新律對控制律中的未知參數(shù)估計;最后,仿真結(jié)果驗(yàn)證了所提方法的有效性.

本文的創(chuàng)新點(diǎn)在于:

1)與現(xiàn)有的ILC方法相比,控制器設(shè)計和分析過程只使用系統(tǒng)輸入/輸出(I/O) 數(shù)據(jù),不包含任何顯式的模型信息;

2)通過采用高階算法,在控制律中利用更多之前迭代的輸入信息,提高了控制性能;

3)相比于傳統(tǒng)的ILC 方法,學(xué)習(xí)增益是自適應(yīng)變化的而不是固定不變的,提高了控制算法的魯棒性.

本文余下結(jié)構(gòu)分布如下:第1節(jié)是基本問題描述,將WMR模型利用IDL轉(zhuǎn)化為線性輸入輸出數(shù)據(jù)模型;第2節(jié)是控制器的設(shè)計;第3節(jié)利用仿真結(jié)果驗(yàn)證了所提方法的有效性;第4節(jié)總結(jié)全文.

1 問題描述

WMR多采用雙后輪驅(qū)動和雙前輪支撐方式,前輪為用于平衡的無動力方向輪,驅(qū)動輪采用獨(dú)立直流伺服電機(jī)(DC)驅(qū)動.在不考慮輪胎和地面橫向滑動的情況下,WMR可以簡化為兩輪車模型進(jìn)行運(yùn)動學(xué)分析,如圖1所示.

圖1 輪式機(jī)器人簡圖Fig.1 Schematic diagram of WMR

假設(shè)圖1中MWR的兩個驅(qū)動輪有相同的物理特性,r為驅(qū)動輪的半徑,2R為兩輪之間的距離.兩個輪子的中點(diǎn)為C點(diǎn).設(shè)MWR的質(zhì)心為C點(diǎn),其位置坐標(biāo)可設(shè)為(x,y).I是C點(diǎn)的慣性力矩,m是MWR的質(zhì)量.

以點(diǎn)C為坐標(biāo)原點(diǎn),以MWR的前進(jìn)向方向?yàn)閄軸,前進(jìn)方向的垂直方向?yàn)閅軸,建立機(jī)體坐標(biāo)系CXcYc.機(jī)體坐標(biāo)系與慣性坐標(biāo)系之間的夾角為θ,即MWR的轉(zhuǎn)向角.

記q(t)=[x(t)y(t)θ(t)]T表示W(wǎng)MR的廣義坐標(biāo),x(t)和y(t)分別表示MWR在平面坐標(biāo)系中的橫坐標(biāo)和縱坐標(biāo),θ(t)是WMR的轉(zhuǎn)向角,點(diǎn)C表示W(wǎng)MR當(dāng)前位置,當(dāng)前線速度為v(t),角速度為ω(t),則純滾動、無滑移情況下,MWR的非完整約束方程為

(1)

根據(jù)式(1)可得:

(2)

則WMR的運(yùn)動學(xué)方程可以表示為

(3)

式(3)可被簡化為

(4)

其中,

V(t)=[v(t),w(t)]T,

假設(shè)WMR在水平面上運(yùn)動,不考慮表面摩擦,可以利用經(jīng)典拉格朗日動力學(xué)方程得到WMR的動力學(xué)模型,如式(5)所示

(5)

由于WMR的軌跡局限于水平面,系統(tǒng)勢能保持不變,系統(tǒng)動能可以表示為

(6)

其中,m為WMR的質(zhì)量,I為慣性矢量.

式(5)可重寫為

(7)

對式(4)兩邊求導(dǎo)數(shù)可得:

(8)

將式(8)代入式(7)可得:

STMSV+STMSV=STEτ-STAλ,

(9)

其中,

(10)

為了在式(5)中增加執(zhí)行機(jī)構(gòu)動力,假設(shè)WMR的驅(qū)動輪由兩個有機(jī)械齒的電刷直流電機(jī)(DC)驅(qū)動,電機(jī)的數(shù)學(xué)模型為

(11)

其中,u代表輸入電壓,Ra表示電樞電阻,L表示電樞電感,ωm表示為DC的角速度,Kb表示反電動勢(Back Electromotive Force,EMF)常數(shù).

假設(shè)在忽略電樞電感的情況下,由直流轉(zhuǎn)矩與電流的關(guān)系和齒輪前后角速度與轉(zhuǎn)矩的關(guān)系可得兩驅(qū)動輪的扭矩為

(12)

其中:K1=nKτ/Ra,K2=nKbK1,n為齒輪傳動比,Kτ為直流的轉(zhuǎn)矩常數(shù);u=[ulur]T為輸入電壓,ul和ur分別為驅(qū)動左右輪輸入電壓;ωl和ωr分別為左右驅(qū)動輪的角速度;ωl和ωr分別為左右驅(qū)動輪的角速度.

根據(jù)速度矢量V與車輪角速度ωw(ωw=ωm/n)的關(guān)系可知:

(13)

將式(12)代入式(13)可得:

(14)

將式(14)代入式(10),可得聯(lián)合直流電機(jī)的動態(tài)模型表達(dá)式為

(15)

式(15)通過離散化重新整理為

(16)

其中,

重復(fù)運(yùn)行環(huán)境中的WMR運(yùn)動模型可表示為

(17)

其中,t∈{0,1,…,N}表示重復(fù)的運(yùn)行區(qū)間,N是一個正整數(shù),k∈{0,1,…}表示迭代次數(shù).

注1WMR系統(tǒng)(17)僅用來產(chǎn)生輸入輸出數(shù)據(jù),后續(xù)控制器設(shè)計及分析均不需要已知A,B和C的信息.也就是說,在本文中A,B和C是未知的.

針對WMR系統(tǒng)(17),本文中給出如下假設(shè):

假設(shè)1WMR系統(tǒng)(17)滿足相同的初始狀態(tài)條件,即Vk(0)=c,?k,其中c為常數(shù)向量.

定理1對于非線性系統(tǒng)(17)在滿足假設(shè)1的條件下,必然存在一個偽雅可比矩陣(Pseudo Jacobian matrix,PJM)Φk(t)使下式成立:

Δyk(t+1)=Φk(t)ΔUk(t),

(18)

Δyk(t+1)=yk(t+1)-yk-1(t+1),

ΔUk(t)=Uk(t)-Uk-1(t).

證明根據(jù)系統(tǒng)(17),可得:

(19)

進(jìn)一步,系統(tǒng)輸出變?yōu)?/p>

(20)

相鄰兩次迭代的輸出作差,并利用假設(shè)1,可得:

Φk(t)ΔUk(t),

(21)

其中,

Φk(t)=[φk(0),φk(1),…,φk(t)],

φk(i)=CAiB,i∈{0,…,t}.

定理1得證.

本文的控制目標(biāo)是找到一個最優(yōu)的控制輸入使得跟蹤誤差ek(t+1)=yd(t+1)-yk(t+1)隨迭代次數(shù)k趨于無窮時收斂于零.

2 控制器設(shè)計

考慮如下目標(biāo)函數(shù):

J(Uk(t),αk)=‖ek(t+1)‖2+

(22)

(23)

由于Φk(t)是未知的,所以式(23)可重寫為

(24)

(25)

其中,μ是一個權(quán)重因子.

(26)

(27)

其中,ε是一個充分小的正的常數(shù).

進(jìn)一步,為了提高控制算法的對外部擾動的魯棒性,設(shè)計控制律為

(28)

綜上所述,所設(shè)計的基于數(shù)據(jù)驅(qū)動的高階學(xué)習(xí)方案由式(26)、(27)和(28)組成.

從上述控制方案中可以看出,所提的高階學(xué)習(xí)方案與MWR的數(shù)學(xué)模型、機(jī)理和階數(shù)均無關(guān).控制方案中只有PJM需要在線調(diào)整,與以往數(shù)據(jù)驅(qū)動的自適應(yīng)ILC方法相比,本文所提方法利用了更多之前迭代的輸入信息,提高了控制性能.

3 仿真驗(yàn)證

為了充分說明所提出方法的有效性,本部分給出了仿真驗(yàn)證.

WMR控制系統(tǒng)的參數(shù)給出如下:

m=36 kg,I=15.625 kg·m2,2R=1.5 m,r=0.15 m,K1=7.2,K2=2.592.

系統(tǒng)重復(fù)運(yùn)行80次.在仿真中,期望路徑設(shè)置為

t∈{0,1,…,10}.

為了模擬實(shí)際中的外部擾動,在仿真中考慮如下輸出擾動dk(t)=[dk,1(t)dk,2(t)]=0.03 rand[1 1],如圖2和圖3所示.

圖2 隨機(jī)噪聲dk,1(t)Fig.2 Random noise dk,1(t)

圖3 隨機(jī)噪聲dk,2(t)Fig.3 Random noise dk,2(t)

應(yīng)用本文所提出的基于數(shù)據(jù)驅(qū)動的高階學(xué)習(xí)算法(26)—(28),控制器參數(shù)設(shè)置為η=1,μ=1,ρ=0.2,λ=0.01,l=3,a1=0.1,a2=0.1,a3=0.8,采樣時間設(shè)置為h=0.1.圖4和圖5分別表示不同迭代次數(shù)下的線速度和角速度的跟蹤性能.圖6和圖7分別表示線速度和角速度的跟蹤誤差隨著迭代的變化情況.從圖4—7可以看出所提的基于數(shù)據(jù)驅(qū)動的高階算法對WVR系統(tǒng)可以達(dá)到很好的跟蹤控制效果.

圖4 線速度跟蹤性能Fig.4 Performance of linear velocity tracking

圖5 角速度跟蹤性能Fig.5 Performance of angular velocity tracking

圖6 線速度跟蹤誤差Fig.6 Tracking error of linear velocity

圖7 角速度跟蹤誤差Fig.7 Tracking error of angular velocity

4 結(jié)論

針對輪式機(jī)器人執(zhí)行巡邏任務(wù)的重復(fù)特性,提出了一種數(shù)據(jù)驅(qū)動的高階迭代學(xué)習(xí)控制算法.通過引入基于狀態(tài)轉(zhuǎn)移的迭代動態(tài)線性化技術(shù),將輪式移動機(jī)器人系統(tǒng)轉(zhuǎn)化為線性輸入輸出數(shù)據(jù)模型形式,在此基礎(chǔ)上,利用包含更多之前迭代輸入信息的指標(biāo)函數(shù),設(shè)計高階學(xué)習(xí)律,并對數(shù)據(jù)模型中的參數(shù)設(shè)計更新算法,從而實(shí)現(xiàn)軌跡跟蹤的目的,提高了控制性能.

猜你喜歡
驅(qū)動輪輪式移動機(jī)器人
移動機(jī)器人自主動態(tài)避障方法
基于正交試驗(yàn)的整車驅(qū)動輪滾動阻力因素分析
電驅(qū)動輪輪轂設(shè)計及有限元分析
基于backstepping方法的兩輪移動機(jī)器人軌跡跟蹤控制
移動機(jī)器人路徑規(guī)劃算法綜述
輪式拖拉機(jī)前驅(qū)動橋使用調(diào)整
輪式裝備搶救搶修車
一種新型掘進(jìn)機(jī)行走驅(qū)動輪設(shè)計方案
室內(nèi)環(huán)境下移動機(jī)器人地圖構(gòu)建與路徑規(guī)劃技術(shù)
移動平臺及包含移動平臺的行李箱