彭積廣,肖涵臻
(廣東工業(yè)大學(xué) 自動化學(xué)院,廣東 廣州 510006)
近些年來,移動機器人的編隊控制與避障能力引起了許多研究者的興趣,是機器人領(lǐng)域中非常熱門的研究方向之一?;诜植际揭恢滦缘木庩牽刂偏@得了快速且持續(xù)的發(fā)展,在基于一致性的編隊中,由于機器人之間的通信帶寬受到限制及機器人之間的信息傳輸應(yīng)具備高質(zhì)量和無延時的高標(biāo)準(zhǔn),因此考慮機器人只能與它的鄰居接收和發(fā)送信息是十分有必要的。在領(lǐng)導(dǎo)者?跟隨者機器人編隊形式中[1-3],有一個及以上機器人為領(lǐng)導(dǎo)者,領(lǐng)導(dǎo)者可以是其中的某個機器人或者為虛擬機器人,它決定整個編隊的運動軌跡和方向,其他移動機器人作為跟隨者被領(lǐng)導(dǎo)者帶領(lǐng)運動,并相互之間保持相對的距離與方位。文獻[4]實現(xiàn)了一種模型預(yù)測控制(Model Predictive Control, MPC)方法來控制一個領(lǐng)導(dǎo)者?跟隨者編隊系統(tǒng)。通過在分離度?姿態(tài)?方位模型(Separation-Bearing-Orientation Scheme, SBOS)和避障模型之間進行切換,使編隊避免碰撞,達到理想的編隊狀態(tài),并對約束條件進行處理。但是SBOS模型難以與避障模型相結(jié)合起來。于是文獻[5]提出了固定無向拓撲下基于距離與速度的人工勢場方法的編隊避障系統(tǒng),但是沒有考慮有向拓撲且拓撲可以變化下的避障,并且沒考慮機器人相互避免碰撞的同時,能避免障礙物的問題。結(jié)合以上參考的工作,為在期望路徑上規(guī)劃機器人到達并與領(lǐng)導(dǎo)機器人保持期望距離,通過構(gòu)造編隊路徑規(guī)劃的控制輸入與避障系統(tǒng)結(jié)合起來。
研究者們提出了許多的控制算法來控制機器人編隊,如一致控制[6-7]、自適應(yīng)控制[8]、滑模[9-10]和人工勢場[11]等。對于群體編隊,需要考慮系統(tǒng)約束問題。然而,模型預(yù)測控制(MPC)能夠很好地考慮移動機器人的物理約束問題。另一方面,模型預(yù)測控制(MPC)方法已成功地應(yīng)用于工業(yè)環(huán)境下的復(fù)雜系統(tǒng)的控制,是應(yīng)用最廣泛的最優(yōu)控制技術(shù)之一。其中,文獻[12-13]是一種模型預(yù)測控制(MPC),具有軌跡優(yōu)化能力,并充分考慮物理約束,適用于多機器人控制。一般來說,MPC可以解決包含約束的優(yōu)化問題。在預(yù)測控制范圍內(nèi),由最優(yōu)解得到的輸入序列總能考慮機器人的內(nèi)在物理約束。為解決預(yù)測控制的優(yōu)化問題,需要一種高效的優(yōu)化算法。文獻[14]將多機器人編隊控制(General Projection Neural Network,GPNN)方法與多機器人一致編隊相結(jié)合,來求解包含編隊最優(yōu)輸入的約束(Quadratic Programming,QP)問題的最優(yōu)解。與現(xiàn)有的領(lǐng)導(dǎo)者?跟隨者方法相比,所提出的MPC方法能夠考慮系統(tǒng)的輸入約束和狀態(tài)約束。本文利用投影神經(jīng)網(wǎng)絡(luò)優(yōu)化算法來處理基于MPC方法的優(yōu)化問題。
在實際機器人運動中,機器人處理避障的能力是十分重要的,研究者們對于這一問題進行了深入的研究[15-18],其中一種較簡單且廣泛使用的避障方式為基于距離的人工勢場法。人工勢場法的主要思想是,當(dāng)一個機器人進入其他機器人的勢場中時,機器人會產(chǎn)生一種很強的排斥力,迫使它遠離其他機器人,從而避免發(fā)生碰撞。然而,文獻[19-20]中的人工勢場方法僅基于機器人之間的距離進行設(shè)計,在很多情況下具有相當(dāng)大的局限性。例如:一機器人雖然進入勢場中,但是兩機器人的移動方向和速度不同,使得機器人之間不會產(chǎn)生碰撞,此時,機器人也會因靠近產(chǎn)生排斥力,從而會增加機器人的能量消耗,并且易致編隊控制不穩(wěn)定。機器人也需有避開障礙物的能力,運用人工勢場法來進行避障處理?;谏鲜龇治觯疚睦靡环N基于距離和速度的人工勢場方法來處理多移動機器人編隊控制的機器人間的避碰問題和人工勢場法來處理避免障礙物。
受以上文獻啟發(fā),本文首次將文獻[5]的基于距離與速度的人工勢場方法引入有向拓撲且拓撲可以變化下考慮機器人相互避免碰撞避障。同時,運用人工勢場法[21]能避免障礙物的問題,且融合進一階多移動機器人的一致性編隊路徑規(guī)劃控制中。本文提出兩層編隊控制框架, 在編隊控制層面上,設(shè)計具有避碰的編隊控制律控制??梢允箼C器人在相對平滑的軌跡上運動且具有避障能力,并與相鄰機器人達到并保持預(yù)期的距離。在編隊跟蹤層,應(yīng)用GPNN結(jié)合MPC方法重構(gòu)并求解一個基于跟蹤誤差模型的約束QP問題。得到控制機器人的最優(yōu)輸入,同時考慮速度約束和系統(tǒng)狀態(tài)約束。該兩層群形成框架綜合了軌跡生成方法和算法的優(yōu)點。
在實際工作過程中,機器人的避障能力是十分必要的,不僅僅是避免對障礙物的碰撞,而且機器人相互之間也需要有良好的避障能力。對于基于距離的人工勢場法的避障系統(tǒng),當(dāng)某一機器人進入另一機器人的勢場范圍內(nèi)或兩個及以上機器人的勢場范圍發(fā)生接觸時,機器人之間就會迅速產(chǎn)生排斥力。但是如圖1所示,即使其進入勢場的范圍內(nèi)時,機器人之間也不會發(fā)生碰撞。此時機器人之間的碰撞不僅僅取決于機器人之間的距離,也與機器人之間的速度的大小和方向相關(guān)。根據(jù)文獻[5],可用基于距離和速度的避障方式來建立機器人躲避障礙的模型。
圖1 基于距離與速度的機器人避障圖Fig.1 Obstacle avoidance diagram of robot based on distance and speed
為了控制編隊跟蹤良好,采用MPC方法。在有限時間范圍之類,經(jīng)過歐拉離散化的系統(tǒng),可轉(zhuǎn)化為具有輸入和狀態(tài)飽和約束以及離散非線性模型方程的閉環(huán)離散時間最優(yōu)控制問題。因此,將系統(tǒng)的控制輸入和狀態(tài)方法轉(zhuǎn)化成離散時間狀態(tài)空間方程。編隊控制目標(biāo)、避障實現(xiàn)和軌跡跟蹤可以通過MPC方法轉(zhuǎn)化為離散時間閉環(huán)優(yōu)化控制問題。不失一般性,可得到廣義非線性離散仿射系統(tǒng):
模型預(yù)測控制是一種基于模型的閉環(huán)優(yōu)化控制策略,其算法的核心是:可預(yù)測未來的動態(tài)模型,在線反復(fù)優(yōu)化計算并滾動實施的控制作用和模型誤差的反饋校正。因此,對比于傳統(tǒng)或經(jīng)典的控制器,模型預(yù)測控制具有控制效果好、魯棒性強等優(yōu)點,可有效地克服過程的不確定性、非線性和并聯(lián)性,并能方便地處理被控變量和操縱變量中的各種約束。因此,代價函數(shù)可表示為
為了在線模型預(yù)測控制中獲得已規(guī)劃的優(yōu)化問題的最優(yōu)解,需要尋求一種高效的最優(yōu)化方法來求解。因此,一種廣義投影神經(jīng)網(wǎng)絡(luò)優(yōu)化的方法被提出。為了解決二次規(guī)劃問題(19),開發(fā)了一種單層結(jié)構(gòu)一般投影神經(jīng)網(wǎng)絡(luò)(GPNN),它是一種遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)。廣義投影神經(jīng)網(wǎng)絡(luò)是一類求解更廣泛的單調(diào)變分不等式和相關(guān)的優(yōu)化問題。本文所提出的神經(jīng)網(wǎng)絡(luò)具有低模型復(fù)雜度的單層結(jié)構(gòu),包含了現(xiàn)有的用于約束優(yōu)化的神經(jīng)網(wǎng)絡(luò),如原始對偶神經(jīng)網(wǎng)絡(luò)、對偶神經(jīng)網(wǎng)絡(luò)和投影神經(jīng)網(wǎng)絡(luò),均為廣義投影神經(jīng)網(wǎng)絡(luò)的特殊情況。廣義投影神經(jīng)網(wǎng)絡(luò)的漸進神經(jīng)網(wǎng)絡(luò)的遞歸神經(jīng)網(wǎng)絡(luò)(RNN)用于解 MPC 控制中產(chǎn)生的二次規(guī)劃問題,并表現(xiàn)出了較低的計算復(fù)雜度。通過GPNN方法,可得到具有全局指數(shù)收斂性和李雅普諾夫穩(wěn)定性的二次規(guī)劃問題最優(yōu)解。因此,有以下定理[20]:
在本節(jié)中,利用Matlab對一組編隊的非完整移動機器人進行軌跡跟蹤和避障仿真,以驗證本文提出的避障與軌跡跟蹤的控制性能和有效性。本文以3個機器人和1個虛擬機器人為例進行數(shù)值計算。機器人被標(biāo)記為R1~R3, 虛擬領(lǐng)導(dǎo)者被標(biāo)記為RL。
在本文中,圖2為機器人的通信拓撲結(jié)構(gòu),在機器人運動過程中可選用兩種通信拓撲。實驗1仿真結(jié)果如圖3~圖7所示。在圖3中,跟隨者可以實現(xiàn)并保持所期望的直線運動的規(guī)則三角形,跟隨者的幾何中心可以跟蹤領(lǐng)導(dǎo)者的軌跡。并且跟隨者即實際機器人可以實現(xiàn)良好的避障效果。與文獻[5]相比,本文不僅實現(xiàn)了良好的避障而且可以進行編隊控制與跟蹤。在圖4~圖5中顯示了機器人的線速度和角速度的變化,可以看到線速度和角速度受到約束。圖6~圖7中,通過使用的一致性控制方法,所有的一致性誤差都可以穩(wěn)定到原點。
圖2 通信拓撲結(jié)構(gòu)圖Fig.2 Communication topology
圖3 實驗1編隊的跟蹤與避障Fig.3 Formation tracking and obstacle avoidance in test one
圖4 實驗1機器人Ri 的線速度Fig.4Linear velocitiesofRiintest one
圖5 實驗1機器人Ri 的角速度Fig.5Angularvelocities of Riin test one
圖6 實驗1 xi的誤差演化Fig.6 Evolutions of errorsofxiin test one
圖7 實驗1yi的誤差演化Fig.7 Evolutions oferrorsofyiin test one
實驗2仿真結(jié)果如圖8~圖12所示。在圖8中,跟隨者可以實現(xiàn)并保持所期望的正弦曲線的規(guī)則三角形運動,跟隨者的幾何中心可以跟蹤領(lǐng)導(dǎo)者的軌跡。并且跟隨者即實際機器人可以實現(xiàn)良好的避障效果。在圖9~圖10中顯示了機器人的線速度和角速度的變化,表示線速度和角速度受到約束。圖11~圖12中,通過使用的一致性控制方法,所有的一致性誤差都可以穩(wěn)定到零或趨于零。綜合上述仿真結(jié)果表明:采用所提出的控制策略,本文系統(tǒng)能夠在充分考慮輸入約束的前提下實現(xiàn)編隊跟蹤目標(biāo)與避障處理。通過上述實例,驗證了該控制方法系統(tǒng)的有效性。
圖8 實驗2編隊的跟蹤與避障Fig.8 Formation tracking and obstacle avoidance in test two
圖9實驗2機器人Ri 的線速度Fig.9Linear velocitiesofRiintest two
圖10實驗2機器人Ri 的角速度Fig.10Angularvelocities of Riin test two
圖11 實驗2 xi 的誤差演化Fig.11 Evolutions of errorsofxiin test two
圖12 實驗2yi的誤差演化Fig.12 Evolutions oferrorsofyiin test two
本文研究了在虛擬領(lǐng)導(dǎo)者下的具有一階多移動機器人系統(tǒng)在基于位移與速度下的一致性編隊跟蹤與避障控制問題。首先設(shè)計多機器人的通信拓撲,再設(shè)計具有避障功能的一致性編隊控制律,然后設(shè)計移動機器人編隊跟蹤系統(tǒng),運用模型預(yù)測控制(MPC)方法,將編隊誤差運動問題按代價函數(shù)轉(zhuǎn)化為最小優(yōu)化問題。利用廣義投影神經(jīng)網(wǎng)絡(luò)優(yōu)化的方法求解最優(yōu)值。本文給出的理論分析和仿真結(jié)果驗證了該方法的有效性。