白國(guó)星,羅維東,劉 立,孟 宇,顧 青,李凱倫
北京科技大學(xué)機(jī)械工程學(xué)院,北京 100083
?通信作者,E-mail: myu@ustb.edu.cn
采礦作業(yè)環(huán)境惡劣,自動(dòng)化已經(jīng)成為世界礦業(yè)的主要發(fā)展趨勢(shì),礦用車輛的自主行駛是采礦自動(dòng)化的重要研究方向. 在礦用車輛中,鉸接式車輛(可簡(jiǎn)稱為鉸接車)采用前后車體折腰的形式完成轉(zhuǎn)向. 因此鉸接式車輛具有較為特殊的運(yùn)動(dòng)學(xué)、動(dòng)力學(xué)特性,其路徑跟蹤控制也成為了礦用車輛自主行駛的一個(gè)熱點(diǎn)和難點(diǎn). 2005 年Dragt 等對(duì)鉸接式鏟運(yùn)機(jī)的自動(dòng)化進(jìn)行了綜述,回顧了鉸接式車輛的運(yùn)動(dòng)學(xué)模型、路徑跟蹤控制方法等路徑跟蹤控制關(guān)鍵研究點(diǎn)的研究進(jìn)展[1]. 而在最近的十五年中,鉸接式車輛的路徑跟蹤控制研究又有了一些新的發(fā)展動(dòng)態(tài).
在數(shù)學(xué)建模方面,由于運(yùn)動(dòng)學(xué)模型日益難以滿足鉸接式車輛路徑跟蹤控制的需求,所以研究者們逐漸將注意力集中到了動(dòng)力學(xué)模型的研究.路徑跟蹤控制方法也迎來(lái)了發(fā)展的高潮,研究者們基于不同的控制方法提出了多種高性能的路徑跟蹤控制器. 基于上述發(fā)展趨勢(shì),從鉸接式車輛數(shù)學(xué)模型和鉸接式車輛路徑跟蹤控制方法兩個(gè)方面,闡述了礦用鉸接式車輛路徑跟蹤控制研究的現(xiàn)狀和進(jìn)展. 在此基礎(chǔ)上,總結(jié)了不同數(shù)學(xué)模型和控制方法對(duì)路徑跟蹤控制性能的影響,提出了進(jìn)一步提高路徑跟蹤控制精確性和安全性的研究思路,以圖為礦用鉸接式車輛的路徑跟蹤控制提供技術(shù)參考.
在Dragt 等的工作中,鉸接式車輛的模型分為無(wú)側(cè)滑模型、有側(cè)滑模型和誤差模型[1]. 不過(guò)無(wú)側(cè)滑模型和有側(cè)滑模型均屬于運(yùn)動(dòng)學(xué)模型的范疇,而誤差模型通常是基于運(yùn)動(dòng)幾何關(guān)系推導(dǎo)獲得的運(yùn)動(dòng)學(xué)模型衍生物. Dragt 等沒(méi)有回顧關(guān)于鉸接式車輛動(dòng)力學(xué)模型的研究,但是該模型對(duì)路徑跟蹤控制意義較大. 綜上可將鉸接式車輛的模型研究分為運(yùn)動(dòng)學(xué)模型和動(dòng)力學(xué)模型兩類.
(1)運(yùn)動(dòng)學(xué)模型.
根據(jù)Dragt 等的工作,可以將關(guān)于鉸接式車輛運(yùn)動(dòng)學(xué)模型的研究成果分為兩類,即無(wú)側(cè)滑模型和有側(cè)滑模型.
A. 無(wú)側(cè)滑模型
關(guān)于無(wú)側(cè)滑鉸接式車輛運(yùn)動(dòng)學(xué)模型的研究工作歷史較為悠久. Hemami 和DeSantis 參考前輪轉(zhuǎn)向車輛的運(yùn)動(dòng)學(xué)模型建立了早期的無(wú)側(cè)滑鉸接式車輛運(yùn)動(dòng)學(xué)模型[2-4].
如果鉸接角定義為后車體航向減去前車體航向之差,即γ=θr-θf(wàn),該模型在全局坐標(biāo)系下的一般形式可以列為:
式中,x 為橫坐標(biāo),y 為縱坐標(biāo),θ 為航向角,v 為縱向速度,l 為車橋到鉸接點(diǎn)的距離,下標(biāo)f 表示前車體,下標(biāo)r 表示后車體,δ 表示鉸接點(diǎn)速度矢量與前車體之間的夾角,γ 為鉸接角.
在較早的鉸接式車輛路徑跟蹤控制中,該模型得到了較為廣泛的應(yīng)用[5-7]. 但是由于該模型中存在中間變量tan δ,計(jì)算過(guò)程復(fù)雜且映射關(guān)系不夠直觀,所以研究者們對(duì)該模型又做了一些改進(jìn).將式(1)中的tan δ 消去,并用ωγ表示鉸接角速度,即可獲得該運(yùn)動(dòng)學(xué)模型的另一種形式:
1999 年Altafini 給出了與式(2)相近的鉸接式車輛運(yùn)動(dòng)學(xué)模型[8],但是沒(méi)有給出具體的推導(dǎo)過(guò)程. 而且在Altafini 的模型中,模型的輸出狀態(tài)是后橋中心的狀態(tài),但是在鉸接式車輛的路徑跟蹤控制中,很少采用以后橋中心狀態(tài)作為輸出狀態(tài)的運(yùn)動(dòng)學(xué)模型. 2001 年Corke 和Ridley 給出了形如式(2)的鉸接式車輛運(yùn)動(dòng)學(xué)模型的詳細(xì)推導(dǎo)過(guò)程[9]. 2019 年白國(guó)星等基于非完整約束條件提出了一種更加簡(jiǎn)便的鉸接式車輛運(yùn)動(dòng)學(xué)模型推導(dǎo)方法,并得到了相同的運(yùn)動(dòng)學(xué)模型[10].
該模型還有一個(gè)變體,如果將鉸接角定義為前車體航向減去后車體航向之差,即 γo=θf(wàn)-θr,最終得到的模型為:
式(2)和式(3)之間的區(qū)別僅為鉸接角正方向的定義,兩個(gè)模型的特性完全相同.
在行駛速度較低時(shí),這種運(yùn)動(dòng)學(xué)模型的精度較高,而鉸接式車輛的多數(shù)工況都不需要高速行駛,所以該模型的應(yīng)用十分廣泛,很多研究者基于這種模型設(shè)計(jì)了路徑跟蹤控制器[11-20]. 因此該模型可稱為鉸接式車輛的經(jīng)典運(yùn)動(dòng)學(xué)模型.
B. 有側(cè)滑模型
鉸接式車輛的運(yùn)動(dòng)學(xué)模型中,有側(cè)滑模型的出現(xiàn)時(shí)間略晚于無(wú)側(cè)滑模型. 1997 年Scheding 等參考前輪轉(zhuǎn)向車輛的運(yùn)動(dòng)學(xué)模型提出了考慮側(cè)滑的鉸接式車輛運(yùn)動(dòng)學(xué)模型[21],并證明了相比無(wú)側(cè)滑模型,有側(cè)滑模型與實(shí)車測(cè)試的數(shù)據(jù)更加接近[22].2011 年Nayl 等在形如式(3)的經(jīng)典運(yùn)動(dòng)學(xué)模型中加入了側(cè)偏角,建立了新的有側(cè)滑模型[23],其后基于該模型設(shè)計(jì)了用于鉸接式車輛的路徑跟蹤控制器[24-26].
在有側(cè)滑模型中,需要將側(cè)偏角作為已知量輸入運(yùn)動(dòng)學(xué)模型. 在作為被控對(duì)象驗(yàn)證控制算法時(shí),該模型相對(duì)無(wú)側(cè)滑模型更加接近實(shí)際工況. 但是由于運(yùn)動(dòng)學(xué)模型中不考慮側(cè)向加速度,有側(cè)滑模型無(wú)法預(yù)測(cè)鉸接式車輛未來(lái)的側(cè)滑情況. 在作為參考模型設(shè)計(jì)控制器時(shí),如果鉸接式車輛的縱向行駛速度較低,該模型相對(duì)無(wú)側(cè)滑模型對(duì)控制精確性的提升極為有限,而如果鉸接式車輛的縱向行駛速度較高,誤差中將包含較多側(cè)滑導(dǎo)致的成分,控制器會(huì)通過(guò)增大橫擺角速度來(lái)消除側(cè)向速度帶來(lái)的額外誤差,從而進(jìn)一步增大側(cè)向加速度,導(dǎo)致鉸接式車輛側(cè)向速度的進(jìn)一步增大,最終發(fā)生危險(xiǎn). 因此從理論上來(lái)看,有側(cè)滑鉸接式車輛運(yùn)動(dòng)學(xué)模型更加適合作為仿真系統(tǒng)中的被控對(duì)象,而在作為路徑跟蹤控制器的參考模型時(shí)存在增大側(cè)滑趨勢(shì)的傾向.
總而言之,在運(yùn)動(dòng)學(xué)模型層面,經(jīng)典鉸接式車輛運(yùn)動(dòng)學(xué)模型雖然無(wú)法將輪胎側(cè)滑等現(xiàn)象納入考慮,但是由于其結(jié)構(gòu)簡(jiǎn)單,在行駛速度較低時(shí)精確性尚可,所以在鉸接式車輛的路徑跟蹤控制中,該模型的應(yīng)用較為廣泛.
(2)動(dòng)力學(xué)模型.
由于基于運(yùn)動(dòng)學(xué)模型的控制器無(wú)法有效處理側(cè)滑問(wèn)題,所以目前鉸接式車輛的自動(dòng)行駛控制通常僅在低速工況下運(yùn)行. 但是鉸接式卡車等礦用車輛也有高速運(yùn)行的需求,所以鉸接式車輛的動(dòng)力學(xué)模型也是鉸接式車輛路徑跟蹤控制領(lǐng)域中的一個(gè)研究熱點(diǎn).
在鉸接式車輛動(dòng)力學(xué)模型的研究工作中,虛擬樣機(jī)和數(shù)學(xué)模型是兩個(gè)主要研究方向. 研究虛擬樣機(jī)的目的通常是為懸架系統(tǒng)、差速系統(tǒng)的設(shè)計(jì)提供參考[27-29],而在針對(duì)路徑跟蹤控制的研究工作中,虛擬樣機(jī)通常僅作為用于測(cè)試控制方法的被控對(duì)象,所以本文主要針對(duì)鉸接式車輛數(shù)學(xué)模型的研究工作進(jìn)行回顧. 鉸接式車輛動(dòng)力學(xué)模型的數(shù)學(xué)建模方法可以分為兩類,即牛頓-歐拉法和拉格朗日法,其中基于牛頓-歐拉法的鉸接式車輛動(dòng)力學(xué)模型較為常見(jiàn).
A. 基于牛頓-歐拉法的動(dòng)力學(xué)模型
基于牛頓-歐拉法的建模研究,還可以根據(jù)模型的自由度繼續(xù)細(xì)分,分為二自由度、三自由度、四自由度和多自由度模型. 二自由度的鉸接式車輛模型較為罕見(jiàn),僅He 等在其論文中有所提及[30],而且在該論文中二自由度模型僅作為四自由度動(dòng)力學(xué)模型的對(duì)照,目前也未見(jiàn)其他學(xué)者對(duì)二自由度模型進(jìn)行深入研究.
鉸接式車輛的三自由度模型較為常見(jiàn),按照自由度的選擇,該模型也可以分為兩類. 其中最常見(jiàn)的一類是選擇前后車體的橫向速度和橫擺角速度作為輸出狀態(tài)的模型,由于前后車體的橫向速度存在耦合,所以其自由度為三,這種模型也常被叫做原地轉(zhuǎn)向模型[31-36]. 另一類是將鉸接角視為固定值的動(dòng)力學(xué)模型,在這種模型中前后車體被視為剛性連接或彈簧阻尼連接,其輸出狀態(tài)為前車體縱向速度、橫向速度和橫擺角速度,這種模型也被叫做穩(wěn)態(tài)轉(zhuǎn)向模型[37-47]. 上述模型常用于鉸接式車輛行駛穩(wěn)定性等領(lǐng)域的研究,而鉸接式車輛的路徑跟蹤控制需要同時(shí)對(duì)前車體的縱向速度、橫向速度、橫擺角速度和后車體的橫擺角速度進(jìn)行控制,所以三自由度模型對(duì)于鉸接式車輛路徑跟蹤控制不具有完備性.
鉸接式車輛四自由度動(dòng)力學(xué)模型的研究也具有較長(zhǎng)的歷史,周國(guó)建在1992 年即采用牛頓-歐拉法建立了四自由度鉸接式車輛轉(zhuǎn)向動(dòng)態(tài)數(shù)學(xué)模型[48-49]. 1997 年DeSantis 在其論文中給出了相似的模型[4]. 此后He 等[30]、Azad[40,50]、Dou 等[51-52]也提出了四自由度鉸接式車輛動(dòng)力學(xué)模型. 上述四自由度動(dòng)力學(xué)模型能夠完備地反映鉸接式車輛前車體縱向速度、橫向速度、橫擺角速度和后車體橫擺角速度等狀態(tài),原則上可以滿足鉸接式車輛路徑跟蹤控制的需求. 不過(guò)在這些研究成果中,文獻(xiàn)[48]~[49]只考慮了鉸接式車輛前、后車體在鉸接角發(fā)生變化時(shí)的瞬態(tài)轉(zhuǎn)向特性,而忽略了鉸接角不變時(shí)前、后車體受縱向力和橫向力作用的穩(wěn)態(tài)轉(zhuǎn)向. 文獻(xiàn)[11], [30], [40], [50]~[52]則試圖通過(guò)將液壓轉(zhuǎn)向機(jī)構(gòu)簡(jiǎn)化為彈簧阻尼結(jié)構(gòu)來(lái)解決這個(gè)問(wèn)題,但是簡(jiǎn)化后模型的特性是內(nèi)力矩隨鉸接角近似線性變化,而實(shí)際的鉸接式車輛內(nèi)力矩是由縱向力、橫向力以及車身加速度等狀態(tài)決定的變量. 因此雖然四自由度模型在理論上可以滿足路徑跟蹤控制的需求,但是現(xiàn)有模型仍不足以作為鉸接式車輛路徑跟蹤控制的理論基礎(chǔ).
已知的多自由度鉸接式車輛動(dòng)力學(xué)模型包括Azad 提出的五自由度模型和七自由度模型[40],以及Gao 等提出的十二自由度模型[53]. 對(duì)于路徑跟蹤控制而言,多自由度模型包含了過(guò)多非控制目標(biāo)的狀態(tài)變量,而多個(gè)變量之間的耦合關(guān)系可能會(huì)引起控制器優(yōu)化函數(shù)非凸等問(wèn)題,因此這種模型通常更適合作為測(cè)試控制方法的被控對(duì)象. 不過(guò)多自由度模型處理瞬態(tài)轉(zhuǎn)向與穩(wěn)態(tài)轉(zhuǎn)向之間關(guān)系的方法,可以被移植到四自由度模型的建模研究中,從而幫助建立能夠滿足鉸接式車輛自動(dòng)行駛控制需求的動(dòng)力學(xué)模型.
B. 基于拉格朗日法的動(dòng)力學(xué)模型
基于拉格朗日法的鉸接式車輛動(dòng)力學(xué)模型較為少見(jiàn),劉剛等[54]、葛強(qiáng)勝等[55-56]和Alshaer 等[57]分別基于該方法建立了鉸接式車輛的動(dòng)力學(xué)模型. 通過(guò)拉格朗日法建立的模型計(jì)算量較大,不利于作為路徑跟蹤控制的參考模型,因此基于拉格朗日法的鉸接式車輛動(dòng)力學(xué)模型通常僅作為被控對(duì)象,用于驗(yàn)證控制器的性能.
總而言之,在動(dòng)力學(xué)模型層面,基于牛頓-歐拉法的四自由度鉸接式車輛動(dòng)力學(xué)模型在理論上較為適合作為路徑跟蹤控制的參考模型. 但目前存在的四自由度模型還存在無(wú)法同時(shí)反映瞬態(tài)轉(zhuǎn)向特性和穩(wěn)態(tài)轉(zhuǎn)向特性的問(wèn)題,因此還需參考多自由度模型的建模方法繼續(xù)改進(jìn),才能滿足鉸接式車輛路徑跟蹤控制的需求.
在實(shí)現(xiàn)礦用鉸接式車輛自主行駛的過(guò)程中,需要運(yùn)用實(shí)時(shí)通信、環(huán)境感知、決策規(guī)劃、路徑跟蹤等技術(shù). 其中實(shí)時(shí)通信、環(huán)境感知、決策規(guī)劃是可以用于不同領(lǐng)域的共性技術(shù),而路徑跟蹤是自主行駛系統(tǒng)的最終實(shí)現(xiàn)手段,也是自主行駛系統(tǒng)的核心技術(shù). 礦用鉸接式車輛的路徑跟蹤,即通過(guò)對(duì)巷道環(huán)境信息和車身姿態(tài)信息進(jìn)行實(shí)時(shí)感知,控制鉸接式車輛的車速和轉(zhuǎn)向,從而在保證安全的前提下,使鉸接式車輛沿著規(guī)劃決策系統(tǒng)給出的參考路徑行駛.
根據(jù)日常的駕駛經(jīng)驗(yàn),如果駕駛員將目光適當(dāng)前移,偏離預(yù)定路線的情況將大幅減少. 目光前移的動(dòng)作可以稱為預(yù)瞄,其本質(zhì)是在駕駛員的控制行為中加入預(yù)定路線上的前饋信息. 由于引入前饋信息可以有效提高鉸接式車輛路徑跟蹤控制的精確性,因此可以按照有無(wú)前饋信息對(duì)鉸接式車輛路徑跟蹤控制方面的研究成果進(jìn)行分類.
(1)無(wú)前饋信息的路徑跟蹤控制方法.
無(wú)前饋信息的路徑跟蹤控制方法還可以細(xì)分為有模型控制方法和無(wú)模型控制方法.
A. 有模型控制方法
常用于鉸接式車輛路徑跟蹤控制的有模型控制有兩類,分別是反饋線性化控制和最優(yōu)控制(Optimal control).
a. 反饋線性化控制
反饋線性化控制在鉸接式車輛路徑跟蹤控制中較為常見(jiàn),該方法通過(guò)將鉸接式車輛的運(yùn)動(dòng)學(xué)模型推導(dǎo)為誤差模型,然后基于狀態(tài)反饋控制解算消除各誤差值所需的控制輸入,從而獲得能夠使移動(dòng)裝備跟蹤參考路徑的控制律. 從1996 年直到2019 年, Hemami 和Polotski[58-59]、 Polotski[2-3]、DeSantis[4]、Petrov 和Bigras[5]、Bigras 等[6]、Ridley和Corke[11]、Marshall 等[12]、Zhao 等[13]、Bian 等[16]和Dekker 等[20]等先后使用該方法研究了鉸接式車輛的路徑跟蹤控制.
根據(jù)上述研究工作可知,基于反饋線性化控制的路徑跟蹤控制器可以有效控制鉸接式車輛跟蹤參考路徑. 但是這類控制方法在跟蹤不同參考路徑時(shí)需要設(shè)置相應(yīng)的控制器參數(shù)來(lái)保證控制效果,所以在參考路徑較為復(fù)雜時(shí)難以保證路徑跟蹤控制的效果. 這個(gè)特點(diǎn)導(dǎo)致基于反饋線性化控制的鉸接式車輛路徑跟蹤控制器在實(shí)際應(yīng)用中受到了諸多限制.
b. 最優(yōu)控制
最優(yōu)控制與其他反饋控制的區(qū)別主要在于其鎮(zhèn)定函數(shù)為運(yùn)動(dòng)狀態(tài)等性能指標(biāo)的泛函. 通過(guò)求解泛函的極大值或極小值,即可獲取某一個(gè)或某幾個(gè)性能指標(biāo)的最優(yōu)控制律. 鎮(zhèn)定函數(shù)為二次型的最優(yōu)控制,即LQR(Linear quadratic regulator)控制,Meng 等[19]根據(jù)這種控制方法設(shè)計(jì)了用于鉸接式車輛的路徑跟蹤控制器. 相對(duì)反饋線性化等控制方法,LQR 具有設(shè)計(jì)簡(jiǎn)便、魯棒性較強(qiáng)等優(yōu)勢(shì).但是由于缺乏前饋信息,傳統(tǒng)的LQR 路徑跟蹤控制器在參考路徑存在較大幅度的曲率突變時(shí)仍然性能不佳.
B. 無(wú)模型控制方法
常用于鉸接式車輛路徑跟蹤控制的無(wú)模型控制方法有三類,分別是PID(Proportion integral differential)控制、滑動(dòng)模態(tài)控制(Sliding mode control,SMC)和智能控制.
a. PID 控制
PID 是最為經(jīng)典的無(wú)模型反饋控制方法,其設(shè)計(jì)過(guò)程簡(jiǎn)便,適合用于工程開發(fā),因此PID 控制在鉸接式車輛路徑跟蹤控制中的應(yīng)用十分廣泛. 但是由于控制性能受參數(shù)影響較大,目前研究者們通常將PID 控制器作為改進(jìn)基礎(chǔ)或?qū)φ栈鶞?zhǔn). 近年來(lái)的研究成果中,Alshaer 等采用PID 控制作為模糊控制(Fuzzy control)的對(duì)照組,研究了這兩種控制器在鉸接式車輛路徑跟蹤控制中的性能差異[57].
b. 滑動(dòng)模態(tài)控制
滑動(dòng)模態(tài)控制也就是變結(jié)構(gòu)控制(Variable structure control,VSC),通常也可以簡(jiǎn)稱為滑??刂? SMC 是一種出現(xiàn)于20 世紀(jì)50 年代的特殊非線性反饋控制,其原理是基于系統(tǒng)的狀態(tài),動(dòng)態(tài)改變控制系統(tǒng)的結(jié)構(gòu),迫使系統(tǒng)按照預(yù)先設(shè)定的狀態(tài)軌跡運(yùn)動(dòng). SMC 在路徑跟蹤控制中的應(yīng)用較為廣泛,趙翾等[14]、Nayl 等[60]基于這種方法設(shè)計(jì)了鉸接式車輛路徑跟蹤控制器. 由于SMC 的設(shè)計(jì)與被控對(duì)象的模型無(wú)關(guān),所以具有響應(yīng)速度快、魯棒性強(qiáng)等優(yōu)點(diǎn). 但是SMC 也具有固有缺陷,當(dāng)狀態(tài)軌跡到達(dá)滑模面后,控制量可能會(huì)產(chǎn)生顫動(dòng)[61].
c. 智能控制
智能控制的定義是具有學(xué)習(xí)功能、適應(yīng)功能、組織功能等能力的新型控制方法,是人工智能和自動(dòng)控制學(xué)科交叉產(chǎn)生的最新成果. 目前已經(jīng)出現(xiàn)了多種智能控制方法,其中較為重要的分支包括模糊控制、神經(jīng)網(wǎng)絡(luò)(Neural network,NN)和遺傳算法(Genetic algorithm,GA)[62],這些智能控制方法本身屬于無(wú)模型控制,但是也可以和其他有模型控制或無(wú)模型控制結(jié)合,形成復(fù)合控制器,從而提高控制性能.
在鉸接式車輛的路徑跟蹤控制中,Sasiadek 和Lu 結(jié)合反饋線性化控制與模糊控制建立了控制器[7],Tan 等基于PID 控制的框架設(shè)計(jì)了模糊控制器[17],Alshaer 等則基于誤差設(shè)計(jì)了單獨(dú)的模糊控制器[57]. 這些工作證明了模糊控制性能優(yōu)于反饋線性化控制、PID 控制等作為改進(jìn)基礎(chǔ)或?qū)φ栈鶞?zhǔn)的控制方法. 但是也表明模糊控制的性能受限于控制系統(tǒng)的結(jié)構(gòu).
神經(jīng)網(wǎng)絡(luò)也被稱為人工神經(jīng)網(wǎng)絡(luò)(Artificial NN,ANN),在路徑跟蹤控制中較為常見(jiàn)的神經(jīng)網(wǎng)絡(luò)包括BP(Back propagation)神經(jīng)網(wǎng)絡(luò)、徑向基(Radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)(Reinforcement learning,RL)神經(jīng)網(wǎng)絡(luò)等. 在鉸接式車輛的路徑跟蹤控制中,邵俊愷等提出了基于RL-PID 的控制器[15]. 與模糊控制一樣,神經(jīng)網(wǎng)絡(luò)控制雖然能改進(jìn)控制性能,但是這種控制方法的性能也取決于控制框架.
遺傳算法是一種計(jì)算智能,常用于PID、LQR、SMC 等控制方法中的參數(shù)自適應(yīng)調(diào)整. 孟宇等采用GA 優(yōu)化了LQR 控制器的參數(shù),提高了鉸接式車輛的路徑跟蹤控制性能[19],但是GA 仍然只能對(duì)控制方法的某些性能指標(biāo)進(jìn)行改進(jìn),無(wú)法彌補(bǔ)控制方法機(jī)理方面的不足.
總而言之,受限于前饋信息的缺乏,所有無(wú)前饋信息的路徑跟蹤控制方法均無(wú)法有效解決參考路徑存在較大幅度的曲率突變時(shí)誤差較大的問(wèn)題. 而對(duì)于鉸接式車輛等工作環(huán)境較為狹窄的移動(dòng)裝備,跟蹤存在較大幅度曲率突變的參考路徑是十分常見(jiàn)的工況,因此無(wú)前饋信息的控制方法在鉸接式車輛路徑跟蹤控制中的應(yīng)用受限頗多.而就無(wú)前饋信息的控制方法本身而言,模糊控制、神經(jīng)網(wǎng)絡(luò)等智能控制方法可以有效改善其他控制方法的性能,所以這些控制方法在鉸接式車輛路徑跟蹤控制中仍然具有較為廣闊的應(yīng)用前景.
(2)有前饋信息的路徑跟蹤控制方法.
有前饋信息的路徑跟蹤控制方法可以再細(xì)分為兩類,前饋-反饋(Feedforward-Feedback)控制和模型預(yù)測(cè)控制.
A. 前饋-反饋控制
在路徑跟蹤控制中,前饋-反饋控制即將參考路徑上的前饋信息引入無(wú)前饋信息的反饋控制器的控制方法,上文中提到的反饋線性化控制、最優(yōu)控制、PID 控制、SMC 和智能控制均可作為前饋-反饋控制中的反饋控制方法. 在乘用車等移動(dòng)裝備的路徑跟蹤控制中,前饋-反饋控制已經(jīng)得到了較為廣泛的應(yīng)用[63-64]. 在鉸接式車輛的路徑跟蹤控制中,孟宇等采用將預(yù)瞄誤差加入優(yōu)化目標(biāo)的方法提出了前饋-LQR 路徑跟蹤控制器,一定程度改善了鉸接式車輛跟蹤曲率變化幅度較大的參考路徑時(shí)的性能[18]. 但是受限于預(yù)瞄距離的設(shè)置,前饋-反饋控制器在參考路徑包含不同幅度的曲率突變時(shí)仍然誤差較大.
B. 模型預(yù)測(cè)控制
模型預(yù)測(cè)控制也是一種最優(yōu)控制,MPC 與最優(yōu)控制的關(guān)系如圖1 所示. MPC 通常也會(huì)被稱為后退時(shí)域控制(Receding horizon control,RHC)、滾動(dòng)時(shí)域控制(Moving horizon control,MHC)等[65].MPC 在路徑跟蹤控制中的應(yīng)用十分廣泛,其原理是基于移動(dòng)裝備的數(shù)學(xué)模型建立預(yù)測(cè)模型,然后通過(guò)預(yù)測(cè)模型基于當(dāng)前的位姿狀態(tài)和所有可行的控制輸入預(yù)測(cè)未來(lái)所有可能的位姿狀態(tài),接著通過(guò)優(yōu)化目標(biāo)函數(shù)找出其中與參考狀態(tài)最為接近的位姿狀態(tài),進(jìn)而得到該狀態(tài)對(duì)應(yīng)的控制輸入. 由于在引入?yún)⒖紶顟B(tài)時(shí),可以加入?yún)⒖悸窂降淖兓厔?shì)等信息,所以MPC 跟蹤復(fù)雜參考路徑的能力顯著優(yōu)于其他控制方法. 而且在確定控制輸入的可行范圍時(shí),可以加入系統(tǒng)的約束條件,所以MPC能夠顯式地處理系統(tǒng)約束,從而獲得相對(duì)其他控制方法十分顯著的優(yōu)勢(shì).
圖 1 MPC 與最優(yōu)控制的關(guān)系Fig.1 Relationship between MPC and optimal control
在2012 年至2015 年,Nayl 等提出了一種基于切換模型預(yù)測(cè)控制(Switching-MPC,SMPC)的鉸接式車輛路徑跟控制器,并證明了SMPC 的性能優(yōu)于LQR 和基于極點(diǎn)配置(Pole placement,PP)的反饋線性化控制[24-26]. 考慮到該控制器的預(yù)測(cè)模型是由鉸接式車輛的運(yùn)動(dòng)學(xué)模型推導(dǎo)獲得的線性誤差模型,所以SMPC 是一種線性MPC(Linear MPC,LMPC). 在2019 年,孟宇等提出了基于線性時(shí)變MPC(Linear time varying MPC, LTV-MPC)的鉸接式車輛路徑跟蹤控制器[66],這種控制方法也是一種典型的LMPC.
上述LMPC 是一種采用當(dāng)前誤差預(yù)測(cè)未來(lái)誤差的控制方法,當(dāng)參考路徑存在較大幅度的曲率突變且鉸接式車輛的縱向行駛速度較高時(shí),預(yù)測(cè)獲得的未來(lái)誤差和實(shí)際的未來(lái)誤差之間偏差較大,所以在這種情況下LMPC 控制器的精確性仍然不足[10]. 非線性MPC(Nonlinear MPC, NMPC)在跟蹤存在大幅度曲率突變的參考路徑時(shí)相比LMPC性能更佳,因此白國(guó)星等提出了一種基于NMPC 的鉸接式車輛路徑跟蹤控制器[10]和一種基于NMPC的鉸接式車輛反應(yīng)式導(dǎo)航運(yùn)動(dòng)控制器[67],取得了相比LMPC 控制器更加精確的控制效果. 不過(guò)NMPC 控制器的計(jì)算成本較高,所以其實(shí)時(shí)性還有待進(jìn)一步優(yōu)化.
綜合上述研究現(xiàn)狀可知,在有前饋信息的路徑跟蹤控制方法中,MPC 能夠有效引入?yún)⒖悸窂降那梆佇畔ⅲ覠o(wú)需考慮預(yù)瞄距離的設(shè)置等問(wèn)題,此外MPC 在處理系統(tǒng)約束方面也具有十分顯著的優(yōu)勢(shì),所以MPC 有助于提高鉸接式車輛路徑跟蹤控制在參考路徑存在較大幅度曲率突變時(shí)的精確性. 而在現(xiàn)存的多種MPC 中,NMPC 能夠更加充分地利用參考路徑的前饋信息,在鉸接式車輛等工作環(huán)境狹窄的移動(dòng)裝備的路徑跟蹤控制中具有較為廣泛的應(yīng)用前景.
白國(guó)星等在對(duì)基于MPC 的路徑跟蹤控制進(jìn)行回顧和比較時(shí)發(fā)現(xiàn),目前存在兩種NMPC 控制器設(shè)計(jì)思路,一種是以離散化后的運(yùn)動(dòng)學(xué)模型作為預(yù)測(cè)模型的典型NMPC 設(shè)計(jì)方法,另一種是以離散化后的非線性誤差模型作為預(yù)測(cè)模型的非線性誤差MPC(Nonlinear error MPC, NEMPC)[68],各種MPC 的關(guān)系如圖2 所示,下文中的NMPC 專指典型NMPC.
圖 2 MPC 及其分支Fig.2 MPC and its branches
在文獻(xiàn)[68]中,白國(guó)星等比較了NMPC 與NEMPC在移動(dòng)機(jī)器人路徑跟蹤控制中的性能,但是移動(dòng)機(jī)器人的運(yùn)動(dòng)學(xué)特性較鉸接式車輛較為簡(jiǎn)單,因此對(duì)于這兩種控制方法在鉸接式車輛路徑跟蹤控制中的性能目前還未進(jìn)行比較. 將式(3)中的模型代入文獻(xiàn)[68]中的NEMPC 控制器設(shè)計(jì)過(guò)程,即可建立基于NEMPC 的鉸接式車輛路徑跟蹤控制器.NMPC 控制器的設(shè)計(jì)過(guò)程則可以參考文獻(xiàn)[10]和[69].為了保證比較的一致性,兩個(gè)控制系統(tǒng)中鉸接式車輛和控制器的參數(shù)均一致,如表1 所示.
表 1 鉸接式車輛和控制器參數(shù)Table 1 Parameters of the articulated vehicle and controllers
參考路徑為直線和圓弧組成的路徑. 其中圓弧路徑的半徑為15 m,仿真起點(diǎn)的坐標(biāo)為(20, 80).參考速度設(shè)置為4 m·s-1時(shí),仿真結(jié)果如圖3 所示.圖4 所示為仿真結(jié)果的局部放大. 圖5 和圖6 顯示了橫向誤差和航向誤差. 圖7 顯示了控制器在每個(gè)控制周期內(nèi)的運(yùn)算時(shí)間.
圖 3 NMPC 和NEMPC 的仿真結(jié)果Fig.3 Simulation results of NMPC and NEMPC
圖 4 NMPC 和NEMPC 的仿真結(jié)果局部放大Fig.4 Partial enlargement of simulation results of NMPC and NEMPC
圖 5 NMPC 和NEMPC 的橫向誤差Fig.5 Lateral error of NMPC and NEMPC
圖 6 NMPC 和NEMPC 的航向誤差Fig.6 Heading error of NMPC and NEMPC
圖 7 NMPC 和NEMPC 的運(yùn)算時(shí)間Fig.7 Computation time of NMPC and NEMPC
根據(jù)仿真結(jié)果可知,NEMPC 在精確性方面遜色于NMPC. 而在實(shí)時(shí)性方面,NEMPC 的平均運(yùn)算時(shí)間和最大運(yùn)算時(shí)間小于NMPC 的平均運(yùn)算時(shí)間和最大運(yùn)算時(shí)間,但是NEMPC 的最大運(yùn)算時(shí)間大于控制周期,所以它的實(shí)時(shí)性同樣有待進(jìn)一步優(yōu)化.
總之在參考路徑存在較大幅度的曲率突變時(shí),NMPC 精確性顯著優(yōu)于NEMPC,與文獻(xiàn)[68]中得到的結(jié)論一致,由此可知該結(jié)論不受被控平臺(tái)運(yùn)動(dòng)學(xué)特性的影響. 至于在參考路徑存在較大幅度的曲率突變時(shí)NEMPC 誤差較大的原因,與文獻(xiàn)[10]中LMPC 誤差較大的原因類似. NEMPC 也通過(guò)當(dāng)前誤差預(yù)測(cè)未來(lái)誤差,它與LMPC 的區(qū)別僅為預(yù)測(cè)的迭代過(guò)程中保留了非線性項(xiàng).
接著繼續(xù)分析NMPC 的性能. 通過(guò)圖5 和圖6可知,NMPC 在跟蹤直線路徑時(shí)誤差較小,而參考路徑在直線和彎道之間切換時(shí),即參考路徑存在較大幅度的曲率突變時(shí),橫向誤差和航向誤差均有所增大. 因此可以合理推斷,當(dāng)參考路徑的曲率突變幅度更大時(shí),路徑跟蹤控制將產(chǎn)生更大的誤差. 此外當(dāng)基于NMPC 的鉸接式車輛路徑跟蹤控制器以不同的參考速度跟蹤上述參考路徑時(shí),可以得到不同的橫向誤差最大值和航向誤差最大值. 隨著參考速度的增加,誤差最大值也會(huì)出現(xiàn)增加的趨勢(shì). 當(dāng)其他參數(shù)與上述仿真一致時(shí),NMPC的誤差最大值變化趨勢(shì)如圖8 所示.
圖 8 NMPC 的誤差最大值隨參考速度變化趨勢(shì)Fig.8 Change trend in maximum error of NMPC with reference velocity changes
由此可知,在參考路徑存在較大幅度的曲率突變以及參考速度較高時(shí),雖然基于NMPC 的鉸接式車輛路徑跟蹤控制器較基于其他控制方法的控制器精確性較高,但是這種控制器仍然存在繼續(xù)改進(jìn)的余地.
針對(duì)上述問(wèn)題,至少存在兩種解決思路. 第一種思路是繼續(xù)改進(jìn)NMPC,白國(guó)星等在針對(duì)移動(dòng)機(jī)器人的路徑跟蹤控制中發(fā)現(xiàn)NMPC 的優(yōu)化目標(biāo)和參考速度之間存在耦合關(guān)系[70],針對(duì)該耦合關(guān)系進(jìn)行解耦研究,能夠進(jìn)一步提高在參考路徑存在較大幅度曲率突變時(shí)的路徑跟蹤控制精確性.第二種思路是加入速度決策控制器,白國(guó)星等提出了一種結(jié)合NMPC 和LMPC 的多層MPC(Multilayer MPC, MMPC)路徑跟蹤控制器. 這種控制器采用能夠在更長(zhǎng)的預(yù)測(cè)時(shí)域精確預(yù)測(cè)鉸接式車輛位姿的NMPC 控制器作為速度決策控制器,采用實(shí)時(shí)性更好的LMPC 控制器作為底層路徑跟蹤控制器,從而實(shí)現(xiàn)了通過(guò)動(dòng)態(tài)調(diào)節(jié)縱向速度進(jìn)一步提高路徑跟蹤控制精確性的目的[71]. 不過(guò)在路徑跟蹤控制系統(tǒng)存在較大幅度的定位誤差時(shí),MMPC控制下的鉸接式車輛可能會(huì)陷入低速行駛的狀態(tài),因此這項(xiàng)工作還需進(jìn)一步完善.
目前,基于NMPC 的鉸接式車輛路徑跟蹤控制存在的另一個(gè)問(wèn)題是預(yù)測(cè)模型仍然以運(yùn)動(dòng)學(xué)模型為基礎(chǔ). 在鉸接式車輛以較低的參考速度(如5 m·s-1以下)運(yùn)行時(shí),以運(yùn)動(dòng)學(xué)為基礎(chǔ)的NMPC 路徑跟蹤控制系統(tǒng)性能較好,但是在鉸接式車輛以較高的參考速度(如10 m·s-1以上)運(yùn)行時(shí),側(cè)向速度導(dǎo)致的精確性下降和安全性惡化的問(wèn)題必須被納入考慮. 研究者們針對(duì)移動(dòng)機(jī)器人的研究[70]和針對(duì)乘用車等移動(dòng)裝備的研究[72-76]表明,以動(dòng)力學(xué)模型作為預(yù)測(cè)模型的基礎(chǔ)可以有效解決這個(gè)問(wèn)題. 因此基于NMPC 的鉸接式車輛路徑跟蹤控制的一個(gè)重要發(fā)展方向,就是建立以動(dòng)力學(xué)模型為預(yù)測(cè)模型的控制器,提高鉸接式車輛以較高參考速度運(yùn)行時(shí)路徑跟蹤控制的精確性.
此外,根據(jù)前文中的仿真結(jié)果可知,目前基于NMPC 的鉸接式車輛路徑跟蹤控制器還面臨著實(shí)時(shí)性方面的挑戰(zhàn). 隨著計(jì)算機(jī)硬件性能的飛速進(jìn)步,實(shí)時(shí)性問(wèn)題已經(jīng)不再是限制NMPC 路徑跟蹤控制方法應(yīng)用的瓶頸,本文仿真中使用的計(jì)算機(jī)處理器僅為Intel(R)Core(TM)i5-8500 @ 3.00 GHz,如果采用性能更強(qiáng)的處理器,NMPC 在實(shí)時(shí)性方面的表現(xiàn)必然會(huì)有所提升,但是出于成本控制的考慮,實(shí)時(shí)性方面的優(yōu)化仍然是基于NMPC 的鉸接式車輛路徑跟蹤控制領(lǐng)域中的一個(gè)重要發(fā)展方向.
從鉸接式車輛數(shù)學(xué)模型和鉸接式車輛路徑跟蹤控制方法兩個(gè)方面,回顧了礦用鉸接式車輛路徑跟蹤控制關(guān)鍵研究點(diǎn)的現(xiàn)狀和進(jìn)展,并得出了以下結(jié)論與展望:
(1)在數(shù)學(xué)模型研究中,鉸接式車輛的無(wú)側(cè)滑經(jīng)典運(yùn)動(dòng)學(xué)模型在行駛速度較低時(shí)精確性較高,完全能夠滿足鉸接式車輛低速路徑跟蹤控制的需求,可以作為低速路徑跟蹤控制的參考模型. 而有側(cè)滑運(yùn)動(dòng)學(xué)模型在低速時(shí)性能與無(wú)側(cè)滑經(jīng)典運(yùn)動(dòng)學(xué)模型相近,高速時(shí)則存在可能增大側(cè)滑趨勢(shì)的問(wèn)題. 在動(dòng)力學(xué)模型層面,目前基于牛頓-歐拉法建立的鉸接式車輛四自由度動(dòng)力學(xué)模型原則上能夠滿足路徑跟蹤控制的需求,但是目前存在的四自由度模型無(wú)法同時(shí)反映鉸接式車輛的瞬態(tài)轉(zhuǎn)向特性和穩(wěn)態(tài)轉(zhuǎn)向特性,還需要繼續(xù)加以改進(jìn).
(2)在路徑跟蹤控制方法研究中,傳統(tǒng)的無(wú)前饋信息控制方法,如反饋線性化控制、最優(yōu)控制、PID 控制、SMC 等,均無(wú)法有效解決鉸接式車輛跟蹤存在較大幅度曲率突變的參考路徑時(shí)誤差較大的問(wèn)題. 基于上述反饋控制提出的前饋-反饋控制可以用于解決上述問(wèn)題,但是受限于預(yù)瞄距離的設(shè)置,前饋-反饋控制器在參考路徑包含不同幅度的曲率突變時(shí)仍然誤差較大,在后續(xù)的研究中可以通過(guò)自動(dòng)調(diào)整預(yù)瞄距離進(jìn)一步提高前饋-反饋控制的精確性. MPC 是另一種引入前饋信息的控制方法,這種控制方法可以更加有效地利用前饋信息,且不需要考慮預(yù)瞄距離的設(shè)置. 而在目前存在的多種MPC 中,NMPC 較LMPC、NEMPC 等方法在跟蹤存在較大幅度曲率突變的參考路徑時(shí)精確性更高
(3)對(duì)于基于NMPC 的鉸接式車輛路徑跟蹤控制,目前仍然存在三方面的問(wèn)題. 首先,這種控制方法仍然存在誤差最大值隨參考速度增大而增加的趨勢(shì). 這個(gè)問(wèn)題可以通過(guò)對(duì)NMPC 進(jìn)行解耦研究和增加速度決策控制器來(lái)解決,但是目前尚未出現(xiàn)成熟的研究成果. 其次,目前基于NMPC 的鉸接式車輛路徑跟蹤控制仍然以運(yùn)動(dòng)學(xué)模型作為預(yù)測(cè)模型的理論基礎(chǔ),從而無(wú)法解決鉸接式車輛以較高的參考速度運(yùn)行時(shí)側(cè)向速度導(dǎo)致的精確性下降和安全性惡化的問(wèn)題. 這個(gè)問(wèn)題需要通過(guò)建立以動(dòng)力學(xué)模型為預(yù)測(cè)模型的路徑跟蹤控制器來(lái)解決,因此必須加緊研究面向路徑跟蹤控制的鉸接式車輛動(dòng)力學(xué)模型. 最后,這種控制方法仍然面臨著實(shí)時(shí)性方面的挑戰(zhàn),所以還需對(duì)該控制方法進(jìn)行實(shí)時(shí)性優(yōu)化研究.