何臣修,郭世永
(青島理工大學(xué)機(jī)械與汽車工程學(xué)院,山東 青島 266520)
智能車輛(IV)和智能交通系統(tǒng)(ITS)是近年來的焦點(diǎn)話題[1]。它們集信息技術(shù),傳感器技術(shù),自動(dòng)控制技術(shù)于一體,為節(jié)省燃料消耗和減少污染物排放提供了巨大潛力[2]。車輛中配備的高級(jí)駕駛員輔助系統(tǒng)(ADAS)是ITS[3]的關(guān)鍵組件,通常包含自適應(yīng)巡航控制(ACC),主動(dòng)緊急制動(dòng)(AEB),自動(dòng)停車,換道輔助等[4]。作為ADAS的一項(xiàng)關(guān)鍵技術(shù)[5],ACC可以通過執(zhí)行控制系統(tǒng)來調(diào)節(jié)當(dāng)前車輛的速度以實(shí)現(xiàn)車輛跟蹤,它通常包括三個(gè)模塊:感知,決策和控制[6]。感知模塊可以通過輪速傳感器和毫米雷達(dá)波獲得當(dāng)前和先前車輛的狀態(tài)。然后,決策模塊計(jì)算所需的加速度并將其傳遞給控制模塊。控制模塊操作制動(dòng)或驅(qū)動(dòng)系統(tǒng)以控制車輛的縱向運(yùn)動(dòng)。
關(guān)于ACC已有許多研究。恒定時(shí)間車距(CTH)和可變時(shí)間車距(VTH)[7]得到了廣泛的研究。與只能解決簡(jiǎn)單工作條件的CTH相比,VTH的期望跟隨距離隨相對(duì)速度變化而變化。因此,VTH具有更好的適應(yīng)性。然而,考慮到復(fù)雜的駕駛環(huán)境,VTH不涉及前車的加速,因此,還有更多的改進(jìn)空間[8]。在ACC 流程中,并不是要唯一優(yōu)化車輛動(dòng)力學(xué)的目標(biāo)。文獻(xiàn)[9]提出了一種多目標(biāo)解耦分層策略,并協(xié)調(diào)控制跟蹤能力、燃油經(jīng)濟(jì)性和乘坐舒適性。除了這些方法,MPC還因?yàn)槠溆行院妥罴研阅芏晒?yīng)用于許多領(lǐng)域[10]。然而,沉重的計(jì)算負(fù)擔(dān)對(duì)于數(shù)值優(yōu)化是一個(gè)巨大的問題。在參考文獻(xiàn)[11]中,提出了一種快速在線計(jì)算方法,以減少M(fèi)PC控制器中后退水平優(yōu)化的在線計(jì)算負(fù)擔(dān)。
與以往的出版物不同,這里重點(diǎn)討論了如何利用MPC來實(shí)現(xiàn)ACC的多個(gè)目標(biāo)。
組織如下。第二節(jié)在模型預(yù)測(cè)控制(MPC)理論框架下對(duì)上層控制器進(jìn)行綜合。第三節(jié)提出了三種參數(shù)調(diào)整方法,包括高斯過程回歸(GPR)和網(wǎng)格搜索(GS)。第四部分,在MPC 框架下,采用粒子群優(yōu)化算法(PSO)進(jìn)行優(yōu)化。最后一部分,作者進(jìn)行了總結(jié)。
由于發(fā)動(dòng)機(jī)扭矩圖是靜態(tài)非線性的,隨時(shí)間變化的齒輪位置和氣動(dòng)阻力作為車速的二次函數(shù),因此車輛的縱向動(dòng)力學(xué)是非線性的。傳統(tǒng)的自適應(yīng)巡航控制器包括兩個(gè)層次,一個(gè)上層控制器和一個(gè)下層控制器。上層控制器根據(jù)車輛間狀態(tài)和車輛狀態(tài)確定期望的縱向加速度。下層控制器確定加速踏板位置和制動(dòng)壓力輸入,以確保實(shí)際加速度跟蹤所需的加速度。然而,在合成下層控制器時(shí),縱向動(dòng)力學(xué)模型的非線性存在帶來了很大的挑戰(zhàn)。為了彌補(bǔ)這一缺陷,應(yīng)用了逆動(dòng)力學(xué)控制設(shè)計(jì)方法[12]。期望加速度與實(shí)際加速度之間的關(guān)系可以表示如下:
式中:KL—系統(tǒng)增益;TL—時(shí)間常數(shù)。
通過頻率響應(yīng)法將參數(shù)識(shí)別為KL=0.99,TL=0.35KL
根據(jù)車輛之間的縱向動(dòng)力學(xué),定義了兩個(gè)狀態(tài)變量。第一個(gè)是距離誤差,表示為:
式中:ddes—駕駛員期望的車間距離,這里我們采用恒定時(shí)間間隔策略來描述:
式中:τh=3s—標(biāo)稱行車間隔時(shí)間,d0=15m是典型駕駛員的停車距離。第二個(gè)狀態(tài)變量是速度誤差,定義為:
式中:vp—前面車輛的速度;vf—后面跟隨車輛的速度。
集成了廣義車輛縱向動(dòng)力學(xué)系統(tǒng)(GVLD)和車輛間縱向動(dòng)力學(xué)系統(tǒng),建立了汽車跟隨系統(tǒng)的三狀態(tài)空間模型,其模型如下:
其中,
式中:ap—前面車輛的加速度;u—控制輸入;v—可測(cè)量的干擾;x—系統(tǒng)狀態(tài)。
考慮到MPC算法通常是在離散時(shí)域中設(shè)計(jì)和實(shí)現(xiàn)的,因此通過零階保持(ZOH)離散化將連續(xù)時(shí)間轉(zhuǎn)換為離散時(shí)間模型,得出:
式中:k—第k個(gè)采樣點(diǎn);A、B和G—系統(tǒng)矩陣,用數(shù)學(xué)表示為:
跟蹤能力通常根據(jù)速度誤差和距離誤差來指定,表示為:
油耗定義為所需縱向加速度及其導(dǎo)數(shù)的2范函數(shù),而不是實(shí)際縱向加速度和加速度率:
然后成本函數(shù)可以表示為:
為了推導(dǎo)二次編程的標(biāo)準(zhǔn)形式,定義了以下向量:
因此,獲得以下擴(kuò)展?fàn)顟B(tài)空間模型:
其中,
QP問題的標(biāo)準(zhǔn)成本函數(shù)可以表示為:
其中,
對(duì)于ACC中駕駛員的縱向乘坐舒適性問題,我們同時(shí)限制了加速度和加速度率,具體如下:
此外,采用駕駛員允許的跟蹤范圍標(biāo)準(zhǔn)來限制Δd和Δv并在特定范圍內(nèi)。
式中:Δdmin=-5m—Δd的下邊界;Δdmax=6m—Δd的上邊界;Δvmin=-1.0m/s—Δv下邊界,而Δvmax=0.9 m/s是的Δv上邊界。
MO-ACC算法的一個(gè)關(guān)鍵問題是預(yù)測(cè)優(yōu)化問題的計(jì)算不可行性,這個(gè)QP問題可能沒有最優(yōu)解,因?yàn)橛布s束永遠(yuǎn)不能滿足。為了解決這個(gè)問題,我們引入了一個(gè)松弛變量來軟化約束。
一個(gè)新的成本函數(shù)加上一個(gè)松弛變量的二次項(xiàng)可以表示為:
式中:ε—松弛變量;ρ—其加權(quán)系數(shù)。
當(dāng)超過硬邊界時(shí),松弛變量將自動(dòng)變?yōu)檎?,以允許違反硬約束,從而避免潛在的計(jì)算不可行性。當(dāng)硬約束不超過0時(shí),就不會(huì)違反硬約束。
MPC-ACC 問題的關(guān)鍵問題是參數(shù)的選擇。影響結(jié)果的參數(shù)有Np,ωΔd,ωΔv,ωu,ωdu。在參數(shù)調(diào)整過程中,采用高斯過程回歸和網(wǎng)格搜索的方法來尋找最佳參數(shù)。
跟蹤性能的優(yōu)度由TEI衡量(Δv和Δd使用標(biāo)準(zhǔn)單位)
式中:T—ACC的模擬時(shí)間(模擬中T=800s);Δd—距離誤差,單位為m;Δv—相對(duì)速度(m/s)。
后車燃油經(jīng)濟(jì)性用FCM(L/100km)衡量。
式中:S—跟車行駛距離,單位為km;
Qeng—發(fā)動(dòng)機(jī)的燃油率,單位為L(zhǎng)/s。
首先,作者嘗試使用高斯過程回歸來調(diào)整其他參數(shù),以獲取函數(shù)的分布。在參數(shù)調(diào)整過程中,ωu和ωdu的最佳結(jié)果始終圍繞以下數(shù)字(ωu=0.01,ωdu=0.01)。因此,GPR用于預(yù)測(cè)ωu和ωdu的最佳數(shù)。ωu和ωdu的結(jié)果,如圖1、圖2所示。
圖1 FCM(GPR)的變化結(jié)果Fig.1 FCM(GPR)Change Results
圖2 TE(IGPR)的變化結(jié)果Fig.2 The Change of TE(IGPR)
當(dāng)TEI和FCM達(dá)到最小值時(shí),ωΔd和ωΔv的數(shù)量,如表1所示。
表1 參數(shù)Tab.1 Parameters
在高斯進(jìn)度回歸之后,作者在更改“預(yù)測(cè)范圍”的同時(shí)設(shè)置了其他參數(shù),如表2所示。
表2 參數(shù)Tab.2 Parameters
反映TEI和FCM的結(jié)果,如圖3、圖4所示。
圖3 FEI的結(jié)果Fig.3 Results of FEI
圖4 FCM的結(jié)果Fig.4 Results of FCM
如圖3、圖4所示,當(dāng)Np=4時(shí),TEI和FCM的結(jié)果最佳。在這模擬中,當(dāng)Np>5時(shí),Np越大,MPC的性能就越差。
但是,ωΔd和ωΔv的值將相互影響對(duì)方的最優(yōu)值。為了更準(zhǔn)確地獲得最優(yōu)參數(shù)集,采用了網(wǎng)格搜索(GS)。
GR的步長(zhǎng)為0.01;
TEI、FCM的調(diào)整結(jié)果(GS)示意圖,如圖5、圖6所示。
圖5 TEI的調(diào)整結(jié)果(GS)Fig.5 Adjustment Results of TE(IGS)
圖6 FCM的調(diào)整結(jié)果(GS)Fig.6 FCM Adjustment Results(GS)
如圖5、圖6 所示,TEI 隨著ωΔd的增加而減小,而FCM 隨著ωΔv的增加而減小。最佳結(jié)果,如表3所示。第一行是GPR的結(jié)果,第二行是GS的結(jié)果。
表3 GPR與GS的最佳結(jié)果Tab.3 Best Results of GPR and GS
第三節(jié)中提到的網(wǎng)格搜索方法提供了搜索更好的解決方案的方法。如果花費(fèi)足夠的時(shí)間,則會(huì)找到最佳解決方案。雖然通過上述方法搜索的解決方案是特定模型的最佳解決方案,但由于模型不匹配和錯(cuò)誤,它可能不是ACC問題的最佳解決方案。
反映控制輸出加速度的加權(quán)因子ωu對(duì)TEI的影響,如圖7所示。在(0.01~0.1)范圍內(nèi),ωu增大會(huì)導(dǎo)致TEI增大,這是因?yàn)榧铀俣仍?附近收縮,從而使車速狀態(tài)恒定,當(dāng)前一個(gè)車速變化時(shí),速度誤差和距離誤差會(huì)導(dǎo)致TEI增大。
圖7 ωu對(duì)TEI的影響Fig.7 Effect of ωu on TEI
反映ωu對(duì)燃油率的影響,如圖8所示。在(0.01~0.1)之間,ωu增加。在總體趨勢(shì)上會(huì)導(dǎo)致燃油率的上升,這意味著燃油率的成本函數(shù)不能完全代表燃油成本。在文獻(xiàn)[13]中,恒定巡航速度不是燃油經(jīng)濟(jì)性的最佳策略,而脈沖和滑行策略使發(fā)動(dòng)機(jī)工作在高效區(qū),從而提供更好的燃油經(jīng)濟(jì)性。
圖8 ωu對(duì)燃料率的影響Fig.8 Effectofωuon Fuel Rate
因此,零加速不是燃油經(jīng)濟(jì)性的最佳選擇。并且在不同的駕駛階段,加速度的最優(yōu)值是不同的,因此燃料成本的成本函數(shù)被改變?yōu)榈仁剑?),其中,最佳加速度是根據(jù)駕駛階段進(jìn)行自適應(yīng)調(diào)整的。
反映最佳加速度對(duì)TEI的影響,如圖9所示。分別為0.5,5和0.01。范圍在(-0.5~0.2)m/s2之間,ωu增加,將導(dǎo)致TEI的增加。
圖9 最佳加速度對(duì)TEI的影響Fig.9 Effect of Optimum Acceleration on TEI
在總體趨勢(shì)中,0m/s2和-0.5m/s2的aopt燃油經(jīng)濟(jì)性更好,并且其影響因巡航階段而異。首先,-0.5m/s2的aopt更好,而下一階段0m/s2更好。
根據(jù)A部分的結(jié)果和分析,提出了一種基于規(guī)則的參數(shù)變化方法,以提高燃油經(jīng)濟(jì)性。規(guī)則總結(jié)如下:(1)當(dāng)遠(yuǎn)離所需距離時(shí),增加距離的權(quán)重因子;(2)在遠(yuǎn)離所需距離時(shí)增加最佳加速度。反映不同誤差參數(shù)的跟蹤值,如表4所示?;谶@組參數(shù),TEI的跟蹤性能為0.6338,F(xiàn)CM的跟蹤性能為7892。
表4 不同誤差范圍內(nèi)的參數(shù)Tab.4 Parameters in Different Error Ranges
模型預(yù)測(cè)控制具有良好的動(dòng)態(tài)控制性能,但計(jì)算量大等缺點(diǎn)更為明顯。隨著預(yù)測(cè)和控制域的增加,計(jì)算量也在增加,這可能導(dǎo)致控制器失去實(shí)時(shí)性。這里將粒子群優(yōu)化算法應(yīng)用于MPC問題的求解。在最優(yōu)解基本一致的前提下,求解速度大大提高。
粒子群算法的思想來源于自然界鳥類群體的覓食行為[14]。其基本思想是初始化一組隨機(jī)粒子,并對(duì)其在當(dāng)前位置的適應(yīng)度進(jìn)行評(píng)估,從而得到每個(gè)粒子在當(dāng)前位置的最優(yōu)位置,即局部最優(yōu)解。然后,程序比較所有的局部最優(yōu)解,得到當(dāng)前時(shí)刻的全局最優(yōu)解以其他粒子的速度逼近全局最優(yōu)解的位置。最后,確定當(dāng)前結(jié)果是否滿足要求,如果不滿足,則需要重復(fù)上述過程,直到滿足為止,并結(jié)束搜索。粒子群算法以其易于使用、全局尋優(yōu)能力強(qiáng)、集變量少等優(yōu)點(diǎn)而備受重視。方程(30)和方程(31)是算法的數(shù)學(xué)表達(dá)式,是代碼的主要依據(jù)。
使用該算法求解MPC方程時(shí),需要處理兩點(diǎn):(1)確定粒子與控制參數(shù)之間的關(guān)系,以及每個(gè)粒子的大小和粒子的搜索范圍。(2)確定算法參數(shù)的值,包括最大迭代次數(shù),粒子總數(shù)大小,加速度系數(shù)和慣性系數(shù)。以下討論主要基于以上兩點(diǎn)。
在MPC問題中,我們提到了成本函數(shù),控制參數(shù),預(yù)測(cè)范圍,控制范圍和約束條件等。在這里,我們將它們與粒子群算法相對(duì)應(yīng)。成本函數(shù)的展開形式用作評(píng)估適用性的目標(biāo)函數(shù),控制參數(shù)為粒子。每個(gè)粒子具有四個(gè)維度,這是預(yù)測(cè)范圍的大小。最后,MPC約束用于定義粒子群的搜索范圍。這樣,我們完成了算法結(jié)構(gòu)的構(gòu)建。
這里將最大迭代次數(shù)設(shè)置為1000,如圖10所示,圖10(b)是圖10(a)的局部放大圖,具體顯示了0到50次迭代期間最優(yōu)值的下降趨勢(shì)??梢钥吹?,在第30代左右就已達(dá)到最佳解,隨后的迭代不再重要,只會(huì)增加計(jì)算負(fù)擔(dān)。
圖10 最優(yōu)值與迭代次數(shù)的關(guān)系Fig.10 Relationship Between Optimal Value and Iteration Times
然后進(jìn)行了一系列的對(duì)比仿真。具體數(shù)據(jù),如表5所示。綜合考慮控制效果和計(jì)算時(shí)間,以最大迭代次數(shù)為10次為宜。這樣,在保證最優(yōu)解精度的同時(shí),也提高了計(jì)算速度。
表5 對(duì)比實(shí)驗(yàn)數(shù)據(jù)Tab.5 Comparative Experimental Data
這里采用全局收縮因子來計(jì)算加速度系數(shù),它可以控制粒子的動(dòng)力學(xué)性能[15]。其數(shù)學(xué)表達(dá)式如下:
為了加快算法的收斂速度,這里采用線性變慣量系數(shù)[16]。公式是其計(jì)算方法,指當(dāng)前迭代次數(shù),w1及w2是慣性系數(shù)的初值和終值。整理后,w1=0.9,w2=0.4。這樣,粒子群算法在保證最優(yōu)解精度的同時(shí),可以減少計(jì)算時(shí)間。
最后,我們比較了常用內(nèi)點(diǎn)法和PSO的結(jié)果。試驗(yàn)結(jié)果,如表6所示。根據(jù)指標(biāo)及其計(jì)算時(shí)間,可以看出兩者的性能基本相同。但是,PSO的時(shí)間大約是內(nèi)部點(diǎn)方法的25%。驗(yàn)證了粒子群優(yōu)化算法解決加速模型預(yù)測(cè)控制問題的可行性。
表6 效果比較Tab.6 Effect Comparison
這里采用模型預(yù)測(cè)控制理論來同時(shí)滿足有效跟蹤能力,高燃油經(jīng)濟(jì)性,駕駛員期望響應(yīng)和避免碰撞等控制目標(biāo),得出以下結(jié)論。(1)在ACC過程中,過多的跟蹤誤差可能會(huì)導(dǎo)致不可行的解決方案。使用約束管理方法糾正其優(yōu)化問題后,MPC可以自動(dòng)放寬約束范圍,從而可以有效避免控制律的不可行解決方案。(2)在參數(shù)調(diào)整期間,使用高斯進(jìn)度回歸和網(wǎng)格搜索方法來找到權(quán)重ωΔd和ωΔv的最佳值。當(dāng)預(yù)測(cè)范圍NP等于4時(shí),可以使用另一種參數(shù)自適應(yīng)調(diào)整方法實(shí)時(shí)調(diào)整權(quán)重。(3)采用粒子群算法求解MPC 控制器的優(yōu)化問題。在確保最優(yōu)解一致的前提下,使用PSO優(yōu)化目標(biāo)函數(shù)可以大大提高求解速度。
由于MPC控制器具有較高的仿真性能,未來的工作將集中在實(shí)際車輛上。