郭泉成
廣州鐵路職業(yè)技術(shù)學(xué)院 機車車輛學(xué)院,廣東廣州,510430
在對智能車的研究中,避障路徑規(guī)劃一直都是研究的重點,也是解決汽車交通安全問題的有效方法[1]。美、法、日、德等一些世界發(fā)達國家的研究機構(gòu)相繼在該研究方向做了一定程度的研究,并取得了許多有價值的研究成果。在中國,智能汽車技術(shù)迅速發(fā)展,蔚來汽車、小鵬汽車等造車新勢力,以及搭載華為智能汽車解決方案的北汽極狐,在商用智能汽車避障路徑規(guī)劃技術(shù)方面,達到世界先進水平[2]。根據(jù)不同的建模方法,避障路徑規(guī)劃可以分為以神經(jīng)網(wǎng)絡(luò)為代表的黑箱建模方法、以模糊邏輯為代表的灰箱建模方法和以最優(yōu)控制理論為代表的白箱建模方法。本文將根據(jù)建模思想的不同進行分類,來闡述智能汽車避障路徑規(guī)劃建模的一些方法。
智能汽車運用在復(fù)雜的交通系統(tǒng)中,具有高度的不確定性,智能汽車本身會因為系統(tǒng)的非線性和時變性,導(dǎo)致獲得精準的智能車數(shù)學(xué)模型和環(huán)境障礙物模型的可能性基本為零,在理論上來說是不可能完成的事情。研究人員為了建模的便利,在研究時往往提出一些脫離真實工況的線性化假設(shè),以簡化汽車模型,然而當智能汽車工作在非線性區(qū)域時,路徑規(guī)劃時常會失效。
人腦的決策機制,一直以來都是科研的一個重要領(lǐng)域,然而神奇的大腦,卻難以使用精準的數(shù)學(xué)模型表達。當智能車使用模仿人類開車決策的技術(shù)路線進行智能駕駛技術(shù)的開發(fā)時,本質(zhì)上是模仿人類的駕駛決策,因此,尋找一個能夠盡量逼近人腦的模型,成了重要的研究方向。當我們將人腦在駕駛車輛進行路徑規(guī)劃時視為一個黑箱模型,可以用神經(jīng)網(wǎng)絡(luò)的方法進行刻畫。神經(jīng)網(wǎng)絡(luò)正是研究人員嘗試對大腦功能進行模擬而提出的一種非線性模型,這個非線性模型是復(fù)雜的網(wǎng)絡(luò),由大量的、多層的簡單非線性單元構(gòu)成。神經(jīng)網(wǎng)絡(luò)需要足夠的樣本數(shù)據(jù),即需要足夠的輸入信號和輸出信號進行深度學(xué)習,不斷調(diào)整各個非線性單元的權(quán)重,本質(zhì)上,它是一個不依賴模型特征的非線性函數(shù),其中卷積神經(jīng)網(wǎng)絡(luò)是應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)[3]。正因為神經(jīng)網(wǎng)絡(luò)不依賴模型特征,因此對于像避障路徑規(guī)劃這樣具有復(fù)雜性、非線性和時變性的系統(tǒng),用其建模十分合適。智能汽車避障路徑規(guī)劃處理的問題就是,根據(jù)車輛搭載的各類傳感器,獲得車輛本身如速度、加速度、方向角等狀態(tài)信息,道路狀態(tài)、交通標志、行人及其他車輛狀態(tài)等外界環(huán)境信息,在最短的時間內(nèi)輸出控制車輛運行的油門、剎車、方向盤動作。從函數(shù)的角度,智能汽車避障路徑規(guī)劃可以看作一個狀態(tài)空間到動作空間的映射。因人類駕駛車輛的方法各異、水平不同、風格取向不同,人腦的這種映射關(guān)系很難用精確的數(shù)學(xué)方程來表達,而理論上可以逼近任意非線性函數(shù)的神經(jīng)網(wǎng)絡(luò),就成了一個十分適用的選擇,然而神經(jīng)網(wǎng)絡(luò)不斷逼近人腦映射的過程,需要大量的樣本和學(xué)習過程,比較費時。
一些深度學(xué)習方法已經(jīng)被應(yīng)用到自主駕駛?cè)蝿?wù)中,而端到端的深度神經(jīng)網(wǎng)絡(luò)可以大大簡化自主駕駛算法的設(shè)計,這已經(jīng)引起了學(xué)術(shù)界和工業(yè)界越來越多的關(guān)注。文獻[4]使用NVIDIA DevBox和Torch 7來訓(xùn)練一種端到端的卷積神經(jīng)網(wǎng)絡(luò)(CNN)。前端為前置攝像頭,攝像頭采集的像素信號作為神經(jīng)網(wǎng)絡(luò)的輸入端。后端通過神經(jīng)網(wǎng)絡(luò)直接輸出控制指令。實驗表明,這種端到端的方法非常有效,經(jīng)過一定的訓(xùn)練,不僅可以在有標線的車道上行駛,還可以在沒有車道線的高速公路上行駛。常見的端到端神經(jīng)網(wǎng)絡(luò)是單模任務(wù),為了克服這個缺點,文獻[5]介紹了一種使用多模式任務(wù)的學(xué)習方法。與單模神經(jīng)網(wǎng)絡(luò)相比,用MTL(Multi-Modal Multi Task Learning)訓(xùn)練的模型具有更好的駕駛性能。為了驗證實驗算法,作者建立了一個1/10比例的模型車,并通過模型車試驗訓(xùn)練了幾個模擬人腦的神經(jīng)網(wǎng)絡(luò)來控制汽車的轉(zhuǎn)向角和行駛速度。實驗結(jié)果表明,在各種工況下,參數(shù)較少的多模態(tài)多任務(wù)學(xué)習(MTL)訓(xùn)練模型都能與單任務(wù)訓(xùn)練的網(wǎng)絡(luò)相匹配,甚至超過單任務(wù)訓(xùn)練的網(wǎng)絡(luò)。
文獻[6]設(shè)計了一種基于視覺特征提取的強化學(xué)習自動駕駛系統(tǒng),在提取關(guān)鍵信息的基礎(chǔ)上,采用強化學(xué)習算法進行自動駕駛訓(xùn)練?;诜抡嫫脚_的測試結(jié)果表明,該文設(shè)計的自動駕駛系統(tǒng)不僅能夠完成車道保持任務(wù),而且具有良好的泛化能力,改變路況后,車輛仍能正常行駛。文獻[7]提出了一種結(jié)合神經(jīng)網(wǎng)絡(luò)和模糊邏輯的路徑規(guī)劃算法,該算法充分發(fā)揮了神經(jīng)網(wǎng)絡(luò)和模糊理論的優(yōu)點,一方面可以像神經(jīng)網(wǎng)絡(luò)一樣映射,另一方面可以處理模糊信息。
然而,在神經(jīng)網(wǎng)絡(luò)學(xué)習和訓(xùn)練過程中,逼近人腦模型需要大量的樣本和較長的時間。同時,它高度依賴于計算機的計算速度,對硬件平臺有很高的要求。
模糊邏輯算法將人腦建模為灰箱模型,與神經(jīng)網(wǎng)絡(luò)算法相比,模糊邏輯算法對人腦進行了一定程度的描述,這種描述是基于專家經(jīng)驗的模糊推理規(guī)則表。模糊邏輯與布爾邏輯相比,通過引入隸屬度的概念改變非此即彼的二元布爾邏輯,在一定程度上接近于人腦的決策機制。與精確地將路徑規(guī)劃作為數(shù)學(xué)模型進行建模的方法不同,模糊邏輯不需要依賴于精確的傳感器信息,因此可以大大提高算法的適應(yīng)能力。模糊語言核心內(nèi)容是模糊規(guī)則[8],將模糊邏輯算法運用在智能車局部路徑規(guī)劃,其核心是根據(jù)人的駕駛經(jīng)驗得出符合實際需求的模糊控制規(guī)則表;根據(jù)傳感器收集到的環(huán)境信息和車輛狀態(tài)信息,經(jīng)過模糊化處理,根據(jù)模糊控制規(guī)則表,做出模糊決策,即可輸出可行的規(guī)劃路徑。因為模糊邏輯算法本身就會對傳感器信息進行模糊化處理,因此傳感器的精度不再是限制算法的指標,擺脫了車輛定位精度、環(huán)境信息和傳感器精度的依賴。不過在障礙物較多的時候,模糊邏輯算法存在計算量較大的問題,會影響規(guī)劃速度和實時性。
文獻[9]提出的模糊邏輯路徑規(guī)劃方法,主要解決了傳感器限制下,未知環(huán)境下的路徑規(guī)劃問題,模糊邏輯路徑規(guī)劃器由避障行為,目標導(dǎo)向行為和模糊行為監(jiān)督器組成,實驗表明,算法能夠在未知環(huán)境下規(guī)劃路徑。常規(guī)的模糊邏輯算法可能出現(xiàn)死鎖的情況,文獻[10]提出的基于模糊邏輯的智能車局部路徑規(guī)劃算法,改進了常規(guī)針對模糊邏輯在智能車局部路徑規(guī)劃中存在的問題,巧妙設(shè)計多次轉(zhuǎn)動避障的策略,避免智能車出現(xiàn)死鎖的情況,優(yōu)化智能車的路徑規(guī)劃;文獻[11]選擇合理的隸屬度函數(shù),進一步模糊處理傳感器信息,再結(jié)合人的駕駛經(jīng)驗,建立知識庫,形成模糊推理規(guī)則表,設(shè)計Kenblock的模糊邏輯控制器,同時給出了路徑規(guī)劃死循環(huán)的策略。文獻[12]通過使用模糊邏輯,改進粒子群算法,傳統(tǒng)的粒子群算法計算速度快,尋找解的過程簡單,但是經(jīng)常陷入局部最優(yōu)解,作者通過引入模糊邏輯防止系統(tǒng)陷入局部最優(yōu),同時加快了算法的收斂速度。
模糊邏輯能夠一定程度上描述了人腦的決策過程,相比于神經(jīng)網(wǎng)絡(luò)黑箱建模,不需要大量的樣本收集和深度學(xué)習時間,成本較低;但模糊邏輯模糊化處理傳感器信息需要選擇合適的隸屬度函數(shù),這個函數(shù)的選擇是否合理存在較大的可靠性驗證風險,采用人的駕駛經(jīng)驗作為重要的推理規(guī)則,若要覆蓋各種各樣的工況,需要形成大規(guī)模的知識庫,這些都是模糊邏輯算法需要解決的問題。
雖然智能汽車是一個復(fù)雜的、非線性、時變的系統(tǒng),但是在大部分的運行工況中,使用數(shù)學(xué)模型建模求解的規(guī)劃路徑能夠適用。最優(yōu)控制方法的基本思想是:在可接受的范圍內(nèi),通過一些假設(shè)和條件的理想化,使用數(shù)學(xué)模型將物理模型進行表達。具體到智能車路徑規(guī)劃問題,則是通過一定程度的假設(shè),簡化表達為數(shù)學(xué)模型,然后根據(jù)需求和約束條件,建立最優(yōu)控制目標,進而選擇合適的方法進行求解。優(yōu)化問題的數(shù)學(xué)模型,包括兩個要素:目標函數(shù)和約束條件。使用最優(yōu)控制對路徑規(guī)劃問題進行建模時,又分為兩個部分:數(shù)學(xué)模型的建立和求解。大量的研究人員對此展開了較多的研究,不同研究人員選擇了不同的障礙物建模方法,比如人工勢場法、柵格圖法和幾何刻畫法。
(1)人工勢場法。人工勢場法是路徑規(guī)劃研究中運用較多的方法,其核心思想是將車輛所處環(huán)境要素建模為一個引力場,而不同的障礙物、道路等可視為不同的引力場,然后以過程中勢能最小為性能目標規(guī)劃最優(yōu)路徑。傳統(tǒng)人工勢場法存在兩個問題:①將智能車視為質(zhì)點,沒有充分考慮車輛的動力學(xué)約束;②容易陷入局部最小值[13]。為了克服第一個問題,Amir Khajepour等人[14]導(dǎo)入了車輛動力學(xué)約束,提出了一種模型預(yù)測路徑規(guī)劃控制器,結(jié)合了人工勢場法和最優(yōu)控制法的優(yōu)點,取得了良好效果。為了克服陷入局部最小值的問題,不同研究人員給出了不同的解決方案,比如選擇更優(yōu)的勢場公式[15],使用人工協(xié)調(diào)場[16],增加隨機逃逸設(shè)計[17],引入啟發(fā)式搜索方法[18]等方法克服。然而人工勢場法存在如何合理選擇勢場模型的問題,不同的勢場選擇會得出不同的求解結(jié)果,因此,人工勢場法的求解結(jié)果難以界定為最優(yōu)解,只能算是一個假設(shè)條件下的可行解。
(2)柵格圖法。柵格圖法的本質(zhì)是柵格化的地圖。根據(jù)傳感器檢測到的車道線、靜態(tài)障礙物、動態(tài)障礙物等,賦予這些元素所在位置一個值,最簡單的柵格法,便是對這些柵格賦值為0或1??蛇x擇0作為可通行區(qū)域,1作為障礙物占領(lǐng)的區(qū)域,將路徑規(guī)劃問題轉(zhuǎn)化為尋找最短的起點到終點的連續(xù)0值柵格組合。復(fù)雜一點的柵格圖,每個柵格的權(quán)重不一定是二元的,可以是0~1之內(nèi)的連續(xù)量,最優(yōu)路徑即為所有經(jīng)過的柵格權(quán)重值之和最小的路徑。比如虛線道路就是盡量不能侵占的柵格,但是這并不意味著虛線不能跨越,因此簡單地對道路虛線柵格賦值0或1都是不可行的,因此尋找一個合適的中間值,關(guān)乎求解的優(yōu)化程度。除了柵格圖的權(quán)重之外,柵格圖的像素也是一個重要的指標。每一個柵格的尺寸越細,柵格的像素越高,對環(huán)境信息的建模能力越強,但這也會帶來一個隱患,那就是增加了存儲空間,降低調(diào)用速度;相應(yīng)地,每一個柵格的尺寸越大,柵格的像素越低,對環(huán)境的建模能力越弱,犧牲精度,但是帶來了一個好處,那就是能夠降低存儲空間,提高運算速度。
文獻[19]在采用柵格圖建模環(huán)境信息的基礎(chǔ)上,模擬螞蟻行為規(guī)則,搜索可行道路,完成路徑規(guī)劃。文獻[20]為了解決路徑規(guī)劃問題中的障礙物陷阱,以柵格圖為基礎(chǔ),合成對變形對障礙物進行建模。對于柵格圖的優(yōu)化方法眾多,文獻[21]結(jié)合柵格圖、勢場法和蟻群算法,可以克服傳統(tǒng)蟻群算法收斂較慢的問題,又能夠避免單純?nèi)斯輬龇◣淼木植孔顑?yōu)解問題。
(3)幾何刻畫法。幾何刻畫法是最樸素的建模思想。道路類型眾多,障礙物形狀各異,幾何刻畫法通過幾何圖形對其建模,選擇不同的幾何模型帶來不同的適應(yīng)性和復(fù)雜性。比如有研究人員選擇使用面積法[22],有選擇P準則建模多邊形的方法[23-24]、基于雙曲函數(shù)的車庫幾何近似法[25]等。通過幾何刻畫法對障礙物和道路建模,實際上表達的是邊界,邊界之內(nèi)是不可行區(qū)域,邊界之外則是可行區(qū)域,因此這種建模方法會產(chǎn)生大量的數(shù)學(xué)不等式模型,在優(yōu)化問題中屬于約束范疇。文獻[25]使用栓曲線函數(shù)表達車庫,統(tǒng)一了側(cè)方位停車和垂直車位停車的求解;而基于P準則的函數(shù),理論上講,可以近似大多數(shù)封閉圖形,具有廣闊的運用前景和適應(yīng)能力,但函數(shù)參數(shù)中包含了高次冪和高次開方,使用其對障礙物進行模型建立可能導(dǎo)致更為困難的數(shù)值求解過程。
智能車避障路徑規(guī)劃是自動駕駛技術(shù)的重要環(huán)節(jié),選擇合適的建模方法關(guān)系到路徑規(guī)劃器的速度和適應(yīng)能力。本文嘗試總結(jié)不同的建模思想,分別整理了將路徑規(guī)劃視為黑箱的神經(jīng)網(wǎng)絡(luò)方法、灰箱的模糊邏輯方法以及白箱的最優(yōu)控制算法。最優(yōu)控制算法求解精準,但在復(fù)雜時變系統(tǒng)中可能失效;模糊邏輯算法可以降低傳感器精度要求,但在障礙物較多時存在實時性不強的問題;展望未來,神經(jīng)網(wǎng)絡(luò)若能優(yōu)化機器學(xué)習方法,減少學(xué)習時間,將成為最具潛力的解決方案。