王建強(qiáng)*, 黃荷葉, 李克強(qiáng), 李駿
S tate Key Laboratory of Automotive S afety and Energy, S chool of Vehicle and Mobility, Tsinghua University, Beijing 100084, China
近年來,自動(dòng)駕駛汽車的自動(dòng)化程度正逐漸提高,并引發(fā)對(duì)更高程度自動(dòng)化水平的追求。自主性可以定義為一個(gè)智能化的系統(tǒng)在系統(tǒng)自身及其環(huán)境的不確定性下實(shí)現(xiàn)特定任務(wù)的能力[1]。在實(shí)現(xiàn)特定任務(wù)過程中,通常也可認(rèn)為,系統(tǒng)自身在無/少干擾情況下對(duì)于不確定性處理能力越強(qiáng),其自動(dòng)化程度越高[2]。目前對(duì)于自動(dòng)駕駛汽車自動(dòng)化程度的衡量標(biāo)準(zhǔn)多樣,而汽車工業(yè)界通常采用汽車工程師協(xié)會(huì)(SAE International)定義的從0 級(jí)(完全手動(dòng))到5 級(jí)(完全自主)的6 級(jí)分級(jí)標(biāo)準(zhǔn)[3]。現(xiàn)有SAE 對(duì)于L1~L5 級(jí)自動(dòng)駕駛的定義[3]可以理解為:對(duì)于L1 級(jí)別自動(dòng)駕駛,可以完成在一個(gè)維度(橫向或縱向)的駕駛?cè)蝿?wù);L2 級(jí)別自動(dòng)駕駛可以同時(shí)自動(dòng)進(jìn)行多維度輔助(如加減速和轉(zhuǎn)向);L3級(jí)別自動(dòng)駕駛車輛在特定環(huán)境中可以實(shí)現(xiàn)自動(dòng)加減速和轉(zhuǎn)向,無需駕駛?cè)烁深A(yù);在L4 級(jí)別自動(dòng)駕駛中,在限定條件下如果車輛當(dāng)前處于自動(dòng)駕駛狀態(tài),則全程無需駕駛者接管方向盤;L5 級(jí)別自動(dòng)駕駛車輛可以在任何條件、任何場(chǎng)景下自動(dòng)行駛,車輛的自動(dòng)化系統(tǒng)完全替代了人類駕駛員,車輛達(dá)到完全自動(dòng)化。
在L1~L5級(jí)自動(dòng)駕駛發(fā)展過程中,動(dòng)態(tài)性、隨機(jī)性和多樣化的交通參與者,耦合化、時(shí)變化、復(fù)雜化的交通環(huán)境,以及非結(jié)構(gòu)化、模糊不明甚至不合理的道路基礎(chǔ)設(shè)施都是實(shí)現(xiàn)自動(dòng)駕駛的潛在挑戰(zhàn)[4,6]。三大主要挑戰(zhàn)可以概括為:①多場(chǎng)景疊加,如城市鬧區(qū)等多交通場(chǎng)景疊加情況等;②非理想環(huán)境適應(yīng),如動(dòng)態(tài)變化的天氣與路況條件等;③交通狀態(tài)不確定,如隨機(jī)突發(fā)的緊急事件等潛在難題。因此,為實(shí)現(xiàn)更高等級(jí)的自動(dòng)駕駛,需要提出一套有效的自動(dòng)駕駛汽車研發(fā)思路,讓高等級(jí)自動(dòng)駕駛汽車具備在考慮其他道路使用者的意愿和決策機(jī)制的前提下,對(duì)交通環(huán)境中的風(fēng)險(xiǎn)程度進(jìn)行估計(jì)、判斷和預(yù)測(cè),規(guī)劃具體的駕駛策略和軌跡,實(shí)現(xiàn)智能車輛在復(fù)雜的不確定環(huán)境中的安全可靠的高等級(jí)自動(dòng)駕駛。
駕駛過程中人為失誤導(dǎo)致的交通事故比例已經(jīng)超過90%,包括駕駛?cè)嗽诟兄?、認(rèn)知、推理與決策各階段自身的局限性[7,9]。應(yīng)用自動(dòng)駕駛技術(shù),逐步提高車輛駕駛的智能化水平,是解決交通安全問題的根本途徑。許多自動(dòng)駕駛制造商都制定了各自研究路線,推動(dòng)自動(dòng)駕駛技術(shù)發(fā)展。目前主流自動(dòng)駕駛技術(shù)路線[10-11]有:①“漸進(jìn)演化”路線。從先進(jìn)駕駛?cè)溯o助系統(tǒng)(ADAS)產(chǎn)品開始生產(chǎn)并逐步研發(fā)到無人駕駛階段,大部分傳統(tǒng)車企和零部件企業(yè)一般采用這種相對(duì)保守的路線[12]。②“革命性”路線。一開始就研發(fā)L4 或者L5 級(jí)自動(dòng)駕駛,如谷歌、福特、通用(GM)、Momenta等公司。③“特斯拉”路線。在搭載自動(dòng)駕駛系統(tǒng)硬件的汽車上,首先應(yīng)用輔助自動(dòng)駕駛功能,不斷積累測(cè)試數(shù)據(jù),通過軟件升級(jí)完善自動(dòng)駕駛統(tǒng),最終實(shí)現(xiàn)無人駕駛。
但現(xiàn)有的技術(shù)路線在實(shí)施過程中都遇到了類似難題:①自動(dòng)駕駛汽車會(huì)違反交通規(guī)則,頻繁制動(dòng),犧牲乘客舒適性,對(duì)交通造成負(fù)面影響;②安全算法考慮因素不足,難以準(zhǔn)確判別行車危險(xiǎn)程度;③智能汽車在復(fù)雜環(huán)境陷入困境后,綜合判斷能力欠缺,易導(dǎo)致決策沖突等。這些難題帶來了在現(xiàn)實(shí)行車過程中出現(xiàn)的一系列自動(dòng)駕駛不合理現(xiàn)象[13]:“路遇行人不停車”“一次跨越多個(gè)車道”“路遇車輛頻繁制動(dòng)”“左轉(zhuǎn)時(shí)猶豫、起?!钡葐栴},同時(shí)也造成了多起自動(dòng)駕駛事故[14]。例如,2016 年,特斯拉Model S電動(dòng)汽車在途經(jīng)十字路口的時(shí)候,撞上了一輛正在左轉(zhuǎn)的卡車;2017年,自動(dòng)駕駛汽車Waymo在測(cè)試時(shí),發(fā)生了追尾事故;2018 年,Uber 自動(dòng)駕駛測(cè)試車因系統(tǒng)無法準(zhǔn)確識(shí)別人行橫道以外的行人而造成事故。
雖然各研究機(jī)構(gòu)的研究路線有所側(cè)重,但針對(duì)高等級(jí)自動(dòng)駕駛汽車的研發(fā)思路主要是基于場(chǎng)景和任務(wù)驅(qū)動(dòng)來進(jìn)行特定場(chǎng)景下的具體功能開發(fā)[5]。這一思路對(duì)于L1~L3級(jí)的駕駛輔助系統(tǒng)開發(fā)有一定指導(dǎo)作用,可以在特定場(chǎng)景下完成指定功能;而L3~L4級(jí)自動(dòng)駕駛屬于任務(wù)驅(qū)動(dòng),因此能夠?qū)崿F(xiàn)在限定條件下人機(jī)協(xié)同共駕。而對(duì)于L5 級(jí)自動(dòng)駕駛,場(chǎng)景驅(qū)動(dòng)可能會(huì)帶來多類場(chǎng)景疊加難題,使得L5級(jí)自動(dòng)駕駛汽車會(huì)為了能夠適應(yīng)這一功能而陷入困境;任務(wù)驅(qū)動(dòng)則會(huì)導(dǎo)致自動(dòng)駕駛時(shí)多任務(wù)沖突,難以讓L5 級(jí)自動(dòng)駕駛汽車無條件地自由行駛。例如,交通參與者(車輛、行人、騎行者)對(duì)交通規(guī)則的遵循意識(shí)觀念不強(qiáng);行駛環(huán)境的道路結(jié)構(gòu)和交通設(shè)施都存在不合理、老舊不清晰等問題。這些特殊化的交通參與者行為和行車環(huán)境都大大增加了現(xiàn)有基于場(chǎng)景或任務(wù)驅(qū)動(dòng)的研發(fā)思路的應(yīng)用挑戰(zhàn)。
由此可見,L5 級(jí)自動(dòng)駕駛汽車需要實(shí)現(xiàn)超越駕駛?cè)说男阅?,全方位提高汽車行駛性能,從學(xué)習(xí)駕駛?cè)说鸟{駛方式到適應(yīng)駕駛?cè)笋{駛模式再到超越駕駛?cè)笋{駛局限[2]。目前仍鮮有從一種全新的“系統(tǒng)、統(tǒng)一、均衡”的角度出發(fā),探索高等級(jí)自動(dòng)駕駛系統(tǒng)背后的物理機(jī)制,揭示駕駛本質(zhì)的研發(fā)范式。因此針對(duì)現(xiàn)有方法的局限性,本文突破傳統(tǒng)研發(fā)自動(dòng)駕駛思想,采用推理演繹方式,提出“大腦-小腦-器官”協(xié)調(diào)平衡框架,探索“自主學(xué)習(xí)+先驗(yàn)知識(shí)”的研究范式。通過開展開拓性研究,旨在實(shí)現(xiàn)自動(dòng)駕駛汽車“自學(xué)習(xí)、自適應(yīng)、自超越”特性,為L5 級(jí)自動(dòng)駕駛汽車的開發(fā)提供新的研究思路和途徑。
現(xiàn)有的自動(dòng)駕駛汽車的常用開發(fā)思路是將整個(gè)系統(tǒng)劃分為獨(dú)立的層和功能。例如,智能車輛首先通過感知層感知駕駛環(huán)境參數(shù),識(shí)別目標(biāo)類型。然后通過情景評(píng)估,提高對(duì)駕駛行為意圖等駕駛環(huán)境的了解,并估計(jì)和預(yù)測(cè)未來的駕駛風(fēng)險(xiǎn)程度,評(píng)估其他道路使用者的風(fēng)險(xiǎn)水平,正確認(rèn)識(shí)環(huán)境[15]。最后,自動(dòng)駕駛汽車通過決策和執(zhí)行控制系統(tǒng)完成行為和路徑規(guī)劃,從而實(shí)現(xiàn)駕駛操作任務(wù)。
具體來說,現(xiàn)有與基于場(chǎng)景和任務(wù)驅(qū)動(dòng)的研發(fā)思路對(duì)應(yīng)的自動(dòng)駕駛汽車的開發(fā)途徑主要分為“感知-決策-控制”這一分層自動(dòng)駕駛框架和端到端的整體學(xué)習(xí)框架。
在目前的自動(dòng)駕駛系統(tǒng)中,感知系統(tǒng)、決策系統(tǒng)、控制系統(tǒng)、執(zhí)行系統(tǒng)多依賴功能疊加式的設(shè)計(jì)方案進(jìn)行獨(dú)立設(shè)計(jì)開發(fā)。當(dāng)自動(dòng)駕駛汽車在向更高等級(jí)發(fā)展的過程中,就需要提供更高等級(jí)的功能,而現(xiàn)有的研究框架通常在原有系統(tǒng)基礎(chǔ)上,直接疊加新的系統(tǒng),進(jìn)行功能集成,產(chǎn)生新的功能。這種“結(jié)構(gòu)分層設(shè)計(jì),功能疊加產(chǎn)生”的集成架構(gòu)相對(duì)簡單,容易實(shí)現(xiàn),在智能駕駛系統(tǒng)發(fā)展的初級(jí)階段發(fā)揮了重要作用[5]。然而,隨著智能汽車的等級(jí)逐漸提高,功能需求不斷增多,子系統(tǒng)不斷集成,系統(tǒng)結(jié)構(gòu)愈發(fā)復(fù)雜,各系統(tǒng)功能與結(jié)構(gòu)存在相互的耦合與重疊,易造成結(jié)構(gòu)配置冗余、資源利用率不高和系統(tǒng)成本增加等問題。
特別地,目前在分層式框架中,在決策過程中常采用基于規(guī)則的方法。該方法能夠有效實(shí)現(xiàn)L2~L4級(jí)的決策過程,是一種有效針對(duì)特定場(chǎng)景和具體任務(wù)驅(qū)動(dòng)的自動(dòng)駕駛模式的方法。該方法的代表性方法包括有限狀態(tài)機(jī)等,其規(guī)則直觀、可讀性較好、易實(shí)現(xiàn),在簡單的場(chǎng)景中,適用性比較好。而這類方法的明顯缺點(diǎn)是缺乏概括未知情況的能力,這使其很難被擴(kuò)展到實(shí)際駕駛中,尤其是針對(duì)高等級(jí)自動(dòng)駕駛。在分層框架中,具體各子系統(tǒng)的特點(diǎn)和存在的不足如表1所示[16,22]。
表1 “感知-決策-控制”分層框架特點(diǎn)
續(xù)表
目前很多創(chuàng)新公司或研究機(jī)構(gòu)都在研究并推廣,結(jié)合深度學(xué)習(xí)與增強(qiáng)學(xué)習(xí)的方法在自動(dòng)駕駛領(lǐng)域進(jìn)行端到端的訓(xùn)練[19,23]。端到端的學(xué)習(xí)方法可以直接將傳感器輸入端的信息導(dǎo)出,然后輸入車輛底層控制器中(剎車、油門、轉(zhuǎn)向等)進(jìn)行輸出。對(duì)于現(xiàn)有采用端到端的學(xué)習(xí)框架,其不斷探索、學(xué)習(xí)的屬性能夠讓自動(dòng)駕駛汽車實(shí)現(xiàn)“自適應(yīng)、自學(xué)習(xí)”這一過程[24]。然而由于端到端框架的中間環(huán)節(jié)的隱藏特性,最終導(dǎo)致在實(shí)際交通場(chǎng)景中,在面對(duì)未知不確定的情境時(shí)會(huì)出現(xiàn)“學(xué)習(xí)內(nèi)容不明確、學(xué)習(xí)方向不可控、學(xué)習(xí)策略不相關(guān)”等問題。由于端到端中間過程的“黑箱問題”會(huì)帶來透明性不高的問題,導(dǎo)致所對(duì)應(yīng)的功能和策略與預(yù)期不相符的程度會(huì)增加。同時(shí),由于學(xué)習(xí)類方法背后潛在的物理機(jī)制不明晰,導(dǎo)致開發(fā)高等級(jí)自動(dòng)駕駛車輛存在許多潛在風(fēng)險(xiǎn)。此外,由于未能深刻揭示模型背后的物理機(jī)制所造成的可解釋性問題,將成為阻礙學(xué)習(xí)類方法進(jìn)一步發(fā)展應(yīng)用的瓶頸。而具體的問題如“難以與規(guī)則結(jié)合”“計(jì)算成本過高、硬件要求高”“樣本不夠多、完整性不足,高訓(xùn)練成本”等也進(jìn)一步讓端到端學(xué)習(xí)在實(shí)際應(yīng)用過程中受阻[25]。
因此,僅靠端到端的探索或現(xiàn)有的分層式框架,無法有效應(yīng)對(duì)這些非正常情況。復(fù)雜的交通場(chǎng)景通常具備這些不確定、不可測(cè)、非常規(guī)的元素。如果高等級(jí)自動(dòng)駕駛汽車按照目前的單一功能、特定場(chǎng)景、任務(wù)驅(qū)使的發(fā)展趨勢(shì),將無法有效處理交通不正常的情況。針對(duì)特定場(chǎng)景與單一交通環(huán)境的傳統(tǒng)研發(fā)方法,不能全面反映駕駛?cè)嗽谡鎸?shí)交通環(huán)境中的決策操控能力,很難為開發(fā)高等級(jí)智能汽車的擬人化駕駛算法提供指導(dǎo)依據(jù)。
根據(jù)已有的定義,L5 級(jí)和L4 級(jí)之間存在本質(zhì)區(qū)別,L4 級(jí)可以實(shí)現(xiàn)高度智能的無人駕駛,但其限定條件使得L4 級(jí)只能在盡量覆蓋各種場(chǎng)景的前提下趨近于人類駕駛行為,無法實(shí)現(xiàn)100%的實(shí)用化和L5級(jí)下的無條件普適性要求。而根據(jù)SAE 分級(jí)標(biāo)準(zhǔn),在目前的自動(dòng)駕駛等級(jí)分級(jí)中,L4與L5級(jí)別的自動(dòng)駕駛汽車的區(qū)別在于運(yùn)行設(shè)計(jì)域(ODD),L4級(jí)的自動(dòng)駕駛汽車只能在給定工況范圍內(nèi)運(yùn)行,而L5 級(jí)則是可以在符合道德規(guī)范的任意工況下運(yùn)行。但究其根本,如果從場(chǎng)景的覆蓋范圍及運(yùn)行工況角度對(duì)L4 級(jí)和L5 級(jí)進(jìn)行區(qū)分,則很容易造成L5 級(jí)自身的定義模糊化,且?guī)硎欠裼斜匾l(fā)展L5級(jí)的系列討論。
因此,本文在SAE 標(biāo)準(zhǔn)和其他自動(dòng)駕駛分類標(biāo)準(zhǔn)的基礎(chǔ)上,重新對(duì)L5級(jí)自動(dòng)駕駛的本質(zhì)進(jìn)行闡明。L5級(jí)自動(dòng)駕駛汽車將不再是傳統(tǒng)意義上的一輛汽車,而是一個(gè)具有“自學(xué)習(xí)、自修復(fù)、軟件自配置、自主社交、自主駕駛能力”的連接不同場(chǎng)景的移動(dòng)生活載體。其“自學(xué)習(xí)、自適應(yīng)、自超越”的特性可以應(yīng)用于L2~L4級(jí)自動(dòng)駕駛,但這一過程只是單向的。而L1~L4 級(jí)自動(dòng)駕駛只是L5 級(jí)的一種特例。進(jìn)一步分析,在L1~L5 級(jí)自動(dòng)駕駛發(fā)展過程中,L1~L3 級(jí)自動(dòng)駕駛聚焦于感知層面的任務(wù)代理;L4級(jí)實(shí)現(xiàn)給定復(fù)雜場(chǎng)景內(nèi)的決策任務(wù),存在一定的任務(wù)處理邊界,該任務(wù)邊界出現(xiàn)的主要原因是L4 級(jí)自動(dòng)駕駛系統(tǒng)生成決策的方法是基于統(tǒng)計(jì)信息的決策搜索,而非基于邏輯的決策生成。我們也可以將L4 級(jí)自動(dòng)駕駛理解為部分樣本,在達(dá)到L4 級(jí)技術(shù)后即實(shí)現(xiàn)了部分樣本的驗(yàn)證,但部分樣本無法覆蓋全部樣本。L4 級(jí)自動(dòng)駕駛汽車可理解為能在有限性工況下運(yùn)行,但對(duì)于無限的不確定場(chǎng)景難以以單純列舉的方式實(shí)現(xiàn),更多的是需要具有自主探索能力。
因此,L5 級(jí)要求自動(dòng)駕駛系統(tǒng)在未知駕駛場(chǎng)景內(nèi)具備決策生成的能力,相較于L4 級(jí)的主要差異在于其具備了基于邏輯的推理學(xué)習(xí)能力,亦可稱為自修正能力。不同于簡單的機(jī)器學(xué)習(xí)模式,這種能力不僅使自動(dòng)駕駛系統(tǒng)可以采用統(tǒng)計(jì)學(xué)的方法對(duì)駕駛經(jīng)歷進(jìn)行特征提取,而且有助于進(jìn)一步提煉受控車輛與交通環(huán)境的交互機(jī)制,從而形成一種能夠系統(tǒng)性調(diào)整自動(dòng)駕駛系統(tǒng)(相較于對(duì)單一模塊的調(diào)整)的修正邏輯。
真實(shí)的交通環(huán)境由于存在各種道路使用者,且各道路使用者的時(shí)變和行為不確定性造成了交通系統(tǒng)的復(fù)雜性。如文獻(xiàn)[26]所述,自動(dòng)駕駛汽車發(fā)展過程中存在一些共性問題,主要包括現(xiàn)有各項(xiàng)技術(shù)發(fā)展存在瓶頸和現(xiàn)有基礎(chǔ)設(shè)施不夠完善。如先前的研究[6,10]所述,針對(duì)目前的感知、決策、控制技術(shù)的發(fā)展現(xiàn)狀,要真正實(shí)現(xiàn)L5 級(jí)自動(dòng)駕駛離不開各項(xiàng)技術(shù)的推動(dòng)。比如Chen等[27]引入了基于事件的自主駕駛神經(jīng)形態(tài)視覺的新概念,可以幫助高等級(jí)自動(dòng)駕駛汽車獲取更準(zhǔn)確的視覺感知信息。這對(duì)發(fā)展更高等級(jí)自動(dòng)駕駛汽車,尤其是L5 級(jí)自動(dòng)駕駛汽車至關(guān)重要。而高等級(jí)自動(dòng)駕駛所需要的技術(shù)條件與目前的發(fā)展現(xiàn)狀存在一些差距。同時(shí),除了技術(shù)和基礎(chǔ)設(shè)施原因,自動(dòng)駕駛汽車目前仍然無法達(dá)到L5級(jí)的更深層次的原因主要有:
(1)交通要素作用機(jī)理不明。復(fù)雜環(huán)境下,各要素對(duì)行車風(fēng)險(xiǎn)影響的機(jī)制不清晰,難以探明各要素之間的耦合機(jī)理。如駕駛?cè)藢?duì)不同交通環(huán)境靜態(tài)和動(dòng)態(tài)信息的認(rèn)知判斷機(jī)制不清晰,駕駛?cè)藢?duì)車輛動(dòng)力學(xué)特性的適應(yīng)能力和操縱水平難量化,各交通要素對(duì)于駕駛?cè)说膭?dòng)態(tài)干擾機(jī)制不確定等。因此高等級(jí)自動(dòng)駕駛汽車需要充分認(rèn)知人-車-環(huán)境耦合風(fēng)險(xiǎn),將駕駛?cè)藢?duì)于行車環(huán)境各要素造成的潛在風(fēng)險(xiǎn)認(rèn)知規(guī)律應(yīng)用于智能車輛風(fēng)險(xiǎn)評(píng)估,實(shí)現(xiàn)交通環(huán)境多要素耦合作用下的準(zhǔn)確風(fēng)險(xiǎn)辨識(shí)。
(2)交通運(yùn)行的變化規(guī)律不清晰。在動(dòng)態(tài)環(huán)境下,存在人-車-路系統(tǒng)多方面的不確定性。如人的參與帶來的不確定性,人本身的隨機(jī)性使得交通復(fù)雜系統(tǒng)更具不確定性;環(huán)境的變化不確定,導(dǎo)致對(duì)交通認(rèn)知的難度提高;道路條件的不確定,帶來車輛性能適應(yīng)的不確定性;信息獲取的不確定性(通訊手段、安全通信的不確定性),帶來復(fù)雜交通系統(tǒng)信息范圍的不確定性等。因此高等級(jí)自動(dòng)駕駛汽車的發(fā)展需要充分探明交通環(huán)境的變化規(guī)律,考慮其他道路使用者的動(dòng)態(tài)意圖,估計(jì)、判斷和預(yù)測(cè)交通環(huán)境中的風(fēng)險(xiǎn)程度,通過規(guī)劃具體駕駛策略和軌跡,提高智能車輛在復(fù)雜環(huán)境中的決策水平和能力。
(3)決策執(zhí)行機(jī)理不明。在復(fù)雜交通環(huán)境下,存在智能車輛決策固化,駕駛行為難符合優(yōu)秀駕駛?cè)说鸟{駛習(xí)慣,難適應(yīng)不同駕駛/乘坐需求,從而降低人們對(duì)駕駛系統(tǒng)的接受度。而通過學(xué)習(xí)人類智慧來解決問題是自動(dòng)駕駛發(fā)展的一種可行思路,原有的L1~L4級(jí)自動(dòng)駕駛系統(tǒng)并未完全實(shí)現(xiàn)學(xué)習(xí)人類的思維方式,而通過真正解析人類的決策機(jī)制才能更好支撐L5 級(jí)的發(fā)展。但對(duì)人類駕駛?cè)说臎Q策機(jī)制的學(xué)習(xí)是有難度的,如何解析駕駛?cè)说臎Q策機(jī)制,如何進(jìn)行決策層次的邏輯判斷仍需要進(jìn)一步探討。尤其是在前端給出環(huán)境感知的各種要素的統(tǒng)一表達(dá)后,如何準(zhǔn)確、細(xì)致地反映駕駛?cè)说臎Q策機(jī)制,實(shí)現(xiàn)擬人化決策策略對(duì)L5級(jí)自動(dòng)駕駛汽車發(fā)展十分關(guān)鍵。
除了技術(shù)和機(jī)理方面的難題,現(xiàn)有研究思路仍需深入探討。目前,自動(dòng)駕駛的層化結(jié)構(gòu)能夠有效保證駕駛過程中的各項(xiàng)任務(wù)(感知-認(rèn)知-評(píng)估-決策-控制)被獨(dú)立完成,且單任務(wù)的完成情況可以被準(zhǔn)確評(píng)估。在技術(shù)攻堅(jiān)階段,這種模塊化分層化的任務(wù)結(jié)構(gòu)是實(shí)現(xiàn)完備功能的必然要求。但是,模塊化分層化的設(shè)計(jì)結(jié)構(gòu),導(dǎo)致自動(dòng)駕駛系統(tǒng)的自我修正僅存在于單一模塊中。例如,先進(jìn)的決策模塊雖已具備一定的自調(diào)整能力,但也僅能考慮如何在駕駛過程中進(jìn)行自優(yōu)化和自適應(yīng),卻無法有效評(píng)估和影響系統(tǒng)中其他模塊。目前的決策模塊設(shè)計(jì)過程,通常將感知所提供的輸入和控制所需要的輸出,作為已有且固定不變的條件,模塊之間是剛性橋接的。這意味著決策模塊不能滿足與其他模塊協(xié)同修正的要求,難以將自身的修正過程和結(jié)果反饋給其他模塊。
而模塊間反饋機(jī)制的缺失導(dǎo)致自動(dòng)駕駛系統(tǒng)缺乏模塊間的協(xié)同成長能力,即系統(tǒng)性的自我修正能力。并且,單一模塊的成長對(duì)于整體系統(tǒng)的影響是不可測(cè)的,甚至不一定是有益的。一個(gè)具有單模塊成長能力的自動(dòng)駕駛系統(tǒng),在自學(xué)習(xí)過程中甚至有可能由于各個(gè)模塊的獨(dú)立學(xué)習(xí)而喪失系統(tǒng)的整體協(xié)調(diào)性。
自動(dòng)駕駛系統(tǒng)是一個(gè)搭載了大量的硬件結(jié)構(gòu)和軟件算法的集成框架[28]。在傳統(tǒng)功能分層疊加框架中,不同功能所對(duì)應(yīng)的物理結(jié)構(gòu)對(duì)應(yīng)于不同的子系統(tǒng)。通過集成框架在實(shí)際應(yīng)用中所需處理的問題來調(diào)用各部分結(jié)構(gòu)及其對(duì)應(yīng)功能,通過信息傳輸、能量運(yùn)送來控制物理結(jié)構(gòu)本體,實(shí)現(xiàn)不同智能化程度的系統(tǒng)功能。但現(xiàn)有分層設(shè)計(jì)的框架所帶來的系列挑戰(zhàn),迫切期望能從系統(tǒng)論的角度為高等級(jí)自動(dòng)駕駛系統(tǒng)的研發(fā)提供全新思路。要實(shí)現(xiàn)這一點(diǎn),我們需要思考以下問題:怎樣真正解析人類駕駛?cè)说鸟{駛行為,探明駕駛?cè)说臎Q策操控機(jī)制,讓自動(dòng)駕駛系統(tǒng)具備自主學(xué)習(xí)、自主探索的能力?怎樣讓自動(dòng)駕駛汽車獲取學(xué)習(xí)人、模擬人、超越人的決策智慧?怎樣將意識(shí)和功能融入自動(dòng)駕駛系統(tǒng),輸出更智能更合理的駕駛行為?
這些問題將使研究人員難以離散化理解自動(dòng)駕駛系統(tǒng)的各個(gè)功能,不再分解系統(tǒng)對(duì)應(yīng)的功能以及功能對(duì)應(yīng)的部件,而是從整車系統(tǒng)功能出發(fā),分析各系統(tǒng)、部件以及部件子結(jié)構(gòu)中的共性原理與共性結(jié)構(gòu),運(yùn)用大腦/意識(shí)理論,如結(jié)合全局工作空間理論(GWT)[29]和綜合信息理論(IIT)[30]來設(shè)計(jì)和優(yōu)化統(tǒng)一的系統(tǒng)結(jié)構(gòu)。如圖1 所示,自動(dòng)駕駛系統(tǒng)功能可以描述為系統(tǒng)對(duì)環(huán)境的一種整體屬性,是系統(tǒng)在一定環(huán)境中所能發(fā)揮出的作用和能力,是系統(tǒng)的外部聯(lián)系,構(gòu)成了系統(tǒng)與環(huán)境的關(guān)系集;在系統(tǒng)動(dòng)態(tài)運(yùn)轉(zhuǎn)中實(shí)現(xiàn),表現(xiàn)為物質(zhì)流、能量流、信息流的輸入和輸出;遵循系統(tǒng)化的思維模式,有可能為高等級(jí)自動(dòng)駕駛汽車,尤其是L5 級(jí)別的汽車發(fā)展提供更好的解決途徑。同時(shí),高等級(jí)自動(dòng)駕駛汽車研究應(yīng)該有“學(xué)習(xí)人、模擬人、超越人、服務(wù)人”的思想,最終目的是以人為中心,服務(wù)于人。因此,以系統(tǒng)化思維并始終以人為中心,在車路協(xié)同、云端控制的外在環(huán)境下,更能促進(jìn)高等級(jí)自動(dòng)駕駛汽車的發(fā)展。
然而,目前針對(duì)高等級(jí)自動(dòng)駕駛汽車的發(fā)展路徑,主要是從自動(dòng)駕駛車的應(yīng)用場(chǎng)景及針對(duì)不同駕駛?cè)蝿?wù)需求兩方面進(jìn)行研發(fā),但場(chǎng)景驅(qū)動(dòng)和任務(wù)驅(qū)動(dòng)的方式最終因分層框架的功能不斷疊加而帶來決策沖突、功能冗余等問題;因此在這種思路下研發(fā)的自動(dòng)駕駛汽車,將難以突破有操縱運(yùn)行域限定的L4級(jí)自動(dòng)駕駛汽車,以致在實(shí)現(xiàn)L5級(jí)自動(dòng)駕駛車過程中面臨挑戰(zhàn)。鑒于此,本文將拋開已有框架的限制,將自動(dòng)駕駛汽車視為一個(gè)整體,以“類人”的系統(tǒng)角度,建立一個(gè)基于混合智能的統(tǒng)一通用框架。首先構(gòu)建開放的類腦系統(tǒng),然后將可能影響交通安全的各要素以統(tǒng)一的態(tài)勢(shì)感知進(jìn)行輸入,最終輸出實(shí)時(shí)的決策控制,以期為實(shí)現(xiàn)L5級(jí)自動(dòng)駕駛系統(tǒng)提供可行思路。
“大腦-小腦-器官”協(xié)調(diào)平衡框架從系統(tǒng)層次開發(fā)自動(dòng)駕駛大腦作為系統(tǒng)層,將感知、評(píng)估、決策、控制等技術(shù)作為功能層。其中,決策對(duì)應(yīng)小腦,感知對(duì)應(yīng)眼睛,控制對(duì)應(yīng)手腳。在人腦的調(diào)配下,通過自動(dòng)駕駛汽車的感知技術(shù)篩選興趣區(qū)域,有選擇有目的地進(jìn)行感知;通過自動(dòng)駕駛汽車的評(píng)估技術(shù)實(shí)時(shí)量化風(fēng)險(xiǎn),保障安全出行;通過自動(dòng)駕駛汽車的決策技術(shù)綜合優(yōu)化決策,平衡各項(xiàng)功能;通過自動(dòng)駕駛汽車的控制技術(shù)穩(wěn)態(tài)操控執(zhí)行,實(shí)現(xiàn)可靠駕駛。而現(xiàn)有的分層框架和端到端框架所對(duì)應(yīng)的基于場(chǎng)景驅(qū)動(dòng)的研發(fā)思路是一種“反饋傳輸”結(jié)構(gòu),而自動(dòng)駕駛大腦對(duì)各部分結(jié)構(gòu)不僅僅是單獨(dú)的刺激-反應(yīng)雙向反饋,而是包含意向擴(kuò)散的復(fù)雜結(jié)構(gòu)網(wǎng)絡(luò)。如圖2所示,在自動(dòng)駕駛“大腦-小腦-器官”協(xié)調(diào)平衡框架中,通過感知器官感知外界環(huán)境來刺激大腦,同時(shí)轉(zhuǎn)錄為歷史大數(shù)據(jù)儲(chǔ)存到大腦中進(jìn)行記憶。而小腦基于最小作用量原理,通過調(diào)用內(nèi)部狀態(tài)來完成思考與協(xié)調(diào)的功能,最后大腦和小腦一起輸出激活狀態(tài),通過手腳控制器官完成控制過程。
圖1.系統(tǒng)整體流程圖。現(xiàn)有的場(chǎng)景驅(qū)動(dòng)和任務(wù)驅(qū)動(dòng)的方法將很難突破運(yùn)行設(shè)計(jì)域限制的L4級(jí)自動(dòng)駕駛汽車,因此實(shí)現(xiàn)L5級(jí)自動(dòng)駕駛汽車將具有挑戰(zhàn)性。因此,我們將自動(dòng)駕駛汽車視為一個(gè)整體系統(tǒng),從“類人”角度建立了基于混合智能的統(tǒng)一通用框架。LKA:車道保持輔助;ACC:自適應(yīng)巡航控制;AEB:自動(dòng)緊急制動(dòng)。
圖2.“大腦-小腦-器官”協(xié)調(diào)平衡框架。在這個(gè)框架下,外部狀態(tài)刺激大腦,存儲(chǔ)交通信息,小腦調(diào)用內(nèi)部狀態(tài)完成思考,最后大腦和小腦輸出激活狀態(tài),反饋完成控制。
如圖3所示,我們可以假設(shè)自動(dòng)駕駛的訓(xùn)練過程和一個(gè)拳擊手的訓(xùn)練過程具有相似性。其中,自動(dòng)駕駛對(duì)應(yīng)的感知技術(shù)可以讓拳擊手輸入外界信息,感知到潛在風(fēng)險(xiǎn);控制技術(shù)可以訓(xùn)練拳擊手進(jìn)行運(yùn)動(dòng)控制,鍛煉肌肉;決策技術(shù)對(duì)應(yīng)拳擊手的小腦,對(duì)各項(xiàng)技能的協(xié)調(diào)起到平衡作用。但是僅僅依靠小腦、五官及手腳并不能使得拳擊手真正實(shí)現(xiàn)一個(gè)高水平拳擊手所具有的技能和素養(yǎng),各項(xiàng)技術(shù)只是訓(xùn)練了他的小腦和各項(xiàng)體能水平,而沒有訓(xùn)練到大腦,使其具備自如靈活的攻擊性能和保護(hù)性能等。因此,自動(dòng)駕駛要實(shí)現(xiàn)“自學(xué)習(xí)、自適應(yīng)、自超越”特性的核心是構(gòu)建完備的自動(dòng)駕駛大腦。
大腦的主要功能是調(diào)配各項(xiàng)技能,包括探索、學(xué)習(xí)、思考、主導(dǎo)機(jī)體內(nèi)一切活動(dòng)過程,以及調(diào)節(jié)機(jī)體與周圍環(huán)境的平衡的功能。當(dāng)自動(dòng)駕駛系統(tǒng)具備了運(yùn)動(dòng)控制和感知系統(tǒng)后,其所缺乏的是自動(dòng)駕駛系統(tǒng)的控制和信息處理中樞。如果把上層系統(tǒng)定義為自動(dòng)駕駛的大腦,那么運(yùn)動(dòng)控制和感知系統(tǒng)則對(duì)應(yīng)于自動(dòng)駕駛的小腦和相應(yīng)器官。只有大腦、小腦和各自器官系統(tǒng)得到發(fā)展,自動(dòng)駕駛系統(tǒng)才能更好地服務(wù)人類。同時(shí),為了實(shí)現(xiàn)符合現(xiàn)實(shí)社會(huì)期望的駕駛功能,自動(dòng)駕駛系統(tǒng)必須盡可能表現(xiàn)得像人類,這需要對(duì)人類行為以及群體的社會(huì)期望有內(nèi)在的理解。在現(xiàn)有框架下繼續(xù)發(fā)展的終極目標(biāo)很難突破“場(chǎng)景的泛化性、多風(fēng)險(xiǎn)的因素融合、求解目標(biāo)的耦合”等瓶頸,因此無法完全了解人類做決策時(shí)的生理與心理機(jī)制。而自動(dòng)駕駛大腦可以從內(nèi)至外地模擬和學(xué)習(xí)人類,能夠?qū)崿F(xiàn)在特定環(huán)境下,通過組織系統(tǒng)充分運(yùn)用人類的各種認(rèn)知活動(dòng)完成指定任務(wù)。同時(shí),由于存在自我意識(shí),大腦通常在不確定情況下,具有自我探索、主動(dòng)解決問題的能力。例如,在駕駛過程中,自動(dòng)駕駛系統(tǒng)大腦可以快速采取有效措施,應(yīng)對(duì)周圍其他障礙物的隨意停放或其他不遵守交通規(guī)則的行為,如不遵循交通規(guī)則的切入、超車、換道等行為。
圖3.駕駛?cè)撕妥詣?dòng)駕駛汽車之間的對(duì)應(yīng)關(guān)系。自動(dòng)駕駛汽車需要具備駕駛?cè)说囊恍┗炯寄埽?duì)人類行為及其社會(huì)期望有內(nèi)在理解。即一個(gè)駕駛?cè)说囊庀蛐裕瑢?duì)應(yīng)一個(gè)自動(dòng)駕駛汽車的智能數(shù)字化。
事實(shí)上,這些行為模式在世界許多地方都非常普遍。例如,車輛需要應(yīng)對(duì)強(qiáng)交互場(chǎng)景,如高速公路多車匯入和無保護(hù)左轉(zhuǎn),這對(duì)駕駛?cè)藖碚f也是一個(gè)挑戰(zhàn)。在很長一段時(shí)間里,自動(dòng)駕駛汽車與駕駛?cè)藭?huì)在同一行車環(huán)境中行駛,因此自動(dòng)駕駛汽車必須理解駕駛?cè)说囊鈭D,并以可預(yù)測(cè)和可解釋的方式做出反應(yīng)。雖然在空曠的道路上左轉(zhuǎn)對(duì)于自動(dòng)駕駛汽車來說可能是簡單可行的,但在復(fù)雜交通環(huán)境下仍然很困難。對(duì)于駕駛?cè)藖碚f,這些不受保護(hù)的左轉(zhuǎn)經(jīng)常發(fā)生在一個(gè)正在行駛的駕駛?cè)藴p速讓出的時(shí)候,這暗示了另一個(gè)駕駛?cè)丝梢园踩D(zhuǎn)彎。而這對(duì)于目前開發(fā)的自動(dòng)駕駛系統(tǒng)來說是極大的挑戰(zhàn)。因此,基于場(chǎng)景驅(qū)動(dòng)的研究思路在針對(duì)以上挑戰(zhàn)時(shí)應(yīng)用受限,未能突破局限性達(dá)到真正的高等級(jí)智能化。而智能可以闡述為一種表現(xiàn)在個(gè)體與自然、社會(huì)群體之間的相互作用和行為過程中的一種現(xiàn)象。因此從系統(tǒng)科學(xué)的思路出發(fā),用系統(tǒng)觀點(diǎn)來認(rèn)識(shí)駕駛的本質(zhì),從而達(dá)到通用智能化。
錢學(xué)森[31]說:“人體作為一個(gè)系統(tǒng),首先,它是一個(gè)開放的系統(tǒng),也就是說,這個(gè)系統(tǒng)與外界是有交往的。比如,通過呼吸、飲食、排泄等,進(jìn)行物質(zhì)交往;通過視覺、聽覺、味覺、嗅覺、觸覺等進(jìn)行信息交往。此外,人體是由億萬個(gè)分子組成的,所以它不是一個(gè)小系統(tǒng),也不是一個(gè)大系統(tǒng),而是比大系統(tǒng)還大的巨系統(tǒng)。這個(gè)巨系統(tǒng)的組成部分又是各不相同的,它們之間的相互作用也是異常復(fù)雜的。所以是復(fù)雜的巨系統(tǒng)?!币虼耍谧詣?dòng)駕駛系統(tǒng)研發(fā)過程中,也需要提煉自動(dòng)駕駛系統(tǒng)中存在的問題,用系統(tǒng)的方式進(jìn)行研發(fā)。
事實(shí)上,隨著一個(gè)系統(tǒng)開放程度的提高,其處理高復(fù)雜性的能力以及適應(yīng)不斷變化的環(huán)境的能力也在提高。加利福尼亞大學(xué)洛杉磯分校的朱松純教授介紹了兩種人工智能的模式[32]。一種稱之為“鸚鵡范式”,認(rèn)為鸚鵡可以和人類說話,但不理解他們說的話。例如,當(dāng)你說“你好”時(shí),它會(huì)回答“你好”,但它不知道這是什么意思。還有一種是“烏鴉范式”。比如烏鴉知道不斷往水瓶里扔石頭,以提高水位來喝水。鸚鵡式模仿學(xué)習(xí)范式和烏鴉式推理學(xué)習(xí)范式之間存在顯著差異。對(duì)于鸚鵡來說,它是一種簡單粗暴的模仿學(xué)習(xí),這種方式可以機(jī)械地實(shí)現(xiàn)“類人”行為,而不理解學(xué)習(xí)背后的深層原因。而烏鴉能自主研究因果關(guān)系并推斷解決方案,從而完成任務(wù)。烏鴉依靠自己的觀察、感知、認(rèn)知、學(xué)習(xí)、推理和執(zhí)行,過著完全獨(dú)立的生活。所以可以理解為烏鴉有獨(dú)立學(xué)習(xí)和探索未知的能力。相應(yīng)地,自動(dòng)駕駛系統(tǒng)在邁向高等級(jí)發(fā)展過程中,智能可以被認(rèn)為是一種現(xiàn)象,它反映在個(gè)人和社會(huì)群體的行為過程中。自動(dòng)駕駛汽車的智能化水平的提高取決于客觀現(xiàn)實(shí)和物理環(huán)境的因果鏈。比如,外部物理環(huán)境為烏鴉提供了生存邊界條件。在不同的環(huán)境條件下,智能的形式有所不同。任何智能機(jī)器都需要理解物理世界及其因果鏈,并適應(yīng)世界。同時(shí),自動(dòng)駕駛汽車的智能可以滿足它們需要完成的特定任務(wù)。而任務(wù)代表價(jià)值和決策功能,是生物進(jìn)化的剛性需求。智能不僅體現(xiàn)適應(yīng)性(如只存在刺激和反應(yīng)而沒有預(yù)測(cè)和推斷),還適合局限于運(yùn)行設(shè)計(jì)域下的低等級(jí)自動(dòng)駕駛汽車。對(duì)于高等級(jí)自動(dòng)駕駛汽車,不適應(yīng)性在某種程度上更為重要,例如,它可以推理、進(jìn)化和超越人類自身的局限性。高等級(jí)自動(dòng)駕駛汽車可以創(chuàng)造一種新的可能性來適應(yīng)互動(dòng),實(shí)現(xiàn)超越。因此,在開發(fā)高等級(jí)自動(dòng)駕駛系統(tǒng)時(shí),尤其是L5 級(jí)自動(dòng)駕駛過程,需要有效結(jié)合烏鴉和鸚鵡的兩種不同的學(xué)習(xí)思維模式,提出第三種混合型范式,即“烏鴉推理+鸚鵡學(xué)舌”研究范式。根據(jù)前述對(duì)智能的理解,真正的智能體現(xiàn)的不僅僅是適應(yīng)性,更重要的是不適應(yīng)性,進(jìn)而以一種新的可能性實(shí)現(xiàn)從自適應(yīng)到他交互再到自超越的最終目標(biāo),并最終創(chuàng)造出一系列新的可能性——自由、改變、交互。圖靈機(jī)的缺點(diǎn)是只有刺激-反應(yīng)雙向反饋而沒有選擇機(jī)制,只有順應(yīng)而沒有同化機(jī)制,其與鸚鵡范式近似。而人類自身的演變機(jī)制對(duì)應(yīng)“烏鴉推理”范式,能夠自主推理、演化,但要真正實(shí)現(xiàn)超越人類本身的局限性,提高智能系統(tǒng)的算力,融入智能化的優(yōu)勢(shì),還需要結(jié)合兩種范式,如圖4 所示。因此,這種“烏鴉+鸚鵡”混合范式才是高等級(jí)自動(dòng)駕駛尤其是L5級(jí)自動(dòng)駕駛汽車發(fā)展的未來趨勢(shì)。
圖4.“烏鴉推理+鸚鵡學(xué)舌”研究框架?!胞W鵡學(xué)舌”可以通過數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)方法實(shí)現(xiàn)適應(yīng)性,而“烏鴉推理”則體現(xiàn)對(duì)交通環(huán)境的不適應(yīng)。通過兩者結(jié)合,自動(dòng)駕駛汽車可隨環(huán)境的變化而實(shí)現(xiàn)交互和進(jìn)化。
假設(shè)所考慮的大腦系統(tǒng)是開放演化的?!盀貘f+鸚鵡”混合范式具備開放性、發(fā)散性,能夠進(jìn)行自主演化,突破已有技術(shù)和思維的局限性。傳統(tǒng)架構(gòu)中,分層次來解決各項(xiàng)功能;而大腦系統(tǒng)的開發(fā)需要在已有的知識(shí)經(jīng)驗(yàn)基礎(chǔ)上借助人工智能這一工具進(jìn)行自主學(xué)習(xí),探索未知[2]?!白灾鲗W(xué)習(xí)+先驗(yàn)知識(shí)”的開發(fā)模式能夠讓大腦在基于大量共性決策機(jī)制和操控規(guī)律時(shí),不斷探索個(gè)性化駕駛/乘坐需求,真正實(shí)現(xiàn)“自學(xué)習(xí)、自適應(yīng)、自超越”的目標(biāo)。
現(xiàn)有針對(duì)自動(dòng)駕駛汽車發(fā)展所采取的措施主要有兩種思路:①自主學(xué)習(xí)法[24,33];②邏輯判斷法(先驗(yàn)知識(shí))[24]。前者包括深度神經(jīng)網(wǎng)絡(luò)(DNN),在自動(dòng)駕駛方面已取得了顯著成果。但是,當(dāng)將DNN 應(yīng)用于諸如預(yù)測(cè)和決策的行為生成之類的安全關(guān)鍵模塊時(shí),DNN 缺乏可解釋性和因果關(guān)系,并且很難合并領(lǐng)域知識(shí)。另外,建立一個(gè)精確的DNN 需要大量的相關(guān)數(shù)據(jù)進(jìn)行訓(xùn)練,而且對(duì)于不熟悉的場(chǎng)景,尤其在極端情況下也無法很好地推廣。而生成概率和邏輯模型具有解釋性,能夠通過邏輯判斷闡明因果關(guān)系,并具備不確定性建模能力。但是,這些固有邏輯模型的可遷移性低,且對(duì)復(fù)雜場(chǎng)景的表示能力相對(duì)較低。因此,本文提出一個(gè)結(jié)合學(xué)習(xí)類方法和生成概率模型及邏輯模型優(yōu)勢(shì)的混合框架,以生成可解釋且數(shù)據(jù)高效的行為。在此框架中,我們提出了一種“自主學(xué)習(xí)+先驗(yàn)知識(shí)”的開發(fā)模式,如圖5所示,通過使用從生成概率模型和觀測(cè)值獲得的動(dòng)態(tài)世界的低維表示來生成用于高級(jí)判斷的駕駛行為控制層。這樣,大腦系統(tǒng)能夠?qū)⑷四X儲(chǔ)存的先驗(yàn)知識(shí)遷移,并在自學(xué)習(xí)的框架下探索未知,從而構(gòu)建更復(fù)雜更高層級(jí)的知識(shí)推理。
假設(shè)態(tài)勢(shì)感知是狀態(tài)-趨勢(shì)-感覺-認(rèn)知的統(tǒng)一輸入。統(tǒng)一的安全場(chǎng)思路[34]能夠有效解決復(fù)雜環(huán)境下的綜合態(tài)勢(shì)感知和風(fēng)險(xiǎn)評(píng)估,實(shí)現(xiàn)時(shí)間和空間之間多域融合的多維尺度下的統(tǒng)一視角評(píng)估功能。智能車輛行駛過程將受到人-車-路三方面中多種因素的綜合影響。由于道路交通復(fù)雜,路況多變;駕駛?cè)藛T性格各異,行為不定;車輛系統(tǒng)復(fù)雜,性能耦合,使得行駛過程存在潛在風(fēng)險(xiǎn),其安全態(tài)勢(shì)具有時(shí)變、復(fù)雜和耦合的特性。
在圖6所示的方案中,將態(tài)勢(shì)感知中的“態(tài)”定義為駕駛?cè)?道路-環(huán)境系統(tǒng)中的各類表征個(gè)體狀態(tài)的主客觀數(shù)據(jù);“勢(shì)”定義為事件的發(fā)展趨勢(shì);“感”定義為對(duì)系統(tǒng)中“態(tài)”的覺察;“知”定義為對(duì)“勢(shì)”的理解。深度態(tài)勢(shì)感知理論模型在不同情境下處理信息的方式會(huì)有所區(qū)別,并且以往關(guān)于態(tài)勢(shì)感知的研究都充分說明了態(tài)勢(shì)感知具有實(shí)時(shí)性,即態(tài)勢(shì)感知會(huì)隨時(shí)間而不停地更新、迭代。通常行駛過程中的安全態(tài)勢(shì)評(píng)估/感知技術(shù)主要可以從宏觀交通管理視角和微觀車輛行駛視角出發(fā)[35]。然而,前者屬于依賴海量歷史事故數(shù)據(jù)的事后評(píng)估,難以及時(shí)評(píng)價(jià)行車過程中的當(dāng)前風(fēng)險(xiǎn),難以刻畫當(dāng)前行車安全水平,無法體現(xiàn)實(shí)時(shí)性;后者考慮的風(fēng)險(xiǎn)因素不全面,適用場(chǎng)景單一,難以適用于復(fù)雜多變的交通環(huán)境,對(duì)環(huán)境中人-車-路三要素間相互影響的耦合機(jī)理研究得不夠透徹,致使其在實(shí)際應(yīng)用中常顯示出局限性[36]。因此,現(xiàn)有針對(duì)態(tài)勢(shì)感知的研究思路還存在一定局限性,本文從統(tǒng)一的角度出發(fā),對(duì)人-車-路各要素之間的關(guān)系進(jìn)行耦合分析。
針對(duì)安全態(tài)勢(shì)的時(shí)變、復(fù)雜、耦合特性,借鑒場(chǎng)論探索行車過程的物理機(jī)制,構(gòu)建了行車安全場(chǎng)的具體模型。通過分別量化考慮車輛本身、道路交通設(shè)施、駕駛?cè)诵袨楹偷缆翻h(huán)境中各因素的行車風(fēng)險(xiǎn),確定了影響行車風(fēng)險(xiǎn)分布的內(nèi)因在于風(fēng)險(xiǎn)源本身的變化和風(fēng)險(xiǎn)梯度的變化。因此,本文可以用統(tǒng)一場(chǎng)的模型來對(duì)人-車-路綜合風(fēng)險(xiǎn)進(jìn)行量化評(píng)估,進(jìn)而有效解決現(xiàn)有方法難以實(shí)現(xiàn)綜合多因素的實(shí)時(shí)行車風(fēng)險(xiǎn)建模的難題。
圖5.結(jié)合基于規(guī)則和基于學(xué)習(xí)方法的統(tǒng)一自動(dòng)駕駛汽車框架。高等級(jí)自動(dòng)駕駛汽車應(yīng)從分層框架轉(zhuǎn)移到統(tǒng)一框架。
圖6.狀態(tài)-趨勢(shì)-感覺-認(rèn)知統(tǒng)一輸入框架。在人-車-路系統(tǒng)中,綜合考慮多種因素的統(tǒng)一輸入,通過狀態(tài)-趨勢(shì)-感覺-認(rèn)知4個(gè)步驟,可以實(shí)現(xiàn)綜合態(tài)勢(shì)感知和風(fēng)險(xiǎn)評(píng)估。ER指交通場(chǎng)景中靜止或固有的交通參與者帶來的潛在風(fēng)險(xiǎn),如道路條件帶來的風(fēng)險(xiǎn)約束;ED代表不同駕駛?cè)烁兄?認(rèn)知偏差的潛在風(fēng)險(xiǎn);EV代表交通參與者隨時(shí)間和空間動(dòng)態(tài)變化的演化風(fēng)險(xiǎn)。
假設(shè)實(shí)時(shí)決策和控制模塊的輸出追求最優(yōu)結(jié)果。在綜合交通環(huán)境中,由于駕駛場(chǎng)景的復(fù)雜多變、交通參與者行為的難以預(yù)測(cè)以及人們對(duì)于行車安全性、高效性和舒適性要求的提高,對(duì)于整個(gè)動(dòng)態(tài)復(fù)雜過程,自動(dòng)駕駛汽車的智能決策系統(tǒng)相當(dāng)于人類駕駛?cè)说男∧X。其能協(xié)同平衡各項(xiàng)操縱的控制終端,使得駕駛?cè)藢⑿旭偮窂椒纸鉃榉较虮P、油門、剎車踏板的操作,從而執(zhí)行規(guī)劃目標(biāo)。本文基于駕駛?cè)嗽诰C合交通場(chǎng)景下的行為決策過程,抽取行駛過程中駕駛?cè)岁P(guān)注的相關(guān)屬性,分析駕駛?cè)嗽诓倏v過程中追求的主要目標(biāo)。通過判斷、評(píng)價(jià)并獲取駕駛?cè)说闹饕{駛行為模式,使得自動(dòng)駕駛汽車的行為決策過程符合人類駕駛?cè)说乃季S過程[2]。通過建立一種基于模擬駕駛?cè)笋{駛行為的自動(dòng)駕駛汽車路徑規(guī)劃模型,使得實(shí)時(shí)規(guī)劃符合駕駛期望的軌跡,能夠有效探索單車個(gè)體和多車系統(tǒng)的最優(yōu)路徑。
如圖7所示,通過統(tǒng)計(jì)自然駕駛數(shù)據(jù)中駕駛過程的關(guān)鍵參數(shù),分析發(fā)現(xiàn)車輛行駛過程中反映駕駛?cè)藳Q策行為的主要運(yùn)動(dòng)特征參數(shù)存在極值現(xiàn)象。產(chǎn)生極值現(xiàn)象的內(nèi)在動(dòng)因是駕駛?cè)俗裱摆吚芎Α钡幕緵Q策機(jī)制,即駕駛過程中駕駛?cè)肆D實(shí)現(xiàn)機(jī)動(dòng)性和安全性之間的最優(yōu)效果。受自然界包括物理和生物行為上的眾多極值現(xiàn)象遵循最小作用量原理的啟發(fā),有研究人員提出駕駛?cè)藳Q策機(jī)制遵循最小作用量原理的假設(shè)[37]。本文嘗試將自然界中力學(xué)系統(tǒng)的物理特性與交通系統(tǒng)的固有屬性聯(lián)系,將自然界“尋優(yōu)”目的與駕駛?cè)恕摆吚芎Α钡奶匦越Y(jié)合,從而提出基于最小作用量的決策控制算法[38]。即在選擇最優(yōu)軌跡時(shí),本文通過采用讓自動(dòng)駕駛汽車模擬駕駛?cè)说臎Q策規(guī)劃方式,總結(jié)駕駛?cè)瞬倏v特性,提出基于最小作用量原理的目標(biāo)函數(shù)[39]。該目標(biāo)函數(shù)綜合考慮安全和高效等駕駛期望,通過計(jì)算每條可行軌跡的作用量來對(duì)路徑進(jìn)行篩選,從而選擇具有最小作用量的路徑并對(duì)其進(jìn)行速度優(yōu)化。
現(xiàn)有關(guān)于駕駛?cè)藳Q策的研究難以滿足智能汽車技術(shù)的發(fā)展需求。傳統(tǒng)研究通常是針對(duì)特定場(chǎng)景與單一交通環(huán)境的駕駛?cè)诵袨榈慕7椒ǎ荒苋娣从绸{駛?cè)嗽谡鎸?shí)交通環(huán)境中的決策能力和準(zhǔn)確量化駕駛?cè)说臎Q策行為[40],更難為開發(fā)高等級(jí)智能汽車的擬人化駕駛算法提供指導(dǎo)依據(jù)。針對(duì)現(xiàn)有方法的局限性,本文中的方法將駕駛?cè)诵熊囘^程中“趨利避害”的駕駛特性融入自動(dòng)駕駛汽車的決策層,運(yùn)用駕駛?cè)瞬倏v思維來控制底端,完成駕駛?cè)蝿?wù)。算法綜合考慮客觀環(huán)境和周邊障礙物(動(dòng)態(tài)、靜態(tài)),并不局限于單一場(chǎng)景或靜態(tài)障礙物,適用面更廣。
高等級(jí)的自動(dòng)駕駛汽車作為一個(gè)獨(dú)立且需要與外界進(jìn)行信息交互的智能體,需要在遵從人類預(yù)期的運(yùn)行規(guī)律的同時(shí),能夠超越人類的局限性,并且具備“意識(shí)”和“智能”兩方面的能力。其中,“意識(shí)”是指智能體感知并理解事物的能力,“智能”是指智能體推斷并解決問題的能力。如圖8所示,高等級(jí)的自動(dòng)駕駛汽車通常被期望具有強(qiáng)大的環(huán)境感知能力,如人的眼睛一樣,因此,感知-評(píng)估模塊對(duì)人-車-路系統(tǒng)進(jìn)行動(dòng)態(tài)信息感知,為大腦中樞提供感官信息輸入。同時(shí),期望智能車輛能夠準(zhǔn)確地預(yù)測(cè)周圍道路參與者的行為和適應(yīng)周邊環(huán)境的動(dòng)態(tài)變化,而車輛決策系統(tǒng)作為車輛的核心控制單元,需要像人體的小腦一樣具備協(xié)調(diào)平衡的能力。決策系統(tǒng)提供了一個(gè)離散交通參與者、約束、動(dòng)態(tài)演化趨勢(shì)和大腦控制中心輸入的動(dòng)態(tài)平衡。高等級(jí)自動(dòng)駕駛汽車作為在外部交通環(huán)境中能夠與信息進(jìn)行交互的獨(dú)立智能體,需要具備超越人類局限的能力,同時(shí)遵守預(yù)期的運(yùn)行規(guī)則,具備意識(shí)和智能的能力。因此,自動(dòng)駕駛汽車需要基于自主學(xué)習(xí)和先驗(yàn)知識(shí)的發(fā)展模式。此外,自動(dòng)駕駛汽車可以運(yùn)用意識(shí)理論,如GWT和IIT,從系統(tǒng)的角度實(shí)現(xiàn)閉環(huán)互動(dòng)。這樣就可以通過手腳和大腦終端動(dòng)作的及時(shí)調(diào)整來實(shí)現(xiàn)車輛執(zhí)行?;凇盀貘f推理+鸚鵡學(xué)舌”的混合范式,閉環(huán)反饋中存在一個(gè)開環(huán)自進(jìn)化過程。
然而,現(xiàn)有的研究思路對(duì)于開發(fā)高等級(jí)自動(dòng)駕駛系統(tǒng)無疑是具有挑戰(zhàn)性的,在現(xiàn)有框架下,我們難以全面列出自動(dòng)駕駛汽車所面對(duì)的所有駕駛情況和可能的潛在危險(xiǎn),而高等級(jí)自動(dòng)駕駛汽車所要應(yīng)對(duì)的更高等級(jí)的復(fù)雜性和部分隱含的機(jī)動(dòng)駕駛?cè)蝿?wù),使得研究人員在研發(fā)高等級(jí)自動(dòng)駕駛汽車的每個(gè)階段都很難論證安全要求的完整性和正確性。因此要徹底測(cè)試系統(tǒng)以確保超級(jí)可靠的系統(tǒng)運(yùn)行是不可行的,而從系統(tǒng)角度進(jìn)行整體的開發(fā)對(duì)于高等級(jí)自動(dòng)駕駛汽車,尤其是L5級(jí)自動(dòng)駕駛汽車具有重要意義。
提高自動(dòng)駕駛汽車的智能化水平引發(fā)人們極大的興趣。然而,對(duì)于如何實(shí)現(xiàn)高等級(jí)自動(dòng)駕駛汽車,基于任務(wù)或場(chǎng)景驅(qū)動(dòng)框架的可行解決方案,以及統(tǒng)一原則如何發(fā)揮作用等都還存在一定程度的困惑。本文試圖通過分析現(xiàn)有的高等級(jí)自動(dòng)駕駛的發(fā)展技術(shù),比較L4級(jí)和L5級(jí)之間的差異來解析現(xiàn)有挑戰(zhàn)。最后,提出邁向L5 級(jí)自動(dòng)駕駛汽車的統(tǒng)一原則和可行途徑。
圖7.擬人化的整體決策和控制框架。通過將交通環(huán)境中的離散信息輸入到最優(yōu)決策系統(tǒng)中,結(jié)合數(shù)據(jù)驅(qū)動(dòng)的駕駛?cè)诵袨槟J降妮斎?,可系統(tǒng)地輸出多目標(biāo)協(xié)同控制策略。Gi:虛擬吸引力;Ri:阻力;Fji:外力;θi:傾角;i:自動(dòng)駕駛汽車;j:外部交通參與者。
圖8.評(píng)估和獲取駕駛?cè)笋{駛行為模式的系統(tǒng)概述圖。高等級(jí)自動(dòng)駕駛汽車通過感知-認(rèn)知-評(píng)估模塊獲取復(fù)雜的交通環(huán)境信息,集成各種傳感器進(jìn)行信息融合,保證車輛環(huán)境感知系統(tǒng)的穩(wěn)定性。決策小腦協(xié)同平衡各種操控的控制終端,通過判斷、評(píng)估、獲取駕駛?cè)说鸟{駛行為模式,使行為決策過程符合駕駛?cè)说乃季S過程。大腦系統(tǒng)基于自主學(xué)習(xí)和先驗(yàn)知識(shí)的發(fā)展模式,最終通過其他子系統(tǒng)的控制實(shí)現(xiàn)開放進(jìn)化。
具體而言,本文將系統(tǒng)科學(xué)理論作為自動(dòng)駕駛系統(tǒng)開發(fā)的核心思想,將自動(dòng)駕駛汽車視為具有“自學(xué)習(xí)、自適應(yīng)、自超越”能力的智能生命體?;凇按竽X-小腦-器官”的協(xié)調(diào)平衡框架和基于“烏鴉推理+鸚鵡學(xué)舌”研究范式的混合模型,為發(fā)展高等級(jí)自動(dòng)駕駛汽車提供了新的視角。此外,提出了一種可行的類腦系統(tǒng)模塊開發(fā)方法,并將其視為結(jié)合自主學(xué)習(xí)和先驗(yàn)知識(shí)優(yōu)勢(shì)的混合框架,可以支持復(fù)雜環(huán)境下自動(dòng)駕駛系統(tǒng)實(shí)現(xiàn)完全自主駕駛。同時(shí),本文提出了一種可行的態(tài)勢(shì)感知模塊開發(fā)方法,即建立統(tǒng)一的安全場(chǎng),支持自動(dòng)駕駛汽車在多因素耦合條件下進(jìn)行準(zhǔn)確的風(fēng)險(xiǎn)評(píng)估。此外,基于最小動(dòng)作原理的決策與控制模塊可以為系統(tǒng)地開發(fā)L5 級(jí)自動(dòng)駕駛汽車提供一個(gè)全新的思路。
綜上所述,場(chǎng)景驅(qū)動(dòng)和任務(wù)驅(qū)動(dòng)的研究思路對(duì)于實(shí)現(xiàn)L5 級(jí)自動(dòng)駕駛系統(tǒng)是具有挑戰(zhàn)性的,但從系統(tǒng)的角度出發(fā),結(jié)合所提出的基本原則,能夠?yàn)殚_發(fā)高等級(jí)自主系統(tǒng)提供一種新的途徑。希望在這個(gè)研究范式的指導(dǎo)下,能突破現(xiàn)有技術(shù)的局限,實(shí)現(xiàn)高等級(jí)自動(dòng)駕駛。
致謝
感謝國家杰出青年科學(xué)基金(51625503)、國家自然科學(xué)基金重大項(xiàng)目(61790561),以及車聯(lián)網(wǎng)教育部-中國移動(dòng)聯(lián)合實(shí)驗(yàn)室聯(lián)合資助。
Compliance with ethics guidelines
Jianqiang Wang, Heye Huang, Keqiang Li, and Jun Li declare that they have no conflict of interest or financial conflicts to disclose.