国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

邁向L5級(jí)自動(dòng)駕駛汽車的發(fā)展原則

2021-03-17 02:54王建強(qiáng)黃荷葉李克強(qiáng)李駿
工程 2021年9期
關(guān)鍵詞:框架決策自動(dòng)

王建強(qiáng)*, 黃荷葉, 李克強(qiáng), 李駿

S tate Key Laboratory of Automotive S afety and Energy, S chool of Vehicle and Mobility, Tsinghua University, Beijing 100084, China

1.引言

近年來,自動(dòng)駕駛汽車的自動(dòng)化程度正逐漸提高,并引發(fā)對(duì)更高程度自動(dòng)化水平的追求。自主性可以定義為一個(gè)智能化的系統(tǒng)在系統(tǒng)自身及其環(huán)境的不確定性下實(shí)現(xiàn)特定任務(wù)的能力[1]。在實(shí)現(xiàn)特定任務(wù)過程中,通常也可認(rèn)為,系統(tǒng)自身在無/少干擾情況下對(duì)于不確定性處理能力越強(qiáng),其自動(dòng)化程度越高[2]。目前對(duì)于自動(dòng)駕駛汽車自動(dòng)化程度的衡量標(biāo)準(zhǔn)多樣,而汽車工業(yè)界通常采用汽車工程師協(xié)會(huì)(SAE International)定義的從0 級(jí)(完全手動(dòng))到5 級(jí)(完全自主)的6 級(jí)分級(jí)標(biāo)準(zhǔn)[3]。現(xiàn)有SAE 對(duì)于L1~L5 級(jí)自動(dòng)駕駛的定義[3]可以理解為:對(duì)于L1 級(jí)別自動(dòng)駕駛,可以完成在一個(gè)維度(橫向或縱向)的駕駛?cè)蝿?wù);L2 級(jí)別自動(dòng)駕駛可以同時(shí)自動(dòng)進(jìn)行多維度輔助(如加減速和轉(zhuǎn)向);L3級(jí)別自動(dòng)駕駛車輛在特定環(huán)境中可以實(shí)現(xiàn)自動(dòng)加減速和轉(zhuǎn)向,無需駕駛?cè)烁深A(yù);在L4 級(jí)別自動(dòng)駕駛中,在限定條件下如果車輛當(dāng)前處于自動(dòng)駕駛狀態(tài),則全程無需駕駛者接管方向盤;L5 級(jí)別自動(dòng)駕駛車輛可以在任何條件、任何場(chǎng)景下自動(dòng)行駛,車輛的自動(dòng)化系統(tǒng)完全替代了人類駕駛員,車輛達(dá)到完全自動(dòng)化。

在L1~L5級(jí)自動(dòng)駕駛發(fā)展過程中,動(dòng)態(tài)性、隨機(jī)性和多樣化的交通參與者,耦合化、時(shí)變化、復(fù)雜化的交通環(huán)境,以及非結(jié)構(gòu)化、模糊不明甚至不合理的道路基礎(chǔ)設(shè)施都是實(shí)現(xiàn)自動(dòng)駕駛的潛在挑戰(zhàn)[4,6]。三大主要挑戰(zhàn)可以概括為:①多場(chǎng)景疊加,如城市鬧區(qū)等多交通場(chǎng)景疊加情況等;②非理想環(huán)境適應(yīng),如動(dòng)態(tài)變化的天氣與路況條件等;③交通狀態(tài)不確定,如隨機(jī)突發(fā)的緊急事件等潛在難題。因此,為實(shí)現(xiàn)更高等級(jí)的自動(dòng)駕駛,需要提出一套有效的自動(dòng)駕駛汽車研發(fā)思路,讓高等級(jí)自動(dòng)駕駛汽車具備在考慮其他道路使用者的意愿和決策機(jī)制的前提下,對(duì)交通環(huán)境中的風(fēng)險(xiǎn)程度進(jìn)行估計(jì)、判斷和預(yù)測(cè),規(guī)劃具體的駕駛策略和軌跡,實(shí)現(xiàn)智能車輛在復(fù)雜的不確定環(huán)境中的安全可靠的高等級(jí)自動(dòng)駕駛。

駕駛過程中人為失誤導(dǎo)致的交通事故比例已經(jīng)超過90%,包括駕駛?cè)嗽诟兄?、認(rèn)知、推理與決策各階段自身的局限性[7,9]。應(yīng)用自動(dòng)駕駛技術(shù),逐步提高車輛駕駛的智能化水平,是解決交通安全問題的根本途徑。許多自動(dòng)駕駛制造商都制定了各自研究路線,推動(dòng)自動(dòng)駕駛技術(shù)發(fā)展。目前主流自動(dòng)駕駛技術(shù)路線[10-11]有:①“漸進(jìn)演化”路線。從先進(jìn)駕駛?cè)溯o助系統(tǒng)(ADAS)產(chǎn)品開始生產(chǎn)并逐步研發(fā)到無人駕駛階段,大部分傳統(tǒng)車企和零部件企業(yè)一般采用這種相對(duì)保守的路線[12]。②“革命性”路線。一開始就研發(fā)L4 或者L5 級(jí)自動(dòng)駕駛,如谷歌、福特、通用(GM)、Momenta等公司。③“特斯拉”路線。在搭載自動(dòng)駕駛系統(tǒng)硬件的汽車上,首先應(yīng)用輔助自動(dòng)駕駛功能,不斷積累測(cè)試數(shù)據(jù),通過軟件升級(jí)完善自動(dòng)駕駛統(tǒng),最終實(shí)現(xiàn)無人駕駛。

但現(xiàn)有的技術(shù)路線在實(shí)施過程中都遇到了類似難題:①自動(dòng)駕駛汽車會(huì)違反交通規(guī)則,頻繁制動(dòng),犧牲乘客舒適性,對(duì)交通造成負(fù)面影響;②安全算法考慮因素不足,難以準(zhǔn)確判別行車危險(xiǎn)程度;③智能汽車在復(fù)雜環(huán)境陷入困境后,綜合判斷能力欠缺,易導(dǎo)致決策沖突等。這些難題帶來了在現(xiàn)實(shí)行車過程中出現(xiàn)的一系列自動(dòng)駕駛不合理現(xiàn)象[13]:“路遇行人不停車”“一次跨越多個(gè)車道”“路遇車輛頻繁制動(dòng)”“左轉(zhuǎn)時(shí)猶豫、起?!钡葐栴},同時(shí)也造成了多起自動(dòng)駕駛事故[14]。例如,2016 年,特斯拉Model S電動(dòng)汽車在途經(jīng)十字路口的時(shí)候,撞上了一輛正在左轉(zhuǎn)的卡車;2017年,自動(dòng)駕駛汽車Waymo在測(cè)試時(shí),發(fā)生了追尾事故;2018 年,Uber 自動(dòng)駕駛測(cè)試車因系統(tǒng)無法準(zhǔn)確識(shí)別人行橫道以外的行人而造成事故。

雖然各研究機(jī)構(gòu)的研究路線有所側(cè)重,但針對(duì)高等級(jí)自動(dòng)駕駛汽車的研發(fā)思路主要是基于場(chǎng)景和任務(wù)驅(qū)動(dòng)來進(jìn)行特定場(chǎng)景下的具體功能開發(fā)[5]。這一思路對(duì)于L1~L3級(jí)的駕駛輔助系統(tǒng)開發(fā)有一定指導(dǎo)作用,可以在特定場(chǎng)景下完成指定功能;而L3~L4級(jí)自動(dòng)駕駛屬于任務(wù)驅(qū)動(dòng),因此能夠?qū)崿F(xiàn)在限定條件下人機(jī)協(xié)同共駕。而對(duì)于L5 級(jí)自動(dòng)駕駛,場(chǎng)景驅(qū)動(dòng)可能會(huì)帶來多類場(chǎng)景疊加難題,使得L5級(jí)自動(dòng)駕駛汽車會(huì)為了能夠適應(yīng)這一功能而陷入困境;任務(wù)驅(qū)動(dòng)則會(huì)導(dǎo)致自動(dòng)駕駛時(shí)多任務(wù)沖突,難以讓L5 級(jí)自動(dòng)駕駛汽車無條件地自由行駛。例如,交通參與者(車輛、行人、騎行者)對(duì)交通規(guī)則的遵循意識(shí)觀念不強(qiáng);行駛環(huán)境的道路結(jié)構(gòu)和交通設(shè)施都存在不合理、老舊不清晰等問題。這些特殊化的交通參與者行為和行車環(huán)境都大大增加了現(xiàn)有基于場(chǎng)景或任務(wù)驅(qū)動(dòng)的研發(fā)思路的應(yīng)用挑戰(zhàn)。

由此可見,L5 級(jí)自動(dòng)駕駛汽車需要實(shí)現(xiàn)超越駕駛?cè)说男阅?,全方位提高汽車行駛性能,從學(xué)習(xí)駕駛?cè)说鸟{駛方式到適應(yīng)駕駛?cè)笋{駛模式再到超越駕駛?cè)笋{駛局限[2]。目前仍鮮有從一種全新的“系統(tǒng)、統(tǒng)一、均衡”的角度出發(fā),探索高等級(jí)自動(dòng)駕駛系統(tǒng)背后的物理機(jī)制,揭示駕駛本質(zhì)的研發(fā)范式。因此針對(duì)現(xiàn)有方法的局限性,本文突破傳統(tǒng)研發(fā)自動(dòng)駕駛思想,采用推理演繹方式,提出“大腦-小腦-器官”協(xié)調(diào)平衡框架,探索“自主學(xué)習(xí)+先驗(yàn)知識(shí)”的研究范式。通過開展開拓性研究,旨在實(shí)現(xiàn)自動(dòng)駕駛汽車“自學(xué)習(xí)、自適應(yīng)、自超越”特性,為L5 級(jí)自動(dòng)駕駛汽車的開發(fā)提供新的研究思路和途徑。

2.現(xiàn)有研發(fā)框架的局限性分析

現(xiàn)有的自動(dòng)駕駛汽車的常用開發(fā)思路是將整個(gè)系統(tǒng)劃分為獨(dú)立的層和功能。例如,智能車輛首先通過感知層感知駕駛環(huán)境參數(shù),識(shí)別目標(biāo)類型。然后通過情景評(píng)估,提高對(duì)駕駛行為意圖等駕駛環(huán)境的了解,并估計(jì)和預(yù)測(cè)未來的駕駛風(fēng)險(xiǎn)程度,評(píng)估其他道路使用者的風(fēng)險(xiǎn)水平,正確認(rèn)識(shí)環(huán)境[15]。最后,自動(dòng)駕駛汽車通過決策和執(zhí)行控制系統(tǒng)完成行為和路徑規(guī)劃,從而實(shí)現(xiàn)駕駛操作任務(wù)。

具體來說,現(xiàn)有與基于場(chǎng)景和任務(wù)驅(qū)動(dòng)的研發(fā)思路對(duì)應(yīng)的自動(dòng)駕駛汽車的開發(fā)途徑主要分為“感知-決策-控制”這一分層自動(dòng)駕駛框架和端到端的整體學(xué)習(xí)框架。

2.1.“感知-決策-控制”分層框架分析

在目前的自動(dòng)駕駛系統(tǒng)中,感知系統(tǒng)、決策系統(tǒng)、控制系統(tǒng)、執(zhí)行系統(tǒng)多依賴功能疊加式的設(shè)計(jì)方案進(jìn)行獨(dú)立設(shè)計(jì)開發(fā)。當(dāng)自動(dòng)駕駛汽車在向更高等級(jí)發(fā)展的過程中,就需要提供更高等級(jí)的功能,而現(xiàn)有的研究框架通常在原有系統(tǒng)基礎(chǔ)上,直接疊加新的系統(tǒng),進(jìn)行功能集成,產(chǎn)生新的功能。這種“結(jié)構(gòu)分層設(shè)計(jì),功能疊加產(chǎn)生”的集成架構(gòu)相對(duì)簡單,容易實(shí)現(xiàn),在智能駕駛系統(tǒng)發(fā)展的初級(jí)階段發(fā)揮了重要作用[5]。然而,隨著智能汽車的等級(jí)逐漸提高,功能需求不斷增多,子系統(tǒng)不斷集成,系統(tǒng)結(jié)構(gòu)愈發(fā)復(fù)雜,各系統(tǒng)功能與結(jié)構(gòu)存在相互的耦合與重疊,易造成結(jié)構(gòu)配置冗余、資源利用率不高和系統(tǒng)成本增加等問題。

特別地,目前在分層式框架中,在決策過程中常采用基于規(guī)則的方法。該方法能夠有效實(shí)現(xiàn)L2~L4級(jí)的決策過程,是一種有效針對(duì)特定場(chǎng)景和具體任務(wù)驅(qū)動(dòng)的自動(dòng)駕駛模式的方法。該方法的代表性方法包括有限狀態(tài)機(jī)等,其規(guī)則直觀、可讀性較好、易實(shí)現(xiàn),在簡單的場(chǎng)景中,適用性比較好。而這類方法的明顯缺點(diǎn)是缺乏概括未知情況的能力,這使其很難被擴(kuò)展到實(shí)際駕駛中,尤其是針對(duì)高等級(jí)自動(dòng)駕駛。在分層框架中,具體各子系統(tǒng)的特點(diǎn)和存在的不足如表1所示[16,22]。

表1 “感知-決策-控制”分層框架特點(diǎn)

續(xù)表

2.2.端到端學(xué)習(xí)框架分析

目前很多創(chuàng)新公司或研究機(jī)構(gòu)都在研究并推廣,結(jié)合深度學(xué)習(xí)與增強(qiáng)學(xué)習(xí)的方法在自動(dòng)駕駛領(lǐng)域進(jìn)行端到端的訓(xùn)練[19,23]。端到端的學(xué)習(xí)方法可以直接將傳感器輸入端的信息導(dǎo)出,然后輸入車輛底層控制器中(剎車、油門、轉(zhuǎn)向等)進(jìn)行輸出。對(duì)于現(xiàn)有采用端到端的學(xué)習(xí)框架,其不斷探索、學(xué)習(xí)的屬性能夠讓自動(dòng)駕駛汽車實(shí)現(xiàn)“自適應(yīng)、自學(xué)習(xí)”這一過程[24]。然而由于端到端框架的中間環(huán)節(jié)的隱藏特性,最終導(dǎo)致在實(shí)際交通場(chǎng)景中,在面對(duì)未知不確定的情境時(shí)會(huì)出現(xiàn)“學(xué)習(xí)內(nèi)容不明確、學(xué)習(xí)方向不可控、學(xué)習(xí)策略不相關(guān)”等問題。由于端到端中間過程的“黑箱問題”會(huì)帶來透明性不高的問題,導(dǎo)致所對(duì)應(yīng)的功能和策略與預(yù)期不相符的程度會(huì)增加。同時(shí),由于學(xué)習(xí)類方法背后潛在的物理機(jī)制不明晰,導(dǎo)致開發(fā)高等級(jí)自動(dòng)駕駛車輛存在許多潛在風(fēng)險(xiǎn)。此外,由于未能深刻揭示模型背后的物理機(jī)制所造成的可解釋性問題,將成為阻礙學(xué)習(xí)類方法進(jìn)一步發(fā)展應(yīng)用的瓶頸。而具體的問題如“難以與規(guī)則結(jié)合”“計(jì)算成本過高、硬件要求高”“樣本不夠多、完整性不足,高訓(xùn)練成本”等也進(jìn)一步讓端到端學(xué)習(xí)在實(shí)際應(yīng)用過程中受阻[25]。

因此,僅靠端到端的探索或現(xiàn)有的分層式框架,無法有效應(yīng)對(duì)這些非正常情況。復(fù)雜的交通場(chǎng)景通常具備這些不確定、不可測(cè)、非常規(guī)的元素。如果高等級(jí)自動(dòng)駕駛汽車按照目前的單一功能、特定場(chǎng)景、任務(wù)驅(qū)使的發(fā)展趨勢(shì),將無法有效處理交通不正常的情況。針對(duì)特定場(chǎng)景與單一交通環(huán)境的傳統(tǒng)研發(fā)方法,不能全面反映駕駛?cè)嗽谡鎸?shí)交通環(huán)境中的決策操控能力,很難為開發(fā)高等級(jí)智能汽車的擬人化駕駛算法提供指導(dǎo)依據(jù)。

3.L4級(jí)與L5級(jí)自動(dòng)駕駛的差異性

3.1.L5級(jí)自動(dòng)駕駛目標(biāo)

根據(jù)已有的定義,L5 級(jí)和L4 級(jí)之間存在本質(zhì)區(qū)別,L4 級(jí)可以實(shí)現(xiàn)高度智能的無人駕駛,但其限定條件使得L4 級(jí)只能在盡量覆蓋各種場(chǎng)景的前提下趨近于人類駕駛行為,無法實(shí)現(xiàn)100%的實(shí)用化和L5級(jí)下的無條件普適性要求。而根據(jù)SAE 分級(jí)標(biāo)準(zhǔn),在目前的自動(dòng)駕駛等級(jí)分級(jí)中,L4與L5級(jí)別的自動(dòng)駕駛汽車的區(qū)別在于運(yùn)行設(shè)計(jì)域(ODD),L4級(jí)的自動(dòng)駕駛汽車只能在給定工況范圍內(nèi)運(yùn)行,而L5 級(jí)則是可以在符合道德規(guī)范的任意工況下運(yùn)行。但究其根本,如果從場(chǎng)景的覆蓋范圍及運(yùn)行工況角度對(duì)L4 級(jí)和L5 級(jí)進(jìn)行區(qū)分,則很容易造成L5 級(jí)自身的定義模糊化,且?guī)硎欠裼斜匾l(fā)展L5級(jí)的系列討論。

因此,本文在SAE 標(biāo)準(zhǔn)和其他自動(dòng)駕駛分類標(biāo)準(zhǔn)的基礎(chǔ)上,重新對(duì)L5級(jí)自動(dòng)駕駛的本質(zhì)進(jìn)行闡明。L5級(jí)自動(dòng)駕駛汽車將不再是傳統(tǒng)意義上的一輛汽車,而是一個(gè)具有“自學(xué)習(xí)、自修復(fù)、軟件自配置、自主社交、自主駕駛能力”的連接不同場(chǎng)景的移動(dòng)生活載體。其“自學(xué)習(xí)、自適應(yīng)、自超越”的特性可以應(yīng)用于L2~L4級(jí)自動(dòng)駕駛,但這一過程只是單向的。而L1~L4 級(jí)自動(dòng)駕駛只是L5 級(jí)的一種特例。進(jìn)一步分析,在L1~L5 級(jí)自動(dòng)駕駛發(fā)展過程中,L1~L3 級(jí)自動(dòng)駕駛聚焦于感知層面的任務(wù)代理;L4級(jí)實(shí)現(xiàn)給定復(fù)雜場(chǎng)景內(nèi)的決策任務(wù),存在一定的任務(wù)處理邊界,該任務(wù)邊界出現(xiàn)的主要原因是L4 級(jí)自動(dòng)駕駛系統(tǒng)生成決策的方法是基于統(tǒng)計(jì)信息的決策搜索,而非基于邏輯的決策生成。我們也可以將L4 級(jí)自動(dòng)駕駛理解為部分樣本,在達(dá)到L4 級(jí)技術(shù)后即實(shí)現(xiàn)了部分樣本的驗(yàn)證,但部分樣本無法覆蓋全部樣本。L4 級(jí)自動(dòng)駕駛汽車可理解為能在有限性工況下運(yùn)行,但對(duì)于無限的不確定場(chǎng)景難以以單純列舉的方式實(shí)現(xiàn),更多的是需要具有自主探索能力。

因此,L5 級(jí)要求自動(dòng)駕駛系統(tǒng)在未知駕駛場(chǎng)景內(nèi)具備決策生成的能力,相較于L4 級(jí)的主要差異在于其具備了基于邏輯的推理學(xué)習(xí)能力,亦可稱為自修正能力。不同于簡單的機(jī)器學(xué)習(xí)模式,這種能力不僅使自動(dòng)駕駛系統(tǒng)可以采用統(tǒng)計(jì)學(xué)的方法對(duì)駕駛經(jīng)歷進(jìn)行特征提取,而且有助于進(jìn)一步提煉受控車輛與交通環(huán)境的交互機(jī)制,從而形成一種能夠系統(tǒng)性調(diào)整自動(dòng)駕駛系統(tǒng)(相較于對(duì)單一模塊的調(diào)整)的修正邏輯。

3.2.難實(shí)現(xiàn)L5級(jí)自動(dòng)駕駛的原因

真實(shí)的交通環(huán)境由于存在各種道路使用者,且各道路使用者的時(shí)變和行為不確定性造成了交通系統(tǒng)的復(fù)雜性。如文獻(xiàn)[26]所述,自動(dòng)駕駛汽車發(fā)展過程中存在一些共性問題,主要包括現(xiàn)有各項(xiàng)技術(shù)發(fā)展存在瓶頸和現(xiàn)有基礎(chǔ)設(shè)施不夠完善。如先前的研究[6,10]所述,針對(duì)目前的感知、決策、控制技術(shù)的發(fā)展現(xiàn)狀,要真正實(shí)現(xiàn)L5 級(jí)自動(dòng)駕駛離不開各項(xiàng)技術(shù)的推動(dòng)。比如Chen等[27]引入了基于事件的自主駕駛神經(jīng)形態(tài)視覺的新概念,可以幫助高等級(jí)自動(dòng)駕駛汽車獲取更準(zhǔn)確的視覺感知信息。這對(duì)發(fā)展更高等級(jí)自動(dòng)駕駛汽車,尤其是L5 級(jí)自動(dòng)駕駛汽車至關(guān)重要。而高等級(jí)自動(dòng)駕駛所需要的技術(shù)條件與目前的發(fā)展現(xiàn)狀存在一些差距。同時(shí),除了技術(shù)和基礎(chǔ)設(shè)施原因,自動(dòng)駕駛汽車目前仍然無法達(dá)到L5級(jí)的更深層次的原因主要有:

(1)交通要素作用機(jī)理不明。復(fù)雜環(huán)境下,各要素對(duì)行車風(fēng)險(xiǎn)影響的機(jī)制不清晰,難以探明各要素之間的耦合機(jī)理。如駕駛?cè)藢?duì)不同交通環(huán)境靜態(tài)和動(dòng)態(tài)信息的認(rèn)知判斷機(jī)制不清晰,駕駛?cè)藢?duì)車輛動(dòng)力學(xué)特性的適應(yīng)能力和操縱水平難量化,各交通要素對(duì)于駕駛?cè)说膭?dòng)態(tài)干擾機(jī)制不確定等。因此高等級(jí)自動(dòng)駕駛汽車需要充分認(rèn)知人-車-環(huán)境耦合風(fēng)險(xiǎn),將駕駛?cè)藢?duì)于行車環(huán)境各要素造成的潛在風(fēng)險(xiǎn)認(rèn)知規(guī)律應(yīng)用于智能車輛風(fēng)險(xiǎn)評(píng)估,實(shí)現(xiàn)交通環(huán)境多要素耦合作用下的準(zhǔn)確風(fēng)險(xiǎn)辨識(shí)。

(2)交通運(yùn)行的變化規(guī)律不清晰。在動(dòng)態(tài)環(huán)境下,存在人-車-路系統(tǒng)多方面的不確定性。如人的參與帶來的不確定性,人本身的隨機(jī)性使得交通復(fù)雜系統(tǒng)更具不確定性;環(huán)境的變化不確定,導(dǎo)致對(duì)交通認(rèn)知的難度提高;道路條件的不確定,帶來車輛性能適應(yīng)的不確定性;信息獲取的不確定性(通訊手段、安全通信的不確定性),帶來復(fù)雜交通系統(tǒng)信息范圍的不確定性等。因此高等級(jí)自動(dòng)駕駛汽車的發(fā)展需要充分探明交通環(huán)境的變化規(guī)律,考慮其他道路使用者的動(dòng)態(tài)意圖,估計(jì)、判斷和預(yù)測(cè)交通環(huán)境中的風(fēng)險(xiǎn)程度,通過規(guī)劃具體駕駛策略和軌跡,提高智能車輛在復(fù)雜環(huán)境中的決策水平和能力。

(3)決策執(zhí)行機(jī)理不明。在復(fù)雜交通環(huán)境下,存在智能車輛決策固化,駕駛行為難符合優(yōu)秀駕駛?cè)说鸟{駛習(xí)慣,難適應(yīng)不同駕駛/乘坐需求,從而降低人們對(duì)駕駛系統(tǒng)的接受度。而通過學(xué)習(xí)人類智慧來解決問題是自動(dòng)駕駛發(fā)展的一種可行思路,原有的L1~L4級(jí)自動(dòng)駕駛系統(tǒng)并未完全實(shí)現(xiàn)學(xué)習(xí)人類的思維方式,而通過真正解析人類的決策機(jī)制才能更好支撐L5 級(jí)的發(fā)展。但對(duì)人類駕駛?cè)说臎Q策機(jī)制的學(xué)習(xí)是有難度的,如何解析駕駛?cè)说臎Q策機(jī)制,如何進(jìn)行決策層次的邏輯判斷仍需要進(jìn)一步探討。尤其是在前端給出環(huán)境感知的各種要素的統(tǒng)一表達(dá)后,如何準(zhǔn)確、細(xì)致地反映駕駛?cè)说臎Q策機(jī)制,實(shí)現(xiàn)擬人化決策策略對(duì)L5級(jí)自動(dòng)駕駛汽車發(fā)展十分關(guān)鍵。

除了技術(shù)和機(jī)理方面的難題,現(xiàn)有研究思路仍需深入探討。目前,自動(dòng)駕駛的層化結(jié)構(gòu)能夠有效保證駕駛過程中的各項(xiàng)任務(wù)(感知-認(rèn)知-評(píng)估-決策-控制)被獨(dú)立完成,且單任務(wù)的完成情況可以被準(zhǔn)確評(píng)估。在技術(shù)攻堅(jiān)階段,這種模塊化分層化的任務(wù)結(jié)構(gòu)是實(shí)現(xiàn)完備功能的必然要求。但是,模塊化分層化的設(shè)計(jì)結(jié)構(gòu),導(dǎo)致自動(dòng)駕駛系統(tǒng)的自我修正僅存在于單一模塊中。例如,先進(jìn)的決策模塊雖已具備一定的自調(diào)整能力,但也僅能考慮如何在駕駛過程中進(jìn)行自優(yōu)化和自適應(yīng),卻無法有效評(píng)估和影響系統(tǒng)中其他模塊。目前的決策模塊設(shè)計(jì)過程,通常將感知所提供的輸入和控制所需要的輸出,作為已有且固定不變的條件,模塊之間是剛性橋接的。這意味著決策模塊不能滿足與其他模塊協(xié)同修正的要求,難以將自身的修正過程和結(jié)果反饋給其他模塊。

而模塊間反饋機(jī)制的缺失導(dǎo)致自動(dòng)駕駛系統(tǒng)缺乏模塊間的協(xié)同成長能力,即系統(tǒng)性的自我修正能力。并且,單一模塊的成長對(duì)于整體系統(tǒng)的影響是不可測(cè)的,甚至不一定是有益的。一個(gè)具有單模塊成長能力的自動(dòng)駕駛系統(tǒng),在自學(xué)習(xí)過程中甚至有可能由于各個(gè)模塊的獨(dú)立學(xué)習(xí)而喪失系統(tǒng)的整體協(xié)調(diào)性。

4.L5級(jí)自動(dòng)駕駛的實(shí)現(xiàn)思路

自動(dòng)駕駛系統(tǒng)是一個(gè)搭載了大量的硬件結(jié)構(gòu)和軟件算法的集成框架[28]。在傳統(tǒng)功能分層疊加框架中,不同功能所對(duì)應(yīng)的物理結(jié)構(gòu)對(duì)應(yīng)于不同的子系統(tǒng)。通過集成框架在實(shí)際應(yīng)用中所需處理的問題來調(diào)用各部分結(jié)構(gòu)及其對(duì)應(yīng)功能,通過信息傳輸、能量運(yùn)送來控制物理結(jié)構(gòu)本體,實(shí)現(xiàn)不同智能化程度的系統(tǒng)功能。但現(xiàn)有分層設(shè)計(jì)的框架所帶來的系列挑戰(zhàn),迫切期望能從系統(tǒng)論的角度為高等級(jí)自動(dòng)駕駛系統(tǒng)的研發(fā)提供全新思路。要實(shí)現(xiàn)這一點(diǎn),我們需要思考以下問題:怎樣真正解析人類駕駛?cè)说鸟{駛行為,探明駕駛?cè)说臎Q策操控機(jī)制,讓自動(dòng)駕駛系統(tǒng)具備自主學(xué)習(xí)、自主探索的能力?怎樣讓自動(dòng)駕駛汽車獲取學(xué)習(xí)人、模擬人、超越人的決策智慧?怎樣將意識(shí)和功能融入自動(dòng)駕駛系統(tǒng),輸出更智能更合理的駕駛行為?

這些問題將使研究人員難以離散化理解自動(dòng)駕駛系統(tǒng)的各個(gè)功能,不再分解系統(tǒng)對(duì)應(yīng)的功能以及功能對(duì)應(yīng)的部件,而是從整車系統(tǒng)功能出發(fā),分析各系統(tǒng)、部件以及部件子結(jié)構(gòu)中的共性原理與共性結(jié)構(gòu),運(yùn)用大腦/意識(shí)理論,如結(jié)合全局工作空間理論(GWT)[29]和綜合信息理論(IIT)[30]來設(shè)計(jì)和優(yōu)化統(tǒng)一的系統(tǒng)結(jié)構(gòu)。如圖1 所示,自動(dòng)駕駛系統(tǒng)功能可以描述為系統(tǒng)對(duì)環(huán)境的一種整體屬性,是系統(tǒng)在一定環(huán)境中所能發(fā)揮出的作用和能力,是系統(tǒng)的外部聯(lián)系,構(gòu)成了系統(tǒng)與環(huán)境的關(guān)系集;在系統(tǒng)動(dòng)態(tài)運(yùn)轉(zhuǎn)中實(shí)現(xiàn),表現(xiàn)為物質(zhì)流、能量流、信息流的輸入和輸出;遵循系統(tǒng)化的思維模式,有可能為高等級(jí)自動(dòng)駕駛汽車,尤其是L5 級(jí)別的汽車發(fā)展提供更好的解決途徑。同時(shí),高等級(jí)自動(dòng)駕駛汽車研究應(yīng)該有“學(xué)習(xí)人、模擬人、超越人、服務(wù)人”的思想,最終目的是以人為中心,服務(wù)于人。因此,以系統(tǒng)化思維并始終以人為中心,在車路協(xié)同、云端控制的外在環(huán)境下,更能促進(jìn)高等級(jí)自動(dòng)駕駛汽車的發(fā)展。

然而,目前針對(duì)高等級(jí)自動(dòng)駕駛汽車的發(fā)展路徑,主要是從自動(dòng)駕駛車的應(yīng)用場(chǎng)景及針對(duì)不同駕駛?cè)蝿?wù)需求兩方面進(jìn)行研發(fā),但場(chǎng)景驅(qū)動(dòng)和任務(wù)驅(qū)動(dòng)的方式最終因分層框架的功能不斷疊加而帶來決策沖突、功能冗余等問題;因此在這種思路下研發(fā)的自動(dòng)駕駛汽車,將難以突破有操縱運(yùn)行域限定的L4級(jí)自動(dòng)駕駛汽車,以致在實(shí)現(xiàn)L5級(jí)自動(dòng)駕駛車過程中面臨挑戰(zhàn)。鑒于此,本文將拋開已有框架的限制,將自動(dòng)駕駛汽車視為一個(gè)整體,以“類人”的系統(tǒng)角度,建立一個(gè)基于混合智能的統(tǒng)一通用框架。首先構(gòu)建開放的類腦系統(tǒng),然后將可能影響交通安全的各要素以統(tǒng)一的態(tài)勢(shì)感知進(jìn)行輸入,最終輸出實(shí)時(shí)的決策控制,以期為實(shí)現(xiàn)L5級(jí)自動(dòng)駕駛系統(tǒng)提供可行思路。

4.1.“大腦-小腦-器官”協(xié)調(diào)平衡框架

“大腦-小腦-器官”協(xié)調(diào)平衡框架從系統(tǒng)層次開發(fā)自動(dòng)駕駛大腦作為系統(tǒng)層,將感知、評(píng)估、決策、控制等技術(shù)作為功能層。其中,決策對(duì)應(yīng)小腦,感知對(duì)應(yīng)眼睛,控制對(duì)應(yīng)手腳。在人腦的調(diào)配下,通過自動(dòng)駕駛汽車的感知技術(shù)篩選興趣區(qū)域,有選擇有目的地進(jìn)行感知;通過自動(dòng)駕駛汽車的評(píng)估技術(shù)實(shí)時(shí)量化風(fēng)險(xiǎn),保障安全出行;通過自動(dòng)駕駛汽車的決策技術(shù)綜合優(yōu)化決策,平衡各項(xiàng)功能;通過自動(dòng)駕駛汽車的控制技術(shù)穩(wěn)態(tài)操控執(zhí)行,實(shí)現(xiàn)可靠駕駛。而現(xiàn)有的分層框架和端到端框架所對(duì)應(yīng)的基于場(chǎng)景驅(qū)動(dòng)的研發(fā)思路是一種“反饋傳輸”結(jié)構(gòu),而自動(dòng)駕駛大腦對(duì)各部分結(jié)構(gòu)不僅僅是單獨(dú)的刺激-反應(yīng)雙向反饋,而是包含意向擴(kuò)散的復(fù)雜結(jié)構(gòu)網(wǎng)絡(luò)。如圖2所示,在自動(dòng)駕駛“大腦-小腦-器官”協(xié)調(diào)平衡框架中,通過感知器官感知外界環(huán)境來刺激大腦,同時(shí)轉(zhuǎn)錄為歷史大數(shù)據(jù)儲(chǔ)存到大腦中進(jìn)行記憶。而小腦基于最小作用量原理,通過調(diào)用內(nèi)部狀態(tài)來完成思考與協(xié)調(diào)的功能,最后大腦和小腦一起輸出激活狀態(tài),通過手腳控制器官完成控制過程。

圖1.系統(tǒng)整體流程圖。現(xiàn)有的場(chǎng)景驅(qū)動(dòng)和任務(wù)驅(qū)動(dòng)的方法將很難突破運(yùn)行設(shè)計(jì)域限制的L4級(jí)自動(dòng)駕駛汽車,因此實(shí)現(xiàn)L5級(jí)自動(dòng)駕駛汽車將具有挑戰(zhàn)性。因此,我們將自動(dòng)駕駛汽車視為一個(gè)整體系統(tǒng),從“類人”角度建立了基于混合智能的統(tǒng)一通用框架。LKA:車道保持輔助;ACC:自適應(yīng)巡航控制;AEB:自動(dòng)緊急制動(dòng)。

圖2.“大腦-小腦-器官”協(xié)調(diào)平衡框架。在這個(gè)框架下,外部狀態(tài)刺激大腦,存儲(chǔ)交通信息,小腦調(diào)用內(nèi)部狀態(tài)完成思考,最后大腦和小腦輸出激活狀態(tài),反饋完成控制。

如圖3所示,我們可以假設(shè)自動(dòng)駕駛的訓(xùn)練過程和一個(gè)拳擊手的訓(xùn)練過程具有相似性。其中,自動(dòng)駕駛對(duì)應(yīng)的感知技術(shù)可以讓拳擊手輸入外界信息,感知到潛在風(fēng)險(xiǎn);控制技術(shù)可以訓(xùn)練拳擊手進(jìn)行運(yùn)動(dòng)控制,鍛煉肌肉;決策技術(shù)對(duì)應(yīng)拳擊手的小腦,對(duì)各項(xiàng)技能的協(xié)調(diào)起到平衡作用。但是僅僅依靠小腦、五官及手腳并不能使得拳擊手真正實(shí)現(xiàn)一個(gè)高水平拳擊手所具有的技能和素養(yǎng),各項(xiàng)技術(shù)只是訓(xùn)練了他的小腦和各項(xiàng)體能水平,而沒有訓(xùn)練到大腦,使其具備自如靈活的攻擊性能和保護(hù)性能等。因此,自動(dòng)駕駛要實(shí)現(xiàn)“自學(xué)習(xí)、自適應(yīng)、自超越”特性的核心是構(gòu)建完備的自動(dòng)駕駛大腦。

大腦的主要功能是調(diào)配各項(xiàng)技能,包括探索、學(xué)習(xí)、思考、主導(dǎo)機(jī)體內(nèi)一切活動(dòng)過程,以及調(diào)節(jié)機(jī)體與周圍環(huán)境的平衡的功能。當(dāng)自動(dòng)駕駛系統(tǒng)具備了運(yùn)動(dòng)控制和感知系統(tǒng)后,其所缺乏的是自動(dòng)駕駛系統(tǒng)的控制和信息處理中樞。如果把上層系統(tǒng)定義為自動(dòng)駕駛的大腦,那么運(yùn)動(dòng)控制和感知系統(tǒng)則對(duì)應(yīng)于自動(dòng)駕駛的小腦和相應(yīng)器官。只有大腦、小腦和各自器官系統(tǒng)得到發(fā)展,自動(dòng)駕駛系統(tǒng)才能更好地服務(wù)人類。同時(shí),為了實(shí)現(xiàn)符合現(xiàn)實(shí)社會(huì)期望的駕駛功能,自動(dòng)駕駛系統(tǒng)必須盡可能表現(xiàn)得像人類,這需要對(duì)人類行為以及群體的社會(huì)期望有內(nèi)在的理解。在現(xiàn)有框架下繼續(xù)發(fā)展的終極目標(biāo)很難突破“場(chǎng)景的泛化性、多風(fēng)險(xiǎn)的因素融合、求解目標(biāo)的耦合”等瓶頸,因此無法完全了解人類做決策時(shí)的生理與心理機(jī)制。而自動(dòng)駕駛大腦可以從內(nèi)至外地模擬和學(xué)習(xí)人類,能夠?qū)崿F(xiàn)在特定環(huán)境下,通過組織系統(tǒng)充分運(yùn)用人類的各種認(rèn)知活動(dòng)完成指定任務(wù)。同時(shí),由于存在自我意識(shí),大腦通常在不確定情況下,具有自我探索、主動(dòng)解決問題的能力。例如,在駕駛過程中,自動(dòng)駕駛系統(tǒng)大腦可以快速采取有效措施,應(yīng)對(duì)周圍其他障礙物的隨意停放或其他不遵守交通規(guī)則的行為,如不遵循交通規(guī)則的切入、超車、換道等行為。

圖3.駕駛?cè)撕妥詣?dòng)駕駛汽車之間的對(duì)應(yīng)關(guān)系。自動(dòng)駕駛汽車需要具備駕駛?cè)说囊恍┗炯寄埽?duì)人類行為及其社會(huì)期望有內(nèi)在理解。即一個(gè)駕駛?cè)说囊庀蛐裕瑢?duì)應(yīng)一個(gè)自動(dòng)駕駛汽車的智能數(shù)字化。

事實(shí)上,這些行為模式在世界許多地方都非常普遍。例如,車輛需要應(yīng)對(duì)強(qiáng)交互場(chǎng)景,如高速公路多車匯入和無保護(hù)左轉(zhuǎn),這對(duì)駕駛?cè)藖碚f也是一個(gè)挑戰(zhàn)。在很長一段時(shí)間里,自動(dòng)駕駛汽車與駕駛?cè)藭?huì)在同一行車環(huán)境中行駛,因此自動(dòng)駕駛汽車必須理解駕駛?cè)说囊鈭D,并以可預(yù)測(cè)和可解釋的方式做出反應(yīng)。雖然在空曠的道路上左轉(zhuǎn)對(duì)于自動(dòng)駕駛汽車來說可能是簡單可行的,但在復(fù)雜交通環(huán)境下仍然很困難。對(duì)于駕駛?cè)藖碚f,這些不受保護(hù)的左轉(zhuǎn)經(jīng)常發(fā)生在一個(gè)正在行駛的駕駛?cè)藴p速讓出的時(shí)候,這暗示了另一個(gè)駕駛?cè)丝梢园踩D(zhuǎn)彎。而這對(duì)于目前開發(fā)的自動(dòng)駕駛系統(tǒng)來說是極大的挑戰(zhàn)。因此,基于場(chǎng)景驅(qū)動(dòng)的研究思路在針對(duì)以上挑戰(zhàn)時(shí)應(yīng)用受限,未能突破局限性達(dá)到真正的高等級(jí)智能化。而智能可以闡述為一種表現(xiàn)在個(gè)體與自然、社會(huì)群體之間的相互作用和行為過程中的一種現(xiàn)象。因此從系統(tǒng)科學(xué)的思路出發(fā),用系統(tǒng)觀點(diǎn)來認(rèn)識(shí)駕駛的本質(zhì),從而達(dá)到通用智能化。

4.2.“烏鴉推理+鸚鵡學(xué)舌”研究范式

錢學(xué)森[31]說:“人體作為一個(gè)系統(tǒng),首先,它是一個(gè)開放的系統(tǒng),也就是說,這個(gè)系統(tǒng)與外界是有交往的。比如,通過呼吸、飲食、排泄等,進(jìn)行物質(zhì)交往;通過視覺、聽覺、味覺、嗅覺、觸覺等進(jìn)行信息交往。此外,人體是由億萬個(gè)分子組成的,所以它不是一個(gè)小系統(tǒng),也不是一個(gè)大系統(tǒng),而是比大系統(tǒng)還大的巨系統(tǒng)。這個(gè)巨系統(tǒng)的組成部分又是各不相同的,它們之間的相互作用也是異常復(fù)雜的。所以是復(fù)雜的巨系統(tǒng)?!币虼耍谧詣?dòng)駕駛系統(tǒng)研發(fā)過程中,也需要提煉自動(dòng)駕駛系統(tǒng)中存在的問題,用系統(tǒng)的方式進(jìn)行研發(fā)。

事實(shí)上,隨著一個(gè)系統(tǒng)開放程度的提高,其處理高復(fù)雜性的能力以及適應(yīng)不斷變化的環(huán)境的能力也在提高。加利福尼亞大學(xué)洛杉磯分校的朱松純教授介紹了兩種人工智能的模式[32]。一種稱之為“鸚鵡范式”,認(rèn)為鸚鵡可以和人類說話,但不理解他們說的話。例如,當(dāng)你說“你好”時(shí),它會(huì)回答“你好”,但它不知道這是什么意思。還有一種是“烏鴉范式”。比如烏鴉知道不斷往水瓶里扔石頭,以提高水位來喝水。鸚鵡式模仿學(xué)習(xí)范式和烏鴉式推理學(xué)習(xí)范式之間存在顯著差異。對(duì)于鸚鵡來說,它是一種簡單粗暴的模仿學(xué)習(xí),這種方式可以機(jī)械地實(shí)現(xiàn)“類人”行為,而不理解學(xué)習(xí)背后的深層原因。而烏鴉能自主研究因果關(guān)系并推斷解決方案,從而完成任務(wù)。烏鴉依靠自己的觀察、感知、認(rèn)知、學(xué)習(xí)、推理和執(zhí)行,過著完全獨(dú)立的生活。所以可以理解為烏鴉有獨(dú)立學(xué)習(xí)和探索未知的能力。相應(yīng)地,自動(dòng)駕駛系統(tǒng)在邁向高等級(jí)發(fā)展過程中,智能可以被認(rèn)為是一種現(xiàn)象,它反映在個(gè)人和社會(huì)群體的行為過程中。自動(dòng)駕駛汽車的智能化水平的提高取決于客觀現(xiàn)實(shí)和物理環(huán)境的因果鏈。比如,外部物理環(huán)境為烏鴉提供了生存邊界條件。在不同的環(huán)境條件下,智能的形式有所不同。任何智能機(jī)器都需要理解物理世界及其因果鏈,并適應(yīng)世界。同時(shí),自動(dòng)駕駛汽車的智能可以滿足它們需要完成的特定任務(wù)。而任務(wù)代表價(jià)值和決策功能,是生物進(jìn)化的剛性需求。智能不僅體現(xiàn)適應(yīng)性(如只存在刺激和反應(yīng)而沒有預(yù)測(cè)和推斷),還適合局限于運(yùn)行設(shè)計(jì)域下的低等級(jí)自動(dòng)駕駛汽車。對(duì)于高等級(jí)自動(dòng)駕駛汽車,不適應(yīng)性在某種程度上更為重要,例如,它可以推理、進(jìn)化和超越人類自身的局限性。高等級(jí)自動(dòng)駕駛汽車可以創(chuàng)造一種新的可能性來適應(yīng)互動(dòng),實(shí)現(xiàn)超越。因此,在開發(fā)高等級(jí)自動(dòng)駕駛系統(tǒng)時(shí),尤其是L5 級(jí)自動(dòng)駕駛過程,需要有效結(jié)合烏鴉和鸚鵡的兩種不同的學(xué)習(xí)思維模式,提出第三種混合型范式,即“烏鴉推理+鸚鵡學(xué)舌”研究范式。根據(jù)前述對(duì)智能的理解,真正的智能體現(xiàn)的不僅僅是適應(yīng)性,更重要的是不適應(yīng)性,進(jìn)而以一種新的可能性實(shí)現(xiàn)從自適應(yīng)到他交互再到自超越的最終目標(biāo),并最終創(chuàng)造出一系列新的可能性——自由、改變、交互。圖靈機(jī)的缺點(diǎn)是只有刺激-反應(yīng)雙向反饋而沒有選擇機(jī)制,只有順應(yīng)而沒有同化機(jī)制,其與鸚鵡范式近似。而人類自身的演變機(jī)制對(duì)應(yīng)“烏鴉推理”范式,能夠自主推理、演化,但要真正實(shí)現(xiàn)超越人類本身的局限性,提高智能系統(tǒng)的算力,融入智能化的優(yōu)勢(shì),還需要結(jié)合兩種范式,如圖4 所示。因此,這種“烏鴉+鸚鵡”混合范式才是高等級(jí)自動(dòng)駕駛尤其是L5級(jí)自動(dòng)駕駛汽車發(fā)展的未來趨勢(shì)。

圖4.“烏鴉推理+鸚鵡學(xué)舌”研究框架?!胞W鵡學(xué)舌”可以通過數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)方法實(shí)現(xiàn)適應(yīng)性,而“烏鴉推理”則體現(xiàn)對(duì)交通環(huán)境的不適應(yīng)。通過兩者結(jié)合,自動(dòng)駕駛汽車可隨環(huán)境的變化而實(shí)現(xiàn)交互和進(jìn)化。

5.L5級(jí)自動(dòng)駕駛可行途徑

5.1.大腦系統(tǒng)開放演化

假設(shè)所考慮的大腦系統(tǒng)是開放演化的?!盀貘f+鸚鵡”混合范式具備開放性、發(fā)散性,能夠進(jìn)行自主演化,突破已有技術(shù)和思維的局限性。傳統(tǒng)架構(gòu)中,分層次來解決各項(xiàng)功能;而大腦系統(tǒng)的開發(fā)需要在已有的知識(shí)經(jīng)驗(yàn)基礎(chǔ)上借助人工智能這一工具進(jìn)行自主學(xué)習(xí),探索未知[2]?!白灾鲗W(xué)習(xí)+先驗(yàn)知識(shí)”的開發(fā)模式能夠讓大腦在基于大量共性決策機(jī)制和操控規(guī)律時(shí),不斷探索個(gè)性化駕駛/乘坐需求,真正實(shí)現(xiàn)“自學(xué)習(xí)、自適應(yīng)、自超越”的目標(biāo)。

現(xiàn)有針對(duì)自動(dòng)駕駛汽車發(fā)展所采取的措施主要有兩種思路:①自主學(xué)習(xí)法[24,33];②邏輯判斷法(先驗(yàn)知識(shí))[24]。前者包括深度神經(jīng)網(wǎng)絡(luò)(DNN),在自動(dòng)駕駛方面已取得了顯著成果。但是,當(dāng)將DNN 應(yīng)用于諸如預(yù)測(cè)和決策的行為生成之類的安全關(guān)鍵模塊時(shí),DNN 缺乏可解釋性和因果關(guān)系,并且很難合并領(lǐng)域知識(shí)。另外,建立一個(gè)精確的DNN 需要大量的相關(guān)數(shù)據(jù)進(jìn)行訓(xùn)練,而且對(duì)于不熟悉的場(chǎng)景,尤其在極端情況下也無法很好地推廣。而生成概率和邏輯模型具有解釋性,能夠通過邏輯判斷闡明因果關(guān)系,并具備不確定性建模能力。但是,這些固有邏輯模型的可遷移性低,且對(duì)復(fù)雜場(chǎng)景的表示能力相對(duì)較低。因此,本文提出一個(gè)結(jié)合學(xué)習(xí)類方法和生成概率模型及邏輯模型優(yōu)勢(shì)的混合框架,以生成可解釋且數(shù)據(jù)高效的行為。在此框架中,我們提出了一種“自主學(xué)習(xí)+先驗(yàn)知識(shí)”的開發(fā)模式,如圖5所示,通過使用從生成概率模型和觀測(cè)值獲得的動(dòng)態(tài)世界的低維表示來生成用于高級(jí)判斷的駕駛行為控制層。這樣,大腦系統(tǒng)能夠?qū)⑷四X儲(chǔ)存的先驗(yàn)知識(shí)遷移,并在自學(xué)習(xí)的框架下探索未知,從而構(gòu)建更復(fù)雜更高層級(jí)的知識(shí)推理。

5.2.態(tài)勢(shì)感知統(tǒng)一輸入

假設(shè)態(tài)勢(shì)感知是狀態(tài)-趨勢(shì)-感覺-認(rèn)知的統(tǒng)一輸入。統(tǒng)一的安全場(chǎng)思路[34]能夠有效解決復(fù)雜環(huán)境下的綜合態(tài)勢(shì)感知和風(fēng)險(xiǎn)評(píng)估,實(shí)現(xiàn)時(shí)間和空間之間多域融合的多維尺度下的統(tǒng)一視角評(píng)估功能。智能車輛行駛過程將受到人-車-路三方面中多種因素的綜合影響。由于道路交通復(fù)雜,路況多變;駕駛?cè)藛T性格各異,行為不定;車輛系統(tǒng)復(fù)雜,性能耦合,使得行駛過程存在潛在風(fēng)險(xiǎn),其安全態(tài)勢(shì)具有時(shí)變、復(fù)雜和耦合的特性。

在圖6所示的方案中,將態(tài)勢(shì)感知中的“態(tài)”定義為駕駛?cè)?道路-環(huán)境系統(tǒng)中的各類表征個(gè)體狀態(tài)的主客觀數(shù)據(jù);“勢(shì)”定義為事件的發(fā)展趨勢(shì);“感”定義為對(duì)系統(tǒng)中“態(tài)”的覺察;“知”定義為對(duì)“勢(shì)”的理解。深度態(tài)勢(shì)感知理論模型在不同情境下處理信息的方式會(huì)有所區(qū)別,并且以往關(guān)于態(tài)勢(shì)感知的研究都充分說明了態(tài)勢(shì)感知具有實(shí)時(shí)性,即態(tài)勢(shì)感知會(huì)隨時(shí)間而不停地更新、迭代。通常行駛過程中的安全態(tài)勢(shì)評(píng)估/感知技術(shù)主要可以從宏觀交通管理視角和微觀車輛行駛視角出發(fā)[35]。然而,前者屬于依賴海量歷史事故數(shù)據(jù)的事后評(píng)估,難以及時(shí)評(píng)價(jià)行車過程中的當(dāng)前風(fēng)險(xiǎn),難以刻畫當(dāng)前行車安全水平,無法體現(xiàn)實(shí)時(shí)性;后者考慮的風(fēng)險(xiǎn)因素不全面,適用場(chǎng)景單一,難以適用于復(fù)雜多變的交通環(huán)境,對(duì)環(huán)境中人-車-路三要素間相互影響的耦合機(jī)理研究得不夠透徹,致使其在實(shí)際應(yīng)用中常顯示出局限性[36]。因此,現(xiàn)有針對(duì)態(tài)勢(shì)感知的研究思路還存在一定局限性,本文從統(tǒng)一的角度出發(fā),對(duì)人-車-路各要素之間的關(guān)系進(jìn)行耦合分析。

針對(duì)安全態(tài)勢(shì)的時(shí)變、復(fù)雜、耦合特性,借鑒場(chǎng)論探索行車過程的物理機(jī)制,構(gòu)建了行車安全場(chǎng)的具體模型。通過分別量化考慮車輛本身、道路交通設(shè)施、駕駛?cè)诵袨楹偷缆翻h(huán)境中各因素的行車風(fēng)險(xiǎn),確定了影響行車風(fēng)險(xiǎn)分布的內(nèi)因在于風(fēng)險(xiǎn)源本身的變化和風(fēng)險(xiǎn)梯度的變化。因此,本文可以用統(tǒng)一場(chǎng)的模型來對(duì)人-車-路綜合風(fēng)險(xiǎn)進(jìn)行量化評(píng)估,進(jìn)而有效解決現(xiàn)有方法難以實(shí)現(xiàn)綜合多因素的實(shí)時(shí)行車風(fēng)險(xiǎn)建模的難題。

圖5.結(jié)合基于規(guī)則和基于學(xué)習(xí)方法的統(tǒng)一自動(dòng)駕駛汽車框架。高等級(jí)自動(dòng)駕駛汽車應(yīng)從分層框架轉(zhuǎn)移到統(tǒng)一框架。

圖6.狀態(tài)-趨勢(shì)-感覺-認(rèn)知統(tǒng)一輸入框架。在人-車-路系統(tǒng)中,綜合考慮多種因素的統(tǒng)一輸入,通過狀態(tài)-趨勢(shì)-感覺-認(rèn)知4個(gè)步驟,可以實(shí)現(xiàn)綜合態(tài)勢(shì)感知和風(fēng)險(xiǎn)評(píng)估。ER指交通場(chǎng)景中靜止或固有的交通參與者帶來的潛在風(fēng)險(xiǎn),如道路條件帶來的風(fēng)險(xiǎn)約束;ED代表不同駕駛?cè)烁兄?認(rèn)知偏差的潛在風(fēng)險(xiǎn);EV代表交通參與者隨時(shí)間和空間動(dòng)態(tài)變化的演化風(fēng)險(xiǎn)。

5.3.決策控制最優(yōu)輸出

假設(shè)實(shí)時(shí)決策和控制模塊的輸出追求最優(yōu)結(jié)果。在綜合交通環(huán)境中,由于駕駛場(chǎng)景的復(fù)雜多變、交通參與者行為的難以預(yù)測(cè)以及人們對(duì)于行車安全性、高效性和舒適性要求的提高,對(duì)于整個(gè)動(dòng)態(tài)復(fù)雜過程,自動(dòng)駕駛汽車的智能決策系統(tǒng)相當(dāng)于人類駕駛?cè)说男∧X。其能協(xié)同平衡各項(xiàng)操縱的控制終端,使得駕駛?cè)藢⑿旭偮窂椒纸鉃榉较虮P、油門、剎車踏板的操作,從而執(zhí)行規(guī)劃目標(biāo)。本文基于駕駛?cè)嗽诰C合交通場(chǎng)景下的行為決策過程,抽取行駛過程中駕駛?cè)岁P(guān)注的相關(guān)屬性,分析駕駛?cè)嗽诓倏v過程中追求的主要目標(biāo)。通過判斷、評(píng)價(jià)并獲取駕駛?cè)说闹饕{駛行為模式,使得自動(dòng)駕駛汽車的行為決策過程符合人類駕駛?cè)说乃季S過程[2]。通過建立一種基于模擬駕駛?cè)笋{駛行為的自動(dòng)駕駛汽車路徑規(guī)劃模型,使得實(shí)時(shí)規(guī)劃符合駕駛期望的軌跡,能夠有效探索單車個(gè)體和多車系統(tǒng)的最優(yōu)路徑。

如圖7所示,通過統(tǒng)計(jì)自然駕駛數(shù)據(jù)中駕駛過程的關(guān)鍵參數(shù),分析發(fā)現(xiàn)車輛行駛過程中反映駕駛?cè)藳Q策行為的主要運(yùn)動(dòng)特征參數(shù)存在極值現(xiàn)象。產(chǎn)生極值現(xiàn)象的內(nèi)在動(dòng)因是駕駛?cè)俗裱摆吚芎Α钡幕緵Q策機(jī)制,即駕駛過程中駕駛?cè)肆D實(shí)現(xiàn)機(jī)動(dòng)性和安全性之間的最優(yōu)效果。受自然界包括物理和生物行為上的眾多極值現(xiàn)象遵循最小作用量原理的啟發(fā),有研究人員提出駕駛?cè)藳Q策機(jī)制遵循最小作用量原理的假設(shè)[37]。本文嘗試將自然界中力學(xué)系統(tǒng)的物理特性與交通系統(tǒng)的固有屬性聯(lián)系,將自然界“尋優(yōu)”目的與駕駛?cè)恕摆吚芎Α钡奶匦越Y(jié)合,從而提出基于最小作用量的決策控制算法[38]。即在選擇最優(yōu)軌跡時(shí),本文通過采用讓自動(dòng)駕駛汽車模擬駕駛?cè)说臎Q策規(guī)劃方式,總結(jié)駕駛?cè)瞬倏v特性,提出基于最小作用量原理的目標(biāo)函數(shù)[39]。該目標(biāo)函數(shù)綜合考慮安全和高效等駕駛期望,通過計(jì)算每條可行軌跡的作用量來對(duì)路徑進(jìn)行篩選,從而選擇具有最小作用量的路徑并對(duì)其進(jìn)行速度優(yōu)化。

現(xiàn)有關(guān)于駕駛?cè)藳Q策的研究難以滿足智能汽車技術(shù)的發(fā)展需求。傳統(tǒng)研究通常是針對(duì)特定場(chǎng)景與單一交通環(huán)境的駕駛?cè)诵袨榈慕7椒ǎ荒苋娣从绸{駛?cè)嗽谡鎸?shí)交通環(huán)境中的決策能力和準(zhǔn)確量化駕駛?cè)说臎Q策行為[40],更難為開發(fā)高等級(jí)智能汽車的擬人化駕駛算法提供指導(dǎo)依據(jù)。針對(duì)現(xiàn)有方法的局限性,本文中的方法將駕駛?cè)诵熊囘^程中“趨利避害”的駕駛特性融入自動(dòng)駕駛汽車的決策層,運(yùn)用駕駛?cè)瞬倏v思維來控制底端,完成駕駛?cè)蝿?wù)。算法綜合考慮客觀環(huán)境和周邊障礙物(動(dòng)態(tài)、靜態(tài)),并不局限于單一場(chǎng)景或靜態(tài)障礙物,適用面更廣。

5.4.L5級(jí)自動(dòng)駕駛實(shí)現(xiàn)的可行思路

高等級(jí)的自動(dòng)駕駛汽車作為一個(gè)獨(dú)立且需要與外界進(jìn)行信息交互的智能體,需要在遵從人類預(yù)期的運(yùn)行規(guī)律的同時(shí),能夠超越人類的局限性,并且具備“意識(shí)”和“智能”兩方面的能力。其中,“意識(shí)”是指智能體感知并理解事物的能力,“智能”是指智能體推斷并解決問題的能力。如圖8所示,高等級(jí)的自動(dòng)駕駛汽車通常被期望具有強(qiáng)大的環(huán)境感知能力,如人的眼睛一樣,因此,感知-評(píng)估模塊對(duì)人-車-路系統(tǒng)進(jìn)行動(dòng)態(tài)信息感知,為大腦中樞提供感官信息輸入。同時(shí),期望智能車輛能夠準(zhǔn)確地預(yù)測(cè)周圍道路參與者的行為和適應(yīng)周邊環(huán)境的動(dòng)態(tài)變化,而車輛決策系統(tǒng)作為車輛的核心控制單元,需要像人體的小腦一樣具備協(xié)調(diào)平衡的能力。決策系統(tǒng)提供了一個(gè)離散交通參與者、約束、動(dòng)態(tài)演化趨勢(shì)和大腦控制中心輸入的動(dòng)態(tài)平衡。高等級(jí)自動(dòng)駕駛汽車作為在外部交通環(huán)境中能夠與信息進(jìn)行交互的獨(dú)立智能體,需要具備超越人類局限的能力,同時(shí)遵守預(yù)期的運(yùn)行規(guī)則,具備意識(shí)和智能的能力。因此,自動(dòng)駕駛汽車需要基于自主學(xué)習(xí)和先驗(yàn)知識(shí)的發(fā)展模式。此外,自動(dòng)駕駛汽車可以運(yùn)用意識(shí)理論,如GWT和IIT,從系統(tǒng)的角度實(shí)現(xiàn)閉環(huán)互動(dòng)。這樣就可以通過手腳和大腦終端動(dòng)作的及時(shí)調(diào)整來實(shí)現(xiàn)車輛執(zhí)行?;凇盀貘f推理+鸚鵡學(xué)舌”的混合范式,閉環(huán)反饋中存在一個(gè)開環(huán)自進(jìn)化過程。

然而,現(xiàn)有的研究思路對(duì)于開發(fā)高等級(jí)自動(dòng)駕駛系統(tǒng)無疑是具有挑戰(zhàn)性的,在現(xiàn)有框架下,我們難以全面列出自動(dòng)駕駛汽車所面對(duì)的所有駕駛情況和可能的潛在危險(xiǎn),而高等級(jí)自動(dòng)駕駛汽車所要應(yīng)對(duì)的更高等級(jí)的復(fù)雜性和部分隱含的機(jī)動(dòng)駕駛?cè)蝿?wù),使得研究人員在研發(fā)高等級(jí)自動(dòng)駕駛汽車的每個(gè)階段都很難論證安全要求的完整性和正確性。因此要徹底測(cè)試系統(tǒng)以確保超級(jí)可靠的系統(tǒng)運(yùn)行是不可行的,而從系統(tǒng)角度進(jìn)行整體的開發(fā)對(duì)于高等級(jí)自動(dòng)駕駛汽車,尤其是L5級(jí)自動(dòng)駕駛汽車具有重要意義。

6.結(jié)論

提高自動(dòng)駕駛汽車的智能化水平引發(fā)人們極大的興趣。然而,對(duì)于如何實(shí)現(xiàn)高等級(jí)自動(dòng)駕駛汽車,基于任務(wù)或場(chǎng)景驅(qū)動(dòng)框架的可行解決方案,以及統(tǒng)一原則如何發(fā)揮作用等都還存在一定程度的困惑。本文試圖通過分析現(xiàn)有的高等級(jí)自動(dòng)駕駛的發(fā)展技術(shù),比較L4級(jí)和L5級(jí)之間的差異來解析現(xiàn)有挑戰(zhàn)。最后,提出邁向L5 級(jí)自動(dòng)駕駛汽車的統(tǒng)一原則和可行途徑。

圖7.擬人化的整體決策和控制框架。通過將交通環(huán)境中的離散信息輸入到最優(yōu)決策系統(tǒng)中,結(jié)合數(shù)據(jù)驅(qū)動(dòng)的駕駛?cè)诵袨槟J降妮斎?,可系統(tǒng)地輸出多目標(biāo)協(xié)同控制策略。Gi:虛擬吸引力;Ri:阻力;Fji:外力;θi:傾角;i:自動(dòng)駕駛汽車;j:外部交通參與者。

圖8.評(píng)估和獲取駕駛?cè)笋{駛行為模式的系統(tǒng)概述圖。高等級(jí)自動(dòng)駕駛汽車通過感知-認(rèn)知-評(píng)估模塊獲取復(fù)雜的交通環(huán)境信息,集成各種傳感器進(jìn)行信息融合,保證車輛環(huán)境感知系統(tǒng)的穩(wěn)定性。決策小腦協(xié)同平衡各種操控的控制終端,通過判斷、評(píng)估、獲取駕駛?cè)说鸟{駛行為模式,使行為決策過程符合駕駛?cè)说乃季S過程。大腦系統(tǒng)基于自主學(xué)習(xí)和先驗(yàn)知識(shí)的發(fā)展模式,最終通過其他子系統(tǒng)的控制實(shí)現(xiàn)開放進(jìn)化。

具體而言,本文將系統(tǒng)科學(xué)理論作為自動(dòng)駕駛系統(tǒng)開發(fā)的核心思想,將自動(dòng)駕駛汽車視為具有“自學(xué)習(xí)、自適應(yīng)、自超越”能力的智能生命體?;凇按竽X-小腦-器官”的協(xié)調(diào)平衡框架和基于“烏鴉推理+鸚鵡學(xué)舌”研究范式的混合模型,為發(fā)展高等級(jí)自動(dòng)駕駛汽車提供了新的視角。此外,提出了一種可行的類腦系統(tǒng)模塊開發(fā)方法,并將其視為結(jié)合自主學(xué)習(xí)和先驗(yàn)知識(shí)優(yōu)勢(shì)的混合框架,可以支持復(fù)雜環(huán)境下自動(dòng)駕駛系統(tǒng)實(shí)現(xiàn)完全自主駕駛。同時(shí),本文提出了一種可行的態(tài)勢(shì)感知模塊開發(fā)方法,即建立統(tǒng)一的安全場(chǎng),支持自動(dòng)駕駛汽車在多因素耦合條件下進(jìn)行準(zhǔn)確的風(fēng)險(xiǎn)評(píng)估。此外,基于最小動(dòng)作原理的決策與控制模塊可以為系統(tǒng)地開發(fā)L5 級(jí)自動(dòng)駕駛汽車提供一個(gè)全新的思路。

綜上所述,場(chǎng)景驅(qū)動(dòng)和任務(wù)驅(qū)動(dòng)的研究思路對(duì)于實(shí)現(xiàn)L5 級(jí)自動(dòng)駕駛系統(tǒng)是具有挑戰(zhàn)性的,但從系統(tǒng)的角度出發(fā),結(jié)合所提出的基本原則,能夠?yàn)殚_發(fā)高等級(jí)自主系統(tǒng)提供一種新的途徑。希望在這個(gè)研究范式的指導(dǎo)下,能突破現(xiàn)有技術(shù)的局限,實(shí)現(xiàn)高等級(jí)自動(dòng)駕駛。

致謝

感謝國家杰出青年科學(xué)基金(51625503)、國家自然科學(xué)基金重大項(xiàng)目(61790561),以及車聯(lián)網(wǎng)教育部-中國移動(dòng)聯(lián)合實(shí)驗(yàn)室聯(lián)合資助。

Compliance with ethics guidelines

Jianqiang Wang, Heye Huang, Keqiang Li, and Jun Li declare that they have no conflict of interest or financial conflicts to disclose.

猜你喜歡
框架決策自動(dòng)
框架
為可持續(xù)決策提供依據(jù)
自動(dòng)捕盜機(jī)
廣義框架的不相交性
決策為什么失誤了
讓小鴨子自動(dòng)轉(zhuǎn)身
自動(dòng)搖擺的“蹺蹺板”
關(guān)于自動(dòng)駕駛
關(guān)于原點(diǎn)對(duì)稱的不規(guī)則Gabor框架的構(gòu)造
一種基于OpenStack的云應(yīng)用開發(fā)框架
吉安市| 澄江县| 石屏县| 梧州市| 临清市| 兴城市| 阿克陶县| 承德县| 大足县| 壶关县| 惠来县| 陵水| 惠东县| 南充市| 雷波县| 屏山县| 威信县| 咸阳市| 朝阳县| 石家庄市| 都兰县| 澄城县| 安仁县| 榆树市| 兴仁县| 新邵县| 青田县| 民和| 昂仁县| 德钦县| 浦江县| 凉山| 晋宁县| 扎鲁特旗| 云浮市| 延川县| 交口县| 随州市| 沙坪坝区| 赫章县| 东方市|