石蕊 張輝 王霽宇 端帥
摘要 隨著信息技術(shù)及汽車(chē)產(chǎn)業(yè)的快速融合,促進(jìn)了自動(dòng)駕駛技術(shù)迅猛發(fā)展。目前,許多主流車(chē)企陸續(xù)加快L3及以上自動(dòng)駕駛功能產(chǎn)品的研發(fā)及試驗(yàn)進(jìn)程。而多數(shù)L3及以上級(jí)別智能汽車(chē)的設(shè)計(jì)運(yùn)行范圍中會(huì)聲明其具備自主超車(chē)及變道功能,因此對(duì)L3以上級(jí)別的換道行為進(jìn)行研究、提升自動(dòng)駕駛功能下?lián)Q道安全性就顯得十分重要。研究通過(guò)解析影響高速公路環(huán)境下自動(dòng)駕駛車(chē)輛主動(dòng)換道決策的多重信息,之后具體解析直接對(duì)換道行為產(chǎn)生影響的車(chē)輛間的博弈交互機(jī)理,建立了基于博弈論的自動(dòng)駕駛車(chē)高速公路換道行為的決策機(jī)制,將為自動(dòng)駕駛車(chē)換道行為仿真以及后續(xù)的自動(dòng)駕駛換道行為評(píng)價(jià)提供支撐。
關(guān)鍵詞 換道決策;博弈論;高速公路;自動(dòng)駕駛;主動(dòng)換道
中圖分類(lèi)號(hào) U463.6文獻(xiàn)標(biāo)識(shí)碼 A文章編號(hào) 2096-8949(2022)04-0004-04
0 引言
近年來(lái),我國(guó)鼓勵(lì)推動(dòng)汽車(chē)網(wǎng)聯(lián)化、智能化與電動(dòng)化協(xié)同發(fā)展,智能汽車(chē)呈現(xiàn)強(qiáng)勁發(fā)展勢(shì)頭。隨著關(guān)鍵技術(shù)的不斷突破,車(chē)載激光雷達(dá)等真值設(shè)備達(dá)到國(guó)際先進(jìn)水平,L2級(jí)別乘用車(chē)新車(chē)市場(chǎng)滲透率達(dá)到20%。截止2021年9月,我國(guó)已有3 500多千米的道路實(shí)現(xiàn)智能化升級(jí),搭載聯(lián)網(wǎng)終端車(chē)輛超過(guò)500萬(wàn)輛[1]。
然而自動(dòng)駕駛車(chē)的普及率及技術(shù)成熟度逐步提升的同時(shí)也給交通管理帶來(lái)了新的挑戰(zhàn),尤其是在未來(lái)混行環(huán)境下給交通安全帶來(lái)的挑戰(zhàn)。跟馳及換道作為車(chē)輛在路上行駛的兩種基本形態(tài),L3及以上級(jí)別的智能汽車(chē)能夠自動(dòng)化地完成這兩個(gè)形態(tài)。相比于跟馳狀態(tài),換道行為涉及與本車(chē)道及目標(biāo)車(chē)道車(chē)輛的復(fù)雜交互。智能汽車(chē)相較于完全手動(dòng)駕駛汽車(chē)具有感知時(shí)間更短、感知范圍更廣的優(yōu)勢(shì),可以進(jìn)行交互的信息也有不同,因此不能用傳統(tǒng)的換道理論來(lái)解釋自動(dòng)駕駛車(chē)的換道行為。
換道行為的自動(dòng)化作為自動(dòng)駕駛車(chē)輛行駛過(guò)程的關(guān)鍵環(huán)節(jié),對(duì)于指導(dǎo)自動(dòng)駕駛車(chē)輛的安全高效行駛有著重要意義。當(dāng)前對(duì)于自動(dòng)駕駛車(chē)輛在高速公路上的換道研究尚處于起步階段,相關(guān)的現(xiàn)有研究和基礎(chǔ)理論尚不夠完善,且研究中所述換道情境及驗(yàn)證中應(yīng)用的場(chǎng)景與實(shí)際的高速公路通行環(huán)境存在一定程度的差別。
當(dāng)前研究通常將換道全過(guò)程拆解為產(chǎn)生換道意圖、換道決策和換道執(zhí)行三個(gè)階段。最原始的換道決策模型是由Gipps提出的Gipps 換道模型[2]。Motohiro[3]等以換道車(chē)輛與周?chē)?chē)輛的速度差、間隙等為參數(shù),建立神經(jīng)網(wǎng)絡(luò)模型,利用大規(guī)模的軌跡數(shù)據(jù)進(jìn)行標(biāo)定,用于預(yù)測(cè)車(chē)輛的換道決策。Wang[4]等以駕駛安全性、舒適性和效率為多重目標(biāo),考慮了不同駕駛決策對(duì)周?chē)?chē)輛加速度的影響,從而對(duì)駕駛決策機(jī)制進(jìn)行優(yōu)化。近幾年來(lái),國(guó)內(nèi)外學(xué)者開(kāi)始嘗試基于博弈論思想解析車(chē)輛的換道行為。Kita[5]提出將博弈論中信息交互博弈的思想策略帶入換道決策中。Talebpour[6]提出混流環(huán)境下的換道行為是非合作博弈行為,并基于此建立換道模型。Be11[7]應(yīng)用博弈論理論對(duì)考慮高速公路交通流來(lái)研究車(chē)輛換道對(duì)交通流運(yùn)行的影響程度。
根據(jù)上述研究,可以看出博弈論為含有多重信息且具備競(jìng)爭(zhēng)傾向的問(wèn)題提供了解決方法和分析手段,適用于該研究期望的高速公路自動(dòng)駕駛車(chē)主動(dòng)換道的場(chǎng)景。因此,研究對(duì)高速通行環(huán)境下影響自動(dòng)駕駛車(chē)換道的多重交互信息進(jìn)行分析,界定博弈類(lèi)型建立換道決策機(jī)制并通過(guò)實(shí)際通行數(shù)據(jù)完成驗(yàn)證。
1 基于博弈論的自動(dòng)駕駛車(chē)輛換道策略機(jī)制建立
傳統(tǒng)交通流理論中根據(jù)車(chē)輛換道的動(dòng)機(jī)將車(chē)輛的換道行為劃分為自由換道和強(qiáng)制換道。該文主要研究自動(dòng)駕駛車(chē)的主觀自動(dòng)換道行為,場(chǎng)景如圖1所示,Lane1上行駛的AV車(chē)產(chǎn)生換道至目標(biāo)車(chē)道Lane2的意圖,假定AV車(chē)為可以自動(dòng)完成主動(dòng)換道全過(guò)程的L3級(jí)別自動(dòng)駕駛車(chē)輛,Lane1的前車(chē)RV1及Lane 2的后車(chē)RV2均為完全人工駕駛的非網(wǎng)聯(lián)車(chē)輛。車(chē)輛AV做出從Lane1換道Lane2的決策過(guò)程可以視為其與其他車(chē)輛交互博弈的過(guò)程。AV為了尋求更大的行駛空間產(chǎn)生了換道意圖,而周?chē)艿接绊懙钠渌?chē)輛需考慮自身所處的環(huán)境決定是否進(jìn)行讓行,周?chē)?chē)輛采取的策略的不同都會(huì)影響AV最終的決策結(jié)果。該文主要研究有換道意圖的自動(dòng)駕駛車(chē)AV與目標(biāo)車(chē)道后車(chē)RV2間的博弈,下面將確定兩者間的博弈類(lèi)型及作用機(jī)理。
1.1 博弈類(lèi)型界定及博弈機(jī)理解析
每一個(gè)博弈的主要構(gòu)成要素包括參與者、每個(gè)參與者所采取的策略以及參與者采取相應(yīng)的策略所帶來(lái)的收益函數(shù)。根據(jù)博弈雙方的期望收益,通常可以將博弈劃分為合作博弈與非合作博弈。非合作博弈下根據(jù)參與者行動(dòng)順序的可見(jiàn)性和參與者信息的完整性又可分為完全信息動(dòng)態(tài)博弈、完全信息靜態(tài)博弈、不完全信息動(dòng)態(tài)博弈和不完全信息靜態(tài)博弈四種類(lèi)型。
上述兩車(chē)在博弈過(guò)程中知曉對(duì)方的坐標(biāo)、所處車(chē)道等信息,為完全信息博弈,區(qū)別在于AV作為配備真值測(cè)試設(shè)備的自動(dòng)駕駛車(chē)在感應(yīng)時(shí)間、感應(yīng)范圍上具備一定優(yōu)勢(shì);研究假定兩車(chē)同時(shí)采取是否換道/是否讓行的決策,因此為靜態(tài)博弈;在博弈中,兩車(chē)的預(yù)期目標(biāo)均為自身的收益達(dá)到最佳,因此為非合作博弈。故AV與RV2間的博弈類(lèi)別界定為完全信息下的非合作靜態(tài)博弈。這個(gè)博弈對(duì)應(yīng)的基本要素為[8]:
(1)參與者:為AV和RV2;
(2)決策:可供AV選擇的決策有換道/原車(chē)道繼續(xù)行駛,可供RV2選擇的決策有減速讓行/加速阻止;
(3)收益函數(shù):兩車(chē)不論采取何種決策都會(huì)產(chǎn)生一定的收益,將建立兩車(chē)的收益函數(shù)對(duì)收益程度進(jìn)行量化表達(dá)。
1.2 換道決策機(jī)制建立
依據(jù)上述博弈要素分析,可以得到兩車(chē)博弈的收益矩陣,如表1所示。其中m1、m2為AV采取的換道、不換道策略,u1為AV的收益函數(shù);n1、n2為RV2采取的讓行、不讓行策略,u2為RV2的收益函數(shù)。
假定此非合作博弈存在策略(mi,ni),滿足納什均衡,即使式(1)成立:
而策略(mi,ni)也將作為該研究對(duì)博弈換道的預(yù)測(cè)策略。
1.2.1 收益函數(shù)確定
在進(jìn)行換道過(guò)程的收益評(píng)估時(shí),學(xué)者們通常從安全(距離)收益[9]或速度收益(時(shí)間)的維度[10]來(lái)建立效益函數(shù)。研究將結(jié)合兩個(gè)維度建立收益函數(shù),AV及RV2采取何種策略所得到的收益計(jì)算方式如下:
式中:-AV未決策前的最優(yōu)行駛速度;
-AV采取決策后的穩(wěn)定跟車(chē)速度;
-AV采取決策后穩(wěn)定跟車(chē)的距離;
-RV2未決策前的最優(yōu)行駛速度;
-RV2采取決策后的穩(wěn)定跟車(chē)速度;
-RV2采取決策后穩(wěn)定跟車(chē)的距離。
1.2.2 換道決策機(jī)制
根據(jù)式(2)提出的博弈收益函數(shù),從AV視角進(jìn)行博弈決策機(jī)制,換道決策流程為:換道意圖產(chǎn)生—信息收集整合—博弈分析—收益計(jì)算—執(zhí)行決策(換道、不換道)。
2 實(shí)際數(shù)據(jù)驗(yàn)證
為驗(yàn)證機(jī)制的有效性,選擇使用自動(dòng)駕駛車(chē)進(jìn)行高速公路測(cè)試時(shí)的數(shù)據(jù)進(jìn)行決策預(yù)測(cè)。試驗(yàn)車(chē)是蔚來(lái)ES6,在高速公路上可以完成自動(dòng)變道。
該車(chē)配備了由GPS定位、慣性測(cè)量單元、激光雷達(dá)等組成的測(cè)試系統(tǒng),能夠準(zhǔn)確識(shí)別車(chē)輛周?chē)能?chē)道信息、車(chē)輛等目標(biāo)物,計(jì)算之間的距離、速度和位置,并在數(shù)采內(nèi),實(shí)現(xiàn)數(shù)據(jù)分析與評(píng)價(jià)。此次道路測(cè)試選定的測(cè)試路線為天津市某段繞城高速公路,總長(zhǎng)248.8 km。于每天不同時(shí)間段對(duì)此路線進(jìn)行測(cè)試采集。
提取測(cè)試過(guò)程中發(fā)生的自由變道成功及失敗場(chǎng)景,并對(duì)數(shù)據(jù)進(jìn)行清洗,獲得72個(gè)主動(dòng)換道成功場(chǎng)景、31個(gè)失敗場(chǎng)景,本驗(yàn)證將對(duì)這些場(chǎng)景進(jìn)行換道拆解,根據(jù)換道決策前的跟車(chē)間隙、周邊車(chē)速、車(chē)流密度等信息進(jìn)行綜合收益評(píng)估,對(duì)其是否換道展開(kāi)預(yù)測(cè)。后續(xù)將預(yù)測(cè)后結(jié)果與實(shí)際場(chǎng)景比對(duì)計(jì)算準(zhǔn)確率。
2.1 自動(dòng)換道成功場(chǎng)景驗(yàn)證
提取測(cè)試過(guò)程中的換道場(chǎng)景,在換道意圖產(chǎn)生后根據(jù)試驗(yàn)車(chē)采集的自車(chē)與周邊數(shù)據(jù)進(jìn)行換道決策預(yù)測(cè),如圖2所示,試驗(yàn)車(chē)根據(jù)環(huán)境,產(chǎn)生換道意圖,此時(shí)對(duì)試驗(yàn)車(chē)及目標(biāo)車(chē)道后車(chē)進(jìn)行收益計(jì)算,表2為試驗(yàn)車(chē)與目標(biāo)后車(chē)的博弈收益矩陣。
納什均衡后,不論RV2是否讓行,AV的最佳策略都是換道,但該次的最佳策略是RV2讓行,AV換道,這也與實(shí)際情況相符。依次測(cè)算所有換道成功場(chǎng)景,準(zhǔn)確率達(dá)90.2%。
2.2 自動(dòng)換道失敗場(chǎng)景驗(yàn)證
提取的自動(dòng)換道失敗場(chǎng)景是指試驗(yàn)車(chē)在自動(dòng)駕駛功能開(kāi)啟的工況下進(jìn)行換道,但由于自車(chē)或周?chē)囊蛩卣?qǐng)求人工接管,由安全員決定是否繼續(xù)換道,如圖3樣例所示,計(jì)算試驗(yàn)車(chē)及目標(biāo)車(chē)道后車(chē)的收益函數(shù)值,如表3所示。
納什均衡后,該次博弈的最佳策略是RV2不讓行,AV換道。實(shí)際情況是AV在選擇換道后,RV2采取加速策略,AV自動(dòng)駕駛功能退出,人工接管換道,與預(yù)測(cè)決策相符。依次測(cè)算所有提取的有效場(chǎng)景,預(yù)測(cè)準(zhǔn)確率為82.7%。
2.3 驗(yàn)證結(jié)果分析
研究采用實(shí)際自動(dòng)駕駛數(shù)據(jù)分析了自動(dòng)換道執(zhí)行成功和失敗兩種工況下的共103個(gè)場(chǎng)景進(jìn)行換道決策預(yù)測(cè)。結(jié)果顯示該研究的換道決策機(jī)制具備一定程度的可靠性,尤其在成功工況下準(zhǔn)確率較高。
相較于成功工況,自動(dòng)換道失敗工況預(yù)測(cè)準(zhǔn)確率較低,經(jīng)場(chǎng)景回放分析,自動(dòng)換道失敗原因大部分是由于試驗(yàn)車(chē)沒(méi)有充分考慮目標(biāo)車(chē)道后車(chē)加速的可能性,在后車(chē)突然加速后退出了自動(dòng)駕駛功能,存在決策失誤的可能,也體現(xiàn)了博弈思想在車(chē)輛策略決策方面具有一定的積極意義。
3 結(jié)語(yǔ)
該文應(yīng)用博弈論理論從安全及效率維度建立了換道決策機(jī)制,通過(guò)實(shí)際數(shù)據(jù)進(jìn)行高速自動(dòng)駕駛換道決策預(yù)測(cè),準(zhǔn)確率證明了機(jī)制的有效性,也體現(xiàn)了博弈思想對(duì)于自動(dòng)駕駛汽車(chē)決策的積極意義。
參考文獻(xiàn)
[1]北京日?qǐng)?bào). 全國(guó)新能源車(chē)保有量超600萬(wàn)輛!網(wǎng)聯(lián)汽車(chē)測(cè)試?yán)锍掏黄?00萬(wàn)公里[EB/OL] . (2021-9-25). https://baijiahao.baidu.com/s?id=1711869964531068507&wfr=spider&for=pc.
[2]Gipps P G. A Model for the Structure of Lane-Changing Decision[J]. Transportation Research Part B Methodological, ?1986(5): 403-414.?
[3]Motohiro, Fujita, Koji, et al. Predicting driver's lane-changing decisions using a neural network model. Simulation Modelling Practice & Theory International Journal of the Federation of European Simulation Societies, 2014.
[4]Wang D, Hu M, Wang Y. Model predictive control-based cooperative lane change strategy for improving traffic flow[J]. Advances in Mechanical Engineering, 2016(2): 1-17.
[5]Kita H. A merging–giveway interaction model of cars in a merging section: ?a game theoretic analysis[J]. Transportation Research, Part A (Policy and Practice), 1999(3-4): 305-312.
[6]Talebpour A, Mahmassani H S, Hamdar S H. Modeling lane-changing behavior in a connected environment: A game theory approach[J]. transportation research procedia, 2015(59): 216-232.
[7]Bell M. A game theory approach to measuring the performance reliability of transport networks[J]. Transportation Research Part B, 2000(6): ?533-545.
[8]Mckelvey R, Mclennan A, Turocy T, et al. Gambit: ?Software Tools for Game Theory[J]. Modern Healthcare, 2005(5).
[9] 薛春銘. 基于博弈的車(chē)輛協(xié)作換道策略研究[D]. 大連:大連理工大學(xué), 2017.
[10]楊曉芳, 張盛, 付強(qiáng). ?基于博弈論的完全信息下的駕駛行為研究[J]. 公路交通科技, 2015(7): 105-111.