摘要: 為研究城市交通流頻變路段智能網(wǎng)聯(lián)車輛換道博弈的演化機制和降低車輛換道的決策沖突,通過量化車輛收益和權(quán)重系數(shù)實現(xiàn)人車交互并建立演化動態(tài)方程,根據(jù)博弈系統(tǒng)的雅可比矩陣分析均衡點的穩(wěn)定性,最后利用數(shù)值仿真決策演化路徑并對影響因素進行靈敏度分析。結(jié)果表明不同駕駛決策的初始比例會影響決策的演化方向,左轉(zhuǎn)綠燈時間增進車輛策略向(換道,讓行)方向演化,隨決策時刻位置減小增進車輛策略向(換道,讓行)方向演化。
關(guān)鍵詞: 智能網(wǎng)聯(lián)車輛;交通流頻變路段;強制換道;演化博弈
中圖分類號: U491;U491.2文獻標(biāo)識碼: A
Evolutionary Game Mechanisms of Lane Changing for Intelligent Connected Vehicles on Traffic Flow Frequently Changing Sections
DAI Shouchen, QU Dayi, MENG Yiming, YANG Yufeng,WANG Qikun
(School of Mechanical and Automotive Engineering, Qingdao University of Technology, Qingdao 266520,China)
Abstract:In order to study the evolutionary mechanism of lane changing for intelligent connected vehicles on urban traffic flow frequently changing sections and reduce the decision conflict of vehicle lane changing, the human-vehicle interaction was realized and the evolutionary dynamic equations were established by quantifying the vehicle revenue and weight coefficient. According to the Jacobi matrix of the game system, the stability of the equilibrium points were analyzed. Finally, the numerical simulation was used to determine the evolution path and the sensitivity analysis of the influencing factors was carried out. The results show that the initial ratio of different driving decisions will affect the evolution direction of the decision, and the left-turn green time will enhance the evolution of vehicle strategy in the direction of changing lane and giving way, and the evolution of vehicle strategy in the direction of changing lane and giving way as the position of decision time decreases.
Keywords: intelligent connected vehicles; traffic flow frequently changing sections; forced lane change; evolutionary game
0 引言
隨著新能源汽車的生產(chǎn)和普及以及新能源汽車依托于不斷發(fā)展的輔助駕駛或無人駕駛技術(shù),未來的城市道路將出現(xiàn)一定規(guī)模的智能網(wǎng)聯(lián)車輛行駛的交通場景。城市道路為人們駕車出行的主要場景,車輛換道是交通流中一種常見的車輛微觀駕駛行為,因此,車輛的換道決策和交互行為成為交通流領(lǐng)域研究的熱點。
城市路段的車輛換道特性主要在于車輛行駛受到信號燈的影響,相比于其他換道行為,信號燈等道路信息是交叉口換道模型中不可缺少的研究要素。丁建勛等[1]基于二維最優(yōu)速度模型建立了信號交叉口的車輛跟馳換道模型,刻畫了臨近交叉口路段交通流的宏觀特征;成衛(wèi)等[2]基于元胞自動機研究了換道行為對交叉口路段交通流穩(wěn)定性的影響,結(jié)果表明交通密度隨綠信比增大而降低;Zhou等[3]基于強化學(xué)習(xí)模型,通過獲取信號燈狀況和行駛需求實現(xiàn)車輛的高效駕駛策略。此外,也有學(xué)者基于網(wǎng)聯(lián)車輛的發(fā)展前景來研究復(fù)雜交通環(huán)境下的交叉口換道過程,楊達等[4]通過考慮信號燈和周圍車輛的行駛狀況建立了智能網(wǎng)聯(lián)汽車的決策行為框架,結(jié)果表明綜合環(huán)境信息后的車輛決策準(zhǔn)確性得到顯著提高。宗芳等[5]基于風(fēng)險場理論刻畫了網(wǎng)聯(lián)環(huán)境下的行車風(fēng)險狀況,通過動態(tài)軌跡優(yōu)化和速度控制提高了交叉口的行車效率。相較于上述模型側(cè)重于刻畫宏觀交通流或提高交叉口通行效率,部分學(xué)者將車輛的交互過程作為重點進行研究,進而得到更為動態(tài)的微觀換道模型。葉穎俊等[6]基于軌跡數(shù)據(jù)挖掘發(fā)現(xiàn)快速路匯入路段存在車輛試探后車回應(yīng)式交互行為,從而拓展了傳統(tǒng)的匝道車輛匯入模型。Zhang等[7]基于系統(tǒng)相似性分析和相互作用勢理論,通過分子動力學(xué)刻畫了車輛換道過程中的態(tài)勢分布和交互關(guān)系。
隨著博弈理論與交通領(lǐng)域的交叉發(fā)展,學(xué)者們將博弈論應(yīng)用于車輛換道的研究中,將決策行為量化成相應(yīng)的收益得失并通過求得最優(yōu)解為車輛提供決策誘導(dǎo),張可琨等[8]通過量化換道決策行為,基于換道碰撞概率建立了自動駕駛車輛博弈換道的決策模型;Guo等[9]通過將多主體博弈過程分解成子博弈系統(tǒng)建立了博弈論分解算法,結(jié)果表明所建模型可以降低計算復(fù)雜度并在交通擁堵情況下具有明顯優(yōu)勢;Qu等[10]通過量化換道意圖和換道動態(tài)風(fēng)險研究了自動駕駛車輛的換道影響因素。
博弈理論的應(yīng)用拓展了傳統(tǒng)的換道規(guī)則模型,按照博弈順序或持續(xù)時間又可以劃分為動態(tài)和靜態(tài)博弈,其中動態(tài)博弈相較于上述模型更能準(zhǔn)確刻畫駕駛員的交互過程,Shao等[11]基于信號博弈方法研究了不同交通密度下的換道成功率,通過靈敏度分析驗證了模型穩(wěn)定性;Ladino等[12]提出了一種高速匝道合并路段的動態(tài)博弈最優(yōu)控制框架,刻畫了車輛協(xié)同換道過程中的交互關(guān)系。肖雪等[13]采用主從博弈的方法描述了智能駕駛車輛的換道過程,通過量化代價函數(shù)建立了車輛換道決策及軌跡規(guī)劃模型;禹樂文等[14]通過構(gòu)建車輛侵入系數(shù)建立了復(fù)雜環(huán)境下的多人動態(tài)博弈模型,結(jié)果表明車輛博弈過程能在復(fù)雜環(huán)境中尋找最優(yōu)策略和軌跡路線。隨著對博弈決策的深入研究,部分學(xué)者通過研究其他場景提高了博弈換道模型的適用性。Zhang等[15]通過分析換道意圖和視覺特征研究了霧天環(huán)境下的換道博弈模型,為復(fù)雜天氣環(huán)境下的換道模型提供了參考。Peng等[16]提出了一種網(wǎng)聯(lián)駕駛車輛協(xié)同決策方法,通過形成博弈聯(lián)盟解決無信號交叉口的駕駛沖突,結(jié)果表明該決策算法可以提高無信號交叉口的通行效率和社會效益。
綜上所述,學(xué)者們基于博弈理論對車輛換道進行了大量研究,但研究場景主要面向高速公路或瓶頸路段且模型通?;诓┺恼搨?cè)重于對決策控制過程進行優(yōu)化,缺少對換道博弈機理的研究而直接將博弈結(jié)果應(yīng)用于策略控制,因此具有一定的局限性。針對上述問題,本文通過演化博弈理論來研究非完全理性下的左轉(zhuǎn)車輛強制換道行為,通過量化決策權(quán)重實現(xiàn)人車交互并建立車輛換道演化博弈模型,對車輛初始決策傾向和主要宏觀因素進行靈敏度分析并探討換道穩(wěn)定策略的收斂情況,通過仿真演化路徑研究分析車輛強制換道的博弈演化機制,為車輛博弈決策與控制的相關(guān)研究提供理論參考。
1 換道博弈行為
1.1 博弈場景
城市道路作為居民日常出行的主要場景承載了相當(dāng)比例的車輛運行,而車輛換道作為道路交通中普遍的駕駛行為具有隨行駛意圖變化而變化的特點,車輛換道通??梢詣澐譃樽杂蓳Q道和強制換道,二者頻繁發(fā)生在城市道路的不同場景中。如圖1所示雙向四車道的城市路段中,各相鄰交叉口之間的路段根據(jù)交通流的換道特性可以劃分為自由換道、交通流穩(wěn)定路段和交通流頻變路段。
自由換道路段以上游交叉口出口道為起點,由于車輛性能和駕駛員操作的差異造成車輛起步和行駛速度不同,該路段上的車輛普遍追求較高的行駛速度,根據(jù)換道意圖從而產(chǎn)生以自由換道為主的換道行為。當(dāng)車輛在自由換道路段行駛并換道至期望車道時,車輛的行駛速度和車間距均滿足駕駛員對行駛效率和安全的需求,因此,車輛通常以不同間距的車隊或車輛簇的形式在一定長度的路段內(nèi)穩(wěn)定行駛,使得該路段的換道頻率降低,呈現(xiàn)出交通流局部穩(wěn)定的局面。對于人工駕駛車輛而言,由于駕駛員駕駛技術(shù)的不同,隨著車輛駛近下游交叉口以及車輛駛?cè)虢煌黝l變路段時,保守的駕駛員更傾向于提前換道至目標(biāo)車道并保持車道行駛,而對駕駛技術(shù)較為自信的駕駛員更傾向于選擇車速較高的車道行駛。對于網(wǎng)聯(lián)駕駛車輛而言,從人工駕駛環(huán)境轉(zhuǎn)變?yōu)榫W(wǎng)聯(lián)駕駛環(huán)境的過程中,網(wǎng)聯(lián)駕駛車輛應(yīng)遵循傳統(tǒng)交通環(huán)境下的行駛特性以保障乘客的可接受性,網(wǎng)聯(lián)駕駛車輛在滿足乘客的乘坐期望的要求上還要遵守交通規(guī)則和促進維護良性的交通環(huán)境,因此,假定網(wǎng)聯(lián)駕駛車輛不存在臨近進口道時采取換道的激進駕駛行為,車輛為遵守交通規(guī)則均需要提前駛?cè)肽繕?biāo)車道行駛,交通流頻變路段的車輛受制于道路和交通條件,車輛換道采取以強制換道為主的換道行為。
ICV(Intelligent Connected Vehicle)為換道車輛,RICV(Rear Intelligent Connected Vehicle)為目標(biāo)車道后方車輛,本文界定模型場景為:假設(shè)周圍車輛均在下游交叉口綠燈相位內(nèi)以穩(wěn)定狀態(tài)行駛,ICV是行駛在右側(cè)車道且需要左轉(zhuǎn)的車輛,RICV是正常行駛在最左側(cè)車道且同樣需要左轉(zhuǎn)的車輛,因此,ICV需要換道至最左側(cè)車道完成左轉(zhuǎn)任務(wù)。ICV采取向目標(biāo)車道換道的行為通常受到RICV的影響,車輛的決策選擇有換道和不換道,目標(biāo)車道后車的決策選擇有讓行和不讓行,當(dāng)兩車間距小于ICV以當(dāng)前狀態(tài)換道所需要的距離時,ICV需要RICV減速協(xié)助完成換道過程,由于RICV減速是對自身效率收益的損失策略而換道行為是ICV的增益策略,因此車輛之間需要進行換道博弈。
1.2 智能網(wǎng)聯(lián)車輛功能界定
本文模型中的車輛均界定為智能網(wǎng)聯(lián)車輛,車輛均搭載車載檢測器、傳感器等裝置,車輛與路側(cè)單元設(shè)施之間實現(xiàn)信息交互,包括車間距、車速等行駛狀態(tài)信息,路側(cè)單元設(shè)施也能獲取道路設(shè)施如信號燈的狀態(tài)信息,包括信號燈相位、剩余或下一綠燈時間等信息。相較于人工或混合交通環(huán)境,網(wǎng)聯(lián)駕駛車輛之間可通過博弈控制系統(tǒng)完成博弈和決策過程,車輛通過車載設(shè)備獲取車輛行駛狀態(tài)并將狀態(tài)信息發(fā)送至路側(cè)信息接收端,博弈系統(tǒng)決策模塊為博弈主體車輛確定離散化的駕駛目標(biāo),設(shè)定決策收益并通過博弈系統(tǒng)完成博弈演化過程,最終由路側(cè)信息發(fā)送端為車輛提供穩(wěn)定性駕駛策略,假設(shè)智能網(wǎng)聯(lián)車輛均按照最優(yōu)博弈策略做出相應(yīng)行為,從而實現(xiàn)車輛換道決策控制過程。
智能網(wǎng)聯(lián)車輛與乘客之間也具有一定的交互關(guān)系,車輛在做出決策行為時應(yīng)考慮到一般乘客的決策期望,網(wǎng)聯(lián)駕駛車輛在面對一定的交通環(huán)境時應(yīng)當(dāng)做出類人化的駕駛行為,車輛行駛屬性如激進或保守能夠隨駕駛環(huán)境變化而變化,從而提高決策行為的合理性和乘客的可接受性。為簡化博弈行為和決策過程,本文將智能網(wǎng)聯(lián)車輛的駕駛?cè)蝿?wù)離散化,車輛在某一時間段的行駛?cè)蝿?wù)隨交通環(huán)境變化而觸發(fā),并通過量化收益權(quán)重建立乘客期望車輛決策的人車交互機制,本文所建車輛博弈模型不考慮全局最優(yōu),通過博弈演化動態(tài)過程探究交通環(huán)境等因素對車輛換道決策的影響。
2 換道博弈行為模型
2.1 決策收益
以上述場景中的ICV和RICV車輛為例分析車輛采取不同決策所對應(yīng)的收益函數(shù)。當(dāng)車輛間距不滿足ICV換道要求時需要RICV協(xié)助做出減速決策,ICV與RICV的決策存在收益沖突而構(gòu)成博弈場景,構(gòu)建ICV和RICV的換道博弈收益函數(shù)分別為
I=μIe+1-μIs R=ρRe+1-ρRs(1)
其中,Ie和Is分別為ICV的效率收益和安全收益;Re和Rs分別為RICV的效率收益和安全收益;μ和ρ分別為各自的效率權(quán)重系數(shù)。
ICV和RICV的安全收益受到車輛間距和換道需求距離的影響,將二者的安全收益表示為
Is=Rs=ΔL-LminLmax-Lmin(2)
其中,ΔL為縱向車間距;Lmax為需要博弈換道的最大車間距;Lmin為后車協(xié)助減速可以完成換道的最小車間距。
基于目前自動駕駛車輛局部路徑駕駛行為通常由場景觸發(fā),本文將車輛的駕駛?cè)蝿?wù)離散化,ICV的駕駛?cè)蝿?wù)為與目標(biāo)車道后車進行博弈并換道至目標(biāo)車道。RICV為在當(dāng)前車道正常行駛而受到ICV換道期望影響的車輛,RICV采取讓行或不讓行決策將影響自身的效率收益。假設(shè)交通流穩(wěn)定行駛,當(dāng)ICV換道至目標(biāo)車道時,通常會增加排隊長度從而增加RICV的行程時間,當(dāng)ICV未換道至RICV前方時,RICV的行程時間受博弈過程影響較小。因此,將ICV和RICV的效率收益分別表示為
Ie=ti-tImintImax-tIminRe=tr-tRmintRmax-tRmin(3)
其中,ti為ICV做出不同決策后所對應(yīng)的換道時間;tImax、tImin分別為考慮車輛換道過程的最長和最短時間。tr為RICV采取不同決策所對應(yīng)通過停車線的時間,tRmax、tRmin分別為RICV僅考慮與ICV博弈過程影響下由博弈時刻至通過停車線的最長和最短行程時間,最短行程時間為車流在期望車速下穩(wěn)定行駛通過停車線所需時間。
由于本文界定了智能網(wǎng)聯(lián)車輛的行駛場景和駕駛功能,智能網(wǎng)聯(lián)車輛通過自動駕駛系統(tǒng)控制行駛,駕駛員由駕駛車輛改變?yōu)槌俗囕v,其身份由駕駛員轉(zhuǎn)變?yōu)檐囕v乘客。智能網(wǎng)聯(lián)車聯(lián)在遵守交通規(guī)則的條件下需要兼容不同駕駛風(fēng)格的乘客以期達到乘客的乘車期望,因此,智能網(wǎng)聯(lián)車輛應(yīng)建立與乘客的交互關(guān)系,設(shè)定車輛可以根據(jù)交通環(huán)境調(diào)整對效率和安全的收益權(quán)重,從而反映乘客對車輛決策的期望。考慮到智能網(wǎng)聯(lián)車輛發(fā)展的前瞻性,本文不再考慮駕駛員風(fēng)格的差異性,轉(zhuǎn)而為智能網(wǎng)聯(lián)車輛建立通用權(quán)重函數(shù),對權(quán)重設(shè)置上下限以避免智能網(wǎng)聯(lián)車輛過于片面追求安全或效率。
ICV換道需要考慮決策時刻位置和換道時間的影響,決策時刻位置越靠近停車線越傾向于完成車輛換道過程。RICV采取不同決策和左轉(zhuǎn)綠燈時間會影響其行駛至交叉口的時間,且左轉(zhuǎn)綠燈時間越短RICV越傾向于追求效率收益。因此,將ICV和RICV收益函數(shù)的權(quán)重分別表示為
μ=maxminSmax-SSmax-Smin+η,0.7,0.3ρ=minmaxtR-tGmintG-tGmin+η,0.3,0.7(4)
其中,S為ICV決策時刻至停車線的距離;Smin為ICV距交叉口停車線的最小期望換道距離,設(shè)置該值以維護良性的交通環(huán)境并減少實線區(qū)附近的換道沖突;Smax為交通流頻變路段最遠換道位置;tR為RICV采取不同決策對應(yīng)的由當(dāng)前位置至行駛過停車線的時間;tG為下游交叉口的左轉(zhuǎn)綠燈剩余時間;tGmin為車輛由當(dāng)前位置通過交叉口所需的最小綠燈時間;η為非零較小值。
通過分析決策沖突和構(gòu)建收益函數(shù)建立如表1所示的收益矩陣。
2.2 ICV決策演化動態(tài)方程
演化博弈論被廣泛應(yīng)用于研究車輛換道和社會科學(xué)[1720]等決策問題,其理論思想為適應(yīng)性調(diào)整策略并通過不斷演化使得博弈者選擇收益高的策略,該過程通常被視為一個具有時間概念的演化過程,演化博弈論通過演化動態(tài)方程描述不同策略的演化趨勢,因此,對ICV建立決策時間連續(xù)情況下的演化動態(tài)方程,ICV選擇換道和不換道決策所對應(yīng)的期望收益EI1、EI2分別為
EI1=2μIe+1-μIsy+-μIe-1-μIs(5)
EI2=-μIe+1-μIs(6)
ICV以概率x選擇換道、以概率1-x選擇不換道的期望收益EI為
EI=2μIe+1-μIsxy-21-μIsx-μIe+1-μIs(7)
根據(jù)式(5)和(7)可得ICV選擇換道決策的演化動態(tài)方程FI為
FI=xt=xEI1-EI=2xμIe+1-μIsy-1-μIs-μIe+1-μIsxy+1-μIsx=2x1-xμIe+1-μIsy-1-μIs(8)
2.3 RICV決策演化動態(tài)方程
對RICV建立決策時間連續(xù)情況下的演化動態(tài)方程,RICV選擇讓行和不讓行決策所對應(yīng)的期望收益ER1、ER2分別為
ER1=-ρRe+1-ρRs(9)
ER2=-2ρRe+1-ρRsx+ρRe+1-ρRs(10)
RICV以概率y選擇讓行、以概率1-y選擇不讓行的期望收益ER為
ER=yER1+1-yER2=-2ρRey-2ρRe+1-ρRsx+2ρRe+1-ρRsxy+ρRe+1-ρRs(11)
根據(jù)式(9)和(11)可得RICV選擇讓行的演化動態(tài)方程FR為
FR=yt=yER1-ER=2y-ρRe+ρRe+1-ρRsx+ρRey-ρRe+1-ρRsxy=2y1-y-ρRe+ρRe+1-ρRsx(12)
3 演化策略穩(wěn)定性分析
由于演化博弈論考慮到博弈方具有有限理性的特點,因此博弈方受到實際環(huán)境的影響通常通過動態(tài)調(diào)整決策概率來逐步達到穩(wěn)定狀態(tài)。因此,通過式(8)和(12)聯(lián)立可得關(guān)于ICV選擇換道比例x和RICV選擇讓行比例y的微分方程組:
xt=0yt=0 x,y∈0,1(13)
無論所建模型中的收益函數(shù)如何變化,求解式(13)微分方程組總可以得到的解為(0,0)、(0,1)、( 0)、( 1),微分方程組另有一組與收益函數(shù)有關(guān)的解(x*,y*)即(ρRe/(ρRe+(1-ρ)Rs),(1-μ)Is/(μIe+(1-μ)Is))。
所建模型中動態(tài)博弈系統(tǒng)的雅可比矩陣為
JIR=FIxFIyFRxFRy=21-2xμIe+1-μIsy-1-μIs2x1-xμIe+1-μIs2y1-yρRe+1-ρRs21-2y-ρRe+ρRe+1-ρRsx(14)
根據(jù)式(15)得到雅可比矩陣的行列式JIR和跡trJIR分別為
JIR=21-2xμIe+1-μIsy-1-μIs×21-2y-ρRe+ρRe+1-ρRsx-2y1-yρRe+1-ρRs×2x1-xμIe+1-μIs(15)
trJIR=21-2xμIe+1-μIsy-1-μIs+21-2y-ρRe+ρRe+1-ρRsx(16)
將式(13)求得的5個均衡解分別代入式(15)和(16),從而得到各均衡點行列式和跡的數(shù)值正負,計算結(jié)果如表2所示。
根據(jù)穩(wěn)定性原理,當(dāng)均衡點滿足trJIR小于0且JIR大于0時,此均衡點對應(yīng)為演化穩(wěn)定策略,通過矩陣的行列式和跡來判斷均衡點的穩(wěn)定性,則上述各均衡點的穩(wěn)定性如表3所示。
根據(jù)以上穩(wěn)定性判定可以得到穩(wěn)定均衡點有(0,0)和( 1),其對應(yīng)的穩(wěn)定策略分別為(不換道,不讓行)和(換道,讓行),不穩(wěn)定點為(0,1)和( 0),其對應(yīng)的策略分別為(不換道,讓行)和(換道,不讓行),ρRe/(ρRe+1-ρRs),1-μIs/(μIe+1-μIs)為鞍點,向(0,0)或( 1)收斂方向不定。
4 靈敏度分析
4.1 參數(shù)標(biāo)定
為詳細闡明交通流頻變路段智能網(wǎng)聯(lián)車輛換道博弈的策略演化結(jié)果,選取青島平度市人民路—永州路交叉口西向路段為調(diào)查地點、工作日平峰時段為調(diào)查時間,路段和交叉口渠化如圖1所示,為路段雙向四車道、進口道為三車道。采用視頻檢測和人工調(diào)查相結(jié)合方法對該路段的換道位置、平均速度和車間距等數(shù)據(jù)進行調(diào)查,通過對本文模型進行參數(shù)標(biāo)定、構(gòu)造換道收益函數(shù)并使用MATLAB對演化路徑進行仿真,本文設(shè)定模型參數(shù)取值如表4所示。
4.2 初始決策傾向影響
如圖2所示為初始換道比例x和讓行比例y分別以0.1的間隔在[0. 0.9]之間選取初始值得到的演化路徑。當(dāng)x和y初始值較小時,在演化路徑中將收斂于不換道和不讓行策略組合。當(dāng)x和y初始值較大時,在演化路徑中將收斂于換道和讓行策略組合。
基于智能網(wǎng)聯(lián)車輛的發(fā)展前景,未來的網(wǎng)聯(lián)車輛可以在一定程度上體現(xiàn)乘客的行程需求和對車輛決策的可接受性。對于人工駕駛車輛而言,不同類型的駕駛員具有不同的初始決策傾向,因此,智能網(wǎng)聯(lián)車輛可以通過量化權(quán)重系數(shù)實現(xiàn)乘客期望—車輛決策的人車交互機制,從而更好地兼容不同類型的乘客期望。如圖3所示,以初始比例為(0.2,0.9)為例,即ICV初始決策傾向于不換道而RICV傾向于讓行,根據(jù)收斂方向車輛策略向( 1)點演化并最終收斂于(換道,讓行)策略;當(dāng)選取初始值為(0.6,0.5)時,即ICV初始決策傾向于換道而RICV相對中立,車輛策略向( 1)點演化并最終收斂于(換道,讓行)策略。
如圖4所示,當(dāng)選取初始比例為(0. 0.4)時,即ICV初始決策傾向于不換道而RICV傾向于不讓行,車輛策略向(0,0)點演化并最終收斂于(不換道,不讓行)策略;當(dāng)選取初始值為(0.8,0.1)時,即ICV初始決策傾向于換道而RICV傾向于不讓行,車輛策略向(0,0)點演化并最終收斂于(不換道,不讓行)策略。
由于城市路段的交通流通常以信號交叉口的綠燈時間為時間分隔,因此車流呈現(xiàn)出以車輛簇的形式駛向下游交叉口,在上游交叉口不同綠燈相位內(nèi)放行的車流中,不同車輛會表現(xiàn)出駕駛風(fēng)格的差異性,對于智能網(wǎng)聯(lián)車輛,車輛的決策傾向在一定程度上反應(yīng)了乘客的決策期望,不同類型的乘客通過車輛決策獲得可接受性的乘坐體驗。此外,不同初始決策的影響與演化博弈論起源即在生物進化過程中不同物種之間進行競爭與合作有著相似之處,因此,當(dāng)面對一定的交通環(huán)境時,被賦予不同駕駛期望的智能網(wǎng)聯(lián)車輛在換道博弈中表現(xiàn)出不同的最優(yōu)決策選擇。
4.3 決策時刻位置影響
在演化博弈中,鞍點與初始決策比例的相對位置將影響不同策略的收斂方向,進而對演化的穩(wěn)定策略產(chǎn)生影響,將式(13)所求均衡解劃分為如圖5所示相位圖的A( 0)、B(0,1)、C( 1)、E(x*,y*)、O(0,0)5個點。將不同收斂區(qū)域的面積表示為
SAOBE=12[ρReρRe+1-ρRs+1-μIsμIe+1-μIs](17)
SACBE=1-12[ρReρRe+1-ρRs+1-μIsμIe+1-μIs](18)
通過均衡解可知鞍點(x*,y*)的數(shù)值大小受收益函數(shù)和權(quán)重系數(shù)影響,因此,以博弈收益中的決策時刻車輛位置和左轉(zhuǎn)綠燈時間為例進行靈敏度分析以研究宏觀交通因素對博弈決策的影響。為降低上文所述初始值對決策演化的影響,在靈敏度分析過程中均將初始值設(shè)定為(0.5,0.5)并假定周圍車流穩(wěn)定行駛。調(diào)整決策時刻車輛位置的大小,并以1m為步長在(75,155)范圍內(nèi)進行變化,得到如圖6所示的交通流頻變路段車輛換道演化收斂隨決策時刻位置的影響,S為車輛決策時刻ICV車頭中心點距停車線的距離。
通過策略演化收斂情況可知隨S增加,收斂于換道和讓行的速度降低,收斂于不換道和不讓行的速度加快,穩(wěn)定點由 1向0,0改變,策略組合由(換道,讓行)向(不換道,不讓行)改變。其中,不同決策的臨界值為119m,即S<119m時,博弈系統(tǒng)收斂于 1即(換道,讓行),當(dāng)S>119m時,系統(tǒng)收斂于0,0即(不換道,不讓行)。
當(dāng)車流行駛至交通流頻變路段且下游交叉口左轉(zhuǎn)綠燈剩余時間一定時,S數(shù)值越大使得RICV對于行駛效率的期望越大而ICV對換道效率的期望越小,x*、y*均向 1趨近使得SAOBE增大而SACBE減小,從而收斂于 1的初始值比例減少、收斂于0,0的初始值比例增加,因此,策略比例組合從收斂于 1向0,0改變。
4.4 左轉(zhuǎn)綠燈時間影響
調(diào)整下游交叉口左轉(zhuǎn)綠燈時間,并以1s為步長在(10,30)范圍內(nèi)進行變化,假設(shè)交通流穩(wěn)定行駛并選定車輛決策位置為81 m,從而得到如圖7所示的換道決策演化收斂隨左轉(zhuǎn)綠燈時間的影響,當(dāng)決策時刻位置一定時,tG越大,收斂于換道和讓行的速度越快,收斂于不換道和不讓行的速度越低,穩(wěn)定點由0,0向 1改變,策略組合由(不換道,不讓行)向(換道,讓行)改變。策略組合改變的臨界值為14 s,即車輛行駛至某一位置且tG<14s時,博弈系統(tǒng)收斂于0,0即(不換道,不讓行),當(dāng)tG>14s時,系統(tǒng)收斂于 1即(換道,讓行)。
當(dāng)tG增加時,RICV對行駛至停車線的期望降低,鞍點向0,0點趨近使得SAOBE減小而SACBE增大,收斂于0,0的初始值比例降低而收斂于 1的比例增加,因此,策略組合向(換道,讓行)策略收斂。
通過以上分析可以得出無論初始值如何選擇,所建博弈系統(tǒng)中ICV和RICV的換道博弈均衡解最終將收斂于演化穩(wěn)定點0,0或 1,即穩(wěn)定策略組合收斂于(不換道,不讓行)或(換道,讓行)。網(wǎng)聯(lián)駕駛車輛在做出決策行為時應(yīng)考慮到乘客的決策期望,通過建立乘客期望—車輛決策交互關(guān)系,使得車輛在面對一定交通環(huán)境做出駕駛行為時能夠考慮決策行為的合理性和乘客的可接受性。決策時刻位置和左轉(zhuǎn)綠燈時間作為構(gòu)成收益矩陣的組成因素對策略的選擇具有影響作用,左轉(zhuǎn)綠燈時間增進車輛決策向(換道,讓行)方向演化,決策位置增進車輛決策向(不換道,不讓行)方向演化,影響因素通過改變鞍點的位置進而改變不同收斂區(qū)域的面積以及鞍點與初始值的相對位置,從而改變初始值收斂方向進而影響穩(wěn)定策略。
5 結(jié)論
本文研究了在城市交通流頻變路段的車輛換道行為過程中左轉(zhuǎn)強制換道車輛與目標(biāo)車道后車對不同決策的演化博弈機制,通過數(shù)值仿真決策演化路徑并以主要宏觀因素為例進行了靈敏度分析,為車輛博弈決策與控制提供理論參考并得到結(jié)論:1)通過對均衡點的穩(wěn)定性分析,該博弈系統(tǒng)有兩種演化穩(wěn)定策略即(換道,讓行)和(不換道,不讓行)、兩種不穩(wěn)定演化策略(換道,不讓行)和(不換道,讓行),最終演化方向通常受到交通環(huán)境的影響。2)通過量化收益權(quán)重建立乘客期望車輛決策的人車交互關(guān)系,決策收斂方向受到車輛初始策略傾向的影響并驗證了智能網(wǎng)聯(lián)車輛應(yīng)具備體現(xiàn)乘客期望的必要性。3)通過量化博弈收益函數(shù)并通過靈敏度分析得出:隨決策時刻車輛位置減小促使穩(wěn)定策略向(換道,讓行)演化,左轉(zhuǎn)綠燈時間增加促使策略組合向(換道,讓行)方向演化。根據(jù)本文模型可以探究車輛換道博弈的策略演化機制和智能網(wǎng)聯(lián)車輛與乘客的交互關(guān)系,為智能網(wǎng)聯(lián)車輛的博弈換道決策提供參考。但模型也具有一定的局限性,如對車輛決策控制過程和車輛動態(tài)交互行為的細節(jié)研究較為不足,后續(xù)研究還需考慮更加復(fù)雜的交通情況來完善車輛換道的決策演化和控制模型。
參考文獻:
[1]丁建勛,鄭楊邊牧,張夢婷, 等.臨近交叉口的車輛跟馳換道行為研究 [J]. 交通運輸系統(tǒng)工程與信息, 2017, 17(3): 6066.
DING J X,ZHENG Y B M,ZHANG M T, et al. Car-following and lane-changing behaviors near an intersection [J]. Journal of Transportation Systems Engineering and Information Technology, 2017, 17(3): 6066.
[2]成衛(wèi),周通,李冰. 駕駛員變更車道對信號交叉口交通流的影響 [J]. 昆明理工大學(xué)學(xué)報(自然科學(xué)版), 202 46(3): 149154.
CHENG W, ZHOU T, LI B. Influence of driver changing lane on traffic flow at signalized intersections [J]. Journal of Kunming University of Science and Technology (Natural Sciences), 202 46(3): 149154.
[3]ZHOU M F,YU Y,QU X B. Development of an efficient driving strategy for connected and automated vehicles at signalized intersections: a reinforcement learning approach [J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(1): 433443.
[4]楊達,楊果,羅旭, 等. 考慮前車狀態(tài)的智能網(wǎng)聯(lián)車交叉口行為決策 [J]. 西南交通大學(xué)學(xué)報, 2022, 57(2): 410417,433.
YANG D,YANG G,LUO X, et al. Behavior decision of intelligent connected vehicles considering status of preceding vehicles at intersections [J]. Journal of Southwest Jiaotong University, 2022, 57(2): 410417,433.
[5]宗芳,石蕊,劉懌軒, 等. 信號交叉口行車風(fēng)險場建立及車輛通行行為優(yōu)化 [J]. 中國公路學(xué)報, 2022, 35(10): 244253.
ZONG F,SHI R,LIU Z X, et al. Construction of risk field and optimization of driving behaviors for signalized intersections[J]. China Journal of Highway and Transport, 2022, 35(10): 244253.
[6]葉穎俊,倪穎,孫劍. 高密度瓶頸交通流主動回應(yīng)匯入行為定義與建模 [J]. 中國公路學(xué)報, 2022, 35(8): 278290.
YE Y J,NI Y,SUN J. Defining and modeling active-responsive merging behavior at high-density expressway on-ramp bottlenecks [J]. China Journal of Highway and Transport, 2022, 35(8): 278290.
[7] ZHANG K K,QU D Y,SONG H, et al. Analysis of lane-changing decision-making behavior and molecular interaction potential modeling for connected and automated vehicles [J]. Sustainability, 2022, 14(17): 120.
[8]張可琨,曲大義,宋慧, 等. 自動駕駛車輛換道博弈策略分析及建模 [J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2022, 12(7): 110.
ZHANG K K,QU D Y,SONG H, et al. Analysis and modeling for lane-changing game strategy of autonomous vehicles [J]. Complex Systems and Complexity Science, 2022, 12(7): 110.
[9]GUO J,HARMATI I. Lane-changing decision modelling in congested traffic with a game theory-based decomposition algorithm [J]. Engineering Applications of Artificial Intelligence, 2022, 107(5): 10453050.
[10]QU D Y,ZHANG K K,SONG H, et al. Analysis and modeling of lane-changing game strategy for autonomous driving vehicles [J]. IEEE Access, 2022, 10(2): 6953142.
[11]SHAO H P,ZHANG M R,F(xiàn)ENG T, et al. A discretionary lane-changing decision-making mechanism incorporating drivers’heterogeneity: a signalling game-based approach [J]. Journal of Advanced Transportation, 2020, 10(16): 116.
[12]LADINO A,WANG M. A dynamic game formulation for cooperative and change strategies at highway merges[J]. IFAC-PapersOnLine. 2020, 53(2): 1505964.
[13]肖雪,李克平,彭博, 等. 基于決策規(guī)劃迭代框架的智駕車換道行為建模 [J]. 吉林大學(xué)學(xué)報(工學(xué)版), 2023, 53(3): 746757.
XIAO X,LI K P,PENG B, et al. Integrated lane-changing model of decision making and motion planning for autonomous vehicles[J]. Journal of Jilin University (Engineering Edition), 2023, 53(3): 746757.
[14]禹樂文,羅霞,劉仕焜. 復(fù)雜車路環(huán)境下自動駕駛車輛換道仿真研究 [J]. 計算機仿真, 202 38(5): 146152.
YU L W,LUO X,LIU S K. Research on simulation of lane-changing for autonomous vehicles under complex road conditions [J]. Computer Simulation, 202 38(5): 146152.
[15]ZHANG X G,GAO J P,LI L, et al. Expressway lane change in fog environment by dynamic strategic game [J]. Journal of Advanced Transportation, 2022, 10(1): 110.
[16]PENG H,HUANG C,HU X Z, et al. Decision making for connected automated vehicles at urban intersections considering social and individual benefits [J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23: 2254956.
[17]杜筱婧,姚榮涵. 智能網(wǎng)聯(lián)公交車出站強制換道的演化博弈機制 [J]. 吉林大學(xué)學(xué)報(工學(xué)版), 2024, 54(1): 124135.
DU X J,YAO R H. Evolutionary game mechanism of mandatory lane changing for exiting for intelligent connected bus [J]. Journal of Jilin University (Engineering Edition), 2024, 54(1): 124135.
[18]李超然,劉舉勝,宋美,等, 演化博弈視角下的醫(yī)患關(guān)系分析及對策研究 [J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2022, 19(3): 4454.
LI C R,LIU J S,SONG M, et al. Analysis of doctor-patient relationship and countermeasures from the perspective of evolutionary game [J]. Complex Systems and Complexity Science, 2022, 19(3): 4454.
[19]彭偉華,侯仁勇,李光紅. 基于演化博弈的網(wǎng)絡(luò)平臺就業(yè)多元協(xié)同治理研究 [J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2022, 19(2): 916,30.
PENG W H,HOU R Y,LI G H. Research on multiple collaborative governance of network plaCungTJ3Muj8ERkCg6z9s248nG/pitOZCx8q+cVKtXCI=tform employment based on evolutionary game [J]. Complex Systems and Complexity Science, 2022, 19(2): 916,30.
[20]李春發(fā),劉煥星,胡培培. 政府分類規(guī)制、智能平臺賦能與藥企CSR策略演化 [J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2022, 19(2): 1730.
LI C F,LIU H X,HU P P. Government classification regulation, intelligent platform empowerment and CSR strategy evolution of pharmaceutical enterprises [J]. Complex Systems and Complexity Science, 2022, 19(2): 1730.
(責(zé)任編輯 李 進)