李 根
(東南大學(xué)交通學(xué)院, 南京 210096)
駕駛行為對(duì)交通安全和交通流均有十分重要的影響.跟車行為和換道行為是2種最重要、最基本的駕駛行為.根據(jù)駕駛員的目的,換道行為可以分為自主性換道和強(qiáng)制性換道[1].在高速公路交織區(qū),匝道車輛匯入主線的換道行為是一種典型的強(qiáng)制性換道.匯入行為是引發(fā)瓶頸路段擁堵的原因之一[2],交織區(qū)頻繁的不合理匯入行為會(huì)引發(fā)交通擁堵乃至主線交通流的失效.因此,對(duì)于高速公路交織區(qū)匝道車輛的匯入行為進(jìn)行準(zhǔn)確建模,對(duì)微觀交通流仿真模型的實(shí)現(xiàn)以及道路交通管理措施的提出具有重要意義.
研究者們大多采用臨界間隙模型[3]和離散選擇模型[4-6]來(lái)研究匯入行為.近年來(lái),分類回歸樹(CART)[7]、貝葉斯分類[8]、SVM[9]等數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)的方法也被引入到車輛換道匯入行為的建模之中.與傳統(tǒng)的參數(shù)化模型相比,這類模型能夠深度挖掘變量與匯入行為間的隱性關(guān)系.然而,CART模型的泛化能力較差,容易造成過(guò)擬合現(xiàn)象;采用貝葉斯模型、SVM模型時(shí),交通研究者和管理者難以解釋其變量與匯入行為間的關(guān)系.鑒于此,本文采用梯度提升決策樹(GBDT)對(duì)高速公路交織區(qū)車輛匯入行為進(jìn)行建模,并對(duì)模型進(jìn)行訓(xùn)練和檢驗(yàn).GBDT結(jié)合了Logit模型和數(shù)據(jù)挖掘方法的優(yōu)點(diǎn),能夠深入挖掘變量對(duì)匯入決策行為的影響.
梯度提升決策樹是一種迭代的決策樹算法,其基礎(chǔ)是分類回歸樹算法.GBDT基于Boosting迭代的思想,除了第1棵決策樹采用原始預(yù)測(cè)指標(biāo)生成外,每一輪迭代中的目標(biāo)都是令當(dāng)前學(xué)習(xí)器的損失函數(shù)最小化,即令損失函數(shù)總是沿著其梯度方向下降,通過(guò)不斷迭代使最終殘差趨近于0,將所有樹的結(jié)果累加起來(lái)便可得到最終的預(yù)測(cè)結(jié)果[10-12].
高速公路交織區(qū)車輛匯入行為是一個(gè)典型的二分類模型,匝道車輛通過(guò)對(duì)周邊交通狀態(tài)的評(píng)估來(lái)決定是否匯入主線車道.令y為駕駛員的匯入決策,y=-1表示不匯入,y=1表示匯入;x={x1,x2,…,xK}為匯入行為影響因素組成的K維變量.對(duì)于包含N個(gè)樣本的訓(xùn)練數(shù)據(jù)集T={(x1,y1),(x2,y2),…,(xN,yN)}, GBDT建模過(guò)程如下:
①初始化學(xué)習(xí)器,即
(1)
式中,f0(x)為只有一個(gè)根節(jié)點(diǎn)的初始決策樹;c為使損失函數(shù)最小化的常數(shù);L(yi,c)為損失函數(shù),其中,yi為第i個(gè)訓(xùn)練數(shù)據(jù).
GBDT模型中,對(duì)于二分類問(wèn)題可以采用多種不同的損失函數(shù),如Huber損失函數(shù)、誤差損失函數(shù)等,但對(duì)數(shù)似然損失函數(shù)無(wú)論在計(jì)算還是在最終模型的解釋上都具有優(yōu)勢(shì),因此,一般采用對(duì)數(shù)似然損失函數(shù)作為GBDT模型的損失函數(shù),即
L(y,f(x))=log(1+exp(-yf(x)))
(2)
式中,f(x)為待求解的二分類模型.
②令迭代輪數(shù)m=1,2,…,M,則第i個(gè)訓(xùn)練樣本的負(fù)梯度為
(3)
根據(jù)所有樣本及其負(fù)梯度方向(xi,rmi)(i=1,2,…,N), 得到一棵由J個(gè)葉子節(jié)點(diǎn)組成的決策樹Tm,第j個(gè)葉子節(jié)點(diǎn)區(qū)域?yàn)镽mj(j=1,2,…,J),則各葉子節(jié)點(diǎn)的最佳擬合值為
(4)
本輪得到的學(xué)習(xí)器為
(5)
式中,I為第i個(gè)訓(xùn)練樣本在第j個(gè)葉子節(jié)點(diǎn)區(qū)域的示性函數(shù),且
③經(jīng)過(guò)M輪迭代后,得到最終的決策模型為
(6)
根據(jù)變量在迭代過(guò)程中被選為回歸樹中分裂變量的次數(shù)及其在分裂過(guò)程中對(duì)于模型的提高程度,可以得到每個(gè)變量的重要程度為[12]
(7)
(8)
本文采用美國(guó)聯(lián)邦公路局NGSIM研究項(xiàng)目中提供的車輛軌跡數(shù)據(jù).NGSIM項(xiàng)目的海量軌跡數(shù)據(jù)具有精度高、采樣頻率高、時(shí)間長(zhǎng)等特點(diǎn),常被用于微觀交通流、宏觀交通流、交通行為預(yù)測(cè)、交通仿真等方面的研究,高速公路車輛換道行為分析[5-6]中也采用了這些數(shù)據(jù).選取NGSIM數(shù)據(jù)庫(kù)中的US101高速公路路段作為研究對(duì)象,該路段全長(zhǎng)640 m,包含5條普通車道、1條進(jìn)口匝道、1條出口匝道以及2條匝道之間的附加車道(見圖1).NGSIM提供的軌跡數(shù)據(jù)包括車輛位置、速度、加速度、車型、車頭時(shí)距等,時(shí)間精度為0.1 s/幀[13].本文的研究對(duì)象為進(jìn)口匝道和出口匝道之間的交織區(qū).
圖1 US101線形與采集路段(單位:m)
匝道車輛在附加車道上行駛的過(guò)程中可能會(huì)遇到一個(gè)或者多個(gè)相鄰間隙的選擇,并通過(guò)對(duì)周邊交通狀態(tài)的評(píng)估決定是否接受遇到的相鄰間隙.如果接受,駕駛員將調(diào)整車輛速度和位置以匯入主線;如果不接受(即拒絕間隙),駕駛員將繼續(xù)在附加車道上行駛并尋找合適的間隙.同一輛車只能接受一個(gè)間隙,但可能會(huì)拒絕多個(gè)間隙.將駕駛員在附加車道上拒絕第1個(gè)間隙并選擇超車匯入主線的行為稱為超車匯入;反之,在附加車道上接受第1個(gè)間隙并匯入主線的行為稱為非超車匯入(見圖2).本文將非超車匯入作為一次接受間隙行為.經(jīng)統(tǒng)計(jì),共得到該路段的753組數(shù)據(jù),包括372次接受間隙行為和381次拒絕接受間隙行為.接受間隙事件中有145次非超車匯入.為了測(cè)試GBDT模型的有效性,隨機(jī)選取80%的數(shù)據(jù)(即603組數(shù)據(jù))作為訓(xùn)練數(shù)據(jù),剩下150組數(shù)據(jù)作為測(cè)試數(shù)據(jù).
圖2 超車匯入與非超車匯入示意圖
文獻(xiàn)[5-8]指出,影響車輛匯入行為的因素主要包括主線前后車輛之間的間隙G、匯入車輛的速度V、匯入車輛與主線前后車的相對(duì)速度ΔV1和ΔV1、主線前后車的車型C1和C2等.
以往對(duì)于匯入行為的研究主要存在2個(gè)問(wèn)題:①大多數(shù)研究忽略了車輛在附加車道上拒絕間隙并超越前車的超車行為;②將匯入行為視為一個(gè)即時(shí)的決策行為,忽視了車輛在附加車道上對(duì)主線車輛的觀察歷史和前期決策過(guò)程對(duì)于最終匯入行為決策的影響.為了解決第1個(gè)問(wèn)題,通過(guò)引入一個(gè)新的變量——超車時(shí)間(time-to-overtake, TTO)來(lái)研究車輛在附加車道上拒絕相鄰間隙并超車的行為. TTO定義為保持當(dāng)前車速的情況下匯入車輛超越主線前車達(dá)到前一個(gè)間隙所需要的時(shí)間,即
(9)
式中,T為匯入車輛的超車時(shí)間;YL和VL分別為主線前車的行駛距離和速度;Y和V分別為匯入車輛的行駛距離和速度.
可以看出,TTO與研究交通安全時(shí)所用的距離碰撞時(shí)間(time-to-collision,TTC)類似.不同之處在于,TTO是2輛車處于不同車道上時(shí)后車車頭完全超越前車車身所需要的時(shí)間,而TTC是2輛車處于同一車道上保持當(dāng)前車速發(fā)生碰撞所需要的時(shí)間.
只有當(dāng)匯入車輛速度比主線前車速度快時(shí),匯入車輛才可能超越前車.當(dāng)匯入車輛速度比主線前車小或兩車速度相等時(shí),意味著匯入車輛不可能在保持當(dāng)前車速的情況下超越主線前車,T在此時(shí)應(yīng)為無(wú)窮大.本文將T的最大值取為99 s,當(dāng)T為無(wú)窮大或大于99 s時(shí),全部取為最大值99 s.
為了解決第2個(gè)問(wèn)題,引入?yún)R入車輛在當(dāng)前間隙之前的拒絕間隙數(shù)N以及最大拒絕間隙GLR,以反映匯入車輛之前的超車行為對(duì)于后續(xù)決策行為的影響.其中,對(duì)于非超車匯入或超車匯入的第1個(gè)間隙,GLR=0.
GBDT模型由決策樹數(shù)量M、單棵決策樹葉子數(shù)J以及學(xué)習(xí)效率R三個(gè)參數(shù)決定.本文采用美國(guó)Salford公司開發(fā)的數(shù)據(jù)挖掘軟件Salford Systems建立GBDT模型.參照文獻(xiàn)[11-12]并結(jié)合模型的樣本數(shù)量,將J和R分別設(shè)定為6和0.01.Salford Systems軟件可以根據(jù)目標(biāo)函數(shù)(預(yù)測(cè)結(jié)果誤分率)的最小值自動(dòng)確定最佳決策樹數(shù)量M=352.
采用訓(xùn)練數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,再利用訓(xùn)練好的模型對(duì)測(cè)試數(shù)據(jù)中駕駛員的間隙選擇行為進(jìn)行測(cè)試.結(jié)果顯示:在訓(xùn)練數(shù)據(jù)集中,GBDT模型對(duì)于拒絕間隙和接受間隙的預(yù)測(cè)準(zhǔn)確率分別為94.3%和89.5%;在測(cè)試數(shù)據(jù)集中,GBDT模型對(duì)于拒絕間隙和接受間隙的預(yù)測(cè)準(zhǔn)確率分別為87.8%和86.8%.
引入新變量T,N,GLR前后,利用相同的訓(xùn)練數(shù)據(jù)分別構(gòu)建了GBDT模型、CART模型以及二元Logit模型.然后,利用相同的測(cè)試數(shù)據(jù)對(duì)這3個(gè)模型進(jìn)行測(cè)試,預(yù)測(cè)精度結(jié)果見表1.由表可知,GBDT模型與CART模型在訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)的分類準(zhǔn)確度上均優(yōu)于二元Logit模型,說(shuō)明基于數(shù)據(jù)挖掘的智能算法相比于離散選擇模型能夠更好地預(yù)測(cè)車輛匯入行為.比較GBDT模型與CART模型的結(jié)果發(fā)現(xiàn),引入新變量后,GBDT模型在訓(xùn)練數(shù)據(jù)上的預(yù)測(cè)精度略高于CART模型(約提高2.2%),而測(cè)試數(shù)據(jù)的分類精度則提高了5.3%,說(shuō)明GBDT模型具有更高的預(yù)測(cè)精度和更強(qiáng)的泛化能力.此外,引入新變量T,N,GLR后,3種模型在訓(xùn)練數(shù)據(jù)上的預(yù)測(cè)精度分別提高了3.3%,4.8%和3.0%,在測(cè)試數(shù)據(jù)上的預(yù)測(cè)精度分別提高了6.0%,6.7%和5.3%.由此說(shuō)明,引入新變量后3種模型均能夠更好地預(yù)測(cè)駕駛員的匯入行為.
表 1 不同條件下模型預(yù)測(cè)精度對(duì)比 %
GBDT模型通過(guò)變量出現(xiàn)在決策樹中的次數(shù)來(lái)確定變量在模型中的相對(duì)重要性.高速公路交織區(qū)車輛匯入模型中的變量相對(duì)重要性值見圖3.由圖可知,在GBDT模型中,超車時(shí)間T的重要性值最高,其次為間隙G.拒絕間隙數(shù)N和最大拒絕間隙GLR的重要性值高于前導(dǎo)車、后隨車相對(duì)速度及車型,說(shuō)明N和GLR是影響車輛匯入行為的重要因素.N和GLR反映了駕駛員前期超車行為,其較高的重要性值表明駕駛員在間隙選擇過(guò)程中的超車行為對(duì)于當(dāng)前的決策行為也有重要影響.
圖3 變量相對(duì)重要性值
GBDT模型還可以顯示預(yù)測(cè)模型中各變量對(duì)預(yù)測(cè)結(jié)果的偏效應(yīng).在二分類模型中,GBDT模型可以直接給出預(yù)測(cè)事件的對(duì)數(shù)優(yōu)勢(shì)比與變量之間的偏效應(yīng)關(guān)系.偏效應(yīng)值為正時(shí)表示駕駛員選擇匯入的可能性更大;偏效應(yīng)值為負(fù)時(shí)表示駕駛員選擇不匯入的可能性更大.
圖4顯示了各變量對(duì)預(yù)測(cè)結(jié)果的偏效應(yīng)值.由圖可知,各變量與駕駛員匯入行為間具有高度的非線性關(guān)系.以T為例,當(dāng)T<1.83 s時(shí),T對(duì)于駕駛員匯入行為的偏效應(yīng)值最小且為固定值,此時(shí)T的變化對(duì)駕駛員匯入行為沒有影響;當(dāng)T>2.55 s時(shí),T對(duì)于駕駛員間隙選擇的偏效應(yīng)值由負(fù)值變?yōu)檎?;?dāng)1.83 s≤T≤6.63 s時(shí),隨著T值的增加,駕駛員選擇當(dāng)前間隙的可能性急劇增加;當(dāng)T>6.36 s時(shí),T的變化對(duì)于駕駛員匯入行為幾乎沒有影響.根據(jù)統(tǒng)計(jì),T<1.83 s的數(shù)據(jù)共有220組,其中只有0.45%的駕駛員選擇匯入;T>6.36 s的數(shù)據(jù)共有305組,其中只有14.4%的駕駛員選擇匯入.GBDT模型的分析結(jié)果表明,變量T對(duì)于駕駛員匯入行為的影響具有異質(zhì)性,只有當(dāng)1.83 s≤T≤6.63 s時(shí),T的變化才會(huì)對(duì)駕駛員的匯入行為產(chǎn)生較大影響.
(a) 超車時(shí)間T
(b) 間隙G
(c) 速度V
(d) 輔助車道行駛距離Y
(e) 拒絕間隙數(shù)N
(f) 最大拒絕間隙GLR
(g) 前導(dǎo)車相對(duì)速度ΔV1
(h) 后隨車相對(duì)速度ΔV2
(i) 前導(dǎo)車車型C1
(j) 后隨車車型C2
圖4各變量對(duì)預(yù)測(cè)結(jié)果的偏效應(yīng)值
1) 模型預(yù)測(cè)結(jié)果對(duì)比表明,引入新變量T,N,GLR前后,GBDT模型對(duì)匯入行為的預(yù)測(cè)準(zhǔn)確率均優(yōu)于CART模型和二元Logit模型.
2) 引入新變量T,N,GLR后,GBDT,CART和二元Logit模型的預(yù)測(cè)精度均有顯著提高.
3) GBDT模型中,超車時(shí)間T的相對(duì)重要性值最高,其次為間隙G;拒絕間隙數(shù)N和最大拒絕間隙GLR也是影響車輛匯入行為的重要因素.
4) 變量對(duì)預(yù)測(cè)結(jié)果的偏效應(yīng)分析表明,采用GBDT模型可以準(zhǔn)確獲得變量與匯入行為間隱藏的非線性關(guān)系以及駕駛員在匯入行為中的異質(zhì)性.
后續(xù)研究中將采集更多不同地點(diǎn)的數(shù)據(jù)對(duì)模型進(jìn)行比較和驗(yàn)證,進(jìn)一步分析引發(fā)各變量變化的原因,同時(shí)考慮將駕駛員的個(gè)體差異性引入模型中,從而進(jìn)一步提高模型精度.
參考文獻(xiàn)(References)
[1] 張?jiān)? 基于Stackelberg博弈理論的自主性車道變換模型[J]. 交通運(yùn)輸系統(tǒng)工程與信息, 2014, 14(5):67-73. DOI: 10.3969/j.issn.1009-6744.2014.05.010.
Zhang Yuanliang. Discretionary lane changing modeling based on Stackelberg game theory[J].JournalofTransportationSystemsEngineeringandInformationTechnology, 2014,14(5):67-73. DOI: 10.3969/j.issn.1009-6744.2014.05.010.(in Chinese)
[2] Sarvi M, Kuwahara M. Microsimulation of freeway ramp merging processes under congested traffic conditions[J].IEEETransactionsonIntelligentTransportationSystems, 2007,8(3): 470-479. DOI:10.1109/tits.2007.895305.
[3] Toledo T,Koutsopoulos H N, Ben-Akiva M. Estimation of an integrated driving behavior model[J].TransportationResearchPartC:EmergingTechnologies, 2009,17(4): 365-380. DOI:10.1016/j.trc.2009.01.005.
[4] Marczak F, Daamen W, Buisson C. Merging behaviour: Empirical comparison between two sites and new theory development[J].TransportationResearchPartC:EmergingTechnologies, 2013,36: 530-546. DOI:10.1016/j.trc.2013.07.007.
[5] Wan X, Jin P J, Yang F, et al. Merging preparation behavior of drivers: How they choose and approach their merge positions at a congested weaving area[J].JournalofTransportationEngineering, 2016,142(9): 05016005. DOI:10.1061/(asce)te.1943-5436.0000864.
[6] Wan X, Jin P J,Gu H, et al. Modeling freeway merging in a weaving section as a sequential decision-making process[J].JournalofTransportationEngineeringPartA:Systems, 2017,143(5): 05017002. DOI:10.1061/jtepbs.0000048.
[7] Meng Q, Weng J. Classification and regression tree approach for predicting drivers’ merging behavior in short-term work zone merging areas[J].JournalofTransportationEngineering, 2012,138(8): 1062-1070. DOI:10.1061/(asce)te.1943-5436.0000412.
[8] 邱小平, 劉亞龍, 馬麗娜, 等. 基于貝葉斯網(wǎng)絡(luò)的車輛換道模型[J]. 交通運(yùn)輸系統(tǒng)工程與信息, 2015, 15(5): 67-73,95. DOI: 10.3969/j.issn.1009-6744.2015.05.010.
Qiu Xiaoping, Liu Yalong, Ma Lina, et al. A lane change model based on Bayesian networks[J].JournalofTransportationSystemsEngineeringandInformationTechnology, 2015,15(5):67-73,95. DOI: 10.3969/j.issn.1009-6744.2015.05.010. (in Chinese)
[9] Wang E G, Sun J, Jiang S, et al. Modeling the various merging behaviors at expressway on-ramp bottlenecks using support vector machine models[J].TransportationResearchProcedia, 2017,25: 1327-1341. DOI:10.1016/j.trpro.2017.05.157.
[10] Ahmed M, Abdel-Aty M. Application of stochastic gradient boosting technique to enhance reliability of real-time risk assessment: Use of automatic vehicle identification and remote traffic microwave sensor data[J].TransportationResearchRecord:JournaloftheTransportationResearchBoard, 2013,2386: 26-34. DOI:10.3141/2386-04.
[11] Friedman J H. Stochastic gradient boosting[J].ComputationalStatistics&DataAnalysis, 2002,38(4): 367-378. DOI:10.1016/s0167-9473(01)00065-2.
[12] Friedman J H, Meulman J J. Multiple additive regression trees with application in epidemiology[J].StatMed, 2003,22(9): 1365-1381. DOI:10.1002/sim.1501.
[13] Alexiadis V, Colyar J, Halkias J, et al. The next generation simulation program[J].InstituteofTransportationEngineers, 2004,74(8): 22-26.