基于梯度提升決策樹的高速公路交織區(qū)匯入模型

2018-06-12 11:38:16李根

東南大學(xué)學(xué)報(bào)(自然科學(xué)版) 2018年3期

李根

(東南大學(xué)交通學(xué)院，南京 210096)

駕駛行為對(duì)交通安全和交通流均有十分重要的影響.跟車行為和換道行為是2種最重要、最基本的駕駛行為.根據(jù)駕駛員的目的，換道行為可以分為自主性換道和強(qiáng)制性換道[1].在高速公路交織區(qū)，匝道車輛匯入主線的換道行為是一種典型的強(qiáng)制性換道.匯入行為是引發(fā)瓶頸路段擁堵的原因之一[2]，交織區(qū)頻繁的不合理匯入行為會(huì)引發(fā)交通擁堵乃至主線交通流的失效.因此，對(duì)于高速公路交織區(qū)匝道車輛的匯入行為進(jìn)行準(zhǔn)確建模，對(duì)微觀交通流仿真模型的實(shí)現(xiàn)以及道路交通管理措施的提出具有重要意義.

研究者們大多采用臨界間隙模型[3]和離散選擇模型[4-6]來(lái)研究匯入行為.近年來(lái)，分類回歸樹(CART)[7]、貝葉斯分類[8]、SVM[9]等數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)的方法也被引入到車輛換道匯入行為的建模之中.與傳統(tǒng)的參數(shù)化模型相比，這類模型能夠深度挖掘變量與匯入行為間的隱性關(guān)系.然而，CART模型的泛化能力較差，容易造成過(guò)擬合現(xiàn)象；采用貝葉斯模型、SVM模型時(shí)，交通研究者和管理者難以解釋其變量與匯入行為間的關(guān)系.鑒于此，本文采用梯度提升決策樹(GBDT)對(duì)高速公路交織區(qū)車輛匯入行為進(jìn)行建模，并對(duì)模型進(jìn)行訓(xùn)練和檢驗(yàn).GBDT結(jié)合了Logit模型和數(shù)據(jù)挖掘方法的優(yōu)點(diǎn)，能夠深入挖掘變量對(duì)匯入決策行為的影響.

1 基于梯度提升決策樹的匯入模型

梯度提升決策樹是一種迭代的決策樹算法，其基礎(chǔ)是分類回歸樹算法.GBDT基于Boosting迭代的思想，除了第1棵決策樹采用原始預(yù)測(cè)指標(biāo)生成外，每一輪迭代中的目標(biāo)都是令當(dāng)前學(xué)習(xí)器的損失函數(shù)最小化，即令損失函數(shù)總是沿著其梯度方向下降，通過(guò)不斷迭代使最終殘差趨近于0，將所有樹的結(jié)果累加起來(lái)便可得到最終的預(yù)測(cè)結(jié)果[10-12].

高速公路交織區(qū)車輛匯入行為是一個(gè)典型的二分類模型，匝道車輛通過(guò)對(duì)周邊交通狀態(tài)的評(píng)估來(lái)決定是否匯入主線車道.令y為駕駛員的匯入決策，y=-1表示不匯入，y=1表示匯入；x={x1,x2,…,xK}為匯入行為影響因素組成的K維變量.對(duì)于包含N個(gè)樣本的訓(xùn)練數(shù)據(jù)集T={(x1,y1),(x2,y2),…,(xN,yN)}, GBDT建模過(guò)程如下：

①初始化學(xué)習(xí)器，即

(1)

式中，f0(x)為只有一個(gè)根節(jié)點(diǎn)的初始決策樹；c為使損失函數(shù)最小化的常數(shù)；L(yi,c)為損失函數(shù)，其中，yi為第i個(gè)訓(xùn)練數(shù)據(jù).

GBDT模型中，對(duì)于二分類問(wèn)題可以采用多種不同的損失函數(shù)，如Huber損失函數(shù)、誤差損失函數(shù)等，但對(duì)數(shù)似然損失函數(shù)無(wú)論在計(jì)算還是在最終模型的解釋上都具有優(yōu)勢(shì)，因此，一般采用對(duì)數(shù)似然損失函數(shù)作為GBDT模型的損失函數(shù)，即

L(y,f(x))=log(1+exp(-yf(x)))

(2)

式中，f(x)為待求解的二分類模型.

②令迭代輪數(shù)m=1,2,…，M，則第i個(gè)訓(xùn)練樣本的負(fù)梯度為

(3)

根據(jù)所有樣本及其負(fù)梯度方向(xi,rmi)(i=1,2,…，N), 得到一棵由J個(gè)葉子節(jié)點(diǎn)組成的決策樹Tm，第j個(gè)葉子節(jié)點(diǎn)區(qū)域?yàn)镽mj(j=1,2,…，J)，則各葉子節(jié)點(diǎn)的最佳擬合值為

(4)

本輪得到的學(xué)習(xí)器為

(5)

式中，I為第i個(gè)訓(xùn)練樣本在第j個(gè)葉子節(jié)點(diǎn)區(qū)域的示性函數(shù)，且

③經(jīng)過(guò)M輪迭代后，得到最終的決策模型為

(6)

根據(jù)變量在迭代過(guò)程中被選為回歸樹中分裂變量的次數(shù)及其在分裂過(guò)程中對(duì)于模型的提高程度，可以得到每個(gè)變量的重要程度為[12]

(7)

(8)

2 研究路段和數(shù)據(jù)

本文采用美國(guó)聯(lián)邦公路局NGSIM研究項(xiàng)目中提供的車輛軌跡數(shù)據(jù).NGSIM項(xiàng)目的海量軌跡數(shù)據(jù)具有精度高、采樣頻率高、時(shí)間長(zhǎng)等特點(diǎn)，常被用于微觀交通流、宏觀交通流、交通行為預(yù)測(cè)、交通仿真等方面的研究，高速公路車輛換道行為分析[5-6]中也采用了這些數(shù)據(jù).選取NGSIM數(shù)據(jù)庫(kù)中的US101高速公路路段作為研究對(duì)象，該路段全長(zhǎng)640 m，包含5條普通車道、1條進(jìn)口匝道、1條出口匝道以及2條匝道之間的附加車道(見圖1).NGSIM提供的軌跡數(shù)據(jù)包括車輛位置、速度、加速度、車型、車頭時(shí)距等，時(shí)間精度為0.1 s/幀[13].本文的研究對(duì)象為進(jìn)口匝道和出口匝道之間的交織區(qū).

圖1 US101線形與采集路段(單位：m)

匝道車輛在附加車道上行駛的過(guò)程中可能會(huì)遇到一個(gè)或者多個(gè)相鄰間隙的選擇，并通過(guò)對(duì)周邊交通狀態(tài)的評(píng)估決定是否接受遇到的相鄰間隙.如果接受，駕駛員將調(diào)整車輛速度和位置以匯入主線；如果不接受(即拒絕間隙)，駕駛員將繼續(xù)在附加車道上行駛并尋找合適的間隙.同一輛車只能接受一個(gè)間隙，但可能會(huì)拒絕多個(gè)間隙.將駕駛員在附加車道上拒絕第1個(gè)間隙并選擇超車匯入主線的行為稱為超車匯入；反之，在附加車道上接受第1個(gè)間隙并匯入主線的行為稱為非超車匯入(見圖2).本文將非超車匯入作為一次接受間隙行為.經(jīng)統(tǒng)計(jì)，共得到該路段的753組數(shù)據(jù)，包括372次接受間隙行為和381次拒絕接受間隙行為.接受間隙事件中有145次非超車匯入.為了測(cè)試GBDT模型的有效性，隨機(jī)選取80%的數(shù)據(jù)(即603組數(shù)據(jù))作為訓(xùn)練數(shù)據(jù)，剩下150組數(shù)據(jù)作為測(cè)試數(shù)據(jù).

圖2 超車匯入與非超車匯入示意圖

3 匯入模型建立與驗(yàn)證

3.1 變量選取

文獻(xiàn)[5-8]指出，影響車輛匯入行為的因素主要包括主線前后車輛之間的間隙G、匯入車輛的速度V、匯入車輛與主線前后車的相對(duì)速度ΔV1和ΔV1、主線前后車的車型C1和C2等.

以往對(duì)于匯入行為的研究主要存在2個(gè)問(wèn)題：①大多數(shù)研究忽略了車輛在附加車道上拒絕間隙并超越前車的超車行為；②將匯入行為視為一個(gè)即時(shí)的決策行為，忽視了車輛在附加車道上對(duì)主線車輛的觀察歷史和前期決策過(guò)程對(duì)于最終匯入行為決策的影響.為了解決第1個(gè)問(wèn)題，通過(guò)引入一個(gè)新的變量——超車時(shí)間(time-to-overtake, TTO)來(lái)研究車輛在附加車道上拒絕相鄰間隙并超車的行為. TTO定義為保持當(dāng)前車速的情況下匯入車輛超越主線前車達(dá)到前一個(gè)間隙所需要的時(shí)間，即

(9)

式中，T為匯入車輛的超車時(shí)間；YL和VL分別為主線前車的行駛距離和速度；Y和V分別為匯入車輛的行駛距離和速度.

可以看出，TTO與研究交通安全時(shí)所用的距離碰撞時(shí)間(time-to-collision，TTC)類似.不同之處在于，TTO是2輛車處于不同車道上時(shí)后車車頭完全超越前車車身所需要的時(shí)間，而TTC是2輛車處于同一車道上保持當(dāng)前車速發(fā)生碰撞所需要的時(shí)間.

只有當(dāng)匯入車輛速度比主線前車速度快時(shí)，匯入車輛才可能超越前車.當(dāng)匯入車輛速度比主線前車小或兩車速度相等時(shí)，意味著匯入車輛不可能在保持當(dāng)前車速的情況下超越主線前車，T在此時(shí)應(yīng)為無(wú)窮大.本文將T的最大值取為99 s，當(dāng)T為無(wú)窮大或大于99 s時(shí)，全部取為最大值99 s.

為了解決第2個(gè)問(wèn)題，引入?yún)R入車輛在當(dāng)前間隙之前的拒絕間隙數(shù)N以及最大拒絕間隙GLR，以反映匯入車輛之前的超車行為對(duì)于后續(xù)決策行為的影響.其中，對(duì)于非超車匯入或超車匯入的第1個(gè)間隙，GLR=0.

3.2 模型結(jié)果與驗(yàn)證

GBDT模型由決策樹數(shù)量M、單棵決策樹葉子數(shù)J以及學(xué)習(xí)效率R三個(gè)參數(shù)決定.本文采用美國(guó)Salford公司開發(fā)的數(shù)據(jù)挖掘軟件Salford Systems建立GBDT模型.參照文獻(xiàn)[11-12]并結(jié)合模型的樣本數(shù)量，將J和R分別設(shè)定為6和0.01.Salford Systems軟件可以根據(jù)目標(biāo)函數(shù)(預(yù)測(cè)結(jié)果誤分率)的最小值自動(dòng)確定最佳決策樹數(shù)量M=352.

采用訓(xùn)練數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練，再利用訓(xùn)練好的模型對(duì)測(cè)試數(shù)據(jù)中駕駛員的間隙選擇行為進(jìn)行測(cè)試.結(jié)果顯示：在訓(xùn)練數(shù)據(jù)集中，GBDT模型對(duì)于拒絕間隙和接受間隙的預(yù)測(cè)準(zhǔn)確率分別為94.3%和89.5%；在測(cè)試數(shù)據(jù)集中，GBDT模型對(duì)于拒絕間隙和接受間隙的預(yù)測(cè)準(zhǔn)確率分別為87.8%和86.8%.

引入新變量T,N,GLR前后，利用相同的訓(xùn)練數(shù)據(jù)分別構(gòu)建了GBDT模型、CART模型以及二元Logit模型.然后，利用相同的測(cè)試數(shù)據(jù)對(duì)這3個(gè)模型進(jìn)行測(cè)試，預(yù)測(cè)精度結(jié)果見表1.由表可知，GBDT模型與CART模型在訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)的分類準(zhǔn)確度上均優(yōu)于二元Logit模型，說(shuō)明基于數(shù)據(jù)挖掘的智能算法相比于離散選擇模型能夠更好地預(yù)測(cè)車輛匯入行為.比較GBDT模型與CART模型的結(jié)果發(fā)現(xiàn)，引入新變量后，GBDT模型在訓(xùn)練數(shù)據(jù)上的預(yù)測(cè)精度略高于CART模型(約提高2.2%)，而測(cè)試數(shù)據(jù)的分類精度則提高了5.3%，說(shuō)明GBDT模型具有更高的預(yù)測(cè)精度和更強(qiáng)的泛化能力.此外，引入新變量T,N,GLR后，3種模型在訓(xùn)練數(shù)據(jù)上的預(yù)測(cè)精度分別提高了3.3%，4.8%和3.0%，在測(cè)試數(shù)據(jù)上的預(yù)測(cè)精度分別提高了6.0%，6.7%和5.3%.由此說(shuō)明，引入新變量后3種模型均能夠更好地預(yù)測(cè)駕駛員的匯入行為.

表 1 不同條件下模型預(yù)測(cè)精度對(duì)比 %

3.3 變量分析

GBDT模型通過(guò)變量出現(xiàn)在決策樹中的次數(shù)來(lái)確定變量在模型中的相對(duì)重要性.高速公路交織區(qū)車輛匯入模型中的變量相對(duì)重要性值見圖3.由圖可知，在GBDT模型中，超車時(shí)間T的重要性值最高，其次為間隙G.拒絕間隙數(shù)N和最大拒絕間隙GLR的重要性值高于前導(dǎo)車、后隨車相對(duì)速度及車型，說(shuō)明N和GLR是影響車輛匯入行為的重要因素.N和GLR反映了駕駛員前期超車行為，其較高的重要性值表明駕駛員在間隙選擇過(guò)程中的超車行為對(duì)于當(dāng)前的決策行為也有重要影響.

圖3 變量相對(duì)重要性值

GBDT模型還可以顯示預(yù)測(cè)模型中各變量對(duì)預(yù)測(cè)結(jié)果的偏效應(yīng).在二分類模型中，GBDT模型可以直接給出預(yù)測(cè)事件的對(duì)數(shù)優(yōu)勢(shì)比與變量之間的偏效應(yīng)關(guān)系.偏效應(yīng)值為正時(shí)表示駕駛員選擇匯入的可能性更大；偏效應(yīng)值為負(fù)時(shí)表示駕駛員選擇不匯入的可能性更大.

圖4顯示了各變量對(duì)預(yù)測(cè)結(jié)果的偏效應(yīng)值.由圖可知，各變量與駕駛員匯入行為間具有高度的非線性關(guān)系.以T為例，當(dāng)T<1.83 s時(shí)，T對(duì)于駕駛員匯入行為的偏效應(yīng)值最小且為固定值，此時(shí)T的變化對(duì)駕駛員匯入行為沒有影響；當(dāng)T>2.55 s時(shí)，T對(duì)于駕駛員間隙選擇的偏效應(yīng)值由負(fù)值變?yōu)檎?；?dāng)1.83 s≤T≤6.63 s時(shí)，隨著T值的增加，駕駛員選擇當(dāng)前間隙的可能性急劇增加；當(dāng)T>6.36 s時(shí)，T的變化對(duì)于駕駛員匯入行為幾乎沒有影響.根據(jù)統(tǒng)計(jì)，T<1.83 s的數(shù)據(jù)共有220組，其中只有0.45%的駕駛員選擇匯入；T>6.36 s的數(shù)據(jù)共有305組，其中只有14.4%的駕駛員選擇匯入.GBDT模型的分析結(jié)果表明，變量T對(duì)于駕駛員匯入行為的影響具有異質(zhì)性，只有當(dāng)1.83 s≤T≤6.63 s時(shí)，T的變化才會(huì)對(duì)駕駛員的匯入行為產(chǎn)生較大影響.

(a) 超車時(shí)間T

(b) 間隙G

(d) 輔助車道行駛距離Y

(e) 拒絕間隙數(shù)N

(f) 最大拒絕間隙GLR

(g) 前導(dǎo)車相對(duì)速度ΔV1

(h) 后隨車相對(duì)速度ΔV2

(i) 前導(dǎo)車車型C1

(j) 后隨車車型C2

圖4各變量對(duì)預(yù)測(cè)結(jié)果的偏效應(yīng)值

4 結(jié)論

1) 模型預(yù)測(cè)結(jié)果對(duì)比表明，引入新變量T,N,GLR前后，GBDT模型對(duì)匯入行為的預(yù)測(cè)準(zhǔn)確率均優(yōu)于CART模型和二元Logit模型.

2) 引入新變量T,N,GLR后，GBDT，CART和二元Logit模型的預(yù)測(cè)精度均有顯著提高.

3) GBDT模型中，超車時(shí)間T的相對(duì)重要性值最高，其次為間隙G；拒絕間隙數(shù)N和最大拒絕間隙GLR也是影響車輛匯入行為的重要因素.

4) 變量對(duì)預(yù)測(cè)結(jié)果的偏效應(yīng)分析表明，采用GBDT模型可以準(zhǔn)確獲得變量與匯入行為間隱藏的非線性關(guān)系以及駕駛員在匯入行為中的異質(zhì)性.

后續(xù)研究中將采集更多不同地點(diǎn)的數(shù)據(jù)對(duì)模型進(jìn)行比較和驗(yàn)證，進(jìn)一步分析引發(fā)各變量變化的原因，同時(shí)考慮將駕駛員的個(gè)體差異性引入模型中，從而進(jìn)一步提高模型精度.

參考文獻(xiàn)(References)

[1] 張?jiān)? 基于Stackelberg博弈理論的自主性車道變換模型[J]. 交通運(yùn)輸系統(tǒng)工程與信息, 2014, 14(5):67-73. DOI: 10.3969/j.issn.1009-6744.2014.05.010.

Zhang Yuanliang. Discretionary lane changing modeling based on Stackelberg game theory[J].JournalofTransportationSystemsEngineeringandInformationTechnology, 2014,14(5):67-73. DOI: 10.3969/j.issn.1009-6744.2014.05.010.(in Chinese)

[2] Sarvi M, Kuwahara M. Microsimulation of freeway ramp merging processes under congested traffic conditions[J].IEEETransactionsonIntelligentTransportationSystems, 2007,8(3): 470-479. DOI:10.1109/tits.2007.895305.

[3] Toledo T,Koutsopoulos H N, Ben-Akiva M. Estimation of an integrated driving behavior model[J].TransportationResearchPartC:EmergingTechnologies, 2009,17(4): 365-380. DOI:10.1016/j.trc.2009.01.005.

[4] Marczak F, Daamen W, Buisson C. Merging behaviour: Empirical comparison between two sites and new theory development[J].TransportationResearchPartC:EmergingTechnologies, 2013,36: 530-546. DOI:10.1016/j.trc.2013.07.007.

[5] Wan X, Jin P J, Yang F, et al. Merging preparation behavior of drivers: How they choose and approach their merge positions at a congested weaving area[J].JournalofTransportationEngineering, 2016,142(9): 05016005. DOI:10.1061/(asce)te.1943-5436.0000864.

[6] Wan X, Jin P J,Gu H, et al. Modeling freeway merging in a weaving section as a sequential decision-making process[J].JournalofTransportationEngineeringPartA:Systems, 2017,143(5): 05017002. DOI:10.1061/jtepbs.0000048.

[7] Meng Q, Weng J. Classification and regression tree approach for predicting drivers’ merging behavior in short-term work zone merging areas[J].JournalofTransportationEngineering, 2012,138(8): 1062-1070. DOI:10.1061/(asce)te.1943-5436.0000412.

[8] 邱小平, 劉亞龍, 馬麗娜, 等. 基于貝葉斯網(wǎng)絡(luò)的車輛換道模型[J]. 交通運(yùn)輸系統(tǒng)工程與信息, 2015, 15(5): 67-73,95. DOI: 10.3969/j.issn.1009-6744.2015.05.010.

Qiu Xiaoping, Liu Yalong, Ma Lina, et al. A lane change model based on Bayesian networks[J].JournalofTransportationSystemsEngineeringandInformationTechnology, 2015,15(5):67-73,95. DOI: 10.3969/j.issn.1009-6744.2015.05.010. (in Chinese)

[9] Wang E G, Sun J, Jiang S, et al. Modeling the various merging behaviors at expressway on-ramp bottlenecks using support vector machine models[J].TransportationResearchProcedia, 2017,25: 1327-1341. DOI:10.1016/j.trpro.2017.05.157.

[10] Ahmed M, Abdel-Aty M. Application of stochastic gradient boosting technique to enhance reliability of real-time risk assessment: Use of automatic vehicle identification and remote traffic microwave sensor data[J].TransportationResearchRecord:JournaloftheTransportationResearchBoard, 2013,2386: 26-34. DOI:10.3141/2386-04.

[11] Friedman J H. Stochastic gradient boosting[J].ComputationalStatistics&DataAnalysis, 2002,38(4): 367-378. DOI:10.1016/s0167-9473(01)00065-2.

[12] Friedman J H, Meulman J J. Multiple additive regression trees with application in epidemiology[J].StatMed, 2003,22(9): 1365-1381. DOI:10.1002/sim.1501.

[13] Alexiadis V, Colyar J, Halkias J, et al. The next generation simulation program[J].InstituteofTransportationEngineers, 2004,74(8): 22-26.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡