李根,翟偉,朱興貝,楊晟,鄔嵐
(南京林業(yè)大學,汽車與交通工程學院,南京210037)
交織區(qū)是高速公路主要的瓶頸路段,而大量的匯合行為是引發(fā)交通流紊亂、造成通行能力下降的主要原因之一。研究高速公路交織區(qū)匯合行為并構(gòu)建準確的匯合模型,不僅能夠提升微觀交通仿真模型的精度,更能夠為輔助駕駛技術(shù)和自動駕駛技術(shù)提供理論支撐。
匯合決策模型由Gipps 提出,該模型是一種基于規(guī)則的模型,結(jié)構(gòu)簡單、易于應用,被廣泛引用于微觀交通流仿真軟件中,但該模型假設條件較多,與實際駕駛行為差異較大[1]。此后國內(nèi)外學者采用效用理論[2]、元胞自動機[3]、馬爾可夫[4]、模糊邏輯[5]等理論對匯合決策行為進行分析和建模。近幾年,不少學者將機器學習、深度學習等算法應用于匯合行為研究中。Xie 等[6]使用深度信念網(wǎng)絡和長短期記憶神經(jīng)網(wǎng)絡建立基于深度學習的數(shù)據(jù)驅(qū)動換道決策模型;楊達等[7]結(jié)合社會力跟馳模型與換道模型建立駕駛員主動換道決策行為模型;谷新平等[8]基于貝葉斯優(yōu)化算法的支持向量機建立換道決策行為模型。但這些研究都是將匯合行為視為一個瞬時決策事件,忽略了長達數(shù)秒的車輛匯合過程。Charisma等[9]開發(fā)了從入口匝道合并的加速決策組合模型,考慮合并計劃選擇、間隙接受、目標間隙選擇對車道變換的影響。Zheng等[10]考慮駕駛員反應時間和最小間距的變化,分析車道變換對駕駛員行為自身的影響,雖然研究本身考慮了反應時間作為研究參量,但并沒有考慮車道變換對周圍車輛的影響,忽略了匯合決策的過程是復雜多變的;孫劍等[11]利用分類回歸樹建立匯合決策模型,考慮不同匯合行為對匯合過程的影響。鄧建華等[12]利用改進雙車道元胞自動機的換道規(guī)則模型,考慮不同空間占有率下不同車道分隔方式對換道行為的影響。但以上研究均未考慮匯合車輛與周圍車輛的碰撞風險,特別是側(cè)向碰撞風險對匯合行為的影響。同時,神經(jīng)網(wǎng)絡等機器學習算法能夠有效提高匯合模型精度,但其“黑箱”特性令研究者無法研究其行為機理;分類回歸樹盡管能夠得到匯合行為規(guī)則,但容易受到數(shù)據(jù)微小波動的影響,從而導致過擬合現(xiàn)象。
梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)是一種基于分類回歸樹的集成算法,通過懲罰系數(shù)等參數(shù)的設置能夠有效防止模型過擬合,同時GBDT繼承了分類回歸樹挖掘數(shù)據(jù)內(nèi)部機理的特性,能夠深入挖掘數(shù)據(jù)的內(nèi)部機理。以往的研究表明GBDT 應用于匯合決策行為研究能夠取得良好的效果[13]。因此,本文采用GBDT的方法對高速公路交織區(qū)匯合車輛的加速度進行研究,深入挖掘各解釋變量與匯合加速度之間的潛在非線性關(guān)系,同時本文引入橫向碰撞時間指標分析側(cè)向碰撞事故風險對匯合行為的影響。
梯度提升決策樹(GBDT)是一種基于樹的集成學習技術(shù),主要采用集成學習boosting 的基本思想,通過迭代一系列可疊加的回歸決策樹模型,在迭代過程中不斷對模型進行優(yōu)化和提升,最終形成一個集成模型。GBDT 在每次迭代時通過最小化損失函數(shù)來逼近真實值,最后將每次迭代建立的決策樹所得結(jié)論累加起來得到最終的預測結(jié)果。
如圖1所示,給定具有N個訓練樣本的數(shù)據(jù)集,其中,xi為訓練樣本的輸入變量,yi為訓練樣本的目標變量,hm為目標變量的基函數(shù),ρm為最佳下降梯度步長,m為第M個決策樹。GBDT 的目標是讓輸入變量xi映射到目標變量yi的損失函數(shù)最小,即
圖1 GBDT集成學習流程圖Fig.1 GBDT integrated learning flow chart
式中:δ為Huber-M 損失函數(shù)的一個參數(shù)。當δ~0時,Huber 損失會趨向于均方誤差(MSE);當δ~∞時,Huber 損失會趨向于平均絕對偏差(MAD)。為了有效估計參數(shù),采用梯度增強的方法,計算每棵樹的負梯度值,即
利用每棵樹的負梯度值作為訓練數(shù)據(jù)進行回歸擬合,將訓練好的M-1 棵樹的預測結(jié)果與第1顆樹進行疊加,即
式中:η為學習率;γJM為第M棵樹第J個葉子節(jié)點的值;nodes per tree(·)為每棵決策樹的結(jié)點;N為訓練樣本數(shù)量。
最后,通過均方誤差(MSE)、平均絕對偏差(MAD)和R值作為模型性能的評價指標,定義為
交織區(qū)指行駛方向相同的兩股或多股交通流在沒有交通控制設施的情況下,沿著相當長的路段進行交叉。根據(jù)道路結(jié)構(gòu)和交叉形式,交織區(qū)一般可以分為A、B、C 這3 種類型。本文主要研究的是A型交織區(qū)路段的匯合行為,采用的數(shù)據(jù)集為美國聯(lián)邦公路局提供的Next Generation Simulation(NGSIM)數(shù)據(jù)。本文選取高速公路US-101 路段上采集的匯合車輛軌跡,該路段全長640 m,包含5條目標車道,1 條輔道以及兩個匝道出入口。本文研究兩個匝道之間的交織區(qū),如圖2所示,該數(shù)據(jù)集采集于2005年6月15日7:50-8:35,包括車輛的加速度、速度、位置、車型、車頭間距、車頭時距等參量,時間精度為0.1 s·frame-1,原始數(shù)據(jù)集每0.1 s提供一個數(shù)據(jù)樣本,本文采用對稱指數(shù)移動平均濾波器(sEMA)對車輛的加速度和速度進行處理,即每1 s 對這些數(shù)據(jù)樣本進行算術(shù)平均,以消除檢測誤差[14]。
如圖2所示,影響交通流匯合加速度的因素主要有匯合車輛與周圍車輛的速度差與距離差,然而匯合過程中匯合車輛難免會和周圍車輛產(chǎn)生交通事故,尤其受到與目標車道領(lǐng)車的影響最大,因此猜想?yún)R合車輛在匯合過程中與目標車道前車是否會發(fā)生側(cè)向碰撞風險,在此考慮將匯合車輛與目標車道前車右車身線的碰撞時間作為影響因素引入模型中,如圖3所示。
圖2 US-101路段以及匯合過程車輛布局Fig.2 US-101 section and vehicle layout in merging process
圖3 影響變量參數(shù)確定Fig.3 Affect variable parameter determination
式中:TC為匯合車輛與目標車道前車右車身線的碰撞時間;ΔX為橫向距離差;Vx為匯合車輛的橫向速度;Ax為匯合車輛當前時刻的加速度。
在匯合過程中,匯合車輛的加速度一般會受到目標車道和輔道車輛的影響,匯合車輛會根據(jù)周圍車輛和自身的相對速度和相對距離對駕駛速度進行調(diào)整。根據(jù)文獻[14-15],本文將駕駛員反應時間定為1 s。表1 為所選取的影響變量的描述以及當前時刻影響變量和1 s后匯合加速度之間的相關(guān)性系數(shù),可以發(fā)現(xiàn),所有影響變量與匯合加速度都存在顯著的相關(guān)性。
表1 匯合加速度與各變量之間的相關(guān)性系數(shù)Table 1 Correlation coefficient between merging acceleration and variables
本文采用美國Salford 公司開發(fā)的數(shù)據(jù)挖掘軟件Salford Predictive Modeler(SPM)建立GBDT 模型,GBDT 模型通過添加決策樹實現(xiàn)減少訓練誤差,這將會導致模型過于接近訓練樣本數(shù)據(jù),出現(xiàn)過擬合現(xiàn)象,為了降低過擬合現(xiàn)象,需選擇最優(yōu)的決策樹數(shù)目,同時,在每一次迭代過程中,需訓練一個弱決策樹來改進模型,通過隨機采樣獲得新的訓練數(shù)據(jù)集和新的特征向量,利用新的訓練數(shù)據(jù)集和新的特征向量進行擬合。因此,在構(gòu)建GBDT模型時,所有決策樹都將被限制為生長到相同大小,GBDT 模型的表現(xiàn)是由學習率η,屬性采樣數(shù)Sa,二次抽樣Sfrd,樹的復雜度J以及決策樹數(shù)目M這5 個參數(shù)決定。為了防止過擬合現(xiàn)象,需選擇最佳參數(shù)組合,本文采用五重交叉驗證,選取NGSIM中的車輛軌跡數(shù)據(jù)對模型進行訓練,將高速公路US101路段上的車輛軌跡數(shù)據(jù)劃分成5個相等的子集,每個子集被用作測試數(shù)據(jù),剩余子集用于訓練模型,將學習率設定為Auto模式,η會根據(jù)樣本數(shù)量隨機定義,取值在[0.00,0.05]可以保證擬合的最佳效果;Sa會根據(jù)隨機采樣獲得新的數(shù)據(jù)集,Sfrd會根據(jù)隨機采樣獲得新的特征向量,新樹會根據(jù)新的數(shù)據(jù)集和新的特征向量進行擬合,本文將其值分別設定為7 和0.6;SPM 軟件可以根據(jù)目標函數(shù)自動確定決策樹數(shù)目M,從而確定取值設置在5000;樹的復雜度J選擇均方誤差(MSE)、平均絕對偏差(MAD)和R2作為評價標準。如表2所示,樹的復雜度反映影響變量之間未知的交互作用,樹的復雜度越高,影響變量之間的交互作用就會越高,同時不僅會降低計算速度,還會降低模型的泛化能力,根據(jù)以往的研究,本文將樹的復雜度設置在10以內(nèi)。
表2 樹復雜度的確定
Table 2 Determination of tree complexity
為獲得最佳參數(shù)組合,決策樹復雜度在10 的時候誤差和偏差值最小,再根據(jù)數(shù)據(jù)集的數(shù)量對模型進行反復測試,最終確定參數(shù)最優(yōu)組合如表3所示。
表3 GBDT參數(shù)設定Table 3 GBDT parameter setting
根據(jù)高速公路US-101路段上獲得的車輛信息及交通流特征,從橫縱向距離差、速度差以及加速度等交通參數(shù)選取10 個候選變量,將1 s 后的匯合加速度作為預測變量構(gòu)建GBDT模型。此外,本文還根據(jù)文獻[16]構(gòu)建了基于視角的刺激-反應模型(VASR)對模型精度進行對比。如表4所示,GBDT模型在兩項評價指標上都優(yōu)于傳統(tǒng)的刺激-反應模型。圖4 選取編號為2990 和10864 的車輛對兩種模型的預測值和實際值進行對比,發(fā)現(xiàn)GBDT模型能夠更好地反應車輛加速度在換道過程中的動態(tài)變化。
圖4 隨機選擇樣車的預測結(jié)果與實際匯合加速度的比較Fig.4 Comparison between predicted results of randomly selected sample cars and actual combined acceleration
表4 不同模型預測精度對比Table 4 Comparison of prediction accuracy of different models
相比于以往研究,本文側(cè)重于考慮匯合車輛匯合過程中的安全性,將匯合車輛與目標車道前車右車身線的碰撞時間TC作為匯合過程的安全評價指標,分析側(cè)向碰撞時間對匯合加速度的影響程度。由表5 可以發(fā)現(xiàn):在引入側(cè)向碰撞時間之后,模型的精度也會有所提升,說明側(cè)向碰撞時間對匯合過程是存在安全影響的,而且該變量的引入能夠讓GBDT模型更加適用于匯合決策執(zhí)行。
表5 GBDT模型不同影響變量精度對比Table 5 Comparison of accuracy of different influencing variables of GBDT model
各影響變量對匯合加速度影響的相對重要性如圖5所示,其中,ΔVPL對匯合加速度的影響最大,TC、VM、ΔYL對匯合加速度也存在顯著的影響,重要性超過了10%。通過影響變量的相對重要性分析可以發(fā)現(xiàn),側(cè)向碰撞時間TC對于匯合加速度的影響占據(jù)著重要的位置,表明側(cè)面碰撞事故風險是匯合車輛駕駛員調(diào)整加速度的重要依據(jù)。
圖5 影響變量的重要性Fig.5 Importance of influencing variables
為了進一步探索影響變量對匯合加速度的影響,建立重要性超過10%的影響變量對匯合加速度的偏效應,如圖6所示,圖中偏效應可以理解為在其他變量取均值并保持不變時,單個影響變量對匯合加速度的影響。
由圖6 可以發(fā)現(xiàn):重要性排在前4 的解釋變量對匯合過程中匯合車輛加速度的影響存在著較強的非線性關(guān)系,匯合車輛與領(lǐng)車之間的速度差呈現(xiàn)較強的負相關(guān),尤其是與目標車道領(lǐng)車的速度差,匯合加速度會隨著速度差的增加而加快下降,當與領(lǐng)車的速度差ΔVPL達到2 m·s-1的時候,匯合車輛才會開始減速;新引入的變量,即側(cè)向碰撞時間TC也是和匯合加速度呈現(xiàn)負相關(guān),但有趣的是在TC值達到30 s的時候,與匯合加速度的偏效應變成了線性的下降趨勢,到70 s 的時候逐漸趨于平緩,說明當匯合車輛與目標車道領(lǐng)車的碰撞時間達到30 s的時候,駕駛員會認為這時候的車輛匯合相對安全從而降低減速的幅度,直到70 s的時候確認安全,將速度變成勻減速,但匯合車輛在匯合過程中依舊處于減速狀態(tài);匯合車輛的速度也對匯合加速度有一定的影響,其中匯合加速度與匯合速度呈現(xiàn)正相關(guān),匯合速度在[6,8]m·s-1處波動較大;相比于前三者,距離差對于加速度的影響相對比較平緩,處于上下波動,但也呈現(xiàn)下降的趨勢,匯合車輛在相距40 m 的時候才會開始減速,在[80,95]m 處會出現(xiàn)減速不穩(wěn)定。
圖6 影響變量對預測結(jié)果的偏效應Fig.6 Partial effect of influencing variables on forecast results
本文利用梯度提升決策樹(GBDT)構(gòu)建交織區(qū)匯合加速度模型,引入側(cè)向碰撞時間TC對模型進行預測和偏效應分析。測試結(jié)果表明:GBDT模型相比于基于視角的刺激-反應模型(VASR),具有較高的預測精度;在所采用的影響變量中,匯合車輛與目標車道領(lǐng)車的速度差ΔVPL對匯合加速度的影響最大,其次是側(cè)向碰撞時間TC;引入側(cè)向碰撞時間TC可以有效優(yōu)化模型的均方誤差(MSE)、平均絕對偏差(MAD)和R2這3個指標值,說明側(cè)面碰撞風險是匯合車輛調(diào)整加速度的重要依據(jù),能夠讓GBDT模型更加準確預測車輛的匯合加速度。