張海倫,付 銳
(長安大學汽車學院,西安710064)
相鄰前車的駕駛行為(換道/切入)對后車的行駛安全產(chǎn)生較大影響[1].據(jù)統(tǒng)計,大量的交通事故都是由駕駛人的誤判或誤操作引起,這些事故中較多是發(fā)生在換道過程[2].此外,在換道過程中,國內(nèi)外轉向燈開啟率普遍較低,這對后車的安全行駛形成挑戰(zhàn).因此,先進駕駛輔助系統(tǒng)(ADAS)需對相鄰前車的駕駛行為進行識別并預測其駕駛意圖,以便提前對本車進行預警,同時為預測前車行駛軌跡提供支持.
國內(nèi)外學者對駕駛行為和意圖并未進行嚴格區(qū)別.駕駛行為識別是指換道、超車等駕駛行為已經(jīng)發(fā)生,并在行為過程的早期階段進行準確識別;駕駛意圖預測是指駕駛行為并未發(fā)生,需根據(jù)周圍環(huán)境信息或駕駛人視覺信息預測車輛未來的行為.
近年來,機器學習方法在駕駛人行為識別領域應用較為廣泛,深度學習方法在語音識別、圖像分類等領域同樣取得較大突破.劉志強等[3]以駕駛人注視參數(shù)和車路參數(shù)作為指標,設計了基于HMM和SVM的級聯(lián)算法.祝儷菱等[4]提出基于支持向量機的駕駛行為識別方法,測試結果表明識別效果較好.倪捷等[5]建立了一種基于模糊神經(jīng)網(wǎng)絡的駕駛人換道意圖識別模型.深度學習方法在處理時序問題時具有較強的泛化能力.駕駛行為亦是一種時變、連續(xù)過程.因此,采用深度學習方法預測駕駛意圖受到越來越多學者的關注,Alex Zyner等[6]采用循環(huán)神經(jīng)網(wǎng)絡方法推斷車輛在穿過無信號燈交叉路口時的意圖.針對RNN 方法的梯度缺陷,文獻[7]以駕駛人頭部運動姿態(tài)作為參考特征,構建RNN-LSTM框架預測駕駛行為.
以上研究大多是針對本車駕駛行為的識別,其結果不能直接應用于前方車輛換道行為識別.本文受語音識別的啟發(fā)[8],基于隱馬爾可夫模型(Hidden Markov Model,HMM)和長短時記憶網(wǎng)絡(Long Short Term Memory,LSTM),分別設計雙層連續(xù)隱馬爾可夫模型—貝葉斯生成分類器(Two Layer Continuous Hidden Markov Model-Bayesian Generation Classifier,CHMM-BGC),以及雙向長短時記憶(Bi-directional Long Short Time Memory Network,Bi-LSTM)網(wǎng)絡的行為識別模型識別相鄰前車換道行為并預測其換道意圖,所需的信號可由本車上安裝的傳感器獲取.采用NGSIM 自然駕駛數(shù)據(jù)對兩種行為識別模型的識別率及預測性進行驗證.
傳統(tǒng)語音識別過程通過對語音庫中的每個單詞波形進行參數(shù)提取,得到語音向量,基于機器學習方法或深度學習方法學習訓練模型M.對觀測輸入序列進行特征提取獲得特征向量序列,解碼得到最終識別結果,如圖1所示,其中wordn表示語音庫中的第n個單詞.
圖1 語音識別系統(tǒng)框架Fig.1 Speech recognition system framework
以語音識別框架為例,將前車行為(換道、保持)對應為不同的語音單詞,由于相鄰前車的運動信息和周圍環(huán)境車輛的運動信息同為連續(xù)的時變過程,以不同長度的單詞,對應不同駕駛風格的駕駛人換道持續(xù)過程不同,因此采用語音識別模型可以較好地應用于識別前車的換道行為.圖2為換道過程和車道保持過程場景示意圖,其中車輛R為本車,車輛T 為相鄰前方車輛,RF 為本車的前車,TF為相鄰前車的前車.
圖2 換道和車道保持場景Fig.2 Lane change and lane keep
不同的駕駛行為是由駕駛人與周圍環(huán)境交互后產(chǎn)生,因此環(huán)境信息可以對駕駛人的行為和意圖產(chǎn)生影響.為了識別并預測車輛T的駕駛行為和意圖,模型的輸入分別為
式中:為行為識別模型的輸入;為意圖預測模型的輸入;t為時間;為車輛T 的運動信息;為周圍環(huán)境信息.T 車的運動信息和與周圍環(huán)境的相對運動信息為
式中:為車輛T的絕對速度;為車輛T的橫向速度;為車輛T 的加速度;為車輛T 的橫向位移;為車輛T 與本車R 的相對距離為車輛T 與本車R 的相對速度;為車輛T 與車輛RF 的相對距離;為車輛T 與車輛RF 的相對速度;為車輛T與車輛TF的相對距離;為車輛T與車輛TF的相對速度.
HMM 由馬爾科夫鏈生成不可觀測的狀態(tài)隨機序列和一個觀測隨機序列過程組成,可對任意長度的時間序列進行建模.雙層CHMM-BGC算法結構如圖3所示,其中,ask,sk狀態(tài)轉移概率,Sk為狀態(tài)的集合.
圖3 雙層CHMM-BGC 行為識別算法結構Fig.3 Structure of two-layer CHMM-BGC behavior recognition algorithm
高斯混合模型(GMM)可對連續(xù)觀測序列進行概率建模,由多個高斯分布疊加構成.概率分布模型為
式中:αk是系數(shù),為第k個高斯分布密度,θk為第k個模型參數(shù),θk=(μk,σ2k),μk,σ2k分別為高斯分布的均值和方差;y為觀測數(shù)據(jù);K為模型數(shù)量.采用EM 算法估計高斯混合模型的參數(shù)θk.
本文采用的隱馬爾可夫模型為從左至右結構,模型參數(shù)可表示為
式中:A表示狀態(tài)轉移概率矩陣,A=[aij]N×N,aij表示狀態(tài)qi到狀態(tài)qj的轉移概率,N表示可能的狀態(tài)數(shù);B表示觀測概率矩陣,B=[bj(k)]M×N,bj(k)表示在狀態(tài)qj時的觀測vk的概率,M表示可能的觀測數(shù);π為初始狀態(tài)概率向量,π=(πi),πi表示在初始時刻狀態(tài)qi的概率.
令M表示分類數(shù),wi為各類別,p(wi)為各類別的先驗概率,p(X|wi)為類條件密度,X為樣本.類條件密度模型為隱馬爾可夫模型,先驗概率p(wi)通過極大似然估計法得到,通過貝葉斯公式計算待測樣本屬于各類別的概率,輸出類別的概率最大者為最終分類結果.
LSTM網(wǎng)絡通過門結構特征解決了梯度消失或爆炸的問題,可以實現(xiàn)對任意時間序列進行建模并識別[7],同時考慮了時間序列前后時刻的關聯(lián),狀態(tài)從前往后傳遞,即當前狀態(tài)只能通過過去的狀態(tài)和當前的輸入才能獲取,解決了長期依賴問題,而Bi-LSTM網(wǎng)絡從序列的兩端出發(fā),考慮了反向時序的影響,模型泛化能力增強,LSTM算法為
式中:為當前時刻輸入向量;為系統(tǒng)遺忘門輸出;表示單元內(nèi)狀態(tài)更新;表示當前時刻輸入門值;為當前時刻的輸出;為上一時刻的輸出;q(iτ)為輸出門;分別為遺忘門的輸入偏置,輸入權重和循環(huán)權重;分別為輸入門的輸入偏置,輸入權重和循環(huán)權重;分別為輸出門的輸入偏置,輸入權重和循環(huán)權重;σ為sigmoid 激活函數(shù);tanh 為雙曲正切函數(shù);i,j為細胞數(shù),i,j=1,2,…,n;τ為時刻.基于Bi-LSTM網(wǎng)絡的行為識別模型結構如圖4所示,其中x(τ)、h(τ)和s(τ)分別為LSTM單元在τ時刻的輸 入、輸出和狀態(tài)更新,h(τ-1)和s(τ-1)分 別 為LSTM單元在上一時刻輸入和狀態(tài)更新
圖4 基于Bi-LSTM 的意圖識別模型Fig.4 Intention recognition model based on Bi-LSTM
模型驗證及測試采用公開的NGSIM 數(shù)據(jù)集.數(shù)據(jù)中包含了車輛速度、加速度及位置等信息,采樣頻率為10 Hz.
為了凸顯環(huán)境信息對駕駛人換道意圖的影響,需提取包含相鄰前車及周圍環(huán)境車輛的運動信息.所提取數(shù)據(jù)包括本車所在車道及相鄰車道車輛信息,如圖2所示.換道過程按照以下步驟提?。?/p>
(1)識別換道或切入車輛的編號.
(2)搜尋目標車輛跨道時刻tlc.
(3)以tlc作為起點,反向提取目標車輛在跨道時刻前的換道動作時間序列Tts.
(4)標記目標車輛換道時刻tac.
(5)提取目標車輛周圍環(huán)境車輛在時間Tts內(nèi)的運動信息.
需要注意的是:NGSIM 原始數(shù)據(jù)具有一定的噪聲和誤差,采用局部加權散射圖平滑算法(LOWESS)對樣本進行濾波處理;步驟(3)中的時間序列Tts涵蓋了目標車輛在換道時刻tac前的時間序列,如圖5所示;步驟(4)中的換道時刻點tac標記方法為,以目標車輛的橫向位移數(shù)據(jù)為參考,采用MATLAB 中findpeaks 函數(shù)尋找到峰值點,該點為局部最大值,如圖6所示,橫向位移軌跡為NGSIM 數(shù)據(jù)集中I-80 路段04:00-04:15,2285 號車輛的橫向位移,倒三角為findpeaks 函數(shù)尋找到的峰值點,以此作為換道時刻點,圓點為跨道時刻點,虛線為車道線.
經(jīng)過以上提取過程,共提取到1 090段換道樣本.定義相鄰前車長時間在某車道行駛、無換道動作為車道保持過程,同樣提取1 090段車道保持樣本.對換道過程和保持過程進行分類,模型識別過程本質上為二分類問題.
圖5 目標車輛換道時間序列提取示意圖Fig.5 Schematic diagram of target vehicle lane change time series extraction
圖6 換道過程橫向位移示意圖Fig.6 Lateral displacement diagram of lane change process
將提取樣本的80%作為訓練集,20%作為測試集.GMM 的數(shù)量K將通過貝葉斯信息標準(BIC)確定.表1為不同K值對應的BIC 值,BIC 值越小越好[9],故選取K=4.
表1 不同K 值對應的BIC 值Table1 BIC values for different K values
采用Baum-Welch算法對λ的參數(shù)進行估計.
Bi-LSTM網(wǎng)絡由4層Bi-LSTM堆疊組成,Dropout 率為0.2,每層隱藏單元數(shù)為128,全連接層的激活函數(shù)為ReLU,采用Adam優(yōu)化器,學習率為0.001,衰減置為0.9.
分別訓練行為識別模型Mbeh-CHMM和Mbeh-BiLSTM,意圖預測模型Mint-CHMM和Mint-BiLSTM,其中Mbeh和Mint的輸入分別為和.
分別以識別率、行為識別時刻和意圖預測時域對所提方法的有效性和預測性進行分析.
3.3.1 識別率
識別率是指得到的正確分類樣本占總樣本的比例,亦稱準確率,該結果基于行為識別模型Mbeh-CHMM和Mbeh-BiLSTM得到.雙層CHMM-BGC 模型識別結果如表2所示.可以看出,該模型對換道過程的識別率較高,對保持過程識別率相對較低,但也達到了81.19%,原因可能是所提取的車道保持樣本中部分數(shù)據(jù)存在一定的波動,使模型誤判別為換道過程.平均識別率為88.07%.
表2 雙層CHMM-BGC 模型識別結果Table2 Two-layer CHMM-BGC model identification results
基于Bi-LSTM網(wǎng)絡模型識別結果如表3所示.該模型采用深度學習的方法,從識別率可看出,識別率較雙層CHMM-BGC模型有較大提升,尤其是車道保持過程的識別,識別率上升到98.62%,換道過程的識別率達到100%.平均識別率為99.31%,相較于雙層CHMM-BGC模型提升了11.24%.
表3 Bi-LSTM網(wǎng)絡模型識別結果Table3 Bi-LSTM network model identification results
圖7為受試者工作特征曲線(ROC),其中,點劃線為假正例率(FPT)為5%,對應的CHMM-BGC的真正例率(TPR)為84.1%,Bi-LSTM 的TPR 為98.6%,說明兩種模型都具有較好的識別性能,但基于Bi-LSTM的行為識別模型泛化性能優(yōu)于雙層CHMM-BGC行為識別模型.
圖7 受試者工作特征曲線Fig.7 Receiver operating curve
3.3.2 行為識別時刻
為了最大限度利用數(shù)據(jù),采用滑動時間窗口方法,如圖8所示.步長設置為0.1 s,即前后窗口中的有Tw-0.1 s 項是相同的.考慮到滑動時間窗口設置過長會影響到模型計算速度和內(nèi)存占用,經(jīng)對比后將Tw設置為1.8 s.
圖8 滑動時窗Fig.8 Slide time window
行為識別時刻是指模型識別出換道行為時滑動窗口所處時間點,通過分析該指標可判別模型的識別能力.為了驗證模型是否具有能夠在換道過程早期階段識別換道行為的能力,將測試集中的換道過程從換道時刻tac處截取,保留從換道時刻tac至跨道時刻tlc的時間序列,僅考慮目標車輛運動信息,采用Mbeh-CHMM和Mbeh-BiLSTM識別相鄰前車駕駛行為.
令Treg=treg-tac,treg為識別時刻,此時該時間點處于tac之后.Treg為模型自換道動作發(fā)生后到正確識別出結果所需的時間.測試集中不同換道過程時間長度不同,對識別時間進行歸一化處理.圖9為所提兩種模型對換道過程的識別時間統(tǒng)計,其中,矩形為頻率,折線為累計頻率.由圖9可以看出,近90%的換道行為都能夠在0.0~0.2 s 被識別,說明本文所提的兩種模型均可在相鄰前方車輛換道過程的早期時刻正確識別.
3.3.3 意圖預測時域
為了凸顯環(huán)境信息在一定程度上對相鄰前車駕駛意圖產(chǎn)生的影響,并可通過環(huán)境信息預測出駕駛人換道意圖,考慮相鄰前車與周圍環(huán)境車輛的交互作用,采用Mint-CHMM和Mint-BiLSTM預測相鄰前車的意圖,此時模型的輸入為,Tw與前一致.
由于加入環(huán)境信息,此時模型的換道識別時刻treg將出現(xiàn)在換道時刻tac之前.令Tpre=tac-treg為預測時域,即預判時間.圖10為所提兩種模型得到的預測時域統(tǒng)計,矩形為預測時域Tpre的頻率,折線為累計頻率,橫坐標表示預測時域Tpre.圖10中,雙層CHMM-BGC 模型預測時域超過50%集中在1~2 s,1~3 s 累計頻率近80%,說明該模型可較好地在換道開始前1~3 s 預測出前方目標車輛的換道意圖;Bi-LSTM 模型的預測時域有近60%集中在1~2 s,但1~3 s 為70%,低于雙層CHMM-BGC模型在該時間段的預測樣本比例,該模型在1~2 s可較好地預測前方目標車輛的換道意圖,但預測性能相較于前者不具備優(yōu)勢,同時發(fā)現(xiàn),在0~1 s所占比例為25.5%,反應出部分換道樣本僅能在換道時刻前的較短時間內(nèi)識別到換道意圖.兩種模型在長時域預測上頻率較低,這是因為較早時刻周圍環(huán)境不滿足換道要求,無法有效預測,與實際情況相符合.
圖9 換道識別時刻Fig.9 Recognition moment of lane change
3.3.4 模型計算時間
在正常行駛時,系統(tǒng)需具有實時計算的能力.通過tic和toc函數(shù)獲得Mint-CHMM和Mint-BiLSTM計算時間,結果如表4所示.表4可以看出,兩種模型的平均仿真識別時間數(shù)量級分別為10-3和10-2,駕駛人處理突發(fā)事件的所需反應時間一般為0.2~0.4 s,因此所提模型均可滿足系統(tǒng)實時計算要求.
圖10 預測時域Fig.10 Prediction horizon
表4 模型仿真識別時間Table4 Model simulation recognition time
對相鄰前車的駕駛行為和意圖預測進行了研究,提出了一種雙層CHMM-BGC行為識別模型和一種基于Bi-LSTM 的行為識別模型,并測試了兩種行為識別模型的識別率及預測性能.結果表明:基于Bi-LSTM的行為識別模型在識別率上有較大優(yōu)勢,識別泛化能力更好;兩種模型在識別時間上均可在前車換道早期階段識別到換道行為;雙層CHMM-BGC 行為識別模型可在換道時刻前預測到目標車輛駕駛人的換道意圖,基于Bi-LSTM 的行為識別模型在預測時域上相較于前者不具備優(yōu)勢.本文所提模型應用于ADAS,可為后車駕駛人預留出寶貴的反應時間,同時為后續(xù)預測周圍車輛行駛軌跡打下基礎.