宋傳杰,高建平,謝詔璽,郗建國(guó)
(河南科技大學(xué) 車輛與交通工程學(xué)院, 河南 洛陽(yáng) 471003)
隨著汽車智能化、網(wǎng)聯(lián)化的深度發(fā)展,智能駕駛汽車的安全問(wèn)題成為關(guān)注的焦點(diǎn)。構(gòu)建合理的自動(dòng)駕駛汽車測(cè)試與評(píng)價(jià)系統(tǒng),需對(duì)真實(shí)環(huán)境中的危險(xiǎn)場(chǎng)景進(jìn)行分析與構(gòu)建。當(dāng)前,自動(dòng)駕駛汽車的測(cè)試評(píng)價(jià)對(duì)象已從傳統(tǒng)的人-車系統(tǒng)轉(zhuǎn)變?yōu)槿?車-環(huán)境交互耦合系統(tǒng),而測(cè)試場(chǎng)景已成為不可或缺的環(huán)節(jié)[1-2]。目前,國(guó)內(nèi)外對(duì)測(cè)試場(chǎng)景及場(chǎng)景要素的形式還存在爭(zhēng)議,標(biāo)準(zhǔn)中也未進(jìn)行明確闡述。場(chǎng)景生成方法可分為基于演繹的方法和基于歸納的方法。郭景華等[3]、徐向陽(yáng)等[4]基于歸納的方法,通過(guò)采集的真實(shí)交通數(shù)據(jù)構(gòu)建測(cè)試場(chǎng)景,且處于仿真階段。Xia等[5]利用層次分析法衡量場(chǎng)景要素的重要度,通過(guò)獨(dú)立組合測(cè)試方法將離散的測(cè)試用例聚類成連續(xù)場(chǎng)景,確保了場(chǎng)景覆蓋的全面性,但生成的場(chǎng)景不具有典型性?;诋?dāng)前自動(dòng)駕駛汽車測(cè)試現(xiàn)狀,測(cè)試場(chǎng)景應(yīng)具有代表性強(qiáng)、數(shù)量少等特點(diǎn)。
目前,科學(xué)理論技術(shù)提升了自動(dòng)駕駛汽車的預(yù)測(cè)能力。熊曉夏等[6]基于支持向量機(jī)和混合高斯的隱馬爾可夫鏈模型對(duì)道路事故進(jìn)行預(yù)測(cè),但對(duì)我國(guó)交通環(huán)境下網(wǎng)聯(lián)車輛的前車狀態(tài)考慮較少。張金輝等[7]采用貝葉斯網(wǎng)絡(luò)對(duì)前車車速進(jìn)行預(yù)測(cè),將得到的跟車數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,通過(guò)測(cè)試集檢測(cè)前車車速預(yù)測(cè)效果,但預(yù)測(cè)精度有待提高。倪捷[8]在構(gòu)建預(yù)測(cè)模型時(shí),僅考慮了車輛的運(yùn)行特征,而忽略了交通環(huán)境對(duì)行車風(fēng)險(xiǎn)的影響,不能全面反映行車狀態(tài)。綜上所述,由于我國(guó)交通環(huán)境復(fù)雜度較高,車輛未來(lái)狀態(tài)受駕駛員等多種因素影響,自動(dòng)駕駛車輛對(duì)前車運(yùn)行狀態(tài)難以進(jìn)行精確預(yù)判。
基于以上問(wèn)題,本文以自動(dòng)駕駛車輛為研究對(duì)象,對(duì)典型場(chǎng)景下自動(dòng)駕駛車輛前車車速進(jìn)行預(yù)測(cè),選取對(duì)事故類型影響較大的特征要素。采用Prescan、Matlab/Simulink等工具和優(yōu)化算法,構(gòu)建基于馬爾科夫鏈和循環(huán)神經(jīng)網(wǎng)絡(luò)的前車車速預(yù)測(cè)模型,通過(guò)模擬狀態(tài)與原始狀態(tài)的對(duì)比,驗(yàn)證了預(yù)測(cè)模型的有效性。最后,將車速模型參數(shù)導(dǎo)入整車控制器中,并進(jìn)行試驗(yàn)驗(yàn)證。
本文數(shù)據(jù)來(lái)源于國(guó)家車輛事故深度調(diào)查系統(tǒng)(national automobile accident indepth investigation system,NAIS),由多所高校和研究機(jī)構(gòu)共同建立。該數(shù)據(jù)圍繞事故相關(guān)的人-車-路-環(huán)境信息進(jìn)行深入采集,涵蓋全國(guó)具有代表性的區(qū)域,且與我國(guó)道路事故統(tǒng)計(jì)特征基本吻合[9]。結(jié)合NAIS數(shù)據(jù)庫(kù)和自動(dòng)駕駛測(cè)試場(chǎng)景要求,考慮到測(cè)試過(guò)程中,測(cè)試車輛本身與周圍場(chǎng)景的相互作用,因此,將場(chǎng)景要素分為交通環(huán)境要素和測(cè)試車輛基礎(chǔ)信息要素兩大類,如圖1所示。
圖1 場(chǎng)景要素分類
為了構(gòu)建場(chǎng)景要素指標(biāo)體系,需要對(duì)各場(chǎng)景要素進(jìn)行編碼。根據(jù)實(shí)際駕駛經(jīng)驗(yàn),本文以交通環(huán)境要素中的事故時(shí)間、天氣、道路狀況、道路流量、路面材質(zhì)、道路類型為自變量,事故類型為因變量,使用SPSS軟件進(jìn)行多元線性回歸分析,探究各要素對(duì)事故類型的影響程度。多元線性回歸模型能較好地兼顧各個(gè)要素的權(quán)值。此外,為避免個(gè)別要素取值過(guò)于離散,在編碼過(guò)程中將相近的屬性進(jìn)行合并。要素編碼情況如表1所示。
表1 要素編碼
事故類型的線性回歸模型為:
(1)
式中:Y為事故類型;x為對(duì)事故類型有顯著影響的自變量;p為自變量個(gè)數(shù);n為樣本總數(shù);βp為第p個(gè)變量的回歸系數(shù),εi為第i個(gè)樣本的隨機(jī)誤差[10]。由式(1)可得n個(gè)樣本的矩陣隨機(jī)表達(dá)式:
Y=xβ+ε
(2)
假設(shè)x的列滿秩,則回歸系數(shù)的最小二乘估計(jì)量為:
(3)
多元線性回歸過(guò)程中還需對(duì)樣本回歸函數(shù)進(jìn)行檢驗(yàn),以判斷預(yù)測(cè)的可靠程度,包括擬合優(yōu)度、顯著性水平、德賓-沃森值等。
擬合優(yōu)度檢驗(yàn)即通過(guò)樣本回歸對(duì)觀測(cè)值進(jìn)行擬合,記
(4)
為總離差平方和,
(5)
為回歸平方和,
(6)
為殘差平方和,則:
(7)
式中,R2為可決系數(shù),其大小可表示自變量對(duì)因變量的貢獻(xiàn)程度,其值越接近1,表明擬合優(yōu)度越高。
在原假設(shè)成立的前提下,顯著性檢驗(yàn)的統(tǒng)計(jì)量由
(8)
公式確定,查表可得臨界值Fα,通過(guò)比較F和Fα的大小來(lái)判斷原假設(shè)H是否成立,一般情況下顯著性水平取0.05或0.1。
本文多元線性回歸分析中,置信區(qū)間設(shè)為95%,模型信息如表2所示,回歸分析結(jié)果如表3所示。根據(jù)R2,表明各要素預(yù)測(cè)事故類型的準(zhǔn)確性較強(qiáng)。
表2 模型信息
表3 回歸分析結(jié)果
結(jié)合表2和表3數(shù)據(jù),根據(jù)德賓-沃森值和VIF值,可說(shuō)明樣本數(shù)據(jù)隨機(jī)性較強(qiáng)且多重共線性呈弱相關(guān),顯著性水平<0.001,表明模型預(yù)測(cè)效果較好。取顯著性水平為0.05,根據(jù)分析結(jié)果,路面材質(zhì)、道路類型和道路干濕對(duì)事故類型影響較大,而天氣、道路狀況對(duì)事故類型影響較小。
基于以上分析,將路面材質(zhì)、道路類型和道路干濕確定為特征要素,特征要素即對(duì)事故類型影響較大的要素。由于自動(dòng)駕駛車輛感知系統(tǒng)容易受能見(jiàn)度的影響,因此,將能見(jiàn)度作為測(cè)試場(chǎng)景的特征要素[11]。
為挖掘出具有代表性的測(cè)試用例,采用聚類算法對(duì)測(cè)試場(chǎng)景進(jìn)行聚類挖掘,剔除重復(fù)或相似的測(cè)試用例,得到代表性較強(qiáng)的測(cè)試用例。K-均值聚類分析算法作為一種快速聚類算法,其對(duì)計(jì)算機(jī)的性能要求不高,且可應(yīng)用于比系統(tǒng)聚類法大得多的數(shù)據(jù)組[12]。
K-均值算法流程為:首先,將所有樣品分為K個(gè)初始類;然后,計(jì)算某樣品到各類中心的歐幾里得平方距離,將樣品分配給最近的一類。對(duì)于有變動(dòng)的類,重新計(jì)算其坐標(biāo),為下一步聚類做準(zhǔn)備。無(wú)變動(dòng)的類輸出后成為一類[13]。聚類算法的流程如圖2所示。
圖2 K-均值聚類算法流程
其中歐式平方距離公式為:
(9)
式中:I=(xi1,xi2,…,xif)和J=(xj1,xj2,…,xjf)是2個(gè)f維的數(shù)據(jù)對(duì)象,f為變量個(gè)數(shù),xik為第i個(gè)樣本中第k個(gè)變量的度量值。此外,采用最長(zhǎng)距離法定義類與類之間的距離,規(guī)定相同變量間距離為0,不同變量間距離為1。首先,將各樣品自成一類;然后將距離最小的兩類合并。其中,定義類Gi與類Gj之間的距離為最遠(yuǎn)樣品的距離,公式為:
(10)
式中:dij為樣品Xi與Xj之間的距離;Dpq表示類Gp與Gq之間的距離。將類Gp與Gq合并為Gr,則任一類Gm與Gr的類間距離為:
max{Dmp,Dmq}
(11)
選取第1節(jié)的4個(gè)特征要素為聚類分析的參數(shù),在聚類分析中,需將參數(shù)進(jìn)行賦值,以計(jì)算各測(cè)試用例之間的距離??紤]到本文只針對(duì)名義變量,規(guī)定相同變量間距離為0,不同變量間距離為1。其中,對(duì)于幾乎靜止的要素如天氣等,可將其設(shè)置為較小的值?;谏鲜龇椒ǖ玫降木垲惤Y(jié)果如表4、表5所示。
表4 迭代記錄
根據(jù)表4可得,當(dāng)進(jìn)行第4次迭代時(shí),各個(gè)聚類中心的絕對(duì)坐標(biāo)不再改變。因此,本文最終的聚類個(gè)數(shù)為4。根據(jù)SPSS得到的結(jié)果,查閱要素編碼表,最終得到4種危險(xiǎn)典型場(chǎng)景,如表5所示。
表5 4種危險(xiǎn)典型場(chǎng)景
本文基于采集的實(shí)車數(shù)據(jù)作為樣本,利用馬爾科夫模型和循環(huán)神經(jīng)網(wǎng)絡(luò)分別對(duì)平穩(wěn)工況和快變工況下前車車速進(jìn)行預(yù)測(cè)。
本文以某公司生產(chǎn)的自動(dòng)駕駛巴士為測(cè)試車輛,車上裝載多線激光雷達(dá)和毫米波雷達(dá),底盤采用CAN總線進(jìn)行通訊,對(duì)實(shí)際道路工況進(jìn)行采集。由于實(shí)際道路采集的數(shù)據(jù)受周圍環(huán)境、道路結(jié)構(gòu)、駕駛風(fēng)格等因素影響,因此需要對(duì)數(shù)據(jù)進(jìn)行處理。其中采集的數(shù)據(jù)集包括前車速度、前車加速度等數(shù)據(jù)。為建立符合我國(guó)交通特征的跟車工況,根據(jù)以下準(zhǔn)則篩選出相應(yīng)數(shù)據(jù)[7]。
1) 考慮到換道、超車情況,前后兩車距離應(yīng)滿足|Δdi|<8 m,其中Δdi為主車與前車之間的距離,單位為m。
2) 為確保跟車安全,兩車速度差應(yīng)滿足|Δvi|<5 km/h,其中Δvi為主車與前車速度之差。
3) 連續(xù)跟車大于10 s時(shí),不考慮起步、停車過(guò)程。
根據(jù)上述準(zhǔn)則篩選出車輛跟車數(shù)據(jù),其中前車速度、加速度概率分布情況如圖3、圖4所示。
圖3 前車速度概率分布
圖4 前車加速度概率分布
為準(zhǔn)確預(yù)測(cè)前車運(yùn)動(dòng)狀態(tài),參照文獻(xiàn)[14]的工況判斷方法,將篩選出的工況分為平穩(wěn)工況和快變工況。以采集的數(shù)據(jù)為基礎(chǔ),在平穩(wěn)工況下構(gòu)建基于馬爾科夫的前車狀態(tài)預(yù)測(cè)模型。假設(shè)車輛未來(lái)的狀態(tài)與歷史狀態(tài)無(wú)關(guān),則當(dāng)前車輛的狀態(tài)變化可視為一種馬爾科夫過(guò)程。假設(shè)駕駛過(guò)程為隨機(jī)過(guò)程ω,ω(m)為m時(shí)刻前車的狀態(tài),其中ω(m)可以表示速度、加速度等參數(shù)的隨機(jī)組合。根據(jù)條件概率定義,由狀態(tài)sm轉(zhuǎn)移到sn的轉(zhuǎn)移概率可定義為:
Tmn={X(t+1)=sm|X(t)=sn}
(12)
式中:Tmn為t時(shí)刻的轉(zhuǎn)移概率,即從t時(shí)刻sm轉(zhuǎn)移到t+1時(shí)刻sn的概率。將歷史數(shù)據(jù)劃分為若干片段,隨機(jī)組成不同狀態(tài)并依次編碼。車輛運(yùn)行時(shí),狀態(tài)間隨機(jī)進(jìn)行轉(zhuǎn)換,可根據(jù)這一屬性和歷史數(shù)據(jù)得到狀態(tài)轉(zhuǎn)移矩陣,公式如下:
(13)
(14)
式中:vm為下一時(shí)刻車速;vn為當(dāng)前車速;aj(m)為下一時(shí)刻加速度。根據(jù)單次試驗(yàn)時(shí)的數(shù)據(jù),可得到馬爾科夫鏈轉(zhuǎn)移概率矩陣元素,如圖5所示。
圖5 馬爾科夫模型轉(zhuǎn)移矩陣元素
考慮到馬爾科夫預(yù)測(cè)模型在前車工況波動(dòng)較大時(shí)預(yù)測(cè)魯棒性較弱,不能實(shí)時(shí)為主車提供準(zhǔn)確的前車運(yùn)行狀態(tài)。因此,本文采用循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)對(duì)前車多變工況進(jìn)行預(yù)測(cè),通過(guò)對(duì)駕駛行為序列的自學(xué)習(xí)預(yù)測(cè)前車狀態(tài)[16]。
循環(huán)神經(jīng)網(wǎng)絡(luò)具有深度神經(jīng)網(wǎng)絡(luò)的輸入、輸出和隱藏層,且隱藏層具有傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的前饋連接,并且每個(gè)神經(jīng)元都具有自反饋功能,RNN模型如圖6所示。
圖6 RNN模型示意圖
其中,定義RNN模型的輸入層xt(n)為歷史車速和加速度信息,輸出層yt為前車未來(lái)車速和及加速度,隱藏層采用具有自反饋功能的偏執(zhí)向量。
(15)
式中:W為權(quán)重系數(shù)矩陣(Wxh表示輸入層到隱藏層的權(quán)重系數(shù));b為偏置向量(bh表示隱藏層的偏置向量);fa為激活函數(shù),t為當(dāng)前時(shí)刻。其中損失函數(shù)為:
(16)
式中:pi和yi分別為前車車速預(yù)測(cè)值和真實(shí)值;(m-l,l)為輸出結(jié)果的維度。設(shè)定損失函數(shù)最小為優(yōu)化目標(biāo)。RNN模型根據(jù)輸入的歷史車速和加速度信息預(yù)測(cè)未來(lái)車速,根據(jù)相應(yīng)的誤差項(xiàng)和權(quán)重梯度實(shí)現(xiàn)循環(huán)神經(jīng)網(wǎng)絡(luò)在線學(xué)習(xí)。
為驗(yàn)證前文中車速預(yù)測(cè)模型和測(cè)試場(chǎng)景生成方法的有效性,在Prescan和Matlab/Simulink中搭建聯(lián)合仿真平臺(tái)。車輛模型選用Prescan自帶車型,在Prescan界面中對(duì)車輛、場(chǎng)景參數(shù)、輸入輸出進(jìn)行配置,通過(guò)界面可實(shí)時(shí)觀察仿真結(jié)果。圖7為部分三維仿真場(chǎng)景。定位系統(tǒng)和傳感器融合策略在Matlab/Simulink中搭建,設(shè)置采樣時(shí)間間隔為0.1 s。考慮到自車車速的危險(xiǎn)工況多在20~40 km/h,將測(cè)試車輛采集的數(shù)據(jù)作為樣本數(shù)據(jù),統(tǒng)計(jì)可得目標(biāo)車加速度呈近似正態(tài)分布。
圖7 部分三維仿真場(chǎng)景
將聚類的4種場(chǎng)景中自車車速作為歷史數(shù)據(jù),可得城市場(chǎng)景、二級(jí)公路場(chǎng)景、三級(jí)公路場(chǎng)景的速度,如圖8所示。3種場(chǎng)景中的速度誤差集中在 2 km/h范圍內(nèi),考慮到原始工況下車輛隨機(jī)性及環(huán)境隨機(jī)性較大,通過(guò)對(duì)采集數(shù)據(jù)的學(xué)習(xí)得到預(yù)測(cè)模型,結(jié)果存在一定的差異,其中體現(xiàn)了車輛狀態(tài)的隨機(jī)性。城市場(chǎng)景車輛頻繁啟停,速度誤差波動(dòng)較大,二級(jí)公路、三級(jí)公路波動(dòng)較小。
圖8 3種場(chǎng)景預(yù)測(cè)速度誤差
為進(jìn)一步驗(yàn)證前文提出的前車車速預(yù)測(cè)模型的準(zhǔn)確性,利用某公司生產(chǎn)的自動(dòng)駕駛套件標(biāo)定系統(tǒng)將模型參數(shù)導(dǎo)入至整車控制器中,進(jìn)行實(shí)驗(yàn)驗(yàn)證。試驗(yàn)小車如圖9所示。
圖9 試驗(yàn)小車
全車采用基于CAN卡的通訊方式,協(xié)議采用主從通訊模式,主設(shè)備是測(cè)量標(biāo)定系統(tǒng),從設(shè)備是整車控制器。當(dāng)主從設(shè)備建立聯(lián)系后,主設(shè)備控制所有通訊數(shù)據(jù),從設(shè)備接受數(shù)據(jù)并反饋代碼信息和報(bào)文。
在實(shí)車試驗(yàn)前,啟動(dòng)Dreamview平臺(tái),并在Cyber monitor里查看小車定位、感知、預(yù)測(cè)等通道的信號(hào)是否正常。試驗(yàn)時(shí)小車安全車速為20~30 km/h,最大加速度為5 m/s2。實(shí)車測(cè)試表明:在試驗(yàn)條件下,預(yù)測(cè)模型能平均提前4.86 s預(yù)測(cè)前車車速,且單程誤差率小于0.1%,誤差較小且實(shí)用價(jià)值較高。分別對(duì)試驗(yàn)后速度指標(biāo)和加速度指標(biāo)進(jìn)行分析,試驗(yàn)與仿真場(chǎng)景如圖10—12所示。通過(guò)觀察3種場(chǎng)景下前車速度和加速度的試驗(yàn)與仿真對(duì)比圖,其變化趨勢(shì)基本一致。部分片段偏差過(guò)大,這種現(xiàn)象是由試驗(yàn)環(huán)境及測(cè)量誤差造成的,均在合理范圍之內(nèi)。
圖10 城市場(chǎng)景試驗(yàn)與仿真
圖11 二級(jí)公路場(chǎng)景試驗(yàn)與仿真
圖12 三級(jí)公路場(chǎng)景仿真與試驗(yàn)
根據(jù)表6可以看出,城市場(chǎng)景和二級(jí)公路場(chǎng)景誤差車速較小,三級(jí)公路場(chǎng)景誤差車速較大,這是因?yàn)樵囼?yàn)條件和測(cè)試誤差造成的。由此可以看出,所構(gòu)建的車速預(yù)測(cè)模型能較好地預(yù)測(cè)前車車速,實(shí)車試驗(yàn)驗(yàn)證了預(yù)測(cè)模型仿真系統(tǒng)的有效性。
表6 預(yù)測(cè)試驗(yàn)結(jié)果
1) 基于NAIS數(shù)據(jù)庫(kù),在置信區(qū)間為95%時(shí),在構(gòu)建的多元線性回歸模型中提取得到4個(gè)特征要素,對(duì)特征要素使用K均值聚類算法,挖掘出4種危險(xiǎn)典型場(chǎng)景。
2) 基于實(shí)際跟車數(shù)據(jù),分別對(duì)平穩(wěn)工況和快變工況建立馬爾科夫和循環(huán)神經(jīng)網(wǎng)絡(luò)車速預(yù)測(cè)模型?;赑rescan、Simulink聯(lián)合仿真平臺(tái),對(duì)典型場(chǎng)景下車速預(yù)測(cè)模型進(jìn)行驗(yàn)證,仿真結(jié)果表明:所提出模型的車速預(yù)測(cè)誤差小于2 km/h,在合理范圍內(nèi)。
3) 基于馬爾科夫模型和循環(huán)神經(jīng)網(wǎng)絡(luò)模型平均能提前4.86 s預(yù)測(cè)前車車速,且單程誤差小于0.1%,實(shí)用性較高。未來(lái)的工作是探究如何快速生成典型測(cè)試場(chǎng)景。