国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

考慮駕駛員特性的自學(xué)習(xí)換道軌跡規(guī)劃系統(tǒng)*

2021-01-13 11:14高振海朱乃宣梅興泰
汽車工程 2020年12期
關(guān)鍵詞:車道聚類軌跡

高振海,朱乃宣,高 菲,梅興泰,張 進(jìn),何 磊

(1. 吉林大學(xué),汽車仿真與控制國家重點實驗室,長春 130022;2. 廣州汽車集團(tuán)股份有限公司汽車工程研究院,廣州 511434)

前言

車道變換是當(dāng)前研究的熱點問題,在軌跡的規(guī)劃和跟蹤方面,Shladover 等[1]提出了一個正弦車道變化模型,該模型可以將橫向加速度表示為時間的正弦曲線特征。閆堯等[2]建立車輛五次多項式換道軌跡模型,并為其增加調(diào)節(jié)參數(shù)。以換道軌跡的平均曲率最小和長度最短為目標(biāo)設(shè)計目標(biāo)函數(shù),同時考慮換道過程中的舒適性和平穩(wěn)性,以車輛的橫向速度、橫向加速度和橫擺角速度為約束條件,最后采用序列二次規(guī)劃算法對參數(shù)進(jìn)行優(yōu)化求解。白成盼等[3]利用約束求解得到基于sigmoid 函數(shù)的優(yōu)化路徑,將其與多項式參數(shù)化時間函數(shù)作為平坦輸出,利用微分平坦理論構(gòu)造一個非線性性能指標(biāo)函數(shù)并對其進(jìn)行優(yōu)化求解完成車速規(guī)劃,進(jìn)而實現(xiàn)對智能車輛路徑-速度分解式的軌跡規(guī)劃。

近年來越來越多的研究聚焦在人性化的駕駛輔助系統(tǒng)上,這也就對車道變換提出了更高的要求。當(dāng)前與駕駛員特性相結(jié)合的換道輔助系統(tǒng)研究正廣泛進(jìn)行,閆淑德[4]利用模糊C-均值聚類算法給駕駛員貼“標(biāo)簽”,并將駕駛員駕駛習(xí)性分為謹(jǐn)慎型、一般型和激進(jìn)型,采用粒子群算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)搭建駕駛?cè)笋{駛習(xí)性辨識策略,基于駕駛?cè)笋{駛習(xí)性建立個性化換道最小安全距離模型。縱瑞雪[5]采用自適應(yīng)模型預(yù)測控制原理與離散車輛動力學(xué)模型相融合的方法,將安全性、個性化和舒適性作為優(yōu)化性能指標(biāo),設(shè)計了換道輔助策略。Ren 等[6]考慮了駕駛員的駕駛風(fēng)格將樣本數(shù)據(jù)分為3 種駕駛方式:謹(jǐn)慎、穩(wěn)定和激進(jìn),同時建立了K-means 和神經(jīng)網(wǎng)絡(luò)的多層感知器模型以辨識換道過程。Vallon 等[7]提出了一種自主車道變更算法,其中車道變更決策由基于支持向量機(jī)(SVM)的分類器確定,使用人類駕駛員實際變道和保持車道演示的數(shù)據(jù)來訓(xùn)練多個SVM。SVM 根據(jù)所顯示的單個駕駛員的喜好來學(xué)習(xí)是繼續(xù)保留車道還是啟動換道,之后再使用分類器的輸出生成軌跡。

上述研究主要對駕駛員換道數(shù)據(jù)進(jìn)行大樣本采集,應(yīng)用分類算法將駕駛員分類,之后將各類駕駛員的共性化特征運用到控制或者預(yù)警策略中。這些方法往往存在著以下問題:將駕駛員分類后,算法不能針對每位駕駛員的特點進(jìn)行個性化微調(diào);同時,由于數(shù)據(jù)采集局限在換道數(shù)據(jù),在自由駕駛的環(huán)境下普適性較差,實時性也難以保證。

針對以上問題,本文中提出了一套基于駕駛員自然駕駛行為數(shù)據(jù)辨識的換道軌跡規(guī)劃系統(tǒng)。采集了30 位駕駛員的車道變換操縱行為數(shù)據(jù)和自由駕駛數(shù)據(jù),并基于對這些數(shù)據(jù)的離線學(xué)習(xí),建立可描述駕駛員共性化的車道變換軌跡規(guī)劃算法。通過對駕駛員個體數(shù)據(jù)的在線學(xué)習(xí),實現(xiàn)對規(guī)劃算法的微調(diào),使其更精準(zhǔn)體現(xiàn)駕駛員的個性化操控行為規(guī)律,最終生成與真人操控數(shù)據(jù)高度一致的換道軌跡。

1 基于高斯分布的換道軌跡規(guī)劃

在基于駕駛員特性的換道輔助系統(tǒng)中,設(shè)計換道軌跡非常重要。既要滿足軌跡的可行性,同時將駕駛員的特性融入其中。本文通過對采集的30 名駕駛員的換道數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)當(dāng)駕駛員進(jìn)行換道操作時,實際車輛的橫向速度隨時間的曲線均可由高斯分布很好的擬合。圖1 為其中某名駕駛員的換道橫向速度的時域圖。因此,本文中提出了一種基于高斯分布的換道軌跡規(guī)劃方法。

圖1 實際換道過程的橫向速度變化和擬合曲線

高斯分布擬合的橫向速度公式為

式中:t為換道時間;d、μy和σy為擬合系數(shù)。

由高斯分布的定義可知,決定曲線的主要參數(shù)就是式(1)中的d、μy和σy。其中d是比例系數(shù),將曲線等比例放大,代表著由道路條件決定的換道橫向速度系數(shù);μy是分布的位置參數(shù),體現(xiàn)數(shù)據(jù)集中分布的中心位置,用來描述駕駛員的反應(yīng)和操作時間;σy主要描述數(shù)據(jù)分布的離散程度,進(jìn)而改變曲線的形狀,σy越大,曲線越扁平,該值很好地反映不同駕駛員的特點。

在傳統(tǒng)高斯擬合的基礎(chǔ)上,本文中引入駕駛員特性系數(shù)Jc和駕駛員反應(yīng)與操作時間td,用于計算σy,建立了仿駕駛員行為的換道軌跡規(guī)劃系統(tǒng)。式(1)中相關(guān)系數(shù)如下:

式中:B為車道寬度;ts為轉(zhuǎn)向系統(tǒng)反應(yīng)時間。

將車道寬度設(shè)置為d=B=3.75 m,轉(zhuǎn)向系統(tǒng)反應(yīng)時間ts= 1.1 s,Jc和td的具體取值在 2.1.2 和2.2.3 節(jié)中詳細(xì)說明。

由此,便可獲得車輛的橫向加速度:

車道變換過程的車輛橫向位移也可通過公式積分獲得:

式中T為整個換道過程的總時間。

2 基于駕駛員自然駕駛行為數(shù)據(jù)辨識的換道軌跡規(guī)劃系統(tǒng)

一套完整的自學(xué)習(xí)系統(tǒng)首先對駕駛員的共性特征進(jìn)行提取,獲得普適性的參數(shù),同時能夠針對某名駕駛員實際駕駛的數(shù)據(jù)進(jìn)行個性化的在線調(diào)整。圖2 顯示了本文所搭建的軌跡規(guī)劃系統(tǒng)的技術(shù)路線圖。

圖2 規(guī)跡規(guī)劃系統(tǒng)技術(shù)路線圖

2.1 基于歷史數(shù)據(jù)的離線學(xué)習(xí)

2.1.1 駕駛員數(shù)據(jù)的采集

為分析駕駛員特性,在自由駕駛工況下進(jìn)行大量實驗,以收集駕駛員的駕駛數(shù)據(jù)。如圖3 所示,構(gòu)建了駕駛員行為數(shù)據(jù)采集系統(tǒng),它使用了一輛真實車輛,輔以慣性導(dǎo)航和VECTOR VN1630A CAN 采集設(shè)備。

圖3 駕駛員數(shù)據(jù)采集流程圖

采集以下數(shù)據(jù)以便后續(xù)分析:轉(zhuǎn)向盤轉(zhuǎn)角、轉(zhuǎn)向盤轉(zhuǎn)速、橫縱向加速度、橫擺角速度、車速、制動主缸壓力、油門踏板開度和經(jīng)緯度。

實驗地點在中國長春選定了一段路線作為駕駛場景,選取的路段涵蓋了常見的場景,如直行、連續(xù)彎道、環(huán)島、換道、高架和擁堵等,全程約12 km,單次駕駛時長約25 min。實驗最后每名駕駛員再進(jìn)行5 次自由換道以便后續(xù)分析。

為使采集的數(shù)據(jù)具有代表性,本次實驗選擇了30 名長春本地的駕駛員作為測試樣本,其職業(yè)為學(xué)生、教師和出租車駕駛員。其中男性23 名,女性7名,年齡分布在20 ~55 歲之間。同時為區(qū)別其駕駛能力,選取的駕駛員駕齡分布在1 ~20年之間。在正式測試之前,駕駛員會先對實驗車輛進(jìn)行一段時間的試駕,以使他們熟悉車輛和實驗步驟,除副駕駛的一名記錄員外車上無其他乘員及設(shè)備[8]。試驗后對其個人信息進(jìn)行統(tǒng)計,如表1 所示。

表1 駕駛員信息

2.1.2 共性化Jc和td的獲得

Jc是確定車輛橫向速度最大值vy和變化率的系數(shù),同時也是反映不同駕駛員之間區(qū)別的關(guān)鍵參數(shù);td是反映駕駛員反應(yīng)和操作快慢的重要因素。因此,針對每個駕駛員特性適當(dāng)選擇Jc和td,就能夠保證車輛狀態(tài)符合該駕駛員的預(yù)期。

使用動態(tài)時間規(guī)整(DTW)進(jìn)行軌跡的匹配。DTW 可在某些限制條件下找到兩個給定(時間相關(guān))序列之間的最佳比對[9]。選用采集的30 名駕駛員的自由換道軌跡作為真實軌跡,令擬合生成的軌跡和真實換道軌跡分別為X和Y,長度分別為X和歸整路徑(Warp Path)的形式為

W中每項的形式為wk(i,j),其中i表示軌跡X中第i個點坐標(biāo),j表示軌跡Y中第j個點坐標(biāo)。

歸整路徑W必須從w1=(1,1)開始,到wk=結(jié)尾,以保證X和Y中的每個坐標(biāo)都在W中出現(xiàn)。另外,W中w(i,j)的i和j必須是單調(diào)增加的,即

其中:i≤i′≤i+1,j≤j′≤j+1。

最后要得到的歸整路徑就是距離最短的一個歸整路徑:

式中:Dist(i,j)為軌跡X第i個點與Y第j個點之間的距離;D(i,j)為軌跡X的前i個點與Y的前j個點的總距離。

通過對駕駛特性系數(shù)Jc和反應(yīng)與操作時間td的動態(tài)調(diào)整以改變擬合軌跡,使用DTW 算法將每一對Jc和td下的擬合軌跡與真實軌跡匹配,直到獲得最小的平方歐式距離,此時的Jc和td即為該名駕駛員的最佳參數(shù)。圖4 顯示了一名駕駛員平方距離最小時(Jc=1.3,td=0.9 s)的擬合軌跡和真實軌跡,此時兩者軌跡接近程度最好。

圖4 使用DTW 后的真實軌跡和擬合軌跡

通過對30 名駕駛員5 次換道軌跡的DTW 比對,最終得到了150 組Jc和td,為了獲得共性化的Jc和td,本文中使用了AP 算法進(jìn)行聚類分析。AP 聚類算法是基于數(shù)據(jù)點間的“信息傳遞”的一種聚類算法。與k-均值算法或k中心點算法不同,AP 算法不需要在運行算法之前確定聚類中心的個數(shù)。

本文的數(shù)據(jù)樣本集為{x1,x2,x3,…,xn},其中xi為一組Jc和td值。令S是一個刻畫點之間相似度的矩陣,使得S(i,j)>S(i,k)當(dāng)且僅當(dāng)xi與xj的相似性程度大于其與xk的相似性。

AP 算法進(jìn)行交替兩個消息傳遞的步驟,以更新如下兩個矩陣。

(1)吸引信息矩陣R:r(i,k)描述了數(shù)據(jù)對象k適合作為數(shù)據(jù)對象i的聚類中心的程度,表示的是從i到k的消息。

(2)歸屬信息矩陣A:a(i,k)描述了數(shù)據(jù)對象i選擇數(shù)據(jù)對象k作為其聚類中心的適合程度,表示從k到i的消息。

兩個矩陣R和A中全部初始化為0,可看成Log-概率表,這個算法通過以下步驟迭代進(jìn)行。

首先,吸引信息rt+1(i,k)按照如下迭代:

然后,歸屬信息at+1(i,k)按照下面兩式迭代:

對以上步驟進(jìn)行迭代,當(dāng)矩陣穩(wěn)定或達(dá)到最大迭代次數(shù),即可得到最終結(jié)果。

聚類結(jié)果如圖 5 所示,AP 算法將(Jc,td)最終分為 3 類,3 類的聚類中心分別為(1.48,0.79)、(1.36,0.65)和(1.57,0.62)。本文中將這 3 類分別定義為舒適型、一般型和運動型的軌跡參數(shù),同時將聚類中心值作為(Jc,td)的 3 類離線共性化參數(shù)值。

圖5 AP 聚類結(jié)果

將3 個聚類中心值(Jc,td)代入擬合軌跡方程中,圖6 分別顯示了對應(yīng)典型的3 類參數(shù)下的橫向速度、加速度和位移曲線。由圖可見,3 種控制器參數(shù)下?lián)Q道特性存在明顯差異,能夠很好地滿足不同駕駛員的駕駛需求。

圖 6 3 種( Jc,td )下的擬合數(shù)據(jù)

2.2 基于實時數(shù)據(jù)的在線學(xué)習(xí)

在完成離線學(xué)習(xí)后,需要從自由駕駛數(shù)據(jù)中在線分析出30 名駕駛員的駕駛特性。上文中,根據(jù)(Jc,td)將駕駛特性分為舒適、一般和運動型,從而得到30 名實驗者的標(biāo)簽。本文中基于此標(biāo)簽和長短時記憶神經(jīng)網(wǎng)絡(luò)(LSTM)搭建了在線辨識模型以動態(tài)調(diào)整參數(shù)。

2.2.1 特征工況提取

考慮到LSTM 的輸入為時序數(shù)列,將駕駛員的自由駕駛數(shù)據(jù)進(jìn)行了提取和分段。駕駛員的轉(zhuǎn)向操作是區(qū)別不同駕駛員的重要操作,許多研究將駕駛員的轉(zhuǎn)向操作從自由駕駛數(shù)據(jù)中剝離出來進(jìn)行分析[10]。本文設(shè)定的轉(zhuǎn)向行駛的條件為:(1)車速v>2 m/s2;(2)轉(zhuǎn)向盤轉(zhuǎn)角δsw>5°;(3)轉(zhuǎn)向盤轉(zhuǎn)速

當(dāng)汽車脫離穩(wěn)定直線行駛時,開啟數(shù)據(jù)的提??;當(dāng)汽車重新進(jìn)入直線行駛或者超過設(shè)定的工況持續(xù)時間Tcon(本文設(shè)置Tcon=7 s),完成一段數(shù)據(jù)提取,得到一組駕駛員轉(zhuǎn)向的時序數(shù)據(jù)。

每個駕駛員25 min 的駕駛數(shù)據(jù)大約能提取50組左右特征工況,30 個駕駛員的實驗,累計獲得了1 831 組特征工況。

2.2.2 在線辨識模型搭建

采用LSTM 建立駕駛員辨識模型。LSTM 是一種時間循環(huán)神經(jīng)網(wǎng)絡(luò),適合于處理和預(yù)測時間序列中間隔和延遲較長的重要事件[11],其網(wǎng)絡(luò)結(jié)構(gòu)如圖7 所示。

圖7 LSTM 網(wǎng)絡(luò)結(jié)構(gòu)

本文的輸入門Xt包含轉(zhuǎn)向盤轉(zhuǎn)角δsw、車速v、轉(zhuǎn)向盤轉(zhuǎn)速、縱向加速度ax、橫向加速度ay和計算得到的航向角變化ψ的時間序列。

圖8 LSTM 訓(xùn)練過程

在訓(xùn)練過程中,在1 831 組數(shù)據(jù)中隨機(jī)選取1 300(總數(shù)據(jù)的70%)組作為訓(xùn)練集。訓(xùn)練過程如圖8 所示,表2 則顯示了使用剩余數(shù)據(jù)作測試集的驗證結(jié)果。由表2 可見,舒適、一般和運動的駕駛特性在經(jīng)過訓(xùn)練的LSTM 網(wǎng)絡(luò)的檢測準(zhǔn)確度均超過90%。實踐證明,該算法準(zhǔn)確性良好,為駕駛員特性辨識算法在控制系統(tǒng)中的運用奠定了基礎(chǔ)。

表2 LSTM 單次特征工況的辨識結(jié)果

2.2.3Jc和td的動態(tài)調(diào)整方法

在確保了單次特征工況辨識的準(zhǔn)確后,設(shè)計了Jc和td的動態(tài)更新方法:駕駛員駕駛車輛時,在線辨識模型不斷地進(jìn)行特征工況的提取。每獲得一段特征工況數(shù)據(jù),就將其進(jìn)行LSTM 模型的辨識,根據(jù)多次辨識的統(tǒng)計結(jié)果,得到Jc和td的值,之后再生成個性化的換道軌跡。Jc和td的具體更新方法如下:

式中:nc為辨識出舒適特性的次數(shù);nn為辨識出一般特性的次數(shù);ns為辨識出運動特性的次數(shù);n為特征工況的總個數(shù)。

該系統(tǒng)隨著駕駛數(shù)據(jù)的累積和特征工況的增多,能夠動態(tài)更新駕駛員特性系數(shù)Jc和駕駛員反應(yīng)與操作時間td,進(jìn)而描述駕駛員個體的行為特性,最終可很好的復(fù)現(xiàn)真人的換道軌跡。

3 模型的驗證

選取了15 名駕駛員進(jìn)行實車驗證,本節(jié)將選取其中3 名駕駛員進(jìn)行說明。實驗開始前,令駕駛員對實驗車輛先進(jìn)行一段時間的試駕,使他們熟悉車輛和實驗流程。

將駕駛員特性辨識程序搭載進(jìn)MATLAB/ Simulink 中,通過VECTOR VN1630A 實時獲取駕駛員的車輛操控數(shù)據(jù),通過辨識程序進(jìn)行特征工況提取,駕駛員每完成一次特征工況,便將此次時序數(shù)據(jù)進(jìn)入集成好的 LSTM 中辨識,并更新Jc和td。圖9 顯示了1 號駕駛員在駕駛過程中Jc和td的動態(tài)調(diào)整過程。

表3 顯示了實驗完成后駕駛員的特征工況辨識結(jié)果及對應(yīng)生成的Jc和td。

表3 駕駛員特性辨識結(jié)果

在完成自由駕駛后,令每名駕駛員分別完成幾次自由換道,以驗證實際換道軌跡和擬合軌跡的匹配度。圖10 顯示1-3 號駕駛員的實際換道軌跡,圖11~圖13 分別是3 位駕駛員的真實軌跡和根據(jù)辨識結(jié)果獲得的擬合軌跡。

圖10 3 名駕駛員真實換道軌跡

圖11 1 號駕駛員的真實軌跡和擬合軌跡(Jc = 1.48,td = 0.78 s)

圖12 2 號駕駛員的真實軌跡和擬合軌跡(Jc = 1.45,td = 0.65 s)

圖13 3 號駕駛員的真實軌跡和擬合軌跡(Jc = 1.54,td = 0.63 s)

為描述擬合軌跡的符合程度,基于上節(jié)中30 名駕駛員的軌跡,計算出一個平均距離作為系統(tǒng)誤差的通用閾值。將通用閾值設(shè)定為1,即擬合軌跡與真實軌跡間的平方歐氏距離均小于1 就表明擬合的軌跡滿足駕駛員的要求。圖14 顯示了1 號駕駛員在線辨識過程中的DTW 誤差情況。隨著在線學(xué)習(xí)系統(tǒng)的運行,軌跡誤差不斷下降,最后達(dá)到了本文設(shè)定的要求。最終,15 名駕駛員實驗完成后,其中14名駕駛員的誤差達(dá)到了閾值以下,擬合準(zhǔn)確率達(dá)93.3%。

圖14 1 號駕駛員的軌跡誤差

因此,基于駕駛員特性的自學(xué)習(xí)個性化換道軌跡規(guī)劃系統(tǒng)可準(zhǔn)確識別真人駕駛行為數(shù)據(jù),之后基于辨識結(jié)果調(diào)整自動駕駛控制,良好的復(fù)現(xiàn)真人的換道軌跡,實驗結(jié)果與真人操控軌跡具有良好的一致性。

4 結(jié)論

(1)本文在換道軌跡規(guī)劃中融合了駕駛?cè)说奶匦?,建立了基于駕駛員特性的自學(xué)習(xí)換道軌跡規(guī)劃系統(tǒng),研究結(jié)果可為考慮駕駛?cè)艘蛩氐鸟{駛輔助系統(tǒng)的研究提供參考。

(2)在傳統(tǒng)高斯擬合的基礎(chǔ)上,引入駕駛員特性系數(shù)和駕駛員反應(yīng)與操作時間,提出了個性化的換道軌跡規(guī)劃系統(tǒng),并通過DTW 算法匹配實際和擬合軌跡,盡可能復(fù)現(xiàn)了真人的換道軌跡。

(3)通過實車采集換道軌跡,并使用AP 聚類算法得到Jc和td的共性化值和駕駛員特性標(biāo)簽。同時對自由駕駛數(shù)據(jù)進(jìn)行特征工況分段提取,獲得了1 831 組時間序列。依據(jù)標(biāo)簽,搭建了基于LSTM 的駕駛特性實時辨識模型,驗證集顯示了在單次工況下識別率均高于91.2%。

(4)通過實驗驗證了提出系統(tǒng)的有效性。實驗結(jié)果表明:該系統(tǒng)能夠在線提取特征工況并完成辨識,依據(jù)辨識結(jié)果動態(tài)更新Jc和td,生成換道軌跡。最終15 名中的14 名駕駛員實際軌跡與擬合軌跡的平方歐氏距離小于1,擬合正確率達(dá)到93.3%。因此,該系統(tǒng)能夠準(zhǔn)確識別真人行為數(shù)據(jù),然后基于辨識結(jié)果調(diào)整自動駕駛控制,復(fù)現(xiàn)真人的換道軌跡。

猜你喜歡
車道聚類軌跡
智慧收費機(jī)器人在高速公路車道上的應(yīng)用
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
解析幾何中的軌跡方程的常用求法
基于OpenCV的直道車道線識別技術(shù)研究
基于知識圖譜的k-modes文本聚類研究
基于數(shù)據(jù)降維與聚類的車聯(lián)網(wǎng)數(shù)據(jù)分析應(yīng)用
北斗+手機(jī)實現(xiàn)車道級導(dǎo)航應(yīng)用
軌跡
軌跡
基于模糊聚類和支持向量回歸的成績預(yù)測