趙 韓,劉 浩,邱明明,曹龍凱,張義雷,虞 偉
(1. 合肥工業(yè)大學(xué)機械工程學(xué)院,合肥 230009;2. 汽車技術(shù)與裝備國家地方聯(lián)合工程研究中心,合肥 230009)
駕駛風(fēng)格是駕駛員在駕駛車輛過程中的行為特征,體現(xiàn)在開車過程中人對車的輸入及整車響應(yīng)[1]。在整車能量管理策略開發(fā)過程中,駕駛風(fēng)格的有效識別可增強整車對不同駕駛風(fēng)格自適應(yīng)能力,這對于提高燃油經(jīng)濟性和降低排放具有重要意義。
在駕駛風(fēng)格識別方面,國內(nèi)外學(xué)者開展了大量研究。文獻[2]中利用人工神經(jīng)網(wǎng)絡(luò)將駕駛風(fēng)格分為非常運動型、運動型、正常型、戒備型和非常戒備型。文獻[3]中利用支持向量機、k 最近鄰算法、隨機森林等方法對駕駛員風(fēng)格進行了識別,并比較了各種方法的準確度。文獻[4]中利用模糊邏輯算法在Matlab/Simulink 中設(shè)計了一種在線駕駛風(fēng)格識別系統(tǒng)。文獻[5]中搭建了一種基于數(shù)據(jù)挖掘和神經(jīng)網(wǎng)絡(luò)等人工智能技術(shù)的DrivingStyles 軟硬件平臺。文獻[6]中研究了不同性能的輕型汽車對駕駛風(fēng)格的影響。文獻[7]中提出一種雙層指針模型,使得駕駛風(fēng)格識別與車輛所處駕駛環(huán)境相結(jié)合。文獻[8]中搭建了一種用于駕駛行為分析的低成本遠程數(shù)據(jù)采集系統(tǒng)。
國內(nèi)學(xué)者對于駕駛風(fēng)格的研究起步較晚,但經(jīng)過十余年的積累也有了一定的成果。文獻[9]中利用基于K-means 聚類的支持向量機方法,開發(fā)了一種快速模式識別方法,可將該方法用于駕駛風(fēng)格分類。文獻[10]中通過駕駛員的制動特性構(gòu)建了一套基于隱馬爾可夫模型算法的駕駛風(fēng)格識別方法。文獻[11]中從加速與減速兩個角度分析駕駛風(fēng)格并利用支持向量機算法進行了識別。文獻[12]中將駕駛風(fēng)格分為保守型、一般型和激進型,并基于Gini 指數(shù)構(gòu)建了用于駕駛風(fēng)格識別的隨機森林模型。文獻[13]中對駕駛風(fēng)格識別方法在不同車型上的通用性與適應(yīng)性進行了研究。文獻[14]中采用沖擊度的標準差結(jié)合典型工況下的平均沖擊度值來對駕駛風(fēng)格分類并進行在線識別。文獻[15]中采用基于K 均值聚類結(jié)果的高斯混合模型對駕駛風(fēng)格分類。文獻[16]中采用基于馬爾可夫鏈蒙特卡洛采樣和離群點剔除的K-means 算法對駕駛風(fēng)格進行分類。文獻[17]中提出一種基于標準化駕駛行為和相空間重構(gòu)的駕駛風(fēng)格定量評估方法。文獻[18]中采用高斯混合分布模型算法對起步工況下的駕駛風(fēng)格分類。
上述研究中,大多沒有考慮車流密度對駕駛風(fēng)格的影響。為此,本文中從分析車流密度與駕駛風(fēng)格特征參數(shù)之間的耦合關(guān)系入手,通過對不同車流密度下的駕駛風(fēng)格特征參數(shù)修正問題展開研究,建立一種考慮車流密度影響的駕駛風(fēng)格多層次識別方法。
本文中首先以模擬駕駛軟件3D Instructor 2 為基礎(chǔ)搭建實驗平臺,采集不同車流密度下不同駕駛風(fēng)格駕駛員的踏板信號與速度信號,并提取駕駛風(fēng)格特征參數(shù);然后采用主成分分析法對特征參數(shù)進行簡化與降維處理,得到不同車流密度影響下的表征駕駛風(fēng)格的綜合特征參數(shù),在此基礎(chǔ)上應(yīng)用減法聚類和K 均值聚類混合算法對駕駛風(fēng)格進行了分類與特征參數(shù)修正;最后采用隨機森林算法構(gòu)建駕駛風(fēng)格辨識模型,進行模型訓(xùn)練與k折交叉測試驗證,并與未考慮車流密度影響的駕駛風(fēng)格識別方法進行對比,驗證在駕駛風(fēng)格識別中考慮車流密度影響的必要性。
本文中采用模擬駕駛平臺并通過駕駛員在環(huán)實驗獲取實驗數(shù)據(jù)。試驗過程中,采用圖1 所示的系統(tǒng)實時采集制動與加速踏板數(shù)據(jù),采用視覺識別軟件提取車速數(shù)據(jù)。
圖1 模擬駕駛實驗數(shù)據(jù)采集系統(tǒng)
實驗選取城區(qū)道路工況進行模擬駕駛實驗,路線全長4.7 km,如圖2 中A 路徑所示。
圖2 模擬駕駛實驗路線規(guī)劃
使用3D Instructor 2 軟件的車流密度設(shè)置選項,設(shè)置車流密度分別為10%、40%、70%、100%的4 種城區(qū)工況,針對44 位駕駛員,通過駕駛員在環(huán)實驗,分別在上述4 種車流密度下進行數(shù)據(jù)采集,共采集有效實驗數(shù)據(jù)176 組(每種車流密度工況下采集44組),模擬駕駛實驗臺如圖3 所示。
圖3 模擬駕駛實驗臺
根據(jù)所獲取的實驗數(shù)據(jù),選取17 個特征參數(shù)來表征駕駛風(fēng)格,具體特征參數(shù)及其測試數(shù)據(jù)如表1所示。
同一組駕駛風(fēng)格特征參數(shù)在不同的車流密度下會表現(xiàn)出不同的駕駛風(fēng)格類型,為此需要對不同車流密度下的駕駛風(fēng)格進行重新定義與修正。本章中提出一種多層次混合算法,第一層基于主成分分析法對駕駛風(fēng)格特征參數(shù)進行綜合與降維處理,得到綜合特征參數(shù),第二層,采用減法聚類的方法獲取不同車流密度下不同駕駛風(fēng)格的綜合特征參數(shù)聚類中心,在此基礎(chǔ)上通過K 均值聚類方法對上述綜合特征參數(shù)聚類中心進行修正,計算出修正后的各類駕駛風(fēng)格特征參數(shù),具體流程如圖4 所示。
表1 駕駛風(fēng)格特征參數(shù)及其測試數(shù)據(jù)
圖4 駕駛風(fēng)格分類計算流程框圖
駕駛風(fēng)格相關(guān)的特征參數(shù)眾多,直接將樣本數(shù)據(jù)用于聚類分析效果較差,且計算和分析過程復(fù)雜,因此需要采用主成分分析法[19]對駕駛風(fēng)格特征參數(shù)進行綜合和降維處理,建立能綜合表征所有駕駛風(fēng)格特征參數(shù)的樣本矩陣。
根據(jù)上文中所提取的駕駛風(fēng)格特征參數(shù),進行主成分綜合處理,得到17 個主成分,即原始特征參數(shù)的17 種組合方式,在此基礎(chǔ)上進行主成分分析,得到17 個主成分的貢獻率(如圖5 所示)和17 個主成分的特征值碎石圖(如圖6 所示)。
由圖5 可知,前4 個主成分的累計貢獻率為81.68%。按照累計貢獻率大于80%的要求,取前4 個主成分即可表征17 個特征參數(shù)的絕大部分信息。同樣,由圖6 可知,按照特征值大于1 的要求選擇前4 個主成分。前4 個主成分的得分如表2所示,根據(jù)主成分得分矩陣建立綜合特征參數(shù)樣本矩陣。
表2 主成分得分
2.2.1 基于減法聚類的綜合特征參數(shù)聚類中心提取
圖5 主成分貢獻率
圖6 主成分的特征值碎石圖
本文中采用減法聚類提取綜合特征參數(shù)樣本矩陣的聚類中心,具體算法流程如圖7 所示。
圖7 減法聚類算法流程
式中ra為該點鄰域半徑。
式中sf為比例系數(shù)。
用于乘以確定集群中心鄰域的半徑值,從而消除將外圍點視為集群一部分的可能性,通過設(shè)置參數(shù)值可避免聚類中心過于密集的重合聚類問題或者分類不充分導(dǎo)致的欠分類問題。
在樣本集確定的情況下,減法聚類得到的聚類中心個數(shù)與位置由參數(shù)δ與sf確定。本文中提出的駕駛風(fēng)格分類算法中,通過對比實驗,確定參數(shù)δ取0.2、sf取1.75 時,駕駛風(fēng)格能被分割成較恰當(dāng)?shù)?類,得到4 種車流密度下綜合特征參數(shù)聚類中心,如表3 所示。
表3 4 種車流密度下的綜合特征參數(shù)聚類中心
由表3 可知,將4 種車流密度下的綜合特征參數(shù)樣本數(shù)據(jù)分別使用同樣的參數(shù)進行減法聚類后得到了相同數(shù)量的聚類中心,即在上述各種工況下,駕駛風(fēng)格均可恰當(dāng)?shù)乇环譃? 類。
根據(jù)文獻[20]和文獻[21],按照駕駛員激進程度的強弱將駕駛風(fēng)格分為謹慎型、穩(wěn)健型和激進型。
2.2.2 基于K 均值聚類的駕駛風(fēng)格特征參數(shù)修正
K 均值聚類是一種迭代求解的聚類分析算法,具體流程如圖8 所示。
由圖8 中所述流程可看出K 均值聚類結(jié)果受初始聚類中心的影響較大,如果初始聚類中心選取不當(dāng),聚類結(jié)果可能會陷入局部最優(yōu)解。使用減法聚類計算得到的綜合特征參數(shù)聚類中心作為K 均值聚類的初始聚類中心,可提高算法的自適應(yīng)性與穩(wěn)定性,得到較好的聚類效果,迭代停止后得到修正后的綜合特征參數(shù)聚類中心,如表4 所示,同時得到的聚類結(jié)果,如圖9 ~圖12 所示,其中聚類結(jié)果1、2 和3分別表示第1 類、第2 類和第3 類駕駛風(fēng)格。
圖8 K 均值算法流程
表4 修正后的綜合特征參數(shù)聚類中心
圖9 車流密度為10%駕駛風(fēng)格聚類結(jié)果
圖10 車流密度為40%駕駛風(fēng)格聚類結(jié)果
圖11 車流密度為70%駕駛風(fēng)格聚類結(jié)果
圖12 車流密度為100%駕駛風(fēng)格聚類結(jié)果
對聚類后的樣本進行計算分析,修正不同車流密度下的駕駛風(fēng)格特征參數(shù),得到相應(yīng)的特征參數(shù)表,如表5~表8 所示。
由表5 可知,對于車流密度為10%的工況,類別3 為激進型,其各項特征參數(shù)的絕對值除加速踏板均值以外均為最大;類別2 為穩(wěn)健型,與類別1 相比,其車輛加速度波動大、正向加速度大且變化快,加速踏板行程大、變化快且變化速率波動大,制動踏板行程大、變化快且變化速率波動大;類別1 為謹慎型。
由表6 可知,對于車流密度為40%的工況,類別1 為謹慎型,其各項特征參數(shù)的絕對值除加速踏板均值以外均為最小;類別3 為激進型,與類別2 相
比,其車速高、正向加速度大且變化快,加速踏板行程大、變化快且變化速率波動大;類別2 為穩(wěn)健型。
表5 駕駛風(fēng)格特征參數(shù)值(車流密度為10%)
表6 駕駛風(fēng)格特征參數(shù)值(車流密度為40%)
表7 駕駛風(fēng)格特征參數(shù)值(車流密度為70%)
表8 駕駛風(fēng)格特征參數(shù)值(車流密度為100%)
由表7 可知,對于車流密度為70%的工況,類別3 為激進型,其各項特征參數(shù)的絕對值除加速踏板均值以外都均為最大;類別2 為穩(wěn)健型,與類別1 相比,其車輛加速度波動大、負向加速度大且變化快,加速踏板行程變化快且變化速率波動大,制動踏板行程大、變化快且變化速率波動大;類別 1 為謹慎型。
由表8 可知,對于車流密度為100%的工況,從類別1 到類別3,各項特征參數(shù)的絕對值都是從小到大,符合謹慎型、穩(wěn)健型與激進型駕駛風(fēng)格的特征。
在對駕駛風(fēng)格進行準確表征的基礎(chǔ)上,引入隨機森林算法構(gòu)建駕駛風(fēng)格識別模型。
對于車流密度為10%的工況,通過聚類分析已得到44 個樣本中每一個樣本所屬的類別,在此基礎(chǔ)上構(gòu)造滿足隨機森林算法要求的矩陣,其數(shù)據(jù)如表9 所示。將謹慎型、穩(wěn)健型和激進型的駕駛風(fēng)格類別分別記為 1、2 和 3。
表9 用于識別的駕駛風(fēng)格特征參數(shù)(車流密度為10%)
隨機森林模型訓(xùn)練原理如圖13 所示,具體實現(xiàn)流程如圖14 所示。利用圖14 所述方法訓(xùn)練得到隨機森林模型進行駕駛員駕駛風(fēng)格識別。
采用k折交叉驗證的方式對上述駕駛風(fēng)格識別模型進行測試驗證,具體流程如圖15 所示。
圖13 隨機森林模型訓(xùn)練原理
圖14 隨機森林模型具體實現(xiàn)流程
圖15 k 折交叉驗證具體流程
對于車流密度為40%、70%和100%的工況分別采用上述隨機森林算法建立駕駛風(fēng)格辨識模型并進行測試驗證,4 種車流密度下k折交叉驗證的測試結(jié)果如圖16~圖19 所示,各個車流密度下駕駛風(fēng)格辨識模型的識別精度如表10 所示。
圖16 辨識模型測試驗證結(jié)果(車流密度為10%)
圖17 辨識模型測試驗證結(jié)果(車流密度為40%)
圖18 辨識模型測試驗證結(jié)果(車流密度為70%)
圖19 辨識模型測試驗證結(jié)果(車流密度為100%)
從表10 中可以看出,在4 種車流密度下駕駛風(fēng)格辨識模型的識別精度都較高,可有效辨識駕駛風(fēng)格類型。
表10 4 種車流密度下的模型識別精度
從圖16~圖19 中可以看出,與車流密度為10%和100%的測試驗證結(jié)果相比,車流密度為40%和70%的駕駛風(fēng)格識別模型測試驗證得到的正確率值普遍更大,且曲線波動更小。這是由于在道路暢通與道路嚴重擁堵的工況下,不同駕駛風(fēng)格駕駛員踩踏踏板的信號相似,因此提取的駕駛風(fēng)格特征參數(shù)差異性很小,導(dǎo)致模型識別精度相對較低。
為驗證本文中所述方法的優(yōu)越性,采用車流密度為70%試驗數(shù)據(jù)訓(xùn)練駕駛風(fēng)格識別模型,然后用該模型對車流密度為10%、40%和100%的實驗數(shù)據(jù)進行測試,得到的模型識別結(jié)果如表11 和圖20所示。
表11 未考慮車流密度影響的模型識別精度
圖20 未考慮車流密度影響的模型識別精度
從表11 與圖20 中可見,使用固定的駕駛風(fēng)格識別模型對不同車流密度對應(yīng)工況的適應(yīng)性較差。
(1)通過模擬駕駛實驗采集了不同車流密度下不同駕駛風(fēng)格駕駛員的駕駛數(shù)據(jù)并提取特征參數(shù),采用主成分分析法實現(xiàn)了對特征參數(shù)的降維和簡化處理,從而得到相應(yīng)的綜合特征參數(shù)。在此基礎(chǔ)上基于減法聚類和K 均值聚類混合算法對駕駛風(fēng)格進行了分類與特征參數(shù)修正,建立了不同車流密度下的駕駛風(fēng)格特征參數(shù)表。
(2)采用隨機森林算法建立駕駛風(fēng)格識別模型,在此基礎(chǔ)上對不同車流密度下的駕駛風(fēng)格進行識別,并與未考慮車流密度影響的駕駛風(fēng)格識別方法進行了對比。結(jié)果表明,在不同車流密度影響下,本文中所提出的方法駕駛風(fēng)格識別有效性更好。
(3)建立了多層次混合算法,通過對不同車流密度下的駕駛風(fēng)格特征參數(shù)修正以及基于隨機森林算法的駕駛風(fēng)格識別,使駕駛風(fēng)格的分類與識別更加細化,可構(gòu)建一套考慮車流密度影響的駕駛風(fēng)格識別方法,并能將其應(yīng)用于混合動力汽車的控制策略優(yōu)化中,從而為考慮車流密度影響的駕駛風(fēng)格自適應(yīng)控制策略的開發(fā)奠定基礎(chǔ)。