董小瑞,武雅文,張志文,李曉杰
(中北大學(xué)能源動(dòng)力工程學(xué)院,山西 太原 030051)
新能源汽車(chē)在實(shí)際工作中,復(fù)雜和多變的行駛工況會(huì)對(duì)汽車(chē)控制策略產(chǎn)生干擾,造成汽車(chē)的能耗經(jīng)濟(jì)性下降。如果可以根據(jù)工況實(shí)時(shí)調(diào)整汽車(chē)能量管理控制參數(shù),那么就可以提高汽車(chē)對(duì)路況的適應(yīng)能力,并使汽車(chē)的動(dòng)力性能及節(jié)能效果達(dá)到最優(yōu)[1-6]。因此準(zhǔn)確地識(shí)別行駛工況變得至關(guān)重要,可為新能源汽車(chē)后續(xù)的能量管理策略制定打下堅(jiān)實(shí)的基礎(chǔ)。當(dāng)前國(guó)內(nèi)外針對(duì)工況識(shí)別進(jìn)行了大量的研究。姜超等[7]依據(jù)混合動(dòng)力地下鏟運(yùn)機(jī)的工作特點(diǎn),采用可能性C均值聚類(lèi)算法對(duì)鏟運(yùn)機(jī)的5種典型工況進(jìn)行了識(shí)別,但是該算法容易受聚類(lèi)中心初始值的影響,且該算法時(shí)間開(kāi)銷(xiāo)很大;孫蕾等[8]選取了3類(lèi)標(biāo)準(zhǔn)循環(huán)工況,并提取了11個(gè)特征參數(shù)為訓(xùn)練數(shù)據(jù),建立了學(xué)習(xí)向量量化(LVQ)神經(jīng)網(wǎng)絡(luò)工況識(shí)別模型,而神經(jīng)網(wǎng)絡(luò)對(duì)樣本容量有依賴(lài)性;Chen等[9]基于模糊邏輯控制在線校正算法對(duì)短期未來(lái)行駛工況進(jìn)行預(yù)測(cè),但是模糊算法中的隸屬度函數(shù)大多靠經(jīng)驗(yàn)選擇,需要反復(fù)調(diào)試。
針對(duì)上述問(wèn)題,本研究選擇支持向量機(jī)(SVM)算法對(duì)行駛工況進(jìn)行識(shí)別,SVM在非線性分類(lèi)、模式識(shí)別上有著廣泛的應(yīng)用,識(shí)別精度高,泛化能力強(qiáng),但是識(shí)別效果上受SVM模型相關(guān)參數(shù)的影響。而遺傳算法具有強(qiáng)大的全局搜索能力,可以在很短的時(shí)間搜索到全局最優(yōu)點(diǎn),所以為了提高支持向量機(jī)算法的識(shí)別精度,本研究將遺傳算法優(yōu)化和SVM算法相結(jié)合,優(yōu)化模型參數(shù),建立優(yōu)良的行駛工況識(shí)別模型。
(1)
式中:ω為權(quán)值向量;b為閾值。
對(duì)于數(shù)據(jù)中的異常點(diǎn),SVM算法通常進(jìn)行軟間隔處理,為此需要引入負(fù)松弛因子ξi和懲罰系數(shù)C(控制松弛程度),優(yōu)化問(wèn)題轉(zhuǎn)化為
(2)
為解決上述線性約束凸優(yōu)化問(wèn)題,通常轉(zhuǎn)化為拉格朗日對(duì)偶函數(shù)求解[10]:
(3)
解得最優(yōu)分類(lèi)平面為
(4)
式中:a*為最優(yōu)解。
對(duì)于非線性問(wèn)題,通常引入一個(gè)核函數(shù)將原數(shù)據(jù)映射到一個(gè)高維空間中。定義核函數(shù):
K(xi,xj)=(φ(xi))Tφ(xj)。
(5)
在識(shí)別算法中應(yīng)用最廣泛的核函數(shù)為高斯徑向基函數(shù):
K(xi,x)=exp(-g‖xi-x‖2)。
(6)
式中:g為核函數(shù)寬度,只需把原問(wèn)題的(xi·xj)替換為K(xi·xj)即可解決。
懲罰系數(shù)C和核函數(shù)寬度g的取值對(duì)支持向量機(jī)的識(shí)別精度有很大的影響,因此需要找到最優(yōu)的C和g值。
遺傳算法(GA)是模擬自然界生物進(jìn)化現(xiàn)象發(fā)展起來(lái)的隨機(jī)全局搜索優(yōu)化方法,把搜索空間映射為遺傳空間[12]。將可能的解編碼成一個(gè)染色體,每個(gè)染色體通過(guò)選擇、交叉和變異三種算子來(lái)進(jìn)行操作運(yùn)算,整個(gè)種群在優(yōu)勝劣汰的進(jìn)化機(jī)理下進(jìn)化發(fā)展,直到進(jìn)化到最優(yōu)狀態(tài)。遺傳算法具有極強(qiáng)的搜索精度和求變功能,并且不易陷入局部最小值。
本研究提出基于遺傳算法優(yōu)化的支持向量機(jī)行駛工況識(shí)別算法(GA-SVM),算法流程見(jiàn)圖1。
圖1 GA-SVM算法流程
GA-SVM算法的基本步驟如下:
1) 網(wǎng)格搜索法粗搜索,設(shè)定懲罰因子C和核函數(shù)寬度g的搜索范圍和步長(zhǎng),合適的步長(zhǎng)有助于縮短搜索時(shí)間。
2) 根據(jù)網(wǎng)格搜索法,通過(guò)交叉驗(yàn)證法,得到粗搜時(shí)最優(yōu)的C*和g*值,作為下一步遺傳算法尋優(yōu)的依據(jù)。
3) 編碼:設(shè)定遺傳算法尋優(yōu)參數(shù)的范圍,其中C的范圍為[mC*,nC*],g的范圍為[mg*,ng*],并采用二進(jìn)制編碼。
4) 生成初始群體:隨機(jī)產(chǎn)生M個(gè)初始個(gè)體。
5) 計(jì)算個(gè)體的適應(yīng)度:以支持向量機(jī)交叉驗(yàn)證法的分類(lèi)準(zhǔn)確率作為評(píng)價(jià)每個(gè)個(gè)體適應(yīng)度的指標(biāo)。
6) 選擇,交叉,變異。
7) 終止條件判斷:設(shè)定迭代次數(shù),當(dāng)?shù)螖?shù)達(dá)到T時(shí),終止運(yùn)算,輸出最優(yōu)解。
在行駛工況識(shí)別的研究中,一般將城市工況分成4類(lèi)典型工況,即擁堵工況、城區(qū)工況、郊區(qū)工況和高速路工況[5]。1)擁堵工況:大部分集中在城市繁華地帶,怠速時(shí)間長(zhǎng),啟停頻繁,汽車(chē)平均速度低;2)高速路工況:行駛在高速公路上,交通暢通,汽車(chē)車(chē)速高,行駛距離長(zhǎng);3)郊區(qū)工況:位于城市郊區(qū),啟停少,巡航時(shí)間占比較高,行駛時(shí)間較長(zhǎng);4)城區(qū)工況:主要集中在城市的生活區(qū),交通流量較大,啟停較為頻繁,怠速時(shí)間較長(zhǎng)。本研究將這類(lèi)典型工況分別標(biāo)記為1,2,3,4。
本研究以某城市為例,使用一輛輕型汽車(chē)在該城市的4類(lèi)典型工況實(shí)際路段采集工況數(shù)據(jù)(采樣頻率為1 Hz),從采集設(shè)備上讀取CAN信號(hào)中的GPS速度、行駛時(shí)間、加速度,扭矩百分比等信號(hào),并保存在電腦中進(jìn)行后續(xù)處理。
本研究計(jì)劃采集4類(lèi)典型工況各100條行駛工況運(yùn)動(dòng)學(xué)片段,即汽車(chē)從怠速狀態(tài)開(kāi)始至下一個(gè)怠速狀態(tài)開(kāi)始之間的車(chē)速區(qū)間,每條片段應(yīng)同時(shí)包含怠速、加速、減速、巡航這四種運(yùn)動(dòng)狀態(tài),且每種狀態(tài)至少持續(xù)4 s。
由于汽車(chē)行駛數(shù)據(jù)的采集設(shè)備直接記錄的原始數(shù)據(jù)會(huì)包含一些不良數(shù)據(jù)值,需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,包括對(duì)異常值的刪除、缺失值的補(bǔ)齊和噪聲的濾波等,超長(zhǎng)怠速時(shí)間段也需要剔除。處理后的4個(gè)典型工況運(yùn)動(dòng)學(xué)片段見(jiàn)圖2。
圖2 典型行駛工況運(yùn)動(dòng)學(xué)片段
為了保證行駛工況識(shí)別的準(zhǔn)確率,需要足夠并有效的工況識(shí)別特征參數(shù),這些特征參數(shù)既要反映車(chē)輛運(yùn)行特性,又要反映速度波動(dòng)特性。原則上選取的特征參數(shù)數(shù)量越多,描述行駛工況特征信息的能力也就越強(qiáng),但是計(jì)算時(shí)間也越長(zhǎng),而數(shù)量過(guò)少會(huì)導(dǎo)致工況信息描述不準(zhǔn)確[13]。因此,在前人研究的基礎(chǔ)上,選取14個(gè)特征參數(shù)描述各典型工況運(yùn)動(dòng)學(xué)片段(見(jiàn)表1)。
表1 汽車(chē)行駛工況特征參數(shù)
通過(guò)選取的14個(gè)特征參數(shù)對(duì)工況運(yùn)動(dòng)學(xué)片段特征進(jìn)行表述,但如果直接使用這14個(gè)參數(shù)對(duì)運(yùn)動(dòng)學(xué)片段進(jìn)行分類(lèi),計(jì)算時(shí)間長(zhǎng)且處理繁瑣,故需要找出這14個(gè)參數(shù)之間的關(guān)聯(lián)性,將表述信息重疊的參數(shù)歸為一類(lèi)。這就需要利用主成分分析法(PCA)對(duì)其進(jìn)行降維處理,主成分分析法是利用線性變換相關(guān)知識(shí),使用少數(shù)幾個(gè)相互無(wú)關(guān)的變量代替原來(lái)的多個(gè)變量,并且可以綜合反映原始數(shù)據(jù)的大部分信息。具體步驟如下。
1) 對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
本次試驗(yàn)共采集了400條行駛工況運(yùn)動(dòng)學(xué)片段,每條運(yùn)動(dòng)學(xué)片段都有14個(gè)參數(shù)對(duì)其進(jìn)行描述,即構(gòu)成了一個(gè)400×14型的矩陣Z,將矩陣Z進(jìn)行標(biāo)準(zhǔn)化處理。
2) 判斷各個(gè)變量之間的相關(guān)性,計(jì)算各個(gè)數(shù)據(jù)之間的相關(guān)系數(shù)。
由標(biāo)準(zhǔn)化后的矩陣Z計(jì)算得到協(xié)方差矩陣C,并進(jìn)一步計(jì)算得到相關(guān)系數(shù)矩陣R。
3) 計(jì)算相關(guān)系數(shù)矩陣的特征值。
求得相關(guān)系數(shù)矩陣R的特征值,并按從大到小順序進(jìn)行排列。
4) 計(jì)算主成分貢獻(xiàn)率和累計(jì)貢獻(xiàn)率。
本研究采用SPSS軟件對(duì)400個(gè)行駛工況運(yùn)動(dòng)學(xué)片段的14個(gè)特征參數(shù)數(shù)據(jù)庫(kù)進(jìn)行主成分分析(PCA),得到14個(gè)主成分特征值和累計(jì)貢獻(xiàn)率(見(jiàn)表2)。
表2 各主成分特征值及貢獻(xiàn)率
表2中的特征值是主成分原始特征參數(shù)信息的表示,該值越大,對(duì)應(yīng)的主成分包含原有的14個(gè)特征參數(shù)信息就越多。當(dāng)主成分的特征值小于1時(shí),一般不會(huì)采用,因?yàn)楫?dāng)特征值小于1時(shí)說(shuō)明此主成分表達(dá)的信息不如原有的一個(gè)特征參數(shù)所表達(dá)的信息充分,達(dá)不到降維目的[14-15]。故選用主成分時(shí),一般采用特征值大于1的成分。從表2看出,前4個(gè)主成分的特征值都大于1,且累計(jì)貢獻(xiàn)率為83.259%,超過(guò)了80%,說(shuō)明這4個(gè)主成分就能代表原有的14個(gè)特征參數(shù)充分表達(dá)工況特征信息,因此,選擇前4個(gè)主成分作為GA-SVM識(shí)別算法的輸入?yún)?shù)。
本研究以行駛平均速度、最大速度、加速度段平均加速度、怠速比例作為GA-SVM算法的輸入?yún)?shù),從400個(gè)行駛工況運(yùn)動(dòng)學(xué)片段中隨機(jī)抽取80%作為訓(xùn)練樣本來(lái)訓(xùn)練并建立識(shí)別模型,剩下的20%作為測(cè)試樣本來(lái)驗(yàn)證識(shí)別模型的精度。
首先基于網(wǎng)格搜索法建立SVM識(shí)別算法模型,將C,g分別以2為底的指數(shù)離散,設(shè)置為C∈[2-4,24],g∈[2-4,24],進(jìn)行網(wǎng)格尋優(yōu),取識(shí)別精度最高時(shí)所對(duì)應(yīng)的C,g值作為最優(yōu)值。網(wǎng)格搜索法的尋優(yōu)過(guò)程見(jiàn)圖3。
圖3 網(wǎng)格搜索法尋優(yōu)3D圖
由圖3可以得出,此時(shí)最優(yōu)值C=8,g=1,最優(yōu)識(shí)別精度為94.06%。這種算法的80個(gè)隨機(jī)測(cè)試樣本的識(shí)別結(jié)果見(jiàn)圖4,由圖可見(jiàn),測(cè)試樣本有5個(gè)樣本被錯(cuò)誤識(shí)別。
圖4 網(wǎng)格搜索法SVM分類(lèi)結(jié)果
在此基礎(chǔ)上,使用遺傳算法進(jìn)行優(yōu)化,將種群數(shù)量設(shè)置為20,最大進(jìn)化次數(shù)設(shè)置為50,此時(shí)GA-SVM的尋優(yōu)過(guò)程見(jiàn)圖5。
圖5 GA-SVM算法的尋優(yōu)過(guò)程
由圖5得出,此時(shí)最優(yōu)值C=5.35,g=0.93,最優(yōu)識(shí)別精度為97.5%。測(cè)試樣本的識(shí)別結(jié)果見(jiàn)圖6,由圖可見(jiàn),測(cè)試樣本中有3個(gè)樣本被錯(cuò)誤識(shí)別。
圖6 GA-SVM算法分類(lèi)結(jié)果
經(jīng)過(guò)對(duì)比,基于GA-SVM算法的行駛工況識(shí)別精度相較于網(wǎng)格搜索尋優(yōu)算法的識(shí)別精度提高了3.44%,并且得到了更小的懲罰系數(shù)C。在保證識(shí)別精度的前提下,C值過(guò)大會(huì)導(dǎo)致過(guò)學(xué)習(xí)的情況發(fā)生,從而降低了識(shí)別模型的泛化能力,而C值越小,泛化能量就越強(qiáng)。仿真結(jié)果表明,運(yùn)用基于遺傳算法優(yōu)化的支持向量機(jī)識(shí)別模型可以很好地識(shí)別行駛工況類(lèi)型。
在某城市的擁堵工況、城區(qū)工況、郊區(qū)工況、高速路工況這4種典型工況的道路進(jìn)行實(shí)車(chē)行駛工況數(shù)據(jù)采集并進(jìn)行處理,定義了14個(gè)特征參數(shù)來(lái)描述行駛工況特性,然后利用主成分分析理論對(duì)特征參數(shù)進(jìn)行降維處理,提取出4個(gè)有效表征行駛工況的特征參數(shù)。
在網(wǎng)格搜索法的基礎(chǔ)上,提出基于遺傳算法優(yōu)化的支持向量機(jī)行駛工況識(shí)別算法,并通過(guò)仿真試驗(yàn)驗(yàn)證得知此方法在網(wǎng)格搜索法的基礎(chǔ)上將識(shí)別精度提高了3.44%,同時(shí)改善了C值過(guò)大導(dǎo)致過(guò)學(xué)習(xí)的情況。所研究的分類(lèi)模型可以用于新能源電動(dòng)汽車(chē)能量管理策略的開(kāi)發(fā)。