王瓏迪,何超,李加強(qiáng),劉學(xué)淵,王浩
(1.西南林業(yè)大學(xué)機(jī)械與交通學(xué)院,云南 昆明 650000;2.云南省高校高原山區(qū)機(jī)動(dòng)車環(huán)保與安全重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650224)
缸內(nèi)直噴(GDI)汽油機(jī)具有良好的動(dòng)力性、瞬態(tài)響應(yīng)能力、燃油經(jīng)濟(jì)性等優(yōu)點(diǎn),采用GDI技術(shù)的車型在市場(chǎng)上的占有率也越來(lái)越高。但有研究表明,與進(jìn)氣道噴射(Port Fuel Injection, PFI)輕型汽油車相比,缸內(nèi)直噴汽車的部分污染物排放量增加[1]。準(zhǔn)確預(yù)測(cè)GDI汽油車在實(shí)際道路的污染物排放,有利于減少重復(fù)RDE試驗(yàn)帶來(lái)的時(shí)間投入和經(jīng)濟(jì)投入,并為GDI汽油車排放提供基礎(chǔ)數(shù)據(jù)支撐,為制定污染控制策略提供依據(jù)。
近年來(lái),國(guó)內(nèi)外學(xué)者將機(jī)器學(xué)習(xí)應(yīng)用到排放預(yù)測(cè)領(lǐng)域。王志紅等[2]對(duì)一輛重型柴油車進(jìn)行了道路污染物排放特性測(cè)試,利用測(cè)得的數(shù)據(jù),在雙隱含層反向傳播神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上引入GA遺傳算法優(yōu)化網(wǎng)絡(luò)的權(quán)值和閾值,構(gòu)建CO和NOx的排放預(yù)測(cè)模型,在整體誤差水平上,CO和NOx排放因子的相對(duì)誤差分別為2.61%和6.71%。Cha等[3]建立了基于最小二乘回歸法的多元回歸模型對(duì)輕型柴油車CO2排放量進(jìn)行預(yù)測(cè),并引入移動(dòng)平均法對(duì)采集的數(shù)據(jù)進(jìn)行濾波處理,消除預(yù)測(cè)變量的不確定性。結(jié)果表明,基于回歸方程的CO2預(yù)測(cè)值與CO2的實(shí)際值高度相關(guān),模型預(yù)測(cè)精度較高。Claudio Maino等[4]提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)規(guī)劃算法的混合動(dòng)力車CO2排放預(yù)測(cè)模型,開(kāi)發(fā)了一種自動(dòng)搜索工具(AST)對(duì)神經(jīng)網(wǎng)絡(luò)中的參數(shù)進(jìn)行尋優(yōu),捕捉混合動(dòng)力汽車結(jié)構(gòu)設(shè)計(jì)參數(shù)和CO2排放之間的相關(guān)性,仿真試驗(yàn)結(jié)果表明,該模型的平均回歸誤差低于1%。
國(guó)內(nèi)外對(duì)于排放預(yù)測(cè)模型的研究主要集中于平原地區(qū),相較而言高原地區(qū)排放預(yù)測(cè)模型的研究較少。我國(guó)高原分布廣闊,海拔1 000 m以上的高原面積約占中國(guó)總面積的58%,2 000 m以上的高原占33%[5-6]。機(jī)動(dòng)車在高原地區(qū)行駛時(shí),由于海拔的升高,大氣壓力降低,吸入缸內(nèi)的進(jìn)氣量減少,將導(dǎo)致發(fā)動(dòng)機(jī)動(dòng)力性和經(jīng)濟(jì)性下降、部分污染物排放增加[7]。由于單一模型并不能很好地?cái)M合不平穩(wěn)的時(shí)間序列數(shù)據(jù)[8],基于此,本研究提出了基于XGBoost-SVR組合模型的高原環(huán)境GDI汽油車CO和PN排放預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)高原環(huán)境下GDI汽油車CO和PN的精準(zhǔn)預(yù)測(cè)。
奇異譜分析(SSA)是一種處理非線性時(shí)間序列的方法[9],而汽油機(jī)污染物排放序列受到道路坡度、道路等級(jí)、駕駛員習(xí)慣等多種因素影響,是一種非平穩(wěn)、非線性的時(shí)間序列,利用奇異譜分析對(duì)數(shù)據(jù)進(jìn)行分解、重構(gòu),可以提取有效趨勢(shì)信息,去除時(shí)間序列中的噪聲部分。SSA的分析對(duì)象是有限長(zhǎng)一維時(shí)間序列,以CO排放序列為例,定義CO排放序列數(shù)據(jù)為{x1,x2,…xN},然后計(jì)算軌跡矩陣X:
(1)
式中:K=N-L+1。通常情況下,滑動(dòng)窗口長(zhǎng)度L
(2)
(3)
XGBoost模型的基本單元為回歸樹(shù)[10],表達(dá)式為
(4)
XGBoost模型在每次迭代中加入新的函數(shù),分別對(duì)應(yīng)一顆回歸樹(shù),新生成的回歸樹(shù)與之前所有樹(shù)預(yù)測(cè)的誤差進(jìn)行擬合,迭代公式為
(5)
式中:t表示迭代次數(shù)。
XGBoost目標(biāo)函數(shù)的表達(dá)式如下:
(6)
(7)
式中:ωj為第j個(gè)葉子節(jié)點(diǎn)的權(quán)重;T為葉子結(jié)點(diǎn)個(gè)數(shù);λ為正則化懲罰項(xiàng)系數(shù),保證葉子結(jié)點(diǎn)權(quán)重不會(huì)太大;γ為懲罰函數(shù)系數(shù),防止葉子結(jié)點(diǎn)個(gè)數(shù)過(guò)多。
XGBoost對(duì)目標(biāo)函數(shù)進(jìn)行泰勒二階展開(kāi),得到的目標(biāo)函數(shù)表達(dá)式為
(8)
(9)
進(jìn)一步對(duì)ωj求導(dǎo)得葉子的最優(yōu)權(quán)重:
(10)
最優(yōu)目標(biāo)函數(shù)為
(11)
式中:Ij表示葉子結(jié)點(diǎn)的樣本集合。
支持向量機(jī)回歸(Support Vector Regression,SVR)是一種用于分類和回歸的監(jiān)督學(xué)習(xí)算法,通過(guò)非線性映射函數(shù)φ(t),將低維空間的樣本映射到高維空間,從而進(jìn)行非線性數(shù)據(jù)的擬合[11]。假定樣本集為{xi,yi},其中xi是輸入向量,yi是輸出向量。SVR模型的決策函數(shù)表示為
f(x)=ωTφ(x)+b。
(12)
式中:ω為權(quán)重系數(shù);φ(x)為將輸入向量x從輸入空間映射到更高維空間的非線性映射函數(shù);b為偏置量。SVR模型的訓(xùn)練過(guò)程可以看作尋找最優(yōu)的ω,b,使f(xi)無(wú)限接近yi,即
(13)
f(xi)-yi≤ε+ξi,
(14)
(15)
(16)
(17)
式中:k(x,xi)為核函數(shù)。
基于XGBoost和SVR提出了一種組合模型對(duì)高原環(huán)境下GDI汽油車CO和PN的瞬時(shí)排放進(jìn)行預(yù)測(cè),具體流程如圖1所示。
圖1 組合模型流程
組合模型的預(yù)測(cè)首先使用SSA對(duì)CO和PN的原始數(shù)據(jù)進(jìn)行降噪處理,利用訓(xùn)練集數(shù)據(jù)進(jìn)行XGBoost建模,利用XGBoost模型獲得初始的預(yù)測(cè)值,計(jì)算真實(shí)值與初始預(yù)測(cè)值的殘差,利用SVR模型進(jìn)行殘差修正,最后將SVR模型預(yù)測(cè)的殘差結(jié)果與XGBoost模型的初始預(yù)測(cè)值相加得到最終的預(yù)測(cè)結(jié)果,具體過(guò)程如下:
1) SSA降噪。高原環(huán)境下GDI汽油機(jī)的CO和PN的排放序列受到多種因素的影響,是一種非平穩(wěn)、非線性的時(shí)間序列數(shù)據(jù),SSA可以將數(shù)據(jù)進(jìn)行分解重構(gòu),丟棄數(shù)據(jù)內(nèi)的噪聲部分,保留數(shù)據(jù)的有效趨勢(shì)信息。
(18)
4) 將XGBoost模型的預(yù)測(cè)結(jié)果與SVR模型獲得的殘差預(yù)測(cè)值相加,得到最終的預(yù)測(cè)值,即
(19)
本研究采用均方根誤差RMSE[12]、決定系數(shù)R2[13]評(píng)估模型性能。計(jì)算公式如下:
(20)
(21)
試驗(yàn)采用便攜式車載排放測(cè)試系統(tǒng)(Portable Emission Measurement System,PEMS)對(duì)一臺(tái)國(guó)Ⅴ輕型汽油車進(jìn)行測(cè)試,被測(cè)車輛采用缸內(nèi)直噴的供油方式。將PEMS安裝到測(cè)試車輛上,接通電源,預(yù)熱完畢后對(duì)氣體分析儀進(jìn)行標(biāo)零標(biāo)定。國(guó)六標(biāo)準(zhǔn)的進(jìn)一步擴(kuò)展海拔條件為1 300~2 400 m。此外,國(guó)六標(biāo)準(zhǔn)規(guī)定,PEMS檢測(cè)道路中試驗(yàn)開(kāi)始點(diǎn)和結(jié)束點(diǎn)之間海拔差不得超過(guò)100 m,并且累計(jì)正海拔增加量不超過(guò)1 200 m/100 km。因此,選定如圖2所示的試驗(yàn)路線。試驗(yàn)路線包括市區(qū)、市郊和高速路段,具體道路信息見(jiàn)表1。PEMS設(shè)備在發(fā)動(dòng)機(jī)第一次起動(dòng)前開(kāi)始記錄數(shù)據(jù),在試驗(yàn)期間不間斷地記錄污染物濃度和環(huán)境條件。按照規(guī)定的試驗(yàn)工況駕駛車輛,達(dá)到要求后停止試驗(yàn)。RDE試驗(yàn)持續(xù)102 min,將試驗(yàn)采集到的數(shù)據(jù)按照3∶1∶1的比例劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集。
對(duì)測(cè)得的輕型汽油車的PN和CO排放數(shù)據(jù)進(jìn)行SSA分解,窗口長(zhǎng)度L設(shè)置為10。從圖3可以看出,對(duì)于CO和PN,前五個(gè)成分明顯大于其他部分,可以代表原序列的大部分信息,提取前五個(gè)主成分重構(gòu)CO和PN序列,其余部分是可以去除的噪聲部分。
圖3 CO和PN的組件特征
圖4示出SSA處理后的CO和PN部分排放序列結(jié)果。從圖4可以看出,重構(gòu)后的序列保留了原序列的總體變化情況,并且剔除了異常值,重構(gòu)后的數(shù)據(jù)更有利于GDI汽油車CO和PN的瞬態(tài)排放預(yù)測(cè)。
圖4 SSA處理前后部分污染物排放序列比較
基于XGBoost模型對(duì)重構(gòu)后的CO和PN排放序列進(jìn)行初步預(yù)測(cè),利用網(wǎng)格搜索結(jié)合4折交叉驗(yàn)證尋找模型最優(yōu)超參數(shù),主要調(diào)節(jié)參數(shù)及范圍見(jiàn)表2。最終選定XGBoost模型學(xué)習(xí)率為0.006,決策樹(shù)數(shù)量為1 000,樹(shù)的最大深度為3。使用XGBoost模型的預(yù)測(cè)結(jié)果如圖5所示。從圖5可以看出,XGBoost單一模型在整體的排放趨勢(shì)上與試驗(yàn)值相一致,但在某些波峰、波谷處存在較大誤差,因此利用SVR模型進(jìn)行殘差修正。
表2 XGBoost超參數(shù)含義及其取值范圍
圖5 XGBoost模型預(yù)測(cè)結(jié)果
本研究SVR模型中的核函數(shù)選擇徑向基函數(shù)(RBF),核函數(shù)的表達(dá)式如下:
(22)
將原始數(shù)據(jù)與XGBoost模型預(yù)測(cè)數(shù)據(jù)作差,得到殘差序列,將原始數(shù)據(jù)和殘差序列代入SVR模型,殘差的預(yù)測(cè)結(jié)果如圖6所示。
圖6 SVR殘差預(yù)測(cè)結(jié)果
將XGBoost預(yù)測(cè)結(jié)果與SVR預(yù)測(cè)結(jié)果相加得到最終的預(yù)測(cè)結(jié)果,如圖7所示。從圖7中可以看出,對(duì)于XGBoost單一模型,在某些波峰、波谷處CO和PN的瞬時(shí)排放預(yù)測(cè)結(jié)果與實(shí)測(cè)值誤差較大,這是由于在波峰、波谷附近,發(fā)動(dòng)機(jī)工況在短時(shí)間內(nèi)發(fā)生變化,預(yù)測(cè)模型響應(yīng)時(shí)間受到限制,導(dǎo)致預(yù)測(cè)精度不足。而組合模型通過(guò)SVR殘差修正,預(yù)測(cè)結(jié)果能與實(shí)測(cè)值較好地吻合。相比于XGBoost單模型,組合模型的擬合精度得到提高。組合模型和XGBoost模型對(duì)CO和PN的瞬態(tài)排放預(yù)測(cè)的精度對(duì)比見(jiàn)表3。在高原環(huán)境GDI汽油車瞬態(tài)CO排放預(yù)測(cè)中,組合模型RMSE和R2的值相比于XGboost單一模型分別提高了22.9%和25.1%;在瞬態(tài)PN排放預(yù)測(cè)中,組合模型RMSE和R2的值相比于XGboost單一模型分別提高了39.7%和12.8%。從RMSE和R2的值可以看出,組合模型具有更高的預(yù)測(cè)精度。
圖7 組合模型預(yù)測(cè)結(jié)果
提出了一種基于XGBoost預(yù)測(cè)時(shí)間序列結(jié)合SVR殘差修正的高原環(huán)境下GDI汽油車排放預(yù)測(cè)模型,以一輛高原環(huán)境下的GDI汽油車作為研究對(duì)象進(jìn)行實(shí)證研究。對(duì)原始排放數(shù)據(jù)進(jìn)行SSA降噪,去除原始數(shù)據(jù)中異常值,經(jīng)SSA降噪后建立的組合模型表現(xiàn)出良好的預(yù)測(cè)性能;對(duì)CO和PN排放預(yù)測(cè)的RMSE分別為0.037和0.047,且決定系數(shù)R2均大于0.9。利用XGBoost-SVR組合模型對(duì)高原環(huán)境下GDI汽油車瞬時(shí)排放中CO和PN進(jìn)行預(yù)測(cè),結(jié)果表明,組合模型相比于單一的XGBoost模型,RMSE分別提高了22.9%和39.7%,R2分別提高了25.1%和12.8%。