蔡鍔 李陽陽 李春明 譚曉偉 劉東民
(長(zhǎng)安大學(xué))
汽車尾氣是城市空氣的重要污染源之一,而不同交通條件下的汽車行駛工況將直接影響尾氣排放。目前,通過對(duì)汽車全行駛過程的各運(yùn)動(dòng)學(xué)片段進(jìn)行分析,構(gòu)建一個(gè)典型的合成行駛工況并在試驗(yàn)環(huán)境中模擬該工況,是國(guó)內(nèi)外進(jìn)行尾氣排放測(cè)試研究的熱點(diǎn)之一[1~4]。近年來,西安市機(jī)動(dòng)車數(shù)量快速增加,汽車尾氣污染已成為突出的環(huán)境問題之一,因此研究市區(qū)行駛工況對(duì)控制汽車排放污染和制定相關(guān)政策具有重要意義[5,6]。
本文借助高精度GPS車速儀采集車輛的短行程樣本,并從多參數(shù)評(píng)價(jià)角度出發(fā)對(duì)短行程樣本進(jìn)行特征提取,獲取了表征其特性的高維特征值向量。同時(shí),采用核主分量分析(KPCA)實(shí)現(xiàn)高維特征向量降維,在消除高維特征值之間冗余量的同時(shí),提取了高維特征值之間的非線性聯(lián)系。最后采用基于K-均值的聚類算法對(duì)降維后的特征向量進(jìn)行了分析,獲得了代表市區(qū)不同聚類行駛工況的樣本,并且按照離聚類中心最近的原則選擇各聚類的典型樣本合成為西安市汽車行駛工況。
采用英國(guó)Race Technology公司生產(chǎn)的型號(hào)為DL1 PRO的GPS車速記錄儀(圖1)進(jìn)行原始數(shù)據(jù)采集。GPS車速記錄儀內(nèi)置三軸加速度傳感器,GPS刷新率達(dá)20 Hz,通過內(nèi)置存儲(chǔ)卡可對(duì)車輛的行駛速度、加速度、位置信息及模擬量、開關(guān)量等多種參數(shù)進(jìn)行實(shí)時(shí)測(cè)量和存儲(chǔ)。由于該設(shè)備直接內(nèi)置加速度傳感器,可以通過加速度值對(duì)測(cè)量數(shù)據(jù)進(jìn)行插補(bǔ),防止了試驗(yàn)車輛在城市中因建筑物密集導(dǎo)致GPS信號(hào)丟失而引起的數(shù)據(jù)缺失,保證了采集的原始數(shù)據(jù)的完整性。為使采集的數(shù)據(jù)能真實(shí)有效地反映西安市道路行駛工況,根據(jù)西安城區(qū)的分布特點(diǎn),利用4輛私家車按照各自正常目的地、緊跟行駛車流的方式進(jìn)行原始數(shù)據(jù)采集。車輛的行駛范圍涵蓋三環(huán)內(nèi)城區(qū)的主要干線道路,時(shí)間為早7點(diǎn)至晚8點(diǎn),采集天數(shù)為60天,采樣時(shí)間間隔為0.1 s,總行駛里程約為5000 km。
首先采用短行程法對(duì)GPS車速儀原始采集數(shù)據(jù)進(jìn)行片段劃分。當(dāng)車輛速度低于0.5 km/h時(shí),將其定義為車輛怠速狀態(tài),車輛從怠速結(jié)束至下一個(gè)怠速結(jié)束所行駛的距離為1個(gè)短行程[7]。將所采集的一段原始車速曲線按照短行程定義進(jìn)行劃分,共包含7個(gè)短行程,如圖2所示。為對(duì)短行程數(shù)據(jù)進(jìn)行全面評(píng)價(jià),從時(shí)間、速度和加速度3個(gè)方面對(duì)所劃分的短行程原始數(shù)據(jù)進(jìn)行特征提取,提取的特征參數(shù)如表1所列,所得高維特征向量將作為短行程樣本聚類分析的原始數(shù)據(jù)集。
為全面分析行駛工況數(shù)據(jù)的分布特點(diǎn),需要采用盡可能多的特征參數(shù)去表征,在獲取全面信息的同時(shí),由于各特征參數(shù)之間存在一定的冗余性,如果直接采用高維特征向量進(jìn)行聚類分析,不僅算法的運(yùn)算量較大,而且特征的冗余量會(huì)導(dǎo)致無法抓住行駛工況的本質(zhì)信息。因此需要對(duì)原始高維特征向量進(jìn)行降維,在降低運(yùn)算量的同時(shí)消除特征向量之間的冗余性。短行程提取的時(shí)間、行駛距離、速度和加速度等特征值之間明顯存在非線性關(guān)系,因此采用KPCA對(duì)原始特征集進(jìn)行降維。KPCA是一種非線性降維方法,通過核函數(shù)將原始數(shù)據(jù)從數(shù)據(jù)空間變換到特征空間,然后在特征空間利用PCA算法進(jìn)行線性降維。
表1 汽車行駛工況特征參數(shù)
KPCA的求解步驟[10,11]為:首先通過非線性映射函數(shù)φ(x)實(shí)現(xiàn)樣本xk∈Rm(k=1,2,…,N)從樣本空間到特征空間的非線性映射,并得到如下協(xié)方差矩陣:
得到如下特征值計(jì)算式:
式中,R為樣本集合;m為樣本特征數(shù)目;N為樣本數(shù)目;λi是C的一個(gè)非零特征值;ui是對(duì)應(yīng)的特征向量。
通過引入核矩陣K∈RN×N,=,式(1)可轉(zhuǎn)換為如下特征值計(jì)算式:
k(xi,xj)是核函數(shù),本文采用的是高斯核函數(shù):
式中,σ為核函數(shù)寬度,將其設(shè)置為1。
式(3)的特征值λ1,λ2,…,λd(λ1,>λ2,…,>λd)和對(duì)應(yīng)特征向量ξ1,ξ2,…,ξd保留前k(k<d)個(gè)主成分,則yk=(ξ1,ξ2,…,ξk)Tx為降維后數(shù)據(jù)。
將所采集的行駛工況原始數(shù)據(jù)進(jìn)行短行程劃分,共獲得734個(gè)短行程,每個(gè)短行程按照表1進(jìn)行特征值提取,在對(duì)高維特征集數(shù)據(jù)歸一化的基礎(chǔ)上對(duì)其進(jìn)行KP?CA降維。由于前5維主成分貢獻(xiàn)量為89.6%,根據(jù)主成分貢獻(xiàn)率大于85%的原則[11],決定保留前5個(gè)主成分,并將其作為聚類分析特征集。
車輛的設(shè)計(jì)和開發(fā)不能只滿足一種工況,需針對(duì)不同交通狀況的多種水平層次的工況來設(shè)計(jì)[1]。根據(jù)提取的行駛工況特征,車輛的行駛工況可劃分為多個(gè)類,不同類之間的樣本行駛工況特征差異明顯,而同類樣本的行駛工況特征類似。樣本進(jìn)行分類后,再?gòu)牟煌愔羞x取具有代表性的典型樣本,最后構(gòu)成合成行駛工況。顯然,行駛工況分析是一個(gè)典型的無監(jiān)督聚類問題,在事先不確定樣本類別的前提下,對(duì)行駛工況樣本聚類的精確程度將直接影響后續(xù)的工況合成。
將K-均值聚類算法用于降維后的短行程工況特征參數(shù)聚類。K-均值聚類算法是一種基于樣本間相似性度量的間接聚類方法,目標(biāo)是最小化所有樣本與之相應(yīng)的聚類中心之間的距離平方和,屬于非監(jiān)督學(xué)習(xí)方法。此算法以k為參數(shù),將n個(gè)對(duì)象分為k個(gè)聚類,使類內(nèi)樣本具有較高的相似度,而類間樣本的相似度較低。
K-均值聚類算法流程[12]如下:
a.從原數(shù)據(jù)集S={x1,x2,…,xn}中隨機(jī)選取k個(gè)輸入初始聚類中心z1,z2,…,zk;
b.根據(jù)每個(gè)聚類中所有樣本點(diǎn)的均值計(jì)算樣本集中每個(gè)樣本點(diǎn)與這些均值的距離,并根據(jù)最小距離重新對(duì)樣本進(jìn)行劃分;
c.重新計(jì)算每個(gè)聚類的均值;
d. 循環(huán)執(zhí)行步驟b和c,直到每個(gè)聚類不再發(fā)生變化為止。
圖3為降維后的前3維短行程特征散點(diǎn)圖,采用K-均值聚類法對(duì)所有樣本進(jìn)行了聚類分析,不同聚類的樣本采用不同顏色表示,每個(gè)聚類的中心也被標(biāo)識(shí)。由圖3可看出,短行程特征樣本被有效分為3個(gè)聚類。此外,分別計(jì)算了第1主成分和表1中每個(gè)工況特征參數(shù)的相關(guān)系數(shù),發(fā)現(xiàn)行駛距離L、行駛時(shí)間T、怠速比例Tidl、平均行駛速度Vmean、最高行駛加速度Amax等5個(gè)特征參數(shù)的相關(guān)系數(shù)超過0.8,表明這些特征參數(shù)值與第1主成分值緊密相關(guān),因此可以通過分別計(jì)算相同聚類樣本的特征平均值,對(duì)短行程聚類結(jié)果進(jìn)行分析。
不同聚類的樣本特征平均值如表2所列,由表2可知,不同聚類的樣本代表不同的短行程工況,各樣本特征平均值差異明顯。其中聚類1樣本的行駛距離和行駛時(shí)間最短,怠速比例最高,相應(yīng)的平均行駛速度和最大加速度最小,表明聚類1樣本為典型的城市擁堵行駛工況樣本;而聚類3樣本特性相反,其行駛距離和行駛時(shí)間最長(zhǎng),怠速比例最低,相應(yīng)的平均行駛速度和最大加速度最大,樣本3應(yīng)為典型的城市道路通暢行駛工況樣本;聚類2樣本的特性介于聚類樣本1和聚類3樣本之間,其代表的是介于擁堵與通暢之間的城市道路綜合行駛工況樣本。
表2 不同聚類的樣本特征平均值
根據(jù)短行程特征聚類結(jié)果,計(jì)算聚類1、2和聚類3的樣本數(shù)占總樣本數(shù)的比例,分別為12.53%、22.39%和65.08%。分別從不同聚類樣本中選取相應(yīng)數(shù)量且離聚類中心最近的短行程樣本構(gòu)成各自的合成行駛工況,選擇的短行程數(shù)量由該聚類樣本數(shù)占總樣本數(shù)的百分比和最終合成行駛工況持續(xù)時(shí)間所決定。合成的擁堵行駛工況、綜合行駛工況和暢通行駛工況的時(shí)間-速度曲線如圖4所示。將此3種典型合成行駛工況依次首尾相接,最后合成持續(xù)時(shí)間為1166 s、平均速度為21.51 km/h、距離為6.9 km的西安市城區(qū)合成行駛工況,如圖5所示。
計(jì)算了西安市合成行駛工況的6個(gè)特征參數(shù),并與國(guó)外主要行駛工況標(biāo)準(zhǔn)進(jìn)行了對(duì)比,結(jié)果如表3所列。
表3 西安市合成行駛工況與國(guó)外主要行駛工況標(biāo)準(zhǔn)的特征值比較
由表3可知,西安市合成行駛工況的怠速比例Tidl與其它標(biāo)準(zhǔn)相比較低,最接近于歐洲標(biāo)準(zhǔn);平均行駛速度Vmean低于其它工況標(biāo)準(zhǔn),與日本標(biāo)準(zhǔn)相當(dāng);最高行駛加速度Amax和平均行駛加速度Amean均高于其它工況標(biāo)準(zhǔn),與紐約市區(qū)標(biāo)準(zhǔn)最接近??傮w上評(píng)價(jià),西安市工況更接近于日本J10-15標(biāo)準(zhǔn),但加速度要大很多。
本文借助先進(jìn)的測(cè)試儀器采集了西安市區(qū)的汽車行駛工況原始數(shù)據(jù)。采用短行程法,結(jié)合基于KPCA的非線性降維算法和基于K-均值的聚類算法合成了平均速度21.51 km/h、持續(xù)時(shí)間1166 s、距離6.9 km的西安市城區(qū)合成行駛工況。將該工況與其它工況標(biāo)準(zhǔn)對(duì)比表明,西安市城區(qū)汽車行駛合成工況接近于日本J10-15標(biāo)準(zhǔn),但具有較大的加速度數(shù)值。
1 Zhang Xiao,Zhao DuiJia,Shen JunMin.A Synthesis of Methodologies and Practices for Developing Driving Cycles.Energy Procedia,2012(16):1868 ~1873.
2 Sanghpriya H.Kamble,Tom V.Mathew,G.K.Sharma.De?velopment of real-world driving cycle:Case study of Pune,India.Transportation Research Part D 14(2009):132~140.
3 Sze-Hwee Ho,Yiik-Diew Wong,Victor Wei-Chung Chang.Developing Singapore Driving Cycle for passenger cars to es?timate fuel consumption and vehicular emissions.Atmo?spheric Environment 97(2014):353~362.
4 鄭與波,石琴,王世齡.合肥市汽車行駛工況的研究.汽車技術(shù),2010(10):34~39.
5 馬洪龍,丁建勛,王桂龍,等.小波變換在道路行駛工況構(gòu)建中的應(yīng)用.汽車工程學(xué)報(bào),2014(1):56~60.
6 董恩源,顏文勝,申江衛(wèi),等.聚類分析法在城市公交行駛工況開發(fā)中的應(yīng)用.昆明理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2013(5):41~45.
7 劉希玲,丁焰,我國(guó)城市汽車行駛工況調(diào)查研究,環(huán)境科學(xué)研究,2000,1(13):23~28.
8 Sebastian Mika,Bernhard Sch?lkopf,Alex J Smola,Klaus-Robert Müller,Matthias Scholz,Gunnar R?tsch,Kernel PCA and de-noising in feature spaces,Advances in Neural Information Processing Systems 11(1999):536 ~542.
9 Fangjun Kuang,Weihong Xu,Siyang Zhang.A novel hy?brid KPCA and SVM with GA model for intrusion detection.Applied Soft Computing,2014,5(18):178~184.
10 Leonard Kaufman,Peter J.Rousseeuw,finding groups in data:An introduction to cluster analysis,Wiley(1990).