田元武,楊志文,王計廣,黎 蘇
(1.河北工業(yè)大學(xué)能源與環(huán)境工程學(xué)院,天津 300401;2.中國汽車技術(shù)研究中心,天津 300300)
汽車行駛工況反映了車輛運行過程中的運動狀態(tài)與行駛情況,由一組速度-時間曲線所表示。工況曲線廣泛地應(yīng)用在車輛動力裝置匹配、能量管理策略、排放特性研究等方面,是整車開發(fā)與檢測的重要因素。隨著我國城市化水平不斷提高,城市專用作業(yè)車輛的保有量也迎來了大幅增長,許多學(xué)者對專用作業(yè)車輛的行駛工況展開了研究。趙承輝等[1]以西安市某公交為例,以聚類分析法構(gòu)建了西安市的典型公交車工況;王志強等[2]以太原市某CNG公交為研究對象,構(gòu)建了太原市公交工況,并以此為基礎(chǔ)對CNG公交車排放特性進(jìn)行了研究。苗強等[3]基于聚類和馬爾可夫鏈法構(gòu)建了濟(jì)南市公交的典型工況曲線,并提出了相應(yīng)優(yōu)化方案。
上述研究大多聚焦在公交車上,而對城市內(nèi)工作的環(huán)衛(wèi)車的關(guān)注明顯不足。據(jù)統(tǒng)計,截至2016年底我國的環(huán)衛(wèi)車保有量為16.8 萬輛,經(jīng)過4 年的發(fā)展,在2020 年底達(dá)到了35.4 萬輛,平均每年增長約4.65 萬輛。Clark 等[4-6]開發(fā)的紐約環(huán)衛(wèi)車行駛工況(New York garbage truck cycle,NYGTC)工況被用于美國紐約市環(huán)衛(wèi)車的開發(fā)測試,但目前絕大多數(shù)國家的測試標(biāo)準(zhǔn)中并未將環(huán)衛(wèi)車單獨列出。我國現(xiàn)行的測試標(biāo)準(zhǔn)中采用以世界重型商用車瞬態(tài)循環(huán)(World Transient Vehicle Cycle,WTVC)為基礎(chǔ)修訂的C-WTVC工況進(jìn)行測試,該循環(huán)各工況的占比與環(huán)衛(wèi)車實際行駛狀態(tài)差異較大[7],不能體現(xiàn)環(huán)衛(wèi)車的實際運行狀態(tài)。綜上所述,構(gòu)建城市環(huán)衛(wèi)車的典型行駛工況對環(huán)衛(wèi)車的生產(chǎn)、維護(hù)、檢測具有十分重要的意義。
孫強等[8]以西安市一輛環(huán)衛(wèi)車為研究對象,采用聚類法構(gòu)建了西安市環(huán)衛(wèi)車行駛工況。由于單一的研究對象采集區(qū)域與路線固定,采集時段覆蓋較少,使得構(gòu)建結(jié)果的代表性不夠理想。為全面研究城市環(huán)衛(wèi)車的行駛工況與其特征,本文選取了在天津市10個行政區(qū)運行的72輛環(huán)衛(wèi)車作為研究對象。對所采集的數(shù)據(jù)進(jìn)行預(yù)處理后劃分運動學(xué)片段,以K-means聚類法[9]對片段進(jìn)行聚類,以GIS技術(shù)對聚類結(jié)果進(jìn)行可視化[10],明確環(huán)衛(wèi)車在空間上的運動特征與工作狀態(tài)。最后應(yīng)用鄰域搜索法完成類內(nèi)工況的選取,構(gòu)建了天津市環(huán)衛(wèi)車代表工況。
在本文的數(shù)據(jù)采集階段,考慮到環(huán)衛(wèi)車活動范圍大、作業(yè)時間長的工作特點,在天津市十個行政區(qū)(市內(nèi)六區(qū)與環(huán)城四區(qū))范圍內(nèi)通過移動終端采集了共72 輛環(huán)衛(wèi)車作的實際行駛數(shù)據(jù),采樣頻率為1 Hz,采樣類型包括車輛行駛速度、數(shù)據(jù)采集時間、GPS經(jīng)緯度信息等運動學(xué)信息,采樣時間包含工作日與休息日早晚高峰和非擁堵時間,能夠更加完整的反映環(huán)衛(wèi)車運行狀況。采集數(shù)據(jù)時長共782 ks,被采樣車輛具體情況如表1所示。
表1 采樣車輛詳情Tab.1 Details of Sampled Vehicles
車輛在數(shù)據(jù)采集的過程中,受到采集設(shè)備狀態(tài)、路況狀態(tài)、與環(huán)境信號等因素的干擾,導(dǎo)致原始數(shù)據(jù)存在異常值與缺失值。依據(jù)國內(nèi)的相關(guān)文獻(xiàn)和國外全球統(tǒng)一輕型車測試程序(World Light Vehicle Test Procedure,WLTP)對異常數(shù)據(jù)的處理方法[11],對加速度絕對值大于4 m/s2行駛數(shù)據(jù)進(jìn)行剔除。針對信號屏蔽所造成的缺失問題,若采集的數(shù)據(jù)發(fā)生缺失且缺失時長小于5 s,則保留此段行程并在段內(nèi)進(jìn)行插值,否則刪去這段短行程。預(yù)處理后的行駛數(shù)據(jù)的速度分布如圖1 所示。由圖1 可知,環(huán)衛(wèi)車在中心城區(qū)、主干路車速分布在0~20 km/h,在環(huán)線,次主干路上行駛速度相對較大,車速主要分布在0~40 km/h,具有工作區(qū)域速度低,通勤區(qū)域速度高的工作特點。
圖1 總體樣本速度分布圖Fig.1 Velocity distribution of the total sample
運動片段是指車輛行駛過程中兩次怠速狀態(tài)之間的運動行程[12],通常,一個運動片段具有怠速、加速、勻速、減速4 個狀態(tài),如圖2 所示??紤]到環(huán)衛(wèi)車工作地點多為擁堵路段,且完成環(huán)衛(wèi)車作業(yè)時有長時間的停留,本文將初始怠速狀態(tài)的時長限制在180 s 以下,以避免極端路況與長時間作業(yè)對工況構(gòu)建的影響。
圖2 運動片段示意圖Fig.2 Schematic of Kinematic sequence
在對運動片段進(jìn)行信息提取與聚類分析時,特征值的選取有很大的影響。本文從時間、加速度、速度3方面對運動片段進(jìn)行特征值的構(gòu)建,用以描述運動片段的15個特征參數(shù),如表2所示。
表2 運動片段特征參數(shù)Tab.2 Feature parameters of Kinematic sequence
根據(jù)上述要求對采集到的數(shù)據(jù)進(jìn)行運動片段劃分,共得到3 036個運動片段,時長共計162.4 ks。
依據(jù)表2計算每個運動片段的特征參數(shù),構(gòu)成了特征參數(shù)矩陣X3036×15。因在特征參數(shù)構(gòu)建時,15 個參數(shù)彼此的量綱不同、數(shù)量級差異大,直接對特征矩陣X3036×15進(jìn)行降維分析與聚類分析會導(dǎo)致結(jié)果的穩(wěn)定性較差。為此在對特征矩陣進(jìn)行進(jìn)一步處理前,先要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。
標(biāo)準(zhǔn)化是指將數(shù)據(jù)按比例縮放,使之落入一個小的特定區(qū)間,以此去除數(shù)據(jù)的單位限制,將其轉(zhuǎn)化為無量綱的純數(shù)值,便于不同單位或量級的指標(biāo)能夠進(jìn)行比較和加權(quán)。本文中使用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化的方法,處理后的數(shù)據(jù)樣本均值為0,方差為1,為后期降維創(chuàng)造了條件,具體計算方法如公式(1)所示。
標(biāo)準(zhǔn)化后的15個特征參數(shù)間的相關(guān)性強,需要使用主成分分析法(PCA)對特征矩陣進(jìn)行降維[13],從而達(dá)到節(jié)約計算資源,提升聚類準(zhǔn)確性的目的。
主成分分析法是指利用線性變換構(gòu)造出新變量(即主成分),使得各主成分間兩兩獨立且線性無關(guān),并保留了原變量的絕大部分特征信息。研究表明,若主成分的特征值大于1,且累積貢獻(xiàn)率在80%以上,即滿足行駛工況開發(fā)要求[14]。特征參數(shù)矩陣在主成分分析后得到的各主成分相應(yīng)特征值、貢獻(xiàn)率及累計貢獻(xiàn)率如表3所示,本文選取前5個主成分,累計貢獻(xiàn)率為82.7%,能夠達(dá)到降維目的,并反映特征參數(shù)矩陣的大部分信息。
表3 特征參數(shù)矩陣主成分分析結(jié)果Tab.3 PCA result of characteristic parameters
車輛的行駛工況可以分為多個類別,同一類別的片段具有相同的運動特征,不同類的片段運動特征差異明顯。K-means聚類法作為一種無監(jiān)督的分類方法,具有分類準(zhǔn)確、計算時間短、類內(nèi)相似度高、類間差異大的優(yōu)點,被廣泛的應(yīng)用于工況構(gòu)建領(lǐng)域,其具體過程如下。
1)確定樣本的k個初始聚類中心zj。
2)計算每個樣本點xi到最近聚類中心zj的歐氏距離。歐氏距離可以反映表征類別間的不相似性,從而根據(jù)最小距離的原則重新對樣本進(jìn)行劃分。
3)重新計算每個聚類的均值,將此均值作為新的聚類中心。
4)循環(huán)步驟2、3,直到每個聚類中心收斂為定值。
為了確定最佳聚類數(shù)k,本文采用Calinski-Harabasz(C-H)指標(biāo)評價聚類結(jié)果,并結(jié)合“肘部法”確定最佳聚類數(shù)。
C-H指標(biāo)是評價數(shù)據(jù)集聚類效果的參考,由分離度與緊密度的比值得到。因此,C-H指標(biāo)越大代表著類自身越緊密,類與類之間越分散,即更優(yōu)的聚類結(jié)果,其計算方法如公式(2)~公式(6):
式中:k代表聚類數(shù);N代表全部數(shù)據(jù)數(shù)目;SB為類間方差;SW為類內(nèi)方差;cq是在聚類q中的樣本點;Cq是在聚類q中的中心點;nq是聚類q中的樣本點數(shù)量;trace 只考慮了矩陣對角上的元素,即類q中所有數(shù)據(jù)點到類q中心點的歐幾里得距離。
如圖3 所示,CH 評分在k為3 時取得最大值,為1 342.8 分,之后隨著聚類數(shù)k的增大而減小,根據(jù)“肘部法”,本文將運動片段分為3類,各類片段樣本的特征值如表4所示。
圖3 C-H 指標(biāo)評分Fig.3 Calinski-Harabasz score
表4 聚類結(jié)果及特征參數(shù)Tab.4 Clustering results and characteristic parameters
由表4 所示,3種類別的片段數(shù)量分別為1 386、1 040、610,特征參數(shù)差異明顯。利用采集的GPS 信息對各個類別片段進(jìn)行可視化,結(jié)果如圖4所示。圖4的底圖以天津市城市核心城區(qū)為中心縮放而成,各類別樣本點依據(jù)GPS 信息在地圖上進(jìn)行映射。類別1 中的平均速度最小,怠速比例最大,累計行駛路程短、時間長,多分布在主干路與中心城區(qū),且分布集中,是典型的城區(qū)擁堵路況。類別2 的行駛速度較大、勻速比例高、加減速比例接近,與環(huán)衛(wèi)車作業(yè)區(qū)域重合度高,符合環(huán)衛(wèi)車作業(yè)時的特性。類別3具有行駛速度高、持續(xù)時間長的特性,多處在環(huán)線、快速路等行駛條件較好的路段,是城市道路通暢情況下的行駛工況,即環(huán)衛(wèi)車前往作業(yè)區(qū)域或作業(yè)結(jié)束后跟隨城市車流駛回停車場情景。
圖4 聚類結(jié)果空間分布Fig.4 Spatial distribution of clustering results
在類內(nèi)工況構(gòu)建過程中,考慮被采集環(huán)衛(wèi)車的工作區(qū)域大、工作時間不固定等特點,本文采用鄰域搜索-最小誤差的方法進(jìn)行類內(nèi)工況構(gòu)建,其具體流程如圖5所示。每類行駛工況的時長由公式(7)得出。
圖5 工況構(gòu)建流程Fig.5 Condition construction process
式中:ti表示第i類運動學(xué)片段在最終行駛工況曲線中所占的時間;Ti表示第i類運動學(xué)片段庫總共持續(xù)的時間之和;T表示全部運動學(xué)片段持續(xù)的時間之和;tr表示車輛行駛工況曲線的時長,此處為1 700 s。
在候選集選取中,本文依據(jù)最小距離法進(jìn)行排序,距離指每個運動片段與所屬類別簇心的歐氏距離,選每類中距簇心距離最小的100個片段作為候選集。在構(gòu)建了類內(nèi)的候選集后,每次從這3類候選集中隨機(jī)搜索,選取符合時間要求的運動學(xué)片段構(gòu)建關(guān)于行駛工況曲線的目標(biāo)集,最后根據(jù)目標(biāo)集σ中每條曲線的與總樣本的誤差大小選取誤差最小的曲線作為合成工況曲線。
隨機(jī)搜索-最小誤差的構(gòu)建方法引入了更高的自由度,這使得模型有一定的概率跳出局部最優(yōu)解,搜索到更好的解,降低最小誤差與平均誤差,獲得更具代表性的工況曲線。最終得到的工況曲線如圖6 所示。由圖6所展示的合成工況可知,3類運動片段的差異明顯,其時長分別為769 s、525 s、451 s。在低速工況中,車速值小,怠速時間長,啟停次數(shù)多,是環(huán)衛(wèi)車處于擁堵路況的運動特征;中速工況下速度處于30~50 km/h,怠速片段較低速工況較短;高速工況中,行駛速度大,怠速時間短,是環(huán)衛(wèi)車在環(huán)線、快速路的典型行駛狀態(tài)。
圖6 天津市環(huán)衛(wèi)車代表工況Fig.6 Driving cycle of of Tianjin sanitation truck
對合成的天津市環(huán)衛(wèi)車代表工況(Tianjin Sanitation Truck Cycle,TJSTC)進(jìn)行檢驗,以驗證其有效性。首先計算出合成工況與總樣本特征參數(shù)的誤差,如表5所示。結(jié)果表明,合成工況的平均速度、平均加速度、勻速比例等參數(shù)與總樣本的吻合程度較高,各特征參數(shù)的誤差在10%以下,相對誤差的算數(shù)平均值為4.60%,表明代表工況的運動學(xué)特征與總樣本基本一致,能體現(xiàn)城市環(huán)衛(wèi)車的真實工作狀態(tài)。
表5 合成工況與總樣本特征參數(shù)對比Tab.5 Comparison of synthetic conditions and total sample characteristic parameters
車輛運行狀態(tài)并不只與單一運動學(xué)特征有關(guān)。速度、加速度的聯(lián)合分布規(guī)律決定了發(fā)動機(jī)的比功率(VSP),是確定車輛行駛狀態(tài)的關(guān)鍵因素[1]。因此,對合成工況進(jìn)行速度-加速度聯(lián)合分布的驗證十分必要。如圖7所示,合成工況的高速段(40~60 km/h)占比較總樣本增大,是因為類別2、類別3兩類片段的抽取過程中,在該部分統(tǒng)計量較多。低速段(0~20 km/h)的分布趨勢比較一致,多位于加速度較小的區(qū)域內(nèi),符合環(huán)衛(wèi)車的工作特點。說明所構(gòu)建代表工況能很好地反映試驗數(shù)據(jù)樣本,表征城市環(huán)衛(wèi)車的實際行駛特征。
圖8 TJSTC 與其他代表工況對比Fig.8 Comparation between TJSTC and other cycles
為進(jìn)一步分析天津市環(huán)衛(wèi)車的運行工況,將所構(gòu)建的天津市環(huán)衛(wèi)車代表工況的部分特征參數(shù)與C-WTVC 標(biāo)準(zhǔn)工況、C-WTVC*工況、中國自卸行駛汽車工況(China Heavy-duty Commercial Vehicle Test Cycle for Dumper,CHTC-D)工況進(jìn)行對比。其中,C-WTVC*工況為C-WTVC標(biāo)準(zhǔn)工況去除432 s的高速段后的工況。
TJSTC工況具有勻速比例、怠速比例大、速度變化趨勢平緩、平均速度小的特點。相比于C-WTVC工況,TJSTC工況的平均速度約為C-WTVC工況的30%,勻速、怠速比例略高,其主要原因是環(huán)衛(wèi)車在清潔作業(yè)時必須保持穩(wěn)定的較低車速??紤]此因素的影響,將去除高速段的C-WTVC*工況與TJSTC工況進(jìn)行對比,結(jié)果表明,C-WTVC*雖在平均速度上與TJSTC更為接近,但加速、勻速比例與TJSTC工況差異依舊明顯。與CHTD-D 工況相比,TJSTC 工況的平均速度、加減速比例較低,勻速比例較高。與其他3種標(biāo)準(zhǔn)工況對比表明,現(xiàn)有的C-WTVC工況、C-WTVC*工況、CHTC-D工況與TJSTC 工況差異較大,難以有效的反映城市環(huán)衛(wèi)車的實際工作狀態(tài),不適用與城市環(huán)衛(wèi)車的工作測試。
1)本文以天津市環(huán)衛(wèi)車為研究對象,采用自主駕駛法采集數(shù)據(jù)782 ks,經(jīng)過數(shù)據(jù)清洗、片段劃分后,得到運動片段3 036 個,運用python 語言編寫程序腳本,獲得各片段的特征值,并以主成分分析法、Kmeans聚類法、肘部法對運動片段進(jìn)行聚類處理,最后用鄰域搜索法完成了時長為1 745 s的天津市環(huán)衛(wèi)車典型工況構(gòu)建。
2)通過GIS技術(shù)對環(huán)衛(wèi)車工況曲線進(jìn)行可視化,3類片段的空間分布規(guī)律符合環(huán)衛(wèi)車的工作特點。特征值誤差分析與速度-加速度聯(lián)合概率分布表明,合成工況與總樣本的誤差為4.60%,且速度-加速度分布趨勢相似,說明合成工況可以很好地反映總體采集樣本。
3)將構(gòu)建的TJSTC工況與現(xiàn)有標(biāo)準(zhǔn)工況進(jìn)行對比,結(jié)果表明環(huán)衛(wèi)車TJSTC具有勻速比例高、平均速度低、加減速比例小的運行特點,能真實地表征城市環(huán)衛(wèi)車運行狀態(tài),為區(qū)域內(nèi)環(huán)衛(wèi)車性能優(yōu)化提供了有效的支持。