国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

改進全局K-Means聚類算法的汽車行駛工況研究*

2021-07-08 02:17徐淑萍熊小墩蘇小會張玉西
西安工業(yè)大學學報 2021年3期
關鍵詞:特征參數(shù)運動學全局

徐淑萍,熊小墩,蘇小會,張玉西

(西安工業(yè)大學 計算機科學與工程學院,西安 710021)

汽車行駛工況又稱汽車運轉(zhuǎn)循環(huán),是用來描述特定交通環(huán)境下車輛行駛特征的速度-時間歷程[1]。它是汽車行業(yè)一項重要的通用基礎技術,主要用于評價車輛污染物排放和能源消耗,對新車型技術研發(fā)與交通控制風險評估等研究具有重要價值[2]。目前,歐、美、日等發(fā)達國家均采用適用于本國道路的行駛工況來對汽車性能指標進行優(yōu)化標定及排放認證。為了完善汽車行駛工況的構(gòu)建方法,開發(fā)出符合我國各地區(qū)城市交通狀況的特征,近年來,國內(nèi)學者對于汽車行駛工況進行了深入的研究,并且取得了一些研究成果。文獻[3]以合肥市典型汽車行駛道路為例,采用最大似然估計法與馬爾科夫分析法相結(jié)合來構(gòu)建典型工況,并通過獨立性檢驗,驗證了馬爾科夫方法應用于行駛工況的正確性。文獻[4]等通過對工況塊特征參數(shù)進行主成分分析提取三個代表性的主成分,再運用神經(jīng)網(wǎng)絡和K-均值聚類對其進行分析,這種方法得到的循環(huán)工況更接近實際的道路運行狀況。文獻[5]提出基于密度的改進K-Means文本聚類算法,通過對孤立點的檢測和處理能避免傳統(tǒng)K-Means算法容易陷入局部最優(yōu)解的情況。文獻[6-7]提出了改進的模糊C均值算法,利用多島遺傳算法與序列二次規(guī)劃法,優(yōu)化了聚類中心,提高了擬合行駛工況的精度。文獻[8]通過對多個特征值分析綜合的方法分析了不同城市的典型工況。

通過上述分析,目前國內(nèi)外用于汽車行駛工況構(gòu)建的聚類方法主要有模糊c均值聚類方法、系統(tǒng)聚類法和AP聚類等。其中,模糊均值C均值算法雖然涉及簡單,快速高效,但是計算量大,并且容易陷入局部最優(yōu)解當中[8-9]。AP聚類算法雖然準確度較高,但是需要指定數(shù)據(jù)點的參考度和阻尼系數(shù),并且算法的復雜度高,在海量數(shù)據(jù)運行下耗費的時間較長[10-11]。本文提出將主成分分析法和改進的K均值聚類算法組合優(yōu)化的方法,擬在表征更多特征參數(shù)信息的同時實現(xiàn)降維和聚類,并通過對采集到的汽車道路行駛工況數(shù)據(jù)運用統(tǒng)計學軟件進行仿真分析。

1 主成分分析和改進的聚類分析算法

1.1 主成分分析法

由于變量在丟失信息最少的情況下主成分分析可以將其壓縮成幾個主成分,因此特征參數(shù)多而引起的特征參數(shù)信息重復和計算復雜的問題可以使用主成分分析的方法來解決。主成分分析法步驟如下:

① 均值化處理原始矩陣數(shù)據(jù),即:使用相應的預處理數(shù)據(jù)把各項的指標均值進行去除;

② 預處理后矩陣中各列均值求解,得到均值化矩陣;

③ 對Y進行主成分分析,進而得到與特征參數(shù)數(shù)目相同的主成分數(shù)量。

選擇主成分依據(jù)的規(guī)則為:前n個主成分特征值大于1的累積貢獻率大于90%,則可以選擇進行主成分分析;特征參數(shù)與該主成分的相關系數(shù)高低由某個特征參數(shù)主成分上的載荷系數(shù)決定,載荷系數(shù)越高說明相關系數(shù)越大;若前m(m≤n)個主成分能夠反映所有特征參數(shù),則可取前m個主成分進行聚類分析。

1.2 改進的全局K-Means聚類算法

傳統(tǒng)K-Means 算法的初始聚類中心的選擇極大的影響了聚類結(jié)果,一般情況下因為只是一個局部最優(yōu)而非全局最優(yōu),從而導致聚類結(jié)果收到影響,且不穩(wěn)定,而且易受噪聲點的影響[12]。而全局K-Means聚類是在傳統(tǒng)聚類算法上的改進,雖然克服了傳統(tǒng)K-Means聚類算法的缺點,比傳統(tǒng)K-Means算法的魯棒性更好,但是全局K-Means聚類算法選擇下一個最佳初始中心的方法是一種通過局部搜索反復迭代實現(xiàn)的全局尋優(yōu)搜索,這種方法具有很大的運算開銷,復雜度較高[13-15]。本文提出改進的全局K-Means聚類算法構(gòu)建行駛工況,快速K-Means聚類算法避免了噪音點的影響,且第一步Vi的計算避免了樣本間距離的重復運算,改善了全局K-均值運算量大的問題,聚類時間更短,描述如下。

數(shù)據(jù)對像x=(x1,x2,x3,…,xp)和y=(y1,y2,y3,…,yp)之間的距離為

(1)

② 將(i=1,2,…,n)劃分到離各個p=1,2,…,q,最近的簇,更新簇中心:

③ 設q=q+1,若q>k,算法終止;

④ 選擇之后簇的最佳初始中心點;

2 汽車行駛工況的構(gòu)建

2.1 數(shù)據(jù)采集與預處理

本文所用數(shù)據(jù)是研究生數(shù)學建模大賽中所提供的某城市輕型汽車實際道路行駛采集的數(shù)據(jù),采樣頻率1 Hz,時刻為2017年12月18日12時42分27秒至2017年12月24日12時37分49秒。采集的信息有時間、經(jīng)緯度、發(fā)動機轉(zhuǎn)速等。

在汽車行駛測試時,由于車輛振動、道路環(huán)境、設備和信號干擾的影響,傳感器采集到的數(shù)據(jù)往往會受到不同程度的失真、噪聲和干擾。對于數(shù)據(jù)的不平滑問題,采用小波去噪的方法,該方法是一種有效改善信號失真、噪聲和干擾的方法,利用小波分解和重構(gòu)對原始數(shù)據(jù)進行預處理,基本思想是在保留原信號小波系數(shù)的同時,去除各頻帶噪聲對應的小波系數(shù),然后對處理后的系數(shù)進行小波重構(gòu),得到純信號。

設用于信號含有的噪聲表示為

S(x)=F(x)+n1(x)*n2(x),

(2)

式中:S(x)為降級信號;f(x)為原始信號;n1(x)為加性噪聲;n2(x)為乘性噪聲。

基于小波分解和重構(gòu)的去噪過程如下:

① 將含噪信號通過小波分解分解為近似分量cj,k和細節(jié)分量dj,k。

② 根據(jù)閾值δj,利用Eq對第j層的詳細分量dj,k進行處理,其表示為

(3)

③ 近似分量cj,k和細節(jié)分量dj,k利用重構(gòu)算法進行重構(gòu),得到濾波后的信號、原始數(shù)據(jù)、小波分解重構(gòu)預處理后的數(shù)據(jù)。

通過預處理原始數(shù)據(jù)缺失值,小波去噪分解與重構(gòu),實驗原始數(shù)據(jù)由184 616條減少至165 019條,由于數(shù)據(jù)龐大,本文選取部分原始數(shù)據(jù)預處理示例,結(jié)果如圖1所示。

圖1 原始數(shù)據(jù)與預處理數(shù)據(jù)比較圖

2.2 運動學片段劃分與特征參數(shù)提取

汽車在行駛過程中,由于受到道路交通條件的限制,存在多次怠速、加速、巡航和減速的狀態(tài)。汽車由之前的一個怠速狀態(tài)到之后的一個怠速狀態(tài)之前的運行車輛速度區(qū)間被稱為運動學片段。運動學片段可以描述為橫坐標為時間由許多不同的運動學片段組成,縱坐標為車速的輕型汽車的行駛工況曲線。本文在分析相關資料的基礎上,定義了運行時間、行駛距離、平均速度等12個特征參數(shù)來描述運動學片段見表1。運用python中的pandas庫開發(fā)了相關程序,采用堆棧思想和循環(huán)遍歷對數(shù)據(jù)項進行處理,來查找和確定怠速和其他運動狀態(tài),并進行相應的運動學片段分割,從204 029預處理數(shù)據(jù)中分割出1 758個運動學片段并用Matlab進行處理。

表1 運動學片段特征參數(shù)值

2.3 主成分分析

對預處理后的數(shù)據(jù),即樣本數(shù)量(n行)與X特征參數(shù)(p列)構(gòu)成的矩陣進行主成分分析,通過SPSS軟件仿真,得到結(jié)果見表2。由表2可見,前三個主成分累計貢獻率已達90.2%,由統(tǒng)計學理論,一般情況下主成分分析時,選取累積貢獻率達到85%的主成分可滿足,基本代表了片段12個特征參數(shù)所有信息,因此可選取前3個主成分進行聚類分析。

表2 主成分貢獻率及累積貢獻率

通過主成分分析前3個主成分即可反映原始運動學片段的特性,將片段特征值總體樣本12個特征參數(shù)矩陣壓縮成了1個能代表絕大多數(shù)總體樣本信息的8個特征參數(shù)主成分矩陣。如表3所示,主成分載荷表示主成分和原先變量的相關系數(shù),相關系數(shù)的絕對值越大,主成分對該變量的代表性越強。由主成分載荷矩陣可得某主成分對應的一些參數(shù),第一主成分特征值有行駛距離、片段持續(xù)時間、加速時間比、巡航時間比、平均行駛速度;第二主成分特征值有平均速度和速度標準差;第三主成分特征值有怠速時間。

表3 主成分載荷矩陣

2.4 改進的全局K-Means聚類分析

由于CH指標在確定聚類數(shù)時評估結(jié)果穩(wěn)定,指標性能較好,故選取CH為評價指標來判定聚類前的K值是否最優(yōu),CH越大表示類自身越緊密,類與類之間越分散,其最大值對應的類數(shù)作為最佳聚類數(shù)。在不同聚類狀態(tài)下CH值的處理結(jié)果如圖2所示,可觀察到CH值最小時聚成了3類。

圖2 聚類數(shù)與CH指標關系圖

通過改進的全局K-Means聚類算法,把運動學片段聚成三大類,由表4可知,第一類運動學片段的平均速度、平均行駛速度較低,怠速時間比例較高,加速時間比例,減速時間比例較高,所以為道路擁堵路況的低速片段;第二類運動學片段的巡航時間比、平均速度、怠速時間比例均處于中間,所以第二類為道路暢通路況的中速片段;第三類運動學片段的平均速度、巡航時間比例較高,怠速時間比較低,所以為高速路況的高速片段。根據(jù)交通特征,聚成的3類分別為擁堵路況、暢通路況和高速路況,其中第一類包含586個運動學片段,第二類包含879個運動學片段,第三類包含293個運動學片段。

表4 聚類后各類別的平均特征值

2.5 行駛工況構(gòu)建

根據(jù)各類時間片段總時間占所有數(shù)據(jù)集汽車行駛工況的比例,可以計算出各工況在最終構(gòu)建的工況中所取的時間,本文按一般典型的車輛行駛工況時間取1 200 s左右。公式為

(4)

式中:tk為第k類在行駛工況中的持續(xù)時間;ti,k為第i類中k個片段持續(xù)時間;Dk為在第k類中所以片段的數(shù)量;tDuringAll為所有行駛工況數(shù)據(jù)持續(xù)的總時間;tDriCycle為車輛行駛工況構(gòu)建最終持續(xù)時間。經(jīng)式(4)運算整理后得到如圖3所示結(jié)果。取構(gòu)建汽車行駛工況總時間約1 200 s,第一類道路擁堵路況的低速片段得到2段,低速段最高車速為27.44 km·h-1;第二類道路通暢路況的中速片段得到4段,中速段最高車速為53.58 km·h-1;第三類道路高速路況的高速片段得到2段,高速段最高車速為66.33 km·h-1。

圖3 合成行駛工況

3 行駛工況構(gòu)建驗證分析

3.1 基于特征參數(shù)的誤差分析驗證

將收集到的數(shù)據(jù)工況與構(gòu)建行駛工況參數(shù)做對比,定義Es為構(gòu)建的工況參數(shù)與原始數(shù)據(jù)行駛工況參數(shù)相對誤差的均值,Es的大小可以檢驗構(gòu)建的汽車行駛工況精度,表達式為

式中:Δ為各特征參數(shù)的相對誤差,βi(i=1,2,…,8)為各特征參數(shù)的加權值,為了簡化計算可取值為1。

由表5可以看出,傳統(tǒng)K-Means聚類構(gòu)建工況Es=8.9%,由于IGKM算法組合了主成分分析方法,因此構(gòu)建工況Es=3.9%,且其余特征值參數(shù)平均相對誤差均小于5.9%,滿足車輛行駛工況構(gòu)建精確度的要求,說明構(gòu)建的行駛工況是有效的。傳統(tǒng)K-Means聚類處理需要61 s,而IGKM處理只需13 s,故IGKM不僅可以避免選擇最佳初始中心點時噪音點的影響,而且在聚類效果穩(wěn)定的基礎上大大縮短了聚類時間。

表5 特征參數(shù)平均相對誤差

3.2 速度-加速度聯(lián)合分布驗證

計算試驗數(shù)據(jù)與改進全局K-Means聚類聚類算法構(gòu)建的行駛工況速度-加速度聯(lián)合分布的SAFD差異值如圖4所示,實驗數(shù)據(jù)與改進的全局K-Means聚類算法速度-加速度聯(lián)合差異分布在±1.9%范圍左右,且計算的分布差異值(SAFDdiff)為0.87%,而實驗數(shù)據(jù)與傳統(tǒng)的K-Means聚類算法構(gòu)建行駛工況的速度-加速度聯(lián)合分布差異為1.97%。通過以上分析,改進的全局K-Means聚類算法所構(gòu)建的行駛工況滿足輕型汽車的行駛特征,符合開發(fā)工況的要求,具有較強的適用性。

圖4 實驗數(shù)據(jù)與合成工況的分布差異值

4 結(jié) 論

文中通過對主成分分析和改進全局聚K-Means聚類的組合優(yōu)化,在提高了各主成分較多特征參數(shù)表征行駛工況特征信息量的同時,也能對車輛交通路況特征進行有效分類。對構(gòu)建1 200 s的車輛行駛工況特征參數(shù)平均相對誤差和速度-加速度聯(lián)合分布差異值分析,實驗數(shù)據(jù)與構(gòu)建行駛工況的特征參數(shù)平均相對誤差為4.3%,其余特征參數(shù)相對誤差均在6%以下;實驗數(shù)據(jù)與構(gòu)建行駛工況的速度-加速度聯(lián)合分布差異值僅為0.79%,大多數(shù)分布在±1.9%范圍內(nèi),所用方法聚類時間僅為13 s。這說明文中方法構(gòu)建工況能較強表征實驗數(shù)據(jù)的信息,更好的反映實現(xiàn)行駛工況特征,驗證了所提方法開發(fā)車輛行駛工況的合理性和有效性。

猜你喜歡
特征參數(shù)運動學全局
基于改進空間通道信息的全局煙霧注意網(wǎng)絡
轎車前后懸架運動學仿真分析
領導者的全局觀
基于視頻圖像序列的船用雷達目標檢測和目標特征參數(shù)提取
速度輪滑直道雙蹬技術的運動學特征
落子山東,意在全局
說話人識別特征參數(shù)MFCC的提取與分析
民用飛機預測與健康管理技術與系統(tǒng)特征參數(shù)研究
基于運動學特征的新型滑板對速滑蹬冰動作模擬的有效性
“必修1”專題復習與訓練
密山市| 日土县| 共和县| 广河县| 射洪县| 晋江市| 汉阴县| 汉川市| 宜兰市| 寿阳县| 新泰市| 庐江县| 什邡市| 科尔| 高阳县| 镇江市| 铜陵市| 淮北市| 新田县| 开平市| 突泉县| 富平县| 三原县| 莱州市| 永定县| 佛教| 新邵县| 惠安县| 隆林| 桓台县| 乌拉特后旗| 深州市| 易门县| 云和县| 息烽县| 渑池县| 花莲市| 吴桥县| 新河县| 北票市| 秭归县|