国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于K-均值聚類和支持向量機的電動汽車行駛工況研究

2021-05-20 02:30:32趙煒華李郁菡
關鍵詞:特征參數西安市均值

余 曼,趙煒華,吳 玲,李郁菡

(西安航空學院 車輛工程學院,陜西 西安 710077)

0 引 言

行駛工況是一個國家或地區(qū)氣候環(huán)境、道路交通特征、機動車保有量等因素的綜合反映,是車輛能耗和排放測試標準的主要基準,是引導和制約汽車行業(yè)發(fā)展的關鍵因素之一[1]。近年來,我國車輛能耗和排放測試標準一直沿用NEDC工況,隨著我國汽車保有量急劇增長及城市道路交通環(huán)境的不斷變化,NEDC工況越來越難以反映我國車輛實際運行情況。能源與交通創(chuàng)新中心和新能源汽車國家大數據聯盟的最新調查結果顯示,傳統(tǒng)內燃機車實際行駛油耗與工況測試油耗差異接近30%,純電動汽車差異約為35%,且呈現逐年上升趨勢[2]。此外,NEDC工況也無法評價新能源汽車循環(huán)外技術節(jié)能效果。因此,真實有效的行駛工況,對于整車能耗和排放評估、動力系統(tǒng)參數匹配、能量管理以及技術路線選擇有重要意義。

國內外學者和機構對行駛工況的構建做了大量研究。從地域和車輛因素考慮,全世界多地區(qū)建立了區(qū)域工況,如都柏林[3]、天津[4]、合肥[5]等,研究對象包括混合車型,驗證了不同地區(qū)、不同車輛行駛工況特征的差異性及構建針對性工況的必要性;在工況構建方法研究方面,現有工況構建方法可分為基于聚類的短行程法和馬爾科夫方法。曹騫等[6]將汽車行駛視為一個“無后效性”的馬爾科夫過程構建工況,以體現行駛過程的隨機性,但存在計算量較大和不可重復性問題;王國林等[7]基于短行程的方法,采用主成分分析和K-均值聚類算法,得到了更多學者的關注和應用s。

當前研究多采用混合車型原始數據,有必要針對電動汽車構建針對性的工況,以更準確評估電動汽車在能耗、續(xù)航等方面性能。同時,目前研究的短行程法中,多采用非監(jiān)督學習方法進行數據解析。然而,K-均值聚類或模糊聚類的非監(jiān)督學習方法多采用“貪心策略”,對數據異常值敏感且易陷入局部最優(yōu),直接影響到擬合工況的精度。為了彌補以往研究的不足,筆者以國內典型大中型城市——西安市為例,選擇純電動汽車為研究對象,提出一種K-均值聚類和支持向量機相結合的半監(jiān)督模型,構建真實行駛工況。

1 城市道路行駛工況數據

1.1 試驗路線

西安市路網總長度約2 562 km,具有“回字形布局、棋盤狀分布”等特點,具體分布情況如圖1,不同等級道路特征如表1。

表1 西安市不同等級道路特征

圖1 西安市路網結構

1.1.1 試驗路線樣本容量

(1)

設樣本均值的最大絕對誤差Δ如式(2):

(2)

式中:a為顯著性水平,設為0.1。

對式(2)兩邊平方,并移項得式(3):

(3)

1.1.2 試驗路線分配

層次分析法(AHP)是一種解決多目標決策問題的輔助分析方法。通過將復雜問題的多個影響因素劃分為不同層級,使之具有條理化,并在此基礎上進行規(guī)劃、決策和評價[8]。AHP在解決復雜決策問題時,主要分為3步:① 對系統(tǒng)中各要素進行分析,并對重要性進行評價;② 判斷所選要素與某一準則的相對權重;③ 按照總權重大小對各個層級進行排序。

在城市道路中,由于距離遠近、實時路況、經濟程度等因素影響,即使是同一個起點和終點,也可能會產生多種行車路線??梢?,確定試驗路線中不同等級道路比例,是一個多目標決策問題。筆者將確定最佳出行方式作為最終目標,以快速出行和便捷出行作為備選措施,將不同道路類型作為待選方案,基于AHP方法,建立駕駛人最佳出行方式模型,如圖2。最終求得試驗路線中,不同等級道路長度及分配比例如表2。

圖2 駕駛人最佳出行方式模型

表2 試驗路線分配

1.1.3 試驗路線

根據試驗路線樣本容量,并結合西安市道路分布情況,設計的試驗路線如圖3,具體路線信息如表3??梢钥闯?,試驗路線包括了西安市中心商業(yè)區(qū),主要住宅區(qū)和重要工業(yè)區(qū),基本能夠反映西安市居民日常出行情況。

圖3 試驗路線

表3 試驗路線信息

1.2 試驗方案

試驗方案設計主要包括試驗時間、試驗設備以及駕駛員的選取。根據西安市城市道路交通流量,同時考慮到西安市居民的出行習慣,試驗采用時間設計為07:30~09:30、12:30~15:00、17:00~20:00,連續(xù)一周每天按設計時間和路線完成試驗,包含了城市交通流量的主要高峰期、一般平峰期和正常低峰期,保證各種交通狀況都能被全面適量的采集,盡可能在較短時間內獲得較為普遍的結果。

根據行駛工況構建需求,選擇GPS、OBD、陀螺儀、行車記錄儀、12V鉛酸蓄電池和電源逆變器等試驗設備。此外,駕駛員是數據采集試驗的一個重要因素,不同職業(yè)、性別、年齡的駕駛員的駕駛風格存在差異,對試驗數據影響顯著。因此,選擇西安市2名經驗豐富、熟悉路況的出租車司機作為駕駛員,模擬不同電動汽車駕駛員的駕駛行為,結合車載測量法和車輛追蹤試驗法完成試驗。

2 行駛工況數據解析

2.1 行駛單元

行駛單元指車輛由一個怠速開始到下一個怠速開始之間的運動歷程[9],如圖4。車輛在城市道路行駛時,由于受到實時路況影響,駕駛員需要頻繁加速或制動車輛。為了便于量化分析,根據公式(4)將車輛運動劃分為加速、減速、勻速和怠速4種狀態(tài)。

圖4 行駛單元劃分

(4)

2.2 特征描述

行駛單元劃分后,為盡可能全面描述車輛的運動信息,最大程度利用數據價值,筆者從時間、速度、加速度3個方面選取了14個參數對每個單元特征進行描述,如表4。

表4 描述行駛單元特征參數

2.3 基于主成分分析的特征提取

主成分分析(PCA)是一種考察多變量間相關性的特征提取方法?;舅枷胧歉鶕延刑卣鳎ㄟ^正交變換得到一個抽象程度更高、互不相關的特征集合,并最大程度保留原始特征信息。由于描述行駛單元的特征參數有很多,其中部分為冗余特征,利用PCA對特征參數進行降維,既可以避免維數災難,又方便問題的分析和處理[10]。

設行駛單元特征參數矩陣X0如式(5):

(5)

式中:xpn為第p個單元的第n個特征。為了消除量綱影響,利用公式(6)對X0進行標準化:

(6)

然后求X0的相關矩陣R=XXT,并求其特征值l1,l2…,ln(l1≥l2≥…≥ln)和對應的特征向量[ci1,ci2,…,cin]T(i=1,2,…,n),得到特征向量矩陣,如式(7):

(7)

則特征參數x1,x2,…,xn經正交變換后的各主分量y1,y2,…,yn可表示為式(8):

(8)

式中:y1,y2,…,yn分別稱為第1、2、…、n個主成分。

主成分方差貢獻率P和累積貢獻率CP的計算方式如式(9)、(10):

(9)

(10)

PCA得到的各主成分表達式如式(11):

特征參數PCA結果如表5。由表5可知,從第1到第14主成分,各主成分方差依次遞減,表明其所包含的信息量也逐漸減少。前4個主成分方差均大于1,且累積貢獻率達到90.49%,基本包含了原始特征的所有信息。因此,為了簡化問題,計算前4個主成分得分,將其作為行駛單元新的綜合評價指標,如表6。

表5 PCA結果

表6 主成分得分

(11)

2.4 半監(jiān)督分類模型

分類問題按照訓練樣本的有無,分為監(jiān)督學習和非監(jiān)督學習兩種。K-均值聚類屬于非監(jiān)督學習方法,可以對未知樣本進行聚類;支持向量機屬于監(jiān)督學習方法,需要訓練樣本來建立分類模型。這兩種算法各有利弊,相互補充[11]。為了充分發(fā)揮這兩種算法的優(yōu)勢,筆者將K-均值聚類算法和支持向量機相結合,建立了行駛單元的半監(jiān)督分類模型?;舅枷霝椋豪肒-均值聚類算法,從所有行駛單元中篩選出信息最為豐富的樣本,作為支持向量機模型的訓練集,模型經過“學習”后,對待測樣本進行預測。

2.4.1 支持向量機理論

支持向量機(SVM)是一種解決二分類問題的監(jiān)督學習方法[12]。基本思想是通過構造一個分類超平面作為決策曲面,使不同類數據的差異最大化。由于SVM具有理論完善、魯棒性好等諸多優(yōu)點,得到了廣泛應用。

設大小為l的集合{(xi,yi),i=1,2,…,l}由兩類構成。若xi屬于第一類,記yi=1;若xi屬于第二類,則記yi=-1。若能找到如圖5的分類超平面wx+b=0,將集合內的數據正確分為兩類,則表示該集合線性可分。

圖5 分類超平面

即滿足:

(11)

式中:w=(w1;w2;…;wd)為法向量;b為位移項。則集合中任一點xi到超平面的距離為:

(12)

由圖5可知,距離超平面最近的幾個樣本使式(11)等號成立,稱之為“支持向量”。

異類支持向量間距離γ如式(13):

(13)

為尋找最優(yōu)分類超平面,使不同類別樣本盡可能分離開,在滿足公式(11)的條件下使得γ最大,如式(14):

(14)

式(14)可等價寫為式(15):

(15)

該問題可通過求解拉格朗日函數鞍點得到:

(16)

式中:ai>0,i=1,2,…,l,為拉格朗日系數。

按照拉格朗日理論可以將公式(16)轉化為對偶問題,如式(17):

(17)

(18)

式中:xr和xs為支持向量。

最終得到的最優(yōu)分類函數如式(19):

(19)

SVM最初是為二分類問題設計的,而通常城市道路行駛單元的種類一般多于兩類,無法直接進行劃分。筆者基于MATLAB軟件,通過組合多個二分類器的方法,建立了行駛單元的多分類模型。具體過程包括:訓練樣本篩選、參數尋優(yōu)、模型訓練和分類預測。

2.4.2 訓練樣本篩選

由于SVM屬于監(jiān)督學習方法,分類前需要選取合適的訓練樣本(訓練集)。考慮到行駛單元數量眾多,為了提高分類準確率和效率,筆者利用K-均值聚類算法進行訓練集的篩選。K-均值算法通過計算每個樣本與各個聚類中心間距離,按照距離最近原則進行樣本標記,具體流程如圖6[13]。

圖6 K-Means聚類流程

采用歐幾里得距離描述樣本間的差異,如式(20):

(20)

式中:p是特征數目;xik和xjk為樣本i和j的k-th特征。

在K-均值聚類算法中,類別數K對聚類結果的準確性有著重要影響[14],但通常K的準確值最初是未知的。如果K大于真值,則將在多個類中錯誤地劃分同一類數據,這將導致聚類結果的邊界模糊。反之,將不同類別的數據合并到同一類中,將導致集群的緊湊性降低[15]。因此,通常使用聚類穩(wěn)定性來確定K值[16]。基本思想是:如果對相同的樣本數據進行重復聚類,則合適的K值應該產生相同或相近的聚類結果,即穩(wěn)定性被視為K值是否合適的指標。根據聚類穩(wěn)定性測試結果,最終確定將所有的行駛單元聚為3類。

由于K-均值屬于硬聚類算法,僅依據距離進行數據劃分。當多個聚類中心間的距離差異不大時,聚類效果欠佳。另外,K-均值聚類算法的收斂條件是不斷迭代直至聚類中心不再發(fā)生變化,這可能導致在類內數據已經十分接近,但未充分考慮類間距離,只保證了局部最優(yōu),未能實現全局最優(yōu)。由此可見,雖然利用K-均值算法便可獲得行駛單元大致的分類信息,但效果并不十分理想,這將直接影響到各類行駛工況的特征以及綜合行駛工況的曲線構成。

考慮到SVM較K-均值算法在解決高維模式識別方面的顯著優(yōu)勢,筆者從K-均值聚類結果中,篩選若干代表性單元作為SVM的訓練集,然后利用訓練好的SVM模型對剩余單元進行精確劃分。代表性單元選取遵循2點原則:① 選取合適數量的訓練集,避免模型的欠學習和過學習;② 選取的單元距同類中心的距離應盡可能近、距異類中心距離應盡可能遠。

依照上述原則,篩選出74個行駛單元作為訓練集,剩余部分作為測試集。

2.4.3 參數尋優(yōu)

因訓練集數量正常,特征參數相對較少。為使算法更好地適應訓練集,選擇徑向基函(RBF)作為模型的核函數,如式(21):

K(x,xi)=exp(-gamma‖xi-x‖2)

(21)

式中:xi為支持向量;x為待測樣本;‖xi-x‖2為范數距離;gamma為核函數參數g。

為了更好地提升分類器的性能,分類前需要調整SVM模型的懲罰參數c和核函數參數g。參數c決定錯分樣本的處罰程度,參數g決定高維空間中數據的分布情況[17]。在K折交叉驗證思想下,利用網格搜索算法尋找最佳參數,具體步驟如下[18]:

1)確定參數c和g的取值范圍和計算步長;

2)將訓練集均分為S份,選擇S-1份進行模型訓練;余下的一份用于評估分類效果。循環(huán)進行S次,由此得到S個分類準確率,將其均值作為此組c和g下最終的分類準確率;

3)選擇分類準確率最高的那組c和g作為SVM模型的最佳參數;

4)如果具有最高準確率的參數不唯一時,由于較大的c值會降低SVM模型的泛化能力,所以選擇c值最小的那組c和g作為最佳參數。

參數尋優(yōu)3D視圖如圖7,x、y軸分別表示參數c、g取對數后的值,z軸表示取每組c和g后對應的分類準確率。最終獲得的最佳參數c=0.25,g=2.297 4,訓練集的分類準確率達到了100%。

圖7 參數尋優(yōu)

2.4.4 模型訓練與分類預測

利用篩選得到訓練集和最佳參數對SVM模型進行訓練,然后對剩余的行駛單元進行分類預測。選取行駛單元主要的平均特征來衡量分類準確率,SVM的分類結果如表7??梢钥闯觯愔g區(qū)別明顯,分類效果良好。

表7 SVM分類結果

3 城市道路行駛工況

3.1 工況構建

行駛工況是通過組合各類中最具有代表性行駛單元,直至滿足預先設定的時間長度而構建。行駛工況的構建過程分為:工況總運行時間確定、各類行駛單元時長分配以及代表性單元選取與組合。

通常國際標準工況和國內外典型城市代表性工況的運行時間在600~1 800 s。參考北京[19]、香港[20]、新加坡[21]等城市工況,筆者設定西安工況總運行時間為1 200 s。然后根據每類行駛單元運行時間,占所有行駛單元總運行時間比例,確定每類單元在擬合成工況中的時間比例[22],如式(22):

(22)

式中:Ti為擬合成工況中第i類行駛單元的時間比例;n為第i類行駛單元的數目;l為類別數。

計算得到3類行駛單元在擬合成行駛工況中的時長(比例)分別為170 s(14.2%)、589 s(49.1%)、441 s(36.7%)。選擇每個行駛單元與該類平均特征的相關系數作為篩選指標,選取相關系數大的作為備選單元,如式(23):

(23)

按照各類時長和相關系數分別從3類中選取3個、5個、3個行駛單元,將其首尾連接,構建了西安市3種交通環(huán)境下的典型行駛工況。根據每種行駛工況的特征,將它們分別定義為擁堵、一般和暢通行駛工況,最后將3種行駛工況組合在一起,構建了西安市綜合行駛工況(西安工況),如圖8。

圖8 行駛工況

3.2 工況驗證

行駛工況驗證標準是能夠以少量數據反映原始試驗數據的綜合結果。筆者選擇3個平均特征、2個波動特征和4個狀態(tài)特征共9個參數作為工況有效性的評價指標。所構建的西安工況與原始試驗數據的對比結果如表8。根據式(24)~(26),計算了西安工況與原始試驗數據特征參數的相對誤差(RE)、平均相對誤差值(MRE)和均方根誤差值(RMSE)。同時,比較了二者的速度-加速度聯合概率分布,如圖9。

表8 西安工況與原始試驗數據對比

圖9 速度-加速度聯合概率分布

(24)

(25)

(26)

式中:ac和at分別是行駛工況和原始試驗數據的特征參數;n為特征參數個數;M和N分別是速度和加速度點劃分的網格數;xij和yij分別是第ij個網格對應的概率值。

計算結果表明,西安工況與原始試驗數據特征參數的相對誤差基本小于5%,平均相對誤差僅為2.66%,均方根誤差值為1.7%。且兩者速度-加速度聯合概率分布矩陣(SAPD)接近一致,表明西安工況與實際道路行駛的試驗數據非常接近。因此,構建行駛工況可較為準確的反映西安市車輛的真實行駛特征。

此外,為了研究西安工況與國際標準工況[23]的差異性,筆者將西安工況與6個國際標準工況進行對比。不同行駛工況曲線對比如圖10,特征參數對比結果如表9??梢钥闯觯靼补r與國際標準行駛工況的差異明顯。西安工況具體特征表現為:平均車速較低,平均加/減速度較大,加減速比例高、勻怠速比例低??偟膩碚f,西安工況表現出更激進的變化特征。

圖10 不同行駛工況曲線對比

表9 西安工況與國際標準工況對比

西安工況特征的可以從車輛性能和道路交通因素兩方面進行解釋:

1)車輛性能方面,西安工況基于電動汽車,而其他國際標準行駛工況均基于傳統(tǒng)燃油車。電動汽車與燃油車在動力系統(tǒng)的差異導致了車輛行駛特征的不同,主要表現為:① 電機的低速恒扭矩特性可實現車輛在起步瞬間即輸出最大扭矩,而燃油車的動力輸出需要結合換擋控制或液力變矩器控制,發(fā)動機從怠速到最大扭矩的響應時間更長。因此,電動汽車起步加速度更大,起步時間更短;② 電機響應迅速、運行平穩(wěn),加速踏板的微小變化將導致車速的顯著變化,這是燃油車無法實現的;③ 電動汽車再生制動系統(tǒng)的控制策略較為激進,在確保制動安全的前提下盡可能多使用再生制動以獲得較高的能量利用率,從而導致車輛變現出更加劇烈的加減速特征。相比之下,燃油車在制動時車輛處于滑行狀態(tài),制動過程相對平穩(wěn)。

2)道路交通因素方面,西安工況反映了西安市車輛的行駛特征,其他國際標準工況是某一國家或地區(qū)道路交通特征的綜合表現。目前,西安市機動車保有量和城市人口數量急劇增加,城市規(guī)模和交通基礎設施建設不能滿足城市發(fā)展的要求,交通擁堵工況占比較大,導致車輛行駛過程的頻繁急加速和急減速。

4 結 語

1)以國內典型大中型城市——西安市為例,通過道路試驗獲得了大量汽車行駛數據。通過試驗數據解析法,利用K-均值 與 SVM半監(jiān)督分類模型,構建了西安市的代表性汽車行駛工況。筆者所構建的工況與原始試驗數據特征參數的相對誤差基本小于5%,平均相對誤差僅為2.66%。

2)西安工況具有平均車速低、平均加/減速度大、加減速比例高、勻怠速比例低等特點,與國際標準工況差異明顯。這是因為汽車行駛工況受特定地域的道路交通條件影響,也由于車輛動力系統(tǒng)差異,電動汽車工況比傳統(tǒng)燃油汽車工況特征表現更為激進。

猜你喜歡
特征參數西安市均值
故障診斷中信號特征參數擇取方法
基于特征參數化的木工CAD/CAM系統(tǒng)
親子創(chuàng)意美工展
西安市第四醫(yī)院
123的幾種說法
基于PSO-VMD的齒輪特征參數提取方法研究
基于CA-Markov模型的西安市熱環(huán)境模擬研究
均值不等式失效時的解決方法
均值與方差在生活中的應用
統(tǒng)計特征參數及多分類SVM的局部放電類型識別
電測與儀表(2015年7期)2015-04-09 11:40:04
左云县| 城口县| 洛南县| 读书| 平安县| 江西省| 兴和县| 卫辉市| 耿马| 于都县| 紫金县| 富源县| 玉龙| 库车县| 怀集县| 马关县| 岫岩| 卓尼县| 烟台市| 静乐县| 刚察县| 布拖县| 闸北区| 沙湾县| 武汉市| 扎赉特旗| 绥江县| 茌平县| 三明市| 武定县| 抚远县| 类乌齐县| 勐海县| 灵石县| 桂平市| 延长县| 健康| 清水河县| 吉林省| 曲麻莱县| 同心县|