李 想, 王 鑫, 蔡 辰, 趙宗琴, 冉若愚, 楊 德, 皮家甜
(1.重慶師范大學(xué),重慶 401331;2.重慶長(zhǎng)安汽車股份有限公司,重慶 401120)
汽車是現(xiàn)代社會(huì)不可或缺的交通工具之一,而變速器無疑是傳統(tǒng)燃油車甚至混合動(dòng)力汽車中必不可少的一部分。其中,在各類自動(dòng)變速器中,濕式雙離合器變速器因其具有動(dòng)力損失小、換擋時(shí)間短、更佳的燃油經(jīng)濟(jì)性等優(yōu)點(diǎn)[1],目前被廣泛應(yīng)用于燃油車、插電式混合動(dòng)力汽車中。DCT變速器通過液壓系統(tǒng)作為執(zhí)行動(dòng)力源控制離合器和撥叉動(dòng)作實(shí)現(xiàn)動(dòng)力傳動(dòng)比切換,DCT執(zhí)行換擋操作時(shí),動(dòng)力要在兩個(gè)離合器之間來回切換,液壓系統(tǒng)產(chǎn)生液壓力去完成換擋同步器以及離合器執(zhí)行機(jī)構(gòu)的操作[2-3]。
DCT 液壓響應(yīng)對(duì)DCT 平穩(wěn)換擋具有十分重要的意義,關(guān)系到駕乘人員的駕駛體驗(yàn),也是研究基于數(shù)據(jù)驅(qū)動(dòng)的方法在DCT 控制邏輯優(yōu)化方面的重要部分。為進(jìn)一步提升換擋品質(zhì)以及優(yōu)化控制策略,眾多學(xué)者以及DCT 生產(chǎn)商也對(duì)DCT 進(jìn)行著持續(xù)深入的研究。饒坤等[4]提出一種離合器壓力非線性魯棒控制策略。戴冬華等[5]基于離合器壓力控制閥的壓力和電流特性在半結(jié)合點(diǎn)附近的非線性關(guān)系設(shè)計(jì)了DCT 半結(jié)合點(diǎn)自學(xué)習(xí)控制策略。然而,影響DCT 變速器執(zhí)行性能的因素很多,包括液壓電磁閥的制造差異、離合器彈簧及間隙、油瓶狀態(tài)、殘余油量等,而上述傳統(tǒng)的控制策略很難全面考慮諸多因素以及硬件誤差帶來的影響。隨著機(jī)器學(xué)習(xí)方法日益成熟,基于數(shù)據(jù)驅(qū)動(dòng)的方法也逐漸被用于DCT 領(lǐng)域。劉永剛等[6]提出了基于數(shù)據(jù)驅(qū)動(dòng)的雙離合器自動(dòng)變速器換擋過程的自適應(yīng)控制。王蒙蒙等[7]研究了基于數(shù)據(jù)驅(qū)動(dòng)的DCT 起步策略智能控制。萬有剛等[8]利用集成學(xué)習(xí)算法挖掘DCT換擋數(shù)據(jù)中蘊(yùn)含的控制規(guī)律等。這些研究在一定程度上驗(yàn)證了基于數(shù)據(jù)驅(qū)動(dòng)的方法在DCT 方面的可行性,但是基于數(shù)據(jù)驅(qū)動(dòng)的方法在DCT 控制邏輯中的研究仍然不足。
為探究DCT 液壓響應(yīng)預(yù)測(cè)方法,本文收集了大量包含了不同工況下的DCT 數(shù)據(jù),為模型訓(xùn)練提供了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。但在訓(xùn)練數(shù)據(jù)集中,特征數(shù)量和預(yù)測(cè)結(jié)果并非一定成正比[9],過多的特征反而可能導(dǎo)致預(yù)測(cè)精度下降,還會(huì)大大增加訓(xùn)練開銷[10-11]。如果直接基于人工挑選重要特征,可能導(dǎo)致結(jié)果不準(zhǔn)確。為建立一個(gè)能對(duì)重要特征進(jìn)行可視化選擇,且能精準(zhǔn)預(yù)測(cè)DCT 液壓響應(yīng)的模型,本文提出了一種基于SHAP 可解釋極端隨機(jī)樹算法的液壓預(yù)測(cè)模型。先繪制特征值圖形結(jié)合數(shù)據(jù)的實(shí)際物理含義初步刪除其值變化小以及沒有意義的特征,再利用SHAP 法可視化選擇重要特征,最后訓(xùn)練模型并進(jìn)行預(yù)測(cè)。同時(shí),將時(shí)間切片作為特征參與模型訓(xùn)練,結(jié)合某汽車公司DCT 實(shí)驗(yàn)室獲取的數(shù)據(jù),預(yù)測(cè)結(jié)果表明,該模型預(yù)測(cè)的結(jié)果在設(shè)計(jì)誤差允許范圍內(nèi),預(yù)測(cè)液壓結(jié)果較精準(zhǔn),一定程度上解決了不同工況以及硬件誤差帶來的執(zhí)行精度不可控的影響,可以為基于數(shù)據(jù)驅(qū)動(dòng)的控制邏輯優(yōu)化提供較準(zhǔn)確的結(jié)果。
DCT通過液壓系統(tǒng)作為執(zhí)行動(dòng)力源控制離合器和撥叉動(dòng)作實(shí)現(xiàn)動(dòng)力傳動(dòng)比切換,但DCT 變速器不同樣本、不同工況下的液壓系統(tǒng)執(zhí)行精度響應(yīng)不完全可控。DCT 換擋示意圖如圖1 所示。究其原因,除了制造差異等工程問題外,DCT控制策略容差能力也是重要原因之一。而控制策略容差能力主要體現(xiàn)在DCT自適應(yīng)學(xué)習(xí)與補(bǔ)償策略方面。
圖1 DCT變速器通過液壓模塊控制離合與換擋示意圖
由PPV 電磁閥閥芯平衡方程可知,當(dāng)電流較小時(shí),如果要對(duì)壓力進(jìn)行控制,電磁力需要克服與運(yùn)動(dòng)趨勢(shì)反向的摩擦力、彈簧力、出口壓力腔反饋壓力[12]。PPV 電磁閥示意圖如圖2所示,電磁閥閥芯平衡方程如式(1)所示。同時(shí),由于PPV 電磁閥設(shè)計(jì)有正遮蓋量,電磁閥在小電流區(qū)域無法克服正遮蓋行程及摩擦力,閥口無法打開致使壓力為0,該電流區(qū)域稱之為壓力死區(qū)。PPV 電磁閥還具有壓力遲滯與徑向不平衡力等缺陷,導(dǎo)致壓力響應(yīng)精度不可控。壓力死區(qū)與壓力遲滯如圖3 所示。目前,業(yè)界廣泛采用自學(xué)習(xí)策略與補(bǔ)償策略來適應(yīng)不同工況下壓力響應(yīng)的差異。由于溫度發(fā)生變化導(dǎo)致油壓變化,而傳統(tǒng)的物理模型無法預(yù)測(cè)不同溫度下油壓的數(shù)值,導(dǎo)致?lián)Q擋品質(zhì)不高。而基于數(shù)據(jù)驅(qū)動(dòng)的自學(xué)習(xí)策略可以在不同溫度下學(xué)得最適合當(dāng)前狀態(tài)的換擋油壓,結(jié)合物理模型以期能滿足各工況下的性能要求。因此,本文重點(diǎn)探究利用數(shù)據(jù)預(yù)測(cè)壓力響應(yīng)方法,為基于數(shù)據(jù)驅(qū)動(dòng)與物理模型相結(jié)合的控制策略提供預(yù)測(cè)結(jié)果。
圖2 PPV電磁閥(常態(tài)位)
圖3 壓力死區(qū)與壓力遲滯示意圖
式中:Fe為電磁力;Ff為摩擦力;Fbs為穩(wěn)態(tài)液動(dòng)力;Fs為彈簧力;Fp為出口壓力腔反饋壓力。
本文利用的數(shù)據(jù)集為某汽車公司DCT 試驗(yàn)室采集的真實(shí)DCT 數(shù)據(jù)。主要包括DCT 在不同溫度工況下的數(shù)據(jù),具體溫度工況見表1。采集的原始數(shù)據(jù)共計(jì)73 個(gè)特征,1 個(gè)標(biāo)簽,具體特征見表2,其中TRANS_bar_ClPressure 為標(biāo)簽值,其余為特征。該模型須能預(yù)測(cè)出不同溫度下的液壓響應(yīng),因此,將溫度(temperature)也作為一條特征變量。由于原始數(shù)據(jù)量較龐大,為了方便試驗(yàn),本研究在上述數(shù)據(jù)集中,在每一種溫度工況下選取8 萬條數(shù)據(jù),共計(jì)64萬條數(shù)據(jù)。
表1 不同溫度工況
表2 數(shù)據(jù)的全部特征
集成學(xué)習(xí)[13]是組合多個(gè)個(gè)體學(xué)習(xí)器,從而獲得比單一學(xué)習(xí)器性能更優(yōu)的模型。目前在多個(gè)領(lǐng)域已經(jīng)取得較好應(yīng)用,如李恒杰等[14]利用集成學(xué)習(xí)預(yù)測(cè)電動(dòng)汽車充電樁超短期負(fù)荷;賈志強(qiáng)等[15]使用XGBoost模型對(duì)消費(fèi)行為進(jìn)行預(yù)測(cè);OGUNLEYE等[16]使用XGBoost 為慢性腎臟?。–hronic Kidney Disease,CKD) 提供了早期廉價(jià)的診斷方法;GUPTA 等[17]對(duì)比了隨機(jī)森林、線性模型、支持向量機(jī)神經(jīng)網(wǎng)絡(luò)等模型預(yù)測(cè)新冠肺炎(Corona Virus Disease 2019,COVID-19)病例的確診、治愈和死亡數(shù)據(jù),發(fā)現(xiàn)隨機(jī)森林(Random Forest, RF)模型的準(zhǔn)確率最高。
極端隨機(jī)樹(Extremely Randomized Trees,ET)[18]模型屬于集成學(xué)習(xí),它和隨機(jī)森林[19]類似。隨機(jī)森林是Bagging 的一個(gè)擴(kuò)展變體,其個(gè)體學(xué)習(xí)器是CART 決策樹。其繼承了Bagging 的隨機(jī)選擇樣本,同時(shí)增加了屬性隨機(jī),即在當(dāng)前節(jié)點(diǎn)的屬性中隨機(jī)選擇包含k個(gè)屬性的子集,然后從這個(gè)子集中選擇一個(gè)最優(yōu)屬性用于劃分。而ET 和RF 不同的是ET 模型使用全部的樣本,且完全隨機(jī)選擇特征進(jìn)行分裂。在本研究中,相較于其他幾個(gè)對(duì)比模型效果更好,具有更高的抗擬合能力以及更好的泛化性。ET模型決策過程如圖4所示。
圖4 ET模型決策過程
SHAP(Shapley Additive exPlanations)[20]是機(jī)器學(xué)習(xí)中用于解釋模型輸出的方法,可以通過計(jì)算每個(gè)特征對(duì)預(yù)測(cè)標(biāo)簽的貢獻(xiàn)來解釋結(jié)果。模型的準(zhǔn)確率和可解釋性同等重要,但是模型越復(fù)雜準(zhǔn)確率越高,其可解釋性越差,面臨著準(zhǔn)確率和可解釋性的矛盾[21]。而SHAP 方法可以計(jì)算特征的全局重要性,并將特征根據(jù)重要性進(jìn)行排序,比直接采用經(jīng)驗(yàn)判斷特征重要性具有更高的準(zhǔn)確度。
為清楚地對(duì)比本研究采用模型相較于其他對(duì)比模型的準(zhǔn)確性和有效性,選取平均絕對(duì)值誤差(MAE)、均方誤差(MSE)以及可決系數(shù)(R2)3個(gè)指標(biāo)進(jìn)行比較。其中以MSE 為主要衡量指標(biāo),MSE反映預(yù)測(cè)值與真實(shí)值的誤差,該值越小,則誤差越小。R2表示可決系數(shù),其取值范圍為[0,1],越接近1 表明模型效果越好。MAE、MSE 及R2如式(2)所示。在數(shù)據(jù)集1,即只包含表4 中所示特征的數(shù)據(jù)集上,本文模型和其他模型的結(jié)果對(duì)比見表3。由表3可知,基于可解釋ET模型的MSE要低于其他幾個(gè)模型。
表3 本文所使用的模型和其他模型結(jié)果對(duì)比
表4 刪除無關(guān)特征后的剩余特征
式中:MAE 為平均絕對(duì)值誤差;MSE 為均方誤差指標(biāo);R2為可決系數(shù);y為液壓響應(yīng)實(shí)際數(shù)據(jù);為模型預(yù)測(cè)的液壓響應(yīng)值;為液壓相應(yīng)實(shí)際平均值。
根據(jù)本文提出的模型設(shè)計(jì)了如下試驗(yàn)。首先對(duì)傳感器采集的多項(xiàng)關(guān)于DCT 的數(shù)據(jù)進(jìn)行清理,通過繪制特征值的折線圖,可以發(fā)現(xiàn)很多的恒值特征,再結(jié)合實(shí)際物理模型對(duì)結(jié)果預(yù)測(cè)的先驗(yàn)知識(shí),發(fā)現(xiàn)這一部分特征對(duì)于液壓響應(yīng)計(jì)算影響不大。因此,可以將這一部分特征刪除,初步減少數(shù)據(jù)維度,然后輸入模型進(jìn)行訓(xùn)練。接著使用SHAP 算法對(duì)結(jié)果進(jìn)行解釋,將重要特征可視化排序。同時(shí)通過SHAP 圖可發(fā)現(xiàn)該數(shù)據(jù)和時(shí)間具有一定關(guān)系,因此,試驗(yàn)2 將時(shí)間處理成切片并輸入模型進(jìn)行訓(xùn)練和驗(yàn)證。最后,由于汽車ECU 計(jì)算能力有限,為了工程化考慮,試驗(yàn)3 僅保留幾個(gè)最重要的特征并進(jìn)行訓(xùn)練,最后輸出結(jié)果。具體流程如圖5所示。
圖5 可解釋ET模型預(yù)測(cè)流程
本研究的目標(biāo)是利用特征變量預(yù)測(cè)DCT 液壓響應(yīng),即表2 中紅色標(biāo)簽??紤]到實(shí)際應(yīng)用需要,本研究將誤差設(shè)計(jì)為25 kPa以內(nèi)。同時(shí)為了探究模型在高溫工況下的表現(xiàn),將數(shù)據(jù)集中120 ℃工況下的數(shù)據(jù)作為測(cè)試集,測(cè)試模型的實(shí)際預(yù)測(cè)效果。為保證較好的訓(xùn)練結(jié)果,本研究在訓(xùn)練時(shí)采用10 折交叉驗(yàn)證[22],10 折交叉驗(yàn)證是將原始數(shù)據(jù)隨機(jī)劃分為幾乎相等的10份,每次輪流使用其中9個(gè)作為訓(xùn)練集,剩余1個(gè)作為測(cè)試集,總共輪流10次。
3.2.1 保留恒值以外特征試驗(yàn)
為了可以更加全面地收集數(shù)據(jù),投入了大量傳感器采集原始數(shù)據(jù),由此導(dǎo)致原始數(shù)據(jù)維數(shù)過多,如果直接采用算法選擇重要特征,會(huì)造成計(jì)算時(shí)間太長(zhǎng),而且可能計(jì)算不準(zhǔn)確。因此,本試驗(yàn)先繪制出了特征值的圖形,可以發(fā)現(xiàn)很多特征值為恒值,為恒值的部分特征如圖6 所示,圖中紅色表示標(biāo)簽值,藍(lán)色為特征值。對(duì)于樹模型這些特征無法使用,可以直接刪除,保留除恒值以外的特征后形成數(shù)據(jù)集1,作為試驗(yàn)1。刪除恒值特征后剩余的特征見表4,可以看到,數(shù)據(jù)已由表2 中的74 維降至表4所示的43維,大大減少了數(shù)據(jù)維度。
圖6 一部分值為零值(a和b)和恒值(c和d)的特征
3.2.2 添加時(shí)間切片及升降壓判定試驗(yàn)
在SHAP 圖對(duì)模型結(jié)果分析后,發(fā)現(xiàn)時(shí)間對(duì)結(jié)果具有一定影響。經(jīng)過對(duì)標(biāo)簽值圖形觀察后,發(fā)現(xiàn)其具有一定規(guī)律。具體來說,在一定時(shí)間周期內(nèi),液壓響應(yīng)的波形先上升后下降,即先升壓后降壓,為了區(qū)分升降壓階段而添加升降壓標(biāo)志。同時(shí)時(shí)間也應(yīng)該隨著壓力變化而周期性變化,但數(shù)據(jù)中原始時(shí)間是不斷上升的(見圖7 綠色實(shí)線),不利于模型學(xué)習(xí)時(shí)間與液壓響應(yīng)之間的關(guān)系。因此,將時(shí)間進(jìn)行切片,液壓響應(yīng)值變化后時(shí)間重新從0 開始計(jì)算,選取液壓響應(yīng)上升時(shí)的一段數(shù)據(jù)進(jìn)行繪圖,說明液壓與時(shí)間的關(guān)系。時(shí)間切片及升降壓判定特征示意圖如圖7 和圖8 所示。圖7 中紅色線段代表壓力,可以看到壓力每變化一次,時(shí)間都重新從0 開始。由圖8 可知,壓力上升階段標(biāo)志為1,而下降階段標(biāo)志為0。SHAP圖解釋模型結(jié)果如圖9~10所示。圖9 中橫軸表明特征的重要程度,數(shù)值越大說明該特征越重要。試驗(yàn)2 在試驗(yàn)1 的數(shù)據(jù)中增加了升降壓判定以及時(shí)間切片特征,形成數(shù)據(jù)集2。
圖7 原始時(shí)間、切片時(shí)間與壓力之間的關(guān)系
圖8 升降壓標(biāo)志示意圖
圖9 SHAP特征重要性分析圖
圖10 SHAP摘要圖
SHAP 圖會(huì)顯示比較重要的一些特征及其重要度。圖中每一行代表一個(gè)特征,橫坐標(biāo)為SHAP值,越靠前說明特征越重要。一個(gè)點(diǎn)代表一個(gè)樣本,顏色越紅說明特征本身數(shù)值越大,顏色越藍(lán)說明特征本身數(shù)值越小。由圖9~10 可知,請(qǐng)求電流(mA_ClCurrentRequest)和時(shí)間(time)對(duì)結(jié)果影響較大。
3.2.3 重要特征可解釋選擇試驗(yàn)
由于車輛ECU 并不具備實(shí)驗(yàn)室環(huán)境下的高算力,所以需要將模型輕量化,即只保留最重要特征。基于試驗(yàn)2 中SHAP 算法對(duì)重要特征的選擇,且考慮到模型需要預(yù)測(cè)不同溫度(temperature)下的液壓響應(yīng),因此,試驗(yàn)3保留了如表5所示的4個(gè)特征,形成數(shù)據(jù)集3,作為試驗(yàn)3訓(xùn)練數(shù)據(jù)。表5中“TRANS_bar_Cl1Pressure”表示需要預(yù)測(cè)的標(biāo)簽,“time”表示時(shí)間切片屬性,“temperature”表示溫度屬性,“updown_mark”表示升降壓判定屬性,“ClC_mA_C1CurrentRequest”表示電流屬性。
表5 工程化模型訓(xùn)練所需特征
在建立好的3 個(gè)數(shù)據(jù)集上分別進(jìn)行訓(xùn)練以及預(yù)測(cè),表6 為3 次試驗(yàn)的10 折交叉結(jié)果的平均值,評(píng)估指標(biāo)使用MAE,MSE 以及R2,其中以MSE 作為主要評(píng)估指標(biāo)。從MSE 結(jié)果可以看出,添加時(shí)間切片(第2 次試驗(yàn))的MSE 比沒有添加時(shí)間切片(第1 次試驗(yàn))的MSE 降低了0.551 2,這表明添加時(shí)間切片以及升降壓標(biāo)記對(duì)模型精度提升有促進(jìn)作用,同時(shí)也說明SHAP 法選擇的特征是正確的。輕量化試驗(yàn)(第3 次試驗(yàn))的MSE 比第1,2 次試驗(yàn)結(jié)果高很多,但訓(xùn)練時(shí)間相比于1,2 次試驗(yàn)短很多(Time/s 下的時(shí)間是在64 GB 2.9 Ghz 的CPU 上的訓(xùn)練時(shí)間,不同機(jī)器的時(shí)間可能有所差異),且訓(xùn)練誤差仍然可接受誤差以內(nèi),更適合工程化應(yīng)用。3次試驗(yàn)結(jié)果見表6所示。
表6 三個(gè)試驗(yàn)結(jié)果對(duì)比
為了進(jìn)一步驗(yàn)證模型的精確度,說明模型的預(yù)測(cè)結(jié)果,本研究在測(cè)試集上做進(jìn)一步的測(cè)試,并且將模型預(yù)測(cè)的預(yù)測(cè)值和實(shí)際值對(duì)比。將每個(gè)樣本的預(yù)測(cè)值和實(shí)際值差值的絕對(duì)值做平均(MAE),如表7 所示。圖11 展示了3 個(gè)試驗(yàn)結(jié)果的預(yù)測(cè)值和實(shí)際值的曲線對(duì)比,圖12展示了3個(gè)試驗(yàn)真實(shí)值和預(yù)測(cè)值的差值。可以發(fā)現(xiàn),試驗(yàn)3 在測(cè)試集上的效果最好,與真實(shí)值貼合最緊,說明模型具有較好的泛化能力。
表7 不同模型實(shí)際值和預(yù)測(cè)值差值的均值
圖11 不同試驗(yàn)預(yù)測(cè)結(jié)果和實(shí)際值對(duì)比圖
圖12 不同試驗(yàn)實(shí)際值和預(yù)測(cè)值的差值圖
為了探究DCT 液壓響應(yīng)預(yù)測(cè)方法,本文提出了一種基于SHAP可解釋的ET模型。利用SHAP算法篩選重要的特征變量,作為ET 模型的輸入,構(gòu)建預(yù)測(cè)模型。通過對(duì)比試驗(yàn)可知,基于SHAP 可解釋ET模型具有以下優(yōu)勢(shì):
1)該模型可以較準(zhǔn)確地預(yù)測(cè)液壓響應(yīng),為基于數(shù)據(jù)與物理雙驅(qū)動(dòng)的控制方法提供較準(zhǔn)確的預(yù)測(cè)結(jié)果;
2)利用SHAP 算法可以對(duì)重要特征進(jìn)行篩選,并且具有良好的解釋性,可以降低訓(xùn)練數(shù)據(jù)維度,減少訓(xùn)練時(shí)間,同時(shí)又不會(huì)降低預(yù)測(cè)精度;
3)加入時(shí)間切片和升降壓判定屬性后,模型MSE 降至0.670 3,降低了0.551 2,說明時(shí)間序列對(duì)液壓結(jié)果有一定影響。
本試驗(yàn)結(jié)果可直接運(yùn)用于工程實(shí)際,在整車標(biāo)定時(shí),可參考試驗(yàn)得出的液壓響應(yīng)時(shí)間和跟隨效果值。