郭嘉強 黃敬 周武 時瑞浩 陳文慶
(廣州汽車集團股份有限公司汽車工程研究院,廣州 511434)
輪胎壓力監(jiān)測系統(tǒng)(Tire Pressure Monitoring System,TPMS)[1]對胎壓和胎溫等進行全天候?qū)崟r檢測,并在滿足一定的時間要求和一定的閾值條件時發(fā)出報警。目前,該系統(tǒng)對輪胎的快速漏氣具備較好的判斷能力,但當輪胎慢速漏氣發(fā)生時,輪胎壓力下降至報警胎壓通常需要較長時間,慢漏氣期間行駛不僅會加速輪胎磨損、容易引起爆胎,且影響車輛操縱穩(wěn)定性和行車安全,容易造成嚴重的交通事故[2]。因此,提前發(fā)現(xiàn)輪胎慢漏氣現(xiàn)象具有重要意義。
文獻[3]以某整車企業(yè)純電動汽車的遠程通信終端(Telematics BOX,TBOX)實時采集的輪胎時間序列數(shù)據(jù)為基礎(chǔ),經(jīng)過數(shù)據(jù)預處理、構(gòu)建派生字段,提出基于權(quán)重函數(shù)的輪胎慢漏氣預警算法,基于67 臺慢漏氣的車輛樣本數(shù)據(jù)進行模型訓練和模型預測,準確率接近80%。但是,如何進一步提高模型預測準確率、縮短模型預測時間,需要進一步研究。
本文基于TBOX 實時采集輪胎數(shù)據(jù),提出一種基于機器學習的輪胎慢漏氣實時預警方法,通過數(shù)據(jù)預處理、特征值構(gòu)建、數(shù)據(jù)樣本標注、模型訓練、模型評估、模型選優(yōu)、模型參數(shù)優(yōu)化和預測模型工程化等步驟[4],實現(xiàn)對車輛慢漏氣的實時預警,并通過對模型預測結(jié)果進行數(shù)據(jù)分析,驗證深度學習模型的可行性和可靠性。
本文基于車聯(lián)網(wǎng)系統(tǒng)(由車載網(wǎng)絡終端、車聯(lián)網(wǎng)平臺、大數(shù)據(jù)平臺等組成),按照GB/T 32960—2016《電動汽車遠程服務與管理系統(tǒng)技術(shù)規(guī)范》[5]的要求,將TPMS 的數(shù)據(jù)通過CAN 總線傳輸至TBOX,并經(jīng)移動網(wǎng)絡以一定周期實時傳輸至由Hadoop 和Spark 等組成的企業(yè)大數(shù)據(jù)平臺,實現(xiàn)胎壓系統(tǒng)狀態(tài)、輪胎壓力、輪胎溫度、輪胎系統(tǒng)告警等TPMS 時間序列數(shù)據(jù)采集[6]。
為了提升模型的預測精度,需對采集到的數(shù)據(jù)進行清洗,包含系統(tǒng)偶發(fā)故障時發(fā)出的無效值或異常值、車輛各輪胎胎壓完全相同等不可能的數(shù)據(jù)組合、補胎過程中胎壓監(jiān)測系統(tǒng)測得的胎壓數(shù)據(jù)、車端已識別的快漏氣等數(shù)據(jù)。采用滑動窗口均值[7]對胎壓數(shù)據(jù)進行均值濾波,以消除異常數(shù)據(jù),滑動窗口大小為3幀數(shù)據(jù)。
輪胎內(nèi)氣體溫度對輪胎壓力有較大影響[8],數(shù)據(jù)建模前需消除溫度對胎壓變化的影響,根據(jù)理想氣體定律得出胎壓溫度補償模型,同時將不同溫度下的胎壓數(shù)據(jù)轉(zhuǎn)換為25 ℃時的等效胎壓。如圖1所示,通過胎壓溫度補償,可消除溫度影響,且如果輪胎并未漏氣,則補償壓力曲線會更為平滑。胎壓溫度補償計算過程如下:
圖1 溫度補償前、后胎壓對比
理想氣體定律為:
式中,P為溫度為T時采集的胎壓數(shù)據(jù);V為輪胎中空氣體積;N為輪胎中空氣的物質(zhì)的量;R為熱力學常數(shù);T為輪胎中空氣的絕對溫度。
假定由放氣引起的任何輪胎尺寸變化可忽略,且輪胎體積固定,則式(1)可改寫為:
式(2)右側(cè)的所有量為固定值,故壓力與溫度成正比。引入2 個新的量:補償胎壓壓力C和標稱溫度T0,可建立以下關(guān)系:
選擇預設固定值,例如25 ℃作為標稱溫度T0,則可將不同溫度下的胎壓數(shù)據(jù)轉(zhuǎn)換為25 ℃時的等效胎壓p:
式中,P0=100 kPa為大氣壓力;temp為胎溫。
由圖1 可以看出,受輪胎振動或傳感器采集誤差等的影響,胎壓溫度補償后胎壓仍存在波動,通過大數(shù)據(jù)統(tǒng)計得出該波動值的絕對值為PT=10 kPa。車輛停車休眠期間因無胎壓數(shù)據(jù)采集,當此時間段內(nèi)胎壓變化值大于閾值PT,且停車重新起動時車端胎壓無低壓預警時,缺失數(shù)據(jù)需要按照等差數(shù)列方式進行數(shù)據(jù)插值。
選取低壓報警車輛數(shù)據(jù),數(shù)據(jù)中可能包含快漏氣和慢漏氣,本文主要針對慢漏氣故障進行預警,需要標記慢漏氣故障數(shù)據(jù),同時剔除快速漏氣故障數(shù)據(jù)。
假設數(shù)據(jù)預處理后某輪胎慢漏氣片段時間序列數(shù)據(jù)集為[t0,p0],[t1,p1],…,[tn-1,pn-1],其中n為數(shù)據(jù)集樣本的數(shù)量,若滿足下面2個條件之一,則該次漏氣故障視為慢漏氣故障:
a. 第ti時刻與第ti-1時刻的胎壓變化率小于20 kPa/min(該閾值由各企業(yè)TPMS 軟件標定得出)。
b.第ti時刻與第ti-1時刻時間差小于30 min;當二者時間差大于30 min,且ti時刻胎壓不低于車端的胎壓低壓報警閾值(車輛休眠期間不回傳數(shù)據(jù),這期間胎壓降低到低壓報警閾值),則不視為慢速漏氣。
針對基于上述規(guī)則處理后的胎壓數(shù)據(jù),進行慢漏氣數(shù)據(jù)片段標注:自車輪胎胎壓互減,將任意一個差值的絕對值連續(xù)3次大于閾值PT的時刻作為車輛慢漏氣數(shù)據(jù)片段的起始點,胎壓第一次低壓報警的前一時刻作為慢漏氣數(shù)據(jù)片段的終點。為了便于數(shù)據(jù)建模,車輛慢漏氣期間,每輛車分別只選取一個慢漏氣和一個正常輪胎數(shù)據(jù)片段,如圖2所示,右后輪胎標記為慢漏氣輪胎,左后輪胎為正常輪胎,為了縮短模型預測時間,盡早預測,截取的慢漏氣數(shù)據(jù)片段是起始點和終點之間的部分數(shù)據(jù)片段。基于該方法從大數(shù)據(jù)平臺抽取1 000 臺發(fā)生過慢漏氣的車輛,將其數(shù)據(jù)標注為數(shù)據(jù)樣本。
圖2 輪胎慢漏氣數(shù)據(jù)片段標注示意
基于3.1 中數(shù)據(jù)預處理后輪胎慢漏氣片段n個時間序列數(shù)據(jù),進行輪胎慢漏氣特征值計算。
3.2.1 胎壓累計變化量
用Δp表示該慢漏氣數(shù)據(jù)片段胎壓的累計變化量,采用慢漏氣數(shù)據(jù)片段終點前3 個數(shù)據(jù)和起始點連續(xù)采集3個胎壓數(shù)據(jù)的均值差計算:
3.2.2 胎壓變化率
用k表示慢漏氣數(shù)據(jù)片段曲線的斜率、b表示截距,di、Di分別表示誤差、誤差平方和,pˉ、tˉ為均值,采用最小二乘法擬合直線,通過最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配,使求得的數(shù)據(jù)與實際數(shù)據(jù)之間誤差的平方和最?。?/p>
設擬合直線為:
設誤差為:
采用最小二乘法擬合直線:
對式(8)求偏導,可得:
3.2.3 胎壓標準差
用標準差(Standard Deviation,STD)Dst反映慢漏氣數(shù)據(jù)片段胎壓偏離平均值的離散程度:
隨機森林(Random Forest,RF)算法是一種基于分類回歸樹(Classification and Regression Tree,CART)和引導聚集(Bootstrap aggregating,Bagging)方法的集成算法,能夠提供良好的預測性能[9]。研究表明,RF 算法具有較強的抗噪聲和過擬合能力[10]。因此從現(xiàn)有的機器學習算法訓練模型邏輯回歸(Logistic Regression,LR)、RF、向量機(Support Vector Machine,SVM)、梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)等模型中選取RF 算法建立輪胎慢漏氣預測模型?;跇俗?shù)據(jù)樣本和3.2 節(jié)部分特征值計算的數(shù)據(jù)集表示為:
式中,m為每個樣本的特征數(shù)量;Xi為特征值;yi為慢漏氣標志符,yi=0 表示輪胎正常,yi=1 表示輪胎漏氣。
數(shù)據(jù)集示例如表1所示。
表1 數(shù)據(jù)集示例
將數(shù)據(jù)集按照7∶3的比例隨機劃分為訓練集和測試集,1 000 臺車輛樣本數(shù)據(jù)劃分的訓練集包括700 個漏氣片段和700 個正常片段,測試集包括300個漏氣片段和300個正常片段。
其中訓練集SL記為:
式中,L為訓練集的數(shù)量。
具體的RF算法如圖3所示,步驟如下:
圖3 RF模型算法框架
a.采用自舉法(Bootstrap)對訓練集SL進行隨機采樣,得到數(shù)量為K的子訓練樣本集合{T1,T2,...,TK}和數(shù)量為K的測試樣本集合;
b.利用步驟a 得到的新的訓練集分別建立多個分類決策樹模型M1、M2、……、MK;
c.將測試集代入訓練好的決策樹模型中,得到K個分類結(jié)果分別為分類A、分類B……;
d.將所有決策樹的投票結(jié)果匯總,最多的類別作為RF模型的預測結(jié)果。
為了評估訓練模型,引入混淆矩陣、準確率、精確率、召回率、F1 分值、受試者工作特征曲線(Receiver Operating Characteristic Curve,ROC)等評價指標,將測試數(shù)據(jù)集(300個漏氣片段,300個正常片段)輸入訓練好的模型進行測試驗證,結(jié)果如圖4和圖5所示。
圖4 RF模型訓練指標評估
RF 模型指標評估結(jié)果中混淆矩陣真正例數(shù)量為300 個,假正例數(shù)量為0,真負例數(shù)量為0,假負例數(shù)量為300 個,預測全部正確;預測準確率為100%,召回率為100%,F(xiàn)1 分值為1.00,查準率為100%;正常的F1 分值為1;慢漏氣的F1 分值為1。以上指標表明,選擇的RF模型表現(xiàn)較好。
由圖5 可以看出,ROC 曲線下面積(Area Under Curve,AUC)為1.00,選擇的RF模型表現(xiàn)良好。
首先利用隨機參數(shù)選擇模型確定模型參數(shù)的大致范圍,然后用交叉驗證法與網(wǎng)格搜索法對模型算法進行精確搜索[11],RF 模型需調(diào)優(yōu)超參數(shù)包含決策樹數(shù)量、決策樹最大深度、最小葉子節(jié)點樣本數(shù)量等,經(jīng)多輪優(yōu)化,最優(yōu)的模型參數(shù)為:決策樹數(shù)量為50 棵、樹最大深度為6 層、最小葉子節(jié)點樣本數(shù)量為15個等。選取其中一棵決策樹如圖6所示。
圖6 決策樹示例
將訓練好的RF 模型部署到采用Spark、Kafka、Clickhouse、Redies 等組成的大數(shù)據(jù)計算集群,以便實現(xiàn)預測模型對車輛的實時預測,具體步驟如圖7所示,大數(shù)據(jù)計算平臺基于新采集的車輛胎壓數(shù)據(jù)進行數(shù)據(jù)異常值清洗、溫度補償、窗口函數(shù)過濾等數(shù)據(jù)預處理計算,然后自車輪胎胎壓兩兩相減篩選出任一胎壓差值絕對值連續(xù)N次大于閾值PT的車輛清單,判斷這些車輛是否已經(jīng)在緩存的車輛監(jiān)控清單中,如果不在清單中,新增慢漏氣數(shù)據(jù)片段起始時刻t0,并調(diào)用特征值計算,開始進入模型預測,輸出預測結(jié)果,同時新增車輛到車輛監(jiān)控清單中,周期循環(huán),直至pn+1-pn>PT時,車輛退出慢漏氣監(jiān)控清單。當模型連續(xù)N次預測輪胎慢漏氣時,慢漏氣預警信息通過移動網(wǎng)絡推送給用戶,及時提醒用戶檢查輪胎和進行補胎操作。將輪胎慢漏氣模型預測結(jié)果輸入模型,利用數(shù)據(jù)閉環(huán)持續(xù)進行模型訓練,可以不斷提高模型的精度。
圖7 模型線上流程
從模型預測結(jié)果中隨機選取1 596 臺慢漏氣車輛,示例如表2所示。
表2 模型預測結(jié)果示例
以表2 中編號2 的車輛為例,車輛胎壓慢漏氣曲線如圖8 所示,9 月22 日6:26:14 時刻該車輛開始進入預測模型,9 月23 日06:32:00 時刻模型預測為發(fā)生慢漏氣,持續(xù)時間為24.11 h,9 月29 日18:12:54車端發(fā)出胎壓過低告警,持續(xù)時間為179.78 h,模型預測平均比車端低壓告警時間提前了155.67 h。
圖8 車輛胎壓慢漏氣時序
針對模型預測慢漏氣的1 596 臺車輛,在模型預測成功后又發(fā)生輪胎低壓告警的車輛有1 565臺,從這批車輛中隨機抽取200 臺車,經(jīng)過短信核實,有198臺車發(fā)生了慢漏氣故障,綜合以上驗證結(jié)果,訓練模型預測準確率達到98%以上。模型慢漏氣第一次預測時刻和車端第一次輪胎低壓報警數(shù)據(jù)對比分析如圖9 所示,汽車輪胎漏氣到模型成功預測時間均值接近34.7 h,模型成功預測時間比車端胎壓低壓告警時間平均提前了106.3 h。
圖9 輪胎慢漏氣時間對比
本文基于車聯(lián)網(wǎng)實時采集的胎壓系統(tǒng)數(shù)據(jù),提出一種基于機器學習的輪胎慢漏氣實時預警方法,首先對原始數(shù)據(jù)進行異常數(shù)據(jù)清除、滑動窗口均值濾波、溫度補償?shù)阮A處理,提高了模型精度,其次,采用單車輪胎胎壓自我比較法確定漏氣起始時刻進行輪胎慢漏氣片段標注,提高了標注效率并過濾了正常車輛進入計算模型,節(jié)約計算資源,最后構(gòu)建特征工程,選取RF機器學習算法進行模型開發(fā)。
本文提出的機器學習算法根據(jù)車型TPMS 軟件標定閾值(快漏氣閾值、低壓報警閾值等)不同選取輪胎慢漏氣數(shù)據(jù)樣本進入車型輪胎慢漏氣預測模型算法訓練,以便車型輪胎慢漏氣預測模型參數(shù)與車型TPMS 標定值更好地適配;積累模型預測數(shù)據(jù)構(gòu)建數(shù)據(jù)閉環(huán)重新進入模型訓練,持續(xù)提高模型預測精度;模型算法車型驗證準確率接近98%,預測胎壓慢漏氣平均時間為34.7 h,比車端低壓告警平均時間提前了106.3 h。