蔣國璋,張翼翔,向 峰,李公法
(1.武漢科技大學(xué)冶金裝備及其控制教育部重點(diǎn)實(shí)驗(yàn)室,湖北 武漢,430081;2.武漢科技大學(xué)機(jī)械傳動(dòng)與制造工程湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 武漢,430081;3.武漢科技大學(xué)精密制造研究院,湖北 武漢,430081)
卡車的動(dòng)力轉(zhuǎn)向系統(tǒng)(以下簡稱“動(dòng)轉(zhuǎn)系統(tǒng)”)普遍采用液壓助力轉(zhuǎn)向(HPS),車輛在行駛時(shí)將發(fā)動(dòng)機(jī)的一部分能量供給動(dòng)轉(zhuǎn)系統(tǒng),幫助駕駛員控制卡車轉(zhuǎn)向,其本質(zhì)屬于一種液壓傳動(dòng)系統(tǒng)。相較于固定工作環(huán)境下的液壓系統(tǒng),卡車動(dòng)轉(zhuǎn)系統(tǒng)所面臨的工作條件更為復(fù)雜多變,并且由于工作性質(zhì)原因,很難對(duì)其工作狀態(tài)進(jìn)行有效監(jiān)測,因此在系統(tǒng)發(fā)生漏油初期往往不易察覺,得不到及時(shí)維修,導(dǎo)致漏油程度嚴(yán)重惡化。
目前卡車制造企業(yè)對(duì)于漏油問題的解決方案是由售后服務(wù)人員對(duì)故障車輛進(jìn)行維修,并根據(jù)現(xiàn)場情況在售后服務(wù)記錄中通過自然語言對(duì)漏油情況進(jìn)行描述,再通過車輛的編號(hào)追溯生產(chǎn)制造信息。維修人員通常只從動(dòng)轉(zhuǎn)系統(tǒng)自身角度對(duì)漏油原因進(jìn)行分析,無法從歷史案例中找出與漏油相關(guān)的規(guī)律,也無法從生產(chǎn)、裝配等環(huán)節(jié)去分析漏油原因。而企業(yè)的售后服務(wù)記錄是對(duì)車輛漏油情況的詳細(xì)文本描述,包含大量案例,從中分析出漏油產(chǎn)生的原因?qū)⒂欣谄髽I(yè)對(duì)生產(chǎn)技術(shù)進(jìn)行改進(jìn),同時(shí)根據(jù)歷史案例數(shù)據(jù)建立預(yù)測模型,可以對(duì)卡車漏油情況進(jìn)行預(yù)測,以避免更嚴(yán)重的漏油事故發(fā)生。
對(duì)蘊(yùn)含在售后服務(wù)記錄中的大量信息進(jìn)行數(shù)據(jù)挖掘的一個(gè)有力工具是情感分析(sentiment analysis)。情感分析又稱為評(píng)論挖掘,它通過自然語言處理(natural language processing, NLP)等技術(shù)獲取文字記錄者對(duì)所記錄事件的評(píng)價(jià)和態(tài)度[1],目前主要包括基于情感詞典的方法、基于機(jī)器學(xué)習(xí)的方法以及基于深度學(xué)習(xí)的方法?;谇楦性~典的方法以情感詞典中收錄詞語的情感極性和強(qiáng)度信息作為情感傾向的主要判斷依據(jù)[2-4],但是構(gòu)建領(lǐng)域情感詞典的工作較為復(fù)雜,且詞典的準(zhǔn)確性也會(huì)影響到分析結(jié)果。基于機(jī)器學(xué)習(xí)的方法需要人工構(gòu)造特征,再通過支持向量機(jī)(SVM)等機(jī)器學(xué)習(xí)算法進(jìn)行分類[5],所構(gòu)造特征的質(zhì)量直接影響到分類準(zhǔn)確性,且構(gòu)造特征需要領(lǐng)域知識(shí),要耗費(fèi)大量人力和時(shí)間。
隨著深度學(xué)習(xí)技術(shù)的發(fā)展,越來越多的研究者將其應(yīng)用到情感分析上。Kim[6]對(duì)卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)模型進(jìn)行了調(diào)整,將其應(yīng)用于文本分類任務(wù)。Wang等[7]在CNN模型的輸入層和池化層加入注意力機(jī)制,使模型對(duì)文本中的重要詞語更加關(guān)注。蔡鑫等[8]使用長短期記憶(long short-term memory, LSTM)神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)對(duì)中國電信官方微博訪問用戶的情緒分析,克服了傳統(tǒng)文本處理方法中容易丟失上下文順序和詞的語義差異的缺陷。鄧楠等[9]提出了一種改進(jìn)的雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)模型,在隱藏層加入情感特征抽取模塊,改善了文本情感分析效果?;谏疃葘W(xué)習(xí)的情感分析方法可以彌補(bǔ)基于情感詞典和基于機(jī)器學(xué)習(xí)的情感分析方法的不足,但上述模型只能分析一段文字整體所表達(dá)的粗粒度的二元情感傾向。為了獲取更加精確的情感分析結(jié)果,需要對(duì)文本所包含的信息進(jìn)行細(xì)粒度分析。細(xì)粒度情感分析主要從兩方面著手,一是文本區(qū)分粒度細(xì)化,即針對(duì)文本信息的不同方面進(jìn)行情感分析,從而基于同一段文字獲得不同角度的情感傾向[10-12],二是情感強(qiáng)度細(xì)化,即將情感劃分為更多的層次,從而獲得更加準(zhǔn)確的情感分析結(jié)果[13-14]。以上研究可以為基于描述文本的卡車動(dòng)轉(zhuǎn)系統(tǒng)漏油程度量化提供參考。
在獲得漏油程度量化結(jié)果后,結(jié)合售后服務(wù)記錄中的相關(guān)生產(chǎn)數(shù)據(jù),可對(duì)動(dòng)轉(zhuǎn)系統(tǒng)的漏油問題進(jìn)行分析預(yù)測。目前機(jī)械系統(tǒng)故障預(yù)測方面的研究成果較多,例如,Zhao等[15]采用小波包分析方法提取液壓系統(tǒng)中液壓缸的故障特征,實(shí)現(xiàn)了對(duì)其早期泄露的預(yù)測;Prakash等[16]基于深度神經(jīng)網(wǎng)絡(luò)模型對(duì)液壓系統(tǒng)中冷卻回路的工作狀況進(jìn)行了預(yù)測;Chen等[17]提出了一種無需先驗(yàn)知識(shí)的滾動(dòng)軸承剩余使用壽命的預(yù)測方法;徐增丙等[18]設(shè)計(jì)了改進(jìn)直接灰色模型,用以預(yù)測混凝土泵車擺缸的泄露趨勢;韓朝建等[19]采用支持向量機(jī)實(shí)現(xiàn)對(duì)鐵路車輛車鉤裝置運(yùn)動(dòng)可靠性的預(yù)測;黃魁等[20]提出了一種結(jié)合灰色理論和神經(jīng)網(wǎng)絡(luò)的預(yù)測模型,在雷達(dá)發(fā)射機(jī)的故障預(yù)測中獲得較好精度。但是以上方法只是基于已有數(shù)據(jù)特征進(jìn)行預(yù)測,沒有深入考慮特征與故障之間的相關(guān)性。
本文基于某企業(yè)的卡車動(dòng)轉(zhuǎn)系統(tǒng)漏油問題的售后服務(wù)記錄,首先采用結(jié)合注意力機(jī)制的雙向長短期記憶神經(jīng)網(wǎng)絡(luò)模型(BiLSTM with attention mechanism,Att-BiLSTM)根據(jù)漏油描述文本進(jìn)行漏油程度量化,然后將隨機(jī)森林(random forest, RF)算法[21]與BP神經(jīng)網(wǎng)絡(luò)模型相結(jié)合,建立動(dòng)轉(zhuǎn)系統(tǒng)漏油分析預(yù)測模型,并對(duì)可能造成漏油的樣本特征與漏油程度進(jìn)行相關(guān)性分析,依據(jù)其結(jié)果,一方面可以指導(dǎo)企業(yè)進(jìn)行工藝改進(jìn),另一方面在進(jìn)行回歸預(yù)測時(shí)可減少無關(guān)數(shù)據(jù)的影響,從而提高模型性能。
本文采用模糊層次分析法建立漏油程度量化訓(xùn)練標(biāo)簽。首先依據(jù)售后服務(wù)記錄建立卡車動(dòng)轉(zhuǎn)系統(tǒng)漏油程度評(píng)價(jià)指標(biāo)體系,如圖1所示。
圖1 漏油程度評(píng)價(jià)指標(biāo)體系Fig.1 Evaluation index system for oil leakage
咨詢相關(guān)專家并采用1~9標(biāo)度衡量評(píng)價(jià)體系中屬性Ci的重要程度,記作IMi。以f(Ci,Cj)表示兩個(gè)屬性間重要程度的對(duì)比:
(1)
創(chuàng)建評(píng)價(jià)指標(biāo)權(quán)重判斷矩陣R以獲得每個(gè)屬性的權(quán)重:
求得矩陣R的最大特征值λmax,并通過式(2)驗(yàn)證一致性指標(biāo)CR:
(2)
式中:n為矩陣R的維度;RI為對(duì)應(yīng)維度的平均隨機(jī)一致性指標(biāo)。
若CR<0.1,則認(rèn)為λmax所對(duì)應(yīng)的特征向量Wmax經(jīng)過歸一化后的向量W=(w1,w2,…,wi)T即為評(píng)價(jià)體系中每個(gè)屬性對(duì)應(yīng)的權(quán)重。運(yùn)用模糊數(shù)學(xué)理論,將漏油程度分為5級(jí),即{嚴(yán)重,較嚴(yán)重,一般,較輕微,輕微},其對(duì)應(yīng)的賦值區(qū)間為{(1.0,0.8],(0.8,0.6],(0.6,0.4],(0.4,0.2],(0.2,0)}。請相關(guān)專家依據(jù)售后服務(wù)記錄,同時(shí)參考5級(jí)漏油程度評(píng)價(jià)方法,確定當(dāng)前車輛每個(gè)屬性Ci所對(duì)應(yīng)的嚴(yán)重程度,記作向量VC=(v1,v2,…,vi)。根據(jù)公式(3)以及5級(jí)漏油程度賦值區(qū)間即可獲得當(dāng)前車輛的漏油程度:
(3)
式中:E為卡車漏油程度對(duì)應(yīng)的賦值;vi為專家對(duì)漏油評(píng)價(jià)指標(biāo)體系中第i個(gè)屬性的嚴(yán)重程度評(píng)分;wi為第i個(gè)屬性的權(quán)重。
漏油描述文本是以中文記錄的,進(jìn)行漏油程度量化時(shí),需要將文本處理成神經(jīng)網(wǎng)絡(luò)能夠運(yùn)算的數(shù)值張量,將每個(gè)詞以向量的形式輸入到神經(jīng)網(wǎng)絡(luò)模型。首先要采用分詞、去停用詞等步驟對(duì)漏油描述文本進(jìn)行預(yù)處理,同時(shí)因?yàn)槁┯兔枋鑫谋局械闹T如“故障現(xiàn)象”、“診斷結(jié)論”等詞語對(duì)于漏油程度的量化沒有意義,在預(yù)處理階段也將其去除。
文本經(jīng)過預(yù)處理后,再通過Word2Vec訓(xùn)練成詞向量。Word2Vec是一種以無監(jiān)督的方式學(xué)習(xí)語義知識(shí)并將自然語言轉(zhuǎn)換成向量數(shù)據(jù)的軟件工具,圖2所示為將一段漏油描述文本處理成向量數(shù)據(jù)的過程。
圖2 漏油描述文本轉(zhuǎn)換為詞向量Fig.2 Transformation of description text for oil leakage into word vector
漏油描述文本是一種序列信息,且詞語之間存在很強(qiáng)的邏輯關(guān)聯(lián),循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks, RNN)是一種用于處理序列信息的經(jīng)典算法。LSTM是基于RNN的改進(jìn)形式,有效避免了RNN訓(xùn)練中出現(xiàn)的梯度消失問題,其核心是單元和門管理機(jī)制。
將一段漏油描述文本轉(zhuǎn)換為詞向量,記為X={x1,x2,…,xn},將其作為訓(xùn)練特征輸入LSTM后,當(dāng)前單元的輸出ht由上個(gè)單元的輸出ht-1及當(dāng)前單元的輸入xt決定,如式(4)所示。
(4)
式中:σ表示Sigmod函數(shù);Wo為LSTM權(quán)值矩陣;Ct為當(dāng)前單元狀態(tài)值向量;→表示LSTM的數(shù)據(jù)流方向;bo為線性系數(shù)偏倚。
但是單向的LSTM只能從前到后地獲取上下文信息,而雙向長短期記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)在LSTM的基礎(chǔ)上加入一個(gè)反向的LSTM從后往前獲取信息(見式(5)),并將雙向信息融合后輸出,從而獲取全局信息,見式(6)。
(5)
(6)
式中:Ht為當(dāng)前BiLSTM的輸出。
漏油描述文本中的一些關(guān)鍵詞語對(duì)于漏油程度的判斷尤為重要,如“救援”、“沉重”等。本文在BiLSTM模型中引入注意力機(jī)制,建立Att-BiLSTM神經(jīng)網(wǎng)絡(luò)模型,通過賦予重要詞語更高的權(quán)重,使模型對(duì)這些詞語更加關(guān)注,從而提高模型訓(xùn)練結(jié)果的準(zhǔn)確性。
首先將單元輸出Ht通過式(7)建立注意力權(quán)重,隨后通過式(8)將注意力權(quán)重歸一化到0~1之間,再通過式(9)將注意力權(quán)重配置給Ht。最后將A輸入到輸出層,通過Relu函數(shù)輸出漏油程度量化結(jié)果,如式(10)所示。漏油程度量化過程見圖3。
ut=tanh(Ht)
(7)
(8)
(9)
(10)
圖3 漏油程度量化過程Fig.3 Process of quantifying oil leakage
根據(jù)售后服務(wù)記錄將漏油程度量化后,結(jié)合相關(guān)生產(chǎn)信息建立漏油分析樣本集,從而進(jìn)行漏油原因分析及預(yù)測。漏油分析樣本集中的相關(guān)生產(chǎn)信息主要是由售后服務(wù)部門的工作人員根據(jù)漏油車輛的實(shí)際情況在MES、ERP等系統(tǒng)中追溯到的車輛生產(chǎn)信息進(jìn)行記錄,其中不可避免地存在異常數(shù)據(jù)或缺失值。數(shù)據(jù)預(yù)處理的工作就是把樣本集內(nèi)的數(shù)據(jù)處理為可以進(jìn)行預(yù)測分析的狀態(tài),該階段的工作質(zhì)量將會(huì)影響到預(yù)測分析的效率和準(zhǔn)確度。本文按以下步驟對(duì)數(shù)據(jù)進(jìn)行預(yù)處理:①將樣本集中記錄不完善、缺失甚至錯(cuò)誤的項(xiàng)目刪除;②使用標(biāo)準(zhǔn)化方法讓所有數(shù)值都處在0~1之間;③將樣本集按照8∶2的比例分為訓(xùn)練樣本和測試樣本。
另外,樣本集中包含一些特征如“車型”、“生產(chǎn)線”等,這些特征對(duì)應(yīng)的字符或數(shù)字并無數(shù)值上的意義,需要在預(yù)處理階段使用獨(dú)熱編碼(one-hot encoding,OHE)對(duì)這些特征進(jìn)行處理,以“車型”為例,OHE處理過程如圖4所示。
圖4 獨(dú)熱編碼處理過程Fig.4 Process of one-hot encoding
樣本集中的各個(gè)特征與漏油的相關(guān)性并不相同,通過相關(guān)性分析,一方面可以找出對(duì)漏油問題影響較大的特征,企業(yè)應(yīng)重點(diǎn)關(guān)注,另一方面可以在建立回歸模型時(shí)忽略影響程度較低的特征,降低預(yù)測模型的特征維度,從而減少運(yùn)算資源的浪費(fèi),提高預(yù)測結(jié)果的準(zhǔn)確性。
建立RF-BP分析預(yù)測模型如圖5所示。先通過RF算法獲得各個(gè)特征的變量重要性(variable importance measure, VIM),再將VIM大于閾值的特征輸入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行回歸預(yù)測。
圖5 RF-BP神經(jīng)網(wǎng)絡(luò)分析預(yù)測模型Fig.5 Analysis and prediction model based on RF-BP neural network
2.2.1 計(jì)算特征VIM
隨機(jī)森林算法在分析數(shù)據(jù)時(shí),通過隨機(jī)置換各變量的值并計(jì)算置換前后袋外數(shù)據(jù)(OOB)的錯(cuò)誤率來確定每個(gè)特征的VIM,其計(jì)算公式為:
(11)
式中:N為隨機(jī)森林中決策樹的個(gè)數(shù);errOOB1it為變量置換之前第t棵樹的錯(cuò)誤率;errOOB2it為變量置換之后第t棵樹的錯(cuò)誤率。
2.2.2 預(yù)測漏油程度
BP神經(jīng)網(wǎng)絡(luò)是用于回歸預(yù)測的經(jīng)典模型,將VIM大于閾值的特征輸入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行漏油程度預(yù)測訓(xùn)練。以平均絕對(duì)誤差(MAE)和平均相對(duì)誤差(MAPE)作為模型預(yù)測性能的評(píng)價(jià)指標(biāo):
(12)
(13)
以某卡車制造企業(yè)提供的2017年1月到2019年4月的售后服務(wù)記錄作為實(shí)驗(yàn)數(shù)據(jù)集,共包含635個(gè)數(shù)據(jù)樣本。數(shù)據(jù)分析環(huán)境為Python 3.7.3,主要采用Sklearn、Pandas、Numpy等工具及以GPU版TensorFlow為后端的深度學(xué)習(xí)框架Keras,操作系統(tǒng)為Windows 10專業(yè)工作站版。
漏油程度量化屬于有監(jiān)督學(xué)習(xí),先要建立訓(xùn)練集。采用模糊層次分析法對(duì)訓(xùn)練集中的漏油描述文本建立訓(xùn)練標(biāo)簽需要較大的人力消耗,因此綜合考慮其有效性,將訓(xùn)練集設(shè)置為200條漏油描述文本。
首先請專家根據(jù)動(dòng)轉(zhuǎn)系統(tǒng)漏油程度評(píng)價(jià)指標(biāo)體系(圖1)確定評(píng)價(jià)權(quán)重系數(shù),并建立權(quán)重判斷矩陣R:
計(jì)算出矩陣R的最大特征值為5.291,并求得一致性指標(biāo)CR=0.065<0.1,則其對(duì)應(yīng)的特征向量W=[0.8616,0.4346,0.2177,0.1352,0.0548]T即為5個(gè)評(píng)價(jià)指標(biāo)的權(quán)重。
然后請專家根據(jù)漏油程度評(píng)價(jià)指標(biāo)體系,分別對(duì)當(dāng)前車輛的各個(gè)相關(guān)屬性進(jìn)行評(píng)分,再通過式(3)計(jì)算出這200條漏油描述文本對(duì)應(yīng)的漏油程度以建立訓(xùn)練集。
隨后,對(duì)訓(xùn)練集進(jìn)行預(yù)處理,通過Word2Vec進(jìn)行向量化,再將詞向量矩陣輸入Att-BiLSTM 模型進(jìn)行訓(xùn)練。對(duì)模型加入隨機(jī)失活(dropout)以避免訓(xùn)練出現(xiàn)過擬合[22],并通過早停法(early stopping)在模型學(xué)習(xí)率降低或即將陷入過擬合前結(jié)束訓(xùn)練。
設(shè)計(jì)5組實(shí)驗(yàn)對(duì)Att-BiLSTM模型的性能進(jìn)行驗(yàn)證,實(shí)驗(yàn)中采用的對(duì)照組模型描述如下:
(1)用于情感分析的卷積神經(jīng)網(wǎng)絡(luò)模型CNN[6]。
(2)引入注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)模型Att-CNN[7]。
(3)基礎(chǔ)的長短期記憶神經(jīng)網(wǎng)絡(luò)模型LSTM。
(4)引入注意力機(jī)制的長短期記憶神經(jīng)網(wǎng)絡(luò)模型Att-LSTM。
(5)雙向長短期記憶神經(jīng)網(wǎng)絡(luò)模型BiLSTM。
分別對(duì)Att-BiLSTM及以上5個(gè)對(duì)照模型進(jìn)行訓(xùn)練,結(jié)果如表1及圖6所示。
由表1和圖6可見,LSTM模型在漏油程度量化時(shí)比CNN模型具有更好的性能,這是因?yàn)樵谔幚碜匀徽Z言這種序列數(shù)據(jù)方面,LSTM因其記憶能力而表現(xiàn)更佳。同時(shí),CNN和LSTM在引入注意力機(jī)制后,模型精度都得到了提升,表明部分詞語對(duì)于漏油程度量化十分關(guān)鍵,模型對(duì)這部分關(guān)鍵信息進(jìn)行關(guān)注而獲得了更高的準(zhǔn)確率。另外,相較于單向的LSTM,BiLSTM的精度也得到提升,表明雙向信息的獲取有利于更加準(zhǔn)確地量化漏油程度??傊?,與其他5種模型相比,Att-BiLSTM模型在漏油程度量化上具有充分的優(yōu)勢。表2為部分訓(xùn)練樣本基于Att-BiLSTM模型的漏油程度量化值與模糊層次分析結(jié)果的對(duì)比。
表1 不同模型的漏油程度量化準(zhǔn)確率Table 1 Accuracies of quantifying oil leakage by different models
圖6 不同模型在訓(xùn)練過程中的精度對(duì)比Fig.6 Accuracy comparison of different models during the training
表2 部分訓(xùn)練樣本的漏油程度量化結(jié)果Table 2 Results of oil leakage quantifying for some training samples
將本次實(shí)驗(yàn)數(shù)據(jù)集中的所有漏油描述文本均輸入Att-BiLSTM模型進(jìn)行漏油程度量化,并對(duì)漏油程度分布及其售后服務(wù)費(fèi)用進(jìn)行統(tǒng)計(jì),結(jié)果見圖7。
由圖7可見,根據(jù)5級(jí)漏油程度進(jìn)行區(qū)分,有大量卡車的漏油程度為“嚴(yán)重”等級(jí),所產(chǎn)生的售后服務(wù)費(fèi)用占漏油所致總損失費(fèi)用的67.65%。嚴(yán)重漏油不僅造成卡車制造企業(yè)大量的經(jīng)濟(jì)損失,同時(shí)對(duì)卡車駕駛而言也是巨大的安全隱患。
圖7 漏油程度分布及售后服務(wù)費(fèi)用Fig.7 Distribution of quantified values of oil leakage and the after-sales service costs
找到動(dòng)轉(zhuǎn)系統(tǒng)漏油的原因?qū)⒂欣诳ㄜ囍圃炱髽I(yè)解決漏油問題,節(jié)省售后服務(wù)成本,提高卡車安全性能??ㄜ噭?dòng)轉(zhuǎn)系統(tǒng)漏油不僅涉及到設(shè)計(jì)、制造、管理等方面,也有客戶使用習(xí)慣及保養(yǎng)維護(hù)等方面的原因。漏油問題的相關(guān)特征說明見表3。
表3 漏油相關(guān)特征說明Table 3 Description of oil leakage related features
通過查閱該企業(yè)內(nèi)部與漏油問題相關(guān)的資料,發(fā)現(xiàn)企業(yè)曾對(duì)墊片、卡套、管路及油罐結(jié)構(gòu)進(jìn)行過工藝改進(jìn)。為了驗(yàn)證工藝改進(jìn)效果,將改進(jìn)前后所生產(chǎn)車輛的對(duì)應(yīng)特征用布爾值表示,改進(jìn)節(jié)點(diǎn)前記為0,改進(jìn)節(jié)點(diǎn)后記為1,同時(shí)將前述根據(jù)2017年1月到2019年4月的售后服務(wù)記錄所計(jì)算出的漏油程度量化值作為訓(xùn)練目標(biāo)加入數(shù)據(jù)集中,建立漏油分析樣本集,表4所示為樣本集中的部分訓(xùn)練樣本。
表4 部分訓(xùn)練樣本Table 4 Part of the training samples
將樣本集進(jìn)行預(yù)處理后通過RF-BP神經(jīng)網(wǎng)絡(luò)模型對(duì)漏油程度進(jìn)行分析預(yù)測。首先基于隨機(jī)森林算法計(jì)算相關(guān)特征的VIM,結(jié)果見圖8。
由圖8可知,車輛行駛里程是與漏油相關(guān)性最強(qiáng)的特征,同時(shí)該企業(yè)對(duì)部分結(jié)構(gòu)的工藝改進(jìn)起到了較好的作用,而且車型平臺(tái)也是一個(gè)比較重要的特征,因此該企業(yè)在后期生產(chǎn)中對(duì)車型平臺(tái)進(jìn)行優(yōu)化升級(jí)也會(huì)進(jìn)一步改善漏油問題。另外,生產(chǎn)線和供應(yīng)商這兩個(gè)因素對(duì)漏油幾乎沒有影響,說明企業(yè)上游供應(yīng)商的品控較為可靠,而且企業(yè)內(nèi)部的生產(chǎn)線之間也無差異。將RF-BP神經(jīng)網(wǎng)絡(luò)的特征選擇閾值設(shè)置為0.1,在對(duì)漏油程度進(jìn)行預(yù)測時(shí)忽略生產(chǎn)線和供應(yīng)商這兩個(gè)VIM很小的特征。
圖8 各個(gè)特征的VIM值Fig.8 VIM values of various features
分別采用GM(1,1)[23]、SVM[19]、BP神經(jīng)網(wǎng)絡(luò)模型及本文提出的RF-BP神經(jīng)網(wǎng)絡(luò)模型,根據(jù)漏油分析樣本集對(duì)卡車動(dòng)轉(zhuǎn)系統(tǒng)的漏油程度進(jìn)行預(yù)測,部分預(yù)測結(jié)果如表5所示。
由表5可知,總體來看,BP神經(jīng)網(wǎng)絡(luò)及RF-BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果與實(shí)際漏油程度的擬合度較好,而GM(1,1)與SVM模型的預(yù)測結(jié)果則出現(xiàn)了較大的偏差;GM(1,1)模型的誤差值出現(xiàn)較大波動(dòng),而其他3種模型的誤差值相對(duì)較為穩(wěn)定;4種模型中,RF-BP神經(jīng)網(wǎng)絡(luò)模型的誤差及其波動(dòng)是最小的,表明通過該模型預(yù)測的漏油程度相對(duì)更加可靠。
表5 不同模型的預(yù)測結(jié)果對(duì)比Table 5 Comparison of prediction results by different models
為進(jìn)一步驗(yàn)證模型的性能,將上述4種訓(xùn)練完成的模型分別應(yīng)用于該企業(yè)2019年5月及2019年6月的售后服務(wù)記錄數(shù)據(jù)集,分別包含48個(gè)及46個(gè)數(shù)據(jù)樣本。以MAE及MAPE作為指標(biāo)進(jìn)行評(píng)價(jià),結(jié)果如表6所示。由表6可見,在對(duì)漏油程度進(jìn)行預(yù)測時(shí),BP神經(jīng)網(wǎng)絡(luò)模型相較于GM(1,1)及SVM具有明顯的優(yōu)勢,說明在面對(duì)大量的歷史數(shù)據(jù)時(shí),深度學(xué)習(xí)模型的數(shù)據(jù)驅(qū)動(dòng)方式能夠提供更好的預(yù)測性能;而且BP神經(jīng)網(wǎng)絡(luò)模型在結(jié)合了隨機(jī)森林算法后,其預(yù)測精度又有提升,說明在去除部分VIM值較低的特征后,減少了無關(guān)數(shù)據(jù)對(duì)模型的干擾,使其更加關(guān)注于重要特征,模型的性能也因此得到了改善。總之,RF-BP神經(jīng)網(wǎng)絡(luò)模型不僅在預(yù)測精度上具有優(yōu)勢,還可以計(jì)算出不同特征的VIM,可用于指導(dǎo)企業(yè)進(jìn)行工藝優(yōu)化,改善動(dòng)轉(zhuǎn)系統(tǒng)漏油問題,同時(shí)RF-BP神經(jīng)網(wǎng)絡(luò)模型的性能在2019年5月及6月的數(shù)據(jù)集上并未出現(xiàn)明顯的波動(dòng),表明該模型也具有較好的泛化能力。
表6 不同模型在3個(gè)數(shù)據(jù)集上的性能比較Table 6 Performance comparison of different models tested on three datasets
本文提出了一種基于企業(yè)售后服務(wù)記錄的卡車動(dòng)轉(zhuǎn)系統(tǒng)漏油分析預(yù)測方法。首先采用自然語言情感分析的方法建立Att-BiLSTM模型,針對(duì)售后服務(wù)記錄中的漏油描述文本進(jìn)行漏油程度量化。該模型從漏油描述文本的兩個(gè)方向全面獲取信息,并通過引入注意力機(jī)制使模型對(duì)文本中的關(guān)鍵詞語更加關(guān)注,取得了比其他模型更好的效果。然后結(jié)合漏油程度的量化結(jié)果,建立RF-BP神經(jīng)網(wǎng)絡(luò)分析預(yù)測模型,通過計(jì)算數(shù)據(jù)集中各個(gè)特征的重要性,分析出了卡車動(dòng)轉(zhuǎn)系統(tǒng)漏油的主要影響因素,據(jù)此對(duì)漏油趨勢進(jìn)行預(yù)測,取得了較好的預(yù)測精度。企業(yè)可通過預(yù)測模型對(duì)下線車輛的漏油情況進(jìn)行預(yù)測,及時(shí)提醒用戶對(duì)車輛進(jìn)行維護(hù),從而避免嚴(yán)重漏油問題的發(fā)生,可為企業(yè)和用戶節(jié)省大量費(fèi)用。