蔡 蕓,楊江輝,熊禾根
(武漢科技大學(xué) 冶金裝備及其控制教育部重點實驗室,機械傳動與制造工程湖北省重點實驗室,湖北 武漢 430081)
無樁式共享單車的出現(xiàn)為人們的出行提供了便利,但單車故障問題也大量出現(xiàn)。Kaspi等[1]指出,即使故障共享單車的比例很小,仍然會嚴重地影響用戶對整個共享單車系統(tǒng)的滿意度。故障共享單車不僅降低了共享單車運營企業(yè)的服務(wù)品質(zhì),還嚴重威脅騎行乘客的安全。因此,及時回收故障單車成為企業(yè)亟待解決的問題。
目前研究共享單車的故障預(yù)測問題的文獻很少,其研究對象分為有樁式共享單車系統(tǒng)和無樁式共享單車系統(tǒng)。研究問題大致可分為兩類:預(yù)測每一輛單車的故障狀態(tài)和預(yù)測站內(nèi)故障單車的數(shù)量問題。例如,Kaspi等[2]用貝葉斯模型對停放在站內(nèi)的每一輛有樁單車進行故障預(yù)測。趙明明[3]用Cox比例風(fēng)險模型,考慮單車的使用時間、環(huán)境等因素,對站內(nèi)每一輛有樁單車進行故障預(yù)測。Zhang等[4]用邏輯回歸模型,考慮騎行速度、維修次數(shù)等因素,計算每一輛無樁單車的損壞概率。張巍等[5]考慮單車故障概率隨模糊站點的使用強度不同而近似服從正態(tài)分布,來預(yù)測故障無樁單車數(shù)量。常山[6]考慮維修站影響區(qū)域、共享單車投射面積,提出故障單車區(qū)域密度公式,來預(yù)測故障無樁單車數(shù)量。
上述研究都取得了較好的理論成果,但存在如下問題:1) 單一預(yù)測模型考慮因素有限,導(dǎo)致系統(tǒng)誤差預(yù)測風(fēng)險大[7];2) 多數(shù)模型未考慮單車使用時間、頻率等預(yù)測因素的影響;3) 部分模型雖然考慮了預(yù)測因素的影響,但將所有因素同等看待,忽略了不同預(yù)測因素造成單車故障的重要程度不同。
針對上述問題,本文對上海市寶山區(qū)4月份共享單車騎行數(shù)據(jù)進行深入分析,應(yīng)用改進熵權(quán)法對故障單車的預(yù)測因素(騎行時長、距離等)賦予不同權(quán)值,進而得到每一輛單車的分值,再對所有分值進行平均優(yōu)化處理。在此基礎(chǔ)上,以BP神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)和ELMAN神經(jīng)網(wǎng)絡(luò)3種單一預(yù)測模型,建立基于critic權(quán)重的組合預(yù)測模型,并將其應(yīng)用于單車故障預(yù)測,以期降低預(yù)測風(fēng)險。
故障預(yù)測因素常采用騎行總距離、騎行次數(shù)、騎行速度、騎行總時長、維修次數(shù)以及共享單車自投放經(jīng)歷的惡劣天氣次數(shù)等[3-4]。本文對上海市2019年4月份無樁式共享單車用戶騎行數(shù)據(jù)(交易編號、車輛ID、騎行起點經(jīng)緯度、騎行終點經(jīng)緯度、租賃時間、還車時間等)進行分析,得到以下結(jié)論:故障單車租借騎行時長常會低于無故障單車的騎行時長,尤其是騎行時間低于1 min的時候故障單車數(shù)量暴增,同時騎行距離低于300 m時,故障車輛的數(shù)量也遠遠大于無故障單車,其原因可能是顧客試騎后發(fā)現(xiàn)單車故障,提前鎖車所致;此外,在無惡劣天氣和環(huán)境影響的情況下,單車停滯時間過長大概率表示單車出現(xiàn)故障;單車在地鐵口、公交站、商業(yè)街等熱門區(qū)域的停滯時間和使用頻率與單車故障有相關(guān)性,與同區(qū)域單車相比,單車停滯天數(shù)過長,日租借次數(shù)過多或過少,預(yù)示著單車出現(xiàn)故障。
因此,本文選擇的共享單車故障預(yù)測因素包括服務(wù)時間低于1min的次數(shù)、服務(wù)路程低于300m的次數(shù)、停滯天數(shù)、熱門點停滯天數(shù)、日平均租借次數(shù)、熱門點日平均租借次數(shù)、租借均差值。其中,單車日平均租借次數(shù)包含該單車的熱門點日平均租借次數(shù)。租借均差值是某單車日均租借次數(shù)與近段時間該區(qū)域日均租借次數(shù)的差的絕對值。該絕對值越大表示單車租借次數(shù)過多或者過少,都預(yù)示著存在故障風(fēng)險。
在對多個影響因素進行綜合評價時,各影響因素權(quán)值的分配是量化評估的關(guān)鍵。為此,本文應(yīng)用改進熵權(quán)法對共享單車故障預(yù)測的各個預(yù)測因素予以不同權(quán)重。熵權(quán)的獲得建立在評價矩陣的基礎(chǔ)之上,在一個具有i組數(shù)據(jù)、j個預(yù)測因素的評估體系中,評價矩陣和改進熵權(quán)求解步驟如下。
第4步 用本文改進公式計算各項指標(biāo)的權(quán)值,改進公式如下。
針對傳統(tǒng)熵權(quán)法出現(xiàn)的問題,文獻[8](記為改進熵權(quán)法1)和文獻[9](記為改進熵權(quán)法2)對各項指標(biāo)的權(quán)值公式進行改進,但仍存在不足之處(如表1所示),因此本文提出以下改進。
式中,wj表 示第j個預(yù)測因素的權(quán)重;Hj是第j個預(yù)測因素的熵值;H是所有不為1的熵值的平均值。以下通過3組熵值對4種熵權(quán)法進行比較。由表1可知,對于第1組數(shù)據(jù),3種改進熵權(quán)法都克服了傳統(tǒng)熵權(quán)法的權(quán)重分配問題;對于第2、3組數(shù)據(jù),改進熵權(quán)法1和2明顯縮小了熵權(quán)之間的差距。在熵值離散時,本文改進的熵權(quán)法的熵權(quán)離散效果更好。綜上,本文改進的熵權(quán)法更加合理。
表1 改進熵權(quán)法的效果比較Table 1 Effect Comparison of improved entropy weight method
共享單車故障預(yù)測與單車騎行距離、頻次、時長,以及單車使用環(huán)境、天氣等多種因素有關(guān),很難用一定的數(shù)學(xué)表達式描述。人工智能方法如BP神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)、ELMAN神經(jīng)網(wǎng)絡(luò)等具有較強的非線性學(xué)習(xí)能力,能通過數(shù)據(jù)學(xué)習(xí)得到其內(nèi)在關(guān)系。本文選擇以上3種方法進行組合預(yù)測。
BP神經(jīng)網(wǎng)絡(luò)模型具有良好的函數(shù)逼近特性,可以模擬任意非線性問題,由輸入層、隱含層(可以是多層)和輸出層構(gòu)成,適合處理復(fù)雜問題,使得BP神經(jīng)網(wǎng)絡(luò)成為應(yīng)用最廣泛的經(jīng)典模型之一[10]。本文BP神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖1所示,神經(jīng)網(wǎng)絡(luò)輸入層為7個預(yù)測因素,神經(jīng)網(wǎng)絡(luò)輸出層為單車分值PBP。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Figure 1 Structure of BP neural network
徑向基函數(shù)可以避開復(fù)雜的算法來準確地完成計算和預(yù)測,其具有全局逼近擬合、訓(xùn)練速度快、不易陷入局部極小值等優(yōu)勢[11]。徑向基函數(shù)一般有輸入層、隱含層和輸出層3層,常用的徑向基函數(shù)是高斯函數(shù),徑向基函數(shù)結(jié)構(gòu)圖與BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖類似,PRBF為徑向基函數(shù)輸出單車分值。
ELMAN神經(jīng)網(wǎng)絡(luò)與BP和RBF神經(jīng)網(wǎng)絡(luò)不同的是,它是一種典型的反饋式網(wǎng)絡(luò),在前饋式神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上增加了承接層用以記憶存儲前一時刻的輸出數(shù)據(jù),從而使系統(tǒng)具有適應(yīng)時變特性的能力,進而促使網(wǎng)絡(luò)適應(yīng)數(shù)據(jù)動態(tài)信息特征,提高網(wǎng)絡(luò)預(yù)測精度[12]。ELMAN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,神經(jīng)網(wǎng)絡(luò)輸入層為7個預(yù)測因素,神經(jīng)網(wǎng)絡(luò)輸出為單車分值PELMAN。
圖2 ELMAN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Figure 2 Elman neural network structure
2.2.1 組合預(yù)測的概念
組合預(yù)測[13-14]是對幾種預(yù)測方法得到的預(yù)測結(jié)果,選取適當(dāng)?shù)臋?quán)重進行加權(quán)以達到提高預(yù)測精度的一種預(yù)測方法。其主要目的在于消除單一預(yù)測方法可能存在的較大偏差,提高預(yù)測的準確性。BP神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)、ELMAN神經(jīng)網(wǎng)絡(luò)3種預(yù)測方法組合預(yù)測的示意圖如圖3所示。其表達式為
圖3 組合預(yù)測的示意圖Figure 3 Schematic diagram of combined forecasting
式中, λ1、 λ2、 λ3分別為BP神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)、ELMAN神經(jīng)網(wǎng)絡(luò)的權(quán)值。
2.2.2 critic權(quán)重法
本文采用cirtic法對組合預(yù)測模型進行賦權(quán)。該方法既突出數(shù)據(jù)間的相互關(guān)系,又體現(xiàn)數(shù)據(jù)波動性,由此建立一個能夠全面考慮到各種單項預(yù)測方法所提供的信息的組合預(yù)測模型,達到客觀、準確的預(yù)測效果。critic權(quán)重計算具體步驟如下。
首先設(shè)對n種預(yù)測方法用m個評價指標(biāo)(MAE、MSE等)去評價,得到誤差評價矩陣。
其中,yij表示第j種預(yù)測方法用第i個指標(biāo)進行評價得到的評估值。
再進行歸一化處理和數(shù)據(jù)變異性及沖突性計算,最后計算權(quán)重。
對于BP神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)、ELMAN神經(jīng)網(wǎng)絡(luò)和組合預(yù)測輸出的每一輛共享單車預(yù)測分值,使用下列公式進行評判單車故障或良好。
針對誤差評價矩陣的評價指標(biāo),本文選擇平均絕對誤差MAE、均方誤差MSE、均方根誤差RMSE和平均絕對百分比誤差MAPE這4種誤差指標(biāo)。
針對實例有假設(shè)如下。假設(shè)此區(qū)域內(nèi)沒有跨區(qū)單車;預(yù)測過程中,此區(qū)域沒有新的故障單車產(chǎn)生;暫不考慮3年報廢車輛。為驗證本文所提出的方法的有效性,以2019年上海市4月份原始(該月份天氣晴朗)共享單車數(shù)據(jù)為例,通過原始數(shù)據(jù)分析得到,對應(yīng)7個預(yù)測因素(服務(wù)時間低于1 min的次數(shù)、服務(wù)路程低于300 m的次數(shù)、停滯天數(shù)、熱門點停滯天數(shù)、日平均租借次數(shù)、熱門點日平均租借次數(shù)、租借均差值)的700組單車數(shù)據(jù),其中,90輛為故障單車數(shù)據(jù),610輛為無故障車數(shù)據(jù)。部分數(shù)據(jù)內(nèi)容如表2所示。
表2 原始數(shù)據(jù)Table 2 Raw data
首先將7個預(yù)測因素和700組數(shù)據(jù)對應(yīng)的矩陣X,分別代入改進熵權(quán)法1[8]、改進熵權(quán)法 2[9]、本文改進熵權(quán)法中,可以得到7個預(yù)測因素所對應(yīng)的權(quán)值,如表3所示。
表3 改進熵權(quán)法實例比較Table 3 Example comparison of improved entropy weight method
表3中,X1、X2、X3、X4、X5、X6、X7分別表示單車服務(wù)時間低于1 min的次數(shù)、服務(wù)路程低于300 m的次數(shù)、停滯天數(shù)、熱門點停滯天數(shù)、日平均租借次數(shù)、熱門點日平均租借次數(shù)、租借均差值。從權(quán)重數(shù)值分布來看,改進熵權(quán)法1和改進熵權(quán)法2縮小了熵權(quán)之間的差距,本文改進熵權(quán)離散效果更好,權(quán)重分配更為合理。
然后將上面得到的改進權(quán)重代入式(7)、(8)、(9)、(17)計算,可以分別得到AVE1=1.5、AVE2= 0.9、θ = 1以及平均處理優(yōu)化后的單車分值集合Z。
3.2.1 BP神經(jīng)網(wǎng)絡(luò)預(yù)測
本文基于Matlab編程應(yīng)用BP神經(jīng)網(wǎng)絡(luò)預(yù)測。在具體設(shè)計時,首先依據(jù)經(jīng)驗公式[15]初步確定隱含層神經(jīng)元個數(shù),再通過對不同神經(jīng)元數(shù)的網(wǎng)絡(luò)進行訓(xùn)練和對比,最終確定神經(jīng)元數(shù)。隨機選取640組數(shù)據(jù)作為訓(xùn)練樣本(580組無故障車和60組故障單車數(shù)據(jù))和60組數(shù)據(jù)作為測試樣本(30組無故障車和30組故障單車數(shù)據(jù))。經(jīng)過測算,確定BP神經(jīng)網(wǎng)絡(luò)模型為12個隱層神經(jīng)元,網(wǎng)絡(luò)預(yù)測性能最佳。從輸入層到隱含層以及從隱含層到輸出層的傳遞函數(shù)分別采用雙曲正切s型傳遞函數(shù)和線性傳遞函數(shù),訓(xùn)練函數(shù)采用trainlm函數(shù)。運行結(jié)果如圖4所示,其中1 ~ 30和31 ~ 60組數(shù)據(jù)分別為故障單車和無故障車,其平均絕對百分比誤差為9.4%,預(yù)測準確率達到了86.7%。
圖4 BP神經(jīng)網(wǎng)絡(luò)預(yù)測Figure 4 Prediction diagram of BP neural network
3.2.2 徑向基函數(shù)預(yù)測
本文基于Matlab編程實現(xiàn)應(yīng)用徑向基函數(shù)的預(yù)測。訓(xùn)練集和測試集數(shù)據(jù)與BP神經(jīng)網(wǎng)絡(luò)模型一樣,利用newrbe函數(shù)創(chuàng)建一個精確的神經(jīng)網(wǎng)絡(luò)。該函數(shù)在創(chuàng)建網(wǎng)絡(luò)時,將自動選擇隱含層的數(shù)目,使得誤差為零。針對徑向基函數(shù)的分布密度。本文對訓(xùn)練集樣本進行多次反復(fù)訓(xùn)練,當(dāng)spread = 0.5時,網(wǎng)絡(luò)預(yù)測性能最佳。運行結(jié)果如圖5所示,其平均絕對百分比誤差為10.3%,其預(yù)測準確率達到86.7%。
圖5 徑向基函數(shù)預(yù)測Figure 5 Prediction diagram of radial basis function
3.2.3 ELMAN神經(jīng)網(wǎng)絡(luò)預(yù)測
本文基于Matlab編程實現(xiàn)應(yīng)用ELMAN神經(jīng)網(wǎng)絡(luò)的預(yù)測。訓(xùn)練集和測試集數(shù)據(jù)與BP神經(jīng)網(wǎng)絡(luò)模型一樣。經(jīng)過測算,確定ELMAN神經(jīng)網(wǎng)絡(luò)模型為13個隱層神經(jīng)元,網(wǎng)絡(luò)預(yù)測性能最佳。從輸入層到隱含層以及從隱含層到輸出層的傳遞函數(shù)分別采用雙曲正切s型傳遞函數(shù)和線性傳遞函數(shù),訓(xùn)練函數(shù)采用trainlm函數(shù)。運行結(jié)果如圖6所示,其平均絕對百分比誤差為10.0%,預(yù)測準確率達到85%。
圖6 ELMAN神經(jīng)網(wǎng)絡(luò)預(yù)測Figure 6 Prediction diagram of Elman neural network
將3種單一預(yù)測模型輸出的預(yù)測分值和集合Z代入式(18) ~ (21)中計算,可以得到評價誤差矩陣為
將以上矩陣代入critic法中,可以得到BP神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)和ELMAN神經(jīng)網(wǎng)絡(luò)的權(quán)重分別為0.467、0.261、0.272,組合模型公式為
基于Matlab平臺計算,組合預(yù)測模型預(yù)測結(jié)果如圖7所示,其平均絕對百分比誤差為6.7%,預(yù)測準確率達到93.3%。
圖7 組合預(yù)測Figure 7 Prediction diagram of combined forecast
第3節(jié)中單一方法預(yù)測模型和critic組合預(yù)測模型的誤差對比,反映了critic組合預(yù)測模型預(yù)測準確率有了較大的提高。
除與各單一預(yù)測的結(jié)果進行比較外,為了體現(xiàn)critic法的優(yōu)勢,與熵權(quán)組合預(yù)測[16]進行對比,可計算出BP神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)和ELMAN神經(jīng)網(wǎng)絡(luò)的權(quán)重分別為0.42、0.28、0.30。表4給出單一預(yù)測方法和組合預(yù)測的誤差數(shù)據(jù)對比,其中,critic組合預(yù)測的各項誤差指標(biāo)最小,預(yù)測準確率最高達到93.9%。
表4 預(yù)測模型效果比較Table 4 Comparison of prediction model effect
為了體現(xiàn)本文改進熵權(quán)法對后續(xù)預(yù)測的優(yōu)勢,與改進熵權(quán)法2[9]進行整體對比實驗。當(dāng)采用改進熵權(quán)法2對預(yù)測因素進行權(quán)重分配后,計算可得到AVE1為1.69、AVE2為0.83、θ為1以及平均處理優(yōu)化后的單車分值集合Z,再進行單一方法預(yù)測和critic組合預(yù)測,其誤差對比如圖8所示。表5給出采用改進熵權(quán)法2[9]后進行預(yù)測對比的數(shù)據(jù),數(shù)據(jù)表明本文改進熵權(quán)法對預(yù)測準確率有較大提高。
圖8 基于改進熵權(quán)法2的預(yù)測誤差對比Figure 8 Comparison diagram of prediction error based on improved entropy weight method 2
表5 基于改進熵權(quán)法2的預(yù)測模型效果比較Table 5 Comparison of prediction models based on improved entropy weight method 2
本文提出改進的熵權(quán)法和基于critic的組合預(yù)測方法,充分挖掘了預(yù)測因素的信息特征,綜合利用BP神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)和ELMAN神經(jīng)網(wǎng)絡(luò)3種單一模型的信息。實例分析表明,相比于其他改進熵權(quán)法分配權(quán)重,利用本文改進熵權(quán)法分配權(quán)重再進行預(yù)測的模型,得到的預(yù)測準確率提高了5%左右,且采用基于critic法的組合預(yù)測方法,各個誤差指標(biāo)也都有了一定程度的改善,預(yù)測結(jié)果優(yōu)于單一模型的預(yù)測結(jié)果,預(yù)測穩(wěn)定性也高于單一預(yù)測方法。這說明本文的組合預(yù)測模型具有一定的合理性和優(yōu)越性。