鄧必年
摘 要: 孤立點(diǎn)對(duì)物流成本預(yù)測(cè)結(jié)果具有干擾作用,而當(dāng)前模型均沒有考慮孤立點(diǎn)的負(fù)面影響,預(yù)測(cè)結(jié)果可信度低。為了改善物流成本的預(yù)測(cè)效果,提出基于剔除孤立點(diǎn)的物流成本預(yù)測(cè)模型。首先對(duì)當(dāng)前物流成本預(yù)測(cè)研究現(xiàn)狀進(jìn)行分析,并根據(jù)密度方法找到物流成本原始數(shù)據(jù)中的孤立點(diǎn),刪除這些孤立點(diǎn),然后對(duì)物流成本數(shù)據(jù)進(jìn)行聚類,找到物流中隱藏的變化特點(diǎn),采用最小二乘支持向量機(jī)建立物流成本預(yù)測(cè)模型,最后通過(guò)物流成本預(yù)測(cè)實(shí)驗(yàn)對(duì)性能進(jìn)行測(cè)試。測(cè)試結(jié)果表明,該模型消除了孤立點(diǎn)的干擾,提高了物流成本的預(yù)測(cè)精度,物流成本預(yù)測(cè)的建模效率得到改善,具有很好的實(shí)際應(yīng)用價(jià)值。
關(guān)鍵詞: 物流成本; 孤立數(shù)據(jù)點(diǎn); 密度方法; 預(yù)測(cè)模型
中圖分類號(hào): TN911.1?34; TP301 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)13?0114?04
Abstract: The isolated point plays the interference effect on the forecast result of the logistics cost, but its negative effect isn′t considered in current model, and the reliability of the prediction result is low. In order to improve the forecasting effect of logistics cost, the logistics cost forecasting model based on isolated point elimination is put forward. The current research status of logistics cost prediction is analyzed. The isolated points in original data of the logistics cost are found out according to the density method, and removed. The data of logistics cost is clustered to seek out the change characteristics hidden in logistics. The least square support vector machine is used to establish the logistics cost prediction model. Its performance is tested by means of the logistics cost prediction experiment. The test results show that the model can eliminate the interference of isolated point, enhance the prediction accuracy of logistics cost, improve the modeling efficiency of logistics cost forecasting, and has perfect practical application value.
Keywords: logistics cost; isolated data point; density method; prediction model
0 引 言
隨著經(jīng)濟(jì)、人們生活水平以及交通技術(shù)等不斷改善,物流企業(yè)越來(lái)越多,導(dǎo)致企業(yè)之間的競(jìng)爭(zhēng)加劇,物流成本預(yù)測(cè)直接影響物流企業(yè)的經(jīng)濟(jì)效益,是物流研究領(lǐng)域中的一個(gè)重要方向,引起了人們的高度關(guān)注[1]。
物流成本與一個(gè)地區(qū)的經(jīng)濟(jì)、政策以及交通狀況密切相關(guān),是一個(gè)復(fù)雜多變系統(tǒng),最原始的物流成本預(yù)測(cè)通過(guò)手工方式實(shí)現(xiàn),一些專業(yè)人員采用統(tǒng)計(jì)學(xué)理論對(duì)物流成本進(jìn)行分析和預(yù)測(cè),該方式對(duì)小規(guī)模物流成本預(yù)測(cè)可以實(shí)現(xiàn),對(duì)于現(xiàn)代大規(guī)模物流成本計(jì)算過(guò)程太復(fù)雜,工作效率低,而且易出錯(cuò)。隨后有學(xué)者提出了物流成本自動(dòng)預(yù)測(cè)模型。有學(xué)者采用時(shí)間序列法對(duì)物流成本進(jìn)行建模,根據(jù)收集的物流歷史成本數(shù)據(jù)發(fā)現(xiàn)原物流成本將來(lái)的變化特點(diǎn),相對(duì)于手工方式,提高了物流成本的預(yù)測(cè)效率,預(yù)測(cè)結(jié)果更加可靠、穩(wěn)定,但它們屬于線性預(yù)測(cè)模型,而物流成本不是簡(jiǎn)單的線性變化,同時(shí)具有隨機(jī)性、波動(dòng)特性,故無(wú)法描述物流成本的非線性變化特點(diǎn),導(dǎo)致有時(shí)預(yù)測(cè)結(jié)果與實(shí)際值相差大,物流成本的預(yù)測(cè)精度低[2]。為了克服線性預(yù)測(cè)模型的不足,有學(xué)者提出了非線性的物流成本預(yù)測(cè)模型,可以描述物流成本的非線性變化特點(diǎn),提高了物流成本預(yù)測(cè)精度[3?4],主要有神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等非物流成本預(yù)測(cè)模型,但它們?nèi)毕菀彩置黠@,如支持向量機(jī)的物流成本建模時(shí)間長(zhǎng),神經(jīng)網(wǎng)絡(luò)要求歷史樣本多等[5]。最小二乘支持向量機(jī)(LSSVM)減少了物流成本的建模時(shí)間,需要的物流歷史樣本少,因此成為物流成本預(yù)測(cè)的主要建模工具[6?7]。相關(guān)研究表明,在物流成本預(yù)測(cè)模型的建立過(guò)程中,一些孤立點(diǎn)對(duì)預(yù)測(cè)結(jié)果影響大,對(duì)LSSVM的學(xué)習(xí)過(guò)程產(chǎn)生干擾,因此,如何有效剔除物流成本數(shù)據(jù)中的孤立點(diǎn),改善物流成本的預(yù)測(cè)效果十分關(guān)鍵[8]。
為了消除孤立點(diǎn)對(duì)物流成本預(yù)測(cè)結(jié)果的干擾作用,提出基于剔除孤立點(diǎn)的物流成本預(yù)測(cè)模型。首先采用密度方法刪除物流成本原始數(shù)據(jù)中的孤立點(diǎn),然后對(duì)物流成本數(shù)據(jù)進(jìn)行聚類分析,采用最小二乘支持向量機(jī)建立物流成本預(yù)測(cè)模型,物流成本預(yù)測(cè)實(shí)驗(yàn)結(jié)果表明,該模型提高了物流成本的預(yù)測(cè)精度,改善了物流成本預(yù)測(cè)的建模效率。
1 剔除物流成本歷史數(shù)據(jù)中的孤立點(diǎn)
在物流成本的歷史數(shù)據(jù)中,由于工作人員、收集條件等限制,會(huì)有一定數(shù)量的孤立點(diǎn),這些孤立點(diǎn)實(shí)際是一些無(wú)用的數(shù)據(jù),會(huì)對(duì)物流成本建模過(guò)程產(chǎn)生干擾,因此在建立物流成本預(yù)測(cè)模型之前,準(zhǔn)確剔除這些孤立點(diǎn)有助于后續(xù)的物流成本預(yù)測(cè),因此本文采用密度方法對(duì)物流成本的歷史數(shù)據(jù)進(jìn)行分析,找到其中的孤立點(diǎn)。
設(shè)為第個(gè)物流成本的歷史樣本數(shù)據(jù)點(diǎn),為鄰域內(nèi)的物流成本數(shù)目,為預(yù)先設(shè)置的最少數(shù)據(jù)量,其計(jì)算公式為:
剔除物流成本歷史數(shù)據(jù)中孤立點(diǎn)的步驟為:
Step1:收集一個(gè)物流成本歷史數(shù)據(jù)并設(shè)置的值。
Step2:估計(jì)樣本點(diǎn)的領(lǐng)域大小Eps。
Step3: 估計(jì)任意樣本點(diǎn)與其他物流成本數(shù)據(jù)點(diǎn)之間的距離,并估計(jì)物流成本樣本數(shù)據(jù)點(diǎn)的值。
Step4: 根據(jù)式(3)對(duì)物流成本歷史數(shù)據(jù)進(jìn)行分析,找到其中的孤立點(diǎn)。
Step5:從物流成本歷史樣本中刪除孤立點(diǎn),剩下的物流成本歷史數(shù)據(jù)組成學(xué)習(xí)樣本。
2 物流成本預(yù)測(cè)模型的構(gòu)建
2.1 物流成本數(shù)據(jù)的聚類分析
物流成本數(shù)據(jù)具有固定變化規(guī)律,可以對(duì)剔除物流成本歷史數(shù)據(jù)進(jìn)行聚類分析,選擇與預(yù)測(cè)點(diǎn)具有相似變化特點(diǎn)的數(shù)據(jù),減少訓(xùn)練數(shù)據(jù)樣本的規(guī)模,加快物流成本數(shù)據(jù)建模速度。設(shè)物流成本數(shù)據(jù)集為為物流成本樣本點(diǎn)數(shù),共有類,且有則聚類分析的目標(biāo)函數(shù)定義為:
2.2 最小二乘支持向量機(jī)
設(shè)物流成本建模訓(xùn)練樣本為最小二乘支持向量機(jī)引入映射函數(shù)對(duì)其進(jìn)行空間變換,做如下的回歸過(guò)程:
式中:和為最小二乘支持向量機(jī)的參數(shù)。
為了找到最佳二乘支持向量機(jī)參數(shù)和的值,引入松弛因子,找到與式(7)等同的多約束函數(shù),即有:
2.3 物流成本預(yù)測(cè)模型的建立步驟
Step1:對(duì)一個(gè)具體物流成本預(yù)測(cè)問題收集相應(yīng)的歷史樣本。
Step2:采用密度方法剔除物流成本原始數(shù)據(jù)中的孤立點(diǎn)。
Step3:對(duì)物流成本數(shù)據(jù)做如下處理,減少數(shù)據(jù)的變化幅度。
Step4:對(duì)剔除孤立點(diǎn)的物流成本數(shù)據(jù)進(jìn)行聚類,找到預(yù)測(cè)點(diǎn)的最優(yōu)訓(xùn)練樣本數(shù)據(jù)集。
Step5:將最優(yōu)訓(xùn)練樣本數(shù)據(jù)集輸入最小二乘支持向量機(jī),建立物流成本預(yù)測(cè)模型。
Step6:采用具體物流成本數(shù)據(jù)對(duì)物流成本預(yù)測(cè)模型性能進(jìn)行分析,并對(duì)物流成本將來(lái)的值進(jìn)行估計(jì)。
綜上可知,基于剔除孤立點(diǎn)的物流成本預(yù)測(cè)模型工作流程如圖1所示。
3 實(shí)驗(yàn)結(jié)果與分析
為了測(cè)試基于剔除孤立點(diǎn)的物流成本預(yù)測(cè)模型的性能,采用VC++編寫物流成本預(yù)測(cè)程序,收集到物流成本歷史樣本,密度方法剔除其中的孤立點(diǎn),最后得到200個(gè)數(shù)據(jù),如圖2所示。
采用聚類分析選擇物流成本預(yù)測(cè)的訓(xùn)練樣本,建立物流成本預(yù)測(cè)模型,物流成本的單步預(yù)測(cè)結(jié)果如圖3所示。從圖3可知,物流成本預(yù)測(cè)值與實(shí)際值之間誤差很小,這說(shuō)明本文模型可以發(fā)現(xiàn)物流成本樣本點(diǎn)數(shù)據(jù)中隱藏的變化特點(diǎn),是一種精度高的物流成本預(yù)測(cè)模型。
提前三步的物流成本預(yù)測(cè)結(jié)果如圖4所示。對(duì)圖4進(jìn)行分析可以清楚看出,物流成本的多步預(yù)測(cè)精度要低于物流成本的單步預(yù)測(cè)精度,預(yù)測(cè)誤差增加,但還是可以從整體上描述物流成本的變化特點(diǎn),預(yù)測(cè)結(jié)果有一定的實(shí)際價(jià)值,可以幫助有關(guān)部門制定相應(yīng)的管理措施。
為了分析本文模型的優(yōu)越性,選擇文獻(xiàn)[9?10]的物流成本預(yù)測(cè)模型進(jìn)行對(duì)比實(shí)驗(yàn),采用預(yù)測(cè)精度(%)作為評(píng)價(jià)標(biāo)準(zhǔn),結(jié)果如表1所示。從表1可以發(fā)現(xiàn),本文模型的物流成本預(yù)測(cè)精度要高于其他模型,更好地反映了物流成本預(yù)測(cè)變化特點(diǎn),降低了物流成本預(yù)測(cè)誤差,具有明顯的優(yōu)越性。
在物流成本建模過(guò)程中,訓(xùn)練時(shí)間影響預(yù)測(cè)效率,統(tǒng)計(jì)不同模型的物流成本建模時(shí)間,具體如圖5所示,對(duì)圖5的物流成本建模時(shí)間進(jìn)行對(duì)比分析,可以看出,本文模型的物流成本建模時(shí)間最少,優(yōu)勢(shì)十分明顯,可以滿足速度要求快的物流成本預(yù)測(cè)領(lǐng)域。
4 結(jié) 語(yǔ)
在物流成本建模過(guò)程中,預(yù)測(cè)結(jié)果的好壞與樣本選擇直接相關(guān),為了避免孤立點(diǎn)對(duì)物流成本預(yù)測(cè)結(jié)果的負(fù)面影響,設(shè)計(jì)了基于剔除孤立點(diǎn)的物流成本預(yù)測(cè)模型,測(cè)試結(jié)果表明,無(wú)論是單步或者多步的物流成本預(yù)測(cè)結(jié)果,本文模型的性能都得到了不同程度的改善,物流成本預(yù)測(cè)誤差大幅度下降,同時(shí)由于剔除孤立點(diǎn),通過(guò)聚類分析選擇與預(yù)測(cè)點(diǎn)相關(guān)的樣本,減少了訓(xùn)練樣本的規(guī)模,物流成本建模速度加快,具有更廣的應(yīng)用范圍。
參考文獻(xiàn)
[1] YUEN S Y, CHI K C. A genetic algorithm that adaptively mutates and never revisits [J]. IEEE transactions on evolutionary computation, 2009, 13(2): 454?458.
[2] 陳森,周峰.基于灰色系統(tǒng)理論的物流需求預(yù)測(cè)模型[J].統(tǒng)計(jì)與決策,2006(3):59?60.
[3] 王曉原,李軍.灰色GM(1,1)模型在區(qū)域物流規(guī)模預(yù)測(cè)中的應(yīng)用[J].武漢理工大學(xué)學(xué)報(bào),2011,9(3):613?615.
[4] 尹艷玲.基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)的物流需求預(yù)測(cè)研究[J].河南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,29(5):700?704.
[5] 后銳,張畢西.基于MLP神經(jīng)網(wǎng)絡(luò)的區(qū)域物流需求預(yù)測(cè)方法及其應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2005(12):43?47.
[6] 陳以,萬(wàn)梅芳.BPNN神經(jīng)網(wǎng)絡(luò)在物流系統(tǒng)中的應(yīng)用[J].計(jì)算機(jī)仿真,2010,27(4):159?163.
[7] 胡燕祝,呂宏義.基于支持向量回歸機(jī)的物流需求預(yù)測(cè)模型研究[J].物流技術(shù),2008,27(5):66?68.
[8] 閆莉,薛惠峰,陳青.基于灰色馬爾可夫模型的區(qū)域物流規(guī)模預(yù)測(cè)[J].西安工業(yè)大學(xué)學(xué)報(bào),2009,29(5):495?497.
[9] 初良勇,田質(zhì)廣,謝新連.組合預(yù)測(cè)模型在物流需求預(yù)測(cè)中的應(yīng)用[J].大連海事大學(xué)學(xué)報(bào),2004,30(4):43?46.
[10] 陳建軍.蟻群算法在物流配送路徑優(yōu)化中的研究[J].計(jì)算機(jī)仿真,2011,28(2):268?271.
[11] 王鐵君,鄔月春.基于混沌粒子群算法的物流配送路徑優(yōu)化[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(29):218?221.
[12] TSENG L Y, LIN Y T. A hybrid genetic local search algorithm for the permutation flowshop scheduling problem [J]. European journal of operational research, 2009, 198(1): 84?92.
[13] 孫建豐,向小東.基于灰色線性回歸組合模型的物流需求預(yù)測(cè)研究[J].工業(yè)技術(shù)經(jīng)濟(jì),2006,26(10):146?148.