白朝陽(yáng),宋林杰,李曉琳
(大連理工大學(xué) 管理與經(jīng)濟(jì)學(xué)部,遼寧大連116024)
物料需求預(yù)測(cè)受到企業(yè)內(nèi)外部多方因素影響,如訂單變化、生產(chǎn)能力改變、產(chǎn)品周期化迭代等因素,往往呈現(xiàn)出樣本量小且變化周期快、范圍大的特點(diǎn),從而使得需求預(yù)測(cè)問(wèn)題難度較高。對(duì)于傳統(tǒng)預(yù)測(cè)模型,需要事先知道影響因素的模式,而這種模式主要靠主觀分析和特征判別,因此傳統(tǒng)模型對(duì)于物料需求的預(yù)測(cè)效果并不理想。
物料需求呈現(xiàn)出非平穩(wěn)、非線性的時(shí)間序列特征。本文擬將EMD和LSSVR的組合進(jìn)行物料需求預(yù)測(cè)。運(yùn)用EMD方法將非平穩(wěn)時(shí)間序列分解為一系列的本征模函數(shù)(imf)和一個(gè)殘差項(xiàng)(res),挖掘出更多的信息,再使用LSSVR模型并結(jié)合PSO進(jìn)行組合預(yù)測(cè)。并根據(jù)某清分機(jī)生產(chǎn)企業(yè)實(shí)際物料需求數(shù)據(jù),驗(yàn)證了該組合預(yù)測(cè)模型的可行性和有效性。
EMD通過(guò)數(shù)據(jù)的特征時(shí)間尺度來(lái)獲得本征波動(dòng)模式,將復(fù)雜時(shí)間序列分解為能夠直接分析的有限個(gè)本征模函數(shù)以及殘差。因其在處理非平穩(wěn)、非線性數(shù)據(jù)上的優(yōu)越性,該方法可以應(yīng)用于任何類(lèi)型的時(shí)間序列(信號(hào))的分解,且比之前的處理方法更具有明顯的優(yōu)勢(shì)。EMD方法的分解步驟如下:
(1)確定數(shù)據(jù)序列x(t)的局部極值。找出當(dāng)前序列的所有局部極大值點(diǎn),使用三次樣條函數(shù)擬合形成當(dāng)前數(shù)據(jù)序列的上包絡(luò)線U(t)。同樣,找出數(shù)據(jù)序列所有局部極小值點(diǎn),形成數(shù)據(jù)序列下包落線L(t)。計(jì)算上包絡(luò)線和下
然后將m1(t)從原始序列x(t)中除去,形成新的序列h11(t),若其滿足對(duì)稱(chēng)性,且局部極大值均為正數(shù),所有局部極小值均為負(fù)數(shù),則所得到的分量h1(t)為IMF否則,用h11(t)替代x(t)并重復(fù)上述過(guò)程,直到找到滿足要求的IMF,具體公式為:
(2)滿足要求的時(shí)間序列h1n(t)即為IMF1,并定義為c1(t),用原始序列x(t)減去c1(t)即可得到r1(t)為:
(3)將r1(t)作為原始序列,并重復(fù)上述步驟直到rn(t)無(wú)法再分解。最終原始時(shí)間序列被分解為:包絡(luò)線的平均值m1(t):
其中,x(t)表示數(shù)據(jù)的原始時(shí)間序列,ci(t)表示每個(gè)IMF值,n為IMF函數(shù)的個(gè)數(shù),r(t)表示殘差。使用EMD需要滿足以下假設(shè)條件:
(1)數(shù)據(jù)至少有一個(gè)最大值和一個(gè)最小值;
(2)數(shù)據(jù)的局部時(shí)域特性由極值點(diǎn)間的時(shí)間尺度唯一確定;
(3)如果數(shù)據(jù)沒(méi)有極值點(diǎn)但有拐點(diǎn),則可以通過(guò)對(duì)數(shù)據(jù)進(jìn)行一次或多次微分求得極值,然后再通過(guò)積分來(lái)獲得分解結(jié)果。
物料需求時(shí)間序列都符合這些假設(shè),因此可以用EMD方法分解。
在給定樣本空間集中,S={(xi,yi)|xi∈Rn,yi∈R,i=1,…,N},xi為函數(shù)的輸入值,通過(guò)非線性映射生成高緯度空間函數(shù)的對(duì)應(yīng)值,即函數(shù)的輸出值yi,其優(yōu)化問(wèn)題為:
其中,C為懲罰系數(shù),φ(xi)為非線性映射函數(shù),ei為誤差項(xiàng),i表示誤差項(xiàng)個(gè)數(shù)。未解決該優(yōu)化問(wèn)題,引入拉格朗日函數(shù):
根據(jù)Karush-Kuhn-Tucker條件,求解得:
分別對(duì)w、b、ei、αi求偏導(dǎo),然后消除ei和w后,式(8)轉(zhuǎn)變?yōu)椋?/p>
求解得:
其中,ψ(x,xi)為內(nèi)核函數(shù),本文選取擬合精度較高且適用于小樣本的高斯函數(shù)為核函數(shù):
式(11)中,σ為高斯核函數(shù)的寬度參數(shù),它隱含地定義了從需求函數(shù)特性輸入空間到高維特征空間的非線性映射,從而控制最終解的復(fù)雜性。
第一階段,首先針對(duì)不同類(lèi)型參數(shù),將原始物料需求數(shù)據(jù)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解,得到若干IMF和一個(gè)殘差趨勢(shì)項(xiàng)Res。然后使用通過(guò)選取平均值、標(biāo)準(zhǔn)差、偏度、均方值、相關(guān)系數(shù)等統(tǒng)計(jì)指標(biāo)進(jìn)行聚類(lèi)分析,把IMF聚為高頻、低頻兩類(lèi),并迭加相同類(lèi)別的IMF。得到高頻聚類(lèi)本征模態(tài)函數(shù)CIMF1(Comprehensive Intrinsic Mode Functions 1)和低頻聚類(lèi)本征模態(tài)函數(shù)CIMF2(Comprehensive Intrinsic Mode Functions 2)。最后以CIMF1、CIMF2和Res作為訓(xùn)練樣本,建立LSSVR進(jìn)行預(yù)測(cè)。
第二階段,輸入上述步驟得到的訓(xùn)練樣本訓(xùn)練LSSVR,獲得最優(yōu)參數(shù),從而獲得物料需求預(yù)測(cè)結(jié)果??紤]到最小二乘支持相量回歸預(yù)測(cè)模型的關(guān)鍵問(wèn)題在于參數(shù)的確定,本文采用PSO算法來(lái)優(yōu)化LSSVR的物料需求預(yù)測(cè)型,具體步驟如圖1所示。
圖1 PSO算法優(yōu)化LSSVR參數(shù)過(guò)程
本文選取2012年1月至2015年3月,A金融設(shè)備制造企業(yè)MES(Manufacturing Execution System)系統(tǒng)中某清分機(jī)產(chǎn)品族通用材料S的月出庫(kù)數(shù)據(jù)作為研究樣本。由于該行業(yè)物料需求同時(shí)受訂單驅(qū)動(dòng)以及上期期末庫(kù)存量的影響,因而數(shù)據(jù)序列會(huì)呈現(xiàn)出周期性。為評(píng)價(jià)組合預(yù)測(cè)模型的性能,本文選取平均絕對(duì)誤差MAE(Mean Absolute Error)、平均絕對(duì)百分比誤差MAPE(Mean Absolute Percentage Error)、均方根誤差RMSE(Root Mean Absolute Error)為誤差評(píng)價(jià)指標(biāo),與ARIMA、三次指數(shù)平滑以及LSSVR預(yù)測(cè)模型進(jìn)行對(duì)比,從而說(shuō)明EMD-PSO-LSSVR組合預(yù)測(cè)模型在物料需求預(yù)測(cè)應(yīng)用上的有效性。評(píng)價(jià)指標(biāo)計(jì)算方法如式(12)、式(13)、式(14)所示,其中pi、xi分別為物料需求在時(shí)間點(diǎn)i時(shí)的預(yù)測(cè)值與實(shí)際值:
A企業(yè)是MTS(Make-to-order)-ATO(Assemble-to-order)的混合型生產(chǎn)模式,同時(shí)該企業(yè)于2012年實(shí)行產(chǎn)品族管理戰(zhàn)略。針對(duì)產(chǎn)品族內(nèi)的通用材料S,企業(yè)會(huì)提前進(jìn)行生產(chǎn)決策以避免采購(gòu)、生產(chǎn)周期過(guò)長(zhǎng)而導(dǎo)致的拖期違約等問(wèn)題。在接到具體訂單后,生產(chǎn)部門(mén)會(huì)根據(jù)訂單要求制定當(dāng)期裝配計(jì)劃以滿足產(chǎn)品訂單需求。通用材料S是某類(lèi)型清分機(jī)產(chǎn)品族內(nèi)所使用的特殊材料,而該類(lèi)型清分機(jī)市場(chǎng)訂單不穩(wěn)定,在2012—2015年中通用材料S的需求量時(shí)常會(huì)有大幅度的波動(dòng),使用傳統(tǒng)預(yù)測(cè)模型難以預(yù)測(cè)。關(guān)于物料需求數(shù)據(jù)的具體統(tǒng)計(jì)特征指標(biāo)如表1所示。
表1 物料需求數(shù)據(jù)統(tǒng)計(jì)特征指標(biāo)
2.3.1 EMD分解結(jié)果
根據(jù)EMD算法,越早分解出的IMF頻率越高,波動(dòng)性越大,越能代表原始序列在近期所表現(xiàn)出的特點(diǎn),而分解最后剩余的殘差項(xiàng)則代表了原始序列的發(fā)展趨勢(shì)。物料需求序列使用EMD分解后,得到3個(gè)IMF分量和1個(gè)殘差項(xiàng),分解結(jié)果如圖2所示。其中,按照頻率從高到低排列分別為IMF1、IMF2、IMF3,IMFs分量曲線均呈現(xiàn)出一種圍繞零均值線、局部最大值、和局部最小值基本對(duì)稱(chēng)的振蕩形式。而且可以發(fā)現(xiàn),隨著頻率的降低,序列的規(guī)律性越來(lái)越明顯。
圖2 EMD分解結(jié)果
2.3.2 EMD聚類(lèi)合成結(jié)果分析
表2是IMFs以及RES的特征統(tǒng)計(jì)指標(biāo),可以看出最大值與最小值的范圍差距在不斷縮小,選取描述統(tǒng)計(jì)結(jié)果中能夠體現(xiàn)序列特征的平均值、標(biāo)準(zhǔn)差、峰度、偏度、相關(guān)系數(shù)等指標(biāo)并結(jié)合IMF的波動(dòng)頻率進(jìn)行聚類(lèi)分析。
表2 EMD分解結(jié)果描述統(tǒng)計(jì)
從表2中還可以看出IMF1及IMF2波動(dòng)頻率較高,數(shù)據(jù)的離散程度也較為接近且與原時(shí)間序列數(shù)據(jù)的相關(guān)性較強(qiáng),因此將IMF1及IMF2疊加構(gòu)成CIMF1,即高頻聚類(lèi)本征模函數(shù);同時(shí)IMF3成為CIMF2,即低頻聚類(lèi)本征模函數(shù),分解聚類(lèi)后的波動(dòng)趨勢(shì)顯示:聚類(lèi)后得到的CIMF1、CIMF2及殘差項(xiàng)對(duì)于原始時(shí)間序列均有隱含的統(tǒng)計(jì)學(xué)解釋?zhuān)軌蛘f(shuō)明其波動(dòng)原因及長(zhǎng)期趨勢(shì)。CIMF1反映的是原始物料需求的序列短期內(nèi)的波動(dòng),由于產(chǎn)品族管理戰(zhàn)略的施行,A企業(yè)針對(duì)通用材料S的計(jì)劃調(diào)度管理也愈加成熟,通過(guò)預(yù)先生產(chǎn)策略減輕產(chǎn)品需求波動(dòng)對(duì)通用材料需求數(shù)量波動(dòng)的影響。CIMF2的波動(dòng)反映出事件對(duì)于物料需求序列的影響,其振幅體現(xiàn)的是事件對(duì)于物料需求的影響程度而周期則表示外界影響的周期長(zhǎng)短。最后看到殘差項(xiàng)的趨勢(shì)是長(zhǎng)期上升但趨于平緩,反映出物料需求的長(zhǎng)期趨勢(shì)是微弱上升的,這與產(chǎn)品族所處市場(chǎng)已趨于飽和的情景是相符合的。
2.3.3 面向高頻聚類(lèi)本征模函數(shù)的LSSVR參數(shù)優(yōu)化
本文取粒子群算法的加速度因子C1和C2取經(jīng)驗(yàn)值C1=1.5,C2=1.7,種群規(guī)模設(shè)為20,初始種群隨機(jī)生成,搜索終止條件為達(dá)到最大迭代次數(shù)100,慣性權(quán)重Wmax=0.8,Wmin=0.3,參數(shù)自動(dòng)尋優(yōu)得到最優(yōu)正則化參數(shù)C=2.5354,最優(yōu)核函數(shù)參數(shù)σ=0.5457,相關(guān)系數(shù)r=99.84%具體擬合尋優(yōu)結(jié)果如圖3、圖4所示。
圖3 LSSVR擬合結(jié)果曲線
圖4 PSO適應(yīng)度迭代曲線
從以上處理結(jié)果來(lái)看,粒子群優(yōu)化后的組合預(yù)測(cè)模型擬合效果良好,同時(shí)收斂速度快。從長(zhǎng)期趨勢(shì)看,物料的需求量成略微上升的趨勢(shì),并且隨著時(shí)間的增長(zhǎng),物料需求量的震蕩幅度逐漸減弱,這也符合企業(yè)物料管理水平逐漸成熟的客觀實(shí)際。
2.3.4 面向低頻本征模函數(shù)的函數(shù)擬合
根據(jù)低頻CIMF2的形態(tài)構(gòu)造函數(shù)表示數(shù)據(jù)趨勢(shì),CIMF2的形態(tài)和Gumbel概率密度函數(shù)的形態(tài)相似。本文使用origin軟件的函數(shù)擬合功能對(duì)CIMF2使用高斯擬合,得到擬合結(jié)果及殘差值,非線性擬合確定系數(shù)R2的值為0.9873,說(shuō)明擬合結(jié)果良好,具體函數(shù)擬合式為:
通過(guò)對(duì)CIMF2進(jìn)行擬合,得到最優(yōu)參數(shù)如表3所示,其中y0為常數(shù)項(xiàng),xc為尖峰中心的坐標(biāo)值,w為峰寬,A為曲線尖峰的高度。
表3 CIMF2擬合參數(shù)
目標(biāo)時(shí)間序列共有39個(gè)觀測(cè)值,本文選取前36個(gè)點(diǎn)作為回歸訓(xùn)練樣本集,后3個(gè)點(diǎn)作為預(yù)測(cè)測(cè)試集,將EMD-PSO-LSSVR模型與三次指數(shù)平滑、ARIMA、LSSVR模型進(jìn)行回歸預(yù)測(cè)對(duì)比分析,以驗(yàn)證EMD-PSO-LSSVR組合預(yù)測(cè)模型在物料需求預(yù)測(cè)問(wèn)題中的有效性,預(yù)測(cè)結(jié)果如表4所示。
表4 預(yù)測(cè)結(jié)果分析
表4給出四種模型的預(yù)測(cè)結(jié)果和相對(duì)預(yù)測(cè)誤差。EMD-PSO-LSSVR模型的預(yù)測(cè)精度優(yōu)于其他三種模型,預(yù)測(cè)出的S物料需求值較其他三種模型更接近于實(shí)際值。組合預(yù)測(cè)模型預(yù)測(cè)期內(nèi)的最大、最小相對(duì)預(yù)測(cè)誤差為2.15%和5.01%,其他三種模型的最大、最小相對(duì)預(yù)測(cè)誤差較大,分別為6.89%和9.97%、4.35%和13.57%、3.99%和6.33%。
為了評(píng)價(jià)模型的預(yù)測(cè)效果,本文選取了MAE、RMSE以及MAPE三種指標(biāo),用于評(píng)價(jià)不同方法對(duì)測(cè)試樣本的預(yù)測(cè)能力。MAE、RMSE均是用來(lái)衡量的是預(yù)測(cè)值與實(shí)際值之間的偏差,其中MAE是常用的評(píng)價(jià)指標(biāo),其特點(diǎn)在于預(yù)測(cè)結(jié)果的個(gè)體差異對(duì)于平均值的權(quán)重相同,而RMSE對(duì)于預(yù)測(cè)結(jié)果中偏移程度大的誤差比較敏感,更能體現(xiàn)預(yù)測(cè)結(jié)果的精準(zhǔn)度。MAPE用來(lái)衡量誤差與實(shí)際值之間的比例,真實(shí)反映了預(yù)測(cè)結(jié)果偏移的程度。經(jīng)過(guò)計(jì)算,得到誤差分析結(jié)果如表5所示。
表5 預(yù)測(cè)誤差分析結(jié)果
從表5可以發(fā)現(xiàn):EMD-PSO-LSSVR組合預(yù)測(cè)模型的MAE、RSME和MAPE均小于三次指數(shù)平滑模型、LSSVR模型以及ARIMA模型。這說(shuō)明對(duì)于樣本量小且變化模式復(fù)雜的物料需求預(yù)測(cè)問(wèn)題,EMD-PSO-LSSVR組合預(yù)測(cè)模型能夠比常用的三次指數(shù)平滑模型及ARIMA模型提供精度更高、更加可靠的預(yù)測(cè)結(jié)果。另外,從各個(gè)指標(biāo)來(lái)看,組合預(yù)測(cè)模型相較于LSSVR模型平均提高了接近3倍的精度,這是經(jīng)過(guò)EMD分解合成將非平穩(wěn)的數(shù)據(jù)變得具有一定的規(guī)律性,從中可以挖掘出有效的信息,從而提高了預(yù)測(cè)精度。
EMD-PSO-LSSVR組合預(yù)測(cè)模型與三次指數(shù)平滑模型預(yù)測(cè)結(jié)果的趨勢(shì)與實(shí)際值相同,而ARIMA模型以及LSSVR模型則呈現(xiàn)出了相反的趨勢(shì)。為了實(shí)現(xiàn)精益化管理,提升運(yùn)營(yíng)效率,企業(yè)需要通過(guò)分析未來(lái)物料需求的發(fā)展傾向,來(lái)制定更加合理的生產(chǎn)計(jì)劃。而趨勢(shì)預(yù)測(cè)結(jié)果的偏差會(huì)給企業(yè)生產(chǎn)管理者提供錯(cuò)誤的決策信息,使其對(duì)未來(lái)物料需求的走勢(shì)產(chǎn)生錯(cuò)誤認(rèn)知,從而造成過(guò)量采購(gòu)或物料短缺等問(wèn)題,最終會(huì)對(duì)企業(yè)經(jīng)營(yíng)造成負(fù)面影響。
本文基于最小二乘支持向量機(jī)技術(shù)對(duì)非平穩(wěn)時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè),為降低數(shù)據(jù)非平穩(wěn)性對(duì)預(yù)測(cè)結(jié)果的影響,利用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)將原始序列分解為若干IMF分量和殘差趨勢(shì)項(xiàng),根據(jù)IMF分量的描述統(tǒng)計(jì)結(jié)果,根據(jù)其頻率的高低將其聚類(lèi)為高頻和低頻兩部分。利用高頻的部分來(lái)預(yù)測(cè)物料需求的短期波動(dòng),利用低頻部分來(lái)預(yù)測(cè)物料需求的長(zhǎng)期趨勢(shì),并利用粒子群算法(PSO)對(duì)模型參數(shù)進(jìn)行優(yōu)化,最后將高頻、低頻以及殘差項(xiàng)匯總,得到最終預(yù)測(cè)結(jié)果。為了驗(yàn)證EMD-PSO-LSSVR組合預(yù)測(cè)模型的有效性,本文選取了A公司的通用材料S的需求量為研究對(duì)象,并對(duì)比分析了ARIMA、三次指數(shù)平滑、LSSVR三種模型的擬合和預(yù)測(cè)效果。結(jié)果表明,EMD分解后,利用LSSVR做物料需求量回歸預(yù)測(cè)的擬合效果最優(yōu),驗(yàn)證了EMD-PSO-LSSVR組合預(yù)測(cè)的有效性,能為企業(yè)做物料需求預(yù)測(cè)提供參考。