陳銀光, 于守健
(東華大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院, 上海 201620)
預(yù)測是對未來將要發(fā)生的事情做出的推測。隨著數(shù)據(jù)預(yù)測技術(shù)的發(fā)展,數(shù)據(jù)預(yù)測技術(shù)的應(yīng)用范圍日趨廣泛,已拓展普及至經(jīng)濟(jì)、環(huán)境、教育、交通、醫(yī)療等重要領(lǐng)域。本文主要研究服裝銷售相關(guān)的預(yù)測。時下的服裝業(yè)正銳意前行,競爭相對也在加劇,因而需要在學(xué)習(xí)中探索利用科學(xué)的方法解決服裝銷售中的問題,從而增強(qiáng)自身的競爭實力。在服裝銷售中如果能夠預(yù)測服裝的銷售量,不僅有利于合理制定銷售計劃、最佳優(yōu)化商品分配、科學(xué)控制商品生產(chǎn)、有效避免商品積壓,而且可以大幅減少人力物力,由此提高商品銷售利潤。所以服裝銷售行業(yè)亟需一個快速優(yōu)質(zhì)的方法用于服裝銷售的評估預(yù)測,通過選擇合適的數(shù)據(jù)預(yù)測模型,結(jié)合歷史銷售數(shù)據(jù)來預(yù)測未來一段時間的銷售狀況,預(yù)測的結(jié)果可以輔助企業(yè)匯總籌劃日常決策,從而發(fā)揮一定的參考借鑒作用。
銷售數(shù)據(jù)是典型的時間序列。在基于時間序列的預(yù)測分析方法中,移動平均法業(yè)已躋身學(xué)界流行行列,但也存在一些不足。簡單的移動平均法并未考慮周期內(nèi)數(shù)據(jù)的權(quán)重,加權(quán)移動平均法彌補(bǔ)了這一缺陷,但李云剛經(jīng)過對比證明卻發(fā)現(xiàn)加權(quán)移動平均法也表現(xiàn)出一定劣勢[1]?;诖?,本文探討了移動平均法和加權(quán)移動平均法存在的問題,通過計算相鄰數(shù)據(jù)的增減情況,引入了趨勢的概念,并且利用對整體預(yù)測結(jié)果的平移處理,解決了預(yù)測延遲的問題。而且通過計算誤差對比實驗可以看出改進(jìn)后的方法大大提高了預(yù)測的精度。
移動平均法是時間序列模型中比較常見的方法,是一種簡單平滑預(yù)測技術(shù)。該技術(shù)的基本原理是根據(jù)已知一段時間的數(shù)據(jù),從開始位置逐步向后移動指定期數(shù),再求取其平均值作為下一個期數(shù)要預(yù)測的值。時間序列的數(shù)據(jù)一般會受周期變動和隨機(jī)波動的影響,有較大的起伏,不易探尋出時間的發(fā)展趨勢,使用移動平均法可以消除這些因素的影響,研究求出時間的發(fā)展方向與趨勢,并據(jù)此分析預(yù)測未來的發(fā)展趨勢。
移動平均法可以分為:簡單移動平均法和加權(quán)移動平均法,本文將對其展開解析分述如下[2]。
設(shè)有一段時間序列x1,x2,x3,…,xm,可以參照各數(shù)據(jù)點的順序逐點推移求出n個數(shù)的平均數(shù),即可得到一次移動平均數(shù),計算公式如下:
(1)
其中,k>n;n為數(shù)據(jù)移動的周期數(shù),n的值可以結(jié)合實際情況設(shè)置;xk表示周期內(nèi)的一次移動平均數(shù),可以依次求出其它的預(yù)測值;xk-1,xk-2,…,xk-n為居于xk之前的一個周期的數(shù)據(jù)。
當(dāng)k值不斷向后推移,移動一次就可以求出一個平均值,這個方法可以依次求出后面一段時間的值??紤]到該方法的設(shè)計原理是不斷地逐期向后移動,因此將其稱為移動平均法。
與移動平均法不同,加權(quán)移動平均法就是每一項中均增加了一個權(quán)值,具體就是給一定周期的變量值增加不同的權(quán)值。其設(shè)計原理是基于在一個時間序列中每一個時期的數(shù)據(jù)對未來預(yù)測的作用大小各有不同,因此可為其增加一個權(quán)值來衡定其作用大小。分析可知,在一個周期中距離預(yù)測時間越遠(yuǎn),其影響力就相對較小,而距離越近影響力可能就越大。研究中設(shè)置的權(quán)重可依從時間的順序逐漸變大。當(dāng)周期為n時,加權(quán)移動平均法的公式可以表示如下:
(2)
進(jìn)一步地,式(2)可以簡化為:
(3)
其中,w1+w2+…+wn=1;x′k表示預(yù)測值;wi表示xk-i的權(quán)重,i=1,2,3…,n。
從以上的加權(quán)移動平均法公式可以看出,權(quán)重的選擇是一個關(guān)鍵問題。常規(guī)方法是根據(jù)經(jīng)驗進(jìn)行選擇。一般情況下,研究中是將距離預(yù)測時間近的值賦予大的權(quán)重,距離遠(yuǎn)的將賦予較小權(quán)重值。
在時間序列數(shù)據(jù)中會存在數(shù)值的增加或者減少,移動平均法及加權(quán)移動平均法中均未對此予以特別關(guān)注,為此研究中將引入趨勢的概念[3-5]。在移動平均法中還存在預(yù)測結(jié)果時間推移的現(xiàn)象,這里通過把預(yù)測的結(jié)果整體前移一個時間單位用于應(yīng)對這一問題狀況。為此,研究推得改進(jìn)后的公式可表述如下:
(4)
其中,pk表示預(yù)測值;xk+1表示時間序列數(shù)據(jù)的移動平均值,其求解過程如式(1)所示;x′k+1表示時間序列數(shù)據(jù)的加權(quán)移動平均值,其求解過程如式(2)所示;y表示在n周期內(nèi)曲線的整體趨勢,當(dāng)y>0,說明曲線整體為上升的趨勢。如果y<0,則表示曲線整體呈下降的趨勢。y的表達(dá)式可以用以下方法進(jìn)行表示:
(5)
其中,vi表示相鄰2個數(shù)差的權(quán)值。
在前文研究論述基礎(chǔ)上,分析歸納后得出改進(jìn)的加權(quán)移動平均法的設(shè)計步驟可闡釋解析如下。
Step1根據(jù)時間序列數(shù)據(jù)求出周期為n的數(shù)據(jù)移動平均值,數(shù)學(xué)運算如式(1)所示。
Step2求取周期為n的時間序列數(shù)據(jù)的加權(quán)移動平均值,數(shù)學(xué)運算如式(2)所示。
Step3根據(jù)式(5)可求得取周期為n的時間序列的趨勢平均值。
Step4綜合前述3步得到的各方法結(jié)果進(jìn)行合并計算,其數(shù)學(xué)運算形式即如式(4)所示。
實驗數(shù)據(jù)選取了某一服裝銷售商2013年12月至2018年5月的銷售額,通過使用移動平均法(公式(1))、加權(quán)移動平均法(公式(2))以及改進(jìn)的加權(quán)移動平均法(公式(4))進(jìn)行預(yù)測,而這里的預(yù)測設(shè)計則將以折線圖的形式繪制出預(yù)測數(shù)據(jù)與原始數(shù)據(jù),從而得到更加直觀的誤差對比結(jié)果。為此,研究中專門選用了平均絕對誤差(MAE)和均方根誤差(RMSE)用于誤差值計算[6]。文中,將對這2個誤差計算方法做出研究簡述如下。
(1)平均絕對誤差(Mean Absolute Deviation,MAE)。MAE是絕對誤差的平均值,能夠更好地反映預(yù)測值誤差的實際情況。計算公式如下:
(6)
(2)均方根誤差(root-mean-square error,RMSE),也稱為標(biāo)準(zhǔn)誤差。是觀測值與真值偏差的平方與周期次數(shù)比值的平方根。RMSE可用于衡量預(yù)測值與實際值的偏差。計算公式如下:
(7)
本次實驗數(shù)據(jù)中,將移動周期選為3個月,研究擬預(yù)測2018年6~8月的銷售額。首先使用移動平均法(公式(1))與加權(quán)移動平均法(公式(2))進(jìn)行服裝銷售額預(yù)測,預(yù)測的結(jié)果與原始數(shù)據(jù)的對比折線圖,則如圖1所示。由圖1可以發(fā)現(xiàn),傳統(tǒng)的移動平均法和加權(quán)移動平均法的預(yù)測值與實際值之間誤差較大。
圖1 移動平均法和加權(quán)移動平均法預(yù)測值對比
其次,通過改進(jìn)加權(quán)移動平均法(公式(4))對原始數(shù)據(jù)進(jìn)行預(yù)測求得的結(jié)果與原始數(shù)據(jù)對比繪制的折線圖,如圖2所示。其中,服裝銷售數(shù)據(jù)移動的周期仍然為3個月,預(yù)測2018年6~8月的銷售額。通過折線圖可以看出,改進(jìn)后的預(yù)測方法與實際數(shù)據(jù)的誤差呈明顯減少態(tài)勢,分析得知改進(jìn)的加權(quán)移動平均法對服裝銷售額的預(yù)測獲得了更好的改良性能。
為了更清晰地對比這3種方法的運行結(jié)果,使用平均絕對誤差(公式(6))和均方根誤差(公式(7))計算各類方法誤差,運算結(jié)果可見表1。通過數(shù)值對比可以看到,改進(jìn)后的方法誤差降低了很多,由此即可推得:改進(jìn)后的加權(quán)移動平均法對服裝銷售額的預(yù)測精度有了可觀的改善。
根據(jù)服裝銷售商的歷史銷售記錄,分別使用這3種方法預(yù)測了2018年6~8月的銷售額,預(yù)測結(jié)果可詳見表2。研究至此可知,通過前文的仿真實驗證明改進(jìn)的加權(quán)移動平均法在數(shù)據(jù)預(yù)測精度上已有可觀改善,因此2018年6月、7月、8月的預(yù)測值將可分別選擇為:39.83萬元、38.97萬元、39.07萬元。
表1 3種預(yù)測方法的誤差對比
表23種方法分別預(yù)測6~8月的銷售額
Tab. 2 Three methods predict sales from June to August 萬元
圖2 改進(jìn)加權(quán)移動平均法預(yù)測值
本文在移動平均法和加權(quán)移動平均法的基礎(chǔ)上,增加了趨勢和解決預(yù)測推移的方法,構(gòu)造了一種改進(jìn)的加權(quán)移動平均方法,通過平均絕對誤差和均方根誤差進(jìn)行誤差分析,經(jīng)過仿真可以確知:這種改進(jìn)的加權(quán)移動平均法比原有的移動平均預(yù)測方法已取得了長足進(jìn)步。利用這種方法對某服裝銷售商的未來銷售額進(jìn)行預(yù)測,目前雖然仍還存在一些誤差,但相對于傳統(tǒng)預(yù)測方法已有較大的優(yōu)化與改進(jìn)。