国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SARIMA-LSTM的 零售生鮮品庫(kù)存需求預(yù)測(cè)

2022-04-16 12:55:52熊芷瑤李林
物流科技 2022年3期

熊芷瑤 李林

摘? 要:針對(duì)零售業(yè)的生鮮類商品存在易損耗、貨架周期短、明顯的季節(jié)性等特點(diǎn),提出一種新的組合預(yù)測(cè)模型。采用SARIMA-LSTM組合模型綜合供應(yīng)商、零售商、用戶三方面考慮需求影響因素如準(zhǔn)時(shí)交貨率、綜合成本、氣溫狀況、銷售金額等,并結(jié)合貝葉斯優(yōu)化算法對(duì)LSTM進(jìn)行超參數(shù)選擇,將SARIMA的模型預(yù)測(cè)值和實(shí)際值間的誤差序列進(jìn)行修正并得到預(yù)測(cè)值。實(shí)驗(yàn)證明,考慮需求影響因素的組合預(yù)測(cè)模型比單一傳統(tǒng)統(tǒng)計(jì)方法的預(yù)測(cè)精度要高,并對(duì)以后零售業(yè)庫(kù)存管理有一定的建設(shè)意義。

關(guān)鍵詞:SARIMA;LSTM;組合預(yù)測(cè)模型;貝葉斯優(yōu)化算法;庫(kù)存需求預(yù)測(cè)

中圖分類號(hào):F253? ? 文獻(xiàn)標(biāo)識(shí)碼:A

Abstract: Aiming at the characteristics of fresh goods in retail industry, such as easy wear and tear, short shelf cycle and obvious seasonality, a new combination forecasting model was proposed. The SARIMA-LSTM portfolio model integrated suppliers, retailers and users demand three aspects to consider factors such as on-time delivery rate, comprehensive cost, the temperature condition, the sales amount, etc., and combined with bayesian optimization algorithm for super LSTM parameter selection, the SARIMA model error between the predicted value and actual value sequence modification and predictive value. The experimental results show that the combined forecasting model considering the demand influencing factors has higher forecasting accuracy than the single traditional statistical method, and has a certain construction significance for the future retail inventory management.

Key words: SARIMA; LSTM; combination prediction model; bayesian optimization algorithm; inventory demand forecast

0? 引? 言

庫(kù)存需求預(yù)測(cè)指根據(jù)物料歷史庫(kù)存需求狀況來(lái)預(yù)測(cè)未來(lái)的需求量,屬于庫(kù)存管理中重要的一部分。隨著近幾年零售市場(chǎng)庫(kù)存物料種類繁多,生命周期短,庫(kù)存需求預(yù)測(cè)越發(fā)困難。尤其是生鮮類商品,它有著極大的消耗需求,同時(shí)本身具有易損耗、易變質(zhì)等特點(diǎn),其庫(kù)存控制是需在短時(shí)期內(nèi)立即做出決策判斷的,因此及時(shí)準(zhǔn)確的預(yù)測(cè)庫(kù)存需求變得越發(fā)困難。

對(duì)于庫(kù)存需求量時(shí)間序列預(yù)測(cè)方面,主要包括統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)兩大類。比較經(jīng)典傳統(tǒng)的統(tǒng)計(jì)方法有加權(quán)平均法、指數(shù)平均法、灰色預(yù)測(cè)[1]等。后來(lái)漸漸出現(xiàn)機(jī)器學(xué)習(xí)在預(yù)測(cè)方面的應(yīng)用,如BP神經(jīng)網(wǎng)絡(luò)[2]、前饋神經(jīng)網(wǎng)絡(luò)與蝙蝠算法和縮放共軛梯度算法結(jié)合[3]提高了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和預(yù)測(cè)結(jié)果的精度。近年來(lái),單一的預(yù)測(cè)模型不能滿足復(fù)雜的庫(kù)存需求,逐漸出現(xiàn)考慮需求特性或需求影響因素的預(yù)測(cè)模型以及組合預(yù)測(cè)模型。龔巍[4]在庫(kù)存需求預(yù)測(cè)不僅考慮了電力物資的包括重要性、緊急性等需求特性,并且運(yùn)用GA-BP組合預(yù)測(cè)模型最終實(shí)現(xiàn)動(dòng)態(tài)庫(kù)存控制。Elcio, Tarallo等[5]運(yùn)用機(jī)器學(xué)習(xí)在短保質(zhì)期和易腐產(chǎn)品在預(yù)測(cè)方面的好處,降低零售店的庫(kù)存率。

本研究提出基于SARIMA和LSTM的組合預(yù)測(cè)模型,并且將領(lǐng)域?qū)<业囊庖?jiàn)和生鮮類商品庫(kù)存的特性結(jié)合起來(lái)。考慮需求影響因素成為預(yù)測(cè)變量的一部分,應(yīng)用該模型對(duì)零售生鮮類商品做出庫(kù)存需求預(yù)測(cè),并通過(guò)H零售企業(yè)的生鮮品每月庫(kù)存需求量進(jìn)行驗(yàn)證。

1? 理論方法

1.1? SARIMA預(yù)測(cè)模型

ARIMA全稱為差分移動(dòng)平均模型,通常被記作ARIMAp,d,q。p表示自回歸項(xiàng)數(shù),d表示讓時(shí)間序列平穩(wěn)差分的次數(shù),q表示移動(dòng)平均項(xiàng)數(shù)。

ARIMA模型的數(shù)學(xué)表達(dá)式如下:

X=λX+λX+…+λX+μ+φμ+φμ+…+φμ? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)

其中:X是平穩(wěn)變量,λ是自回歸項(xiàng)系數(shù),μ是殘差,φ是移動(dòng)平均項(xiàng)系數(shù),δ是常數(shù)項(xiàng),ω是白噪聲序列,也稱為殘差。

SARIMA是建立在ARIMA模型基礎(chǔ)之上的,考慮了其季節(jié)性元素,形式為ARIMAp,d,q×P,D,Q,S,其中p為非季節(jié)性回歸項(xiàng)數(shù),d為非季節(jié)差分階數(shù),q為非季節(jié)移動(dòng)平均項(xiàng)數(shù),P為季節(jié)性回歸項(xiàng)數(shù),D為季節(jié)性差分階數(shù),Q為季節(jié)性移動(dòng)平均項(xiàng)數(shù),S為季節(jié)性時(shí)間跨度[6]。

本文的研究對(duì)象為零售企業(yè)生鮮類商品,具有明顯的季節(jié)性特征,因此擬用ARIMAp,d,q×P,D,Q,S進(jìn)行建模預(yù)測(cè)。

1.2? LSTM預(yù)測(cè)模型

LSTM是一種特殊的RNN,具有記憶數(shù)據(jù)序列的長(zhǎng)期依賴關(guān)系,有著強(qiáng)大的自學(xué)習(xí)能力和非線性擬合能力[7]。如圖1所示,LSTM模型結(jié)構(gòu)中各單元的更新方式如下:

圖1中,x表示該時(shí)刻的數(shù)據(jù)信息,激活函數(shù)σ、tanh表達(dá)式通常取如下值:

σx=? ? ? ? ? ? ? ? ? ? ? (2)

tanhx=? ? ? ? ? ? ? ? ? ? ? (3)

f表示遺忘門,能夠過(guò)濾前序時(shí)刻的狀態(tài)信息,識(shí)別前序時(shí)刻對(duì)后序時(shí)刻的影響程度;i表示輸入門,用來(lái)控制輸入信息進(jìn)入本時(shí)刻信息的比例;o表示輸出門,用于控制本時(shí)刻狀態(tài)信息輸出的比例,計(jì)算公式分別為:

f=σ

W

h,

x

+b? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(4)

i=σ

W

h,

x

+b? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(5)

o=σ

W

h,

x

+b? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(6)

其中:W、W、W均是權(quán)重矩陣。如公式(7)所示,c表示本時(shí)刻狀態(tài)信息,其值由本時(shí)刻輸入信息以及上一時(shí)刻狀態(tài)信息決定:

c=f×c+i×? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(7)

其中:=tanh

W

h,

x

+b。h表示本時(shí)刻隱藏層的狀態(tài)信息:

h=o×tanh

c? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (8)

1.3? 貝葉斯優(yōu)化算法

貝葉斯優(yōu)化算法能夠在每次迭代中,根據(jù)代理模型擬合實(shí)際目標(biāo)函數(shù)的結(jié)果選擇最優(yōu)評(píng)估點(diǎn),減少目標(biāo)函數(shù)的迭代次數(shù),可提高模型泛化能力并避免過(guò)擬合現(xiàn)象。

貝葉斯優(yōu)化算法的迭代過(guò)程分為三部分:根據(jù)最大化采集函數(shù)選擇最優(yōu)評(píng)估點(diǎn);將評(píng)估目標(biāo)函數(shù)加入觀測(cè)數(shù)據(jù);更新目標(biāo)函數(shù)的后驗(yàn)概率分布和采集函數(shù)。文中采用高斯過(guò)程作為代理函數(shù),期望提高函數(shù)為采集函數(shù)。

1.4? 模型實(shí)現(xiàn)及評(píng)估方法

研究基于Anaconda環(huán)境下的Python語(yǔ)言對(duì)SARIMA模型和LSTM神經(jīng)網(wǎng)絡(luò)模型進(jìn)行編程實(shí)現(xiàn)。其中,SARIMA模型主要通過(guò)調(diào)用Statsmodels庫(kù)進(jìn)行實(shí)現(xiàn);而LSTM神經(jīng)網(wǎng)絡(luò)模型主要通過(guò)Tensorflow作為后端,采用Keras進(jìn)行實(shí)現(xiàn)[8]。

關(guān)于模型評(píng)價(jià),研究選用均方誤差MSE、平均絕對(duì)誤差MAE、平均絕對(duì)百分比誤差MAPE三個(gè)指標(biāo)來(lái)評(píng)價(jià)這幾種模型對(duì)于該庫(kù)存需求的時(shí)間序列預(yù)測(cè)性能,指標(biāo)數(shù)值越小,說(shuō)明預(yù)測(cè)精度越高,預(yù)測(cè)效果越好。這四種評(píng)價(jià)指標(biāo)表達(dá)式分別為:

MSE=

-y? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (9)

MAPE=

(10)

其中:y為實(shí)際觀測(cè)值,為預(yù)測(cè)值,n代表測(cè)試集的樣本數(shù)量。

2? 組合模型的建立

2.1? 數(shù)據(jù)描述

本文采用H零售企業(yè)2010年至2020年連續(xù)11年132個(gè)月份的生鮮類商品的庫(kù)存需求量數(shù)據(jù)作為基礎(chǔ)研究數(shù)據(jù)。其中前120個(gè)的月份數(shù)據(jù)作為訓(xùn)練集,后12個(gè)的月份數(shù)據(jù)作為測(cè)試集。

2.2? 組合模型中SARIMA模型建立

2.2.1? 序列平穩(wěn)化

(1)平穩(wěn)性檢驗(yàn)及平穩(wěn)化處理

根據(jù)人們對(duì)生鮮類商品的購(gòu)買習(xí)慣,夏季以及全網(wǎng)大促的特定月份會(huì)出現(xiàn)非常大的庫(kù)存需求量,因此存在明顯的周期性。將序列的趨勢(shì)、季節(jié)和隨機(jī)效應(yīng)分解出來(lái)繪制時(shí)間序列分解圖(圖2)。通過(guò)ADF檢驗(yàn)結(jié)果可知,檢驗(yàn)統(tǒng)計(jì)量的值為0.73,并且在90%、95%和99%的置信度下,檢驗(yàn)統(tǒng)計(jì)量的值均大于對(duì)應(yīng)的臨界值,所以認(rèn)為該初始時(shí)間序列是非平穩(wěn)的。因此,需要進(jìn)行平穩(wěn)化處理。

對(duì)原始的序列作1階12步差分來(lái)提取原序列的趨勢(shì)效應(yīng)和季節(jié)效應(yīng),由差分后的ADF檢驗(yàn)結(jié)果可知,1階12步差分后的序列是平穩(wěn)的。

2.2.2? 模型識(shí)別及定階

通過(guò)網(wǎng)格搜索遍歷參數(shù)的不同組合,利用AIC準(zhǔn)則評(píng)價(jià)選取最優(yōu)模型參數(shù)。所得AIC值最低為286.84時(shí),模型為ARIMA1,1,1×1,1,1,12。

2.2.3? 模型擬合及檢驗(yàn)

根據(jù)擬合結(jié)果每個(gè)變量的P值均小于0.01,MSE=1.88,MAE=0.9025,MAPE=2.001%,因此可以認(rèn)為擬合的模型是合理的。然后對(duì)殘差采用LB檢驗(yàn)法進(jìn)行白噪聲檢驗(yàn),檢驗(yàn)結(jié)果顯示Q統(tǒng)計(jì)量的P值均大于0.05,擬合模型已經(jīng)充分提取了時(shí)間序列中的信息。最后對(duì)殘差的分布進(jìn)行模型診斷,診斷結(jié)果如圖3所示,殘差分布較為正常,時(shí)序圖基本穩(wěn)定,服從正態(tài)分布且自相關(guān)圖中不存在自相關(guān)。綜上,該模型ARIMA1,1,1×1,1,1,12擬合效果很好,具有較好的預(yù)測(cè)性能。

2.3? 組合模型中LSTM模型建立

將上文SARIMA模型的殘差指標(biāo)、準(zhǔn)時(shí)交貨率、零售綜合成本、銷售金額以及氣溫狀況共五個(gè)指標(biāo)作為L(zhǎng)STM模型的輸入變量,預(yù)測(cè)2020年中12個(gè)月的SARIMA模型的殘差指標(biāo)。

2.3.1? 數(shù)據(jù)歸一化

當(dāng)激活函數(shù)為sigmoid或者tanh時(shí),需要把數(shù)據(jù)標(biāo)準(zhǔn)化,此時(shí)LSTM比較敏感。因此采用sklearn.preprocessing模塊中的最大最小值標(biāo)準(zhǔn)MinMaxSealer

函數(shù)將每一維的特征映射到指定區(qū)間——0到1之間。

2.3.2? 模型訓(xùn)練

LSTM神經(jīng)網(wǎng)絡(luò)模型包含三層:輸入層、LSTM層、輸出層,其中LSTM層包含三層LSTM模塊進(jìn)行訓(xùn)練,最后加一層普通的神經(jīng)網(wǎng)絡(luò)用于輸出結(jié)構(gòu)的降維。其中超參數(shù)運(yùn)用貝葉斯優(yōu)化算法進(jìn)行選擇,迭代次數(shù)設(shè)為50次。其中超參數(shù)及取值范圍如表1所示。

3? 算例分析

3.1? SARIMA時(shí)間序列預(yù)測(cè)

將2020年12個(gè)月份的庫(kù)存需求量進(jìn)行回代預(yù)測(cè),得到預(yù)測(cè)圖如圖4所示。其中MSE=5.0035,RMSE=2.2369,MAE=1.7205,MAPE=3.85%。所得預(yù)測(cè)值與實(shí)際值進(jìn)行相減,得到的殘差作為后續(xù)LSTM模型的輸入變量之一,對(duì)殘差進(jìn)行修正。

3.2? LSTM殘差修正

利用上文中SARIMA模型的2020年12個(gè)測(cè)試樣本所得的殘差序列進(jìn)行考慮需求影響因素的LSTM神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)。由圖5驗(yàn)證誤差迭代圖所示,利用貝葉斯優(yōu)化算法對(duì)LSTM模型進(jìn)行超參數(shù)優(yōu)化得到誤差值最優(yōu)為第30次。

模型預(yù)測(cè)得到的殘差修正值如圖6所示。其中各項(xiàng)評(píng)價(jià)指標(biāo)分別為MSE=5.72,RMSE=2.39,MAPE=6.22%。

最后,將SARIMA模型預(yù)測(cè)所得的12個(gè)月的預(yù)測(cè)值與LSTM神經(jīng)網(wǎng)絡(luò)的殘差預(yù)測(cè)修正值進(jìn)行累加,所得最終結(jié)果為2020年12個(gè)月的庫(kù)存需求量預(yù)測(cè)值。最終累加得到的預(yù)測(cè)值計(jì)算出的各項(xiàng)評(píng)價(jià)指標(biāo)分別為MSE=4.7862,MAE=1.4797,MAPE

=3.34%。

4? 結(jié)果分析

為評(píng)估提出的方法,實(shí)驗(yàn)選取幾種主流文獻(xiàn)中的傳統(tǒng)方法進(jìn)行對(duì)比分析,對(duì)比方法包括灰色理論、樣條回歸、SARIMA、單特征LSTM和多特征LSTM。

以上六種方法所得最終預(yù)測(cè)結(jié)果計(jì)算得到的三個(gè)誤差指標(biāo)對(duì)比如表2所示,以及2020年12個(gè)月份的預(yù)測(cè)結(jié)果圖如圖7所示。

由對(duì)比結(jié)果可知,灰色理論的整體趨勢(shì)捕捉較好,但是對(duì)于特殊月份的預(yù)測(cè)精度很差;而通過(guò)加入有效輸入變量,樣條回歸模型對(duì)部分特殊月份的預(yù)測(cè)效果較好,但整體的波動(dòng)趨勢(shì)并未準(zhǔn)確捕捉。單特征LSTM預(yù)測(cè)模型的預(yù)測(cè)效果最差,預(yù)測(cè)精度最低,該模型既未考慮季節(jié)因素的影響,也未考慮庫(kù)存需求影響因素,因此具有較大偏差。考慮了需求影響因素的多特征LSTM預(yù)測(cè)模型的預(yù)測(cè)精度明顯較高,但是相比加入了季節(jié)因子的SARIMA預(yù)測(cè)模型的預(yù)測(cè)效果還是要差一些,未準(zhǔn)確抓取季節(jié)波動(dòng)規(guī)律。SARIMA預(yù)測(cè)模型考慮到了時(shí)間序列的季節(jié)效應(yīng),整體預(yù)測(cè)精度顯著提升,但對(duì)于某些月份的預(yù)測(cè)還是具有一定差異。而SARIMA-LSTM組合預(yù)測(cè)模型既考慮到季節(jié)性又考慮到需求因素影響,盡管LSTM易發(fā)生過(guò)擬合現(xiàn)象,但是該組合預(yù)測(cè)模型中的LSTM模型僅僅對(duì)預(yù)測(cè)殘差進(jìn)行修正,對(duì)其整體預(yù)測(cè)效果影響較小。因此相比其他五種預(yù)測(cè)模型,該組合模型的預(yù)測(cè)精度最高。

5? 結(jié)束語(yǔ)

針對(duì)本文零售業(yè)生鮮類商品庫(kù)存需求量時(shí)間序列數(shù)據(jù),采取的是一種基于SARIMA-LSTM組合預(yù)測(cè)模型,與傳統(tǒng)預(yù)測(cè)方法不同的是該方法既考慮到了生鮮類商品的季節(jié)性特點(diǎn),還考慮到四點(diǎn)庫(kù)存需求的相關(guān)性較高的影響因素,如準(zhǔn)時(shí)交貨率、零售綜合成本、銷售金額、氣溫狀況。通過(guò)利用SARIMA模型良好地捕捉季節(jié)性規(guī)律的能力進(jìn)行預(yù)測(cè),然后構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型加入多個(gè)影響指標(biāo)輔助預(yù)測(cè)SARIMA模型的殘差,盡可能地降低LSTM過(guò)擬合現(xiàn)象。對(duì)比傳統(tǒng)預(yù)測(cè)模型,得到組合模型的預(yù)測(cè)性能最佳。因此該組合預(yù)測(cè)方法對(duì)于零售業(yè)生鮮類商品庫(kù)存需求量時(shí)間序列數(shù)據(jù)預(yù)測(cè)具有一定合理性和參考性,利于庫(kù)存管理和控制,并且對(duì)于其他領(lǐng)域的預(yù)測(cè)具有一定參考性。

參考文獻(xiàn):

[1]? Paul H K H. Forecasting Construction Manpower Demand by Gray Model[J]. Journal of Construction Engineering and Management, 2010,136(12):1299-1305.

[2]? X G, C L, W X, et al. A Prediction-Based Inventory Optimization Using Data Mining Models: 2014 Seventh International Joint Conference on Computational Sciences and Optimization, 2014[C] // Computational Sciences and Optimization (CSO), 2014:611-615.

[3]? P M R B, J A N P, M R A C, et al. A bat optimized neural network and wavelet transform approach for short-term price forecasting[J]. Applied Energy, 2018,210:88-97.

[4] 龔巍. 基于需求特性分類的電力物資庫(kù)存控制與需求預(yù)測(cè)方法研究[D]. 沈陽(yáng):東北大學(xué)(碩士學(xué)位論文),2013.

[5]? Elcio T, Getúlio K A, Camilo I S, et al. Machine Learning in Predicting Demand for Fast-Moving Consumer Goods: An Exploratory Research[J]. IFAC PapersOnLine, 2019,52(13):737-742.

[6]? Nari S A, Diane A. A hybrid seasonal autoregressive integrated moving average and quantile regression for daily food sales forecasting[J]. International Journal of Production Economics, 2015,170:321-335.

[7] 王淑平,李敏,杜敏,等. ARIMA與LSTM模型在醫(yī)院出院人次預(yù)測(cè)中的比較研究[J]. 公共衛(wèi)生與預(yù)防醫(yī)學(xué),2021,32(1):18-21.

[8] 張曉卉,姚婷婷,陳陽(yáng),等. 基于Python語(yǔ)言的ARIMA模型在天津市結(jié)核病發(fā)病率預(yù)測(cè)中的應(yīng)用[J]. 中國(guó)感染控制雜志,2020,19(7):634-642.

大田县| 青铜峡市| 泗水县| 惠水县| 项城市| 呼玛县| 元氏县| 尼玛县| 三门县| 山阴县| 井冈山市| 陵川县| 安图县| 宁明县| 凉城县| 磐安县| 井冈山市| 江孜县| 木里| 轮台县| 怀来县| 饶阳县| 张家川| 乳源| 嘉义市| 芦山县| 泗水县| 榆社县| 八宿县| 余姚市| 乐至县| 清苑县| 剑阁县| 莱阳市| 高台县| 肇州县| 蓬溪县| 石景山区| 抚顺市| 凉城县| 饶阳县|