国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于BP-AdaBoost的電商短期銷量預(yù)測(cè)模型①

2021-02-23 06:30王麗紅
關(guān)鍵詞:誤差因子樣本

王麗紅

(煙臺(tái)汽車工程職業(yè)學(xué)院 經(jīng)濟(jì)管理系,煙臺(tái) 265500)

近年來(lái),電子商務(wù)的發(fā)展勢(shì)頭強(qiáng)勁,一度對(duì)傳統(tǒng)的實(shí)體經(jīng)濟(jì)產(chǎn)生了非常大的沖擊.僅2019年上半年,銷售額已經(jīng)達(dá)到了驚人的195209.7 億元[1],且2019年天貓雙十一購(gòu)物節(jié)活動(dòng)成交額突破100 億,僅用了1 分36 秒,這在以往的傳統(tǒng)零售行業(yè)內(nèi)幾乎是無(wú)法想象的[2].隨著電商行業(yè)的興起,國(guó)內(nèi)涌現(xiàn)出天貓、淘寶、京東等大型電商平臺(tái),并產(chǎn)生了B2B、B2C、C2C 等許多新模式,這些足以看出電商行業(yè)巨大的發(fā)展?jié)摿3].

由于電子商務(wù)具有數(shù)據(jù)化、集成化、互動(dòng)化的特性,使得電子商務(wù)會(huì)計(jì)系統(tǒng)與其他傳統(tǒng)會(huì)計(jì)系統(tǒng)相比具有更大的數(shù)據(jù)規(guī)模,同樣也蘊(yùn)藏了更多待挖掘的數(shù)據(jù)信息[4,5].各電商企業(yè)在產(chǎn)品銷售過程中會(huì)產(chǎn)生大量的銷售數(shù)據(jù),如何處理這些銷售數(shù)據(jù),并從中發(fā)掘銷量變化的規(guī)律,指導(dǎo)電商企業(yè)制訂策略,對(duì)電商企業(yè)管理具有十分重要的意義[6].同時(shí),銷量預(yù)測(cè)也是新型電子商務(wù)會(huì)計(jì)系統(tǒng)中一個(gè)重要的組成模塊[7].

目前,各個(gè)行業(yè)的銷量預(yù)測(cè)方法大多是依據(jù)歷史銷量對(duì)未來(lái)銷量的預(yù)測(cè).付敏娟等人考慮了指數(shù)平滑模型較大的預(yù)測(cè)誤差和神經(jīng)網(wǎng)絡(luò)的過擬合問題,提出了用二次指數(shù)平滑序列改進(jìn)BP 神經(jīng)網(wǎng)絡(luò)的指數(shù)平滑神經(jīng)網(wǎng)絡(luò)太陽(yáng)能熱水器銷售預(yù)測(cè)模型[8].圣文順等用遺傳算法改進(jìn)傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò),并用時(shí)間序列對(duì)模型進(jìn)一步校正,大大降低了預(yù)測(cè)誤差[9].王建偉利用產(chǎn)品銷售共性提取產(chǎn)品聚類簇,再使用時(shí)間序列模型得出預(yù)測(cè)結(jié)果并通過隱馬爾科夫預(yù)測(cè)模型給出預(yù)測(cè)結(jié)果的概率分布[10].上述銷量預(yù)測(cè)方法均采用常用的時(shí)間序列模型,說(shuō)明基于歷史數(shù)據(jù)的銷量預(yù)測(cè)具有更高的可行性和可靠性.由于BP 神經(jīng)網(wǎng)絡(luò)存在的過擬合、收斂慢、誤差大等問題,采用其他方法對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn)也是較為可行的方法.

本文建立了一種電子商務(wù)會(huì)計(jì)系統(tǒng)中的短期銷量預(yù)測(cè)模型,其以日銷量為預(yù)測(cè)單位,并考慮電商行業(yè)內(nèi)較為常見的“周末效應(yīng)”改進(jìn)時(shí)間窗的時(shí)序設(shè)計(jì)和預(yù)測(cè)模型結(jié)構(gòu).運(yùn)用AdaBoost 思想集合多個(gè)傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果,通過增加弱預(yù)測(cè)器數(shù)量重點(diǎn)學(xué)習(xí)預(yù)測(cè)錯(cuò)誤的樣本并分配預(yù)測(cè)器權(quán)重,根據(jù)預(yù)測(cè)器權(quán)重組合多個(gè)BP 神經(jīng)網(wǎng)絡(luò)(以下簡(jiǎn)稱BPN)的模型輸出建立一個(gè)準(zhǔn)確率更高的預(yù)測(cè)模型.短期銷量預(yù)測(cè)對(duì)于迅速反應(yīng)電商行情變化,制訂短期內(nèi)穩(wěn)定銷量的應(yīng)對(duì)方案和促銷計(jì)劃具有重要的意義.

1 AdaBoost-BPN 預(yù)測(cè)模型的建立

1.1 BPN 弱預(yù)測(cè)器

BPN是機(jī)器學(xué)習(xí)領(lǐng)域應(yīng)用較為廣泛的一種神經(jīng)網(wǎng)絡(luò)算法,常用于模式識(shí)別、數(shù)據(jù)分類、數(shù)據(jù)挖掘等領(lǐng)域.BPN 實(shí)際上是一個(gè)大型的雙向循環(huán)的迭代計(jì)算模型,正向計(jì)算過程是簡(jiǎn)單的輸出結(jié)果計(jì)算,反向的誤差修正計(jì)算是BPN的算法核心,通過Widrow-Hoff 學(xué)習(xí)規(guī)則對(duì)各節(jié)點(diǎn)的權(quán)值進(jìn)行反復(fù)的修正,直至輸出結(jié)果誤差小于期望閾值[11–13].常見的BPN 一般為3 層結(jié)構(gòu),分別為輸入層、隱含層和輸出層,較為復(fù)雜的工程可能用到多隱含層的網(wǎng)絡(luò)結(jié)構(gòu),3 層BPN的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示.

1.2 AdaBoost 算法

AdaBoost 算法也是一種迭代算法,其思想來(lái)源于Hansen 提出的同一樣本的多個(gè)神經(jīng)網(wǎng)絡(luò)的組合能夠提高網(wǎng)絡(luò)泛化能力的理論[14].針對(duì)用于數(shù)據(jù)預(yù)測(cè)的算法,AdaBoost 算法是按照一定的規(guī)則將多個(gè)BPN 弱預(yù)測(cè)器集合為一個(gè)強(qiáng)預(yù)測(cè)器.這里所提到的多個(gè)BPN 預(yù)測(cè)器集合的規(guī)則就是AdaBoost 算法的核心規(guī)則,與BPN的節(jié)點(diǎn)權(quán)重修正類似,也是通過計(jì)算各BPN 弱預(yù)測(cè)器的權(quán)重對(duì)BPN 弱預(yù)測(cè)器的結(jié)果進(jìn)行組合[15,16].

圖1 3 層BPN 網(wǎng)絡(luò)結(jié)構(gòu)圖

AdaBoost 算法的具體執(zhí)行步驟如下:

1)首先,對(duì)每一個(gè)輸入樣本設(shè)置權(quán)重ω1(n)=1/N,N為樣本總數(shù).利用第1 個(gè)BPN 弱預(yù)測(cè)器進(jìn)行第1 次訓(xùn)練,并計(jì)算錯(cuò)誤率εi.

2)利用錯(cuò)誤率按照式(2)計(jì)算BPN 弱預(yù)測(cè)器的權(quán)重αi,i為BPN 弱預(yù)測(cè)器編號(hào).

3)按照式(3)規(guī)則確定第2 個(gè)BPN 弱預(yù)測(cè)器的樣本權(quán)值,增加預(yù)測(cè)不準(zhǔn)確的樣本的權(quán)值,降低預(yù)測(cè)準(zhǔn)確的樣本的權(quán)值,即重點(diǎn)學(xué)習(xí)預(yù)測(cè)錯(cuò)誤的樣本,其中hi(xn)為第i個(gè)BPN 弱預(yù)測(cè)器第n個(gè)樣本的預(yù)測(cè)結(jié)果.

4)按照上述規(guī)律一直進(jìn)行迭代計(jì)算直至第I個(gè)BPN 弱預(yù)測(cè)器,得到I個(gè)BPN 弱預(yù)測(cè)器的權(quán)重集合{α1,α2,···,αI},按照式(4)計(jì)算所有BPN 弱預(yù)測(cè)器的集合預(yù)測(cè)結(jié)果,其中sign 代表符號(hào)函數(shù).

1.3 AdaBoost-BPN 預(yù)測(cè)模型工作原理

BPN 弱預(yù)測(cè)器均采用2 層隱含層的BPN,BPN的隱含層節(jié)點(diǎn)數(shù)量采用式(5)確定.

其中,Nh為隱含層節(jié)點(diǎn)數(shù)量;Ni為輸入層節(jié)點(diǎn)數(shù)量,由預(yù)測(cè)樣本數(shù)據(jù)的維數(shù)決定;Nh為輸出層節(jié)點(diǎn)數(shù)量,由預(yù)測(cè)結(jié)果數(shù)據(jù)維數(shù)決定,R為[0,10]之間的隨機(jī)數(shù).神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,不是隱含層節(jié)點(diǎn)數(shù)量越多訓(xùn)練效果越好,因此具體的隱含層節(jié)點(diǎn)數(shù)量需要進(jìn)行大量的訓(xùn)練試驗(yàn)來(lái)確定.BPN 弱預(yù)測(cè)器的輸入為歷史銷售數(shù)據(jù),輸出結(jié)果為銷量預(yù)測(cè)數(shù)據(jù).

AdaBoost-BPN 預(yù)測(cè)模型的實(shí)質(zhì)是將BPN 弱預(yù)測(cè)器融入AdaBoost的算法的過程中,AdaBoost 算法通過不斷增加BPN 弱預(yù)測(cè)器數(shù)量強(qiáng)化訓(xùn)練那些預(yù)測(cè)結(jié)果不準(zhǔn)確的樣本,直至預(yù)測(cè)誤差達(dá)到設(shè)置的誤差閾值.AdaBoost 算法的輸入為BPN 弱預(yù)測(cè)器模型和樣本數(shù)據(jù),輸出為多個(gè)BPN 弱預(yù)測(cè)器的預(yù)測(cè)模型和權(quán)重,并組合得到一個(gè)強(qiáng)預(yù)測(cè)器.AdaBoost-BPN 預(yù)測(cè)模型流程圖如圖2所示.

圖2 AdaBoost-BPN 預(yù)測(cè)模型流程圖

2 基于時(shí)間序列的短期銷量預(yù)測(cè)模型

目前常見的銷量預(yù)測(cè)模型大多以月銷量或者周銷量作為基本預(yù)測(cè)單位[17,18],隨著電商行業(yè)規(guī)模的不斷增大,入駐電商領(lǐng)域的商家越來(lái)越多,甚至以個(gè)人為主導(dǎo)的C2C 商業(yè)模式也展現(xiàn)出較大的活力和發(fā)展?jié)摿?電商行業(yè)的競(jìng)爭(zhēng)愈發(fā)激烈[19].在這種情況下,以往的銷量預(yù)測(cè)方法已經(jīng)無(wú)法保證預(yù)測(cè)的及時(shí)性,因此本文建立的AdaBoost-BPN 短期銷量預(yù)測(cè)模型以日銷量作為預(yù)測(cè)基本單位.

基于時(shí)序數(shù)據(jù)的預(yù)測(cè)任務(wù)通常用時(shí)間窗口切割時(shí)間軸來(lái)獲得訓(xùn)練樣本,本文建立的時(shí)間軸設(shè)計(jì)了兩個(gè)固定跨度的時(shí)間窗口,觀測(cè)時(shí)間窗和預(yù)測(cè)時(shí)間窗[20,21].本文以某電商平臺(tái)商家LMAZ-CG1520 型號(hào)牛仔褲的歷史銷量和鏈接點(diǎn)擊量數(shù)據(jù)作為模型的訓(xùn)練和測(cè)試數(shù)據(jù).該組數(shù)據(jù)具有較為明顯的分布特征,同一周內(nèi)工作日的銷量和周末的銷量會(huì)一般存在較大的差別,周末兩天的日銷量會(huì)明顯高于工作日5 天的日銷量,本文稱之為電商的“周末效應(yīng)”.除了特殊節(jié)假日和平臺(tái)促銷活動(dòng)期間,其他時(shí)間的銷量基本遵循以一周為周期的短期循環(huán).為了使模型的訓(xùn)練能夠全面采集一周內(nèi)的銷量變化特征,同時(shí)考慮“周末效應(yīng)”的影響,本文采用觀測(cè)時(shí)間窗跨度為5,預(yù)測(cè)時(shí)間窗跨度為3,當(dāng)時(shí)間軸總跨度為n時(shí),即以n天的歷史銷量數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,將得到n?5+1 組訓(xùn)練數(shù)據(jù),時(shí)間軸的劃分如圖3所示.

圖3 時(shí)間軸劃分圖

AdaBoost-BPN 短期銷量預(yù)測(cè)模型的觀測(cè)時(shí)間窗跨度為5 天,常規(guī)的事件窗采樣無(wú)法判斷觀測(cè)時(shí)段內(nèi)是否存在周末,因此本文在模型的輸入部分增加了1 個(gè)輸入層節(jié)點(diǎn),該輸入節(jié)點(diǎn)稱為“周末因子”.電子商務(wù)銷量歷史數(shù)據(jù)中包含該條記錄的時(shí)間標(biāo)簽,判斷該條記錄是否為周末的銷量較為簡(jiǎn)單.當(dāng)“周末因子”為1 時(shí),代表此次訓(xùn)練樣本中包含周末銷量,能夠幫助網(wǎng)絡(luò)調(diào)整權(quán)重,5 組輸入數(shù)據(jù)相鄰的兩組明顯偏高的數(shù)據(jù)或者邊緣1 組明顯偏高的數(shù)據(jù)即為周末銷量;當(dāng)“周末因子”為0 時(shí),代表此次訓(xùn)練樣本均為工作日銷量.

電商平臺(tái)中某商品的銷量與該商品鏈接的點(diǎn)擊量有直接關(guān)系,模型輸入中應(yīng)包含該商品的歷史銷量、歷史點(diǎn)擊量和“周末因子”.因此,單個(gè)BPN 弱預(yù)測(cè)器一共有11 個(gè)輸入節(jié)點(diǎn),3 個(gè)輸出節(jié)點(diǎn),共設(shè)置兩層隱含層,第一層隱含層采用tansig 函數(shù)作為傳遞函數(shù),第二層隱含層采用pureline 函數(shù)作為傳遞函數(shù),經(jīng)過大量的訓(xùn)練測(cè)試,隱含層節(jié)點(diǎn)數(shù)分別為13和3 時(shí),模型的訓(xùn)練效果最佳,訓(xùn)練次數(shù)為1000 次時(shí),網(wǎng)絡(luò)計(jì)算精度可以達(dá)到0.01.加入“周末因子”的AdaBoost-BPN 短期銷量預(yù)測(cè)模型中單個(gè)BPN 弱預(yù)測(cè)器的結(jié)構(gòu)如圖4所示.

圖4 單個(gè)BPN 弱預(yù)測(cè)器結(jié)構(gòu)圖

3 短期銷量預(yù)測(cè)實(shí)驗(yàn)

實(shí)驗(yàn)數(shù)據(jù)取自某電商商家2019年第三、四季度LMAZ-CG1520 型號(hào)牛仔褲的歷史銷量數(shù)據(jù)和歷史點(diǎn)擊量數(shù)據(jù),其中有效數(shù)據(jù)段共184 條,采用7、8、9、10、11月份的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,數(shù)據(jù)段共153 條,有效訓(xùn)練樣本149 組.12月份數(shù)據(jù)作為測(cè)試數(shù)據(jù)集,數(shù)據(jù)段共31 條.分別采用普通BPN 弱預(yù)測(cè)器、AdaBoost-BPN 預(yù)測(cè)模型和加入“周末因子”的AdaBoost-BPN 預(yù)測(cè)模型進(jìn)行銷量預(yù)測(cè)實(shí)驗(yàn),預(yù)測(cè)結(jié)果采用預(yù)測(cè)誤差進(jìn)行評(píng)價(jià).圖5為不同模型的銷量預(yù)測(cè)測(cè)試結(jié)果,以及預(yù)測(cè)結(jié)果與真實(shí)數(shù)據(jù)的對(duì)比.圖5中不同預(yù)測(cè)模型的預(yù)測(cè)曲線表明,加入“周末因子”的AdaBoost-BPN 預(yù)測(cè)模型的預(yù)測(cè)曲線與實(shí)際銷量的重合度最高,沒有加入“周末因子”的AdaBoost-BPN 預(yù)測(cè)模型表現(xiàn)稍差,而只用一個(gè)普通的BPN 弱預(yù)測(cè)器的預(yù)測(cè)結(jié)果偏差很大.

表1為不同模型的平均預(yù)測(cè)誤差對(duì)比.由表1結(jié)果分析,采用普通BPN 弱預(yù)測(cè)器的誤差遠(yuǎn)遠(yuǎn)大于AdaBoost-BPN 預(yù)測(cè)模型的誤差,說(shuō)明基于AdaBoost 思想集合多個(gè)BPN 弱預(yù)測(cè)器結(jié)果能夠提升預(yù)測(cè)的準(zhǔn)確率;AdaBoost-BPN 預(yù)測(cè)模型與普通BPN 弱預(yù)測(cè)器相比,預(yù)測(cè)效果得到了較為明顯的提升,但是由于沒有考慮“周末效應(yīng)”,一些特殊的樣本數(shù)據(jù)拉低了整體的預(yù)測(cè)效果;AdaBoost-BPN 預(yù)測(cè)模型在添加了“周末因子”后,平均預(yù)測(cè)誤差明顯降低,可以達(dá)到20%以內(nèi),預(yù)測(cè)效果得到了極大的提升.

圖5 銷量預(yù)測(cè)測(cè)試結(jié)果

表1 不同模型平均預(yù)測(cè)誤差對(duì)比(%)

本文在建立時(shí)間軸時(shí),考慮到電商銷量的“周末效應(yīng)”,確定的觀測(cè)時(shí)間窗跨度為5 天,為了探究選取的觀測(cè)時(shí)間窗跨度對(duì)預(yù)測(cè)效果的影響,采用加入“周末因子”的AdaBoost-BPN 預(yù)測(cè)模型,將歷史時(shí)間窗跨度分別設(shè)置為3、4、5、6、7 再次進(jìn)行預(yù)測(cè)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表2所示.

表2 不同時(shí)間窗平均預(yù)測(cè)誤差對(duì)比(%)

由表2結(jié)果分析,觀測(cè)時(shí)間窗跨度為3和4 時(shí),樣本數(shù)據(jù)隱藏的信息量不足,而且預(yù)測(cè)時(shí)間窗為3 天,理論上觀測(cè)時(shí)間窗應(yīng)大于預(yù)測(cè)時(shí)間窗,較短的觀測(cè)時(shí)間窗跨度無(wú)法準(zhǔn)確體現(xiàn)銷量變化特征,因此平均預(yù)測(cè)誤差相對(duì)較大;觀測(cè)時(shí)間窗跨度為6和7 時(shí),本文所建立的“周末因子”形同虛設(shè),模型無(wú)法準(zhǔn)確反映“周末效應(yīng)”帶來(lái)的影響,因此平均預(yù)測(cè)誤差偏大;只有觀測(cè)時(shí)間窗跨度5 時(shí),預(yù)測(cè)模型發(fā)揮出最良好的預(yù)測(cè)能力,同時(shí)證明了“周末因子”的加入可以有效提升預(yù)測(cè)的準(zhǔn)確度.

4 結(jié)論

在電商行業(yè)迅速發(fā)展的大背景下,本文針對(duì)目前已有的商品銷量預(yù)測(cè)模型預(yù)測(cè)誤差大、無(wú)法滿足商家對(duì)行情變化的迅速應(yīng)變的問題,提出了一種電子商務(wù)會(huì)計(jì)系統(tǒng)中的短期銷量預(yù)測(cè)模型.該模型以日銷量作為預(yù)測(cè)基本單位,采用近5 天的銷量數(shù)據(jù)和點(diǎn)擊量數(shù)據(jù)對(duì)未來(lái)3 天的銷量變化情況進(jìn)行預(yù)測(cè).借鑒AdaBoost思想集合多個(gè)BPN 弱預(yù)測(cè)器形成強(qiáng)預(yù)測(cè)器,提高預(yù)測(cè)準(zhǔn)確率.提出合理的日銷量預(yù)測(cè)的時(shí)間軸設(shè)計(jì)方法,根據(jù)電商產(chǎn)品銷量的變化特性為預(yù)測(cè)模型添加“周末因子”,使預(yù)測(cè)模型具備辨識(shí)“周末效應(yīng)”的能力.實(shí)驗(yàn)測(cè)試結(jié)果表明,加入“周末因子”的AdaBoost-BPN 預(yù)測(cè)模型平均預(yù)測(cè)誤差在20%以內(nèi),能夠有效預(yù)測(cè)未來(lái)短期內(nèi)的銷量變化情況,對(duì)電商企業(yè)及時(shí)掌握產(chǎn)品銷售情況,并對(duì)短期內(nèi)存在的銷售風(fēng)險(xiǎn)制訂及時(shí)有效的應(yīng)對(duì)措施具有重要的意義.

猜你喜歡
誤差因子樣本
一類常微分方程的解法研究
山藥被稱“長(zhǎng)壽因子”
規(guī)劃·樣本
隧道橫向貫通誤差估算與應(yīng)用
隧道橫向貫通誤差估算與應(yīng)用
直徑不超過2的無(wú)爪圖的2—因子
巧解難題二則
隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
精確與誤差
基于支持向量機(jī)的測(cè)厚儀CS值電壓漂移故障判定及處理
山东| 保德县| 塔河县| 文水县| 腾冲县| 扎囊县| 黑水县| 黑龙江省| 江孜县| 东光县| 济源市| 泾阳县| 灵璧县| 雅江县| 江孜县| 古浪县| 屏山县| 运城市| 凌海市| 绍兴市| 磐石市| 游戏| 尼玛县| 旺苍县| 天门市| 正定县| 剑川县| 惠安县| 密山市| 剑河县| 巢湖市| 共和县| 泗洪县| 盈江县| 根河市| 大埔县| 屯门区| 凌海市| 阳原县| 锦屏县| 玉溪市|