趙梓賀,徐慧智 (東北林業(yè)大學(xué) 交通學(xué)院,黑龍江 哈爾濱 150040)
在“互聯(lián)網(wǎng)+”的時(shí)代,電子商務(wù)已漸漸融入了人們的日常生活。隨著消費(fèi)者在網(wǎng)絡(luò)購(gòu)物比例的提高,網(wǎng)絡(luò)銷(xiāo)售平臺(tái)的數(shù)量也越來(lái)越多。消費(fèi)者日益多樣化和個(gè)性化的需求,使企業(yè)間競(jìng)爭(zhēng)更加激烈,電商進(jìn)入精細(xì)化運(yùn)營(yíng)階段。為了及時(shí)地把握市場(chǎng)需求變化,合理地規(guī)劃有限的資源,基于網(wǎng)銷(xiāo)商品全平臺(tái)的銷(xiāo)量預(yù)測(cè)已成為研究的熱點(diǎn)。
國(guó)內(nèi)外學(xué)者對(duì)此開(kāi)展了相關(guān)研究,王建偉[1]提出了利用產(chǎn)品銷(xiāo)售共性提取產(chǎn)品聚類(lèi)簇的產(chǎn)品重分類(lèi)預(yù)測(cè)模型,王雪蓉等[2]通過(guò)分析銷(xiāo)量的可控關(guān)聯(lián)性進(jìn)行大數(shù)據(jù)挖掘,進(jìn)行動(dòng)態(tài)預(yù)測(cè),Juan R Trapero等[3]分析了促銷(xiāo)活動(dòng)中的銷(xiāo)量預(yù)測(cè),劉治、謝天保和曹永立等[4-6]利用網(wǎng)絡(luò)爬蟲(chóng)獲取評(píng)分、搜索數(shù)據(jù),對(duì)多種預(yù)測(cè)模型進(jìn)行比較分析,Jinlou Zhao等[7]提出了在線零售商之間的市場(chǎng)需求信息共享可以實(shí)現(xiàn)供應(yīng)鏈的增值,降低供應(yīng)商的庫(kù)存水平。Ching-Chin Chern、孟園等[8-9]從網(wǎng)絡(luò)口碑的角度促進(jìn)了銷(xiāo)售預(yù)測(cè)的研究,張鈉等[10]提出由于需求波動(dòng)較大,不同的訂貨周期應(yīng)采用不同的預(yù)測(cè)方法。Gro Kl?boe等[11]提出使用具有平衡狀態(tài)信息的模型進(jìn)行模擬預(yù)測(cè)。
綜上所述,商品銷(xiāo)量屬于商家內(nèi)部數(shù)據(jù),難以從網(wǎng)站上直接獲得,傳統(tǒng)的統(tǒng)計(jì)方法滯后于短時(shí)預(yù)測(cè)需求。區(qū)別于傳統(tǒng)銷(xiāo)售的銷(xiāo)量預(yù)測(cè),網(wǎng)絡(luò)數(shù)據(jù)具有實(shí)時(shí)性。電商發(fā)售平臺(tái)逐漸增多,各平臺(tái)之間數(shù)據(jù)不能充分共享,根據(jù)各平臺(tái)的實(shí)時(shí)銷(xiāo)售數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘具有現(xiàn)實(shí)的應(yīng)用意義,能夠?qū)ι唐返娜脚_(tái)銷(xiāo)售量有總體把握。
本文統(tǒng)計(jì)了電商平臺(tái)產(chǎn)品評(píng)價(jià)數(shù)量,為解決評(píng)價(jià)與實(shí)際銷(xiāo)售量存在時(shí)間遲滯的現(xiàn)象,設(shè)計(jì)了用戶調(diào)查問(wèn)卷,獲取用戶的評(píng)價(jià)延遲期,據(jù)此推算平臺(tái)銷(xiāo)售數(shù)據(jù)。采用時(shí)間序列分解法進(jìn)行短期預(yù)測(cè),及時(shí)掌握商品的銷(xiāo)售動(dòng)態(tài)。
選取五款網(wǎng)絡(luò)熱銷(xiāo)手機(jī)商品,統(tǒng)計(jì)網(wǎng)絡(luò)銷(xiāo)售平臺(tái)每天的評(píng)價(jià)數(shù)量(實(shí)時(shí)獲取最近1 000條評(píng)價(jià),約為1周的銷(xiāo)售量數(shù)據(jù))。
為了增加數(shù)據(jù)樣本數(shù)量,對(duì)商品評(píng)價(jià)數(shù)量進(jìn)行了追蹤記錄,具體統(tǒng)計(jì)時(shí)段為2018年8月30日到11月1日。圖1為統(tǒng)計(jì)結(jié)果。
為統(tǒng)計(jì)顧客評(píng)價(jià)延遲期,設(shè)計(jì)了調(diào)查問(wèn)卷。問(wèn)卷采取網(wǎng)絡(luò)發(fā)放的形式,共獲得反饋問(wèn)卷250份,經(jīng)過(guò)篩選,有效問(wèn)卷218份,有效率為87.2%。調(diào)查問(wèn)卷樣式見(jiàn)表1。
圖1 產(chǎn)品評(píng)價(jià)數(shù)量統(tǒng)計(jì)圖
為驗(yàn)證問(wèn)卷調(diào)查獲取數(shù)據(jù)的可信度,對(duì)調(diào)查問(wèn)卷進(jìn)行信度分析,相關(guān)系數(shù)計(jì)算見(jiàn)公式(1)。
其中,K為問(wèn)題數(shù);為第i題得分方差;為總分的方差。
表2為信度系數(shù)的取值范圍。經(jīng)計(jì)算問(wèn)卷信度系數(shù)0.71(信度系數(shù)在0.7<α≤0.9),認(rèn)為該問(wèn)卷結(jié)果為“很可信”,測(cè)驗(yàn)結(jié)果穩(wěn)定可靠,詳見(jiàn)表3至表6。
表2 信度系數(shù)的取值范圍
表3 可靠性統(tǒng)計(jì)量
表4 摘要項(xiàng)統(tǒng)計(jì)量
表5 信度分析表
表6 項(xiàng)間相關(guān)性矩陣
根據(jù)調(diào)查問(wèn)卷的問(wèn)題7,獲得被調(diào)查者的評(píng)價(jià)延遲期,見(jiàn)表7。
表7 評(píng)價(jià)延遲期
根據(jù)調(diào)查問(wèn)卷的結(jié)果對(duì)產(chǎn)品評(píng)價(jià)數(shù)量的數(shù)據(jù)進(jìn)行處理。默認(rèn)商品為次日達(dá),配送時(shí)間為一天。則每天的產(chǎn)品銷(xiāo)量等于經(jīng)過(guò)不同的評(píng)價(jià)延遲期后的評(píng)價(jià)數(shù)總和,見(jiàn)公式(2)。
其中,Vi為第i天的銷(xiāo)量,Mi為第i天的評(píng)價(jià)數(shù)。
根據(jù)公式(2) 得到商品8月29日到10月17日的銷(xiāo)售量(8月29日到10月10日用于構(gòu)建時(shí)間序列預(yù)測(cè)模型,10月11日至10月17日用于驗(yàn)證模型有效性)。圖2(a) 至圖2(e) 分別為P20 pro、nove3、nove3e、mate10、暢享8等5種商品評(píng)價(jià)數(shù)與銷(xiāo)量的對(duì)比圖。
圖2 產(chǎn)品銷(xiāo)售量統(tǒng)計(jì)結(jié)果
選用乘法模式的時(shí)間序列對(duì)圖2數(shù)據(jù)進(jìn)行分解,見(jiàn)公式(3)。
其中,Xt為商品銷(xiāo)量,Tt為長(zhǎng)期趨勢(shì)因素,Ct為循環(huán)指數(shù),Zt為周期性指數(shù),It為隨機(jī)性因素。
采用移動(dòng)平均得到長(zhǎng)期趨勢(shì)因素和循環(huán)變動(dòng)因素,見(jiàn)公式(4)。
采用標(biāo)準(zhǔn)差作為指標(biāo),確定合理移動(dòng)步長(zhǎng)(比選N=3、N=4、N=5),分析結(jié)果見(jiàn)表8。
表8 移動(dòng)平均的標(biāo)準(zhǔn)差比
根據(jù)表5確定的合理步長(zhǎng)獲取移動(dòng)平均數(shù)列,圖3(a) 至圖3(e) 為P20 pro、nove3、nove3e、mate10、暢享8等5種商品銷(xiāo)量與移動(dòng)平均值的對(duì)比。
圖3 商品銷(xiāo)量與移動(dòng)平均值的對(duì)比圖
將觀察值除以移動(dòng)平均得到數(shù)據(jù)的周期性和隨機(jī)性,見(jiàn)公式(5)。
圖4(a) 至圖4(e) 為P20 pro、nove3、nove3e、mate10、暢享8等5種商品周期性和隨機(jī)性。
圖4 周期性和隨機(jī)性
以1周為周期,通過(guò)累加平均消除隨機(jī)影響,得到周期性指數(shù),見(jiàn)公式(6)。
其中,ri為每周同一天的平均數(shù),為總平均數(shù)。
表9為計(jì)算得到的各產(chǎn)品周期指數(shù)。
表9 各產(chǎn)品的周期指數(shù)
利用趨勢(shì)外推法求出長(zhǎng)期趨勢(shì)Tt,將循環(huán)變動(dòng)和長(zhǎng)期趨勢(shì)分離開(kāi)來(lái),結(jié)果見(jiàn)圖5。
根據(jù)公式(7) 得到循環(huán)變動(dòng)因子Ct,P20 pro、nove3、nove3e、mate10、暢享8等5種商品的循環(huán)變動(dòng)因子變化圖如圖6(a) 至圖6(e) 所示。
圖5 長(zhǎng)期趨勢(shì)圖
圖6 循環(huán)變動(dòng)因子
對(duì)第7周,即10月10日到10月17日1周的銷(xiāo)售量進(jìn)行預(yù)測(cè)。循環(huán)因子Ct變動(dòng)周期較長(zhǎng),隨機(jī)性It無(wú)法直接進(jìn)行預(yù)測(cè),因此Ct與It忽略不計(jì),只考慮周期與趨勢(shì)Zt×Tt的影響,趨勢(shì)計(jì)算結(jié)果見(jiàn)表10。
表10 長(zhǎng)期趨勢(shì)預(yù)測(cè)值
計(jì)算長(zhǎng)期趨勢(shì)預(yù)測(cè)值與周期指數(shù)的乘積,得到最終的預(yù)測(cè)結(jié)果,計(jì)算結(jié)果見(jiàn)表11。
為了驗(yàn)證預(yù)測(cè)模型的可行性,將預(yù)測(cè)銷(xiāo)量與實(shí)際銷(xiāo)量進(jìn)行對(duì)比。見(jiàn)表12和圖7(a)至圖7(e)。
采用MAPE(平均絕對(duì)百分誤差) 來(lái)衡量預(yù)測(cè)是否可行,見(jiàn)公式(8) 至公式(9),MAPE評(píng)價(jià)參考表見(jiàn)表13,計(jì)算結(jié)果見(jiàn)表14。
表11 預(yù)測(cè)結(jié)果
表12 預(yù)測(cè)值與實(shí)際值的對(duì)比
圖7 預(yù)測(cè)值與實(shí)際銷(xiāo)量的對(duì)比圖
表13 MAPE評(píng)價(jià)參考表
表14 MAPE計(jì)算結(jié)果
其中,n為預(yù)測(cè)的項(xiàng)數(shù),Yi為第i項(xiàng)實(shí)際值,F(xiàn)i為第i項(xiàng)預(yù)測(cè)值。
結(jié)果表明5種商品的MAPE均小于10%認(rèn)為預(yù)測(cè)評(píng)價(jià)效果為“精確”,預(yù)測(cè)銷(xiāo)售量可以較好的擬合實(shí)際數(shù)據(jù)。
本文基于電商的網(wǎng)絡(luò)數(shù)據(jù)挖掘進(jìn)行商品銷(xiāo)售量的短期預(yù)測(cè),提出了通過(guò)記錄商品評(píng)價(jià)數(shù)量得到商品銷(xiāo)售量數(shù)據(jù)的方法,設(shè)計(jì)調(diào)查問(wèn)卷并進(jìn)行信度分析,提高了網(wǎng)絡(luò)數(shù)據(jù)的可信度?;谑占玫降木W(wǎng)絡(luò)數(shù)據(jù),運(yùn)用時(shí)間序列分解法分解出長(zhǎng)期趨勢(shì)及周期性變動(dòng)因素,得到數(shù)據(jù)的分布規(guī)律,根據(jù)數(shù)據(jù)的發(fā)展趨勢(shì)預(yù)測(cè)下一個(gè)周期的銷(xiāo)量。
對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),5種商品的MAPE(平均絕對(duì)百分誤差)均小于10%,短期預(yù)測(cè)值與實(shí)際銷(xiāo)量基本吻合,商品銷(xiāo)量的發(fā)展趨勢(shì)遵循長(zhǎng)期趨勢(shì)與周期指數(shù)。本文中收集電商網(wǎng)絡(luò)數(shù)據(jù)以及用時(shí)間序列分解法進(jìn)行預(yù)測(cè)的方法適用于對(duì)電商網(wǎng)絡(luò)全平臺(tái)商品銷(xiāo)售數(shù)據(jù)的獲取及統(tǒng)計(jì)分析,且方便快捷,具有一定的可信度,可以及時(shí)掌握商品在網(wǎng)絡(luò)全平臺(tái)的銷(xiāo)售動(dòng)態(tài)。