黃毅能 吳旭東 多曉偉
基金項(xiàng)目:2019年江西省教育廳科學(xué)技術(shù)研究項(xiàng)目“數(shù)據(jù)挖掘技術(shù)在電商平臺(tái)中的應(yīng)用——以陶瓷餐具的電商營(yíng)銷(xiāo)為例”(項(xiàng)目編號(hào):191300)
摘 要:本文通過(guò)與淘寶后臺(tái)核心經(jīng)營(yíng)數(shù)據(jù)進(jìn)行分行析,使用生意參謀工具,在數(shù)據(jù)中心進(jìn)行數(shù)據(jù)對(duì)接。利用數(shù)據(jù)挖掘的若干重要分析方法,抽取核心經(jīng)營(yíng)數(shù)據(jù)進(jìn)行分析。對(duì)兩個(gè)月60天的數(shù)據(jù)進(jìn)行分析,通過(guò)關(guān)聯(lián)規(guī)則分析、神經(jīng)網(wǎng)絡(luò)兩種算法對(duì)淘寶核心數(shù)據(jù)進(jìn)行分析,建立了經(jīng)營(yíng)預(yù)警機(jī)制,進(jìn)而為提高店鋪經(jīng)營(yíng)提供一些參考性的建議。
關(guān)鍵詞:數(shù)據(jù)挖掘;陶瓷餐具;電商平臺(tái)
本文以淘寶電商平臺(tái)陶瓷餐具店鋪真實(shí)銷(xiāo)售數(shù)據(jù)為,專(zhuān)門(mén)針對(duì)陶瓷餐具的銷(xiāo)售歷史原始數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘分析。對(duì)數(shù)據(jù)進(jìn)行檢測(cè)、篩選、抽取、整理。然后,利用SPSS clementine數(shù)據(jù)挖掘軟件建立樣本模型、測(cè)試樣本數(shù)據(jù)等一系列數(shù)據(jù)挖掘工作;其中重點(diǎn)運(yùn)用數(shù)據(jù)挖掘中常見(jiàn)的算法進(jìn)行建模,找出適合陶瓷餐具電商銷(xiāo)售的算法并加以分析。如圖1陶瓷餐具電商銷(xiāo)售數(shù)據(jù)挖掘詳細(xì)流程圖
一、關(guān)聯(lián)規(guī)則分析
(一)數(shù)據(jù)預(yù)處理
通過(guò)相關(guān)軟件把淘寶店鋪銷(xiāo)售數(shù)據(jù)下載下來(lái),先對(duì)數(shù)據(jù)進(jìn)行前期的整理,然后將數(shù)據(jù)預(yù)處理,對(duì)數(shù)據(jù)離散化和抽象化處理,從而能更好的符合關(guān)聯(lián)數(shù)據(jù)挖掘模型。在開(kāi)展數(shù)據(jù)挖掘之前,需要將購(gòu)買(mǎi)商品的子類(lèi)目以及購(gòu)買(mǎi)金額。商品的類(lèi)目按數(shù)據(jù)表中的順序依次映射成為英語(yǔ)字母A-餐具籠/架、B-碟、C-瓶/罐、D-盤(pán)、E-餐具瓷器套裝、F-果盆/果盤(pán)/果籃、G-餐墊等;經(jīng)過(guò)處理以后如表1所示。
(二)實(shí)驗(yàn)過(guò)程與分析
對(duì)顧客購(gòu)買(mǎi)數(shù)據(jù)進(jìn)行離散化處理,通過(guò)類(lèi)型選擇集合,數(shù)據(jù)挖掘的核心算法采用GRI關(guān)聯(lián)規(guī)則算法,其中的支持度設(shè)置為50%,置信度設(shè)置為60%。數(shù)據(jù)挖掘結(jié)果如圖3所示:
規(guī)則1中顯示,購(gòu)買(mǎi)餐墊和瓶/罐的客戶(hù)占52%,其中購(gòu)買(mǎi)餐墊同時(shí)有76.92%的顧客購(gòu)買(mǎi)了瓶/罐。
規(guī)則2中顯示,購(gòu)買(mǎi)餐墊和餐具瓷器套裝的客戶(hù)占53%,其中購(gòu)買(mǎi)餐墊同時(shí)有75.47%的顧客購(gòu)買(mǎi)了餐具瓷器套裝。
規(guī)則3中顯示,購(gòu)買(mǎi)餐具瓷器套裝和瓶/罐的客戶(hù)占52%,其中購(gòu)買(mǎi)餐具瓷器套裝的同時(shí)有71.15%購(gòu)買(mǎi)瓶/罐。
規(guī)則4中顯示,購(gòu)買(mǎi)瓶/罐和餐具瓷器套裝的客戶(hù)占53%,其中購(gòu)買(mǎi)瓶/罐的同時(shí)有69.81%購(gòu)買(mǎi)餐具瓷器。
規(guī)則5顯示,購(gòu)買(mǎi)果盆/果盤(pán)/果籃和盤(pán)的客戶(hù)占52%,其中購(gòu)買(mǎi)果盆/果盤(pán)/果籃同時(shí)有67.31%購(gòu)買(mǎi)盤(pán)。
二、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)
(一)神經(jīng)網(wǎng)絡(luò)算法
人工神經(jīng)網(wǎng)絡(luò)又稱(chēng)連接機(jī)模型,是一種無(wú)監(jiān)督的學(xué)習(xí),是現(xiàn)代神經(jīng)學(xué)、生物學(xué)、心理學(xué)的基礎(chǔ)上產(chǎn)生的一種算法模型,屬于無(wú)監(jiān)督學(xué)習(xí)的算法。是模擬生物神經(jīng)系統(tǒng)處理外界事物的基本過(guò)程,是在模擬人類(lèi)大腦的神經(jīng)組織發(fā)展起來(lái)的計(jì)算系統(tǒng)。包括大規(guī)模并行、分布式處理、自組織、自學(xué)習(xí)等優(yōu)點(diǎn),廣泛應(yīng)用于模式識(shí)別、語(yǔ)音分析、圖像識(shí)別、數(shù)字簽名、計(jì)算機(jī)視覺(jué)等很多領(lǐng)域,取得了許多豐碩的成果。1986年由Rinehart和McClelland科學(xué)共同提出,按誤差逆向傳播算法訓(xùn)練多層前饋網(wǎng)絡(luò),是目前較典型的神經(jīng)網(wǎng)絡(luò)算法之一。BP網(wǎng)絡(luò)能學(xué)習(xí)和存儲(chǔ)大量的輸入—輸出模式映射關(guān)系,不需要提前知道映射關(guān)系的數(shù)學(xué)方程。學(xué)習(xí)過(guò)程使用最快下降法,通過(guò)反向傳播來(lái)不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小。BP神經(jīng)網(wǎng)絡(luò)具有非線(xiàn)性映射能力、自學(xué)習(xí)和自適應(yīng)能力、泛化能力、容錯(cuò)能力等優(yōu)點(diǎn),國(guó)內(nèi)不少研究學(xué)者都對(duì)其進(jìn)行了重點(diǎn)研究,運(yùn)用網(wǎng)絡(luò)解決了許多領(lǐng)域的問(wèn)題。
BP神經(jīng)網(wǎng)絡(luò)的計(jì)算過(guò)程由正向計(jì)算過(guò)程和反向計(jì)算過(guò)程組成。正向傳播過(guò)程中,輸入模式從輸入層到隱含層單元層逐層處理,逐步轉(zhuǎn)向輸出層,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài)。如果不能得到期望的輸出結(jié)果則轉(zhuǎn)入反向傳播,將誤差信號(hào)沿原來(lái)的連接通路返回,通過(guò)調(diào)整各層神經(jīng)元的權(quán)值和閾值,把型號(hào)誤差調(diào)到最小。主要包括兩個(gè)步驟:第一步是網(wǎng)絡(luò)狀態(tài)初始化,第二步是前向計(jì)算過(guò)程。BP網(wǎng)絡(luò)主要應(yīng)用在以下四個(gè)方面:
1.函數(shù)逼近:輸入向量和輸出向量訓(xùn)練出對(duì)應(yīng)的網(wǎng)絡(luò)模型逼近指定的函數(shù)。
2.模式識(shí)別:用指定的輸出向量于輸入向量進(jìn)行關(guān)聯(lián),訓(xùn)練特定的模型。
3.分類(lèi):把一些向量按著一定的規(guī)則進(jìn)行分類(lèi)。
4.數(shù)據(jù)壓縮:減少輸出向量的維度,方便傳輸和存儲(chǔ)。
(二)實(shí)驗(yàn)過(guò)程
利用BP神經(jīng)網(wǎng)絡(luò)算法構(gòu)建模型,對(duì)準(zhǔn)備好的數(shù)據(jù)進(jìn)行挖掘,對(duì)數(shù)據(jù)源的各個(gè)字段類(lèi)型進(jìn)行合適的設(shè)置。利用支付轉(zhuǎn)化率、訪(fǎng)客數(shù)、成功退款金額、作為輸入項(xiàng),借閱量作為輸出量。如圖5、圖6所示。
訓(xùn)練樣本共60條,支付轉(zhuǎn)化率、訪(fǎng)客數(shù)、成功退款金額、直通車(chē)消耗、老買(mǎi)家支付金額、淘寶客傭金、客單價(jià)和支付件數(shù)8個(gè)字段作為輸入層,輸入層包括8個(gè)神經(jīng)元,隱藏層包括3個(gè)神經(jīng)元,輸出層包括1個(gè)神經(jīng)元為支付金額。建立BP神經(jīng)網(wǎng)絡(luò)模型,預(yù)測(cè)后10天的支付金額,假設(shè)后10天的支付金額是未知的,通過(guò)比較預(yù)測(cè)值與真實(shí)值的誤差,結(jié)果預(yù)測(cè)的準(zhǔn)確率比較高為82.519%。
利用神經(jīng)網(wǎng)絡(luò)建立淘寶店鋪經(jīng)營(yíng)預(yù)警機(jī)制。如圖7所示,輸入店鋪核心經(jīng)營(yíng)數(shù)據(jù),利用事先建立好的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)支付金額,如果預(yù)測(cè)值與實(shí)際值的誤差在20%以?xún)?nèi),則說(shuō)明正常,如果誤差超過(guò)了20%,則開(kāi)始預(yù)警,表示淘寶店鋪經(jīng)營(yíng)數(shù)據(jù)異常,需要認(rèn)真分析查找原因,首先查詢(xún)?nèi)粘:诵臄?shù)據(jù),找出原因后,再調(diào)整店鋪商品的擺放、定價(jià)、店鋪的裝修以及詳情頁(yè)的設(shè)計(jì)等。
結(jié)束語(yǔ):
本文從淘寶網(wǎng)店的購(gòu)買(mǎi)記錄出發(fā),通過(guò)發(fā)掘歷史數(shù)據(jù),建立一些典型的數(shù)據(jù)挖掘分析法模型得出了一些有趣的結(jié)論。
1.使用關(guān)聯(lián)規(guī)則分析,發(fā)現(xiàn)了一些有趣的規(guī)律即:陶瓷餐具的某些產(chǎn)品存在著密切的關(guān)系。算通過(guò)規(guī)律合理安排陶瓷網(wǎng)店中商品的上架排布,商品的定價(jià)策略等。
2.利用神經(jīng)網(wǎng)絡(luò)法預(yù)測(cè)出未來(lái)淘寶網(wǎng)店的銷(xiāo)售數(shù)據(jù),并在此基礎(chǔ)上建立了淘寶網(wǎng)店的預(yù)警機(jī)制。
參考文獻(xiàn):
[1]朱沙.電子商務(wù)中計(jì)算機(jī)WEB數(shù)據(jù)挖掘技術(shù)的應(yīng)用分析[J].商場(chǎng)現(xiàn)代化,2018(23):34-35.
[2]李濤,曾春秋,周武柏,等.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘——從應(yīng)用的角度看大數(shù)據(jù)挖掘[J].大數(shù)據(jù),2015(04):1-24.
[3]李楠楠.大數(shù)據(jù)挖掘技術(shù)在電子商務(wù)企業(yè)營(yíng)銷(xiāo)中的應(yīng)用研究[J].全國(guó)流通經(jīng)濟(jì),2019(8):16-17.
[4]方晶晶、劉佳峰.數(shù)據(jù)挖掘技術(shù)在企業(yè)服務(wù)中的應(yīng)用與研究[J].電腦編程技巧與維護(hù).2020(06):105-107.