国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于亞馬遜連衣裙銷售策略的商務智能研究

2018-01-20 15:04王志慧王夢華李森
市場周刊 2018年3期
關鍵詞:數(shù)據挖掘

王志慧 王夢華 李森

摘 要:眾所周知,連衣裙受到女性追捧。連衣裙不僅在夏季流行,而且在其他季節(jié)都成為時尚,占據了主要市場。文章旨在利用數(shù)據挖掘技術挖掘連衣裙數(shù)據,從而產生關于連衣裙數(shù)據的真知灼見,提供有價值的商業(yè)信息進行商務智能研究。首先,采用聚類方法尋找最佳連衣裙銷售策略。其次,運用統(tǒng)計方法研究連衣裙屬性之間的關系。例如,連衣裙的風格和銷售之間存在的關系,最后,分類模型將被用來指示顧客是否可以推薦一件連衣裙。

關鍵詞:數(shù)據挖掘;商務智能;分類模型

中圖分類號:F713.50 ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A ? ? ? ? ? ? ? 文章編號:1008-4428(2018)03-74 ?-03

一、數(shù)據獲取與預處理

(一)問題提出

在信息化時代,企業(yè)數(shù)據量正在飛速增長。作為企業(yè)的寶貴資源的數(shù)據庫,卻沒有被大多數(shù)企業(yè)充分深入地利用。商務智能幫助企業(yè)利用數(shù)據,將數(shù)據轉換為有價值的信息,從信息中獲得知識,做出更明智的決策。

分析這一主題對設計師和賣家具有重要意義,我們將使用來自www.ics.uci.edu的二手數(shù)據分析銷售數(shù)量和不同屬性之間的關系,具體如下:多種屬性中,什么屬性最有助于銷售?客戶會推薦什么樣的裙子?

在本課題中,數(shù)據挖掘目標包括:

A1:使用聚類來找出哪些屬性對銷售貢獻最大。

A2:使用統(tǒng)計方法總結變量,找出一些重要變量之間的關系。

B:使用決策樹、回歸和神經網絡來確定這條裙子是否會被推薦。

(二)數(shù)據描述

該數(shù)據集包含關于裙子的兩個文檔,這兩個文檔結合的獨特功能是裙子ID。一份列出了不同日期的銷售金額,另一份是裙子的不同屬性。我們將這兩個文檔合并為一個數(shù)據集。因此,形成 14個獨立變量,分別是款式、價格、等級、尺碼、季節(jié)、領口、袖扣、腰圍、材質、制作、裝飾、圖案類型、銷售和推薦。

二、商品屬性分析

(一)利用聚類分析方法進行屬性分析

我們可以利用數(shù)據進行分割現(xiàn)有數(shù)據,不同的屬性可以提供更廣闊的視野。聚類分析是我們分割數(shù)據的有用工具。在商店的主頁上推薦這些裙子,或者在購物中心里放置模特,吸引女性的注意力。

1. 數(shù)據處理

對于“哪些屬性對銷售貢獻最大”的問題,我們創(chuàng)建了數(shù)據源并刪除了一些無用的屬性:評級、季度、大小和推薦,這些都與銷售有正相關關系。我們把銷售額設為目標,輸入數(shù)據集的變量的統(tǒng)計特性。在這一步中生成的結果將給我們一個在這個數(shù)據集最有用的預測目標響應。

因此,我們使用StatExplore節(jié)點和MultiPlot節(jié)點來幫助我們探索數(shù)據集。

2.分析結果

然后我們使用SAS Enterprise Mining進行集群,集群的數(shù)量自動設置為8。

根據結果,我們發(fā)現(xiàn),自然的腰線、休閑的款式、無袖的袖衫、O領口和棉質裙子在第六部門中都有更好的銷售。然而,在第一部分,高腰圍、休閑風格和O領口賣得更多。而在第五部分,可愛款式、肩帶裝飾和立體款式都賣得更好。

(二)利用統(tǒng)計理論進行屬性關聯(lián)分析

使用統(tǒng)計方法,我們尋找裝飾與銷售、材料與銷售、領口與銷售、款式與銷售、腰圍與銷售、袖長與銷售、款式與銷售、價格與銷售之間的關系。

三、模型建立與結果分析

在分類分析方面,將使用決策樹、回歸和神經網絡三種模型來預測問題“是否推薦一件衣服”。

(一)決策樹模型

1.數(shù)據選擇與決策樹生成

我們首先將建議設定為目標,并設置角色為序數(shù),并拒絕評級和銷售。通過數(shù)據分區(qū)節(jié)點將原始數(shù)據劃分為培訓和驗證集。添加數(shù)據分區(qū)的值,訓練結果和驗證結果為65和35,測試結果為0。我們注意到,2、4個葉片錯誤率最低,4個葉片均為最小均方誤差。因此,我們使用了4的最大分支數(shù)。

2.結果分析

從決策樹,根據季節(jié)、風格、袖長和面料類型將首先被顧客考慮是否推薦。

決策樹描述了模型分析輸出結果,分析是通過分裂的方式進行的。在圖的上部是決策樹模型的根結點,包含了所有的可能的觀測數(shù)據,根結點中處于中間列出了訓練數(shù)據總共為324個,41.98%可信任(推薦),而58.02%不可信任(不推薦),處于右側的數(shù)據是驗證數(shù)據結果,共有20個驗證數(shù)據,其中42.08%可信任(推薦),而57.92%不可信任(不推薦)。在過程的進一步,數(shù)據被分成了兩組——是否是春天,根據變量級別值,這個變量是最能區(qū)分的變量。如果是春天,左側觀測數(shù)據78條記錄中有58.97%的記錄是可信的;如果是夏天、秋天或者冬天,右側246條觀測記錄中36.59%的客戶記錄是可信的。接著對于選用變量VALUE,進行下一步劃分。以DELINQ變量進行下一步劃分。如果春天下風格可愛,右側100%可信任(推薦);其他風格看第三層左側,52.24%可信任(推薦)。第三層第二個結點在這一步停止。第二層第二個節(jié)點——夏秋冬,對袖長屬性進行劃分,屬性為無袖或者長袖或者其他的,180個觀測值中有41.67%可信任;如果是短袖,66個觀測值中有22.72%可信任(推薦)。如果是短袖,繼續(xù)分類,如果是織物類型,19個觀察值有12.82%可信任;如果是雪紡類型的,27個27.04%可信任,觀測值最終到達葉子結點。

(二)回歸分析的概述

選擇回歸節(jié)點,檢查屬性并選擇stepwise作為選擇模型。

我們可以得出結論,最重要的是季節(jié)和價格。此外,春季和中期價格也同樣被認為是很重要的推薦依據。嘗試不推薦的季節(jié)和價格變量中,比較哪些貢獻對推薦的產品有重要影響,我們發(fā)現(xiàn)風格是非常值得推薦的依據,建議如下結果:

(三)神經網絡

分析樹模型后,我們使用了節(jié)點模型來比較它們的性能。概要統(tǒng)計信息比較:

由于這種情況下的預測類型是決策,所以錯誤分類應該作為模型性能指標。如上述分析結果所示,回歸對驗證和訓練數(shù)據的誤分類率最低。因此,回歸模型是基于誤分類率的最佳模型。

四、 結論

基于以上模型分析,我們可以解決提出的兩個問題:自然的腰身、休閑的款式、無袖款、O領口、棉料、純色型和均價位的裙子比其他的裙子賣得多。而春季和中等價位的裙子比其他的裙子更受推薦。這樣的推薦有助于吸引更多的顧客,提供更大的銷量。

商務智能(BI)作為一種概念和工具,在學科領域,尤其在戰(zhàn)略管理學科以及信息管理學科被廣泛地重視和強調。BI是獲取和分析從多個渠道所收集的數(shù)據的一種應用工具和過程,使用BI工具還能夠通過管理組織企業(yè)業(yè)績來提高企業(yè)利潤以及通過整合過去的成功經驗來獲得競爭優(yōu)勢。

隨著大數(shù)據時代的到來,存儲技術的提高,相關終端營銷的數(shù)據會越來越多,目前的商務智能技術和數(shù)據倉庫的構建將無法滿足大數(shù)據時代的數(shù)據處理要求,需要更多的擴展研究。

參考文獻:

[1]魏慧娟,戴牡紅,寧勇余.基于最近鄰居聚類的協(xié)同過濾推薦算法[J].中國科學技術大學學報,2016,46(09):736-742.

[2]楊鳳萍. 基于神經網絡集成和用戶偏好模型的協(xié)同過濾推薦算法研究[D].華中師范大學,2016.

[3]PHUSIT KANCHANATRIPOP(羅邦弘). 商務智能與大數(shù)據的系統(tǒng)化文獻調研[D].廣西師范大學,2016.

[4]黃濤. 基于神經網絡的個性化推薦算法研究與設計[D].重慶大學,2016.

[5]孟婷婷. 終端營銷系統(tǒng)中的商務智能與市場感知[D].浙江理工大學,2016.

[6]高輝. 幾類常用非線性回歸分析中最優(yōu)模型的構建與SAS智能化實現(xiàn)[D].中國人民解放軍軍事醫(yī)學科學院,2012.

[7]張玉嵐,曹慧敏,蔣玉潔,蔡忠民.SAS軟件在果樹試驗數(shù)據系統(tǒng)聚類分析中的應用[J].遼寧農業(yè)職業(yè)技術學院學報,2009,11(3):8-10.

[8]趙華生. 基于SAS數(shù)據挖掘的C2C信用評價研究[D].西南財經大學,2009.

[9]Moro S, Cortez P, Rita P. Business intelligence in banking: A literature analysis from 2002 to 2013 using text mining and latent Dirichlet allocation[J]. Expert Systems with Applications, 2015, 42(3):1314-1324.

[10]Bodislav D A. Transferring business intelligence and big data analysis from corporations to governments as a hybrid leading indicator[J]. Theoretical & Applied Economics, 2015, XXII.

作者簡介:

王志慧,女,江蘇泰州人,南京財經大學管理科學與工程學院碩士,研究方向:管理信息系統(tǒng);

王夢華,女,河南周口人,南京財經大學管理科學與工程學院碩士,研究方向:管理信息系統(tǒng);

李森,男,江蘇淮安人,南京財經大學管理科學與工程學院碩士,研究方向:管理信息系統(tǒng)。

猜你喜歡
數(shù)據挖掘
近十年國內教育數(shù)據挖掘領域的應用技術分析
數(shù)據挖掘技術在內河航道維護管理中的應用研究
數(shù)據挖掘技術在物流企業(yè)中的應用
數(shù)據挖掘過程模型及創(chuàng)新應用
數(shù)據挖掘綜述
軟件工程領域中的異常數(shù)據挖掘算法
基于R的醫(yī)學大數(shù)據挖掘系統(tǒng)研究
電子政務中基于云計算模式的數(shù)據挖掘研究
數(shù)據挖掘創(chuàng)新應用
數(shù)據挖掘的系統(tǒng)構成與發(fā)展趨勢
财经| 阿坝县| 巴彦淖尔市| 抚宁县| 于田县| 长垣县| 河北区| 周口市| 巩留县| 四川省| 台中市| 绥棱县| 灌阳县| 崇州市| 青神县| 兰坪| 睢宁县| 建阳市| 建瓯市| 石城县| 都江堰市| 五华县| 双峰县| 青川县| 鲁山县| 兰考县| 平阳县| 河间市| 康定县| 平和县| 乌什县| 砀山县| 屏东县| 炉霍县| 介休市| 紫金县| 达尔| 鄂尔多斯市| 全州县| 天全县| 从化市|