范苗苗 陸 穎 吳小丁
(吉林大學(xué)商學(xué)院)
?
營銷數(shù)據(jù)勘探的路徑構(gòu)建研究
范苗苗陸穎吳小丁
(吉林大學(xué)商學(xué)院)
提出了數(shù)據(jù)勘探的構(gòu)想,并構(gòu)建了“聚”、“分”、“組”三個階段的網(wǎng)店數(shù)據(jù)勘探路徑,在PVP語法規(guī)則下,以維度組合的方式構(gòu)造最終的數(shù)據(jù)語句,其中有挖掘意義的語句即可能是后續(xù)的數(shù)據(jù)挖掘方向。通過對網(wǎng)店企業(yè)數(shù)據(jù)的勘探與挖掘驗證了該數(shù)據(jù)勘探路徑的有效性,同時表明數(shù)據(jù)勘探能夠提高營銷數(shù)據(jù)挖掘的效率和挖掘方向的科學(xué)決策水平。
營銷大數(shù)據(jù); 數(shù)據(jù)勘探; 數(shù)據(jù)挖掘; 挖掘方向決策
大數(shù)據(jù)時代,數(shù)據(jù)將成為重要資源。在這樣的時代背景下,數(shù)據(jù)積累和數(shù)據(jù)挖掘應(yīng)用已成為企業(yè)經(jīng)營的重要部分。利用數(shù)據(jù)挖掘手段將市場營銷過程中產(chǎn)生的海量數(shù)據(jù)轉(zhuǎn)換成有價值的信息和知識,是營銷發(fā)展到現(xiàn)階段的必然要求。作為一種技術(shù)手段,數(shù)據(jù)挖掘在具體的實現(xiàn)過程中離不開人的參與,任何一種數(shù)據(jù)挖掘軟件在實現(xiàn)數(shù)據(jù)挖掘的過程中,都需要挖掘人員向計算機提供挖掘方向的指令,計算機執(zhí)行該指令并反復(fù)計算,最終得到數(shù)據(jù)挖掘結(jié)果。然而,當(dāng)前的企業(yè)數(shù)據(jù)挖掘存在的重要問題之一,是數(shù)據(jù)挖掘方向的決策多為經(jīng)驗判斷,直接影響了數(shù)據(jù)挖掘的效率和挖掘結(jié)果的科學(xué)性。初入數(shù)據(jù)挖掘領(lǐng)域的人很難憑經(jīng)驗做出正確的指令決策;而經(jīng)驗豐富的人因過分依賴經(jīng)驗很可能忽略數(shù)據(jù)資源中其他有價值的數(shù)據(jù)信息。
在數(shù)據(jù)挖掘之前,如果進行勘探,應(yīng)該可以減少盲目性、提高挖掘的效率。因此,本研究提出營銷數(shù)據(jù)勘探的構(gòu)想,并在此基礎(chǔ)上構(gòu)建可行的數(shù)據(jù)勘探路徑,其目的是提高數(shù)據(jù)挖掘方向決策的科學(xué)性,尋找到一條從經(jīng)驗決策到科學(xué)決策的途徑。
本研究以網(wǎng)店為研究對象,其中,網(wǎng)店特指B2C和C2C模式下的網(wǎng)店,是交易的賣方;買方特指個人消費者;商品特指有形商品。
1.1數(shù)據(jù)挖掘研究綜述
本研究利用中國知網(wǎng)、維普中文期刊全文數(shù)據(jù)庫、超星數(shù)字圖書館、中國社會科學(xué)引文索引(CSSCI)、EBSCO檢索平臺、哈佛大學(xué)出版社回溯電子圖書以及綜述期刊等11個管理學(xué)常用中英文數(shù)據(jù)庫,對當(dāng)前數(shù)據(jù)挖掘的研究現(xiàn)狀進行了檢索統(tǒng)計。分別以“數(shù)據(jù)挖掘”和“data mining”為搜索詞,在“中文發(fā)現(xiàn)”和“外文發(fā)現(xiàn)”子系統(tǒng)*吉林大學(xué)圖書館,網(wǎng)址如下:http://lib.jlu.edu.cn/portal/database2/1/61.aspx.提交檢索要求,對檢索的結(jié)果以關(guān)鍵詞為條件限制,以“重要期刊”為文獻來源,得到數(shù)據(jù)挖掘研究關(guān)鍵詞分布示意圖(見圖1)。結(jié)果顯示,當(dāng)前關(guān)于數(shù)據(jù)挖掘的研究中,中文研究更關(guān)注數(shù)據(jù)挖掘方法,外文研究同時關(guān)注數(shù)據(jù)挖掘方法和數(shù)據(jù)挖掘應(yīng)用。這一結(jié)果與曾有學(xué)者[1]采用共詞分析法對我國1997~2010年間數(shù)據(jù)挖掘研究狀況的分析結(jié)果基本一致。但當(dāng)前國內(nèi)外研究都忽略了數(shù)據(jù)挖掘過程中技術(shù)人員對數(shù)據(jù)挖掘結(jié)果的影響,即數(shù)據(jù)挖掘決策科學(xué)性和有效性的問題。本研究從數(shù)據(jù)挖掘的前一環(huán)節(jié)入手,意圖通過數(shù)據(jù)勘探,使數(shù)據(jù)挖掘更有方向性和目標性,甚至發(fā)現(xiàn)傳統(tǒng)數(shù)據(jù)挖掘所忽略的有價值的挖掘目標。
圖1 數(shù)據(jù)挖掘研究現(xiàn)狀
1.2數(shù)據(jù)勘探的基本描述
在大數(shù)據(jù)時代,人們普遍承認大數(shù)據(jù)是一種資源,數(shù)據(jù)挖掘就是人們對大數(shù)據(jù)資源的開采。大數(shù)據(jù)分析的對象是與某種事物相關(guān)的所有數(shù)據(jù),而非少量的樣本數(shù)據(jù)[2],因此不存在對數(shù)據(jù)資源的普查問題。大數(shù)據(jù)在被開采利用之前,利用某種技術(shù)手段,對資源中可能存在的“礦藏”及其價值、儲量以及開采條件等進行勘探,有助于為后續(xù)的開采利用活動提供依據(jù)。國內(nèi)外當(dāng)前關(guān)于大數(shù)據(jù)的研究多集中于數(shù)據(jù)處理(側(cè)重數(shù)據(jù)采集和數(shù)據(jù)計算)、數(shù)據(jù)挖掘以及大數(shù)據(jù)應(yīng)用等方面,缺少有關(guān)數(shù)據(jù)資源的勘探研究。不經(jīng)勘探而直接挖掘,容易帶來數(shù)據(jù)資源的浪費。本研究提出數(shù)據(jù)勘探的構(gòu)想,并模仿礦產(chǎn)資源勘查的相關(guān)理論,給出數(shù)據(jù)勘探的基本描述:數(shù)據(jù)勘探是通過各種數(shù)據(jù)勘查技術(shù)手段,對大數(shù)據(jù)資源中可能存在的挖掘價值做出描述的過程,因勘查技術(shù)手段的不同,該過程可以有不同的表現(xiàn)形式,但最終的數(shù)據(jù)勘探結(jié)果,應(yīng)能為后續(xù)的數(shù)據(jù)利用活動提供決策支持。
2.1營銷數(shù)據(jù)勘探路徑的開發(fā)
為開發(fā)出合適的數(shù)據(jù)勘探路徑,本研究對悠易互通(以下簡稱悠易)公司提供的截至2015年4月底“汽車交通”、“數(shù)碼家電”、“金融財經(jīng)”、“手機通訊”、“快消日化”、“電子商務(wù)”以及“其他”7個領(lǐng)域共54個數(shù)據(jù)挖掘成功實例的挖掘結(jié)論進行了全面觀察,并從每一板塊中任意選取一項業(yè)務(wù)的數(shù)據(jù)挖掘結(jié)論制作成表(見表1),詳細說明觀察的結(jié)果。
觀察發(fā)現(xiàn),數(shù)據(jù)挖掘結(jié)論通常表述為語句形式,該語句一般由三部分構(gòu)成,可暫將其稱為“條件”部分、“謂詞”部分和“條件結(jié)論”部分。例如,在“中小型辦公用戶喜歡選擇功能全面、成本低廉的打印機”這一挖掘結(jié)論中,“中小型”、“辦公用戶”即所謂的“條件”部分,謂詞是“喜歡選擇”,而“功能全面”、“成本低廉”則是“條件結(jié)論”部分(見表1)。這一發(fā)現(xiàn)給研究帶來了重要的啟發(fā):如果能將數(shù)據(jù)有效組合成類似的語句形式,那么該語句就可能是有價值的挖掘方向,至少在所有組成的語句中,存在有挖掘價值的語句。本研究在這一思路的指引下,構(gòu)建數(shù)據(jù)勘探路徑。為了與以后其他研究的數(shù)據(jù)勘探路徑相區(qū)分,將其命名為“語句構(gòu)造”勘探路徑,如沒有特殊說明,下文的勘探路徑均指“語句構(gòu)造”勘探路徑。
表1 數(shù)據(jù)挖掘結(jié)論細分表
2.2營銷數(shù)據(jù)勘探過程
營銷數(shù)據(jù)勘探過程由“聚”、“分”、“組”3個階段構(gòu)成。首先將數(shù)據(jù)轉(zhuǎn)化為適合語句構(gòu)造的形態(tài),然后依據(jù)一定的語法規(guī)則構(gòu)造成語句形式。本研究在細化數(shù)據(jù)規(guī)模時,遵循“以特征描述總體,以維度描述特征”的細化規(guī)則,將維度作為數(shù)據(jù)歸類的最小單位。
2.2.1數(shù)據(jù)勘探第一步——“聚”
所謂“聚”,就是將待勘探的全體數(shù)據(jù)按照某種原則歸類。歸類標準不同,最終得到的類也不同。本研究依據(jù)數(shù)據(jù)與交易主體之間的從屬關(guān)系,將全體數(shù)據(jù)歸為兩大類:一類是與網(wǎng)店(賣家)相關(guān)的數(shù)據(jù);一類是與消費者相關(guān)的數(shù)據(jù)。商品作為交易的客體,由賣家提供,賣家可通過直接的生產(chǎn)活動或間接的備貨活動調(diào)節(jié)和控制其商品構(gòu)成,商品在某種程度上可看作是賣家的備貨,故將與商品相關(guān)的數(shù)據(jù)歸于與網(wǎng)店相關(guān)的數(shù)據(jù)類中。其他由交易派生出的數(shù)據(jù),如物流數(shù)據(jù)、訂單數(shù)據(jù),可依據(jù)數(shù)據(jù)所屬的傾向性,將其相應(yīng)地歸為與賣家或消費者相關(guān)的數(shù)據(jù)類中。例如:網(wǎng)店提供的物流選擇是關(guān)于賣家服務(wù)的描述,可將這類數(shù)據(jù)歸于與賣家相關(guān)的數(shù)據(jù)類中;而消費者的物流選擇描述的是消費者的物流偏好,可將這類數(shù)據(jù)歸于與消費者相關(guān)的數(shù)據(jù)類中。
數(shù)據(jù)勘探的第一步“聚”,實現(xiàn)了對數(shù)據(jù)的總體細化,下一步,是對這兩類數(shù)據(jù)的具體維度劃分,即數(shù)據(jù)勘探過程中的“分”。
2.2.2數(shù)據(jù)勘探第二步——“分”
所謂“分”,是指將“聚”的過程中得到的數(shù)據(jù)類,劃分到更細小的維度層面。本研究中以特征描述總體,以維度描述特征。
根據(jù)交易流程,賣家的行為主要包括備貨行為、營銷行為、支付方式提供的行為(以下簡稱支付方式行為)和售前/售后服務(wù)行為,下文簡稱網(wǎng)店的SMPS行為,并以網(wǎng)店的SMPS行為特征描述網(wǎng)店總體。網(wǎng)絡(luò)環(huán)境下的消費者研究以消費者心理和消費者行為為核心領(lǐng)域[3],在實際的電子商務(wù)運營中,網(wǎng)店利用推薦系統(tǒng),通過挖掘消費者偏好和消費者習(xí)慣為消費者提供恰當(dāng)?shù)纳唐坊蚍?wù)[4]。因此,網(wǎng)店數(shù)據(jù)勘探與挖掘研究的理論歸宿,應(yīng)集中于消費者行為、心理、習(xí)慣和偏好領(lǐng)域,下文簡稱消費者BPHP研究。具體的維度劃分如下:
2.2.2.1網(wǎng)店SMPS行為特征的維度選取
(1)網(wǎng)店備貨行為特征備貨是為了滿足目標顧客的需求,從一個或幾個供應(yīng)商處分別把一些同質(zhì)異種的商品集中起來。除了商品的種類外,還包括不同的品牌、價格、規(guī)格以及數(shù)量[5]。本研究中網(wǎng)店備貨行為主要描述商品構(gòu)成特征,包括商品的①價格,②種類,③多樣性、性能及功用,④質(zhì)量。
其中,種類有其電子商務(wù)環(huán)境下的獨特含義。不同于廣義概念上的商品基本種類劃分,電子商務(wù)環(huán)境下的種類是網(wǎng)店人為制定的、依照網(wǎng)店獨特的劃分規(guī)則對商品的內(nèi)部歸類,通常作為網(wǎng)店后臺數(shù)據(jù)庫中的字段而存在。每個網(wǎng)店對種類的歸類方法不盡相同,但其歸類目的都是為了統(tǒng)計商品狀況。本研究將種類作為數(shù)據(jù)庫中的字段進行分析。多樣性描述的是商品屬性的取值范圍,如價位、種類、尺碼、顏色、形狀、口味、材質(zhì)、產(chǎn)地等商品屬性的取值范圍。
(2)網(wǎng)店營銷行為特征網(wǎng)店最常見的營銷行為是價格策略和促銷策略。移動互聯(lián)技術(shù)的發(fā)展和智能終端的全面普及,使電子商務(wù)的主戰(zhàn)場從PC端轉(zhuǎn)移到移動端*中國互聯(lián)網(wǎng)中心《第34次中國互聯(lián)網(wǎng)絡(luò)發(fā)展統(tǒng)計報告》顯示,截至2014年6月,我國網(wǎng)民上網(wǎng)設(shè)備中,手機使用率達83.4%,首次超越傳統(tǒng)PC整體80.9%的使用率,手機成為第一大上網(wǎng)終端。,有的網(wǎng)店還開設(shè)了線下體驗店(如韓都衣舍開設(shè)線下體驗店)。因此,本研究將渠道策略作為網(wǎng)店營銷行為特征的一個維度。網(wǎng)店的營銷行為特征主要有①價格策略,②促銷策略,③渠道策略。
網(wǎng)店的價格策略主要體現(xiàn)在商品價格的表達方式上,而非傳統(tǒng)意義的定價策略??蚣苄?yīng)[6]認為,如果內(nèi)容相同的信息以不同的表述方式呈現(xiàn)給決策者,決策者可能會對相同的決策狀況形成完全不同的理解。因此,網(wǎng)店將不同的價格表現(xiàn)方式作為一種營銷手段。主要有以下幾種方式:原價與現(xiàn)價在絕對數(shù)值上的對比,如:原價198元,現(xiàn)價168元;相對價格,如:168元(8.5折);套餐價格,如:護膚品洗護套裝238元,低于分別購買的總計價格268元。
網(wǎng)店促銷策略的獨特性主要體現(xiàn)在促銷方式和促銷平臺兩方面。網(wǎng)店促銷方式可分為捆綁式促銷和宣傳性促銷。捆綁式促銷通過有代價地向消費者提供優(yōu)惠,將促銷與商品購買相捆綁,意在發(fā)展直接客戶。如:打折銷售、滿減滿贈、優(yōu)惠券、滿包郵等;宣傳性促銷不與直接的商品購買掛鉤,為宣傳產(chǎn)品或品牌而向消費者提供優(yōu)惠,意在發(fā)展?jié)撛诳蛻?。如:免費郵寄商品小樣、免費提供試用裝、包郵試吃等。網(wǎng)店的促銷平臺包括網(wǎng)絡(luò)運營平臺和媒體推廣平臺兩種。
網(wǎng)店渠道策略主要描述電子商務(wù)環(huán)境下網(wǎng)店銷售產(chǎn)品的渠道,包括PC端銷售、移動終端APP銷售和線下實體店銷售。
(3)網(wǎng)店支付方式提供行為特征主要描述網(wǎng)店支持的支付手段,包括在線支付、貨到付款、積分支付和分期付款。這一特征體現(xiàn)的是網(wǎng)店為消費者提供的多樣化便捷服務(wù)。
(4)網(wǎng)店售前/售后服務(wù)行為特征網(wǎng)店售前承諾包括關(guān)于商品質(zhì)量、物流服務(wù)、售后服務(wù)以及糾紛的處理等承諾;售后服務(wù)包括對商品的持續(xù)性后續(xù)服務(wù),如保修期限、退換貨、退款、糾紛處理等。售前承諾與售后服務(wù)是影響消費者滿意度、消費者忠誠的重要因素,是顧客關(guān)系管理的重要內(nèi)容。
2.2.2.2消費者人群特征的維度選取
分析消費者人群特征是消費者BPHP研究的前提。本研究將消費者人群特征劃分為:①自然屬性,②興趣、愛好、品味,③上網(wǎng)習(xí)慣,④生活習(xí)慣,⑤購買特征。
(1)自然屬性本研究將性別、年齡、地域、受教育程度、收入水平、職業(yè)、婚姻狀況等人口統(tǒng)計特征命名為消費者的自然屬性,描述的是消費者固定的或相對穩(wěn)定的屬性。
(2)興趣、愛好、品味這一特征是消費者受后天環(huán)境影響,逐漸形成的、對事物較為固定的態(tài)度,能夠影響消費者對商品及網(wǎng)店行為的評價。移動互聯(lián)時代消費者行為帶有社交性,擁有共同興趣、愛好、品位的消費者在自發(fā)形成的社交網(wǎng)絡(luò)中,相互交流商品信息、商品體驗及商品評價。
(3)上網(wǎng)習(xí)慣該特征描述的是消費者在使用網(wǎng)絡(luò)過程中形成的較為固定的行為模式,包括上網(wǎng)時間段、上網(wǎng)時長、上網(wǎng)頻次、登陸習(xí)慣、瀏覽習(xí)慣等。
(4)生活習(xí)慣這一特征描述的是消費者在生活中形成的較為固定的帶有某種規(guī)律的生活模式,例如定期旅行、定期健身、定期體檢、定期理發(fā)等。
(5)購買特征購買特征描述的是消費者在購買過程中形成的,較為規(guī)律的行為特點,包括購買數(shù)量、購買金額、購買方式(自助購買或者與賣家溝通后購買)、支付方式、物流選擇等與購買過程相關(guān)的行為表現(xiàn)。
2.2.2.3消費者BPHP研究
消費者BPHP研究即關(guān)于消費者消費行為、心理、習(xí)慣和偏好的研究,這四者之間存在著內(nèi)在關(guān)聯(lián),很難明確地將消費者的某一表現(xiàn)歸為BPHP中的某一類。
科特勒[7]從構(gòu)建消費者行為模型的角度分析,認為營銷刺激和其他環(huán)境刺激經(jīng)由消費者意識激活消費者心理,消費者心理又與特定的消費者特征相結(jié)合,共同決定消費者的購買決策過程和最終的購買決策結(jié)果??梢?,消費心理與消費行為統(tǒng)一于整個消費過程,二者不可分割,消費心理更傾向描述人的內(nèi)心活動,消費行為更多地體現(xiàn)為人的外在表現(xiàn)。
消費習(xí)慣、消費偏好是消費心理和消費行為共同作用的結(jié)果。消費習(xí)慣是消費者在消費過程中逐漸形成的、長期的、較為穩(wěn)定的并具有一定規(guī)律性的行為,是消費者較為穩(wěn)定的消費心理狀況在消費行為方面的體現(xiàn)[8]。消費偏好多描述“消費者對產(chǎn)品的喜愛程度”,是消費者的一種心理反應(yīng)[9]。因此,不能將消費者的BPHP研究完全獨立分析,可根據(jù)分析目的和消費者表現(xiàn)的傾向性具體問題具體分析。本研究對消費者的BPHP分析研究做出如下界定:
(1)消費者行為本研究中的消費者行為側(cè)重研究消費者購買決策階段的行為表現(xiàn),包括產(chǎn)品選擇、品牌選擇、經(jīng)銷商選擇、購買數(shù)量、購買時間、付款方法等方面的行為以及購后行為。其他方面的行為表現(xiàn),如問題認識(即消費者需求)、信息收集、可供選擇方案的評價等,可視消費者的具體表現(xiàn),將其劃分到相應(yīng)的BPHP研究范疇。
(2)消費者心理本研究根據(jù)消費者心理學(xué)雜志(《Journal of Consumer Psychology》)關(guān)于消費者心理研究的界定及網(wǎng)店運營的實際情況,將消費者在信息搜集、購買商品等階段涉及的心理活動,以及影響消費者心理變化的因素(如網(wǎng)店的營銷刺激等)歸為消費者心理研究范疇。某些消費行為,反映了具體的消費者心理變化過程,如消費者多次取消訂單并重新下訂單,可根據(jù)具體的研究情境,將其歸于消費者心理研究。
(3)消費者偏好有研究表明,消費者偏好是內(nèi)生、變化的,會受到購物經(jīng)驗、人格特性、市場環(huán)境等因素的影響[10],在電子商務(wù)環(huán)境下,消費者偏好隨著交易情境的改變具有權(quán)變的性質(zhì)[11]。因此,本研究中的消費者偏好是一個變動的過程,描述的是消費者面臨多種選擇時,根據(jù)某種排序規(guī)則做出的選擇。另外,本研究中的消費者偏好分為顯性偏好和隱性偏好[4]。其中,顯性偏好可直接獲得,如物流選擇偏好、套餐選擇偏好等;隱性偏好需要通過挖掘消費者的網(wǎng)店交易行為進一步明確其真實偏好,不能直接獲得,如基于消費者瀏覽行為、上網(wǎng)軌跡、歷史記錄等挖掘消費者真實偏好。
(4)消費者習(xí)慣按照消費者習(xí)慣的指向性,通常將消費習(xí)慣細分為對特定商品品牌的消費習(xí)慣、對特定商品類型的消費習(xí)慣、對特定商品風(fēng)格的消費習(xí)慣、對商品特定屬性的消費習(xí)慣、購買商品時表現(xiàn)的習(xí)慣性行為以及商品使用過程中表現(xiàn)的習(xí)慣[8]。本研究關(guān)注網(wǎng)店行為對消費者BPHP研究的影響,不考慮品牌效應(yīng);另外,消費者對特定商品類型、商品風(fēng)格、商品特定屬性的消費習(xí)慣更符合本研究中關(guān)于消費者偏好的描述。因此,本研究中的消費者習(xí)慣側(cè)重于消費者購買商品時表現(xiàn)出的習(xí)慣性行為和商品使用過程中的習(xí)慣,如習(xí)慣的購買時機、購買數(shù)量、購買總金額、購買方式等。
根據(jù)以上的維度選取,在數(shù)據(jù)勘探“聚”的過程中得到的數(shù)據(jù)類被具體劃分到維度層,下一步即是對這些維度層面的數(shù)據(jù)以特定的語法規(guī)則構(gòu)造成有意義的挖掘語句,即數(shù)據(jù)勘探過程中的“組”。
2.2.3營銷數(shù)據(jù)勘探過程第三步——“組”
所謂“組”,就是將數(shù)據(jù)勘探“分”的過程中得到的維度以特定語法規(guī)則組合成有意義的語句。本研究中用于組合維度的語法規(guī)則為PVP語法結(jié)構(gòu)。
PVP語法結(jié)構(gòu),即“前件(the pre-)+謂詞(verb)+后件(the post-)”結(jié)構(gòu),其中前件和后件與傳統(tǒng)的理解有所差異。在邏輯學(xué)范疇,前件和后件用于假言判斷命題,規(guī)定條件的判斷叫做“前件”,以前件為條件的判斷叫做“后件”,二者之間存在著因果聯(lián)系或類似因果關(guān)系的聯(lián)系。在數(shù)據(jù)結(jié)構(gòu)中,二者描述的是數(shù)據(jù)元素之間“前驅(qū)”和“后繼”的邏輯關(guān)系。本語法規(guī)則中的前件和后件沒有強烈的“因”與“果”、“前驅(qū)”和“后繼”的邏輯關(guān)系,只是挖掘語句中“前面的表述”(the pre-)和“后面的表述”(the post-),在邏輯上二者可以互換位置。PVP語法結(jié)構(gòu)中的謂詞,來自對數(shù)據(jù)字段的抽象提煉。一般能夠表明某種狀態(tài)或某種動作的字段可抽象成謂詞,如“白領(lǐng)女性的訂單創(chuàng)建時間多為20:30之后”,可抽象出謂詞“創(chuàng)建訂單”。PVP語法結(jié)構(gòu)中的前件和后件可以選自不同“聚”類中的維度,此時多用于描述消費者對網(wǎng)店行為的反應(yīng);也可以選自相同“聚”類中的維度,此時多用于描述消費者行為(或網(wǎng)店行為)的組合特征。
挖掘語句的組合過程有兩種方式,一種方式可稱作“事先遴選”,即根據(jù)電商的實際需要,在構(gòu)建挖掘語句之前選擇電商感興趣的某些維度,然后利用計算機對這些維度進行PVP語法組合,從而分析出數(shù)據(jù)挖掘方向。這種“事先遴選”的組合方式要求電商有一定的前件、后件、謂詞指向(或數(shù)據(jù)挖掘指向),這種指向可以是明確的挖掘目標(如,電商想挖掘某幾個數(shù)據(jù)之間的關(guān)系),也可以是模糊的挖掘傾向(如,電商想知道某些或某類數(shù)據(jù)之間的內(nèi)在相關(guān)性)。傳統(tǒng)的數(shù)據(jù)挖掘過程類似“事先遴選”的組合方式,數(shù)據(jù)分析人員多依據(jù)經(jīng)驗引導(dǎo)電商向可能的數(shù)據(jù)挖掘目標靠攏,最終確定挖掘方向。這種經(jīng)驗性判斷存在遺漏挖掘方向的風(fēng)險,不同技術(shù)人員的主觀能動性和不同的從業(yè)經(jīng)驗,會帶來不同的組合結(jié)果。經(jīng)過數(shù)據(jù)勘探的“事先遴選”組合能更全面的覆蓋可能的挖掘目標,降低遺漏風(fēng)險。
另一種組合方式可稱作“事后選擇”,即先將電商的數(shù)據(jù)按照“聚”、“分”的勘探過程劃分為細小的維度;然后,利用計算機技術(shù)依照PVP語法規(guī)則進行維度組合,得到所有可能的數(shù)據(jù)挖掘路徑;最后,電商根據(jù)實際需要在所有路徑中進行挖掘方向的抉擇。電商對挖掘方向的選擇,可參考以下兩個原則:“謂詞優(yōu)先”原則和“前件(后件)優(yōu)先”原則。謂詞由表示某種狀態(tài)或某種動作的字段抽象而成,如果電商想探求某種經(jīng)營狀態(tài)的形成原因或某種電商行為的后續(xù)結(jié)果,則可以根據(jù)相應(yīng)的謂詞選擇優(yōu)先挖掘的語句;前件和后件是描述消費者特征或電商行為特征的維度,如果電商想進行市場細分、目標市場選擇、市場定位和營銷組合策略決策等,則可以根據(jù)相應(yīng)的前件、后件選擇優(yōu)先挖掘的語句。
通過“聚”、“分”、“組”的勘探過程,能夠積累形成關(guān)于前件、謂詞、后件以及消費者BPHP研究的數(shù)據(jù)庫,即“數(shù)據(jù)勘探中心”。當(dāng)網(wǎng)店的數(shù)據(jù)存儲符合某種形式的前件、謂詞、后件結(jié)構(gòu)時,網(wǎng)店就能通過“數(shù)據(jù)勘探中心”,找到對應(yīng)的消費者BPHP研究領(lǐng)域,便可明確其數(shù)據(jù)利用的方向。當(dāng)網(wǎng)店有明確的關(guān)于消費者BPHP研究需求時,也可通過“數(shù)據(jù)勘探中心”回溯所需要的數(shù)據(jù),進而有目的地存儲數(shù)據(jù)。以下用網(wǎng)店的數(shù)據(jù)來檢驗所構(gòu)建的數(shù)據(jù)勘探路徑。
以網(wǎng)店ZMT2014年6月5日~8月30日的銷售數(shù)據(jù)為分析對象,進行數(shù)據(jù)勘探路徑的檢驗。ZMT是一家以經(jīng)營保健品為主兼營保健護理化妝品的企業(yè)。ZMT希望通過數(shù)據(jù)挖掘得到一些有價值的信息,但對信息價值的預(yù)期并不明確。換言之,ZMT沒有明確的數(shù)據(jù)挖掘目標。在這種情況下,數(shù)據(jù)勘探便顯得尤為重要了。ZMT的數(shù)據(jù)勘探與挖掘過程分為數(shù)據(jù)準備、數(shù)據(jù)勘探和數(shù)據(jù)挖掘3個階段。
3.1數(shù)據(jù)準備
這一階段的主要工作是剔除無用的數(shù)據(jù),以提高數(shù)據(jù)挖掘的準確性和效率。包括數(shù)據(jù)篩選、數(shù)據(jù)凈化和數(shù)據(jù)縮減。ZMT提供的銷售數(shù)據(jù)共計28 491條,包含“訂單編號”、“標題”等30個字段(見表2)。
表2 字段統(tǒng)計表
對這些字段分析簡化,過程如下:
“訂單編號”、“外部系統(tǒng)編號”、“商家編碼”、“買家會員名”、“物流單號”、“店鋪ID”是身份識別編號,多用于查詢功能,不作為數(shù)據(jù)勘探與挖掘的分析對象,將其排除。
“標題”和“寶貝標題”分屬不同數(shù)據(jù)庫,但描述內(nèi)容一致,二者任選其一,在本研究中保留“標題”字段,排除“寶貝標題”字段;買家實際支付金額=總金額=買家應(yīng)付貨款+買家應(yīng)付郵費,但當(dāng)訂單關(guān)閉時,買家實際支付金額為“0”,總金額不變??偨痤~更能表述消費者的購買消費極限,因此保留“總金額”字段,排除“買家實際支付金額”字段;同時排除“買家應(yīng)付貨款”字段,以“總金額”字段和“買家應(yīng)付郵費”字段代表;“運送方式”字段的數(shù)據(jù)值均為“快遞”,不具備挖掘價值,故排除。在訂單成功的狀態(tài)下,買家可支付積分與買家實際支付積分完全相等,不存在差異,表明所有買家都選擇了以積分代替部分消費金額,不具備挖掘價值,故排除這兩個字段。
創(chuàng)建訂單時間與訂單付款時間存在一個時間間隔,對這兩個字段計算,得到一個新的“付款時間間隔”字段。
至此,用于ZMT數(shù)據(jù)勘探與挖掘研究的數(shù)據(jù)由19個字段構(gòu)成,包括原30字段中的18個字段以及“付款時間間隔”字段(見表3)。
數(shù)據(jù)準備完畢后,運用本研究構(gòu)建的“語句構(gòu)造”數(shù)據(jù)勘探路徑對ZMT數(shù)據(jù)做挖掘前的數(shù)據(jù)勘探。
表3 最終字段統(tǒng)計表
3.2數(shù)據(jù)勘探
3.2.1數(shù)據(jù)勘探過程
根據(jù)“聚”、“分”、“組”的數(shù)據(jù)勘探路徑,本研究對ZMT的數(shù)據(jù)進行了數(shù)據(jù)勘探(見表4)?,F(xiàn)對某些特殊字段的維度劃分做進一步說明:
表4 ZMT數(shù)據(jù)勘探過程
“標題”字段的數(shù)據(jù)描述兩部分內(nèi)容,包括促銷信息和商品信息,如:“買1送3,熱銷45萬瓶,ZMT膠原蛋白粉,魚膠原蛋白正品,咨詢有禮”。因此將其劃分為備貨和營銷兩個維度;
“訂單備注”字段是根據(jù)消費者留言、備注以及售后服務(wù)結(jié)果(如退款)對訂單的總結(jié)性概括,該字段的數(shù)據(jù)更多的描述了網(wǎng)店對消費者的售前售后服務(wù)行為,因此將該字段數(shù)據(jù)劃分為網(wǎng)店的售前/售后服務(wù)維度;
“備注”和“買家留言”字段的數(shù)據(jù)反映的是消費者的服務(wù)要求,傾向于描述消費者購買特征,故將其劃分到消費者購買特征維度;
“訂單狀態(tài)”描述的是消費者對購買行為的某種反饋,是對最終交易結(jié)果的刻畫。網(wǎng)店最為關(guān)注交易結(jié)果,因此將其劃分為與網(wǎng)店相關(guān)的數(shù)據(jù)類中,并以謂詞的方式構(gòu)造挖掘語句。
“訂單關(guān)閉原因”字段實質(zhì)上描述的是網(wǎng)店對消費者反饋的反應(yīng),屬于網(wǎng)店的售后服務(wù),故將其劃分到售前/售后_售后維度。
3.2.2數(shù)據(jù)勘探結(jié)果
數(shù)據(jù)勘探結(jié)果從不同“聚”類間和同一“聚”類內(nèi)的維度組合兩個方面進行描述。
“聚”類間的組合路徑所得到的挖掘語句,前件和后件的維度分別來自與網(wǎng)店相關(guān)的數(shù)據(jù)集和與消費者相關(guān)的數(shù)據(jù)集,謂詞為訂單狀態(tài),最終形成的挖掘語句歸于消費者BPHP分析(見表5)。與傳統(tǒng)數(shù)理統(tǒng)計注重變量間的因果關(guān)系相比,大數(shù)據(jù)分析更側(cè)重由大數(shù)據(jù)計算得到的相關(guān)關(guān)系,只要某種關(guān)系得到了大數(shù)據(jù)的支持驗證,即可為實踐所應(yīng)用,不必細究背后的因果邏輯?!熬邸鳖愰g的組合路徑旨在發(fā)現(xiàn)前件后件間的關(guān)系,適合關(guān)聯(lián)分析的挖掘方法。
表5 “聚”間組合路徑
“聚”類內(nèi)的組合路徑所得到的挖掘語句,其前件和后件均來自同一個“聚”類。前件和后件均是消費者特征的維度,意在幫助網(wǎng)店識別細分消費群體。謂詞由字段“訂單關(guān)閉原因”或“創(chuàng)建訂單時間”“訂單付款時間”“付款時間間隔”等抽象而來,最終形成的挖掘語句為網(wǎng)店的行為決策提供支持(見表6)。“聚”內(nèi)組合研究的是消費者特征維度之間的相關(guān)關(guān)系,同樣適合關(guān)聯(lián)分析的挖掘方法。
表6 “聚”內(nèi)組合路徑
“聚”類內(nèi)與“聚”類間組合路徑的語句構(gòu)造原理相同。但需注意,由于前件、后件、謂詞是源于同一“聚”類的維度,因此,一個維度不能同時出現(xiàn)在前件、后件、謂詞的維度組合中。
3.3數(shù)據(jù)挖掘
經(jīng)過與電商ZMT溝通發(fā)現(xiàn),當(dāng)前ZMT最關(guān)心的是消費者的“下單”能否最終成功轉(zhuǎn)換為網(wǎng)店的“訂單”。本研究根據(jù)“事后選擇”的PVP組合方法,以“謂詞優(yōu)先”為原則,選擇最終的挖掘語句。經(jīng)過對所構(gòu)造挖掘語句的甄別,選取“消費者購買總金額、寶貝總數(shù)量、付款時間間隔可能影響最終的購買結(jié)果”這一語句為例,做數(shù)據(jù)挖掘?qū)嵶C分析。該挖掘語句的構(gòu)成規(guī)則為“總金額/寶貝總數(shù)量/付款時間間隔/訂單狀態(tài)”,意在挖掘消費者的購買特征與最終交易結(jié)果之間的關(guān)聯(lián)關(guān)系。下面以Clementine軟件為數(shù)據(jù)挖掘平臺,應(yīng)用Apriori算法構(gòu)建關(guān)聯(lián)模型,對上述語句進行挖掘?qū)嶒灐?/p>
3.3.1數(shù)據(jù)處理
為了挖掘總金額、寶貝數(shù)量、付款時間間隔和訂單狀態(tài)4個字段之間的關(guān)聯(lián)關(guān)系,首先需要對待挖掘的數(shù)據(jù)做預(yù)處理,剔除異常數(shù)據(jù)。
通過數(shù)據(jù)篩選發(fā)現(xiàn),當(dāng)網(wǎng)店開展“會員活動、補差價、補運費”的活動時,商品價格為“1”;當(dāng)網(wǎng)店開展“試用中心免費試用”活動時,總金額為“0”,這兩種情況都屬于交易中的特例,在研究變量間的普遍關(guān)系時,應(yīng)剔除特例的影響,故刪除總金額為“0”和商品單價為“1”的數(shù)據(jù)。
3.3.2數(shù)據(jù)轉(zhuǎn)換
將原始數(shù)據(jù)轉(zhuǎn)換為可供數(shù)據(jù)挖掘軟件識別的數(shù)據(jù)類型。即將字符型數(shù)據(jù)轉(zhuǎn)換為邏輯型數(shù)據(jù),用T代表“交易成功”的訂單狀態(tài),用F代表“交易關(guān)閉”的訂單狀態(tài);將數(shù)值型的數(shù)據(jù)根據(jù)一定的規(guī)則分組;將時間型數(shù)據(jù)先轉(zhuǎn)換為數(shù)值型數(shù)據(jù),再按照數(shù)值型數(shù)據(jù)進行處理。詳細的轉(zhuǎn)換規(guī)則見表7。
表7 數(shù)據(jù)轉(zhuǎn)換規(guī)則
每一字段的轉(zhuǎn)換規(guī)則具體如下:
篩選“總金額”字段數(shù)據(jù)發(fā)現(xiàn),其取值范圍為(0,19600],但數(shù)值集中在(0,300]的范圍內(nèi),以100為單位試分組,發(fā)現(xiàn)落在(0,100]范圍內(nèi)的數(shù)據(jù)個數(shù)約為(0,300]區(qū)間數(shù)據(jù)總數(shù)的一半,因此在(0,300]范圍內(nèi)將總金額數(shù)值分為兩個區(qū)間(0,100]和(100,300];在(300,500]區(qū)間段,保持與(100,300]區(qū)間相同的劃分單位,剩余的數(shù)值區(qū)間作為最后一組。
“寶貝總數(shù)量”字段的分組方法與“總金額”字段的分組方法相同。需要特別強調(diào)的是,由于購買數(shù)量不能為空,所以該字段的值至少為1,試探性的以1作為組內(nèi)距離單位,因此,第一組的區(qū)間范圍是[1,2]。
“付款時間間隔”字段分組中,(0,1]表示一分鐘之內(nèi)付款;以15分鐘和30分鐘作為分界點,源于淘寶與天貓商城在實際運營中關(guān)于限時搶購活動的付款間隔限制,這兩個數(shù)值已經(jīng)過了實踐的檢驗;剩余數(shù)值作為最后一個分組區(qū)間。
“訂單狀態(tài)”字段的數(shù)據(jù)類型是字符型,將其轉(zhuǎn)換為邏輯型數(shù)值,用T代表“交易成功”的訂單狀態(tài),用F代表“交易關(guān)閉”的訂單狀態(tài)。
3.3.3數(shù)據(jù)挖掘結(jié)果
在Clementine的操作平臺上應(yīng)用Apriori算法構(gòu)建關(guān)聯(lián)分析模型。為了發(fā)現(xiàn)消費者購買特征對最終交易結(jié)果的影響,建模時將“訂單狀態(tài)”作為輸出項,將“總金額”、“寶貝數(shù)量”和“付款時間間隔”作為輸入項。為了挖掘出消費者購買特征與最終購買行為之間較強的關(guān)聯(lián)關(guān)系,將最低條件支持度設(shè)為30%,最小規(guī)則置信度設(shè)為90%。得到的最終挖掘結(jié)果見表8。
表8 數(shù)據(jù)挖掘結(jié)果
3.3.4數(shù)據(jù)挖掘結(jié)果分析
分析表8中的數(shù)據(jù)挖掘結(jié)果,可以得到以下結(jié)論:
與消費總額在100元之內(nèi)的訂單相比,消費總金額在100~300元間的訂單更容易交易成功(第1、5條);
在15分鐘之內(nèi)付款的訂單,其交易成功的可能性大于1分鐘之內(nèi)付款的訂單(第2、9條);
寶貝數(shù)量為3~5個的訂單比2個之內(nèi)的更容易交易成功(第3、10條);
寶貝數(shù)量為3~5個,并在15分鐘之內(nèi)付款的訂單,其交易成功的可能性大于寶貝數(shù)量在2個之內(nèi)且付款時間間隔少于1分鐘的訂單(第4、11條);
付款時間間隔為1~15分鐘且總金額為100~300 元的訂單組合比付款時間間隔為1分鐘之內(nèi)且總金額為 0~100]元的組合相更容易交易成功(第6、12條);
寶貝數(shù)量為(2,5]個且總金額為(100,300]元的訂單組合比寶貝數(shù)量為[1,2]個且總金額為(0,100]元的訂單組合更容易交易成功(第7、11條);
總金額為(100,300]元、付款時間間隔為(1,15]分鐘且寶貝數(shù)量為(2,5]個的訂單組合比三者的(0,100]元、(0,1]分鐘且[1,2]個的訂單組合更容易交易成功(第8、14條)。
在上述挖掘結(jié)論中,消費者購買習(xí)慣組合的挖掘結(jié)論更能體現(xiàn)數(shù)據(jù)挖掘的價值。單個購買習(xí)慣與最終交易狀態(tài)之間的關(guān)聯(lián)關(guān)系,雖然可以通過簡單的統(tǒng)計繪圖直接得到,但消費者購買習(xí)慣的組合與最終交易狀態(tài)的關(guān)聯(lián)關(guān)系,卻是傳統(tǒng)的數(shù)理統(tǒng)計所不能發(fā)現(xiàn)的。
從以上挖掘結(jié)論中得到的有價值的市場信息是:當(dāng)消費者的購買總金額在(100,300]范圍,付款時間間隔在(1,15]范圍,購買數(shù)量在(2,5]范圍內(nèi),或者消費者的購買習(xí)慣是這三者的任意自由組合時,消費者最終更傾向于決定購買。根據(jù)這一信息,ZMT可采取適當(dāng)?shù)男袨榇碳はM者的習(xí)慣向以上方向靠攏,特別是對消費習(xí)慣組合的刺激,可以更大程度促使交易成功。
通過對ZMT的數(shù)據(jù)勘探與挖掘的實證檢驗,可以確認本研究構(gòu)建的數(shù)據(jù)勘探路徑的可操作性及數(shù)據(jù)勘探的價值所在。即當(dāng)企業(yè)的數(shù)據(jù)挖掘需求或大數(shù)據(jù)利用方向不明確時,數(shù)據(jù)勘探能夠提供多個數(shù)據(jù)利用方向的選擇,經(jīng)由數(shù)據(jù)勘探所構(gòu)造的數(shù)據(jù)挖掘語句,能夠為后續(xù)的數(shù)據(jù)挖掘提供清晰的挖掘目標。
4.1研究結(jié)論
為了提高營銷數(shù)據(jù)挖掘的有效性,本研究提出了數(shù)據(jù)勘探的構(gòu)想,以維度組合的方法,構(gòu)建了“聚”、“分”、“組”的數(shù)據(jù)勘探路徑,并以網(wǎng)店企業(yè)數(shù)據(jù)的勘探與挖掘?qū)ζ溥M行了實證檢驗,證明了該數(shù)據(jù)勘探路徑的適用性和實踐性。
研究結(jié)果表明,經(jīng)由數(shù)據(jù)勘探路徑所構(gòu)造的最終語句,能夠發(fā)現(xiàn)數(shù)據(jù)資源可能存在的挖掘價值,為后續(xù)數(shù)據(jù)挖掘工作指引挖掘方向和挖掘目標;當(dāng)網(wǎng)店對大數(shù)據(jù)“無處下手”時,可嘗試用數(shù)據(jù)勘探的方法分析數(shù)據(jù)利用的可能方向;網(wǎng)店也可以利用“數(shù)據(jù)勘探中心”,有意識地存儲相關(guān)數(shù)據(jù)、實現(xiàn)自主數(shù)據(jù)挖掘??傊?,數(shù)據(jù)勘探能使網(wǎng)店數(shù)據(jù)挖掘工作更具有目標性、效率性。
4.2研究意義
這一研究結(jié)果可以推廣到網(wǎng)店之外的其他企業(yè),其營銷實踐意義在于,數(shù)據(jù)勘探能夠為企業(yè)的數(shù)據(jù)挖掘工作提供挖掘方向的參考和借鑒,使企業(yè)的數(shù)據(jù)挖掘活動更有目標和效率。當(dāng)企業(yè)數(shù)據(jù)挖掘沒有明確方向或挖掘目標不明確時,可以利用數(shù)據(jù)勘探路徑明晰數(shù)據(jù)利用方向,并根據(jù)數(shù)據(jù)勘探路徑有目的、有選擇地積累所需數(shù)據(jù);當(dāng)企業(yè)有明確的數(shù)據(jù)挖掘目標時,數(shù)據(jù)勘探有助于幫助企業(yè)發(fā)現(xiàn)有價值的其他挖掘目標,使企業(yè)能夠更充分合理地利用大數(shù)據(jù)資源,避免數(shù)據(jù)資源的浪費。另外,企業(yè)可建立“數(shù)據(jù)勘探中心”,有目標地進行數(shù)據(jù)挖掘工作,更有效、更快速、更自主地實現(xiàn)對大數(shù)據(jù)資源的開發(fā)利用。本研究的結(jié)論如果能擴展到全數(shù)據(jù)挖掘領(lǐng)域,將可以為其他行業(yè)的數(shù)據(jù)挖掘方向決策提供理論支持。
本研究的理論意義在于首次提出數(shù)據(jù)勘探的構(gòu)想,開拓了數(shù)據(jù)勘探研究領(lǐng)域,使流通數(shù)據(jù)挖掘研究從挖掘過程向挖掘之前的環(huán)節(jié)延伸,從挖掘技術(shù)(或技術(shù)應(yīng)用)研究向挖掘決策研究拓展。同時,本研究開發(fā)并驗證了數(shù)據(jù)勘探路徑的價值并為數(shù)據(jù)挖掘方向決策探索出一條從經(jīng)驗決策通向科學(xué)決策的道路。另外,本研究構(gòu)建的數(shù)據(jù)勘探路徑的有效性如果能夠得到進一步證實,將能提高企業(yè)數(shù)據(jù)挖掘的效率,幫助企業(yè)科學(xué)制定競爭策略,真正將數(shù)據(jù)資源轉(zhuǎn)變成能創(chuàng)造新的經(jīng)濟利益的商業(yè)資本,進而推動企業(yè)營銷與大數(shù)據(jù)的深度融合。
4.3未來研究方向
本研究是對數(shù)據(jù)勘探的初步探索,數(shù)據(jù)勘探路徑的構(gòu)建尚不完善,相關(guān)的概念界定、維度劃分標準有待進一步規(guī)范。文中關(guān)于數(shù)據(jù)勘探的研究尚處于理論形成階段,勘探路徑的構(gòu)建比較粗糙,僅僅是一個理論構(gòu)想的展現(xiàn)過程,數(shù)據(jù)勘探路徑的理論性、技術(shù)性有待進一步優(yōu)化,下一步的研究方向定位于數(shù)據(jù)勘探路徑的優(yōu)化研究。數(shù)據(jù)勘探過程中的“聚”和“分”的過程,其實質(zhì)是數(shù)據(jù)挖掘中的分類問題,如何通過技術(shù)手段使 “聚”、“分”過程中的分類問題更具科學(xué)性,更少受到人的主觀思維影響,是下一步數(shù)據(jù)勘探路徑優(yōu)化研究的重點,目的是使路徑更精確、科學(xué)和有效。數(shù)據(jù)勘探路徑優(yōu)化研究是一個持續(xù)的過程,需要在不斷的實踐檢驗中發(fā)現(xiàn)、提出和解決問題。下一階段的研究目標是至少找出一種優(yōu)化數(shù)據(jù)勘探路徑的方法,使前一階段構(gòu)建的數(shù)據(jù)勘探路徑相對更優(yōu)。在優(yōu)化數(shù)據(jù)勘探路徑的研究階段,計劃通過專家咨詢和小組討論發(fā)現(xiàn)路徑中存在的問題,并擬借鑒人工智能領(lǐng)域的遺傳算法、粒子群算法等技術(shù)手段解決該問題,達到優(yōu)化數(shù)據(jù)勘探路徑的目的。另外,如何在所構(gòu)建的語句中快速識別出傳統(tǒng)數(shù)據(jù)挖掘所不能發(fā)現(xiàn)的、更有意義、更具價值的挖掘方向,是數(shù)據(jù)勘探能否快捷有效的關(guān)鍵,這也是未來營銷數(shù)據(jù)勘探研究的重點。
鳴謝本研究得到浙江工商大學(xué)現(xiàn)代商貿(mào)研究中心和浙江省2011協(xié)同創(chuàng)新中心——現(xiàn)代商貿(mào)流通體系建設(shè)協(xié)同創(chuàng)新中心的項目(15SMGK15YB)資助,特此致謝。
[1] 張玉,郭會雨,陳建青. 我國數(shù)據(jù)挖掘研究現(xiàn)狀分析——基于共詞分析視角[J].情報科學(xué),2011,29(10):1589~1593
[2] WU X D, ZHU X Q,WU G Q, et al. Data Mining with Big Data [J].IEEE Transactions on Knowledge & Data Engineering,2014,26(1):97~107
[3] 戴麗娜. 改革開放以來中國消費者研究探析[J]. 社會學(xué),2012(4):40~50
[4] 劉枚蓮,劉同存,吳偉平. 基于網(wǎng)絡(luò)消費者偏好預(yù)測的推薦算法研究[J]. 圖書情報工作,2012,56(4):120~125
[5] 吳小丁. 商品流通論[M]. 北京:科學(xué)出版社,2015:10
[6] KüHBERGER A. The Framing of Decisions: A New Look at Old problems: Organizational Behavior and Human Decision Processes [J]. Organizational Behavior and Human Decision Processes, 1995,62(2):230~240
[7] 科特勒 F. 營銷管理[M]. 汪濤,譯. 北京:中國人民大出版社,2012:71,73
[8] 羅子明. 消費心理學(xué)[M]. 北京:清華大學(xué)出版社,2002:144,145~146
[9] CARPENTER G S, NAKAMOTO K. Consumer Preference Formation and Pioneering Advantage [J].Journal of Marketing Research, 1989,26(3):285~298
[10] KWON K, CHO J, PARK Y. Influences of Customer Preference Development on the Effectiveness of Recommendation Strategies [J]. Electronic Commerce Research and Application,2005,8(5): 263~275
[11] 崔艷武,蘇秦,李釗. 基于電子商務(wù)環(huán)境的顧客消費偏好研究[J]. 軟科學(xué),2007,12(6):19~23
(編輯劉繼寧)
A Research on Building the Path of Data Exploration in Marketing
FAN MiaomiaoLU YingWU Xiaoding
(Jilin University, Changchun, China)
The present research proposes the idea of data exploration and builds a path composed of the stages of “gathering”, “separating” and “grouping” for the data exploration of online stores. By using the method of PVP, we construct the meaningful data mining statements with dimension combination to get meaningful data mining statements, among which the valuable statements might be the future direction of data mining. We verify the rationality of the theoretical system on the data exploration path through exploring and mining the data from online stores. The results shows that the data exploration path constructed in the research can improve the efficiency of data mining in marketing and the decision making level in data mining direction.
marketing big data; data exploration; data mining; decision-making for data mining direction
2016-03-07
教育部人文社科重點研究基地資助項目(15SMGK15YB)
C93
A
1672-884X(2016)09-1400-10
吳小丁(1954~),女,滿族,吉林省吉林市人。吉林大學(xué)(長春市130012)商學(xué)院教授、博士研究生導(dǎo)師,博士。研究方向為零售管理,商品流通等,E-mail:xiaoding_wu@126.com
DOI編碼: 10.3969/j.issn.1672-884x.2016.09.016