曹安林
(南京機(jī)電職業(yè)技術(shù)學(xué)院,江蘇 南京 211135)
在電商行業(yè)發(fā)展過(guò)程中,電商平臺(tái)用戶的操作行為會(huì)產(chǎn)生大量的網(wǎng)絡(luò)數(shù)據(jù)信息,面對(duì)海量的數(shù)據(jù)信息如何應(yīng)用先進(jìn)的技術(shù)對(duì)其進(jìn)行分析、支持,如何辨別信息的真假保證數(shù)據(jù)的質(zhì)量就成為擺在人們面前的現(xiàn)實(shí)問(wèn)題。
目前,網(wǎng)絡(luò)中的數(shù)據(jù)信息可以分為兩大類,一類是結(jié)構(gòu)化數(shù)據(jù),即主要形式包括字符、文本及數(shù)字的數(shù)據(jù);另一類則是非結(jié)構(gòu)化數(shù)據(jù),即主要形式包括圖片、視頻、音頻的數(shù)據(jù)[1]。 人們?cè)诰W(wǎng)絡(luò)中產(chǎn)生的互動(dòng)行為越來(lái)越多,故網(wǎng)絡(luò)信息數(shù)據(jù)的格式也越來(lái)越復(fù)雜。 數(shù)據(jù)挖掘技術(shù)應(yīng)是對(duì)越來(lái)越龐大、越來(lái)越復(fù)雜的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行分析、挖掘,以快速、準(zhǔn)確地獲取有價(jià)值的信息,探究隱含于不完整的、有雜音的、隨機(jī)的數(shù)據(jù)中不為人所知的知識(shí)與信息[2]。 對(duì)于電商企業(yè)而言,所挖掘的就是電商用戶的購(gòu)買(mǎi)模式與行為特點(diǎn)。
目前常用的數(shù)據(jù)挖掘方法包括以下幾種:
一是類/概念描述,其對(duì)數(shù)據(jù)進(jìn)行分類、特征化描述后,對(duì)數(shù)據(jù)進(jìn)行對(duì)比、總結(jié),將數(shù)據(jù)之間的類或概念通過(guò)對(duì)比及匯總等方式描述出來(lái)[3]。 二是關(guān)聯(lián)分析。該方法是目前數(shù)據(jù)挖掘技術(shù)常用的方法之一,其利用挖掘探測(cè)規(guī)則發(fā)現(xiàn)數(shù)據(jù)間互相依賴的、能夠滿足一定條件的關(guān)系。 三是分類和預(yù)測(cè),該方法可對(duì)某些未知的數(shù)據(jù)做出預(yù)測(cè),其應(yīng)用特定的技術(shù)研究類標(biāo)號(hào)未知的數(shù)據(jù)類型,辨別數(shù)據(jù)類/概念的模型。 四是聚類分析,該方法利用最大化類內(nèi)相似性與最小化類之間的相似性原理對(duì)數(shù)據(jù)進(jìn)行分組,其主要分析數(shù)據(jù)對(duì)象不考慮類標(biāo)號(hào),而是針對(duì)無(wú)標(biāo)記類的數(shù)據(jù)進(jìn)行聚類分析,再產(chǎn)生數(shù)據(jù)組群的類標(biāo)號(hào),將高相似性對(duì)象簇聚類與其他簇中的對(duì)象區(qū)分開(kāi)來(lái)[4]。 五是離群點(diǎn)分析,該方法可以發(fā)現(xiàn)一些數(shù)據(jù)對(duì)象和數(shù)據(jù)的一般行為或模型異常,其主要對(duì)數(shù)據(jù)集進(jìn)行分析。 六是演變分析與預(yù)測(cè)分析,比如時(shí)間序列分類、周期或序列模式匹配、基于類似性的數(shù)據(jù)分析等,主要分析隨時(shí)間變化而變化的數(shù)據(jù)的發(fā)展規(guī)律或趨勢(shì)。
上述方法中關(guān)聯(lián)分析是目前數(shù)據(jù)挖掘應(yīng)用最廣泛的方法之一,通過(guò)關(guān)聯(lián)規(guī)則分析可以發(fā)現(xiàn)事務(wù)之間的內(nèi)在關(guān)系,分析各個(gè)要素之間的潛在規(guī)律,比如消費(fèi)者在電商平臺(tái)購(gòu)買(mǎi)了衣服,是否會(huì)再購(gòu)買(mǎi)鞋子,或者購(gòu)買(mǎi)手機(jī)的消費(fèi)者是否會(huì)配套購(gòu)買(mǎi)手機(jī)殼等,這種方法也稱為購(gòu)物籃分析。 關(guān)聯(lián)規(guī)則的處理對(duì)象是可理解為一種業(yè)務(wù)行為的事務(wù),關(guān)聯(lián)規(guī)則可通過(guò)有效的規(guī)則支持度與有效的規(guī)則置信度兩個(gè)基本標(biāo)準(zhǔn)來(lái)衡量[5]。 其中規(guī)則置信度表示兩個(gè)包含的事務(wù)發(fā)生的概率,可評(píng)價(jià)關(guān)聯(lián)規(guī)則是否準(zhǔn)確,其表示X出現(xiàn)的條件下Y出機(jī)的概率,即某個(gè)事務(wù)中包含有X的同時(shí)有多大概率會(huì)包含Y,可用下式表示:
上式中,T(x):項(xiàng)目X的事務(wù)數(shù);T(X⌒Y):同時(shí)包含項(xiàng)目X和項(xiàng)目Y事務(wù)數(shù)。 置信度越高,X出現(xiàn)的條件下Y出現(xiàn)的概率越大。
規(guī)則支持度表示項(xiàng)目X和項(xiàng)目Y同時(shí)發(fā)生的概率,是測(cè)量關(guān)聯(lián)規(guī)則廣泛性的標(biāo)準(zhǔn),用下式表示:
上式中,|T|表示總事務(wù)數(shù),支持度過(guò)低表示規(guī)則不具一般性。
規(guī)則支持度與規(guī)則置信度的內(nèi)在聯(lián)系可以用前項(xiàng)支持度、后項(xiàng)支持度來(lái)表示,前項(xiàng)支持度數(shù)學(xué)表達(dá)式如下:
關(guān)聯(lián)規(guī)則的開(kāi)展必須設(shè)置合理的閾值,支持度閾值設(shè)置過(guò)小可能會(huì)導(dǎo)致生成的規(guī)則落空,分析結(jié)果缺乏代表性,反之支持度閾值設(shè)置過(guò)大可能會(huì)找不到相關(guān)規(guī)則[6]。 除上述兩項(xiàng)基本標(biāo)準(zhǔn)外,關(guān)聯(lián)規(guī)則還包括增益、提升度、事物及項(xiàng)集等其他指標(biāo)。
在電商運(yùn)營(yíng)管理過(guò)程中數(shù)據(jù)挖掘的應(yīng)用主要包括兩個(gè)方面,即消費(fèi)者信息分析與消費(fèi)者交易數(shù)據(jù)分析。
電商平臺(tái)分析消費(fèi)者信息主要從訪問(wèn)數(shù)據(jù)、消費(fèi)者瀏覽行為、訪問(wèn)渠道及訪問(wèn)模式等方面進(jìn)行了解,從中挖掘關(guān)于消費(fèi)者的、具有價(jià)值的數(shù)據(jù)信息。 通過(guò)數(shù)據(jù)挖掘技術(shù)電商平臺(tái)可以對(duì)消費(fèi)者進(jìn)行分類,并進(jìn)行客戶保持、交叉銷售等,再根據(jù)這些信息分析消費(fèi)者的消費(fèi)能力,有針對(duì)性地調(diào)整營(yíng)銷策略[7]。 比如利用數(shù)據(jù)挖掘技術(shù)構(gòu)建消費(fèi)者行為反應(yīng)預(yù)測(cè)模式,評(píng)估消費(fèi)者未來(lái)可能發(fā)生的消費(fèi)行為,能夠?yàn)殡娚唐髽I(yè)挖掘潛在目標(biāo)客戶提供有價(jià)值的參考。 或者利用相關(guān)技術(shù)進(jìn)行一對(duì)一營(yíng)銷,通過(guò)數(shù)據(jù)挖掘的聚類方法對(duì)海量消費(fèi)者進(jìn)行分類,分析消費(fèi)者的群體行為規(guī)律,掌握群體共性,采取精準(zhǔn)營(yíng)銷或差異化營(yíng)銷。
交易數(shù)據(jù)分析可以將產(chǎn)品之間隱含的內(nèi)在固有關(guān)系挖掘出來(lái)。 對(duì)于電商企業(yè)而言,收集客戶信息是數(shù)據(jù)挖掘中最關(guān)鍵的一環(huán),消費(fèi)者進(jìn)入店鋪后會(huì)產(chǎn)生一系列信息,對(duì)其行為進(jìn)行跟蹤有助于了解消費(fèi)者的喜好,擴(kuò)大消費(fèi)者規(guī)模。 在流量為王的信息社會(huì)中,電商企業(yè)并非免費(fèi)獲得客戶信息,需要付出推廣成本、客戶維護(hù)成本等,而客戶的價(jià)值也并非同等重要,通過(guò)消費(fèi)者交易數(shù)據(jù)的挖掘可以有效甄別客戶的價(jià)值,滿足消費(fèi)者的個(gè)性化需求,制定差異化營(yíng)銷策略,挖掘消費(fèi)者潛在需求點(diǎn),分析產(chǎn)品之間的關(guān)聯(lián)關(guān)系,進(jìn)行捆綁銷售等。
要針對(duì)電商平臺(tái)進(jìn)行數(shù)據(jù)挖掘,就必須從海量的運(yùn)營(yíng)數(shù)據(jù)中確定關(guān)鍵的信息數(shù)據(jù),針對(duì)這些數(shù)據(jù)進(jìn)行分析才能幫助電商企業(yè)決策者找準(zhǔn)運(yùn)營(yíng)管理的關(guān)鍵點(diǎn),提高解決問(wèn)題的針對(duì)性及運(yùn)營(yíng)管理的科學(xué)性。 對(duì)于電商平臺(tái)而言,數(shù)據(jù)挖掘的關(guān)鍵指標(biāo)體系主要圍繞消費(fèi)者、銷售的產(chǎn)品、電子商務(wù)店銷及店鋪的銷售數(shù)據(jù)4 個(gè)方面來(lái)展開(kāi)。 實(shí)際運(yùn)營(yíng)過(guò)程中,電商企業(yè)有著不同的生命周期,生命周期不同,電商企業(yè)的主要指標(biāo)也有所不同,具體如下:
首先,電商企業(yè)創(chuàng)業(yè)初期主要的經(jīng)營(yíng)目標(biāo)是獲得最大化的流量,培養(yǎng)領(lǐng)袖客戶群體及固化商業(yè)模式,因此該階段需要分析客戶數(shù)量、銷售額兩項(xiàng)指標(biāo),主要目的是通過(guò)轉(zhuǎn)化率、利潤(rùn)額檢測(cè)商業(yè)模式是否可行,以降低投資風(fēng)險(xiǎn)。 其次,在電商企業(yè)成長(zhǎng)期主要運(yùn)營(yíng)目標(biāo)是擴(kuò)大客戶群體,對(duì)產(chǎn)品及產(chǎn)品的呈現(xiàn)進(jìn)行完善,改善客戶體驗(yàn),該階段主要分析客戶增長(zhǎng)率及銷售額增長(zhǎng)率兩項(xiàng)指標(biāo),主要評(píng)估消費(fèi)者的回頭購(gòu)買(mǎi)率,分析消費(fèi)者對(duì)產(chǎn)品及產(chǎn)品的呈現(xiàn)、客戶服務(wù)等內(nèi)容的反饋,以維護(hù)更加健康的客戶關(guān)系。 再次,電商企業(yè)成熟期的主要運(yùn)營(yíng)目標(biāo)是保持市場(chǎng)占有率,提高投資回報(bào)率,提高客戶需求響應(yīng)率,該階段需要分析市場(chǎng)占有率及利潤(rùn)額,計(jì)算投資回報(bào)率,不斷提高經(jīng)營(yíng)利潤(rùn),分析日活躍用戶量能夠?qū)οM(fèi)者的黏度、品牌影響力進(jìn)行檢測(cè)。最后,電商企業(yè)經(jīng)營(yíng)衰退期主要運(yùn)營(yíng)目標(biāo)是保持資金流,并尋找新的、可持續(xù)發(fā)展的增長(zhǎng)點(diǎn),該階段主要分析客戶生命周期價(jià)值,通過(guò)銷售額檢測(cè)維持運(yùn)營(yíng)的資金流,分析客戶流失率,在留住領(lǐng)袖客戶群體的基礎(chǔ)上尋找商業(yè)轉(zhuǎn)型升級(jí)的機(jī)會(huì)[8]。
確定好各項(xiàng)關(guān)鍵指標(biāo)后即開(kāi)始針對(duì)指標(biāo)所對(duì)應(yīng)的數(shù)據(jù)進(jìn)行分析、挖掘,電商數(shù)據(jù)挖掘包括以下幾個(gè)方面。
3.2.1 客戶數(shù)據(jù)分析挖掘
針對(duì)不同的數(shù)據(jù)類型選擇不同的數(shù)據(jù)挖掘方法,比如從消費(fèi)者數(shù)據(jù)庫(kù)中分析出不同的消費(fèi)群體可以采用聚類分析,該方法還可以概括出每個(gè)消費(fèi)群體的消費(fèi)習(xí)慣、消費(fèi)模式等信息;根據(jù)消費(fèi)者的性別、年齡、區(qū)域、興趣等人口統(tǒng)計(jì)要素將其細(xì)分為不同的群組,針對(duì)不同區(qū)域確定不同的產(chǎn)品價(jià)格,或者針對(duì)不同性別、不同年齡段的消費(fèi)者制定個(gè)性化的營(yíng)銷策略等。 還可以針對(duì)不同的客戶來(lái)源對(duì)客戶進(jìn)行細(xì)分,比如直接訪問(wèn)者、通過(guò)搜索引擎登錄平臺(tái)者,或者通過(guò)網(wǎng)絡(luò)廣告訪問(wèn)平臺(tái)者,就可以分為不同的群組。 此外,還可以進(jìn)一步分析客戶的瀏覽路徑、停留時(shí)間等,通過(guò)用戶的訪問(wèn)信息分析確定電商企業(yè)產(chǎn)品的優(yōu)化策略、廣告投放策略等。 除聚類分析外,還可應(yīng)用關(guān)聯(lián)分析方法對(duì)消費(fèi)者的購(gòu)買(mǎi)習(xí)慣進(jìn)行分析,比如分析消費(fèi)者的購(gòu)物車(chē),就可以得出消費(fèi)者的消費(fèi)傾向,分析各商品之間的聯(lián)系,就可以提高捆綁營(yíng)銷策略的針對(duì)性等。
3.2.2 產(chǎn)品數(shù)據(jù)分析挖掘
針對(duì)產(chǎn)品進(jìn)行數(shù)據(jù)挖掘主要分析產(chǎn)品的動(dòng)覽率、動(dòng)銷率、售罄率、退貨率及貨齡等指標(biāo),并根據(jù)產(chǎn)品被瀏覽點(diǎn)擊的次數(shù)分析潛在的銷售機(jī)會(huì)。 此外,針對(duì)產(chǎn)品還可以分析其被添加到購(gòu)物車(chē)的次數(shù)、被購(gòu)買(mǎi)的次數(shù)、產(chǎn)品銷售額,這些可以分析產(chǎn)品的被購(gòu)買(mǎi)意向及消費(fèi)者對(duì)產(chǎn)品的接受程度;而分析產(chǎn)品的退貨率及退貨原因,則可以作為優(yōu)化產(chǎn)品的重要參考等。 對(duì)產(chǎn)品進(jìn)行數(shù)據(jù)挖掘可以明確電商企業(yè)當(dāng)下的產(chǎn)品情況,有助于企業(yè)根據(jù)明星產(chǎn)品、暢銷產(chǎn)品及滯銷產(chǎn)品而調(diào)整營(yíng)銷策略。 此外,通過(guò)數(shù)據(jù)挖掘還可以進(jìn)一步分析產(chǎn)品之間的關(guān)聯(lián)因素,比如明星產(chǎn)品是否因?yàn)閮r(jià)格促銷,或者滯銷產(chǎn)品是否因?yàn)槲锪鳝h(huán)節(jié)存在問(wèn)題等,通過(guò)分析產(chǎn)品可以提高產(chǎn)品推廣的針對(duì)性,并針對(duì)滯銷產(chǎn)品調(diào)整產(chǎn)品線。
3.2.3 店鋪數(shù)據(jù)挖掘
電商平臺(tái)上入駐的各個(gè)電商企業(yè)是促進(jìn)電商商品與消費(fèi)者產(chǎn)生交易的最終場(chǎng)所,針對(duì)店鋪的數(shù)據(jù)挖掘可以按照常規(guī)的銷售邏輯進(jìn)行分析:首先流量分析,即通過(guò)數(shù)據(jù)分析進(jìn)行科學(xué)引流,采用方差分析法可以分析不同客戶群組進(jìn)店方式對(duì)店鋪流量的影響,再針對(duì)不同的客戶群組制定更具針對(duì)性的廣告策略;其次點(diǎn)擊率分析,消費(fèi)者進(jìn)入店鋪后多種因素均會(huì)對(duì)其購(gòu)物體驗(yàn)產(chǎn)生影響,比如店鋪的界面、氛圍、觸及商品的便捷性等,采用聚類分析法可以挖掘消費(fèi)者進(jìn)店后在某個(gè)產(chǎn)品的停留時(shí)間及瀏覽路徑;最后進(jìn)行轉(zhuǎn)化率分析,即消費(fèi)者最終購(gòu)買(mǎi)了何種商品,分析轉(zhuǎn)化率可以為后續(xù)產(chǎn)品的打磨、服務(wù)的優(yōu)化提供有效參考。
3.2.4 銷售數(shù)據(jù)挖掘及運(yùn)營(yíng)預(yù)測(cè)分析
針對(duì)銷售數(shù)據(jù)的挖掘可以綜合應(yīng)用聚類分析、關(guān)聯(lián)分析、對(duì)比分析等多種方法,對(duì)產(chǎn)品的銷售量、銷售額、銷售增長(zhǎng)率等指標(biāo)進(jìn)行分析,對(duì)產(chǎn)品進(jìn)行優(yōu)化,根據(jù)分析結(jié)果調(diào)整銷售策略;分析客單價(jià)、客單活躍度、回頭率等,可以為客戶量化模型及投資回報(bào)率計(jì)算提供參考。 運(yùn)營(yíng)預(yù)測(cè)可以采用方差分析、邏輯回歸分析等多種挖掘方法分析消費(fèi)者的購(gòu)買(mǎi)行為、客戶成長(zhǎng)規(guī)律、行業(yè)發(fā)展趨勢(shì)等信息,對(duì)電商企業(yè)的運(yùn)營(yíng)管理情況有個(gè)宏觀的把握及預(yù)測(cè),對(duì)營(yíng)銷戰(zhàn)略的有效性做出評(píng)估,并作為下階段運(yùn)營(yíng)管理戰(zhàn)略部署的參考,進(jìn)一步提高電商企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力[9]。
針對(duì)上述指標(biāo)進(jìn)行數(shù)據(jù)挖掘后,根據(jù)分析結(jié)果對(duì)運(yùn)營(yíng)策略做進(jìn)一步優(yōu)化,根據(jù)消費(fèi)者來(lái)源選擇更好的引流方式來(lái)擴(kuò)大消費(fèi)群體;分析消費(fèi)者購(gòu)買(mǎi)心理、購(gòu)買(mǎi)行為,優(yōu)化電商平臺(tái)界面及服務(wù),增加消費(fèi)者黏性,提高消費(fèi)者滿意度及忠誠(chéng)度。 通過(guò)產(chǎn)品數(shù)據(jù)分析針對(duì)不同群組的客戶定制不同的包裝、價(jià)格及營(yíng)銷策略;基于運(yùn)營(yíng)管理的角度針對(duì)行業(yè)及市場(chǎng)變化規(guī)律不斷優(yōu)化電商運(yùn)營(yíng)策略,做出科學(xué)決策。 最后要針對(duì)電商運(yùn)營(yíng)優(yōu)化效果進(jìn)行持續(xù)性追蹤,比如促銷活動(dòng)對(duì)店鋪流量變化的影響及規(guī)律,分析其訂單數(shù)、成交額、轉(zhuǎn)化率等,對(duì)促銷活動(dòng)的實(shí)施效果進(jìn)行綜合分析。
總之,電商企業(yè)決策者希望從數(shù)據(jù)中獲取更精確的有效信息,除了簡(jiǎn)單的網(wǎng)絡(luò)營(yíng)銷列表外,還需更深入地了解消費(fèi)者購(gòu)買(mǎi)商品的細(xì)節(jié)性信息,以總結(jié)消費(fèi)者的消費(fèi)偏好、預(yù)測(cè)其后續(xù)的購(gòu)買(mǎi)傾向,傳統(tǒng)的結(jié)構(gòu)化語(yǔ)言查詢已無(wú)法滿足越來(lái)越高的電商營(yíng)銷需求。 大數(shù)據(jù)時(shí)代促進(jìn)了數(shù)據(jù)挖掘技術(shù)的進(jìn)步,數(shù)據(jù)挖掘技術(shù)能夠從海量的網(wǎng)絡(luò)數(shù)據(jù)中快速、準(zhǔn)確地獲得更有價(jià)值的信息,理解已有的歷史數(shù)據(jù),并對(duì)消費(fèi)者未來(lái)的行為進(jìn)行預(yù)測(cè)。 相信隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘在電商領(lǐng)域的應(yīng)用范圍會(huì)越來(lái)越廣泛。