吳淑凡
(閩南理工學(xué)院 信息管理學(xué)院,福建 泉州 362700)
中國(guó)百貨商業(yè)協(xié)會(huì)《2020-2021 中國(guó)百貨零售業(yè)發(fā)展報(bào)告》中指出:隨著數(shù)字化進(jìn)入深水區(qū),企業(yè)數(shù)字化重點(diǎn)工作需要完善系統(tǒng)運(yùn)營(yíng)能力,包括線上商城、數(shù)據(jù)分析等。電商平臺(tái)是線上商城的主要方式,自2008年,我國(guó)電子商務(wù)發(fā)展迅速,電商平臺(tái)上的消費(fèi)者數(shù)量不斷增加,為電商企業(yè)帶來(lái)了激烈的競(jìng)爭(zhēng)。隨著大數(shù)據(jù)技術(shù)的發(fā)展,如何在海量數(shù)據(jù)信息中整合客戶信息、挖掘客戶需求,以便實(shí)施精準(zhǔn)營(yíng)銷成為電商企業(yè)急需解決的問題[1]?!吨袊?guó)互聯(lián)網(wǎng)發(fā)展報(bào)告(2021)》顯示,2020 年,我國(guó)數(shù)字經(jīng)濟(jì)市場(chǎng)規(guī)模已達(dá) 39.2 萬(wàn)億元[2]。電商企業(yè)在面對(duì)海量客戶時(shí),預(yù)測(cè)電商客戶價(jià)值,尤為重要的是對(duì)不同價(jià)值的客戶實(shí)施個(gè)性化精準(zhǔn)營(yíng)銷。企業(yè)已經(jīng)從以商品為中心轉(zhuǎn)向以客戶為中心,客戶成為企業(yè)競(jìng)爭(zhēng)的重要資源。以往是對(duì)客戶進(jìn)行分類,這種方法會(huì)出現(xiàn)資源浪費(fèi)、客戶流失等現(xiàn)象,已經(jīng)不能滿足大數(shù)據(jù)環(huán)境下的精準(zhǔn)營(yíng)銷。挖掘客戶的價(jià)值,與客戶建立穩(wěn)固持久的關(guān)系是企業(yè)持續(xù)發(fā)展的有利途徑。電商平臺(tái)的一個(gè)重要優(yōu)勢(shì)就是能夠追蹤客戶的行為軌跡,方便獲取相關(guān)數(shù)據(jù)。本文所分析的數(shù)據(jù)為電商客戶真實(shí)的行為數(shù)據(jù),所采用的算法是機(jī)器學(xué)習(xí)算法,構(gòu)建出一個(gè)電商客戶價(jià)值識(shí)別模型,該模型的應(yīng)用能夠?yàn)槠髽I(yè)制定市場(chǎng)營(yíng)銷策略提供依據(jù),從而提高企業(yè)的經(jīng)濟(jì)效益。因此,電商平臺(tái)企業(yè)能夠通過(guò)用戶價(jià)值分析、預(yù)測(cè)實(shí)現(xiàn)差異化服務(wù),留住高質(zhì)量客戶和挖掘新客戶。所以,對(duì)電商客戶進(jìn)行價(jià)值預(yù)測(cè)的研究具有一定的應(yīng)用研究?jī)r(jià)值。
世界電子商務(wù)在歐美地區(qū)起步較為早。1995 年,美國(guó)亞馬遜成立,電子商務(wù)平臺(tái)在國(guó)外快速發(fā)展,許多外國(guó)研究者開始研究以客戶數(shù)據(jù)為基礎(chǔ)的電子商務(wù)平臺(tái)中用戶價(jià)值[3]。2007年,SUZAN[4]審查了用戶價(jià)值的類型和屬性,探討了價(jià)值定義之間的異同,通過(guò)多維性、交互性等來(lái)研究用戶價(jià)值。2014 年,STEPHANIE等[5]從用戶功能性、普及度、社會(huì)性、等角度收集用戶數(shù)據(jù),建立用戶價(jià)值模型。2018年,PARK等[6]以智能手機(jī)為例,研究了一種價(jià)值抽樣方法向量空間模型(Vector Space Model,VSM)來(lái)評(píng)估用戶價(jià)值;同年,OSKARSDOTTIR等[7]結(jié)合用戶價(jià)值先驗(yàn)概率與用戶終身價(jià)值法(Customer Lifetime Value,CLV),得到在不同生命周期用戶價(jià)值計(jì)算方法。2019年,MOHIT[8]以兩輪車為數(shù)據(jù)樣本,研究了用戶價(jià)值要素在用戶價(jià)值分析中的影響。
2018年,劉園園[9]針對(duì)電力用戶監(jiān)測(cè)數(shù)據(jù),建立分析評(píng)價(jià)模型來(lái)反應(yīng)用戶的信息價(jià)值。2019年,邢海龍等[10]對(duì)改進(jìn)傳統(tǒng)最近一次消費(fèi)頻率消費(fèi)金額(Recency Frequency Monetary,RFM)模型,構(gòu)建K-means 模型與ALC(Activity Loyalty Contribution)-RFM 模型結(jié)合,識(shí)別與細(xì)分電商平臺(tái)用戶價(jià)值,結(jié)果表明該方法在可以得到重要價(jià)值、重要保持和重要挽留用戶。2020年,馮志強(qiáng)[11]提出對(duì)客戶價(jià)值評(píng)價(jià)指標(biāo)體系進(jìn)行研究,指出不僅要考慮客戶當(dāng)前價(jià)值,還要考慮客戶潛在價(jià)值和忠誠(chéng)度。2021年,許雪晶等[12]提出基于RFM模型及聚類算法,對(duì)某電商企業(yè)客戶數(shù)據(jù)進(jìn)行評(píng)估和分析,實(shí)現(xiàn)對(duì)客戶進(jìn)行有效的細(xì)分。
電商用戶是指在電子商務(wù)平臺(tái)中購(gòu)買商品或服務(wù)的個(gè)人或單位,用戶的消費(fèi)行為是指用戶使用、獲取商品所采取的行動(dòng)的過(guò)程。用戶的消費(fèi)行為具有多樣性和復(fù)雜性的特點(diǎn),同樣的用戶在不同的平臺(tái)、不同的時(shí)間以及選擇不同的商品時(shí)行為可能會(huì)有很大的不同。用戶的消費(fèi)行為還受其他因素的影響,例如電商平臺(tái)中的各種廣告。在大數(shù)據(jù)快速發(fā)展的時(shí)期,要想分析用戶的消費(fèi)行為,需要通過(guò)用戶消費(fèi)過(guò)程中產(chǎn)生的行為數(shù)據(jù)進(jìn)行研究,在這些行為數(shù)據(jù)中找到其共性進(jìn)行挖掘,從而制定出有效的營(yíng)銷策略。論文在電商用戶消費(fèi)行為理論的基礎(chǔ)上研究電商用戶的價(jià)值預(yù)測(cè)具有重要的研究?jī)r(jià)值。
從不同的角度分析用戶價(jià)值主要考慮2方面的內(nèi)容。第一方面,從用戶方面考慮,用戶價(jià)值是用戶在獲取商家的產(chǎn)品或服務(wù)中所產(chǎn)生的貨幣價(jià)值;另一方面,從企業(yè)角度考慮,用戶的價(jià)值是用戶在享受商家提供的產(chǎn)品或服務(wù)過(guò)程中為商家所帶來(lái)的利潤(rùn)[13]。文中研究的是第2 個(gè)方面的價(jià)值,用戶為商家?guī)?lái)的利潤(rùn)價(jià)值。目前,在用戶價(jià)值分類中主要的模型有RFM模型和CLV模型、用戶價(jià)值矩陣模型等。
(1)RFM模型
RFM(Recency Frequency Monetary)模型是分析用戶價(jià)值和潛在價(jià)值的模型。在RFM 模型中,Recency是指最近一次消費(fèi),是當(dāng)前時(shí)間與用戶最近一次消費(fèi)的時(shí)間間隔,這個(gè)間隔越小表示再次消費(fèi)的可能性越大。Frequency表示消費(fèi)頻率,是在一定時(shí)間段內(nèi)消費(fèi)的次數(shù),次數(shù)越多價(jià)值越大。Monetary表示消費(fèi)金額,是在一定時(shí)間段內(nèi)消費(fèi)的金額,金額越大價(jià)值越高。應(yīng)用RFM模型在R(Recency)、F(Frequency)、M(Monetary)3 個(gè)維度上將用戶分為重要保持用戶、重要價(jià)值用戶、重要發(fā)展用戶、重要挽留用戶、一般保持用戶、一般價(jià)值用戶、一般發(fā)展用戶、一般挽留用戶。
(2)CLV模型
CLV 模型是客戶生命周期價(jià)值模型,該模型在分析的過(guò)程中考慮客戶完整的生命周期,在完整的生命周期中為企業(yè)創(chuàng)造利潤(rùn)的總和,以及將來(lái)可能為企業(yè)創(chuàng)造的利潤(rùn)。CLV的模型分類見圖1,模型中將用戶分為最佳用戶、投資用戶、保留用戶和放棄用戶,其中最佳用戶和投資用戶是對(duì)于企業(yè)來(lái)說(shuō)未來(lái)盈利高,保留用戶和放棄用戶的未來(lái)盈利低;而最佳用戶和保留用戶的目前盈利高,投資用戶和放棄用戶目前利潤(rùn)低。
圖1 CLV模型分類圖
(3)用戶價(jià)值矩陣模型
在RFM 模型的基礎(chǔ)上進(jìn)行改進(jìn)得到用戶價(jià)值矩陣模型,用戶價(jià)值矩陣模型解決了用戶消費(fèi)金額和頻率存在線性問題,使用用戶平均消費(fèi)金額代替總金額,構(gòu)建用戶價(jià)值矩陣模型。用戶價(jià)值矩陣模型分類見圖2。其中,樂于消費(fèi)型用戶和最好用戶的平均消費(fèi)金額高,最好用戶和經(jīng)常型用戶消費(fèi)頻率高;而不確定型用戶和經(jīng)常型用戶消費(fèi)金額相對(duì)低,樂于消費(fèi)型用戶和不確定型用戶消費(fèi)頻率相對(duì)低。
圖2 用戶價(jià)值矩陣模型圖
RFM 模型中衡量用戶價(jià)值的指標(biāo)有3 個(gè),這種模型對(duì)于傳統(tǒng)的企業(yè)營(yíng)銷模式是有效的,但是隨著電商企業(yè)的發(fā)展,影響用戶價(jià)值的因素變得更加復(fù)雜和多樣,簡(jiǎn)單的3個(gè)指標(biāo)已經(jīng)不能夠滿足用戶價(jià)值的需要,需要增加更多的指標(biāo),因此,需要對(duì)RFM 模型進(jìn)行改進(jìn),使模型在用戶價(jià)值分析中更加準(zhǔn)確。大數(shù)據(jù)技術(shù)的發(fā)展使得價(jià)值分析的數(shù)據(jù)支撐更強(qiáng),改進(jìn)的RFM模型的框架見圖3。在傳統(tǒng)的RFM模型中加入電商用戶價(jià)值的評(píng)價(jià)指標(biāo),從用戶的潛在價(jià)值和當(dāng)前價(jià)值來(lái)評(píng)價(jià)用戶的綜合價(jià)值??蛻魞r(jià)值的細(xì)分指標(biāo)采用因子分析法確定,各指標(biāo)的權(quán)重確定是利用因子分析法和熵值法相結(jié)合。根據(jù)用戶的細(xì)分指標(biāo)使用聚類分析的方法進(jìn)行細(xì)分,識(shí)別用戶價(jià)值。
圖3 改進(jìn)的RFM模型框架
3.2.1 當(dāng)前價(jià)值
RFM中R的值越小,用戶購(gòu)買的時(shí)間間隔短,表示用戶重復(fù)購(gòu)買的可能性越大,這類用戶價(jià)值相對(duì)較高。購(gòu)買頻率F還需要與最近購(gòu)買時(shí)間綜合考慮,因?yàn)殡m然用戶購(gòu)買頻率高,但是最近購(gòu)買時(shí)間與當(dāng)前時(shí)間的間隔R較長(zhǎng),該類型用戶很可能將要流失,因此其價(jià)值在減少[14]。相反,雖然用戶購(gòu)買頻率F較低,但是最近購(gòu)買時(shí)間與當(dāng)前時(shí)間間隔R較短,該用戶反復(fù)購(gòu)買的可能性較大,因此用戶價(jià)值較高。客戶的消費(fèi)金額M越高,表明用戶價(jià)值越高。RFM模型以用戶購(gòu)買行為區(qū)分用戶,RFM模型指標(biāo)中的最近購(gòu)買時(shí)間間隔R、購(gòu)買頻率F、購(gòu)買金額M能夠體現(xiàn)用戶的價(jià)值,也就是用戶對(duì)企業(yè)的當(dāng)前價(jià)值。
3.2.2 潛在價(jià)值
電商企業(yè)盈利模式包括2 方面,一方面是電商用戶購(gòu)買商品或服務(wù)所帶來(lái)的直接利益,另一方面是包括電商用戶在內(nèi)的電商平臺(tái)操作行為帶來(lái)的間接利益。一般情況下,用戶瀏覽一個(gè)平臺(tái)次數(shù)越多、查看商品數(shù)越多,用戶活躍度和忠誠(chéng)度越高,用戶價(jià)值越高。因此,用戶活躍度可以用用戶在電商平臺(tái)的操作行為總數(shù)。同時(shí)用戶收藏和加入購(gòu)物車的行為越多能夠體現(xiàn)用戶購(gòu)買商品的意向,表示購(gòu)買商品的可能性越大。
3.2.3 電商用戶價(jià)值評(píng)價(jià)指標(biāo)
構(gòu)建的新的電商用戶價(jià)值指標(biāo)如圖4。其中:一級(jí)指標(biāo)有當(dāng)前價(jià)值和潛在價(jià)值,一級(jí)指標(biāo)下為二級(jí)指標(biāo),當(dāng)前價(jià)值的二級(jí)指標(biāo)為購(gòu)買價(jià)值,潛在價(jià)值的二級(jí)指標(biāo)為活躍度和購(gòu)買意向;二級(jí)指標(biāo)下是三級(jí)指標(biāo),購(gòu)買價(jià)值的三級(jí)指標(biāo)是傳統(tǒng)RFM 模型中的3 個(gè)指標(biāo),分別為最近消費(fèi)的時(shí)間間隔R、消費(fèi)頻率F和消費(fèi)金額M;活躍度的三級(jí)指標(biāo)是操作行為總數(shù)、點(diǎn)擊商品數(shù)和點(diǎn)擊商品類型數(shù);購(gòu)買意向的三級(jí)指標(biāo)是收藏商品數(shù)、加入購(gòu)物車商品數(shù)和加入購(gòu)物車商品類型數(shù)。
圖4 電商用戶價(jià)值評(píng)價(jià)指標(biāo)
文中選用的數(shù)據(jù)是某電商平臺(tái)一個(gè)月內(nèi)用戶真實(shí)的消費(fèi)行為數(shù)據(jù)。數(shù)據(jù)集中包括8 個(gè)字段,共有123 656 819 條記錄,每一條記錄代表一個(gè)行為事件。其中,behavior_type 包括用戶對(duì)商品瀏覽行為、加購(gòu)物車行為和購(gòu)買商品的行為。文中實(shí)驗(yàn)選取用戶的交互行為大于10 次的原始數(shù)據(jù)進(jìn)行驗(yàn)證,這樣的用戶有1 500個(gè),共60 015條記錄。數(shù)據(jù)原始格式見表1。
表1 數(shù)據(jù)原始格式
原始數(shù)據(jù)需要進(jìn)行處理才能應(yīng)用到實(shí)驗(yàn)中,文中使用線性變換將數(shù)據(jù)進(jìn)行映射,實(shí)現(xiàn)數(shù)據(jù)的可比性。數(shù)據(jù)指標(biāo)分為正向和逆向2 種,正向指標(biāo)的值越大越好,逆向指標(biāo)的值越小越好。因此,數(shù)據(jù)的標(biāo)準(zhǔn)化處理方法不盡相同。正向指標(biāo)處理采用公式(1)進(jìn)行計(jì)算,逆向指標(biāo)處理采用公式(2)進(jìn)行計(jì)算。
4.3.1 因子適用性分析
文中首先采用檢驗(yàn)統(tǒng)計(jì)量KMO(Kaiser-Meyer-Olkin)和球形檢驗(yàn)Bartlett’s 對(duì)因子的適用性進(jìn)行分析。文中使用SPSS 26軟件對(duì)指標(biāo)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),得到KMO和Bartlett’s球形檢驗(yàn)的結(jié)果,KMO取樣適切性量數(shù)為0.649,其值大于0.5的,Bartlett’s球形檢驗(yàn)的卡方統(tǒng)計(jì)顯著性為0.000,其值小于0.05,因此得出結(jié)論,KMO 越大,表示被檢驗(yàn)的變量之間具有較強(qiáng)的相關(guān)性,研究的數(shù)據(jù)比較適合因子分析。如果這個(gè)值較小,如KMO<0.5,研究的數(shù)據(jù)則不適合因子分析。在使用Bartlett's 時(shí),卡方統(tǒng)計(jì)量顯著性小于0.05時(shí),則單位矩陣和系數(shù)矩陣之間差異較大。論文對(duì)指標(biāo)數(shù)據(jù)進(jìn)行處理,得到KMO和Bartlett's 的結(jié)果。KMO的值大于0.5,KMO=0.649,Bartlett's 的自由度為 27,近似卡方值為9 355.321,Bartlett’s 的卡方統(tǒng)計(jì)顯著性為 0.000,小于0.05。結(jié)果表明,所使用的數(shù)據(jù)適合因子分析。公因子方差中提取了8個(gè)變量的共同度,包括總操作數(shù)、用戶點(diǎn)擊商品數(shù)、用戶點(diǎn)擊商品類型數(shù)、最近消費(fèi)的時(shí)間間隔數(shù)、消費(fèi)頻率、消費(fèi)金額、加購(gòu)物車商品數(shù)和加購(gòu)物車商品類型數(shù),這些變量的共同度都超過(guò)0.5,說(shuō)明變量提取的因子說(shuō)明度高,適合因子分析。
4.3.2 公共因子的處理
對(duì)處理后的數(shù)據(jù)提取特征值大于1 的因子作為公共因子,表2 為變量的方差解釋。提取的公共因子為3 個(gè),累計(jì)方差貢獻(xiàn)率為83.489%,說(shuō)明這3 個(gè)因子可以解釋大多數(shù)電商用戶價(jià)值評(píng)價(jià)指標(biāo)。表2 前3 個(gè)公共因子的特征值均大于1,從第4 個(gè)公共因子開始特征值變化幅度不大,因此,提取3 個(gè)特征因子是比較合理的。
表2 變量的方差解釋
對(duì)各成分?jǐn)?shù)據(jù)通過(guò)凱撒正態(tài)化最大方差法進(jìn)行正交旋轉(zhuǎn)。如果在一個(gè)公共因子上某變量的荷載成分較大,說(shuō)明該公共因子能很好地反映該變量的信息。因此,文中提取了3類公共因子。
第1 類公共因子包括總操作行為數(shù)、用戶點(diǎn)擊商品數(shù)和用戶點(diǎn)擊商品類型數(shù),將它們定義為“活躍度”指標(biāo);第2類公共因子包括用戶最近消費(fèi)時(shí)間間隔、用戶的消費(fèi)頻率和用戶消費(fèi)金額,將該類因子歸為“購(gòu)買價(jià)值”指標(biāo);第3 類公共因子包括用戶加購(gòu)商品數(shù)和用戶加購(gòu)商品類型數(shù),將該類因子其歸為“購(gòu)買意向”指標(biāo)。
通過(guò)各成分旋轉(zhuǎn)矩陣得到成分得分系數(shù)矩陣見表3。根據(jù)所提取出的公共因子的得分系數(shù)矩陣,可以得出每個(gè)公共因子的分?jǐn)?shù)。
表3 成分得分系數(shù)矩陣
每個(gè)因子的得分計(jì)算公式:
根據(jù)表2 的數(shù)據(jù)可以得到變量攜帶信息的貢獻(xiàn)率,得到購(gòu)買價(jià)值、活躍度和購(gòu)買意向3 個(gè)指標(biāo)的權(quán)重,分別為0.259 8、0.320 1、0.249 9,對(duì)它們進(jìn)行歸一化處理得到權(quán)重值根據(jù)計(jì)算公式:
通過(guò)活躍度指標(biāo)、購(gòu)買價(jià)值和購(gòu)買意向的因子分析,得到電商用戶價(jià)值評(píng)價(jià)指標(biāo)見表4。
表4 電商用戶價(jià)值評(píng)價(jià)指標(biāo)
從表4 可以看出,活躍度和購(gòu)買意向可以表示出用戶的需求,潛在價(jià)值可以根據(jù)用戶的需求衡量。用戶越活躍,購(gòu)買意向越強(qiáng)烈,消費(fèi)的可能性越大。用戶的價(jià)值細(xì)分指標(biāo)可以選擇潛在價(jià)值和當(dāng)前價(jià)值來(lái)體現(xiàn)。潛在價(jià)值是活躍度和購(gòu)買意向的加權(quán)和。因此,細(xì)分指標(biāo)的公式如(5)和(6),其中,V pva代表潛在價(jià)值,V cva代表當(dāng)前價(jià)值。
文中采用K-means 聚類方法對(duì)用戶等級(jí)劃分,對(duì)它們的價(jià)值進(jìn)行判定。通過(guò)聚類細(xì)分,對(duì)電商用戶的價(jià)值和行為特征進(jìn)行識(shí)別。從訓(xùn)練集隨機(jī)選取K個(gè)聚類中心,采用輪廓系數(shù)法和肘部法則選出最合理的K值。圖5 為不同K值對(duì)應(yīng)的組內(nèi)誤差平方和,當(dāng)K=4時(shí),輪廓系數(shù)為最大值0.870 5,此時(shí)的值為最優(yōu),最佳的聚類數(shù)選擇4。由此分析得出,電商平臺(tái)用戶分為4類。
圖5 不同K值對(duì)應(yīng)的組內(nèi)誤差平方和
根據(jù)圖5 中的數(shù)據(jù),能夠得到傳統(tǒng)RFM 模型和改進(jìn)的RFM 模型用戶類內(nèi)平均距離。改進(jìn)的RFM 模型類內(nèi)緊密程度高于原始的RFM 模型。傳統(tǒng)RFM 模型的輪廓系數(shù)小于改進(jìn)的模型。因此,文中改進(jìn)后的模型聚類效果更好,對(duì)電商用戶價(jià)值細(xì)分更優(yōu)。根據(jù)分析得出,用戶價(jià)值從高到低分別為類別1、類別2、類別3和類別4,類別越高表明對(duì)企業(yè)具有更高的忠誠(chéng)度。
我國(guó)電子商務(wù)發(fā)展迅速,電商平臺(tái)上的消費(fèi)者數(shù)量不斷增加,為電商企業(yè)帶來(lái)了激烈的競(jìng)爭(zhēng)。文中利用真實(shí)的電商客戶行為數(shù)據(jù),采用機(jī)器學(xué)習(xí)算法對(duì)客戶行為數(shù)據(jù)進(jìn)行分析處理,構(gòu)建電商客戶價(jià)值識(shí)別模型。首先,介紹用戶價(jià)值理論和用戶價(jià)值模型,對(duì)用戶價(jià)值模型RFM 模型、CLV 模型、用戶價(jià)值矩陣模型分別進(jìn)行介紹;然后對(duì)傳統(tǒng)的RFM 模型進(jìn)行了改進(jìn),構(gòu)建了改進(jìn)的RFM模型框架;最后在改進(jìn)的RFM模型中采用因子分析法確定電商用戶的價(jià)值細(xì)分指標(biāo),結(jié)合K-means聚類算法對(duì)電商用戶進(jìn)行聚類分析和價(jià)值細(xì)分,識(shí)別出不同類別電商用戶的特征。該研究成果能夠?yàn)殡娚唐脚_(tái)提供用戶價(jià)值分析、預(yù)測(cè),從而實(shí)現(xiàn)差異化服務(wù),為電商企業(yè)制定市場(chǎng)營(yíng)銷策略提供依據(jù),提高企業(yè)的經(jīng)濟(jì)效益。