崔雯 李劍鋒
摘 要:隨著經(jīng)濟(jì)全球化及大數(shù)據(jù)技術(shù)的蓬勃發(fā)展,跨國(guó)零售商之間的競(jìng)爭(zhēng)日益激烈,根據(jù)客戶特征進(jìn)行客戶細(xì)分,協(xié)助客戶進(jìn)行個(gè)性化的服務(wù)體驗(yàn),有利于跨國(guó)零售商實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)和高效的客戶關(guān)系管理。為了提高客戶細(xì)分的精度,本文提出一種基于RFM模型的K-means聚類(lèi)算法,使用簇內(nèi)誤方差(SSE)和輪廓系數(shù)(Silhouette Coefficient)計(jì)算聚類(lèi)個(gè)數(shù),優(yōu)化K值選取。本文選取一家跨國(guó)零售商的數(shù)據(jù)進(jìn)行實(shí)證檢驗(yàn),對(duì)細(xì)分后的結(jié)果進(jìn)行特征分析,將客戶劃分為核心型客戶、維護(hù)型客戶和風(fēng)險(xiǎn)型客戶三種類(lèi)別,并為不同客戶群體提供差異化營(yíng)銷(xiāo)策略,僅供參考。
關(guān)鍵詞:K-means;RFM模型;跨國(guó)零售商;客戶細(xì)分;聚類(lèi)算法
本文索引:崔雯,李劍鋒.<變量 2>[J].中國(guó)商論,2024(09):-040.
中圖分類(lèi)號(hào):F724.2 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-0298(2024)05(a)--04
近年來(lái),隨著全球經(jīng)濟(jì)數(shù)字化浪潮的蓬勃興起,高效的客戶關(guān)系管理和優(yōu)化配置客戶資源的能力是跨國(guó)零售商生存和發(fā)展的關(guān)鍵性因素,激烈的市場(chǎng)競(jìng)爭(zhēng)迫使跨國(guó)零售商逐步從剛性的產(chǎn)品導(dǎo)向轉(zhuǎn)為柔性的客戶導(dǎo)向。然而,不同類(lèi)型的客戶群體消費(fèi)需求不同,若對(duì)所有客戶均采用同樣的營(yíng)銷(xiāo)策略,不僅不能提高客戶的滿意度,還會(huì)造成資源的巨大浪費(fèi)。因此,跨國(guó)零售商要實(shí)現(xiàn)強(qiáng)競(jìng)爭(zhēng)力的客戶管理,就要科學(xué)地甄別不同客戶群體的價(jià)值,定制基于客戶價(jià)值差異的個(gè)性化營(yíng)銷(xiāo)策略。通過(guò)客戶細(xì)分,跨國(guó)零售商可以挖掘客戶的潛在需求,細(xì)分不同客戶群體,對(duì)不同特征的客戶采取個(gè)性化營(yíng)銷(xiāo)策略,從而針對(duì)客戶進(jìn)行合理的資源分配,提高營(yíng)銷(xiāo)效率。
1 相關(guān)研究
隨著客戶對(duì)跨國(guó)零售商的要求越來(lái)越高,跨國(guó)零售商逐步轉(zhuǎn)變傳統(tǒng)的營(yíng)銷(xiāo)模式,開(kāi)始注重客戶體驗(yàn)。在客戶關(guān)系管理(CRM)領(lǐng)域的研究文獻(xiàn)中,Kotler(1999)強(qiáng)調(diào)了一個(gè)關(guān)鍵理念:確立與企業(yè)最具價(jià)值的客戶之間的持久聯(lián)系是CRM戰(zhàn)略的核心[1]。Wyner(1996)明確指出,企業(yè)80%的利潤(rùn)來(lái)自20%的客戶[2]??鐕?guó)零售商的客戶關(guān)系管理也遵循這一模式,如何對(duì)客戶進(jìn)行精準(zhǔn)細(xì)分,識(shí)別不同價(jià)值類(lèi)別的客戶,成為跨國(guó)零售商需要積極思索的問(wèn)題[3]。
在客戶細(xì)分的方法上,K-means聚類(lèi)算法作為一種基于劃分的聚類(lèi)算法,被應(yīng)用于不同的聚類(lèi)場(chǎng)景中。RFM模型及其改進(jìn)模型憑借便捷高效和通俗易懂的優(yōu)勢(shì),占據(jù)著客戶價(jià)值細(xì)分領(lǐng)域的主導(dǎo)地位。許雪晶、林辰瑋(2021)通過(guò)實(shí)驗(yàn)驗(yàn)證RFM模型與K-means方法的結(jié)合使用能夠?qū)ζ髽I(yè)客戶價(jià)值進(jìn)行有效細(xì)分[4]。陳丹紅等(2022)在RFM模型的基礎(chǔ)上,構(gòu)建了融入客戶信用指標(biāo)C的RFMC模型,具有良好的實(shí)驗(yàn)效果[5]。靖立崢、吳增源(2020)引入了客戶消費(fèi)行為特征,構(gòu)建了RFPAV客戶細(xì)分模型[6]。但客戶細(xì)分研究仍需解決以下問(wèn)題:如果聚類(lèi)數(shù)目過(guò)少,則聚類(lèi)客戶分配就不徹底,聚類(lèi)效果不佳;如果聚類(lèi)數(shù)目過(guò)多,則客戶群體細(xì)分就瑣碎,數(shù)據(jù)泛化性受到損害[7]。傳統(tǒng)的K-means聚類(lèi)算法存在人為設(shè)定K值的缺陷,結(jié)果易失真。因此,為提高客戶細(xì)分的精度,本文使用簇內(nèi)誤方差(SSE)和輪廓系數(shù)(Silhouette Coefficient)計(jì)算聚類(lèi)個(gè)數(shù)優(yōu)化K值選取,提出基于RFM模型的K-means 聚類(lèi)算法,按照價(jià)值類(lèi)別的重要程度細(xì)分跨國(guó)零售商客戶群體,并針對(duì)每一類(lèi)細(xì)分群體提出個(gè)性化的營(yíng)銷(xiāo)建議。
2 RFM模型與K-means聚類(lèi)算法
2.1 RFM模型
源自Arthur Hughes在美國(guó)數(shù)據(jù)庫(kù)營(yíng)銷(xiāo)研究所進(jìn)行的企業(yè)用戶分析,RFM模型是一種關(guān)鍵的分類(lèi)手段,用于評(píng)估客戶的價(jià)值及其消費(fèi)行為。該模型在客戶關(guān)系管理(CRM)領(lǐng)域得到了普遍采納,廣泛應(yīng)用于精細(xì)化管理和提升客戶互動(dòng)策略[8]。在客戶行為分析中,R指標(biāo)代表最近消費(fèi)的時(shí)間跨度,具體而言,指的是自客戶最后一次購(gòu)買(mǎi)行為發(fā)生至今所經(jīng)過(guò)的天數(shù);F指標(biāo)則用于衡量消費(fèi)的頻次,反映的是在特定時(shí)間范圍內(nèi)客戶的購(gòu)買(mǎi)次數(shù);M指標(biāo)反映了消費(fèi)的貨幣價(jià)值,即在考察的時(shí)間段內(nèi),客戶的總消費(fèi)支出。這三個(gè)維度共同構(gòu)成了客戶價(jià)值評(píng)估的框架,有助于企業(yè)更精準(zhǔn)地識(shí)別和理解客戶行為模式。
在跨國(guó)零售商想要擴(kuò)大自身業(yè)務(wù),卻無(wú)法一一查看每個(gè)客戶的細(xì)節(jié)時(shí),RFM有助于對(duì)客戶的價(jià)值進(jìn)行合理的評(píng)估,瞄準(zhǔn)最有可能成為跨國(guó)零售商忠實(shí)客戶的群體,重點(diǎn)關(guān)注最有價(jià)值的客戶。
2.2 K-means聚類(lèi)算法
K-means聚類(lèi)算法是一種經(jīng)典有效的無(wú)監(jiān)督學(xué)習(xí)聚類(lèi)算法,數(shù)據(jù)集通過(guò)距離度量被劃分為多個(gè)類(lèi)別群組,其中群組內(nèi)部的樣本表現(xiàn)出較高的相似性,而不同群組間的樣本相似性則相對(duì)較低。該過(guò)程的關(guān)鍵步驟包括:首先,設(shè)定聚類(lèi)中心的初始位置。給定一個(gè)包含n個(gè)數(shù)據(jù)項(xiàng)的數(shù)據(jù)集N,并從中挑選K個(gè)數(shù)據(jù)項(xiàng)作為各類(lèi)別的初始聚類(lèi)中心。其次,進(jìn)行樣本分配,通過(guò)計(jì)算每個(gè)數(shù)據(jù)項(xiàng)到這K個(gè)聚類(lèi)中心的距離,并根據(jù)這些距離將數(shù)據(jù)項(xiàng)分配到與之最接近的聚類(lèi)中心所在的類(lèi)別中,從而構(gòu)建不同的類(lèi)別群組;再次更新聚類(lèi)中心。令i=i+1,利用公式重新對(duì)每個(gè)形成的群組內(nèi)的樣本數(shù)據(jù)計(jì)算其平均值,并將此平均值視作更新后的群組中心,通過(guò)迭代這一過(guò)程,不斷重復(fù)計(jì)算和更新的步驟,直至觀察到群組中心的位置穩(wěn)定,不再發(fā)生顯著變化,得到最終的聚類(lèi)分析結(jié)果。最后,評(píng)估聚類(lèi)效果。
由于聚類(lèi)個(gè)數(shù)K是一個(gè)人為設(shè)定的數(shù)字,不同的 K 值會(huì)產(chǎn)生不同的聚類(lèi)結(jié)果,因此對(duì)于無(wú)監(jiān)督的K-means聚類(lèi)來(lái)說(shuō),兩種廣泛采用的評(píng)估技術(shù)分別是:簇內(nèi)平方和(SSE)和輪廓系數(shù)(Silhouette Coefficient)。通過(guò)觀察SSE在不同K值下的變化,可以找到其學(xué)習(xí)曲線的轉(zhuǎn)折點(diǎn),即“肘部”效應(yīng),這個(gè)點(diǎn)通常被認(rèn)為是K值的較佳選擇。同樣地,輪廓系數(shù)的峰值指示著K值的最佳設(shè)定,當(dāng)K值達(dá)到這兩個(gè)指標(biāo)中的任意一個(gè)時(shí),可以認(rèn)為找到了最佳的聚類(lèi)數(shù)目[9]。
通過(guò)RFM模型對(duì)跨國(guó)零售商數(shù)據(jù)進(jìn)行建模,采用K-means算法進(jìn)行聚類(lèi),以深入理解客戶的購(gòu)買(mǎi)行為,并識(shí)別出各種客戶群體的獨(dú)特消費(fèi)習(xí)慣。
3 客戶細(xì)分實(shí)證分析研究
3.1 操作平臺(tái)及數(shù)據(jù)獲取
將K-means算法應(yīng)用于跨國(guó)零售商的客戶細(xì)分過(guò)程中,本文獲取了一家跨國(guó)零售商在2023年4月11日—2023年6月10日的客戶訂單數(shù)據(jù)作為樣本數(shù)據(jù)信息 ,共計(jì)1000條。研究涉及數(shù)據(jù)集中的字段:訂單編號(hào)、購(gòu)買(mǎi)日期、交易金額、客戶編號(hào),字段及其描述如表1所示。
3.2 數(shù)據(jù)預(yù)處理
首先,進(jìn)行數(shù)據(jù)清洗,清除數(shù)據(jù)為零或空值等異常數(shù)據(jù),處理重復(fù)數(shù)據(jù);其次,將PurchaseDate字段中的時(shí)間戳字段類(lèi)型轉(zhuǎn)換成天數(shù)的形式,以方便計(jì)算R值指標(biāo);最后,結(jié)合RFM模型,對(duì)數(shù)據(jù)進(jìn)行重新統(tǒng)計(jì)整理,分別從三個(gè)維度構(gòu)建客戶價(jià)值細(xì)分特征,RFM模型部分?jǐn)?shù)據(jù)如表2所示。
為消除各指標(biāo)單位不同而對(duì)聚類(lèi)結(jié)果產(chǎn)生影響,在進(jìn)行算法實(shí)驗(yàn)之前,需要對(duì)指標(biāo)提取之后的數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化處理,經(jīng)過(guò)處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1。
標(biāo)準(zhǔn)化公式如(1),其中μ為所有樣本數(shù)據(jù)的均值,σ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差:
標(biāo)準(zhǔn)化后的部分?jǐn)?shù)據(jù)如表3所示,指標(biāo)R、F、M的數(shù)據(jù)全部被轉(zhuǎn)換為無(wú)量綱的數(shù)據(jù)值。
3.3 K-means聚類(lèi)算法實(shí)現(xiàn)
在聚類(lèi)效果評(píng)估的眾多指標(biāo)中,簇內(nèi)平方和(SSE)與輪廓系數(shù)(Silhouette Coefficient)被廣泛認(rèn)為是兩個(gè)關(guān)鍵的性能度量。SSE,也稱(chēng)為簇內(nèi)誤差平方和,代表在多次迭代過(guò)程中,數(shù)據(jù)集中的樣本點(diǎn)與各自群組中心之間的距離的平方和。通常,SSE與K值的關(guān)系圖會(huì)呈現(xiàn)出類(lèi)似手肘的形狀,這個(gè)形狀的轉(zhuǎn)折點(diǎn)通常被認(rèn)為指示著最優(yōu)的K值。SSE的具體計(jì)算公式如下,其中x(i)表示樣本點(diǎn)i,u(j)表示第j簇的質(zhì)心:
輪廓系數(shù)是一個(gè)綜合考量?jī)?nèi)聚度和分離度兩種因素的度量,值域在[-1,1]。輪廓系數(shù)的值越接近1,表示樣本聚類(lèi)效果越好;越接近-1,則表示樣本更應(yīng)分類(lèi)到其他的簇。輪廓系數(shù)公式如下,其中a(i)為樣本點(diǎn)a(i)到同簇樣本點(diǎn)的平均距離,b(i)為樣本點(diǎn)a(i)到其他每個(gè)簇距離平均值的最小值:
本文運(yùn)用sklearn.cluster模塊中的KMeans類(lèi)來(lái)執(zhí)行K-means聚類(lèi)分析,為了評(píng)估聚類(lèi)效果,本文使用sklearn.metrics模塊提供的silhouette_score函數(shù)來(lái)計(jì)算輪廓系數(shù)。通過(guò)這種方法,本文對(duì)K值從2~11進(jìn)行了循環(huán)遍歷,并根據(jù)每個(gè)K值繪制不同 K值下的簇內(nèi)誤方差和輪廓系數(shù),如圖1所示。
由圖1的分析結(jié)果可以觀察到,當(dāng)K值設(shè)定為3時(shí),簇內(nèi)平方和(SSE)呈現(xiàn)出明顯的“肘部”現(xiàn)象,同時(shí)輪廓系數(shù)達(dá)到了其峰值。這一現(xiàn)象表明,在考慮SSE和輪廓系數(shù)這兩個(gè)評(píng)價(jià)標(biāo)準(zhǔn)的情況下,選擇K值為3能夠帶來(lái)最佳的聚類(lèi)性能。
4 聚類(lèi)結(jié)果分析與營(yíng)銷(xiāo)建議
4.1 聚類(lèi)結(jié)果分析
基于RFM模型和K-means聚類(lèi)算法確定客戶的種類(lèi)歸屬K=3,將處理過(guò)的原始數(shù)據(jù)導(dǎo)入客戶的聚類(lèi)模型中,分別對(duì)跨國(guó)零售商的R、F、M指標(biāo)進(jìn)行聚類(lèi)分析,得到3類(lèi)數(shù)據(jù),對(duì)每類(lèi)數(shù)據(jù)的R、F、M值分別計(jì)算均值,所得字段差異性分析結(jié)果如表4所示。
文章通過(guò)對(duì)表4中3類(lèi)群體聚類(lèi)結(jié)果的R、F、M值進(jìn)行分析,可以發(fā)現(xiàn):
(1)類(lèi)別1,此分類(lèi)群體的R值較小,F(xiàn)、M值均較大,說(shuō)明該客戶群體在樣本統(tǒng)計(jì)期內(nèi)消費(fèi)的次數(shù)較多,消費(fèi)金額較大,且近期有過(guò)消費(fèi)行為,對(duì)企業(yè)的貢獻(xiàn)價(jià)值最大但占比最少,是價(jià)值最大的客戶群體,屬于“核心型客戶”。
(2)類(lèi)別2,此分類(lèi)群體的R值最小,但F、M值相對(duì)較小,說(shuō)明該客戶群體近期有過(guò)消費(fèi)行為,貢獻(xiàn)了一定的消費(fèi)金額,但樣本統(tǒng)計(jì)期內(nèi)消費(fèi)的次數(shù)相對(duì)較少。雖然消費(fèi)頻率和消費(fèi)金額都表現(xiàn)一般,但最后一次消費(fèi)的時(shí)間較近,所以這類(lèi)客戶很可能是新得客戶。因此,可將這類(lèi)客戶視為中等價(jià)值客戶群,屬于“維護(hù)型客戶”。
(3)類(lèi)別3,與其他兩種客戶類(lèi)型相比,此群體的R值最大,F(xiàn)、M值較小,說(shuō)明該客戶群體在樣本統(tǒng)計(jì)期內(nèi)消費(fèi)的次數(shù)較少,消費(fèi)金額較少且長(zhǎng)期沒(méi)有過(guò)消費(fèi)行為,是最不活躍和最沒(méi)有價(jià)值的一類(lèi)群體,具有較高的流失風(fēng)險(xiǎn),屬于“風(fēng)險(xiǎn)型客戶”。
4.2 客戶價(jià)值分類(lèi)的策略分析
(1)核心型客戶
核心型客戶是跨國(guó)零售商運(yùn)營(yíng)收益的最大貢獻(xiàn)者,因此需要投入大量精力和資源進(jìn)行持續(xù)維護(hù)和大力發(fā)展??梢酝ㄟ^(guò)信息技術(shù)動(dòng)態(tài)掌握客戶的需求變化,結(jié)合其消費(fèi)行為習(xí)慣為其提供優(yōu)質(zhì)服務(wù),并優(yōu)先推薦新產(chǎn)品。同時(shí),保證價(jià)格優(yōu)惠和產(chǎn)品質(zhì)量,與客戶建立良好的信任關(guān)系,最大程度地滿足客戶的消費(fèi)期望,充分挖掘這類(lèi)客戶的消費(fèi)潛力,提高客戶增購(gòu)復(fù)購(gòu)的意愿。
(2)維護(hù)型客戶
維護(hù)型客戶雖然近期有過(guò)消費(fèi)行為,但可能是新獲得的客戶,具有一定的流失風(fēng)險(xiǎn),因此需要及時(shí)推送客戶可能感興趣的產(chǎn)品,促進(jìn)客戶關(guān)系進(jìn)一步發(fā)展。同時(shí),需要投入一定的資源探尋客戶未能持續(xù)貢獻(xiàn)價(jià)值的原因,清楚問(wèn)題所在后,針對(duì)性地制定相應(yīng)的客戶關(guān)系管理策略來(lái)留存客戶,提高客戶的購(gòu)買(mǎi)頻率,從而有希望向核心型客戶方向發(fā)展。
(3)風(fēng)險(xiǎn)型客戶
風(fēng)險(xiǎn)型客戶消費(fèi)次數(shù)少且長(zhǎng)期沒(méi)有消費(fèi)行為,極具流失風(fēng)險(xiǎn),因此不必投入過(guò)多資源進(jìn)行該類(lèi)客戶的關(guān)系維護(hù)??梢酝ㄟ^(guò)再次將該類(lèi)客戶細(xì)分的方式,針對(duì)不同結(jié)果制定不同的留存措施。對(duì)于再次細(xì)分后價(jià)值較高的客戶,可以通過(guò)發(fā)放優(yōu)惠券等方式進(jìn)行留存維護(hù)。對(duì)于價(jià)值低的客戶,可以選擇直接放棄,從而讓跨國(guó)零售商有限的資源產(chǎn)生最大效益。
5 結(jié)語(yǔ)
客戶關(guān)系管理是跨國(guó)零售商保持競(jìng)爭(zhēng)優(yōu)勢(shì)的前提和關(guān)鍵性因素,跨國(guó)零售商需要提高客戶細(xì)分的準(zhǔn)確性,以實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)和有效的客戶關(guān)系管理。本文針對(duì)現(xiàn)有研究存在的傳統(tǒng)K-means聚類(lèi)算法人為設(shè)定K值易導(dǎo)致聚類(lèi)結(jié)果偏差的不足,在方法上,引入簇內(nèi)平方和(SSE)和輪廓系數(shù)(Silhouette Coefficient)對(duì)K-means聚類(lèi)算法進(jìn)行優(yōu)化,通過(guò)對(duì)一家跨國(guó)零售商客戶數(shù)據(jù)集預(yù)處理后,選取最佳K值,基于RFM模型和K-means聚類(lèi)算法挖掘客戶數(shù)據(jù),將相似特征的客戶歸為一類(lèi),劃分客戶群體為核心型客戶、維護(hù)型客戶和風(fēng)險(xiǎn)型客戶三種類(lèi)別,并為不同客戶群體提供了差異化的營(yíng)銷(xiāo)建議,從而幫助跨國(guó)零售商實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)。
參考文獻(xiàn)
Kotler Philip. Kotler on marketing: how to create, win, and dominate markets[M]. Free Press,1999.
Wyner G A. Customer profitability: linking behavior to economics[J]. Marketing Research,1996, 8(2): 36-38.
劉瀟,王效俐.基于k-means和鄰域粗糙集的航空客戶價(jià)值分類(lèi)研究[J].運(yùn)籌與管理,2021,30(3):104-111.
許雪晶,林辰瑋.基于RFM的電商數(shù)據(jù)客戶價(jià)值細(xì)分實(shí)例研究[J].長(zhǎng)春師范大學(xué)學(xué)報(bào),2021,40(4):60-69.
陳丹紅,彭張林,萬(wàn)德全,等.眾包平臺(tái)用戶價(jià)值識(shí)別與細(xì)分: 基于改進(jìn)的RFM模型[J].計(jì)算機(jī)科學(xué),2022,49(4): 37-42.
靖立崢,吳增源.基于改進(jìn)K-means算法的電子商務(wù)客戶細(xì)分研究[J].中國(guó)計(jì)量大學(xué)學(xué)報(bào),2020,31(4):482-489.
杜科,鄧佳雯,陳繼紅.改進(jìn)RFM模型在房地產(chǎn)客戶細(xì)分中的研究及應(yīng)用[J].電腦知識(shí)與技術(shù),2018,14(19):243-245+251.
HUGHES A. Strategic Database Marketing: The Master Plan for Starling and Managing A Profitable Customer-Based Marketing Program[M]. New York: McGraw-Hill Professional, 1994:231-238.
巫芯宇.基于FTRM模型和K-means算法的大學(xué)生知識(shí)付費(fèi)產(chǎn)品使用行為研究[J].西南大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,43(6): 195-204.