摘 ?要:RFM模型是客戶價值細分的一種方法和手段,在不同領域的應用中會有一定的差異性。闡述了客戶價值分析的分析方法和分析過程,分析了影響奢侈品電商企業(yè)客戶購買行為的重要因素,構建了一種改進的RFM模型為RFMLC模型,闡述了使用RFMLC模型實現(xiàn)大客戶跟蹤分析過程。該系統(tǒng)在業(yè)務運行中表明有一定的使用價值,對開發(fā)企業(yè)客戶價值分析系統(tǒng)有一定的參考價值和借鑒作用。
關鍵詞:RFM模型;客戶活躍度;消費能力;K-means算法
中圖分類號:TP18;TP391 ? ? ? 文獻標識碼:A文章編號:2096-4706(2021)13-0173-03
To Achieve Key Customer Tracking Analysis of E-commerce Enterprise ERP System Based on K-means Algorithm
DAI Yuanquan
(School of Information Engineering, Hubei Light Industry Technology Institute, Wuhan ?430070, China)
Abstract: RFM model is a method and means of customer value segmentation, and there will be some differences in the application of different fields. This paper expounds the analysis method and analysis process of customer value analysis, analyzes the important factors affecting the customer purchase behavior of luxury E-commerce enterprises, constructs an improved RFM model as RFMLC model, and expounds the implementation of key customer tracking analysis process by using RFMLC model. The system has certain use value in business operation, and has certain reference value and function for developing enterprise customer value analysis system.
Keywords: RFM model; customer activity; consumption capacity; K-means algorithm
0 ?引 ?言
某奢侈品經銷企業(yè)主要通過天貓、淘寶、京東等第三方平臺銷售商品,同時,也通過拼多多、云集、短視頻平臺、微信銷售商品,甚至還通過線下實體店銷售商品。該電商企業(yè)銷售渠道復雜,貨源來源廣,客戶分布廣而且構成復雜,需要整合各種資源,開發(fā)電商企業(yè)的ERP系統(tǒng)。ERP系統(tǒng)中的大客戶跟蹤管理顯得尤為重要。電商企業(yè)需要針對不同類型客戶,進行精準營銷,實現(xiàn)利潤最大化,建立合理的客戶價值評估模型,進行客戶分類,是解決問題的關鍵。
1 ?分析方法與過程
該電商企業(yè)ERP系統(tǒng)中的大客戶跟蹤分析的目標是首先根據客戶的相關數據,對客戶進行聚類分析,然后衡量客戶價值,識別出大客戶,再針對大客戶制定個性化的溝通和營銷服務。
1.1 ?分析方法
RFM模型[1]是進行客戶價值分析的一種方法。該方法是基于三個指標即R、F和M。其指標體系如表1所示。
應用這些信息能夠預測客戶的購買行為[2]。若采用傳統(tǒng)RFM模型分析,其缺點是細分客戶群太多,導致難以形成對每個客戶群的準確把握,精準營銷成本太高。另外,由于RFM分析指標中的購買次數與同期總購買金額存在多重共線性,即一個給定客戶每多購買一次,總價值也相應增加,這就降低了RFM分析的有效性[3]。實際應用中還需考慮其他指標。
客戶忠誠度是指客戶對某一特定產品或服務、品牌、商家有較強的好感,并形成了偏好,進而重復購買的一種情感與態(tài)度趨向[4]。通過企業(yè)組織的各種活動可以深入了解客戶,主動把握客戶的需求,最終實現(xiàn)客戶的忠誠度的提升。客戶若能很積極參與公司活動,在一定程度上表明該客戶的忠誠度高。因此選定指標活躍度Liveness,計作L。
客戶的消費能力決定著成交的金額,也可以縮短咨詢時間,更決定著這個單是否成交[5]。針對不同客戶的消費能力制定銷售方法,有針對性的銷售方式可以大大增加產品銷售的成功率。因此選定指標消費能力consumption capacity,計作C。
基于以上分析,本案例中,作為電商企業(yè)識別客戶價值指標,記為RFMLC模型。
1.2 ?分析過程
某電商企業(yè)ERP系統(tǒng)中的大客戶跟蹤分析的分析過程如圖1所示。
主要包括以下幾個步驟:
(1)ERP系統(tǒng)中的業(yè)務生產的數據存于關系數據庫、非結構化數據以及檔案文件中。從數據源中抽取數據,包括選擇性抽取與新增數據抽取,形成歷史數據和增量數據。
(2)進行數據處理,主要是缺失值與異常分析、數據清洗、數據的屬性規(guī)約和數據標準化處理。
(3)分析客戶購買行為的影響因素,進行建模,構建RFMLC模型。
(4)編碼實現(xiàn),采用K-means算法進行客戶分群,進行聚類分析、分類分析和關聯(lián)規(guī)則分析,識別有價值客戶。
(5)針對模型結果得到不同價值的客戶,采用不同的營銷手段,提供定制化的營銷服務,設計針對性的優(yōu)惠與關懷。
2 ?實現(xiàn)過程
2.1 ?抽取數據
一般原始數據通常包含很多字段,最為關心的就是3個字段:客戶編號、購買時間、購買金額。
R=當前日期-最近一次購買日期,轉換為天數。
F=給定時間內購買次數綜合
M=給定時間內購買金額總和
L=給定時間內參加公司活動的次數,從ERP的子系統(tǒng)“客戶關懷”數據庫表中統(tǒng)計。
C值計算較為復雜。電商上的交易數據,“最低消費金額”“最高消費金額”“平均每次購買消費金額”,通過這幾個指標來計算出一個值,表示一個消費者的消費能力強弱。即為C值。本案例中,采用PERT分析模型的三點估算法。即:
期望消費金額=(最高消費金額+4×平均消費金額
+最低消費金額)/6
2.2 ?數據處理
首先數據清洗。對數據進行初步加工,因為數據源中很多臟數據,會影響我們的分析結果,需要先將其篩選出去,比如一些空值、異常值、特殊文本顯示等等。主要對數據進行缺失值和異常值分析。查找每列屬性觀測值中空值、0值、最大值、最小值,丟棄數據項為NULL的記錄,丟棄F、M、C值為0的記錄。得到如表2所示的樣本數據。
然后,規(guī)約屬性。在RFMLC模型中,R值為最近一次購買距離當前日期的間隔,轉換為天數。理論上R值越小的客戶是價值越高的客戶,與F、M等指標是負相關性。在進行分析計算是采用1/R的倒數的形式。
再進行數據標準化處理。數據標準化最典型的就是數據的歸一化,即將數據統(tǒng)一映射到[0,1]區(qū)間上。本案例采用z-score法。
z-score標準化是將原始數據x的均值(mean)、標準差(standard deviation)使用z-score標準化到y(tǒng)。這種方法適用于屬性A的最大值和最小值未知的情況,或有超出取值范圍的離群數據的情況[6]。
2.3 ?編碼實現(xiàn)
本案例使用Java語言編寫,采用K-means算法。K-means作為一種無監(jiān)督聚類算法在各種業(yè)務場景中得到較為普及的運用。K-means是將給定數據集中的數據使用其不同特征進行聚類的算法模型,將數據集分為K個不同的簇,且每個簇的聚類核心點采用簇中所含值的平均值計算而來[7]。
編寫方法為getClustering(DataArraydataArray,int k),實現(xiàn)K-means的聚類,聚類后的數據存于ClusterArray中,代碼具體為:
/**運行k-means算法進行聚類*/
public ClusterArraygetClustering(DataArraydataArray, int k) {
ClusterArrayclusterArray = new ClusterA();
dataArray.clearIsAllocated(); ?//清除數據分配
//創(chuàng)建初始的簇
clusterArray.add(createClusterWithRandomlySelectedDataPoint(dataArray));
//如果簇沒達到所定義的簇數量,則創(chuàng)建新簇
while (clusterArray.size() < k) {
clusterArray.add(createClusterBasedFurthestData(dataArray, clusterArray));
}
//開始迭代
int i=0;
for (; i<clusteringIterations; i++) {
//基于質心和數據點的距離,分配沒有分配的數據
assignUnallocatedDataPoints(dataArray, clusterArray);
//更新質心,取每個簇所有數據點的各維度的均值
clusterArray.updateCentroids();
if (i<clusteringIterations - 1) {
//清空簇,重新迭代
clusterArray.clear();
}
}
return clusterArray;
}
其中DataArray 為產生的數據,K聚類個數。簇的個數K是手動指定的,每一個簇經過其聚類核心點(即簇中所有點的中心)來描述。本例中K為5,如表3所示。
3 ?模型應用
根據聚類分析得到的客戶群結構如表4所示。
針對不同的客戶,實施客戶關懷和營銷方案。對重要價值客戶進行提醒或促銷活動,提高客戶滿意度;對重要深耕客戶實施客戶跟蹤分析;對重要挽留客戶從公司的活動入手。
4 ?結 ?論
RFM模型是測算消費者價值最重要也是最容易的方法,這充分的表現(xiàn)了這三個指標對營銷活動的指導意義。但在奢侈品行業(yè)的電商企業(yè)中,業(yè)務方除了消費金額、頻次以外,還會考慮客戶的跨場景使用,客戶的活躍度和消費能力是主要的影響因子。本案例中改進了RFM模型,采用K-Means算法對客戶數據進行客戶分群,聚成五類,在實際開發(fā)中得到了應用,并且效果較好。
參考文獻:
[1] 林盛,肖旭.基于RFM的電信客戶市場細分方法 [J].哈爾濱工業(yè)大學學報,2006(5):758-760.
[2] 楊玉梅.基于信息熵改進的K-means動態(tài)聚類算法 [J].重慶郵電大學學報(自然科學版),2016,28(2):254-259.
[3] 蒲曉川,黃俊麗,祁寧,等.基于密度信息熵的K-Means算法在客戶細分中的應用 [J].吉林大學學報(理學版),2021,59(5):1245-1251.
[4] 陳新華.基于K-Means改進的算法在客戶聚類中的應用 [J].信息通信,2020(9):35-37.
[5] 喬文瑄,楊小勇.平臺經濟下消費力的發(fā)展及其提升研究 [J].消費經濟,2021,37(3):12-19.
[6] 姜朋,李挺.基于大數據的航空客戶價值分析 [J].民航學報,2019,3(3):1-4.
[7] 馬培梁.基于K-means算法的數據挖掘與客戶細分研究 [J].市場研究,2019(11):66-67.
作者簡介:戴遠泉(1965—),男,漢族,湖北黃梅人,副教授,碩士研究生,研究方向:軟件開發(fā)、大數據應用開發(fā)。