蔡秋茹,柳益君,羅 燁,葉飛躍
摘 要:電信業(yè)是典型的數(shù)據(jù)密集行業(yè),數(shù)據(jù)挖掘應(yīng)用開發(fā)對(duì)電信企業(yè)的發(fā)展有重要意義。其中,客戶分群可以準(zhǔn)確認(rèn)識(shí)客戶總體構(gòu)成,使得服務(wù)和營銷更具針對(duì)性。在此以常州市電信企業(yè)為例,利用商業(yè)數(shù)據(jù)挖掘自動(dòng)化軟件KXEN給出電信客戶分群的解決方案。實(shí)踐證明,利用KXEN軟件不僅大量減少了建模時(shí)間,而且得到的解決方案是成功有效的。
關(guān)鍵詞:數(shù)據(jù)挖掘;電信企業(yè);客戶分群;KXEN軟件
中圖分類號(hào):TP31113文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-373X(2009)20-097-03
Research on Telecom Customer Segmentation Based on KXEN
CAI Qiuru,LIU Yijun,LUO Ye,YE Feiyue
(Jiangsu Teachers University of Technology,Changzhou,213001,China)
Abstract:Data mining application is very vital for Telecom.Customer segmentation can analyze customer composition and promote serve quality.In this study,a resolution of customer segmentation for Changzhou Telecom in Jiangsu province is proposed based on the commercial automatic data mining tool KXEN.Results show that KXEN saves much modeling time and the resolution is efficient.
Keywords:data mining;telecom;customer segmentation;KXEN software
0 引 言
隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,尤其是數(shù)據(jù)庫技術(shù)的普及,人們面臨著日益擴(kuò)張的數(shù)據(jù)海洋,原來的數(shù)據(jù)分析工具已無法有效地為決策者提供決策支持所需要的相關(guān)知識(shí),從而形成一種獨(dú)特的現(xiàn)象“豐富的數(shù)據(jù),貧乏的知識(shí)”。數(shù)據(jù)挖掘又稱為數(shù)據(jù)庫中知識(shí)發(fā)現(xiàn),它是一個(gè)從大量數(shù)據(jù)中抽取挖掘出未知的、有價(jià)值的模式或規(guī)律等知識(shí)的復(fù)雜過程。目的是在大量的數(shù)據(jù)中發(fā)現(xiàn)人們感興趣的知識(shí) [1-3]。
電信業(yè)是典型的數(shù)據(jù)密集行業(yè),利用數(shù)據(jù)挖掘得到有用的知識(shí),能更好地向用戶提供服務(wù),發(fā)現(xiàn)更多的商機(jī)。電信的數(shù)據(jù)挖掘應(yīng)用開發(fā),主要包括客戶分群、客戶流失分析、客戶發(fā)展分析、客戶行為分析等專題分析??蛻舴秩阂庵父鶕?jù)一個(gè)或多個(gè)客戶屬性組合把所有客戶劃分成不同的類,同類內(nèi)的客戶具有最大的相似性,異類間的客戶具有最大的差異性。通過對(duì)客戶合理的類別劃分,并對(duì)當(dāng)前客戶以及預(yù)期的客戶群做區(qū)段分析,判斷不同區(qū)段的突出特點(diǎn),對(duì)客戶總體構(gòu)成有準(zhǔn)確的認(rèn)識(shí),對(duì)客戶的服務(wù)和營銷更具針對(duì)性[4-7]。對(duì)客戶分群可以達(dá)到如下目標(biāo):
(1) 了解客戶的總體構(gòu)成;
(2) 了解各種客戶價(jià)值的客戶群體特征;
(3) 了解流失客戶的客戶群體特征;
(4) 了解客戶群體的消費(fèi)特征;
(5) 了解各信用等級(jí)的客戶群體特征。
客戶分群后的結(jié)果可應(yīng)用于:對(duì)不同價(jià)值分段的客戶進(jìn)一步分析以了解各個(gè)分段的客戶組成;對(duì)流失傾向高的客戶進(jìn)一步細(xì)分以采取不同的挽留策略;對(duì)交叉銷售的目標(biāo)客戶進(jìn)一步細(xì)分以采取不同的行銷策略。
常用的數(shù)據(jù)挖掘技術(shù)包括關(guān)聯(lián)分析、異類分析、分類與預(yù)測、聚類分析以及演化分析等。其中,聚類分析可以解決客戶分群問題。
1 KXEN特點(diǎn)分析
KXEN是三大數(shù)據(jù)挖掘軟件(SAS/EM,KXEN,SPSS/Clementine)之一,與其他兩者不同,KXEN專注數(shù)據(jù)挖掘的高端技術(shù),是面向結(jié)果、而不是面向方法的。用戶不需要專業(yè)的統(tǒng)計(jì)學(xué)背景和機(jī)器學(xué)習(xí)的理論,而只需要知道數(shù)據(jù)和分析的問題,對(duì)于每種問題,KXEN都提供一種簡單的解決方案。商業(yè)數(shù)據(jù)挖掘自動(dòng)化軟件KXEN具有以下特點(diǎn)[8,9] :
(1) 在數(shù)據(jù)準(zhǔn)備階段,KXEN可以自動(dòng)處理缺失值、奇異值、進(jìn)行自動(dòng)化編碼。KXEN獨(dú)特的預(yù)處理編碼技術(shù)和特征選擇方式,大量減少了建模時(shí)間。
(2) KXEN在建模時(shí)不用額外的磁盤空間來存儲(chǔ)數(shù)據(jù),數(shù)據(jù)直接在數(shù)據(jù)倉庫內(nèi)部處理,很好地利用了數(shù)據(jù)倉庫的性能,節(jié)省硬件成本,符合現(xiàn)在的Knowledge Discovery in Database的理念。
(3) KXEN共有四個(gè)模塊(穩(wěn)健回歸、聰明分群、關(guān)聯(lián)規(guī)則和時(shí)間序列)來解決所有的商業(yè)數(shù)據(jù)挖掘問題。一個(gè)商業(yè)問題只有一種算法,因此不需要用戶選擇算法。所有算法都基于Vapnik的結(jié)構(gòu)風(fēng)險(xiǎn)最小化(Structured Risk Minimization)理論。
(4) KXEN進(jìn)行自動(dòng)建模,不需要進(jìn)行模型的參數(shù)設(shè)置,KXEN引擎采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論,找到最佳模型。
(5) 結(jié)果的可解釋性。KXEN所有組件的設(shè)計(jì)都使之對(duì)最終用戶呈現(xiàn)有意義的結(jié)果。
由于上述特點(diǎn),KXEN改變了傳統(tǒng)的數(shù)據(jù)挖掘方法,數(shù)據(jù)準(zhǔn)備時(shí)間從以前的占整個(gè)建模周期的70%到現(xiàn)在的幾乎不用花時(shí)間(見圖1和圖2)。而KXEN的模型與傳統(tǒng)工具創(chuàng)建的模型一樣精確健壯。
圖1 傳統(tǒng)的數(shù)據(jù)挖掘方法
圖2 基于KXEN的數(shù)據(jù)挖掘方法
2 實(shí)例研究
2.1 業(yè)務(wù)問題
電信運(yùn)營商定義的客戶分群的商業(yè)目標(biāo)是“對(duì)市數(shù)十萬公眾客戶,從價(jià)值和行為的分析維度進(jìn)行客戶分群,以了解不同客戶群的消費(fèi)行為特征,為發(fā)展新業(yè)務(wù)、流失客戶保有、他網(wǎng)用戶爭奪的針對(duì)性營銷策略的制訂提供分析依據(jù),并實(shí)現(xiàn)企業(yè)保存量、激增量的戰(zhàn)略目標(biāo)”。將此商業(yè)目標(biāo)轉(zhuǎn)化為數(shù)據(jù)挖掘的可行性方案:從價(jià)值和行為維度,考察客戶業(yè)務(wù)擁有與使用、消費(fèi)行為變化、他網(wǎng)業(yè)務(wù)滲透等方面屬性,采用聚類分析的數(shù)據(jù)挖掘技術(shù)對(duì)研究的目標(biāo)客戶進(jìn)行客戶分群,對(duì)各客戶群進(jìn)行特征刻畫和屬性分析,為針對(duì)性營銷確定目標(biāo)客戶群,并根據(jù)客戶群屬性和營銷目標(biāo)量體裁衣制訂恰當(dāng)?shù)臓I銷方案。
2.2 應(yīng)用分析
這里在常州選擇了營銷服務(wù)相對(duì)薄弱的小型商客作為目標(biāo)客戶群,取得目標(biāo)客戶群的近一年的相關(guān)數(shù)據(jù)。其中小型商客是指客戶有1,2門電話、小靈通的客戶,不包含已經(jīng)安裝寬帶的客戶,有效小型商客為23 074戶?;A(chǔ)表涵蓋了以下數(shù)據(jù):
(1) 用戶及客戶的基本信息:包括客戶身份信息、聯(lián)系方式、產(chǎn)品擁有情況、入網(wǎng)時(shí)長、服務(wù)開通情況、優(yōu)惠套餐信息、客戶服務(wù)信息(投訴、咨詢、催繳情況)等;
(2) 價(jià)值信息:包括業(yè)務(wù)月租費(fèi)、使用費(fèi)、優(yōu)惠費(fèi)用及增值業(yè)務(wù)、新業(yè)務(wù)、信息費(fèi)和卡類、結(jié)算費(fèi)用、繳欠費(fèi)信息等;
(3) 行為信息:包括時(shí)長、次數(shù)、跳次、發(fā)話不同號(hào)碼數(shù)、時(shí)長集中度、次數(shù)集中度等。
KXEN軟件分群采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化的K-Means算法實(shí)現(xiàn)。這里使用KXEN軟件從價(jià)值緯度(V)將客戶分為6個(gè)價(jià)值分群,從行為緯度(B)將客戶分為5個(gè)行為分群。其中參加分群的V變量有21個(gè),B變量有15個(gè)。然后對(duì)V變量按總費(fèi)用進(jìn)行群排序,形成VB矩陣交叉圖(見圖3和圖4)。在組成的交叉矩陣中選出1 000人以上的8個(gè)戰(zhàn)略客戶群SS1-SS8,共有客戶17 128戶,占總客戶的比例為74.23%。
圖3 客戶群VB矩陣交叉圖
圖4 小商客戰(zhàn)略群(SS1-SS8)矩陣圖
根據(jù)分群結(jié)果,計(jì)算出每個(gè)群的平均收入進(jìn)行客戶價(jià)值分析:
ARPU=客戶群總收入/m
式中:m為該群客戶人數(shù),ARPU(Average Revenue Per User)為每用戶平均收入。圖5是各群分布?xì)馀輬D。圖5中氣泡的大小代表客戶數(shù)的多少。SS7,SS8客戶群最大。橫軸方向越靠右,表明客戶價(jià)值越高。SS1,SS2,SS3群為高值的小商客;SS7,SS8為低值小商客。縱軸表明客戶的消費(fèi)趨勢(shì)值情況,橫軸以下為下降趨勢(shì),偏離越多,下降值越大。SS2群下降最多,SS1上升最為明顯。
以中值下降的SS6戰(zhàn)略客戶群為例進(jìn)行特征分析,可得到該群特征如下:
(1) 群為中值下降群,ARPU值為93.35元??傎M(fèi)用趨勢(shì)下降較明顯,月均下降5.28元,各項(xiàng)費(fèi)用均呈下降趨勢(shì)。
(2) 該群客戶為長話低值客戶,長話主要使用傳統(tǒng)長途。
(3) 使用他網(wǎng)卡較多,但他網(wǎng)IP卡下降趨勢(shì)明顯。SS6群使用非電信卡消費(fèi)均值最高,長話流失嚴(yán)重。
針對(duì)上述情況,采用的營銷策略是用超級(jí)IP、商務(wù)行、17908卡等有針對(duì)性地開展策反工作。
圖5 小商客戰(zhàn)略群(SS1-SS8)分布?xì)馀輬D
3 結(jié) 語
數(shù)據(jù)挖掘可以對(duì)大量數(shù)據(jù)進(jìn)行自動(dòng)分析,學(xué)習(xí)新的潛在模式。聚類分析能夠解決客戶分群問題,從而應(yīng)用于電信目標(biāo)市場營銷[10]。在此采用數(shù)據(jù)挖掘工具KXEN,并依據(jù)其方法給出一個(gè)電信客戶分群的解決方案。實(shí)踐證明這里提供的電信目標(biāo)市場營銷客戶分群的解決方案是成功有效的。
參考文獻(xiàn)
[1]張建萍,劉希玉.基于聚類分析的K-means算法研究及應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2007(5):166-168.
[2]朱明.數(shù)據(jù)挖掘[M].2版.合肥:中國科學(xué)技術(shù)大學(xué)出版社,2008.
[3]Olson D,石勇.商業(yè)數(shù)據(jù)挖掘?qū)д揫M].呂巍,譯.北京:北京機(jī)械工業(yè)出版社,2007.
[4]陶露菁.基于數(shù)據(jù)挖掘的電信客戶分群設(shè)計(jì)和實(shí)現(xiàn)[D].南京:南京大學(xué),2005.
[5]鄧曉梅.基于數(shù)據(jù)挖掘的電信客戶細(xì)分模型研究[D].大連:大連理工大學(xué),2006.
[6]張國祚.DW,OLAP和DM在電信經(jīng)營分析系統(tǒng)中的研究與應(yīng)用[D].南京:南京郵電學(xué)院,2005.
[7]蘇寧軍.采用聚類分析的數(shù)據(jù)挖掘技術(shù)進(jìn)行電信市場客戶分群[EB/OL].http://www.billingchina.com/html/2006-07-03/1726.html,2006.
[8]劉文.凱森(KXEN)商業(yè)數(shù)據(jù)挖掘[EB/OL].http://www.datom-i.com,2008.
[9]劉文.KXEN市場細(xì)分教程[EB/OL].http://www.amteam.org/print.aspx?id=606090,2007.
[10]張永紅.電信大客戶營銷[M].北京:人民郵電出版社,2008.