国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘的手機(jī)客戶流失預(yù)警系統(tǒng)

2020-11-06 04:22:52楊英英
現(xiàn)代信息科技 2020年13期
關(guān)鍵詞:決策樹數(shù)據(jù)挖掘預(yù)警

摘 ?要:隨著中國電信業(yè)改革不斷深入,電信市場日趨飽和,各大運(yùn)營商都面臨日益嚴(yán)峻的客戶流失率飆升問題,如何識別高風(fēng)險流失客戶是運(yùn)營商最為關(guān)注的問題。因此,文章借助西安財經(jīng)大學(xué)行知學(xué)院校企合作單位的真實客戶數(shù)據(jù),通過R語言編程,使用數(shù)據(jù)挖掘中的決策樹模型來形成一個系統(tǒng)的客戶流失預(yù)警監(jiān)測過程,幫助合作企業(yè)提前識別高風(fēng)險客戶流失。結(jié)果發(fā)現(xiàn)畫像符合套餐使用月數(shù)在25個月以上、有服務(wù)合約、是集團(tuán)用戶的客戶更不易流失。

關(guān)鍵詞:數(shù)據(jù)挖掘;客戶流失;預(yù)警;決策樹

中圖分類號:TP319 ? ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2020)13-0055-03

Abstract:With the deepening reform of Chinas telecom industry and the saturation of the telecom market,major operators are facing the increasingly serious problem of soaring customer lose rate. How to identify high-risk customer lose is the most concerned issue for operators. Therefore,with the help of the real customer data of school-enterprise cooperation units of Xingzhi College of Xian University of Finance and Economics,this paper through R language programming,uses the decision tree model in data mining to form a systematic early warning and monitoring process of customer lose,and helps cooperative enterprises to identify high-risk customer lose in advance. The results showed that the portrait was more than 25 months old,signed a service contract,and the group users were less likely to lose customers.

Keywords:data mining;customer lose;early warning;decision tree

0 ?引 ?言

我國主要的3家電信運(yùn)營商分別是中國移動、中國電信和中國聯(lián)通。在過去的10年里,這3家公司都得到了極其快速的發(fā)展。這種發(fā)展主要來源于移動通訊設(shè)備的普及以及發(fā)卡量的增長。但是,在過去的5年里,客戶量的增長速度緩慢,同時發(fā)卡量似乎不再增長。如何實現(xiàn)業(yè)務(wù)增長,成了三大運(yùn)營商頭痛的問題。與此同時,運(yùn)營商之間相互挖客戶墻角的問題時有發(fā)生,客戶流失率的急劇上升成為了各大運(yùn)營商最為直接的難題,尤其是優(yōu)質(zhì)客戶的流失更是會造成企業(yè)極大的經(jīng)濟(jì)損失。從運(yùn)營成本來看,引進(jìn)新用戶的成本遠(yuǎn)高于維護(hù)一個優(yōu)質(zhì)的老客戶,會對企業(yè)的收益產(chǎn)生較大影響。因此,為了幫助企業(yè)在客戶流失前提前做出預(yù)警防范,文章使用數(shù)據(jù)挖掘分類算法中的組合預(yù)測樹模型建立了一套具有實際意義的預(yù)警檢測系統(tǒng),為企業(yè)留住客戶提供指導(dǎo)策略。

1 ?變量的獲取與說明

本案例使用的數(shù)據(jù)來自某移動公司當(dāng)月的客戶信息統(tǒng)計,該企業(yè)為我校對口實踐實習(xí)單位,共4 975條數(shù)據(jù),缺失值已處理。因變量是否流失的數(shù)據(jù)來源于下一個月,自變量的數(shù)據(jù)來源于當(dāng)月。數(shù)據(jù)包含8個變量:1個因變量、7個自變量,其中定性變量6個,定量變量2個。因變量為流失客戶,為定性變量,1代表客戶流失,0代表客戶未流失;套餐金額為定性變量,共3個水平:1為96元以下,2為96到225元,3為225元以上;改變行為為定性變量,1代表曾改變過套餐金額,0代表未曾改變過套餐金額;服務(wù)合約為定性變量,1代表曾經(jīng)簽訂過服務(wù)合約,0代表未曾簽訂過服務(wù)合約;關(guān)聯(lián)購買為定性變量,1代表同時辦理一項其他業(yè)務(wù),2代表同時辦理兩項其他業(yè)務(wù),0代表沒有辦理其他業(yè)務(wù);集團(tuán)用戶為定性變量,1代表是集團(tuán)用戶,0代表不是集團(tuán)用戶;額外流量、套餐使用月數(shù)均為定量變量。

2 ?描述性分析

2.1 ?集團(tuán)用戶對客戶流失的影響

通過繪制馬賽克圖,了解是否是集團(tuán)用戶在流失用戶中所占比例的大小。在圖1中,橫坐標(biāo)表示客戶是否流失,縱坐標(biāo)表示客戶是否為集團(tuán)用戶。結(jié)果顯示,在流失的客戶群體中,不是集團(tuán)用戶所占比例較大,是集團(tuán)用戶所占比例較小,說明是集團(tuán)用戶的客戶更不易流失。同時通過卡方檢驗得知二者所對應(yīng)的概率P值小于0.000,應(yīng)該拒絕集團(tuán)用戶和流失用戶之間相關(guān)獨立的原假設(shè)。說明集團(tuán)用戶與客戶流失不獨立,是否是集團(tuán)用戶對客戶是否流失有顯著影響。

2.2 ?服務(wù)合約對流失客戶的影響

通過服務(wù)合約與客戶流失兩變量的二維列聯(lián)表與卡方檢驗來分析其影響顯著性。由表1交叉列聯(lián)頻數(shù)表可知,在客戶流失的個體中,無服務(wù)合約的客戶有3 340人,有服務(wù)合約的用戶為554人。無服務(wù)合約用戶中客戶流失的個體占88.9%,有服務(wù)合約用戶中客戶流失個體占45.5%,說明有服務(wù)合約用戶的個體更不易流失。服務(wù)合約與客戶流失服從自由度為1的卡方檢驗,對應(yīng)的概率P值小于0.000,應(yīng)該拒絕客戶流失與服務(wù)合約之間相互獨立的原假設(shè)。說明服務(wù)合約與客戶流失不獨立,是否簽約過服務(wù)合約對客戶是否流失有影響。

3 ?預(yù)警模型的建立

3.1 ?數(shù)據(jù)挖掘

數(shù)據(jù)挖掘是從當(dāng)下海量不完全、模糊的數(shù)據(jù)中提取未知但隱藏在其中的潛在有價值信息的過程。數(shù)據(jù)挖掘常使用的軟件有Weka、KNIME、RapidMiner、R-Programming、Kaggle

等,常使用的算法包括分類算法、聚類算法、關(guān)聯(lián)規(guī)則等,其中分類算法包括決策樹、邏輯回歸、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、Boosting等,本文通過使用分類算法中的組合決策樹在R軟件中完成數(shù)據(jù)挖掘全過程。

3.2 ?組合決策樹的構(gòu)造

決策樹分類是最典型的一種分類方法,從實例集中構(gòu)造決策樹,先根據(jù)訓(xùn)練子集形成決策樹,然后根據(jù)葉節(jié)點的類稱號進(jìn)行檢驗記錄分類。其核心環(huán)節(jié)在于解決訓(xùn)練記錄的分裂和何時停止分裂的問題。解決第一個問題的關(guān)鍵在于屬性測試條件的合理決策;解決第二個問題最好的辦法是當(dāng)樣本數(shù)量小于某個特定閾值時停止分裂。通過使用RStudio軟件編程建立的組合決策樹算法調(diào)試代碼如下:

install.packages("ipred")

library(ipred)

set.seed(1234)

m=m[,-1]

m$流失用戶<-as.factor(m$流失用戶)

m1<-bagging(m$流失用戶~.,data = m,nbagg=25,coob =TRUE)

pre<-predict(m1,m,type = "class")

hx<-table(m$流失用戶,pre)

E1<-(sum(hx)-sum(diag(hx)))/sum(hx)

并且,得到的預(yù)警監(jiān)測模型如圖2所示,在根節(jié)點中總樣本量為4 975人,其中流失客戶有3 894人;最優(yōu)特征變量為使用月數(shù)在取值25處將決策樹分裂為0、1兩部分,其中預(yù)測客戶未流失1 020人,預(yù)測客戶流失3 955人,預(yù)測未流失人數(shù)中與真實未流失結(jié)果一致的有1 020人,預(yù)測流失人數(shù)中與真實流失結(jié)果一致的有3 894人。結(jié)果顯示使用月數(shù)是客戶是否會發(fā)生流失的最重要因素,當(dāng)使用月數(shù)大于等于25時,客戶流失率最低。

通過數(shù)據(jù)挖掘方法中的決策樹分類模型進(jìn)行客戶的流失監(jiān)測,將預(yù)測結(jié)果和真實數(shù)據(jù)進(jìn)行對比做組和決策樹混淆矩陣,結(jié)果如表2所示,真實未流失客戶有1 081人,預(yù)測未流失客戶有1 020人,精確率=1 020/(1 020+61)=94.36%,準(zhǔn)確率=(1 020+3 894)/(1 020+61+0+3 894)=98.77%,預(yù)警模型的預(yù)測準(zhǔn)確率高達(dá)98.77%。

4 ?遏制用戶流失的措施

手機(jī)客戶流失預(yù)警監(jiān)測結(jié)果說明,在使用月數(shù)這一特征上,用戶使用月數(shù)小于25個月的用戶基本都流失了,使用月數(shù)大于25個月的用戶都得到了保留。在關(guān)聯(lián)性購買特征中,沒有辦理過其他業(yè)務(wù)的用戶容易流失,辦理過其他業(yè)務(wù)的用戶能得以保留。對于服務(wù)合約特征來說,有服務(wù)合約用戶的個體更不易流失,應(yīng)該注意無服務(wù)合約這一用戶群體可能會流失。集團(tuán)用戶特征中,非集團(tuán)用戶中客戶流失的個體占88.1%,集團(tuán)用戶中客戶流失個體占45.0%,說明是集團(tuán)用戶的個體更不易流失,運(yùn)營商也應(yīng)注意不是集團(tuán)用戶的群體可能會有流失的危險。其他影響因素因效果不顯著,均未進(jìn)入預(yù)警模型。

所以運(yùn)營商應(yīng)在推廣各種套餐、關(guān)聯(lián)購買活動、簽訂服務(wù)合約、辦理集團(tuán)用戶等方面加大力度取得客戶信任,使得客戶對運(yùn)營商更加信任,進(jìn)而將客戶的套餐使用月數(shù)提升到25個月以上。除此以外,運(yùn)營商可以從以下幾方面著手遏制用戶的流失。

4.1 ?提升用戶的忠實度

提升忠誠度對每一個以客戶為中心的企業(yè)來說都是長久生存之道。結(jié)合老客戶的使用習(xí)慣、話費回贈、專屬優(yōu)惠等活動制定出不同的VIP高級套餐,以保證老客戶的高端心理預(yù)期;考慮新客戶的現(xiàn)有需求制定靈活多變的新穎策略,吸引新客戶的使用好感,提升新客戶的留存率,進(jìn)而提升老客戶的轉(zhuǎn)化率。同時,在售后服務(wù)上要人性化,舉辦溫馨的送愛心活動,讓新老客戶不僅有產(chǎn)品享受,更有家一樣的溫暖體驗。

4.2 ?加強(qiáng)對品牌自身的推廣和創(chuàng)新

5G時代洶涌而至,對每個企業(yè)來說機(jī)遇和挑戰(zhàn)并存。在宣傳方面,應(yīng)借助互聯(lián)網(wǎng)優(yōu)勢,采取多樣化流量推廣,例如在微博、抖音、B站、微信等社交媒體上通過各種視頻、文案等宣傳企業(yè)品牌文化和優(yōu)惠套餐活動,尤其是需要將利益化的點可視化;在運(yùn)營模式上,借助互聯(lián)網(wǎng)對客戶群體實行網(wǎng)格化管理,實現(xiàn)“一網(wǎng)撒天下,客戶盡在掌握中”的全局運(yùn)營管理模式,不錯過一個新客戶,不放棄一個老客戶;在產(chǎn)品創(chuàng)新上,要與時俱進(jìn),不斷研發(fā)新的核心產(chǎn)品,提高企業(yè)核心競爭力,要不斷招募年輕人才,創(chuàng)新出更為特色、更為符合客戶需求的營銷手段。

4.3 ?定制差異化營銷策略

在營銷方面,可以借助數(shù)據(jù)挖掘方法對真實的客戶數(shù)據(jù)進(jìn)行客戶人群細(xì)分,進(jìn)而完成精準(zhǔn)的人物畫像,按照客戶的不同喜好、不同消費層面、不同需求,劃分為4~8種畫像描述,然后針對不同畫像的客戶定制不同層級的個性化服務(wù)和優(yōu)惠活動,同時要及時把握自身品牌的差異化塑造,從情感、文化、家庭歸屬感等方面來及時調(diào)整自身定位,提升品牌核心競爭力。

5 ?結(jié) ?論

客戶流失率的日益增長已經(jīng)成為電信行業(yè)各大運(yùn)營商最為棘手的問題之一,而數(shù)據(jù)挖掘技術(shù)的產(chǎn)生便為解決該問題提供了極大的便利。本文通過大量查找文獻(xiàn)、研究相關(guān)理論基礎(chǔ),并結(jié)合企業(yè)真實客戶數(shù)據(jù),使用R語言做數(shù)據(jù)挖掘建立模型,基于決策樹的構(gòu)建,形成了手機(jī)客戶流失預(yù)警系統(tǒng),經(jīng)混淆矩陣的準(zhǔn)確率評估,該模型基本達(dá)到預(yù)期效果,可以將其用在解決該企業(yè)客戶流失管理的實際問題中。但由于數(shù)據(jù)中存在所選因素的種類有所欠缺、與客戶相關(guān)的其他信息不夠全面等問題,模型的準(zhǔn)確性有待進(jìn)一步提升。

參考文獻(xiàn):

[1] CALZADA-INFANTE L,?SKARSD?TTIR M,BAESENS B. Evaluation of customer behavior with temporal centrality metrics for churn prediction of prepaid contracts [J/OL].Expert Systems With Applications,2020,160.[2020-05-28].https://www.sciencedirect.com/science/article/abs/pii/S0957417420303778.

[2] 李鑫.基于數(shù)據(jù)挖掘的電信客戶流失預(yù)警研究 [D].昆明:云南財經(jīng)大學(xué),2020.

[3] 張磊.基于深度學(xué)習(xí)的電信客戶流失預(yù)測研究 [D].昆明:云南財經(jīng)大學(xué),2020.

[4] 趙慧珂.流失客戶的識別、預(yù)警與對策研究 [D].天津:天津財經(jīng)大學(xué),2019.

[5] 周艷.基于數(shù)據(jù)挖掘技術(shù)的電話經(jīng)理業(yè)務(wù)支撐系統(tǒng)設(shè)計與實現(xiàn) [D].長沙:湖南大學(xué),2016.

[6] 王玉玲.中國電信B公司寬帶客戶流失預(yù)警及對策研究 [D].秦皇島:燕山大學(xué),2018.

[7] 程勇,梁吉祥.基于數(shù)據(jù)挖掘的掌銀客戶流失預(yù)測建模方法研究 [J].中國金融電腦,2019(8):51-60.

[8] 張利利,馬艷琴.基于數(shù)據(jù)挖掘技術(shù)的航空客戶流失與細(xì)分研究及R語言程序?qū)崿F(xiàn) [J].數(shù)學(xué)的實踐與認(rèn)識,2019,49(6):134-142.

[9] 姜輝輝.WA移動分公司存量客戶營銷策略研究 [D].邯鄲:河北工程大學(xué),2020.

[10] 王曉婷.邢臺移動用戶流失預(yù)警系統(tǒng)分析與設(shè)計 [D].北京:北京郵電大學(xué),2010.

作者簡介:楊英英(1989—),女,漢族,陜西延安人,專職教師,助教,碩士研究生,研究方向:數(shù)據(jù)分析。

猜你喜歡
決策樹數(shù)據(jù)挖掘預(yù)警
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
法國發(fā)布高溫預(yù)警 嚴(yán)陣以待備戰(zhàn)“史上最熱周”
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
園林有害生物預(yù)警與可持續(xù)控制
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
基于決策樹的出租車乘客出行目的識別
機(jī)載預(yù)警雷達(dá)對IFF 的干擾分析
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
宿州市| 吴堡县| 新余市| 游戏| 阿合奇县| 房产| 昭苏县| 江山市| 高陵县| 临江市| 论坛| 惠安县| 玛沁县| 含山县| 韶关市| 湖口县| 同仁县| 昔阳县| 辽宁省| 张家界市| 兰州市| 香港 | 宁安市| 桑日县| 宣汉县| 海南省| 鹤峰县| 江都市| 台南县| 含山县| 贵德县| 西平县| 徐水县| 郸城县| 福海县| 定南县| 宁陕县| 乐东| 定兴县| 大同市| 邵东县|