胡丁相,李新群
(1.中國移動(dòng)通信集團(tuán)浙江有限公司,浙江 杭州 310000;2.流量海科技成都有限公司,四川 成都 610000)
在電信運(yùn)營商領(lǐng)域,全面﹑客觀地評估客戶的價(jià)值,對于更好地識別和挖掘風(fēng)險(xiǎn)用戶,優(yōu)化業(yè)務(wù)規(guī)則,合理配置營銷資源,提升服務(wù)效果,降低跑冒滴漏等收入流失風(fēng)險(xiǎn),具有重要意義[1]。
隨著業(yè)務(wù)的迅猛發(fā)展和客戶群規(guī)模的擴(kuò)大,新業(yè)務(wù)層出不窮,IT支撐系統(tǒng)越來越復(fù)雜。不法分子(風(fēng)險(xiǎn)用戶)利用業(yè)務(wù)規(guī)則或系統(tǒng)支撐的漏洞,違規(guī)侵占或倒賣電信運(yùn)營商營銷資源,極大地危害著公司利益。電信管理論壇《Revenue Assurance Survey 2016》顯示,歐美電信運(yùn)營商的平均收入流失率為1.5%,而中國運(yùn)營商由于客戶服務(wù)的標(biāo)準(zhǔn)要求更高,違規(guī)套利犯罪成本低,收入流失比例遠(yuǎn)遠(yuǎn)高于歐美。因此,亟需一種方法,找到藏匿在正常用戶群體的風(fēng)險(xiǎn)用戶,以供后續(xù)進(jìn)一步分析其行為,挖掘深層次的風(fēng)險(xiǎn)。
在風(fēng)險(xiǎn)識別與特征分析過程中,如果數(shù)據(jù)相對完整,便可以定量的逐一分析風(fēng)險(xiǎn),并建立對應(yīng)的模型分析其產(chǎn)生的影響和損失。通常需要從兩個(gè)方面進(jìn)行考量,即風(fēng)險(xiǎn)的嚴(yán)重性和風(fēng)險(xiǎn)可能帶來的損失。
當(dāng)前,電信運(yùn)營商通過數(shù)據(jù)一致性稽核﹑業(yè)務(wù)流程平衡性稽核等手段,已經(jīng)具備一定的風(fēng)險(xiǎn)管控能力。但是,由于IT系統(tǒng)數(shù)量眾多﹑集成復(fù)雜﹑對接不暢且三域間數(shù)據(jù)未關(guān)聯(lián),難以實(shí)現(xiàn)風(fēng)險(xiǎn)場景的自動(dòng)識別﹑風(fēng)險(xiǎn)問題的精準(zhǔn)定位。此外,企業(yè)外部欺詐形成產(chǎn)業(yè)鏈,欺詐分子可通過眾多手段侵占電信運(yùn)營商營銷資源或通信資源,以謀取自身利益[2]。對于此類風(fēng)險(xiǎn)用戶,目前尚無有效全面的手段去檢測識別。當(dāng)下,主要的手段有兩種。第一,欺詐規(guī)則檢測法。根據(jù)風(fēng)險(xiǎn)檢測對象,制定風(fēng)險(xiǎn)檢測規(guī)則和閾值門限,并通過風(fēng)險(xiǎn)檢測規(guī)則對用戶進(jìn)行識別。第二,關(guān)聯(lián)用戶識別法。通過識別與 被處罰的用戶存在行為交互的關(guān)聯(lián)用戶,按照預(yù)設(shè)的風(fēng)險(xiǎn)權(quán)重計(jì)算用戶風(fēng)險(xiǎn)分值的方式識別風(fēng)險(xiǎn)用戶。本文主要論述基于用戶價(jià)值分析的風(fēng)險(xiǎn)識別方法,來尋找這些給電信運(yùn)營商造成巨大損失的欺詐分子(風(fēng)險(xiǎn)用戶)。
現(xiàn)有風(fēng)險(xiǎn)用戶識別手段存在如下缺陷。對于欺詐規(guī)則檢測法,由于電信運(yùn)營商用戶基數(shù)龐大,用戶消費(fèi)水平﹑行為習(xí)慣各異,簡單的規(guī)則檢測容易造成較高的誤判率;檢測規(guī)則基于用戶行為特征提煉封裝,覆蓋范圍有限,存在較高的漏判率;該手段難以記錄風(fēng)險(xiǎn)用戶的全貌,不能對風(fēng)險(xiǎn)問題進(jìn)行回溯,不利于進(jìn)一步的分析挖掘。對于關(guān)聯(lián)用戶識別法,該方法要求足夠多的被處罰的用戶(壞樣本)作為輸入,進(jìn)而識別壞樣本的關(guān)聯(lián)用戶作為潛在風(fēng)險(xiǎn)用戶,而實(shí)際生產(chǎn)的情況往往沒有現(xiàn)成的壞樣本,通常只有在造成重大影響或者被其他用戶舉報(bào)后,才會(huì)獲得被處罰的用戶。
通俗地,用戶價(jià)值就是用戶在特定的生命周期內(nèi),借助直接付費(fèi)﹑口碑相傳等手段,為企業(yè)貢獻(xiàn)的所有價(jià)值。用戶價(jià)值是企業(yè)與用戶之間聯(lián)系的關(guān)鍵?;谟脩魞r(jià)值的風(fēng)險(xiǎn)識別模型,可以幫助電信運(yùn)營商找出隱藏在正常用戶群體中的風(fēng)險(xiǎn)用戶,并對其進(jìn)行深層次分析。挖掘業(yè)務(wù)規(guī)則或者系統(tǒng)實(shí)現(xiàn)上的漏洞,可為電信運(yùn)營商制定更加完善的業(yè)務(wù)規(guī)則,修復(fù)系統(tǒng)漏洞,減少企業(yè)收入損失,保障業(yè)務(wù)健康發(fā)展。
下面結(jié)合附圖,對基于價(jià)值分析的風(fēng)險(xiǎn)用戶識別方法作詳細(xì)闡述。
圖1為基于價(jià)值分析的風(fēng)險(xiǎn)用戶識別方法示意圖,主要涉及構(gòu)建用戶價(jià)值分析體系﹑用戶價(jià)值細(xì)分﹑篩選低利潤率用戶群﹑根據(jù)風(fēng)險(xiǎn)場景對低價(jià)值用戶群進(jìn)行細(xì)分等。
圖2為基于用戶價(jià)值構(gòu)成(充值本金)聚類分析示意圖。
圖3為基于用戶價(jià)值構(gòu)成的細(xì)分示意圖。
圖1 本文中基于價(jià)值分析的風(fēng)險(xiǎn)用戶識別方法
圖2 本文中基于用戶價(jià)值構(gòu)成(充值本金)聚類分析
圖3 本文中基于用戶價(jià)值構(gòu)成細(xì)分
基于價(jià)值分析的風(fēng)險(xiǎn)用戶識別的詳細(xì)步驟如下。
步驟1:構(gòu)建用戶價(jià)值分析體系。用戶價(jià)值的基本計(jì)算方法:用戶價(jià)值=用戶收益-用戶成本。收益主要為累計(jì)出賬收入;用戶成本主要為累計(jì)網(wǎng)間結(jié)算支出﹑累計(jì)SP(服務(wù)提供商)結(jié)算支出﹑累計(jì)營銷成本支出等。
步驟2:設(shè)計(jì)用戶價(jià)值評估指標(biāo)。用戶收益主要包括用戶消費(fèi)的價(jià)值(如繳費(fèi)充值本金)和衍生消費(fèi)的價(jià)值(如購買手機(jī)終端);用戶成本主要包括營銷活動(dòng)成本(如入網(wǎng)送終端/饋贈(zèng)金/積分)﹑用戶獲取成本(如渠道發(fā)展酬金支出)和結(jié)算成本(如網(wǎng)間結(jié)算/SP(服務(wù)提供商)結(jié)算)。
步驟3:計(jì)算用戶生命周期價(jià)值。計(jì)算通過資金相關(guān)數(shù)據(jù)的用戶畫像進(jìn)行。例如,用戶生命周期價(jià)值=[累計(jì)充值本金收入+累計(jì)網(wǎng)間結(jié)算收入-累計(jì)網(wǎng)間結(jié)算支出-累計(jì)SP(服務(wù)提供商)結(jié)算支出-累計(jì)營銷成本支出]。通過計(jì)費(fèi)賬務(wù)信息和成本使用信息確定用戶的價(jià)值,使評價(jià)結(jié)果更加客觀全面。
步驟4:根據(jù)用戶價(jià)值分析體系,計(jì)算所有用戶的價(jià)值,即利潤貢獻(xiàn)率。利潤貢獻(xiàn)率=所有用戶價(jià)值/電信運(yùn)營商所有業(yè)務(wù)利潤。
步驟5:對用戶價(jià)值構(gòu)成相關(guān)的數(shù)據(jù)進(jìn)行聚類分析(圖2),其中包括用戶充值本金﹑饋贈(zèng)金﹑酬金﹑SP(服務(wù)提供商)結(jié)算費(fèi)和網(wǎng)間結(jié)算費(fèi)等指標(biāo)。投入計(jì)算公式:投入=饋贈(zèng)金+酬金+SP結(jié)算費(fèi)+網(wǎng)間結(jié)算費(fèi),產(chǎn)出計(jì)算公式:產(chǎn)出=用戶充值本金,并將投入產(chǎn)出的比例以及投入和產(chǎn)出的實(shí)際金額按照實(shí)際情況設(shè)定一系列等級,通過投入產(chǎn)出比例的等級劃分,將用戶群進(jìn)一步細(xì)分為高投入-低產(chǎn)出﹑高投入-高產(chǎn)出﹑低投入-高產(chǎn)出及低投入-低產(chǎn)出。圖4顯示了細(xì)分用戶的等級。橫坐標(biāo)為生命周期內(nèi)用戶的成本和收益(單位為百元),縱坐標(biāo)為收益和成本的比例。舉例說明,成本大于1000元,收益成本比例大于3,為高投入-高產(chǎn)出;成本大于1000元,收益成本比例小于1,高成本-低產(chǎn)出。具體的閾值可以根據(jù)實(shí)際情況進(jìn)行設(shè)定。
步驟6:篩選貢獻(xiàn)利潤率低的低價(jià)值客戶群體,如高投入-低產(chǎn)出(如產(chǎn)出/成本<0.33),投入金額>100元(平均每月)。設(shè)定閥值可根據(jù)實(shí)際需求進(jìn)行更改。
步驟7:對低價(jià)值客戶群體的行為數(shù)據(jù)進(jìn)行二次聚類分析?;谟脩粜袨樾畔ㄍㄐ判袨椹p消費(fèi)行為﹑業(yè)務(wù)受理行為﹑繳費(fèi)充值行為﹑流量使用行為和流量共享行為等信息進(jìn)行二次聚類。例如,通過ARPU/業(yè)務(wù)受理記錄等指標(biāo)的變異系數(shù)(消除平均值的影響),進(jìn)一步細(xì)分低價(jià)值客戶群體。更進(jìn)一步可以將篩選出的風(fēng)險(xiǎn)用戶利用規(guī)則漏洞辦理來套取酬金的業(yè)務(wù)列為敏感業(yè)務(wù),更深層次可以對辦理這些敏感業(yè)務(wù)的用戶及受理渠道進(jìn)行分析。
步驟8:根據(jù)預(yù)設(shè)風(fēng)險(xiǎn)場景對不同低價(jià)值用戶群體進(jìn)行分類,如酬金套利風(fēng)險(xiǎn)用戶群﹑營銷資源倒賣風(fēng)險(xiǎn)用戶群[3]等。
步驟9:酬金套利風(fēng)險(xiǎn)場景的確定。對于低價(jià)值用戶群體,如其用戶成本主要由渠道酬金組成且存在渠道異常集中情況,則可確定為酬金套利風(fēng)險(xiǎn)用戶群[4]。
步驟10:對于未匹配上預(yù)設(shè)風(fēng)險(xiǎn)場景的用戶群,可通過關(guān)聯(lián)用戶識別法,將其作為潛在風(fēng)險(xiǎn)用戶群進(jìn)行重點(diǎn)監(jiān)控??梢苑治鲲L(fēng)險(xiǎn)用戶的交往圈,與風(fēng)險(xiǎn)用戶交往密切的用戶群體也需要重點(diǎn)監(jiān)控。
步驟11:最終確定風(fēng)險(xiǎn)用戶。
圖4 用戶劃分等級三維圖
以酬金套利風(fēng)險(xiǎn)場景為例,對低價(jià)值甚至負(fù)價(jià)值的用戶群體,如其用戶成本主要由渠道酬金組成,且存在某個(gè)或某幾個(gè)渠道異常集中情況,則可確定為酬金套利風(fēng)險(xiǎn)用戶群。隨機(jī)選取部分疑似酬金套利用戶限制其業(yè)務(wù)受理渠道,收到這批用戶的投訴率極低,觀察受限渠道,疑似養(yǎng)卡套酬金額環(huán)比下降40%,基本證明基于用戶價(jià)值的風(fēng)險(xiǎn)識別方法具有很好的效果。
通過基于價(jià)值分析的風(fēng)險(xiǎn)用戶識別方法在沒有使用壞樣本的前提下找到了大量藏匿在正常用戶群體的風(fēng)險(xiǎn)用戶,并通過抽取樣本進(jìn)行撥號測試﹑停機(jī)測試,接通率﹑投訴率極低。深入研究其通信行為﹑免費(fèi)資源的使用情況,均發(fā)現(xiàn)極大的養(yǎng)卡嫌疑,基本論證了價(jià)值分析在電信運(yùn)營風(fēng)險(xiǎn)識別中的重要意義,很大程度彌補(bǔ)了現(xiàn)有關(guān)聯(lián)用戶識別法需要足夠的被處罰用 戶(壞樣本)的不足,提高了風(fēng)險(xiǎn)用戶識別方法的實(shí)用性,同時(shí)解決了現(xiàn)有欺詐規(guī)則檢測法中對風(fēng)險(xiǎn)用戶覆蓋率和誤判率的不足。通過用戶價(jià)值構(gòu)成的畫像分析,挖掘深層業(yè)務(wù)問題,使得運(yùn)營商能夠及時(shí)精準(zhǔn)發(fā)現(xiàn)風(fēng)險(xiǎn)用戶,減少收入流失[5]。
本文研究源于電信運(yùn)營行業(yè)的欺詐行為,即代理商通過電信運(yùn)營商系統(tǒng)的業(yè)務(wù)或者系統(tǒng)漏洞謀取自身利益。通過疑似風(fēng)險(xiǎn)用戶的特征——低價(jià)值甚至負(fù)價(jià)值,提出基于用戶價(jià)值的風(fēng)險(xiǎn)識別方法,將其應(yīng)用于電信運(yùn)營領(lǐng)域內(nèi),成功在沒有使用壞樣本的情況下找出大量藏匿在正常用戶群體內(nèi)的風(fēng)險(xiǎn)用戶,減少了運(yùn)營商損失,提升了管理效益。
本文論述的基于用戶價(jià)值的風(fēng)險(xiǎn)識別方法的應(yīng)用模式是:構(gòu)建用戶價(jià)值體系→根據(jù)用戶價(jià)值體系計(jì)算用戶的價(jià)值→對用戶構(gòu)成的價(jià)值構(gòu)成的相關(guān)數(shù)據(jù)進(jìn)行分析→對于疑似壞樣本的典型行為進(jìn)行二次聚類→將電信運(yùn)營商數(shù)據(jù)依照體系進(jìn)行分析→確定風(fēng)險(xiǎn)用戶。模型的應(yīng)用模式還可以應(yīng)用于其他行業(yè),如信用卡惡意透支套現(xiàn)行為。通過本文的分析方法及結(jié)論,可針對信用卡用戶制定相應(yīng)的用戶價(jià)值體系并進(jìn)行分析。
[1] 上官曉麗,許玉娜,楊建軍.SP800-30‘風(fēng)險(xiǎn)評估實(shí)施指南“研究[J].信息技術(shù)與標(biāo)準(zhǔn)化,2011:44-47.
SHANGGUAN Xiao-li,XU Yu-na,YANG Jianjun.SP800-30 "Guidance on Implementation of Risk Assessment"[J].Information Technology and Standardization,2011:44-47.
[2] C C.Information Technology Security Evaluation Common Criteria[S].2004.
[3] 宋蕊.中國電信運(yùn)營企業(yè)社會(huì)渠道傭金管理和渠道控制研究[D].北京:北京郵電大學(xué),2011.
SONG Rui.Study on Commission And Control Management of Social Distribution Channels for Chinese Telecom Operators[D].Beijing:Beijing University of Posts and Telecommunications,2011:31-33.
[4] 王保華.利用大數(shù)據(jù)分析建立養(yǎng)卡模型[J].電信技術(shù),2016(02):73-75.
WANG Bao-hua.Using Big Data Analysis to Build a Save Card Model[J].Telecommunications Technology,2016(02):73-75.
[5] 呂智超.基于hadoop平臺(tái)的電信養(yǎng)卡研究與分析[D].南京:南京郵電大學(xué),2016.
LV Zhi-chao.Telecommunications Save Card Research and Analysis base don Hadoop[J].Nanjing:Nanjing University of Posts and Telecommunications,2016:34-40.