雷蕾 余鳳麗
【摘要】 電信行業(yè)客戶重入網(wǎng)會(huì)帶來(lái)大量營(yíng)銷(xiāo)資源的無(wú)效消耗,同時(shí)帶來(lái)離網(wǎng)率過(guò)高和用戶虛增等異?,F(xiàn)象,為此,業(yè)務(wù)分析人員通過(guò)建立模型識(shí)別出重入網(wǎng)客戶加以管理,但是識(shí)別的準(zhǔn)確率一直不夠理想。本文總結(jié)重入網(wǎng)建模經(jīng)驗(yàn),結(jié)合大數(shù)據(jù)IT建設(shè)成果,分析各種識(shí)別方法的優(yōu)劣,為模型優(yōu)化提供參考。
【關(guān)鍵詞】 重入網(wǎng) 模型 大數(shù)據(jù)
一、背景及研究現(xiàn)狀分析
重入網(wǎng)客戶行為指的是已擁有某電信運(yùn)營(yíng)商的A地市分公司一個(gè)移動(dòng)號(hào)碼的客戶,由于某種原因又新買(mǎi)了該運(yùn)營(yíng)商A地市分公司的另一個(gè)同類(lèi)終端產(chǎn)品(手機(jī)、數(shù)據(jù)卡、上網(wǎng)本、MIFI)的號(hào)碼入網(wǎng)。由此消耗的營(yíng)銷(xiāo)資源包括號(hào)卡資源以及渠道銷(xiāo)售成本,還有客戶在重入網(wǎng)后對(duì)前一號(hào)卡進(jìn)行棄卡,引發(fā)惡意欠費(fèi)等現(xiàn)象。傳統(tǒng)的重入網(wǎng)識(shí)別技術(shù)是基本信息識(shí)別、IMEI識(shí)別和社交匹配度識(shí)別,這三種技術(shù)或單獨(dú)或交叉使用,但是這些識(shí)別技術(shù)準(zhǔn)確率低,例如基于用戶資料的移動(dòng)用戶身份識(shí)別準(zhǔn)確率僅為42%,有待改進(jìn):1、客戶基本信息在實(shí)名制還未普及的情況下,很多信息是錯(cuò)誤的;2、IMEI識(shí)別受山寨機(jī)的影響,存在錯(cuò)誤;3、可引入大數(shù)據(jù)實(shí)現(xiàn)信令數(shù)據(jù)的采集,對(duì)用戶的位置信息進(jìn)行定位和跟蹤,從而分析兩個(gè)用戶是一個(gè)客戶的可能性。
二、客戶重入網(wǎng)識(shí)別方法優(yōu)化方案介紹
以下介紹三種模型優(yōu)化的方法。
2.1客戶基本信息校驗(yàn)
客戶基本信息主要包括姓名、家庭住址和身份證,先對(duì)客戶信息的有效性進(jìn)行驗(yàn)證,僅在信息有效的客戶中識(shí)別重入網(wǎng)用戶:
1、姓名識(shí)別,剔除:
以下一個(gè)或多個(gè)詞語(yǔ)的用戶:“預(yù)開(kāi)”、“營(yíng)業(yè)廳”、“開(kāi)戶”、“直郵”、“套卡”、“代銷(xiāo)”、“中心”、“批量”、“批開(kāi)”、“直供”;
中文字符小于2個(gè)的。
2、家庭住址識(shí)別:剔除中文字符小于2個(gè)的。
3、身份證有效性識(shí)別,為防止客戶亂填,號(hào)碼有效性識(shí)別如下: 參數(shù)1:取前17位數(shù)字,以i表示其所在位數(shù),從左向右依次為17、16、15...2、1;參數(shù)2:每一位上的身份證號(hào)碼數(shù)字記為Ai 參數(shù)3:計(jì)算MOD(2^i,11),記為Wi;參數(shù)4:將每一個(gè)Ai與對(duì)應(yīng)位置上的Wi相乘。
將參數(shù)4得到的17個(gè)數(shù)值求和,然后除以11求余數(shù),得到一個(gè)數(shù)值n
通過(guò)n在下面的對(duì)應(yīng)表中進(jìn)行查表,得到最終的校驗(yàn)位字符:
計(jì)算值n 0 1 2 3 4 5 6 7 8 9 10
校驗(yàn)碼 1 0 X 9 8 7 6 5 4 3 2
2.2IMEI信息有效性校驗(yàn)
采用IMEI識(shí)別之前,先判定客戶的唯一有效IMEI,主要分為以下兩種判定方式:
1、剔除1個(gè)IMEI對(duì)應(yīng)多個(gè)號(hào)碼的情況,即山寨機(jī):
IMEI號(hào)對(duì)應(yīng)3個(gè)以上號(hào)碼;
IMEI長(zhǎng)度小于14個(gè)字符;
IMEI字符全是0或者空的。
2、剔除1個(gè)號(hào)碼對(duì)應(yīng)多個(gè)IMEI 的情況,這類(lèi)客戶可能存在頻繁換機(jī)情況:
IMEI號(hào)對(duì)應(yīng)3個(gè)及以上號(hào)碼 ;
用戶2個(gè)IMEI號(hào),取一個(gè)月內(nèi)使用天數(shù)最多的標(biāo)識(shí)為用戶的唯一有效IMEI。
三、引入用戶位置軌跡匹配
同一個(gè)客戶的上班地點(diǎn)、住宅地點(diǎn)相對(duì)固定,而且該客戶出現(xiàn)在這類(lèi)地點(diǎn)的時(shí)間遵循一定的規(guī)律,所以,通過(guò)比較兩個(gè)用戶在上班地點(diǎn)和住宅地點(diǎn),來(lái)識(shí)別兩個(gè)用戶是一個(gè)客戶的可能性。首先,按照工作日白天、工作日晚上、休息日白天、休息日晚上來(lái)劃分時(shí)段;其次,A口信令數(shù)據(jù)在客戶進(jìn)行位置移動(dòng)、開(kāi)機(jī)、關(guān)機(jī)、通話時(shí)等操作會(huì)產(chǎn)生數(shù)據(jù),無(wú)以上操作時(shí),將按照一定的時(shí)間間隔進(jìn)行采集,由此可以計(jì)算出客戶在該基站下的逗留時(shí)長(zhǎng);最后,匹配客戶在這四個(gè)時(shí)段的相同位置的逗留時(shí)長(zhǎng),即可評(píng)估兩個(gè)用戶是同一客戶的可能性。
四、總結(jié)及下一步發(fā)展
經(jīng)過(guò)對(duì)比測(cè)試,對(duì)客戶基本信息和IMEI信息進(jìn)行校驗(yàn)后,分別有30%和38%的信息正確可用,只針對(duì)信息有效的用戶識(shí)別,重入網(wǎng)準(zhǔn)確率達(dá)到75%;其余客戶基本信息和IMEI信息錯(cuò)誤的用戶,采用交往圈和位置軌跡匹配的方案提升重入網(wǎng)客戶識(shí)別的覆蓋率,這部分用戶通過(guò)外呼確認(rèn),準(zhǔn)確率為48%??傮w而言,通過(guò)三種方法的引入,能有效提升模型識(shí)別的準(zhǔn)確率。通過(guò)加強(qiáng)社會(huì)渠道的管控,隨著實(shí)名制的普及和攜號(hào)轉(zhuǎn)網(wǎng)業(yè)務(wù)的發(fā)展,重入網(wǎng)客戶可在業(yè)務(wù)辦理時(shí)即得到識(shí)別和控制。
參 考 文 獻(xiàn)
[1]溫瑞軍.移動(dòng)代理商渠道養(yǎng)卡套利行為識(shí)別與治理[J].電子技術(shù)與軟件工程,2015(3):54-55.
[2]羅亞.移動(dòng)電話用戶重入網(wǎng)識(shí)別及營(yíng)銷(xiāo)建議.北京郵件大學(xué)碩士論文,2010.
[3]王征,包磊.基于網(wǎng)絡(luò)訪問(wèn)項(xiàng)序的移動(dòng)用戶重入網(wǎng)身份識(shí)別方法[J].大連理工大學(xué)學(xué)報(bào),2015(2):016.
[4]日發(fā)帖趙麗莎.基于數(shù)據(jù)挖掘的電信客戶重入網(wǎng)預(yù)測(cè)系統(tǒng)的研究.昆明理工大學(xué)碩士論文,2014.