楊 晟,施元元
(中訊郵電咨詢設(shè)計院有限公司,上海 200050)
基于電信運(yùn)營商大數(shù)據(jù)分析的個人征信評估模型
楊 晟,施元元
(中訊郵電咨詢設(shè)計院有限公司,上海 200050)
電信運(yùn)營商在征信領(lǐng)域極具價值,主要研究了如何利用電信運(yùn)營商大數(shù)據(jù)分析結(jié)果來構(gòu)建個人征信評估模型。
電信運(yùn)營商;互聯(lián)網(wǎng);身份信息;位置信息
電信運(yùn)營商目前在征信行業(yè)被視為一塊可口的蛋糕。電信運(yùn)營商在征信行業(yè)具有天然優(yōu)勢:①數(shù)據(jù)覆蓋極廣。手機(jī)號碼基本人手一個,三大運(yùn)營商基本能覆蓋所有人群。在這一點(diǎn)上,即使BAT等互聯(lián)網(wǎng)巨頭也是難以望其項(xiàng)背。②隨著實(shí)名制的普及,身份證號碼、手機(jī)號碼、姓名等真實(shí)身份信息之間的關(guān)聯(lián)越來越強(qiáng),大大降低了征信行業(yè)的偽冒風(fēng)險,冒名申請、代辦養(yǎng)卡等行為的難度陡增。③運(yùn)營商數(shù)據(jù)能方便地構(gòu)建出個人關(guān)系網(wǎng)。④運(yùn)營商能提供位置信息的變化,從而建立征信預(yù)警機(jī)制。
電信運(yùn)營商的數(shù)據(jù)優(yōu)勢表現(xiàn)在全面、及時、多形式等方面,如何提取有價值信息,構(gòu)建合理的個人征信評估模型,是本文研究的方向。
我們將從用戶基本信息、消費(fèi)信息、活動信息、通話分析、數(shù)據(jù)流量分析、關(guān)系分析六大類型數(shù)據(jù)著手,聚合形成個人的信用評分。
用戶基本信息包括:①身份證件信息。運(yùn)營商認(rèn)可的實(shí)名制證件包括了身份證、警官證、軍官證、戶口本、港澳居民通行證、臺胞證這幾種。這部分信息主要用于驗(yàn)真使用,對于軍官證、警官證可以進(jìn)行加分處理。②性別信息。性別信息可從身份證件信息中提取。③年齡信息。年齡信息可從身份證件信息中提取,不同年齡段設(shè)置不同信息分值。④家庭住址。用戶預(yù)留在運(yùn)營商處的住址信息,如果用戶有寬帶業(yè)務(wù),則可以設(shè)定為寬帶地址。⑤入網(wǎng)時間。用戶名下最早號碼的入網(wǎng)時間,入網(wǎng)越早信用度越高。⑥VIP等級。用戶在運(yùn)營商處最高的VIP等級。⑦號碼數(shù)量。由于雙卡手機(jī)的普及,一個身份證號碼可能有多個號碼。⑧名下其他業(yè)務(wù)。比如企業(yè)業(yè)務(wù)、寬帶業(yè)務(wù)、專線業(yè)務(wù)等。用戶基本信息主要用來貸前驗(yàn)真使用,可以作為用戶信用分的基本分。
消費(fèi)信息包括:①名下總消費(fèi)。用戶名下所有業(yè)務(wù)的月度總消費(fèi),可以是半年的平均消費(fèi)。②名下最高套餐評級。根據(jù)用戶不同套餐類型,設(shè)定不同評級分。③套餐外消費(fèi)金額。用戶超過套餐的消費(fèi)金額。④消費(fèi)變化趨勢。月度消費(fèi)的變化趨勢。⑤終端型號。用戶所使用終端的品牌、型號。⑥終端價格。按1 000元以下、1 000~2 000元、2 000~4 000元、4 000元以上四檔分檔計算信用分。⑦終端更換次數(shù)。提取一年內(nèi)用戶終端更換次數(shù)。⑧終端更換價格變化趨勢。根據(jù)更換終端的價格變化情況計算信用分。⑨欠費(fèi)次數(shù)。月均欠費(fèi)次數(shù)。
活動信息包括:①住宅區(qū)域。根據(jù)用戶在夜晚(比如每日22:00—6:00)登錄基站次數(shù)最多的位置列為用戶的住宅區(qū)域。可以分為高檔住宅、普通住宅、城中村、鄉(xiāng)鎮(zhèn)農(nóng)村、廠區(qū)等不同檔次區(qū)域,分別計算信用分。②工作區(qū)域。根據(jù)用戶在工作日工作時間(非周末的9:30—11:00,14:00—16:00)的位置列為用戶的工作區(qū)域??梢苑譃楣I(yè)區(qū)、高檔寫字樓、普通寫字樓、科技園區(qū)、政府機(jī)關(guān)、軍隊、學(xué)校、醫(yī)院等各種類型,分別計算信用分。③晚餐區(qū)域。根據(jù)用戶在晚餐時間(18:00—19:30)位置列為用戶的晚餐區(qū)域。將晚餐區(qū)域分類,可以分為高檔飯店、普通飯店、綜合體、快餐等,根據(jù)用戶在不同場所出現(xiàn)的次數(shù)分別計算信用分。④娛樂區(qū)域。根據(jù)用戶在晚餐后時間(19:30—22:00)位置,列為用戶娛樂區(qū)域。將娛樂區(qū)域分類,可以分為KTV、會所、電影院、超市等,根據(jù)用戶在不同場所出現(xiàn)的次數(shù)分別計算信用分。⑤漫游天數(shù)。根據(jù)用戶月均漫游到外地的天數(shù),計算信用分。
用戶活動位置的判斷主要基于主服務(wù)小區(qū)更新信息、MR采樣信息等判斷,同時,前期需要對不同場所進(jìn)行手動分類。比如對高檔住宅、普通住宅等做好分類標(biāo)簽。
通話分析的內(nèi)容包括:①單月總語音時間;②單月總通話次數(shù);③單月本地通話次數(shù);④省內(nèi)國內(nèi)漫游通話次數(shù);⑤通話時間次數(shù)變化趨勢分析。
根據(jù)用戶的通話次數(shù)、通話時間、不同漫游地通話次數(shù)、通話時間次數(shù)變化趨勢對用戶進(jìn)行信用評分。
數(shù)據(jù)流量分析的內(nèi)容包括:①數(shù)據(jù)流量。用戶月均數(shù)據(jù)流量使用量。②數(shù)據(jù)流量使用變化趨勢分析。③即時通訊類流量占比。④各類流量的比例,比如視頻流量、游戲流量等。⑤淘寶、京東等消費(fèi)類網(wǎng)站訪問次數(shù)。
根據(jù)用戶的月均流量使用情況、變化趨勢、不同流量占比、消費(fèi)類網(wǎng)站訪問次數(shù)對用戶進(jìn)行信用評分。
關(guān)系分析的內(nèi)容包括:①快遞人員通話次數(shù)。結(jié)合號碼庫,計算月均和快遞人員的通話次數(shù)。②司機(jī)人員通話次數(shù)。計算月均和滴滴快車等網(wǎng)約車、出租車司機(jī)通話次數(shù)。③外賣人員通話次數(shù)。計算月均和餓了嗎等外賣騎手的通話次數(shù)。④親密聯(lián)系人。提取多位,比如10位頻繁通話聯(lián)系人。
基于上述6類指標(biāo),采用多指標(biāo)聚類系數(shù)化的方法對上述不同數(shù)據(jù)進(jìn)行整合,形成個人的信用評分,計算公式:消費(fèi)信息得分+活動信息得分+通話分析得分+數(shù)據(jù)流量得分+關(guān)系分析得分×用戶基本信息得分=個人信用得分。電信運(yùn)營商可以直接提供個人信用得分供征信企業(yè)使用,也可以給出各個子模塊得分,由征信企業(yè)自行使用。
目前,用于征信的數(shù)據(jù)多種多樣,比如基本的社保、公積金信息,也有互聯(lián)網(wǎng)企業(yè)的相關(guān)信息,比如芝麻信用等。這些信息的實(shí)時性都沒有運(yùn)營商的高,手機(jī)的普及使得運(yùn)營商時刻掌握運(yùn)用的位置估計、通信行為,可以據(jù)此建立征信風(fēng)險預(yù)警體系。
根據(jù)用戶通信行為的變化,對用戶進(jìn)行提前征信預(yù)警,可以從下列幾個方面評分:①名下手機(jī)號碼增加。②通信行為變化。例如通話次數(shù)顯著減少,通話時長縮短;③和特定高風(fēng)險用戶聯(lián)系增多。比如高利貸提供者、境外賭場、彩票站等;④待機(jī)狀態(tài)變化。關(guān)機(jī)次數(shù)增多、掛機(jī)次數(shù)增多、關(guān)機(jī)時間增加等;⑤親密聯(lián)系人有急劇變化。⑥出現(xiàn)在高風(fēng)險位置。例如澳門、拉斯維加斯等賭場區(qū)域或者傳銷聚集區(qū)域,例如以前的廣西北海。⑦異常網(wǎng)絡(luò)行為。比如接入賭博類APP、用搜索引擎搜索“賭博”“高利貸”等關(guān)鍵詞。
一旦用戶出現(xiàn)上述非正常的通信行為,偏離其長期平均的模式,即可發(fā)出對該用戶的征信預(yù)警,供征信企業(yè)使用。
如果用戶已經(jīng)成為高風(fēng)險人員,例如出現(xiàn)逾期不還的情況,或者已被提前預(yù)警警示,則我們利用運(yùn)營商大數(shù)據(jù)分析可對用戶進(jìn)行高風(fēng)險警示判斷,基本模型為:出現(xiàn)在高鐵站、機(jī)場、本市高速國道出城口等區(qū)域;訪問攜程、去哪兒、各大航空公司官網(wǎng)等出行相關(guān)網(wǎng)站、APP,或與此類業(yè)務(wù)提供商通話;本人或親密聯(lián)系人長時間非正常時間關(guān)機(jī),比如工作日連續(xù)關(guān)機(jī)超過5 h。一旦出現(xiàn)上述行為,則可以觸發(fā)高風(fēng)險警示,并提供給相關(guān)征信企業(yè)。
電信運(yùn)營商在征信領(lǐng)域具有天然優(yōu)勢,傳統(tǒng)的征信方法和電信運(yùn)營商、互聯(lián)網(wǎng)公司提供的大數(shù)據(jù)分析應(yīng)該起到互補(bǔ)的作用。電信運(yùn)營商大數(shù)據(jù)分析對傳統(tǒng)征信無力涉及領(lǐng)域的覆蓋,極大提升了征信服務(wù)的實(shí)時性、提高征信結(jié)果的準(zhǔn)確性。同時,電信運(yùn)營商也必須承擔(dān)相應(yīng)義務(wù),比如如何確保用戶數(shù)據(jù)的匿名狀態(tài),對數(shù)據(jù)的匿名安全性作出評估,如果數(shù)據(jù)交易的對象具備對數(shù)據(jù)復(fù)原身份屬性的能力,則應(yīng)當(dāng)限制此類交易。在交易協(xié)議中,需要通過協(xié)議來明確交易各方對于數(shù)據(jù)安全的責(zé)任,尤其約束交易方不得再進(jìn)行身份識別性的利用。
F626
A
10.15913/j.cnki.kjycx.2017.20.056
2095-6835(2017)20-0056-02
〔編輯:張思楠〕