姜疆
金融行業(yè)應(yīng)用系統(tǒng)積累了非常多的客戶交易數(shù)據(jù),同時(shí),借助大數(shù)據(jù)技術(shù)將分散在金融企業(yè)服務(wù)網(wǎng)絡(luò)與IT系統(tǒng)中的海量信息與基于業(yè)務(wù)驅(qū)動(dòng)的外部數(shù)據(jù)源融合,金融機(jī)構(gòu)能夠在金融企業(yè)內(nèi)部的客戶管理、信用評(píng)級(jí)、風(fēng)險(xiǎn)控制等諸多方面得到有效提升。
大數(shù)據(jù)技術(shù)和數(shù)據(jù)挖掘技術(shù)在金融業(yè)中的主要運(yùn)用有:數(shù)據(jù)分析和設(shè)計(jì)構(gòu)造的數(shù)據(jù)倉(cāng)庫(kù);特征數(shù)據(jù)變量選擇、關(guān)聯(lián)屬性相關(guān)數(shù)據(jù)用于預(yù)測(cè)客戶信用狀況;聚類、分類分析識(shí)別目標(biāo)客戶和市場(chǎng);數(shù)據(jù)可視化過(guò)程及歸并、聚類分析甄別洗錢等金融犯罪行為。
在當(dāng)前“以客戶為中心、以市場(chǎng)為導(dǎo)向”的激烈競(jìng)爭(zhēng)時(shí)代,在各大金融機(jī)構(gòu)準(zhǔn)備“二次轉(zhuǎn)型”的改革進(jìn)程中,要想提高核心競(jìng)爭(zhēng)能力、防范業(yè)務(wù)風(fēng)險(xiǎn)、提高業(yè)務(wù)分析數(shù)據(jù)的時(shí)效性及準(zhǔn)確性,就必須懂得如何利用現(xiàn)代管理信息系統(tǒng)進(jìn)行綜合分析挖掘客戶潛在價(jià)值,借助有價(jià)值的信息改進(jìn)服務(wù)手段,運(yùn)用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)職能化的決策支持功能管理。
了解客戶行為
據(jù)廣發(fā)銀行信用卡相關(guān)人士介紹,2016年,廣發(fā)信用卡在4800萬(wàn)客戶體量之下,客戶服務(wù)滿意度始終保持在99%以上,其“秘訣”就在于近年來(lái)廣發(fā)卡客服中心成功地將大數(shù)據(jù)運(yùn)用于日常業(yè)務(wù),基于客戶歷史行為數(shù)據(jù)的分析和預(yù)測(cè)實(shí)現(xiàn)與客戶的雙向互動(dòng)。
近年來(lái),廣發(fā)卡客服中心積極推進(jìn)服務(wù)創(chuàng)新,充分挖掘海量客戶數(shù)據(jù)的價(jià)值,在開(kāi)發(fā)銀行大數(shù)據(jù)平臺(tái)的基礎(chǔ)上,創(chuàng)新推出“客戶Face Time--大數(shù)據(jù)時(shí)代客戶標(biāo)簽畫(huà)像”。該業(yè)務(wù)能根據(jù)客戶的歷史行為對(duì)客戶畫(huà)像進(jìn)行描畫(huà),細(xì)化分群,建立客戶服務(wù)專屬標(biāo)簽群。
隨后將基于客戶特征集合形成的客戶標(biāo)簽以行業(yè)首創(chuàng)的“九宮格”界面的形式傳輸?shù)娇蛻舴?wù)系統(tǒng)前端,確??头砜梢酝ㄟ^(guò)可視化、友好化的界面即時(shí)全面掌握客戶畫(huà)像及代表的用戶特征和潛在需求,有的放矢地完成精準(zhǔn)服務(wù)和差異化服務(wù)。
大數(shù)據(jù)時(shí)代,信用卡行業(yè)可以利用先進(jìn)的互聯(lián)網(wǎng)、云計(jì)算等新興技術(shù),對(duì)消費(fèi)者的刷卡行為進(jìn)行數(shù)據(jù)化的分類、統(tǒng)計(jì),通過(guò)整理獲取消費(fèi)者的消費(fèi)習(xí)慣、消費(fèi)能力、消費(fèi)偏好等非常重要的數(shù)據(jù)信息,進(jìn)行深入的數(shù)據(jù)挖掘。
中國(guó)光大銀行信用卡中心總經(jīng)理戴兵表示,信用卡行業(yè)已經(jīng)進(jìn)入了精耕細(xì)作的時(shí)代,各行在數(shù)據(jù)挖掘方面已不是新手,利用數(shù)據(jù)挖掘與客戶關(guān)系管理相結(jié)合,深入挖掘客戶信息,對(duì)客戶進(jìn)行細(xì)分,針對(duì)不同客戶提供差異化服務(wù),滿足客戶不同需求。
通過(guò)捕捉客戶的行為變化等事件信息,及時(shí)發(fā)現(xiàn)客戶潛在需求,針對(duì)性地為客戶提供個(gè)性化的活動(dòng)或產(chǎn)品,從而達(dá)到對(duì)客戶需求的精準(zhǔn)認(rèn)知與匹配,在合適的時(shí)機(jī)對(duì)客戶進(jìn)行營(yíng)銷和服務(wù),最終促成交易。
浦發(fā)銀行卡中心大數(shù)據(jù)團(tuán)隊(duì)已經(jīng)于2014年建設(shè)了Hadoop大數(shù)據(jù)平臺(tái),實(shí)現(xiàn)了批量計(jì)算的應(yīng)用;2015年對(duì)平臺(tái)進(jìn)行升級(jí),引入流式計(jì)算,并自主設(shè)計(jì)了事件式營(yíng)銷系統(tǒng),內(nèi)部代號(hào)“游隼”(Falcon)。該系統(tǒng)使用Storm和Kafka等大數(shù)據(jù)技術(shù)處理數(shù)據(jù)流,使用HBase和Redis等NoSql數(shù)據(jù)庫(kù)技術(shù)進(jìn)行數(shù)據(jù)存儲(chǔ)和處理。
客戶一旦進(jìn)行交易,平臺(tái)就會(huì)捕捉到交易事件并結(jié)合用戶特征與平臺(tái)預(yù)定義的活動(dòng)進(jìn)行對(duì)比計(jì)算,如果該客戶的刷卡行為與特征能夠滿足活動(dòng)規(guī)則,則通過(guò)短信、微信、APP等渠道推送預(yù)定義好的營(yíng)銷信息,進(jìn)行實(shí)時(shí)營(yíng)銷。
著眼于零售商業(yè)銀行客戶行為中的預(yù)測(cè)變化,可以使用一種“可伸縮的時(shí)間掃描算法”來(lái)檢測(cè)高度多維的銀行交易,從而檢測(cè)客戶消費(fèi)行為中的一些變化。
前提是根據(jù)一系列標(biāo)準(zhǔn),對(duì)相關(guān)數(shù)據(jù)進(jìn)行分類,如:年齡段、性別、教育程度、家境,等等。而算法是,通過(guò)將個(gè)人客戶的行為及其歷史記錄,與同類別群體的當(dāng)前及歷史行為作為比較,從而檢測(cè)出行為中的時(shí)間變化點(diǎn)。
該算法會(huì)考慮至少230種不同類型的變化點(diǎn),他們是根據(jù)上文提及的多種分類標(biāo)準(zhǔn)和消費(fèi)行為轉(zhuǎn)變的多種時(shí)間尺度而得到的。那些檢測(cè)到的、不能用數(shù)據(jù)的隨機(jī)波動(dòng)來(lái)解釋的變化,被認(rèn)為是未來(lái)行為的可能,如單日信用卡消費(fèi)熱潮。
可以使用機(jī)器學(xué)習(xí)來(lái)自動(dòng)檢測(cè)那些經(jīng)實(shí)證檢驗(yàn)后最有用的備選指標(biāo)集。研究大數(shù)據(jù)的學(xué)者Artur Dubrawski曾撰文介紹了一個(gè)大數(shù)據(jù)模型,能夠精確地提前三天預(yù)測(cè)某天的消費(fèi)熱潮。
當(dāng)然,與以往運(yùn)用的數(shù)據(jù)挖掘技術(shù)不同,大數(shù)據(jù)需要更龐大的數(shù)據(jù)倉(cāng)庫(kù)、新興技術(shù)來(lái)存儲(chǔ)與支撐,這也是信用卡行業(yè)需要進(jìn)一步去提高的。當(dāng)然,信用卡行業(yè)也很期待大數(shù)據(jù)的來(lái)臨,利用新興技術(shù),結(jié)合豐富的數(shù)據(jù),深入挖掘有效信息,通過(guò)細(xì)分客群,為客戶提供更好的服務(wù)。
信用評(píng)級(jí)
傳統(tǒng)金融機(jī)構(gòu)的征信信息來(lái)源主要是央行征信,但央行征信僅有3億多人有信貸記錄,信貸記錄又主要來(lái)源于商業(yè)銀行和農(nóng)村信用社等金融機(jī)構(gòu)。隨著互聯(lián)網(wǎng)不斷滲入人們生活,互聯(lián)網(wǎng)行為數(shù)據(jù)是央行征信的有效補(bǔ)充,可以不斷強(qiáng)化征信數(shù)據(jù)的時(shí)效性、全面性和層次性,從無(wú)形中記錄用戶的行為,去偽存真,還原真實(shí)的客戶,從而大大提升信息的利用率和有效性。
傳統(tǒng)上,金融機(jī)構(gòu)的授信審批決策主要依賴于信貸人員的主觀經(jīng)驗(yàn)和判斷,缺乏統(tǒng)一的標(biāo)準(zhǔn),不利于金融機(jī)構(gòu)整體風(fēng)險(xiǎn)政策的執(zhí)行。
隨著大數(shù)據(jù)時(shí)代的到來(lái),銀行可以通過(guò)移動(dòng)互聯(lián)網(wǎng)等渠道,取得越來(lái)越完善的貸款人信息:同時(shí),強(qiáng)大的底層技術(shù)也可以完成復(fù)雜模型所帶來(lái)的巨大計(jì)算量。這兩點(diǎn)同時(shí)為信用評(píng)分模型注入了新活力,信用評(píng)分模型的進(jìn)步帶來(lái)的是銀行壞賬率的下降。
對(duì)于銀行來(lái)說(shuō),貸出的款額、利息的高低、還款的時(shí)間以及方式等是可以控制的因素,而銀行所不能控制的因素有借款人的收入水平、婚姻狀況、消費(fèi)水平,等等。這兩方面的因素都會(huì)影響借款人還款能力的高低。為了更全面地評(píng)價(jià)借款人的還款能力,銀行有必要同時(shí)采集這兩方面的信息。
銀行的信用評(píng)分模型最主要的作用是評(píng)定那些特征不大明顯的借款者是否能還貸。正常情況下,銀行是絕不會(huì)借錢給那些明顯不能還款的客戶的,而顯然會(huì)還款的客戶有總是各個(gè)銀行爭(zhēng)奪的對(duì)象。
當(dāng)然,信用評(píng)分系統(tǒng)不僅可以用于申請(qǐng)貸款業(yè)務(wù),也可以用于信用卡開(kāi)通業(yè)務(wù)、汽車行業(yè)分期付款業(yè)務(wù)、房地產(chǎn)分期付款業(yè)務(wù),還可以用于開(kāi)展保險(xiǎn)業(yè)務(wù)評(píng)分、欺詐風(fēng)險(xiǎn)評(píng)分等諸多評(píng)分業(yè)務(wù),等等。
信用評(píng)分模型涉及深厚的理論基礎(chǔ)以及先進(jìn)的算法思想。盡管構(gòu)建信用評(píng)分模型的算法有所不同,但構(gòu)建信用評(píng)分模型的原理和步驟是基本一致的,所有的信用評(píng)分模型在構(gòu)建時(shí),都需要三個(gè)步驟。
首先,根據(jù)經(jīng)驗(yàn)或相關(guān)性分析,找出和借款人的信用風(fēng)險(xiǎn)相關(guān)的經(jīng)濟(jì)或財(cái)務(wù)因素,并選定算法,確定模型將要使用的函數(shù)形式;其次,根據(jù)以往的數(shù)據(jù)確定相關(guān)因素的重要性大小,并代入算法進(jìn)行試驗(yàn),尋找最優(yōu)參數(shù);最后,將待分類借款人的相關(guān)數(shù)據(jù)代入信用評(píng)分函數(shù)計(jì)算信用數(shù)值,根據(jù)數(shù)值的大小確定是否借款給待分類借款人。
借款人以往的還債記錄、公共記錄、年齡、職業(yè)、經(jīng)濟(jì)狀況、消費(fèi)水平、消費(fèi)偏好、持有的銀行卡數(shù)目、銀行卡余額,等等,都是銀行需要收集的數(shù)據(jù)。這些數(shù)據(jù)可以詳細(xì)地勾畫(huà)出一個(gè)消費(fèi)者的形象,從而幫助銀行判斷借款人是否能償還貸款。
構(gòu)建信用評(píng)分模型常用的算法有:邏輯回歸模型、共性過(guò)濾分析、支持向量機(jī)、判別分析、神經(jīng)網(wǎng)絡(luò)模型、決策樹(shù)模型、多元回歸模型、基因算法、RFM分析、存貨分析、時(shí)間序列分析,等等。
在信用評(píng)分模型構(gòu)建過(guò)程中,從不同的側(cè)面看待同一個(gè)問(wèn)題時(shí),可以設(shè)計(jì)出不同的解決方案。
對(duì)于有大數(shù)據(jù)量支持的大型銀行,可以使用決策樹(shù)來(lái)構(gòu)建信用評(píng)分模型;對(duì)于沒(méi)有過(guò)多數(shù)據(jù)的小型借貸公司,神經(jīng)網(wǎng)絡(luò)將克服數(shù)據(jù)量過(guò)少的不便;判別分析適用于針對(duì)某一明確問(wèn)題構(gòu)建模型,而在探索性數(shù)據(jù)分析中作用不大;支持向量機(jī)則可以精確地區(qū)分可能會(huì)還款的客戶和不太可能會(huì)還款的客戶。
不同算法所使用的變量并不相同,對(duì)于這個(gè)算法來(lái)說(shuō)很重要的變量可能并不能在其他算法中發(fā)揮作用,而不同的算法所適合的問(wèn)題也不盡相同。在使用這些算法解決問(wèn)題時(shí),應(yīng)注意每種算法的長(zhǎng)處與短處,從而揚(yáng)長(zhǎng)避短,找到解決問(wèn)題的最佳方案。
隨著大數(shù)據(jù)模型開(kāi)發(fā)技術(shù)與內(nèi)部評(píng)級(jí)體系建設(shè)的深度融合,金融機(jī)構(gòu)將更加廣泛和全面地將評(píng)分/評(píng)級(jí)結(jié)果應(yīng)用于授信審批,為貸款決策提供參考和支持。同時(shí),大數(shù)據(jù)模型的應(yīng)用,可以不斷提高金融機(jī)構(gòu)風(fēng)險(xiǎn)識(shí)別、計(jì)量能力。從而不斷完善征信信息體系架構(gòu),為精細(xì)化風(fēng)險(xiǎn)定價(jià)提供必要的基礎(chǔ)和土壤。
風(fēng)險(xiǎn)控制
風(fēng)險(xiǎn)監(jiān)控與預(yù)警是指借助各類信息來(lái)源或渠道,通過(guò)對(duì)數(shù)據(jù)與信息進(jìn)行整合與分析,運(yùn)用定量和定性分析相結(jié)合的方法來(lái)發(fā)現(xiàn)授信客戶及業(yè)務(wù)的早期風(fēng)險(xiǎn)征兆,準(zhǔn)確識(shí)別風(fēng)險(xiǎn)的類別、程度、原因及其發(fā)展變化趨勢(shì),并按規(guī)定的權(quán)限和程序?qū)?wèn)題授信采取針對(duì)性處理措施,以及時(shí)防范、控制和化解授信風(fēng)險(xiǎn)的一系列管理過(guò)程。
大數(shù)據(jù)風(fēng)險(xiǎn)模型可以快速識(shí)別貸后風(fēng)險(xiǎn),為不同的用戶設(shè)定不同的監(jiān)控頻率、自動(dòng)篩選高風(fēng)險(xiǎn)客戶,制定有針對(duì)性的貸后管理措施、貸后管理工作等。
目前我國(guó)商業(yè)銀行缺乏細(xì)分客戶的計(jì)量工具,催收時(shí)通常根據(jù)逾期時(shí)間長(zhǎng)短來(lái)區(qū)分客戶,導(dǎo)致精細(xì)化管理程度不高,無(wú)法早期區(qū)分出將要變?yōu)椴涣伎蛻舻母唢L(fēng)險(xiǎn)客戶和可以主動(dòng)還款的低風(fēng)險(xiǎn)客戶。對(duì)前者因沒(méi)有采取有效的催收手段,而使之轉(zhuǎn)變?yōu)椴涣伎蛻?,?duì)后者過(guò)度催收,增加了無(wú)謂的催收成本。
一個(gè)實(shí)施風(fēng)險(xiǎn)管控的例子是新加坡的UOB銀行。它基于大數(shù)據(jù)成功測(cè)試了風(fēng)險(xiǎn)系統(tǒng),在內(nèi)存技術(shù)(數(shù)據(jù)儲(chǔ)存在內(nèi)存中)和將銀行風(fēng)險(xiǎn)總計(jì)算時(shí)間從18小時(shí)降為幾分鐘(風(fēng)險(xiǎn)價(jià)值法)的支持下,使得“大數(shù)據(jù)”成為可能。這有助于在未來(lái)實(shí)現(xiàn)實(shí)時(shí)壓力測(cè)試,更快應(yīng)對(duì)新風(fēng)險(xiǎn)。另一個(gè)大數(shù)據(jù)技術(shù)在現(xiàn)存商業(yè)模式中的成功案例是Morgan Stanley。該銀行開(kāi)發(fā)其大數(shù)據(jù)處理能力,從而優(yōu)化了規(guī)模和結(jié)果質(zhì)量方面的組合分析。據(jù)預(yù)計(jì),由于自動(dòng)化模式識(shí)別和可理解性增強(qiáng),這些過(guò)程將會(huì)導(dǎo)致金融風(fēng)險(xiǎn)管控的顯著提升。
金融企業(yè)運(yùn)用大數(shù)據(jù)和機(jī)器學(xué)習(xí)算法,對(duì)欠款客戶進(jìn)行人群聚類并根據(jù)聚類的結(jié)果識(shí)別騙貸、惡意欠款、惡意透支、盜刷盜用、對(duì)交易有疑問(wèn)拒絕還款、經(jīng)濟(jì)狀況惡化無(wú)力還貸、遺忘還貸等多種欠款類型;從而準(zhǔn)確預(yù)測(cè)客戶的還款概率和金額,從而進(jìn)行催收策略評(píng)估,最大限度降低催收成本。
中國(guó)建設(shè)銀行資產(chǎn)總行風(fēng)險(xiǎn)管理部/資產(chǎn)保全部副總經(jīng)理譚興民曾詳盡分析大數(shù)據(jù)何以幫助銀行提高征信水平和風(fēng)險(xiǎn)管控能力:
首先,一站式征信平臺(tái)可以進(jìn)行貸前客戶甄別。目前,銀行查詢客戶的情況既費(fèi)時(shí)、費(fèi)力,又增加銀行費(fèi)用,而利用企業(yè)的一站式征信平臺(tái),則可以最大限度地節(jié)省銀行的人力、物力及時(shí)間,并確保數(shù)據(jù)有效、及時(shí)、準(zhǔn)確。
其次,風(fēng)險(xiǎn)量化平臺(tái)可以助力貸后風(fēng)險(xiǎn)管控。平臺(tái)基于企業(yè)日常經(jīng)營(yíng)數(shù)據(jù),結(jié)合平臺(tái)數(shù)據(jù)模型,采用動(dòng)態(tài)、實(shí)時(shí)的云端數(shù)據(jù)抓取技術(shù),對(duì)企業(yè)的發(fā)展進(jìn)行分析和評(píng)測(cè),給出風(fēng)險(xiǎn)量化分?jǐn)?shù),并第一時(shí)間發(fā)現(xiàn)企業(yè)的生產(chǎn)經(jīng)營(yíng)異動(dòng),在風(fēng)險(xiǎn)觸發(fā)前3到6個(gè)月預(yù)警,使銀行等金融機(jī)構(gòu)能夠及時(shí)采取相應(yīng)措施,防止和減少損失發(fā)生。
同時(shí),利用“企業(yè)族譜”查詢,對(duì)不良貸款進(jìn)行監(jiān)控。如一些企業(yè)通過(guò)關(guān)聯(lián)交易轉(zhuǎn)移利潤(rùn)、制造虧損的假象,為不償還銀行貸款尋找理由;或者通過(guò)關(guān)聯(lián)交易制造虛假業(yè)績(jī),為繼續(xù)獲得銀行貸款提供依據(jù),這些假象通過(guò)關(guān)聯(lián)交易查詢,都可以很快發(fā)現(xiàn)蛛絲馬跡,讓企業(yè)造假暴露原形,可防止銀行上當(dāng)受騙。
大數(shù)據(jù)風(fēng)控相對(duì)于傳統(tǒng)風(fēng)控來(lái)說(shuō),建模方式和原理其實(shí)是一樣的,其核心是側(cè)重在利用更多維的數(shù)據(jù),更多互聯(lián)網(wǎng)的足跡,更多傳統(tǒng)金融沒(méi)有觸及到的數(shù)據(jù)。比如電商的網(wǎng)頁(yè)瀏覽、客戶在app的行為軌跡、甚至GPS的位置信息等,這些信息看似和一個(gè)客戶是否可能違約沒(méi)有直接關(guān)系,但實(shí)則通過(guò)大量的數(shù)據(jù)累積,能夠產(chǎn)生出非常有效的識(shí)別客戶的能力。
在運(yùn)行邏輯上,大數(shù)據(jù)風(fēng)控不強(qiáng)調(diào)較強(qiáng)的因果關(guān)系,看重統(tǒng)計(jì)學(xué)上的相關(guān)性是大數(shù)據(jù)風(fēng)控區(qū)別于傳統(tǒng)金融風(fēng)控的典型特征。傳統(tǒng)金融機(jī)構(gòu)強(qiáng)調(diào)因果,講究?jī)蓚€(gè)變量之間必須存在邏輯上能夠講通因果。
在數(shù)據(jù)維度這個(gè)層級(jí),傳統(tǒng)金融風(fēng)控和大數(shù)據(jù)風(fēng)控還有一個(gè)顯著的區(qū)別在于傳統(tǒng)金融數(shù)據(jù)和非傳統(tǒng)金融數(shù)據(jù)的應(yīng)用。傳統(tǒng)的金融數(shù)據(jù)包括上文中提及的個(gè)人社會(huì)特征、收入、借貸情況等等。而互金公司的大數(shù)據(jù)風(fēng)控,采納了大量的非傳統(tǒng)金融數(shù)據(jù)。
相對(duì)于傳統(tǒng)金融機(jī)構(gòu),互金公司擴(kuò)大了非傳統(tǒng)數(shù)據(jù)獲取的途徑,對(duì)于新客戶群體的風(fēng)險(xiǎn)定價(jià),是一種風(fēng)險(xiǎn)數(shù)據(jù)的補(bǔ)充。當(dāng)然,這些數(shù)據(jù)的金融屬性有多強(qiáng),仍然有待驗(yàn)證。
巨頭優(yōu)勢(shì)明顯,并不代表創(chuàng)業(yè)公司的路已被堵死。大公司不可能面面俱到,布局各種場(chǎng)景。在互聯(lián)網(wǎng)巨頭尚未涉及的領(lǐng)域,小步快跑,比巨頭更早的搶下賽道,拿到數(shù)據(jù),并且優(yōu)化自己的數(shù)據(jù)應(yīng)用能力,成為創(chuàng)業(yè)公司殺出重圍的一條路徑。