【摘要】本文首先針對(duì)大數(shù)據(jù)在互聯(lián)網(wǎng)金融中的應(yīng)用提出了幾個(gè)創(chuàng)新的方向,然后介紹了在互聯(lián)網(wǎng)金融的大環(huán)境下風(fēng)險(xiǎn)控制的原則和核心方法,并重點(diǎn)分析了大數(shù)據(jù)在這些規(guī)則下數(shù)據(jù)積累、加工和應(yīng)用的場(chǎng)景,最后根據(jù)應(yīng)用的現(xiàn)狀提出了需要注意的問(wèn)題和后續(xù)的展望。
【關(guān)鍵詞】大數(shù)據(jù);互聯(lián)網(wǎng)金融;風(fēng)險(xiǎn)控制
1.引言
互聯(lián)網(wǎng)金融是指以依托于支付、云計(jì)算、社交網(wǎng)絡(luò)以及搜索引擎等互聯(lián)網(wǎng)工具,實(shí)現(xiàn)資金融通、支付和信息中介等業(yè)務(wù)的一種新興金融?;ヂ?lián)網(wǎng)金融不是互聯(lián)網(wǎng)和金融業(yè)的簡(jiǎn)單結(jié)合,而是在實(shí)現(xiàn)安全、移動(dòng)等網(wǎng)絡(luò)技術(shù)水平上,被用戶熟悉接受后(尤其是對(duì)電子商務(wù)的接受),自然而然為適應(yīng)新的需求而產(chǎn)生的新模式及新業(yè)務(wù)。是傳統(tǒng)金融行業(yè)與互聯(lián)網(wǎng)精神相結(jié)合的新興領(lǐng)域。
論起互聯(lián)網(wǎng)金融首先想到的是馬云的“三步走戰(zhàn)略”——平臺(tái)、數(shù)據(jù)、金融。未來(lái)的互聯(lián)網(wǎng)金融無(wú)疑有著巨大的發(fā)展空間,可目前看來(lái)三步走已經(jīng)不符合市場(chǎng)預(yù)期,因?yàn)槭袌?chǎng)到今天已經(jīng)不只是平臺(tái)之爭(zhēng),特別隨著這兩年互聯(lián)網(wǎng)金融爆發(fā)式的發(fā)展,已經(jīng)形成了平臺(tái)、數(shù)據(jù)、金融相互影響的格局。在這種形勢(shì)下破局的點(diǎn)在哪里?就在于連接平臺(tái)、用戶、金融等方面的工具——大數(shù)據(jù)上,誰(shuí)能對(duì)大數(shù)據(jù)合理利用,誰(shuí)就能掌握這場(chǎng)數(shù)據(jù)之爭(zhēng)的未來(lái)市場(chǎng)。
2.大數(shù)據(jù)在互聯(lián)網(wǎng)金融的應(yīng)用方向
從大數(shù)據(jù)的應(yīng)用場(chǎng)景來(lái)看盡管達(dá)不到人們所預(yù)期的精確性,但確實(shí)已經(jīng)有了不少比較成功的商業(yè)案例。如Decide利用超過(guò)80億條的已知價(jià)格信息預(yù)測(cè)價(jià)格走勢(shì),給出購(gòu)買建議;DataSift通過(guò)分析社交網(wǎng)絡(luò)數(shù)據(jù),制定針對(duì)性營(yíng)銷方案;Zestfinance則利用大數(shù)據(jù)進(jìn)行信用評(píng)估,并已累積獲得近一億美元的融資等等。
隨著平臺(tái)的發(fā)展和數(shù)據(jù)的積累,互聯(lián)網(wǎng)金融也越來(lái)越多參與到其中,所以三步走已經(jīng)轉(zhuǎn)變成交叉并行的三個(gè)方面。國(guó)內(nèi)對(duì)互聯(lián)網(wǎng)金融的應(yīng)用比較多的還是在理財(cái)上,這是受了阿里余額寶、百度百發(fā)、微信理財(cái)通等的影響,可實(shí)際上貸款才是金融服務(wù)中最具剛性需求的服務(wù)。而且隨著大眾時(shí)間和需求上的碎片化程度提升,一方面是銀行等金融機(jī)構(gòu)的產(chǎn)品自然而然的落地,二是互聯(lián)網(wǎng)信貸圍繞大數(shù)據(jù)分析等方式進(jìn)行了很好的改造。因此大數(shù)據(jù)已經(jīng)促進(jìn)了高頻交易、社交情緒分析和信貸風(fēng)險(xiǎn)分析三大金融創(chuàng)新。
2.1 高頻交易和算法交易
以高頻交易為例,交易者為獲得利潤(rùn),利用硬件設(shè)備和交易程序的優(yōu)勢(shì),快速獲取、分析、生成和發(fā)送交易指令,在短時(shí)間內(nèi)多次買入賣出,且一般不持有大量未對(duì)沖的頭寸過(guò)夜?,F(xiàn)在的高頻交易主要采取“戰(zhàn)略順序交易”,即通過(guò)分析金融大數(shù)據(jù),以識(shí)別出特定市場(chǎng)參與者留下的足跡。例如,如果一只共同基金通常在收盤前一分鐘的第一秒執(zhí)行大額訂單,能夠識(shí)別出這一模式的算法將預(yù)判出該基金在其余交易時(shí)段的動(dòng)向,并執(zhí)行相同的交易。該基金繼續(xù)執(zhí)行交易時(shí)將付出更高的價(jià)格,使用算法的交易商可趁機(jī)獲利。
2.2 通過(guò)收集、分析社交媒體上的內(nèi)容進(jìn)行市場(chǎng)情緒分析
金融市場(chǎng)的投資者將對(duì)情緒分析的研究與應(yīng)用結(jié)合起來(lái)。大約兩年前,對(duì)沖基金開(kāi)始從Twitter、Facebook、聊天室和博客等社交媒體中提取市場(chǎng)情緒信息開(kāi)發(fā)交易算法。例如一旦從中發(fā)現(xiàn)有自然災(zāi)害或恐怖襲擊等意外信息公布,便立即拋出訂單。2008年,精神病專家理查德·彼得森籌集了100萬(wàn)美元在美國(guó)加州圣莫尼卡建立了名為MarketPsy Capital的對(duì)沖基金,通過(guò)追蹤聊天室、博客、網(wǎng)站和微博,以確定市場(chǎng)對(duì)不同企業(yè)的情緒,再據(jù)此確定基金的交易策略,到2010年該基金回報(bào)率達(dá)40%。位于倫敦的小型對(duì)沖基金DCM資本從Facebook和Twitter等社交媒體收集信息,將人們對(duì)某個(gè)金融工具的情緒進(jìn)行打分,并向零售客戶發(fā)布預(yù)測(cè),輔助投資者作出投資決定。
2.3 加強(qiáng)風(fēng)險(xiǎn)的可審性和管理力度,支持精細(xì)化管理
金融機(jī)構(gòu)希望能夠收集和分析大量小微企業(yè)用戶日常交易行為的數(shù)據(jù),判斷其業(yè)務(wù)范疇、經(jīng)營(yíng)狀況、信用狀況、用戶定位、資金需求和行業(yè)發(fā)展趨勢(shì),解決由于小微企業(yè)財(cái)務(wù)制度的不健全無(wú)法真正了解其真實(shí)的經(jīng)營(yíng)狀況的難題。
阿里小貸首創(chuàng)了從風(fēng)險(xiǎn)審核到放貸的全程線上模式,將貸前、貸中以及貸后三個(gè)環(huán)節(jié)形成有效聯(lián)結(jié),向通常無(wú)法在傳統(tǒng)金融渠道獲得貸款的弱勢(shì)群體批量發(fā)放“金額小、期限短、隨借隨還”的小額貸款。
3.風(fēng)險(xiǎn)控制的原則和方法
有效的控制風(fēng)險(xiǎn)方法最簡(jiǎn)單的說(shuō)法就是不要把雞蛋放在一個(gè)籃子里,所以要求客戶必須是“小額、分散”,避免客戶過(guò)度集中在某一個(gè)或幾個(gè)行業(yè)或客戶。
先說(shuō)一下“分散”在風(fēng)險(xiǎn)控制方面的好處,即借款的客戶分散在不同的地域、行業(yè)、年齡和學(xué)歷等,這些分散獨(dú)立的個(gè)體之間違約的概率能夠相互保持獨(dú)立性,那么同時(shí)違約的概率就會(huì)非常小。比如100個(gè)獨(dú)立個(gè)人的違約概率都是20%,那么隨機(jī)挑選出其中2人同時(shí)違約的概率為4%(20%^2),3個(gè)人同時(shí)違約的概率為0.8%(20%^3),四個(gè)人都發(fā)生違約的概率為0.016%(20%^4)。如果這100個(gè)人的違約存在相關(guān)性,比如在A違約的時(shí)候B 也會(huì)違約的概率是50%,那么隨機(jī)挑出來(lái)這兩個(gè)人的同時(shí)違約概率就會(huì)上升到10%(20%×50%=10%,而不是4%)。因此保持不同借款主體之間的獨(dú)立性非常重要。
“小額”在風(fēng)險(xiǎn)控制上的重要性則是避免統(tǒng)計(jì)學(xué)上的“小樣本偏差”。例如,平臺(tái)一共做10億的借款,如果借款人平均每個(gè)借3萬(wàn),就是3.3萬(wàn)個(gè)借款客戶,如果借款單筆是1000萬(wàn)的話,就是100個(gè)客戶。在統(tǒng)計(jì)學(xué)有“大數(shù)定律”法則,即需要在樣本個(gè)數(shù)數(shù)量夠大的情況下(超過(guò)幾萬(wàn)個(gè)以后),才能越來(lái)越符合正態(tài)分布定律,統(tǒng)計(jì)學(xué)上才有意義。因此,如果借款人壞賬率都是2%,則放款給3.3萬(wàn)個(gè)客戶,其壞賬率為2%的可能性要遠(yuǎn)高于僅放款給100個(gè)客戶的可能性,并且這100個(gè)人壞賬比較集中可能達(dá)到10%甚至更高,這就是統(tǒng)計(jì)學(xué)意義上的“小樣本偏差”的風(fēng)險(xiǎn)。
除了堅(jiān)持小額分散借款原則,用數(shù)據(jù)分析方式建立風(fēng)控模型和決策引擎同樣重要。小額分散最直接的體現(xiàn)就是借款客戶數(shù)量眾多,如果采用銀行傳統(tǒng)的信審模式,在還款能力、還款意愿等難以統(tǒng)一量度的違約風(fēng)險(xiǎn)判斷中,風(fēng)控成本會(huì)高至業(yè)務(wù)模式難以承受的水平,可以借鑒的是國(guó)外成熟的P2P比如LendingClub等都是采用信貸工廠的模式,利用風(fēng)險(xiǎn)模型的指引建立審批的決策引擎和評(píng)分卡體系,根據(jù)客戶的行為特征等各方面數(shù)據(jù)來(lái)判斷借款客戶的違約風(fēng)險(xiǎn)。簡(jiǎn)單點(diǎn)說(shuō),建立數(shù)據(jù)化風(fēng)控模型并固化到?jīng)Q策引擎和評(píng)分卡系統(tǒng),對(duì)于小額信用無(wú)抵押借款類業(yè)務(wù)的好處包括兩個(gè)方面:一是決策自動(dòng)化程度的提高,降低依靠人工審核造成的高成本;二是解決人工實(shí)地審核和判斷所帶來(lái)審核標(biāo)準(zhǔn)的不一致性問(wèn)題。
因此除了小額分散的風(fēng)控原則,風(fēng)控的核心方法在于通過(guò)研究分析不同個(gè)人特征數(shù)據(jù)(即大數(shù)據(jù)分析)相對(duì)應(yīng)的違約率,通過(guò)非線性邏輯回歸、決策樹(shù)分析、神經(jīng)網(wǎng)絡(luò)建模等方法來(lái)建立數(shù)據(jù)風(fēng)控模型和評(píng)分卡體系,來(lái)掌握不同個(gè)人特征對(duì)應(yīng)影響到違約率的程度,并將其固化到風(fēng)控審批的決策引擎和業(yè)務(wù)流程中來(lái)指導(dǎo)風(fēng)控審批業(yè)務(wù)的開(kāi)展。
4.大數(shù)據(jù)在風(fēng)險(xiǎn)控制中的應(yīng)用
國(guó)內(nèi)運(yùn)用大數(shù)據(jù)方式涉及互聯(lián)網(wǎng)金融的產(chǎn)品還相對(duì)較少,一是由于國(guó)內(nèi)的金融體系還不完善,二是國(guó)內(nèi)的用戶數(shù)據(jù)存在“大而不準(zhǔn),大而不精”。數(shù)據(jù)存在獲取困難和不精準(zhǔn)的問(wèn)題,因而給大數(shù)據(jù)互聯(lián)網(wǎng)金融帶來(lái)了很多難題,但嘗試者也并不少特別是在風(fēng)險(xiǎn)控制方面。
在不依賴央行征信系統(tǒng)的情況下,國(guó)內(nèi)金融市場(chǎng)自發(fā)形成了各具特色的風(fēng)險(xiǎn)控制生態(tài)系統(tǒng)。大公司通過(guò)大數(shù)據(jù)挖掘,自建信用評(píng)級(jí)系統(tǒng);小公司通過(guò)信息分享,借助第三方獲得信用評(píng)級(jí)咨詢服務(wù)?;ヂ?lián)網(wǎng)金融企業(yè)的風(fēng)控大致分為兩種模式,一種是類似于阿里的風(fēng)控模式,他們通過(guò)自身系統(tǒng)大量的電商交易以及支付信息數(shù)據(jù)建立了封閉系統(tǒng)的信用評(píng)級(jí)和風(fēng)控模型。另外一種則是眾多中小互聯(lián)網(wǎng)金融公司通過(guò)貢獻(xiàn)數(shù)據(jù)給一個(gè)中間征信機(jī)構(gòu),再分享征信信息。
圖1 風(fēng)控相關(guān)大數(shù)據(jù)及代表企業(yè)或產(chǎn)品
央行的征信系統(tǒng)是通過(guò)商業(yè)銀行、其它社會(huì)機(jī)構(gòu)上報(bào)的數(shù)據(jù),結(jié)合身份認(rèn)證中心的身份審核,提供給銀行系統(tǒng)信用查詢和個(gè)人信用報(bào)告。但對(duì)于其它征信機(jī)構(gòu)和互聯(lián)金融公司目前不提供直接查詢服務(wù),同時(shí)大量的個(gè)人在此系統(tǒng)里面沒(méi)有信貸記錄,而這些人卻有可能在央行征信系統(tǒng)外的其它機(jī)構(gòu)、互聯(lián)網(wǎng)金融公司自己的數(shù)據(jù)系統(tǒng)中存有相應(yīng)的信貸記錄。從網(wǎng)貸公司和一些線下小貸公司采集動(dòng)態(tài)大數(shù)據(jù),為互聯(lián)網(wǎng)金融企業(yè)提供重復(fù)借貸查詢、不良用戶信息查詢、信用等級(jí)查詢等多樣化服務(wù)是目前市場(chǎng)上征信公司正在推進(jìn)的工作。而隨著加入這個(gè)游戲規(guī)則的企業(yè)越來(lái)越多,這個(gè)由大量動(dòng)態(tài)數(shù)據(jù)勾勒的信用圖譜也將越來(lái)越清晰。
但是互聯(lián)網(wǎng)大數(shù)據(jù)海量且龐雜,充滿噪音,哪些大數(shù)據(jù)是互聯(lián)網(wǎng)金融企業(yè)風(fēng)險(xiǎn)控制官鐘愛(ài)的有價(jià)值的數(shù)據(jù)類型?下圖揭示了互聯(lián)網(wǎng)海量大數(shù)據(jù)中與風(fēng)控相關(guān)的數(shù)據(jù),以及哪些企業(yè)或產(chǎn)品擁有這些數(shù)據(jù)。
利用電商大數(shù)據(jù)進(jìn)行風(fēng)控,阿里金融對(duì)于大數(shù)據(jù)的謀劃已久。在很多行業(yè)人士還在云里霧里的時(shí)候,阿里已經(jīng)建立了相對(duì)完善的大數(shù)據(jù)挖掘系統(tǒng)。通過(guò)電商平臺(tái)阿里巴巴、淘寶、天貓、支付寶等積累的大量交易支付數(shù)據(jù)作為最基本的數(shù)據(jù)原料,再加上賣家自己提供的銷售數(shù)據(jù)、銀行流水、水電繳納甚至結(jié)婚證等情況作為輔助數(shù)據(jù)原料。所有信息匯總后,將數(shù)值輸入網(wǎng)絡(luò)行為評(píng)分模型進(jìn)行信用評(píng)級(jí)。
信用卡類網(wǎng)站的大數(shù)據(jù)同樣對(duì)互聯(lián)網(wǎng)金融的風(fēng)險(xiǎn)控制非常有價(jià)值。申請(qǐng)信用卡的年份、是否通過(guò)、授信額度、卡片種類;信用卡還款數(shù)額、對(duì)優(yōu)惠信息的關(guān)注等都可以作為信用評(píng)級(jí)的參考數(shù)據(jù)。
2013年阿里巴巴以5.86億美元購(gòu)入新浪微博18%的股份來(lái)獲得社交大數(shù)據(jù),阿里完善了大數(shù)據(jù)類型。加上淘寶的水電煤繳費(fèi)信息、信用卡還款信息、支付和交易信息,已然成為了數(shù)據(jù)全能選手。
小貸類網(wǎng)站積累的信貸大數(shù)據(jù)包括信貸額度、違約記錄等。但單一企業(yè)缺陷在于數(shù)據(jù)的數(shù)量級(jí)別低和地域性太強(qiáng)。還有部分小貸網(wǎng)站平臺(tái)通過(guò)線下采集數(shù)據(jù)轉(zhuǎn)移到線上的方式來(lái)完善信用數(shù)據(jù),這些特點(diǎn)決定了如果單兵作戰(zhàn)他們必定付出巨大成本。因此貢獻(xiàn)數(shù)據(jù)、共享數(shù)據(jù)的模式正逐步被認(rèn)可,抱團(tuán)取暖勝過(guò)單打獨(dú)斗。
第三方支付類平臺(tái)未來(lái)的機(jī)遇在于未來(lái)有可能基于用戶的消費(fèi)數(shù)據(jù)做信用分析。支付的方向、每月支付的額度、購(gòu)買產(chǎn)品品牌都可以作為信用評(píng)級(jí)的重要參考數(shù)據(jù)。
生活服務(wù)類網(wǎng)站的大數(shù)據(jù)如水、電、煤氣、有線電視、電話、網(wǎng)絡(luò)費(fèi)、物業(yè)費(fèi)交納平臺(tái)則客觀真實(shí)地反映了個(gè)人的基本信息,是信用評(píng)級(jí)中一類重要的數(shù)據(jù)類型。
圖2 大數(shù)據(jù)加工過(guò)程圖解析
擁有了這些數(shù)據(jù)后,大數(shù)據(jù)加工的過(guò)程如圖2所示。同時(shí)阿里的加工過(guò)程也極具代表性,具體流程如下所示:
首先,通過(guò)阿里巴巴B2B、淘寶、天貓、支付寶等電子商務(wù)平臺(tái),收集客戶積累的信用數(shù)據(jù),利用在線視頻全方位定性調(diào)查客戶資信,再加上交易平臺(tái)上的客戶信息(客戶評(píng)價(jià)度數(shù)據(jù)、貨運(yùn)數(shù)據(jù)、口碑評(píng)價(jià)等),并對(duì)后兩類信息進(jìn)行量化處理;同時(shí)引入海關(guān)、稅務(wù)、電力等外部數(shù)據(jù)加以匹配,建立數(shù)據(jù)庫(kù)模型。
其次,通過(guò)交叉檢驗(yàn)技術(shù)輔以第三方驗(yàn)證確認(rèn)客戶信息的真實(shí)性,將客戶在電子商務(wù)網(wǎng)絡(luò)平臺(tái)上的行為數(shù)據(jù)映射為企業(yè)和個(gè)人的信用評(píng)價(jià),通過(guò)沙盤推演技術(shù)對(duì)地區(qū)客戶進(jìn)行評(píng)級(jí)分層,研發(fā)評(píng)分卡體系、微貸通用規(guī)則決策引擎、風(fēng)險(xiǎn)定量化分析等技術(shù)。
第三,在風(fēng)險(xiǎn)監(jiān)管方面,開(kāi)發(fā)了網(wǎng)絡(luò)人際爬蟲(chóng)系統(tǒng),突破地理距離的限制,捕捉和整合相關(guān)人際關(guān)系信息,并通過(guò)逐條規(guī)則的設(shè)立及其關(guān)聯(lián)性分析得到風(fēng)險(xiǎn)評(píng)估結(jié)論,結(jié)合結(jié)論與貸前評(píng)級(jí)系統(tǒng)進(jìn)行交叉驗(yàn)證,構(gòu)成風(fēng)險(xiǎn)控制的雙保險(xiǎn)。阿里小貸還憑借互聯(lián)網(wǎng)技術(shù)監(jiān)控貸款的流向:如果該客戶是貸款用于擴(kuò)展經(jīng)營(yíng),阿里小貸將會(huì)對(duì)其廣告投放、店鋪裝修和銷售進(jìn)行評(píng)估和監(jiān)控。
5.結(jié)論
金融服務(wù)將進(jìn)一步從粗放式管理向精細(xì)化管理轉(zhuǎn)型,由抵押文化向信用文化轉(zhuǎn)變,更全面的信用體制和風(fēng)險(xiǎn)管理體制將會(huì)建立。風(fēng)險(xiǎn)控制作為金融的本質(zhì)將是其中最重要的一環(huán),而大數(shù)據(jù)毫無(wú)疑問(wèn)將在此過(guò)程中發(fā)揮重大的作用,但大部分的互聯(lián)網(wǎng)金融企業(yè)目前體量尚小,用戶規(guī)模和交易額都不大,因此在數(shù)據(jù)積累基礎(chǔ)上能夠及時(shí)結(jié)合實(shí)際情況進(jìn)行互動(dòng),及時(shí)修正模型,相互促進(jìn)從而達(dá)到風(fēng)險(xiǎn)控制模型的逐步優(yōu)化。
參考文獻(xiàn)
[1]李耀東,李鈞.互聯(lián)網(wǎng)金融框架與實(shí)踐[M].北京:電子工業(yè)出版社,2014.
[2]羅明雄,唐穎,劉勇.互聯(lián)網(wǎng)金融[M].北京:中國(guó)財(cái)政經(jīng)濟(jì)出版社,2013.
[3]張海泉.大數(shù)據(jù)時(shí)代下的信貸風(fēng)險(xiǎn)防控研究[J].中國(guó)集體經(jīng)濟(jì).2014(14):75-77.
[4]吳昭華.大數(shù)據(jù)時(shí)代的互聯(lián)網(wǎng)金融發(fā)展研究[J].電子世界.2014(05):192-193.
[5]井華,王南海.大數(shù)據(jù)時(shí)代下的互聯(lián)網(wǎng)金融[J].國(guó)際融資.2013(11):24-25.
[6]王召.“大數(shù)據(jù)”:傳統(tǒng)金融與互聯(lián)網(wǎng)金融爭(zhēng)奪的焦點(diǎn)[J].中國(guó)農(nóng)村金融.2014(02):44-45.
作者簡(jiǎn)介:楊秀萍(1978—),廣東龍川人,碩士,廣東農(nóng)工商職業(yè)技術(shù)學(xué)院計(jì)算機(jī)系講師,主要研究方向:智能信息處理。