秦啟雯
(中國人民銀行西寧中心支行 青海西寧 810001)
近年來,大數(shù)據(jù)分析技術(shù)崛起,得到了人們更多的關(guān)注,并應(yīng)用于現(xiàn)代信息科技領(lǐng)域。大數(shù)據(jù)分析概念,最初源于美國麥肯錫的一個(gè)科學(xué)研究報(bào)告,后來通過眾多科研人員和企業(yè)的推廣與普及,大數(shù)據(jù)分析的概念逐步流傳開來。由于大數(shù)據(jù)分析的體積十分巨大,內(nèi)容類型豐富且數(shù)量規(guī)模龐大,并不是一個(gè)完全獨(dú)立的數(shù)據(jù)源,只是經(jīng)過網(wǎng)絡(luò)技術(shù)的加工與采集后逐漸產(chǎn)生的數(shù)據(jù)庫,它在分析數(shù)據(jù)上具備真實(shí)性較高的特征。因此,公司在產(chǎn)品運(yùn)營與發(fā)展過程中可以利用互聯(lián)網(wǎng)技術(shù)獲取數(shù)據(jù)且分析大量用戶數(shù)據(jù),一定程度上增強(qiáng)企業(yè)產(chǎn)品運(yùn)營的針對(duì)性,進(jìn)而大幅改善公司管理水平。此外,由于大數(shù)據(jù)處理技術(shù)龐雜,對(duì)紛繁復(fù)雜的大數(shù)據(jù)處理信息需要進(jìn)行相應(yīng)的加工與處理,從而產(chǎn)生有用數(shù)據(jù)。
雖然大數(shù)據(jù)分析技術(shù)一直是推動(dòng)建立現(xiàn)代互聯(lián)網(wǎng)金融機(jī)構(gòu)風(fēng)控系統(tǒng)的有力工具,但我國的互聯(lián)網(wǎng)金融風(fēng)控發(fā)展時(shí)間相對(duì)不長。伴隨科技的進(jìn)步,很多智能技術(shù)已經(jīng)在網(wǎng)絡(luò)金融風(fēng)控上發(fā)揮作用,但還是受到內(nèi)外部諸多不確定因素的影響。在計(jì)算機(jī)網(wǎng)絡(luò)上,大規(guī)模的社會(huì)信息采集、數(shù)據(jù)分析都需要煩瑣的步驟和較長的時(shí)間,但是在智能互聯(lián)網(wǎng)技術(shù)應(yīng)用以后,一些全新的技術(shù)出現(xiàn),與之前的舊技術(shù)形成交叉,兩者的融合與大數(shù)據(jù)技術(shù)的價(jià)值體現(xiàn)是需要深入研究的。利用大數(shù)據(jù)分析技術(shù)可判定并提高個(gè)人信息真實(shí)性,進(jìn)行個(gè)人身份信息掃描、圖片辨別人臉,再加入融資擔(dān)保機(jī)構(gòu)等,能夠?qū)訉影芽鼐W(wǎng)絡(luò)上金融信息的風(fēng)險(xiǎn)。就像目前中國互聯(lián)網(wǎng)金融業(yè)界比較重視的信用風(fēng)險(xiǎn)和欺詐風(fēng)險(xiǎn)等,可以通過剖析歷史事件,發(fā)現(xiàn)其內(nèi)在的邏輯規(guī)律性,列出危險(xiǎn)性指標(biāo),進(jìn)行大數(shù)據(jù)樣本檢驗(yàn),從而實(shí)現(xiàn)算法優(yōu)選,并建立基于大數(shù)據(jù)風(fēng)險(xiǎn)控制的基礎(chǔ)模式,通過不斷收集大量新數(shù)據(jù)加以檢驗(yàn)與優(yōu)化。以美國最主要的個(gè)人信用評(píng)價(jià)工具FICO信用分為例,評(píng)級(jí)的基礎(chǔ)思想就是將每個(gè)借款人過去的信貸發(fā)展歷史資源和信息庫中各個(gè)借款人的信貸習(xí)慣進(jìn)行比較,檢查借款人的信息與違規(guī)、隨意透支、申請(qǐng)倒閉的各種財(cái)政困難的情況,FICO評(píng)級(jí)是傳統(tǒng)金融領(lǐng)域?qū)Υ髷?shù)據(jù)技術(shù)的利用,美國很多商業(yè)銀行早已著手試圖利用大數(shù)據(jù)分析來驅(qū)動(dòng)銀行業(yè)務(wù)經(jīng)營。例如,中信銀行刷卡中心利用大數(shù)據(jù)分析技術(shù)進(jìn)行實(shí)際經(jīng)營;光大商業(yè)銀行構(gòu)建了社會(huì)互聯(lián)網(wǎng)信息數(shù)據(jù)庫系統(tǒng);招商銀行運(yùn)用大數(shù)據(jù)分析技術(shù)發(fā)展小微信貸。大數(shù)據(jù)分析技術(shù)在金融產(chǎn)業(yè)的利用率也相當(dāng)高,可以為金融產(chǎn)業(yè)風(fēng)險(xiǎn)管理保駕護(hù)航。
首先,互聯(lián)網(wǎng)交易成本費(fèi)用低廉。資本供求雙方在資本融通流程中所產(chǎn)生的成本費(fèi)用稱為互聯(lián)網(wǎng)交易成本費(fèi)用,互聯(lián)網(wǎng)利用信息網(wǎng)絡(luò),降低了人力、物力的投資,發(fā)布資訊、匹配商品、制定價(jià)格、成交均采用互聯(lián)網(wǎng)完成,穩(wěn)定了貿(mào)易成本費(fèi)用。其次,網(wǎng)絡(luò)服務(wù)便捷、高效,而且不受時(shí)限、空間的約束,客戶只需在手機(jī)或者電腦上進(jìn)行操作就可以完成需求。大數(shù)據(jù)中的信息價(jià)值量很廣,建立在大數(shù)據(jù)分析技術(shù)基礎(chǔ)上,電子商務(wù)和互聯(lián)網(wǎng)相融合,使得人民群眾無論是生活、學(xué)習(xí)還是工作上,都逐漸形成依賴性,使某些單元和個(gè)別的生活消費(fèi)資訊在互聯(lián)網(wǎng)空氣中流露,從而形成了海量的信息數(shù)據(jù)庫,數(shù)據(jù)便是信息資源,如果進(jìn)行分析與研究便是極大的商務(wù)價(jià)值。最后風(fēng)險(xiǎn)系數(shù)高、創(chuàng)新性強(qiáng)。隨著科學(xué)技術(shù)的發(fā)展,不斷誕生新的金融產(chǎn)品、融資形態(tài),一系列網(wǎng)絡(luò)產(chǎn)品和支付方法也層出不窮,如互聯(lián)網(wǎng)銀行、網(wǎng)上保險(xiǎn)、眾籌融資、網(wǎng)上證券、余額寶、支付寶、微信支付、網(wǎng)絡(luò)借貸等。但是由于現(xiàn)階段對(duì)網(wǎng)絡(luò)金融機(jī)構(gòu)的監(jiān)督力量薄弱,沒有法規(guī)制約,使得有些不法分子違規(guī)集資、實(shí)施網(wǎng)上欺詐,嚴(yán)重危害網(wǎng)絡(luò)金融的安全。
現(xiàn)代信息技術(shù)系統(tǒng)包括收集與預(yù)處理、儲(chǔ)存與管理、運(yùn)算模型與系統(tǒng)、大數(shù)據(jù)分析與挖掘、可視化計(jì)算、保護(hù)與安全管理等方面,可優(yōu)化信息處理環(huán)節(jié),提高信息處理效能,特征一般為信息資源體量大、類別多、處理速度快、信息內(nèi)容價(jià)值密度系數(shù)低。在當(dāng)今社會(huì),信息技術(shù)隨處可見,并滲透于人們每日的生活、學(xué)習(xí)、工作中。以阿里巴巴小額貸款公司為例,在2015年累計(jì)發(fā)放貸款1953億元,交易額上升40%。大數(shù)據(jù)分析的運(yùn)用可以有效減少交易成本、增加交易頻次、擴(kuò)大交易空間、提升交易體驗(yàn),有效推動(dòng)了網(wǎng)絡(luò)金融市場的健康發(fā)展,但也面臨著一定的隱患和風(fēng)險(xiǎn),如暴露個(gè)人隱私,甚至影響公司的經(jīng)營管理決策等。
雖然大數(shù)據(jù)分析的運(yùn)用在現(xiàn)階段并不能全部實(shí)現(xiàn)預(yù)測的精確性,但是已經(jīng)有不少比較成熟的例子。比如DataSifi通過對(duì)社會(huì)數(shù)據(jù)網(wǎng)絡(luò)的數(shù)據(jù)分析總結(jié),制定出具體的實(shí)施方案;Zest運(yùn)用大數(shù)據(jù)分析信用評(píng)價(jià),已拿到了一億美元的投資;Decide運(yùn)用價(jià)格信息預(yù)測價(jià)格趨勢,已給出了比較合理的購買意見等等。隨著大數(shù)據(jù)的累積與平臺(tái)的發(fā)展,網(wǎng)絡(luò)金融服務(wù)越來越普遍,受余額寶、微信理財(cái)通等影響,國內(nèi)互聯(lián)網(wǎng)金融主要應(yīng)用在個(gè)人理財(cái)方面,但實(shí)際上金融中最具剛性要求的業(yè)務(wù)是借貸,大數(shù)據(jù)分析也推動(dòng)著金融服務(wù)的不斷創(chuàng)新。交易是為了實(shí)現(xiàn)高收益,使用交易程序和硬件裝置,迅速分析、生成、捕獲并發(fā)出買賣命令,才能在短暫的時(shí)間內(nèi)進(jìn)行較多的買賣。交易方面已經(jīng)十分頻繁,因?yàn)樗芾么髷?shù)據(jù)分析技術(shù)將市場中的各方連接在一起,再共同使用先進(jìn)的技術(shù)功能性,并且在交易過程中客戶信息會(huì)被記憶,而且很多信息的搜集都是在交易進(jìn)行的同時(shí)展開的,能夠辨識(shí)此模式的算法就能夠估計(jì)這支基金在其他時(shí)刻的價(jià)格動(dòng)向,但如果繼續(xù)執(zhí)行買賣,就需要再支付更高的報(bào)價(jià),此算法交易商可以趁機(jī)獲得收益。
大概兩年前, 對(duì)沖基金已經(jīng)在各種媒介上形成了一種適應(yīng)市場的信息搜集處理工具,在此集中包括很多軟件,如Facebook、博客、聊天室等。在看到有關(guān)恐怖主義事件、天然災(zāi)難等突如其來的消息時(shí)也會(huì)拋售訂單,精神病專家理查德·彼得森在2008年于美國加利福尼亞州圣莫尼卡集資100萬美元成立對(duì)沖基金,利用追蹤網(wǎng)絡(luò)、微博、聊天室等剖析企業(yè)情緒,并制定基金的買賣決策,該基金的收益率在2010年高達(dá)40%。再如設(shè)在英國倫敦的小型對(duì)沖基金DCM,通過在社會(huì)媒介上獲取資訊,剖析人類對(duì)金融工具的情感,并協(xié)助投資者制定投資計(jì)劃。金融機(jī)構(gòu)可以通過對(duì)大小額用戶買賣行為中的數(shù)據(jù)進(jìn)行采集,從而對(duì)其買賣范圍、運(yùn)營情況、目標(biāo)用戶、融資需求及業(yè)務(wù)的發(fā)展趨勢等做出具體的數(shù)據(jù)分析,以化解企業(yè)的經(jīng)營困難。阿里小貸開創(chuàng)了從線上審批到放款的管理模式,有效銜接了放貸的全過程,給弱勢群體提供了人性化的小額貸款。
就大數(shù)據(jù)分析的實(shí)際使用情況來說,雖然達(dá)不到人們所期望的精確性,但是目前的確有了很多較為成熟的商業(yè)例子。比如,Decide運(yùn)用八十億條以上的已知市場價(jià)值信息預(yù)估價(jià)格趨勢,并提供了采購意見;DataSift利用分析社交互聯(lián)網(wǎng)數(shù)據(jù)挖掘,并提出了針對(duì)性銷售方法;Zestfinance運(yùn)用大數(shù)據(jù)分析開展個(gè)人的信用評(píng)價(jià)工作,并累計(jì)取得近一億美元的商業(yè)投資;等等。隨著大數(shù)據(jù)平臺(tái)的發(fā)展與數(shù)量的累積,互聯(lián)網(wǎng)金融公司也將加入當(dāng)中,所以三步走目前已經(jīng)轉(zhuǎn)變成交叉并行的三個(gè)方向。國內(nèi)市場對(duì)網(wǎng)絡(luò)金融服務(wù)的應(yīng)用比較多的是在傳統(tǒng)理財(cái)產(chǎn)品上,主要是受到阿里余額寶、百度、微信理財(cái)產(chǎn)品通等的負(fù)面影響,但其實(shí)借貸才是傳統(tǒng)金融服務(wù)中最具剛性要求的業(yè)務(wù)。由于社會(huì)大眾資金需求上的碎片化程度增加,商業(yè)銀行等傳統(tǒng)金融機(jī)構(gòu)的產(chǎn)品自然而然地落地,網(wǎng)絡(luò)征信已經(jīng)圍繞大數(shù)據(jù)挖掘等方面完成了很好的轉(zhuǎn)型。因此,大數(shù)據(jù)挖掘已經(jīng)推動(dòng)了高頻網(wǎng)絡(luò)交易、社會(huì)金融分析方法及信息風(fēng)險(xiǎn)分析方法三個(gè)金融服務(wù)技術(shù)創(chuàng)新。
首先,高頻交易和算法交易。以高頻買賣為例,交易中人們?yōu)榱双@取最大收益,往往運(yùn)用硬件設(shè)施和買賣程序上的優(yōu)點(diǎn),通過迅速收集信息、分類、制作并傳遞買賣指令等,在短時(shí)期內(nèi)連續(xù)買進(jìn)或賣出,而現(xiàn)在的高頻買賣大多采用“策略序列買賣”,即通過解析資金信息,以辨識(shí)出某個(gè)金融市場參與者所留下來的足跡。舉例來說,假設(shè)一個(gè)合伙基金常常在收盤前一分鐘的第1秒做出最大訂單,可以辨識(shí)這一模型的計(jì)算將預(yù)測出該基金在其他買賣時(shí)段內(nèi)的價(jià)格動(dòng)態(tài),并做出同樣的買賣結(jié)果。該基金在繼續(xù)執(zhí)行成交時(shí)也將支付較高的報(bào)價(jià),因此采用算法的交易者可趁機(jī)獲益。
其次,通過搜集、分析社會(huì)媒介上的內(nèi)容,開展市場情緒分析,金融市場的投資者把對(duì)情緒分析方法的研發(fā)和應(yīng)用緊密結(jié)合起來。大概兩年前,對(duì)沖基金就在Twitter、Facebook、閑聊室和博客等社會(huì)化媒介中,為獲取市場情感消息研發(fā)交易算法。比如,只要從中發(fā)覺有自然災(zāi)難或恐怖主義侵襲等的意外消息發(fā)布,就迅速發(fā)出訂單。2008年,美國精神病專家理查德·彼得森募集100萬美元,在美國加利福尼亞州圣莫尼卡成立了名叫MarketPsy Capital的對(duì)沖基金,通過跟蹤閑聊室、博客、網(wǎng)頁和微博等,以判斷金融市場上對(duì)不同公司的情感,再由此制定基金交易策略,至2010年該基金收益率已達(dá)到40%。設(shè)在倫敦的小額對(duì)沖基金DCM資本,利用從Facebook和Twitter等社會(huì)化媒介上獲取的資訊,將人類對(duì)某種金融工具的情緒狀態(tài)加以打分,從而向零售顧客發(fā)出預(yù)警,并輔助投資人做出決策。
最后,增加對(duì)風(fēng)險(xiǎn)的可審度和管控措施,以支持精細(xì)化管控。金融機(jī)構(gòu)希望獲取并分析大量中小微企業(yè)用戶日常交易活動(dòng)的歷史數(shù)據(jù),從而確定其主要經(jīng)營范疇、運(yùn)營情況、誠信狀態(tài)、用戶定位、融資要求及業(yè)務(wù)發(fā)展,克服因?yàn)樾∥⑵髽I(yè)財(cái)務(wù)制度的不完善而無法真實(shí)掌握其實(shí)際運(yùn)營情況的困難。阿里小貸開創(chuàng)了從風(fēng)險(xiǎn)評(píng)估到放款的全程線上服務(wù)模式,將貸前、貸中和貸后的三環(huán)服務(wù)形成高效連接,向一般無法從傳統(tǒng)金融機(jī)構(gòu)拿到信貸的人群,大規(guī)模投放“數(shù)額小、時(shí)限短、隨借隨還”的小額貸款。
風(fēng)險(xiǎn)管理中,最有效的辦法比喻起來便是把全部的雞蛋以各種各樣的比率分別裝到各個(gè)籃子里,即所謂小額、散放,盡量避免集中投入。散放在風(fēng)險(xiǎn)管理方面具有十分關(guān)鍵的意義,因?yàn)榻杩羁蛻魝€(gè)人差異很大,由于身處地區(qū)有所不同,而且經(jīng)濟(jì)條件如年紀(jì)、學(xué)歷等也有差異,所以這種離散的個(gè)體違約的概率就比較獨(dú)立,并且違約的概率也非常小。如100個(gè)單獨(dú)的個(gè)人其違約的概率為20%,假設(shè)隨機(jī)抽取兩個(gè)人,同時(shí)違約的概率是22%或4%,如果隨機(jī)抽取5個(gè)人,同時(shí)違約的概率是25%,如果抽取8個(gè)人同時(shí)違約的概率是25%,但是假設(shè)這100個(gè)人之間具有相關(guān)性,甲在違約的時(shí)候乙也違約,那么他們一起違約的概率就是10%,所以貸款中個(gè)人間的獨(dú)立性就是減少風(fēng)險(xiǎn)的必要措施。小額解決小樣本偏差問題。像某家信貸企業(yè)現(xiàn)在的信貸一共有10億元,假設(shè)每位貸款人平均能貸5萬元,一共有2萬個(gè)客戶,假設(shè)單筆貸款數(shù)額平均為100萬元,那么就有1000個(gè)客戶服務(wù),按照計(jì)量經(jīng)濟(jì)學(xué)中的一般規(guī)律,樣本數(shù)量越多,越遵循正態(tài)分布法則。所以,如果借款人的違約概率為2%,那么這2萬個(gè)客戶的違約概率就會(huì)超過另外1000個(gè)客戶的違約概率。利用大數(shù)據(jù)分析構(gòu)建風(fēng)控模式和決定引擎也十分關(guān)鍵。由于小額分散貸款客戶總量較多,如果銀行通過傳統(tǒng)的信審模式無法統(tǒng)一衡量償債能力、償還意向,就會(huì)進(jìn)一步提高風(fēng)險(xiǎn)成本。因此,可參考國外的P2P,通過信貸工廠模式,構(gòu)建風(fēng)險(xiǎn)模型,結(jié)合客戶的行為特點(diǎn)判定該客戶的違約概率,從而減少人工評(píng)估的成本,降低人工評(píng)估結(jié)果與評(píng)估準(zhǔn)則的偏差。風(fēng)控系統(tǒng)的核心方法除按照小額分散原則之外,還要通過深入研究不同特征個(gè)人的違約概率,形成大數(shù)據(jù)風(fēng)控模塊和評(píng)分卡系統(tǒng),將其固化在風(fēng)控審核的業(yè)務(wù)過程和決策引擎中,了解不同個(gè)人的違約概率程度,從而引導(dǎo)風(fēng)險(xiǎn)審批業(yè)務(wù)進(jìn)行。
目前由于我國的金融風(fēng)險(xiǎn)防控體系尚不完善,其中有許多信息的搜集無法真實(shí)精準(zhǔn)地完成,所以結(jié)合大數(shù)據(jù)信息技術(shù)在互聯(lián)網(wǎng)金融服務(wù)當(dāng)中的應(yīng)用產(chǎn)品數(shù)量并不多,信息數(shù)據(jù)相對(duì)不實(shí),而且來源不明確,缺乏真實(shí)準(zhǔn)確性,導(dǎo)致網(wǎng)絡(luò)金融服務(wù)的落實(shí)比較困難。如果不接近央行征信體系,那么很多風(fēng)險(xiǎn)管控體系在互聯(lián)網(wǎng)上的建立就能幫助企業(yè)完善信息搜集?,F(xiàn)階段,網(wǎng)絡(luò)金融機(jī)構(gòu)的風(fēng)控體系主要有兩類:一類是規(guī)模龐大的中小型網(wǎng)絡(luò)金融機(jī)構(gòu)向中間征信機(jī)構(gòu)貢獻(xiàn)財(cái)務(wù)數(shù)據(jù),能夠把握征信的信息共享權(quán)利。另一類是與阿里進(jìn)行合作,構(gòu)建全新的信用評(píng)估體系與模型,還要對(duì)諸多交易及消費(fèi)者的信息進(jìn)行全面統(tǒng)計(jì)和分析。在中央銀行征信體系的基礎(chǔ)上可驗(yàn)證一些身份,然后商業(yè)銀行或者金融組織就能有效結(jié)合大數(shù)據(jù)技術(shù)進(jìn)行信息搜集和挖掘,但是對(duì)于其他的互聯(lián)網(wǎng)金融組織和機(jī)構(gòu)并不會(huì)提供查詢等服務(wù)。甚至一些個(gè)人的信用記錄也不會(huì)在該體系內(nèi),有可能在其他的金融機(jī)構(gòu)或者網(wǎng)絡(luò)金融公司的體系內(nèi)出現(xiàn)。
互聯(lián)網(wǎng)信息數(shù)量龐大,充滿了復(fù)雜性。阿里構(gòu)建完整的大數(shù)據(jù)挖掘體系比較早,不過當(dāng)時(shí)不少人還處在迷茫狀態(tài),于是利用以淘寶、天貓、支付寶等積累了大量消費(fèi)為基本的數(shù)據(jù)分析原料,再根據(jù)賣家的銷量和銀行流水等財(cái)務(wù)數(shù)據(jù),進(jìn)行全面整理后通過網(wǎng)絡(luò)評(píng)級(jí)模式開展個(gè)人信用評(píng)估活動(dòng)。銀行卡分類網(wǎng)站的大數(shù)據(jù)分析功能同樣對(duì)于網(wǎng)絡(luò)金融風(fēng)險(xiǎn)防控有著巨大的實(shí)用價(jià)值,可以依據(jù)用戶信用卡辦卡年齡、還款信息、信用額度、發(fā)卡類型等做出信用評(píng)估。2013年,阿里買下了新浪微博18%的股權(quán),耗資約5.86億元,目的是希望掌握社會(huì)大數(shù)據(jù),進(jìn)而完成大數(shù)據(jù)分析,銀行卡的還款信息、交易、消費(fèi),以及淘寶上的水電煤氣等繳費(fèi)信息,現(xiàn)階段已經(jīng)形成大數(shù)據(jù)分析的基石。未來,第三方消費(fèi)平臺(tái)付款的方向、額度、購物品牌及金額等都可以作為個(gè)人信用評(píng)估的重要數(shù)據(jù)參考,生活類信息服務(wù)網(wǎng)站中有關(guān)個(gè)人用戶的日常生活消費(fèi)信息如水費(fèi)、電費(fèi)、煤氣費(fèi)、物業(yè)費(fèi)、電話費(fèi)、上網(wǎng)費(fèi)等都有可能反映用戶的生活基礎(chǔ)信息,為個(gè)人信用評(píng)估提供重要的依據(jù),只有掌握所有的大數(shù)據(jù)分析信息才可以實(shí)現(xiàn)大數(shù)據(jù)分析的有效加工。
本文對(duì)于互聯(lián)網(wǎng)背景下大數(shù)據(jù)技術(shù)支撐的網(wǎng)絡(luò)金融風(fēng)險(xiǎn)管理體系進(jìn)行全面闡述,并從中挖掘此期間利用互聯(lián)網(wǎng)金融存在的各種風(fēng)險(xiǎn),再對(duì)相關(guān)解決措施進(jìn)行深入探究,根據(jù)當(dāng)前的互聯(lián)網(wǎng)金融風(fēng)控實(shí)際情況全面探析和論述,并提出了個(gè)人的見解,希望能對(duì)相關(guān)人員提供借鑒。