国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

金融科技在互聯(lián)網(wǎng)金融行業(yè)性風(fēng)險(xiǎn)防范領(lǐng)域的應(yīng)用

2018-03-01 03:48:53胡鵬飛
大數(shù)據(jù) 2018年1期
關(guān)鍵詞:數(shù)據(jù)源欺詐圖譜

胡鵬飛

北京宜信致誠(chéng)信用管理有限公司,北京 100022

1 引言

2006—2016年,中國(guó)的普惠金融已經(jīng)發(fā)展成為中國(guó)金融體系的重要組成部分,隨著行業(yè)監(jiān)管細(xì)則的不斷落地,行業(yè)發(fā)展愈加有章可循。但與此同時(shí),借款人的信用風(fēng)險(xiǎn)(借款人多頭負(fù)債和欺詐風(fēng)險(xiǎn))嚴(yán)重影響了行業(yè)的健康發(fā)展。這些風(fēng)險(xiǎn)如果得不到很好的防控,很可能會(huì)演化成一個(gè)行業(yè)的系統(tǒng)性風(fēng)險(xiǎn)。在此背景下,如何做好風(fēng)險(xiǎn)管理與防范成為行業(yè)發(fā)展的重中之重。

2 互聯(lián)網(wǎng)金融行業(yè)面臨的挑戰(zhàn)

隨著互聯(lián)網(wǎng)金融行業(yè)規(guī)模的不斷擴(kuò)大,借款需求持續(xù)增加,行業(yè)整體的風(fēng)控水平亟待提升,主要面臨的挑戰(zhàn)包括以下3點(diǎn)。

● 行業(yè)數(shù)據(jù)“孤島”現(xiàn)象嚴(yán)重。互聯(lián)網(wǎng)金融機(jī)構(gòu)每天都會(huì)接到大量借款申請(qǐng),但由于缺乏數(shù)據(jù)共享機(jī)制,機(jī)構(gòu)獲知有關(guān)借款人的信用數(shù)據(jù),特別是強(qiáng)金融屬性數(shù)據(jù)的難度非常大。一方面導(dǎo)致機(jī)構(gòu)無(wú)法有效判斷客戶的風(fēng)險(xiǎn)等級(jí),另一方面也導(dǎo)致多頭負(fù)債現(xiàn)象頻生。這就需要通過(guò)技術(shù)手段實(shí)現(xiàn)信用信息的互聯(lián)互通,并從海量數(shù)據(jù)中挖掘有效信息用以識(shí)別信用風(fēng)險(xiǎn)。

● 行業(yè)惡意欺詐現(xiàn)象越來(lái)越嚴(yán)重,欺詐手段不斷翻新,且趨于科技化、專業(yè)化、規(guī)?;哺哂须[蔽性,這已經(jīng)嚴(yán)重制約了互聯(lián)網(wǎng)金融行業(yè)的健康發(fā)展。

● 金融科技在風(fēng)控制領(lǐng)域滲透度低,行業(yè)機(jī)構(gòu)的風(fēng)控水平參差不齊,很多機(jī)構(gòu)仍采用線下人工的傳統(tǒng)信用審計(jì)方式,缺乏金融科技的應(yīng)用與助力,在風(fēng)控成本、風(fēng)控質(zhì)量、風(fēng)控時(shí)效性上均無(wú)法滿足實(shí)際的業(yè)務(wù)需求。

因此,首先應(yīng)當(dāng)解決行業(yè)數(shù)據(jù)割裂的瓶頸,形成了一個(gè)行業(yè)機(jī)構(gòu)間的共享生態(tài)系統(tǒng),實(shí)現(xiàn)互聯(lián)網(wǎng)金融行業(yè)數(shù)據(jù)的互聯(lián)與互通,有效防范行業(yè)多頭負(fù)債的發(fā)生。其次,應(yīng)擁有強(qiáng)大的信用數(shù)據(jù)分析與挖掘能力,推動(dòng)數(shù)據(jù)在風(fēng)控決策中的運(yùn)用,幫助機(jī)構(gòu)防范信用風(fēng)險(xiǎn)。最后,應(yīng)最大化地將金融科技與業(yè)務(wù)融合,并通過(guò)量化評(píng)分、風(fēng)險(xiǎn)分級(jí),對(duì)風(fēng)險(xiǎn)實(shí)現(xiàn)最優(yōu)排序性和區(qū)分度,準(zhǔn)確識(shí)別用戶欺詐的可能性,精準(zhǔn)反饋風(fēng)險(xiǎn)信息。

3 技術(shù)難點(diǎn)及應(yīng)對(duì)思路

為了解決當(dāng)前互聯(lián)網(wǎng)金融行業(yè)面臨的挑戰(zhàn),防范行業(yè)系統(tǒng)性風(fēng)險(xiǎn)的集中爆發(fā),推動(dòng)行業(yè)健康發(fā)展,北京宜信致誠(chéng)信用管理有限公司(以下簡(jiǎn)稱致誠(chéng)信用)推出了致誠(chéng)阿福風(fēng)控平臺(tái)(以下簡(jiǎn)稱阿福平臺(tái)),以共享為核心,基于強(qiáng)金融屬性數(shù)據(jù)及先進(jìn)風(fēng)控經(jīng)驗(yàn)、大數(shù)據(jù)分析應(yīng)用及評(píng)分建模能力,采用分布式服務(wù)化的系統(tǒng)架構(gòu),通過(guò)RESTful應(yīng)用程序編程接口(application programming interface,API)方式提供海量數(shù)據(jù)對(duì)接查詢服務(wù),幫助信貸機(jī)構(gòu)防范在貸前調(diào)查、貸中授信和貸后管理中因信息不對(duì)稱帶來(lái)的潛在風(fēng)險(xiǎn)。除此之外,還將知識(shí)圖譜、大數(shù)據(jù)分析等金融科技應(yīng)用于信用審計(jì)風(fēng)控領(lǐng)域,以提升機(jī)構(gòu)風(fēng)險(xiǎn)管理的效率和效果,讓金融科技成為金融行業(yè)發(fā)展的動(dòng)力。這是專為網(wǎng)絡(luò)借貸機(jī)構(gòu)、消費(fèi)信貸、小額信貸、銀行信用卡中心等提供身份識(shí)別、反欺詐、信用評(píng)估等服務(wù)的一站式智能風(fēng)控云平臺(tái)。

在開(kāi)發(fā)阿福平臺(tái)的過(guò)程中,存在一些技術(shù)上的難點(diǎn),主要包括以下幾個(gè)問(wèn)題。

(1)第三方機(jī)構(gòu)的系統(tǒng)穩(wěn)定性問(wèn)題

第三方機(jī)構(gòu)系統(tǒng)規(guī)范程度不同,提供服務(wù)的能力參差不齊,如果千萬(wàn)級(jí)的訪問(wèn)量直接運(yùn)行在第三方機(jī)構(gòu)的系統(tǒng)上,絕大部分系統(tǒng)都難以承載。即使有緩存層作為防護(hù),還是會(huì)存在緩存穿透的可能性,導(dǎo)致大量請(qǐng)求涌入第三方機(jī)構(gòu),引發(fā)機(jī)構(gòu)的服務(wù)“雪崩”。因此,一方面要做好監(jiān)控預(yù)警,另一方面也要充分挖掘第三方機(jī)構(gòu)的系統(tǒng)承載潛力。因此,提出了第三方機(jī)構(gòu)系統(tǒng)“健康度”的概念。

健康度是根據(jù)第三方機(jī)構(gòu)歷史吞吐量、響應(yīng)時(shí)間、服務(wù)返回?cái)?shù)據(jù)質(zhì)量綜合計(jì)算得出的。在分發(fā)請(qǐng)求時(shí),會(huì)根據(jù)健康度智能決定查詢數(shù)據(jù)的方式。如果健康度高,能夠滿足秒級(jí)響應(yīng),則實(shí)時(shí)反饋查詢結(jié)果;如果健康度一般,則從緩存獲取,隨后異步請(qǐng)求機(jī)構(gòu),更新緩存內(nèi)容,從而保證秒級(jí)響應(yīng);如果健康度差,則直接從緩存獲取數(shù)據(jù)。同時(shí),監(jiān)控系統(tǒng)也會(huì)檢測(cè)到機(jī)構(gòu)的健康度問(wèn)題,及時(shí)和第三方機(jī)構(gòu)進(jìn)行溝通處理。

(2)并發(fā)訪問(wèn)性能問(wèn)題

由于對(duì)并發(fā)訪問(wèn)性能有很高的要求,需要應(yīng)對(duì)10億級(jí)的被查歷史數(shù)據(jù)量、千萬(wàn)級(jí)訪問(wèn)請(qǐng)求量、億級(jí)的請(qǐng)求分發(fā)量、秒級(jí)的訪問(wèn)響應(yīng)時(shí)間,因此通過(guò)優(yōu)化緩存命中率和并發(fā)訪問(wèn)調(diào)度機(jī)制來(lái)解決。

首先,建立多級(jí)緩存機(jī)制,包含內(nèi)存級(jí)緩存和固態(tài)硬盤(solid state drive,SSD)級(jí)緩存,內(nèi)存級(jí)緩存過(guò)期時(shí)間為24 h,SSD級(jí)緩存過(guò)期時(shí)間為7天(可配置),在兩級(jí)緩存的作用下,緩存命中率將達(dá)到80%以上,緩存集群采用Redis集群方式部署。緩存失效分為主動(dòng)失效和被動(dòng)失效,被動(dòng)失效采用最近最少使用(least recently used,LRU)算法,主動(dòng)失效為確保查詢的信息準(zhǔn)確性,在系統(tǒng)容量充足且第三方機(jī)構(gòu)健康度指標(biāo)達(dá)標(biāo)的情況下,主動(dòng)發(fā)起信息更新行為。

其次,采用NIO+連接池的方式提高并發(fā)訪問(wèn)性能,減少分布式鎖的使用,同時(shí)通過(guò)多級(jí)測(cè)試獲得單個(gè)服務(wù)節(jié)點(diǎn)的服務(wù)能力上限,使線程數(shù)為最佳設(shè)置值,最大限度地利用系統(tǒng)性能。

(3)異構(gòu)數(shù)據(jù)處理問(wèn)題

將知識(shí)圖譜技術(shù)應(yīng)用于信用審計(jì)風(fēng)控領(lǐng)域,可提升機(jī)構(gòu)風(fēng)險(xiǎn)管理的效率和效果。在構(gòu)建知識(shí)圖譜的過(guò)程中,需要處理大量的不同數(shù)據(jù)源的異構(gòu)數(shù)據(jù),如果針對(duì)每一個(gè)新增的數(shù)據(jù)源都寫(xiě)一個(gè)對(duì)應(yīng)的適配器,會(huì)極大地影響開(kāi)發(fā)效率,增加維護(hù)難度。因此,可通過(guò)引入MoonBox和Wormhole解決異構(gòu)數(shù)據(jù)處理問(wèn)題。

通過(guò)引入上述技術(shù),可以實(shí)現(xiàn)支持自動(dòng)適配不同數(shù)據(jù)源(包括My SQ L、Oracle、HDFS、MongoDB等)、透明化異構(gòu)數(shù)據(jù)系統(tǒng)異構(gòu)交互方式、跨異構(gòu)數(shù)據(jù)系統(tǒng)混算。Wormhole還可提供可視化的操作界面、極簡(jiǎn)的配置流程、基于SQL的業(yè)務(wù)開(kāi)發(fā)方式,并屏蔽大數(shù)據(jù)處理底層技術(shù)細(xì)節(jié),使知識(shí)圖譜項(xiàng)目開(kāi)發(fā)和管理變得更加可控可靠。

4 平臺(tái)架構(gòu)

阿福平臺(tái)采用分布式架構(gòu)設(shè)計(jì),系統(tǒng)主要包括展示層、服務(wù)層、消息層、緩存層、數(shù)據(jù)層、監(jiān)控層6部分,涵蓋了從用戶請(qǐng)求接收和分發(fā)、異構(gòu)數(shù)據(jù)的接入和歸一化處理、數(shù)據(jù)模型的構(gòu)建、對(duì)外服務(wù)能力的輸出以及系統(tǒng)整體健康度的檢測(cè)和預(yù)警等內(nèi)容,系統(tǒng)架構(gòu)如圖1所示。

圖1 系統(tǒng)架構(gòu)

(1)展示層

通過(guò)使用Shrio和分布式會(huì)話管理技術(shù),支持不同機(jī)構(gòu)用戶動(dòng)態(tài)展示不同菜單功能項(xiàng),優(yōu)化了展示效果。同時(shí)通過(guò)使用單點(diǎn)登錄(single sign on,SSO)技術(shù),提供各子系統(tǒng)用戶統(tǒng)一信息查詢?nèi)肟?,包括通過(guò)用戶界面(user interface,UI)直接查詢和通過(guò)RESTful API批量查詢,在確保用戶體驗(yàn)的基礎(chǔ)上,滿足了用戶多種查詢模式的需求。

(2)服務(wù)層

將Dubbo作為分布式服務(wù)框架,使用ZooKeeper提供服務(wù)的自動(dòng)注冊(cè)與發(fā)現(xiàn),使用Hystrix提供服務(wù)熔斷機(jī)制,使用UAVStack提供服務(wù)限流和降級(jí)、自動(dòng)化應(yīng)用/服務(wù)畫(huà)像、無(wú)侵入調(diào)用鏈跟蹤、一站式線程分析、秒級(jí)大規(guī)模服務(wù)圖譜繪制、瀏覽器訪問(wèn)跟蹤、多維可視化看板等功能。

(3)消息層

使用Kafka和RocketMQ提供消息服務(wù),其中Kafka應(yīng)用于日志信息同步,RocketMQ應(yīng)用于訂單等要求高可用的使用場(chǎng)景。構(gòu)建統(tǒng)一的消息中心,支持多種消息中間件,同時(shí)抽象出消息的發(fā)送和接收、消息限流、消息去重等功能。

(4)緩存層

使用R e d i s、M e m c a c h e等建立CacheManager,提供統(tǒng)一緩存服務(wù)接口、分布式鎖服務(wù),同時(shí)針對(duì)對(duì)象存儲(chǔ)提供透明的序列化/反序列化服務(wù),支持無(wú)縫擴(kuò)展NoSQL數(shù)據(jù)源。

(5)數(shù)據(jù)層

采用MySQL+HBase集群的方式,其中MySQL采用Sharding-JDBC進(jìn)行分庫(kù)分表,同時(shí)為提高讀取性能,采用了讀寫(xiě)分離技術(shù),一主多從。使用DBus進(jìn)行流式同步,解決不同業(yè)務(wù)系統(tǒng)的數(shù)據(jù)源的同步效率問(wèn)題,使數(shù)據(jù)同步效率從原來(lái)的T+1提高到準(zhǔn)實(shí)時(shí)。

(6)監(jiān)控層

建立多級(jí)監(jiān)控體系,引入E L K+UAVMonitor ,能夠?qū)μ摂M機(jī)、Docker、物理機(jī)的基礎(chǔ)性能指標(biāo)、Java虛擬機(jī)、線程狀態(tài)、服務(wù)整體生命周期、服務(wù)調(diào)用棧、統(tǒng)一日志、數(shù)據(jù)庫(kù)連接池等進(jìn)行全面監(jiān)控和預(yù)警。

圖2 知識(shí)圖譜架構(gòu)

5 知識(shí)圖譜在平臺(tái)的應(yīng)用

平臺(tái)將知識(shí)圖譜技術(shù)應(yīng)用在反欺詐領(lǐng)域,為傳統(tǒng)風(fēng)控帶來(lái)了極具競(jìng)爭(zhēng)力的革新。目前利用致誠(chéng)信用11年來(lái)的海量數(shù)據(jù),構(gòu)建了一個(gè)包含企業(yè)實(shí)體超過(guò)1億、人的實(shí)體超過(guò)4 000萬(wàn)、關(guān)系量超過(guò)50億的知識(shí)圖譜。

知識(shí)圖譜對(duì)數(shù)據(jù)的存儲(chǔ)和組合有巨大優(yōu)勢(shì),但是不利于進(jìn)一步的分析,因此結(jié)合金融行業(yè)的特點(diǎn),形成了一個(gè)更適用于金融場(chǎng)景的社交網(wǎng)絡(luò)圖譜。不同于微信、微博等一般社交網(wǎng)絡(luò),金融場(chǎng)景下的社交網(wǎng)絡(luò)更為稀疏,且節(jié)點(diǎn)含有豐富的金融屬性,狀態(tài)變化頻繁。社交網(wǎng)絡(luò)的屬性描述如下。

● 節(jié)點(diǎn):基于貸前貸后數(shù)據(jù)進(jìn)行用戶畫(huà)像,如進(jìn)件次數(shù)、被拒次數(shù)、最近申請(qǐng)時(shí)間等。

● 邊:把實(shí)體關(guān)系細(xì)分為o w n、contact、call等,并通過(guò)組合得到人與人之間的不同關(guān)系。

構(gòu)建知識(shí)圖譜基于的數(shù)據(jù)來(lái)源于兩大塊數(shù)據(jù)源:一是軟件開(kāi)發(fā)工具包(software development kit,SDK)傳遞的用戶設(shè)備數(shù)據(jù),如設(shè)備基本信息、IP地址信息、全球定位系統(tǒng)(global positioning system,GPS)信息等;二是致誠(chéng)信用歷史用戶授權(quán)信息。針對(duì)不同的數(shù)據(jù)源,采用不同的處理方式。對(duì)于實(shí)時(shí)數(shù)據(jù),基于Spark Streaming開(kāi)發(fā)了數(shù)據(jù)導(dǎo)入工具,對(duì)其進(jìn)行數(shù)據(jù)清洗、格式轉(zhuǎn)換、自然語(yǔ)言處理等相關(guān)操作,可以在秒級(jí)時(shí)延內(nèi)將數(shù)據(jù)導(dǎo)入系統(tǒng)。對(duì)于一些歷史數(shù)據(jù),使用Spark和MapReduce進(jìn)行處理。另外,對(duì)于已經(jīng)存儲(chǔ)的社交網(wǎng)絡(luò)數(shù)據(jù),可以通過(guò)RESTful API方式進(jìn)行查詢,也可以將數(shù)據(jù)導(dǎo)入Hive中,供數(shù)據(jù)分析人員進(jìn)行數(shù)據(jù)分析。知識(shí)圖譜架構(gòu)如圖2所示。

通過(guò)構(gòu)建的知識(shí)圖譜,可以進(jìn)行圖特征提取,計(jì)算人脈信用得分和反欺詐得分,進(jìn)行觸黑關(guān)聯(lián)查詢等,其應(yīng)用如圖3所示。

圖3 知識(shí)圖譜的應(yīng)用

6 應(yīng)用效果

(1)大幅提升信審時(shí)效

通過(guò)強(qiáng)大的信用數(shù)據(jù)分析與挖掘能力,解決了行業(yè)數(shù)據(jù)割裂的瓶頸,在得到客戶授權(quán)的前提下,以共享為基礎(chǔ),通過(guò)分布式架構(gòu)設(shè)計(jì)及API調(diào)用技術(shù),形成了一個(gè)行業(yè)機(jī)構(gòu)間的共享生態(tài)系統(tǒng),實(shí)現(xiàn)了互聯(lián)網(wǎng)金融行業(yè)數(shù)據(jù)的互聯(lián)與互通,有效防范了行業(yè)多頭負(fù)債的發(fā)生。截至2017年10月,阿福平臺(tái)已經(jīng)為行業(yè)累計(jì)預(yù)警多頭借貸1 733萬(wàn)次。其中,在2家及以上機(jī)構(gòu)申請(qǐng)借款的總?cè)藬?shù)達(dá)443萬(wàn)人,在5家及以上機(jī)構(gòu)申請(qǐng)借款的總?cè)藬?shù)達(dá)137.8萬(wàn)人,同一借款人最多向30家機(jī)構(gòu)申請(qǐng)了借款。此外,還幫助行業(yè)機(jī)構(gòu)將傳統(tǒng)線下審批模式升級(jí)為線上智能決策的模式,并成功解決了千萬(wàn)級(jí)并發(fā)訪問(wèn)性能問(wèn)題,實(shí)現(xiàn)了查詢結(jié)果秒級(jí)反饋,大大降低了風(fēng)控成本,提升了信用審計(jì)效率。

(2)提升行業(yè)反欺詐能力

以知識(shí)圖譜為底層架構(gòu)建立了反欺詐的風(fēng)控體系,創(chuàng)新性地研發(fā)了福網(wǎng),以經(jīng)過(guò)校驗(yàn)核實(shí)的多條業(yè)務(wù)線的風(fēng)險(xiǎn)數(shù)據(jù)、社交數(shù)據(jù)以及其他數(shù)據(jù)為基礎(chǔ)進(jìn)行整合,在提升數(shù)據(jù)純度的基礎(chǔ)上,有效釋放了數(shù)據(jù)價(jià)值,通過(guò)自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、聚類算法等方法構(gòu)建了模型,創(chuàng)建了多維度數(shù)據(jù)畫(huà)像。通過(guò)量化評(píng)分、風(fēng)險(xiǎn)分級(jí),對(duì)風(fēng)險(xiǎn)實(shí)現(xiàn)最優(yōu)排序性和區(qū)分度,準(zhǔn)確識(shí)別用戶欺詐的可能性,并為機(jī)構(gòu)反饋精準(zhǔn)且區(qū)隔度高的風(fēng)險(xiǎn)信息。在欺詐客戶的造假手段識(shí)別,構(gòu)建客戶知識(shí)圖譜、社交關(guān)系網(wǎng)絡(luò),從更多維度識(shí)別隱蔽性欺詐、團(tuán)體欺詐預(yù)警等方面,都取得了非常好的防范效果。截至2017年10月,阿福平臺(tái)有效識(shí)別欺詐借款人31 784人,攔截欺詐申請(qǐng)109 367次。

[1] ABREU D D, FLORES A, PALMA G, et al.Choosing between graph databases and RDF engines for consuming and mining linked data[C]//The 4th International Conference on Consuming Linked Data,July 13, 2013, Sydney, Australia. Aachen:CEUR-WS.org, 2013: 37-49.

[2] BORDES A, USUNIER N, WESTON J, et al.Translating embeddings for modeling multi-relational data[C]//The 26th International Conference on Neural Information Processing Systems,December 5-10, 2013, Lake Tahoe, USA.New York: Curran Associates Inc., 2013:2787-2795.

[3] JENATTON R, ROUX N L, BORDES A, et al.A latent factor model for highly multirelational data[C]//The 25th International Conference on Neural Information Processing Systems, December 3-6,2012, Lake Tahoe, USA. New York:Curran Associates Inc., 2012: 3167-3175.

猜你喜歡
數(shù)據(jù)源欺詐圖譜
關(guān)于假冒網(wǎng)站及欺詐行為的識(shí)別
關(guān)于假冒網(wǎng)站及欺詐行為的識(shí)別
繪一張成長(zhǎng)圖譜
警惕國(guó)際貿(mào)易欺詐
Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評(píng)價(jià)研究
主動(dòng)對(duì)接你思維的知識(shí)圖譜
網(wǎng)購(gòu)遭欺詐 維權(quán)有種法
基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評(píng)價(jià)算法
青阳县| 鹤庆县| 漯河市| 闵行区| 昔阳县| 宜州市| 高密市| 广西| 井陉县| 嘉峪关市| 金沙县| 四子王旗| 丰城市| 衡阳县| 当雄县| 达日县| 宝鸡市| 桃园市| 治多县| 渝北区| 吐鲁番市| 高淳县| 宽甸| 延津县| 甘南县| 华阴市| 泸溪县| 东台市| 黎平县| 内黄县| 巴楚县| 邵武市| 鄂尔多斯市| 哈巴河县| 峡江县| 五寨县| 大姚县| 滦平县| 阳高县| 白沙| 永善县|