国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

消費(fèi)信貸智能決策模型系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

2020-09-10 12:29杜一謙
關(guān)鍵詞:消費(fèi)信貸大數(shù)據(jù)技術(shù)

杜一謙

摘 ?要:消費(fèi)信貸風(fēng)險(xiǎn)管理是一個(gè)廣交的領(lǐng)域,其中銀行的內(nèi)部控制更是變化多端。為了提升風(fēng)控核心競(jìng)爭(zhēng)力,基于先進(jìn)的數(shù)據(jù)倉(cāng)庫(kù)Hadoop技術(shù)建立銀行信用貸款的智能決策系統(tǒng),并運(yùn)用多種數(shù)據(jù)挖掘及分析工具,充分利用銀行現(xiàn)有數(shù)據(jù),通過(guò)決策引擎及模型接口實(shí)現(xiàn)智能決策引擎風(fēng)險(xiǎn)識(shí)別和防控,判定銀行是否應(yīng)該發(fā)放貸款。該系統(tǒng)的建立對(duì)銀行信用管理和風(fēng)險(xiǎn)預(yù)測(cè)具有指導(dǎo)意義,為銀行消費(fèi)信貸業(yè)務(wù)的拓展提供參考和依據(jù)。

關(guān)鍵詞:消費(fèi)信貸;智能決策;大數(shù)據(jù)技術(shù)

中圖分類(lèi)號(hào): TP311 ? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A

0 引言

近年來(lái),隨著我國(guó)經(jīng)濟(jì)轉(zhuǎn)型升級(jí)逐步推進(jìn),消費(fèi)金融行業(yè)進(jìn)入了快速發(fā)展時(shí)期。面對(duì)愈加嚴(yán)峻的互聯(lián)網(wǎng)風(fēng)險(xiǎn)環(huán)境,大數(shù)據(jù)、人工智能等技術(shù)逐漸進(jìn)入消費(fèi)信貸決策領(lǐng)域,科技與金融的結(jié)合日益嚴(yán)密。生物識(shí)別、OCR技術(shù)、用戶(hù)畫(huà)像、反欺詐模型、信用模型等技術(shù)成為必不可少的核心信貸決策環(huán)節(jié)。

隨著外部市場(chǎng)環(huán)境的不斷變化,僅僅依靠傳統(tǒng)的信貸決策方式已不能滿足銀行消費(fèi)信貸業(yè)務(wù)發(fā)展的需要,正確及時(shí)地決策成了銀行業(yè)各機(jī)構(gòu)生存與發(fā)展的重要保障,智能決策模型系統(tǒng)的搭建(以下簡(jiǎn)稱(chēng)“系統(tǒng)”)至關(guān)重要。

1 系統(tǒng)設(shè)計(jì)思想

智能決策引擎模型系統(tǒng)的設(shè)計(jì)需要結(jié)合業(yè)務(wù)實(shí)際,做到功能完備的同時(shí),又具有可發(fā)展性,能夠應(yīng)對(duì)未來(lái)的市場(chǎng)變化。系統(tǒng)的設(shè)計(jì)主要考慮以下3個(gè)方面。

1.1 多維識(shí)別,防范欺詐

消費(fèi)信貸業(yè)務(wù)前端一直面臨著大量欺詐客戶(hù)的攻擊,隨著身份偽冒、團(tuán)伙欺詐等風(fēng)險(xiǎn)愈演愈烈,科技反欺詐成為系統(tǒng)中必不可少的一環(huán)[1]。首先通過(guò)內(nèi)嵌人臉活體識(shí)別、指紋識(shí)別、聲紋識(shí)別等前端生物識(shí)別技術(shù)進(jìn)行客戶(hù)身份認(rèn)證。其次通過(guò)銀行卡四要素鑒權(quán)技術(shù),進(jìn)一步進(jìn)行客戶(hù)身份核實(shí)。最后通過(guò)OCR等文字識(shí)別技術(shù),進(jìn)行申請(qǐng)資料的識(shí)別,將紙質(zhì)或圖像材料轉(zhuǎn)為電子化信息,使其能夠供決策模型系統(tǒng)后續(xù)使用。

1.2 海量數(shù)據(jù),流暢運(yùn)行

隨著業(yè)務(wù)的不斷發(fā)展,沉淀的數(shù)據(jù)量及數(shù)據(jù)維度呈指數(shù)級(jí)增長(zhǎng),傳統(tǒng)的Oracle數(shù)據(jù)庫(kù)架構(gòu)在運(yùn)行高維、大批量數(shù)據(jù)時(shí)顯得力不從心,模型迭代進(jìn)度受數(shù)據(jù)處理速度制約。

在該背景下,系統(tǒng)設(shè)計(jì)搭建基于Hadoop框架的大數(shù)據(jù)平臺(tái),采用非結(jié)構(gòu)化的數(shù)據(jù)存儲(chǔ)方式和分布式計(jì)算功能,使模型開(kāi)發(fā)在大數(shù)據(jù)運(yùn)算過(guò)程中更加靈活和高效。

1.3 實(shí)時(shí)決策,智能預(yù)警

智能決策引擎模型系統(tǒng)主要運(yùn)用于自動(dòng)化審批,對(duì)于系統(tǒng)的實(shí)時(shí)處理能力有著極高的要求。同時(shí),高并發(fā)的審批過(guò)程也會(huì)伴隨一定概率的錯(cuò)誤進(jìn)程,需要建立智能化的預(yù)警機(jī)制。

系統(tǒng)設(shè)計(jì)采用“決策引擎+Python模型接口”的方式,擴(kuò)展自動(dòng)化審批功能的同時(shí),大幅縮短單筆審批時(shí)間。同時(shí),系統(tǒng)需要通過(guò)設(shè)置相關(guān)策略,實(shí)現(xiàn)對(duì)單位時(shí)間內(nèi)申請(qǐng)量、審批結(jié)果等統(tǒng)計(jì)信息的實(shí)時(shí)預(yù)警,幫助業(yè)務(wù)人員及時(shí)發(fā)現(xiàn)并快速解決問(wèn)題。

2 系統(tǒng)結(jié)構(gòu)

智能決策模型系統(tǒng)以大數(shù)據(jù)平臺(tái)(Hadoop)和數(shù)據(jù)倉(cāng)庫(kù)(MPP)混合架構(gòu)的大數(shù)據(jù)基礎(chǔ)體系,為后續(xù)數(shù)據(jù)應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)(如圖1所示)。

大數(shù)據(jù)平臺(tái)負(fù)責(zé)歷史數(shù)據(jù)、外部數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、數(shù)據(jù)挖掘、客戶(hù)畫(huà)像、風(fēng)控、智能決策等場(chǎng)景的支撐,數(shù)據(jù)倉(cāng)庫(kù)負(fù)責(zé)傳統(tǒng)報(bào)表、指標(biāo)等統(tǒng)計(jì)分析場(chǎng)景,兩者相輔相成,共同支撐著整個(gè)數(shù)據(jù)條線的應(yīng)用。

2.1 數(shù)據(jù)采集

利用大數(shù)據(jù)平臺(tái)自帶的數(shù)據(jù)采集組件Flume、Kafka、Sqoop,兼容各種數(shù)據(jù)源,包括流式數(shù)據(jù)(業(yè)務(wù)消息流/日志消息流等)、磁盤(pán)文件、各種數(shù)據(jù)庫(kù)、其他存儲(chǔ)系統(tǒng)等。采集后的數(shù)據(jù)落地到大數(shù)據(jù)平臺(tái)分布式存儲(chǔ)中,其中流式數(shù)據(jù)也可不落地直接進(jìn)入實(shí)時(shí)處理應(yīng)用中。

2.2 分布式存儲(chǔ)

利用大數(shù)據(jù)平臺(tái)HBase組件和HDFS組件的特性,對(duì)海量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲(chǔ),支持無(wú)限拓展,線性擴(kuò)展能力強(qiáng),數(shù)據(jù)存儲(chǔ)靈活。

2.3 資源調(diào)度

多租戶(hù)是大數(shù)據(jù)平臺(tái)大數(shù)據(jù)集群中的多個(gè)資源集合,具有分配和調(diào)度資源的能力。資源包括計(jì)算資源和存儲(chǔ)資源。多租戶(hù)將大數(shù)據(jù)集群的資源隔離成一個(gè)個(gè)資源集合,彼此互不干擾,用戶(hù)通過(guò)“租用”需要的資源集合,來(lái)運(yùn)行應(yīng)用和作業(yè),并存放數(shù)據(jù)。在大數(shù)據(jù)集群上可以存在多個(gè)資源集合來(lái)支持多個(gè)用戶(hù)的不同需求。

2.4 實(shí)時(shí)處理

大數(shù)據(jù)平臺(tái)內(nèi)存數(shù)據(jù)庫(kù)Redis、分布式消息隊(duì)列Kafka和實(shí)時(shí)處理引擎Flink,對(duì)數(shù)據(jù)進(jìn)行分布式計(jì)算,實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)傳輸、實(shí)時(shí)數(shù)據(jù)緩存和實(shí)時(shí)數(shù)據(jù)流處理的高速處理。為智能預(yù)警和智能決策系統(tǒng)提供實(shí)時(shí)準(zhǔn)確的數(shù)據(jù)服務(wù)。

2.5 離線處理

Spark和ELK為海量結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的離線分析處理提供技術(shù)支撐。

2.6 決策模型

基于Spark架構(gòu)預(yù)置機(jī)器學(xué)習(xí)算法庫(kù)和數(shù)據(jù)分析挖掘算法,提供可視化分析挖掘平臺(tái),構(gòu)建實(shí)時(shí)反欺詐平臺(tái)和模型訓(xùn)練平臺(tái)。以用戶(hù)數(shù)據(jù)、畫(huà)像及行為的關(guān)系網(wǎng)絡(luò)為基準(zhǔn),通過(guò)反欺詐模型、信用模型等進(jìn)行風(fēng)險(xiǎn)分析決策,完成貸前準(zhǔn)入、貸中監(jiān)控、貸后管理的信貸全生命周期管控流程。

3 業(yè)務(wù)支撐及實(shí)現(xiàn)

業(yè)務(wù)流程如下:客戶(hù)在信息認(rèn)證界面,需要進(jìn)行基礎(chǔ)認(rèn)證及提額認(rèn)證,其中基礎(chǔ)認(rèn)證包括填寫(xiě)聯(lián)系人、身份證認(rèn)證(上傳身份證照片正反、進(jìn)行活體認(rèn)證和人臉識(shí)別、OCR解析并由系統(tǒng)判斷身份證有效期)、銀行卡綁定(進(jìn)行四要素驗(yàn)證)。提額認(rèn)證主要包括人行及各類(lèi)其他征信源查詢(xún)授權(quán)如圖2所示。

客戶(hù)提交貸款后,系統(tǒng)首先進(jìn)入準(zhǔn)入策略,篩查掉不符合公司合規(guī)要求及產(chǎn)品對(duì)應(yīng)策略要求的客戶(hù),然后,通過(guò)反欺詐策略攔截內(nèi)外部黑名單、嚴(yán)重多頭及命中強(qiáng)關(guān)系欺詐規(guī)則的客戶(hù),再進(jìn)入信用策略,通過(guò)人行征信和自建的子數(shù)據(jù)源等模型劃分客戶(hù)資質(zhì)和分類(lèi),評(píng)估客戶(hù)風(fēng)險(xiǎn)等級(jí),并匹配對(duì)應(yīng)額度和定價(jià)。對(duì)于評(píng)分灰色區(qū)域(評(píng)分在拒絕閾值左右)客戶(hù)和反欺詐策略給出的欺詐團(tuán)伙、黑中介等屬性客戶(hù),進(jìn)入人工審核環(huán)節(jié),跟進(jìn)并確認(rèn)客戶(hù)的欺詐風(fēng)險(xiǎn)和信用風(fēng)險(xiǎn)。審核通過(guò)后,短信通知客戶(hù)審核結(jié)果,提醒客戶(hù)后續(xù)做好還款準(zhǔn)備等工作,并放款至綁定的銀行卡。

4 風(fēng)控模塊及其安全性

決策模型主要運(yùn)用于自動(dòng)化審批,對(duì)于系統(tǒng)的實(shí)時(shí)處理能力有著極高的要求[2]。同時(shí),高并發(fā)的審批過(guò)程也會(huì)伴隨一定概率的錯(cuò)誤進(jìn)程,需要建立智能化的預(yù)警機(jī)制。

4.1 反欺詐模塊

反欺詐模塊由身份驗(yàn)證、黑名單、團(tuán)伙識(shí)別、反欺詐模型等多個(gè)子模塊組成,從不同角度打擊不同形態(tài)的個(gè)人與團(tuán)體欺詐,可以有效防范各種欺詐形態(tài),減少風(fēng)險(xiǎn)損失,保護(hù)客戶(hù)的利益。

4.1.1 嚴(yán)格的身份驗(yàn)證

系統(tǒng)采用活體檢測(cè)、人臉識(shí)別、OCR技術(shù)和銀行卡鑒權(quán)等多種技術(shù)相結(jié)合,對(duì)申請(qǐng)者的身份進(jìn)行嚴(yán)格的驗(yàn)證,增加身份偽冒的成本。這些環(huán)節(jié)均在信貸產(chǎn)品申請(qǐng)環(huán)節(jié)中嵌入并實(shí)時(shí)進(jìn)行核驗(yàn),保證了風(fēng)險(xiǎn)控制的準(zhǔn)確性和申請(qǐng)時(shí)效性的平衡。此外對(duì)同一設(shè)備登錄不同賬號(hào)等高風(fēng)險(xiǎn)異常行為進(jìn)行嚴(yán)格控制,有效防止賬號(hào)被盜、黑中介代客下單等欺詐行為。這些技術(shù)在征信查詢(xún)之前就可以對(duì)欺詐客戶(hù)進(jìn)行有效攔截,降低欺詐風(fēng)險(xiǎn)的同時(shí),也可以保護(hù)客戶(hù)利益不被違法分子侵害。

4.1.2 黑名單

利用歷史積累的申請(qǐng)數(shù)據(jù)與表現(xiàn)數(shù)據(jù),形成內(nèi)部的黑名單并持續(xù)更新。黑名單可以對(duì)風(fēng)險(xiǎn)較高的歷史客戶(hù)進(jìn)行快速識(shí)別,可以有效節(jié)省征信成本與系統(tǒng)資源。

4.1.3 欺詐團(tuán)伙識(shí)別

傳統(tǒng)的信貸審核只以單筆申請(qǐng)的角度對(duì)客戶(hù)進(jìn)行審視,無(wú)法獲得不同申請(qǐng)之間的關(guān)聯(lián)關(guān)系。而消費(fèi)信貸申請(qǐng)的欺詐行為中,團(tuán)伙欺詐占較大一部分,相較于個(gè)人欺詐也會(huì)帶來(lái)更大的風(fēng)險(xiǎn)損失。團(tuán)伙欺詐具有組織性強(qiáng)、攻擊隱蔽、手段復(fù)雜等特點(diǎn),傳統(tǒng)的風(fēng)險(xiǎn)控制手段無(wú)法應(yīng)對(duì)一直更新的復(fù)雜攻擊手段,效率和準(zhǔn)確率都有一定限制。針對(duì)該問(wèn)題,建立了關(guān)系網(wǎng)絡(luò)模型,通過(guò)積累沉淀信貸生命周期中的客戶(hù)數(shù)據(jù),尋找不同申請(qǐng)之間的關(guān)聯(lián)性,并通過(guò)社群發(fā)現(xiàn)等圖算法,定位高風(fēng)險(xiǎn)的欺詐團(tuán)體。當(dāng)新的客戶(hù)來(lái)申請(qǐng)時(shí),系統(tǒng)可以通過(guò)算法快速定位其與高風(fēng)險(xiǎn)欺詐團(tuán)體是否有關(guān)聯(lián)。關(guān)系網(wǎng)絡(luò)模型隨著數(shù)據(jù)的積累定期進(jìn)行更新迭代,能應(yīng)對(duì)一直更新的欺詐手段。

4.1.4 反欺詐模型

信用風(fēng)險(xiǎn)模型注重對(duì)所有客戶(hù)進(jìn)行分級(jí),一般采用經(jīng)典的邏輯回歸算法,體現(xiàn)出主要特征與風(fēng)險(xiǎn)之間的線性關(guān)系。而欺詐客戶(hù)一般可以通過(guò)一些手段進(jìn)行包裝,導(dǎo)致信用風(fēng)險(xiǎn)模型無(wú)法抓取極少部分人的異常行為。因此針對(duì)欺詐客戶(hù),開(kāi)發(fā)了專(zhuān)用的反欺詐模型,對(duì)異常行為進(jìn)行大量的特征衍生,采用隨機(jī)森林、梯度提升決策樹(shù)、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)的領(lǐng)先算法,抓取大量特征與欺詐風(fēng)險(xiǎn)之間的非線性關(guān)系,對(duì)異??蛻?hù)進(jìn)行甄別。

4.2 信用模塊

系統(tǒng)的信用模塊主要結(jié)合內(nèi)外部數(shù)據(jù),由信用規(guī)則和信用模型組成,對(duì)客戶(hù)進(jìn)行風(fēng)險(xiǎn)評(píng)級(jí)。

4.2.1 信用規(guī)則

根據(jù)人行報(bào)告和外部數(shù)據(jù)顯示的申請(qǐng)人不同階段的申請(qǐng)、發(fā)放、還款等行為數(shù)據(jù),衍生出不同時(shí)間序列維度下的數(shù)據(jù)標(biāo)簽,從收入負(fù)債、資金緊迫性等方面評(píng)估申請(qǐng)人的還款意愿和還款能力,形成強(qiáng)風(fēng)險(xiǎn)規(guī)則組合。

4.2.2 信用模型

信用模型運(yùn)用數(shù)據(jù)挖掘方法,通過(guò)對(duì)客戶(hù)的基本信息特征、行為記錄、交易記錄等大量原始數(shù)據(jù)進(jìn)行分析,挖掘數(shù)據(jù)中客戶(hù)存在的行為模式、信用特征,預(yù)測(cè)客戶(hù)未來(lái)的信用表現(xiàn)。信用模型的主要功能是以科學(xué)的方法將風(fēng)險(xiǎn)模式數(shù)據(jù)化。提供客觀風(fēng)險(xiǎn)量尺,減少主觀判斷。提高風(fēng)險(xiǎn)管理效率、節(jié)省人力成本。其主要包括2個(gè)方面的內(nèi)容。1)算法研究。目前系統(tǒng)主要運(yùn)用邏輯回歸、決策樹(shù)、聚類(lèi)等常規(guī)算法,實(shí)現(xiàn)對(duì)客戶(hù)的分層和評(píng)級(jí),這些算法可解釋性高、穩(wěn)定性好。同時(shí),XGB、CNN等前沿算法模型也在系統(tǒng)中同步運(yùn)行,但由于該類(lèi)算法近乎黑箱,無(wú)法有效解釋其中變量與風(fēng)險(xiǎn)的關(guān)系,一旦模型出現(xiàn)異動(dòng),無(wú)法準(zhǔn)確定位原因并進(jìn)行有針對(duì)性地處置,同時(shí)模型穩(wěn)定性較低,區(qū)分度隨時(shí)間下降較快,因此僅作為主模型的補(bǔ)充和交叉驗(yàn)證。此外,在新模型迭代的過(guò)程中發(fā)現(xiàn),如果建模樣本中不包含拒件客戶(hù),會(huì)導(dǎo)致在訓(xùn)練過(guò)程中表現(xiàn)較好的新模型,迭代后業(yè)務(wù)風(fēng)險(xiǎn)反而有所上升。所以在模型開(kāi)發(fā)過(guò)程中應(yīng)使用拒絕推斷算法,納入歷史拒件樣本,更準(zhǔn)確地評(píng)估整體樣本風(fēng)險(xiǎn),避免因模型迭代導(dǎo)致的風(fēng)險(xiǎn)波動(dòng)。2)模型應(yīng)用。為了持續(xù)篩選風(fēng)險(xiǎn)防控效果最優(yōu)的模型,同時(shí)保證不同特征的客群能有一定風(fēng)險(xiǎn)表現(xiàn)供后期模型優(yōu)化,系統(tǒng)中設(shè)置了一定比例的冠軍挑戰(zhàn)審批流,比較各個(gè)模型的風(fēng)控效果及各類(lèi)特征客戶(hù)的實(shí)際表現(xiàn),用于逐步優(yōu)化迭代模型。在線上業(yè)務(wù)發(fā)展過(guò)程中發(fā)現(xiàn),不同客群的風(fēng)險(xiǎn)表現(xiàn)有一定差異,根據(jù)整體客戶(hù)風(fēng)險(xiǎn)表現(xiàn)對(duì)模型閾值采用一刀切的方式,會(huì)導(dǎo)致不少好客戶(hù)被拒之門(mén)外,過(guò)件率較難提升。結(jié)合客戶(hù)畫(huà)像的研究結(jié)果,在模型評(píng)分閾值的制定上納入了“分客群”的思想,根據(jù)客群資質(zhì)靈活調(diào)整模型閾值,提升過(guò)件率的同時(shí)降低風(fēng)險(xiǎn)。

5 結(jié)語(yǔ)

項(xiàng)目上線以來(lái),累計(jì)實(shí)現(xiàn)自動(dòng)審批逾900萬(wàn)筆,服務(wù)客戶(hù)逾500萬(wàn)人,審批時(shí)效在1 min以?xún)?nèi),模型表現(xiàn)也穩(wěn)步提升。該項(xiàng)目極大地節(jié)省了人工成本,降低風(fēng)險(xiǎn)損失,優(yōu)化客戶(hù)體驗(yàn),借助科技創(chuàng)新推進(jìn)普惠金融。

參考文獻(xiàn)

[1]吳雷,楊儀,吳傳威,等.基于多層架構(gòu)的信用卡反欺詐系統(tǒng)研究[J].金融科技時(shí)代,2018(1):41-45.

[2]單良,喬楊.數(shù)據(jù)化風(fēng)控:信用評(píng)分建模教程[M].北京:電子工業(yè)出版社,2018.

猜你喜歡
消費(fèi)信貸大數(shù)據(jù)技術(shù)
后疫情時(shí)代個(gè)人消費(fèi)信貸對(duì)消費(fèi)結(jié)構(gòu)的影響研究
消費(fèi)信貸對(duì)江蘇省經(jīng)濟(jì)增長(zhǎng)的影響研究
——基于期限結(jié)構(gòu)視角
消費(fèi)信貸對(duì)我國(guó)經(jīng)濟(jì)增長(zhǎng)的影響研究
安徽省消費(fèi)信貸的發(fā)展研究
消費(fèi)信貸市場(chǎng)均衡及其影響研究:一個(gè)無(wú)限生命跨期消費(fèi)模型
大數(shù)據(jù)技術(shù)對(duì)新聞業(yè)務(wù)的影響研究
消費(fèi)信貸與消費(fèi)者行為研究述評(píng):基于多學(xué)科視角
宿州市| 夏河县| 林芝县| 甘南县| 灵璧县| 宿松县| 观塘区| 新乐市| 澄城县| 呼和浩特市| 保德县| 南平市| 平乡县| 荆门市| 建德市| 体育| 阳高县| 方城县| 京山县| 九龙坡区| 龙陵县| 佛冈县| 仪陇县| 常宁市| 永城市| 桂东县| 始兴县| 台前县| 出国| 大关县| 胶南市| 蛟河市| 晋州市| 昌邑市| 牟定县| 正定县| 盐山县| 名山县| 东源县| 石门县| 神农架林区|