国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于邏輯回歸的個人信用評分卡模型研究

2024-06-03 02:22:12張俊麗郭雙顏任翠萍馬倩
現(xiàn)代信息科技 2024年5期

張俊麗 郭雙顏 任翠萍 馬倩

收稿日期:2023-08-01

基金項(xiàng)目:2020年陜西省教育科學(xué)“十三五”規(guī)劃課題(SGH20Y1480);2022年西安歐亞學(xué)院校級項(xiàng)目(2022GCPY01)

DOI:10.19850/j.cnki.2096-4706.2024.05.003

摘? 要:構(gòu)建有效的個人信用風(fēng)險評價系統(tǒng),用以應(yīng)對潛在的個人信貸風(fēng)險,這對金融行業(yè)和社會公眾皆有重要的現(xiàn)實(shí)意義。文章首先對數(shù)據(jù)進(jìn)行清洗、預(yù)處理,然后通過WOE編碼分箱、IV值進(jìn)行變量篩選,構(gòu)建了邏輯回歸模型并基于邏輯回歸模型建立了個人信用評分卡模型,該模型可輔助決策者制定合理的授信政策、定價策略以及其他相關(guān)業(yè)務(wù)運(yùn)營策略。

關(guān)鍵詞:個人信用評估;評分卡;AUC

中圖分類號:TP39;O212.1 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2024)05-0012-05

Research on Personal Credit Score Card Model Based on Logistic Regression

ZHANG Junli1, GUO Shuangyan2, REN Cuiping1, MA Qian1

(1.Xi'an Eurasia University, Xi'an? 710065, China; 2.Shaanxi Branch of Bank of Communications, Xi'an? 710004, China)

Abstract: Building an effective personal credit risk assessment system to address potential personal credit risks is of great practical significance for the financial industry and the general public. This paper first cleans and preprocesses the data, and then uses WOE coding and binning and IV values for variable screening. A logistic regression model is constructed, and a personal credit score card model is established based on the logistic regression model. This model can assist decision-makers in formulating reasonable credit policies, pricing strategies, and other related business operation strategies.

Keywords: personal credit evaluation; score card; AUC

0? 引? 言

隨著經(jīng)濟(jì)和互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,信用消費(fèi)的方式逐漸興起,已融入人們的日常生活,如住房貸款、汽車貸款,以及個人信用卡、螞蟻花唄、借唄、京東白條金條等小額消費(fèi)貸款。這些金融服務(wù)的使用都離不開個人信用,其中個人信用風(fēng)險評估是一個必不可少的環(huán)節(jié)[1-3]。因此,對個人信用風(fēng)險進(jìn)行合理評估,對客戶是否會違約進(jìn)行預(yù)測,成為金融機(jī)構(gòu)控制風(fēng)險的重要手段。信用消費(fèi)產(chǎn)業(yè)的健康發(fā)展,可以為消費(fèi)者帶來極大的便利。對金融機(jī)構(gòu)來說,信用消費(fèi)有著廣闊的市場空間,蘊(yùn)含著巨大的利潤增長點(diǎn);對金融市場來說,信用消費(fèi)可以分散金融風(fēng)險,促進(jìn)金融體系的健康發(fā)展;對社會經(jīng)濟(jì)來說,信用消費(fèi)能夠拉動社會需求,促進(jìn)經(jīng)濟(jì)增長。

在如今這個信息時代,互聯(lián)網(wǎng)技術(shù)的發(fā)展也帶動了互聯(lián)網(wǎng)金融行業(yè)的繁榮?;ヂ?lián)網(wǎng)金融是指傳統(tǒng)金融機(jī)構(gòu)與互聯(lián)網(wǎng)企業(yè)利用互聯(lián)網(wǎng)技術(shù)和信息通信技術(shù)實(shí)現(xiàn)資金融通、支付、投資和信息中介服務(wù)的新型金融業(yè)務(wù)模式。簡單來說就是利用互聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)了更快捷、更便利的支付、征信、投資理財、融資、信貸業(yè)務(wù)?,F(xiàn)如今,不僅可以通過手機(jī)進(jìn)行網(wǎng)購,還可以通過手機(jī)申請信貸,例如人們所熟知的花唄、京東白條等?;ヂ?lián)網(wǎng)金融的發(fā)展從面對面的業(yè)務(wù)辦理向手機(jī)業(yè)務(wù)辦理方向發(fā)展。隨著居民購買力的不斷提高,信貸、信用卡這一系列具備信貸消費(fèi)功能的產(chǎn)品接踵而來。而個人平常使用這些產(chǎn)品時無不反襯著消費(fèi)者的信用特征信息,金融機(jī)構(gòu)可以通過諸如此類的個人征信記錄來審批是否向某人提供貸款或信貸等服務(wù)。對客戶信用風(fēng)險的準(zhǔn)確預(yù)測對銀行和金融企業(yè)來說至關(guān)重要,可以最大限度地減少向客戶放貸的風(fēng)險,降低做出錯誤決策的概率。因此,相對于傳統(tǒng)操作中業(yè)務(wù)人員的主觀判斷,信用評分模型更具客觀性、全面性、準(zhǔn)確性、效率性。

目前,消費(fèi)信用正處于高速發(fā)展的階段,一些信用企業(yè)在經(jīng)營上也面臨著大大小小的風(fēng)險。為了促進(jìn)我國消費(fèi)信貸的良性發(fā)展,需要建立科學(xué)、合理的個人信用風(fēng)險評估與預(yù)測機(jī)制。與此同時,促進(jìn)行業(yè)健康發(fā)展、健全個人征信系統(tǒng)、嚴(yán)評用戶的違約風(fēng)險、防范不良信貸的發(fā)生、提升信貸機(jī)構(gòu)風(fēng)險管控能力變得更加重要。在信貸產(chǎn)品不斷涌現(xiàn)與數(shù)據(jù)利用率低下的客觀矛盾下,應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行個人信用評價具有十分重要的意義。實(shí)行個人信用評價不但可以提升銀行的審批效率,還可以降低銀行的信貸風(fēng)險,規(guī)避人工審核過程中出錯情況的發(fā)生。這對于金融業(yè)的發(fā)展具有舉足輕重的作用。

1? 個人信用風(fēng)險評估介紹

個人信用指的是客戶與信貸機(jī)構(gòu)之間(即受信人與授信人之間),為滿足受信人個人生活消費(fèi)需求,建立在誠實(shí)守信基礎(chǔ)上的一種履行契約關(guān)系、遵守契約約定的能力。所以個人信用評估即是授信人對受信人在信貸過程中所承擔(dān)的還貸義務(wù)及其可信程度做出判斷和評估。個人信用評價也是一個客戶償債能力和履約能力的綜合反映和寫照。狹義上說,信貸機(jī)構(gòu)評價的是客戶的履約能力、償債能力和守信程度;廣義上是指客戶個人履行各類經(jīng)濟(jì)承諾的守信程度和可信任程度。個人信用評估,又稱“消費(fèi)者信用評估”,它是根據(jù)對客戶的個人信用歷史資料,綜合微觀環(huán)境和個人特征(內(nèi)外主客觀原因)的考察,結(jié)合經(jīng)濟(jì)、金融、司法、社會、工商、財產(chǎn)等因素(例如信用歷史記錄、行為記錄、個人特征、交易記錄),通過使用科學(xué)、嚴(yán)謹(jǐn)?shù)姆治龇椒ɑ蛐庞蔑L(fēng)險評估模型,對客戶的償付能力或信用程度進(jìn)行全面的判斷和評估,從而根據(jù)評估結(jié)果對客戶進(jìn)行信用評級。

個人信用風(fēng)險評估的方法有很多,傳統(tǒng)的個人信用風(fēng)險評估主要是評估人員根據(jù)自己的主觀意愿對客戶進(jìn)行評判。由于這種方法的不確定性因素和主觀因素太多,評判指標(biāo)過少,從而會造成評估結(jié)果的非全面性和非有效性。隨著基于統(tǒng)計方法的個人信用評估模型的大量涌現(xiàn),我們現(xiàn)在可以十分客觀地預(yù)測客戶的個人信用等級[4-7]。

個人信用評估方面在國外已有150年的發(fā)展歷史,最早啟用的評估方法是Fisher于1936年提出的判別式分析法。在這150年的發(fā)展歷程中,判別分析法、非參數(shù)分析法、人工智能和統(tǒng)計學(xué)方法紛紛應(yīng)用在信用評估上。以往學(xué)者通常將個人信用評估問題分成分類和回歸這兩大問題。分類問題是根據(jù)多個貸款人在相同地點(diǎn)以及類別中的特征指標(biāo),去判斷不同貸款人的所屬類別。分類問題的主要算法有:線性判別、神經(jīng)網(wǎng)絡(luò)、遺傳算法、K近鄰、分類樹;回歸問題是指根據(jù)多個貸款人在未知的所屬類別中的特征指標(biāo),估計和預(yù)測其信用分?jǐn)?shù)和違約概率,線性回歸是這類問題將會用到的重要方法。在國內(nèi),個人信用體系起步較晚,2000年才開始起步。這個時期最典型的方法便是:銀行要求客戶填寫一張表單,然后銀行根據(jù)預(yù)定義的計分表對每個指標(biāo)進(jìn)行打分,再根據(jù)打分結(jié)果決定是否接受該客戶的申請。而預(yù)定義計分表中每個指標(biāo)的權(quán)重分?jǐn)?shù)都是根據(jù)專家的主觀意見和經(jīng)驗(yàn)給出的,缺少必要的信用評價機(jī)制和懲戒規(guī)范機(jī)制[8,9]。因此,如果信貸機(jī)構(gòu)想要降低信貸所帶來的風(fēng)險,就必須科學(xué)有效、公平公正、有理有據(jù)地對個人信用風(fēng)險進(jìn)行評估。

本文采用數(shù)據(jù)挖掘技術(shù),建立并訓(xùn)練優(yōu)化模型,從而科學(xué)有效地對個人信用風(fēng)險進(jìn)行快速評估。希望能夠在加強(qiáng)及完善互聯(lián)網(wǎng)金融個人信用風(fēng)險評估方面盡一點(diǎn)綿薄之力,可以在某種程度上幫助機(jī)構(gòu)拒絕信用風(fēng)險高的人,達(dá)到規(guī)避信用風(fēng)險高人群所帶來的損失,即達(dá)到降低風(fēng)險的目的。

2? 個人信用風(fēng)險變量選擇及分箱

本文所用到的分析數(shù)據(jù)來自Kaggle平臺,總共挑選20 000條數(shù)據(jù)。原始數(shù)據(jù)特征為47維,其中包含匿名特征15個。本文以isDefault為因變量,以貸款金額、貸款期限、貸款利率、貸款等級等46個變量作為自變量進(jìn)行分析研究。

IV值的全稱為Information Value,即信息量或信息價值[10],它是評分卡模型中的一個常見指標(biāo),廣泛應(yīng)用于金融風(fēng)控領(lǐng)域。其主要作用是在構(gòu)建分類模型時對變量進(jìn)行篩選,對輸入變量進(jìn)行編碼和預(yù)測能力評估。IV值用于衡量自變量預(yù)測能力的大?。◤?qiáng)弱),與其相似的還有信息增益、基尼系數(shù)等。

對IV值的解釋預(yù)測力如表1所示。

表1? IV值的解釋預(yù)測力

IV值范圍 預(yù)測能力 選擇

<0.02 無預(yù)測能力 不納入模型變量候選集

[0.02, 0.1) 較弱 根據(jù)實(shí)際情況決定是否納入模型變量候選集

[0.1, 0.3) 中等 根據(jù)實(shí)際情況決定是否納入模型變量候選集

[0.3, 0.5) 強(qiáng) 納入模型變量候選集

≥0.5 很強(qiáng) 具有可疑性,需進(jìn)一步調(diào)查

WOE值的全稱是Weight of Evidence,由于各個變量的量綱和取值區(qū)間存在很大的差別,通常會對變量的取值進(jìn)行分箱并計算WOE值。若要對一個變量進(jìn)行WOE編碼,首先需要對這個變量進(jìn)行分箱處理。分箱后,對第i組進(jìn)行以下運(yùn)算:

其中:n為分組個數(shù),表示各分組中“壞”客戶占總“壞”客戶的比例,表示各分組中“好”客戶占總“好”客戶的比例。因此,引入WOE的轉(zhuǎn)換,對變量進(jìn)行篩選并計算WOE、IV值。

如圖1所示,根據(jù)計算出的各變量IV值,過濾IV值<0.02的變量,保留interestRate、ficoRangeLow、ficoRangeHigh、dti、loanAmnt、revolUtil、installment、annualIncome、grade、term、verificationStatus、homeOwnership這12個變量。

利用WOE轉(zhuǎn)換對變量進(jìn)行分箱,以“ficoRangeHigh”為例,輸出變量的分箱統(tǒng)計表,如表2所示。

采用上述分箱方法對數(shù)據(jù)進(jìn)行分箱處理,部分?jǐn)?shù)據(jù)如表3所示。

圖1? 變量IV值

3? 基于邏輯回歸的個人信用風(fēng)險評估

現(xiàn)如今常用的個人信用風(fēng)險評估方法主要有邏輯回歸法、判別分析法、人工智能法和非參數(shù)分析法。本文建立了基于邏輯回歸的個人信用評分卡模型。

為了深入挖掘影響違約的顯著因素,首先按照7:3的比例將數(shù)據(jù)集拆分為訓(xùn)練集和測試集,在測試集上對模型進(jìn)行訓(xùn)練,得到邏輯回歸模型,如表4所示。

從邏輯回歸模型結(jié)果可以看出,變量interestRate、ficoRangeLow、dti、loanAmnt、annualIncome、term、verificationStatus、homeOwnership均對違約有顯著影響。

繪制模型的ROC曲線,得到模型的AUC值為0.708,模型的分類效果較好,如圖2所示?;谧罴验撝?.199,可計算得到模型的準(zhǔn)確率為0.73,表示測試集數(shù)據(jù)中有73%的客戶會被正確歸類,精確率達(dá)到0.45,表示預(yù)測為違約的客戶中確實(shí)發(fā)生違約行為的客戶占比為45%,召回率達(dá)到0.76,表示客戶發(fā)生違約并被模型預(yù)測出來的比例為76%。

圖2? ROC曲線

4? 基于邏輯回歸的個人信用評分卡模型

評分卡是一種以分?jǐn)?shù)形式衡量一個客戶信用風(fēng)險大小的憑借,評分卡設(shè)定的分值刻度可以通過將分值表示為比率對數(shù)的現(xiàn)行表達(dá)式來定義。在實(shí)際應(yīng)用中,計算出每個變量各分箱對應(yīng)的分值。當(dāng)有新用戶產(chǎn)生時,對應(yīng)到每個分箱的值,將這些值相加,最后加上初始基礎(chǔ)分,得到最終的結(jié)果。如果用戶的某個變量發(fā)生改變,由一個分箱變成另一個分箱,只需將更新后所在分箱的值進(jìn)行替換,再重新相加即可得到新的總分。因此,可以說個人信用評分卡模型具有很強(qiáng)的業(yè)務(wù)應(yīng)用價值。

結(jié)合logistic模型和評分計算表達(dá)式,可以將評分卡改為以下形式:

其中,Score為信用得分,A為“補(bǔ)償”,B為“刻度”,顯然,違約概率越高,信用得分越低。采用個人信用評分卡模型,可以通過對不同用戶的各種特征進(jìn)行量化評分,實(shí)現(xiàn)對用戶信用水平的評估,如表5所示。

根據(jù)各變量得分表最終可得各樣本的分值,如圖3所示。銀行或金融機(jī)構(gòu)可以首先根據(jù)個人信用評分卡模型中各預(yù)測變量不同分類的信用評分,結(jié)合自身的業(yè)務(wù)需求對每個用戶進(jìn)行量化評分。然后,根據(jù)評分的分布特征設(shè)定相應(yīng)的閾值,將用戶劃分為不同的類別。通過這種方式可以有效控制風(fēng)險,實(shí)現(xiàn)收益的最大化。

圖3? 得分分布圖

5? 結(jié)? 論

本文首先對變量進(jìn)行了WOE轉(zhuǎn)換、分箱處理,并計算每個變量的IV值來對變量進(jìn)行選擇,剔除相關(guān)性不高的變量,然后基于邏輯回歸模型建立了個人信用評分卡模型。通過個人信用評分卡模型,金融機(jī)構(gòu)和其他組織可以更加準(zhǔn)確地評估借款人、客戶的信用風(fēng)險程度。這有助于決策者制定合理的授信政策、定價策略以及其他相關(guān)業(yè)務(wù)運(yùn)營策略;同時也可以幫助用戶了解自己的信用狀況,并采取相應(yīng)的措施來改善自身的信用評分。

參考文獻(xiàn):

[1] 都珂珂,黃全生,張玥.我國個人信用評估模型綜述 [J].經(jīng)營與管理,2021(1):166-172.

[2] 戴蓓蓓.基于組合預(yù)測模型的商業(yè)銀行個人信貸風(fēng)險預(yù)測 [J].經(jīng)濟(jì)研究導(dǎo)刊,2022(35):69-72.

[3] 毛子林,劉姜.基于機(jī)器學(xué)習(xí)方法的信用風(fēng)險評估綜述 [J].經(jīng)濟(jì)研究導(dǎo)刊,2021(23):117-119.

[4] 劉念,王文君,高家鳴,等.檢驗(yàn)檢測機(jī)構(gòu)信用風(fēng)險評價指標(biāo)體系建設(shè)研究 [J].中國標(biāo)準(zhǔn)化,2023(23):218-222.

[5] 呂秀梅,張儒.網(wǎng)絡(luò)小額貸款業(yè)務(wù)個人信用風(fēng)險評估——基于DNN-SMOTEENN-ExtraTrees組合模型 [J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2023,53(7):14-21.

[6] 楊柳,孫帶.基于多分類器串并聯(lián)結(jié)構(gòu)的個人信用評估模型 [J].湘潭大學(xué)學(xué)報:自然科學(xué)版,2022,44(6):1-11.

[7] 黃寶鳳,祁婷婷.基于特征工程的個人信用風(fēng)險評估組合模型 [J].中國統(tǒng)計,2021(6):37-39.

[8] 范彥勤,黃海午,楊智凱.基于特征工程和樹增強(qiáng)貝葉斯網(wǎng)絡(luò)的個人信用評估研究 [J].桂林航天工業(yè)學(xué)院學(xué)報,2022,27(4):573-579.

[9] 張俊麗,仲崇麗,楊震,等.基于數(shù)據(jù)挖掘的上市公司高送轉(zhuǎn)預(yù)測 [J].財務(wù)管理研究,2021(6):90-95.

[10] 張華.基于邏輯回歸的駕駛員信用評估研究 [J].計算機(jī)時代,2023(3):25-27+35.

作者簡介:張俊麗(1982—),女,漢族,陜西韓城人,副教授,碩士,研究方向:數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)。

曲阳县| 绩溪县| 海南省| 惠州市| 临泉县| 曲阳县| 义马市| 宁都县| 措勤县| 大同县| 古丈县| 双柏县| 谢通门县| 德安县| 三亚市| 江门市| 临沂市| 慈利县| 榕江县| 巧家县| 河南省| 灯塔市| 文化| 丁青县| 茶陵县| 海宁市| 延边| 邻水| 调兵山市| 金昌市| 湖南省| 大化| 武隆县| 上高县| 北辰区| 金湖县| 蓬莱市| 杭锦后旗| 来安县| 满洲里市| 陵川县|