溫紅梅,隋 昕
(哈爾濱商業(yè)大學(xué) 金融學(xué)院,哈爾濱150028)
當(dāng)前,全球新一輪科技革命持續(xù)深化,金融科技快速興起,新業(yè)態(tài)、新模式、新產(chǎn)品層出不窮,不僅改變了傳統(tǒng)金融服務(wù)運作模式,而且推動了互聯(lián)網(wǎng)貸款的發(fā)展。個人消費貸款的存在,將會在一定程度上影響客戶跨期消費行為。在此背景下,多維度、海量數(shù)據(jù)被融合加工運用于風(fēng)險管理領(lǐng)域,個人信用風(fēng)險評價指標(biāo)體系越來越豐富。然而,在人行征信系統(tǒng)和傳統(tǒng)個人信用風(fēng)險評價指標(biāo)中,很少采用消費信息對個人信用風(fēng)險進(jìn)行評價。消費信息能用于個人信用風(fēng)險評價嗎?這正是本文要回答的問題,本文采用某消費信貸平臺數(shù)據(jù)對這一問題進(jìn)行探究。
在金融科技的推動下,互聯(lián)網(wǎng)消費貸款應(yīng)運而生并已取得長足發(fā)展。截止到目前,互聯(lián)網(wǎng)消費信貸規(guī)模迅速擴(kuò)張,2014 年初規(guī)模為187 億元,2020年底規(guī)模為15.4 萬億元,年復(fù)合增長率為206%。隨著金融科技的蓬勃發(fā)展和新興消費群體的逐步形成,我國消費市場呈現(xiàn)井噴式發(fā)展,各大互聯(lián)網(wǎng)巨頭、P2P 平臺和消費金融公司,甚至是傳統(tǒng)商業(yè)銀行都紛紛布局消費金融市場。
同時,傳統(tǒng)金融機(jī)構(gòu)采用的5C、5W、5P 信用評價方法重點關(guān)注客戶基本情況、償債能力和償債意愿,與傳統(tǒng)金融機(jī)構(gòu)不同,消費金融公司等非傳統(tǒng)金融機(jī)構(gòu)對客戶信用風(fēng)險評價更傾向于采集消費能力、消費頻率和消費等級等信息,這類信息可獲得性較強(qiáng),但無法體現(xiàn)償債能力和償債意愿。因此,消費信息是否能用于個人信用風(fēng)險評價值得深入探討。
一直以來,信息不對稱是影響個人信用風(fēng)險的主要因素。Stiglitz and Weiss(1981)最早提出盡管借款人的信用歷史信息(如信用等級、歷史表現(xiàn))是公開給所有投資者,但網(wǎng)絡(luò)匿名性可能會加劇網(wǎng)絡(luò)借貸的典型信息不對稱問題。與一般金融市場一樣,網(wǎng)絡(luò)借貸市場中也存在信息不對稱現(xiàn)象(Sufi,2007)。信息不對稱的存在,會導(dǎo)致市場萎縮的兩類效應(yīng):其一為“惜貸”效應(yīng),市場的有效供給萎縮;其二為“擠出”效應(yīng),市場的有效需求萎縮(周耿等,2021)。根據(jù)行為金融學(xué)的觀點,借款人的個人信息包括兩類信息:“硬信息”與“軟信息”(Stein,2002)。“硬信息”指真實性強(qiáng)且客觀存在的個人信息,例如年齡、性別、工作等級和信用評分等;“軟信息”指借款人所在組群、社交網(wǎng)絡(luò)中的朋友數(shù)量以及消費能力和等級等信息。蘇亞和成春林(2017)對網(wǎng)絡(luò)借貸借款人違約行為影響因素研究發(fā)現(xiàn),“軟信息”同樣具有價值,網(wǎng)絡(luò)借貸平臺應(yīng)該多維度地量化借款人的信用評價。
長期以來,建立有效的個人信用評分體系并對申請者信用進(jìn)行量化評分,是個人信用風(fēng)險評價的核心內(nèi)容。學(xué)者們對個人信用風(fēng)險評價的研究主要包括兩方面:一是個人信用風(fēng)險評價指標(biāo)體系的構(gòu)建;二是個人信用風(fēng)險評價方法的選擇?,F(xiàn)有的評價指標(biāo)體系多以客戶歷史信貸交易中的指標(biāo)作為主要指標(biāo)。Emekter.et al(2015)探索了P2P 網(wǎng)絡(luò)借貸違約的影響因素,發(fā)現(xiàn)信用等級、收入債務(wù)比、FICO分值與周轉(zhuǎn)利用率對違約行為有顯著影響。然而,Garmaise&Natividad(2017)提出當(dāng)前以 FICO 分為代表的主流信用評分體系雖然包含了還款記錄、交易記錄等信息,對曾經(jīng)的負(fù)面結(jié)果過度關(guān)注,這一機(jī)制本身對借款人造成了負(fù)面影響。因為負(fù)面信息有時是由突發(fā)事件或經(jīng)濟(jì)波動產(chǎn)生的,若過度關(guān)注負(fù)面影響,將對借款人產(chǎn)生不利影響。趙大偉(2017)提出基于多渠道收集到的海量客戶數(shù)據(jù),包括年齡、職業(yè)、教育程度、職位、消費記錄、人際關(guān)系等,通過構(gòu)建模型實現(xiàn)定量分析,從而推動風(fēng)險管理創(chuàng)新,切實防范消費信貸風(fēng)險。
關(guān)于信用風(fēng)險評價方法,早期主要是采用邏輯回歸和專家判別法,回歸分析模型中的Logistic 回歸模型是迄今應(yīng)用范圍最廣的個人信用風(fēng)險評價模型(Hosmer,2000;Kordas,2002;羅方科和陳曉紅,2017;謝陳昕,2019),F(xiàn)ICO 分的核心模型是 logistic回歸算法;專家判別法常見的有3C和5C原則。目前,我國商業(yè)銀行主要采用層次分析法和模糊評價法評估借款客戶的信用風(fēng)險(周毓萍,陳官羽,2019)。隨著金融科技和人工智能的發(fā)展,將機(jī)器學(xué)習(xí)算法運用到信用風(fēng)險評價領(lǐng)域可以更加高效、準(zhǔn)確的預(yù)測信用主體的違約風(fēng)險。牛貝貝等(2019)運用LightGBM算法對借款人違約風(fēng)險預(yù)測,發(fā)現(xiàn)社交信息可以用于個人信用風(fēng)險評估。
由此可見,主流信用評分體系在傳統(tǒng)金融服務(wù)的邊緣群體中的風(fēng)險識別能力有限,主流信用評分系統(tǒng)以外的信息能降低借貸市場的信息不對稱,提高對借款人信用風(fēng)險的識別能力(王正位等,2020)。本文重點關(guān)注消費信息在個人信用風(fēng)險評價中的識別左右,由于消費信息具有發(fā)生頻率高、及時性強(qiáng)的特征,不同于傳統(tǒng)征信指標(biāo)。通過對比消費信息和傳統(tǒng)征信指標(biāo)在個人信用風(fēng)險評價中的識別作用,本文試圖回答消費信息能否用于個人信用風(fēng)險評價這一問題。
本文數(shù)據(jù)來源于某生活服務(wù)類和現(xiàn)金貸為一體的平臺,該平臺作為國內(nèi)大型生活服務(wù)類平臺,服務(wù)涉及美食、酒店、旅游、電影和團(tuán)購等項目,2019 年一季度至2020 年一季度交易用戶數(shù)4 億以上,因此選取該平臺消費信息數(shù)據(jù)進(jìn)行分析較有說服力。同時,該平臺為借款人提供類似于信用卡模式的循環(huán)授信額度,本文通過獲取用戶在該平臺中的消費信息和個人信息構(gòu)建指標(biāo)體系,對借款人在平臺的還款表現(xiàn)將客戶定義為“好”“壞”客戶,分析消費信息在個人信用評價體系中的識別能力和作用大小。對2020 年7 月至2020 年10 月授信的76 300條客戶信息中,隨機(jī)抽取20 000 條客戶信息作為樣本進(jìn)行分析研究。
本文實證設(shè)計所涉及的核心變量如下
1.還款表現(xiàn)
當(dāng)借款人未在還款期限內(nèi)還款,產(chǎn)生逾期行為,則該客戶定義為“壞客戶”(default=1);反之客戶沒有逾期行為(default=0)。
2.人行征信信息
由于借款平臺貸前審查對客戶人行征信進(jìn)行查詢,由于該平臺對客戶征信分采取脫敏保密制度,因此僅獲取到客戶征信等級,本文獲取數(shù)據(jù)僅為客戶征信分等級,若征信分>700,score 取1;反之,score 取 0。
3.消費信息
由于數(shù)據(jù)來源為某大型集消費與借款為一體的平臺,則可以獲取借款人在該平臺的消費力等級(consumption_ability)、消費頻次等級(consumption_frequency)、消費場景數(shù)量(consumption_scene)三個消費信息指標(biāo)。
4.控制變量
本文的控制變量包含兩類:借款人個人信息和借款信息。個人信息包括:年齡(age)、性別(male)、婚姻狀態(tài)(marital);借款信息包括:授信額度(amount)、利率(rate)、期限(term)。
1.消費信息對借款人信用風(fēng)險的影響
為了探討消費信息能否用于個人信用風(fēng)險評價,本文運用logistic 回歸模型利用歷史還款數(shù)據(jù)分析消費信息對借款人信用風(fēng)險的影響。因變量為客戶還款表現(xiàn)發(fā)生逾期行為(default);自變量包括征信信息(score)和消費信息(consumptionvariables);控制變量(controlvariables)包含借款人個人信息和借款信息。
為探討借款人消費信息在個人信用評價體系中的識別能力和作用,本文共構(gòu)建4 個模型:其中模型1 的自變量包含控制變量和征信信息;模型2的自變量包含控制變量和消費信息;模型3 的自變量包含控制變量、征信信息和消費信息;模型4 的自變量僅包括控制變量,具體如下:
表1 主要變量的定義
表2 描述性統(tǒng)計
其中defaulti表示借款人是否發(fā)生逾期行為,α 為系數(shù),scorei、consumptionvariablesi、controlvariablesi為解釋變量。ε 為隨機(jī)誤差項。Logistic回歸模型通過SAS14.3 實現(xiàn)。
2.個人信用風(fēng)險預(yù)測模型
LightGBM 算法是 Boosting 算法的一種,Boosting 算法對多個分類器學(xué)習(xí),通過改變訓(xùn)練樣本的權(quán)重,并通過線性組合提升分類器的性能,而且減少了計算的復(fù)雜程度,減少了計算機(jī)內(nèi)存的占用。由于LightGBM算法的優(yōu)點,被廣泛運用于多領(lǐng)域,本文運用LightGBM算法實現(xiàn)對個人信用風(fēng)險的預(yù)測。
1.消費信息對借款人信用風(fēng)險的影響
Logistic 回歸結(jié)果如表3 所示,征信信息和婚姻狀態(tài)與借款人信用風(fēng)險不相關(guān),可能是由于征信分區(qū)間劃分不夠詳細(xì)導(dǎo)致;消費能力等級與借款人信用風(fēng)險在10%的顯著水平下顯著負(fù)相關(guān),表明一年內(nèi)消費金額越少,借款人發(fā)生違約行為的可能性越大;消費頻次等級和消費場景數(shù)量與借款人信用風(fēng)險在1%顯著水平下正相關(guān),表明消費頻次和消費場景越大,借款人發(fā)生違約行為的可能性越大。在控制變量中,授信額度和性別與借款人信用風(fēng)險分別在5%和1%顯著水平下正相關(guān),表明授信額度越大,借款人發(fā)生違約行為的可能性越大,相比于男性借款人,女性借款人發(fā)生違約行為的可能性較大;借款利率和借款期限與借款人信用風(fēng)險在1%顯著水平下負(fù)相關(guān),這說明利率越小,借款人發(fā)生違約行為的可能性越大;借款期限越短,借款人發(fā)生違約行為的可能性越大。
表3 Logistic 回歸結(jié)果
2.消費信息對模型的提升作用
基于LightGBM算法構(gòu)建了兩個模型:包含消費信息和不包含消費信息的模型,以便通過兩個模型預(yù)測能力的區(qū)分,探討消費信息在個人信用風(fēng)險評價中的作用。
圖1 表示了無消費信息模型的AUC 值為0.72;圖2 表示了加入消費信息模型的AUC 值為0.90,根據(jù)AUC 值的提升可以說明,消費信息的加入顯著提升了模型的預(yù)測能力。
圖1 無消費信息模型的AUC 曲線
圖2 加入消費信息模型的AUC 曲線
本文選取某生活服務(wù)類和現(xiàn)金貸為一體的平臺借款人為研究對象,比較了消費信息對借款人信用評價提供的信息含量,發(fā)現(xiàn)采用傳統(tǒng)的信用評價方法難以準(zhǔn)確識別信用風(fēng)險,而通過加入消費信息能夠有效提升模型準(zhǔn)確性,提升了信用風(fēng)險的識別能力。具體來看,消費能力等級與借款人信用風(fēng)險在10%的顯著水平下顯著負(fù)相關(guān),表明一年內(nèi)消費金額越少,借款人發(fā)生違約行為的可能性越大,由于客戶消費能力較小,可以反映出客戶收入水平不高,因此還款能力不強(qiáng);消費頻次等級和消費場景數(shù)量與借款人信用風(fēng)險在1%顯著水平下正相關(guān),表明消費頻次和消費場景越大,借款人發(fā)生違約行為的可能性越大。研究結(jié)果表明,消費信息可以用于信用風(fēng)險評價。