朱思霖
摘? 要: 為了提升個(gè)人消費(fèi)信貸產(chǎn)品的申請(qǐng)意愿,對(duì)影響消費(fèi)信貸需求的因素進(jìn)行了分析。通過(guò)對(duì)消費(fèi)信貸數(shù)據(jù)的描述性分析、探索性分析,來(lái)挖掘貸款申請(qǐng)條件與申請(qǐng)人數(shù)之間的關(guān)聯(lián),得出城市、還款方式、放款時(shí)間、審批時(shí)間、擔(dān)保方式、年齡限制、身份限制等7個(gè)因素對(duì)消費(fèi)貸款需求的影響作用。對(duì)消費(fèi)貸款需求問(wèn)題進(jìn)行總結(jié),以期通過(guò)挖掘個(gè)人消費(fèi)貸款數(shù)據(jù)背后的秘密,為消費(fèi)信貸產(chǎn)品的設(shè)計(jì)提供有針對(duì)性地建議。
關(guān)鍵詞: 申請(qǐng)意愿; 消費(fèi)信貸需求; 因素; 影響; 建議
中圖分類(lèi)號(hào):TP391.1? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1006-8228(2020)12-14-04
Abstract: In order to increase the willingness to apply for personal consumer credit products, the factors that affect consumer credit demand are analyzed. Through descriptive analysis and exploratory analysis of consumer credit data, the relationship between loan application conditions and the number of applicants is explored, and the 7 factors affecting the consumer loan demand are obtained, i.e. the city, repayment method, loan time, approval time, guarantee method, age limit, identity limit, etc. The issues of demand for consumer loans are summarized, hoping to provide targeted suggestions for the design of consumer credit products by mining the secrets behind personal consumer loan data.
Key words: the willingness to apply; consumer credit demand; factors; affect; suggestion
0 引言
消費(fèi)信貸業(yè)務(wù)是商業(yè)銀行最重要的資產(chǎn)業(yè)務(wù),同時(shí)也是商業(yè)銀行的主要贏利手段。該信貸方式主要是通過(guò)放款收回本金和利息,扣除成本后獲得利潤(rùn)。據(jù)全球宏觀經(jīng)濟(jì)數(shù)據(jù)平臺(tái)CEIC的數(shù)據(jù)顯示,中國(guó)的國(guó)內(nèi)信貸在2020年1月1日已達(dá)31,964,194.2百萬(wàn)美元[1],約合人民幣223萬(wàn)億元。如此龐大的信貸規(guī)模,不但說(shuō)明了中國(guó)金融市場(chǎng)的快速持續(xù)增長(zhǎng),同時(shí)也反應(yīng)了民眾消費(fèi)意識(shí)的覺(jué)醒。
近年來(lái),隨著互聯(lián)網(wǎng)浪潮席卷全球,互聯(lián)網(wǎng)金融正以超出人們預(yù)期的速度發(fā)展,貸款這件事也從線(xiàn)下走到了線(xiàn)上。從現(xiàn)象上來(lái)說(shuō),這不僅僅是方式上的轉(zhuǎn)變,更是觀念上的、行為上的重大轉(zhuǎn)變,由此帶來(lái)的影響值得學(xué)者從多個(gè)方面進(jìn)行研究。文獻(xiàn)[2-6]分別從消費(fèi)需求方面、政策研究方面、大學(xué)生決策行為方面、個(gè)人信用風(fēng)險(xiǎn)方面給出了相關(guān)的對(duì)策建議。眾多學(xué)者對(duì)消費(fèi)信貸的研究加速了信用經(jīng)濟(jì)時(shí)代的來(lái)臨,然而我國(guó)尚未建立完善的個(gè)人信用機(jī)制,關(guān)于消費(fèi)信貸這項(xiàng)業(yè)務(wù)還有許多新的課題尚待研究。本文以狗熊會(huì)數(shù)據(jù)科學(xué)精品案例庫(kù)歐亞聯(lián)合研究組提供的消費(fèi)貸款數(shù)據(jù)[7]為例,通過(guò)描述性分析方法、探索性分析方法,試圖分析影響消費(fèi)貸款申請(qǐng)人數(shù)的因素,進(jìn)而挖掘個(gè)人消費(fèi)貸款數(shù)據(jù)背后的秘密,從而為消費(fèi)信貸產(chǎn)品的設(shè)計(jì)提供有針對(duì)性地建議。
1 數(shù)據(jù)說(shuō)明
本文所用數(shù)據(jù)共包含1046條消費(fèi)貸款信息,每條數(shù)據(jù)包含公司名稱(chēng)、申請(qǐng)人數(shù)、城市、貸款金額、還款期限、月供、還款總費(fèi)用、擔(dān)保方式、申請(qǐng)條件等15個(gè)變量,各個(gè)變量詳細(xì)情況見(jiàn)表1。為了分析影響消費(fèi)貸款申請(qǐng)人數(shù)的因素,本文以申請(qǐng)人數(shù)為因變量,各個(gè)維度的影響因素為自變量。
在該消費(fèi)貸款數(shù)據(jù)中,貸款的申請(qǐng)人數(shù)是我們關(guān)注的焦點(diǎn)所在。其中,申請(qǐng)人數(shù)的最小值為0人次,最大值為62898人次,其平均值為1208人次,中位數(shù)僅為44人。而申請(qǐng)人數(shù)為0的有395項(xiàng),占比37.76%,剩余651項(xiàng)申請(qǐng)人數(shù)均大于0。由于數(shù)據(jù)間差異較大,分布較為離散,在后文的分析中,將以貸款產(chǎn)品是否有人申請(qǐng)為因變量,對(duì)申請(qǐng)人數(shù)按“0”——無(wú)人申請(qǐng)、“1”——有人申請(qǐng)進(jìn)行建模分析。
2 描述性分析
2.1 貸款內(nèi)容因素
還款方式方面,我們繪制出不同還款方式的消費(fèi)貸款申請(qǐng)人數(shù)對(duì)比的箱線(xiàn)圖,如圖1所示。從圖1中可以看到,分期還款的方式最受歡迎,申請(qǐng)人數(shù)存在最大值為62898,平均申請(qǐng)人數(shù)也最大,平均申請(qǐng)人數(shù)為1267人次;到期還款方式申請(qǐng)的人數(shù)較少,且平均值較低,平均申請(qǐng)人數(shù)為241人次;而隨借隨還類(lèi)型的產(chǎn)品則幾乎是無(wú)人問(wèn)津,平均申請(qǐng)人數(shù)也最低,平均申請(qǐng)人數(shù)為47人次。
2.2 貸款條件因素
擔(dān)保方式方面,包含了信用貸、抵押貸、自由選、擔(dān)保貸四種情況。在圖2中,我們繪制出不同的擔(dān)保方式的產(chǎn)品最高申請(qǐng)人數(shù),以及平均申請(qǐng)人數(shù)的柱狀圖。其顯示信用貸最受消費(fèi)者歡迎,其次是抵押貸與自由選這兩種擔(dān)保方式也有較好的市場(chǎng)反應(yīng),而擔(dān)保貸則在消費(fèi)市場(chǎng)遇冷,無(wú)論是最高申請(qǐng)人數(shù)還是平均申請(qǐng)人數(shù)方面,較前幾種擔(dān)保方式都相差甚遠(yuǎn)。
2.3 貸款地域因素
歸屬城市方面,包含了北京、上海、廣州、南京等12個(gè)城市。在圖3中,我們繪制了不同城市的產(chǎn)品平均申請(qǐng)人數(shù)的柱狀圖,其顯示消費(fèi)金融在北京、重慶、深圳、上海、成都等城市更加火爆,而在南京、青島、濟(jì)南等城市則相對(duì)冷清。
2.4 申請(qǐng)條件的關(guān)鍵詞分析
對(duì)不同消費(fèi)貸款產(chǎn)品的申請(qǐng)條件進(jìn)行提取匯總,并作為文本分析的語(yǔ)料。使用Python中jieba庫(kù)的逆文檔頻率(Term Frequency-Inverse Document Frequency,TF-IDF)算法和TextRank算法對(duì)申請(qǐng)條件進(jìn)行關(guān)鍵詞提取,并取排序前10的關(guān)鍵詞,兩種算法的關(guān)鍵詞提取結(jié)果如圖4所示。比較兩種提取結(jié)果,我們發(fā)現(xiàn),兩種算法的重疊關(guān)鍵詞占比接近70%。相同的關(guān)鍵詞部分突出地表達(dá)了申請(qǐng)條件看中“銀行流水”、“記錄信用”、“身份證明”、“所屬單位”,不同的關(guān)鍵詞部分,TextRank算法顯示的結(jié)果更注重是否是“公務(wù)員”、“所屬單位或”是否是“銀行員工”,TF-IDF算法顯示的結(jié)果更注重是否有“公積金”、“名下財(cái)產(chǎn)”以及申請(qǐng)人的年齡。
3 建模分析
3.1 Logistic回歸模型
本部分研究的目的是驗(yàn)證各個(gè)維度因素是否會(huì)影響產(chǎn)生貸款申請(qǐng)的行為發(fā)生,由于是否申請(qǐng)消費(fèi)貸款是一個(gè)二元離散變量,在因變量為非連續(xù)型二分變量的時(shí)候,適合選擇Logistic回歸模型[8]。具體的研究模型可參照公式⑴:
其中,[p]表示申請(qǐng)消費(fèi)貸款發(fā)生的概率,[1-p]表示該行為不發(fā)生的概率。[β0]為常數(shù)項(xiàng),[Xi]為解釋變量,分別對(duì)應(yīng)還款方式、擔(dān)保方式、審批時(shí)間、放款時(shí)間、期限最低范圍、期限最高范圍、月管理費(fèi)、還款總費(fèi)用、月供、貸款總金額、期限等11個(gè)自變量,另外,[βi]代表解釋變量的回歸系數(shù),其中[i=0,1,…,11],[ε]為隨機(jī)誤差項(xiàng)。
3.2 逐步回歸
為了精簡(jiǎn)模型,排除無(wú)效變量的干擾,使用赤池信息準(zhǔn)則(Akaike Information Criterion,AIC)結(jié)合逐步回歸選出最優(yōu)變量子集[9]。AIC準(zhǔn)則的數(shù)學(xué)表達(dá)可參照公式⑵,其中,[q]是進(jìn)入模型當(dāng)中的自變量個(gè)數(shù),[n]為樣本量,[SSE]是殘差平方和,在樣本量[n]固定的情況下,[q]越小,[SSE]越小,[AIC]越小。而[q]越小代表著模型越簡(jiǎn)潔,[SSE]越小代表著模型越精準(zhǔn),即擬合度越好,綜上所述,[AIC]越小,即模型就越簡(jiǎn)潔和精準(zhǔn)。
通過(guò)AIC準(zhǔn)則結(jié)合向前逐步回歸方法,篩選出5個(gè)自變量進(jìn)入邏輯回歸模型,這5個(gè)自變量分別為擔(dān)保方式、審批時(shí)間、還款方式、放款時(shí)間、所在城市。
3.3 文本挖掘
通過(guò)前文中對(duì)申請(qǐng)條件的關(guān)鍵詞分析,我們猜測(cè)申請(qǐng)條件可能會(huì)對(duì)消費(fèi)者的申請(qǐng)意愿造成影響。故此本文對(duì)申請(qǐng)條件進(jìn)行挖掘并引入年齡限制、身份限制作為啞變量建立回歸模型,建模結(jié)果如表2所示。通過(guò)讀表可以看出,引入新創(chuàng)造的貸款條件變量建立的回歸模型具有一定的解釋力(P值<0.001),即至少有一個(gè)自變量對(duì)因變量有顯著影響。另外,不論是[R2]還是調(diào)整[R2]均達(dá)到0.8以上,即該情況下建立的模型擁有的變動(dòng)程度能模擬80%的總變動(dòng)程度,說(shuō)明模型的擬合優(yōu)度較好。
4 總結(jié)與展望
本文通過(guò)描述性分析方法、回歸建模方法,分析并挖掘了影響消費(fèi)貸款申請(qǐng)人數(shù)的關(guān)鍵因素,并得到如下結(jié)論:影響消費(fèi)者是否申請(qǐng)消費(fèi)貸款的關(guān)鍵特征因素包括城市、還款方式、放款時(shí)間、審批時(shí)間、擔(dān)保方式、年齡限制、身份限制等7個(gè)因素。公司在進(jìn)行消費(fèi)信貸產(chǎn)品方面的設(shè)計(jì)時(shí),可有針對(duì)性地進(jìn)行設(shè)計(jì)。如在擔(dān)保方式及還款方式方面,消費(fèi)者更喜歡信用貸、分期還款的方式;對(duì)于審批時(shí)間,1~3個(gè)月為宜;對(duì)于放款時(shí)間,0~8天內(nèi)放款的產(chǎn)品消費(fèi)者更愛(ài)申請(qǐng);對(duì)于年齡限制,有明確年齡要求的產(chǎn)品,消費(fèi)者申請(qǐng)的意愿越高;對(duì)于身份限制方面,要求提供證明、證件、工作合同、流水、住址等信息的,消費(fèi)者申請(qǐng)的意愿較低,推測(cè)該類(lèi)申請(qǐng)條件較硬性且隱私涉及更多,不易受到消費(fèi)者喜愛(ài)。后續(xù)的研究,將嘗試引入其他機(jī)器學(xué)習(xí)相關(guān)算法實(shí)現(xiàn)具體申請(qǐng)人數(shù)的預(yù)測(cè),為消費(fèi)信貸產(chǎn)品的設(shè)計(jì)提供更有針對(duì)性地建議。
參考文獻(xiàn)(References):
[1] CEIC.中國(guó)——國(guó)內(nèi)信貸[EB/OL].[2020.03]. https://www.ceicdata.com/
[2] 劉鳳娟,寧云才.物聯(lián)網(wǎng)環(huán)境下基于年齡差異的消費(fèi)金融需求異同分析[J].財(cái)會(huì)月刊,2019.12:162-169
[3] 賈進(jìn).消費(fèi)信貸資產(chǎn)證券化的發(fā)展困境、國(guó)際經(jīng)驗(yàn)與未來(lái)發(fā)展建議[J].政策研究,2019.6:3-12
[4] 彭小輝,王靜怡,王坤沂.博弈視角下大學(xué)生互聯(lián)網(wǎng)消費(fèi)信貸決策行為研究[J].審計(jì)與經(jīng)濟(jì)研究,2020.1:120-127
[5] 朱振濤,孫敏,沈建紅.信用卡逾期行為的影響因素及行為預(yù)測(cè)研究[J].南京工程學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2019.19(3):46-53
[6] 王正位,周從意,廖理,張偉強(qiáng).消費(fèi)行為在個(gè)人信用風(fēng)險(xiǎn)識(shí)別中的信息含量研究[J].經(jīng)濟(jì)研究,2020.1:149-163
[7] 狗熊會(huì).消費(fèi)貸款[EB/OL].[2020.03].http://teach.xiong99.com.cn/
[8] 王濟(jì)川,郭志剛.Logistic回歸模型——方法與應(yīng)用[M].高等教育出版社,2001.
[9] Jonathan D.Cryer,Kung-Sik Chan.潘紅宇等譯.時(shí)間序列分析及應(yīng)用(第二版)[M].機(jī)械工業(yè)出版社,2011.