国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機(jī)森林的成都地區(qū)大學(xué)生消費(fèi)信貸態(tài)度影響分析

2021-01-10 18:37:10李思雨潘莉
科學(xué)與生活 2021年26期
關(guān)鍵詞:隨機(jī)森林消費(fèi)信貸互聯(lián)網(wǎng)金融

李思雨 潘莉

摘要:為研究大學(xué)生消費(fèi)信貸現(xiàn)狀,本文選擇成都的四所高校使用信貸產(chǎn)品的在校大學(xué)生作為調(diào)查研究的對象,基于R軟件運(yùn)用隨機(jī)森林算法研究影響大學(xué)生消費(fèi)信貸態(tài)度的重要因素,并建立分類模型對新樣本進(jìn)行消費(fèi)態(tài)度預(yù)測。研究結(jié)論顯示:根據(jù)隨機(jī)森林重要性度量,影響消費(fèi)信貸態(tài)度的兩個(gè)重要因素是每月消費(fèi)信貸產(chǎn)品額度和信貸產(chǎn)品了解度。

關(guān)鍵詞:互聯(lián)網(wǎng)金融;消費(fèi)信貸;隨機(jī)森林

1研究背景

隨著互聯(lián)網(wǎng)金融的發(fā)展,互聯(lián)網(wǎng)消費(fèi)信貸開始擴(kuò)展市場至大學(xué)生市場,時(shí)常有關(guān)于大學(xué)生參與違規(guī)校園貸,并欠下巨額貸款的惡性事件。由此導(dǎo)致市場對大學(xué)生消費(fèi)信貸產(chǎn)品信任度下降,大學(xué)生消費(fèi)信貸市場發(fā)展受阻。為了保證大學(xué)生消費(fèi)信貸市場的良性發(fā)展,信貸機(jī)構(gòu)的首要目標(biāo)便是爭取和引導(dǎo)這一群體的忠誠度和消費(fèi)慣性。因此,研究大學(xué)生參與消費(fèi)信貸的情況以及大學(xué)生對待消費(fèi)信貸的態(tài)度,成為了信貸機(jī)構(gòu)塑造產(chǎn)品、維護(hù)顧客忠誠度和消費(fèi)慣性的重要議題。

2隨機(jī)森林算法介紹

隨機(jī)森林本質(zhì)屬于機(jī)器學(xué)習(xí)的一大分支,與所有的決策系統(tǒng)相比,具有更高的準(zhǔn)確性。隨機(jī)森林算法能夠降低算法復(fù)雜度,對經(jīng)過訓(xùn)練的隨機(jī)森林模型,可通過它來進(jìn)行預(yù)測,可以滿足及時(shí)業(yè)務(wù)的需求,并可有效檢測錯(cuò)誤的數(shù)據(jù)。故本文在構(gòu)建消費(fèi)信貸態(tài)度評估模型時(shí)引入了這一算法。

隨機(jī)森林應(yīng)用隨機(jī)特征選擇方法和Bootstrap抽樣,具體實(shí)現(xiàn)過程如下:

(1)指定n值,即為隨機(jī)產(chǎn)生的n個(gè)變量用在節(jié)點(diǎn)上面的二叉樹,二叉樹的變量選擇也依然符合節(jié)點(diǎn)不純度的最小原則。

(2)應(yīng)用Bootstrap自助法有放回的在原數(shù)據(jù)集中抽取m個(gè)樣本集,由此組成m棵決策樹,對于未被抽到的樣本則用來作單棵決策樹的預(yù)測。

(3)根據(jù)m個(gè)決策樹組合成的隨機(jī)森林對分類樣本進(jìn)行分類或者是預(yù)測,分類原則是投票法,得票最多的為獲勝者,預(yù)測原則是簡單平均。

3基于隨機(jī)森林的消費(fèi)信貸態(tài)度影響分析

3.1數(shù)據(jù)預(yù)處理與分類

本文選擇成都的四所高校,將使用信貸產(chǎn)品的在校大學(xué)生作為調(diào)查研究的對象,采用了分層隨機(jī)抽樣的方法,共回收有效問卷340份。

對問卷回收的定性數(shù)據(jù),全部處理為虛擬變量,從0開始賦值。14個(gè)變量:性別、學(xué)歷、專業(yè)、每月生活費(fèi)、戶籍地、使用的消費(fèi)信貸產(chǎn)品、信貸產(chǎn)品每個(gè)月的授信額度、每月消費(fèi)信貸產(chǎn)品額度、信貸產(chǎn)品逾期的月利率、信貸產(chǎn)品的一般還款期限、還款資金的主要來源、還款比例、信貸清償情況、信貸產(chǎn)品了解度,分別表示為D1-D14,消費(fèi)信貸產(chǎn)品態(tài)度表示為y。

對數(shù)據(jù)預(yù)處理完成后,運(yùn)用R編程對數(shù)據(jù)進(jìn)行分類。將270個(gè)數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)集214(80%)個(gè)和測試數(shù)據(jù)集56(20%)個(gè)。訓(xùn)練集是幫助我們進(jìn)行模型訓(xùn)練,通過訓(xùn)練集的數(shù)據(jù)讓我們確定擬合曲線的參數(shù);測試集是為了測試已經(jīng)訓(xùn)練好的模型精確度,測試集并不能保證模型的正確性,只是表示相似的數(shù)據(jù)用此模型會(huì)得出相似的結(jié)果。

3.2尋找最優(yōu)參數(shù)mytree、ntree

隨機(jī)森林有兩個(gè)重要參數(shù):mytree、ntree。

mytree是指樹節(jié)點(diǎn)預(yù)選的變量數(shù),即單棵決策樹決策的情況,每棵樹生長越茂盛,組成森林的分類性能就越好;ntree是指隨機(jī)森林所包含的決策樹數(shù)目,是隨機(jī)森林的總體規(guī)模,ntree的值越大,模型的精度越高,但ntree值達(dá)到閥值以后,精度的提高有限。

1)、確定最優(yōu)參數(shù)mytree

R建模過程將數(shù)據(jù)劃分為訓(xùn)練集和測試集,并使用訓(xùn)練集構(gòu)建隨機(jī)森林模型,尋找最佳參數(shù)mytree。

模型對于中立態(tài)度的預(yù)測分類效果最高,誤差只有0.05;對于肯定和否定的預(yù)測分類效果較差,誤差分別為0.84和1。因?yàn)閙ytree參數(shù)從1至14,模型的誤差率都不變,均為0.29,故mytree參數(shù)的值對模型的結(jié)果沒有影響,所以mytree參數(shù)值在該模型中可以不用設(shè)置。

2)、確定最優(yōu)參數(shù)ntree

運(yùn)用R編程建模尋找最佳參數(shù)ntree時(shí),首先將ntree的值設(shè)置為40000,可以發(fā)現(xiàn)當(dāng)ntree>20000時(shí),誤差(Error)不再變化,但ntree值達(dá)到閥值以后,精度的提高有限,故此處將ntree設(shè)置為120。

3.3模型分析

在隨機(jī)森林分類模型構(gòu)建完成后,通過R軟件輸出影響消費(fèi)信貸態(tài)度的重要因素。MeanDecreaseAccuracy變量值和MeanDecreaseGini變量值的加和作為得分來評估該因素的重要程度。

14個(gè)因素中對消費(fèi)信貸的影響程度有高有低,為了更清晰的了解14個(gè)因素對于消費(fèi)信貸的影響程度,使用離差標(biāo)準(zhǔn)化對原始得分進(jìn)行線性變換,并將結(jié)果擴(kuò)大10倍,使其落到[0,10]區(qū)間,D14信貸產(chǎn)品了解度的最終得分17.3是最大的,其次是D8每月消費(fèi)信貸產(chǎn)品額度,最終得分為16.3。可以看出這兩個(gè)變量是對于消費(fèi)信貸態(tài)度最重要的兩個(gè)影響因素;同時(shí)也可以看出D2學(xué)歷、D4每月生活費(fèi)、D7信貸產(chǎn)品每月授信額度、D10信貸產(chǎn)品一般還款期限、D11還款資金主要來源、D12還款比例、D13信貸清償情況是影響消費(fèi)信貸態(tài)度較為重要的因素;D3專業(yè)的最終得分最低為5.3,表明大學(xué)生的專業(yè)對他們消費(fèi)信貸產(chǎn)品態(tài)度影響最弱。

綜上所述,信貸產(chǎn)品了解度和每月消費(fèi)信貸產(chǎn)品額度是對消費(fèi)信貸態(tài)度最重要的影響因素。在隨機(jī)森林分類模型中,掌握好這兩個(gè)因素對消費(fèi)信貸態(tài)度預(yù)測至關(guān)重要。

4模型預(yù)測

通過訓(xùn)練集建立的分類模型對測試集的樣本數(shù)據(jù)進(jìn)行預(yù)測。將原始態(tài)度和預(yù)測態(tài)度整理成混淆矩陣,如表4.1所示。

5結(jié)論與建議

本文運(yùn)用隨機(jī)森林分類模型對成都地區(qū)大學(xué)生進(jìn)行消費(fèi)信貸態(tài)度分析,研究結(jié)果發(fā)現(xiàn),每月消費(fèi)信貸產(chǎn)品額度和信貸產(chǎn)品了解度是對于信貸產(chǎn)品消費(fèi)態(tài)度很重要的兩個(gè)影響因素。根據(jù)隨機(jī)森林篩選出的對消費(fèi)信貸態(tài)度的重要影響因素,可建立隨機(jī)森林分類模型,幫助信貸機(jī)構(gòu)預(yù)測大學(xué)生對待消費(fèi)信貸的態(tài)度,從而推出更具針對性、更具吸引力的消費(fèi)信貸產(chǎn)品。

參考文獻(xiàn)

[1]徐瑩.大學(xué)生校園網(wǎng)貸問題的分析與探究——基于重慶部分高校大學(xué)生網(wǎng)絡(luò)消費(fèi)及網(wǎng)絡(luò)信貸現(xiàn)狀調(diào)查問卷[J].現(xiàn)代商貿(mào)工業(yè),2021,04.057.

[2]劉瀏.基于金融素養(yǎng)理論的大學(xué)生消費(fèi)信貸風(fēng)險(xiǎn)研究[]].佛山科學(xué)技術(shù)學(xué)院學(xué)報(bào):社會(huì)科學(xué)版.2020,6:54-63.

[3]Mendes Da Silva.Credit card risk behavior on college campuses: evidence from Brazil[J]. 2012-09.9.3: 351-373.

作者簡介

1. 李思雨,成都信息工程大學(xué)統(tǒng)計(jì)學(xué)院學(xué)生

2. 潘莉,成都信息工程大學(xué)統(tǒng)計(jì)學(xué)院講師,碩士;研究方向:金融數(shù)量分析。

猜你喜歡
隨機(jī)森林消費(fèi)信貸互聯(lián)網(wǎng)金融
后疫情時(shí)代個(gè)人消費(fèi)信貸對消費(fèi)結(jié)構(gòu)的影響研究
消費(fèi)信貸對江蘇省經(jīng)濟(jì)增長的影響研究
——基于期限結(jié)構(gòu)視角
消費(fèi)信貸對我國經(jīng)濟(jì)增長的影響研究
隨機(jī)森林在棉蚜蟲害等級預(yù)測中的應(yīng)用
基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
軟件(2016年7期)2017-02-07 15:54:01
拱壩變形監(jiān)測預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
基于隨機(jī)森林算法的飛機(jī)發(fā)動(dòng)機(jī)故障診斷方法的研究
互聯(lián)網(wǎng)金融的風(fēng)險(xiǎn)分析與管理
互聯(lián)網(wǎng)金融理財(cái)產(chǎn)品分析
互聯(lián)網(wǎng)金融對傳統(tǒng)金融的影響
开远市| 大城县| 枣庄市| 三明市| 射阳县| 邵阳县| 同江市| 洛南县| 芜湖市| 特克斯县| 日土县| 徐汇区| 镇远县| 布尔津县| 抚顺县| 咸宁市| 两当县| 教育| 五家渠市| 武强县| 碌曲县| 江华| 太保市| 八宿县| 仁怀市| 纳雍县| 荆门市| 多伦县| 高尔夫| 南溪县| 淅川县| 司法| 新泰市| 东至县| 庆城县| 原阳县| 额敏县| 北票市| 郸城县| 扶绥县| 鸡泽县|