李運(yùn)蒙,桂繞根,石安安
(五邑大學(xué) 經(jīng)濟(jì)管理學(xué)院,廣東 江門 529020)
基于支持向量機(jī)的助學(xué)貸款信用風(fēng)險(xiǎn)預(yù)警研究
李運(yùn)蒙,桂繞根,石安安
(五邑大學(xué) 經(jīng)濟(jì)管理學(xué)院,廣東 江門 529020)
針對(duì)助學(xué)貸款額度小、管理過程繁瑣、違約率高的問題,提出了用基于支持向量機(jī)的助學(xué)貸款信用風(fēng)險(xiǎn)預(yù)警系統(tǒng)來(lái)有效降低關(guān)注范圍、提高貸后管理效率的方法. 在分析助學(xué)貸款違約影響因素和相關(guān)預(yù)警模型特點(diǎn)的基礎(chǔ)上,建立了支持向量機(jī)預(yù)警模型;通過實(shí)際數(shù)據(jù)測(cè)試,模型在違約和守約分類預(yù)測(cè)方面有較高的準(zhǔn)確率,為銀行調(diào)整貸后管理策略提供了依據(jù).
助學(xué)貸款;支持向量機(jī);核函數(shù);信用風(fēng)險(xiǎn)
國(guó)家助學(xué)貸款是由政府主導(dǎo)、財(cái)政貼息,銀行、教育行政部門與高校共同操作的專門幫助高校貧困家庭學(xué)生的銀行貸款,是政府運(yùn)用金融手段幫助貧困學(xué)生順利完成學(xué)業(yè)而采取的重要措施,于1999年開始實(shí)施. 由于機(jī)制不健全和信用體系不完善,助學(xué)貸款一直有較高的違約率. 從銀行方面考慮,迫切需要提高對(duì)助學(xué)貸款的管理水平,探索能夠提高貸后管理效率的切實(shí)可行的方法.
通過預(yù)警的方法來(lái)提高管理效率,是目前各種風(fēng)險(xiǎn)管理十分重視的方法. 在助學(xué)貸款方面,一些學(xué)者通過研究,構(gòu)建出了國(guó)家助學(xué)貸款風(fēng)險(xiǎn)預(yù)警指標(biāo)體系[1-4],并對(duì)助學(xué)貸款的管理提出了很多有意義的建議. 但多數(shù)研究集中在理論分析等定性的研究方面,定量研究以及構(gòu)建高精度預(yù)警模型方面有待深入. 國(guó)際上通常將商業(yè)銀行貸款風(fēng)險(xiǎn)預(yù)警問題看作分類問題[5-6],即通過貸款對(duì)象的一些相關(guān)指標(biāo)的數(shù)據(jù),運(yùn)用預(yù)警模型進(jìn)行估算和判斷,將結(jié)果分為正常貸款和違約貸款兩類;或設(shè)置不同警戒限,將結(jié)果分為多類. 如Logistic、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法,在銀行貸款風(fēng)險(xiǎn)預(yù)警方面都有良好的應(yīng)用效果[7-8]. 考慮到助學(xué)貸款問題的復(fù)雜性,以及預(yù)測(cè)模型的精度要求,對(duì)其預(yù)警應(yīng)著重考慮非線性模型. 支持向量機(jī)(support vector machine,SVM)模型不過分依賴樣本數(shù)量,能通過有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中[9-10],是適合助學(xué)貸款違約行為等小樣本問題分析與建模的首選工具. 本文采用MATLAB7.0中的SVM工具箱LIBSVM構(gòu)建了廣發(fā)銀行江門分行助學(xué)貸款信用風(fēng)險(xiǎn)預(yù)警系統(tǒng).
1.1 支持向量機(jī)常用核函數(shù)介紹
SVM分類器通過建立一個(gè)超平面作為決策曲面,使得不同類別樣本之間的隔離邊緣最大化,以達(dá)到對(duì)空間進(jìn)行劃分,最終實(shí)現(xiàn)分類的目的. 這基于樣本集線性可分的前提,而實(shí)際應(yīng)用中,多數(shù)樣本集在原始空間內(nèi)的分類函數(shù)不是線性的,通常需要采用非線性映射的方法,將原始空間的樣本集映射到高維特征空間使其可分,但又會(huì)因此產(chǎn)生維數(shù)災(zāi)難或無(wú)法計(jì)算的問題.
核函數(shù)能很好地解決上述問題,既能使樣本集在特征空間可分,又不增加計(jì)算的復(fù)雜度,因此核函數(shù)的選擇是決定SVM分類性能優(yōu)劣的關(guān)鍵問題. 用于SVM的核函數(shù)一般有以下幾種:
1.2 指標(biāo)數(shù)據(jù)預(yù)處理
助學(xué)貸款是小額貸款但其需要單獨(dú)管理且過程十分復(fù)雜,如果能夠很好地進(jìn)行預(yù)警,就能夠縮小關(guān)注范圍、節(jié)省管理成本. 筆者在總結(jié)了國(guó)內(nèi)助學(xué)貸款預(yù)警研究成果的基礎(chǔ)上,與廣發(fā)銀行專家進(jìn)行多次討論,列出的國(guó)家助學(xué)貸款指標(biāo)體系[4]主要包括:入學(xué)前指標(biāo)、在校期間指標(biāo)、畢業(yè)后指標(biāo)和環(huán)境指標(biāo)等內(nèi)容. 采用一系列方法對(duì)這些指標(biāo)進(jìn)行篩選,最終確定10項(xiàng)指標(biāo)作為助學(xué)貸款違約預(yù)警判別指標(biāo),為了滿足模型學(xué)習(xí)、預(yù)測(cè)的需要,將收集到的學(xué)生在校表現(xiàn)等數(shù)據(jù)進(jìn)行量化,并將數(shù)據(jù)取值進(jìn)行離散化,具體處理如下:
1)在校是否獲獎(jiǎng)學(xué)金,0表示未獲得,1表示獲得;
2)綜合測(cè)評(píng)成績(jī)的班排名,取值0.01~0.99;
3)性別,0表示女,1表示男;
4)在校是否有還款行為,0表示無(wú),1表示有;
5~7)畢業(yè)后1~3年內(nèi)的還貸比,取值0.00~1.00;
8)分別取0.2、0.4、0.8、1.0代表貸款生畢業(yè)后月收入1500以下、1500~3000、3000~4500、4500以上;
9)分別取0.2、0.4、0.8、1.0表示健康狀況差、一般、良、優(yōu);
10)是否就業(yè),0表示未就業(yè),1表示就業(yè).
1.3 模型建立步驟
采用MATLAB7.0中的SVM工具箱LIBSVM對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練和檢驗(yàn). LIBSVM是臺(tái)灣大學(xué)林智仁副教授等開發(fā)設(shè)計(jì)的具有SVM模式識(shí)別與回歸、交互檢驗(yàn)(Cross Validation)等功能的軟件包. 本文在使用這一軟件包時(shí),嘗試對(duì)一般建模步驟進(jìn)行改進(jìn),采用以下改進(jìn)的步驟和訓(xùn)練要求進(jìn)行建模和預(yù)測(cè):
1)準(zhǔn)備學(xué)習(xí)用指標(biāo)數(shù)據(jù)集;
2)選用相應(yīng)核函數(shù)和其他參數(shù),初次選線性核函數(shù);
3)進(jìn)行訓(xùn)練并利用交叉驗(yàn)證得到最佳參數(shù),訓(xùn)練精度大于99%,獲取支持向量機(jī)模型;
4)利用獲取的模型進(jìn)行測(cè)試與預(yù)測(cè);
5)當(dāng)預(yù)測(cè)精度低于90%時(shí),采用以下方式進(jìn)行改進(jìn):a.更換核函數(shù),分別選取RBF核函數(shù)、多項(xiàng)式核函數(shù)和Sigmoid核函數(shù)再試;b.分析樣本數(shù)據(jù)集,剔除不合理樣本,重復(fù)以上過程;c.重新按新標(biāo)準(zhǔn)離散化樣本.
2.1 數(shù)據(jù)準(zhǔn)備
從廣發(fā)銀行江門分行提取近8年學(xué)生貸款情況數(shù)據(jù)6000余條,通過篩選,違約樣本只有521個(gè). 如果隨機(jī)在其中選取樣本,將使模型在多數(shù)的守約樣本中學(xué)習(xí),不能體現(xiàn)違約樣本的特點(diǎn),因此在學(xué)習(xí)中采用:11的方式選取違約與守約樣本,剔除數(shù)據(jù)殘缺的樣本,最終選取出300個(gè)較合理的樣本.
在選取的300個(gè)樣本中,其中200個(gè)作為訓(xùn)練樣本,并采用交叉檢驗(yàn)進(jìn)行學(xué)習(xí)檢測(cè),剩下100個(gè)作為預(yù)測(cè)樣本.
2.2 模型參數(shù)及實(shí)驗(yàn)結(jié)果
200個(gè)樣本屬于小樣本,但是經(jīng)過離散化樣本指標(biāo),使得樣本空間縮小,加上使用支持向量機(jī)模型,得到了較滿意的結(jié)果. 不同核函數(shù)和參數(shù)下的預(yù)測(cè)結(jié)果如表1所示.
從表1預(yù)測(cè)結(jié)果可以看到,徑向基核函數(shù)的分類準(zhǔn)確率較高,是適合本文模型的核函數(shù). 目前,關(guān)于支持向量機(jī)模型參數(shù)的選取尚無(wú)有確定的結(jié)論[11],一般采用逐個(gè)測(cè)試的方法確定,當(dāng)某種參數(shù)的選取能取得較好結(jié)果時(shí),有理由相信實(shí)際問題與該非線性模型有較好的相似性.
表1 各種核函數(shù)的運(yùn)行結(jié)果
運(yùn)用支持向量機(jī)模型,在不同核函數(shù)條件下,對(duì)學(xué)生貸款行為進(jìn)行預(yù)測(cè),預(yù)測(cè)準(zhǔn)確率在83%以上,尤其是采用徑向基核函數(shù),準(zhǔn)確率可以達(dá)到90%,據(jù)此可以得出以下結(jié)論:
1)現(xiàn)有歷史數(shù)據(jù)能夠構(gòu)建出有較高精度的預(yù)測(cè)模型,可以作為貸后管理的參考,據(jù)此銀行方面可以調(diào)整管理策略、縮小關(guān)注范圍,集中精力應(yīng)對(duì)有可能發(fā)生違約的用戶,以實(shí)現(xiàn)降低管理成本的目的.
2)在小樣本建模的過程中,對(duì)樣本數(shù)據(jù)指標(biāo)進(jìn)行合理的離散化,有助于模型的訓(xùn)練學(xué)習(xí),可以快速得到穩(wěn)定的模型.
3)當(dāng)學(xué)習(xí)精度達(dá)不到要求時(shí),可從模型選取、數(shù)據(jù)指標(biāo)選取、數(shù)據(jù)預(yù)處理方式等多方面進(jìn)行調(diào)整,以取得好的效果.
采用違約與守約:11樣本進(jìn)行學(xué)習(xí),能夠使模型折中合理且準(zhǔn)確. 守約判為違約的錯(cuò)誤對(duì)銀行只是增加了管理成本,而違約判為守約則會(huì)造成直接損失. 因此根據(jù)銀行方面的要求,模型在每類錯(cuò)誤上的概率仍需細(xì)分繼續(xù)研究.
[1] 陳媛,龔曦. 國(guó)家助學(xué)貸款風(fēng)險(xiǎn)防范對(duì)策研究[J]. 山西財(cái)經(jīng)大學(xué)學(xué)報(bào),2010, 32(2): 81-82.
[2] 趙振宇,張偉,陳紅霞. 基于模糊德爾菲法的國(guó)家助學(xué)貸款信用風(fēng)險(xiǎn)評(píng)估研究[J]. 黑龍江高教研究,2011(1):58-60.
[3] 鄭天虹. 粵助學(xué)貸款:違約率6年升高10多倍[N]. 新華每日電訊,2009-12-11.
[4] 李運(yùn)蒙,桂繞根,涂英. 國(guó)家助學(xué)貸款信用風(fēng)險(xiǎn)預(yù)警指標(biāo)體系的構(gòu)建與應(yīng)用[J]. 內(nèi)蒙古大學(xué)學(xué)報(bào):自然科學(xué)版,2012, 43(6): 579-585.
[5] DAN M C, MARK G R. A comparative analysis of current credit risk models [J]. Journal of Banking and Finance, 2000, 24(1): 59-117.
[6] ATIYA A F. Bankruptcy prediction for credit risk using neural networks: a survey and new results [J]. IEEE Transactions on Neural Networks, 2001. 12(4): 929-935.
[7] 石慶焱,靳云匯. 多種個(gè)人信用評(píng)分模型在中國(guó)應(yīng)用的比較研究[J]. 統(tǒng)計(jì)研究,2004(6): 43-47.
[8] 姚瀟,余樂安. 模糊近似支持向量機(jī)模型及其在信用風(fēng)險(xiǎn)評(píng)估中的應(yīng)用[J]. 系統(tǒng)工程理論與實(shí)踐,2012, 32(3): 549-554.
[9] CHAPELLE O, VAPNIK V, BOUSQUET O. Choosing multiple parameters for support vector machines [J]. Machine Learning, 2002, 46(1): 131-159.
[10] 施燕杰. 基于支持向量機(jī)(SVM)的股市預(yù)測(cè)方法[J]. 統(tǒng)計(jì)與決策,2005(4): 123-125.
[11] 劉向東,駱斌,陳兆乾. 支持向量機(jī)最優(yōu)模型選擇的研究[J]. 計(jì)算機(jī)研究與發(fā)展,2005, 42(4): 576-581.
[責(zé)任編輯:熊玉濤]
A Study of Early Warning on Credit Risks of Student Loans Based on the Support Vector Machine (SVM)
LI Yun-meng, GUI Rao-gen, SHI An-an
(School of Economics and Management, Wuyi University, Jiangmen 529020, China)
Considering the small amounts, the tedious management process and the high default rate of student loans, this paper proposes a student loans credit risk warning system based on the support vector machine to effectively reduce the scope of attention for loans and improve their management efficiency. On the basis of an analysis of the factors contributing to defaulting and the characteristics of an early warning model, an early warning model based on the support vector machine (SVM) is built. Actual data tests show that the model has a high accuracy rate in the prediction of contract observance and breach and can provide a basis for banks to adjust loan management strategies.
student loans; SVM; kernel function; credit risks
O211.61;F822.1
A
1006-7302(2014)01-0050-04
2013-10-11
廣東省哲學(xué)社會(huì)科學(xué)規(guī)劃項(xiàng)目(GD11XGL20)
李運(yùn)蒙(1964—),男,山東鄆城人,副教授,碩士,主要從事金融數(shù)據(jù)分析方面的研究.