王夢(mèng)菊 胡曉旭
摘要:組合數(shù)據(jù)挖掘技術(shù)正在成為研究的一個(gè)熱點(diǎn)。組合方法是信用評(píng)估的一種新趨勢(shì),目標(biāo)是提高模型的分類準(zhǔn)確性。因此,介紹了信用評(píng)估的概念、信用評(píng)估指標(biāo)體系建立的原則,以及常用信用評(píng)估方法的比較。最后,對(duì)目前信用評(píng)估模型中的組合方法進(jìn)行了比較分析,為以何種角度構(gòu)建組合信用評(píng)估模型提供了思路。
關(guān)鍵詞:信用評(píng)估;數(shù)據(jù)挖掘;組合算法
中圖分類:TP311.13文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1673-291X(2012)23-0129-02
一、信用評(píng)估的定義
信用評(píng)估是統(tǒng)計(jì)學(xué)和運(yùn)籌學(xué)在金融和銀行業(yè)中最成功的應(yīng)用之一,也是最早開(kāi)發(fā)的金融風(fēng)險(xiǎn)管理工具之一。信用評(píng)估通常定義為一種用于預(yù)測(cè)貸款申請(qǐng)者或現(xiàn)存借款人將發(fā)生違約或拖欠概率的統(tǒng)計(jì)或定量方法,廣泛應(yīng)用于消費(fèi)信貸到商業(yè)貸款的各類信用分析中。信用評(píng)估的本質(zhì)是模式識(shí)別——將企業(yè)或個(gè)體消費(fèi)者按照其歷史資料和相應(yīng)的數(shù)據(jù)劃分為履約(即“好”客戶)和違約(即“壞”客戶)兩類。各種信用評(píng)估方法的思路在本質(zhì)上是相同的,即運(yùn)用數(shù)據(jù)挖掘技術(shù)、統(tǒng)計(jì)學(xué)和運(yùn)籌學(xué)等方法,通過(guò)對(duì)消費(fèi)者基本特征、信用記錄、行為記錄等大量數(shù)據(jù)進(jìn)行系統(tǒng)的分析,挖掘數(shù)據(jù)中蘊(yùn)含的行為模式、信用特征,獲取歷史信息和未來(lái)信用表現(xiàn)之間的關(guān)系,發(fā)展出預(yù)測(cè)性的模型,來(lái)綜合評(píng)估消費(fèi)者未來(lái)的某種信用表現(xiàn)即事先確認(rèn)某些決定違約(與償還款項(xiàng)相反的行為)概率的關(guān)鍵因素,然后將它們加以聯(lián)合考慮或加權(quán)計(jì)算出一個(gè)數(shù)量化的分?jǐn)?shù)。根據(jù)分?jǐn)?shù)或一個(gè)關(guān)鍵點(diǎn)把潛在的客戶分成“好”客戶與“壞”客戶兩組,用于是否貸款的決策審批。信用評(píng)估成為是否發(fā)放貸款、貸款額度、產(chǎn)品定價(jià)、以及提高放貸機(jī)構(gòu)贏利性和操作戰(zhàn)略的決策支持工具。
二、信用評(píng)估指標(biāo)體系建立的原則
評(píng)估指標(biāo)體系的選擇己經(jīng)成為信用評(píng)級(jí)工作的首要問(wèn)題,它關(guān)系著評(píng)估工作的成敗。尋找一種較為科學(xué)的指標(biāo)選取的方法是信用評(píng)估研究和探索的重點(diǎn)之一。為使指標(biāo)的選取更為客觀、可信,待選指標(biāo)體系的確定必須在正確的指導(dǎo)原則下進(jìn)行,本文歸納如下。
1.準(zhǔn)確性原則。指標(biāo)的選擇、數(shù)據(jù)的選取、計(jì)算必須以公認(rèn)的科學(xué)理論為依據(jù)。
2.全面性原則.。指標(biāo)體系要全面反映貸款申請(qǐng)人的各方面特征,在考核過(guò)去表現(xiàn)的同時(shí),更要預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì),既要考慮評(píng)估對(duì)象的情況,還要研究社會(huì)經(jīng)濟(jì)環(huán)境及其發(fā)展的影響。信用風(fēng)險(xiǎn)的評(píng)估要覆蓋貸款業(yè)務(wù)的每個(gè)行業(yè)及行業(yè)內(nèi)的每一筆貸款業(yè)務(wù)。
3.可操作性原則。要求指標(biāo)體系的設(shè)置避免過(guò)于繁瑣,同時(shí)還要考慮指標(biāo)體系所涉及指標(biāo)的量化及數(shù)據(jù)獲取的難易程度和可靠性。
4.獨(dú)立性原則。確定評(píng)估指標(biāo)在考慮全面性的基礎(chǔ)上,要使采用的指標(biāo)盡可能相互獨(dú)立,指標(biāo)間的獨(dú)立性越好,評(píng)估的準(zhǔn)確性越高。
5.可量化原則。為了克服主觀評(píng)價(jià)所帶來(lái)的不確定性和盲目性,評(píng)價(jià)要盡量做到以量化研究為主,同時(shí)定性評(píng)價(jià)與定量評(píng)估相結(jié)合。
6.靈活性原則。評(píng)價(jià)指標(biāo)體系應(yīng)具有足夠的靈活性,以便各銀行可根據(jù)自己的放貸方式和用途以及本地區(qū)的實(shí)際情況,對(duì)指標(biāo)靈活進(jìn)行運(yùn)用。
7.公正性原則。信用評(píng)估指標(biāo)體系的建立,要符合客觀事實(shí),能正確反映評(píng)估對(duì)象信用等級(jí)的真實(shí)面貌,指標(biāo)體系和計(jì)算方法不能偏向評(píng)估對(duì)象或授信方的任何一方,評(píng)估機(jī)構(gòu)和評(píng)估人員不能根據(jù)個(gè)人愛(ài)好,任意改變指標(biāo)項(xiàng)目,計(jì)算方法和評(píng)估標(biāo)準(zhǔn)。
8.動(dòng)態(tài)性原則。信用風(fēng)險(xiǎn)的評(píng)估不是簡(jiǎn)單靜態(tài)的一次度量,而是連續(xù)動(dòng)態(tài)的調(diào)整過(guò)程,因?yàn)殡S著貸款企業(yè)在生產(chǎn)環(huán)節(jié)中的每個(gè)過(guò)程都在動(dòng)態(tài)發(fā)生變化,企業(yè)的經(jīng)營(yíng)成果也隨著發(fā)生改變,變化中的財(cái)務(wù)和非財(cái)務(wù)數(shù)據(jù)就直接地影響到信用風(fēng)險(xiǎn)評(píng)估結(jié)果。因此,信用風(fēng)險(xiǎn)的評(píng)估是要不斷地進(jìn)行調(diào)整的,基于國(guó)內(nèi)銀行和企業(yè)的財(cái)務(wù)制度,建議一個(gè)季度進(jìn)行動(dòng)態(tài)調(diào)整一次。
三、基于數(shù)據(jù)挖掘技術(shù)的信用評(píng)估算法
David Durand(1941)從Fisher的一項(xiàng)試驗(yàn)中獲得啟示,意識(shí)到可以采用把整個(gè)客戶群分為好與壞兩種不同類別的方式來(lái)處理放貸問(wèn)題。在隨后的發(fā)展和演變過(guò)程中,個(gè)人信用評(píng)始終被看做是一個(gè)分類問(wèn)題。到目前為止,主要的評(píng)估方法大致可以分為以下幾類:經(jīng)驗(yàn)式評(píng)判法、統(tǒng)計(jì)學(xué)方法、運(yùn)籌學(xué)方法以及人工智能方法中的數(shù)據(jù)挖掘技術(shù)。
信用評(píng)估的本質(zhì)是分類,因此,信用評(píng)估是數(shù)據(jù)挖掘技術(shù)非常重要的一個(gè)應(yīng)用領(lǐng)域。數(shù)據(jù)挖掘從大量數(shù)據(jù)中提取或“挖掘”知識(shí),用于信用評(píng)估,可對(duì)客戶進(jìn)行分類、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、預(yù)測(cè)、偏差檢測(cè)等;其中,多數(shù)用分類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)和預(yù)測(cè)方法進(jìn)行個(gè)人信用評(píng)估。目前,用于信用評(píng)估的分類算法主要包括判別分析、Logisitic回歸、決策樹(shù)、線性規(guī)劃、神經(jīng)網(wǎng)絡(luò)、遺傳算法、支持向量機(jī)等算法。
1.判別分析。是一種信用評(píng)估中使用最早的算法,其本質(zhì)是一種線性回歸,它通過(guò)對(duì)己知客戶進(jìn)行分類形成若干母體,然后根據(jù)這些母體的特征得出判別函數(shù)來(lái)判斷對(duì)象屬于哪個(gè)母體。由于判別分析的假定條件過(guò)于嚴(yán)格如要求解釋變量呈多元正態(tài)分布,如果客戶樣本存在一定偏差性,則不是很適合使用該算法進(jìn)行信用評(píng)估。
2.Logisitic回歸。是線性回歸的變形,通過(guò)采用極大似然估計(jì)的迭代方法,找到“最可能”系數(shù)的估計(jì),適用于解釋變量為定性指標(biāo)的問(wèn)題。該算法不受解釋變量分布假設(shè)的嚴(yán)格限制是其優(yōu)于判別分析之處,但評(píng)分的結(jié)果和判別分析的差別并不大。
3.線性規(guī)劃。線性規(guī)劃是一種運(yùn)籌學(xué)的方法,采用最小絕對(duì)誤差或最小化最大誤差作為目標(biāo)對(duì)客戶進(jìn)行分類。但許多學(xué)者通過(guò)研究比較之后認(rèn)為該方法在信用評(píng)分領(lǐng)域的效果并不比統(tǒng)計(jì)方法優(yōu)越,所以線性規(guī)劃的實(shí)際應(yīng)用并不多。
4.K近鄰判別。K近鄰判別是一種非參數(shù)統(tǒng)計(jì)方法,Chatterje等把這種方法引入信用評(píng)分領(lǐng)域,在申請(qǐng)者數(shù)據(jù)上選取一個(gè)矩陣來(lái)測(cè)量申請(qǐng)者的信用差距,其常用來(lái)解決概率密度函數(shù)的估計(jì)和分類問(wèn)題,在應(yīng)用中不受樣本偏差的限制,但模型參數(shù)的選擇有很大隨機(jī)性,在信用評(píng)估中應(yīng)用較少。
5.決策樹(shù)法。是20世紀(jì)80 年代末提出的一種利用機(jī)器學(xué)習(xí)技術(shù)發(fā)展起來(lái)的符號(hào)方法,是一種非參數(shù)統(tǒng)計(jì)方法。決策樹(shù)是一個(gè)類似流程圖的樹(shù)型結(jié)構(gòu),其中樹(shù)的每個(gè)內(nèi)部結(jié)點(diǎn)代表對(duì)一個(gè)屬性(取值)的測(cè)試,其分支就代表測(cè)試的輸出結(jié)果;這樣,樹(shù)的每個(gè)葉結(jié)點(diǎn)就代表一個(gè)類別。從決策樹(shù)的根結(jié)點(diǎn)到葉結(jié)點(diǎn)的一條路徑就形成了對(duì)相應(yīng)對(duì)象的類別預(yù)測(cè)。決策樹(shù)可以很容易轉(zhuǎn)換為分類規(guī)則?;緵Q策樹(shù)算法是一個(gè)貪心算法,采用自上而下、分而治之的遞歸方式來(lái)構(gòu)造。構(gòu)造決策樹(shù)的經(jīng)典算法有 ID3、C4.5。