国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于模糊支持向量機的信用風險評估模型研究

2014-08-08 06:00:28
關鍵詞:信用風險信用向量

林 于 力

(重慶大學 數學與統(tǒng)計學院,重慶 401331)

20世紀30年代至今,金融經濟危機頻頻發(fā)生,信用風險評估成為金融風險管理領域的重要課題。實證研究表明:支持向量機模型(SVM)是研究信用風險評估問題的最好模型之一[1]。SVM的主要思想是最小化泛化誤差的上界,在機器學習過程中,對訓練樣本需要解一個二次規(guī)劃。當遇到一個大型的二次規(guī)劃問題時,計算會很復雜。因此,解二次規(guī)劃問題的算法影響著支持向量機模型的性能。另外,在實際生活中,不能完全確定每個信用申請者是屬于可信客戶還是違約客戶。例如,一個申請者有90%可能屬于可信(不違約)客戶,有10%可能屬于違約(不可信)客戶,很難100%判定申請者是可信的還是違約的。因此,應為信用申請者設置一個模糊隸屬度,對信用風險評估問題應進行模糊化處理。

針對以上問題,本文利用試驗設計方法和模糊支持向量機,構造基于試驗設計的模糊支持向量機模型來進行信用風險評估。在該模型中,首先采用試驗設計方法為模型選擇最優(yōu)參數,然后利用模糊支持向量機來處理信用評估問題。此外,為了減少支持向量機求解二次規(guī)劃問題的計算復雜度,利用最小二乘原理進行簡化處理。最后,用來自UCI機器學習庫中的德國信用數據集對提出的方法進行實證分析。

1 基于試驗設計的模糊最小二乘支持向量機模型

1.1 模糊最小二乘支持向量機模型的構造

支持向量機首先通過映射函數φ(·)把輸入數據映射到一個高維的特征空間中,并找到有最大分類間距的最優(yōu)分離超平面。最優(yōu)超平面表達如下:

y=wTφ(x)+b=0

(1)

其中,x=(x1,x2,…,xN)T,N為樣本數,w為超平面的法向量,b是偏差,為一個標量。根據結構風險最小化原則,分類超平面問題可以通過如下的優(yōu)化問題求解:

(2)

尋找最優(yōu)超平面是一個二次規(guī)劃問題,有較高的計算復雜性,因此,基于最小二乘原則進行求解。在實際的信用分類問題中,每個樣本數據不能完全明確的分到一個特定的類里,引入模糊隸屬度μi,模型變?yōu)?/p>

(3)

為訓練數據的每個元素指定αki,相應的拉格朗日函數為

(4)

由KKT點的必要條件,代入式(4),有:

(5)

上述等式可寫為

(6)

分類器為

(7)

最后,模型變?yōu)?/p>

(8)

輸入空間到高維特征空間的非線性映射取徑向基核函數:

(9)

對于隸屬度μi,選擇公式:

(10)

sk是由SVM,LSSVM等信用評分方法得到的每個輸入數據的初始信用評分。

1.2 分類器參數選擇的方法

支持向量機的性能不僅受解優(yōu)化問題的算法所影響,在機器學習的過程中參數的選擇也是很重要的。試驗設計法(DOE)的主要思想如下:首先,設定一個覆蓋了整個搜索空間的粗糙網格;然后,迭代網格解析度和搜索邊界直至滿足停止準則。每次迭代后,搜索空間重新設定為以最優(yōu)性能的點為中心。如果上述過程使搜索邊界超過了給定的界,調整中心使整個空間包含在給定的界中。

以兩個參數的設定為例。讓每個參數取值[-5,5],圖1表示以1×1為精度,網格搜索法總共要評估的點是100;圖2表示用DOE方法需要評估的點及其迭代,圓表示第一次迭代的點,三角形表示第二次迭代的點。

圖1 網格搜索法評估的點

圖2 DOE方法評估的點

尋找徑向基核函數的最小二乘支持向量機的參數,DOE方法主要步驟如下:

(1) 設定γ和σ的初始范圍為[γ_min,γ_max],[σ_min,σ_max],iter=1;

(2) 當iter≤MAXITER時,根據圖2的模式,找到空間中的13個點,以(γ_min,σ_min)為左底角,(γ_max,σ_max)為右上角,由[(γ_min,σ_min),(γ_max,σ_max)]表示,設γ_Space=γ_max-γ_min,σ_Space=σ_max-σ_min。

對這13個沒有進行評估的點,進行評估:以點的坐標作為參數,用訓練和測試樣本運行徑向基核的最小二乘支持向量機M次,這M次檢測的平均分類準確度就是這個點的性能指數。

選擇具有最優(yōu)性能的點P0(γ0,σ0)作為中心,設定一個新的搜索空間范圍:γ_Space=γ_Space/2,σ_Space=σ_Space/2。如果以(γ0,σ0)為中心,γ_Space、σ_Space為寬和高的長方形超過了最初的范圍,調整中心點直到新的搜索空間包含在[(γ_min,σ_min),(γ_max,σ_max)]內。

設定新的搜索空間:γ_min=γ0-γ_Space/2,γ_max=γ0+γ_Space/2,σ_min=σ0-σ_Space/2,σ_max=σ0+σ_Space/2,iter=iter+1。

(3) 返回有最優(yōu)性能的點,選擇最優(yōu)參數構造模糊最小二乘支持向量機模型進行分類。

1.3 基于試驗設計的模糊最小二乘支持向量機模型的信用風險評估算法

使用Matlab,采用徑向基核函數,用DOE法找到最優(yōu)參數σ2,γ,使用σ2和γ來訓練和檢驗輸入數據。算法步驟如下:把數據轉為Matlab能識別的格式;初始化參數σ2和γ,然后使用DOE方法進行參數選擇;使用標準LSSVM模型計算得分sk,計算μk,解決數學規(guī)劃,得到拉格朗日乘數α和數量b;構造分類函數,對檢驗數據分類;計算三種類型的精度(總精度,一類精度,二類精度)。其中:

如果對得到的精度不滿意,改變σ2和γ的初始值。

2 實證分析

為了檢驗所提出方法進行信用風險評估的效果,選擇來自UCI機器學習庫中的德國信用數據集(http://archive.ics.uci.edu/ml/)進行實證分析。其中,德國信用數據集包括1 000位申請者(700位可信客戶,300位違約客戶,分別對應標簽為1和-1),每位客戶有24個屬性;數據集中可信客戶和違約客戶是不平衡的,和現(xiàn)實情況相符。

使用徑向基核函數,模型中只有σ2和γ兩個待定參數。采取DOE方法,初始范圍設為γ[2-5,29],σ[2-9,25],maxiter=6,檢驗的次數為10次;選擇601個數據作為訓練樣本,剩下的399個數據作為測試樣本對模型的精度進行檢驗,并與線性判別分析法(LDA)、最小二乘支持向量機(LSSVM)、支持向量機(SVM)、徑向基網絡(RBF)和k鄰近等常用的信用風險評估模型的精度進行比較,結果如表1所示。

由表1可知,模糊最小二乘支持向量機模型的總精度和第二類精度都高于其他模型。第一類精度僅次于徑向基網絡模型,也遠高于其他模型精度的平均值。這說明了所提出的模糊最小二乘支持向量機模型對信用風險評估有很好的效果。

得到這個較好的結果的原因之一是DOE方法得到了模型的最優(yōu)參數,而DOE更是一種能夠有效減少計算復雜度的參數選擇算法。對上述德國信用數據集選用最小二乘支持向量機模型進行信用風險評估,選擇100個數據作為訓練樣本,20個數據作為測試樣本,并用DOE方法和網格搜索法(GS)分別進行參數選擇,得到的結果和所花費的時間如表2所示。由表2可知,用DOE方法做參數選擇所得到的第二類精度和總精度都高于用網格搜索法做參數選擇得到的精度,第一類精度略低,但也處于一個較高的水平。但DOE方法所耗時間為4.7 s,遠低于網格搜索法所需要的時間,因此用DOE方法進行參數選擇是有價值的。

表1 不同信用風險評估模型的精度比較 %

表2 LSSVM兩種參數選擇方法的結果比較

3 結 論

作為有效防范信用風險的主要手段,信用風險評估在信用管理中發(fā)揮著重要的作用,本文用基于試驗設計的模糊最小二乘支持向量機模型對信用數據進行信用風險評估。在此模型中,利用DOE方法進行參數選擇,再利用模糊最小二乘支持向量機模型對數據進行分類,得到不同客戶的信用評估情況。為了檢驗該方法,使用UCI數據庫中的德國信用數據集信用數據集來進行實證分析,研究結果表明:基于試驗設計的模糊最小二乘支持向量機模型能取得較好的分類結果,且運行速度較快,可為信用決策者提供重要的決策參考依據,具有較強的實用性。此外,基于試驗設計的模糊最小二乘支持向量機模型也可應用于其他二分類問題,因而此模型具有較強的適用性。

參考文獻:

[1] LEAN Y,WANG S Y,LAI K. Credit risk evaluation using a C-variable least squares support vector classification model[J].Communications in Computer and Information Science,2009(35):573-579

[2] 余樂安,汪壽陽.基于核主元分析的帶可變懲罰因子最小二乘模糊支持向量機模型及其在信用分類中的應用[J].系統(tǒng)科學與數學,2009(10):1311-1326

[3] YU L,YAO X,WANG S Y,et al. Credit risk evaluation using a weighted least squares SVM classifier with design of experiment for parameter selection [J]. Expert Systems with Applications,2011,38:15392-15399

[4] LIU J L,MAO J Q,CHEN L. An Ensemble of Fuzzy Sets and Least Squares Support Vector Machines Approach to Consumer Credit Risk Assessment[J]. Fifth International Conference on Business Intelligence,2012(5):10-12

[5] 余晨曦,梁瀟.基于支持向量機的商業(yè)銀行信用風險度量模型[J].計算機與數字工程,2008(11):10-14

[6] TWALA B. Multiple classier application to credit risk assessment[J]. Expert Systems with Applications,2010(37):3326-3336

[7] 張冰,孔銳.一種支持向量機的組合核函數[J].計算機應用,2007,27(1):44-46

[8] 奉國和.SVM分類核函數及參數選擇比較[J].計算機工程與應用,2011,47(3):123-128

猜你喜歡
信用風險信用向量
向量的分解
聚焦“向量與三角”創(chuàng)新題
為食品安全加把“信用鎖”
信用收縮是否結束
中國外匯(2019年9期)2019-07-13 05:46:30
淺析我國商業(yè)銀行信用風險管理
遼寧經濟(2017年6期)2017-07-12 09:27:35
信用中國網
信用消費有多爽?
京東商城電子商務信用風險防范策略
當代經濟(2016年26期)2016-06-15 20:27:18
向量垂直在解析幾何中的應用
向量五種“變身” 玩轉圓錐曲線
纳雍县| 任丘市| 灵山县| 五指山市| 邹平县| 德令哈市| 卢氏县| 图木舒克市| 汉寿县| 开远市| 顺义区| 龙岩市| 卢氏县| 紫金县| 衡山县| 普安县| 神木县| 彭州市| 山东| 扎囊县| 长宁县| 西昌市| 项城市| 辽中县| 山阳县| 洪泽县| 榆中县| 永和县| 新乡县| 红原县| 桓仁| 临武县| 白水县| 东乌珠穆沁旗| 徐州市| 绥宁县| 白朗县| 石棉县| 雅安市| 德昌县| 安丘市|