国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于決策樹的中小微企業(yè)信貸風險數據分析

2022-10-14 03:47:08盧林軍董浩垠
大眾科技 2022年9期
關鍵詞:信譽額度決策樹

盧林軍 盧 暢 董浩垠

基于決策樹的中小微企業(yè)信貸風險數據分析

盧林軍1盧 暢1董浩垠2

(1.桂林電子科技大學計算機與信息安全學院,廣西 桂林 541004;2.桂林電子科技大學建筑與交通工程學院,廣西 桂林 541004)

銀行通常需評價中小微企業(yè)情況才提供貸款,并且可以為聲譽較高和信用風險較低的公司給予特殊利率優(yōu)惠。文章通過信譽量化、決策樹等數學模型,運用模糊層次分析法、spearman相關系數分析法以及剪枝處理等方法,設計銀行對中小微企業(yè)信貸的策略。對有信貸記錄的中小微企業(yè),運用模糊層次分析法,建立信譽量化模型,取得了各個企業(yè)信貸額度占銀行總信貸額度的比例,銀行可根據實際額度按比例給中小微企業(yè)貸款。對沒有信貸記錄的中小微企業(yè),使用決策樹模型,預測企業(yè)的信譽評級和違規(guī)情況,使得無信貸記錄的企業(yè)能夠得到一個相對精準的信用評價。此外,還對決策樹模型進行剪枝處理,提高模型的準確率和泛化性能。針對公開數據集進行測試,得到相關決策,模型具有較強的適應性,也可推廣至其他領域。

中小微企業(yè);信譽量化;決策樹;模糊層次分析;相關系數分析

引言

生活中,由于中小微型企業(yè)的規(guī)模小和缺乏抵押資產,基于信貸政策、發(fā)票交易信息和產業(yè)鏈上下游影響力,銀行為保持穩(wěn)定的供求關系,會向實力強的企業(yè)提供貸款,并且可以為聲譽較高和信用風險較低的公司給予特殊利率優(yōu)惠。在相關的研究[1-15]中,銀行會首先根據企業(yè)實力和信譽評估中小企業(yè)的信用風險,然后根據信用風險等因素,判斷是否放貸,采用信用限額、利率和期限等借貸方式,對中小微型企業(yè)給予借貸。

(1)利用spearman相關性分析法[16]對四項指標與企業(yè)信譽進行相關性檢驗,得到指標相關性良好,驗證了系數選擇的合理性。

(2)根據沒有信譽評級的企業(yè)數據,在經過指標提取后,建決策樹[17]模型,該模型在樣本小的條件下,能很好的完成信譽評級的分類效果。同時,考慮到決策樹模型自身會產生過擬合的缺點,對決策樹模型進行了剪枝處理,提高模型泛化性能。

1 中小微企業(yè)信貸風險管理問題假設

現實中有很多因素影響著銀行的信貸策略,為了使得本文的研究能夠順利進行,需要對問題進行一些假設。在滿足銀行對中小企業(yè)信貸管理的條件并考慮了實際因素之后,提出了如下基本的合理假設。

(1)假設中小微企業(yè)進行與銷項全部有發(fā)票記錄,不存在發(fā)票遺漏的現象。

(2)假設本文選擇的公開數據中提到的企業(yè),全都符合中小微企業(yè)的標準,不存在皮套公司。

(3)假設中小微企業(yè)處于經營正常的狀態(tài),不存在企業(yè)被列入到異常經營的范圍。

(4)假設本文沒有考慮到的影響因素,對本文提出的模型影響忽略不計。

(5)假設中小微企業(yè)的借貸,都沒有政府以及國家的優(yōu)惠政策減免。

(6)假設銀行的資金流動正常,擁有充足的現金可以放貸。

(7)假設銀行具有承受爛賬、壞賬的能力,不存在容易倒閉的情況。

(8)假設本文使用的公開數據集中的企業(yè),都在中小微企業(yè)中具有代表性。

(9)假設本文使用的公開數據中的數據均為真實且可靠的。

2 中小微企業(yè)信貸風險管理分析

2.1 與企業(yè)信譽相關因素選取與分析

為了探究討論企業(yè)信譽,建立評價模型解決問題,本文從數據集中123家有信貸記錄的企業(yè)中,選取5項指標與信譽評級進行相關性分析。

(1)信譽評級。

企業(yè)信譽評級反映了企業(yè)信用度的高低等級類別,它是根據企業(yè)從資產、負債和盈利等方面對企業(yè)信譽、地位等方面,對企業(yè)信用度進行劃分。本文把企業(yè)信譽評級分為A等評級,B等評級,C等評級,D等評級,一共四個等級。其中A等評級企業(yè)信譽最高,D等評級企業(yè)信譽最低。

(2)上一年是否違約。

銀行成為企業(yè)獲取融資的重要手段,銀行是企業(yè)信貸的主要資金來源者和風險承擔者,企業(yè)信貸違約不斷積聚的風險會波及到銀行信貸資產,也會打破銀行的穩(wěn)定經營。本文使用的123家有信貸記錄的企業(yè)信貸數據中,所有的企業(yè)都有信貸是否違約記錄。在此之前的信貸中,有違約記錄的企業(yè),信譽度較低,信貸風險高。

(3)企業(yè)年利潤比。

企業(yè)年利潤比反映了企業(yè)盈虧情況,企業(yè)盈虧情況又反映出了企業(yè)是否具有償還銀行貸款的能力。根據公開數據集,本文對數據集中企業(yè)用公式(1)計算盈利情況。

b為該企業(yè)一年中銷項發(fā)票的價稅合計總和,即企業(yè)收入;b為企業(yè)一年中進項發(fā)票中的非負價稅合計總和,即企業(yè)支出;為企業(yè)年利潤比;收入除以支出得到的結果,即為企業(yè)年利潤比。

(4)銷項發(fā)票中負價發(fā)票個數。

銷項發(fā)票為企業(yè)銷售產品時為購貨方開具的發(fā)票,負價發(fā)票為交易活動中,企業(yè)已入賬記稅后,購買方因故發(fā)生退貨并退款。在交易過程中購買方退貨并退款,一般情況下認為與產品的質量有關。負價發(fā)票個數過多,說明企業(yè)產品質量出現重大問題。產品質量有問題會直接降低了潛在投資者購買企業(yè)產品的意愿,增加了企業(yè)獲利的成本和難度。只有過硬的產品質量才能讓企業(yè)獲得贏得市場,獲得更好的效益,實現企業(yè)的可持續(xù)發(fā)展,擁有良好的信譽條件。

(5)負價發(fā)票對應的金額數目。

一個企業(yè)如果銷售發(fā)票中,負價發(fā)票過多會導致企業(yè)收入降低,還貸能力也逐漸下降,使得企業(yè)未能及時還款,企業(yè)在銀行就有了違約記錄,企業(yè)將承受較高的罰息,增加企業(yè)財務成本,形成惡性循環(huán)。

2.2 相關性分析校驗

相關性分析是指對兩個或多個具備相關性的變量元素進行分析,從而衡量兩個變量因素的相關密切程度[18]。為了校驗上述4項指標與企業(yè)信譽的相關性,本文選取信譽評級作為標準,分別對上一年是否違約、企業(yè)年利潤比、銷項發(fā)票中負價發(fā)票個數以及負價發(fā)票對應的金額進行相關性分析[7]。對于檢驗各指標的相關性,本文選擇spearman方法。當spearman相關系數接近0時,說明關系不相關;當spearman相關系數大于0.3時,表示有相關關系;兩個變量的相關性越強,spearman相關系數絕對值越大;反之,兩個變量的相關性越弱,spearman相關系數絕對值越小[19]。分別計算企業(yè)一年中發(fā)票中負價發(fā)票的個數n、企業(yè)一年中負價發(fā)票對應金額數目m、企業(yè)年利潤比P、上一年是否違約v與信譽評級g的spearman相關系數。相關系數結果如表1所示。

表1 相關系數符號說明

指標含義相關系數 ni企業(yè)一年中發(fā)票中負價發(fā)票的個數Ei的企業(yè)對應的編號0.356 mi企業(yè)一年中發(fā)票中負價發(fā)票對應金額數目0.361 Pi企業(yè)年利潤比0.464 vi上一年是否違約0.695

從表1可以得出上述四個指標與信譽評級的相關系數。可以看到每個系數與信譽評級相關系數均大于0.3,驗證了系數選擇的合理性。

2.3 信譽量化模型的建立

已知與信譽相關因素分別有:信譽評級、上一年是否違約、企業(yè)年利潤比、銷項發(fā)票中負價發(fā)票個數和負數發(fā)票對應的金額。運用模糊層次分析法模型[20],加入約束條件,輸入數據,進行求解。

求解步驟如下:

Step1:本文先對五項指標:信譽評級、上一年是否違約、企業(yè)年利潤比、銷項發(fā)票中負價發(fā)票個數和負數發(fā)票對應的金額數目,進行單獨分析并排名,將排名作為企業(yè)在該項的得分。

Step2:將五項得分相加作為該企業(yè)的最終信譽,并對最終信譽進行排名。

Step3:對排名進行歸一化處理作為該企業(yè)的信貸額度占銀行信貸額度的系數。基于以上思路,本文建立數學模型公式(2),公式(3),完成信貸數據的信譽量化過程。

表示企業(yè)代號為E的企業(yè)對應的編號;C為該企業(yè)的信譽量化數值;表示企業(yè)信譽排序后的排名;g為該企業(yè)的信譽評級,A取4,B取3,C取2,D取1;v為上一年是否違約,未違規(guī)取2,違規(guī)取1;P為企業(yè)年利潤比詳細定義見公式(1);n為該企業(yè)一年中發(fā)票中負價發(fā)票的個數;m為該企業(yè)一年中發(fā)票中負價發(fā)票對應金額。

本文基于企業(yè)信譽評級、上一年是否違約、企業(yè)年利潤比、銷項發(fā)票中負價發(fā)票個數和負數發(fā)票對應的金額,共5點指標,運用模糊層次分析法,最終對123家有信貸記錄的企業(yè)排序進行分析,本文在進行排名時,相同分數的企業(yè)取排名相同的名次,而不是去取對排名進行順延的排名的名次。這樣可以使得相同分數的企業(yè)差異鑒定但導致了不同項的排名的最值可能相差較大,因此,本文對每個排名進行了歸一化處理,處理得到的結果排名,即為函數()詳見公式(3)。最后對企業(yè)的信譽量化數值C進行排序,得到123個有信貸記錄的企業(yè)量化后信譽的排名(C)。對信譽排名除以排名總和,得到每個企業(yè)對應的系數,作為該企業(yè)的信貸額度占銀行信貸額度的系數,其中第i個企業(yè)的銀行信貸額度系數計算方式如公式(4)所示。

k為第個企業(yè)最終得到的銀行信貸額度系數;()為對進行求和。第個企業(yè)最終被分配的信貸額度為M,其計算方式如公式(5)所示。

3 有信貸記錄的中小微企業(yè)信貸策略

為了排除實驗干擾數據的影響,本文在處理數據時,進項發(fā)票數據與銷項發(fā)票數據中所含有的作廢發(fā)票,都將不做處理。在進價發(fā)票信息中,部分企業(yè)發(fā)票所含有的信息過少,進行計算時會產生干擾數據,從而影響到計算結果,故本文將其認為干擾數據。在處理進價發(fā)票信息時,由于進價發(fā)票信息中的負價發(fā)票與購買方相關性低,故不作為計算數據,僅將正價發(fā)票數據作為該企業(yè)支出金額。

將信譽評級、上一年是否違約、企業(yè)年利潤、銷項發(fā)票中負價發(fā)票個數和負數發(fā)票對應的金額數目,分別按照上述所建立的數學模型,進行處理后,計算出第個企業(yè)的信譽量化數值C和企業(yè)信貸額度系數k,以及每個企業(yè)對應的信貸額度M。每個企業(yè)可貸款額度對應的百分比k計算結果如圖1所示。

圖1 企業(yè)可貸款百分比示意圖

圖1中展示了信貸額度大小排名中,排名前35家中小微型企業(yè),各家企業(yè)占銀行總信貸額度的百分比;其余88家中小微型企業(yè),占銀行總信貸額度的百分比。表2展示了123家有信貸記錄企業(yè)的信貸風險量化分析后的部分結果,得到的排名靠前的部分企業(yè)信貸評級和是否違規(guī)的信息。

表2 部分企業(yè)信譽風險的信息

企業(yè)代號E15E16E64E31E58E89E31E7… 信譽評級AAAAAAAA… 是否違規(guī)否否否否否否否否…

從表2中可以看出,擁有信貸額度高的公司均對應較高的信譽評價等級,且在之前的信貸交易中沒有出現違約現象。此現象也可說明本文建立的數學模型,具有較好的準確性。本文假設銀行放貸總額度為100萬,根據公式(5)的計算方式可以得出每一家企業(yè)的信貸額度,部分企業(yè)對應的信貸額度M如表3所示。

表3 部分有信貸記錄企業(yè)的信貸額度

企業(yè)代號E15E16E64E31E58E89E31… 信貸額度19960197601956019360191601896018750…

4 尚未有信貸記錄企業(yè)的信貸方案

4.1 決策樹模型建立

本文的數據中有302家公司均無信貸記錄,在提出的模型公式(4)和公式(5)中缺少信譽評級和上一年是否違約兩項。本文使用決策樹模型對123家有信貸記錄的企業(yè)數據進行訓練,使得決策樹模型可以分別對302家無信貸記錄的企業(yè)數據的信譽評級進行分類以及預測該企業(yè)是否會違約。

通過決策樹模型獲取信譽評級g和企業(yè)是否會違約v。在預測過程中,先選用企業(yè)盈利比P、企業(yè)每月負發(fā)票數平均值n和企業(yè)每月負發(fā)票對應金額平均值m作為輸入值將企業(yè)是否違規(guī)作為輸出值。由于模型預測該項準確率高達90%,故接下來本文將是否違規(guī)的預測值作為輸入與企業(yè)盈利比P、企業(yè)每月負發(fā)票數平均值n、企業(yè)每月負發(fā)票對應金額平均m一起輸入決策樹模型進行分類訓練。最終得到企業(yè)的信譽評級。

4.2 決策樹模型的優(yōu)化

由于302家無信貸記錄企業(yè)所給數據較多,并且部分數據具有干擾性,本文對決策樹模型進行了剪枝處理,減小模型過擬合的概率提高模型泛化性。剪枝處理屬于決策樹優(yōu)化中的精調部分。因為在使用決策樹模型的過程中,將不斷重復節(jié)點分化過程,盡可能使得被訓練樣本正確分類,這使得決策樹模型把訓練集本身特性,當作數據具有的一般的性質,從而導致擬合過度。在實際操作過程中通過模擬不同的剪枝深度,計算不同剪枝深度下決策樹模型在驗證集上的準確率。繪制預測準確度如圖2所示。

圖2 決策樹深度對于模型準確率

從圖2中可以得到,當剪枝數為6時在驗證集上準確率最高,為96%。在生成的決策樹中,剪枝之前的結果冗余且繁雜,剪枝后決策樹模型更加間接且具有預測更高的準確性,可以滿足對信譽評級預測的需求,使得尚未有信貸記錄的中小微企業(yè)能夠獲得一個相對精確的信譽評級。

4.3 預測信譽評級與違規(guī)情況

將302家無信貸記錄企業(yè)的數據,輸入經過剪枝處理決策樹模型,可預測出每一家企業(yè)的信譽評級和是否違約情況。部分企業(yè)的預測結果如表4所示。

表4 部分企業(yè)指標預測效果

企業(yè)代號E125E126E127E128E129E130E131… 信譽評級BAACAAA… 是否違規(guī)否否否是否否否…

4.4 信譽量化值計算

將預測得到的信譽評級、上一年是否違約。以及附件中企業(yè)年利潤、銷項發(fā)票中負價發(fā)票個數和負數發(fā)票對應的金額分別按照上述建模方式進行處理后計算出企業(yè)的信譽量化數值C和企業(yè)可貸款百分比k以及每個企業(yè)對應的信貸額度MM計算結果如圖3所示。

圖3 302家無信貸記錄企業(yè)可貸金額

本文在提取出評估指標的基礎上,利用123家有信貸記錄的企業(yè)數據構建出決策樹,從而預測出302家無信貸記錄企業(yè)中每一家企業(yè)的信譽評級和違規(guī)情況,構建出有信貸記錄的數據集,采用原來的評估方式,計算出每一家公司獲得銀行貸款的占比,由于預測的過程中可能與真實有出入,將月均收入作為企業(yè)可貸金額合理性的一個評估,表5為前5個企業(yè)對應的月均收入,信貸評級和是否違規(guī)的信息。

表5 可貸款額度前5的企業(yè)基本信息

企業(yè)代號E127E126E129E153E139 月均收入18640K11857K8179K7095K5459K 信譽評級AAACA 是否違規(guī)否否否否否

從表5中可以看出,信貸額度高的公司均對應較高的信譽評價和較高的評價等級,同時在之前的信貸交易中沒有出現違規(guī)違約現象,也具有較高的月均收入。此現象也可說明模型具有較好的準確性。部分企業(yè)對應的信貸額度M如表6所示。假設貸款申請額度為1億元,下表為部分302家無信貸記錄企業(yè)根據計算出的信貸額度比例所得的具體信貸額度。

表6 部分302家無信貸記錄企業(yè)的信貸額度

企業(yè)代號E127E126E128E129E153E139 信貸額度813000810000806000803000800000796000

5 結論

本文建立的模型,綜合考慮了影響中小微企業(yè)信貸風險的多方面因素及其限制,建立的最優(yōu)模型能與實際生活貼近,可用于多種問題的量化分析,優(yōu)化資源的配置。建立的數學模型,既忽略了對問題實質影響的部分因素,又體現了問題的主要矛盾,使得模型簡單易求解。模型的評價體系、評價體系指標、評價體系方法,可推廣到其它的公共服務系統(tǒng)的評價中,簡化計算復雜度。模型仍然存在一些不足,本文模型是建立在相對理想的狀態(tài)下,然而現實的企業(yè)信貸的信貸風險還有信息不對稱風險、經營風險、道德風險等因素的制約,在現實中應用此模型可能會存在一定偏差。

對銀行不同的實際問題,本文建立的數學模型都能給出很好的解決方式,說明模型具有較強的適應性。本文的模型不僅僅只在銀行信貸決策方面起作用,而且也能解決商品銷售等方面問題,廣泛應用于實際生活中的多個領域。

[1] Vieira J, Barboza F, Sobreiro V A, et al. Machine learning models for credit analysis improvements: Predicting low income families' default[J]. Applied Soft Computing, 2019, 83: 105640.

[2] Murjad M D, Rustam Z. Fuzzy support vector machines based on adaptive particle swarm optimization for credit risk analysis[J]. Journal of Physics: Conference Series, 2018, 1108(1): 012052.

[3] 侯明. 疫情下中小微企業(yè)信貸扶持政策存在的問題和對策[D]. 長春: 吉林大學,2021.

[4] 孔翼堯. 小微企業(yè)信貸管理中的問題與對策分析[J]. 時代金融,2021(19): 81-83.

[5] 蔣偉. 淺析中小企業(yè)信貸問題[J]. 時代金融,2014(12): 99-100.

[6] 曲蕾. 小微企業(yè)信貸管理中的問題與對策分析[J]. 商訊,2020(36): 117-118.

[7] 費洪波. 銀行小微企業(yè)信貸業(yè)務的問題及對策研究[D]. 成都: 西南財經大學,2019.

[8] 王黎,李燁峰. 信貸資源配置視角下中小企業(yè)融資問題研究[J]. 智庫時代,2018(51): 34,47.

[9] 王朵朵. 徽商銀行B分行小微企業(yè)信貸風險管理研究[D]. 蚌埠: 安徽財經大學,2021.

[10] 陳璐璐. 工商銀行JA分行小微企業(yè)信貸風險管理研究[D]. 長春: 吉林大學,2021.

[11] 趙嵐,李俊葉. 基于Logistic回歸的企業(yè)信貸違約概率模型研究[J]. 科學技術創(chuàng)新,2021(23): 4-5.

[12] 東雨晨. 淺析中小企業(yè)信貸融資困境及對策[J]. 商場現代化,2021(19): 58-60.

[13] 翁瑜. 小微企業(yè)信貸風險定價的研究[D]. 杭州: 浙江大學,2021.

[14] 王宇晴. “互聯(lián)網+”視角下小微企業(yè)信貸問題研究[J]. 中小企業(yè)管理與科技(下旬刊),2021(11): 134-136.

[15] 趙苓伶,陳瑾,李笑瑩,等. 基于K-Means聚類分析的中小微企業(yè)信貸策略分析[J]. 高師理科學刊,2021,41(9): 14-20.

[16] 謝文華. Spearman相關系數的變量篩選方法[D]. 北京: 北京工業(yè)大學,2015.

[17] 張棪,曹健. 面向大數據分析的決策樹算法[J]. 計算機科學,2016,43(S1): 374-379,383.

[18] 吳朋民,陳挺,王小梅. Altmetrics與引文指標相關性研究[J]. 數據分析與知識發(fā)現,2018,2(6): 58-69.

[19] 由慶斌,韋博,湯珊紅. 基于補充計量學的論文影響力評價模型構建[J]. 圖書情報工作,2014,58(22): 5-11.

[20] 司守奎,孫璽菁. 數學建模算法與應用[M]. 北京: 國防工業(yè)出版社,2015(4): 375-379.

Analysis of Credit Risk Data of Small and Medium-Sized Enterprises Based on Decision Tree

Banks usually need to evaluate the situation of small and medium-sized enterprises before providing loans, and can give special interest rates to companies with high reputations and low credit risk. Through credit quantification, decision tree, and other mathematical models, using fuzzy analytic hierarchy process, spearman correlation coefficient analysis, pruning and other methods, design the bank's credit strategy for small and medium-sized enterprises. For small and medium-sized enterprises with credit records, fuzzy analytic hierarchy process is used to establish a quantitative model of reputation, and the proportion of each enterprise's credit line in the bank's total credit line is obtained. The bank can lend loans to small, medium-sized and micro enterprises in proportion to the actual amount. For mall and medium-sized enterprises without credit records, the decision tree model is used to predict the credit rating and violations of the enterprises, so that enterprises without credit records can obtain a relatively accurate credit record. In addition, the decision tree model is pruned to improve the accuracy and generalization performance of the model. Testing against public data sets to obtain relevant decisions, the model has strong adaptability and can also be extended to other fields.

small and medium-sized enterprises; reputation quantification; decision tree; fuzzy analytic hierarchy process; correlation coefficient analysis

F832.4; TP181

A

1008-1151(2022)09-0005-05

2022-04-29

廣西大學生創(chuàng)新創(chuàng)業(yè)訓練計劃立項項目(202010595168、202110595025)。

盧林軍(2000-),男,桂林電子科技大學計算機與信息安全學院學生,研究方向為機器學習、深度學習、計算機視覺。

猜你喜歡
信譽額度決策樹
以質量求發(fā)展 以信譽贏市場
信用卡臨時額度暗藏三大雷區(qū)
投資與理財(2019年8期)2019-12-01 11:56:38
信譽如“金”
華人時刊(2019年13期)2019-11-26 00:54:42
一種針對不均衡數據集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應用
電子制作(2018年16期)2018-09-26 03:27:06
基于決策樹的出租車乘客出行目的識別
江蘇德盛德旺食品:信譽為翅飛五洲
華人時刊(2016年19期)2016-04-05 07:56:08
滬港通一周成交概況 (2015.5.8—2015.5.14)
基于肺癌CT的決策樹模型在肺癌診斷中的應用
额济纳旗| 全南县| 鄂托克旗| 临安市| 水富县| 山东省| 平利县| 耒阳市| 西盟| 正蓝旗| 基隆市| 临邑县| 贵定县| 长子县| 天津市| 界首市| 咸宁市| 聂拉木县| 区。| 陇川县| 彭州市| 焦作市| 依安县| 武定县| 寿光市| 连山| 遂川县| 通道| 治县。| 托里县| 百色市| 栾城县| 宣恩县| 元氏县| 龙泉市| 十堰市| 红河县| 精河县| 广河县| 历史| 乌海市|