張鈺
摘 要:根據(jù)中小板市場(chǎng)998家企業(yè)的財(cái)務(wù)指標(biāo)數(shù)據(jù)構(gòu)建財(cái)務(wù)預(yù)警與信用評(píng)分指標(biāo)體系,運(yùn)用相關(guān)性與機(jī)器學(xué)習(xí)決策樹對(duì)指標(biāo)進(jìn)行二次篩選,并通過邏輯回歸計(jì)算各樣本的信用分值,再根據(jù)模型評(píng)估和實(shí)證結(jié)果可以推知:邏輯模型對(duì)中小企業(yè)具有較好的財(cái)務(wù)預(yù)警能力,能夠準(zhǔn)確衡量企業(yè)信用風(fēng)險(xiǎn)水平。同時(shí)可發(fā)現(xiàn),存貨周轉(zhuǎn)率等12個(gè)財(cái)務(wù)指標(biāo)是衡量中小企業(yè)信用風(fēng)險(xiǎn)的重要指標(biāo)。
關(guān)鍵詞:信用評(píng)分;中小企業(yè);邏輯回歸;財(cái)務(wù)預(yù)警
中圖分類號(hào):F276.3? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? 文章編號(hào):1673-291X(2021)30-0063-03
引言
隨著我國從經(jīng)濟(jì)體量到經(jīng)濟(jì)發(fā)展質(zhì)量的轉(zhuǎn)變,中小企業(yè)成為我國經(jīng)濟(jì)發(fā)展的重要推動(dòng)力量,在我國的經(jīng)濟(jì)發(fā)展中,逐漸出現(xiàn)了企業(yè)體系中資金配置的兩極分化,這是我國異于他國的金融體系框架所導(dǎo)致的。但從根本上來說,中小企業(yè)發(fā)展最主要的問題是其自身財(cái)務(wù)狀況導(dǎo)致的融資難問題,中小企業(yè)的資金規(guī)模、技術(shù)、產(chǎn)品、服務(wù)都嚴(yán)重制約了其發(fā)展,且自有資金相對(duì)匱乏。此外,易受到外界多種因素的影響,在內(nèi)部管理、決策水平、風(fēng)險(xiǎn)控制等方面的能力也較為薄弱,管理的風(fēng)險(xiǎn)也相對(duì)較高,從而使得中小企業(yè)發(fā)展受到各個(gè)方面的制約,導(dǎo)致其經(jīng)營風(fēng)險(xiǎn)、管理風(fēng)險(xiǎn)、信用風(fēng)險(xiǎn)不斷加大。
在我國經(jīng)濟(jì)發(fā)展改革和經(jīng)濟(jì)體系轉(zhuǎn)變的過程中,中小企業(yè)要想扮演好自身的角色,要想有效地提高自身的經(jīng)營能力和財(cái)務(wù)能力,要想有效地從根本上或者是一定程度地解決中小企業(yè)的融資問題,最重要的是解決企業(yè)信用風(fēng)險(xiǎn)量化問題和建立良好的財(cái)務(wù)預(yù)警體系,從根本上解決金融機(jī)構(gòu)和市場(chǎng)主體對(duì)中小企業(yè)投資信心的問題。為較好地解決市場(chǎng)外部環(huán)境和中小企業(yè)與銀行之間的信息不對(duì)稱的問題,本文旨在建立一套健全的財(cái)務(wù)指標(biāo)體系,較為準(zhǔn)確地衡量中小企業(yè)的信用風(fēng)險(xiǎn),并形成評(píng)分卡。
一、文獻(xiàn)綜述
在對(duì)于中小企業(yè)信用指標(biāo)體系的研究中,我國許多學(xué)者都致力于尋找最合理的方法來衡量企業(yè)風(fēng)險(xiǎn)。如于善麗和遲國泰(2017)通過Fisherscore值建立了服務(wù)業(yè)小企業(yè)債信評(píng)價(jià)體系,并對(duì)1 077家企業(yè)的數(shù)據(jù)進(jìn)行實(shí)證分析;孟斌等(2019)根據(jù)組合系數(shù)構(gòu)建建筑企業(yè)信用評(píng)價(jià)模型,研究表明,與單一賦權(quán)結(jié)果相比,組合賦權(quán)模型特異度和靈敏度更高;遲國泰等(2019)利用1 814家工業(yè)企業(yè)的貸款數(shù)據(jù)實(shí)證分析了其所建立的小型工業(yè)企業(yè)債信評(píng)級(jí)模型,結(jié)果表明,該指標(biāo)體系能夠顯著區(qū)分該類企業(yè)的違約狀態(tài);張傳新和王光偉(2012)運(yùn)用Logit模型實(shí)證分析基于主成分的信用風(fēng)險(xiǎn)體系的有效性;郭林(2020)用兩階段邏輯回歸構(gòu)建了敏感性更強(qiáng)、判別力更大的信用評(píng)價(jià)指標(biāo)體系,并使用3 111個(gè)小企業(yè)的信貸數(shù)據(jù)實(shí)證分析了其指標(biāo)體系的有效性等。
為建立較為準(zhǔn)確的指標(biāo)體系,本文基于企業(yè)財(cái)務(wù)指標(biāo),構(gòu)建指標(biāo)體系,運(yùn)用隨機(jī)森林和決策樹篩選指標(biāo)變量,并建立邏輯回歸判別指標(biāo)模型,最后得出信用分值。
二、指標(biāo)變量選擇和數(shù)據(jù)處理
(一)特征變量選擇和數(shù)據(jù)預(yù)處理
本文選擇了六大類共19個(gè)財(cái)務(wù)指標(biāo),具體包括營運(yùn)能力指標(biāo)、償債能力指標(biāo)、盈利能力指標(biāo)、財(cái)務(wù)杠桿指標(biāo)、流動(dòng)性指標(biāo)以及發(fā)展能力指標(biāo)。這六大類指標(biāo)都是與企業(yè)信用風(fēng)險(xiǎn)的高低有著較高的相關(guān)性的。本文數(shù)據(jù)來源于同花順網(wǎng)站中小板市場(chǎng)中988家公司的財(cái)務(wù)指標(biāo)數(shù)據(jù),其中ST企業(yè)違約風(fēng)險(xiǎn)為1,非ST違約風(fēng)險(xiǎn)為0。而后對(duì)數(shù)據(jù)樣本進(jìn)行了描述性統(tǒng)計(jì)和初步的處理。
(二)缺失值與異常值處理
從下頁表1可知,樣本數(shù)據(jù)缺失嚴(yán)重,且樣本量為988個(gè),所以本文采用眾數(shù)、均值、隨機(jī)森林模型來填補(bǔ)樣本缺失值,對(duì)于較為重要的特征變量,可根據(jù)樣本其他特征變量,用隨機(jī)森林模型預(yù)測(cè)缺失特征的值來補(bǔ)充樣本。此外,通過箱線圖尋找異常值并剔除,所得樣本數(shù)為491個(gè)。
三、特征變量篩選
(一)相關(guān)性檢驗(yàn)
根據(jù)數(shù)據(jù)的初步處理,得到491個(gè)樣本,19個(gè)特征變量,由于本文所采用的數(shù)據(jù)為財(cái)務(wù)指標(biāo)數(shù)據(jù),數(shù)據(jù)指標(biāo)中可能存在多重共線性,所以本文可根據(jù)變量之間的相關(guān)系數(shù),初步剔除相關(guān)性較強(qiáng)的指標(biāo),將相關(guān)系數(shù)大于0.5的指標(biāo)進(jìn)行剔除,共刪除流動(dòng)資產(chǎn)周轉(zhuǎn)率、速動(dòng)比率、權(quán)益負(fù)債比、凈資產(chǎn)收益率、成本費(fèi)用利潤率等5個(gè)指標(biāo)。
(二)決策樹深度篩選特征變量
決策樹是一個(gè)通過樹狀結(jié)構(gòu)模擬人進(jìn)行決策的過程的方法,根節(jié)點(diǎn)后的每個(gè)分枝代表一個(gè)新的決策事件,而每個(gè)葉子代表一個(gè)最終判定所屬的類別。而決策事件的多少即為深度,不同的深度確定不同特征的重要性,本文基于改變決策樹深度(max_depth=3-20)以確定特征變量對(duì)信用違約的貢獻(xiàn)程度,從而得出存貨周轉(zhuǎn)率、資產(chǎn)現(xiàn)金率、流動(dòng)比率等12個(gè)特征。
四、邏輯回歸模型與評(píng)估
(一)特征變量分箱,計(jì)算WOE
要得出企業(yè)的信用分值,首先要知道每一特征在不同區(qū)間上所對(duì)應(yīng)的分值,即分箱,根據(jù)特征變量的取值,將不同樣本分成不同的區(qū)間。本文為簡(jiǎn)化算法,特將每一個(gè)特征變量等距分成5個(gè)區(qū)間,即5個(gè)箱子,且區(qū)間長(zhǎng)度相同,并將區(qū)間擴(kuò)展到正無窮和負(fù)無窮。此外,為計(jì)算各箱的WOE值,必須保證每個(gè)箱中標(biāo)簽均包含0和1,將無0和1的箱子與上一箱子合并,直到箱子中均含0和1為止。在每一個(gè)特征分箱后的每一個(gè)箱,將WOE計(jì)算完畢后,將其映射到數(shù)據(jù)樣本中,進(jìn)行模型判別。
(二)邏輯回歸函數(shù)
將上述樣本數(shù)帶入邏輯回歸函數(shù),回歸結(jié)果顯示,截距-3.12895206,特征變量系數(shù)為-0.290402、-0.5816、0.19818等12個(gè)系數(shù)。
(三)模型評(píng)估
基于該模型為機(jī)器學(xué)習(xí)所訓(xùn)練的模型,應(yīng)檢驗(yàn)其模型的好壞。準(zhǔn)確度等于預(yù)測(cè)值與真實(shí)值相同的個(gè)數(shù)比上預(yù)測(cè)樣本數(shù),根據(jù)模型結(jié)果顯出正確度為96.6%,從準(zhǔn)確得分來說,該模型具有較好的預(yù)測(cè)能力,但是由于樣本的不均衡,如果更想知道的是模型對(duì)于信用風(fēng)險(xiǎn)較大企業(yè)的預(yù)測(cè)能力,那么應(yīng)該選擇ROC曲線,其能較好地評(píng)估這一能力。ROC曲線是在不同命中和不同錯(cuò)誤率下所繪制而成的。AUC指ROC曲線下方的面積,面積越大,模型效果越好。一般來說,AUC值大于0.75就意味著可以接受模型,大于0.85就表示模型效果好。圖1中,AUC值為0.79,說明模型可以接受。