国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

企業(yè)信用評(píng)級(jí)計(jì)算模型綜述

2023-08-25 01:08:14田一擎程曦馮博靖
關(guān)鍵詞:企業(yè)信用評(píng)級(jí)信用

田一擎,程曦,馮博靖*

1. 湖南大學(xué),工商管理學(xué)院,湖南 長(zhǎng)沙 410000

2. 中國(guó)科學(xué)院自動(dòng)化研究所,北京 100190

引 言

企業(yè)信用評(píng)級(jí)是評(píng)估企業(yè)按照合同如期履行義務(wù)的意愿和能力,評(píng)級(jí)的目的在于評(píng)估企業(yè)作為債務(wù)人的違約風(fēng)險(xiǎn)大小。被評(píng)級(jí)企業(yè)主要分為非金融公司(如工商、建筑、交通、旅游等公司)和金融公司(如保險(xiǎn)、證券公司等)。后者由于資金流轉(zhuǎn)和組織架構(gòu)的特殊性,其信用風(fēng)險(xiǎn)往往更大,評(píng)級(jí)工作更加困難。

目前,國(guó)際上最知名的信用評(píng)級(jí)機(jī)構(gòu)有3 家,分別是標(biāo)準(zhǔn)普爾、穆迪和惠譽(yù)。標(biāo)準(zhǔn)普爾有160 余年歷史,在行業(yè)內(nèi)處于領(lǐng)先地位并扮演著領(lǐng)導(dǎo)者的角色,評(píng)級(jí)范圍涵蓋了全球126 個(gè)國(guó)家和地區(qū)。標(biāo)準(zhǔn)普爾在2019 年進(jìn)入中國(guó)信用評(píng)級(jí)市場(chǎng),按周發(fā)布對(duì)各國(guó)和各地區(qū)主權(quán)信用評(píng)級(jí)的更新。穆迪有120余年歷史,由著名公司鄧白氏拆分而來(lái),評(píng)級(jí)范圍涵蓋了全球一百多個(gè)國(guó)家和地區(qū),在2001 年進(jìn)入中國(guó)市場(chǎng)?;葑u(yù)有100 余年歷史,規(guī)模相較于標(biāo)準(zhǔn)普爾和穆迪稍小,評(píng)級(jí)范圍涵蓋了全球70 多個(gè)國(guó)家和地區(qū),于2020 年獲準(zhǔn)進(jìn)入中國(guó)市場(chǎng)。除了這3 家機(jī)構(gòu)以外,中國(guó)的評(píng)級(jí)機(jī)構(gòu)也在不斷發(fā)展,如大公國(guó)際、中誠(chéng)信、東方金誠(chéng)等。不過(guò)中國(guó)的評(píng)級(jí)機(jī)構(gòu)起步較晚,在完善程度、評(píng)級(jí)指標(biāo)構(gòu)建的科學(xué)性等方面還有很大進(jìn)步空間。專家學(xué)者在構(gòu)建信用評(píng)級(jí)模型時(shí)用到的數(shù)據(jù)庫(kù)并不單一,表1 展示了常用的一些數(shù)據(jù)庫(kù)。

表1 企業(yè)信用評(píng)級(jí)常用數(shù)據(jù)庫(kù)Table 1 The main databases of corporate credit rating

雖然當(dāng)下企業(yè)信用評(píng)級(jí)數(shù)據(jù)庫(kù)不統(tǒng)一且缺乏統(tǒng)一的基準(zhǔn),然而大部分人工評(píng)級(jí)和算法評(píng)級(jí)方法都是基于常用的一些數(shù)據(jù)庫(kù)構(gòu)建企業(yè)信用評(píng)級(jí)指標(biāo),如WIND、Bloomberg 等。人工評(píng)級(jí)方法發(fā)展早且理論完善應(yīng)用廣泛。雖然當(dāng)下主觀評(píng)級(jí)方法綜合了多方分析結(jié)果且經(jīng)歷多次迭代,但該方法主觀性依然很強(qiáng)且受分析師個(gè)人偏好影響大,耗費(fèi)大量人力物力,多次迭代耗時(shí)間長(zhǎng)導(dǎo)致評(píng)級(jí)結(jié)果不能實(shí)時(shí)反映公司信用。而算法評(píng)級(jí)相對(duì)來(lái)講實(shí)時(shí)性強(qiáng)成本低,評(píng)級(jí)結(jié)果客觀可復(fù)現(xiàn)。但當(dāng)下算法評(píng)級(jí)不能完全替代專家知識(shí),對(duì)定性信息的理解也不充分,未來(lái)還有很大發(fā)展空間。

企業(yè)信用評(píng)級(jí)作為市場(chǎng)經(jīng)濟(jì)條件下的社會(huì)中介服務(wù),在維護(hù)社會(huì)經(jīng)濟(jì)秩序中起了重要作用。企業(yè)應(yīng)當(dāng)建立在對(duì)客戶信用狀況充分了解的前提下發(fā)展客戶。企業(yè)一味地追求大量訂單難免會(huì)收到壞賬。信用評(píng)級(jí)可以幫助金融從業(yè)者規(guī)避風(fēng)險(xiǎn),為投資者和合伙人提供客觀公正的資信信息,減小了企業(yè)的經(jīng)營(yíng)管理壓力[1]。資本市場(chǎng)管理部門為了維持資本秩序的穩(wěn)定需要對(duì)企業(yè)進(jìn)行審查。企業(yè)信用評(píng)級(jí)提升了經(jīng)濟(jì)管理部門對(duì)企業(yè)的監(jiān)管能力,弘揚(yáng)了企業(yè)的社會(huì)知名度。

與企業(yè)信用評(píng)級(jí)相似的是債券信用評(píng)級(jí)。雖然二者都是為了促進(jìn)資源的有效配置,減少評(píng)級(jí)對(duì)象和投資者之間的信息不對(duì)稱,但其評(píng)級(jí)對(duì)象不一樣,前者面向的是商業(yè)銀行或相關(guān)監(jiān)管機(jī)構(gòu),后者面向的是債券投資者。由于債券評(píng)級(jí)機(jī)構(gòu)的評(píng)級(jí)耗時(shí)長(zhǎng),經(jīng)歷信息收集、處理、二次評(píng)級(jí)、跟蹤評(píng)級(jí)等多個(gè)階段,信用風(fēng)險(xiǎn)的變更往往反應(yīng)不及時(shí)[2],建立一套自己的信用評(píng)級(jí)體系對(duì)金融機(jī)構(gòu)來(lái)說(shuō)非常重要。然而,評(píng)級(jí)機(jī)構(gòu)做一次完整細(xì)致的評(píng)級(jí)需要耗費(fèi)大量的人力物力財(cái)力和時(shí)間[3],這對(duì)于大部分企業(yè)以及金融從業(yè)者來(lái)說(shuō)難以承擔(dān)。所以構(gòu)建精準(zhǔn)的企業(yè)信用評(píng)級(jí)模型對(duì)于投資者來(lái)說(shuō)很有價(jià)值。

當(dāng)下已經(jīng)有許多專家學(xué)者對(duì)企業(yè)信用評(píng)級(jí)模型做了細(xì)致的研究,但是關(guān)于這類模型的整體性綜述卻相對(duì)不足,對(duì)近年來(lái)基于神經(jīng)網(wǎng)絡(luò)的評(píng)級(jí)模型的綜述更是寥寥無(wú)幾。本文綜合了傳統(tǒng)的統(tǒng)計(jì)學(xué)模型、基于機(jī)器學(xué)習(xí)的模型以及近年來(lái)話題度很高的基于神經(jīng)網(wǎng)絡(luò)的評(píng)級(jí)模型對(duì)企業(yè)信用評(píng)級(jí)展開(kāi)描述。

1 企業(yè)信用評(píng)級(jí)的統(tǒng)計(jì)學(xué)模型

在金融領(lǐng)域,大多數(shù)用于評(píng)估企業(yè)信用風(fēng)險(xiǎn)的傳統(tǒng)模型都使用了基礎(chǔ)的統(tǒng)計(jì)方法,由企業(yè)破產(chǎn)預(yù)測(cè)模型衍生而來(lái)。這類模型大部分基于企業(yè)財(cái)務(wù)指標(biāo)(如資產(chǎn)負(fù)債結(jié)構(gòu)、現(xiàn)金流量、盈利能力、資產(chǎn)流動(dòng)性等)來(lái)構(gòu)建評(píng)級(jí)指標(biāo)體系,如表2 所示,之后用統(tǒng)計(jì)方法分析這些指標(biāo)體系特征來(lái)完成企業(yè)信用評(píng)級(jí)分類。

表2 企業(yè)信用評(píng)級(jí)常用指標(biāo)Table 2 The main metrics of corporate credit rating

常用的統(tǒng)計(jì)模型如下:

1.1 ZETA

ZETA 模型最初用來(lái)評(píng)估公司破產(chǎn)風(fēng)險(xiǎn),之后在信用評(píng)級(jí)領(lǐng)域也有廣泛的應(yīng)用。評(píng)價(jià)指標(biāo)體系基于資產(chǎn)收益率、收益穩(wěn)定性、債務(wù)償付能力、累計(jì)盈利能力、流動(dòng)性、資本化程度和規(guī)模這7 個(gè)維度構(gòu)建。文獻(xiàn)[4]結(jié)合了判別分析算法,并引入先驗(yàn)概率進(jìn)行了信用價(jià)值分析。然而ZETA 模型的7 個(gè)指標(biāo)是固定不變的,不能涵蓋所有評(píng)級(jí)要素。之后廣泛使用的特征工程本質(zhì)上就是在尋找適合描述評(píng)級(jí)問(wèn)題的要素指標(biāo)。

1.2 層次分析法

層次分析法(Analytic Hierarchy Process, AHP)是指將決策分解成多個(gè)層次從而進(jìn)行定性和定量分析的方法,常被用于企業(yè)信用評(píng)級(jí)[5],目前被廣泛用于確定參數(shù)的相對(duì)重要性。為了平衡AHP 方法的主觀性,文獻(xiàn)[6]結(jié)合了客觀的數(shù)據(jù)包絡(luò)分析模型(DEA)對(duì)信用水平進(jìn)行評(píng)估。特別是對(duì)于難以完全定量分析的復(fù)雜系統(tǒng),層次分析法的優(yōu)勢(shì)明顯。然而層次分析法需要決策者對(duì)指標(biāo)兩兩比較,判斷其相對(duì)重要性,不僅引入了更多的主觀要素,而且在指標(biāo)數(shù)量多的時(shí)候很難人為判斷。

1.3 多元判別分析

多元判別分析(Multiple Discriminant Analysis,MDA)是用一種根據(jù)數(shù)據(jù)集分析新的數(shù)據(jù)屬于哪一類的統(tǒng)計(jì)方法,曾被廣泛應(yīng)用于信用評(píng)分模型[7]。按照判別準(zhǔn)則不同,判別方法可以分為距離判別法、Fisher 判別法、Bayes 判別法、逐步判別法等。Reichert 等[8]指出,大部分MDA 模型都假定變量以多元正態(tài)分布。如果數(shù)據(jù)的真實(shí)分布顯著偏離正態(tài),分類結(jié)果會(huì)嚴(yán)重錯(cuò)誤。Z-score 模型是基于MDA 創(chuàng)建的,最初被用來(lái)進(jìn)行企業(yè)破產(chǎn)分析,后來(lái)也用于信用風(fēng)險(xiǎn)度量[9]。與前兩種方法相比,可以發(fā)現(xiàn)MDA 方法更多地考慮了數(shù)據(jù)的科學(xué)性,更少地受到分析師主觀的影響。然而MDA 的分類結(jié)果往往在數(shù)據(jù)集較小時(shí)更精確,難以招架如今日益增加的評(píng)級(jí)需求。此外,MDA 模型沒(méi)有使用統(tǒng)計(jì)上獨(dú)立于估計(jì)樣本的數(shù)據(jù)來(lái)驗(yàn)證評(píng)級(jí)的準(zhǔn)確性,導(dǎo)致驗(yàn)證結(jié)果出現(xiàn)偏差。MDA 模型假設(shè)所有類別的方差-協(xié)方差矩陣相等,這與現(xiàn)實(shí)不符。

1.4 多元自適應(yīng)回歸

多元自適應(yīng)回歸(Multivariate Adaptive Regression Splines, MARS)[10]也被用于信用評(píng)級(jí)。MARS是由逐步線性回歸衍生而來(lái)。相比較于適合小數(shù)據(jù)集的MDA 模型,MARS 可以精確快捷地處理大規(guī)模企業(yè)信用評(píng)級(jí)問(wèn)題。更可觀的是,MARS 還能夠捕捉變量之間的非線性和交互作用。不過(guò)相較于其他模型而言,MARS 在企業(yè)信用評(píng)級(jí)上用的并不多。

1.5 邏輯回歸

邏輯回歸模型(Logistic Regression, LR)是以線性回歸理論為支持的非線性模型,常被用于處理二分類問(wèn)題。Laitinen 等[11]使用邏輯回歸和線性回歸模型來(lái)分析公司信用風(fēng)險(xiǎn)。WEST 等[12]使用經(jīng)典因子分析與多元邏輯回歸相結(jié)合,構(gòu)建了一個(gè)商業(yè)銀行預(yù)警系統(tǒng)。LR 作為一個(gè)廣泛使用的分類算法,在各領(lǐng)域都有應(yīng)用,優(yōu)點(diǎn)在于速度快,可以進(jìn)行非線性分類,也常常與其他算法結(jié)合,用于信用評(píng)級(jí)問(wèn)題。

1.6 其他統(tǒng)計(jì)模型

文獻(xiàn)[13]同樣將定性指標(biāo)和定量指標(biāo)相結(jié)合建立小企業(yè)信用評(píng)價(jià)指標(biāo)體系,指標(biāo)權(quán)重由增量聚類算法產(chǎn)生。實(shí)驗(yàn)證明了該聚類算法適合高維特征。Shi等[14]使用了Pearson 相關(guān)分析和F 檢驗(yàn)顯著性判別的方法,篩選關(guān)鍵特征,從而兼顧分類精度與計(jì)算時(shí)間。由于模糊優(yōu)劣解距離(TOPSIS)方法的簡(jiǎn)單性和排序能力,該方法也被用作企業(yè)信用評(píng)級(jí)[15]。

關(guān)于統(tǒng)計(jì)學(xué)習(xí)方法,基于ZETA 模型由于指標(biāo)固定,所以結(jié)果上魯棒性高且可復(fù)現(xiàn)性強(qiáng);然而AHP 方法由于引入分析師對(duì)指標(biāo)重要性的排序,受人為因素影響大。MDA、MARS 和LR 等方法的優(yōu)點(diǎn)在于理論體系較為完備,邏輯性強(qiáng),得到的結(jié)論比較清晰,并且容易操作。但以統(tǒng)計(jì)學(xué)為基礎(chǔ)的理論和方法都存在前提約束條件較多的缺點(diǎn),在實(shí)際評(píng)級(jí)工作中,適用范圍受到限制,具有局限性。

縱觀整個(gè)基于統(tǒng)計(jì)的模型的歷史可以發(fā)現(xiàn),除了少數(shù)幾個(gè)傳統(tǒng)模型外,所有模型都擅長(zhǎng)處理線性關(guān)系,而不是非線性關(guān)系。大型評(píng)級(jí)機(jī)構(gòu)往往重視分析師在確定評(píng)級(jí)模型參數(shù)或直接信用評(píng)級(jí)時(shí)主觀判斷時(shí)的重要性。盡管這些傳統(tǒng)方法基于對(duì)數(shù)據(jù)的統(tǒng)計(jì)和分析,但它們一直受到人為因素對(duì)企業(yè)信用評(píng)級(jí)的影響。此外,傳統(tǒng)模型(如LR, KMV)在做評(píng)級(jí)任務(wù)時(shí),往往對(duì)數(shù)據(jù)集的參數(shù)分布做了假設(shè)。這些假設(shè)可能與真實(shí)數(shù)據(jù)分布相悖,而機(jī)器學(xué)習(xí)模型對(duì)這些問(wèn)題的解決提供了新的思路。

2 企業(yè)信用評(píng)級(jí)的機(jī)器學(xué)習(xí)模型

2.1 支持向量機(jī)

支持向量機(jī)(Support Vector Machine, SVM)是信用評(píng)級(jí)領(lǐng)域最常用的模型之一。Huang 等人[3]使用支持向量機(jī)對(duì)信用評(píng)級(jí)分析市場(chǎng)進(jìn)行了比較研究,認(rèn)為SVM 比LR 模型具有更高的準(zhǔn)確性。研究證明使用小而準(zhǔn)確的指標(biāo)數(shù)據(jù)集對(duì)信貸結(jié)果進(jìn)行評(píng)級(jí),甚至比包含各種指標(biāo)的金融數(shù)據(jù)集更準(zhǔn)確。該研究還對(duì)美國(guó)和中國(guó)臺(tái)灣省評(píng)級(jí)機(jī)構(gòu)的相關(guān)數(shù)據(jù)指標(biāo)進(jìn)行了比較和分析。研究發(fā)現(xiàn),前者更關(guān)注公司的規(guī)模,后者更關(guān)注公司的盈利能力。這與美國(guó)公司倡導(dǎo)高杠桿操作的方式不謀而合。與以往傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)模型不同,SVM 更強(qiáng)調(diào)評(píng)級(jí)方式的客觀性,金融變量比機(jī)構(gòu)分析師更能決定評(píng)級(jí)結(jié)果。特征工程的應(yīng)用往往可以提升SVM 的準(zhǔn)確度,這個(gè)特質(zhì)拔高了SVM 的上限,但同時(shí)也限制了SVM 在信用評(píng)級(jí)領(lǐng)域的發(fā)展。

支持向量機(jī)最初是為二元分類而設(shè)計(jì)的,對(duì)企業(yè)來(lái)講,信用評(píng)級(jí)并沒(méi)有絕對(duì)的好與壞,簡(jiǎn)單的二分類并不適用于企業(yè)信用評(píng)級(jí)問(wèn)題。模糊支持向量機(jī)[16]為正負(fù)類別的各個(gè)樣本分配了各自的隸屬度,從而使得SVM 具有更強(qiáng)的泛化能力。之后隨著多類支持向量機(jī)的發(fā)展,“一對(duì)全”“一對(duì)一”和有向無(wú)環(huán)圖SVM(DAGSVM)被用在多分類上。文獻(xiàn)[17]使用以上3 種多分類SVM 的方法進(jìn)行企業(yè)債券評(píng)級(jí),得到了DAGSVM 性能最好的結(jié)論。為了實(shí)現(xiàn)非線性可分樣本的分類,徑向基函數(shù)(RBF)核函數(shù)被用來(lái)對(duì)樣本升維。該工作[18]使用了帶有RBF 核函數(shù)的SVM 進(jìn)行企業(yè)信用評(píng)級(jí)分類。RBF 核函數(shù)的最優(yōu)參數(shù)值通過(guò)網(wǎng)格搜索技術(shù)來(lái)尋找。實(shí)驗(yàn)表示[16],帶有合適的核和隸屬度生成方法的SVM 比標(biāo)準(zhǔn)支持向量機(jī)和模糊支持向量機(jī)在信用評(píng)級(jí)問(wèn)題上的準(zhǔn)確度更高。

然而企業(yè)信用評(píng)級(jí)不是一個(gè)簡(jiǎn)單的分類問(wèn)題,評(píng)級(jí)結(jié)果是有高低之分的。文獻(xiàn)[2]考慮到信用評(píng)級(jí)的獨(dú)特順序,提出了基于有序成對(duì)劃分策略的支持向量機(jī)。為了解決模型參數(shù)優(yōu)化問(wèn)題,遺傳算法也被引入SVM。GA-SVM[19]使用網(wǎng)格搜索設(shè)置模型參數(shù)并用遺傳算法對(duì)參數(shù)進(jìn)行優(yōu)化。然而,SVM 始終是一個(gè)黑盒問(wèn)題,理解SVM 的原理會(huì)提高模型的實(shí)用性。為了提高SVM 的可解釋性,CRCR-SVM[20]結(jié)合了傳統(tǒng)的規(guī)則學(xué)習(xí)方法,通過(guò)一致區(qū)域覆蓋減少的規(guī)則進(jìn)行SVM 學(xué)習(xí)。

此外,SVM 常被用來(lái)進(jìn)行特征選擇工作。由于指標(biāo)之間互相依賴,所以特征選擇的過(guò)程非常曲折。公司信用評(píng)級(jí)取決于多變量因素。Fisher 是常用的特征選擇方法。該方法易于實(shí)現(xiàn),執(zhí)行快速,但沒(méi)有考慮到變量和分類器之間的相互作用。另外的雙樣本獨(dú)立性指標(biāo),如KS 檢驗(yàn)(Kolmogorov-Smirnov test)和卡方檢驗(yàn),通常會(huì)獲得與Fisher 得分相似的結(jié)果。為了避免特征排序方法所需的額外校準(zhǔn)步驟,Maldonado 等[21]使用兩種SVM 方法(l1-MISVM,LP-MISVM)來(lái)獲取銀行信用貸款數(shù)據(jù)的最佳特征子集。在構(gòu)建分類器時(shí),該方法會(huì)考慮所有變量交互作用。文獻(xiàn)[17]提出特征選擇可以進(jìn)一步提升SVM 的泛化性能。相比較于遺傳規(guī)劃和決策樹(shù)分類器,SVM 的輸入精度對(duì)大量的輸入特征的依賴性更低[19]。

2.2 決策樹(shù)

決策樹(shù)(DT)是一種可快速構(gòu)建、可解釋性強(qiáng)的算法。ID3 和梯度提升迭代決策樹(shù)算法都用于企業(yè)信用評(píng)級(jí),后者更有效[22]。結(jié)合了集成學(xué)習(xí)與決策規(guī)則方法,相關(guān)調(diào)整決策森林[23]平衡了模型的準(zhǔn)確性與可解釋性。該方法使用決策樹(shù)作為基分類器,選擇了18 個(gè)對(duì)于信用風(fēng)險(xiǎn)評(píng)級(jí)來(lái)說(shuō)最重要的特征。穆迪的KMV 模型(Credit Monitor Model)基于金融理論和違約概率,是著名的信用評(píng)級(jí)分析模型?;旌螷MV 模型[24]將KMV 與RF 和粗糙集理論(RST)結(jié)合,以提高信用評(píng)級(jí)的準(zhǔn)確率。RST 不對(duì)數(shù)據(jù)的分布做任何假設(shè),適用于定量和定性分析。在決策過(guò)程涉及不確定的模糊數(shù)據(jù)時(shí),RST 在解決決策支持問(wèn)題方面成果顯著。首先,混合KMV 模型使用KMV 來(lái)進(jìn)行變量預(yù)測(cè);其次,RF 選擇變量作為RST 模型的輸入;最后,模型以if-then 規(guī)則的形式生成結(jié)果,過(guò)程透明且易于決策者理解。但是該方法必須對(duì)一些參數(shù)進(jìn)行優(yōu)化,從而構(gòu)成基分類器。然而可以發(fā)現(xiàn),由于金融數(shù)據(jù)的高維性、稀疏性和強(qiáng)相關(guān)性,DT 模型的性能受到限制,在之后的研究中往往被作為信用評(píng)級(jí)模型的基線,或者與其他算法結(jié)合。

2.3 集成學(xué)習(xí)

集成學(xué)習(xí)不獨(dú)立于其他機(jī)器學(xué)習(xí)算法,它是一種通過(guò)結(jié)合多個(gè)基學(xué)習(xí)器共同完成學(xué)習(xí)任務(wù)的機(jī)器學(xué)習(xí)方法。由于集成學(xué)習(xí)在分類任務(wù)上具有突出表現(xiàn),所以該算法在企業(yè)信用評(píng)級(jí)方面也有了長(zhǎng)足的發(fā)展。集成學(xué)習(xí)的基本思想是當(dāng)我們做出重要決定時(shí),需要參考從不同角度提出的多方面的意見(jiàn)。對(duì)多角度意見(jiàn)進(jìn)行加權(quán)最終做出的決策往往比只參考單方面意見(jiàn)做出的決策更加合適。所以,基學(xué)習(xí)器在具有一定的準(zhǔn)確性的基礎(chǔ)上,彼此間應(yīng)當(dāng)具有多樣性。當(dāng)基學(xué)習(xí)器給出的意見(jiàn)達(dá)到互補(bǔ)時(shí),集成學(xué)習(xí)算法通??梢匀〉酶玫男Ч?。Abellan 和Castellano 提出的信用決策樹(shù)改變了處理不精確性的方式,使用不精確概率和不確定性度量來(lái)構(gòu)建模型,使基分類器變得相對(duì)不穩(wěn)定。不穩(wěn)定意味著很小的訓(xùn)練數(shù)據(jù)的變化會(huì)使模型產(chǎn)生較大的差異,導(dǎo)致基分類器具有多樣性,非常適合在集成學(xué)習(xí)中使用[25]。

近年來(lái),神經(jīng)網(wǎng)絡(luò)方法結(jié)合集成學(xué)習(xí),被很多專家應(yīng)用在企業(yè)信用評(píng)級(jí)任務(wù)上。Donate 等[26]提出在企業(yè)信用評(píng)級(jí)任務(wù)上,集成了多個(gè)神經(jīng)網(wǎng)絡(luò)的模型優(yōu)于只使用單個(gè)神經(jīng)網(wǎng)絡(luò),對(duì)多個(gè)基學(xué)習(xí)器進(jìn)行適應(yīng)度加權(quán)的集成策略比非加權(quán)策略更具有準(zhǔn)確性,證明了應(yīng)用集成算法的神經(jīng)網(wǎng)絡(luò)方法的巨大潛力。為了保證基學(xué)習(xí)器之間的差異性,Yu 等[27]提出的模型在選擇自適應(yīng)神經(jīng)網(wǎng)絡(luò)(ANN)時(shí)采用了去最大相關(guān)性算法,再將單個(gè)基學(xué)習(xí)器的決策值從正負(fù)無(wú)窮縮放到0 和1 之間,之后分別使用最大、最小、中值、平均和產(chǎn)品策略將基分類結(jié)果集成。其中,產(chǎn)品策略的性能最好,其次是均值策略,導(dǎo)致該結(jié)果的原因尚待討論。

集成學(xué)習(xí)常用的算法有多數(shù)投票、加權(quán)平均、Baggin、Boosting、Random Subspace、Decorate、Rotation Forest 等。多數(shù)投票算法最為常用,但是忽略了某些少數(shù)的神經(jīng)網(wǎng)絡(luò)有時(shí)確實(shí)會(huì)產(chǎn)生正確結(jié)果的事實(shí),默認(rèn)每個(gè)神經(jīng)網(wǎng)絡(luò)的置信度都相同。在公司信用評(píng)級(jí)任務(wù)中,可用的樣本數(shù)據(jù)往往是有限的,而bagging 算法通過(guò)從原始訓(xùn)練集隨機(jī)置換抽樣子集的方法,對(duì)整體數(shù)據(jù)集在統(tǒng)計(jì)意義上生成更多的估計(jì),一定程度上彌補(bǔ)了訓(xùn)練數(shù)據(jù)有限的缺陷,通??梢愿倪M(jìn)分類效果[27]。此外,企業(yè)信用評(píng)級(jí)數(shù)據(jù)類別嚴(yán)重不均衡,如圖1 所示,等級(jí)很高或者很低的都相對(duì)較少。Brown 和Mues 提出隨機(jī)森林(RF)和梯度提升算法在緩解該問(wèn)題時(shí)性能較好。然而He等[28]提出在解決企業(yè)信用評(píng)級(jí)數(shù)據(jù)不均衡問(wèn)題時(shí),RF 和梯度提升算法的模型的參數(shù)有待進(jìn)一步優(yōu)化。他們擴(kuò)展了級(jí)聯(lián)平衡方法,基于訓(xùn)練數(shù)據(jù)的不平衡率生成可調(diào)的平衡子集,構(gòu)建了以RF 和XGBoost作為基分類器的三階段集成模型。使用疊加生成前一層的預(yù)測(cè)結(jié)果,作為后一層的新解釋特征,基分類器的參數(shù)通過(guò)粒子群優(yōu)化進(jìn)行優(yōu)化。特征工程也被用于神經(jīng)網(wǎng)絡(luò)集成學(xué)習(xí)方法[29]??紤]到歷史財(cái)務(wù)數(shù)據(jù)和信用評(píng)級(jí)對(duì)當(dāng)前信用評(píng)級(jí)的影響,Wang等[30]構(gòu)建了一個(gè)經(jīng)典的基于集成學(xué)習(xí)的并行神經(jīng)網(wǎng)絡(luò)(PANNs),擴(kuò)展了特征空間,其中視差和絕對(duì)值波動(dòng)率特征可以更好地預(yù)測(cè)企業(yè)信用評(píng)級(jí)。

圖1 典型行業(yè)的企業(yè)信用評(píng)級(jí)分布圖Fig.1 Distribution of corporate credit rating

然而,如何決定集成學(xué)習(xí)方法中基分類器的個(gè)數(shù)和組合,使它更適合企業(yè)信用評(píng)級(jí)問(wèn)題,依然有待研究。集成學(xué)習(xí)集合了許多基分類器,其訓(xùn)練時(shí)間也是指數(shù)級(jí)增長(zhǎng),基分類器的數(shù)量與訓(xùn)練時(shí)間的分配問(wèn)題值得研究者們?cè)谖磥?lái)權(quán)衡。雖然一定程度上結(jié)合了多個(gè)基分類器的模型可以從多方面考慮問(wèn)題,但是集成策略也很難同時(shí)適合多種基分類器,如何提高包含多種基分類器模型的性能是未來(lái)集成學(xué)習(xí)方法的研究方向。Wang 等[30]的實(shí)驗(yàn)結(jié)果表明,有時(shí)候基于神經(jīng)網(wǎng)絡(luò)的集成模型效果不隨著數(shù)據(jù)量的增加而顯著增強(qiáng),一種可能的解釋是更多財(cái)務(wù)數(shù)據(jù)會(huì)引入更多的噪聲。在今后的研究中,可以通過(guò)降低噪聲得到更有用的數(shù)據(jù)集來(lái)提高預(yù)測(cè)精度。

2.4 其他機(jī)器學(xué)習(xí)模型

文獻(xiàn)[31]基于知識(shí)生成決策規(guī)則,使用粗糙集實(shí)現(xiàn)兩個(gè)混合模型,對(duì)全球銀行業(yè)的信用評(píng)級(jí)進(jìn)行分類。Chai 等[32]針對(duì)小企業(yè)進(jìn)行信用評(píng)級(jí),發(fā)現(xiàn)對(duì)小企業(yè)來(lái)講,非金融因素的影響大于財(cái)務(wù)因素。在構(gòu)建信用指標(biāo)體系時(shí),先使用三角模糊數(shù)將定性指標(biāo)轉(zhuǎn)化為數(shù)值,再采用偏相關(guān)分析(PCA)和概率回歸算法消除冗余指標(biāo)。該工作利用TOPSIS 算法計(jì)算信用評(píng)分,再使用模糊C-means 對(duì)小企業(yè)信用評(píng)分進(jìn)行聚類。

在常用的信用評(píng)級(jí)機(jī)器學(xué)習(xí)模型中,決策樹(shù)方法是一種非參數(shù)統(tǒng)計(jì)學(xué)習(xí)方法,其特點(diǎn)在于提升生成的分類樹(shù)的魯棒性和泛化能力。最近鄰方法基于度量測(cè)度,特點(diǎn)在于將待評(píng)級(jí)企業(yè)歸類于與其指標(biāo)最相近的訓(xùn)練集中指標(biāo)對(duì)應(yīng)的信用等級(jí)。不需要評(píng)級(jí)指標(biāo)數(shù)據(jù)的先驗(yàn)概率分布信息或假設(shè)信息是最近鄰方法的顯著優(yōu)勢(shì)。此外,基于特征選擇、數(shù)據(jù)降維的主成分分析方法等在解決評(píng)級(jí)指標(biāo)數(shù)據(jù)量的快速增加方面有很大優(yōu)勢(shì)。而集成學(xué)習(xí)得到的混合模型總體來(lái)講比單一模型評(píng)級(jí)精度更好,其中一個(gè)可能的原因在于集成方法針對(duì)不同數(shù)據(jù)集采用不同的模型建模,一定程度上解決了評(píng)級(jí)中的不平衡問(wèn)題。

縱觀基于機(jī)器學(xué)習(xí)的模型可以發(fā)現(xiàn),雖然這類模型相較于之前的統(tǒng)計(jì)模型來(lái)講,更強(qiáng)調(diào)客觀性,卻也在一定程度上只利用了量化數(shù)據(jù)而丟棄了定性數(shù)據(jù)帶來(lái)的信息增益。而企業(yè)信用評(píng)級(jí)問(wèn)題中,定性數(shù)據(jù)如文本等包含了大量風(fēng)險(xiǎn)信息。此外,這類模型過(guò)于依賴特征工程,好的特征會(huì)給模型效果帶來(lái)顯著提升。神經(jīng)網(wǎng)絡(luò)模型對(duì)這些問(wèn)題提供了新的思路。

3 企業(yè)信用評(píng)級(jí)的神經(jīng)網(wǎng)絡(luò)模型

3.1 早期的神經(jīng)網(wǎng)絡(luò)

關(guān)于企業(yè)信用評(píng)級(jí)問(wèn)題,在神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用之前,特征工程一直是金融工程的研究重點(diǎn)。在以前的機(jī)器學(xué)習(xí)算法中,使用特征工程獲得新特征往往比僅使用原始特征得到的評(píng)級(jí)結(jié)果更準(zhǔn)確。Chen 等[33]使用單方差分析的統(tǒng)計(jì)方法來(lái)選擇特征。盡管統(tǒng)計(jì)方法會(huì)提高訓(xùn)練集的分類精度,但也會(huì)帶來(lái)噪聲并導(dǎo)致過(guò)度擬合。然而,神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中賦予特征不同的權(quán)重,相當(dāng)于選擇了重要特征作為重點(diǎn)關(guān)注對(duì)象。Golbayani 等[34]發(fā)現(xiàn),當(dāng)使用所有財(cái)務(wù)變量作為輸入,并在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程中執(zhí)行特征工程時(shí),評(píng)級(jí)結(jié)果更準(zhǔn)確。與統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)方法相比,神經(jīng)網(wǎng)絡(luò)不假設(shè)數(shù)據(jù)分布。

早期的神經(jīng)網(wǎng)絡(luò)(如多層感知器(MLP))需要手動(dòng)調(diào)整學(xué)習(xí)速率,避免陷入局部極小值。與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比,MLP 能夠有效地處理高維數(shù)據(jù)和非線性關(guān)系。Brennan 等[35]利用財(cái)務(wù)報(bào)表中的信息建立了一個(gè)反向傳播神經(jīng)網(wǎng)絡(luò),對(duì)債券發(fā)行公司進(jìn)行評(píng)級(jí)。他們發(fā)現(xiàn),使用反向傳播神經(jīng)網(wǎng)絡(luò)得到的結(jié)果比傳統(tǒng)的統(tǒng)計(jì)方法準(zhǔn)確得多。Huang等[3]用反向傳播神經(jīng)網(wǎng)絡(luò)模型解釋企業(yè)信用評(píng)級(jí),并試圖從該模型中分析不同的輸入金融變量的相對(duì)重要性。Angelini 等[36]認(rèn)為數(shù)據(jù)分析和處理以及參數(shù)優(yōu)化是解決公司信用評(píng)級(jí)的重點(diǎn)難點(diǎn)。他們使用了經(jīng)典的前饋神經(jīng)網(wǎng)絡(luò)和具有自組織連接的前饋神經(jīng)網(wǎng)絡(luò)來(lái)評(píng)估信用風(fēng)險(xiǎn)。后者由四層的前饋網(wǎng)絡(luò)組成。輸入神經(jīng)元由3 個(gè)神經(jīng)元組成,每組連接到下一層的一個(gè)神經(jīng)元。然而,MLP 模型收斂速度慢而且訓(xùn)練過(guò)程不穩(wěn)定。傳統(tǒng)的神經(jīng)網(wǎng)模型更適合于二值分類,但在多類分類中精度較低。此外,傳統(tǒng)的反向傳播神經(jīng)網(wǎng)絡(luò)算法在網(wǎng)絡(luò)中訓(xùn)練大量參數(shù),容易產(chǎn)生過(guò)擬合,訓(xùn)練時(shí)間長(zhǎng)。文獻(xiàn)[2,3,18-19]認(rèn)為,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在信用評(píng)級(jí)方面不如SVM。Choi 等[37]認(rèn)為,這可能是因?yàn)镾VM 在避免過(guò)度擬合問(wèn)題方面更穩(wěn)健,而且與神經(jīng)網(wǎng)絡(luò)相比SVM 參數(shù)更少。Du等[38]提出遺傳算法可以對(duì)神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行修改和優(yōu)化,提高企業(yè)信用評(píng)級(jí)的準(zhǔn)確性。遺傳算法信用評(píng)級(jí)模型一定程度上緩解了BPNN 訓(xùn)練時(shí)間長(zhǎng)、收斂速度慢、陷入局部極小值可能性的問(wèn)題。

關(guān)于企業(yè)信用評(píng)級(jí)問(wèn)題,在經(jīng)典的前向反饋網(wǎng)絡(luò)模型的基礎(chǔ)上,許多其他的神經(jīng)網(wǎng)絡(luò)模型也相繼被提出。深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(DNN)由多個(gè)淺層神經(jīng)網(wǎng)絡(luò)組成。隨著網(wǎng)絡(luò)層數(shù)的增加,DNN 的梯度在訓(xùn)練中消失,優(yōu)化函數(shù)越來(lái)越容易陷入局部最優(yōu)解,訓(xùn)練效率大大降低。直到2006 年,Hinton 提出了分層訓(xùn)練受限玻爾茲曼機(jī)的方法,改善了上述問(wèn)題。這種結(jié)構(gòu)被稱為深度信念網(wǎng)絡(luò)(DBN)。Luo 等[39]首次使用DBN 對(duì)企業(yè)信用評(píng)分進(jìn)行了研究,分類性能優(yōu)于MLR、MLP 和SVM。此外,Kim 等[40]使用自適應(yīng)學(xué)習(xí)網(wǎng)絡(luò)(ALN)預(yù)測(cè)債券評(píng)級(jí)。文獻(xiàn)[41]使用概率神經(jīng)網(wǎng)絡(luò)(PNN)對(duì)美國(guó)公司和市政當(dāng)局進(jìn)行評(píng)級(jí)。數(shù)據(jù)預(yù)處理階段采用了基于相關(guān)性的方法和遺傳算法。他們發(fā)現(xiàn),概率神經(jīng)網(wǎng)絡(luò)比其他基準(zhǔn)分類器,如傳統(tǒng)神經(jīng)網(wǎng)絡(luò)(如前饋神經(jīng)網(wǎng)絡(luò)、RBF、數(shù)據(jù)處理多項(xiàng)式神經(jīng)網(wǎng)絡(luò))、級(jí)聯(lián)相關(guān)神經(jīng)網(wǎng)絡(luò)和統(tǒng)計(jì)方法(LR、MDA)有更準(zhǔn)確的結(jié)果。PNN是徑向基函數(shù)網(wǎng)絡(luò)的一個(gè)分支,屬于前饋網(wǎng)絡(luò)。它將密度函數(shù)估計(jì)和貝葉斯決策理論相結(jié)合,使判斷界面接近貝葉斯最佳判斷界面。它具有學(xué)習(xí)過(guò)程簡(jiǎn)單、訓(xùn)練速度快的優(yōu)點(diǎn)。

3.2 卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)(CNN)的出現(xiàn)是為了解決DNN的參數(shù)爆炸問(wèn)題。事實(shí)證明,在各種金融問(wèn)題上,尤其是在股票市場(chǎng)分析領(lǐng)域,CNN 明顯優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)[42-44]。CNN 主要由卷積層、池層和全連通層組成,并采用反向傳播算法進(jìn)行訓(xùn)練。據(jù)本文所知,Golbayani 等[34]是第一個(gè)使用CNN 進(jìn)行企業(yè)信用評(píng)級(jí)的。他們使用了包含dropout 和early stopping 算法的CNN 模型和二維卷積CNN2D 模型,這兩個(gè)模型都由兩個(gè)卷積層和兩個(gè)完全連接的層組成。它們之間的區(qū)別在于,在CNN 模型中,卷積核只朝一個(gè)方向移動(dòng),而在CNN2D 模型中,卷積核朝兩個(gè)方向移動(dòng)。該研究還提出了一個(gè)雙向方差分析模型,用于比較網(wǎng)絡(luò)體系結(jié)構(gòu)的多種性能。一個(gè)重要的事實(shí)是并非所有公司都能提供每年的信用評(píng)級(jí)分?jǐn)?shù)或財(cái)務(wù)信息。與MLP 相比,CNN 由于可以有效地調(diào)整特征權(quán)重,在處理缺失數(shù)據(jù)方面取得了良好的效果。

各種基于CNN 的衍生模型廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理領(lǐng)域,但它們不適用于金融場(chǎng)景。以往的研究只能提取企業(yè)數(shù)據(jù)的一維特征,受計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)ΧS特征處理方式的啟發(fā),F(xiàn)eng 等[45]構(gòu)建的CCR-CNN 模型為每個(gè)企業(yè)生成了一張包含每個(gè)二維財(cái)務(wù)信息的圖像,該圖像被輸入CNN 結(jié)構(gòu)并獲得分類結(jié)果。該模型的優(yōu)點(diǎn)在于捕捉了企業(yè)指標(biāo)之間獨(dú)特的二維關(guān)系特性和構(gòu)圖,這在以往的模型中是被忽視的。

然而,企業(yè)信用評(píng)級(jí)是動(dòng)態(tài)的并與時(shí)間因素密切相關(guān)。對(duì)于建立基于連續(xù)時(shí)間的企業(yè)信用評(píng)級(jí)模型,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一種合適的算法。

3.3 循環(huán)神經(jīng)網(wǎng)絡(luò)

盡管RNN 在時(shí)間序列問(wèn)題的研究中取得了顯著的成果,但反向傳播算法引起的梯度消失和梯度爆炸給RNN 的訓(xùn)練帶來(lái)了很大的困難。長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)是RNN 的一種變體,它通過(guò)選通機(jī)制將短時(shí)記憶和長(zhǎng)時(shí)記憶結(jié)合起來(lái),在一定程度上解決了梯度爆炸和消失的問(wèn)題。LSTM 具有較高的計(jì)算復(fù)雜度,RNN 的選通遞歸單元(GRU)可以節(jié)省計(jì)算成本,同時(shí)確保相當(dāng)高的精度。注意機(jī)制可以進(jìn)一步節(jié)省計(jì)算成本。其原理是通過(guò)分配權(quán)重,從大量信息中選擇對(duì)當(dāng)前任務(wù)更關(guān)鍵的信息。注意力分布是通過(guò)計(jì)算向量的相似性或相關(guān)性來(lái)實(shí)現(xiàn)的。目前,大多數(shù)基于注意力的模型都屬于編碼器-解碼器框架內(nèi)。例如transformer 的并行計(jì)算可以顯著減少訓(xùn)練時(shí)間。此外,Bert、deep transformer 和transformerXL 等也屬于該框架。

Golbayani 等[34]將CNN 與LSTM 進(jìn)行了比較,并通過(guò)實(shí)驗(yàn)分析證明后者在處理企業(yè)信用評(píng)級(jí)問(wèn)題上更為有效。他們用32 個(gè)LSTM 單元和兩個(gè)全連接層構(gòu)建模型。SMAGRU[33]是第一個(gè)將長(zhǎng)期關(guān)注機(jī)制應(yīng)用在企業(yè)信用評(píng)級(jí)的模型。SMAGRU 由6 個(gè)相同的模塊堆疊而成,每個(gè)模塊由多頭自我注意機(jī)制和全連接的前饋網(wǎng)絡(luò)組成。多頭注意力類似于CNN 中的多個(gè)過(guò)濾器,有助于捕捉更全面的信息。該體系結(jié)構(gòu)基于GRU,具有多頭自注意機(jī)制,能夠捕捉時(shí)間序列的特征。多頭自注意機(jī)制通過(guò)增強(qiáng)時(shí)間特征提高了分類精度和收斂速度。此外,多頭自注意機(jī)制和門控遞歸神經(jīng)網(wǎng)絡(luò)也能很好地適應(yīng)高維稀疏數(shù)據(jù),這對(duì)解決企業(yè)信用評(píng)級(jí)問(wèn)題來(lái)說(shuō)十分合適。

3.4 基于定性信息的神經(jīng)網(wǎng)絡(luò)

大多數(shù)評(píng)級(jí)方法使用定量數(shù)據(jù)(如財(cái)務(wù)信息和資本流動(dòng)性),但定性數(shù)據(jù)(如公司的戰(zhàn)略布局、輿論和管理效率)也對(duì)信用評(píng)級(jí)有重要影響。信用評(píng)級(jí)是為了指導(dǎo)投資者投資未來(lái),但使用的財(cái)務(wù)數(shù)據(jù)是基于公司的歷史運(yùn)營(yíng)情況。財(cái)務(wù)數(shù)據(jù)也不能完全反映企業(yè)的經(jīng)濟(jì)環(huán)境,標(biāo)準(zhǔn)普爾還使用報(bào)告和管理層訪談來(lái)補(bǔ)充評(píng)級(jí)模型?;诙ㄐ孕畔⒌纳窠?jīng)網(wǎng)絡(luò)使用文本數(shù)據(jù)挖掘方法,使得模型分類結(jié)果不完全依賴于定量數(shù)據(jù)分布,是對(duì)信用評(píng)級(jí)模型方法的重要補(bǔ)充。

將文本轉(zhuǎn)換為嵌入向量的常用方法有詞包模型(BOW)、Word2Vec 和Doc2Vec。BOW 最早被提出,它將文檔視為一組單詞,忽略了詞序、語(yǔ)法和語(yǔ)法等元素。BOW 假設(shè)文檔中的每個(gè)單詞都獨(dú)立出現(xiàn)。向量的每個(gè)維度都與語(yǔ)料庫(kù)中的單詞一一對(duì)應(yīng),維度值表明了單詞的重要性。詞頻-逆文檔頻度(TF-IDF)是計(jì)算單詞相對(duì)重要性最常用的方法。Word2Vec 假設(shè)在上下文中經(jīng)常同時(shí)出現(xiàn)的單詞具有相似的含義,并將單詞嵌入到一個(gè)連續(xù)的向量空間中。訓(xùn)練神經(jīng)網(wǎng)絡(luò)的目的是根據(jù)輸入的單詞準(zhǔn)確地預(yù)測(cè)目標(biāo)單詞。Word2Vec 有兩種最常見(jiàn)的架構(gòu):CBOW 模型和Skip-Gram 模型。CBOW 模型使用相鄰單詞的一個(gè)熱編碼作為輸入并預(yù)測(cè)單詞。相反Skip-Gram 模型使用單詞的一個(gè)熱編碼并預(yù)測(cè)其相鄰單詞[46]。Doc2Vec[47]為Word2Vec 添加了一個(gè)段落向量,可用于嵌入可變長(zhǎng)度文本,如句子、段落和文檔。

Choi 等[37]使用上述3 種文本嵌入方法獲得向量,并將向量分別輸入到ANN、SVM 和RF 模型中。實(shí)驗(yàn)結(jié)果表明,使用定量財(cái)務(wù)數(shù)據(jù)和定性文本數(shù)據(jù)訓(xùn)練的模型比僅使用定量財(cái)務(wù)數(shù)據(jù)和定性文本數(shù)據(jù)訓(xùn)練的模型具有更高的精度。模型精度從低到高依次為Word2Vec、Doc2Vec 和BOW。BOW 獲得最高精度的原因可能是訓(xùn)練數(shù)據(jù)集很小。用于訓(xùn)練的管理層討論與分析文本數(shù)據(jù)的長(zhǎng)度很長(zhǎng),Doc2Vec 比Word2Vec 更擅長(zhǎng)處理更長(zhǎng)的文檔。今后使用更大的數(shù)據(jù)集進(jìn)行訓(xùn)練是提高Doc2Vec 精度的一種方法。Feng 等[48]對(duì)定性數(shù)據(jù)進(jìn)行了一次熱編碼,然后使用嵌入層將定量金融數(shù)據(jù)與定性數(shù)據(jù)連接,輸入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。

3.5 圖神經(jīng)網(wǎng)絡(luò)

當(dāng)一個(gè)行業(yè)的市場(chǎng)不景氣時(shí),相關(guān)企業(yè)的評(píng)級(jí)結(jié)果往往也會(huì)變得很糟。企業(yè)之間的關(guān)系也是企業(yè)信用評(píng)級(jí)尚未探索的影響因素之一。然而,現(xiàn)有的大多數(shù)使用圖神經(jīng)網(wǎng)絡(luò)的模型都是基于全球視角對(duì)企業(yè)進(jìn)行研究。它們直接在企業(yè)之間建立網(wǎng)絡(luò),而不考慮單個(gè)企業(yè)內(nèi)部特征的相互作用(例如債務(wù)和資本結(jié)構(gòu)之間的關(guān)系)。

CCR-GNN[48]是第一個(gè)應(yīng)用圖神經(jīng)網(wǎng)絡(luò)(GNN)研究企業(yè)信用評(píng)級(jí)的模型。CCR-GNN 并不是簡(jiǎn)單地將企業(yè)視為一個(gè)節(jié)點(diǎn),而是考慮到單個(gè)企業(yè)內(nèi)部特征的交互作用,為每個(gè)企業(yè)構(gòu)建一個(gè)圖。CCR-GNN包括三層子神經(jīng)網(wǎng)絡(luò):首先,根據(jù)特征之間的關(guān)系將每個(gè)企業(yè)映射為一個(gè)圖結(jié)構(gòu);然后,這些特征通過(guò)圖形注意層的交互來(lái)捕獲局部和全局企業(yè)信用信息;最后,信用評(píng)級(jí)層根據(jù)這些企業(yè)信用信息輸出類別。通過(guò)疊加多個(gè)圖形注意層,CCR-GNN 可以清晰地探索高階特征交互,特征節(jié)點(diǎn)的企業(yè)信用信息通過(guò)注意機(jī)制傳輸?shù)较噜徆?jié)點(diǎn)。

3.6 基于對(duì)抗和半監(jiān)督的神經(jīng)網(wǎng)絡(luò)

中小企業(yè)的財(cái)務(wù)信息不足,而且沒(méi)有足夠的資金支持評(píng)級(jí)。因此,以往對(duì)企業(yè)信用評(píng)級(jí)的研究往往只考慮大型企業(yè)。然而,中小企業(yè)的財(cái)務(wù)數(shù)據(jù)也具有研究?jī)r(jià)值。半監(jiān)督學(xué)習(xí)算法為解決這一問(wèn)題提供了可能性?;谙嗨茦颖揪哂邢嗨戚敵龅募僭O(shè),半監(jiān)督學(xué)習(xí)同時(shí)使用標(biāo)記數(shù)據(jù)和未標(biāo)記數(shù)據(jù)來(lái)訓(xùn)練模型。對(duì)抗學(xué)習(xí)是指基于對(duì)攻擊能力和攻擊結(jié)果的理解,訓(xùn)練能夠抵抗攻擊的網(wǎng)絡(luò)機(jī)器學(xué)習(xí)算法。實(shí)現(xiàn)對(duì)抗學(xué)習(xí)的方法是使兩個(gè)網(wǎng)絡(luò)相互競(jìng)爭(zhēng),其中生成器網(wǎng)絡(luò)向樣本中添加噪聲來(lái)構(gòu)造偽數(shù)據(jù),判別器網(wǎng)絡(luò)判斷數(shù)據(jù)的真實(shí)性。通過(guò)反復(fù)對(duì)抗,生成器和判別器的能力將不斷增強(qiáng)。

然而,F(xiàn)eng 等[49]發(fā)現(xiàn),僅使用半監(jiān)督學(xué)習(xí)會(huì)導(dǎo)致監(jiān)督任務(wù)和半監(jiān)督任務(wù)之間的表征錯(cuò)位問(wèn)題。ASSL4CCR 中引入了編碼器模塊和對(duì)抗學(xué)習(xí)來(lái)緩解這種現(xiàn)象。ASSL4CCR 包括兩個(gè)階段,第一階段是通過(guò)半監(jiān)督學(xué)習(xí)獲得偽標(biāo)簽;在第二階段,編碼器模塊的映射將標(biāo)記數(shù)據(jù)與偽標(biāo)記數(shù)據(jù)結(jié)合起來(lái),判別器模塊用于區(qū)分?jǐn)?shù)據(jù)來(lái)自真標(biāo)簽還是偽標(biāo)簽。

3.7 基于預(yù)訓(xùn)練和自監(jiān)督的神經(jīng)網(wǎng)絡(luò)

除了集成學(xué)習(xí)外,自監(jiān)督學(xué)習(xí)也可以在一定程度上緩解企業(yè)信用數(shù)據(jù)集的類別不平衡問(wèn)題。在基于神經(jīng)網(wǎng)絡(luò)的方法中,半監(jiān)督學(xué)習(xí)和自監(jiān)督學(xué)習(xí)對(duì)標(biāo)簽的依賴性相對(duì)減弱,所以類別分布差異對(duì)該方法影響相對(duì)較小。自監(jiān)督學(xué)習(xí)主要通過(guò)輔助任務(wù)從無(wú)監(jiān)督數(shù)據(jù)中挖掘監(jiān)督信息,下游任務(wù)的有價(jià)值表示是通過(guò)構(gòu)建的監(jiān)督信息來(lái)學(xué)習(xí)的。CP4CCR[50]將特征掩蔽和特征交換作為兩個(gè)自監(jiān)督的任務(wù),對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練。該工作提出,相對(duì)于其他常用的編碼模塊,企業(yè)信用評(píng)級(jí)模型更好的編碼模塊是transformer。

3.8 基于可解釋性學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)

在金融領(lǐng)域,提高模型的可解釋性至關(guān)重要,高解釋性模型便于分析師判斷哪些特征對(duì)評(píng)級(jí)更有顯著性。相較于深度學(xué)習(xí)算法的黑匣子特性,基于可解釋性學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)更適合解決這個(gè)問(wèn)題。機(jī)器學(xué)習(xí)方法的可解釋性可分為內(nèi)在解釋和事后解釋。內(nèi)在解釋意味著模型本身是可解釋的。事后解釋意味著訓(xùn)練黑盒模型(如集成方法或神經(jīng)網(wǎng)絡(luò)),并在訓(xùn)練后應(yīng)用可解釋性方法[51]。文獻(xiàn)[52]提出了一種基于企業(yè)信用評(píng)級(jí)的事后解釋的稀疏算法。該工作通過(guò)稀疏算法對(duì)此問(wèn)題做出了反事實(shí)解釋。此外,該研究還發(fā)現(xiàn),信用評(píng)級(jí)越高,企業(yè)提高信用評(píng)級(jí)的難度就越大。通過(guò)對(duì)模型進(jìn)行解釋,可以探索如何以最少的成本來(lái)達(dá)到提高信用評(píng)級(jí)分?jǐn)?shù)的目的。這樣的思想開(kāi)辟了企業(yè)信用評(píng)級(jí)模型的新思路。

總的來(lái)講,基于神經(jīng)網(wǎng)絡(luò)的模型對(duì)于特征工程的要求相對(duì)較低,考慮到評(píng)級(jí)信息時(shí)序變化的特點(diǎn)以及企業(yè)間關(guān)系,綜合了機(jī)器學(xué)習(xí)模型難以捕捉的定性信息,緩解了數(shù)據(jù)分布不均的問(wèn)題。這類模型逐年取代以往的統(tǒng)計(jì)模型和機(jī)器學(xué)習(xí)模型,成為信用評(píng)級(jí)的主流。然而神經(jīng)網(wǎng)絡(luò)更依賴于大量數(shù)據(jù)集,可解釋性也不高,未來(lái)還有相當(dāng)大的發(fā)展空間。

4 結(jié)論與展望

企業(yè)信用評(píng)級(jí)模型作為中國(guó)評(píng)級(jí)企業(yè)的卡脖子技術(shù),近年來(lái)受到越來(lái)越多的關(guān)注。通過(guò)對(duì)以往文獻(xiàn)的總結(jié),本文系統(tǒng)地分析了企業(yè)信用評(píng)級(jí)的起源與發(fā)展。從傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)模型、基于機(jī)器學(xué)習(xí)的評(píng)級(jí)模型和基于神經(jīng)網(wǎng)絡(luò)的評(píng)級(jí)模型3 個(gè)層面深入地介紹了信用評(píng)級(jí)的方法。

當(dāng)下信用評(píng)級(jí)模型已經(jīng)非常豐富,企業(yè)信用評(píng)級(jí)領(lǐng)域取得了快速發(fā)展。時(shí)間與金錢成本被降低,新方法的提出打破了評(píng)級(jí)機(jī)構(gòu)的壟斷門檻,小微企業(yè)也可以獲得相應(yīng)的評(píng)級(jí)。此外,隨著神經(jīng)網(wǎng)絡(luò)方法的引進(jìn),評(píng)級(jí)準(zhǔn)確率獲得了顯著提升,模型中帶有分析師個(gè)人色彩的主觀性也被降低。

然而,目前在信用評(píng)級(jí)領(lǐng)域依然有很多待解決的問(wèn)題。擁有全面的金融信息的依然是大型企業(yè),小微企業(yè)由于缺少相應(yīng)數(shù)據(jù)而評(píng)級(jí)困難。此外,擁有評(píng)級(jí)標(biāo)簽的企業(yè)大部分都是信用良好的企業(yè),等級(jí)低的企業(yè)少之又少,數(shù)據(jù)集類別嚴(yán)重不均衡,給評(píng)級(jí)過(guò)程帶來(lái)了很大的困難?,F(xiàn)有模型所使用的數(shù)據(jù)集都是由研究者自己構(gòu)建,缺乏開(kāi)源統(tǒng)一而廣泛使用的數(shù)據(jù)集。統(tǒng)一的數(shù)據(jù)集有助于比較不同模型的性能。在深度學(xué)習(xí)廣泛應(yīng)用之前,傳統(tǒng)評(píng)級(jí)廣泛采用定性與定量結(jié)合的辦法。然而近年來(lái)發(fā)展迅速的深度學(xué)習(xí)方法大部分只使用了定量數(shù)據(jù)進(jìn)行分析。

此外,信用評(píng)級(jí)問(wèn)題多被深度學(xué)習(xí)模型視為分類問(wèn)題,忽視了評(píng)級(jí)對(duì)排序的敏感性?;谏窠?jīng)網(wǎng)絡(luò)企業(yè)信用評(píng)級(jí)模型的可解釋性依然有待商榷,是金融從業(yè)者的心頭之患。圖1 展示了不同行業(yè)的企業(yè)評(píng)級(jí)的分布情況。由于不同行業(yè)之間差異比較大,企業(yè)信用評(píng)級(jí)模型需要考慮到不同行業(yè)間的經(jīng)營(yíng)特色,未來(lái)仍有改進(jìn)空間。評(píng)級(jí)結(jié)果只能部分體現(xiàn)企業(yè)經(jīng)營(yíng)狀況,如何幫助企業(yè)提高經(jīng)營(yíng)能力,提高信用評(píng)級(jí)等級(jí),是未來(lái)該領(lǐng)域一個(gè)新的研究視角。

在企業(yè)信用評(píng)級(jí)的建模方面,圖神經(jīng)網(wǎng)絡(luò)依舊是一個(gè)熱點(diǎn)的方向,其集成了神經(jīng)網(wǎng)絡(luò)強(qiáng)大的表達(dá)能力和圖結(jié)構(gòu)數(shù)據(jù)的可解釋能力,如何充分利用圖神經(jīng)網(wǎng)絡(luò)建模是一個(gè)重要的研究方向,不論是從特征建圖還是從企業(yè)建圖都是很好的方法,異質(zhì)圖網(wǎng)絡(luò)的引入可以將企業(yè)多種關(guān)系聯(lián)合建模。此外,由于企業(yè)信用特征與信息是實(shí)時(shí)變化的,現(xiàn)有的圖網(wǎng)絡(luò)建模方法多是基于靜態(tài)圖,基于動(dòng)態(tài)圖網(wǎng)絡(luò)進(jìn)行評(píng)級(jí)的工作有相當(dāng)大的空缺。動(dòng)態(tài)圖網(wǎng)絡(luò)的建模方法也可以將時(shí)序信息引入,使評(píng)級(jí)涵蓋因素更廣泛。企業(yè)信用評(píng)級(jí)的研究前景廣闊,還有很大的空間去探索。

利益沖突聲明

所有作者聲明不存在利益沖突關(guān)系。

猜你喜歡
企業(yè)信用評(píng)級(jí)信用
揚(yáng)州市穩(wěn)步推進(jìn)安全生產(chǎn)領(lǐng)域企業(yè)信用修復(fù)
泰州市推行企業(yè)信用修復(fù)全鏈條服務(wù)模式
為食品安全加把“信用鎖”
信用收縮是否結(jié)束
“涉軍”企業(yè)信用評(píng)價(jià)擴(kuò)大試點(diǎn)工作即將啟動(dòng)
“涉軍”企業(yè)信用評(píng)論擴(kuò)大試點(diǎn)工作即將啟動(dòng)
信用中國(guó)網(wǎng)
分析師最新給予買入評(píng)級(jí)的公司
信用消費(fèi)有多爽?
百度遭投行下調(diào)評(píng)級(jí)
新宁县| 阳春市| 澜沧| 瓮安县| 和平县| 临海市| 顺义区| 黎平县| 昌图县| 凤冈县| 山阴县| 武汉市| 太白县| 准格尔旗| 荥阳市| 宜昌市| 南溪县| 图片| 格尔木市| 泽州县| 尚义县| 扎囊县| 美姑县| 濮阳市| 万年县| 林口县| 班玛县| 永新县| 南郑县| 莲花县| 陇川县| 深圳市| 肥乡县| 东至县| 云梦县| 福贡县| 阿坝| 景泰县| 航空| 手机| 海原县|