企業(yè)信用評(píng)級(jí)計(jì)算模型綜述

2023-08-25 01:08:14田一擎程曦馮博靖

數(shù)據(jù)與計(jì)算發(fā)展前沿 2023年4期

田一擎，程曦，馮博靖＊

1. 湖南大學(xué)，工商管理學(xué)院，湖南長(zhǎng)沙 410000

2. 中國(guó)科學(xué)院自動(dòng)化研究所，北京 100190

引言

企業(yè)信用評(píng)級(jí)是評(píng)估企業(yè)按照合同如期履行義務(wù)的意愿和能力，評(píng)級(jí)的目的在于評(píng)估企業(yè)作為債務(wù)人的違約風(fēng)險(xiǎn)大小。被評(píng)級(jí)企業(yè)主要分為非金融公司（如工商、建筑、交通、旅游等公司）和金融公司（如保險(xiǎn)、證券公司等）。后者由于資金流轉(zhuǎn)和組織架構(gòu)的特殊性，其信用風(fēng)險(xiǎn)往往更大，評(píng)級(jí)工作更加困難。

目前，國(guó)際上最知名的信用評(píng)級(jí)機(jī)構(gòu)有3 家，分別是標(biāo)準(zhǔn)普爾、穆迪和惠譽(yù)。標(biāo)準(zhǔn)普爾有160 余年歷史，在行業(yè)內(nèi)處于領(lǐng)先地位并扮演著領(lǐng)導(dǎo)者的角色，評(píng)級(jí)范圍涵蓋了全球126 個(gè)國(guó)家和地區(qū)。標(biāo)準(zhǔn)普爾在2019 年進(jìn)入中國(guó)信用評(píng)級(jí)市場(chǎng)，按周發(fā)布對(duì)各國(guó)和各地區(qū)主權(quán)信用評(píng)級(jí)的更新。穆迪有120余年歷史，由著名公司鄧白氏拆分而來(lái)，評(píng)級(jí)范圍涵蓋了全球一百多個(gè)國(guó)家和地區(qū)，在2001 年進(jìn)入中國(guó)市場(chǎng)?；葑u(yù)有100 余年歷史，規(guī)模相較于標(biāo)準(zhǔn)普爾和穆迪稍小，評(píng)級(jí)范圍涵蓋了全球70 多個(gè)國(guó)家和地區(qū)，于2020 年獲準(zhǔn)進(jìn)入中國(guó)市場(chǎng)。除了這3 家機(jī)構(gòu)以外，中國(guó)的評(píng)級(jí)機(jī)構(gòu)也在不斷發(fā)展，如大公國(guó)際、中誠(chéng)信、東方金誠(chéng)等。不過(guò)中國(guó)的評(píng)級(jí)機(jī)構(gòu)起步較晚，在完善程度、評(píng)級(jí)指標(biāo)構(gòu)建的科學(xué)性等方面還有很大進(jìn)步空間。專家學(xué)者在構(gòu)建信用評(píng)級(jí)模型時(shí)用到的數(shù)據(jù)庫(kù)并不單一，表1 展示了常用的一些數(shù)據(jù)庫(kù)。

表1 企業(yè)信用評(píng)級(jí)常用數(shù)據(jù)庫(kù)Table 1 The main databases of corporate credit rating

雖然當(dāng)下企業(yè)信用評(píng)級(jí)數(shù)據(jù)庫(kù)不統(tǒng)一且缺乏統(tǒng)一的基準(zhǔn)，然而大部分人工評(píng)級(jí)和算法評(píng)級(jí)方法都是基于常用的一些數(shù)據(jù)庫(kù)構(gòu)建企業(yè)信用評(píng)級(jí)指標(biāo)，如WIND、Bloomberg 等。人工評(píng)級(jí)方法發(fā)展早且理論完善應(yīng)用廣泛。雖然當(dāng)下主觀評(píng)級(jí)方法綜合了多方分析結(jié)果且經(jīng)歷多次迭代，但該方法主觀性依然很強(qiáng)且受分析師個(gè)人偏好影響大，耗費(fèi)大量人力物力，多次迭代耗時(shí)間長(zhǎng)導(dǎo)致評(píng)級(jí)結(jié)果不能實(shí)時(shí)反映公司信用。而算法評(píng)級(jí)相對(duì)來(lái)講實(shí)時(shí)性強(qiáng)成本低，評(píng)級(jí)結(jié)果客觀可復(fù)現(xiàn)。但當(dāng)下算法評(píng)級(jí)不能完全替代專家知識(shí)，對(duì)定性信息的理解也不充分，未來(lái)還有很大發(fā)展空間。

企業(yè)信用評(píng)級(jí)作為市場(chǎng)經(jīng)濟(jì)條件下的社會(huì)中介服務(wù)，在維護(hù)社會(huì)經(jīng)濟(jì)秩序中起了重要作用。企業(yè)應(yīng)當(dāng)建立在對(duì)客戶信用狀況充分了解的前提下發(fā)展客戶。企業(yè)一味地追求大量訂單難免會(huì)收到壞賬。信用評(píng)級(jí)可以幫助金融從業(yè)者規(guī)避風(fēng)險(xiǎn)，為投資者和合伙人提供客觀公正的資信信息，減小了企業(yè)的經(jīng)營(yíng)管理壓力[1]。資本市場(chǎng)管理部門為了維持資本秩序的穩(wěn)定需要對(duì)企業(yè)進(jìn)行審查。企業(yè)信用評(píng)級(jí)提升了經(jīng)濟(jì)管理部門對(duì)企業(yè)的監(jiān)管能力，弘揚(yáng)了企業(yè)的社會(huì)知名度。

與企業(yè)信用評(píng)級(jí)相似的是債券信用評(píng)級(jí)。雖然二者都是為了促進(jìn)資源的有效配置，減少評(píng)級(jí)對(duì)象和投資者之間的信息不對(duì)稱，但其評(píng)級(jí)對(duì)象不一樣，前者面向的是商業(yè)銀行或相關(guān)監(jiān)管機(jī)構(gòu)，后者面向的是債券投資者。由于債券評(píng)級(jí)機(jī)構(gòu)的評(píng)級(jí)耗時(shí)長(zhǎng)，經(jīng)歷信息收集、處理、二次評(píng)級(jí)、跟蹤評(píng)級(jí)等多個(gè)階段，信用風(fēng)險(xiǎn)的變更往往反應(yīng)不及時(shí)[2]，建立一套自己的信用評(píng)級(jí)體系對(duì)金融機(jī)構(gòu)來(lái)說(shuō)非常重要。然而，評(píng)級(jí)機(jī)構(gòu)做一次完整細(xì)致的評(píng)級(jí)需要耗費(fèi)大量的人力物力財(cái)力和時(shí)間[3]，這對(duì)于大部分企業(yè)以及金融從業(yè)者來(lái)說(shuō)難以承擔(dān)。所以構(gòu)建精準(zhǔn)的企業(yè)信用評(píng)級(jí)模型對(duì)于投資者來(lái)說(shuō)很有價(jià)值。

當(dāng)下已經(jīng)有許多專家學(xué)者對(duì)企業(yè)信用評(píng)級(jí)模型做了細(xì)致的研究，但是關(guān)于這類模型的整體性綜述卻相對(duì)不足，對(duì)近年來(lái)基于神經(jīng)網(wǎng)絡(luò)的評(píng)級(jí)模型的綜述更是寥寥無(wú)幾。本文綜合了傳統(tǒng)的統(tǒng)計(jì)學(xué)模型、基于機(jī)器學(xué)習(xí)的模型以及近年來(lái)話題度很高的基于神經(jīng)網(wǎng)絡(luò)的評(píng)級(jí)模型對(duì)企業(yè)信用評(píng)級(jí)展開(kāi)描述。

1 企業(yè)信用評(píng)級(jí)的統(tǒng)計(jì)學(xué)模型

在金融領(lǐng)域，大多數(shù)用于評(píng)估企業(yè)信用風(fēng)險(xiǎn)的傳統(tǒng)模型都使用了基礎(chǔ)的統(tǒng)計(jì)方法，由企業(yè)破產(chǎn)預(yù)測(cè)模型衍生而來(lái)。這類模型大部分基于企業(yè)財(cái)務(wù)指標(biāo)（如資產(chǎn)負(fù)債結(jié)構(gòu)、現(xiàn)金流量、盈利能力、資產(chǎn)流動(dòng)性等）來(lái)構(gòu)建評(píng)級(jí)指標(biāo)體系，如表2 所示，之后用統(tǒng)計(jì)方法分析這些指標(biāo)體系特征來(lái)完成企業(yè)信用評(píng)級(jí)分類。

表2 企業(yè)信用評(píng)級(jí)常用指標(biāo)Table 2 The main metrics of corporate credit rating

常用的統(tǒng)計(jì)模型如下：

1.1 ZETA

ZETA 模型最初用來(lái)評(píng)估公司破產(chǎn)風(fēng)險(xiǎn)，之后在信用評(píng)級(jí)領(lǐng)域也有廣泛的應(yīng)用。評(píng)價(jià)指標(biāo)體系基于資產(chǎn)收益率、收益穩(wěn)定性、債務(wù)償付能力、累計(jì)盈利能力、流動(dòng)性、資本化程度和規(guī)模這7 個(gè)維度構(gòu)建。文獻(xiàn)[4]結(jié)合了判別分析算法，并引入先驗(yàn)概率進(jìn)行了信用價(jià)值分析。然而ZETA 模型的7 個(gè)指標(biāo)是固定不變的，不能涵蓋所有評(píng)級(jí)要素。之后廣泛使用的特征工程本質(zhì)上就是在尋找適合描述評(píng)級(jí)問(wèn)題的要素指標(biāo)。

1.2 層次分析法

層次分析法（Analytic Hierarchy Process, AHP）是指將決策分解成多個(gè)層次從而進(jìn)行定性和定量分析的方法，常被用于企業(yè)信用評(píng)級(jí)[5]，目前被廣泛用于確定參數(shù)的相對(duì)重要性。為了平衡AHP 方法的主觀性，文獻(xiàn)[6]結(jié)合了客觀的數(shù)據(jù)包絡(luò)分析模型（DEA）對(duì)信用水平進(jìn)行評(píng)估。特別是對(duì)于難以完全定量分析的復(fù)雜系統(tǒng)，層次分析法的優(yōu)勢(shì)明顯。然而層次分析法需要決策者對(duì)指標(biāo)兩兩比較，判斷其相對(duì)重要性，不僅引入了更多的主觀要素，而且在指標(biāo)數(shù)量多的時(shí)候很難人為判斷。

1.3 多元判別分析

多元判別分析（Multiple Discriminant Analysis,MDA）是用一種根據(jù)數(shù)據(jù)集分析新的數(shù)據(jù)屬于哪一類的統(tǒng)計(jì)方法，曾被廣泛應(yīng)用于信用評(píng)分模型[7]。按照判別準(zhǔn)則不同，判別方法可以分為距離判別法、Fisher 判別法、Bayes 判別法、逐步判別法等。Reichert 等[8]指出，大部分MDA 模型都假定變量以多元正態(tài)分布。如果數(shù)據(jù)的真實(shí)分布顯著偏離正態(tài)，分類結(jié)果會(huì)嚴(yán)重錯(cuò)誤。Z-score 模型是基于MDA 創(chuàng)建的，最初被用來(lái)進(jìn)行企業(yè)破產(chǎn)分析，后來(lái)也用于信用風(fēng)險(xiǎn)度量[9]。與前兩種方法相比，可以發(fā)現(xiàn)MDA 方法更多地考慮了數(shù)據(jù)的科學(xué)性，更少地受到分析師主觀的影響。然而MDA 的分類結(jié)果往往在數(shù)據(jù)集較小時(shí)更精確，難以招架如今日益增加的評(píng)級(jí)需求。此外，MDA 模型沒(méi)有使用統(tǒng)計(jì)上獨(dú)立于估計(jì)樣本的數(shù)據(jù)來(lái)驗(yàn)證評(píng)級(jí)的準(zhǔn)確性，導(dǎo)致驗(yàn)證結(jié)果出現(xiàn)偏差。MDA 模型假設(shè)所有類別的方差-協(xié)方差矩陣相等，這與現(xiàn)實(shí)不符。

1.4 多元自適應(yīng)回歸

多元自適應(yīng)回歸（Multivariate Adaptive Regression Splines, MARS）[10]也被用于信用評(píng)級(jí)。MARS是由逐步線性回歸衍生而來(lái)。相比較于適合小數(shù)據(jù)集的MDA 模型，MARS 可以精確快捷地處理大規(guī)模企業(yè)信用評(píng)級(jí)問(wèn)題。更可觀的是，MARS 還能夠捕捉變量之間的非線性和交互作用。不過(guò)相較于其他模型而言，MARS 在企業(yè)信用評(píng)級(jí)上用的并不多。

1.5 邏輯回歸

邏輯回歸模型（Logistic Regression, LR）是以線性回歸理論為支持的非線性模型，常被用于處理二分類問(wèn)題。Laitinen 等[11]使用邏輯回歸和線性回歸模型來(lái)分析公司信用風(fēng)險(xiǎn)。WEST 等[12]使用經(jīng)典因子分析與多元邏輯回歸相結(jié)合，構(gòu)建了一個(gè)商業(yè)銀行預(yù)警系統(tǒng)。LR 作為一個(gè)廣泛使用的分類算法，在各領(lǐng)域都有應(yīng)用，優(yōu)點(diǎn)在于速度快，可以進(jìn)行非線性分類，也常常與其他算法結(jié)合，用于信用評(píng)級(jí)問(wèn)題。

1.6 其他統(tǒng)計(jì)模型

文獻(xiàn)[13]同樣將定性指標(biāo)和定量指標(biāo)相結(jié)合建立小企業(yè)信用評(píng)價(jià)指標(biāo)體系，指標(biāo)權(quán)重由增量聚類算法產(chǎn)生。實(shí)驗(yàn)證明了該聚類算法適合高維特征。Shi等[14]使用了Pearson 相關(guān)分析和F 檢驗(yàn)顯著性判別的方法，篩選關(guān)鍵特征，從而兼顧分類精度與計(jì)算時(shí)間。由于模糊優(yōu)劣解距離（TOPSIS）方法的簡(jiǎn)單性和排序能力，該方法也被用作企業(yè)信用評(píng)級(jí)[15]。

關(guān)于統(tǒng)計(jì)學(xué)習(xí)方法，基于ZETA 模型由于指標(biāo)固定，所以結(jié)果上魯棒性高且可復(fù)現(xiàn)性強(qiáng)；然而AHP 方法由于引入分析師對(duì)指標(biāo)重要性的排序，受人為因素影響大。MDA、MARS 和LR 等方法的優(yōu)點(diǎn)在于理論體系較為完備，邏輯性強(qiáng)，得到的結(jié)論比較清晰，并且容易操作。但以統(tǒng)計(jì)學(xué)為基礎(chǔ)的理論和方法都存在前提約束條件較多的缺點(diǎn)，在實(shí)際評(píng)級(jí)工作中，適用范圍受到限制，具有局限性。

縱觀整個(gè)基于統(tǒng)計(jì)的模型的歷史可以發(fā)現(xiàn)，除了少數(shù)幾個(gè)傳統(tǒng)模型外，所有模型都擅長(zhǎng)處理線性關(guān)系，而不是非線性關(guān)系。大型評(píng)級(jí)機(jī)構(gòu)往往重視分析師在確定評(píng)級(jí)模型參數(shù)或直接信用評(píng)級(jí)時(shí)主觀判斷時(shí)的重要性。盡管這些傳統(tǒng)方法基于對(duì)數(shù)據(jù)的統(tǒng)計(jì)和分析，但它們一直受到人為因素對(duì)企業(yè)信用評(píng)級(jí)的影響。此外，傳統(tǒng)模型（如LR, KMV）在做評(píng)級(jí)任務(wù)時(shí)，往往對(duì)數(shù)據(jù)集的參數(shù)分布做了假設(shè)。這些假設(shè)可能與真實(shí)數(shù)據(jù)分布相悖，而機(jī)器學(xué)習(xí)模型對(duì)這些問(wèn)題的解決提供了新的思路。

2 企業(yè)信用評(píng)級(jí)的機(jī)器學(xué)習(xí)模型

2.1 支持向量機(jī)

支持向量機(jī)（Support Vector Machine, SVM）是信用評(píng)級(jí)領(lǐng)域最常用的模型之一。Huang 等人[3]使用支持向量機(jī)對(duì)信用評(píng)級(jí)分析市場(chǎng)進(jìn)行了比較研究，認(rèn)為SVM 比LR 模型具有更高的準(zhǔn)確性。研究證明使用小而準(zhǔn)確的指標(biāo)數(shù)據(jù)集對(duì)信貸結(jié)果進(jìn)行評(píng)級(jí)，甚至比包含各種指標(biāo)的金融數(shù)據(jù)集更準(zhǔn)確。該研究還對(duì)美國(guó)和中國(guó)臺(tái)灣省評(píng)級(jí)機(jī)構(gòu)的相關(guān)數(shù)據(jù)指標(biāo)進(jìn)行了比較和分析。研究發(fā)現(xiàn)，前者更關(guān)注公司的規(guī)模，后者更關(guān)注公司的盈利能力。這與美國(guó)公司倡導(dǎo)高杠桿操作的方式不謀而合。與以往傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)模型不同，SVM 更強(qiáng)調(diào)評(píng)級(jí)方式的客觀性，金融變量比機(jī)構(gòu)分析師更能決定評(píng)級(jí)結(jié)果。特征工程的應(yīng)用往往可以提升SVM 的準(zhǔn)確度，這個(gè)特質(zhì)拔高了SVM 的上限，但同時(shí)也限制了SVM 在信用評(píng)級(jí)領(lǐng)域的發(fā)展。

支持向量機(jī)最初是為二元分類而設(shè)計(jì)的，對(duì)企業(yè)來(lái)講，信用評(píng)級(jí)并沒(méi)有絕對(duì)的好與壞，簡(jiǎn)單的二分類并不適用于企業(yè)信用評(píng)級(jí)問(wèn)題。模糊支持向量機(jī)[16]為正負(fù)類別的各個(gè)樣本分配了各自的隸屬度，從而使得SVM 具有更強(qiáng)的泛化能力。之后隨著多類支持向量機(jī)的發(fā)展，“一對(duì)全”“一對(duì)一”和有向無(wú)環(huán)圖SVM（DAGSVM）被用在多分類上。文獻(xiàn)[17]使用以上3 種多分類SVM 的方法進(jìn)行企業(yè)債券評(píng)級(jí)，得到了DAGSVM 性能最好的結(jié)論。為了實(shí)現(xiàn)非線性可分樣本的分類，徑向基函數(shù)（RBF）核函數(shù)被用來(lái)對(duì)樣本升維。該工作[18]使用了帶有RBF 核函數(shù)的SVM 進(jìn)行企業(yè)信用評(píng)級(jí)分類。RBF 核函數(shù)的最優(yōu)參數(shù)值通過(guò)網(wǎng)格搜索技術(shù)來(lái)尋找。實(shí)驗(yàn)表示[16]，帶有合適的核和隸屬度生成方法的SVM 比標(biāo)準(zhǔn)支持向量機(jī)和模糊支持向量機(jī)在信用評(píng)級(jí)問(wèn)題上的準(zhǔn)確度更高。

然而企業(yè)信用評(píng)級(jí)不是一個(gè)簡(jiǎn)單的分類問(wèn)題，評(píng)級(jí)結(jié)果是有高低之分的。文獻(xiàn)[2]考慮到信用評(píng)級(jí)的獨(dú)特順序，提出了基于有序成對(duì)劃分策略的支持向量機(jī)。為了解決模型參數(shù)優(yōu)化問(wèn)題，遺傳算法也被引入SVM。GA-SVM[19]使用網(wǎng)格搜索設(shè)置模型參數(shù)并用遺傳算法對(duì)參數(shù)進(jìn)行優(yōu)化。然而，SVM 始終是一個(gè)黑盒問(wèn)題，理解SVM 的原理會(huì)提高模型的實(shí)用性。為了提高SVM 的可解釋性，CRCR-SVM[20]結(jié)合了傳統(tǒng)的規(guī)則學(xué)習(xí)方法，通過(guò)一致區(qū)域覆蓋減少的規(guī)則進(jìn)行SVM 學(xué)習(xí)。

此外，SVM 常被用來(lái)進(jìn)行特征選擇工作。由于指標(biāo)之間互相依賴，所以特征選擇的過(guò)程非常曲折。公司信用評(píng)級(jí)取決于多變量因素。Fisher 是常用的特征選擇方法。該方法易于實(shí)現(xiàn)，執(zhí)行快速，但沒(méi)有考慮到變量和分類器之間的相互作用。另外的雙樣本獨(dú)立性指標(biāo)，如KS 檢驗(yàn)（Kolmogorov-Smirnov test）和卡方檢驗(yàn)，通常會(huì)獲得與Fisher 得分相似的結(jié)果。為了避免特征排序方法所需的額外校準(zhǔn)步驟，Maldonado 等[21]使用兩種SVM 方法（l1-MISVM,LP-MISVM）來(lái)獲取銀行信用貸款數(shù)據(jù)的最佳特征子集。在構(gòu)建分類器時(shí)，該方法會(huì)考慮所有變量交互作用。文獻(xiàn)[17]提出特征選擇可以進(jìn)一步提升SVM 的泛化性能。相比較于遺傳規(guī)劃和決策樹(shù)分類器，SVM 的輸入精度對(duì)大量的輸入特征的依賴性更低[19]。

2.2 決策樹(shù)

決策樹(shù)（DT）是一種可快速構(gòu)建、可解釋性強(qiáng)的算法。ID3 和梯度提升迭代決策樹(shù)算法都用于企業(yè)信用評(píng)級(jí)，后者更有效[22]。結(jié)合了集成學(xué)習(xí)與決策規(guī)則方法，相關(guān)調(diào)整決策森林[23]平衡了模型的準(zhǔn)確性與可解釋性。該方法使用決策樹(shù)作為基分類器，選擇了18 個(gè)對(duì)于信用風(fēng)險(xiǎn)評(píng)級(jí)來(lái)說(shuō)最重要的特征。穆迪的KMV 模型（Credit Monitor Model）基于金融理論和違約概率，是著名的信用評(píng)級(jí)分析模型?；旌螷MV 模型[24]將KMV 與RF 和粗糙集理論（RST）結(jié)合，以提高信用評(píng)級(jí)的準(zhǔn)確率。RST 不對(duì)數(shù)據(jù)的分布做任何假設(shè)，適用于定量和定性分析。在決策過(guò)程涉及不確定的模糊數(shù)據(jù)時(shí)，RST 在解決決策支持問(wèn)題方面成果顯著。首先，混合KMV 模型使用KMV 來(lái)進(jìn)行變量預(yù)測(cè)；其次，RF 選擇變量作為RST 模型的輸入；最后，模型以if-then 規(guī)則的形式生成結(jié)果，過(guò)程透明且易于決策者理解。但是該方法必須對(duì)一些參數(shù)進(jìn)行優(yōu)化，從而構(gòu)成基分類器。然而可以發(fā)現(xiàn)，由于金融數(shù)據(jù)的高維性、稀疏性和強(qiáng)相關(guān)性，DT 模型的性能受到限制，在之后的研究中往往被作為信用評(píng)級(jí)模型的基線，或者與其他算法結(jié)合。

2.3 集成學(xué)習(xí)

集成學(xué)習(xí)不獨(dú)立于其他機(jī)器學(xué)習(xí)算法，它是一種通過(guò)結(jié)合多個(gè)基學(xué)習(xí)器共同完成學(xué)習(xí)任務(wù)的機(jī)器學(xué)習(xí)方法。由于集成學(xué)習(xí)在分類任務(wù)上具有突出表現(xiàn)，所以該算法在企業(yè)信用評(píng)級(jí)方面也有了長(zhǎng)足的發(fā)展。集成學(xué)習(xí)的基本思想是當(dāng)我們做出重要決定時(shí)，需要參考從不同角度提出的多方面的意見(jiàn)。對(duì)多角度意見(jiàn)進(jìn)行加權(quán)最終做出的決策往往比只參考單方面意見(jiàn)做出的決策更加合適。所以，基學(xué)習(xí)器在具有一定的準(zhǔn)確性的基礎(chǔ)上，彼此間應(yīng)當(dāng)具有多樣性。當(dāng)基學(xué)習(xí)器給出的意見(jiàn)達(dá)到互補(bǔ)時(shí)，集成學(xué)習(xí)算法通?？梢匀〉酶玫男Ч?。Abellan 和Castellano 提出的信用決策樹(shù)改變了處理不精確性的方式，使用不精確概率和不確定性度量來(lái)構(gòu)建模型，使基分類器變得相對(duì)不穩(wěn)定。不穩(wěn)定意味著很小的訓(xùn)練數(shù)據(jù)的變化會(huì)使模型產(chǎn)生較大的差異，導(dǎo)致基分類器具有多樣性，非常適合在集成學(xué)習(xí)中使用[25]。

近年來(lái)，神經(jīng)網(wǎng)絡(luò)方法結(jié)合集成學(xué)習(xí)，被很多專家應(yīng)用在企業(yè)信用評(píng)級(jí)任務(wù)上。Donate 等[26]提出在企業(yè)信用評(píng)級(jí)任務(wù)上，集成了多個(gè)神經(jīng)網(wǎng)絡(luò)的模型優(yōu)于只使用單個(gè)神經(jīng)網(wǎng)絡(luò)，對(duì)多個(gè)基學(xué)習(xí)器進(jìn)行適應(yīng)度加權(quán)的集成策略比非加權(quán)策略更具有準(zhǔn)確性，證明了應(yīng)用集成算法的神經(jīng)網(wǎng)絡(luò)方法的巨大潛力。為了保證基學(xué)習(xí)器之間的差異性，Yu 等[27]提出的模型在選擇自適應(yīng)神經(jīng)網(wǎng)絡(luò)（ANN）時(shí)采用了去最大相關(guān)性算法，再將單個(gè)基學(xué)習(xí)器的決策值從正負(fù)無(wú)窮縮放到0 和1 之間，之后分別使用最大、最小、中值、平均和產(chǎn)品策略將基分類結(jié)果集成。其中，產(chǎn)品策略的性能最好，其次是均值策略，導(dǎo)致該結(jié)果的原因尚待討論。

集成學(xué)習(xí)常用的算法有多數(shù)投票、加權(quán)平均、Baggin、Boosting、Random Subspace、Decorate、Rotation Forest 等。多數(shù)投票算法最為常用，但是忽略了某些少數(shù)的神經(jīng)網(wǎng)絡(luò)有時(shí)確實(shí)會(huì)產(chǎn)生正確結(jié)果的事實(shí)，默認(rèn)每個(gè)神經(jīng)網(wǎng)絡(luò)的置信度都相同。在公司信用評(píng)級(jí)任務(wù)中，可用的樣本數(shù)據(jù)往往是有限的，而bagging 算法通過(guò)從原始訓(xùn)練集隨機(jī)置換抽樣子集的方法，對(duì)整體數(shù)據(jù)集在統(tǒng)計(jì)意義上生成更多的估計(jì)，一定程度上彌補(bǔ)了訓(xùn)練數(shù)據(jù)有限的缺陷，通?？梢愿倪M(jìn)分類效果[27]。此外，企業(yè)信用評(píng)級(jí)數(shù)據(jù)類別嚴(yán)重不均衡，如圖1 所示，等級(jí)很高或者很低的都相對(duì)較少。Brown 和Mues 提出隨機(jī)森林（RF）和梯度提升算法在緩解該問(wèn)題時(shí)性能較好。然而He等[28]提出在解決企業(yè)信用評(píng)級(jí)數(shù)據(jù)不均衡問(wèn)題時(shí)，RF 和梯度提升算法的模型的參數(shù)有待進(jìn)一步優(yōu)化。他們擴(kuò)展了級(jí)聯(lián)平衡方法，基于訓(xùn)練數(shù)據(jù)的不平衡率生成可調(diào)的平衡子集，構(gòu)建了以RF 和XGBoost作為基分類器的三階段集成模型。使用疊加生成前一層的預(yù)測(cè)結(jié)果，作為后一層的新解釋特征，基分類器的參數(shù)通過(guò)粒子群優(yōu)化進(jìn)行優(yōu)化。特征工程也被用于神經(jīng)網(wǎng)絡(luò)集成學(xué)習(xí)方法[29]?？紤]到歷史財(cái)務(wù)數(shù)據(jù)和信用評(píng)級(jí)對(duì)當(dāng)前信用評(píng)級(jí)的影響，Wang等[30]構(gòu)建了一個(gè)經(jīng)典的基于集成學(xué)習(xí)的并行神經(jīng)網(wǎng)絡(luò)（PANNs），擴(kuò)展了特征空間，其中視差和絕對(duì)值波動(dòng)率特征可以更好地預(yù)測(cè)企業(yè)信用評(píng)級(jí)。

圖1 典型行業(yè)的企業(yè)信用評(píng)級(jí)分布圖Fig.1 Distribution of corporate credit rating

然而，如何決定集成學(xué)習(xí)方法中基分類器的個(gè)數(shù)和組合，使它更適合企業(yè)信用評(píng)級(jí)問(wèn)題，依然有待研究。集成學(xué)習(xí)集合了許多基分類器，其訓(xùn)練時(shí)間也是指數(shù)級(jí)增長(zhǎng)，基分類器的數(shù)量與訓(xùn)練時(shí)間的分配問(wèn)題值得研究者們?cè)谖磥?lái)權(quán)衡。雖然一定程度上結(jié)合了多個(gè)基分類器的模型可以從多方面考慮問(wèn)題，但是集成策略也很難同時(shí)適合多種基分類器，如何提高包含多種基分類器模型的性能是未來(lái)集成學(xué)習(xí)方法的研究方向。Wang 等[30]的實(shí)驗(yàn)結(jié)果表明，有時(shí)候基于神經(jīng)網(wǎng)絡(luò)的集成模型效果不隨著數(shù)據(jù)量的增加而顯著增強(qiáng)，一種可能的解釋是更多財(cái)務(wù)數(shù)據(jù)會(huì)引入更多的噪聲。在今后的研究中，可以通過(guò)降低噪聲得到更有用的數(shù)據(jù)集來(lái)提高預(yù)測(cè)精度。

2.4 其他機(jī)器學(xué)習(xí)模型

文獻(xiàn)[31]基于知識(shí)生成決策規(guī)則，使用粗糙集實(shí)現(xiàn)兩個(gè)混合模型，對(duì)全球銀行業(yè)的信用評(píng)級(jí)進(jìn)行分類。Chai 等[32]針對(duì)小企業(yè)進(jìn)行信用評(píng)級(jí)，發(fā)現(xiàn)對(duì)小企業(yè)來(lái)講，非金融因素的影響大于財(cái)務(wù)因素。在構(gòu)建信用指標(biāo)體系時(shí)，先使用三角模糊數(shù)將定性指標(biāo)轉(zhuǎn)化為數(shù)值，再采用偏相關(guān)分析（PCA）和概率回歸算法消除冗余指標(biāo)。該工作利用TOPSIS 算法計(jì)算信用評(píng)分，再使用模糊C-means 對(duì)小企業(yè)信用評(píng)分進(jìn)行聚類。

在常用的信用評(píng)級(jí)機(jī)器學(xué)習(xí)模型中，決策樹(shù)方法是一種非參數(shù)統(tǒng)計(jì)學(xué)習(xí)方法，其特點(diǎn)在于提升生成的分類樹(shù)的魯棒性和泛化能力。最近鄰方法基于度量測(cè)度，特點(diǎn)在于將待評(píng)級(jí)企業(yè)歸類于與其指標(biāo)最相近的訓(xùn)練集中指標(biāo)對(duì)應(yīng)的信用等級(jí)。不需要評(píng)級(jí)指標(biāo)數(shù)據(jù)的先驗(yàn)概率分布信息或假設(shè)信息是最近鄰方法的顯著優(yōu)勢(shì)。此外，基于特征選擇、數(shù)據(jù)降維的主成分分析方法等在解決評(píng)級(jí)指標(biāo)數(shù)據(jù)量的快速增加方面有很大優(yōu)勢(shì)。而集成學(xué)習(xí)得到的混合模型總體來(lái)講比單一模型評(píng)級(jí)精度更好，其中一個(gè)可能的原因在于集成方法針對(duì)不同數(shù)據(jù)集采用不同的模型建模，一定程度上解決了評(píng)級(jí)中的不平衡問(wèn)題。

縱觀基于機(jī)器學(xué)習(xí)的模型可以發(fā)現(xiàn)，雖然這類模型相較于之前的統(tǒng)計(jì)模型來(lái)講，更強(qiáng)調(diào)客觀性，卻也在一定程度上只利用了量化數(shù)據(jù)而丟棄了定性數(shù)據(jù)帶來(lái)的信息增益。而企業(yè)信用評(píng)級(jí)問(wèn)題中，定性數(shù)據(jù)如文本等包含了大量風(fēng)險(xiǎn)信息。此外，這類模型過(guò)于依賴特征工程，好的特征會(huì)給模型效果帶來(lái)顯著提升。神經(jīng)網(wǎng)絡(luò)模型對(duì)這些問(wèn)題提供了新的思路。

3 企業(yè)信用評(píng)級(jí)的神經(jīng)網(wǎng)絡(luò)模型

3.1 早期的神經(jīng)網(wǎng)絡(luò)

關(guān)于企業(yè)信用評(píng)級(jí)問(wèn)題，在神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用之前，特征工程一直是金融工程的研究重點(diǎn)。在以前的機(jī)器學(xué)習(xí)算法中，使用特征工程獲得新特征往往比僅使用原始特征得到的評(píng)級(jí)結(jié)果更準(zhǔn)確。Chen 等[33]使用單方差分析的統(tǒng)計(jì)方法來(lái)選擇特征。盡管統(tǒng)計(jì)方法會(huì)提高訓(xùn)練集的分類精度，但也會(huì)帶來(lái)噪聲并導(dǎo)致過(guò)度擬合。然而，神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中賦予特征不同的權(quán)重，相當(dāng)于選擇了重要特征作為重點(diǎn)關(guān)注對(duì)象。Golbayani 等[34]發(fā)現(xiàn)，當(dāng)使用所有財(cái)務(wù)變量作為輸入，并在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程中執(zhí)行特征工程時(shí)，評(píng)級(jí)結(jié)果更準(zhǔn)確。與統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)方法相比，神經(jīng)網(wǎng)絡(luò)不假設(shè)數(shù)據(jù)分布。

早期的神經(jīng)網(wǎng)絡(luò)（如多層感知器（MLP））需要手動(dòng)調(diào)整學(xué)習(xí)速率，避免陷入局部極小值。與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比，MLP 能夠有效地處理高維數(shù)據(jù)和非線性關(guān)系。Brennan 等[35]利用財(cái)務(wù)報(bào)表中的信息建立了一個(gè)反向傳播神經(jīng)網(wǎng)絡(luò)，對(duì)債券發(fā)行公司進(jìn)行評(píng)級(jí)。他們發(fā)現(xiàn)，使用反向傳播神經(jīng)網(wǎng)絡(luò)得到的結(jié)果比傳統(tǒng)的統(tǒng)計(jì)方法準(zhǔn)確得多。Huang等[3]用反向傳播神經(jīng)網(wǎng)絡(luò)模型解釋企業(yè)信用評(píng)級(jí)，并試圖從該模型中分析不同的輸入金融變量的相對(duì)重要性。Angelini 等[36]認(rèn)為數(shù)據(jù)分析和處理以及參數(shù)優(yōu)化是解決公司信用評(píng)級(jí)的重點(diǎn)難點(diǎn)。他們使用了經(jīng)典的前饋神經(jīng)網(wǎng)絡(luò)和具有自組織連接的前饋神經(jīng)網(wǎng)絡(luò)來(lái)評(píng)估信用風(fēng)險(xiǎn)。后者由四層的前饋網(wǎng)絡(luò)組成。輸入神經(jīng)元由3 個(gè)神經(jīng)元組成，每組連接到下一層的一個(gè)神經(jīng)元。然而，MLP 模型收斂速度慢而且訓(xùn)練過(guò)程不穩(wěn)定。傳統(tǒng)的神經(jīng)網(wǎng)模型更適合于二值分類，但在多類分類中精度較低。此外，傳統(tǒng)的反向傳播神經(jīng)網(wǎng)絡(luò)算法在網(wǎng)絡(luò)中訓(xùn)練大量參數(shù)，容易產(chǎn)生過(guò)擬合，訓(xùn)練時(shí)間長(zhǎng)。文獻(xiàn)[2,3,18-19]認(rèn)為，傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在信用評(píng)級(jí)方面不如SVM。Choi 等[37]認(rèn)為，這可能是因?yàn)镾VM 在避免過(guò)度擬合問(wèn)題方面更穩(wěn)健，而且與神經(jīng)網(wǎng)絡(luò)相比SVM 參數(shù)更少。Du等[38]提出遺傳算法可以對(duì)神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行修改和優(yōu)化，提高企業(yè)信用評(píng)級(jí)的準(zhǔn)確性。遺傳算法信用評(píng)級(jí)模型一定程度上緩解了BPNN 訓(xùn)練時(shí)間長(zhǎng)、收斂速度慢、陷入局部極小值可能性的問(wèn)題。

關(guān)于企業(yè)信用評(píng)級(jí)問(wèn)題，在經(jīng)典的前向反饋網(wǎng)絡(luò)模型的基礎(chǔ)上，許多其他的神經(jīng)網(wǎng)絡(luò)模型也相繼被提出。深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)（DNN）由多個(gè)淺層神經(jīng)網(wǎng)絡(luò)組成。隨著網(wǎng)絡(luò)層數(shù)的增加，DNN 的梯度在訓(xùn)練中消失，優(yōu)化函數(shù)越來(lái)越容易陷入局部最優(yōu)解，訓(xùn)練效率大大降低。直到2006 年，Hinton 提出了分層訓(xùn)練受限玻爾茲曼機(jī)的方法，改善了上述問(wèn)題。這種結(jié)構(gòu)被稱為深度信念網(wǎng)絡(luò)（DBN）。Luo 等[39]首次使用DBN 對(duì)企業(yè)信用評(píng)分進(jìn)行了研究，分類性能優(yōu)于MLR、MLP 和SVM。此外，Kim 等[40]使用自適應(yīng)學(xué)習(xí)網(wǎng)絡(luò)（ALN）預(yù)測(cè)債券評(píng)級(jí)。文獻(xiàn)[41]使用概率神經(jīng)網(wǎng)絡(luò)（PNN）對(duì)美國(guó)公司和市政當(dāng)局進(jìn)行評(píng)級(jí)。數(shù)據(jù)預(yù)處理階段采用了基于相關(guān)性的方法和遺傳算法。他們發(fā)現(xiàn)，概率神經(jīng)網(wǎng)絡(luò)比其他基準(zhǔn)分類器，如傳統(tǒng)神經(jīng)網(wǎng)絡(luò)（如前饋神經(jīng)網(wǎng)絡(luò)、RBF、數(shù)據(jù)處理多項(xiàng)式神經(jīng)網(wǎng)絡(luò)）、級(jí)聯(lián)相關(guān)神經(jīng)網(wǎng)絡(luò)和統(tǒng)計(jì)方法（LR、MDA）有更準(zhǔn)確的結(jié)果。PNN是徑向基函數(shù)網(wǎng)絡(luò)的一個(gè)分支，屬于前饋網(wǎng)絡(luò)。它將密度函數(shù)估計(jì)和貝葉斯決策理論相結(jié)合，使判斷界面接近貝葉斯最佳判斷界面。它具有學(xué)習(xí)過(guò)程簡(jiǎn)單、訓(xùn)練速度快的優(yōu)點(diǎn)。

3.2 卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)（CNN）的出現(xiàn)是為了解決DNN的參數(shù)爆炸問(wèn)題。事實(shí)證明，在各種金融問(wèn)題上，尤其是在股票市場(chǎng)分析領(lǐng)域，CNN 明顯優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)[42-44]。CNN 主要由卷積層、池層和全連通層組成，并采用反向傳播算法進(jìn)行訓(xùn)練。據(jù)本文所知，Golbayani 等[34]是第一個(gè)使用CNN 進(jìn)行企業(yè)信用評(píng)級(jí)的。他們使用了包含dropout 和early stopping 算法的CNN 模型和二維卷積CNN2D 模型，這兩個(gè)模型都由兩個(gè)卷積層和兩個(gè)完全連接的層組成。它們之間的區(qū)別在于，在CNN 模型中，卷積核只朝一個(gè)方向移動(dòng)，而在CNN2D 模型中，卷積核朝兩個(gè)方向移動(dòng)。該研究還提出了一個(gè)雙向方差分析模型，用于比較網(wǎng)絡(luò)體系結(jié)構(gòu)的多種性能。一個(gè)重要的事實(shí)是并非所有公司都能提供每年的信用評(píng)級(jí)分?jǐn)?shù)或財(cái)務(wù)信息。與MLP 相比，CNN 由于可以有效地調(diào)整特征權(quán)重，在處理缺失數(shù)據(jù)方面取得了良好的效果。

各種基于CNN 的衍生模型廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理領(lǐng)域，但它們不適用于金融場(chǎng)景。以往的研究只能提取企業(yè)數(shù)據(jù)的一維特征，受計(jì)算機(jī)視覺(jué)領(lǐng)域?qū)ΧS特征處理方式的啟發(fā)，F(xiàn)eng 等[45]構(gòu)建的CCR-CNN 模型為每個(gè)企業(yè)生成了一張包含每個(gè)二維財(cái)務(wù)信息的圖像，該圖像被輸入CNN 結(jié)構(gòu)并獲得分類結(jié)果。該模型的優(yōu)點(diǎn)在于捕捉了企業(yè)指標(biāo)之間獨(dú)特的二維關(guān)系特性和構(gòu)圖，這在以往的模型中是被忽視的。

然而，企業(yè)信用評(píng)級(jí)是動(dòng)態(tài)的并與時(shí)間因素密切相關(guān)。對(duì)于建立基于連續(xù)時(shí)間的企業(yè)信用評(píng)級(jí)模型，循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）是一種合適的算法。

3.3 循環(huán)神經(jīng)網(wǎng)絡(luò)

盡管RNN 在時(shí)間序列問(wèn)題的研究中取得了顯著的成果，但反向傳播算法引起的梯度消失和梯度爆炸給RNN 的訓(xùn)練帶來(lái)了很大的困難。長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)（LSTM）是RNN 的一種變體，它通過(guò)選通機(jī)制將短時(shí)記憶和長(zhǎng)時(shí)記憶結(jié)合起來(lái)，在一定程度上解決了梯度爆炸和消失的問(wèn)題。LSTM 具有較高的計(jì)算復(fù)雜度，RNN 的選通遞歸單元（GRU）可以節(jié)省計(jì)算成本，同時(shí)確保相當(dāng)高的精度。注意機(jī)制可以進(jìn)一步節(jié)省計(jì)算成本。其原理是通過(guò)分配權(quán)重，從大量信息中選擇對(duì)當(dāng)前任務(wù)更關(guān)鍵的信息。注意力分布是通過(guò)計(jì)算向量的相似性或相關(guān)性來(lái)實(shí)現(xiàn)的。目前，大多數(shù)基于注意力的模型都屬于編碼器-解碼器框架內(nèi)。例如transformer 的并行計(jì)算可以顯著減少訓(xùn)練時(shí)間。此外，Bert、deep transformer 和transformerXL 等也屬于該框架。

Golbayani 等[34]將CNN 與LSTM 進(jìn)行了比較，并通過(guò)實(shí)驗(yàn)分析證明后者在處理企業(yè)信用評(píng)級(jí)問(wèn)題上更為有效。他們用32 個(gè)LSTM 單元和兩個(gè)全連接層構(gòu)建模型。SMAGRU[33]是第一個(gè)將長(zhǎng)期關(guān)注機(jī)制應(yīng)用在企業(yè)信用評(píng)級(jí)的模型。SMAGRU 由6 個(gè)相同的模塊堆疊而成，每個(gè)模塊由多頭自我注意機(jī)制和全連接的前饋網(wǎng)絡(luò)組成。多頭注意力類似于CNN 中的多個(gè)過(guò)濾器，有助于捕捉更全面的信息。該體系結(jié)構(gòu)基于GRU，具有多頭自注意機(jī)制，能夠捕捉時(shí)間序列的特征。多頭自注意機(jī)制通過(guò)增強(qiáng)時(shí)間特征提高了分類精度和收斂速度。此外，多頭自注意機(jī)制和門控遞歸神經(jīng)網(wǎng)絡(luò)也能很好地適應(yīng)高維稀疏數(shù)據(jù)，這對(duì)解決企業(yè)信用評(píng)級(jí)問(wèn)題來(lái)說(shuō)十分合適。

3.4 基于定性信息的神經(jīng)網(wǎng)絡(luò)

大多數(shù)評(píng)級(jí)方法使用定量數(shù)據(jù)（如財(cái)務(wù)信息和資本流動(dòng)性），但定性數(shù)據(jù)（如公司的戰(zhàn)略布局、輿論和管理效率）也對(duì)信用評(píng)級(jí)有重要影響。信用評(píng)級(jí)是為了指導(dǎo)投資者投資未來(lái)，但使用的財(cái)務(wù)數(shù)據(jù)是基于公司的歷史運(yùn)營(yíng)情況。財(cái)務(wù)數(shù)據(jù)也不能完全反映企業(yè)的經(jīng)濟(jì)環(huán)境，標(biāo)準(zhǔn)普爾還使用報(bào)告和管理層訪談來(lái)補(bǔ)充評(píng)級(jí)模型?；诙ㄐ孕畔⒌纳窠?jīng)網(wǎng)絡(luò)使用文本數(shù)據(jù)挖掘方法，使得模型分類結(jié)果不完全依賴于定量數(shù)據(jù)分布，是對(duì)信用評(píng)級(jí)模型方法的重要補(bǔ)充。

將文本轉(zhuǎn)換為嵌入向量的常用方法有詞包模型（BOW）、Word2Vec 和Doc2Vec。BOW 最早被提出，它將文檔視為一組單詞，忽略了詞序、語(yǔ)法和語(yǔ)法等元素。BOW 假設(shè)文檔中的每個(gè)單詞都獨(dú)立出現(xiàn)。向量的每個(gè)維度都與語(yǔ)料庫(kù)中的單詞一一對(duì)應(yīng)，維度值表明了單詞的重要性。詞頻-逆文檔頻度（TF-IDF）是計(jì)算單詞相對(duì)重要性最常用的方法。Word2Vec 假設(shè)在上下文中經(jīng)常同時(shí)出現(xiàn)的單詞具有相似的含義，并將單詞嵌入到一個(gè)連續(xù)的向量空間中。訓(xùn)練神經(jīng)網(wǎng)絡(luò)的目的是根據(jù)輸入的單詞準(zhǔn)確地預(yù)測(cè)目標(biāo)單詞。Word2Vec 有兩種最常見(jiàn)的架構(gòu)：CBOW 模型和Skip-Gram 模型。CBOW 模型使用相鄰單詞的一個(gè)熱編碼作為輸入并預(yù)測(cè)單詞。相反Skip-Gram 模型使用單詞的一個(gè)熱編碼并預(yù)測(cè)其相鄰單詞[46]。Doc2Vec[47]為Word2Vec 添加了一個(gè)段落向量，可用于嵌入可變長(zhǎng)度文本，如句子、段落和文檔。

Choi 等[37]使用上述3 種文本嵌入方法獲得向量，并將向量分別輸入到ANN、SVM 和RF 模型中。實(shí)驗(yàn)結(jié)果表明，使用定量財(cái)務(wù)數(shù)據(jù)和定性文本數(shù)據(jù)訓(xùn)練的模型比僅使用定量財(cái)務(wù)數(shù)據(jù)和定性文本數(shù)據(jù)訓(xùn)練的模型具有更高的精度。模型精度從低到高依次為Word2Vec、Doc2Vec 和BOW。BOW 獲得最高精度的原因可能是訓(xùn)練數(shù)據(jù)集很小。用于訓(xùn)練的管理層討論與分析文本數(shù)據(jù)的長(zhǎng)度很長(zhǎng)，Doc2Vec 比Word2Vec 更擅長(zhǎng)處理更長(zhǎng)的文檔。今后使用更大的數(shù)據(jù)集進(jìn)行訓(xùn)練是提高Doc2Vec 精度的一種方法。Feng 等[48]對(duì)定性數(shù)據(jù)進(jìn)行了一次熱編碼，然后使用嵌入層將定量金融數(shù)據(jù)與定性數(shù)據(jù)連接，輸入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。

3.5 圖神經(jīng)網(wǎng)絡(luò)

當(dāng)一個(gè)行業(yè)的市場(chǎng)不景氣時(shí)，相關(guān)企業(yè)的評(píng)級(jí)結(jié)果往往也會(huì)變得很糟。企業(yè)之間的關(guān)系也是企業(yè)信用評(píng)級(jí)尚未探索的影響因素之一。然而，現(xiàn)有的大多數(shù)使用圖神經(jīng)網(wǎng)絡(luò)的模型都是基于全球視角對(duì)企業(yè)進(jìn)行研究。它們直接在企業(yè)之間建立網(wǎng)絡(luò)，而不考慮單個(gè)企業(yè)內(nèi)部特征的相互作用（例如債務(wù)和資本結(jié)構(gòu)之間的關(guān)系）。

CCR-GNN[48]是第一個(gè)應(yīng)用圖神經(jīng)網(wǎng)絡(luò)（GNN）研究企業(yè)信用評(píng)級(jí)的模型。CCR-GNN 并不是簡(jiǎn)單地將企業(yè)視為一個(gè)節(jié)點(diǎn)，而是考慮到單個(gè)企業(yè)內(nèi)部特征的交互作用，為每個(gè)企業(yè)構(gòu)建一個(gè)圖。CCR-GNN包括三層子神經(jīng)網(wǎng)絡(luò)：首先，根據(jù)特征之間的關(guān)系將每個(gè)企業(yè)映射為一個(gè)圖結(jié)構(gòu)；然后，這些特征通過(guò)圖形注意層的交互來(lái)捕獲局部和全局企業(yè)信用信息；最后，信用評(píng)級(jí)層根據(jù)這些企業(yè)信用信息輸出類別。通過(guò)疊加多個(gè)圖形注意層，CCR-GNN 可以清晰地探索高階特征交互，特征節(jié)點(diǎn)的企業(yè)信用信息通過(guò)注意機(jī)制傳輸?shù)较噜徆?jié)點(diǎn)。

3.6 基于對(duì)抗和半監(jiān)督的神經(jīng)網(wǎng)絡(luò)

中小企業(yè)的財(cái)務(wù)信息不足，而且沒(méi)有足夠的資金支持評(píng)級(jí)。因此，以往對(duì)企業(yè)信用評(píng)級(jí)的研究往往只考慮大型企業(yè)。然而，中小企業(yè)的財(cái)務(wù)數(shù)據(jù)也具有研究?jī)r(jià)值。半監(jiān)督學(xué)習(xí)算法為解決這一問(wèn)題提供了可能性?；谙嗨茦颖揪哂邢嗨戚敵龅募僭O(shè)，半監(jiān)督學(xué)習(xí)同時(shí)使用標(biāo)記數(shù)據(jù)和未標(biāo)記數(shù)據(jù)來(lái)訓(xùn)練模型。對(duì)抗學(xué)習(xí)是指基于對(duì)攻擊能力和攻擊結(jié)果的理解，訓(xùn)練能夠抵抗攻擊的網(wǎng)絡(luò)機(jī)器學(xué)習(xí)算法。實(shí)現(xiàn)對(duì)抗學(xué)習(xí)的方法是使兩個(gè)網(wǎng)絡(luò)相互競(jìng)爭(zhēng)，其中生成器網(wǎng)絡(luò)向樣本中添加噪聲來(lái)構(gòu)造偽數(shù)據(jù)，判別器網(wǎng)絡(luò)判斷數(shù)據(jù)的真實(shí)性。通過(guò)反復(fù)對(duì)抗，生成器和判別器的能力將不斷增強(qiáng)。

然而，F(xiàn)eng 等[49]發(fā)現(xiàn)，僅使用半監(jiān)督學(xué)習(xí)會(huì)導(dǎo)致監(jiān)督任務(wù)和半監(jiān)督任務(wù)之間的表征錯(cuò)位問(wèn)題。ASSL4CCR 中引入了編碼器模塊和對(duì)抗學(xué)習(xí)來(lái)緩解這種現(xiàn)象。ASSL4CCR 包括兩個(gè)階段，第一階段是通過(guò)半監(jiān)督學(xué)習(xí)獲得偽標(biāo)簽；在第二階段，編碼器模塊的映射將標(biāo)記數(shù)據(jù)與偽標(biāo)記數(shù)據(jù)結(jié)合起來(lái)，判別器模塊用于區(qū)分?jǐn)?shù)據(jù)來(lái)自真標(biāo)簽還是偽標(biāo)簽。

3.7 基于預(yù)訓(xùn)練和自監(jiān)督的神經(jīng)網(wǎng)絡(luò)

除了集成學(xué)習(xí)外，自監(jiān)督學(xué)習(xí)也可以在一定程度上緩解企業(yè)信用數(shù)據(jù)集的類別不平衡問(wèn)題。在基于神經(jīng)網(wǎng)絡(luò)的方法中，半監(jiān)督學(xué)習(xí)和自監(jiān)督學(xué)習(xí)對(duì)標(biāo)簽的依賴性相對(duì)減弱，所以類別分布差異對(duì)該方法影響相對(duì)較小。自監(jiān)督學(xué)習(xí)主要通過(guò)輔助任務(wù)從無(wú)監(jiān)督數(shù)據(jù)中挖掘監(jiān)督信息，下游任務(wù)的有價(jià)值表示是通過(guò)構(gòu)建的監(jiān)督信息來(lái)學(xué)習(xí)的。CP4CCR[50]將特征掩蔽和特征交換作為兩個(gè)自監(jiān)督的任務(wù)，對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練。該工作提出，相對(duì)于其他常用的編碼模塊，企業(yè)信用評(píng)級(jí)模型更好的編碼模塊是transformer。

3.8 基于可解釋性學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)

在金融領(lǐng)域，提高模型的可解釋性至關(guān)重要，高解釋性模型便于分析師判斷哪些特征對(duì)評(píng)級(jí)更有顯著性。相較于深度學(xué)習(xí)算法的黑匣子特性，基于可解釋性學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)更適合解決這個(gè)問(wèn)題。機(jī)器學(xué)習(xí)方法的可解釋性可分為內(nèi)在解釋和事后解釋。內(nèi)在解釋意味著模型本身是可解釋的。事后解釋意味著訓(xùn)練黑盒模型（如集成方法或神經(jīng)網(wǎng)絡(luò)），并在訓(xùn)練后應(yīng)用可解釋性方法[51]。文獻(xiàn)[52]提出了一種基于企業(yè)信用評(píng)級(jí)的事后解釋的稀疏算法。該工作通過(guò)稀疏算法對(duì)此問(wèn)題做出了反事實(shí)解釋。此外，該研究還發(fā)現(xiàn)，信用評(píng)級(jí)越高，企業(yè)提高信用評(píng)級(jí)的難度就越大。通過(guò)對(duì)模型進(jìn)行解釋，可以探索如何以最少的成本來(lái)達(dá)到提高信用評(píng)級(jí)分?jǐn)?shù)的目的。這樣的思想開(kāi)辟了企業(yè)信用評(píng)級(jí)模型的新思路。

總的來(lái)講，基于神經(jīng)網(wǎng)絡(luò)的模型對(duì)于特征工程的要求相對(duì)較低，考慮到評(píng)級(jí)信息時(shí)序變化的特點(diǎn)以及企業(yè)間關(guān)系，綜合了機(jī)器學(xué)習(xí)模型難以捕捉的定性信息，緩解了數(shù)據(jù)分布不均的問(wèn)題。這類模型逐年取代以往的統(tǒng)計(jì)模型和機(jī)器學(xué)習(xí)模型，成為信用評(píng)級(jí)的主流。然而神經(jīng)網(wǎng)絡(luò)更依賴于大量數(shù)據(jù)集，可解釋性也不高，未來(lái)還有相當(dāng)大的發(fā)展空間。

4 結(jié)論與展望

企業(yè)信用評(píng)級(jí)模型作為中國(guó)評(píng)級(jí)企業(yè)的卡脖子技術(shù)，近年來(lái)受到越來(lái)越多的關(guān)注。通過(guò)對(duì)以往文獻(xiàn)的總結(jié)，本文系統(tǒng)地分析了企業(yè)信用評(píng)級(jí)的起源與發(fā)展。從傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)模型、基于機(jī)器學(xué)習(xí)的評(píng)級(jí)模型和基于神經(jīng)網(wǎng)絡(luò)的評(píng)級(jí)模型3 個(gè)層面深入地介紹了信用評(píng)級(jí)的方法。

當(dāng)下信用評(píng)級(jí)模型已經(jīng)非常豐富，企業(yè)信用評(píng)級(jí)領(lǐng)域取得了快速發(fā)展。時(shí)間與金錢成本被降低，新方法的提出打破了評(píng)級(jí)機(jī)構(gòu)的壟斷門檻，小微企業(yè)也可以獲得相應(yīng)的評(píng)級(jí)。此外，隨著神經(jīng)網(wǎng)絡(luò)方法的引進(jìn)，評(píng)級(jí)準(zhǔn)確率獲得了顯著提升，模型中帶有分析師個(gè)人色彩的主觀性也被降低。

然而，目前在信用評(píng)級(jí)領(lǐng)域依然有很多待解決的問(wèn)題。擁有全面的金融信息的依然是大型企業(yè)，小微企業(yè)由于缺少相應(yīng)數(shù)據(jù)而評(píng)級(jí)困難。此外，擁有評(píng)級(jí)標(biāo)簽的企業(yè)大部分都是信用良好的企業(yè)，等級(jí)低的企業(yè)少之又少，數(shù)據(jù)集類別嚴(yán)重不均衡，給評(píng)級(jí)過(guò)程帶來(lái)了很大的困難?，F(xiàn)有模型所使用的數(shù)據(jù)集都是由研究者自己構(gòu)建，缺乏開(kāi)源統(tǒng)一而廣泛使用的數(shù)據(jù)集。統(tǒng)一的數(shù)據(jù)集有助于比較不同模型的性能。在深度學(xué)習(xí)廣泛應(yīng)用之前，傳統(tǒng)評(píng)級(jí)廣泛采用定性與定量結(jié)合的辦法。然而近年來(lái)發(fā)展迅速的深度學(xué)習(xí)方法大部分只使用了定量數(shù)據(jù)進(jìn)行分析。

此外，信用評(píng)級(jí)問(wèn)題多被深度學(xué)習(xí)模型視為分類問(wèn)題，忽視了評(píng)級(jí)對(duì)排序的敏感性?；谏窠?jīng)網(wǎng)絡(luò)企業(yè)信用評(píng)級(jí)模型的可解釋性依然有待商榷，是金融從業(yè)者的心頭之患。圖1 展示了不同行業(yè)的企業(yè)評(píng)級(jí)的分布情況。由于不同行業(yè)之間差異比較大，企業(yè)信用評(píng)級(jí)模型需要考慮到不同行業(yè)間的經(jīng)營(yíng)特色，未來(lái)仍有改進(jìn)空間。評(píng)級(jí)結(jié)果只能部分體現(xiàn)企業(yè)經(jīng)營(yíng)狀況，如何幫助企業(yè)提高經(jīng)營(yíng)能力，提高信用評(píng)級(jí)等級(jí)，是未來(lái)該領(lǐng)域一個(gè)新的研究視角。

在企業(yè)信用評(píng)級(jí)的建模方面，圖神經(jīng)網(wǎng)絡(luò)依舊是一個(gè)熱點(diǎn)的方向，其集成了神經(jīng)網(wǎng)絡(luò)強(qiáng)大的表達(dá)能力和圖結(jié)構(gòu)數(shù)據(jù)的可解釋能力，如何充分利用圖神經(jīng)網(wǎng)絡(luò)建模是一個(gè)重要的研究方向，不論是從特征建圖還是從企業(yè)建圖都是很好的方法，異質(zhì)圖網(wǎng)絡(luò)的引入可以將企業(yè)多種關(guān)系聯(lián)合建模。此外，由于企業(yè)信用特征與信息是實(shí)時(shí)變化的，現(xiàn)有的圖網(wǎng)絡(luò)建模方法多是基于靜態(tài)圖，基于動(dòng)態(tài)圖網(wǎng)絡(luò)進(jìn)行評(píng)級(jí)的工作有相當(dāng)大的空缺。動(dòng)態(tài)圖網(wǎng)絡(luò)的建模方法也可以將時(shí)序信息引入，使評(píng)級(jí)涵蓋因素更廣泛。企業(yè)信用評(píng)級(jí)的研究前景廣闊，還有很大的空間去探索。

利益沖突聲明

所有作者聲明不存在利益沖突關(guān)系。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡