吳育輝 劉忻忻 陳韞妍
【摘 要】 自2014年我國債券市場首例違約事件發(fā)生以來,債券違約屢見不鮮。文章以2014—2022年發(fā)行的公司債、企業(yè)債和中期票據(jù)為研究對象,選取財(cái)務(wù)指標(biāo)與非財(cái)務(wù)指標(biāo),搭建了基于機(jī)器學(xué)習(xí)算法SMOTETomek-GWO-XGBoost的債券違約風(fēng)險預(yù)警模型。結(jié)果表明:(1)與其他方法相比,GWO-XGBoost模型在準(zhǔn)確率、召回率、未加權(quán)平均召回率以及AUC值這四個指標(biāo)上具有更加優(yōu)異的表現(xiàn);(2)SMOTETomek采樣方法可以有效平衡數(shù)據(jù)樣本,因此SMOTETomek-GWO- XGBoost模型具有更高的精度與穩(wěn)定性;(3)SHAP值法可以展示不同特征變量對債券違約風(fēng)險的貢獻(xiàn)度,有利于就重要特征進(jìn)行針對性分析。
【關(guān)鍵詞】 債券違約風(fēng)險; 風(fēng)險預(yù)警; 機(jī)器學(xué)習(xí); GWO-XGBoost; SMOTETomek
【中圖分類號】 F234.3;F832.5? 【文獻(xiàn)標(biāo)識碼】 A? 【文章編號】 1004-5937(2024)06-0073-09
一、引言
截至2022年末,我國債券市場總存量已經(jīng)達(dá)到了141.22萬億元,同比增長8.2%,這一龐大規(guī)模和快速增長的數(shù)據(jù)顯示出中國債券市場持續(xù)蓬勃發(fā)展的態(tài)勢。但值得注意的是,自2014年第一只違約債券出現(xiàn)以來,債券違約事件屢見不鮮。根據(jù)Wind數(shù)據(jù)庫的統(tǒng)計(jì),2022年我國債券違約總金額為861.95億元,新增違約主體37家,新增違約債券152只。在實(shí)體經(jīng)濟(jì)的發(fā)展過程中,債券市場發(fā)揮了促進(jìn)企業(yè)投資、融資活動的重要作用。然而,近年來屢屢發(fā)生的違約事件暴露出債券市場存在一定的信用風(fēng)險。通過分析債券違約的原因,本文希望找到防范化解債券違約風(fēng)險的有效途徑,從而為我國債券市場的高質(zhì)量發(fā)展提供有益參考。
債券違約事件的發(fā)生,不僅與宏觀經(jīng)濟(jì)環(huán)境及監(jiān)管政策的變化密不可分,而且與公司層面的經(jīng)營財(cái)務(wù)表現(xiàn)密切相關(guān)。此外,Bao等[ 1 ]研究發(fā)現(xiàn),相比于現(xiàn)有的大多數(shù)以解釋樣本欺詐行為并強(qiáng)調(diào)因果推理為主要目的研究,使用集成學(xué)習(xí)構(gòu)建的預(yù)測模型可以更準(zhǔn)確地對會計(jì)欺詐行為進(jìn)行預(yù)測。因此,本文從宏觀和微觀層面入手,結(jié)合財(cái)務(wù)指標(biāo)與非財(cái)務(wù)指標(biāo),運(yùn)用機(jī)器學(xué)習(xí)的方法對債券違約風(fēng)險進(jìn)行預(yù)測。
本文以我國2014—2022年企業(yè)債、公司債和中期票據(jù)為研究對象,結(jié)合SMOTETomek(Synthetic Minority Oversampling Technique Tomek Links)采樣算法以及GWO-XGBoost(Grey Wolf Optimizer Extreme Gradient Boosting)算法,構(gòu)建債券違約風(fēng)險預(yù)警模型。實(shí)證結(jié)果表明,該機(jī)器學(xué)習(xí)模型有較好的違約預(yù)測能力,在準(zhǔn)確率、召回率、未加權(quán)平均召回率以及AUC值(ROC曲線下的面積)四個指標(biāo)上均有不錯的表現(xiàn),為后續(xù)債券違約分析和預(yù)警提供了思路和依據(jù)。
本文的主要貢獻(xiàn)體現(xiàn)為兩個方面:(1)在研究方法上進(jìn)行改進(jìn)。相比傳統(tǒng)的XGBoost機(jī)器學(xué)習(xí)模型,本文先以GWO智能優(yōu)化算法對其進(jìn)行優(yōu)化。通過利用GWO算法計(jì)算出最優(yōu)的弱分類器數(shù)量(n_estimators)、學(xué)習(xí)率(learning_rate)以及最大深度(max_depth)的方式,對XGBoost模型的參數(shù)進(jìn)行調(diào)優(yōu)。在此基礎(chǔ)上,鑒于債券樣本非平衡的特點(diǎn),使用SMOTETomek采樣算法,有效提升了小類別樣本(即違約樣本)的識別率。(2)在選取非財(cái)務(wù)指標(biāo)上進(jìn)行改進(jìn)。本文創(chuàng)新性地引入了從上市公司年報(bào)中提取出的核心競爭力指標(biāo),并且發(fā)現(xiàn)該指標(biāo)的加入對提升債券違約預(yù)警模型的性能有較大幫助。
二、文獻(xiàn)綜述與理論分析
債券違約一直是金融領(lǐng)域的熱點(diǎn)話題之一。債券違約風(fēng)險的識別意味著對債權(quán)人發(fā)生違約的可能性進(jìn)行評估和預(yù)測。已有的研究主要從財(cái)務(wù)及非財(cái)務(wù)指標(biāo)的選擇、預(yù)測模型的建立,以及不平衡數(shù)據(jù)的處理這三個方面展開。
(一)指標(biāo)選取
在財(cái)務(wù)指標(biāo)方面,大量的研究將財(cái)務(wù)指標(biāo)用于財(cái)務(wù)危機(jī)預(yù)警和企業(yè)違約風(fēng)險的預(yù)測。具體而言,吳世農(nóng)和黃世忠[ 2 ]從資產(chǎn)變現(xiàn)率、負(fù)債狀況、資產(chǎn)使用效率以及盈利能力四個方面選取企業(yè)破產(chǎn)分析指標(biāo)。吳世農(nóng)和盧賢義[ 3 ]選取了包括資產(chǎn)收益率、負(fù)債比率以及資產(chǎn)周轉(zhuǎn)率等在內(nèi)的21個財(cái)務(wù)指標(biāo)。吳育輝和唐浩博[ 4 ]的研究中則包括了資產(chǎn)負(fù)債率與企業(yè)成長性(營業(yè)收入同比增長率)等上述研究中未出現(xiàn)的指標(biāo)。本文總結(jié)上述研究成果,從盈利能力、短期償債能力、長期償債能力、資產(chǎn)負(fù)債結(jié)構(gòu)、營運(yùn)能力、成長能力以及創(chuàng)現(xiàn)能力這七個維度出發(fā),選取了包括資產(chǎn)負(fù)債率、凈資產(chǎn)收益率、流動比率、總資產(chǎn)周轉(zhuǎn)天數(shù)、應(yīng)收賬款周轉(zhuǎn)天數(shù)、EBIT利潤率在內(nèi)的總計(jì)34個財(cái)務(wù)指標(biāo)。這些財(cái)務(wù)指標(biāo)可以幫助評估企業(yè)在不同層面的財(cái)務(wù)狀況和經(jīng)營業(yè)績,從而為企業(yè)的管理和決策提供有價值的信息。
在非財(cái)務(wù)指標(biāo)方面,本文考慮了宏觀、行業(yè)及企業(yè)三個層面。具體而言,首先是宏觀經(jīng)濟(jì)層面。呂峻和李梓房[ 5 ]以及盧永艷[ 6 ]研究發(fā)現(xiàn),GDP、GDP增長率、消費(fèi)者物價指數(shù)CPI以及狹義貨幣供給量M1的增長率這些宏觀經(jīng)濟(jì)指標(biāo)對公司陷入財(cái)務(wù)危機(jī)的影響顯著;戴雅榕和沈藝峰[ 7 ]的研究表明,政府作為“看不見”的手,其隱性擔(dān)保能力在債券違約預(yù)測中有著重要作用。因此,本文將GDP增速、CPI增速以及M1增速納入全國層面的經(jīng)濟(jì)指標(biāo),將GDP增速以及政府隱性擔(dān)保能力作為省級層面的經(jīng)濟(jì)指標(biāo)。其次是行業(yè)層面。Chava和Jarrow[ 8 ]指出不同行業(yè)面臨的競爭水平和破產(chǎn)可能性不同,成熟行業(yè)的破產(chǎn)率較高。此外,行業(yè)需求和行業(yè)集中度也會對企業(yè)破產(chǎn)概率產(chǎn)生影響。因此,本文選擇發(fā)債主體所在行業(yè)以及該行業(yè)的行業(yè)集中度作為行業(yè)指標(biāo)。最后是企業(yè)層面。根據(jù)吳世農(nóng)等[ 9 ]的研究,企業(yè)的核心競爭力越強(qiáng),未來的違約風(fēng)險越低。因此,本文創(chuàng)新性地選取對上市公司年報(bào)進(jìn)行文本分析和提煉得到的企業(yè)核心競爭力指標(biāo)作為企業(yè)的非財(cái)務(wù)指標(biāo),這是既往債券違約預(yù)測中并未出現(xiàn)過的指標(biāo)。
(二)模型選取
在獲取具有研究價值的實(shí)驗(yàn)指標(biāo)之后,通常需要利用統(tǒng)計(jì)方法或機(jī)器學(xué)習(xí)方法對大量數(shù)據(jù)進(jìn)行詳細(xì)分析。而在計(jì)量經(jīng)濟(jì)學(xué)中,主要使用統(tǒng)計(jì)方法分析指標(biāo)間的相關(guān)性,并通過利用其理論背景對結(jié)果進(jìn)行解釋[ 10 ]。相比統(tǒng)計(jì)方法,機(jī)器學(xué)習(xí)方法在檢測數(shù)據(jù)特征的非線性關(guān)系以及處理大量數(shù)據(jù)等方面具有重要優(yōu)勢[ 11 ]。
在諸多主流機(jī)器學(xué)習(xí)模型中,XGBoost模型自2016年由Chen和Guestrin[ 12 ]提出以來,因其在分類和預(yù)測方面的效果明顯優(yōu)于傳統(tǒng)模型而廣泛應(yīng)用于風(fēng)險預(yù)測領(lǐng)域。Barboza等[ 13 ]的實(shí)驗(yàn)結(jié)果表明,在破產(chǎn)預(yù)測方面,Bagging、Boosting以及隨機(jī)森林(Random Forest,RF)比線性判別分析(Linear Discriminant Analysis,LDA)、邏輯回歸(Logistic Regression,LR)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)具有更好的性能。此外,Addo等[ 14 ]利用不同的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)對貸款違約行為進(jìn)行預(yù)測,證明了基于樹的模型比基于多層神經(jīng)網(wǎng)絡(luò)的模型更加穩(wěn)定。XGBoost模型作為機(jī)器學(xué)習(xí)模型用于債券違約預(yù)測,不僅在與傳統(tǒng)的邏輯回歸模型進(jìn)行比較時展現(xiàn)出一定的優(yōu)越性[ 15 ],而且相比基于樹的其他模型(如決策樹、梯度提升決策樹等),在AUC、準(zhǔn)確率、精確率、召回率以及F1值等指標(biāo)上均有優(yōu)勢[ 16 ]。
參考Chen等[ 17 ]的研究,當(dāng)數(shù)據(jù)樣本不平衡時,可以引入未加權(quán)平均召回率指標(biāo)對模型性能進(jìn)行評估。精確率與F1值在面對不平衡樣本時效果較差,故本文采用AUC、準(zhǔn)確率、召回率以及未加權(quán)平均召回率這四個指標(biāo)衡量由XGBoost模型構(gòu)建的債券違約風(fēng)險預(yù)測模型的性能。
然而,通過總結(jié)已有文獻(xiàn)得出一個結(jié)論,即單一預(yù)測模型的效果往往有限。為了更好地提高預(yù)測的精度,可以引入智能優(yōu)化算法來解決。EML(進(jìn)化機(jī)器學(xué)習(xí))是一類基于生物進(jìn)化理論的機(jī)器學(xué)習(xí)算法,它模擬自然界中的生物進(jìn)化過程,使用進(jìn)化計(jì)算的方法來優(yōu)化模型參數(shù)或解決優(yōu)化問題。EML算法包括遺傳算法(Genetic Algorithm,GA)、粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)、模擬退火算法(Simulated Annealing,SA)以及灰狼優(yōu)化算法(Grey Wolf Optimization,GWO)等,在財(cái)務(wù)領(lǐng)域廣泛應(yīng)用。Ansari等[ 18 ]通過使用粒子群優(yōu)化算法(PSO)來改進(jìn)人工神經(jīng)網(wǎng)絡(luò)模型,成功降低了人工神經(jīng)網(wǎng)絡(luò)權(quán)值訓(xùn)練所需的時間復(fù)雜度,提高了ANN進(jìn)行破產(chǎn)預(yù)測的效率和準(zhǔn)確率。Wang等[ 19 ]利用灰狼優(yōu)化算法(GWO)構(gòu)建了一種用于破產(chǎn)預(yù)測的新型KELM(內(nèi)核極限學(xué)習(xí)機(jī))模型,其在準(zhǔn)確性、I型和II型誤差、AUC值以及計(jì)算時間方面都表現(xiàn)出了優(yōu)越性。除此之外,肖艷麗和向有濤[ 20 ]的研究發(fā)現(xiàn),GWO-XGBoost模型相比SVM(支持向量機(jī))、KNN(K-近鄰)、決策樹、LDA以及RF等模型,在預(yù)測精度、穩(wěn)定性和統(tǒng)計(jì)意義方面都具有更優(yōu)異的性能,并對數(shù)據(jù)預(yù)測和決策具有重要的應(yīng)用價值。前人的研究為本文提供了研究思路,即在進(jìn)行預(yù)測任務(wù)時,可以考慮使用智能優(yōu)化算法來輔助模型的選擇和調(diào)整,從而獲得更準(zhǔn)確的預(yù)測結(jié)果。
但需要注意的是,在利用機(jī)器學(xué)習(xí)分析債券違約問題時,除了要關(guān)注預(yù)測精度的提升以外,還應(yīng)重視模型結(jié)果的可解釋性,盡量避免“黑箱”問題。近年來,源于Shapley值概念的SHapley Additive exPlanations(SHAP)值[ 21 ]在復(fù)雜模型的解釋中得到了頻繁的應(yīng)用。SHAP值可以幫助衡量每個屬性對預(yù)測分類的貢獻(xiàn),從而解釋復(fù)雜模型的預(yù)測結(jié)果。通過將不同屬性的SHAP值及其排名可視化,可以為進(jìn)一步探索不同屬性與債券違約之間的因果關(guān)系提供理論依據(jù)。
(三)不平衡數(shù)據(jù)處理
在債券違約風(fēng)險研究領(lǐng)域,數(shù)據(jù)的不平衡性是一個常見的問題。違約的樣本相較未違約的樣本而言只占全樣本的少數(shù),因此在模型的訓(xùn)練過程中,往往會出現(xiàn)對少數(shù)類的識別精度較低的情況。不平衡的數(shù)據(jù)需要從數(shù)據(jù)層面或者算法層面加以處理。在算法層面,可以通過成本敏感型學(xué)習(xí)模型以及集成學(xué)習(xí)模型解決數(shù)據(jù)不平衡的問題;而在數(shù)據(jù)層面,可以通過采樣方法來平衡數(shù)據(jù)[ 22 ]。上述方法中,采樣方法是最為常用的解決數(shù)據(jù)不平衡問題的方法。
合成少數(shù)過采樣技術(shù)(SMOTE)是一種主流的過采樣方法,通過對少數(shù)類進(jìn)行線性插值來生成新的綜合訓(xùn)練數(shù)據(jù)。然而SMOTE方法對少數(shù)類的隨機(jī)添加,可能會導(dǎo)致過度泛化和噪聲數(shù)據(jù)的產(chǎn)生[ 23 ]。為了提高SMOTE方法的性能,可以采用欠采樣方法來清理多數(shù)類中的噪聲數(shù)據(jù)。一種基于SMOTE過采樣方法開發(fā)出的SMOTE-Tomek Links方法,結(jié)合了SMOTE過采樣方法和Tomek Links欠采樣方法的特點(diǎn),既保留了有效信息,又可以去除具有相似特征和重疊的噪聲數(shù)據(jù),從而減輕了邊界模糊問題[ 24 ]。相比單獨(dú)使用SMOTE方法,SMOTE-Tomek Links方法可以更有效地改善數(shù)據(jù)不平衡性,并提高模型識別少數(shù)類的準(zhǔn)確性。因此,本文采用SMOTE-Tomek Links方法(簡稱SMOTETomek)作為非平衡數(shù)據(jù)的處理方法。
三、研究設(shè)計(jì)
(一)指標(biāo)選取
1.財(cái)務(wù)指標(biāo)
根據(jù)前文的文獻(xiàn)梳理,選取以下財(cái)務(wù)指標(biāo)進(jìn)行分析:
(1)盈利能力:銷售毛利率、銷售凈利率、EBIT利潤率、營業(yè)利潤率、總資產(chǎn)凈利率(ROA)、凈資產(chǎn)收益率(ROE)、投入資本回報(bào)率(ROIC)。
(2)短期償債能力:流動比率、速動比率、現(xiàn)金比率。
(3)長期償債能力:資產(chǎn)負(fù)債率、凈現(xiàn)金負(fù)債率、有息負(fù)債權(quán)益比、利息保障倍數(shù)。
(4)資產(chǎn)負(fù)債結(jié)構(gòu):經(jīng)營風(fēng)險、資產(chǎn)結(jié)構(gòu)、負(fù)債結(jié)構(gòu)。
(5)營運(yùn)能力:總資產(chǎn)周轉(zhuǎn)天數(shù)、存貨周轉(zhuǎn)天數(shù)、應(yīng)收賬款周轉(zhuǎn)天數(shù)、應(yīng)付賬款周轉(zhuǎn)天數(shù)、預(yù)收賬款周轉(zhuǎn)天數(shù)、預(yù)付賬款周轉(zhuǎn)天數(shù)、現(xiàn)金周轉(zhuǎn)天數(shù)、凈營運(yùn)周期。
(6)成長能力:營業(yè)收入增長率、凈利潤增長率、歸母扣非凈利潤增長率、經(jīng)營活動凈現(xiàn)金增長率、凈現(xiàn)金增長率、總資產(chǎn)增長率、凈資產(chǎn)增長率。
(7)創(chuàng)現(xiàn)能力:收入獲現(xiàn)率、利潤獲現(xiàn)率。
2.非財(cái)務(wù)指標(biāo)
根據(jù)前文分析,選擇以下指標(biāo)作為非財(cái)務(wù)指標(biāo):
(1)宏觀經(jīng)濟(jì)指標(biāo):全國層面包括GDP增速、CPI增速以及M1增速,省級層面包括地方GDP增速以及地方政府隱性擔(dān)保能力。
(2)行業(yè)指標(biāo):發(fā)債主體所屬行業(yè)以及行業(yè)集中度。
(3)企業(yè)非財(cái)務(wù)指標(biāo):上市公司核心競爭力指標(biāo)。這部分指標(biāo)參考吳世農(nóng)等[ 9 ]的研究,利用Word2Vec模型以及命名實(shí)體識別法(NER)等文本分析技術(shù),從2012—2022年中國A股上市公司年報(bào)中提取得出,主要包括傳統(tǒng)資源指標(biāo)(Tradition)、人才資源指標(biāo)(Human)、品牌資源指標(biāo)(Brand)、政策資源指標(biāo)(Policy)、經(jīng)營能力指標(biāo)(Operation)、創(chuàng)新能力指標(biāo)(Innovation)、管控能力指標(biāo)(Management)、產(chǎn)業(yè)鏈協(xié)同能力指標(biāo)(Industrychain)、社會責(zé)任履行能力指標(biāo)(Society)以及其他能力指標(biāo)(Other)共10個二級指標(biāo),通過上述二級指標(biāo)求和得出上市公司核心競爭力綜合指標(biāo)(Core)。
指標(biāo)定義見表1。
(二)數(shù)據(jù)選取與處理
本文數(shù)據(jù)均來源于Wind數(shù)據(jù)庫。考慮到首次出現(xiàn)實(shí)質(zhì)違約的樣本可能不具代表性,并且刪除發(fā)行日期早于2014年的樣本有助于調(diào)整小類別樣本的比例,因此本文選擇了2014年1月至2022年12月之間發(fā)行的債券作為研究對象。已到期債券未來沒有違約的可能,因此,本文選取已到期非違約公司債、企業(yè)債和中期票據(jù)數(shù)據(jù)作為模型的正向樣本,同時選取了在此期間發(fā)生違約的全部公司債、企業(yè)債和中期票據(jù)數(shù)據(jù)作為模型的負(fù)向樣本,即違約樣本。樣本去重后,得到正向樣本8 002條,負(fù)向樣本346條,總體樣本8 348條。在匹配核心競爭力指標(biāo)(Core)且剔除樣本缺失值后,得到本文最終樣本共計(jì)1 279條,其中債券違約樣本106條。
為了排除異常值的影響,本文對財(cái)務(wù)數(shù)據(jù)進(jìn)行了上下1%的Winsorize縮尾處理。由于樣本存在部分缺失值,本文采用各屬性的行業(yè)中值來填補(bǔ)缺失值,并對填補(bǔ)后的數(shù)據(jù)進(jìn)行了歸一化處理,將數(shù)據(jù)范圍限制在[0,1]之間。
債券發(fā)行前3年披露的數(shù)據(jù)能夠提供較為全面的歷史信息,有助于捕捉可能對違約風(fēng)險產(chǎn)生影響的因素。因此,本文以債券發(fā)行前3年的數(shù)據(jù)作為樣本,以考察各項(xiàng)財(cái)務(wù)指標(biāo)的表現(xiàn)。舉例來說,當(dāng)選擇銷售毛利率這一指標(biāo)時,需要相應(yīng)地提取債券發(fā)行前3年的銷售毛利率數(shù)據(jù),即銷售毛利率(t-3)、銷售毛利率(t-2)以及銷售毛利率(t-1)。其中,t表示發(fā)行起始年,t-1表示發(fā)行日期的前一年,以此類推。
(三)研究模型設(shè)計(jì)
1.XGBoost模型
XGBoost(EXtreme Gradient Boosting)是一種集成學(xué)習(xí)算法,它結(jié)合了梯度提升算法(Gradient Boosting)和決策樹模型,被廣泛應(yīng)用于回歸和分類問題。該算法采用Boosting思想中的加法模型,通過逐步構(gòu)建一系列弱分類器,并將它們的預(yù)測結(jié)果進(jìn)行集成來提升整體性能。
2.GWO算法
XGBoost模型的參數(shù)選擇對模型的預(yù)測結(jié)果具有重要影響。本文選擇灰狼優(yōu)化算法(GWO)來優(yōu)化XGBoost模型的學(xué)習(xí)率(learning_rate)、弱分類器個數(shù)(n_estimators)以及最大深度(max_depth)的參數(shù)設(shè)置,并應(yīng)用GWO-XGBoost模型來預(yù)警企業(yè)債券違約風(fēng)險?;依撬惴ㄊ且环N啟發(fā)式優(yōu)化算法,它由灰狼的種群機(jī)制推演而來,通過對掠奪行為的不斷迭代,最終找到最佳解。該算法具有搜索速度快、易得到全局最優(yōu)解和穩(wěn)定性較強(qiáng)等優(yōu)勢。
3.SMOTE-Tomek采樣模型
SMOTE和Tomek Links是兩種常用的處理不平衡數(shù)據(jù)集的方法。它們可以結(jié)合使用,形成一種稱為SMOTE-Tomek的組合方法。SMOTE-Tomek算法首先使用SMOTE對少數(shù)類別進(jìn)行過采樣,創(chuàng)建合成樣本,然后使用Tomek Links方法刪除生成的合成樣本與原始樣本之間的膠著樣本對,以改進(jìn)不同類之間的分離程度。這種組合方法旨在增強(qiáng)不平衡數(shù)據(jù)集的分類性能,并為少數(shù)類預(yù)測提供更穩(wěn)健的模型。
四、研究結(jié)果
(一)評價指標(biāo)
選擇適當(dāng)?shù)哪P驮u價指標(biāo)對準(zhǔn)確評估和比較不同模型的性能至關(guān)重要。由于債券違約風(fēng)險預(yù)測問題本質(zhì)上是二分類問題,本文以不平衡二分類問題中常用的準(zhǔn)確率(Accuracy)、召回率(Recall)、未加權(quán)平均召回率(UAR)以及AUC值作為模型的評價指標(biāo)。
對于每一個測試樣本,模型有四種可能的預(yù)測結(jié)果,如表2所示。
以下是對上述指標(biāo)的具體介紹:
1.準(zhǔn)確率(Accuracy)
準(zhǔn)確率是最直觀和常用的指標(biāo),它表示模型預(yù)測正確的樣本占總樣本的比例。但在數(shù)據(jù)不平衡的情況下,準(zhǔn)確率可能會因模型傾向于預(yù)測多數(shù)類別而產(chǎn)生誤導(dǎo),因此需要結(jié)合其他指標(biāo)進(jìn)行模型性能的評判。其具體計(jì)算公式如下:
2.召回率(Recall)
召回率衡量模型正確預(yù)測為正例的樣本占實(shí)際正例樣本的比例,高召回率表示模型能夠較好地識別出正例,對于關(guān)注正確預(yù)測實(shí)際正例的應(yīng)用非常重要。其具體計(jì)算公式為:
3.UAR(Unweighted Average Recall)
UAR針對實(shí)際的正樣本和負(fù)樣本計(jì)算相關(guān)概率,表示每類數(shù)據(jù)樣本召回率(Recall)的平均值。因此,當(dāng)樣本不平衡時可以使用UAR對模型進(jìn)行客觀評估。其具體公式為:
其中,Recall0代表特異度[等于TN/(TN+FP)],Recall1代表召回率,分母為2代表二分類問題。
4.AUC值
AUC值是ROC曲線下的面積,用于度量二分類模型預(yù)測結(jié)果的整體性能。ROC曲線繪制了模型在不同閾值下的真正率[TPR,等于TP/(TP+FN)]和假正率[FPR,等于FP/(FP+TN)]之間的關(guān)系。AUC值越高,表示模型的性能越好。
(二)模型結(jié)果分析
非財(cái)務(wù)指標(biāo)中的核心競爭力指標(biāo)從上市公司年報(bào)中提取而來,因此在結(jié)合該指標(biāo)后,樣本量會有較大幅度的減少。為了系統(tǒng)地探究不同模型在債券違約風(fēng)險預(yù)測方面的性能,以及不同特征與違約行為之間的聯(lián)系,本研究將實(shí)驗(yàn)劃分為三部分。第一部分,分別驗(yàn)證不同模型基于財(cái)務(wù)指標(biāo)以及全部指標(biāo)的債券違約預(yù)測能力;第二部分,利用SMOTE-Tomek采樣算法對模型進(jìn)行優(yōu)化;第三部分,使用SHAP值法分析各指標(biāo)對債券違約預(yù)測的影響力。
1.模型實(shí)驗(yàn)結(jié)果
本文對七個常用的機(jī)器學(xué)習(xí)模型進(jìn)行了比較和分析,這些模型包括GWO-XGBoost、XGBoost、ANN、RF、KNN、SVM以及LR。其中,GWO算法通過優(yōu)化XGBoost模型的準(zhǔn)確率來獲得最佳的弱分類器數(shù)量、學(xué)習(xí)率以及最大深度?;谪?cái)務(wù)特征的GWO-XGBoost模型最佳參數(shù)配置為n_estimators=250,learning_rate=0.3,max_depth=5;基于全部特征(即財(cái)務(wù)特征與非財(cái)務(wù)特征)的GWO-XGBoost模型最佳參數(shù)配置為n_estimators=300,learning_ rate=0.3,max_depth=6。
根據(jù)表3及圖1可知,無論基于財(cái)務(wù)特征還是基于全部特征,XGBoost模型的綜合性能都優(yōu)于其他5個模型。經(jīng)過GWO算法優(yōu)化后,基于財(cái)務(wù)特征的XGBoost模型在Recall、UAR和AUC值這三個指標(biāo)上都有明顯的提高,基于全部特征的XGBoost模型在四個指標(biāo)上的表現(xiàn)較默認(rèn)模型均有所提升。
通過觀察基于財(cái)務(wù)特征的GWO-XGBoost模型與XGBoost模型的預(yù)測值混淆矩陣(表4)可以發(fā)現(xiàn),由于GWO算法以準(zhǔn)確率為優(yōu)化目標(biāo),且數(shù)據(jù)的不平衡性較強(qiáng)(即債券違約樣本數(shù)量較少),因此,在提高準(zhǔn)確率的同時,可能會導(dǎo)致少量違約樣本被錯誤分類,進(jìn)而造成召回率的小幅下降。但值得注意的是,優(yōu)化后模型的UAR值與AUC值更高。其中,UAR指標(biāo)只關(guān)注自類數(shù)據(jù),即分別在正樣本和負(fù)樣本中觀察相關(guān)概率問題,因此,該指標(biāo)可以無視樣本不均衡的情況,對模型進(jìn)行客觀評估。而AUC指標(biāo)的計(jì)算方法同時考慮了學(xué)習(xí)器對正例和負(fù)例的分類能力,因此,該指標(biāo)在樣本不平衡的情況下同樣可以對分類器做出合理的評價。由此可知,當(dāng)模型具有更高的UAR值與AUC值時,說明該模型對不同樣本的識別能力更強(qiáng)且綜合表現(xiàn)更好。上述結(jié)論表明,基于本文中的數(shù)據(jù)樣本,使用GWO算法對XGBoost模型進(jìn)行優(yōu)化可以提升模型的性能。
在引入非財(cái)務(wù)指標(biāo)后,由于上市公司數(shù)量較少,樣本的數(shù)據(jù)量有了較大幅度的縮減,這導(dǎo)致模型可以學(xué)習(xí)到的信息減少。然而,與僅使用財(cái)務(wù)指標(biāo)的模型相比,使用全部指標(biāo)的模型準(zhǔn)確率以及UAR值都有所提高,同時,AUC值也有顯著提高。這表明雖然樣本數(shù)據(jù)的減少會對模型的訓(xùn)練造成一定的影響,但使用更全面的指標(biāo)能夠彌補(bǔ)這一缺點(diǎn),并提高模型的性能。使用全部指標(biāo)的模型能夠更好地識別出正例并且減少誤報(bào)率,具備更高的實(shí)用性和可靠性。
2.引入SMOTETomek采樣算法
使用SMOTETomek采樣算法后,原始數(shù)據(jù)經(jīng)過重新平衡,得到了以下分類情況:非違約樣本數(shù)量與違約樣本數(shù)量的比例為1:1。具體而言,僅包含財(cái)務(wù)特征的樣本中,非違約樣本和違約樣本的數(shù)量均為6 408條;而包含全部特征的樣本中,非違約樣本和違約樣本的數(shù)量均為942條。
由表5可以觀察到,在對數(shù)據(jù)進(jìn)行SMOTETomek采樣后,模型的召回率以及未加權(quán)平均召回率的值都有所提升,而AUC值和準(zhǔn)確率變化不大。綜合來看,通過采用SMOTETomek算法重新平衡數(shù)據(jù),可以在不降低模型性能的情況下,有效提高模型對少數(shù)樣本(即違約樣本)的識別能力并降低模型的偏差,使模型能夠更準(zhǔn)確地判斷正例和負(fù)例,并具有更高的實(shí)用價值。
3.特征重要性分析
Shapley Value是一種為合作博弈中的參與者分配收益的方法,衡量每個參與者對整個合作所產(chǎn)生的貢獻(xiàn)程度。在機(jī)器學(xué)習(xí)中,可以將特征看作參與者,將預(yù)測結(jié)果看作合作博弈的收益。SHAP值基于Shapley Value的思想,可以用來衡量每個特征對單個預(yù)測結(jié)果的貢獻(xiàn)。
從圖2可以看出,SHAP值排名中最重要的10個特征為:地方政府隱性擔(dān)保能力,預(yù)付賬款周轉(zhuǎn)天數(shù)(t-3),有息負(fù)債權(quán)益比(t-1),總資產(chǎn)同比增長率(t-2),存貨周轉(zhuǎn)天數(shù)(t-1),EBIT利潤率(t-1),預(yù)付賬款周轉(zhuǎn)天數(shù)(t-2),現(xiàn)金周轉(zhuǎn)天數(shù)(t-1),EBIT利潤率(t-3)以及ROE(t-1)。而在129個特征中,核心競爭力指標(biāo)的排名較為靠前,其中,C_Society排名14,C_Operation排名28,說明在進(jìn)行債券違約預(yù)測時,核心競爭力指標(biāo)具有較高的影響力。
在上述指標(biāo)中,最重要的兩個指標(biāo)為地方政府隱性擔(dān)保能力以及預(yù)付賬款周轉(zhuǎn)天數(shù)。本文以地方政府財(cái)政盈余與地方GDP增速的比值作為地方政府隱性擔(dān)保能力的代理值。地方政府隱性擔(dān)保反映了地方政府的財(cái)政實(shí)力,以及政府預(yù)算對當(dāng)?shù)貒笈c民企的軟約束能力。由于預(yù)算軟約束的存在,當(dāng)企業(yè)產(chǎn)生資金問題時,政府可能會直接或者間接地向企業(yè)提供資金或其他方面的隱性支持,以緩解企業(yè)的經(jīng)營壓力,降低其破產(chǎn)風(fēng)險。因此,債券發(fā)行人所屬地區(qū)的財(cái)政實(shí)力越強(qiáng),該債券對應(yīng)的違約概率相對越小。
預(yù)付賬款周轉(zhuǎn)天數(shù)是衡量企業(yè)經(jīng)營效率的一個指標(biāo),它反映了企業(yè)通過銷售所獲得的預(yù)付款項(xiàng)從銷售到收回所需的平均時間。高預(yù)付賬款周轉(zhuǎn)天數(shù)表明企業(yè)預(yù)付款項(xiàng)和合同資產(chǎn)的資金占用情況較為嚴(yán)重,資金使用效率和運(yùn)營效率較低。同時該指標(biāo)越高,表明企業(yè)對供應(yīng)商或客戶的議價能力較弱,處于供應(yīng)鏈中弱勢地位,競爭力較弱。綜上,普遍來說,預(yù)付賬款周轉(zhuǎn)天數(shù)越高,企業(yè)的經(jīng)營風(fēng)險越大。
總體來說,地方政府隱性擔(dān)保能力以及企業(yè)的預(yù)付賬款周轉(zhuǎn)天數(shù)都與債券違約概率之間存在關(guān)聯(lián),但并不能單獨(dú)決定債券違約的發(fā)生。不能簡單地理解為高預(yù)付賬款周轉(zhuǎn)天數(shù)等價于高違約概率,或者高隱性擔(dān)保能力等價于低違約概率。違約概率受到眾多因素的綜合影響,包括行業(yè)情況、市場環(huán)境、經(jīng)營策略等,對違約成因的分析也應(yīng)該綜合考慮多個指標(biāo),并結(jié)合具體情況進(jìn)行評估。
五、研究結(jié)論
本文以我國2014—2022年發(fā)行的公司債、企業(yè)債和中期票據(jù)為研究對象,從財(cái)務(wù)特征(盈利能力、短期償債能力、長期償債能力、資產(chǎn)負(fù)債結(jié)構(gòu)、營運(yùn)能力、成長能力、創(chuàng)現(xiàn)能力)和非財(cái)務(wù)特征(宏觀經(jīng)濟(jì)、行業(yè)、企業(yè)核心競爭力)兩大層面選取指標(biāo)構(gòu)建了基于SMOTETomek-GWO-XGBoost的債券違約風(fēng)險預(yù)警模型并進(jìn)行分析。為了提高模型結(jié)果的準(zhǔn)確性和可靠性,本文采用了多種性能評估指標(biāo),如準(zhǔn)確率、召回率、未加權(quán)平均召回率和AUC值,對比分析了基于財(cái)務(wù)特征和全部特征的情況下,GWO-XGBoost模型與其他5個基準(zhǔn)模型以及未優(yōu)化的XGBoost模型間的性能差異,以及在使用SMOTETomek采樣算法前后的GWO-XGBoost模型的性能差異。此外,本文采用SHAP值法對指標(biāo)重要性進(jìn)行了分析,以解釋模型結(jié)果。
實(shí)證結(jié)果表明:第一,本文所用的GWO-XGBoost 債券違約風(fēng)險預(yù)警模型具有較好的泛化能力、更高的預(yù)測精度以及更強(qiáng)的穩(wěn)定性,能夠?qū)倪`約行為進(jìn)行有效預(yù)測。第二,在結(jié)合SMOTETomek采樣算法后,模型的召回率以及UAR值都得到了提高,可以說明SMOTETomek具有平衡樣本和改善模型分類性能的作用。第三,應(yīng)用SHAP值法可以定量展示不同特征對債券違約風(fēng)險的影響力,增加機(jī)器學(xué)習(xí)模型的可解釋性,避免違約風(fēng)險預(yù)測過程中的“黑箱”問題。此外,本文根據(jù)SHAP值排名的結(jié)果,重點(diǎn)討論了SHAP值排名前兩位的指標(biāo),即地方政府隱性擔(dān)保能力和預(yù)付賬款周轉(zhuǎn)天數(shù)與違約風(fēng)險之間的關(guān)系。第四,值得注意的是,當(dāng)數(shù)據(jù)量過少時,可能會導(dǎo)致過擬合的現(xiàn)象發(fā)生。因此,在應(yīng)用機(jī)器學(xué)習(xí)模型解決實(shí)際應(yīng)用問題時,應(yīng)該關(guān)注數(shù)據(jù)量變化帶來的影響。
本文將SMOTETomek-GWO-XGBoost機(jī)器學(xué)習(xí)方法引入財(cái)務(wù)學(xué)研究領(lǐng)域,并通過與其他機(jī)器學(xué)習(xí)方法的比較,證明了其對債券違約預(yù)警具有重要的幫助作用。在后續(xù)的研究中,可以進(jìn)一步挖掘更多與公司經(jīng)營管理、發(fā)展戰(zhàn)略、行業(yè)特征、宏觀環(huán)境方面相關(guān)的信息,提高財(cái)務(wù)風(fēng)險預(yù)警的準(zhǔn)確性、有效性和及時性,為防范化解重大金融風(fēng)險提供支持。
【參考文獻(xiàn)】
[1] BAO Y,KE B,LI B,et al.Detecting accounting fraud in publicly traded US firms using a machine learning approach[J].Journal of Accounting Research,2020,58(1):199-235.
[2] 吳世農(nóng),黃世忠.企業(yè)破產(chǎn)的分析指標(biāo)和預(yù)測模型[J].中國經(jīng)濟(jì)問題,1987(6):8-15.
[3] 吳世農(nóng),盧賢義.我國上市公司財(cái)務(wù)困境的預(yù)測模型研究[J].經(jīng)濟(jì)研究,2001(6):46-55,96.
[4] 吳育輝,唐浩博.風(fēng)險信息披露能預(yù)測債券違約風(fēng)險嗎?——來自債券募集說明書的經(jīng)驗(yàn)證據(jù)[J].財(cái)務(wù)研究,2021(5):15-28.
[5] 呂峻,李梓房.宏觀經(jīng)濟(jì)因素對企業(yè)財(cái)務(wù)危機(jī)影響的實(shí)證分析[J].山西財(cái)經(jīng)大學(xué)學(xué)報(bào),2008(11):94-100.
[6] 盧永艷.宏觀經(jīng)濟(jì)因素對企業(yè)財(cái)務(wù)困境風(fēng)險影響的實(shí)證分析[J].宏觀經(jīng)濟(jì)研究,2013(5):53-58.
[7] 戴雅榕,沈藝峰.隨機(jī)森林模型能夠預(yù)測中國債券違約嗎?[J].計(jì)量經(jīng)濟(jì)學(xué)報(bào),2022(2):418-440.
[8] CHAVA S,JARROW R A.Bankruptcy prediction with industry effects[J].Review of Finance,2004,8(4): 537-569.
[9] 吳世農(nóng),唐浩博,張騰.中國國有上市公司的核心競爭力研究[C].2022年度“中國資本市場與國資國企改革”國際學(xué)術(shù)研討會,2022.
[10] YILDIRIM M,OKAY F Y,?魻ZDEMIR S.Big data analytics for default prediction using graph theory[J].Expert Systems with Applications,2021,176:114840.
[11] KIM T,KIM H Y.Forecasting stock prices with a feature fusion LSTM-CNN model using different representations of the same data[J].PloS one,2019,14(2):e0212320.
[12] CHEN T,GUESTRIN C.Xgboost:a scalable tree boosting system[C]//Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining,2016:785-794.
[13] BARBOZA F,KIMURA H,ALTMAN E.Machine learning models and bankruptcy prediction[J].Expert Systems with Applications,2017,83:405-417.
[14] ADDO P M,GUEGAN D,HASSANI B.Credit risk analysis using machine and deep learning models[J]. Risks,2018,6(2):38.
[15] 馮雅情.基于改進(jìn)的KMV-XGBoost的信用債風(fēng)險度量[D].濟(jì)南:山東大學(xué)碩士學(xué)位論文,2020.
[16] 譚本艷,袁神鵬.基于XGboost的企業(yè)債務(wù)違約特征預(yù)警分析[J].會計(jì)之友,2023(19):74-81.
[17] CHEN M,HE X,YANG J,et al.3-D convolutional recurrent neural networks with attention model for speech emotion recognition[J].IEEE Signal Processing Letters,2018,25(10):1440-1444.
[18] ANSARI A,AHMAD I S,BAKAR A A,et al.A hybrid metaheuristic method in training artificial neural network for bankruptcy prediction[J].IEEE Access,2020,8:176640-176650.
[19] WANG M,CHEN H,LI H,et al.Grey wolf optimization evolving kernel extreme learning machine:application to bankruptcy prediction[J].Engineering Applications of Artificial Intelligence,2017,63:54-68.
[20] 肖艷麗,向有濤.企業(yè)債券違約風(fēng)險預(yù)警:基于GWO- XGBoost方法[J].上海金融,2021(10):44-54.
[21] LUNDBERG S M,LEE S I.A unified approach to interpreting model predictions[J].Advances in Neural Information Processing Systems,2017,30.
[22] 遲國泰,章彤,張志鵬.基于非平衡數(shù)據(jù)處理的上市公司ST預(yù)警混合模型[J].管理評論,2020,32(3):3-20.
[23] CHANDRA W,SUPRIHATIN B,RESTI Y.Median-KNN Regressor-SMOTE-Tomek links for handling missing and imbalanced data in air quality prediction[J].Symmetry,2023,15(4):887.
[24] HAIRANI H,ANGGRAWAN A,PRIYANTO D.Improvement performance of the random forest method on unbalanced diabetes data classification using smote-tomek link[J].International Journal on Informatics Visualization,2023,7(1):258-264.