趙越
摘要:本文采用Bagging和Adaboost作為集成模型,并采用神經(jīng)網(wǎng)絡(NN)、支持向量機(SVM)和決策樹(DT)作為集成的基分類器。實驗結果表明,以決策樹作為基分類器的Ababoost模型具有最好的預測效果,該模型對我國上市公司財務的預警是有效的,并且具有較好的財務危機預警效果。
關鍵字:企業(yè)財務危機預警;集成模型;Bagging;Adaboost
1 引言
建立有效的財務危機預警模型是金融機構一項非常重要而艱巨的任務。財務危機預警模型可以用來預測上市公司的財務是否發(fā)生問題。如果預測模型不能正常運行,如預測錯誤率很高,它會導致不正確的決策,并很可能會由此導致嚴重的金融危機和災難。
財務危機預警模型也可以表示為一類具有輸入和輸出的二分類問題。也就是說,預測模型將每個樣本分類到2個預定義的類。對于財務危機預警問題,輸出結果即為發(fā)生財務危機或者未發(fā)生財務危機。單變量分析方法最早應用于企業(yè)財務危機預警領域,Beaver(1966)[1]等是較早采用單變量分析法預測企業(yè)狀況的學者,并在研究中發(fā)現(xiàn)對企業(yè)財務狀況判別能力高的財務指標和關鍵要素。Ohlson(1980)[2]發(fā)現(xiàn)Logistic模型更適合描述企業(yè)發(fā)生財務危機與否和財務比率指標之間的非線性關系。自上世紀50年代人工智能技術,如決策樹、支持向量機、神經(jīng)網(wǎng)絡、概率神經(jīng)網(wǎng)絡等分類器成為預測企業(yè)財務危機較常用的方法。Odom(1990)[3]最先運用神經(jīng)網(wǎng)絡模型對企業(yè)財務狀況進行預測。
已有研究表明,分類器集成技術在預測精度和誤差等方面都要優(yōu)于單一分類器模型和傳統(tǒng)的統(tǒng)計方法。集成分類器是針對同一問題通過組合一組分類器進行解決的,最終的分類結果根據(jù)每個分類器的組合從而最終得到。常用的集成方法包括Bagging和Adaboost。West(2005)[4]研究了用于對神經(jīng)網(wǎng)絡進行集成的cross-validation,bagging,boosting三類集成策略,并證明多分類器集成方法的預測能力優(yōu)于單一模型。Alfaro(2008)[5]對比了使用AdaBoost集成方法和神經(jīng)網(wǎng)絡模型的預測企業(yè)破產(chǎn)的精度,結果顯示AdaBoost集成方法有效降低了神經(jīng)網(wǎng)絡的泛化錯誤。
雖然許多相關的研究已經(jīng)證明了集成分類器優(yōu)于許多單分類器,但是在企業(yè)財務危機預警領域,關于集成模型的應用還缺少全面的對比及分析。所以本文選取了Bagging和Adaboost集成模型,同時選取了神經(jīng)網(wǎng)絡(NN)、支持向量機(SVM)和決策樹(DT)作為集成的基分類器,重點討論如何構建財務危機預警的最優(yōu)集成分類器模型。
2 集成模型
集成學習方法是機器學習的新興領域。近些年來,采用集成模型對企業(yè)財務危機進行預警的研究也呈上升趨勢。集成模型的目的在于將多個具有一般性能的弱分類器整合成為具有較強分類性能的集成模型。也就是說,用于集成的基分類器能夠有效彌補其它基分類器所產(chǎn)生的不足,從而獲得比單分類器更好的預測效果,顯著的提高預測模型的泛化能力。
將不同的基分類器的預測結果進行組合得到最終的預測結果,這些用于組合的基分類器可以通過不同的訓練數(shù)據(jù)集產(chǎn)生,也可以通過不同的分類算法產(chǎn)生:
2.1 Bagging
Bagging首先通過自助抽樣法,從初始訓練數(shù)據(jù)集中有放回的對樣本進行抽樣,形成不同的訓練數(shù)據(jù)集。進而采用某一分類算法分別用各個訓練數(shù)據(jù)集對基分類器模型進行訓練,從而形成不同的基分類器模型。最后采用多數(shù)投票法融合各個基分類器的預測結果。已有研究表明,Bagging采用的自助抽樣法和多數(shù)投票法能夠有效降低模型的方差從而提高預測的精度。
2.2 Adaboost
在Adaboost中,各個分類器是連續(xù)生成的。即Adaboost是一種迭代算法,其核心思想是針對同一個訓練集訓練不同的基分類器,然后把這些基分類器通過多數(shù)加權投票的方法進行整合形成一個最終的強分類器。Adaboost的算法如下:
假設有訓練樣本集 ,代表一個二分類問題中訓練樣本的對應輸出。當經(jīng)過第t次迭代時,每個訓練樣本的權重表示為 。每個訓練樣本的初始權重為1/n,樣本的權重隨著迭代的增加而不斷的更新。在t次迭代時,Adaboost根據(jù)權重分布生成新的訓練樣本集,并使用新的訓練樣本生成基分類器,通過ft表示。Et代表分類器ft的錯誤率,可以通過式(1)進行計算:
(1)
根據(jù)容易分類的樣本分配較小權重,較難分類的樣本分配較大權重的基本思想,樣本的權重通過式(2)進行更新:
(2)
式(2)中的αt和lit分別通過式(3),(4)計算得到:
(3)
(4)
將以上得到的權重進行標準化處理,可以得到 (5)。
當進行T次迭代時,將有T個弱分類器用于集成。Adaboost通過加權投票集成法得到最終的分類結果。
3 實證研究
3.1 樣本描述
本文采用的上市公司的財務數(shù)據(jù)樣本均通過CCER經(jīng)濟金融數(shù)據(jù)庫獲取。采用滬深兩市中的上市公司因為連續(xù)兩年以上財務狀況異常而被“特別處理(Special Treatment,ST)”作為分類器的分類標準?;诖?,本文選取2009-2014年首次被證監(jiān)會“特別處理”的上市公司,共計167家上市公司作為發(fā)生財務危機的公司樣本。并根據(jù)同行業(yè)和相似總資產(chǎn)選取準則,選取了167家財務健康的上市公司作為配對樣本進行實驗?;诩扔械牡闹笜诉x取原則,本文分別從市場價值、營運能力、資本結構、償債能力、盈利能力和成長能力6個方面選取了38個財務指標作為構建財務預警模型的輸入。具體包含的指標內(nèi)容如表1所示:
3.2 實驗設計
本文選取了神經(jīng)網(wǎng)絡(NN),支持向量機(SVM)和決策樹(DT)三個常用的預測模型作為集成的基分類器。使用神經(jīng)網(wǎng)絡作為基分類器,主要需要確定網(wǎng)絡層神經(jīng)元的數(shù)量,本文采用經(jīng)驗法對其進行設置,即網(wǎng)絡層的神經(jīng)元數(shù)量一般設置為 ,其中m是輸入層神經(jīng)元的個數(shù),即輸入財務指標集的數(shù)量,n是輸出層的神經(jīng)元個數(shù),即是否發(fā)生財務危機,a是一個0-10之間的常數(shù)。采用支持向量機作為集成的基分類器時,采用徑向基函數(shù)(RBF)作為其核函數(shù),并利用交叉驗證法尋找最優(yōu)的懲罰系數(shù)C和核參數(shù)σ。
為了避免訓練樣本因為一次抽樣而使得模型的測試產(chǎn)生有偏的結果,采用10-折交叉驗證作為模型的驗證方法。即將樣本數(shù)據(jù)隨機劃分為互斥的10組,用其中9組作為訓練樣本,剩余1組作為測試樣本,重復這一過程,直至每組都做過一次測試樣本,并計算最終正確分類的樣本數(shù)量占總樣本數(shù)量的值來評估分類器的性能。
3.3 評價標準
本文分別采用整體預測準確率(Accuracy)、第一類錯誤率(type I error)和第二類錯誤率(type II error)作為評判模型優(yōu)劣的評價標準。融合矩陣及各個評價標準的定義如下所示:
3.4 實驗結果與分析
為了分析以下兩個問題,一是在企業(yè)財務危機預警中Bagging和Adaboost兩類集成模型預測能力的差異,二是NN,DT和SVM分別與Bagging和Adaboost集成后預測能力的差異。本實驗共進行了9組實驗,來較全面的分析以上兩個問題。具體實驗結果見表3:
從表3可以看出,當使用Adaboost作為集成框架,DT作為集成的基分類器時,構建的模型具有最好的預測性能,準確率達到了80.24%,第一類錯誤率為17.86%,第二類錯誤率為21.69%。而采用Adaboost-SVM和Adaboost-NN的預測結果分類別77.55%和76.35%。同時可以看出,無論選擇哪種預測算法作為集成的基分類器,Adaboost集成框架的預測效果都優(yōu)于Bagging,因為Adaboost具有更好的泛化性能和降低方差的能力。
4 結論
既往研究中,關于分類器集成方法在企業(yè)財務危機預警中的作用沒有被充分挖掘。所以本文對集成方法進行了較全面的研究和比較分析。本文選取了企業(yè)財務危機預警中常用了兩個集成模型:Bagging和Adaboost,用于比較。同時,每個集成模型都分別與神經(jīng)網(wǎng)絡、決策樹和支持向量機相結合,用于判斷集成模型的性能。實驗表明,Adaboost-DT具有最優(yōu)的預測能力。此外,相比于其它集成模型,Adaboost-DT具有更好的效率。所以,在未來關于企業(yè)財務危機預警的實踐應用中,該模型為管理者和投資者提供了一個較好的決策工具。
參考文獻:
[1] Altman E.I. Financial Ratios, Discriminant Analysis, and the Prediction of Corporate Bankruptcy. Journal of Finance, 1968:589~609.
[2] Ohlson. James A. Financial Ratios and the Probabilistic Prediction of Bankruptcy.Journal of Accounting Research. 1980,(18): 109~131.