趙智繁,王世民,曹 倩
(北京工商大學 計算機與信息工程學院 食品安全大數(shù)據(jù)技術北京市重點實驗室,北京 100048)
基于數(shù)據(jù)挖掘的財務危機多分類預警研究
趙智繁,王世民,曹倩
(北京工商大學計算機與信息工程學院食品安全大數(shù)據(jù)技術北京市重點實驗室,北京 100048)
目前對財務危機預警模型的研究大多少為二分類研究,其只能對企業(yè)是否存在財務危機做出預警,無法對企業(yè)的財務危機程度做出警報,因此簡單的二分類可能無法揭示企業(yè)財務狀況逐漸變差的事實。鑒于此,將F分數(shù)模型與ST分類法相結合,對企業(yè)財務危機程度進行了細化,并使用t-2年的財務數(shù)據(jù)構建了基于關聯(lián)規(guī)則、決策樹等數(shù)據(jù)挖掘算法的財務危機多分類預警模型。實證結果表明,模型在保證了較高準確率的基礎上,能夠提供更加精細的警報。
F分數(shù)模型;數(shù)據(jù)挖掘;財務預警;財務危機;多分類
面對日趨嚴峻的市場競爭,不少企業(yè)將會面臨財務危機的困擾。財務危機又稱財務困境,陷入財務危機的企業(yè)不但將面臨資不抵債、無法償還到期債務、盈利能力下降、財務指標數(shù)據(jù)惡化等狀況,甚至還有破產(chǎn)的風險。因此,如何提前識別出企業(yè)潛在的財務危機狀況,及時地進行改善,以避免更為嚴重的損失,成為了企業(yè)管理者、投資者最為關注的問題。
通過大量的、真實的企業(yè)財務歷史數(shù)據(jù),并使用一定的數(shù)學建模方法所構建的財務危機預警模型,是用來預測企業(yè)是否存在財務危機的重要方法,也是財務危機預警定量研究的重要內(nèi)容。最早的財務危機預警模型研究是20世紀30年代Fitz Patrick等人使用的單變量預測方法。隨著統(tǒng)計理論的普及和計算機技術、數(shù)據(jù)庫應用的興起,財務危機預警模型得到了不斷的推衍與改進,并涌現(xiàn)出了大量的優(yōu)秀成果,如國外Altman等人的Z值計分模型和國內(nèi)周首華等人的F分數(shù)模型等。
縱觀國內(nèi)外現(xiàn)有的研究成果,大多數(shù)研究的重點都集中在建模方法的對比和預測變量的選取這兩個方面,卻缺乏在財務危機預警中對財務危機進行多分類的探討。就目前的文獻資料來看,大多數(shù)的研究依然采取傳統(tǒng)的二分類預警模式,即只能預測企業(yè)將成為ST企業(yè),或者將成為非ST企業(yè)。然而在實際的情況中,有些企業(yè)雖然沒有被標記為ST,但是其財務狀況依然不樂觀,現(xiàn)有的二分類預警模型卻并不能對這一部分企業(yè)給出警報。因此當前的依據(jù)ST進行劃分的財務危機二分類預警模型很難提升實際應用的價值,同時也掩蓋了企業(yè)在陷入財務危機前財務狀況惡化的過程。
對財務危機的多分類目前還沒有公認的標準,同時該問題相對定性,難以在定量研究中通過單一的數(shù)值進行表示,這些都為在財務危機預警模型中進行財務危機程度的多分類造成了障礙。
本文將采用目前國內(nèi)在財務危機預警領域使用較為廣泛的F分數(shù)模型的判別公式,并與傳統(tǒng)研究中的ST分類方式相結合,將企業(yè)財務危機程度劃分為“財務穩(wěn)定企業(yè)”、“財務不穩(wěn)定企業(yè)”、“財務較危機企業(yè)”和“財務危機企業(yè)”四個部分。并使用t-2年的財務指標數(shù)據(jù),通過關聯(lián)規(guī)則算法篩選出重要的預測變量,再通過決策樹模型進行訓練生成財務危機多分類預警模型,最后使用測試樣本對模型的準確性進行檢驗。
財務危機預警模型的研究中,在財務危機的分類方面,最早是依據(jù)企業(yè)是否破產(chǎn)進行分類的,其中具有代表性的研究是Altman[1]使用多元線性判別方法創(chuàng)立的 Z值計分模型,其使用的研究樣本是33家提出破產(chǎn)申請的企業(yè)與33家與之配對產(chǎn)生的財務狀況良好的企業(yè)。在國外的現(xiàn)有研究中,大部分也是依據(jù)企業(yè)是否破產(chǎn)進行二分類。在抽樣的方法上,大多也使用配對抽樣的方法。在國內(nèi),由于上市企業(yè)的財務年報獲取較為容易,同時其年報數(shù)據(jù)的真實性、準確性較高,所以大部分研究選取上市企業(yè)作為研究樣本。但是由于我國真正破產(chǎn)、退市的上市企業(yè)很少,所以在研究中一般以上市企業(yè)被特別處理(ST)作為企業(yè)陷入財務危機的標志,同樣屬于一種二分類方式,這主要是為了迎合我國上市企業(yè)的實際情況、提升建模實驗的可操作性以及便于不同學者的研究相互比較。其中最具影響力的是周首華[2]等人在Z值計分模型的基礎上,以我國企業(yè)為研究樣本進行了修正,并考慮了現(xiàn)金流量因素,提出了F分數(shù)模型。對于財務危機多分類預警模型的研究探討相對較少,但也有一些成果,如張坤[3]以西部四省上市企業(yè)為例,在構建財務危機預警模型前使用數(shù)據(jù)包絡分析法將企業(yè)財務危機狀況分成五類。陳磊[4]則將傳統(tǒng)的基于ST的二分類方式擴展為ST、*ST、非ST的三分類。
在預測變量的選擇上,目前主要分為財務指標和非財務指標兩類。相對而言,財務指標更加容易獲取,且構建的財務預警模型具有直觀性、穩(wěn)定性,因此更多的研究選擇財務指標作為預測變量。非財務指標相對難以獲取且難以量化,但也有相關研究表明非財務指標與財務危機具有一定的關系,如La Porta[5]等人發(fā)現(xiàn)企業(yè)股權集中度越高,企業(yè)越容易出現(xiàn)財務危機。邊海榮[6]等人將Web金融信息文本數(shù)值化后發(fā)現(xiàn),其也可以作為預測變量用于構建財務危機預警模型。
在建模方法的應用上,傳統(tǒng)的方法主要是單變量、多變量預測模型,但隨著計算機網(wǎng)絡和數(shù)據(jù)庫技術的興起,數(shù)據(jù)挖掘技術逐漸成為了構建財務危機預警模型的主要工具。數(shù)據(jù)挖掘擁有強大的學習能力,可以從大量歷史信息中發(fā)現(xiàn)潛在的、有價值的知識,輔助管理者進行決策。其中,Odom[7]是使用人工神經(jīng)網(wǎng)絡構建企業(yè)財務危機預警模型的最具代表性的學者之一。吳世農(nóng)[8]等人通過對邏輯回歸模型與另外兩種方法對比發(fā)現(xiàn),邏輯回歸模型擁有最低的誤判率。李?。?]通過對邏輯回歸、決策樹、人工神經(jīng)網(wǎng)絡三種不同的數(shù)據(jù)挖掘算法進行對比,發(fā)現(xiàn)在構建財務危機預警模型時決策樹模型訓練次數(shù)少、速度快,在長期預測和短期預測中都能取得較高的準確率,穩(wěn)定性更強。
3.1技術路線
基于數(shù)據(jù)挖掘的財務危機多分類預警建模的研究,大致可分為四個部分:樣本數(shù)據(jù)的選取和財務指標的計算、財務危機的多分類、預測變量的篩選、數(shù)據(jù)挖掘算法的訓練。
對于財務危機的多分類,由于現(xiàn)有的二分類預警模型存在較為明顯的局限性,因此本文將F分數(shù)模型的判別公式和ST分類方法相結合,將財務危機細化為“財務穩(wěn)定企業(yè)”、“財務不穩(wěn)定企業(yè)”、“財務較危機企業(yè)”和“財務危機企業(yè)”四個部分,使得預警模型可以對那些雖然目前沒有被標記為ST的風險,但財務狀況依舊不樂觀的企業(yè)做出警報。
對于預測變量的篩選,由于預測變量(財務指標)的多樣性,以及不同預測變量間可能存在的關聯(lián)性,同時也為了能夠生成簡練易讀的財務危機預警模型,因此需要對預測變量進行篩選。本文將使用t-2年的財務指標數(shù)據(jù),并通過數(shù)據(jù)挖掘中的關聯(lián)規(guī)則算法,篩選出與t年財務危機程度關聯(lián)度較大的財務指標作為預測變量,剔除了弱關聯(lián)指標。
最后,本文將使用t-2年的預測變量數(shù)據(jù),以t年的財務危機程度作為結果變量,并通過數(shù)據(jù)挖掘中的決策樹算法進行訓練,生成樹狀判別模型,并使用測試樣本檢驗模型的準確率。
3.2樣本來源和指標體系
本文的樣本數(shù)據(jù)來源于上海證券交易所官網(wǎng)中上市公司定期披露的財務年報,這些年報數(shù)據(jù)經(jīng)過了嚴格的審查,具有較高的真實性和規(guī)范性。
由于在財務分析研究中,各類財務指標類型較多,為了避免在選取備用的財務指標時造成的主觀性和相關性,本文選取了國內(nèi)相對較為完善的《企業(yè)綜合績效評價實施細則》中財務績效定量評價指標規(guī)定的8個基本指標與14個修正指標作為備選的財務指標,其中舍棄4個外部報表使用者難以獲取的指標,分別是不良資產(chǎn)比率、帶息負債比率、或有負債比率和技術投入比率,剩余的財務指標如表1所示。
表1備選的財務指標
3.3財務危機的多分類
3.3.1 F分數(shù)模型
為了彌補目前二分類預警模型的缺陷,本文采用F分數(shù)模型的判別公式與傳統(tǒng)ST分類標準相結合,實現(xiàn)了對財務危機程度的多分類。
F分數(shù)模型是我國學者在Z值計分模型的基礎上,以我國企業(yè)財務信息為樣本數(shù)據(jù)所改進的財務危機預測模型。隨后,在相關領域的研究中,F(xiàn)分數(shù)模型得到了廣泛的運用,并保持了很高的準確率。與Z值計分模型相比,它具有如下的優(yōu)勢:首先,F(xiàn)分數(shù)模型充分考慮到現(xiàn)金流量的因素;其次,F(xiàn)分數(shù)模型通過數(shù)據(jù)庫技術使用了更大的研究樣本,擁有更強的穩(wěn)定性和普遍適用性,同時更加適用于國內(nèi)企業(yè);另外,F(xiàn)分數(shù)模型考慮到了近代企業(yè)財務狀況相關標準的更新與發(fā)展。
F分數(shù)模型的判別公式如下:
其中的X1表示的是企業(yè)期末流動資產(chǎn)與期末流動負債的差值,占企業(yè)期末總資產(chǎn)的比率;X2表示企業(yè)期末留存收益與期末總資產(chǎn)的比值;X3表示企業(yè)稅后純收益與折舊的總和與平均總負債的比值;X4是期末股東權益的市場價值與期末總負債的比值;X5表示企業(yè)稅后純收益、利息、折舊三者總和與平均總資產(chǎn)的比值。與Z值計分模型相比,F(xiàn)分數(shù)模型考慮了現(xiàn)金流量方面的情況,如 X3、X5指標的分子項,都是對企業(yè)創(chuàng)造的現(xiàn)金流量方面的測量[9]。F分數(shù)的計算比較簡單,流動資產(chǎn)、流動負債、總負債、總資產(chǎn)等項目均可從資產(chǎn)負債表中直接獲取,凈利潤可從利潤表中獲取,只有期末股東權益的市場價值需要參考期末股價、未上市流通股份和已上市流通股份等其他會計資料。
F分數(shù)模型的臨界點被設定為0.027 4,當企業(yè)的F分數(shù)小于臨界點時,則被預測為具有較高的財務危機,被標記為ST的可能性很大;若F分數(shù)大于臨界點,則被預測為財務狀況正常的企業(yè)。另外,經(jīng)過大量的樣本檢驗,當F分數(shù)處于[-0.050 1,0.104 9]時,預測的準確率將會下降到僅僅70%左右,一般在研究中我們稱之為“灰色區(qū)域”。
3.3.2多分類標準
在目前的相關研究中,經(jīng)常依據(jù)上市企業(yè)被標記為ST作為企業(yè)是否存在財務危機的分類標準。ST(Special Treatment),意為“特別處理”,是證券交易所對財務狀況或其他狀況出現(xiàn)異常的上市企業(yè)股票交易進行的特別處理,這里的異常狀況主要包括:最近兩個會計年度的審計結果顯示的凈利潤均為負;最近一個會計年度的審計結果顯示其股東權益低于注冊資本等。可見,上市企業(yè)被標記為ST是一種明顯的具有較高財務危機的體現(xiàn)。本文也認同這種觀點,因此將被標記為ST的企業(yè)作為財務危機多分類中的“財務危機企業(yè)”樣本,并將其被標記為ST的年份稱為第t年。但是,由于在實際情況中,部分上市企業(yè)雖然沒有被標記為ST企業(yè),但財務狀況并不樂觀,依然存在較高的財務危機風險,僅僅使用傳統(tǒng)的ST分類方式是無法將這部分企業(yè)篩選出來的。因此,將使用F分數(shù)模型,繼續(xù)對非ST企業(yè)進行分類。
由于財務數(shù)據(jù)的發(fā)表具有滯后性,因此使用t-1年的財務報表數(shù)據(jù)進行F分數(shù)的計算。當非ST企業(yè)的F分數(shù)低于-0.050 1時,我們認為這部分企業(yè)雖然沒有被標記為ST,但依然存在較高的財務危機風險。而且,當非ST企業(yè)的凈利潤為負數(shù)時,近兩年成為ST企業(yè)的可能性很高。因此我們將這兩類企業(yè)作為財務危機多分類中的“財務較危機企業(yè)”樣本。
當非ST企業(yè)的F分數(shù)處于灰色區(qū)域 [-0.050 1,0.104 9]時,F(xiàn)分數(shù)模型的預測準確率較低,因此這部分企業(yè)的財務狀況并不穩(wěn)定,將這類企業(yè)作為財務危機多分類中的“財務不穩(wěn)定企業(yè)”樣本。
當非ST企業(yè)的F分數(shù)高于0.104 9時,F(xiàn)分數(shù)模型的預測準確率回升到了較高的水平,這部分企業(yè)的財務狀況良好,存在財務風險的可能性很低,因此我們將這類企業(yè)作為財務危機多分類中的“財務穩(wěn)定企業(yè)”樣本。
最終本文在上海證券交易所官網(wǎng)中選取了37家2015年被標記為ST的上市企業(yè)作為“財務危機企業(yè)”樣本,同時通過計算 F分數(shù),選取“財務較危機企業(yè)”、“財務不穩(wěn)定企業(yè)”、“財務穩(wěn)定企業(yè)”各37家,共148個研究樣本,將其中將98家作為訓練樣本,50家作為測試樣本。
3.4預測變量的篩選
3.4.1財務危機分類結果與財務指標的對應
因為財務數(shù)據(jù)的發(fā)布具有滯后性,因此當我們獲取t-1年的財務報表數(shù)據(jù)時,實際上第t年的財務危機已經(jīng)發(fā)生,因此在構建財務危機預警模型時,使用t-1年的財務數(shù)據(jù)沒有任何預警意義,使用t-2年的財務數(shù)據(jù)更為合理。
在數(shù)據(jù)庫中對預測變量進行篩選前,需要將樣本企業(yè)第t年的財務危機分類結果與第t-2年的財務指標數(shù)據(jù)進行對應。最簡單的方法是,在企業(yè)第t-2年的財務指標數(shù)據(jù)行中添加一個新的屬性(列),通過數(shù)據(jù)庫的存儲過程寫入將該企業(yè)第t年的財務危機分類結果。
3.4.2關聯(lián)規(guī)則篩選預測變量
表1中列舉了備選的財務指標,但是如果將所列的財務指標全部當作預測變量來構建預警模型,則容易造成預警模型過擬合,同時過于復雜的預警模型不利于實際的應用。因此,需要對財務指標進行篩選,選擇出合適的財務指標作為預測變量。
以往的研究在篩選財務指標時常采用的方法包括:K-S檢驗、配對T檢驗和主成分分析等方法,但都具有一定的局限性。首先K-S檢驗、配對T檢驗對樣本數(shù)據(jù)的分布狀況有一定的要求,部分財務數(shù)據(jù)因其本身的特點往往很難滿足要求。其次在使用主成分分析前需要對樣本進行KMO檢驗和Bartlett球形檢驗,而且最終形成的主成分因子是所有指標在不同權系數(shù)下的線性組合,不一定具有合理的財務意義。因此,本文采用了數(shù)據(jù)挖掘中關聯(lián)規(guī)則算法來篩選預測變量。關聯(lián)規(guī)則算法對樣本數(shù)據(jù)的分布沒有要求,同時能夠篩選出與財務危機狀況關聯(lián)度較高的財務指標作為預測變量。
關聯(lián)規(guī)則是一種可以在大量數(shù)據(jù)集中找出項與項之間的關系的數(shù)據(jù)挖掘技術,Apriori算法是關聯(lián)規(guī)則中最經(jīng)典的算法,依據(jù)每條規(guī)則的支持度與置信度,可以得出在規(guī)則先導發(fā)生的情況下,規(guī)則后繼發(fā)生的可能性。其中規(guī)則的支持度用support表示,意為在所有記錄中同時包括先導與后繼的比率,公式為:
其中X為規(guī)則的先導,Y為規(guī)則的后繼,|D|表示所有記錄的條數(shù)。
規(guī)則的置信度用confidence表示,表達的含義是當一條記錄包含先導時,同時也包含后繼的概率,公式為:
通過設定最小支持度和最小置信度,可以選擇出我們需要的關聯(lián)規(guī)則。例如:當規(guī)則中指標X1<m推導出“財務危機企業(yè)”的支持度與置信度均滿足最低標準,那么指標X1將成合格的預測變量。
因此我們將財務危機分類設置成后繼屬性Y,通過約束規(guī)則的最大項數(shù),來考察單一的財務指標數(shù)據(jù)與財務危機分類的關聯(lián)程度。經(jīng)過篩選,當最小置信度設置為0.7時,獲得的規(guī)則數(shù)目與規(guī)則先導數(shù)量最為合理,分別可以獲得9條重要的關聯(lián)規(guī)則和 7個預測變量,分別是 X1、X2、X3、X5、X8、X9、X16,重要的關聯(lián)規(guī)則如表2所示。
表2重要的關聯(lián)規(guī)則
3.5基于決策樹的財務危機預警模型
數(shù)據(jù)挖掘中的決策樹算法是一種逼近離散函數(shù)值的方法,可用于分類、預測。通過決策樹來構建財務危機預警模型具有訓練次數(shù)少、速度快的優(yōu)點,同時決策樹的分類精度高、生成的模型直觀可讀、對樣本中的噪聲數(shù)據(jù)有很好的健壯性并能取得穩(wěn)定的預測準確率。
決策樹自根節(jié)點開始,依據(jù)屬性的信息增益量進行分裂,優(yōu)先分裂信息增益量最大的屬性,其分類過程具有貪心思想。屬性的信息增益量為系統(tǒng)在攜帶該屬性時與不攜帶該屬性時的信息量的差值。信息量(熵)的計算公式為:
其中Pi為變量在取不同的值i的概率。使用98組訓練樣本,將通過關聯(lián)規(guī)則篩選出的t-2年的財務指標作為決策樹的預測變量,以第t年的財務危機分類作為決策樹的結果變量,在葉結點處,決策樹給出每一個分支的預測分類,如圖1所示。
圖1決策樹預測結果
本文使用的是 SQL Server數(shù)據(jù)庫及配套的 Business Intelligence Development Studio商務智能套件,在挖掘結果信息欄中選取挖掘準確性圖表,可以使用50組測試樣本數(shù)據(jù)對預警模型的準確性進行檢驗,得到如表3的結果分類矩陣。
表3預測結果分類矩陣
根據(jù)預測的結果來看,本文在使用F分數(shù)模型與ST分類法相結合的方法將財務危機進行了多分類,并用數(shù)據(jù)挖掘算法訓練生成了預警模型,這使得預警模型的預警結果也是多分類的。與現(xiàn)有的二分類模型相比,多分類的預警模型不但能對可能成為ST的企業(yè)進行警報,同時能對那些雖然暫時沒有被ST的風險,但是其財務狀況依舊不樂觀的企業(yè)做出警報,增強了實用價值。
在準確率方面,多分類的預警模型與傳統(tǒng)的二分類模型并不具有直接的可比性。但是從預測準確率上依舊可以看出,多分類預警模型在對財務危機型企業(yè)與財務穩(wěn)定型企業(yè)進行預警時,準確率較高,但在對財務較危機型企業(yè)和財務不穩(wěn)定型企業(yè)進行預警時準確率不夠,只能達到60%左右,這可能是由于難以挖掘到有效的預警指標和預警區(qū)間,但這對實際的應用價值影響較小。
在財務危機預警模型的驗證中,經(jīng)常需要檢驗模型的錯誤成本,因為Sinkey[10]認為,當預測結果優(yōu)于實際結果時,其給企業(yè)帶來的錯誤成本要高于預測結果劣于實際結果的情況,根據(jù)本文的預測結果分類矩陣,錯誤的預測大部分要劣于實際的結果,因此該模型的錯誤成本相對較小。
本文使用F分數(shù)模型,并與傳統(tǒng)的ST分類法相結合,將企業(yè)財務危機進行了多分類,在財務危機預警建模中,提供了一種新的財務危機多分類預警思路。與傳統(tǒng)的二分類預警模型相比,多分類的預警模型在保證了一定準確率的基礎上,能夠提供更多種類的警報,具有更強的應用價值。
在篩選財務指標時,關聯(lián)規(guī)則算法與K-S檢驗、配對T檢驗和主成分分析法相比,擁有更強的適用性,更加適合財務數(shù)據(jù)本身的數(shù)據(jù)特點。同時,決策樹算法在構建財務危機預警模型時訓練次數(shù)少、速度快、準確率較為穩(wěn)定。
就目前的研究結果來看,總資產(chǎn)報酬率、流動資產(chǎn)周轉率、資本保值增值率、成本費用利潤率、凈資產(chǎn)收益率等幾個指標在預測企業(yè)財務危機時具有較高的穩(wěn)定性。因此無論是作為企業(yè)的管理者還是外部的投資者,都應當重點關注這些指標的變化,相關的財務指標評價體系也可適當調(diào)高這些指標的權重,使其獲得更準確的評價。
主要文獻文獻
[1]Altman,E.I.Financial Ratios,Discriminate Analysis and the Prediction of Corporate Bankruptcy[J].The Joural of Finance,1968(4):589-609.
[2]周首華,楊濟華,王平.論財務危機的預警分析—F分數(shù)模型[J].會計研究,1996(8):8-11.
[3]張坤,丁玉芳,胡敏杰.基于數(shù)據(jù)包絡分析:決策樹的企業(yè)財務評價與預警——以西部四省上市企業(yè)為例 [J].財務與金融,2014(3):36-41.
[4]陳磊,任若恩,曹漢平.公司多階段財務危機動態(tài)預警研究[J].系統(tǒng)工程理論與實踐,2008(11):29-35.
[5]N Gennaioli,RL Porta,F(xiàn)LD Silanes,et al.Growth in Regions[J].Journal of Economic Growth,1969,19(3):259-309.
[6]邊海容,萬常選,劉德喜.考慮Web金融信息的上市企業(yè)財務危機預測模型研究[J].計算機科學,2013,40(11):295-298.
[7]Odom M D,Sharda R.A Neural Network for Bankruptcy Prediction[C]// Proceedings of the International Joint Conference on Neural Networks Tool,1990.
[8]吳世農(nóng),盧賢義.我國上市公司財務危機困境的預測模型研究[J].經(jīng)濟研究,2001(6):46-55.
[9]李吉林.基于F分數(shù)模型的上市公司財務危機預警系統(tǒng)研究[J].中小企業(yè)管理與科技,2010(18):72-74.
[10]趙長明.我國二手房地產(chǎn)交易價格風險的核算[J].統(tǒng)計與決策,2014(1):50-52.
10.3969/j.issn.1673-0194.2016.11.032
F275
A
1673-0194(2016)11-0056-06
2016-04-19
北京市教委科學研究項目(KM201410011005);北京市優(yōu)秀人才培養(yǎng)資助項目(2015000020124G029);北京工商大學教育教學改革項目(jg155225)。