吳慶賀 唐曉華 林宇
【摘要】以我國創(chuàng)業(yè)板上市公司為研究對象,針對公司不同財務(wù)狀況構(gòu)成的非均衡樣本特性,運用Twin-SVM來構(gòu)建財務(wù)危機(jī)預(yù)警模型。實證結(jié)果表明:在Twin-SVM模型的構(gòu)建過程中,RBF核函數(shù)展示出比Linear、Polynomial、Sigmoid、Wavelet核函數(shù)更為優(yōu)異的預(yù)測性能;與改進(jìn)的ODR-ADASYNSVM、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類法和K近鄰法相比,Twin-SVM不僅在預(yù)測精度上高于其他模型,而且在預(yù)測穩(wěn)健性上也顯著更為優(yōu)越,在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個分行業(yè)的泛化性能也顯著優(yōu)越于其余模型。
【關(guān)鍵詞】財務(wù)危機(jī)預(yù)警;Twin-SVM;創(chuàng)業(yè)板;上市公司;非均衡樣本
【中圖分類號】F275【文獻(xiàn)標(biāo)識碼】A【文章編號】1004-0994(2020)02-0056-9
【基金項目】國家自然科學(xué)基金項目(項目編號:71771032);四川省應(yīng)用基礎(chǔ)研究項目(項目編號:2017JY0158)
一、引言
上市公司作為實體經(jīng)濟(jì)的典型代表,一旦發(fā)生財務(wù)危機(jī),不僅自身會遭受巨大損失,讓投資者利益嚴(yán)重受損,甚至可能對整個平穩(wěn)發(fā)展的經(jīng)濟(jì)社會造成巨大沖擊[1,2]。只有科學(xué)地展開對我國上市公司財務(wù)危機(jī)識別和預(yù)警的研究,才能及時發(fā)現(xiàn)財務(wù)危機(jī)的誘因并采取有效的防范措施,避免造成不可挽回的損失。因此,探討并建立一個合理有效的財務(wù)危機(jī)預(yù)警機(jī)制,無論是對我國經(jīng)濟(jì)還是對上市公司發(fā)展而言,都意義重大。
特別是對我國創(chuàng)業(yè)板上市公司而言,創(chuàng)業(yè)板是專門向高科技、高成長企業(yè)提供融資途徑和成長空間的證券交易市場,但是由于我國創(chuàng)業(yè)板存在著上市門檻低、企業(yè)股本小、抵御風(fēng)險能力弱等問題,加上創(chuàng)業(yè)板市場成立時間較短,相應(yīng)的法律法規(guī)以及政策制度還不夠完善,公司上市后業(yè)績嚴(yán)重下滑的現(xiàn)象頻頻發(fā)生[3]。基于以上因素,我國創(chuàng)業(yè)板上市公司面臨較大的財務(wù)風(fēng)險且較易發(fā)生財務(wù)危機(jī)。為使我國創(chuàng)業(yè)板健康穩(wěn)定地成長并有效地輔助公司經(jīng)營者及監(jiān)管層防范和化解風(fēng)險與危機(jī),建立科學(xué)的創(chuàng)業(yè)板上市公司財務(wù)危機(jī)預(yù)警模型,是一個值得關(guān)注的問題。
財務(wù)危機(jī)預(yù)警長期以來都是學(xué)術(shù)界關(guān)注的焦點與熱點,相關(guān)文獻(xiàn)比較多見。有學(xué)者運用單變量模型對財務(wù)危機(jī)預(yù)警展開研究[4],但一家企業(yè)的財務(wù)狀況不是僅用一個指標(biāo)就可以評判的,因此這類模型逐漸被其他模型所取代;其后有學(xué)者引入多元變量模型[5],但多元變量模型的前提條件過于嚴(yán)格,要求解釋變量與被解釋變量呈線性關(guān)系,各變量間相互獨立,且要求殘差服從正態(tài)分布;也有學(xué)者采用Logistic回歸模型進(jìn)行財務(wù)危機(jī)預(yù)警研究[6-8],但Logistic回歸模型一般用于解決二分類問題,也要求解釋變量與被解釋變量存在線性關(guān)系;而后有學(xué)者采用人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行財務(wù)危機(jī)預(yù)警研究[9],該類模型采用的是局部搜索的優(yōu)化方法,容易造成局部極小的問題。令人欣慰的是,Vapnik[10]提出的支持向量機(jī)(Support Vector Machine,SVM)恰好具有解決以上模型存在問題的突出優(yōu)勢,具有更為優(yōu)異的學(xué)習(xí)能力和泛化推廣性能,其一經(jīng)提出便受到學(xué)術(shù)界眾多學(xué)者青睞并被廣泛運用于風(fēng)險預(yù)警等研究中[11,12]。
必須指出的是,無論是在醫(yī)學(xué)領(lǐng)域、信息領(lǐng)域還是金融領(lǐng)域,樣本集往往呈現(xiàn)偏態(tài)的特征,即兩類樣本數(shù)目往往是不等的。這種非均衡樣本所訓(xùn)練出的模型得到的分類結(jié)果會具有明顯的偏向性,即對多數(shù)類樣本預(yù)測準(zhǔn)確率高,對少數(shù)類樣本預(yù)測準(zhǔn)確率較低。而傳統(tǒng)SVM的良好預(yù)測性能往往要求兩類樣本是均衡的[12,13],但是發(fā)生財務(wù)危機(jī)的上市公司畢竟只是少數(shù),財務(wù)正常的上市公司占多數(shù),這就必然導(dǎo)致兩類樣本不均衡,從而使得SVM所構(gòu)建的分類超平面會偏向財務(wù)危機(jī)樣本一邊,進(jìn)而導(dǎo)致模型的預(yù)測效果不盡人意。
于是,有學(xué)者從數(shù)據(jù)層面和算法層面對非均衡樣本進(jìn)行了研究。欠采樣(Under-sampling)和過采樣(Over-sampling)是常用的將非均衡樣本處理為均衡樣本的方法,但是欠采樣方法在刪除多數(shù)類樣本時可能會將影響分類的有效信息誤刪,最終造成預(yù)測效果不理想。過采樣則是通過增加少數(shù)類的樣本使兩類樣本數(shù)目達(dá)到均衡,但增加的樣本可能造成少數(shù)類樣本的相互重疊,也未必能進(jìn)一步提升模型預(yù)測結(jié)果的準(zhǔn)確性[13]。而后有學(xué)者將處理非均衡樣本的方法與SVM相結(jié)合進(jìn)行研究,如衣柏衡等[14]提出了改進(jìn)的SMOTE與SVM相結(jié)合的方法,在面對非均衡樣本時,生成一定數(shù)量的少數(shù)類樣本來進(jìn)行平衡處理,但令人遺憾的是,利用SMOTE對少數(shù)類樣本進(jìn)行處理,無法消除多數(shù)類樣本中的噪聲信息,容易造成新生成樣本重疊的問題[15]。林宇等[12]將自適應(yīng)合成抽樣方法(ADASYN)和逐級優(yōu)化遞減欠采樣方法(ODR)與SVM相結(jié)合,構(gòu)建ODRADASYN-SVM模型對極端金融風(fēng)險進(jìn)行了預(yù)警研究,但這種做法可能會破壞原始數(shù)據(jù)的結(jié)構(gòu)且違背研究的可重復(fù)性原則,特別地,由于該方法的訓(xùn)練樣本與原始數(shù)據(jù)有偏,其模型的解釋性也容易受到質(zhì)疑[16]。
令人驚喜的是,Twin-SVM[17]的提出從根本上解決了非均衡樣本的問題,Twin-SVM不必增加或減少原始樣本,而是為上市公司財務(wù)正常樣本與財務(wù)危機(jī)樣本分別構(gòu)造一個分類超平面,使每個分類超平面離本類樣本點盡可能近而離另一類樣本點盡可能遠(yuǎn),將一個大的分類問題轉(zhuǎn)換成求解兩個小的分類問題,從而約束條件數(shù)目將減少,模型訓(xùn)練時間縮短,Twin-SVM的分類靈活性及計算性能將大大提高,從而行之有效地克服了傳統(tǒng)SVM的根本缺陷[11,18]。因此,本文引入Twin-SVM對創(chuàng)業(yè)板上市公司財務(wù)危機(jī)進(jìn)行預(yù)警研究。
從目前所掌握的文獻(xiàn)來看,對于Twin-SVM的研究主要集中在算法的優(yōu)化改進(jìn)、圖像識別以及金融風(fēng)險的預(yù)警等方面,并未發(fā)現(xiàn)將其應(yīng)用于財務(wù)危機(jī)預(yù)警的實證研究;在Twin-SVM的核函數(shù)選擇上,以往學(xué)者大多是選擇RBF,而未對不同核函數(shù)下Twin-SVM模型的預(yù)測性能進(jìn)行探討;以往的文獻(xiàn)在對創(chuàng)業(yè)板上市公司進(jìn)行財務(wù)預(yù)測時,并沒有針對創(chuàng)業(yè)板中的分行業(yè)進(jìn)行模型的泛化性能探討。
基于以上分析,本文以我國創(chuàng)業(yè)板上市公司為研究對象,基于扣除非經(jīng)常性損益后的凈利潤和凈資產(chǎn)增長率構(gòu)建財務(wù)危機(jī)的識別方法,從而確定了財務(wù)正常和財務(wù)危機(jī)樣本。對所選取的31個財務(wù)指標(biāo),運用顯著性檢驗、相關(guān)性分析、共線性診斷和逐步回歸提取出最具解釋能力的財務(wù)指標(biāo)作為模型的最終輸入變量,以此避免維數(shù)災(zāi)難和過擬合的問題。首先,對不同核函數(shù)下的Twin-SVM模型進(jìn)行預(yù)測性能對比來確定最優(yōu)的核函數(shù);然后采用分類準(zhǔn)確率、幾何平均正確率G、少數(shù)類的度量值F對在不同樣本劃分比例下的Twin-SVM、ODR-ADASYNSVM、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類法以及K近鄰法的預(yù)測精度及穩(wěn)健性進(jìn)行對比,運用配對樣本T檢驗對各模型預(yù)測精度的差異性進(jìn)行顯著性檢驗;最后,對制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個分行業(yè)下不同預(yù)警模型的泛化性能進(jìn)行對比研究。希望能為公司經(jīng)營者以及監(jiān)管層防范和化解風(fēng)險與危機(jī)提供良好的借鑒,為投資者減小損失提供合適的操作工具。
二、研究方法
2.財務(wù)危機(jī)識別方法。構(gòu)建財務(wù)危機(jī)預(yù)警模型的關(guān)鍵之一在于如何識別上市公司是否發(fā)生財務(wù)危機(jī)。從主板和中小板來看,Geng等[19]、Chu等[20]將被ST和非ST作為是否陷入財務(wù)危機(jī)的識別標(biāo)志,但是創(chuàng)業(yè)板不同于主板和中小板存在“ST”和“ST”這樣的過渡階段,對于存在財務(wù)危機(jī)的企業(yè)直接作暫停上市處理。因此,在對創(chuàng)業(yè)板上市公司進(jìn)行財務(wù)危機(jī)預(yù)警研究時,不能繼續(xù)沿用以往的標(biāo)準(zhǔn)。從已有的研究創(chuàng)業(yè)板上市公司財務(wù)危機(jī)預(yù)警的文獻(xiàn)來看,岑慧[21]以四種情況作為界定標(biāo)準(zhǔn):一是凈利潤為負(fù),二是凈資產(chǎn)為負(fù),三是審計報告為非標(biāo)意見,四是營業(yè)利潤增長率為負(fù);宋寶珠[8]以兩種情況作為界定標(biāo)準(zhǔn):一是連續(xù)兩個年度凈利潤為負(fù),二是凈資產(chǎn)在最近一個會計年度為負(fù)。
由此,本文發(fā)現(xiàn)以往學(xué)者在識別創(chuàng)業(yè)板上市公司財務(wù)危機(jī)時往往以凈利潤和凈資產(chǎn)作為標(biāo)準(zhǔn),但是僅將凈利潤為負(fù)作為界定標(biāo)準(zhǔn),缺少一定合理性。因為一些企業(yè)雖然經(jīng)營困難、陷入財務(wù)危機(jī),但是因獲得政府或者銀行補(bǔ)助而得以繼續(xù)生存,因此,本文將扣除非經(jīng)常性損益后的凈利潤作為凈利潤的替代標(biāo)準(zhǔn)。最終本文將陷入財務(wù)危機(jī)的識別標(biāo)準(zhǔn)界定為:一是最近一個會計年度扣除非經(jīng)常性損益的凈利潤為負(fù);二是最近一個會計年度期末凈資產(chǎn)增長率為負(fù)。
對于一家上市公司,一旦同時達(dá)到上述兩個門檻,則被識別為財務(wù)危機(jī)樣本;反之,則被識別為財務(wù)正常樣本。
3.財務(wù)危機(jī)預(yù)警模型的性能評估方法。為了更全面地評估Twin-SVM財務(wù)危機(jī)預(yù)警模型的綜合性能,不僅要評估模型的預(yù)測性能是否優(yōu)越,還要對模型的穩(wěn)健性進(jìn)行研究,考察其在樣本劃分比例不同的情況下是否依然能保持優(yōu)越的預(yù)測性能。本文首先運用傳統(tǒng)的分類正確率對總體的分類準(zhǔn)確率進(jìn)行考察,再進(jìn)一步借鑒相關(guān)文獻(xiàn)[15],運用針對非均衡樣本的評估指標(biāo)對Twin-SVM財務(wù)危機(jī)預(yù)警模型進(jìn)行預(yù)測精度的評估。分類正確率即總的預(yù)測正確的樣本數(shù)占總體樣本數(shù)的比例,針對非均衡樣本分類的評估指標(biāo)則是幾何平均正確率Gmean和少數(shù)類的度量值Fmeasure(以下用G和F分別代替Gmean和Fmeasure)。G和F評估指標(biāo)的構(gòu)建過程具體闡述如下:
設(shè)TP和TN分別表示將財務(wù)危機(jī)樣本和財務(wù)正常樣本預(yù)測正確的數(shù)量,F(xiàn)N和FP分別表示將財務(wù)危機(jī)樣本和財務(wù)正常樣本預(yù)測錯誤的數(shù)量?;煜仃嚤硎緦y試集進(jìn)行預(yù)測分類的結(jié)果(見表1)。
于是,通過計算式(20)、(21)和(22)中的分類準(zhǔn)確率、幾何平均正確率G及少數(shù)類的度量值F,本文就能對所構(gòu)建的Twin-SVM模型的預(yù)測性能進(jìn)行準(zhǔn)確的評價。G值越大,表示對財務(wù)正常和財務(wù)危機(jī)兩類樣本的綜合預(yù)測性能越優(yōu)異;F值越大,表示對財務(wù)危機(jī)樣本的預(yù)測精度越高,反之亦然。
三、實證結(jié)果與分析
1.樣本選擇及數(shù)據(jù)處理。由于本文在設(shè)計創(chuàng)業(yè)板上市公司財務(wù)危機(jī)預(yù)警模型時,選擇滯后狀態(tài)指標(biāo)一個警度時差,且根據(jù)創(chuàng)業(yè)板股票上市規(guī)則,最近連續(xù)虧損三年的公司會被進(jìn)行退市處理,因此早期的預(yù)測就能夠保證企業(yè)在應(yīng)對危機(jī)時抓住有利時機(jī),采取有效措施,最大限度地減少相關(guān)損失。為保證對上市公司財務(wù)危機(jī)預(yù)警的前瞻性與時效性,本文對2018年前三年即2016 ~ 2018年的警度進(jìn)行研究,從而應(yīng)選擇2015 ~ 2017年的數(shù)據(jù)。在剔除了數(shù)據(jù)存在缺失的樣本后,共得到655家樣本公司。從三年的數(shù)據(jù)樣本中分別隨機(jī)抽取等比例的數(shù)據(jù)組成訓(xùn)練集和測試集,經(jīng)統(tǒng)計發(fā)現(xiàn)三年樣本中財務(wù)正常樣本和財務(wù)危機(jī)樣本的比例超過10∶1,構(gòu)成嚴(yán)重的非均衡樣本。本文所有數(shù)據(jù)都來源于Wind數(shù)據(jù)庫。
2.特征指標(biāo)的篩選。對引發(fā)財務(wù)危機(jī)的特征指標(biāo)進(jìn)行準(zhǔn)確提取,是構(gòu)建財務(wù)危機(jī)預(yù)警模型的重要步驟。由于在對模型的輸入變量即財務(wù)指標(biāo)的選取上暫未得到定論[22],因此本文借鑒以往研究文獻(xiàn)[19,23]并參考公司業(yè)績綜合評價指標(biāo)體系,從盈利能力、現(xiàn)金流量、營運能力、成長能力和償債能力五個方面挑選出31個財務(wù)指標(biāo)(模型的特征指標(biāo)見表2)。
為篩選出能顯著區(qū)分危機(jī)狀態(tài)的財務(wù)指標(biāo),本文借鑒相關(guān)文獻(xiàn)[12,23,24],分別對符合正態(tài)分布和非正態(tài)分布的變量采用T檢驗和U檢驗,將未能通過顯著性檢驗的指標(biāo)(X12)予以剔除。進(jìn)一步,為避免指標(biāo)間的共線性問題對模型的擬合效果產(chǎn)生影響,本文借鑒相關(guān)研究[23,25],運用相關(guān)性分析和共線性診斷對30個留存變量進(jìn)行分析,最終剔除了6個指標(biāo)(X2、X3、X7、X8、X27和X28)。為更近一步提取出對狀態(tài)指標(biāo)變量有更強(qiáng)解釋力的特征變量,借鑒以往學(xué)者的研究[22],采用逐步回歸(Stepwise Regression)對數(shù)據(jù)進(jìn)行進(jìn)一步的處理,最終將24個特征指標(biāo)約簡為7個特征指標(biāo),分別為:X1(平均凈資產(chǎn)收益率)、X11(全部資產(chǎn)現(xiàn)金回收率)、X16(非流動資產(chǎn)周轉(zhuǎn)率)、X17(固定資產(chǎn)周轉(zhuǎn)率)、X18(應(yīng)收賬款周轉(zhuǎn)率)、X21(營業(yè)總收入)和X26(流動比率)。至此,已完成對創(chuàng)業(yè)板上市公司財務(wù)危機(jī)預(yù)警模型特征指標(biāo)的篩選。
3.不同核函數(shù)下Twin-SVM模型的預(yù)測性能對比。基于不同核函數(shù)的Twin-SVM財務(wù)危機(jī)預(yù)警模型具有不同的預(yù)測性能,倘若無法確定最優(yōu)的核函數(shù),就無法獲得性能優(yōu)越的預(yù)警模型。本文采用5折交叉驗證法(Cross Validation,CV)下G值、F值以及分類準(zhǔn)確率對Twin-SVM創(chuàng)業(yè)板上市公司財務(wù)危機(jī)預(yù)警模型的最優(yōu)核函數(shù)進(jìn)行確定。實驗結(jié)果見表3。
從表3可看出,依次將5種核函數(shù)與Twin-SVM模型結(jié)合后,RBF核函數(shù)的G值(0.6681)和F值(0.3586)顯著高于其余4種核函數(shù)。雖然RBF核函數(shù)的分類準(zhǔn)確率(0.8616)略低于其余核函數(shù),但是究其原因是其余核函數(shù)所構(gòu)成的模型將大量財務(wù)危機(jī)樣本錯誤預(yù)測為財務(wù)正常樣本,財務(wù)危機(jī)樣本僅占總體樣本的一小部分。而把財務(wù)危機(jī)樣本錯誤預(yù)測為財務(wù)正常樣本所產(chǎn)生的危害是遠(yuǎn)大于把財務(wù)正常樣本錯誤預(yù)測為財務(wù)危機(jī)樣本的。因此,將RBF核函數(shù)與Twin-SVM結(jié)合后的預(yù)測性能是顯著優(yōu)于其余核函數(shù)的,本文采用RBF作為Twin-SVM的核函數(shù)。
同時,為了直觀地展現(xiàn)在創(chuàng)業(yè)板上市公司財務(wù)危機(jī)預(yù)警研究中最優(yōu)核函數(shù)RBF下Twin-SVM預(yù)警模型的參數(shù)效果圖,本文在將RBF核參數(shù)設(shè)定為0.8的基礎(chǔ)上,讓Twin-SVM模型本身的參數(shù)c1在{0.001,0.01,0.1,1,10}區(qū)間取值、c2在{0.005,0.05,0.5,5,50}區(qū)間取值,來研究不同參數(shù)下預(yù)警模型的預(yù)測性能。實驗結(jié)果如圖1所示。
從圖1中可看出,RBF核函數(shù)下Twin-SVM預(yù)警模型在不同的參數(shù)下取得了差異較大的預(yù)測效果。從更為綜合的評價指標(biāo)G值和F值來看,大多數(shù)情況下,Twin-SVM模型的預(yù)測效果隨c1和c2的變動呈現(xiàn)同增或同減的變動趨勢;而從分類準(zhǔn)確率來看,大多數(shù)情況下,c1取值較小且c2取值較大時,整體的分類準(zhǔn)確率都較低,這是因為當(dāng)c1取值較小時,對財務(wù)危機(jī)樣本進(jìn)行預(yù)測的容錯率較低,會將大量的財務(wù)正常樣本錯誤劃分,導(dǎo)致對財務(wù)危機(jī)樣本預(yù)測準(zhǔn)確率較高,而整體的分類準(zhǔn)確率都較低。倘若c1取值較大而c2取值較小時,分類準(zhǔn)確率提高,但是此時G值和F值較低,即將大量財務(wù)危機(jī)樣本錯誤劃分。因此,在參數(shù)選取上不僅要考慮財務(wù)危機(jī)樣本的分類準(zhǔn)確率,也要關(guān)注整體樣本的分類準(zhǔn)確率。進(jìn)一步發(fā)現(xiàn),在c1和c2分別取0.01和0.5時,無論是G值、F值還是分類準(zhǔn)確率都取得了較好的效果。由此,本文所使用的RBF核函數(shù)下Twin-SVM模型的參數(shù)設(shè)置是準(zhǔn)確且可靠的。
4.不同預(yù)警模型的預(yù)測性能對比。在確定了Twin-SVM預(yù)警模型的最優(yōu)核函數(shù)以及模型參數(shù)之后,就要對模型的預(yù)測性能進(jìn)行評估。為了避免數(shù)據(jù)的隨機(jī)選取造成偶然性結(jié)果,也為了避免模型過擬合和欠擬合的問題,本文借鑒相關(guān)文獻(xiàn)[19],采用不同劃分比例(6∶4、7∶3、8∶2、9∶1)的訓(xùn)練集和測試集分別進(jìn)行訓(xùn)練和預(yù)測。在將經(jīng)篩選后的特征指標(biāo)作為輸入指標(biāo)后,首先對Twin-SVM預(yù)警模型的分類準(zhǔn)確率進(jìn)行計算,進(jìn)一步計算在最優(yōu)參數(shù)下Twin-SVM預(yù)警模型的幾何平均正確率G和少數(shù)類的度量值F。為了展示Twin-SVM模型優(yōu)越的預(yù)測性能,將其與改進(jìn)的ODR-ADASYN-SVM模型、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類法(Bayes模型)和K近鄰法(KNN模型)進(jìn)行比較,結(jié)果如表4所示。
從表4中可以看出,無論是在6∶4、7∶3、8∶2還是9∶1的數(shù)據(jù)劃分比例下,Twin-SVM模型的分類準(zhǔn)確率都略低于BP神經(jīng)網(wǎng)絡(luò)和K近鄰法,但是略高于改進(jìn)的ODR-ADASYN-SVM模型且顯著高于Bayes分類法。究其原因,是BP神經(jīng)網(wǎng)絡(luò)和K近鄰法沒有考慮到財務(wù)正常和財務(wù)危機(jī)公司構(gòu)成的嚴(yán)重非均衡樣本的特性,將大量財務(wù)危機(jī)公司錯誤預(yù)判為財務(wù)正常公司,而財務(wù)正常樣本的數(shù)量僅占總體樣本很小的比例,所以最后導(dǎo)致BP神經(jīng)網(wǎng)絡(luò)和K近鄰法的總體分類準(zhǔn)確率會略高于Twin-SVM模型。而ODR-ADASYN-SVM和Bayes分類法的分類準(zhǔn)確率較低的原因可能在于,這兩個模型對兩類樣本的擬合效果和預(yù)測性能不及Twin-SVM模型優(yōu)異。
值得注意的是,將財務(wù)危機(jī)公司預(yù)測為財務(wù)正常公司所帶來的危害是遠(yuǎn)遠(yuǎn)大于將財務(wù)正常公司預(yù)測為財務(wù)危機(jī)公司的。因此,為了進(jìn)一步體現(xiàn)TwinSVM模型對少數(shù)類的財務(wù)危機(jī)樣本的優(yōu)越預(yù)測性能,將針對非均衡樣本的評價指標(biāo)幾何平均正確率G和少數(shù)類的度量值F進(jìn)一步用于Twin-SVM與其他模型的對比研究。為更直觀地展現(xiàn)預(yù)測結(jié)果,將結(jié)果繪制在折線圖中,見圖2。
由圖2可直觀看出,從幾何平均正確率G來看,四種數(shù)據(jù)劃分比例下Twin-SVM模型的G值都在0.7上下波動,顯著大于ODR-ADASYN-SVM模型(0.6左右)、BP神經(jīng)網(wǎng)絡(luò)(0.3左右)、Baye分類法(0.5左右)和K近鄰法(0.3左右)。表明無論是對財務(wù)正常還是財務(wù)危機(jī)樣本,ODR-ADASYN-SVM模型、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類法和K近鄰法的預(yù)測效果都不如Twin-SVM模型;從少數(shù)類的度量值F來看,ODR-ADASYN-SVM模型(0.3左右)、BP神經(jīng)網(wǎng)絡(luò)(0.15左右)、Bayes分類法(0.18左右)和K近鄰法(0.2左右)也是遠(yuǎn)小于Twin-SVM模型(0.38左右),表明非均衡樣本數(shù)據(jù)集對其他四種模型的預(yù)測能力都有較為嚴(yán)重的影響。進(jìn)一步從不同數(shù)據(jù)劃分比例下預(yù)測精度的G值或者F值的標(biāo)準(zhǔn)差來看,除Twin-SVM模型預(yù)測精度G值和F值的標(biāo)準(zhǔn)差(0.0218,0.0112)大于Bayes分類法(0.0215,0.006)以外,Twin-SVM模型預(yù)測精度G值和F值的標(biāo)準(zhǔn)差均小于其余模型。由此,綜合來看,Twin-SVM模型的預(yù)測性能和穩(wěn)健性都是顯著優(yōu)于ODRADASYN-SVM模型、BP神經(jīng)網(wǎng)絡(luò)、Baye分類法和K近鄰法的。
進(jìn)一步地,如果僅將結(jié)論建立在評價指標(biāo)數(shù)值上,則缺少了類似數(shù)理統(tǒng)計上的嚴(yán)謹(jǐn)性與可靠性。因此,為增強(qiáng)所得結(jié)果的科學(xué)性與客觀性,本文繼續(xù)采用配對樣本T檢驗對預(yù)測結(jié)果進(jìn)行顯著性檢驗以判斷不同模型的預(yù)測性能是否存在顯著性差異。檢驗結(jié)果如表5所示。
從表5可以看出,Twin-SVM模型與BP神經(jīng)網(wǎng)絡(luò)、Bayes分類法和K近鄰法在分類準(zhǔn)確率上的配對樣本T檢驗統(tǒng)計量在1%的顯著性水平上拒絕零假設(shè)(null hypothesis),即Twin-SVM模型與其他三個模型的預(yù)測效果有顯著性差異,Twin-SVM模型在分類準(zhǔn)確率上顯著優(yōu)于Bayes分類法,但略低于BP神經(jīng)網(wǎng)絡(luò)和K近鄰法,這與前文的結(jié)論一致。進(jìn)一步地,從更為綜合的針對非均衡樣本的評價指標(biāo)幾何平均正確率G及少數(shù)類的度量值F來看,在5%的顯著性水平上,Twin-SVM模型與ODR-ADASYNSVM模型、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類法和K近鄰法的G值和F值有顯著性差異。由此,從預(yù)測精度上來看,Twin-SVM模型是顯著優(yōu)越于其他四個模型的。
5.分行業(yè)下Twin-SVM預(yù)警模型的預(yù)測結(jié)果。評價模型的預(yù)測性能不僅要基于整體行業(yè)進(jìn)行實證研究,而且應(yīng)在不同行業(yè)不同特點下論證模型的泛化性能。本文在實驗過程中發(fā)現(xiàn)創(chuàng)業(yè)板發(fā)生財務(wù)危機(jī)的公司大多數(shù)集中在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個行業(yè),2015年發(fā)生財務(wù)危機(jī)的公司共15家,其中12家屬于制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè);2016年發(fā)生財務(wù)危機(jī)的公司共38家,其中30家集中在上述兩個行業(yè);2017年發(fā)生財務(wù)危機(jī)的公司共98家,其中81家集中在上述兩個行業(yè)。而制造業(yè)是創(chuàng)業(yè)板板塊中規(guī)模最大的行業(yè),也是我國經(jīng)濟(jì)社會發(fā)展的支柱性產(chǎn)業(yè)。在當(dāng)今信息高速發(fā)展以及大數(shù)據(jù)時代下,信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)對于國家經(jīng)濟(jì)發(fā)展的重要性不言而喻。由此,本文進(jìn)一步在這兩大行業(yè)中對Twin-SVM模型與其余模型展開預(yù)測精度對比,以考察該模型的泛化性能。實驗結(jié)果見表6。
通過表6可看出,在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個分行業(yè)中Twin-SVM模型均獲得了最為優(yōu)異的預(yù)測效果。在制造業(yè)中,TwinSVM模型明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和K近鄰法,雖然ODR-ADASYN-SVM模型和Bayes分類法的G值略大于Twin-SVM模型,但是綜合分類準(zhǔn)確率和F值來看,ODR-ADASYN-SVM模型和Bayes分類法總體分類準(zhǔn)確率較低,且對財務(wù)危機(jī)樣本的預(yù)測精度也低,因此在制造業(yè)的預(yù)測中,Twin-SVM模型是優(yōu)于其他模型的。而從信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)來看,Twin-SVM模型的G值(0.6298)和F值(0.2920)明顯大于其他模型,表明Twin-SVM模型無論是對財務(wù)正常樣本還是財務(wù)危機(jī)樣本都有著優(yōu)越的預(yù)測能力。
綜合以上分析,無論是從預(yù)測精度來說,還是從預(yù)測穩(wěn)健性來說,就整個創(chuàng)業(yè)板來看,Twin-SVM模型都是顯著優(yōu)越于其他預(yù)警模型的。而在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個分行業(yè)中,Twin-SVM模型也具有更為優(yōu)異的學(xué)習(xí)能力和推廣泛化能力。因此,Twin-SVM模型有著更為優(yōu)越的綜合性能,能有效地識別并預(yù)測我國創(chuàng)業(yè)板上市公司的財務(wù)危機(jī),為公司經(jīng)營者和監(jiān)管層防范與化解風(fēng)險、投資者減少投資損失提供合適的操作工具。
四、結(jié)論
本文將篩選后的我國創(chuàng)業(yè)板655家上市公司作為研究樣本,基于扣除非經(jīng)常性損益后的凈利潤和凈資產(chǎn)增長率構(gòu)建財務(wù)危機(jī)的識別方法,從而確定了財務(wù)正常和財務(wù)危機(jī)樣本。在Twin-SVM模型的構(gòu)建過程中,運用5折交叉驗證法下的三個評價指標(biāo)即分類準(zhǔn)確率、幾何平均正確率G和少數(shù)類的度量值F來確定最優(yōu)的Twin-SVM核函數(shù)。然后對在不同樣本劃分比例下的Twin-SVM模型與ODRADASYN-SVM模型、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類法以及K近鄰法的預(yù)測精度和穩(wěn)健性進(jìn)行對比,運用配對T檢驗對各模型預(yù)測精度的差異性進(jìn)行顯著性檢驗。最后在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個分行業(yè)中對Twin-SVM模型與其余模型的泛化性能進(jìn)行了對比。
實證結(jié)果表明:在Twin-SVM模型的構(gòu)建過程中,RBF核函數(shù)展示出比Linear、Polynomial、Sigmoid、Wavelet核函數(shù)更為優(yōu)異的預(yù)測性能;與改進(jìn)的ODR-ADASYN-SVM模型、BP神經(jīng)網(wǎng)絡(luò)、Bayes分類法和K近鄰法相比,Twin-SVM模型不僅在預(yù)測精度上高于其他模型,而且在預(yù)測穩(wěn)健性上顯著更為優(yōu)越,在制造業(yè)與信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)兩個分行業(yè)的泛化性能也顯著優(yōu)越于其余幾個模型。
根據(jù)以上實證研究結(jié)果,基于Twin-SVM的財務(wù)危機(jī)預(yù)警模型能夠有效地識別并預(yù)測我國創(chuàng)業(yè)板上市公司是否會發(fā)生財務(wù)危機(jī)。對政府管理決策部門而言,能根據(jù)預(yù)測結(jié)果及時準(zhǔn)確地評估上市公司發(fā)生財務(wù)危機(jī)的可能性,并制定和實施相應(yīng)的措施,避免對經(jīng)濟(jì)社會的平穩(wěn)運行產(chǎn)生大的影響;對公司經(jīng)營者來說,可審時度勢,及時調(diào)整經(jīng)營戰(zhàn)略,積極防范和化解風(fēng)險與危機(jī);對投資者而言,可及時掌握上市公司的經(jīng)營狀況和盈利狀況,進(jìn)而調(diào)整投資策略,優(yōu)化投資組合,減少相關(guān)投資損失。
【主要參考文獻(xiàn)】
[1]John Nkwoma Inekwe,Yi Jin,Ma. Rebecca Valenzuela. The effects of financial distress:Evidence from US GDP growth[J].Economic Modelling,2018(72):8~21.
[2]Geng R.,Bose I.,Chen X. Prediction of financial distress:An empirical study of listed Chinese companies using data mining[J].European Journal of Operational Research,2015(1):236~247.
[3]逯東,萬麗梅,楊丹.創(chuàng)業(yè)板公司上市后為何業(yè)績變臉?[J].經(jīng)濟(jì)研究,2015(2):132~144.
[4]William H. Beaver. Financial ratios as predictors of failure[J].Journal of Accounting Research,1964(1):71~111.
[5]Edward I. Altman. Financial ratios,discriminant analysis and the prediction of corporate bankruptcy[J].Journal of Finance,1968(4):189~209.
[6]Hanmei Sun,Thuan Nguyen,Yihui Luan,et al. Classified mixed logistic model prediction[J].Journal of Multivariate Analysis,2018(168):63~74.
[7]James A. Ohlson. Financial ratios and the probabilistic prediction of bankruptcy[J].Journal of Accounting Research,1980(1):109~131.
[8]宋寶珠.創(chuàng)業(yè)板上市公司財務(wù)預(yù)警模型研究[D].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué),2014.
[9]Le H. H.,Viviani J. L. Predicting bank failure:An improvement by implementing machine learning approach on classical financial ratios[J]. Post-Print,2017(44):16~25.
[10]Vapnik V. N. The nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995:100~200.
[11]Huang H.,Wei X.,Zhou Y. Twin support vector machines:A survey[J].Neurocomputing,2018(300):34~43.
[12]林宇,黃迅,淳偉德等.基于ODR-ADASYN-SVM的極端金融風(fēng)險預(yù)警研究[J].管理科學(xué)學(xué)報,2016(5):87~101.
[13]Jian C.,Gao J.,Ao Y. A new sampling method for classifying imbalanced data based on support vector machine ensemble[J].Neurocomputing,2016(193):115~122.
[14]衣柏衡,朱建軍,李杰.基于改進(jìn)SMOTE的小額貸款公司客戶信用風(fēng)險非均衡SVM分類[J].中國管理科學(xué),2016(3):24~30.
[15]Beyan C.,F(xiàn)isher R. Classifying imbalanced data sets using similarity based hierarchical decomposition[J].Pattern Recognition,2015(5):1653~1672.
[16]李揚,李竟翔,馬雙鴿.不平衡數(shù)據(jù)的企業(yè)財務(wù)預(yù)警模型研究[J].數(shù)理統(tǒng)計與管理,2016(5):893~906.
[17]R. K. Javadeva,R. Khemchandani,S. Chandra. Twin support vector machine for pattern classification[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2007(5):905~910.
[18]王鵬,黃迅.基于Twin-SVM的多分形金融市場風(fēng)險的智能預(yù)警研究[J].統(tǒng)計研究,2018(2):3~13.
[19]Geng R.,Bose I.,Chen X. Prediction of financial distress:An empirical study of listed Chinese companies using data mining[J].European Journal of Operational Research,2015(1):236~247.
[20]Chu Y.,Wang G.,Chen G. A new random subspace method incorporating sentiment and textual information for financial distress prediction[J].Electronic Commerce Research & Applications,2018(29):30~49.
[21]岑慧.創(chuàng)業(yè)板上市公司財務(wù)危機(jī)預(yù)警模型研究[D].廈門:集美大學(xué),2018.
[22]Liang D.,Tsai C. F.,Wu H. T. The effect of feature selection on financial distress prediction[J].Knowledge-Based Systems,2014(1):289
~297.
[23]Mselmi N.,Lahiani A.,Hamza T. Financial distress prediction:The case of French small and medium-sized firms[J].International Review of Financial Analysis,2017(50):67~80.
[24]Hosaka T. Bankruptcy prediction using imaged financial ratios and convolutional neural networks[J].Expert Systems with Applications,2019(117):287~299.
[25]Binh P. V. N.,Trung D. T.,Duc V. H. Financial distress and bankruptcy prediction:An appropriate model for listed firms in Vietnam[J]. Economic Systems,2018(42):616~624.