【摘要】 文章以2004—2009年間因調(diào)整損益而受到證監(jiān)會處罰的56份年度財務(wù)報告為研究對象,采用Lib-SVM分類算法,將所有樣本分為訓練樣本和測試樣本,運用訓練樣本構(gòu)建了我國上市公司損益調(diào)整類財務(wù)報告舞弊的識別模型,運用測試樣本檢驗了模型的預測精度。結(jié)果表明,識別效率較高的RBF核函數(shù)模型的預測精度達到86.67%,模型的總體正確率為87.5%。
【關(guān)鍵詞】 財務(wù)報告舞弊;識別模型;RBF核函數(shù);線性核函數(shù)
一、問題的提出
我國上市公司財務(wù)報告舞弊通?;趦深惸康?,一是為實現(xiàn)融資目的而調(diào)節(jié)利潤,包括隱瞞虧損或者為取得配股增發(fā)資格;二是通過隱瞞關(guān)聯(lián)方占款、關(guān)聯(lián)方擔保等行為,以實現(xiàn)大股東的特定利益,其結(jié)果將侵害中小股東的權(quán)益。據(jù)筆者對2004—2009年間受到證監(jiān)會處罰的財務(wù)報告舞弊公司的統(tǒng)計來看,第一類以調(diào)節(jié)利潤為目的的舞弊行為占所處罰公司的55.13%,是我國上市公司主要的舞弊行為。在本文中,以第一類舞弊公司(本文稱其為損益調(diào)整類財務(wù)報告舞弊)為研究對象,基于支持向量機技術(shù)中的Lib-SVM算法,構(gòu)建有效的損益調(diào)整類財務(wù)報告舞弊識別模型,為有關(guān)各方加強監(jiān)管提供參考。
二、研究設(shè)計
?。ㄒ唬颖镜倪x取標準及數(shù)據(jù)來源
1.舞弊樣本的選取標準
本文以2004—2009年間因年度財務(wù)報告舞弊而受到證監(jiān)會查處的公司作為舞弊公司,并選取其中以損益調(diào)整方式實施舞弊的公司為研究對象,并且僅包括因2001年以來的年報舞弊而被處罰的公司,不包括2001年之前的年報中舞弊的公司,也不包括半年報中舞弊的公司及非損益調(diào)整類舞弊公司。整理后得到56家年度財務(wù)報告舞弊公司的56個觀測值。
2.控制樣本的選取標準
本文選取的控制樣本必須同時滿足以下條件:與舞弊公司同行業(yè)、同一上市地點;與舞弊公司資產(chǎn)規(guī)模相當(選取規(guī)模最接近的公司)。整理后同樣得到56家非舞弊公司的56個觀測值。
3.數(shù)據(jù)來源
舞弊公司的確定來源于證監(jiān)會網(wǎng)站公布的處罰公告,經(jīng)逐個整理得到。舞弊公司及控制樣本財務(wù)數(shù)據(jù)和治理機制數(shù)據(jù)來源于國泰安經(jīng)濟研究數(shù)據(jù)庫(CSMAR)。
(二)變量的選取
1.被解釋變量
被解釋變量為財務(wù)報告舞弊(FFS, Fraudulent Financial Statement),該變量為二元變量,某公司在某年度實施了損益調(diào)整類財務(wù)報告舞弊,該變量取值為1;否則取0。
2.解釋變量
我國上市公司主要通過虛增主營業(yè)務(wù)收入、隱瞞主營業(yè)務(wù)成本、隱瞞期間費用、少提減值準備等方式虛增利潤,而這些舞弊方式將直接影響到企業(yè)資產(chǎn)結(jié)構(gòu)、利潤結(jié)構(gòu)和現(xiàn)金流量結(jié)構(gòu),進而影響企業(yè)的資產(chǎn)運作效率。以此為基礎(chǔ),結(jié)合國內(nèi)外已有的研究成果,本文選取的第一類解釋變量包括以下14個財務(wù)特征指標。具體內(nèi)容如表1。
另外,財務(wù)報告舞弊的順利實施通常與薄弱的公司治理機制有關(guān)。而公司治理機制分為內(nèi)部治理結(jié)構(gòu)和外部治理機制兩方面。內(nèi)部治理結(jié)構(gòu)包括股權(quán)結(jié)構(gòu)、董事會特征、審計委員會、高層管理團隊和內(nèi)部審計師;外部治理機制包括外部審計師和監(jiān)管機構(gòu)。當內(nèi)部治理結(jié)構(gòu)和外部監(jiān)管機制失效時,財務(wù)報告舞弊的機會就會大大增加。由以上分析,結(jié)合國內(nèi)外已有的研究成果,本文選取的第二類解釋變量包括以下14個公司治理特征指標,具體內(nèi)容如表2。
?。ㄈ┠P偷倪x取
財務(wù)報告舞弊的識別,即判斷某一公司是否存在舞弊行為,其本質(zhì)上是一個分類問題。根據(jù)分類模型研究領(lǐng)域的最新進展,支持向量機(SVM)算法以其較強的模型泛化能力和較高的識別效果,已經(jīng)成為常用的分類模型之一。目前,支持向量機算法在財務(wù)危機預警研究領(lǐng)域已得到初步運用。結(jié)果表明,運用該算法構(gòu)建的財務(wù)危機預警模型,效果優(yōu)于Probit判別方法、Logistic回歸模型和人工神經(jīng)網(wǎng)絡(luò)(ANN)技術(shù)。
因此,本文引入Lib-SVM支持向量機技術(shù),將損益調(diào)整類舞弊公司按照舞弊年限分為兩組,一組用來構(gòu)建財務(wù)報告舞弊識別模型,另一組用來檢驗模型的預測精度,并以預測精度的高低作為檢驗模型預測效果的依據(jù),判斷模型在后續(xù)年限中的適用性和泛化能力。
同時,由于Lib-SVM算法的核函數(shù)形式包括RBF核函數(shù)、線性核函數(shù)、多項式核函數(shù)、指數(shù)基核函數(shù)等多種形式,其中,RBF核函數(shù)穩(wěn)定性較強,而在某些情況下線性核函數(shù)的預測精度也會高于RBF核函數(shù),因而,本文選擇RBF核函數(shù)和線性核函數(shù)分別構(gòu)建識別模型,并采用一種基于交叉驗證的網(wǎng)格搜尋的方法來確定RBF核函數(shù)的兩個關(guān)鍵參數(shù)C和γ的取值;采用逐步搜尋的方法確定線性核函數(shù)的關(guān)鍵參數(shù)C的取值。
三、解釋變量的顯著性檢驗、Lib-SVM識別模型的構(gòu)建及結(jié)果分析
(一)解釋變量的
459xR9vCWF2yauYrh0oS6g==顯著性檢驗
根據(jù)前述的研究設(shè)計,本文以2004—2009年間因調(diào)節(jié)利潤舞弊而受到證監(jiān)會處罰的56個公司作為舞弊樣本,按一定標準選取了56個非舞弊公司作為控制樣本,并選取了14個財務(wù)特征指標和14個公司治理特征指標作為解釋變量。為保證模型的識別效率,本文先采用兩獨立樣本T檢驗的方法對28個解釋變量的顯著性進行檢驗,并將通過顯著性檢驗的指標作為構(gòu)建模型的基礎(chǔ)。檢驗結(jié)果如表3所示。
檢驗結(jié)果表明,確定的28個解釋變量中,共有13個指標在5%的水平上顯著。其中,財務(wù)特征指標5個,具體為:應收賬款占流動資產(chǎn)的比例、存貨占流動資產(chǎn)的比例、固定資產(chǎn)原值占總資產(chǎn)的比例、其他應收款占總資產(chǎn)的比例和總資產(chǎn)周轉(zhuǎn)率;治理機制特征指標為8個,包括審計意見、第一大股東股權(quán)性質(zhì)、第一大股東持股比例、董事會規(guī)模、董事會持股比例、監(jiān)事會規(guī)模、股東大會會議次數(shù)和高管持股比例。
?。ǘ㎜ib-SVM識別模型的構(gòu)建
根據(jù)上述選出的具備顯著性的13個指標,運用Lib-SVM算法構(gòu)建損益調(diào)整類財務(wù)報告舞弊識別模型。為驗證模型的泛化能力,本文將2001—2006年的所有舞弊公司和配對公司分為兩組,其中,2001—2003年的公司作為訓練樣本,2004—2006年的公司作為測試樣本,運用前三年的數(shù)據(jù)作為訓練集構(gòu)建模型,模型對2004—2006年的分類情況預測精度越高,表明模型的泛化能力越強,在后續(xù)年度運用的效果越好。
1.Lib-SVM算法RBF核函數(shù)識別模型的構(gòu)建與檢驗
首先將全部樣本經(jīng)過歸一化處理,然后將2001—2003年的公司數(shù)據(jù)輸入Lib-SVM程序,經(jīng)過交叉驗證的網(wǎng)格搜尋確定RBF核函數(shù)的C和γ取值結(jié)果如圖1所示。
由圖1可以看出,將2001—2003年調(diào)節(jié)利潤舞弊公司作為訓練樣本,確定的Lib-SVM算法RBF核函數(shù)參數(shù)為C =2048,γ=0.00048828125。
運用參數(shù)為C=2048,γ=0.00048828125的RBF核函數(shù)和2001—2003年調(diào)節(jié)利潤類舞弊公司數(shù)據(jù)構(gòu)建識別模型,再運用所建模型對2004—2006年的公司進行預測,預測精度為86.667%。具體如表4、表5、表6所示。
2.Lib-SVM算法線性核函數(shù)識別模型的構(gòu)建與檢驗
同理,采用Lib-SVM算法線性核函數(shù)根據(jù)2001—2003年的數(shù)據(jù)構(gòu)建模型,并對2004—2006年的數(shù)據(jù)進行預測,確定的線性核函數(shù)參數(shù)C=750,預測精度為83.333%。具體結(jié)果如表7、表8、表9所示。
由上述各表可以看出,以2001—2003年的損益調(diào)整類舞弊公司作為訓練樣本集,構(gòu)建模型后,以2004—2006年的調(diào)節(jié)利潤類舞弊公司作為測試樣本集,結(jié)果表明RBF核函數(shù)的預測精度為86.667%,線性核函數(shù)的預測精度為83.333%,兩者的預測精度都較高,說明識別模型的泛化能力較強,可用于后續(xù)年度財務(wù)報告舞弊的識別。比較而言,在構(gòu)建調(diào)節(jié)利潤舞弊識別模型時,RBF核函數(shù)的預測精度相比線性核函數(shù)更加穩(wěn)定。
從模型的總體正確率來看,采用支持向量機算法構(gòu)建模型,無論是采用RBF核函數(shù)還是線性核函數(shù),Ⅰ類誤判率均在10%左右,總體正確率均高于85%。說明模型結(jié)果對于識別損益調(diào)整類舞弊具有較高的參考價值。
四、研究結(jié)論與不足
?。ㄒ唬┭芯拷Y(jié)論
1.損益調(diào)整類財務(wù)報告舞弊公司的顯著特征。本文研究結(jié)果表明,從財務(wù)特征方面來看,舞弊公司的資產(chǎn)構(gòu)成和資產(chǎn)運作效率顯著不同于非舞弊公司;從治理機制特征方面來看,舞弊公司有8個指標顯著不同于非舞弊公司,包括審計意見、第一大股東股權(quán)性質(zhì)、第一大股東持股比例、董事會規(guī)模、董事會持股比例、監(jiān)事會規(guī)模、股東大會會議次數(shù)和高管持股比例。
2. Lib-SVM舞弊識別模型的效果。在損益調(diào)整類財務(wù)報告舞弊識別模型的構(gòu)建方面,本文分別運用Lib-SVM算法的RBF核函數(shù)和線性核函數(shù),構(gòu)建了損益調(diào)整類財務(wù)報告舞弊的識別模型。結(jié)果表明,采用2001—2003年的數(shù)據(jù)構(gòu)建出的識別模型,對2004—2006年的數(shù)據(jù)具備較強的預測能力,RBF核函數(shù)模型的預測精度達到了86.667%,總體正確率達到了87%;線性核函數(shù)的預測精度達到了83.333%,總體正確率達到了86.607%,說明運用支持向量機技術(shù)構(gòu)建損益調(diào)整類財務(wù)報告舞弊的識別模型,可以為有關(guān)各方識別后續(xù)年度的財務(wù)報告舞弊行為提供參考。
?。ǘ┭芯烤窒扌?br/> 本文在構(gòu)建損益調(diào)整類財務(wù)報告舞弊識別模型時,未考慮財務(wù)特征中的動態(tài)指標,可能會影響到模型的預測效果,有待在后續(xù)研究中繼續(xù)完善。
【主要參考文獻】
?。?] Uzun H,Samuel H Szewczyk,Raj Varma.Board Composition and Corporate Fraud[J].Financial Analysts Journal,2004,(5/6):33-43.
?。?] Jensen. M.C.The Modern Industrial Revolution, Exit and the Failure of internal Control Systems[J]. Journal of Finance, 1993,48(3):831-880.
?。?] Jensen, M. Meckling, W. The theory of the firm: Managerial behavior, agency costs and ownership structure[J]. Journal of Financial Economics, 1976(4):305-360.
?。?] 朱學義,孫自愿等.企業(yè)經(jīng)營者年薪制、期權(quán)股權(quán)激勵及管理層收購方案設(shè)計總結(jié)報告[R]. 江蘇省財政廳科研項目,2003.
?。?] 王澤霞.識別上市公司管理舞弊之預警信號[M].上海:上海三聯(lián)書店,2007:72-88.
?。?] 袁樹民,楊召華.上市公司財務(wù)舞弊與關(guān)聯(lián)方交易[J].財會通訊(學術(shù)版),2007(1):37-40.
?。?] 薛祖云,黃彤.董事會、監(jiān)事會制度特征與會計信息質(zhì)量——來自中國資本市場的經(jīng)驗分析[J]. 財經(jīng)理論與實踐,2004(7):85-89.
?。?] 侯曉紅,李琦,羅煒.大股東占款與上市公司盈利能力關(guān)系研究[J].會計研究,2008(6):77-84.
?。?] 程新生.公司治理、內(nèi)部控制、組織結(jié)構(gòu)互動關(guān)系研究[J].會計研究,2004(4):14-18.