国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘的會(huì)計(jì)舞弊識(shí)別問(wèn)題研究綜述

2011-02-09 19:44汪士果張俊民
關(guān)鍵詞:舞弊數(shù)據(jù)挖掘神經(jīng)網(wǎng)絡(luò)

汪士果 張俊民

(天津財(cái)經(jīng)大學(xué) 商學(xué)院,天津300222)

基于數(shù)據(jù)挖掘的會(huì)計(jì)舞弊識(shí)別問(wèn)題研究綜述

汪士果 張俊民

(天津財(cái)經(jīng)大學(xué) 商學(xué)院,天津300222)

本文檢索了近年來(lái)基于數(shù)據(jù)挖掘的會(huì)計(jì)舞弊識(shí)別方面的文獻(xiàn),歸類比較挖掘數(shù)據(jù)、算法以及分類器評(píng)價(jià)方法和分類效果,為投資者、監(jiān)管部門(mén)和審計(jì)師在舞弊識(shí)別中選用適當(dāng)數(shù)據(jù)和挖掘技術(shù)及優(yōu)化模型提供借鑒?,F(xiàn)有研究多對(duì)舞弊和配對(duì)非舞弊樣本進(jìn)行有標(biāo)簽挖掘,特征值涵蓋審計(jì)師數(shù)據(jù)、公司治理數(shù)據(jù)、財(cái)務(wù)報(bào)表數(shù)據(jù)、行業(yè)和交易數(shù)據(jù)多個(gè)類別。當(dāng)前研究以反映舞弊三角的綜合數(shù)據(jù)為主,比率數(shù)據(jù)比賬戶數(shù)據(jù)更有效,主要算法包括統(tǒng)計(jì)檢驗(yàn)、回歸分析、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、貝葉斯網(wǎng)絡(luò)、堆棧變量法等。其中,回歸分析應(yīng)用最為普遍,神經(jīng)網(wǎng)絡(luò)在識(shí)別效果和準(zhǔn)確性方面總體上優(yōu)于回歸模型,模型輔助檢測(cè)優(yōu)于審計(jì)師無(wú)輔助檢測(cè)?,F(xiàn)有文獻(xiàn)還缺乏無(wú)標(biāo)簽挖掘和時(shí)序數(shù)據(jù)挖掘研究。

數(shù)據(jù)挖掘;舞弊識(shí)別;會(huì)計(jì)舞弊;分類器評(píng)價(jià)

一、引言

會(huì)計(jì)舞弊是指旨在欺騙財(cái)務(wù)報(bào)表使用者,尤其是投資者和債權(quán)人的蓄意錯(cuò)報(bào)或數(shù)額的遺漏[1](P6)。舞弊識(shí)別是反舞弊的關(guān)鍵環(huán)節(jié),對(duì)于會(huì)計(jì)執(zhí)業(yè)界和社會(huì)公眾都越來(lái)越重要。數(shù)據(jù)挖掘是指從數(shù)據(jù)中提取統(tǒng)計(jì)上可靠、以前未知并且可行動(dòng)信息的知識(shí)發(fā)現(xiàn)過(guò)程[2]。一般而言,用于挖掘的數(shù)據(jù)必須可獲取、問(wèn)題相關(guān)、數(shù)量充分、清潔。同時(shí),挖掘問(wèn)題必須能夠明確定義,不能夠通過(guò)詢問(wèn)和報(bào)告工具解決,也不能通過(guò)數(shù)據(jù)挖掘程序模型引導(dǎo)解決。自動(dòng)化并且減少手工檢測(cè)工作量的欺詐識(shí)別(或檢測(cè))技術(shù),是歷史最悠久的數(shù)據(jù)挖掘應(yīng)用領(lǐng)域之一。有效識(shí)別會(huì)計(jì)舞弊一直是會(huì)計(jì)執(zhí)業(yè)界的難題。常規(guī)審計(jì)程序不能有效識(shí)別會(huì)計(jì)舞弊的根源在于舞弊識(shí)別效力和效率的矛盾[3]。

數(shù)據(jù)挖掘和會(huì)計(jì)舞弊識(shí)別的耦合點(diǎn)在于,數(shù)據(jù)挖掘技術(shù)作為審計(jì)高級(jí)分析性程序在輔助注冊(cè)會(huì)計(jì)師進(jìn)行舞弊識(shí)別決策時(shí),具有同時(shí)解決效力和效率問(wèn)題的潛力?,F(xiàn)行國(guó)內(nèi)外舞弊準(zhǔn)則雖然在舞弊三角理論框架下提供舞弊“紅旗”的詳細(xì)指導(dǎo),特別強(qiáng)調(diào)充分利用各種信息源探清舞弊風(fēng)險(xiǎn)所在,以及通過(guò)分析性程序等手段充分挖掘隱藏于各類信息中的舞弊風(fēng)險(xiǎn)因子,然而,注冊(cè)會(huì)計(jì)師如何從眾多“紅旗”中綜合得出接受抑或拒絕財(cái)務(wù)報(bào)告存在舞弊的決策結(jié)論仍是一個(gè)難題。在準(zhǔn)則“紅旗”為訓(xùn)練數(shù)據(jù)變量選擇提供有效理論支持的背景下,引進(jìn)決策輔助工具既現(xiàn)實(shí)又非常有必要。

美國(guó)自SAS No.56開(kāi)始便明確要求審計(jì)人員“在審計(jì)計(jì)劃階段和結(jié)束階段必須實(shí)施分析性程序”,在歷次準(zhǔn)則修訂和數(shù)據(jù)挖掘技術(shù)發(fā)展的推動(dòng)下,有許多數(shù)據(jù)挖掘算法被應(yīng)用于會(huì)計(jì)舞弊檢測(cè)。對(duì)基于數(shù)據(jù)挖掘的一般舞弊識(shí)別技術(shù)存在兩種主要批評(píng)意見(jiàn):一是認(rèn)為缺乏可據(jù)以試驗(yàn)的可公開(kāi)獲取的真實(shí)數(shù)據(jù);二是認(rèn)為缺乏成熟的方法和技術(shù)[4]?;跀?shù)據(jù)挖掘的會(huì)計(jì)舞弊識(shí)別面臨同樣的問(wèn)題。本文即是要通過(guò)回顧代表性文獻(xiàn)中數(shù)據(jù)挖掘所應(yīng)用的數(shù)據(jù)結(jié)構(gòu)、算法、結(jié)論以及模型效果評(píng)價(jià),為注冊(cè)會(huì)計(jì)師在舞弊識(shí)別中選用適當(dāng)數(shù)據(jù)和挖掘技術(shù)及進(jìn)一步優(yōu)化模型提供借鑒。

二、文獻(xiàn)回顧

不同文獻(xiàn)應(yīng)用的挖掘數(shù)據(jù)、方法和得出的紅旗標(biāo)志不同,因而很難簡(jiǎn)單地用某一項(xiàng)特定標(biāo)準(zhǔn)進(jìn)行歸類比較,以下主要根據(jù)文獻(xiàn)時(shí)間、大致數(shù)據(jù)類型并結(jié)合挖掘方法回顧代表性文獻(xiàn)。

早期Loebbecke和 Willingham建立的L/W模型并非嚴(yán)格意義上的識(shí)別模型,但其后學(xué)者對(duì)其紅旗標(biāo)志的檢驗(yàn)開(kāi)創(chuàng)了相關(guān)研究的先河。通過(guò)分析證監(jiān)會(huì)會(huì)計(jì)和審計(jì)實(shí)施公告(AAERs)的舞弊特征,L/W模型概括出三大類共46個(gè)舞弊風(fēng)險(xiǎn)因素:(1)組織可能導(dǎo)致舞弊發(fā)生的條件(condition);(2)管理當(dāng)局的舞弊動(dòng)力(motivated);(3)管理當(dāng)局在明確知道會(huì)構(gòu)成犯罪的前提下的道德價(jià)值觀(attitude)。他們認(rèn)為,管理當(dāng)局個(gè)人存在舞弊是合理的倫理價(jià)值觀,又有一定的動(dòng)機(jī),借助于一定的條件,發(fā)生會(huì)計(jì)舞弊的可能性較大;管理當(dāng)局不誠(chéng)實(shí)、人格異常、曾有過(guò)舞弊史、說(shuō)謊、逃避責(zé)任、財(cái)務(wù)披露政策激進(jìn)、業(yè)績(jī)不佳、存在以會(huì)計(jì)數(shù)字為基礎(chǔ)的契約、所在行業(yè)為夕陽(yáng)行業(yè)、決策高度集權(quán)化、存在大量關(guān)聯(lián)交易、內(nèi)部控制薄弱等也是會(huì)計(jì)舞弊的信號(hào)[5]。Loebbecke、Eining和Willingham通過(guò)調(diào)查畢馬威會(huì)計(jì)事務(wù)所合伙人,得到77個(gè)舞弊案例的詳細(xì)資料,用單變量卡方檢驗(yàn)測(cè)試L/W模型中三類舞弊因子的識(shí)別能力。結(jié)果表明,88%的舞弊案件至少存在著L/W模型中的三種舞弊因子中的一種,但由于缺乏非舞弊樣本因而不能評(píng)價(jià)模型的判別力[6]。Bell、Szykowny和Willingham補(bǔ)充非舞弊樣本繼續(xù)檢驗(yàn)L/W模型。研究使用Cascaded Logit方法提供總的舞弊風(fēng)險(xiǎn)評(píng)估,應(yīng)用40個(gè)舞弊和162個(gè)非舞弊樣本檢驗(yàn)預(yù)測(cè)效果,三個(gè)模型產(chǎn)生出超過(guò)25%的錯(cuò)報(bào)率,其最優(yōu)的替代模型正確分類出74%的舞弊案例,對(duì)于非舞弊案例的錯(cuò)分類率僅11%[7]。Bell和Carcello又沿用上述兩篇文獻(xiàn)的研究樣本,增加啞變量對(duì)早期樣本和近期樣本進(jìn)行區(qū)分,并將樣本的所有權(quán)狀況引入模型,繼續(xù)對(duì)L/W模型舞弊因子的識(shí)別能力進(jìn)行檢測(cè)。單變量分析和多變量分析檢驗(yàn)結(jié)果中均顯著的舞弊風(fēng)險(xiǎn)因素包括:薄弱的內(nèi)控環(huán)境,公司高速增長(zhǎng),相對(duì)不足和不穩(wěn)定的盈利能力,管理層過(guò)分重視盈利預(yù)測(cè),管理層對(duì)審計(jì)師撒謊或過(guò)度回避,股權(quán)結(jié)構(gòu),薄弱的內(nèi)控環(huán)境和管理層對(duì)財(cái)務(wù)報(bào)告激進(jìn)態(tài)度的相互作用等。其研究同時(shí)比較了模型和注冊(cè)會(huì)計(jì)師無(wú)輔助預(yù)測(cè)的判別能力,發(fā)現(xiàn)模型對(duì)77個(gè)舞弊樣本的判別更準(zhǔn)確,對(duì)于非舞弊樣本,模型和執(zhí)業(yè)審計(jì)師無(wú)顯著差別[8]。

L/W模型盡管提供了一個(gè)非常有用的舞弊信號(hào)清單,但模型設(shè)計(jì)存在許多主觀判斷和僅能由審計(jì)師和企業(yè)內(nèi)部人士才能獲取的非公開(kāi)信息。Calderon和Green首次使用共享信息建立舞弊模型,對(duì)于廣大投資者和審計(jì)師以外的其他監(jiān)管者識(shí)別舞弊有重要意義。他們利用AAERs中111個(gè)公司1982~1989年的收入、應(yīng)收賬款和存貨中的重大矛盾之處,檢測(cè)財(cái)務(wù)分析師的預(yù)測(cè)、企業(yè)報(bào)告的盈利及舞弊的可能性之間差異的相關(guān)關(guān)系,模型的結(jié)果是:當(dāng)舞弊實(shí)際存在時(shí),預(yù)測(cè)舞弊不存在的錯(cuò)誤風(fēng)險(xiǎn)從9.76%到15.38%;當(dāng)舞弊實(shí)際不存在時(shí),預(yù)測(cè)舞弊存在的錯(cuò)誤風(fēng)險(xiǎn)從77.67%到88%[3]。Summers和Sweeney認(rèn)為Bell、Carcello等研究得出的傳統(tǒng)紅旗標(biāo)志是可控的,并創(chuàng)新性地采用內(nèi)部人交易變量建立模型,Cascaded Logit回歸結(jié)果顯示內(nèi)幕交易可以替代傳統(tǒng)紅旗作為預(yù)測(cè)舞弊的信號(hào)[9]。Persons提出應(yīng)用可公開(kāi)獲取的報(bào)表數(shù)據(jù)識(shí)別會(huì)計(jì)舞弊。他利用1970~1990年美國(guó)舞弊企業(yè)和相應(yīng)配對(duì)樣本,采用逐步邏輯回歸模型從反映企業(yè)七個(gè)方面的十個(gè)財(cái)務(wù)指標(biāo)中篩選出四個(gè)和舞弊相關(guān)的指標(biāo)特征:高財(cái)務(wù)杠桿、低資本周轉(zhuǎn)率、資產(chǎn)構(gòu)成中高流動(dòng)資產(chǎn)比率以及小企業(yè)規(guī)模。最終模型預(yù)測(cè)采用jackknife方法為被評(píng)估企業(yè)計(jì)算舞弊預(yù)測(cè)分值,并通過(guò)與誤分類成本最低的基準(zhǔn)分值比較以對(duì)被評(píng)估企業(yè)歸類。通過(guò)計(jì)算誤分類成本,模型評(píng)價(jià)結(jié)果顯示,對(duì)于所有第一類錯(cuò)誤和第二類錯(cuò)誤,模型預(yù)測(cè)結(jié)果優(yōu)于將全部企業(yè)歸類為非舞弊企業(yè)的簡(jiǎn)單分類。在相對(duì)誤差實(shí)際成本假設(shè)下(第一類錯(cuò)誤和第二類錯(cuò)誤的成本比例為20∶1),模型能夠識(shí)別出絕大多數(shù)的舞弊企業(yè)樣本,對(duì)非舞弊企業(yè)的誤分類比例相對(duì)較?。?0]。Spathis持同樣的思想采用類似方法應(yīng)用希臘數(shù)據(jù)建立邏輯回歸模型,最終模型變量包括:存貨與銷(xiāo)售比率、資產(chǎn)負(fù)債率、運(yùn)營(yíng)資本和總資產(chǎn)比率、資產(chǎn)凈利率、財(cái)務(wù)壓力(Z值)。其模型預(yù)測(cè)的準(zhǔn)確率超過(guò)84%[11]。Beneish選取1982~1992年間74家因操縱利潤(rùn)而被SEC查處的公司為樣本,利用Probit判別方法構(gòu)建包含應(yīng)收賬款周轉(zhuǎn)指數(shù)、毛利率指數(shù)、資產(chǎn)質(zhì)量指數(shù)、銷(xiāo)售增長(zhǎng)指數(shù)、應(yīng)計(jì)總額占總資產(chǎn)指數(shù)等5個(gè)財(cái)務(wù)指標(biāo)在內(nèi)的財(cái)務(wù)欺詐判別模型,模型預(yù)測(cè)的準(zhǔn)確率達(dá)到75%,并在實(shí)際中得到了一定程度的運(yùn)用[12]。黃學(xué)敏在橫向(與同行業(yè)平均水平比較)和縱向(與企業(yè)上一年度比較)兩個(gè)維度的經(jīng)驗(yàn)分析基礎(chǔ)上得出22個(gè)財(cái)務(wù)指標(biāo),擬尋找能夠顯著預(yù)測(cè)財(cái)務(wù)欺詐的財(cái)務(wù)指標(biāo)。他分別用LPM模型和Logit模型進(jìn)行回歸分析,共發(fā)現(xiàn)6個(gè)財(cái)務(wù)指標(biāo)統(tǒng)計(jì)顯著性較高:期間費(fèi)用-行業(yè)指數(shù)、毛利率指數(shù)、折舊-行業(yè)指數(shù)、非經(jīng)常性損益指數(shù)、經(jīng)常性損益-行業(yè)指數(shù)和應(yīng)收賬款-行業(yè)指數(shù)。就模型的判別效果而言,Logit模型優(yōu)于LPM模型[13]。

Beasley對(duì)財(cái)務(wù)理論和政策制定機(jī)構(gòu)所支持的公司管理標(biāo)準(zhǔn)進(jìn)行創(chuàng)造性測(cè)試,他利用1981~1982年的AAERs和WSJs索引得到75個(gè)舞弊案例,以8個(gè)資產(chǎn)挪用案例以及75個(gè)無(wú)舞弊案例為控制樣本,運(yùn)用Logit回歸方法檢測(cè)公司管理層的特征和舞弊發(fā)生率之間的關(guān)系。研究結(jié)果表明,舞弊公司董事會(huì)成員中外部董事的比例顯著低于未舞弊公司,外部董事的比例與會(huì)計(jì)舞弊的可能性顯著負(fù)相關(guān),但審計(jì)委員會(huì)的存在和組成并不顯著地影響會(huì)計(jì)舞弊的發(fā)生率;董事會(huì)中外部董事的任期增加、持股比例增加以及在其他公司任職的減少使會(huì)計(jì)舞弊發(fā)生的可能性下降;董事會(huì)規(guī)模越小,會(huì)計(jì)舞弊發(fā)生的可能性越低[14]。關(guān)于審計(jì)委員會(huì)的作用,Abbott、Parker、Peters和Beasley等得出了不同結(jié)論。前者在分析發(fā)生財(cái)務(wù)誤報(bào)的公司的審計(jì)委員會(huì)特征后發(fā)現(xiàn),審計(jì)委員會(huì)的獨(dú)立性和每年的開(kāi)會(huì)次數(shù)與財(cái)務(wù)報(bào)告重編顯著負(fù)相關(guān),審計(jì)委員會(huì)中缺少財(cái)務(wù)專家與財(cái)務(wù)報(bào)告重編顯著正相關(guān)[15]。后者分別以舞弊公司和行業(yè)平均值為觀測(cè)樣本和控制樣本,從行業(yè)(高科技、醫(yī)藥和金融)和公司治理機(jī)制的角度出發(fā),通過(guò)對(duì)1987~1997年間近200家財(cái)務(wù)報(bào)告舞弊的公司進(jìn)行研究發(fā)現(xiàn):不同的行業(yè)普遍采用的財(cái)務(wù)報(bào)告舞弊技術(shù)不一樣,舞弊公司審計(jì)委員會(huì)的開(kāi)會(huì)次數(shù)低于非舞弊公司,而且舞弊公司存在內(nèi)部審計(jì)職能的比例低于非舞弊公司[16]。劉立國(guó)、杜瑩的研究表明,法人股比例、執(zhí)行董事比例、內(nèi)部人控制度以及監(jiān)事會(huì)的規(guī)模與財(cái)務(wù)舞弊的可能性正相關(guān),流通股比例則與之負(fù)相關(guān)。此外,如果公司的第一大股東為國(guó)資局,則公司更有可能發(fā)生財(cái)務(wù)舞弊[17]。

Green和Choi檢驗(yàn)了神經(jīng)網(wǎng)絡(luò)作為篩選工具的有效性。他們?cè)谖墨I(xiàn)檢索基礎(chǔ)上采用5個(gè)比率和3個(gè)賬戶變量為輸入變量(壞賬準(zhǔn)備/凈銷(xiāo)售額、壞賬準(zhǔn)備/應(yīng)收賬款、毛利潤(rùn)/凈銷(xiāo)售額、凈銷(xiāo)售額/應(yīng)收賬款、應(yīng)收賬款/總資產(chǎn);凈銷(xiāo)售額、應(yīng)收賬款、壞賬準(zhǔn)備),使用3種不同的期望方法構(gòu)建模型:?jiǎn)我话俜直茸兓窠?jīng)網(wǎng)絡(luò)(SPCNN),普通年數(shù)總和平均權(quán)重神經(jīng)網(wǎng)絡(luò)(PSYDNN)和增量年數(shù)總和平均權(quán)重神經(jīng)網(wǎng)絡(luò)(ISYDNN)。其評(píng)價(jià)依據(jù)是將每個(gè)神經(jīng)網(wǎng)絡(luò)的第一類錯(cuò)誤和第二類錯(cuò)誤與0.5的標(biāo)準(zhǔn)作比較,以及將兩類錯(cuò)誤率合計(jì)與1.0的標(biāo)準(zhǔn)相比較,三個(gè)神經(jīng)網(wǎng)絡(luò)各自的分類能力通過(guò)學(xué)習(xí)、測(cè)試和混合樣本衡量。結(jié)果顯示:比率數(shù)據(jù)的訓(xùn)練效果優(yōu)于賬戶數(shù)據(jù);除了ISYDNN在一項(xiàng)測(cè)試樣本中的錯(cuò)誤率為64.29%之外,其他神經(jīng)網(wǎng)絡(luò)的錯(cuò)誤率都低于0.5;PSYDNN在混合樣本中錯(cuò)誤率最低,三個(gè)評(píng)價(jià)標(biāo)準(zhǔn)的檢驗(yàn)結(jié)果類似,顯示出神經(jīng)網(wǎng)絡(luò)在減少第一類錯(cuò)誤的同時(shí)并沒(méi)有像以前的研究那樣在第二類錯(cuò)誤檢測(cè)中存在弱點(diǎn),以及神經(jīng)網(wǎng)絡(luò)具有比其他檢測(cè)模型更高的分類精度。與更高級(jí)的ISYDNN可能會(huì)比PSYDNN或者SPCNN的效果更好的初始預(yù)期不同,基于增量的預(yù)期方法似乎掩蓋了舞弊和非舞弊財(cái)務(wù)報(bào)表之間的模式差別[18]。Lin、Hwang和Becker根據(jù)收益指標(biāo)和收益趨勢(shì)構(gòu)建了基于模糊神經(jīng)網(wǎng)絡(luò)的會(huì)計(jì)舞弊判定模型,進(jìn)一步證實(shí)集成的模糊神經(jīng)網(wǎng)絡(luò)的效果比先前的人工神經(jīng)網(wǎng)絡(luò)的效果更好。該研究還將集成的模糊神經(jīng)網(wǎng)絡(luò)模型的效用與基線回歸模型(Baseline Logit)做了比較,通過(guò)對(duì)匹配的舞弊和非舞弊公司樣本進(jìn)行測(cè)試,他們發(fā)現(xiàn)這兩個(gè)模型在識(shí)別非舞弊公司時(shí)的準(zhǔn)確性都很高。該研究最終給出的Logit模型在預(yù)測(cè)非舞弊案例時(shí)準(zhǔn)確率為97.5%,較其他模型的準(zhǔn)確率(86.7%)更高[19]。

其他技術(shù)性研究還包括:Hansen等以國(guó)際會(huì)計(jì)師事務(wù)所開(kāi)發(fā)的數(shù)據(jù)為基礎(chǔ),采用Probit和Logit技術(shù)建立管理者舞弊識(shí)別模型[20];Beneish提出概率分析法檢測(cè)舞弊,其研究模型產(chǎn)生的利潤(rùn)操縱指數(shù)由組合后的財(cái)務(wù)變量值得到,進(jìn)而轉(zhuǎn)化為利潤(rùn)操縱可能性[21];Eining等驗(yàn)證了專家系統(tǒng)在增強(qiáng)審計(jì)人員和報(bào)表使用者的識(shí)別能力時(shí)的作用,專家系統(tǒng)對(duì)不同環(huán)境下、不同層次的會(huì)計(jì)舞弊風(fēng)險(xiǎn)有良好的判別力,可使審計(jì)人員通過(guò)恰當(dāng)?shù)膶徲?jì)程序給出更可靠的審計(jì)意見(jiàn)[22]。

我國(guó)及其他一些發(fā)展中國(guó)家關(guān)于會(huì)計(jì)舞弊的檢測(cè)技術(shù)研究起步較晚,但有些學(xué)者傾向于采用綜合數(shù)據(jù)挖掘本國(guó)會(huì)計(jì)舞弊識(shí)別標(biāo)志并嘗試引進(jìn)新的算法。陳國(guó)欣、呂占甲、何峰從滬深兩市上市公司中選取1994~2005年間126家舞弊公司和126家正常公司為樣本,并選取財(cái)務(wù)、股權(quán)結(jié)構(gòu)、內(nèi)部控制以及其他等四類29個(gè)指標(biāo)建立舞弊識(shí)別模型。回歸結(jié)果表明盈利能力弱、管理層持股比例高、獨(dú)立董事人數(shù)少以及沒(méi)有出具標(biāo)準(zhǔn)無(wú)保留意見(jiàn)的上市公司舞弊的可能性更大,通過(guò)Logistic回歸技術(shù)得到的模型總體識(shí)別正確率達(dá)95.1%,預(yù)測(cè)效果良好[23]。任海松以2000~2004年公開(kāi)處罰的35家舞弊公司以及隨機(jī)抽取的500家非舞弊公司為樣本,同時(shí)使用聚類分析和Logistic分析方法,從財(cái)務(wù)指標(biāo)、公司治理、財(cái)務(wù)風(fēng)險(xiǎn)和壓力以及關(guān)聯(lián)交易等四個(gè)方面建立舞弊偵測(cè)模型。經(jīng)聚類分析篩選出的顯著性變量包括:其他收益/利潤(rùn)總額、其他經(jīng)營(yíng)現(xiàn)金/銷(xiāo)售現(xiàn)金、存貨流動(dòng)負(fù)債比率、存貨周轉(zhuǎn)率、各項(xiàng)稅費(fèi)/主營(yíng)業(yè)務(wù)收入凈額、年度、第一大股東持股比例、持有本公司股份的監(jiān)事人數(shù)、審計(jì)意見(jiàn)、市盈率、交易狀態(tài)、關(guān)聯(lián)方所占權(quán)益比例、關(guān)聯(lián)方關(guān)系性質(zhì)、是否占用上市公司資金等。對(duì)各類顯著性變量分別采用Bayes和Logistic方法建立預(yù)測(cè)模型,檢驗(yàn)結(jié)果顯示四類判別結(jié)果基本相近,但識(shí)別率差異較大。Logistic在對(duì)欺詐樣本的判別可靠性方面遠(yuǎn)遠(yuǎn)高于Bayes判別,但Logistic判別對(duì)欺詐的識(shí)別率過(guò)低。對(duì)于非欺詐樣本的判別,Bayes判別的可靠性遠(yuǎn)遠(yuǎn)高于Logistic判別,識(shí)別率也較高(但達(dá)不到Logistic對(duì)于非欺詐的判別)。根據(jù)Bayes判別的結(jié)果,欺詐的識(shí)別率最高的是財(cái)務(wù)風(fēng)險(xiǎn)和壓力,其次是公司治理,最后是財(cái)務(wù)指標(biāo),對(duì)于關(guān)聯(lián)交易的判別效果不理想[24]。Kirkos、Spathis和Manolopoulos以76家希臘舞弊與非舞弊制造業(yè)公司為樣本,以財(cái)務(wù)比率為輸入變量,應(yīng)用人工神經(jīng)網(wǎng)絡(luò)、決策樹(shù)和貝葉斯網(wǎng)絡(luò)三種算法建立會(huì)計(jì)舞弊檢測(cè)模型,并對(duì)三者的判別能力進(jìn)行比較。檢測(cè)結(jié)果顯示:貝葉斯網(wǎng)絡(luò)模型的效果最好,對(duì)10層交叉驗(yàn)證的樣本的正確分類率為90.3%;神經(jīng)網(wǎng)絡(luò)和決策樹(shù)模型的準(zhǔn)確率分別是80%和73.6%。三個(gè)模型的第一類錯(cuò)誤率都很低。貝葉斯信任網(wǎng)絡(luò)模型揭示出債務(wù)轉(zhuǎn)換率、資產(chǎn)利潤(rùn)率、銷(xiāo)售收入與總資產(chǎn)的比率、運(yùn)營(yíng)資金與總資產(chǎn)的比率及Z值與舞弊之間存在依賴關(guān)系。這些財(cái)務(wù)比率關(guān)系到公司財(cái)務(wù)狀況的不同方面,如杠桿作用、收益率、銷(xiāo)售績(jī)效、償還能力和財(cái)務(wù)危機(jī)等方面。由于決策樹(shù)模型在第一層劃分是運(yùn)用Z值,所以它與因財(cái)務(wù)危機(jī)而導(dǎo)致的欺詐相關(guān)[25]。

三、簡(jiǎn)單總結(jié)和評(píng)述

(一)關(guān)于挖掘數(shù)據(jù)集和會(huì)計(jì)舞弊紅旗標(biāo)志

數(shù)據(jù)集可視為“數(shù)據(jù)對(duì)象×特征值”的數(shù)據(jù)矩陣,數(shù)據(jù)質(zhì)量是有效挖掘的基礎(chǔ)?,F(xiàn)有絕大多數(shù)研究以證券監(jiān)管部門(mén)公開(kāi)處罰的舞弊企業(yè)和控制行業(yè)、規(guī)模、時(shí)間后的非舞弊企業(yè)為研究對(duì)象,特征值基本涵蓋審計(jì)師數(shù)據(jù)、公司治理數(shù)據(jù)、財(cái)務(wù)報(bào)表數(shù)據(jù)、行業(yè)和交易數(shù)據(jù)多個(gè)類別。這些特征變量一般是在規(guī)范分析、案例分析、經(jīng)驗(yàn)文獻(xiàn)檢索的基礎(chǔ)上得出的,反映舞弊“三角”的基本特征,具有較強(qiáng)的會(huì)計(jì)舞弊相關(guān)性和理論依據(jù)。早期的研究以輔助審計(jì)師決策為出發(fā)點(diǎn),多為審計(jì)師數(shù)據(jù),將這類數(shù)據(jù)應(yīng)用于會(huì)計(jì)舞弊檢測(cè)有以下難點(diǎn):第一,審計(jì)人員一般不愿將其私下關(guān)注的數(shù)據(jù)公之于眾;第二,即使他們?cè)敢鉃閿?shù)據(jù)挖掘提供這些數(shù)據(jù),但該類數(shù)據(jù)一般不易搜集;第三,數(shù)據(jù)主觀性強(qiáng)。后期的研究嘗試采用共享數(shù)據(jù)建立模型,公開(kāi)報(bào)表數(shù)據(jù)、公司治理數(shù)據(jù)等可能得到廣泛應(yīng)用。研究目標(biāo)擴(kuò)展為不但輔助審計(jì)師決策,而且適用于監(jiān)管部門(mén)和廣大投資者。當(dāng)前的研究以反映舞弊三角的綜合數(shù)據(jù)為主,以應(yīng)對(duì)越來(lái)越復(fù)雜的舞弊技術(shù)。

現(xiàn)有文獻(xiàn)的數(shù)據(jù)挖掘結(jié)果為準(zhǔn)則及其他理論研究得出的“紅旗”判別力提供了經(jīng)驗(yàn)證據(jù),并且有些研究對(duì)舞弊標(biāo)志根據(jù)判別力進(jìn)行了排序,這無(wú)疑為在舞弊識(shí)別過(guò)程中區(qū)別眾多紅旗標(biāo)志,并形成最終決策結(jié)論有積極意義。一般研究認(rèn)為,比率數(shù)據(jù)比賬戶數(shù)據(jù)更有效;也有多項(xiàng)研究表明審計(jì)委員會(huì)指標(biāo)的判別力檢驗(yàn)存在不一致,有研究解釋為這是因?yàn)樵缙趯徲?jì)委員會(huì)沒(méi)有發(fā)揮作用;同時(shí)關(guān)聯(lián)交易也存在和感覺(jué)不一致的結(jié)論,有研究認(rèn)為這是因?yàn)槲璞灼髽I(yè)和非舞弊企業(yè)均存在大量關(guān)聯(lián)交易,從而掩蓋了二者的區(qū)別。

關(guān)于數(shù)據(jù)的一個(gè)挑戰(zhàn)性問(wèn)題是:基于我國(guó)會(huì)計(jì)舞弊的普遍存在和舞弊的低發(fā)現(xiàn)率,當(dāng)前研究以目前沒(méi)有受到處罰的公司作為正常公司,與已知的舞弊公司進(jìn)行配對(duì),而目前沒(méi)有受到處罰的公司并不意味著就沒(méi)有舞弊。如果存在尚未暴露的舞弊公司作為舞弊公司的配對(duì)公司,則數(shù)據(jù)可靠性進(jìn)而數(shù)據(jù)挖掘結(jié)論就要受到質(zhì)疑[26]。此外,配對(duì)公司的選擇一般僅控制行業(yè)和規(guī)模變量,而一般認(rèn)為即使采用了配對(duì)比較檢驗(yàn),仍然不能消除公司之間的差別影響。相對(duì)來(lái)說(shuō),采用同一公司前后各期的縱向比較就可以考慮更多的公司自身的影響因素,可能預(yù)測(cè)效果會(huì)更好,但目前鮮有研究進(jìn)行時(shí)序數(shù)據(jù)挖掘。

(二)關(guān)于算法

現(xiàn)有文獻(xiàn)使用的挖掘算法包括統(tǒng)計(jì)檢驗(yàn)、回歸分析、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、貝葉斯網(wǎng)絡(luò)、堆棧變量法等?;貧w分析在隱藏?cái)?shù)據(jù)方面應(yīng)用得最為普遍,舞弊識(shí)別的回歸模型一般具有很好的解釋力,文獻(xiàn)用到的回歸分析模型有Logit模型、Step-wise Logistic模型、UTADIS多元決策輔助方法和EGB2等模型;其次就是人工神經(jīng)網(wǎng)絡(luò)。雖然不能進(jìn)行簡(jiǎn)單比較,但總體上神經(jīng)網(wǎng)絡(luò)的識(shí)別效果和準(zhǔn)確性似乎都優(yōu)于回歸模型。神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)在于對(duì)數(shù)據(jù)沒(méi)有嚴(yán)格的假定,具有較強(qiáng)的概括性和適應(yīng)性。雖然經(jīng)過(guò)正確配置和訓(xùn)練的神經(jīng)網(wǎng)絡(luò)似乎能夠做出持續(xù)良好的分類和總結(jié),但與回歸模型相比,由于其獨(dú)特的內(nèi)部結(jié)構(gòu),研究者無(wú)法追蹤其輸出結(jié)論的形成過(guò)程,對(duì)連接權(quán)重沒(méi)有明顯的解釋,不能確定它的精度和統(tǒng)計(jì)可靠性,因而缺乏解釋力?,F(xiàn)有算法多適用于有標(biāo)簽的學(xué)習(xí)類型,若進(jìn)行無(wú)標(biāo)簽數(shù)據(jù)挖掘,則需引入聚類分析等其他算法。

(三)關(guān)于分類器評(píng)估

評(píng)估工具的有效性可以基于它提供給注冊(cè)會(huì)計(jì)師注意有限資源的正確信號(hào)比例來(lái)評(píng)價(jià):第一類錯(cuò)誤率意味著注冊(cè)會(huì)計(jì)師將額外的資源用于一個(gè)不存在舞弊問(wèn)題領(lǐng)域的識(shí)別效力問(wèn)題,第二類錯(cuò)誤則導(dǎo)致注冊(cè)會(huì)計(jì)師沒(méi)有將額外的資源用于存在舞弊問(wèn)題領(lǐng)域的識(shí)別效力問(wèn)題。因此,絕大多數(shù)文獻(xiàn)采用誤分類率標(biāo)準(zhǔn)來(lái)評(píng)估分類器效果。后期大部分文獻(xiàn)模型的舞弊識(shí)別總體錯(cuò)誤率不超過(guò)30%,達(dá)到了比較滿意的分類精度。有關(guān)文獻(xiàn)還比較了模型識(shí)別率和審計(jì)師無(wú)輔助識(shí)別率的差異,一般認(rèn)為模型識(shí)別優(yōu)于審計(jì)師無(wú)輔助識(shí)別。Bell和Carcello還特地驗(yàn)證了模型在任意風(fēng)險(xiǎn)水平下對(duì)舞弊存在的識(shí)別率高于審計(jì)師無(wú)輔助識(shí)別,對(duì)模型利于提高審計(jì)師對(duì)舞弊先驗(yàn)概率的估計(jì)提供了經(jīng)驗(yàn)證據(jù)。Persons通過(guò)在任意第一、第二類錯(cuò)誤成本水平假設(shè)前提下,計(jì)算誤分類成本孰高孰低以評(píng)判模型效果,是較為獨(dú)特的一種模型評(píng)估標(biāo)準(zhǔn)。

現(xiàn)有文獻(xiàn)對(duì)誤分類率的估計(jì)方法存在差異:部分文獻(xiàn)區(qū)分訓(xùn)練樣本和檢驗(yàn)樣本,但舞弊樣本一般較少;也有部分文獻(xiàn)直接根據(jù)訓(xùn)練樣本得出結(jié)論,這很可能高估了模型效果。小樣本情況下,Persons采用的近似于自展方法的“jackknife”方法仍不失為既不損失訓(xùn)練樣本又能提高檢驗(yàn)可信度的一種值得借鑒的方法。

[1]瑞扎伊.財(cái)務(wù)報(bào)表舞弊:預(yù)防與發(fā)現(xiàn)[M].北京:中國(guó)人民大學(xué)出版社,2005.

[2]Elkan,C.Magical Thinking in Data Mining:Lessons from COIL Challenge 2000[EB/OL].(2001-03-28)[2010-06-17]http://reference.kfupm.edu.sa/content/m/a/magical_thinking_in_data_mining__lessons_117416.pdf.

[3]Calderon,T.G.,B.P.Green.Analysts'Forecast as an Exogenous Risk Indicator in Analytical Auditing[J].Advances in Accounting,1994,(12):281-300.

[4]Clifton Phua,Vincent Lee,Kate Smith,Ross Gayler.A Comprehensive Survey of Data Mining-based Fraud Detection Research[EB/OL].(2005-07-18)[2010-06-17]http://arxiv.org/pdf/1009.6119.

[5]Loebbecke,J.K.,J.J.Willingham.Review of SEC Accounting and Auditing Enforcement Releases[Z].University of Utah Working Paper,1988.

[6]Loebbecke,J.K.,Eining,M.M.,Willingham,J.J.Auditors'Experience with Material Irregularities:Frequency,Nature and Detectability[J].Auditing:A Journal of Practice & Theory,1989,(Fall):1-28.

[7]Bell,T.B.,S.Szykowny,J.J.Willingham.Assessing the Likelihood of Fraudulent Financial Reporting:A Cascaded Logit Approach[Z].KPMG LLP Working Paper,1991.

[8]Bell,T.B.,Carcello,J.V.A Decision Aid for Assessing the Likelihood of Fraudulent Financial Reporting[J].Auditing:A Journal of Practice &Theory,2000,19(1):169-184.

[9]Summers,S.L.,Sweeney,J.T.Fraudulently Misstated Financial Statements and Insider Trading:An Empirical Analysis[J].The Accounting Review,1998,73(1):131-146.

[10]Persons,O.S.Using Financial Statement Data to Identify Factors Associated with Fraudulent Financial Reporting[J].Journal of Applied Business Research,1995,11(3):38-46.

[11]Charalambos T.Spathis.Detecting False Financial Statements Using Published Data:Some Evidence from Greece[J].Managerial Auditing Journal,2002,17(4):179-191.

[12]Beneish,M.D.Incentives and Penalties Related to Earnings Overstatements that Violate GAAP[J].The Accounting Review,1999,74(4):425-457.

[13]黃學(xué)敏.上市公司財(cái)務(wù)欺詐及其監(jiān)管研究——基于投資者保護(hù)的視角[D].廈門(mén):廈門(mén)大學(xué),2006.

[14]Beasley,M.S.An Empirical Analysis of the Relation between the Board of Director Composition and Financial Statement Fraud[J].The Accounting Review,1996,71(4):443-465.

[15]Abbott,L.J.,Parker,S.,Peters,G.F.Audit Committee Characteristics and Financial Misstatement[J].Auditing:A Journal of Practice&Theory,2002,23(1):69-87.

[16]Beasley,M.S.,Carcello,J.V.,Hermanson,D.R.Fraudulent Financial Reporting:Consideration of Industry Traits and Corporate Governance Mechanisms[J].Accounting Horizons,2000,14(4):441-454.

[17]劉立國(guó),杜瑩.公司治理與會(huì)計(jì)信息質(zhì)量關(guān)系的實(shí)證研究[J].會(huì)計(jì)研究,2003,(2):28-36.

[18]Brian Patrick Green,Jae Hwa Choi.Assessing the Risk of Management Fraud through Neural Network Technology[J].Auditing:A Jounrnal of Practice&Theory,1997,16(l):14-28.

[19]Lin,J.W.,Hwang,M.I.,Becker,J.D.A Fuzzy Neural Networks for Assessing the Risk of Fraudulent Financial Reporting[J].Managerial Auditing Journal,2003,18(8):657-665.

[20]Hansen,J.V.,McDonald,J.B.,Messier,W.F.,Bell,T.B.A Generalized Qualitative-response Model and the Analysis of Management Fraud[J].Management Science,1996,42(7):1022-1032.

[21]Beneish,M.D.Detecting GAAP Violation:Implications for Assessing Earnings Management among Firms with Extreme Financial Performance[J].Journal of Accounting and Public Policy,1997,16(3):271-309.

[22]Eining,M.M.,Jones,D.R.,Loebbecke,J.K.Reliance on Decision Aids:An Examination of Auditors’Assemment of Management Fraud[J].Auditing:A Journal of Practice and Theory,1997,16(1):1-19.

[23]陳國(guó)欣,呂占甲,何峰.財(cái)務(wù)報(bào)告舞弊識(shí)別的實(shí)證研究——基于中國(guó)上市公司經(jīng)驗(yàn)數(shù)據(jù)[J].審計(jì)研究,2007,(3):88-93.

[24]任海松.上市公司財(cái)務(wù)報(bào)告欺詐及其偵測(cè)研究[D].大連:東北財(cái)經(jīng)大學(xué),2006.

[25]Kirkos,E.,Spathis,C.,Manolopoulos,Y.Data Mining Techniques for the Detection of Fraudulent Financial Statements[J].Expert Systems with Applications,2007,32(3):995-1003.

[26]岳殿民.中國(guó)上市公司會(huì)計(jì)舞弊模式特征及識(shí)別研究[D].天津:天津財(cái)經(jīng)大學(xué),2008.

(責(zé)任編輯:胡浩志)

F239

A

1003-5230(2011)01-0079-06

2010-08-23

國(guó)家自然科學(xué)基金資助項(xiàng)目“基于數(shù)據(jù)挖掘的會(huì)計(jì)舞弊識(shí)別問(wèn)題研究”(70872082);教育部人文社會(huì)科學(xué)研究青年項(xiàng)目“中國(guó)轉(zhuǎn)型經(jīng)濟(jì)下民營(yíng)企業(yè)連鎖董事關(guān)系網(wǎng)絡(luò)的演變特征及其功能定位”(09YJC630057);2010年度河南省政府決策研究招標(biāo)課題“基于ERMIF的河南省國(guó)有企業(yè)內(nèi)部控制與風(fēng)險(xiǎn)測(cè)度工具研究”

汪士果(1972— ),女,河南確山人,天津財(cái)經(jīng)大學(xué)商學(xué)院博士生;

張俊民(1960— ),男,山東魚(yú)臺(tái)人,天津財(cái)經(jīng)大學(xué)商學(xué)院教授,博士生導(dǎo)師。

猜你喜歡
舞弊數(shù)據(jù)挖掘神經(jīng)網(wǎng)絡(luò)
淺談財(cái)務(wù)舞弊與防范
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
舞弊行為人特征分析
數(shù)據(jù)挖掘技術(shù)在打擊倒賣(mài)OBU逃費(fèi)中的應(yīng)用淺析
神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
基于神經(jīng)網(wǎng)絡(luò)的中小學(xué)生情感分析
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
我國(guó)上市公司財(cái)務(wù)舞弊識(shí)別模型初探
基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
在美上市公司會(huì)計(jì)信息舞弊的原因及治理