劉佳進(jìn)(博士)
(福州大學(xué)計(jì)劃財(cái)務(wù)處 福建福州 350116)
上市公司信息披露準(zhǔn)確與否將對(duì)財(cái)報(bào)使用者的決策產(chǎn)生較大的影響。近年來(lái),上市公司的舞弊手段越發(fā)多樣化和隱蔽化,且更加具有針對(duì)性,僅依靠傳統(tǒng)分析手段較難發(fā)現(xiàn)舞弊行為。機(jī)器學(xué)習(xí)模型不同于傳統(tǒng)分析手段,其通過(guò)輸入特定的樣本數(shù)據(jù)進(jìn)行訓(xùn)練和擬合并進(jìn)行預(yù)測(cè)分析的方法,能發(fā)現(xiàn)傳統(tǒng)分析手段難以識(shí)別出的問(wèn)題,目前已經(jīng)有越來(lái)越多的研究開(kāi)始關(guān)注這一領(lǐng)域。機(jī)器學(xué)習(xí)模型的應(yīng)用較為簡(jiǎn)單,只需輸入特定的財(cái)務(wù)報(bào)告指標(biāo),根據(jù)模型輸出結(jié)果即可快速判別上市公司是否存在財(cái)務(wù)舞弊,其財(cái)務(wù)報(bào)告數(shù)據(jù)是否可以信賴,這對(duì)于財(cái)務(wù)報(bào)告使用者決策將大有助益。
機(jī)器學(xué)習(xí)模型本身不依賴數(shù)據(jù)背景,僅僅是通過(guò)分析數(shù)據(jù)之間的內(nèi)在邏輯進(jìn)行訓(xùn)練和擬合,因此,要想提升判別的效果,一是訓(xùn)練集樣本的分類(lèi)需要足夠準(zhǔn)確,二是輸入指標(biāo)反映的信息要盡可能全面,信息缺失將影響機(jī)器學(xué)習(xí)模型的訓(xùn)練效果。
現(xiàn)有相關(guān)研究聚焦于機(jī)器學(xué)習(xí)模型的應(yīng)用,嘗試?yán)貌煌臋C(jī)器學(xué)習(xí)模型判別上市公司是否存在舞弊行為,并利用測(cè)試集驗(yàn)證判別的效果。在模型選擇方面,相關(guān)研究主要選取支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林模型等作為判別模型,在輸入指標(biāo)的選取方面,不同研究之間差異較大,具體有如下特點(diǎn):
部分研究在選擇輸入指標(biāo)時(shí),會(huì)參考經(jīng)典的舞弊模型,如冰山理論、舞弊三角論、GONE 理論等,根據(jù)舞弊產(chǎn)生的動(dòng)因?qū)?yīng)的指標(biāo)作為輸入指標(biāo)進(jìn)行機(jī)器學(xué)習(xí)模型的訓(xùn)練和分析。根據(jù)現(xiàn)有研究結(jié)論,這種輸入指標(biāo)的選取方法確實(shí)可以取得較為滿意的實(shí)證結(jié)果,但帶有主觀的色彩,同時(shí),這種研究方法更傾向于驗(yàn)證現(xiàn)有的舞弊而非發(fā)現(xiàn)潛在的舞弊,實(shí)際上是利用現(xiàn)代的方法驗(yàn)證傳統(tǒng)的理論。若有舞弊行為的上市公司意識(shí)到經(jīng)典舞弊模型的相關(guān)指標(biāo)可能會(huì)被重點(diǎn)關(guān)注,就會(huì)通過(guò)技術(shù)手段粉飾這些關(guān)鍵指標(biāo),如果仍依據(jù)經(jīng)典舞弊模型選取指標(biāo),則訓(xùn)練形成的模型就可能會(huì)在識(shí)別舞弊上誤判。
除了上述依據(jù)經(jīng)典舞弊模型選擇指標(biāo)的方式外,也有一部分研究在選擇輸入指標(biāo)時(shí)并沒(méi)有明顯的模型依據(jù),僅根據(jù)研究者個(gè)人的判斷選取輸入指標(biāo),這將導(dǎo)致此類(lèi)研究選擇輸入指標(biāo)缺乏統(tǒng)一的標(biāo)準(zhǔn),使得不同研究之間選擇的指標(biāo)差異較大,甚至存在不同研究采用完全不同的兩套輸入指標(biāo)體系的情況。此類(lèi)研究之間唯一可以比較的結(jié)果就是判別準(zhǔn)確率,但該準(zhǔn)確率受到模型參數(shù)、輸入指標(biāo)和輸入樣本等各方面的影響,很難比較不同的輸入指標(biāo)對(duì)舞弊判別結(jié)果的影響程度。
現(xiàn)有的研究選取指標(biāo)會(huì)傾向于選擇靜態(tài)的指標(biāo),對(duì)于不同年度之間變動(dòng)率的指標(biāo)選擇較少。上市公司的舞弊行為,一般會(huì)影響超過(guò)一年的財(cái)務(wù)數(shù)據(jù),反映到財(cái)務(wù)報(bào)告數(shù)據(jù)中,就是進(jìn)行財(cái)務(wù)舞弊前以及舞弊后的年份,上市公司特定的指標(biāo)值會(huì)出現(xiàn)異常的反彈,因此,變動(dòng)率的指標(biāo)就顯得尤為重要,也應(yīng)當(dāng)加入輸入指標(biāo)體系的構(gòu)建中。
綜上所述,現(xiàn)有的研究在選擇輸入指標(biāo)方面缺乏統(tǒng)一的標(biāo)準(zhǔn),選擇方式也較為主觀,使得不同研究之間輸入指標(biāo)差異較大,導(dǎo)致許多財(cái)務(wù)信息并未進(jìn)入到機(jī)器學(xué)習(xí)模型中進(jìn)行訓(xùn)練,輸入信息的缺失可能會(huì)影響機(jī)器學(xué)習(xí)模型判別的效果。
根據(jù)現(xiàn)有研究選取輸入指標(biāo)存在的問(wèn)題,結(jié)合機(jī)器學(xué)習(xí)模型有別于傳統(tǒng)的財(cái)務(wù)分析模型,本文改進(jìn)了輸入指標(biāo)的選擇方法。
為確保能夠充分利用現(xiàn)有的各類(lèi)財(cái)務(wù)信息,機(jī)器學(xué)習(xí)模型需要大量的輸入指標(biāo),在選取的過(guò)程中,應(yīng)當(dāng)避免人為因素干擾導(dǎo)致財(cái)務(wù)信息的缺失。因此,初始的輸入指標(biāo)體系應(yīng)該盡可能涵蓋所有可獲取的有用的信息。
上市公司財(cái)務(wù)舞弊判別的本質(zhì)就是一個(gè)“是否”“有無(wú)”二分類(lèi)的問(wèn)題。因此,在機(jī)器學(xué)習(xí)模型的訓(xùn)練過(guò)程中,如能將正負(fù)樣本的特征差異最大的幾個(gè)指標(biāo)篩選出來(lái),則能有效提升判別的效率。因此在選擇輸入指標(biāo)的過(guò)程中,要盡可能選取正負(fù)樣本差異較大的指標(biāo),以提升舞弊判別的效率。
在選擇上述正負(fù)樣本差異較大的指標(biāo)時(shí),應(yīng)當(dāng)采用經(jīng)典舞弊模型的因子、因素進(jìn)行篩選,而非主觀判斷選擇,這樣能夠避免人為干預(yù)造成的信息遺漏。另外,還應(yīng)當(dāng)比較初始輸入指標(biāo)和篩選后的輸入指標(biāo)在構(gòu)建機(jī)器學(xué)習(xí)模型中的判別效果,以確認(rèn)篩選指標(biāo)的有效性。
綜上所述,要想提升機(jī)器學(xué)習(xí)模型舞弊判別的效果,需要盡可能多的指標(biāo)組成初始指標(biāo)集,并篩選出正負(fù)樣本差異較大的指標(biāo)輸入并進(jìn)行訓(xùn)練,比較初始輸入指標(biāo)和篩選后的指標(biāo)訓(xùn)練的模型在測(cè)試集中的判別效果。而利用Logistics 回歸分析模型,可以從大量的指標(biāo)中篩選出較為顯著的指標(biāo),因此,本文將使用初始輸入指標(biāo)體系和利用Logistics 回歸分析模型篩選后的敏感指標(biāo)體系,分別使用機(jī)器學(xué)習(xí)模型訓(xùn)練和驗(yàn)證判別效果。
確定上市公司財(cái)務(wù)報(bào)表是否存在虛假披露行為,可以依賴的判斷標(biāo)準(zhǔn)有兩個(gè),一是年度報(bào)告的審計(jì)意見(jiàn),二是監(jiān)管機(jī)構(gòu)的處罰記錄。若上市公司財(cái)務(wù)報(bào)告被會(huì)計(jì)師事務(wù)所出具了非標(biāo)準(zhǔn)審計(jì)意見(jiàn),且該審計(jì)意見(jiàn)的內(nèi)容和公司當(dāng)年披露盈利相關(guān),則可以認(rèn)為上市公司發(fā)生了財(cái)務(wù)舞弊行為;若監(jiān)管機(jī)構(gòu)對(duì)上市公司某一年的財(cái)報(bào)定性為虛假披露,那么即使當(dāng)年該上市公司的財(cái)務(wù)報(bào)告審計(jì)意見(jiàn)為無(wú)保留意見(jiàn),同樣可以認(rèn)為該上市公司在當(dāng)年發(fā)生了舞弊行為。
根據(jù)上述思路,本文按照如下方法選擇舞弊樣本:選擇2008—2021年度會(huì)計(jì)師事務(wù)所出具非標(biāo)準(zhǔn)審計(jì)意見(jiàn),該審計(jì)意見(jiàn)的內(nèi)容和公司當(dāng)年披露盈利相關(guān)的滬深A(yù)股上市公司,以及2008—2021 年度會(huì)計(jì)師事務(wù)所出具無(wú)保留意見(jiàn),后續(xù)監(jiān)管機(jī)構(gòu)對(duì)該公司的違規(guī)行為提出處罰,處罰的違規(guī)期間屬于2008—2021年,且該違規(guī)行為涉及當(dāng)年披露盈利的滬深A(yù)股上市公司作為“舞弊組”,取得處罰記錄的截止日期為2022年10月31日。
在選取舞弊公司樣本時(shí),同時(shí)選取與舞弊公司同行業(yè)①行業(yè)分類(lèi)依據(jù)IFind同花順行業(yè)分類(lèi),取最明細(xì)類(lèi)、資產(chǎn)規(guī)模相近、年度報(bào)表審計(jì)意見(jiàn)為無(wú)保留意見(jiàn)且后續(xù)年度未被監(jiān)管機(jī)構(gòu)處罰的滬深A(yù) 股企業(yè)作為正常公司,通過(guò)舞弊公司與正常公司1∶1 進(jìn)行配對(duì),以減少行業(yè)及規(guī)模因素造成的數(shù)據(jù)特征差異。
若舞弊樣本在不同年份連續(xù)發(fā)生同類(lèi)型的舞弊行為,只取發(fā)生舞弊行為的首年作為研究樣本,以消除重復(fù)舞弊造成的研究差異;如在同年或者不同年份發(fā)生了超過(guò)一類(lèi)的舞弊行為,則視同為不同的舞弊樣本。由于金融類(lèi)公司財(cái)務(wù)報(bào)告格式與其他類(lèi)公司不同,本文剔除所有的金融類(lèi)上市公司,因同一家公司在同年度發(fā)生不止一種舞弊行為視同為不同的樣本,本文選取了461家舞弊公司,共531個(gè)舞弊樣本。舞弊樣本所屬行業(yè)分布如表1所示。
表1 舞弊公司樣本行業(yè)分類(lèi)
由此可見(jiàn),舞弊公司樣本分布是以制造業(yè)為主的各類(lèi)行業(yè)。將各個(gè)樣本根據(jù)舞弊手段及發(fā)生舞弊的年份分類(lèi)如表2所示。
表2 樣本舞弊手段匯總
以上為樣本舞弊公司的數(shù)量,研究過(guò)程中依據(jù)上述要求共選取了531 個(gè)樣本,其中舞弊類(lèi)型為關(guān)聯(lián)方交易的樣本130 個(gè)、隱瞞大額事項(xiàng)的樣本76 個(gè)、虛構(gòu)交易的樣本172 個(gè)、準(zhǔn)備計(jì)提的樣本153 個(gè)。對(duì)照公司的樣本數(shù)量與舞弊公司1∶1配對(duì),數(shù)量相同。
輸入指標(biāo)很大程度決定了所提取的數(shù)據(jù)走向,如前述分析,若輸入指標(biāo)不足,一些特征信息被遺漏,可能對(duì)研究結(jié)果造成較大的影響。本文結(jié)合現(xiàn)有文獻(xiàn)常用的分析指標(biāo),結(jié)合同花順數(shù)據(jù)庫(kù)中評(píng)價(jià)上市公司償債能力、營(yíng)運(yùn)能力、盈利能力、成長(zhǎng)能力以及財(cái)務(wù)報(bào)告常見(jiàn)的各類(lèi)財(cái)務(wù)指標(biāo),剔除重復(fù)的、不易獲得的指標(biāo),最終確定了91 個(gè)指標(biāo)作為初始輸入指標(biāo)(見(jiàn)表3),以減少人為選擇因素造成的指標(biāo)缺失,影響模型的初始輸入指標(biāo)分布于各類(lèi)財(cái)務(wù)報(bào)表,并涵蓋了各類(lèi)的財(cái)務(wù)信息。
其中“是否法人股東”和“是否變更事務(wù)所”這兩個(gè)指標(biāo)為啞變量(虛擬變量),公司第一大股東為法人的取1,公司股東為自然人的取0,在舞弊公司發(fā)生舞弊行為的當(dāng)年,變更過(guò)會(huì)計(jì)師事務(wù)所的取1,否則取0,正常公司是否變更事務(wù)所的年度取與其配對(duì)的舞弊公司的舞弊年度,首次上市視同為不變更,因會(huì)計(jì)師事務(wù)所合并等客觀原因造成的事務(wù)所變更也視同為不變更。含有Δ 標(biāo)記的指標(biāo)為舞弊當(dāng)年對(duì)上一年的指標(biāo)變動(dòng)率。
根據(jù)舞弊種類(lèi)的不同,將數(shù)據(jù)分四類(lèi)輸入Logistic 回歸分析模型,在因變量的選取中,舞弊公司結(jié)果選擇1,正常公司結(jié)果選擇0,選擇前向步進(jìn)方法,篩選出如下指標(biāo):
1.關(guān)聯(lián)方交易舞弊敏感指標(biāo)。從下頁(yè)表4 可以看出,經(jīng)過(guò)篩選,對(duì)于關(guān)聯(lián)方交易舞弊公司,其與正常公司的敏感指標(biāo)集為S1,有息稅折舊攤銷(xiāo)前利潤(rùn)/負(fù)債合計(jì)、已獲利息倍數(shù)、凈資產(chǎn)收益率ROE(扣除/加權(quán))、應(yīng)收賬款周轉(zhuǎn)天數(shù)、經(jīng)營(yíng)活動(dòng)產(chǎn)生的現(xiàn)金流量(億元)等5 個(gè)指標(biāo)。可以看出,關(guān)聯(lián)方交易會(huì)引起應(yīng)收賬款數(shù)量的變動(dòng),因此應(yīng)收賬款的相應(yīng)指標(biāo)也可能指向關(guān)聯(lián)方交易舞弊。
2.隱瞞大額事項(xiàng)舞弊敏感指標(biāo)。從表5 可以看出,對(duì)于隱瞞大額事項(xiàng)舞弊公司,其與正常公司的敏感指標(biāo)集合為S2,有Δ速動(dòng)比率、每股留存收益、Δ營(yíng)業(yè)總收入、Δ基本每股收益、現(xiàn)金流量比率、Δ 現(xiàn)金凈流量、凈資產(chǎn)收益率ROE(加權(quán),公布值)等7個(gè)指標(biāo)??梢钥闯觯绻髽I(yè)隱瞞大額的事項(xiàng),其在一些指標(biāo)的前后年度變動(dòng)率上的變化將較為明顯。
表5 隱瞞大額事項(xiàng)敏感指標(biāo)
3.虛構(gòu)交易舞弊敏感指標(biāo)。對(duì)于虛構(gòu)交易舞弊公司,其與正常公司的敏感指標(biāo)集合為S3,有每股留存收益、Δ毛利、Δ營(yíng)業(yè)總收入、投入資本回報(bào)率ROIC、流動(dòng)資產(chǎn)周轉(zhuǎn)率5個(gè)指標(biāo)。這些指標(biāo)說(shuō)明如果上市公司發(fā)生了虛構(gòu)交易舞弊行為,主要通過(guò)盈利能力和成長(zhǎng)能力指標(biāo)表現(xiàn)出來(lái)。其中“Δ 毛利”的“B”值(回歸系數(shù))為-0.00031,“S.E,”值(標(biāo)準(zhǔn)誤差)為0.00016,限于篇幅,表格中保留三位小數(shù),故僅顯示為-0.000和0.000。見(jiàn)表6。
表6 虛構(gòu)交易舞弊敏感指標(biāo)
4.準(zhǔn)備計(jì)提舞弊敏感指標(biāo)。對(duì)于采用準(zhǔn)備計(jì)提手段進(jìn)行舞弊的公司,其與正常公司的敏感指標(biāo)集合為S4,有Δ 應(yīng)收賬款周轉(zhuǎn)率、Δ 固定資產(chǎn)營(yíng)業(yè)收入比、存貨周轉(zhuǎn)率、Δ利潤(rùn)總額、投入資本回報(bào)率ROIC、應(yīng)收賬款周轉(zhuǎn)率6個(gè)指標(biāo)。這說(shuō)明,準(zhǔn)備計(jì)提舞弊公司和正常公司在營(yíng)運(yùn)能力指標(biāo)上存在較大的差異。表7中“Δ利潤(rùn)總額”的“B”值(回歸系數(shù))為0.00023,“S.E,”值(標(biāo)準(zhǔn)誤差)為0.00011,限于篇幅,表格中保留三位小數(shù),顯示為0.000。
表7 準(zhǔn)備計(jì)提舞弊敏感指標(biāo)
5.總體敏感指標(biāo)。我們發(fā)現(xiàn),“Δ 應(yīng)收賬款周轉(zhuǎn)率”這一指標(biāo)在模型中并未在10%的顯著性水平上統(tǒng)計(jì)顯著。考慮到本文采用的是Logistic逐步回歸的方式,盡管在準(zhǔn)備計(jì)提舞弊敏感指標(biāo)中,“Δ 應(yīng)收賬款周轉(zhuǎn)率”這一指標(biāo)的顯著性不佳,但通過(guò)加入該指標(biāo)能夠?qū)ogistic回歸分析模型整體的顯著性有貢獻(xiàn),因此本文采用了該指標(biāo)作為準(zhǔn)備計(jì)提舞弊敏感指標(biāo)之一。
通過(guò)上述實(shí)證分析可以發(fā)現(xiàn),四類(lèi)舞弊的敏感指標(biāo)不完全相同,但是部分指標(biāo)存在重合,說(shuō)明不同的舞弊手段可能造成同樣的指標(biāo)敏感,取S1—S4指標(biāo)集的并集形成總體敏感指標(biāo)集合S 進(jìn)行機(jī)器學(xué)習(xí)模型訓(xùn)練和測(cè)試,總體敏感指標(biāo)集合S共計(jì)20個(gè)指標(biāo),具體包括:息稅折舊攤銷(xiāo)前利潤(rùn)/負(fù)債合計(jì)、已獲利息倍數(shù)、凈資產(chǎn)收益率ROE(扣除/加權(quán))、應(yīng)收賬款周轉(zhuǎn)天數(shù)、經(jīng)營(yíng)活動(dòng)現(xiàn)金流量(億元)、Δ速動(dòng)比率、每股留存收益、Δ營(yíng)業(yè)總收入、Δ基本每股收益、現(xiàn)金流量比率、Δ 現(xiàn)金凈流量、凈資產(chǎn)收益率ROE(加權(quán),公布值)、Δ毛利、流動(dòng)資產(chǎn)周轉(zhuǎn)率、Δ應(yīng)收賬款周轉(zhuǎn)率、Δ固定資產(chǎn)周轉(zhuǎn)率、存貨周轉(zhuǎn)率、應(yīng)收賬款周轉(zhuǎn)率、投入資本回報(bào)率ROIC、Δ利潤(rùn)總額等。
依次選取現(xiàn)有研究常用的機(jī)器學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隨機(jī)森林模型,利用2008—2020年A股上市公司選取的926個(gè)樣本作為訓(xùn)練集分別輸入各個(gè)模型進(jìn)行訓(xùn)練,并將2021年的140個(gè)樣本作為測(cè)試集測(cè)試各模型的泛化效果。
1.人工神經(jīng)網(wǎng)絡(luò)模型判別結(jié)果。作為機(jī)器學(xué)習(xí)應(yīng)用較為廣泛的算法,人工神經(jīng)網(wǎng)絡(luò)算法在模式識(shí)別、回歸分析等多個(gè)領(lǐng)域中均有較為穩(wěn)定的表現(xiàn),而人工神經(jīng)網(wǎng)絡(luò)的種類(lèi)也較多,本文采用學(xué)術(shù)界應(yīng)用較為廣泛的BP神經(jīng)網(wǎng)絡(luò)作為分類(lèi)判別的模型。使用人工神經(jīng)網(wǎng)絡(luò)算法的判別混淆矩陣結(jié)果見(jiàn)表8。
表8 人工神經(jīng)網(wǎng)絡(luò)判別混淆矩陣
2.支持向量機(jī)模型判別結(jié)果。構(gòu)建支持向量機(jī)模型中,本文采用RBF 核函數(shù)進(jìn)行模型構(gòu)建,RBF 核函數(shù)有C(懲罰因子)和γ(核參數(shù))兩個(gè)必備的參數(shù),為保證訓(xùn)練的質(zhì)量,本文通過(guò)網(wǎng)格搜尋和交叉驗(yàn)證的方法,尋找最優(yōu)的參數(shù)。支持向量機(jī)模型的判別結(jié)果見(jiàn)表9。
表9 支持向量機(jī)判別混淆矩陣
3.隨機(jī)森林模型判別結(jié)果。隨機(jī)森林模型是以決策樹(shù)為基礎(chǔ)的集成模型,當(dāng)輸入待分類(lèi)的樣本時(shí),通過(guò)抽樣形成子樣本,并將每個(gè)子樣本通過(guò)決策樹(shù)進(jìn)行分類(lèi),依據(jù)每個(gè)決策樹(shù)的判別結(jié)果,通過(guò)投票法決定最終模型的輸出。利用隨機(jī)森林模型進(jìn)行上市公司舞弊判別結(jié)果見(jiàn)表10。
表10 隨機(jī)森林判別混淆矩陣
通過(guò)分析上述回歸分析以及不同機(jī)器學(xué)習(xí)模型判別表格,可以得出以下結(jié)論:
1.Logistics 回歸分析模型可以用于敏感指標(biāo)篩選。通過(guò)Logistics 回歸分析模型的步進(jìn)方法篩選后,這些敏感指標(biāo)大多數(shù)都在模型中在10%的水平上統(tǒng)計(jì)顯著,這說(shuō)明篩選出的指標(biāo)在正負(fù)樣本中差異較大,可以用于模型的訓(xùn)練。
2.通過(guò)Logistics 回歸分析篩選的指標(biāo)能夠提升機(jī)器學(xué)習(xí)舞弊判別效率。對(duì)比上述三種機(jī)器學(xué)習(xí)的效果可知,通過(guò)Logistic 回歸分析前向步進(jìn)方法篩選出的敏感指標(biāo)作為輸入指標(biāo),在測(cè)試集中的判斷準(zhǔn)確率均有了一定程度的提升,這是因?yàn)槊舾兄笜?biāo)作為輸入指標(biāo),機(jī)器學(xué)習(xí)模型能夠更加容易地區(qū)分開(kāi)“舞弊組”與“正常組”樣本,且有一定的泛化能力。
3.隨機(jī)森林模型在初始指標(biāo)集就有不錯(cuò)的表現(xiàn)。在初始指標(biāo)集作為輸入指標(biāo)時(shí),隨機(jī)森林模型的判別準(zhǔn)確率就超過(guò)了80%,這說(shuō)明隨機(jī)森林模型自身能夠較好地利用訓(xùn)練集樣本信息,其算法是通過(guò)抽樣的方式形成決策樹(shù)并通過(guò)投票法組合多棵決策樹(shù)的預(yù)測(cè)結(jié)果來(lái)形成最終結(jié)果,該方法本身就是現(xiàn)有信息的篩選,因此利用初始輸入指標(biāo)訓(xùn)練判別效果也比較好。
本文的結(jié)論與貢獻(xiàn)主要有:第一,克服了現(xiàn)有相關(guān)研究中模型輸入指標(biāo)選取較為隨意的問(wèn)題,選擇了盡可能多的、涵蓋范圍廣的財(cái)務(wù)報(bào)告指標(biāo)作為初始輸入指標(biāo)體系,充分利用了上市公司披露的財(cái)務(wù)信息;第二,構(gòu)建了初始輸入指標(biāo)后,根據(jù)舞弊手段的不同,通過(guò)Logistics回歸分析篩選出最大化舞弊組和正常組上市公司的相關(guān)指標(biāo)形成敏感指標(biāo)集,并實(shí)證檢驗(yàn)了敏感指標(biāo)集的篩選有助于提升機(jī)器學(xué)習(xí)模型的舞弊判別效率;第三,比較了常見(jiàn)機(jī)器學(xué)習(xí)模型應(yīng)用于上市公司財(cái)報(bào)舞弊判別的效果,在實(shí)際應(yīng)用于未知樣本的舞弊判別時(shí),可以綜合幾個(gè)模型的識(shí)別結(jié)果,若某個(gè)上市公司的樣本數(shù)據(jù)在這幾個(gè)判別模型中得到一致的結(jié)果(如都被模型判別為是舞弊公司或都是正常公司),則無(wú)疑更能說(shuō)明其是否存在舞弊行為。