喬冰琴 段全虎 趙丹
【摘 要】 以2017—2020年滬深主板A股非金融上市公司為樣本,提取其年報(bào)MD&A章節(jié)中反映不同文本特征的多個(gè)文本指標(biāo),并引入上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型。采用人工神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)兩種方法對(duì)模型的預(yù)測(cè)能力進(jìn)行實(shí)證。結(jié)果表明,在常規(guī)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型中引入MD&A多文本特征可提升模型預(yù)測(cè)的AUC值。在此基礎(chǔ)上繼續(xù)增加融資約束、財(cái)務(wù)困境指數(shù)測(cè)度、非效率投資程度和過(guò)度負(fù)債程度等指標(biāo),模型預(yù)測(cè)的AUC值提升更顯著。對(duì)比兩種實(shí)證方法得到結(jié)論:基于卷積神經(jīng)網(wǎng)絡(luò)方法的MD&A多文本特征上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的預(yù)測(cè)能力更高、誤報(bào)率和漏報(bào)率更平衡。
【關(guān)鍵詞】 管理層討論與分析; 財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警; 卷積神經(jīng)網(wǎng)絡(luò); 文本分析
【中圖分類(lèi)號(hào)】 F275? 【文獻(xiàn)標(biāo)識(shí)碼】 A? 【文章編號(hào)】 1004-5937(2023)05-0016-08
一、引言
數(shù)據(jù)對(duì)于我國(guó)當(dāng)前數(shù)字經(jīng)濟(jì)發(fā)展、數(shù)字產(chǎn)業(yè)化、產(chǎn)業(yè)數(shù)字化的重要性不言而喻。傳統(tǒng)的數(shù)據(jù)主要以結(jié)構(gòu)化數(shù)據(jù)形式進(jìn)行存儲(chǔ)和提取?!按笾且圃莆铩钡刃录夹g(shù)的深入發(fā)展及場(chǎng)景化應(yīng)用,極大豐富了非結(jié)構(gòu)化數(shù)據(jù)的形式,擴(kuò)大了非結(jié)構(gòu)化數(shù)據(jù)的數(shù)量。非結(jié)構(gòu)化數(shù)據(jù)的主要呈現(xiàn)形式有文本、圖片、視頻、日志等,其中,文本作為非結(jié)構(gòu)化數(shù)據(jù)的重要組成部分,頻繁地出現(xiàn)在社交網(wǎng)絡(luò)、新聞媒體、政府文件、公司公告、公司年報(bào)及數(shù)字出版物等各類(lèi)載體中。
劉云菁等[1]指出,財(cái)務(wù)與會(huì)計(jì)領(lǐng)域的文本數(shù)據(jù)具有較高的研究?jī)r(jià)值,可基于特定技術(shù)從文本數(shù)據(jù)中挖掘出情緒、隱含語(yǔ)義、文本可讀性和相似度等,以增強(qiáng)和改進(jìn)傳統(tǒng)的預(yù)測(cè)分析與因素分析。胡楠等[2]基于上市公司年報(bào)中的管理層討論與分析(Management Discussion and Analysis,MD&A)章節(jié)進(jìn)行管理者“短期視域”文本提取,并對(duì)管理者短視是否會(huì)影響企業(yè)長(zhǎng)期投資進(jìn)行了研究。苗霞等[3]研究了財(cái)務(wù)報(bào)告前瞻性信息中的管理層超額樂(lè)觀語(yǔ)調(diào)對(duì)企業(yè)財(cái)務(wù)危機(jī)預(yù)測(cè)的價(jià)值,隨后苗霞[4]又研究了上市公司年報(bào)中的管理層語(yǔ)調(diào)和相關(guān)媒體報(bào)道對(duì)企業(yè)財(cái)務(wù)危機(jī)預(yù)測(cè)的影響。趙納暉等[5]基于上市公司文本型年報(bào)中的MD&A章節(jié)建立了識(shí)別企業(yè)財(cái)務(wù)報(bào)告舞弊模型。
綜上可知,從文本中提取和挖掘信息用于企業(yè)經(jīng)營(yíng)預(yù)測(cè)和決策,已是當(dāng)前數(shù)字經(jīng)濟(jì)時(shí)代眾多學(xué)者的研究方向。而年報(bào)MD&A章節(jié)的文本更是暗含了企業(yè)管理層對(duì)企業(yè)現(xiàn)狀和未來(lái)發(fā)展的態(tài)度、情緒傾向、語(yǔ)調(diào)語(yǔ)義等特征,這對(duì)于企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)的價(jià)值更是不容小覷?;诖耍疚膶哪陥?bào)MD&A章節(jié)中提取出多個(gè)反映文本隱含語(yǔ)義特征的指標(biāo),并引入企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型;同時(shí),將反映企業(yè)融資約束、財(cái)務(wù)困境指數(shù)測(cè)度、非效率投資程度及過(guò)度負(fù)債程度等指標(biāo)也引入財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,實(shí)證分析多文本分析指標(biāo)和多樣化指標(biāo)對(duì)模型預(yù)測(cè)能力大小的影響,分別以人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)兩種方法進(jìn)行實(shí)驗(yàn)。結(jié)果表明,引入多文本指標(biāo)及增強(qiáng)指標(biāo)多樣化均能顯著提升財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的預(yù)測(cè)能力,并且基于卷積神經(jīng)網(wǎng)絡(luò)方法的模型的誤報(bào)率和漏報(bào)率更加平衡。
二、文獻(xiàn)回顧與理論分析
國(guó)內(nèi)外對(duì)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的研究主要集中在計(jì)量工具及模型的改進(jìn)研究方面。國(guó)外財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型從1932年Fitzpatrick以財(cái)務(wù)比率預(yù)測(cè)財(cái)務(wù)困境開(kāi)始,歷經(jīng)1966年Beaver建立的單變量模型、1968年Altman建立的多元判別分析Z模型,到1980年Ohlson建立的Logit回歸模型、1988年Franco et al.建立遺傳算法財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)模型、1990年Sharda et al.建立BP神經(jīng)網(wǎng)絡(luò)財(cái)務(wù)困境預(yù)測(cè)模型,1997年Martin建立邏輯回歸財(cái)務(wù)困境預(yù)測(cè)模型,再到1998年Bradley et al.建立的支持向量機(jī)財(cái)務(wù)困境預(yù)測(cè)模型等過(guò)程,財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)模型從傳統(tǒng)模型轉(zhuǎn)向現(xiàn)代模型,從單變量分析轉(zhuǎn)向多變量分析,從單純的財(cái)務(wù)指標(biāo)分析轉(zhuǎn)向基于財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo)的分析[6-7]。
國(guó)內(nèi)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型研究相對(duì)于國(guó)外起步較晚,受限于數(shù)字技術(shù)應(yīng)用成熟度,國(guó)內(nèi)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型多是基于結(jié)構(gòu)化數(shù)據(jù)庫(kù)中的數(shù)值類(lèi)財(cái)務(wù)指標(biāo)進(jìn)行研究。1996年周首華等建立了F分?jǐn)?shù)模型,2007年鮮文鐸等建立了混合Logit模型,2009年郭德仁等建立了模糊聚類(lèi)預(yù)測(cè)模型[6-7]。
隨著現(xiàn)代數(shù)字技術(shù)的迅猛發(fā)展,將文本數(shù)據(jù)引入財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型無(wú)論在文本數(shù)據(jù)來(lái)源還是在模型構(gòu)建技術(shù)方面都具備了充分的條件。陳藝云等[8]從公司年報(bào)MD&A章節(jié)提取文本特征詞構(gòu)建公司經(jīng)理人違約傾向指標(biāo),進(jìn)而與財(cái)務(wù)數(shù)值指標(biāo)一起構(gòu)建財(cái)務(wù)困境預(yù)測(cè)模型,并分別采用Logistic回歸和SVM方法對(duì)模型進(jìn)行實(shí)證。隨后,陳藝云[9]又從管理層語(yǔ)調(diào)角度實(shí)證了文本分析能對(duì)財(cái)務(wù)困境預(yù)測(cè)提供增量信息,提高預(yù)測(cè)準(zhǔn)確性。梁龍躍等[10]在前人研究的基礎(chǔ)上,進(jìn)一步提取了上市公司年報(bào)中MD&A章節(jié)和審計(jì)報(bào)告章節(jié)的文本特征,構(gòu)建兩種文本指標(biāo)和財(cái)務(wù)數(shù)值指標(biāo)融合的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,并分別采用Logistic回歸、XGBoost決策樹(shù)、人工神經(jīng)網(wǎng)絡(luò)及卷積神經(jīng)網(wǎng)絡(luò)四種方法對(duì)模型預(yù)測(cè)效果進(jìn)行驗(yàn)證。
對(duì)上述文獻(xiàn)從財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型指標(biāo)體系構(gòu)成、財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型訓(xùn)練方法兩個(gè)方面進(jìn)行分析,并提出本文的研究?jī)?nèi)容。
(一)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型指標(biāo)體系
從文本中提取與企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警相關(guān)的文本指標(biāo),并將其納入到財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警指標(biāo)體系中,均能有效提高財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的預(yù)測(cè)能力,但同時(shí)也可以發(fā)現(xiàn)以下問(wèn)題。其一,上述文獻(xiàn)在財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)模型中引入的文本指標(biāo)大多為1至2個(gè),相比十幾個(gè)乃至幾十個(gè)財(cái)務(wù)數(shù)值指標(biāo)而言,文本指標(biāo)所占的比重及所起的作用并不明顯。其二,模型所涉及的財(cái)務(wù)指標(biāo)多是單純的財(cái)務(wù)指標(biāo),而能對(duì)企業(yè)經(jīng)營(yíng)進(jìn)行多方面、多維度刻畫(huà)的內(nèi)部治理指標(biāo)、違約風(fēng)險(xiǎn)指標(biāo)等非財(cái)務(wù)指標(biāo)應(yīng)用不多。其三,將融資約束、財(cái)務(wù)困境指數(shù)測(cè)度、非效率投資程度及過(guò)度負(fù)債程度等經(jīng)營(yíng)困境類(lèi)指標(biāo)應(yīng)用于財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)模型的討論也相對(duì)較少。故而上述模型并不能全面地反映企業(yè)所處的經(jīng)營(yíng)內(nèi)外部環(huán)境可能給企業(yè)財(cái)務(wù)帶來(lái)的風(fēng)險(xiǎn)。
(二)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型訓(xùn)練方法
在模型訓(xùn)練方法方面,上述文獻(xiàn)的很多作者采用了神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、遺傳算法、支持向量機(jī)等方法訓(xùn)練財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,個(gè)別作者采用深度學(xué)習(xí)方法提取文本和訓(xùn)練模型。然而深度學(xué)習(xí)發(fā)展迅猛,新技術(shù)和新方法不斷迭代更新。將性能更優(yōu)、用法更簡(jiǎn)單的深度學(xué)習(xí)技術(shù)引入財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,這將對(duì)提升模型預(yù)測(cè)能力大有裨益,將給企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)發(fā)現(xiàn)和預(yù)警帶來(lái)更多機(jī)會(huì)。
基于上述分析,本文擬從擴(kuò)大文本指標(biāo)數(shù)量和增選融資約束、財(cái)務(wù)困境指數(shù)測(cè)度、非效率投資程度及過(guò)度負(fù)債程度等指標(biāo)入手,建立兩種企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型:(1)融合多文本指標(biāo)和常規(guī)財(cái)務(wù)指標(biāo)的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型;(2)融合多文本指標(biāo)、融資約束指標(biāo)、財(cái)務(wù)困境指數(shù)測(cè)度指標(biāo)、非效率投資程度指標(biāo)及過(guò)度負(fù)債程度指標(biāo)、常規(guī)財(cái)務(wù)指標(biāo)的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型。
同時(shí),鑒于深度學(xué)習(xí)強(qiáng)大的性能及Python的Keras深度學(xué)習(xí)庫(kù)的簡(jiǎn)潔易用等特點(diǎn),本文將基于Keras分別構(gòu)建多層Dense堆疊神經(jīng)網(wǎng)絡(luò)模型和Convolution1D卷積神經(jīng)網(wǎng)絡(luò)模型,對(duì)多文本指標(biāo)及多樣化指標(biāo)是否能夠提高財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的預(yù)測(cè)能力進(jìn)行實(shí)證檢驗(yàn)。在檢驗(yàn)過(guò)程中,對(duì)模型1和模型2的預(yù)測(cè)效果進(jìn)行對(duì)比分析,評(píng)測(cè)多文本指標(biāo)和融資約束指標(biāo)、財(cái)務(wù)困境指數(shù)測(cè)度指標(biāo)、非效率投資程度指標(biāo)及過(guò)度負(fù)債程度指標(biāo)在提升企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型預(yù)測(cè)能力方面的價(jià)值。
三、指標(biāo)設(shè)計(jì)
下面說(shuō)明本文構(gòu)建的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型所選取的指標(biāo)及其含義。
(一)常規(guī)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型指標(biāo)的選取
根據(jù)已有文獻(xiàn)的研究思路,選取常規(guī)的可以用作財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的指標(biāo)作為本文財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的基本指標(biāo)組成??紤]到深度學(xué)習(xí)優(yōu)秀的數(shù)據(jù)特征挖掘能力,盡可能選取更多的常規(guī)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警指標(biāo)及公司內(nèi)部治理指標(biāo)來(lái)描述企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)特征。表1所示為選取的常規(guī)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警指標(biāo),包括償債能力、營(yíng)運(yùn)能力、盈利能力、發(fā)展能力、現(xiàn)金流比率、結(jié)構(gòu)比率和內(nèi)部治理7類(lèi)30個(gè)指標(biāo)。
(二)文本指標(biāo)的選取
從公司年報(bào)MD&A章節(jié)中提取多種文本特征,旨在從不同角度反映MD&A章節(jié)所蘊(yùn)含的管理層情緒和態(tài)度等信息。選取的文本指標(biāo)如表2所示。
其中,正面詞匯數(shù)量、負(fù)面詞匯數(shù)量、詞匯總量、句子數(shù)量、文字?jǐn)?shù)量是基礎(chǔ)指標(biāo),而與前一年相比文本相似度、情感語(yǔ)調(diào)1、情感語(yǔ)調(diào)2是進(jìn)一步計(jì)算得到的指標(biāo)。兩類(lèi)指標(biāo)均納入本文構(gòu)建的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,利用深度學(xué)習(xí)技術(shù)自動(dòng)學(xué)習(xí)指標(biāo)特征及指標(biāo)關(guān)系,以期得到更好的模型。
(三)融資約束、財(cái)務(wù)困境指數(shù)測(cè)度、非效率投資程度及過(guò)度負(fù)債程度指標(biāo)的選取
影響企業(yè)陷入財(cái)務(wù)困境和經(jīng)營(yíng)困境的因素有很多,融資約束、財(cái)務(wù)困境指數(shù)測(cè)度、非效率投資程度、過(guò)度負(fù)債程度等都會(huì)對(duì)企業(yè)財(cái)務(wù)及經(jīng)營(yíng)產(chǎn)生一定的影響。
1.融資約束指標(biāo)的選取
當(dāng)企業(yè)融資管理出現(xiàn)效率缺口時(shí),企業(yè)的債務(wù)違約風(fēng)險(xiǎn)增加,進(jìn)而使得財(cái)務(wù)風(fēng)險(xiǎn)增加,企業(yè)陷入財(cái)務(wù)困境的可能性也將增大。為體現(xiàn)融資約束對(duì)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的影響,本文創(chuàng)新性地將目前在融資約束研究中占主流的、衡量融資約束的四項(xiàng)指數(shù)——SA指數(shù)、KZ指數(shù)、WW指數(shù)和FC指數(shù)引入模型,由深度學(xué)習(xí)技術(shù)自動(dòng)刻畫(huà)融資約束特征對(duì)企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的影響。
2.財(cái)務(wù)困境指數(shù)測(cè)度指標(biāo)的選取
在傳統(tǒng)的財(cái)務(wù)困境研究中,Z_Score模型、O_Score模型、RLPM模型及Merton DD模型常用于對(duì)企業(yè)財(cái)務(wù)困境的評(píng)價(jià)。為豐富本文所建模型,提取出這四種模型中的常用指標(biāo),與本文的常規(guī)財(cái)務(wù)指標(biāo)和多文本分析指標(biāo)相結(jié)合,構(gòu)建財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,以提升本文所建模型的預(yù)測(cè)能力。財(cái)務(wù)困境指數(shù)測(cè)度指標(biāo)如表3所示。
3.非效率投資程度指標(biāo)及過(guò)度負(fù)債程度指標(biāo)的選取
投資過(guò)度及投資不足構(gòu)成的非效率投資也是造成企業(yè)出現(xiàn)財(cái)務(wù)風(fēng)險(xiǎn)的因素之一。非效率投資程度是基于相關(guān)財(cái)務(wù)指標(biāo)分年度進(jìn)行OLS回歸,模型估計(jì)的殘差絕對(duì)值為公司非效率投資程度。殘差絕對(duì)值越大,意味著非效率投資的程度越高,即投資效率越低。殘差為正表示過(guò)度投資,殘差為負(fù)表示投資不足。本文選取非效率投資程度指標(biāo)納入企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,以提升財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)效果。
過(guò)度負(fù)債程度是實(shí)際負(fù)債率減去目標(biāo)負(fù)債率的差額,其中,實(shí)際負(fù)債率為賬面資產(chǎn)負(fù)債率,用總負(fù)債與總資產(chǎn)的比值來(lái)計(jì)算;目標(biāo)負(fù)債率為通過(guò)Tobit回歸方法對(duì)實(shí)際負(fù)債率、產(chǎn)權(quán)性質(zhì)、權(quán)益凈利潤(rùn)、資產(chǎn)負(fù)債率、總資產(chǎn)增長(zhǎng)率、固定資產(chǎn)占比、公司規(guī)模、公司第一大股東比率分年度進(jìn)行回歸得到。過(guò)度舉債會(huì)加劇企業(yè)財(cái)務(wù)風(fēng)險(xiǎn),而高財(cái)務(wù)杠桿也是企業(yè)出現(xiàn)財(cái)務(wù)風(fēng)險(xiǎn)的因素之一。因此,本文將過(guò)度負(fù)債程度指標(biāo)也納入上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型。
非效率投資程度指標(biāo)和過(guò)度負(fù)債程度指標(biāo)如表4所示。
四、模型構(gòu)建與訓(xùn)練
為驗(yàn)證本文所選取的MD&A多文本指標(biāo)(下文標(biāo)記為①)、融資約束指標(biāo)、財(cái)務(wù)困境指數(shù)測(cè)度指標(biāo)、非效率投資程度指標(biāo)和過(guò)度負(fù)債程度指標(biāo)(下文標(biāo)記為②)對(duì)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的作用,下面分別構(gòu)建(1)融合①和常規(guī)財(cái)務(wù)指標(biāo)的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型、(2)融合①、②及常規(guī)財(cái)務(wù)指標(biāo)的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,并分別采用多層Dense堆疊神經(jīng)網(wǎng)絡(luò)和1維卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行實(shí)證。
(一)樣本選擇
本文所有數(shù)據(jù)均來(lái)自國(guó)泰安數(shù)據(jù)庫(kù)。選擇2017—2020年滬深兩市主板A股上市公司為研究樣本,剔除金融類(lèi)企業(yè),剔除缺失數(shù)據(jù)比率超過(guò)30%的企業(yè)。
借鑒已有的研究思路,將上市公司被ST作為其陷入財(cái)務(wù)困境的標(biāo)志。同時(shí),鑒于上市公司陷入財(cái)務(wù)困境是一個(gè)動(dòng)態(tài)的、持續(xù)變化的過(guò)程和狀態(tài),即大多數(shù)公司在被ST之前都會(huì)經(jīng)歷財(cái)務(wù)風(fēng)險(xiǎn)增加直到陷入財(cái)務(wù)困境,因此,財(cái)務(wù)異常樣本集定義為t年被ST公司的t-1年至t-4年的年度數(shù)據(jù)。最終得到623條財(cái)務(wù)異常樣本數(shù)據(jù)。
對(duì)于財(cái)務(wù)正常樣本的選取,按照ST與非ST行業(yè)匹配、規(guī)模匹配及樣本量比率為1■1的原則,同樣取得623條財(cái)務(wù)正常樣本。所有樣本共計(jì)1 246條。
(二)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型構(gòu)建
1.融合①和常規(guī)財(cái)務(wù)指標(biāo)的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型
此模型包括的指標(biāo)主要是表1所示的30個(gè)常規(guī)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警指標(biāo)和表2所示的8個(gè)MD&A文本特征指標(biāo),共計(jì)38個(gè)指標(biāo)。
2.融合①、②及常規(guī)財(cái)務(wù)指標(biāo)的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型
此模型包括的指標(biāo)主要是表1所示的30個(gè)常規(guī)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警指標(biāo)、表2所示的8個(gè)MD&A文本特征指標(biāo)、融資約束及表3的財(cái)務(wù)困境指數(shù)測(cè)度和表4的非效率投資程度與過(guò)度負(fù)債程度等13個(gè)指標(biāo),共計(jì)51個(gè)指標(biāo)。
(三)實(shí)證方法選擇
參考梁龍躍等[10]使用的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型訓(xùn)練方法,本文引入人工神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)兩種方法完成財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的訓(xùn)練,以期得到更有效、性能更好的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型。文中所有實(shí)證均基于Python的Keras深度學(xué)習(xí)庫(kù)完成。實(shí)驗(yàn)環(huán)境采用Anaconda3,conda版本是4.10.1,Python版本是3.8.8,Jupyter Notebook版本是6.3.0,Keras版本是2.7.0。
1.多層Dense堆疊神經(jīng)網(wǎng)絡(luò)
Dense是Keras中的全連接(Fully Connection)層,也叫密集連接層(Densely Connected Layer)或密集層(Dense Layer)。由多個(gè)Dense層連接形成的神經(jīng)網(wǎng)絡(luò)模型稱(chēng)為Dense堆疊神經(jīng)網(wǎng)絡(luò)模型。
由于財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的數(shù)據(jù)量較小,指標(biāo)特征相對(duì)也較少,因此,Dense網(wǎng)絡(luò)僅需4層即可完成模型訓(xùn)練。同時(shí),為降低過(guò)擬合,前三個(gè)Dense層后各接一個(gè)Dropout層,最后一個(gè)Dense層采用sigmoid激活函數(shù)完成輸出分類(lèi)即可。
2.Convolution1D卷積神經(jīng)網(wǎng)絡(luò)
Convolution1D是Keras中的一維卷積神經(jīng)網(wǎng)絡(luò)模型,對(duì)于文本分類(lèi)、時(shí)間序列等簡(jiǎn)單任務(wù),構(gòu)建小型的Convolution1D網(wǎng)絡(luò)可以使模型訓(xùn)練速度更快。一維卷積層可以從財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)樣本中提取局部樣本特征,并能利用一維卷積神經(jīng)網(wǎng)絡(luò)的平移不變性將提取到的特征在樣本其他位置進(jìn)行識(shí)別。
CNN常用于圖像領(lǐng)域。由于圖像的特征維度很高,為減少特征數(shù)量,CNN層常與最大池化層連接,通過(guò)最大池化層的下采樣達(dá)到降低維度和擴(kuò)大卷積層觀察窗口的作用。同時(shí),對(duì)于具有高維特征的圖像而言,最大池化層的下采樣也基本不會(huì)影響圖像識(shí)別結(jié)果。而將CNN應(yīng)用于本文的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型時(shí),由于模型的特征指標(biāo)數(shù)量很少,且每個(gè)指標(biāo)都各有其意義,因此,針對(duì)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的這一特性,本文在設(shè)計(jì)CNN模型時(shí),沒(méi)有使用最大池化層,僅在各卷積層下接Dropout層以降低過(guò)擬合。
同樣,由于財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型較小,故CNN模型僅需4層,每層卷積核大小為3;每個(gè)卷積層后接一個(gè)Dropout層。最后對(duì)卷積輸出進(jìn)行展平,在其后再接一層Dense層,利用Sigmoid激活函數(shù)完成輸出分類(lèi)即可。
(四)實(shí)驗(yàn)步驟
實(shí)驗(yàn)步驟如圖1所示。
(五)實(shí)驗(yàn)結(jié)果
為了對(duì)比本文所建財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型與已有模型的預(yù)測(cè)效果,分別建立如表5所示的四種財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,所有模型均在相同的樣本集上選擇如表5所示的指標(biāo)數(shù)據(jù)。
分別以Dense堆疊網(wǎng)絡(luò)和Convolution1D卷積神經(jīng)網(wǎng)絡(luò)對(duì)表5中的4種預(yù)警模型進(jìn)行訓(xùn)練,所得模型在測(cè)試集上的AUC值(Area Under Curve,ROC曲線下面積)和混淆矩陣比較如表6所示。
五、結(jié)果分析
(一)四種財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型對(duì)比
下面分別從財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型指標(biāo)體系構(gòu)成和實(shí)證方法兩方面對(duì)這些模型的預(yù)測(cè)效果進(jìn)行對(duì)比分析。
1.從模型指標(biāo)體系構(gòu)成方面進(jìn)行對(duì)比
(1)AUC值對(duì)比
在深度學(xué)習(xí)中,AUC是非常重要的檢測(cè)模型好壞的指標(biāo),AUC值越接近1,表示模型預(yù)測(cè)能力越高。從表6可以看出,無(wú)論是以Dense堆疊網(wǎng)絡(luò)還是Convolution1D網(wǎng)絡(luò)建立的預(yù)警模型,其M1到M4的AUC值均在不斷升高,這意味著預(yù)警模型的預(yù)測(cè)能力在不斷提升。
在Dense訓(xùn)練的預(yù)警模型中,相比M1,M3的AUC提升是因?yàn)樵黾恿?個(gè)MD&A多文本指標(biāo);相比M2和M3,M4的AUC提升是因?yàn)镸4包含了全部51個(gè)指標(biāo)。同理,在Convolution1D訓(xùn)練的預(yù)警模型中,相比M1,M3的AUC提升是因?yàn)樵黾恿?個(gè)MD&A多文本指標(biāo);相比M2和M3,M4的AUC提升是因?yàn)镸4包含了全部51個(gè)指標(biāo)。
(2)漏報(bào)率與誤報(bào)率對(duì)比
預(yù)測(cè)模型中,漏報(bào)率(FNR)是指將有風(fēng)險(xiǎn)的公司預(yù)測(cè)為無(wú)風(fēng)險(xiǎn)的比率;誤報(bào)率(FPR)是指將無(wú)風(fēng)險(xiǎn)的公司預(yù)測(cè)為有風(fēng)險(xiǎn)的比率。降低預(yù)警模型的這兩類(lèi)錯(cuò)誤是判斷模型好壞的標(biāo)準(zhǔn)之一。
從表6可以看出,以Dense訓(xùn)練的四種預(yù)警模型中,M4模型的FNR與FPR之和(0.32)最低,并且相對(duì)持平(FNR與FPR相差0.02),說(shuō)明M4模型預(yù)測(cè)的兩類(lèi)錯(cuò)誤率較低且比較平衡。以Convolution1D訓(xùn)練的四種預(yù)警模型中,M4模型的FNR與FPR之和(0.33)稍高于M2模型(0.32),但M4模型比M2模型的預(yù)測(cè)要平衡得多(M4模型的FNR與FPR相差0.01),說(shuō)明M4模型預(yù)測(cè)比較平衡。
由此得知,將MD&A中提取的多文本特征引入上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型,能有效提高模型的預(yù)測(cè)能力,印證了出自企業(yè)內(nèi)部管理層之手的MD&A章節(jié)文本內(nèi)容能夠體現(xiàn)管理層對(duì)企業(yè)未來(lái)的主觀判斷。同時(shí),擴(kuò)充指標(biāo)后的模型表現(xiàn)出更好的風(fēng)險(xiǎn)預(yù)測(cè)能力,印證了模型指標(biāo)類(lèi)型越豐富、數(shù)量越多,其預(yù)測(cè)風(fēng)險(xiǎn)的能力也越高,結(jié)果越穩(wěn)定。因此,構(gòu)建上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型時(shí),合理加入MD&A的多文本特征及一些通過(guò)建模和計(jì)算得到的復(fù)合型指標(biāo)來(lái)提升模型預(yù)測(cè)能力是可行和可靠的。
2.從實(shí)證方法方面進(jìn)行對(duì)比
(1)AUC值對(duì)比
從表6可以看出,相比Dense訓(xùn)練的四種預(yù)警模型,Convolution1D訓(xùn)練的四種預(yù)警模型的AUC值分別高出0.027、0.030、0.026、0.017,說(shuō)明Convolution1D比Dense訓(xùn)練的效果好。這表明Convolution1D比Dense更能挖掘出上市公司的財(cái)務(wù)風(fēng)險(xiǎn)特征,更適合作為財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型訓(xùn)練的方法。不過(guò)模型優(yōu)勢(shì)不是絕對(duì)的。通過(guò)交叉對(duì)比分析可以看出,指標(biāo)數(shù)量不斷增加及指標(biāo)含義更加豐富都可以彌補(bǔ)訓(xùn)練方法的缺陷。比如,Dense訓(xùn)練的M3模型使用了38個(gè)指標(biāo),其AUC值為0.887,超過(guò)了Convolution1D訓(xùn)練的M1模型的AUC值,但是優(yōu)勢(shì)特別微弱,僅為0.001。而當(dāng)Dense訓(xùn)練的M4模型的指標(biāo)數(shù)量增加至51個(gè)時(shí),其AUC值達(dá)到了0.903,超過(guò)Convolution1D訓(xùn)練的M1模型的AUC值(超過(guò)0.017),模型優(yōu)勢(shì)進(jìn)一步擴(kuò)大,說(shuō)明指標(biāo)的豐富程度能夠影響模型的預(yù)測(cè)能力。
(2)漏報(bào)率與誤報(bào)率對(duì)比
Convolution1D訓(xùn)練的模型比Dense訓(xùn)練的模型在預(yù)測(cè)時(shí)要更加平衡。對(duì)于M3模型,Dense網(wǎng)絡(luò)的FNR與FPR之和(0.33)小于Convolution1D網(wǎng)絡(luò)的FNR與FPR之和(0.36),但Dense網(wǎng)絡(luò)的FNR與FPR之差(0.17)遠(yuǎn)大于Convolution1D網(wǎng)絡(luò)的FNR與FPR之差(0.06)。不過(guò),指標(biāo)的豐富程度降低了這種差異,對(duì)于M4模型,Dense網(wǎng)絡(luò)的FNR與FPR之和(0.32)及之差(0.02)幾乎與Convolution1D網(wǎng)絡(luò)的FNR與FPR之和(0.33)及之差(0.01)持平。
(二)與其他文獻(xiàn)對(duì)比
在同一領(lǐng)域的研究中,梁龍躍等[10]基于BERT-AE提取MD&A文本特征和審計(jì)報(bào)告文本特征,并分別使用Logistic回歸、XGBoost、ANN及CNN訓(xùn)練加入兩種文本特征的財(cái)務(wù)預(yù)警模型,最終使模型的AUC值分別達(dá)到0.8577、0.8961、0.8757和0.8777。與本文所建的基于Convolution1D網(wǎng)絡(luò)的M3和M4模型相比,本文這兩個(gè)模型的AUC值均高于該文獻(xiàn)所有模型的AUC值。
袁美芬[11]所建預(yù)警模型共有45個(gè)財(cái)務(wù)和非財(cái)務(wù)指標(biāo),其中包含了“審計(jì)意見(jiàn)類(lèi)型”指標(biāo),模型基于人工神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,在T-5時(shí)間步樣本集上得到0.901的AUC值。而在本文的前期實(shí)驗(yàn)中,曾專(zhuān)門(mén)將審計(jì)報(bào)告中的審計(jì)意見(jiàn)類(lèi)型提取并量化后加入到M4模型中,在Convolution1D方法的訓(xùn)練下,M4模型的AUC值高達(dá)0.996,這印證了審計(jì)意見(jiàn)類(lèi)型與企業(yè)是否陷入財(cái)務(wù)困境、是否可能被帶上ST帽子有著非常緊密和直接的聯(lián)系。然而審計(jì)意見(jiàn)類(lèi)型由企業(yè)外部獨(dú)立的專(zhuān)業(yè)審計(jì)機(jī)構(gòu)提供,不依賴(lài)外部審計(jì)而從企業(yè)內(nèi)部管理層視角來(lái)測(cè)度財(cái)務(wù)風(fēng)險(xiǎn),這對(duì)企業(yè)未來(lái)的可持續(xù)發(fā)展具有更為重要的意義。因此,本文所建的M3和M4模型沒(méi)有包含審計(jì)意見(jiàn)類(lèi)型指標(biāo)。但即便不包括對(duì)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)影響如此之高的指標(biāo),本文所建的基于卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的M3和M4模型的AUC值也優(yōu)于袁美芬[11]所建模型。
湯惠蓉[12]建立的基于深度學(xué)習(xí)網(wǎng)絡(luò)的預(yù)警模型用到27個(gè)純財(cái)務(wù)數(shù)值指標(biāo),其模型在T-3時(shí)間步上達(dá)到的AUC值為0.783,遠(yuǎn)低于本文基于Convolution1D的M3模型和M4模型的AUC值。
與上述文獻(xiàn)的AUC值對(duì)比如表7所示。
六、結(jié)論
管理層討論與分析是上市公司年報(bào)中重要的信息披露部分,能夠體現(xiàn)企業(yè)內(nèi)部管理層對(duì)未來(lái)的預(yù)期。將從MD&A章節(jié)提取的多文本指標(biāo)加入常規(guī)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警指標(biāo)體系可以提升模型預(yù)測(cè)的準(zhǔn)確性。本文構(gòu)建了基于MD&A多文本特征的上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警體系,并分別用Dense網(wǎng)絡(luò)和Convolution1D網(wǎng)絡(luò)實(shí)證這兩種模型的預(yù)測(cè)能力。結(jié)論如下:
1.從MD&A章節(jié)提取的多文本特征可以提升上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的預(yù)測(cè)能力。文本分析技術(shù)能夠挖掘MD&A章節(jié)的文本特征,展示管理層語(yǔ)調(diào)和情緒,提升風(fēng)險(xiǎn)預(yù)警的敏感度。從MD&A章節(jié)提取的正面詞匯數(shù)量、負(fù)面詞匯數(shù)量、詞匯總量、句子數(shù)量、文字?jǐn)?shù)量,以及經(jīng)過(guò)處理的與前一年相比文本相似度、情感語(yǔ)調(diào)1和情感語(yǔ)調(diào)2等文本特征,能夠體現(xiàn)企業(yè)管理層甚或高層對(duì)于企業(yè)未來(lái)發(fā)展的信心、態(tài)度以及預(yù)期。實(shí)證表明,將MD&A多文本特征加入上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型指標(biāo)體系明顯提升了模型的預(yù)測(cè)能力。
2.豐富財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的指標(biāo)體系可以提升模型的預(yù)測(cè)能力。在常規(guī)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警指標(biāo)體系中,依次加入①指標(biāo)、②指標(biāo),實(shí)證發(fā)現(xiàn)模型的AUC值不斷提升。②指標(biāo)均是從融資管理、投資管理和風(fēng)險(xiǎn)角度選取的、經(jīng)過(guò)一定計(jì)算得到的復(fù)合指標(biāo),其本身具有反映財(cái)務(wù)困境的能力,融入本文模型后,表現(xiàn)出有效的模型預(yù)測(cè)提升能力。
3.實(shí)證表明,深度神經(jīng)網(wǎng)絡(luò)比傳統(tǒng)機(jī)器學(xué)習(xí)方法更能提升財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的預(yù)測(cè)能力,而卷積神經(jīng)網(wǎng)絡(luò)比人工神經(jīng)網(wǎng)絡(luò)更能提升財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的預(yù)測(cè)能力。Python的Keras深度學(xué)習(xí)庫(kù)提供了功能強(qiáng)大、簡(jiǎn)單易用的深度學(xué)習(xí)工具包,它使模型的構(gòu)建和訓(xùn)練更加容易,僅需十幾行代碼就能完成財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的訓(xùn)練,這為企業(yè)應(yīng)用實(shí)踐財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型預(yù)判可能的財(cái)務(wù)風(fēng)險(xiǎn)提供了便利性和靈活性,為企業(yè)日常經(jīng)營(yíng)決策活動(dòng)提供了智能支持。
數(shù)字經(jīng)濟(jì)時(shí)代,更多的企業(yè)經(jīng)營(yíng)信息以非結(jié)構(gòu)化信息的形式涌現(xiàn)出來(lái),充分挖掘這些信息間隱含的關(guān)聯(lián),更精準(zhǔn)地刻畫(huà)企業(yè)財(cái)務(wù)特征、更及時(shí)地為企業(yè)提供財(cái)務(wù)預(yù)警、更智能地輔助企業(yè)決策是未來(lái)一段時(shí)間的重要研究?jī)?nèi)容。同時(shí),鑒于深度學(xué)習(xí)強(qiáng)大的性能,未來(lái)可以構(gòu)建更加多樣化、維度更豐富的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警指標(biāo)體系,使預(yù)警模型更加健壯,表征性更強(qiáng),角度更全面。
【參考文獻(xiàn)】
[1] 劉云菁,張紫怡,張敏.財(cái)務(wù)與會(huì)計(jì)領(lǐng)域的文本分析研究:回顧與展望[J].會(huì)計(jì)與經(jīng)濟(jì)研究,2021,35(1):3-22.
[2] 胡楠,薛付婧,王昊楠.管理者短視主義影響企業(yè)長(zhǎng)期投資嗎?——基于文本分析和機(jī)器學(xué)習(xí)[J].管理世界,2021,37(5):139-156,11,19-21.
[3] 苗霞,李秉成.管理層超額樂(lè)觀語(yǔ)調(diào)與企業(yè)財(cái)務(wù)危機(jī)預(yù)測(cè)——基于年報(bào)前瞻性信息的分析[J].商業(yè)研究,2019(2):129-137.
[4] 苗霞.管理層語(yǔ)調(diào)、媒體報(bào)道與企業(yè)財(cái)務(wù)危機(jī)預(yù)測(cè)——基于年報(bào)前瞻性信息的分析[J].財(cái)會(huì)通訊,2019(27):17-21.
[5] 趙納暉,張?zhí)煅?基于MD&A文本和深度學(xué)習(xí)模型的財(cái)務(wù)報(bào)告舞弊識(shí)別[J].會(huì)計(jì)之友,2022(8):140-149.
[6] 朱永明,徐璐銘.引入社會(huì)責(zé)任的上市公司財(cái)務(wù)困境預(yù)測(cè)模型研究[J].商業(yè)研究,2015(3):92-97.
[7] 夏寧,宋學(xué)良.財(cái)務(wù)困境預(yù)測(cè)模型綜述[J].會(huì)計(jì)之友,2015(8):27-29.
[8] 陳藝云,賀建風(fēng),覃福東.基于中文年報(bào)管理層討論與分析文本特征的上市公司財(cái)務(wù)困境預(yù)測(cè)研究[J].預(yù)測(cè),2018,37(4):53-59.
[9] 陳藝云.基于信息披露文本的上市公司財(cái)務(wù)困境預(yù)測(cè):以中文年報(bào)管理層討論與分析為樣本的研究[J].中國(guó)管理科學(xué),2019,27(7):23-34.
[10] 梁龍躍,劉波.基于文本挖掘的上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究[J].計(jì)算機(jī)工程與應(yīng)用,2022,58(4):255-266.
[11] 袁美芬.深度學(xué)習(xí)驅(qū)動(dòng)的財(cái)務(wù)困境預(yù)測(cè)研究[D].南昌:江西財(cái)經(jīng)大學(xué)碩士學(xué)位論文,2021.
[12] 湯惠蓉.基于深度學(xué)習(xí)的上市公司財(cái)務(wù)困境預(yù)測(cè)研究[D].南京:東南大學(xué)碩士學(xué)位論文,2020.