陳啟城
【摘 ?要】企業(yè)因經(jīng)營和財務(wù)杠桿不合理導(dǎo)致資金鏈斷裂等情況時有發(fā)生,進而形成財務(wù)危機。財務(wù)風(fēng)險預(yù)警模型能夠在財務(wù)風(fēng)險轉(zhuǎn)化為危機前及時預(yù)警,幫助企業(yè)盡早應(yīng)對。基于此,論文以基于PCA-NBC模型的財務(wù)風(fēng)險預(yù)警模型為研究內(nèi)容,采用滬深主板A股上市企業(yè)的t-3年的財務(wù)報告為數(shù)據(jù)樣本,綜合主成分分析法與樸素貝葉斯的優(yōu)勢構(gòu)建了財務(wù)風(fēng)險預(yù)警模型。通過測試數(shù)據(jù)集的檢驗,結(jié)果表明PCA-NBC算法具有較高的預(yù)測準(zhǔn)確性,適用于制造業(yè)上市企業(yè)風(fēng)險預(yù)警。
【Abstract】Unreasonable operating and financial leverage of enterprises often leads to broken capital chain, which leads to financial crisis. The financial risk early warning model can give early warning before financial risks turn into crises, and help enterprises to respond as soon as possible. Based on this, this paper takes the financial risk early warning model based on PCA-NBC model as the research content, takes the financial reports for the first three years of the t-year of A-share listed companies in Shanghai and Shenzhen main boards for the data samples, and constructs the financial risk early warning model by combining the advantages of principal component analysis and Naive Bayes. Through the test data set, the results show that PCA-NBC algorithm has high prediction accuracy and is suitable for risk warning of listed manufacturing enterprises.
【關(guān)鍵詞】主成分分析;樸素貝葉斯;財務(wù)風(fēng)險預(yù)警
【Keywords】principal component analysis; Naive Bayes; financial risk early warning
【中圖分類號】F275 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻標(biāo)志碼】A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號】1673-1069(2021)12-0085-03
1 引言
企業(yè)財務(wù)風(fēng)險從開始到量變以及質(zhì)變?yōu)槲C是一個持續(xù)的過程,是各種不良因素不斷積累到最終的結(jié)果。因此,企業(yè)財務(wù)風(fēng)險實際上是可以預(yù)先檢測,提前防治的,企業(yè)如果能在財務(wù)風(fēng)險質(zhì)變前及時發(fā)現(xiàn)并采取措施,就有機會挽回?fù)p失。
在經(jīng)濟全球化的大背景以及近年經(jīng)濟壓力的影響之下,我國企業(yè)各方面都面臨著嚴(yán)峻的挑戰(zhàn),雖然我國市場經(jīng)濟制度正在逐步完善,政府的監(jiān)管力度也在加強,但是依然有許多企業(yè)面臨財務(wù)風(fēng)險。尤其制造業(yè)企業(yè)作為我國國民經(jīng)濟的重要組成部分,由于重資產(chǎn)、重設(shè)備的特點,比其他企業(yè)更有可能遇到流動資金短缺等財務(wù)風(fēng)險,嚴(yán)重的可能出現(xiàn)資金斷裂,瀕臨破產(chǎn)[1]。要想在激烈的市場競爭中占有一席之地,如何對財務(wù)風(fēng)險進行預(yù)警,在面對來自外部風(fēng)險的同時,抵御自身風(fēng)險,顯得尤為重要。因此,本文以制造業(yè)上市公司作為研究對象,通過建立客觀、適用的財務(wù)風(fēng)險預(yù)警指標(biāo)體系,結(jié)合主成分分析法與樸素貝葉斯構(gòu)建了財務(wù)風(fēng)險預(yù)警模型。實驗結(jié)果表明PCA-NBC財務(wù)風(fēng)險預(yù)警模型預(yù)測準(zhǔn)確率高,適用于制造業(yè)上市公司的財務(wù)風(fēng)險預(yù)警,具有使用價值。
2 PCA-NBC財務(wù)風(fēng)險預(yù)警模型構(gòu)建
2.1 數(shù)學(xué)模型的選擇
2.1.1 主成分分析
主成分分析(Principal Component Analysis, PCA)是Hotelling在1933年提出的一種使用廣泛的數(shù)據(jù)降維方法。其原理是通過正交變換,用相同數(shù)量的線性不相關(guān)變量來替代原來可能存在線性相關(guān)的變量,并且變換前后信息沒有損失,這些變換后的變量又叫主成分。原始數(shù)據(jù)的信息量一般用方差來衡量,因此為了實現(xiàn)降維的目的,通常根據(jù)實際需要選取方差貢獻率最大的前幾個主成分來代替原始變量,在降維的同時盡可能保留原來變量的信息[2]。如果研究數(shù)據(jù)有m個樣本和n個維度的屬性,則可以用X來表示樣本的數(shù)據(jù)集,其中xij表示第i個樣本的第j個維度的屬性。然后可以通過公式求C=XTX得X的協(xié)方差矩陣,最后求出特征值與特征向量。
2.1.2 樸素貝葉斯
樸素貝葉斯法是貝葉斯分類中使用較為廣泛的算法,該算法本身來源于貝葉斯定理。
2.2 財務(wù)風(fēng)險指標(biāo)體系設(shè)計
企業(yè)財務(wù)風(fēng)險狀況一般會體現(xiàn)在公司的財務(wù)指標(biāo)中,財務(wù)指標(biāo)體系的構(gòu)建對提高最終財務(wù)風(fēng)險預(yù)警模型的準(zhǔn)確性十分關(guān)鍵。為保證財務(wù)風(fēng)險指標(biāo)的評估及選取的客觀與適用,需要理解指標(biāo)的功能并遵循一定的選取原則。預(yù)警指標(biāo)的功能涉及比較功能、反映功能、評價功能、預(yù)測功能[4]。除了這四大功能外,還應(yīng)遵從重要性原則、系統(tǒng)性原則、可操作性原則、動態(tài)性原則、定性和定量相結(jié)合原則[5]。
2.3 PCA-NBC財務(wù)風(fēng)險預(yù)警模型建立
上述2種方法(主成分分析和樸素貝葉斯)各有優(yōu)勢,主成分分析能提取主要信息,降低數(shù)據(jù)維度,樸素貝葉斯模型有穩(wěn)定的分類效率,對小規(guī)模的數(shù)據(jù)表現(xiàn)很好,能處理多分類任務(wù)。因此,綜合考慮2種方法的優(yōu)勢建立組合預(yù)測模型,即主成分分析與樸素貝葉斯模型。
3 基于PCA-NBC的企業(yè)財務(wù)風(fēng)險預(yù)警模型應(yīng)用
3.1 數(shù)據(jù)來源及樣本選擇
為保證樣本數(shù)據(jù)的可靠性,論文將受到監(jiān)管與審計的上市公司年度財務(wù)報告作為數(shù)據(jù)來源。同時因為滬深A(yù)股與B股企業(yè)區(qū)別較大,A股遵守的是國內(nèi)會計與審計準(zhǔn)則,B股遵守的則是國際會計與審計準(zhǔn)則,2種不同準(zhǔn)則下的各財務(wù)報表項目和財務(wù)指標(biāo)會有較大的區(qū)別[6]。因此,本文將選用滬深A(yù)股主板上市的制造業(yè)企業(yè)進行分析。實驗數(shù)據(jù)取自國泰安CSMAR數(shù)據(jù)庫,將選取的樣本(ST、*ST樣本、非ST樣本)隨機劃分為訓(xùn)練樣本集與測試樣本集2類,用訓(xùn)練樣本集訓(xùn)練財務(wù)風(fēng)險預(yù)警模型并用測試樣本集測試模型。根據(jù)相關(guān)文獻發(fā)現(xiàn),財務(wù)風(fēng)險預(yù)警模型的構(gòu)建以第t-1年與第t-2年有關(guān)數(shù)據(jù)進行研究雖然能有效提升財務(wù)風(fēng)險預(yù)測準(zhǔn)確率,但是對于企業(yè)財務(wù)風(fēng)險預(yù)警來說過晚,意義不大[7]。因此,本文的財務(wù)風(fēng)險預(yù)警模型研究將同樣遵守該原則,采用制造業(yè)上市企業(yè)t-3年年度財務(wù)報告作為實驗樣本。
3.2 數(shù)據(jù)收集與標(biāo)準(zhǔn)化處理
3.2.1 數(shù)據(jù)收集
數(shù)據(jù)樣本將選取2017年到2020年滬深A(yù)股上市的ST、*ST制造企業(yè)共45家,同時去除樣本中含有缺失值的5家制造業(yè)上市企業(yè),剩下40個ST或*ST企業(yè)樣本。對于制造業(yè)非ST、非*ST企業(yè)樣本,主要的選擇依據(jù)是資產(chǎn)規(guī)模要相同或接近,共選取70個樣本,因此總共取得研究樣本110份。在模型訓(xùn)練的過程中,針對預(yù)警模型的訓(xùn)練與檢驗,將樣本按照比例劃分為訓(xùn)練集和驗證集,采用隨機劃分的方式將80%左右的樣本分訓(xùn)練樣本,20%樣本分為驗證樣本,循環(huán)10次。
3.2.2 標(biāo)準(zhǔn)化處理
本文首先使用Z分?jǐn)?shù)對樣本進行標(biāo)準(zhǔn)化處理,確保所有數(shù)據(jù)不受量綱影響。針對前文初步選取的24項財務(wù)指標(biāo),需要進行顯著性檢驗。根據(jù)樣本是否服從正態(tài)分布,顯著性檢驗可以分為參數(shù)檢驗和非參數(shù)檢驗。為判斷樣本是否滿足正態(tài)分布,需要對樣本進行K-S(Kolmogorov-Smimov)檢驗。在SPSS26.0中對27個指標(biāo)進行顯著性檢驗,結(jié)果如表1所示,在95%的置信水平下,初步選出的指標(biāo)顯著性都小于0.05,即樣本來自的總體不服從正態(tài)分布。接下來進行Mann-Whitney U非參數(shù)檢驗。
在95%的置信水平下,26個指標(biāo)中有17個指標(biāo)通過了顯著性檢驗。為使預(yù)測更加客觀和有效,剔除了不符合Mann-Whitney U檢驗的財務(wù)指標(biāo)。
3.3 基于PCA-NBC算法的財務(wù)風(fēng)險預(yù)警分析
3.3.1 使用PCA提取主成分
①KMO與巴特利特球形檢驗。KMO與巴特利特球形是主成分分析法適用性的2種常見的檢驗方法[8]。KMO檢驗是用于比較變量間簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的指標(biāo),取值在0和1之間。KMO值越接近1,意味著變量間的相關(guān)性越強。檢驗結(jié)果KMO值為0.671,說明相關(guān)性較強,原有變量適合使用因子分析。巴特利特球形檢驗則需要通過顯著性檢驗,檢驗結(jié)果巴特利特的自由度為136,近似卡方為6073.419,顯著性水平為0.000,說明原變量具有相關(guān)性,適合使用因子分析。
②主成分選取。主成分分析的特征值與方差貢獻率如表2所示,從表中可以看到特征值大于1的主成分有6個,這6個主成分的累計貢獻率只有72.684%,一般來說,累計貢獻率至少要達到80%以上,才能較好地代替原來變量。因此本文提取前8個主成分代替原變量。
3.3.2 基于PCA-NBC算法的財務(wù)風(fēng)險預(yù)測
將預(yù)處理后的樣本隨機劃分為80%的訓(xùn)練樣本和20%的預(yù)測樣本,每次訓(xùn)練與預(yù)測循環(huán)10次,結(jié)果取平均值。第一組實驗不采用主成分分析方法提取主成分,只使用處理后的數(shù)據(jù)來訓(xùn)練樸素貝葉斯、二次判別分析、邏輯回歸KNN(K-Nearest Neighbor)算法、SVM(support vector machine)模型,并列出預(yù)測結(jié)果。第二組實驗,模型采用主成分分析提取前8個主成分,然后進行模型的訓(xùn)練和預(yù)測,同樣列出預(yù)測結(jié)果,如表3、表4所示。
實驗結(jié)果表明,在沒有使用PCA處理數(shù)據(jù)時,樸素貝葉斯算法的預(yù)測準(zhǔn)確率只有67.4%,要遠(yuǎn)小于邏輯回歸、KNN和SVM算法,但是在使用PCA處理數(shù)據(jù)進行降維后,樸素貝葉斯算法的預(yù)測準(zhǔn)確率取得了較大的提高,已經(jīng)優(yōu)于KNN算法,與邏輯回歸和SVM相當(dāng)接近,已經(jīng)具有實際的應(yīng)用價值。
4 結(jié)語
本文以滬深A(yù)股的制造業(yè)上市企業(yè)為研究對象,選取的實驗數(shù)據(jù)樣本為t-3年上市公司年度財務(wù)報表。通過數(shù)據(jù)標(biāo)準(zhǔn)化處理、K-S檢驗、Mann-Whitney U檢驗,分析并構(gòu)建了客觀、適合的財務(wù)指標(biāo)體系。經(jīng)過KMO與巴特利特球形檢驗確定主成分分析方法的適用性。最終使用主成分分析提取8個主成分,降低變量間相關(guān)性,提高了預(yù)測結(jié)果的準(zhǔn)確性。
主成分分析與樸素貝葉斯的有效結(jié)合消除了樣本間的線性相關(guān)關(guān)系,既降低了數(shù)據(jù)維度,又提高了模型的泛化性能,對樣本數(shù)量偏少同時數(shù)據(jù)維度較高的財務(wù)數(shù)據(jù)有很好的適用性。最后,PCA-NBC上市公司財務(wù)風(fēng)險預(yù)警模型預(yù)測準(zhǔn)確率已經(jīng)達到87.8%,超過二次判別分析和KNN模型,與PCA-邏輯回歸、PCA-SVM模型的預(yù)測準(zhǔn)確率十分接近,適用于制造業(yè)上市企業(yè)的財務(wù)風(fēng)險預(yù)警。
【參考文獻】
【1】任廣乾.企業(yè)財務(wù)危機的董事會決策行為因素及其預(yù)警[J].中南財經(jīng)政法大學(xué)學(xué)報,2018(6):52-61.
【2】操瑋,李燦,朱衛(wèi)東.多源信息融合視角下中小企業(yè)財務(wù)危機預(yù)警研究——基于集成學(xué)習(xí)的數(shù)據(jù)挖掘方法[J].財會通訊,2018(5):95-99+129.
【3】Yang, Chen, Wenping, et al. Using Bayesian model averaging to estimate terrestrial evapotranspiration in China[J]. Journal of Hydrology, 2015, 528:537-549.
【4】張亮,張玲玲,陳懿冰,等.基于信息融合的數(shù)據(jù)挖掘方法在公司財務(wù)預(yù)警中的應(yīng)用[J].中國管理科學(xué),2015,23(10):170-176.
【5】康洋平.企業(yè)財務(wù)指標(biāo)體系構(gòu)建及其運用[J].科技經(jīng)濟導(dǎo)刊,2021,29(19):237-238.
【6】劉玉敏,劉莉,任廣乾.基于非財務(wù)指標(biāo)的上市公司財務(wù)預(yù)警研究[J].商業(yè)研究,2016(10):87-92.
【7】石先兵.基于PCA-SVM的企業(yè)財務(wù)危機預(yù)警模型構(gòu)建[J].財會通訊,2020(10):131-134.
【8】劉玉敏,申李瑩,任廣乾.基于PCA-PSO-SVM的上市公司財務(wù)危機預(yù)警[J].管理現(xiàn)代化,2017,37(3):12-14.