国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

貝葉斯分類模型應(yīng)用于企業(yè)運(yùn)營(yíng)風(fēng)險(xiǎn)預(yù)測(cè)

2017-10-13 05:58:50韓麗娜石昊蘇咸陽(yáng)師范學(xué)院圖形圖像研究所咸陽(yáng)7000西北政法大學(xué)商學(xué)院西安70063
微型電腦應(yīng)用 2017年9期
關(guān)鍵詞:訓(xùn)練樣本貝葉斯概率

韓麗娜, 石昊蘇(.咸陽(yáng)師范學(xué)院 圖形圖像研究所,咸陽(yáng) 7000; .西北政法大學(xué) 商學(xué)院,西安 70063)

貝葉斯分類模型應(yīng)用于企業(yè)運(yùn)營(yíng)風(fēng)險(xiǎn)預(yù)測(cè)

韓麗娜1, 石昊蘇2
(1.咸陽(yáng)師范學(xué)院 圖形圖像研究所,咸陽(yáng) 712000; 2.西北政法大學(xué) 商學(xué)院,西安 710063)

針對(duì)影響企業(yè)運(yùn)營(yíng)因素多,無(wú)法提前預(yù)知結(jié)果、風(fēng)險(xiǎn)大等問(wèn)題,采用貝葉斯分類方法,通過(guò)選取企業(yè)的4個(gè)指標(biāo)作為屬性條件,以企業(yè)運(yùn)營(yíng)狀況(破產(chǎn)或良好)作為目標(biāo),對(duì)40個(gè)訓(xùn)練樣本進(jìn)行貝葉斯分類模型學(xué)習(xí)訓(xùn)練;然后對(duì)4個(gè)測(cè)試樣本以及訓(xùn)練樣本進(jìn)行了預(yù)測(cè)實(shí)驗(yàn),誤判率為10%,精確度較高,測(cè)試樣本也進(jìn)行了歸類。因此應(yīng)用貝葉斯分類模型能夠較好預(yù)測(cè)企業(yè)運(yùn)營(yíng)狀況,減少運(yùn)營(yíng)風(fēng)險(xiǎn),為盡早預(yù)防改善企業(yè)的運(yùn)營(yíng)管理提供參考。

貝葉斯分類模型; 風(fēng)險(xiǎn)預(yù)測(cè); 企業(yè)運(yùn)營(yíng)狀況

Abstract: For the risk of no prediction in advance and many influential factors about enterprise status, Bayesian classification method is selected to predict the risk. By selecting 4 index factors as the property of the enterprise, taking the enterprise operation status (bankruptcy or good) as the target, 40 training samples were input into Bayesian classification model for training. Then the experimental error rate is 10% in the testing of 40 training samples and 4 other samples. Therefore, the Bayesian classification model could forecast the enterprise status in order to reduce operational risk, and provide a reference of early prevention and improvement of the management.

Keywords: Bayes classification model; Risk prediction; Enterprise operation status

0 引言

企業(yè)的競(jìng)爭(zhēng)非常激烈,企業(yè)運(yùn)營(yíng)風(fēng)險(xiǎn)較大,而且影響企業(yè)運(yùn)營(yíng)狀況的因素又很多,如果能借助某種方法建立一套企業(yè)狀況的預(yù)測(cè)趨勢(shì)模型,通過(guò)該模型,企業(yè)能夠及時(shí)發(fā)現(xiàn)財(cái)務(wù)管理中存在的問(wèn)題,及早察覺(jué)財(cái)務(wù)異常的信號(hào),能夠在財(cái)務(wù)狀況異常出現(xiàn)的萌芽狀態(tài)采取有效措施,改善管理,預(yù)防失敗,是非常重要的。為了能夠判斷財(cái)務(wù)狀況出現(xiàn)異常的公司未來(lái)最有可能出現(xiàn)的運(yùn)營(yíng)風(fēng)險(xiǎn)(破產(chǎn)或良好),本文分別選取了20家發(fā)生財(cái)務(wù)危機(jī)的破產(chǎn)企業(yè)和20家保持穩(wěn)定發(fā)展的企業(yè)作為研究訓(xùn)練樣本,通過(guò)分析提取不同組別的樣本公司的4個(gè)財(cái)務(wù)指標(biāo)屬性,構(gòu)建貝葉斯分類預(yù)測(cè)模型,然后對(duì)4家未知企業(yè)進(jìn)行企業(yè)狀況的預(yù)測(cè)。

1 貝葉斯分類概念

1.1 貝葉斯定理

貝葉斯方法是一種概率統(tǒng)計(jì)方法,它計(jì)算每一個(gè)樣本屬于每一類的概率,然后將樣本劃分為具有最大概率的那一類中。即已知樣本x的條件下,計(jì)算其屬于某一類的概率[1]。

1.2 貝葉斯公式中的相關(guān)概率

先驗(yàn)概率P(cj):表示訓(xùn)練樣本數(shù)據(jù)前cj(類別)擁有的初始概率。P(cj)常被稱為cj的先驗(yàn)概率(prior probability) ,它反映cj正確分類時(shí)的經(jīng)驗(yàn)知識(shí),是根據(jù)歷史的資料或主觀判斷所確定的各種事件發(fā)生的概率,它是獨(dú)立于樣本的,樣本的類別總數(shù)用|C|表示[2,3]。如果沒(méi)有這一先驗(yàn)知識(shí),可以將每一候選類別賦予相同的先驗(yàn)概率。但通常采用用樣例中屬于cj的樣例數(shù)|cj|與總樣例數(shù)|D|的比值來(lái)近似表示。如式(1)。

(1)

類條件概率(似然概率):P(X|cj):指當(dāng)已知類別為cj的條件下,出現(xiàn)所考察樣本X的概率,若設(shè)X=,則如式(2)。

P(X|cj)=P(a1,a2,…,am|cj),j∈(1,|C|)

(2)

后驗(yàn)概率P(cj|X):指當(dāng)給定數(shù)據(jù)樣本X,屬于cj類的概率。P(cj|X)被稱為cj的后驗(yàn)概率(posterior probability),它反映先看到數(shù)據(jù)樣本X后cj成立的置信度。使用貝葉斯公式計(jì)算后驗(yàn)概率,如式(3)。

貝葉斯公式:

(3)

由于P(X)對(duì)所有類都是相同的,因此在實(shí)際的應(yīng)用中我們只需計(jì)算貝葉斯公式分子部分,求取最大值,如式(4)所示,然后就把X分到最大值對(duì)應(yīng)的類ccap中,如式(4)。

P(ccap|X)=max(P(X|cj)P(cj))

(4)

1.3 樸素貝葉斯分類器

由于計(jì)算式(2)相當(dāng)困難,所以采用樸素貝葉斯分類器假設(shè),即在給定樣本的目標(biāo)值時(shí)屬性之間的相互獨(dú)立,即式(2)求取的類條件概率就是每個(gè)單獨(dú)屬性對(duì)應(yīng)的概率的乘積 ,如式(5)。

P(X|cj)=P(a1,a2,…,am|cj)=

(5)

因此,對(duì)于樸素貝葉斯學(xué)習(xí)方法就是從訓(xùn)練樣本中估計(jì)不同的P(cj)和P(ai|cj),針對(duì)新的待分樣本實(shí)例,采用公式(4)、(5)進(jìn)行計(jì)算給出分類結(jié)果。

如果屬性為分類屬性,則P(ai|cj)=|sik|/|si|,其中|sik|是D中屬性ak的值為xk的ci類的樣本個(gè)數(shù),|si|是D中屬于ci類的樣本個(gè)數(shù)[4]。

如果屬性為連續(xù)屬性,樸素貝葉斯分類方法使用兩種方法估計(jì)連續(xù)屬性的類條件概率。一種方法是把每個(gè)連續(xù)的屬性離散化,然后用相應(yīng)的離散區(qū)間替換連續(xù)屬性值。另一種方法是可以假設(shè)連續(xù)變量服從某種概率分布,使用訓(xùn)練樣本估計(jì)分布的參數(shù),一般采用正態(tài)分布來(lái)表示類條件概率分布[5],如式(6)。

(6)

1.4 應(yīng)用貝葉斯分類預(yù)測(cè)企業(yè)運(yùn)營(yíng)風(fēng)險(xiǎn)

1.4.1 數(shù)據(jù)準(zhǔn)備

本次收集數(shù)據(jù)為:20個(gè)破產(chǎn)企業(yè)在破產(chǎn)前兩年的年度財(cái)務(wù)數(shù)據(jù)和同時(shí)期20個(gè)財(cái)務(wù)良好的企業(yè)年度數(shù)據(jù),數(shù)據(jù)涉及4個(gè)變量。因此訓(xùn)練樣本為40個(gè)數(shù)據(jù),分為2組,1組為破產(chǎn)企業(yè),2組為良好企業(yè);包含4個(gè)屬性x1表示現(xiàn)金流量/總資產(chǎn),x2表示凈收入/總資產(chǎn),x3表示流動(dòng)資產(chǎn)/流動(dòng)債務(wù),x4表示流動(dòng)資產(chǎn)/凈銷售額,采用貝葉斯分類對(duì)40個(gè)數(shù)據(jù)進(jìn)行挖掘分析,針對(duì)4個(gè)企業(yè)的年度財(cái)務(wù)數(shù)據(jù),預(yù)測(cè)該企業(yè)的運(yùn)營(yíng)狀況[4]。部分企業(yè)年度財(cái)務(wù)數(shù)據(jù),如表1所示。

1.4.2 貝葉斯分類預(yù)測(cè)應(yīng)用步驟

第一步:讀取數(shù)據(jù),整理樣本數(shù)據(jù)并歸一化,得到歸一化后的1組數(shù)據(jù)20項(xiàng),2組數(shù)據(jù)20項(xiàng);待測(cè)數(shù)據(jù)4項(xiàng)。

第二步:求出各組數(shù)據(jù)的均值和方差,根據(jù)公式(6),構(gòu)造兩類數(shù)據(jù)的正態(tài)分布函數(shù)g(x1)和g(x2);

表1 部分企業(yè)年度財(cái)務(wù)數(shù)據(jù)

第三步:將任意一行待測(cè)數(shù)據(jù)代入兩組正態(tài)分布函數(shù)中,分別求出結(jié)果P1(Xi)和P2(Xi)。

第四步:根據(jù)公式(4)比較P1(Xi)和P2(Xi)的大小,將Xi分到最大值對(duì)應(yīng)的組別中。

1.4.3 貝葉斯分類預(yù)測(cè)結(jié)果分析

基于40個(gè)訓(xùn)練樣本,采用貝葉斯分類思想對(duì)未知的4家企業(yè)數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果是41和43號(hào)企業(yè)判歸為1組,他們?yōu)槠飘a(chǎn)企業(yè),42和44號(hào)企業(yè)判歸為2組,他們?yōu)榉瞧飘a(chǎn)企業(yè)。為了計(jì)算機(jī)該貝葉斯分類模型的誤判率,將40個(gè)訓(xùn)練樣本采用此方法進(jìn)行分類,結(jié)果如圖1所示。

其中空心圓圈表示1組的20個(gè)數(shù)據(jù),帶實(shí)心的圈表示2組的20個(gè)數(shù)據(jù),縱坐標(biāo)表示分類組別。我們發(fā)現(xiàn)1組有3個(gè)數(shù)據(jù)發(fā)生了誤判,分別為第13、15、16號(hào)數(shù)據(jù)被盼歸到2組,而2組有13號(hào)數(shù)據(jù)發(fā)生了誤判,被判歸到1組,因此1組的誤判概率估計(jì)值為:3/20=0.15,2組的誤判概率估計(jì)值

(a) 應(yīng)用模型1組樣本分類結(jié)果

(b) 應(yīng)用模型2組樣本分類結(jié)果

為:1/20=0.05。設(shè)兩組的先驗(yàn)概率為0.5,則此貝葉斯分類模型的誤判概率為:=0.5*0.15+0.5*0.05=0.1=10%,基本上滿足分類預(yù)測(cè)的準(zhǔn)確度。

3 總結(jié)

文章論述了貝葉斯分類的基本理論,然后采用貝葉斯方法對(duì)企業(yè)狀況預(yù)測(cè)問(wèn)題進(jìn)行研究。首先選取訓(xùn)練樣本,采用貝葉斯方法建立分類模型進(jìn)行訓(xùn)練,然后將待測(cè)數(shù)據(jù)帶入分類模型并求出結(jié)果。通過(guò)訓(xùn)練樣本對(duì)該模型進(jìn)行測(cè)試評(píng)估,準(zhǔn)確率達(dá)90%。不足之處該模型中樣本數(shù)據(jù)較少,考慮影響企業(yè)狀況的因素不夠全面,還需要進(jìn)一步改進(jìn)。

[1] 郭艷軍.貝葉斯網(wǎng)學(xué)習(xí)方法及應(yīng)用研究[D].武漢:華中科技大學(xué),2009.

[2] 邊平勇,石永奎,張序萍.基于貝葉斯分類器的煤與瓦斯突出強(qiáng)度預(yù)測(cè)研究[J].佳木斯大學(xué)學(xué)報(bào),2013,31(6):890-894.

[3] 李愛(ài)國(guó),厙向陽(yáng).數(shù)據(jù)挖掘原理、算法及應(yīng)用[M].西安:西安電子科技大學(xué)出社,2012:69-72.

[4] 謝中華.MATLAB統(tǒng)計(jì)分析與應(yīng)用[M].北京:北京航空航天大學(xué)出版社,2010,6.

[5] 李堯.基于貝葉斯網(wǎng)絡(luò)的上市公司財(cái)務(wù)狀況異常變動(dòng)趨勢(shì)研究[D].沈陽(yáng):沈陽(yáng)工業(yè)大學(xué),2006.

TheApplicationofBayesClassificationModelinEnterpriseOperationRiskPrediction

Han Lina1, Shi Haosu2
(1. Institute of Graphics and Image Processing, Xianyang Normal University, Xianyang 712000, China;2. School of Business, Northwest University of Political Science and Law, Xi’an 710063, China)

TP399

A

2017.05.30)

陜西省教育廳科研計(jì)劃項(xiàng)目(15JK1776),陜西省計(jì)算機(jī)教育學(xué)會(huì)2016教學(xué)改革項(xiàng)目(013),咸陽(yáng)師范學(xué)院校級(jí)項(xiàng)目(15XSYK047),咸陽(yáng)師范學(xué)院“青藍(lán)”人才工程項(xiàng)目(XSYQL201608)

韓麗娜(1976-),女,陜西富平縣人,教授,博士,CCF會(huì)員,研究方向:數(shù)據(jù)挖掘,圖像處理。 石昊蘇(1976-),男,陜西咸陽(yáng)人,碩士,副教授,研究方向:物證圖像處理,信息管理。

1007-757X(2017)09-0009-02

猜你喜歡
訓(xùn)練樣本貝葉斯概率
第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
概率與統(tǒng)計(jì)(二)
概率與統(tǒng)計(jì)(一)
人工智能
貝葉斯公式及其應(yīng)用
寬帶光譜成像系統(tǒng)最優(yōu)訓(xùn)練樣本選擇方法研究
融合原始樣本和虛擬樣本的人臉識(shí)別算法
基于稀疏重構(gòu)的機(jī)載雷達(dá)訓(xùn)練樣本挑選方法
基于貝葉斯估計(jì)的軌道占用識(shí)別方法
济南市| 香港 | 大姚县| 拜泉县| 蕲春县| 罗城| 普格县| 黑河市| 临清市| 贵阳市| 柯坪县| 河东区| 耿马| 沛县| 福建省| 邵武市| 博罗县| 宣恩县| 绵阳市| 东源县| 龙游县| 山西省| 万山特区| 庆云县| 望奎县| 德保县| 崇礼县| 东安县| 新竹县| 石首市| 西藏| 长葛市| 宜君县| 饶河县| 巩义市| 海南省| 兴义市| 曲麻莱县| 若羌县| 遂平县| 友谊县|