【摘要】 文章主要介紹了數(shù)據(jù)挖掘方法在財務分析方面的應用,針對應用中存在的問題,提出了相關的解決措施,以實現(xiàn)數(shù)據(jù)的真實與實時,以及信息涵蓋范圍的廣泛和分析方法的全面。
【關鍵詞】 數(shù)據(jù)挖掘; 財務分析; 神經網絡
一、前言
數(shù)據(jù)挖掘技術是人們長期對數(shù)據(jù)庫技術進行研究和開發(fā)的成果。數(shù)據(jù)挖掘(DM,DataMining)的概念產生于20世紀80年代末,在90年代獲得了長足的發(fā)展。目前,數(shù)據(jù)挖掘技術已經應用到市場分析、政府管理、醫(yī)療衛(wèi)生、科學探索、金融、財經領域中并取得了一定的實效。
財務數(shù)據(jù)挖掘是一種新的財務信息處理技術,其主要特點是能對會計數(shù)據(jù)庫及其它業(yè)務數(shù)據(jù)庫中的大量數(shù)據(jù)進行抽取、轉換、分析及其他模型化處理,從中提取輔助決策的關鍵性數(shù)據(jù)。在企業(yè)的財務狀況分析中應用數(shù)據(jù)挖掘技術,報表使用者可以節(jié)省大量的時間和精力去關注更有用的信息,幫助報表使用者找出隱藏的、未知的、但對了解企業(yè)經營狀況十分有用的信息。
二、應用于財務分析的數(shù)據(jù)挖掘方法
現(xiàn)有研究中,應用于財務分析的數(shù)據(jù)挖掘方法主要有以下幾種:
(一)神經網絡
神經網絡主要應用于財務危機預測和財務狀況評價兩方面。
1.財務危機預測
目前神經網絡在財務危機預測的應用中主要集中在模型的建立和優(yōu)化上。在模型建立方面,通過選取一定的樣本包括ST公司和非ST公司,選取其中一部分作為訓練集,其余的作為測試集。先對訓練集進行歸一化處理,再運用神經網絡算法建立模型,為了驗證模型的預測準確率,用測試集檢驗模型的預測結果。
在模型優(yōu)化方面,一方面不斷改進指標的選取,通過一定的統(tǒng)計方法客觀選取指標,降低主觀性,提高模型的預測準確性;另一方面不斷改進神經網絡算法,把不同的技術引用到模型中從而不斷優(yōu)化模型。
2.財務狀況評價
神經網絡運用到企業(yè)財務狀況評價時,首先都是建立系統(tǒng)的評價指標體系,然后在神經網絡結構和算法研究的基礎上,通過樣本對網絡進行訓練,最后得到穩(wěn)定的結構和權值,從而建立模型。
?。ǘ┠:碚?br/> 目前有關模糊集理論在財務分析的應用主要集中在模糊綜合評價法在企業(yè)財務狀況評價的應用。在運用模糊綜合評價法建立評價模型時,首先要確定因素集,因素集為各種指標體系的集合;其次要確定權重集,權重的確定主要有市場調查法和德爾菲法;再次要建立等級評價標準,評價等級集是評價者對評價對象可能做出的各種評價結果所組成的集合;最后建立模糊評價矩陣,經過運算得到評價結果。
在運用模糊集理論建立評價模型時,一方面需要根據(jù)企業(yè)的具體情況建立因素集和權重系數(shù)矩陣,具有一定的客觀性;另一方面評價集以隸屬度的方式表示,使其評價結果留有余地。
?。ㄈQ策樹
決策樹在財務方面主要應用于財務預警方面。利用決策樹進行數(shù)據(jù)挖掘建模,首先需要進行變量的指定,一般把上市公司是否“特別處理”為目標變量,已選定的財務指標為輸入變量;然后運用軟件建立模型;最后要根據(jù)檢驗樣本進行檢驗。
決策樹作為一種數(shù)據(jù)挖掘技術運用到財務預警中具有較好的預測效果。目前,利用決策樹進行財務預警處于起步階段,如何更好的應用決策樹有很大的研究空間。但是決策樹的輸出變量只能有兩個,只能簡單的預測評價企業(yè)財務狀況好或者不好。
?。ㄋ模┻z傳算法
現(xiàn)有的研究一般把遺傳算法和神經網絡結合在一起,通過遺傳算法的全局尋優(yōu)能力,建立財務困境預測的遺傳神經網絡模型,該模型利用遺傳算法對輸入變量進行了優(yōu)化,比單純的神經網絡模型具有更好的預測能力。
遺傳算法主要適用于數(shù)值優(yōu)化問題,在財務分析中主要運用于具體的問題中,例如內涵報酬率的分析和證券組合選擇分析,它作為一種解決數(shù)值優(yōu)化問題的算法,在數(shù)值優(yōu)化問題中有廣闊的應用前景。
(五)粗糙集
粗糙集理論目前主要運用在財務危機預測中。首先是財務指標的篩選過程,通過計算條件屬性和決策屬性的依賴度,進而確定各條件屬性相對于決策屬性的重要程度,并根據(jù)重要程度對其進行條件屬性約簡;之后,確定篩選后進入預測模型的財務指標的權重,對財務指標重要程度做歸一化處理后得到權重;最后,得到基于粗糙集理論的綜合預測模型,應用預測模型計算對象的綜合預測值。通過實證分析可以看出與傳統(tǒng)判別模型進行比較,基于粗糙集理論的模型預測效果更好。
(六)聚類分析
聚類分析主要是對事先不知道類別的數(shù)據(jù)進行分類,目前對于聚類分析的研究集中到模糊聚類分析。
在對企業(yè)財務狀況進行評價時,大多是運用模糊聚類分析方法,選取一定的財務狀況評價指標,建立模糊聚類分析模型,進行實證分析,形成模糊聚類圖,再將具有財務狀況相似性的行業(yè)進行歸類。
三、數(shù)據(jù)挖掘方法評析
從現(xiàn)有基于數(shù)據(jù)挖掘的財務分析方法可以看出,它們都是以財務報表為基礎,因而存在以下問題:
(一)數(shù)據(jù)采集欠缺真實和滯后
企業(yè)為標榜業(yè)績,常常粉飾財務報告、虛增利潤,使財務報告中的數(shù)據(jù)喪失了真實性,在此基礎上進行的財務分析是不可靠的。此外,財務報告一般是半年報和年報,半年報在半年度結束之后兩個月內報出,年報在年度結束后四個月內報出,缺乏及時的信息跟蹤和反饋控制,存在明顯的滯后性,在這個基礎上進行財務狀況分析具有一定的局限性,從而影響分析的結果。
(二)數(shù)據(jù)挖掘范圍廣泛性不足且分析方法片面
現(xiàn)有的財務狀況分析在根據(jù)財務信息對企業(yè)財務狀況進行定量的分析預測時缺乏非財務信息的輔助分析,使信息涵蓋范圍不夠廣泛。而且,現(xiàn)有的財務狀況分析方法都不能很好的把定性分析與定量分析相結合。
四、數(shù)據(jù)挖掘在財務分析應用的改進
?。ㄒ唬┰跀?shù)據(jù)采集方面
不再是以財務報表的資料為數(shù)據(jù)源,而是從企業(yè)中采集原始數(shù)據(jù),提高數(shù)據(jù)的可信度。當然,會計信息數(shù)據(jù)也可以有多種表現(xiàn)形式,可以是傳統(tǒng)的關系數(shù)據(jù)庫、文本形式的數(shù)據(jù),也可以是面向對象的數(shù)據(jù)庫以及Web數(shù)據(jù)庫等。另外,利用XBRL和WEB挖掘等技術加入了非財務信息和外部信息。這樣,財務分析所需要的財務信息、非財務信息和外部信息可以分別從會計信息系統(tǒng)、管理信息系統(tǒng)和Internet采集。
實時數(shù)據(jù)庫的建立使實時數(shù)據(jù)挖掘成為可能,為企業(yè)財務狀況分析的準確性提供了技術支持。實時數(shù)據(jù)庫是數(shù)據(jù)庫系統(tǒng)發(fā)展的一個分支,它適用于處理不斷更新的快速變化的數(shù)據(jù)及具有時間限制的事務。XBRL開始廣泛的應用,將會促進實時數(shù)據(jù)采集問題的實現(xiàn)。
?。ǘ┰跀?shù)據(jù)挖掘過程中
應綜合運用數(shù)據(jù)挖掘的各種技術,對凈化和轉換過后的數(shù)據(jù)集進行挖掘。將非財務信息納入考察范圍,以擴充信息的涵蓋范圍。
實際運用中,定性分析和定量分析方法并不能截然分開。量的差異在一定程度上反映了質的不同,由于量的分析結果比較簡潔、抽象,通常還要借助于定性的描述,說明其具體的含義;定性分析又是定量分析的基礎,定量分析的量必須是同質的。在需要時,有些定性信息也要進行二次量化,作為定量信息來處理,以提高其精確性。●
【參考文獻】
?。?] 康曉東.基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術[M].北京:機械工業(yè)出版社,2004:131-148.
?。?] 李建鋒.數(shù)據(jù)挖掘在公司財務分析中的應用[J].計算機工程與應用,2005(2).
?。?] 姚靠華,蔣艷輝.基于決策樹的財務預警[J].系統(tǒng)工程,2005(10):102-106.
?。?] 林偉林,林有.數(shù)據(jù)挖掘在上市公司財務狀況分析中的應用[J].市場周刊,2004(10).
?。?] 汪嘉楊,王卓.基于BP神經網絡的企業(yè)效績綜合評價方法[J].成都信息工程學院學報,2004(3):117-121.
?。?] 王世彤.企業(yè)財務綜合分析方法[J].系統(tǒng)工程理論與實踐,1998(12):103-109.