陳星 張宇飛 馬月 張文宇
[摘要]在現(xiàn)代審計過程中,一方面是企業(yè)財務(wù)信息量的極速增長,一方面是對審計工作的要求越來越高。為了在有限的時間內(nèi)高質(zhì)量地完成審計任務(wù),審計抽樣就成為了主要方式。數(shù)據(jù)挖掘是針對當(dāng)數(shù)據(jù)信息量過大時,從中有效地發(fā)現(xiàn)有用數(shù)據(jù),進而進行分析的過程。本文針對審計抽樣的特點,運用數(shù)據(jù)挖掘技術(shù)的思想及相關(guān)算法,為審計抽樣提供了又一種解決方案,將審計抽樣分析技術(shù)提升到一個新的高度。
[關(guān)鍵詞]數(shù)據(jù)挖掘;審計抽樣;運用流程
隨著信息技術(shù)和數(shù)據(jù)庫系統(tǒng)的普及,人們面對的各種數(shù)據(jù)量急劇增加,而數(shù)據(jù)的激增使從中發(fā)現(xiàn)重要信息的難度增大,人們希望能夠運用有效的數(shù)據(jù)分析方法對這些繁亂無章的數(shù)據(jù)進行更深一層次的分析,以便更好地掌握和利用這些數(shù)據(jù),挖掘出對人們有用的信息。在這一情況下,數(shù)據(jù)挖掘(Data Min-ing,DM)技術(shù)應(yīng)運而生并逐漸發(fā)展成熟。
從審計角度來看,在企業(yè)規(guī)模不斷擴大和經(jīng)營復(fù)雜程度不斷提升的今天,審計人員在進行審計時需要面對海量的財務(wù)數(shù)據(jù)。時間與成本的限制,使得審計人員對每一筆交易進行檢查日益變得既不現(xiàn)實,也沒有必要。為了在合理的時間內(nèi)以合理的成本完成審計工作,審計抽樣的運用就變得不可或缺。因此,在審計抽樣領(lǐng)域應(yīng)用數(shù)據(jù)挖掘是審計人員的現(xiàn)實需要。這將有利于解決審計抽樣數(shù)據(jù)的噪音問題,有效地控制審計風(fēng)險、降低審計成本。
審計工作如今越來越制度化、規(guī)范化,進行審計抽樣方法的研究更加有現(xiàn)實意義。數(shù)據(jù)挖掘技術(shù)在一些行業(yè)已有成功的應(yīng)用,但由于審計工作的專業(yè)性較強,涉及審計業(yè)務(wù)的技術(shù)研究相對緩慢,在審計抽樣中的應(yīng)用也不多見。
一、數(shù)據(jù)挖掘技術(shù)的概念和步驟
概括來說,數(shù)據(jù)挖掘是一種特定應(yīng)用的數(shù)據(jù)分析過程,它可以從包含大量冗余信息的數(shù)據(jù)中提取盡可能多的隱藏知識,從而為做出正確的判斷提供基礎(chǔ)。
通過各國學(xué)者多年來的不斷研究,現(xiàn)在已經(jīng)有多種數(shù)據(jù)挖掘技術(shù)存在,用于集中對大量數(shù)據(jù)的抽取和分析??偟膩碚f,數(shù)據(jù)挖掘的任務(wù)及模式有聚類、分類、關(guān)聯(lián)規(guī)則、偏差檢測等。聚類分析可以在事先不規(guī)定分組規(guī)則的情況下,將數(shù)據(jù)按照其自身特征劃分成不同的群組,在不同群組的數(shù)據(jù)間有明顯差別,而每個群組內(nèi)部的數(shù)據(jù)比較相似;分類可以解決的問題是為一個事件或?qū)ο髿w類,在使用上既可以用此模型分析已有的數(shù)據(jù),也可以用它來預(yù)測未來的數(shù)據(jù);關(guān)聯(lián)分析的目的是找出數(shù)據(jù)中隱藏的關(guān)聯(lián)關(guān)系網(wǎng),其生成的規(guī)則一般帶有可信度;偏差檢測對發(fā)現(xiàn)數(shù)據(jù)庫中的異常記錄很有意義。數(shù)據(jù)挖掘技術(shù)中常用的方法有分類、聚類、回歸分析、關(guān)聯(lián)規(guī)則、決策樹、粗糙集等。
數(shù)據(jù)挖掘的基本過程可由以下四個步驟的組成:
(1)問題識別。清晰地識別出領(lǐng)域內(nèi)的特定問題,確定數(shù)據(jù)挖掘的目的。
(2)數(shù)據(jù)準(zhǔn)備。包括數(shù)據(jù)收集及數(shù)據(jù)預(yù)處理,實現(xiàn)對目標(biāo)數(shù)據(jù)集的提取及對數(shù)據(jù)進行再加工。
(3)數(shù)據(jù)挖掘。這是數(shù)據(jù)挖掘過程中最重要的步驟,其工作是使用智能算法,在經(jīng)過加工的數(shù)據(jù)集上進行數(shù)據(jù)挖掘,提取出數(shù)據(jù)模式或規(guī)律知識。
(4)結(jié)果分析。對數(shù)據(jù)挖掘的結(jié)果進行解釋和評價,轉(zhuǎn)換成為用戶所需要的知識。
二、審計抽樣和審計統(tǒng)計抽樣
審計抽樣是指注冊會計師對具有審計相關(guān)性的總體中低于百分之百的項目實施審計程序,使所有抽樣單元都有被選取的機會,為注冊會計師針對整個總體得出結(jié)論提供合理基礎(chǔ)。
審計抽樣應(yīng)當(dāng)具備三個基本特征:(1)對某類交易或賬戶余額中低于百分之百的項目實施審計程序;(2)所有抽樣單元都有相同概率被選取的機會;(3)審計測試的目的是為了評價該賬戶余額或交易類型的某一特征。
審計人員在使用審計抽樣方法時,主要分為三個階段進行。第一階段是樣本設(shè)計階段,旨在根據(jù)測試的目標(biāo)和抽樣總體,制定選取樣本的計劃。第二階段是選取樣本階段,旨在按照適當(dāng)?shù)姆椒◤南鄳?yīng)的抽樣總體中選取所需的樣本,并對其實施檢查,以確定是否存在誤差。第三階段是評價樣本結(jié)果階段,旨在根據(jù)對誤差的性質(zhì)和原因的分析,將樣本結(jié)果推斷至總體,形成對總體的結(jié)論。
審計抽樣包括統(tǒng)計抽樣和非統(tǒng)計抽樣兩種方法。統(tǒng)計抽樣是指同時具備下列特征的抽樣方法:(1)隨機選取樣本項目;(2)運用概率論評價樣本結(jié)果。不同時具備前款提及的兩個特征的抽樣方法為非統(tǒng)計抽樣。
審計人員會根據(jù)具體情況,運用職業(yè)判斷,來選取能夠最有效率的獲取審計證據(jù)的抽樣方法。統(tǒng)計抽樣的優(yōu)點在于能夠客觀地計量抽樣風(fēng)險,并通過調(diào)整樣本規(guī)模來精確地控制風(fēng)險,這也是與非統(tǒng)計抽樣的最主要的區(qū)別。另外,統(tǒng)計抽樣還有助于審計人員高效地設(shè)計樣本,計量所獲取證據(jù)的充分性,以及定量評價樣本結(jié)果,也正是如此,才使數(shù)據(jù)挖掘的運用得以進行。
審計抽樣中數(shù)據(jù)挖掘的運用流程
任何一項審計工作,都不可能也不應(yīng)該去審查總體中的所有樣本,這種做法所花費的時間和費用成本不存在合理性。更重要的是審計人員在限定的時間內(nèi)完成對每個程序收集所有證據(jù),并進行檢查的任務(wù)是不現(xiàn)實的。所以我們需要在大量的可能數(shù)據(jù)中選取其中的一部分作為審計樣本。針對審計抽樣的性質(zhì),綜合考慮數(shù)據(jù)挖掘各種算法的特點,我們可以使用數(shù)據(jù)挖掘中的分類或聚類算法將難以計數(shù)的隨機審計數(shù)據(jù)進行分層,將審計數(shù)據(jù)分成若干層,并且為每一層規(guī)定唯一的編號,再從中選擇若干樣本進行重點分析。這樣,審計人員就有可能使用少量具有代表性的審計樣本,來代替大量相似的審計數(shù)據(jù),從而大大減輕了審計人員的負(fù)擔(dān)。另外,在許多情況下,由于某些未被完全知道的原因,一些單個重大項目需要重點分析,這時使用偏差測試檢驗可以更加容易地發(fā)現(xiàn)關(guān)鍵因素。同時針對不同審計抽樣的特殊性,綜合運用其它方法進行補充。
根據(jù)審計抽樣過程中各種數(shù)據(jù)挖掘算法的運用思想,將審計抽樣的三個階段與數(shù)據(jù)挖掘的四個步驟進行結(jié)合,可以總結(jié)出審計抽樣的數(shù)據(jù)挖掘具體流程,如圖2所示。
(1)問題識別。在這一階段主要內(nèi)容包括確定審計的問題和目標(biāo),掌握解決此類問題的主要方法,確定審計數(shù)據(jù)挖掘目標(biāo)和結(jié)論的評估標(biāo)準(zhǔn)。
(2)數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)收集和預(yù)處理直接決定著審計數(shù)據(jù)挖掘結(jié)論是否正確。由于被審計單位數(shù)據(jù)量過大,審計人員需要在滿足重要性和相關(guān)性的基礎(chǔ)上采樣進行數(shù)據(jù)消減;再針對各種不同類型的數(shù)據(jù)采取相適應(yīng)的數(shù)據(jù)預(yù)處理方法。通過數(shù)據(jù)準(zhǔn)備這一步驟,審計人員將原始數(shù)據(jù)轉(zhuǎn)換為了數(shù)據(jù)挖掘方法所需要的特定的數(shù)據(jù)格式及類型。
(3)數(shù)據(jù)挖掘。這一過程是審計人員在審計問題的發(fā)現(xiàn)過程中的一個關(guān)鍵性步驟。這一步驟包括選擇數(shù)據(jù)挖掘方法、確定訓(xùn)練與檢驗程序、建立模型、驗證發(fā)現(xiàn)的知識等。
(4)結(jié)果分析。根據(jù)審計的問題和目標(biāo)對提取的信息進行分析,把結(jié)果轉(zhuǎn)換為易懂的知識從而提交給審計人員。如果對結(jié)果不滿意,則重復(fù)進行上述過程。
結(jié)束語
在計算機技術(shù)快速發(fā)展的時代,企業(yè)財務(wù)數(shù)據(jù)信息量過于龐大,在進行審計抽樣時,傳統(tǒng)的人工抽樣方式已不再適用,簡單的電算化技術(shù)操作也不能很好地滿足要求。本文從改進審計抽樣的技術(shù)方法出發(fā),運用數(shù)據(jù)挖掘技術(shù)可以快速有效地為審計人員搜集其所需的證據(jù),來實現(xiàn)在審計抽樣的過程中,盡可能地提高效率、降低成本的目標(biāo)。有效地有利于將審計人員從繁雜的審計證據(jù)收集工作中解脫出來,將更多的精力致力投入到職業(yè)判斷中,進行審計決策的制定,有效地保證了審計工作的完成質(zhì)量。
參考文獻(xiàn)
[1]趙磊.數(shù)據(jù)挖掘技術(shù)在財務(wù)分析中的應(yīng)用[J].中國管理信息化,2009,12(2):34-38.
[2]鄒友華.數(shù)據(jù)挖掘在財務(wù)決策中的應(yīng)用[J].現(xiàn)代商貿(mào)工業(yè),2008,4(4):157-158.
[3]孫山澤.抽樣調(diào)查.北京:北京大學(xué)出版社,2004.
[4]中國注冊會計師協(xié)會編.審計[M].北京:中國財政經(jīng)濟出版社,2012.
[5]毛國君、段立娟、王實、石云編著.數(shù)據(jù)挖掘原理與算法(第二版)[M].北京:清華大學(xué)出版社,2007.
[6]張莉.數(shù)據(jù)挖掘技術(shù)及應(yīng)用現(xiàn)狀[J].中國石油人學(xué)勝利學(xué)院學(xué)報,2008,6:34-35.
[7]Patricia L. Smith,Audit and Assessment of SamplingSystems[J].Chemometrics and Intelligent Laboratory Systems.2004,1(74):225-230.