謝景偉 程華安
(1.湖南大眾傳媒職業(yè)技術(shù)學(xué)院財(cái)務(wù)建設(shè)處,湖南長(zhǎng)沙410100;2.湖南大眾傳媒職業(yè)技術(shù)學(xué)院管理學(xué)院,湖南長(zhǎng)沙410100)
基于數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)的計(jì)算機(jī)審計(jì)模型構(gòu)建
謝景偉1程華安2
(1.湖南大眾傳媒職業(yè)技術(shù)學(xué)院財(cái)務(wù)建設(shè)處,湖南長(zhǎng)沙410100;2.湖南大眾傳媒職業(yè)技術(shù)學(xué)院管理學(xué)院,湖南長(zhǎng)沙410100)
利用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)建立計(jì)算機(jī)審計(jì)模型,解決了數(shù)據(jù)存儲(chǔ)量的問題,數(shù)據(jù)倉(cāng)庫(kù)按照多維數(shù)據(jù)集的方式存儲(chǔ)數(shù)據(jù),并建立索引,審計(jì)人員可以高效、快速地訪問被審計(jì)單位的數(shù)據(jù);同時(shí),采用數(shù)據(jù)挖掘技術(shù),可以對(duì)審計(jì)數(shù)據(jù)進(jìn)行全方位、多角度、深層次的分析,快速發(fā)現(xiàn)審計(jì)線索,提高審計(jì)人員工作效率,是對(duì)傳統(tǒng)審計(jì)模型的一次突破。
數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)挖掘技術(shù);審計(jì)模型;構(gòu)建
隨著計(jì)算機(jī)技術(shù)的廣泛應(yīng)用,高職院校的內(nèi)部審計(jì)工作也由傳統(tǒng)的手工審計(jì)向計(jì)算機(jī)審計(jì)轉(zhuǎn)變,審計(jì)人員能通過軟件獲取所需的審計(jì)數(shù)據(jù),但憑個(gè)人的經(jīng)驗(yàn)面對(duì)審計(jì)軟件提取的大量數(shù)據(jù)有點(diǎn)無能為力,這對(duì)保證審計(jì)質(zhì)量增加了一定的風(fēng)險(xiǎn)。如何通過計(jì)算機(jī)技術(shù)幫助審計(jì)人員從海量數(shù)據(jù)中提取審計(jì)所需要的信息,利用數(shù)據(jù)之間隱藏的關(guān)系發(fā)現(xiàn)問題進(jìn)行重點(diǎn)審計(jì),提高審計(jì)質(zhì)量,達(dá)到審計(jì)目的,是亟待解決的問題。本文探討如何利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和數(shù)據(jù)挖掘技術(shù)為審計(jì)人員快速、準(zhǔn)確地提供數(shù)據(jù)的綜合信息,構(gòu)建計(jì)算機(jī)審計(jì)模型,以加快審計(jì)速度,提高審計(jì)質(zhì)量。
(一)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)
一般審計(jì)軟件的數(shù)據(jù)庫(kù)大多是以表格的形式存儲(chǔ)日常處理過程中產(chǎn)生的數(shù)據(jù),審計(jì)人員能按需求進(jìn)行簡(jiǎn)單的存儲(chǔ)、分析、查詢等操作。但隨著電子技術(shù)特別是計(jì)算機(jī)技術(shù)的飛速發(fā)展,單位業(yè)務(wù)基本都通過計(jì)算機(jī)來完成,加之業(yè)務(wù)量不斷增大,需要處理的數(shù)據(jù)不斷增加,信息更加復(fù)雜,傳統(tǒng)的數(shù)據(jù)庫(kù)已不能滿足復(fù)雜的數(shù)據(jù)分析、處理的要求。對(duì)不同類型的數(shù)據(jù)進(jìn)行分離、存儲(chǔ),特別是將分析型數(shù)據(jù)和操作型數(shù)據(jù)分離,對(duì)分析型數(shù)據(jù)按照審計(jì)的需要進(jìn)行二次處理,建立相對(duì)獨(dú)立的分析環(huán)境,對(duì)數(shù)據(jù)進(jìn)行分析,就形成了數(shù)據(jù)倉(cāng)庫(kù)。它著重于數(shù)據(jù)的綜合分析,是圍繞著審計(jì)主題的數(shù)據(jù)存儲(chǔ)介質(zhì)。倉(cāng)庫(kù)中的數(shù)據(jù)是相對(duì)穩(wěn)定、高度集中的,能按照審計(jì)主題進(jìn)行組織,隨時(shí)間的變化不斷更新。數(shù)據(jù)倉(cāng)庫(kù)以存儲(chǔ)的數(shù)據(jù)為基礎(chǔ),利用多種數(shù)據(jù)處理工具完成重要信息的提取,以滿足不同審計(jì)主題對(duì)于分析型數(shù)據(jù)的要求,能擴(kuò)大數(shù)據(jù)的存儲(chǔ),并加強(qiáng)數(shù)據(jù)管理,保證數(shù)據(jù)的完全一致性,支持多種方式的分析,由管理部分、存儲(chǔ)部分和應(yīng)用部分組成。
(二)數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù)是從數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)等數(shù)據(jù)存儲(chǔ)介質(zhì)中挖掘隱含的、潛在的、有用的知識(shí),以輔助決策或更新原有知識(shí),它是一個(gè)完整、可重復(fù)的過程。它通過明確業(yè)務(wù)、數(shù)據(jù)的選取、預(yù)處理、轉(zhuǎn)換、挖掘、分析等過程,發(fā)現(xiàn)數(shù)據(jù)的關(guān)聯(lián)關(guān)系,對(duì)數(shù)據(jù)進(jìn)行分類、預(yù)測(cè)、聚類,發(fā)現(xiàn)孤立點(diǎn),發(fā)現(xiàn)數(shù)據(jù)的規(guī)律和趨勢(shì),從而在未被發(fā)現(xiàn)或者沒有明確假設(shè)條件的情況下發(fā)現(xiàn)知識(shí),挖掘有用信息。
由此看來,如果將兩者結(jié)合起來,在數(shù)據(jù)倉(cāng)庫(kù)中運(yùn)用數(shù)據(jù)挖掘技術(shù)可以產(chǎn)生更好的分析結(jié)果,發(fā)現(xiàn)更復(fù)雜、更有價(jià)值的信息。兩者相輔相成又各有差異,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的發(fā)展促使數(shù)據(jù)挖掘技術(shù)的發(fā)展,但數(shù)據(jù)挖掘技術(shù)不一定必須依賴于數(shù)據(jù)倉(cāng)庫(kù)技術(shù),它也可直接從審計(jì)軟件的數(shù)據(jù)庫(kù)或其他存儲(chǔ)介質(zhì)中挖掘數(shù)據(jù)。若將兩者結(jié)合應(yīng)用,將使數(shù)據(jù)挖掘更加精、準(zhǔn)、快。
如前所述,將數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)結(jié)合起來,針對(duì)現(xiàn)有計(jì)算機(jī)審計(jì)模型的不足,能夠構(gòu)建出適合現(xiàn)有審計(jì)環(huán)境的新型計(jì)算機(jī)審計(jì)模型,提高審計(jì)質(zhì)量和服務(wù)效率(見下圖)。
圖 基于數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)的計(jì)算機(jī)審計(jì)模型
該模型主要由信息收集系統(tǒng)、數(shù)據(jù)倉(cāng)庫(kù)、分析系統(tǒng)和數(shù)據(jù)服務(wù)系統(tǒng)組成。
(一)信息收集系統(tǒng)
主要是在審計(jì)前期階段通過不同途徑廣、快、精、準(zhǔn)地獲取各類審計(jì)信息,包括初始電子數(shù)據(jù)、初始紙質(zhì)數(shù)據(jù)、初始外部數(shù)據(jù),收集好后進(jìn)行簡(jiǎn)單的處理,為數(shù)據(jù)倉(cāng)庫(kù)提供基礎(chǔ)數(shù)據(jù)。
(二)審計(jì)數(shù)據(jù)倉(cāng)庫(kù)
主要是對(duì)信息系統(tǒng)中提取的信息進(jìn)行清理、轉(zhuǎn)換、載入等處理,并將這些信息按審計(jì)主題進(jìn)行存儲(chǔ),同時(shí)將這些信息按審計(jì)主題的需要,多角度、多層次地以交叉表、直方圖等多種形式展現(xiàn)出來,為審計(jì)分析做好準(zhǔn)備。
(三)審計(jì)分析系統(tǒng)
主要由簡(jiǎn)單分析工具、多維分析工具、挖掘模塊和知識(shí)庫(kù)組成。其中簡(jiǎn)單分析工具主要借鑒查詢和統(tǒng)計(jì)技術(shù),為審計(jì)提供報(bào)表分析和數(shù)據(jù)查詢;多維分析工具主要采用統(tǒng)計(jì)圖形、多維方式的報(bào)表顯示數(shù)據(jù),便于審計(jì)中對(duì)數(shù)據(jù)進(jìn)行逐層細(xì)化和深入分析;挖掘模塊主要集中了該技術(shù)中的多種算法,將不同算法按類進(jìn)行封裝,方便按審計(jì)主題調(diào)用數(shù)據(jù);知識(shí)庫(kù)主要是利用庫(kù)中已存儲(chǔ)的審計(jì)規(guī)則、挖掘出的有效數(shù)據(jù)、審計(jì)人員的審計(jì)經(jīng)驗(yàn)積累等為審計(jì)快速發(fā)現(xiàn)有價(jià)值數(shù)據(jù)提供幫助。
(四)審計(jì)數(shù)據(jù)服務(wù)
主要是對(duì)審計(jì)分析系統(tǒng)中所獲取的數(shù)據(jù)進(jìn)行評(píng)價(jià),按照審計(jì)主題,確定審計(jì)重點(diǎn),分析結(jié)果展示,形成審計(jì)報(bào)告。
(一)信息收集系統(tǒng)
信息收集系統(tǒng)是模型中計(jì)算機(jī)審計(jì)的輸入系統(tǒng),它由不同的數(shù)據(jù)服務(wù)器組成。被審計(jì)單位的所有信息,按照獲取的方式、來源、類型不同,系統(tǒng)將這些信息進(jìn)行分類后,裝入不同的數(shù)據(jù)服務(wù)器,為審計(jì)過程中獲取有用數(shù)據(jù)清除障礙。該系統(tǒng)的數(shù)據(jù)按來源不同采用不同的方式獲取。
1.內(nèi)部信息。如果審計(jì)單位和被審計(jì)單位使用的系統(tǒng)相同,則只需將兩個(gè)系統(tǒng)對(duì)接,采用直接讀取數(shù)據(jù)的方式即可。若雖系統(tǒng)不同,但審計(jì)單位的信息系統(tǒng)可以直接訪問被審計(jì)單位信息系統(tǒng)的數(shù)據(jù)庫(kù),也可采用直接讀取數(shù)據(jù)的方式。如果不能采用上述兩種方式,則需要采用專用的導(dǎo)入導(dǎo)出工具將不同類型的數(shù)據(jù)先轉(zhuǎn)換成標(biāo)準(zhǔn)格式的數(shù)據(jù),然后再轉(zhuǎn)換成審計(jì)信息系統(tǒng)所需格式的數(shù)據(jù)。
2.外部信息。將外部信息轉(zhuǎn)換成標(biāo)準(zhǔn)格式,壓縮、加密后通過網(wǎng)絡(luò)傳輸,再將其解壓,利用轉(zhuǎn)換工具將其轉(zhuǎn)換成系統(tǒng)所需的格式。
3.移動(dòng)存儲(chǔ)介質(zhì)上的信息。一般是按標(biāo)準(zhǔn)格式存儲(chǔ)的,只需利用轉(zhuǎn)換工具將其轉(zhuǎn)換成系統(tǒng)所需的格式即可。
(二)數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù)是該模型中的重要組成部分,是對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)、分類、簡(jiǎn)單分析的場(chǎng)所。審計(jì)人員需根據(jù)不同的審計(jì)主題設(shè)計(jì)不同的數(shù)據(jù)倉(cāng)庫(kù),按類進(jìn)行存儲(chǔ),提供相對(duì)獨(dú)立的環(huán)境,使數(shù)據(jù)能不斷循還往復(fù)、不斷反饋、不斷完善地進(jìn)行處理和分析。
1.數(shù)據(jù)倉(cāng)庫(kù)模型的設(shè)計(jì)。一是確定審計(jì)主題,審計(jì)人員需對(duì)審計(jì)業(yè)務(wù)進(jìn)行歸納,確定數(shù)據(jù)倉(cāng)庫(kù)的主題,并對(duì)其進(jìn)行審計(jì)事實(shí)的描述和對(duì)事實(shí)信息屬性的描述。二是對(duì)邏輯模型進(jìn)行設(shè)計(jì),設(shè)計(jì)的數(shù)據(jù)倉(cāng)庫(kù)需保證存儲(chǔ)量足夠且不能降低查詢效率。三是對(duì)物理模型進(jìn)行設(shè)計(jì),以確定數(shù)據(jù)的存儲(chǔ)位置和索引策略,按照不同的審計(jì)主題確定存儲(chǔ)位置并設(shè)計(jì)索引字段,為下一步的數(shù)據(jù)查找提供方便。
2.數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)處理的設(shè)計(jì)。一是數(shù)據(jù)清理,主要是指對(duì)不規(guī)范、不完整、不合理、冗余的數(shù)據(jù)按照規(guī)范的格式謹(jǐn)慎進(jìn)行清理,一般對(duì)不同類型的數(shù)據(jù)采用不同的工具進(jìn)行清理,常見的清理工具有Excel、審計(jì)軟件、SQL Server、SQL查詢語言等。對(duì)于不完整的數(shù)據(jù)通過手工輸入進(jìn)行糾正。對(duì)于錯(cuò)誤值,利用統(tǒng)計(jì)分析中的偏差分析、回歸分析、常識(shí)性規(guī)則庫(kù)、簡(jiǎn)單規(guī)則庫(kù)檢查數(shù)值進(jìn)行糾錯(cuò)。二是數(shù)據(jù)轉(zhuǎn)換,指對(duì)清理出來的數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)中找到合適的轉(zhuǎn)換工具,將操作型數(shù)據(jù)轉(zhuǎn)換成分析型數(shù)據(jù),為審計(jì)分析做好準(zhǔn)備。三是數(shù)據(jù)驗(yàn)證,指審計(jì)人員對(duì)數(shù)據(jù)的真實(shí)性、完整性進(jìn)行驗(yàn)證,確保審計(jì)分析可靠。常用的數(shù)據(jù)驗(yàn)證主要有4種方式,利用不同的業(yè)務(wù)規(guī)則、數(shù)據(jù)關(guān)系完整性、統(tǒng)計(jì)抽樣、數(shù)據(jù)記錄的總量或主要變量的統(tǒng)計(jì)等指標(biāo)進(jìn)行驗(yàn)證。
3.多維數(shù)據(jù)庫(kù)的設(shè)計(jì)。經(jīng)過處理的數(shù)據(jù)一般以二維的結(jié)構(gòu)存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中,這就需要審計(jì)人員利用聯(lián)機(jī)分析工具將這些數(shù)據(jù)處理成多維數(shù)據(jù)集存入多維數(shù)據(jù)倉(cāng)庫(kù),以便查詢分析。
(三)數(shù)據(jù)挖掘
對(duì)于一般的數(shù)據(jù),審計(jì)人員只需按照審計(jì)主題設(shè)置一定的篩選條件,采用聯(lián)機(jī)分析處理技術(shù)對(duì)審計(jì)數(shù)據(jù)進(jìn)行分析,并將分析結(jié)果以數(shù)據(jù)和圖表的形式展示出來,快速地實(shí)現(xiàn)審計(jì)分析。對(duì)于復(fù)雜的數(shù)據(jù),審計(jì)人員需要掌握更多的計(jì)算機(jī)挖掘算法,建立挖掘模塊,按照主題的要求選擇合理的挖掘算法,找出有價(jià)值的線索,常用的算法有決策樹法、統(tǒng)計(jì)分析法、關(guān)聯(lián)規(guī)則法、人工神經(jīng)網(wǎng)絡(luò)法等。審計(jì)數(shù)據(jù)經(jīng)數(shù)據(jù)挖掘模塊處理后,數(shù)據(jù)之間將會(huì)存在一定的關(guān)系,主要表現(xiàn)為呈現(xiàn)出一定的規(guī)律或異常,通常把它叫作“知識(shí)”,對(duì)審計(jì)知識(shí)進(jìn)行存儲(chǔ)的系統(tǒng)叫“知識(shí)庫(kù)”。知識(shí)庫(kù)中不但存儲(chǔ)了大量審計(jì)事實(shí),還包含審計(jì)規(guī)則和處理機(jī)制,審計(jì)人員可以直接采用里面的信息進(jìn)行審計(jì)推理,從而得出審計(jì)結(jié)論。
綜上所述,利用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)建立計(jì)算機(jī)審計(jì)模型,解決了數(shù)據(jù)存儲(chǔ)量的問題,數(shù)據(jù)倉(cāng)庫(kù)按照多維數(shù)據(jù)集的方式存儲(chǔ)數(shù)據(jù),并建立索引,審計(jì)人員可以高效、快速地訪問被審計(jì)單位的數(shù)據(jù);同時(shí),采用數(shù)據(jù)挖掘技術(shù),可以對(duì)審計(jì)數(shù)據(jù)進(jìn)行全方位、多角度、深層次的分析,快速發(fā)現(xiàn)審計(jì)線索,提高審計(jì)人員工作效率,是對(duì)傳統(tǒng)審計(jì)模型的一次突破。
(責(zé)任編輯陶新艷)
F239
A
1671-5454(2016)02-0082-03
10.16261/j.cnki.cn43-1370/z.2016.02.023
2016-04-21
謝景偉(1978-),男,湖南望城人,湖南大眾傳媒職業(yè)技術(shù)學(xué)院副教授,研究方向:計(jì)算機(jī)及應(yīng)用技術(shù)研究。程華安(1978-),女,湖南華容人,湖南大眾傳媒職業(yè)技術(shù)學(xué)院副教授,研究方向:財(cái)務(wù)管理應(yīng)用研究。
本文為湖南教育科學(xué)規(guī)劃“十二五”課題研究項(xiàng)目“基于數(shù)字湖南視覺下高職院校計(jì)算機(jī)審計(jì)應(yīng)用研究”(編號(hào):XJK011CZJ084)的研究成果。