国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)的計(jì)算機(jī)審計(jì)模型構(gòu)建

2016-10-19 03:07:32謝景偉程華安
關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘湖南

謝景偉 程華安

(1.湖南大眾傳媒職業(yè)技術(shù)學(xué)院財(cái)務(wù)建設(shè)處,湖南長(zhǎng)沙410100;2.湖南大眾傳媒職業(yè)技術(shù)學(xué)院管理學(xué)院,湖南長(zhǎng)沙410100)

基于數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)的計(jì)算機(jī)審計(jì)模型構(gòu)建

謝景偉1程華安2

(1.湖南大眾傳媒職業(yè)技術(shù)學(xué)院財(cái)務(wù)建設(shè)處,湖南長(zhǎng)沙410100;2.湖南大眾傳媒職業(yè)技術(shù)學(xué)院管理學(xué)院,湖南長(zhǎng)沙410100)

利用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)建立計(jì)算機(jī)審計(jì)模型,解決了數(shù)據(jù)存儲(chǔ)量的問題,數(shù)據(jù)倉(cāng)庫(kù)按照多維數(shù)據(jù)集的方式存儲(chǔ)數(shù)據(jù),并建立索引,審計(jì)人員可以高效、快速地訪問被審計(jì)單位的數(shù)據(jù);同時(shí),采用數(shù)據(jù)挖掘技術(shù),可以對(duì)審計(jì)數(shù)據(jù)進(jìn)行全方位、多角度、深層次的分析,快速發(fā)現(xiàn)審計(jì)線索,提高審計(jì)人員工作效率,是對(duì)傳統(tǒng)審計(jì)模型的一次突破。

數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)挖掘技術(shù);審計(jì)模型;構(gòu)建

隨著計(jì)算機(jī)技術(shù)的廣泛應(yīng)用,高職院校的內(nèi)部審計(jì)工作也由傳統(tǒng)的手工審計(jì)向計(jì)算機(jī)審計(jì)轉(zhuǎn)變,審計(jì)人員能通過軟件獲取所需的審計(jì)數(shù)據(jù),但憑個(gè)人的經(jīng)驗(yàn)面對(duì)審計(jì)軟件提取的大量數(shù)據(jù)有點(diǎn)無能為力,這對(duì)保證審計(jì)質(zhì)量增加了一定的風(fēng)險(xiǎn)。如何通過計(jì)算機(jī)技術(shù)幫助審計(jì)人員從海量數(shù)據(jù)中提取審計(jì)所需要的信息,利用數(shù)據(jù)之間隱藏的關(guān)系發(fā)現(xiàn)問題進(jìn)行重點(diǎn)審計(jì),提高審計(jì)質(zhì)量,達(dá)到審計(jì)目的,是亟待解決的問題。本文探討如何利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和數(shù)據(jù)挖掘技術(shù)為審計(jì)人員快速、準(zhǔn)確地提供數(shù)據(jù)的綜合信息,構(gòu)建計(jì)算機(jī)審計(jì)模型,以加快審計(jì)速度,提高審計(jì)質(zhì)量。

一、數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和數(shù)據(jù)挖掘技術(shù)

(一)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)

一般審計(jì)軟件的數(shù)據(jù)庫(kù)大多是以表格的形式存儲(chǔ)日常處理過程中產(chǎn)生的數(shù)據(jù),審計(jì)人員能按需求進(jìn)行簡(jiǎn)單的存儲(chǔ)、分析、查詢等操作。但隨著電子技術(shù)特別是計(jì)算機(jī)技術(shù)的飛速發(fā)展,單位業(yè)務(wù)基本都通過計(jì)算機(jī)來完成,加之業(yè)務(wù)量不斷增大,需要處理的數(shù)據(jù)不斷增加,信息更加復(fù)雜,傳統(tǒng)的數(shù)據(jù)庫(kù)已不能滿足復(fù)雜的數(shù)據(jù)分析、處理的要求。對(duì)不同類型的數(shù)據(jù)進(jìn)行分離、存儲(chǔ),特別是將分析型數(shù)據(jù)和操作型數(shù)據(jù)分離,對(duì)分析型數(shù)據(jù)按照審計(jì)的需要進(jìn)行二次處理,建立相對(duì)獨(dú)立的分析環(huán)境,對(duì)數(shù)據(jù)進(jìn)行分析,就形成了數(shù)據(jù)倉(cāng)庫(kù)。它著重于數(shù)據(jù)的綜合分析,是圍繞著審計(jì)主題的數(shù)據(jù)存儲(chǔ)介質(zhì)。倉(cāng)庫(kù)中的數(shù)據(jù)是相對(duì)穩(wěn)定、高度集中的,能按照審計(jì)主題進(jìn)行組織,隨時(shí)間的變化不斷更新。數(shù)據(jù)倉(cāng)庫(kù)以存儲(chǔ)的數(shù)據(jù)為基礎(chǔ),利用多種數(shù)據(jù)處理工具完成重要信息的提取,以滿足不同審計(jì)主題對(duì)于分析型數(shù)據(jù)的要求,能擴(kuò)大數(shù)據(jù)的存儲(chǔ),并加強(qiáng)數(shù)據(jù)管理,保證數(shù)據(jù)的完全一致性,支持多種方式的分析,由管理部分、存儲(chǔ)部分和應(yīng)用部分組成。

(二)數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘技術(shù)是從數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)等數(shù)據(jù)存儲(chǔ)介質(zhì)中挖掘隱含的、潛在的、有用的知識(shí),以輔助決策或更新原有知識(shí),它是一個(gè)完整、可重復(fù)的過程。它通過明確業(yè)務(wù)、數(shù)據(jù)的選取、預(yù)處理、轉(zhuǎn)換、挖掘、分析等過程,發(fā)現(xiàn)數(shù)據(jù)的關(guān)聯(lián)關(guān)系,對(duì)數(shù)據(jù)進(jìn)行分類、預(yù)測(cè)、聚類,發(fā)現(xiàn)孤立點(diǎn),發(fā)現(xiàn)數(shù)據(jù)的規(guī)律和趨勢(shì),從而在未被發(fā)現(xiàn)或者沒有明確假設(shè)條件的情況下發(fā)現(xiàn)知識(shí),挖掘有用信息。

由此看來,如果將兩者結(jié)合起來,在數(shù)據(jù)倉(cāng)庫(kù)中運(yùn)用數(shù)據(jù)挖掘技術(shù)可以產(chǎn)生更好的分析結(jié)果,發(fā)現(xiàn)更復(fù)雜、更有價(jià)值的信息。兩者相輔相成又各有差異,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的發(fā)展促使數(shù)據(jù)挖掘技術(shù)的發(fā)展,但數(shù)據(jù)挖掘技術(shù)不一定必須依賴于數(shù)據(jù)倉(cāng)庫(kù)技術(shù),它也可直接從審計(jì)軟件的數(shù)據(jù)庫(kù)或其他存儲(chǔ)介質(zhì)中挖掘數(shù)據(jù)。若將兩者結(jié)合應(yīng)用,將使數(shù)據(jù)挖掘更加精、準(zhǔn)、快。

二、新型計(jì)算機(jī)審計(jì)模型的構(gòu)建

如前所述,將數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)結(jié)合起來,針對(duì)現(xiàn)有計(jì)算機(jī)審計(jì)模型的不足,能夠構(gòu)建出適合現(xiàn)有審計(jì)環(huán)境的新型計(jì)算機(jī)審計(jì)模型,提高審計(jì)質(zhì)量和服務(wù)效率(見下圖)。

圖 基于數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)的計(jì)算機(jī)審計(jì)模型

該模型主要由信息收集系統(tǒng)、數(shù)據(jù)倉(cāng)庫(kù)、分析系統(tǒng)和數(shù)據(jù)服務(wù)系統(tǒng)組成。

(一)信息收集系統(tǒng)

主要是在審計(jì)前期階段通過不同途徑廣、快、精、準(zhǔn)地獲取各類審計(jì)信息,包括初始電子數(shù)據(jù)、初始紙質(zhì)數(shù)據(jù)、初始外部數(shù)據(jù),收集好后進(jìn)行簡(jiǎn)單的處理,為數(shù)據(jù)倉(cāng)庫(kù)提供基礎(chǔ)數(shù)據(jù)。

(二)審計(jì)數(shù)據(jù)倉(cāng)庫(kù)

主要是對(duì)信息系統(tǒng)中提取的信息進(jìn)行清理、轉(zhuǎn)換、載入等處理,并將這些信息按審計(jì)主題進(jìn)行存儲(chǔ),同時(shí)將這些信息按審計(jì)主題的需要,多角度、多層次地以交叉表、直方圖等多種形式展現(xiàn)出來,為審計(jì)分析做好準(zhǔn)備。

(三)審計(jì)分析系統(tǒng)

主要由簡(jiǎn)單分析工具、多維分析工具、挖掘模塊和知識(shí)庫(kù)組成。其中簡(jiǎn)單分析工具主要借鑒查詢和統(tǒng)計(jì)技術(shù),為審計(jì)提供報(bào)表分析和數(shù)據(jù)查詢;多維分析工具主要采用統(tǒng)計(jì)圖形、多維方式的報(bào)表顯示數(shù)據(jù),便于審計(jì)中對(duì)數(shù)據(jù)進(jìn)行逐層細(xì)化和深入分析;挖掘模塊主要集中了該技術(shù)中的多種算法,將不同算法按類進(jìn)行封裝,方便按審計(jì)主題調(diào)用數(shù)據(jù);知識(shí)庫(kù)主要是利用庫(kù)中已存儲(chǔ)的審計(jì)規(guī)則、挖掘出的有效數(shù)據(jù)、審計(jì)人員的審計(jì)經(jīng)驗(yàn)積累等為審計(jì)快速發(fā)現(xiàn)有價(jià)值數(shù)據(jù)提供幫助。

(四)審計(jì)數(shù)據(jù)服務(wù)

主要是對(duì)審計(jì)分析系統(tǒng)中所獲取的數(shù)據(jù)進(jìn)行評(píng)價(jià),按照審計(jì)主題,確定審計(jì)重點(diǎn),分析結(jié)果展示,形成審計(jì)報(bào)告。

三、主要模塊的功能實(shí)現(xiàn)

(一)信息收集系統(tǒng)

信息收集系統(tǒng)是模型中計(jì)算機(jī)審計(jì)的輸入系統(tǒng),它由不同的數(shù)據(jù)服務(wù)器組成。被審計(jì)單位的所有信息,按照獲取的方式、來源、類型不同,系統(tǒng)將這些信息進(jìn)行分類后,裝入不同的數(shù)據(jù)服務(wù)器,為審計(jì)過程中獲取有用數(shù)據(jù)清除障礙。該系統(tǒng)的數(shù)據(jù)按來源不同采用不同的方式獲取。

1.內(nèi)部信息。如果審計(jì)單位和被審計(jì)單位使用的系統(tǒng)相同,則只需將兩個(gè)系統(tǒng)對(duì)接,采用直接讀取數(shù)據(jù)的方式即可。若雖系統(tǒng)不同,但審計(jì)單位的信息系統(tǒng)可以直接訪問被審計(jì)單位信息系統(tǒng)的數(shù)據(jù)庫(kù),也可采用直接讀取數(shù)據(jù)的方式。如果不能采用上述兩種方式,則需要采用專用的導(dǎo)入導(dǎo)出工具將不同類型的數(shù)據(jù)先轉(zhuǎn)換成標(biāo)準(zhǔn)格式的數(shù)據(jù),然后再轉(zhuǎn)換成審計(jì)信息系統(tǒng)所需格式的數(shù)據(jù)。

2.外部信息。將外部信息轉(zhuǎn)換成標(biāo)準(zhǔn)格式,壓縮、加密后通過網(wǎng)絡(luò)傳輸,再將其解壓,利用轉(zhuǎn)換工具將其轉(zhuǎn)換成系統(tǒng)所需的格式。

3.移動(dòng)存儲(chǔ)介質(zhì)上的信息。一般是按標(biāo)準(zhǔn)格式存儲(chǔ)的,只需利用轉(zhuǎn)換工具將其轉(zhuǎn)換成系統(tǒng)所需的格式即可。

(二)數(shù)據(jù)倉(cāng)庫(kù)

數(shù)據(jù)倉(cāng)庫(kù)是該模型中的重要組成部分,是對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)、分類、簡(jiǎn)單分析的場(chǎng)所。審計(jì)人員需根據(jù)不同的審計(jì)主題設(shè)計(jì)不同的數(shù)據(jù)倉(cāng)庫(kù),按類進(jìn)行存儲(chǔ),提供相對(duì)獨(dú)立的環(huán)境,使數(shù)據(jù)能不斷循還往復(fù)、不斷反饋、不斷完善地進(jìn)行處理和分析。

1.數(shù)據(jù)倉(cāng)庫(kù)模型的設(shè)計(jì)。一是確定審計(jì)主題,審計(jì)人員需對(duì)審計(jì)業(yè)務(wù)進(jìn)行歸納,確定數(shù)據(jù)倉(cāng)庫(kù)的主題,并對(duì)其進(jìn)行審計(jì)事實(shí)的描述和對(duì)事實(shí)信息屬性的描述。二是對(duì)邏輯模型進(jìn)行設(shè)計(jì),設(shè)計(jì)的數(shù)據(jù)倉(cāng)庫(kù)需保證存儲(chǔ)量足夠且不能降低查詢效率。三是對(duì)物理模型進(jìn)行設(shè)計(jì),以確定數(shù)據(jù)的存儲(chǔ)位置和索引策略,按照不同的審計(jì)主題確定存儲(chǔ)位置并設(shè)計(jì)索引字段,為下一步的數(shù)據(jù)查找提供方便。

2.數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)處理的設(shè)計(jì)。一是數(shù)據(jù)清理,主要是指對(duì)不規(guī)范、不完整、不合理、冗余的數(shù)據(jù)按照規(guī)范的格式謹(jǐn)慎進(jìn)行清理,一般對(duì)不同類型的數(shù)據(jù)采用不同的工具進(jìn)行清理,常見的清理工具有Excel、審計(jì)軟件、SQL Server、SQL查詢語言等。對(duì)于不完整的數(shù)據(jù)通過手工輸入進(jìn)行糾正。對(duì)于錯(cuò)誤值,利用統(tǒng)計(jì)分析中的偏差分析、回歸分析、常識(shí)性規(guī)則庫(kù)、簡(jiǎn)單規(guī)則庫(kù)檢查數(shù)值進(jìn)行糾錯(cuò)。二是數(shù)據(jù)轉(zhuǎn)換,指對(duì)清理出來的數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)中找到合適的轉(zhuǎn)換工具,將操作型數(shù)據(jù)轉(zhuǎn)換成分析型數(shù)據(jù),為審計(jì)分析做好準(zhǔn)備。三是數(shù)據(jù)驗(yàn)證,指審計(jì)人員對(duì)數(shù)據(jù)的真實(shí)性、完整性進(jìn)行驗(yàn)證,確保審計(jì)分析可靠。常用的數(shù)據(jù)驗(yàn)證主要有4種方式,利用不同的業(yè)務(wù)規(guī)則、數(shù)據(jù)關(guān)系完整性、統(tǒng)計(jì)抽樣、數(shù)據(jù)記錄的總量或主要變量的統(tǒng)計(jì)等指標(biāo)進(jìn)行驗(yàn)證。

3.多維數(shù)據(jù)庫(kù)的設(shè)計(jì)。經(jīng)過處理的數(shù)據(jù)一般以二維的結(jié)構(gòu)存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中,這就需要審計(jì)人員利用聯(lián)機(jī)分析工具將這些數(shù)據(jù)處理成多維數(shù)據(jù)集存入多維數(shù)據(jù)倉(cāng)庫(kù),以便查詢分析。

(三)數(shù)據(jù)挖掘

對(duì)于一般的數(shù)據(jù),審計(jì)人員只需按照審計(jì)主題設(shè)置一定的篩選條件,采用聯(lián)機(jī)分析處理技術(shù)對(duì)審計(jì)數(shù)據(jù)進(jìn)行分析,并將分析結(jié)果以數(shù)據(jù)和圖表的形式展示出來,快速地實(shí)現(xiàn)審計(jì)分析。對(duì)于復(fù)雜的數(shù)據(jù),審計(jì)人員需要掌握更多的計(jì)算機(jī)挖掘算法,建立挖掘模塊,按照主題的要求選擇合理的挖掘算法,找出有價(jià)值的線索,常用的算法有決策樹法、統(tǒng)計(jì)分析法、關(guān)聯(lián)規(guī)則法、人工神經(jīng)網(wǎng)絡(luò)法等。審計(jì)數(shù)據(jù)經(jīng)數(shù)據(jù)挖掘模塊處理后,數(shù)據(jù)之間將會(huì)存在一定的關(guān)系,主要表現(xiàn)為呈現(xiàn)出一定的規(guī)律或異常,通常把它叫作“知識(shí)”,對(duì)審計(jì)知識(shí)進(jìn)行存儲(chǔ)的系統(tǒng)叫“知識(shí)庫(kù)”。知識(shí)庫(kù)中不但存儲(chǔ)了大量審計(jì)事實(shí),還包含審計(jì)規(guī)則和處理機(jī)制,審計(jì)人員可以直接采用里面的信息進(jìn)行審計(jì)推理,從而得出審計(jì)結(jié)論。

綜上所述,利用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)建立計(jì)算機(jī)審計(jì)模型,解決了數(shù)據(jù)存儲(chǔ)量的問題,數(shù)據(jù)倉(cāng)庫(kù)按照多維數(shù)據(jù)集的方式存儲(chǔ)數(shù)據(jù),并建立索引,審計(jì)人員可以高效、快速地訪問被審計(jì)單位的數(shù)據(jù);同時(shí),采用數(shù)據(jù)挖掘技術(shù),可以對(duì)審計(jì)數(shù)據(jù)進(jìn)行全方位、多角度、深層次的分析,快速發(fā)現(xiàn)審計(jì)線索,提高審計(jì)人員工作效率,是對(duì)傳統(tǒng)審計(jì)模型的一次突破。

(責(zé)任編輯陶新艷)

F239

A

1671-5454(2016)02-0082-03

10.16261/j.cnki.cn43-1370/z.2016.02.023

2016-04-21

謝景偉(1978-),男,湖南望城人,湖南大眾傳媒職業(yè)技術(shù)學(xué)院副教授,研究方向:計(jì)算機(jī)及應(yīng)用技術(shù)研究。程華安(1978-),女,湖南華容人,湖南大眾傳媒職業(yè)技術(shù)學(xué)院副教授,研究方向:財(cái)務(wù)管理應(yīng)用研究。

本文為湖南教育科學(xué)規(guī)劃“十二五”課題研究項(xiàng)目“基于數(shù)字湖南視覺下高職院校計(jì)算機(jī)審計(jì)應(yīng)用研究”(編號(hào):XJK011CZJ084)的研究成果。

猜你喜歡
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘湖南
Indoor orchids take the spotlight
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
三線建設(shè)在湖南
湖南是我家
基于數(shù)據(jù)倉(cāng)庫(kù)的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉(cāng)庫(kù)中的設(shè)計(jì)
電子制作(2016年15期)2017-01-15 13:39:15
探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析探索與實(shí)踐
师宗县| 长垣县| 集贤县| 凉山| 永城市| 建始县| 永福县| 左云县| 亳州市| 永川市| 东山县| 仲巴县| 桃园市| 温泉县| 台湾省| 张北县| 偏关县| 澜沧| 招远市| 海宁市| 南投市| 塔城市| 大新县| 茌平县| 丽水市| 博客| 灌阳县| 延寿县| 景洪市| 北安市| 江达县| 双城市| 天门市| 泾源县| 中阳县| 铜陵市| 靖安县| 江永县| 偃师市| 奉化市| 阳城县|