賈凱
大數(shù)據(jù)、云計(jì)算概念和關(guān)系
(一)大數(shù)據(jù)的概念。大數(shù)據(jù),亦可稱海量資料,是指現(xiàn)在市場(chǎng)上的主流軟件工具都無法在一定的時(shí)間內(nèi)完成分析、處理,并將其轉(zhuǎn)化成為有用信息的海量數(shù)據(jù)。而大數(shù)據(jù)技術(shù)既是指快速高效的從各種復(fù)雜繁多的類型數(shù)據(jù)中獲取有價(jià)值信息的能力。大數(shù)據(jù)具有四個(gè)特點(diǎn):一是數(shù)據(jù)體量級(jí)別躍升,從TB到PB,不單是采集量大,其存儲(chǔ)和計(jì)算量也非常巨大。二是速度快、時(shí)效性高,這是大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)挖掘技術(shù)的最主要區(qū)別,例如用戶在搜索引擎上可以檢索到剛剛發(fā)生的新聞。三是數(shù)據(jù)類型多樣,從海量的結(jié)構(gòu)化數(shù)據(jù),以及位置信息、圖片、視頻、音頻等等各種各樣類型的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中,通過分析計(jì)算,找到數(shù)據(jù)價(jià)值,是大數(shù)據(jù)所要解決的問題。四是價(jià)值密度低,商業(yè)價(jià)值高,隨著信息技術(shù)的快速發(fā)展,各行各業(yè)中互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的應(yīng)用無處不在,產(chǎn)生的數(shù)據(jù)量在幾何倍數(shù)的增加,單一數(shù)據(jù)的呈現(xiàn)并不能產(chǎn)生價(jià)值,二若把相關(guān)數(shù)據(jù)聚集在一起并進(jìn)行深入挖掘就會(huì)產(chǎn)生很高的商業(yè)價(jià)值。在大數(shù)據(jù)的思維下,我們不要抽樣要全體、不要精確要效率、不要因果要相關(guān)。大數(shù)據(jù)改變了人們收集、處理和使用數(shù)據(jù)的方式,促使著會(huì)計(jì)、審計(jì)思維方式的轉(zhuǎn)變,而這些改變則推動(dòng)著財(cái)務(wù)管理模式的轉(zhuǎn)變,影響著審計(jì)技術(shù)和手段的發(fā)展。
(二)云計(jì)算的概念。云計(jì)算是虛擬化(Virtualization)、效用計(jì)算(Utility Computing)、基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺(tái)即服務(wù)(PaaS)、軟件即服務(wù)(SaaS)等概念混合演進(jìn)并躍升的結(jié)果,是一種新興的共享基礎(chǔ)架構(gòu)的方法,它最核心的技術(shù)就是將大量用網(wǎng)絡(luò)連接的計(jì)算資源統(tǒng)一管理和調(diào)度,構(gòu)成一個(gè)計(jì)算資源池對(duì)用戶提供按需服務(wù),提供資源的網(wǎng)絡(luò)被稱為“云”。在云計(jì)算的環(huán)境下,為了使用戶能夠快速、便捷、準(zhǔn)確、高效的訪問“云”中的數(shù)據(jù),云計(jì)算的服務(wù)供應(yīng)商不僅要能夠提供給用戶足夠大的存儲(chǔ)空間,還要能夠提供速度快、準(zhǔn)確性高的計(jì)算能力,將服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)和各種應(yīng)用軟件集中在一個(gè)資源共享空間內(nèi),使用戶能夠隨時(shí)隨地通過互聯(lián)網(wǎng)訪問數(shù)據(jù),并將用戶每一次處理的數(shù)據(jù)保存在互聯(lián)網(wǎng)的數(shù)據(jù)中心,方便用戶以后隨時(shí)調(diào)取使用。這種模式使得管理費(fèi)用大大降低,應(yīng)用體驗(yàn)感受大幅提升。
(三)大數(shù)據(jù)和云計(jì)算的關(guān)系。大數(shù)據(jù)和云計(jì)算可以看作是一個(gè)硬幣的正反兩面。大數(shù)據(jù)的特點(diǎn)決定了普通的單臺(tái)計(jì)算機(jī)無法滿足其功能需求對(duì)數(shù)據(jù)進(jìn)行有效處理,而必須采用分布式計(jì)算架構(gòu),依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫、云存儲(chǔ)和虛擬化技術(shù),對(duì)海量數(shù)據(jù)進(jìn)行有效挖掘,找到有價(jià)值信息。大數(shù)據(jù)技術(shù)的重點(diǎn)在于對(duì)海量數(shù)據(jù)的存儲(chǔ)能力,同時(shí)提供數(shù)據(jù)采集、挖掘、分析的技術(shù)和方法,它著眼于“數(shù)據(jù)”,專注點(diǎn)在實(shí)際業(yè)務(wù)中。云計(jì)算技術(shù)的重點(diǎn)在于對(duì)海量數(shù)據(jù)的計(jì)算能力,也就是數(shù)據(jù)處理能力,它著眼于“計(jì)算”。大數(shù)據(jù)的海量數(shù)據(jù)存儲(chǔ)和云計(jì)算的海量數(shù)據(jù)處理是相輔相成、缺一不可的,二者只有同時(shí)作用于數(shù)據(jù)時(shí)才能使相關(guān)數(shù)據(jù)產(chǎn)生價(jià)值。
大數(shù)據(jù)、云計(jì)算對(duì)政府審計(jì)的影響
(一)擴(kuò)大政府審計(jì)范圍。現(xiàn)階段的政府審計(jì)工作,由于技術(shù)手段和從業(yè)人員的專業(yè)水平限制,無法對(duì)被審單位的所有數(shù)據(jù)進(jìn)行梳理和辨別,通常是根據(jù)重要性水平,抽樣進(jìn)行審計(jì)分析。而在大數(shù)據(jù)時(shí)代,云計(jì)算技術(shù)的不斷發(fā)展,使得審計(jì)的樣本量不斷擴(kuò)大,從傳統(tǒng)的抽樣審計(jì)逐漸過渡到全覆蓋審計(jì),因此可以規(guī)避掉審計(jì)抽樣風(fēng)險(xiǎn)。同時(shí),審計(jì)范圍的擴(kuò)大,也對(duì)數(shù)據(jù)的存儲(chǔ)、分析和挖掘力起到一個(gè)推動(dòng)作用,使得大數(shù)據(jù)審計(jì)的技術(shù)能力不斷發(fā)展。
(二)豐富政府審計(jì)數(shù)據(jù)。傳統(tǒng)政府審計(jì)的數(shù)據(jù)主要為財(cái)務(wù)、業(yè)務(wù)等企業(yè)內(nèi)部的結(jié)構(gòu)化數(shù)據(jù),但對(duì)企業(yè)的規(guī)章制度、會(huì)議記錄等非結(jié)構(gòu)化的數(shù)據(jù)應(yīng)用較少,且人為影響因素較大。在云計(jì)算平臺(tái)下,數(shù)據(jù)存儲(chǔ)空間及處理速度大幅度提升,對(duì)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的處理水平也大大提高,因此可用數(shù)據(jù)越來越多,數(shù)據(jù)來源更為廣泛,快速、便捷、高效的獲取非標(biāo)準(zhǔn)化數(shù)據(jù)和各種類型的外部數(shù)據(jù)成為可能。
(三)促進(jìn)政府審計(jì)成果應(yīng)用。當(dāng)前,擁有固定的格式,且內(nèi)容相對(duì)單一、信息量相對(duì)較少的審計(jì)報(bào)告仍然是審計(jì)工作的最主要的成果。隨著大數(shù)據(jù)、云計(jì)算技術(shù)在審計(jì)中廣泛應(yīng)用,審計(jì)工作進(jìn)行過程中產(chǎn)生的各種信息數(shù)據(jù)也逐漸被重視。通過對(duì)這些數(shù)據(jù)的深入挖掘,并與內(nèi)控、薪酬等等規(guī)章制度,以及外部數(shù)據(jù)的關(guān)聯(lián),能夠從中找出財(cái)務(wù)、業(yè)務(wù)和經(jīng)營管理等方面存在的問題和發(fā)展趨勢(shì),總結(jié)出內(nèi)在規(guī)律,并將其匯總歸納為宏觀性和綜合性較強(qiáng)的審計(jì)信息,提供給被審計(jì)單位的管理層和決策層,從而通過審計(jì)促進(jìn)被審單位完善內(nèi)部制度、提高管理水平,同時(shí)提高審計(jì)成果的綜合應(yīng)用效果。此外,大數(shù)據(jù)、云計(jì)算技術(shù)還能夠?qū)徲?jì)過程中發(fā)現(xiàn)的問題規(guī)則化并固化到系統(tǒng)中,并通過與同行業(yè)標(biāo)桿企業(yè)相同問題進(jìn)行對(duì)比,設(shè)置預(yù)警模型,向被審計(jì)單位進(jìn)行預(yù)警。
(四)加速大數(shù)據(jù)審計(jì)師培養(yǎng)?,F(xiàn)階段的政府審計(jì)工作要求審計(jì)人員掌握相應(yīng)的會(huì)計(jì)、審計(jì)知識(shí),具備過硬的專業(yè)素質(zhì)和職業(yè)道德,同時(shí)擁有一定的審計(jì)經(jīng)驗(yàn)。但是,在大數(shù)據(jù)、云計(jì)算時(shí)代,數(shù)據(jù)的真實(shí)性是一切的基石,倘若數(shù)據(jù)不真實(shí),那么無論怎么計(jì)算都不能得到有價(jià)值的結(jié)果,因此,對(duì)數(shù)據(jù)真實(shí)性的驗(yàn)證就成了重中之重。在這樣的前提下,就產(chǎn)生了數(shù)據(jù)審計(jì)師這一職業(yè)。數(shù)據(jù)審計(jì)師除了能熟練掌握審計(jì)相關(guān)知識(shí)以外,還應(yīng)該是數(shù)學(xué)、統(tǒng)計(jì)學(xué)、以及計(jì)算機(jī)科學(xué)等領(lǐng)域的專家,應(yīng)該具備大數(shù)據(jù)分析和預(yù)測(cè)的評(píng)估能力,同時(shí)也要與審計(jì)人員一同恪守職業(yè)道德。
大數(shù)據(jù)政府審計(jì)實(shí)施框架
大數(shù)據(jù)環(huán)境下政府審計(jì)的主要任務(wù)是通過構(gòu)建一個(gè)支撐平臺(tái),實(shí)現(xiàn)對(duì)審計(jì)數(shù)據(jù)的分析和處理,將審計(jì)系統(tǒng)和數(shù)據(jù)挖掘技術(shù)結(jié)合起來,找到結(jié)合的突破口。運(yùn)用大數(shù)據(jù)技術(shù)對(duì)被審計(jì)單位運(yùn)行過程中產(chǎn)生的大量業(yè)務(wù)數(shù)據(jù)與財(cái)務(wù)數(shù)據(jù),以及與被審單位相關(guān)的外部數(shù)據(jù)進(jìn)行深入的分析,形成疑點(diǎn)數(shù)據(jù),取得審計(jì)線索?;谝陨侠斫?,本文根據(jù)審計(jì)項(xiàng)目實(shí)施流程,構(gòu)建了一個(gè)大數(shù)據(jù)時(shí)代審計(jì)實(shí)施框架,見下圖:
大數(shù)據(jù)環(huán)境下的政府審計(jì)是按照統(tǒng)一的行業(yè)審計(jì)模型,通過云平臺(tái)數(shù)據(jù)中心來實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)轉(zhuǎn)換、模型和方法制作,并利用數(shù)據(jù)之間的相關(guān)關(guān)系得出相應(yīng)的審計(jì)線索。審計(jì)部門可以從云平臺(tái)數(shù)據(jù)中心,調(diào)出被審計(jì)單位的數(shù)據(jù),并通過云平臺(tái)審計(jì)系統(tǒng)進(jìn)行數(shù)據(jù)的分析和處理。
(一)數(shù)據(jù)采集。大數(shù)據(jù)審計(jì)實(shí)施的基礎(chǔ)是數(shù)據(jù)采集,以審計(jì)目標(biāo)為出發(fā)點(diǎn),在被審計(jì)單位內(nèi)部的企業(yè)資源計(jì)劃系統(tǒng)(ERP)及業(yè)務(wù)管理系統(tǒng)(EIS)中,采集與審計(jì)目標(biāo)相關(guān)的各種類型數(shù)據(jù),同時(shí)通過網(wǎng)絡(luò)將被審計(jì)單位內(nèi)部各個(gè)系統(tǒng)與審計(jì)系統(tǒng)直接鏈接起來,審計(jì)人員就可以通過審計(jì)系統(tǒng)直接訪問被審計(jì)單位的內(nèi)部各系統(tǒng),進(jìn)而修復(fù)、篩選出真實(shí)、可靠、相關(guān)的審計(jì)數(shù)據(jù),形成數(shù)據(jù)層。
(二)數(shù)據(jù)清洗。首先對(duì)收集來的源數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、清洗、集成,加載,再通過ODS、DM、OLAP等數(shù)據(jù)分析與數(shù)據(jù)挖掘技術(shù)對(duì)清洗過的數(shù)據(jù)進(jìn)行有針對(duì)性加工,提煉出有價(jià)值合乎審計(jì)目標(biāo)的數(shù)據(jù)。
(三)數(shù)據(jù)存儲(chǔ)。清洗過的數(shù)據(jù)采用分布式存儲(chǔ)的方式存儲(chǔ)在數(shù)據(jù)中心。
(四)數(shù)據(jù)分析。通過邏輯數(shù)據(jù)模型對(duì)清洗過的數(shù)據(jù)進(jìn)行重構(gòu),形成多個(gè)數(shù)據(jù)倉庫,并在數(shù)據(jù)倉庫中進(jìn)行存儲(chǔ)和管理,形成審計(jì)數(shù)據(jù)庫。審計(jì)數(shù)據(jù)庫使用多維數(shù)據(jù)模型進(jìn)行數(shù)據(jù)建模,在基于云計(jì)算平臺(tái)的審計(jì)數(shù)據(jù)挖掘中,數(shù)據(jù)庫的訪問信息目錄由元數(shù)據(jù)提供,這個(gè)目錄可以精準(zhǔn)的定位源數(shù)據(jù)和數(shù)據(jù)庫中的內(nèi)容,也可以對(duì)數(shù)據(jù)倉庫服務(wù)器中的數(shù)據(jù)進(jìn)行存儲(chǔ)和更新。
云平臺(tái)中的模型方法將輸入的原始數(shù)據(jù)過分析計(jì)算轉(zhuǎn)化為審計(jì)需要的信息,以發(fā)現(xiàn)審計(jì)線索或支持審計(jì)取證。從云平臺(tái)獲取處理過的審計(jì)數(shù)據(jù),根據(jù)正確的設(shè)定值計(jì)算,判斷審計(jì)業(yè)務(wù)的性質(zhì)。在對(duì)其進(jìn)行確認(rèn)驗(yàn)證后,得出具體審計(jì)結(jié)果。
(作者單位:陜西省審計(jì)廳)