蔡乙萍 舒若敏
摘 要:大數(shù)據(jù)審計是現(xiàn)代審計發(fā)展的必由之路,是國家治理體系和治理能力現(xiàn)代化的重要保證。目前,中國迫切需要一系列比較成熟的方法來構(gòu)建大數(shù)據(jù)審計平臺,以滿足大數(shù)據(jù)時代智能審計的需要。大數(shù)據(jù)審計平臺的構(gòu)建涉及審計理論、大數(shù)據(jù)科學(xué)、計算機科學(xué)等學(xué)科,具有各種適用技術(shù)和復(fù)雜的構(gòu)建機制。本文將大數(shù)據(jù)審計平臺分為收集、預(yù)處理、分析和可視化四個子平臺。在方法支持、過程建模和運行機制的基礎(chǔ)上,對各子平臺進行了專題研究,旨在為大數(shù)據(jù)審計的實踐提供建設(shè)性思路。
關(guān)鍵詞:大數(shù)據(jù)審計 平臺構(gòu)建 數(shù)據(jù)挖掘 過程建模
大數(shù)據(jù)審計是以大數(shù)據(jù)為背景的專業(yè)審計主體,根據(jù)具體規(guī)范,審計科學(xué)和大數(shù)據(jù)科學(xué)程序的使用和方法:通過大數(shù)據(jù)收集,開展獨立監(jiān)督活動,驗證重大財務(wù)事項,業(yè)務(wù)管理活動和被審計單位相關(guān)資料的可靠性。近年來,中國政府高度重視大數(shù)據(jù)審計的建設(shè)。 目前,中國迫切需要一系列豐富的大數(shù)據(jù)審計理論來指導(dǎo)實踐,從而大大提高審計主體利用信息方法挖掘問題的能力,從宏觀上進行評估,判斷和分析。 為此,本文在審計大數(shù)據(jù)采集,預(yù)處理,分析,可視化等模塊的基礎(chǔ)上,深入探討了大數(shù)據(jù)審計平臺的構(gòu)建機制。
一、大數(shù)據(jù)審計平臺建設(shè)的理論分析
大數(shù)據(jù)審計平臺的構(gòu)建遵循系統(tǒng)理論,結(jié)構(gòu)理論,協(xié)同理論和控制理論的思想。大數(shù)據(jù)的關(guān)鍵技術(shù)涵蓋了收集,預(yù)處理,存儲和管理,分析和挖掘,演示和應(yīng)用五個技術(shù)方面。大數(shù)據(jù)審計平臺涵蓋多個子平臺,按照具體邏輯進行集成。為大數(shù)據(jù)處理技術(shù)全面整合到大數(shù)據(jù)審計平臺建設(shè),以平臺為視角展示大數(shù)據(jù)審計。在整個設(shè)計過程中,本文特別以分類為理論基礎(chǔ)的五大技術(shù)將分裂為大數(shù)據(jù)審計集,預(yù)處理,分析和可視化是一個研究的平臺,其中,內(nèi)置的存儲技術(shù)建立子平臺時,必須發(fā)現(xiàn)具體審計的內(nèi)在本質(zhì)和邏輯規(guī)則基于細(xì)節(jié)深入系統(tǒng)地處理大數(shù)據(jù)對象,熟悉其任務(wù)需求。只有這樣才能完成相關(guān)子平臺的過程分解和功能分解,“主題技術(shù)數(shù)據(jù)庫”下的子科學(xué)建立平臺,有效選擇各子平臺的“過程建模小組”,在戰(zhàn)略層面上有效提升大數(shù)據(jù)審計整體平臺建設(shè)的質(zhì)量和水平?;诳鐚W(xué)科理論的視角相互融合并通過四個平臺的分解,加強大數(shù)據(jù)分析的應(yīng)用,嘗試在實際需求下應(yīng)用于平臺的相應(yīng)技術(shù),全力以“應(yīng)用技術(shù)組”為軸,比較分析不同的建模技術(shù),有效地促進了審計實踐的大數(shù)據(jù)路由,抽象和智能化。
二、審計大數(shù)據(jù)采集平臺的建立和運行
在大數(shù)據(jù)時代,審計數(shù)據(jù)收集渠道得到了廣泛的擴展,主要涵蓋了互聯(lián)網(wǎng)平臺下的媒體信息,門戶網(wǎng)站和搜索報價。引擎和社交網(wǎng)絡(luò)數(shù)據(jù);正在審查的單位的貨幣數(shù)據(jù),以及一系列非貨幣數(shù)據(jù),如業(yè)務(wù)戰(zhàn)略,技術(shù)研發(fā),社會關(guān)系,治理能力和組織環(huán)境;經(jīng)驗數(shù)據(jù),業(yè)務(wù)數(shù)據(jù),管理 審計實體內(nèi)的數(shù)據(jù)和預(yù)測數(shù)據(jù);其他渠道,如日志數(shù)據(jù),傳感器數(shù)據(jù),經(jīng)濟數(shù)據(jù),行業(yè)數(shù)據(jù),政策數(shù)據(jù)等。審計大數(shù)據(jù)不是上述渠道的分散收購和機械化,而是 在特定邏輯框架下整合指導(dǎo)本地化和有機集成。
三、審計大數(shù)據(jù)預(yù)處理平臺的建立和運行
審計大數(shù)據(jù)預(yù)處理平臺由數(shù)據(jù)存儲,提取,清理,轉(zhuǎn)換和加載等模塊組成。近年來,大數(shù)據(jù)存儲基礎(chǔ)審計采用傳統(tǒng)的存儲模式,審計主體應(yīng)熟悉各種分布式存儲技術(shù)。其核心是網(wǎng)絡(luò)存儲技術(shù),靈活高效的元數(shù)據(jù)管理,系統(tǒng)開發(fā),應(yīng)用和負(fù)載存儲優(yōu)化,優(yōu)化,存儲層數(shù)據(jù)動態(tài)調(diào)度和優(yōu)化,數(shù)據(jù)災(zāi)難以及存儲屬性等優(yōu)化技術(shù)。審計主體需要選擇適用的數(shù)據(jù)存儲子系統(tǒng)基于大數(shù)據(jù)結(jié)構(gòu)的特點。對于結(jié)構(gòu)化數(shù)據(jù),采用分布式數(shù)據(jù)庫存儲。對于簡單的半結(jié)構(gòu)化數(shù)據(jù),采用分布式鍵值存儲。對于復(fù)雜的半結(jié)構(gòu)化數(shù)據(jù),采用分布式表存儲。對于視頻,圖片和其他非結(jié)構(gòu)化數(shù)據(jù),分布式文件存儲被采納。
審計大數(shù)據(jù)提取包括全量提取和增量提取。 全量提取是復(fù)制和遷移源數(shù)據(jù)庫中的所有數(shù)據(jù)并增加提取是基于前者從源表中提取新添加,刪除和修改的數(shù)據(jù)。 具體方法包括時間戳,觸發(fā)器,日志比較和全表比較。審計主體應(yīng)建立適合他們的大數(shù)據(jù)提取方案。 例如,web標(biāo)簽提取算法可用于結(jié)構(gòu)化數(shù)據(jù),基于本體的web標(biāo)簽提取算法可用于半結(jié)構(gòu)化數(shù)據(jù),而基于規(guī)則的數(shù)據(jù)提取算法可用于非結(jié)構(gòu)化數(shù)據(jù)。
四、建立審計大數(shù)據(jù)分析平臺
審計大數(shù)據(jù)分析平臺的構(gòu)建必須依賴于過程建模,建模的動態(tài)因素包括:(1)分布式并行處理。審計主體在分布式并行處理系統(tǒng)的幫助下,海量目標(biāo)數(shù)據(jù)可以分成塊,并由多臺計算機協(xié)同處理?;跁r間和空間的并行計算,可以同時執(zhí)行多條指令,從而及時擴展問題解決規(guī)模,解決復(fù)雜的審計計算問題。(2)引擎組件。審計主體可以使用云引擎來執(zhí)行應(yīng)用程序設(shè)計各種功能,或使用相同的“云”來執(zhí)行不同要求的審計分析。工作流程是開發(fā)適用的過程邏輯,確保審計分析的靈活性,可維護性和穩(wěn)定性。審計主體需要通過基于流向管理,流程節(jié)點管理和流程樣本管理的芯片處理器來增強審計分析引擎,以促進審計分析的同步實施和效率優(yōu)化。(3)方法庫。(4)相關(guān)軟件工具。審計大數(shù)據(jù)分析平臺需要整合現(xiàn)有的成熟分析軟件,如SPSS,SAS,R語言等。
五、審計大數(shù)據(jù)可視化平臺的建立和運行
審計大數(shù)據(jù)可視化基于計算機輔助設(shè)計,圖像處理,信號處理,圖形,計算機視覺和其他學(xué)科。利用計算機圖形和圖像處理等相關(guān)技術(shù),將審計大數(shù)據(jù)信息的內(nèi)部結(jié)構(gòu)轉(zhuǎn)換為圖形或圖像進行顯示,實現(xiàn)交互處理。
參考文獻
[1] 呂勁松,王志成等.2017.大數(shù)據(jù)環(huán)境下商業(yè)銀行審計非結(jié)構(gòu)化數(shù)據(jù)研究[J].軟科學(xué)(1):141-144.
[2] 秦榮生.2014.大數(shù)據(jù)、云計算技術(shù)對審計的影響研究[J].審計研究(6):23-28.
[3] 王崇業(yè).2017.基于大數(shù)據(jù)的傳統(tǒng)財務(wù)報表持續(xù)審計模型重構(gòu)[J].財會通訊(7):111-113.
[4] 魏建祥.2016.大數(shù)據(jù)環(huán)境下政府審計模式轉(zhuǎn)變[J].財會月刊(22):64-67.
[5] 張元鳴,陳苗等.2016.非結(jié)構(gòu)化表格文檔數(shù)據(jù)抽取與組織模型研究[J].浙江工業(yè)大學(xué)學(xué)報(5):487-494.
[6] 鄭偉,張立民,楊莉.2016.試析大數(shù)據(jù)環(huán)境下的大數(shù)據(jù)審計模式[J].審計研究(4):20-27.