□文/張春鈺 楊穎紅
(沈陽化工大學(xué)經(jīng)濟(jì)與管理學(xué)院 遼寧·沈陽)
[提要]當(dāng)前大數(shù)據(jù)技術(shù)不斷滲透到審計(jì)領(lǐng)域中,使得傳統(tǒng)審計(jì)手段面臨轉(zhuǎn)變。為了更好的了解大數(shù)據(jù)審計(jì)研究現(xiàn)狀以及發(fā)現(xiàn)存在的不足之處,本文通過對(duì)近年來關(guān)于大數(shù)據(jù)審計(jì)的文獻(xiàn)進(jìn)行梳理,指出大數(shù)據(jù)審計(jì)對(duì)傳統(tǒng)審計(jì)產(chǎn)生的多方面影響;總結(jié)學(xué)者們提出較多的大數(shù)據(jù)審計(jì)流程框架,同時(shí)對(duì)數(shù)據(jù)采集、存儲(chǔ)、分析三方面的技術(shù)方法進(jìn)行概括;并針對(duì)現(xiàn)有研究文獻(xiàn)做出總結(jié)。
隨著我國(guó)社會(huì)與經(jīng)濟(jì)的不斷發(fā)展,各行各業(yè)的信息量呈井噴式的增長(zhǎng),這給傳統(tǒng)審計(jì)工作帶來了極大的挑戰(zhàn),采用更強(qiáng)大的技術(shù)手段來提高審計(jì)工作效率十分必要,2016年劉家義明確地提出了“要運(yùn)用大數(shù)據(jù),創(chuàng)新審計(jì)技術(shù)方法?!标P(guān)于大數(shù)據(jù)審計(jì)的含義,陳偉、居江寧(2017)認(rèn)為大數(shù)據(jù)審計(jì)可分為大數(shù)據(jù)背景下的電子數(shù)據(jù)審計(jì)和信息系統(tǒng)審計(jì)兩方面內(nèi)容,而對(duì)于注冊(cè)會(huì)計(jì)師行業(yè)來說,其工作重心更多在于對(duì)數(shù)據(jù)進(jìn)行審計(jì),Deniz Appelbaum等(2017)提出在大數(shù)據(jù)技術(shù)不斷滲透到各領(lǐng)域的今天,會(huì)計(jì)師事務(wù)所想要保持競(jìng)爭(zhēng)力同時(shí)滿足客戶的需求,注冊(cè)會(huì)計(jì)師行業(yè)需要走向大數(shù)據(jù)。本文通過對(duì)近年來關(guān)于大數(shù)據(jù)審計(jì)的文獻(xiàn)進(jìn)行總結(jié),概括了現(xiàn)階段大數(shù)據(jù)技術(shù)對(duì)審計(jì)產(chǎn)生的影響、審計(jì)數(shù)據(jù)的采集方法、數(shù)據(jù)存儲(chǔ)方法、數(shù)據(jù)分析挖掘方法,以及大數(shù)據(jù)審計(jì)面臨的風(fēng)險(xiǎn),并總結(jié)出面對(duì)不同的審計(jì)業(yè)務(wù),大數(shù)據(jù)審計(jì)的工作流程需要進(jìn)行有針對(duì)性的優(yōu)化的結(jié)論。
(一)大數(shù)據(jù)對(duì)審計(jì)抽樣的影響。目前,注冊(cè)會(huì)計(jì)師在審計(jì)工作中頻繁運(yùn)用到審計(jì)抽樣,但這種方法存在不可避免的抽樣風(fēng)險(xiǎn),無論是在控制測(cè)試工作還是在細(xì)節(jié)測(cè)試工作中這種風(fēng)險(xiǎn)會(huì)導(dǎo)致注冊(cè)會(huì)計(jì)師發(fā)表不恰當(dāng)?shù)膶徲?jì)意見亦或是降低審計(jì)效率。秦榮生(2014)認(rèn)為利用大數(shù)據(jù)相關(guān)技術(shù)可以對(duì)審計(jì)所需的數(shù)據(jù)進(jìn)行跨行業(yè)、跨企業(yè)式的收集與分析,不再采用傳統(tǒng)隨機(jī)抽樣模式,轉(zhuǎn)而使用收集和分析被審計(jì)單位全部數(shù)據(jù)的總體審計(jì)模式;顧洪菲(2015)認(rèn)為在總體審計(jì)模式下運(yùn)用數(shù)據(jù)分析,能夠消除抽樣風(fēng)險(xiǎn)使審計(jì)結(jié)果更加準(zhǔn)確,同時(shí)數(shù)據(jù)無需預(yù)處理進(jìn)一步保持?jǐn)?shù)據(jù)原本特征,從而讓數(shù)據(jù)分析更全面、更真實(shí);張敏(2020)提出隨著大數(shù)據(jù)、人工智能等技術(shù)的不斷發(fā)展,抽樣審計(jì)重新回歸詳細(xì)審計(jì)的可能性大大提高,并且風(fēng)險(xiǎn)評(píng)估、內(nèi)控測(cè)試通過機(jī)器學(xué)習(xí)更易實(shí)現(xiàn)智能化。
從相關(guān)文獻(xiàn)中可以了解到,利用大數(shù)據(jù)技術(shù)對(duì)審計(jì)對(duì)象的總體進(jìn)行審計(jì)能夠消除抽樣風(fēng)險(xiǎn),同時(shí)利用大數(shù)據(jù)分析能更加全面的找出審計(jì)疑點(diǎn),這顯著地提升了審計(jì)工作的質(zhì)量。
(二)大數(shù)據(jù)技術(shù)對(duì)審計(jì)取證的影響。審計(jì)人員在取證過程中受制于審計(jì)證據(jù)來源的廣泛性、多樣性,審計(jì)證據(jù)的充分性與適當(dāng)性的要求,使得審計(jì)取證面臨效率低、周期長(zhǎng)的問題,同時(shí),成本效益原則又要求審計(jì)工作在人員與時(shí)間的配置上進(jìn)行良好的控制,這些問題通常使得審計(jì)人員極大地依賴自身的職業(yè)判斷,從而導(dǎo)致審計(jì)證據(jù)的質(zhì)量良莠不齊。魯清仿、梁子慧(2015)認(rèn)為大數(shù)據(jù)技術(shù)運(yùn)用到審計(jì)工作中顛覆了傳統(tǒng)審計(jì)取證的思維,使得審計(jì)人員能夠采集更多的信息,進(jìn)一步使審計(jì)證據(jù)更充分、更適當(dāng),減少依賴注冊(cè)會(huì)計(jì)師職業(yè)判斷,降低了審計(jì)風(fēng)險(xiǎn)。Helen Brown-Liburd、Miklos A.Vasarhelyi(2015)提出在大數(shù)據(jù)技術(shù)下審計(jì)證據(jù)的充分性不再是主要問題,而如何及時(shí)獲取審計(jì)證據(jù)并利用數(shù)據(jù)分析工具有效地分析和解釋數(shù)據(jù)將是工作重點(diǎn)。陽杰、應(yīng)里孟(2017)提出在審計(jì)中使用大數(shù)據(jù)手段深度搜查審計(jì)數(shù)據(jù),對(duì)以往的審計(jì)證據(jù)作出補(bǔ)充,其在充分性、可靠性兩點(diǎn)上更加優(yōu)于傳統(tǒng)審計(jì)證據(jù)。鄭石橋(2020)認(rèn)為大數(shù)據(jù)時(shí)代下審計(jì)載體發(fā)生了改變,審計(jì)證據(jù)載體更加電子化,這影響了審計(jì)取證,傳統(tǒng)取證思路是風(fēng)險(xiǎn)評(píng)估和風(fēng)險(xiǎn)應(yīng)對(duì),而大數(shù)據(jù)審計(jì)則變?yōu)椤皵?shù)據(jù)采集”、“數(shù)據(jù)分析”和“疑點(diǎn)核實(shí)”。
學(xué)者大多認(rèn)為依靠大數(shù)據(jù)技術(shù)獲取的信息與以往相比無論從數(shù)量還是維度都更加豐富,從邏輯上看,在與被審計(jì)單位的內(nèi)部信息結(jié)合后,審計(jì)證據(jù)的相關(guān)性、充分性都有所增強(qiáng)。
(三)大數(shù)據(jù)技術(shù)對(duì)事后審計(jì)的影響。以往的審計(jì)模式可以稱之為事后審計(jì),而這種審計(jì)模式的弊端在于其時(shí)效性較差,即問題的發(fā)生與發(fā)現(xiàn)時(shí)間間隔較長(zhǎng)也會(huì)給被審計(jì)單位造成較大的損失。Paul Byrnes等(2014)認(rèn)為從企業(yè)的角度出發(fā),如果其依靠XBRL技術(shù)便可以頻繁、連續(xù)的在線編制財(cái)務(wù)報(bào)告,而不像以往那樣每年發(fā)布一次,那么在大數(shù)據(jù)背景下審計(jì)人員很可能接近實(shí)時(shí)審計(jì)或者至少在一定期間內(nèi)頻繁的監(jiān)視和審計(jì)一個(gè)實(shí)體。黃舒(2017)認(rèn)為隨著大數(shù)據(jù)技術(shù)的發(fā)展和使用,審計(jì)的實(shí)時(shí)處理和快速?zèng)Q斷將變得可能。審計(jì)人員運(yùn)用數(shù)據(jù)分析平臺(tái)能夠?qū)崟r(shí)監(jiān)控并更可能發(fā)現(xiàn)企業(yè)的錯(cuò)誤和舞弊行為,從而及時(shí)糾正問題,提高審計(jì)工作的質(zhì)量。秦榮生(2019)認(rèn)為非現(xiàn)場(chǎng)實(shí)時(shí)審計(jì)是一種新的方法,該方法通過互聯(lián)網(wǎng)與被審計(jì)單位的內(nèi)部系統(tǒng)實(shí)施連接,實(shí)現(xiàn)非現(xiàn)場(chǎng)實(shí)時(shí)監(jiān)控,提高審計(jì)工作的及時(shí)性與效率,是現(xiàn)代審計(jì)發(fā)展的新方向。
非現(xiàn)場(chǎng)實(shí)時(shí)審計(jì)將會(huì)是今后審計(jì)方式演變的重要方向,現(xiàn)階段,關(guān)于實(shí)時(shí)審計(jì)的文獻(xiàn)已經(jīng)為實(shí)踐提供了可參考的路徑和可行的技術(shù)方法,同時(shí)涉及到具體業(yè)務(wù)時(shí)也還需進(jìn)一步探索和靈活轉(zhuǎn)變。
傳統(tǒng)審計(jì)工作流程總體為接受業(yè)務(wù)、計(jì)劃審計(jì)工作、識(shí)別評(píng)估重大錯(cuò)報(bào)風(fēng)險(xiǎn)、應(yīng)對(duì)風(fēng)險(xiǎn)、出具審計(jì)報(bào)告,但在大數(shù)據(jù)審計(jì)下這一流程將發(fā)生改變。
陳偉、Smieliauskas Wally(2016)將大數(shù)據(jù)電子數(shù)據(jù)審計(jì)原理分成四大步驟:數(shù)據(jù)集成、數(shù)據(jù)存儲(chǔ)與管理、數(shù)據(jù)分析、可視化展示。(圖1)
圖1 大數(shù)據(jù)電子數(shù)據(jù)審計(jì)流程圖
劉國(guó)城、陳正升(2019)認(rèn)為大數(shù)據(jù)審計(jì)的總體流程包括了數(shù)據(jù)的采集、處理、取證、可視化呈現(xiàn)四項(xiàng)基本流程。(圖2)
圖2 大數(shù)據(jù)審計(jì)流程總體框架圖
目前,在大數(shù)據(jù)審計(jì)流程設(shè)計(jì)的文獻(xiàn)中均包括了數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)分析三個(gè)模塊,這對(duì)應(yīng)用大數(shù)據(jù)技術(shù)進(jìn)行審計(jì)提供了一定的指引。此外,對(duì)不同審計(jì)目標(biāo),若能根據(jù)現(xiàn)有框架進(jìn)行相對(duì)應(yīng)的匹配或許能實(shí)現(xiàn)更高的效率。
大數(shù)據(jù)審計(jì)在取證時(shí)需要從被審計(jì)單位內(nèi)外部獲取各種各樣的數(shù)據(jù),這些不同來源的數(shù)據(jù)在格式上存在較大區(qū)別,需要使用多種采集方法。陳琦、陳偉(2015)基于C#語言實(shí)現(xiàn)了將文本數(shù)據(jù)、Excel數(shù)據(jù)和Access數(shù)據(jù)庫(kù)中所需數(shù)據(jù)采集到Visual Studio 2008的相關(guān)組件中,對(duì)審計(jì)數(shù)據(jù)的采集具有指導(dǎo)作用。陳偉、孫夢(mèng)蝶(2018)將數(shù)據(jù)來源概括為三個(gè)方面:上級(jí)審計(jì)部門數(shù)據(jù)、審計(jì)部門所領(lǐng)導(dǎo)的各機(jī)關(guān)單位數(shù)據(jù)、被審計(jì)單位數(shù)據(jù),同時(shí)提出了直接復(fù)制、通過中間文件、通過ODBC接口、通過備份與恢復(fù)、網(wǎng)絡(luò)爬蟲五種數(shù)據(jù)采集方法。魏祥健(2019)將審計(jì)數(shù)據(jù)概括為結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化三類,同時(shí)給出了軟件接口、數(shù)據(jù)庫(kù)接口和底層數(shù)據(jù)直接交換三種采集方式。徐超(2020)基于網(wǎng)絡(luò)爬蟲技術(shù)設(shè)計(jì)了數(shù)據(jù)采集框架,流程包括數(shù)據(jù)預(yù)定義、網(wǎng)絡(luò)爬蟲模塊、實(shí)時(shí)監(jiān)控,并在具體案例中對(duì)企業(yè)的征信、工商、訴訟等數(shù)據(jù)實(shí)現(xiàn)了爬取。
審計(jì)數(shù)據(jù)采集是一項(xiàng)重要工作,現(xiàn)有文獻(xiàn)對(duì)審計(jì)數(shù)據(jù)的分類較為完善,方法多樣,不過非結(jié)構(gòu)化數(shù)據(jù)的獲取相對(duì)困難,因此,預(yù)期需要將更多的研究集中于非結(jié)構(gòu)化數(shù)據(jù)的采集上。
數(shù)據(jù)存儲(chǔ)是大數(shù)據(jù)審計(jì)工作流程中的重要一環(huán),面對(duì)不斷累計(jì)增多的大量數(shù)據(jù)如何科學(xué)合理的存儲(chǔ)以實(shí)現(xiàn)數(shù)據(jù)的高效利用是推動(dòng)大數(shù)據(jù)審計(jì)的關(guān)鍵。Kumar Setty、Rohit Bakhshi(2013)提出交互式技術(shù)與Apache Hadoop平臺(tái)的結(jié)合能夠存儲(chǔ)多種結(jié)構(gòu)的原始數(shù)據(jù)并通過聚合與轉(zhuǎn)換將數(shù)據(jù)結(jié)構(gòu)變?yōu)榭墒褂玫母袷健`崅サ龋?016)認(rèn)為提高審計(jì)大數(shù)據(jù)處理和存儲(chǔ)的效率,獲取的數(shù)據(jù)需經(jīng)過預(yù)先處理(集成、清洗、冗余消除)后才能儲(chǔ)存到相應(yīng)數(shù)據(jù)庫(kù)中,可以利用Hadoop平臺(tái),圍繞HDFS系統(tǒng)、Hbase數(shù)據(jù)庫(kù)、Map Reduce程序設(shè)計(jì)模型三項(xiàng)核心實(shí)現(xiàn)存儲(chǔ)管理。劉國(guó)城、王會(huì)金(2017)在大數(shù)據(jù)審計(jì)預(yù)處理平臺(tái)搭建中提出利用分布式數(shù)據(jù)庫(kù)儲(chǔ)存結(jié)構(gòu)化數(shù)據(jù),而簡(jiǎn)單半結(jié)構(gòu)化的利用數(shù)據(jù)分布式鍵值儲(chǔ)存,分布式表格儲(chǔ)存復(fù)雜半結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)則利用分布式文件儲(chǔ)存。郭紅建、梅軼群(2017)提出數(shù)據(jù)存儲(chǔ)可以通過云平臺(tái),云平臺(tái)再聯(lián)合網(wǎng)格、分布式系統(tǒng)來共同工作,并對(duì)外提供審計(jì)數(shù)據(jù)的存儲(chǔ)和訪問功能。
關(guān)于存儲(chǔ)方法的研究,學(xué)者們熱衷于搭建功能強(qiáng)大、處理效率高的數(shù)據(jù)分類平臺(tái),這種平臺(tái)構(gòu)想的優(yōu)點(diǎn)在于功能集成度高。當(dāng)然,這也要求操作人員需具備多種技術(shù)才能使用。
面對(duì)龐大的數(shù)據(jù),審計(jì)人員在進(jìn)行總體分析時(shí)必須使用分析能力較強(qiáng)的技術(shù)方法,這樣才能夠符合大數(shù)據(jù)審計(jì)的要求。Christine E.Earley(2015)在文獻(xiàn)中闡述了在審計(jì)中使用高強(qiáng)度數(shù)據(jù)分析給審計(jì)人員帶來的機(jī)遇和挑戰(zhàn)并認(rèn)為,數(shù)據(jù)分析能夠提高審計(jì)質(zhì)量,更好的發(fā)現(xiàn)舞弊行為,比傳統(tǒng)CAATs技術(shù)效果更佳。Adrian Gepp等(2018)通過總結(jié)大數(shù)據(jù)技術(shù)在金融欺詐、股票市場(chǎng)預(yù)測(cè)等領(lǐng)域的運(yùn)用,提出審計(jì)人員也可利用數(shù)據(jù)分析預(yù)測(cè)企業(yè)財(cái)務(wù)困境,并結(jié)合專業(yè)判斷,更好地對(duì)企業(yè)持續(xù)經(jīng)營(yíng)方面作出評(píng)價(jià)。胡榮、陳月昆(2004)、呂新民、王學(xué)榮(2007)在相關(guān)文獻(xiàn)中都提到了在審計(jì)工作中對(duì)被審計(jì)單位的大量數(shù)據(jù)采用統(tǒng)計(jì)分析、關(guān)聯(lián)分析、聚類分析等技術(shù)進(jìn)行建模并完成數(shù)據(jù)的分析和挖掘。羌雨(2016)提出利用R語言作為分析工具來實(shí)現(xiàn)可視化分析。張志恒、成雪嬌(2017)提出運(yùn)用HDFS文件系統(tǒng)、Hbase數(shù)據(jù)庫(kù)、Map Reduce計(jì)算模型搭建平臺(tái),利用文本挖掘技術(shù)進(jìn)一步實(shí)現(xiàn)對(duì)非結(jié)構(gòu)化數(shù)據(jù)的分析與挖掘。陳偉(2019)根據(jù)大數(shù)據(jù)審計(jì)案例,利用Python語言進(jìn)行數(shù)據(jù)分析展現(xiàn)了多種可視化分析圖。
可以說,數(shù)據(jù)分析是大數(shù)據(jù)審計(jì)最重要的一環(huán)。目前,相關(guān)文獻(xiàn)已提出了多種工具和方法,將其綜合利用能夠使數(shù)據(jù)分析和挖掘效果更好,不過還需要對(duì)程序的針對(duì)性做出優(yōu)化。
未來隨著大數(shù)據(jù)技術(shù)在審計(jì)中的不斷應(yīng)用,其風(fēng)險(xiǎn)也將逐漸暴露出來,使得大數(shù)據(jù)審計(jì)的發(fā)展面臨較大挑戰(zhàn)。Helen Brown-Liburd等(2015)通過研究大數(shù)據(jù)如何影響審計(jì)人員的判斷,提出了審計(jì)人員在信息量過多、信息相關(guān)性、識(shí)別模式等方面,面臨分析結(jié)果的信息量較大,識(shí)別無關(guān)信息難度高等風(fēng)險(xiǎn)。劉星等(2016)認(rèn)為大數(shù)據(jù)審計(jì)在數(shù)據(jù)采集環(huán)節(jié)、存儲(chǔ)與調(diào)用環(huán)節(jié)、處理環(huán)節(jié)、分析環(huán)節(jié)均存在風(fēng)險(xiǎn)。付達(dá)院和楊靜怡(2019)認(rèn)為互聯(lián)網(wǎng)時(shí)代審計(jì)人員存在三個(gè)方面的風(fēng)險(xiǎn),即系統(tǒng)風(fēng)險(xiǎn)、控制風(fēng)險(xiǎn)、測(cè)試風(fēng)險(xiǎn)。裴春燕(2020)將大數(shù)據(jù)審計(jì)的風(fēng)險(xiǎn)概括為五點(diǎn):一是審計(jì)人才短缺,分析能力弱;二是審計(jì)程序的針對(duì)性差;三是傳統(tǒng)思維有待轉(zhuǎn)變;四是方法技術(shù)落后;五是軟件開發(fā)費(fèi)用高。
現(xiàn)階段關(guān)于大數(shù)據(jù)審計(jì)風(fēng)險(xiǎn)的研究多數(shù)是客觀的、充分的,文獻(xiàn)中反映出大數(shù)據(jù)審計(jì)在多個(gè)環(huán)節(jié)存在風(fēng)險(xiǎn),也能夠了解到對(duì)風(fēng)險(xiǎn)的解決方案,今后可以進(jìn)行更深入的探索與研究。
在關(guān)于大數(shù)據(jù)審計(jì)的現(xiàn)有文獻(xiàn)中,早期學(xué)者從大數(shù)據(jù)對(duì)審計(jì)抽樣、審計(jì)取證、事后審計(jì)的影響等方面進(jìn)行研究,逐步設(shè)計(jì)出大數(shù)據(jù)審計(jì)流程框架,進(jìn)而走向?qū)?shù)據(jù)采集、存儲(chǔ)、分析挖掘等技術(shù)的研究,研究方面逐漸完備。而當(dāng)下的研究更多的涉及到了具體審計(jì)業(yè)務(wù),研究方向更加細(xì)化。但是,現(xiàn)階段關(guān)于大數(shù)據(jù)審計(jì)的研究還存在不足之處,大數(shù)據(jù)審計(jì)中非結(jié)構(gòu)化數(shù)據(jù)的采集難度大,價(jià)值密度不高,還需要更好的數(shù)據(jù)采集手段。審計(jì)業(yè)務(wù)范圍大、內(nèi)容復(fù)雜,今后對(duì)大數(shù)據(jù)審計(jì)的研究可以圍繞具體審計(jì)業(yè)務(wù)對(duì)大數(shù)據(jù)審計(jì)流程進(jìn)行有針對(duì)性的優(yōu)化,以推動(dòng)大數(shù)據(jù)審計(jì)的快速發(fā)展。