程平 (教授/博導(dǎo)) 常吉 夏會(huì) (副教授)
(重慶理工大學(xué)會(huì)計(jì)學(xué)院 重慶理工大學(xué)云會(huì)計(jì)大數(shù)據(jù)智能研究所 重慶 400054)
以大數(shù)據(jù)、云計(jì)算、人工智能和機(jī)器人流程自動(dòng)化為代表的新一代信息技術(shù)蓬勃發(fā)展與廣泛應(yīng)用,對(duì)會(huì)計(jì)領(lǐng)域的理論和實(shí)踐產(chǎn)生了深刻的影響。大數(shù)據(jù)作為核心技術(shù)之一,它的運(yùn)用使得財(cái)務(wù)會(huì)計(jì)工作的重點(diǎn)由原先的編制憑證、記賬、結(jié)賬、編制報(bào)表等轉(zhuǎn)向數(shù)據(jù)的收集、存儲(chǔ)、加工、傳遞和查詢上,同時(shí)對(duì)會(huì)計(jì)信息的呈現(xiàn)、獲取、使用方式和質(zhì)量產(chǎn)生了較大的影響,促使財(cái)務(wù)會(huì)計(jì)向業(yè)財(cái)融合方向發(fā)展。在大數(shù)據(jù)時(shí)代,財(cái)務(wù)會(huì)計(jì)與管理會(huì)計(jì)的深度融合,本質(zhì)上就是體現(xiàn)為業(yè)財(cái)融合,而業(yè)財(cái)融合的關(guān)鍵是要實(shí)現(xiàn)企業(yè)內(nèi)部的財(cái)務(wù)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)與外部多維數(shù)據(jù)的全面融合。大數(shù)據(jù)技術(shù)助推業(yè)財(cái)融合,幫助會(huì)計(jì)信息使用者能更好地掌握和理解數(shù)據(jù),能夠?qū)崟r(shí)、精準(zhǔn)地洞察和理解市場(chǎng)經(jīng)濟(jì)現(xiàn)象和規(guī)律。
多年來,大數(shù)據(jù)及相關(guān)技術(shù)在會(huì)計(jì)領(lǐng)域的應(yīng)用一直是業(yè)界關(guān)注的重點(diǎn)。尹建芳等(2020)在闡述人工智能背景下會(huì)計(jì)轉(zhuǎn)型發(fā)展三種觀點(diǎn)的基礎(chǔ)上,進(jìn)一步對(duì)企業(yè)會(huì)計(jì)面臨的機(jī)遇與挑戰(zhàn)進(jìn)行了分析,探索了財(cái)務(wù)會(huì)計(jì)與管理會(huì)計(jì)未來的發(fā)展趨勢(shì)。丁勝紅(2019)采用歷史文獻(xiàn)法梳理會(huì)計(jì)核算流程的演變規(guī)律,采用演繹與歸納法構(gòu)建大數(shù)據(jù)會(huì)計(jì)核算理論體系,采用嫁接法重構(gòu)大數(shù)據(jù)會(huì)計(jì)核算云端化流程。陳文軍(2015)在探討大數(shù)據(jù)、云計(jì)算在數(shù)據(jù)存儲(chǔ)和處理方面對(duì)完善管理會(huì)計(jì)的職能所發(fā)揮作用的基礎(chǔ)上,論述了在管理會(huì)計(jì)發(fā)展領(lǐng)域所產(chǎn)生的重要影響。劉鳳委(2017)分析了大數(shù)據(jù)對(duì)管理會(huì)計(jì)各項(xiàng)職能的影響,并從會(huì)計(jì)行業(yè)發(fā)展角度提出了未來會(huì)計(jì)從業(yè)人員所面臨的嚴(yán)峻挑戰(zhàn)。吳勇等(2019)在梳理大數(shù)據(jù)和管理會(huì)計(jì)相關(guān)概念的基礎(chǔ)上,立足于數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用四個(gè)關(guān)鍵階段,重構(gòu)面向大數(shù)據(jù)分析全生命周期的管理會(huì)計(jì)應(yīng)用系統(tǒng)功能架構(gòu),進(jìn)而從需求驅(qū)動(dòng)、供給推動(dòng)以及外部環(huán)境影響三個(gè)方面,提出基于大數(shù)據(jù)分析的管理會(huì)計(jì)應(yīng)用系統(tǒng)的實(shí)施思路和實(shí)現(xiàn)路徑。
現(xiàn)有文獻(xiàn)對(duì)大數(shù)據(jù)技術(shù)在財(cái)務(wù)會(huì)計(jì)、管理會(huì)計(jì)領(lǐng)域的應(yīng)用從挑戰(zhàn)、職能影響、流程重構(gòu)以及功能框架等方面進(jìn)行了多維度的探索,對(duì)豐富大數(shù)據(jù)技術(shù)與會(huì)計(jì)結(jié)合的研究做出了非常積極的貢獻(xiàn),然而這些研究對(duì)會(huì)計(jì)大數(shù)據(jù)的內(nèi)涵和具體的技術(shù)實(shí)現(xiàn)還缺乏清晰、深入、系統(tǒng)的研究。有鑒于此,本文從會(huì)計(jì)大數(shù)據(jù)的內(nèi)涵、內(nèi)容框架和技術(shù)實(shí)現(xiàn)三方面嘗試為會(huì)計(jì)大數(shù)據(jù)建立比較系統(tǒng)的理論和方法體系提供參考。
會(huì)計(jì)大數(shù)據(jù),目前業(yè)界還沒有統(tǒng)一的概念界定。本文基于對(duì)會(huì)計(jì)數(shù)據(jù)和會(huì)計(jì)信息的理解,結(jié)合大數(shù)據(jù)技術(shù)的內(nèi)涵和特征對(duì)會(huì)計(jì)大數(shù)據(jù)進(jìn)行定義。會(huì)計(jì)大數(shù)據(jù)是建立在互聯(lián)網(wǎng)和云計(jì)算基礎(chǔ)之上,面向會(huì)計(jì)核算、會(huì)計(jì)管理和會(huì)計(jì)決策應(yīng)用場(chǎng)景,對(duì)企業(yè)內(nèi)外部產(chǎn)生的大規(guī)模、多樣化的會(huì)計(jì)數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、處理、計(jì)算與分析的一系列數(shù)據(jù)處理技術(shù)。簡(jiǎn)單的說,會(huì)計(jì)大數(shù)據(jù)就是大數(shù)據(jù)及相關(guān)技術(shù)在財(cái)務(wù)會(huì)計(jì)體系、管理會(huì)計(jì)體系中的應(yīng)用,它是以傳統(tǒng)會(huì)計(jì)體系為核心,并在原來的基礎(chǔ)上增加了一個(gè)技術(shù)處理手段,并未使傳統(tǒng)會(huì)計(jì)體系發(fā)生根本變化。
會(huì)計(jì)大數(shù)據(jù)的概念中所指的會(huì)計(jì)數(shù)據(jù)不只包含傳統(tǒng)財(cái)務(wù)會(huì)計(jì)下的會(huì)計(jì)數(shù)據(jù),還包括來自企業(yè)業(yè)務(wù)信息系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),以及外部或者互聯(lián)網(wǎng)上的半結(jié)構(gòu)化數(shù)據(jù)(如網(wǎng)頁)和非結(jié)構(gòu)化數(shù)據(jù)(如圖像、文本等)。會(huì)計(jì)大數(shù)據(jù)除了能夠完成財(cái)務(wù)會(huì)計(jì)的會(huì)計(jì)核算和會(huì)計(jì)監(jiān)督職能,還能夠通過業(yè)財(cái)數(shù)據(jù)融合和大數(shù)據(jù)挖掘技術(shù),完成管理會(huì)計(jì)的預(yù)測(cè)、決策、規(guī)劃、控制和評(píng)價(jià)職能。
會(huì)計(jì)大數(shù)據(jù)是大數(shù)據(jù)及相關(guān)技術(shù)在財(cái)務(wù)會(huì)計(jì)體系、管理會(huì)計(jì)體系中的具體應(yīng)用,可以從會(huì)計(jì)的職能層面對(duì)會(huì)計(jì)大數(shù)據(jù)的內(nèi)容進(jìn)行詮釋,其框架如圖1所示。
圖1 會(huì)計(jì)大數(shù)據(jù)的內(nèi)容框架
財(cái)務(wù)會(huì)計(jì)是現(xiàn)代企業(yè)的一項(xiàng)重要的基礎(chǔ)性工作,它通過一系列會(huì)計(jì)程序提供決策有用的信息,并積極參與經(jīng)營(yíng)管理決策,提高企業(yè)經(jīng)濟(jì)效益,服務(wù)于市場(chǎng)經(jīng)濟(jì)的健康有序發(fā)展。財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)是大數(shù)據(jù)及相關(guān)技術(shù)在財(cái)務(wù)會(huì)計(jì)中的應(yīng)用,具體體現(xiàn)為大數(shù)據(jù)及相關(guān)技術(shù)在會(huì)計(jì)核算和監(jiān)督職能中的具體實(shí)現(xiàn)。
1.核算。核算職能是對(duì)以貨幣計(jì)量的經(jīng)濟(jì)活動(dòng)進(jìn)行確認(rèn)、計(jì)量、記錄和報(bào)告。傳統(tǒng)信息化模式下的會(huì)計(jì)核算工作,財(cái)務(wù)人員基本被定位在收集單據(jù)、定制憑證、復(fù)核、結(jié)賬、報(bào)告、歸檔等工作的軟件操作,其處理的數(shù)據(jù)主要是結(jié)構(gòu)化類型的會(huì)計(jì)數(shù)據(jù)。而在財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)下,財(cái)務(wù)人員所面對(duì)的不只是會(huì)計(jì)數(shù)據(jù)和原始單據(jù),而更多的是海量的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)的類型包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),并且更多的是非結(jié)構(gòu)化數(shù)據(jù)。財(cái)務(wù)人員需要收集和分析會(huì)計(jì)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù),并將有用的數(shù)據(jù)放置在合理的資源中,通過高效的核算流程輸出有價(jià)值的會(huì)計(jì)信息。財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)下,大數(shù)據(jù)采集、存儲(chǔ)、處理和計(jì)算使得會(huì)計(jì)核算更為精細(xì)。例如,企業(yè)在進(jìn)行成本核算時(shí),不管采用什么方法,重點(diǎn)都是要確定成本定額的大小。在財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)下,企業(yè)通過采集、存儲(chǔ)海量數(shù)據(jù),來分析同行業(yè)企業(yè)的成本定額標(biāo)準(zhǔn),從而根據(jù)企業(yè)的財(cái)務(wù)狀況,制定一個(gè)更加合理的成本定額標(biāo)準(zhǔn)。所以,財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)能夠讓企業(yè)的會(huì)計(jì)成本核算更加精細(xì)化,為企業(yè)節(jié)約成本。財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)下,大數(shù)據(jù)的傳播、處理和計(jì)算的速度提升了會(huì)計(jì)核算的及時(shí)性。例如,企業(yè)在發(fā)出或者購(gòu)進(jìn)貨物時(shí),只需要將購(gòu)進(jìn)或者發(fā)出貨物的單價(jià)和數(shù)量輸入系統(tǒng)內(nèi)就可以將這些數(shù)據(jù)立即傳輸給會(huì)計(jì)核算人員,馬上進(jìn)行會(huì)計(jì)處理和分析,這有利于相關(guān)管理和決策者在最佳時(shí)間點(diǎn)做出選擇。財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)下,大數(shù)據(jù)使財(cái)務(wù)會(huì)計(jì)報(bào)告更加及時(shí)。大數(shù)據(jù)技術(shù)將推動(dòng)財(cái)務(wù)報(bào)告從定期報(bào)告向?qū)崟r(shí)報(bào)告轉(zhuǎn)化,大數(shù)據(jù)的特點(diǎn)就是數(shù)據(jù)的處理速度非???,實(shí)時(shí)報(bào)告是大數(shù)據(jù)技術(shù)與會(huì)計(jì)的完美結(jié)合,極大地促進(jìn)了財(cái)務(wù)會(huì)計(jì)報(bào)告的及時(shí)性,使投資者等財(cái)務(wù)報(bào)告使用者能隨時(shí)了解企業(yè)的財(cái)務(wù)狀況和未來的發(fā)展趨勢(shì)。
2.監(jiān)督。監(jiān)督職能是會(huì)計(jì)人員在進(jìn)行會(huì)計(jì)核算的同時(shí),對(duì)特定主體經(jīng)濟(jì)業(yè)務(wù)的真實(shí)性、合法性和合理性進(jìn)行的審查。在大數(shù)據(jù)背景下,審查的對(duì)象由憑證、賬簿等轉(zhuǎn)變?yōu)槎喾N類型的會(huì)計(jì)數(shù)據(jù)。在財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)下,會(huì)計(jì)監(jiān)督工作迫切需要利用大數(shù)據(jù)技術(shù)對(duì)自身加以優(yōu)化完善,而這主要體現(xiàn)在會(huì)計(jì)數(shù)據(jù)的大量化、多樣化、高效化這三個(gè)方面,通過打通財(cái)務(wù)部門與采購(gòu)部門、生產(chǎn)部門、銷售部門之間的數(shù)據(jù)信息壁壘,推動(dòng)會(huì)計(jì)監(jiān)督數(shù)據(jù)的融合與共享,實(shí)現(xiàn)對(duì)會(huì)計(jì)數(shù)據(jù)的全天候、不間斷的主動(dòng)式監(jiān)督。在財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)下,大數(shù)據(jù)技術(shù)應(yīng)用于會(huì)計(jì)信息歸集、處理、分析,通過對(duì)各個(gè)流程數(shù)據(jù)的匯總與對(duì)比,借助非結(jié)構(gòu)化數(shù)據(jù)的提取利用,可以加強(qiáng)會(huì)計(jì)內(nèi)部監(jiān)督的職能,為不同的使用者提供高質(zhì)量的會(huì)計(jì)信息。當(dāng)前,基于大數(shù)據(jù)背景下的會(huì)計(jì)職能早已從反映過去向著預(yù)測(cè)未來轉(zhuǎn)變,財(cái)務(wù)報(bào)告也從事后報(bào)告向著實(shí)時(shí)報(bào)告加以轉(zhuǎn)型。所以,結(jié)合大數(shù)據(jù)技術(shù)與大數(shù)據(jù)思維,為會(huì)計(jì)監(jiān)督工作構(gòu)建一個(gè)行之有效的防范機(jī)制,對(duì)可能存在的風(fēng)險(xiǎn)問題加以防控,是加強(qiáng)事前、事中監(jiān)督的關(guān)鍵。
需要注意的是,在財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)下,由于非結(jié)構(gòu)化數(shù)據(jù)的比例增加,會(huì)計(jì)信息結(jié)構(gòu)日益復(fù)雜,會(huì)計(jì)監(jiān)督工作中傳統(tǒng)的統(tǒng)一的信息判斷標(biāo)準(zhǔn)開始失效,因此,需要對(duì)會(huì)計(jì)信息的質(zhì)量標(biāo)準(zhǔn)提出新的觀察維度,會(huì)計(jì)監(jiān)督工作需要在信息的數(shù)量與精確性之間找到有效平衡。
管理會(huì)計(jì)是面向企業(yè)內(nèi)部的會(huì)計(jì),是從數(shù)據(jù)到?jīng)Q策的一個(gè)過程。對(duì)于管理會(huì)計(jì),大數(shù)據(jù)的理念和技術(shù)為企業(yè)管理層合理配置資源和優(yōu)化決策并對(duì)當(dāng)前和未來的經(jīng)濟(jì)活動(dòng)進(jìn)行預(yù)測(cè)、決策、規(guī)劃、控制和考核評(píng)價(jià)提供了更多可能。從某種程度上來說,大數(shù)據(jù)是預(yù)測(cè)分析、決策分析、成本控制等管理會(huì)計(jì)職能得以良好運(yùn)用的基礎(chǔ)。此外,大數(shù)據(jù)還可以突破當(dāng)前管理會(huì)計(jì)工作的限制,實(shí)現(xiàn)高效的信息管理與存儲(chǔ),深入挖掘相關(guān)數(shù)據(jù)的價(jià)值,以此提高管理會(huì)計(jì)在實(shí)際工作中的效率。管理會(huì)計(jì)大數(shù)據(jù)是大數(shù)據(jù)及相關(guān)技術(shù)在管理會(huì)計(jì)中的應(yīng)用,具體體現(xiàn)為大數(shù)據(jù)及其相關(guān)技術(shù),尤其是分類、聚類、關(guān)聯(lián)、預(yù)測(cè)等數(shù)據(jù)挖掘算法在會(huì)計(jì)預(yù)測(cè)、決策、規(guī)劃、控制、考核評(píng)價(jià)職能中的具體實(shí)現(xiàn)。在數(shù)據(jù)挖掘算法中,常見的分類算法有C4.5、簡(jiǎn)單貝葉斯法、SVM、KNN、AdaBoost、CART 等算法,聚類算法有 K-Means、EM等,關(guān)聯(lián)算法有Aprior、FP-G、FreeSpan及prefixspan等算法,預(yù)測(cè)算法有人工神經(jīng)網(wǎng)絡(luò)、時(shí)間序列預(yù)測(cè)等算法。
1.預(yù)測(cè)。預(yù)測(cè)是管理會(huì)計(jì)的一個(gè)重要職能,它是對(duì)歷史數(shù)據(jù)用一定的統(tǒng)計(jì)方法進(jìn)行銷售預(yù)測(cè)、成本預(yù)測(cè)、利潤(rùn)預(yù)測(cè)等,比較常用的預(yù)測(cè)方法有因果預(yù)測(cè)和回歸分析。傳統(tǒng)的預(yù)測(cè)方法都有一個(gè)共同的缺陷,就是為了節(jié)約成本要對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單處理,這使得預(yù)測(cè)結(jié)果的準(zhǔn)確性受到影響。而在管理大數(shù)據(jù)下,通過數(shù)據(jù)挖掘技術(shù),利用趨勢(shì)分析、時(shí)間序列分析等方法,將數(shù)據(jù)進(jìn)行整理、存儲(chǔ)、分析、挖掘,將有助于更好地預(yù)測(cè)銷售、成本、資金等信息,進(jìn)而提高預(yù)測(cè)的準(zhǔn)確度,比如對(duì)市場(chǎng)調(diào)研的數(shù)據(jù)分析可以幫助企業(yè)建立更加科學(xué)規(guī)范的銷售預(yù)測(cè)體系。
2.決策?,F(xiàn)代管理會(huì)計(jì)的主要職責(zé)之一是為決策部門提供決策支持。企業(yè)的經(jīng)營(yíng)決策主要包括戰(zhàn)略目標(biāo)決策、短期經(jīng)營(yíng)決策、長(zhǎng)期經(jīng)營(yíng)決策等,這些決策的產(chǎn)生都需要大數(shù)據(jù)分析的支持,而這正是需要管理會(huì)計(jì)大數(shù)據(jù)的地方。在管理會(huì)計(jì)大數(shù)據(jù)下,通過積累的大量歷史數(shù)據(jù)和利用統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等技術(shù),能夠讓依賴于個(gè)人經(jīng)驗(yàn)的決策讓位于理性的數(shù)據(jù)決策。例如,貸款不是靠信貸員的主觀判斷而是由模型預(yù)測(cè)結(jié)果來決定是否給予貸款、利率應(yīng)該是多少;零售店不是靠管理人員判斷采購(gòu)哪些產(chǎn)品及采購(gòu)數(shù)量,而是依賴于模型數(shù)據(jù)分析的結(jié)果給出判斷依據(jù);定價(jià)決策可能不單純依賴成本,而是結(jié)合客戶特征、偏好與以往購(gòu)買行為,甚至能夠針對(duì)每一個(gè)客戶給出不同的定價(jià)。在管理會(huì)計(jì)大數(shù)據(jù)下,決策方式的轉(zhuǎn)變使得企業(yè)更智能化,并且由于企業(yè)掌握數(shù)據(jù)的獨(dú)特性,能夠構(gòu)建基于自身的核心競(jìng)爭(zhēng)力,無法被其他企業(yè)簡(jiǎn)單模仿,也不用擔(dān)心具有豐富經(jīng)驗(yàn)的員工離職給企業(yè)帶來嚴(yán)重的損失。
3.規(guī)劃。規(guī)劃是企業(yè)選擇和制定正確戰(zhàn)略的基礎(chǔ),是對(duì)未來整體性、長(zhǎng)期性、基本性問題的思考和考量,是通過編制各種計(jì)劃和預(yù)算實(shí)現(xiàn)的。它要求在最終決策方案的基礎(chǔ)上,將事先確定的有關(guān)經(jīng)濟(jì)目標(biāo)分解落實(shí)到有關(guān)預(yù)算中去,從而合理有效地組織協(xié)調(diào)企業(yè)供、產(chǎn)、銷及人、財(cái)、物之間的關(guān)系,并為控制和責(zé)任考核創(chuàng)造條件。管理會(huì)計(jì)以面向未來為基點(diǎn),以決策為主體,幫助企業(yè)管理者對(duì)未來進(jìn)行戰(zhàn)略規(guī)劃,為決策提供最優(yōu)信息,為企業(yè)的預(yù)算提供決策依據(jù)。非財(cái)務(wù)信息是企業(yè)進(jìn)行戰(zhàn)略規(guī)劃的基礎(chǔ),宏觀環(huán)境、行業(yè)競(jìng)爭(zhēng)度、價(jià)值鏈等非財(cái)務(wù)信息有助于企業(yè)選擇正確的戰(zhàn)略行動(dòng),而管理會(huì)計(jì)大數(shù)據(jù)的應(yīng)用將有力提升企業(yè)在規(guī)劃方面的能力。在應(yīng)用過程中,利用大數(shù)據(jù)技術(shù),如網(wǎng)絡(luò)搜尋、關(guān)鍵詞獲取等,全面掌握行業(yè)環(huán)境、價(jià)值鏈等各類關(guān)鍵信息,可以輔助企業(yè)進(jìn)行戰(zhàn)略決策;此外,大量運(yùn)營(yíng)的非財(cái)務(wù)數(shù)據(jù)有助于提升企業(yè)投資規(guī)劃能力,如利用水質(zhì)監(jiān)測(cè)積累的大數(shù)據(jù)來提高污水處理企業(yè)投資收益分析能力等。
4.控制??刂坡毮芫褪菍⒔?jīng)濟(jì)活動(dòng)的事前控制和事中控制有機(jī)地結(jié)合起來,通過事前確定科學(xué)可行的各種標(biāo)準(zhǔn),根據(jù)執(zhí)行過程中實(shí)際與計(jì)劃發(fā)生的偏差進(jìn)行原因分析,并及時(shí)采取措施加以調(diào)整、改進(jìn),確保經(jīng)濟(jì)活動(dòng)的正常進(jìn)行。管理會(huì)計(jì)中的流程管理和內(nèi)部控制等,將極大地加強(qiáng)企業(yè)對(duì)運(yùn)營(yíng)的控制,從而保證運(yùn)營(yíng)效率??刂频年P(guān)鍵在于事先確定的標(biāo)準(zhǔn),而明確標(biāo)準(zhǔn)的基礎(chǔ)在于對(duì)企業(yè)研發(fā)、采購(gòu)、生產(chǎn)、營(yíng)銷等各環(huán)節(jié)關(guān)鍵信息的掌握,尤其是非財(cái)務(wù)信息數(shù)據(jù)的積累、分析與應(yīng)用,是最大限度地改進(jìn)控制能力、提高企業(yè)整體運(yùn)營(yíng)效率的關(guān)鍵。大數(shù)據(jù)時(shí)代強(qiáng)調(diào)對(duì)企業(yè)日常經(jīng)營(yíng)管理活動(dòng)進(jìn)行全面記錄與分析,這將對(duì)控制效率的提升具有決定性作用。管理會(huì)計(jì)大數(shù)據(jù)下的控制職能可以采用指標(biāo)體系,將數(shù)據(jù)量化后建模達(dá)到計(jì)算指標(biāo)的目的,進(jìn)行偏差的查找,還可發(fā)揮監(jiān)測(cè)的作用。但是偏差的前提是有一個(gè)衡量標(biāo)準(zhǔn),大數(shù)據(jù)的數(shù)據(jù)計(jì)算能力能夠滿足這一前提。大數(shù)據(jù)能夠完善目前管理會(huì)計(jì)工具的應(yīng)用,比如用作業(yè)成本法來核算成本時(shí),利用互聯(lián)網(wǎng)收集基于作業(yè)層面的數(shù)據(jù),從而使得直接費(fèi)用更真實(shí),間接費(fèi)用也容易找到分配的因子,更好地實(shí)現(xiàn)成本控制的目標(biāo)。大數(shù)據(jù)還能夠系統(tǒng)地管理成本,傳統(tǒng)成本控制和管理所需的信息來自于企業(yè)內(nèi)部,但在管理會(huì)計(jì)大數(shù)據(jù)下,企業(yè)可以將外部信息收集起來與內(nèi)部信息結(jié)合,以達(dá)到全面、系統(tǒng)地控制成本。
在利用非財(cái)務(wù)信息進(jìn)行控制方面,成本控制的關(guān)鍵則取決于各項(xiàng)成本信息的細(xì)化與分析,從而形成控制的基本標(biāo)準(zhǔn)。沒有對(duì)日常大量關(guān)鍵非財(cái)務(wù)信息的存儲(chǔ)與分析,要想實(shí)現(xiàn)精確的控制異常艱難。以非財(cái)務(wù)信息為基礎(chǔ)的控制將更具及時(shí)性,能夠讓企業(yè)更快速地采取措施、糾正錯(cuò)誤。
5.考核評(píng)價(jià)。管理會(huì)計(jì)履行“考核評(píng)價(jià)經(jīng)營(yíng)業(yè)績(jī)”的職能,是通過建立責(zé)任會(huì)計(jì)制度來實(shí)現(xiàn)的,即在各部門各單位及每個(gè)人均明確各自責(zé)任的前提下,逐級(jí)考核責(zé)任指標(biāo)的執(zhí)行情況,找出成績(jī)和不足,從而為獎(jiǎng)懲制度的實(shí)施和未來工作提供必要的依據(jù)。作為管理會(huì)計(jì),其評(píng)價(jià)對(duì)象不是企業(yè),而是組織內(nèi)部的個(gè)人、分支機(jī)構(gòu)或業(yè)務(wù)條線;其評(píng)價(jià)標(biāo)準(zhǔn)不一定是財(cái)務(wù)信息,而是有賴于大量非財(cái)務(wù)信息或經(jīng)調(diào)整后的財(cái)務(wù)信息,以此來規(guī)避財(cái)務(wù)信息評(píng)價(jià)的缺陷。目前,大量企業(yè)管理控制與評(píng)價(jià)的標(biāo)準(zhǔn)都來自于數(shù)據(jù)管理。企業(yè)管理中經(jīng)常通過數(shù)據(jù)來查看、評(píng)價(jià)員工的工作動(dòng)態(tài)及績(jī)效考核,績(jī)效評(píng)價(jià)一直以來都是管理會(huì)計(jì)工作的一大難題,其難點(diǎn)之一在于實(shí)際評(píng)價(jià)時(shí)難以收集到所有與績(jī)效有關(guān)的信息,不管用什么樣的評(píng)價(jià)方法都不能完全客觀、準(zhǔn)確地評(píng)價(jià)績(jī)效高低。一方面,為了提高員工績(jī)效考核的科學(xué)性和合理性,管理會(huì)計(jì)有必要通過對(duì)大數(shù)據(jù)的收集、整理和分析,遵循先進(jìn)且公平的考核和獎(jiǎng)懲制度,當(dāng)員工的積極性受到極大鼓舞,這種激情將快速地反饋至企業(yè),促使企業(yè)實(shí)現(xiàn)強(qiáng)勁的發(fā)展。另一方面,在評(píng)價(jià)客戶信用方面,利用管理會(huì)計(jì)大數(shù)據(jù)可以準(zhǔn)確評(píng)價(jià)客戶信用,預(yù)測(cè)企業(yè)風(fēng)險(xiǎn)??蛻裟芊癜雌谥Ц端坟浛?,決定了企業(yè)需要承擔(dān)壞賬風(fēng)險(xiǎn)的大小。通過建立管理會(huì)計(jì)大數(shù)據(jù)平臺(tái),構(gòu)建多維數(shù)據(jù)庫(kù),從不同渠道獲得客戶不同維度的數(shù)據(jù),可以將事后分析轉(zhuǎn)為事先引導(dǎo)。針對(duì)責(zé)任成本制的企業(yè),成本中心、利潤(rùn)中心和投資中心都需要利用大數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù),通過數(shù)據(jù)挖掘技術(shù)進(jìn)行責(zé)任預(yù)算的編制以及實(shí)際中心數(shù)據(jù)和相關(guān)市場(chǎng)數(shù)據(jù)的確定,并且通過實(shí)際數(shù)據(jù)和預(yù)算數(shù)據(jù)的對(duì)比分析,對(duì)各中心的績(jī)效做出評(píng)價(jià)與考核。在管理會(huì)計(jì)大數(shù)據(jù)下,對(duì)評(píng)價(jià)職能的徹底改變還在于以往的評(píng)價(jià)角度更強(qiáng)調(diào)基于效率與效益的內(nèi)部評(píng)價(jià),由于擁有大量客戶評(píng)價(jià)反饋信息作為評(píng)價(jià)基準(zhǔn),并且是從客戶價(jià)值角度出發(fā)給出的直接評(píng)價(jià),將進(jìn)一步完善與拓展現(xiàn)有管理會(huì)計(jì)業(yè)績(jī)?cè)u(píng)價(jià)工具,提升管理會(huì)計(jì)工具應(yīng)用水平。
會(huì)計(jì)大數(shù)據(jù)是一套完整的“場(chǎng)景+需求+數(shù)據(jù)+技術(shù)”的解決方案,其本質(zhì)是運(yùn)用大數(shù)據(jù)采集、預(yù)處理、存儲(chǔ)與管理、計(jì)算、分析與挖掘、可視化一系列關(guān)鍵技術(shù)來服務(wù)財(cái)務(wù)會(huì)計(jì)體系和管理會(huì)計(jì)體系的應(yīng)用場(chǎng)景。
大數(shù)據(jù)采集通過RFID射頻數(shù)據(jù)、傳感器數(shù)據(jù)、社交網(wǎng)絡(luò)數(shù)據(jù)、移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)等方式獲得結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等多種類型的海量數(shù)據(jù)。大數(shù)據(jù)采集從數(shù)據(jù)源上可以分為四類:Web數(shù)據(jù)(包括網(wǎng)頁、視頻、音頻、動(dòng)畫、圖片等)、日志數(shù)據(jù)、數(shù)據(jù)庫(kù)數(shù)據(jù)、其他數(shù)據(jù)(感知設(shè)備數(shù)據(jù)等)?;ヂ?lián)網(wǎng)上會(huì)產(chǎn)生大量的日志、網(wǎng)頁、音頻、視頻等Web數(shù)據(jù),價(jià)值密度較低,收集難度大。數(shù)據(jù)庫(kù)數(shù)據(jù)主要源自會(huì)計(jì)信息系統(tǒng)和業(yè)務(wù)信息系統(tǒng),其中,會(huì)計(jì)信息系統(tǒng)包含了大量的以財(cái)務(wù)會(huì)計(jì)為主的結(jié)構(gòu)化數(shù)據(jù)、價(jià)值密度高,收集難度較小,而業(yè)務(wù)信息系統(tǒng)包含了大量的結(jié)構(gòu)化和非結(jié)構(gòu)化的管理會(huì)計(jì)大數(shù)據(jù)。感知設(shè)備上的數(shù)據(jù)包括大量音頻、視頻和圖片數(shù)據(jù),價(jià)值密度較低,收集難度大,可以從數(shù)據(jù)服務(wù)提供商處直接獲取,這些數(shù)據(jù)屬于管理會(huì)計(jì)大數(shù)據(jù)范疇。
傳統(tǒng)的數(shù)據(jù)采集來源單一,且存儲(chǔ)、管理和分析數(shù)據(jù)量也相對(duì)較小,大多采用關(guān)系型數(shù)據(jù)庫(kù)和并行數(shù)據(jù)倉(cāng)庫(kù)即可處理。大數(shù)據(jù)采集技術(shù)面臨著諸多挑戰(zhàn):一方面數(shù)據(jù)源的種類多,數(shù)據(jù)的類型繁雜,數(shù)據(jù)量大,并且產(chǎn)生的速度快;另一方面需要保證數(shù)據(jù)采集的可靠性和高效性,同時(shí)還要避免數(shù)據(jù)重復(fù)。
和傳統(tǒng)的數(shù)據(jù)采集技術(shù)相比,大數(shù)據(jù)采集技術(shù)有兩個(gè)特點(diǎn):(1)大數(shù)據(jù)采集通常采用分布式架構(gòu)。大數(shù)據(jù)采集的數(shù)據(jù)流量大,數(shù)據(jù)集記錄條數(shù)多,傳統(tǒng)的單機(jī)采集方式,在性能和存儲(chǔ)空間上都無法滿足需求。(2)多種采集技術(shù)混合使用。大數(shù)據(jù)采集不像普通數(shù)據(jù)采集那樣單一,往往是多種數(shù)據(jù)源同時(shí)采集,而不同的數(shù)據(jù)源對(duì)應(yīng)的采集技術(shù)通常不一樣,很難有一種平臺(tái)或技術(shù)能夠統(tǒng)一采集所有的數(shù)據(jù)源,因此大數(shù)據(jù)采集時(shí),往往是多種技術(shù)混合使用,要求更高。傳統(tǒng)企業(yè)會(huì)使用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù) MySQL 和 Oracle 等來存儲(chǔ)數(shù)據(jù),隨著大數(shù)據(jù)時(shí)代的到來,Redis、MongoDB 和HBase 等 NoSQL 數(shù)據(jù)庫(kù)也常用于數(shù)據(jù)的存儲(chǔ)。企業(yè)通過在采集端部署大量數(shù)據(jù)庫(kù),并在這些數(shù)據(jù)庫(kù)之間進(jìn)行負(fù)載均衡和分片,來完成大數(shù)據(jù)采集工作。此外,會(huì)計(jì)大數(shù)據(jù)采集還包括感知設(shè)備數(shù)據(jù)采集,它是指通過傳感器、攝像頭和其他智能終端自動(dòng)采集信號(hào)、圖片或錄像來獲取數(shù)據(jù)。大數(shù)據(jù)智能感知系統(tǒng)需要實(shí)現(xiàn)對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的海量會(huì)計(jì)大數(shù)據(jù)的智能化識(shí)別、定位、跟蹤、接入、傳輸、信號(hào)轉(zhuǎn)換、監(jiān)控、初步處理和管理等,其關(guān)鍵技術(shù)包括針對(duì)會(huì)計(jì)大數(shù)據(jù)源的智能識(shí)別、感知、適配、傳輸、接入等。
大數(shù)據(jù)預(yù)處理是指針對(duì)財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)和管理會(huì)計(jì)大數(shù)據(jù)實(shí)施的數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約等一系列數(shù)據(jù)操作,達(dá)到審核、篩選、排序等目的,它區(qū)別于大數(shù)據(jù)分析階段的數(shù)據(jù)處理。當(dāng)采集到的數(shù)據(jù)量較小時(shí),只需要簡(jiǎn)單的數(shù)據(jù)處理就可以得到有效的數(shù)據(jù),但是大數(shù)據(jù)復(fù)雜的特點(diǎn)意味著在獲取數(shù)據(jù)時(shí),得到的部分?jǐn)?shù)據(jù)是臟數(shù)據(jù),也就是說,源系統(tǒng)中的數(shù)據(jù)不在給定的范圍內(nèi)或?qū)τ趯?shí)際的會(huì)計(jì)業(yè)務(wù)毫無意義,或是數(shù)據(jù)格式非法,以及在源系統(tǒng)中存在不規(guī)范的編碼和含糊的會(huì)計(jì)業(yè)務(wù)邏輯等。由于臟數(shù)據(jù)無法進(jìn)行數(shù)分析和挖掘,所以需要對(duì)大數(shù)據(jù)進(jìn)行預(yù)處理。
數(shù)據(jù)清洗是保證數(shù)據(jù)質(zhì)量的重要手段之一。并不是所有采集到的數(shù)據(jù)都是有價(jià)值的,有些數(shù)據(jù)可能與分析和挖掘需求無關(guān),有些甚至是完全錯(cuò)誤的干擾項(xiàng)。因此要對(duì)數(shù)據(jù)過濾、去噪,從而提取出有效的數(shù)據(jù)。數(shù)據(jù)清洗包括對(duì)缺失值、噪音數(shù)據(jù)和不一致數(shù)據(jù)的處理。對(duì)于缺失值,可用全局常量、屬性均值、可能值填充或者直接忽略該數(shù)據(jù)等方法處理。對(duì)于噪音數(shù)據(jù),即數(shù)據(jù)中存在著錯(cuò)誤、或偏離期望值的數(shù)據(jù),可用分箱(對(duì)原始數(shù)據(jù)進(jìn)行分組,然后對(duì)每一組內(nèi)的數(shù)據(jù)進(jìn)行平滑處理)、聚類、計(jì)算機(jī)人工檢查和回歸等方法去除噪音。對(duì)于不一致的數(shù)據(jù),可以進(jìn)行手動(dòng)更正。數(shù)據(jù)集成是把不同來源、格式、特點(diǎn)性質(zhì)的數(shù)據(jù)在邏輯上或物理上有機(jī)的集中,從而為企業(yè)提供全面的數(shù)據(jù)共享。
在這個(gè)過程中需要重點(diǎn)解決模式匹配、數(shù)據(jù)冗余、數(shù)據(jù)值沖突檢測(cè)與處理三個(gè)問題。數(shù)據(jù)變換是指對(duì)數(shù)據(jù)進(jìn)行規(guī)范化處理,從一種表示形式變換為另一種表現(xiàn)形式的過程,以達(dá)到適用于大數(shù)據(jù)分析和挖掘的目的,它包括平滑、聚集、離散化、規(guī)范化、屬性構(gòu)造和概念分層方式。數(shù)據(jù)規(guī)約是指在盡可能保持?jǐn)?shù)據(jù)原貌的前提下,最大限度地精簡(jiǎn)數(shù)據(jù)量,包括維規(guī)約、數(shù)量規(guī)約和數(shù)據(jù)壓縮三個(gè)方面。
大數(shù)據(jù)存儲(chǔ)與管理是對(duì)海量的財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)和管理會(huì)計(jì)大數(shù)據(jù)進(jìn)行歸檔、整理和共享的過程。在大數(shù)據(jù)下,由于從不同渠道獲得的數(shù)據(jù)通常缺乏一致性,數(shù)據(jù)結(jié)構(gòu)混雜,且數(shù)據(jù)不斷增長(zhǎng),更何況任何計(jì)算機(jī)都會(huì)有內(nèi)存容量、硬盤容量、處理器速度等物理上的限制,因此,對(duì)于那些希望從比存儲(chǔ)和使用成本更高的會(huì)計(jì)數(shù)據(jù)中獲得價(jià)值的企業(yè)和組織來講,有效的會(huì)計(jì)大數(shù)據(jù)存儲(chǔ)和管理變得比以往任何時(shí)候都更加重要。比如,對(duì)單機(jī)系統(tǒng)來說,即使及時(shí)不斷提升硬件配置也很難跟上數(shù)據(jù)規(guī)模增長(zhǎng)的速度,也需要在硬件限制和性能之間做出取舍。大數(shù)據(jù)存儲(chǔ)與管理技術(shù)需要重點(diǎn)解決會(huì)計(jì)大數(shù)據(jù)的可存儲(chǔ)、可表示、可處理、可靠性及有效傳輸?shù)汝P(guān)鍵問題,具體包括海量文件的存儲(chǔ)與管理,海量小文件的傳輸、索引和管理,海量大文件的分塊與存儲(chǔ),系統(tǒng)可擴(kuò)展性與可靠性方面的內(nèi)容。大數(shù)據(jù)存儲(chǔ)與管理技術(shù)對(duì)整個(gè)會(huì)計(jì)大數(shù)據(jù)系統(tǒng)至關(guān)重要,其好壞直接影響到整個(gè)會(huì)計(jì)大數(shù)據(jù)系統(tǒng)的性能表現(xiàn)。大數(shù)據(jù)存儲(chǔ)技術(shù)的核心是Hadoop的分布式文件系統(tǒng)HDFS(Hadoop Distributed File System)和分布式實(shí)時(shí)列式存儲(chǔ)數(shù)據(jù)庫(kù)管理系統(tǒng) HBase(Hadoop Database)等。
大數(shù)據(jù)存儲(chǔ)和管理并不只是被定義為接收、存儲(chǔ)、組織和維護(hù)創(chuàng)建的財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)和管理會(huì)計(jì)數(shù)據(jù),它還意味著包括更多的內(nèi)容:對(duì)數(shù)據(jù)進(jìn)行分類;聚合、收集和解析數(shù)據(jù)的元數(shù)據(jù);保護(hù)數(shù)據(jù)和元數(shù)據(jù)不受自然和人為中斷的影響;在內(nèi)部部署和地理上移動(dòng)數(shù)據(jù),以進(jìn)行共享、歸檔、復(fù)制、數(shù)據(jù)保護(hù)、存儲(chǔ)系統(tǒng)技術(shù)更新和遷移,并訪問所需的分析引擎,從而對(duì)該數(shù)據(jù)進(jìn)行更深入的研究;在進(jìn)行一次或多次移動(dòng)后,保持用戶和應(yīng)用程序?qū)?shù)據(jù)的透明訪問;提供用戶可定義的策略,這些策略可自動(dòng)移動(dòng)、復(fù)制和刪除數(shù)據(jù);部署人工智能和機(jī)器學(xué)習(xí)以優(yōu)化和自動(dòng)化大多數(shù)數(shù)據(jù)管理功能;搜索數(shù)據(jù)并提供可行的信息和見解;使數(shù)據(jù)符合個(gè)人識(shí)別信息法律和法規(guī);將數(shù)據(jù)管理擴(kuò)展到數(shù)百PB甚至EB級(jí)別。
大數(shù)據(jù)計(jì)算包括分布式離線計(jì)算框架MapReduce、分布式內(nèi)存計(jì)算框架Spark、流式實(shí)時(shí)計(jì)算框架Storm等技術(shù)。在會(huì)計(jì)大數(shù)據(jù)的實(shí)際應(yīng)用中,應(yīng)該根據(jù)具體的業(yè)務(wù)需求選擇對(duì)應(yīng)的解決方案。比如對(duì)于離線、非實(shí)時(shí)、靜態(tài)數(shù)據(jù)的處理,可以選用批處理方案;對(duì)于在線、實(shí)時(shí)、動(dòng)態(tài)的數(shù)據(jù)處理或者低延遲的場(chǎng)景,則可以選用流處理方案。
MapReduce作為典型的離線計(jì)算框架,其思想來自于Google公司2004年發(fā)表的論文,用于在集群環(huán)境下處理海量的、結(jié)構(gòu)復(fù)雜的數(shù)據(jù)文件。MapReduce通過對(duì)輸入的數(shù)據(jù)集進(jìn)行切分,形成若干獨(dú)立的數(shù)據(jù)塊,由Map任務(wù)對(duì)各個(gè)數(shù)據(jù)塊進(jìn)行處理,得到處理的中間結(jié)果;對(duì)結(jié)果進(jìn)行Shuffle操作,實(shí)現(xiàn)對(duì)結(jié)果的排序,并在此基礎(chǔ)上對(duì)結(jié)果進(jìn)行Reduce操作,實(shí)現(xiàn)對(duì)數(shù)據(jù)的匯總。事實(shí)上,MapReduce是一個(gè)基于集群的高性能并行計(jì)算平臺(tái),采用“分而治之”的思想把對(duì)大規(guī)模數(shù)據(jù)集的操作,分發(fā)給一個(gè)主節(jié)點(diǎn)管理下的各分界點(diǎn)共同完成,然后通過整合各個(gè)節(jié)點(diǎn)的中間結(jié)果得到最終結(jié)果。
Spark是一種與Hadoop相似的開源集群環(huán)境,專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎,利用主控節(jié)點(diǎn)、工作節(jié)點(diǎn)和協(xié)調(diào)節(jié)點(diǎn)實(shí)現(xiàn)集群的狀態(tài)維護(hù)和配置管理。Spark不同于MapReduce的是,其Job中間輸出結(jié)果可以保存在內(nèi)存中,從而不再需要讀寫HDFS,因此Spark能更好地適用于數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)等需要迭代的MapReduce的算法。Spark 啟用了內(nèi)存分布數(shù)據(jù)集,除了能夠提供交互式查詢外,它還可以優(yōu)化迭代工作負(fù)載。
隨著越來越多的場(chǎng)景對(duì)Hadoop的MapReduce高延遲無法容忍,比如網(wǎng)站統(tǒng)計(jì)、推薦系統(tǒng)、預(yù)警系統(tǒng)、金融系統(tǒng)(高頻交易、股票)等,大數(shù)據(jù)實(shí)時(shí)處理解決方案(流計(jì)算)的應(yīng)用日趨廣泛,目前已是分布式技術(shù)領(lǐng)域關(guān)注的重點(diǎn),而Storm更是流計(jì)算技術(shù)中的主流技術(shù)之一。Storm為用戶提供了豐富的服務(wù)和編程接口,大大提高了用戶管理的效率,降低了學(xué)習(xí)和開發(fā)的門檻。此外,Storm提供了可靠性保障,不僅提供對(duì)分布式的組件級(jí)的容錯(cuò),而且提供不丟失數(shù)據(jù)的記錄及容錯(cuò)保證,這為實(shí)時(shí)分析、在線學(xué)習(xí)和挖掘等提供了開放、強(qiáng)大的解決方案。
大數(shù)據(jù)分析和挖掘都是從財(cái)務(wù)會(huì)計(jì)和管理會(huì)計(jì)數(shù)據(jù)中提取一些有價(jià)值的信息,會(huì)計(jì)大數(shù)據(jù)分析更多在于利用工具和專業(yè)知識(shí)分析數(shù)據(jù)。
大數(shù)據(jù)分析是將采集到的大量財(cái)務(wù)大數(shù)據(jù)和管理會(huì)計(jì)大數(shù)據(jù)通過匯總、理解并消化,旨在發(fā)現(xiàn)數(shù)據(jù)的價(jià)值。最初的數(shù)據(jù)分析來源于統(tǒng)計(jì)學(xué)家和經(jīng)濟(jì)學(xué)家的一些理論,進(jìn)而結(jié)合一定的實(shí)際應(yīng)用場(chǎng)景解決問題,更多的是偏重于業(yè)務(wù)層次的。常見的大數(shù)據(jù)分析編程工具包括SAS、R、SPSS等。大數(shù)據(jù)分析常用的手段是基于數(shù)據(jù)倉(cāng)庫(kù)的OLAP聯(lián)機(jī)分析處理。在會(huì)計(jì)大數(shù)據(jù)環(huán)境下,以特定主題為導(dǎo)向,數(shù)據(jù)倉(cāng)庫(kù)將各個(gè)業(yè)務(wù)系統(tǒng)中與分析有關(guān)的數(shù)據(jù)通過ETL操作整理在一起,實(shí)現(xiàn)對(duì)目標(biāo)數(shù)據(jù)的管理和維護(hù)。在此基礎(chǔ)上,利用OLAP分析工具對(duì)數(shù)據(jù)進(jìn)行切塊、切片、旋轉(zhuǎn)、上鉆、下取等操作,有利于從不同維度、不同粒度對(duì)數(shù)據(jù)進(jìn)行觀察理解,提取和總結(jié)有價(jià)值的知識(shí)。在會(huì)計(jì)大數(shù)據(jù)的實(shí)際應(yīng)用環(huán)境中,數(shù)據(jù)倉(cāng)庫(kù)和OLAP通常采用Hive工具實(shí)現(xiàn)對(duì)用戶的動(dòng)態(tài)多維分析,包括跨維計(jì)算和建模等。這里的Hive是基于Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具,主要用來進(jìn)行數(shù)據(jù)提取、轉(zhuǎn)化、加載,它是一種可以存儲(chǔ)、查詢和分析存儲(chǔ)Hadoop中的大規(guī)模數(shù)據(jù)的機(jī)制。在進(jìn)行會(huì)計(jì)大數(shù)據(jù)分析之前,需要從業(yè)務(wù)和財(cái)務(wù)的角度,對(duì)數(shù)據(jù)分析的維度數(shù)據(jù)進(jìn)行規(guī)劃和定義。
大數(shù)據(jù)挖掘是從海量的財(cái)務(wù)會(huì)計(jì)和管理會(huì)計(jì)數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可理解的模式的技術(shù)。通常利用統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過去的經(jīng)驗(yàn)法則)和模式識(shí)別等技術(shù)實(shí)現(xiàn)。常用的大數(shù)據(jù)挖掘工具包括Rapid Miner、Orange、Weka、Knime、Apache Mahout、SSDT(SQL Server數(shù)據(jù)工具)、Sisense、IBM SPSS Modeler、Oracle數(shù)據(jù)挖掘等。其中Rapid Miner、Orange、Weka、Knime、Apache Mahout 等均是開源工具,側(cè)重于對(duì)數(shù)據(jù)的挖掘分析和可視化操作,而Apache Mahout是基于Hadoop的一個(gè)機(jī)器學(xué)習(xí)庫(kù),主要關(guān)注分類、聚類和協(xié)同過濾問題,用于從海量數(shù)據(jù)中找到人們未知的、可能有用的、隱藏的規(guī)則。常用的會(huì)計(jì)大數(shù)據(jù)挖掘方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則等,它們分別從不同的角度對(duì)數(shù)據(jù)進(jìn)行挖掘。
大數(shù)據(jù)可視化是將財(cái)務(wù)會(huì)計(jì)大數(shù)據(jù)和管理會(huì)計(jì)大數(shù)據(jù)以不同的視覺表現(xiàn)形式呈現(xiàn)出來,包括相應(yīng)信息單位的各種屬性和變量,通過表達(dá)、建模,以及對(duì)立體、表面、屬性、動(dòng)畫的顯示,對(duì)數(shù)據(jù)加以可視化解釋,清晰有效地傳達(dá)與溝通信息。大數(shù)據(jù)可視化的基本思想是將存儲(chǔ)財(cái)務(wù)會(huì)計(jì)和管理會(huì)計(jì)大數(shù)據(jù)的數(shù)據(jù)庫(kù)中每一個(gè)數(shù)據(jù)項(xiàng)作為單個(gè)圖元元素表示,大量的數(shù)據(jù)集構(gòu)成數(shù)據(jù)圖像,同時(shí)將數(shù)據(jù)的各個(gè)屬性值以多維數(shù)據(jù)的形式表示,可以從不同的維度觀察數(shù)據(jù),從而對(duì)數(shù)據(jù)進(jìn)行更深入的觀察和分析。圖表、動(dòng)態(tài)圖的形式可將數(shù)據(jù)更加直觀地展現(xiàn)給用戶,從而減少用戶的閱讀和思考時(shí)間,以便更好地做出決策。在企業(yè)的年度匯報(bào)或者分析中,銷售部門、采購(gòu)部門或生產(chǎn)部門等可以通過大數(shù)據(jù)可視化將年度內(nèi)銷售、采購(gòu)、生產(chǎn)商品的數(shù)量、成本、單價(jià)等有效展示出來,通過高效的方式刻畫和呈現(xiàn)數(shù)據(jù)反映的本質(zhì)問題,豐富視覺效果,以直觀、生動(dòng)、易理解的方式呈現(xiàn)給管理層以做出戰(zhàn)略決策與調(diào)整。
傳統(tǒng)的數(shù)據(jù)可視化工具僅僅將數(shù)據(jù)加以組合,通過不同的展現(xiàn)方式提供給用戶,用于發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)信息。隨著大數(shù)據(jù)時(shí)代的來臨,已經(jīng)不再滿足于使用傳統(tǒng)的數(shù)據(jù)可視化工具來對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行抽取、歸納及簡(jiǎn)單的展現(xiàn)。新型的會(huì)計(jì)大數(shù)據(jù)可視化必須能夠滿足大數(shù)據(jù)需求,必須快速收集、篩選、分析、歸納、展現(xiàn)決策者所需要的信息,并根據(jù)新增的數(shù)據(jù)進(jìn)行實(shí)時(shí)更新。會(huì)計(jì)大數(shù)據(jù)可視化工具種類繁多,其中零編程工具包括Tableau、Microsoft Power BI等。
大數(shù)據(jù)技術(shù)與會(huì)計(jì)結(jié)合的概念眾多,內(nèi)涵差異較大,學(xué)術(shù)界還缺乏統(tǒng)一的共識(shí)。基于此,本文針對(duì)大數(shù)據(jù)及相關(guān)技術(shù)在會(huì)計(jì)領(lǐng)域的應(yīng)用,定義了會(huì)計(jì)大數(shù)據(jù)的概念,提出了會(huì)計(jì)大數(shù)據(jù)的內(nèi)容框架,并從大數(shù)據(jù)的采集、預(yù)處理、存儲(chǔ)和管理、計(jì)算、分析與挖掘、可視化方面對(duì)會(huì)計(jì)大數(shù)據(jù)的技術(shù)實(shí)現(xiàn)進(jìn)行了深入闡述。本文的研究可以為會(huì)計(jì)大數(shù)據(jù)的理論和方法體系建設(shè)奠定初步基礎(chǔ),能夠?yàn)闀?huì)計(jì)大數(shù)據(jù)的相關(guān)研究和具體應(yīng)用提供參考和借鑒。