楊淑慧+潘德寶+徐芬+李磊
隨著中國人民銀行信息化水平的不斷提升,先后引入和升級了許多業(yè)務(wù)系統(tǒng),記錄和處理各項業(yè)務(wù)的經(jīng)營狀況、處理活動,形成了各類業(yè)務(wù)數(shù)據(jù)庫,儲存了海量業(yè)務(wù)數(shù)據(jù),大踏步邁入了大數(shù)據(jù)時代。面對大數(shù)據(jù)時代的到來,各級人民銀行內(nèi)部審計部門要保持高度的危機意識、未雨綢繆,正確認識大數(shù)據(jù)分析的理論核心數(shù)據(jù)挖掘技術(shù),逐步將數(shù)據(jù)挖掘技術(shù)引入人民銀行內(nèi)部審計工作。通過數(shù)據(jù)的全面掌握、挖掘技術(shù)的廣泛運用,實現(xiàn)對風(fēng)險的前瞻、全面、深入和持續(xù)的審計覆蓋,提高審計質(zhì)量,規(guī)避審計風(fēng)險,從更高層面為人民銀行業(yè)務(wù)發(fā)展提供更具戰(zhàn)略性、系統(tǒng)性和前瞻性的審計建議,改善組織運營,增加組織價值。
一、基本概念
(一)大數(shù)據(jù)
大數(shù)據(jù)又稱巨量數(shù)據(jù),所涉及的數(shù)據(jù)量規(guī)模巨大到無法使用傳統(tǒng)工具,在合理時間內(nèi)達到擷取、管理、處理并整理成有價值的信息。大數(shù)據(jù)具有數(shù)據(jù)容量巨大、數(shù)據(jù)類型紛繁、數(shù)據(jù)價值密度低和處理速度要求快的特點。
大數(shù)據(jù)對內(nèi)部審計工作具有重要影響:一是促使審計方式向連續(xù)審計轉(zhuǎn)變。隨著信息技術(shù)迅速發(fā)展,連續(xù)審計的重要性日益凸顯,大數(shù)據(jù)技術(shù)及大數(shù)據(jù)基礎(chǔ)使連續(xù)審計成為可能,連續(xù)審計可以降低傳統(tǒng)審計過程中的時滯問題,降低審計錯誤和風(fēng)險,為組織提供咨詢增值服務(wù);二是促進審計抽樣向系統(tǒng)化、智能化和模塊化發(fā)展。數(shù)據(jù)量的爆炸式增長使審計人員無法使用現(xiàn)行的抽樣審計方法揭示舞弊行為和技術(shù)性錯誤。大數(shù)據(jù)時代的審計抽樣算法可以對審計數(shù)據(jù)進行分析,進行數(shù)據(jù)挖掘,找出特征數(shù)據(jù),縮小抽取樣本的數(shù)量,降低審計成本、提高審計效率;利用關(guān)聯(lián)規(guī)則,預(yù)測被審計單位運營風(fēng)險的高低,幫助審計人員確定審計重點,實現(xiàn)精確打擊;三是促進審計成果的轉(zhuǎn)化與應(yīng)用。促進對以往審計中獲取的大量信息資料的匯總、歸納,從中找出內(nèi)在規(guī)律、共性問題和發(fā)展趨勢,通過匯總歸納宏觀性和綜合性較強的審計信息,為領(lǐng)導(dǎo)決策提供依據(jù);通過對帶有共性、普遍性、傾向性的問題進行挖掘,提煉出問題與數(shù)據(jù)中的關(guān)聯(lián)性,可以將所有問題通過IT手段檢查出來;將審計成果進行知識化留存;通過大數(shù)據(jù)技術(shù),將問題規(guī)則化并固化到系統(tǒng)中,以便于計算或判斷問題發(fā)展趨勢、對問題進行預(yù)警等。
(二)數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(Data Mining,DM)是一種計算機輔助技術(shù),用于從海量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中抽取出潛在的、有效的、新穎的、有用的和最終可以理解的知識的過程,又稱數(shù)據(jù)庫知識發(fā)現(xiàn)(Knowledge Discover of Database,KDD)。數(shù)據(jù)挖掘即能針對特定7876數(shù)據(jù)庫進行簡單的檢索和查詢,又能進行多層次、全方位的統(tǒng)計、分析、綜合和推理,越來越多的組織開始對記錄交易活動、經(jīng)營狀況和市場信息的海量數(shù)據(jù)進行數(shù)據(jù)挖掘,從而獲得有價值的信息,提高組織的盈利水平和競爭能力。審計人員可將具有相似性的會計數(shù)據(jù)進行聚類分組,從而發(fā)現(xiàn)異常賬目。
二、大數(shù)據(jù)視角下的人民銀行內(nèi)部審計模型
根據(jù)人民銀行業(yè)務(wù)實際和大數(shù)據(jù)處理要求,構(gòu)建了由數(shù)據(jù)獲取、數(shù)據(jù)整理、數(shù)據(jù)挖掘和審計應(yīng)用四階段構(gòu)成的人民銀行大數(shù)據(jù)審計模型,模型流程如圖1。
圖1 人民銀行大數(shù)據(jù)審計模型
(一)數(shù)據(jù)獲取。人民銀行內(nèi)審部門應(yīng)結(jié)合轄區(qū)業(yè)務(wù)實際,積極開展風(fēng)險評估工作,確定各業(yè)務(wù)風(fēng)險排序,擬定審計主題,針對特定的審計目標和審計內(nèi)容進行廣泛而深入的審前調(diào)查,掌握審計的范圍、審計的內(nèi)容、審計所需的信息。根據(jù)審前調(diào)查情況,審計人員有目的性的收集和整理與審計相關(guān)的數(shù)據(jù),服務(wù)于審計項目。該階段審計人員在保證不影響被審計單位業(yè)務(wù)系統(tǒng)的平穩(wěn)、持續(xù)運行前提下,采取諸如Microsoft SQL Server 2000等數(shù)據(jù)轉(zhuǎn)換工具,獲取、更新和維護審計相關(guān)數(shù)據(jù)。
(二)數(shù)據(jù)整理。該階段審計人員在充分分析數(shù)據(jù)質(zhì)量的情況下,運用數(shù)據(jù)庫各表之間的勾稽關(guān)系,剔除垃圾數(shù)據(jù),清理、轉(zhuǎn)換、載入和驗證提取的數(shù)據(jù),建立審計數(shù)據(jù)庫××,數(shù)據(jù)庫中的審計數(shù)據(jù)是集成的、一致的、高質(zhì)量的,便于后續(xù)審計工作的開展。數(shù)據(jù)庫是面向特定審計主題的,不同被審計單位的審計主題不同,因此審計人員要為不同審計對象設(shè)計不同的數(shù)據(jù)庫××,設(shè)計數(shù)據(jù)庫××包括數(shù)據(jù)庫××模型設(shè)計及數(shù)據(jù)處理設(shè)計,是一個循環(huán)往復(fù)、不斷優(yōu)化的過程,需要不斷地反饋和不斷地完善。該階段審計人員主要任務(wù)是為采集到的審計數(shù)據(jù)建立一個獨立與被審計單位數(shù)據(jù)庫的數(shù)據(jù)庫××,提供適合聯(lián)機分析處理和數(shù)據(jù)挖掘的數(shù)據(jù)存儲環(huán)境。
(三)數(shù)據(jù)挖掘。該階段審計人員可以使用簡單分析和多維分析工具對數(shù)據(jù)庫××進行數(shù)據(jù)分析,如:采用聯(lián)機分析處理的切塊、切片、旋轉(zhuǎn)和鉆取等技術(shù),對審計數(shù)據(jù)進行比較分析、比率分析、趨勢分析等。但在海量數(shù)據(jù)情況下,審計人員必須采用諸如統(tǒng)計分析、決策樹、人工神經(jīng)網(wǎng)絡(luò)和關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘算法,對數(shù)據(jù)庫××進行數(shù)據(jù)挖掘。
1.選擇數(shù)據(jù)挖掘算法。不同數(shù)據(jù)挖掘算法的思路、步驟、功能和應(yīng)用領(lǐng)域不盡相同,審計人員應(yīng)根據(jù)審計主題選擇挖掘方法,以得到對審計有指導(dǎo)意義的知識。
2.建立數(shù)據(jù)挖掘模型。選擇數(shù)據(jù)挖掘算法后,從分析數(shù)據(jù)入手,從數(shù)據(jù)庫××中提取主要變量,剔除無關(guān)變量,建立適合該算法的數(shù)據(jù)挖掘模型。
3.驗證數(shù)據(jù)挖掘模型。從數(shù)據(jù)庫××中選取多個樣本數(shù)據(jù),對挖掘模型進行驗證,確保數(shù)據(jù)挖掘模型實現(xiàn)既定審計目的。
4.運行數(shù)據(jù)挖掘模型。挖掘模型的運行由專業(yè)計算機工具完成,審計人員要認真評估挖掘結(jié)果,判定挖掘結(jié)果的準確性和有效性,保證挖掘結(jié)果得出正確審計結(jié)論。評估結(jié)果可能導(dǎo)致退回到之前的階段,重新選擇數(shù)據(jù)集合、數(shù)據(jù)挖掘算法或調(diào)整挖掘算法參數(shù)。
5.構(gòu)造審計知識庫。數(shù)據(jù)挖掘模型運行后,會呈現(xiàn)隱藏在數(shù)據(jù)庫××中的一些規(guī)律或者展示異常審計數(shù)據(jù),這些規(guī)律或者異常稱之為審計知識,不同的審計知識存儲在一起即構(gòu)成了審計知識庫,審計人員利用審計知識提取審計線索或違規(guī)及風(fēng)險情況。