◆隋學(xué)深/審計(jì)署審計(jì)科研所 黃 豐/審計(jì)署金融審計(jì)三局
大數(shù)據(jù)審計(jì)云平臺、審計(jì)大數(shù)據(jù)標(biāo)準(zhǔn)體系是實(shí)現(xiàn)審計(jì)大數(shù)據(jù)分析的基礎(chǔ)設(shè)施,審計(jì)大數(shù)據(jù)分析模型要素是發(fā)現(xiàn)審計(jì)線索、解決審計(jì)問題的直接生產(chǎn)工具,模型構(gòu)建是否科學(xué)直接影響審計(jì)大數(shù)據(jù)分析的效果。科學(xué)審計(jì)模型的構(gòu)建是一項(xiàng)科研性很強(qiáng)的工作,需要對審計(jì)業(yè)務(wù)的全面深入認(rèn)識和對計(jì)算機(jī)實(shí)現(xiàn)算法的深刻理解,并將二者有機(jī)結(jié)合、高度統(tǒng)一。
此類審計(jì)大數(shù)據(jù)分析模型依賴于審計(jì)實(shí)踐中形成并已被證明有效的經(jīng)驗(yàn),是基于已知經(jīng)驗(yàn)知識構(gòu)建的大數(shù)據(jù)分析模型?;趯徲?jì)業(yè)務(wù)中實(shí)體間相互關(guān)系的全面清晰描述,將審計(jì)專家經(jīng)驗(yàn)應(yīng)用于審計(jì)大數(shù)據(jù)分析,形成SQL 語句等計(jì)算機(jī)執(zhí)行語言構(gòu)成的查詢類大數(shù)據(jù)審計(jì)分析模型。通過查詢類大數(shù)據(jù)審計(jì)分析模型實(shí)現(xiàn)審計(jì)專家經(jīng)驗(yàn)的知識化、模型化,讓經(jīng)驗(yàn)以知識的形式得以固化和傳播,以模型的形式得以快速推廣和應(yīng)用,產(chǎn)生實(shí)際的審計(jì)生產(chǎn)力。
基于機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘類大數(shù)據(jù)分析模型發(fā)現(xiàn)的是事先沒有已知經(jīng)驗(yàn)的審計(jì)知識和規(guī)律,是機(jī)器學(xué)習(xí)算法通過對大數(shù)據(jù)中隱藏知識的挖掘,來發(fā)現(xiàn)審計(jì)線索和分析解決審計(jì)問題。
一是對全國現(xiàn)有的基于審計(jì)專家經(jīng)驗(yàn)的查詢類大數(shù)據(jù)分析模型進(jìn)行分類、改進(jìn)和完善。按行業(yè)對現(xiàn)有的審計(jì)大數(shù)據(jù)分析模型進(jìn)行分類整理。2004年至2012年,審計(jì)署連續(xù)開展了七屆計(jì)算機(jī)審計(jì)專家經(jīng)驗(yàn)和計(jì)算機(jī)審計(jì)方法征集工作,共征集評選出3683 篇計(jì)算機(jī)審計(jì)專家經(jīng)驗(yàn)和計(jì)算機(jī)審計(jì)方法。2013年和2015年,審計(jì)署審計(jì)科研所開展了兩次全國審計(jì)機(jī)關(guān)技術(shù)創(chuàng)新情況專題調(diào)研活動(dòng),出版了《審計(jì)技術(shù)創(chuàng)新發(fā)展報(bào)告及案例選編2013》《審計(jì)技術(shù)創(chuàng)新發(fā)展報(bào)告及案例選編2015》,分別發(fā)布了155篇和119篇審計(jì)技術(shù)創(chuàng)新案例。上述計(jì)算機(jī)審計(jì)專家經(jīng)驗(yàn)、計(jì)算機(jī)審計(jì)方法和審計(jì)技術(shù)創(chuàng)新案例是多年來全國審計(jì)機(jī)關(guān)寶貴經(jīng)驗(yàn)的積累和總結(jié),可以對其進(jìn)行更新和完善,構(gòu)建種類比較齊全的基于審計(jì)專家經(jīng)驗(yàn)的查詢類大數(shù)據(jù)分析模型庫。
二是目前可在審計(jì)專網(wǎng)建立審計(jì)大數(shù)據(jù)分析模型眾創(chuàng)和共享平臺,集全國審計(jì)人員智慧,不斷添加新的大數(shù)據(jù)分析模型。在保證信息安全的前提下,可由全國審計(jì)人員在統(tǒng)一平臺上,針對相同或相近的審計(jì)問題交流經(jīng)驗(yàn)、共同開發(fā)、開源共享代碼,充分發(fā)揮全國審計(jì)人員的積極性和創(chuàng)造性,推動(dòng)構(gòu)建具有時(shí)代性、實(shí)用性的審計(jì)大數(shù)據(jù)分析模型。
一是以科研攻關(guān)的形式逐一攻克基于機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘類大數(shù)據(jù)分析模型構(gòu)建難點(diǎn)。構(gòu)建數(shù)據(jù)挖掘類大數(shù)據(jù)分析模型的門檻相對較高,需要對深度學(xué)習(xí)、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、決策樹、貝葉斯、最小二乘等算法的數(shù)學(xué)機(jī)理透徹理解,實(shí)現(xiàn)計(jì)算機(jī)語言的熟練運(yùn)用,才能實(shí)現(xiàn)對審計(jì)大數(shù)據(jù)的分類、關(guān)聯(lián)規(guī)則、聚類、時(shí)間序列等數(shù)據(jù)挖掘分析。這類數(shù)據(jù)分析工作本質(zhì)上是科研創(chuàng)新工作,對數(shù)據(jù)、人員素質(zhì)和科學(xué)組織管理的要求都較高,需要以科研課題、科研攻關(guān)的形式逐一明確問題、逐一立項(xiàng),進(jìn)行專項(xiàng)科研攻關(guān)來解決。
二是需要梳理和歸納可以通過數(shù)據(jù)挖掘模型解決的審計(jì)問題,構(gòu)建人工智能審計(jì)問題庫。目前的機(jī)器學(xué)習(xí)算法適合解決分類、關(guān)聯(lián)規(guī)則、聚類、時(shí)間序列等問題。并不是所有的審計(jì)問題都能夠使用機(jī)器學(xué)習(xí)工具分析,因此需要將基于機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘類和基于審計(jì)專家經(jīng)驗(yàn)的查詢類相結(jié)合,共同構(gòu)成審計(jì)大數(shù)據(jù)分析模型體系。正是因?yàn)榛跈C(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘類大數(shù)據(jù)分析模型有其特定的應(yīng)用場景,需要系統(tǒng)地梳理審計(jì)業(yè)務(wù)問題,分門別類地構(gòu)建出可以用機(jī)器學(xué)習(xí)工具挖掘分析的人工智能審計(jì)問題庫。
三是需要在深刻洞悉審計(jì)問題和深入理解與審計(jì)問題相匹配的機(jī)器學(xué)習(xí)算法的基礎(chǔ)上,進(jìn)行大量數(shù)據(jù)分析實(shí)驗(yàn),構(gòu)建基于機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘類大數(shù)據(jù)分析模型。這項(xiàng)科研工作需要審計(jì)專家和大數(shù)據(jù)分析專家深度合作,將兩個(gè)領(lǐng)域的知識有機(jī)結(jié)合起來,研究出切實(shí)解決實(shí)際問題、高效準(zhǔn)確的大數(shù)據(jù)分析模型,為實(shí)現(xiàn)智能化審計(jì)添磚加瓦。
成都市審計(jì)局整合現(xiàn)有的計(jì)算機(jī)審計(jì)分析方法,以大數(shù)據(jù)處理技術(shù)為手段,創(chuàng)新推出了一套大數(shù)據(jù)審計(jì)模型,讓復(fù)雜的審計(jì)問題模型化,便于審計(jì)人員學(xué)習(xí)掌握和運(yùn)用操作。在此基礎(chǔ)上,進(jìn)一步推出了自動(dòng)化、形象化、可視化的數(shù)據(jù)分析功能,讓審計(jì)人員能夠直觀地接受和使用大數(shù)據(jù)模型開展分析工作,提高審計(jì)發(fā)現(xiàn)疑點(diǎn)線索的能力。
成都市審計(jì)局通過搜索引擎式查詢技術(shù)實(shí)現(xiàn)審計(jì)大數(shù)據(jù)分析低門檻化。除了將成型的各行業(yè)數(shù)據(jù)分析方法固化形成模型外,還將各區(qū)(市)縣的審計(jì)模型添加到平臺中,形成一套不斷擴(kuò)大的審計(jì)方法模型體系。目前已建立了部門大數(shù)據(jù)審計(jì)模型方法體系、企業(yè)大數(shù)據(jù)審計(jì)模型方法體系、專項(xiàng)資金大數(shù)據(jù)審計(jì)模型方法體系、自然資源資產(chǎn)大數(shù)據(jù)審計(jì)模型方法體系和區(qū)(市)縣大數(shù)據(jù)審計(jì)模型方法體系,如溫江區(qū)審計(jì)局開發(fā)了工程苗木及建材價(jià)格信息審計(jì)模塊,崇州市審計(jì)局開發(fā)了工程造價(jià)審計(jì)模塊,郫都區(qū)審計(jì)局開發(fā)了拆遷資金大數(shù)據(jù)審計(jì)模塊等。
杭州市審計(jì)局大數(shù)據(jù)模型建設(shè)分為三類。
第一類是基礎(chǔ)查詢模型。杭州智慧審計(jì)系統(tǒng)共構(gòu)建了公安戶籍信息查詢、財(cái)政供養(yǎng)人員查詢、工商登記信息查詢、社保信息查詢等21個(gè)審計(jì)基礎(chǔ)查詢模型,這些審計(jì)基礎(chǔ)查詢采用固定輸入輸出格式的方式,操作簡單,可實(shí)現(xiàn)單類審計(jì)信息的精確查詢。
第二類是主題查詢模型。審計(jì)主題庫是指與特定審計(jì)視角相關(guān)的審計(jì)數(shù)據(jù)的集合。杭州智慧審計(jì)一期系統(tǒng)構(gòu)建了法人、自然人和資金三個(gè)審計(jì)主題庫,以企業(yè)法人、自然人和資金三個(gè)審計(jì)視角為數(shù)據(jù)維度,把杭州審計(jì)數(shù)據(jù)中心與其相關(guān)的審計(jì)數(shù)據(jù)歸集在一起,形成審計(jì)數(shù)據(jù)集合。主題查詢模型以固定格式向?qū)徲?jì)人員展示審計(jì)數(shù)據(jù)中心內(nèi)與查詢對象相關(guān)的所有數(shù)據(jù),并提供數(shù)據(jù)關(guān)聯(lián)查詢?nèi)肟?,便于審?jì)人員全面了解相關(guān)內(nèi)容。
第三類是行業(yè)分析模型。杭州智慧審計(jì)一期系統(tǒng)圍繞財(cái)政審計(jì)、部門預(yù)算執(zhí)行審計(jì)、社保審計(jì)和國土審計(jì)等4 個(gè)重點(diǎn)審計(jì)行業(yè)構(gòu)建了20 個(gè)常用審計(jì)分析模型,對財(cái)政審計(jì)、社保審計(jì)、部門預(yù)算執(zhí)行審計(jì)等重點(diǎn)審計(jì)行業(yè)的歷年審計(jì)方法進(jìn)行分類匯總,提煉適用于同類審計(jì)事項(xiàng)的多個(gè)審計(jì)方法間的共同點(diǎn),構(gòu)建常用審計(jì)模型,實(shí)現(xiàn)同類審計(jì)問題的模式化分析。在常用審計(jì)分析模型上引入“表內(nèi)列間計(jì)算”和“數(shù)據(jù)穿透”來實(shí)現(xiàn)對某一類問題“靈活”分析,增加常用審計(jì)模型的適用范圍。