摘要:為了更好地推動扶貧政策的落實,在國家審計或內部過程中可以運用雙向大數(shù)據(jù)審計模式,讓數(shù)據(jù)信息幫助審計人員快速精準定位問題疑點,促進黨中央精準扶貧工作落到實處。雙向大數(shù)據(jù)審計模式針對異地審計過程中數(shù)據(jù)獲取、數(shù)據(jù)過濾、數(shù)據(jù)分析中的難點,嘗試將結果數(shù)據(jù)分析與業(yè)務邏輯再現(xiàn)有機融合,依靠邏輯演繹和歸納統(tǒng)計算法,提升教育扶貧、金融扶貧、健康扶貧、產(chǎn)業(yè)扶貧和精準幫扶定位方面的智慧審計成效。
關鍵詞:政策審計:大數(shù)據(jù)分析:應用建模
一、背景
2015年習近平總書記強調要科學謀劃好“十三五”扶貧開發(fā)工作,提出了扶貧“貴在精準,重在精準,成敗之舉在于精準”的理念,將大水漫灌式方法轉變?yōu)榫珳实喂嗍綆头?。十九大后,精準扶貧成為促進新時期三農(nóng)發(fā)展的關鍵舉措,確保貧困人口到2020年如期脫貧。為了更好地推動江蘇省扶貧政策的落實,發(fā)揮審計的專業(yè)監(jiān)督職能,各級審計機關和單位內審機構分級分批開展了扶貧政策落實情況跟蹤審計。
由于各個扶貧相關部門中信息系統(tǒng)的廣泛運用,計算機審計優(yōu)勢凸顯。相比傳統(tǒng)憑證臺賬式審計方法,通過運用大數(shù)據(jù)技術可以全面高效掌握有關部門和單位、各地區(qū)實施脫貧致富奔小康工程采取的措施、進展情況和工作成效。依靠數(shù)據(jù)分析定點關注產(chǎn)業(yè)扶貧、教育扶貧、健康扶貧、金融扶貧財政措施落實情況,方便揭露弄虛作假搞數(shù)字扶貧問題。
二、現(xiàn)狀
扶貧政策落實情況審計與傳統(tǒng)的財政資金審計、社保審計、工程審計和經(jīng)濟責任審計相比有著自身特點??傮w審計數(shù)據(jù)具有多、雜、廣、緊四大特征。一是對象多。單位多,涉及市級、區(qū)縣級、鄉(xiāng)鎮(zhèn)級的各類扶貧開發(fā)主管部門,財政部門、教育等相關職能部門,幫扶工作隊,鄉(xiāng)鎮(zhèn)政府,村委會;行業(yè)多,涉及金融機構、醫(yī)療機構、教育院校、龍頭企業(yè)、專業(yè)合作社和個體戶以及財政扶貧項目的建設和實施單位。二是類型雜。精準扶貧標準針對當?shù)卣?、企業(yè)、個人都有不同的指標,各級各地還針對性出臺了相關規(guī)定,種類繁雜。與此同時,各個審計對象都有一套自己的信息化系統(tǒng),開發(fā)標準、部署架構、數(shù)據(jù)交互都不相同。三是地域廣。相關鄉(xiāng)鎮(zhèn)、村落、企業(yè)以網(wǎng)狀分布在貧困縣多地,直線距離往往在20公里以上,審計的交通時間成本高。四是資源緊。審計現(xiàn)場時間短,數(shù)據(jù)分析的硬件主要考慮便攜性為主。和專業(yè)大型數(shù)據(jù)分析中心平臺相比,現(xiàn)場處理能力和存儲空間都相當有限。
因此傳統(tǒng)審計方法對扶貧審計的適用性并不高.很多數(shù)據(jù)分析模型和審計分析平臺都會水土不服,需要尋找一種靈活便捷的審計模式來應對此類小快靈的審計項目和需求。雙向大數(shù)據(jù)審計模式在近三年的扶貧審計中多次使用,查出了一些過去想查卻沒有能力查的問題,成為有益的嘗試。
三、原理
雙向大數(shù)據(jù)審計模式ARI/AOP是大數(shù)據(jù)審計功能模型棧在數(shù)據(jù)轉換層的重點細化,兼顧現(xiàn)有審計信息化建設成果及數(shù)據(jù)資源的復用。模式中的雙向不是簡單的功能模型架構中的自下而上或自上而下,更多地反映在兩個實際數(shù)據(jù)分析應用的切入點和著力點,為移動異地審計的大數(shù)據(jù)分析量身調配。其核心是嘗試將多維數(shù)據(jù)切片與業(yè)務系統(tǒng)模塊勘察進行雙向結合,從兩個不同方面增進審計需求的檢驗性和實現(xiàn)性。
ARI( Automatic Relation Investigation)的本質是將政策審計需求注入多維度信息關聯(lián)模型中,自動匹配相關信息并篩選矛盾數(shù)據(jù)。這類方法是傳統(tǒng)審計數(shù)據(jù)分析的改良升級。相比傳統(tǒng)單領域、重完整的審計數(shù)據(jù)分析建模方式,更加注重維度的拓展和數(shù)據(jù)切片的輕量化。在政策建模實施前盡可能掌握各類政務信息數(shù)據(jù),并打分計算其可靠性系數(shù)??煽啃韵禂?shù)=數(shù)據(jù)重要性。數(shù)據(jù)獨立性。數(shù)據(jù)重要性為樣本數(shù)據(jù)切片與審計目標的貼合程度,由低到高以1-5評分,數(shù)據(jù)獨立性為數(shù)據(jù)產(chǎn)生、管理和存儲的差異性,由高到低1-5評分,越是詳盡的數(shù)據(jù)切片可靠性系數(shù)越高。異地數(shù)據(jù)和跨部門數(shù)據(jù)可靠性系數(shù)也高于同部門不同條線數(shù)據(jù)。審計數(shù)據(jù)分析過程中選擇可靠性系數(shù)排名前列的數(shù)據(jù)切片,通過SQL或Python代碼來建立關聯(lián)比對模型。審計人員借助回歸分析、關聯(lián)挖掘、聚類學習等數(shù)學統(tǒng)計算法,自動化篩選出各類數(shù)據(jù)切片中的矛盾點和異常點,精準定位政策落實過程中的造假疑點。
AOP( Audit Oriented Programming)著眼于政務管理信息系統(tǒng)本身,以審計目標視角來檢測政策落實情況相關的一個或多個信息系統(tǒng)的開發(fā)全周期。當前,各類政策落實業(yè)務都是通過網(wǎng)絡連接的信息系統(tǒng)進行管理。信息管理系統(tǒng)是業(yè)務管理流程和業(yè)務執(zhí)行邏輯的信息化體現(xiàn),程序代碼上的漏洞和后門直接反映出業(yè)務管理流程上的風險點。以此為入口,能夠直接反映出政策執(zhí)行過程中的錯誤和問題。通過反編譯重要系統(tǒng)函數(shù)庫,來獲取重要計算、統(tǒng)計、存儲函數(shù)方法的開發(fā)編碼,驗證系統(tǒng)功能實現(xiàn)的真實性和合規(guī)性:通過瀏覽各個系統(tǒng)功能模塊的操作界面和執(zhí)行操作,來探尋能夠便于系統(tǒng)使用者用于數(shù)據(jù)編輯篡改的功能頁面:通過調閱系統(tǒng)運行的后臺日志腳本,來固化各類違規(guī)違紀操作的執(zhí)行痕跡。該方法緊盯各類數(shù)據(jù)報表的生成源頭,結合信息系統(tǒng)審計的部分功能,來披露由信息系統(tǒng)偽造出的鉤稽關系。
ARI/AOP分別從業(yè)務數(shù)據(jù)和業(yè)務系統(tǒng)兩個角度切入,目的性明確,審計效率較高。通過現(xiàn)場審計項目中數(shù)據(jù)分析各個階段的時間耗費成本對比,ARI/AOP雙向大數(shù)據(jù)審計模式在數(shù)據(jù)采集、標準化轉換、建平臺切片、應用遷移、復用變更方面更具有優(yōu)勢,更適合在多變的政策審計現(xiàn)場使用。
四、前提
(一)基礎準備
長期謀劃做好基礎性數(shù)據(jù)切片處理準備,為后期審計切片接口訪問創(chuàng)造條件。審計主體定期完成各類基礎性數(shù)據(jù)的入庫,在其基礎上完成多維切片的生成。扶貧審計期間明確各個相關職能單位的數(shù)據(jù)提供責任,從審計小組和審計對象及相關單位雙向發(fā)力,掃除雙向分析的數(shù)據(jù)源障礙。
(二)專業(yè)分工
為了更好地保障數(shù)據(jù)分析效率,提升雙向大數(shù)據(jù)審計成效,審計小組明確職能分工,在允許的情況下成立數(shù)據(jù)分析小組。配備具備數(shù)據(jù)建模分析技能和系統(tǒng)開發(fā)需求管理技能的審計人員,全面提升數(shù)據(jù)應用分析的專業(yè)化和精細化水平。
(三)時間分配
需要正確預估和認識數(shù)據(jù)獲取和數(shù)據(jù)整理的時間消耗。由于雙向大數(shù)據(jù)審計與傳統(tǒng)數(shù)據(jù)分析方式的時間分布差異,在時間節(jié)點安排和進度管理方面要盡可能向準備階段傾斜,在扶貧審計過程中將40%的時間用于數(shù)據(jù)對接和標準化切片,同時完成相關信息系統(tǒng)的摸排調研。
五、實踐
在近兩年的實際審計過程中,現(xiàn)場數(shù)據(jù)分析小組以ARI理念貫穿審計數(shù)據(jù)分析全過程,將省內各個地級市的建檔立卡、工商、社保、稅務、房產(chǎn)、項目建設等22個維度數(shù)據(jù)進行標準化切片,提取核心標準表,并計算出可靠性系數(shù)列表。選擇前十的數(shù)據(jù)進行關聯(lián)性建模,并進行模糊關聯(lián)和鏈式關聯(lián)分析。針對貧困人員權益、實際收入、補助發(fā)放、政策宣傳、幫扶績效情況運用python腳本完成數(shù)學模型,幫助某區(qū)精準定位幫扶對象,提升扶貧項目收益。
定位幫扶對象可以使用離散模型中常用的層次分析模型。層次分析法的基本思路與人對復雜問題的決策思維、判斷的過程大體上是一致的。首先,將問題分為3個層次:最上層為目標層,即選擇扶貧對象:最下層為方案層,即有哪些具體的幫扶對象;中間層為準則層,將人員相關的信息中關聯(lián)核心標準的十個項目作為十個準則。接著確定各項準則對于目標的權重及各個幫扶對象對于每一項準則的權重,這是一種定量方法。最后將方案層對準則層的權重和準則層對目標層的權重進行綜合,最終確定方案層對目標層的權重,使得問題得以解決。
扶貧效益是不是可以優(yōu)化就是數(shù)學規(guī)劃模型的典型應用。具體實現(xiàn)需要確定決策變量,將獲取效益與決策變量建立函數(shù)關系作為目標函數(shù),決策變量受限制的因素作為約束條件,從而形成數(shù)學規(guī)劃模型。求解模型的結果就可以判斷在約束條件下有沒有達到獲取效益最大化。
AOP模式也在多個地市級審計項目進行試點。將扶貧系統(tǒng)、醫(yī)保系統(tǒng)、學籍管理系統(tǒng)和信貸授權系統(tǒng)等10余個信息管理系統(tǒng)進行解析梳理,掌握系統(tǒng)研發(fā)的核心流程,建立與審計方案相關的核心功能映射。在厘清映射拓撲圖基礎上,以JS-GUI完成代碼反編譯定位,發(fā)現(xiàn)某縣系統(tǒng)中進出變動功能和信息調整功能模塊的操作后門,堵住了人為批量違規(guī)操作的漏洞,確保幫扶全覆蓋。
這些就可以使用統(tǒng)計回歸模型來實現(xiàn)。用統(tǒng)計方法對大量數(shù)據(jù)進行分析,建立回歸模型,擬合數(shù)據(jù)的走勢情況。根據(jù)模型參數(shù)相關系數(shù)R,用來檢驗樣本的結果是否能夠代表總體真實程度的F值,置信區(qū)間等統(tǒng)計量來判斷模型是否可信。如果模型可信,使用殘差分析法則可以找出其中的異常值。如果模型存在缺點,再分析修正模型,可以找出交互項來重新建立回歸模型,直至模型完全可信。
六、展望
ARI/AOP雙向大數(shù)據(jù)審計模式讓應用數(shù)學建模技術和信息化資源更好地下沉并融人異地審計現(xiàn)場,在兩年的異地扶貧審計過程中得到了不斷完善,彌補了傳統(tǒng)審計數(shù)據(jù)分析的靈活性和針對性局限,令審計更加智能化和自動化。根據(jù)雙向大數(shù)據(jù)審計模式特點,ARI/AOP不僅僅只局限于扶貧等政策落實情況審計,也能夠在具備充分信息化條件的經(jīng)濟責任審計和專項資金審計中一展身手。
參考文獻:
[1]C.L. Philip Chen, Chun-Yang Zhang, InformationSciences.Data-intensive applications,challenges,techniques, and technologies: A survey on Big Data, 2014(275).
[2]黃靜.面向方面程序切片技術及其在測試數(shù)據(jù)生成中的應用[J].知網(wǎng).2011.
[3]朱律.“大數(shù)據(jù)分析”技術在推進審計監(jiān)督全覆蓋中的運用,江蘇省審計廳網(wǎng)站.2015.6.25.
[4]中國政府網(wǎng).國務院關于印發(fā)存進大數(shù)據(jù)發(fā)展行動綱要的通知.2015.8.31.
[5]中國經(jīng)濟網(wǎng).習近平扶貧新論斷:扶貧先扶志、扶貧必扶智和精準扶貧.2016.01.3.
[6]姜啟源,謝金星,葉俊.數(shù)學模型(第五版)[M].北京:高等教育出版社.2018.
作者簡介:
何旦,無錫城市職業(yè)技術學院,江蘇無錫。