◆廖 亮/ 宜昌市審計局
數據挖掘始于20世紀下半葉,是在當時多個學科的基礎上發(fā)展起來的,它是指從數據集合中自動抽取隱藏在數據中的那些有用信息的非平凡過程,這些信息的表現(xiàn)形式為規(guī)則、概念、規(guī)律及模式等。進入21世紀,數據挖掘技術伴隨著信息技術的發(fā)展日益成熟起來。如今數據挖掘融合了數據庫、人工智能、機器學習、統(tǒng)計學、高性能計算、模式識別、神經網絡、數據可視化、信息檢索和空間數據分析等多個領域的理論和技術,是21世紀初期對人類產生重大影響的十大新興技術之一。
隨著信息技術的迅速發(fā)展,被審計單位業(yè)務數據呈現(xiàn)出數據類型多樣化、數據關系離散化、數據來源多源化的特征,如何從這樣的數據中得到審計所需要的有價值的信息——利用數據挖掘技術可以提高數據分析效率,可以提供數據相關性分析的新思路,揭開隱藏在現(xiàn)象背后的原因。2019年,宜昌市審計局將數據挖掘技術運用到國有企業(yè)領導經濟責任審計工作中,運用SPSS STATISTICS 的均值分析功能,審計出某國有企業(yè)通過低價關聯(lián)交易,實現(xiàn)利益輸送的違法違規(guī)問題,審計成效顯著。
1.被審計單位宜昌市XX公司2017年4月26日至2018年3月25日銷售臺賬。
2.被審計單位宜昌市XX公司2016 年至2018 年的財務核算數據。
3.宜昌市工商注冊法人信息表。
4.宜昌市戶籍信息數據表。
5.相關國有企業(yè)領導人及其重要關系人名單。
1.審計思路
審計人員在核實企業(yè)經營績效時發(fā)現(xiàn),2016年至2018年該企業(yè)的銷售利潤率與行業(yè)平均水平相比顯著偏低,而企業(yè)的成本費用水平與行業(yè)平均水平差異不大,企業(yè)盈利能力低下。從企業(yè)的生產經營狀況來看,企業(yè)生產、銷售形勢良好,生產技術水平在同行業(yè)中處于較先進的水平,應收賬款回收及時,短期負債金額較小,沒有現(xiàn)金流動性風險,審計人員統(tǒng)計出的全年平均價格水平與行業(yè)平均水平接近,這些現(xiàn)象交織在一起,顯示出企業(yè)的盈利情況與生產情況、銷售情況不相吻合的矛盾。
審計人員通過利潤要素分析,把銷售單價作為審計重點,運用SPSS 均值分析,發(fā)現(xiàn)非關聯(lián)企業(yè)與關聯(lián)企業(yè)銷售單價之間相關性不明顯,即非關聯(lián)企業(yè)與關聯(lián)企業(yè)的單價沒有一起受到市場因素的影響而產生波動。審計人員抽取生產規(guī)模接近的20家客戶的銷售數據作為樣本,以月均單價為價格標準與關聯(lián)企業(yè)的當期銷售單價進行對比,發(fā)現(xiàn)企業(yè)通過對關聯(lián)企業(yè)低價銷售轉移利潤來進行利益輸送。
2.審計業(yè)務流程
審計業(yè)務流程如圖1所示。
圖1
步驟一:如圖2所示,利用市委組織部門提供的國有企業(yè)法人及其重要關系人名單,與工商部門提供的企業(yè)注冊與股東信息表進行關聯(lián)比對,查詢出這些重要關系人在企業(yè)中任職法人、股東的企業(yè)名單,將這些企業(yè)作為潛在的關聯(lián)企業(yè)。
SELECT[統(tǒng)一社會信用代碼],[企業(yè)名稱],[登記機關],[股東姓名]
FROM[2019 年度第三方數據庫].[dbo].[2019 年月宜昌市公司法人(縱向)信息表]
where 股東姓名='歐**'or 股東姓名='陳**'or 股東姓名='李**'or 股東姓名='蔡**'or 股東姓名='梅**'or 股東姓名='曹**'or 股東姓名='鄭**'
圖2
步驟二:通過分析企業(yè)利潤的來源要素,選擇銷售價格作為影響企業(yè)利潤的審計重點。
由于企業(yè)的營業(yè)利潤由相對固定的要素組成,通過圖表法分析(見圖3),在眾多要素中,銷售價格的影響是最直接、明顯的,產品數量、產品成本、稅金、費用等要素的影響因素比較固定,材料類、產品類的有數量控制,人工費有一定的行業(yè)定額標準,財務費用、稅金等有固定的利率或者稅率,變化的影響面比較小,而銷售價格的變動會直接影響到企業(yè)當期利潤,于是審計人員將企業(yè)銷售價格作為審計重點。
圖3
圖4 數據界面
步驟三:利用IBM SPSS Statistics 軟件導入處理好的銷售臺賬excel文件(見圖4),以字段“關聯(lián)企業(yè)”為對象分組(見圖5),研究分組間的價格均值差異。選擇“分析”菜單,選擇“比較均值”子項,再選擇“均值”,對“選項”進行設置(見圖6),以關聯(lián)企業(yè)字段為自變量和單價字段為因變量,研究關聯(lián)企業(yè)與非關聯(lián)企業(yè)的單價間有沒有差異,所得結果如圖7所示。
圖5 設置變量
圖6 設置選項
圖7
分析報告中數據總數為2134個,統(tǒng)計數據為2134個,占總數的100%,其中非關聯(lián)企業(yè)交易數為1866筆,關聯(lián)企業(yè)交易數為268筆。非關聯(lián)企業(yè)均值的標準誤為19.30,關聯(lián)企業(yè)均值的標準誤為38.50,兩值差異大。非關聯(lián)企業(yè)單價均值為3854.76 元,關聯(lián)企業(yè)單價均值為3481.90 元,差異額為372.86 元,差異率為關聯(lián)企業(yè)單價均值的10.7%。ANOVA表中F值為49.516,顯著性為0.000,表明各組均值之間有顯著差異,關聯(lián)企業(yè)單價與非關聯(lián)企業(yè)單價間的差異顯著。這種現(xiàn)象說明關聯(lián)企業(yè)的銷售單價沒有和非關聯(lián)企業(yè)一樣受到市場因素的影響發(fā)生同樣或者類似的波動,企業(yè)可能存在通過售價低于正常銷售均價的形式將本該留存于企業(yè)的利潤輸送到關聯(lián)企業(yè)的行為。
步驟四:根據關聯(lián)企業(yè)與非關聯(lián)企業(yè)單價的差異性現(xiàn)象,在采集的該企業(yè)銷售臺賬明細表中,選取相似經營規(guī)模、銷售數量接近的20 家客戶作為樣本企業(yè)(包含部分關聯(lián)企業(yè)),分別統(tǒng)計樣本企業(yè)在2017年至2018年間的年均銷售價格、季均銷售價格、月均銷售價格,比較三個價格之間的關系。由于企業(yè)銷售市場受多種因素的影響,以年和季為區(qū)間統(tǒng)計平均價格時間間隔太長,市場因素變化較快,其均價不能真實地反映相同市場條件下的實時銷售價格,于是放棄年均價格和季均價格,選擇月均價格作為衡量價格偏差的標準。
步驟五:將關聯(lián)企業(yè)的銷售價格與當月的參照均價進行比較,計算價格差,并以價格差乘以銷售數量,得到關聯(lián)企業(yè)利益輸送的金額,如圖8所示。
根據數據分析結果得知,某國有企業(yè)在2017年的5、6、7 三個月內,以低于本企業(yè)當月平均銷售價格15%以上的水平,低價向關聯(lián)企業(yè)銷售產品4720.3 噸,涉嫌利益輸送近315.77萬元。
圖8
審計人員現(xiàn)場核實了該國有企業(yè)疑點當期銷售臺賬、生產臺賬、應收賬款明細表、銀行對賬單,核算了當期成本,證實該國有企業(yè)2017年5月至7月間,以低于成本價的價格向關聯(lián)企業(yè)銷售產品,實現(xiàn)其利潤轉移輸送的目的,該案件已經移交紀委進一步查處。
數據挖掘是一門新興學科,把它運用到審計數據分析工作中既是一種技術革命,也是一種思維創(chuàng)新,其作為一種審計分析技術可以在審計數據分析的各個層面推廣使用。數據挖掘的技術基礎多來源于統(tǒng)計學,因此審計數據采集的覆蓋面會直接影響分析結果,審計實踐中應盡可能采集完整的數據集,如果只采集到部分數據,分析結果可能會產生偏差。