国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)時(shí)代基于孤立點(diǎn)分析的審計(jì)抽樣方法探討

2017-07-06 20:49周明杰繆慧玲
中國(guó)管理信息化 2017年12期
關(guān)鍵詞:大數(shù)據(jù)

周明杰+繆慧玲

[摘 要]在計(jì)算機(jī)技術(shù)發(fā)展過(guò)程中,海量的存儲(chǔ)及高效的計(jì)算機(jī)運(yùn)算為實(shí)際工作提供了較強(qiáng)的技術(shù)支持。審計(jì)工作需要處理和分析海量的財(cái)務(wù)數(shù)據(jù),利用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)開(kāi)展審計(jì)工作,能突破傳統(tǒng)方法的限制,并且提升工作效率。通過(guò)應(yīng)用計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的孤立點(diǎn)分析,構(gòu)建相應(yīng)的模型,能有效發(fā)現(xiàn)審計(jì)中的問(wèn)題,對(duì)審計(jì)工作的順利開(kāi)展具有重要意義。

[關(guān)鍵詞]孤立點(diǎn)分析;審計(jì)抽樣;大數(shù)據(jù)

doi:10.3969/j.issn.1673 - 0194.2017.12.022

[中圖分類(lèi)號(hào)]F239.2;TP311.13 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1673-0194(2017)12-00-02

在當(dāng)前時(shí)代背景下,有效開(kāi)展審計(jì)工作成為各行業(yè)發(fā)展的關(guān)鍵。通過(guò)實(shí)踐,相關(guān)技術(shù)研究人員發(fā)現(xiàn)應(yīng)用數(shù)據(jù)挖掘技術(shù)的孤立點(diǎn)分析,可以極大提升數(shù)據(jù)分析能力,輔助審計(jì)工作中的專(zhuān)業(yè)判斷,并發(fā)現(xiàn)隱含問(wèn)題,為審計(jì)工作提供必要的支持。

1 孤立點(diǎn)概述

所謂孤立點(diǎn),指的是在運(yùn)用計(jì)算機(jī)處理數(shù)據(jù)的過(guò)程中,出現(xiàn)的處于離散狀態(tài)的小規(guī)模數(shù)據(jù)對(duì)象,這一小部分?jǐn)?shù)據(jù)對(duì)象與數(shù)據(jù)中的一般規(guī)律和趨勢(shì)具有顯著差異。在海量數(shù)據(jù)中,往往會(huì)出現(xiàn)一些與眾不同的數(shù)據(jù),這些數(shù)據(jù)并不是由隨機(jī)偏差產(chǎn)生的,可能產(chǎn)生于完全不同的機(jī)制,所以在聚類(lèi)分析中表現(xiàn)為不屬于任何的簇或者類(lèi),這些數(shù)據(jù)對(duì)象一般被叫做噪聲,在相應(yīng)的孤立點(diǎn)分析中叫做孤立點(diǎn)。在審計(jì)領(lǐng)域,因?yàn)榫唧w的模型和審查背景存在一定差異,所以對(duì)于孤立點(diǎn)的分析也會(huì)得出不同的結(jié)論。此外,蓄意操作、操作錯(cuò)誤、整體數(shù)據(jù)偏差、系統(tǒng)和測(cè)量錯(cuò)誤等都會(huì)導(dǎo)致孤立點(diǎn)的出現(xiàn)。因此,相關(guān)審計(jì)人員需要關(guān)注這些因素,并對(duì)深入分析相關(guān)情況產(chǎn)生的原因,從中篩選出價(jià)值較高的信息內(nèi)容。

2 孤立點(diǎn)分析

孤立點(diǎn)分析,指的是利用數(shù)據(jù)分析方法和挖掘理論模型,發(fā)現(xiàn)數(shù)據(jù)在集中態(tài)勢(shì)下出現(xiàn)的異常值。在審計(jì)分析過(guò)程中,異常的頻率、事件和數(shù)據(jù)往往具有特殊的含義,且包含著重要信息,可以從中發(fā)現(xiàn)違規(guī)、違法行為的線索。

2.1 孤立點(diǎn)分析的步驟

孤立點(diǎn)分析方法大致包括兩個(gè)步驟。第一步:確定數(shù)據(jù)集合中變量的屬性,而后根據(jù)非財(cái)務(wù)數(shù)據(jù)和財(cái)務(wù)數(shù)據(jù)進(jìn)行分類(lèi)。接下來(lái)進(jìn)行因子分析,從多個(gè)變量指標(biāo)中選出具有一定代表性的綜合變量指標(biāo),而后達(dá)到數(shù)據(jù)降維的目的,是重要的多元統(tǒng)計(jì)方法。在分析過(guò)程中,使用解釋總方差可得到累計(jì)方差貢獻(xiàn)率,該指標(biāo)的高低直接影響原始數(shù)據(jù)代表程度的高低,若影響程度較高,則相應(yīng)的公共因子可信度就較高。計(jì)算輸出因子的荷載矩陣,能獲得原始數(shù)據(jù)的系數(shù)矩陣,相應(yīng)的元素?cái)?shù)據(jù)如果較高,那實(shí)際原始數(shù)據(jù)的解釋程度就比較理想,有利于對(duì)相應(yīng)公共因子命名,并能獲得預(yù)期的數(shù)據(jù)指標(biāo)。第二步:挖掘和檢測(cè)數(shù)據(jù),如果數(shù)據(jù)中呈現(xiàn)出離散狀態(tài)的小規(guī)模數(shù)據(jù),那么能發(fā)現(xiàn)孤立點(diǎn)。傳統(tǒng)方法主要應(yīng)用密度、偏差、距離的特定方法來(lái)尋找相應(yīng)的孤立點(diǎn)。此外,使用云計(jì)算技術(shù),能應(yīng)用比較復(fù)雜的運(yùn)算方式來(lái)計(jì)算相應(yīng)的計(jì)算資源。

2.2 孤立點(diǎn)分析的方法

第一,基于人工神經(jīng)網(wǎng)絡(luò)模型的方法。在這種方法中,可以使用比較小的統(tǒng)計(jì)數(shù)據(jù)集,同時(shí)也可以采用比較大的專(zhuān)業(yè)數(shù)據(jù)集,所以檢測(cè)大小數(shù)據(jù)孤立點(diǎn)都能獲得良好的效果。但是,這種方式在檢測(cè)具有放射狀孤立點(diǎn)數(shù)據(jù)集時(shí),實(shí)際效果不佳。

第二,基于偏離的分析方法。這種方式是根據(jù)數(shù)據(jù)對(duì)象的突出特征來(lái)進(jìn)行分析和檢查,并找出其中的孤立點(diǎn)。在這種分析模式下,一般采用OLAP數(shù)據(jù)立方體技術(shù)及序列異常技術(shù)。前者需要把審計(jì)中的異常單元進(jìn)行正確標(biāo)注并且下鉆,這樣可以發(fā)現(xiàn)更深層次的問(wèn)題。后者需要預(yù)先定義樣本集中的一般特征,并且把相應(yīng)的偏離和具備這些特征的樣本區(qū)別開(kāi)來(lái),可以通過(guò)相關(guān)審計(jì)數(shù)據(jù)集的總方差來(lái)發(fā)現(xiàn)相異度函數(shù)。

第三,基于距離的分析方法。這種方法主要對(duì)相關(guān)數(shù)據(jù)域的數(shù)據(jù)內(nèi)容進(jìn)行相異度分析,并且清洗相應(yīng)的審計(jì)數(shù)據(jù),檢驗(yàn)數(shù)據(jù)的有效性后,再根據(jù)相關(guān)審計(jì)內(nèi)容特征,通過(guò)公式計(jì)算出符合大部分對(duì)象之間距離的相應(yīng)閾值,同時(shí)把相應(yīng)數(shù)據(jù)定義為孤立點(diǎn)。通過(guò)這種方法,可以解決基于統(tǒng)計(jì)方法的數(shù)據(jù)分布特征相關(guān)問(wèn)題。

第四,基于密度的方式。這種方法主要使用數(shù)據(jù)對(duì)象的局部密度來(lái)檢測(cè)相應(yīng)孤立點(diǎn)。如果相關(guān)數(shù)據(jù)對(duì)象的區(qū)域密度和臨近相關(guān)數(shù)據(jù)的密度的實(shí)際局部孤立點(diǎn)因子值較大,那么就可能屬于孤立點(diǎn)。這種方法在發(fā)現(xiàn)局部孤立點(diǎn)時(shí)具有良好的效果。

在實(shí)際審計(jì)中,在異常檢測(cè)及處理審計(jì)數(shù)據(jù)的過(guò)程中,需要進(jìn)行孤立點(diǎn)分析。審計(jì)人員需要有效處理原始數(shù)據(jù),并完成相應(yīng)驗(yàn)證、清洗及采集,確保數(shù)據(jù)滿足相應(yīng)的建模要求,并且根據(jù)相關(guān)數(shù)據(jù)的特點(diǎn)來(lái)選擇合適的孤立點(diǎn)分析方法。

3 在大數(shù)據(jù)環(huán)境下應(yīng)用孤立點(diǎn)分析的審計(jì)抽象方法

3.1 提出需求

在審計(jì)過(guò)程中,審計(jì)人員需要根據(jù)自己的洞察能力來(lái)分析相應(yīng)的異常情況,并發(fā)現(xiàn)海量數(shù)據(jù)中的孤立點(diǎn),而后和相關(guān)人員進(jìn)行深度溝通,以全面了解審計(jì)需求。在明確審計(jì)需求時(shí),涉及數(shù)據(jù)理解及業(yè)務(wù)理解的內(nèi)容。所謂數(shù)據(jù)理解包括對(duì)業(yè)務(wù)流程及審計(jì)部門(mén)的理解,對(duì)原始數(shù)據(jù)的分析和收集,對(duì)數(shù)據(jù)的初步探索和檢測(cè)。業(yè)務(wù)理解包括數(shù)據(jù)挖掘目標(biāo)、項(xiàng)目計(jì)劃,評(píng)估審計(jì)目標(biāo)資料等,根據(jù)相關(guān)需求來(lái)進(jìn)行假設(shè)。

3.2 演示相應(yīng)的審計(jì)抽樣模型建構(gòu)原理

第一步,明確需要審計(jì)數(shù)據(jù)的集合的變量屬性,實(shí)施因子分析。相應(yīng)的背景是學(xué)?;üこ探Y(jié)算審計(jì),需要全面調(diào)查學(xué)校在公寓建設(shè)方面的資金進(jìn)出是否有效且合理,是否存在貪污公款、違規(guī)挪用的嚴(yán)重問(wèn)題。第二步,發(fā)現(xiàn)相應(yīng)的孤立點(diǎn)。筆者需要應(yīng)用基于距離的孤立點(diǎn)分成方法,并應(yīng)用K-means算法來(lái)尋找孤立點(diǎn),這樣做的目的是發(fā)現(xiàn)與相應(yīng)宿舍樓建設(shè)綜合情況差別較大的項(xiàng)目和影響因素,使用因子散點(diǎn)圖來(lái)探討實(shí)際原因。

3.3 實(shí)際案例分析

隨著高等院校招生規(guī)模不斷擴(kuò)大,為確保學(xué)生的正常生活和學(xué)習(xí),各高校都加強(qiáng)了自身的基礎(chǔ)設(shè)施建設(shè)。為了能夠有效、安全地使用相應(yīng)資金,各高校需要聯(lián)合監(jiān)察、紀(jì)委等部門(mén)進(jìn)行結(jié)算審計(jì),審計(jì)相應(yīng)的學(xué)生公寓樓工程。因?yàn)闀r(shí)間安排及人員方面的限制,不能全面審計(jì)全部公寓樓工程,需要通過(guò)孤立點(diǎn)分析的方式來(lái)選取相應(yīng)審計(jì)樣本。

第一步,需要掌握全部公寓樓的相關(guān)數(shù)據(jù),包括電線電纜、排水管道、采暖管道、門(mén)窗工程、保溫隔熱屋面、屋面卷材防水、鋼筋工程量、整體混凝土體積、輔助面積、使用面積、相應(yīng)的工程結(jié)算總價(jià)款及工程合同總價(jià)款,需要整合這些數(shù)據(jù)信息。由于篇幅的限制,本研究只分析工期時(shí)間、輔助面積、使用面積及建筑面積這四個(gè)變量,并根據(jù)相應(yīng)數(shù)據(jù)分析相關(guān)因素對(duì)工程結(jié)算總價(jià)款及工程合同總價(jià)款的影響。在明確相應(yīng)變量的屬性后,全面分析六個(gè)指標(biāo),并且得出解釋總方差,這樣可以得出累計(jì)方差貢獻(xiàn)率為90.975%。工程合同總價(jià)、工程結(jié)算總價(jià)款和建筑面積三個(gè)因子具有較強(qiáng)的可信度,所以需要使用這三個(gè)因子作為特定的公共因子。

第二步,使用K-means算法來(lái)進(jìn)行聚類(lèi)分析,這是為了尋找孤立點(diǎn)。在實(shí)際聚類(lèi)分析中,全部的觀測(cè)數(shù)據(jù)可以分成四個(gè)種類(lèi),這四個(gè)種類(lèi)中沒(méi)有缺失值,而且具有一定的有效性。分析結(jié)果表明,大部分?jǐn)?shù)據(jù)間是互相有關(guān)聯(lián)的,主要分布區(qū)間在1、2、4簇中,只能看到第三簇的數(shù)據(jù)與其他數(shù)據(jù)嚴(yán)重偏離。第三簇中的三個(gè)觀測(cè)點(diǎn)占觀測(cè)點(diǎn)數(shù)量的4.5%,低于10%,所以這三個(gè)觀測(cè)點(diǎn)屬于孤立點(diǎn)。通過(guò)聚類(lèi)分析的方式,能夠找到3個(gè)孤立點(diǎn),但以3個(gè)孤立點(diǎn)作為審計(jì)范圍的標(biāo)準(zhǔn)并不科學(xué),應(yīng)經(jīng)過(guò)多次數(shù)的迭代過(guò)程,這樣能確保數(shù)據(jù)集中相應(yīng)的孤立點(diǎn)。與此同時(shí),還需要聚類(lèi)分析1、2、4簇中的觀測(cè)點(diǎn)。相應(yīng)的步驟和文中相同,所以不再具體的描述。最后的步驟,需要總結(jié)分析四次的聚類(lèi)分析,并且發(fā)現(xiàn)其中的全部19個(gè)孤立點(diǎn),并且進(jìn)行審計(jì)抽樣,而后根據(jù)散點(diǎn)圖進(jìn)行全方位的審計(jì)。

3.4 判斷

檢測(cè)依據(jù)相關(guān)模型得出的最終數(shù)據(jù)挖掘結(jié)果,若檢測(cè)結(jié)果的異常情況在合理范圍內(nèi),那么審計(jì)人員可以根據(jù)自己的經(jīng)驗(yàn)判斷該結(jié)果是否達(dá)到標(biāo)準(zhǔn);如果沒(méi)有到達(dá)相應(yīng)水平,則可以不予處理。在建立基于孤立點(diǎn)分析的審計(jì)數(shù)據(jù)模型時(shí),需要深入了解相關(guān)數(shù)據(jù)內(nèi)容,并且合理把握孤立點(diǎn)算法和審計(jì)需求的融合程度,而后構(gòu)建統(tǒng)一標(biāo)準(zhǔn)。在這個(gè)過(guò)程中,只有持續(xù)地進(jìn)行反饋和論證,才能確保方案和挖掘模型的實(shí)用性及針對(duì)性。通過(guò)建立準(zhǔn)確的模型,發(fā)掘數(shù)據(jù),假設(shè)相應(yīng)的孤立點(diǎn),而后發(fā)現(xiàn)反常及特殊的孤立點(diǎn),通過(guò)查閱資料或者進(jìn)一步追蹤,就能發(fā)現(xiàn)問(wèn)題所在,并且發(fā)現(xiàn)不規(guī)范和舞弊行為,提升審計(jì)的實(shí)效性。

4 結(jié) 語(yǔ)

大數(shù)據(jù)為審計(jì)帶來(lái)了新的機(jī)遇和挑戰(zhàn),利用相應(yīng)的非財(cái)務(wù)數(shù)據(jù)能快速得出需要的信息,并且有利于提升審計(jì)的有效性。本文利用孤立點(diǎn)分析對(duì)策構(gòu)建了相應(yīng)的模型,并且通過(guò)針對(duì)性分析,達(dá)到降低審計(jì)成本、提升審計(jì)效率、降低審計(jì)風(fēng)險(xiǎn)的目的,具有較強(qiáng)的應(yīng)用價(jià)值。

主要參考文獻(xiàn)

[1]朱政,劉侃.孤立點(diǎn)分析在稅務(wù)審計(jì)上的發(fā)展運(yùn)用[J].硅谷,2012(19).

[2]陳麗娜.孤立點(diǎn)挖掘研究[J].內(nèi)江科技,2009(3).

[3]王越,劉亞輝,徐傳運(yùn).孤立點(diǎn)用戶意義分析在質(zhì)量管理中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2009(11).

[4]賈晨科,邱保志.基于局部孤立系數(shù)的孤立點(diǎn)挖掘[J].微計(jì)算機(jī)信息,2005(26).

[5]高恩陽(yáng),劉偉軍,王天然.一種基于線性規(guī)劃的孤立點(diǎn)檢測(cè)方法[J].控制工程,2013(6).

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
基于大數(shù)據(jù)的小微電商授信評(píng)估研究
大數(shù)據(jù)時(shí)代新聞的新變化探究
淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
“互聯(lián)網(wǎng)+”對(duì)傳統(tǒng)圖書(shū)出版的影響和推動(dòng)作用
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
尉氏县| 自治县| 密云县| 裕民县| 平原县| 通州区| 寿宁县| 乡城县| 东辽县| 即墨市| 邢台县| 北票市| 湄潭县| 阜城县| 杭锦后旗| 灵璧县| 平度市| 新邵县| 滕州市| 阳曲县| 温州市| 商都县| 建平县| 黔南| 从江县| 临安市| 彩票| 永德县| 监利县| 江阴市| 盐池县| 彭山县| 晋中市| 儋州市| 陵水| 全南县| 车致| 抚顺县| 吉木萨尔县| 昌邑市| 嘉祥县|