李煒雄
摘要:供電企業(yè)是面向全國(guó),為有用電需求的個(gè)人及企業(yè)用戶提供電力資源的主體,在電力銷售過(guò)程中由于銷售對(duì)象及業(yè)務(wù)流程節(jié)點(diǎn)較多,因此形成了海量的業(yè)務(wù)數(shù)據(jù)。在大數(shù)據(jù)時(shí)代下,如何有效地開(kāi)展電力營(yíng)銷審計(jì),已成為防范供電企業(yè)經(jīng)營(yíng)風(fēng)險(xiǎn)、促進(jìn)電力系統(tǒng)長(zhǎng)遠(yuǎn)發(fā)展的關(guān)鍵。在長(zhǎng)期的工作中,相關(guān)技術(shù)人員發(fā)現(xiàn)了基于數(shù)據(jù)挖掘技術(shù)的孤立點(diǎn)分析具有極強(qiáng)的數(shù)據(jù)分析能力,能在電力營(yíng)銷審計(jì)需要專業(yè)判斷時(shí)作為高效的輔助工具,找出隱藏的問(wèn)題數(shù)據(jù),為審計(jì)人員提供更有效的審計(jì)線索,提高審計(jì)工作的效率。本文就大數(shù)據(jù)時(shí)代下孤立點(diǎn)分析在電力營(yíng)銷審計(jì)中的有效應(yīng)用進(jìn)行了探索。
關(guān)鍵詞:孤立點(diǎn);數(shù)據(jù)挖掘;電力系統(tǒng);營(yíng)銷審計(jì);應(yīng)用探索
隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,其高效的運(yùn)算和海量的儲(chǔ)存為供電企業(yè)管理提供了強(qiáng)大的技術(shù)支持。尤其是涉及運(yùn)營(yíng)環(huán)節(jié)的審計(jì)工作,因?yàn)樾枰獙?duì)大量的財(cái)務(wù)數(shù)據(jù)和經(jīng)營(yíng)管理數(shù)據(jù)進(jìn)行分析,通過(guò)計(jì)算機(jī)的數(shù)據(jù)挖掘技術(shù)輔助開(kāi)展審計(jì)工作,可以有效減少傳統(tǒng)審計(jì)方法對(duì)審計(jì)工作的限制,有效提高審計(jì)效率。在大數(shù)據(jù)時(shí)代的今天,基于計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的孤立點(diǎn)分析方法,通過(guò)建立數(shù)據(jù)挖掘模型,具有快速發(fā)現(xiàn)異常審計(jì)現(xiàn)象的特點(diǎn),因此,孤立點(diǎn)分析在供電行業(yè)營(yíng)銷審計(jì)中具有深遠(yuǎn)的應(yīng)用意義。
一、孤立點(diǎn)和孤立點(diǎn)分析方法
孤立點(diǎn)分析,是數(shù)據(jù)挖掘技術(shù)中的一項(xiàng)重要技術(shù),主要用來(lái)檢測(cè)審計(jì)數(shù)據(jù)中的異常數(shù)據(jù),是針對(duì)常規(guī)審計(jì)工作中疑點(diǎn)數(shù)據(jù)的孤立點(diǎn)表現(xiàn)而產(chǎn)生的一種技術(shù)分析方法。
1.孤立點(diǎn)
在進(jìn)行審計(jì)的海量數(shù)據(jù)集中,通常會(huì)出現(xiàn)一些與眾不同的數(shù)據(jù),這些數(shù)據(jù)并不是由隨機(jī)偏差產(chǎn)生的,很有可能產(chǎn)生于完全不同的機(jī)制,因此在聚類分析中表現(xiàn)為不屬于任何的類或簇,這種數(shù)據(jù)對(duì)象在聚類中被稱為噪聲,在孤立點(diǎn)分析中則叫孤立點(diǎn)。在審計(jì)領(lǐng)域中,由于審查背景的不同和模型假設(shè)的差異,對(duì)于孤立點(diǎn)也會(huì)得出不同的結(jié)論。
另外,操作錯(cuò)誤、蓄意操作,以及測(cè)量、系統(tǒng)的錯(cuò)誤和相關(guān)總體數(shù)據(jù)的自然偏差等,都會(huì)導(dǎo)致孤立點(diǎn)的產(chǎn)生,因此,審計(jì)人員需對(duì)這些情況產(chǎn)生的原因進(jìn)行深入分析,從中篩選出有價(jià)值的審計(jì)信息。
2.孤立點(diǎn)分析方法
(1)孤立點(diǎn)分析方法的概念:孤立點(diǎn)分析方法是通過(guò)在給定的數(shù)據(jù)集合中找出定義不一致的數(shù)據(jù),并檢測(cè)這些不一致的數(shù)據(jù)的方法。即,給定一個(gè)有n個(gè)數(shù)據(jù)點(diǎn)的集和,并對(duì)其中可能出現(xiàn)的孤立點(diǎn)數(shù)目進(jìn)行預(yù)期,這個(gè)數(shù)值為k,發(fā)現(xiàn)與剩余的數(shù)據(jù)相比是顯著異常的、孤立的、或不一致的前k個(gè)對(duì)象的過(guò)程。
(2)孤立點(diǎn)分析方法介紹。基于距離的方法:即對(duì)數(shù)據(jù)域中的數(shù)據(jù)對(duì)象進(jìn)行相異度的分析,通過(guò)對(duì)審計(jì)數(shù)據(jù)進(jìn)行清洗,并檢驗(yàn)有效性后,結(jié)合所審計(jì)的行業(yè)的特點(diǎn),以公式計(jì)算出符合大多數(shù)對(duì)象之間距離的閾值,并將這個(gè)數(shù)據(jù)確定為一個(gè)孤立點(diǎn)。這個(gè)方法可以克服基于統(tǒng)計(jì)方法中數(shù)據(jù)分布特征確定的問(wèn)題。
基于偏離的方法:這一方法是通過(guò)對(duì)數(shù)據(jù)對(duì)象的主要特征進(jìn)行檢查從而確定孤立點(diǎn)。在基于偏離的方法中,主要采用的是序列異常技術(shù)和OLAP數(shù)據(jù)立方體技術(shù)。前者是通過(guò)對(duì)定義樣本集的一般特征進(jìn)行預(yù)先定義,從而將“偏離”這些特征的樣本區(qū)分出來(lái),是一種利用審計(jì)數(shù)據(jù)集的總方差找到相異度函數(shù)的有效方法。后者則是以審計(jì)中對(duì)異常的單元進(jìn)行標(biāo)注下鉆,從而發(fā)現(xiàn)更深層次的異常。
基于密度的方法:這個(gè)方法的是利用數(shù)據(jù)對(duì)象的局部密度來(lái)對(duì)孤立點(diǎn)進(jìn)行檢測(cè)。當(dāng)某一數(shù)據(jù)對(duì)象周圍區(qū)域的局部密度與其他鄰近數(shù)據(jù)的局部密度的局部孤立點(diǎn)因子(Locai OutlierFactor,LOF)值越大時(shí),則越有可能是孤立點(diǎn),從而提示相關(guān)審計(jì)人員注意,其特點(diǎn)是對(duì)于局部孤立點(diǎn)的發(fā)現(xiàn)效果較好。
基于距離和密度的聚類和孤立點(diǎn)檢測(cè)方法:這一方法是將距離和密度方法進(jìn)行融合,利用兩種方法的優(yōu)點(diǎn)來(lái)進(jìn)行準(zhǔn)確的聚類和孤立點(diǎn)確定,對(duì)于高維數(shù)據(jù)中的孤立點(diǎn)的識(shí)別更有效。
基于人工神經(jīng)網(wǎng)絡(luò)模型的方法:這一方法使用的數(shù)據(jù)集可以是較小的通用統(tǒng)計(jì)數(shù)據(jù)集,也可以是現(xiàn)實(shí)的較大的專用數(shù)據(jù)集,因此對(duì)于大小數(shù)據(jù)的孤立點(diǎn)檢測(cè)都能獲得較好的預(yù)期效果。但這一方法對(duì)于含有放射狀的孤立點(diǎn)數(shù)據(jù)集檢測(cè)效果不好。
在審計(jì)過(guò)程中,孤立點(diǎn)分析技術(shù)主要用于審計(jì)數(shù)據(jù)預(yù)處理過(guò)程和異常檢測(cè)兩個(gè)方面。審計(jì)人員需完成對(duì)原始數(shù)據(jù)的采集、清洗、驗(yàn)證,使數(shù)據(jù)滿足建模的需求,再根據(jù)數(shù)據(jù)的類型和特征從以上幾種常用的孤立點(diǎn)分析方法中找出適應(yīng)的孤立點(diǎn)算法,既可以選取其中一種,也可以將幾種方法進(jìn)行有效組合,以滿足審計(jì)工作尋找異常數(shù)據(jù)的要求。
二、孤立點(diǎn)分析方法在供電行業(yè)營(yíng)銷審計(jì)應(yīng)用中的流程
孤立點(diǎn)分析方法在電力營(yíng)銷行業(yè)審計(jì)工作中的應(yīng)用,應(yīng)結(jié)合供電行業(yè)的特點(diǎn),根據(jù)審計(jì)的需求,選擇合適的方法,一般情況下,具體工作可以遵循以下流程:
1.提出需求
在進(jìn)行審計(jì)時(shí),審計(jì)人員需根據(jù)自身的經(jīng)驗(yàn)和洞察力對(duì)經(jīng)營(yíng)業(yè)務(wù)中的異常情況進(jìn)行分析,找出業(yè)務(wù)及數(shù)據(jù)中的孤立點(diǎn),并與數(shù)據(jù)挖掘人進(jìn)行深入溝通,實(shí)現(xiàn)對(duì)審計(jì)需求的全面了解。在提出審計(jì)需求時(shí),相關(guān)內(nèi)容應(yīng)包括業(yè)務(wù)理解和數(shù)據(jù)理解兩個(gè)方面,業(yè)務(wù)理解包括審計(jì)項(xiàng)目目標(biāo)、評(píng)估審計(jì)目標(biāo)的資源、確定數(shù)據(jù)挖掘目標(biāo)、生成項(xiàng)目計(jì)劃,并根據(jù)這些需求進(jìn)行相關(guān)審計(jì)人員的假設(shè);數(shù)據(jù)理解則是對(duì)審計(jì)部門的系統(tǒng)和業(yè)務(wù)流程進(jìn)行了解,并對(duì)原始數(shù)據(jù)進(jìn)行采集分析,同時(shí)對(duì)數(shù)據(jù)質(zhì)量、數(shù)據(jù)變量進(jìn)行初步檢測(cè)和探索。
2.檢驗(yàn)
基于對(duì)審計(jì)需求的理解,相關(guān)數(shù)據(jù)挖掘人員需要對(duì)能否采用孤立點(diǎn)分析方法解決審計(jì)問(wèn)題進(jìn)行判斷。這需要預(yù)定義相關(guān)參數(shù)和孤立點(diǎn)的識(shí)別規(guī)則,后通過(guò)數(shù)據(jù)清理算法清理審計(jì)數(shù)據(jù),最終實(shí)現(xiàn)對(duì)孤立點(diǎn)的精準(zhǔn)定位。
3.建模
進(jìn)行相關(guān)審計(jì)的建模工作,需要數(shù)據(jù)挖掘人員根據(jù)實(shí)際情況,提交數(shù)據(jù)挖掘模型,并將相關(guān)的功能和作用向?qū)徲?jì)人員進(jìn)行詳細(xì)介紹,使審計(jì)人員熟悉模型并確定其使用方法,之后即可對(duì)數(shù)據(jù)挖掘模型進(jìn)行試用。
4.挖掘、評(píng)價(jià)
在挖掘模型的基礎(chǔ)上,審計(jì)人員對(duì)其得到的數(shù)據(jù)挖掘結(jié)果進(jìn)行評(píng)價(jià)。
5.修正和完善
如對(duì)模型得出的試用結(jié)果進(jìn)行評(píng)價(jià)發(fā)現(xiàn)模型與審計(jì)需求不相符,這時(shí)就需對(duì)模型進(jìn)行相應(yīng)的修正和完善,使模型迎合審計(jì)的需求。
6.重復(fù)評(píng)價(jià)
在對(duì)模型進(jìn)行調(diào)整后,對(duì)模型進(jìn)行重復(fù)評(píng)價(jià),保證其符合審計(jì)需求。
7.判斷
根據(jù)模型得出的最終數(shù)據(jù)挖掘結(jié)果進(jìn)行檢測(cè),如果結(jié)果的異常情況在合理范圍內(nèi),審計(jì)人員可以根據(jù)自身的經(jīng)驗(yàn)對(duì)其是否達(dá)到重要性水平進(jìn)行判斷,如果沒(méi)有達(dá)到相關(guān)水平則可不予處理。
在進(jìn)行基于孤立點(diǎn)分析方法的審計(jì)數(shù)據(jù)挖掘模型的建立時(shí),審計(jì)人員需對(duì)相關(guān)數(shù)據(jù)的進(jìn)行深入的理解,并對(duì)審計(jì)需求和孤立點(diǎn)算法的融合程度進(jìn)行有效把握,以此決定數(shù)據(jù)挖掘模型的建立標(biāo)準(zhǔn)。在這一過(guò)程中,需通過(guò)不斷的論證和反饋才能實(shí)現(xiàn)挖掘模型及方案在針對(duì)性、實(shí)用性上的最優(yōu)化。
在大數(shù)據(jù)時(shí)代下,孤立點(diǎn)分析在供電行業(yè)營(yíng)銷審計(jì)中的應(yīng)用,是實(shí)現(xiàn)科學(xué)審計(jì)的重要前提。根據(jù)供電行業(yè)營(yíng)銷業(yè)務(wù)的特點(diǎn),通過(guò)制定最佳的]孤立點(diǎn)分析方法,可以為相關(guān)審計(jì)工作提供最符合需求的數(shù)據(jù)、目標(biāo)及審計(jì)環(huán)境,從而得到最滿意的結(jié)果。當(dāng)然,要實(shí)現(xiàn)審計(jì)目標(biāo),還需要相關(guān)審計(jì)人員具備扎實(shí)的專業(yè)技能和豐富的經(jīng)驗(yàn),通過(guò)對(duì)算法的科學(xué)選擇和模型的精確建立,對(duì)相關(guān)數(shù)據(jù)進(jìn)行深入挖掘,假設(shè)孤立點(diǎn),并以此找出特殊的、反常的疑點(diǎn),進(jìn)一步追蹤、查閱相關(guān)資料,探尋異常問(wèn)題的本質(zhì),經(jīng)過(guò)分析驗(yàn)證營(yíng)銷業(yè)務(wù)中是否存在舞弊、違規(guī)等行為,從而提高審計(jì)效率,降低審計(jì)風(fēng)險(xiǎn),促進(jìn)供電行業(yè)的發(fā)展。
參考文獻(xiàn):
[1]陳丹萍.數(shù)據(jù)挖掘技術(shù)在現(xiàn)代審計(jì)中的運(yùn)用研究[J].南京審計(jì)學(xué)院學(xué)報(bào),2009,02:57-61.
[2]魏克哲.孤立點(diǎn)分析方法在現(xiàn)代審計(jì)中的運(yùn)用研究[J].財(cái)會(huì)學(xué)習(xí),2013,05:43-45.
[3]孫柏林.“大數(shù)據(jù)”技術(shù)及其在電力行業(yè)中的應(yīng)用[J].電氣時(shí)代,2013,08:18-23.
[4]盧建昌,樊圍國(guó).大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)在電力企業(yè)中的應(yīng)用[J].廣東電力,2014,09:88-94.
現(xiàn)代營(yíng)銷·學(xué)苑版2017年1期