汪 倩 上海對外經(jīng)貿(mào)大學(xué)
資源環(huán)境審計的歷史在我國較短。由于我國地理范圍廣闊,地形分布復(fù)雜多樣,更是加大了資源環(huán)境審計的難度。2019年,南京市審計局在南京市水資源保護(hù)政策落實情況專項審計調(diào)查項目中,面對審計對象多、審計事項復(fù)雜、數(shù)據(jù)和審計資金量大的特點,積極采取“雙主審、雙方案、雙報告”的組織模式,深度融合大數(shù)據(jù)審計手段,取得了一定實效。2020年,江蘇省揚州市審計工作就將水資源審計作為資源環(huán)境審計的重中之重。揚州市審計局發(fā)布了多個加強(qiáng)資源審計的方案,并要求以“五個強(qiáng)審”行動計劃為引領(lǐng),深入推進(jìn)水環(huán)境審計高質(zhì)量發(fā)展。
水資源審計是水資源保護(hù)與治理中重要的一環(huán)。水源質(zhì)量的高低不僅會直接影響到居民的身體健康,也會對經(jīng)濟(jì)社會的健康可持續(xù)發(fā)展產(chǎn)生重大影響,由此可見,水資源保護(hù)與治理對整個社會的發(fā)展的重要性。水資源審計單位可以作為社會獨立機(jī)構(gòu),審計相關(guān)環(huán)保部門的資源保護(hù)的效果以及污水治理資金是否得到恰當(dāng)有效的利用,其具有一定的監(jiān)督評價力度。由于,我國水資源審計發(fā)展歷史較短,還存在一定的局限性。例如,審計人員的教育背景傾向財會方向,對環(huán)境資源相關(guān)的知識不了解。大數(shù)據(jù)可視化技術(shù)可以快速處理環(huán)境質(zhì)量檢測,污水排量與超標(biāo)因子等統(tǒng)計數(shù)據(jù),形成易于理解的圖形,便于審計人員從探求數(shù)據(jù)背后的規(guī)律和潛在問題。筆者結(jié)合大數(shù)據(jù)環(huán)境下基于數(shù)據(jù)可視化技術(shù)的電子數(shù)據(jù)審計方法(陳偉,2017),我國水資源審計的現(xiàn)狀與未來探討(耿建新,2018),研究基于數(shù)據(jù)可視化技術(shù)的水資源審計方法。
近幾年,大數(shù)據(jù)在我國計算機(jī)學(xué)科方面引起國民的高度關(guān)注,掀起了一股“人人都在學(xué)Python”的熱潮。其中,大數(shù)據(jù)可視化技術(shù)是指利用工具對數(shù)據(jù)進(jìn)行處理分析,用直觀的圖表向讀者展示最關(guān)鍵核心的信息,同時也便于讀者發(fā)現(xiàn)隱藏在大量數(shù)據(jù)中的異常數(shù)據(jù)。在互聯(lián)網(wǎng)時代,我們每天可以及時有效的接受到各種各樣的信息數(shù)據(jù),那么如何在海量的信息中,最便捷直觀的向讀者輸出關(guān)鍵信息,成了一大難題。而大數(shù)據(jù)可視化技術(shù)正好滿足這個要求。例如,在新冠疫情蔓延全國各地時,我們手機(jī)每日按各地區(qū)分類上報的新冠疫情感染人數(shù)的圖表,就是大數(shù)據(jù)可視化技術(shù)的結(jié)果,它可以直觀清晰的讓我們獲取相關(guān)的信息,以及近段時間數(shù)據(jù)的變化趨勢,也能為預(yù)測未來近期的趨勢提供相關(guān)有效數(shù)據(jù)。其次,在市場調(diào)研工作中,經(jīng)常需要使用到大數(shù)據(jù)可視化技術(shù),其可以有效的將市場產(chǎn)品相關(guān)的數(shù)據(jù)進(jìn)行處理,用多樣且具有藝術(shù)形態(tài)的圖表來體現(xiàn)核心思想,這使得向客戶的市場匯報具有一定的趣味性,同時又簡潔明了,便于工作中思想的有效交流傳達(dá)。
在獲取可視化圖表之前,我們首要工作就是進(jìn)行數(shù)據(jù)挖掘。行業(yè)報告和政府?dāng)?shù)據(jù)通常是需要自己在網(wǎng)上爬取相關(guān)數(shù)據(jù)。專業(yè)人士會選擇Python,但是市場也存在零代碼數(shù)據(jù)挖掘工具,例如造數(shù)。國內(nèi)爬蟲軟件如Gooseeker,八爪魚等。數(shù)據(jù)處理好后,我們就可以進(jìn)入可視化圖表制作了,其工具有BDP,Python等。由于Python相對與R語言要簡單,且是開源軟件,本文根據(jù)水資源審計需要,以Python為例,分析折線圖,詞云圖等可視化技術(shù)。
1.被審計單位的內(nèi)部數(shù)據(jù)
其主要包括兩類,一是體現(xiàn)被審計單位自身經(jīng)營狀況的文書報告,如水利工程建設(shè),省市重點排污企業(yè)名單,各地區(qū)用水量以及飲用水質(zhì)量檢測標(biāo)準(zhǔn)等,便于審計人員開展相關(guān)審計工作。二是水資源存量與質(zhì)量相關(guān)的具體數(shù)據(jù),如飲用水安全與污水基礎(chǔ)設(shè)施,污水排放標(biāo)準(zhǔn)。針對水資源審計工作的內(nèi)容,重點關(guān)注飲用水安全情況與污水排放治理工作等。
2.被審計單位的外部數(shù)據(jù)
審計人員所需的外部數(shù)據(jù)具體包括水質(zhì)自動監(jiān)測系統(tǒng)數(shù)據(jù),地區(qū)企業(yè)用水?dāng)?shù)據(jù)。全國部分地區(qū)設(shè)置的水質(zhì)自動監(jiān)測系統(tǒng),及時有效的為水資源審計提供大量的較準(zhǔn)確的數(shù)據(jù),節(jié)約了大量的審計采集數(shù)據(jù)的時間,形成較完整的數(shù)據(jù)采集,分析,預(yù)測和決策系統(tǒng)。審計人員基于各地區(qū)有關(guān)部門制定的污染排放標(biāo)準(zhǔn)、企業(yè)用水?dāng)?shù)據(jù)和相關(guān)環(huán)境政策法規(guī),結(jié)合相關(guān)污水基礎(chǔ)設(shè)施資金的運用情況,環(huán)保資金是否得到恰當(dāng)?shù)氖褂?。另外,審計人員可以使用爬蟲工具在環(huán)保部門網(wǎng)站上抓取需要的水資源質(zhì)量檢測數(shù)據(jù),如《xx省水資源公報》《xx省水利發(fā)展統(tǒng)計公報》《xx發(fā)展年鑒》以及巡測資料和水文站實時監(jiān)測成果。
審計人員結(jié)合大數(shù)據(jù)可視化技術(shù)進(jìn)行審計時,首先要確認(rèn)進(jìn)行可視化分析的目標(biāo)。通俗的話,一個具體的審計對象或?qū)徲嬆康牡奶岢?,其實就可以對?yīng)一個數(shù)據(jù)可視化的主體。確定數(shù)據(jù)圍繞的審計目的后,就可以獲取相關(guān)數(shù)據(jù),選擇合適的工具將數(shù)據(jù)進(jìn)行整理清洗,用合適的圖表將數(shù)據(jù)展示出來,最后將可視化的結(jié)果作為企業(yè)決策的依據(jù)。通常來說,我們可以把這個過程概括為三個階段,即采集、分析、應(yīng)用。
在第一階段,審計工作人員是到審計現(xiàn)場獲取進(jìn)行可視化分析時用到的有效數(shù)據(jù)。數(shù)據(jù)來源可以是業(yè)務(wù)檢測系統(tǒng),例如水源質(zhì)量監(jiān)測數(shù)據(jù)。傳統(tǒng)方式上獲取的數(shù)據(jù)來源于財務(wù)室相關(guān)的財務(wù)會計信息和管理部門發(fā)布的相關(guān)水污染防治工作情況的報告等。
當(dāng)我們收集到數(shù)據(jù)后,需要對數(shù)據(jù)進(jìn)行預(yù)處理,將沒有意義的數(shù)據(jù)和錯誤的數(shù)據(jù)剔除。數(shù)據(jù)分析階段是根據(jù)我們的審計具體目標(biāo),選擇合適的圖表,進(jìn)行統(tǒng)計分析,數(shù)據(jù)透視,地理分析等多種操作。
通過分析后會得到我們的數(shù)據(jù)可視化結(jié)果,通過對呈現(xiàn)的可視化圖標(biāo)進(jìn)行觀察,發(fā)現(xiàn)差異,獲取審計線索。進(jìn)一步對異常數(shù)據(jù)進(jìn)行延伸審計,最終獲取審計證據(jù),以期發(fā)現(xiàn)水資源管理中存在的問題并提出優(yōu)化建議,從而促進(jìn)水資源健康,可持續(xù)發(fā)展。
本文以建設(shè)飲用水安全工程,加強(qiáng)水污染防治工作為背景,從水資源數(shù)量和質(zhì)量上總體把握,以地下水源豐富,河湖眾多,水系復(fù)雜的xx省水資源審計為例,結(jié)合環(huán)保政策法規(guī),考察xx省2017—2019年期間水質(zhì)變化與水質(zhì)污染源數(shù)據(jù)情況,探究大數(shù)據(jù)可視化技術(shù)在水資源審計中的具體應(yīng)用。現(xiàn)已獲取xx省2017—2019年水質(zhì)均值檢測數(shù)據(jù),2019年國控重點排污單位自動監(jiān)控超標(biāo)數(shù)據(jù)等。目前,大數(shù)據(jù)分工具主要包括商業(yè)化軟件工具和開源的、可編程的工具。本文使用在國民圈大熱的大數(shù)據(jù)可視化分析軟件python,進(jìn)行可視化分析。
1.文本與文檔可視化分析
文字是傳遞信息最常用的載體。在浮躁的當(dāng)代社會,人們少有耐心讀面前大段文字,經(jīng)常是掃幾眼文章中的配圖。這體現(xiàn)了人們對圖片的接受程度要比枯燥的文字要高很多,此時就出現(xiàn)了另一種更高效的方式,即文本可視化。文本可視化處理的對象是文字,借助數(shù)據(jù)可視化的邏輯框架,通常運用編程軟件,將復(fù)雜大量的枯燥文本內(nèi)容,用有趣的圖表形式,將文本中的抽象的難以發(fā)現(xiàn)的現(xiàn)象規(guī)律展示出來,給人們一定的視覺沖擊感。
詞云是文本可視化分析技術(shù)的典型的結(jié)果形式,最先由美國一名副教授提出,是最新的,網(wǎng)絡(luò)流行的傳播方式。在新浪微博上,我們可以經(jīng)??吹酱笮〔灰粯樱l率不一樣的文字的圖片,卻其中一段文字在大量文字中異常顯眼突出,讓我們過目不忘,這就是詞云的效果。為了在大量文本信息中突出關(guān)鍵文本信息,給予視覺上的沖擊,讓讀者一眼就能抓住文本的核心內(nèi)容。其廣泛應(yīng)用于報紙,雜志等傳媒和互聯(lián)網(wǎng)行業(yè)。
2.全省水質(zhì)月報數(shù)據(jù)變化分析
圖1 2017—2019年水質(zhì)自動檢測數(shù)據(jù)達(dá)標(biāo)率變化情況
為了從整體上把握被審計地區(qū)水資源質(zhì)量情況,審計人員首先應(yīng)該采集相關(guān)水質(zhì)檢測數(shù)據(jù)和收集相關(guān)的文件公告。此時,面對環(huán)保部門官網(wǎng)的實時更新的質(zhì)檢數(shù)據(jù),可以借助前文提到的爬蟲軟件。在此基礎(chǔ)上,借助Python工具,采用折線圖分析,從而有效清晰地分析水質(zhì)變化情況。例如,2017—2019年水質(zhì)月報數(shù)據(jù)變化分析情況,分析結(jié)果如圖1所示。其中,三條顏色不同的折線分別為集中式飲用水水源地,太湖流域重點斷面,南水北調(diào)控制斷面水質(zhì)的月達(dá)標(biāo)率。
由圖1可以容易發(fā)現(xiàn)太湖流域重點斷面水質(zhì)達(dá)標(biāo)率在近三年較平穩(wěn)上升。2016年太湖流域遭受特大洪水災(zāi)難,這對太湖流域斷面水質(zhì)有直接影響。據(jù)被審計單位相關(guān)重點水利工程建設(shè)進(jìn)展文本信息,可知于2017年、2018年,政府分別對太湖治理工程新溝河先后完成投資39 359萬元和9 400萬元,2019年完成太湖治理工程投資194 694萬元。圖線直觀的上升趨勢在一定程度上肯定了被審計單位關(guān)于加強(qiáng)太湖流域水資源保護(hù)和水污染防治,保障防汛等工作進(jìn)展的情況。其中,集中式飲用水水源地水質(zhì),檢測的達(dá)標(biāo)率控制在90%與100%之間,可以體現(xiàn)出飲用水安全管理工作進(jìn)行的較好。另外,圖示很明顯的異常點是2019年8月,南水北調(diào)控制斷面的水質(zhì)達(dá)標(biāo)率低到了40%,水質(zhì)情況屬于比較惡劣,需要引起審計人員的注意,應(yīng)當(dāng)及時進(jìn)行調(diào)查,從而發(fā)現(xiàn)原因是由于自然災(zāi)害,相關(guān)工程項目沒有實施到位,或者是自動檢測設(shè)備傳輸?shù)臄?shù)據(jù)異常問題,從而發(fā)現(xiàn)影響問題的線索。
3.全省國控重點污染源數(shù)據(jù)分析
為了解XX省2019年的國控重點污染源自動檢測數(shù)據(jù)超標(biāo)情況,審計人員可以借助編程工具進(jìn)行建模,計算該期間排放超標(biāo)的企業(yè)名單頻次情況;在此基礎(chǔ)上,按年度對所有排放超標(biāo)企業(yè)名單生成詞云圖進(jìn)行分析。詞云不僅可以用于展示標(biāo)簽,還可以展示更為復(fù)雜的文本信息,目的是給予使用者直觀的視覺感受,便于使用者抓取文本中的關(guān)鍵信息。詞云中字體的大小表示企業(yè)在2019年度重點排污單位自動監(jiān)控數(shù)據(jù)超標(biāo)公示表中出現(xiàn)的次數(shù)情況。圖2的分析結(jié)果表明:xx省2019年重點排污超標(biāo)單位有實聯(lián)化工有限公司、宿遷市群英紡織印染科技有限公司、連云港晨興環(huán)保產(chǎn)業(yè)有限公司、盱眙北控水務(wù)發(fā)展有限公司等。這些單位在2019年12次重點排污單位自動檢測數(shù)據(jù)超標(biāo)公示表中出現(xiàn)了至少六次以上。這些企業(yè)是污水排放的重大風(fēng)險點,也是今后政府審計需要督促內(nèi)部審計進(jìn)行經(jīng)常評價并報送的重點企業(yè)。政府審計可針對這些企業(yè)建立名單,并要求內(nèi)部審計定期報送具體評價結(jié)果,從而給出可能的處罰措施;另一方面,也可以發(fā)現(xiàn)行業(yè)中污水治理比較好的企業(yè),以便將其治理方案在行業(yè)中傳播,達(dá)到降低整個行業(yè)污水排放的目的。
圖2 重點排污單位內(nèi)容分析
審計人員可以將這幾個公司納入重點審計對象,對排污數(shù)據(jù)超標(biāo)因子進(jìn)行進(jìn)一步的延伸取證。抽離出重點排污單位,對其進(jìn)入深入分析。審計人員可以發(fā)現(xiàn):盱眙北控水務(wù)發(fā)展有限公司的超標(biāo)因子為COD。COD出水濃度指標(biāo)可以用來衡量污水對周圍環(huán)境的污染情況,COD出水濃度排放標(biāo)準(zhǔn)為50mg/L(國家標(biāo)準(zhǔn)),在2019年后半年,該公司顯然遠(yuǎn)超出平均超出排放標(biāo)準(zhǔn)。在10月份,COD出水濃度更是排放標(biāo)準(zhǔn)的10倍,是六月份超標(biāo)濃度的近3倍。此時,審計人員可以對污水治理資金以及相應(yīng)排污處罰措施進(jìn)一步分析,從而也可以為審查相關(guān)監(jiān)督機(jī)構(gòu)的環(huán)境保護(hù)項目的績效審計獲取證據(jù)。
基于數(shù)據(jù)可視化技術(shù)的水資源審計過程中,結(jié)合地域特點,以水資源生態(tài)環(huán)境為審計重點,在時間緊,任務(wù)重的情況下,堅持嚴(yán)謹(jǐn)盡職的審計工作態(tài)度,嚴(yán)格執(zhí)行現(xiàn)場管理辦法,及時通報審計進(jìn)度和發(fā)現(xiàn)的問題,加強(qiáng)對審計獲取的證據(jù)進(jìn)行分析,提高大數(shù)據(jù)環(huán)境下水資源數(shù)據(jù)的使用效果。我國水資源分布地理范圍廣闊,因此審計的覆蓋范圍廣。同時審計需要的時間長,取證難度大,以及數(shù)據(jù)繁雜等特征都促使審計方法創(chuàng)新。與此同時,利用大數(shù)據(jù)可視化技術(shù)開展水資源審計可能是一種可行性研究方法。本文基于現(xiàn)實的需要,利用python探索了如何在水資源審計中應(yīng)用大數(shù)據(jù)可視化技術(shù),并通過案例具體分析?!?/p>