国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

OCR技術(shù)在審計(jì)現(xiàn)場(chǎng)中的應(yīng)用研究

2020-10-30 01:52:46黃妙紅何勝王玨肖嘉麗
中國(guó)管理信息化 2020年16期

黃妙紅 何勝 王玨 肖嘉麗

[摘 要]電網(wǎng)企業(yè)目前的計(jì)算機(jī)審計(jì)工作主要基于數(shù)據(jù)庫(kù)中的電子數(shù)據(jù)進(jìn)行分析,而從審計(jì)經(jīng)驗(yàn)看,被審計(jì)單位的各類紙質(zhì)文件中往往隱藏著大量的審計(jì)線索和疑點(diǎn),如何充分利用相關(guān)數(shù)據(jù)是本課題的核心?;诖?,本文首先要解決的問(wèn)題就把相關(guān)紙質(zhì)文件轉(zhuǎn)化成計(jì)算機(jī)能夠識(shí)別的文字,這需要企業(yè)利用掃描儀將相關(guān)文件掃描成圖片;其次,本文研究了OCR圖片識(shí)別技術(shù),將掃描后的圖片文件進(jìn)行OCR處理,并抽取成文字文檔,為相關(guān)文檔的深度挖掘和利用奠定基礎(chǔ)。

[關(guān)鍵詞]OCR技術(shù);審計(jì)文本識(shí)別;現(xiàn)場(chǎng)審計(jì)

doi:10.3969/j.issn.1673 - 0194.2020.16.036

[中圖分類號(hào)]F239.1[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1673-0194(2020)16-00-03

0? ? ?引 言

經(jīng)過(guò)多年的信息化建設(shè),電網(wǎng)企業(yè)各業(yè)務(wù)系統(tǒng)中產(chǎn)生了海量的業(yè)務(wù)數(shù)據(jù),僅靠人工進(jìn)行審計(jì),不能滿足企業(yè)的需求。電網(wǎng)企業(yè)審計(jì)信息化建設(shè)應(yīng)用已有10年的歷史,在此期間,電網(wǎng)企業(yè)積累了大量審計(jì)信息化經(jīng)典案例,同時(shí)也對(duì)前沿信息技術(shù)如何在審計(jì)業(yè)務(wù)中應(yīng)用進(jìn)行了深入研究。為了進(jìn)一步提升審計(jì)工作效率,推進(jìn)審計(jì)信息化作業(yè)模式和手段向智能化、自動(dòng)化方向發(fā)展,企業(yè)需要對(duì)先進(jìn)信息技術(shù)在審計(jì)輔助作業(yè)中應(yīng)用進(jìn)行深入研究。利用圖片識(shí)別技術(shù)、大數(shù)據(jù)分析技術(shù)、文本挖掘、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、商業(yè)智能(BI)等高科技手段與工具,基于公司海量業(yè)務(wù)數(shù)據(jù)進(jìn)行智能審計(jì),幫助公司審計(jì)部門進(jìn)一步提高審計(jì)工作效率,提升審計(jì)的精確監(jiān)管能力。本文重點(diǎn)研究圖片識(shí)別技術(shù)(OCR)在電網(wǎng)企業(yè)審計(jì)現(xiàn)場(chǎng)中的應(yīng)用。通過(guò)OCR技術(shù)實(shí)現(xiàn)現(xiàn)場(chǎng)取證的紙質(zhì)文檔結(jié)構(gòu)化,并對(duì)文檔合規(guī)性進(jìn)行審查,分類及整理智能化文檔,為智能電子取證打下堅(jiān)實(shí)基礎(chǔ)。

1? ? ?OCR技術(shù)在審計(jì)現(xiàn)場(chǎng)中的應(yīng)用

目前,電網(wǎng)企業(yè)的計(jì)算機(jī)審計(jì)工作主要基于數(shù)據(jù)庫(kù)中的電子數(shù)據(jù)進(jìn)行分析,而從審計(jì)經(jīng)驗(yàn)看,被審計(jì)單位的各類紙質(zhì)文件中往往隱藏著大量的審計(jì)線索和疑點(diǎn),因此,如何充分利用相關(guān)數(shù)據(jù)是本課題的核心。而首先要解決的問(wèn)題就是把相關(guān)紙質(zhì)文件轉(zhuǎn)化成計(jì)算機(jī)能夠識(shí)別的文字。這需要企業(yè)先利用掃描儀將相關(guān)文件掃描成圖片,然后研究OCR圖片識(shí)別技術(shù),將掃描后的圖片文件進(jìn)行OCR處理,并抽取文字文檔,為相關(guān)文檔的深度挖掘和利用奠定基礎(chǔ)。在本課題中,OCR技術(shù)在審計(jì)現(xiàn)場(chǎng)中的應(yīng)用分為以下幾點(diǎn)。

1.1? ?交通費(fèi)發(fā)票識(shí)別

國(guó)家和中央各部委、電網(wǎng)企業(yè)對(duì)員工出行時(shí)乘坐的交通工具均有明文規(guī)定,根據(jù)出差人的行政崗級(jí)、出差事由和目標(biāo)、出差地的經(jīng)濟(jì)環(huán)境水平、出差人數(shù)和出差的可行預(yù)算,對(duì)交通費(fèi)報(bào)銷標(biāo)準(zhǔn)均制定了明確的上限。出差人獲得的交通費(fèi)報(bào)銷憑證的票面清楚地標(biāo)示了國(guó)內(nèi)機(jī)票的艙位和火車票的座位等級(jí)。總而言之,企業(yè)核查交通費(fèi)發(fā)票報(bào)銷,重點(diǎn)是運(yùn)用OCR技術(shù)對(duì)機(jī)票艙位為頭等艙、商務(wù)艙,火車票座位等級(jí)為商務(wù)座、特等座、一等座、軟臥的差旅費(fèi)報(bào)銷行為進(jìn)行定位識(shí)別,核查超標(biāo)情況。

1.2? ?酒店住宿發(fā)票識(shí)別

按照中央廉潔自律八項(xiàng)規(guī)定,公務(wù)人員出差不能超標(biāo)入住高檔酒店和會(huì)所,也不能有任何高消費(fèi)行為。在審計(jì)檢測(cè)中,企業(yè)可以通過(guò)提取成本費(fèi)用中的差旅費(fèi)、業(yè)務(wù)接待費(fèi)、會(huì)議費(fèi)等科目下發(fā)生的支出,對(duì)重點(diǎn)關(guān)注的高檔酒店的住宿和消費(fèi)情況進(jìn)行核查,提取這些支出原始憑證,對(duì)發(fā)票開具單位的名稱和信息進(jìn)行檢查,匹配酒店等級(jí)和出差人員的職務(wù)級(jí)別,從中發(fā)現(xiàn)疑點(diǎn)。

1.3? ?違規(guī)購(gòu)買土特產(chǎn)、高檔煙酒識(shí)別

企業(yè)通過(guò)提取成本費(fèi)用中的業(yè)務(wù)接待費(fèi)、宣傳費(fèi)、會(huì)議費(fèi)、其他費(fèi)用等科目下發(fā)生的支出,檢查員工是否違規(guī)購(gòu)買土特產(chǎn)和高檔煙酒。運(yùn)用OCR技術(shù)對(duì)發(fā)票開具方的單位和信息、品名、規(guī)格、數(shù)量、單價(jià)等商品內(nèi)容進(jìn)行核查,檢查發(fā)票開具方是否含有“商貿(mào)行”“特產(chǎn)”“煙酒”“貿(mào)易公司”等字樣,關(guān)注商品名稱中是否含有“煙”“酒”“禮盒”字樣。尤其要注意的是,在多次審計(jì)項(xiàng)目實(shí)踐中發(fā)現(xiàn)部分基層單位存在一些隱形變異現(xiàn)象,如通過(guò)開具“購(gòu)用品”“購(gòu)水”或者“辦公用品”“文具一批”和“購(gòu)茶葉”等發(fā)票進(jìn)行變通,掩蓋實(shí)際采購(gòu)的交易行為信息。對(duì)于此類現(xiàn)象,審計(jì)人員在對(duì)原始憑證發(fā)票信息進(jìn)行識(shí)別歸類和分析后,可以通過(guò)外圍調(diào)查、咨詢?cè)L談、突擊盤點(diǎn)實(shí)物、觀察法等,對(duì)真實(shí)交易行為開展定性和審計(jì)識(shí)別。

1.4? ?財(cái)務(wù)報(bào)表識(shí)別

目前,電網(wǎng)企業(yè)財(cái)務(wù)報(bào)表的數(shù)據(jù)分析大都采用人工閱讀審核方式,效率低,無(wú)法實(shí)現(xiàn)自動(dòng)化以及智能化。傳統(tǒng)的人工審核方式已經(jīng)嚴(yán)重阻礙了電網(wǎng)企業(yè)的審計(jì)效率和業(yè)務(wù)開展。運(yùn)用OCR技術(shù)將財(cái)務(wù)報(bào)表中的文字、表格、圖像轉(zhuǎn)化為電子版的數(shù)據(jù),通過(guò)計(jì)算機(jī)程序,快速采集財(cái)務(wù)報(bào)表數(shù)據(jù),再通過(guò)AI技術(shù)發(fā)現(xiàn)其中隱藏的疑點(diǎn)信息,具體步驟如圖1所示。

2? ? ?關(guān)鍵技術(shù)要素

2.1? ?圖片識(shí)別技術(shù)

光學(xué)字符識(shí)別(Optical Character Recognition,OCR)指對(duì)文本資料的圖像文件進(jìn)行分析識(shí)別處理,獲取文字及版面信息的過(guò)程,即識(shí)別圖像中的文字,并以文本的形式返回。

2.1.1? ?OCR的應(yīng)用場(chǎng)景

根據(jù)識(shí)別場(chǎng)景,可大致將OCR分為識(shí)別特定場(chǎng)景的專用OCR和識(shí)別多種場(chǎng)景的通用OCR。比如,現(xiàn)今方興未艾的證件識(shí)別和車牌識(shí)別是專用OCR的典型實(shí)例。通用OCR可以用于更復(fù)雜的場(chǎng)景,具有更大的應(yīng)用潛力。但由于通用圖片的場(chǎng)景不固定,文字布局多樣,難度較大。根據(jù)所識(shí)別圖片的內(nèi)容,企業(yè)利用OCR可將場(chǎng)景分為清晰且具有固定模式的簡(jiǎn)單場(chǎng)景和更復(fù)雜的自然場(chǎng)景。自然場(chǎng)景文本識(shí)別難度極高,主要原因是圖片背景非常豐富,經(jīng)常面臨低亮度、低對(duì)比度、光照不均、透視變形和殘缺遮擋等問(wèn)題,且文本布局可能存在扭曲、褶皺、換向等問(wèn)題,文字可能出現(xiàn)字體多樣,字號(hào)、字重、顏色不一的問(wèn)題。因此,自然場(chǎng)景中的文字識(shí)別技術(shù),也經(jīng)常被單列為場(chǎng)景文字識(shí)別技術(shù)(Scene Text Recognition,STR)。

平武县| 茌平县| 古交市| 玉屏| 咸丰县| 酒泉市| 华安县| 常山县| 墨江| 德阳市| 武鸣县| 洛南县| 遂溪县| 龙游县| 江陵县| 精河县| 永川市| 石家庄市| 班玛县| 龙游县| 乐昌市| 西宁市| 盐山县| 祁门县| 商城县| 诏安县| 体育| 浪卡子县| 新河县| 巴里| 施秉县| 平罗县| 无棣县| 子长县| 南平市| 灵川县| 山阳县| 武威市| 南靖县| 浙江省| 大余县|