摘 要:文章運(yùn)用區(qū)塊鏈和人工智能OCR技術(shù)設(shè)計(jì)財(cái)會(huì)檔案從形成到歸檔模型,在前人的基礎(chǔ)上,將兩種技術(shù)嵌入財(cái)務(wù)管理系統(tǒng)以及檔案管理系統(tǒng)中,提出用“公有鏈+私有鏈”的雙區(qū)塊鏈技術(shù)來(lái)實(shí)現(xiàn)和保障財(cái)會(huì)檔案的信息安全性,用OCR技術(shù)實(shí)現(xiàn)對(duì)憑證影像化的智能信息提取。文章還介紹了模型的系統(tǒng)框架及原理,并分析了區(qū)塊鏈和OCR技術(shù)在高校財(cái)會(huì)檔案管理中會(huì)碰到的痛點(diǎn)和難點(diǎn)。希望該系統(tǒng)的建立能夠?yàn)樨?cái)會(huì)管理系統(tǒng)和檔案管理系統(tǒng)模型搭建提供參考和啟發(fā),為推動(dòng)財(cái)會(huì)檔案電子進(jìn)程提供新的契機(jī)。
關(guān)鍵詞:區(qū)塊鏈;OCR;財(cái)會(huì)檔案
中圖分類號(hào):G271 文獻(xiàn)標(biāo)識(shí)碼:A
引言
區(qū)塊鏈?zhǔn)且豁?xiàng)具有可追溯性、可信任、去中心化和防篡改等多種屬性的創(chuàng)新技術(shù),隨著其在各領(lǐng)域的探索,技術(shù)優(yōu)勢(shì)逐漸凸顯。新《中華人民共和國(guó)檔案法》對(duì)檔案信息資源共享及電子檔案管理等建設(shè)提出新的要求,區(qū)塊鏈及相關(guān)技術(shù)正好填補(bǔ)信息安全管理部分缺口。
人工智能OCR(Optical Character Recognition)是通過對(duì)文本資料的圖像文件分析識(shí)別處理獲取文字信息的一種技術(shù),在實(shí)現(xiàn)檔案數(shù)字化過程中,已經(jīng)成為檔案技術(shù)領(lǐng)域的重要技術(shù)之一。
要保障電子檔案的真實(shí)性,應(yīng)從兩方面著手:一是文件形成過程;二是文件形成之后?;谏鲜鲆?,結(jié)合這兩種技術(shù)特征以及當(dāng)前財(cái)會(huì)檔案管理的形勢(shì)和特點(diǎn),本文引入?yún)^(qū)塊鏈和OCR技術(shù),為驗(yàn)證電子憑證真?zhèn)?,保證線上審核及利用流程的安全性、可行性、可信性、可用性和時(shí)效性,解決財(cái)會(huì)檔案從形成到利用過程中可預(yù)見的難題,提供新的思路和契機(jī)。
一、區(qū)塊鏈及OCR技術(shù)應(yīng)用于電子檔案管理的國(guó)內(nèi)外研究進(jìn)展
1.國(guó)外研究進(jìn)展
2018年,英國(guó)啟動(dòng)Archangel項(xiàng)目的研究,目標(biāo)是通過分布式賬本技術(shù)保障數(shù)字檔案長(zhǎng)期可用及內(nèi)容完整,旨在使用區(qū)塊鏈等信息安全技術(shù)來(lái)保護(hù)電子檔案元數(shù)據(jù)完整。美國(guó)Smart Records項(xiàng)目利用區(qū)塊鏈取代紙質(zhì)文件,減少錯(cuò)誤和欺詐的發(fā)生,削減風(fēng)險(xiǎn)控制成本。美國(guó)國(guó)家檔案館已經(jīng)在電子檔案信息安全管理領(lǐng)域廣泛運(yùn)用區(qū)塊鏈等信息安全技術(shù),區(qū)塊鏈技術(shù)正在改變著美國(guó)政府運(yùn)作和管理方式。OCR的強(qiáng)大表單處理技術(shù),通過掃描發(fā)票圖像文件,可以智能、準(zhǔn)確地檢測(cè)和捕獲供應(yīng)商名稱、日期、金額甚至銀行項(xiàng)目詳細(xì)信息。
結(jié)合上述研究基礎(chǔ),不難發(fā)現(xiàn)區(qū)塊鏈不可修改的特點(diǎn)在電子發(fā)票真實(shí)性檢測(cè)上具有很高的適用性,而區(qū)塊鏈的智能合約可以為電子發(fā)票線上審核以及檔案利用模塊提供安全保障。OCR的智能識(shí)別技術(shù)能夠有效提高圖像化發(fā)票的文字提取,為財(cái)會(huì)檔案從形成到利用過程的系統(tǒng)管理模型建立提供了有利參考。
2.國(guó)內(nèi)研究進(jìn)展
區(qū)塊鏈技術(shù)對(duì)于電子檔案的適用性、可行性及可信性等都有非常大的優(yōu)勢(shì)。張珊認(rèn)為區(qū)塊鏈技術(shù)在電子檔案管理中的優(yōu)勢(shì)可以幫我們解決目前電子檔案管理效率低下等問題,并能保證檔案的安全性和真實(shí)性。
高校財(cái)務(wù)管理在信息化時(shí)代的強(qiáng)烈沖擊下,建設(shè)數(shù)字化的高校財(cái)務(wù)信息平臺(tái),并使之與檔案系統(tǒng)順利對(duì)接,成為高校財(cái)務(wù)方面的研究重點(diǎn)。王平、趙毅認(rèn)為電子發(fā)票存在著可重復(fù)打印報(bào)銷、票面信息易被篡改以及信息安全性容易受到威脅等問題,利用區(qū)塊鏈技術(shù)可以保障電子發(fā)票信息的安全性;劉丕平等人認(rèn)為,傳統(tǒng)的檔案管理模式已無(wú)法滿足現(xiàn)階段高校信息化建設(shè)及檔案管理的需求,實(shí)施會(huì)計(jì)檔案影像化是規(guī)范高校會(huì)計(jì)檔案管理的必由之路。而人工智能OCR技術(shù)可以很好地將圖像檔案內(nèi)的圖片繼續(xù)保存,將圖像內(nèi)的表格和文字資料變成可編輯的電子文檔,從而節(jié)約人力和時(shí)間成本。由此可見,要解決“紙電共存”時(shí)期的問題,引進(jìn)OCR技術(shù)也是非常必要的。
綜上所述,國(guó)內(nèi)外都非常重視對(duì)區(qū)塊鏈和OCR技術(shù)的應(yīng)用,為區(qū)塊鏈和人工智能技術(shù)在財(cái)會(huì)檔案管理系統(tǒng)建立提供了參考模型和基本概念框架,在借鑒國(guó)外經(jīng)驗(yàn)的同時(shí),還需要深刻認(rèn)識(shí)自身優(yōu)勢(shì)與不足。因此,在財(cái)會(huì)檔案管理實(shí)踐應(yīng)用領(lǐng)域,如何高效并安全地將區(qū)塊鏈和人工智能OCR技術(shù)納入財(cái)會(huì)檔案的全流程管理中,并解決現(xiàn)在的財(cái)會(huì)檔案從形成到歸檔過程中易變性、不穩(wěn)定、缺乏安全性與利用效率低等問題,也是亟待解決的難題。
二、區(qū)塊鏈及OCR技術(shù)在財(cái)會(huì)檔案管理中的應(yīng)用設(shè)計(jì)
1.財(cái)會(huì)檔案管理全流程平臺(tái)框架
本文利用區(qū)塊鏈和人工智能OCR技術(shù)模型搭建財(cái)會(huì)檔案管理流程,財(cái)務(wù)管理系統(tǒng)和檔案管理系統(tǒng)通過開放接口的方式,對(duì)接元數(shù)據(jù)。與此同時(shí),系統(tǒng)還具有拓展性,支持利用公有鏈跨組織或跨機(jī)構(gòu)管理平臺(tái)融合,見圖1。
電子憑證生成及驗(yàn)證鏈。使用公有鏈可以不需要準(zhǔn)入機(jī)制,最大程度發(fā)揮區(qū)塊鏈優(yōu)勢(shì)。將電子憑證區(qū)塊存儲(chǔ)于公有鏈,保證了電子憑證的真實(shí)性和可溯源性。
財(cái)會(huì)檔案形成與管理鏈。使用私有鏈區(qū)塊可以控制區(qū)塊打包速度和擴(kuò)大收益,改善數(shù)據(jù)存儲(chǔ)于公有鏈成本較高等問題。
本文將財(cái)會(huì)檔案從形成到管理的全過程,設(shè)計(jì)的財(cái)會(huì)檔案管理流程模型,將公有鏈和私有鏈雙區(qū)塊鏈結(jié)合,實(shí)現(xiàn)安全、可信的線上報(bào)賬、歸檔與利用一條龍服務(wù)的目的,達(dá)到“數(shù)據(jù)多跑步,師生少走路”的效果。
圖1 財(cái)會(huì)檔案管理全流程框架設(shè)計(jì)圖
2.財(cái)會(huì)檔案形成過程模型
(1)憑證對(duì)接財(cái)務(wù)管理系統(tǒng)
采用API接口技術(shù)。API(Application Programming Interface,應(yīng)用程序接口)技術(shù)是一些預(yù)先定義的接口,如函數(shù)、HTTP接口,它無(wú)須訪問源碼或理解內(nèi)部工作機(jī)制的細(xì)節(jié),即可實(shí)現(xiàn)各系統(tǒng)間對(duì)接與集成,方便數(shù)據(jù)采集和交換,達(dá)到數(shù)據(jù)的傳遞和共享。
(2)電子憑證的真實(shí)性驗(yàn)證
由于電子憑證生成的單位多,范圍廣,在現(xiàn)有的網(wǎng)絡(luò)基礎(chǔ)上,利用公有鏈完成形成過程可行性較高,后匯總到政府稅務(wù)部門展開計(jì)稅,再發(fā)送至個(gè)人微信或支付寶卡包,就可以完善稅收管理。利用區(qū)塊鏈技術(shù)的可追溯性,通過與稅務(wù)部門構(gòu)建區(qū)塊鏈接口,調(diào)取數(shù)據(jù)信息,即可直接完成可信性檢測(cè)。
(3)憑證影像化智能提取
雖然電子憑證大量普及,但紙質(zhì)憑證并沒有被完全取代。將紙質(zhì)憑證電子影像化,再通過OCR技術(shù)識(shí)別發(fā)票影像,解決紙質(zhì)憑證審核及保存路徑單一的問題。利用OCR技術(shù)實(shí)現(xiàn)憑證自動(dòng)分類,發(fā)票關(guān)鍵信息提取、判別發(fā)票真?zhèn)危⒂行Х婪稇{證造假和重復(fù)報(bào)賬等問題。
3.財(cái)會(huì)檔案管理過程模型
財(cái)會(huì)檔案對(duì)接完成之后,檔案管理工作主要由專職檔案管理人員實(shí)施操作,其每項(xiàng)操作都應(yīng)該符合REST(Representational State Transfer)原則,以保護(hù)元數(shù)據(jù)安全。REST模式主要指網(wǎng)絡(luò)上所有事物都可抽象成具體資源,每個(gè)網(wǎng)絡(luò)資源都有唯一的標(biāo)識(shí)符,所有的具體操作都不會(huì)改變?cè)撡Y源的標(biāo)識(shí)符,所有符合REST原則的系統(tǒng)架構(gòu)稱為RESTful架構(gòu),采用這種架構(gòu)形式可以保護(hù)檔案數(shù)據(jù)信息的安全性。IPFS(InterPlanetary File System,星際文件系統(tǒng))是一個(gè)全球互聯(lián)的分布式文件系統(tǒng),它與區(qū)塊鏈相結(jié)合的文件存儲(chǔ)和內(nèi)容分發(fā)網(wǎng)絡(luò)協(xié)議,具有內(nèi)容可尋址、去中心化以及不可篡改等特點(diǎn)。在存儲(chǔ)文件時(shí),IPFS會(huì)根據(jù)文件內(nèi)容計(jì)算得出哈希值,并添加到分布式哈希表中。
圖2 檔案管理系統(tǒng)架構(gòu)圖
三、區(qū)塊鏈和OCR技術(shù)在高校財(cái)會(huì)檔案管理中的挑戰(zhàn)
1.區(qū)塊鏈電子發(fā)票在實(shí)際應(yīng)用中的困境
伴隨著區(qū)塊鏈技術(shù)新時(shí)代的到來(lái),區(qū)塊鏈電子發(fā)票不僅有電子發(fā)票的便捷,還融入了區(qū)塊鏈的安全、智能的技術(shù)優(yōu)勢(shì),能引起金融運(yùn)行機(jī)制及人們生活習(xí)慣的巨大變革,前景廣闊。但在當(dāng)前的社會(huì)環(huán)境下開展推廣應(yīng)用,仍應(yīng)充分警惕其中的問題與風(fēng)險(xiǎn)。
(1)缺乏全面、系統(tǒng)的建設(shè)規(guī)劃
區(qū)塊鏈?zhǔn)墙鉀Q供應(yīng)鏈金融和數(shù)字身份中的核心技術(shù),受現(xiàn)有技術(shù)水平等諸多限制,缺乏全面的區(qū)塊鏈系統(tǒng)建設(shè)規(guī)劃與平臺(tái)搭建,各系統(tǒng)間聯(lián)系不夠緊密。對(duì)于高校而言,應(yīng)提高對(duì)財(cái)務(wù)管理的重視,將區(qū)塊鏈技術(shù)與現(xiàn)有信息平臺(tái)有效融合,以提高工作效率為目標(biāo)展開系統(tǒng)的信息化規(guī)劃建設(shè)。
(2)缺乏復(fù)合型技術(shù)人才
區(qū)塊鏈不單要求計(jì)算機(jī)專業(yè)人員理論基礎(chǔ)知識(shí)扎實(shí),還需要具備較強(qiáng)的專業(yè)領(lǐng)域研發(fā)能力。財(cái)會(huì)管理人員對(duì)會(huì)計(jì)制度的關(guān)注遠(yuǎn)大于對(duì)技術(shù)進(jìn)步的關(guān)注,而區(qū)塊鏈的財(cái)務(wù)管理模式顛覆了大部分財(cái)會(huì)管理人員的觀念,需要財(cái)會(huì)管理人員具有一定的信息化思維。但是,目前同時(shí)兼?zhèn)湄?cái)務(wù)管理和信息技術(shù)的高端復(fù)合型人才十分稀缺,政府應(yīng)該重視復(fù)合型人才的培養(yǎng)力度。
(3)安全性問題
區(qū)塊鏈技術(shù)在我國(guó)仍處于發(fā)展初期,專業(yè)人才緊缺,相關(guān)配套的風(fēng)險(xiǎn)管理措施不夠完善。雖然可以通過非對(duì)稱加密算法減少風(fēng)險(xiǎn)發(fā)生,但如果收到大于51%的規(guī)則攻擊,那么其較傳統(tǒng)互聯(lián)網(wǎng)模式的優(yōu)勢(shì)也就不復(fù)存在。因此,區(qū)塊鏈電子發(fā)票不僅要保證數(shù)據(jù)的準(zhǔn)確性,還需要保證過程的安全性。在加強(qiáng)風(fēng)險(xiǎn)防控的同時(shí),還需時(shí)刻監(jiān)督區(qū)塊鏈網(wǎng)絡(luò)交易狀況,做到實(shí)時(shí)發(fā)現(xiàn)、實(shí)時(shí)修補(bǔ)系統(tǒng)漏洞,盡可能地把風(fēng)險(xiǎn)降到最低。
2.OCR技術(shù)在財(cái)會(huì)檔案管理中的難點(diǎn)
在傳統(tǒng)模式下,會(huì)計(jì)檔案僅以紙質(zhì)形式保存,利用OCR技術(shù)實(shí)施影像化以后,在向檔案管理部門移交紙質(zhì)會(huì)計(jì)檔案時(shí),需同時(shí)提交電子會(huì)計(jì)檔案,要符合財(cái)會(huì)檔案相關(guān)歸檔文件的要求,滿足檔案入庫(kù)標(biāo)準(zhǔn),保證影像化財(cái)會(huì)憑證符合電子檔案管理要求。在應(yīng)用過程中,也應(yīng)注意以下問題。
(1)圖像文件識(shí)別率低
圖像文件的識(shí)別率高低直接影響OCR的識(shí)別效率。高識(shí)別率可以提高檔案信息錄入的準(zhǔn)確性以及后期處理的工作量。低識(shí)別率不單增加后期處理的工作量,還會(huì)加大人工校對(duì)力度。比如,非常規(guī)字體、圖像文字處污損以及圖片虛焦等,都會(huì)降低識(shí)別度。因此,應(yīng)提前制定相關(guān)操作標(biāo)準(zhǔn),從源頭上符合財(cái)會(huì)電子檔案管理規(guī)范。
(2)財(cái)會(huì)檔案信息的安全性
以往的財(cái)會(huì)檔案利用,需要履行必要的會(huì)計(jì)憑證借閱申請(qǐng)手續(xù),登記備案,并由專門的檔案管理人員陪同查閱,財(cái)務(wù)信息相對(duì)安全。但是在實(shí)行財(cái)會(huì)檔案影像化,開通線上查閱后,如何利用OCR技術(shù)設(shè)計(jì)完善的查詢系統(tǒng)、保證財(cái)務(wù)信息安全是檔案管理系統(tǒng)亟待解決的難題。
(3)紙質(zhì)憑證粘貼需要符合影像化標(biāo)準(zhǔn)
由于“區(qū)塊鏈+電子發(fā)票”并沒有全覆蓋,紙質(zhì)憑證依舊存在,原有的票據(jù)粘貼方法無(wú)法滿足影像化的要求,如魚鱗狀粘貼、折疊和發(fā)票背面簽字等形式,不利于拍照和掃描。為保證會(huì)計(jì)檔案影像化的順利實(shí)施,應(yīng)制定財(cái)務(wù)票據(jù)粘貼方式規(guī)范,為憑證影像化工作的順利開展打下良好基礎(chǔ)。
四、結(jié)束語(yǔ)
雖然,目前區(qū)塊鏈電子發(fā)票技術(shù)還不夠成熟,但多地陸續(xù)開展試點(diǎn),發(fā)票全面電子化時(shí)代也即將到來(lái)。區(qū)塊鏈去中心化、防篡改以及可追溯等特性非常契合電子檔案管理理念,其數(shù)據(jù)共識(shí)機(jī)制、智能合約、時(shí)間戳以及數(shù)據(jù)加密等技術(shù)可以有效實(shí)現(xiàn)財(cái)務(wù)管理去中心化的分布式記賬框架、數(shù)據(jù)溯源以及防篡改要求。因此,高校應(yīng)加快推進(jìn)財(cái)會(huì)檔案電子化進(jìn)程,將相關(guān)政策、法律法規(guī)有效融合,科學(xué)管理,細(xì)化財(cái)會(huì)檔案影像化、電子化的具體措施,充分調(diào)研和論證,梳理業(yè)務(wù)流程,制定具體操作規(guī)范,優(yōu)化財(cái)務(wù)流程,既要實(shí)現(xiàn)財(cái)務(wù)數(shù)據(jù)有效共享,又要保障財(cái)務(wù)信息安全,提高財(cái)會(huì)檔案利用價(jià)值,聯(lián)合云計(jì)算、大數(shù)據(jù)以及人工智能等技術(shù),為電子檔案管理提供更優(yōu)質(zhì)的技術(shù)解決方案。
參考文獻(xiàn):
[1]楊茜茜.基于區(qū)塊鏈技術(shù)的電子檔案信任管理模式探析:英國(guó)ARCHANGEL項(xiàng)目的啟示[J].檔案學(xué)研究,2019(03):135-140.
[2]Delaware Office of the Governor.Governor Markell Launches Delaware Blockchain Initiative [EB/OL].(2016–05–02) [2020–11–08].https://www.prnewswire.com/news-releases/governor–markell–launches–delaware–blockchain–initiative-300260672.html.
[3]信息自由法咨詢委員會(huì)會(huì)議記錄[EB/OL].[2017-07-27]. https://www.archives.gov/files/july-2017-foia-advisory-committee-meeting-transcript.pdf.
[4]Automated Invoice Processing-What’s the benefit?[J].M2 Presswire,2014.
[5]張 珊.區(qū)塊鏈技術(shù)在電子檔案管理中的適用性和應(yīng)用展望[J].檔案管理,2017(3):18-19.
[6]王 軍,蔣雅瓊.區(qū)塊鏈技術(shù)在高校財(cái)務(wù)管理中的應(yīng)用[J].質(zhì)量與市場(chǎng),2020(12):13-15.
[7]王 平,趙毅.電子發(fā)票對(duì)高校軍工科研經(jīng)費(fèi)管理的影響研究[J].經(jīng)濟(jì)師,2021(07):79-81+84.
[8]劉丕平,王海清,史 焱,等.高校會(huì)計(jì)檔案影像化的實(shí)施路徑研究[J].商業(yè)會(huì)計(jì),2021(09):64-67.
[9]張 鵬.基于OCR技術(shù)的高校數(shù)字化檔案資源的開發(fā)與利用[J].福建電腦,2013,29(05):67-69.
作者單位:仲愷農(nóng)業(yè)工程學(xué)院