王戀 吳龍庭
[摘 要] 人工智能技術被廣泛地運用于財務舞弊、證券投資和財務文本分析領域,是推動會計電算化向信息化轉型的重要力量。本文首先回顧人工智能在會計與財務領域的應用背景,其次分析智能技術在國內(nèi)外會計領域運用和研究的現(xiàn)狀,介紹典型的貝葉斯分類、神經(jīng)網(wǎng)絡和支持向量機等人工智能方法,最后就原始憑證識別、會計語料庫建立和會計分詞系統(tǒng)等問題進行了研究探討。
[關鍵詞] 會計信息化;會計信息系統(tǒng);人工智能
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 13. 025
[中圖分類號] F232 [文獻標識碼] A [文章編號] 1673 - 0194(2018)13- 0053- 03
0 引 言
進入21世紀以來,信息技術的巨大進步日益深刻地影響著人們的工作和生活。以大數(shù)據(jù)、智能化、移動互聯(lián)網(wǎng)和云計算為代表的新技術推動著會計電算化向信息化轉型??梢灶A見,在未來以賬務處理為主要功能的通用財務軟件將逐步演化為能在一定程度上理解和分析會計信息的智能化會計信息系統(tǒng)。在這個過程中,計算機視覺、自然人機交互、知識表示等人工智能技術將發(fā)揮重要作用。人工智能技術在會計領域的應用起源很早。在20世紀80年代末,我國學者已經(jīng)提出在憑證輸入環(huán)節(jié)引入自然語言處理技術的設想。21世紀初,國外學術界掀起過使用機器學習技術來分析財務報表和預測證券市場的研究高潮。本文首先綜述當前人工智能技術在會計與財務管理領域的應用研究現(xiàn)狀,其次介紹人工智能技術在會計領域運用的主要方法,最后提出未來會計界應該重點關注的研究方向。
1 人工智能技術在財會領域的應用研究綜述
人工智能誕生于20世紀50年代,最早起源于計算機學科,其研究目的是讓機器替代人完成各種具有智能意味的工作和任務。受限于計算機及其相關學科的發(fā)展水平,在歷史上人工智能研究曾幾度陷入低谷。進入21世紀,隨著互聯(lián)網(wǎng)、搜索引擎、機器學習等領域出現(xiàn)的關鍵性突破,人工智能在近十年進入井噴發(fā)展期,相關研究論文和研究成果逐年呈爆發(fā)型增長。當前人工智能的研究領域大致可概括為六個方面:①計算機視覺;②自然語言處理;③認知與推理;④機器人學;⑤博弈與倫理;⑥機器學習。其中在財會領域運用的主要是②和⑥。我國學者開展相關研究較早,張蒙生在1987年設計了一種通過語言匹配來智能錄入會計憑證的軟件接口,該接口借助自然語言理解技術在一定程度上實現(xiàn)了會計人員通過語言輸入會計憑證。張永雄提出通用財務軟件中的記賬憑證輸入模式需要改革,他認為借助于現(xiàn)代模式識別技術,可以在原始憑證上設置條形碼,讓計算機直接讀取原始憑證信息,然后根據(jù)既定的會計處理方法生成記賬憑證,這樣既能提高憑證錄入效率,又能為企業(yè)選擇不同的會計準則來處理財務數(shù)據(jù)提供便利。謝琨探討了人工智能技術會對財務管理帶來的影響,他借鑒人工智能領域中專家系統(tǒng)的概念,認為在財務管理領域也應構建專家系統(tǒng)來幫助企業(yè)進行經(jīng)營和決策。他闡述了建立專家系統(tǒng)的一般步驟,并就建立財務管理專家系統(tǒng)這一問題進行了分析和展望。王文蓮等認為會計核算實現(xiàn)智能化的核心問題是讓計算機能做出正確會計職業(yè)判斷,他們設計了一種讓計算機根據(jù)發(fā)生的經(jīng)濟業(yè)務自動生成記賬憑證的方法,該方法由用戶輸入經(jīng)濟業(yè)務的若干要素,然后由計算機根據(jù)事先設定好的程序編制出相應憑證,該方法比手工輸入憑證要方便高效。王艦綜合了現(xiàn)代的系統(tǒng)論、信息空間理論和人機系統(tǒng)理論,以數(shù)據(jù)庫技術、商務智能技術和新3I技術(物聯(lián)化Instrumented,互聯(lián)化Interconnected和智能化Intelligent)為手段,提出在智能化的立場上構建統(tǒng)一的財務信息平臺,并以此支持會計業(yè)務管理和決策支持系統(tǒng)。另外學者在探討財務智能和智能財務問題上也取得了一定的研究成果。
國際上,人工智能在會計領域的研究已經(jīng)形成了幾個比較成熟的研究方向,包括:①財務報表的質量分析和舞弊識別;②證券市場預測;③上市公司文檔分析。在21世紀初,隨著互聯(lián)網(wǎng)技術的迅猛發(fā)展和網(wǎng)絡爬蟲技術的出現(xiàn),學術界曾出現(xiàn)過一次通過采集和分析互聯(lián)網(wǎng)財經(jīng)信息來進行證券投資的熱潮,Mittermayer,Antweiler,Halgamuge和Schumaker等學者通過搜集財經(jīng)報道和股票論壇用戶發(fā)言設計了各種證券自動投資系統(tǒng),這些系統(tǒng)在實驗中取得了較好的效果,但在實際的市場交易中表現(xiàn)并不穩(wěn)定。Tetlock于2007年、2008年與2011年發(fā)表了一系列將文本分析應用于證券市場預測和公司財務狀況分析的文章,奠定了從會計文本中提取變量進行實證研究的基礎。Feng Li研究了財務報告的可讀性(readability)問題,他認為當公司經(jīng)營狀況不佳時,上市公司會通過降低財務報表的可讀性來降低會計信息披露的質量,他的一系列研究使得財務報告的可讀性成為自然語言處理技術在會計領域應用的一個研究方向。Cecchini使用機器學習技術對舞弊財務報告的文本特征進行了統(tǒng)計分析,使用這些文本特征去檢測財務報告是否造假,正確率超過了70%。
總的看來,由于會計環(huán)境和會計工作模式存在差異,國內(nèi)學術界和國外學術界對于人工智能在會計領域應用的關注點不同。國內(nèi)學術界已經(jīng)提煉出人工智能在會計領域應用的關鍵問題,以此可以引導人工智能在會計中的研究方向;而國外學術界則擅長于運用具體的人工智能技術來解決學術和實務問題。
2 人工智能技術在財會領域應用的主要技術
時至今日,人工智能已經(jīng)發(fā)展成為一個龐大的、橫跨多個學科的綜合學科,它所包含的方法和技術五花八門。運用在財會領域的人工智能技術有如下一些,由于這些技術在人工智能教材中有專門的介紹,所以此處只做簡略的說明,不進行深入的探討。
(1)中文分詞:指讓計算機將一句話或一段文字序列按照一定的規(guī)范切分為詞序列。這是中文語言處理的第一步,是句法和語義分析的基礎。英文由于有空格分隔單詞,所以不需要進行分詞。當前漢語分詞技術已經(jīng)成熟,分詞正確率可達90%以上,常用的分詞工具有張華平博士開發(fā)的NLPIR,哈爾濱工業(yè)大學開發(fā)的LTP和斯坦福大學開發(fā)的分詞器。
(2)貝葉斯分類:該方法來源于概率論中的貝葉斯公式,其原理是先對各種已分類的樣本進行學習,總結出各個類別的代表特征,然后利用這些特征確定待分類數(shù)據(jù)的類別。利用訓練得到的分類特征實現(xiàn)對未分類數(shù)據(jù)的分類。該方法實現(xiàn)簡單,分類效果好,在模式識別和數(shù)據(jù)挖掘領域得到了廣泛的應用,是很多分類問題首選的分類算法。
(3)支持向量機:將分類對象映射為高維向量,在高維向量空間里建立一個最大間隔超平面。在分開數(shù)據(jù)的超平面的兩邊建有兩個互相平行的超平面。建立方向合適的分隔超平面使兩個與之平行的超平面間的距離最大化,平行超平面間的距離或差距越大,分類的效果越好。
(4)神經(jīng)網(wǎng)絡:神經(jīng)網(wǎng)絡起源于數(shù)學家和神經(jīng)生理學家的討論,是一種模擬腦神經(jīng)運算的分層模型。它的結構看似復雜,其實有較強的規(guī)律性。每個神經(jīng)網(wǎng)絡可以分為輸入層、中間層和輸出層三個部分,其中的每一層都包含若干節(jié)點(即神經(jīng)元),每個節(jié)點有自己的權重值,節(jié)點之間通過輸出函數(shù)相連。在訓練時,向神經(jīng)網(wǎng)絡輸入信號,得到神經(jīng)網(wǎng)絡的輸出值,將其與標準輸出相比較,如果存在差異則調(diào)整節(jié)點的權重,直到神經(jīng)網(wǎng)絡的輸出與標準值相符。
(5)TF-IDF:是一種詞頻統(tǒng)計方法,用以衡量一個詞對于文件集或語料庫中某個文件的重要程度。該方法的主要思想是:如果某個詞在一篇文章中出現(xiàn)的頻率高(表示它能代表該文章的主體內(nèi)容),同時又在其他文章中出現(xiàn)的頻率低(表示它不是一個常用詞),則認為該詞能很好地代表該文章的特征。
(6)文本情感分析:指讓計算機使用自然語言處理技術來識別和提取文本中蘊含的主觀信息,如<正面的、負面的、中性>或<積極的、消極的、中性>等。Tetlock曾經(jīng)使用情感分析的方法來預測證券市場的走勢,他從心理學詞典中篩選出若干分別表示褒義和貶義的單詞,然后統(tǒng)計這些詞在財經(jīng)文章(刊登在《華爾街日報》上)中出現(xiàn)的頻率,根據(jù)統(tǒng)計結果判定文章的傾向性(極性)。根據(jù)判定結果制定的投資策略在證券市場上取得了良好的收益。
如前所述,人工智能領域包含著各種各樣的技術方法,大量技術尚未被運用于財會領域,上述的研究方法是可見諸文獻的,可以期望在不遠的將來會有更多的人工智能技術進入財會領域。
3 人工智能在財會領域的研究展望
人工智能深入人們的生活,在工作中替代簡單重復的勞動是大勢所趨。在未來會出現(xiàn)能與會計人員用自然語言進行交流的智能化會計信息系統(tǒng)。相較于當前的通用財務軟件,這樣的智能化系統(tǒng)會掌握更多的財會知識,與外部環(huán)境進行信息交互的手段也會更多樣。但是從本質上來講,智能技術的引入是讓計算機能按照既定的會計原理來分析和解釋經(jīng)濟業(yè)務信息,而不是讓其重新定義會計核算方法,所以它只會推動會計理論的不斷進步,而不會從根本上推翻已經(jīng)成熟的會計體系。但在實務工作和會計教育方面,人工智能帶來的變化將會是巨大的,云會計和財務機器人的出現(xiàn)將會深刻地影響會計工作模式,智能化財會學習軟件則可能會給會計電算化的教學帶來巨大的變革。在未來,下述的幾個方面可能會成為人工智能在財會領域應用研究的重點:
(1)原始憑證的精準識別。計算機視覺技術近年來進展極大,但如何從原始單據(jù)中完整準確地提取出信息還是一個懸而未決的問題。處理此問題首先要對原始單據(jù)進行統(tǒng)一建模,由于實際業(yè)務中,原始單據(jù)的類型五花八門,如領料單、出庫單、增值稅發(fā)票等。如何將這些原始單據(jù)的格式進行統(tǒng)一化和標準化是一個需要解決的難題。另外計算機在識別圖像時往往存在誤差,而會計對于數(shù)據(jù)精度的要求又非常高,如何研制出能達到會計識別要求的圖像識別系統(tǒng)也是引人關注的問題。
(2)建立會計標準語料庫。讓計算機理解會計知識,從根本上來講是要將會計知識用計算機能懂的方式表示出來,供其學習。這涉及人工智能領域的核心問題——知識表示。當前還沒有統(tǒng)一的知識表示框架。現(xiàn)在常用的知識表示方法是建立語料庫,也就是對各種包含會計概念,描述會計事實的文本進行標注,然后讓機器學習,再讓其在實際任務中運用。此項工作涉及自然語言處理的最高層次——語義理解,非常值得研究和探索。簡單地來講,如果說書籍是人類獲取知識的源泉,那么語料庫就是計算機的“書”。
(3)面向會計語料的專用分詞系統(tǒng)。當前,通用漢語分詞工具已經(jīng)成熟,應用此類工具進行漢語分詞的正確率可達90%以上,但此類工具是否完全適合于會計專業(yè)語料分詞還有待進一步研究。比如“一般增值稅納稅人”,從會計的角度來看,該詞就是一個詞,但是通用分詞系統(tǒng)從非會計專業(yè)人員的角度來分析,會將其劃分為“一般”“增值稅” “納稅”“人”。這種劃分不正確,會影響后續(xù)的句法和語義分析。對此類問題,可以通過定義用戶詞典來改善(比如在詞典中定義了“銀行存款”這個詞后,那么在分詞時,“銀行存款”就會被作為一個詞,而不會被劃分為“銀行”和“存款”),但依然有必要在分詞原理上進一步地研究,以期有更圓滿的解決方案。
總之,人工智能在會計領域的應用任重而道遠,它將會給會計實務和會計理論帶來何種影響還有待實踐的考察和檢驗。
主要參考文獻
[1]張蒙生.會計語言智能接口的設計與實現(xiàn)[J].計算機工程與應用,1987(12):36-40.
[2]張永雄.會計信息系統(tǒng)數(shù)據(jù)入口環(huán)節(jié)設計模式的改革[J].中國會計電算化,2002(8):7-10.
[3]謝琨.財務和會計智能系統(tǒng)研究簡析[J].中國會計電算化,2003(2):8-10.
[4]王文蓮,張麗霞.會計核算智能化的突破[J].會計之友,2009(5):37-38.
[5]蔣勇,王俊奇.論財務智能現(xiàn)狀及發(fā)展[J].宿州教育學院學報,2009,12(2):13-16.
[6]吳龍庭,肖聰.基于自然語言的會計事項智能判斷方法研究[J].財會通訊,2017(7).