【摘 要】 數(shù)字經(jīng)濟正加速改變世界,審計作為經(jīng)濟監(jiān)督“特種部隊”面臨著大數(shù)據(jù)和人工智能重塑業(yè)務(wù)場景與規(guī)則的挑戰(zhàn),創(chuàng)新審計技術(shù)方法,以智能化全方位賦能審計工作,推動審計事業(yè)高質(zhì)量發(fā)展勢在必行。從實際審計工作需求出發(fā),探索智能審計應(yīng)用場景、核心技術(shù)和實踐方向,提出智能審計的工程化路徑,結(jié)合多方安全計算技術(shù)、多模態(tài)大數(shù)據(jù)治理技術(shù)、審計大語言模型技術(shù)、一站式大模型開發(fā)管理平臺等技術(shù)給出實踐分析,切實提高審計工作實效和質(zhì)量,在可視化展示與交互、智能決策支持的助力下為審計人員提供更直觀、更具有深度的數(shù)據(jù)模式解讀方式,提高了審計決策的科學性。大數(shù)據(jù)和人工智能的應(yīng)用開啟了智能審計時代,為建設(shè)新型審計監(jiān)督體系、推動審計工作向更高水平發(fā)展、審計信息化向全面數(shù)字化轉(zhuǎn)型發(fā)展,提供了創(chuàng)新思路、技術(shù)支持和實現(xiàn)路徑。
【關(guān)鍵詞】 智能審計; 研究型審計; 多方安全計算; 多模態(tài)大數(shù)據(jù)治理; 審計大語言模型; 大模型開發(fā)管理平臺
【中圖分類號】 F239.1 【文獻標識碼】 A 【文章編號】 1004-5937(2024)20-0014-08
一、智能審計的創(chuàng)新特點
習近平總書記在二十屆中央審計委員會第一次會議上指出,做好新時代新征程審計工作,總的要求是在構(gòu)建集中統(tǒng)一、全面覆蓋、權(quán)威高效的審計監(jiān)督體系[1]和更好發(fā)揮審計監(jiān)督作用上聚焦發(fā)力,并用“如臂使指”“如影隨形”“如雷貫耳”形象概括了新型審計監(jiān)督體系的特性,從“三個如”的創(chuàng)新論述中明晰智能審計的創(chuàng)新特點和實踐方向。智能審計通過數(shù)字化、智能化技術(shù)和工具的應(yīng)用,強化審計的政治屬性、全覆蓋審計監(jiān)督效果,提升審計的研究能力和斗爭本領(lǐng),是構(gòu)建新型審計監(jiān)督體系、推進國家治理體系和治理能力現(xiàn)代化建設(shè)水平提升的重要一環(huán)。
(一)政治屬性和政治功能的增強
智能審計有利于增強審計的政治屬性和政治功能。通過大數(shù)據(jù)和人工智能相關(guān)技術(shù)、深度數(shù)據(jù)分析手段,增強審計機關(guān)在決策層面的動能發(fā)揮,確保審計服務(wù)在國家大局工作中、國家治理中的針對性。審計機關(guān)應(yīng)用智能化審計工具實現(xiàn)“如臂使指”,將審計工作與黨中央部署有機結(jié)合執(zhí)行中央審計委員會的決策,并在審計過程中緊追所指的大局方向和工作重點。
(二)常態(tài)化、動態(tài)化震懾的全覆蓋審計
智能審計保證“如影隨形”的審計監(jiān)督[2],通過智能審計相關(guān)技術(shù)體系實現(xiàn)對使用公共資金、國有資產(chǎn)、國有資源的地方、部門和單位的審計監(jiān)督無一遺漏、無一例外。數(shù)字化智能化審計工具的應(yīng)用,使得審計能夠高效地實現(xiàn)常態(tài)化和動態(tài)化的監(jiān)督目標,達到全覆蓋、無禁區(qū)的審計效果,從而增強審計的震懾力、穿透力。
(三)強化研究型審計和斗爭本領(lǐng)
智能審計強化了研究型審計,是做實研究型審計的技術(shù)支持。通過數(shù)字智能審計技術(shù)和數(shù)據(jù)分析,審計人員能夠深入地剖析、系統(tǒng)地研判審計對象,開展研究型審計,挖掘?qū)徲媽ο鬂撛诘膯栴}和風險[3]。智能審計技術(shù)和工具的應(yīng)用賦能審計機關(guān),增強斗爭本領(lǐng)是打造經(jīng)濟監(jiān)督“特種部隊”的必然選擇,特別是數(shù)字共享技術(shù)有助于審計與其他形式的監(jiān)督形成合力,實現(xiàn)信息的溝通、工作的聯(lián)通和成果的融通,從而提升監(jiān)督質(zhì)效。
二、智能審計的創(chuàng)新應(yīng)用場景
智能審計在數(shù)據(jù)采集和治理、實時監(jiān)控與預(yù)警、自動化測試、跨領(lǐng)域融合、決策支持、可視化展示、信息安全與隱私保護、風險識別、持續(xù)審計、協(xié)同優(yōu)化、預(yù)測分析等多方面有顯著的創(chuàng)新成效,為新時代的審計工作帶來全新的思路和工作方法,在提高具體審計工作水平和效益的同時,全面推動了整個監(jiān)督領(lǐng)域的升級和發(fā)展。
(一)數(shù)據(jù)處理層面
1.數(shù)據(jù)采集與分析
智能審計實現(xiàn)數(shù)據(jù)采集的自動化和智能化,對各類數(shù)據(jù)進行高效處理。采用自然語言處理、機器學習和深度學習等數(shù)據(jù)處理技術(shù),以提高對多源、多模態(tài)數(shù)據(jù)的處理效率。通過多模態(tài)數(shù)據(jù)整合,使得不同類型的數(shù)據(jù)(如文本、圖像、視頻等),為審計人員提供更為綜合、全面的信息。在大數(shù)據(jù)分析方面,智能審計利用數(shù)據(jù)挖掘技術(shù)深入挖掘海量數(shù)據(jù)和潛在業(yè)務(wù)風險。通過模式識別、關(guān)聯(lián)分析和異常檢測,審計系統(tǒng)能夠快速識別出異常模式,進而提醒審計人員可能存在的問題。這使審計工作更具針對性,能夠更加精準地關(guān)注潛在風險點,提高審計效益。
2.實時監(jiān)控與預(yù)警
智能審計通過大數(shù)據(jù)和云計算等新技術(shù)實現(xiàn)實時監(jiān)控和發(fā)揮預(yù)警功能。實時監(jiān)控對象不僅包括傳統(tǒng)的財務(wù)數(shù)據(jù),還包括業(yè)務(wù)流程、資金流向等多個維度。通過建立實時監(jiān)測系統(tǒng),審計人員能夠在第一時間獲知被審計單位的變化情況,及時發(fā)現(xiàn)異常和潛在風險。智能審計通過預(yù)警系統(tǒng),自動識別異常模式,并向?qū)徲嬋藛T發(fā)送、報告預(yù)警信息,提醒其關(guān)注可能出現(xiàn)的問題。實時監(jiān)控與預(yù)警不僅提高了審計的時效性,也大幅度減小了潛在風險漏報的可能性。
3.可視化展示與交互
智能審計通過可視化技術(shù),將審計結(jié)果和報告按不同使用者的興趣進行直觀、生動的展示。這一創(chuàng)新提高了審計人員對數(shù)據(jù)的理解和分析效率,也使得審計結(jié)果更具可信度、容易獲得相關(guān)方的認可??梢暬故緦嫶蟮臄?shù)據(jù)集以直觀的方式呈現(xiàn),幫助審計人員、被審計單位更好地發(fā)現(xiàn)潛在問題和趨勢。通過交互式設(shè)計,審計人員能夠與數(shù)據(jù)進行實時互動,進一步提高審計工作的可操作性和用戶體驗。
4.智能化多模態(tài)數(shù)據(jù)治理
審計對象的數(shù)字化轉(zhuǎn)型對內(nèi)部審計既是挑戰(zhàn)也是機遇。智能審計通過自動化、智能化的技術(shù)手段,實現(xiàn)對多源、多模態(tài)數(shù)據(jù)的高效獲取、處理、分析和報告。通過自適應(yīng)大數(shù)據(jù)治理技術(shù),系統(tǒng)能夠根據(jù)數(shù)據(jù)的實時性和權(quán)重自動調(diào)整數(shù)據(jù)的治理策略[4],確保數(shù)據(jù)的一致性和準確性,使得審計人員能夠便捷地獲取所需數(shù)據(jù)縮短審計周期。
(二)風險與安全層面
1.信息安全與隱私保護
在數(shù)字化時代,特別是數(shù)據(jù)合規(guī)、信息安全和隱私保護成為重要關(guān)注。智能審計在應(yīng)用大數(shù)據(jù)和人工智能等新技術(shù)的同時,充分考慮和保障被審計單位的信息安全和隱私。采用加密技術(shù),確保審計數(shù)據(jù)在傳輸和存儲過程中的安全性。系統(tǒng)設(shè)計中注重隱私保護機制,遵守數(shù)據(jù)相關(guān)法律法規(guī),確保審計過程中不發(fā)生侵犯被審計單位合法權(quán)益的審計風險。
2.智能風險識別
智能審計利用大數(shù)據(jù)技術(shù)對企業(yè)的全部財務(wù)數(shù)據(jù)進行實時監(jiān)控和分析。通過模式識別和異常檢測等技術(shù)手段,審計系統(tǒng)能夠及時發(fā)現(xiàn)潛在的財務(wù)風險。舉例來說,通過對交易模式的分析,系統(tǒng)能夠?qū)崟r地識別出異常的資金流向,為審計人員提供重要線索。這種智能化的風險識別大幅提升了審計的準確性和效率。
3.智能預(yù)測與持續(xù)審計
智能審計利用大數(shù)據(jù)和人工智能等新技術(shù)進行預(yù)測分析。建立預(yù)測模型,系統(tǒng)對未來的財務(wù)風險進行預(yù)測和預(yù)警。智能化的預(yù)測能力為審計人員提供了發(fā)現(xiàn)未來趨勢的線索,幫助其更好地制訂審計計劃。通過持續(xù)審計模型,審計系統(tǒng)對被審計單位進行持續(xù)監(jiān)控和評估,及時發(fā)現(xiàn)和解決問題,提高審計工作的時效性、準確性。
(三)融合應(yīng)用層面
1.智能化審計決策支持
以大數(shù)據(jù)和人工智能等為技術(shù)核心,智能審計提供智能化的決策支持服務(wù)。通過對海量數(shù)據(jù)的挖掘和分析,發(fā)現(xiàn)不同行業(yè)、不同領(lǐng)域數(shù)據(jù)背后的規(guī)律、模式和趨勢。包括對財務(wù)數(shù)據(jù)、市場趨勢、行業(yè)動態(tài)等多方面信息的整合研判分析。審計人員基于數(shù)據(jù)依據(jù)做出更為準確、全面的決策,提高審計工作的水平和專業(yè)度。智能化審計系統(tǒng)基于模型解釋性工具,幫助審計人員理解模型的決策邏輯,使得審計決策更為科學可信,降低了決策的風險。
2.自動化審計測試
通過大數(shù)據(jù)、人工智能等新技術(shù)智能審計實現(xiàn)了自動化審計測試。這一技術(shù)應(yīng)用減少了繁瑣的測試環(huán)節(jié)中的人工參與。自動化審計測試涵蓋了審計過程中的多個環(huán)節(jié),包括數(shù)據(jù)采樣、賬務(wù)核對、生成審計中間表、內(nèi)部控制測試等。采用機器學習、深度學習算法,以監(jiān)督、非監(jiān)督結(jié)合的模式學習并優(yōu)化測試方案,逐步提高測試的準確性和全面性。使得審計人員能夠更專注于復(fù)雜業(yè)務(wù)問題的解決,拓寬審計工作的深度和廣度。
3.智能協(xié)同與流程優(yōu)化
智能審計能夠?qū)崿F(xiàn)與其他監(jiān)督部門的貫通協(xié)同,形成監(jiān)督合力。通過信息共享和協(xié)同工作,共同打擊違法違規(guī)行為,提高監(jiān)督的權(quán)威性和有效性。同時,通過流程自動化和智能化的技術(shù)手段優(yōu)化審計流程,高效地完成審計任務(wù),而不是過度依賴人工操作。
4.跨行業(yè)、跨領(lǐng)域融合與技術(shù)創(chuàng)新
智能審計實現(xiàn)了跨領(lǐng)域、跨行業(yè)的融合,將審計工作與財務(wù)管理、風險管理、內(nèi)部控制等有機結(jié)合,包括不同數(shù)據(jù)源、不同模態(tài)數(shù)據(jù)的整合、歸集,審計方法和工具的創(chuàng)新。在風險管理和內(nèi)部控制的融合中,智能審計與風險管理系統(tǒng)相連接,實現(xiàn)風險事件的自動關(guān)聯(lián),使得審計人員能夠更好地理解業(yè)務(wù)背后的風險,并有針對性地進行審計工作,給出內(nèi)部控制策略。智能審計在關(guān)注傳統(tǒng)數(shù)字審計領(lǐng)域的同時關(guān)注新興技術(shù)領(lǐng)域,如區(qū)塊鏈審計、虛擬現(xiàn)實場景中的審計。這種融合和創(chuàng)新為審計行業(yè)帶來新的發(fā)展機遇,使得審計工作更加符合時代變革潮流,更具前瞻性。
三、智能審計的核心技術(shù)
隨著企業(yè)數(shù)字化轉(zhuǎn)型的加速和審計工作的日益復(fù)雜,傳統(tǒng)的審計方法已經(jīng)無法滿足現(xiàn)代審計的需求。創(chuàng)新應(yīng)用場景的需求推動了智能審計核心技術(shù)的不斷發(fā)展,技術(shù)創(chuàng)新又為審計應(yīng)用場景拓展提供了技術(shù)支持和保障。
(一)審計數(shù)據(jù)的多方安全計算技術(shù)
1.技術(shù)要點
由于被審計單位、其他關(guān)聯(lián)方提供的數(shù)據(jù)中可能包含大量的個人隱私信息、政府敏感信息以及企業(yè)商業(yè)秘密。這就需要在審計過程中關(guān)注數(shù)據(jù)使用的安全性、保密性,防止由于人為管理、系統(tǒng)漏洞等原因?qū)е聰?shù)據(jù)遭到泄露或破壞。隨著審計全覆蓋數(shù)據(jù)采集范圍的不斷擴大,數(shù)據(jù)安全和隱私保護則成為審計中需要解決的基礎(chǔ)性問題。多方安全計算是保護數(shù)據(jù)隱私和安全的重要技術(shù),其起源可追溯到1982年亞洲圖靈獎第一人姚期智院士提出的百萬富翁問題,自此以后多方安全計算技術(shù)得到廣泛研究和應(yīng)用。已經(jīng)衍生出多個技術(shù)分支,包括混淆電路、秘密分享、同態(tài)加密[5],不經(jīng)意傳輸[6],隱私集合交集和差分隱私、聯(lián)邦學習等。技術(shù)應(yīng)用方面,差分隱私機制已被廣泛應(yīng)用于邏輯回歸、支持向量機等簡單二分模型[7],實現(xiàn)隱私與可用性的平衡;聯(lián)邦學習則通過GBoard輸入法,實現(xiàn)聯(lián)想詞和智能提示等功能。
2.技術(shù)應(yīng)用
多方安全計算是一種保護數(shù)據(jù)隱私和安全的技術(shù),允許多個參與方在不共享原始數(shù)據(jù)的情況下,對數(shù)據(jù)進行聯(lián)合計算和分析。應(yīng)用于多種場景,在審計領(lǐng)域多方安全計算助力審計人員在保護被審計單位數(shù)據(jù)隱私的同時,完成數(shù)據(jù)的采集、分析和驗證工作,步驟如下。
(1)數(shù)據(jù)預(yù)處理:審計人員和被審計單位首先對各自的數(shù)據(jù)進行預(yù)處理,如數(shù)據(jù)清洗、格式轉(zhuǎn)換等,以確保數(shù)據(jù)的質(zhì)量和兼容性。(2)建立安全計算環(huán)境:審計人員和被審計單位共同建立一個安全計算環(huán)境,該環(huán)境采用先進的加密技術(shù)和訪問控制機制,確保只有經(jīng)過授權(quán)的人員才能訪問和操作數(shù)據(jù)。(3)數(shù)據(jù)聯(lián)合分析:在安全計算環(huán)境中,審計人員和被審計單位對數(shù)據(jù)進行綜合分析,如比對財務(wù)報表和交易記錄的一致性、檢查異常交易等。以上分析過程是在加密狀態(tài)下進行的,以保證數(shù)據(jù)的隱私性。(4)生成審計報告:根據(jù)聯(lián)合分析的結(jié)果,審計人員生成審計報告。報告中只包含分析結(jié)果和結(jié)論,而不包含任何原始數(shù)據(jù)。這樣既可以保證報告的準確性和合規(guī)性,又可以避免數(shù)據(jù)泄露的風險。
(二)面向多模態(tài)大數(shù)據(jù)的審計數(shù)據(jù)治理技術(shù)
1.技術(shù)要點
自2015年實施審計全覆蓋后,審計數(shù)據(jù)體量日趨龐大,審計數(shù)據(jù)呈現(xiàn)出多模態(tài)、大體量的特點,涉及文本、圖像、圖表等多種形式的數(shù)據(jù)。針對審計業(yè)務(wù)中多模態(tài)大數(shù)據(jù)開展智能抽取、安全存儲、隱私使用等方面的治理是基礎(chǔ)。首先針對多模態(tài)審計大數(shù)據(jù)進行編碼處理,將編碼后信息進行融合對齊,通過多模態(tài)指令調(diào)整,將系統(tǒng)指令/文本查詢與輸入多模態(tài)上下文相關(guān)聯(lián),抽取成為知識。通過融合多方安全計算和聯(lián)邦學習來確保模型聚合或參數(shù)更新過程中的數(shù)據(jù)隱私和安全性,同時構(gòu)建完備的審計領(lǐng)域元數(shù)據(jù)管理體系,制定元數(shù)據(jù)治理規(guī)范和標準,形成安全有效的數(shù)據(jù)底座。
在審計數(shù)據(jù)的智能抽取方面則通過單一形式數(shù)據(jù)和混雜數(shù)據(jù)抽取實現(xiàn)數(shù)據(jù)的全覆蓋能力。
單一形式的數(shù)據(jù)抽取技術(shù)主要針對形式單一的數(shù)據(jù)如單純的文本、圖像等進行抽取。數(shù)據(jù)編碼器是實現(xiàn)有效數(shù)據(jù)轉(zhuǎn)換的關(guān)鍵。方法包括深度學習算法,如卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)等,用于自動提取數(shù)據(jù)的特征并進行編碼。采用傳統(tǒng)的特征工程方法,如手工設(shè)計特征提取器,結(jié)合審計領(lǐng)域知識進行數(shù)據(jù)編碼。在多模態(tài)大數(shù)據(jù)中,不同模態(tài)的數(shù)據(jù)存在異構(gòu)性,向量對齊旨在將不同模態(tài)的數(shù)據(jù)映射到同一向量空間中,以實現(xiàn)數(shù)據(jù)融合和關(guān)聯(lián)分析。研究方法包括基于距離度量的向量對齊法,如歐氏距離、余弦相似度等,以及基于深度學習的向量對齊法,如孿生神經(jīng)網(wǎng)絡(luò)、三元組損失函數(shù)等,用于衡量不同模態(tài)數(shù)據(jù)之間的相似性,并實現(xiàn)向量空間的對齊。多模態(tài)令牌指令是多模態(tài)大數(shù)據(jù)中的一種重要表示形式,融合不同模態(tài)的信息并傳遞給下游任務(wù),包括基于規(guī)則的方法手動設(shè)計令牌指令的生成規(guī)則,結(jié)合領(lǐng)域知識進行指令的設(shè)計;基于深度學習的方法序列生成模型(LSTM、Transformer等),通過訓(xùn)練模型自動生成多模態(tài)令牌指令。
混雜數(shù)據(jù)抽取指的是針對審計數(shù)據(jù)中夾雜著文本、圖像、圖表等信息的數(shù)據(jù)的抽取。通過模型訓(xùn)練構(gòu)建一個預(yù)處理分離模型,提高對資料中圖片和表格等信息的識別和提取能力。該模型自動從審計資料中分離出圖片和表格,針對圖片信息采用多模態(tài)大模型,識別提取出圖片中的關(guān)鍵內(nèi)容形成圖片摘要。對于表格信息的識別與提取,模型將采用大模型技術(shù),通過解析表格的結(jié)構(gòu)和內(nèi)容,提取出其中的重要信息。從材料中獲取有關(guān)表格的語義結(jié)構(gòu)信息,將其用于后續(xù)的處理和分析。為了綜合利用多模態(tài)數(shù)據(jù),將使用多模態(tài)模型來結(jié)合單一形式的數(shù)據(jù)信息處理方式,同時考慮文本、圖片和表格等多種形式的數(shù)據(jù),統(tǒng)一形成文本數(shù)據(jù)將它們?nèi)诤显谝黄?,生成全面且準確的語義摘要。根據(jù)語義摘要來檢索相關(guān)的原始數(shù)據(jù),實現(xiàn)更高效和準確的信息訪問和查詢能力。
2.技術(shù)應(yīng)用
審計機構(gòu)對一家大型企業(yè)的財務(wù)進行審計。企業(yè)的財務(wù)信息包含文本、圖片和圖表等多種形式的數(shù)據(jù)。審計人員需要從多模態(tài)數(shù)據(jù)中提取關(guān)鍵信息,進行合規(guī)性和真實性檢查,具體步驟如下。
(1)數(shù)據(jù)預(yù)處理與抽?。菏褂妙A(yù)處理分離模型對財務(wù)報表進行預(yù)處理,自動分離出文本、圖像和圖表等信息。采用多模態(tài)大模型進行識別與提取,形成圖片摘要和表格摘要。(2)數(shù)據(jù)融合與關(guān)聯(lián)分析:將提取出的文本、圖片和圖表信息進行融合對齊,形成統(tǒng)一的向量表示。通過關(guān)聯(lián)分析技術(shù)找出數(shù)據(jù)之間的潛在聯(lián)系和異常點,為后續(xù)審計提供線索。(3)安全存儲與隱私使用:采用多方安全計算和聯(lián)邦學習技術(shù)對模型進行訓(xùn)練和優(yōu)化,以保護數(shù)據(jù)的隱私性。將融合后的多模態(tài)數(shù)據(jù)存儲在安全的數(shù)據(jù)倉庫中,確保只有經(jīng)過授權(quán)的人員才能訪問。(4)生成審計報告:根據(jù)多模態(tài)數(shù)據(jù)的分析結(jié)果生成審計報告。報告中包含對財務(wù)信息的合規(guī)性和真實性的評估結(jié)果,以及相關(guān)的證據(jù)和解釋。
(三)基于多模態(tài)大數(shù)據(jù)的審計大語言模型技術(shù)
1.技術(shù)要點
傳統(tǒng)的數(shù)據(jù)處理技術(shù)已無法滿足審計對多模態(tài)大數(shù)據(jù)處理的需要。圍繞這類數(shù)據(jù)情形,在基座模型的基礎(chǔ)上,結(jié)合人工智能等技術(shù),開展領(lǐng)域分析專屬大語言模型的研究。分別通過針對垂直審計語料庫構(gòu)建、增量數(shù)據(jù)微調(diào)模型、知識圖譜結(jié)合大模型關(guān)聯(lián)分析三方面內(nèi)容進行構(gòu)建,以期更加準確、全面了解和分析被審計單位的數(shù)據(jù)情況,發(fā)現(xiàn)潛在的風險和問題,為審計決策提供科學依據(jù)[8]。訓(xùn)練垂直領(lǐng)域?qū)徲嫶竽P托枰欢ㄒ?guī)模的語料,由于人工標注語料成本很高,因此采用智能方式,自動快速進行審計語料庫的構(gòu)建,為模型訓(xùn)練提供高質(zhì)量數(shù)據(jù)集。
由于審計數(shù)據(jù)的敏感性,獲取大規(guī)模的訓(xùn)練數(shù)據(jù)非常困難,在多數(shù)的下游任務(wù)微調(diào)時,下游任務(wù)的目標與預(yù)訓(xùn)練的目標差距過大導(dǎo)致提升效果不明顯,因此微調(diào)過程中需要引入大量監(jiān)督語料。在此背景下,少量樣本學習成為一種有效的方法,通過構(gòu)建基于少量樣本學習的大語言模型訓(xùn)練微調(diào)模式,能夠讓機器從少量數(shù)據(jù)中學習并泛化到新情境,其基本思想是在數(shù)據(jù)集上構(gòu)建預(yù)訓(xùn)練模型,通過人工定義、自動搜索、文本生成等方法設(shè)置模板,通過標簽詞映射,使用小規(guī)模的支持集完成模型微調(diào),旨在解決傳統(tǒng)微調(diào)的語義差異和過擬合痛點問題。具體過程是結(jié)合特定審計領(lǐng)域的業(yè)務(wù)場景對數(shù)據(jù)進行分類標注處理,收集標記過的數(shù)據(jù)和未標注的數(shù)據(jù),使用標記過的數(shù)據(jù)進行微調(diào)訓(xùn)練,得出預(yù)定義標準的觀測結(jié)果和結(jié)果的置信度,選擇置信度概率較高的樣本作為可信樣本加入訓(xùn)練集;使用新訓(xùn)練集重新訓(xùn)練微調(diào)模型,并對審計文檔進行人工標注和檢查問答對效果等。重復(fù)上述操作,直到模型的抽取效果滿足指標要求。
審計領(lǐng)域大語言模型不僅要面臨樣本數(shù)據(jù)過少問題,還要面臨和其他垂直領(lǐng)域一樣的問題,即參數(shù)量過于龐大的訓(xùn)練學習,會面臨高額的訓(xùn)練硬件成本與數(shù)據(jù)成本問題。解決以上問題基于增量學習技術(shù),只需少量的訓(xùn)練數(shù)據(jù)調(diào)整部分的模型參數(shù),使得模型能夠達到領(lǐng)域適應(yīng)的目的,這是審計領(lǐng)域大語言模型應(yīng)用的核心難點。
將知識圖譜的信息關(guān)聯(lián)與可解釋性能力和大模型的語義理解能力結(jié)合對審計數(shù)據(jù)進行高效全面分析與挖掘,增強知識圖譜的表征是審計大模型的特色。知識圖譜的特性在于能夠挖掘?qū)嶓w節(jié)點間的隱藏關(guān)聯(lián)關(guān)系,大模型具備強大的語義分析、語言交互特性。審計人員通過自然語言交互向大語言模型提出關(guān)聯(lián)分析的需求,由大語言模型進行需求理解與分析,將需求轉(zhuǎn)譯成圖查詢語言或者語義向量,然后通過圖向量檢索以及圖查詢等方式從知識圖譜中挖掘出答案,并使用自然語言的方式返回給審計人員,給出知識圖譜中的分析解釋。
2.技術(shù)應(yīng)用
以某審計機構(gòu)對一家大型企業(yè)的財務(wù)報表及其相關(guān)數(shù)據(jù)的深度分析為例,評估其財務(wù)狀況和潛在風險,具體步驟如下。
(1)構(gòu)建垂直審計語料庫:收集該企業(yè)的歷史財務(wù)報表,相關(guān)法規(guī)、行業(yè)報告等多源數(shù)據(jù),形成初始的審計語料庫;利用智能抽取技術(shù),自動從語料庫中提取文本問答對,構(gòu)建高質(zhì)量的垂直審計語料庫,為模型訓(xùn)練提供數(shù)據(jù)支持。(2)增量數(shù)據(jù)微調(diào)模型:在預(yù)訓(xùn)練的大語言模型基礎(chǔ)上,利用增量學習技術(shù),對模型進行微調(diào)。選擇部分具有代表性的財務(wù)報表數(shù)據(jù)作為增量數(shù)據(jù),通過調(diào)整模型參數(shù),使模型更適應(yīng)審計領(lǐng)域的數(shù)據(jù)特點。這種微調(diào)方式有效降低了訓(xùn)練成本和時間,提高了模型的準確性和泛化能力。(3)結(jié)合知識圖譜關(guān)聯(lián)分析:將知識圖譜的信息關(guān)聯(lián)能力與大模型的語義理解能力相結(jié)合,對財務(wù)報表進行深入分析。通過自然語言向大語言模型提出關(guān)聯(lián)分析需求,如“請分析該企業(yè)近三年的營收增長趨勢及其與同行業(yè)企業(yè)的比較”。大語言模型理解需求后,以自然語言的形式返回給審計人員,根據(jù)返回的分析解釋,評估企業(yè)的財務(wù)狀況和潛在風險。
(四)一站式大模型開發(fā)管理平臺技術(shù)
1.技術(shù)要點
對審計大模型的開發(fā)應(yīng)用進行一站式管理是智能審計工程化應(yīng)用的重要環(huán)節(jié)。一站式大模型開發(fā)管理平臺覆蓋了數(shù)據(jù)處理、模型訓(xùn)練、模型評估和推理、人機交互界面等方面的內(nèi)容,具體架構(gòu)如圖1所示。
審計結(jié)果智能生成過程,需要將標準化的多模態(tài)審計大數(shù)據(jù)以及法律法規(guī)等審計知識注入基礎(chǔ)預(yù)訓(xùn)練模型中,以此來實現(xiàn)模型訓(xùn)練任務(wù),這就需要研究和設(shè)計一個智能化標注數(shù)據(jù)的系統(tǒng),以便更好地支持大模型的訓(xùn)練。
實現(xiàn)大語言模型的自動標注。利用大模型的能力先對多模態(tài)大數(shù)據(jù)進行初步自動標注,由專業(yè)標注員進行細化和校正、反饋給大模型,從而使模型反復(fù)迭代得到更高的模型性能,最終形成高質(zhì)量訓(xùn)練數(shù)據(jù)集、提高標注速度。
利用全流程評測工具完成大模型能力的評估。全流程評測工具包含了評測數(shù)據(jù)集構(gòu)建、模型加載與生成、結(jié)果的評測與指標計算等流程。預(yù)處理完評測數(shù)據(jù)集后,對評測數(shù)據(jù)配置指標計算方式、目標答案解析規(guī)則等。對模型評測工作進行拆分,確定評測維度、細化評測數(shù)據(jù)集,以定義最小粒度的工作節(jié)點,根據(jù)不同的執(zhí)行模式云集群模式、基于SLURM(Simple Linux Utility for Resource Management)的并行模式、基于本地Python的local模式等,最終完成模型評估任務(wù),生成模型評估結(jié)果。
智能審計算法模型之間的協(xié)同和調(diào)度越來越重要。為提高算法模型的效率和性能,需要設(shè)計面向多模態(tài)大數(shù)據(jù)的大語言模型的智能調(diào)度與系統(tǒng)協(xié)同技術(shù),包括兩方面的內(nèi)容:(1)通過大語言模型作為控制器實現(xiàn)智能調(diào)度算法,利用大模型生成任務(wù)規(guī)劃;實現(xiàn)大語言模型對現(xiàn)有模型的選擇;通過任務(wù)執(zhí)行,將任務(wù)分配給不同的模型并進行執(zhí)行。實現(xiàn)大模型的回答生成,并評測結(jié)果的準確性、可讀性。(2)利用大語言模型生成RPA業(yè)務(wù)流,實現(xiàn)審計工作的智能化和自動化處理流程,包括流程的自動設(shè)定、關(guān)鍵參數(shù)的智能設(shè)定和調(diào)優(yōu),實現(xiàn)在對審計大數(shù)據(jù)采集分析的基礎(chǔ)上與以往知識融合形成新認知的智能體自演進學習能力,確保其能在面對突發(fā)事件、新生問題等強時效性業(yè)務(wù)場景時提供可靠的知識服務(wù)能力,實現(xiàn)數(shù)據(jù)與知識的持續(xù)集成、領(lǐng)域大模型的演進學習,為多模態(tài)業(yè)務(wù)數(shù)據(jù)的感知與建模、全生命周期業(yè)務(wù)場景的智慧化精準服務(wù)提供底層平臺支撐。
2.技術(shù)應(yīng)用
審計人員依托一站式大模型開發(fā)管理平臺技術(shù)開展智能審計,應(yīng)用過程如下。
(1)數(shù)據(jù)處理與自動標注:收集企業(yè)多維度來源的多模態(tài)數(shù)據(jù),對數(shù)據(jù)進行標準化處理。利用平臺提供的自動標注功能,對多模態(tài)數(shù)據(jù)進行初步自動標注。自動標注系統(tǒng)通過大模型的語義理解能力,對數(shù)據(jù)中的關(guān)鍵信息進行提取和標注,為后續(xù)模型訓(xùn)練提供高質(zhì)量的訓(xùn)練數(shù)據(jù)集。(2)模型訓(xùn)練與評估:將處理后的數(shù)據(jù)注入預(yù)訓(xùn)練的大模型中,進行模型訓(xùn)練。利用平臺提供的全流程評測工具,定期評估模型的能力。通過配置評測數(shù)據(jù)集、計算指標等方式,評估模型的準確性、可讀性等。根據(jù)評估結(jié)果對模型進行調(diào)優(yōu),提高模型的性能。(3)智能調(diào)度與系統(tǒng)協(xié)同:利用大模型作為控制器,實現(xiàn)智能調(diào)度算法。通過大模型的生成任務(wù)規(guī)劃,實現(xiàn)對現(xiàn)有模型的選擇和調(diào)度,將任務(wù)分配給不同的模型執(zhí)行。生成RPA業(yè)務(wù)流,實現(xiàn)審計工作的智能化和自動化處理。包括流程的自動設(shè)定、關(guān)鍵參數(shù)的智能設(shè)定和調(diào)優(yōu),實現(xiàn)與以往知識的融合,形成新認知的智能體自演進學習能力。(4)結(jié)果展示與決策支持:通過大模型的推理功能,生成審計報告,展示審計結(jié)果。審計報告包括對企業(yè)財務(wù)報表的分析、潛在風險的識別、不合規(guī)行為的揭示等內(nèi)容。根據(jù)報告結(jié)果為企業(yè)提供決策支持,幫助企業(yè)改進財務(wù)管理、加強風險防控等方面的工作。
四、智能審計的工程化路徑
工程化是智能審計廣泛應(yīng)用的基礎(chǔ),是審計向數(shù)字化轉(zhuǎn)型的必經(jīng)之路。智能審計的核心技術(shù)發(fā)展和創(chuàng)新為工程化路徑的不斷完善和優(yōu)化提供了可能,而工程化路徑的實施和應(yīng)用則為核心技術(shù)的進一步發(fā)展和應(yīng)用提供實踐基礎(chǔ)和反饋。
(一)基于多模態(tài)大數(shù)據(jù)的審計數(shù)據(jù)治理路徑
采用“多模態(tài)大數(shù)據(jù)智能抽取→多方數(shù)據(jù)隱私計算保護融合→審計元數(shù)據(jù)管理體系構(gòu)建”的技術(shù)路徑,實現(xiàn)面向多模態(tài)審計大數(shù)據(jù)的安全治理。總體技術(shù)路線如圖2所示。
對接多種異構(gòu)數(shù)據(jù)源,對異構(gòu)數(shù)據(jù)進行梳理轉(zhuǎn)化,進行數(shù)據(jù)清洗,對數(shù)據(jù)進行編碼對齊,實現(xiàn)對采集圖片、文本、音視頻等形式異構(gòu)數(shù)據(jù)的智能抽取,做到廣泛的數(shù)據(jù)采集。構(gòu)建多方安全計算算法,實現(xiàn)數(shù)據(jù)存儲加密,在多方安全計算與聯(lián)邦學習融合的基礎(chǔ)上,實現(xiàn)數(shù)據(jù)隱私存儲以及數(shù)據(jù)交互安全。最后構(gòu)建一套元數(shù)據(jù)管理體系,將智能抽取的數(shù)據(jù)通過元數(shù)據(jù)體系管理起來,實現(xiàn)數(shù)據(jù)的高效使用,保證審計質(zhì)效。
考慮到企業(yè)的日常運營涉及多種數(shù)據(jù)類型,包括文本合同、圖片發(fā)票、視頻監(jiān)控等。多模態(tài)數(shù)據(jù)為審計提供了豐富的信息,也帶來了治理上的挑戰(zhàn)。如何有效保證數(shù)據(jù)安全、隱私和高效利用,成為審計工作的關(guān)鍵。一是多模態(tài)大數(shù)據(jù)智能抽取。使用智能抽取技術(shù)從企業(yè)各個業(yè)務(wù)系統(tǒng)中抽取關(guān)鍵數(shù)據(jù)。通過自然語言處理技術(shù)從合同文本中提取簽約日期、金額、條款等關(guān)鍵信息;通過圖像識別技術(shù)從發(fā)票圖片中識別出供應(yīng)商、發(fā)票號、金額等信息;通過視頻分析技術(shù)從監(jiān)控視頻中識別出異常行為或違規(guī)行為。審計數(shù)據(jù)治理大大提高了業(yè)務(wù)數(shù)據(jù)采集的效率和準確性,為后續(xù)的審計分析提供了堅實基礎(chǔ)。二是多方數(shù)據(jù)隱私計算保護數(shù)據(jù)融合。大型企業(yè)審計涉及多地區(qū)和多子公司的數(shù)據(jù),采用多方安全計算算法,確保在數(shù)據(jù)不離開本地的情況下進行聯(lián)合分析。對于涉及不同地區(qū)子公司的財務(wù)數(shù)據(jù),利用聯(lián)邦學習算法進行模型訓(xùn)練,實現(xiàn)跨區(qū)域的聯(lián)合審計保證數(shù)據(jù)的隱私性。三是審計元數(shù)據(jù)管理體系構(gòu)建。構(gòu)建一個元數(shù)據(jù)管理體系,將所有抽取的數(shù)據(jù)進行分類、標簽化和索引。對于合同數(shù)據(jù),根據(jù)合同類型、簽約方、金額等維度進行分類和標簽化;對于發(fā)票數(shù)據(jù),根據(jù)供應(yīng)商、發(fā)票類型、開票日期等進行分類和索引。通過元數(shù)據(jù)管理體系,審計人員能夠快速定位到所需數(shù)據(jù),達到“如臂使指”的效果。
(二)基于多模態(tài)大數(shù)據(jù)的審計大語言模型應(yīng)用路徑
采用“預(yù)訓(xùn)練數(shù)據(jù)準備→大語言模型訓(xùn)練和評估→知識圖譜融合大模型應(yīng)用分析”的技術(shù)路線,實現(xiàn)面向?qū)徲嬵I(lǐng)域多模態(tài)大數(shù)據(jù)的大語言模型應(yīng)用。如圖3所示。
審計領(lǐng)域需要處理大量多模態(tài)數(shù)據(jù)。為了從復(fù)雜的數(shù)據(jù)中提取有用的信息,選用基于多模態(tài)大數(shù)據(jù)的審計大語言模型。審計機構(gòu)審查一家大型跨國企業(yè)的全部財務(wù)數(shù)據(jù),并希望使用大語言模型來自動化處理和分析這些數(shù)據(jù):一是預(yù)訓(xùn)練數(shù)據(jù)準備。收集大量的財務(wù)報表、合同文本和圖片數(shù)據(jù);利用自然語言處理技術(shù)對文本數(shù)據(jù)進行清洗和標注;對圖片數(shù)據(jù)則提取其中的關(guān)鍵信息。經(jīng)過預(yù)訓(xùn)練數(shù)據(jù)準備,得到高質(zhì)量的數(shù)據(jù)集,為后續(xù)的大語言模型訓(xùn)練和評估提供基礎(chǔ)。二是大語言模型訓(xùn)練和評估。使用大語言模型,并基于預(yù)訓(xùn)練數(shù)據(jù)集進行訓(xùn)練。訓(xùn)練過程中如發(fā)現(xiàn)模型的推理邏輯能力在某些財務(wù)報表分析任務(wù)上表現(xiàn)不佳,可使用增量微調(diào)LoRA方法對模型進行調(diào)整,經(jīng)過訓(xùn)練和評估,得到一個適用的多模態(tài)大數(shù)據(jù)處理模型。三是知識圖譜融合大模型應(yīng)用分析。為進一步提高模型的性能,將知識圖譜與大語言模型進行融合。構(gòu)建審計領(lǐng)域的知識圖譜,包括各種財務(wù)報表的實體、關(guān)系和規(guī)則;利用知識圖譜增強大語言模型的能力,使其能夠更好地理解財務(wù)報表中的復(fù)雜關(guān)系和規(guī)則。通過知識圖譜融合大模型應(yīng)用分析,審計人員發(fā)現(xiàn)模型的實體發(fā)現(xiàn)、共指消解和關(guān)系提取能力得到了顯著提升。
(三)基于多模態(tài)大數(shù)據(jù)的審計智能體自演進路徑
采用“大模型設(shè)計→模型評估及生成智能體→審計問題自動發(fā)現(xiàn)、審計報告自動生成、審計建議自動輸出等應(yīng)用落地→審計智能體自演進”的技術(shù)路線,實現(xiàn)數(shù)據(jù)與知識融合驅(qū)動的一站式自演進審計應(yīng)用平臺,總體技術(shù)路線如圖4所示。
依托前述工程化基礎(chǔ),通過提取審計業(yè)務(wù)活動所涉及的相關(guān)數(shù)據(jù),采用命令實體分類、文本分類等技術(shù)構(gòu)建可供大模型智能體學習的高質(zhì)量訓(xùn)練數(shù)據(jù)集,使之成為審計智能體的知識底座。針對審計知識底座,利用一站式模型開發(fā)管理平臺中的模型微調(diào)、評估、部署等功能,完成對大模型的調(diào)優(yōu),進而形成審計智能體。借助于知識底座的不斷更新,為審計智能體的自演進提供數(shù)據(jù)基礎(chǔ)。利用RPA技術(shù)審計智能體完成對審計業(yè)務(wù)規(guī)則和流程的制定[9],發(fā)現(xiàn)業(yè)務(wù)活動中的關(guān)鍵問題、生成審計報告,給出相應(yīng)的審計建議。在上述基礎(chǔ)上形成基于大模型的審計智能體自演進框架,最后對形成的框架進行人工評價和調(diào)整,以使其更為準確和全面地理解審計業(yè)務(wù),并最終服務(wù)于審計業(yè)務(wù)。
五、結(jié)語
隨著大數(shù)據(jù)、人工智能等新技術(shù)的廣泛應(yīng)用,特別是大語言模型等的探索應(yīng)用,能夠迅速處理和理解大量的非結(jié)構(gòu)化數(shù)據(jù)。審計場景、審計方法、審計過程和審計工具正在經(jīng)歷著全面而深刻的變革,推動著傳統(tǒng)審計向智能審計轉(zhuǎn)型,建成新型審計監(jiān)督體系?,F(xiàn)有審計實踐與成果,標志著審計工作不再局限于傳統(tǒng)的數(shù)據(jù)整理和初步分析,而是更多地依賴自動化流程和先進算法,協(xié)助審計人員更快速度、更為準確地挖掘數(shù)據(jù)模式、規(guī)律。
智能審計賦能審計人員更靈活地應(yīng)對復(fù)雜的審計任務(wù),專注于業(yè)務(wù)分析和方向性決策。審計機關(guān)一旦掌握先進的智能審計技術(shù)和工具,包括多方安全計算技術(shù)、多模態(tài)大數(shù)據(jù)處理、自動化審計測試、智能決策支持、大模型開發(fā)管理平臺技術(shù)等,實現(xiàn)審計過程的高度自動化和智能化,則審計人員的工作將從繁瑣的數(shù)據(jù)收集、初步分析中解放出來,轉(zhuǎn)而致力于對復(fù)雜分析結(jié)果的深度解讀、決策制定和行業(yè)研究。
總之,大數(shù)據(jù)和人工智能等新技術(shù)將為審計領(lǐng)域注入新活力,讓審計人員從煩瑣、初級的數(shù)據(jù)處理中解放出來,通過深層次的、高維度的數(shù)據(jù)分析為國家治理提供更有深度和戰(zhàn)略性的審計服務(wù)。
【參考文獻】
[1] 習近平.在二十屆中央審計委員會第一次會議上的講話[EB/OL].(2023-05-23)[2024-02-16].https:// www.ccps.gov.cn/tpxw/202310/t20
231031_159717.shtml.
[2] 晏維龍,孟金卓,張璐,等.開展“如影隨形”審計工作的思路[J].審計觀察,2023(8):56-61.
[3] 秦榮生.研究型審計的現(xiàn)實使命與實現(xiàn)路徑研究[J].會計之友,2024(4):2-5.
[4] 葉祥,錢鋼.審計領(lǐng)域大數(shù)據(jù)治理體系研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,42(4):27-32.
[5] YAO A C C.How to generate and exchange secrets[C].27th Annual Symposium on Foundations of Computer Science (SFCS 1986),Toronto,ON,Canada,1986.
[6] 李莉,宣佳錚,高尚,等.基于不經(jīng)意多項式估值的SM4協(xié)同加解密方案[J].計算機應(yīng)用研究,2024,41(6):1862-1868.
[7] GIDDENS S,ZHOU Y,KRULL KevinR,et al.A differentially private weighted empirical risk minimization procedure and its application to outcome weighted learning[Z].2023.
[8] 徐超.審計大模型的構(gòu)建與運用[J].審計觀察,2023(11):4-7.
[9] 樊俏.財務(wù)機器人RPA的智能數(shù)據(jù)提取與處理技術(shù)[J].中國信息化,2024(1):58-59.