謝雨欣
摘要:檔案鑒定是檔案管理的基礎(chǔ)性業(yè)務(wù)工作,重要性不言而喻,而由于文件數(shù)量的急劇增加以及相關(guān)技術(shù)的更新?lián)Q代等復(fù)雜因素,導(dǎo)致檔案鑒定工作的弊端愈加突出,亟須采取有效措施解決問題。該文以專家系統(tǒng)的應(yīng)用為核心,以對檔案鑒定工作現(xiàn)階段存在難題的分析作為問題來源,試圖將專家系統(tǒng)與檔案鑒定進(jìn)行融合,初步構(gòu)建基于專家系統(tǒng)的檔案鑒定工作簡單模型,提升檔案鑒定工作效率。
關(guān)鍵詞:專家系統(tǒng) 檔案鑒定工作 知識庫 人工智能
隨著大數(shù)據(jù)時代與人工智能時代的到來,傳統(tǒng)的檔案鑒定工作已不能適應(yīng)新時代的需求,鑒定效率低下、檔案載體多樣導(dǎo)致鑒定工作難度大等問題層出不窮。而在全新的技術(shù)背景下,要想使檔案鑒定工作滿足更高的需求,可以利用先進(jìn)的人工智能技術(shù)。在眾多的人工智能技術(shù)中,專家系統(tǒng)尤其具備支持人類決策、模擬人類解決領(lǐng)域問題的強大功能,并且它已在動物識別、故障診斷等領(lǐng)域成功應(yīng)用,北京市市場監(jiān)督管理局也運用專家系統(tǒng)研發(fā)出了智能鑒定工具[1],因此,利用專家系統(tǒng)進(jìn)行檔案鑒定工作的創(chuàng)新具有一定的可行性。本文基于專家系統(tǒng)的檔案鑒定工作構(gòu)建了具體的應(yīng)用模型,以期為檔案鑒定工作在新技術(shù)時代下的發(fā)展提供參考。
專家系統(tǒng)是一個智能計算機程序系統(tǒng),它能夠模仿人類專家的思維活動對問題進(jìn)行推理和判斷,也能像專家那樣求解專門問題。專家系統(tǒng)工作的基礎(chǔ)是把某一領(lǐng)域里被公認(rèn)的權(quán)威專家的經(jīng)驗精選出來,并歸納成一定形式的規(guī)則,計算機將根據(jù)專門的知識,運用這些規(guī)則去模仿專家分析問題的方法和解決問題的策略,最終求得問題的解答。[2]
專家系統(tǒng)主要是由人—機交互界面、知識獲取、推理機、知識庫、解釋器和綜合數(shù)據(jù)庫六個部分構(gòu)成,如圖1所示。其中,知識庫與推理機是它的核心組成部分。專家系統(tǒng)的整個工作過程連續(xù)且簡單,首先領(lǐng)域?qū)<覍I(yè)知識、經(jīng)驗等信息輸入系統(tǒng)中形成知識庫,專家系統(tǒng)針對用戶提出的事實情況與問題,運用知識庫中的內(nèi)容,使用推理機模仿專家進(jìn)行分析判斷,進(jìn)而得出結(jié)論反饋給用戶。[3]
進(jìn)入21世紀(jì)以來,檔案工作領(lǐng)域經(jīng)歷了一系列重要的發(fā)展變革,深刻影響著檔案鑒定工作實踐。[4]大數(shù)據(jù)、云計算、人工智能等新一代信息技術(shù)為電子文件產(chǎn)生與管理提供了機遇,同時也對鑒定工作提出了更高要求,相關(guān)制度標(biāo)準(zhǔn)的缺乏也為檔案鑒定工作造成了一定的影響。因此,采用自主性與專業(yè)性較強的專家系統(tǒng)助力鑒定工作尤為重要。
(一)電子文件大量涌現(xiàn)對鑒定工作要求的提高
隨著無紙化辦公的普及,電子文件開始大量涌現(xiàn),與傳統(tǒng)的紙質(zhì)檔案相比,它具有較強的易被篡改性,這決定了電子文件的真?zhèn)坞y辨,因此,除了要對其價值進(jìn)行鑒定外,還需要對其真實性、完整性、可用性等進(jìn)行詳細(xì)鑒定,但由于技術(shù)要求較高,難以對電子文件是否具有原始性進(jìn)行判斷,導(dǎo)致鑒定難度大大提升。除此之外,電子文件的脆弱性也容易導(dǎo)致信息安全問題的發(fā)生,黑客攻擊、病毒侵略、軟硬件系統(tǒng)更新等都可能使電子文件的安全受到威脅,而在鑒定過程中,如果出現(xiàn)工作人員的保密意識和信息安全意識薄弱,相關(guān)部門對系統(tǒng)安全缺乏有效監(jiān)督等問題,就會再次增加安全隱患遺留的概率。[5]針對電子文件真實性判斷和安全性保障問題,基于信息化環(huán)境的專家系統(tǒng)可以采取相關(guān)措施應(yīng)對電子文件出現(xiàn)的各種問題,比如:在專家系統(tǒng)知識庫中加入哈希算法,推理機通過計算哈希值對檔案真實性進(jìn)行判斷;利用人工智能技術(shù)在系統(tǒng)中安裝智能防火墻、智能防入侵系統(tǒng)[6]來保障信息安全等。
(二)檔案鑒定工作標(biāo)準(zhǔn)缺乏且難以掌握
鑒定標(biāo)準(zhǔn)是判斷文件價值、有用性、可用性的依據(jù)和核心。[7]目前我國關(guān)于檔案鑒定的理論支持較薄弱,且相關(guān)的政策制度也較為鮮見,專門的鑒定條例只有《機關(guān)文件材料歸檔范圍和文書檔案保管期限規(guī)定》《企業(yè)文件材料歸檔范圍和保管期限規(guī)定》,相對于檔案鑒定工作的需求來說,這些制度還遠(yuǎn)遠(yuǎn)不足。因此,我們在充分肯定現(xiàn)有理論、政策的基礎(chǔ)上,更應(yīng)該看到實際工作需要更加貼切的智力支持的急切性。[8]另外,對于文書檔案來說,數(shù)量龐大、內(nèi)容豐富,其鑒定標(biāo)準(zhǔn)也難以掌握,不像專門檔案有比較明確的標(biāo)準(zhǔn)可依,比如會計檔案保管期限清楚地劃分為5年、15年、25年、永久等幾個級別,鑒定時容易操作[9],而文書檔案在實際的保管期限劃分過程中,還存在著難以確定期限、劃分方式不足等問題,影響檔案鑒定工作的順利開展。專家系統(tǒng)的應(yīng)用能在一定程度上緩解這些問題,知識庫可以根據(jù)輸入的現(xiàn)有標(biāo)準(zhǔn)、理論進(jìn)行自我學(xué)習(xí),在鑒定時利用啟發(fā)后的規(guī)則,為鑒定人員免除人工做決定的過程。
根據(jù)專家系統(tǒng)的整體運作過程并結(jié)合檔案鑒定工作的程序,筆者初步構(gòu)建出一個基于專家系統(tǒng)的檔案鑒定工作模型,如圖2所示。按照新模型的設(shè)計,大致的工作流程為:首先應(yīng)用人工智能識別技術(shù)將待鑒定的檔案數(shù)字化,檔案專家、檔案工作者將鑒定工作相關(guān)的知識以機器可以理解的表達(dá)方式輸入知識庫中;然后由檔案管理人員將數(shù)字化的檔案輸入系統(tǒng)中,推理機通過對檔案專家、工作者在知識庫中輸入的知識、經(jīng)驗等信息進(jìn)行分析推理,得出相關(guān)結(jié)論,最終將結(jié)果反饋給檔案管理人員;用戶可通過雙向交流通道參與到鑒定工作過程中。
(一)數(shù)字化檔案
隨著信息時代的發(fā)展,檔案館收集到的檔案載體形式多種多樣,既包括紙質(zhì)類檔案與電子文件,也包括照片、音視頻檔案,所有載體形式檔案的數(shù)字化都需要一定的技術(shù)水平做支撐,而人工智能中的識別技術(shù)此時就可以派上用場。除了較為常見的用文字識別技術(shù)識別紙質(zhì)檔案外,對于照片、視頻檔案要用到圖像識別技術(shù)進(jìn)行辨別,對于音頻檔案要利用語音識別技術(shù),科大訊飛研發(fā)的檔案機就利用語音識別、合成技術(shù)參與了口述檔案的征集工作[10],取得了顯著成效。待鑒定的檔案除了檔案館從各級各類檔案部門接收來的文件之外,還包括從社交媒體、檔案網(wǎng)站等網(wǎng)頁上收集到的檔案信息,較大的工作量也亟須這種自主系統(tǒng)輔助鑒定工作的完成。
(二)知識獲取與知識庫
知識庫存放著專家提供的知識,專家系統(tǒng)解決判斷問題的過程就是通過知識庫中的知識來模擬專家的思維方式進(jìn)行的。不同領(lǐng)域?qū)<蚁到y(tǒng)知識庫中保存著不同專業(yè)的知識,而在該模型中,哪些知識需要通過知識獲取存儲到知識庫中,是由檔案鑒定工作的內(nèi)容與方法決定的。檔案專家要從檔案鑒定內(nèi)容與程序入手,將涉及的知識輸入知識庫中,其中既要包含檔案鑒定方法、鑒定原則等這些專業(yè)知識,又要包含實際案例和專家自身的鑒定經(jīng)驗,這樣不僅避免了不同專家意見不同導(dǎo)致的分歧,又使檔案得到了綜合鑒定。另外,知識庫具有一定的啟發(fā)性,即它不僅僅可以根據(jù)既定知識進(jìn)行邏輯上的判定工作,還具有根據(jù)專業(yè)知識進(jìn)行聯(lián)想、學(xué)習(xí)的功能,以此進(jìn)行啟發(fā)性的推理工作。
(三)推理機
針對檔案管理人員輸入的待鑒定檔案,推理機根據(jù)提出的問題,結(jié)合知識庫中的規(guī)則對檔案進(jìn)行反復(fù)判斷求證。在這個過程中,推理機一般可以運用兩種推理方式,即正向推理與反向推理。舉例子來說,當(dāng)對檔案的保管期限進(jìn)行判斷時,可以先對檔案進(jìn)行分析,從中獲取相關(guān)事實與信息,然后從事實出發(fā),演繹出文件的保管期限,這是正向推理方法;先選擇一種保管期限,再反向確定其真假,這是反向推理方法。[11]知識庫是基礎(chǔ),推理機是核心,推理策略、推理方式是否合理和高效影響著推理結(jié)論是否準(zhǔn)確,因此,要提高檔案鑒定專家系統(tǒng)的工作質(zhì)量與效率,就要著重對推理機進(jìn)行功能上的優(yōu)化,以滿足檔案鑒定工作的需求。
(四)綜合數(shù)據(jù)庫
綜合數(shù)據(jù)庫屬于專家系統(tǒng)的輔助結(jié)構(gòu)之一,用來暫時存儲推理過程中涉及的各種信息,包括推理所需的初始數(shù)據(jù)、中間結(jié)果和最終結(jié)論等。在檔案鑒定工作中,綜合數(shù)據(jù)庫會存儲對于檔案保管期限、密級等方面的假設(shè),以及在檔案內(nèi)容中關(guān)于檔案價值判定的關(guān)鍵詞、關(guān)于密級判定的敏感詞等,為推理機的推理過程留下記錄,也為解釋器提供相關(guān)數(shù)據(jù)。
(五)解釋器
解釋器是專家系統(tǒng)的另一個重要輔助性結(jié)構(gòu),它是對系統(tǒng)的推理行為做出解釋的部分,能夠針對用戶的提問,就推理過程、結(jié)論或系統(tǒng)的一系列行為等方面做出必要的說明。在檔案鑒定工作中,解釋器可以對如保管期限的推理策略,系統(tǒng)為什么選擇某種鑒定規(guī)則進(jìn)行鑒定,以及系統(tǒng)為什么對某份檔案判定為某種密級等進(jìn)行解釋。這些推理過程的記錄和解釋一方面能使技術(shù)人員掌握系統(tǒng)的運行狀況,使檔案工作者了解知識庫的內(nèi)容是否存在欠缺,以便對專家系統(tǒng)進(jìn)行及時的修復(fù)與維護;另一方面,這也使用戶(檔案管理者)能夠了解系統(tǒng)工作過程,并回答用戶的一些問題,促進(jìn)二者之間的交互??傮w來說,解釋器是賦予專家系統(tǒng)透明性的結(jié)構(gòu),它使用戶能夠更加理解與接受該系統(tǒng),使系統(tǒng)更加人性化。
(六)雙向交流通道
檔案內(nèi)容涉及的領(lǐng)域較為廣泛,容易出現(xiàn)由于檔案鑒定人員對相關(guān)專業(yè)知識缺乏導(dǎo)致的鑒定結(jié)果出現(xiàn)偏差現(xiàn)象,因此,檔案部門可以呼吁廣大檔案形成者、檔案利用者、公眾積極參與到知識獲取環(huán)節(jié)中來,經(jīng)過檔案管理人員審核,向知識庫輸入有關(guān)事實、信息和知識,增強推理結(jié)果的合理性,這也是在“以用戶為中心”的思想指導(dǎo)下采取的相關(guān)舉措。同時,針對經(jīng)過專家系統(tǒng)鑒定后的檔案,除了需要檔案管理人員根據(jù)解釋器調(diào)整系統(tǒng)功能外,也可以通過管理人員邀請公眾對鑒定結(jié)果進(jìn)行反饋的方式來發(fā)現(xiàn)問題、解決問題,在統(tǒng)一的交流平臺上對知識庫中的內(nèi)容提出建議,隨時為專家系統(tǒng)提供外部的智力支持。正向輸入知識,反向反饋問題,這種以用戶參與為核心的雙向交流通道能為專家系統(tǒng)優(yōu)化做出巨大的貢獻(xiàn)。
檔案鑒定工作在數(shù)字化時代受到了一定沖擊,鑒定理論、制度的不適應(yīng),鑒定人員工作量的增加等問題,都亟須采取相應(yīng)的措施去緩解,而作為人工智能技術(shù)之一的專家系統(tǒng)具有透明、靈活等特點,能夠較好地輔助檔案工作者完成鑒定工作。以專家系統(tǒng)自身結(jié)構(gòu)為基礎(chǔ)構(gòu)想的檔案鑒定模型可以彌補傳統(tǒng)鑒定面臨的程序復(fù)雜、標(biāo)準(zhǔn)難以掌握等難題,創(chuàng)新鑒定模式,發(fā)揮多種功能。當(dāng)然,該基于專家系統(tǒng)的檔案鑒定模型還存在著一些不足,尚停留在理論階段,需要后續(xù)在實踐上的改進(jìn)與深入研究。
注釋及參考文獻(xiàn):
[1][11]鄭子建,黃燕芳,鄭瑋.計算機輔助檔案價值鑒定專家系統(tǒng)[J].檔案學(xué)研究,1993(S1):49.
[2]張遠(yuǎn)寧.淺析計算機專家系統(tǒng)在檔案管理中的應(yīng)用[J].檔案學(xué)研究,1993(S1):29.
[3]陳彤.專家系統(tǒng)在勞動政策網(wǎng)上咨詢服務(wù)中的應(yīng)用[D].上海:復(fù)旦大學(xué),2010.
[4]譚彩敏.新時期檔案價值鑒定研究:背景、標(biāo)準(zhǔn)、主體[J].北京檔案,2019(12):26-28.
[5]黃瑩妍,王蕓蕓.“互聯(lián)網(wǎng)+”背景下檔案鑒定工作思考[J].檔案時空,2019(8):14-15.
[6]沙洲.人工智能在檔案工作中的應(yīng)用研究[J].檔案與建設(shè),2018(2):36-39.
[7]宋魏巍.大數(shù)據(jù)環(huán)境下電子文件鑒定研究[J].北京檔案,2015(12):16-19.
[8]姜之茂.當(dāng)前我國檔案鑒定工作中的問題探討[J].檔案學(xué)研究,1998(1):10-13.
[9]劉鳳鳴.探討文書檔案鑒定工作中存在的問題及對策[J].蘭臺世界,2013(S1):83.
[10]陳慧,羅慧玉,張凱,陳暉.AI賦能檔案:AI技術(shù)在檔案管理中的賦能模式探究[J].山西檔案,2020(4):76-83;131.
作者單位:上海大學(xué)圖書情報檔案系