(揚州大學社會發(fā)展學院 揚州 225002)
人工智能是研究、開發(fā)用于模擬和擴展人的智能的理論、方法、技術(shù)和應用系統(tǒng)的一門技術(shù)科學,正在對人類社會發(fā)展和生產(chǎn)生活產(chǎn)生極其深刻的影響。在檔案管理領(lǐng)域引入人工智能,將極大提高管理效果、改善服務效率低下等問題。本文從檔案管理創(chuàng)新的視角,運用SWOT方法分析檔案館應用人工智能技術(shù)創(chuàng)新管理的優(yōu)劣勢、新技術(shù)應用給檔案管理帶來的機遇和挑戰(zhàn),探索檔案智能管理,提高檔案管理水平。
SWOT分析法又稱態(tài)勢分析法,主要分析研究對象的內(nèi)部優(yōu)勢、劣勢和外部的機會、威脅,理清內(nèi)外部關(guān)系,通過匹配得出最佳實施戰(zhàn)略。綜合性檔案館有一定的應用人工智能技術(shù)的基礎(chǔ),檔案管理工作因技術(shù)環(huán)境的改變面臨新的機會,這正是SWOT與檔案館應用人工智能技術(shù)創(chuàng)新管理工作特性的一致性。因此,筆者將SWOT要素運用到檔案智能管理工作中,探討人工智能技術(shù)在檔案管理環(huán)節(jié)的應用場景。
1.1.1 具備豐厚的數(shù)據(jù)資源基礎(chǔ)
高質(zhì)量的數(shù)據(jù)資源是人工智能應用的重要前提。截至2018年底,我國館藏電子檔案127.7萬GB。其中,數(shù)碼照片33.2萬GB,數(shù)字錄音、數(shù)字錄像30.5萬GB。館藏檔案數(shù)字化副本1556.4萬GB。[1]檔案館擁有海量數(shù)字資源,數(shù)字存儲與管理方面的優(yōu)勢確保資源真實可靠。檔案館可以利用人工智能技術(shù)將這些數(shù)字資源轉(zhuǎn)化為優(yōu)質(zhì)數(shù)據(jù)資源,以此為基礎(chǔ),應用人工智能新技術(shù),促進管理和服務智能化。
1.1.2 具有開展人工智能技術(shù)的基本條件
隨著科學技術(shù)的進步,許多智能化設(shè)備設(shè)施,檔案綜合管理、控制及服務系統(tǒng)紛紛運用到檔案館建設(shè)上來,實現(xiàn)對檔案資源、設(shè)施設(shè)備和庫房環(huán)境的一體化管理,使得數(shù)字檔案館向智能化方向邁進了一大步,具有初步的人工智能技術(shù)條件。[2]檔案館在完成硬件形式上的升級后,還需利用人工智能技術(shù),建設(shè)內(nèi)在的數(shù)字檔案資源,創(chuàng)新檔案管理環(huán)節(jié)。
1.2.1 數(shù)字檔案館建設(shè)大多停留于初級階段
為響應智慧城市建設(shè),綜合性檔案館一直致力于應用人工智能、物聯(lián)網(wǎng)等新技術(shù)建設(shè)智慧檔案館。數(shù)字檔案館是智慧檔案館建設(shè)的基礎(chǔ)。目前,我國部分檔案館已完成紙質(zhì)檔案的數(shù)字化工作,但數(shù)字資源建設(shè)水平以及綜合管理系統(tǒng)建設(shè)程度參差不齊。檔案館期望建設(shè)一個能夠?qū)?shù)字檔案信息進行采集、加工、存儲、管理,并通過門戶網(wǎng)站、社交媒體等網(wǎng)絡(luò)平臺提供信息服務和共享利用的檔案信息集成管理系統(tǒng)。[3]然而,現(xiàn)有的系統(tǒng)尚未實現(xiàn)數(shù)字檔案信息的全過程管理;信息服務網(wǎng)絡(luò)平臺版塊功能不全,缺少定期的系統(tǒng)更新與維護。檔案館綜合管理系統(tǒng)智能化程度較低,不利于人工智能新技術(shù)的嫁接。
1.2.2 檔案館員綜合素質(zhì)偏低
檔案人員的綜合素質(zhì)偏低是掣肘新技術(shù)應用的重要因素。一是館員結(jié)構(gòu)不合理,我國各級檔案行政管理部門和綜合性檔案館現(xiàn)有專職人員年齡偏大、技術(shù)人才偏少;二是檔案工作人員專業(yè)程度較低,我國檔案專職人員中檔案專業(yè)碩士研究生以上學歷的比例僅為1%,大部分檔案工作人員數(shù)據(jù)素養(yǎng)偏低,對檔案數(shù)據(jù)的收集、挖掘和綜合分析能力弱,[4]難以適應人工智能技術(shù)的應用工作,需要相應的技術(shù)培訓,才能熟悉操作流程,獨立操作機器設(shè)備。
1.3.1 國家政策的引導
2017年7月,國家發(fā)布《新一代人工智能發(fā)展規(guī)劃》,確定人工智能發(fā)展分三步走的戰(zhàn)略目標。同年10月,習近平總書記在中國共產(chǎn)黨第十九次全國代表大會的報告中強調(diào)“推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實體經(jīng)濟深度融合”,利用人工智能新技術(shù)驅(qū)動經(jīng)濟發(fā)展。2019年3月,李克強總理在政府工作報告中提出“拓展‘智能+’ ……深化大數(shù)據(jù)、人工智能等研發(fā)應用”,希望拓展人工智能的應用寬度。國家越來越重視人工智能,以其作為基礎(chǔ)技術(shù),滲透到各行各業(yè),為檔案館應用人工智能提供了良好的社會環(huán)境。
1.3.2 檔案管理活動的轉(zhuǎn)型需求
隨著智能化和智慧化理念的深入,社會對檔案館的要求越來越高,檔案管理活動急需轉(zhuǎn)型升級,檔案服務需要向個性化、智能化、知識化方向轉(zhuǎn)變。傳統(tǒng)的檔案管理工作存在大量程式化步驟,管理模式簡單、低效。檔案分類倚賴人工,片面主觀;檔案鑒定水平較低,影響資源開放利用;此外,用戶關(guān)注的不再是簡單的獲取文獻,可能是文獻中的某一段落,可能是圍繞某一主體的一系列文獻。因此,準確地從繁雜的信息環(huán)境中捕獲和析取所需內(nèi)容至關(guān)重要。[5]提供掃描原件圖像的檢索系統(tǒng),已經(jīng)無法滿足日益?zhèn)€性化、精準化的用戶需求。
1.3.3 行業(yè)理論與實踐的推動
對于人工智能技術(shù)在檔案工作中的應用,國內(nèi)已經(jīng)有了一定的理論和實踐應用基礎(chǔ)。相關(guān)專家學者積極尋找人工智能技術(shù)與檔案管理環(huán)節(jié)的契合點,構(gòu)想新技術(shù)在檔案管理環(huán)節(jié)中的應用場景。這些探索和實踐將進一步促進人工智能與檔案管理活動的深度結(jié)合。例如江蘇省太倉市檔案館引入人工智能為檔案資源收集、智能分類、安全管理、網(wǎng)絡(luò)建設(shè)工作服務,效果顯著。北京市市場監(jiān)督管理局運用自然語言處理技術(shù)對電子文件進行智能比對和分類,設(shè)置歸檔批處理標準和程序,提升電子文件歸檔工作效率。[6]這些富有成效的應用實例對綜合性檔案館人工智能的運用起到了良好示范作用。
1.4.1 “技術(shù)至上”的傾向
從現(xiàn)有研究文獻來看,關(guān)于大數(shù)據(jù)、云計算、人工智能等信息技術(shù)研究的論文數(shù)量幾乎占據(jù)了總發(fā)文量的一半,這些文獻雖然涵蓋檔案資源建設(shè)、檔案社會服務等研究,但研究焦點集中在新興技術(shù)方面。[7]在應用實踐中,綜合性檔案館也容易走上技術(shù)至上的道路,盲目追隨技術(shù)熱點,升級和更新館內(nèi)軟硬件設(shè)施,而忽視檔案信息內(nèi)涵建設(shè)。比如,許多檔案館雖然開設(shè)有門戶網(wǎng)站、微信公眾號,但是發(fā)布的檔案信息形式單一,內(nèi)容乏味,缺乏吸引力。檔案館應該根據(jù)業(yè)務需求,將人工智能技術(shù)應用到具體的業(yè)務場景中,在技術(shù)升級的同時,注重檔案信息資源的挖掘與利用,堅持技術(shù)與人文的有機統(tǒng)一。
1.4.2 “雙重價值”的偏差
當前各地檔案館應用人工智能的實踐,凸顯了現(xiàn)代信息技術(shù)對傳統(tǒng)檔案管理環(huán)節(jié)的賦能和增效:智能化信息處理技術(shù)從根本上提升了檔案參考價值實現(xiàn)的針對性和深刻性。智能化設(shè)備圍繞具體主題采集處理信息,使檔案信息服務更具針對性;數(shù)據(jù)挖掘與分析,揭示檔案信息之間內(nèi)在聯(lián)系,提升檔案價值實現(xiàn)的深刻性。[8]顯然,人工智能的應用提高了檔案館提供信息服務的能力,有利于檔案參考價值的發(fā)揮,但是,檔案館保存社會記憶、維護檔案原始記錄性的功能也應受到關(guān)注。在深層開發(fā)檔案參考價值的同時,不能忽略了檔案的原始記錄性的維護。
從檔案的管理活動轉(zhuǎn)型角度來看,人工智能技術(shù)在檔案分類、鑒定以及檢索利用等環(huán)節(jié)中有著巨大的應用前景。
2.1.1 借助自然語言處理技術(shù),進行檔案智能分類
《中國人工智能發(fā)展報告2018》報告顯示:2017年中國人工智能市場規(guī)模達到237億元,其中自然語言處理市場占比21%,目前已有許多相關(guān)應用產(chǎn)品。[9]文本歸納和分類便是自然語言處理技術(shù)的代表性功能。目前,各類檔案總量龐大且迅速增長,文檔管理面臨極大挑戰(zhàn)。檔案館可以利用文本歸納和分類技術(shù),以一定的分類體系和標準,確定檔案文本屬性,尋找不同類型文本之間的關(guān)系,對文本類檔案進行智能分類,[10]揭示檔案內(nèi)在聯(lián)系,保證檔案之間形成有機整體。當用戶想要檢索有關(guān)某主題的全部檔案時,智能分類可以有效提高查全率,在最大程度上滿足用戶的需求。
2.1.2 建立專家系統(tǒng),提升檔案鑒定水平
檔案館長期以來較低的開放利用率與檔案鑒定工作不足有著密切聯(lián)系。檔案人員專業(yè)水準、理解能力等因素,導致鑒定水平參差不齊,檔案有效供給不足。而借助專家系統(tǒng),一個具有大量專門知識和經(jīng)驗的程序系統(tǒng),模擬專家鑒定過程,則能整齊劃一,提升檔案鑒定水平,將封閉的內(nèi)部資源轉(zhuǎn)為公開的社會信息。例如,北京市市場監(jiān)督管理局利用圖像識別和專家系統(tǒng)等人工智能技術(shù),采用批量智能識別處理的模式對存量檔案圖像頁面的公開級別進行自動鑒定,有效消除檔案利用中的信息泄露等安全隱患,提高檔案開放利用率,促進檔案管理工作的創(chuàng)新。[11]
2.1.3 升級檢索系統(tǒng),滿足用戶精準化信息利用需求
準確用戶需求,提供個性化服務是檔案館資源開發(fā)利用的目標。人工智能技術(shù),能夠?qū)崿F(xiàn)檔案數(shù)字化到數(shù)據(jù)化轉(zhuǎn)變,使檢索系統(tǒng)具備閱讀、理解和處理檔案信息的能力,對用戶所輸入的關(guān)鍵信息進行分析推理,并得出結(jié)論。將死檔案變?yōu)榛钚畔?,文獻檢索變?yōu)橹R檢索,為用戶提供精準化的信息內(nèi)容。此外,檔案館可以采用語音識別技術(shù)和視覺技術(shù)等,探索以音視頻信息服務為主體的多媒體內(nèi)容分析處理等智能化信息處理工具,對音視頻文件進行自動分類管理和智能檢索利用,滿足利用者多樣化、個性化的信息需求。[12]
(2)節(jié)假日因素。節(jié)假日對于用戶以及企業(yè)用電都有很大的差別,我們在處理時將其離散化,0表示工作日,1表示節(jié)假日。
2.2.1 深度挖掘檔案數(shù)據(jù)資源
目前檔案館擁有的可利用數(shù)據(jù)資源以館藏檔案、網(wǎng)絡(luò)信息資源以及少量用戶數(shù)據(jù)資源為主,對支撐人工智能技術(shù)應用的用戶行為數(shù)據(jù)和科學數(shù)據(jù)等不夠豐富。檔案館在重視檔案數(shù)據(jù)化的同時,應拓寬資源收集渠道,利用信息集成平臺選擇與采集各種信息并進行數(shù)據(jù)化加工,豐富檔案數(shù)據(jù)資源,避免數(shù)據(jù)資源狹窄的局面。
我國綜合性檔案館館藏反映國家管理層面的檔案居多,反映社會領(lǐng)域的操作性、形態(tài)性、特色性的微觀層面的檔案缺乏,數(shù)據(jù)資源在深度上有較大局限。[13]檔案館要重點關(guān)注社會公眾生活檔案資源的建設(shè),跟蹤采集人們生產(chǎn)生活中形成的各種記錄,利用數(shù)據(jù)挖掘、語義分析等技術(shù)在檔案數(shù)據(jù)庫中搜索有關(guān)社會生活方方面面的全部檔案,編輯整合,形成特色檔案數(shù)據(jù)庫。
2.2.2 平衡維護檔案“雙重價值”
智能技術(shù)使檔案信息服務的基礎(chǔ)工作和終端系統(tǒng)得到革命性的更新和升級,檔案的參考價值發(fā)揮地淋漓盡致。然而,在數(shù)據(jù)集約化管理環(huán)境下,可能出現(xiàn)人為修改數(shù)據(jù);系統(tǒng)升級進行數(shù)據(jù)遷移時丟失部分數(shù)據(jù);存儲服務器老化或損壞引起部分數(shù)據(jù)丟失等因素造成檔案憑證要素丟失等現(xiàn)象,給人們維護檔案數(shù)據(jù)的憑證屬性帶來巨大挑戰(zhàn)。[14]在管理環(huán)節(jié)中,檔案館應該盡量確保檔案資源不受人為和環(huán)境因素的侵害,使用具有識別能力的安防系統(tǒng)為實體檔案建立安全屏障,借助人工智能高效的數(shù)據(jù)管理手段實現(xiàn)的有序安全存儲,確保檔案數(shù)據(jù)的真實性和完整性,保障檔案的憑證價值。此外,檔案館應該認識到,除形成單位,檔案在人民群眾自身權(quán)益方面也發(fā)揮著重要憑證價值。通過智能鑒定劃控,提高檔案的開放利用程度;開展檔案編研工作,編寫大事記、地方志,傳承歷史、記錄當下,幫助于人們發(fā)現(xiàn)并充分利用檔案的價值。
2.3.1 優(yōu)化數(shù)字檔案館整體建設(shè)
數(shù)字檔案館的建設(shè)經(jīng)過近二十年的努力,取得了很大進展,但是建設(shè)程度參差不齊,許多檔案館還未實現(xiàn)館藏檔案的全部數(shù)字化?,F(xiàn)階段,檔案館首先要做的是實現(xiàn)館藏檔案的全部數(shù)字化,建立檔案數(shù)字資源的安全保障體系,優(yōu)化綜合管理平臺和信息共享的網(wǎng)絡(luò)平臺。數(shù)字檔案館發(fā)展成熟后,借助人工智能、物聯(lián)網(wǎng)等新技術(shù),順利過渡到智慧檔案館建設(shè)階段。
2.3.2 升級一體化智能管理系統(tǒng)建設(shè)
數(shù)字檔案館采用線性邏輯對檔案信息資源、檔案業(yè)務工作進行管理,導致檔案業(yè)務環(huán)節(jié)之間缺少協(xié)同機制。[15]人工智能技術(shù)則通過信息共享、事件關(guān)聯(lián)、協(xié)同業(yè)務等手段,整合業(yè)務工作,使檔案數(shù)據(jù)資源、檔案管理環(huán)節(jié)相互作用、相互協(xié)同,實現(xiàn)檔案數(shù)據(jù)資源全過程管理,建立一體化智能管理系統(tǒng)。檔案館應積極申請增加政府資金投入,加強新技術(shù)應用的重視力度和專項資金傾斜力度,配置必備的人工智能硬件設(shè)施,聘請技術(shù)人員完善技術(shù)平臺建設(shè),推動一體化智能管理系統(tǒng)建設(shè)。
2.4.1 樹立資源為王,技術(shù)助力的理念
檔案資源是檔案館立足社會、服務社會的根本。豐富的館藏資源是檔案館開展日常業(yè)務工作、提供社會服務的重要前提。如果缺乏資源,檔案館的一切工作將變?yōu)闊o源之水。當然,在信息技術(shù)無處不及的今天,檔案館還應重視和支持對新技術(shù)的應用,在資源建設(shè)與新技術(shù)應用之間找到一個合理的切合點或融合點,使二者和諧發(fā)展,切不可過分強調(diào)技術(shù),偏離檔案工作本質(zhì)。[16]檔案館要樹立資源為王,技術(shù)助力的理念。拓寬資源廣度,拓展資源深度,提高用戶廣泛性;擁有資源支撐,結(jié)合工作實際需要,合理應用人工智能新興技術(shù),為檔案資源的傳播利用助力。
2.4.2 優(yōu)化檔案人員的數(shù)據(jù)素養(yǎng)
人工智能時代,檔案人員面對的不是單一的檔案信息服務,而是面向用戶的人機交互場景咨詢、個性化知識服務等工作。這就需要檔案人員既能運用數(shù)據(jù)分析挖掘、文獻自動分類等計算機知識,也要具備信息、知識和數(shù)據(jù)的用戶服務知識,推動檔案人員向不易替代、不易復制的復合型人才方向發(fā)展。[17]檔案館一方面要對在職館員進行技術(shù)培訓,提高他們的數(shù)據(jù)素養(yǎng)和技能;另一方面,要積極引進技術(shù)型人才,畢竟檔案學專業(yè)復合型人才不能完全替代計算機科學、數(shù)據(jù)科學等專業(yè)培養(yǎng)的技術(shù)型人才的作用。[18]
綜上,在數(shù)字時代,綜合性檔案館應用人工智能新技術(shù)有利于檔案事業(yè)的發(fā)展,有利于實現(xiàn)檔案信息資源的管理、共享和利用。檔案館利用新技術(shù)創(chuàng)新管理要依托自身優(yōu)勢,抓住外部機遇,努力改變內(nèi)部劣勢,積極應對外部威脅,制定出符合數(shù)字時代的檔案管理策略,推動人工智能在檔案管理中的應用,提升我國檔案工作的轉(zhuǎn)型升級效率,促進檔案工作的現(xiàn)代化水平。[19]