車婷婷
2019 年5 月6 日—9 日,由國家互聯(lián)網(wǎng)信息辦公室、國家發(fā)展和改革委員會、工業(yè)和信息化部、福建省人民政府共同主辦的第二屆數(shù)字中國建設(shè)峰會如期舉辦,會上“數(shù)字政務(wù)”成為熱點話題。5 月9 日,國家檔案局在電子政務(wù)分論壇發(fā)布《推進電子檔案單套管理的政策與步驟》,旨在提高行政效率,提升檔案資源安全保管意識及水平。結(jié)合當前檔案局、館逐步分離的現(xiàn)實情況,未來檔案館將向服務(wù)的、數(shù)字化的、開放的公共事業(yè)單位轉(zhuǎn)型。隨著“數(shù)字中國”偉大工程的建設(shè)與發(fā)展,檔案館的用戶智能體驗水平、數(shù)字化管理與服務(wù)水平成為未來檔案館工作質(zhì)量的重要衡量標準。數(shù)字檔案館的建設(shè)并非一朝一夕之事,需逐步推進,而隨著語言識別技術(shù)和全息影像技術(shù)的發(fā)展成熟,基礎(chǔ)技術(shù)支持已具備,國內(nèi)外各行業(yè)實踐案例日趨豐富,由此,在前期影像檔案交互式傳播特征研究的基礎(chǔ)上,針對我國檔案館影像檔案交互式傳播服務(wù)模式展開機理分析。
影像檔案交互傳播旨在通過人機交互技術(shù)與人工智能技術(shù),增強檔案用戶利用檔案資源的體驗感,提升用戶與計算機主動互動、自然互動的流暢感和真實感,借助語音識別技術(shù)實現(xiàn)用戶自然語言與計算機程序語言的無障礙命令互動,借助虛擬成像技術(shù)提升用戶閱讀檔案資料的臨場感,最大限度地還原歷史事件的真實環(huán)境,令用戶查閱影像資料的同時能身臨其境般回歸事件原始場景,結(jié)合當前我國5G 技術(shù)優(yōu)勢,大力提升信息傳遞速度,科技賦能提升影像檔案的閱讀效果。
人機交互的核心技術(shù)是語音識別技術(shù)和檔案主題詞規(guī)范化著錄,影像檔案的互動服務(wù)體驗核心技術(shù)是全息影像技術(shù)以及影像資源的高度關(guān)聯(lián)性。與此同時,還要保證檔案信息資源的安全性,以及注重檔案信息資源著錄的及時修正和檔案資源及其關(guān)鍵詞的增量補充?;谏鲜鲫P(guān)鍵問題,建立檔案館影像檔案交互式傳播服務(wù)流程模型,如圖1。
圖1 檔案館影像檔案交互式傳播服務(wù)流程模型簡圖
用戶進入檔案館互動服務(wù)體驗專區(qū),由人臉識別技術(shù)自動捕獲用戶身份信息,驗證用戶身份后自動安全登錄檔案館用戶服務(wù)系統(tǒng),并授權(quán)用戶相應(yīng)利用權(quán)限,用戶開始體驗檔案館交互式傳播利用服務(wù)。
用戶使用自然語言,甚至可以使用網(wǎng)絡(luò)流行用語、方言,發(fā)出對話(如圖1 中a 所示),服務(wù)體驗區(qū)的語音識別系統(tǒng)捕獲用戶的語言信息,并解析語言,捕獲并提煉關(guān)鍵詞,將捕獲到的用戶自然語言中的關(guān)鍵詞,根據(jù)語境、詞義,匹配館藏數(shù)據(jù)庫中的著錄關(guān)鍵詞(如圖1中b 所示),我們將關(guān)鍵詞庫稱為關(guān)鍵詞庫1,關(guān)鍵詞庫1 中包含了所有館藏數(shù)據(jù)庫檔案資源關(guān)聯(lián)的關(guān)鍵詞,甚至包括未開放檔案資源、非影像檔案資源的關(guān)鍵詞;關(guān)鍵詞庫2 包含館藏全部已開放影像檔案資源關(guān)鍵詞。系統(tǒng)將關(guān)鍵詞庫1 中匹配的結(jié)果與關(guān)鍵詞庫2 匹配,匹配并篩選已開放影像檔案資源關(guān)鍵詞(如圖1 中d所示),根據(jù)篩選結(jié)果匹配高度關(guān)聯(lián)的全息影像檔案資源(如圖1 中e 所示),傳送至中控平臺,在發(fā)送給用戶前再進行一次安全性檢查,檢驗其開放屬性(如圖1 中f 所示),最終借助全息影像設(shè)備將匹配結(jié)果的全息影像投射至服務(wù)體驗區(qū)(如圖1 中g(shù) 所示),實現(xiàn)完整的影像檔案人機交互服務(wù)體驗過程。
關(guān)鍵詞庫1 關(guān)聯(lián)全部館藏檔案資源,而關(guān)鍵詞庫2關(guān)聯(lián)館藏已開放全息影像檔案資源庫,這樣操作一方面便于區(qū)分已開放全息影像檔案,另一方面為檔案館逐步推進全息影像檔案轉(zhuǎn)制工作提供過渡時間。
隨著語音識別技術(shù)和虛擬影像技術(shù)的不斷發(fā)展成熟,影像檔案交互式傳播過程中呈現(xiàn)出內(nèi)容聚合性、動態(tài)關(guān)聯(lián)性、功能平衡性、渠道多元性、形式靈活性、體驗創(chuàng)新性、利用主動性、載體創(chuàng)新性、經(jīng)濟環(huán)保性的特征及技術(shù)優(yōu)勢,令檔案服務(wù)品質(zhì)、仿真體驗感提升。但與此同時,當前國內(nèi)技術(shù)普及以及成本效益等實際因素影響下,傳統(tǒng)影像檔案閱讀模式向交互傳播服務(wù)模式的轉(zhuǎn)變依然面臨許多困難,需檔案工作者們正視困難,分步驟、分階段地逐步攻克難題。
1.技術(shù)成熟度不斷提升。影像檔案交互服務(wù)模式的構(gòu)建,需要建立在以語音識別技術(shù)和全息影像技術(shù)為核心的基礎(chǔ)上,以檔案著錄的標準化、規(guī)范化以及主題詞的科學(xué)著錄為保障,以數(shù)字檔案資源數(shù)據(jù)庫的建設(shè)與維護為后盾。近年來,我國檔案管理技術(shù)人員的業(yè)務(wù)水平不斷提高,在主題詞標引、檔案著錄以及檔案資源數(shù)據(jù)庫的建設(shè)、管理與維護方面積累了豐富的經(jīng)驗。我國語音識別技術(shù)也呈現(xiàn)強勢發(fā)展,科大訊飛、清華同方等多家國內(nèi)科技公司碩果顯著,并在許多領(lǐng)域應(yīng)用廣泛。在自主研發(fā)技術(shù)不足的情況下,未來檔案館可以通過技術(shù)外包的方式實現(xiàn)。但是作為核心技術(shù)之一的全息影像技術(shù),在國內(nèi)的應(yīng)用尚不廣泛,目前主要用于舞臺表演領(lǐng)域,且國內(nèi)的成熟技術(shù)團隊也較少,加之這項技術(shù)所需的耗材設(shè)備量大且價格昂貴,使得許多國內(nèi)影像技術(shù)團隊往往不敢輕易涉足,由此,未來檔案館在引進全息影像技術(shù)方面,無論是借助技術(shù)外包,還是自主培養(yǎng)技術(shù)團隊,都將在時間、人力、物力、財力方面面臨巨大挑戰(zhàn)。
2.任務(wù)量大,層次復(fù)雜。實現(xiàn)影像檔案的交互式服務(wù),其過程復(fù)雜、工序多。首先,重新整理著錄影像檔案,特別是將原先零散的、碎片式的檔案資源,通過主題詞重新關(guān)聯(lián)回到事件中心,這個過程需要檔案人員重新梳理事件全部關(guān)聯(lián)檔案,甚至包括事件本身所涉及的人物檔案;其次,將傳統(tǒng)的影像檔案轉(zhuǎn)制成全息影像,不僅需要大量的設(shè)備支持,還需大量的工作人員同時參與;第三,全息影像的轉(zhuǎn)制工作環(huán)境和最終投射空間的搭建,需借助建筑團隊完成;第四,語音識別的關(guān)鍵詞和檔案著錄的關(guān)鍵詞之間的關(guān)聯(lián)性,依賴于語音識別技術(shù)人員和檔案著錄人員的溝通合作;第五,在建設(shè)期間,為了保證檔案以及檔案利用服務(wù)的安全性,必須阻隔館藏檔案庫房的外聯(lián)通道,單獨保管。可見,影像檔案的交互式傳播服務(wù)模式的實現(xiàn),需要將任務(wù)模塊盡量細分,既明確分工,又要保證有序溝通與合作。
3.建設(shè)周期長,資金需求大。影像檔案的交互式服務(wù)模式的實現(xiàn)過程,是一個長期建設(shè)的過程,即使完成了現(xiàn)有影像檔案的全息影像轉(zhuǎn)制工作,隨著新檔案的不斷產(chǎn)生,這項工程將不斷建設(shè)。未來,在“數(shù)字中國”以及“智慧城市”的建設(shè)布局下,數(shù)字檔案館的數(shù)字化轉(zhuǎn)制工作將成為常態(tài)化工作內(nèi)容,優(yōu)化檔案用戶體驗感、提升檔案用戶服務(wù)質(zhì)量將是數(shù)字化的重要衡量標準。因此,這將是一場長期項目,前期投入的資金需求是十分龐大的,除了耗材設(shè)備的資金需求,還包括技術(shù)開發(fā)、檔案整理的資金需求。但是也不必悲觀,數(shù)字化的時代已經(jīng)到來,數(shù)字化的服務(wù)是未來公共服務(wù)的大勢所趨,前期資金投入是趨勢所致,后期隨著技術(shù)的不斷成熟和普及,這項工程的成本會越來越趨于平穩(wěn)。
4.網(wǎng)絡(luò)詞匯的增量著錄。當今社會,90 后、00 后已逐漸步入工作崗位,成為各行業(yè)的主流建設(shè)者和用戶。90 后甚至00 后、10 后的成長環(huán)境是十分特殊的,伴隨著互聯(lián)網(wǎng)的快速發(fā)展,90 后、00 后用戶有著極強的互聯(lián)網(wǎng)觸覺,對移動設(shè)備和互動服務(wù)使用更是深諳其道。與此同時,這些用戶也制造出了許多獨特的互聯(lián)網(wǎng)詞匯,廣泛應(yīng)用于工作與生活的方方面面,甚至國家語言資源監(jiān)測與研究中心和商務(wù)印書館會評選年度網(wǎng)絡(luò)用語,商務(wù)印書館更將網(wǎng)絡(luò)用語修訂進《現(xiàn)代漢語詞典》中。這無疑給未來檔案工作者提供了新的工作任務(wù),在實現(xiàn)影像檔案語音識別的過程中,不能僅關(guān)注傳統(tǒng)的關(guān)鍵詞,還應(yīng)關(guān)注新增網(wǎng)絡(luò)用語的關(guān)鍵詞,及時進行增量著錄,這樣才能保證未來用戶的無障礙人機對話。
5.操作指南待形成。當前國內(nèi)關(guān)于影像檔案交互式服務(wù)的研究并不多見,國外學(xué)術(shù)界對于全息影像技術(shù)在檔案管理中的應(yīng)用方面的研究已開展多年,并已初見成效。例如,美國南加利福尼亞大學(xué)Shoah 基金會的新型互動式口述歷史項目,在2016 年展示出了階段性成果,將二戰(zhàn)的猶太幸存者口述歷史影像轉(zhuǎn)制成全息影像,利用語言識別技術(shù)與公眾實現(xiàn)無障礙的人機互動,令用戶體驗超高度仿真;在此基礎(chǔ)上,該基金會在2016 年與南京大學(xué)合作啟動一項旨在保留南京大屠殺幸存者口述歷史影像檔案的項目。國內(nèi)針對該領(lǐng)域的獨立研究尚不豐富,針對基層工作的影像檔案轉(zhuǎn)制業(yè)務(wù)的指南亟待形成。
1.館藏檔案載體的安全性。在用戶體驗交互式服務(wù)過程中,進入檔案館區(qū)域后,設(shè)立專門的服務(wù)體驗區(qū)域,一方面,由于在數(shù)字檔案館建設(shè)的過渡階段,不能一步實現(xiàn)全館范圍的數(shù)字開放服務(wù);另一方面,在地理范圍上保證館藏資源的安全性。
2.未開放檔案資源的安全性。由于保管期限不同,未開放檔案資源不提供利用服務(wù),但對于開放目錄用戶享有知情權(quán)?;诖?,根據(jù)館藏檔案資源標引、著錄關(guān)鍵詞,制成關(guān)鍵詞庫(如圖1 中關(guān)鍵詞庫1 所示),關(guān)鍵詞庫1 與館藏數(shù)據(jù)庫保持物理關(guān)聯(lián),隔斷互聯(lián)網(wǎng)(如