程妍妍 李劍鋒 孫 筠/國(guó)防大學(xué)政治學(xué)院
“時(shí)光機(jī)”項(xiàng)目(Europe Time Machine)是歐盟耗資100萬(wàn)歐元,未來(lái)十年重點(diǎn)發(fā)展的六個(gè)旗艦研究項(xiàng)目之一,將為歐盟在全球技術(shù)競(jìng)賽中創(chuàng)造競(jìng)爭(zhēng)優(yōu)勢(shì)。作為項(xiàng)目的主要發(fā)起方和參與方之一,檔案機(jī)構(gòu)不僅負(fù)責(zé)提供歷史檔案數(shù)據(jù),也發(fā)揮提供領(lǐng)域知識(shí)模型、技術(shù)驗(yàn)證的作用。本文一方面研究該項(xiàng)目信息技術(shù)在檔案工作中的應(yīng)用,另一方面也探討信息技術(shù)應(yīng)用對(duì)檔案工作帶來(lái)的影響和啟示,以期對(duì)我國(guó)檔案工作在未來(lái)社會(huì)的定位和發(fā)展提供思路和借鑒。
2019年,歐盟“時(shí)光機(jī)”項(xiàng)目正式啟動(dòng),該項(xiàng)目對(duì)加強(qiáng)歐洲的凝聚力、經(jīng)濟(jì)和社會(huì)發(fā)展產(chǎn)生強(qiáng)烈、長(zhǎng)期和積極的影響,為促進(jìn)各級(jí)決策層批判性思維形成、加強(qiáng)歐洲集體認(rèn)同感以及提高科技競(jìng)爭(zhēng)力作出突出貢獻(xiàn),并促進(jìn)整個(gè)歐盟知識(shí)密集型和創(chuàng)意部門(mén)的創(chuàng)業(yè)和就業(yè)。項(xiàng)目目標(biāo)是使用最先進(jìn)的信息技術(shù)挖掘歐洲海量的文化遺產(chǎn),創(chuàng)建一個(gè)合作性的數(shù)字信息系統(tǒng),描繪歐洲經(jīng)濟(jì)、社會(huì)、文化和地理跨時(shí)代的演變,并向各領(lǐng)域提供免費(fèi)的信息利用,支持未來(lái)科學(xué)和技術(shù)發(fā)展。項(xiàng)目應(yīng)用大規(guī)模計(jì)算和數(shù)字化基礎(chǔ)設(shè)施,從復(fù)雜的歷史檔案中抽取信息,如將中世紀(jì)的手稿和歷史檔案轉(zhuǎn)化為可用的知識(shí),并采用地理數(shù)據(jù)可視化和在線地圖構(gòu)建技術(shù)展現(xiàn)出歐洲發(fā)展歷程。該項(xiàng)目指出,項(xiàng)目成果將是人類(lèi)對(duì)歷史和未來(lái)進(jìn)行新的批判性思考的關(guān)鍵資源,能夠進(jìn)一步提升人類(lèi)對(duì)歷史的理解程度,“給歷史增加新的維度”[1],能夠?yàn)闅v史學(xué)家、政策制定者和公眾提供新的見(jiàn)解,有助于從日常生活到學(xué)術(shù)、專(zhuān)業(yè)領(lǐng)域和政治事務(wù)的決策制定。項(xiàng)目參與方包括40多個(gè)城市的600多家機(jī)構(gòu),主要有提供數(shù)據(jù)資源的機(jī)構(gòu),如博物館、檔案館、圖書(shū)館等,以及提供高新信息技術(shù)的企業(yè)等,其中參與的檔案機(jī)構(gòu)包括法國(guó)國(guó)家檔案館、日內(nèi)瓦國(guó)家檔案館、巴黎檔案館、安特衛(wèi)普市檔案館、克拉根福檔案館等。
“時(shí)光機(jī)”項(xiàng)目應(yīng)用了一系列前沿信息技術(shù),特別是基于醫(yī)學(xué)斷層掃描的檔案數(shù)字化、機(jī)器學(xué)習(xí)為代表的人工智能技術(shù)等的深度應(yīng)用,檔案機(jī)構(gòu)是信息技術(shù)應(yīng)用最大的受益者之一,既提升了效率,也開(kāi)拓了前所未有的想象空間。從“時(shí)光機(jī)”項(xiàng)目在歐盟各檔案機(jī)構(gòu)的應(yīng)用實(shí)踐來(lái)說(shuō),這些信息技術(shù)主要應(yīng)用于檔案資源數(shù)字化與識(shí)別、檔案資源數(shù)據(jù)挖掘與關(guān)聯(lián)、檔案資源利用與呈現(xiàn)等。其中檔案資源的數(shù)字化只是第一步,數(shù)字化之后必須進(jìn)行文檔的識(shí)別與轉(zhuǎn)錄、文檔的組件提取、實(shí)體消歧義、知識(shí)組織與提取以及圖像檢索、增強(qiáng)/虛擬現(xiàn)實(shí)(AR/VR)呈現(xiàn)利用、地理數(shù)據(jù)整合等一系列工作。
“時(shí)光機(jī)”項(xiàng)目的重要工作之一就是對(duì)歷史檔案材料的數(shù)字化,從目前歐盟各國(guó)數(shù)字化進(jìn)度來(lái)看,進(jìn)展緩慢。如芬蘭國(guó)家檔案館目前只有4%的檔案材料進(jìn)行數(shù)字化[2],按照目前的數(shù)字化速度,這項(xiàng)工作將需要200年,其他國(guó)家也不同程度的存在類(lèi)似問(wèn)題。因此,“時(shí)光機(jī)”項(xiàng)目的首要任務(wù)是應(yīng)用新技術(shù)加速數(shù)字化,并處理數(shù)字化后的海量數(shù)據(jù)。該項(xiàng)目一是采用新型檔案數(shù)字化技術(shù)。傳統(tǒng)檔案數(shù)字化工作采用掃描儀等設(shè)備完成,該項(xiàng)目可以在無(wú)需打開(kāi)歷史檔案的情況下,對(duì)檔案進(jìn)行掃描識(shí)別。如項(xiàng)目參與者瑞士洛桑理工學(xué)院和威尼斯佛斯卡里大學(xué)合作研究一種類(lèi)似于醫(yī)學(xué)X射線斷層掃描的數(shù)字化方法[3],該方法首先對(duì)歷史檔案的書(shū)寫(xiě)成分進(jìn)行分析,歷史檔案的書(shū)寫(xiě)字跡主要使用鐵和碳元素,使用X射線層析成像技術(shù)(X-ray tomography)對(duì)這些特殊成分進(jìn)行掃描成像,從投影圖像集中逐頁(yè)提取信息,形成掃描圖像。這種方法保護(hù)珍貴易損的歷史檔案,成本低速度快,有廣闊應(yīng)用前景。如威尼斯檔案館中有數(shù)十萬(wàn)封古老材料制成的遺囑檔案,傳統(tǒng)掃描會(huì)損壞檔案,應(yīng)用該掃描技術(shù)有效防止風(fēng)險(xiǎn);又如芬蘭商業(yè)文件中心檔案館應(yīng)用該技術(shù)對(duì)館藏100年前的古老檔案進(jìn)行數(shù)字化。二是采用基于卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法對(duì)手寫(xiě)文本自動(dòng)識(shí)別轉(zhuǎn)錄[4],如該項(xiàng)目對(duì)威尼斯國(guó)家檔案館數(shù)百萬(wàn)張數(shù)字化的18世紀(jì)財(cái)政文件進(jìn)行自動(dòng)識(shí)別轉(zhuǎn)錄。首先檔案專(zhuān)家花了2年的時(shí)間用于圖像注釋?zhuān)斯まD(zhuǎn)錄形成23000余張圖像片段,這些圖像中包含55000個(gè)威尼斯人名和地名,然后將帶注釋的數(shù)據(jù)集用來(lái)訓(xùn)練和測(cè)試深度學(xué)習(xí)體系結(jié)構(gòu),最終計(jì)算機(jī)自動(dòng)轉(zhuǎn)錄研究搜索用例的性能水平大約是90%的字符正確率,與人工轉(zhuǎn)錄相比,計(jì)算機(jī)在這項(xiàng)轉(zhuǎn)錄任務(wù)中的表現(xiàn)優(yōu)于人工。
“時(shí)光機(jī)”項(xiàng)目對(duì)歷史檔案數(shù)字化后形成大量圖像文檔,將這些數(shù)字化圖像轉(zhuǎn)換為結(jié)構(gòu)化、鏈接關(guān)系的數(shù)據(jù)并不簡(jiǎn)單,需要采用一系列方法。在這方面,該項(xiàng)目主要應(yīng)用了以下技術(shù):一是文檔組件提取分割技術(shù)。項(xiàng)目參與者瑞士洛桑理工學(xué)院的數(shù)字人文實(shí)驗(yàn)室開(kāi)發(fā)名為dhSegment文檔分割通用深度學(xué)習(xí)框架[5]用于歷史檔案處理,依靠卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)像素特征,提供圖像處理操作自動(dòng)提取文檔組件,如文檔框、多邊形、線條、蒙版等。二是稀疏歷史數(shù)據(jù)關(guān)聯(lián)技術(shù)[6]。項(xiàng)目重點(diǎn)研究了人物實(shí)體記錄鏈接系統(tǒng),將多個(gè)涉及同一人物實(shí)體的多個(gè)歷史文檔相互關(guān)聯(lián)。在這個(gè)過(guò)程中,需要進(jìn)行實(shí)體消歧義、實(shí)體鏈接、識(shí)別人物實(shí)體、聚合實(shí)體的多源信息等工作,最后重建關(guān)于該實(shí)體的文檔網(wǎng)絡(luò)。如當(dāng)檔案館的多份檔案中涉及到同一個(gè)人物實(shí)體時(shí),可以將這個(gè)人視為是網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn),當(dāng)同一個(gè)文檔中存在多個(gè)人物實(shí)體時(shí),可以視為這些人物實(shí)體之間存在關(guān)聯(lián),通過(guò)分析這種關(guān)聯(lián),網(wǎng)絡(luò)節(jié)點(diǎn)不斷增多,開(kāi)始成長(zhǎng)為一個(gè)巨大的網(wǎng)絡(luò),就像科學(xué)家從 Facebook 或 Twitter 數(shù)據(jù)中繪制社交網(wǎng)絡(luò)一樣。這個(gè)網(wǎng)絡(luò)可以幫助歷史學(xué)家發(fā)現(xiàn)大量隱藏在檔案信息中的人物實(shí)體的關(guān)系、生活細(xì)節(jié)以及社會(huì)地位等信息。又如該項(xiàng)目在芬蘭國(guó)家檔案館開(kāi)展的WarSampo子項(xiàng)目,為86萬(wàn)用戶(hù)提供有關(guān)二戰(zhàn)歷史的開(kāi)放數(shù)據(jù)服務(wù)。該項(xiàng)目使用關(guān)聯(lián)數(shù)據(jù)技術(shù)從多樣化數(shù)據(jù)源中將已故軍人實(shí)體和其所在的作戰(zhàn)區(qū)域、軍事單位、作戰(zhàn)事件等數(shù)據(jù)進(jìn)行關(guān)聯(lián),可以自動(dòng)重組二戰(zhàn)軍人的生活故事。數(shù)據(jù)源包括美國(guó)國(guó)家檔案館中約26000份原始戰(zhàn)爭(zhēng)日記、與日記相關(guān)的約10000個(gè)軍事單位的活動(dòng)信息、數(shù)千篇關(guān)于戰(zhàn)爭(zhēng)回憶錄的雜志文章、16萬(wàn)張真實(shí)照片檔案等。用戶(hù)既可以尋找在戰(zhàn)爭(zhēng)中已故軍人的信息,也可以在歷史地圖中瀏覽和該名軍人相關(guān)的作戰(zhàn)區(qū)域、軍事單位等相關(guān)信息。三是元知識(shí)編碼技術(shù)。歷史知識(shí)從根本上是不確定的,對(duì)歷史事件的特定描述通常是基于一系列的來(lái)源和基于這些來(lái)源的一系列解釋和推理形成的。項(xiàng)目采用語(yǔ)義網(wǎng)絡(luò)技術(shù)對(duì)歷史知識(shí)進(jìn)行編碼,同時(shí)詳細(xì)記錄將歷史來(lái)源與給定編碼關(guān)聯(lián)起來(lái)的知識(shí)序列。
該項(xiàng)目提供圖像檢索和地理信息時(shí)間線展示等各類(lèi)利用方式。一是歷史照片檔案檢索利用技術(shù)[7]。照片檔案是社會(huì)歷史的快照,是人類(lèi)視覺(jué)記憶的寶庫(kù),構(gòu)成了價(jià)值無(wú)法估量的文化資產(chǎn)。檔案機(jī)構(gòu)的主要任務(wù)是保護(hù)這些文化資產(chǎn)并將其傳播。照片檔案?jìng)鹘y(tǒng)檢索方式是對(duì)照片著錄信息進(jìn)行檢索,檢索效果有限。利用“時(shí)光機(jī)”項(xiàng)目,第一創(chuàng)建新工具,幫助檔案工作者完成新照片數(shù)據(jù)的分類(lèi)、注釋和索引任務(wù);第二應(yīng)用人工智能,提出在照片檔案檢索中將搜索范式從基于關(guān)鍵字轉(zhuǎn)向基于語(yǔ)義。如該項(xiàng)目對(duì)威尼斯Cini基金會(huì)約100萬(wàn)張照片檔案(1300—1900年)進(jìn)行數(shù)字化并創(chuàng)建專(zhuān)用檢索工具,使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)深度學(xué)習(xí)方法,將圖像數(shù)據(jù)庫(kù)的每一幅畫(huà)與1000個(gè)特征相關(guān)聯(lián),這些特征代表能夠?qū)?yīng)經(jīng)過(guò)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)的卷積層。每幅畫(huà)與高維空間中的一個(gè)點(diǎn)相關(guān)聯(lián),當(dāng)一個(gè)圖像查詢(xún)被發(fā)送到搜索引擎時(shí),按照它們與查詢(xún)的距離進(jìn)行結(jié)果排序。在檢索出相似結(jié)果時(shí),再采用代數(shù)公式運(yùn)算精確圖像查詢(xún)結(jié)果。又如巴塞羅那自治大學(xué)計(jì)算機(jī)視覺(jué)中心參與的深度檔案館(Deep Archive)子項(xiàng)目,該項(xiàng)目關(guān)注歷史照片檔案的識(shí)別與檢索。照片檔案中人們的服飾、發(fā)型、生活環(huán)境、使用的工具甚至自然風(fēng)光等,都能揭示照片檔案的語(yǔ)義特征和照片之間的關(guān)聯(lián),能夠推斷照片的形成時(shí)間,或是揭示照片內(nèi)容所反映的地點(diǎn),從而利用人工智能技術(shù)將同一時(shí)間或地點(diǎn)的照片進(jìn)行聚類(lèi),形成語(yǔ)義網(wǎng)絡(luò),供高級(jí)搜索或可視化工具訪問(wèn)。二是地圖數(shù)據(jù)時(shí)間線動(dòng)態(tài)展現(xiàn)技術(shù)。在“時(shí)光機(jī)”項(xiàng)目中,有專(zhuān)門(mén)做地圖業(yè)務(wù)的商業(yè)公司,通過(guò)從歷史檔案中提取地理信息,結(jié)合地圖技術(shù)進(jìn)行展現(xiàn)。如MapTiler公司制作的動(dòng)態(tài)地圖模擬顯示了標(biāo)志性的威尼斯里亞托橋如何在鹽沼中建造,以及該地區(qū)定期被火災(zāi)破壞和隨后的重建過(guò)程。該公司地圖產(chǎn)品還包括威尼斯地圖,能夠?qū)⑼崴箽v史通過(guò)時(shí)間線的方式動(dòng)態(tài)展現(xiàn)。地理數(shù)據(jù)由時(shí)間戳標(biāo)記,標(biāo)明建筑的開(kāi)始日期和持續(xù)日期。地圖旁邊有時(shí)間線,用戶(hù)可以將該地圖和現(xiàn)代地圖、衛(wèi)星地圖或掃描的歷史檔案地圖進(jìn)行比較。數(shù)據(jù)可以以3D形式提供利用,包括選擇建筑物的名稱(chēng)、時(shí)間段和其他信息。
尋求和高新技術(shù)的結(jié)合是檔案工作煥發(fā)生命力的關(guān)鍵。傳統(tǒng)的社會(huì)認(rèn)知,檔案工作和其他文化遺產(chǎn)行業(yè)一樣,是一門(mén)單純消耗性的工作,而信息技術(shù)的應(yīng)用挖掘出了檔案資源的含金量,使其真正成為一種有價(jià)值的資產(chǎn),也為檔案工作服務(wù)社會(huì)提供了新的增長(zhǎng)空間,檔案工作為社會(huì)服務(wù)的重要性更加凸顯。檔案資源這種新的資產(chǎn)將成為一種社會(huì)經(jīng)濟(jì)加速器,推動(dòng)教育、政府決策制定、智能旅游、智慧城市、環(huán)境建模等新興領(lǐng)域的服務(wù)和產(chǎn)品發(fā)展。如教育方面,“時(shí)光機(jī)”項(xiàng)目在威尼斯檔案館重點(diǎn)發(fā)展威尼斯4D模型,將城市地圖信息關(guān)聯(lián)歷史檔案數(shù)據(jù),在威尼斯部分大學(xué)的學(xué)士和碩士課程已經(jīng)使用了項(xiàng)目成果用于教學(xué)和科研;城市建設(shè)方面,法國(guó)古斯塔夫·埃菲爾大學(xué)資助和支持的“檔案城市”項(xiàng)目,提出利用城市建設(shè)檔案的新方法,通過(guò)整合城市歷史檔案,規(guī)劃未來(lái)城市建設(shè),項(xiàng)目成果不僅為研究人員、歷史學(xué)家和檔案工作者使用,還被當(dāng)?shù)卣咧贫ㄕ?、城市運(yùn)營(yíng)商以及渴望參與城市建設(shè)的普通市民利用;疫情防控方面,該項(xiàng)目和瑞士洛桑理工學(xué)院的流行病學(xué)專(zhuān)家合作,通過(guò)對(duì)威尼斯檔案館中的人口病例檔案和死亡檔案進(jìn)行數(shù)據(jù)挖掘和關(guān)聯(lián),通過(guò)研究17世紀(jì)中葉瘟疫蔓延導(dǎo)致威尼斯三分之一人口死亡的原因,結(jié)合現(xiàn)代的疫情數(shù)據(jù),對(duì)現(xiàn)代流行性疾病的預(yù)防和防控研究提供分析和支持;科學(xué)研究方面,該項(xiàng)目為科學(xué)研究的各個(gè)分支提供了支持,如倫敦政治經(jīng)濟(jì)學(xué)院專(zhuān)家指出“傳統(tǒng)經(jīng)濟(jì)學(xué)的理論缺乏足夠的數(shù)據(jù)支撐,歐洲金融檔案館存有大量的銀行歷史交易檔案,這些檔案有助于改變我們對(duì)金融市場(chǎng)運(yùn)作方式的理解,傳統(tǒng)的檔案館利用,我每天只可能查閱利用三份檔案,但是‘時(shí)光機(jī)’項(xiàng)目將徹底改變游戲規(guī)則,通過(guò)對(duì)普通人員的交易檔案的關(guān)聯(lián)處理,我們可以得到更多數(shù)據(jù),從而得出經(jīng)濟(jì)學(xué)正確有依據(jù)的結(jié)論”[8]。
“時(shí)光機(jī)”項(xiàng)目是歐盟各國(guó)集體攻關(guān)、跨界合作的典型,各國(guó)、各行業(yè)、各領(lǐng)域都是其受益者。該項(xiàng)目初期在威尼斯檔案館中進(jìn)行先驅(qū)性實(shí)驗(yàn)和驗(yàn)證,進(jìn)而由點(diǎn)至面擴(kuò)展到整個(gè)歐盟的文化遺產(chǎn)機(jī)構(gòu),并計(jì)劃將所有參與機(jī)構(gòu)的信息資源鏈接成網(wǎng),形成歐盟下一代旗艦項(xiàng)目之一?!皶r(shí)光機(jī)”項(xiàng)目聯(lián)合了來(lái)自科學(xué)、技術(shù)和文化遺產(chǎn)的杰出專(zhuān)家和主要機(jī)構(gòu),會(huì)員類(lèi)型分為個(gè)人會(huì)員和機(jī)構(gòu)會(huì)員,合作方式靈活多樣,包括以下三種。第一,本地“時(shí)光機(jī)”項(xiàng)目。機(jī)構(gòu)如果正在進(jìn)行或已經(jīng)完成了一個(gè)旨在挖掘和可視化歷史檔案數(shù)據(jù)的項(xiàng)目都可以注冊(cè)為本地“時(shí)光機(jī)”,一旦注冊(cè),有以下幾方面優(yōu)勢(shì)。一是可以在“時(shí)光機(jī)”項(xiàng)目網(wǎng)站享有獨(dú)立的主頁(yè)空間發(fā)布項(xiàng)目成果,加強(qiáng)本地項(xiàng)目在整個(gè)歐盟知名度,獲取更多的支持和合作的可能性;二是可分享本地項(xiàng)目經(jīng)驗(yàn)、工具、知識(shí)和最佳實(shí)踐;三是“時(shí)光機(jī)”項(xiàng)目會(huì)提供代碼庫(kù)、輔助開(kāi)發(fā)等工具,加快本地項(xiàng)目檔案資源的開(kāi)發(fā)和挖掘??梢钥闯?,一旦注冊(cè)為本地“時(shí)光機(jī)”項(xiàng)目,這種合作方式是雙向和相互促進(jìn)的。第二,項(xiàng)目支持服務(wù)。對(duì)于一些缺乏經(jīng)費(fèi)或技術(shù)支持的機(jī)構(gòu),“時(shí)光機(jī)”項(xiàng)目提供資助機(jī)會(huì)、尋求合作伙伴或項(xiàng)目聯(lián)盟,檔案機(jī)構(gòu)可以獲得資金來(lái)源和技術(shù),獲得更大的創(chuàng)新成就。第三,通過(guò)參與征求意見(jiàn)流程共同設(shè)計(jì)“時(shí)光機(jī)”項(xiàng)目的技術(shù)框架。為確保項(xiàng)目技術(shù)選擇達(dá)成共識(shí),便于開(kāi)放開(kāi)發(fā)和評(píng)估,建立請(qǐng)求評(píng)議(Request For Comments,簡(jiǎn)稱(chēng)RFC)維護(hù)組,任何人都可以編寫(xiě)RFC,并遵循一定的規(guī)則提交,RFC編輯會(huì)指導(dǎo)編寫(xiě)和進(jìn)行規(guī)范。從該項(xiàng)目的合作機(jī)制來(lái)看,實(shí)現(xiàn)了資源合作、經(jīng)驗(yàn)合作和技術(shù)合作,因此,檔案工作者需要具備合作性的思維。一是檔案行業(yè)要打破行業(yè)內(nèi)和行業(yè)間的壁壘,實(shí)現(xiàn)數(shù)據(jù)合作。因?yàn)閷?duì)歷史知識(shí)的挖掘需要大數(shù)據(jù)集,任何一家檔案機(jī)構(gòu)的數(shù)據(jù)都不能獨(dú)立成為大數(shù)據(jù),小數(shù)據(jù)集難以形成可靠完整的分析來(lái)源和產(chǎn)生可信的分析結(jié)果。二是技術(shù)經(jīng)驗(yàn)合作。信息技術(shù)在檔案機(jī)構(gòu)的應(yīng)用需要經(jīng)歷技術(shù)的實(shí)驗(yàn)、試用和驗(yàn)證,機(jī)構(gòu)的經(jīng)驗(yàn)共享,一家用,各家學(xué),能夠有力地加快技術(shù)應(yīng)用發(fā)展速度。最佳實(shí)踐路徑是從國(guó)家層面發(fā)起類(lèi)似“時(shí)光機(jī)”項(xiàng)目,如由我國(guó)電子文件管理部際聯(lián)席會(huì)議發(fā)起,企業(yè)、檔案機(jī)構(gòu)、圖書(shū)館等文化遺產(chǎn)機(jī)構(gòu)、高等院校等共同合作完成,形成大規(guī)模技術(shù)攻關(guān)團(tuán)隊(duì),形成集體經(jīng)驗(yàn)和智慧,加快技術(shù)成熟的周期。
信息技術(shù)應(yīng)用于檔案工作,除對(duì)現(xiàn)有工作環(huán)節(jié)進(jìn)行升級(jí)改造以外,也會(huì)啟發(fā)新的思考。一是對(duì)檔案工作傳統(tǒng)理論的影響。在“時(shí)光機(jī)”項(xiàng)目發(fā)起的“前言:21世紀(jì)的私人和公共檔案館(2022年)”“檔案中新的數(shù)字指數(shù)技術(shù)創(chuàng)新(2021年)”“檔案和知識(shí)社會(huì)(2020年)”等研討會(huì)中,來(lái)自檔案機(jī)構(gòu)和國(guó)際檔案理事會(huì)的專(zhuān)家代表深入討論信息技術(shù)對(duì)檔案來(lái)源、全宗、檔案背景等傳統(tǒng)理論的影響,認(rèn)為傳統(tǒng)檔案管理理論在信息社會(huì)中存在局限性,但也可以在數(shù)字世界中找到新的生命,與其爭(zhēng)論傳統(tǒng)檔案理論在信息技術(shù)背景下的存活問(wèn)題,不如用信息技術(shù)理念來(lái)解讀傳統(tǒng)的檔案管理理論。二是對(duì)檔案工作實(shí)踐的影響。“時(shí)光機(jī)”項(xiàng)目使檔案館突破了自身機(jī)構(gòu)的限制,使檔案館能夠直接連接到數(shù)字人文等新社區(qū)。信息技術(shù)也讓檔案機(jī)構(gòu)從傳統(tǒng)的歷史館藏中產(chǎn)生了新的見(jiàn)解,通過(guò)新穎的檢索形式和檢索系統(tǒng)使檔案利用多元化。如在關(guān)聯(lián)數(shù)據(jù)技術(shù)的視角下,檔案的檢索利用發(fā)生明顯變化。傳統(tǒng)檔案檢索依賴(lài)于檔案的原始整理順序和檔案的來(lái)源,但是當(dāng)不同全宗、不同案卷的檔案通過(guò)內(nèi)容關(guān)聯(lián)數(shù)據(jù)鏈接到一起,原始的整理順序和來(lái)源成為多種檔案利用方式之一。正如檔案學(xué)者Yeo[9]指出的,文件內(nèi)容的邏輯關(guān)系超過(guò)了文件自身的背景關(guān)系,并且文件在更廣闊的背景下產(chǎn)生了更多的關(guān)聯(lián)。在新的視角下,文件會(huì)和除其形成機(jī)構(gòu)之外的其他機(jī)構(gòu)產(chǎn)生更多的關(guān)系。因此,檔案的檢索利用可能會(huì)更多的轉(zhuǎn)向內(nèi)容驅(qū)動(dòng)的方法,和傳統(tǒng)按來(lái)源為主的檢索方法一起,形成互補(bǔ)的模式。又如檔案的著錄工作,技術(shù)的深度應(yīng)用可以自動(dòng)提取文檔內(nèi)容的重要實(shí)體和形成知識(shí)圖譜,基于卷積運(yùn)算的神經(jīng)網(wǎng)絡(luò)系統(tǒng)技術(shù)可以自動(dòng)識(shí)別圖像檔案中的人物、事件等,那么傳統(tǒng)的檔案著錄環(huán)節(jié)是否可以取消或者簡(jiǎn)化?因此,技術(shù)應(yīng)用可能會(huì)導(dǎo)致傳統(tǒng)檔案業(yè)務(wù)流程中底層建構(gòu)的理論和實(shí)踐發(fā)生顛覆性變化。
信息技術(shù)在檔案管理中的深層次應(yīng)用,這一發(fā)展將對(duì)未來(lái)檔案人員的能力素質(zhì)產(chǎn)生巨大的影響?!皶r(shí)光機(jī)”項(xiàng)目絕不是單純的技術(shù)應(yīng)用,即使是最先進(jìn)的人工智能技術(shù),也依賴(lài)于檔案工作者對(duì)檔案知識(shí)的深度了解。如“時(shí)光機(jī)”項(xiàng)目就需要大量的檔案學(xué)者對(duì)訓(xùn)練集中的檔案信息進(jìn)行注釋?zhuān)瑸樯疃葘W(xué)習(xí)提供背景信息,而在識(shí)別用特定文字和代碼書(shū)寫(xiě)的檔案材料時(shí),單純的技術(shù)是無(wú)法完成的,需要檔案工作者的深度參與,提供專(zhuān)業(yè)知識(shí)。因此,“時(shí)光機(jī)”項(xiàng)目是技術(shù)和檔案人員的結(jié)合,缺一不可。從這點(diǎn)上說(shuō),未來(lái)檔案工作人員僅會(huì)收集和存儲(chǔ)信息是不夠的,只有具備對(duì)檔案資源訪問(wèn)、使用和解釋的能力才能適應(yīng)時(shí)代對(duì)檔案人員的高要求,才能將數(shù)據(jù)轉(zhuǎn)化為洞察力,并將存儲(chǔ)轉(zhuǎn)化為記憶,從歷史記憶的守護(hù)者變成歷史記憶的守護(hù)和解釋者。即使是發(fā)展到人工智能社會(huì),技術(shù)和檔案工作人員相互之間也并非處于相互取代的關(guān)系,檔案工作者應(yīng)當(dāng)學(xué)會(huì)研究技術(shù)、應(yīng)用技術(shù),利用人類(lèi)的優(yōu)勢(shì)彌補(bǔ)技術(shù)的弱點(diǎn),開(kāi)闊視野,積極和社會(huì)科學(xué)、復(fù)雜系統(tǒng)等跨領(lǐng)域合作,培養(yǎng)時(shí)代的檔案工作新思維新能力。