任力
摘 要:該文從當(dāng)前新技術(shù)時代的特征出發(fā),概述數(shù)據(jù)處理、人工智能、網(wǎng)絡(luò)技術(shù)等時代背景下,大數(shù)據(jù)對傳統(tǒng)檔案信息管理的沖擊。分析了大數(shù)據(jù)技術(shù)時代,檔案信息管理在管理思維與管理方法等方面的變化與變革。思維方面,從注重保存到檔案保存與開發(fā)并重;方法方面,從平面單機檔案數(shù)據(jù)管理到智能化、可實現(xiàn)大數(shù)據(jù)分析與處理的立體網(wǎng)絡(luò)化檔案管理新方式;最后,提出應(yīng)對大數(shù)據(jù)技術(shù)時代檔案信息管理新要求的對策。
關(guān)鍵詞:大數(shù)據(jù)技術(shù) 檔案管理 理念 思維 方法 變革
中圖分類號:G270.7 文獻標(biāo)識碼:A 文章編號:1672-3791(2016)11(b)-0023-02
在這個科技飛速發(fā)展的年代,新技術(shù)的不斷涌現(xiàn)成為推動整個社會前行的發(fā)動機。大數(shù)據(jù)、云計算、人工智能等每一次技術(shù)的進步和革新,都滲透到社會的各個行業(yè)和領(lǐng)域,在引領(lǐng)社會變革的同時,使之快步走入信息化時代。在檔案界,新技術(shù)的應(yīng)用和管理正成為不斷深入研究的課題,檔案工作的發(fā)展理念、工作目標(biāo)和實施路徑發(fā)生了深刻的改變,檔案事業(yè)的發(fā)展正邁向更廣闊的未來。
1 大數(shù)據(jù)時代檔案管理所涉新技術(shù)的發(fā)展特征
1.1 數(shù)據(jù)處理技術(shù)
當(dāng)今的檔案數(shù)據(jù)正在向電子化過渡,檔案信息已經(jīng)成為存儲在某種介質(zhì)上能被相應(yīng)電子設(shè)備識別的物理符號。與紙質(zhì)數(shù)據(jù)相比,它是對一定事實、概念或指令的一種全新的表達形式。隨著計算機和網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)據(jù)信息的處理更加高效和便捷。面對海量、無序的數(shù)據(jù),應(yīng)用計算機軟件程序,人們能夠?qū)?shù)據(jù)進行快速的采集、存儲、檢索、加工、變換和傳輸,并通過各種數(shù)據(jù)處理的應(yīng)用軟件包,將數(shù)據(jù)提取并演算出有價值和意義的信息。數(shù)據(jù)處理技術(shù)是檔案管理的重要環(huán)節(jié),隨著新技術(shù)的不斷發(fā)展和創(chuàng)新,檔案工作才得以向系統(tǒng)化和自動化發(fā)展。當(dāng)前檔案數(shù)據(jù)處理工作主要依靠計算機和網(wǎng)絡(luò)來支撐,依據(jù)不同電子處理設(shè)備的結(jié)構(gòu)、工作方式或時空分布,對各種原始數(shù)據(jù)的分析、整理、計算、編輯等的加工和處理,由相應(yīng)的軟硬件來共同完成。
1.2 人工智能技術(shù)
人工智能被稱為世界三大頂尖技術(shù)之一,其目的是讓機器來替代人類智慧才能完成的復(fù)雜工作。作為計算機科學(xué)的一個分支,通過了解和掌握智能的實質(zhì),以此設(shè)計和生產(chǎn)出近似或高于人類智能的儀器和設(shè)備,讓機器來完成人類的智能工作。該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。2016年3月基于人工智能的圍棋程序阿爾法狗戰(zhàn)勝了世界冠軍李世石,標(biāo)志著人工智能已經(jīng)向?qū)嵺`應(yīng)用領(lǐng)域取得了突破性的進展。面對多元化的檔案信息資源,檔案數(shù)據(jù)規(guī)模的幾何式增長,檔案社會化程度的不斷提升,檔案管理工作也應(yīng)更加智慧和智能,而人工智能技術(shù)也終將成為檔案信息化建設(shè)的技術(shù)引擎。
1.3 計算機網(wǎng)絡(luò)技術(shù)
計算機網(wǎng)絡(luò)將處于不同地理位置的計算機相連接,以實現(xiàn)信息檢索、網(wǎng)絡(luò)通信、辦公自動化、電子商務(wù)和遠程教育等功能。當(dāng)今世界已進入全球化、高速和智能的網(wǎng)絡(luò)時代,一個巨型的“虛擬世界”在逐步形成,人們可以足不出戶的實現(xiàn)互動和交流,現(xiàn)實生活向數(shù)字化發(fā)展。計算機網(wǎng)絡(luò)技術(shù)也為檔案管理工作插上了翅膀,每一項網(wǎng)絡(luò)新技術(shù)的出現(xiàn)都極大的促進了檔案管理工作效率和水平的提高,在當(dāng)前的檔案信息化建設(shè)中,云計算、數(shù)據(jù)挖掘和物聯(lián)網(wǎng)技術(shù)的不斷成熟和完善,解決了傳統(tǒng)檔案受時間和空間的限制,實現(xiàn)了檔案信息的高效檢索和利用,真正實現(xiàn)了其在人類記憶、信息服務(wù)和文化傳承等方面的社會功能。
2 大數(shù)據(jù)技術(shù)時代檔案信息管理面臨的挑戰(zhàn)與變革
2.1 大數(shù)據(jù)技術(shù)時代檔案管理思維的變化
從何種角度、層次、方式去管理、開發(fā)和利用檔案,取決于每個檔案管理者的思維方式。隨著科學(xué)技術(shù)的發(fā)展,傳統(tǒng)的分類、比較、歸納和演繹的檔案學(xué)邏輯思維方式,往往將檔案管理局限在文字館藏的管理上,面對檔案資源范疇和信息形式的變化,以及互聯(lián)網(wǎng)、移動終端和個人電腦等產(chǎn)生的電子檔案數(shù)據(jù),以傳統(tǒng)的鑒定和整理思維加以處理,很難從檔案中挖掘出高價值的有效信息。因此面對大數(shù)據(jù)時代的來臨,檔案工作者應(yīng)當(dāng)采用擴散型和橫向型的思維,關(guān)注檔案事業(yè)發(fā)展的整體性和多維性,從信息科學(xué)汲取養(yǎng)分,改變單純的以保存、檢索等為主要的檔案信息服務(wù)理念,將網(wǎng)絡(luò)化、智能化的檔案數(shù)據(jù)挖掘和分析工作當(dāng)成未來檔案服務(wù)的主要方式,真正體現(xiàn)檔案信息的價值,滿足檔案工作的社會化需求。
2.2 大數(shù)據(jù)技術(shù)時代檔案管理方法的變革
檔案管理工作肩負著對檔案信息采集、整理、鑒定、存儲和檢索等任務(wù),具有社會記憶、信息服務(wù)和文化傳承等社會職責(zé)。在傳統(tǒng)的檔案管理方式下,對檔案數(shù)據(jù)往往是孤立、扁平和簡單化的處理模式,對海量數(shù)據(jù)缺乏一種立體和智能化的技術(shù)手段,大量死檔案和低價值數(shù)據(jù)是各檔案管理部門普遍存在的通病。而在大數(shù)據(jù)時代下,云計算、大數(shù)據(jù)分析、人工智能等技術(shù)的出現(xiàn),使主動利用檔案成為可能,不同的檔案管理部門,可以針對自身檔案數(shù)據(jù)的特點和屬性,利用基于不同數(shù)據(jù)模型而開發(fā)的軟硬件系統(tǒng),對本單位的海量數(shù)據(jù)進行相關(guān)性分析,從而滿足檔案管理者和使用者的需求,使檔案更加價值和意義。
3 應(yīng)對大數(shù)據(jù)技術(shù)時代要求的檔案信息管理策略
3.1 利用人工智能技術(shù),對檔案資源進行采集、分類和管理
人工智能技術(shù)的飛速發(fā)展使檔案智能管理的實現(xiàn)成為可能,檔案信息擺脫了傳統(tǒng)載體的限制,在計算機網(wǎng)絡(luò)中,應(yīng)用基于自然語言搜索、云計算和數(shù)據(jù)挖掘等技術(shù),在各種軟硬件的相互配合下,能夠完成從檔案資源的采集、分類、存儲、鑒定、安全、分析、檢索等一系列的檔案管理業(yè)務(wù),有效提升檔案信息化建設(shè)水平。以檔案數(shù)據(jù)收集為例:文本挖掘是人工智能中最早實現(xiàn)的技術(shù)之一,面對浩如煙海的檔案信息資料,想要收集滿足自身需要的有價值數(shù)據(jù),憑借人力是根本不可能實現(xiàn)的。而應(yīng)用基于人工智能技術(shù)的數(shù)據(jù)挖掘產(chǎn)品智能Agent,通過關(guān)鍵詞檢索和智能分析系統(tǒng),能夠在海量信息中搜索和提取到網(wǎng)絡(luò)資源中幾乎全部的數(shù)字化成果,使檔案的檢索和利用更加的方便和快捷。
3.2 基于大數(shù)據(jù)技術(shù)下的檔案信息資源的共建與共享
“運用互聯(lián)網(wǎng)和大數(shù)據(jù)加強橫向聯(lián)系,讓數(shù)據(jù)多跑路,群眾少跑腿”是近期國務(wù)院對滿足百姓信息需求的新倡導(dǎo)。對檔案管理工作而言,也就是利用大數(shù)據(jù)技術(shù)實現(xiàn)檔案信息資源的共建和共享。大數(shù)據(jù)本身的物性是經(jīng)過數(shù)字化后被存儲的可被識別的物理代碼,其真正意義在于能夠從這些海量的信息中提取和利用有價值的部分。也就是利用互聯(lián)網(wǎng)和大數(shù)據(jù)的相關(guān)技術(shù),使數(shù)據(jù)更加公開和透明,實現(xiàn)不同部門間、不同社會群體間的信息傳導(dǎo)和利用,為檔案管理者和服務(wù)對象提供數(shù)據(jù)支撐,充分體現(xiàn)檔案管理工作的社會價值。應(yīng)在檔案信息共建共享的原則、技術(shù)和設(shè)備、實施路徑、安全性等方面制定詳細和可行的規(guī)劃,從而確保檔案管理的社會價值最大化實現(xiàn)。
3.3 應(yīng)用數(shù)據(jù)挖掘技術(shù),對檔案信息進行開發(fā)和利用
當(dāng)前我國檔案管理的自動化、網(wǎng)絡(luò)化工作已經(jīng)基本實現(xiàn),很多檔案管理部門都能利用計算機軟件或網(wǎng)絡(luò)平臺,對檔案工作所產(chǎn)生的海量數(shù)據(jù)信息進行記錄、整理和分析,并從中挖掘有價值的信息,為檔案業(yè)務(wù)信息的管理提供可以參考的決策信息,為檔案數(shù)據(jù)資源的優(yōu)化和整合,檔案服務(wù)的便捷和高效提供了一定的技術(shù)支撐。但在檔案數(shù)據(jù)的深層次處理方面,由于分析方法和技術(shù)上的缺失,在對大規(guī)模數(shù)據(jù)處理上仍顯不足。而隨著數(shù)據(jù)挖掘技術(shù)的日趨成熟,人們可以通過特定的算法和模型,對數(shù)據(jù)進行總結(jié)、分類發(fā)現(xiàn)、聚類和關(guān)聯(lián),對檔案數(shù)據(jù)進行更高層次的抽象,提高檔案資源的實際利用率。檔案管理部門應(yīng)積極應(yīng)用最新的數(shù)據(jù)挖掘技術(shù),將傳統(tǒng)的數(shù)據(jù)保管模式向數(shù)據(jù)開發(fā)和利用模式轉(zhuǎn)變,將檔案服務(wù)從被動向信息的主動提供者轉(zhuǎn)型。
參考文獻
[1]周林興,周振國.高校檔案館、博物館數(shù)字資源整合研究[J].檔案管理,2014(5):10-14.
[2]張芳霖,唐霜.大數(shù)據(jù)影響下檔案學(xué)發(fā)展趨勢的思考[J].北京檔案,2014(9):9-13.
[3]楊來青,徐明君,鄒杰.檔案館未來發(fā)展的新前景:智慧檔案館[J].中國檔案,2013(2):68-70.