文/中國(guó)郵政文史中心(中國(guó)郵政郵票博物館) 劉妍
近年來,由于檔案的作用與價(jià)值越發(fā)重要,企業(yè)也越來越重視檔案的管理,會(huì)根據(jù)工作需要對(duì)運(yùn)營(yíng)中產(chǎn)生的檔案進(jìn)行收集、存儲(chǔ)、分析等。但是,傳統(tǒng)的檔案管理模式已經(jīng)跟不上企業(yè)快速發(fā)展的步伐,不能在大量的檔案資料中即時(shí)、高效地為檔案查閱人員和企業(yè)決策者提供精準(zhǔn)有效的服務(wù)。通過用大數(shù)據(jù)技術(shù)收集各類原始檔案資料,提取有用信息并加以分析、整合,最終為企業(yè)日益增長(zhǎng)的檔案信息需求和服務(wù)功能需求提供更精準(zhǔn)、高效的服務(wù),是企業(yè)檔案管理的新發(fā)展方式。隨著大數(shù)據(jù)技術(shù)的應(yīng)用,企業(yè)檔案管理需要記錄的信息數(shù)量及種類會(huì)更加復(fù)雜,企業(yè)內(nèi)部大數(shù)據(jù)系統(tǒng)建設(shè)及大數(shù)據(jù)背景下的檔案管理也面臨著挑戰(zhàn)。
(一)大數(shù)據(jù)的出現(xiàn)及發(fā)展。大數(shù)據(jù)(big data)一詞起源于互聯(lián)網(wǎng),最早可追溯到Apache的開源項(xiàng)目Nutch中,是用來描述為更新網(wǎng)絡(luò)搜索索引同時(shí)進(jìn)行批量處理或分析的大量數(shù)據(jù)集。自2012年起,大數(shù)據(jù)吸引了越來越多的關(guān)注,隨著不斷地豐富發(fā)展,形成了大量(Volume)、多樣(Varity)、高速(Velocity)、價(jià)值(Value)四大特征,其數(shù)據(jù)類型包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化三種數(shù)據(jù)。如今,大數(shù)據(jù)在各行業(yè)不斷應(yīng)用實(shí)踐,非結(jié)構(gòu)化數(shù)據(jù)逐漸成為數(shù)據(jù)的主要部分。大數(shù)據(jù)的精髓在于帶來了三個(gè)顛覆性觀念的轉(zhuǎn)變:是全部數(shù)據(jù),而不是隨機(jī)采樣;是大體方向,而不是精確制導(dǎo);是相關(guān)關(guān)系,而不是因果關(guān)系。大數(shù)據(jù)如此重要,以至于其獲取、存儲(chǔ)、搜索、分析等都成為當(dāng)前重要的研究課題。
(二)大數(shù)據(jù)檔案。檔案是企業(yè)發(fā)展的真實(shí)記錄,是客觀形成、最原始的材料,也是一種獨(dú)特的信息資源。在傳統(tǒng)的檔案管理模式下,不能充分發(fā)揮檔案的服務(wù)價(jià)值,隨著大數(shù)據(jù)技術(shù)的應(yīng)用,企業(yè)的檔案管理工作迎來了新的發(fā)展。
企業(yè)在發(fā)展過程中會(huì)產(chǎn)生大量的檔案材料,不僅包含各種會(huì)議材料、項(xiàng)目材料,還包括人員信息材料等,數(shù)據(jù)量豐富多樣。傳統(tǒng)的企業(yè)檔案管理模式不能合理將這些檔案分門別類地歸檔好,檔案之間聯(lián)系不夠緊密,不能將現(xiàn)有檔案資源合理利用,有效開發(fā)。大數(shù)據(jù)技術(shù)在企業(yè)檔案管理中的應(yīng)用,能較好地解決這些問題。大數(shù)據(jù)檔案具有存儲(chǔ)數(shù)據(jù)量龐大、承載數(shù)據(jù)種類多樣等特點(diǎn),能夠?qū)⑵髽I(yè)現(xiàn)存的文字、圖片、音頻、視頻等各類檔案進(jìn)行數(shù)字化處理,并運(yùn)用相關(guān)技術(shù)進(jìn)行分類存儲(chǔ),在龐大的企業(yè)存儲(chǔ)的檔案中,快速查詢相關(guān)聯(lián)的檔案,綜合分析處理,從價(jià)值密度低的文件中快速檢索,實(shí)現(xiàn)價(jià)值的提純,大大提高檔案的利用率,提高服務(wù)保障的精準(zhǔn)度。
大數(shù)據(jù)背景下的企業(yè)檔案管理,能夠發(fā)揮高科技技術(shù)的天然優(yōu)勢(shì),在改善檔案存儲(chǔ)質(zhì)量的同時(shí),不斷深挖檔案的潛在價(jià)值,為企業(yè)提供更加精準(zhǔn)的服務(wù)支撐;同時(shí)提高檔案資源的有效共享率,提高檔案查閱的效率,釋放部分檔案管理人員的工作精力,為企業(yè)檔案管理帶來極大的便利。
(一)能有效改善檔案的存儲(chǔ)質(zhì)量。傳統(tǒng)的企業(yè)檔案主要以紙質(zhì)方式存儲(chǔ),紙質(zhì)檔案數(shù)量多的企業(yè),需要大量的空間存儲(chǔ),這就對(duì)存儲(chǔ)的環(huán)境提出了更高的要求,在濕度、溫度、防水、防火、防蟲等方面都有極其嚴(yán)格的規(guī)定,而且隨著時(shí)間的推移,會(huì)出現(xiàn)紙張老化,導(dǎo)致紙張變脆或字跡模糊的現(xiàn)象。另外企業(yè)存儲(chǔ)的各類檔案,由于數(shù)據(jù)類型的差別,往往會(huì)造成相關(guān)聯(lián)的檔案不能存放在一起,為查檔工作帶來很大困難。大數(shù)據(jù)背景下,檔案資料以數(shù)據(jù)的形式存儲(chǔ),將紙質(zhì)檔案、圖片檔案、視頻檔案等以電子數(shù)據(jù)的形式,按照規(guī)范原則統(tǒng)一存儲(chǔ)到設(shè)備當(dāng)中,極大地提高了數(shù)據(jù)的存儲(chǔ)質(zhì)量。而且現(xiàn)在硬盤存儲(chǔ)數(shù)據(jù)量巨大,一塊硬盤就可以存儲(chǔ)TB級(jí)的數(shù)據(jù)量,以往成千上萬張紙質(zhì)檔案,現(xiàn)在一塊硬盤就能存儲(chǔ),在極大地節(jié)省存儲(chǔ)空間的同時(shí)更加易于保存。另外,電子數(shù)據(jù)往往會(huì)備份使用,即使系統(tǒng)出現(xiàn)故障,我們也能找到備份數(shù)據(jù),而傳統(tǒng)紙質(zhì)檔案管理并不會(huì)將所有檔案進(jìn)行復(fù)印留存。以上都能說明從安全性和操作性上,大數(shù)據(jù)檔案管理能提高檔案的存儲(chǔ)質(zhì)量。
(二)能不斷挖掘檔案的潛在價(jià)值。企業(yè)檔案的價(jià)值,主要表現(xiàn)在企業(yè)平時(shí)的查檔服務(wù)和利用上,想要深挖檔案的潛在價(jià)值,不僅要解決好檔案存儲(chǔ)的完整性,更重要的是將相關(guān)聯(lián)的檔案緊密串聯(lián)到一起,挖掘其潛在價(jià)值,為企業(yè)相關(guān)人員提供更加精準(zhǔn)的服務(wù)。借助大數(shù)據(jù)檔案管理的先進(jìn)技術(shù),能推動(dòng)手動(dòng)紙質(zhì)化查閱向電子化查閱方向轉(zhuǎn)變,通過設(shè)置相關(guān)篩選條件,對(duì)檔案進(jìn)行深層次研究分析,從大量檔案資源中提取出全新的內(nèi)容,充分挖掘檔案的潛在價(jià)值,同時(shí)能根據(jù)各類不同的需求,定制多樣化的服務(wù),使得企業(yè)檔案管理向先進(jìn)性、智能化方向發(fā)展,改變了傳統(tǒng)模式下檔案管理效率低、精準(zhǔn)度不高等問題,推動(dòng)企業(yè)檔案管理工作長(zhǎng)足發(fā)展與進(jìn)步。
(三)能極大提高檔案的管理效率。傳統(tǒng)模式下的檔案查詢主要通過紙質(zhì)檔案來查閱信息,需要檔案管理人員找到相關(guān)檔案,從中篩選并提煉出查檔者需要的有用信息。這種模式下,長(zhǎng)時(shí)間翻閱紙質(zhì)檔案,一方面,會(huì)造成紙質(zhì)檔案的破損,加大后續(xù)存儲(chǔ)管理的難度;另一方面,通過人工方式翻閱、查找必然會(huì)造成人力和時(shí)間上的浪費(fèi),這些都降低了企業(yè)檔案管理的效率,更加不適應(yīng)現(xiàn)代科技的發(fā)展要求。大數(shù)據(jù)檔案建設(shè)之初,就要求企業(yè)根據(jù)檔案的性質(zhì)、類別等進(jìn)行分類并存儲(chǔ)到設(shè)備中,運(yùn)用大數(shù)據(jù)技術(shù),對(duì)存儲(chǔ)的企業(yè)檔案進(jìn)行檢索、分析。查閱過程中檔案管理人員僅通過電腦就能實(shí)現(xiàn)有效數(shù)據(jù)的獲取與分析。一方面,極大提高了檔案管理人員對(duì)檔案查閱的速度與質(zhì)量;另一方面,也從側(cè)面顯示出了企業(yè)的經(jīng)營(yíng)水平。
(四)能實(shí)現(xiàn)檔案數(shù)據(jù)的資源共享。大數(shù)據(jù)技術(shù)在檔案管理中的應(yīng)用,使得檔案數(shù)據(jù)在企業(yè)內(nèi)部共享成為可能。大數(shù)據(jù)技術(shù)的應(yīng)用能較好地解決企業(yè)檔案資源的浪費(fèi)問題,提高檔案資源的利用率,同時(shí)基于大數(shù)據(jù)技術(shù),能有效構(gòu)建檔案管理及共享系統(tǒng),通過查檔者提出的查檔需求,檔案管理者進(jìn)行查閱并實(shí)現(xiàn)價(jià)值的提純,將相關(guān)數(shù)據(jù)共享給查檔者,從而有效解決查檔必進(jìn)檔案室的老問題,促進(jìn)企業(yè)檔案資源的共享。另外企業(yè)各部門產(chǎn)生的檔案,根據(jù)規(guī)范化處理,按照格式要求通過大數(shù)據(jù)網(wǎng)絡(luò)實(shí)時(shí)、快速共享給檔案管理者,能極大減少再次整理檔案的時(shí)間,節(jié)約檔案歸檔的成本,提高檔案歸檔的效率。
大數(shù)據(jù)技術(shù)在企業(yè)檔案管理中發(fā)揮了巨大作用,帶來了更加便捷的工作方式與檔案分析處理能力,與此同時(shí),也面臨著人力、物力、財(cái)力的巨大投入,數(shù)據(jù)存儲(chǔ)安全壓力倍增、人員素質(zhì)與儲(chǔ)備不足、缺乏未來規(guī)劃合理統(tǒng)籌等新問題、新挑戰(zhàn),從而使得大數(shù)據(jù)技術(shù)在企業(yè)檔案管理中的應(yīng)用面臨一些現(xiàn)實(shí)問題,不得不引起企業(yè)的重視。
(一)系統(tǒng)建設(shè)與運(yùn)維需要大量投入。當(dāng)前,企業(yè)大數(shù)據(jù)檔案管理系統(tǒng)的建設(shè)速度,遠(yuǎn)遠(yuǎn)跟不上時(shí)代發(fā)展速度,建設(shè)適合單位發(fā)展需求的大數(shù)據(jù)檔案管理系統(tǒng)。一方面,需要高性能的硬件設(shè)備及軟件環(huán)境的支撐,以此為基礎(chǔ)才能構(gòu)建智能化、數(shù)據(jù)化檔案管理模式,否則企業(yè)的檔案將無法實(shí)現(xiàn)大數(shù)據(jù)條件下的智能管理。同時(shí)企業(yè)需要將原有的紙質(zhì)檔案、圖片、視頻、音頻等傳統(tǒng)檔案文件轉(zhuǎn)變?yōu)榭捎玫碾娮訑?shù)據(jù),建立企業(yè)檔案數(shù)據(jù)庫,對(duì)于有大量檔案存放的企業(yè)來說,為了增加檔案數(shù)據(jù)的關(guān)聯(lián)程度,便于后續(xù)查找,要求在轉(zhuǎn)化為電子數(shù)據(jù)的過程中,按照規(guī)定轉(zhuǎn)化為規(guī)范可用的數(shù)據(jù)集,并建立相關(guān)數(shù)據(jù)檔案的索引鏈接,這是一個(gè)浩大的工程,需要人力、物力、財(cái)力的支持;另一方面,系統(tǒng)的軟硬件運(yùn)行維護(hù)也需要專業(yè)運(yùn)維人員,檔案涉及企業(yè)運(yùn)轉(zhuǎn)各個(gè)環(huán)節(jié),需要及時(shí)歸檔、存儲(chǔ),也需要第一時(shí)間為查檔者提供需要的信息,所以軟硬件出現(xiàn)故障,必須第一時(shí)間解決,這就要求企業(yè)投入資金建立軟硬件備份庫。所以,企業(yè)大數(shù)據(jù)檔案系統(tǒng)建設(shè)不是一蹴而就的,需要企業(yè)增大投入并穩(wěn)步推進(jìn),才能發(fā)揮出檔案的最大價(jià)值。
(二)數(shù)據(jù)存儲(chǔ)與管理存在安全隱患。企業(yè)檔案是在運(yùn)營(yíng)過程中產(chǎn)生的實(shí)物見證,記錄著企業(yè)成長(zhǎng)的全部過程,同時(shí)有大量的公司保密性信息,一旦丟失或者泄露,會(huì)帶來巨大損失。大數(shù)據(jù)時(shí)代,大量檔案數(shù)據(jù)以電子數(shù)據(jù)進(jìn)行存儲(chǔ),不可避免地會(huì)與網(wǎng)絡(luò)產(chǎn)生聯(lián)系,有可能出現(xiàn)內(nèi)在或外在的網(wǎng)絡(luò)安全隱患,造成檔案數(shù)據(jù)的丟失、泄露或被惡意篡改等安全問題。另外企業(yè)及檔案管理人員對(duì)檔案安全重視程度不夠,沒有制定規(guī)范的檔案管理制度或不能按照檔案管理相關(guān)制度進(jìn)行檔案管理,造成檔案的缺失、遺漏等。這就要求企業(yè)及檔案管理人員重視檔案數(shù)據(jù)的管理與建設(shè),實(shí)時(shí)監(jiān)控檔案信息處理,形成穩(wěn)定的數(shù)據(jù)存儲(chǔ)機(jī)制與管理模式。
(三)人員素質(zhì)與儲(chǔ)備具有一定差距。由于檔案的特殊性及重要性,檔案管理有一套嚴(yán)格的技術(shù)流程,尤其是在大數(shù)據(jù)檔案管理中,更需要從源頭對(duì)企業(yè)各類檔案數(shù)據(jù)進(jìn)行規(guī)范的電子化處理。同時(shí),針對(duì)不同的檔案,使用不同的方式進(jìn)行分析處理是管理人員需要具備的技術(shù)條件,這就對(duì)管理人員的素質(zhì)提出更高的要求。現(xiàn)實(shí)情況,企業(yè)中檔案管理人員數(shù)量少,人員流動(dòng)大,很少參加檔案類的培訓(xùn),更不用說了解大數(shù)據(jù)檔案的管理與應(yīng)用相關(guān)知識(shí),甚至有些企業(yè)沒有專門的檔案管理人員由其他部門人員兼職,這些都體現(xiàn)了企業(yè)對(duì)檔案管理人員,培養(yǎng)不夠重視;另外,企業(yè)沒有對(duì)高學(xué)歷、高素質(zhì)、熟悉大數(shù)據(jù)檔案管理的人才引進(jìn)計(jì)劃,更多的是關(guān)注管理人才與技術(shù)人才的引進(jìn),這種情況加劇了人才儲(chǔ)備機(jī)制的不健全,不能很好地適應(yīng)大數(shù)據(jù)條件下的檔案管理工作。
(四)未來規(guī)劃與發(fā)展缺乏合理統(tǒng)籌。隨著對(duì)大數(shù)據(jù)技術(shù)的深入研究,更加智能、便捷、新穎的技術(shù)將會(huì)被開發(fā)出來,如果這些技術(shù)在企業(yè)檔案管理中能及時(shí)應(yīng)用,會(huì)使得企業(yè)檔案的潛在價(jià)值挖掘得更充分,同時(shí)為檔案管理者提供更加便捷的管理方式,為企業(yè)決策者提供更加精準(zhǔn)的數(shù)據(jù)支撐,為企業(yè)帶來更多無形的財(cái)富,從而為企業(yè)長(zhǎng)遠(yuǎn)發(fā)展注入新的活力。但是,現(xiàn)階段科技發(fā)展迅速,大數(shù)據(jù)技術(shù)更新迭代速度快、新技術(shù)層出不窮,現(xiàn)實(shí)情況是企業(yè)不能合理統(tǒng)籌,對(duì)未來大數(shù)據(jù)技術(shù)在企業(yè)檔案管理中的應(yīng)用規(guī)劃不夠明確,并沒有及時(shí)對(duì)最初部署的大數(shù)據(jù)技術(shù)升級(jí),存在沒有留好大數(shù)據(jù)技術(shù)升級(jí)接口等現(xiàn)實(shí)情況,這樣就造成了檔案后續(xù)發(fā)展力量不足,對(duì)大數(shù)據(jù)技術(shù)在企業(yè)檔案管理中的應(yīng)用造成影響。
大數(shù)據(jù)的發(fā)展為企業(yè)檔案管理工作注入了新的活力,提供了新的管理方式,帶來了巨大的變化。企業(yè)要抓住大數(shù)據(jù)發(fā)展的機(jī)遇,與時(shí)俱進(jìn),科學(xué)規(guī)范,不斷挖掘企業(yè)檔案的價(jià)值,為相關(guān)人員提供精準(zhǔn)服務(wù);同時(shí)要直面大數(shù)據(jù)在企業(yè)檔案管理中面臨的各類問題,科學(xué)規(guī)劃與統(tǒng)籌,善于分析并解決,只有這樣才能開創(chuàng)大數(shù)據(jù)技術(shù)在企業(yè)檔案管理工作應(yīng)用的新局面。