崔偉山
摘 要:在當(dāng)前時(shí)代發(fā)展的進(jìn)程中,我國(guó)已經(jīng)進(jìn)入了大數(shù)據(jù)的時(shí)代,這一時(shí)代對(duì)于檔案資源的整合與利用提出了更高的要求,可以說,任何一項(xiàng)工作都需要建立在數(shù)據(jù)的基礎(chǔ)上,只有通過數(shù)據(jù)才可以保證其自身的發(fā)展。所以檔案數(shù)字資源在當(dāng)前的工作中就顯得尤為重要。檔案數(shù)字資源自身具有一定的優(yōu)勢(shì),例如具有龐大的數(shù)據(jù)量,并且在短時(shí)間內(nèi)就實(shí)現(xiàn)了迅速的增長(zhǎng)等,面對(duì)如此繁雜的數(shù)據(jù),就為檔案數(shù)字資源的整合工作帶來了一定的難度。因此本文重點(diǎn)對(duì)相應(yīng)的難點(diǎn)以及具體的對(duì)策展開了探討。
關(guān)鍵詞:大數(shù)據(jù);檔案數(shù)字資源;整合
在現(xiàn)代化的發(fā)展過程中,檔案數(shù)字資源是大數(shù)據(jù)時(shí)代下一個(gè)主要的特征。我國(guó)具有豐富的檔案館藏,隨著時(shí)代的發(fā)展,這些館藏?cái)?shù)量也在不斷的增加,尤其是電子檔案的數(shù)量,增長(zhǎng)速度是十分明顯的。同時(shí),檔案數(shù)字資源也具有十分廣泛的分布,在人們的不斷探索過程中,數(shù)據(jù)保存的能力也得到了進(jìn)一步的提升,結(jié)構(gòu)化信息以及其他類型的半結(jié)構(gòu)化信息等都逐漸融合在了一起,此外,檔案數(shù)字資源變得愈發(fā)可靠了起來,其正在以一種更加真實(shí)的面貌展現(xiàn)在人們的面前。所以本文主要對(duì)大數(shù)據(jù)時(shí)代下的檔案數(shù)字資源整合的相關(guān)問題展開了探討,希望對(duì)今后的工作有所幫助。
1 大數(shù)據(jù)時(shí)代檔案數(shù)字資源整合的難點(diǎn)
與傳統(tǒng)檔案存在很大的不同,大數(shù)據(jù)時(shí)代下的檔案數(shù)字資源正面臨著以下幾個(gè)方面的難點(diǎn)。首先是在數(shù)據(jù)的存儲(chǔ)量方面,數(shù)據(jù)數(shù)量的不斷增多就需要一定的支撐才能得以實(shí)現(xiàn),當(dāng)前對(duì)于數(shù)據(jù)的存儲(chǔ)以及管理都投入了較大的資源,但是仍然不能滿足大量數(shù)字資源增長(zhǎng)的現(xiàn)狀。所以在這種情況下就需要進(jìn)一步的完善存儲(chǔ)方式以滿足實(shí)際發(fā)展的需要。
其次是在大數(shù)據(jù)分析的過程中,對(duì)于數(shù)據(jù)的分析是一個(gè)嚴(yán)峻的問題,因?yàn)樵谛畔⒒瘯r(shí)代的發(fā)展下,傳統(tǒng)的檔案挖掘技術(shù)對(duì)于處理非結(jié)構(gòu)化數(shù)據(jù)時(shí)具有一定的局限性,要想將數(shù)據(jù)的價(jià)值體現(xiàn)出來,就需要進(jìn)行更加深入的挖掘以及分析,但是現(xiàn)階段的數(shù)據(jù)分析只能在檢索方面為用戶提供服務(wù),這就不符合大數(shù)據(jù)時(shí)代的發(fā)展要求。
第三,在安全性方面有待進(jìn)一步的完善,與信息資源存在一定的差異性,檔案數(shù)字資源是經(jīng)過精心的挑選才保存下來的,在這之中包含著大量的秘密,因此安全性是十分重要的。如何才能避免出現(xiàn)安全隱患,保證對(duì)檔案數(shù)字資源更加嚴(yán)密的保護(hù)是當(dāng)前工作中面臨的一個(gè)主要問題,需要與大數(shù)據(jù)時(shí)代的發(fā)展相一致。
最后是人才方面的問題。只有具備高素質(zhì)的人才才能保證檔案工作的順利展開,在現(xiàn)階段的檔案管理過程中,專業(yè)化的人才較少,所以整個(gè)檔案隊(duì)伍不具有較高的專業(yè)性,這樣就會(huì)對(duì)數(shù)字資源的整合工作帶來一定的難度,無法順利的實(shí)現(xiàn)檔案整合,甚至還會(huì)存在一定的制約,由此可見,加強(qiáng)對(duì)檔案人才的培養(yǎng)是十分必要的。
2 應(yīng)對(duì)策略
在大數(shù)據(jù)時(shí)代的發(fā)展進(jìn)程中,應(yīng)該將大數(shù)據(jù)的價(jià)值積極的展現(xiàn)出來,所以相應(yīng)的管理模式需要加以進(jìn)一步的變革。應(yīng)該將相應(yīng)的管理模式加以進(jìn)一步的轉(zhuǎn)變,積極的采用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)檔案數(shù)據(jù)信息的相互關(guān)聯(lián),這樣才能更好的實(shí)現(xiàn)檔案資源的共享。相關(guān)的檔案管理部門也應(yīng)該做相互協(xié)調(diào)的工作,將檔案數(shù)字資源中所蘊(yùn)含的潛在價(jià)值充分的體現(xiàn)出來,這樣才能實(shí)現(xiàn)進(jìn)一步的整合。傳統(tǒng)的檔案管理部門中,供給式的模式占據(jù)重要位置,而在新時(shí)期的發(fā)展下,這一思維模式應(yīng)該加以進(jìn)一步的轉(zhuǎn)變,從用戶面臨的問題入手,為人們的行為決策提供有益指導(dǎo)。以解決用戶所面臨的問題為目標(biāo)整合檔案數(shù)字資源,構(gòu)建起以社會(huì)利用需求為導(dǎo)向的檔案數(shù)字資源體系,不斷提高檔案服務(wù)與用戶需求之間的匹配程度。
構(gòu)建適應(yīng)大數(shù)據(jù)要求的檔案數(shù)字資源。以云計(jì)算為例,它適應(yīng)了大數(shù)據(jù)時(shí)代分布式存儲(chǔ)與海量數(shù)據(jù)并行處理的需要,實(shí)現(xiàn)了計(jì)算機(jī)資源的服務(wù)化,是大數(shù)據(jù)時(shí)代檔案數(shù)字資源整合的基礎(chǔ)平臺(tái)和支撐技術(shù)。首先,各檔案部門應(yīng)根據(jù)國(guó)家統(tǒng)一規(guī)劃以及自身基礎(chǔ)設(shè)施建設(shè)與檔案數(shù)據(jù)庫(kù)資源匹配程度的具體情況,靈活選擇適合的云部署方案。對(duì)于那些處在檔案數(shù)字資源整合關(guān)鍵節(jié)點(diǎn)的部門應(yīng)架設(shè)私有云,以動(dòng)態(tài)申請(qǐng)公有云的方式彌補(bǔ)自身計(jì)算能力、存儲(chǔ)空間等的不足。其次,云計(jì)算能統(tǒng)一各應(yīng)用環(huán)境之間的業(yè)務(wù)邏輯、組織結(jié)構(gòu)和表達(dá)方式等,消除信息孤島,從而建立集成的檔案數(shù)字資源管理平臺(tái),促成檔案數(shù)字資源深層次整合與知識(shí)開發(fā)的實(shí)現(xiàn)。再次,云計(jì)算能實(shí)現(xiàn)對(duì)檔案應(yīng)用的整合,并以服務(wù)的形式向用戶發(fā)布;同時(shí)支持用戶利用各種終端設(shè)備隨時(shí)隨地訪問所需的云服務(wù)。這些都將在最大程度上發(fā)揮檔案數(shù)字資源整合的優(yōu)勢(shì),提高檔案服務(wù)的效率和便捷性。
加強(qiáng)大數(shù)據(jù)時(shí)代檔案數(shù)字資源整合的安全保障體系建設(shè)。首先,應(yīng)建立IAM(身份和訪問管理)和隱私保護(hù)系統(tǒng),實(shí)現(xiàn)統(tǒng)一身份認(rèn)證與訪問權(quán)限控制,達(dá)到用戶安全集成管理的目標(biāo),有效應(yīng)對(duì)檔案數(shù)字資源整合與大數(shù)據(jù)應(yīng)用過程中的安全風(fēng)險(xiǎn)。其次,通過數(shù)據(jù)加密技術(shù)保護(hù)檔案信息安全。通過SSL(Secure Sockets Layer,安全套接層協(xié)議層)加密,實(shí)現(xiàn)在數(shù)據(jù)集的節(jié)點(diǎn)和應(yīng)用程序之間移動(dòng)保護(hù)大數(shù)據(jù)。再次,綜合運(yùn)用大數(shù)據(jù)技術(shù)手段與安全保密制度,加強(qiáng)對(duì)重點(diǎn)領(lǐng)域檔案數(shù)據(jù)的日常監(jiān)管,有效應(yīng)對(duì)檔案數(shù)據(jù)聚集性與檔案利用需求無序性造成的檔案泄密風(fēng)險(xiǎn)。最后,實(shí)時(shí)開展檔案數(shù)字資源異地異質(zhì)備份工作,提高系統(tǒng)容災(zāi)能力。
最后,還要組建一支具有大數(shù)據(jù)素質(zhì)的檔案從業(yè)者隊(duì)伍。大數(shù)據(jù)環(huán)境下,檔案從業(yè)者應(yīng)加強(qiáng)自身素質(zhì)建設(shè),在檔案數(shù)字資源整合中承擔(dān)起業(yè)務(wù)專家的重任,成為檔案數(shù)字資源的提供者、組織者和導(dǎo)航者。作為檔案數(shù)字資源的提供者,就要求檔案從業(yè)者具有過硬的檔案專業(yè)知識(shí)與技能,能正確預(yù)判大數(shù)據(jù)給本單位數(shù)據(jù)處理各環(huán)節(jié)帶來的風(fēng)險(xiǎn)構(gòu)成,給出基于檔案專業(yè)的解決方案,從而確保檔案數(shù)字資源的真實(shí)、完整與安全,最大限度地滿足檔案數(shù)字資源整合的需要,保證檔案價(jià)值的實(shí)現(xiàn)。
3 結(jié)語(yǔ)
檔案數(shù)字資源整合是大數(shù)據(jù)時(shí)代檔案事業(yè)發(fā)展的關(guān)鍵命題,也是檔案部門抓住機(jī)遇重塑職業(yè)形象的重要內(nèi)容。在此過程中,檔案部門除應(yīng)時(shí)刻關(guān)注云計(jì)算技術(shù)、大數(shù)據(jù)處理技術(shù)等新興信息技術(shù)的發(fā)展,不斷深入研究其在相關(guān)領(lǐng)域的應(yīng)用實(shí)踐外,更應(yīng)進(jìn)一步探索大數(shù)據(jù)時(shí)代檔案數(shù)字資源整合的理論體系和實(shí)踐措施,從而推動(dòng)檔案服務(wù)理念與方式的變革,為開展個(gè)性化檔案智慧服務(wù),最大限度地實(shí)現(xiàn)檔案數(shù)字資源的內(nèi)在價(jià)值做好準(zhǔn)備。
參考文獻(xiàn)
[1]王飛躍.知識(shí)生產(chǎn)方式和科技決策支持的重大變革——面向大數(shù)據(jù)和開源信息的科技態(tài)勢(shì)解析與決策服務(wù)[J].中國(guó)科學(xué)院院刊,2012,(5).
[2]周峰林.大數(shù)據(jù)時(shí)代的數(shù)字檔案館(業(yè)務(wù)指導(dǎo)司司長(zhǎng)孫鋼[J]浙江檔案,2013,(8)