趙彥昌+段雪茹
摘要:本文運(yùn)用SWOT分析法,分析了檔案部門在大數(shù)據(jù)時(shí)代開展檔案信息資源整合自身的優(yōu)勢、劣勢,以及面臨的外部機(jī)遇和挑戰(zhàn),以便運(yùn)用大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù)來推進(jìn)檔案信息資源整合的進(jìn)程。
關(guān)鍵詞:大數(shù)據(jù)檔案信息資源SWOT分析
Abstract: This article will use the SWOT analysis method to analysis the advantages ,disadvantages op? portunities and challenges of archives information re? sources integration in the time of big data, which ex? pect to use the data mining technology to promote the progress of archives information resources inte? gration.
Keywords:Big data; Archives information resourc? es; SWOT analysis method
一、引言
大數(shù)據(jù)時(shí)代的到來給檔案事業(yè)帶來了深遠(yuǎn)的影響。大數(shù)據(jù)是以容量大、類型多、存取速度快、應(yīng)用價(jià)值高為主要特征的數(shù)據(jù)集合,對(duì)數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進(jìn)行采集、存儲(chǔ)和關(guān)聯(lián)分析,從中發(fā)現(xiàn)新知識(shí)、創(chuàng)造新價(jià)值、提升新能力的新一代信息技術(shù)和服務(wù)業(yè)態(tài)。[1]但是事物都有兩面性,一方面,大數(shù)據(jù)能夠給人們帶來便捷,比如幫助人們獲取海量的信息資源;另一方面,也為人們的檢索帶來難題,比如如何快捷、高效地在海量信息資源中挖掘出滿足自己需求的信息。從這個(gè)角度而言,檔案部門應(yīng)立足于檔案信息資源整合的現(xiàn)狀,結(jié)合大數(shù)據(jù)的時(shí)代背景,充分應(yīng)用大數(shù)據(jù)時(shí)代的信息挖掘技術(shù),采取有效的措施應(yīng)對(duì)大數(shù)據(jù)時(shí)代帶來的挑戰(zhàn),最終實(shí)現(xiàn)檔案信息資源的整合?;诖耍覀儾捎肧WOT分析法對(duì)大數(shù)據(jù)環(huán)境下檔案部門開展檔案信息資源整合自身的優(yōu)勢、劣勢、面臨的外部機(jī)遇和挑戰(zhàn)進(jìn)行分析,以便檔案部門在進(jìn)行檔案信息資源整合時(shí)認(rèn)清形勢,揚(yáng)長避短,抓住機(jī)遇,制定符合大數(shù)據(jù)時(shí)代的檔案信息資源整合措施。具體如圖1所示。
二、優(yōu)勢分析
首先,我們從技術(shù)優(yōu)勢、保管條件優(yōu)勢、檔案館數(shù)字化現(xiàn)代管理系統(tǒng)三個(gè)方面來分析大數(shù)據(jù)時(shí)代現(xiàn)有檔案信息資源整合的優(yōu)勢。
(一)檔案館的技術(shù)優(yōu)勢
1.目前現(xiàn)有的信息交換技術(shù)在檔案信息資源整合中的應(yīng)用。部分檔案信息資源的內(nèi)容是不公開的,涉密性較高。因此,在整合檔案信息資源時(shí),既要滿足其共享性的要求,又要保障檔案信息資源的安全性。第一,傳統(tǒng)以紙質(zhì)檔案為主的檔案信息資源可以通過用戶到檔案館借閱瀏覽實(shí)現(xiàn)信息交換。而數(shù)字化的檔案資源則可以通過檔案網(wǎng)站、檔案數(shù)據(jù)庫等“一站式跨庫檢索”實(shí)現(xiàn)共享。第二,為了保障信息交換的安全,引入“用戶身份認(rèn)證技術(shù)”。不同的用戶具有不同的訪問權(quán)限,通過這種方式在一定程度上約束用戶行為,保障檔案信息資源的安全性。
2.大數(shù)據(jù)時(shí)代檔案信息資源的利用技術(shù)優(yōu)勢。傳統(tǒng)檔案載體信息資源的利用主要是通過檔案館閱覽室借閱、檔案復(fù)制本、館內(nèi)現(xiàn)場人員咨詢服務(wù)等方式實(shí)現(xiàn)的。在大數(shù)據(jù)時(shí)代,還出現(xiàn)了電子檔案閱覽室、檔案云平臺(tái)網(wǎng)絡(luò)在線咨詢等自主利用方式。例如,遼寧省檔案館網(wǎng)站就有新聞發(fā)布室、文化大觀園、走進(jìn)展廳、檔案云平臺(tái)、業(yè)務(wù)系統(tǒng)專區(qū)等模塊。在“檔案云平臺(tái)”模塊,用戶可以通過鍵入檔號(hào)、題名等信息,自主查閱政府信息公開文件、檔案信息資源、綜合檔案館館藏等。
(二)檔案館的保管條件優(yōu)勢
2014年8月,中共中央辦公廳、國務(wù)院辦公廳聯(lián)合印發(fā)的《關(guān)于加強(qiáng)和改進(jìn)新形勢下檔案工作的意見》中明確要求:“檔案機(jī)構(gòu)要建立健全人防、物防、技防三位一體的檔案安全防范體系,確保檔案安全?!痹诖艘庖姷耐苿?dòng)下,部分省市檔案館(室)已經(jīng)基本建成智慧館庫,即以物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)等技術(shù)為支撐,對(duì)檔案館庫房進(jìn)行智能一體化設(shè)計(jì),從而實(shí)現(xiàn)對(duì)檔案的集中統(tǒng)一保管,達(dá)到檔案安全保管工作的網(wǎng)絡(luò)化、智能化、人性化、科學(xué)化。[2]
(三)檔案館數(shù)字化現(xiàn)代管理系統(tǒng)的發(fā)展
在大數(shù)據(jù)時(shí)代,檔案館建立了數(shù)字化現(xiàn)代管理系統(tǒng)。數(shù)字化現(xiàn)代管理系統(tǒng)一般分為日常業(yè)務(wù)管理系統(tǒng)、檔案數(shù)字化采集系統(tǒng)和數(shù)字化檔案查閱系統(tǒng)三大板塊。除此以外,該系統(tǒng)還包括系統(tǒng)維護(hù)、Web瀏覽查詢等功能。各個(gè)模塊相互協(xié)調(diào)配合,不僅能夠滿足檔案館工作人員日常辦公的需求,而且能夠縮短用戶的檢索時(shí)間,提升檢索效率和服務(wù)效能,最終促使檔案信息資源數(shù)字化的順利開展。以蘇州數(shù)字化現(xiàn)代檔案管理系統(tǒng)的建設(shè)為例,蘇州市數(shù)字檔案館項(xiàng)目已經(jīng)完成,能夠通過網(wǎng)絡(luò)處理檔案館所有業(yè)務(wù),而各機(jī)關(guān)事業(yè)單位信息化建設(shè)也已見成效。[3]
三、劣勢分析
(一)理念與實(shí)踐進(jìn)度不匹配
為了推進(jìn)檔案信息資源的整合,檔案工作者提出了“大檔案”的理念。“大檔案”理念由來已久,但是檔案部門只是把“大檔案”理念落實(shí)到檔案館的建設(shè)中,并沒有較好地應(yīng)用在檔案信息資源的建設(shè)中。因此,我們不僅要提出與時(shí)代發(fā)展相匹配的管理理念,而且要使理念落實(shí)到檔案信息資源整合的實(shí)踐中去。在大數(shù)據(jù)時(shí)代,檔案信息資源整合需要各個(gè)環(huán)節(jié)的配合和各個(gè)部門協(xié)調(diào)一致的工作才能完成,各部門、各環(huán)節(jié)的協(xié)調(diào)都需要強(qiáng)大的信息系統(tǒng)來組織、協(xié)調(diào)和實(shí)現(xiàn)信息資源共享,使其得到最優(yōu)化的利用。簡言之,檔案部門要充分發(fā)揮意識(shí)的能動(dòng)作用,讓大數(shù)據(jù)時(shí)代的“大檔案”理念更好地指導(dǎo)檔案信息資源整合的實(shí)踐工作。
(二)缺乏統(tǒng)一的技術(shù)整合規(guī)范標(biāo)準(zhǔn)
當(dāng)前在檔案信息資源整合中,檔案部門缺乏一套統(tǒng)一的技術(shù)整合標(biāo)準(zhǔn)體系,制約了檔案信息資源整合更好的發(fā)展,因此應(yīng)該高度重視。“標(biāo)準(zhǔn)化是對(duì)檔案信息資源各方面建設(shè)具有總攬性的前提與基礎(chǔ),也是最亟待解決的實(shí)際問題,否則檔案信息資源共建共享就無法實(shí)現(xiàn)?!盵4]可見,只有建立一套檔案信息資源整合的標(biāo)準(zhǔn)體系,各地區(qū)檔案館在開展檔案信息資源整合時(shí)才能有據(jù)可依。
(三)檔案信息資源質(zhì)量的難把關(guān)
一方面,紙質(zhì)檔案信息資源質(zhì)量鑒定困難。檔案館為了豐富館藏,改變原本單一的館藏結(jié)構(gòu),會(huì)不斷地在整合工作中更加廣泛地收集檔案,由于檔案種類繁多,類目繁雜,短時(shí)間內(nèi)僅僅依靠檔案館工作人員很難選取大量優(yōu)質(zhì)的檔案信息資源。此外,檔案部門不僅要關(guān)注檔案信息資源內(nèi)容的優(yōu)質(zhì)性,還要關(guān)注其檔案載體質(zhì)量的好壞,二者兼顧才能更好地為檔案信息資源質(zhì)量進(jìn)行把關(guān)。另一方面,數(shù)字檔案信息資源質(zhì)量的控制與鑒定也比較復(fù)雜。既要控制好數(shù)字檔案信息資源采集環(huán)節(jié)的質(zhì)量,又要控制好錄入、組織與開發(fā)環(huán)節(jié)的質(zhì)量。因此,在進(jìn)行檔案信息資源整合時(shí),如何收集質(zhì)量優(yōu)、價(jià)值高的檔案資源也將是我們面臨的問題之一。
四、機(jī)遇分析
只有抓住機(jī)遇才能更好地發(fā)展自己,大數(shù)據(jù)環(huán)境下檔案部門開展檔案信息資源整合也面臨著一些機(jī)遇,抓住這些機(jī)遇,有利于檔案事業(yè)更好的發(fā)展。
(一)國家政策的支持
“十二五”規(guī)劃期間,《全國檔案事業(yè)發(fā)展“十二五”規(guī)劃》中提到要實(shí)施公共檔案信息資源共享服務(wù)工程項(xiàng)目,打造“一站式”檔案信息資源共享和服務(wù)平臺(tái),為社會(huì)提供全方位的檔案信息服務(wù)。[5]“十三五”規(guī)劃期間,國家檔案局印發(fā)的《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中也制定了相關(guān)政策支持檔案信息資源整合的發(fā)展。其中,有一項(xiàng)發(fā)展目標(biāo)就是“實(shí)現(xiàn)檔案資源多樣化。依法管理檔案資源,各級(jí)國家機(jī)關(guān)、團(tuán)體、企業(yè)事業(yè)單位檔案實(shí)現(xiàn)應(yīng)歸盡歸、應(yīng)收盡收;檔案資源更加齊全完整、豐富多元,覆蓋人民群眾的檔案資源體系更加完善?!盵6]
(二)大數(shù)據(jù)環(huán)境下信息挖掘技術(shù)的進(jìn)步
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,越來越多的信息以非結(jié)構(gòu)化或半結(jié)構(gòu)化的形式進(jìn)行存儲(chǔ),如超級(jí)文本標(biāo)記語言(HTML)文檔。目前,對(duì)這類文檔數(shù)據(jù)訪問主要是基于瀏覽和信息檢索技術(shù),而已知瀏覽器和搜索引擎檢索信息的能力是非常有限的。[7]通過Web文本挖掘技術(shù),一方面,可以提升檔案信息資源的檢索效率。首先,Web2.0通過對(duì)信息的聚類處理,把碎片化的信息整合到一起,發(fā)揮其最大的利用價(jià)值。其次,Web2.0通過對(duì)用戶的檢索痕跡進(jìn)行分析,使分析結(jié)果一目了然,然后通過對(duì)分析結(jié)果進(jìn)行分組和標(biāo)注,使提供的檢索內(nèi)容更加精確,從而優(yōu)化了用戶的檢索效果,提升了檢索效率。另一方面,極大地提升了服務(wù)效能。在搜索信息或者問題時(shí),搜索引擎就會(huì)自動(dòng)推送用戶可能感興趣的信息供用戶參考。檔案館可以通過分析用戶瀏覽不同類型信息資源的頻率,從而分析關(guān)注用戶的喜好,這樣有利于升級(jí)完善更加人性化的推薦、定制等多樣化的服務(wù)。
(三)信息化建設(shè)為檔案信息資源整合提供了有利的平臺(tái)
我國開展的信息化建設(shè)為檔案信息資源的整合提供了有利的平臺(tái)?!笆濉币?guī)劃期間,我國的檔案信息化建設(shè)已經(jīng)取得了一些成果,如檔案信息化建設(shè)初具規(guī)模。初步建成以局域網(wǎng)、政務(wù)網(wǎng)、因特網(wǎng)為平臺(tái),以檔案信息管理系統(tǒng)為支撐,以檔案目錄中心、基礎(chǔ)數(shù)據(jù)庫、檔案利用平臺(tái)、檔案網(wǎng)站信息發(fā)布為基礎(chǔ)的檔案信息化體系。[8]“十三五”規(guī)劃期間,《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中也提到了要加快檔案管理信息化進(jìn)程的目標(biāo)。它要求各檔案部門、檔案網(wǎng)站等主體加快提升電子檔案管理水平。[9]
五、挑戰(zhàn)分析
知己知彼,方能百戰(zhàn)不殆。檔案部門既要抓住機(jī)遇,促進(jìn)檔案信息資源整合的開展,也要了解外部面臨的挑戰(zhàn)和威脅,以便提出相應(yīng)的解決對(duì)策。
(一)信息實(shí)時(shí)精準(zhǔn)管控難
大數(shù)據(jù)時(shí)代,動(dòng)態(tài)性與交互性并存,使得數(shù)據(jù)實(shí)時(shí)精準(zhǔn)管控難?;ヂ?lián)網(wǎng)信息是檔案信息資源的重要組成部分,而互聯(lián)網(wǎng)信息的動(dòng)態(tài)性是顯而易見的,具有較大的自由度和隨意性。除此以外,在大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)構(gòu)筑起了檔案館和用戶之間的互動(dòng)橋梁,檔案館可以通過檔案網(wǎng)站向用戶輸送信息,公眾可以參與互動(dòng),實(shí)現(xiàn)信息的雙向流動(dòng)。從這個(gè)角度而言,檔案部門對(duì)紛繁復(fù)雜、動(dòng)態(tài)性強(qiáng),互動(dòng)性緊密的數(shù)字檔案信息資源實(shí)時(shí)精準(zhǔn)控制的難度越來越大。
(二)對(duì)數(shù)據(jù)分析帶來的挑戰(zhàn)
大數(shù)據(jù)時(shí)代是一個(gè)海量數(shù)據(jù)和信息爆炸式增長的時(shí)代。隨著檔案部門信息化建設(shè)工作的開展,檔案信息資源的收集渠道也日趨多元化,數(shù)據(jù)類型不僅包括結(jié)構(gòu)化數(shù)據(jù),而且包括非結(jié)構(gòu)化數(shù)據(jù)等。由于大數(shù)據(jù)時(shí)代信息類型的多樣性發(fā)展,使得傳統(tǒng)封閉式的檔案數(shù)據(jù)挖掘與分析技術(shù)不再適應(yīng)半結(jié)構(gòu)化數(shù)據(jù)等的分析處理?!耙@得大數(shù)據(jù)分析的價(jià)值,就應(yīng)關(guān)注檔案數(shù)字資源中的數(shù)據(jù)關(guān)系和語義表征,實(shí)現(xiàn)信息整合與知識(shí)整合。但目前檔案數(shù)字資源整合還處于數(shù)據(jù)整合階段,偏重于實(shí)現(xiàn)異質(zhì)異構(gòu)數(shù)據(jù)在物理或邏輯上的集中和互聯(lián)互通,僅能為用戶提供信息檢索服務(wù),這與大數(shù)據(jù)時(shí)代的要求相去甚遠(yuǎn)。”[10]
(三)安全技術(shù)存在的漏洞
大數(shù)據(jù)時(shí)代的到來為檔案信息資源整合帶來了較多機(jī)遇,但是大數(shù)據(jù)時(shí)代也容易出現(xiàn)信息泄密的現(xiàn)象。一方面,在大數(shù)據(jù)時(shí)代,信息種類繁多,檔案部門要學(xué)會(huì)識(shí)別哪些檔案信息資源能開放,哪些檔案信息資源又屬于加密的。另一方面,雖然檔案館有采取“用戶身份認(rèn)證技術(shù)”來約束用戶行為的措施,但是遠(yuǎn)遠(yuǎn)不夠。目前,互聯(lián)網(wǎng)的開放性對(duì)檔案信息的安全構(gòu)成了一定威脅,比如黑客非法入侵、計(jì)算機(jī)病毒植入等都能對(duì)檔案網(wǎng)站信息資源的安全構(gòu)成挑戰(zhàn)。除此以外,在云環(huán)境下,云安全也存在著一定的風(fēng)險(xiǎn)。比如云計(jì)算的隱私保護(hù)問題集中在訪問控制方面,上傳到云端的敏感數(shù)據(jù)能否被非授權(quán)訪問,用戶訪問時(shí)個(gè)人身份信息會(huì)被保留多久。[11]因此,檔案部門要培養(yǎng)掌握計(jì)算機(jī)技術(shù)和檔案專業(yè)技能的綜合素質(zhì)人才,健全檔案信息安全技術(shù)等確保檔案信息資源整合的安全。
綜上,在大數(shù)據(jù)時(shí)代,檔案部門開展檔案信息資源整合有利于推動(dòng)我國檔案事業(yè)的發(fā)展,有利于實(shí)現(xiàn)檔案信息資源的共享、開發(fā)和利用。通過上述分析,檔案部門在進(jìn)行檔案信息資源整合時(shí)要依托自身內(nèi)部的優(yōu)勢,抓住外部機(jī)遇,努力改變內(nèi)部的劣勢,積極應(yīng)對(duì)外部的挑戰(zhàn),制定出符合大數(shù)據(jù)時(shí)代的檔案信息資源整合策略,使其更好地為用戶服務(wù),實(shí)現(xiàn)檔案信息資源應(yīng)有的價(jià)值。
*本文為2016年國家社科基金項(xiàng)目“非結(jié)構(gòu)化電子文件管理研究”(項(xiàng)目編號(hào):16BTQ089)的階段性研究成果。
注釋及參考文獻(xiàn):
[1]國務(wù)院.促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要[M].北京:人民出版社,2015:2.
[2]吳慧芳,郭慶琳,余武南.檔案館智慧館庫建設(shè)研究[J].北京檔案,2016(5):27-28.
[3]肖芃,林忠華,卜鑒民.構(gòu)建區(qū)域性大檔案格局[J].中國檔案,2011(3):22.
[4]劉玉波.檔案信息資源共建共享機(jī)制建設(shè)問題芻議[J].黑龍江檔案,2015(1):92.
[5]國家檔案局.全國檔案事業(yè)發(fā)展“十二五”規(guī)劃(摘要)[J].機(jī)電兵船檔案,2011(2):4.
[6][8][9]國家檔案局.全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要[J].中國檔案,2016(5):14-16.
[7][11]李智勇,李蒙,周悅.大數(shù)據(jù)時(shí)代的云安全[M].北京:化學(xué)工業(yè)出版社,2016(3):47-119.
[10]孟歆.大數(shù)據(jù)時(shí)代檔案數(shù)字資源整合的難點(diǎn)及對(duì)策分析[J].山西檔案,2015(1):79.