侯作龍 吳磊
摘 要:檔案事業(yè)作為一項(xiàng)基礎(chǔ)性服務(wù)性事業(yè),面臨大數(shù)據(jù)技術(shù)帶來(lái)的沖擊和影響。本文通過(guò)分析認(rèn)為,作為檔案工作的從業(yè)者,需要深入思考如何與大數(shù)據(jù)技術(shù)融合發(fā)展,既要為大數(shù)據(jù)技術(shù)產(chǎn)業(yè)發(fā)展服務(wù),又要利用大數(shù)據(jù)技術(shù)發(fā)展促進(jìn)自身發(fā)展。
關(guān)鍵詞:大數(shù)據(jù);檔案管理;關(guān)注方向
人類進(jìn)入二十一世紀(jì)之后,信息產(chǎn)業(yè)技術(shù)迅猛發(fā)展,特別是大數(shù)據(jù)技術(shù)更是突飛猛進(jìn),給人們的生活帶來(lái)了普遍影響。時(shí)至今日,各個(gè)行業(yè)都在思考如何利用大數(shù)據(jù)技術(shù)為本行業(yè)本產(chǎn)業(yè)服務(wù),都在尋找與大數(shù)據(jù)技術(shù)融合的最佳結(jié)合點(diǎn)。
檔案事業(yè)是基礎(chǔ)性事業(yè),也是服務(wù)性事業(yè),同樣面臨大數(shù)據(jù)技術(shù)帶來(lái)的沖擊和影響,一樣要思考如何與大數(shù)據(jù)技術(shù)融合發(fā)展,既要為大數(shù)據(jù)技術(shù)產(chǎn)業(yè)發(fā)展服務(wù),又要利用大數(shù)據(jù)技術(shù)發(fā)展促進(jìn)自身發(fā)展。
1 大數(shù)據(jù)技術(shù)發(fā)展對(duì)檔案資源體系建設(shè)影響之一:來(lái)源更廣了
在人們的固有觀念里,檔案部門(mén)收藏的都是一些有關(guān)黨和國(guó)家的檔案,這就大大地限制了檔案的來(lái)源,把檔案的范圍集中在機(jī)關(guān)和企事業(yè)單位。大數(shù)據(jù)時(shí)代背景下,互聯(lián)網(wǎng)、社會(huì)、大眾生活也應(yīng)該成為獲取檔案數(shù)據(jù)的來(lái)源。隨著互聯(lián)網(wǎng)的普及,越來(lái)越多的數(shù)據(jù)來(lái)自互聯(lián)網(wǎng)?;ヂ?lián)網(wǎng)已經(jīng)成為最大的信息資源生產(chǎn)地。我國(guó)的網(wǎng)民數(shù)量已經(jīng)穩(wěn)居世界各國(guó)之首。據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心官網(wǎng)消息,第49次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》(以下簡(jiǎn)稱《報(bào)告》)2月25日在京發(fā)布?!秷?bào)告》顯示,截至2021年12月,我國(guó)網(wǎng)民規(guī)模達(dá)10.32億,互聯(lián)網(wǎng)普及率達(dá)73.0%,我國(guó)網(wǎng)民人均每周上網(wǎng)時(shí)長(zhǎng)達(dá)到28.5個(gè)小時(shí)。城鄉(xiāng)上網(wǎng)差距繼續(xù)縮小,我國(guó)農(nóng)村網(wǎng)民規(guī)模已達(dá)2.84億,農(nóng)村地區(qū)互聯(lián)網(wǎng)普及率為57.6。老年群體加速融入網(wǎng)絡(luò)社會(huì),截至2021年12月,我國(guó)60歲及以上老年網(wǎng)民規(guī)模達(dá)1.19億,互聯(lián)網(wǎng)普及率達(dá)43.2%??梢?jiàn),互聯(lián)網(wǎng)產(chǎn)生的海量信息已經(jīng)成為檔案數(shù)據(jù)的一個(gè)重要來(lái)源。
同時(shí),加大對(duì)民生的關(guān)注力度是檔案部門(mén)獲取檔案數(shù)據(jù)來(lái)源的又一個(gè)大的變化。最近幾年,為了響應(yīng)國(guó)家政策,檔案部門(mén)加大了收集與民眾切身利益相關(guān)的民生檔案的工作力度。檔案部門(mén)還利用國(guó)際檔案日對(duì)普通公民展開(kāi)教育,幫助民眾樹(shù)立社會(huì)檔案意識(shí),喚起人們對(duì)我國(guó)的檔案事業(yè)的關(guān)注。[1]當(dāng)前,為了使我國(guó)的檔案管理向生活化、草根化方向發(fā)展,家庭檔案和個(gè)人檔案的建立正成為一種新的趨勢(shì)。
2 大數(shù)據(jù)技術(shù)發(fā)展對(duì)檔案資源體系建設(shè)影響之二:內(nèi)容更豐富了
信息資源是檔案部門(mén)安身立命的根本所在。信息資源數(shù)量越是大、門(mén)類越是多,檔案的價(jià)值才越能夠發(fā)揮出來(lái),愈加凸顯檔案部門(mén)的社會(huì)地位。當(dāng)信息技術(shù)進(jìn)入大數(shù)據(jù)時(shí)代,檔案部門(mén)也意識(shí)到自身變革的重要性,開(kāi)始不斷改變自身[2]。
2.1 檔案數(shù)據(jù)量幾何級(jí)增長(zhǎng)
大數(shù)據(jù)時(shí)代背景下,我國(guó)檔案數(shù)據(jù)資源在總量上呈現(xiàn)出快速增長(zhǎng)的趨勢(shì)[3]。截至2020年底,全國(guó)各級(jí)綜合檔案館館藏檔案91789.8萬(wàn)卷、件。其中,中央級(jí)2046.6萬(wàn)卷、件,省(區(qū)、市)級(jí)4666.9萬(wàn)卷、件,副省級(jí)2456.4萬(wàn)卷、件,地(市、州、盟)級(jí)19050.2萬(wàn)卷、件,縣(區(qū)、旗、市)級(jí)63569.7萬(wàn)卷、件。照片檔案2401.0萬(wàn)張。其中,中央級(jí)20.0萬(wàn)張,?。▍^(qū)、市)級(jí)285.5萬(wàn)張,副省級(jí)235.5萬(wàn)張,地(市、州、盟)級(jí)607.6萬(wàn)張,縣(區(qū)、旗、市)級(jí)1252.4萬(wàn)張。錄音磁帶、錄像磁帶、影片檔案112.1萬(wàn)盤(pán)。其中,中央級(jí)1.8萬(wàn)盤(pán),?。▍^(qū)、市)級(jí)26.7萬(wàn)盤(pán),副省級(jí)3.4萬(wàn)盤(pán),地(市、州、盟)級(jí)32.5萬(wàn)盤(pán),縣(區(qū)、旗、市)級(jí)47.7萬(wàn)盤(pán)。館藏電子檔案1387.5TB,其中,數(shù)碼照片390.2TB,數(shù)字錄音、數(shù)字錄像523.5TB。館藏檔案數(shù)字化成果19588.5TB。2020年度全國(guó)各級(jí)綜合檔案館共接收檔案8310.1萬(wàn)卷、件,照片檔案105.3萬(wàn)張,錄音磁帶、錄像磁帶、影片檔案4.4萬(wàn)盤(pán)。2020年度全國(guó)各級(jí)綜合檔案館共征集檔案91.7萬(wàn)卷、件,照片檔案25.6萬(wàn)張,錄音磁帶、錄像磁帶、影片檔案0.4萬(wàn)盤(pán)。截至2020年底,全國(guó)各級(jí)綜合檔案館紙質(zhì)館藏資料4039.4萬(wàn)冊(cè)。其中,中央級(jí)213.6萬(wàn)冊(cè),省(區(qū)、市)級(jí)272.9萬(wàn)冊(cè),副省級(jí)66.8萬(wàn)冊(cè),地(市、州、盟)級(jí)841.6萬(wàn)冊(cè),縣(區(qū)、旗、市)級(jí)2644.5萬(wàn)冊(cè)。隨著新一輪各級(jí)各類檔案館的改擴(kuò)建工程的批復(fù)與落地,我國(guó)檔案館館藏容量必將持續(xù)增長(zhǎng),對(duì)于存量檔案的數(shù)字化處理以及新增檔案的電子化處理將是檔案部門(mén)今后一段時(shí)間的工作重點(diǎn),“雙套歸檔制”仍是我國(guó)檔案管理的主要制度[4]。而那些經(jīng)過(guò)移交、寄存、撤轉(zhuǎn)并改的檔案,很容易就會(huì)讓檔案館的館藏存儲(chǔ)量由TB級(jí)跨越到PB。
2.2 檔案數(shù)據(jù)類型空前多樣
紙質(zhì)、聲像、實(shí)物是常見(jiàn)的三種傳統(tǒng)檔案類型。隨著信息化的普及,電子檔案也成為檔案的一種類型。此外,檔案部門(mén)還要對(duì)瀏覽查詢記錄、用戶信息等進(jìn)行保存。這些信息的載體不同、各自特點(diǎn)突出、結(jié)構(gòu)差異大,因此檔案部門(mén)以不同的方式把它們分門(mén)別類地保管起來(lái)。這樣,即使是同一個(gè)信息也會(huì)因載體的不同而呈現(xiàn)出不同的數(shù)據(jù)形式[5]。同樣的道理,同一個(gè)數(shù)據(jù)形式會(huì)因載體的不同而呈現(xiàn)出不同的信息。異構(gòu)數(shù)據(jù)大集群便由此產(chǎn)生。隨著大數(shù)據(jù)技術(shù)的發(fā)展,越來(lái)越多的半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)將以表格、文檔、圖像、音頻、視頻、網(wǎng)頁(yè)等的形態(tài)呈現(xiàn)出來(lái)。異構(gòu)化數(shù)據(jù)將是未來(lái)檔案館藏的重要來(lái)源,類型多樣、非結(jié)構(gòu)化的數(shù)據(jù)將在檔案中占有越來(lái)越大的比例[6]。
2.3 檔案數(shù)據(jù)價(jià)值密度大幅下降
與一般的信息資源比起來(lái),檔案能夠真實(shí)地記錄歷史,因此有著很高的價(jià)值。然而,對(duì)于大多數(shù)的檔案而言,從它們進(jìn)入檔案館的那一刻起,便進(jìn)入了深度睡眠的狀態(tài),少有人問(wèn)津。相關(guān)調(diào)查表明,真正具有較大利用價(jià)值、利用率較高的檔案在全部館藏中的占比并不是很高[7]。隨著大數(shù)據(jù)時(shí)代的到來(lái),檔案數(shù)量也在不斷地增加,檔案價(jià)值密度也越來(lái)越低,因此有價(jià)值的檔案的占比越來(lái)越低。
2.4 檔案數(shù)據(jù)處理速度隨著技術(shù)進(jìn)步不斷加快
信息化技術(shù)的普及使得檔案部門(mén)對(duì)檔案的管理工作,由過(guò)去的人工手動(dòng)管理模式轉(zhuǎn)變?yōu)樾畔⒒?、網(wǎng)絡(luò)化的收、管、用業(yè)務(wù)流程管理模式[8]。時(shí)效性和便捷性是大數(shù)據(jù)時(shí)代檔案管理工作的兩大特點(diǎn):第一,互聯(lián)網(wǎng)上的信息更新的速度都會(huì)很快,特別是那些有用的信息,若無(wú)法將它們快速地抓取出來(lái),這些信息便難覓蹤影;第二,為了更好地滿足用戶的需求,檔案員應(yīng)該快速地從海量的檔案中提取用戶想要的信息。怎樣才能夠快速地提取出用戶想要的信息呢?云計(jì)算技術(shù)是大數(shù)據(jù)背景下檔案部門(mén)亟須學(xué)習(xí)和掌握的一項(xiàng)技術(shù)[9]。云計(jì)算技術(shù)基于互聯(lián)網(wǎng)技術(shù),利用各種精密的算法,在大幅度提高檔案資源處理速度的同時(shí),提高查找的準(zhǔn)確度。
3 大數(shù)據(jù)技術(shù)發(fā)展對(duì)檔案資源體系建設(shè)影響之三:收集方式更多了
在實(shí)際工作中,一些單位總是借故拖延或是從未積極主動(dòng)地把檔案移交給檔案館。修訂后的檔案法賦予了檔案行政管理部門(mén)強(qiáng)制執(zhí)行檔案收集移交的權(quán)利,也從法律層面明確了違法違規(guī)人員和行為的法律責(zé)任。但這依然屬于傳統(tǒng)的檔案收集模式,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,大數(shù)據(jù)技術(shù)給檔案管理帶來(lái)了新的檔案收集方式:實(shí)時(shí)捕捉[10]。
互聯(lián)網(wǎng)可謂是深入到每個(gè)人的日常生活當(dāng)中,它所蘊(yùn)含的信息具有數(shù)量大、更新快、傳播廣的特點(diǎn)。這給大數(shù)據(jù)時(shí)代下的檔案收集工作提出了新的挑戰(zhàn)。對(duì)于檔案員而言,是否能夠捕捉到有價(jià)值的信息并將其歸檔,是對(duì)檔案員業(yè)務(wù)能力和操作水平的檢驗(yàn)[11]。檔案部門(mén)應(yīng)該轉(zhuǎn)變過(guò)去那種“等人送上門(mén)”的檔案收集辦法,利用云計(jì)算技術(shù),實(shí)時(shí)抓取互聯(lián)網(wǎng)上有用的信息,使檔案資源動(dòng)態(tài)化,不斷提高互聯(lián)網(wǎng)信息資源抓取的科學(xué)性、準(zhǔn)確性[12]。
結(jié)語(yǔ)
人類進(jìn)入二十一世紀(jì)之后,人們的生活受到計(jì)算機(jī)技術(shù)的影響越來(lái)越大,第三次技術(shù)革命之后產(chǎn)生的信息產(chǎn)業(yè)技術(shù)越來(lái)越快發(fā)展,技術(shù)進(jìn)步帶來(lái)的大數(shù)據(jù)技術(shù)更是突飛猛進(jìn)。時(shí)至今日,信息產(chǎn)業(yè)技術(shù)特別是計(jì)算機(jī)技術(shù)的影響已經(jīng)深入經(jīng)濟(jì)社會(huì)生活的方方面面,無(wú)論是朝陽(yáng)產(chǎn)業(yè)還是夕陽(yáng)產(chǎn)業(yè),都在寄希望于能夠利用信息產(chǎn)業(yè)技術(shù)或者計(jì)算機(jī)技術(shù)促進(jìn)本行業(yè)本產(chǎn)業(yè)的技術(shù)革新,都在思考如何利用大數(shù)據(jù)技術(shù)為本行業(yè)本產(chǎn)業(yè)服務(wù),都在尋找與大數(shù)據(jù)技術(shù)融合的最佳結(jié)合點(diǎn)。檔案事業(yè)是基礎(chǔ)性事業(yè),也是服務(wù)性事業(yè),檔案工作者要思考如何與大數(shù)據(jù)技術(shù)融合發(fā)展,既要發(fā)揮檔案事業(yè)基礎(chǔ)性工作、服務(wù)性工作的特性,為大數(shù)據(jù)技術(shù)產(chǎn)業(yè)發(fā)展服務(wù),發(fā)揮檔案為科學(xué)研究科技進(jìn)步提供基礎(chǔ)數(shù)據(jù)服務(wù)的作用;又要利用大數(shù)據(jù)技術(shù)發(fā)展促進(jìn)自身發(fā)展,利用大數(shù)據(jù)技術(shù)促進(jìn)檔案管理工作提高效率、降低成本,進(jìn)一步利用大數(shù)據(jù)技術(shù)提高檔案服務(wù)工作水平,做到超前服務(wù)、精準(zhǔn)服務(wù)和個(gè)性化需求服務(wù)。本文從來(lái)源、內(nèi)容和收集三個(gè)方面總結(jié)了大數(shù)據(jù)技術(shù)發(fā)展對(duì)檔案資源體系建設(shè)具有重大影響,希望能夠引起檔案管理人員的注意,引起大家的共鳴,共同研究大數(shù)據(jù)技術(shù)發(fā)展對(duì)檔案資源體系建設(shè)的意義,揚(yáng)其所長(zhǎng),避其所短,讓大數(shù)據(jù)技術(shù)為檔案資源體系建設(shè)賦能。
參考文獻(xiàn)
[1]陳如明.大數(shù)據(jù)時(shí)代的挑戰(zhàn):價(jià)值與應(yīng)對(duì)策略[J].移動(dòng)通信,2012(17):14.
[2]劉佳麗.數(shù)字時(shí)代紅色檔案資源開(kāi)發(fā)利用策略研究[J].檔案天地,2022(05):50-51+14.
[3]于秀.大數(shù)據(jù)背景下檔案管理“價(jià)值鏈”的生成研究[J].文化產(chǎn)業(yè),2022(12):100-102.
[4]董中印.大數(shù)據(jù)時(shí)代檔案信息資源開(kāi)發(fā)芻議[J].黑龍江檔案,2022(02):95-97.
[5]趙卉.大數(shù)據(jù)指導(dǎo)下對(duì)辦公室檔案管理工作的創(chuàng)新研究[J].辦公自動(dòng)化,2022,27(02):44-46.
[6]舒瓊.探究大數(shù)據(jù)時(shí)代下的檔案管理工作[J].山西青年,2021(24):65-66.
[7]李文瓊.大數(shù)據(jù)挖掘技術(shù)在高校檔案管理中的運(yùn)用[J].鄭州鐵路職業(yè)技術(shù)學(xué)院學(xué)報(bào),2021,33(04):106-107+112.DOI:10.13920/j.cnki.zztlzyjsxyxb.2021.04.032.
[8]董繼紅.大數(shù)據(jù)背景下檔案管理發(fā)展及趨勢(shì)分析[J].蘭臺(tái)內(nèi)外,2021(35):10-12.
[9]馮華.大數(shù)據(jù)時(shí)代檔案管理的機(jī)遇與挑戰(zhàn)[J].當(dāng)代工人(C版),2021(05):94-95.
[10]曲晶瑤.大數(shù)據(jù)視域下檔案信息建設(shè)發(fā)展研究動(dòng)態(tài)研判[J].蘭臺(tái)世界,2021(10):110-114.DOI:10.16565/j.cnki.1006-7744.2021.10.29.
[11]楊爽.淺談大數(shù)據(jù)時(shí)代檔案管理工作存在的問(wèn)題與對(duì)策[J].蘭臺(tái)內(nèi)外,2021(27):64-65.
[12]王迎.基于大數(shù)據(jù)時(shí)代的檔案信息(下接65頁(yè))
(上接62頁(yè))管理研究[J].無(wú)線互聯(lián)科技,2021,18(18):33-34.
[13]盤(pán)活存量 優(yōu)化增量 做強(qiáng)變量 提升質(zhì)量 整體推進(jìn)檔案資源體系建設(shè)[J].四川檔案,2022(02):26-27.
[14]加小雙,姚靜.數(shù)字人文賦能檔案資源體系建設(shè):機(jī)制與路徑[J/OL].山西檔案:1-9[2022-07-10].http://kns.cnki.net/kcms/detail/14.1162.g2.20220227.1215.002.html
[15]張騰華.建立適合鄉(xiāng)村發(fā)展的檔案資源管理體系思考[J].黑龍江檔案,2022(01):108-110.
[16]倪代川,蔡麗華.數(shù)字檔案資源文化軟實(shí)力建設(shè)探析[J].山西檔案,2021(06):31-37+14.
[17]李晉.運(yùn)用大數(shù)據(jù)技術(shù)加強(qiáng)干部人事檔案資源體系建設(shè)[J].數(shù)據(jù),2021(12):66-67.
[18]劉凱,肖向華,霍艷芳,霍紅霞,馬立偉,李潔.“十四五”時(shí)期檔案學(xué)專業(yè)教材資源體系的構(gòu)建研究[J].檔案學(xué)通訊,2021(06):100-102.DOI:10.16113/j.cnki.daxtx.2021.06.011.
[19]楊帆.國(guó)有企業(yè)檔案資源體系構(gòu)建研究[J].浙江檔案,2021(08):28-30.DOI:10.16033/j.cnki.33-1055/g2.2021.08.010.
[20]王麗茹.地方綜合檔案館館藏資源體系建設(shè)的思考[J].蘭臺(tái)內(nèi)外,2021(21):44-45.
[21]郭成斌,陳永楠,李珒,杜貞.社會(huì)治理視域下高??萍紕?chuàng)新檔案資源體系構(gòu)建[J].浙江檔案,2021(05):57-59.DOI:10.16033/j.cnki.33-1055/g2.2021.05.022.
[22]朱建邦,王巧玲,謝永憲.國(guó)家治理時(shí)代我國(guó)檔案資源整體治理體系構(gòu)建研究[J].檔案學(xué)研究,2021(02):20-25.DOI:10.16065/j.cnki.issn1002-1620.2021.02.003.
[23]劉芳.檔案資源體系建設(shè)研究[J].機(jī)電兵船檔案,2021(02):39-40.
[24]秦敏.檔案信息化背景下高校檔案資源體系建設(shè)[J].辦公自動(dòng)化,2021,26(02):53-54+47.
[25]宋璇.運(yùn)用大數(shù)據(jù)技術(shù)加強(qiáng)干部人事檔案資源體系建設(shè)[J].辦公室業(yè)務(wù),2020(02):161+168.
作者簡(jiǎn)介:侯作龍,本科學(xué)歷,通榆縣債務(wù)管理服務(wù)中心館員;吳磊,本科學(xué)歷,白山市江源區(qū)機(jī)關(guān)事務(wù)服務(wù)中心職員。