賈曉楠 遼寧科技學(xué)院
隨著互聯(lián)網(wǎng)時代的來臨,信息的爆炸式增長,海量數(shù)據(jù)成為了資源,我國貴州省貴陽市成立了全國首個大數(shù)據(jù)交易所。大數(shù)據(jù)的背景下,檔案學(xué)會朝著什么方向發(fā)展,這是本文的研究重點(diǎn)。通過對大數(shù)據(jù)的分析和檔案學(xué)自身的學(xué)科發(fā)展特點(diǎn)的分析,提出大數(shù)據(jù)的時代下檔案學(xué)的發(fā)展趨勢。
古人為了保存能夠?yàn)楹蟠陌l(fā)展提供幫助的經(jīng)驗(yàn)而出現(xiàn)了檔案。隨著時間的流逝,檔案占據(jù)著越來越重要的地位,在國家的發(fā)展過程中發(fā)揮著巨大的作用,今天的檔案學(xué)已經(jīng)成為了不可或缺的學(xué)科,對檔案信息資源的管理開發(fā)、原則方法等的研究已經(jīng)成為今天大量檔案信息資源必須進(jìn)行的一項(xiàng)工作。今天的檔案學(xué)面臨的主要問題是海量的信息資源如何管理、開發(fā)。
《大數(shù)據(jù)時代》一書認(rèn)為大數(shù)據(jù)包含四個主要的特征:大量、高速、多樣、價(jià)值。這四個特征對于理解大數(shù)據(jù)的基本內(nèi)涵是有很大幫助的。綜合這四個主要的特征,大數(shù)據(jù)指的是在信息化社會里產(chǎn)生大量的信息數(shù)據(jù),這些數(shù)據(jù)是多樣化、高速產(chǎn)生的,需要通過新的思路和管理運(yùn)作方式才能將這些海量數(shù)據(jù)變成信息資產(chǎn),產(chǎn)生巨大的價(jià)值。在大數(shù)據(jù)時代,海量數(shù)據(jù)只是表面現(xiàn)象,更多的是這些數(shù)據(jù)的處理方式背后的新思維,這才是大數(shù)據(jù)時代的核心,這也是目前眾多學(xué)者研究的熱點(diǎn)問題。
檔案學(xué)的研究對象是檔案現(xiàn)象及其本質(zhì)與規(guī)律,檔案范疇的變化,檔案意義的數(shù)據(jù)在社會各個領(lǐng)域發(fā)揮價(jià)值,都促使檔案學(xué)者開始思考大數(shù)據(jù)時代檔案管理與服務(wù)的新模式。首先,作為資源的大數(shù)據(jù)中包含了電子文件在內(nèi)的檔案意義的數(shù)字資源,其中很多超出了我們目前檔案信息資源管理領(lǐng)域探討的資源形式。其次,在這種資源形式基礎(chǔ)上進(jìn)行的檔案活動很多是我們以往未曾預(yù)料的新現(xiàn)象。最后,就像電子文件時代檔案學(xué)研究內(nèi)容的擴(kuò)展一樣,大數(shù)據(jù)特性帶來的技術(shù)、設(shè)備、平臺、制度等,都要求檔案學(xué)者進(jìn)一步研究,這些研究將極大程度地豐富檔案學(xué)。本質(zhì)上,在檔案學(xué)領(lǐng)域探討大數(shù)據(jù),首先是對電子文件管理和檔案信息化研究領(lǐng)域的擴(kuò)展:但由于其理念的革命性,大數(shù)據(jù)很有可能會對檔案學(xué)核心理論體系帶來巨大的撼動。
方法論研究是科學(xué)研究的重要基礎(chǔ),檔案學(xué)研究方法論是檔案學(xué)研究的重要方面。以大數(shù)據(jù)為基礎(chǔ)的數(shù)據(jù)密集型科學(xué)研究,無需模型就可以通過數(shù)據(jù)挖掘出可靠的新模式、新知識、新規(guī)律,微軟發(fā)布了《第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)》論文集對此進(jìn)行解釋。
計(jì)算社會科學(xué)(Computational Social Science)是基于特定社會需求在特定的社會理論指導(dǎo)下,收集、整理和分析數(shù)據(jù)足跡(data print)以便進(jìn)行社會解釋、監(jiān)控、預(yù)測與規(guī)劃的過程和活動。
檔案學(xué)的研究尚以理性思辨或?qū)嵶C考查為主,而隨著數(shù)字人文等上述以數(shù)據(jù)聯(lián)系為基礎(chǔ)的研究方法論的出現(xiàn),也將彌補(bǔ)檔案學(xué)研究中存在的遺憾,甚至推翻原有的一些曾被認(rèn)為是真理的理論。例如在檔案推廣評價(jià)研究中,目前主要基于”是否開展“”展示量“”人次“等被動數(shù)據(jù)作為支撐,而如果擁有大數(shù)據(jù),研究者則可以充分挖掘參與檔案推廣活動的受眾用戶相關(guān)數(shù)據(jù),獲得用戶對活動的評價(jià)及傳播力等,建立更為科學(xué)的體系來評價(jià)活動價(jià)值和尋找問題的解決辦法。我國檔案學(xué)研究正在從定性走向定量”射,大數(shù)據(jù)時代的到來,為檔案學(xué)研究方法提供了更多的選擇,甚至可能實(shí)現(xiàn)“以嚴(yán)格的學(xué)術(shù)研究取代目前常用的經(jīng)驗(yàn)總結(jié)和定性判斷”。
檔案工作主要為“八項(xiàng)內(nèi)容”和“兩大方面”,“管”和“用”這兩方面一直是檔案管理理論研究的重要課題。由于物質(zhì)技術(shù)條件、社會條件的限制,“卷”被作為早期檔案管理的基本單位,但隨著檔案數(shù)量的急劇增加、檔案類型的繁多、檔案工作重心轉(zhuǎn)向利用為主,在技術(shù)條件允許的情況下,立卷改革后檔案管理逐漸以“件”作為基本單位,這一改革使得檔案管理更加科學(xué)。而隨著大數(shù)據(jù)時代到來,以“件”為單位的方法可能仍然無法適應(yīng)實(shí)際中的某些特殊情況,大數(shù)據(jù)有即時性、碎片化、非結(jié)構(gòu)化等特征,很多數(shù)據(jù)的出現(xiàn)不能以“件”論之,它們有的還可以分拆,有的甚至難以用某一個量詞來形容。而大數(shù)據(jù)對檔案資源本身的組織形式的依賴性也將進(jìn)一步弱化,依靠智能化的檢索和挖掘技術(shù),從大數(shù)據(jù)中挖掘出有用信息不再需要較為嚴(yán)格的組織形式,例如,在文本挖掘中,常常以句段,甚至是字、詞或詞組作為知識來源,傳統(tǒng)以全宗為檔案組織形式的管理模式甚至可能束縛新技術(shù)的挖掘能力。因此,未來以“條”或其他更小的單位作為檔案管理的基本單位將成為可能。同時,檔案利用工作也可能發(fā)生變化。傳統(tǒng)模式下,檔案利用以“檢索”作為一切利用和服務(wù)的基礎(chǔ),無論從最初的人工服務(wù)方式,還是發(fā)展后的檔案信息系統(tǒng)服務(wù)方式,要對檔案信息進(jìn)行利用和開發(fā),都無法繞過檢索活動。而進(jìn)入大數(shù)據(jù)時代,以符合用戶需求的即時性快速精準(zhǔn)的信息推送模式,或?qū)⒊蔀槲磥硇畔⒎?wù)的主要方式,檔案信息服務(wù)的底層基礎(chǔ)可能不再是檢索,而是智能化的數(shù)據(jù)挖掘。檔案信息資源的價(jià)值將在大數(shù)據(jù)技術(shù)的支持下得到最大程度的釋放。這些新的變化,將促進(jìn)檔案學(xué)者對檔案工作模式的進(jìn)一步探索。
檔案事業(yè),作為典型的數(shù)據(jù)管理活動之一,勢必會受到大數(shù)據(jù)理念的影響。盡管檔案大數(shù)據(jù)技術(shù)的研究還處于起步階段,依然面臨諸多問題和爭議,但檔案信息中蘊(yùn)涵的巨大的知識寶藏,應(yīng)該盡快得到深入的開發(fā)和利用,這就需要政府、企業(yè)、高校等機(jī)構(gòu)檔案工作者、檔案研究人員、檔案行政管理人員、IT信息技術(shù)從業(yè)者通力配合,建立創(chuàng)新服務(wù)理念、充分采用新的技術(shù),把檔案的“死”的數(shù)據(jù)變成“活的信息”。