劉彩云
一、概述
高校檔案資源作為國(guó)家檔案資源的有機(jī)組成部分,其檔案資源體系建設(shè)對(duì)保障國(guó)家基礎(chǔ)性戰(zhàn)略資源具有重要意義,如何轉(zhuǎn)變高校檔案工作的理念、技術(shù)、方法及模式,加強(qiáng)大數(shù)據(jù)環(huán)境下高校檔案資源體系建設(shè)是高校檔案館面臨的挑戰(zhàn)。
1.概念界定
在大數(shù)據(jù)環(huán)境下,“檔案數(shù)據(jù)”這一術(shù)語(yǔ)出現(xiàn)在學(xué)術(shù)研究中的頻率越來(lái)越高,探討高校檔案資源體系建設(shè)需要厘清“檔案數(shù)據(jù)”的概念。上海大學(xué)圖書(shū)情報(bào)檔案系副主任于英香指出:“對(duì)檔案數(shù)據(jù)的界定除了從檔案和數(shù)據(jù)本身出發(fā),還須注意兩方面的問(wèn)題:一是檔案數(shù)據(jù)應(yīng)與檔案信息(資源)區(qū)分,二是重新認(rèn)識(shí)內(nèi)容管理在檔案數(shù)據(jù)管理中的地位”。同時(shí),學(xué)者王金玲提出:“檔案數(shù)據(jù)在傳統(tǒng)意義上主要指與檔案自身相關(guān)的目錄數(shù)據(jù)和全文數(shù)據(jù),并進(jìn)一步將大數(shù)據(jù)環(huán)境下的檔案數(shù)據(jù)劃分為檔案目錄信息資源、檔案內(nèi)容信息資源、多媒體信息資源、檔案應(yīng)用信息資源、檔案實(shí)體信息資源以及檔案館庫(kù)信息資源六個(gè)大類”。綜合兩位學(xué)者的a觀點(diǎn),本文所提及的“檔案資源”為廣義的檔案資源,包括檔案本身和大數(shù)據(jù)環(huán)境下新技術(shù)應(yīng)用于高校教學(xué)、科研等各項(xiàng)工作所形成的多媒體信息、應(yīng)用信息等檔案數(shù)據(jù)。
2.大數(shù)據(jù)環(huán)境下高校檔案資源體系建設(shè)的必要性
一方面,在檔案信息化與互聯(lián)網(wǎng)利用成為大勢(shì)所趨的背景下,結(jié)合新技術(shù)加強(qiáng)檔案資源體系建設(shè)、提供優(yōu)質(zhì)服務(wù)是高校檔案館在大數(shù)據(jù)環(huán)境下實(shí)現(xiàn)轉(zhuǎn)型發(fā)展、化挑戰(zhàn)為機(jī)遇的契機(jī)。
另一方面,自2008年IBM公司提出“智慧地球”概念以來(lái),全球掀起了智慧城市建設(shè)的浪潮,高等學(xué)校在智慧地球、智慧城市的帶動(dòng)下開(kāi)始建設(shè)智慧校園,高校OA系統(tǒng)、教務(wù)系統(tǒng)、財(cái)務(wù)系統(tǒng)等的建設(shè)與推廣驅(qū)動(dòng)了大量電子檔案的生成,探索高校檔案資源體系建設(shè)是融入智慧校園發(fā)展大局、順應(yīng)檔案信息化發(fā)展大勢(shì)、打造高校智慧檔案館的發(fā)展需要。
3.大數(shù)據(jù)環(huán)境下高校檔案資源體系建設(shè)的可行性
其一,大數(shù)據(jù)環(huán)境下開(kāi)展高校檔案資源體系建設(shè)具有政策支持。在宏觀層面,改革開(kāi)放不斷深入和現(xiàn)代化進(jìn)程加快,“四個(gè)全面”戰(zhàn)略布局、國(guó)家大數(shù)據(jù)發(fā)展戰(zhàn)略、“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃的推進(jìn)等措施對(duì)信息化建設(shè)進(jìn)行了頂層設(shè)計(jì)。微觀層面而言,《全國(guó)檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》將檔案資源多樣化、檔案管理信息化作為發(fā)展目標(biāo),全面推進(jìn)檔案資源存量數(shù)字化、增量電子化、利用網(wǎng)絡(luò)化,為高校檔案資源體系建設(shè)指明了任務(wù)落實(shí)方向。
其二,大數(shù)據(jù)環(huán)境下開(kāi)展高校檔案資源體系建設(shè)具有技術(shù)保障。例如,云計(jì)算為高效率、低成本完成大容量、異構(gòu)復(fù)雜數(shù)據(jù)計(jì)算提供了有效方式,數(shù)據(jù)挖掘技術(shù)為有效解決從數(shù)據(jù)到知識(shí)的轉(zhuǎn)化提供了可能,數(shù)據(jù)可視化以及虛擬現(xiàn)實(shí)技術(shù)的應(yīng)用為用戶理解和感知信息提供了便利。此外,物聯(lián)網(wǎng)、人工智能、定位技術(shù)等新興技術(shù)的迅速發(fā)展與融合還將給高校檔案工作帶來(lái)無(wú)限的發(fā)展空間。
二、大數(shù)據(jù)環(huán)境下高校檔案資源的特征
1.檔案資源量大且增速快
高校檔案作為高校開(kāi)展各項(xiàng)工作和舉辦重大活動(dòng)的原始記錄,全方位記錄了高校招生與就業(yè)、教學(xué)改革、國(guó)際合作辦學(xué)、專業(yè)設(shè)置與發(fā)展規(guī)劃、碩士點(diǎn)申報(bào)與審批、博士點(diǎn)申報(bào)與審批等工作的發(fā)展軌跡,隨著改革開(kāi)放的深入,教育事業(yè)的發(fā)展日新月異,在“雙套制”管理制度的推行下,紙質(zhì)檔案數(shù)字化成果和增量電子檔案呈現(xiàn)出快速、大量增長(zhǎng)的趨勢(shì)。
2.檔案資源類型多元化
高校檔案館檔案資源類型多元化特征體現(xiàn)為結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)并存。在保存?zhèn)鹘y(tǒng)的、經(jīng)整理有序的紙質(zhì)檔案的同時(shí),文檔、圖片、音頻、視頻、實(shí)物等載體多樣、形式各異的異構(gòu)數(shù)據(jù)也源源不斷進(jìn)館,呈現(xiàn)出Doc、Pdf、Tiff、Txt、PPT、JPG、PNG、MP3、WAV、MPG、AVI等多種類型。
3.檔案資源具有高價(jià)值
與大數(shù)據(jù)環(huán)境下大部分信息資源價(jià)值總量高、價(jià)值密度低的特點(diǎn)不同,“檔案歸檔鑒定使檔案數(shù)據(jù)的價(jià)值密度高于沒(méi)有經(jīng)過(guò)鑒定的一般性數(shù)據(jù),檔案是一種大數(shù)據(jù)‘富礦”,檔案是經(jīng)過(guò)人為鑒定、整理、歸檔的原始記錄,相對(duì)其它信息而言,檔案的原始記錄性決定了其具有較高的價(jià)值并隨著檔案利用工作的深入而逐漸遞增。
三、大數(shù)據(jù)環(huán)境下高校檔案資源體系建設(shè)存在的問(wèn)題
1.檔案資源采集對(duì)象定位狹窄
首先,高校檔案館當(dāng)前采取以實(shí)體檔案為主、輔以“雙套制”歸檔的管理模式,關(guān)注點(diǎn)仍局限于傳統(tǒng)紙質(zhì)檔案與部分電子文件的收集,難以滿足大數(shù)據(jù)環(huán)境下大量電子文件快速增長(zhǎng)的管理與利用需求。其次,各大高校檔案館在對(duì)檔案信息化建設(shè)的探索中未能高度重視檔案數(shù)據(jù)的管理,“檔案部門關(guān)注的是海量數(shù)據(jù)信息儲(chǔ)存的軟硬件系統(tǒng)建設(shè),尤其側(cè)重硬件方面的配置。而對(duì)于維護(hù)業(yè)務(wù)系統(tǒng)正常運(yùn)轉(zhuǎn)的日志數(shù)據(jù)、數(shù)據(jù)庫(kù)軟件系統(tǒng)支撐數(shù)據(jù)以及各種安全密鑰等數(shù)據(jù)的管理尚未引起重視”。因此,在大數(shù)據(jù)環(huán)境下,高校檔案資源采集對(duì)象的定位有待擴(kuò)展。
2.檔案資源采集來(lái)源渠道單一
高校實(shí)行檔案材料形成單位、課題組立卷的歸檔制度,檔案資源來(lái)源于黨群、行政、教輔、科研等各部門及各院系,其采集渠道主要包括三種:一是材料形成單位傳統(tǒng)立卷歸檔,這部分為紙質(zhì)、音頻、視頻、實(shí)物等類型的檔案;二是信息化建設(shè)下通過(guò)接口與檔案管理系統(tǒng)連接、在線立卷歸檔的各部門(各院系)辦公系統(tǒng),如行政OA系統(tǒng)、財(cái)務(wù)系統(tǒng)、教務(wù)系統(tǒng)、科研系統(tǒng)等,這部分為電子檔案;三是開(kāi)展檔案征集或捐贈(zèng)活動(dòng)。從采集對(duì)象來(lái)看,這三種渠道所采集到的檔案資源關(guān)注點(diǎn)仍主要為狹義上的檔案資源,忽視了相應(yīng)檔案數(shù)據(jù)的采集與管理,從采集范圍來(lái)看,這三種渠道所采集到的檔案資源難以覆蓋學(xué)校網(wǎng)站、社交媒體等來(lái)源的信息。因此,在大數(shù)據(jù)環(huán)境下,高校檔案資源采集渠道有待擴(kuò)展。
3.檔案資源采集技術(shù)有待提高
在大數(shù)據(jù)環(huán)境下,對(duì)海量數(shù)據(jù)價(jià)值的關(guān)注度不斷提升,檔案資源作為價(jià)值高且價(jià)值密度高的特殊數(shù)據(jù),各類檔案資源之間的內(nèi)在關(guān)系亟待進(jìn)一步挖掘分析,如何運(yùn)用好大數(shù)據(jù)環(huán)境下的新興技術(shù)對(duì)檔案資源開(kāi)展深度挖掘與分析是各個(gè)檔案部門需要深思的課題。由于建設(shè)成本不足、技術(shù)突破困難、人才欠缺等多方面原因,高校檔案資源體系建設(shè)側(cè)重于館藏紙質(zhì)檔案的數(shù)字化、增量電子檔案的采集與存儲(chǔ),缺乏檔案資源精細(xì)化管理,提供的檔案服務(wù)利用層次淺,難以開(kāi)展大數(shù)據(jù)環(huán)境下對(duì)檔案資源“富礦”價(jià)值的挖掘。
4.檔案資源存儲(chǔ)處理效率較低
檔案的非現(xiàn)行性決定了檔案工作本身具有滯后性,但在大數(shù)據(jù)環(huán)境下,智慧校園的建設(shè)產(chǎn)生了大量類型多樣、結(jié)構(gòu)各異的數(shù)據(jù),這些數(shù)據(jù)最終有可能部分、甚至全部轉(zhuǎn)化為檔案資源,如何實(shí)時(shí)存儲(chǔ)和處理這些異構(gòu)的檔案資源是高校檔案信息化建設(shè)適應(yīng)大數(shù)據(jù)發(fā)展趨勢(shì)需要解決的難題。高校檔案信息化管理手段還未覆蓋檔案管理的全流程,對(duì)潛在檔案資源的存儲(chǔ)與處理相對(duì)滯后,難以滿足大數(shù)據(jù)環(huán)境下高效、快速處理數(shù)據(jù)的需求。
四、大數(shù)據(jù)環(huán)境下高校檔案資源體系建設(shè)發(fā)展對(duì)策
1.轉(zhuǎn)變檔案信息化建設(shè)理念
高校檔案館作為集中統(tǒng)一保管高校檔案資源并提供信息服務(wù)的陣地,轉(zhuǎn)變檔案信息化建設(shè)理念,一要樹(shù)立廣義的“檔案資源”觀念,充分認(rèn)識(shí)大數(shù)據(jù)給檔案資源來(lái)源、數(shù)據(jù)存儲(chǔ)與處理等帶來(lái)的變化,拓展檔案資源體系建設(shè)的外延與內(nèi)涵;二要對(duì)檔案資源體系建設(shè)進(jìn)行長(zhǎng)遠(yuǎn)規(guī)劃,將海量檔案數(shù)據(jù)戰(zhàn)略納入智慧檔案館建設(shè)規(guī)劃,實(shí)現(xiàn)增量檔案電子化、存量檔案數(shù)字化、檔案服務(wù)網(wǎng)絡(luò)化、資源開(kāi)發(fā)深度化、館庫(kù)管理智能化,以信息化促進(jìn)檔案工作現(xiàn)代化。
2.拓寬檔案資源采集范圍
從廣義的檔案資源出發(fā),在大數(shù)據(jù)環(huán)境下必須進(jìn)一步拓寬檔案資源的采集范圍,除了傳統(tǒng)檔案資源的收集,“對(duì)實(shí)時(shí)產(chǎn)生的具有證據(jù)價(jià)值、信息價(jià)值、服務(wù)價(jià)值的數(shù)據(jù)都應(yīng)該進(jìn)行有效管理”。高校檔案館開(kāi)展館藏紙質(zhì)檔案數(shù)字化、增量電子檔案歸檔的同時(shí),應(yīng)加強(qiáng)對(duì)多媒體信息資源(包括媒體信息、網(wǎng)站信息等)、檔案應(yīng)用信息資源(包括用戶信息、檔案利用信息等)、檔案實(shí)體信息資源(基于RFID電子標(biāo)簽所產(chǎn)生的檔案實(shí)體位置信息、出入庫(kù)信息等資源)、檔案館庫(kù)信息資源(智能化設(shè)備運(yùn)行產(chǎn)生的供電信息、溫濕度信息、安保信息等)等結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化信息資源的采集。
3.推行檔案資源異構(gòu)采集策略
由于大數(shù)據(jù)環(huán)境下的檔案資源類型多樣、結(jié)構(gòu)各異,必須提供多樣化的資源采集方式,實(shí)行異構(gòu)采集策略,以滿足不同檔案資源類型的采集。一方面要加強(qiáng)學(xué)習(xí)智慧檔案館建設(shè)的優(yōu)秀典型案例,吸取先進(jìn)的檔案資源采集經(jīng)驗(yàn),如,青島市檔案館推行的“包含控制中心、魔方適配器、主動(dòng)捕獲引擎、嵌入式工具集和資源池的數(shù)據(jù)魔方式的智慧收集”。另一方面,加強(qiáng)高校檔案人才隊(duì)伍建設(shè),通過(guò)舉辦工作人員培訓(xùn)和引進(jìn)人才,加強(qiáng)對(duì)應(yīng)用接口、數(shù)據(jù)交換引擎自動(dòng)導(dǎo)入、元數(shù)據(jù)方案設(shè)置等前沿智慧采集技術(shù)的學(xué)習(xí)與應(yīng)用,雙管齊下,實(shí)現(xiàn)檔案工作者角色由保管員向知識(shí)組織者的根本轉(zhuǎn)變。
4.加強(qiáng)檔案資源深度挖掘
檔案資源深度挖掘作為檔案資源體系建設(shè)與檔案資源利用體系建設(shè)的連接環(huán)節(jié),是挖掘檔案資源價(jià)值的關(guān)鍵。一方面,加強(qiáng)以高校檔案資源為中心的數(shù)據(jù)挖掘,分析各類檔案資源之間的關(guān)系,發(fā)現(xiàn)檔案資源潛在的大數(shù)據(jù)價(jià)值。另一方面,要開(kāi)展以檔案應(yīng)用信息資源為中心的數(shù)據(jù)內(nèi)在關(guān)聯(lián)挖掘,以此為依據(jù)對(duì)高校檔案用戶搜索、存儲(chǔ)、利用等行為進(jìn)行預(yù)測(cè)分析,推出個(gè)性化推送服務(wù)。
(作者單位:貴州財(cái)經(jīng)大學(xué)檔案館)