葉文玲
一、大數(shù)據(jù)的內(nèi)涵
隨著云計(jì)算等新技術(shù)的更新發(fā)展,人類已經(jīng)進(jìn)入前所未有的信息爆炸時(shí)代,也稱為“大數(shù)據(jù)時(shí)代”。目前,學(xué)術(shù)界對于何謂“大數(shù)據(jù)”還沒形成統(tǒng)一的界定,但都普遍認(rèn)同,大數(shù)據(jù)除了傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),還包括了各種半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),且數(shù)據(jù)體量以指數(shù)級速度增長。在大數(shù)據(jù)的開發(fā)與使用中,關(guān)鍵點(diǎn)不僅僅在于數(shù)據(jù)的收集,更在于對數(shù)據(jù)的進(jìn)一步有效挖掘與整合,并對其進(jìn)行二次開發(fā),提升其自身所包含的價(jià)值。在我國“十三五”規(guī)劃中,明確指出要實(shí)施“國家大數(shù)據(jù)戰(zhàn)略,推進(jìn)數(shù)據(jù)資源開放共享。無疑,在信息化時(shí)代,如何呈現(xiàn)數(shù)據(jù)信息的價(jià)值將是未來社會發(fā)展的重要驅(qū)動力。
從特點(diǎn)上來說,大數(shù)據(jù)具有大容量(Volume)、多樣性(Variety)、速度(Velocity)、真實(shí)性(Veracity)四個(gè)基本特征,在實(shí)際運(yùn)用中還存在著價(jià)值密度低、商業(yè)價(jià)值高的特點(diǎn)。從本質(zhì)上來說,大數(shù)據(jù)其實(shí)就是信息管理者在當(dāng)今信息技術(shù)條件下,通過對真實(shí)數(shù)據(jù)的挖掘與分析,形成各種有附加價(jià)值的元數(shù)據(jù)為相關(guān)使用者提供判斷及決策的依據(jù)。高校檔案管理工作就是對高校檔案信息的分析、整合、存儲和利用,是一種典型的信息管理活動,本文結(jié)合大數(shù)據(jù)運(yùn)用的時(shí)代背景,分析大數(shù)據(jù)運(yùn)用在當(dāng)前高校檔案管理中所面臨的種種問題,有針對性的提出解決的建議,為高校檔案工作大數(shù)據(jù)化提供依據(jù)。
二、大數(shù)據(jù)時(shí)代背景下高校檔案資源管理數(shù)字化的需求分析
高校檔案是指“高等學(xué)校從事招生、教學(xué)、科研、管理等活動直接形成的對學(xué)生、學(xué)校和社會有保存價(jià)值的各種文字、圖表、聲像等不同形式、載體的歷史記錄。邁入信息化時(shí)代以來,隨著辦公自動化系統(tǒng)(OA系統(tǒng))、財(cái)務(wù)管理系統(tǒng)、學(xué)籍管理系統(tǒng)、一卡通系統(tǒng)等數(shù)字化校園項(xiàng)目的不斷普及,高校的各類檔案已經(jīng)從過去的單一紙質(zhì)材料為主要載體轉(zhuǎn)變?yōu)橐愿黝愋畔?shù)據(jù)為主要載體,高校日常所形成的各類檔案文件也已經(jīng)呈現(xiàn)數(shù)字化、海量化的趨勢,這種趨勢對于檔案工作來說既是一種挑戰(zhàn),也是一種機(jī)遇。高校檔案管理工作要抓住大數(shù)據(jù)時(shí)代的發(fā)展的契機(jī),著力于對檔案數(shù)據(jù)的分析、挖掘與整合,結(jié)合當(dāng)今高校檔案資源全球化、云端化的趨勢,使得高校檔案管理工作更上一個(gè)臺階。與此同時(shí),國務(wù)院也于2015年10月份印發(fā)了《統(tǒng)籌推進(jìn)世界一流大學(xué)和一流學(xué)科建設(shè)總體方案》,提出加快建成一批世界一流大學(xué)和一流學(xué)科戰(zhàn)略,提升我國高等教育綜合實(shí)力和國際競爭力。在此背景之下,檔案工作如何在創(chuàng)“雙一流”的過程中結(jié)合大數(shù)據(jù)技術(shù)的運(yùn)用,對教學(xué)實(shí)踐和科學(xué)研究起到推動作用,為相關(guān)決策者更好的提供支持與依據(jù)的相關(guān)研究更顯得尤為必要。
三、大數(shù)據(jù)時(shí)代背景下高校檔案資源管理的現(xiàn)狀和存在的問題
1、檔案信息資源分散及不足
由于高校內(nèi)各部門的職能歸屬、管理標(biāo)準(zhǔn)沒有統(tǒng)一標(biāo)準(zhǔn),造成高校在招生、教研、管理等方面產(chǎn)生的海量的信息數(shù)據(jù)絕大部分都是以各自為政的方式進(jìn)行分散式收集,同時(shí)由于各信息化系統(tǒng)的數(shù)據(jù)庫標(biāo)準(zhǔn)筆譯,無法以一個(gè)統(tǒng)一的標(biāo)準(zhǔn)對信息進(jìn)行匯總,更無法發(fā)揮大數(shù)據(jù)的挖掘與二次開發(fā)的技術(shù)優(yōu)勢。
此外,由于資源有限等原因,高校檔案目前的收集范圍往往僅針對于一些重要的、形成成果的教學(xué)科研檔案進(jìn)行留存歸檔,而對于一些未有結(jié)果或者難以突破的檔案則通常未列入收集范圍;與此同時(shí),由于高校的教學(xué)、科研項(xiàng)目存在檔案形成周期長,資料種類繁雜等原因,導(dǎo)致許多檔案資料在項(xiàng)目實(shí)施過程中出現(xiàn)遺失的情況。這種情況的出現(xiàn)嚴(yán)重破壞了檔案工作中關(guān)于完整性和連續(xù)性的基本要求。
2、檔案管理方式落后
邁入信息化時(shí)代以后,隨著數(shù)字化校園各子項(xiàng)目的不斷投入使用,高校目前的各類檔案資源都開始從“實(shí)體化”向“數(shù)字化”轉(zhuǎn)變。但本文通過對多家高校的檔案管理方式進(jìn)行研究后發(fā)現(xiàn),目前許多高校的檔案管理方式及思維方式仍保留在“實(shí)體化”的階段,館藏資源基本還是以傳統(tǒng)介質(zhì)的實(shí)體檔案為主,數(shù)字化的檔案資源仍然比較匱乏。除此以外,在許多僅有的數(shù)字化檔案資源中,主要也是以光盤資源等結(jié)構(gòu)化的信息為主,未對類似圖片、XML,HTML、各類報(bào)表、圖像和音頻/視頻信息等的半結(jié)構(gòu)或非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行收集和分析,沒有發(fā)揮大數(shù)據(jù)化所提倡的數(shù)據(jù)挖掘和二次開發(fā)作用。
3、高校檔案藏用并重意識不強(qiáng),服務(wù)價(jià)值缺失
目前,高校檔案館處于資源管理的模式,仍然存在“重藏輕用”的問題,檔案管理者只注重對檔案資源進(jìn)行有效歸檔,僅部分學(xué)校開展了館藏檔案的數(shù)字化,以方便檔案利用者的利用,但如何使館藏檔案轉(zhuǎn)化為信息資源的能力不夠,缺乏綜合數(shù)據(jù)挖掘和深度整合,使得最有價(jià)值的檔案資源處于休眠狀態(tài)。然而,在大數(shù)據(jù)時(shí)代,數(shù)字資源建設(shè)和數(shù)字資源服務(wù)是不可分割的,檔案資源建設(shè)是以收藏為主要任務(wù),資源利用服務(wù)為根本目的,隨著國家、社會組織和個(gè)人對高校檔案信息的需求日益增大,檔案部門傳統(tǒng)的服務(wù)模式已經(jīng)不能滿足大數(shù)據(jù)時(shí)代日益增長的檔案信息需求。所以,各高校檔案館應(yīng)該樹立藏用并重意識,實(shí)現(xiàn)由“檔案管理者”向“信息專家”的角色轉(zhuǎn)變,尤其是在海量的檔案信息中,根據(jù)利用者的檔案價(jià)值需求,快速地挖掘出有用的檔案信息。
四、大數(shù)據(jù)時(shí)代背景下推進(jìn)高校檔案資源管理建設(shè)的有效策略
1、轉(zhuǎn)變觀念,做好檔案資源收集“前端控制”,建立“大檔案”、“大服務(wù)”檔案觀
高校檔案工作想要得到一個(gè)質(zhì)的飛躍,首先得樹立“大檔案”、“大服務(wù)”檔案觀,這兩個(gè)概念是高校檔案工作未來發(fā)展的重要取向。要樹立“大檔案”、“大服務(wù)”檔案觀也就是要樹立新的檔案資源觀,在思想認(rèn)識層面,強(qiáng)調(diào)學(xué)校所有的教職員工要全部自覺參與檔案工作,并充分利用現(xiàn)代化裝備和數(shù)字化技術(shù)擴(kuò)大數(shù)據(jù)總量。
要實(shí)現(xiàn)“大檔案”管理模式,首先需要在現(xiàn)有管理模式基礎(chǔ)上在完善原有的歸檔范圍和過程所存在的的“漏存、不存”問題,然后進(jìn)一步擴(kuò)大存儲對象的范圍,把以前沒重視或收集的類似圖片、數(shù)據(jù)、圖像和音頻/視頻信息等的半結(jié)構(gòu)或非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行收集。通過豐富館藏內(nèi)容,逐步實(shí)現(xiàn)資源結(jié)構(gòu)的合理化建設(shè),為實(shí)現(xiàn)檔案大數(shù)據(jù)挖掘和二次開發(fā)奠定基礎(chǔ)。endprint
要實(shí)現(xiàn)“大服務(wù)”檔案觀,則是要重點(diǎn)針對現(xiàn)有檔案工作所存在的“重藏輕用”的問題進(jìn)行改善。在這個(gè)過程中,首先需要扭轉(zhuǎn)的是檔案工作者關(guān)于自身的定位,在大數(shù)據(jù)檔案工作時(shí)代,檔案管理者的身份應(yīng)當(dāng)從“文件保管員”逐步向知識信息提供者和創(chuàng)造者”轉(zhuǎn)變,高校檔案管理部門要學(xué)會充分利用現(xiàn)有的數(shù)字化校園系統(tǒng),尤其是辦公自動化系統(tǒng)做好檔案服務(wù)工作的二次研發(fā),實(shí)現(xiàn)高校檔案服務(wù)社會化、多元化、個(gè)性化和開放化。
2、加速數(shù)字化資源建設(shè),轉(zhuǎn)變儲存方式,建立館藏“數(shù)字化”檔案資源
在信息化時(shí)代,實(shí)體形式的檔案材料已經(jīng)無法適應(yīng)時(shí)代發(fā)展的要求,實(shí)體檔案由于對存儲空間要求較高,無法從根本上改變造成檔案工作長期漏存、不存的局限,更無法將檔案信息用于大數(shù)據(jù)所要求的收集與分析。為此,檔案資源要實(shí)現(xiàn)數(shù)字化,應(yīng)著重從以下幾點(diǎn)著手進(jìn)行變革。
首先,做好對現(xiàn)有館藏傳統(tǒng)介質(zhì)檔案的數(shù)字化轉(zhuǎn)換工作,通過掃描、錄入等方式將紙質(zhì)檔案、照片、錄像帶等資源進(jìn)行轉(zhuǎn)化。從而構(gòu)建數(shù)字化檔案資源;其次,要對數(shù)字化校園各子系統(tǒng)的數(shù)字化信息進(jìn)行統(tǒng)一化。高校檔案管理部門應(yīng)當(dāng)對現(xiàn)存數(shù)字化校園系統(tǒng)進(jìn)行二次研發(fā),通過開發(fā)中間件等方式,對數(shù)據(jù)接口進(jìn)行統(tǒng)一,將各類數(shù)字化檔案信息進(jìn)行收集和整合,對學(xué)校內(nèi)各部門管理系統(tǒng)及分散孤立的檔案信息資源統(tǒng)籌規(guī)劃。再次,通過統(tǒng)一鏈接共享的方式,檔案管理部門可以加強(qiáng)原本分散于各部門的電子文檔、郵件等信息的收集,并可對其進(jìn)行數(shù)據(jù)挖掘工作,形成類似在線檔案瀏覽、專題檔案資源等各種形式的數(shù)字資源。
3、轉(zhuǎn)變觀念,增強(qiáng)高校檔案資源建設(shè)及檔案服務(wù)的意識
在確保檔案資源數(shù)字化轉(zhuǎn)換的同時(shí),為了進(jìn)一步推進(jìn)數(shù)字化檔案的增量工作,各部門新增的檔案必須要以一個(gè)統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行歸檔,著在一定程度上增加了檔案管理人員的工作,需要整個(gè)學(xué)校自上而下進(jìn)行統(tǒng)一部署。因此,高校領(lǐng)導(dǎo)干部必須轉(zhuǎn)變思想觀念,要引導(dǎo)各級部門充分認(rèn)識到,高校檔案是作為學(xué)校人才培養(yǎng)、學(xué)科建設(shè)、黨政管理以及其它各項(xiàng)活動的原始記錄,是學(xué)校教科研及日常管理的重要組成部分,也是學(xué)校歷史沿革及發(fā)展中不可或缺的一環(huán),更是衡量學(xué)校教學(xué)辦公水準(zhǔn)的重要指標(biāo)。為此,高校各部門都應(yīng)對檔案數(shù)字化工作有一個(gè)清晰而明確的認(rèn)識,明確部門職責(zé),加強(qiáng)對檔案數(shù)字化建設(shè)工作的重視,提升檔案管理人員數(shù)字化技術(shù)水平,加大對高校數(shù)字化檔案建設(shè)的資金投入,有力推進(jìn)高校檔案數(shù)字化建設(shè)發(fā)展進(jìn)程。
此外,在原有檔案管理制度的基礎(chǔ)上,還需要根據(jù)大數(shù)據(jù)信息的要求,建設(shè)一套科學(xué)化、規(guī)范化、可操作性強(qiáng)的數(shù)字化檔案管理制度,實(shí)現(xiàn)數(shù)字化檔案業(yè)務(wù)流程的規(guī)范。通過大數(shù)據(jù)技術(shù),可將原本由于資源限制而漏存或不存的資源重新納入收集范圍,通過規(guī)范化的格式,將圖片、音視頻等半結(jié)構(gòu)或非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行整合,方便檔案管理者對其進(jìn)行加工、提煉、分析和整合。
另外,還需要做好將檔案數(shù)據(jù)進(jìn)行著錄和索引構(gòu)建工作,以方便對檔案數(shù)據(jù)進(jìn)行提取和分析。事實(shí)上,在進(jìn)行完著錄和索引建設(shè)工作之后,高校檔案的樣本數(shù)據(jù)便能夠?qū)崿F(xiàn)隨機(jī)抽取,為大數(shù)據(jù)技術(shù)在信息挖掘和整合功能上的發(fā)揮奠定了數(shù)據(jù)基礎(chǔ)。無疑,以紙質(zhì)方式來儲存的高校檔案信息是無法發(fā)揮大數(shù)據(jù)的價(jià)值的,只有在強(qiáng)化數(shù)字化資源建設(shè)的基礎(chǔ)上,大數(shù)據(jù)技術(shù)才獲得了用武之地。
大數(shù)據(jù)時(shí)代的到來,對高校檔案工作來說是一個(gè)重大的發(fā)展機(jī)遇,同時(shí)也對其帶來了更高的要求。高校檔案工作者必須清晰的認(rèn)識到信息技術(shù)發(fā)展的現(xiàn)狀,更新管理思想與技術(shù)水平,結(jié)合大數(shù)據(jù)技術(shù),將技術(shù)驅(qū)動力轉(zhuǎn)化為學(xué)校發(fā)展的生產(chǎn)力,進(jìn)一步完善高校檔案的管理機(jī)制和管理模式,在創(chuàng)“雙一流”高校的過程中對教學(xué)實(shí)踐和科學(xué)研究起到推動作用,為相關(guān)決策者更好的提供支持與依據(jù)。
(作者單位:廣東工程職業(yè)技術(shù)學(xué)院)endprint