何楊琦
摘 要:大數(shù)據(jù)現(xiàn)已影響到各行各業(yè),它的到來對高校圖書館的數(shù)字化建設(shè)不只是機遇,還有挑戰(zhàn)。本文概述了大數(shù)據(jù)技術(shù)和高校圖書館之間存在的內(nèi)在聯(lián)系,并分析了大數(shù)據(jù)背景下高校圖書館的數(shù)字化建設(shè)問題。
關(guān)鍵詞:大數(shù)據(jù);高校圖書館;數(shù)字化
中圖分類號:G250.72 文獻(xiàn)標(biāo)識碼:B
當(dāng)下社會信息技術(shù)正在持續(xù)迅猛地發(fā)展,大數(shù)據(jù)時代已經(jīng)到來,其明顯表現(xiàn)就是新型的數(shù)據(jù)不斷地涌現(xiàn)出來,數(shù)據(jù)量正呈現(xiàn)爆炸式增長。
高校圖書館是公共信息體系中的重要組成部分,也在緊隨時代的腳步進(jìn)行數(shù)字化改革建設(shè)。
大數(shù)據(jù)對于高校圖書館進(jìn)行數(shù)字化建設(shè)來說不只是挑戰(zhàn),更是機遇。二者之間存在兩方面的內(nèi)在聯(lián)系:首先, 大數(shù)據(jù)背景下的有關(guān)技術(shù)能為圖書館數(shù)字化建設(shè)提供必要的幫助;其次,圖書館的數(shù)字化建設(shè)可以為大數(shù)據(jù)的相關(guān)研究提供經(jīng)驗和應(yīng)用的空間。
一、大數(shù)據(jù)和高校圖書館數(shù)字化建設(shè)之間的內(nèi)在聯(lián)系
到目前為止,作為一項逐漸顯現(xiàn)出強大功能的技術(shù),我們還沒有對大數(shù)據(jù)做出一個準(zhǔn)確的解釋,不過通過對不同概念進(jìn)行分析,我們得出了一個共識——大數(shù)據(jù)技術(shù)就是從各種不同類型的數(shù)據(jù)中迅速地檢索到自己所需的有價值的信息的能力。
高校圖書館的主要作用是為高校教學(xué)以及師生的科研任務(wù)提供幫助,其是實現(xiàn)高效信息化的主要載體,在高校的發(fā)展進(jìn)程中起著不可替代的作用。
高校圖書館要想為了使自己保持與信息社會發(fā)展同步,就必須開展數(shù)字化建設(shè)。
二、高校圖書館在大數(shù)據(jù)背景下數(shù)字化建設(shè)的建設(shè)思路
接下來,筆者將從技術(shù)發(fā)展、資源建設(shè)、服務(wù)升級三個方面論述高校圖書館在大數(shù)據(jù)背景下進(jìn)行數(shù)字化建設(shè)的思路。
1.技術(shù)發(fā)展
(1)當(dāng)今的數(shù)據(jù)量已經(jīng)由TB級升級到了PB級,并還在迅猛增長。有調(diào)查顯示,2015年世界上最大的數(shù)據(jù)倉庫中存有的數(shù)據(jù)量已經(jīng)將近100PB。但它對信息的存儲能力還不能滿足數(shù)據(jù)快速增長的要求,因此迫切需要開發(fā)一種新型的分布式數(shù)據(jù)庫。
(2)傳統(tǒng)意義上的圖書館中的數(shù)據(jù)均為結(jié)構(gòu)化數(shù)據(jù),在實現(xiàn)數(shù)字化之后,圖書館還擁有了非結(jié)構(gòu)化數(shù)據(jù),比如圖片、視頻等多媒體數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)的增長速度明顯高于結(jié)構(gòu)化數(shù)據(jù),截至2012年,非結(jié)構(gòu)化數(shù)據(jù)已經(jīng)占到了互聯(lián)網(wǎng)數(shù)據(jù)量的76%以上。在這種背景之下,關(guān)系數(shù)據(jù)庫已經(jīng)不能滿足時代的需求。
(3)處理數(shù)據(jù)的快捷性。用戶在數(shù)字化圖書館中能夠得到即時服務(wù),可以隨時閱讀或者下載信息。
而大數(shù)據(jù)技術(shù)要求的也是數(shù)據(jù)處理的快捷性,數(shù)據(jù)處理的時間顯著縮短,比如300GB的數(shù)據(jù)只需1秒鐘就可以處理完成。
(4)大數(shù)據(jù)時代下需要對數(shù)據(jù)進(jìn)行精簡和挖掘,最近幾年數(shù)據(jù)挖掘、數(shù)據(jù)倉庫等技術(shù)的快速發(fā)展為高校圖書館的發(fā)展提供啟示,那就是著重發(fā)展對大數(shù)據(jù)的數(shù)據(jù)挖掘以及分析。高校圖書館只要能在大數(shù)據(jù)中發(fā)現(xiàn)潛在規(guī)律和價值,就能夠從根本上提升智能化服務(wù)水平。
2.資源建設(shè)
高校圖書館在實現(xiàn)數(shù)字化之后,不要只把資源建設(shè)當(dāng)作自己的服務(wù)基礎(chǔ),還要把它當(dāng)作建設(shè)自身的核心所在。資源建設(shè)過程中需要大數(shù)據(jù)技術(shù)的強力支持,進(jìn)而幫助能豐富數(shù)據(jù)資源的內(nèi)容和種類,完善數(shù)據(jù)資源的結(jié)構(gòu),重點發(fā)展原生資源、領(lǐng)域資源以及特色資源,并積極實現(xiàn)資源的共享。
(1)發(fā)展原生資源——高校本身在平時的教學(xué)和科研過程中發(fā)表的各種類型的、各種用途的文獻(xiàn)。原生資源是高校學(xué)術(shù)水平的集中體現(xiàn),它集中了學(xué)校老師的所有科研成果。原生資源的利用價值高,而建設(shè)成本低,因此在高校圖書館數(shù)字化建設(shè)中具有一定的優(yōu)勢。
(2)建立自己的特色資源——這是高校圖書館保持本身特色的根本所在。在當(dāng)今的大數(shù)據(jù)背景下,圖書館無需將所有館藏數(shù)據(jù)都進(jìn)行數(shù)字化建設(shè),而應(yīng)該根據(jù)本館的館藏優(yōu)勢及特色,重點對特色的學(xué)科進(jìn)行數(shù)字化建設(shè),因地制宜,才能做得更好。
(3)建立各圖書館之間的資源共享機制——只有保持合作共享,才能夠滿足用戶日益增長的數(shù)據(jù)需求,才能夠在數(shù)據(jù)爆炸的時代背景下不被淘汰。因此,各高校圖書館之間要建立互通有無的合作式發(fā)展關(guān)系。
3.服務(wù)升級
數(shù)字化圖書館的核心服務(wù)價值在于滿足客戶的以下要求:①用戶對高質(zhì)量數(shù)據(jù)資源的需求;②用戶能夠迅速方便地檢索到所需信息;③對用戶關(guān)注的信息要持續(xù)跟蹤并推送給用戶。大數(shù)據(jù)技術(shù)的發(fā)展使得數(shù)字化圖書館能更好地解決以上三個問題,通過提供智能化服務(wù)和個性化服務(wù),推動圖書館服務(wù)水平的提升。
三、圖書館數(shù)字化建設(shè)可行性建議
目前還處于大數(shù)據(jù)技術(shù)的初始階段,各項理論以及實踐技術(shù)有待完善。高校圖書館要想在大數(shù)據(jù)時代做好數(shù)字化建設(shè),需要未雨綢繆,做好前期的準(zhǔn)備工作。
1.建立數(shù)字資源的整合平臺
為了滿足新時期用戶快捷、方便的數(shù)據(jù)需求,摒棄以往復(fù)雜的檢索方法以及檢索界面給用戶帶來的諸多不便,高校圖書館首先要建立起一個統(tǒng)一檢索的數(shù)字資源平臺,為讀者用戶提供一站式的服務(wù),并實現(xiàn)數(shù)據(jù)查閱的快速、聚類呈現(xiàn)、無重復(fù)以及多角度。
北京大學(xué)圖書館已經(jīng)建立了一套“未名學(xué)術(shù)搜索”系統(tǒng),這為建立整合平臺提供了探索經(jīng)驗。
用戶通過使用該系統(tǒng),能快速地檢索到本圖書館館藏中的所有藏書、論文資源、多媒體資源、電子書資源、期刊等各種數(shù)據(jù)資源,并向用戶提供所檢索資源的來源、館藏中的存放位置等重要信息。
2.加強整合原生的信息資源
不斷生成的原生數(shù)據(jù)是未來生活中大數(shù)據(jù)的重要來源,所以高校圖書館要加強整合原生資源并建立數(shù)據(jù)庫。
目前的各個數(shù)據(jù)庫之間普遍存在著知識關(guān)聯(lián)度低、內(nèi)容交叉且重復(fù)的問題,因此在建立新的原生數(shù)據(jù)庫時,要做好統(tǒng)一協(xié)議,建立一個有利于大數(shù)據(jù)相互融合、操作性強的標(biāo)準(zhǔn)平臺。
3.建立精確、個性化的推薦系統(tǒng)
根據(jù)不同用戶在圖書館中不同的瀏覽網(wǎng)站、鏈接搜索、瀏覽次數(shù)以及停留時間,追蹤出用戶不同的興趣以及特征方向,基于此為用戶建立一套精確的個性化推薦系統(tǒng)。
這種系統(tǒng)在大數(shù)據(jù)時代可用于分析用戶的行為并預(yù)測相應(yīng)的應(yīng)對方式,其可以為建設(shè)大數(shù)據(jù)提供客觀、準(zhǔn)確的參考依據(jù)。
高校圖書館是大數(shù)據(jù)的重要組成部分,也是大數(shù)據(jù)與人們之間聯(lián)系的橋梁。
因此,高校圖書館不能只安心做大數(shù)據(jù)時代的受益者,更應(yīng)該在數(shù)字化建設(shè)中積極探索,作為一個參與者主動參與到大數(shù)據(jù)時代的發(fā)展進(jìn)程當(dāng)中。
參考文獻(xiàn):
[1]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012,(11).
[2]王天泥.知識咨詢:大數(shù)據(jù)成為信息科技關(guān)注新熱點[J].圖書與情報,2013,(2).
[3]朱開忠.圖書館轉(zhuǎn)型研究[M].北京:人民郵電出版社,2011.
[4]魏 欣,趙 雋,張 敬,等.高校圖書館數(shù)字化建設(shè)——淺論數(shù)字化特色資源的建設(shè)[J].圖書館工作與研究,2005,(4).
[5]董秀真,靳艷華.高校圖書館數(shù)字化建設(shè)[J].醫(yī)學(xué)信息學(xué)雜志,2007,(3).