趙振營
摘要:文章結(jié)合大數(shù)據(jù)時代的客觀要求分析圖書館實施大數(shù)據(jù)戰(zhàn)略的必要性與可行性。從數(shù)據(jù)的分析與整合、大數(shù)據(jù)處理以及結(jié)果顯示3個階段探究圖書館實施大數(shù)據(jù)戰(zhàn)略的框架,并著重從數(shù)據(jù)資源建設(shè)、數(shù)據(jù)處理技術(shù)和數(shù)據(jù)流通傳輸3個方面提出實施大數(shù)據(jù)戰(zhàn)略的路徑,即擴大圖書館數(shù)據(jù)存儲量,豐富數(shù)據(jù)資源種類;提高圖書館數(shù)據(jù)處理技術(shù),合理應(yīng)用網(wǎng)絡(luò)環(huán)境;促進圖書館數(shù)據(jù)傳輸,搭建資源分享網(wǎng)站。以期推動圖書館大數(shù)據(jù)戰(zhàn)略的發(fā)展和進步。
關(guān)鍵詞:圖書館;大數(shù)據(jù)戰(zhàn)略;構(gòu)建;路徑分析
中圖分類號:G250.7 文獻標識碼:A 文章編號:2095-5707(2017)02-0035-04
Abstract: Combined with the objective requirements of the era of big data, this article analyzed the necessity and feasibility of implementing big data strategy in libraries. It explored the framework of implementing big data strategy in libraries from the three stages of analysis and integration of data, big data processing and, results display, and proposed the pathway of implementing big data strategy in libraries mainly from the aspects of data resource construction the data processing technology, data transmission and circulation, namely the expansion of the library data storage, enrichment of data resources; improvement of library data processing technology, reasonable application of network environment; promotion of library data transmission, construction of resources sharing website, with a purpose to promote the development and progress of big data strategy in libraries.
Key words: libraries; big data strategy; construction; analysis on pathway
大數(shù)據(jù)(Big Date)意為“大量的、大規(guī)模的、多類型的數(shù)據(jù)”,這個名詞是隨著信息時代來臨而不斷演變發(fā)展的,我國各行各業(yè)的數(shù)據(jù)化轉(zhuǎn)型標志著數(shù)據(jù)時代已經(jīng)到來。在這種時代背景下,圖書館也開始向數(shù)據(jù)化轉(zhuǎn)型,圖書館原有的數(shù)據(jù)建設(shè)大多局限于數(shù)據(jù)數(shù)量的多少,傾向于強調(diào)“海量數(shù)據(jù)”,而對于數(shù)據(jù)內(nèi)容的質(zhì)量評估、服務(wù)方式的數(shù)據(jù)采集及不同圖書館之間的數(shù)據(jù)資源輸出平臺方面鮮少涉及。
大數(shù)據(jù)時代的到來,一方面要求圖書館降低數(shù)據(jù)構(gòu)成的成本,體現(xiàn)出數(shù)據(jù)資源可再生成、綠色環(huán)保使用的特點,另一方面要求圖書館提高數(shù)據(jù)構(gòu)成的質(zhì)量、增加數(shù)據(jù)介質(zhì)類型??梢哉f,大數(shù)據(jù)戰(zhàn)略顛覆了傳統(tǒng)圖書館的建設(shè)和服務(wù)[1]。廣泛意義上講,圖書館實施大數(shù)據(jù)戰(zhàn)略可分為兩大部分:資源的數(shù)據(jù)構(gòu)成和服務(wù)的數(shù)據(jù)構(gòu)成。一般來說,圖書館更側(cè)重于資源的數(shù)據(jù)構(gòu)成分析。本文從2個層面對圖書館實施大數(shù)據(jù)戰(zhàn)略的構(gòu)建與實現(xiàn)路徑進行了探討,希望以一種新的視角分析圖書館大數(shù)據(jù)戰(zhàn)略,并從不同角度推動圖書館大數(shù)據(jù)戰(zhàn)略的實施。
1 圖書館實施大數(shù)據(jù)戰(zhàn)略的必要性與可行性
圖書館實施大數(shù)據(jù)戰(zhàn)略既是圖書館轉(zhuǎn)型的自身需要,也是大數(shù)據(jù)時代的客觀要求,與此同時,技術(shù)支持和政府支持為圖書館實施大數(shù)據(jù)戰(zhàn)略帶來了可行性條件。
1.1 必要性
首先,圖書館的現(xiàn)代化建設(shè)與發(fā)展需要多種多樣的數(shù)據(jù)資源。大數(shù)據(jù)時代隱含的資源數(shù)據(jù)化、服務(wù)信息化決定了未來圖書館的服務(wù)指向網(wǎng)絡(luò)化和數(shù)字化偏移,紙質(zhì)文獻的數(shù)據(jù)化處理以及數(shù)據(jù)庫成為現(xiàn)今圖書館資源構(gòu)建的重要部分,各種結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)信息豐富了圖書館的文獻資源,以互聯(lián)網(wǎng)為平臺的數(shù)字化虛擬服務(wù)也成為圖書館發(fā)展的新天地。因此,圖書館實施大數(shù)據(jù)戰(zhàn)略是圖書館自身轉(zhuǎn)型的必然要求[2]。其次,在大數(shù)據(jù)時代,圖書館必須掌握對文獻的數(shù)字處理技術(shù),包括數(shù)據(jù)的儲存、格式轉(zhuǎn)換、輸入輸出和分析整合等,圖書館的核心是資源,只有具備豐富的資源才能提高圖書館的核心競爭力,增強讀者用戶對其的粘性。圖書館大數(shù)據(jù)戰(zhàn)略的數(shù)據(jù)處理技術(shù)還包括對讀者用戶資源獲取的指導(dǎo),精準的數(shù)據(jù)分類和推送,有利于提高圖書館的服務(wù)質(zhì)量、提高文獻資源的利用率[3]。
1.2 可行性
圖書館實施大數(shù)據(jù)戰(zhàn)略的可行性條件包括2個方面:技術(shù)支持和政府支持。在技術(shù)支持方面,圖書館能夠?qū)崿F(xiàn)紙質(zhì)文獻的數(shù)據(jù)化處理或數(shù)據(jù)庫建設(shè),前提是要實現(xiàn)先進的數(shù)據(jù)處理技術(shù),即高性能的資源云中轉(zhuǎn)和PB級海量數(shù)據(jù)傳輸平臺。目前,國內(nèi)大多數(shù)圖書館具備高速的網(wǎng)絡(luò)條件和數(shù)據(jù)資源轉(zhuǎn)化技術(shù),部分偏遠地區(qū)的圖書館也可依靠購買數(shù)據(jù)庫實現(xiàn)數(shù)據(jù)資源建設(shè)工作。因此,充分的技術(shù)支持為圖書館實現(xiàn)大數(shù)據(jù)戰(zhàn)略提供了可行條件。在政府支持方面,由于圖書館的數(shù)據(jù)建設(shè)和信息化服務(wù)涉及的領(lǐng)域廣泛、參與的部門較多,是一次地方文化機構(gòu)知識輸出的大變革,因此引起了地方政府的關(guān)注,政府在資金、政策上給予了相應(yīng)的幫助和指導(dǎo),如安徽蚌埠市圖書館在數(shù)據(jù)建設(shè)上與地方檔案館、博物館形成了合作關(guān)系,圖書館在政府牽頭下獲準將檔案館的紙質(zhì)資料數(shù)據(jù)化并呈現(xiàn)于網(wǎng)絡(luò)平臺上,此外,還與環(huán)保部門、地質(zhì)部門進行合作,將其數(shù)據(jù)或模型用于圖書館的數(shù)據(jù)庫建設(shè)[4]。政府的支持為圖書館實施大數(shù)據(jù)戰(zhàn)略提供幫助,是圖書館向現(xiàn)代化轉(zhuǎn)型的又一動力。
2 圖書館實施大數(shù)據(jù)戰(zhàn)略實踐的框架構(gòu)建
圖書館實施大數(shù)據(jù)戰(zhàn)略實踐的框架構(gòu)建包含3個階段:數(shù)據(jù)的分析與整合、大數(shù)據(jù)處理及結(jié)果顯示,其中數(shù)據(jù)分析與整合是核心,大數(shù)據(jù)處理是技術(shù)層面要求,結(jié)果顯示為數(shù)據(jù)的輸出(見圖1)。
2.1 數(shù)據(jù)的分析與整合
圖書館對數(shù)據(jù)的分析與整合是指將分散多個平臺和不同類型、介質(zhì)的數(shù)據(jù)進行篩選整理,排查重復(fù)無效的數(shù)據(jù)資源,整合分類數(shù)據(jù)信息,以及對不完整的數(shù)據(jù)進行補充,是提高數(shù)據(jù)質(zhì)量的前期階段。圖書館數(shù)據(jù)的分析與整合需要依靠云數(shù)據(jù)儲存平臺,也可以將其成為中轉(zhuǎn)平臺。大數(shù)據(jù)戰(zhàn)略下,這種數(shù)據(jù)載體至關(guān)重要,是數(shù)據(jù)庫建設(shè)的臨時文件夾,以此實現(xiàn)數(shù)據(jù)的存儲與交流[5]。具體來說,圖書館實施大數(shù)據(jù)戰(zhàn)略時,對于數(shù)據(jù)的篩查和補充為后續(xù)的數(shù)據(jù)處理與結(jié)果顯示奠定了基礎(chǔ),是資源構(gòu)建的核心環(huán)節(jié)。傳統(tǒng)的數(shù)據(jù)庫建設(shè),往往由于數(shù)據(jù)的無序和重復(fù)造成利用率和準確率的降低,資源分布的分散同樣會增加圖書館服務(wù)任務(wù)量,難以精準定位讀者用戶的資源需求,是數(shù)據(jù)服務(wù)體系上要解決的問題,圖書館大數(shù)據(jù)戰(zhàn)略下的數(shù)據(jù)分析與整合環(huán)節(jié)對于資源的科學構(gòu)建起到了促進作用,方便圖書館的管理和讀者用戶的使用[6]。
2.2 大數(shù)據(jù)處理
圖書館大數(shù)據(jù)處理環(huán)節(jié)建立在資源的分析和整合層面上,即收集海量數(shù)據(jù)信息,并通過信息之間的關(guān)聯(lián)建立發(fā)散性聯(lián)系與鏈接,如果2個數(shù)據(jù)在語境或主題某一方面有交集,在數(shù)據(jù)建設(shè)時即為2個數(shù)據(jù)設(shè)置相關(guān)聯(lián)系,建立二者之間的信息聚合,完成讀者的知識獲取和服務(wù)延伸功能。在大數(shù)據(jù)處理環(huán)節(jié),圖書館要依靠特殊軟件和特殊技術(shù)的支持,如Hadoop系統(tǒng)以及跨庫檢索等等[7],既要對數(shù)據(jù)信息進行宏觀的整合的鏈接,又要對不同層面、上下文之間進行關(guān)聯(lián),實現(xiàn)數(shù)據(jù)全方面的延展和內(nèi)在分析處理。除此之外,語境搜索和數(shù)據(jù)倉庫也是圖書館實施大數(shù)據(jù)所普遍采用的數(shù)據(jù)處理軟件,經(jīng)濟高效分析PB級結(jié)構(gòu)化與非結(jié)構(gòu)數(shù)據(jù)是語境搜索的優(yōu)勢所在,有利于增強各節(jié)點之間的顯性或隱形聯(lián)系,提高數(shù)據(jù)庫的完整性和網(wǎng)絡(luò)覆蓋性,將各節(jié)點文件進行新生或覆蓋,并將新產(chǎn)生數(shù)據(jù)納入數(shù)據(jù)庫中,體現(xiàn)了圖書館大數(shù)據(jù)戰(zhàn)略的全面優(yōu)化和數(shù)據(jù)數(shù)量、質(zhì)量的雙向提升。
2.3 結(jié)果顯示
結(jié)果顯示是圖書館實施大數(shù)據(jù)戰(zhàn)略實踐的最后階段,又可具體分為2個部分。⑴數(shù)據(jù)可視化,所謂數(shù)據(jù)可視化是指圖書館對數(shù)據(jù)分析整合以及處理后,呈現(xiàn)出來的處理結(jié)果,既可為數(shù)據(jù)庫建設(shè)內(nèi)部工作人員所查看,內(nèi)化為圖書館大數(shù)據(jù)戰(zhàn)略的管理系統(tǒng)組成部分,也可將可視化的原始數(shù)據(jù)提交給用戶,直接為用戶服務(wù)。⑵數(shù)據(jù)分析,可包括對數(shù)據(jù)本身的分析,也包括對數(shù)據(jù)發(fā)展的預(yù)測和內(nèi)容節(jié)點聯(lián)系的評估與改善;此外,數(shù)據(jù)分析結(jié)果還能夠為圖書館大數(shù)據(jù)戰(zhàn)略的改進提供直接的建議。一般來說,圖書館側(cè)重于數(shù)據(jù)內(nèi)容的分析,實際上,數(shù)據(jù)預(yù)測更有利于推動圖書館的現(xiàn)代化和數(shù)據(jù)化轉(zhuǎn)型,更有利于改善圖書館服務(wù)、提高讀者粘度[8]。
3 圖書館實施大數(shù)據(jù)戰(zhàn)略實踐的路徑
筆者對圖書館實施大數(shù)據(jù)戰(zhàn)略框架構(gòu)建探究,從數(shù)據(jù)資源建設(shè)、數(shù)據(jù)處理技術(shù)和數(shù)據(jù)流通傳輸 3個方面提出了實施的路徑。
3.1 擴大圖書館數(shù)據(jù)存儲量,豐富數(shù)據(jù)資源種類
數(shù)據(jù)資源是圖書館實施大數(shù)據(jù)戰(zhàn)略的核心,大數(shù)據(jù)戰(zhàn)略需要圖書館對數(shù)據(jù)資源進行初步的分析和整合,在這一環(huán)節(jié),圖書館需要對本館自建數(shù)據(jù)庫和外購數(shù)據(jù)庫的資源進行篩選排查,過濾掉無法讀取的、無效的、重復(fù)的甚至過期的數(shù)據(jù)資源,保留完整的資源文獻,進行廣義分類,如文史類、社科類、財經(jīng)類或哲學類等等,再對數(shù)據(jù)的形式進行劃分,如文本文檔、音頻文件、視頻文件等等;此外,還可以采用等級分類法,如加密等級、珍貴史料、普通等級等等。圖書館實施大數(shù)據(jù)戰(zhàn)略的路徑最終是要從數(shù)據(jù)資源入手,充實館內(nèi)的數(shù)據(jù)文獻。在具體的數(shù)據(jù)資源建設(shè)過程中,根據(jù)本館的實際情況進行資源配置,如適當增添自身缺少的資源內(nèi)容,減少過多的同類資源等等。
3.2 提高圖書館數(shù)據(jù)處理技術(shù),合理應(yīng)用網(wǎng)絡(luò)環(huán)境
圖書館實施大數(shù)據(jù)戰(zhàn)略的另一表現(xiàn)在于服務(wù)內(nèi)容和服務(wù)方式的數(shù)據(jù)化。2012年,鄭州金水區(qū)圖書館引進1800高性能計算機系統(tǒng)[9],采用先進的數(shù)據(jù)處理技術(shù),為該館海量數(shù)據(jù)資源重新編目,為讀者呈現(xiàn)了耳目一新的服務(wù)內(nèi)容。其中,一級檢索更為細化,在一級檢索結(jié)果中就呈現(xiàn)出不同節(jié)點和不同主題鏈接到的相關(guān)文獻,以網(wǎng)絡(luò)思維圖狀表達出來,促進了讀者用戶的知識遷移。同時簡化了讀者用戶的檢索過程,將數(shù)據(jù)資源進行更為全面的關(guān)聯(lián)整合。此外,圖書館的服務(wù)方式也日趨網(wǎng)絡(luò)化,目前我國大多數(shù)圖書館都開通了官方主頁,在主頁上設(shè)置了“數(shù)據(jù)庫資源”一項,讀者可自行利用網(wǎng)絡(luò)環(huán)境訪問圖書館數(shù)據(jù)庫,獲取相關(guān)資源,這種擺脫了時間與空間束縛的自助閱讀被廣泛使用,集中體現(xiàn)了大數(shù)據(jù)環(huán)境下圖書館服務(wù)的快捷性、便利性與人性化特點[10]。
3.3 促進圖書館數(shù)據(jù)傳輸,搭建資源分享網(wǎng)站
大數(shù)據(jù)環(huán)境將不同地域的圖書館連接為一個整體,網(wǎng)絡(luò)的溝通無障礙體現(xiàn)在圖書館之間資源的相互交流與共享。圖書館大數(shù)據(jù)戰(zhàn)略一方面在于構(gòu)建本館的數(shù)據(jù)庫、形成本館的數(shù)字化服務(wù),另一方面則是依托網(wǎng)絡(luò)平臺,實現(xiàn)資源配置的優(yōu)化和館際之間互通有無。2014年,山東濰坊市牽頭山東沿海地區(qū)的市級圖書館形成了區(qū)域內(nèi)的圖書館聯(lián)盟,并構(gòu)建資源共享網(wǎng)站,使得數(shù)據(jù)的實時流通成為現(xiàn)實,讀者可根據(jù)自己的需要向圖書館申請閱讀請求,圖書館則將讀者所需內(nèi)容發(fā)送到讀者預(yù)留的郵箱中[11]。由此可見,圖書館的大數(shù)據(jù)戰(zhàn)略推動了數(shù)據(jù)傳輸,真正實現(xiàn)了資源共享。搭建資源共享網(wǎng)站,是對獨立個體的圖書館數(shù)據(jù)處理技術(shù)和計算機應(yīng)用技術(shù)的檢驗,它有利于推動形成廣義的圖書館間聯(lián)盟,有利于落實大數(shù)據(jù)精神,有利于促進圖書館的共同發(fā)展和轉(zhuǎn)型,更有利于為讀者用戶提供優(yōu)質(zhì)高效的服務(wù)。
4 小結(jié)
大數(shù)據(jù)時代為圖書館擺脫傳統(tǒng)服務(wù)內(nèi)容和服務(wù)方式提供了契機,圖書館的資源優(yōu)勢、技術(shù)優(yōu)勢、政府支持,為實施大數(shù)據(jù)帶來可行性條件,有助于圖書館服務(wù)貼合讀者用戶的實際需求,增強圖書館的核心競爭力。
與此同時,發(fā)展過程中出現(xiàn)的各種矛盾和問題,給我們提出了新的挑戰(zhàn)。數(shù)據(jù)資源建設(shè)是實施大數(shù)據(jù)戰(zhàn)略的重點;數(shù)據(jù)處理技術(shù)是實施的保障;數(shù)據(jù)內(nèi)容和整合決定其成效;資源質(zhì)量的優(yōu)劣決定圖書館競爭力的高低;結(jié)果顯示直接影響讀者用戶的服務(wù)。我們要找準發(fā)展重點和主要矛盾,從整體視角上建設(shè)資源共享平臺,發(fā)揮圖書館的職能,使服務(wù)水平得到提升。
參考文獻
[1] 梁孟華.圖書館知識信息服務(wù)綜合評估研究[D].武漢:武漢大學, 2010.
[2] 毛剛.圖書館用戶需求生態(tài)服務(wù)系統(tǒng)研究[D].長春:吉林大學,2013.
[3] 劉雄洲,王菲.國外數(shù)據(jù)存管實施現(xiàn)狀及其對國內(nèi)高校圖書館的啟示[J].圖書館,2012(5):81-83.
[4] 張興旺.圖書館大數(shù)據(jù)體系構(gòu)建的學術(shù)環(huán)境和戰(zhàn)略思考[J].情報資料工作,2013(2):12-17.
[5] 侯茹.大英圖書館館藏元數(shù)據(jù)戰(zhàn)略報告研究[J].圖書館學研究, 2016(5):75-79.
[6] 劉曉英.大數(shù)據(jù)時代圖書館數(shù)字資源長期保存問題研究[J].圖書館,2016(7):90-96.
[7] 仵淮林.大數(shù)據(jù)環(huán)境下數(shù)字圖書館面向用戶的服務(wù)組織研究[D].武漢:華中師范大學,2015.
[8] 王浩.用大數(shù)據(jù)思維構(gòu)建圖書館信息服務(wù)[J].情報探索,2016(10): 121-124,129.
[9] 薛紅,唐明元.論大數(shù)據(jù)時代圖書館電子資源建設(shè)模式[J].圖書館工作與研究,2016(10):52-56.
[10] 許玲.大數(shù)據(jù)時代圖書館面臨的挑戰(zhàn)與對策思考[J].中共福建省委黨校學報,2014(5):117-120.
[11] 馬曉亭.基于可信大數(shù)據(jù)的圖書館個性化服務(wù)平臺構(gòu)建[J].圖書館理論與實踐,2015(1):85-88.
(收稿日期:2017-01-03)
(修回日期:2017-02-08;編輯:魏民)