馮秋燕
(河南財(cái)經(jīng)政法大學(xué),河南 鄭州450000)
大數(shù)據(jù)時(shí)代信息文獻(xiàn)資源共建共享的創(chuàng)新與發(fā)展
馮秋燕
(河南財(cái)經(jīng)政法大學(xué),河南 鄭州450000)
大數(shù)據(jù)時(shí)代下,電子書刊等電子資源的積累、云計(jì)算和社交網(wǎng)絡(luò)等信息技術(shù)的發(fā)展、高速網(wǎng)絡(luò)和智能手機(jī)的普及,為信息文獻(xiàn)資源提供了廣泛的數(shù)據(jù)來源。如何更好地管理、利用大數(shù)據(jù)成為現(xiàn)今的熱點(diǎn)話題。本文首先介紹了大數(shù)據(jù)的特征、概念和應(yīng)用情況;然后以我省為例講述信息文獻(xiàn)資源共建共享目前的情況為例;最后,以經(jīng)典案例為契機(jī),探討了大數(shù)據(jù)時(shí)代下信息文獻(xiàn)資源共建共享的創(chuàng)新模式。
大數(shù)據(jù);信息文獻(xiàn)資源;共建共享
隨著博客、社交網(wǎng)路、物聯(lián)網(wǎng)等新型技術(shù)的興起,大數(shù)據(jù)時(shí)代的到來,學(xué)術(shù)界、工業(yè)界、政府機(jī)構(gòu)都開始關(guān)注大數(shù)據(jù)問題。2008年,《Nature》推出了BigData專刊。
大數(shù)據(jù)不僅僅指數(shù)據(jù)量的龐大和數(shù)據(jù)規(guī)模的龐大,依據(jù)大數(shù)據(jù)所具有的規(guī)模性、多樣性、高速性、價(jià)值性、真實(shí)性等特征,大數(shù)據(jù)具有3V和4V定義,維基百科對(duì)大數(shù)據(jù)的定義[1]為:大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時(shí)間超過了可容忍時(shí)間的數(shù)據(jù)集。
大數(shù)據(jù)的典型應(yīng)用有:科學(xué)計(jì)算、金融、社會(huì)網(wǎng)絡(luò)、移動(dòng)數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、多媒體等,其中所用數(shù)據(jù)量均在GB級(jí)以上,大數(shù)據(jù)給人們帶來便利的同時(shí)也給傳統(tǒng)的數(shù)據(jù)管理方式帶來了極大的挑戰(zhàn),詳見表1。目前,大數(shù)據(jù)的處理以云計(jì)算為基礎(chǔ),有流處理和批處理[2]兩種模式。表1給出了大數(shù)據(jù)集成、大數(shù)據(jù)分析、大數(shù)據(jù)隱私、大數(shù)據(jù)能耗、大數(shù)據(jù)處理與硬件的協(xié)同問題、大數(shù)據(jù)管理的易用性、性能的測試基準(zhǔn)等大數(shù)據(jù)目前所面臨的問題及其子問題。
以河南省高等教育文獻(xiàn)保障系統(tǒng)(HALIS)為例,HALIS以中國教育科研網(wǎng)(CERNET)為依托,配合CALIS,聯(lián)合河南省各高校圖書館,實(shí)現(xiàn)了全省高校信息文獻(xiàn)資源的有效開發(fā)和利用;黃河金三角“示范區(qū)”[3]中的6所高校,建立學(xué)校聯(lián)盟,調(diào)配資源,優(yōu)勢(shì)互補(bǔ),逐步推進(jìn)區(qū)域性資源共建共享。
表2描述了以HALIS為平臺(tái),高校圖書館對(duì)超星電子圖書、電子版《四庫全書》、CSSCI數(shù)據(jù)庫、CCC數(shù)據(jù)庫、中文科技期刊數(shù)據(jù)庫的訂購情況,最高的是超星電子圖書96.67%,而最低的CCC數(shù)據(jù)庫只有36.67%,可見,河南省高校圖書館的共建共享服務(wù)情況并不理想。
表2 河南省HALIS的利用情況
大數(shù)據(jù)對(duì)信息文獻(xiàn)資源的沖擊不可避免,本文以數(shù)據(jù)這項(xiàng)基礎(chǔ)性資源為出發(fā)點(diǎn),分別從大數(shù)據(jù)時(shí)代下信息文獻(xiàn)資源共建共享創(chuàng)新層面、創(chuàng)建虛擬圖書共建共享社區(qū)、創(chuàng)建區(qū)域性總分館模式三個(gè)方面對(duì)大數(shù)據(jù)時(shí)代下信息文獻(xiàn)資源共建共享創(chuàng)新方法進(jìn)行闡述。
4.1 大數(shù)據(jù)時(shí)代下信息文獻(xiàn)資源共建共享創(chuàng)新層面
本節(jié)從管理層次、技術(shù)層次、人員建設(shè)、服務(wù)模式四個(gè)層面對(duì)大數(shù)據(jù)時(shí)代下的信息文獻(xiàn)資源共建共享進(jìn)行簡單的分析。
大數(shù)據(jù)建設(shè)是一項(xiàng)系統(tǒng)工程,需具備良好的運(yùn)作機(jī)制:
4.1.1 在管理層次,應(yīng)完善數(shù)據(jù)管理措施,建立數(shù)據(jù)管理部門,負(fù)責(zé)數(shù)據(jù)的獲取、管理、使用、分析、協(xié)調(diào)等工作,如美國的MIT、康奈爾大學(xué)圖書館成了專門的“研究數(shù)據(jù)管理服務(wù)工作組(RDMSG)”,負(fù)責(zé)如元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)重用、數(shù)據(jù)共享、處理數(shù)據(jù)版權(quán)等數(shù)據(jù)管理工作。
4.1.2 大數(shù)據(jù)技術(shù)是解決大數(shù)據(jù)問題的核心,搭建合理的大數(shù)據(jù)技術(shù)架構(gòu)是基礎(chǔ)性同時(shí)也是全局性工作。大數(shù)據(jù)架構(gòu),自底向上,第一層即底層是大數(shù)據(jù)的采集工作,即對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)、科學(xué)數(shù)據(jù)、課件、數(shù)據(jù)庫、論文、郵件、社交網(wǎng)絡(luò)、微博等的處理;大數(shù)據(jù)架構(gòu)的第二層是大數(shù)據(jù)的存儲(chǔ)工作,可以采用云存儲(chǔ)、NoSQL、Hadoop、HDFS、Mapduce、HBASE等技術(shù);大數(shù)據(jù)架構(gòu)的第三層是大數(shù)據(jù)處理工作,即大數(shù)據(jù)的集成、數(shù)據(jù)抽取、數(shù)據(jù)建模、重復(fù)數(shù)據(jù)刪除、聚合與關(guān)聯(lián)、網(wǎng)格計(jì)算、數(shù)據(jù)加密、數(shù)據(jù)容災(zāi)等工作;大數(shù)據(jù)架構(gòu)的第四層即大數(shù)據(jù)的應(yīng)用,包括信息檢索、資源發(fā)現(xiàn)、數(shù)據(jù)挖掘、數(shù)據(jù)可視化、相關(guān)應(yīng)用軟件、推薦服務(wù)、學(xué)科化服務(wù)、知識(shí)服務(wù)等。
4.1.3 在人員建設(shè)上,應(yīng)具有一批懂技術(shù)、通管理的人員隊(duì)伍。美國國家科學(xué)委員會(huì)(NSB)提出的“數(shù)據(jù)科學(xué)家(DataScientist)”中,包含學(xué)科專家、信息科學(xué)家、數(shù)據(jù)處理員、計(jì)算機(jī)科學(xué)家、圖書館員等。
4.1.4 由于信息已經(jīng)從“紙質(zhì)”向“數(shù)字”進(jìn)行轉(zhuǎn)變,原有的服務(wù)方式、模式也應(yīng)當(dāng)做適當(dāng)?shù)恼{(diào)整。首先,應(yīng)當(dāng)收集、整理、編輯數(shù)據(jù),其次,應(yīng)當(dāng)對(duì)信息進(jìn)行分析、認(rèn)知、推理,然后,發(fā)現(xiàn)、獲取、應(yīng)用知識(shí),最后,對(duì)知識(shí)進(jìn)行積累、預(yù)見形成智慧(Wisdom),通過這四層對(duì)信息的處理模式,最終將有效的信息提供給需求者。
4.2 創(chuàng)建虛擬圖書共建共享社區(qū)
虛擬圖書共建共享社區(qū)指的是,成立多個(gè)不同種類的社區(qū)興趣小組,小組內(nèi)部成員有相同或相似的興趣、愛好,相互之間可以分享自己感興趣的圖書或雜志等,還可以將興趣指數(shù)、評(píng)價(jià)較高的資源放置到該小組的“云”端,供大家分享,小組之間可以通過組間“云”端共享所需資源。換言之,創(chuàng)建社區(qū)興趣小組即將大數(shù)據(jù)劃分為不同質(zhì)(“質(zhì)”指興趣、愛好等分類依據(jù))的數(shù)據(jù),對(duì)大數(shù)據(jù)的處理在小范圍內(nèi)迭代進(jìn)行,實(shí)現(xiàn)了大數(shù)據(jù)時(shí)代下信息文獻(xiàn)資源的共建共享。
表3 創(chuàng)建虛擬圖書共建共享社區(qū)影響因子
創(chuàng)建虛擬圖書共建共享社區(qū)除需要考慮如表3所示的幾個(gè)因素,還需滿足以下三個(gè)轉(zhuǎn)變:第一,紙質(zhì)文獻(xiàn)轉(zhuǎn)變?yōu)殡娮淤Y源;第二,傳統(tǒng)的固定服務(wù)模式向移動(dòng)服務(wù)模式轉(zhuǎn)變;第三,工作人員由原來的坐班制變?yōu)閃eb在線服務(wù)制。
4.3 創(chuàng)建區(qū)域性總分館模式
本文秉著科學(xué)計(jì)劃、系統(tǒng)整體、規(guī)范統(tǒng)一、共建共贏、注重特色的原則,以平臺(tái)共享、權(quán)威協(xié)調(diào)為策略創(chuàng)建區(qū)域性總分館模式。
區(qū)域性總分館模式是指以學(xué)校特色、類型為依據(jù),結(jié)合地域分布的特點(diǎn),在該區(qū)域建立總分館模式,整合區(qū)域內(nèi)高校的文獻(xiàn)信息資源,提高資源共知共享程度的管理體制和服務(wù)模式。
區(qū)域性總分館模式,以區(qū)域內(nèi)總館為中心,在區(qū)域內(nèi)設(shè)置分館、汽車流動(dòng)圖書館、24小時(shí)自助圖書館等。該模式,首先,可以通過建立分館(如圖1所示)進(jìn)行館際互借,實(shí)現(xiàn)紙質(zhì)資源的區(qū)域性傳播;其次,根據(jù)用戶需求,可以通過郵件等形式,提供給用戶所需電子版資源;最后,總分館之間進(jìn)行溝通交流,定期更換各自館內(nèi)的館藏等。
本文以河南省高等教育文獻(xiàn)保障系統(tǒng)為例,闡述了大數(shù)據(jù)時(shí)代下信息文獻(xiàn)資源共建共享的發(fā)展方法,這些創(chuàng)新模式有望在更多的地區(qū)加以使用。
[1]Bigdata[EB/OL].[2012-10-02].http://en.wikipedia.org/wiki/ Big_data.
[2]KumarR.Twocomputationalparadigmforbigdata[EB/OL]. [2012-10-02].KDDsummerschool,2012.http://kdd2012.sigkdd. org/sites/images/summerschool/Ravi-Kumar.pdf.
[3]梁轉(zhuǎn)琴.黃河金三角“示范區(qū)”高校文獻(xiàn)信息資源共建共享探析[J].圖書館學(xué)研究,2013(6):63-67.
[4]王海.總分館模式下文獻(xiàn)資源共建共享的探索與實(shí)踐—以濟(jì)南市圖書館為例[J].圖書館學(xué)刊,2013,(4):45-47.
G250
A
1671-0037(2014)-48-1.5
2013年12月26日。
馮秋燕(1988-),女,碩士,助理館員,研究方向:現(xiàn)代軟件工程技術(shù)、數(shù)據(jù)挖掘、大數(shù)據(jù)等研究工作。