国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)背景下圖書館服務(wù)體系創(chuàng)新與重構(gòu)

2014-02-19 19:20劉瓊
科技創(chuàng)新與應(yīng)用 2014年6期
關(guān)鍵詞:服務(wù)體系重構(gòu)大數(shù)據(jù)

摘 要:大數(shù)據(jù)時(shí)代的到來影響著社會(huì)的各個(gè)層面,從物聯(lián)網(wǎng)、云計(jì)算到微博等影響著人們生活的方方面面,圖書館作為存儲(chǔ)、傳播知識(shí)的重要場(chǎng)所受大數(shù)據(jù)的影響最為深刻。大數(shù)據(jù)時(shí)代,圖書館的服務(wù)體系需要完善,服務(wù)質(zhì)量需要提升,這就需要研究大數(shù)據(jù),應(yīng)用大數(shù)據(jù)。文章在分析了大數(shù)據(jù)內(nèi)涵與特征,提出了圖書館面臨大數(shù)據(jù)的挑戰(zhàn),從服務(wù)內(nèi)容與服務(wù)模式兩個(gè)方面提出創(chuàng)新與重構(gòu)圖書館的服務(wù)體系的思路。

關(guān)鍵詞:大數(shù)據(jù);圖書館;服務(wù)體系;創(chuàng)新;重構(gòu)

“大數(shù)據(jù)”概念最早是由咨詢公司McKensey提出,而后《紐約時(shí)報(bào)》及《華爾街日?qǐng)?bào)》開辟專欄,對(duì)其展開激烈討論。之后,包括Oracle、Microsoft、IBM、Yahoo、VMWare、FaceBook等幾乎所有IT巨頭,紛紛加入到相關(guān)的軟硬件技術(shù)研究的陣營(yíng)中?,F(xiàn)在,大數(shù)據(jù)已深深地影響了我們的生活,近年來,信息技術(shù)的飛速發(fā)展推動(dòng)社會(huì)各個(gè)層面快速發(fā)展,新事物不斷涌現(xiàn)?!按髷?shù)據(jù)”是移動(dòng)計(jì)算、物聯(lián)網(wǎng)、云計(jì)算等一系列新興技術(shù)之后的又一新興事物。大數(shù)據(jù)已成為2012年以來的研究熱點(diǎn),2013年7月28日在中國(guó)期刊網(wǎng)上用“大數(shù)據(jù)”作為關(guān)鍵詞進(jìn)行搜索,并以發(fā)表時(shí)間順序排列,1985年有1篇文獻(xiàn),2000年有4篇,2011年有41篇,到了2012年有324篇,2013年的1-5月則達(dá)到了418篇,增長(zhǎng)的速度如此驚人。由此說明,對(duì)大數(shù)據(jù)有研究已成為科學(xué)研究的一個(gè)重要內(nèi)容。綜觀國(guó)內(nèi)外大數(shù)據(jù)領(lǐng)域的研究和應(yīng)用發(fā)展現(xiàn)狀可見:大數(shù)據(jù)相關(guān)的研究與應(yīng)用目前仍然處于起步階段,學(xué)術(shù)研究大多局限于宏觀層面;基于互聯(lián)網(wǎng)和社會(huì)媒體的企業(yè)大數(shù)據(jù)研究與應(yīng)用亟需進(jìn)一步的深入開展;現(xiàn)有的大數(shù)據(jù)研究大多立足于信息科學(xué),側(cè)重于大數(shù)據(jù)的獲取、存儲(chǔ)、處理、挖掘和信息安全等方面[1]。

圖書館的責(zé)任之一就知識(shí)存貯、利用、開發(fā)和傳播,在即將出現(xiàn)的大數(shù)據(jù)的各種問題面前,圖書館已經(jīng)感受到其所帶來的轉(zhuǎn)變和創(chuàng)新知識(shí)服務(wù)的巨大壓力。要把壓力轉(zhuǎn)化為創(chuàng)新的動(dòng)力,就要正確地認(rèn)識(shí)大數(shù)據(jù)給帶來的環(huán)境和改變,利用大數(shù)據(jù)實(shí)現(xiàn)圖書館服務(wù)能力的提升,推動(dòng)圖書館事業(yè)的發(fā)展。

1 大數(shù)據(jù)的內(nèi)涵與特征

早在 20 世紀(jì) 80 年代初,美國(guó)有人提出了大數(shù)據(jù)的概念,但是并沒有引起人們足夠的重視。近年來,各個(gè)領(lǐng)域的數(shù)據(jù)量都在大量的增長(zhǎng),因此,大數(shù)據(jù)這一概念也變得越來越流行,也越來越重要[2]。以“云計(jì)算”為標(biāo)志的“大數(shù)據(jù)”,已經(jīng)成為一些國(guó)家和政府的發(fā)展戰(zhàn)略。對(duì)于大數(shù)據(jù)的概念,企業(yè)和學(xué)術(shù)界目前尚未形成公認(rèn)的準(zhǔn)確定義。維基百科將大數(shù)據(jù)定義為“無法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合”[3]; 權(quán)威 IT研究與顧問咨詢公司 Gartner 將大數(shù)據(jù)定義為“在一個(gè)或多個(gè)維度上超出傳統(tǒng)信息技術(shù)的處理能力的極端信息管理和處理問題”[4]; 美國(guó)國(guó)家科學(xué)基金會(huì)( NSF) 則將大數(shù)據(jù)定義為“由科學(xué)儀器、傳感設(shè)備、互聯(lián)網(wǎng)交易、電子郵件、音視頻軟件、網(wǎng)絡(luò)點(diǎn)擊流等多種數(shù)據(jù)源生成的大規(guī)模、多元化、復(fù)雜、長(zhǎng)期的分布式數(shù)據(jù)集”[5]。盡管存在不同的表述,但一個(gè)普遍的觀點(diǎn)是,大數(shù)據(jù)與“海量數(shù)據(jù)”和“大規(guī)模數(shù)據(jù)”的概念一脈相承,但其在數(shù)據(jù)體量、數(shù)據(jù)復(fù)雜性和產(chǎn)生速度三個(gè)方面均大大超出了傳統(tǒng)的數(shù)據(jù)形態(tài),也超出了現(xiàn)有技術(shù)手段的處理能力,并帶來了巨大的產(chǎn)業(yè)創(chuàng)新的機(jī)遇。大數(shù)據(jù)包含了互聯(lián)網(wǎng)、醫(yī)療設(shè)備、視頻監(jiān)控、移動(dòng)設(shè)備、智能設(shè)備、非傳統(tǒng) IT 設(shè)備等渠道產(chǎn)生的海量結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),并且時(shí)時(shí)刻刻都在源源不斷地滲入現(xiàn)代企業(yè)日常管理和運(yùn)作的方方面面[1]。

大數(shù)據(jù)的特點(diǎn)可以用“4V+1C”來概括,“4V+1C”分別代表了Variety(多樣化)、Volume(海量)、Velocity(快速)、Vitality(靈活)以及Complexity(復(fù)雜)。多樣化(Variety)指大數(shù)據(jù)一般包括以事務(wù)為代表的結(jié)構(gòu)化數(shù)據(jù)、以網(wǎng)頁為代表的半結(jié)構(gòu)化數(shù)據(jù)和以視頻和語音信息為代表的非結(jié)構(gòu)化等多類數(shù)據(jù),并且它們的處理和分析方式區(qū)別很大。海量(Volume)指通過各種智能設(shè)備產(chǎn)生了大量的數(shù)據(jù)。據(jù) DCCI 互聯(lián)網(wǎng)數(shù)據(jù)中心在2012年7月26日舉辦的“Adworld2012 互動(dòng)營(yíng)銷世界”上給出的數(shù)據(jù)顯示:2010 年,全球數(shù)據(jù)量已達(dá) 1.2ZB(1ZB=1024EB,1EB 相當(dāng)于10億GB),到2020年將暴增30倍達(dá)35ZB;2011年,全球被創(chuàng)建和復(fù)制數(shù)據(jù)總量為1.8ZB;2013年,我們生成這樣規(guī)模的信息量只需10分鐘[6]。快速(Velocity)指大數(shù)據(jù)要求快速處理,因?yàn)橛行?shù)據(jù)存在時(shí)效性。比如電商的數(shù)據(jù),假如今天數(shù)據(jù)的分析結(jié)果要等到明天才能得到,那么將會(huì)使電商很難做類似補(bǔ)貨這樣的決策,從而導(dǎo)致這些數(shù)據(jù)失去了分析的意義。靈活(Vitality)指在互聯(lián)網(wǎng)時(shí)代,和以往相比,企業(yè)的業(yè)務(wù)需求更新的頻率加快了很多,那么相關(guān)大數(shù)據(jù)的分析和處理模型必須快速地適應(yīng)新的業(yè)務(wù)需求。復(fù)雜(Complexity)指雖然傳統(tǒng)的已經(jīng)很復(fù)雜了,但是由于前面4個(gè)V的存在,使得針對(duì)大數(shù)據(jù)的處理和分析更艱巨。

圖書館作為知識(shí)信息的重要來源之一,不可避免地受到社會(huì)應(yīng)用技術(shù)潮流的影響,圖書館也應(yīng)與時(shí)代相呼應(yīng)。在當(dāng)今,圖書館已具備了大數(shù)據(jù)的特征,至2008年底,CALIS文獻(xiàn)數(shù)據(jù)總量達(dá)到180TB,截止到2012年底,國(guó)家圖書館數(shù)字資源總量達(dá)807.3TB,內(nèi)容豐富、種類齊全[7]。研究大數(shù)據(jù)對(duì)于圖書館來說具有重的現(xiàn)實(shí)意義。

2 大數(shù)據(jù)對(duì)圖書館發(fā)展的挑戰(zhàn)

2.1 大數(shù)據(jù)的復(fù)雜性挑戰(zhàn)

復(fù)雜性造成網(wǎng)絡(luò)大數(shù)據(jù)存儲(chǔ)、分析、挖掘等多個(gè)環(huán)節(jié)的困難。網(wǎng)絡(luò)大數(shù)據(jù)的復(fù)雜性主要表現(xiàn)在三個(gè)方面。

數(shù)據(jù)類型復(fù)雜。信息技術(shù)的發(fā)展使得數(shù)據(jù)產(chǎn)生的途徑不斷增加,數(shù)據(jù)類型持續(xù)增多。相應(yīng)地,則需要開發(fā)新的數(shù)據(jù)采集、存儲(chǔ)與處理技術(shù)。例如社交網(wǎng)絡(luò)的興起,使相關(guān)當(dāng)?shù)男畔⒈憩F(xiàn)為短文本數(shù)據(jù)信息。與傳統(tǒng)的長(zhǎng)文本不同,短文本由于長(zhǎng)度短,下文信息和統(tǒng)計(jì)信息很少,給傳統(tǒng)的文本挖掘(如檢索、主題發(fā)現(xiàn)、語義和情感分析等)帶來很大的困難。

是數(shù)據(jù)結(jié)構(gòu)的復(fù)雜。傳統(tǒng)上處理的數(shù)據(jù)對(duì)象都是有結(jié)構(gòu)的,能夠存儲(chǔ)到關(guān)系數(shù)據(jù)庫中。但隨著數(shù)據(jù)生成方式的多樣化,如社交網(wǎng)絡(luò)、移動(dòng)計(jì)算和傳感器等技術(shù),非結(jié)構(gòu)化數(shù)據(jù)成為大數(shù)據(jù)的主流形式。非結(jié)構(gòu)化數(shù)據(jù)具有許多格式,包括文本、文檔、圖形、視頻等等。非結(jié)構(gòu)化數(shù)據(jù)當(dāng)中蘊(yùn)含著豐富的知識(shí),但其異構(gòu)和可變的性質(zhì)也給數(shù)據(jù)分析與挖掘工作帶來了更大的挑戰(zhàn)。與結(jié)構(gòu)化的數(shù)據(jù)相比,非結(jié)構(gòu)化數(shù)據(jù)相對(duì)組織凌亂,包含更多的無用信息,給數(shù)據(jù)的存儲(chǔ)與分析帶來很大的困難。

數(shù)據(jù)模式的復(fù)雜。隨著數(shù)據(jù)規(guī)模的增大,描述和刻畫數(shù)據(jù)的特征必然隨之增大,而由其組成的數(shù)據(jù)內(nèi)在模式將會(huì)以指數(shù)形式增長(zhǎng)。首先,數(shù)據(jù)類型的多樣化決定了數(shù)據(jù)模式的多樣化。不僅需要熟悉各種類型的數(shù)據(jù)模式,同時(shí)也要善于把握它們之間的相互作用。這種面向多模式學(xué)習(xí)的研究需要綜合利用各個(gè)方面的知識(shí)(如文本挖掘、圖像處理、信息網(wǎng)絡(luò)、甚至社會(huì)學(xué)等等)。其次,非結(jié)構(gòu)化的數(shù)據(jù)通常比結(jié)構(gòu)化數(shù)據(jù)蘊(yùn)含更多的無用信息和噪聲,網(wǎng)絡(luò)數(shù)據(jù)需要高效魯棒的方法來實(shí)現(xiàn)去粗存精,去冗存真。搜索引擎就是從無結(jié)構(gòu)化數(shù)據(jù)中檢索出有用信息的一種工具。盡管搜索技術(shù)在工業(yè)上已經(jīng)取得極大的成功,仍然存在很多不足,都有待進(jìn)一步提高[8]。

2.2 應(yīng)對(duì)大數(shù)據(jù)的不確定性挑戰(zhàn)

大數(shù)據(jù)具有不確定性,其不確定性使得網(wǎng)絡(luò)數(shù)據(jù)難以被建模和學(xué)習(xí),從而難以有效利用其價(jià)值。大數(shù)據(jù)的不確定性表現(xiàn)為數(shù)據(jù)本身的不確定性、模型的不確定性和學(xué)習(xí)的不確定性。

數(shù)據(jù)本身的不確定性。原始數(shù)據(jù)的不準(zhǔn)確以及數(shù)據(jù)采集處理力度、應(yīng)用需求與數(shù)據(jù)集成和展示等因素帶來了數(shù)據(jù)在不同維度、不同尺度上都有不同程度的不確定性。傳統(tǒng)數(shù)據(jù)具有較為明顯的結(jié)構(gòu)性,其處理方法難以應(yīng)對(duì)海量、高維、多類型的不確定性數(shù)據(jù)。具體而言,在數(shù)據(jù)的采集、存儲(chǔ)、建模、查詢、檢索、挖掘等方面都需要有新的方法來應(yīng)對(duì)不確定性的挑戰(zhàn)。近年來,概率統(tǒng)計(jì)的方法被逐步應(yīng)用于不確定性數(shù)據(jù)的處理中。一方面,數(shù)據(jù)的不確定性要求我們使用不確定的方法加以應(yīng)對(duì);另一方面,計(jì)算機(jī)硬件的發(fā)展也為這類方法提供了效率、效能上的可能。目前,該領(lǐng)域研究尚淺,在學(xué)術(shù)界和產(chǎn)業(yè)界尚有大量問題亟待解決。

數(shù)據(jù)模型的不確定性。數(shù)據(jù)的不確定性要求對(duì)數(shù)據(jù)的處理方式有別于傳統(tǒng)的處理方法,能夠提出新的模型方法,并能夠把握模型的表達(dá)能力與復(fù)雜程度之間的平衡。在對(duì)不確定數(shù)據(jù)的建模和系統(tǒng)設(shè)計(jì)上,人們常用的是“可能世界模型”觀點(diǎn)。該觀點(diǎn)認(rèn)為,在一定的結(jié)構(gòu)規(guī)范下,應(yīng)將數(shù)據(jù)的每一種狀態(tài)都加以刻畫,但該種模型過于復(fù)雜,難以用一種通用的模型結(jié)構(gòu)來適應(yīng)具體的應(yīng)用需求。在實(shí)際應(yīng)用中,我們往往采取簡(jiǎn)化的模型刻畫不確定性數(shù)據(jù)的特性,如獨(dú)立性假設(shè)、同分布假設(shè)等等。概率圖模型由于具有很強(qiáng)的表達(dá)能力而且可對(duì)數(shù)據(jù)相關(guān)性進(jìn)行建模,因此已被廣泛應(yīng)用在不確定數(shù)據(jù)的建模領(lǐng)域。另外,在數(shù)據(jù)的管理和挖掘上面,不確定性模型的構(gòu)建應(yīng)當(dāng)考慮到圖書館系統(tǒng)數(shù)據(jù)的查詢、檢索、傳輸、展示等方面的影響。

數(shù)據(jù)學(xué)習(xí)的不確定性。數(shù)據(jù)模型通常都需要對(duì)模型參數(shù)進(jìn)行學(xué)習(xí)。然而,在很多情況下找到模型的最優(yōu)解是很困難的。因此很多學(xué)習(xí)問題都采用近似的、不確定的方法來尋找一個(gè)相對(duì)不錯(cuò)的解。但在大數(shù)據(jù)的背景下,傳統(tǒng)近似的、不確定的學(xué)習(xí)方法需要面對(duì)規(guī)模和時(shí)效的挑戰(zhàn)。如何將近似的、不確定的學(xué)習(xí)方法拓展到這種框架上成為當(dāng)前研究的重點(diǎn)。近年來,不少高校和研究機(jī)構(gòu),在該領(lǐng)域做出了探索。如在矩陣分解運(yùn)算中對(duì)數(shù)據(jù)進(jìn)行分塊的計(jì)算方法能夠利用多臺(tái)機(jī)器并行計(jì)算,從而提高數(shù)據(jù)的處理速度。近年來,在統(tǒng)計(jì)學(xué)習(xí)領(lǐng)域,非參模型方法的提出為自動(dòng)學(xué)習(xí)出模型復(fù)雜度和參數(shù)個(gè)數(shù)提供了一種思路。但該類模型計(jì)算上較為復(fù)雜,如何分布式地、并行地應(yīng)用到網(wǎng)絡(luò)大數(shù)據(jù)的處理上,還是一個(gè)開放問題,圖書館應(yīng)加強(qiáng)技術(shù)水平來應(yīng)對(duì)大數(shù)據(jù)的學(xué)習(xí)不確定性。

2.3 大數(shù)據(jù)的涌現(xiàn)性挑戰(zhàn)

涌現(xiàn)性是指多個(gè)要素組成系統(tǒng)后,出現(xiàn)了系統(tǒng)組成前單個(gè)要素所不具有的性質(zhì),這個(gè)性質(zhì)并不存在于任何單個(gè)要素當(dāng)中,而是系統(tǒng)在低層次構(gòu)成高層次時(shí)才表現(xiàn)出來,所以人們形象地稱其為“涌現(xiàn)”。系統(tǒng)功能之所以往往表現(xiàn)為“整體大于部分之和”,就是因?yàn)橄到y(tǒng)涌現(xiàn)了新質(zhì)的緣故。涌現(xiàn)性是網(wǎng)絡(luò)數(shù)據(jù)有別于其它數(shù)據(jù)的關(guān)鍵特性。涌現(xiàn)性在度量、研判與預(yù)測(cè)上的困難使得網(wǎng)絡(luò)數(shù)據(jù)難以被駕馭。網(wǎng)絡(luò)數(shù)據(jù)的涌現(xiàn)性主要表現(xiàn)為模式的涌現(xiàn)性、行為的涌現(xiàn)性和智慧的涌現(xiàn)性。

大數(shù)據(jù)的模式涌現(xiàn)性是指在多尺度、異質(zhì)關(guān)系的網(wǎng)絡(luò)數(shù)據(jù)中,由于不同的數(shù)據(jù)在屬性、功能等方面既存在差異又相互關(guān)聯(lián),因此使網(wǎng)絡(luò)大數(shù)據(jù)在結(jié)構(gòu)、功能等方面涌現(xiàn)出了局部結(jié)構(gòu)所不具備的特定模式特征。在結(jié)構(gòu)方面,數(shù)據(jù)之間不同的關(guān)聯(lián)程度使得數(shù)據(jù)構(gòu)成的網(wǎng)絡(luò)涌現(xiàn)出模塊結(jié)構(gòu)。在功能方面,網(wǎng)絡(luò)在演化過程中會(huì)自發(fā)地形成相互分離的連通小塊。

大數(shù)據(jù)的行為涌現(xiàn)性是指隨著數(shù)據(jù)采集技術(shù)的不斷發(fā)展,人們得到的很多數(shù)據(jù)都具有時(shí)序性,而社會(huì)網(wǎng)絡(luò)中個(gè)體行為的涌現(xiàn)性則是基于數(shù)據(jù)時(shí)序分布的統(tǒng)計(jì)結(jié)果。在社會(huì)網(wǎng)絡(luò)中有較大相似性的個(gè)體之間容易建立社會(huì)關(guān)系,當(dāng)這些個(gè)體在產(chǎn)生網(wǎng)絡(luò)數(shù)據(jù)時(shí)每一個(gè)體的行為同時(shí)出現(xiàn)在一個(gè)系統(tǒng)中時(shí),就表現(xiàn)為復(fù)雜的區(qū)別于個(gè)體的復(fù)雜性。

大數(shù)據(jù)的智慧涌現(xiàn)性是指網(wǎng)絡(luò)數(shù)據(jù)在沒有全局控制和預(yù)先定義的情況下,通過對(duì)來自大量自發(fā)個(gè)體的語義進(jìn)行互相融合和連接而形成語義,整個(gè)過程隨著數(shù)據(jù)的變化而持續(xù)演進(jìn),從而形成網(wǎng)絡(luò)數(shù)據(jù)的涌現(xiàn)語義,也可以稱之為智慧涌現(xiàn)。作為一種特殊的智慧涌現(xiàn)形式,眾包正在通過互聯(lián)網(wǎng)和社會(huì)網(wǎng)絡(luò)快速發(fā)展,成為一種新的商業(yè)模式、新的數(shù)據(jù)產(chǎn)生模式和新的數(shù)據(jù)處理協(xié)作模式??傮w而言,盡管與網(wǎng)絡(luò)大數(shù)據(jù)研究密切相關(guān)的數(shù)據(jù)庫、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和知識(shí)工程等領(lǐng)域近些年來都有很大的進(jìn)展,甚至在許多不同的領(lǐng)域得到了深入的應(yīng)用,但由于網(wǎng)絡(luò)大數(shù)據(jù)規(guī)模海量、關(guān)系復(fù)雜等根本特性,使得相關(guān)領(lǐng)域的研究成果難以被直接借鑒于網(wǎng)絡(luò)大數(shù)據(jù)的研究。到目前為止,大數(shù)據(jù)的精確定義還缺乏一個(gè)統(tǒng)一的標(biāo)準(zhǔn),網(wǎng)絡(luò)大數(shù)據(jù)科學(xué)需要一個(gè)完備的新的理論體系來指導(dǎo)該學(xué)科的發(fā)展和研究。

3 大數(shù)據(jù)背景下圖書館服務(wù)體系創(chuàng)新與重構(gòu)

3.1 大數(shù)據(jù)背景下的服務(wù)內(nèi)容創(chuàng)新與重構(gòu)

大數(shù)據(jù)背景下,圖書館的競(jìng)爭(zhēng)不僅僅是擁有的數(shù)據(jù)資源的多少,而是在數(shù)據(jù)類型與結(jié)構(gòu)上、數(shù)據(jù)的利用與開發(fā)上,即服務(wù)內(nèi)容創(chuàng)新。在自媒體時(shí)代,每個(gè)是都一個(gè)數(shù)據(jù)產(chǎn)生源,圖書館的用戶信息是極具價(jià)值的信息,如用戶信息行為數(shù)據(jù),這類目前還未完整收集的用戶行為等非結(jié)構(gòu)化數(shù)據(jù)將極具價(jià)值,很多的圖書館服務(wù)只有對(duì)大量的用戶數(shù)據(jù)挖掘、分析才能得出圖書館所需的決策參考,因此圖書館要重視這些非結(jié)構(gòu)化的大量的用戶數(shù)據(jù)與信息。對(duì)圖書館來說,在大數(shù)據(jù)時(shí)代的競(jìng)爭(zhēng)就是避免邊緣化,開展必要的大數(shù)據(jù)分析服務(wù)。圖書館開展的大數(shù)據(jù)分析服務(wù)業(yè)務(wù),主要可以有以下幾種: 首先是圖書館自身建設(shè)所需的大數(shù)據(jù)分析。這類分析一般以圖書館的現(xiàn)有數(shù)據(jù)位對(duì)象進(jìn)行分析,如讀者的借閱方式、行為愛好等,是一種對(duì)現(xiàn)有資源的分析與挖掘; 其次是客戶即讀者所需的大數(shù)據(jù)分析。這類分析業(yè)務(wù)類似于當(dāng)今圖書館為企業(yè)等客戶群體所做的信息情報(bào)參考、競(jìng)爭(zhēng)情報(bào)分析,但也有著很大的區(qū)別,如對(duì)于分析對(duì)象數(shù)據(jù)的不同、分析手段的不同、分析目的的不同等,這類分析業(yè)務(wù)所依靠的大量數(shù)據(jù)可能并非圖書館所擁有,從而成為限制該項(xiàng)業(yè)務(wù)發(fā)展的瓶頸,如何解決此類服務(wù)的數(shù)據(jù)問題是突破該瓶頸的關(guān)鍵[9]。

大數(shù)據(jù)的價(jià)值在于其背后的使用規(guī)律和產(chǎn)生規(guī)律,對(duì)大數(shù)據(jù)的分析要利用先進(jìn)的信息技術(shù),創(chuàng)新原有的分析方法和分析技術(shù),大量網(wǎng)絡(luò)社交等信息行為產(chǎn)生的大量非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)也讓許多學(xué)者開始思考去采集和利用這些信息。如果能夠采集到Web 日志的數(shù)據(jù),就能很好地滿足發(fā)現(xiàn)關(guān)聯(lián)規(guī)則、內(nèi)容分類和用戶聚類的需求,從而能提高個(gè)性化推薦的精度,進(jìn)而對(duì)定制 Web 日志的數(shù)據(jù)模型、過程及方法進(jìn)行探索。即對(duì)現(xiàn)有服務(wù)內(nèi)容進(jìn)行重構(gòu)。

3.2 大數(shù)據(jù)背景下的服務(wù)模式創(chuàng)新與重構(gòu)

在當(dāng)今時(shí)代,傳統(tǒng)的物理圖書館已轉(zhuǎn)變?yōu)閿?shù)字圖書館,圖書館的服務(wù)也發(fā)生了變化,從原來的點(diǎn)對(duì)點(diǎn)、線對(duì)點(diǎn)、面對(duì)點(diǎn)的傳統(tǒng)服務(wù)轉(zhuǎn)變?yōu)橐惑w化服務(wù)。不管是服務(wù)的方式、途徑、模式等也都將發(fā)生改變。從服務(wù)的理念上轉(zhuǎn)變?yōu)榛跀?shù)據(jù)的服務(wù),以“大數(shù)據(jù)”為基礎(chǔ),圍繞從數(shù)據(jù)匯聚到信息加工,知識(shí)服務(wù),智慧服務(wù)的四個(gè)層次展開一體化服務(wù)。即服務(wù)模式的創(chuàng)新[10]。

大數(shù)據(jù)時(shí)代下,數(shù)據(jù)資源是海量的,理論上一個(gè)圖書館可以收集所有的數(shù)據(jù)資源,如各類文獻(xiàn)資源,科研成果,學(xué)術(shù)交流,甚至包括各種訪問,社交日志信息等各種網(wǎng)絡(luò)資源。提供資源之間的無縫鏈接,提供各種數(shù)據(jù)管理服務(wù),包括存儲(chǔ)備份、元數(shù)據(jù)加工、數(shù)據(jù)發(fā)布,數(shù)據(jù)共享等。在數(shù)據(jù)的洪流中,異構(gòu)、分布和海量的各種數(shù)據(jù)資源得以匯聚及融合,形成中心知識(shí)庫,通過預(yù)索引的方式,為用戶提供快速,簡(jiǎn)單,易用的資源發(fā)現(xiàn)及獲取服務(wù),建立一體化數(shù)據(jù)資源服務(wù)平臺(tái)[7]。但是,這些數(shù)據(jù)來源于不同的機(jī)構(gòu)知識(shí)庫或讀者個(gè)人,圖書館可以充分利用機(jī)構(gòu)優(yōu)勢(shì)有組織地通過對(duì)各類數(shù)據(jù)源的定位和連接,實(shí)現(xiàn)數(shù)據(jù)的采集、傳輸和匯聚。鼓勵(lì)讀者開放存取各種數(shù)字資源,使用戶不僅是資源的接受者和學(xué)習(xí)者,而且是資源的的發(fā)布者和貢獻(xiàn)者。

在大數(shù)據(jù)環(huán)境下,圖書館應(yīng)利用知識(shí)服務(wù)平臺(tái)重構(gòu)服務(wù)模式,通過對(duì)匯集數(shù)據(jù)的加工整理,數(shù)據(jù)建模,提高數(shù)據(jù)的價(jià)值密度。探索以數(shù)據(jù)為基礎(chǔ)的知識(shí)發(fā)現(xiàn)分析,通過基于數(shù)據(jù)的增值服務(wù),面向用戶、滿足用戶的學(xué)科知識(shí)需求,開展知識(shí)服務(wù)。如以學(xué)科為基礎(chǔ),將不同學(xué)科用戶的檢索瀏覽下載的信息行為數(shù)據(jù)進(jìn)行分類加工整理,將信息的可視化服務(wù)、數(shù)據(jù)挖掘的智慧服務(wù)進(jìn)行重構(gòu),以便發(fā)揮大數(shù)據(jù)背景下圖書館的最大功能。

4 結(jié)束語

大數(shù)據(jù)已深入到我們生活的各個(gè)層面與各個(gè)角落,已無法抗拒,只有擁抱大數(shù)據(jù)。大數(shù)據(jù)伴隨著云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等信息技術(shù)的成熟而迅速發(fā)展,并且越來越受到業(yè)界和學(xué)術(shù)界的關(guān)注,相較于過去幾十年數(shù)字圖書館的研究與發(fā)展,大數(shù)據(jù)技術(shù)在未來幾年給云圖書館將會(huì)帶來革命性、持續(xù)性和創(chuàng)造性的變化,會(huì)對(duì)我們所熟知的知識(shí)服務(wù)能力和知識(shí)服務(wù)機(jī)制產(chǎn)生重大的顛覆和創(chuàng)新,也對(duì)現(xiàn)有的技術(shù)和方法提出更高的要求,而這一切可能會(huì)超出我們正常期待的范圍。綜合分析過去兩年內(nèi)對(duì)大數(shù)據(jù)技術(shù)的關(guān)注和研究,在未來幾年,新型的大數(shù)據(jù)獲取、存儲(chǔ)、組織、分析和決策過程中,體系架構(gòu)、計(jì)算模型、數(shù)據(jù)模型、智能輔助決策模型、性能優(yōu)化模型及知識(shí)服務(wù)模型等方面,將會(huì)出現(xiàn)更多的研究成果。大數(shù)據(jù)技術(shù)是圖書情報(bào)領(lǐng)域無法逃避的未來技術(shù)發(fā)展形態(tài),必將重構(gòu)圖書館的服務(wù)體系。

參考文獻(xiàn)

[1]劉瓊.大數(shù)據(jù)環(huán)境下圖書館面臨的影響與挑戰(zhàn)[J].理論觀察,2013,8:112-113.

[2]馮芷艷,郭迅華,等.大數(shù)據(jù)背景下商務(wù)管理研究若干前沿課題[J].管理科學(xué)學(xué)報(bào),2013.

[3]孫琳.大數(shù)據(jù)時(shí)代圖書館服務(wù)體系創(chuàng)新研究[J].理論觀察,2013.

[4]http://en.wikipedia.org/wiki/Big_data.

[5]http://www.gartner.com/it-glossary/big-data/.

[6]http://www.nsf.gov/funding/pgm_summ.jsp?pims_id=504767.

[7]韓翠峰.大數(shù)據(jù)時(shí)代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013.

[8]國(guó)家圖書館面向地方開放120TB數(shù)字資源[Z].2013-7-28.

http://roll.sohu.com/20130304/n367700292.shtml.

[9]王元卓,靳小龍,等.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2013.

[10]韓翠峰.大數(shù)據(jù)時(shí)代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013.

[11]朱靜薇,李紅艷.大數(shù)據(jù)時(shí)代下圖書館的挑戰(zhàn)及其應(yīng)對(duì)策略[J].現(xiàn)代情報(bào),2013.

作者簡(jiǎn)介:劉瓊(1971-),女,淮陰工學(xué)院圖書館管理員,研究方向:計(jì)算機(jī)與圖書管理。

猜你喜歡
服務(wù)體系重構(gòu)大數(shù)據(jù)
智慧出行,智繪未來——新一代出行服務(wù)體系構(gòu)建與實(shí)踐探討
長(zhǎng)城敘事的重構(gòu)
“三效合一”構(gòu)建現(xiàn)代農(nóng)業(yè)服務(wù)體系
建好公共法律服務(wù)體系“最后一公里”
北方大陸 重構(gòu)未來
北京的重構(gòu)與再造
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
論中止行為及其對(duì)中止犯的重構(gòu)
初具規(guī)模的健康管理服務(wù)體系