国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)帶給圖書館的影響和挑戰(zhàn)

2014-04-07 20:08石岱
關(guān)鍵詞:海量結(jié)構(gòu)化圖書館

石岱

(黑龍江大學(xué)信息管理學(xué)院,黑龍江哈爾濱150080)

如今,大數(shù)據(jù)對于我們并不陌生,大數(shù)據(jù)這個(gè)詞也并不生疏,早在1980年代,美國就有人提出了大數(shù)據(jù)的概念[1]。而將“大數(shù)據(jù)”作為全球性發(fā)展戰(zhàn)略計(jì)劃,則始于2012年2月美國奧巴馬政府宣布推出的“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”,該方案計(jì)劃投資兩億多美元,在美國國家科學(xué)基金、美國國防部等6家政府部門協(xié)作下,大力推動(dòng)及改善與大數(shù)據(jù)相關(guān)的采集、組織、分析、決策工具及技術(shù)[2]。

1.大數(shù)據(jù)

1.1 概念

業(yè)內(nèi)對大數(shù)據(jù)沒有一個(gè)統(tǒng)一的概念,但是比較公認(rèn)的是以下這種說法。大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。

1.2 特點(diǎn)

大數(shù)據(jù)的4V特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)、Veracity(精確)。第一,數(shù)據(jù)體量巨大。從TB級別,躍升到PB級別;第二,數(shù)據(jù)類型繁多。以前的數(shù)據(jù)結(jié)構(gòu)單一,現(xiàn)金則呈現(xiàn)出結(jié)構(gòu)復(fù)雜的特點(diǎn),結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)使對于大數(shù)據(jù)的處理更加復(fù)雜;第三,價(jià)值密度低,商業(yè)價(jià)值高。價(jià)值密度低體現(xiàn)在海量數(shù)據(jù)中可能僅有僅一少部分有效信息,但這少部分的有效信息卻富含商業(yè)價(jià)值;第四,處理速度快,1秒定律。這點(diǎn)也是與傳統(tǒng)數(shù)據(jù)挖掘不同的體現(xiàn)。

“大數(shù)據(jù)”與“海量數(shù)據(jù)”并不完全相同,“大數(shù)據(jù)”在數(shù)量上包含“海量數(shù)據(jù)”,但“大數(shù)據(jù)”在時(shí)間或速度維度上又區(qū)別于“海量數(shù)據(jù)”。結(jié)構(gòu)的復(fù)雜化,處理數(shù)據(jù)的速度和效率都有別于“海量數(shù)據(jù)”。

1.3 大數(shù)據(jù)的影響

1.3.1 大數(shù)據(jù)將成為一種新的決策工具

2009年爆發(fā)的甲型H1N1流感,谷歌公司通過google瀏覽器中隱藏的大量數(shù)據(jù)對用戶檢索進(jìn)行分析,從而預(yù)知了流感的發(fā)生,并確定了傳播區(qū)域,從而帶給公共衛(wèi)生部門極有價(jià)值的信息,大大縮短了研究時(shí)間,而這個(gè)預(yù)測比疾控中心的判斷提前了一兩周的時(shí)間。

美國的Farecast飛機(jī)票價(jià)預(yù)測系統(tǒng),也通過各種旅游網(wǎng)站獲得大量數(shù)據(jù)進(jìn)行分析,從而幫助乘客選擇最佳購票時(shí)機(jī),并降低了購票成本。

大數(shù)據(jù)的預(yù)知與決策的功能將幫助我們更好地分析與決策,節(jié)省不必要的時(shí)間與成本,從而帶來更高的收益。

1.3.2 信息技術(shù)與各行業(yè)的深度融合

大數(shù)據(jù)時(shí)代下對各行業(yè)的發(fā)展都提出了新的挑戰(zhàn)。醫(yī)療、教育、金融、IT等行業(yè)都呈現(xiàn)出巨量增長的數(shù)據(jù)。而有專家則提出,未來10年,大數(shù)據(jù)及其分析將改變幾乎每一個(gè)行業(yè)的業(yè)務(wù)功能。美國大公司平均擁有的數(shù)據(jù)量,遠(yuǎn)超過美國國會(huì)圖書館所有的數(shù)據(jù)量,而這些數(shù)據(jù)則有可能改變其業(yè)務(wù)功能。

1.3.3 大數(shù)據(jù)推動(dòng)新發(fā)展

大數(shù)據(jù)的特點(diǎn)之一就是結(jié)構(gòu)的復(fù)雜性,而這些復(fù)雜的結(jié)構(gòu)需要更新的技術(shù)來支撐分析。大數(shù)據(jù)的到來無疑會(huì)帶動(dòng)新的技術(shù)的發(fā)展,而大數(shù)據(jù)的有效利用,也依賴于技術(shù)的保障,只有更新、更有力的新技術(shù)才能更好地利用大數(shù)據(jù)。

2.大數(shù)據(jù)和圖書館的關(guān)系

2.1 大數(shù)據(jù)的積累,為圖書館帶來了海量信息

由于信息技術(shù)的發(fā)展,尤其是大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)的積累與技術(shù)的結(jié)合,促進(jìn)了圖書館中數(shù)字資源的產(chǎn)生。這種電子資源的數(shù)量和種類都與日俱增,正在超越紙本資源。據(jù)調(diào)查,全球新產(chǎn)出的信息量每3年翻一番,大約90%的信息都是以數(shù)據(jù)形式儲(chǔ)存[3]。如此巨大的數(shù)據(jù)增長,就需要圖書館對于數(shù)據(jù)存儲(chǔ)的能力有一定要求。

2.2 網(wǎng)絡(luò)技術(shù)的提高,高速網(wǎng)絡(luò)的實(shí)現(xiàn),移動(dòng)電話的便捷,給移動(dòng)圖書館帶來了更大的空間

根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)今天對外發(fā)布《第32次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至6月底,我國網(wǎng)民規(guī)模達(dá)5.91億,較2012年底增加2 656萬人。新增網(wǎng)民中使用手機(jī)上網(wǎng)的比例高達(dá)70%,而半年期新增網(wǎng)民中農(nóng)村網(wǎng)民占54.4%。網(wǎng)民數(shù)量的劇增與移動(dòng)網(wǎng)絡(luò)的便捷都使得移動(dòng)圖書館更加便利。

3.大數(shù)據(jù)對于圖書館的影響與挑戰(zhàn)

3.1 對于技術(shù)的要求

大數(shù)據(jù)的到來,對于數(shù)據(jù)處理的技術(shù)要求提升,傳統(tǒng)的數(shù)據(jù)處理滿足不了多結(jié)構(gòu)化、海量信息的要求。館藏信息量的增大,要求圖書館的數(shù)據(jù)處理技術(shù)的提升。不僅是處理結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)的處理也成為數(shù)據(jù)處理的一部分,各種非結(jié)構(gòu)化的數(shù)據(jù)又增加了大數(shù)據(jù)的復(fù)雜性。對數(shù)據(jù)的掌握將成為圖書館的核心資產(chǎn),而對這些數(shù)據(jù)的利用則需要處理技術(shù)的支持。圖書館可以根據(jù)數(shù)據(jù)的分析來掌握用戶借閱習(xí)慣,根據(jù)數(shù)據(jù)分析服務(wù)消費(fèi)記載,提高服務(wù)質(zhì)量等。

3.2 對于人員的要求

在面對大數(shù)據(jù)的時(shí)候,圖書館人員對于大數(shù)據(jù)的認(rèn)知和理解局限了對于數(shù)據(jù)的進(jìn)一步分析加工,對于圖書館及其人員來說,大數(shù)據(jù)還十分陌生,并不是所有人員都能夠很好地處理分析所接收到的大數(shù)據(jù),可能會(huì)將有可能有價(jià)值的信息忽略掉,從而使其失去價(jià)值,或者對于處理和分析大數(shù)據(jù)的能力尚未掌握,也會(huì)導(dǎo)致大量有效信息的流失[4]。所以這更需要圖書館相關(guān)人員對于大數(shù)據(jù)相關(guān)知識的進(jìn)一步了解與認(rèn)識。

3.3 對于存儲(chǔ)能力的要求

現(xiàn)代完備的圖書館不僅有圖書借閱信息、借閱人員信息外,還大量存儲(chǔ)了圖書本身的資料數(shù)據(jù),尤其是大型或者學(xué)校的圖書館,各類書目、內(nèi)容與數(shù)量上都很多。當(dāng)前大型圖書館每年的數(shù)據(jù)增量大約為20~30TB,如此浩大的數(shù)據(jù)量,對于一個(gè)擁有100TB存儲(chǔ)容量的圖書館也只能滿足3~5年的數(shù)據(jù)存儲(chǔ)需要。但是現(xiàn)今圖書館的存儲(chǔ)設(shè)備的利用率低,還不過總?cè)萘康囊话耄€有很多的空間可以挖掘。這需要圖書館在數(shù)據(jù)存儲(chǔ)方面作出改變,可以利用壓縮技術(shù)、消重技術(shù)、提高空間利用率等手段,對館藏?cái)?shù)據(jù)進(jìn)行整理整合,完善存儲(chǔ)[5]。

3.4 對于改善服務(wù)的要求

圖書館的智能化服務(wù)已經(jīng)是大數(shù)據(jù)時(shí)代下圖書館發(fā)展的趨勢,不僅需要智能化的技術(shù)處理、分析數(shù)據(jù),更需要智能化的服務(wù)來面對讀者。服務(wù)的內(nèi)容和手段的智能化提高有利于服務(wù)對象的滿意度提高。智能化的分析大量并且結(jié)構(gòu)復(fù)雜的讀者數(shù)據(jù),了解讀者閱讀習(xí)慣,有利于推送等服務(wù)的開展,有利于圖書館服務(wù)的開展[6]。

4.結(jié)束語

大數(shù)據(jù)時(shí)代的到來,給很多領(lǐng)域帶來了機(jī)會(huì)和挑戰(zhàn),對于圖書館情報(bào)領(lǐng)域也不例外。大數(shù)據(jù)的海量特征為我們能找到所需信息提供了可能性,但同時(shí)其結(jié)構(gòu)的復(fù)雜性又對數(shù)據(jù)處理技術(shù)提出了更高的要求。圖書館作為現(xiàn)代社會(huì)中公共信息服務(wù)體系必要的組成部分,不可避免地會(huì)受到社會(huì)技術(shù)應(yīng)用潮流的影響,對于大數(shù)據(jù)的掌握是將圖書館的發(fā)展走向現(xiàn)代化的必經(jīng)之路。技術(shù)上的提高與圖書館相關(guān)人員知識的提升都影響著大數(shù)據(jù)時(shí)代下圖書管的發(fā)展,所以,圖書館若想在大數(shù)據(jù)時(shí)代良好的發(fā)展,應(yīng)該了解大數(shù)據(jù)并合理利用大數(shù)據(jù),對現(xiàn)在模式進(jìn)行改善,從服務(wù)、人員培訓(xùn)、技術(shù)更新等方面提出要求。提升其核心競爭力,以最優(yōu)狀態(tài)在大數(shù)據(jù)時(shí)代中發(fā)展。

[1]張文彥.大數(shù)據(jù)時(shí)代的圖書館初探[J].圖書與情報(bào),2012(6).

[2][4]樊偉紅,李晨暉,張興旺,秦曉珠,郭自寬.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012(11).

[3]朱靜薇,李紅艷.大數(shù)據(jù)時(shí)代下圖書館的挑戰(zhàn)及其應(yīng)對策略[J].現(xiàn)代情報(bào),2013(5).

[5]羅彬,陽靜,袁赟.數(shù)字圖書館中大數(shù)據(jù)存儲(chǔ)的應(yīng)用研究[J].科技與企業(yè),2013(18).

[6]韓翠峰.大數(shù)據(jù)時(shí)代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013(1).

猜你喜歡
海量結(jié)構(gòu)化圖書館
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
促進(jìn)知識結(jié)構(gòu)化的主題式復(fù)習(xí)初探
結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
海量快遞垃圾正在“圍城”——“綠色快遞”勢在必行
圖書館
基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
基于軟信息的結(jié)構(gòu)化轉(zhuǎn)換
基于文件系統(tǒng)的分布式海量空間數(shù)據(jù)高效存儲(chǔ)與組織研究