国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)環(huán)境下高校圖書館創(chuàng)新服務(wù)初探

2016-05-14 12:08:45符雅諾
未來英才 2016年7期
關(guān)鍵詞:結(jié)構(gòu)化圖書館資源

符雅諾

摘要:文章通過大數(shù)據(jù)這一概念的闡述和分析,結(jié)合行業(yè)對(duì)大數(shù)據(jù)的應(yīng)用,引出在大數(shù)據(jù)時(shí)代背景下,高校圖書館應(yīng)分析挖掘收集到的結(jié)構(gòu)化、半結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)中的重要信息,解讀其中的關(guān)聯(lián)性,整合關(guān)聯(lián)信息,預(yù)測(cè)服務(wù)方向,是圖書館未來創(chuàng)新服務(wù)的重要發(fā)展趨勢(shì)。

關(guān)鍵字:大數(shù)據(jù);圖書館;服務(wù)

全球知名咨詢公司麥肯錫(Mckinseyand Company)于2011年5發(fā)布了《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿領(lǐng)域》報(bào)告,首次提出了“大數(shù)據(jù)”這一概念,并在報(bào)告中指出“數(shù)據(jù)已經(jīng)滲透到每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素;而人們對(duì)于海量數(shù)據(jù)的運(yùn)用將預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來?!盵1]2012年的美國(guó)總統(tǒng)競(jìng)選期間,奧巴馬的競(jìng)選團(tuán)隊(duì)利用大數(shù)據(jù)來分析預(yù)測(cè)選民的結(jié)構(gòu)組成、政治需求、社交關(guān)系、行為特征、生活習(xí)慣與興趣愛好,制定出基于大數(shù)據(jù)驅(qū)動(dòng)的資金籌集和競(jìng)選決策,并最終獲得競(jìng)選勝利。之后奧巴馬政府宣布推出的“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”,該方案計(jì)劃投資兩億多美元,在美國(guó)國(guó)家科學(xué)基金、美國(guó)國(guó)防部等六家政府部門協(xié)作下,大力推動(dòng)及改善與大數(shù)據(jù)相關(guān)的采集、組織、分析、決策工具及技術(shù)[2]。

從提出到推廣應(yīng)用,經(jīng)過這幾年的發(fā)展,大數(shù)據(jù)的研究與應(yīng)用已經(jīng)滲透到全行業(yè)的各個(gè)方面,大到政策的制定,小到商品的銷售推廣,都與大數(shù)據(jù)的運(yùn)用密切相關(guān)。大數(shù)據(jù)時(shí)代,如何有效利用大數(shù)據(jù)來發(fā)展圖書館的業(yè)務(wù)也是這兩年的熱點(diǎn)前沿。重視分析結(jié)構(gòu)化數(shù)據(jù),更深層的挖掘非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),整合關(guān)聯(lián)信息,預(yù)測(cè)服務(wù)方向,是圖書館未來創(chuàng)新服務(wù)的重要發(fā)展方向。

一、大數(shù)據(jù)的特征及應(yīng)用

1、大數(shù)據(jù)的四種特征。大數(shù)據(jù)(Big Data)是指“無法用現(xiàn)有的軟件工具提取、存儲(chǔ)、搜索、共享、分析和處理的海量的、復(fù)雜的數(shù)據(jù)集合?!奔夹g(shù)上,存儲(chǔ)數(shù)據(jù)的大小達(dá)到PB級(jí)或EB級(jí)的海量數(shù)據(jù)我們都稱之為“大數(shù)據(jù)”。但顯然,數(shù)據(jù)“大”不等于“大數(shù)據(jù)”。大數(shù)據(jù)不是對(duì)數(shù)據(jù)規(guī)模的定量描述,而是一種在類型繁多、數(shù)量龐大的多樣化數(shù)據(jù)中進(jìn)行的快速信息提取的技術(shù)和思維[3]。

業(yè)界通常用4個(gè)V(即Volume、Variety、Velocity、Value)來概括大數(shù)據(jù)的特征:①數(shù)據(jù)體量巨大(Volume):數(shù)據(jù)量巨大,數(shù)量單位從TB躍升至PB,甚至EB級(jí)別,傳統(tǒng)的存儲(chǔ)與計(jì)算已經(jīng)無法處理呈指數(shù)級(jí)別的數(shù)據(jù)增長(zhǎng)速度;②數(shù)據(jù)類型繁多(Variety):傳統(tǒng)數(shù)據(jù)管理流程無法處理異構(gòu)和可變的大數(shù)據(jù),這些數(shù)據(jù)可能具備結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化屬性,如訪問日志、網(wǎng)絡(luò)檢索歷史記錄、Email、社交媒體、音頻視頻、和傳感器數(shù)據(jù)等,甚至包括隨時(shí)間演變、不一致的和沖突的數(shù)據(jù)格式;③處理速度快(Velocity):這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。數(shù)據(jù)即時(shí)生成,同時(shí)要求按需提供交互式的、實(shí)時(shí)或準(zhǔn)實(shí)時(shí)的數(shù)據(jù)分析,而數(shù)據(jù)分析的新趨勢(shì),則是超越常規(guī)數(shù)據(jù)分析模型的深度分析需求的增長(zhǎng),因?yàn)橛脩舨粌H僅需要通過數(shù)據(jù)了解現(xiàn)在發(fā)生了什么,更需要利用數(shù)據(jù)及時(shí)地對(duì)將要發(fā)生什么進(jìn)行預(yù)測(cè);④價(jià)值密度低(Value):有價(jià)值的數(shù)據(jù)需要從海量的非結(jié)構(gòu)化與半結(jié)構(gòu)化數(shù)據(jù)中挖掘,并且如何通過強(qiáng)大的機(jī)器算法更迅速地完成數(shù)據(jù)的價(jià)值“提純”成為目前大數(shù)據(jù)背景下須臾解決的難題[4]。

2、大數(shù)據(jù)的商業(yè)應(yīng)用。大數(shù)據(jù)最開始就是伴隨著經(jīng)濟(jì)增長(zhǎng)與互聯(lián)網(wǎng)云計(jì)算技術(shù)的發(fā)展應(yīng)運(yùn)而生的,就如麥肯錫報(bào)告里所說“海量數(shù)據(jù)的運(yùn)用將預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來”。大數(shù)據(jù)最直觀的運(yùn)用也是在商業(yè)智能和市場(chǎng)營(yíng)銷這兩個(gè)方面。前期數(shù)據(jù)的抓取和信息分析關(guān)聯(lián)預(yù)測(cè),為后期的商業(yè)決策及商品銷售提供了最有效的方案。阿里巴巴旗下的淘寶網(wǎng)就是大數(shù)據(jù)的“資深玩家”。我們可以發(fā)現(xiàn),不同人群打開淘寶網(wǎng)頁所看到的廣告是不一樣的,關(guān)注養(yǎng)生的中老年用戶看到的保健品廣告居多,而愛美的女性看到的服飾、護(hù)膚品居多。這就是因?yàn)橛脩粼谔詫毶厦恳淮吸c(diǎn)擊、瀏覽都會(huì)留下痕跡,這些痕跡就是他們數(shù)據(jù)的來源。結(jié)合用戶的搜索、購買歷史,根據(jù)用戶的地域性、年齡段,來分析用戶的購買習(xí)慣,并且推測(cè)出用戶的購買需求,由此進(jìn)行準(zhǔn)確的有針對(duì)性的廣告投放,已期達(dá)到收益最大化?,F(xiàn)如今,大數(shù)據(jù)的應(yīng)用已經(jīng)深入到社會(huì)生活的每一個(gè)角落。對(duì)圖書館來說,在大數(shù)據(jù)時(shí)代要想在激烈的市場(chǎng)份額競(jìng)爭(zhēng)中爭(zhēng)得一席之地,避免邊緣化,開展必要的大數(shù)據(jù)分析服務(wù)也顯得必不可少。

二、大數(shù)據(jù)背景下圖書館的創(chuàng)新服務(wù)

隨著社會(huì)信息化進(jìn)程的加快, 國(guó)內(nèi)高校圖書館基本實(shí)現(xiàn)了以互聯(lián)網(wǎng)為基礎(chǔ)的信息化建設(shè),以互聯(lián)網(wǎng)信息搜索、查詢?yōu)榛A(chǔ)的知識(shí)信息服務(wù)已經(jīng)成為圖書館服務(wù)體系中不可或缺的一部分。大數(shù)據(jù)時(shí)代的高校圖書館依舊以互聯(lián)網(wǎng)為基礎(chǔ),服務(wù)模式將從數(shù)據(jù)信息的提供轉(zhuǎn)變?yōu)閷?duì)數(shù)據(jù)的挖掘。利用大數(shù)據(jù)技術(shù)去挖掘、識(shí)別、組織與分析隱含在用戶行為中的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)信息,尋找他們的隱性訴求進(jìn)而改進(jìn)圖書館的服務(wù),也使高校圖書館能夠找到更好的服務(wù)模式面對(duì)未來的挑戰(zhàn)[5]。

1、數(shù)據(jù)信息的收集。 大數(shù)據(jù)時(shí)代的高校圖書館服務(wù)所需的數(shù)據(jù)量也是海量的,當(dāng)中既有當(dāng)前圖書館正在建設(shè)的文獻(xiàn)資源、數(shù)字資源、網(wǎng)絡(luò)資源等結(jié)構(gòu)化數(shù)據(jù),也有目前圖書館還無法進(jìn)行或暫時(shí)沒有建設(shè)的半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),如大量的用戶信息行為數(shù)據(jù),這些還未完整收集的用戶數(shù)據(jù)將極具價(jià)值。用戶查詢書目產(chǎn)生的OPAC日志,借還書產(chǎn)生的流通日志,檢索瀏覽下載電子資源產(chǎn)生的日志數(shù)據(jù),訪問產(chǎn)生的流量數(shù)據(jù)及各種社交網(wǎng)絡(luò)等[6],這些數(shù)據(jù)不但記錄用戶的個(gè)人信息,還隱藏用戶的閱讀習(xí)慣、偏好,通過對(duì)這些數(shù)據(jù)進(jìn)行挖掘提煉,描述用戶的行為,準(zhǔn)確定位用戶的閱讀需求。

2、數(shù)據(jù)的關(guān)聯(lián)與分析。高校圖書館開展的大數(shù)據(jù)分析服務(wù)業(yè)務(wù),主要基于以下兩個(gè)方面:圖書館自身建設(shè)所需的大數(shù)據(jù)分析。這類分析一般以圖書館的已有數(shù)據(jù)為對(duì)象進(jìn)行分析,如讀者的借閱記錄、閱讀偏好等,是一種對(duì)現(xiàn)有資源的分析與挖掘。對(duì)這類數(shù)據(jù)進(jìn)行深層次分析,挖掘其潛在的關(guān)聯(lián)性,可以對(duì)讀者需求發(fā)展趨勢(shì)進(jìn)行準(zhǔn)確的預(yù)測(cè)。用戶所需的大數(shù)據(jù)分析。這類分析業(yè)務(wù)主要服務(wù)于學(xué)科教學(xué)與學(xué)術(shù)研究。其依靠的大量數(shù)據(jù)可能并非圖書館所擁有,需要加強(qiáng)與院系之間的溝通與合作,從被動(dòng)的角色轉(zhuǎn)變?yōu)橹鲃?dòng)的信息提供方。

3、圖書館服務(wù)的數(shù)據(jù)化、智能化。未來圖書館所提供的服務(wù)是基于大數(shù)據(jù)的智能化服務(wù)。圖書館根據(jù)所收集到的用戶閱讀行為和社會(huì)關(guān)系數(shù)據(jù),準(zhǔn)確分析、預(yù)測(cè)未來讀者閱讀需求和行為發(fā)展[7],向讀者主動(dòng)提供信息推送服務(wù),滿足其個(gè)性化的智能服務(wù)。圖書館降低運(yùn)營(yíng)成本和服務(wù)模式復(fù)雜度的同時(shí),還提高服務(wù)效率和用戶滿意度。

4、應(yīng)用案例——澳大利亞“圖書館立方”項(xiàng)目簡(jiǎn)述[8]。2009年,臥龍崗大學(xué)圖書館(University of Wollongong Library,簡(jiǎn)稱UWL)與該???jī)效指標(biāo)管理中心(PerformanceIndicator Unit,簡(jiǎn)稱PIU)合作開發(fā)了“圖書館立方”(Library Cule,簡(jiǎn)稱LC)項(xiàng)目,將學(xué)生的圖書館使用記錄與PIU已有的數(shù)據(jù)庫相關(guān)聯(lián),一方面評(píng)估圖書館在教學(xué)活動(dòng)中的影響和價(jià)值,另一方面也希望通過收集反饋信息以擴(kuò)大圖書館信息資源的影響和提高圖書館的價(jià)值,同時(shí)為學(xué)校的教學(xué)政策制定提供數(shù)據(jù)支撐。

工作人員通過“圖書館立方”的數(shù)據(jù)分析發(fā)現(xiàn),臥龍崗大學(xué)學(xué)生的學(xué)習(xí)成績(jī)與其利用圖書館信息資源(電子或紙質(zhì)資源)的情況密切相關(guān),使用圖書館電子資源的時(shí)間越長(zhǎng),借閱館藏次數(shù)越多的學(xué)生,其學(xué)習(xí)成績(jī)可能越好;或者,學(xué)習(xí)成績(jī)?cè)胶玫膶W(xué)生可能越長(zhǎng)時(shí)間地使用圖書館的電子資源或更多的次數(shù)的借閱館藏。這充分體現(xiàn)了高校圖書館的重要性和價(jià)值創(chuàng)造作用。

工作人員分析數(shù)據(jù)時(shí)發(fā)現(xiàn),圖書館紙質(zhì)館藏和電子信息資源與學(xué)生成績(jī)之間的關(guān)系呈正比的同時(shí),也存在一定的差異。分析其原因,主要有以下兩方面因素。

首先,2010年臥龍崗大學(xué)有接近30%的學(xué)生沒有借過 1 本書,而沒使用電子資源的學(xué)生只有8%;其次,館藏借閱次數(shù)最多和使用電子資源時(shí)間最長(zhǎng)的學(xué)生平均分?jǐn)?shù)之間差別較大,且它們與相對(duì)應(yīng)的從不借閱館藏或使用電子資源的學(xué)生的平均分?jǐn)?shù)之間的差距分別是 11分和19分。

這從另一個(gè)側(cè)面反映出隨著信息技術(shù)的不斷發(fā)展人們信息使用習(xí)慣的變化,即電子資源比傳統(tǒng)的紙質(zhì)資源得到了更廣泛和便利的使用,這為圖書館的信息資源建設(shè)傳遞了重要信號(hào)。

上述研究表明,一方面“圖書館立方”項(xiàng)目的開展非常有利于圖書館向?qū)W校管理委員會(huì)和其他上級(jí)機(jī)構(gòu)很好地展示其為學(xué)校的教學(xué)活動(dòng)創(chuàng)造的價(jià)值;另一方面也獲得了一些預(yù)期之外的科學(xué)結(jié)論(如性別、年齡、成績(jī)等社會(huì)變量與圖書館用戶行為之間的關(guān)系),進(jìn)而為圖書館未來的推廣活動(dòng)提供準(zhǔn)確的細(xì)分目標(biāo)群體,以提高活動(dòng)的針對(duì)性和執(zhí)行效率。

三、結(jié)語

數(shù)字信息時(shí)代帶來的變革已席卷了整個(gè)IT相關(guān)行業(yè),大數(shù)據(jù)的相關(guān)技術(shù)與思維也已經(jīng)改變了許多行業(yè)的未來。同時(shí),大數(shù)據(jù)的運(yùn)用也已經(jīng)漸漸影響到高校圖書館的服務(wù)模式和發(fā)展思路。服務(wù)是圖書館價(jià)值體現(xiàn)的核心,也是其存在的價(jià)值與意義所在。新的時(shí)代,如何更好的利用新的技術(shù),提高圖書館的服務(wù)水平,提升圖書館的核心競(jìng)爭(zhēng)力,將是日后我們應(yīng)該更多思考的內(nèi)容。

參考文獻(xiàn)

[1] Big data: The next frontier for innovation,competition,and productivi-ty.http:// www.mckinsey.com/Insights/ MGI/Research/Technology_and_Innovation/Big_data_The_next_frontier_for_ innovation.2012.08.01.

[2] The White House.Big Data Across the Federal Government[R/OL].[2012-8-10].http://www.whitehouse.gov/ sites/default/files/microsites/ostp/big_ data_fact_sheet.pdf.

[3] 韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報(bào),2013(5):37-40.

[4] 樊偉紅,圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志2012,30(11),68.

[5] 張曉林,李麟,劉細(xì)文,等.開放獲取學(xué)術(shù)信息資源:逼近“主流化”轉(zhuǎn)折點(diǎn)[J].圖書情報(bào)工作,2012,(9):42-47.

[6] 朱靜薇.大數(shù)據(jù)時(shí)代下圖書館的挑戰(zhàn)及其應(yīng)對(duì)策略[J].現(xiàn)代情報(bào),2013(5),11-13.

[7] 江波,覃燕梅.掌上圖書館、手機(jī)圖書館與移動(dòng)圖書館比較分析[J].圖書館論壇.2012(1),69-71,88.

[8] CoxBL,JanttiMH.Capturing Business Intelligence Required for Targeted Marketing, Demonstrating Value,and Driving Process Improvement[J].Li brary&InformationScienceResear ch,2012,34(4):308-316.

猜你喜歡
結(jié)構(gòu)化圖書館資源
基礎(chǔ)教育資源展示
促進(jìn)知識(shí)結(jié)構(gòu)化的主題式復(fù)習(xí)初探
結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
一樣的資源,不一樣的收獲
資源回收
圖書館
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
飛躍圖書館
基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
去圖書館
玉树县| 遂宁市| 呼伦贝尔市| 平果县| 嘉黎县| 苏州市| 盈江县| 定陶县| 融水| 岳西县| 花垣县| 香港| 京山县| 新源县| 藁城市| 建昌县| 梨树县| 四平市| 北辰区| 兰坪| 江达县| 什邡市| 河源市| 开平市| 林甸县| 成都市| 晋江市| 泾阳县| 额济纳旗| 那曲县| 泗阳县| 广昌县| 济源市| 壤塘县| 广灵县| 镇平县| 曲水县| 宜良县| 林周县| 吴川市| 潢川县|