劉曉穗
(西華師范大學(xué)圖書館 四川 南充 637000)
進(jìn)入21世紀(jì)新技術(shù)爆發(fā)式涌現(xiàn),在帶給人們方便、改變?nèi)藗冃袨?、?xí)慣、觀念和思維的同時(shí)也催生出大量異構(gòu)的數(shù)據(jù)。我們每個(gè)人都無法置身數(shù)據(jù)包圍之外而又無時(shí)無刻不在產(chǎn)生和消費(fèi)著數(shù)據(jù)。當(dāng)無限膨脹的數(shù)據(jù)被當(dāng)成資本被挖掘利用時(shí),數(shù)據(jù)就由量變到質(zhì)變發(fā)生了飛越,“大數(shù)據(jù)”應(yīng)運(yùn)而生,成為繼云計(jì)算、物聯(lián)網(wǎng)后IT業(yè)的新寵而倍受關(guān)注?!按髷?shù)據(jù)”它不是巨量數(shù)據(jù)的簡單疊加,而是面對巨量繁雜數(shù)據(jù)的一種用以解決異構(gòu)數(shù)據(jù)統(tǒng)一接入和實(shí)時(shí)數(shù)據(jù)處理需求,挖掘分析數(shù)據(jù)間關(guān)聯(lián)性或未知性為核心,以實(shí)現(xiàn)信息價(jià)值增值和趨勢預(yù)測為目的的一類技術(shù)方法和手段。按調(diào)研公司IDC的定義:大數(shù)據(jù)是“一種新一代的技術(shù)和架構(gòu),具備高效率的捕捉,發(fā)現(xiàn)和分析能力,能夠經(jīng)濟(jì)地從類型繁雜、數(shù)量龐大的數(shù)據(jù)中挖掘出色價(jià)值”[1]。大數(shù)據(jù)的產(chǎn)生是新技術(shù)發(fā)展的必然,定將給人類的存在帶來深遠(yuǎn)影響。
大數(shù)據(jù)始于2010年12月美國總統(tǒng)科技顧問委員會(huì)向總統(tǒng)和國會(huì)提交的《規(guī)劃數(shù)字化未來》報(bào)告,繼由奧巴馬政府于2012年3月正式宣布投資2億美元啟動(dòng)《大數(shù)據(jù)研究和發(fā)展計(jì)劃》,用以增加政府收集、分析、提取海量數(shù)據(jù)的能力和提升知識洞見、科學(xué)發(fā)現(xiàn)的速度,將大規(guī)模數(shù)據(jù)管理與分析提升到國家戰(zhàn)略高度來加以發(fā)展[2]。大數(shù)據(jù)一經(jīng)提出立即引起各國政府以及社會(huì)各界的廣泛關(guān)注。發(fā)達(dá)國家無不積極組織人力研發(fā)大數(shù)據(jù)分析技術(shù)、開放數(shù)據(jù)源,引導(dǎo)政府、科研機(jī)構(gòu)、學(xué)術(shù)團(tuán)體、企業(yè)商界、信息咨詢等行業(yè)協(xié)同參與數(shù)據(jù)分析和創(chuàng)新應(yīng)用,力爭在下一場信息戰(zhàn)中贏得先手。大數(shù)據(jù)儼然已成為國家之戰(zhàn)、軍隊(duì)之戰(zhàn)、科技之戰(zhàn),經(jīng)濟(jì)之戰(zhàn)、生存之戰(zhàn)的一把利器。
通過大數(shù)據(jù)含義我們可以清晰地知道,大數(shù)據(jù)是一類創(chuàng)新技術(shù),它通過特定算法對海量、密集數(shù)據(jù)進(jìn)行聚類、分析、挖掘并產(chǎn)生價(jià)值增量及趨勢預(yù)測。正是由于其增值性、趨勢預(yù)測性以及數(shù)據(jù)泛在的屬性,使得它的應(yīng)用前景十分廣闊。國外一些大數(shù)據(jù)起步較早的國家大數(shù)據(jù)應(yīng)用已滲透到政府、學(xué)校、航天、氣象、通訊、醫(yī)療、制造等各個(gè)領(lǐng)域并取得顯著成效。由政府出面組織建立數(shù)據(jù)開放式平臺(tái),打破數(shù)據(jù)壁壘、鼓勵(lì)開源環(huán)境下的數(shù)據(jù)再造。一種把數(shù)據(jù)作為研究對象,以數(shù)據(jù)為驅(qū)動(dòng)的洞悉知識、發(fā)現(xiàn)知識、創(chuàng)造知識的創(chuàng)新思維模式即“數(shù)據(jù)密集型的科學(xué)發(fā)現(xiàn)”[3]模式誕生了。它拋棄傳統(tǒng)科學(xué)實(shí)驗(yàn)?zāi)J剑陂_放平臺(tái)上任何人都可以將科學(xué)實(shí)驗(yàn)與知識發(fā)現(xiàn)分離開來,運(yùn)用大數(shù)據(jù)工具將密集型數(shù)據(jù)中的關(guān)聯(lián)數(shù)據(jù)加以分析、研究從中直接剝離出新的知識和無限可能。這就是大數(shù)據(jù)最具價(jià)值的貢獻(xiàn)。
23年前馬克·魏澤爾(Mark Weiser)在1991年9月的《科學(xué)美國人》中發(fā)表的《21世紀(jì)的計(jì)算機(jī)》文章中作了計(jì)算無處不在的普適計(jì)算時(shí)代的預(yù)判。今天從物聯(lián)網(wǎng)、社交網(wǎng)、個(gè)人電腦、智能終端、可視化穿戴裝置、傳感器等設(shè)備使用中產(chǎn)生的大量結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)組成的大數(shù)據(jù)已作為戰(zhàn)略資源被大量充分地收集利用??梢哉f,計(jì)算就在你我身邊,大數(shù)據(jù)奏響了普適計(jì)算時(shí)代的序曲。一些科學(xué)實(shí)驗(yàn)室正在將大數(shù)據(jù)以全新的方式轉(zhuǎn)化為人體感官可接收的可視、可聽、可聞、可觸等感官信息,在虛擬世界再現(xiàn)或重建實(shí)體場景。這種虛實(shí)邊界模糊的世界里,“真”與“假”、“實(shí)”與“虛”、“這”與“那”、“現(xiàn)在”與“過去”區(qū)別在哪呢?當(dāng)可視化、感知化裝置佩戴或植入人體,感知沒有了邊界,不受時(shí)空的限制,我們熟悉的“存在”何去何從呢[4]?
隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,數(shù)據(jù)的產(chǎn)生方式、發(fā)現(xiàn)途徑、存在范圍、類型結(jié)構(gòu)都發(fā)生了巨大的變化。從數(shù)據(jù)生成看,有政府和各級機(jī)構(gòu)的組織管理數(shù)據(jù),有人們生產(chǎn)、生活、經(jīng)營活動(dòng)產(chǎn)生的運(yùn)營數(shù)據(jù),有各種通訊、電子設(shè)備、傳感設(shè)備交換、監(jiān)測的數(shù)據(jù),還有人們科學(xué)研究、思想語錄、情緒宣泄的原創(chuàng)數(shù)據(jù)。這些數(shù)據(jù)無處不在也無時(shí)不生,構(gòu)筑了大數(shù)據(jù)的物質(zhì)基礎(chǔ),使大數(shù)據(jù)呈現(xiàn)海量、位置分散、結(jié)構(gòu)繁雜、類型多樣、變化快速、價(jià)值稀缺、規(guī)律趨勢隱蔽的特性。為此,作為信息服務(wù)機(jī)構(gòu)的普通高校圖書館不可能在大數(shù)據(jù)革命中置身事外,在自身數(shù)據(jù)的收集范圍、結(jié)構(gòu)類型等方面必將呈現(xiàn)多維變化。從普通高校圖書館現(xiàn)有的數(shù)據(jù)資源來看,有文獻(xiàn)、光盤、數(shù)據(jù)庫、特色館藏庫、讀者統(tǒng)計(jì)、借閱覽統(tǒng)計(jì)、跟蹤服務(wù)、嵌入服務(wù)等多種數(shù)據(jù),這些數(shù)據(jù)大多屬于圖書館內(nèi)部結(jié)構(gòu)化數(shù)據(jù)資源。而大數(shù)據(jù)是一個(gè)開源的數(shù)據(jù)范疇,開放的大數(shù)據(jù)源將極大地?cái)U(kuò)展圖書館的數(shù)據(jù)來源范圍,政府及各類組織公開的數(shù)據(jù),物聯(lián)網(wǎng)、社交網(wǎng)、移動(dòng)終端等收集、傳播、組織的社會(huì)化媒體信息,學(xué)校各部門、學(xué)科專業(yè)、研究課題的集成數(shù)據(jù)以及圖書館通過自動(dòng)化及監(jiān)測設(shè)備收集的讀者身份、體貌特征、學(xué)習(xí)活動(dòng)的聲視頻圖像、情緒情感表達(dá)方式、搜索習(xí)慣、存儲(chǔ)方式等個(gè)性化數(shù)據(jù)將成為圖書館數(shù)據(jù)新的組成部分。這些新的散布在云終端靜態(tài)的、動(dòng)態(tài)的數(shù)據(jù)多以半結(jié)構(gòu)化和非結(jié)構(gòu)化的形式大量介入圖書館,勢必打破圖書館以結(jié)構(gòu)化數(shù)據(jù)為主的格局,使數(shù)據(jù)管理由關(guān)系型數(shù)據(jù)庫向非關(guān)系型數(shù)據(jù)庫傾斜,進(jìn)而推動(dòng)大數(shù)據(jù)新技術(shù)的全面引進(jìn)與應(yīng)用,引領(lǐng)圖書館服務(wù)向更廣、更深、更智能方向發(fā)展。
大數(shù)據(jù)處理的三大關(guān)鍵:數(shù)據(jù)本身、數(shù)據(jù)分析和結(jié)果呈現(xiàn)。數(shù)據(jù)本身的處理主要反映在數(shù)據(jù)的組織管理上,數(shù)據(jù)分析變化集中在大數(shù)據(jù)思維、創(chuàng)新分析方法和密集型數(shù)據(jù)驅(qū)動(dòng)方面,結(jié)果呈現(xiàn)的不同即決策模式的變化。
2.2.1 數(shù)據(jù)組織管理的變化
大數(shù)據(jù)時(shí)代個(gè)人或組織在真實(shí)世界的活動(dòng)和狀態(tài)被前所未有的記錄,有價(jià)值的信息通常被淹沒在海量、異構(gòu)的數(shù)字世界,零星且獨(dú)立地分布于網(wǎng)絡(luò)中為不同格式、不同處理技術(shù)所存貯著。普通高校圖書館的數(shù)據(jù)也是如此,無論是圖書館開發(fā)的、共享的、購買的、開放式獲取的數(shù)據(jù),除部分結(jié)構(gòu)化的數(shù)據(jù)外其余80%的非結(jié)構(gòu)化數(shù)據(jù)沒有統(tǒng)一的表達(dá)式和“一站式”檢索入口,讀者往往在不同種類的數(shù)據(jù)資源間切來換去,難以充分挖掘有效利用。如今大數(shù)據(jù)技術(shù)為整合異構(gòu)數(shù)據(jù)和各類信息系統(tǒng)、軟硬件資源提供了技術(shù)支持,圖書館應(yīng)按用戶需求依一定的邏輯關(guān)系以高度并行的方式組織、抽取、篩選、融合數(shù)據(jù)成各種功能數(shù)據(jù)塊,運(yùn)用具有高容錯(cuò)、高擴(kuò)展、高性能的大數(shù)據(jù)核心技術(shù) MapReduce[5]的數(shù)據(jù)組織機(jī)制實(shí)現(xiàn)異構(gòu)數(shù)據(jù)間、功能數(shù)據(jù)塊間的相互映射、相互印證、相互解釋,達(dá)到數(shù)據(jù)靈活重構(gòu)、統(tǒng)一檢索和個(gè)性挖掘,實(shí)現(xiàn)異構(gòu)數(shù)據(jù)的組織集成和整合管理。
2.2.2 數(shù)據(jù)分析、思維方式的變化
大數(shù)據(jù)時(shí)代數(shù)據(jù)總量及增長是巨大的,數(shù)據(jù)類型是異構(gòu)和繁雜的,而巨大數(shù)據(jù)掩蓋下的知識價(jià)值卻呈現(xiàn)出隱性低密的特性。正是由于巨量隱藏了價(jià)值的外顯,才使得價(jià)值發(fā)現(xiàn)突顯其重要性。面對浩如煙海的種類繁雜的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析挖掘方法只能望而興嘆,而 NoSQL、MapReduce、Hadoop等密集型數(shù)據(jù)存取、分析新技術(shù)卻能有效地對巨量、異構(gòu)數(shù)據(jù)加以轉(zhuǎn)化、篩選、融合、集成。通過一定的自然語言處理、統(tǒng)計(jì)分析處理和數(shù)據(jù)挖掘算法處理等手段分析出數(shù)據(jù)的關(guān)聯(lián)與數(shù)據(jù)本身的特點(diǎn),進(jìn)而挖掘增值價(jià)值和推斷趨勢走向,使知識發(fā)現(xiàn)更智能化呈暴發(fā)式增長。
大數(shù)據(jù)時(shí)代密集型數(shù)據(jù)存取分析技術(shù)的廣泛應(yīng)用,從實(shí)質(zhì)上開啟了數(shù)據(jù)創(chuàng)造知識的時(shí)代,把數(shù)據(jù)作為對象和工具加以研究和利用,改變了人們分析范式的同時(shí)也改變著人們的思維方式。人們不再執(zhí)著追求數(shù)據(jù)的精確性和因果關(guān)系,轉(zhuǎn)而尋求數(shù)據(jù)的完整性、混雜性及相關(guān)關(guān)系,這種去精確性、去因果關(guān)系的結(jié)果就是只關(guān)注結(jié)論無需明白過程和方法。人們可以不再通過學(xué)習(xí)去累積認(rèn)知,越來越多的社會(huì)問題、科學(xué)研究、技術(shù)創(chuàng)新將通過計(jì)算得以解決。這種思維模式顛覆了我們熟悉的認(rèn)知世界的習(xí)慣,也必將催生出基于統(tǒng)計(jì)的分析數(shù)據(jù)專家取代行業(yè)專家的宿命。為此,普通高校圖書館要看到大數(shù)據(jù)變革的力量,打破以往信息統(tǒng)計(jì)、分析、挖掘的傳統(tǒng)思維框架,引進(jìn)大數(shù)據(jù)分析軟件,開展大數(shù)據(jù)服務(wù),提高智能水平,以適應(yīng)大數(shù)據(jù)時(shí)代人們思維方式、行為需求的變化。
2.2.3 決策模式的變化
大數(shù)據(jù)的決策模式是依賴于數(shù)據(jù)分析而誕生的,各種以數(shù)據(jù)為研究對象的數(shù)據(jù)驅(qū)動(dòng)分析技術(shù)能從大量關(guān)聯(lián)數(shù)據(jù)中洞悉出相關(guān)共性和未知趨勢。而大數(shù)據(jù)的開放、透明性使得任何組織與個(gè)人都可以利用大數(shù)據(jù)分析技術(shù),繞開專家、精英、權(quán)威而自主研究、預(yù)判和知識發(fā)現(xiàn)??梢?,大數(shù)據(jù)不僅是技術(shù)挑戰(zhàn)同時(shí)也是業(yè)務(wù)挑戰(zhàn),一個(gè)非線性的、去中心化的、自下而上的、發(fā)現(xiàn)群體智慧的決策模式逐步成型,決策從后臺(tái)向前端轉(zhuǎn)移、從集中向分散轉(zhuǎn)移、從精英向草根轉(zhuǎn)移[5]。決策模式的改變使圖書館在用戶個(gè)人行為、大數(shù)據(jù)資源利用能力與動(dòng)機(jī)等相關(guān)數(shù)據(jù)采集、組織、管理、分析等方面提出了更高的要求,數(shù)據(jù)的完整性、可靠性、及時(shí)性、可控性、安全性決定了決策的有效性。因此,普通高校圖書館應(yīng)及時(shí)組建一個(gè)數(shù)據(jù)驅(qū)動(dòng)評價(jià)、決策小組,從總體上統(tǒng)一規(guī)劃、制定相應(yīng)的數(shù)據(jù)驅(qū)動(dòng)知識發(fā)現(xiàn)戰(zhàn)略,提出明確的目標(biāo)與需求,建立大眾參與的數(shù)據(jù)研發(fā)平臺(tái),鼓勵(lì)全員創(chuàng)新分享,推動(dòng)圖書館服務(wù)向縱深和智能化發(fā)展。
大數(shù)據(jù)是一個(gè)全球開放的范疇,被譽(yù)為是繼生產(chǎn)力、人力資源之后的第三大資源,是IT界的又一次飛躍,是普適時(shí)代的前奏。從理論上講其開放、開源的數(shù)據(jù)環(huán)境為所有信息機(jī)構(gòu)提供了同等公平的平臺(tái),也為普通高校圖書館信息服務(wù)帶來新的生機(jī)。在分享大數(shù)據(jù)帶來機(jī)遇的同時(shí),必須清醒的意識到創(chuàng)新技術(shù)人才在大數(shù)據(jù)開發(fā)中的價(jià)值。大數(shù)據(jù)作為一類技術(shù)與方法,它本身的產(chǎn)生與發(fā)展就離不開技術(shù)人才的保障,它需要多種技能支持,需要了解業(yè)務(wù)流程、Java編程技能和統(tǒng)計(jì)知識,甚至需要一些SQL技能和將數(shù)據(jù)轉(zhuǎn)換為可執(zhí)行能力的IT專家。麥肯錫公司預(yù)測,到2019年,全球?qū)⑷鄙俑哌_(dá)19萬可處理大數(shù)據(jù)的科學(xué)家[1]。19萬的巨大缺口這一數(shù)字揭示了普通高校圖書館對于社會(huì)寵兒的數(shù)據(jù)專家而言是沒有太大吸引力的,而普通高校圖書館想短時(shí)間把現(xiàn)有技術(shù)力量培養(yǎng)成有大數(shù)據(jù)處理技術(shù)的專家也是有難度的。如此囧境,放棄自主大數(shù)據(jù)技術(shù)開發(fā)、引進(jìn)成熟分析軟件,走小規(guī)模碎片服務(wù)與社會(huì)化協(xié)同合作發(fā)展的道路才是可取而行之有效的途徑。普通高校圖書館必須把自己融入大數(shù)據(jù)環(huán)境,借助中國社會(huì)化大數(shù)據(jù)剛剛起步的有利條件,立足高校師生信息需求相對集中的環(huán)境開展大數(shù)據(jù)建設(shè)、服務(wù),培養(yǎng)一批屬于自己相對固定的用戶群;積極加入高校圖書館數(shù)字聯(lián)盟,利用集團(tuán)大數(shù)據(jù)優(yōu)勢及分析技術(shù)加強(qiáng)與科研機(jī)構(gòu)、情報(bào)部門、政府機(jī)構(gòu)、社會(huì)團(tuán)體、企業(yè)商家的合作;拓寬服務(wù)面爭取與IT業(yè)專家協(xié)作,尋求一定的技術(shù)支持;力求小投入大產(chǎn)出,用自己的特色來豐富社會(huì)化開源數(shù)據(jù)資源,成為中國大數(shù)據(jù)健康發(fā)展的助推手。
大數(shù)據(jù)對普通高校圖書館的挑戰(zhàn)是顯而易見的,圖書館必須面對現(xiàn)實(shí)、認(rèn)清優(yōu)劣、定準(zhǔn)角色,制定適合自身發(fā)展的短期、長期目標(biāo),做好與社會(huì)共同愿景、學(xué)校總體設(shè)計(jì)、辦學(xué)方針、學(xué)科發(fā)展、科研項(xiàng)目匹配的階段性、漸進(jìn)式發(fā)展規(guī)劃。
3.2.1 大數(shù)據(jù)資源重構(gòu)
資源重構(gòu)是大數(shù)據(jù)開發(fā)、創(chuàng)新、服務(wù)的基礎(chǔ),所以普通高校圖書館必須依自身制定的戰(zhàn)略目標(biāo)盡可能廣泛、全面、完整地收集、組織貼近戰(zhàn)略規(guī)劃的數(shù)據(jù)資源。在數(shù)據(jù)來源上,加強(qiáng)同高校數(shù)字聯(lián)盟、區(qū)域性行業(yè)聯(lián)盟、政府部門、云服務(wù)商、門戶網(wǎng)站、移動(dòng)通訊公司、數(shù)據(jù)庫開發(fā)商等組織機(jī)構(gòu)合作,建立長期數(shù)據(jù)共享、交換機(jī)制;在大數(shù)據(jù)技術(shù)上,主要面對大數(shù)據(jù)分析技術(shù)全球還處于初級階段、多技術(shù)開發(fā)尚缺乏通用框架的現(xiàn)狀,普通高校圖書館應(yīng)隨主流先從Apache下載Hadoop來實(shí)現(xiàn)對數(shù)據(jù)源中大量非結(jié)構(gòu)化數(shù)據(jù)的分析存儲(chǔ)。這一成熟開源軟件框架,能在標(biāo)準(zhǔn)服務(wù)器上運(yùn)行,可以進(jìn)行索引、排序、數(shù)據(jù)挖掘、日志分析、圖像處理等等[6],其優(yōu)勢可以有效幫助普通高校圖書館大數(shù)據(jù)建設(shè),以較少的投入獲取處理大量信息。此外,圖書館還要時(shí)常關(guān)注大數(shù)據(jù)技術(shù)的發(fā)展,努力爭取知名大數(shù)據(jù)技術(shù)開發(fā)公司和大數(shù)據(jù)IT專家的技術(shù)協(xié)助,在Hadoop或更強(qiáng)大的新技術(shù)框架下建立與圖書館目標(biāo)規(guī)劃需求一致的數(shù)據(jù)源評估與篩選模式,有針對性、有選擇的對源數(shù)據(jù)進(jìn)行抽取、映射、切割、聚合、融合,整合成格式統(tǒng)一、知識聚類、架構(gòu)清晰的適合圖書館大數(shù)據(jù)服務(wù)的重構(gòu)數(shù)據(jù)資源平臺(tái)。
3.2.2 漸進(jìn)式發(fā)展
大數(shù)據(jù)能力包含兩個(gè)方面:一是大數(shù)據(jù)整合、分析、技術(shù)創(chuàng)新能力,二是大數(shù)據(jù)個(gè)性服務(wù)能力。這兩種能力相輔相成,第一種是手段,第二種是目的。作為普通高校圖書館而言第一種自主能力弱需要借外力加以提升,第二種卻有著多年信息服務(wù)打下的基礎(chǔ),存在較快的適應(yīng)性,圖書館應(yīng)把第二種能力的提高視為今后一段時(shí)間努力的重點(diǎn)。能力的提高不是一朝一夕的事,大數(shù)據(jù)建設(shè)又是一個(gè)龐大復(fù)雜的工程,其對思維、知識發(fā)現(xiàn)模式的顛覆于普通高校圖書館而言沒有多少前人經(jīng)驗(yàn)可借鑒,只有盡快借助大數(shù)據(jù)技術(shù)在摸索中創(chuàng)新服務(wù)才能爭得用戶。為此,普通高校圖書館的大數(shù)據(jù)建設(shè)不能脫離高校這一特定環(huán)境,不能丟掉服務(wù)師生這一宗旨,從身邊力所能及的事抓起,由小到大、由內(nèi)到外逐步累積經(jīng)驗(yàn)、漸進(jìn)式拓展,努力搭建好適合自身發(fā)展所需要的服務(wù)平臺(tái)和服務(wù)模式。
(1)圖書館內(nèi)部建立以用戶需求為導(dǎo)向的服務(wù)模式。由于普通高校有著數(shù)量龐大、專業(yè)聚類、興趣愛好趨同的一大批同學(xué),也有著科研項(xiàng)目明確的教研團(tuán)隊(duì)。所以,圖書館的大數(shù)據(jù)服務(wù)必須充分考慮這些群體的共性需求,以用戶需求為導(dǎo)向建立與校內(nèi)各部門的協(xié)同聯(lián)系。從人事、組織、學(xué)工部、教務(wù)處等部門收集讀者個(gè)人信息、社會(huì)關(guān)系、專業(yè)設(shè)置、人員結(jié)構(gòu)等信息,從二級學(xué)院收集課程安排、教師配備等信息,從招生就業(yè)處了解生源及就業(yè)情況,從圖書館自己的設(shè)備和系統(tǒng)中統(tǒng)計(jì)讀者借閱史、收集閱讀習(xí)慣、專業(yè)知識需求與個(gè)性關(guān)注以及情感情緒宣泄等信息,通過大數(shù)據(jù)技術(shù)加以統(tǒng)一格式的解析、描述、刪減、聚類、融合、整合,使異構(gòu)松散的數(shù)據(jù)關(guān)聯(lián)起來,從中辨析出共性、階段性的關(guān)注熱點(diǎn)、研究動(dòng)向、教學(xué)需求,為校務(wù)和教學(xué)部門提供決策支持。此外,更要重視單個(gè)用戶個(gè)性信息需求的及時(shí)處理,讓碎片需求的碎片服務(wù)模式和共性需求的集體推送模式能相互推進(jìn)、共同發(fā)展。
(2)圖書館外部建立用戶需求為導(dǎo)向的社會(huì)化共享模式。大數(shù)據(jù)是一個(gè)開源的范疇,大數(shù)據(jù)時(shí)代數(shù)據(jù)的產(chǎn)生和增量無處不在,人們獲取信息數(shù)據(jù)的手段與途徑十分廣泛,全球數(shù)據(jù)共享已成趨勢。為此,普通高校圖書館在價(jià)值信息市場所占份額急劇壓縮的今天,其數(shù)據(jù)的收集、存儲(chǔ)、分析、重構(gòu)是為大數(shù)據(jù)服務(wù)建立的,數(shù)據(jù)服務(wù)需求社會(huì)化又是為共享準(zhǔn)備的,用戶需求社會(huì)化是共享的動(dòng)力。圖書館應(yīng)以用戶需求為導(dǎo)向走出校園與擁有巨量數(shù)據(jù)信息的政府信息機(jī)構(gòu)、移動(dòng)通信公司、大型門戶網(wǎng)站、云服務(wù)商等主動(dòng)聯(lián)系,建立交互式信息、數(shù)據(jù)共享平臺(tái)。在充分挖掘社會(huì)信息的同時(shí),把自己開發(fā)的館內(nèi)特色數(shù)據(jù)、校內(nèi)特色數(shù)據(jù)、個(gè)性化信息、共性趨勢化信息、科研成果信息等進(jìn)行安全保護(hù)處理后交換出去,讓社會(huì)有需求的用戶方便快捷地用到這些數(shù)據(jù),完成共享,推動(dòng)價(jià)值增值和知識再造。
(3)圖書館構(gòu)建數(shù)據(jù)驅(qū)動(dòng)型用戶自主研發(fā)平臺(tái)。隨著大數(shù)據(jù)技術(shù)日臻成熟完善,全球數(shù)據(jù)大融合催生沒有邊際的網(wǎng)絡(luò)大學(xué)、沒有圍墻的圖書館誕生。沒有邊際、沒有圍墻就意味著沒有傳統(tǒng)意義的在校學(xué)生及教研團(tuán)隊(duì),取而代之的是全體公民。大家共同接受公平的教育、共同分享開放平臺(tái)服務(wù)、共同貢獻(xiàn)智慧成果,許多社會(huì)化問題與科學(xué)研究將以“眾包”的形式加以解決,智慧的分析決策在未來已不再是局限于專家領(lǐng)域,而是一個(gè)組織內(nèi)任何一個(gè)人的自由。由此可見,普通高校圖書館在大數(shù)據(jù)建設(shè)中要營造大數(shù)據(jù)資源開放公平的使用環(huán)境,打造一個(gè)易于用戶自主數(shù)據(jù)研發(fā)的開放平臺(tái)與社會(huì)對接;注重大數(shù)據(jù)文化培育,加強(qiáng)對館內(nèi)職工、廣大學(xué)生和科研人員進(jìn)行圖書館大數(shù)據(jù)技術(shù)培訓(xùn),讓他們學(xué)會(huì)并掌握大數(shù)據(jù)技術(shù)的使用;鼓勵(lì)用戶自主研發(fā),增強(qiáng)個(gè)性需求自我滿足的愉悅感和成就感,建好用好圖書館大數(shù)據(jù)用戶自主研發(fā)開放平臺(tái)是圖書館的大數(shù)據(jù)服務(wù)真正走向成功的關(guān)鍵。
[1]英特爾公司.關(guān)于大數(shù)據(jù)的重要事實(shí)[EB/OL].[2014-09-02].http://www.intel.cn/content/www/cn/zh/big-data/about-bigdata-importantfact.html.
[2]王翠波,吳金紅.大數(shù)據(jù)環(huán)境下技術(shù)競爭情報(bào)分析的挑戰(zhàn)及其應(yīng)對策略[J].情報(bào)雜志,2014,(3):6-10.
[3]鄧仲華,李立睿,陸穎雋.大數(shù)據(jù)環(huán)境下嵌入科研過程的信息服務(wù)模式研究[J].圖書與情報(bào),2014,(1):30-34,40.
[4]格申·多布倫,約瑟夫·A·帕拉迪索.互聯(lián)的世界[N].龔南葳,譯.光明日報(bào),2014-08-03(006).
[5]鐘輝新,張興旺,黃曉斌.面向大數(shù)據(jù)的企業(yè)競爭情報(bào)動(dòng)態(tài)運(yùn)行模式 MDD:監(jiān)控、發(fā)現(xiàn)、決策的互動(dòng)[J].情報(bào)理論與實(shí)踐,2014,37(3):6-11,15.
[6]英特爾公司.應(yīng)用大數(shù)據(jù)技術(shù)獲得近實(shí)時(shí)分析巨大成效[EB/OL].[2014-09-02].http://www.intel.cn/content/www/cn/zh/big-data/real-time-analysis2.html.