王蘭英
[摘要]大數(shù)據(jù)是科學(xué)進(jìn)步的產(chǎn)物,是高校圖書(shū)館的重要資產(chǎn),也是服務(wù)轉(zhuǎn)型的基礎(chǔ)。大數(shù)據(jù)具有全面性、多樣性和時(shí)效性的特征,預(yù)測(cè)和優(yōu)化是大數(shù)據(jù)的核心。高校圖書(shū)館的大數(shù)據(jù)的形成、存儲(chǔ)和應(yīng)用有其特點(diǎn)。大數(shù)據(jù)時(shí)代下高校圖書(shū)館應(yīng)加快服務(wù)轉(zhuǎn)型,轉(zhuǎn)型的關(guān)鍵在于資源整合、語(yǔ)義分析和移動(dòng)終端等3個(gè)方面。
[關(guān)鍵詞]大數(shù)據(jù);知識(shí)服務(wù);資源整合;語(yǔ)義分析;網(wǎng)絡(luò)平臺(tái)
1大數(shù)據(jù)是現(xiàn)代網(wǎng)絡(luò)技術(shù)的必然結(jié)果
由于互聯(lián)網(wǎng)、3G網(wǎng)絡(luò)和物聯(lián)網(wǎng)等各種信息網(wǎng)絡(luò)的快速發(fā)展,PC端、移動(dòng)終端、RFID和無(wú)線傳感器等各種終端的廣泛使用,Hadoop平臺(tái)、數(shù)據(jù)流分析、云計(jì)算等網(wǎng)絡(luò)技術(shù)的不斷成熟,產(chǎn)生于各種終端的數(shù)據(jù)急劇膨脹。這些數(shù)據(jù)如此之大,存儲(chǔ)方式如此之復(fù)雜,人們就用大數(shù)據(jù)來(lái)形容這些以TB計(jì)量的信息數(shù)據(jù)。通常人們用4V來(lái)描述大數(shù)據(jù)的特征[2],即體量巨大(volume)、形態(tài)繁多(variety)、生成速度快(velocity)、價(jià)值大但密度低(value)。這是對(duì)大數(shù)據(jù)的量級(jí)、儲(chǔ)存方式、處理技術(shù)和利用價(jià)值等方面的描述。
對(duì)海量數(shù)據(jù)進(jìn)行篩選分析,挖掘出有價(jià)值的信息,才是大數(shù)據(jù)的真正本質(zhì)。從價(jià)值發(fā)現(xiàn)的角度來(lái)看,大數(shù)據(jù)具有全面、多樣和實(shí)時(shí)的特征。
1.1 大數(shù)據(jù)是全面的
大數(shù)據(jù)的全面性反映在兩個(gè)方面。一方面,幾乎人類社會(huì)的各個(gè)方面都有大數(shù)據(jù)的存在和使用,從電子商務(wù)、網(wǎng)絡(luò)教育到政府微博等,大數(shù)據(jù)無(wú)所不在、無(wú)所不包;另一方面,大數(shù)據(jù)為單一個(gè)體提供了歷史數(shù)據(jù)、同類比較等比較全面的描述。對(duì)大數(shù)據(jù)來(lái)說(shuō),樣本即總體。大數(shù)據(jù)的全面性能對(duì)事物的本質(zhì)和行為者的意識(shí)做出比較客觀的判斷,能對(duì)事物的未來(lái)發(fā)展做出比較準(zhǔn)確的預(yù)測(cè)。
1.2 大數(shù)據(jù)是多樣的
大數(shù)據(jù)的多樣性表現(xiàn)在兩個(gè)方面。首先,產(chǎn)生和儲(chǔ)存大數(shù)據(jù)的形式呈現(xiàn)多樣性,功能不同的數(shù)據(jù)終端生成的數(shù)據(jù)在形式上也各有不同,有文本、圖像,還有各種無(wú)線信號(hào),從存儲(chǔ)形式上看,這些數(shù)據(jù)有結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù);其次,大數(shù)據(jù)產(chǎn)生的價(jià)值是多方面的,同樣的大數(shù)據(jù)由于參數(shù)選擇的不同,觀察角度的不同,會(huì)產(chǎn)生不同的價(jià)值,例如,同一組銷售數(shù)據(jù),對(duì)生產(chǎn)廠家和對(duì)物流公司來(lái)說(shuō),其價(jià)值是不同的。大數(shù)據(jù)的多樣性特別是形態(tài)的多樣性,可以對(duì)事物進(jìn)行直觀的多維度的描述,可以從數(shù)據(jù)中挖掘更多的價(jià)值。
1.3 大數(shù)據(jù)是實(shí)時(shí)的
由靜態(tài)發(fā)展轉(zhuǎn)向動(dòng)態(tài)發(fā)展將成為信息發(fā)展的主流。大數(shù)據(jù)最重要的特征就是數(shù)據(jù)的時(shí)效性。大數(shù)據(jù)的時(shí)效性也包含兩個(gè)方面。一方面,數(shù)據(jù)的產(chǎn)生是實(shí)時(shí)的,由于產(chǎn)生大數(shù)據(jù)的各種終端不斷地實(shí)時(shí)地產(chǎn)生數(shù)據(jù),如網(wǎng)絡(luò)訪問(wèn)中的日志數(shù)、商品的二維碼掃描、通訊信息等,特別是隨著移動(dòng)終端采集數(shù)據(jù)的技術(shù)的更新與進(jìn)步,大數(shù)據(jù)的時(shí)效性更為突出;另一方面,大數(shù)據(jù)的處理是實(shí)時(shí)的,云計(jì)算和hadoop等網(wǎng)絡(luò)技術(shù)為大數(shù)據(jù)提供了實(shí)時(shí)的處理。
大數(shù)據(jù)的上述特征,使大數(shù)據(jù)蘊(yùn)含著巨大的價(jià)值?!禕ig Data-A Revolution That Will Transform How We Live, Work and Think》一書(shū)的作者Viktor Mayer-Schonberger認(rèn)為大數(shù)據(jù)的核心就是預(yù)測(cè)和優(yōu)化。Google公司開(kāi)發(fā)的自動(dòng)駕駛汽車運(yùn)用了視頻攝像頭、雷達(dá)傳感器和激光測(cè)距器來(lái)收集實(shí)時(shí)的數(shù)據(jù),了解周圍的交通狀況,并通過(guò)詳盡的地圖對(duì)前方的道路進(jìn)行導(dǎo)航,這一切都是通過(guò)Google的大數(shù)據(jù)中心來(lái)實(shí)現(xiàn)的。Aamzon的推薦引擎也是運(yùn)用大數(shù)據(jù)的成功案例,其推薦引擎完全是基于客戶在過(guò)去一段時(shí)間的購(gòu)買(mǎi)行為所做的:客戶的購(gòu)物車中所收藏的商品、客戶喜歡的商品、其他用戶瀏覽或購(gòu)買(mǎi)的商品……Aamzon使用大數(shù)據(jù)平臺(tái),為每位客戶定制了專屬的個(gè)人主頁(yè),利用這一策略,公司在其第三財(cái)政季度期間銷售增長(zhǎng)27%,達(dá)到了1318億美元,而去年同期的銷售額則為96億美元。從這些經(jīng)典的案例中,我們可以展望大數(shù)據(jù)對(duì)高校圖書(shū)館所產(chǎn)生的巨大價(jià)值。
2高校圖書(shū)館的大數(shù)據(jù)建設(shè)
大數(shù)據(jù)特別是非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)將成為未來(lái)圖書(shū)館的重要資產(chǎn)[3]。高校圖書(shū)館的大數(shù)據(jù)資源包括圖書(shū)館的紙型資源、數(shù)字資源、網(wǎng)絡(luò)資源和客戶資源。
2.1 紙型資源要加快數(shù)字化建設(shè)
圖書(shū)館的紙型資源是所有紙介質(zhì)信息的總和,包括圖書(shū)、期刊和報(bào)紙,它是高校圖書(shū)館的大數(shù)據(jù)資源的基礎(chǔ)。為適應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展趨勢(shì),未來(lái)高校圖書(shū)館應(yīng)該將紙型資源與數(shù)字資源結(jié)合起來(lái),紙質(zhì)資源與數(shù)字資源互補(bǔ)共存,并且數(shù)字資源要逐步成為圖書(shū)館的主要資源,而紙質(zhì)資源要逐步數(shù)字化,為在線閱讀和資源整合提供數(shù)字化基礎(chǔ)。
2.2 數(shù)字資源要進(jìn)一步整合
圖書(shū)館的數(shù)字資源包括數(shù)據(jù)庫(kù)、電子期刊、電子圖書(shū)、網(wǎng)頁(yè)和多媒體資源。資源整合是高校圖書(shū)館發(fā)展的基礎(chǔ)工程,包括高校內(nèi)部的資源整合,高校之間的資源整合和各類數(shù)據(jù)庫(kù)的共享等。資源整合可以提高現(xiàn)有資源的利用率,最大限度地滿足讀者的需求。目前已有的基于OPAC的數(shù)字資源整合是資源整合的初級(jí)階段,主要是查閱功能和數(shù)據(jù)庫(kù)的整合,未來(lái)還要加快客戶資源、數(shù)字化了的紙質(zhì)資源、教學(xué)和實(shí)驗(yàn)資源的整合,盡可能消除時(shí)間和空間的影響。高校圖書(shū)館的資源整合是大數(shù)據(jù)環(huán)境下的內(nèi)在需求,同時(shí)大數(shù)據(jù)還可以為資源整合提供必要的數(shù)據(jù)和技術(shù)支持[4]。
2.3 網(wǎng)絡(luò)平臺(tái)是大數(shù)據(jù)的載體
高校圖書(shū)館的網(wǎng)絡(luò)平臺(tái)是大數(shù)據(jù)的根基,是生成、存儲(chǔ)和交換大數(shù)據(jù)的重要載體,是圖書(shū)館與客戶互動(dòng)的重要平臺(tái)。高校圖書(shū)館建立網(wǎng)絡(luò)平臺(tái)擁有自己特有的優(yōu)勢(shì)。
2.3.1 實(shí)體優(yōu)勢(shì)。經(jīng)過(guò)多年的積累和完善,高校圖書(shū)館積累了大量的圖書(shū)和期刊,其品質(zhì)和專業(yè)性也逐年提高,這就能為客戶提供更多的和更便利的選擇,這種實(shí)體優(yōu)勢(shì)是其他只提供虛擬的知識(shí)服務(wù)和信息服務(wù)的網(wǎng)絡(luò)平臺(tái)所無(wú)法比擬的。
2.3.2 客戶優(yōu)勢(shì)。高校圖書(shū)館的服務(wù)對(duì)象主要是在校學(xué)生和教師,客戶群相對(duì)穩(wěn)定,因此對(duì)客戶信息的認(rèn)知程度非常高,這些信息包括客戶的個(gè)人信息、專業(yè)取向和知識(shí)水平等,對(duì)這些信息的掌握可以使圖書(shū)館在服務(wù)環(huán)節(jié)上做到細(xì)分,從而為客戶提供更準(zhǔn)確和更高效的知識(shí)服務(wù)。
2.3.3 管理優(yōu)勢(shì)。高校圖書(shū)館一直處在知識(shí)信息的最前沿,對(duì)圖書(shū)的質(zhì)量和需求、最新的圖書(shū)信息、知識(shí)服務(wù)的新進(jìn)展等都更加了解,可以為客戶提供更及時(shí)和更前沿的圖書(shū)信息。高校圖書(shū)館的管理人員和技術(shù)人員的專業(yè)水平高,管理經(jīng)驗(yàn)豐富,這是圖書(shū)館提供優(yōu)質(zhì)服務(wù)的不可或缺的軟實(shí)力。
高校圖書(shū)館應(yīng)根據(jù)自身的優(yōu)勢(shì)和需要建立更具特色的網(wǎng)絡(luò)平臺(tái),使其成為信息更加豐富,資源更加全面,搜索更加便利,個(gè)性化更加突出的平臺(tái),成為圖書(shū)館與客戶連接的重要窗口。
3大數(shù)據(jù)促高校圖書(shū)館的功能轉(zhuǎn)變
大數(shù)據(jù)時(shí)代下高校圖書(shū)館的服務(wù)功能將產(chǎn)生新的變化。除了要繼承和優(yōu)化傳統(tǒng)的服務(wù)功能,也要開(kāi)發(fā)大數(shù)據(jù)支持下的新的服務(wù)功能。
3.1 實(shí)體資源的跨區(qū)域整合
圖書(shū)館的最大優(yōu)勢(shì)是它的實(shí)體資源,實(shí)體資源的整合可以進(jìn)一步優(yōu)化資源配置,最大限度地滿足客戶需求。高校圖書(shū)館的服務(wù)對(duì)象有明顯的區(qū)域性特征,在當(dāng)?shù)貓D書(shū)館和購(gòu)買(mǎi)行為無(wú)法滿足客戶的閱讀需求時(shí),跨區(qū)域的實(shí)體資源的重新配置就顯得非常必要。大數(shù)據(jù)也伴隨著大物流,在物流相當(dāng)發(fā)達(dá)的今天,圖書(shū)館實(shí)體資源的整合成為可能。高校圖書(shū)館應(yīng)建立跨區(qū)域的圖書(shū)聯(lián)盟,建立跨區(qū)域的無(wú)償或有償?shù)膱D書(shū)預(yù)約機(jī)制和圖書(shū)調(diào)配機(jī)制,建立便利、可信、智能的圖書(shū)物流平臺(tái)。
3.2 專業(yè)化的客戶服務(wù)
在高校圖書(shū)館的網(wǎng)絡(luò)平臺(tái)建設(shè)中,提高搜索引擎的個(gè)性化和智能化是關(guān)鍵。目前高校圖書(shū)館已經(jīng)提供了許多數(shù)字資源[5],包括CALIS、CADAL等數(shù)據(jù)庫(kù),也提供了許多個(gè)性化服務(wù),但由于受到技術(shù)方面的制約,現(xiàn)有的搜索引擎和語(yǔ)義分析還無(wú)法完全滿足客戶的搜索意圖,搜索的結(jié)果往往是機(jī)械的和被動(dòng)的,客戶在提供的搜索數(shù)據(jù)面前,只能自己去篩選信息。如果一個(gè)教授與一個(gè)新生得出的搜索結(jié)果是一樣的,顯然違背了客戶的搜索意圖。大數(shù)據(jù)的全面性和多樣性為圖書(shū)館提供了比較詳細(xì)的客戶的信息,包括客戶的專業(yè)信息、借閱行為、網(wǎng)絡(luò)瀏覽記錄等,這些信息為圖書(shū)館開(kāi)發(fā)優(yōu)質(zhì)、智能、提前的服務(wù)提供了可靠的依據(jù)。建立在大數(shù)據(jù)平臺(tái)下的搜索引擎,可以根據(jù)客戶的搜索歷史以及瀏覽習(xí)慣等數(shù)據(jù)進(jìn)行分析,根據(jù)本體知識(shí)的來(lái)源、演化過(guò)程、知識(shí)間的因果關(guān)系和關(guān)聯(lián)知識(shí)進(jìn)行判斷,將數(shù)據(jù)進(jìn)行深加工,從而使搜索結(jié)果變得立體和科學(xué),能充分滿足用戶間差異性的需求。
3.3 移動(dòng)終端的信息服務(wù)
大數(shù)據(jù)時(shí)代的一個(gè)重要標(biāo)志是移動(dòng)終端的廣泛使用。手機(jī)以其方便快捷、碎片化時(shí)間的閱讀優(yōu)勢(shì),將成為今后閱讀的最主要的方式之一。據(jù)第十次全國(guó)國(guó)民閱讀調(diào)查報(bào)告[6],2012年我國(guó)18—70周歲國(guó)民人均每天手機(jī)閱讀的時(shí)長(zhǎng)為13.53分鐘,比2010年增加了3.21分鐘,在大學(xué)生群體中手機(jī)閱讀時(shí)間遠(yuǎn)超這個(gè)數(shù)字。高校圖書(shū)館應(yīng)為客戶提供更多的針對(duì)移動(dòng)終端的資源,通過(guò)短信等方式發(fā)布有關(guān)專業(yè)的信息,開(kāi)通手機(jī)的訂閱服務(wù)功能等。建立移動(dòng)終端的個(gè)人圖書(shū)館是圖書(shū)館服務(wù)功能轉(zhuǎn)型的重要環(huán)節(jié)。
4結(jié)語(yǔ)
大數(shù)據(jù)的來(lái)臨,是科技進(jìn)步的必然結(jié)果,它在給傳統(tǒng)的高校圖書(shū)館帶來(lái)挑戰(zhàn)的同時(shí),也帶來(lái)了機(jī)遇。只有正確認(rèn)識(shí)大數(shù)據(jù),深度挖掘大數(shù)據(jù)的價(jià)值,完善大數(shù)據(jù)技術(shù),高校圖書(shū)館才能在大數(shù)據(jù)時(shí)代下得到發(fā)展。只有改變服務(wù)理念,了解客戶的需求,掌握專業(yè)進(jìn)步的需求,提高服務(wù)品質(zhì),高校圖書(shū)館才能實(shí)現(xiàn)服務(wù)轉(zhuǎn)型。建立在大數(shù)據(jù)平臺(tái)下的高校圖書(shū)館,是未來(lái)高校圖書(shū)館發(fā)展的必然趨勢(shì)。
[參考文獻(xiàn)]
[1] 李福林.聯(lián)合發(fā)展,應(yīng)對(duì)圖書(shū)館邊緣化[J].情報(bào)探索,2009(1):10—11.
[2] 李國(guó)杰,程學(xué)旗.大數(shù)據(jù)研究:未來(lái)科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國(guó)科學(xué)院院刊,2012(6):647—657.
[3] 楊海燕.大數(shù)據(jù)時(shí)代的圖書(shū)館服務(wù)淺析[J].圖書(shū)與情報(bào),2012(4):120—122.
[4] 嚴(yán)霄鳳,張德馨.大數(shù)據(jù)研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013(4):168—172.
[5] 龔亦農(nóng).數(shù)字圖書(shū)館的資源整合[J].圖書(shū)情報(bào)工作,2005(9):121—123.
[6] 中國(guó)新聞出版研究院.第十次全國(guó)國(guó)民閱讀調(diào)查報(bào)告[EB/OL]. [2013-07-27].http://www.chuban.cc/yw/201304/t20130419_140027.html.