摘 要:大數(shù)據(jù)時代,互聯(lián)網(wǎng)將從網(wǎng)頁相聯(lián)走向“數(shù)據(jù)相聯(lián)”和“知識相聯(lián)”。大數(shù)據(jù)技術(shù)應(yīng)用將是圖書館服務(wù)創(chuàng)新、提升服務(wù)價值的重要手段?,F(xiàn)階段,圖書館的核心競爭力將轉(zhuǎn)變?yōu)橛脩糍Y源,文獻資源趨向于同質(zhì)化,衡量圖書館競爭力的將是用戶數(shù)及其服務(wù)效益。
關(guān)鍵詞:大數(shù)據(jù) 圖書館 服務(wù)創(chuàng)新
中圖分類號:G25 文獻標識碼: A 文章編號:1003-9082(2017)10-00-01
一、大數(shù)據(jù)時代的來臨
近十多年來,數(shù)字圖書館(DL)、信息共享空間(IC)、IFRD、機構(gòu)知識庫(IR)、移動圖書館(ML)、云計算等等輪番登場,成為熱點。從去年開始,大數(shù)據(jù)(Big Data)開始成為熱點。2012年3月29日,美國奧巴馬政府宣布推出“大數(shù)據(jù)研究和發(fā)展計劃”( Big Data Research and Development Initiative),該計劃涉及NSF等6個聯(lián)邦政府部門,投資超兩億美元,研發(fā)采集、組織和分析大數(shù)據(jù)的工具及技術(shù)。美國政府大數(shù)據(jù)計劃的出籠,表明大數(shù)據(jù)技術(shù)已經(jīng)上升為國家戰(zhàn)略。
傳統(tǒng)資源被數(shù)字化只占數(shù)字資源的很小部分,原生數(shù)字資源(Born –digital resources )不斷產(chǎn)生,每個用戶、每臺終端都在產(chǎn)生信息。Google Glass Explorer Edition 4月16日開始對2000位測試者發(fā)放,進行用戶體驗。預計2014年大規(guī)模上市,這是微型投影儀+攝像頭+傳感器+存儲+傳輸+操控系統(tǒng)的結(jié)合體。
據(jù) IDC (國際數(shù)據(jù)公司)統(tǒng)計,全球數(shù)據(jù)量以年均50%的速率增長。2011 年全球所產(chǎn)生的數(shù)據(jù)總量是 1.8 ZB(10 的 21 次方)。根據(jù)美國南加州大學學者的研究結(jié)果,人類信息儲存量每18個月就提高一倍 。非結(jié)構(gòu)化的數(shù)據(jù)(圖片、聲音、視頻、地理位置信息等等),已成為數(shù)字資源的主體,約占數(shù)據(jù)總量的80%以上。數(shù)據(jù)中蘊藏的巨大價值引發(fā)了對于數(shù)據(jù)處理、分析、挖掘的巨大需求。這樣催生了大數(shù)據(jù)的概念與相關(guān)技術(shù)。大數(shù)據(jù)技術(shù)的宗旨就是從海量、多樣性的數(shù)據(jù)中,快速獲得有價值的信息。
二、大數(shù)據(jù)對圖書館的影響
商業(yè)或經(jīng)濟領(lǐng)域的觸角一般來說是最靈敏的。大數(shù)據(jù)已經(jīng)對商業(yè)企業(yè)產(chǎn)生影響。樂購公司(Tesco)通過挖掘分析會員卡用戶的購物數(shù)據(jù),對顧客分類,有針對性地發(fā)廣告郵件, 每年節(jié)省 3.5 億英鎊的廣告費用。圖書館的服務(wù)推廣能否這樣精準?智能手機可實現(xiàn)號碼(身份信息)的一對一鎖定,空間的一對一鎖定(LBS平臺)、時間的一對一鎖定(“時間軸”)、資金流的一對一鎖定(支付數(shù)據(jù)平臺),提供精準廣告與銷售。圖書館能否借鑒應(yīng)用?樂購公司在韓國地鐵站的墻面展示所售商品的圖片,每張圖片上附有一個二維碼。消費者可用智能手機讀取二維碼,并將選好的商品放入虛擬購物車中,下班回家就可坐等送貨上門。曾經(jīng)被浪費的等車時間成了便捷的購物時間。借書能否如此?
數(shù)據(jù)處理分析將成為許多行業(yè)的主業(yè)。例如,在網(wǎng)上支付中,數(shù)據(jù)業(yè)務(wù)已成為主業(yè),而金融業(yè)務(wù)(刷卡、轉(zhuǎn)賬等)將走向免費化。在商業(yè)流通中,數(shù)據(jù)分析已成為主業(yè),柜臺服務(wù)則日益邊緣化。
圖書流通業(yè)務(wù)也將有這樣的趨勢,即主業(yè)應(yīng)是分析流通數(shù)據(jù),而不是流通操作本身(用戶自助),從而提高服務(wù)的針對性、有效性和質(zhì)量。
三、大數(shù)據(jù)對圖書館的機遇與挑戰(zhàn)
大數(shù)據(jù)為圖書館帶來的機遇是:大數(shù)據(jù)提供了采集數(shù)據(jù)的不竭來源,提供了分析問題的思想方法,提供了采集與分析處理數(shù)據(jù)的技術(shù)工具。大數(shù)據(jù)技術(shù)研究的主要目標就是開發(fā)、提供技術(shù)工具。
大數(shù)據(jù)為圖書館帶來的挑戰(zhàn)有:
1.用戶眼球的爭奪將更加劇烈
用戶的時間是有限的,太多的媒體與內(nèi)容吸引著他們,導致高校圖書館不僅紙書流通和到館讀者量處在下降通道,而且數(shù)字圖書館網(wǎng)站對用戶的吸引力也在下降。
2.人才缺乏
限于人才與技術(shù)水平,圖書館對于文獻數(shù)據(jù)庫以外的數(shù)字資源的采集、處理、保存、挖掘和服務(wù),還沒有引起足夠的重視。對于非結(jié)構(gòu)化數(shù)據(jù)的采集、處理、管理與利用,圖書館基本上還沒有作出反應(yīng)。
3.用戶隱私保護難度加大
個人隱私的泄漏和濫用的可能性在增大。隨著移動互聯(lián)、社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、電子商務(wù)等的迅速發(fā)展,人們在互聯(lián)網(wǎng)以及物理空間上的行為軌跡、檢索閱讀、言論交流、購物經(jīng)歷等等都可能被捕捉到。
4.數(shù)據(jù)安全、知識產(chǎn)權(quán)、商業(yè)利益、公共安全受損的威脅增大
大數(shù)據(jù)的發(fā)展,信息開放度加大,新的信息采集、數(shù)據(jù)分析、數(shù)據(jù)挖掘技術(shù)以及海量數(shù)據(jù)存儲技術(shù)和設(shè)備將不斷涌現(xiàn),云計算將更加普及。帶來的副作用是IT基礎(chǔ)架構(gòu)將變得越來越一體化和外向型,對數(shù)據(jù)安全和知識產(chǎn)權(quán)、商業(yè)利益甚至公共安全構(gòu)成較大的風險。
四、大數(shù)據(jù)時代圖書館發(fā)展的對策
1.更加關(guān)注特色資源建設(shè)
不同圖書館數(shù)字館藏趨向于同質(zhì)化。在大數(shù)據(jù)時代,圍繞特色優(yōu)勢學科進行專題數(shù)據(jù)采集,建立特色數(shù)據(jù)庫并實時更新數(shù)據(jù)變得十分重要。因此,我們需要從新的視角來看待數(shù)字圖書館的特色數(shù)據(jù)庫建設(shè)。在特色數(shù)據(jù)庫建設(shè)中,不僅要重視結(jié)構(gòu)化的文獻數(shù)據(jù),更要重視非結(jié)構(gòu)化數(shù)據(jù)的采集、分析、管理與服務(wù),如dataset、圖片、視頻等
2.引進、研發(fā)與應(yīng)用數(shù)據(jù)挖掘、分析和發(fā)現(xiàn)工具,加強數(shù)字資源的整合、分析和挖掘,提供高質(zhì)量的信息服務(wù)
關(guān)聯(lián)度分析、Hadoop:大數(shù)據(jù)處理軟件框架、大數(shù)據(jù)一體機、硬件軟件一體化的數(shù)據(jù)處理平臺、大數(shù)據(jù)處理的云服務(wù)。用數(shù)據(jù)說話。目前圖書館積累的數(shù)據(jù):書目數(shù)據(jù)、用戶數(shù)據(jù)、流通數(shù)據(jù)、參考咨詢數(shù)據(jù)、OPAC查詢數(shù)據(jù)、圖書館網(wǎng)站利用數(shù)據(jù)、數(shù)據(jù)庫利用數(shù)據(jù)、門禁系統(tǒng)數(shù)據(jù)等等。對這些數(shù)據(jù)進行分析挖掘,是改進資源建設(shè)與服務(wù)的重要依據(jù)。
參考文獻
[1]譚影虹.從數(shù)字圖書館到數(shù)據(jù)圖書館--大數(shù)據(jù)時代的圖書館服務(wù)范式轉(zhuǎn)變,圖書與情報[J],2016年3期.
[2]郗勤,傅永平.大數(shù)據(jù),圖書館的新機遇[J],集寧師范學院學報,2016年4期.
[3]劉明,李娜.大數(shù)據(jù)趨勢與專業(yè)圖書館,中華醫(yī)學圖書情報雜志[J],2013年2期
作者簡介:李欣容,女,漢族,河南省洛陽市,本科,職稱:圖書館員,研究方向:圖書情報。endprint