銀晶
摘 要 大數(shù)據(jù)的核心實際是一種數(shù)據(jù)思維,國內(nèi)公共圖書館目前已做了一些利用大數(shù)據(jù)嘗試。論文從單個城市公共圖書館到圖書館業(yè)內(nèi),以及圖書館與社會跨界三個維度的實證分析,反映出大數(shù)據(jù)運用時產(chǎn)生的各種問題,并給予建議和對策,同時也展望了圖書館未來大數(shù)據(jù)運用情況,以期對國內(nèi)圖書館業(yè)內(nèi)有所借鑒。
關(guān)鍵詞 公共圖書館 大數(shù)據(jù) 數(shù)據(jù)思維
分類號 G250.76
DOI 10.16810/j.cnki.1672-514X.2017.01.012
Analysis and Countermeasures on the Empirical Process of Big Data in Public Library
Yin Jing
Abstract The core of big data is a data thinking. At present domestic public libraries have made some attempt of using big data. This paper analyzes the empirical process of big data from three dimensions, including public libraries in different cities, library industry, and library and social cross-borders. It reflects some problems of using big data, and gives the suggestions and countermeasures. Also it outlooks the future of big data in libraries, and hopes to give reference for domestic libraries.
Keywords Public library. Big data. Data thinking.
大數(shù)據(jù)時代要學(xué)會用數(shù)據(jù)說話,其核心就是要擁有數(shù)據(jù)思維[1]。作為服務(wù)行業(yè)的公共圖書館,數(shù)據(jù)的產(chǎn)生及收集是非常豐厚的,利用大數(shù)據(jù)思維,可以從更多維度來了解館情,不僅可以了解館內(nèi)讀者行為、資源使用情況,改進或調(diào)整管理決策、服務(wù)過程、技術(shù)手段以及宣傳策略,提升圖書館服務(wù)質(zhì)量和水平、提高資源利用率等;也可以在業(yè)內(nèi)進行比較,幫助發(fā)現(xiàn)問題,了解所處行業(yè)位置和業(yè)務(wù)水平;還可以將數(shù)據(jù)與外部環(huán)境關(guān)聯(lián)對比,在社會大環(huán)境中看清楚圖書館的服務(wù)價值、提升空間及發(fā)展方向。
1 圖書館對大數(shù)據(jù)的認(rèn)識才剛剛開始
大數(shù)據(jù)目前雖然已經(jīng)成為業(yè)界的話題,但在圖書館,大多數(shù)人認(rèn)為它離我們還遙遠(yuǎn),在實踐中還沒有認(rèn)認(rèn)真真地著手基礎(chǔ)數(shù)據(jù)的挖掘工作,一些看似簡單的、無用的、雜亂的數(shù)據(jù)還沒有有效地應(yīng)用于圖書館的各項工作中,圖書館對大數(shù)據(jù)的認(rèn)識也才剛剛開始。
國內(nèi)圖書館將一些業(yè)務(wù)服務(wù)數(shù)據(jù)向社會公布始于2013年,率先是由上海圖書館開始嘗試。上海圖書館于2013年推出了“我的悅讀2012”,即注冊讀者2012年的閱讀賬單,大獲好評,其數(shù)據(jù)內(nèi)容為上海圖書館的讀者每人平均借閱書本冊數(shù)、借閱量最大的讀者借過多少冊、借閱頻率最高的書被多少名讀者借過、上海市中心圖書館的規(guī)模等有趣的統(tǒng)計數(shù)據(jù)[2]。2015年,深圳圖書館對外公布了深圖2014年大數(shù)據(jù)服務(wù)結(jié)果,包括到館人次、服務(wù)讀者量、文獻外借冊次、全年舉辦各類活動場次,微媒體粉絲、數(shù)字閱讀服務(wù)量、年度檢索熱詞、圖書館設(shè)施設(shè)備情況及場館服務(wù)宣傳等內(nèi)容。同年,杭州圖書館則在其微信公眾號增加了“閱讀賬單”功能,綁定讀者帳號后,讀者可了解自己在2014年的全年借閱量及排行、文獻種類、持證時間等數(shù)據(jù)內(nèi)容。2016年初,東莞圖書館、廣州圖書館、佛山圖書館等也相繼在媒體上公布本館大數(shù)據(jù)服務(wù)內(nèi)容。盡管眾多的圖書館向社會陸續(xù)開展大數(shù)據(jù)服務(wù),但筆者認(rèn)為真正實施大數(shù)據(jù)分析的圖書館卻少之又少。
2 圖書館數(shù)據(jù)源統(tǒng)計應(yīng)用實證分析
大數(shù)據(jù)理論上需要全的數(shù)據(jù),圖書館目前已有的數(shù)據(jù)并不少,特別是采用績效管理模式的圖書館,數(shù)據(jù)源更是種類多樣,這就需要對館內(nèi)部的數(shù)據(jù)進行梳理、分析,進行查漏補缺、合并重復(fù)數(shù)據(jù),形成數(shù)據(jù)整合報表,一目了然,清晰明白,而一旦其中數(shù)據(jù)有異樣可以準(zhǔn)確發(fā)現(xiàn)問題環(huán)節(jié),這樣才具有參考決策意義。
2.1 案例一、流通文獻書目數(shù)據(jù)
以流通文獻為例,流通文獻的統(tǒng)計在系統(tǒng)建設(shè)前期,已經(jīng)設(shè)計了各種數(shù)據(jù)字段的數(shù)據(jù)表等,需要什么字段的內(nèi)容,語句命令調(diào)用即可。基于東莞圖書館圖書館Interlib系統(tǒng)后臺調(diào)用日志,采用SQL統(tǒng)計方法,對2014年1月1日—2014年12月31日圖書館借閱文獻進行統(tǒng)計,并按照文獻借閱數(shù)量排序,顯示年文獻借閱量達1萬次以上數(shù)據(jù)統(tǒng)計結(jié)果,見表1。
(1)該熱門文獻借閱統(tǒng)計表需要與館藏文獻統(tǒng)計表等相關(guān)業(yè)務(wù)數(shù)據(jù)進行對比,對于文獻館藏比例調(diào)整、采購選擇有了參考依據(jù),館藏文獻統(tǒng)計表、預(yù)約文獻統(tǒng)計表、續(xù)借文獻統(tǒng)計表、熱門檢索文獻統(tǒng)計表等此類數(shù)據(jù)的統(tǒng)計就需要納入業(yè)務(wù)數(shù)據(jù)統(tǒng)計范疇中。
(2)該表分析有如下結(jié)果,成人讀物與少兒讀物類別比例對分,即1:1。成人閱讀最熱內(nèi)容,除小說及家庭教育之外,個性心理學(xué)(人格心理學(xué))、圖形圖像識別、人生觀與人生哲學(xué)、證券市場也進入了熱門借閱榜。兒童閱讀最熱內(nèi)容,以圖畫故事書為主,各種童話、寓言、兒童笑話、謎語、神話其次,位居第三的美國圖書故事書深受歡迎,隨后是各科簡易讀物、對照讀物、注釋讀物、幼兒讀物、常識等等。
(3)對于此表的統(tǒng)計還發(fā)現(xiàn)文獻編目數(shù)據(jù)應(yīng)有更詳細(xì)的制定規(guī)則。以I247.57為例,就有長篇小說、言情小說、中篇小說、三部曲(作品)、日記體小說、歷史小說、短篇小說空值等35項分類說明,不僅增加了統(tǒng)計難度,而且統(tǒng)計出來的結(jié)果無法適用于實際工作。
2.2 案例二、監(jiān)控數(shù)據(jù)的作用
以到館人次為例,東莞圖書館2014年到館人數(shù)為230萬,其中參與用戶培訓(xùn)人數(shù)占0.79%,參加講座人數(shù)占1.4%,參觀展覽人數(shù)占18.9%,合計有21.09%的讀者到館是參加各種活動、講座或培訓(xùn)。其中書刊文獻外借人次占流通人次的38.17%,到館使用文獻資源,那么還有40.74%的到館讀者在做什么呢?自習(xí)、休閑、開架閱覽是觀察中得到的結(jié)論,并無數(shù)據(jù)支持,而這部分?jǐn)?shù)據(jù)是可以通過已有的門禁系統(tǒng)、視頻監(jiān)控系統(tǒng)等進行數(shù)據(jù)統(tǒng)計。除了統(tǒng)計數(shù)量之外,監(jiān)控數(shù)據(jù)時間分布趨勢對安全管理措施制定有重要的參考意義。
以上僅以兩個案例說明在圖書館內(nèi)外部反映業(yè)務(wù)成效數(shù)據(jù)中需要厘清數(shù)據(jù)源,在對一種業(yè)務(wù)數(shù)據(jù)報表統(tǒng)計時要與關(guān)聯(lián)數(shù)據(jù)表相互佐證,籍此來發(fā)現(xiàn)是否有遺漏的價值數(shù)據(jù)。業(yè)務(wù)數(shù)據(jù)不能是孤立的,單個報表只反映了客觀事實的一部分,如安全管理的數(shù)據(jù),門禁監(jiān)控數(shù)據(jù)之外,還有能耗、資金投入、修繕等一系列方面的數(shù)據(jù)。
3 通過各類數(shù)據(jù)對比識別社會服務(wù)價值
圖書館的各種統(tǒng)計數(shù)據(jù)除館內(nèi)管理決策使用之外,還要有縱橫比較,一個是與館內(nèi)相關(guān)數(shù)據(jù)進行對比印證客觀事實;二是與業(yè)內(nèi)同行縱向進行比較,來確認(rèn)在業(yè)內(nèi)的服務(wù)水平和業(yè)務(wù)能力等;三是跨界比較,可與服務(wù)地域的人口結(jié)構(gòu)、教育水平、文化程度等進行跨界比較分析,從另一個角度來認(rèn)識圖書館的服務(wù)效果。
3.1 館內(nèi)相關(guān)數(shù)據(jù)對比印證
東莞圖書館的用戶數(shù)據(jù)統(tǒng)計分析結(jié)果中,讀者平均年齡為32歲,男女比例基本持平,男性略占優(yōu)勢,學(xué)歷數(shù)據(jù)統(tǒng)計結(jié)果顯示,小學(xué)以上學(xué)歷占32.83%,其中中學(xué)類占8.15%、大學(xué)占23.75%,研究生以上占1.3%;而填寫其它/空白,即無學(xué)歷占67.13%,表明大部分讀者學(xué)歷不高或太高或無學(xué)歷。與2014年文獻借閱統(tǒng)計分析得出預(yù)估讀者群體特征相一致。
3.2 與業(yè)內(nèi)同行縱向比較
當(dāng)單館的業(yè)務(wù)數(shù)據(jù)與同行相比較的時候,數(shù)據(jù)差異會在一定程度上說明各館的服務(wù)差異,但更多的則是數(shù)據(jù)本身有各種問題。以下案例中國內(nèi)幾個公共圖書館大數(shù)據(jù)結(jié)果來源均出自媒體報道或其工作年報,或直接采用,或根據(jù)其數(shù)據(jù)與相關(guān)數(shù)據(jù)進行演算后得出,沒有數(shù)據(jù)則空白顯示。
(1)主要讀者群體年齡段。表2數(shù)據(jù)顯示,各館的主要年齡段分布在18-45歲之間。
(2)年流通人次及日均到館人次。表3數(shù)值統(tǒng)計中包含了各館分館的數(shù)據(jù),統(tǒng)計方式各館都不同,東莞圖書館曾采用紅外線計數(shù)器,但這種設(shè)備對于群體出入的數(shù)量無法精確記錄,后更新?lián)Q代成單人出入閘口,使得數(shù)據(jù)統(tǒng)計更為準(zhǔn)確。
(3)年文獻外借冊次。表4中可以看到,上海圖書館的年文獻外借冊次驚人。其它館的外借冊次雖然相比而言并不多,卻不能說明服務(wù)水平不高,因為數(shù)字閱讀的服務(wù)已是現(xiàn)代圖書館文獻服務(wù)的重要領(lǐng)域。
人均借閱冊次=外借冊次/持證讀者數(shù)
數(shù)值=(未成年人6冊次+成年人5冊次)/2
(4)持證讀者占城市常住人口比例。表5中的數(shù)值比例本意是想表達圖書館的社會價值和作用,然而讀者證卻是一言難盡的,有些城市圖書館的讀者證與類似便民服務(wù)卡的城市管理服務(wù)相融合,使其服務(wù)卡也具備了讀者證功能,比如社保卡,電子學(xué)生證或校園卡等,通常都?xì)w因于當(dāng)?shù)卣欠翊罅χС?,具有典型的地域特征。而其它圖書館沒有這樣的強力支持力度,則會從讀者證的有效性、活躍性等方面發(fā)出疑問。因此,如何確認(rèn)讀者證的真正價值,或者考慮用其它可以替代的數(shù)值項來表達圖書館對于本地社會的價值和作用。
各城市常住人口數(shù)值均取自各地《2014年X市國民經(jīng)濟與社會發(fā)展統(tǒng)計公報》,如《2014年廣州市國民經(jīng)濟和社會發(fā)展統(tǒng)計公報》
(5)數(shù)字資源服務(wù)量。表6中各館對于數(shù)字資源使用的統(tǒng)計方式,統(tǒng)計項等并不統(tǒng)一。數(shù)字資源的點擊量如何統(tǒng)計、冊次與篇次又有什么區(qū)別,如何計量?下載到本地還是緩存等都無定論。數(shù)字資源使用需要用什么樣的指標(biāo)來確認(rèn),各館均有自己的看法。
(6)熱門借閱文獻。對于熱門文獻的界定,顯然也不統(tǒng)一,各館對于熱門文獻的分析角度也不同,比如上海圖書館對于不同年齡層進行了分析,青年人閱讀經(jīng)濟類圖書的比例遠(yuǎn)高于中老年讀者,老年人閱讀經(jīng)典讀物、人物傳記圖書的比例高于中青年讀者。深圳圖書館書刊借閱部主任張樺介紹[9],工業(yè)技術(shù)類和經(jīng)濟類,這兩大類正好與深圳重點發(fā)展高新技術(shù)產(chǎn)業(yè)、金融產(chǎn)業(yè)的城市發(fā)展方向相吻合,進一步細(xì)分之后,在工業(yè)技術(shù)類中,計算機軟件類的書籍借閱量較大;在經(jīng)濟類中,金融理財和企業(yè)管理類的書籍比較受到讀者的青睞。廣州館則給出了熱門文獻前十名的排行榜,只列出了具體書目文獻信息,沒有類別的統(tǒng)計分析。
綜上所述,當(dāng)館內(nèi)統(tǒng)計的數(shù)據(jù)與業(yè)內(nèi)同行比較時,產(chǎn)生了各種問題,追究其原因,(1)沒有數(shù)據(jù)統(tǒng)計的標(biāo)準(zhǔn),特別是數(shù)字閱讀使用量,而傳統(tǒng)業(yè)務(wù)數(shù)據(jù)的已經(jīng)不能客觀反映業(yè)務(wù)真是情況。(2)大數(shù)據(jù)運用中,該統(tǒng)計什么樣的數(shù)據(jù)項,如何對數(shù)據(jù)項進行有效分析。(3)大數(shù)據(jù)分析結(jié)果要對社會發(fā)生什么樣的影響作用需要考慮,既要積極指引閱讀的作用,也不能抹去存在的問題和困難。(4)數(shù)據(jù)公布是為了帶動業(yè)內(nèi)發(fā)展,促進交流,為本地讀者提供更好的服務(wù)。
3.3 跨界比較
圖書館對社會的影響力到底有多大,或者說對于社會的價值貢獻有多少,在大數(shù)據(jù)時代,各行各業(yè)都開始重視數(shù)據(jù),單純的數(shù)據(jù)沒有了行業(yè)間的阻隔使得跨界比較成為了可能。以東莞圖書館用戶分析數(shù)據(jù)與東莞市人口數(shù)據(jù)的比較為例。數(shù)據(jù)比較1:2014年末東莞市全市常住人口834.31萬人,其中城鎮(zhèn)常住人口740.95萬人,戶籍人口191.39萬人。常住人口以外來務(wù)工人員為主,大部分學(xué)歷為中學(xué)/中專以下,與該館讀者群體分析一致。數(shù)據(jù)比較2:東莞圖書館2014年總分館到館人次為713萬,表明東莞圖書館總分館為全市85%的常住人口提供了服務(wù),去過身邊的圖書館/基層公共電子閱覽室。數(shù)據(jù)比較3:東莞圖書館圖書館2014年提供數(shù)字閱讀服務(wù)量達到了1千萬次以上,以當(dāng)年的東莞市常住人口計算,人均約1.2次。上述比較反映了一個城市的圖書館對于本地社會的服務(wù)情況,側(cè)面反映出它的社會影響力。
除以上對比之外,還可以與當(dāng)?shù)厝丝谖幕?、學(xué)歷水平、社會經(jīng)濟發(fā)展情況等各方面進行跨界對比,城市圖書館為本地市民提供服務(wù)的質(zhì)量、數(shù)量更能準(zhǔn)確反映該圖書館對于當(dāng)?shù)厣鐣膬r值、對市民及行業(yè)的影響力,以及對未來服務(wù)發(fā)展方向的了解等。
4 圖書館運用大數(shù)據(jù)的問題與對策
4.1 標(biāo)準(zhǔn)規(guī)范制定是大數(shù)據(jù)利用前提
4.1.1 規(guī)范原始數(shù)據(jù)類型,夯實數(shù)據(jù)統(tǒng)計的基礎(chǔ)
經(jīng)過數(shù)據(jù)整理會發(fā)現(xiàn)各種數(shù)據(jù)統(tǒng)計問題,規(guī)范原始數(shù)據(jù)非常必要,比如原始數(shù)據(jù)登記內(nèi)容是否完整、數(shù)據(jù)類型分類數(shù)量酌情增減、數(shù)據(jù)源是否增加等。
4.1.2 數(shù)據(jù)統(tǒng)計方式要明確,便于數(shù)據(jù)采信利用
目前業(yè)內(nèi)對于圖書館業(yè)務(wù)數(shù)據(jù)并無統(tǒng)一標(biāo)準(zhǔn),而實際業(yè)務(wù)中發(fā)生的數(shù)據(jù)紛繁蕪雜,以圖書館提供數(shù)字資源服務(wù)的數(shù)據(jù)庫為例,統(tǒng)計數(shù)據(jù)項中的點擊量、下載量、瀏覽量并無統(tǒng)一的標(biāo)準(zhǔn)解釋,或者由圖書館根據(jù)自己的理解去統(tǒng)計,或者由數(shù)據(jù)庫提供商提供資源使用的數(shù)據(jù)統(tǒng)計結(jié)果。這樣的數(shù)據(jù)結(jié)果采信值較低,不利于反映出業(yè)務(wù)服務(wù)的真實情況。
4.1.3 亟待解決數(shù)據(jù)統(tǒng)計標(biāo)準(zhǔn)規(guī)范的制定
從采集渠道、采集種類、統(tǒng)計方式、統(tǒng)計結(jié)果呈現(xiàn)方式等進行規(guī)范。在標(biāo)準(zhǔn)制定過程中需要參照行業(yè)外部的相關(guān)數(shù)據(jù)統(tǒng)計標(biāo)準(zhǔn)規(guī)范,以便與之可以對接,具有可比較性等。
4.2 大數(shù)據(jù)的技術(shù)解決方案
4.2.1 技術(shù)改進,便于使用
大數(shù)據(jù)實際使用中不是必須重新研發(fā)技術(shù)平臺,特別是目前圖書館業(yè)內(nèi)不會花費高昂的成本進行,可以考慮在現(xiàn)有業(yè)務(wù)/服務(wù)系統(tǒng)后臺中搭建小型的統(tǒng)計模塊,對既有的數(shù)據(jù)進行隨時統(tǒng)計,將大型數(shù)據(jù)統(tǒng)計分散到每月/周/日進行統(tǒng)計再匯總,而在很多圖書館的業(yè)務(wù)系統(tǒng),特別是采用interlib系統(tǒng)的圖書館,數(shù)據(jù)表庫中已經(jīng)包含了較為完整的業(yè)務(wù)數(shù)據(jù)信息,只需要根據(jù)需求調(diào)用統(tǒng)計即可。
4.2.2 借力第三方
大數(shù)據(jù)統(tǒng)計不是必須由圖書館自己操作完成,可以借助第三方工具、網(wǎng)站、軟件、科研機構(gòu)等等,在可信的基礎(chǔ)上,借力得出與自己有關(guān)的價值數(shù)據(jù)。中研院信息科學(xué)研究所研究員陳升瑋[10]指出,在絕大多數(shù)情況下,大數(shù)據(jù)項目其實不需要建置Hadoop系統(tǒng)。就技術(shù)面來說,現(xiàn)在有許多業(yè)者開始提供成本較低的大數(shù)據(jù)處理工具和云端系統(tǒng),有些甚至跟App一樣,只要根據(jù)自身需求挑選需要購買的功能即可,例如科智提供的工業(yè)化數(shù)據(jù)管理工具即為一例。
4.3 構(gòu)建數(shù)據(jù)管理機制
(1)圖書館的大數(shù)據(jù)運用定位需要明晰。大數(shù)據(jù)應(yīng)用是為圖書館管理、資源、服務(wù)提供參考依據(jù)或數(shù)據(jù)支撐,它是一種方法、一種工具,不同層級的數(shù)據(jù)統(tǒng)計分析結(jié)果應(yīng)對應(yīng)不同層級的管理模式。從數(shù)據(jù)的產(chǎn)生源,數(shù)據(jù)結(jié)果用在哪里,讓從管理層到一線員工能夠清晰的了解他所負(fù)責(zé)的服務(wù)內(nèi)容和業(yè)務(wù)目前的運營狀況。
(2)建立數(shù)據(jù)驅(qū)動機制。當(dāng)通過數(shù)據(jù)分析某個細(xì)分用戶群時,發(fā)現(xiàn)用戶群的活躍/降低規(guī)律時,基于用戶的特征,就要針對此現(xiàn)象開展數(shù)據(jù)關(guān)聯(lián)查詢,發(fā)揮各個環(huán)節(jié)數(shù)據(jù)的價值以便形成具有個性化的服務(wù)方案。
(3)對于數(shù)據(jù)結(jié)果,還需要實踐論證。比如根據(jù)流通文獻數(shù)據(jù)統(tǒng)計結(jié)果進行對應(yīng)的資源采購、服務(wù)推廣,除了進行數(shù)據(jù)統(tǒng)計分析,還要與之前數(shù)據(jù)進行對比驗證,不斷完善和改進數(shù)據(jù)統(tǒng)計方法,提高數(shù)據(jù)準(zhǔn)確率,提升數(shù)據(jù)利用價值。
(4)加強合作方數(shù)據(jù)管理。在數(shù)據(jù)統(tǒng)計過程中,有些數(shù)據(jù),如數(shù)字資源在線使用的數(shù)據(jù)等,不是由圖書館統(tǒng)計或處理的,在處理數(shù)據(jù)安全、用戶隱私、數(shù)據(jù)可信度以及數(shù)據(jù)使用等方面需要考慮。
4.4 生產(chǎn)數(shù)據(jù)產(chǎn)品
數(shù)據(jù)產(chǎn)品最大的價值在于輔助使用者優(yōu)化決策,以及輔助決策價值的實現(xiàn)。因此圖書館大數(shù)據(jù)產(chǎn)生的數(shù)據(jù)產(chǎn)品需要注意兩點,一是認(rèn)清掌握的數(shù)據(jù)能給受眾帶來哪些有價值的服務(wù)。二是認(rèn)清掌握的數(shù)據(jù)可以通過哪些合理的方法提供。
圖書館可以產(chǎn)生的數(shù)據(jù)產(chǎn)品包括用戶行為數(shù)據(jù)產(chǎn)品、文獻服務(wù)數(shù)據(jù)產(chǎn)品等大類產(chǎn)品,每類數(shù)據(jù)產(chǎn)品又可以細(xì)分成各具特色的數(shù)據(jù)產(chǎn)品,用戶行為數(shù)據(jù)產(chǎn)品可以按不同時段的到館人次、人口籍貫、文化程度、借閱次數(shù)等進行細(xì)分,而文獻服務(wù)產(chǎn)品數(shù)據(jù)就更多,文獻借閱冊次、種類、出版社、作家、年份等,或者二次以上的文獻再開發(fā)、不同主題資源整合、專題深度挖掘等數(shù)據(jù)產(chǎn)品。這些數(shù)據(jù)產(chǎn)品除了圖書館自身掌握和運用之外,還可以為當(dāng)?shù)卣峁┕芾矸?wù)參考;與文獻/資源提供商對已有文獻產(chǎn)品服務(wù)升級進行談判的基礎(chǔ);為拓寬服務(wù)內(nèi)容、服務(wù)方式、創(chuàng)新服務(wù)模式而引入社會團體,并與之對接開展合作的基礎(chǔ)等等。
5 展望圖書館未來大數(shù)據(jù)運用
從圖書館業(yè)務(wù)管理角度出發(fā),大數(shù)據(jù)的運用是圖書館大數(shù)據(jù)運用的初級階段,當(dāng)技術(shù)發(fā)展到更高層次時,圖書館真正的大數(shù)據(jù)運用是知識大數(shù)據(jù),圖書館的服務(wù)也將從文獻信息服務(wù)過渡到知識服務(wù)。蘇新寧[11]認(rèn)為以知識為導(dǎo)向的文獻信息將進行深度開發(fā),知識單元加工與重組,智能詞表、自動分類詞表的組織與共享都將成為未來圖書館的實踐領(lǐng)域,館藏文獻數(shù)據(jù)資源將與社會資源整合,文獻整合服務(wù)向綜合信息資源服務(wù)發(fā)展,以往簡單文獻推薦信息指引將被知識單元數(shù)據(jù)集替代,真實而具體為讀者答疑解惑等等。
從外部環(huán)境融合角度來看,大數(shù)據(jù)的運用是圖書館數(shù)據(jù)開放的運用。除了必要的保密數(shù)據(jù)(用戶隱私數(shù)據(jù)等)之外,業(yè)務(wù)數(shù)據(jù)、館藏數(shù)據(jù)、資源數(shù)據(jù)等都可開放出來。提供數(shù)據(jù)開放服務(wù),包括開放技術(shù)平臺,提供個性化閱讀學(xué)習(xí)功能模塊構(gòu)建;提供大數(shù)據(jù)學(xué)習(xí)課件、軟件支持工具、討論專區(qū);提供資源拆分、重組等軟件工具、學(xué)習(xí)課件及討論專區(qū)。
從用戶角度來看,構(gòu)建眾包模式,鼓勵萬千讀者創(chuàng)建個性化的閱讀學(xué)習(xí)資源庫,對資源進行拆分、重組、再生產(chǎn),甚至按照自己喜歡的方式呈現(xiàn)。還可依照個人興趣或閱讀學(xué)習(xí)方式來創(chuàng)建如報紙、期刊、文檔、視頻等載體類型的讀者個性化閱讀學(xué)習(xí)資源。知識的再生產(chǎn)已不再是獨屬于圖書館或者館員的專利,人人都是知識構(gòu)建、分享者。采用眾包模式,海量數(shù)字資源真正成為知識的寶藏,人人都可以通過自己的方式學(xué)習(xí)和發(fā)現(xiàn)更多更有價值的知識內(nèi)容,圖書館真正成為知識的寶庫。
從第三方合作角度來看,將數(shù)字閱讀平臺(PC端、移動端)的接口開放API(Application Programming Interface,應(yīng)用程序編成接口),讓第三方不僅可以訪問網(wǎng)站內(nèi)容,還可以對內(nèi)容進行修改、整合和再創(chuàng)作,或者增加功能模塊,或形成新的應(yīng)用在第三方平臺上向用戶推送等[12]。合作的目的是采用正確的創(chuàng)意,采用正確的科技和媒體策略,集合各類能人以有效和高效的方式完成任務(wù)[13]。不僅第三方能以較少的成本、較高的成功幾率來創(chuàng)業(yè),圖書館服務(wù)內(nèi)容也更加豐富、形式更加多樣,獲得更多的關(guān)注以及擴大社會影響力。
圖書館內(nèi)外雙向發(fā)展,大數(shù)據(jù)帶給圖書館的將會是顛覆性的,業(yè)務(wù)、管理、服務(wù)、思維方式等等隨之而變,而圖書館是否已做好應(yīng)對了呢?對于圖書館來說這是最好的時代,也是最壞的時代。
參考文獻:
[ 1 ] 吳明輝.忘掉你的大數(shù)據(jù),數(shù)據(jù)思維才最重要![EB/OL].(2015-10-15)[2016-03-13].http://www.cbdio.com/BigData/2015-10/15/content_3972102.htm.
[ 2 ] 上海圖書館推出讀者年度閱讀“對賬單”[EB/OL].(20
13-02-16)[2016-03-13].http://www.wenming.cn/book/pdjj/201302/t20130216_1070126.shtml.
[ 3 ] 東莞圖書館:十年書香漫莞邑[EB/OL].(2016-01-18)[2016-03-13].http://epaper.southcn.com/nfdaily/html/2016-01/18/content_7509723.htm.
[ 4 ] 上海圖書館持證讀者增至310萬,超半數(shù)年外借14冊書[EB/OL].(2015-04-22)[2016-03-13].http://cul.jschina.com.cn/system/2015/04/22/024447365.shtml.
[ 5 ] 廣州圖書館.2014年報:業(yè)務(wù)統(tǒng)計數(shù)據(jù)[Z].廣州圖書館,2014.
[ 6 ] 圖書館大數(shù)據(jù):年人均借書17冊 深圳人都愛看些
啥?[EB/OL].( 2015-10-30 )[2016-03-13].http://www.sznews.com/news/content/2015-10/30/content_124201
90.htm.
[ 7 ] 佛山讀者7年增14倍 最喜愛圖書出爐[EB/OL].(20
15-04-23)[2016-03-13].http://www.citygf.com/FSNews/FS_002008/201504/t20150423_5641555.html.
[ 8 ] 去年廣州圖書館入館人數(shù)遠(yuǎn)超國家圖書館成全國第一[EB/OL].(2016-01-14)[2016-03-13].http://city.igdzc.
com/a/20160114/68850.html#0-tsina-1-12273-
397232819ff9a47a7b7e80a40613cfe1.
[ 9 ] 深圳人到圖書館都愛借閱些什么書?大數(shù)據(jù)告訴你![EB/OL].(2015-04-23)[2016-03-13].http://www.sznews.com/news/content/2015-04/23/content_114981
57.htm.
[10] 李欣宜:一次搞懂大數(shù)據(jù),《數(shù)位時代》第251期[EB/OL].(2015-04-01)[2016-03-13].http://www.bnext.com.tw/article/view/id/35807.
[11] 蘇新寧.大數(shù)據(jù)環(huán)境數(shù)字圖書館面臨的挑戰(zhàn)[EB/OL].(2015-06-10)[2016-03-13].http://www.lib.bnu.edu.cn/balis/2015/2.pdf.
[12] 周婷婷.大數(shù)據(jù)時代數(shù)據(jù)運用的理念與實踐研究:以英國《衛(wèi)報》為例[J].江漢學(xué)術(shù),2015(1):123-128.
[13] 鮑勃·羅德,雷·維勒茲.大融合:互聯(lián)網(wǎng)時代的商業(yè)模式[M].朱衛(wèi)未,等譯.北京:人民郵電出版社,2015:36.