史微微
(黑龍江省政法管理干部學(xué)院,哈爾濱 150080)
?
試論大數(shù)據(jù)思維對圖書館信息服務(wù)的啟示
史微微
(黑龍江省政法管理干部學(xué)院,哈爾濱 150080)
摘要:大數(shù)據(jù)理念與實(shí)踐自商業(yè)領(lǐng)域向信息服務(wù)各個領(lǐng)域迅速擴(kuò)展,圖書館是社會中服務(wù)于公共文化的一個重要機(jī)構(gòu),致力于引進(jìn)及應(yīng)用大數(shù)據(jù)理念與技術(shù)。本文基于大數(shù)據(jù)思維視角,初步探討了收集存儲有關(guān)數(shù)據(jù),整合圖書館信息服務(wù)的作用,對于提高圖書館信息的創(chuàng)新具有十分重要的意義。
關(guān)鍵詞:圖書館信息;大數(shù)據(jù)思維;服務(wù)啟示
隨著不斷提高對大數(shù)據(jù)的關(guān)注,雖然大數(shù)據(jù)技術(shù)目前還不夠成熟,應(yīng)用還無法做到廣泛,但大數(shù)據(jù)思維具有十分重要的作用,在大數(shù)據(jù)時代應(yīng)基于此對該工具進(jìn)行應(yīng)用。本文以“圖書館立方”項(xiàng)目為例,對其在圖書館信息服務(wù)中的應(yīng)用進(jìn)行初步探討,研究應(yīng)用大數(shù)據(jù)思維對圖書館信息服務(wù)工作的整合及完善。
一、大數(shù)據(jù)及其思維
大數(shù)據(jù)也被稱為海量數(shù)據(jù),其劃分標(biāo)準(zhǔn)主要是根據(jù)數(shù)據(jù)的存儲容量是否達(dá)到PB或EB級。據(jù)國際數(shù)據(jù)公司統(tǒng)計報告顯示,全球信息總量增長速度每兩年可增長一倍,目前“大數(shù)據(jù)”的定義還缺乏統(tǒng)一的權(quán)威標(biāo)準(zhǔn)。但數(shù)據(jù)“大”與“大數(shù)據(jù)”是不同的,大數(shù)據(jù)在實(shí)際上不是定量描述數(shù)據(jù)規(guī)模,而是在多樣化的大容量數(shù)據(jù)中迅速提取信息的技術(shù)和思維[1]。
(一)大數(shù)據(jù)思維
大數(shù)據(jù)思維也就是指其哲學(xué)基礎(chǔ)或內(nèi)在邏輯,具有無偏性、規(guī)律性、開放性及關(guān)聯(lián)性4個特征。海量數(shù)據(jù)表面上沒有什么聯(lián)系,但在背后邏輯上存在一些規(guī)律,客觀記錄真實(shí)個體的心理、行為等內(nèi)容,相對于人類群體,個人在心理及行為模式方面具有穩(wěn)定性,并具有規(guī)律性表現(xiàn),若不是通過數(shù)據(jù)分析和挖掘是不可能清楚的。
統(tǒng)計是大數(shù)據(jù)技術(shù)的重要學(xué)科基礎(chǔ)之一,其思維能夠?qū)⒔y(tǒng)計學(xué)思維特點(diǎn)進(jìn)行充分展現(xiàn)。對“代表性”問題的解決是統(tǒng)計的重要成就,過去受現(xiàn)實(shí)因素所限,很多調(diào)查只是采取抽樣方法,但這存在一定的偏頗,難以代表總體客觀情況,因此統(tǒng)計學(xué)應(yīng)確保提高代表性[2]。隨著大數(shù)據(jù)技術(shù)的逐漸產(chǎn)生及應(yīng)用,也發(fā)現(xiàn)對總體研究具有可行性。
數(shù)據(jù)、數(shù)據(jù)庫、數(shù)據(jù)集及數(shù)據(jù)群的累加構(gòu)成大數(shù)據(jù),數(shù)據(jù)量達(dá)到一定程度才具有更高的應(yīng)用價值。在數(shù)據(jù)挖掘過程中,不僅要重視數(shù)據(jù)群內(nèi)數(shù)據(jù)集之間的關(guān)聯(lián),還要重視數(shù)據(jù)群之間的關(guān)聯(lián),才能將更多的隱性價值挖掘出來。
開放性主要是指不預(yù)設(shè)、預(yù)期結(jié)論的可能性,而根據(jù)被驗(yàn)證完成具有可靠性的科學(xué)方法和流程開展相關(guān)研究工作。大數(shù)據(jù)研究不具有預(yù)設(shè)性,在結(jié)論未得出前也不清楚預(yù)期結(jié)論應(yīng)該是什么。很多商業(yè)情報工具都具有對已知的未知進(jìn)行關(guān)注的特點(diǎn),了解問題后再尋找答案,預(yù)先由分析人員對收集數(shù)據(jù)的形式和類型進(jìn)行確定,這都是基于大數(shù)據(jù)及相應(yīng)的分析技術(shù)或系統(tǒng)充分配備的情況下。
大數(shù)據(jù)不僅是技術(shù),也是思維。借助大數(shù)據(jù)思維對圖書館信息服務(wù)模式進(jìn)行創(chuàng)新、信息服務(wù)范圍不斷擴(kuò)大及信息服務(wù)質(zhì)量不斷提高是關(guān)鍵,也要將大數(shù)據(jù)源提供給其他社會組織并創(chuàng)造一定的信息價值,而大數(shù)據(jù)技術(shù)在本質(zhì)上是將目標(biāo)實(shí)現(xiàn)的一個重要工具。
(二)圖書館與大數(shù)據(jù)
在圖書情報研究領(lǐng)域,數(shù)據(jù)、知識及信息之間不僅存在一定聯(lián)系還存在明顯的區(qū)別。被調(diào)用分析前大數(shù)據(jù)通常處于無序狀態(tài),難以直接進(jìn)行利用,而論文數(shù)據(jù)庫等信息資源在圖書館中能夠進(jìn)行直接閱讀、學(xué)習(xí),但圖書館中的借閱記錄、用戶信息行為數(shù)據(jù)等屬于大數(shù)據(jù)或具有成為大數(shù)據(jù)的可能性。大數(shù)據(jù)思維表明在海量數(shù)據(jù)背后隱藏的一些規(guī)律性數(shù)據(jù)群之間存在一定的關(guān)聯(lián),國內(nèi)某一個圖書館的圖書借閱記錄數(shù)還難以達(dá)到PB級,在數(shù)據(jù)規(guī)模上與大數(shù)據(jù)存在一定差距,但不影響圖書館對大數(shù)據(jù)思維的應(yīng)用。圖書館應(yīng)該存在多于目前的數(shù)據(jù)信息,但因沒有進(jìn)行大數(shù)據(jù)思維的學(xué)習(xí)及內(nèi)化,每天對產(chǎn)生的用戶信息行為等大數(shù)據(jù)的收集、存儲也不夠及時,更難以實(shí)現(xiàn)對數(shù)據(jù)進(jìn)行挖掘及研究[3]。
二、大數(shù)據(jù)思維的應(yīng)用
(一)“圖書館立方”項(xiàng)目
某高校圖書館在2010年研發(fā)完成了“圖書館立方”,將學(xué)生應(yīng)用圖書館的有關(guān)記錄關(guān)聯(lián)校內(nèi)其他系統(tǒng)的數(shù)據(jù)庫,不僅實(shí)現(xiàn)對教學(xué)活動中圖書館的影響與價值進(jìn)行評估,還能利用對信息的收集反饋使圖書館信息資源擴(kuò)大影響,也使其價值得到提高,以實(shí)現(xiàn)對學(xué)校制定教學(xué)提供重要的數(shù)據(jù)支撐作用[4]?!皥D書館立方”主要分為價值立方、營銷立方和流程改進(jìn)立方三部分內(nèi)容。
在價值立方方面,已開發(fā)應(yīng)用并圍繞學(xué)科教學(xué)活動進(jìn)行開展,用于對使用圖書館信息資源影響學(xué)生成績的客觀評價,利用該系統(tǒng)了解使用頻次不同的學(xué)生的信息特征。每學(xué)期應(yīng)對此數(shù)據(jù)進(jìn)行一次更新,并在期末匯總學(xué)生成績完成后導(dǎo)入。
通過分析“圖書館立方”的數(shù)據(jù)可知,高校學(xué)生的學(xué)習(xí)成績與其對圖書館信息資源的利用具有十分緊密的聯(lián)系。也就是說,高校學(xué)生對圖書館電子資源的利用時間越長,在學(xué)習(xí)成績方面具有更高的比例獲得好成績;或?qū)W生的學(xué)習(xí)成績越高,其對圖書館電子資源的利用時間也越長,在一定程度上使高校圖書館的重要性及價值創(chuàng)造作用得到充分體現(xiàn)。有關(guān)研究結(jié)果顯示,開展“圖書館立方”對圖書館將教學(xué)活動創(chuàng)造等向?qū)W校及上級機(jī)構(gòu)進(jìn)行展示具有重要作用;而且也將得到預(yù)期外的科學(xué)結(jié)論,為圖書館推廣相應(yīng)活動提供比較準(zhǔn)確的目標(biāo)群體,使活動具有更高的執(zhí)行效率及針對性。
(二)“圖書館立方”的思考
在數(shù)據(jù)規(guī)模上,“圖書館立方”使用的在校2萬名學(xué)生的成績數(shù)據(jù)、應(yīng)用圖書館信息資源的記錄,與大數(shù)據(jù)還有一些差距,但全面體現(xiàn)出大數(shù)據(jù)思維特征。針對學(xué)生學(xué)習(xí)成績或?qū)W術(shù)成就與其對圖書館信息資源利用之間存在的關(guān)系研究思路還有待于創(chuàng)新,但采用問卷、抽樣調(diào)查等研究方法,增大研究結(jié)論的偏差及缺失一些信息,這都是難以克服代表性的不足之處。但隨著日新月異的信息技術(shù),研究方法及分析技術(shù)明顯提高,全樣本研究已逐漸變?yōu)楝F(xiàn)實(shí),這不僅使代表性難題得到有效解決,還基于“全樣本”研究框架,獲得預(yù)期外更多的信息量及研究成果。只針對讀者借閱數(shù)據(jù),還能實(shí)現(xiàn)對館藏文獻(xiàn)流通的類型及借閱率等指標(biāo)的分析,但目前還停留于分析結(jié)構(gòu)化數(shù)據(jù)層次,分析報告難以向上級機(jī)構(gòu)對圖書館的價值創(chuàng)造活動進(jìn)行展示。研究成果獲得目標(biāo)群體的細(xì)分具有一定針對性,可使圖書館服務(wù)推廣活動的價值得到提升。盡管國內(nèi)圖書館還沒有此方面的要求或目標(biāo),但也都是未來必將面臨的一個重要的現(xiàn)實(shí)問題。所以,圖書館應(yīng)加強(qiáng)大數(shù)據(jù)思維的學(xué)習(xí)并內(nèi)化,不只是加強(qiáng)數(shù)據(jù)群,還應(yīng)加強(qiáng)與其他組織數(shù)據(jù)群進(jìn)行良好互動,對用戶信息行為改變后不斷變遷的信息需求加深理解,才能充分發(fā)揮大數(shù)據(jù)的應(yīng)用價值。
三、圖書館準(zhǔn)備“大數(shù)據(jù)”的相關(guān)工作
(一)相關(guān)數(shù)據(jù)的收集及存儲
圖書館目前主要應(yīng)開展用戶信息行為數(shù)據(jù)的收集和存儲,不僅將其向大數(shù)據(jù)不斷累積,準(zhǔn)備應(yīng)用于將來的有關(guān)應(yīng)用;而且借助目前的數(shù)據(jù)分析及研究方法,針對用戶信息行為數(shù)據(jù)加強(qiáng)對用戶需求變化的深入了解,以便于細(xì)分用戶群體,實(shí)現(xiàn)對整合圖書館信息資源及服務(wù)的有效指導(dǎo)。達(dá)到一定規(guī)模的公共圖書館,每天對用戶的服務(wù)次數(shù)類似于每天大型企業(yè)的客戶數(shù)量,都具有很多的用戶行為數(shù)據(jù),圖書館應(yīng)對此提高重視程度并進(jìn)行收集。如在校園網(wǎng)IP范圍內(nèi),高校圖書館用戶僅能對圖書館系統(tǒng)進(jìn)行直接登錄并應(yīng)用其電子資源,但在目前情況下,很多圖書館還沒有提高相關(guān)意識,有目的地記錄存儲用戶信息行為數(shù)據(jù)。用戶的這些數(shù)據(jù)具有半結(jié)構(gòu)化和非結(jié)構(gòu)化特點(diǎn),盡管不具有較大的價值密度,但若全面進(jìn)行收集對于開展用戶相關(guān)喜好的分析研究是具有重要作用的,還可協(xié)助圖書館提供信息服務(wù)的有效性及針對性。
(二)大數(shù)據(jù)思維的學(xué)習(xí)
大數(shù)據(jù)及大數(shù)據(jù)技術(shù)并不是大數(shù)據(jù)時代最重要的,而大數(shù)據(jù)思維確是最重要的。創(chuàng)新源泉是思維,大數(shù)據(jù)思維的學(xué)習(xí)并內(nèi)化對于圖書館適應(yīng)大數(shù)據(jù)時代發(fā)展十分關(guān)鍵。在社會中圖書館是信息資源的集散節(jié)點(diǎn),若用戶從圖書館難以得到所需服務(wù)就會轉(zhuǎn)向其他部門,用戶流失對于公益性機(jī)構(gòu)的存在基礎(chǔ)產(chǎn)生動搖。所以,圖書館應(yīng)積極組織開展大數(shù)據(jù)思維的學(xué)習(xí),深入掌握其他領(lǐng)域大數(shù)據(jù)的發(fā)展及應(yīng)用情況,不管是商業(yè)還是社會領(lǐng)域。在學(xué)習(xí)了解不夠深入前,圖書館管理人員容易產(chǎn)生理解大數(shù)據(jù)片面的問題,認(rèn)為大數(shù)據(jù)技術(shù)十分深奧,從而產(chǎn)生一定的距離。
綜上所述,大數(shù)據(jù)與日常行為具有十分緊密的關(guān)系,評估圖書館經(jīng)濟(jì)效益及信息服務(wù)離不開大數(shù)據(jù)思維的應(yīng)用。圖書館如有條件就可以實(shí)施“圖書館立方”項(xiàng)目,對用戶信息行為及其需求的不斷變化加深了解,并對評估自身經(jīng)濟(jì)價值進(jìn)行客觀量化,進(jìn)而使信息服務(wù)得到有效改善,圖書館也充分發(fā)揮其應(yīng)有的重要作用。
參考文獻(xiàn):
[1]韓翠峰.大數(shù)據(jù)時代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013,(8).
[2]楊繹.基于文獻(xiàn)計量的“大數(shù)據(jù)”研究[J].圖書館雜志,2014,(11).
[3]姜山,王剛.大數(shù)據(jù)對圖書館的啟示[J].圖書館工作與研究,2015,(9).
[4]張文彥.大數(shù)據(jù)時代的圖書館初探[J].圖書與情報,2013,(10).
[責(zé)任編輯:曲占峰]
收稿日期:2016-02-12
作者簡介:史微微(1975-),女,黑龍江哈爾濱人,圖書館工作人員。
中圖分類號:G250.7
文獻(xiàn)標(biāo)志碼:A
文章編號:1008-7966(2016)03-0159-02