陳 艷
據(jù)報道,美國政府利用大數(shù)據(jù)成功地預(yù)測出2012年總統(tǒng)選舉的結(jié)果。奧巴馬團隊通過分析數(shù)據(jù),投入小規(guī)模電視廣告,并確信會獲得部分潛在選民的關(guān)注,最終贏得了大選。2007年沃爾瑪通過對消費者的購物行為等非結(jié)構(gòu)化數(shù)據(jù)進行分析,創(chuàng)造了“啤酒與尿布”的經(jīng)典商業(yè)案例。國外的電子商務(wù)網(wǎng)站Amazon、eBay和CDNow等利用推薦系統(tǒng)主動向消費者推薦商品,讓商品直接找上門來,以此獲得與消費者保持密切聯(lián)系。在醫(yī)療領(lǐng)域,谷歌設(shè)計人員通過不同地區(qū)的人輸入關(guān)于流感的關(guān)鍵詞,設(shè)計了“谷歌流感趨勢”系統(tǒng),2013年1月13日美國通過“谷歌流感趨勢”發(fā)布了流感發(fā)生地區(qū)預(yù)警,波士頓在700例流感得到確認后,宣布進入公共健康緊急狀態(tài)。在教育領(lǐng)域,為科研工作人員科研數(shù)據(jù)保管帶來巨大影響力的數(shù)據(jù)監(jiān)護(Data Curation)崗位的設(shè)立,預(yù)示著大數(shù)據(jù)為科研工作者保管和利用前人的科研成果數(shù)據(jù)帶來了福音。在美國,已有圖書館使用大數(shù)據(jù)決策工具——大數(shù)據(jù)處理引擎,為用戶及所屬服務(wù)機構(gòu)提供數(shù)據(jù)分析與決策。通過數(shù)據(jù)分析可以直接而真實地展示用戶的性格、偏好、意愿等,幫助圖書館感知知識服務(wù)的市場、用戶的需求、未來的發(fā)展形勢等,以便圖書館對價值評估、服務(wù)能力和服務(wù)水平等做出更科學(xué)的決策[1]。
流程化管理是指以流程為主線的管理方法,是管理大師哈默提出的,要求重視顧客(服務(wù)的對象)和服務(wù)的整個過程,強調(diào)顧客(服務(wù)的對象)的重要地位是該管理思想精髓[2]。近年來,以用戶為中心、讀者至上的服務(wù)理念是眾多圖書館管理者堅守的信條,但因為技術(shù)等原因,實踐起來往往有一定的困難,吃力不討好的事情也時常發(fā)生。隨著大數(shù)據(jù)時代的來臨,數(shù)據(jù)處理能力不斷提高,服務(wù)對象的信息行為與需求之間的聯(lián)系將不再是霧里看花,而是可以直接關(guān)聯(lián)和預(yù)判的。
圖書館傳統(tǒng)的機構(gòu)設(shè)置分為:采訪編目部、流通閱覽部、信息技術(shù)部、參考咨詢部等部門。服務(wù)的起點是圖書采購,服務(wù)的終點是圖書被借閱或信息被使用,如圖1所示。
圖1 傳統(tǒng)的圖書館工作流程
近年來,盡管有學(xué)者意識到這一流程的弊端,并對此進行了改進和調(diào)整,有人提出將圖書采購到館后先流通一段時間,再進行精細加工等,但仍舊沒有撼動以采購為起點的圖書館工作流程。
隨著網(wǎng)絡(luò)化和智能化的發(fā)展,到館讀者的人數(shù)在下降,圖書借閱量呈下滑趨勢。有識之士為適應(yīng)社會各層次人員的信息服務(wù)的需要,加強閱讀推廣,在圖書館崗位設(shè)置上,提出了進一步的細分,如提出“管理策劃館員、數(shù)據(jù)編目館員、咨詢館員、系統(tǒng)管理及維護館員、學(xué)科采訪館員、網(wǎng)絡(luò)導(dǎo)航館員、閱覽推介館員、流通導(dǎo)讀館員、心理溝通館員”的崗位設(shè)置[3]。圖書館依托大數(shù)據(jù),建立起以讀者為起點,大數(shù)據(jù)分析決策為核心,讀者服務(wù)為終點的全新的圖書館業(yè)務(wù)流程。改進后的圖書館工作流程如圖2所示。
圖2 改進后的圖書館工作流程
大數(shù)據(jù)時代的來臨,讀者的信息行為是可以分析和預(yù)測的。圖書館將在數(shù)據(jù)存儲、數(shù)據(jù)挖掘、數(shù)據(jù)分析等方面面臨著巨大的挑戰(zhàn)與考驗,復(fù)雜數(shù)據(jù)的處理也將成為大數(shù)據(jù)時代圖書館發(fā)展的主旋律,通過大量的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)尋找隱藏在數(shù)據(jù)背后的世界,進而為圖書館的服務(wù)模式、未來發(fā)展趨勢提供分析與預(yù)測,將成為大數(shù)據(jù)時代圖書館的一大主要服務(wù)內(nèi)容[4]。圖書館在大數(shù)據(jù)環(huán)境下,工作流程將圍繞大數(shù)據(jù)的信息獲取、信息存儲、信息分析、分析決策系統(tǒng)展開,緊密圍繞讀者的需求,指導(dǎo)和開展圖書館的一系列服務(wù)工作。
圖書館通過業(yè)務(wù)流程再造,改變傳統(tǒng)的基于“文獻采購為起點,讀者借閱為終點”的圖書館工作流程,建立起以讀者為起點的,大數(shù)據(jù)分析決策為核心的,讀者服務(wù)為終點的圖書館工作流程,將大數(shù)據(jù)分析決策的結(jié)果應(yīng)用到圖書館全盤工作中去。
以大數(shù)據(jù)為核心的圖書館業(yè)務(wù)流程再造離不開“數(shù)據(jù)”。據(jù)IDC監(jiān)測顯示,全球數(shù)據(jù)量大約每兩年翻一番,2020年全球預(yù)計將擁有35ZB的數(shù)據(jù)量。圖書館大數(shù)據(jù)往大的說是全球范圍內(nèi)的所有可獲取的數(shù)據(jù),往小的說,主要是與圖書館領(lǐng)域相關(guān)的數(shù)據(jù)。這一部分數(shù)據(jù)主要有:通過圖書館聯(lián)盟獲得與同行交流的信息、圖書館內(nèi)的讀者及圖書等信息及圖書相關(guān)行業(yè)的信息。
網(wǎng)絡(luò)化和國際化促進了圖書館聯(lián)盟(Library Consortium),聯(lián)盟的目的是資源共享、協(xié)同合作。當前,我國已經(jīng)建立起眾多全國性的專業(yè)或綜合性的圖書館聯(lián)盟及地區(qū)性的圖書館聯(lián)盟。以CALIS為例,2008年底,文獻數(shù)據(jù)總量達180TB,2010年達到480TB,全國文化共享工程的數(shù)字資源總量達108TB[5]。圍繞這些文獻產(chǎn)生的聯(lián)合編目、館際互借、文獻傳遞、資源評價等數(shù)據(jù)非常巨大。圖書館聯(lián)盟在文獻信息的共享和服務(wù)的協(xié)同合作方面起到了非常重要的作用,并將成為大數(shù)據(jù)分析的重要來源。
圖書相關(guān)行業(yè)的信息存儲主要指電子商務(wù)網(wǎng)站、圖書出版機構(gòu)、論壇及其他有關(guān)的社交網(wǎng)絡(luò)媒體的數(shù)據(jù)存儲。這些數(shù)據(jù)主要是用戶在社區(qū)網(wǎng)絡(luò)中的足跡、點擊歷史、瀏覽歷史、信息反饋等信息。這類數(shù)據(jù)的特點是非結(jié)構(gòu)化的數(shù)據(jù)、數(shù)據(jù)量龐大及參與人員復(fù)雜多變等。
數(shù)字時代的來臨,圖書館信息存儲能力面臨前所未有的挑戰(zhàn)。以往的圖書館信息存儲主要指數(shù)字資源的長期保存,實現(xiàn)讀者對數(shù)字資源的訪問和下載?;诖髷?shù)據(jù)的信息處理系統(tǒng),不僅要求圖書館自身館藏數(shù)據(jù)的存儲,還要求對讀者信息、圖書借閱、資源下載和評價、社交網(wǎng)絡(luò)數(shù)據(jù)等信息存儲。圖書館自身的館藏資源逐年增長,以一個小型高校館為例,在校生一萬人以內(nèi),圖書館產(chǎn)生的借閱數(shù)據(jù)、電子數(shù)據(jù)訪問、下載、評價等數(shù)據(jù)每天有上萬條。目前,這些數(shù)據(jù)的獲取來源除了通過RFID射頻數(shù)據(jù)、傳感器數(shù)據(jù)獲取外,社交網(wǎng)絡(luò)交互數(shù)據(jù)及移動互聯(lián)網(wǎng)數(shù)據(jù)也是數(shù)據(jù)的重要來源。社交網(wǎng)絡(luò)交互數(shù)據(jù)與移動互聯(lián)網(wǎng)數(shù)據(jù)往往是非結(jié)構(gòu)化數(shù)據(jù)為主,也是近年來增長速度最快的數(shù)據(jù)源。這一部分數(shù)據(jù)呈現(xiàn)出種類繁多、流量巨大、容量劇增、隱藏價值大等大數(shù)據(jù)的核心特點。
云存儲技術(shù)是解決大數(shù)據(jù)存儲的重要手段。云存儲是在云計算概念上延伸和發(fā)展出來的一個新的概念,是指通過集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能的一個系統(tǒng)。除此外,單靠一個圖書館的能力無法完成如此巨大的數(shù)據(jù)存儲,應(yīng)當適時發(fā)揮圖書館聯(lián)盟機構(gòu)的作用,實現(xiàn)聯(lián)盟機構(gòu)之間數(shù)據(jù)共享。
信息分析就是根據(jù)特定問題的需要,對大量相關(guān)信息進行深層次的思維加工和分析研究的過程,最終形成有助于問題解決的新信息。通過以用戶的特定需求為依托,以定性和定量研究方法為手段,對整理后的信息進行深層次加工,形成新的、增值的信息產(chǎn)品,最終為科學(xué)決策服務(wù)的智能活動。信息分析的好壞直接決定信息能否產(chǎn)生促進生產(chǎn)力發(fā)展、有效解決問題等系列應(yīng)用價值。
目前,新技術(shù)、新思想不斷對現(xiàn)有系統(tǒng)產(chǎn)生影響,并促成現(xiàn)有系統(tǒng)不斷發(fā)展,精準營銷生態(tài)系統(tǒng)進入新的階段[6]。圖書館相關(guān)的大數(shù)據(jù)分析技術(shù)以hadoop為代表,個性化推薦系統(tǒng)的出現(xiàn)為讀者提供了一個解決Web信息過載問題的強大工具,承擔了在識別讀者閱讀傾向和偏好的基礎(chǔ)上,模擬圖書館工作人員向讀者推介圖書信息和建議,幫助讀者獲取信息服務(wù),從而使讀者避免信息“超載”所帶來的麻煩,順利完成文獻信息資源獲取的過程[7]。目前,圖書館大數(shù)據(jù)分析技術(shù)還處于發(fā)展和探究階段。大數(shù)據(jù)帶來的問題,不僅是數(shù)據(jù)的存儲和獲取的困難,更多的是大數(shù)據(jù)的分析過程及指導(dǎo)管理者決策的價值體現(xiàn)問題。
圖書館建立在大量數(shù)據(jù)基礎(chǔ)之上的,通過云存儲和聯(lián)盟機構(gòu)信息共享等實現(xiàn)數(shù)據(jù)的存儲,使用大數(shù)據(jù)分析技術(shù),最終為決策者提供所需的數(shù)據(jù)、信息和背景資料,幫助明確決策目標和進行問題的識別,建立或修改決策模型,提供各種備選方案,并且對各種方案進行評價和優(yōu)選,通過人機交互功能進行分析、比較和判斷,為決策提供必要的支持。
3.4.1 管理策劃
圖書館管理者的決策依托大數(shù)據(jù),通過決策支持系統(tǒng)制定圖書館宏觀的建設(shè)目標和工作方向,為實現(xiàn)戰(zhàn)略決策而對圖書館內(nèi)部管理進行有效的組織和協(xié)調(diào)。
決策支持系統(tǒng)強調(diào)的是對管理決策的支持,而不是決策的自動化,它所支持的決策可以是任何管理層次上的,如戰(zhàn)略級、戰(zhàn)術(shù)級或執(zhí)行級的決策。圖書館管理者的決策依托大數(shù)據(jù),通過決策支持系統(tǒng)指導(dǎo)圖書館采購、宣傳、服務(wù)、管理、咨詢等各個環(huán)節(jié)。
3.4.2 參考咨詢
大數(shù)據(jù)時代來臨,圖書館參考咨詢工作既是機遇也是挑戰(zhàn)。圖書館學(xué)科館員依賴其在科學(xué)數(shù)據(jù)的信息搜集和管理的優(yōu)勢,將有助于提高學(xué)科館員在科研團隊中的重要地位。在國外,圖書館設(shè)置了數(shù)據(jù)監(jiān)護(Data Curation)等相關(guān)的數(shù)據(jù)分析崗位[8]。麻省理工學(xué)院的一個研究項目表明,圖書館員在數(shù)據(jù)分析這一項工作中主要承擔數(shù)據(jù)保存標準的制定、進行數(shù)據(jù)搜集、分析數(shù)據(jù)、數(shù)據(jù)管理規(guī)劃、經(jīng)驗分享、數(shù)據(jù)服務(wù)等[9]。圖書館學(xué)研究者也嵌入到許多的研究項目當中,包括為促進標準化運動而開展的“語義網(wǎng)社區(qū)與關(guān)聯(lián)開放數(shù)據(jù)運動”(Sematic Web community and Linked Open Datainitiative)等[10];部分機構(gòu)如美國維吉尼亞州立大學(xué)開始組建科學(xué)數(shù)據(jù)咨詢小組,而圖書館員和數(shù)據(jù)管理者則為學(xué)者們充當了咨詢顧問的角色[9]。
在大數(shù)據(jù)環(huán)境下,通過機構(gòu)數(shù)據(jù)庫的建立和共享等,圖書館可以監(jiān)測科研數(shù)據(jù),擔任起科研人員的情報站,建立科研數(shù)據(jù)庫,預(yù)測科研發(fā)展的方向,提早做好文獻準備工作,整理好專題報告,方便科研人員查找和閱覽相關(guān)文獻和數(shù)據(jù)。
3.4.3 資源建設(shè)
通過對大量讀者信息的分析和處理,及時動態(tài)地監(jiān)督采購圖書的特點與讀者契合度,有助于圖書館進一步完備圖書館采購需求,規(guī)范圖書館采購制度。目前的圖書館紙質(zhì)圖書采購主要分書單采購和現(xiàn)場采購。書單采購只能看到圖書書名和出版社等信息,現(xiàn)場采購除了翻看圖書外,主要是查重處理。采訪人員在圖書采購的時候,往往偏主觀而不夠科學(xué)嚴謹。而在大數(shù)據(jù)環(huán)境下,圖書信息的發(fā)布和點評是非常及時快捷的。采訪人員可以通過大數(shù)據(jù)決策支持系統(tǒng),按照條件匹配,系統(tǒng)自動輸出推薦圖書;采訪人員通過該系統(tǒng),可以查閱某書或某作者受歡迎程度,預(yù)測資源的受眾讀者,正確規(guī)劃資金分配制度。
3.4.4 采購評估
數(shù)字資源采購已經(jīng)占居圖書館資源采購的半壁江山,與紙質(zhì)資源分庭抗禮。數(shù)字資源具有不占用圖書館建筑面積、提供24小時服務(wù)、允許多次下載且可以同時閱讀等特點。然而目前數(shù)字資源缺乏完善的效益評估機制,隨著數(shù)據(jù)庫商逐年漲價,經(jīng)費有限的圖書館將騎虎難下。依托大數(shù)據(jù)分析,這一問題將迎刃而解。通過數(shù)據(jù)分析,圖書館可以掌握讀者信息行為動態(tài),了解資源的受歡迎程度及讀者需求,并根據(jù)經(jīng)費和使用等情況,選擇購買全部、或分庫購買、或放棄購買、或聯(lián)合采購等方式。
3.4.5 閱讀推廣
近年來,圖書館閱讀人數(shù)呈現(xiàn)下降趨勢。圖書館在宣傳推介方面,苦于沒有相應(yīng)的數(shù)據(jù)作支撐。在已開展的圖書宣傳和推介的圖書館里,我們發(fā)現(xiàn)閱讀推廣僅限于書目推介、圖書展覽、讀書沙龍等內(nèi)容,且這些工作的開展取得的效益無法評估。圖書館通過管理系統(tǒng)、社交網(wǎng)絡(luò)等掌握了一大批讀者的信息,包括讀者的年齡、性別、學(xué)科、年級等重要信息,通過數(shù)據(jù)分析,我們可以發(fā)現(xiàn)在特殊的時期讀者的特定需求。以高校為例,大一的新生比較迷茫,部分同學(xué)往往喜歡看勵志類的圖書;大二的學(xué)生專業(yè)課程壓力較大,對所學(xué)專業(yè)有一定的認識,在專業(yè)知識獲取方面更加渴望,專業(yè)圖書比較受歡迎;大三的同學(xué)面臨出國或考研,對托??荚?、四六級考試等英語書籍方面有較多的關(guān)注度;大四的同學(xué)面臨畢業(yè),對面試、擇業(yè)和管理類的圖書較關(guān)注等等。在大數(shù)據(jù)環(huán)境下,圖書館可以通過本館或其他館的同類型的讀者對該類圖書的借閱量、讀者評價、社交網(wǎng)絡(luò)工具的信息進行判斷,發(fā)現(xiàn)熱門圖書、暢銷作家、熱點研究,進行集中的有針對性的推介。
3.4.6 讀者教育
圖書館作為信息服務(wù)和信息教育的重要部門,承擔著讀者教育的重要職能。圖書館應(yīng)根據(jù)不同社會群體在年齡、知識層次、學(xué)科種類、從事職業(yè)等的不同,有針對性地提供培養(yǎng)讀者信息處理能力有關(guān)的培訓(xùn)服務(wù)。目前這一類工作的開展,在目標群體的選擇上過于籠統(tǒng),在培訓(xùn)內(nèi)容上個性化不足,工作人員的培訓(xùn)工作過于被動。圖書館在大數(shù)據(jù)決策支持系統(tǒng)的指導(dǎo)下,可以開展多樣化、靈活化的讀者教育工作。無論線上或線下、電子或紙質(zhì)、授課或活動等多渠道地滿足不同讀者、不同時段的培訓(xùn)需求。
3.4.7 輿論監(jiān)督
以讀者需求為指導(dǎo)的圖書館工作流程,更強調(diào)讀者滿意度。通過及時有效的處理客戶投訴,主動聯(lián)系有需要的讀者,最終建立起圖書館與讀者之間的良好關(guān)系渠道。通過大數(shù)據(jù)分析,發(fā)現(xiàn)讀者投訴密集的服務(wù)項目,及時改進服務(wù)策略,提高讀者滿意度。由于了解讀者信息及時,通過有針對性的向目標群體發(fā)布信息,圖書館可以提高與讀者的粘合度,增強在讀者心中的美譽度。
大數(shù)據(jù)時代的來臨,圖書館數(shù)據(jù)異常豐富和復(fù)雜,如何應(yīng)對這一變化,需要我們對數(shù)據(jù)分析引起足夠的重視。在大數(shù)據(jù)環(huán)境下,圖書館需改變傳統(tǒng)的工作流程,建立基于大數(shù)據(jù)的嶄新的工作流程、服務(wù)的模式和組織管理流程。
[1]郭自寬,張興旺,麥范金.大數(shù)據(jù)生態(tài)系統(tǒng)在圖書館中的應(yīng)用[J].圖書資料工作,2013(2):23-28.
[2]百度百科.流程化管理[EB/OL].[2013-12-25].http://baike.baidu.com/link?url=HuWY8o3EpyNvM5-XQ29 ZQY-gfVxeE790lF2cprD9jOBvQQ2MFumNgWjk3xLq cSddMc-vC1_S3UClnIH0x9PvW2tuUginuJRa52SZ71k bwKsDupBtBK7K9OL8_hy355Ga.
[3]佚名.淺談完善圖書館館員制度 促進和諧圖書館的發(fā)展[EB/OL].[2013-12-25].http://www.xswkj.com/lear ninginfo-22-580.html.
[4]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012(5):37-40.
[5]楊海燕.大數(shù)據(jù)時代的圖書館服務(wù)淺析[J].圖書與情報,2012(4):120-122.
[6]傅強.應(yīng)用大數(shù)據(jù)能力:當當網(wǎng)在個性化推薦&精準營銷方面的探索 [EB/OL].[2013-12-19].http://wot.51cto.com/2012/ppt/day2_01/fuqiang.pdf.
[7]阿里巴巴創(chuàng)業(yè).基于協(xié)同過濾算法 打造精準的營銷平臺[EB/OL].[2013-12-19].http://info.1688.com/detail/1090699951.html.
[8]張文彥,武瑞原,于潔.大數(shù)據(jù)時代的圖書館初探[J].圖書與情報,2012(6):15-21.
[9]Heidorn P.The Emerging Role of Libraries in Curation and E-science[J].Journal of Library Administra-tion,2011(7-8):662-672.
[10]Cassidy R S,Ding Y,Thewall M.Library and Information Science in the Big Data Era:Funding,Projects,and Future[a panel proposal][EB/OL].[2013-12-25].http://www.ischool.drexel.edu/faculty/mkhoo/docs/12_asist_panel_description.pdf.