汪丹
摘 要 大數(shù)據(jù)的研究和探討方興未艾,各個領域都探討各自的大數(shù)據(jù)及其應用。在書目數(shù)據(jù)庫方面,OCLC的WorldCat書目數(shù)據(jù)庫包含2萬多家圖書館的書目數(shù)據(jù),是書目領域的大數(shù)據(jù)。無論是體量、速度、還是質(zhì)量上,研究者經(jīng)由大數(shù)據(jù)的統(tǒng)計或者網(wǎng)絡關系等方式呈現(xiàn)事件發(fā)展態(tài)勢,說明和輔助決策。而這一觀點和應用正在通過大數(shù)據(jù)更深層次的利用,從業(yè)務流程化和合作共建共享的角度重新審視大數(shù)據(jù)應用,并以此深刻的影響到我們的工作方式和思維方式。
關鍵詞 OCLC 大數(shù)據(jù) 電子資源管理
分類號 G250.7
DOI 10.16810/j.cnki.1672-514X.2018.08.002
0 引言
隨著信息技術的迅猛發(fā)展,大數(shù)據(jù)正日益對社會的各個方面產(chǎn)生重要影響,中央的一系列講話和文件[1-2]中也充分體現(xiàn)了大數(shù)據(jù)對于新時代的重要性。作為國家的發(fā)展戰(zhàn)略之一,各領域都在推動大數(shù)據(jù)的相關應用,如互聯(lián)網(wǎng)行業(yè)的網(wǎng)絡社交與購物[3]、電信行業(yè)基于位置數(shù)據(jù)和消費數(shù)據(jù)的實時營銷信息推送[4]、金融行業(yè)的投資、信貸、支付、保險[5]及制造業(yè)的企業(yè)流程優(yōu)化等等。當前,對大數(shù)據(jù)的定義有很多,一般認為,大數(shù)據(jù)(Big data) 是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)[6]。維克托·邁爾·舍恩伯格和肯尼斯·克耶在其編寫的《大數(shù)據(jù)時代》[7]中提出:“大數(shù)據(jù)”具有4V特點,即Volume(數(shù)據(jù)量大)、Velocity(輸入和處理速度快)、Variety(數(shù)據(jù)多樣性)、Value(價值密度低),大數(shù)據(jù)的這四個特點得到了學者們的普遍認可。IBM商業(yè)價值研究院在白皮書《分析:大數(shù)據(jù)在現(xiàn)實世界中的應用》[8]中提出大數(shù)據(jù)需要考慮的一個重要維度:Veracity(精確性),凸顯了應對與管理某些類型數(shù)據(jù)中固有的不確定性的重要性。因此,通常情況下大數(shù)據(jù)具有以上五個(5V) 特性。
1 大數(shù)據(jù)對圖書館的意義
就圖書館而言,其數(shù)據(jù)盡管量大,但是單純從數(shù)量級上,還是無法與其他行業(yè)相比較。例如,騰訊數(shù)據(jù)中心的存儲量據(jù)其報道[9],已經(jīng)超過1000個PB,相當于15 000個世界上最大的圖書館(美國國會圖書館) 的存儲量。據(jù)國際數(shù)據(jù)公司IDC研究報告《Extractin Value from Chaos》[10],2010年,人類生產(chǎn)的數(shù)據(jù)量是1.4ZB(引注:1 ZB=1024 PB),2011年增長到1.8 ZB, 到2012年達到2.9 ZB。如果數(shù)據(jù)按照目前的60%速度增長,這就意味著全球數(shù)據(jù)量大約每兩年翻一番;預計到2020年,全球?qū)碛?5 ZB的數(shù)據(jù),數(shù)據(jù)增長近30倍。盡管數(shù)量級別上有所差異,但從圖書館研究方向來看,在國內(nèi)圖書館的研究、管理和分析活動中,大數(shù)據(jù)已然成為繼Web2.0、數(shù)字圖書館和云計算之后的熱門詞匯和研究應用方向。
圖書館的大數(shù)據(jù)主要源于圖書館業(yè)務活動,圖書館業(yè)務活動可以簡單歸納為資源建設和資源利用。具體而言,圖書館的業(yè)務涉及采訪、網(wǎng)絡建設、紙本資源服務、數(shù)字化資源服務、參考咨詢服務等。
目前,圖書館在數(shù)據(jù)應用研究中,主要通過對借閱數(shù)據(jù)使用統(tǒng)計數(shù)據(jù)分析方法[11]或社會網(wǎng)絡分析方法[12]來獲知用戶借書行為,了解借閱需求,分析讀者平均借閱情況,亦或從中挖掘新的知識結構探討個性化借閱推薦系統(tǒng);通過Web日志方式[13]獲知數(shù)據(jù)庫的用戶瀏覽情況和統(tǒng)計數(shù)字,分析獲知網(wǎng)絡用戶關注重點,實現(xiàn)數(shù)據(jù)庫的定量評價;通過數(shù)據(jù)庫商同意使用SUSHI協(xié)議,定期自動收割符合COUNTER標準的用戶使用數(shù)據(jù),高效地采集和分析數(shù)據(jù)庫商提供的使用數(shù)據(jù)。上述用戶使用數(shù)據(jù)的研究和分析已經(jīng)較為成熟,且初見成效,已經(jīng)成為圖書館的一項重要工作。
書目數(shù)據(jù)是圖書館通過編目工作將一次文獻進行整理后形成以目錄、索引、文摘為代表的二次文獻,是圖書館利用專業(yè)知識提供給用戶的一個重要知識產(chǎn)品,對于用戶查找和定位所需資源,起到重要的指引作用。由于書目數(shù)據(jù)采用統(tǒng)一標準的著錄格式,對館藏文獻進行整理、編目可以形成較為穩(wěn)定的結構化數(shù)據(jù),便于通過常用的SQL工具進行分析[14]。對于書目數(shù)據(jù)的數(shù)字化分析,可以反映出圖書館館藏的級別、館藏分布、服務對象和服務傾向。
除了上述穩(wěn)定的結構化數(shù)據(jù),圖書館還有非結構化數(shù)據(jù),如采訪、編目、數(shù)字化資源建設等業(yè)務產(chǎn)生的工作狀態(tài)數(shù)據(jù)、業(yè)務交流產(chǎn)生的數(shù)據(jù)、圖書館與讀者及資源供應方的互動信息和用戶的信息行為、用戶利用手持設備來獲取圖書館服務的行為等,從目前來看,非結構化數(shù)據(jù)比結構化數(shù)據(jù)增長的更快。圖書館各類非結構化數(shù)據(jù)的急速增量和對數(shù)據(jù)管理和掌控能力之間的矛盾日益明顯,圖書館已經(jīng)不再是館藏資源數(shù)量的單純比較和空間環(huán)境的改造,而是各類信息管理、數(shù)據(jù)完善和數(shù)據(jù)綜合處理能力是否能有效通過大數(shù)據(jù)技術解決和提高圖書館服務能力的問題。為了應對這一難題,圖書館學情報學希望借由云系統(tǒng)的存儲,來解決管理和技術上出現(xiàn)的問題。如果能夠?qū)D書館采購圖書資料數(shù)據(jù)到數(shù)據(jù)利用,再到用戶產(chǎn)生的數(shù)據(jù)反饋收集起來,利用云端系統(tǒng)進行增容,同時對各項數(shù)據(jù)進行分析和挖掘,則會為圖書館業(yè)務發(fā)展和服務質(zhì)量帶來質(zhì)的改變。
2 OCLC的WorldCat大數(shù)據(jù)
2.1 WorldCat具有數(shù)據(jù)量大且種類繁多的特點
WorldCat包含三個主要的組成元素:書目數(shù)據(jù)庫
(Bibliographic catalog)、知識庫(Knowledge base)、注冊信息(Registry for library information)。
從書目數(shù)據(jù)庫來看,WorldCat(OCLC聯(lián)機聯(lián)合
目錄)是一個獨一無二的數(shù)據(jù)庫,是唯一一個全球圖書館聯(lián)合目錄,是全世界最大的網(wǎng)絡數(shù)字圖書館,包含了OCLC的2萬多所會員圖書館的館藏信息。截至2018年5月,WorldCat數(shù)據(jù)庫有4.2億多條獨一無二的書目記錄、26.5多億條館藏記錄,其主題廣泛,覆蓋了自公元前4,800年至今的資料,基本上反映了世界范圍內(nèi)的圖書館所擁有的文獻資源,主要類型有圖書、期刊與雜志、報紙、地圖、樂譜、手稿本和網(wǎng)絡資源等。
從知識庫角度來看,OCLC與內(nèi)容合作商合作通過WorldCat知識庫將圖書館用戶鏈接到他們所在圖書館提供的電子內(nèi)容,使得內(nèi)容更容易查找、共享、管理和使用。OCLC是一個非盈利的合作組織,能廣泛地與內(nèi)容合作伙伴進行記錄合作。截至2018年5月,知識庫提供來自6758個內(nèi)容合作伙伴的40 380 013條記錄,涉及20 396個內(nèi)容集(Collections)。隨著越來越多的內(nèi)容提供商加入,WorldCat知識庫將成為另一個獨特的大數(shù)據(jù)。
2.2 WorldCat具有速度快的特點
OCLC產(chǎn)品和服務有8萬多家使用館,其中有2萬多家館是會員館。這些會員館在OCLC的WorldCat上展示各自的館藏資源,進行編目活動或者館際互借服務,讓WorldCat成為一個每秒更新的大數(shù)據(jù)集。在線編目活動大概每秒有一條新的書目記錄輸入到WorldCat數(shù)據(jù)庫;每3秒就會有一家成員館填寫完一項國際館際互借申請單(如圖1所示)。
圖1 WorldCat統(tǒng)計數(shù)字
OCLC作為DDC的提供方,不僅擁有大數(shù)據(jù),同樣也需要大數(shù)據(jù)。從2018年初開始,DDC23紙質(zhì)版已經(jīng)停止發(fā)行。目前采用DDC網(wǎng)絡版,由WebDewey提供檢索服務。相比于4年更新一版的紙本,網(wǎng)絡版在完整度和更新速度上更貼近用戶的需求。同時,網(wǎng)絡版的WebDewey更需要大數(shù)據(jù)為基礎的歸納統(tǒng)計和描述性統(tǒng)計,用以支持DDC分類中需要的描述、作品分類、推論、趨勢話題、學科結構等。
2.3 WorldCat具有高質(zhì)量的數(shù)據(jù)
高質(zhì)量的數(shù)據(jù)源自OCLC對于數(shù)據(jù)質(zhì)量的嚴格控制。高質(zhì)量的書目和數(shù)據(jù)是圖書館資源發(fā)現(xiàn)和共享的基礎,因此,無論是批處理數(shù)據(jù)、新增原編數(shù)據(jù)、合并重復數(shù)據(jù)或者是修正錯誤數(shù)據(jù),OCLC都由專家來過濾檢測。全球圖書館上傳的數(shù)據(jù)并入WorldCat前,首先要進行數(shù)據(jù)清理,而后與WorldCat主數(shù)據(jù)進行比對合并。經(jīng)過OCLC處理后,通常數(shù)據(jù)質(zhì)量會更高、更標準。OCLC的WorldCat質(zhì)量控制組的多數(shù)專家具有MLS學位(Master of Library and Information Science,圖書館和信息科學碩士學位)。質(zhì)量控制組就通過人工手動,系統(tǒng)自動或者數(shù)據(jù)監(jiān)測系統(tǒng)等方法增強了105 215 955條記錄。
2.4 WorldCat具有新的數(shù)據(jù)處理與管理模式
2010年3月25日,OCLC發(fā)布了研究報告《研究圖書館,風險和系統(tǒng)變革》(Research Libraries, Risks and Systemic Change)[15],對研究型圖書館當前面臨的風險進行了總結。研究表明,30%的風險與圖書館自身價值的定位有關。圖書館快速地跟上技術的變化和用戶的需求,改變傳統(tǒng)業(yè)務運作方式,將會有助于圖書館自身的定位和快速發(fā)展。早在2009年,OCLC宣布在WorldCat基礎上,應用云計算技術開發(fā)數(shù)字圖書館。2010年,OCLC以WorldCat為核心,推出基于云計算技術的網(wǎng)絡級管理服務WMS(WorldShare Management Service),推出六大核心模塊:元數(shù)據(jù)管理(Metadata)、采購管理(Acquisitions)、許可證管理(Liceses)、流通管理(Circulation)、館際互借(InterLibrary Loan)、數(shù)據(jù)分析(Analytics)。這六大模塊重構并統(tǒng)一了圖書館管理的各個工作流程,將其串聯(lián)起來成為一個完整的圖書館系統(tǒng)解決方案,集成在一個開放的云平臺上,幫助圖書館實現(xiàn)各種資源的集中式管理。
可以預見,當許多圖書館使用WorldCat管理服務以及電子資源管理服務后,其所產(chǎn)生的越來愈多的業(yè)務流數(shù)據(jù),在通過數(shù)據(jù)聚合、數(shù)據(jù)挖掘技術處理后就可以作為對圖書館業(yè)務發(fā)展分析參考的依據(jù),那么WorldCat不僅能從體量上,速度上跟蹤圖書館的藏書質(zhì)量,還會從實際使用角度成為圖書館使用大數(shù)據(jù)的好幫手。
3 電子資源管理服務
2002年10月,美國數(shù)字圖書館聯(lián)盟(Digital Library Federation, DLF)和國家信息標準化組織(National Information Standards Organization, NISO)聯(lián)合工作組推出電子資源管理項目(Electronic Resources Management Initiative, ERMI)[16]。2013年,OCLC發(fā)布研究白皮書[17]《Meeting the E-resources Challenge》(電子資源管理的挑戰(zhàn)),指出到2020年,80%的圖書館預算將用在電子資源上,而同時94%的圖書館依然用表格進行電子資源管理。OCLC的角色就是發(fā)展服務以支持電子資源管理,并代表成員發(fā)起合作。
隨著圖書館的館藏中電子資源日益增多,用戶的訪問和使用習慣也在變化。但是,圖書館管理系統(tǒng)并非一開始就以電子資源為管理目標,最初的圖書館管理系統(tǒng)是以紙本圖書和借閱做為管理目標,隨著技術和數(shù)字內(nèi)容的增加,在原有系統(tǒng)中增添了很多功能,但支持物理館藏工作流程的圖書館管理系統(tǒng)并沒有從電子資源的角度重新設計。對此,圖書館系統(tǒng)提供商開發(fā)了一種新的集成化產(chǎn)品,圖書館界稱之為“下一代圖書館系統(tǒng)”[18]“圖書館云服務平臺”[19],在云端平臺上構建的新服務實現(xiàn)了紙本資源管理和電子資源管理的功能。知名的“下一代圖書館系統(tǒng)”包括OCLC研發(fā)的WorldShare Management Services,Innovative公司研發(fā)的Sierra、Ex Libris公司研發(fā)的Alma、ProQuest公司研發(fā)的Intota,以及開源計劃Kuali OLE。國內(nèi)圖書館也在利用開源的OLE嘗試開發(fā)電子資源管理系統(tǒng)。
如果說OCLC的WMS是將紙本文獻和數(shù)字館藏統(tǒng)一管理,那么OCLC的E-services則是專門對數(shù)字館藏,或者說電子資源進行統(tǒng)一管理,它具有WMS的大部分功能。在電子資源比重越來越大的今天,電子資源管理應該被視為圖書館的核心功能。電子資源管理必須流線型化,并以工作流為中心,增強互操作性,以消除增添模塊的成本支出,及避免與其他工作流之間的混亂。
3.1 電子資源管理的功能模塊
OCLC E-services由一系列可互操作的功能模塊組成,包括WorldShare License Manager、WorldShare Metadata Services、 WorldShare Acquisitions、WorldCat Discovery Services,并配合Ezproxy遠程代理訪問軟件,WorldCat.org,既可單獨使用,也可以聯(lián)合使用。每個功能模塊有其自身的工作過程,模塊之間因為一些數(shù)據(jù)關系相互關聯(lián),共享數(shù)據(jù),完成數(shù)據(jù)的同步和管理。電子資源管理的核心是知識庫,如上文所述,WorldCat知識庫可將圖書館用戶鏈接到他們所在圖書館提供的電子內(nèi)容,使得更容易查找、共享、管理和使用。
3.2 電子資源管理工作流
OCLC的E-services最大的特點是工作流程與電子
資源生命周期相一致,即從查找電子資源(Select)、采購(Acquire)、詮釋(Describe)、發(fā)現(xiàn)(Discovery)、獲取和訪問(Access)到續(xù)訂(Renew)這一電子資源采購管理流程。
圖書館假如要購買一本電子書,并添加其到自己的館藏中,那么傳統(tǒng)方法是什么呢?第一步,采購人員要到電子書商的網(wǎng)站上查看是否有此書的元數(shù)據(jù)可以提供,要知道如若采購,用戶是否可以快速獲取這個電子資源,以及用什么方式給用戶提供與內(nèi)容相關的電子書,花費多少?當前,需求驅(qū)動采購已經(jīng)成為一種流行的服務方式。WorldCat知識庫就支持這種DDA模式,不用過多考慮采購哪些相關的資料,只需要選擇一個DDA的集合,就可以有包含同樣主題的一系列題名列表供用戶選擇。在E-services中,只要決定采購一項數(shù)字資源,所產(chǎn)生的數(shù)據(jù)將會被其他功能模塊共用,更快地讓用戶獲取使用,而無需從電子商網(wǎng)站下載Marc數(shù)據(jù),無需手工編目。OCLC與出版商密切合作,將他們的資源級Marc數(shù)據(jù)導入WorldCat知識庫,系統(tǒng)會自動推送給圖書館高質(zhì)量的電子書商元數(shù)據(jù)。
在采購電子資源時,圖書館的紙本資源采購設計的管理系統(tǒng)模組與電子資源的訂單管理系統(tǒng)可能不統(tǒng)一,但是,圖書館又存在保持財務采購預算更新的需求,因而圖書館員需要隨時核對和更新幾個系統(tǒng)的資料和數(shù)據(jù)。如果電子資源是連續(xù)出版物,那么續(xù)訂管理將變得更為復雜。而在E-services服務中,依托WorldShare Acquisitions功能模塊,可以支持紙本和電子資源的采購,全球的大型供應商數(shù)據(jù)在此集中展示,圖書館可以定位供應商,或者選擇與某一館使用相同的供應商,通過合作管理供應商數(shù)據(jù)。圖書館員從此無需從供應商那里一一詢問并在Excel中填入相關的地址信息,聯(lián)絡人信息等。WorldShare License Manager模塊為采購流程貢獻了許可管理的功能,里面可以存放用于多個供應商的服務條款,圖書館可以集中存儲所有與之相關的授權文件。一旦訂單發(fā)出,或者使用DDA模式時,圖書館的館藏信息將會標注在知識庫中,館員無需在各個不同系統(tǒng)中跳轉(zhuǎn)填寫資料,館藏信息會自動更新,如元數(shù)據(jù)發(fā)送啟動和預算扣除等自動處理,這種流線化的工作方式將節(jié)省更多的時間。
在詮釋電子資源時,圖書館會發(fā)現(xiàn),電子資源訂單的發(fā)出并不意味終端用戶可以立刻使用這本電子書,圖書館員需要手動編目電子書的標題,或者從電子書商的網(wǎng)站上下載元數(shù)據(jù)。同時,Linking data和電子書的書目數(shù)據(jù)存放在不同的系統(tǒng)中,圖書館員需要將Linking data放到Linkresolver,實現(xiàn)全文解析。為了保持題名和館藏可用,圖書館員需要更新自己的表格,而授權信息(例如條款和簽字合同)也是在電腦中單獨存放的。如果使用E-services,圖書館員無需花費大量時間更新館藏,利用知識庫,所有的館藏信息將會自動更新。由于每個月都有新的數(shù)據(jù)庫元數(shù)據(jù)加入OCLC知識庫,具有多個來源和記錄的OCLC中央索引庫保持不間斷的更新。在云端環(huán)境下,每個加入其中的圖書館都享受著來自云端數(shù)據(jù)更新的紅利。圖書館員在電子資源數(shù)據(jù)的更新維護上可以實現(xiàn)一定程度的“袖手旁觀”。
在發(fā)現(xiàn)電子資源部分,圖書館員希望電子書元數(shù)據(jù)能夠快速的導入,這樣就可以通知員工和用戶有新的電子書可以使用,而無需在傳統(tǒng)編目系統(tǒng)中編寫題名并輸入發(fā)現(xiàn)系統(tǒng)的環(huán)境中。E-services服務包含發(fā)現(xiàn)系統(tǒng)(WorldShare Discovery Services),圖書館可以由此一站式發(fā)現(xiàn)圖書館的紙本資源(如果有上傳館藏)、其他2萬所圖書館的書目數(shù)據(jù)、以及圖書館本身的電子資源。發(fā)現(xiàn)系統(tǒng)可以與圖書館現(xiàn)有的傳輸解決方案相整合。目前可以發(fā)現(xiàn)的資源條數(shù)是18億條。OCLC與其他知名搜索門戶網(wǎng)站合作,例如Google等,使用鏈接數(shù)據(jù)的方式,將圖書館的館藏與用戶開始檢索的地方相關聯(lián),指引用戶回到圖書館。例如,當用戶在維基百科中檢索一本圖書或期刊,那么將會發(fā)現(xiàn)下面有WorldCat的鏈接,而后通過WorldCat把用戶引向圖書館。
在獲取和訪問部分,當學生或者研究者在校園網(wǎng)外訪問圖書館電子書時,對于代理文件的設置尤為重要。如果內(nèi)容提供商電子資源網(wǎng)址URL有變化但沒有及時通知圖書館,那么全文鏈接失效,就會導致圖書館員要花費很多的時間找出鏈接失效原因——是網(wǎng)絡原因,發(fā)現(xiàn)系統(tǒng)問題,鏈接解析器問題,還是遠程代理服務軟件問題?這種情況會讓圖書館員產(chǎn)生焦慮,學生和使用者的滿意度也會受到影響。在E-services中,依托云端的優(yōu)勢,一旦一條全文鏈接被某人發(fā)現(xiàn)失效,則這個鏈接將會被修復,所有使用者均將獲益。與獲取相關的授權問題,也會經(jīng)由WorldShare License Manager將所有訪問信息集中存儲,可以更容易地管理來自同一接口或界面的全文權限、全文訪問和解析。Ezproxy遠程代理訪問是可選項,允許IP范圍外的資源訪問。由于此項為hosting功能,因此缺少IT技術能力的圖書館也可以放心使用,無需花費資源在設定軟件、數(shù)據(jù)庫和更新上。為了便于Ezproxy設定,也可以選擇使用License Manager針對已經(jīng)選擇的館藏來產(chǎn)生設置文檔,幫助更快速有效地進行遠程代理設置。
續(xù)訂(Renew) 位于電子資源管理工作流的末端。如果圖書館員想通過使用統(tǒng)計來了解電子書刊是否仍然被用戶所需要,則要到電子書商的網(wǎng)站上手工檢索使用統(tǒng)計,然后輸入到Excel表格中。有時也不能僅僅考慮Linkresolver的統(tǒng)計數(shù)字,因為使用資源的學生或者研究者能夠直接從電子商網(wǎng)站上獲取資料,這部分的統(tǒng)計也要考慮在內(nèi)。有的電子資源用戶使用非常頻繁,圖書館就會保持這部分訂購。如果使用量少,就替換成其他電子資源,那么電子資源管理流程將返回到查找資源階段(Select)。通常情況下,統(tǒng)計數(shù)據(jù)是續(xù)訂決策的重要參考條件,電子資源的使用程度等量化指標至關重要。此外,E-services中License Manager的預算統(tǒng)計則有助于圖書館優(yōu)化預算結構。E-services從知識庫中自動收割這些出版商的統(tǒng)計數(shù)字,無需手工進行統(tǒng)計操作,就對使用量、預算等進行數(shù)據(jù)匯總、統(tǒng)計成圖、編譯報告,隨需隨用。一旦圖書館決定取消續(xù)訂,所有的圖書館館藏信息都會從知識庫中移除。
3.3 代表性用戶及其使用體驗
OCLC的E-services來自于WMS中針對電子資源管理的一個部分,其不僅僅是創(chuàng)新產(chǎn)品和服務,更是一種工藝創(chuàng)新、管理創(chuàng)新,是將圖書館電子資源的碎片化工作集成在一起,成為一種流程化的管理模式,從圖書館資源管理戰(zhàn)略和圖書館用戶需求的角度出發(fā),以提高圖書館電子資源使用率和用戶滿意度為目標的變革。換言之,OCLC電子資源管理是一種基于圖書館電子資源業(yè)務流程進行的管理、控制模式,在合作共享數(shù)據(jù)基礎上,代表著一種對新的圖書館電子資源組織工作模式的追求。
2016年3月15日, 德國明斯特應用技術大學(Münster University of Applied Sciences) 與OCLC簽訂協(xié)議[20],使用OCLC的WorldShare Management Services (WMS)服務,這也是德國首個使用OCLC WMS服務的學術機構。明斯特應用技術大學的圖書館館長Dr. Klotz-Berendes如是說,現(xiàn)有的圖書館管理系統(tǒng)面對電子資源管理時,通?;ㄙM巨大且費時費力。E-services圍繞電子資源管理,提供了一個未來工業(yè)流程式的設計,重點在于其高效的運行流程可以整合外部供應商現(xiàn)有和未來的服務,例如集團采購,這種在獲取和許可領域使用協(xié)作共享信息的方式,是OCLC產(chǎn)品受歡迎的主因。
美國西部知名的文理學院卡萊門學院(The Claremont Colleges)[21]圖書館信息資源采購主管Margaret Hogarth對于使用E-services也發(fā)出贊嘆,他如是說,有時候,學院購買了一些資源,但是只有題名列表,沒有ISSN號,沒有ISBN號,沒有OCLC序列號。如果只是幾個,那么可以手工添加,如果上千種,那么在OCLC輔助工具協(xié)助的情況下就能很好地查找到相關資源,當MARC數(shù)據(jù)到達時,他還可以將其分享給聯(lián)盟成員,減少了其他人的查找時間。Margaret認為選擇WMS最大的動因在于WMS讓一個平臺上管理信息進行共享成為可能。很多圖書館都在添加資源進來,知識庫在不斷的增長,這有助于WMS參與到社區(qū)之中并保持持續(xù)的更新。
4 結語
卡內(nèi)基梅隆大學海因茲學院院長Ramayya Krishnan[22]提到,大數(shù)據(jù)具有催生社會變革的能量。但釋放這種能量,需要嚴謹?shù)臄?shù)據(jù)治理、富有洞見的數(shù)據(jù)分析和激發(fā)管理創(chuàng)新的環(huán)境。圖書館仍處在早期聚集各種新信息和數(shù)據(jù)的階段。事實上,如果能夠成功地駕馭這些難點,圖書館的大數(shù)據(jù)可能會在教育、權威和文化方面做出重要的影響。
OCLC研究部Constance Malpas在2017年年會上的報告《Libraries and the Big Data Revolution》(圖書館與大數(shù)據(jù)革命)[23]闡釋了圖書館大數(shù)據(jù)驅(qū)動著創(chuàng)新與突破的意義。大學研究者通過WorldCat大數(shù)據(jù)發(fā)現(xiàn)經(jīng)濟發(fā)展和學科知識形成的模式;OCLC研究部應用大數(shù)據(jù)方法來提升WorldCat數(shù)據(jù)質(zhì)量,分析聚合數(shù)據(jù)集,并利用語義網(wǎng)應用進行創(chuàng)新;OCLC產(chǎn)品部門關注合作,利用全球數(shù)據(jù)網(wǎng)絡將圖書館與未來相連接。
OCLC電子資源管理服務的實質(zhì)不是僅僅將圖書館數(shù)據(jù)移到一個新的管理平臺,而是完善了數(shù)據(jù)質(zhì)量,增加了服務內(nèi)容,亦與其他數(shù)據(jù)相關連,從而擴大館藏資源的可測量程度和比對程度。從體量上、更新速度上、質(zhì)量上以及創(chuàng)新應用上來看,WorldCat是圖書館書目領域的大數(shù)據(jù),而如何抽取、使用、分析從而輔助決策,從業(yè)務流程化和合作共建共享的角度利用大數(shù)據(jù),需要全球圖書館共同的努力和實踐。
參考文獻:
國務院關于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知[EB/OL]. [2018-07-09].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
國務院辦公廳印發(fā)國家信息化發(fā)展戰(zhàn)略綱要[EB/OL].
[2018-07-09].http://www.gov.cn/zhengce/2016-07/27/
content_5095336.htm .
易觀.2017中國社交電商大數(shù)據(jù)白皮書[EB/OL].[2018-
07-03].http://www.199it.com/archives/609316.html.
網(wǎng)絡大數(shù)據(jù).解讀:大數(shù)據(jù)在電信行業(yè)的五大應用
[EB/OL].[2018-07-03].http://www.raincent.com/content-10-3105-1.html.
USEIT知識庫.愛分析:2018中國金融大數(shù)據(jù)行業(yè)報告[EB/OL].[2018-07-03].http://www.useit.com.cn/thread-
18800-1-1.html.
大數(shù)據(jù)[EB/OL].[2018-07-03].https://baike.baidu.com/
item/%E5%A4%A7%E6%95%B0%E6%8D%AE/1356941?fr=aladdin.
維克托·邁爾-舍恩伯格,肯尼恩·庫克耶.大數(shù)據(jù)時代[M].周濤,等,譯.杭州:浙江人民出版社, 2013.
中國大數(shù)據(jù)產(chǎn)業(yè)觀察. IBM商業(yè)價值研究院分析:大數(shù)
據(jù)在現(xiàn)實世界中的應用[EB/OL].[2018-07-03].http://www.
cbdio.com/BigData/2014-11/20/content_1914760_all.htm.
騰訊數(shù)據(jù)存儲量相當于1.5萬個最大圖書館[EB/OL].
[2018-07-04].http://app.myzaker.com/news/article.php?v=1.0&pk;=57454bbb9490cb8a3a000011.
GANTZ J,REINSEL D. Extracting value from chaos
[EB/OL].[2018-07-04].https://wenku.baidu.com/view/5cedb204bd64783e09122b79.html.
聶江城,楊軍花,王剛.高校圖書館圖書借閱量化統(tǒng)計
分析:以南開大學圖書館為例[J].圖書館工作與研究,
2010(10):61-65.
燕飛,張銘,孫韜,等.基于網(wǎng)絡特征的用戶圖書借閱行為分析:以北京大學圖書館為例[J]. 情報學報, 2011,30(8):875-882.
李國洪,任小偉,王大元. 研究型大學圖書館數(shù)據(jù)庫資
源利用統(tǒng)計分析:以四川大學CNKI為例[J].現(xiàn)代情報,
2009,29(6):136-139.
郝志剛.大數(shù)據(jù)、云計算與圖書館[J].新世紀圖書館, 2014(6):36-39.
MICHALKO J, MALPAS C, ARCOLIO A. Research
libraries, risk and systemic change[EB/OL].[2018-07-03].https://www.oclc.org/content/dam/research/publications/library/2010/2010-03.pdf.
陳大慶. 電子資源管理系統(tǒng)的發(fā)展及未來思考[J].大
學圖書館學報, 2014,32(03):74-79.
BURKEG. Meeting the E-resources challenge[R].OCLC report,2013.
朱本軍,聶華.下一代圖書館系統(tǒng)與服務研究[M].北京:
北京大學出版社, 2012.
王文清,陳凌. CALIS數(shù)字圖書館云服務平臺模型[J]. 大學圖書館學報, 2009, 27(4):13-18.
OCLC News. Munster University of Applied Sciences
is first in Germany to select OCLC WorldShare Management Services[EB/OL].[2018-07-03].https://
www.oclc.org/en/news/releases/2016/201601oberhaching.html.
OCLC News. The Claremont Colleges: expand your catalog and share with the library community at the same time[EB/OL].[2018-07-10].https://www.oclc.org/en/member-stories/claremont-cataloging.html.
大數(shù)據(jù)[EB/OL]. [2018-07-10].http://wiki.mbalib.com/
wiki/0.
MALPAS C. Libraries and the big data revolution[EB/OL].[2018-07-08].https://www.oclc.org/content/dam/oclc/events/2017/EMEARC2017/EMEARC-2017-Plenary-Session-2-Libraries-and-the-Big-Data-Revolution-Constance-Malpas.pdf. OCLC Report.