劉金玲 默蓉
摘 要:在圖書館共享聯(lián)盟內(nèi),要實現(xiàn)信息資源的共享,首先必須解決信息資源狀況的通報問題,即信息資源的共知。在現(xiàn)代信息技術條件下,圖書館聯(lián)盟的信息資源共知體系建設,要充分運用知識挖掘、知識聚類和元數(shù)據(jù)整合技術,以基于元數(shù)據(jù)整合的共享聯(lián)合目錄體系建設作為主線,正確地處理好紙質(zhì)資源與數(shù)字資源的關系,解決好館藏聯(lián)合目錄與數(shù)字資源導航體系的整合,構建起跨系統(tǒng)、跨平臺、跨地域的多館信息資源聯(lián)合目錄揭示系統(tǒng)。
關鍵詞:元數(shù)據(jù);圖書館聯(lián)盟;信息資源;整合
中圖分類號: G250.73 文獻標志碼: A 文章編號:16720539(2013)06011404
在圖書館共享聯(lián)盟內(nèi),由于各成員館信息資源分散保存在不同的地理空間,相互之間對資源的種類、互補性、可用性等信息都不了解。要實現(xiàn)這些信息資源的共享,首先需要知道各自有什么資源可以共享,向誰索取,這就必須解決信息資源狀況的通報問題,即信息資源的共知。
一、現(xiàn)代圖書館信息資源共知面臨的主要問題
盡管數(shù)字圖書館十幾年的發(fā)展成就有目共睹,但隨之而來的種種問題也日顯突出。家底模糊不清、信息孤島障礙是現(xiàn)代圖書館建設面臨的主要矛盾。
(一)家底模糊不清
為了解決聯(lián)盟成員之間的信息資源共知問題,人們曾通過聯(lián)合編制手工目錄和聯(lián)合編制MARC機讀書目等方式來建立統(tǒng)一的信息搜索通道。在傳統(tǒng)圖書館時代,館藏目錄和各類聯(lián)合目錄的組織是人類組織、控制和管理文獻資源的主要手段,也是開展讀者服務和資源共享的最主要工具。通過目錄系統(tǒng),圖書館和讀者都可以清晰地知道本館乃至一定范圍內(nèi)的其他圖書館有哪些資源,有多少品種和數(shù)量,在什么位置。我們甚至能準確掌握資源的學科保障能力,并據(jù)此不斷調(diào)整和優(yōu)化館藏資源結構。
但是,在進入數(shù)字化時代的現(xiàn)代圖書館,由于技術和觀念等因素的制約,雖然國際國內(nèi)也陸續(xù)出臺了相應的標準規(guī)范,但絕大多數(shù)圖書館都沒有開展數(shù)字資源的統(tǒng)一編目工作,還只能以數(shù)據(jù)庫列表鏈接方式向讀者提供數(shù)字資源的查詢與全文資源訪問服務。這就導致各圖書館雖然購買了大量數(shù)字資源,卻很難準確知道已購買資源的品種結構、重復情況,也難以提供類似傳統(tǒng)圖書館卡片式目錄系統(tǒng)那樣的資源統(tǒng)一目錄體系和統(tǒng)一檢索平臺,從而導致在資源建設、宣傳推廣與資源共享等方面出現(xiàn)問題。在這種背景下,建立館際之間的資源統(tǒng)一目錄和統(tǒng)一檢索系統(tǒng)就更加艱難,讀者難以方便、快捷、準確地掌握可用資源的狀況,沒有了共知,共享也就無從入手。
(二)信息孤島負面效應
由于是不同公司開發(fā)的獨立產(chǎn)品,各數(shù)據(jù)庫的學科范圍、收錄品種、收錄年限等各不相同,在使用界面、使用方法上也都自成體系,缺乏互通性,因此,讀者必須把握每個數(shù)據(jù)庫的適用范圍,逐個學習每個數(shù)據(jù)庫平臺的功能、使用方法和技巧。同時,當讀者從一個個數(shù)據(jù)庫中檢索出相關信息時,由于沒有合適的工具與平臺對這些結果進行去重分析,只能憑著記憶用手工方法去重,也無法判斷在分散檢索中是否會遺漏重要文獻線索。這些數(shù)據(jù)庫成了一個個信息孤島。
在讀者調(diào)查中發(fā)現(xiàn),由于使用不方便,加之很多讀者信息意識欠缺,當有多個相同類型數(shù)據(jù)庫時,他們往往只使用自己熟悉的數(shù)據(jù)庫進行檢索,除非找不到所要文獻,他們基本上放棄再查別的數(shù)據(jù)庫,這就導致許多數(shù)據(jù)庫得不到充分利用。為此,各類圖書館一年四季都需要花費大量的精力開展培訓工作,但面對幾萬用戶(高校)乃至幾十萬、上百萬用戶(公共圖書館),再好的培訓、講座,每次受益人群是十分有限的,數(shù)據(jù)庫利用的瓶頸難以有效消除。
在聯(lián)盟環(huán)境下,信息孤島效應更加突出。除了各圖書館自身數(shù)字資源之間缺乏統(tǒng)一揭示外,不同圖書館資源之間的交叉、重復更難以把握,加之數(shù)字資源訪問權限的約束,讀者要在如此海量的資源里找到、得到自己所需要的資源非常艱難。
二、元數(shù)據(jù)整合
百度百科給出的定義:整合是把一些零散的東西通過某種方式彼此銜接,從而實現(xiàn)信息系統(tǒng)的資源共享和協(xié)同工作[1]。
由此,我們可以給出元數(shù)據(jù)整合的描述,就是把來自不同信息系統(tǒng)的分散元數(shù)據(jù)有機地集成為一個有序整體,從而實現(xiàn)異構、異地多個信息系統(tǒng)數(shù)據(jù)的一站式快速搜索的信息處理過程。元數(shù)據(jù)整合所實現(xiàn)的主要功能包括:
(1)著錄描述:通過標準化手段,對各類數(shù)據(jù)信息單元進行詳細、全面的著錄描述,從而言簡意賅地揭示數(shù)據(jù)元素涵蓋的核心內(nèi)容、載體形態(tài)、存儲位置、獲取方式、制作與利用方法等基礎信息。
(2)定位檢索:通過統(tǒng)一的元數(shù)據(jù)存儲建立高效的數(shù)據(jù)索引,從而幫助人們快速、高效地一站式完成海量信息資源的檢索,以及信息資源存在狀態(tài)和可用狀態(tài)的確認。
(3)資源調(diào)度:通過信息交互鏈接技術,支持信息資源的存儲管理和使用管理,實現(xiàn)目標信息資源的一站式獲取與利用。
三、基于元數(shù)據(jù)整合的信息資源共知體系
在傳統(tǒng)的信息資源共享體系建設中,由于各圖書館信息化管理系統(tǒng)的選擇各不相同,其數(shù)據(jù)庫結構、編程語言、操作界面都不相同,集成系統(tǒng)缺乏標準化,這為實現(xiàn)信息資源的共知增加了難度。
(一)基于元數(shù)據(jù)的信息資源整合
現(xiàn)代圖書館的信息資源共知體系建設,要充分運用元數(shù)據(jù)整合技術,以基于元數(shù)據(jù)整合的共享聯(lián)合目錄體系建設作為主線,正確地處理好紙質(zhì)資源與數(shù)字資源的關系,解決好館藏聯(lián)合目錄與數(shù)字資源導航體系的整合,構建起跨系統(tǒng)、跨平臺、跨地域的多館信息資源聯(lián)合目錄揭示系統(tǒng),實現(xiàn)信息資源的共知,并最終實現(xiàn)信息資源的共享,這是圖書館開放服務的基本保障。
1.基于元數(shù)據(jù)進行信息資源整合
信息資源整合的目的是為了滿足讀者利用信息資源的需求,而將各種不同類型、相對獨立的信息資源進行重組,形成具有內(nèi)在聯(lián)系的、統(tǒng)一、高效的信息資源整體和利用環(huán)境?;谠獢?shù)據(jù)進行信息資源整合,就是以元數(shù)據(jù)倉儲技術為基礎,將各種信息資源的元數(shù)據(jù)進行統(tǒng)一整合,并按照圖書館目錄管理的方法,對信息資源進行分類,構建科學、合理、實用、統(tǒng)一的信息資源索引體系架構,實現(xiàn)對異構、異地海量信息資源的統(tǒng)一整合、統(tǒng)一搜索、統(tǒng)一導航、統(tǒng)一全文調(diào)度和文獻傳遞服務等綜合信息服務功能,最終實現(xiàn)圖書館內(nèi)部和館與館之間信息資源的一站式利用。
2.整合的范圍
基于元數(shù)據(jù)的信息資源整合不僅涵蓋了紙本書目元數(shù)據(jù)資源和購買的商業(yè)數(shù)字資源元數(shù)據(jù),還包括自建數(shù)字資源、開放存取數(shù)字資源以及其它網(wǎng)絡資源的元數(shù)據(jù)。有基于單館的信息資源整合和基于多館異地分布的異構資源的整合兩大類型。
基于單館信息資源的整合是指將圖書館收藏的所有信息資源,有機地整合在一起,建立統(tǒng)一的檢索平臺,提供給讀者使用。其整合目標涵蓋本館所擁有的圖書、期刊、報紙、會議論文、學位論文、標準、專利,乃至音頻、視頻、圖像等各種類型的紙質(zhì)、電子載體文獻,從而形成館內(nèi)所有信息資源元數(shù)據(jù)的統(tǒng)一揭示,實現(xiàn)多種載體信息資源的一站式檢索,極大地減少讀者使用的困難,提高資源利用率,發(fā)揮信息資源的最大效益。
基于多館異地分布的異構資源的整合是指圖書館與其他成員館進行資源整合,打破“信息孤島”的局面,實現(xiàn)相互間信息資源的互通互聯(lián),發(fā)揮信息資源的整體效益。其整合目標主要涵蓋成員館的某類(如單一的館藏圖書聯(lián)合目錄、數(shù)據(jù)庫聯(lián)合導航等)或全部信息資源,從而形成多館信息資源元數(shù)據(jù)的統(tǒng)一倉儲,實現(xiàn)多館(多地)、多系統(tǒng)、異構的不同類型信息資源的統(tǒng)一整合、統(tǒng)一聯(lián)合導航和一站式的統(tǒng)一檢索,并為基于共享的全文館際互借與文獻傳遞服務創(chuàng)造條件。
(二)典型整合平臺介紹
目前,在我國圖書館界較有影響的典型整合平臺主要有以下兩個類型:
1.基于聯(lián)邦檢索的資源整合平臺
基于跨庫檢索系統(tǒng)的數(shù)字資源整合,也稱聯(lián)邦檢索,是將一個檢索請求同時轉換并發(fā)送到多個異構的數(shù)據(jù)庫,將檢索結果進行歸并和統(tǒng)一展示的整合系統(tǒng)[2]。
目前,基于聯(lián)邦檢索的資源整合平臺以國外的MetaLib、ResearchPro、MUSE、Swets Wise等和我國清華同方公司的TRS、江蘇匯文軟件有限公司的Mylibrary為代表。
2.基于元數(shù)據(jù)倉儲的資源整合平臺
基于元數(shù)據(jù)倉儲的資源整合平臺是對來自異構資源的海量元數(shù)據(jù)和部分對象數(shù)據(jù)進行抽取、映射、收割、導入等處理[3],進行檢索前預收集,并通過歸并映射到一個標準的表達式進行預聚合,形成統(tǒng)一的元數(shù)據(jù)索引,向終端用戶提供統(tǒng)一檢索服務的平臺[4]。
目前,基于元數(shù)據(jù)倉儲的資源整合的國外平臺主要有OCLC的WorldCat、Serials Solutions的Summon、EBSCO的EBSCO Discovery Service(EDS)和Ex Libris的Primo Central等,國內(nèi)用戶還較少。國內(nèi)超星公司的讀秀、Medalink和百鏈系統(tǒng)(2006年發(fā)布),已建立數(shù)十個圖書館聯(lián)合目錄系統(tǒng)和聯(lián)盟共享服務平臺;此外,北京萬方公司的整合系統(tǒng)、CALIS的e讀系統(tǒng)也屬于元數(shù)據(jù)整合類的平臺。
3.基于元數(shù)據(jù)進行信息資源整合的優(yōu)勢
以元數(shù)據(jù)為基礎建立的統(tǒng)一整合和聯(lián)合導航系統(tǒng),將整合范圍內(nèi)的全部館藏書目、商業(yè)數(shù)字資源、自建特色資源和網(wǎng)上免費資源等各類資源進行有效去重和標準化管理,所形成的聯(lián)合目錄與資源導航體系將大大減少共享體系資源的重疊浪費,為充分發(fā)揮相互間的資源互補性掃清障礙。與第一代的跨庫聯(lián)邦檢索整合等技術相比,元數(shù)據(jù)整合具有明顯的優(yōu)勢。
(二)技術層面優(yōu)勢
元數(shù)據(jù)整合可以有效兼容網(wǎng)絡信息描述,提高網(wǎng)絡資源的可獲取性,從而增加讀者可查詢信息的范圍;在盡量不改變信息資源原有格式的同時,整合后,計算機可以訪問以不同形式描述的信息資源,實現(xiàn)異構資源的統(tǒng)一搜索;讀者是對預先建立的元數(shù)據(jù)庫索引進行檢索,所以檢索速度非???。
(三)功能層面優(yōu)勢
現(xiàn)代圖書館的信息資源種類繁多,不僅有書刊等傳統(tǒng)資源,還有視頻等新型資源,既有紙質(zhì)資源,也有數(shù)字資源[5],還有網(wǎng)絡開放存取信息資源。在進行資源整合時,不僅要整合本館的資源,還要整合聯(lián)盟內(nèi)各成員館的信息資源。
基于元數(shù)據(jù)進行信息資源整合,收錄的元數(shù)據(jù)描述字段可以包括資源名稱、學科分類、資源類型、時間跨度、語種、出版商、資源檢索平臺等,將元數(shù)據(jù)通過收割、復制、導入等技術聚合起來,建立聯(lián)合資源倉儲,可以較好地實現(xiàn)多種類型信息資源與傳統(tǒng)館藏文獻書目數(shù)據(jù)的統(tǒng)一整合。同時,可以將元數(shù)據(jù)倉儲建構在云計算、云存儲網(wǎng)絡之上,使得全國各個區(qū)域聯(lián)盟的元數(shù)據(jù)很容易在云中心打通,從而在更高、更廣層面實現(xiàn)跨聯(lián)盟的資源整合,在同一個檢索界面實現(xiàn)本館所有資源與聯(lián)盟內(nèi)所有成員館資源,甚至是全國各個聯(lián)盟信息資源的統(tǒng)一檢索,極大地擴大了圖書館文獻資源的服務范圍。
四、結語
綜上所述,元數(shù)據(jù)能夠描述和揭示各種動態(tài)的網(wǎng)絡數(shù)字資源,是管理和利用數(shù)字資源的基礎。圖書館聯(lián)盟在進行信息資源共知體系建設時,應充分發(fā)揮基于元數(shù)據(jù)進行信息資源整合的優(yōu)勢,選擇適合本聯(lián)盟的數(shù)據(jù)服務與技術提供商,進行基于元數(shù)據(jù)的資源整合與揭示系統(tǒng)建設,便捷高效地實現(xiàn)圖書館聯(lián)盟信息資源的共知,進而實現(xiàn)圖書館聯(lián)盟的建設目標——信息資源共享。
參考文獻:
[1]百度百科.整合.[EB/OL].(2013-01-30)[2013-03-27].http://baike.baidu.com/view/57967.htm#sub8058650.
[2]秦鴻,錢國富,鐘遠薪.三種發(fā)現(xiàn)服務系統(tǒng)的比較研究[J].大學圖書館學報,2012,(5):5-11,17.
[3]王淑娟.數(shù)字資源整合平臺優(yōu)化研究[J].情報探索,2011,(3):64-66.
[4]聶華,朱玲.網(wǎng)絡級發(fā)現(xiàn)服務——通向深度整合與便捷獲取的路徑[J].大學圖書館學報,2011,(6):5-10.
[5]劉金玲.基于商業(yè)平臺的信息資源整合研究[J].圖書館理論與實踐,2012,(7):34-35.
編輯:韓冬苗