海濤++任卷芳++王丹
摘要:通過分析圖書館數(shù)據(jù)整合的現(xiàn)狀和背景,以吉林動(dòng)畫學(xué)院圖書館網(wǎng)站數(shù)字資源一框式檢索系統(tǒng)為例,對基于元數(shù)據(jù)整合的一框式檢索系統(tǒng)進(jìn)行闡述和分析。
關(guān)鍵詞:元數(shù)據(jù);數(shù)據(jù)整合;一框式檢索
中圖分類號:TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號:1009-3044(2015)01-0007-03
1 圖書館數(shù)據(jù)整合的現(xiàn)狀
1.1 圖書館數(shù)字資源類型日趨多元化
隨著網(wǎng)絡(luò)的迅速發(fā)展,大量的信息以多樣化的表現(xiàn)形式和實(shí)時(shí)互動(dòng)的交流方式構(gòu)成了一個(gè)虛擬世界。數(shù)字資源類型日益呈現(xiàn)多元化趨勢,信息量豐富,高校圖書館可通過自建、購買、共享和文獻(xiàn)傳遞等方式滿足讀者需要。數(shù)字資源包括自建數(shù)據(jù)庫,如館藏書目數(shù)據(jù)庫、學(xué)位論文和會(huì)議論文數(shù)據(jù)庫、中外文現(xiàn)刊目次庫、館藏特色數(shù)據(jù)庫以及教學(xué)參考書數(shù)據(jù)庫等;外購數(shù)據(jù)庫,如CNKI中國知網(wǎng)、萬方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)、Elsevier ScienceDirect、Springer Link等;光盤數(shù)據(jù)庫;網(wǎng)絡(luò)數(shù)字資源以及參與共享項(xiàng)目建設(shè)的數(shù)據(jù)庫。隨著數(shù)字資源數(shù)量和數(shù)據(jù)庫類型的不斷增多,增長速度加快,可供讀者選擇的數(shù)據(jù)庫多達(dá)上百種,面對如此多的資源,讀者很難在特定的數(shù)據(jù)庫中找到所需信息,需要在不同的數(shù)據(jù)庫間切換、篩選,降低了檢索效率。
同時(shí)網(wǎng)絡(luò)資源也是圖書館數(shù)字資源的一個(gè)重要組成部分,但是網(wǎng)絡(luò)的不可控性造成了網(wǎng)上信息質(zhì)量參差不齊, 缺乏系統(tǒng)的組織管理, 在選擇和利用網(wǎng)上資源時(shí)給讀者造成了很大的困難,同時(shí)也給圖書館為讀者服務(wù)帶來了不便,所以讀者和圖書館都需要一個(gè)可以簡捷、快速和有效地,能夠?qū)崿F(xiàn)跨庫檢索獲取所需信息的理想平臺(tái)。
1.2圖書館數(shù)據(jù)整合的必要性
高校數(shù)字圖書館作為學(xué)校數(shù)字化信息中心,為教學(xué)、科研及廣大師生提供了信息服務(wù)保障,對提高教師教學(xué)水平及科研能力,起到積極的促進(jìn)作用。高校數(shù)字圖書館的運(yùn)行環(huán)境主要為校園網(wǎng),提供局域網(wǎng)范圍內(nèi)的數(shù)字資源服務(wù)。作為一個(gè)知識(shí)服務(wù)機(jī)構(gòu),承擔(dān)了對文獻(xiàn)和資源進(jìn)行篩選、整理, 使文獻(xiàn)有序化的工作。[1]在數(shù)字圖書館成為發(fā)展方向的背景下,各個(gè)圖書館越來越重視數(shù)字館藏的豐富性和多樣性。與此同時(shí),大量的復(fù)雜數(shù)據(jù)面向讀者,使讀者在選擇和使用數(shù)字資源時(shí)造成困惑。圖書館作為“資源”和“讀者”之間的橋梁,需要建立一個(gè)統(tǒng)一檢索平臺(tái),使讀者能夠更加方便地從大量相關(guān)信息中準(zhǔn)確挑選出所需信息,瀏覽和獲取來自圖書館及網(wǎng)絡(luò)的各類數(shù)字資源,開辟了一個(gè)全方位了解和掌握所關(guān)注學(xué)科和領(lǐng)域動(dòng)態(tài)的較為方便快捷的途徑。因此,構(gòu)建統(tǒng)一的檢索平臺(tái)是解決這一問題的有效方式。[2]
2 基于元數(shù)據(jù)整合的一框式檢索
2.1 元數(shù)據(jù)管理及特點(diǎn)
在圖書信息領(lǐng)域,元數(shù)據(jù)是指提供關(guān)于數(shù)字資源或數(shù)據(jù)的一種結(jié)構(gòu)化數(shù)據(jù),是對數(shù)字資源的結(jié)構(gòu)化描述??鐜鞕z索在圖書館網(wǎng)站中,與資源導(dǎo)航、開放鏈接、權(quán)限管理和個(gè)性化服務(wù)等功能一起構(gòu)成的數(shù)字資源整合系統(tǒng),是圖書館網(wǎng)站檢索系統(tǒng)中的一種關(guān)鍵技術(shù)。但對所有資源的跨庫檢索只是一種理想狀態(tài),實(shí)際中只能做到兼容盡可能多的資源。讀者需要針對某個(gè)學(xué)科領(lǐng)域、文獻(xiàn)以及其他個(gè)性化需求的檢索。元數(shù)據(jù)挖掘存儲(chǔ)管理系統(tǒng)吸收了跨庫檢索的優(yōu)點(diǎn),并進(jìn)行了改進(jìn),改變了讀者的認(rèn)識(shí),通過對元數(shù)據(jù)進(jìn)行存儲(chǔ)和預(yù)處理去重排序,提供了搜索引擎方式的檢索,保留了跨庫檢索的功能,解決了采用單一跨庫檢索整合資源的弊端。元數(shù)據(jù)倉儲(chǔ)的建立,對于數(shù)據(jù)倉庫的成功運(yùn)行具有非常重要的作用。
元數(shù)據(jù)管理主要有兩個(gè)方面的任務(wù):一是存儲(chǔ)和維護(hù)元數(shù)據(jù)庫中的元數(shù)據(jù);二是數(shù)據(jù)倉庫建模工具、數(shù)據(jù)獲取工具、前端工具等之間的消息傳遞,協(xié)調(diào)各模塊和工具之間的工作。通過元數(shù)據(jù)索引技術(shù)將圖書館的各種數(shù)字資源元數(shù)據(jù)預(yù)先收錄,實(shí)現(xiàn)搜索引擎的檢索效果,具有搜索速度快,檢索結(jié)果統(tǒng)一無重復(fù)的特點(diǎn)。
2.2 一框式檢索及特點(diǎn)
一框式檢索系統(tǒng)通過資源調(diào)度系統(tǒng),對各種異構(gòu)數(shù)字資源進(jìn)行應(yīng)用檢索整合。一框式檢索引擎實(shí)現(xiàn)了文章題名、主題、作者、刊種進(jìn)行分析型檢索,使讀者能夠快速地獲取所需要的結(jié)果,并且通過先進(jìn)的知識(shí)組織體系和語義檢索獲取資源。一框式檢索為讀者提供了統(tǒng)一的檢索語言和檢索界面,能夠?qū)崿F(xiàn)對本地和異地各種數(shù)字資源系統(tǒng)的檢索,對多種異構(gòu)系統(tǒng)的聯(lián)邦檢索,對多種資源元數(shù)據(jù)倉庫的跨庫檢索,為讀者提供了個(gè)性化的檢索服務(wù)。一框式檢索系統(tǒng)是圖書館網(wǎng)站的核心組件之一,是一套完整的文獻(xiàn)檢索、獲取系統(tǒng)。
2.3基于元數(shù)據(jù)整合的一框式檢索系統(tǒng)
目前高校圖書館都同時(shí)擁有多種數(shù)字資源類型,每種數(shù)字資源都屬于獨(dú)立的系統(tǒng),讀者需要進(jìn)入不同的數(shù)據(jù)庫才能獲取資源,海量的數(shù)字資源給讀者帶來諸多不便。為解決該問題,本館利用發(fā)現(xiàn)系統(tǒng)對館藏紙質(zhì)資源和數(shù)字資源進(jìn)行了大規(guī)模整合,并在網(wǎng)站上啟用了“基于元數(shù)據(jù)整合的一框式檢索系統(tǒng)”。
系統(tǒng)建設(shè)的整體架構(gòu)通過兩層——業(yè)務(wù)層和數(shù)據(jù)層實(shí)現(xiàn),采用分布式大數(shù)據(jù)處理系統(tǒng),將數(shù)據(jù)庫中的非結(jié)構(gòu)化與結(jié)構(gòu)化數(shù)據(jù)通過收割(METS 、OAI)、復(fù)制、導(dǎo)入等技術(shù)聚合起來,建立聯(lián)合資源倉儲(chǔ)(Union Catalog/Database),通過搜索元數(shù)據(jù)倉儲(chǔ)中已經(jīng)收割預(yù)處理好的元數(shù)據(jù),列出檢索結(jié)果,從實(shí)際應(yīng)用角度入手整合了館藏OPAC系統(tǒng)和各類數(shù)字資源系統(tǒng)。系統(tǒng)支持的元數(shù)據(jù)包括DC、Marc、EAD等,檢索協(xié)議包括HTTP、Z39.50、Zing、CALIS-ODL等。
2.3.1 系統(tǒng)框架
基于吉林動(dòng)畫學(xué)院圖書館館藏資源的現(xiàn)狀,根據(jù)元數(shù)據(jù)倉儲(chǔ)整合原理,構(gòu)建的一框式檢索系統(tǒng)數(shù)據(jù)整體架構(gòu)如圖1所示。
一框式檢索系統(tǒng)可以直接對館藏資源進(jìn)行統(tǒng)一檢索,通過與資源調(diào)度系統(tǒng)集成,對來自各個(gè)數(shù)據(jù)庫的數(shù)字資源進(jìn)行統(tǒng)一檢索整合。
2.3.2 元數(shù)據(jù)倉儲(chǔ)建設(shè)
元數(shù)據(jù)挖掘存儲(chǔ)管理系統(tǒng)先對元數(shù)據(jù)收割、抓取,再進(jìn)行存儲(chǔ)和預(yù)處理去重排序,通過元數(shù)據(jù)索引技術(shù)將圖書館的各種數(shù)字資源元數(shù)據(jù)預(yù)先收錄,最終實(shí)現(xiàn)互聯(lián)網(wǎng)搜索引擎的檢索效果。
2.3.3 一框式檢索引擎
一框式檢索系統(tǒng)通過資源調(diào)度系統(tǒng),對各種異構(gòu)數(shù)字資源進(jìn)行應(yīng)用檢索整合。系統(tǒng)利用知識(shí)組織體系和語義檢索獲取信息,為讀者提供統(tǒng)一的檢索語言和檢索界面,對各種資源元數(shù)據(jù)聯(lián)合倉庫的跨庫檢索,實(shí)現(xiàn)了元數(shù)據(jù)搜索、跨庫檢索、全文搜索、篇目搜索等功能,能同時(shí)檢索多個(gè)不同類型的資源。
2.4 實(shí)踐效果
2014年初圖書館正式使用一框式檢索系統(tǒng),實(shí)施統(tǒng)一檢索功能,方便讀者在統(tǒng)一檢索框下實(shí)現(xiàn)全部館藏資源包括CNKI、讀秀學(xué)術(shù)搜索、館藏紙質(zhì)、電子書等資源的檢索。
2.4.1 一框式檢索系統(tǒng)主要功能
一框式檢索系統(tǒng)可以對圖書書目和期刊篇目進(jìn)行統(tǒng)一檢索,檢索速度快,結(jié)果統(tǒng)一,而且篇目、書目檢索結(jié)果還可以進(jìn)行二次聚類,讓讀者看到每一次檢索對應(yīng)的年代、學(xué)科分類導(dǎo)航。一框式檢索系統(tǒng)通過與資源調(diào)度系統(tǒng)及文獻(xiàn)傳遞系統(tǒng)的集成,對來自各個(gè)數(shù)據(jù)庫的圖書和期刊的數(shù)字資源進(jìn)行統(tǒng)一檢索整合,實(shí)現(xiàn)了對文章題名、作者、主題等內(nèi)容的檢索,使讀者能夠快速地獲得合適的檢索結(jié)果,并且通過知識(shí)組織體系和語義檢索獲取信息,使讀者能對本地和異地資源同時(shí)檢索。主要功能介紹如下:
1) 全文檢索:對圖書內(nèi)容的全文檢索。
2) 快速檢索 :幫助讀者像利用搜索引擎一樣檢索學(xué)術(shù)資源,可自定義多個(gè)快速檢索集并且自由排序,供讀者選擇檢索。
3) 整合檢索 :提供對異構(gòu)資源的檢索能力,可同時(shí)檢索多個(gè)不同類型的數(shù)字資源,并且允許自定義單次可檢索資源的個(gè)數(shù)。
4) 多面搜索: 搜索任意一種資源時(shí),同時(shí)顯示除其他相關(guān)的資源信息;檢索一個(gè)內(nèi)容的同時(shí),并獲得其他方面對資源的揭示內(nèi)容。
5) 統(tǒng)一的檢索結(jié)果:對檢索結(jié)果統(tǒng)一格式顯示,支持排序、搜索數(shù)據(jù)預(yù)先的合并和去重。可分別查看合并檢索結(jié)果或者各庫檢索結(jié)果。
6) 資源導(dǎo)航 :通過主題分類、字順列表及其它查找方式,對各種數(shù)字資源進(jìn)行導(dǎo)航,還可自定義數(shù)字資源的描述字段。
7) 語義分析:通過對讀者檢索詞的自然語義分析,調(diào)整分詞體系,以達(dá)到智能檢索和精確檢索。
2.4.2 具體實(shí)例
例如:利用統(tǒng)一檢索框搜索與“動(dòng)畫設(shè)計(jì)”相關(guān)的文獻(xiàn)資源,并精煉檢索出館藏紙本和電子資源。
1) 在統(tǒng)一檢索框中輸入“動(dòng)畫設(shè)計(jì)”并點(diǎn)擊檢索按鈕。
2) 全部檢索結(jié)果如圖4所示。
3) 在左側(cè)“精煉檢索”中,勾選“只檢索館藏紙本資源”和“只檢索館藏電子資源”,并點(diǎn)擊“確定”,得到相應(yīng)的結(jié)果頁面。
2.4.3 優(yōu)勢對比
“基于元數(shù)據(jù)整合的一框式檢索系統(tǒng)”與圖書館門戶主頁上的原有“快速檢索框”相比,具有以下優(yōu)點(diǎn):
1) 建立了統(tǒng)一的數(shù)字圖書館資源目錄體系,包括本館紙質(zhì)書目、本地各類鏡像資源、遠(yuǎn)程可訪問資源及其他網(wǎng)絡(luò)學(xué)術(shù)資源。
2) 提供了知識(shí)挖掘和數(shù)據(jù)分析功能,幫助讀者快速找到所需要的資源,提高了館藏資源利用率。
3) 結(jié)合網(wǎng)絡(luò)技術(shù),對門戶網(wǎng)站進(jìn)行改造,加強(qiáng)了資源展示度,提升圖書館信息服務(wù)力度,使讀者更加了解圖書館的資源和服務(wù)內(nèi)容。
3 結(jié)束語
數(shù)據(jù)整合是信息社會(huì)發(fā)展的必然,是實(shí)現(xiàn)信息共享的前提,也是提供優(yōu)質(zhì)化服務(wù)的基礎(chǔ)。使用元數(shù)據(jù)整合后,可以實(shí)現(xiàn)快速、便捷的“一站式服務(wù)”,在整合平臺(tái)上為讀者提供個(gè)性化服務(wù),促進(jìn)信息共享,減少不必要的重復(fù)建設(shè)。[3]
一框式檢索系統(tǒng)解決了信息過載給讀者帶來的困難,提高了讀者全面、綜合、準(zhǔn)確地利用信息的能力,實(shí)現(xiàn)了圖書館數(shù)據(jù)整合的跨越式發(fā)展。
參考文獻(xiàn):
[1] 李鵬云.基于元數(shù)據(jù)倉儲(chǔ)的圖書館數(shù)據(jù)整合實(shí)踐——以國家圖書館“文津搜索”項(xiàng)目為例[J].圖書館學(xué)刊,2013(8):46-49.
[2] 王旭.國內(nèi)數(shù)字圖書館集成檢索系統(tǒng)發(fā)展對策研究[D]. 湘潭:湘潭大學(xué),2013.
[3] 劉子輝,陳強(qiáng),楊平.以元數(shù)據(jù)為核心實(shí)現(xiàn)區(qū)域數(shù)字圖書館數(shù)據(jù)資源整合[J].重慶科技學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2012(3):153-154.
[4] 嚴(yán)武軍,馬小燕.高校數(shù)字圖書館元數(shù)據(jù)檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2006(1):162-164.
[5] 張宇良.MyLibrary個(gè)性化服務(wù)與資源整合檢索系統(tǒng)研究[D].廣州:華南理工大學(xué),2011(1).
[6] 徐榮華.基于元數(shù)據(jù)倉儲(chǔ)的資源整合應(yīng)用[J].圖書館雜志,2012.
[7] 胡東,詹利華. 浙江網(wǎng)絡(luò)圖書館的實(shí)踐與思考[J].圖書館學(xué)研究,2010.