劉 芳,盧國強(qiáng),王琳琳
(牡丹江醫(yī)學(xué)院,黑龍江 牡丹江 157011)
網(wǎng)格環(huán)境下數(shù)字圖書館異構(gòu)資源整合分析
劉芳,盧國強(qiáng),王琳琳
(牡丹江醫(yī)學(xué)院,黑龍江 牡丹江 157011)
文章主要對網(wǎng)絡(luò)環(huán)境下的數(shù)字圖書館異構(gòu)資源的整合進(jìn)行分析,介紹了網(wǎng)絡(luò)環(huán)境下數(shù)字圖書館的元數(shù)據(jù)、異構(gòu)資源檢索類型、異構(gòu)資源同構(gòu)化的問題、數(shù)字圖書館建設(shè)的整體協(xié)調(diào)及未來發(fā)展趨勢問題。
數(shù)字圖書館;網(wǎng)絡(luò)環(huán)境;異構(gòu)資源
網(wǎng)格是新世紀(jì)提出來的一種全新技術(shù)模式,這種模式出現(xiàn)的時(shí)間為21世紀(jì)初。網(wǎng)格背景將科研帶到了世界領(lǐng)域,全世界的人們實(shí)現(xiàn)了資源的共享,全世界進(jìn)行學(xué)術(shù)交流與科研具備了可能性;網(wǎng)格帶來了全新的科研方法,新科研方法模式下出現(xiàn)了全新的科學(xué)交流方式;網(wǎng)絡(luò)環(huán)境的出現(xiàn)導(dǎo)致科研用戶的信息行為以及信息的需求都發(fā)生了深刻的變革,科研用戶的需求從原來的原始資源的需求轉(zhuǎn)變?yōu)橘Y源中知識的轉(zhuǎn)化,需求的類型也越來越多樣化,同時(shí)希望在享受資源的同時(shí)操作也能夠更加便捷。
隨著時(shí)代的發(fā)展,網(wǎng)格環(huán)境下的數(shù)字圖書館功能必將被進(jìn)一步開拓和發(fā)展,本文主要以異構(gòu)資源作為切入點(diǎn),重點(diǎn)研究其元數(shù)據(jù)問題、資源整合問題以及異構(gòu)資源同構(gòu)化問題。
1.1元數(shù)據(jù)是組織網(wǎng)絡(luò)信息資源的有效工具
所謂的元數(shù)據(jù),指的是數(shù)據(jù)之下的數(shù)據(jù),也就是最原始的數(shù)據(jù)。無論是在任何一種環(huán)境下,元數(shù)據(jù)都是有效的信息資源組織工具,都是利用信息資源的關(guān)鍵部分。網(wǎng)格信息資源包括數(shù)據(jù)、元數(shù)據(jù)、指針3部分,指針是一種工具,用來表示數(shù)據(jù);元數(shù)據(jù)是數(shù)據(jù)集,用來表示數(shù)據(jù)特征;數(shù)據(jù)是儲存在數(shù)字圖書館中的基本信息資源。在數(shù)字圖書館中,元數(shù)據(jù)十分重要,元數(shù)據(jù)主要描述的內(nèi)容包括是什么、什么時(shí)候、在哪、為什么等。以DC的元數(shù)據(jù)為例,其主要組成部分為:作者、主題、標(biāo)題。通過搜索,可以找到不同格式的元數(shù)據(jù),由于元數(shù)據(jù)的格式較多,因此,為了提高搜索效率,在搜索引擎內(nèi)設(shè)置了大量元數(shù)據(jù)模板,甚至可以搜索到格式不常見的元數(shù)據(jù)。除了上述分析之外,元數(shù)據(jù)還需要對數(shù)量、區(qū)域、距離等內(nèi)容進(jìn)行描述。數(shù)字圖書館因?yàn)槠渌峁┱咚幁h(huán)境的不同,因此,在描述網(wǎng)絡(luò)信息資源時(shí)需要詳盡描述信息資源所處的位置。
1.2元數(shù)據(jù)在數(shù)字圖書館中的有效應(yīng)用
(1)元數(shù)據(jù)的創(chuàng)建。在數(shù)據(jù)的搜索與創(chuàng)建階段,元數(shù)據(jù)等信息備被以HTML,SGML等形式放置到信息資源之中。在網(wǎng)格信息資源的整個(gè)生命周期之內(nèi),元數(shù)據(jù)的信息不是一成不變的,而是隨著信息資源的變化而變化的,并保證網(wǎng)絡(luò)系統(tǒng)能夠快速找到精準(zhǔn)的信息。
(2)元數(shù)據(jù)的搜集。在發(fā)現(xiàn)網(wǎng)格數(shù)字圖書館信息資源的階段,搜集元數(shù)據(jù)可以迅速在信息龐大的資源中找到有效信息。元數(shù)據(jù)的格式有不同的類型,在專用的搜索引擎之內(nèi)能夠找到不常用格式的元數(shù)據(jù)。
(3)元數(shù)據(jù)間的映射。MARC,TEL等格式的元數(shù)據(jù)能夠通過傳輸協(xié)議將他們的數(shù)據(jù)語句與元素等進(jìn)行轉(zhuǎn)化,達(dá)到語義與結(jié)構(gòu)相互兼容的目的。
(4)元數(shù)據(jù)與系統(tǒng)的建立。網(wǎng)格環(huán)境下元數(shù)據(jù)倉庫的技術(shù)基礎(chǔ)為因特網(wǎng)與網(wǎng)格技術(shù)。這種技術(shù)背景下建立的元數(shù)據(jù)倉庫不僅具有傳統(tǒng)圖書館的檢索系統(tǒng),而且具有數(shù)字圖書館的信息資源檢索系統(tǒng)。網(wǎng)格技術(shù)能夠?qū)⑺械姆植际綌?shù)據(jù)館藏以及信息資源連接成一個(gè)虛擬源數(shù)據(jù)的館藏,通過數(shù)據(jù)館藏實(shí)現(xiàn)元數(shù)據(jù)的建立、映射以及檢索。用戶則可以通過網(wǎng)絡(luò)查詢網(wǎng)格中的信息資源,并通過對元數(shù)據(jù)信息的查詢,找到信息資源的實(shí)體。
1.3元數(shù)據(jù)在數(shù)字圖書館中的服務(wù)流程
為了實(shí)現(xiàn)異構(gòu)資源的有機(jī)整合,就需要建立一個(gè)公用的數(shù)據(jù)庫信息中心,使用者能夠通過統(tǒng)一的網(wǎng)址進(jìn)行透明的不同數(shù)據(jù)庫的訪問。在網(wǎng)格中,每一個(gè)數(shù)據(jù)庫都有指定的網(wǎng)格服務(wù)保證原數(shù)據(jù)的采集以及注冊,并通過網(wǎng)格服務(wù)以及監(jiān)測查詢作為中間層從而實(shí)現(xiàn)對元數(shù)據(jù)的管理以及查詢的功能??蛻舳擞卸喾N形式,可以是應(yīng)用程序也可以是Web的瀏覽器,后臺的數(shù)據(jù)庫異構(gòu)性被屏蔽,并由統(tǒng)一的服務(wù)接口進(jìn)行訪問,用戶并不需要關(guān)心數(shù)據(jù)庫到底采用哪種類型以及何種訪問的方式。
如何實(shí)現(xiàn)網(wǎng)格環(huán)境下數(shù)字圖書館異構(gòu)資源的有效整合,是網(wǎng)絡(luò)環(huán)境下數(shù)字圖書館信息資源管理重點(diǎn)需要解決的問題。網(wǎng)格環(huán)境下的數(shù)字圖書館包含著多種多樣的信息格式內(nèi)容,信息具有分散性,并且是比較獨(dú)立松散的信息空間,每一信息空間都依照自己的方式進(jìn)行元數(shù)據(jù)的集中,信息檢索模型的建立以及對計(jì)費(fèi)方式的設(shè)定等都不相同,因此要實(shí)現(xiàn)跨庫檢索是一件很困難的事情,跨庫檢索要將這些獨(dú)立的元數(shù)據(jù)以及檢索方式等等集中到一塊,提高數(shù)據(jù)的檢索效率,簡單來說也就是將所有的數(shù)據(jù)庫系統(tǒng)進(jìn)行集成,便于使用者進(jìn)行檢索。
2.1 網(wǎng)格環(huán)境下的數(shù)字圖書館資源
將數(shù)字圖書館中大量的、分散的信息資源進(jìn)行有效整合,集中到一塊是數(shù)字圖書館網(wǎng)格思考的問題。網(wǎng)格要實(shí)現(xiàn)資源的最大塊連通,連通的內(nèi)容包括計(jì)算資源、存儲資源以及軟件資源等。
2.2構(gòu)造異構(gòu)資源統(tǒng)一檢索辦法
數(shù)字圖書館發(fā)展得越來越快,圖書館信息資源的不斷增多,然而因?yàn)楦鱾€(gè)數(shù)據(jù)庫都有自身的檢索界面、檢索方式,因此用戶在進(jìn)入到不同的檢索庫中都需要進(jìn)行身份驗(yàn)證,頻繁的登入或登出。這種情況下即使經(jīng)常使用圖書館資源的用戶也不免抱怨,在信息資源的海洋面前望而卻步。因此圖書館的大量資源并沒有被有效利用,如何讓用戶使用多個(gè)數(shù)據(jù)庫的集成資源跟檢索,保證圖書館的信息資源被最大程度上的使用成為關(guān)鍵。為了解決這個(gè)問題,各大圖書館都在開發(fā)Web的跨庫檢索系統(tǒng)。
2.2.1不同圖書館數(shù)據(jù)庫檢索界面類型
羅列型。這種檢索的界面是將所有的電子資源進(jìn)行羅列,之后讓讀者自己去選擇一種資源進(jìn)行注冊、登錄,隨后輸入檢索詞語進(jìn)行檢索,之后換成另外一種檢索庫進(jìn)行檢索,重新進(jìn)行注冊登錄。如果電子資源的種類偏少的情況下,用戶還不覺得十分的繁瑣,但是如果需要大量的且在不同數(shù)據(jù)庫的電子資源,則很麻煩,造成很多用戶不愿意繼續(xù)使用電子圖書館進(jìn)行資源的檢索。
導(dǎo)航型。導(dǎo)航型是對羅列型的發(fā)展,導(dǎo)航型的數(shù)據(jù)庫根據(jù)用戶的使用習(xí)慣以及需求類型等進(jìn)行分類。分類方法主要包括以下幾種:字母順序類,主體范圍類,學(xué)科類型類,這幾種類別建立一個(gè)導(dǎo)航系統(tǒng),之后用戶根據(jù)這幾種類別對應(yīng)的電子資源進(jìn)行內(nèi)容檢索。導(dǎo)航型具有很強(qiáng)的學(xué)科性質(zhì),對電子資源的類別進(jìn)行劃分,用戶根據(jù)不同的類別進(jìn)行資源的查詢,并以此登錄到每個(gè)數(shù)據(jù)庫的網(wǎng)站,進(jìn)行信息資源的查詢。這種分類的方法有很大局限性,對學(xué)科不了解的用戶來說用處不大。因此采用導(dǎo)航系統(tǒng)的都是有些對電子圖書館使用較多的重點(diǎn)高校,此種類型能夠有效節(jié)省用戶的檢索時(shí)間,實(shí)現(xiàn)一站式的檢索。
2.2.2網(wǎng)格環(huán)境下的異構(gòu)跨庫檢索系統(tǒng)架構(gòu)
電子圖書館是由一系列數(shù)字資源和應(yīng)用系統(tǒng)構(gòu)成的。在實(shí)際工作中可以將數(shù)字圖書館操作劃分為兩個(gè)方面:一是數(shù)字悺必須合理解決多個(gè)應(yīng)用系統(tǒng)構(gòu)成以及其與異構(gòu)資源的集成;二是不同數(shù)字圖書館之間進(jìn)行相互操作的關(guān)系。數(shù)字圖書館在網(wǎng)格環(huán)境下劃分為兩個(gè)主要構(gòu)成部分:一是兩個(gè)或者兩個(gè)以上的圖書館與單個(gè)圖書館之間的交互操作交換。在互聯(lián)網(wǎng)環(huán)境中,數(shù)字圖書館的重點(diǎn)是對眾多用戶和諸多資源進(jìn)行支持和服務(wù)。多個(gè)圖書館在網(wǎng)格環(huán)境下研究的主要內(nèi)容集中在圖書館之間的相互操作、集成方式,甚至對分布式用戶訪問支持方式服務(wù)能力。
基于互聯(lián)網(wǎng)環(huán)境的數(shù)字圖書館建設(shè)應(yīng)以O(shè)GSA規(guī)范為標(biāo)準(zhǔn),在數(shù)字圖書館資源領(lǐng)域?qū)W(wǎng)格計(jì)算資源管理能力予以適當(dāng)?shù)剡\(yùn)用,同時(shí)保障組織模型的開放性、重用性與互操作性等特征。模型可以從3個(gè)層面進(jìn)行子模塊的設(shè)置,分別為分布資源層、網(wǎng)格服務(wù)層與知識服務(wù)層。模型的最下層應(yīng)將圖書館的分布式數(shù)字資源囊括在內(nèi),借助于網(wǎng)格服務(wù)層,可以對這些資源進(jìn)行虛擬整合。
網(wǎng)絡(luò)服務(wù)層包括網(wǎng)絡(luò)基礎(chǔ)架構(gòu)和統(tǒng)一資源空間兩大部分,網(wǎng)格基礎(chǔ)架構(gòu)主要調(diào)度和整合信息資源及服務(wù),自上而下包括信息服務(wù)層、數(shù)據(jù)服務(wù)層及計(jì)算服務(wù)層。信息服務(wù)層的主要作用是提供了統(tǒng)一的用戶服務(wù)接口,通過這個(gè)接口可以相互訪問不同的異構(gòu)數(shù)據(jù)資源,在訪問過程中,元數(shù)據(jù)這一描述信息和異構(gòu)信息整合的數(shù)據(jù)集顯得尤為重要。該層提供的服務(wù)根據(jù)系統(tǒng)需求會有有變化。數(shù)據(jù)服務(wù)層的主要服務(wù)內(nèi)容是通過分布式信息資源集中計(jì)算與分析管理共享信息資源,其主要內(nèi)容是管理數(shù)據(jù)存儲、元數(shù)據(jù)的管理及傳遞管理等。計(jì)算服務(wù)層主要提供的服務(wù)內(nèi)容為資源發(fā)現(xiàn)以及分配和資源的監(jiān)控電能。統(tǒng)一資源空間主要包含統(tǒng)一的資源配置以及統(tǒng)一元數(shù)據(jù)描述,主要負(fù)責(zé)資源與服務(wù)之間的整合。知識服務(wù)層主要的作用是整合虛擬資源,資源整合之后通過知識服務(wù)層為用戶提供服務(wù),不斷優(yōu)化統(tǒng)一資源存儲及檢所運(yùn)行的模式。
關(guān)于網(wǎng)格環(huán)境下數(shù)字圖書館異構(gòu)資源的整合,本文建立了一站式檢索的模型。一站式檢索用戶只需要在使用資源的時(shí)候輸入檢索詞,之后便能在多個(gè)電子資源中檢索到自己所需要的信息,不需要在多個(gè)數(shù)據(jù)庫中進(jìn)行切換,反復(fù)的登錄或登出。通過簡單快捷的操作就能夠一步到位地檢索到需要的信息,是今后電子資源檢索的發(fā)展趨勢。
[1]畢強(qiáng),沈涌.數(shù)字圖書館網(wǎng)格信息資源組織模式研究.[J].圖書情報(bào)工作,2007(8):10-14.
[2]李曉嫻,劉杰.上海研發(fā)公共服務(wù)平臺子系統(tǒng)間協(xié)同機(jī)制研究[J].科技政策與管理,2006(10):31-34.
[3]胡素青.大數(shù)據(jù),向巔峰出發(fā)[J].金融科技時(shí)代,2012(9):20-23.
[4]楊海燕.大數(shù)據(jù)時(shí)代的圖書館服務(wù)淺析[J].圖書與情報(bào),2012(4):120-122.
Integrated analysis of the digital library of heterogeneous resources in grid environment
Liu Fang, Lu Guoqiang, Wang Linlin
(Mudanjiang Medical University, Mudanjiang 157011, China)
This paper introduces the search type digital library grid environment heterogeneous resources, then focus on the analysis of the meta data and resource integration and grid environment heterogeneous resources digital library is omorphism problem and concluded under the overall coordination of grid environment background digital Library construction and the future of digital Library.
digital libraries; network environment; heterogeneous resources
2015年黑龍江省社科規(guī)劃項(xiàng)目;項(xiàng)目名稱:基于中蒙俄地域優(yōu)勢的區(qū)域館際互借系統(tǒng)建設(shè)研究;項(xiàng)目編號:15TQE02。2016年度黑龍江省藝術(shù)科學(xué)規(guī)劃項(xiàng)目;項(xiàng)目名稱:數(shù)字圖書館中異構(gòu)資源共享平臺的研究;項(xiàng)目編號:2016C043。
劉芳(1983— ),女,黑龍江牡丹江,本科,講師;研究方向:數(shù)據(jù)庫,情報(bào)學(xué)。