(湖南工程學院圖書館湘潭411104)
【摘要】數(shù)字圖書館信息體系結(jié)構(gòu)的主要構(gòu)件是數(shù)字對象、句柄和倉儲。數(shù)字圖書館由
數(shù)字對象構(gòu)成,對象存儲在倉儲中并用句柄來標識。數(shù)字圖書館提供包括名錄服務(wù)、索引服務(wù)、倉儲服務(wù)和館藏服務(wù)在內(nèi)的一組核心服務(wù)。
【關(guān)鍵詞】數(shù)字圖書館;體系結(jié)構(gòu);數(shù)字對象;句柄;倉儲
【分類號】G250
數(shù)字圖書館的基本目標是創(chuàng)造一個良好的信息環(huán)境,通過互聯(lián)網(wǎng)提供對分布式存儲信息
的知識化組織、智能化訪問和服務(wù)。但這些分散存儲而又各自獨立的信息倉儲具有各自不同的組織、描述和檢索方式。網(wǎng)絡(luò)環(huán)境下跨倉儲的、統(tǒng)一的、高效的訪問和利用工具,以及高質(zhì)量信息的生成、組織和提取成為數(shù)字圖書館的研究重點。如果把Intemet看成是一個巨大的無墻圖書館,數(shù)字圖書館的目標就是要優(yōu)化Intemet的信息存儲結(jié)構(gòu),提供一致的檢索接口,使整個網(wǎng)絡(luò)成為一個虛擬的、單一的、有組織、有結(jié)構(gòu)的信息集合,實現(xiàn)跨倉儲的無縫檢索。要實現(xiàn)這一目標有以下兩個方面問題,它們也是廣義數(shù)字圖書館的信息體系結(jié)構(gòu)所研究的主要問題。
第一,數(shù)字對象的組織結(jié)構(gòu)。數(shù)字對象是數(shù)字倉儲中表示信息的基本邏輯單位,如一篇文章、一張圖片、一部音樂作品或是一段影像。數(shù)字對象的信息結(jié)構(gòu)是數(shù)字圖書館的基本問題,它決定著進一步的信息組織、處理和利用方式。
第二,分布式信息倉儲的組織結(jié)構(gòu)。數(shù)字圖書館的收藏可以特指本地的信息倉儲,也可以是互連的信息倉儲的集合。數(shù)字圖書館應(yīng)建立一個統(tǒng)一的、互操作的、可擴展的組織框架.
將分布互連的信息倉儲集成為一個整體,在此基礎(chǔ)上提供高質(zhì)量的信息服務(wù),如屏蔽各倉儲的差異,提供統(tǒng)一的服務(wù)接口、語義化檢索、智能代理等。
1. 數(shù)字圖書館信息的體系結(jié)構(gòu)框架
按照Carl Lagoze和Sandra Payette的定義:數(shù)字圖書館是由數(shù)字對象構(gòu)成的館藏(內(nèi)容)和與數(shù)字對象的存儲、發(fā)現(xiàn)、檢索和保存有關(guān)的服務(wù)(功能)。數(shù)字圖書館具有開放的體系結(jié)構(gòu)(0pen architecture),其含義是指將數(shù)字圖書館的整個功能劃分為一組定義明確的服務(wù),每一種服務(wù)都通過一種定義明確的協(xié)議來訪問。數(shù)字圖書館的體系結(jié)構(gòu)為數(shù)字圖書館提供了其必須具備的基本功能,即一組核心服務(wù)。數(shù)字圖書館核心服務(wù)具有如下主要特征:(1)數(shù)字圖書館基礎(chǔ)結(jié)構(gòu)中的內(nèi)容以數(shù)字對象的形式存儲。(2)數(shù)字對象通過永久性的全局惟一的名稱(URN)進行識別,URN(統(tǒng)一資源名稱)由命名服務(wù)器注冊。一個獨立的名錄服務(wù)器能將URN解析一個或多個由URN標識的數(shù)字對象位置。(3)倉儲服務(wù)系統(tǒng)提供數(shù)字對象的存儲和訪問機制。倉儲包含數(shù)字對象。如果一個數(shù)字對象的URN。。解析成相應(yīng)的倉儲,則認為該數(shù)字對象包含在此倉儲中,從而只有通過向相應(yīng)的倉儲發(fā)送服務(wù)請汞才能訪問該數(shù)字對象。(4)索引服務(wù)系統(tǒng)提供數(shù)字對象的發(fā)現(xiàn)機制,由索引服務(wù)器對數(shù)字對象組的信息進行索引。向索引服務(wù)器提交查詢式可返回含有與查詢式匹配的數(shù)字對象的URN的結(jié)果集,客戶或代理然后將這些URN提交至名錄服務(wù)器以訪問相應(yīng)的數(shù)字對象。(5)館藏服務(wù)系統(tǒng)提供將數(shù)字對象組匯聚成有用館藏的機制。館藏服務(wù)器按下列方式創(chuàng)建館藏:掃描一組索引服務(wù),讀取其元數(shù)據(jù)并應(yīng)用館藏定義標準來決定索引服務(wù)器標引的哪些數(shù)字對象可以作為館藏元素。(6)用戶接口網(wǎng)關(guān)提供數(shù)字圖書館以人為中心的入口。每個用戶接口網(wǎng)關(guān)使用由館藏服務(wù)器提供的信息來檢索和訪問這些館藏中的數(shù)字對象。用戶接El網(wǎng)關(guān)也使用館藏服務(wù)器和索引服務(wù)器提供的信息來制定檢索策略。
2數(shù)字對象系統(tǒng)
數(shù)字圖書館信息體系結(jié)構(gòu)的主要構(gòu)件是數(shù)字對象、句柄和倉儲。數(shù)字圖書館由數(shù)字對象
構(gòu)成,它們存儲在倉儲中,用句柄來標識;存儲在數(shù)字對象中的信息稱為內(nèi)容,內(nèi)容被分成數(shù)據(jù),關(guān)于數(shù)據(jù)的信息叫做屬性或稱為元數(shù)據(jù)。在數(shù)字圖書館中,信息以數(shù)字對象作為基本實體進行存儲、訪問、發(fā)送和管理。分布式數(shù)字對象服務(wù)框架按照一定的命名規(guī)則來標識和定位數(shù)字對象、提供使用數(shù)字對象名字來定位和發(fā)送對象的服務(wù),并提供有關(guān)的訪問協(xié)議。在分布式數(shù)字對象系統(tǒng)的體系結(jié)構(gòu)中,一個擁有數(shù)字材料的用戶要使該材料供系統(tǒng)使用,首先應(yīng)將材料放入數(shù)字對象。一個數(shù)字對象是一個數(shù)據(jù)結(jié)構(gòu),它主要包括:數(shù)字材料(或數(shù)據(jù)),以及句柄它是該材料的惟一標識符。用戶請求從授權(quán)的句柄生成器獲得一個句柄,隨后,將數(shù)字對象存入一個或多個倉儲中,從而該數(shù)字對象可為他人所用。把數(shù)字對象存入倉儲時,應(yīng)將其句柄和倉儲名向一個全局的句柄注冊系統(tǒng)注冊。以后,用戶向句柄服務(wù)器提交一個句柄可獲得存放相應(yīng)數(shù)字對象的網(wǎng)絡(luò)名或倉儲地址。
3倉儲服務(wù)系統(tǒng)
倉儲是一種可通過網(wǎng)絡(luò)訪問的存儲系統(tǒng),其中存儲的數(shù)字對象可被存取和檢索。倉儲除了包含數(shù)字對象,也包含了其他相關(guān)信息、服務(wù)和管理信息。倉儲具有一個正式的、惟一的名稱,由一個全局命名授權(quán)(Global Naming Authority)分配和批準。倉儲的實現(xiàn)采用三層結(jié)構(gòu)。第1層:倉儲外殼。它是倉儲與外界的接口部分,它實現(xiàn)了倉儲訪問協(xié)議(RAP),實現(xiàn)了數(shù)字對象的內(nèi)外格式轉(zhuǎn)換,并管理用戶權(quán)限和訪問許可。第2層:對象管理層。它在永久存儲層所提供的服務(wù)和倉儲外殼層所要求的面向?qū)ο蠊δ苤g提供一種接口,并提供數(shù)字對象及其所在位置之間的映射。第3層永久存儲層。倉儲中的信息保存在永久存儲層。永久存儲層的實現(xiàn)對外界是完全透明的。倉儲外殼的設(shè)計可適應(yīng)各種永久存儲層。倉儲訪問協(xié)議是每個倉儲都必須支持的。目前RAP支持存放數(shù)字對象,通過句柄訪問數(shù)字對象并提供下列倉儲服務(wù):在一個倉儲中存入一個數(shù)字對象;從一個倉儲中刪除一個數(shù)字對象;確認倉儲中已存有一個帶有特定句柄的數(shù)字對象;訪問一個倉儲的數(shù)字對象;訪問一個指定數(shù)字對象的元數(shù)據(jù);修改倉儲中的一個數(shù)字對象的元數(shù)據(jù);修改倉儲中的一個數(shù)字對象的數(shù)據(jù);確認一個句柄已在句柄系統(tǒng)中注冊;訪問倉
儲元數(shù)據(jù)(Access Repo Meta)。
4名錄服務(wù)系統(tǒng)
名字是數(shù)字對象的重要替代信息。名錄服務(wù)系統(tǒng)的功能是負責數(shù)字對象名字的創(chuàng)建、解
析和管理。名錄服務(wù)系統(tǒng)包括開放的句柄協(xié)議、名字空間和句柄協(xié)議的具體實現(xiàn)。分布式的
計算機管理系統(tǒng)可以存儲數(shù)字資源的名字即句柄通過句柄協(xié)議可以將句柄解析成數(shù)字資
源所在倉儲的位置,從而使用戶或代理可以通過句柄訪問和使用這些資源。資源的位置發(fā)生
改變時,句柄不改變,因而資源的名字是永久性的。句柄系統(tǒng)即名錄服務(wù)系統(tǒng)采用層次服務(wù)模型。項層是一個全局句柄注冊系統(tǒng),底層是多個句柄服務(wù)系統(tǒng),它們共同構(gòu)成名錄服務(wù)系統(tǒng)負責句柄的創(chuàng)建、解析和刪除。全局句柄注冊系統(tǒng)用于管理句柄命名的名字空間,是一個集中管理的注冊服務(wù)。所有的命名授權(quán)必須用全局句柄注冊系統(tǒng)注冊。局部句柄服務(wù)系統(tǒng)管理在其命名授權(quán)下的所有旬柄,為這些局部名字提供解析和管理服務(wù)。局部句柄服務(wù)系統(tǒng)與多個倉儲相關(guān)聯(lián),實現(xiàn)倉儲與名錄服務(wù)系統(tǒng)的交互。
5索引服務(wù)系統(tǒng)
索引服務(wù)系統(tǒng)是數(shù)字圖書館信息基礎(chǔ)結(jié)構(gòu)的一個重要組成部分,其任務(wù)是進行資源發(fā)現(xiàn),從而使用戶能夠方便地從館藏中尋找和發(fā)現(xiàn)所需的對象。索引服務(wù)系統(tǒng)的工作原理是:索引服務(wù)器收集關(guān)于數(shù)字對象的信息,這些信息可以是數(shù)字對象的替代信息如傳統(tǒng)圖書館的編目記錄,或者是對象的全部內(nèi)容如全文搜索引擎使用的全文信息。這些替代信息被組織成結(jié)構(gòu)化的索引,使搜索引擎在響應(yīng)查詢請求時能保證查準率、查全率和檢索效率。查詢請求的響應(yīng)是一個結(jié)果集,結(jié)果集中的每一條檢索結(jié)果都是與查詢請求相匹配的數(shù)字對象的替代信息,替代信息的簡略形式是數(shù)字對象的惟一標識符;通過名錄服務(wù)系統(tǒng)解析該標識,就可以訪問相應(yīng)的數(shù)字對象。未來的中國數(shù)字圖書館應(yīng)是一個聯(lián)邦數(shù)字圖書館,其成員館具有各自不同的館藏內(nèi)容和服務(wù),具有各自不同的信息組織和描述方式。以上闡述的數(shù)字圖書館的信息體系結(jié)構(gòu)為解決異構(gòu)數(shù)據(jù)庫的檢索、實現(xiàn)跨庫無縫檢索提供了一種有效途徑。
參考文獻:
1唐世渭,楊冬青等.數(shù)字圖書館的體系結(jié)構(gòu).計算機世界
2王軍.數(shù)字圖書館體系結(jié)構(gòu)比較研究.大學圖書館學報
3劉煒,張亮.數(shù)字圖書館的體系結(jié)構(gòu)與元數(shù)據(jù)方案.情報學報
作者簡介:謝芳紅,女,1968.8生,湖南工程學院圖書館,助理館員,研究方向:信息資源管理,