新疆 李森
有關SRU/W和OAI信息檢索協(xié)議的使用研究
新疆 李森
為解決不同數(shù)據(jù)結構信息資源的檢索、集成和共享的問題,先后有一些相關的協(xié)議開發(fā)應用,其中SRU/W和OAI是其中具有代表性的協(xié)議,本文根據(jù)兩個協(xié)議的特點從提出時間、最新版本、與用戶的上下文相關敏感性、請求/響應中是否帶版本號、傳輸機理、服務提供方的工作、對于大規(guī)模響應信息的處理、體系結構、對元數(shù)據(jù)格式的要求的等幾個方面進行研究并相互比較,最后對這兩個協(xié)議的協(xié)同使用進行深入分析,為使用者在應用中提供了相關理論依據(jù)。
SRU/W協(xié)議;OAI協(xié)議;協(xié)同使用
SRU/W和OAI就是具有一定代表性的協(xié)議。SRU/W和OAI是幾乎在同一時間由不同的組織基于不同的應用背景所開發(fā)的信息檢索協(xié)議。SRU/W是為了解決之前信息檢索協(xié)議過于復雜,無法直接與WEB連接等問題而提出的下一代協(xié)議的一個組成部分,SRW根據(jù)最近WEB技術的發(fā)展,提出的一個基于WEB服務(WEBService)的信息檢索協(xié)議。OAI是在原有信息檢索協(xié)議基礎上進行改進,其目標是通過元數(shù)據(jù)收獲這種模式實現(xiàn)在Web上發(fā)布信息的不同組織(主要在歐美等地)之間的互操作,形成一個與應用無關的互操作框架,是一項簡單、靈活的元數(shù)據(jù)互操作協(xié)議,OAI支持選擇性的收割方式,適合于系統(tǒng)間元數(shù)據(jù)的循環(huán)交換。
以上兩種協(xié)議都是為了解決分布、異構的數(shù)據(jù)資源的檢索、集成和共享問題提出的,它們之間存在著相同點和不同點,本文根據(jù)實際工作情況對這兩個協(xié)議進行比較,并對這兩個協(xié)議的協(xié)同使用進行研究,其研究的目的是如何將這兩個協(xié)議結合起來,發(fā)揮各自的優(yōu)點,從而實現(xiàn)數(shù)字信息的資源的更好地集成和共享。
SRW是一個針對WEB應用的信息檢索協(xié)議,提供基于Web Services的各種用戶訪問機制,它定義了一個通用的、抽象的模型,各個系統(tǒng)可以將其具體實現(xiàn)映射到該抽象模型上,實現(xiàn)了不同網(wǎng)絡資源、分布式數(shù)據(jù)庫的統(tǒng)一檢索功能。SRW的設計一方面根據(jù)了Z39.50信息檢索通訊協(xié)議標準,另一方面運用了現(xiàn)有的技術基礎如SOAP、XPath等。SRW使用的是模塊化的整合方式。更進一步說,SRW設計的理念是將信息檢索視為各種查詢檢索服務的集合。
OAI的設計思路和核心思想相對容易和簡單:在HTTP協(xié)議的基礎上,制定了一些命令動詞,其中主要應用的有6個命令動詞,這6個命令動詞中,有三個是用來揭示知識庫的特征(ListSets、Identify、ListMetadataFormats),另外三個是用來從知識庫中提取元數(shù)據(jù)(GetRecord、ListRecords、ListIdentifiers)。
SRU/W和OAI都是為了解決信息資源檢索的整合和共享而提出的解決方案,它們之間存在著相同點和不同點。根據(jù)兩個協(xié)議提出時間最新版本、響應中是否帶版本號、上下文相關敏感性、傳輸機理、服務提供方的工作、響應信息的處理等幾個方面作出相應的比較。比較結果如表1所示。
表 1:OAI、SRU/W 的比較
對于二者的協(xié)同使用中,單純依靠任何一種協(xié)議方式不能滿足數(shù)字信息檢索中的分布、異構資源的整合、共享需求,為了能夠為信息檢索用戶提供的流暢的信息檢索服務,需要將這些協(xié)議結合起來使用。
SRW與OAI可以通過特定的接口結合使用,根據(jù)需要再實現(xiàn)OAI元數(shù)據(jù)收割接口。在OAI框架中,為了提供能夠響應OAI請求,數(shù)據(jù)提供者必須為找到能夠與其現(xiàn)有數(shù)據(jù)庫配置相匹配的OAI實現(xiàn)。OCLCOAIcat通過對數(shù)據(jù)庫引擎、數(shù)據(jù)存儲格式映射機制進行抽象,可以為任意數(shù)據(jù)庫系統(tǒng)建立OAI元數(shù)據(jù)接口,實現(xiàn)基于OAI-PHM2.0協(xié)議的元數(shù)據(jù)開放。但開發(fā)能夠訪問不同數(shù)據(jù)庫的應用程序不僅僅是OAI實現(xiàn)所需要解決的問題。理想的解決方案是具有一個能夠工作于不同的數(shù)據(jù)庫配置的標準檢索API,可以考慮采用SRU/W來實現(xiàn)。
目前對于用OAI所收割的元數(shù)據(jù)集,存在著多種檢索服務Web接口,每種檢索服務都有自己的查詢語法和服務規(guī)范,這種狀況不利于集成檢索。為了解決這一問題,可以為通過OAI所收割的元數(shù)據(jù)提供SRU/W檢索接口,使得用戶可以直接通過SRU/W接口實現(xiàn)對OAI元數(shù)據(jù)集的檢索。這一思想及模型目前已在資源發(fā)現(xiàn)網(wǎng)絡(Resource Discovery Network),歐洲圖書館(The European Library)等項目中加以利用,這一模型同時也是幾個大規(guī)模系統(tǒng)架構的基礎,如Andy Powell所描述的JISC信息環(huán)境。
本文對數(shù)字圖書館中實現(xiàn)分布、異構資源的集成、共享的兩種協(xié)議(OAI、SRU/W)進行了介紹和比較。雖然兩個協(xié)議對于同一個問題采用了不同的解決方式,但兩個協(xié)議可以互為補充,協(xié)同使用,來更好地實現(xiàn)數(shù)字圖書館資源的整合和共享。
SRU/W and OAI are protocols for retrieval,integration and sharing of distributed and heterogeneous resources.Firstlythe twoprotocols are introduced,and then the two protocols are compared from creation time,new protocol version,user context-sensitive,transport mechanism,work of service provider and architecture etc.,finally,Implementations ofCooperation oftwoprotocols are analyzed.
SRU/W protocol;comparison study;implementation ofCooperation
(作者單位:新疆石河子職業(yè)技術學院計算機系)
(編輯呂智飛)