国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

異構(gòu)資源統(tǒng)一檢索平臺的研究

2009-11-19 09:16徐玲芳羅丹梅
現(xiàn)代情報 2009年9期

徐玲芳 羅丹梅

〔摘 要〕通過對異構(gòu)資源統(tǒng)一檢索平臺深入研究的基礎(chǔ)上,歸納了可用于實現(xiàn)統(tǒng)一檢索的技術(shù),并對現(xiàn)有的一些檢索平臺進(jìn)行了分析和比較。在此基礎(chǔ)上對如何完善異構(gòu)資源統(tǒng)一檢索平臺提出了建議。

〔關(guān)鍵詞〕統(tǒng)一檢索;異構(gòu)資源;檢索平臺

〔中圖分類號〕G250 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2009)09-0173-02

Research on the Unified Searching Platforms of Heterogeneous ResourceXv Lingfang Luo Danmei

(Library,Jiangsu University,Zhenjiang 212013,China)

〔Abstract〕This paper researched on the unified searching platforms of heterogeneous resources.After generalizing the techniques of unified searching and discussing the existing platforms,some advices were brought forward to prefect the unified searching platforms of heterogeneous resource.

〔Key words〕unified searching;heterogeneous resource;searching platforms

數(shù)字化信息資源由于其方便快捷的獲取、高查全率、不受限制等優(yōu)點(diǎn),廣受用戶的青睞,越來越多的人開始通過網(wǎng)絡(luò)來獲取他們所需要的信息[1]。

但是書目數(shù)據(jù)庫、題錄、文摘數(shù)據(jù)庫、全文數(shù)據(jù)庫、電子期刊和相關(guān)網(wǎng)站等各類數(shù)字資源品目繁雜,各類數(shù)據(jù)資源的存儲和讀取格式也不盡相同,具有分布式、異構(gòu)性、訪問方式各異和檢索界面多樣化等特點(diǎn)。人們忙碌于在各類數(shù)據(jù)庫中徘徊,忙碌于對各種用戶界面和檢索規(guī)則的熟悉,忙碌于不同格式數(shù)字資源的讀取。如何快速、便捷地找到并讀取所需要的信息成為焦點(diǎn)。人們希望能夠?qū)⑦@些資源與服務(wù)整合為一體,實現(xiàn)跨平臺的無縫鏈接。用戶只需一個檢索指令在一個統(tǒng)一的界面上一次查得所需文獻(xiàn)或信息[2]。如何將不同類型、不同結(jié)構(gòu)、不同環(huán)境、不同用法的各類數(shù)據(jù)庫納入統(tǒng)一檢索系統(tǒng),使用戶能方便、高效地獲取信息已成為迫切需要解決的問題。

1 統(tǒng)一檢索實現(xiàn)原理

統(tǒng)一檢索是指采用統(tǒng)一的檢索界面,對所有資源實現(xiàn)跨庫跨平臺檢索,并將符合檢索要求的記錄一次性返回給讀者,從而解決在傳統(tǒng)獨(dú)立檢索環(huán)境下讀者檢索效率低下的問題[3]。這樣能夠?qū)Ξ悩?gòu)資源提供統(tǒng)一的檢索界面和檢索語言,提高資源的利用效率[4]。目前主要有基于特定協(xié)議和頁面分析技術(shù)兩種實現(xiàn)方式[3]。

1.1 基于特定協(xié)議技術(shù)

Z39.50協(xié)議[5]是一種客戶機(jī)、服務(wù)器體系間信息檢索的應(yīng)用層協(xié)議。其使用通用語言獲取信息,使客戶端和服務(wù)器之間通訊、操作標(biāo)準(zhǔn)化,提供了用戶界面與文獻(xiàn)資源數(shù)據(jù)庫服務(wù)器相分離的解決辦法,已廣泛應(yīng)用于分布式檢索系統(tǒng)中。但是該協(xié)議較復(fù)雜、學(xué)習(xí)難度大、開發(fā)困難、運(yùn)行成本較高。而且這種客戶機(jī)/服務(wù)器模式下的協(xié)議,不適合在Internet中推廣使用。這限制了其在統(tǒng)一檢索系統(tǒng)中的使用。

OpenURL(Z39.88)協(xié)議[6]是一種開放的信息資源與查詢服務(wù)之間的通信協(xié)議標(biāo)準(zhǔn),它通過規(guī)定的OpenURL框架規(guī)范對象的描述和傳輸,提供了在信息服務(wù)者之間傳遞對象元數(shù)據(jù)的格式。異構(gòu)資源可通過OpenURL協(xié)議對框架中各組件元素進(jìn)行注冊來實現(xiàn)相互通信。

OAI-PMH協(xié)議[5]以元數(shù)據(jù)收獲的方式,從數(shù)據(jù)提供者處獲取元數(shù)據(jù),存儲于本地的元數(shù)據(jù)庫,然后在本地數(shù)據(jù)庫基礎(chǔ)上向用戶提供基于元數(shù)據(jù)的統(tǒng)一檢索服務(wù)。該協(xié)議是基于輕量級別的相互操作,由于數(shù)據(jù)的收獲與倉儲的具體實現(xiàn)無關(guān),并不用開放其本地資源。因此,這種互操作框架較現(xiàn)實、可行,正逐步受到重視和應(yīng)用。

Dublin Core規(guī)范參照圖書館卡片目錄的模式,用來標(biāo)識電子資源的一種簡要目錄模式。它制定了15項廣義的元數(shù)據(jù)。全面簡潔地概括了電子資源的主要特征,涵蓋了資源的檢索點(diǎn)及有價值的說明性信息。這些元數(shù)據(jù)同時適用于各類電子化目錄,具有廣泛的實用性。符合Dublin Core協(xié)議規(guī)范的數(shù)據(jù)可以用HTML、XML或者RDF格式表示,這為它在Web環(huán)境下的傳輸提供了很大的方便,可以使用HTTP、SOAP或者其他傳輸協(xié)議來交換數(shù)據(jù)。

Google Web APIs規(guī)范定義了搜索查詢格式、搜索參數(shù)、過濾器、限制條件、輸入輸出編碼等,以XML格式返回結(jié)果,且有一定的包裝規(guī)范。隨著Google學(xué)術(shù)搜索的推出,利用或者整合Google學(xué)術(shù)搜索服務(wù)對于開發(fā)統(tǒng)一檢索系統(tǒng)具有一定的參考價值。

1.2 頁面分析技術(shù)

頁面分析技術(shù)是指通過對HTML頁面的分析,提取其中有價值的部分解析為結(jié)構(gòu)化信息,并作為進(jìn)一步處理的基礎(chǔ)[7]。頁面分析技術(shù)的應(yīng)用包括對檢索頁面的分析和對結(jié)果頁面的分析兩個方面。對檢索頁面的分析是指分析出資源系統(tǒng)的地址及檢索路徑、檢索字段、檢索表達(dá)式的構(gòu)成規(guī)則等;對結(jié)果頁面的分析是指分析出結(jié)果頁面中關(guān)鍵字段表示方法的規(guī)律,從而準(zhǔn)確地從頁面中提取關(guān)鍵字段的內(nèi)容。檢索系統(tǒng)根據(jù)讀者提交表單內(nèi)容構(gòu)造出各資源系統(tǒng)所對應(yīng)的檢索表達(dá)式,準(zhǔn)確地從資源系統(tǒng)返回的檢索結(jié)果中獲取關(guān)鍵字段內(nèi)容,輸出給讀者,實現(xiàn)統(tǒng)一檢索功能[3]。

2 目前已有的統(tǒng)一檢索庫分析

目前國內(nèi)許多圖書館都在進(jìn)行異構(gòu)數(shù)據(jù)統(tǒng)一檢索的研究,許多軟件公司也在開發(fā)類似系統(tǒng),已投入使用或正在測試的統(tǒng)一檢索平臺有清華同方異構(gòu)統(tǒng)一檢索平臺、CALIS統(tǒng)一檢索平臺、TRS資源整合門戶、復(fù)鑫跨庫檢索平臺、天宇異構(gòu)資源統(tǒng)一檢索平臺、Metalib/SFX系統(tǒng)、MAP數(shù)據(jù)庫資源系統(tǒng)等[8]。

清華同方異構(gòu)統(tǒng)一檢索平臺USP是一個智能化的網(wǎng)絡(luò)數(shù)據(jù)庫檢索平臺,通過統(tǒng)一的用戶界面,用戶可實現(xiàn)在多個網(wǎng)絡(luò)數(shù)據(jù)庫搜索平臺中信息檢索。該平臺提供簡單檢索、高級檢索兩種檢索方式,并提供二次檢索功能。數(shù)據(jù)庫可以按中文數(shù)據(jù)庫、外文數(shù)據(jù)庫分類,也可以按學(xué)科分類。對于可檢索數(shù)據(jù)庫和電子圖書,可以對篇名、作者、出版者、關(guān)鍵詞、機(jī)構(gòu)、刊名、全文、摘要、主題詞、企業(yè)名稱、負(fù)責(zé)人、經(jīng)營范圍、產(chǎn)品信息、產(chǎn)品關(guān)鍵詞等字段進(jìn)行檢索。圖書館用戶在查詢多個數(shù)據(jù)庫時不受Z39.50、OAI、OpenURL等協(xié)議的限制,任何數(shù)據(jù)庫和電子圖書都是統(tǒng)一檢索平臺的對象。

CALIS統(tǒng)一檢索系統(tǒng)是中國高等教育文獻(xiàn)保障系統(tǒng)中統(tǒng)一檢索平臺的一部分。該系統(tǒng)提供有簡單檢索、高級檢索兩種檢索方式,不僅支持全文檢索、相關(guān)度檢索,還支持多種檢索運(yùn)算符并提供了可擴(kuò)展的知識庫;可檢索的資源包括數(shù)據(jù)庫、電子期刊、電子圖書以及部分圖書館OPAC等,幾乎可整合圖書館所有電子資源種類;系統(tǒng)提供了多種資源定位和查找方式,可對篇名、作者、ISSN、文摘、來源等字段進(jìn)行檢索;能夠為用戶提供特別的檢索服務(wù),方便用戶精確定位信息。

TRS資源整合門戶提供簡單檢索、高級檢索兩種檢索方式。各數(shù)據(jù)庫的檢索字段可以不同,也可以在數(shù)據(jù)庫檢索字段的選擇菜單中設(shè)置,支持不同目標(biāo)資源的特定檢索條件??蓪?shù)據(jù)庫、電子期刊、圖書館OPAC以及網(wǎng)上免費(fèi)資源等類型進(jìn)行檢索,可按學(xué)科等方式進(jìn)行資源分類。

復(fù)鑫跨庫檢索平臺提供簡單檢索、組合檢索兩種檢索方式。可檢索的資源類型有數(shù)據(jù)庫、電子圖書、圖書館館藏OPAC等,可對篇名、作者、關(guān)鍵詞、全文、摘要、語言、發(fā)布日期、來源等字段進(jìn)行檢索。資源定位可按學(xué)科、國別或用途分類。

天宇異構(gòu)資源統(tǒng)一檢索平臺提供普通檢索和高級檢索兩種檢索方式,可在數(shù)據(jù)庫檢索字段選擇菜單中設(shè)置不同字段,支持不同目標(biāo)資源的特定檢索條件??蓪χ形臄?shù)據(jù)庫、電子圖書、網(wǎng)上免費(fèi)資源等資源進(jìn)行檢索。

MetaLib/SFX系統(tǒng)是以色列ExLibris公司開發(fā)的圖書館信息門戶系統(tǒng),提供統(tǒng)一檢索界面,并可直接鏈接到電子全文。OpenURL技術(shù)是Metalib/SFX系統(tǒng)的核心。該協(xié)議雖然對檢索詞格式做了規(guī)定,但是各數(shù)據(jù)庫根據(jù)OpenURL標(biāo)準(zhǔn)制定的接口仍不同,若要自行開發(fā)統(tǒng)一檢索系統(tǒng)較困難。此外該協(xié)議對返回結(jié)果的格式無嚴(yán)格要求,這對不同數(shù)據(jù)庫的返回信息難以統(tǒng)一處理。

MAP是Innovative Interfaces公司的一種數(shù)據(jù)庫資源整合方式。其通過WebPAC搜索功能及Innopac Millennium管理模塊將館內(nèi)各類型的電子資源整合在一起。該系統(tǒng)數(shù)據(jù)來源于對其它數(shù)據(jù)庫數(shù)據(jù)的索引和轉(zhuǎn)換和通過OpenURL等標(biāo)準(zhǔn)資源鏈接協(xié)議獲得。若用戶將自有的特色數(shù)據(jù)資源整合到該系統(tǒng)中仍存在困難。

3 結(jié) 論

通過對統(tǒng)一檢索實現(xiàn)原理和國內(nèi)外主要異構(gòu)數(shù)據(jù)統(tǒng)一檢索平臺的分析,較全面了解各實現(xiàn)方法的特點(diǎn)及各平臺的功能??梢钥闯龈黝悪z索系統(tǒng)的檢索界面、檢索結(jié)果處理、統(tǒng)計功能及個性化服務(wù)等方面基本功能相似,功能項目的設(shè)置各具特色 。

本文認(rèn)為統(tǒng)一檢索系統(tǒng)應(yīng)以用戶為中心,界面要簡潔、直觀,功能明確;對初級應(yīng)用戶提供在線幫助和資源簡介;檢索方式要分別設(shè)定簡單檢索和高級檢索方式,此外還要設(shè)定二次檢索,便于用戶應(yīng)用習(xí)慣來選擇;統(tǒng)一檢索系統(tǒng)應(yīng)緊跟信息檢索技術(shù)的發(fā)展,提供個性化、智能化檢索服務(wù),提高服務(wù)主動性,提供數(shù)字資源導(dǎo)航以提高用戶檢準(zhǔn)率;將中文資源和外文資源加以區(qū)分,方便用戶得到國內(nèi)外資源;提供檢索結(jié)果的去重和排序功能,節(jié)省用戶的選擇時間;返回結(jié)果應(yīng)有統(tǒng)一的格式;應(yīng)給用戶提供可擴(kuò)展功能,方便用戶進(jìn)行數(shù)字資源整合。

異構(gòu)資源統(tǒng)一檢索平臺對數(shù)字資源的保存及方便用戶對數(shù)字資源的使用都有著及其重要的作用。在數(shù)字資源越來越豐富、種類越來越多的今天,更簡潔、更實用、功能更強(qiáng)的異構(gòu)資源統(tǒng)一檢索平臺的構(gòu)建無疑有著重要的實用價值。

參考文獻(xiàn)

[1]劉濤.數(shù)字資源統(tǒng)一檢索平臺比較分析[J].圖書館學(xué)刊,2007,(1):125-127.

[2]胡娟.數(shù)據(jù)庫統(tǒng)一檢索平臺的功能比較[J].現(xiàn)代情報,2005,(4):174-177.

[3]張建中,袁小一.基于頁面分析技術(shù)的統(tǒng)一檢索系統(tǒng)設(shè)計與實現(xiàn)[J].應(yīng)用實踐,2008,(5):77-80.

[4]李俊敏,劉軍,陳良強(qiáng).文獻(xiàn)資源統(tǒng)一檢索系統(tǒng)原理[J].現(xiàn)代情報,2007(6):120-122.

[5]胡芒谷.基于檢索協(xié)議的元數(shù)據(jù)互操作研究[J].科學(xué)技術(shù)與工程,2008,(12):3201-3205.

[6]朱晶瑩.OpenURL及其在

參考文獻(xiàn)鏈接中的應(yīng)用[J].情報科學(xué),2005,(3):406-409.

[7]智能計算CON2.0等新興技術(shù)為互聯(lián)網(wǎng)加速[J/OL].2007,4(11).

[8]姜華強(qiáng),騰國棟,潘紅,等.基于Web2.0圖書館統(tǒng)一檢索系統(tǒng)的研究[J].杭州師范大學(xué)學(xué)報:自然科學(xué)版,2008,(7):307-310.