国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國內(nèi)外同構聚合檢索系統(tǒng)比較研究

2011-06-28 13:26:16張國棟
大學圖書館學報 2011年5期
關鍵詞:檢索系統(tǒng)同構檢索

□宋 爽 張國棟

1 同構聚合檢索系統(tǒng)的興起

隨著各類商業(yè)性學術資源的大量引進和廣泛使用,學術信息由稀缺資源發(fā)展成為海量異構資源集。科技用戶面對著各資源提供商豐富多樣的檢索界面和指令,需要熟悉不同的檢索系統(tǒng)。限于精力等原因用戶往往陷入一種使用困境:被迫放棄大量數(shù)據(jù)源,只選擇一、二種自己研究最常用的數(shù)據(jù)源,依靠它們作為自己的資源來源,這很容易造成相關重要資源的遺漏[1]。為解決這一問題,跨庫檢索系統(tǒng)應運而生。根據(jù)其技術發(fā)展路線可分為兩個階段:依賴計算機能力和標準協(xié)議對異構數(shù)據(jù)庫的實時檢索階段和基于元數(shù)據(jù)收集的同構聚合檢索階段。

對異構數(shù)據(jù)庫的實時檢索方式是借助于計算機強大的處理能力,實時地對分布異構資源進行檢索。跨庫檢索系統(tǒng)充當一個中間代理的角色,接受用戶的查詢請求后,基于對資源檢索協(xié)議和平臺的分析構建查詢語法,并行地發(fā)出查詢請求,并將獲得的檢索結果整合顯示在系統(tǒng)內(nèi)。其優(yōu)點是為用戶屏蔽了不同數(shù)據(jù)源在平臺、界面、檢索指令等方面的差異,可以通過一個簡單的界面訪問多種異構、分布的資源。缺點在于實時檢索受制于待檢數(shù)據(jù)庫的訪問速度和檢索性能,檢索效率難以提高。目前國內(nèi)的跨庫檢索服務多采用此方式實現(xiàn)。

基于元數(shù)據(jù)收集的同構聚合檢索則通過抽取、映射和導入等手段對分布異構資源的元數(shù)據(jù)(也可能包括對象數(shù)據(jù))進行收集和聚合,安裝存儲于本地系統(tǒng)或者中心系統(tǒng)平臺,提供統(tǒng)一的檢索和服務。該方式的優(yōu)勢是數(shù)據(jù)經(jīng)過收集轉換后不僅格式統(tǒng)一,而且結構清晰,可以按照需求建立各種分類體系,或者按照更高級的知識——本體對數(shù)據(jù)進行組織和管理[2]。檢索過程可控、檢索速度提高,技術解決方案本身就明顯優(yōu)于實時檢索方式。但由于圖書館等信息服務機構需要整合的多是商業(yè)性學術資源,而這些資源的提供商往往不同意用戶將其元數(shù)據(jù)經(jīng)過二次收集和聚合后,安裝在另外一個系統(tǒng)平臺上,導致該解決方案一直不具備可行性。但是近幾年來,主流資源提供商(主要是國外資源提供商)逐漸意識到開放元數(shù)據(jù)的雙贏性,已與幾家軟件生產(chǎn)商達成協(xié)議,促使集中倉儲元數(shù)據(jù)進行同構檢索的商業(yè)化軟件最終得以萌芽。自2009年Serials Solutions公司推出第一個同構聚合檢索系統(tǒng)Summon以來,多家軟件廠商推出了類似解決方案的跨庫檢索系統(tǒng)。由于其解決方案的先天優(yōu)異特性,應該可以說,基于元數(shù)據(jù)收集的同構聚合檢索將逐漸取代對異構數(shù)據(jù)庫的實時檢索,成為跨庫檢索系統(tǒng)的主流實現(xiàn)方式。

雖然國外多所高校圖書館,如悉尼大學、密歇根大學等,基于元數(shù)據(jù)收集的同構聚合檢索系統(tǒng)得到了具體應用并取得了很好的應用效果,但引入國內(nèi)時間相對較短。同時由于中文資源提供商的數(shù)據(jù)封閉性,相關軟件系統(tǒng)在國內(nèi)的具體實施難度更大。因此本文的主要目的并不是對系統(tǒng)進行評價,而是在對此類系統(tǒng)的元數(shù)據(jù)涵蓋范圍、功能特點等方面進行比較的基礎上,總結目前同構聚合檢索系統(tǒng)的一般特點,發(fā)現(xiàn)問題,進而為各信息服務機構根據(jù)各自實際選擇相關產(chǎn)品并有效實施提供建設性意見。

2 國內(nèi)外五種同構聚合檢索系統(tǒng)比較

從各軟件廠商的營銷策略出發(fā),此類跨庫檢索系統(tǒng)被冠以不同名稱,有的將其稱為“互聯(lián)網(wǎng)級探索發(fā)現(xiàn)服務”[3]、有的命名為“資源發(fā)現(xiàn)與獲取解決方案”[4]。筆者根據(jù)前文對跨庫檢索系統(tǒng)發(fā)展階段的分析,從產(chǎn)品功能和產(chǎn)品成熟度兩方面考慮,選取了國內(nèi)外五種同構聚合檢索系統(tǒng),具體包括:Serials Solutions公司的Summon、Ex Libris公司的Primo、OCLC公司的 WorldCat Local、超星公司的百鏈、書生公司的同構跨庫檢索系統(tǒng)。

2.1 比較結果分析

五種同構聚合檢索系統(tǒng)都通過優(yōu)先對元數(shù)據(jù)進行整合存儲和預處理、為讀者提供了互聯(lián)網(wǎng)搜索引擎方式的檢索體驗,檢索具有使用方式簡單、響應速度快、檢索結果無重復、格式統(tǒng)一等優(yōu)點。在實現(xiàn)跨庫檢索同時,都能實現(xiàn)準確定位全文鏈接。

表1 國內(nèi)外五種同構聚合檢索系統(tǒng)比較

① 該數(shù)據(jù)由Ex Libris公司2010年10月提供

② 該數(shù)據(jù)由超星公司2010年9月提供

(1)元數(shù)據(jù)涵蓋范圍比較

同構聚合檢索系統(tǒng)以類似互聯(lián)網(wǎng)搜索引擎的方式提供服務,讀者檢索的是應用系統(tǒng)自身建立的元數(shù)據(jù)庫,而非各信息服務單位真實的訂購數(shù)據(jù)庫。為保證讀者能夠搜盡本館館藏,必須要求軟件商建立的元數(shù)據(jù)庫涵蓋范圍盡可能全面,或者說,更加接近于本館館藏。否則將出現(xiàn)大量漏檢,給用戶使用帶來困擾。

在對各公司的資源列表進行比對、并結合對上線應用系統(tǒng)的測試結果來看,各系統(tǒng)包含的元數(shù)據(jù)各有側重。Summon和Primo收集的外文期刊較全,基本涵蓋了國外主要資源提供商的數(shù)據(jù)庫產(chǎn)品。Summon的大量報紙元數(shù)據(jù)對于公共館相應系統(tǒng)的建設將大有裨益。WorldCat Local則由于OCLC在世界圖書元數(shù)據(jù)中一貫的領袖地位,包含的中外文圖書元數(shù)據(jù)最為全面。但是由于中文資源提供商對自有數(shù)據(jù)的一貫封閉,幾家國外系統(tǒng)均未能與其達成元數(shù)據(jù)使用協(xié)議,導致國外系統(tǒng)中包含的中文元數(shù)據(jù)量非常有限。而國內(nèi)同構聚合檢索系統(tǒng)由于其直接下載元數(shù)據(jù)的靈活性,中外文數(shù)據(jù)比較平衡。

(2)元數(shù)據(jù)的收割方式比較

元數(shù)據(jù)的收割方式方面,國內(nèi)外系統(tǒng)有明顯不同。國外相關系統(tǒng)均完全依靠與各數(shù)據(jù)商簽訂相關協(xié)議來獲取元數(shù)據(jù),合理合法。國內(nèi)相關系統(tǒng)則完全依靠免費下載元數(shù)據(jù),合理但存在一定的法律爭議。且與協(xié)議獲得元數(shù)據(jù)的方式相比,其元數(shù)據(jù)的準確性和連續(xù)性相對較差。數(shù)據(jù)質量的參差不齊將直接影響檢索的查全率和查準率。

(3)中文數(shù)據(jù)處理的技術能力和關注程度

由于同構聚合系統(tǒng)的檢索效果將由系統(tǒng)本身決定,因此國外系統(tǒng)中文數(shù)據(jù)處理的技術能力需要特別考察。從考察結果看,由于Ex Libris公司中國辦事處組織了一批技術力量,中文數(shù)據(jù)處理方面工作得以一直有力推進。再加上2009年Primo在上海交通大學的正式上線[7],積累了一定的本地化經(jīng)驗,項目實施力量能力較強。相比之下,其他兩個國外系統(tǒng)進入中國時間不長,且可能因為尚未在中國正式簽訂實施項目,配備的技術力量有限,相關本地化工作也有待開展。

(4)功能特點比較

五種同構聚合檢索系統(tǒng)總體功能一致,但國內(nèi)外產(chǎn)品在系統(tǒng)架構方面又有所區(qū)別。國外系統(tǒng)多將全文獲取的定位功能獨立出來,如Summon和Primo在依托各自旗下獨立模塊360link和SFX的同時,也可兼容其他公司的相關產(chǎn)品。用戶館可以利用上述模塊自行界定本館館藏,并根據(jù)不同數(shù)據(jù)庫鏈接語法的變化在后臺及時更新相關配置。而國內(nèi)系統(tǒng)則并未做類似區(qū)分,館藏定義和配置工作均需委托公司相關技術人員代為處理。

從功能細節(jié)看,各軟件產(chǎn)品各有特點。Summon主要圍繞電子資源的便捷檢索設計系統(tǒng)功能,以簡潔的顯示界面和便捷的操作見長;由于Primo致力于成為一站式資源發(fā)現(xiàn)與獲取門戶,與本地系統(tǒng)的結合更為緊密;WorldCat Local則在圖書類文獻的顯示效果及館際圖書實時檢索方面獨具實力;百鏈對中國用戶的檢索習慣分析透徹,功能設置合理;書生同構搜索產(chǎn)品的可定制性較強。

(5)系統(tǒng)服務方式和價格

五種同構聚合系統(tǒng)集中體現(xiàn)出軟件即服務(SaaS)的銷售和使用模式。SaaS是指由軟件供應商以服務的方式對用戶進行軟件的日常維護、更新和技術支持的一種軟件分發(fā)模式[8]。供應商提供所有程序邏輯和數(shù)據(jù)的主機服務,使最終用戶能夠通過基于 Web的用戶界面在公共因特網(wǎng)上存取數(shù)據(jù)。在該模式下,圖書館不再需要投入資金來購買服務器等硬件設備,而由供應商負責硬件設施和軟件升級等工作,能夠節(jié)省大量的人力、物力和財力。但目前國內(nèi)高校購買此類系統(tǒng)仍有擔憂,因為SaaS采用的是遠程訪問的模式,它必然對網(wǎng)絡有著強烈的依賴,如果出現(xiàn)不可抗拒因素,這項服務就會癱瘓。另外,由于用戶購買的只是檢索系統(tǒng)當年的使用權而非所有權,一旦賣家需要更新系統(tǒng)或者對系統(tǒng)進行大的調(diào)整,原有的服務很可能停止;不僅如此,買家面對供應商每年的提價或其他要求也是很難抵制的[9]。

國內(nèi)外系統(tǒng)售價大多由系統(tǒng)購置費用和服務年費兩部分構成,但國外系統(tǒng)的價格遠高于國內(nèi)產(chǎn)品。隨著相關產(chǎn)品市場的陸續(xù)打開,國外系統(tǒng)將集中在高端市場爭奪,而國內(nèi)系統(tǒng)多集中在中小館市場。

2.2 主要存在的問題

(1)國外系統(tǒng)依靠與各數(shù)據(jù)庫商簽訂協(xié)議獲取元數(shù)據(jù),雖然保證了數(shù)據(jù)質量,但也導致許多未能簽訂協(xié)議的重要元數(shù)據(jù)(主要是中文資源商的大量中文數(shù)據(jù))無法在該系統(tǒng)中直接檢索。因此國外系統(tǒng)在中國實施時,必須結合對異構數(shù)據(jù)庫的實時檢索方式以保證檢索查全率。除增加了系統(tǒng)實施難度外,形成的兩個檢索入口也會對用戶使用帶來一定困擾,需要有效設計服務說明界面進行引導。

(2)國內(nèi)系統(tǒng)通過訪問數(shù)據(jù)資源免費題錄頁直接下載元數(shù)據(jù),能夠實現(xiàn)按需建設元數(shù)據(jù)庫。由于自行下載建設的數(shù)據(jù)量巨大,如何保證元數(shù)據(jù)的質量及其連續(xù)性成為關注重點。從目前的測試情況看,書生同構跨庫檢索系統(tǒng)的元數(shù)據(jù)庫建設剛剛起步,而百鏈系統(tǒng)雖元數(shù)據(jù)建設達到一定量級,但依據(jù)對檢索結果的分析可見,其數(shù)據(jù)質量有待加強。

3 改進同構聚合檢索應用效果的幾點建議

從國外高校對同構聚合檢索系統(tǒng)的選擇來看,悉尼大學選擇與Series Solutions合作[10]、普林斯頓大學購買了Primo[11]、華盛頓國立大學選擇World-Cat Local作為其聯(lián)邦檢索平臺[12],表明沒有一款產(chǎn)品能滿足所有人的需要,能夠壟斷市場的系統(tǒng)目前并不存在。各應用單位需要根據(jù)自身機構特點,將需求與系統(tǒng)優(yōu)勢結合考慮,以最大程度發(fā)揮出同構聚合檢索系統(tǒng)的服務效益。并在系統(tǒng)實施及后續(xù)服務過程中,在技術允許的范圍內(nèi),進一步推動該系統(tǒng)的功能提升。

3.1 形成基于用戶檢索行為分析的檢索推薦

形成基于用戶檢索行為分析的檢索推薦包含三個層面的內(nèi)容:建立滿足用戶檢索需求的同構元數(shù)據(jù)庫為用戶提供有效檢索結果、根據(jù)用戶輸入推薦切合用戶需要的檢索詞和更深層次的、通過主動收集用戶檢索偏好信息實現(xiàn)檢索結果的有效推薦。

對于第一個層面的實現(xiàn),要求應用單位比較不同同構聚合系統(tǒng)元數(shù)據(jù)庫的涵蓋范圍與用戶檢索需求的差異,選擇差異相對最小的系統(tǒng)實施,并在后續(xù)工作中采用各種方式進一步縮小差異;檢索詞的有效推薦層面則要求系統(tǒng)能夠根據(jù)本應用單位用戶的檢索行為對擬推薦檢索詞逐步優(yōu)化,并對用戶的拼寫錯誤等給予正確提示,以實現(xiàn)系統(tǒng)與用戶的友好交互;收集用戶檢索偏好信息實現(xiàn)檢索結果的有效推薦層面,可分為顯式或隱式兩種方式實現(xiàn)。對于顯式方式,系統(tǒng)通過為用戶提供可供評價檢索材料的相關工具來實現(xiàn)相關推薦;對于隱式方式,系統(tǒng)記錄并分析用戶檢索行為、瀏覽路徑等,以實現(xiàn)有價值信息的推薦[13]。隨著檢索推薦層次的逐層推進,用戶從多次嘗試檢索發(fā)展到得到有效檢索指導,最終通過系統(tǒng)的有效推薦得以輕松檢索,系統(tǒng)與用戶的“粘度”不斷加強。

3.2 有效形成知識網(wǎng)絡,變文獻為服務

以同構聚合檢索系統(tǒng)建設為契機,應用單位得以把本館訂購的各類電子資源、館藏紙質資源、機構庫等自建資源的文獻數(shù)據(jù)進行整合,以統(tǒng)一的界面提供服務。但是如果僅僅將其作為檢索的統(tǒng)一入口,對內(nèi)容缺乏深入挖掘,沒有有效地形成知識網(wǎng)絡,不注重功能特色與細節(jié)開發(fā),對于用戶來說,是卸掉了一種包袱,背上了另一種負擔。因此,同構聚合檢索作為一種新的服務方式,在其建設完善過程中,應基于龐大的元數(shù)據(jù)庫建立有效的知識挖掘機制,加強對文獻主題內(nèi)容、文獻關聯(lián)關系的深度挖掘,并以形象化的方式揭示給用戶??赏ㄟ^可視化處理,使得檢索結果的呈現(xiàn)方式從基于點陣的表格形式進步到動態(tài)的可視化模式。如將搜索結果做成一張示意圖,每個主題分類目錄被顯示為一個彩色的圓圈,在每一個目錄里,每個子目錄也同樣顯示為彩色圓圈,當你點擊相應的圓圈時,相關的區(qū)域就會被放大,里面就會顯示更多的子內(nèi)容[14]。建立起文獻之間的鏈接(包括引證文獻、參考文獻、同類文獻等)、知識元之間的鏈接(包括作者、機構、刊名以及相關關鍵詞等)、分類導航之間的交叉鏈接后,節(jié)點豐富、交織縱橫的庫間知識網(wǎng)絡得以構建。最終形成區(qū)別于google scholar等其他學術搜索引擎的服務特色,真正成為用戶欣于接受的服務系統(tǒng)。

1 常唯.綜合性學術搜索引擎研究.大學圖書館學報,2007(2):73-78

2 姜愛蓉.數(shù)字資源整合系統(tǒng)的技術發(fā)展與應用趨勢.圖書館雜志,2006(12):14-18

3 Serials Solutions.[2011-02-17].http://www.serialssolutions.com/summon/

4 Ex Libris.Empowering libraries to address user needs.[2011-02-17].http://www.exlibrisgroup.com/category/PrimoOverview

5 Ex Libris.Summon?Content &Coverage.[2010-09-10].http://www.serialssolutions.com/summon-content-and-coverage/

6 OCLC.Content in all formats from libraries and publishers around the world.[2010-09-10].http://www.oclc.org/worldcatlocal/overview/content/default.htm

7 Ex Libris.Primo Provides One-Stop Discovery and Delivery for Shanghai Jiao Tong University.[2010-10-15].http://www.exlibrisgroup.com/files/CaseStudy/ShanghaiJiaoTongPrimo.pdf

8 Chong F,Carraro G.抓住長尾市場的架構戰(zhàn)略.[2010-06-10].http://www.cnsaas.com/FileDownload/longtail.pdf.

9 馬驊.國外主要聯(lián)邦檢索系統(tǒng)的興起、現(xiàn)狀及發(fā)展趨勢.圖書館建設,2009(3):1-5

10 Serials Solutions.University of Sydney Library earns bigger return on its content investment with new technology[2010-07-19].http://www.serialssolutions.com/assets/publications/UofSydney_Summon_CaseStudy.pdf

11 Ex Libris.[2009-09-17].http://www.exlibrisgroup.com/default.asp?catid={916AFF5B-CA4A-48FD-AD54-9AD2ADADEB88}&details_type=1&itemid={238A3327-04DF-4388-A44B-BD7EC0B4FE9C}

12 OCLC.University of Washington Libraries adopt WorldCat Lo-cal as their discovery and delivery solution.[2009-09-17].http://www.oclc.org/services/brochures/213050usc_uwashington.pdf

13 Tamar S.User-Centric Solutions for Scholarly Research in the Library.[2009-07-27].http://liber.library.uu.nl/publish/articles/000215/article.pdf

14 Groxis.Groxis and EBSCO Publishing Partner to Provide Visual Search Technology.[2008-06-15].http://www.groxis.com/service/grokker/pr29.html

猜你喜歡
檢索系統(tǒng)同構檢索
巧用同構法解決壓軸題
指對同構法巧妙處理導數(shù)題
同構式——解決ex、ln x混合型試題最高效的工具
高等代數(shù)教學中關于同構的注記
2019年第4-6期便捷檢索目錄
收錄《信號處理》的檢索系統(tǒng)及數(shù)據(jù)庫
信號處理(2018年1期)2018-09-03 07:53:04
收錄《信號處理》的檢索系統(tǒng)及數(shù)據(jù)庫
信號處理(2018年5期)2018-06-28 02:16:02
本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
信號處理(2018年4期)2018-06-27 03:34:16
本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
信號處理(2018年3期)2018-06-27 03:30:18
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36