圖書館發(fā)現(xiàn)服務(wù)平臺的評估工作與研究
姜瑩瑩,李睿華
(南京航空航天大學(xué),210016)
摘要:對Summon、Primo、Find+這三大外文發(fā)現(xiàn)系統(tǒng)進行調(diào)研、測試,從元數(shù)據(jù)、架構(gòu)與功能、檢索與界面以及其他因素等方面評估三大發(fā)現(xiàn)服務(wù)平臺,以期對圖書館發(fā)現(xiàn)系統(tǒng)的選型提供參考。
關(guān)鍵詞:圖書館;發(fā)現(xiàn)系統(tǒng);Summon;Primo;Find+
中圖分類號:G250.76
作者簡介:姜瑩瑩,女,館員。
收稿日期:2014-11-04
Assessment for library resource discovery systems
JIANG Ying-ying, LI Rui-hua
(Nanjing University of Aeronautics and Astronautics, Nanjing210016, China)
Abstract:After making an investigation into and the tested three discovery systems, namely Primo, Summon, and Find+, the paper makes an assessment for these three systems from the following aspects: metadata, structure, functions, retrieval, and user interface, etc.so as to provide necessary principles for the fraternal libraries to select discovery system.
Key words: library; discovery system; assessment; Summon; Primo; Find+
1資源發(fā)現(xiàn)系統(tǒng)研究背景與現(xiàn)狀
1.1 研究背景
隨著信息總量的成倍增長,用戶可獲取的信息量遠遠超過了用戶的吸收和甄別能力。面對復(fù)雜多元的網(wǎng)絡(luò)信息環(huán)境,圖書館與數(shù)據(jù)庫商、系統(tǒng)服務(wù)商等都在努力開發(fā)可以像Google 一樣一站式檢索圖書館各種信息資源的工具——整合檢索系統(tǒng)。在此情境下,為幫助用戶提取解決問題的知識并以直觀和符合用戶需求的方式顯示出來,五大基于元數(shù)據(jù)預(yù)索引的資源發(fā)現(xiàn)系統(tǒng)應(yīng)運而生,它們分別是OCLC 的 World Cat Local,Serials Solutions的Summon,EBSCO 的Discovery Service(EDS),Innovative Interfaces 的Encore,Ex Libris 的Primo。同時,自2012年始,中文資源發(fā)現(xiàn)產(chǎn)品北京世紀超星公司的超星發(fā)現(xiàn)系統(tǒng)、重慶維普公司的維普智立方、萬方數(shù)據(jù)公司的萬方學(xué)術(shù)搜索、北京方正阿帕比公司的學(xué)知搜索等等也相繼研發(fā)推出。
1.2 研究現(xiàn)狀
自發(fā)現(xiàn)產(chǎn)品面市以來,多家高校圖書館已經(jīng)完成資源發(fā)現(xiàn)系統(tǒng)的部署,而且很多圖書館正在準(zhǔn)備實施。當(dāng)前,國外進入國內(nèi)的資源發(fā)現(xiàn)產(chǎn)品主要是Summon、Primo、EDS。
很多圖書館通過對Summon、Primo、EDS這三大外文發(fā)現(xiàn)系統(tǒng)進行測試、調(diào)研,選擇適合本館的發(fā)現(xiàn)系統(tǒng)。例如山東大學(xué)通過兩個階段的評估,選擇了summon作為自己的資源發(fā)現(xiàn)平臺。他們主要是以咨詢部門和技術(shù)中心兩個部門為核心,協(xié)調(diào)其他部門進行,咨詢部門重點從用戶的使用習(xí)慣和需求方向兩方面考慮,技術(shù)中心是對資源架構(gòu)進行調(diào)研。還以該校的重點學(xué)科為中心,重點評估資源發(fā)現(xiàn)、揭示、獲取的核心功能,并把服務(wù)對象在功能需求上進行區(qū)分[2]。而復(fù)旦大學(xué)圖書館通過對正式購買和實施資源發(fā)現(xiàn)系統(tǒng)兄弟院校圖書館的調(diào)研考察,借鑒經(jīng)驗,部署了三輪內(nèi)部測試和三輪讀者測試。通過對元數(shù)據(jù)、后臺功能以及綜合評估,確定并購買了Primo作為自己的資源發(fā)現(xiàn)平臺[3]。上海圖書館作為公共圖書館因其復(fù)雜的用戶群,通過設(shè)計評估的評價指標(biāo)體系進行系統(tǒng)測試,最后選擇EDS作為最適合該館的發(fā)現(xiàn)服務(wù)平臺[4].
自2011年以來,國內(nèi)對圖書館資源發(fā)現(xiàn)系統(tǒng)的研究也越來越多。第一階段的研究主要是針對資源發(fā)現(xiàn)系統(tǒng)的介紹,元數(shù)據(jù)來源、架構(gòu)功能等;第二階段的研究主要是對發(fā)現(xiàn)服務(wù)系統(tǒng)的比較研究;第三階段的研究主要是針對圖書館對發(fā)現(xiàn)系統(tǒng)選型的實踐以及系統(tǒng)具體應(yīng)用研究,比如科技查新工作等。
2部署測試與評估
南京航空航天大學(xué)圖書館擁有大量的資源,其中電子資源數(shù)據(jù)庫105個,紙質(zhì)藏書250萬冊,現(xiàn)刊1761種,還有數(shù)個自建資源等,類型有圖書、期刊、專利、報紙、學(xué)位論文、科技報告等。其中紙質(zhì)資源分布于兩個校區(qū),電子資源來自于不同的提供商,每個數(shù)據(jù)庫商提供不同的入口。發(fā)現(xiàn)系統(tǒng)可將這些資源整合,更好地為讀者服務(wù)。從2013年10月至2014年6月, 南京航空航天大學(xué)圖書館主要是通過內(nèi)部測試的方式對Summon、Primo、Find+這三家資源發(fā)現(xiàn)系統(tǒng)的產(chǎn)品進行測試。對Summon和Primo平臺因為沒有配本館的資源,主要是使用北京大學(xué)的未名學(xué)術(shù)搜素(Summon)、西安交通大學(xué)思源搜索(Summon)、清華大學(xué)水木搜索(Primo)、復(fù)旦大學(xué)望道溯源搜索(Primo)這四個平臺進行測試的。Find+是將本館的資源進行了配置。
2.1 元數(shù)據(jù)評估
元數(shù)據(jù)是評估資源發(fā)現(xiàn)平臺的重點之一。考評元數(shù)據(jù)的指標(biāo)主要有元數(shù)據(jù)的規(guī)模、質(zhì)量、對本館資源的覆蓋度、開放存取資源的覆蓋度、其他灰色資源的集成以及元數(shù)據(jù)的更新頻率。所謂厚元數(shù)據(jù)是指包含題名、作者、來源、主題、摘要等信息的元數(shù)據(jù)。因每家的元數(shù)據(jù)規(guī)模都達到了六億條,直接評估難度較大。我們側(cè)重評估三家資源發(fā)現(xiàn)系統(tǒng)的元數(shù)據(jù)數(shù)量、質(zhì)量,以及與本館資源的覆蓋率,特別是對我館主流數(shù)據(jù)庫期刊、電子書的覆蓋程度以及對我校主流學(xué)科的支持程度。
2.1.1 主流數(shù)據(jù)庫資源評估
根據(jù)我校的專業(yè)設(shè)置以及對比已購買數(shù)據(jù)庫的資源列表,選擇了使用率較高的九個主流期刊數(shù)據(jù)庫進行測試,對比三個外文發(fā)現(xiàn)平臺的元數(shù)據(jù)的覆蓋程度。這九個數(shù)據(jù)庫分別為AIAA、ASME、SIAM、Taylor、IOP、AIP、Wiley、Turpion和APS。選取了這九個數(shù)據(jù)庫的22種期刊進行測試。
通過對比三大發(fā)現(xiàn)系統(tǒng)的檢索結(jié)果與原數(shù)據(jù)庫的檢索結(jié)果看出:(1)Find+的檢索結(jié)果顯示的條數(shù)與利用翻頁功能到最后一頁顯示的記錄條數(shù)不一致,并且翻頁顯示的速度比較慢。(2)檢索某一種刊,按照EISSN字段檢索,Primo的檢索結(jié)果為0,但是選擇此刊的某一篇文章按照題名檢索的話,Primo有收錄,說明Primo元數(shù)據(jù)字段不全。(3)Find+的結(jié)果比原庫的結(jié)果還要多至少一半,因為Find+的內(nèi)容提供者有兩個或兩個以上,也就是說數(shù)據(jù)來源有重復(fù)。(4)AIAA、IOP、Turpion 等數(shù)據(jù)庫的某些期刊Find+均未收錄。(5)在Summon、Primo和Find+中都有部分期刊的檢索結(jié)果比原數(shù)據(jù)庫檢索到的數(shù)據(jù)少,數(shù)據(jù)有遺漏。
2.1.2 電子書數(shù)據(jù)庫資源評估
我館購買了八個電子書的數(shù)據(jù)庫,因此電子書的元數(shù)據(jù)的覆蓋度也是重要的評估因素。從我館購買的八個電子書的數(shù)據(jù)庫任意選擇24種進行比較。
從測試結(jié)果來看,對于我館已購買的電子書,summon覆蓋的較全面,覆蓋度達到100%,Primo次之,覆蓋度為50%,F(xiàn)ind+最少,只有10%。從這些電子書的元數(shù)據(jù)質(zhì)量來看,summon提供的電子書的元數(shù)據(jù)字段較全,包含題名、作者、注釋、出版商、語種、頁碼、版本、主題、ISBN、EISBN等;Primo提供的字段有題名、作者、主題(較少)、描述、出版社、出版日期、語種、識別符(ISBN、EISBN);Find+提供的字段有題名、作者、出版信息、主題、ISBN等。對于沒有收錄電子書,F(xiàn)ind+給出的解決方案是需要電子書的數(shù)據(jù)庫商提供MARC數(shù)據(jù),然后導(dǎo)入EDS的服務(wù)器上。
2.1.3 專利資源評估
我校屬于工科學(xué)校,對于專利的需求比較多,因此對專利元數(shù)據(jù)的收錄情況也是發(fā)現(xiàn)系統(tǒng)選型的重要方面。選擇某一檢索詞比較這三大發(fā)現(xiàn)系統(tǒng)對歐洲專利和美國專利的數(shù)據(jù)覆蓋情況。通過比較發(fā)現(xiàn),summon和Find+均收錄了歐洲專利局的元數(shù)據(jù),Primo沒有專利數(shù)據(jù)。Summon專利元數(shù)據(jù)比Find+的多,并且可以鏈接全文,F(xiàn)ind+只標(biāo)識數(shù)據(jù)來源沒有全文鏈接。三大發(fā)現(xiàn)系統(tǒng)都沒有收錄美國專利局的專利元數(shù)據(jù)。
2.1.4 重點學(xué)科的資源評估
南航的國家重點學(xué)科為航空宇航制造工程和力學(xué)。選取電解加工刀具、聚合物以及流體力學(xué)這三個熱點主題。
在三大發(fā)現(xiàn)系統(tǒng)中檢索電解加工刀具、聚合物以及流體力學(xué)方面的文獻,對比三大發(fā)現(xiàn)系統(tǒng)在檢索結(jié)果總數(shù)、在線全文數(shù)、同行評議論文數(shù)、最新文章數(shù)、圖書/電子書數(shù)量以及厚元數(shù)據(jù)量等六個方面的結(jié)果發(fā)現(xiàn),這三個熱點主題在summon的檢索總數(shù)、在線全文數(shù)、最新文章數(shù)、圖書/電子書的數(shù)量都是最高的,并且Summon的在線全文數(shù)占檢索總數(shù)的百分比也是最高的。Find+的內(nèi)容提供商至少兩個,因此檢索結(jié)果會有至少50%的重復(fù)數(shù)據(jù)。說明Summon在元數(shù)據(jù)總量、元數(shù)據(jù)更新數(shù)量以及圖書數(shù)量上的發(fā)現(xiàn)功能是無可比擬的,Summon沒有提供同行評議論文的篩選,只提供期刊論文數(shù),因此同行評議論文數(shù)無法具體統(tǒng)計,因同行評議論文均為期刊論文,所以在上述表格中標(biāo)記的是小于期刊論文總數(shù)。Primo的圖書/電子書數(shù)量上比Find+要多。
2.1.5 查新需求評估
南京航空航天大學(xué)科技查新站具有國防科工委部級查新資質(zhì)和國家教育部認定的查新資質(zhì),每年有大約300項的科技查新,因此發(fā)現(xiàn)系統(tǒng)的查新需求評估也是重要的評估指標(biāo)。
利用已做過的兩個屬于國家重點學(xué)科的外文查新課題,使用相同的檢索策略,對檢索結(jié)果的相關(guān)度和查準(zhǔn)率進行測試,該測試以檢測檢索結(jié)果的查準(zhǔn)率和精確性為目的。
選擇的兩個科技查新是屬于不同領(lǐng)域的國家重點學(xué)科的國內(nèi)外查新??疾彀l(fā)現(xiàn)系統(tǒng)對密切相關(guān)文獻的覆蓋度以及檢索結(jié)果的元數(shù)據(jù)質(zhì)量。從檢索結(jié)果看,summon命中的相關(guān)文獻最多,其次是Primo,最后是Find+。從測試結(jié)果的信息描述看,三大發(fā)現(xiàn)系統(tǒng)元數(shù)據(jù)質(zhì)量較高,均含有題名、作者、來源,大多含有主題、摘要字段。
在查新中,主題檢索是很重要的檢索方式。通過對比三大發(fā)現(xiàn)系統(tǒng)和SCI的文獻主題詞發(fā)現(xiàn):summon不僅包含SCI的主題詞,還有其他主題詞,也就是說summon將多個來源的元數(shù)據(jù)的主題詞進行了合并;Primo只含有SCI的主題詞;Find+不含有SCI的主題詞,只有自己標(biāo)引的主題詞。
2.2 架構(gòu)與功能評估
發(fā)現(xiàn)系統(tǒng)不同的部署方式會影響硬件和人力的投入。比如云部署就會節(jié)省硬件設(shè)備和人力維護。北京大學(xué)認為Summon 系統(tǒng)架構(gòu)采用云部署,如果出現(xiàn)問題,容易更換。上海交通大學(xué)認為,Primo 比較靈活,可擴展性強,可以做本地化的定制[3]。
三大系統(tǒng)的架構(gòu)與功能對比如表1所示[5]:
表1 架構(gòu)與功能評估表
高級檢索功能是否按照用戶的使用習(xí)慣設(shè)計影響著用戶的使用體驗,三個系統(tǒng)的高級檢索功能對比見表2。
表2 高級檢索功能對比
由表2可以看出,summon的高級檢索提供的字段比較多,其次是Find+。Summon和Primo的時間限制條件可以精確到日進行檢索。Primo比較特別的是提供標(biāo)簽字段檢索。
2.3 檢索與界面評估
2.3.1 檢索結(jié)果的排序機制
Summon的相關(guān)性排序有動態(tài)排序和靜態(tài)排序兩種排序算法。動態(tài)排序與接近度、詞頻、逆向頻率、字段權(quán)重、詞干提取、智能關(guān)鍵詞處理、同義詞、語言處理、自由格式標(biāo)識符等因素相關(guān)。靜態(tài)排序與內(nèi)容類型、學(xué)術(shù)/同行評審、發(fā)表日期、被引次數(shù)、是否本地館藏、內(nèi)容規(guī)模等因素相關(guān)。
ScholarrankTM是primo發(fā)現(xiàn)系統(tǒng)的相關(guān)性排序技術(shù),由資料與查詢的匹配程度、資料學(xué)術(shù)價值、讀者背景信息決定排序位置。讀者登錄后,設(shè)置好自己教育水平和專業(yè)背景,檢索結(jié)果的排序?qū)c讀者背景信息相關(guān)度更高的文章放在比較靠前的位置。
Find+同時運用“受控詞匯的主題詞表”以及出版社原始提供的內(nèi)容(如作者提供的關(guān)鍵字、文摘、全文等)進行排序。以主題詞表優(yōu)先,其優(yōu)先順序如下:命中專業(yè)主題的控制詞表、命中文章題名、命中作者提供的關(guān)鍵字、命中文摘提供的關(guān)鍵字、命中文章全文中提供的關(guān)鍵字,權(quán)重分別為15、10、5、2、1。當(dāng)多筆數(shù)據(jù)總積分相同,二次評分機制啟動,如出版物發(fā)行時間、文章長度、出版物類別(如專家評審期刊的文章,權(quán)重會高于書評)。如果輸入關(guān)鍵字與某字段完整匹配一致(如篇/刊名),則總積分會額外增加?;谝陨纤幸蛩?,算出一個最終相關(guān)度積分。
2.3.2 檢索結(jié)果的顯示方式
檢索結(jié)果的顯示方式直接影響著用戶對檢索結(jié)果的精確篩選。三大發(fā)現(xiàn)系統(tǒng)檢索結(jié)果的顯示方式見表3。
表3 檢索結(jié)果顯示方式
從表3可以看出,F(xiàn)ind+中檢索結(jié)果的分面顯示類型是最多的,查看全文需點擊的鏈接次數(shù)較少,并且Scopus的引用次數(shù)可以顯示,但沒有推薦功能。Summon對相似的元數(shù)據(jù)沒有進行合并。Primo沒有來自WOS的引用標(biāo)識,并且查看全文需點擊的次數(shù)是最多的,比較特別的是Bx學(xué)術(shù)推薦功能。利用檢索詞檢測三大發(fā)現(xiàn)系統(tǒng)檢索結(jié)果的顯示方式,選擇的檢索詞為Information Behavior,分面選擇有在線全文的,F(xiàn)ind+顯示檢索結(jié)果中有不包含全文的元數(shù)據(jù),Summon和Primo的檢索結(jié)果都是含有在線全文的。
2.3.3 檢索響應(yīng)時間
檢索響應(yīng)時間是指從提問到接收再到檢索結(jié)果平均消耗的時間。檢索響應(yīng)時間越短越好,時間太長就會讓用戶放棄使用。通過測試發(fā)現(xiàn)這三大發(fā)現(xiàn)系統(tǒng)的響應(yīng)速度和響應(yīng)時間均在2秒之內(nèi)。
2.3.4 詳細信息的查看方式
用戶有時需要查看文獻的詳細信息對檢索結(jié)果進行篩選。所以詳細信息的查看方式是否便捷影響著用戶的使用體驗。在Summon中要查看詳細信息,只需鼠標(biāo)放在文章標(biāo)題上即可。在Primo中要查看詳細信息,點擊詳細信息即可在當(dāng)前頁面查看。Find+要查看OPAC的信息,需要調(diào)用OPAC系統(tǒng)的功能與界面,要查看文獻的詳細信息,需要進入EBSCO host界面。從文獻詳細信息的查看方式上看,Summon最方便。
2.3.5 館藏信息的顯示
館藏信息的顯示方式影響著用戶的使用體驗。Summon和Primo都是在檢索結(jié)果的下方直接有館藏地的顯示,Primo還有預(yù)約/續(xù)借功能的顯示。Find+通過資源范圍下的館藏目錄才能檢索館藏資源,即館藏資源并沒有和電子資源統(tǒng)一索引。Summon在“更多來源選擇”里,館藏紙本可按照刊名或ISSN號查看紙本資源。Primo在SFX鏈接中,館藏紙本通過館藏目錄查詢。
3因他因素評估
3.1 用戶情況
表4 用戶情況對比表
40%的北美研究型圖書館 (ARL)、75%的美國長春藤聯(lián)盟(Ivy League)大學(xué)、50%的澳大利亞八校聯(lián)盟(Group of) 圖書館、軍事/政府圖書館、世界衛(wèi)生組織(WHO)、全球眾多研究型圖書館均采購了Summon。
從表4可以看出Find+的全球用戶和國內(nèi)用戶是最多的,其次是Primo,最后是Summon。因為Find+的用戶有一些是集團采購的方式購買的,所以在用戶數(shù)量上有一定的優(yōu)勢。但是國內(nèi)有10所985高校圖書館發(fā)現(xiàn)系統(tǒng)用的是Summon。
3.2 本地支持
購買發(fā)現(xiàn)系統(tǒng)之后的售后服務(wù)也是考察發(fā)現(xiàn)平臺的一個重要因素。如果有本地支持的技術(shù)團隊,發(fā)現(xiàn)問題能得到及時解決。EBSCO與南京樂致安公司合作,將EDS本地化,成為Find+;Primo在國內(nèi)沒有技術(shù)團隊;Summon有多名本地售后技術(shù)人員,可提供本地技術(shù)支持。
4總結(jié)
圖書館用戶對資源發(fā)現(xiàn)系統(tǒng)的需求日趨強烈,39所985高校中有資源發(fā)現(xiàn)系統(tǒng)的數(shù)量為27所[6]。圖書館可以結(jié)合本館實際情況制定相應(yīng)的發(fā)展策略,評估發(fā)現(xiàn)系統(tǒng)平臺。筆者根據(jù)近兩年的跟蹤、測試評估工作總結(jié)出一些可供參考的評估要點:(1)評估工作應(yīng)從特定使用群體的需求出發(fā),以學(xué)校的重點學(xué)科為中心,以能否滿足學(xué)校的重點學(xué)科資源整合需求為目標(biāo)。(2)不管是架構(gòu)與功能還是檢索與界面,都要最大限度的方便用戶,貼近用戶的使用習(xí)慣。(3)發(fā)現(xiàn)系統(tǒng)的出現(xiàn)也對圖書館員提出了要求,不管是查新需求還是學(xué)科評價,都是重要的評估要點。
參考文獻:
[1] 竇天芳,等.以Exlibris&Metalib 為例談?wù)蠙z索的幾個關(guān)鍵技術(shù)及應(yīng)用[J].情報科學(xué),2007,(8):1235-1239.
[2] 廖靜.山東大學(xué)圖書館資源發(fā)現(xiàn)系統(tǒng)評估工作的摸索與實踐[J].圖書情報工作,2013,(9):52-57.
[3] 殷沈琴,唐武京,邵誠敏,等. 三家資源發(fā)現(xiàn)系統(tǒng)的調(diào)研、測試和評估[J].圖書館雜志,2013,(12):82-86.
[4] 孫宇,張磊,劉煒. 圖書館資源發(fā)現(xiàn)系統(tǒng)選型研究[J].圖書館雜志,2013,(12):63-70.
[5] NISO ODI Survey Report Reflections and Perspectives on Discovery Services [EB/OL]. http://www.niso.org/apps/group_public/download.php/9977/NISO%20ODI%20Survey%20Report%20Final.pdf,2013-07-05.
[6] 陳定權(quán),盧玉紅,楊敏. 圖書館資源發(fā)現(xiàn)系統(tǒng)的現(xiàn)狀與趨勢[J].圖書情報工作,2012,56(7):44-48.
[7] 胡瑋.“985工程”高校圖書館資源發(fā)現(xiàn)系統(tǒng)現(xiàn)狀分析和思考[J].圖書學(xué)研究,2013,(16):43-48.
(責(zé)任編輯:傅正)