摘 要 資源發(fā)現(xiàn)系統(tǒng)近年來在國內(nèi)外圖書館發(fā)展迅速,論文針對目前公共圖書館資源發(fā)現(xiàn)系統(tǒng)的應(yīng)用現(xiàn)狀,以及技術(shù)發(fā)展對資源統(tǒng)一發(fā)現(xiàn)系統(tǒng)的推進(jìn),結(jié)合上海圖書館資源發(fā)現(xiàn)系統(tǒng)的運行以及維護(hù)情況,介紹了公共圖書館資源發(fā)現(xiàn)系統(tǒng)目前存在的應(yīng)用問題,探討了資源發(fā)現(xiàn)系統(tǒng)改進(jìn)發(fā)展的方向。
關(guān)鍵詞 資源發(fā)現(xiàn) 知識發(fā)現(xiàn) 發(fā)現(xiàn)服務(wù) 資源發(fā)現(xiàn)系統(tǒng) 公共圖書館
分類號 G254.92
DOI 10.16810/j.cnki.1672-514X.2019.04.016
Abstract The resource discovery system has made rapid development at domestic and overseas libraries in recent years. This paper presents the current application situation of the resource discovery system in public libraries, and the advancement of technology development to the unified resource discovery system. Combined with operation and maintenance of resource discovery system in Shanghai Library, the existing problems of the resource discovery system of the public library and the direction of the future development of the discovery system are discussed.
Keywords Resource discovery. Knowledge discovery. Discovery service. Resource discovery system. Public library.
2009年,基于全網(wǎng)域的資源發(fā)現(xiàn)服務(wù)(Web-Scale Discovery Services)引入圖書館[1],用來揭示館藏資源。該系統(tǒng)基于海量的元數(shù)據(jù)集合,具有技術(shù)的先進(jìn)性和檢索界面易用性等優(yōu)勢,可以對圖書館自建和外購資源統(tǒng)一發(fā)現(xiàn)和獲取。截至2016年,國內(nèi)985高校圖書館資源發(fā)現(xiàn)系統(tǒng)的覆蓋率已達(dá)到100%[2],但是,省級公共圖書館對此類發(fā)現(xiàn)系統(tǒng)的使用還比較少。上海圖書館作為全國首家嘗試在公共圖書館提供發(fā)現(xiàn)服務(wù)的機(jī)構(gòu),于2013年開始探索發(fā)現(xiàn)系統(tǒng)在公共圖書館的應(yīng)用,并于2014年上線了“上圖發(fā)現(xiàn)”,實現(xiàn)了基于元數(shù)據(jù)的館藏數(shù)字資源和書目資源的統(tǒng)一檢索。經(jīng)過三年多的服務(wù)應(yīng)用,上海圖書館在積累經(jīng)驗的同時,也在使用過程中發(fā)現(xiàn)了一些問題。對此,本文將結(jié)合上海圖書館資源發(fā)現(xiàn)系統(tǒng)的運行及維護(hù)情況,介紹公共圖書館資源發(fā)現(xiàn)系統(tǒng)在應(yīng)用中存在的問題,并探討未來公共圖書館資源發(fā)現(xiàn)系統(tǒng)的改進(jìn)和發(fā)展方向。
1 公共圖書館資源發(fā)現(xiàn)系統(tǒng)應(yīng)用現(xiàn)狀
美國圖書自動化專家Marshall Breeding對發(fā)現(xiàn)產(chǎn)品的定義為:“發(fā)現(xiàn)產(chǎn)品包含一個面向用戶的圖書館資源查找界面,并通過適當(dāng)?shù)臋C(jī)制使用戶獲得感興趣的條目。發(fā)現(xiàn)產(chǎn)品往往與特定的圖書館資源管理應(yīng)用程序無關(guān),如圖書館集成系統(tǒng)、圖書館服務(wù)平臺、數(shù)據(jù)倉儲或電子資源管理系統(tǒng)等。在大多數(shù)情況下,它們可以訪問各種類型的資源,獨立于管理平臺。發(fā)現(xiàn)產(chǎn)品提供了一個具有搜索和檢索功能的接口,通常具有基于搜索結(jié)果的相關(guān)性排序功能,可以根據(jù)特定類別、著者或日期范圍限定結(jié)果的分面。發(fā)現(xiàn)產(chǎn)品使用合法的訪問授權(quán)、內(nèi)容類型和許可的機(jī)制來提供對資源的訪問。這些機(jī)制包括識別資源當(dāng)前的物理位置和狀態(tài),以提供連接、直接瀏覽或下載文章、章節(jié)、電子書,或其它電子文本,并提供數(shù)字圖像或多媒體內(nèi)容。發(fā)現(xiàn)產(chǎn)品也可以具有社會特征,使圖書館的用戶可以評論、評價或推薦分享,與其他用戶進(jìn)行動態(tài)交互”[3]。目前主流的發(fā)現(xiàn)服務(wù)產(chǎn)品和公司包括EBSCO Discovery Service(EBSCO)、Encore Discovery Solution(Innovative Interfaces)、Primo(ExLibris, a ProQuest Company)、Summon(ProQuest)、Worldcat Local(OCLC)、Enterprise(SirsiDynix)等[4]。Marshall Breeding的 《Library Technology Reports》 曾對美國、英國、加拿大、澳大利亞等地區(qū)的396家圖書館進(jìn)行了資源發(fā)現(xiàn)系統(tǒng)的問卷調(diào)研,其中包含96家公共圖書館,對于發(fā)現(xiàn)產(chǎn)品的總體性能的滿意程度,以及用戶界面的友好性均值最高的是EBSCO Discovery Service(EDS),館藏揭示的全面性得分最高的是Worldcat Local,相關(guān)性排序結(jié)果的有效性得分最高的是VuFind[5]。
目前,國內(nèi)23個省級公共圖書館中,遼寧省圖書館使用Primo資源發(fā)現(xiàn)平臺,山東省圖書館使用百度知識發(fā)現(xiàn),吉林省圖書館和南京圖書館使用超星發(fā)現(xiàn)系統(tǒng)。直轄市公共圖書館中,首都圖書館、重慶圖書館使用Primo發(fā)現(xiàn)平臺,上海圖書館使用EDS(FIND+) 本地化的資源發(fā)現(xiàn)平臺。國家圖書館沒有使用商業(yè)化的成品軟件,而是采用了分布式系統(tǒng)架構(gòu)和大數(shù)據(jù)技術(shù)開發(fā)了“文津搜索”系統(tǒng),比起商業(yè)軟件系統(tǒng)架構(gòu)更加靈活,可擴(kuò)展性好[6]。
2 技術(shù)進(jìn)步對資源統(tǒng)一發(fā)現(xiàn)系統(tǒng)的推動
資源發(fā)現(xiàn)系統(tǒng)基于元數(shù)據(jù)的整合檢索,從架構(gòu)上被認(rèn)為是早前聯(lián)邦檢索的替代產(chǎn)品,聯(lián)邦檢索在資源檢索時實現(xiàn)多個庫的同時跨庫檢索,主要限制因素是缺少結(jié)果的相關(guān)性排序,檢索結(jié)果返回需要較長的時間,以及減少了數(shù)據(jù)庫本地接口組件提供的搜索功能[7]。但是從另一個角度來看,聯(lián)邦檢索對于不便集成到資源發(fā)現(xiàn)系統(tǒng)里的數(shù)據(jù)可以實現(xiàn)初步的統(tǒng)一檢索和揭示。國外多家高校圖書館實現(xiàn)了基于Bento盒子展示的聯(lián)邦檢索系統(tǒng),檢索結(jié)果采用多窗格布局模式,系統(tǒng)在發(fā)現(xiàn)服務(wù)平臺的基礎(chǔ)上,通過APIs(Application Programming Interfaces) 接口服務(wù),實現(xiàn)同時檢索展示館藏目錄、數(shù)字資源、自建資源數(shù)據(jù)庫等內(nèi)容,比較靈活地實現(xiàn)館藏所有資源的統(tǒng)一檢索發(fā)現(xiàn)服務(wù)[8]。
近年來,基于Web2.0功能的發(fā)現(xiàn)展示開源平臺也取得了較快的發(fā)展,目前比較流行的開源軟件平臺有Drupal、Vufind、Blacklight、Koha等,都可以實現(xiàn)檢索結(jié)果的分面顯示和Web 2.0功能。業(yè)內(nèi)比較熟悉的Vufind平臺,最早被開發(fā)用來實現(xiàn)OPAC 2.0的相關(guān)功能,包含分面瀏覽、檢索結(jié)果排序、評論,以及第三方資源的嵌入等功能[9]。
隨著開源檢索系統(tǒng)、Web Services、APIs等技術(shù)的發(fā)展成熟,圖書館可以采用更加靈活的方式實現(xiàn)圖書館資源的發(fā)現(xiàn)服務(wù)[10],在網(wǎng)絡(luò)級發(fā)現(xiàn)服務(wù)系統(tǒng)架構(gòu)(圖1)[11]的基礎(chǔ)上,通過建立一個以發(fā)現(xiàn)為目的的中心索引集和模型,促進(jìn)構(gòu)建更加健壯的、易擴(kuò)展的、可互操作的、異構(gòu)分布的發(fā)現(xiàn)系統(tǒng)。
舉例來說,EBSCO提供了EDS API接口服務(wù),圖書館可以使用API接口來實現(xiàn)學(xué)術(shù)資源的發(fā)現(xiàn)服務(wù),對于館藏資源、自建數(shù)據(jù)庫可以使用另外的商業(yè)發(fā)現(xiàn)平臺軟件,或是自建索引數(shù)據(jù)庫,而對于界面展示,可以使用發(fā)現(xiàn)系統(tǒng)的原生平臺,也可以使用開源系統(tǒng),如EDS API(或其它發(fā)現(xiàn)系統(tǒng)的API接口)加前端展示平臺,可利用Drupal、Vufind、Blacklight、Koha等開源軟件實現(xiàn),斯坦福大學(xué)圖書館的EDS API和VuFind的架構(gòu)[12],印第安納大學(xué)圖書館EDS API和Blacklight的架構(gòu)[13]即是如此。圖書館也可以自己搭建基于本地元數(shù)據(jù)檢索服務(wù)的Solr服務(wù)器實現(xiàn)排序,通過Vufind/Blacklight或其它平臺進(jìn)行展示,如哥倫比亞大學(xué)圖書館元數(shù)據(jù)加Solr引擎加Blacklight的架構(gòu),實現(xiàn)了“Quicksearch performs a combined search”的組合檢索,可同時搜索館藏目錄(圖書、期刊、在線資源、視頻等)、電子資源(期刊、電子書、學(xué)位論文等)、學(xué)院公開(機(jī)構(gòu)庫)、圖書館網(wǎng)站、地理數(shù)據(jù)(哥倫比亞地理空間數(shù)據(jù)集目錄)等,檢索結(jié)果分區(qū)塊顯示[14]。還有一種模式是新加坡國家圖書館的OneSearch系統(tǒng),只有電子期刊資源使用了發(fā)現(xiàn)系統(tǒng)接口,其它所有館藏資源元數(shù)據(jù)通過Solr構(gòu)建索引,圖書館自己完成與其它資源的整合、揭示和展現(xiàn)[15]。
此外,隨著移動通信信息技術(shù)的發(fā)展,實現(xiàn)了基于HTML5的頁面自適應(yīng)功能,以滿足不同終端、移動用戶的訪問需求。通過Web Service服務(wù),可以使發(fā)現(xiàn)系統(tǒng)獨立于圖書館集成管理系統(tǒng)。隨著技術(shù)手段的進(jìn)步,通過更加靈活的系統(tǒng)架構(gòu)實現(xiàn)發(fā)現(xiàn)系統(tǒng)的服務(wù)功能是未來發(fā)展的趨勢。
新技術(shù)發(fā)展的同時也推動了圖書館業(yè)務(wù)流程的重組?;谠獢?shù)據(jù)的資源發(fā)現(xiàn)獲取首先要有一個有效的元數(shù)據(jù)收集管理平臺和數(shù)據(jù)管理人員。內(nèi)容管理是關(guān)鍵,對于購買的學(xué)術(shù)資源數(shù)據(jù)庫,需要長期的跟蹤,并熟悉各類數(shù)據(jù)庫資源的情況。系統(tǒng)的構(gòu)建整合也需要專業(yè)的技術(shù)支持團(tuán)隊,現(xiàn)在很多圖書館已經(jīng)采用外包模式,而外包團(tuán)隊的穩(wěn)定和技術(shù)能力至關(guān)重要。同時,還需要系統(tǒng)的長期維護(hù)人員,協(xié)調(diào)各個環(huán)節(jié)的數(shù)據(jù)和業(yè)務(wù)流程。如何提高系統(tǒng)的穩(wěn)定性和適用性,采用高效的業(yè)務(wù)管理流程至關(guān)重要。
3 公共圖書館資源發(fā)現(xiàn)系統(tǒng)發(fā)展探討
3.1 “上圖發(fā)現(xiàn)”基本情況介紹——基于EDS的發(fā)現(xiàn)服務(wù)
上海圖書館2013年申報了“數(shù)字圖書館資源發(fā)現(xiàn)與服務(wù)平臺”項目,開始進(jìn)行資源發(fā)現(xiàn)系統(tǒng)的選型評估,從技術(shù)因素、元數(shù)據(jù)質(zhì)量和覆蓋率、全文獲取、功能性能和服務(wù)能力等多個方面進(jìn)行考察評估[17],經(jīng)過一年半的需求調(diào)研、資源整理、廠商測評、招標(biāo)實施、平臺測試,于2014年7月開始試運行。該發(fā)現(xiàn)系統(tǒng)采用了EDS(Find+) 本地化的資源發(fā)現(xiàn)服務(wù),當(dāng)時主要考慮的因素是本地技術(shù)支持強(qiáng),EDS元數(shù)據(jù)質(zhì)量高,以及EBSCO數(shù)據(jù)庫的支持。
資源架構(gòu)主要分為學(xué)術(shù)資源和館藏資源。學(xué)術(shù)資源分為外文學(xué)術(shù)資源(使用EDS發(fā)現(xiàn)服務(wù))和中文學(xué)術(shù)資源(Find+中文發(fā)現(xiàn)平臺),按檢索關(guān)鍵詞來進(jìn)行判別區(qū)分;館藏資源包含了館藏書目和數(shù)字閱讀資源(由Find+提供技術(shù)支持)。
(1)服務(wù)方式上,F(xiàn)ind+的服務(wù)器在阿里云上,外文資源檢索是通過阿里云服務(wù)器將請求發(fā)送到美國EBSCO EDS云服務(wù)器,F(xiàn)ind+阿里云服務(wù)器只傳遞檢索請求,檢索任務(wù)的完成都在美國服務(wù)器端。中文資源發(fā)現(xiàn)訪問的是Find+服務(wù)器群上的中文發(fā)現(xiàn),包含維普萬方等元數(shù)據(jù),通過一臺館內(nèi)服務(wù)器跳轉(zhuǎn),獲取訪問權(quán)限,全文鏈接使用的是官網(wǎng)資源。館藏書目元數(shù)據(jù)和自建資源(市民數(shù)字閱讀) 的元數(shù)據(jù)架構(gòu)在上圖自有服務(wù)器上。
(2)檢索策略方面,對于已購資源盡可能全面地覆蓋;對于本館未購資源,發(fā)現(xiàn)與服務(wù)平臺提供元數(shù)據(jù)的,一并納入統(tǒng)一檢索。系統(tǒng)實現(xiàn)了館藏外文學(xué)術(shù)資源數(shù)據(jù)庫88%的覆蓋率,除了外文數(shù)據(jù)庫以外,還包含二次文獻(xiàn)數(shù)據(jù)庫、OA資源等;不包含光盤資源、專利、標(biāo)準(zhǔn)、參考工具、歷史文獻(xiàn),以及不再更新的數(shù)字資源。中文學(xué)術(shù)資源由于元數(shù)據(jù)授權(quán)等問題,目前包含萬方和維普兩種學(xué)術(shù)資源數(shù)據(jù)庫。學(xué)術(shù)資源元數(shù)據(jù)根據(jù)每年館內(nèi)資源新增和變化進(jìn)行更新,館藏目錄數(shù)據(jù)定期更新。
(3)檢索功能包含了基本檢索、檢索結(jié)果排序、分面/聚類、高級檢索、相關(guān)檢索、二次檢索等功能,基本滿足了讀者的各類檢索需求;可進(jìn)行全文下載,通過LinkSource鏈接全文;提供A-to-Z資源導(dǎo)航、RSS訂閱、檢索結(jié)果導(dǎo)出、郵件等功能。系統(tǒng)整合了上圖用戶認(rèn)證接口,支持單點登錄,同時支持網(wǎng)上用戶注冊。用戶登錄一次后可訪問數(shù)據(jù)庫的全文,無需再次登錄。目前在局域網(wǎng)內(nèi)登錄即可獲取全文,館外用戶獲取外文資源需要登錄VPN。
(4)“館藏目錄”部分包括OPAC的所有館藏書目數(shù)據(jù),在揭示OPAC信息的基礎(chǔ)上,擴(kuò)展提供封面、目錄、簡介等多種書目增值服務(wù)信息。此外,系統(tǒng)最初建設(shè)時,對“市民數(shù)字閱讀”的資源進(jìn)行了整合,囊括了30余萬種來自方正、龍源、博看、新華e店、盛大等9家廠商的電子圖書、期刊、報紙等電子資源,在檢索結(jié)果中實現(xiàn)了“紙電合并”功能,能夠進(jìn)行統(tǒng)一檢索。上海圖書館是國內(nèi)首家大規(guī)模引入網(wǎng)絡(luò)文學(xué)的公共圖書館,在系統(tǒng)建設(shè)初期取得了不錯的反響。與盛大文學(xué)的合作,為讀者提供了包括數(shù)字圖書、網(wǎng)絡(luò)文學(xué)、數(shù)字報刊等數(shù)字商品,最多的時候收錄了盛大文學(xué)1.1萬種網(wǎng)絡(luò)文學(xué)作品。新華e店是新華傳媒打造的新華數(shù)字書店,品種覆蓋文藝、社科、生活、健康、文化、教育等各個類別,主打群眾喜愛閱讀的圖書品種,作品以近三年新書為主,部分圖書做到線上線下同步發(fā)售,最初包含3萬余種電子圖書。目前,由于兩家公司業(yè)務(wù)變更、資源調(diào)整,原先提供服務(wù)的“市民數(shù)字閱讀”的很多資源已經(jīng)下架。對此,數(shù)字閱讀正在探索新的服務(wù)模式,以前“市民數(shù)字閱讀”資源考慮的是一次性導(dǎo)入的問題,今后將通過建設(shè)內(nèi)容管理平臺EPUB,通過直接訪問接口或數(shù)據(jù)庫的方式提供更優(yōu)質(zhì)的服務(wù)。
3.2 “上圖發(fā)現(xiàn)”平臺運行維護(hù)情況以及存在的問題
“上圖發(fā)現(xiàn)”投入使用以來,系統(tǒng)經(jīng)過了不斷的改進(jìn)和優(yōu)化,主要包含以下幾個方面。
(1) 中文檢索結(jié)果的排序優(yōu)化,以及資源的合并去重。由于EDS平臺本身采用了優(yōu)化的相關(guān)度排序,如同Google/Baidu等搜索引擎的做法,先經(jīng)過詞頻/密度分析,關(guān)鍵詞鍵入后,再按命中檢索詞匹配主題詞、篇名/刊名、關(guān)鍵詞、摘要、全文等不同的權(quán)重計算進(jìn)行排序。針對中文檢索結(jié)果出現(xiàn)的完全匹配的結(jié)果沒有排在第一頁的問題,經(jīng)過優(yōu)化后,采用默認(rèn)“所有字段”,按檢索關(guān)鍵詞和標(biāo)題完全一致的排第一,然后再按檢索關(guān)鍵詞在所有字段中出現(xiàn)的詞頻詞密度排序。
(2) 從原先A-to-Z期刊導(dǎo)航功能升級為Full Text Finder,新版本改變了原先的期刊分類方式,采用按主題劃分,并增加了智能補(bǔ)充拼寫功能。
(3) 還有一些細(xì)微處的用戶體驗改進(jìn),如檢索歷史默認(rèn)為按時間順序排列,不方便用戶查看,優(yōu)化后改為按降序排列。
“上圖發(fā)現(xiàn)”平臺使用過程中還存在諸多問題,包括:系統(tǒng)存在一定程度的不穩(wěn)定性,服務(wù)器數(shù)據(jù)庫問題曾導(dǎo)致用戶收藏夾、檢索歷史內(nèi)容丟失;緩存服務(wù)問題導(dǎo)致全文下載無法打開;云服務(wù)不穩(wěn)定導(dǎo)致檢索結(jié)果為“0”等情況。此外,統(tǒng)計數(shù)據(jù)無法真實反映資源發(fā)現(xiàn)系統(tǒng)到各數(shù)據(jù)庫的鏈接使用情況,由于外文數(shù)據(jù)的訪問統(tǒng)計是根據(jù)訪問文章的詳細(xì)頁做的數(shù)據(jù)庫統(tǒng)計,名稱通常和所訂購的數(shù)據(jù)庫名無法對應(yīng)。而EDS本身自帶的統(tǒng)計平臺,由于檢索的策略問題,數(shù)據(jù)庫訪問統(tǒng)計數(shù)據(jù)量非常大,對于同一個檢索會同時產(chǎn)生多次訪問,無法準(zhǔn)確統(tǒng)計數(shù)據(jù)庫訪問的情況。平臺建設(shè)初期設(shè)想是通過資源發(fā)現(xiàn)系統(tǒng)中各類資源的使用情況來調(diào)整資源采購策略,但是館外獲取的外文全文數(shù)據(jù)庫資源有限,加上有的中文數(shù)據(jù)庫受版權(quán)限制不能通過元數(shù)據(jù)揭示,這些都導(dǎo)致了發(fā)現(xiàn)系統(tǒng)使用率不高,也缺乏具體數(shù)據(jù)庫訪問的統(tǒng)計數(shù)據(jù),無法起到?jīng)Q策支持作用。
3.3 公共圖書館資源發(fā)現(xiàn)系統(tǒng)應(yīng)用問題
(1)目前,館外全文獲取實現(xiàn)方式主要是通過VPN進(jìn)行授權(quán)訪問,或是通過EZPROXY代理認(rèn)證。使用VPN方式最大的問題在于只支持靜態(tài)IP數(shù)據(jù)庫,早前的ProQuest、Springer都采用了CDN加速服務(wù),使用動態(tài)IP,對于這類資源VPN方式無法實現(xiàn)遠(yuǎn)程授權(quán)訪問。此外,VPN對于系統(tǒng)環(huán)境的要求,以及首次使用需要安裝插件等操作影響了用戶的使用體驗。
(2)資源發(fā)現(xiàn)系統(tǒng)無法實現(xiàn)與圖書館集成管理系統(tǒng)的實時交互,存在數(shù)據(jù)滯后,以及系統(tǒng)缺少相關(guān)接口導(dǎo)致的功能實現(xiàn)方面的缺陷,書目檢索功能需要強(qiáng)化。
(3)所有發(fā)現(xiàn)系統(tǒng)的共同的問題是外文學(xué)術(shù)搜索不同來源資源的重復(fù)問題,目前還無法解決。由于發(fā)現(xiàn)系統(tǒng)是基于元數(shù)據(jù)的,直接揭示到期刊/文章,而圖書館已購數(shù)據(jù)庫中存在期刊重復(fù)問題,所以無法判斷期刊的來源數(shù)據(jù)庫,也無法為采訪部門提供相關(guān)的參考信息。
(4)對于專業(yè)的圖書館用戶和參考咨詢館員來說,查全并不意味著好用,需要進(jìn)行判斷篩選,專業(yè)用戶往往更傾向于直接查找對應(yīng)的數(shù)據(jù)庫,有針對性地找到所需要的資源。有研究表明基于全網(wǎng)域的發(fā)現(xiàn)服務(wù)比單個數(shù)據(jù)庫的效率要低[18]。
(5)發(fā)現(xiàn)系統(tǒng)廠商缺少必要的系統(tǒng)監(jiān)督機(jī)制,用戶在使用過程中往往會發(fā)現(xiàn)很多問題,用戶體驗有待進(jìn)一步優(yōu)化。
3.4 上海圖書館下一代發(fā)現(xiàn)服務(wù)探索
上海圖書館新版網(wǎng)站主頁采用發(fā)現(xiàn)系統(tǒng)作為圖書館統(tǒng)一資源發(fā)現(xiàn)門戶,要提高系統(tǒng)的穩(wěn)定性、健全性,以提供更好的用戶體驗。系統(tǒng)改進(jìn)發(fā)展的主要方向有:頁面對移動終端的支持,實現(xiàn)響應(yīng)式頁面設(shè)計;納入更多的館藏數(shù)字資源,包括全國報刊索引、歷史文獻(xiàn)資源等,實現(xiàn)自建資源的發(fā)現(xiàn)調(diào)整升級;對于沒有全文的資源,提供文獻(xiàn)傳遞服務(wù);改變館外全文獲取的授權(quán)方式;完善統(tǒng)計分析功能。
EDS發(fā)現(xiàn)平臺外文及OA元數(shù)據(jù)資源豐富,相關(guān)性排序效率高,全文鏈接方式多元,包含EBSCOhost全文數(shù)據(jù)庫、智能鏈接SmartLink、DOI Crossref全文鏈接、出版社提供直接連接CustomLink、鏈接解析器Link Resolver等,目前發(fā)現(xiàn)系統(tǒng)可擴(kuò)展的功能主要有:檢索結(jié)果集按照某個學(xué)科/主題進(jìn)行定制、檢索詞學(xué)術(shù)趨勢分析、可視化展示、基于發(fā)現(xiàn)數(shù)據(jù)的學(xué)科推薦、按學(xué)科進(jìn)行資源導(dǎo)航、表達(dá)式檢索功能等;提供開放的接口服務(wù),如檢索框接口,用戶收藏、檢索歷史接口,交互認(rèn)證接口等。EDS原生平臺在很多方面都做了嘗試,如提供相關(guān)主題擴(kuò)展檢索,PlumPrint補(bǔ)充計量學(xué)指標(biāo)統(tǒng)計,提供能夠預(yù)測讀者意圖、突出顯示內(nèi)容和讀者互動的APPs,實現(xiàn)了全文鏈接的自動檢查,并與百度學(xué)術(shù)進(jìn)行了整合(包含百度學(xué)術(shù)檢索結(jié)果推薦、全文鏈接和被引情況等),具備翻譯和建議詞表,實現(xiàn)了基于集團(tuán)文獻(xiàn)傳遞的電子資源共享,可以進(jìn)行引文檢索,以及基于Google Analytics、百度統(tǒng)計、PIWIK開源統(tǒng)計軟件的實時用戶訪問統(tǒng)計分析等。同時,平臺采用了HTML5技術(shù),實現(xiàn)了頁面自適應(yīng)功能,滿足了讀者在移動終端上的訪問。
在未來的發(fā)展過程中,為了實現(xiàn)更靈活的異構(gòu)數(shù)據(jù)的整合揭示和發(fā)現(xiàn)展示,發(fā)現(xiàn)平臺可以僅提供作為學(xué)術(shù)資源元數(shù)據(jù)整合和檢索排序的支撐。圖書館可以使用開源軟件構(gòu)建發(fā)現(xiàn)層,或者是購買商業(yè)軟件產(chǎn)品實現(xiàn)發(fā)現(xiàn)系統(tǒng)的檢索和展示;后臺除了自建、開放存取以及授權(quán)的元數(shù)據(jù)以外,還可以通過發(fā)現(xiàn)系統(tǒng)集成商提供的API接口調(diào)用實現(xiàn)元數(shù)據(jù)的統(tǒng)一檢索和獲取。圖書館可以根據(jù)自有資源建立索引數(shù)據(jù)庫實現(xiàn)資源的索引排序,也可以調(diào)用商業(yè)資源發(fā)現(xiàn)軟件產(chǎn)品的API接口,這種方式使得系統(tǒng)架構(gòu)更加靈活,滿足圖書館各類異構(gòu)資源的檢索展示需求。
作為上海圖書館新一代圖書館服務(wù)系統(tǒng)項目的一個組成部分,資源發(fā)現(xiàn)系統(tǒng)的定位是支持未來數(shù)據(jù)服務(wù)的基礎(chǔ)系統(tǒng)。如何利用好現(xiàn)有系統(tǒng),實現(xiàn)更多的功能擴(kuò)展,管理好數(shù)據(jù),并將這些數(shù)據(jù)揭示給圖書館的各類用戶,系統(tǒng)如何架構(gòu),是當(dāng)前要探討的主要內(nèi)容。圖2是我們目前的一些設(shè)想,資源檢索可以使用成熟的發(fā)現(xiàn)產(chǎn)品,或是其提供的API接口,通過和本地Solr索引服務(wù)的整合,采用混合的、多層次的、更靈活的架構(gòu)實現(xiàn)方式,實現(xiàn)各類異構(gòu)數(shù)據(jù)的統(tǒng)一發(fā)現(xiàn)服務(wù)。在實現(xiàn)過程中,構(gòu)建有效的資源索引發(fā)現(xiàn)服務(wù)和增強(qiáng)檢索結(jié)果的相關(guān)性排序是發(fā)現(xiàn)服務(wù)要解決的關(guān)鍵性問題。
4 結(jié)語
《中華人民共和國公共圖書館法》總則里提到:提高公共圖書館的服務(wù)效能,需要發(fā)揮科技在公共圖書館建設(shè)、管理和服務(wù)中的作用,利用好現(xiàn)代信息技術(shù)和傳播技術(shù),提高圖書館服務(wù)質(zhì)量和水平。公共圖書館發(fā)現(xiàn)系統(tǒng)面向大眾提供服務(wù)時,既要做好面向大眾的資源揭示服務(wù),也要考慮專業(yè)用戶的需求,能夠提供按主題/學(xué)科的資源定制服務(wù)。在明確系統(tǒng)服務(wù)群體的基礎(chǔ)上,做好宣傳推廣工作,加強(qiáng)用戶的引導(dǎo)和交流,重視讀者服務(wù)中心等核心用戶群,定期進(jìn)行推廣培訓(xùn)。正如上海圖書館原館長吳建中先生所說:“各類系統(tǒng)的構(gòu)建實施都要以更好地支撐圖書館服務(wù)為目的,通過技術(shù)創(chuàng)新、服務(wù)創(chuàng)新、手段創(chuàng)新不斷提升圖書館的服務(wù)效能。”
參考文獻(xiàn):
GROSS J, SHERIDAN L. Web scale discovery:the user experience[J]. New Library World,2011,112(5/6):236-247.
陳芳.“985 工程”高校圖書館發(fā)現(xiàn)系統(tǒng)檢索功能調(diào)研分析[J].大學(xué)圖書情報學(xué)刊,2017,35(5):113-119.
Major Discovery Products[EB/OL].[2018-02-06]. https://librarytechnology.org/discovery/.
BURKE J J, TUMBLESON B E. Search systems and finding tools[R]. Library Technology Reports,2016,52(2):17-23.
BREEDING M. Library resource discovery products: context, library perspectives, and vendor positions[R].Library technology reports,2014,50(1):7,11,16,21.
張紅.基于大數(shù)據(jù)技術(shù)的資源發(fā)現(xiàn)平臺構(gòu)建:以國家圖書館“文津搜索”系統(tǒng)為例[J].數(shù)字圖書館論壇,2016(1):61-67.
LI F, THOMES C. Implementing discipline-specific searches in EBSCO Discovery Service[J]. New Library World,2014,115(3/4):102-115.
劉偉成, MISCHO W, SCHLEMBACH M, 等.一種基于Bento模式的聯(lián)邦檢索系統(tǒng)[J].圖書情報工作,2017,61(19):113-121.
張平杉.開源OPAC 2.0:VuFind應(yīng)用研究[J].現(xiàn)代圖書情報技術(shù),2008,24(10):85-89.
BABU B P, KRISHNAMURTHY M. Library automation to resource discovery: a review of emerging challenges[J]. The Electronic Library,2013,31(4):433-451.
THOMPSON J. Implementing web-scale discovery services: a practical guide for librarians[M]. Lanham, Maryland: The Rowman&Littlefield Publishing Group,Inc.,2014:10.
Stanford libraries[EB/OL].[2018-01-23].http://library.stanford.edu/.
Indiana University Bloomington[EB/OL].[2018-01-23].https://libraries.indiana.edu/.
Columbia University Libraries[EB/OL].[2018-01-23]. http://library.columbia.edu/index.html.
OneSearch[EB/OL].[2018-01-23].http://search.nlb.gov.sg/.
張平杉,章偉煊.新一代開源OPAC系統(tǒng)比較研究[J]. 現(xiàn)代圖書情報技術(shù),2011,27(2):21-28.
孫宇,張磊,劉煒.圖書館資源發(fā)現(xiàn)系統(tǒng)選型研究[J]. 圖書館雜志,2013,32(12):63-70.
LEE B, CHUNG E. An analysis of web-scale discovery services from the perspective of users relevance judgment[J]. The Journal of Academic Librarianship, 2016(42):529-534.