葛夢(mèng)蕊
摘 要 發(fā)現(xiàn)系統(tǒng)是數(shù)字資源整合的新趨勢(shì),論文通過(guò)網(wǎng)絡(luò)調(diào)查和實(shí)際體驗(yàn)Summon、EDS、Primo、超星發(fā)現(xiàn)、讀秀學(xué)術(shù)搜索、e讀等發(fā)現(xiàn)系統(tǒng)在圖書(shū)館的應(yīng)用情況,對(duì)發(fā)現(xiàn)系統(tǒng)的發(fā)展及含義進(jìn)行介紹,從元數(shù)據(jù)、檢索與界面、功能架構(gòu)、商務(wù)因素4方面對(duì)以上6個(gè)系統(tǒng)進(jìn)行對(duì)比,進(jìn)而提出增加資源覆蓋量、提高元數(shù)據(jù)版權(quán)意識(shí)、加強(qiáng)系統(tǒng)開(kāi)放性、規(guī)范相關(guān)性排序結(jié)果、輔助整合圖書(shū)館資源等完善我國(guó)發(fā)現(xiàn)系統(tǒng)功能的建議。
關(guān)鍵詞 資源發(fā)現(xiàn)系統(tǒng) 數(shù)字資源整合 圖書(shū)館
分類(lèi)號(hào) G250.7
DOI 10.16810/j.cnki.1672-514X.2017.01.014
Features Analysis and Enlightenment of Resources Discovery System at Home and Abroad
Ge Mengrui
Abstract Discovery System is a new trend of digital resource integration. This paper investigates the application status in libraries of Summon, EDS, Primo, Superstar discovery, Duxiu academic search and eduChina by Internet investigation and practical operation. It introduces the meaning and development of resources discovery system, and compares those discovery systems from the aspects of metadata, retrieval and interface, functional architecture and business factors. In addition, it puts forward several suggestions to improve the functions of systems in China, such as increasing the amount of resources, improving the copyright awareness of metadata, strengthening the openness of system, standardizing the relevance ranking results, as well as assisting the integration of library resources.
Keywords Resources discovery system. Digital resource integration. Library.
1 發(fā)現(xiàn)系統(tǒng)產(chǎn)生背景
追溯發(fā)現(xiàn)系統(tǒng)的淵源,要從20世紀(jì)90年代中期開(kāi)始。隨著信息數(shù)量的快速增長(zhǎng),許多用戶面對(duì)無(wú)數(shù)的信息系統(tǒng)、眾多異構(gòu)接口和內(nèi)容各異的機(jī)構(gòu)數(shù)據(jù)庫(kù)無(wú)從選擇。為了解決這一問(wèn)題,Google于1998年問(wèn)世,以獨(dú)有的信息門(mén)戶吸引了無(wú)數(shù)用戶。與此同時(shí),在圖書(shū)館界和學(xué)術(shù)界,其他的信息發(fā)現(xiàn)與傳遞系統(tǒng)(與圖書(shū)館的ILS相分離的系統(tǒng))也開(kāi)始出現(xiàn),包括機(jī)構(gòu)資源庫(kù)、課程管理、電子存儲(chǔ)和數(shù)字館藏管理系統(tǒng)等。這些系統(tǒng)給當(dāng)時(shí)的圖書(shū)館和機(jī)構(gòu)提供了更多保存、發(fā)現(xiàn)和傳遞信息的額外渠道。
隨后,圖書(shū)館系統(tǒng)商效仿google搜索引擎,開(kāi)發(fā)并推出聯(lián)邦檢索方案,聯(lián)邦檢索,可同時(shí)查找、檢索和充分顯示來(lái)自不同的遠(yuǎn)程機(jī)構(gòu)的信息內(nèi)容。然而聯(lián)邦檢索系統(tǒng)是一種分而治之的異構(gòu)檢索,檢索效果依賴(lài)于各個(gè)數(shù)據(jù)庫(kù)系統(tǒng)的自有功能,在檢索速度、檢索結(jié)果的去重和排序等方面存在難以克服的缺陷[1]。如成本較高、檢索速度慢、使用方法復(fù)雜以及其技術(shù)不能實(shí)現(xiàn)與個(gè)人訂閱數(shù)據(jù)的全面整合等[2]。
在某種意義上說(shuō),以類(lèi)似Z39.50協(xié)議為基礎(chǔ)的聯(lián)合搜索在文獻(xiàn)引用和全文獲取層面上代表了一個(gè)早期的網(wǎng)絡(luò)發(fā)現(xiàn)系統(tǒng)。在20世紀(jì)晚期,圖書(shū)館系統(tǒng)開(kāi)始向“下一代”目錄演化,此種“目錄”可以讓終端用戶在圖書(shū)館提供的檢索界面上實(shí)現(xiàn)具有Web2.0交互特性的標(biāo)注、創(chuàng)建列表、添加書(shū)評(píng)、網(wǎng)站鏈接等應(yīng)用體驗(yàn)[3]。雖然其界面有很多突破和創(chuàng)新,但它仍局限在圖書(shū)館傳統(tǒng)的書(shū)刊資源和本地自建數(shù)字資源的范圍內(nèi)[4]。同時(shí),圖書(shū)館的OPAC系統(tǒng)、資源導(dǎo)航系統(tǒng)、鏈接服務(wù)器、跨庫(kù)檢索系統(tǒng)等也對(duì)資源的組織與獲取帶來(lái)一系列不便,如缺少檢索功能、檢索結(jié)果在去重和排序等方面存在不足;檢索速度不夠快;不能實(shí)現(xiàn)電子資源和實(shí)體資源之間統(tǒng)一揭示等。因此,基于以上系統(tǒng)的種種不足及數(shù)據(jù)處理中的諸多問(wèn)題,在元數(shù)據(jù)檢索、關(guān)聯(lián)檢索等技術(shù)發(fā)展的基礎(chǔ)上,統(tǒng)一資源發(fā)現(xiàn)系統(tǒng)應(yīng)運(yùn)而生。
2 資源發(fā)現(xiàn)系統(tǒng)定義與特征
統(tǒng)一資源發(fā)現(xiàn)系統(tǒng)是系統(tǒng)商通過(guò)與出版社等內(nèi)容提供商的合作,對(duì)海量的、來(lái)自異構(gòu)資源的元數(shù)據(jù)和部分對(duì)象數(shù)據(jù),采用分析、抽取等手段進(jìn)行預(yù)收集(pre—harvested),并將這些數(shù)據(jù)按映射轉(zhuǎn)換規(guī)則轉(zhuǎn)換為標(biāo)準(zhǔn)格式,納入到元數(shù)據(jù)標(biāo)準(zhǔn)體系中,并建立索引,形成一個(gè)預(yù)聚合的元數(shù)據(jù)聯(lián)合索引庫(kù),在本地或者遠(yuǎn)程中心平臺(tái)提供統(tǒng)一的查詢搜索服務(wù)[5]。
根據(jù)Jason Vaughan在《圖書(shū)館技術(shù)報(bào)告中》對(duì)發(fā)現(xiàn)系統(tǒng)特征的概括,我們從五個(gè)方面理解發(fā)現(xiàn)系統(tǒng)的定義。(1)網(wǎng)絡(luò)規(guī)模的發(fā)現(xiàn)。由一個(gè)預(yù)收割形式的主索引和擁有豐富功能的發(fā)現(xiàn)層組成,發(fā)現(xiàn)層提供來(lái)自館藏資源、開(kāi)放資源和訂閱資源的一站式檢索功能。(2)主索引。也被稱(chēng)為基礎(chǔ)索引或統(tǒng)一索引,是預(yù)收割形式的元數(shù)據(jù)與包含WDS服務(wù)的全文文獻(xiàn)的集合,主索引通常包括系統(tǒng)商的全文與引文、OA的全文與元數(shù)據(jù)、已訂購(gòu)數(shù)據(jù)庫(kù)的全文、摘要和索引、館藏目錄的MARC。(3)發(fā)現(xiàn)層。用戶界面與用于發(fā)現(xiàn)、展示,并與圖書(shū)館內(nèi)容系統(tǒng)相互作用的檢索系統(tǒng),如WSD的主索引。(4)預(yù)收割索引。元數(shù)據(jù)與全文文獻(xiàn)系統(tǒng)定期進(jìn)行積累,并在檢索前進(jìn)行預(yù)處理;集中不同來(lái)源的數(shù)據(jù)加工成中央索引。(5)相互許可內(nèi)容。內(nèi)容由圖書(shū)館和WDS出版商共同規(guī)范,使得授權(quán)用戶可以檢索并瀏覽結(jié)果[6]。
發(fā)現(xiàn)系統(tǒng)提供的發(fā)現(xiàn)和傳遞服務(wù)具有以下特征。(1)內(nèi)容。服務(wù)搜集了來(lái)自館藏目錄和遠(yuǎn)程數(shù)據(jù)庫(kù)商提供的可以檢索到文章層面的數(shù)據(jù),基于正規(guī)的系統(tǒng)處理流程,并迅速返回按相關(guān)性排序的檢索結(jié)果,以此建立一個(gè)全方位的大型中心索引。其內(nèi)容既包括圖書(shū)館內(nèi)的資源也包括購(gòu)買(mǎi)的系統(tǒng)商的元數(shù)據(jù)。(2)發(fā)現(xiàn)。擁有單一的檢索框,能提供類(lèi)似Google的用戶檢索體驗(yàn)并帶有高級(jí)檢索功能。(3)傳遞??焖偬峁┌聪嚓P(guān)性排序的結(jié)果,并按照用戶所預(yù)期的直觀化方式予以呈現(xiàn),如使用分面導(dǎo)航可獲取更深入的結(jié)果。(4)彈性。該系統(tǒng)為底層系統(tǒng),既可以被架構(gòu)在圖書(shū)館本地系統(tǒng)中也可放置于遠(yuǎn)程的系統(tǒng)提供商中,相比于傳統(tǒng)的圖書(shū)館服務(wù),該系統(tǒng)更為開(kāi)放,為圖書(shū)館自行定制服務(wù)提供了更多的自由度[7]。
3 發(fā)現(xiàn)系統(tǒng)對(duì)比分析
3.1 元數(shù)據(jù)
3.1.1 元數(shù)據(jù)來(lái)源
資源發(fā)現(xiàn)系統(tǒng)的元數(shù)據(jù)來(lái)源有四種渠道。(1)圖書(shū)館本地?cái)?shù)據(jù)的上傳。這是圖書(shū)館最基礎(chǔ)也是最傳統(tǒng)的元數(shù)據(jù),包括印刷型的紙質(zhì)圖書(shū)、期刊,也包括館藏系統(tǒng)中的電子資源和數(shù)據(jù)庫(kù)資源,通過(guò)OAI接口、數(shù)據(jù)收割、人工導(dǎo)入等各種方式上傳,經(jīng)發(fā)現(xiàn)系統(tǒng)的統(tǒng)一檢索向用戶提供服務(wù)。(2)圖書(shū)館自建庫(kù)。指根據(jù)其特色資源和自身發(fā)展需要?jiǎng)?chuàng)建的特色數(shù)據(jù)庫(kù),如高校學(xué)位論文庫(kù)、教學(xué)庫(kù)和名師庫(kù)等。因擔(dān)心自建特色資源會(huì)被商業(yè)公司所操控,存在安全隱患,一些圖書(shū)館不愿意將這部分資源予以提供。(3)商業(yè)數(shù)據(jù)庫(kù)資源。發(fā)現(xiàn)系統(tǒng)商與數(shù)據(jù)庫(kù)商簽訂協(xié)議,通過(guò)訂購(gòu)的方式獲取元數(shù)據(jù)資源,以這一方式獲取的元數(shù)據(jù)質(zhì)量最高且不存在版權(quán)問(wèn)題,它是發(fā)現(xiàn)系統(tǒng)最主要的元數(shù)據(jù)來(lái)源。(4)免費(fèi)資源及OA資源。隨著開(kāi)放存取逐步深入人心,網(wǎng)絡(luò)OA資源在學(xué)術(shù)界占有越來(lái)越大的比重,發(fā)現(xiàn)系統(tǒng)也開(kāi)始采用OAI協(xié)議對(duì)這些開(kāi)放數(shù)據(jù)進(jìn)行收割,但使用這一方式獲取的元數(shù)據(jù)在質(zhì)量上遠(yuǎn)不及前幾種方式所獲得的元數(shù)據(jù)。
3.1.2 元數(shù)據(jù)覆蓋范圍
元數(shù)據(jù)是資源發(fā)現(xiàn)系統(tǒng)的基礎(chǔ),發(fā)現(xiàn)系統(tǒng)的元數(shù)據(jù)數(shù)量和可檢索量是決定其易用性的主要指標(biāo)。表1列舉了各系統(tǒng)的元數(shù)據(jù)數(shù)量,其僅為階段性指標(biāo),隨著系統(tǒng)規(guī)模的擴(kuò)大其數(shù)據(jù)總數(shù)也在不斷增加。從資源總量看,各系統(tǒng)相差不大,均集中在9~10億,相比于其他系統(tǒng),數(shù)據(jù)庫(kù)商所開(kāi)發(fā)的EDS、Summon和超星在數(shù)據(jù)占有方面更勝一籌。其原因有兩點(diǎn):首先,他們與多家出版社保持良好的合作,在數(shù)據(jù)集成方面有先天優(yōu)勢(shì);其次,以EDS和Summon為例,對(duì)于一些極具價(jià)值的資源,數(shù)據(jù)庫(kù)商不愿意向其他廠商開(kāi)放,這部分資源只有其自身的發(fā)現(xiàn)系統(tǒng)才能使用,如只有通過(guò)Summon才能獲取ProQuest 的全文數(shù)據(jù),ASP&BSP數(shù)據(jù)庫(kù)也只有通過(guò)EDS才能做全文檢索[8]。從國(guó)內(nèi)外發(fā)現(xiàn)系統(tǒng)的資源覆蓋方面來(lái)看,國(guó)外系統(tǒng)資源覆蓋范圍更廣,對(duì)資源的揭示也更為深入,它們側(cè)重于對(duì)核心期刊文獻(xiàn)的深度獲取,力圖為用戶提供全方位的資源發(fā)現(xiàn)與關(guān)聯(lián)性分析,在中文資源的覆蓋上也逐步與維普等廠商簽約,以獲取中文元數(shù)據(jù)使用權(quán)限;國(guó)內(nèi)的發(fā)現(xiàn)系統(tǒng)更偏重于中文資源,外文僅局限于數(shù)據(jù)層面。
3.1.3 元數(shù)據(jù)質(zhì)量
元數(shù)據(jù)的質(zhì)量關(guān)系到發(fā)現(xiàn)系統(tǒng)本身的質(zhì)量,這里我們從兩個(gè)方面進(jìn)行闡述。(1)數(shù)據(jù)重復(fù)與數(shù)據(jù)規(guī)范不一。各發(fā)現(xiàn)系統(tǒng)在數(shù)據(jù)庫(kù)選取中存在大同小異的情況,數(shù)據(jù)存在大量重復(fù),以超星和讀秀為例,二者均隸屬于超星公司,為此其發(fā)現(xiàn)系統(tǒng)所收錄的元數(shù)據(jù)內(nèi)容幾乎相同,在資源上無(wú)過(guò)多差別。其次,由于發(fā)現(xiàn)系統(tǒng)的數(shù)據(jù)倉(cāng)儲(chǔ)來(lái)自于對(duì)海量數(shù)據(jù)的收割,為此不同來(lái)源的元數(shù)據(jù)在著錄形式上存在差異,給數(shù)據(jù)判斷帶來(lái)許多困難。(2)元數(shù)據(jù)有“薄”“厚”之分。一般來(lái)說(shuō)元數(shù)據(jù)只包含題名、作者、來(lái)源等較少字段的數(shù)據(jù)稱(chēng)為薄數(shù)據(jù),如果在此基礎(chǔ)上增加了如摘要、關(guān)鍵詞、主題等字段則稱(chēng)為厚數(shù)據(jù)。目前,國(guó)內(nèi)外各發(fā)現(xiàn)系統(tǒng)都著力呈現(xiàn)厚數(shù)據(jù),如Summon、Primo的大多數(shù)索引都深入到全文層面;讀秀學(xué)術(shù)發(fā)現(xiàn)在向讀者提供書(shū)目信息的同時(shí)還增加了圖書(shū)前幾頁(yè)的免費(fèi)試讀等。
3.2 檢索與界面
3.2.1 高級(jí)檢索
(1)Summon高級(jí)檢索帶有分面導(dǎo)航功能,包含四個(gè)范圍選項(xiàng),用戶通過(guò)點(diǎn)擊“All Field”下拉菜單選擇基本項(xiàng)(Basic)和高級(jí)項(xiàng)(Advanced),并且可以使用布爾邏輯算符對(duì)這四個(gè)范圍選項(xiàng)進(jìn)行關(guān)聯(lián)與限定,也可以選擇出版時(shí)間范圍、文獻(xiàn)類(lèi)型和語(yǔ)言等進(jìn)一步限制檢索詞。(2)EDS將高級(jí)檢索分為中文檢索和外文檢索,使用者可自行選擇檢索字段和邏輯關(guān)系,如字段中有多個(gè)檢索詞可以增加檢索行數(shù)量。(3)Primo系統(tǒng)一旦調(diào)用高級(jí)搜索功能,之前檢索的結(jié)果會(huì)向屏幕下方移動(dòng),屏幕上會(huì)同時(shí)顯示基本項(xiàng)與高級(jí)項(xiàng)兩種搜索方式的共同結(jié)果。讀者需要選擇資料類(lèi)型和語(yǔ)種,同時(shí)將時(shí)間精確到具體日期。(4)用戶可以在超星的高級(jí)檢索系統(tǒng)中限制每頁(yè)所顯示的信息條目數(shù),同時(shí)專(zhuān)業(yè)檢索項(xiàng)也被包含其中,讀者可按照提示說(shuō)明使用邏輯運(yùn)算進(jìn)行專(zhuān)業(yè)查找。
總體來(lái)說(shuō),EDS高級(jí)檢索項(xiàng)更加靈活精細(xì),不熟悉布爾邏輯運(yùn)算的用戶也可以輕松使用;超星系統(tǒng)則給予用戶更大的選擇空間,同時(shí)為專(zhuān)業(yè)人員提供相應(yīng)服務(wù)。
3.2.2 分面導(dǎo)航
分面導(dǎo)航是通過(guò)篩選從而精簡(jiǎn)檢索結(jié)果的列表項(xiàng),出現(xiàn)在檢索結(jié)果頁(yè)面左下方,各系統(tǒng)功能對(duì)比見(jiàn)表2。Primo基于對(duì)大量讀者使用信息的分析,發(fā)現(xiàn)目標(biāo)文獻(xiàn)的相關(guān)文獻(xiàn),特別是最新的學(xué)術(shù)論文,并將其推薦給用戶[5],與其他系統(tǒng)相比,其分面導(dǎo)航功能更為強(qiáng)大,更強(qiáng)調(diào)一站式發(fā)現(xiàn)與獲取。國(guó)內(nèi)系統(tǒng)沒(méi)有同行評(píng)議項(xiàng),更注重資源的查找功能。Primo和Summon在時(shí)間限定方面都可以使用鼠標(biāo)在滑動(dòng)條內(nèi)拖拽選擇時(shí)間范圍,EDS、讀秀和e讀則需要讀者自行鍵入時(shí)間;其中Summon可以將時(shí)間顯示精確到具體日期,而Primo、EDS、讀秀只能精確到年份。
3.2.3 可視化程度
Primo、Summon、EDS、超星、e讀均涉及了可視化內(nèi)容,在書(shū)刊檢索頁(yè)面,書(shū)封信息會(huì)予以顯示,Primo、Summon的時(shí)間軸拖拽功能也屬可視化結(jié)果。在國(guó)外三個(gè)發(fā)現(xiàn)系統(tǒng)中,Primo的可視化程度較高,在其檢索結(jié)果頁(yè)面的頂部會(huì)顯示相關(guān)論著發(fā)文量的趨勢(shì)圖,橫軸為時(shí)間、縱軸為發(fā)文量。筆者以“信息組織”為關(guān)鍵詞,點(diǎn)擊搜索后進(jìn)入“CHARTS”界面,此界面顯示了三個(gè)以“相關(guān)知識(shí)點(diǎn)”“相關(guān)作者”和“相關(guān)機(jī)構(gòu)”命名的圓球狀分支結(jié)構(gòu)的可視化圖形;兩個(gè)以面積圖和折線圖組合形式顯示的“信息組織-圖書(shū)館學(xué)術(shù)發(fā)展曲線圖”和“信息組織-期刊學(xué)術(shù)發(fā)展曲線圖”;兩個(gè)關(guān)于“核心期刊”和“普通期刊”的扇形統(tǒng)計(jì)圖。北京師范大學(xué)“木鐸搜索”的Primo系統(tǒng)將可視化放在了分面導(dǎo)航中,相關(guān)作者、文獻(xiàn)來(lái)源、主題等也分別以條形圖顯示。在我國(guó)的學(xué)術(shù)發(fā)現(xiàn)系統(tǒng)中,超星提供專(zhuān)門(mén)的“可視化學(xué)術(shù)分析”功能,包括趨勢(shì)分析、知識(shí)圖譜和產(chǎn)出統(tǒng)計(jì)三部分。在趨勢(shì)分析中系統(tǒng)將檢索詞的發(fā)展脈絡(luò)以及同一研究專(zhuān)題不同文獻(xiàn)類(lèi)型增長(zhǎng)趨勢(shì)以折線圖的方式予以顯示;其知識(shí)圖譜類(lèi)和產(chǎn)出統(tǒng)計(jì)與Primo中“CHARTS”界面類(lèi)似,均是對(duì)學(xué)科整體發(fā)展情況的概括。
3.2.4 檢索結(jié)果顯示
資源發(fā)現(xiàn)系統(tǒng)將圖書(shū)館的紙本和電子信息整合,通過(guò)統(tǒng)一的檢索框,將檢索結(jié)果按不同的類(lèi)型展現(xiàn)在用戶面前。在國(guó)外的發(fā)現(xiàn)系統(tǒng)中,Primo的檢索結(jié)果較豐富,包括維基詞條、書(shū)封、網(wǎng)摘目次、書(shū)評(píng)、二維碼、熱門(mén)文章(熱門(mén)文章指與該學(xué)科有關(guān)的全球數(shù)據(jù)庫(kù)中檢索次數(shù)較多的文章)等,對(duì)于檢索結(jié)果的獲取,Primo提供在線全文鏈接(靜態(tài)全文地址)、SFX鏈接(動(dòng)態(tài)匹配全文及更多獲取途徑)、OPAC via Link (鏈接到OPAC)三種不同方式。在國(guó)內(nèi)的發(fā)現(xiàn)系統(tǒng)中,讀秀學(xué)術(shù)搜索呈現(xiàn)給用戶多種檢索結(jié)果類(lèi)型供其選擇,在圖書(shū)查找方面,讀秀可將查找結(jié)果深入到章節(jié)部分,提供圖書(shū)的前言頁(yè)、版權(quán)頁(yè)、目錄頁(yè)及正文部分的試讀,讓用戶在借到圖書(shū)之前就可以對(duì)其內(nèi)容進(jìn)行大致了解。在知識(shí)查找方面,系統(tǒng)將用戶輸入的關(guān)鍵詞深入到每一頁(yè)資料中進(jìn)行查找,如對(duì)結(jié)果不滿意,可以進(jìn)行檢索結(jié)果的二次查找,并可使用多個(gè)關(guān)鍵詞同時(shí)檢索。對(duì)于輸入的每一個(gè)檢索詞均提供檢索詞的英文翻譯、詞典、同義詞和共現(xiàn)詞等相關(guān)資料,以方便用戶選擇和進(jìn)行關(guān)鍵詞的查找。
3.3 功能架構(gòu)
3.3.1 服務(wù)方式
在服務(wù)方式上,Summon、EDS、超星、讀秀均采用云計(jì)算的方式,云計(jì)算模式無(wú)需在本地安裝服務(wù)器,不占用本地資源,是目前的主流模式。Primo所采用的混合模式(云+本地),將元數(shù)據(jù)部署在云端,將館藏資源和自建資源存放于本地。這種模式的好處是:可以消除某些圖書(shū)館不愿意將自有數(shù)據(jù)提供給商業(yè)公司的顧慮;可將某些中文數(shù)據(jù)庫(kù)的元數(shù)據(jù)納入本地元數(shù)據(jù)倉(cāng),部分解決國(guó)外發(fā)現(xiàn)產(chǎn)品不支持中文數(shù)據(jù)庫(kù)的問(wèn)題。
3.3.2 OPAC系統(tǒng)整合
在與本館OPAC整合方面,各發(fā)現(xiàn)系的整合深度存在差距,詳見(jiàn)表3。國(guó)外發(fā)現(xiàn)系統(tǒng)在提供館藏信息鏈接,直接調(diào)用OPAC功能與界面上更具優(yōu)勢(shì),基本能夠?qū)Σ煌?lèi)目之間的復(fù)雜關(guān)系進(jìn)行揭示。而我國(guó)發(fā)現(xiàn)系統(tǒng)的本地化整合局限在數(shù)據(jù)層面,僅僅是輔助讀者找出資源,沒(méi)有實(shí)現(xiàn)對(duì)資源內(nèi)容進(jìn)行深層次標(biāo)引以達(dá)到知識(shí)發(fā)現(xiàn)的程度。
3.3.3 用戶空間設(shè)置
資源發(fā)現(xiàn)系統(tǒng)強(qiáng)大的個(gè)性化和社群功能可以讓用戶根據(jù)自己的喜好進(jìn)行檢索結(jié)果的保存和整理,并與其他用戶分享觀點(diǎn)和專(zhuān)業(yè)知識(shí),以滿足用戶的網(wǎng)絡(luò)影響預(yù)期和知識(shí)的交流與創(chuàng)新[9]。由表4可知,作為系統(tǒng)商所開(kāi)發(fā)的產(chǎn)品,Primo的技術(shù)性能更高,賬號(hào)劃分也更為細(xì)致;在信息推送方面EDS更為擅長(zhǎng),通過(guò)用戶的檢索行為分析其偏好,以快報(bào)推送的方式提供主動(dòng)服務(wù),從而吸引用戶增加對(duì)發(fā)現(xiàn)系統(tǒng)的使用;國(guó)內(nèi)的e讀和讀秀則賦予用戶更多的自主權(quán)限,允許用戶根據(jù)個(gè)人喜好對(duì)其空間主頁(yè)進(jìn)行設(shè)置,對(duì)于一些熱衷于個(gè)性化服務(wù)的讀者來(lái)說(shuō)是不錯(cuò)的選擇。
3.3.4 資源導(dǎo)航
期刊和數(shù)據(jù)庫(kù)導(dǎo)航是發(fā)現(xiàn)系統(tǒng)的重要功能,各系統(tǒng)也將電子資源導(dǎo)航功能區(qū)別于其他功能單獨(dú)列出。包括Summon、Primo、超星在內(nèi)的三種資源導(dǎo)航都提供了按照字母順序和學(xué)科查找兩類(lèi)方式,各自特色導(dǎo)航見(jiàn)表5。Summon更側(cè)重于資源整合和館藏發(fā)現(xiàn),360導(dǎo)航功能可以幫助用戶多方位地進(jìn)行資源發(fā)現(xiàn);Primo則具有強(qiáng)大的技術(shù)功能,在資源集成方面更具優(yōu)勢(shì),可以在圖書(shū)館的自動(dòng)化系統(tǒng)中應(yīng)用發(fā)現(xiàn)系統(tǒng),從而進(jìn)行更為深入的數(shù)據(jù)挖掘與分析;國(guó)內(nèi)系統(tǒng)則更偏好于從資源本身出發(fā),對(duì)資源進(jìn)行評(píng)價(jià),借助圖書(shū)館資源熱度排名進(jìn)行導(dǎo)航。
3.3.5 RSS訂閱服務(wù)
RSS(Really Simple Syndication)是基于XML技術(shù)的因特網(wǎng)內(nèi)容發(fā)布和集成技術(shù)。RSS服務(wù)能直接將最新的信息即時(shí)主動(dòng)推送到讀者桌面,使讀者不必直接訪問(wèn)網(wǎng)站就能得到更新的信息。讀者定制RSS后,只要通過(guò)RSS閱讀器,就可看到即時(shí)最新的內(nèi)容。目前,Summon、Primo、EDS、讀秀學(xué)術(shù)搜索等多種發(fā)現(xiàn)系統(tǒng)都實(shí)現(xiàn)了這一功能,用戶只要按照系統(tǒng)上的說(shuō)明,下載RSS閱讀器,復(fù)制頻道的鏈接地址(URL)實(shí)現(xiàn)頻道定制后即可使用。同時(shí),這一RSS定制是雙向的,如果用戶收集到了新資源的RSS地址,也可以通過(guò)E-mail告知圖書(shū)館,實(shí)現(xiàn)資源共享。使用RSS定制與追蹤實(shí)現(xiàn)個(gè)性化服務(wù)已經(jīng)成為每個(gè)發(fā)現(xiàn)系統(tǒng)的必備功能。
3.3.6 系統(tǒng)特色
國(guó)內(nèi)外發(fā)現(xiàn)系統(tǒng)在系統(tǒng)定制上均有各自特色:Primo的技術(shù)性能較高,在與本地系統(tǒng)兼容方面更具優(yōu)勢(shì),其特有的排序算法也加速了檢索結(jié)果列表的創(chuàng)建;Summon在資源發(fā)現(xiàn)和資源整合方面功能強(qiáng)大,完全脫離聯(lián)邦檢索的限制,在系統(tǒng)維護(hù)方面更加方便快捷;EDS的元數(shù)據(jù)覆蓋和知識(shí)發(fā)現(xiàn)更勝一籌,資源內(nèi)容更為豐富;超星更側(cè)重知識(shí)服務(wù),如關(guān)鍵詞關(guān)聯(lián)、引文關(guān)聯(lián)等。因此,國(guó)外發(fā)現(xiàn)系統(tǒng)的資源優(yōu)勢(shì)在于:(1)數(shù)據(jù)覆蓋較全面,信息挖掘深度大,對(duì)同一資源從不同角度進(jìn)行揭示,以滿足不同的檢索需要。(2)系統(tǒng)本地化整合程度高,與圖書(shū)館的其他系統(tǒng)鏈接緊密。我國(guó)發(fā)現(xiàn)系統(tǒng)則在學(xué)術(shù)評(píng)價(jià)以及用戶互動(dòng)方面更為擅長(zhǎng),通過(guò)學(xué)術(shù)評(píng)價(jià)幫助用戶了解各期刊文章的價(jià)值所在,指導(dǎo)閱讀。
3.4 商務(wù)因素
發(fā)現(xiàn)系統(tǒng)的購(gòu)買(mǎi)與實(shí)施需要密切的配合與溝通,其價(jià)格模式和開(kāi)放性是產(chǎn)品考察中必須考慮的問(wèn)題,詳見(jiàn)表6。(1)在價(jià)格模式方面,數(shù)據(jù)庫(kù)商和系統(tǒng)商所開(kāi)發(fā)的產(chǎn)品收費(fèi)方式略有不同,數(shù)據(jù)庫(kù)商只收取資源使用費(fèi),一般按年度計(jì)算,如Summon、EDS;系統(tǒng)開(kāi)發(fā)商在收取年服務(wù)費(fèi)的同時(shí)還需加收系統(tǒng)的初次安裝費(fèi),如Primo。(2)在系統(tǒng)開(kāi)放性方面,國(guó)外三種系統(tǒng)均為開(kāi)放系統(tǒng),即未購(gòu)買(mǎi)系統(tǒng)或未注冊(cè)系統(tǒng)的用戶也有權(quán)查看系統(tǒng)的界面并使用其查詢功能,除無(wú)法登陸個(gè)人空間和借閱資料外,所有連接互聯(lián)網(wǎng)的用戶可不受IP地址的限制自由訪問(wèn)該系統(tǒng)進(jìn)行資料的查找。而我國(guó)的超星和讀秀系統(tǒng)均為非開(kāi)放系統(tǒng),只能通過(guò)購(gòu)買(mǎi)的方式才能進(jìn)行操作。
4 對(duì)我國(guó)系統(tǒng)商的建議
4.1 增加資源覆蓋量
以Summon、Primo為代表的國(guó)外發(fā)現(xiàn)系統(tǒng),由于中文資源出版商和數(shù)據(jù)庫(kù)商在資源占有方面的封閉性,為國(guó)外發(fā)現(xiàn)系統(tǒng)獲取中文數(shù)據(jù)設(shè)置了障礙,在元數(shù)據(jù)覆蓋方面以外文資源為主,中文資源相對(duì)較少。目前,各系統(tǒng)商正通過(guò)技術(shù)彌補(bǔ)這一不足。如EDS系統(tǒng)已能夠支持Unicode大字符集信息檢索與多語(yǔ)言檢索,具備中文分詞與繁簡(jiǎn)通檢功能;Summon支持大部分中文字符集,實(shí)現(xiàn)了CNMarc,CMarc與USMarc/Marc21的映射,并支持中文的簡(jiǎn)繁互檢和拼音檢索等。
對(duì)于國(guó)內(nèi)發(fā)現(xiàn)系統(tǒng)而言,資源覆蓋量不足是主要問(wèn)題,具體表現(xiàn)在兩個(gè)方面。首先,對(duì)各類(lèi)型資源數(shù)據(jù)提供發(fā)現(xiàn)揭示的機(jī)會(huì)不平衡,多數(shù)集中在對(duì)圖書(shū)、期刊文獻(xiàn)資源的發(fā)現(xiàn)揭示,對(duì)圖片、音樂(lè)、影片等類(lèi)型的信息數(shù)據(jù)則較少涉及[10]。其次,國(guó)內(nèi)發(fā)現(xiàn)系統(tǒng)對(duì)外文資源覆蓋量不足,外文檢索效果差。針對(duì)以上問(wèn)題,資源發(fā)現(xiàn)系統(tǒng)商可采取以下對(duì)策:第一,利用元數(shù)據(jù)倉(cāng)儲(chǔ)技術(shù)和數(shù)據(jù)挖掘技術(shù)豐富元數(shù)據(jù)種類(lèi)和內(nèi)容,并保證數(shù)據(jù)的更新速度;第二,積極與國(guó)外數(shù)據(jù)庫(kù)商和圖書(shū)館合作,力圖打破外文資源獲取瓶頸,充分學(xué)習(xí)Summon、EDS等系統(tǒng)商獲取外文數(shù)據(jù)的經(jīng)驗(yàn),以實(shí)現(xiàn)中外文資源的均等覆蓋和質(zhì)量保障。
4.2 提高元數(shù)據(jù)版權(quán)意識(shí)
對(duì)于元數(shù)據(jù)的版權(quán)問(wèn)題,系統(tǒng)商需要關(guān)注以下方面。(1)對(duì)于圖書(shū)館的本地?cái)?shù)據(jù)庫(kù),系統(tǒng)商應(yīng)與圖書(shū)館簽署版權(quán)保護(hù)協(xié)議,在獲取圖書(shū)館數(shù)據(jù)庫(kù)開(kāi)放接口的同時(shí),明確各自責(zé)任,以保證數(shù)據(jù)合法使用;此外,系統(tǒng)商也需提高自身的安全防護(hù)技術(shù),消除圖書(shū)館的顧慮。(2)在使用圖書(shū)館自建數(shù)據(jù)庫(kù)時(shí),應(yīng)明確劃分公開(kāi)與保留的字段信息,對(duì)于涉及個(gè)人隱私的內(nèi)容,應(yīng)在獲取數(shù)據(jù)時(shí)自動(dòng)將其屏蔽。(3)在商業(yè)數(shù)據(jù)庫(kù)資源的獲取方面,系統(tǒng)商應(yīng)注意與數(shù)據(jù)庫(kù)商簽訂授權(quán)協(xié)議,以保證數(shù)據(jù)合法性,同時(shí)減少今后數(shù)據(jù)更新工作中的麻煩。(4)在獲取OA資源時(shí),應(yīng)盡量注意選擇經(jīng)費(fèi)支持的、能夠提供長(zhǎng)期且穩(wěn)定元數(shù)據(jù)服務(wù)的機(jī)構(gòu)和組織所提供的OA資源,確保資源的可靠性[11]。
4.3 加強(qiáng)系統(tǒng)開(kāi)放性
由表6可知,國(guó)外三種發(fā)現(xiàn)系統(tǒng)均為開(kāi)放系統(tǒng)。以清華大學(xué)圖書(shū)館的Primo水木搜索為例,在檢索結(jié)果列表中,除“標(biāo)簽/評(píng)論”項(xiàng)需要讀者登陸后才可進(jìn)行評(píng)論的填寫(xiě)外,其它功能包括在線查看、詳細(xì)信息、手機(jī)二維碼、網(wǎng)摘目次等內(nèi)容,非授權(quán)用戶也可進(jìn)行操作,甚至可以通過(guò)點(diǎn)擊“試讀信息”按鈕進(jìn)行資料的試讀。
在筆者所調(diào)查的國(guó)內(nèi)三種發(fā)現(xiàn)系統(tǒng)中,除e讀外,超星公司所推出的超星發(fā)現(xiàn)和讀秀學(xué)術(shù)搜索均為非開(kāi)放性系統(tǒng)。在調(diào)查過(guò)程中,無(wú)論是以登陸超星發(fā)現(xiàn)系統(tǒng)的官網(wǎng)方式或是通過(guò)進(jìn)入其他圖書(shū)館的超星發(fā)現(xiàn)數(shù)據(jù)庫(kù)的方式,筆者都無(wú)法進(jìn)入其系統(tǒng)主頁(yè)。相比于超星發(fā)現(xiàn),讀秀的封閉性較弱,對(duì)于非注冊(cè)用戶,系統(tǒng)提供了“進(jìn)入體驗(yàn)版”選項(xiàng),雖然可以進(jìn)行相關(guān)信息的查找,但其體驗(yàn)時(shí)間和權(quán)限仍被限制。
早期出現(xiàn)的以Google為代表的搜索引擎相比于圖書(shū)館檢索系統(tǒng)之所以獲得成功,開(kāi)放性是其決定性因素。可以說(shuō)“簡(jiǎn)單、快速、易用、有效”的檢索體驗(yàn)是發(fā)現(xiàn)系統(tǒng)的宗旨[12]。然而,國(guó)內(nèi)發(fā)現(xiàn)系統(tǒng)則以“非訂閱用戶”為由將部分讀者拒之門(mén)外,在一定程度上背離了資源發(fā)現(xiàn)系統(tǒng)的原旨。為此,國(guó)內(nèi)系統(tǒng)商在提高發(fā)現(xiàn)系統(tǒng)性能的同時(shí),當(dāng)務(wù)之急是加強(qiáng)其開(kāi)放性,讓更多的潛在用戶使用并體驗(yàn)該系統(tǒng),這樣不僅讓用戶了觸了其強(qiáng)大功能,而且在用戶體驗(yàn)中可更多地挖掘新的功能,以此真正打開(kāi)用戶市場(chǎng)。
4.4 規(guī)范相關(guān)性排序結(jié)果
從劉頡頏等在廣州大學(xué)城開(kāi)展的一項(xiàng)關(guān)于發(fā)現(xiàn)系統(tǒng)的調(diào)研可見(jiàn),檢索結(jié)果的相關(guān)度排序被用戶認(rèn)為是最有用的功能[13]。對(duì)于檢索結(jié)果的相關(guān)性排序,國(guó)外發(fā)現(xiàn)系統(tǒng)有不同的排序算法,旨在為用戶呈現(xiàn)更好的檢索效果。如Summon使用專(zhuān)有的關(guān)聯(lián)算法,分配給各個(gè)元數(shù)據(jù)字段不同的權(quán)重,對(duì)于不同的內(nèi)容類(lèi)型使用不同的參數(shù)。Primo申請(qǐng)了相關(guān)性排序技術(shù)的專(zhuān)利——ScholarRankTM,對(duì)結(jié)果記錄的三方面進(jìn)行評(píng)價(jià),以判斷該記錄的排列順序。評(píng)價(jià)內(nèi)容包括記錄內(nèi)容跟檢索式的匹配程度、記錄的學(xué)術(shù)價(jià)值評(píng)分(ScholarRank評(píng)分)、讀者的信息及讀者實(shí)時(shí)的研究需求[14]。在顯示頁(yè)面,Primo提供日期、受歡迎度、作者、題名四個(gè)選項(xiàng),供用戶進(jìn)行相關(guān)性排序的選擇。EDS的排序是按照“主題詞表”優(yōu)先的方式進(jìn)行,包括主題詞表的控制性詞匯、文章的標(biāo)題、作者的關(guān)鍵字、文摘中的關(guān)鍵字、全文中的關(guān)鍵字。
在國(guó)內(nèi)發(fā)現(xiàn)系統(tǒng)的相關(guān)性排序方面,e讀相關(guān)性排序僅按出版年代升序和降序兩種排序規(guī)則;而在讀秀學(xué)術(shù)搜索的試用版中,筆者并未找到與相關(guān)性排序相關(guān)的選項(xiàng)。為此,在相關(guān)性結(jié)果的規(guī)范問(wèn)題上,國(guó)內(nèi)系統(tǒng)商需重視對(duì)關(guān)聯(lián)數(shù)據(jù)和語(yǔ)義搜索技術(shù)的使用,分析用戶檢索行為[1],在按一定規(guī)則予以顯示的同時(shí),為用戶提供更多的排序選項(xiàng),做到智能化搜索。
4.5 輔助整合圖書(shū)館資源
幫助用戶找到資源并非系統(tǒng)的最終目的,發(fā)現(xiàn)并及時(shí)下載原文實(shí)現(xiàn)利用才是資源發(fā)現(xiàn)系統(tǒng)的價(jià)值所在。因此,發(fā)現(xiàn)系統(tǒng)能否與圖書(shū)館的本地系統(tǒng)實(shí)現(xiàn)整合是決定其易用性的首要指標(biāo)。在這一方面國(guó)外的發(fā)現(xiàn)系統(tǒng)有更大的優(yōu)勢(shì)。以Summon為例,如表4所示,Summon不僅為讀者查找圖書(shū)館的OPAC資源增加了包括將檢索結(jié)果限制在本館、專(zhuān)門(mén)的OPAC分面導(dǎo)航以及呈現(xiàn)該系統(tǒng)的實(shí)施流通數(shù)據(jù)等特別功能以外,也實(shí)現(xiàn)了Summon與圖書(shū)館已有的文獻(xiàn)評(píng)價(jià)系統(tǒng)、本館的學(xué)科服務(wù)平臺(tái)和Web of Science\Scopus等文獻(xiàn)評(píng)價(jià)系統(tǒng)的無(wú)縫整合。
5 結(jié)語(yǔ)
我國(guó)發(fā)現(xiàn)系統(tǒng)基本上實(shí)現(xiàn)了系統(tǒng)與圖書(shū)館本地資源的整合,但這一整合僅局限于數(shù)據(jù)層面。超星和e讀系統(tǒng)雖然可以顯示館藏信息,但是點(diǎn)擊之后系統(tǒng)自動(dòng)跳轉(zhuǎn)到圖書(shū)館OPAC界面,而非原有的發(fā)現(xiàn)界面,系統(tǒng)所提供的僅僅是一個(gè)鏈接。學(xué)術(shù)資源發(fā)現(xiàn)系統(tǒng)應(yīng)是深度整合圖書(shū)館各種類(lèi)型資源、提供單一入口的學(xué)術(shù)資源發(fā)現(xiàn)服務(wù)平臺(tái),它能幫助讀者快捷、準(zhǔn)確地在海量信息資源中查找所需文獻(xiàn),提供最合適的獲取服務(wù)集成,并在查找過(guò)程中獲得最佳體驗(yàn),而非依靠用戶通過(guò)鏈接進(jìn)行手動(dòng)檢索。筆者認(rèn)為,以超星等為代表的部分國(guó)內(nèi)發(fā)現(xiàn)系統(tǒng)并不能稱(chēng)其為真正的資源發(fā)現(xiàn)系統(tǒng),他們僅僅幫助讀者通過(guò)OPAC鏈接逐一尋找資源,并未利用統(tǒng)一資源整合平臺(tái)幫助用戶發(fā)現(xiàn)和利用資源。因此,我國(guó)的資源發(fā)現(xiàn)系統(tǒng)需要加強(qiáng)與圖書(shū)館本地系統(tǒng)的整合,學(xué)習(xí)國(guó)外發(fā)現(xiàn)系統(tǒng)的資源整合技術(shù),真正實(shí)現(xiàn)發(fā)現(xiàn)系統(tǒng)對(duì)館內(nèi)資源的全面覆蓋,成為名副其實(shí)的一站式檢索工具。
參考文獻(xiàn):