于珊珊
摘 要:數(shù)字圖書館的建立使服務模式從“館藏為中心”轉向“以讀者需求為中心”,其衡量標準不再是館藏是多少、館舍的大小等,而是以服務技術、服務方式等方面。檢索系統(tǒng)的便捷程度將影響到用戶對數(shù)字圖書館的使用。國家圖書館“文津”搜索系統(tǒng)整合數(shù)字資源,更好地展示數(shù)字資源的管理和如何利用,充分滿足用戶需求,提升用戶體驗感。
關鍵詞:國家圖書館;“文津”搜索系統(tǒng)
隨著信息技術的發(fā)展進步,國家圖書館的數(shù)字資源建設從20世紀90年代開始,其館藏資源規(guī)模持續(xù)擴大,文獻類型豐富,擴大數(shù)據(jù)庫網(wǎng)絡訪問權限,豐富在線閱讀資源,不僅擁有傳統(tǒng)的紙質文獻,而且還擁有多樣化的數(shù)字資源,共同構成了龐大的資源庫,成為寶貴而豐富的知識資產。2017年底數(shù)字資源總量為1603.87TB,包括館藏特色資源數(shù)字化量1102.24TB,外購數(shù)據(jù)庫157TB,網(wǎng)絡導航和網(wǎng)絡采集量175.95TB,數(shù)字資源征集162.44TB,電子報紙呈繳6.24TB。通過對2014年至2017年的數(shù)據(jù)對比可知,資源量是逐年遞增的(見表一)。國家圖書館數(shù)字資源內容單元主要包括電子圖書、電子期刊、電子報紙、學術論文、會議論文、音頻資料、視頻資料等。圖書館朝著大規(guī)模數(shù)字化方向發(fā)展,但也面對著諸多挑戰(zhàn),國家圖書館不斷優(yōu)化資源檢索系統(tǒng),使其頁面友好,方便讀者可以快捷地使用國家圖書館檢索服務。并且,國家圖書館非常重視資源的組織加工。
一、“文津”搜索系統(tǒng)概況
1.“文津”搜索建設背景和總體設計
國家圖書館不斷推進文獻信息資源整合,建設“文津”搜索系統(tǒng),提升資源發(fā)現(xiàn)能力,滿足讀者對各類資源的“一站式”檢索需求,快速獲取所需內容,享受便捷服務。“文津”搜索系統(tǒng)提供國家圖書館自建和外購資源統(tǒng)一的元數(shù)據(jù)搜索服務,是國家數(shù)字圖書館工程重要的項目之一,“文津”搜索系統(tǒng)建設目標是結合基于互聯(lián)網(wǎng)的信息收集和數(shù)據(jù)分析挖掘技術,向用戶提供的一個統(tǒng)一、實時高效、精準、權威的數(shù)字圖書館數(shù)字資源元數(shù)據(jù)搜索服務平臺。并且整合國家數(shù)字圖書館自建或其他方式獲取的數(shù)字資源,建立和維護高性能分布式索引。數(shù)字資源的生命周期包括數(shù)字資源采集、數(shù)字資源加工處理、數(shù)字資源保存和數(shù)字資源服務利用。而數(shù)字資源服務利用正是體現(xiàn)國家數(shù)字圖書館工程建設價值的關鍵環(huán)節(jié)?!拔慕颉彼阉飨到y(tǒng)是數(shù)字資源服務利用的集中體現(xiàn),面向圖書館讀者用戶,提供基于圖書館元數(shù)據(jù)的權威搜索服務。
“文津”搜索系統(tǒng)將結合數(shù)字圖書館推廣工程,建立一個覆蓋全國數(shù)字圖書館的搜索服務平臺,滿足讀者對數(shù)字圖書館各類資源“一站式”檢索、獲取的需求,涵蓋了國家圖書館各類中外文自建和外購數(shù)據(jù)庫資源。方便讀者直接獲取數(shù)字資源的目標對象文件和各種應用服務,提高全國圖書館數(shù)字資源利用率,實行“海量資源,一搜既得”?!拔慕颉彼阉飨到y(tǒng)檢索結果多維聚類和導航,實現(xiàn)在不同需求的檢索結果基礎上聚類顯示,以及檢索服務的個性化定制與推送。“文津”搜索系統(tǒng)是一個集軟件、硬件于一體的集成系統(tǒng)。致力于提供一站式發(fā)現(xiàn)和獲取服務?;凇拔慕颉毕到y(tǒng)在服務內容和服務對象的定位,要求系統(tǒng)能夠承載巨大的訪問請求,同時提供快速檢索。要求性能滿足平均每分鐘10萬次檢索請求,峰值每秒一萬次檢索請求的處理能力,系統(tǒng)架構具有擴展能力。
截至2015年年底,“文津”搜索系統(tǒng)已整合百余個數(shù)據(jù)庫,其中已上線數(shù)據(jù)庫58個(含中文外購數(shù)據(jù)庫17個,外文外購庫15個,自建資源庫23個,聯(lián)合編目2個庫,Aleph 1個庫),所有上線數(shù)據(jù)庫全部面向讀者提供服務。國家圖書館外購數(shù)據(jù)庫相關數(shù)據(jù)見表2。2017年,國家圖書館在文獻資源整合工作中對“文津”搜索系統(tǒng)進行系統(tǒng)優(yōu)化升級和內存擴容升級?;谙冗M的技術方案,擴充高性能、大內存服務器,實現(xiàn)對異構服務器集群的管理,以解決制約“文津”搜索系統(tǒng)數(shù)據(jù)更新和應用拓展的關鍵問題,并對多年積累的新數(shù)據(jù)進行整合、測試及整改,對資源訪問接口進行調試,以實現(xiàn)對大量新資源的揭示,從而使“文津”搜索系統(tǒng)揭示的資源庫數(shù)量成倍增長。
2.“文津”搜索系統(tǒng)首界面
讀者可通過域名http://find.nlc.cn直接訪問“文津”搜索系統(tǒng),或登錄國家圖書館主頁(www.nlc.cn),在“文津”搜索系統(tǒng)的檢索入口處一鍵式檢索。在“文津”搜索系統(tǒng)首界面(如圖1所示)內容包括搜索類型(全部、圖書、古文獻、論文、期刊報紙、多媒體、縮微文獻、文檔、詞條等)、高級檢索、聯(lián)邦檢索、搜索熱詞榜、國圖首頁、登錄、注冊、幫助,界面一目了然。“文津”搜索的熱詞榜(如圖2)內容非常豐富多彩,熱詞排行榜分為日、周、總統(tǒng)計的,有不同的10大熱門關鍵詞排行,熱點閱讀、人氣資源庫和“文津”云圖,供讀者查看檢索,使讀者了解閱讀熱點,幫助讀者查找有關資料。點擊榜單和標簽云中的任意檢索詞,可直接進行檢索,出現(xiàn)該詞匯的搜索結果。如圖3所示,點擊“浙江日報”,出現(xiàn)其檢索詞的全部檢索結果。
3.“文津”搜索檢索功能
“文津”搜索系統(tǒng)主界面采用的是單框檢索入口,界面簡潔,讀者輸入檢索詞后,從而對系統(tǒng)內所有資源進行一站式檢索,并具有搜索建議功能,可以為讀者提示熱門搜索詞(如圖4所示),其可檢測內容除了國家圖書館OPAC系統(tǒng)內各類型書刊文獻資源、省市公共圖書館文獻資源,也包括國家圖書館各類中外文自建資源和部分外購資源庫。其包括單條件檢索、二次檢索、高級檢索、聯(lián)邦檢索、相關檢索、聚合檢索等。聯(lián)邦檢索又包括整合檢索、數(shù)據(jù)庫查找、期刊查找、原文查找、個人空間。整合檢索是對所有館藏目錄,包括電子數(shù)據(jù)庫進行的梳理、揭示和整合。
(1)“文津”搜索系統(tǒng)檢索項
第一,初級檢索。檢索項的數(shù)量同文獻信息的揭示程度有關,也影響到讀者檢索結果?!拔慕颉彼阉魇醉?,可進行初次檢索,在搜索欄內輸入查詢詞進行搜索,即可出現(xiàn)與查詢詞相關的檢索結果。初級檢索能讓不具有檢索知識、檢索技能,檢索目的不明確的讀者滿足其檢索需求。
在“文津”搜索首頁,也可進行專業(yè)檢索,點擊選取導航欄資源和檢索字段進行專業(yè)檢索,表3所示資源名稱對應的檢索字段,根據(jù)不同類別專業(yè)檢索字段快速查找資源。例如,用戶點擊“論文”時,統(tǒng)一檢索欄的前端會出現(xiàn)“全部字段”“題名”“責任者”“關鍵詞”和“刊名”選項。為了支持專業(yè)檢索,把數(shù)字資源進行了分類,“文津”搜索系統(tǒng)分為一級分類、二級分類,其中一級分類主要是根據(jù)文獻類型,劃分為圖書、古文獻、論文、期刊報紙、多媒體、縮微文獻、文檔和詞條;二級分類根據(jù)一級類目的文獻內容和文獻類型,即數(shù)字資源的實際情況而形成的。這對用戶能快速準確的查找資源提供便利。
第二,高級檢索。高級檢索能提高檢索效率、檢索速度,即提高齊全率和準確率。圖書、古文獻、論文、期刊報紙、多媒體、縮微文獻、文檔、詞條等這些一級分類均有高級檢索。高級檢索中邏輯檢索方式的流程為選擇文獻類型、選擇高級檢索條件、選擇出版年份、可勾選“來源庫”(包括館藏中文資源、民國資源、博士論文、數(shù)字方志、碑帖菁華、古代典籍以及國家圖書館自建數(shù)據(jù)和部分外購數(shù)字資源庫)(如圖5所示),可選擇是否提供全文、點擊檢索。在選擇高級檢索方式時,需選擇是邏輯檢索還是全文檢索這兩種檢索類型,選擇邏輯檢索的檢索項同初級檢索的檢索項,可以最多添加三個檢索條件項目,并且還可以翻譯成中文或英文。
圖5 高級檢索界面
第三,聯(lián)邦檢索。國內或稱為“跨庫檢索”或“整合檢索”等,維基百科對其定義為,將一個檢索請求以合適的語法進行轉換后發(fā)送到一組獨立的數(shù)據(jù)庫中,合并檢索到的檢索結果,以簡潔統(tǒng)一的格式和最小的重復顯示結果,提供一個自動或者用戶選擇的排序方式對結果進行排序。聯(lián)邦檢索提供分類瀏覽,提高了檢索效率和速度,“文津”搜索系的聯(lián)邦檢索是整合了國家圖書館數(shù)字資源門戶系統(tǒng)中的各個資源,在同一界面即可發(fā)現(xiàn)所有內容信息,根據(jù)所需文獻類型準確定位。在聯(lián)邦檢索中包括整合檢索、數(shù)據(jù)庫查找、期刊查找、原文查找、個人空間等項目。內容豐富強大,為用戶提供更全面、更細化以及不同類型文獻的檢索需求。
4.“文津”搜索系統(tǒng)檢索結果頁面
“文津”搜索系統(tǒng)的檢索結果與國家圖書館的部分資源系統(tǒng)實現(xiàn)了無縫整合鏈接,在系統(tǒng)的檢索結果頁面支持查看到文獻的封面、題名、文獻類型、著者、出版年、出版社、來源數(shù)據(jù)庫。部分文獻資源還提供了摘要、目次、館藏信息以及在線閱讀等欄目,在檢索結果的詳細界面,除上述項目外,還會出現(xiàn)該文獻資源的詳細信息、摘要、目次、館藏信息、在線閱讀、分享到新浪微博、文獻傳遞延伸檢索、更多相似資源、更多相關資源等欄目,可幫助讀者進一步確認是否是所需文獻,直觀初步了解資源信息,提高檢索效率及準確率。延伸檢索是為了更好地滿足讀者同步獲取相關網(wǎng)絡資源的需求,面向谷歌、百度等外部搜索引擎的延伸檢索鏈接。根據(jù)文獻類型不同,具體信息包括所有責任者、標識號(ISBN、ISSN)、出版發(fā)行地、關鍵詞、語種、分類(中圖分類)、叢編題名、載體形態(tài)、版本說明。與此同時,系統(tǒng)提供了收藏該書的全國省市圖書館的館藏位置信息的導航功能,以列表形式說明資源所在位置和提供的服務,如點擊“國家圖書館”即可看到單冊狀態(tài)、館藏子庫的架位導航信息,從而可預約此本單冊。點擊其他省市公共圖書館,也可看到該單冊的館藏信息以及文獻信息,界面還展示了聯(lián)合編目成員館館藏信息的可視化地圖,查看到所在的具體城市和圖書館。搜索到所需文獻后,可直接獲取各類自建或部分外購數(shù)據(jù)庫系統(tǒng)的全文信息,或直接向文獻提供中心發(fā)送館際互借與文獻傳遞申請。結果界面還包括全部檢索字段、排序、相關結果數(shù)量、頁數(shù)、相關搜索、二次檢索等。
在檢索結果界面中,展示出含有檢索詞的文獻資料,在頁面左側顯示了多維度的導航選項,包括文獻類型、著者、年份(可對年份進行篩選)、是否可提供全文、語種(漢語、英語、日語、其他)以及來源數(shù)據(jù)庫等,用戶可以通過這幾項導航選項進一步縮小檢索范圍,實現(xiàn)基于不同需求的檢索結果聚類顯示。比如,年份導航,讀者選擇年份后或者對年份進行篩選,右側搜索結果列表只顯示在此期間的檢索結果。在檢索頁面最下端的“相關搜索”選項是系統(tǒng)通過對用戶歷史檢索詞及系統(tǒng)規(guī)范詞庫的分析得出的,用以幫助讀者更加明確自己的檢索詞。
5.“文津”搜索系統(tǒng)檢索服務的個性化服務
在“文津”搜索系統(tǒng)中登錄后,在界面中會出現(xiàn)個人中心選項,為讀者提供了個性化搜索服務,包括我的檢索歷史,可以查看到自己歷次檢索詞、檢索文獻類型、檢索字段和執(zhí)行時間等,并且可以清空檢索歷史。在我的搜索設定中,可選擇網(wǎng)頁顯示語言(中文、英文)、檢索歷史是否保存、檢索結果是否展現(xiàn)封面信息、選擇自己的職業(yè)類目、興趣等選項進行設定,設定搜索習慣等。
參考文獻:
[1]蔡忠兵.傳統(tǒng)圖書館與數(shù)字圖書館的距離[J].圖書館建設,2001
[2]楊東坡,邢 軍.論國家圖書館“文津”搜索的涉及與實現(xiàn)[J].國家圖書館學刊,2014
[3]馬 驊.國外主要聯(lián)邦檢索系統(tǒng)的興起、現(xiàn)狀及發(fā)展趨勢[J].圖書館建設 2009
(作者單位:國家圖書館)