李云暢
摘要:文章對數(shù)字圖書館檢索現(xiàn)狀進(jìn)行分析,提出了構(gòu)建基于本體的數(shù)字圖書館智能檢索系統(tǒng)。在論述本體理論的基礎(chǔ)上,從設(shè)計思想、系統(tǒng)模型角度介紹了數(shù)字圖書館智能檢索系統(tǒng),并提出了智能檢索系統(tǒng)的設(shè)計方法,包括構(gòu)建數(shù)字資源本體管理模塊、用戶輸入及智能拓展模塊、智能檢索模塊及結(jié)果反饋模塊。
關(guān)鍵詞:本體;數(shù)字圖書館;智能檢索系統(tǒng);設(shè)計
DOI: 10.3969/j.issn.2095-5707.2019.05.006
中圖分類號:G250.7;TP391.1? ??文獻(xiàn)標(biāo)識碼:A??? 文章編號:2095-5707(2019)05-0025-04
Abstract: This article analyzed the status quo of retrieval of digital libraries and proposed to build an intelligent retrieval system of digital libraries based on ontology. Based on the discussion of ontology theory, the article introduced intelligent retrieval system of digital libraries from the perspectives of design ideas and system models, and proposed the design method of intelligent retrieval system, including the construction of digital resource ontology management module, user input and intelligent expansion module, intelligent retrieval module and result feedback module.
Key words: ontology; digital libraries; intelligent retrieval system; design
隨著近年來我國科學(xué)技術(shù)和現(xiàn)代通訊技術(shù)的快速發(fā)展,數(shù)字圖書館為數(shù)字用戶知識信息的精準(zhǔn)檢索創(chuàng)造了有利條件。傳統(tǒng)模式下的數(shù)字圖書館,其信息組織形式無法清晰地表達(dá)信息內(nèi)部組織關(guān)系和內(nèi)部邏輯,僅依靠關(guān)鍵詞層面的信息檢索不能體現(xiàn)信息內(nèi)部的語義關(guān)聯(lián),系統(tǒng)結(jié)構(gòu)不兼容導(dǎo)致操作不規(guī)范,這些原因造成使用數(shù)字圖書館檢索的結(jié)果偏離用戶的實際需求,常會出現(xiàn)無效檢索的現(xiàn)象[1]。因此,迫切需要一種新的技術(shù)對數(shù)字圖書館傳統(tǒng)信息檢索方式進(jìn)行革新。本文提出基于本體的數(shù)字圖書館智能檢索系統(tǒng),希望能幫助數(shù)字圖書館有效提高信息檢索效率,解決檢索結(jié)果準(zhǔn)確率偏低及共享使用中存在的問題。
1? 本體的理論基礎(chǔ)
本體的概念最早源于哲學(xué),是人們從哲學(xué)角度
認(rèn)識事物組織模式的一種方法,是對客觀事物組織系統(tǒng)的詳細(xì)解釋和說明,關(guān)注現(xiàn)實事物邏輯層面上的抽象本質(zhì)。近年來,本體學(xué)或本體論(Ontology)在信息系統(tǒng)領(lǐng)域中的研究和應(yīng)用越來越普遍,其重要性在電子商務(wù)、語義網(wǎng)絡(luò)、企業(yè)、信息集成、自然語言處理、知識工程、數(shù)據(jù)庫等不同領(lǐng)域得到了認(rèn)可和重視[2],本體在數(shù)字科學(xué)領(lǐng)域的使用得到迅速發(fā)展。
1.1? 本體的概念
學(xué)術(shù)界認(rèn)為本體是關(guān)于事物本質(zhì)的共享觀念。對于知識信息而言,本體能在語義和邏輯層面描述知識信息的內(nèi)部結(jié)構(gòu),反映知識信息的內(nèi)部邏輯,是一種有效的知識組織模型。在知識利用方面,本體更加關(guān)注知識概念在語義層面的關(guān)聯(lián),是關(guān)于知識概念、規(guī)則、關(guān)系的集合。應(yīng)用本體的目的是基于知識概念在語義層面關(guān)聯(lián)捕獲相關(guān)學(xué)科領(lǐng)域的信息,基于概念之間的邏輯關(guān)系使人們能對概念共享和理解,依據(jù)人們對概念達(dá)成的共識確定描述知識概念的專用語,并以不同方法、工具、手段及概念之間的邏輯關(guān)系給予這些術(shù)語科學(xué)的定義[3]。
1.2? 本體的功能
本體理論可以實現(xiàn)對知識信息的系統(tǒng)化、標(biāo)準(zhǔn)化加工,使知識使用標(biāo)準(zhǔn)化。本體在知識加工利用方面有著深度的邏輯性、關(guān)聯(lián)性、層次性,基于知識概念內(nèi)部邏輯關(guān)系確定的專業(yè)術(shù)語實現(xiàn)對客觀事物通用化、標(biāo)準(zhǔn)化的描述,并使得這種源于知識概念的知識系統(tǒng)更加完善。與此同時,要在專業(yè)的學(xué)科領(lǐng)域?qū)崿F(xiàn)對知識信息的清晰描述,必須對該學(xué)科使用的專業(yè)術(shù)語進(jìn)行科學(xué)化界定,并使得這種科學(xué)化描述得到全體成員的認(rèn)可,這樣才能實現(xiàn)知識描述的標(biāo)準(zhǔn)化,使源于該學(xué)科的學(xué)術(shù)用語具有良好的通用性。此外,知識組織利用的標(biāo)準(zhǔn)化、通用化也可以借助學(xué)科專業(yè)術(shù)語的知識系統(tǒng)清晰地表達(dá)出來,實現(xiàn)全體共享[4]。
用戶在特定學(xué)科領(lǐng)域的語義層面實現(xiàn)實時信息共用共享。信息媒介的特點是跨系統(tǒng)、跨平臺、多領(lǐng)域傳播,本體若想在知識信息傳播過程中保持自身可組織、可利用的特性,就必須將不同知識觀點及不同學(xué)科背景的用戶、平臺、知識概念集中到統(tǒng)一的系統(tǒng)內(nèi),這樣使知識概念語義層面的邏輯關(guān)系能清晰表達(dá)出來。與此同時,對于新系統(tǒng)、新平臺的開發(fā),可以重用該學(xué)科領(lǐng)域中的原有本體,這樣可以節(jié)約研發(fā)成本、縮短系統(tǒng)和平臺研發(fā)的周期,避免資源重復(fù)建設(shè)[5]。
4.3? 智能檢索模塊
智能檢索模塊是數(shù)字圖書館智能檢索系統(tǒng)的核心模塊,主要功能是在對用戶查詢后形成的語義邏輯表達(dá)式進(jìn)行精確理解的基礎(chǔ)上,結(jié)合知識概念之間的相似度進(jìn)行邏輯推理,根據(jù)拓展后的概念集合,從索引庫中匹配本體。在工程師和學(xué)科專家的幫助下,創(chuàng)建符合用戶檢索習(xí)慣的本體推理規(guī)則,對本體知識庫中采用OWL描述的實例進(jìn)行邏輯分析,確定智能檢索模塊,從數(shù)字圖書館數(shù)據(jù)庫中搜索出符合該語義邏輯的文獻(xiàn)資源,即檢索結(jié)果集合,以可視化的方式呈現(xiàn)給用戶,供用戶自主選擇。
4.4? 結(jié)果反饋模塊
結(jié)果反饋模塊是衡量基于本體的數(shù)字圖書館智能檢索系統(tǒng)檢索效果的工具模塊,主要功能是將檢索得到的領(lǐng)域本體概念進(jìn)行去重、科學(xué)排序、集成和分類處理,并以可視化的方式呈現(xiàn)給用戶,供用戶自主判定。為保障系統(tǒng)為用戶提供滿意的文獻(xiàn)檢索結(jié)果,該模塊對用戶的行為偏好和檢索習(xí)慣進(jìn)行有效記錄,對用戶個性化的檢索特點進(jìn)行判定,形成相關(guān)的系統(tǒng)日志進(jìn)行存儲,并分析用戶的這種檢索記錄,根據(jù)分析結(jié)果面向用戶智能匹配本體模型,提高檢索效率,縮短檢索時間。最后,對系統(tǒng)的用戶評價結(jié)果進(jìn)行反饋,方便技術(shù)專家及學(xué)者找到系統(tǒng)在功能上存在的不足,有利于后期對智能拓展模塊、智能檢索模塊進(jìn)行優(yōu)化調(diào)整。
5? 小結(jié)
基于本體的數(shù)字圖書館智能檢索系統(tǒng),有助于改變數(shù)字圖書館以關(guān)鍵詞、語句進(jìn)行知識檢索的弊端,從本體的角度分析用戶自然語言檢索的語義關(guān)聯(lián)和知識間的邏輯關(guān)系,根據(jù)用戶的習(xí)慣和特點為用戶精準(zhǔn)提供信息資源,促進(jìn)智能檢索服務(wù)效果實時反饋,再根據(jù)反饋結(jié)果及時調(diào)整、優(yōu)化系統(tǒng)結(jié)構(gòu),從而提高檢索效能。
參考文獻(xiàn)
[1] 馮園園.多領(lǐng)域本體語義環(huán)境中數(shù)字圖書館知識地圖的構(gòu)建研究[J].農(nóng)業(yè)圖書情報學(xué)刊,2018,30(2):118-121.
[2] 龍海,朱彥.論GFO的基本框架及頂層本體比較研究[J].中國中醫(yī)藥圖書情報雜志,2015,39(5):18-22.
[3] 沈旺,翟倩,李賀.基于本體的數(shù)字圖書館自適應(yīng)信息系統(tǒng)架構(gòu)研究[J].圖書館學(xué)研究,2016(14):47-51.
[4] 王珊珊,肖明.基于本體的引文知識服務(wù)系統(tǒng)構(gòu)建研究[J].情報理論與實踐,2017,40(11):125-129.
[5] 李燮慧.基于本體論的大數(shù)據(jù)數(shù)字圖書館知識體系構(gòu)建研究[J].圖書館理論與實踐,2016(10):47-51.
[6] 楊選輝,龍帆.基于本體學(xué)習(xí)的圖書館數(shù)字資源服務(wù)模型研究[J].圖書館學(xué)研究,2016(9):90-94.
(收稿日期:2019-02-14)
(修回日期:2019-02-22;編輯:魏民)