国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于本體的數(shù)字圖書館智能檢索系統(tǒng)設(shè)計

2019-01-28 09:54:53李云暢
關(guān)鍵詞:檢索系統(tǒng)本體檢索

李云暢

基于本體的數(shù)字圖書館智能檢索系統(tǒng)設(shè)計

李云暢

內(nèi)蒙古財經(jīng)大學(xué),內(nèi)蒙古 呼和浩特 010070

文章對數(shù)字圖書館檢索現(xiàn)狀進(jìn)行分析,提出了構(gòu)建基于本體的數(shù)字圖書館智能檢索系統(tǒng)。在論述本體理論的基礎(chǔ)上,從設(shè)計思想、系統(tǒng)模型角度介紹了數(shù)字圖書館智能檢索系統(tǒng),并提出了智能檢索系統(tǒng)的設(shè)計方法,包括構(gòu)建數(shù)字資源本體管理模塊、用戶輸入及智能拓展模塊、智能檢索模塊及結(jié)果反饋模塊。

本體;數(shù)字圖書館;智能檢索系統(tǒng);設(shè)計

隨著近年來我國科學(xué)技術(shù)和現(xiàn)代通訊技術(shù)的快速發(fā)展,數(shù)字圖書館為數(shù)字用戶知識信息的精準(zhǔn)檢索創(chuàng)造了有利條件。傳統(tǒng)模式下的數(shù)字圖書館,其信息組織形式無法清晰地表達(dá)信息內(nèi)部組織關(guān)系和內(nèi)部邏輯,僅依靠關(guān)鍵詞層面的信息檢索不能體現(xiàn)信息內(nèi)部的語義關(guān)聯(lián),系統(tǒng)結(jié)構(gòu)不兼容導(dǎo)致操作不規(guī)范,這些原因造成使用數(shù)字圖書館檢索的結(jié)果偏離用戶的實際需求,常會出現(xiàn)無效檢索的現(xiàn)象[1]。因此,迫切需要一種新的技術(shù)對數(shù)字圖書館傳統(tǒng)信息檢索方式進(jìn)行革新。本文提出基于本體的數(shù)字圖書館智能檢索系統(tǒng),希望能幫助數(shù)字圖書館有效提高信息檢索效率,解決檢索結(jié)果準(zhǔn)確率偏低及共享使用中存在的問題。

1 本體的理論基礎(chǔ)

本體的概念最早源于哲學(xué),是人們從哲學(xué)角度認(rèn)識事物組織模式的一種方法,是對客觀事物組織系統(tǒng)的詳細(xì)解釋和說明,關(guān)注現(xiàn)實事物邏輯層面上的抽象本質(zhì)。近年來,本體學(xué)或本體論(Ontology)在信息系統(tǒng)領(lǐng)域中的研究和應(yīng)用越來越普遍,其重要性在電子商務(wù)、語義網(wǎng)絡(luò)、企業(yè)、信息集成、自然語言處理、知識工程、數(shù)據(jù)庫等不同領(lǐng)域得到了認(rèn)可和重視[2],本體在數(shù)字科學(xué)領(lǐng)域的使用得到迅速發(fā)展。

1.1 本體的概念

學(xué)術(shù)界認(rèn)為本體是關(guān)于事物本質(zhì)的共享觀念。對于知識信息而言,本體能在語義和邏輯層面描述知識信息的內(nèi)部結(jié)構(gòu),反映知識信息的內(nèi)部邏輯,是一種有效的知識組織模型。在知識利用方面,本體更加關(guān)注知識概念在語義層面的關(guān)聯(lián),是關(guān)于知識概念、規(guī)則、關(guān)系的集合。應(yīng)用本體的目的是基于知識概念在語義層面關(guān)聯(lián)捕獲相關(guān)學(xué)科領(lǐng)域的信息,基于概念之間的邏輯關(guān)系使人們能對概念共享和理解,依據(jù)人們對概念達(dá)成的共識確定描述知識概念的專用語,并以不同方法、工具、手段及概念之間的邏輯關(guān)系給予這些術(shù)語科學(xué)的定義[3]。

1.2 本體的功能

本體理論可以實現(xiàn)對知識信息的系統(tǒng)化、標(biāo)準(zhǔn)化加工,使知識使用標(biāo)準(zhǔn)化。本體在知識加工利用方面有著深度的邏輯性、關(guān)聯(lián)性、層次性,基于知識概念內(nèi)部邏輯關(guān)系確定的專業(yè)術(shù)語實現(xiàn)對客觀事物通用化、標(biāo)準(zhǔn)化的描述,并使得這種源于知識概念的知識系統(tǒng)更加完善。與此同時,要在專業(yè)的學(xué)科領(lǐng)域?qū)崿F(xiàn)對知識信息的清晰描述,必須對該學(xué)科使用的專業(yè)術(shù)語進(jìn)行科學(xué)化界定,并使得這種科學(xué)化描述得到全體成員的認(rèn)可,這樣才能實現(xiàn)知識描述的標(biāo)準(zhǔn)化,使源于該學(xué)科的學(xué)術(shù)用語具有良好的通用性。此外,知識組織利用的標(biāo)準(zhǔn)化、通用化也可以借助學(xué)科專業(yè)術(shù)語的知識系統(tǒng)清晰地表達(dá)出來,實現(xiàn)全體共享[4]。

用戶在特定學(xué)科領(lǐng)域的語義層面實現(xiàn)實時信息共用共享。信息媒介的特點是跨系統(tǒng)、跨平臺、多領(lǐng)域傳播,本體若想在知識信息傳播過程中保持自身可組織、可利用的特性,就必須將不同知識觀點及不同學(xué)科背景的用戶、平臺、知識概念集中到統(tǒng)一的系統(tǒng)內(nèi),這樣使知識概念語義層面的邏輯關(guān)系能清晰表達(dá)出來。與此同時,對于新系統(tǒng)、新平臺的開發(fā),可以重用該學(xué)科領(lǐng)域中的原有本體,這樣可以節(jié)約研發(fā)成本、縮短系統(tǒng)和平臺研發(fā)的周期,避免資源重復(fù)建設(shè)[5]。

1.3 數(shù)字圖書館本體的構(gòu)建

通常而言,數(shù)字圖書館體系的構(gòu)建需要分為 7個步驟。第一步,根據(jù)數(shù)字圖書館知識信息具有的概念及內(nèi)部邏輯,確定本體的組織區(qū)域和使用范圍,規(guī)劃知識資源的組織方式;第二步,對知識本體進(jìn)行充分研究,在對知識信息覆蓋的學(xué)科領(lǐng)域分類之后,衡量能否對知識本體進(jìn)一步完善;第三步,確定涉及不同學(xué)科領(lǐng)域本體的概念,并根據(jù)知識概念的內(nèi)部邏輯關(guān)系和語義層面的關(guān)聯(lián)確定專業(yè)的學(xué)術(shù)用語,并使這種學(xué)術(shù)用語得到全體成員認(rèn)可;第四步,以自定向上、自定向下的方式確定數(shù)字圖書館本體的定義類及類的等級體系;第五步,根據(jù)用戶的需求及可能選擇的知識檢索方式確定本體定義類的屬性、價值,本體的概念屬性及定義對象屬性;第六步,對用戶可能使用的本體屬性進(jìn)行界定,其中包括本體的值域、基數(shù)、類型等;第七步,根據(jù)學(xué)科術(shù)語、本體定義類、類的等級體系、屬性、價值、本體的概念及定義對象屬性創(chuàng)建實例,基于語義層面以專業(yè)的學(xué)術(shù)用語及本體的概念進(jìn)行檢索查詢。由此,完成了數(shù)字圖書館本體的構(gòu)建,按照本體的概念、類型、屬性實現(xiàn)精準(zhǔn)快速的查詢。

2 基于本體的數(shù)字圖書館智能檢索技術(shù)的優(yōu)勢和意義

目前,數(shù)字圖書館智能檢索技術(shù)可以實現(xiàn)用戶在檢索界面輸入關(guān)鍵詞進(jìn)行知識查詢,用戶使用自然語言輸入的關(guān)鍵詞很難實現(xiàn)精準(zhǔn)的知識資源匹配,缺少對用戶輸入的自然語言語義層面的清晰理解。在檢索結(jié)果層面,只是將用戶需要的知識概念表達(dá)出來,還不夠深入、精準(zhǔn)地查詢知識資源。基于本體的數(shù)字圖書館知識智能檢索技術(shù)不僅能對用戶輸入的關(guān)鍵詞進(jìn)行深入理解,還能向用戶精準(zhǔn)匹配知識資源,以及將滿足用戶個性化需求的專業(yè)學(xué)科領(lǐng)域的知識體系清晰表達(dá)出來,這樣使用戶更加精準(zhǔn)、全面、深入了解自己所需知識。值得注意的是,用戶使用數(shù)字圖書館進(jìn)行檢索運用的都是自然語言,雖然具有較強的通用性,但是不能很好地進(jìn)行轉(zhuǎn)換以及自由控制,這就使用戶不能實現(xiàn)精準(zhǔn)查詢。而基于本體的數(shù)字圖書館智能檢索技術(shù)可以根據(jù)用戶需求對自然語言進(jìn)行標(biāo)注、挖掘,將自然語言轉(zhuǎn)換為可供用戶理解的本體檢索形式,不僅能促進(jìn)用戶在語義層面對知識信息的精準(zhǔn)理解,也進(jìn)一步提高了知識檢索的準(zhǔn)確率。

基于本體的數(shù)字圖書館智能檢索技術(shù)將與本體相關(guān)的知識組織方法、技術(shù)工具應(yīng)用到數(shù)字圖書館智能檢索中,對于特定學(xué)科領(lǐng)域的知識信息能以統(tǒng)一格式的可視化界面清晰地呈現(xiàn)出來。這樣數(shù)字圖書館能幫助用戶精準(zhǔn)查詢到知識資源,借助群體智慧、虛擬社區(qū)對知識資源深度加工,構(gòu)建出符合用戶需求的新的知識體系。同時,基于本體的數(shù)字圖書館智能檢索技術(shù)實現(xiàn)對關(guān)鍵詞、知識結(jié)構(gòu)及本體概念的深度理解和智能化匹配,在知識檢索時能根據(jù)不同領(lǐng)域知識的內(nèi)在聯(lián)系建立學(xué)科知識系統(tǒng),數(shù)字圖書館可利用新的學(xué)科知識系統(tǒng)構(gòu)建基于本體的專題知識導(dǎo)航,通過這樣的功能模塊,幫助用戶以專題的形式查找相關(guān)領(lǐng)域知識,在實現(xiàn)對知識資源分類利用的基礎(chǔ)上,拓展學(xué)科服務(wù)范圍,豐富館藏資源,使知識組織利用效率進(jìn)一步提升[6]。

3 基于本體的數(shù)字圖書館智能檢索系統(tǒng)設(shè)計

目前數(shù)字圖書館使用的智能檢索系統(tǒng)會出現(xiàn)檢索結(jié)果不全面、知識分散、檢索準(zhǔn)確率不高、用戶反饋不及時等問題,影響了用戶體驗度和數(shù)字圖書館服務(wù)效率。為此,筆者設(shè)計了基于本體的數(shù)字圖書館智能檢索系統(tǒng)。該系統(tǒng)將數(shù)字圖書館基于自然語言的知識檢索方式提高到邏輯語義層面,結(jié)合本體的知識組織和表達(dá)優(yōu)勢,從提高系統(tǒng)性能角度,以本體的方式幫助用戶實現(xiàn)知識資源的精準(zhǔn)檢索。

3.1 設(shè)計思想

基于本體的數(shù)字圖書館智能檢索系統(tǒng)設(shè)計首先是構(gòu)建本體,在遵循可用性、拓展性、實用性、持久性、開放性原則的基礎(chǔ)上,針對用戶可能選擇的檢索方式,確定本體的適用領(lǐng)域和應(yīng)用范圍,使用本體語言,在學(xué)科專家和工程師的參與下構(gòu)建符合本體使用的系統(tǒng)框架,建立本體知識庫,實現(xiàn)本體模塊的構(gòu)建。針對用戶自然語言輸入方式使用自然語言處理技術(shù),在工程師的參與下使用本體開發(fā)語言Protege建立學(xué)科本體,針對語義分析,建立語義模型判定語義相似度,對本體知識抽取和拓展;根據(jù)用戶查詢擴展形成的知識表達(dá)結(jié)構(gòu),從語義庫中對符合檢索條件的本體集合進(jìn)行類比和匹配,精準(zhǔn)匹配檢索結(jié)果,實現(xiàn)智能檢索。

3.2 系統(tǒng)模型

在傳統(tǒng)數(shù)字圖書館三層體系結(jié)構(gòu)基礎(chǔ)上新加入本體層,將以自然語言的知識檢索提升到知識語義檢索層面。該系統(tǒng)模型要滿足自然語言輸入、知識資源本體管理、智能拓展、智能檢索、結(jié)果反饋5個方面的需求,設(shè)計不同的功能模塊,實現(xiàn)用戶需求與基于本體的知識資源精準(zhǔn)匹配。

4 基于本體的數(shù)字圖書館智能檢索系統(tǒng)功能模塊

4.1 數(shù)字資源本體管理模塊

數(shù)字資源本體管理模塊是基于本體的數(shù)字圖書館智能檢索系統(tǒng)建設(shè)的基礎(chǔ)模塊,主要功能是有效處理和組織數(shù)字圖書館信息資源,以滿足用戶高效獲取、檢索、使用知識信息的需求。首先,在學(xué)科專家和技術(shù)工程師的幫助下,使用本體語言(OWL)和本體開發(fā)工具構(gòu)建能準(zhǔn)確描述數(shù)字圖書館知識信息的概念空間,形成領(lǐng)域本體。本體的構(gòu)建是持續(xù)同步和不斷完善的過程,領(lǐng)域本體在建成之后還需要優(yōu)化調(diào)整和維護(hù)。其次,使用領(lǐng)域本體對文本信息內(nèi)容的相關(guān)概念進(jìn)行標(biāo)注和關(guān)聯(lián),使用本體語義模型計算信息概念的相似度及語義關(guān)聯(lián)度。最后,對領(lǐng)域本體概念及語義關(guān)聯(lián)度的權(quán)值分類提取,并存儲到相關(guān)索引庫中。索引庫資源既要包含相關(guān)資源的描述信息,也要包括語義本體的標(biāo)注信息,為后續(xù)系統(tǒng)進(jìn)行智能拓展提供資源支持。

4.2 用戶輸入及智能拓展模塊

用戶輸入及智能拓展模塊是根據(jù)用戶采用自然語言在智能檢索系統(tǒng)輸入的關(guān)鍵詞或語句判斷用戶的知識需求,根據(jù)領(lǐng)域本體概念之間的邏輯關(guān)系以及語義模型對關(guān)鍵詞進(jìn)行提取、分析,找到相關(guān)語義關(guān)鍵詞及語句。根據(jù)數(shù)字圖書館信息資源本體的概念、屬性、定義類及定義類等級體系,使用本體領(lǐng)域知識進(jìn)行推理、計算,用自然語言理解技術(shù)對用戶提供的關(guān)鍵詞、語句進(jìn)行分析,通過計算用戶提供的關(guān)鍵詞、語句的相似度進(jìn)行邏輯推理,從領(lǐng)域本體內(nèi)部抽取具有相似語義特征的本體,選擇滿足用戶最大需求度的重要詞匯,代替用戶輸入的自然語言,形成擴展的語義邏輯表達(dá)式,提交智能檢索模塊進(jìn)行搜索。

4.3 智能檢索模塊

智能檢索模塊是數(shù)字圖書館智能檢索系統(tǒng)的核心模塊,主要功能是在對用戶查詢后形成的語義邏輯表達(dá)式進(jìn)行精確理解的基礎(chǔ)上,結(jié)合知識概念之間的相似度進(jìn)行邏輯推理,根據(jù)拓展后的概念集合,從索引庫中匹配本體。在工程師和學(xué)科專家的幫助下,創(chuàng)建符合用戶檢索習(xí)慣的本體推理規(guī)則,對本體知識庫中采用OWL描述的實例進(jìn)行邏輯分析,確定智能檢索模塊,從數(shù)字圖書館數(shù)據(jù)庫中搜索出符合該語義邏輯的文獻(xiàn)資源,即檢索結(jié)果集合,以可視化的方式呈現(xiàn)給用戶,供用戶自主選擇。

4.4 結(jié)果反饋模塊

結(jié)果反饋模塊是衡量基于本體的數(shù)字圖書館智能檢索系統(tǒng)檢索效果的工具模塊,主要功能是將檢索得到的領(lǐng)域本體概念進(jìn)行去重、科學(xué)排序、集成和分類處理,并以可視化的方式呈現(xiàn)給用戶,供用戶自主判定。為保障系統(tǒng)為用戶提供滿意的文獻(xiàn)檢索結(jié)果,該模塊對用戶的行為偏好和檢索習(xí)慣進(jìn)行有效記錄,對用戶個性化的檢索特點進(jìn)行判定,形成相關(guān)的系統(tǒng)日志進(jìn)行存儲,并分析用戶的這種檢索記錄,根據(jù)分析結(jié)果面向用戶智能匹配本體模型,提高檢索效率,縮短檢索時間。最后,對系統(tǒng)的用戶評價結(jié)果進(jìn)行反饋,方便技術(shù)專家及學(xué)者找到系統(tǒng)在功能上存在的不足,有利于后期對智能拓展模塊、智能檢索模塊進(jìn)行優(yōu)化調(diào)整。

5 小結(jié)

基于本體的數(shù)字圖書館智能檢索系統(tǒng),有助于改變數(shù)字圖書館以關(guān)鍵詞、語句進(jìn)行知識檢索的弊端,從本體的角度分析用戶自然語言檢索的語義關(guān)聯(lián)和知識間的邏輯關(guān)系,根據(jù)用戶的習(xí)慣和特點為用戶精準(zhǔn)提供信息資源,促進(jìn)智能檢索服務(wù)效果實時反饋,再根據(jù)反饋結(jié)果及時調(diào)整、優(yōu)化系統(tǒng)結(jié)構(gòu),從而提高檢索效能。

[1] 馮園園.多領(lǐng)域本體語義環(huán)境中數(shù)字圖書館知識地圖的構(gòu)建研究[J].農(nóng)業(yè)圖書情報學(xué)刊,2018,30(2):118-121.

[2]龍海,朱彥.論GFO的基本框架及頂層本體比較研究[J].中國中醫(yī)藥圖書情報雜志,2015,39(5):18-22.

[3] 沈旺,翟倩,李賀.基于本體的數(shù)字圖書館自適應(yīng)信息系統(tǒng)架構(gòu)研究[J].圖書館學(xué)研究,2016(14):47-51.

[4] 王珊珊,肖明.基于本體的引文知識服務(wù)系統(tǒng)構(gòu)建研究[J].情報理論與實踐,2017,40(11):125-129.

[5] 李燮慧.基于本體論的大數(shù)據(jù)數(shù)字圖書館知識體系構(gòu)建研究[J].圖書館理論與實踐,2016(10):47-51.

[6] 楊選輝,龍帆.基于本體學(xué)習(xí)的圖書館數(shù)字資源服務(wù)模型研究[J].圖書館學(xué)研究,2016(9):90-94.

Design of Intelligent Retrieval System of Digital Libraries Based on Ontology

LI Yun-chang

(Inner Mongolia University of Finance and Economics, Hohhot 010070, China)

This article analyzed the status quo of retrieval of digital libraries and proposed to build an intelligent retrieval system of digital libraries based on ontology. Based on the discussion of ontology theory, the article introduced intelligent retrieval system of digital libraries from the perspectives of design ideas and system models, and proposed the design method of intelligent retrieval system, including the construction of digital resource ontology management module, user input and intelligent expansion module, intelligent retrieval module and result feedback module.

ontology; digital libraries; intelligent retrieval system; design

10.3969/j.issn.2095-5707.2019.05.006

G250.7;TP391.1

A

2095-5707(2019)05-0025-04

李云暢,E-mail: aaser4567@163.com

李云暢.基于本體的數(shù)字圖書館智能檢索系統(tǒng)設(shè)計[J].中國中醫(yī)藥圖書情報雜志,2019,43(5):25-28.

(2019-02-14)

(2019-02-22;編輯:魏民)

猜你喜歡
檢索系統(tǒng)本體檢索
Abstracts and Key Words
對姜夔自度曲音樂本體的現(xiàn)代解讀
2019年第4-6期便捷檢索目錄
收錄《信號處理》的檢索系統(tǒng)及數(shù)據(jù)庫
信號處理(2018年1期)2018-09-03 07:53:04
收錄《信號處理》的檢索系統(tǒng)及數(shù)據(jù)庫
信號處理(2018年5期)2018-06-28 02:16:02
本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
信號處理(2018年4期)2018-06-27 03:34:16
本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
信號處理(2018年3期)2018-06-27 03:30:18
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
《我應(yīng)該感到自豪才對》的本體性教學(xué)內(nèi)容及啟示
Care about the virtue moral education
卷宗(2013年6期)2013-10-21 21:07:52
永嘉县| 莱州市| 秦皇岛市| 营山县| 长泰县| 武邑县| 平罗县| 东乌珠穆沁旗| 阿拉善盟| 攀枝花市| 瑞金市| 安康市| 朝阳区| 莱州市| 会昌县| 淅川县| 荆州市| 禹州市| 资阳市| 开江县| 宜城市| 措勤县| 莎车县| 九龙坡区| 织金县| 阳新县| 抚远县| 柯坪县| 罗田县| 元氏县| 漳浦县| 茶陵县| 日土县| 翼城县| 宣恩县| 大新县| 东丽区| 吉林市| 东辽县| 凌海市| 乌拉特中旗|