国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于本體的相似性計算實現(xiàn)高性能案例推理

2009-03-23 02:40王海棠顧君忠葉蘭御
計算機時代 2009年1期
關(guān)鍵詞:本體

王海棠 顧君忠 楊 靜 葉蘭御

摘要:基于案例的推理常常會遇到一詞多義、多詞同義問題,這會在計算案例相似性時導(dǎo)致錯誤的匹配,進而導(dǎo)致結(jié)論錯誤。文章提出了基于本體的相似性計算方法,借此來檢索相似的案例,解決案例檢索中的一詞多義、多詞同義的問題。實驗證明,在基于本體的相似性計算的查全率和查準(zhǔn)率上,該方法優(yōu)于傳統(tǒng)的相似性計算。

關(guān)鍵詞:案例推理;案例檢索;本體;相似性計算

0引言

基于案例推理(case-Based Reasoning,簡稱CBR)是近年來人工智能領(lǐng)域的一項重要的問題求解和學(xué)習(xí)的推理技術(shù)。案例推理能利用過去經(jīng)驗中的特定知識即具體案例來解決新的問題,即通過檢索歷史案例,獲得與當(dāng)前相似特征參數(shù)相匹配的案例,根據(jù)具體情況對匹配案例解決方案進行修正,然后應(yīng)用于當(dāng)前情況。

為了在歷史案例中檢索相似性案例,在案例檢索中通常采用相似度計算。但是一詞多義、多詞同義問題常常導(dǎo)致相似案例的錯誤匹配。因此,本文提出了一個基于本體的相似性計算的案例推理的新方法,有效解決了案例檢索中的一詞多義、多詞同義問題。

1案例推理

1.1案例推理概述

案例推理是以案例的形式來存儲經(jīng)驗和知識,利用先前相似的案例的解決方案來解決當(dāng)前問題的方法。

CBR的工作原理,就是模仿人們的認(rèn)知心理過程。在CBR中,以案例為基礎(chǔ)進行推理,把人們以往的經(jīng)驗存儲成一個個的案例,當(dāng)面臨新的問題時,對案例庫進行搜索,找到合適的案例作為參考.這其實是實現(xiàn)經(jīng)驗的重用;如果對找到的案例有不滿之處,就可以進行修改以適應(yīng)當(dāng)前情況,修改后的案例將被再次存入案例庫,以便下次使用時作為參考,這其實是實現(xiàn)經(jīng)驗的自學(xué)習(xí)。

CBR的生命周期,常常由“4R”組成,包括案例檢索(Retrieve)、案例重用(Reuse)、案例修正(Revise)、案例保存(Retain)4個工作過程,如圖1所示。CBR把經(jīng)驗和知識存儲在案例中,通過案例的推理簡化人工的知識獲取過程,并且以案例的形式提供知識的共享和重用。

1.2案例檢索

案例檢索,從以前的案例中查找最有用案例并忽略那些不相關(guān)案例,從總體上可分為三個步驟,如圖2所示。首先,對新案例充分描述,詳細填充特征項。其次,從歷史案例中搜索那些對決策支持有潛在作用的案例。通常這種搜索在一定的粗限制條件下進行,故常稱過濾。最后,對這些經(jīng)過篩選的案例進行匹配,并按相似度順序排列。匹配過程即評價當(dāng)前案例同上述經(jīng)過篩選的歷史案例相似度的比較過程。

1.3現(xiàn)有的CBR中的相似性計算研究

對于給定的目標(biāo)案例,如何從案例庫中檢索和選擇最為相似的案例決定了案例推理系統(tǒng)的學(xué)習(xí)與推理性能。案例間的相似性計算是檢索的關(guān)鍵。在案例間相似度的評估中,通常是建立一個相似性計算函數(shù)對當(dāng)前案例與舊案例進行比較。下面簡要介紹其中的一些算法。

最鄰近算法最鄰近算法是CBR系統(tǒng)中最為廣泛使用的技術(shù),只用于簡單的基于屬性的案例表述方式。最簡單的最鄰近算法是采用加權(quán)平均的方法,將所有屬性的相似度加權(quán)加總后就可以得到2個案例的相似度。

多維空間檢索技術(shù)雖然結(jié)構(gòu)化的案例表示能夠通過結(jié)構(gòu)表示出屬性之間的相關(guān)性和背景知識,但是很多情況下案例只是簡單地表示為屬性值對的組合。一個案例能夠映射成多維空間的矢量,距離就成為相似度的一種衡量,相似度問題也就轉(zhuǎn)化為在多維空間中尋找最鄰近點。

基于歸納技術(shù)的相似算法歸納算法根據(jù)案例的歷史自動構(gòu)建出決策樹。算法識別案例的模式,據(jù)此將案例庫分割成簇,每個簇存放相似的案例。本質(zhì)上說歸納法是將相似案例進行歸類的一種分類方法。

基于模糊邏輯的相似算法CBR匹配過程可以運用模糊邏輯技術(shù)。CBR和模糊邏輯都能夠確定相似度,但是他們處理的對象不同:CBR通常是處理屬性、集合或結(jié)構(gòu),而模糊邏輯處理的是人們表示近似概念時的不確定性和模糊性。

這些相似性算法在不同的領(lǐng)域都有各自的應(yīng)用。但是在歷史案例中檢索相似性案例時,常常會遇到同義詞問題。同樣的概念術(shù)語在不同的案例中會有不同的意義,相同的概念也可能會使用不同的術(shù)語來描述,這些同義詞問題可能會在計算案例相似性時導(dǎo)致錯誤的匹配。因此,本文提出了基于本體的相似性計算的案例推理的新方法,解決案例檢索中的同義詞問題。

2使用本體和相似度計算來檢索案例

2.1本體概述

本體(Ontology)最早是一個哲學(xué)的分支,隨著人工智能的發(fā)展,被賦予了新的定義。現(xiàn)在本體的含義是:共享概念模型的明確的形式化規(guī)范說明。它主要包括4個方面:概念化(conceptualization):客觀世界的現(xiàn)象的抽象模型;明確(explic-it):概念及它們之間聯(lián)系都被精確定義;形式化(formal):精確的數(shù)學(xué)描述;共享(share):本體中反映的知識是其使用者共同認(rèn)可的。

本體為案例描述提供了一種規(guī)范的語義描述。本體的概念或者描述可以分為三個部分:受約束的詞匯(有限的術(shù)語表),術(shù)語表(術(shù)語和術(shù)語含義表),辭典(同義詞之間的聯(lián)系)。本體的構(gòu)建可以基于分類的知識或者基于通用的知識。分類的知識被用于擁有許多共同屬性的知識分類。通用的知識主要由每個類別的特征組成。它允許用戶構(gòu)造明確的概念,構(gòu)建有層次的結(jié)構(gòu),定義概念之間的聯(lián)系。因此,本體可以更好地描述案例的語義信息,可以解決同義詞問題。

2.2基于本體的相似度計算

當(dāng)新案例產(chǎn)生的的時候,查詢語句將會被傳遞到查詢分析器。查詢分析器將查詢語句分解為動詞和名詞,再與相似性歷史案例進行匹配。由于同義詞的問題,被分解的查詢語句可能不會與相似案例進行匹配。因此,我們事先要先定義好一個和案例庫相關(guān)的本體庫。術(shù)語被傳遞到本體庫中去獲得本體樹中所有他的孩子術(shù)語,然后創(chuàng)建相似性計算的查詢矢量Pq(V,N)。這里,V是動詞矢量,N是名詞矢量。

帶有任何術(shù)語的V、N矢量的歷史案例作為一個案例集,案例庫中的某個歷史案例i通過Pq(V,N)來描述。由于問題查詢矢量和歷史案例矢量在長度上是相似的,所以為了計算在案例集和問題查詢Pq中的問題的相似性,文中采用相似性系數(shù)。

查詢矢量pq和歷史案例Pi之間的相似性系數(shù)計算如下:公式

SC(Pq,Pi)中加權(quán)系數(shù)Wij在歷史案例Pi中表示如下:公式其中fij是歷史案例Pi中術(shù)語tj出現(xiàn)的次數(shù);fj是歷史案例庫中所有不同案例的總數(shù);pfij是歷史案例庫包含術(shù)語tj的歷史案例數(shù)。

猜你喜歡
本體
Abstracts and Key Words
灰鑄鐵缸體本體抗拉強度提升的研究
眼睛是“本體”
對姜夔自度曲音樂本體的現(xiàn)代解讀
領(lǐng)域本體的查詢擴展和檢索研究
基于本體的機械產(chǎn)品工藝知識表示
本體在產(chǎn)品設(shè)計知識管理中的應(yīng)用研究
《我應(yīng)該感到自豪才對》的本體性教學(xué)內(nèi)容及啟示
一種基于本體的語義檢索設(shè)計與實現(xiàn)
媒介生存:關(guān)于新聞史研究本體的思考
盖州市| 宁河县| 信宜市| 措美县| 龙南县| 珲春市| 饶河县| 尉犁县| 加查县| 海安县| 昌吉市| 富阳市| 黔西县| 天祝| 诸城市| 拜城县| 扶余县| 慈利县| 崇文区| 平泉县| 青海省| 商南县| 遂宁市| 城市| 松潘县| 隆回县| 宜兴市| 邯郸县| 峨眉山市| 瓦房店市| 澎湖县| 衡山县| 曲周县| 广德县| 大渡口区| 丰县| 十堰市| 晴隆县| 新和县| 定日县| 江孜县|