国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向領域本體非分類關系的語義相關度計算方法

2016-12-26 08:14樊紅杰
計算機應用與軟件 2016年11期

王 紅 樊紅杰 孫 康

(中國民航大學計算機科學與技術學院 天津 300300)

?

面向領域本體非分類關系的語義相關度計算方法

王 紅 樊紅杰 孫 康

(中國民航大學計算機科學與技術學院 天津 300300)

針對民航突發(fā)事件領域本體非分類關系的語義查詢擴展問題,提出一種面向領域本體非分類關系的語義相關度計算方法。該方法在數(shù)據(jù)屬性方面,提出基于屬性類型和屬性值的語義相關度計算方法;在對象屬性方面,針對查詢詞與本體概念或實例存在多種對象屬性問題,提出基于對象屬性的語義相關度計算方法,并結合領域本體在民航突發(fā)事件案例的語義查詢過程給出了該方法的實現(xiàn)效果分析。該方法不僅有效地提高了語義查詢的準確率和查全率,也為民航突發(fā)事件的應急決策提供了更好的方法支持。

民航突發(fā)事件 領域本體 非分類關系 語義相關度

0 引 言

本體是共享概念模型的明確的規(guī)范說明[1]。領域本體是用于描述指定領域知識的一種專門本體,它將與特定領域相關的概念以及概念間的關系以形式化的說明進行了嚴格的規(guī)范,明確描述了概念的含義以及概念間語義的關系。民航突發(fā)事件領域本體是以民航突發(fā)事件應急救援計劃、民航應急管理相關規(guī)定、民航突發(fā)事件應急救援預案,民航突發(fā)事件歷史案例為基礎,通過概念以及概念間關系的形式化描述,明確了領域中概念及概念間的語義關系。之前開展的基于領域本體的語義檢索方法[2]是基于概念間的分類關系實現(xiàn)的,雖然有效解決了傳統(tǒng)的基于關鍵詞查詢方法所存在的語義偏差和語義歧義等問題,但在查全率和查準率方面依然存在不足。非分類關系是指除分類關系以外的所有其他關系,是概念間語義關系的重要組成部分,影響著語義查詢擴展的效率。因此,本文面向領域本體對基于非分類關系的語義相關度計算方法展開了研究。

目前,針對本體非分類關系的語義相關度計算方法的研究主要集中在數(shù)據(jù)屬性[3-6]方面,在對象屬性方面的研究[7,8]還比較少。本文結合民航突發(fā)事件應急救援的特殊性,通過深入分析已構建的民航突發(fā)事件領域本體[9,10]的特征,提出一種面向領域本體非分類關系的語義相關度計算方法。該方法不僅提高了語義查詢的準確率和查全率,同時也為民航突發(fā)事件的應急決策與救援提供了輔助作用。

1 語義相關度

1.1 語義相關度定義

在本體領域,語義相關度是指概念間語義相互關聯(lián)程度[11]。語義相關的兩個概念可能不存在相似關系,但它們可以通過某些其他關系相關聯(lián)形成相關關系。語義相似度是語義相關度的特例,通常情況下,相似概念一般是相關的,但相關概念卻不一定相似。

本文依據(jù)語義相關度的一般定義和已構建的民航突發(fā)事件領域本體的特點,給出了以下基于民航突發(fā)事件領域本體的語義相關度的定義:

語義相關度是指本體中概念在非分類關系上的相關程度,記概念ci、cj之間的相關度為Sim(ci, cj),它需滿足以下條件:

(1) 相關度的值是區(qū)間[0,1]內(nèi)的一個實數(shù),即Sim(ci, cj)?[0,1];

(2) 如果兩個概念完全相似,則相關度值為1,即Sim(ci, cj)=1(當且僅當ci=cj);

(3) 如果兩個概念之間不存在任何連通路徑,則相關度值為0,即Sim(ci, cj)=0;

(4) 概念之間的相關度是對稱的,即Sim(ci, cj)= Sim(cj, ci)。

1.2 語義相關度計算方法

在民航突發(fā)事件領域本體中,非分類關系分為數(shù)據(jù)屬性關系和對象屬性關系。本文通過對數(shù)據(jù)屬性和對象屬性語義相關度的研究,提出了一種基于非分類關系的語義相關度計算方法,并將其應用于領域本體中事故案例的語義查詢擴展中,其實現(xiàn)模型如圖1所示。

圖1 面向領域本體非分類關系的語義相關度計算方法模型

圖1中:

相關定義:負責語義相關度、數(shù)據(jù)屬性權重和對象屬性權重的定義。

相關度計算:實現(xiàn)查詢詞與本體概念、實例基于非分類關系的語義相關度計算。

相關度應用:將該基于非分類關系的語義相關度計算方法應用于民航突發(fā)事件領域本體中的事故案例語義查詢擴展中。

2 領域本體數(shù)據(jù)屬性的語義相關度計算

2.1 數(shù)據(jù)屬性的權重

當民航突發(fā)事件發(fā)生時,救援指揮中心根據(jù)獲取的各種事故信息和救援信息制定相應的救援方案并通知各救援部門實施及時、有效的救援。在突發(fā)事件的應急決策與救援中,突發(fā)事件案例對實現(xiàn)事故的及時、有效救援起到了重要的借鑒和指導作用。已構建的民航突發(fā)事件領域本體中與突發(fā)事件案例相關的數(shù)據(jù)屬性如表1所示,這些數(shù)據(jù)屬性實現(xiàn)了對突發(fā)事件案例的特征描述。

表1 領域本體中與突發(fā)事件案例相關的數(shù)據(jù)屬性及取值

由于突發(fā)事件案例對事故的應急決策與救援具有重要的借鑒和指導作用,本文依據(jù)突發(fā)事件案例的各種信息在事故應急決策與救援中起到的重要程度,為上述數(shù)據(jù)屬性分配了一定的權重。數(shù)據(jù)屬性的權重越大,該數(shù)據(jù)屬性越重要,越不可缺失。

對于各屬性權重的具體取值,需要結合民航突發(fā)事件應急決策與救援的實際需求。由于Event_Level直接決定了應急救援響應等級,因此其權重應最大。Operation_Stage、Weather_Type、Event_Location對事故評估、救援實施具有重要作用,因此要為其分配次大的權重值。Plane_Type、Plane_Task和Event_Time對事故救援起到的輔助作用相比其他屬性要弱一些,因此其權重值應較小。本文將上述各數(shù)據(jù)屬性權重值限定在區(qū)間[0,1]內(nèi),并對其進行歸一化處理,最終為各數(shù)據(jù)屬性分配如表2所示的權重值。

表2 數(shù)據(jù)屬性的權重

2.2 數(shù)據(jù)屬性類型的語義相關度

在本體中,數(shù)據(jù)屬性將本體概念與屬性值類型、本體實例與具體屬性值相關聯(lián),它實現(xiàn)了對本體概念和實例的特征描述,起到了語義標簽的作用。

目前,基于數(shù)據(jù)屬性的語義相關度計算方法中最經(jīng)典且最常被引用的是Tversrvy[3]方法,其公式如下:

(1)

其中,f(ci, cj)表示本體概念ci、cj擁有的相同數(shù)據(jù)屬性的數(shù)量,f(ci- cj)表示ci擁有但cj沒有的數(shù)據(jù)屬性數(shù)量,f(cj-ci)表示cj擁有但ci沒有的數(shù)據(jù)屬性數(shù)量。α是調(diào)節(jié)因子,它與ci、cj的深度有關,其取值如下:

(2)

該方法在語義相關度計算中將比較的兩概念視為同等重要,但語義查詢擴展是利用目標概念在本體中查詢擴展出與其語義相似或相關的其他本體概念,上述方法削弱了目標概念的重要性。同時,該方法使用的是典型的特征匹配方法,忽略了屬性值之間的語義相關度問題。因此,本節(jié)以目標概念具有的數(shù)據(jù)屬性為基準,對概念在數(shù)據(jù)屬性類型和數(shù)據(jù)屬性值上的語義相關度分別進行了研究。

在數(shù)據(jù)屬性類型方面,兩概念擁有的相同屬性類型的個數(shù)越多,它們越相關;反之,兩概念擁有的相同屬性類型的個數(shù)越少,它們越不相關[12]。以目標概念或實例具有的數(shù)據(jù)屬性為基準,提出了以下基于數(shù)據(jù)屬性類型的語義相關度計算:

(3)

(4)

其中,ci、cj是任意本體概念或實例,ci作為目標概念或實例,cj作為源概念或實例。cik表示ci的第k個數(shù)據(jù)屬性;cjl表示cj的第l個數(shù)據(jù)屬性。type(cik)表示ci的第k個數(shù)據(jù)屬性的屬性類型。Simtype(cik, cjl)表示數(shù)據(jù)屬性cik、cjk基于屬性類型的語義相關度。wk是數(shù)據(jù)屬性cik的權重值。n、m分別表示ci、cj擁有的數(shù)據(jù)屬性的個數(shù)。

2.3 數(shù)據(jù)屬性值的語義相關度

在民航突發(fā)事件領域本體中,數(shù)據(jù)屬性值有三種:有序枚舉型屬性值、無序枚舉型屬性值和混合枚舉型屬性值。數(shù)據(jù)屬性值的類型不同,對屬性值的語義相關度計算方法也應不同。因此,根據(jù)數(shù)據(jù)屬性值的特點提出了三種基于屬性值的語義相關度計算。

1) 有序枚舉型屬性值的語義相關度

有序枚舉型屬性值是指屬性在給定的一個數(shù)據(jù)集中進行取值,該數(shù)據(jù)集中的數(shù)據(jù)存在有序關系,例如Event_Level的取值有1(特別重大)、2(重大)、3(較大)和4(一般)。

對于有序枚舉型屬性值,屬性值相差越大,其語義相關度越??;反之,屬性值相差越小,其語義相關度越大。在有序枚舉型屬性值的語義相關度計算方面,目前最常用的是海明距離法,其計算公式如下:

(5)

其中,Pi、Pj表示數(shù)據(jù)屬性,xi、xj是Pi、Pj的數(shù)值型屬性值。

該方法雖然解決了對有序枚舉型屬性值的語義相關度計算問題,但是計算結果受取值個數(shù)的影響較大。為了增強有序枚舉型屬性值之差對相關度的影響,進行了以下改進:

(6)

其中,ci、cj是任意本體實例,SimValue(cik, cjk)表示ci、cj在第k個數(shù)據(jù)屬性上基于屬性值的語義相關度。xk、yk分別表示ci和cj的第k個數(shù)據(jù)屬性的數(shù)值型屬性值。m是第k個數(shù)據(jù)屬性的取值個數(shù)。

2) 無序枚舉型屬性值的語義相關度

無序枚舉型屬性值是指屬性在給定的一個數(shù)據(jù)集中進行取值,該數(shù)據(jù)集中的所有數(shù)據(jù)之間無關聯(lián)關系,例如數(shù)據(jù)屬性Weather_Type的取值有“適航”、“臺風”、“雷暴”、“冰雹”等。

無序枚舉型屬性值一般都是字符型,因此,對于該屬性值的語義相關度計算使用字符匹配法,即:

(7)

其中,ci、cj是任意本體實例,SimValue(cik, cjk)表示ci、cj在第k個數(shù)據(jù)屬性上基于無序枚舉型屬性值的語義相關度。xk、yk分別表示ci和cj的第k個數(shù)據(jù)屬性的屬性值。

3) 混合枚舉型屬性值的語義相關度

混合枚舉型屬性值是指屬性在給定的多個數(shù)據(jù)集中進行取值,這些數(shù)據(jù)集之間存在分類關系,各數(shù)據(jù)集內(nèi)部所有數(shù)據(jù)之間無關聯(lián)關系。由于混合枚舉型屬性值通常是字符型,所以最常使用的方法是字符匹配法。但是該方法忽略了屬性值之間的隱性語義關系,在一定程度上影響了語義相關度計算的準確度,因此本文依據(jù)該屬性值的特點,提出了一種針對混合枚舉型屬性值的語義相關度計算方法。

對于混合枚舉型屬性值的語義相關度計算,在計算前先對屬性的取值數(shù)據(jù)集進行有序編號。如數(shù)據(jù)屬性Plane_Task的取值數(shù)據(jù)集有商用航空數(shù)據(jù)集和通用航空數(shù)據(jù)集,商用航空數(shù)據(jù)集包含“客運”、“貨運”、“客貨運”,通用航空數(shù)據(jù)集包含“工業(yè)航空”、“農(nóng)業(yè)航空”、“航空科研和探險活動”等。商用航空數(shù)據(jù)集的序號為1,通用航空數(shù)據(jù)集的序號為2,Plane_Task的屬性值“客運”、“貨運”、“飛行訓練”間的語義相關度關系為Sim(客運,客運)>Sim(客運,貨運) > Sim(客運,飛行訓練)。

依據(jù)混合枚舉型屬性值的特點,基于混合枚舉型屬性值的語義相關度計算如下:

(8)

其中,ci、cj是任意本體實例,SimValue(cik, cjk)表示ci、cj在第k個數(shù)據(jù)屬性上基于混合枚舉型屬性值的語義相關度。Xk、Yk分別表示ci和cj的第k個數(shù)據(jù)屬性的屬性值所在數(shù)據(jù)集的序號,如Plane_Task的屬性值“客運”所在數(shù)據(jù)集的序號為1,“飛行訓練”所在數(shù)據(jù)集的序號為2。m是第k個數(shù)據(jù)屬性的取值數(shù)據(jù)集的個數(shù)。xk、yk分別表示ci和cj的第k個數(shù)據(jù)屬性的屬性值。

2.4 基于數(shù)據(jù)屬性的語義相關度計算

通過上述對屬性類型的語義相關度和屬性值的語義相關度的研究,提出了以下基于數(shù)據(jù)屬性的語義相關度計算:

(9)

其中,ci、cj是任意本體概念或實例,ci作為目標概念或實例,cj作為源概念或實例。cik表示ci的第k個數(shù)據(jù)屬性。SimDat(ci,cj)表示ci、cj基于數(shù)據(jù)屬性的語義相關度。SimType(cik,cjl)表示cik、cjl在屬性類型上的語義相關度。SimValue(cik,cjl)表示cik、cjl在屬性值上的語義相關度。wk是屬性cik的權重值。n、m分別是ci、cj擁有的數(shù)據(jù)屬性的個數(shù)。

3 領域本體對象屬性的語義相關度計算

3.1 對象屬性的權重

本體中,對象屬性將不同的概念、實例依據(jù)語義相關性關聯(lián)在一起,構成了非分類關系。通常情況下,相似概念一般是相關的,但相關概念卻不一定相似。

目前,通過對象屬性計算語義相關度的方法主要依賴于概念間的語義距離來實現(xiàn)。許多研究者將基于詞語距離的相似度計算方法引入了本體領域,成為了一種常用的基于對象屬性的語義相關度計算方法,其計算公式如下:

(10)

其中,ci、cj是任意本體概念或實例,length(ci, cj)是ci、cj之間包含對象屬性關系邊的路徑長度。α是調(diào)節(jié)參數(shù)。

后來一些研究者對概念間的對象屬性通過關系權重進行了量化,進而產(chǎn)生了利用權重路徑計算本體概念基于對象屬性的語義相關度的方法,其中最常用的方法為:

(11)

其中,ci、cj是任意本體概念或實例,w(ei)是ci、cj之間包含對象屬性關系邊的路徑中第ei條邊的權重。

雖然該方法通過對象屬性實現(xiàn)了語義相關度的計算,但是它僅考慮了本體概念或實例之間只存在一種對象屬性的情況,對于本體概念或實例間擁有多種對象屬性的情況并不適用。因此,本文基于民航突發(fā)事件領域本體對上述方法進行了改進。

在民航突發(fā)事件領域本體中,與突發(fā)事件案例相關的對象屬性主要有PlanOwn、ActionOwn、RelatedCause、RelatedEffect、RelatedExperience、Keyfacor。由于突發(fā)事件案例對事故的應急決策與救援具有重要的借鑒和指導作用,本文依據(jù)突發(fā)事件案例的各種信息在事故應急決策與救援中的重要程度,為上述對象屬性分配了一定的權重。對象屬性的權重越大,該對象屬性越重要,越不可缺失。

由于對象屬性是將概念、實例進行語義相關聯(lián)的一種非分類關系,所以對象屬性的權重也與分類關系的權重相關。對于各對象屬性權重的具體取值,需要結合民航突發(fā)事件應急決策與救援的實際需求、專家經(jīng)驗和下文改進的基于對象屬性的語義相關度計算方法進行實驗驗證。實驗中,將所有對象屬性的權重初值設為0.1且取值范圍為[0,1],同時以增值為0.1的方式對權重值進行遞增,計算不同權重值下本體概念、實例基于對象屬性的語義相關度。實驗發(fā)現(xiàn),當對象屬性權重小于0.6時,會導致概念間的語義相關度值過小;當對象屬性權重大于0.8時,會導致概念間的語義相關度值過大,與實際情況不符。最終,通過對不同對象屬性權重下的實驗結果的分析和對比,得到如表3所示的各對象屬性的權重值。

表3 民航突發(fā)事件領域本體中對象屬性權重值

3.2 基于對象屬性的語義相關度計算

設集合R={r1,r2,…,rm}為對象屬性非分類關系的集合,其中ri(i=1,2,…,m)是領域本體中已定義的某種對象屬性非分類關系。

定義任意本體概念或實例ci和cj在對象屬性非分類關系ri上的相關值Vri(ci, cj)為:

其中,weight(ri)是對象屬性非分類關系ri的權重值。

在領域本體中,由于本體概念或實例之間可能存在多種對象屬性非分類關系,因此定義ci和cj在對象屬性非分類關系上的關系權重為:

(12)

其中,m為集合R中元素的個數(shù)。n為ci與cj間存在且不重復的對象屬性非分類關系的個數(shù)。

將本體中通過對象屬性相關聯(lián)的概念或實例看成是由一條加權的非分類關系邊直接相連,則基于式(12)的關系權重計算,ci和cj在對象屬性上的語義相關度為:

(13)

其中,α、 β為調(diào)節(jié)參數(shù)。

4 實現(xiàn)過程與效果分析

4.1 實現(xiàn)過程

通過上述對基于數(shù)據(jù)屬性和對象屬性的語義相關度的研究,提出了以下面向領域本體非分類關系的語義相關度計算方法。該方法將數(shù)據(jù)屬性和對象屬性的語義相關度進行了結合,其計算方法如下:

Sim(ci,cj)=?1SimDat(ci,cj)+?2SimNl(ci,cj)

(14)

其中,ci、cj是任意本體概念或實例,ci作為目標概念或實例,cj作為源概念或實例,Sim (ci, cj)表示 ci、cj基于非分類關系的語義相關度。?1、?2是調(diào)節(jié)因子,且?1+?2=1。

在基于非分類關系的語義相關度計算方法中,通過設定一個閾值λ來限制查詢結果集的大小,將領域本體中與目標查詢詞的語義相關度大于閾值λ的本體概念和實例加入查詢結果集中,該方法的具體實現(xiàn)過程如圖2所示。

圖2 基于非分類關系的語義相關度算法

如圖2所示,基于民航突發(fā)事件領域本體將關鍵詞qk與本體概念、實例相匹配, 計算匹配的關鍵詞qk與其他任意本體概念或實例cj在數(shù)據(jù)屬性和對象屬性上的語義相關度值。確定調(diào)節(jié)因子?1、?2的值,計算出關鍵詞qk與cj基于非分類關系的總相關度值,將總相關度值大于閾值λ的本體概念或實例加入查詢結果集OntoSet。

4.2 實現(xiàn)效果與分析

已構建的民航突發(fā)事件領域本體主要包含了與民航突發(fā)事件相關的應急預案、應急案例、應急救援處置方法等領域概念和實例,并對它們之間的各種語義關系進行了描述。圖3是已構建的民航突發(fā)事件領域本體的一部分。

圖3 領域本體中的數(shù)據(jù)屬性和對象屬性

圖3中,橢圓表示本體概念或實例,矩形表示屬性值,實線空箭頭表示KindOf分類關系,實線實箭頭表示InstanceOf分類關系,虛線空箭頭表示數(shù)據(jù)屬性非分類關系,虛線實箭頭表示對象屬性非分類關系,邊上的權值是該關系邊對應的關系權重。

對于參數(shù)α、β的取值,依據(jù)已構建的民航突發(fā)事件領域本體和基于對象屬性的相關度計算方法,首先進行了多組相關實驗。實驗中將α、β的初值都設為0.5,并以增值為0.5的方式對α、β的值進行遞增,計算不同的α、β值下本體概念、實例基于對象屬性的語義相關度。通過對所有相關度計算結果的分析和對比,最終確定α值為0.5、β值為1時,結果最符合實際情況。

為了驗證本文提出的方法的有效性,將傳統(tǒng)的基于數(shù)據(jù)屬性的相關度計算方法Tversky方法[3]和P.W方法[13]作為對比方法,展開了以下實驗。

實驗中,將數(shù)據(jù)屬性和對象屬性視為同等重要,因此參數(shù)?1、?2的取值分別為0.5、0.5。對于閾值λ的取值,需要考慮實際情況。如果λ值過大,會導致查詢結果集過小,影響語義查詢的查全率。如果λ 值過小,會將許多與查詢詞的語義相關度較小的本體概念和實例加入查詢結果集中,影響語義查詢的查準率。本文結合實際情況及需求,將閾值λ的取值設為0.38?;谝褬嫿ǖ拿窈酵话l(fā)事件領域本體,以“AF358號航班事故案例”為例,實驗結果的部分對比情況如表4所示。

表4 AF358航班事故案例相關度計算實驗結果對比

由于民航突發(fā)事件領域本體中,數(shù)據(jù)屬性是根據(jù)概念或實例所具有的特征進行定義的,因此同類概念、實例的數(shù)據(jù)屬性相關,不同類概念、實例的數(shù)據(jù)屬性完全不相關。同時,由于領域本體中對象屬性主要存在于不同類的概念、實例之間,因此通過對象屬性相關聯(lián)的概念或實例在數(shù)據(jù)屬性上的相關性非常小,所以上述實驗結果普遍偏小。

為驗證方法的有效性,共做了10組查詢對比實驗。對得到的實驗結果,使用信息檢索最常用的兩個基本評價指標—查全率Recall和查準率Precision進行評測。用N表示領域本體中所有相關概念和實例總數(shù),A表示檢索出的概念和實例總數(shù),NC表示檢索出的所有相關概念和實例總數(shù),相關計算公式如下:

(15)

(16)

將本文提出的語義相關度計算方法與對比方法的查全率Recall和查準率Precision進行了對比,對比結果如表5所示。

表5 平均查全率和查準率對比

實驗結果表明,Tversky方法通過將查詢詞與本體概念、實例的數(shù)據(jù)屬性值進行字符匹配來計算它們間的語義相關度。該方法不僅忽略了屬性值間的語義關系,同時也忽略了查詢詞與本體概念、實例間的對象屬性,因此查全率和查準率都較低。P.W方法基于多路徑長度計算查詢詞與本體概念、實例間的語義相關度,該方法忽略了它們在數(shù)據(jù)屬性上的語義相關問題,因此查全率和查準率也較低。本文提出的方法在數(shù)據(jù)屬性方面,既考慮了查詢詞與本體概念、實例在屬性類型上的語義相關性,又考慮了它們在屬性值上的語義相關性;在對象屬性方面,其解決了查詢詞與本體概念或實例存在多種對象屬性非分類關系時的語義相關度問題,在一定程度上提高了語義查詢的查全率和查準率。

5 結 語

本文面向已構建的民航突發(fā)事件領域本體,提出了一種基于非分類關系的語義相關度計算方法。該方法在數(shù)據(jù)屬性方面,提出了一種將數(shù)據(jù)屬性類型與屬性值相結合的語義相關度計算;該方法在對象屬性方面,解決了查詢詞與本體概念或實例存在多種對象屬性非分類關系時的語義相關度計算問題。實驗結果表明,該方法不僅有效提高了語義查詢的查全率和查準率,同時也為民航突發(fā)事件的應急決策與救援提供了輔助作用。但該方法仍存在不足,下一步的研究工作將針對查詢關鍵詞集與本體概念不匹配問題,進行相關概念推薦,進一步提高查詢效率。

[1] Studer R, Benjamins V R, Fensel D.Knowledge Engineering Principles and Methods[J].Data and Knowledge Engineering,1998,25(1-2):161-197.

[2] 王紅,肖志偉,李剪,等.基于民航機場應急資源語義檢索方法的研究[J].計算機應用與軟件,2014,31(1):73-76,153.

[3] Tversky A. Features of Similarity[J]. Psychological Review,1977,84(4):327-352.

[4] David Sánchez, Montserrat Batet, David Isern,et al. Ontology-based Semantic Similarity:A New Feature-based Approach[J].Expert Systems with Applications, 2012, 39(9):7718-7728.

[5] Amel Yessad, Catherine Faron-Zucker, Rose Dieng-Kuntz,et al. Ontology- based Semantic Relatedness for Detecting the Relevance of Learning Resources[J].Interactive Learning Environments, 2011,19(1):63-80.

[6] Cai Yingfang, Qiu Wanghua.Research on Retrieval of Multi-Attribute Instance Knowledge Based on Ontology[C]//Proceedings of International Conference on Uncertainty Reasoning and Knowledge Engineering, 2012:13-17.

[7] Huacheng Chen, Xuehui Du, Xingyuan Chen,et al.Query Expansion Model Based on Interest Ontology[C]//Proceedings of International Conference on Information Management, Innovation Management and Industrial Engineering, 2012:474-478.

[8] Neda Alipanah, Pallabi Parveen, Sheetal Menezes,et al.Ontology-driven Query Expansion Methods to Facilitate Federated Queries[C]//Proceedings of IEEE International Conference on Service-Oriented Computing and Applications, 2010:1-8.

[9] 王紅,高斯婷,潘振杰,等.基于NNV關聯(lián)規(guī)則的非分類關系提取方法及其應用研究[J].計算機應用研究, 2012,29(10):3665-3668.

[10] 王紅,楊璇,王靜,等.基于本體的民航應急決策知識表達與推理方法研究[J].計算機工程與科學, 2011, 33(4):129-133.

[11] 王旭陽,蕭波.基于概念關聯(lián)度的智能檢索研究[J].計算機工程與設計, 2013,34(4):1415-1419.

[12] 劉宏哲,須德.基于本體的語義相似度和相關度計算研究綜述[J].計算機科學, 2012,39(2):8-13.

[13] Paul Witherell, Sundar Krishnamurty, Ian Grosse,et al.A Meronomic Relatedness Measure for Domain Ontologies Using Concept Probability and Multiset Theory[C]//Proceedings of the 28th North American Fuzzy Information Processing Society Annual Conference, 2009:1-6.

SEMANTIC RELEVANCY CALCULATION METHOD FOR NON-CLASSIFICATION RELATIONSHIP OF DOMAIN ONTOLOGY

Wang Hong Fan Hongjie Sun Kang

(School of Computer Science and Technology, Civil Aviation University of China, Tianjin 300300, China)

Aiming at the problem of semantic query expansion in regard to non-classification relationships of civil aviation emergency domain ontology (CAEDO), we proposed a semantic relevancy calculation method for the non-classification relationships of domain ontology. In this method, on the aspect of data properties, we proposed a semantic relevancy calculation method which is based on the property type and property value; on the aspect of object properties, aiming at the problem that there are multiple object properties in query words and ontology concept or example, we proposed the object property-based semantic relevancy calculation method. Furthermore, in combination with the semantic query process of domain ontology in civil aviation emergency cases, we gave the analysis of the implementation effect of the method. The method not only effectively improves the precision and the recall of semantic query, it also provides better methods support for emergency decision-making in regard to civil aviation emergencies as well.

Civil aviation emergency Domain ontology Non-classification relationship Semantic relevancy

2015-05-31。國家自然科學基金委員會與中國民用航空總局聯(lián)合基金項目(61079007);國家自然科學青年基金項目(61201414)。王紅,教授,主研領域:本體技術,數(shù)據(jù)挖掘與智能信息處理。樊紅杰,碩士生。孫康,碩士生。

TP391

A

10.3969/j.issn.1000-386x.2016.11.004