王有遠(yuǎn) 趙 璐 張樂恩
1.南昌航空大學(xué)工業(yè)工程研究所,南昌,3300632.南京航空航天大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,南京,2111063.南昌航空大學(xué)航空制造工程學(xué)院,南昌,330063
基于情境約束的知識個性化推送
王有遠(yuǎn)1趙 璐2張樂恩3
1.南昌航空大學(xué)工業(yè)工程研究所,南昌,3300632.南京航空航天大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,南京,2111063.南昌航空大學(xué)航空制造工程學(xué)院,南昌,330063
對面向產(chǎn)品設(shè)計(jì)的情境信息進(jìn)行語義描述和分析,將情境概念之間的關(guān)聯(lián)信息作為限制性條件,提出了基于情境約束的知識聚類方法。采用貝葉斯理論對聚類知識進(jìn)行語義標(biāo)注,對標(biāo)注概念與需求概念的綜合語義相似度和相關(guān)度進(jìn)行計(jì)算,擴(kuò)展了檢索概念范圍。實(shí)驗(yàn)結(jié)果表明,該研究方法可有效提高知識查詢與推送的精確度和效率。
情境約束;約束聚類;貝葉斯理論;語義標(biāo)注;個性化推送
為了從海量的設(shè)計(jì)知識中快速、準(zhǔn)確地找到設(shè)計(jì)人員所需的知識資源,需要對不同的設(shè)計(jì)特征、用戶特征和資源特征挖掘設(shè)計(jì)場景中的情境信息,幫助設(shè)計(jì)人員精確定位滿足個性化需求的知識資源,提高知識推送的準(zhǔn)確率和設(shè)計(jì)人員對知識獲取的滿意度[1]。在產(chǎn)品設(shè)計(jì)的知識個性化推送(或推薦)服務(wù)中,必須考慮設(shè)計(jì)情境信息對知識選擇過程的影響,自動調(diào)整需求知識的分布,為設(shè)計(jì)人員提供個性化的服務(wù)[2]。
SEUNG等[3]提出一種基于多Agent的設(shè)計(jì)知識推送方法,以支持動態(tài)電子市場環(huán)境下的產(chǎn)品族設(shè)計(jì),它通過對用戶的偏好進(jìn)行學(xué)習(xí),將合適的產(chǎn)品設(shè)計(jì)知識推送給用戶;XU等[4]提出了一種基于協(xié)同意識捕捉的主動知識推送服務(wù)方法,提供滿足設(shè)計(jì)者知識需求的服務(wù),并協(xié)助產(chǎn)品概念設(shè)計(jì),構(gòu)建協(xié)同產(chǎn)品概念設(shè)計(jì)的有源知識服務(wù)框架;方輝等[5]構(gòu)建基于Web的制造信息主動推薦服務(wù)模型,提出了用戶興趣獲取、制造信息相似度和相關(guān)性判斷、豐富站點(diǎn)摘要等自動獲取方法。
但在產(chǎn)品的設(shè)計(jì)過程中,設(shè)計(jì)任務(wù)所處的設(shè)計(jì)環(huán)境、產(chǎn)品的設(shè)計(jì)特征、所擔(dān)任的角色、資源環(huán)境等情境信息的構(gòu)建是特定問題域個性化需求的驅(qū)動,同一個設(shè)計(jì)場景下,不同的設(shè)計(jì)任務(wù)在不同的問題觸發(fā)下所涉及的情境要素也不同,因此如何將特定問題域的情境要素轉(zhuǎn)換為個性化的需求驅(qū)動,是知識個性化推送的重要依據(jù)。
DEY[6]認(rèn)為情境(上下文信息)是描述某一個環(huán)境中實(shí)體特征的信息集合,包括主客觀環(huán)境中相關(guān)的任何對象。ADOMAVICIUS等[7]認(rèn)為情境信息有助于提高信息推送的精度。因此,將設(shè)計(jì)情境融入到個性化推送服務(wù)中,用來描述與設(shè)計(jì)任務(wù)相關(guān)的特征信息,區(qū)分不同的設(shè)計(jì)活動,對用戶的知識需求起到約束的作用,可以向用戶推送符合當(dāng)時情境環(huán)境下的知識,從而提高知識需求的敏感性和個性化推送的準(zhǔn)確性。HUANG等[8]利用粗糙集對情境進(jìn)行建模,并結(jié)合協(xié)同過濾方法進(jìn)行個性化推薦;吳楠等[9]提出了一種基于用戶情境聚類的個性化推薦算法;YAO等[10]通過用戶和項(xiàng)目之間上下文信息的相互作用,提出了一種基于多層背景圖的個性化推薦模型;CHENG等[11]提出一種基于內(nèi)容和知識的混合推薦方法。
以上研究主要針對基于內(nèi)容特征相似性過濾方法的個性化推送,以用戶偏好為知識個性化推送的依據(jù),將大量相關(guān)的知識資源與當(dāng)前用戶興趣進(jìn)行比較,通過相似性過濾方法,將語義相似的內(nèi)容直接推送給用戶,但用戶得到的相似知識數(shù)量仍然龐大,很難獲取到可以直接使用的知識,導(dǎo)致知識的使用效率低,從而影響了知識推送的準(zhǔn)確性。因此,除了要考慮用戶偏好外,還要對產(chǎn)品設(shè)計(jì)過程中參與的情境特征因素(產(chǎn)品設(shè)計(jì)特征、用戶、資源)進(jìn)行分析,并將其作為個性化需求的約束條件,過濾掉與需求無關(guān)的信息,幫助用戶實(shí)現(xiàn)資源的精確定位,這對提高智能化制造中的知識查詢、匹配以及個性化推送的準(zhǔn)確性和效率具有重要意義。
針對上述問題,本文對產(chǎn)品設(shè)計(jì)過程中的情境信息進(jìn)行分析與本體化描述,借助本體的語義推理能力,將情境信息轉(zhuǎn)化為語義信息,構(gòu)建知識資源與用戶需求知識之間的情境本體模型。以語義約束的形式給出基于語義關(guān)系的兩概念間共生關(guān)系的邏輯描述,并提出基于情境約束的知識聚類方法。在此基礎(chǔ)上提出基于貝葉斯理論的知識語義標(biāo)注方法,并建立知識個性化推送機(jī)制,通過對標(biāo)注概念與需求概念的綜合語義相似度和相關(guān)度計(jì)算,擴(kuò)展檢索概念范圍。
產(chǎn)品設(shè)計(jì)情境主要是指產(chǎn)品在設(shè)計(jì)過程中所涉及的設(shè)計(jì)內(nèi)容、方式、各個環(huán)節(jié)的控制對象等相關(guān)特征信息,以及不同崗位角色對問題域的認(rèn)識和理解、技術(shù)能力、設(shè)計(jì)約束等環(huán)境蘊(yùn)含的各類信息。產(chǎn)品設(shè)計(jì)情境為知識需求定義了一個特定的解釋空間,通過將動態(tài)的情境數(shù)據(jù)與設(shè)計(jì)人員的認(rèn)知綁定,為需求知識附加了特定情境下的個性化特征,使之不會被錯誤地理解。情境為任務(wù)需求提供了知識過濾和約束機(jī)制,不但能過濾掉與當(dāng)前設(shè)計(jì)任務(wù)無關(guān)的知識,而且能幫助設(shè)計(jì)人員精確定位滿足個性化需求的知識,從而在一定程度上提高了知識查詢、匹配的精確度和效率。
在知識個性化推送服務(wù)中,為了促進(jìn)情境信息與需求知識之間的推理,以及對設(shè)計(jì)人員的需求描述進(jìn)行補(bǔ)充說明,本文采用本體概念的形式化規(guī)范描述,對相關(guān)情境信息進(jìn)行語義描述并存儲,將情境信息作為有關(guān)概念間的關(guān)聯(lián),對已有的需求信息提供語義上的約束。
對于任意產(chǎn)品設(shè)計(jì)情境本體語義表達(dá)模型S={S1,S2,…,Sn},S的第i個情境屬性Si∈S,i=1,2,…,n。情境屬性Si包含一組產(chǎn)品屬性值{si1,si2,…,sik},則一個給定的產(chǎn)品設(shè)計(jì)情境S構(gòu)成了一個n維的情境值域空間。在實(shí)際產(chǎn)品設(shè)計(jì)情境中,Si={si1,si2,…,sik}描述了一個S的實(shí)例,sil∈Si(l=1,2,…,k)。
機(jī)械齒輪設(shè)計(jì)因素包含尺寸、材料、加工精度、最大轉(zhuǎn)速,對應(yīng)的實(shí)例S={(齒高6 mm,齒寬2 mm,模數(shù)8),碳素結(jié)構(gòu)鋼,齒輪精度為5級,5000 r/min}。為了準(zhǔn)確地描述當(dāng)前設(shè)計(jì)情境中對象與對象之間的關(guān)系,采用OWL語言對設(shè)計(jì)情境進(jìn)行分析與描述,如下所示(本文只對齒輪尺寸進(jìn)行描述):
〈owl:Class rdf:about="#產(chǎn)品規(guī)格"〉
〈rdfs:subClassOf rdf:resource="#齒輪設(shè)計(jì)"/〉
〈/owl:Class〉
〈owl:Class rdf:ID="齒輪尺寸"〉
〈rdfs:subClassOf rdf:resource="#產(chǎn)品規(guī)格"/〉
〈rdfs:subClassOf〉
〈owl:Restriction〉
〈owl:onProperty rdf:resource="#齒高"〉
〈owl:Cardinality
rdf:datatype="&xsd;nonNegativeInteger"〉6 mm
〈/owl:Cardinality〉
〈owl:onProperty rdf:resource="#齒寬"〉
〈owl:Cardinality
rdf:datatype="&xsd;nonNegativeInteger"〉2 mm
〈/owl:Cardinality〉
〈owl:onProperty rdf:resource="#模數(shù)"〉
〈owl:Cardinality
rdf:datatype="&xsd;nonNegativeInteger"〉8
〈/owl:Cardinality〉
〈/owl:Restriction〉
〈/rdfs:subClassOf〉
〈/owl:Class〉
參照以上設(shè)計(jì)情境模型的描述方法,對用戶情境特征模型、知識屬性特征模型進(jìn)行描述,用戶偏好、專業(yè)技能、角色等特征可表示為U={U1,U2, …,Um},領(lǐng)域知識可表示為K={K1,K2, …,Kp},其屬性特征具有本體概念樹的層次結(jié)構(gòu)性。
假定在給定問題域求解空間(三維空間)Ω中,當(dāng)前產(chǎn)品設(shè)計(jì)情境Sn、目標(biāo)用戶Um、知識Kp構(gòu)成了空間中的一個點(diǎn)(Sn,Um,Kp),知識資源評價函數(shù)f:Ω→Q表示由(u,s,k)到知識評價值(非負(fù)實(shí)數(shù))Qu,s,k的映射,Qu,s,k∈Q。Qu,s,k的具體定義如下:
(1)
根據(jù)知識資源評價函數(shù)f對知識進(jìn)行評價,可以獲取用戶需求相關(guān)的知識,即在知識評價空間Q中,可以將Qu,s,k最大化的知識資源推送給用戶。
產(chǎn)品設(shè)計(jì)過程中,情境約束將產(chǎn)品設(shè)計(jì)情境信息當(dāng)作一種語義擴(kuò)展,利用本體的語義推理能力,將情境信息轉(zhuǎn)換為與需求相對應(yīng)的語義約束條件。情境驅(qū)動的語義約束知識選擇過程就是從知識庫中挑選出具有直接關(guān)系的知識概念、情境概念、歷史信息等與設(shè)計(jì)人員請求相匹配的過程。情境信息可以對用戶表達(dá)的需求起到補(bǔ)充完整的作用,對已有的需求信息提出更加嚴(yán)格的限制與約束。
知識聚類是將知識集合劃分成不同的小類,同類知識的語義概念相似性較大,不同類之間的語義概念相似性較小。由此在情境約束的驅(qū)動下,通過采用情境概念之間的關(guān)聯(lián)來描述設(shè)計(jì)過程與概念之間的語義關(guān)系,可以有效提高知識獲取的準(zhǔn)確性,并為設(shè)計(jì)人員提供滿意度較高的個性化服務(wù)。設(shè)計(jì)情境約束的需求知識聚類如圖1所示。
圖1 知識聚類Fig.1 Knowledge cluster
設(shè)計(jì)情境約束主要是根據(jù)用戶對產(chǎn)品設(shè)計(jì)活動相關(guān)的特征信息,進(jìn)行獲取、歸類、表達(dá),區(qū)分不同設(shè)計(jì)活動的關(guān)鍵因素,以能提供適合當(dāng)前設(shè)計(jì)情境下目標(biāo)用戶潛在需求的知識資源。知識聚類過程中,使用“約束”的形式表達(dá)領(lǐng)域知識的概念與概念、概念與屬性之間的關(guān)系,可以有效度量兩個概念之間的關(guān)系。每一個約束都有一個懲罰值P,用戶可以根據(jù)設(shè)計(jì)情境的約束進(jìn)行調(diào)整,以提高知識聚類的準(zhǔn)確率。
通常情況下,若兩個概念之間存在語義相似或語義相關(guān),則認(rèn)為概念與概念之間存在共生關(guān)系。若一個概念是另一個概念的子類或?qū)嵗淖痈拍?,則認(rèn)為前者與后者存在支持與被支持的關(guān)系,即相關(guān)性較大。例如,目標(biāo)概念“渦輪葉輪減重結(jié)構(gòu)優(yōu)化”對應(yīng)的一個語義相似概念是“葉輪減重結(jié)構(gòu)模型”,相關(guān)概念“有限元分析”是減重結(jié)構(gòu)模型分析方法的一個實(shí)例方法,目標(biāo)概念“渦輪葉輪減重結(jié)構(gòu)優(yōu)化”與相關(guān)概念“有限元分析”之間的語義相似度較低,但相關(guān)度較高,則認(rèn)為概念“有限元分析”與概念“渦輪葉輪減重結(jié)構(gòu)優(yōu)化”之間存在支持與被支持的關(guān)系。基于語義關(guān)系的兩概念間共生關(guān)系的邏輯描述如下:
定義1 設(shè)CX、CY分別為概念cx、cy的描述集合。其中,概念間的邏輯推理算法可以用基于Tableaux的算法[12]進(jìn)行推理。
(1)若概念cx與cy語義相似,則{cx}={cy};反之,{cx}≠{cy}。
(2)若概念cx是cy的子類或?qū)嵗?,則cx∈cy。
(3)若概念c∈cx,{cx}={cy},則認(rèn)為概念c與cy之間存在支持與被支持關(guān)系,概念c與概念cy的相關(guān)性較高,即c∈({cx}={cy}),且c?cy。
(5)|CX∩CY|表示集合CX、CY共有相同或相似概念交集的概念個數(shù);|CX-CY|表示屬于集合CX而不屬于集合CY的概念個數(shù);|CY-CX|表示屬于集合CY而不屬于集合CX的概念個數(shù)。
(2)
聚類因子T滿足
(3)
α,β∈[0,1]且α+β=1
聚類過程中,只有當(dāng)聚類函數(shù)L的值大于懲罰值P時,相關(guān)知識才滿足聚類要求,并分類到與需求概念相關(guān)的聚類區(qū)域中,從而提高了知識管理的效率和質(zhì)量,為知識的再利用提供了有利的條件。
通過知識聚類獲取了需求知識的聚類區(qū)域,但每個聚類區(qū)域中的知識量仍然龐大,知識的使用效率低。為了解決這個問題,在聚類知識中計(jì)算出相應(yīng)概念在某一類知識下的概率,最后匹配出概率比較大的知識,為用戶提供Qu,s,k最大化的知識資源。
3.1 基于貝葉斯理論的知識標(biāo)注方法
知識語義標(biāo)注方法是從語義詞匯表中抽取標(biāo)注的概念集合[13],對知識資源K進(jìn)行描述,用C={c1,c2,…,cn|ci∩cj=?}來表示,其中,i,j=1,2,…,n。首先將聚類中的知識資源K劃分成m個小類K={k1,k2,…,km}。假設(shè)每一小類知識資源僅對應(yīng)一個聚類區(qū)域,那么知識k 對于概念c的類條件概率密度函數(shù)為fK(k/c),則根據(jù)貝葉斯理論計(jì)算出標(biāo)注概念ci的后驗(yàn)概率[14]:
p(ci/K)≈p(ci/k1,k2,…,km)=
(4)
其中,fK(·)p(·)為聚類知識資源K的邊緣概率密度函數(shù),常數(shù)。假設(shè)標(biāo)注概念是等概率事件,即p(c1)=p(c2)=…=p(cn),則當(dāng)fK(k1,k2,…,km/ci)最大時,可得到標(biāo)注概念ci后驗(yàn)概率p(ci/K)的最大值。
為了估計(jì)聚類知識資源K的條件密度函數(shù)fK(k1,k2,…,km/ci),假設(shè)聚類區(qū)域之間是相互獨(dú)立的,標(biāo)注概念的條件密度函數(shù)[14]fK等價于
(5)
根據(jù)式(4)、式(5)可以計(jì)算出語義概念c的后驗(yàn)概率p(c/K),并選擇后驗(yàn)概率p(c/K)較大的語義概念進(jìn)行標(biāo)注,這提高了知識標(biāo)注的準(zhǔn)確性和有效性,同時也可以有效地對聚類區(qū)域的知識資源進(jìn)行管理。
3.2 知識個性化推送機(jī)制
用戶的知識需求取決于其所要完成的設(shè)計(jì)任務(wù)和在此任務(wù)中擔(dān)當(dāng)?shù)慕巧?。因此,在面向產(chǎn)品設(shè)計(jì)的知識個性化推送服務(wù)中,設(shè)計(jì)情境的不同制約著概念屬性之間的關(guān)聯(lián),為語義概念間的匹配提供了補(bǔ)充和約束。
知識管理系統(tǒng)中,語義概念匹配是指用戶在分析設(shè)計(jì)情境的基礎(chǔ)上對需求知識進(jìn)行描述,在頭腦中形成概念,將形成的概念與聚類區(qū)域中的標(biāo)注概念進(jìn)行綜合語義相似度和語義相關(guān)度的計(jì)算,再將符合要求的標(biāo)注概念作為新的檢索概念加入檢索概念集合,最后映射出聚類知識資源中對應(yīng)的設(shè)計(jì)知識,提交系統(tǒng)實(shí)施推送。知識個性化推送機(jī)制如圖2所示。
令cs(c)表示與概念c語義相似的概念集合,ss(c)表示與概念c之間具有支持和被支持關(guān)系的相關(guān)概念集合,則綜合相似度和相關(guān)度可以得出語義概念的相關(guān)程度:
(6)
(7)
式中,γ為比重系數(shù);d(*)為距離函數(shù)。
圖2 知識個性化推送機(jī)制Fig.2 Knowledge personalized push mechanism
通過計(jì)算需求概念與標(biāo)注概念之間的綜合語義相似度和相關(guān)度,可以更準(zhǔn)確地反映出概念間的關(guān)聯(lián)關(guān)系,根據(jù)設(shè)定的擴(kuò)展閥值,篩選出符合要求的標(biāo)注概念,并把得到的計(jì)算結(jié)果作為相應(yīng)標(biāo)注概念的權(quán)重,存儲并生成新的檢索概念,擴(kuò)展到設(shè)計(jì)人員的初始檢索概念集合中。通過對語義概念的擴(kuò)展檢索,可以更準(zhǔn)確地反映出領(lǐng)域知識的關(guān)聯(lián)特點(diǎn)。擴(kuò)展的檢索概念是依據(jù)語義關(guān)系、邏輯關(guān)系等概念間的擴(kuò)展關(guān)系進(jìn)行抽取的相關(guān)概念。例如,本體層次結(jié)構(gòu)中的子節(jié)點(diǎn)概念與父節(jié)點(diǎn)概念的關(guān)系、概念間的兄弟關(guān)系以及平行關(guān)系等??傊?,兩個概念的相似度或相關(guān)度的值越大,其對應(yīng)知識語義關(guān)系或相關(guān)性越接近;反之,兩知識間的互相關(guān)聯(lián)度越低。
基于本體的概念綜合語義相似度和相關(guān)度計(jì)算流程如圖3所示。
圖3 概念間綜合語義相似度和相關(guān)度計(jì)算流程Fig.3 Comprehensive semantic similarity and correlation calculation process between concepts
本文以渦輪增壓器的空氣濾清器設(shè)計(jì)為例,采用Protégé本體建模工具,對產(chǎn)品設(shè)計(jì)情境、情境約束的語義概念以及概念之間的關(guān)系創(chuàng)建本體語義模型(圖4),準(zhǔn)確描述知識概念之間的語義關(guān)系。采用歐氏距離法對語義相似和語義相關(guān)的知識進(jìn)行約束聚類,通過貝葉斯理論對聚類知識進(jìn)行語義標(biāo)注,有效提高了知識資源管理的質(zhì)量??諝鉃V清器(部分)本體概念結(jié)構(gòu)模型及關(guān)系描述如圖5所示。
根據(jù)當(dāng)前用戶對空氣濾清器設(shè)計(jì)情境的描述以及任務(wù)需求,紙質(zhì)濾芯的空氣濾清器設(shè)計(jì)主要涉及發(fā)動機(jī)排量、額定轉(zhuǎn)速、濾紙面積、折數(shù)、濾芯外徑、折寬、折距,具體實(shí)例可描述為:(發(fā)動機(jī)排量0.15 L,額定轉(zhuǎn)速8000 r/min,實(shí)際所需濾紙面積1019 cm2,折數(shù)80,濾芯外徑D=142 mm,折寬b=14 mm,折距t=4.5 mm,每m3/h空氣量所需紙芯面積為40 cm2)對應(yīng)的OWL描述片段如下所示:
圖4 空氣濾清器相關(guān)情境本體(部分)Fig.4 Related situation ontology(part) of air filter
圖5 空氣濾清器本體概念結(jié)構(gòu)模型及關(guān)系描述(部分)Fig.5 Ontology concept structure model and the relationship description(part) of air filter
〈空氣濾清器設(shè)計(jì) rdf:ID="紙質(zhì)空濾器設(shè)計(jì)"〉
〈類型 rdf:datatye="http://www.w3.org/2001/XML Schema#string"〉紙質(zhì)〈/類型〉
〈/空氣濾清器設(shè)計(jì)〉
〈工作環(huán)境 rdf:ID="發(fā)動機(jī)參數(shù)"〉
〈排量 rdf:datatye="http://www.w3.org/2001/XML Schema#float"〉0.15 L〈/排量〉
〈額定轉(zhuǎn)速 rdf:datatye="http://www.w3.org/2001/XML Schema#int"〉8000 r/min〈/額定轉(zhuǎn)速〉
〈/工作環(huán)境〉
〈目標(biāo)〉
〈功能設(shè)計(jì) rdf:datatye="http://www.w3.org/2001/XML Schema#string"〉每m3/h空氣量需紙芯面積40 cm2〈/功能設(shè)計(jì)〉
〈/目標(biāo)〉
〈濾芯設(shè)計(jì) rdf:ID="濾芯設(shè)計(jì)參數(shù)"〉
〈濾紙面積 rdf:datatye="http://www.w3.org/2001/XML Schema#float"〉1019 cm2〈/濾紙面積〉
〈濾芯外徑 rdf:datatye="http://www.w3.org/2001/XML Schema#int"〉1142 mm〈/濾芯外徑〉
〈折數(shù) rdf:datatye="http://www.w3.org/2001/XML Schema#int"〉80〈/折數(shù)〉
〈折寬 rdf:datatye="http://www.w3.org/2001/XML Schema#int"〉14 mm〈/折寬〉
〈折距 rdf:datatye="http://www.w3.org/2001/XML Schema#float"〉4.5 mm〈/折距〉
〈/濾芯設(shè)計(jì)〉
…
在當(dāng)前設(shè)計(jì)情境下,確定目標(biāo)用戶需求的潛在知識資源,采用情境約束的形式對空氣濾清器設(shè)計(jì)知識的相關(guān)概念間關(guān)系進(jìn)行描述、分類和聚類。
表1 空氣濾清器設(shè)計(jì)(部分)相關(guān)知識之間的關(guān)聯(lián)關(guān)系
通過對約束聚類函數(shù)L進(jìn)行計(jì)算分析,得到相關(guān)知識與各約束聚類中心的相似度,并根據(jù)需求概念之間的關(guān)系,將11類候選知識劃分為實(shí)例、參數(shù)兩類。實(shí)例類為{#K1,#K2,#K3,#K4,#K10,#K11},設(shè)計(jì)參數(shù)類為{#K5,#K6,#K7,#K8,#K9}。得到候選知識之間的關(guān)聯(lián)關(guān)系:#K1sibling-of#K10,#K2similarity-of#K3,#K4similarity-of#K11,#K9part-of#K5,#K9part-of#K6,#K9part-of#K7,#K8attribute-of#K9,#K10similarity-of#K4,#K11instance-of#K8等。同時,設(shè)計(jì)人員可根據(jù)懲罰值P的取值進(jìn)行調(diào)整,對約束聚類函數(shù)L的取值范圍進(jìn)行限定,使聚類效果達(dá)到最優(yōu),本文取P=0.5。
利用貝葉斯理論對需求知識的聚類區(qū)域進(jìn)行標(biāo)注。由式(4)、式(5)得情境約束下聚類知識的標(biāo)注概念空間:#C={空氣濾清器,濾清效率,發(fā)動機(jī),減少油耗,降低進(jìn)氣噪聲,消聲作用,發(fā)動機(jī)與濾清器,濾芯,優(yōu)化分析,濾紙折距優(yōu)化,濾紙厚度優(yōu)化,濾紙面積優(yōu)化,濾清原理,濾紙分析,濾清性能,空濾裝置結(jié)構(gòu)}={#c1,#c2,…,#c16}。則需求概念與聚類區(qū)域標(biāo)注概念之間的關(guān)系,見表2。
通過對空氣濾清器相關(guān)設(shè)計(jì)知識中的標(biāo)注概念進(jìn)行查詢擴(kuò)展,并根據(jù)式(6)、式(7)計(jì)算出相關(guān)標(biāo)注概念與需求概念之間的綜合相似度和相關(guān)度,篩選出符合擴(kuò)展要求的標(biāo)注概念,進(jìn)行擴(kuò)展檢索,最后映射出與檢索概念相對應(yīng)的領(lǐng)域本體知識,如表3所示。
根據(jù)表3對綜合相似度和相關(guān)度的計(jì)算結(jié)果進(jìn)行整合倒置排序,按照S從大到小的排序結(jié)果為#K8、#K4、#K9、#K7、#K6、#K5、#K10、#K1、#K2、#K11、#K3。設(shè)計(jì)人員可以對綜合相似度和相關(guān)度的擴(kuò)展閾值進(jìn)行設(shè)定,進(jìn)一步縮小檢索范圍,提高檢索知識的關(guān)聯(lián)性和可用性。本文取擴(kuò)展閾值為0.7,若S<0.7,則認(rèn)為對應(yīng)的標(biāo)注概念與檢索概念關(guān)聯(lián)性不高,不符合要求,自動過濾;反之,則存儲,并作為擴(kuò)展的檢索概念加入到檢索概念集合中,以提高知識查找的準(zhǔn)確性。
表2 需求知識與標(biāo)注概念的關(guān)系
表3 標(biāo)注概念查詢綜合相似度和相關(guān)度
通過對檢索到的知識進(jìn)行識別和篩選,將符合要求的知識推送給設(shè)計(jì)人員,同時對已經(jīng)推送的知識或設(shè)計(jì)人員檢索過的知識標(biāo)明“已推”,對檢索到符合要求的新知識標(biāo)明“未推”。為下一次精確推送提供了前提條件,避免了知識重復(fù)推送,提高了個性化推送的準(zhǔn)確性和有效性。
利用貝葉斯理論對聚類知識進(jìn)行語義標(biāo)注,通過對標(biāo)注概念與需求概念的綜合語義相似度和相關(guān)度計(jì)算,擴(kuò)展檢索概念范圍,進(jìn)一步對設(shè)計(jì)需求的知識進(jìn)行過濾與精選,從而避免了傳統(tǒng)的設(shè)計(jì)知識推送中相似知識多,而可利用知識少的問題,在一定程度上提高了知識個性化推送的準(zhǔn)確性。
[1] 王立才, 孟祥武, 張玉潔. 上下文感知推薦系統(tǒng)[J].軟件學(xué)報, 2012,23(1):1-20.WANGLicai,MENGXiangwu,ZHANGYujie.Context-awareRecommenderSystems[J].JournalofSoftware, 2012,23(1):1-20.
[2]YINFengjing,ZHAOXiang,ZHAOXin.ImprovingAccuracyandScalabilityofPersonalRecommendationBasedonBipartiteNetworkProjection[J].MathematicalProblemsinEngineering,2014(9):1-11.
[3]SEUNGKM,TIMOTHYWS,SOUNDARRTK.AnAgent-basedRecommenderSystemforDevelopingCustomizedFamiliesofProducts[J].JournalofIntelligentManufacturing, 2009, 20(6): 649-659.
[4]XUYuanhao,YINGuofu,NIEYong,etal.ResearchonanActiveKnowledgePushServiceBasedonCollaborativeIntentCapture[J].JournalofNetworkandComputerApplications, 2013, 36(6):1418-1430.
[5] 方輝, 譚建榮, 譚穎, 等. 基于Web的制造信息主動推薦服務(wù)研究[J]. 計(jì)算機(jī)集成制造系統(tǒng), 2008, 14(11):2253-2260.FANGHui,TANJianrong,TANYing,etal.ManufacturingInformationActiveRecommendationBasedonWebServices[J].ComputerIntegratedManufacturingSystems, 2008, 14(11):2253-2260.
[6]DEYAK.ProvidingArchitecturalSupportforBuildingContext-awareApplications[D].Atlanta:GeorgiaInstituteofTechnology, 2000.
[7]ADOMAVICIUSG,TUZHILINA.Context-awareRecommenderSystems[M]//RecommenderSystemsHandbook.Berlin:Springer-Verlag, 2011:217-253
[8]HUANGZhengxing,LUXudong,DUANHuilong.Context-awareRecommendationUsingRoughSetModelandCollaborativeFiltering[J].ArtificialIntelligenceReview, 2011, 35(1):85-99.
[9] 吳楠, 秦鋒, 姜太平. 一種基于用戶情境聚類的個性化推薦算法[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2014, 24(10): 106-109, 114.WUNan,QINFeng,JIANGTaiping.APersonalizedRecommendationAlgorithmBasedonUserContextClustering[J].ComputerTechnologyandDevelopment, 2014, 24(10):106-109,114.
[10]YAOW,HEJ,HUANGG,etal.PersonalizedRecommendationonMulti-layerContextGraph[J].LectureNotesinComputerScience, 2013:135-148.
[11]CHENGST,CHOUCL,HORNGGJ.TheAdaptiveOntology-basedPersonalizedRecommenderSystem[J].WirelessPersonalCommunications, 2013, 72(4): 1801-1826.
[12]SCHWINDCB.ATableau-basedTheoremProverforaDecidableSubsetofDefaultLogic[C]//10thInternationalConferenceonAutomatedDeduction.Kaiserslautern, 1990:528-542.
[13]AMATOA,MARTINOBD,SCIALDONEM,etal.PersonalizedRecommendationofSemanticallyAnnotatedMediaContents[M]//StudiesinComputationalIntelligence.Berlin:Springer, 2014:261-270.
[14] 張?jiān)? 包俊杰, 況夯, 等.基于貝葉斯理論的圖像標(biāo)注和檢索[J]. 計(jì)算機(jī)科學(xué), 2008, 35(8):229-231.ZHANGYuanqing,BAOJunjie,KUANGHang,etal.ImageAnnotationandRetrievalBasedonBayesianTheory[J].ComputerScience, 2008, 35(8):229-231.
(編輯 張 洋)
Knowledge Personalized Push Based on Context Constraint
WANG Youyuan1ZHAO Lu2ZHANG Le’en3
1.Institute of Industrial Engineering,Nanchang Hangkong University,Nanchang,330063 2.College of Computer Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing,211106 3.School of Aeronautical Manufacturing Engineering,Nanchang Hangkong University,Nanchang,330063
Semantic description and analysis of context informations as restrictive condition between contextual concepts for product designs were presented, and a knowledge clustering method was proposed based on context constraints was proposed. Meanwhile, Bayesian theory was used to semantic annotation of clustering knowledges, and the semantic similarity and relevance of annotation concept and demand concept were calculated to expand the scopes of search. Experimental results show that the method may effectively improve accuracy and efficiency of knowledge query and push in the processes of product designs.
context constraint; constrained clustering; Bayesian theory; semantic annotation; personalized push
2016-06-06
國家科技支撐計(jì)劃資助項(xiàng)目(2013BAF02B01);江西省火炬計(jì)劃資助項(xiàng)目(20151BBE51064);江西省科技支撐計(jì)劃資助項(xiàng)目(20141BBE53005)
TP391
10.3969/j.issn.1004-132X.2017.15.008
王有遠(yuǎn),男,1965年生。南昌航空大學(xué)工業(yè)工程研究所教授。主要研究方向?yàn)橹圃鞓I(yè)信息化、智能制造、知識工程與知識管理。發(fā)表論文100余篇。E-mail:yywnc@sina.com。趙 璐,男,1990年生。南京航空航天大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院博士研究生。張樂恩,男,1990年生。南昌航空大學(xué)航空制造工程學(xué)院碩士研究生。