陸汝華,張家錄,鐘嘉鳴
1.湘南學(xué)院 軟件與通信工程學(xué)院,湖南 郴州 423000
2.湘南學(xué)院 數(shù)學(xué)與金融學(xué)院,湖南 郴州 423000
3.湘南學(xué)院 經(jīng)濟(jì)與管理學(xué)院,湖南 郴州 423000
軟集理論是Molodtsov教授建立的一種描述和處理不確定性的數(shù)學(xué)理論。軟集是由參數(shù)集及其到論域的冪集上的一個(gè)集值映射構(gòu)成的二元組,或者說(shuō)軟集就是論域上由某些參數(shù)組織起來(lái)的一些子集構(gòu)成的整體。軟集中每個(gè)參數(shù)對(duì)應(yīng)的子集稱為近似集,軟集理論中對(duì)近似集不做任何限定,近似集可以是空集,而且不同參數(shù)對(duì)應(yīng)的近似集的交集可能非空。這使得軟集概念涵蓋的范圍非常廣泛,且具有靈活多變、適于應(yīng)用的特點(diǎn)[1-2]?;谲浖臎Q策研究吸引了國(guó)內(nèi)外眾多學(xué)者的注意,軟集理論研究也得到快速發(fā)展,軟集理論在不確定決策方面的應(yīng)用也是其最為活躍的研究方向之一。如,Maji教授等人使用軟集描述各個(gè)對(duì)象關(guān)于決策屬性的滿足情況,通過(guò)軟集計(jì)算來(lái)決定決策對(duì)象的選擇值,以描述對(duì)象的優(yōu)劣程度,并基于選擇值的大小確定最優(yōu)決策對(duì)象或方案[3-5]。Roy和Maji教授等人研究了模糊軟集,給出了一種通過(guò)模糊選擇值排序的決策方法[6-7]。馮等人給出了軟集、粗集和模糊集進(jìn)行比較,結(jié)合定義軟粗集、粗軟集和模糊粗軟集等的相關(guān)概念,指出粗集是軟集的一種特殊情況[8-9],并給出軟集及模糊軟集等在決策、屬性約簡(jiǎn)等方面的應(yīng)用[10-11]。到目前為止,軟集理論已經(jīng)在分類、預(yù)測(cè)和模擬等方面得到了一些成功的應(yīng)用[12-14],但軟集理論在諸如聚類分析、關(guān)聯(lián)關(guān)系分析、模式識(shí)別和近似推理等方面的應(yīng)用研究,還少有相關(guān)文獻(xiàn)報(bào)道。
商務(wù)推薦是不確定性決策理論應(yīng)用的方向之一。目前主流的推薦方法包括基于內(nèi)容的推薦、協(xié)同過(guò)濾推薦、基于知識(shí)推薦和組合推薦四種。各種推薦方法研究的重點(diǎn)主要集中在對(duì)象之間的相似性,協(xié)同過(guò)濾推薦考慮的是用戶之間的相似性,內(nèi)容推薦中關(guān)注的是所推薦商品之間的相似性。目前各種推薦方法常用的相似性計(jì)算方法有向量空間相似度、Pearson相關(guān)、Spearman相關(guān)、夾角余弦方法等[14-16]。從信息論的角度看,A與B之間的相似度一方面與它們的共性相關(guān),共性越多,相似度越高,當(dāng)A與B完全相同時(shí),相似度達(dá)到最大值;另一方面與它們的區(qū)別相關(guān),區(qū)別越大,相似度越低[17]。電子智能推薦是智能推薦的主要應(yīng)用方向之一,它是“利用電子商務(wù)平臺(tái)向用戶提供商品信息和建議,幫助用戶決定應(yīng)該購(gòu)買什么產(chǎn)品,模擬銷售人員幫助客戶完成購(gòu)買過(guò)程”。電子商務(wù)推薦在網(wǎng)絡(luò)經(jīng)濟(jì)環(huán)境下不僅可以將電子商務(wù)系統(tǒng)的瀏覽者轉(zhuǎn)變?yōu)橘?gòu)買者,促進(jìn)產(chǎn)品交叉銷售能力,還可以提高客戶的忠誠(chéng)度,在市場(chǎng)競(jìng)爭(zhēng)日趨激烈的今天顯得尤為重要[18-19]。電子商務(wù)推薦功能實(shí)現(xiàn)的好壞主要決定于其采用的推薦技術(shù),已有推薦算法的相似性計(jì)算方法在遇到稀疏數(shù)據(jù)時(shí)有其明顯的不足,而數(shù)據(jù)缺失、數(shù)據(jù)稀疏又是電子商務(wù)銷售數(shù)據(jù)的主要特征之一。軟集中對(duì)每個(gè)參數(shù)所對(duì)應(yīng)的近似集(論域U的子集)不做任何的限制,這使得軟集在處理稀疏數(shù)據(jù)時(shí)有著明顯的優(yōu)勢(shì)。
本文將命題邏輯思想應(yīng)用到軟集數(shù)據(jù)分析中,給出一種基于軟集和邏輯公式的信息系統(tǒng)屬性分析的新方法。首先,建立一種基于軟集的命題邏輯推理語(yǔ)言,在這種形式推理語(yǔ)言中,原子公式是軟集中的參數(shù)α,參數(shù)α的函數(shù)值F(α()是論域U的子集)是原子公式α的賦值集,軟決策規(guī)則是決策軟集上的由原子公式組成的蘊(yùn)含邏輯公式。其次,引進(jìn)真度、條件真度、絕對(duì)真度等概念從充分性、必要性、合理性等不同方面來(lái)評(píng)價(jià)軟決策規(guī)則,將決策系統(tǒng)轉(zhuǎn)化為決策軟集來(lái)表示,提出不完備決策信息系統(tǒng)的軟決策規(guī)則提取算法。最后,將基于命題邏輯和軟集的數(shù)據(jù)分析方法應(yīng)用于電子智能推薦,給出基于軟屬性關(guān)聯(lián)關(guān)系分析的智能推薦算法,并通過(guò)實(shí)際例子和數(shù)值實(shí)驗(yàn)驗(yàn)證本文提出的算法是有效的。
論域U上的一個(gè)軟集(簡(jiǎn)記為FS)是一個(gè)二元組S=(F,A),其中,E是參數(shù)集合,A?E,P(U)是U的冪集,F(xiàn):A→P(U)是集值映射,即對(duì)e∈A,F(xiàn)(e)?U。如果U上有概率分布P,則稱S=(F,A)為概率軟集。顯然,一般的軟集在等概率分布P({u})=1|U|下可以看作為概率軟集。論域U和參數(shù)集E上的全體軟集記為PE(U)。設(shè)(F,A)和(G,B)是論域U和參數(shù)集E上的兩個(gè)軟集,如果A?B,且 ?a∈A,F(xiàn)(a)?G(a),則稱(F,A)是(G,B)的軟子集,記為(F,A)?(G,B)。兩個(gè)軟集(F,A)和(G,B)的并定義為(H,C)=(F,A)?(G,B),其中C=A?B,當(dāng)a=A-B時(shí),H(c)=F(c);當(dāng) a=B-A時(shí) ,H(c)=G(c);當(dāng)a=A?B時(shí),H(c)=F(c)?G(c)。同樣,兩個(gè)軟集(F,A)和(G,B)的交定義為(H,C)(=F,A)?(G,B),其中C=A?B,對(duì)a=C,H(c)=F(c)?G(c)[2]。
信息系統(tǒng)(也稱為數(shù)據(jù)庫(kù)系統(tǒng))是一個(gè)三元組I=(U,A,V,)其中U是對(duì)象集,A是屬性集,V是屬性值集合,V(a)是屬性a的值域,每個(gè)屬性a∈A都相應(yīng)地確定一個(gè)函數(shù)a:U→V(a,)它指定了U中每個(gè)對(duì)象u的屬性值。如果信息系統(tǒng)的屬性集A被劃分為C和D兩部分,則稱I=(U,C?D,V)為決策信息系統(tǒng),并稱C中的元素為條件屬性,D中的元素為決策屬性[17]。
以上介紹的軟集和信息系統(tǒng)這兩個(gè)概念之間有著密切的聯(lián)系。首先,論域U上的一個(gè)軟集S=(F,A)可以通過(guò)一種自然的方式誘導(dǎo)出一個(gè)信息系統(tǒng)IS=(U,A,{0,1},)對(duì)每一個(gè)a∈A,如果u∈F(a),則a(u)=1,否則a(u)=0其次,設(shè)I=(U,A,V)是信息系統(tǒng),則每一個(gè)a∈A都可以誘導(dǎo)出一個(gè)軟集Sa=(Fa,Ba),其中Ba={a}×V(a),對(duì)任何(a,t)∈Ba,F(xiàn)a(a,t)={u∈U:a(u)=t};而信息系統(tǒng)I誘導(dǎo)出一個(gè)軟集 S=(F,B),其 中對(duì) (a,v)∈B,F(xiàn)(a,v)={u∈U:a(u)=v}。顯然,{Fa(a,t):(a,t)∈Ba}構(gòu)成論域U的一個(gè)劃分,而{F(a,v):(a,v)∈B}構(gòu)成論域U的一個(gè)覆蓋[20]。
以下給出本文要用到的基于軟集的軟邏輯公式及其賦值等概念。
首先,回顧一下命題邏輯公式及其賦值的概念。設(shè)Q={q1,q2,…}為原子公式集,F(xiàn)(Q)是由Q生成的(?,∧,→ 型)自由代數(shù),稱F(Q)中的元素為邏輯公式,簡(jiǎn)稱為公式。設(shè)B={0,1}是標(biāo)準(zhǔn)布爾代數(shù),則B={0,1}亦是(?,∧,→ 型)代數(shù)。自由代數(shù)(F(Q);?,∧,→)和B={0,1}之間的(?,∧,→ )型同態(tài)v:F(S)→{0,1}稱為F(Q)的邏輯公式的賦值,對(duì)α∈F(Q),v(α)稱為公式α的值[21-22]。
設(shè)S=(F,A)是論域U和參數(shù)集E上的軟集,稱α∈A為基于軟集S的軟原子公式(為了與軟集參數(shù)和信息系統(tǒng)屬性術(shù)語(yǔ)相區(qū)別,以下用小寫希臘字母作為軟原子命題的標(biāo)識(shí)符)。由全部原子公式生成的(?,∧,→ )型自由代數(shù)記為F(S),F(xiàn)(S)中的元素稱為基于軟集S的軟邏輯公式(為了與數(shù)理邏輯中邏輯公式概念相區(qū)別,本文稱之為軟邏輯公式),也就是說(shuō),F(xiàn)(S)是由A中的元素經(jīng)過(guò)下列步驟所生成:(1)A?F(S);(2)若φ∈F(S),則?φ∈F(S);(3)若φ,ψ∈F(S),則φ∧ψ,φ→ψ∈F(S);(4)λ∈F(S)當(dāng)且僅當(dāng)λ可經(jīng)過(guò)以上3步有限次所產(chǎn)生[20]。
對(duì)軟集(F,A),如果A被劃分為C和D(即A=C? D,C ?D=?),此時(shí)也記軟集(F,A)為(F,C? D),并稱之為決策軟集。顯然,決策軟集SC=(F,C)和SD=(F,D)都是(F,C?D)的軟子集,分別稱之為條件軟子集和決策軟子集,并稱相應(yīng)的軟邏輯公式FA(SC)和F(SD)為條件屬性公式和決策屬性公式[20]。
設(shè)(F,A)是論域U上的軟集,由于F(S)是由原子公式集A生成的(?,∧,→型)自由代數(shù),因此,對(duì)每一個(gè)u∈U,映射可惟一決定公式集F(S)上的一個(gè)賦值vu:F(S)→{0,1},這里 χF(α)(u)表示集合F(α )的特征函數(shù)。設(shè)φ∈F(S),如果vu(φ)=1,借用數(shù)理邏輯中的術(shù)語(yǔ),稱vu為公式φ的模型(也稱u支持公式φ),記為,并稱為公式φ∈F(S)的軟集合語(yǔ)義解釋。顯然,對(duì)每一個(gè)原子公式α∈A,有,當(dāng)且僅當(dāng)如果,則稱φ為軟重言式;如果,則稱φ為軟矛盾式。設(shè)φ,ψ∈F(S),如果對(duì)全部的賦值vu,有vu(φ)=vu(ψ),則稱φ與ψ軟邏輯等價(jià)。
關(guān)于軟邏輯公式的軟集合語(yǔ)義解釋,有下面的結(jié)論。
命題1[20]設(shè)(F,A是)論域U上的軟集,φ,ψ∈F(S),則:
從形式上看,命題1與粗糙集理論中的決策邏輯中公式解釋相似,但其實(shí)它們定義的途徑是不一樣的,軟集合(F,A)上的任何軟邏輯公式的語(yǔ)義解釋
本文引入的軟邏輯公式及其語(yǔ)義與數(shù)理邏輯中的相應(yīng)概念既有相似也有不同,相似之處是所討論的公式都是由原子公式自由生成且都是用標(biāo)識(shí)符表示;不同之處是數(shù)理邏輯中用于表示原子命題的標(biāo)識(shí)符沒(méi)有明確的實(shí)際意義,而軟邏輯原子公式是軟集中的參數(shù),基于一個(gè)給定軟集的軟邏輯原子公式是有其實(shí)際含義的。另外,本文構(gòu)造的軟邏輯公式的軟集合語(yǔ)義也可認(rèn)為是文獻(xiàn)[22-23]命題邏輯概率語(yǔ)義的具體化。為了在軟邏輯語(yǔ)義意義下找到一種提取有用軟決策規(guī)則的有效方法,在下一章先應(yīng)用文獻(xiàn)[22-23]的部分真度概念來(lái)刻畫一個(gè)給定的軟邏輯公式的正確程度,然后引進(jìn)其他一些描述軟決策規(guī)則的度量指標(biāo)。
定義1設(shè)S=(F,A)是有限論域U上的概率軟集,P是U上的正規(guī)概率分布,即?u∈U,P({u}),>0,對(duì)于給定的邏輯公式φ,稱
為軟邏輯公式φ基于軟集S的基本軟真度(basic soft truth degree,BSTD)。
注意到vu(φ)=1意味著u支持φ,因此τ(?)可以被看作一種“投票模型”。由于在實(shí)際的數(shù)據(jù)處理中軟集通常是用表格表示的,這時(shí)對(duì)象u的概率P({u})其實(shí)就是與u有相同參數(shù)及參數(shù)值的對(duì)象數(shù)目與全體對(duì)象數(shù)的比值,而公式φ的軟真度其實(shí)就是支持φ的對(duì)象的概率和。一個(gè)軟邏輯公式的可靠性通過(guò)軟真度被程度化并且這種程度化是由支撐軟邏輯公式的基礎(chǔ)軟集所確定。
命題2(1)0≤τ(φ)≤1;
(3)若φ與ψ軟邏輯等價(jià),則τ(φ)=τ(ψ);
(4)τ(?φ)=1-τ(φ);
(5)τ(φ∨ψ)=τ(φ)+τ(ψ)-τ(φ∧ψ)。
證明(1)~(3)的證明是容易的,下證(4)和(5)。
設(shè)(F,C?D)為決策軟集,稱形如φ→ψ的邏輯公式為軟決策規(guī)則,其中φ∈F(SC),ψ∈F(SD)。當(dāng)φ、ψ分別只是C、D中的原子公式時(shí),稱φ→ψ為基本軟決策規(guī)則;如果φ、ψ分別包含C、D的全部原子公式,則稱φ→ψ為典型軟決策規(guī)則。當(dāng)φ→ψ是軟重言式時(shí),也記φ→ψ為φ?ψ。顯然,φ?ψ當(dāng)且僅當(dāng)。因此,當(dāng)時(shí),總有φ?ψ,這在邏輯上是有效的,但從實(shí)際推理應(yīng)用的角度來(lái)看卻不是合法的。在屬性關(guān)聯(lián)關(guān)系分析中,既要關(guān)心所提取軟決策規(guī)則的邏輯有效性,同時(shí)還需關(guān)心軟決策規(guī)則實(shí)際應(yīng)用中的合法性?;谶@個(gè)原因,以下引進(jìn)一些軟真度來(lái)刻畫軟決策規(guī)則的合法性和可行性。
定義2設(shè)(F,C?D)是有限論域U上的概率決策軟集,P是U上的正規(guī)概率分布。
(1)當(dāng)τ(φ)≠0時(shí),定義軟決策規(guī)則φ→ψ基于軟集S的條件軟真度(conditional soft truth degree,CSTD)為:
(2)定義軟決策規(guī)則φ→ψ基于軟集S的絕對(duì)軟真度(absolute soft truth degree,ASTD)為:
通常也稱ζ(φ→ψ)為軟決策規(guī)則φ→ψ的絕對(duì)充分軟真度(absolute sufficient soft degree,ASSD),而稱軟邏輯公式ψ→φ的ζ(ψ→φ)為軟決策規(guī)則φ→ψ的絕對(duì)必要軟真度(absolutenecessarysoftdegree,ASND)。當(dāng)前件φ的軟真度τ(φ)≠0時(shí),軟決策規(guī)則φ→ψ的條件軟真度γ(φ→ψ)可以被理解為在給定前件φ的條件下后件ψ為真的條件概率,它表示軟決策規(guī)則φ→ψ的強(qiáng)度,描述了規(guī)則的置信程度。軟決策規(guī)則φ→ψ的絕對(duì)軟真度ζ(φ→ψ)由兩部分組成,它們分別從兩個(gè)不同方面對(duì)軟決策規(guī)則進(jìn)行刻畫。從關(guān)聯(lián)規(guī)則提取的角度看,前一部分τ(φ→ψ)關(guān)注于所收集的數(shù)據(jù)對(duì)軟決策規(guī)則的支持強(qiáng)度,后一部分τ(φ)關(guān)注于所收集的數(shù)據(jù)對(duì)軟決策規(guī)則前件的支持強(qiáng)度。從程度化邏輯語(yǔ)義、近似推理的角度看,τ(φ→ψ)著重考慮軟決策規(guī)則的有效程度,它描述的是軟決策規(guī)則的有效性,τ(φ)著重考慮軟決策規(guī)則的合法程度,它描述的是軟決策規(guī)則的合法性。因此,絕對(duì)軟真度ζ(φ→ψ)從整體上刻畫了軟決策規(guī)則φ→ψ的有效性和合法性,這正符合軟決策規(guī)則在實(shí)際應(yīng)用中既需要考慮它的有效性,還要關(guān)注其合法性的需要。值得指出的是,利用絕對(duì)軟真度可以排除那些偽真的軟決策規(guī)則。如,對(duì)于一個(gè)軟決策規(guī)則φ→ψ,前件φ的基本軟真度τ(φ)=0,即使有τ(φ→ψ)=1,這種偽真的軟決策規(guī)則在應(yīng)用中其實(shí)是沒(méi)有意義的,而絕對(duì)軟真度ζ(φ→ψ)=0則剛好可以刻畫這種應(yīng)用中的實(shí)際情況。
命題3設(shè)(F,C?D)是有限論域U上概率決策軟集,φ→ψ是軟決策規(guī)則,則下列條件等價(jià):
(1)φ→ψ是軟重言式;
(2)τ(φ→ψ)=1;
(3)ζ(φ→ψ)=τ(φ);
(4)τ(φ)=0或γ(φ→ψ)=1。
證明(1)?(2)設(shè)φ→ψ是軟重言式,則。由命題1(4),有:
(2)? (3)是顯然的。
(3)? (4)由ζ(φ→ψ)=τ(φ),知τ(φ→ψ)=1。從而由命題2(2),有此時(shí)當(dāng)然有從而φ→ψ是軟重言式。若γ(φ→ψ)=1,則τ(φ∧ψ)=τ(φ。)由P是U上正規(guī)概率分布和有,故有,于是,從而
Table 1 Probabilitydecisionsoftset(F,C?D)表1 概率決策軟集(F,C?D)
從而φ→ψ是軟重言式。
例1一個(gè)概率決策軟集(F,C?D)如表1。其中,U={u1,u2,u3,u4},U上的正規(guī)概率分布為:P({u1})= 1 3 ,P({u2})=1 3,P({u3})=1 6,P({u4})=1 6,條件參數(shù)集C={e1,e2,e3},參數(shù)的含義為 e1=“頭痛”,e2=“肌肉痛”,e3=“發(fā)燒”,決策參數(shù)集D=syggg00,參數(shù)的含義為d=“流感”。
各軟決策規(guī)則BSTD為:
各軟決策規(guī)則CSTD為:
各軟決策規(guī)則ASTD為:
注1(1)一個(gè)軟決策規(guī)則的三個(gè)真度值從三個(gè)不同角度描述了軟決策規(guī)則的數(shù)值特性。一般來(lái)說(shuō),基本軟真度關(guān)注的是軟決策規(guī)則的有效性;條件軟真度強(qiáng)調(diào)條件屬性與決策屬性之間的蘊(yùn)含關(guān)系的確定性;絕對(duì)軟真度同時(shí)考慮了軟決策規(guī)則的合法性和條件屬性對(duì)軟決策規(guī)則的支持強(qiáng)度。
(2)從例1也可以看到,雖然軟決策規(guī)則e2→d的有效性和確定性都很高(強(qiáng)度為1),軟決策規(guī)則e2→d中的條件屬性e2對(duì)軟決策規(guī)則的支持強(qiáng)度很低(強(qiáng)度為1 6)。直觀地說(shuō),可以理解為:由于u2也滿足e1和e3,從而支持軟決策規(guī)則e2→d的證據(jù)u2實(shí)際上可能不起作用。換句話說(shuō),u2的“流感”與“頭痛”或“發(fā)燒”有關(guān),而不是他的“肌肉痛”。
(3)根據(jù)數(shù)理邏輯的MP規(guī)則,當(dāng)然有φ∧(φ→ψ)?ψ。當(dāng)φ→ψ和φ是軟重言式時(shí),有τ(φ→ψ)=1和τ(φ)=1,從而ζ(φ→ψ)=。1因此,從某種意義上說(shuō),絕對(duì)軟真度是一個(gè)由軟決策規(guī)則φ→ψ和其前件φ的基本軟真度來(lái)共同刻畫后件ψ的真度概念。
定義3設(shè)S=(F,A)是有限論域U上的概率軟集,對(duì)于給定的邏輯公式 φ、ψ,稱 η(φ,ψ)=τ((φ→ψ)∧(ψ → φ))為邏輯公式φ、ψ的軟相似度。當(dāng)η(φ,ψ)=1時(shí),稱軟邏輯公式φ與ψ是軟相似的。
命題4設(shè)φ,ψ∈F(S),則:
(1)η (φ,ψ )=η (ψ,φ );
(2)若φ與ψ邏輯等價(jià),則φ與ψ是軟相似的。
命題4的證明是顯然的。
命題5設(shè)S=(F,A)是有限論域U上的概率軟集,φ,ψ,ζ∈ F(S),記 ρ(φ,ψ )=1-η (φ,ψ ),則:
(1)ρ(φ,φ )=0
(2)ρ(φ,ζ)≤ρ(φ,ψ)+ρ(ψ,ζ)
因此,ρ是F(S)上的偽距離,稱之為軟邏輯距離,并稱(F(S),ρ)為軟邏輯距離空間。
證明(1)是顯然的。下面證明(2)。因τ(φ)=可表示為所以:
又由于:
故得:因此,有:
于是:
因此:
對(duì)于一個(gè)給定的信息系統(tǒng),分析屬性之間的關(guān)聯(lián)關(guān)系,尤其是在決策信息系統(tǒng)中,分析條件屬性值和決策屬性值之間的因果關(guān)系是系統(tǒng)分析的一個(gè)重要方面。從形式邏輯上看,一個(gè)軟決策規(guī)則就是一個(gè)含有蘊(yùn)含聯(lián)結(jié)詞的軟邏輯公式,本章給出一個(gè)基于軟邏輯的決策分析方法。
算法1基于軟邏輯的典型軟決策規(guī)則軟真度分析算法(soft truth analysis algorithm,STAA)
輸入:決策信息系統(tǒng)(U,C? D,V),U上的正規(guī)概率分布P。
輸出:典型軟決策規(guī)則及其真度。
步驟1輸入條件屬性C={a1,a2,…,al},決策屬性D=syggg00。
步驟2構(gòu)造軟集Sai(i=1,2,…,l)和Sb。
步驟3計(jì)算軟集Sai(i=1,2,…,l)和Sb的并決策信息系統(tǒng)(U,C ? D,V)被轉(zhuǎn)化為U上的決策軟集S=(F,CS?DS),條件參數(shù)集為CS={(ai,ri):i=1,2,…,l,ri∈Vai},決策參數(shù)集為 DS={(d,t):t∈ Vb}。
步驟4對(duì)每個(gè)ri∈Vai(i=1,2,…,l)和t∈ Vb,計(jì)算軟決策規(guī)則(a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t)的BSTDτ((a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t))。
步驟 5對(duì)每個(gè)ri∈Vai(i=1,2,…,l)和t∈Vb,計(jì)算軟決策規(guī)則 (a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t)的CSTDγ((a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t))。
步驟 6對(duì)每個(gè)ri∈Vai(i=1,2,…,l)和t∈Vb,計(jì)算軟決策規(guī)則(a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t)的 ASTD ζ((a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t))。
步驟 7計(jì)算 (b,t)→(a1,r1)∧(a2,r2)∧…∧(al,rl)的ASTD得到軟決策規(guī)則(a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t)的ASND。
例2關(guān)于病人決策信息系統(tǒng)的軟決策規(guī)則分析,一個(gè)病人決策信息系統(tǒng)如表2。
Table 2 Patientdecision-makinginformationsystem表2 某些病人決策信息系統(tǒng)
為了方便描述,分別將上述屬性及屬性值符號(hào)化,其中a=“頭痛”,b=“肌肉痛”,c=“體溫”,d=“流感”。
Table 3 Reduced and symbolized decision soft set表3 約簡(jiǎn)和符號(hào)化后的決策軟集
a=“頭痛”的兩個(gè)屬性值是、否分別用a1、a2表示;b=“肌肉痛”的兩個(gè)屬性值是、否分別用b1、b2表示;c=“體溫”的三個(gè)屬性值很高、高、正常分別用c1、c2、c3表示;d=“流感”的兩個(gè)屬性值是、否分別用d1、d2表示。利用粗糙集理論對(duì)信息系統(tǒng)進(jìn)行屬性約簡(jiǎn),得到最小屬性約簡(jiǎn)集為{頭痛(a),體溫(c)}。將約簡(jiǎn)和符號(hào)化后的屬性表轉(zhuǎn)化為軟決策集如表3。
Table 4 Soft truth of typical soft decision rules表4 典型軟決策規(guī)則的軟真度分析
由條件和決策原子公式可以組成12條典型軟決策規(guī)則,在不設(shè)定閾值情況下,BSTD大于0的典型軟決策規(guī)則共有7條,這些典型軟決策規(guī)則的軟真度分析如表4。
從表4的計(jì)算結(jié)果,可以得到關(guān)于流感病人的更多信息。比如,可以說(shuō)“頭痛且體溫高比頭不痛且體溫很高的人更可能患有流感”,因?yàn)檐洓Q策規(guī)則的CSTD表明:
Fig.1 Truth comparison between soft decision rule 1 and 2圖1 軟決策規(guī)則1和2的真度比較
從數(shù)據(jù)分析的角度看,上述結(jié)果意味著大約有100%的頭痛且體溫高的人患有流感,而只有50%的頭不痛且體溫很高的人患有流感。此外,結(jié)論“頭痛且體溫高比頭不痛且體溫很高的人更可能患有流感”可以通過(guò)ASSD得到進(jìn)一步的證實(shí),因?yàn)椋?/p>
以上的分析結(jié)果可通過(guò)圖1進(jìn)一步說(shuō)明,在圖中,軟決策規(guī)則1和2分別表示(a,a1)∧(c,c2)→(d,d1),(a,a2)∧(c,c1) →(d,d1)。
本章在以上分析基礎(chǔ)上,提出一個(gè)基于軟決策分析的智能推薦方法并給出實(shí)例分析。為了表述的方便,以下通過(guò)電子商務(wù)推薦對(duì)該方法進(jìn)行敘述,該推薦方法完全可以類似地應(yīng)用于智慧旅游等其他智能推薦場(chǎng)合。該推薦方法是在已有用戶購(gòu)買電商產(chǎn)品信息的基礎(chǔ)上,給那些有潛在購(gòu)買意向的用戶推薦電商產(chǎn)品,推薦的依據(jù)是用戶有興趣的電商產(chǎn)品信息,推薦的基本思想是認(rèn)為對(duì)一些電商產(chǎn)品具有相同興趣的用戶對(duì)另一電商產(chǎn)品也具有相同的興趣。推薦過(guò)程如下:(1)將用戶已購(gòu)買或已評(píng)價(jià)的電商產(chǎn)品作為條件屬性,待推薦電商產(chǎn)品作為決策屬性,構(gòu)造決策信息系統(tǒng)。(2)將決策信息系統(tǒng)轉(zhuǎn)化為決策軟集。(3)將同時(shí)包含有條件屬性和決策屬性的對(duì)象(用戶)作為典型軟決策規(guī)則挖掘的基礎(chǔ)集(稱之為訓(xùn)練集),依據(jù)訓(xùn)練集挖掘出全部典型軟決策規(guī)則。(4)將只包含有條件屬性而不包含決策屬性的對(duì)象(用戶)作為推薦的基礎(chǔ)集(稱之為推薦集),挖掘出與推薦集相對(duì)應(yīng)的條件屬性公式。(5)按照條件屬性公式與已挖掘出的典型軟決策規(guī)則的條件屬性公式之間的軟邏輯偽距離的大小,激活典型軟決策規(guī)則,利用所激活的典型軟決策規(guī)則,采用邏輯推理的方式給出電商產(chǎn)品的推薦。
算法2基于軟決策分析的推薦算法(soft decision analysis recommendation algorithm,SDARA)
輸入:信息系統(tǒng)(U,A),對(duì)象集U是電商客戶,屬性集A是用戶已評(píng)價(jià)(或購(gòu)買)的電商產(chǎn)品,閾值α、β。
輸出:滿足閾值要求的推薦結(jié)果。
步驟1構(gòu)造決策信息系統(tǒng)(U,C?D),條件屬性C是用戶已購(gòu)買電商產(chǎn)品,決策屬性D是待推薦電商產(chǎn)品。
步驟2將決策信息系統(tǒng)(U,C?D)轉(zhuǎn)化為決策軟集(F,C?D)。
步驟3依據(jù)所得到?jīng)Q策軟集(F,C?D),應(yīng)用算法STAA,挖掘得到全部如下形式的典型軟決策規(guī)則其 中 ri∈Vai(i=1,2,…,l)是作為條件屬性值的電商產(chǎn)品,t∈Vb是待推薦的作為決策屬性值的電商產(chǎn)品。
步驟4應(yīng)用算法STAA,提取BSTD和ASTD分別滿足閾值α、β的典型軟決策規(guī)則(比如(a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t),由于應(yīng)用的是軟邏輯公式概念,提取的典型軟決策規(guī)則所包含的條件屬性原子公式個(gè)數(shù)l可以不一致)。
步驟5對(duì)于一個(gè)給定的只包含有條件屬性的待推薦公式 (c1,s1)∧(c2,s2)∧…∧(ck,sk),其中 si∈Vci(i=1,2,…,k),計(jì)算(c1,s1)∧(c2,s2)∧…∧(ck,sk)與步驟4所提取的典型軟決策規(guī)則前件(如(a1,r1)∧(a2,r2)∧…∧(al,rl))之間的軟邏輯距離(由于應(yīng)用的是軟邏輯公式概念,這些前件包含的原子公式個(gè)數(shù),待推薦公式包含的原子公式個(gè)數(shù)都可以不相同)。
步驟6選擇上一步計(jì)算出的最小軟邏輯距離,設(shè)有最小軟邏輯距離的典型軟決策規(guī)則的前件為,選擇典型軟決策規(guī)則。
步驟7如果有多條典型軟決策規(guī)則的前件為,則計(jì)算 這 些典型 軟決策規(guī)則的CSTD,激活有最大CSTD的軟決策規(guī)則
步驟8將步驟7激活的典型軟決策規(guī)則的 前 件 代 換為待推薦公式,得到推薦規(guī)則(c1,s1)∧(c2,s2)∧…∧(ck,sk)→(d(0),t(0))。
步驟9按照推薦規(guī)則(c1,s1)∧(c2,s2)∧…∧(ck,sk)→ (d(0),t(0))得出推薦結(jié)果 (d(0),t(0))。
注2算法SDARA是基于待推薦軟邏輯公式與已有公式的最小軟邏輯距離來(lái)產(chǎn)生推薦規(guī)則,而軟邏輯距離是通過(guò)真度來(lái)進(jìn)行計(jì)算的。因此,從推薦方法分類的角度,本文的推薦方法是協(xié)同過(guò)濾推薦和基于規(guī)則推薦的結(jié)合,但由于算法2是基于軟邏輯語(yǔ)義理論的,從而它有較強(qiáng)的邏輯基礎(chǔ)和邏輯意義,這種方法將在模式識(shí)別、近似推理等人工智能方面有著較大的應(yīng)用前景。
例3考慮一個(gè)電子商務(wù)網(wǎng)站,用戶通過(guò)網(wǎng)站對(duì)電商產(chǎn)品評(píng)價(jià)(或購(gòu)買)作出“有興趣”“沒(méi)興趣”的評(píng)價(jià)。表5是該網(wǎng)站的部分事務(wù)數(shù)據(jù)庫(kù)(在表中,沒(méi)興趣、有興趣分別用0、1表示,*表示沒(méi)有該用戶對(duì)該電商產(chǎn)品的評(píng)價(jià)數(shù)據(jù))。用戶u3和u8對(duì)電商產(chǎn)品f的評(píng)價(jià)未知,網(wǎng)站平臺(tái)通過(guò)尋找用戶u3和u8的最近鄰關(guān)于f的評(píng)價(jià)來(lái)決定是否應(yīng)該將電商產(chǎn)品f推薦給用戶u3和u8。
Table 5 Partial transaction data for e-commerce表5 某電子商務(wù)部分事務(wù)數(shù)據(jù)庫(kù)
Table 6 Typical soft decision rules and their soft truth表6 典型軟決策規(guī)則及其軟真度
Table 7 Softlogicaldistancebetweena1∧b0∧c1∧d1∧e0 and antecedents of typical soft decision rule表7 a1∧b0∧c1∧d1∧e0與典型軟決策規(guī)則前件的軟邏輯距離
將以上事務(wù)數(shù)據(jù)庫(kù)(信息系統(tǒng))轉(zhuǎn)化為決策軟集(F,C?D),其中C={a,b,c,d,e},D={f},由于本例每個(gè)屬性都只有兩個(gè)值,決策軟集(F,C?D)也可以表示為表5的形式,推薦集為{u3,u8},訓(xùn)練集為{u1,u2,u4,u5,u6,u7,u9,u10}。根據(jù)訓(xùn)練集,取閾值 α=0.5,β = 0.1,應(yīng)用算法SLDTA,挖掘得到的6條典型軟決策規(guī)則及其軟真度如表6。
與用戶u3相對(duì)應(yīng)的軟邏輯公式為a1∧b0∧c1∧d1∧e0,它與各條典型軟決策規(guī)則前件的軟距離如表7。最小距離為0,激活相應(yīng)的軟決策規(guī)則a1∧b0∧c1∧d1∧e0→f1,推薦規(guī)則為a1∧b0∧c1∧d1∧e0→f1,推薦結(jié)論:將電商產(chǎn)品f推薦給用戶u3。
Table 8 Soft logical distance betweenb1∧c0∧d1∧e1and antecedents of typical soft decision rule表8 b1∧c0∧d1∧e1與典型軟決策規(guī)則前件的軟邏輯距離
與用戶u8相對(duì)應(yīng)的軟邏輯公式為b1∧c0∧d1∧e1,它與各條典型軟決策規(guī)則前件的軟距離如表8。最小距離為1 10,激活相應(yīng)的典型軟決策規(guī)則,推薦規(guī)則為a0∧b1∧c0∧d1∧e0→f0或a0∧b1∧c0∧d1→f0,推薦結(jié)論:不將電商產(chǎn)品f推薦給用戶u8。
本章通過(guò)實(shí)驗(yàn)對(duì)本文提出的算法和文獻(xiàn)[24]的關(guān)聯(lián)規(guī)則推薦算法(下文稱之為傳統(tǒng)方法)的推薦準(zhǔn)確率進(jìn)行比較,進(jìn)而驗(yàn)證本文算法的有效性。實(shí)驗(yàn)環(huán)境為Win 7 x64,Intel?3.4 GHz,RAM 4 GB。實(shí)驗(yàn)數(shù)據(jù)集為Movielens公開的電影點(diǎn)播及評(píng)分?jǐn)?shù)據(jù)集,實(shí)驗(yàn)時(shí)從數(shù)據(jù)集中隨機(jī)選取5組數(shù)據(jù),每組數(shù)據(jù)個(gè)數(shù)為1 600,按照75%∶25%的比例隨機(jī)生成訓(xùn)練集和測(cè)試集,取BSTD的閾值為α=0.6,ASTD的閾值為β=0.1。由于本文只處理二值屬性,沒(méi)有涉及多屬性值,而Movielens數(shù)據(jù)集的電影評(píng)價(jià)為1~5級(jí)評(píng)分,為此,對(duì)電影評(píng)分只取“滿意”和“不滿意”兩個(gè)值,客戶評(píng)分大于或等于3分表示客戶對(duì)電影“滿意”,評(píng)分小于或等于2分表示客戶對(duì)電影“不滿意”。實(shí)驗(yàn)結(jié)果的比較指標(biāo)選取為推薦準(zhǔn)確率(recommended accuracy,RA),計(jì)算公式為:
Fig.2 Comparison results of recommended accuracy RA圖2 推薦準(zhǔn)確率RA的比較結(jié)果
實(shí)驗(yàn)比較結(jié)果如圖2所示。
圖2的實(shí)驗(yàn)結(jié)果顯示,從推薦的準(zhǔn)確率方面來(lái)看,本文的推薦方法比傳統(tǒng)推薦方法要高一點(diǎn)。但正如注1所指出的,相對(duì)于傳統(tǒng)的推薦方法,本文方法的更大意義在于其有較強(qiáng)的邏輯基礎(chǔ)和邏輯意義。
軟集在不確定決策方面的研究,是目前軟集在應(yīng)用研究中最活躍的方向之一。本文提出基于軟集和邏輯公式的決策信息系統(tǒng)軟決策規(guī)則分析方法.建立一種基于軟集的形式推理語(yǔ)言,在這種形式推理語(yǔ)言中,原子公式是軟集中的參數(shù)α,參數(shù)α的函數(shù)值是論域U的子集)是原子公式α的賦值集。通過(guò)將決策系統(tǒng)轉(zhuǎn)化用決策軟集來(lái)表示,軟決策規(guī)則表示為決策軟集上的由原子公式組成的蘊(yùn)含邏輯公式。引進(jìn)基本軟真度、條件軟真度、絕對(duì)軟真度等概念從充分性、必要性、合理性等不同方面來(lái)對(duì)軟決策規(guī)則作出評(píng)價(jià),提出基于軟邏輯的不完備決策信息系統(tǒng)的決策規(guī)則提取算法。將基于軟邏輯的軟決策規(guī)則分析方法應(yīng)用于電子商務(wù)智能推薦,給出基于軟屬性關(guān)聯(lián)關(guān)系分析的電商產(chǎn)品推薦算法,實(shí)際例子和實(shí)驗(yàn)表明本文提出的算法是有效的。
本文提出的基于軟邏輯的電子商務(wù)智能推薦方法是基于用戶對(duì)電商產(chǎn)品作出明確的評(píng)價(jià)(購(gòu)買或不購(gòu)買,喜歡或不喜歡等),而無(wú)須用戶給出對(duì)電商產(chǎn)品打分或作其他的不確定性評(píng)價(jià),得到的推薦結(jié)論也只有確定的推薦或不推薦。因此,可以說(shuō)本文提出的智能推薦方法是一種確定的、剛性的推薦方法,這既是本文方法的優(yōu)點(diǎn),也可能是本文研究結(jié)論值得進(jìn)一步完善之處。限于篇幅,本文所提出算法的實(shí)際應(yīng)用,以及將本文方法進(jìn)行推廣,即如何將用戶對(duì)電商產(chǎn)品評(píng)價(jià)程度考慮進(jìn)來(lái)并考慮推薦的等級(jí),討論基于模糊軟集的形式邏輯與相應(yīng)的軟決策規(guī)則分析方法及其在電子智能推薦中的應(yīng)用,將在另外的文章中給出。