王玲玲,呂王勇,2*
(1.四川師范大學(xué) 數(shù)學(xué)與軟件科學(xué)學(xué)院,四川 成都 610066;2.可視化計(jì)算與虛擬現(xiàn)實(shí)四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610066)
擴(kuò)展的三支決策理論
王玲玲1,呂王勇1,2*
(1.四川師范大學(xué) 數(shù)學(xué)與軟件科學(xué)學(xué)院,四川 成都 610066;2.可視化計(jì)算與虛擬現(xiàn)實(shí)四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610066)
三支決策理論只能將決策對(duì)象劃分到接受域、拒絕域和邊界域3類(lèi),不能處理把決策對(duì)象劃分為更多類(lèi)的情況,因此,立足于傳統(tǒng)的三支決策理論,對(duì)其進(jìn)行推廣,提出擴(kuò)展的三支決策理論,結(jié)合貝葉斯理論,以決策的平均損失最小為原則,給出擴(kuò)展的三支決策理論詳細(xì)推導(dǎo)過(guò)程,使經(jīng)典的三支決策理論成為特例.
擴(kuò)展的三支決策; 貝葉斯理論; 三支決策;閥值; 評(píng)價(jià)函數(shù)
三支決策理論是對(duì)傳統(tǒng)的二支決策理論的發(fā)展,它在接受和拒絕2種選擇的基礎(chǔ)上引入延遲決策,使最終的決策結(jié)果保留待判類(lèi),從而避免直接接受或拒絕帶來(lái)的風(fēng)險(xiǎn),也更符合人類(lèi)直觀的信息處理模式,具有很強(qiáng)的現(xiàn)實(shí)意義.
Yao.Y.Y[1]在2012年給出三支決策理論的框架性描述;田海龍等[2]提出基于三支決策的中文微博觀點(diǎn)句識(shí)別研究;張聰?shù)萚3]提出一種三支決策軟增量聚類(lèi)算法;薛占熬等[4]提出基于三支決策理論的條件屬性權(quán)重構(gòu)造方法;徐久成等[5]提出基于三支決策的支持向量機(jī)增量學(xué)習(xí)方法;杜麗娜等[6]給出基于三支決策風(fēng)險(xiǎn)最小化的風(fēng)險(xiǎn)投資評(píng)估應(yīng)用研究;王磊等[7]給出基于主題與三支決策的文本情感分析;周哲等[8]提出一種基于動(dòng)態(tài)詞典和三支決策的情感分析方法;黃順亮等[9]提出客戶(hù)細(xì)分的三支決策方法.此外,還有謝騁等[10]提出的基于三支決策粗糙集的視頻異常行為檢測(cè);李建林等[11]提出的多階段三支決策垃圾短信過(guò)濾模型;張燕平等[12]提出的基于CCA的代價(jià)敏感三支決策模型.可以看到,三支決策理論的發(fā)展側(cè)重于應(yīng)用方面的多樣化,而缺乏對(duì)其理論的推廣.
三支決策的思想和方法簡(jiǎn)單有效,在解決實(shí)際問(wèn)題時(shí)具有很強(qiáng)的應(yīng)用價(jià)值,但是,該理論只能將對(duì)象最終決策到接受域、拒絕域和待判域這3類(lèi),無(wú)法處理需要將對(duì)象決策為更多類(lèi)的問(wèn)題,因此,在傳統(tǒng)三支決策理論的基礎(chǔ)上進(jìn)行擴(kuò)展,三支決策理論的思想能夠應(yīng)用在將對(duì)象劃分為更多類(lèi)的問(wèn)題上,不僅保持了三支決策理論應(yīng)用在對(duì)象細(xì)分上的優(yōu)越性,也突破了三支決策理論只能將對(duì)象劃分為2類(lèi)及一個(gè)待判類(lèi)的局限性,擴(kuò)大其應(yīng)用范圍.
首先給出對(duì)象的價(jià)值信息表T=(U,B,{Vb|b∈B},{Ib|b∈B}),其中,U是所需要研究的全部對(duì)象組成的有窮集合,在客觀上劃分為2個(gè)子集C和Cc,且U=C∪Cc.B是研究對(duì)象所有屬性組成的集合,這里具體指對(duì)象的評(píng)價(jià)指標(biāo)組成的集合,Vb是各屬性所有取值組成的非空集合.Ib:U→Vb是信息函數(shù),將U中每一個(gè)對(duì)象的某個(gè)屬性b映射到Vb上,定義為每個(gè)對(duì)象在各個(gè)指標(biāo)上的取值,即Ib(x)∈Vb.
定義U上的一個(gè)等價(jià)關(guān)系R,若Ib(x)=Ib(y),則xRy.所有滿(mǎn)足關(guān)系R的對(duì)象組成等價(jià)類(lèi)[x],則由等價(jià)類(lèi)[x]、閥值(α,β)和評(píng)價(jià)函數(shù)P(C|[x])將全集U劃分為3個(gè)兩兩不交的集合,分別表示為接受域POS(C)、待判域BND(C)和拒絕域NEG(C):
(1)
(2)
(3)
這3個(gè)概率區(qū)間兩兩不交,且其并集就是有限集合U.
由于將某對(duì)象劃分到不同區(qū)域所需要付出的代價(jià)不同,因此,給出形如表1的一張三支決策代價(jià)表[13](見(jiàn)表1).
表1 三支決策分類(lèi)代價(jià)表Table 1 The loss table of three-way decision
(4)
則每個(gè)對(duì)象的決策代價(jià)函數(shù)為:
(5)
(6)
(7)
RPOS(x)、RNEG(x)、RBND(x)分別表示對(duì)象x劃分到POS(C)、NEG(C)、BND(C)所需要付出的總代價(jià),則閥值對(duì)(α,β)[14]可以表示為
至此閥值對(duì)(α,β)已經(jīng)可以根據(jù)損失函數(shù)λxy確定,至于損失函數(shù)λxy,直接根據(jù)專(zhuān)家評(píng)分法可以得到.下面就評(píng)價(jià)函數(shù)P(C|[x])的求解方法[15],借助貝葉斯理論有
(9)
該計(jì)算公式中P([x])的求解比較困難,因此選擇求(9)式的近似解
(10)
易知
(11)
其中
最后結(jié)合研究對(duì)象的評(píng)價(jià)函數(shù)P(C|[x])以及閥值對(duì)(α,β),可以將全體研究對(duì)象劃分到三支決策的3個(gè)域中.
第一支:rg1={x∈U|[x]?C1},
第二支:rg2={x∈U|[x]?C2},
第三支:rg3={x∈U|[x]?C3},
第四支:rg4={x∈U|[x]∩C1≠φ且[x]C1,[x]∩C2≠φ,且[x]C2,[x]∩C3≠φ,且[x]C3}.
引入評(píng)價(jià)函數(shù)P(Ci|[x]),將上面4個(gè)區(qū)域換一種描述形式,其中,P(Ci|[x])描述等價(jià)類(lèi)[x]中的對(duì)象x屬于集合Ci的概率,則P(Ci|[x])(i=1,2,3)定義為
(12)
其中|·|表示集合的基數(shù).(12)式可表示為:
第一支:rg1={x∈U|P(C1|[x]=1),
第二支:rg2={x∈U|P(C2|[x]=1)},
第三支:rg3={x∈U|P(C3|[x]=1)},
第四支:rg4={x∈U|0
可以看到,雖然借助極端值0和1可以將全集分成互不相交的4個(gè)區(qū)域,但當(dāng)0
由于已經(jīng)定義C1、C2、C3分別表示高價(jià)值、較高價(jià)值和低價(jià)值對(duì)象所屬的類(lèi)別,那么,P(Ci|[x]),i=1,2,3的取值會(huì)受到對(duì)象各個(gè)指標(biāo)數(shù)據(jù)的影響,本身存在大小關(guān)系,因此,給出如下的擴(kuò)展三支決策表達(dá)形式:
第一支:rg1={x∈U|P(C1|[x])≥α1},
第二支:rg2={x∈U|α3≤P(C2|[x])≤α2},
第三支:rg3={x∈U|P(C3|[x])≤α4},
易知閥值滿(mǎn)足條件0≤α4<α3<α2<α1≤1.
至此,給出四支決策模型,接下來(lái)確定評(píng)價(jià)函數(shù)P(Ci|[x])(i=1,2,3)和閥值(α1,α2,α3,α4).
由于將某對(duì)象劃分到不同區(qū)域所需要付出的代價(jià)不同,因此給出一張三狀態(tài)四分類(lèi)結(jié)果的代價(jià)表(見(jiàn)表2).
表2 擴(kuò)展的三支決策分類(lèi)代價(jià)表Table 2 The loss table of extended three-way decision
λxy表示采取不同決策時(shí)所需要付出的代價(jià),如λ1,1′表示將屬于集合C1的對(duì)象劃分為rg1需要付出的代價(jià),且決策代價(jià)大小滿(mǎn)足
劃分為rgh的某對(duì)象x的代價(jià)函數(shù),就是該對(duì)象屬于集合C1的概率P(C1|[x])與該對(duì)象屬于集合C1又判斷為rgh的代價(jià)值λh,1′的乘積,加上該對(duì)象屬于集合C2的概率P(C2|[x])與該對(duì)象屬于集合C2又被判斷為rgh的代價(jià)值λh,2′的乘積,再加上該對(duì)象屬于集合C3的概率P(C3|[x])與該對(duì)象屬于集合C3又被判斷為rgh的代價(jià)值λh,3′的乘積.函數(shù)表達(dá)式為
(14)
由于總是選擇決策代價(jià)最小的行動(dòng)方案為最優(yōu)方案,因此決策規(guī)則可以描述為:
若Rrg1(x)≤Rrg2(x),且Rrg1(x)≤Rrg3(x),Rrg1(x)≤Rrg4(x),則x∈rg1;
若Rrg2(x)≤Rrg1(x),且Rrg2(x)≤Rrg3(x),Rrg2(x)≤Rrg4(x),則x∈rg2;
若Rrg3(x)≤Rrg1(x),且Rrg3(x)≤Rrg2(x),Rrg3(x)≤Rrg4(x),則x∈rg3;
若Rrg4(x)≤Rrg1(x),且Rrg4(x)≤Rrg2(x),Rrg4(x)≤Rrg3(x),則x∈rg4.
由此可以算出P(C1|[x])、P(C2|[x])、P(C3|[x])滿(mǎn)足條件:
下面就結(jié)合前面的決策代價(jià)函數(shù)關(guān)系式,給出4個(gè)閥值的表達(dá)式.
根據(jù)P(C1|[x])來(lái)確定閥值組中最大的那個(gè)閥值α1.同理,通過(guò)次大的條件概率值P(C2|[x])確定閥值α2、α3,通過(guò)最小條件概率P(C3|[x])確定閥值α4,則閥值α1、α2、α3、α4表示為
(18)
接下來(lái)確定評(píng)價(jià)函數(shù)P(Ci|[x]),i=1,2,3.
借助貝葉斯理論有
(19)
該計(jì)算公式中P([x])的求解比較困難,因此選擇先求解
(20)
(21)
先求解出O(P(Ci|[x])),然后根據(jù)(21)式最終確定P(Ci|[x])的值,下面分析(20)式的求解.
[x]描述為該等價(jià)類(lèi)中對(duì)象在屬性(b1,b2,…,bn)下所對(duì)應(yīng)的取值(v1,v2,…,vn),且Ibk(x)=vk,其中,n為指標(biāo)的個(gè)數(shù),vk為等價(jià)類(lèi)[x]中對(duì)象x在第k個(gè)指標(biāo)下的取值.再借助樸素貝葉斯獨(dú)立性假設(shè),即假設(shè)對(duì)任意的k≠l,有vk與vl相互獨(dú)立,則有
(22)
其中
最后再根據(jù)每個(gè)對(duì)象的條件概率值P(C|[x])和閾值(α1,α2,α3,α4)實(shí)現(xiàn)決策.
立足于傳統(tǒng)的三支決策理論,對(duì)傳統(tǒng)三支決策在決策中只能把對(duì)象劃分到接受域、拒絕域這2類(lèi)和待判類(lèi)的局限性進(jìn)行改進(jìn),提出擴(kuò)展的三支決策理論,借助貝葉斯理論,以決策的平均損失代價(jià)最小為原則,并給出決策代價(jià)表,對(duì)擴(kuò)展三支決策理論的三類(lèi)決策規(guī)則進(jìn)行了合適的描述,從而確定決策中最為重要的4個(gè)閥值.接下來(lái)還研究了在擴(kuò)展的三支決策理論下,評(píng)價(jià)函數(shù)的求解方法,最終借助閥值和評(píng)價(jià)函數(shù)成功地將對(duì)象劃分為更多類(lèi),使傳統(tǒng)的三支決策理論成為特例,將三支決策的思想應(yīng)用到更多的領(lǐng)域.
致謝 可視化計(jì)算與虛擬現(xiàn)實(shí)四川省重點(diǎn)實(shí)驗(yàn)室項(xiàng)目 (KJ201410)對(duì)本文給予了資助,謹(jǐn)致謝意.
[1] YAO Y Y.An outline of a theory of three-way decisions[C]//Proceedings of the RSCTC 2012.Berlin:Springer-Varlag,2012:1-17.
[2] 田海龍,朱艷輝,梁韜,等.基于三支決策的中文微博觀點(diǎn)句識(shí)別研究[J].山東大學(xué)學(xué)報(bào)(理學(xué)版),2014,49(8):58-65.
[3] 張聰,于洪.一種三支決策軟增量聚類(lèi)算法[J].山東大學(xué)學(xué)報(bào)(理學(xué)版),2014,49(8):40-47.
[4] 薛占熬,朱泰隆,薛天宇,等.基于三支決策理論的條件屬性權(quán)重構(gòu)造方法[J].計(jì)算機(jī)科學(xué),2015,42(8):265-268.
[5] 徐久成,劉洋洋,杜麗娜,等.基于三支決策的支持向量機(jī)增量學(xué)習(xí)方法[J].計(jì)算機(jī)科學(xué),2015,42(6):82-87.
[6] 杜麗娜,徐久成,劉洋洋,等.基于三支決策風(fēng)險(xiǎn)最小化的風(fēng)險(xiǎn)投資評(píng)估應(yīng)用研究[J].山東大學(xué)學(xué)報(bào)(理學(xué)版),2014,49(8):66-72.
[7] 王磊,黃河笑,吳兵,等.基于主題與三支決策的文本情感分析[J].計(jì)算機(jī)科學(xué),2015,42(6):93-96.
[8] 周哲,商琳.一種基于動(dòng)態(tài)詞典和三支決策的情感分析方法[J].山東大學(xué)學(xué)報(bào)(工學(xué)版),2015,45(1):19-23.
[9] 黃順亮,李建林,王琦.客戶(hù)細(xì)分的三支決策方法[J].計(jì)算機(jī)科學(xué)與探索,2014,8(6):743-750.
[10] 謝騁,商琳.基于三支決策粗糙集的視頻異常行為檢測(cè)[J].南京大學(xué)學(xué)報(bào)(自然科學(xué)),2013,49(4):475-482.
[11] 李建林,黃順亮.多階段三支決策垃圾短信過(guò)濾模型[J].計(jì)算機(jī)科學(xué)與探索,2014,8(2):226-233.
[12] 張燕平,鄒慧錦,趙姝.基于CCA的代價(jià)敏感三支決策模型[J].南京大學(xué)學(xué)報(bào)(自然科學(xué)),2015,51(2):447-452.
[13] 黃順亮,王琦.基于三支決策理論的對(duì)象細(xì)分方法[J].計(jì)算機(jī)應(yīng)用,2014,34(1):244-248.
[14] 劉盾,姚一豫,李天瑞.三支決策粗糙集[J].計(jì)算機(jī)科學(xué),2011,38(1):246-250.
[15] YAO Y Y,ZHOU B.Naive bayesian rough sets[C]//Proceedings of the 5th International Conference on Rough Sets and Knowledge Technology,6401.Berlin:Springer-Verlag,2010:719-726.
2010 MSC:68T37
(編輯 鄭月蓉)
Extension of Three-way Decision Theory
WANG Lingling1,LYU Wangyong1,2
(1.CollegeofMathematicsandSoftwareScience,SichuanNormalUniversity,Chengdu610066,Sichuan;2.VisualComputingandVirtualRealityKeyLaboratoryofSichuanProvince,Chengdu610066,Sichuan)
In the traditional three-way decision theory,the objects can only be divided into 3 regions: acceptance,rejection or deferment.Therefore the theory can not be applied when the objects must be divided into more than 3 regions.In this paper,an extended theory is proposed,in which,combining the Bayes theory,taking the average minimum loss criterion as principle,the detailed derivation of the extended theory is presented so that the classic three-way dicision theory becomes a special case.
extension-three-way decision; the Bayesian theory; three-way decision; the threshold; evaluation function
2015-10-29
國(guó)家自然科學(xué)青年基金(11601357)和四川省教育廳自然科學(xué)重點(diǎn)基金(15ZA0030)
TP181
A
1001-8395(2017)02-0262-05
10.3969/j.issn.1001-8395.2017.02.019
*通信作者簡(jiǎn)介:呂王勇(1979—),女,副教授,主要從事隨機(jī)信號(hào)處理的研究,E-mail:lvwangy@163.com