摘要: 針對(duì)不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)中的最優(yōu)尺度組合和IF-THEN知識(shí)獲取問(wèn)題,首先,提出了集值優(yōu)勢(shì)矩陣的概念,給出了其判斷序決策信息系統(tǒng)是否協(xié)調(diào)的條件。然后,在不協(xié)調(diào)的廣義多尺度序決策信息系統(tǒng)中,引入基于優(yōu)勢(shì)關(guān)系的廣義決策概念,同時(shí)通過(guò)定義區(qū)間值優(yōu)勢(shì)關(guān)系的方法,構(gòu)造了新的協(xié)調(diào)廣義多尺度序決策信息系統(tǒng),并設(shè)計(jì)了通過(guò)集值優(yōu)勢(shì)矩陣求最優(yōu)尺度組合的算法,挖掘了隱藏在不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)中的決策規(guī)則。最后,通過(guò)實(shí)驗(yàn)驗(yàn)證了所提廣義決策最優(yōu)尺度組合的有效性。
關(guān)鍵詞: 廣義多尺度序決策信息系統(tǒng); 集值優(yōu)勢(shì)矩陣; 廣義決策; 屬性約簡(jiǎn); 決策規(guī)則
中圖分類號(hào): TP18
文獻(xiàn)標(biāo)志碼: A
文章編號(hào): 1671-6841(2025)02-0051-10
DOI: 10.13705/j.issn.1671-6841.2023139
Knowledge Acquisition of Inconsistent Generalized Multi-scale Ordered
Decision Information Systems
HUANG Biao, HAN Banghe
(School of Mathematics and Statistics, Xidian University, Xi′an 710126, China)
Abstract: Aiming at the problem of optimal scale combination and IF-THEN knowledge acquisition in inconsistent generalized multi-scale ordered decision information systems, the concept of set-valued dominance matrix was firstly proposed, and the conditions for judging whether an ordered decision information system was consistent were given. Then, in the inconsistent generalized multi-scale ordered decision information system, the concept of generalized decision based on dominance relation was introduced. At the same time, a new consistent generalized multi-scale ordered decision information system was constructed by defining the interval-valued dominance relation, and an algorithm for finding the optimal scale combination through the set-valued dominance matrix was designed. The decision rules hidden in the inconsistent generalized multi-scale ordered decision information system were mined. Finally, the effectiveness of the proposed optimal scale combination of generalized decision was verified by experiments.
Key words: generalized multi-scale ordered decision information systems; set-valued dominance matrix; generalized decision; attribute reduction; decision rules
0 引言
粗糙集理論最初由Pawlak[1]提出,它以各種信息系統(tǒng)、決策信息系統(tǒng)為研究對(duì)象,通過(guò)定義論域上的等價(jià)關(guān)系,把不可區(qū)分的對(duì)象組合在一起構(gòu)成論域的劃分,并通過(guò)屬性約簡(jiǎn)[2-3]來(lái)挖掘信息系統(tǒng)里的最簡(jiǎn)決策規(guī)則,達(dá)到知識(shí)發(fā)現(xiàn)的目的。隨著粗糙集理論的不斷發(fā)展,經(jīng)典粗糙集理論的缺點(diǎn)日益明顯,考慮經(jīng)典粗糙集理論信息系統(tǒng)中的屬性值都是符號(hào)數(shù)據(jù)的問(wèn)題,以及日常生活很多數(shù)據(jù)都是有序的,如考試成績(jī)、價(jià)格波動(dòng)等,Greco等[4]提出了一個(gè)基于優(yōu)勢(shì)關(guān)系的粗糙集模型,即優(yōu)勢(shì)粗糙集。該模型的研究對(duì)象為有序數(shù)據(jù),如序信息系統(tǒng)、區(qū)間值序信息系統(tǒng)、直覺(jué)模糊值序信息系統(tǒng)等,它用優(yōu)勢(shì)關(guān)系代替經(jīng)典粗糙集中的等價(jià)關(guān)系,構(gòu)造近似空間達(dá)到知識(shí)發(fā)現(xiàn)的目的。
另外,傳統(tǒng)粗糙集模型的研究對(duì)象為信息系統(tǒng),它的每個(gè)對(duì)象、每個(gè)屬性只能取唯一的值,稱之為單尺度信息系統(tǒng)。然而,在實(shí)際的生活中,人們處理的數(shù)據(jù)可能是多層次、多尺度的。為此,Wu等提出了多尺度決策信息系統(tǒng)的概念,簡(jiǎn)稱Wu-Leung[5]模型,并研究了協(xié)調(diào)和不協(xié)調(diào)多尺度決策信息系統(tǒng)的最優(yōu)尺度組合[6-10]、知識(shí)獲取[11]的問(wèn)題。接著,Li等在Wu-Leung模型的基礎(chǔ)上提出了廣義多尺度決策信息系統(tǒng)[12]的概念,并給出了互補(bǔ)模型、格模型的算法求最優(yōu)尺度組合和知識(shí)獲取。隨后,Huang等[13]、Wu等[14]分別研究了在協(xié)調(diào)和不協(xié)調(diào)的情況下,決策屬性也具有多尺度的廣義多尺度決策信息系統(tǒng)的最優(yōu)尺度選擇問(wèn)題,尤其在不協(xié)調(diào)中引入廣義決策函數(shù)的方法值得稱贊。
上述針對(duì)廣義多尺度決策信息系統(tǒng)的研究主要基于等價(jià)關(guān)系[5-14]的,而基于優(yōu)勢(shì)關(guān)系[15-16]來(lái)研究廣義多尺度序決策信息系統(tǒng)的最優(yōu)尺度組合很少。盡管張嘉茹等[15]和楊燁等[16]分別研究了決策屬性為多尺度的協(xié)調(diào)、不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)的最優(yōu)尺度選擇問(wèn)題和知識(shí)獲取問(wèn)題,但文獻(xiàn)[16]所提出的廣義決策未像文獻(xiàn)[14]一樣給出構(gòu)造新的協(xié)調(diào)廣義多尺度決策信息系統(tǒng)的方法,它重新定義了協(xié)調(diào)和最優(yōu)尺度選擇,不是傳統(tǒng)最優(yōu)尺度選擇定義的延續(xù)。另外,所定義的廣義決策最優(yōu)尺度很大概率會(huì)是最細(xì)尺度,從代價(jià)來(lái)看未必是最優(yōu)的。這些是當(dāng)前基于優(yōu)勢(shì)關(guān)系的不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)研究的不足。
為了彌補(bǔ)上述不足,本文在文獻(xiàn)[13-18]和傳統(tǒng)協(xié)調(diào)和最優(yōu)尺度定義基礎(chǔ)上,引入更加有效的廣義決策并消除不協(xié)調(diào)性,構(gòu)造協(xié)調(diào)廣義多尺度序決策信息系統(tǒng),并借助集值優(yōu)勢(shì)矩陣來(lái)討論研究不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)的最優(yōu)尺度組合、屬性約簡(jiǎn)和知識(shí)獲取問(wèn)題。最后,通過(guò)實(shí)驗(yàn)驗(yàn)證了所提廣義決策最優(yōu)尺度組合的有效性。
1 基礎(chǔ)知識(shí)
定義1[19] 信息系統(tǒng)是一個(gè)二元組(U,A),其中U={x1,x2,…,xn}是一個(gè)非空有限對(duì)象集,A={a1,a2,…,am}是一個(gè)非空有限屬性集,a∈A,亦表示映射a:U→Va,Va為屬性a的取值域。
定義2[15] 設(shè)L為非空集合,≤為L(zhǎng)上的二元關(guān)系,若下面條件1)~4)成立,稱二元組(L,≤)為一個(gè)全序集。
1) 自反性:x∈L,x≤x;
2) 反對(duì)稱性:x,y∈L,x≤y,y≤xx=y;
3) 傳遞性:x,y,z∈L,x≤y,y≤zx≤z;
4) ≤是線性序:x,y∈L,x≤y或y≤x。
如果一個(gè)信息系統(tǒng)(U,A)屬性a的取值域Va是全序集(對(duì)不同a,在沒(méi)有歧義的情況下,本文均用≤或者≥表示對(duì)應(yīng)的線性序,且假設(shè)屬性值域均為實(shí)數(shù)),那么這個(gè)屬性就稱為一個(gè)準(zhǔn)則。如果信息系統(tǒng)(U,A)的所有屬性都是準(zhǔn)則,則該信息系統(tǒng)(U,A)稱為一個(gè)序信息系統(tǒng)。若決策屬性dA也是一個(gè)準(zhǔn)則,稱(U,A∪syggg00)是一個(gè)序決策信息系統(tǒng)。
對(duì)于一個(gè)序決策信息系統(tǒng)(U,A∪syggg00),(U,A∪syggg00)中的廣義決策[17-18]為
δA(x)=[lA(x),uA(x)],
其中:
lA(x)=min{d(y):yR≥Ax,y∈U},
uA(x)=max{d(y):xR≥Ay,y∈U}。
廣義決策反映了關(guān)于準(zhǔn)則集A對(duì)象x根據(jù)優(yōu)勢(shì)原則可能屬于決策類的區(qū)間,常用于不協(xié)調(diào)序決策信息系統(tǒng)中的分類和約簡(jiǎn)[17-18]。uA(x)和lA(x)為該區(qū)間的上、下界。若x∈U,lA(x)=uA(x)均成立,則稱序決策信息系統(tǒng)是協(xié)調(diào)的;否則,稱為不協(xié)調(diào)的。
2 廣義多尺度序決策信息系統(tǒng)
2.1 集值優(yōu)勢(shì)矩陣
定義3 設(shè)(U,A∪syggg00)是一個(gè)序決策信息系統(tǒng),U={x1,x2,…,xn},記
Dij={aa(xi)≥a(xj),a∈A∪syggg00},i,j=1,2,…,n,
則稱Dij為xi支配xj的集值優(yōu)勢(shì)集,即Dij刻畫(huà)了xi不比xj差的準(zhǔn)則集合,稱D=(Dij)n×n為(U,A∪syggg00)的集值優(yōu)勢(shì)矩陣。
命題1 設(shè)(U,C)=(U,A∪syggg00)是一個(gè)序決策信息系統(tǒng),如果i,j=1,2,…,n,使得{a1,a2,…,am}Dij,dDij成立,則稱(U,A∪syggg00)是不協(xié)調(diào)的;否則,稱(U,A∪syggg00)是協(xié)調(diào)的。
2.2 廣義多尺度序決策信息系統(tǒng)
在現(xiàn)實(shí)生活中,很多屬性值數(shù)據(jù)都是有序的,所以基于優(yōu)勢(shì)關(guān)系研究廣義多尺度序決策信息系統(tǒng)的最優(yōu)尺度是非常有意義的。下面介紹廣義多尺度序決策信息系統(tǒng)的定義和相關(guān)性質(zhì)。
定義4[15] 對(duì)于全序集(L1,≤1)和(L2,≤2),若映射g:(L1,≤1)→(L2,≤2),x,y∈L1,有
x≤1yg(x)≤2g(y),
則稱映射g為保序的。
定義5 廣義多尺度序信息系統(tǒng)是一個(gè)二元組S=(U,C),其中:U={x1,x2,…,xn}是一個(gè)非空有限的對(duì)象集;C={a1,a2,…,am}是一個(gè)非空有限的屬性集。若屬性aj有Ij個(gè)等級(jí)尺度,則一個(gè)廣義多尺度序信息系統(tǒng)可以表示為S=(U,{akjk=1,2,…,Ij,j=1,2,…,m}),其中:akj:U→Vkj是一個(gè)滿射函數(shù);Vkj是屬性aj在第k個(gè)尺度下的值域;≤kj是Vkj上的線性序,即(Vkj,≤kj)是一個(gè)全序集。對(duì)j=1,2,…,m,1≤k≤Ij-1,存在一個(gè)保序的滿射函數(shù)
gk,k+1j:(Vkj,≤kj)→(Vk+1j,≤k+1j),
使得ak+1j=gk,k+1jakj,即
ak+1j(x)=gk,k+1j(akj(x)), x∈U,
gk,k+1j稱為序信息粒度轉(zhuǎn)換函數(shù)。
另外,稱S=(U,C∪syggg00)是廣義多尺度序決策信息系統(tǒng),其中(U,C)是一個(gè)廣義多尺度序信息系統(tǒng),
d{akjk=1,2,…,Ij,j=1,2,…,m},d:U→Vd,
是一個(gè)決策屬性且(Vd,≤d)是全序集。
定義6[5] 設(shè)S=(U,C)為一個(gè)廣義多尺度序信息系統(tǒng),若將條件屬性aj(1≤j≤m)限制在該屬性的第lj(1≤lj≤Ij)個(gè)尺度下,記為L(zhǎng)=(l1,l2,…,lm),則L稱為S的條件屬性的一個(gè)尺度組合。S的所有尺度組合記為={(l1,l2,…,lm)1≤lj≤Ij,j=1,2,…,m}。
定義7[5] 設(shè)S=(U,C)為一個(gè)廣義多尺度信息系統(tǒng),對(duì)于兩個(gè)尺度組合L1=(l11,l12,…,l1m)∈,L2=(l21,l22,…,l2m)∈。若j∈{1,2,…,m},都有l(wèi)1j≤l2j,則稱尺度組合L1比L2細(xì),記L1≤L2。若L1≤L2,且j∈{1,2,…,m},使得l1j<l2j,則稱尺度組合L1嚴(yán)格細(xì)于L2,記L1<L2。
j∈{1,2,…,m},L1=(l11,l12,…,l1m)∈,
L2=(l21,l22,…,l2m)∈,定義
L1∧L2=(l11∧l21,l12∧l22,…,l1m∧l2m),
L1∨L2=(l11∨l21,l12∨l22,…,l1m∨l2m),
其中:l1j∧l2j=min(l1j,l2j);l1j∨l2j=max(l1j,l2j)。
那么
L1≤L2L1∧L2=L1L1∨L2=L2,
且(,≤,∧,∨)是一個(gè)有界格,其中最大元為(I1,I2,…,Im),最小元為(1,1,…,1)。
顯然,對(duì)于一個(gè)廣義多尺度序決策信息系統(tǒng),可以分解成∏mj=1Ij個(gè)序決策信息系統(tǒng)且具有相同的決策屬性d,也可以分解得到∏mj=1Ij個(gè)不同的集值優(yōu)勢(shì)矩陣,即定義7中格結(jié)構(gòu)的每個(gè)節(jié)點(diǎn)加上決策屬性d對(duì)應(yīng)于一個(gè)集值優(yōu)勢(shì)矩陣。
定義8[5] 設(shè)S=(U,C∪syggg00)為一個(gè)廣義多尺度序決策信息WbQN1B/09fUg7OYPDmeT4KKebZWHt17O2FHqC6IM1hM=系統(tǒng),L=(l1,l2,…,lm)∈為S的一個(gè)尺度組合,定義關(guān)于準(zhǔn)則集CL的優(yōu)勢(shì)關(guān)系R≥CL、對(duì)象x的優(yōu)勢(shì)類[x]≥CL為
R≥CL={(y,x)∈U×Ualjj(y)≥aljj(x),aljj∈CL},
[x]≥CL={y∈Ualjj(y)≥aljj(x),aljj∈CL}=
{y∈U(y,x)∈R≥CL}。
性質(zhì)1 設(shè)S=(U,C∪syggg00)=(U,{akjk=1,2,…,Ij,j=1,2,…,m}∪syggg00)為一個(gè)廣義多尺度序決策信息系統(tǒng),Q1=(K1,d)=(k11,k12,…,k1m,d),Q2=(K2,d)=(k21,k22,…,k2m,d)。若Q1、Q2、K1、K2對(duì)應(yīng)的集值優(yōu)勢(shì)矩陣分別為DQ1、DQ2、DK1、DK2,則性質(zhì)1)~4)成立。
1) K1≤K2R≥CK1R≥CK2,[x]≥CK1[x]≥CK2;
2) BCR≥CR≥B;
3) 如果K1≤K2,ak1jj∈DK1i1,i2(ak1jj∈DQ1i1,i2),則ak2jj∈DK2i1,i2(ak2jj∈DQ2i1,i2),i1,i2=1,2,…,n;
4) K1≤K2DK1i1,i2≤DK2i1,i2,i1,i2=1,2,…,n,其中Di1,i2表示集值優(yōu)勢(shì)矩陣中項(xiàng)Di1,i2的元素個(gè)數(shù)。
3 不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)的最優(yōu)尺度組合
在本節(jié)中,基于優(yōu)勢(shì)關(guān)系引入廣義決策,研究了不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)中的最優(yōu)尺度組合,并用于生成單尺度序決策信息系統(tǒng)和提取決策規(guī)則。
3.1 不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)的廣義決策
定義9 設(shè)S=(U,C∪syggg00)=(U,{akjk=1,2,…,Ij,j=1,2,…,m}∪syggg00)是一個(gè)廣義多尺度序決策信息系統(tǒng),L1=(1,1,…,1),如果存在i,j=1,2,…,m,使得{a11,a12,…,a1m}DCL1∪syggg00ij,dDCL1∪syggg00ij成立,即序決策信息系統(tǒng)(U,CL1∪syggg00)不協(xié)調(diào),則S被稱為不協(xié)調(diào)的;否則,稱S是協(xié)調(diào)的。
性質(zhì)2 設(shè)S=(U,C∪syggg00)=(U,{akjk=1,2,…,Ij,j=1,2,…,m}∪syggg00)為一個(gè)廣義多尺度序決策信息系統(tǒng),L1,L2∈,L1<L2。如果SL1=(U,CL1∪syggg00)是不協(xié)調(diào)的,則SL2=(U,CL2∪syggg00)也是不協(xié)調(diào)的;如果SL2=(U,CL2∪syggg00)是協(xié)調(diào)的,那么SL1=(U,CL1∪syggg00)也協(xié)調(diào)。
證明 根據(jù)性質(zhì)1易證。
由于L是最優(yōu)尺度組合當(dāng)且僅當(dāng)L是協(xié)調(diào)的,且所有比L粗的尺度組合都不協(xié)調(diào),則根據(jù)性質(zhì)2可知,若最細(xì)尺度組合和決策屬性d形成的序決策信息系統(tǒng)不協(xié)調(diào),那么廣義多尺度序決策信息系統(tǒng)S的所有尺度組合和決策屬性d形成的序決策信息系統(tǒng)都不協(xié)調(diào),則我們無(wú)法直接遍歷S的尺度組合的格結(jié)構(gòu)尋找最優(yōu)尺度。于是,為了確定S的最優(yōu)尺度組合,我們?cè)诮o定尺度組合下,定義廣義多尺度序決策信息系統(tǒng)的廣義決策。
定義10 設(shè)
S=(U,C∪syggg00)=
(U,{akjk=1,2,…,Ij,j=1,2,…,m}∪syggg00)是一個(gè)廣義多尺度序決策信息系統(tǒng),K=(L,d)=(l1,l2,…,lm,d),在誘導(dǎo)的序決策信息系統(tǒng)(U,CL∪syggg00)中定義廣義決策函數(shù)
δCL(x)=[lCL(x),uCL(x)],
其中:
lCL(x)=min{d(y):yR≥CLx,y∈U};
uCL(x)=max{d(y):xR≥CLy,y∈U}。
記
R≥δCL={(y,x)∈U×UδCL(y)≥δCL(x)},
R≥δCL表示廣義決策δCL誘導(dǎo)的優(yōu)勢(shì)關(guān)系,通過(guò)用廣義決策δCL替換(U,CL∪syggg00)中的決策屬性d,我們就能得到一個(gè)新的序決策信息系統(tǒng)(U,CL∪{δCL})。為了得到(U,CL∪{δCL})的集值優(yōu)勢(shì)矩陣,就需要定義廣義決策δCL的優(yōu)勢(shì)關(guān)系。在具體問(wèn)題中,常采用3種方法定義區(qū)間值優(yōu)勢(shì)關(guān)系。
定義11 設(shè)w1=[u1,v1],w2=[u2,v2],定義任意兩個(gè)區(qū)間值的優(yōu)勢(shì)關(guān)系方法為
1) 下界偏好關(guān)系:[u1,v1]≤[u2,v2]u1≤u2;
2) 上界偏好關(guān)系:[u1,v1]≤[u2,v2]v1≤v2;
3) 直覺(jué)偏好關(guān)系:
[u1,v1]≤[u2,v2]12(u1+v1)<12(u2+v2)或12(u1+v1)=12(u2+v2)且12(v1-u1)≥12(v2-u2)。
定理1 如果采用上述3種方法定義區(qū)間值優(yōu)勢(shì)關(guān)系,則用廣義決策δCL替換(U,CL∪syggg00)中決策屬性d得到的序決策信息系統(tǒng)(U,CL∪{δCL})是協(xié)調(diào)的。
證明 采用定義11的1)定義區(qū)間值優(yōu)勢(shì)關(guān)系,即證
x,y∈U,yR≥CLxlCL(x)≤lCL(y)。
令
H1={d(z1):z1R≥CLx,x,z1∈U},
H2={d(z2):z2R≥CLy,y,z2∈U}。
由于yR≥CLx,有[y]≥CL[x]≥CL,所以H2H1,即min(H1)≤min(H2),故lCL(x)≤lCL(y)。
同理可證,定義11的2)和3)定義區(qū)間值優(yōu)勢(shì)關(guān)系也成立。
綜上,由定義11知,用廣義決策δCL替換(U,CL∪syggg00)中的決策屬性d得到的序決策信息系統(tǒng)(U,CL∪{δCL})是協(xié)調(diào)的。
記GLδ=(U,C∪{δCL})=(U,{akjk=1,2,…,Ij,j=1,2,…,m}∪{δCL})。
顯然,GLδ是由尺度組合L誘導(dǎo)生成的廣義多尺度序決策信息系統(tǒng),決策屬性為δCL,且GLδ是協(xié)調(diào)的。
定義12 設(shè)S=(U,C∪syggg00)是一個(gè)不協(xié)調(diào)的廣義多尺度序決策信息系統(tǒng),L=(l1,l2,…,lm)∈,L1=(1,1,…,1)∈。 如果i,j=1,2,…,n,使得{al11,al22,…,almm}DCL∪{δCL1}ij,dDCL∪
{δCL1}ij成立,則稱(U,CL∪{δCL1})是廣義決策不協(xié)調(diào)的;否則,稱為廣義決策是協(xié)調(diào)的。
定理2 設(shè)廣義多尺度序信息系統(tǒng)GLδ=(U,C∪{δCL})的集值優(yōu)勢(shì)矩陣為DGLδ,K=(k1,k2,…,km)∈。如果i,j=1,2,…,n,使得{ak11,ak22,…,akmm}DGLδij,δCLDGLδij成立,則序決策信息系統(tǒng)(U,CK∪{δCL})不協(xié)調(diào);否則,(U,CK∪{δCL})協(xié)調(diào)。
定理3 設(shè)S=(U,C∪syggg00)=(U,{akjk=1,2,…,Ij,j=1,2,…,m}∪syggg00)是一個(gè)不協(xié)調(diào)的廣義多尺度序決策信息系統(tǒng),L,K∈且L<K。如果
(U,CL∪{δCL1})是廣義決策不協(xié)調(diào)的,則
(U,CK∪{δCL1})也是廣義決策不協(xié)調(diào)的;如果
(U,CK∪{δCL1})是廣義決策協(xié)調(diào)的,則(U,CL∪{δCL1})
也是廣義決策協(xié)調(diào)的。
定理3表明,給定一個(gè)不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)S,若廣義決策δCL1與較粗尺度組合形成的序決策信息系統(tǒng)協(xié)調(diào),那么它一定與較細(xì)尺度形成的序決策信息系統(tǒng)協(xié)調(diào)。這一結(jié)論將幫助我們?cè)诓粎f(xié)調(diào)的廣義多尺度序決策信息系統(tǒng)定義和尋找最優(yōu)尺度組合。
3.2 不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)的最優(yōu)尺度
定義13 設(shè)S=(U,C∪syggg00)=(U,{akjk=1,2,…,Ij,j=1,2,…,m}∪syggg00)是一個(gè)不協(xié)調(diào)的廣義多尺度序決策信息系統(tǒng),L1=(1,1,…,1),L=(l1,l2,…,lm)∈。若不存在i,j=1,2,…,n,使得{al11,al22,…,almm}DGL1δij,δCL1DGL1δij
成立,則序決策信息系統(tǒng)(U,CL∪{δCL1})是協(xié)調(diào)的,即稱尺度組合L是S中廣義決策協(xié)調(diào)的。如果尺度組合L是S中廣義決策協(xié)調(diào)的,且L′=(l′1,l′2,…,l′m)∈,L<L′,L′都不是S中廣義決策協(xié)調(diào)的,則稱L=(l1,l2,…,lm)∈是S的廣義決策最優(yōu)尺度組合,簡(jiǎn)稱最優(yōu)尺度組合。
由于條件屬性aj具有Ij個(gè)尺度,則中所有尺度組合的數(shù)量為∏mj=1Ij,每個(gè)尺度組合加上決策屬性δCL1可代表一個(gè)集值優(yōu)勢(shì)矩陣。又因?yàn)椋?,≤,∧,∨)是一個(gè)有限格,所以可以從上到下搜索格結(jié)構(gòu)(,≤,∧,∨)求最優(yōu)尺度組合。L=(l1,l2,…,lm)∈是S的最優(yōu)尺度組合,當(dāng)且僅當(dāng)L為格(,≤,∧,∨)中使得(U,CL∪{δCL1})協(xié)調(diào)的最大元素。于是我們?cè)O(shè)計(jì)了一種基于定義13尋找一個(gè)最優(yōu)尺度組合的算法,見(jiàn)算法1。最糟糕的情況下,該算法的時(shí)間復(fù)雜度為O(∏mj=1Ij×U2)。
算法1 在不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)中求最優(yōu)尺度組合的算法。
輸入:一個(gè)不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)
S=(U,C∪syggg00)=(U,{akjk=1,2,…,Ij,j=1,2,…,m}∪syggg00)。
輸出:S的一個(gè)最優(yōu)尺度組合。
1. 計(jì)算DGL1δ;M←
2. For i,j=1∶n
3. If δCL1DGCL1δij
4. M←DGCL1δij
5. End if
6. End for
7. Queue←NULL;(l1,l2,…,lm)←(I1,I2,…,Im)
8. L0←(l1,l2,…,lm);Queue.put (L0)
9. While (Queue≠NULL)
10. L←Queue.get()
11. If CLM
12. Return (L)
13. End if
14. For k=1∶m
15. If (lk>1)
16. L←(l1,l2,…,lk-1,lk-1,lm);Queue.put(L)
17. End if
18. End for
19. End while
3.3 不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)的知識(shí)獲取
本小節(jié)主要研究不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)的知識(shí)獲取,分為屬性約簡(jiǎn)和規(guī)則提取。序決策信息系統(tǒng)的屬性約簡(jiǎn)是在所有對(duì)象的基礎(chǔ)上,保持序決策信息系統(tǒng)協(xié)調(diào)性不變的最小屬性子集。
定義14 設(shè)S=(U,C∪syggg00)=(U,{akjk=1,2,…,Ij,j=1,2,…,m}∪syggg00)是一個(gè)不協(xié)調(diào)的廣義多尺度序決策信息系統(tǒng),L=(l1,l2,…,lm)∈是S的最優(yōu)尺度組合。對(duì)BCL={al11,al22,…,almm},若不存在i,j=1,2,…,n,使得BDCL∪{δCL1}ij,δCL1DCL∪{δCL1}ij成立,存在i,j=1,2,…,n,b∈B,使得B-DCL∪{δCL1}ij,δCL1DCL∪{δCL1}ij成立,則稱B是CL的一個(gè)約簡(jiǎn)。
序決策信息系統(tǒng)中的決策規(guī)則一般形式為t→s,t是規(guī)則的條件部分,s是規(guī)則的決策部分。對(duì)同時(shí)滿足決策規(guī)則的條件部分和決策部分的對(duì)象,稱為支持該條規(guī)則的對(duì)象。決策規(guī)則的確定度為r=t∧s/t,確定度體現(xiàn)了根據(jù)條件部分能得出決策部分的可信度。對(duì)于不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng),與文獻(xiàn)[20]類似,
根據(jù)最優(yōu)尺度組合和屬性約簡(jiǎn)就可以提取確定規(guī)則與可能規(guī)則,其規(guī)則形式為
(ak11,≥,r1)∧(ak22,≥,r2)∧…∧(akmm,≥,rm)(d,≥,rd)。
顯然確定規(guī)則的確定度為1,可能規(guī)則的確定度小于1。
例1 假設(shè)S=(U,C∪syggg00)=(U,{a11,a21,a12,a22,a32,a13,a23}∪syggg00)是一個(gè)廣義多尺度序決策信息系統(tǒng),如表1所示,則該廣義多尺度序決策信息系統(tǒng)共有12個(gè)尺度組合,即L1=(1,1,1),L2=(2,1,1),L3=(1,2,1),L4=(1,1,2),L5=(2,2,1),L6=(2,1,2),L7=(1,2,2),L8=(1,3,1),L9=(2,3,1),L10=(1,3,2),L11=(2,2,2),L12=(2,3,2)。顯然,L1=(1,1,1)和L12=(2,3,2)分別為格(,≤,∧,∨)中最小元和最大元,格結(jié)構(gòu)如圖1所示。
例2 在例1中,需要解決問(wèn)題1)~3),
1) 判斷S是否是協(xié)調(diào)的;
2) 確定S的最優(yōu)尺度組合;
3) 確定S的屬性約簡(jiǎn)和決策規(guī)則。
1) 計(jì)算在尺度組合L1=(1,1,1)下,序決策信息系統(tǒng)(U,CL1∪syggg00)的集值優(yōu)勢(shì)矩陣,篇幅原因,在此不具體展示。顯然{a11,a12,a13}
DCL1∪syggg0011,4,dDCL1∪syggg0011,4,
所以
廣義多尺度序決策信息系統(tǒng)S是不協(xié)調(diào)的。
2) 根據(jù)廣義決策的定義,在最細(xì)尺度L1=(1,1,1)下,可計(jì)算得到表1中第10列所示的廣義決策函數(shù)δCL1(x)。由于S不協(xié)調(diào),則替換決策屬性d為δCL1,并分別采用定義11的3種方法定義廣義決策δCL1的區(qū)間值優(yōu)勢(shì)關(guān)系,以此來(lái)分別求最優(yōu)尺度組合。
① 采用定義11的1)定義區(qū)間值優(yōu)勢(shì)關(guān)系,根據(jù)定理1可知(U,CL1∪{δCL1})是協(xié)調(diào)的。另外可得GL1δ=(U,C∪{δCL1})的集值優(yōu)勢(shì)矩陣
DGL1δ,由于矩陣太大和篇幅原因,在此只展示GL1δ=(U,C∪{δCL1})
的集值優(yōu)勢(shì)矩陣中不含決策屬性δCL1的項(xiàng),如
DGL1δ=x1x2x8x9x10x12x1{a21,a12,a22,a32}x2{a21,a12,a22,a32,a23}x3{a32}{a32}{a12,a22,a32}{a12,a22,a32}{a11,a21,a12,a22,a32}{a32,a23}x4{a11,a21}{a11,a21,a12,a22,a32}{a21}x5{a11,a21}{a11,a21,a12,a22,a32}{a21}x6{a32}{a32}{a22,a32}{a32}{a12,a22,a32}{a32,a13,a23}x7{a12,a22,a32}{a13,a23}x8{a32}x10x11{a32}{a32}{a11,a21,a22,a32}{a32}{a11,a21,a12,a22,a32}{a11,a21,a32}x12{a12,a22,a32}。
對(duì)于CL12={a21,a32,a23},由于
{a21,a32,a23}DGL1δ2,9={a21,a12,a22,a32,a23},δCL1DGL1δ2,9,故(U,CL12∪{δCL1})不協(xié)調(diào)。
對(duì)于CL10={a11,a32,a23},由于不存在
i,j=1,2,…,n,使得{a11,a32,a23}DGL1δij,δCL1DGL1δij
成立,故(U,CL10∪{δCL1})協(xié)調(diào)。
同理,也可計(jì)算得到(U,CL11∪{δCL1})不協(xié)調(diào),
(U,CL9∪{δCL1}),(U,CL6∪{δCL1})協(xié)調(diào)。
根據(jù)最優(yōu)尺度組合的定義和圖1的格結(jié)構(gòu),可知最優(yōu)尺度組合為(2 3 1), (1 3Yfdjh9sZcb8T1TEjXaBkgg== 2)。
② 采用定義11的2)和3)分別定義區(qū)間值優(yōu)勢(shì)關(guān)系,計(jì)算過(guò)程在此不具體描述,方法與①一樣,可分別得最優(yōu)尺度為(2 1 2)和(1 1 2), (2 1 1)。
3) 選擇定義11的1)所得的最優(yōu)尺度組合L9=(2,3,1)為例求其屬性約簡(jiǎn)。
由于可求得不存在i,j=1,2,…,n,使得
{a21,a13}DL9∪{δCL1}ij,
δCL1DL9∪{δCL1}ij,
且
{a21}DL9∪{δCL1}4,8,
δCL1DL9∪{δCL1}4,8,
{a13}DL9∪{δCL1}7,12,
δCL1DL9∪{δCL1}7,12。
所以,根據(jù)定義14知{a21,a13}是序決策信息系統(tǒng)
(U,{a21,a32,a13}∪{δCL1})的一個(gè)約簡(jiǎn)。
又因?yàn)閧a21,a32},{a32,a13},{a32}均不是
(U,{a21,a32,a13}∪{δCL1})的約簡(jiǎn),所以
{a21,a13}是(U,{a21,a32,a13}∪{δCL1})的唯一一個(gè)約簡(jiǎn)。
因此可得
S=(U,C∪syggg00)=(U,{a11,a21,a12,a22,a32,a13,a23}∪syggg00)。在L9=(2,3,1)下的部分序決策規(guī)則為
r1:(a21,≥,9)∧(a13,≥,93)(d,≥,2),該規(guī)則的支持對(duì)象為x2,x9,確定度為1;
r2:(a21,≥,7)∧(a13,≥,71)(d,≥,1),該規(guī)則的支持對(duì)象為x1,x2,x3,x8,x9,x10,x12,確定度為1;
r3:(a21,≥,8)∧(a13,≥,58)(d,≥,2),該規(guī)則的支持對(duì)象為x1,x2,x4,x8,x9,x12,確定度為
34;
r4:(a21,≥,8)∧(a13,≥,85)(d,≥,3),該規(guī)則的支持對(duì)象為x1,x8,x9,確定度為34。
4 實(shí)驗(yàn)與分析
為了驗(yàn)證本文提出的算法1的有效性,即驗(yàn)證所提出的廣義決策最優(yōu)尺度組合是合理的。本節(jié)在一些公開(kāi)的數(shù)據(jù)集上進(jìn)行數(shù)值實(shí)驗(yàn),這些數(shù)據(jù)集來(lái)自加州大學(xué)歐文分校(UCI),具體信息如表2所示。
由于這些數(shù)據(jù)集對(duì)應(yīng)的信息系統(tǒng)的條件屬性是單尺度的,所以必須將數(shù)據(jù)集預(yù)處理轉(zhuǎn)換成多尺度信息系統(tǒng)。采用文獻(xiàn)[11]方法獲得多尺度信息系統(tǒng),步驟如下。
1) 通過(guò)a1(x)=(a(x)-ma)/std(a)」計(jì)算得到屬性a的第一個(gè)尺度,其中a(x)是原始數(shù)據(jù)集對(duì)象x的屬性值,ma和std(a)分別是屬性a的最小值和標(biāo)準(zhǔn)差,y」表示滿足z≤y的最大整數(shù)z。
2) 為了模擬數(shù)據(jù)有序的分類任務(wù),首先計(jì)算樣本在條件屬性下的平均值,接著具有較大平均值的樣本被分配較大的類標(biāo)簽,具有較小平均值樣本被分配較小的類標(biāo)簽。考慮類標(biāo)簽的數(shù)量遠(yuǎn)小于樣本數(shù)量,在基于平均值對(duì)類標(biāo)簽進(jìn)行賦值過(guò)程中,采用根據(jù)類標(biāo)簽數(shù)量進(jìn)行批量賦值的方法。例如,對(duì)于數(shù)據(jù)集iris,我們按照平均值的順序?qū)⑵浞殖?個(gè)數(shù)量相等的部分,并按照對(duì)應(yīng)順序?yàn)闃颖痉峙錁?biāo)簽值。然后為了保證不協(xié)調(diào)性,隨機(jī)選擇5%的樣本且使選擇的每個(gè)類標(biāo)簽樣本個(gè)數(shù)相等,并用其余類標(biāo)簽值平均替換原有標(biāo)簽值,就獲得了不協(xié)調(diào)序決策信息系統(tǒng)。
3) 在第一個(gè)尺度的基礎(chǔ)上,從下到上依次合并屬性值來(lái)得到后續(xù)的尺度,直到當(dāng)前尺度級(jí)的屬性值域不超過(guò)3個(gè),如假設(shè)屬性a的第1個(gè)尺度的屬性值域?yàn)閍1={0,1,2,3,4,5},則a2={1,2,3,4,5},a3={2,3,4,5},a4={3,4,5},故屬性a有4個(gè)尺度。
顯然,通過(guò)步驟1)~3)求得的廣義多尺度序決策信息系統(tǒng)是不協(xié)調(diào)的,并利用算法1和定義11三種不同方法就可求得最優(yōu)尺度組合,結(jié)果如表3所示。表3還顯示了最優(yōu)率和平均尺度,最優(yōu)率表示尺度級(jí)2的屬性百分比,平均尺度為所有尺度的平均值。如數(shù)據(jù)集iris包含4個(gè)屬性,在定義11的3種定義區(qū)間值優(yōu)勢(shì)關(guān)系方法下,最優(yōu)尺度組合分別為(1,3,2,2), (2,1,2,1), (1,1,2,1)。與最細(xì)尺度組合相比,最優(yōu)率分別為0.75, 0.50, 0.25,平均尺度分別為2.00, 1.50, 1.25。
通過(guò)使用MATLAB R2020b提供的分類器K近鄰(KNN, K=3)、分類回歸樹(shù)(CART)來(lái)評(píng)估算法所求得的最優(yōu)尺度組合的性能。為了進(jìn)行充分的比較,采用三種不同尺度組合比較,即最細(xì)尺度組合、最粗尺度組合、最優(yōu)尺度組合。
實(shí)驗(yàn)中使用這些分類器的默認(rèn)參數(shù)設(shè)置,采用三重交叉驗(yàn)證,即對(duì)于每個(gè)數(shù)據(jù)集,選擇2/3的樣本作為訓(xùn)練集,其余1/3的樣本作為測(cè)試集。分類準(zhǔn)確率作為評(píng)價(jià)指標(biāo)。重復(fù)實(shí)驗(yàn)10次,計(jì)算分類準(zhǔn)確率的平均值和標(biāo)準(zhǔn)差作為最終結(jié)果。實(shí)驗(yàn)結(jié)果如表4~5所示。在此需要說(shuō)明的是,表4~5中最優(yōu)尺度組合的三個(gè)分類準(zhǔn)確率數(shù)據(jù)是在定義11的三種不同區(qū)間值優(yōu)勢(shì)關(guān)系定義方法下得到的,即相當(dāng)于三個(gè)不同參數(shù)所得的結(jié)果。而最細(xì)尺度組合和最粗尺度組合不受其影響,三種定義方法下所得結(jié)果均相同。
從表4~5可以看出,對(duì)于分類器KNN,在iris數(shù)據(jù)集上,最優(yōu)尺度組合取得了最大分類準(zhǔn)確率;分類器CART在數(shù)據(jù)集iris和vertebral-column-3c上的最優(yōu)尺度組合也取得了最大分類準(zhǔn)確率,說(shuō)明將單尺度信息表轉(zhuǎn)換為多尺度信息表并求得的最優(yōu)尺度組合可以在一定程度上提高分類性能。相比最細(xì)尺度組合,所有數(shù)據(jù)集的最粗尺度組合分類效果較差,主要在于尺度不斷合并過(guò)程導(dǎo)致大量信息丟失。但對(duì)于大多數(shù)數(shù)據(jù)集,最優(yōu)尺度組合的分類精度與最細(xì)尺度組合分類精度接近,理論上代價(jià)也降低了,說(shuō)明所提出的廣義決策最優(yōu)尺度組合是有效的,在一定條件下能取得較好的決策結(jié)果。
5 總結(jié)
目前,廣義多尺度決策信息系統(tǒng)的研究大多基于等價(jià)關(guān)系,而基于優(yōu)勢(shì)關(guān)系進(jìn)行的研究仍然較少。本文定義序決策信息系統(tǒng)的集值優(yōu)勢(shì)矩陣和廣義多尺度序決策信息系統(tǒng),并給出了通過(guò)集值優(yōu)勢(shì)矩陣判斷序決策信息系統(tǒng)是否協(xié)調(diào)的方法。針對(duì)不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)的最優(yōu)尺度組合、知識(shí)獲取問(wèn)題,引入廣義決策的概念,用理論證明了用廣義決策δCL替換序決策信息系統(tǒng)中的決策屬性d能得到新的協(xié)調(diào)序決策信息系統(tǒng)?;诖?,利用集值優(yōu)勢(shì)矩陣給出了求不協(xié)調(diào)廣義多尺度序決策信息系統(tǒng)最優(yōu)尺度組合和屬性約簡(jiǎn)方法,這一方法簡(jiǎn)單且無(wú)須每次計(jì)算條件屬性和決策屬性的優(yōu)勢(shì)類。在下一步的研究中,考慮深入研究集值優(yōu)勢(shì)矩陣的性質(zhì),以此研究最優(yōu)尺度組合的啟發(fā)式算法。
參考文獻(xiàn):
[1] PAWLAK Z. Rough sets[J].International journal of computer & information sciences, 1982, 11(5): 341-356.
[2] 王君宇, 楊亞鋒, 趙佳亮, 等. 基于?;赏貨Q策的屬性約簡(jiǎn)算法研究[J]. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版), 2022, 54(5):72-81.
WANG J Y, YANG Y F, ZHAO J L, et al. Research on attribute reduction algorithm based on granulation extension decision[J]. Journal of Zhengzhou university (natural science edition), 2022, 54(5):72-81.
[3] 劉東君, 陳紅梅. 高斯核模糊粗糙集中基于粒子群算法的屬性約簡(jiǎn)[J]. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版), 2018, 50(3)53-59.
LIU D J, CHEN H M. Attribute reduction in Gaussian kernel based fuzzy rough sets based on particle swarm optimization[J]. Journal of Zhengzhou university (natural science edition), 2018, 50(3)53-59.
[4] GRECO S, MATARAZZO B, SLOWINSKI R. Rough approximation of a preference relation by dominance relations[J]. European journal of operational research, 1999, 117(1): 63-83.
[5] WU W Z, LEUNG Y. Theory and applications of granular labelled partitions in multi-scale decision tables[J]. Information sciences, 2011, 181(18): 3878-3897.
[6] WU W Z, LEUNG Y. Optimal scale selection for multi-scale decision tables[J]. International journal of approximate reasoning, 2013, 54(8): 1107-1129.
[7] 張清華, 張雪秋, 龐國(guó)弘. 多尺度決策系統(tǒng)中代價(jià)敏感的最優(yōu)尺度組合[J]. 控制與決策, 2021, 36(10): 2369-2378.
ZHANG Q H, ZHANG X Q, PANG G H. Cost-sensitive optimal scale combination in multi-scale decision systems[J]. Control and decision, 2021, 36(10): 2369-2378.
[8] XU Y H, WU W Z, TAN A H. Optimal scale selections in consistent generalized multi-scale decision tables[C]∥International Joint Conference on Rough Sets. Cham: Springer International Publishing, 2017: 185-198.
[9] ZHU Y J, YANG B. Optimal scale combination selection for inconsistent multi-scale decision tables[J]. Soft computing, 2022, 26(13): 6119-6129.
[10]BAO H, WU W Z, ZHENG J W, et al. Entropy based optimal scale combination selection for generalized multi-scale information tables[J].International journal of machine learning and cybernetics, 2021, 12(5): 1427-1437.
[11]WU W Z, QIAN Y H, LI T J, et al. On rule acquisition in incomplete multi-scale decision tables[J]. Information sciences, 2017, 378: 282-302.
[12]LI F, HU B Q. A new approach of optimal scale selection to multi-scale decision tables[J]. Information sciences, 2017, 381: 193-208.
[13]HUANG Z H, LI J J, DAI W Z, et al. Generalized multi-scale decision tables with multi-scale decision attributes[J]. International journal of approximate reasoning, 2019, 115: 194-208.
[14]WU W Z, NIU D R, LI J H, et al. Rule acquisition in generalized multi-scale information systems with multi-scale decisions[J]. International journal of approximate reasoning, 2023, 154: 56-71.
[15]張嘉茹, 吳偉志, 楊燁. 協(xié)調(diào)廣義決策多尺度序信息系統(tǒng)的知識(shí)獲?。跩]. 模式識(shí)別與人工智能, 2022, 35(9):789-804.
ZHANG J R, WU W Z, YANG Y. Knowledge acquisition for consistent generalized decision multi-scale ordered information systems[J]. Pattern recognition and artificial intelligence, 2022, 35(9):789-804.
[16]楊燁, 吳偉志, 張嘉茹. 不協(xié)調(diào)廣義決策多尺度序信息系統(tǒng)的最優(yōu)尺度選擇與規(guī)則提?。跩]. 計(jì)算機(jī)科學(xué), 2023, 50(6): 131-141.
YANG Y, WU W Z, ZHANG J R. Optimal scale selection and rule acquisition in inconsistent generalized decision multi-scale ordered information systems[J]. Computer science, 2023, 50(6): 131-141.
[17]DEMBCZYN′SKI K, GRECO S, KOTOWSKI W, et al. Quality of rough approximation in multi-criteria classification problems[M]∥Rough Sets and Current Trends in Computing. Berlin: Springer Press, 2006: 318-327.
[18]DEMBCZYNSKI K, GRECO S, SOWIN′SKI R. Second-order rough approximations in multi-criteria classification with imprecise evaluations and assignments[M]∥Lecture Notes in Computer Science. Berlin: Springer Press, 2005: 54-63.
[19]楊蕾, 張曉燕, 徐偉華. 序決策信息系統(tǒng)中基于差別信息樹(shù)的分配約簡(jiǎn)[J]. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版), 2019, 51(2):84-89.
YANG L, ZHANG X Y, XU W H. Assignment reduction based on discernibility information tree in ordered decision information systems[J]. Journal of Zhengzhou university (natural science edition), 2019, 51(2):84-89.
[20]GRECO S, MATARAZZO B, SLOWINSKI R. Rough approximation by dominance relations[J]. International journal of intelligent systems, 2002, 17(2): 153-171.