趙煥敏 馬利文
(北京郵電大學(xué)理學(xué)院,北京 100876)
覆蓋粗糙集理論作為Pawlak經(jīng)典粗糙集理論的一種推廣,在解決智能系統(tǒng)中的許多復(fù)雜問題方面得到應(yīng)用,有豐富的理論價(jià)值.越來越多的學(xué)者從不同的角度來研究粗糙集理論(如文獻(xiàn)[1-11]).在Pawlak經(jīng)典粗糙集理論和其他廣義粗糙集理論中,研究的核心內(nèi)容是空間中粗糙子集的上下近似,所以很多文獻(xiàn)中,定義和研究了覆蓋近似空間上各種不同的上下近似算子.本文從新的思路出發(fā),基于覆蓋近似空間上的一種等價(jià)關(guān)系,定義了一種新的近似空間:覆蓋近似空間的商近似空間.通過給定源空間中元素的鄰域和余鄰域的概念,定義了所研究商近似空間上的2對(duì)上下近似算子,并詳細(xì)介紹其具有的良好性質(zhì),結(jié)合文獻(xiàn)[12]中對(duì)商空間性質(zhì)的保持性的證明,給出一些例子作理解,為進(jìn)一步解決實(shí)際問題提供新的方法和理論支撐.
本節(jié)簡單介紹覆蓋粗糙集理論中的一些基礎(chǔ)概念及相關(guān)性質(zhì).
定義1[10]設(shè)U是一個(gè)有限集合,C是由U的非空子集構(gòu)成的集族且U=∪C∈CC,則稱集族C是集合U的一個(gè)覆蓋,且稱有序?qū)?U,C)是一個(gè)覆蓋近似空間.
設(shè)U是全集,對(duì)于U的每一個(gè)子集X,用-X表示它的余集.
定義2[2,9-10]設(shè)(U,C)是一個(gè)覆蓋近似空間.對(duì)于任一x∈U,稱
N(x)=∩{C∈C:x∈C},M(x)=-(∪{C∈C:x?C})
分別為元素x的鄰域和余鄰域.
明顯地,余鄰域的定義還可以表示為M(x)=∩{-C:(C∈C)∧(x?C)}.若對(duì)于任一C∈C,有x∈C,則規(guī)定M(x)=U.
定義3[3]設(shè)(U,C)是一個(gè)覆蓋近似空間,A?U,稱
N(A)=∪{N(x):x∈A},M(A)=∪{M(x):x∈A}
分別為集合A的鄰域和余鄰域.
命題1[2]設(shè)(U,C)是一個(gè)覆蓋近似空間,x,y∈U,則y∈N(x)當(dāng)且僅當(dāng)x∈M(y).
命題2[2,10]設(shè)(U,C)是一個(gè)覆蓋近似空間,則對(duì)于每一C∈C,有
命題3[2]鄰域算子N和余鄰域算子M都滿足傳遞性,即若x∈N(y)且y∈N(z),則x∈N(z);若x∈M(y)且y∈M(z),則x∈M(z).
定義4[2]對(duì)于覆蓋近似空間(U,C)的每一個(gè)子集A,定義A的下近似和上近似分別為:
命題4設(shè)(U,C)是一個(gè)覆蓋近似空間,則對(duì)于每一C∈C,有
本節(jié)定義了1個(gè)覆蓋近似空間上的商近似空間和此商近似空間中子集的2對(duì)上下近似.
定義5設(shè)(U,C)是1個(gè)覆蓋近似空間,R是U中的1個(gè)等價(jià)關(guān)系,則W=U/R是U在等價(jià)關(guān)系R下的1個(gè)商空間.令F={F?W:R-1(F)=N(R-1(F))},即集族F由商空間中原像是源空間中的鄰域或鄰域的并的集合構(gòu)成.容易驗(yàn)證,F(xiàn)是W的1個(gè)覆蓋,稱(W,F(xiàn))是源空間(U,C)在等價(jià)關(guān)系R下的商近似空間.
例1令U={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10},記C1={x1,x4},C2={x2,x3},C3={x1,x2,x3},C4={x4,x5,x6,x7},C5={x6,x7,x8,x9},C6={x4,x5,x6,x7,x10},則C={C1,C2,C3,C4,C5,C6}是U的1個(gè)覆蓋.對(duì)于覆蓋近似空間(U,C),若等價(jià)關(guān)系R誘導(dǎo)U上的一個(gè)劃分為y1={x1},y2={x2,x3,x4,x5},y3={x6,x7},y4={x8,x9},y5={x10},則對(duì)于W=U/R={y1,y2,y3,y4,y5},通過對(duì)元素鄰域的計(jì)算,得到F1={y1},F(xiàn)2={y2,y3},F(xiàn)3={y3},F(xiàn)4={y3,y4},F(xiàn)5={y2,y3,y5},則F={F1,F2,F3,F4,F5}是W的1個(gè)覆蓋且(W,F(xiàn))是源空間(U,C)的商近似空間.
定義6若(W,F(xiàn))是源空間(U,C)的商近似空間,則對(duì)于任一y∈W,稱
n(y)=∩{F∈F:y∈F},m(y)=∩{-F:(F∈F)∧(y?F)}
分別為元素y的商鄰域和商余鄰域.對(duì)于任一子集Y?W,稱
n(Y)=∪{n(y):y∈Y},m(Y)=∪{m(y):y∈Y}
分別為集合Y的商鄰域和商余鄰域.
例2考慮例1的源空間和商近似空間,取Y={y2,y3},通過計(jì)算得到n(Y)={y2,y3},m(Y)={y2,y3,y4,y5}.
容易驗(yàn)證,在下列性質(zhì)方面,商近似算子n、m與近似算子N、M相同.
命題5設(shè)(W,F(xiàn))是源空間(U,C)的商近似空間,則商鄰域算子n和商余鄰域算子m都滿足傳遞性,且對(duì)于任意y,z∈W,y∈n(z),當(dāng)且僅當(dāng)z∈m(y).
命題6設(shè)(W,F(xiàn))是源空間(U,C)的商近似空間,則對(duì)于任一F∈F,有F=n(F),-F=m(-F),R-1(-F)=M(R-1(-F)).
證明假設(shè)F∈F,n(F)=∪{n(y):y∈F},由雙包含關(guān)系得到F=n(F),對(duì)于第2個(gè)等式,很明顯,左包含-F?∪{m(y):y∈-F}成立,且對(duì)于任一y∈-F,有m(y)?-F成立,所以∪{m(y):y∈-F}?-F,故-F=∪{m(y):y∈-F}.
對(duì)于第3個(gè)等式,容易驗(yàn)證,R-1(-F)?∪{M(x):x∈R-1(-F)},只需要證明R-1(-F)?∪{M(x):x∈R-1(-F)}.若x∈R-1(-F)=-R-1(F)且M(x)R-1(-F),則存在元素z∈M(x)且z?R-1(-F)=-R-1(F),所以z∈R-1(F)并N(z)?R-1(F).根據(jù)命題1,對(duì)任意x,y∈U,y∈N(x)當(dāng)且僅當(dāng)x∈M(y),得到x∈N(z),所以x∈R-1(F),這與x∈R-1(-F)=-R-1(F)矛盾.這證明對(duì)任一x∈R-1(-F),有M(x)?R-1(-F),故R-1(-F)?∪{M(x):x∈R-1(-F)}.
下面定義商近似空間中子集的上下近似.
定義7設(shè)(W,F(xiàn))是源空間(U,C)的商近似空間且Y?W,定義子集Y的2對(duì)下近似和上近似分別為:
例3考慮例1的源空間和商近似空間,取Y1={y1,y2},Y2={y2,y3,y4},通過計(jì)算得到:
由定義5和命題6,容易驗(yàn)證命題8.
命題8設(shè)(W,F(xiàn))是源空間(U,C)的商近似空間,則對(duì)于任一F∈F,有:
基于此,命題9可以直接得到.
命題9設(shè)(W,F(xiàn))是源空間(U,C)的商近似空間,則對(duì)于任一F∈F,有:
下面討論商鄰域和商余鄰域在等價(jià)關(guān)系R下逆像的性質(zhì).
命題10設(shè)(W,F(xiàn))是源空間(U,C)在等價(jià)關(guān)系R下的商近似空間,則對(duì)于任一y∈W,有:
(1)R-1(n(y))=N(R-1(n(y)));
(2)R-1(m(y))=M(R-1(m(y))).
證明根據(jù)定義6和命題6,可以得到:
N(R-1(n(y)));
接下來,研究近似集在等價(jià)關(guān)系R下像和逆像的性質(zhì).
命題11設(shè)(W,F(xiàn))是源空間(U,C)在等價(jià)關(guān)系R下的商近似空間,則有:
(1)對(duì)于任一
同理,可以證得對(duì)于任一
舉1個(gè)例子說明上述性質(zhì)中的等號(hào)不成立.
令Y1={y3},Y2={y5},Y3=Y4={y2},則
R-1(Y1)={x6,x7},R-1(Y2)={x10},R-1(Y3)=R-1(Y4)={x2,x3,x4,x5}.
且下列各式成立:
在大數(shù)據(jù)分析和應(yīng)用中需對(duì)數(shù)據(jù)集進(jìn)行分類,把所有類作為新的元素進(jìn)行研究,這便是商空間.不僅減少了研究對(duì)象的數(shù)量,而且由于每類元素整體作為一個(gè)對(duì)象,使其共性得以保留,這點(diǎn)在文獻(xiàn)[12]中也被詳細(xì)證明.本文定義了1個(gè)覆蓋近似空間上的商近似空間,基于鄰域和余鄰域的概念對(duì)此商近似空間作出相關(guān)性質(zhì)的證明和研究.由于鄰域和余鄰域是近似空間中的點(diǎn)的基本描述元,代表點(diǎn)的性質(zhì)的基本單位,因而命題10充分說明了商近似空間很好地保留了源空間的鄰域與余鄰域所代表的性質(zhì).這也是商空間理論的初衷,對(duì)后面應(yīng)用新定義的商近似空間模型解決屬性約簡、決策規(guī)則發(fā)現(xiàn)等實(shí)際問題提供了重要理論基礎(chǔ).事實(shí)上,對(duì)覆蓋近似空間(U,C)的商空間W=U/R, 自然想到定義其覆蓋為G={R(C):C∈C},文獻(xiàn)[11]通過探究映射f所滿足的條件,對(duì)得到的映射空間做了初步分析.但由這樣定義覆蓋得到的鄰域{n(y):y∈W}與余鄰域{m(y):y∈W}不具有本文定義的商近似空間所具有的命題10.讀者可以利用例1的數(shù)據(jù)自行檢驗(yàn)這一點(diǎn).這便是本文所定義的商近似空間的優(yōu)越性所在.
命題11表明本文所定義的商近似空間中的上下近似與源空間的上下近似有一種確定的重要的關(guān)系,此性質(zhì)也是上述覆蓋G定義法不能具備的.這一點(diǎn)對(duì)算子的應(yīng)用是非常有益的,使得其上下近似的變化能被很好的把握,是放大還是縮小,對(duì)結(jié)合實(shí)例進(jìn)一步研究粗糙集提供了重要啟示.