国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

鄰域概率粗糙集的不確定性度量

2021-01-03 10:05周艷紅莫智文
關(guān)鍵詞:粗糙集鄰域度量

周艷紅, 張 迪, 莫智文

(1.中國(guó)民用航空飛行學(xué)院 計(jì)算機(jī)學(xué)院,四川 廣漢618307; 2.四川師范大學(xué) 智能信息與量子信息研究所,四川 成都610066)

粗糙集理論作為一種數(shù)據(jù)分析處理的理論[1],在知識(shí)獲取、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等領(lǐng)域有廣泛應(yīng)用[2].在粗糙集理論中,不確定性度量是描述系統(tǒng)分類(lèi)能力的重要依據(jù),對(duì)此很多學(xué)者進(jìn)行了相關(guān)研究[3-6].Pawlak[3]提出3 種不確定性度量,即精度、粗糙度和近似精度;文獻(xiàn)[4]通過(guò)引入知識(shí)粒度,提出基于知識(shí)粒度的精度、粗糙度和近似精度;文獻(xiàn)[5]研究了關(guān)于粒的不確定性度量及其關(guān)系;文獻(xiàn)[6]在概率粗糙集模型中揭示了3 種經(jīng)典不確定性度量(即精度、粗糙度和近似精度)的局限性,提出基于期望粒度的3 種單調(diào)不確定性度量,為屬性約簡(jiǎn)奠定良好的基礎(chǔ).

經(jīng)典粗糙集主要采用等價(jià)關(guān)系和等價(jià)類(lèi),在應(yīng)用時(shí)需要對(duì)相關(guān)的數(shù)值數(shù)據(jù)進(jìn)行離散化,具有局限性.為此,文獻(xiàn)[7]提出比等價(jià)關(guān)系更為通用的鄰域關(guān)系,并廣泛應(yīng)用于不確定性數(shù)據(jù)的特征提取、屬性約簡(jiǎn)等[8-13].在鄰域系統(tǒng)中,不確定性度量對(duì)屬性約簡(jiǎn)具有重要作用.文獻(xiàn)[8]提出鄰域熵、信息粒、基于鄰域熵的近似精度等多種不確定性度量,并研究其相關(guān)性質(zhì);文獻(xiàn)[9]在鄰域粗糙集中提出鄰域精度、粗糙度及近似精度.

由于經(jīng)典的鄰域粗糙集模型對(duì)噪聲的容忍性相對(duì)較差,為此,主要對(duì)鄰域粗糙集模型進(jìn)行擴(kuò)展.首先,通過(guò)引入2 個(gè)閥值,構(gòu)造出鄰域概率粗糙集模型,提出3 種不確定性度量;再次,將鄰域概率粗糙集和鄰域粗糙集相結(jié)合,提出3 種改進(jìn)的不確定性度量.

1 鄰域粗糙集

主要介紹鄰域粗糙集中一些基本的概念[8,10,14].設(shè)NIS=(U,C,V,f,δ)是一個(gè)信息系統(tǒng),其中,U={xi|i=1,…,n}為非空有限集;C是非空屬性集;V為所有屬性的值域,即表示屬性c所有可能取值的集合);δ∈[0,1]為鄰域參數(shù).定義NDS=(U,C∪D,V,f,δ)是鄰域決策信息系統(tǒng),其中C和D分別表示系統(tǒng)的條件屬性和決策屬性.U/D={X1,X2,…,Xm}是決策屬性D在U上的一個(gè)等價(jià)類(lèi).

關(guān)于屬性子集A={a1,a2,…,a|A|}的距離函數(shù)為

其中,q=1 時(shí),dA(x,y)為Manhattan距離;q=2 時(shí),為Euclidean 距離;q=∞時(shí),為Chebychev 距離.本文采用Manhattan距離.由dA和δ產(chǎn)生鄰域(類(lèi))為

鄰域關(guān)系為

2 鄰域概率粗糙集的不確定性度量

在鄰域粗糙集基礎(chǔ)上,本節(jié)通過(guò)引入2 個(gè)閥值,提出鄰域概率粗糙集模型,并逐步構(gòu)建出3 種改進(jìn)的不確定性度量.

2.1 3 種鄰域概率不確定性度量及其單調(diào)性通過(guò)引入2 個(gè)閥值,提出鄰域概率粗糙集模型,定義3種不確定性度量,即鄰域概率精度、粗糙度和近似精度,并研究這3 種不確定性度量的單調(diào)性.

定義2 在NIS中,0≤β <α≤1,A?C,X?U,則X關(guān)于A的鄰域概率下、上近似為:

在NDS中,A?C,U/D={X1,X2,…,Xm},則U/D關(guān)于A的鄰域概率下、上近似為:

定義3在NIS中,0≤β <α≤1,A?C,X?U,則X關(guān)于A的鄰域概率精度和粗糙度分別為:

定義4在NDS中,0≤β <α≤1,A?C,則U/D關(guān)于A的鄰域概率近似精度為

定義3 和定義4 根據(jù)鄰域概率上、下近似給出了鄰域概率精度、粗糙度和近似精度的概念.

對(duì)比文獻(xiàn)[6]中概率粗糙集中的概率精度、粗糙度和近似精度,本節(jié)所定義的鄰域概率粗糙集中的概率精度、粗糙度和近似精度更具有一般性,即推論1.

推論1NIS中,若δ=0 時(shí),則有:

推論1 表明在δ =0 時(shí),鄰域概率粗糙集退化為概率粗糙集,即鄰域概率粗糙集是概率粗糙集的推廣,更具有一般化.

下面主要通過(guò)例1 討論其單調(diào)性.

例1設(shè)NDS=(U,C∪D,V,f,δ)如表1.

表1 例1 決策表Tab. 1 Decision table of Example 1

表1 中,U={x1,x2…,x6},C={a1,a2,a3},U/D={X1,X2}={{x1,x4,x6},{x2,x3,x5}},α =0.4,β=0.3,δ=0.4.

選取B={a1},A={a1,a2}和C={a1,a2,a3}.首先計(jì)算A所對(duì)應(yīng)的鄰域類(lèi),即

表2 例1 中粒度粗化過(guò)程中的鄰域類(lèi)Tab. 2 Neighborhood classes during granularity coarsening in Example 1

根據(jù)表2,由定義3 和4 分別計(jì)算出鄰域概率精度、粗糙度和近似精度所對(duì)應(yīng)的值,結(jié)果如下:

從例1 中說(shuō)明鄰域概率精度、粗糙度和近似精度不具備單調(diào)性,即

1)在NIS中,0≤β <α≤1,B?A?C,X?U,下列結(jié)論不成立:

2)在NIS中,0≤β <α≤1,B?A?C,X?U,下列結(jié)論不成立:

由于例1 中所涉及的粗化過(guò)程較少,鄰域概率近似精度的非單調(diào)性并未完全體現(xiàn),其結(jié)果將會(huì)在UCI數(shù)據(jù)實(shí)驗(yàn)中充分體現(xiàn).

2.2 3 種改進(jìn)鄰域概率不確定性度量及其單調(diào)性在粗化過(guò)程中,由于鄰域概率粗糙集中的上下近似不具備單調(diào)性.因此,鄰域概率粗糙集中的精度、粗糙度和近似精度也不具備單調(diào)性,進(jìn)而需要對(duì)鄰域概率精度、粗糙度和近似精度進(jìn)行改進(jìn),使其滿(mǎn)足粒化單調(diào)性,即為改進(jìn)的鄰域概率精度、粗糙度和近似精度,并討論相關(guān)性質(zhì).下面通過(guò)結(jié)合鄰域粗糙集的上下近似,建設(shè)性地提出改進(jìn)的鄰域概率精度、粗糙度及近似精度,并對(duì)單調(diào)性進(jìn)行研究.

定義5在NIS中,0≤β <α≤1,A?C,X?U,則X關(guān)于A的改進(jìn)鄰域概率精度和粗糙度分別為:

定義6在NDS中,0≤β <α≤1,A?C,X?U,U/D={X1,…,Xm},則U/D關(guān)于A的改進(jìn)鄰域概率近似精度為

定義5 和定義6 將鄰域概率粗糙集和鄰域粗糙集相結(jié)合,分別提出了改進(jìn)的鄰域概率精度、粗糙度和近似精度的概念.下面主要討論其單調(diào)性.立,性質(zhì)3 說(shuō)明改進(jìn)的鄰域概率精度、粗糙度具有參數(shù)單調(diào)性.

由推論4 和推論5 看出,文獻(xiàn)[6]在概率粗糙集中所提出的概率精度、粗糙度和近似精度是改進(jìn)鄰域概率精度、粗糙度和近似精度的一種特例.

下面通過(guò)例2 對(duì)改進(jìn)鄰域概率精度、粗糙度和近似精度單調(diào)性進(jìn)行驗(yàn)證說(shuō)明.

例2利用定義5 和定義6,通過(guò)計(jì)算,其改進(jìn)的鄰域概率精度、粗糙度和近似精度的值如表3.

表3 3 種改進(jìn)鄰域概率不確定性度量的值Tab. 3 Values of three improved neighborhood probabilistic uncertainty measures

在粒度粗化過(guò)程中,3 種改進(jìn)的鄰域概率不確定性度量具有明確的單調(diào)性.例如,針對(duì)例1 選取的粗化過(guò)程“{a1,a2,a3}→{a1,a2}→{a1}”,改進(jìn)鄰域概率精度、粗糙度和近似精度分別表現(xiàn)為:

對(duì)比例1,改進(jìn)的鄰域概率精度、粗糙度和近似精度具有單調(diào)性,改良了鄰域概率粗糙集中鄰域概率精度、粗糙度和近似精度的非單調(diào)性.

3 UCI數(shù)據(jù)實(shí)驗(yàn)

主要選取2 種UCI數(shù)據(jù)進(jìn)行實(shí)驗(yàn),對(duì)本文所提出的鄰域概率精度、粗糙度和近似精度以及改進(jìn)的鄰域概率精度、粗糙度和近似精度的非單調(diào)性/單調(diào)性進(jìn)行比較分析.

數(shù)據(jù)實(shí)驗(yàn)包含2 組數(shù)據(jù),具體為:wdbc 數(shù)據(jù)集包含569 個(gè)對(duì)象,30 個(gè)條件屬性(只取前12 個(gè)),1個(gè)決策屬性(U/D={X1,X2}),取δ=0.3,α=0.4,β=0.3;sonar數(shù)據(jù)集包含208 個(gè)對(duì)象,60 個(gè)條件屬性(只取前11 個(gè)),1 個(gè)決策屬性(U/D={X1,X2}),取δ =0.05,α =0.4,β =0.3.實(shí)驗(yàn)結(jié)果如圖1 -10 所示.為方便,將鄰域概率精度、粗糙度和近似精度分別簡(jiǎn)記為PNA、PNR、PNAA以及改進(jìn)的鄰域概率精度、粗糙度和近似精度分別簡(jiǎn)記為MPNA、MPNR、MPNAA.

圖1 2 種鄰域概率精度(wdbc,δ=0.3,X1)Fig. 1 Two kinds of neighborhood probabilistic accuracies(wdbc,δ=0.3,X1)

圖2 2 種鄰域概率精度(wdbc,δ=0.3,X2)Fig. 2 Two kinds of neighborhood probabilistic accuracies(wdbc,δ=0.3,X2)

圖3 2 種鄰域概率粗糙度(wdbc,δ=0.3,X1)Fig. 3 Two kinds of neighborhood probabilistic roughnesses(wdbc,δ=0.3,X1)

圖4 2 種鄰域概率粗糙度(wdbc,δ=0.3,X2)Fig. 4 Two kinds of neighborhood probabilistic roughnesses(wdbc,δ=0.3,X2)

圖5 2 種鄰域概率近似精度(wdbc,δ=0.3,U/D)Fig. 5 Two kinds of neighborhood probabilistic approximation accuracies(wdbc,δ=0.3,U/D)

圖6 2 種鄰域概率近似精度(sonar,δ=0.05,U/D)Fig. 6 Two kinds of neighborhood probabilistic approximation accuracies(sonar,δ=0.05,U/D)

圖7 2 種鄰域概率精度(sonar,δ=0.05,X1)Fig. 7 Two kinds of neighborhood probabilistic accuracies(sonar,δ=0.05,X1)

圖8 2 種鄰域概率精度(sonar,δ=0.05,X2)Fig. 8 Two kinds of neighborhood probabilistic accuracies(sonar,δ=0.05,X2)

圖9 2 種鄰域概率粗糙度(sonar,δ=0.05,X1)Fig. 9 Two kinds of neighborhood probabilistic roughnesses(sonar,δ=0.05,X1)

圖10 2 種鄰域概率粗糙度(sonar,δ=0.05,X2)Fig. 10 Two kinds of neighborhood probabilistic roughnesses(sonar,δ=0.05,X2)

在wdbc 和sonar 中,從圖1、2 和圖7、8 看出,隨著屬性的增加,鄰域概率精度的值變化較平緩且具有非單調(diào)性,而改進(jìn)的鄰域概率精度變化明顯且具有良好的單調(diào)性.而圖3、4 和圖9、10 顯然體現(xiàn)出鄰域概率粗糙度具有非單調(diào)性,而改進(jìn)的鄰域概率粗糙度具有單調(diào)性.圖5、6 表明鄰域概率近似精度具有非單調(diào)性,而改進(jìn)的鄰域概率近似精度具有明顯的單調(diào)性.

4 結(jié)論

通過(guò)引入2 個(gè)閥值,提出鄰域概率粗糙集模型,利用上下近似定義3 種不確定性度量,即鄰域概率精度、粗糙度和近似精度;再將鄰域概率粗糙集與鄰域粗糙集相結(jié)合,提出3 種改進(jìn)的不確定性度量,即改進(jìn)的鄰域概率精度、粗糙度和近似精度,并討論其單調(diào)性.最后通過(guò)UCI數(shù)據(jù)實(shí)驗(yàn)對(duì)以上的不確定性度量的非單調(diào)性/單調(diào)性進(jìn)行有效性說(shuō)明.實(shí)驗(yàn)表明3 種改進(jìn)的不確定性度量具有良好的單調(diào)性,為后期的屬性約簡(jiǎn)研究奠定良好的基礎(chǔ).同時(shí)鄰域概率粗糙集也是概率粗糙集[6]的推廣.

致謝中國(guó)民用航空飛行學(xué)院面上項(xiàng)目(J2019-037)對(duì)本文給予了支助,謹(jǐn)致謝意.

猜你喜歡
粗糙集鄰域度量
粗糙集與包絡(luò)分析下艦船運(yùn)行數(shù)據(jù)聚類(lèi)算法
基于混合變鄰域的自動(dòng)化滴灌輪灌分組算法
鮑文慧《度量空間之一》
基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
五邑大學(xué)學(xué)報(bào)(自然科學(xué)版)(2019年3期)2019-09-06
突出知識(shí)本質(zhì) 關(guān)注知識(shí)結(jié)構(gòu)提升思維能力
尖銳特征曲面點(diǎn)云模型各向異性鄰域搜索
度 量
基于細(xì)節(jié)點(diǎn)鄰域信息的可撤銷(xiāo)指紋模板生成算法
一種基于粗糙集理論的社交網(wǎng)絡(luò)潛在路徑研究
关岭| 江陵县| 卓资县| 麻江县| 永春县| 墨玉县| 大埔县| 英山县| 精河县| 镇江市| 徐闻县| 清徐县| 湖南省| 保山市| 高台县| 凉山| 宣化县| 阿鲁科尔沁旗| 黔江区| 贵阳市| 八宿县| 乌恰县| 江油市| 茌平县| 巴林右旗| 泰兴市| 新闻| 和田市| 潍坊市| 青龙| 淮滨县| 塘沽区| 宜章县| 区。| 邯郸县| 陈巴尔虎旗| 宜川县| 金阳县| 永宁县| 额敏县| 白沙|