張騰飛,魏立力
寧夏大學(xué)數(shù)學(xué)計(jì)算機(jī)學(xué)院,寧夏銀川 750021
集中有序集值信息系統(tǒng)
張騰飛,魏立力
寧夏大學(xué)數(shù)學(xué)計(jì)算機(jī)學(xué)院,寧夏銀川 750021
集值信息系統(tǒng)是完備信息系統(tǒng)的一種推廣,按照語義可劃分為合取集值信息系統(tǒng)和析取集值信息系統(tǒng)。屬性偏好關(guān)系也有兩種:屬性遞增偏好有序和屬性遞減偏好有序。提出一種新的屬性偏好關(guān)系,建立了一種新的優(yōu)勢(shì)關(guān)系。這種優(yōu)勢(shì)關(guān)系能夠表示一類屬性偏好既不是遞增有序也不是遞減有序,而是趨近于某個(gè)標(biāo)準(zhǔn)值的情形,稱這樣的優(yōu)勢(shì)關(guān)系為屬性集中有序,它可應(yīng)用于某些集值信息系統(tǒng)。
集值信息系統(tǒng);集中有序;屬性標(biāo)準(zhǔn)值;優(yōu)勢(shì)關(guān)系
粗糙集理論[1-3]是由波蘭學(xué)者Paw lak于1982年首先提出的,它是一種刻劃不完整性和不確定性的數(shù)學(xué)工具,能比較有效地分析不完整、不相容、不精確等信息系統(tǒng),并發(fā)現(xiàn)其中隱含的知識(shí),揭示潛在的規(guī)律。經(jīng)典的粗糙集理論以不可分辨關(guān)系(等價(jià)關(guān)系)為基礎(chǔ),其研究對(duì)象是完備信息系統(tǒng),即所處理的信息系統(tǒng)中每個(gè)對(duì)象的所有屬性值都是已知的。當(dāng)某個(gè)信息系統(tǒng)中的某些屬性的值未知,即數(shù)據(jù)是丟失的,或者是只知道部分?jǐn)?shù)據(jù),我們稱這樣的信息系統(tǒng)為不完備信息系統(tǒng)[4-7],在許多實(shí)際問題中,信息系統(tǒng)往往是不完備的,研究不完備信息系統(tǒng)[8]的策略之一是將不完備信息系統(tǒng)轉(zhuǎn)化為集值信息系統(tǒng)來處理。
Greco等人[9-11]提出了基于優(yōu)勢(shì)關(guān)系的粗糙集模型,該模型把經(jīng)典的等價(jià)關(guān)系推廣到具有偏好的優(yōu)勢(shì)關(guān)系,為解決具有偏好信息的多屬性決策問題提供了思路。Qian等人[12-13]提出了集值有序信息系統(tǒng)模型,用來處理屬性偏好有序且屬性取值為集值的情況。對(duì)于集值信息系統(tǒng)語義上的理解有多種,Guan和Wang[14]將其歸結(jié)為兩類:
第一類:合取集值信息系統(tǒng)。在這類系統(tǒng)中,對(duì)象在屬性集值中的取值是合取的,即對(duì)象可以取到屬性值中的所有值。例如,屬性a表示屬性“會(huì)講一種語言”,對(duì)象x在屬性a下的取值f(x)={英語,法語,德語}可以理解為對(duì)象x會(huì)講英語、法語和德語三種語言。
第二類:析取集值信息系統(tǒng)。在這類系統(tǒng)中,對(duì)象在屬性集值中的取值是析取的,即只能取到屬性集值中的某一個(gè)值。例如,屬性a表示屬性“會(huì)講一種語言”,對(duì)象x在屬性a下的取值f(x)={英語,法語,德語}可以理解為對(duì)象x會(huì)講英語、法語和德語三種語言中的某一種語言。
對(duì)于具有未知屬性值的不完備信息系統(tǒng)可看作是析取集值信息系統(tǒng),也可看作合取集值信息系統(tǒng),這要視情況具體分析。在實(shí)際應(yīng)用中,集值信息系統(tǒng)中屬性往往含有偏好信息,從而導(dǎo)致對(duì)象之間往往存在優(yōu)劣關(guān)系,因此,研究具有二元偏好關(guān)系的集值信息系統(tǒng)是具有重要意義的。
目前,針對(duì)偏好信息的處理主要從兩個(gè)方面來定義了優(yōu)勢(shì)關(guān)系:一是數(shù)值越大越好(遞增偏好有序);二是數(shù)值越小越好(遞減偏好有序)。然而,這兩種定義方法并不能處理一些實(shí)際問題。例如,對(duì)病人進(jìn)行健康診斷時(shí),對(duì)于體溫這一指標(biāo),不是越高越好,也不是越低越好,而是越接近人的正常體溫越好。因此,有必要提出一種新的優(yōu)勢(shì)關(guān)系定義方法。本文針對(duì)這種情況,提出了一種特殊的屬性偏好關(guān)系,建立了一種新的優(yōu)勢(shì)關(guān)系,這種優(yōu)勢(shì)關(guān)系能夠解決一類屬性偏好既不是遞增有序也不是遞減有序,而是屬性值趨向于標(biāo)準(zhǔn)屬性值的問題,稱之為屬性集中有序。
本部分引入的定義出自文獻(xiàn)[12-13,15],現(xiàn)羅列如下。
定義1(集值信息系統(tǒng))稱S=(U,A,V,f)是集值信息系統(tǒng),其中,U={x1,x2,…,xn}為非空有限對(duì)象集合,也稱為論域,A={a1,a2,…,am}為非空有限的屬性集合,V=∪a∈AVa是屬性值的集合,Va表示屬性a∈A的值域,f:U×A→2V是一個(gè)集值映射,滿足| |f(x,a)≥1(對(duì)于?x∈U,a∈A),其中|·|表示集合中元素的個(gè)數(shù)。
對(duì)于集值信息系統(tǒng)語義上的理解有多種,Guan和Wang將其歸結(jié)為合取集值信息系統(tǒng)和析取集值信息系統(tǒng)兩類,在引言中已經(jīng)討論過,這里不再贅述。
定義2(有序信息系統(tǒng))給定信息系統(tǒng)S=(U,A,V,f),若信息系統(tǒng)S中所有的條件屬性都是遞增或遞減偏好有序,則稱信息系統(tǒng)S為有序信息系統(tǒng)。
表示在屬性a∈A下,y至少和x一樣好。下面將在數(shù)值域中考慮偏好屬性的序關(guān)系,即Va?N(其中N表示數(shù)值),則?f(y,a)≥f(x,a)(條件偏好屬性a遞增有序)或?f(y,a)≤f(x,a)(條件偏好屬性a遞減有序)。
定義3(優(yōu)勢(shì)關(guān)系和優(yōu)勢(shì)類)給定有序信息系統(tǒng)S=(U,A,V,f),屬性子集B(B?A),優(yōu)勢(shì)關(guān)系定義為:
若屬性子集B=B1∪B2,其中,屬性子集B1中的偏好關(guān)系遞增有序,屬性子集B2中的偏好屬性遞減有序,則優(yōu)勢(shì)類的定義為:
定義4(析取集值有序信息系統(tǒng))給定集值信息系統(tǒng)S=(U,A,V,f),對(duì)于任意的x∈U和任意的a∈A,若對(duì)象x在屬性值f(x,a)中的取值都是析取的,即只能取到屬性集值中的某一個(gè)值,則稱S為析取集值信息系統(tǒng)。若在析取集值信息系統(tǒng)S中進(jìn)行決策規(guī)則獲取時(shí),總要考慮對(duì)象間的優(yōu)勢(shì)關(guān)系,則稱S為析取集值有序信息系統(tǒng)。
顯然,析取集值有序信息系統(tǒng)是同時(shí)滿足析取集值信息系統(tǒng)和有序信息系統(tǒng)定義的一種特殊的信息系統(tǒng)。
定義5(合取集值有序信息系統(tǒng))給定集值信息系統(tǒng)S=(U,A,V,f),對(duì)于任意的x∈U和任意的a∈A,若對(duì)象x在屬性值f(x,a)中的取值都是合取的,即要取到屬性集值中的每一個(gè)值,則稱S為合取集值信息系統(tǒng)。若在合取集值信息系統(tǒng)S中進(jìn)行決策規(guī)則獲取時(shí),我們也總要考慮對(duì)象間的優(yōu)勢(shì)關(guān)系,則稱S為合取集值有序信息系統(tǒng)。
顯然,合取集值有序信息系統(tǒng)是同時(shí)滿足合取集值信息系統(tǒng)和有序信息系統(tǒng)定義的一種特殊的信息系統(tǒng)。
對(duì)象在屬性下的最優(yōu)值叫做屬性標(biāo)準(zhǔn)值,某一屬性a的屬性標(biāo)準(zhǔn)值用Ma表示,高于或低于屬性標(biāo)準(zhǔn)值的值都不是最優(yōu)的。例如,若屬性a表示“人的體溫指標(biāo)”,那么Ma就表示人體溫的標(biāo)準(zhǔn)值,也即是人的正常體溫,高于或低于正常體溫的溫度都不是最優(yōu)的。
在集值信息系統(tǒng)S=(U,A,V,f)中,Va表示屬性a∈A的值域,易知屬性a的標(biāo)準(zhǔn)值Ma∈Va。非空有限的屬性集合A={a1,a2,…,am},其中a1,a2,…,am的屬性標(biāo)準(zhǔn)值分別為Ma1,Ma2,…,Mam,可以用MA={Ma1,Ma2,…,Mam},表示屬性標(biāo)準(zhǔn)值集。
3.1 集中有序的完備信息系統(tǒng)
定義6(完備信息系統(tǒng)的屬性集中有序)在完備信息系統(tǒng)S=(U,A,V,f)中,Va表示屬性a的值域,Ma表示屬性a的標(biāo)準(zhǔn)值,Ma∈Va。對(duì)于對(duì)象x,y∈U,在屬性a下的取值分別為f(x,a)∈Va、f(y,a)∈Va,若滿足
則稱在屬性a∈A下,y至少和x一樣好,稱屬性a集中有序。
這里的集中有序就是屬性值無論從左側(cè)還是右側(cè),越靠近屬性標(biāo)準(zhǔn)值的對(duì)象就越有優(yōu)勢(shì)。屬性集中有序是區(qū)別于屬性遞增有序和屬性遞減有序的一種特殊的有序關(guān)系。滿足集中有序的條件屬性,也稱之為具有偏好關(guān)系的屬性。
用表示在屬性a∈A下,y優(yōu)于x,也即y至少和x一樣好。那么定義6可用下式描述。
定義7給定集中有序完備信息系統(tǒng)S=(U,A,V,f),屬性子集B(B?A),優(yōu)勢(shì)關(guān)系定義為:
對(duì)象x的優(yōu)勢(shì)類相應(yīng)地為:
例1表1所示的為一個(gè)完備信息系統(tǒng),其中對(duì)象集U={x1,x2,…,x10},屬性集A={a1,a2,a3,a4},屬性集A中的偏好屬性集中有序,屬性值域Va1=Va2=Va3=Va4= {1,2,3,4,5},屬性標(biāo)準(zhǔn)值Ma1=Ma2=Ma3=Ma4=3。
表1 一個(gè)完備信息系統(tǒng)
則信息系統(tǒng)在優(yōu)勢(shì)關(guān)系下的優(yōu)勢(shì)類分別為:
定理1給定集中有序完備信息系統(tǒng)S=(U,A,V,f),屬性子集B(B?A),則
(1)滿足自反性、傳遞性;
證明(1)和(2)可以由優(yōu)勢(shì)關(guān)系和優(yōu)勢(shì)類的定義直接得到。
3.2 集中有序的析取集值信息系統(tǒng)
則稱在屬性a∈A下,y至少和x一樣好,稱屬性a集中有序。
用表示在屬性a∈A下,y優(yōu)于x,也即y至少和x一樣好。那么定義8可用下式描述。
注:Va表示屬性a∈A的值域,把Va中每個(gè)值與屬性標(biāo)準(zhǔn)值Ma相減后取絕對(duì)值,把所得值的集合表示為Wa。對(duì)于兩個(gè)對(duì)象x,y∈U,在屬性a∈A之下,他們有各自的屬性值域和,同時(shí)也有各自的和,那么,定義8也可用下式表示。
例2表2所示的為一個(gè)析取集值信息系統(tǒng),其中對(duì)象集U={x1,x2,…,x10},屬性集A={a1,a2,a3,a4},屬性集A中的偏好屬性集中有序,屬性值域Va1=Va2=Va3=Va4= {1,2,3,4,5,6,7},屬性標(biāo)準(zhǔn)值Ma1=Ma2=Ma3=Ma4=4。
表2 一個(gè)析取集值信息系統(tǒng)
則信息系統(tǒng)在優(yōu)勢(shì)關(guān)系下的優(yōu)勢(shì)類分別為:
定理2給定析取集中有序集值信息系統(tǒng)S=(U,A,V,f),屬性子集B(B?A),則
證明(1)和(2)可以由優(yōu)勢(shì)關(guān)系和優(yōu)勢(shì)類的定義直接得到。
3.3 集中有序的合取集值信息系統(tǒng)
則稱在屬性a∈A下,y至少和x一樣好,稱屬性a集中有序。
用表示在屬性a∈A下,y優(yōu)于x,也即y至少和x一樣好。那么定義10可用下式描述。
定義11(優(yōu)勢(shì)關(guān)系和優(yōu)勢(shì)類給定合取集值有序信息系統(tǒng)S=(U,A,V,f),屬性子集B(B?A),優(yōu)勢(shì)關(guān)系定義為:
對(duì)象x的優(yōu)勢(shì)類相應(yīng)地為:
例3表3所示為一個(gè)合取集值信息系統(tǒng),其中對(duì)象集U={x1,x2,…,x10},屬性集A={a1,a2,a3,a4},屬性集A中的偏好屬性集中有序,屬性值域Va1=Va2=Va3=Va4= {1,2,3,4,5,6,7},屬性標(biāo)準(zhǔn)值Ma1=Ma2=Ma3=Ma4=4。
表3 一個(gè)合取集值信息系統(tǒng)
則各對(duì)象在優(yōu)勢(shì)關(guān)系下的優(yōu)勢(shì)類分別為:
定理3給定合取集中有序集值信息系統(tǒng)S=(U,A,V,f),屬性子集B(B?A),則
(1)滿足自反性、傳遞性;
證明(1)和(2)可以由優(yōu)勢(shì)關(guān)系和優(yōu)勢(shì)類的定義直接得到。
目前,針對(duì)偏好信息的處理主要從兩個(gè)方面來定義了優(yōu)勢(shì)關(guān)系:一是數(shù)值越大越好(遞增偏好有序);二是數(shù)值越小越好(遞減偏好有序)。然而,這兩種定義方法并不能表示某些情形。本文提出一種新的條件屬性偏好關(guān)系,建立了一種新的優(yōu)勢(shì)關(guān)系,這種優(yōu)勢(shì)關(guān)系能夠表示一類條件屬性偏好既不是遞增有序也不是遞減有序,而是趨近于某個(gè)標(biāo)準(zhǔn)值的情形。然后,把這種優(yōu)勢(shì)關(guān)系分別應(yīng)用于析取集值信息系統(tǒng)和合取集值信息系統(tǒng),基于這種優(yōu)勢(shì)關(guān)系,還可以進(jìn)一步研究對(duì)象排序、屬性約簡和決策分析等問題。
[1]Paw lak Z.Rough sets[J].International Journal of Computer and Information Science,1982,11(5):341-356.
[2]Paw lak Z.Rough sets theory and its applications to data analysis[J].Cybernetics and System,1998,29(2):661-688.
[3]Paw lak Z.Rough sets and intelligent data analysis[J].Information Science,2002,147(1):1-12.
[4]K rysckiew icz M.Rough set to incomplete information system[J].Information Sciences,1998,112(1):39-49.
[5]Stefanow ski J,Tsoukias A.Incomplete information tables and rough classification[J].Computational Intelligence,2001,17(10):545-566.
[6]Grzymala-busse J W.Charateristic relations for incomplete data:a generalization of the indiscernibility relation[C]//Transactions on Rough Sets VI,LNCS 3066. Berlin:Springer,2004:244-253.
[7]王國胤.Rough集理論在不完備信息系統(tǒng)中的擴(kuò)充[J].計(jì)算機(jī)研究與發(fā)展,2002,39(10):1238-1243.
[8]王國胤.Rough集理論與知識(shí)獲取[M].西安:西安交通大學(xué)出版社,2001.
[9]Greco S,Matarazzo B,Slow inski R.A new rough set approachto multicriteria and multiattribute classification[C]//Lecture Notes in Artificial Intelligence,1998,1424(1):60-67.
[10]Greco S,Matarazzo B,Slow inski R.Rough sets theory for multicriteria decision analysis[J].European Journal of Operational Research,2001,129(1):1-47.
[11]Greco S,Matarazzo B,Slow inski R.Rough sets methodology for sorting problem s in presence of multiple attributes and criteria[J].European Journal of Operational Research,2002,138(2):247-259.
[12]Qian Y H,Dang C D,Liang J Y,et al.Set-valued ordered information systems[J].Information Sciences,2009,179(16):2809-2832.
[13]Qian Y H,Dang C D,Liang J Y,et al.On dominance relations in disjunctive set-valued ordered information systems[J].International Journal of Information Technology and Decision Making,2010,9(1):9-33.
[14]Guan Y Y,Wang H K.Set-valued information systems[J]. Information Sciences,2006,176(17):2507-2525.
[15]張文修,梁怡,吳偉志.信息系統(tǒng)與知識(shí)發(fā)現(xiàn)[M].北京:科學(xué)出版社,2003.
ZHANG Tengfei,WEI Lili
College of Mathematics and Computer Science,Ningxia University,Yinchuan,Ningxia 750021,China
Set-valued information system is a promotion of complete information system.According to semantics,it can be divided into conjunctive set-valued information system and disjunctive set-valued information system.There are also two kinds of attribute preference relations:attribute increasing preference order and attribute decreasing preference order. This paper focuses on a new attribute preference relation and establishes a new dominance relation.This new dominance relation can represent a kind of attribute preference which is not the increasing preference order and not the decreasing preference order,but the condition attribute values tend to the standard values of attribute,such a dominance relation is called as attribute ordered concentration,it can be applied to some set-valued information system s.
set-valued information systems;ordered concentration;standard values of attribute;dominance relation
A
TP18
10.3778/j.issn.1002-8331.1209-0320
ZHANG Tengfei,WEI Lili.Set-valued in formation system s based on ordered concentration.Computer Engineering and Applications,2014,50(16):140-145.
國家自然科學(xué)基金(No.11261044);寧夏高等學(xué)??茖W(xué)技術(shù)研究項(xiàng)目。
張騰飛(1988—),男,碩士研究生,研究領(lǐng)域?yàn)閼?yīng)用統(tǒng)計(jì)與數(shù)據(jù)分析;魏立力(1965—),通訊作者,男,教授,研究方向?yàn)閼?yīng)用統(tǒng)計(jì)與數(shù)據(jù)分析、人工智能的數(shù)學(xué)基礎(chǔ)。E-mail:weill866@163.com
2012-09-27
2012-11-23
1002-8331(2014)16-0140-06
CNKI網(wǎng)絡(luò)優(yōu)先出版:2012-12-18,http://www.cnki.net/kcms/detail/11.2127.TP.20121218.1528.024.htm l