汪小燕, 郭云婷, 申元霞
(安徽工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽 馬鞍山 243032)
粗糙集理論[1]是Pawlak 等學(xué)者在1982年提出的處理不確定、不精確和不完全數(shù)據(jù)的一種新的數(shù)學(xué)工具,主要研究?jī)?nèi)容是屬性約簡(jiǎn)[2]和規(guī)則提取。多粒度粗糙集[3-6]作為一種新型的多視角數(shù)據(jù)分析方法,可以從多個(gè)粒度空間對(duì)目標(biāo)概念進(jìn)行近似逼近,使得邊界區(qū)域減少,目標(biāo)概念的表示精度得到提高,并且與其他處理不確定知識(shí)的理論結(jié)合,受到了學(xué)者們的廣泛關(guān)注。文獻(xiàn)[7]將多粒度粗糙集擴(kuò)展到變精度多粒度粗糙集,文獻(xiàn)[8]將其擴(kuò)展到程度多粒度粗糙集,文獻(xiàn)[9]將其擴(kuò)展到可變多粒度粗糙集,眾多學(xué)者更是從模糊關(guān)系[10]、不完備信息系統(tǒng)[11-13]、鄰域關(guān)系[14]、證據(jù)理論[15]等角度對(duì)多粒度粗糙集進(jìn)行了深入的擴(kuò)展,這些研究工作促進(jìn)了多粒度粗糙集理論和應(yīng)用的發(fā)展。文獻(xiàn)[16]提出了基于等價(jià)關(guān)系的精度與程度“邏輯或”粗糙集模型,融合了相對(duì)量化信息和絕對(duì)量化信息。文中針對(duì)不完備信息系統(tǒng),將精度與程度“邏輯或”粗糙集擴(kuò)展到基于限制容差關(guān)系的不完備信息系統(tǒng)中,融入多粒度思想,提出基于限制容差關(guān)系的變精度與程度“邏輯或”多粒度粗糙集,包括“邏輯或”樂觀多粒度粗糙集和“邏輯或”悲觀多粒度粗糙集,研究“邏輯或”樂觀、悲觀多粒度粗糙集的性質(zhì)和相互之間的關(guān)系,并通過實(shí)例分析和實(shí)驗(yàn)驗(yàn)證了模型及所提出理論的有效性。
限制容差關(guān)系是不完備信息系統(tǒng)中,用于對(duì)象分類的一種重要的二元關(guān)系,可以使分類更加合理。
定義1[17]假定不完備信息系統(tǒng)IS=〈U,AT,V,f〉及U 上定義的二元關(guān)系L(限制容差關(guān)系),對(duì)于A?AT,則
其中PA(x)={a|a∈A∧a(x)≠*}。
定義2[17]設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,對(duì)于?X?U,A?AT,X 在限制容差關(guān)系L(A)的下近似、上近似分別為
其中LA(x)是x 的限制容差類。
在不完備信息系統(tǒng)中,文獻(xiàn)[18]結(jié)合限制容差關(guān)系,提出樂觀多粒度粗糙集和悲觀多粒度粗糙集的下近似、上近似定義。
定義3[18]設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個(gè)屬性子集,?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的樂觀多粒度粗糙集下近似、上近似分別定義為
定義4[18]設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個(gè)屬性子集,?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的悲觀多粒度粗糙集下近似、上近似分別定義為
變精度粗糙集模型和程度粗糙集模型是兩類重要的粗糙集擴(kuò)展模型,其中精度反映了近似空間的相對(duì)量化信息,而程度則刻畫了近似空間的絕對(duì)量化信息。文獻(xiàn)[16]為了融合這兩種特性,提出精度與程度“邏輯或”粗糙集。
定義5[16]設(shè)信息系統(tǒng)S=〈U,AT〉,A?AT,k 為任意自然數(shù),β∈[0,0.5),?X?U,X 關(guān)于A 依精度1-β、程度k 的邏輯或下、上近似算子分別定義為
程度粗糙集存在當(dāng)[x]A∩X=?,|[x]A|-|[x]A∩X|≤k 可能成立,即的問題,現(xiàn)結(jié)合限制容差關(guān)系,在下近似中增加約束條件,構(gòu)建基于限制容差關(guān)系的變精度與程度“邏輯或”模型。
定義6設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個(gè)屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,在限制容差關(guān)系L(A)下,X 變精度與程度“邏輯或”粗糙集的下近似、上近似分別定義為
為了進(jìn)一步對(duì)多粒度粗糙集進(jìn)行拓展,在定義6 的基礎(chǔ)上,融入多粒度思想,提出變精度與程度“邏輯或”多粒度粗糙集模型。
定義7設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個(gè)屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的變精度與程度“邏輯或”樂觀多粒度粗糙集下近似、上近似分別定義為
定義8設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個(gè)屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的變精度與程度“邏輯或”悲觀多粒度粗糙集下近似、上近似分別定義為
說明在基于限制容差關(guān)系的變精度與程度“邏輯或”樂觀多粒度粗糙集中,要求對(duì)象至少有一個(gè)粒度層次上的限制容差類滿足c(LAi(x),X)≤β∨(|LAi(x)-X|≤k∧LAi(x)∩X≠?),則定義為其下近似。在基于限制容差關(guān)系的變精度與程度“邏輯或”悲觀多粒度粗糙集中,要求對(duì)象所有粒度層次上的限制容差類滿足c(LAi(x),X)≤β∨(|LAi(x)-X|≤k∧LAi(x)∩X≠?),則定義為其下近似。
定理1設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個(gè)屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的變精度與程度“邏輯或”樂觀多粒度粗糙集有如下性質(zhì):
(2)k1、k2為任意自然數(shù),β1、β2∈[0,0.5),若k1≤k2、β1≤β2,則
綜上所述,在建筑工程項(xiàng)目的設(shè)計(jì)過程中運(yùn)用BIM技術(shù),可以有效縮短工期,從而減少施工成本。同時(shí)還會(huì)促進(jìn)建筑設(shè)計(jì)企業(yè)工作水平的不斷上升,從而在保證建筑設(shè)計(jì)企業(yè)經(jīng)濟(jì)效益的同時(shí)獲得社會(huì)效益,保證其可持續(xù)性發(fā)展。
證明
(1)?X?U,?Ai∈A,由于LAi(x)?U,故有c(LAi(x),U)=0,從而對(duì)于β∈[0,0.5),顯然有c(LAi(x),U)≤β 成立?;蛘遼LAi(x)-U|=0,從而對(duì)于任意自然數(shù)k,顯然有|LAi(x)-U|≤k∧LAi(x)∩U≠? 成立,因此,
又由于k1≤k2、β1≤β2,從而c(LAi(x),X)≤β2∨(|LAi(x)-X|≤k2∧LAi(x)∩X≠?),因此,即有由定義7 得,
若c(LAi(x),X)≤β 成立,則若|LAi(x)-X|≤0 成立,則必有LAi(x)?X,此時(shí)c(LAi(x),X)=0,從而對(duì)于β∈[0,0.5),顯然c(LAi(x),X)≤β 成立,則因此,反之,若則至少存在某個(gè)Ai∈{A1,A2,…,Am},使得c(LAi(x),X)≤β,由定義7 知即有所以綜合有由定義7 知,又由第一部分結(jié)論知故有
若c(LAi(x),X)≤0 成立,此時(shí)|LAi(x)|-|LAi(x)∩X|≤0,從而對(duì)于任意自然數(shù)k,顯然|LAi(x)|-|LAi(x)∩X|≤k,則若|LAi(x)-X|≤k 成立,又因?yàn)長Ai(x)∩X≠?,顯然|LAi(x)|-|LAi(x)∩X|≤k, 則因此,反之,若則至少存在某個(gè)Ai∈{A1,A2,…,Am},使得|LAi(x)|-|LAi(x)∩X|≤k,又因?yàn)長Ai(x)∩X≠?,故|LAi(x)-X|≤k,從而由定義7 可知即有所以綜合有由定義7 可知,又由第一部分結(jié)論知故有
定理2設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個(gè)屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的變精度與程度“邏輯或”悲觀多粒度粗糙集有如下性質(zhì):
(2)k1、k2為任意自然數(shù),β1、β2∈[0,0.5),若k1≤k2、β1≤β2,則
定理2 的證明類似于定理1 的證明。
定理1 性質(zhì)(3)和定理2 性質(zhì)(3)說明,當(dāng)k=0,變精度與程度“邏輯或”樂(悲)觀多粒度粗糙集就退化為變精度樂(悲)觀多粒度粗糙集。定理1 性質(zhì)(4)和定理2 性質(zhì)(4)說明,當(dāng)β=0,變精度與程度“邏輯或”樂(悲)觀多粒度粗糙集就退化為程度樂(悲)觀多粒度粗糙集。
定理3設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個(gè)屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,則變精度與程度“邏輯或”樂觀和悲觀多粒度粗糙集的關(guān)系如下:
證明由定義7 和定義8 可證。
設(shè)不完備決策系統(tǒng)IS=〈U,AT,V,f〉,其中對(duì)象集U={x1,x2,…,x8},條件屬性AT={c1,c2,c3,c4},d 為決策屬性,取β=0.3,k=1。。
由表1[4]知U/IND(syggg00)={D1,D2},其中D1={x1,x3,x4,x6},D2={x2,x5,x7,x8},設(shè)決策信息系統(tǒng)的屬性子集族如下
表1 不完備決策系統(tǒng)
分別計(jì)算出變精度與程度“邏輯或”樂觀多粒度粗糙集、變精度與程度“邏輯或”悲觀多粒度粗糙集的下近似和上近似:
(1)決策類D1的下近似和上近似分別為
(2)決策類D2的下近似和上近似分別為
由計(jì)算結(jié)果知以下公式成立
同理,對(duì)D2也有以上公式成立。
為了驗(yàn)證基于限制容差關(guān)系的變精度與程度“邏輯或”多粒度粗糙集的性質(zhì),選用UCI 機(jī)器學(xué)習(xí)數(shù)據(jù)集上Zoo 和Tic-tac-toe (http:// archive.Ics.uci.edu/ml/machine-learning-databases/) 進(jìn)行仿真實(shí)驗(yàn),數(shù)據(jù)描述見表2。
首先對(duì)數(shù)據(jù)處理,使該系統(tǒng)存在缺失值,根據(jù)決策屬性將Zoo 分為7 個(gè)決策類D1,D2,D3,D4,D5,D6,D7。文中選取屬性集合A={A1,A2,A3},令第1~6 個(gè)屬性為A1,第6~11 個(gè)屬性為A2,第11~16 個(gè)屬性為A3,在β=0.3,k=1 的前提下,分別計(jì)算變精度與程度“邏輯或”樂觀多粒度粗糙集、變精度與程度“邏輯或”悲觀多粒度粗糙集的下、上近似的樣本個(gè)數(shù),見表3。類似可得Tic-tac-toe 的結(jié)果,見表4。
表2 數(shù)據(jù)描述
表3 Zoo數(shù)據(jù)集上的結(jié)果
表4 Tic-tac-toe 數(shù)據(jù)集上的結(jié)果
在Zoo數(shù)據(jù)集上有7 個(gè)決策類,對(duì)于每個(gè)決策類,從表3 中可以看出,變精度與程度“邏輯或”悲觀多粒度粗糙集下近似對(duì)象個(gè)數(shù)都少于變精度與程度“邏輯或”樂觀多粒度粗糙集下近似對(duì)象個(gè)數(shù)。而變精度與程度“邏輯或”悲觀多粒度粗糙集上近似對(duì)象個(gè)數(shù)都多于變精度與程度“邏輯或”樂觀多粒度粗糙集上近似對(duì)象個(gè)數(shù),在表4 中Tic-tac-toe 數(shù)據(jù)集上也同樣存在這樣的結(jié)論。實(shí)驗(yàn)結(jié)果表明,變精度與程度“邏輯或”樂觀多粒度粗糙集和變精度與程度“邏輯或”悲觀多粒度粗糙集的上、下近似之間存在包含關(guān)系,從實(shí)驗(yàn)角度驗(yàn)證了定理的正確性。
從精度與程度“邏輯或”的角度出發(fā),基于限制容差關(guān)系提出變精度與程度“邏輯或”樂觀多粒度、變精度與程度“邏輯或”悲觀多粒度粗糙集模型。該模型可通過調(diào)節(jié)閾值β、k,使分類更加準(zhǔn)確。接下來的工作將研究變精度與程度“邏輯或”多粒度粗糙集的約簡(jiǎn)和決策規(guī)則的獲取等問題。