駱公志,陳佳馨
(南京郵電大學(xué)管理學(xué)院,江蘇 南京210003)
信息時(shí)代的發(fā)展促使信息來源日益增多,數(shù)據(jù)形式也越來越復(fù)雜,因此有學(xué)者提出多源信息系統(tǒng)MsIS(Multi-source Information System)[1]的概念,以幫助決策者做出正確選擇。目前多源信息系統(tǒng)被廣泛應(yīng)用于粒計(jì)算[2]、深度學(xué)習(xí)[3]和風(fēng)險(xiǎn)評(píng)估[4]等領(lǐng)域,同時(shí)如何在多源信息系統(tǒng)中獲取有用的知識(shí)也成為研究熱點(diǎn)。
經(jīng)典粗糙集中的等價(jià)關(guān)系并不能有效處理存在多種屬性值的信息表,而覆蓋關(guān)系粗糙集彌補(bǔ)了這一缺陷[5]。之后,不斷有學(xué)者在此基礎(chǔ)上對(duì)覆蓋粗糙集進(jìn)行改進(jìn):Zhang等[6]通過建立基于覆蓋關(guān)系的直覺模糊粗糙集模型,深入探討了多屬性決策問題;Wang等[7]利用矩陣研究了覆蓋粗糙集中的最大描述和最小描述的相關(guān)問題;Han等[8]基于局部有限覆蓋近似空間,提出了H-粗糙集算子和K-拓?fù)浯植诩阕印?/p>
為分析有多粒度結(jié)構(gòu)的信息表,Qian等[9,10]構(gòu)造了多粒度粗糙集模型,并在此基礎(chǔ)上引入決策理論,提出了多粒度決策粗糙集的概念??紤]到?jīng)Q策過程中可能存在少數(shù)服從多數(shù)的情況,Xu等[11]建立了廣義多粒度粗糙集并在此基礎(chǔ)上引入雙量化決策關(guān)系,對(duì)模型進(jìn)行了改良;Sang等[12]將多源信息系統(tǒng)和廣義多粒度粗糙集結(jié)合,獲取了新模型的上、下近似。有學(xué)者針對(duì)實(shí)際應(yīng)用中粒度重要性的差異,對(duì)多粒度粗糙集進(jìn)行了擴(kuò)展,Ji等[13]基于粒度加權(quán)和粗糙集理論在直覺模糊系統(tǒng)中進(jìn)行決策研究;Guo等[14]從決策樹學(xué)習(xí)的角度,創(chuàng)造性地提出了3種加權(quán)多粒度區(qū)間值決策理論粗糙集。
多源覆蓋信息系統(tǒng)中的數(shù)據(jù)具有一定復(fù)雜性,本文引入誘導(dǎo)覆蓋粗糙集,構(gòu)造了多源覆蓋信息系統(tǒng)下的廣義多粒度粗糙集MCS-GMRS(Generalized Multi-granulation Rough Set of Multi-source Covering information System)模型。文獻(xiàn)[12]認(rèn)為每個(gè)信息系統(tǒng)重要性相同,并未考慮到實(shí)際決策過程中,由于信息來源不同,每個(gè)信息系統(tǒng)對(duì)決策的支持程度會(huì)有所差異,因此本文對(duì)每個(gè)信息系統(tǒng)的屬性賦予一定權(quán)重值,并定義了權(quán)重的計(jì)算方法,以避免因依據(jù)專家經(jīng)驗(yàn)確定權(quán)重而產(chǎn)生主觀性誤差,進(jìn)而提出了多源覆蓋信息系統(tǒng)下的加權(quán)廣義多粒度粗糙集MCS-WGMRS(Weighted Generalized Multi-granulation Rough Set of Multi-source Covering information System)模型,并通過理論和實(shí)驗(yàn)分析對(duì)其相關(guān)性質(zhì)進(jìn)行了驗(yàn)證。
定義1[5]設(shè)U為論域,C={X|X?U}是U的子集族,若C≠?,且∪C=U,則稱C是論域U上的一個(gè)覆蓋,(U,C)為覆蓋近似空間。
定義2[5]若(U,C)為一覆蓋近似空間,對(duì)?x∈U,Cx=∩{Cj|Cj∈C,x∈Cj},則Cov(C)={Cx|x∈U}被稱為由C誘導(dǎo)的覆蓋。
定義3[5]若Δ={C1,C2,…,Cm}是論域U上的一個(gè)覆蓋族,對(duì)任意目標(biāo)集X?U,對(duì)象x∈U有Δx=∩{Cix|Cix∈Cov(Ci),x∈Cix},那么Cov(Δ)={Δx|x∈U}被稱為由Δ誘導(dǎo)的覆蓋。
定義4[5]若IS=(U,AT∪DT,V,f)為一覆蓋信息系統(tǒng),A?AT為屬性子集,CA(x)為對(duì)象x∈U在屬性A下產(chǎn)生的覆蓋類,則目標(biāo)集X關(guān)于A的下、上近似分別如式(1)和式(2)所示:
(1)
(2)
定義5[15]設(shè)ISi=(U,AT∪DT,Vi,fi),對(duì)?i∈N*,則稱MS=(IS1,IS2,…,ISm)為一多源信息系統(tǒng),ISi為一多源信息系統(tǒng)的第i個(gè)信息系統(tǒng)。
定義6[12]設(shè)MS=(IS1,IS2,…,ISm)為一多源信息系統(tǒng),ISi=(U,AT∪DT,Vi,fi),A?AT為屬性子集,D/DT={D1,D2,…,Dn}為決策類,φ∈(0.5,1],對(duì)?X?U,定義多源信息系統(tǒng)下的廣義多粒度粗糙集(MS-GMRS)的下、上近似分別如式(3)和式(4)所示:
(3)
(4)
其中,x∈U在信息系統(tǒng)ISi下關(guān)于集合X和補(bǔ)集XC的支持特征函數(shù)分別如式(5)和式(6)所示:
(5)
(6)
定義7設(shè)MCS=(IS1,IS2,…,ISm)為一多源覆蓋信息系統(tǒng),ISi=(U,AT∪DT,Vi,fi),A?AT為屬性子集,CISi(x)為誘導(dǎo)覆蓋類,D/DT={D1,D2,…,Dn}為決策類,φ∈(0.5,1],對(duì)?X?U,多源覆蓋信息系統(tǒng)下的廣義多粒度粗糙集(MCS-GMRS)的下、上近似分別如式(7)和式(8)所示:
(7)
(8)
其中,x∈U在信息系統(tǒng)ISi下關(guān)于集合X的支持特征函數(shù)如式(9)和式(10)所示:
(9)
(10)
定義8設(shè)MCS=(IS1,IS2,…,ISm)為一多源覆蓋信息系統(tǒng),ISi=(U,AT∪DT,Vi,fi),A?AT為屬性子集,CISi(x)為誘導(dǎo)覆蓋類,D/DT={D1,D2,…,Dn}為決策類,φ∈(0.5,1],對(duì)?X?U,多源覆蓋信息系統(tǒng)下的廣義樂觀多粒度粗糙集MCS-OMRS(generalized Optimistic Multi-granulation Rough Set of Multi-source Covering information System)和多源覆蓋信息系統(tǒng)下的廣義悲觀多粒度粗糙集MCS-PMRS(generalized Pessimistic Multi-granulation Rough Set of Multi-source Covering information System)的下、上近似分別如式(11)~式(14)所示:
(11)
(12)
(13)
(14)
(15)
(16)
(17)
其中,x∈U在信息系統(tǒng)ISi下關(guān)于集合X的支持特征函數(shù)如式(18)和式(19)所示:
(18)
(19)
規(guī)則1在MCS-WGMRS模型中,對(duì)?X?U,決策規(guī)則如下所示:
(P)If∑{ωi|CISi(x)?X}≥φ,decidex∈POS(X);
(B)If∑{ωi|CISi(x)∩X≠?}>1-φand ∑{ωi|CISi(x)?X}<φ,decidex∈BND(X);
(N)If∑{ωi|CISi(x)∩X≠?}≤1-φ,
decidex∈NEG(X)。
由規(guī)則1可知,如果滿足CISi(x)?X的信息系統(tǒng)的屬性權(quán)重和大于或等于φ,則決定x∈POS(X);如果滿足CISi(x)∩X≠?的信息系統(tǒng)的屬性權(quán)重和大于1-φ且滿足CISi(x)?X的信息系統(tǒng)的屬性權(quán)重和小于φ,則決定x∈BND(X);如果滿足CISi(x)∩X≠?的信息系統(tǒng)的屬性權(quán)重和小于或等于1-φ,則決定x∈NEG(X)。
(20)
(21)
(22)
(23)
由定義10和定義11可證。
(1)當(dāng)ω1=ω2=…=ωm=1/m時(shí),有:
(2)當(dāng)閾值φ1≤φ2時(shí),則有:
□
由上述定理可知,φ的取值會(huì)影響上、下近似計(jì)算結(jié)果,在實(shí)際應(yīng)用中決策者根據(jù)相關(guān)情境調(diào)整閾值可以得到不同的決策結(jié)果。
(24)
(25)
(26)
目標(biāo)集X的分類質(zhì)量定義如式(27)~式(29)所示:
(27)
(28)
(29)
αWPM≤αWGM≤αWOM,γWPM≤γWGM≤γWOM
由定義10、定義11和定理1可證。
企業(yè)環(huán)境成本對(duì)經(jīng)濟(jì)效益的重要性日益凸顯,其環(huán)保投資效率成為客戶決定是否與其開展合作的關(guān)鍵因素,因此客戶會(huì)在投資或合作前對(duì)環(huán)保投資效率進(jìn)行評(píng)估。由于評(píng)估者將環(huán)保投資效率分為多個(gè)等級(jí),所以可能會(huì)出現(xiàn)多個(gè)評(píng)估結(jié)果,進(jìn)而產(chǎn)生覆蓋信息。
表1所示為一個(gè)關(guān)于企業(yè)環(huán)保投資效率評(píng)估的多源覆蓋信息決策系統(tǒng)實(shí)例。其中MCS=(IS1,IS2,IS3,IS4)表示4個(gè)評(píng)估機(jī)構(gòu);U={x1,x2,x3,x4,x5,x6,x7,x8}為對(duì)象集,表示待評(píng)估的8個(gè)企業(yè);屬性集AT={a1,a2,a3},分別表示評(píng)估指標(biāo)“經(jīng)濟(jì)效率”“環(huán)境效率”和“社會(huì)效率”,其取值為{1,2},表示效率等級(jí)為“低”“高”。令A(yù)={A1,A2,A3}={{a1},{a2},{a3}},D/DT={D1,D2}={x1,x2,x4,x5,x6,x8}為決策類集合,xi,i=1,2,…,8的取值為{0,1},分別代表客戶選擇“不合作”“合作”,并取D1為目標(biāo)集X,閾值φ=0.6。
(1)計(jì)算在信息系統(tǒng)IS1、IS2、IS3和IS4下每個(gè)對(duì)象的誘導(dǎo)覆蓋類,計(jì)算結(jié)果如表2所示。
Table 2 Induced coverage relationship表2 誘導(dǎo)覆蓋類
(2)根據(jù)定義計(jì)算每個(gè)信息系統(tǒng)的屬性權(quán)重:
(3)當(dāng)φ=0.6時(shí),根據(jù)定義計(jì)算目標(biāo)集X在相關(guān)模型的上、下近似:
Table 1 Multi-source coverage information decision system for enterprise environmental protection investment efficiency evaluation表1 企業(yè)環(huán)保投資效率評(píng)估多源覆蓋信息決策系統(tǒng)
(4)計(jì)算目標(biāo)集X的近似精度和分類質(zhì)量:
由計(jì)算結(jié)果可得:
αWPM≤αWGM≤αWOM,γWPM≤γWGM≤γWOM
因此可驗(yàn)證定理1和定理2。
(5)通過實(shí)例進(jìn)一步討論φ的取值對(duì)上、下近似及分類質(zhì)量的影響。
當(dāng)φ=0.7時(shí):
當(dāng)φ=0.8時(shí):
(6)計(jì)算結(jié)果表明,隨著φ值的減小,MCS-WGMRS模型的下近似集變大,對(duì)目標(biāo)集的分類也越精確。因此,根據(jù)多源覆蓋信息系統(tǒng)合理調(diào)整φ值的大小,可以降低噪聲數(shù)據(jù)的影響,使模型具有較強(qiáng)的容錯(cuò)能力,并能提高M(jìn)CS-WGMRS對(duì)目標(biāo)集的分類精度,幫助決策者采取更加有效準(zhǔn)確的決策方案。
(7)為進(jìn)一步驗(yàn)證MCS-WGMRS模型的有效性,當(dāng)φ=0.6 時(shí),計(jì)算目標(biāo)集X在MCS-GMRS模型的上、下近似和相關(guān)度量參數(shù),可得:
本文利用誘導(dǎo)覆蓋關(guān)系處理覆蓋信息的優(yōu)勢(shì),提出了多源覆蓋信息系統(tǒng)下的廣義多粒度粗糙集(MCS-GMRS)??紤]到實(shí)際應(yīng)用中數(shù)據(jù)來源的不同,對(duì)每個(gè)信息系統(tǒng)的屬性賦予權(quán)重值,并在MCS-GMRS基礎(chǔ)上構(gòu)建了多源覆蓋信息系統(tǒng)下的加權(quán)廣義多粒度粗糙集(MCS-WGMRS),所提出的計(jì)算權(quán)重的自適應(yīng)性方法可以一定程度上避免由于專家判斷失誤產(chǎn)生的影響。本文給出了模型完整的上、下近似,詳細(xì)討論了MCS-WGMRS模型的相關(guān)定理和決策規(guī)則,并結(jié)合實(shí)例分析驗(yàn)證了MCS-WGMRS模型的分類能力更強(qiáng),具有更高容錯(cuò)性,是一種處理多源覆蓋信息的有效途徑。MCS-WGMRS是對(duì)多粒度粗糙集的進(jìn)一步推廣,未來應(yīng)從屬性約簡、機(jī)器學(xué)習(xí)等角度對(duì)該模型進(jìn)行深入剖析。