夏秀云 田 浩 常安成 田時(shí)宇
(1.湖南信息學(xué)院通識(shí)教育學(xué)院 長沙 410005)(2.湖南信息學(xué)院電子信息學(xué)院 長沙 410005)
Rough理論是近年來發(fā)展起來的一種數(shù)學(xué)理論方法,它可以處理含糊、不確定、不相容的知識(shí)。粗糙集理論在數(shù)據(jù)挖掘、模式識(shí)別、人工智能等方面都取得很大的成功[1~2]。三支決策理論是加拿大Yao.Y.Y在粗糙集和決策粗糙集基礎(chǔ)上于2009年提出的新的決策理論,其是由決策粗糙集導(dǎo)出的分類規(guī)則,具有正域、負(fù)域和邊界域的三區(qū)域特征[3]。目前三支決策理論已成功應(yīng)用于多個(gè)領(lǐng)域。比如,Zhou等學(xué)者將三支決策應(yīng)用到處理郵件文件中[4];Yao等學(xué)者探討了三支決策在醫(yī)療網(wǎng)絡(luò)支持系統(tǒng)的應(yīng)用方法[5];之后,Liu、Li等學(xué)者從三支決策的視角出發(fā),系統(tǒng)地介紹了三支決策與粗糙集理論融合的理論、方法和應(yīng)用[6];張聰學(xué)者從樹結(jié)構(gòu)的角度出發(fā),研究三支增量聚類算法模型[7];2017年,趙天娜等學(xué)者研究了基于多伴隨直覺模糊粗糙集的三支決策模型[8];2018年,辛現(xiàn)偉學(xué)者通過使用可能性測度來度量直覺模糊的三支決策應(yīng)用研究[9];2019年,徐久成等學(xué)者從二階段出發(fā),提出了基于三支決策的二階段分類模型研究[10]。隨后,劉丹等學(xué)者討論了不完備鄰域下多粒度決策理論粗糙集與三支決策的融合[11]。然而對于多類分類模型進(jìn)行研究的文獻(xiàn)不多。文獻(xiàn)[12]中周等學(xué)者提出了一種多類分類模型,該模型考慮將誤分類對象劃分到不同決策類產(chǎn)生不同的損失函數(shù),從而找出每個(gè)類的代價(jià)最小的行動(dòng)決策,但該模型的最終結(jié)果可能存在決策冗余。后來,文獻(xiàn)[13]中徐等學(xué)者針對決策粗糙系統(tǒng)提出了三支決策的多類分類模型。本文是在以上研究基礎(chǔ)上提出來的,給出了基于協(xié)調(diào)覆蓋決策系統(tǒng)的多類分類矩陣模型,從而獲取最小的代價(jià)。首先給出協(xié)調(diào)覆蓋決策系統(tǒng)和三支決策的有關(guān)定義,然后將延遲決策類的多類分類模型運(yùn)用到協(xié)調(diào)覆蓋決策系統(tǒng)中,提出了一種新的協(xié)調(diào)覆蓋基于三支決策的多類分類矩陣模型,減少代價(jià)參數(shù),降低決策風(fēng)險(xiǎn),最后通過一個(gè)實(shí)例分析驗(yàn)證此方法的有效性和可行性。基于以上的討論,本文為覆蓋決策系統(tǒng)基于三支決策理論思想提供了新的框架,因此這樣的研究是有意義的。
定義3[15]設(shè) π ={Ai:i=1,…m}是論域U 的一族覆蓋集族,D是決策屬性,UD是論域U上的決策 劃 分 。 若 對 于 ? x∈U ,?Ej∈UD ,使 得πx?Ej,則稱決策系統(tǒng) cds=(U,π,D)為協(xié)調(diào)覆蓋決策系統(tǒng)。
定義 4[16]設(shè) (U,A) 為一個(gè)覆蓋近似空間,?x∈U ,稱
其中,三種行為下的期望損失可以分別表示為
根據(jù)貝葉斯最小風(fēng)險(xiǎn)的決策準(zhǔn)則,可以得到如下的決策規(guī)則:
(P):若 R(ePj|∩md(xi))≤ R(eBj|∩md(xi)),且R(ePj|∩ md(xi))≤ R(eNj|∩ md(xi)),則 xi∈ POS(Dj);
(B):若 R(eBj|∩md(xi))≤ R(ePj|∩md(xi)),且R(eBj|∩ md(xi))≤ R(eNj|∩ md(xi)),則 xi∈ BND(Dj);
(N):若 R(eNj|∩md(xi))≤ R(ePj|∩md(xi)),且R(eNj|∩ md(xi))≤ R(eBj|∩ md(xi)),則 xi∈ NEG(Dj)。
當(dāng)然,在具體決策過程中,要求正確接受的代價(jià)損失小于錯(cuò)誤拒絕的代價(jià)損失,延遲決策類的損失處于正確接受的代價(jià)損失與錯(cuò)誤拒絕的代價(jià)損失之間。
定義12 設(shè)協(xié)調(diào)覆蓋決策系統(tǒng)為ds=(U,π∪D,V,f),π={Ai;i=1,…,m}為 U 上一個(gè)覆蓋集族,表示對象X的最小描述的交集是∩md(x),UD={D1,D2,…,Dt},則基于覆蓋的三支決策的多分類模型的代價(jià)矩陣t×(t+1)階的M1矩陣:
其中,M1延遲決策類的損失代價(jià)矩陣,其各列值是互不相同的,同時(shí)滿足(t+1)列的各值小于λij(i∈[1,t],i≠j)的最小值。
與定義11相似,可得到基于協(xié)調(diào)覆蓋的三支決策的多分類模型的決策風(fēng)險(xiǎn)矩陣定義如下。
定義13 設(shè)協(xié)調(diào)覆蓋決策系統(tǒng)為ds=(U,π∪D,V,f),π={Ai;i=1,…,m}為 U 上一個(gè)覆蓋集族,表示對象X的最小描述為∩md(x),UD={D1,D2,…,Dt},帶延遲決策類的決策風(fēng)險(xiǎn)矩陣R1=Pπ×M1,記為
注:具體決策時(shí),對∩md(x)所采取的決策要比較分析其不行動(dòng)所付出的代價(jià),找到最合理代價(jià)最小的行動(dòng)。
表1 決策屬性的誤分類代價(jià)
根據(jù)定義11的決策規(guī)則可知:md(x1)∈POS(D1),md(x1)∈POS(D2),表示對于md(x1)而言既屬于D1又屬于 D2,這是一種決策沖突,md(x1)∈NEG(D3),表示該決策是多余的決策。下面我們引進(jìn)延遲類決策代價(jià)來進(jìn)行重新計(jì)算,比較兩種方法的不同。隸屬矩陣保持不變,注意從代價(jià)矩陣這里重新進(jìn)行,由定義12可知:
根據(jù)定義13,計(jì)算出帶延遲類的風(fēng)險(xiǎn)矩陣:
從以上可以看出,md(x1)劃分到D1的代價(jià)最小,沒有出現(xiàn)決策沖突,也就是不存在決策冗余。
從計(jì)算復(fù)雜度本文方法與文獻(xiàn)[17]方法比較如下:
計(jì)算復(fù)雜度比較:在不考慮代價(jià)矩陣存儲(chǔ)縮減情況下,t表示決策類個(gè)數(shù),本文的代價(jià)矩陣中的階數(shù)個(gè)數(shù)為t×(t+1),而文獻(xiàn)[17]方法定義的代價(jià)矩陣階數(shù)個(gè)數(shù)為t×3t。本文風(fēng)險(xiǎn)矩陣的階數(shù)由8×9階,降低為8×4階。
由此,對于協(xié)調(diào)覆蓋決策系統(tǒng)而言,基于三支決策角度來探討多類分類模型具有實(shí)際意義。我們通過一個(gè)實(shí)例與其他算法比較,說明基于三支決策的協(xié)調(diào)覆蓋決策系統(tǒng)的多類分類模型算法相對更易理解、效率更高。也為協(xié)調(diào)覆蓋決策系統(tǒng)基于三支決策理論思想提供了新的框架。
這篇文章討論了協(xié)調(diào)覆蓋決策系統(tǒng)的多類分類視角下三支決策矩陣模型。我們基于文獻(xiàn)[12~13]定義的隸屬度矩陣、代價(jià)矩陣、風(fēng)險(xiǎn)矩陣的概念,提出了基于協(xié)調(diào)覆蓋決策系統(tǒng)的三支決策多類分類模型計(jì)算方法,減少了代價(jià)參數(shù),降低了決策風(fēng)險(xiǎn)。本文的研究對于三支決策模型的進(jìn)一步應(yīng)用討論提供一種新的思路,故我們所做工作還是有意義的。在接下來的工作中,需要進(jìn)一步探討該模型的性質(zhì)及定理,以及其對應(yīng)的屬性約簡方法等。