史進(jìn)玲
摘要:在信息系統(tǒng)中,研究了知識(shí)的粗糙性,定義了一種粗糙熵度量方法,并證明了知識(shí)的粗糙熵隨著劃分的增大而單調(diào)增加的結(jié)論,給出了屬性的重要性度量方法,在此基礎(chǔ)上提出了一種基于粗糙熵的啟發(fā)式屬性約簡(jiǎn)算法。實(shí)例驗(yàn)證表明,該算法能有效地從信息系統(tǒng)中獲取最優(yōu)屬性約簡(jiǎn)。
關(guān)鍵詞:信息系統(tǒng);粗糙熵;屬性重要度;屬性約簡(jiǎn)
中圖分類號(hào):TP312文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)24-5872-03
An Attribute Reduction Algorithm Based on Rough Entropy in Information System
SHI Jin-ling
(International School of Education, Xuchang University, Xuchang 461000, China)
Abstract:In information system, a rough entropy is defined by studying roughness of knowledge, then knowledge rough entropys mo? notonous increasing property with the increase of partition is proved. On this basis, attribute significance measure method is given and a heuristic reduction algorithm based on rough entropy is proposed. A detailed example is shown that the algorithm can effectively extract op? timal reduction.
Key words: information system; rough entropy; attribute significance; attribute reduction
粗糙集理論(Rough Set )是一種有效的從不精確、不完備與不一致數(shù)據(jù)的知識(shí)庫(kù)中獲取知識(shí)的數(shù)學(xué)理論[1-2]。屬性約簡(jiǎn)是粗糙集的核心內(nèi)容之一,而且尋求高效快速的屬性約簡(jiǎn)算法是粗糙集理論研究的主要熱點(diǎn)之一。國(guó)內(nèi)外許多學(xué)者基于知識(shí)的度量方法如信息熵、正區(qū)域、分辨矩陣、知識(shí)粒度、粒度熵等提出了相關(guān)的屬性約簡(jiǎn)算法[3-8],但目前對(duì)信息系統(tǒng)屬性約簡(jiǎn)的研究仍集中于如何尋求有效的知識(shí)度量方法,提出完備的最優(yōu)的屬性約簡(jiǎn)算法。該文針對(duì)知識(shí)的粗糙性,提出了粗糙熵的度量方法,討論了知識(shí)對(duì)論域的劃分粗糙度大小,并給出了一種有效的信息系統(tǒng)啟發(fā)式屬性約簡(jiǎn)算法。
該文針對(duì)信息系統(tǒng)討論了知識(shí)的粗糙性,為準(zhǔn)確度量知識(shí)對(duì)論域劃分的粗糙度,引入了知識(shí)的粗糙熵概念?;谥R(shí)粗糙熵隨著知識(shí)劃分塊增大而單調(diào)增加的特點(diǎn),提出了一種基于粗糙熵的啟發(fā)式屬性約簡(jiǎn)算法。實(shí)例驗(yàn)證表明,該算法能有效地從信息系統(tǒng)中求取最小屬性約簡(jiǎn)。