余文質(zhì)
(廣西醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院,廣西南寧 530021)
粗糙集理論是一種處理不確定和不精確信息的數(shù)學(xué)理論[1-2],它的顯著特點(diǎn)是無需提供問題所需處理的數(shù)據(jù)集合之外的任何先驗信息,而是直接從給定問題的描述集合出發(fā),找出該問題的內(nèi)在規(guī)律.自波蘭數(shù)學(xué)家Z.Pawlak于1982年提出以來,現(xiàn)已廣泛應(yīng)用于信息處理、數(shù)據(jù)挖掘和數(shù)據(jù)庫知識發(fā)現(xiàn)等認(rèn)知領(lǐng)域[3].
汝窯是我宋代五大名窯之一,由于其在歷史上燒制的時間很短、傳世品很少、品位很高,受到了古陶瓷研究者的青睞.自1986年底在河南省寶豐縣大營鎮(zhèn)清涼寺村發(fā)現(xiàn)了傳世汝窯器窯口以后,已有一些古陶瓷研究者采用現(xiàn)代科技手段對汝窯的化學(xué)組成、結(jié)構(gòu)以及呈色機(jī)理進(jìn)行了研究.其中,承煥生等運(yùn)用PIXE技術(shù)對官汝瓷和民汝瓷樣本胎釉中的微量元素作了測量,并用多元統(tǒng)計方法對官汝瓷和民汝瓷的化學(xué)組成規(guī)律進(jìn)行了探討[4].鑒于粗糙集在處理不確定性信息中的優(yōu)勢,本文試用粗糙集算法研究宋代官汝瓷和民汝瓷間的關(guān)系,以期從微量元素中獲取更多有價值的信息.
定義2[2]區(qū)分函數(shù)用Δ*表示,它是一個布爾函數(shù),對知識表達(dá)系統(tǒng)中的每一個屬性a∈A,指定一個布爾變量“a”,若a(x,y)={a1,a2,…,ak}≠?,則指定一個布爾函數(shù)a1∨a2∨…∨ak,用∑a*(x,y)來表示;若a*(x,y)=?,則指定布爾常量1.把區(qū)分函數(shù)Δ*定義為:
區(qū)分函數(shù)Δ*有如下性質(zhì):函數(shù)Δ*的極小析取范式中的所有合取式是C的所有D約簡.
定義3[5](屬性約簡) 對于屬性集P,利用區(qū)分矩陣和區(qū)分函數(shù)找出P中所有的可省屬性.如果P中所有屬性都是不可省的,則稱算法(P,Q)是對立的.對于R?P,當(dāng)算法(P,Q)是對立且相容時,稱(R,Q)為(P,Q)的一個約簡.
定義4[5](規(guī)則約簡) 對于系統(tǒng)中的每一條決策規(guī)則求出決策屬性的等價類和每一個屬性的等價類,找出滿足?關(guān)系的最少條件屬性集.它就是原規(guī)則的一個約簡.
宋代官汝瓷(用0表示)和民汝瓷(用1表示)樣本的微量元素數(shù)據(jù)來源于文獻(xiàn)[3].為了從微量元素中發(fā)掘出官汝瓷和民汝瓷的差異,下面從粗糙集的觀點(diǎn)來構(gòu)造分類算法.
由于粗糙集要求處理的數(shù)據(jù)必須是離散的,而古陶瓷微量元素的測量值是連續(xù)的,因此首先對原始數(shù)據(jù)按等區(qū)間的方法離散化,離散后的數(shù)據(jù)列于表1.
表1 數(shù)據(jù)離散化后的決策表
表1可以看成是含有8個條件屬性(微量元素)和1個決策屬性(官汝瓷還是民汝瓷)的決策表.
假設(shè)P={Ni,Cu,Zn,Ga,Rb,Sr,Zr,Pb},Q={e}分別是條件屬性集合和決策屬性集合,U={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27}為論域.由表2可構(gòu)造區(qū)分矩陣和區(qū)分函數(shù)Δ*=CuZnGaSr∨NiZnGaRbSrZr∨NiCuGaRbSrZr∨NiCuGaSrZrPb.
表2 約簡后的區(qū)分矩陣
通過區(qū)分函數(shù)我們得到這個知識系統(tǒng)有四個約簡{Cu,Zn,Ga,Sr}、{Ni,Ga,Zn,Rb,Sr,Zr}、{Ni,Cu,Ga,Rb,Sr,Zr}和{Ni,Cu,Ga,Sr,Zr,Pb},其中核是{Ga,Sr}.選({Cu,Zn,Ga,Sr},Q)作為決策規(guī)則進(jìn)行再約簡(即消去每一條規(guī)則的不必要部分),約簡后的區(qū)分矩陣見表2(為敘述的方便,將元素Cu,Zn,Ga,Sr分別用a,b,c,d來表示).
對于規(guī)則(2)a0b1c0d0→e0:其決策類[0]a={2,3,6,10,11,14,16,20,23,24,27},[1]b={1,2,3,7,8,9,10,11,12,13,14,16,17,18,24},[0]d={1,2,6,7,8,9,10,13,14,17,19,20,23,24,27},[0]c={1,2,3,4,5,6,9,10,11,12,13,14,16,17,18,19,21,22,23,26,27}.顯然[0]a?[0]e,[1]b?[0]e,[0]c?[0]e,[0]d?[0]e,但[1]b∩[0]c?[0]e,所以得到該決策規(guī)則的約簡b1c0→e0.
類似地,可以得到其他各規(guī)則的約簡如下:
(1、9、17)a1b1或a1d0或b1c0或b1c0d0→e0;(2、10、11、13、14)b1c0→e0;(3、16)a0d1或b1c0或b1d1或a0c0d1→e0;(4)a2→e0;(5)b2→e0;(6)b2→e0;(7、8)a2→e0;(12)a1b1或b1c0或b1d0→e0;(15)a2b2→e0;(18)a2或b1c0或b1d1→e0;(19)a1d0→e0;(20)c2或a0b0→e1;(21、22)b0d1→e1;(23、27)a0b0→e1;(24)a0c1→e1;(25)a1c1或b0c1或b0d1或a1c1d1→e1;(26)a1d2→e1.
該算法的每條規(guī)則都有一個或多個簡化形式,為使算法簡化,取每條規(guī)則的一條簡化形式構(gòu)成原算法的一個約簡算法.消去重復(fù)項后是a2,b2,a2b2,a1d0,b1c0→e0,a0b0,a0c1,a1d2,b0d1→e1.
這樣就得到了最終規(guī)則,根據(jù)最初的替代原則可以知道,若Cu含量高,或Zn含量高,或Cu與Zn含量均高,或Cu含量中等且Sr含量低,或Zn含量中等且Ga含量低,則為官汝瓷;若Cu與Zn含量均低,或Cu含量低且Ga含量中等,或Zn含量低且Sr含量中等,或Cu含量中等且Sr含量高,則為民汝瓷.這為官汝瓷和民汝瓷的鑒別提供了新的線索.
第一,由文獻(xiàn)[3]指出,用聚類分析算法不能將官汝瓷和民汝瓷按微量元素成分完全區(qū)分.本文用粗糙集方法能將官汝瓷和民汝瓷完全區(qū)分開來,為古陶瓷的分類提供了新的途徑.
第二,借助粗糙集算法不僅可以將官汝瓷和民汝瓷樣本區(qū)分開來,而且能得到指紋元素的特征及指紋元素的組合形式,這比目前常見的古陶瓷分類算法聚類分析[6]、灰色關(guān)聯(lián)分析[7]等提供了更多分類信息.
第三,從文獻(xiàn)[4]官汝瓷和民汝瓷樣本數(shù)據(jù)分析得出,官汝瓷Cu、Zn含量高,或Cu含量中等且Sr含量低,或Zn含量中等且Ga含量低;民汝瓷Cu與Zn含量均低,或Cu含量低且Ga含量中等,或Zn含量低且Sr含量中等,或Cu含量中等且Sr含量高.
[參考文獻(xiàn)]
[1]Pawlak Z W.Rough Sets[J].International Journal of Information and Computer Science,1982(5):341-356.
[2]張文修,吳偉志,梁潔業(yè),等.粗糙集理論與方法[M].北京:科學(xué)出版社,2001.
[3]王國胤.Rough集理論與知識推理[M].北京:科學(xué)出版社,2003.
[4]承煥生,何文權(quán),楊福家,等.宋代汝瓷研究[J].文物保護(hù)與考古科學(xué),1999(2):19-26.
[5]孫士保,秦克云,王育輝.基于區(qū)分矩陣和區(qū)分函數(shù)進(jìn)行屬性約簡的數(shù)據(jù)分類[J].河南科技大學(xué)學(xué)報:自然科學(xué)版,2005(4):37-41.
[6]楊大偉,王曉川,李融武,等.鈞臺窯不同時期發(fā)掘出土鈞瓷的PIXE和模糊聚類分析[J].河南師范大學(xué)學(xué)報:自然科學(xué)版,2012(6):89-93.
[7]余文質(zhì),閆玲君.基于灰色關(guān)聯(lián)分析和案例推理的古陶瓷分類方法[J].河南師范大學(xué)學(xué)報:自然科學(xué)版,2011(5):59-62.