李志亮, 羅芳, 阮群生
( 寧德師范學(xué)院 計(jì)算機(jī)系, 福建 寧德 352100 )
?
一種新的白化權(quán)函數(shù)的灰色聚類評(píng)價(jià)方法
李志亮,羅芳,阮群生
( 寧德師范學(xué)院 計(jì)算機(jī)系, 福建 寧德 352100 )
摘要:在傳統(tǒng)三角白化權(quán)函數(shù)的基礎(chǔ)上,構(gòu)建一個(gè)新的正弦曲線形式的白化權(quán)函數(shù),以提高聚類對(duì)象劃分為其所屬灰類的聚類系數(shù),繼而建立一種灰色聚類評(píng)價(jià)改進(jìn)方法.經(jīng)仿真實(shí)驗(yàn)發(fā)現(xiàn),改進(jìn)方法能夠有效降低聚類信息熵的值,并能提高聚類對(duì)象的歸屬性.通過引用研究生招生實(shí)際數(shù)據(jù),分析驗(yàn)證了改進(jìn)的灰色聚類評(píng)價(jià)方法在招生質(zhì)量評(píng)價(jià)應(yīng)用中的可行性和有效性. 正弦曲線; 白化權(quán)函數(shù); 灰色聚類; 招生質(zhì)量評(píng)價(jià) N941.5
文獻(xiàn)標(biāo)識(shí)碼:A
0引言
灰色系統(tǒng)理論是鄧聚龍于2002年首次提出的一種基于小樣本的計(jì)算方法[1],隨后許多學(xué)者應(yīng)用灰色理論的灰色聚類方法建立了聚類模型,例如:劉思峰等在2013年設(shè)計(jì)了加權(quán)多屬性灰色目標(biāo)決策模型[2],并且2014年在傳統(tǒng)白化權(quán)函數(shù)的基礎(chǔ)上,改進(jìn)三角白化權(quán)函數(shù),構(gòu)建了一種新的灰色聚類決策模型[3],該決策模型有效提高了信息決策的準(zhǔn)確度;金燦燦等[4]運(yùn)用SDG模型并結(jié)合灰色聚類技術(shù)提出了系統(tǒng)故障風(fēng)險(xiǎn)評(píng)估方法;王沛[5]應(yīng)用灰色聚類技術(shù)建立了研究生生源質(zhì)量評(píng)價(jià)方法;龍偉等[6]運(yùn)用灰色聚類技術(shù)建立了投標(biāo)決策評(píng)價(jià)模型.上述研究成果均取得了一定的效果,并在相應(yīng)的領(lǐng)域得到了較好的應(yīng)用,但他們建立的白化權(quán)函數(shù)都是直線型的分段函數(shù).對(duì)此,一些學(xué)者對(duì)直線型的白化權(quán)函數(shù)進(jìn)行了改進(jìn),例如:徐衛(wèi)國(guó)等[7]通過建立指數(shù)型白化權(quán)函數(shù),解決了零權(quán)重現(xiàn)象;胡軍等[8]應(yīng)用指數(shù)型白化權(quán)函數(shù)建立了大氣環(huán)境質(zhì)量綜合評(píng)價(jià)灰色聚類模型;王國(guó)勝等[9]引入正態(tài)分布白化權(quán)函數(shù),有效解決了聚類邊緣的零權(quán)重問題.但是,這些基于傳統(tǒng)白化權(quán)函數(shù)或改進(jìn)的指數(shù)型白化權(quán)函數(shù)的評(píng)價(jià)方法都是采用最大歸屬原則,即通過最大歸屬原則來劃分聚類對(duì)象所屬的灰類.該方法雖然能夠得到明確的聚類結(jié)果,但是實(shí)際的聚類結(jié)果難以明確劃分聚類對(duì)象所屬的灰類,即聚類對(duì)象劃分為不同灰類的聚類系數(shù)的值差別不大.
本文在研究傳統(tǒng)白化權(quán)函數(shù)的基礎(chǔ)上,建立了一種正弦曲線的白化權(quán)函數(shù),以提高聚類對(duì)象劃分為其所屬灰類的聚類系數(shù),繼而構(gòu)建了一種基于正弦曲線的白化權(quán)函數(shù)的灰色聚類評(píng)價(jià)方法;通過實(shí)驗(yàn)仿真驗(yàn)證了改進(jìn)評(píng)價(jià)方法的有效性和合理性,并把它應(yīng)用于研究生招生質(zhì)量評(píng)價(jià)中,通過實(shí)例進(jìn)一步驗(yàn)證了評(píng)價(jià)方法的實(shí)際效果.
1概念與定義
首先給出與本研究相關(guān)的一些概念和定義.
定義1設(shè)有m個(gè)聚類對(duì)象,灰色聚類對(duì)象記為i, i∈[1,m]; 每個(gè)聚類對(duì)象有n個(gè)聚類指標(biāo),用j表示每個(gè)聚類指標(biāo)的序號(hào), j∈[1,n]; 聚類對(duì)象的劃分灰類有s個(gè),用k表示灰類序號(hào), k∈[1,s]; 將m個(gè)對(duì)象劃分為s個(gè)灰類的過程稱為灰色聚類.
定義3用Mij表示m個(gè)灰色對(duì)象中的第i個(gè)對(duì)象的第j個(gè)聚類指標(biāo)的值, i∈[1,m], j∈[1,n].灰色聚類對(duì)象的評(píng)價(jià)指標(biāo)矩陣M定義如下:
(1)
(2)
(3)
2改進(jìn)的灰色聚類評(píng)價(jià)方法的設(shè)計(jì)過程
本文運(yùn)用式(2)所示的正弦函數(shù)構(gòu)建灰色聚類評(píng)價(jià)方法,具體步驟如下:
1)構(gòu)建聚類對(duì)象的評(píng)價(jià)指標(biāo)矩陣.假設(shè)聚類對(duì)象個(gè)數(shù)為m, 聚類評(píng)價(jià)指標(biāo)數(shù)為n, 由定義3可知,第i個(gè)灰色聚類對(duì)象的第j個(gè)聚類指標(biāo)的值為Mij,i∈[1,m],j∈[1,n], 經(jīng)歸一化處理得到由Mij可生成聚類對(duì)象的評(píng)價(jià)指標(biāo)矩陣,記為Mm×n.
3)構(gòu)建基于正弦函數(shù)的改進(jìn)的白化權(quán)函數(shù)模型.傳統(tǒng)白化權(quán)函數(shù)有上限測(cè)度白化權(quán)函數(shù)、下限測(cè)度白化權(quán)函數(shù)和中心點(diǎn)白化權(quán)函數(shù),函數(shù)圖形都是直線形式.本文基于正弦函數(shù)的改進(jìn)的白化權(quán)函數(shù)模型對(duì)傳統(tǒng)白化權(quán)函數(shù)進(jìn)行改進(jìn),這里灰類1采用下限測(cè)度白化權(quán)函數(shù),灰類s采用上限測(cè)度白化權(quán)函數(shù),灰類k采用中心點(diǎn)白化權(quán)函數(shù),即在傳統(tǒng)白化權(quán)函數(shù)的基礎(chǔ)上,把直線形式的白化權(quán)函數(shù)改進(jìn)為正弦函數(shù)曲線形式的白化權(quán)函數(shù),具體形式如式(4)至式(6)所示:
(4)
(5)
(6)
構(gòu)造的基于正弦函數(shù)的白化權(quán)函數(shù)示意圖如圖1所示.
圖1 基于正弦函數(shù)的白化權(quán)函數(shù)圖
4)確定聚類指標(biāo)權(quán)重.聚類指標(biāo)權(quán)重的確定對(duì)模型評(píng)價(jià)至關(guān)重要,國(guó)內(nèi)外很多學(xué)者對(duì)指標(biāo)權(quán)重的確定提出了很多方法,這些方法總體上可以將指標(biāo)權(quán)重分為主觀權(quán)重和客觀權(quán)重.主觀權(quán)重可采用層次分析法[10]等得到,客觀權(quán)重可采用離差最大化法[11]等得到,也可以采用主觀、客觀組合方法來得到權(quán)重系數(shù),即通過組合賦權(quán)法[12]可有效地融合主、客觀權(quán)重,進(jìn)而得到灰色聚類的指標(biāo)權(quán)重.當(dāng)然,也可以根據(jù)實(shí)際情況直接確定指標(biāo)權(quán)重的值.本文改進(jìn)灰色聚類方法的聚類指標(biāo)權(quán)重由式(7)確定:
(7)
3仿真實(shí)驗(yàn)
實(shí)驗(yàn)采用文獻(xiàn)[13]中的SCCTS數(shù)據(jù)集,算法編程工具采用VC++,實(shí)驗(yàn)環(huán)境為:64位WIN7操作系統(tǒng),處理器為Intel(R)Core(TM)i7-5500,運(yùn)算速度是2.40GHz,內(nèi)存(RAM)為8GB.采用文獻(xiàn)[13]中的SCCTS數(shù)據(jù)集檢驗(yàn)改進(jìn)的灰色聚類評(píng)價(jià)方法,在仿真實(shí)驗(yàn)中灰類數(shù)m=3.SCCTS數(shù)據(jù)集可以有效地測(cè)試算法性能的數(shù)據(jù)集,數(shù)據(jù)量超過6萬條,在數(shù)據(jù)集中隨機(jī)抽取100條數(shù)據(jù)作為數(shù)據(jù)子集來驗(yàn)證算法的性能.圖2和圖3分別是閾值設(shè)為0.48時(shí)采用文獻(xiàn)[5]方法和本文改進(jìn)方法的聚類結(jié)果圖.
圖2 文獻(xiàn)[5]方法聚類結(jié)果圖
圖3 本文改進(jìn)方法聚類結(jié)果圖
由圖2和圖3可以看出,圖3中聚類結(jié)果明顯更為緊湊,即聚類結(jié)果具有更高的確定性,各個(gè)灰類之間聚類對(duì)象的緊密性更好.由此說明采用本文改進(jìn)方法可以更好地對(duì)聚類對(duì)象進(jìn)行聚類.
在測(cè)試的數(shù)據(jù)子集上,閾值設(shè)為0.48,文獻(xiàn)[5]方法的聚類準(zhǔn)確性是92%,本文改進(jìn)方法的聚類準(zhǔn)確性為95%.表1是文獻(xiàn)[5]方法和本文改進(jìn)方法在閾值為0.48時(shí)得到的聚類結(jié)果,表格數(shù)據(jù)包括正確劃分的個(gè)數(shù)和錯(cuò)誤劃分的個(gè)數(shù),錯(cuò)誤個(gè)數(shù)包括錯(cuò)誤的聚類結(jié)果或沒有明確劃分聚類結(jié)果的評(píng)價(jià)結(jié)果.
表1 兩種評(píng)價(jià)方法的聚類結(jié)果
由表1的實(shí)驗(yàn)結(jié)果可以看出,本文的改進(jìn)評(píng)價(jià)方法在準(zhǔn)確率上優(yōu)于文獻(xiàn)[5]的評(píng)價(jià)方法.這是因?yàn)?,采用正弦形式的白化?quán)函數(shù),對(duì)聚類對(duì)象劃分為所屬灰類的聚類系數(shù)提高得較多,而對(duì)聚類對(duì)象不歸屬灰類的聚類系數(shù)提高得相對(duì)較少,所以提高了聚類對(duì)象劃分為所屬灰類的確定性,因此可以更準(zhǔn)確地提升聚類的準(zhǔn)確性.
信息熵的值可以作為聚類對(duì)象之間相似度的度量,信息熵的值越小,則表明聚類對(duì)象劃分為所屬類越明確,即處在同一個(gè)類的聚類對(duì)象具有更高的相似度,也說明聚類結(jié)果越準(zhǔn)確.表2給出了在劃分不同灰類數(shù)時(shí),采用文獻(xiàn)[5]方法和本文改進(jìn)方法所得的信息熵值.
表2 兩種方法不同灰類數(shù)的熵值表
由表2可以看出,采用本文的改進(jìn)方法可以有效地降低信息熵的值,說明聚類結(jié)果更為準(zhǔn)確.兩種方法在灰類數(shù)為2時(shí),聚類的熵值最??;隨著灰類數(shù)的增多,信息熵值逐漸增大,本文改進(jìn)方法的熵值增長(zhǎng)趨勢(shì)相對(duì)平緩,這也證明了本文改進(jìn)方法對(duì)聚類準(zhǔn)確性的提高.
4實(shí)例分析
研究生生源質(zhì)量對(duì)于提高研究生教育有著重要的影響,因此,為了更好地指導(dǎo)研究生招生工作,需要建立一種科學(xué)有效的研究生招生質(zhì)量評(píng)價(jià)方法.為此,近年來國(guó)內(nèi)外很多學(xué)者進(jìn)行了大量的研究,取得了諸多成果[14-15];部分學(xué)者對(duì)影響研究生招生質(zhì)量的因素設(shè)置了權(quán)重,但沒有給出具體的評(píng)價(jià)模型[16];部分學(xué)者建立了評(píng)價(jià)模型,但是其評(píng)價(jià)過程的實(shí)施比較復(fù)雜[17].為了驗(yàn)證本文改進(jìn)聚類方法的有效性,本文引用文獻(xiàn)[5]的數(shù)據(jù),并與文獻(xiàn)[5]中的聚類結(jié)果作比較.白化權(quán)函數(shù)的臨界值和各指標(biāo)對(duì)應(yīng)灰類的權(quán)值取值沿用文獻(xiàn)[5]的結(jié)果,其中聚類對(duì)象m=14,聚類指標(biāo)n=7,劃分的灰類s=3.改進(jìn)的灰色聚類過程如下:
1)構(gòu)建聚類對(duì)象的評(píng)價(jià)指標(biāo)矩陣.對(duì)文獻(xiàn)[5]中表3的數(shù)據(jù)進(jìn)行歸一化處理,即Mij=Mij/max(Mij)×100, 這里 1≤j≤n.根據(jù)M=(Mij)m×n可得到灰色聚類的指標(biāo)矩陣M:
表3 聚類過程中3個(gè)灰類的轉(zhuǎn)折點(diǎn)與中心點(diǎn)
3)構(gòu)建基于正弦函數(shù)的改進(jìn)的白化權(quán)函數(shù)模型.由步驟2)得到灰類的轉(zhuǎn)折點(diǎn)和中心點(diǎn),并確定每個(gè)評(píng)價(jià)指標(biāo)相對(duì)應(yīng)的轉(zhuǎn)折點(diǎn)和中心點(diǎn),再結(jié)合公式(4)—(6)得到3個(gè)灰類的白化權(quán)函數(shù).基于正弦函數(shù)的改進(jìn)的白化權(quán)函數(shù)如下:
4)確定聚類指標(biāo)權(quán)重.根據(jù)聚類指標(biāo)權(quán)重公式(7)計(jì)算求得灰類k關(guān)于指標(biāo)j的權(quán)值,具體數(shù)值如表4所示.
表4 灰類k關(guān)于指標(biāo)j的權(quán)值
表5 某高校2015年研究生招生質(zhì)量聚類系數(shù)
按文獻(xiàn)[5]方法,若設(shè)定閾值為0.48,則招生質(zhì)量為“優(yōu)秀”類的專業(yè)有通信與信息系統(tǒng)、移動(dòng)互聯(lián)網(wǎng)和集成電路系統(tǒng)設(shè)計(jì);招生質(zhì)量為“一般”類的專業(yè)有電子與通信工程、軟件工程、大數(shù)據(jù)處理與高性能計(jì)算、企業(yè)管理、馬克思主義理論;招生質(zhì)量為“良好”類的專業(yè)有信號(hào)與信息系統(tǒng)、電路與系統(tǒng)和會(huì)計(jì).信息安全、電磁場(chǎng)與微波技術(shù)介于“優(yōu)秀”類專業(yè)和“良好”類專業(yè)之間,微電子學(xué)與固體電子學(xué)介于“一般”類專業(yè)和“良好”類專業(yè)之間.表6給出了閾值為0.48時(shí)兩種方法對(duì)文獻(xiàn)[5]中的數(shù)據(jù)進(jìn)行灰色聚類的結(jié)果.
表6 閾值為0.48時(shí)本文改進(jìn)方法和文獻(xiàn)[5]方法的聚類結(jié)果
由表6可知,采用本文改進(jìn)算法可以較好地對(duì)聚類對(duì)象進(jìn)行灰類劃分.在采取相同閾值的情況下,14個(gè)聚類對(duì)象采用本文改進(jìn)方法可以明確地劃分13個(gè)聚類對(duì)象的灰類,只有1個(gè)“微電子與固體電子學(xué)”專業(yè)不能明確劃分招生質(zhì)量灰類;文獻(xiàn)[5]方法則只能劃分11個(gè)聚類對(duì)象的招生質(zhì)量灰類,“信息安全”“微電子學(xué)與固體電子學(xué)”“電磁場(chǎng)與微波技術(shù)”3門專業(yè)不能具體地劃分招生質(zhì)量灰類.劃分為優(yōu)秀的專業(yè)都是該高校的優(yōu)勢(shì)專業(yè),尤其是“通信與信息技術(shù)”專業(yè)是“優(yōu)秀”灰類聚類系數(shù)值最高的,這與其作為該高校的熱門專業(yè)的實(shí)際情況相符.
5結(jié)束語
本文通過改進(jìn)灰色聚類中的三角白化權(quán)函數(shù),建立了一種新的基于正弦曲線形式的灰色聚類評(píng)價(jià)方法,并通過仿真實(shí)驗(yàn)驗(yàn)證了新的改進(jìn)方法的準(zhǔn)確性和一致性.通過研究生招生質(zhì)量評(píng)價(jià)的實(shí)例分析表明,本文改進(jìn)的灰色聚類方法可以對(duì)研究生招生質(zhì)量的評(píng)價(jià)提供量化支持,能夠有效降低研究生招生質(zhì)量評(píng)價(jià)的主觀性.今后將進(jìn)一步研究不相鄰區(qū)間對(duì)聚類系數(shù)的影響,以提高灰色聚類方法的綜合評(píng)價(jià)準(zhǔn)確性,更好地解決不相鄰區(qū)間的零權(quán)重問題;以及建立新的灰色聚類方法的實(shí)際應(yīng)用模型,擴(kuò)大灰色聚類方法的應(yīng)用范圍.
參考文獻(xiàn):
[1]鄧聚龍.灰理論基礎(chǔ)[M].武漢:華中科技大學(xué)出版社,2002:1-46.
[2]LiuSF,XuBin,JeffreyForrest,etal.Onuniformeffectmeasurefunctionsandaweightedmulti-attributegreytargetdecisionmodel[J].JofGreySystem, 2013,25(1):1-12.
[3]劉思峰,方志耕,楊英杰.兩階段灰色綜合測(cè)度決策模型與三角白化權(quán)函數(shù)的改進(jìn)[J].控制與決策,2014,29(7):1232-1238.
[4]金燦燦,王海燕,左洪福,等.基于SDG和灰色聚類的系統(tǒng)故障風(fēng)險(xiǎn)評(píng)估方法[J].系統(tǒng)工程理論與實(shí)踐,2015,35(4):1048-1056.
[5]王沛.基于灰色聚類的研究生生源質(zhì)量評(píng)價(jià)方法[J].西安郵電大學(xué)學(xué)報(bào),2015,20(4):120-124.
[6]龍偉,鄧龍.灰色聚類分析法在投標(biāo)據(jù)測(cè)中的應(yīng)用[J].海峽大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,32(2):87-93.
[7]徐衛(wèi)國(guó),張清宇,郭慧,等.灰色聚類模型的改進(jìn)及應(yīng)用研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2006,36(6):200-205.
[8]胡軍,許麗忠,張江山.基于改進(jìn)灰色聚類法的大氣環(huán)境質(zhì)量綜合評(píng)價(jià)[J].福建師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,28(1):49-54.
[9]王國(guó)勝,冉治霖,黃奕崇,等.改進(jìn)灰色聚類法在粵港珠江三角洲區(qū)域大氣環(huán)境質(zhì)量評(píng)價(jià)中的應(yīng)用研究[J].深圳信息職業(yè)技術(shù)學(xué)院學(xué)報(bào),2015,13(1):63-67.
[10]馬農(nóng)樂,趙中極.基于層次分析法及其改進(jìn)對(duì)確定權(quán)重系數(shù)的分析[J].水利科技與經(jīng)濟(jì),2006,12(11):732-733.
[11]董一哲,黨耀國(guó).基于離差最大化法的灰色聚類方法[J].系統(tǒng)工程理論與實(shí)踐,2009,29(9):141-146.
[12]陳偉,夏建華.綜合主、客觀權(quán)重信息的最優(yōu)組合賦權(quán)方法[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2007,37(1):17-21.
[13]王元珍,王健,李晨陽.一種改進(jìn)的模糊聚類算法[J].華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,33(2):92-94.
[14]侯俊,陳安民.研究生招生質(zhì)量評(píng)估體系研究[J].學(xué)位與研究生教育,2007(7):22-25.
[15]陳立文,陳書娜.學(xué)術(shù)型碩士研究生生源質(zhì)量評(píng)價(jià)研究進(jìn)展[J].續(xù)教育研究,2011(10):94-97.
[16]許朝輝,高萬林,張領(lǐng)先,等.基于AHP的研究生生源素質(zhì)評(píng)價(jià)[J].北京航空航天大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2007(20):9-11.
[17]徐瑾,岳昆,錢文華,等.一種基于概率圖模型的研究生生源質(zhì)量評(píng)價(jià)方法[J].云南大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,33(S2):299-304.
A gray clustering evaluation method based on new whitenization weight function
LI Zhiliang,LUO Fang,RUAN Qunsheng
(DepartmentofComputerScience,NingdeNormalUniversity,Ningde352100,China)
Abstract:On basis of the traditional triangular whitenization weight function, a new form of whitenization weight function based on sine curve is built in this paper. It can improve the clustering ratio of clustering object belonged to gray class. Then an improved method of gray clustering method is given.Simulation experimental results show that the improved method can effectively reduce the value of information entropy and increase the certainty of clustering objects attribution. With the actual data of graduate student’s enrollment cited, the feasibility and effectiveness of the improved gray clustering evaluation method is detailedly analyzed.
Key words:sine curve; whitenization weight function; gray cluster; enrollment quality evaluation
文章編號(hào):1004-4353(2015)04-0318-08
基金項(xiàng)目:福建省自然科學(xué)基金資助項(xiàng)目(2011J01357);寧德師范學(xué)院服務(wù)海西資助項(xiàng)目(2012H405);福建省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(201410398059)
收稿日期:2015-11-03
作者簡(jiǎn)介:李志亮(1981—),男,講師,研究方向?yàn)椴淮_定系統(tǒng)理論.