李蘭春,王雙成,王 輝
(1.上海立信會計學(xué)院外語學(xué)院,上海 201620;
2.上海立信會計學(xué)院數(shù)學(xué)與信息學(xué)院,上海 201620;
3.中央民族大學(xué)信息工程學(xué)院,北京 100081)
學(xué)生綜合素質(zhì)評估的層次貝葉斯網(wǎng)絡(luò)聚類方法
李蘭春1,王雙成2,王 輝3
(1.上海立信會計學(xué)院外語學(xué)院,上海 201620;
2.上海立信會計學(xué)院數(shù)學(xué)與信息學(xué)院,上海 201620;
3.中央民族大學(xué)信息工程學(xué)院,北京 100081)
針對學(xué)生綜合素質(zhì)評估特點和現(xiàn)有評估方法存在的問題,建立了學(xué)生綜合素質(zhì)評估的層次樸素貝葉斯網(wǎng)絡(luò)聚類方法,這種方法不需要許多例子,甚至在沒有例子的情況下也能夠進行規(guī)則提煉和預(yù)測.實驗結(jié)果顯示,層次樸素貝葉斯網(wǎng)絡(luò)聚類方法具有良好的預(yù)測準確性,這將使基于層次樸素貝葉斯網(wǎng)絡(luò)聚類的學(xué)生綜合素質(zhì)評估更加可靠.
學(xué)生綜合素質(zhì)評估;指標體系;層次樸素貝葉斯網(wǎng)絡(luò);聚類
學(xué)生綜合素質(zhì)評估[1-2]是檢驗學(xué)生全面發(fā)展水平的有效方法之一,同時也為加強學(xué)生思想教育和管理工作,以及制定培養(yǎng)學(xué)生全面發(fā)展策略提供依據(jù).學(xué)生綜合素質(zhì)評估是一個非常復(fù)雜的問題,其中有兩個關(guān)鍵的因素:一個是建立指標體系,指標體系是評估的基礎(chǔ);另一個是運用數(shù)學(xué)或計算機智能方法對指標進行綜合處理,經(jīng)過識別和判斷獲得評估等級.
目前的評估方法主要采用三級指標體系[3-5],在同級(二級或三級)指標之間相互獨立的假設(shè)下,通過二級和三級指標的層次線性加權(quán)求和,以及計算結(jié)果的區(qū)間范圍劃分來進行等級計算.而現(xiàn)實中的同級指標之間一般并不相互獨立,而且等級與二級和三級指標之間的關(guān)系往往也是非線性的.現(xiàn)有的評估方法只注重現(xiàn)在,而忽略過去(歷史),但過去對現(xiàn)在往往也有很大影響.使用二級和三級指標(屬性)對一級指標(類)進行等級識別和判斷是一個分類(或聚類)預(yù)測問題.基于分類(或聚類)的等級預(yù)測不需要線性關(guān)系的假設(shè),可不受完全相互獨立性的約束,而且能夠有效利用歷史信息,因此在評價的可靠性方面具有優(yōu)勢,并可開拓綜合評估的新思路.
分類技術(shù)是使用計算機對人類概念學(xué)習(xí)與應(yīng)用能力的模擬,已成為機器學(xué)習(xí)、模式識別和數(shù)據(jù)采掘等領(lǐng)域研究的核心內(nèi)容之一.現(xiàn)已發(fā)展了許多著名的分類器,如樸素(naive)貝葉斯分類器、TAN分類器、C4.5分類器、支持向量機和神經(jīng)網(wǎng)絡(luò)等,它們各有特色,已在許多領(lǐng)域得到了廣泛的應(yīng)用.但這些分類器都需要一定數(shù)量的例子用于學(xué)習(xí)(訓(xùn)練),當具有不完整例子(類標簽很少、某些類標簽殘缺或根本沒有類標簽)時,由于分類器得不到很好的訓(xùn)練(甚至一些參數(shù)無法估計),將導(dǎo)致分類預(yù)測結(jié)果不可靠,甚至無法進行分類預(yù)測.而由于各種原因,在學(xué)生綜合素質(zhì)評估中這種不完整的例子集普遍存在,目前還缺乏對具有不完整例子情況的針對性研究.樸素貝葉斯網(wǎng)絡(luò)聚類適合于進行這類情況的識別和預(yù)測,這種聚類技術(shù)不僅在例子少或例子殘缺時能夠進行有效的學(xué)習(xí)和預(yù)測,甚至沒有例子也可歸納出分類規(guī)則.經(jīng)典的樸素貝葉斯網(wǎng)絡(luò)聚類[6]是結(jié)合樸素貝葉斯網(wǎng)絡(luò)與EM(expectation-maximization)算法進行的聚類,其中的條件密度估計一般選擇高斯函數(shù).由于EM算法是對分布參數(shù)的局部貪婪(greedy)尋優(yōu),因此對初始值敏感,易于陷入局部極值,參數(shù)迭代還可能收斂到并非似然函數(shù)極值的參數(shù)空間的邊界,從而產(chǎn)生欺騙收斂,這可能導(dǎo)致聚類結(jié)果出現(xiàn)極端情況(類值聚集在少數(shù)類).
本文針對學(xué)生綜合素質(zhì)評估需求和經(jīng)典樸素貝葉斯網(wǎng)絡(luò)聚類存在的問題,結(jié)合樸素貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)和Gibbs sampling[7]進行層次聚類,建立層次樸素貝葉斯網(wǎng)絡(luò)聚類(簡記為HNBC)方法,能夠有效避免使用EM算法所導(dǎo)致的局部最優(yōu)問題,并且將HNBC方法用于學(xué)生綜合素質(zhì)評估還具有魯棒性、靈活性和可擴展性等特點.為檢驗HNBC方法的可靠性,使用國際標準數(shù)據(jù)進行了預(yù)測準確率實驗與分析.
用C,X1,…,Xn表示類變量與屬性變量;c,x1,…,xn是具體的取值;D表示數(shù)據(jù)集;N是數(shù)據(jù)集中的記錄數(shù)量,其中前N*個記錄具有類標簽,后N-N*個記錄沒有類標簽.
HNBC是在聚類結(jié)構(gòu)的基礎(chǔ)上,實現(xiàn)聚類方法的過程.層次聚類可以具有多個層次,依據(jù)學(xué)生綜合素質(zhì)評估特點,本文只研究具有兩個層次的聚類問題.下面給出兩個層次的聚類結(jié)構(gòu)和聚類過程.
結(jié)構(gòu)是聚類的基礎(chǔ),根據(jù)結(jié)構(gòu)來確定聯(lián)合概率的分解形式和參數(shù)布局.標準的樸素貝葉斯網(wǎng)絡(luò)聚類采用星形結(jié)構(gòu),HNBC的結(jié)構(gòu)是星形結(jié)構(gòu)的復(fù)合,因此,可將其分解為一些相互關(guān)聯(lián)的星形結(jié)構(gòu),也就是HNBC可分解成具有層次順序的一系列樸素貝葉斯聚類.兩個層次的HNBC結(jié)構(gòu)如圖1所示.
圖1 兩層次HNBC結(jié)構(gòu)
具有兩個層次的HNBC由兩個聚類階段構(gòu)成:一個是下層子聚類;另一個是上層總聚類.首先進行下層子聚類,在下層子聚類預(yù)測結(jié)果的基礎(chǔ)上再進行上層總聚類,最終得到待預(yù)測變量的值.
(1)聚類過程
在HNBC的上下兩個層次中,下層子聚類是依據(jù)Xui1,…,XuIvi(i=1,…,t)通過聚類預(yù)測得到XuI的過程,其中Xui1,…,Xuivi是屬性,有對應(yīng)的數(shù)據(jù),Xui是類,需要進行聚類預(yù)測;上層總聚類是在下層子聚類預(yù)測結(jié)果的基礎(chǔ)上而進行的聚類,即根據(jù)X1,…,Xt通過聚類確定C的過程.X1,…,Xt都是離散指標,它們的數(shù)據(jù)是下層聚類的結(jié)果,上層聚類預(yù)測的結(jié)果便是所需要的最終結(jié)果.
(2)聚類特征
HNBC非常靈活.聚類結(jié)構(gòu)中的葉子結(jié)點(如圖1中的Xui1,…,Xuivi)既可以是離散屬性,也可以是連續(xù)屬性.在局部的樸素貝葉斯聚類中,屬性結(jié)點可以是葉子結(jié)點,也可以是中間非葉子結(jié)點,當然如果是非葉子結(jié)點,需要先進行下層聚類,以確定這些非葉子結(jié)點對應(yīng)變量的值.
(3)聚類的可擴展性
在圖1給出的兩層次HNBC模型中,Xuivi是樹的葉子結(jié)點,也可以對模型進行擴展,擴展后的Xuivi不再是葉子結(jié)點,而是中間結(jié)點.既可以進行完全擴展(所有葉子節(jié)點都擴展),也可以進行部分擴展(只擴展部分葉子結(jié)點),根據(jù)實際情況而定.也就是,一個非根結(jié)點,既可以表示一個變量,也能夠代表一個樸素貝葉斯聚類模型,還可以是HNBC模型.但擴展的層數(shù)不宜太多,多層次聚類可能會降低預(yù)測的可靠性,因為存在層次誤差累計效應(yīng).
由于HNBC包含兩個層次的聚類,上層聚類(離散屬性聚類)所采用的方法可以看做是下層聚類(混合屬性聚類)的特殊情況,因此,只給出下層混合數(shù)據(jù)聚類方法.為表述的方便,屬性和類變量仍用X1,…,Xn,C表示,S表示星形結(jié)構(gòu).
確定類值的方法:
依據(jù)星形結(jié)構(gòu)S所蘊含的變量之間條件獨立性,得到聯(lián)合概率的分解式為:
其中:p(c)是類先驗概率,p(xi|c,S)是條件概率(Xi是離散變量)或條件密度(Xi是連續(xù)變量).對給定的類數(shù),隨機初始化C的值,并對C的值進行迭代修正,直到迭代趨于穩(wěn)定.在每一次迭代中,按數(shù)據(jù)集中記錄的順序依次對類變量C的值進行修正,修正完所有記錄中的C值實現(xiàn)一次迭代.
設(shè)在第m個記錄C具有待修正值cm,Xi的值為xmi,^cm表示cm經(jīng)過修正后的值,變量C的可能取值為c1,…,crc.用D(k-1)表示第k次迭代修正前的數(shù)據(jù)集,D(k-1)n表示第k次迭代修正中對cm修正后的數(shù)據(jù)集,D(k)表示第k次迭代修正后的數(shù)據(jù)集.
對于離散屬性Xi,只需采用最大似然方法估計(使用頻率估計概率)屬性條件概率即可.
對于連續(xù)屬性Xi,使用高斯函數(shù)估計屬性條件密度,即
基于HNBC方法進行學(xué)生綜合素質(zhì)評估,首先需要建立指標體系,然后依據(jù)指標體系確定聚類結(jié)構(gòu),結(jié)合聚類結(jié)構(gòu)和Gibbs sampling才可進行聚類.
采用三級指標體系,當然模型同樣適合于多級指標體系,下面給出一個可用于學(xué)生綜合素質(zhì)評估的指標體系.
(1)一級指標
學(xué)生綜合素質(zhì)等級(C),共4個級別:A級(高)、B級(較高)、C級(一般)和D級(較低).
(2)二級指標
學(xué)生綜合素質(zhì)所屬的二級指標是:知識結(jié)構(gòu)(X1)、認知結(jié)構(gòu)(X2)、人格形成(X3).它們都分三個等級,分別為:A級(好)、B級(中)和C級(差).
(3)三級指標
知識結(jié)構(gòu)所屬的三級指標是:概念學(xué)習(xí)(X11)、規(guī)則掌握(X12)、問題解決(X13).
認知結(jié)構(gòu)所屬的三級指標是:輸入能力(X21)、存儲能力(X22)、加工能力(X23)、內(nèi)部動力(X24)、外部動力(X25)、大認知策略(X26)、中認知策略(X27)、小認知策略(X28).
人格形成所屬的三級指標是:責(zé)任心(X31)、自信心(X32)、獨立性(X33)、刻苦精神(X34)、忍耐力(X35)、經(jīng)受挫折能力(X36)、融入社會能力(X37).
第三級指標既可以是離散指標,也可以是連續(xù)指標,根據(jù)實際情況而定,在三級指標的下面還可以擴展出四級指標,對多級指標的聚類預(yù)測方法與三級指標類似.
根據(jù)上面的學(xué)生綜合素質(zhì)評估指標體系可得到HNBC結(jié)構(gòu)如圖2:
圖2 用于學(xué)生綜合素質(zhì)評估的HNBC結(jié)構(gòu)
基于聚類結(jié)構(gòu)和歷史數(shù)據(jù)進行概率和密度估計,從而得到用于學(xué)生綜合素質(zhì)評估的HNBC模型,輸入學(xué)生綜合素質(zhì)的最新信息通過聚類運算便可獲得該學(xué)生的綜合素質(zhì)等級.
在UCI機器學(xué)習(xí)數(shù)據(jù)倉庫[8]中選擇10個分類數(shù)據(jù)集,只保留不足4%的類標簽,對去除類標簽的記錄分別進行分類和聚類預(yù)測,并將預(yù)測結(jié)果與真正的類標簽進行比較獲得預(yù)測準確率,情況如表1所示.其中NBCA,CPA和PI分別表示樸素貝葉斯網(wǎng)絡(luò)分類器的分類準確率(naive Bayesian network classing accuracy)、聚類預(yù)測準確率(clustering prediction accuracy)和提高百分率(percentage increase).
表1 預(yù)測準確率比較
根據(jù)表1中的數(shù)據(jù)可以計算出,NBCA的平均聚類預(yù)測準確率是64.91%,CPA的預(yù)測準確率是83.88%,平均提高幅度是29.22%.可見CPA方法更加準確,將其用于學(xué)生綜合素質(zhì)評估,其評估結(jié)果的判斷也將更加可靠.
本文根據(jù)學(xué)生發(fā)展的特點,建立了一種學(xué)生綜合素質(zhì)評估的層次樸素貝葉斯網(wǎng)絡(luò)聚類模型,其中的三級指標可以是離散指標,也可以是連續(xù)指標.模型對例子數(shù)量沒有具體要求,甚至在沒有例子的情況下也能夠提煉出規(guī)則進行識別和判斷,尤其適合于大量學(xué)生的一次性綜合素質(zhì)評估.這種模型在評估過程中還具有魯棒性、靈活性和可擴展性等特點,并且能夠廣泛用于其他領(lǐng)域的評估.
[1] 支敏,盧云輝.基于 AHP的大學(xué)生綜合素質(zhì)評估[J].貴州民族學(xué)院學(xué)報:哲學(xué)社會科學(xué)版,2006,4:168-171.
[2] 胡習(xí)文.基于FNN的智能學(xué)生綜合素質(zhì)評估模型研究[J].武漢理工大學(xué)學(xué)報:信息與管理工程版,2007,29(3):103-107.
[3] 黃僑,林陽子,任遠.基于關(guān)聯(lián)度的預(yù)應(yīng)力混凝土梁橋綜合評估方法[J].武漢理工大學(xué)學(xué)報,2007,29(7):13-17.
[4] 辛楓冬,趙國杰.企業(yè)領(lǐng)導(dǎo)者隱性知識結(jié)構(gòu)的模糊綜合評判[J].統(tǒng)計與決策,2010,26(2):174-176.
[5] 胡勇,吳少華,胡朝浪.信息系統(tǒng)風(fēng)險灰色評估方法[J].計算機應(yīng)用研究,2008,25(8):2477-2479.
[6] CHEESEMAN P,KELLY J,SELF M,et al.Autoclass:a Bayesian classification system[C]//LAIRD J,SAN MATEO.Proceedings of the 15th International Conference on Machine Learning,CA:Morgan Kaufmann,1988,54-64.
[7] GEMAN S,GEMAN D.Stochastic relaxation,gibbs distributions and the Bayesian restoration of images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1984,6:721-742.
[8] MURPHY S L,AHA D W.UCI repository of machine learning databases[EB/OL].[2010-10-15].http://www.ics.uci.edu/~mlearn/MLRepository.Html.
The clustering method of hierarchical naive Bayesian network for student comprehensive quality assessment
LI Lan-chun1,WANG Shuang-cheng2,WANG Hui3
(1.School of Foreign Studies,Shanghai Lixin University of Commerce,Shanghai 201620,China;
2.School of Mathematics and Information,Shanghai Lixin University of Commerce,Shanghai 201620,China;
3.School of Information Engineering,The Central University for Nationalities,Beijing 100081,China)
The student comprehensive quality assessment is one effective way for testing student overall level of development.A hierarchical naive Bayesian network clustering method is developed for student comprehensive quality assessment based on the features of student comprehensive quality assessment and the problems in existing assessment methods.This method not need many examples.Even if no example,it can also extracte rules and do prediction.The experimental results show that the method has very good prediction accuracy so that it will be more reliable to assess student comprehensive quality.
student comprehensive quality assessment;assessment;hierarchical naive Bayesian network;clustering
TP 181
520·20
A
1000-1832(2011)03-0049-05
2010-12-05
國家自然科學(xué)基金資助項目(60675036);教育部人文社科基金資助項目(10YJA630154);上海市教委重點學(xué)科建設(shè)項
目(J51702);上海市教委科研創(chuàng)新重點項目(09zz202).
李蘭春(1959—),女,講師,主要從事教育評估理論與方法研究;王雙成(1958—),男,博士,教授,主要從事計算機智能技術(shù)與應(yīng)用研究;王輝(1961—),男,教授,主要從事決策支持技術(shù)與應(yīng)用研究.
陶 理)