李蘭春,王雙成,王 輝
(1.上海立信會(huì)計(jì)學(xué)院外語(yǔ)學(xué)院,上海 201620;2.上海立信會(huì)計(jì)學(xué)院數(shù)學(xué)與信息學(xué)院,上海 201620;3.中央民族大學(xué)信息工程學(xué)院,北京 100081)
課堂教學(xué)評(píng)估的多層次貝葉斯網(wǎng)絡(luò)分類器方法
李蘭春1,王雙成2,王 輝3
(1.上海立信會(huì)計(jì)學(xué)院外語(yǔ)學(xué)院,上海 201620;2.上海立信會(huì)計(jì)學(xué)院數(shù)學(xué)與信息學(xué)院,上海 201620;3.中央民族大學(xué)信息工程學(xué)院,北京 100081)
課堂教學(xué)是為實(shí)現(xiàn)一定的教學(xué)目標(biāo)而展開的信息傳遞、過程控制和策略實(shí)施過程.依據(jù)課堂教學(xué)的特點(diǎn)給出了課堂教學(xué)評(píng)估的指標(biāo)體系,并在此基礎(chǔ)上建立了課堂教學(xué)評(píng)估的層次貝葉斯網(wǎng)絡(luò)分類器模型.為提高分類器的分類識(shí)別準(zhǔn)確率,在連續(xù)屬性中引入形狀參數(shù),實(shí)驗(yàn)結(jié)果顯示,通過形狀參數(shù)的優(yōu)化能夠顯著提高分類器的分類識(shí)別可靠性.
課堂教學(xué);樸素貝葉斯網(wǎng)絡(luò);分類器;評(píng)估
課堂教學(xué)是為實(shí)現(xiàn)一定的教學(xué)目標(biāo),通過信息傳遞、過程控制和策略實(shí)施而展開的師生之間的雙邊活動(dòng).[1-2]課堂教學(xué)已經(jīng)具有悠久的歷史,在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi)仍將是一種主要的教學(xué)方式,也是學(xué)生建立知識(shí)結(jié)構(gòu)、發(fā)展認(rèn)知結(jié)構(gòu)和人格形成的主要途徑.課堂教學(xué)質(zhì)量評(píng)估能夠?yàn)橹贫ǜ茖W(xué)的教學(xué)策略提供具有針對(duì)性的信息,有助于推動(dòng)教學(xué)改革和提高教學(xué)質(zhì)量.目前課堂教學(xué)評(píng)估主要采用三級(jí)指標(biāo)體系[3-4],在指標(biāo)之間具有線性關(guān)系的假設(shè)下,根據(jù)三級(jí)指標(biāo)計(jì)算出二級(jí)指標(biāo),再由二級(jí)指標(biāo)最終確定一級(jí)指標(biāo)的等級(jí).這一等級(jí)判斷過程是一個(gè)層次分類問題(模擬人類概念學(xué)習(xí)與應(yīng)用的技術(shù)),而且基于分類器的課堂教學(xué)質(zhì)量等級(jí)判斷不需要線性關(guān)系的假設(shè),因此在評(píng)價(jià)的可靠性方面具有優(yōu)勢(shì),并可開拓課堂教學(xué)評(píng)估的新思路.
現(xiàn)在已經(jīng)有了許多著名的分類器,如神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹、統(tǒng)計(jì)判別分析和貝葉斯網(wǎng)絡(luò)等,它們?cè)谠S多領(lǐng)域得到了廣泛的應(yīng)用.但這些分類器往往都需要許多例子數(shù)據(jù)進(jìn)行學(xué)習(xí).課堂教學(xué)方面的例子數(shù)據(jù)一般比較少,而且其中的連續(xù)數(shù)據(jù)也不適合于離散化(離散化會(huì)丟失過多的信息).樸素貝葉斯網(wǎng)絡(luò)(naive Bayesian network,簡(jiǎn)記為NBN)[5-6]分類器是目前最適合于小例子集分類預(yù)測(cè)的概率分類器,這種分類器不需要許多例子數(shù)據(jù)用于訓(xùn)練,并且能夠直接處理連續(xù)屬性.在樸素貝葉斯網(wǎng)絡(luò)分類器中處理連續(xù)屬性的核心問題是條件密度估計(jì),目前主要采用兩種方式來(lái)估計(jì)條件密度[7-8]:一種是使用高斯函數(shù)來(lái)估計(jì)屬性條件密度,而高斯函數(shù)可能與實(shí)際密度函數(shù)有較大的差距,從而影響分類器的分類準(zhǔn)確性;另一種是采用高斯核函數(shù)估計(jì)屬性條件密度,高斯核函數(shù)又易于導(dǎo)致對(duì)例子的過度擬合,也同樣會(huì)降低分類器的泛化能力.
本文從課堂教學(xué)的信息傳遞、過程控制和教學(xué)策略三個(gè)方面來(lái)制定課堂教學(xué)質(zhì)量評(píng)估的指標(biāo)體系,并針對(duì)課堂教學(xué)質(zhì)量評(píng)估的實(shí)際情況和需求建立多層次樸素貝葉斯網(wǎng)絡(luò)(mult-h(huán)ierarchical naive Bayesian network,簡(jiǎn)記為MHNBN)分類器模型.為避免使用高斯核函數(shù)估計(jì)屬性條件密度可能導(dǎo)致的對(duì)例子過度擬合問題,在高斯核函數(shù)中引入形狀參數(shù),并通過形狀參數(shù)的優(yōu)化來(lái)提高分類器的分類識(shí)別準(zhǔn)確性.
MHNBN分類器學(xué)習(xí)包括結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)兩部分.結(jié)構(gòu)學(xué)習(xí)一般是依據(jù)專家的領(lǐng)域知識(shí)確定指標(biāo)之間的層次關(guān)系;參數(shù)學(xué)習(xí)是使用例子數(shù)據(jù)進(jìn)行邊緣和條件概率估計(jì),以及在某種分布假設(shè)下的連續(xù)屬性條件密度估計(jì).
NBN分類器基于這樣的假設(shè):當(dāng)類變量給定時(shí),屬性變量之間條件獨(dú)立.這一假設(shè)決定了NBN分類器結(jié)構(gòu)是星形結(jié)構(gòu).MHNBN分類器是NBN分類器的層次組合,下面給出標(biāo)準(zhǔn)NBN分類器結(jié)構(gòu)(用S表示)和一個(gè)三層次MHNBN分類器的層次樹,如圖1所示.
圖1 NBN分類器結(jié)構(gòu)和分類器層次樹
在圖1(a)的標(biāo)準(zhǔn)NBN分類器結(jié)構(gòu)中,類結(jié)點(diǎn)是所有屬性結(jié)點(diǎn)的唯一父結(jié)點(diǎn);圖1(b)是將NBN分類器作為一個(gè)結(jié)點(diǎn)而得到的MHNBN分類器層次結(jié)構(gòu)樹,將圖1(b)的上面兩層展開后的分類器結(jié)構(gòu)如圖2所示.
圖2 展開后的兩層次分類器結(jié)構(gòu)
MHNBN分類器參數(shù)學(xué)習(xí)是依據(jù)例子數(shù)據(jù)估計(jì)概率和密度的過程,以圖2所示的兩層次分類器(分別稱為上層分類器和下層分類器)為例給出參數(shù)學(xué)習(xí)方法.在由一級(jí)和二級(jí)指標(biāo)構(gòu)成的上層分類器中,C和X u1,…,X ut都是離散指標(biāo)變量;而由二級(jí)和三級(jí)指標(biāo)構(gòu)成的下層分類器中,底層指標(biāo)X u11,…,X u1v1,X u21,…,X u2v2,…,X ut1,…,X utvt可以是離散或連續(xù)指標(biāo).
1.2.1 一級(jí)和二級(jí)指標(biāo)邊緣概率估計(jì)
采用最大似然估計(jì)方法,那么,一級(jí)和二級(jí)指標(biāo)需要估計(jì)邊緣概率(先驗(yàn)概率).
一級(jí)指標(biāo)邊緣概率估計(jì):
其中N(c|D)為例子數(shù)據(jù)集D中第c類(C=c)的例子數(shù)量,N(D)為所有例子數(shù)量.
二級(jí)指標(biāo)邊緣概率估計(jì):
其中N(x ui|D)為例子數(shù)據(jù)集D中第x ui類(X ui=x ui)的例子數(shù)量.
1.2.2 二級(jí)和三級(jí)指標(biāo)條件概率或密度估計(jì)
對(duì)于非葉子結(jié)點(diǎn)的二級(jí)或三級(jí)指標(biāo),只需要估計(jì)條件概率;而對(duì)作為葉子結(jié)點(diǎn)的二級(jí)或三級(jí)指標(biāo)可能要估計(jì)條件概率(離散指標(biāo))和條件密度(連續(xù)指標(biāo)).
二級(jí)離散指標(biāo)的條件概率估計(jì):
其中N(x ui,c|D)為第c類中X ui=x ui的例子數(shù)量.
三級(jí)離散指標(biāo)的條件概率估計(jì):
其中N(x ui k,x ui|D)為第x ui類中X uik=x uik的例子數(shù)量.
三級(jí)連續(xù)指標(biāo)的條件密度估計(jì):
以兩個(gè)層次的MHNBN分類器為例,給出MHNBN分類器的表示形式和分類過程.基于貝葉斯網(wǎng)絡(luò)理論和貝葉斯公式,以及圖2中所體現(xiàn)的條件獨(dú)立性關(guān)系,可得:
分類過程是:首先由下層分類器確定二級(jí)指標(biāo)X u1,…,X ut的值,然后再基于上層分類器得到一級(jí)指標(biāo)的值.多層次分類器的分類也是這樣的自下而上的過程.
首先建立課堂教學(xué)評(píng)估指標(biāo)體系,然后結(jié)合指標(biāo)體系與例子數(shù)據(jù)便能夠建立MHNBN分類器,并基于MHNBN分類器進(jìn)行課堂教學(xué)評(píng)估.
指標(biāo)體系是進(jìn)行課堂教學(xué)評(píng)估的前提,依據(jù)教育控制論、系統(tǒng)科學(xué)原理和課堂教學(xué)機(jī)制等建立一個(gè)課堂教學(xué)評(píng)估三級(jí)指標(biāo)體系,也可根據(jù)實(shí)際需要對(duì)指標(biāo)體系進(jìn)行層次擴(kuò)展.
(1)一級(jí)指標(biāo)
課堂教學(xué)等級(jí)(C)分4個(gè)級(jí)別,分別是:A級(jí)(優(yōu)秀),B級(jí)(良好),C級(jí)(一般),D級(jí)(較差).
(2)二級(jí)指標(biāo)
課堂教學(xué)所屬的二級(jí)指標(biāo)是:課堂信息傳遞(X1),課堂教學(xué)控制(X2),課堂教學(xué)策略(X3).它們都分三個(gè)等級(jí),分別是A級(jí)(好),B級(jí)(中)和C級(jí)(差)
(3)三級(jí)指標(biāo)
課堂信息傳遞所屬的三級(jí)指標(biāo):教師向?qū)W生的信息傳遞(語(yǔ)法信息傳遞(X11),語(yǔ)義信息傳遞(X12),語(yǔ)用信息傳遞(X13)),學(xué)生向教師的信息傳遞(反饋信息(X14),前饋信息(X15),退饋信息(X16)).
課堂教學(xué)控制所屬的三級(jí)指標(biāo):知識(shí)結(jié)構(gòu)控制(概念(X21),規(guī)則(X22),問題解決(X23)),認(rèn)知結(jié)構(gòu)控制(認(rèn)知操作(X24),動(dòng)力供給(X25),認(rèn)知策略(X26)),方式控制(程序控制(X27),隨機(jī)控制(X28)).
課堂教學(xué)策略所屬的三級(jí)指標(biāo):講授式教學(xué)(X31),啟發(fā)式教學(xué)(X32),演繹式教學(xué)(X33),概括式教學(xué)(X34),回溯式教學(xué)(X35).
根據(jù)上面的課堂教學(xué)評(píng)估指標(biāo)體系可得到兩層次的MHNBN分類器結(jié)構(gòu),如圖3所示.
圖3 用于課堂教學(xué)評(píng)估的MHNBN分類器結(jié)構(gòu)
基于分類器結(jié)構(gòu)和例子數(shù)據(jù)進(jìn)行參數(shù)估計(jì),從而得到用于課堂教學(xué)評(píng)估的MHNBN分類器,輸入最新課堂教學(xué)信息,通過分類運(yùn)算便可獲得課堂教學(xué)的等級(jí).
在UCI機(jī)器學(xué)習(xí)數(shù)據(jù)倉(cāng)庫(kù)[9]中選擇12個(gè)具有連續(xù)屬性的分類數(shù)據(jù)集,分別使用對(duì)連續(xù)屬性離散化(DNBN)、高斯密度估計(jì)(GNBN)、高斯核密度估計(jì)(GKNBN)和引入形狀數(shù)的高斯核密度估計(jì)(GKSNBN)而得到的NBN分類器進(jìn)行分類預(yù)測(cè),采用10折交叉有效性(10-fold cross-validation)驗(yàn)證方法進(jìn)行分類器的分類準(zhǔn)確性估計(jì),如表1所示.
表1 分類預(yù)測(cè)準(zhǔn)確率比較
從表1中可以看出,DNBN分類器具有良好的分類準(zhǔn)確率,而GKNBN分類器要優(yōu)于DNBN和GNBN分類器,GKSNBN分類器還要優(yōu)于GKNBN分類器.這表明使用把DNBN分類器和GKSNBN分類器層次組合而得到的MHNBN分類器,進(jìn)行課堂教學(xué)評(píng)估等級(jí)判斷將是比較可靠的.
根據(jù)教育控制論、系統(tǒng)科學(xué)原理和課堂教學(xué)機(jī)制等給出了一個(gè)課堂教學(xué)評(píng)估的三級(jí)指標(biāo)體系,在此基礎(chǔ)上,具有針對(duì)性地建立了用于課堂教學(xué)評(píng)估的動(dòng)態(tài)層次樸素貝葉斯網(wǎng)絡(luò)分類器.為提高分類器層次組件的分類準(zhǔn)確性,在連續(xù)屬性的條件密度估計(jì)中引入了形狀參數(shù),并通過形狀參數(shù)的優(yōu)化來(lái)提高分類器的泛化能力,實(shí)驗(yàn)結(jié)果顯示,形狀參數(shù)的優(yōu)化能夠顯著提高分類器的分類準(zhǔn)確性,這表明將其用于課堂教學(xué)質(zhì)量評(píng)估,所得到的評(píng)估識(shí)別結(jié)果會(huì)更加可靠.
[1]王黎.應(yīng)用型本科經(jīng)濟(jì)學(xué)課堂教學(xué)改革探索[J].教育探索,2010,1:64-65
[2]楊金觀,聶建峰.課堂教學(xué)質(zhì)量評(píng)價(jià)——一個(gè)在高校實(shí)際工作中被誤解的概念[J].高教發(fā)展與評(píng)估,2010,1:15-20.
[3]陳弘,李幽錚,鄭鋼.基于AHP法的教師教學(xué)質(zhì)量評(píng)估改進(jìn)模型[J].金陵科技學(xué)院學(xué)報(bào),2010,26(1):31-34.
[4]劉香芹,陳俠.模糊多層次多屬性高校教師教學(xué)質(zhì)量評(píng)估[J].沈陽(yáng)航空工業(yè)學(xué)院學(xué)報(bào),2010,27(2):90-92.
[5]RAMONI M,SEBASTIANI P.Robust Bayes classifiers[J].Artificial Intelligence,2001,125(1/2):209-226.
[6]JING Y S,PAVLOVI C'V,REHG J M.Boosted Bayesian network classifiers[J].Machine Learning,2008,73(2):155-184.
[7]JOHN G H,LANGLEY P.Estimating continuous distributions in Bayesian classifiers.[C]//Proceedings of the 11th International Conference on Uncertainty in Artificial Intelligence,Bec Canada:Qu &Eacute,1995:106-143.
[8]PéREZ A,LARRANAGA P,INZA I.Bayesian classifiers based on kernel density estimation[J].International Journal of Approximate Reasoning:Flexible Classifiers,2009,50(2):341-362.
[9]MURPHY S L,AHA D W.UCI repository of machine learning databases[EB/OR].[2009-12-04].http://www.ics.uci.edu/~mlearn/MLRepository.Html.
The method of mult-h(huán)ierarchical Bayesian network classifier for classroom teaching assessment
LI Lan-chun1,WANG Shuang-cheng2,WANG Hui3
(1.School of Foreign Studies,Shanghai Lixin University of Commerce,Shanghai 201620,China;2.School of Mathematics and Information,Shanghai Lixin University of Commerce,Shanghai 201620,China;3.School of Information Engineering,The Central University for Nationalities,Beijing 100081,China)
The classroom teaching is a process of teaching information transfer,classroom control and implementation of teaching strategies for realizing certain educational objectives.A index system of classroom teaching assessment is presented based on the features of classroom teaching.And a model of mult-h(huán)ierarchical naive Bayesian network classifier is developed for classroom teaching assessment.In order to improve the classification accuracy of classifier,the shape parameter is pulled in continuous attributes.Experimental results show that the reliability of classifier can be significantly improved by shape parameter optimization.
classroom teaching;naive Bayesian network;classifier;assessment
TP 181
520·20
A
1000-1832(2012)01-0050-05
2011-02-04
國(guó)家自然科學(xué)基金資助項(xiàng)目(60675036);教育部人文社科基金資助項(xiàng)目(10YJA630154);上海市教委重點(diǎn)學(xué)科建設(shè)項(xiàng)
目(J51702);上海市教委科研創(chuàng)新重點(diǎn)項(xiàng)目(09zz202).
李蘭春(1959—),女,講師,主要從事教育原理與評(píng)估研究;王雙成(1958—),男,博士,教授,主要從事智能數(shù)據(jù)處理研究;王輝(1961—),男,碩士,教授,主要從事決策支持技術(shù)研究.
陶 理)