馮 廣,潘庭鋒,伍文燕
(1. 廣東工業(yè)大學(xué) 自動(dòng)化學(xué)院, 廣東 廣州 510006;2. 廣東工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院, 廣東 廣州 510006;3. 廣東工業(yè)大學(xué) 網(wǎng)絡(luò)信息與現(xiàn)代教育技術(shù)中心, 廣東 廣州 510006)
以慕課(Massive Open Online Courses, MOOC)、微課、智慧學(xué)習(xí)空間等線上線下混合的教學(xué)模式是高校進(jìn)行教學(xué)模式改革的熱點(diǎn),特別最近兩年,由于全球化疫情的影響,在線教育更加成為研究的焦點(diǎn)。從課堂教育到在線教育的轉(zhuǎn)變,最大的不同在于學(xué)生學(xué)習(xí)行為的變化,在沒(méi)有老師監(jiān)督的情況下,學(xué)生的學(xué)習(xí)態(tài)度可能會(huì)變得消極。不少研究指出學(xué)習(xí)行為與成績(jī)具有高度相關(guān)性[1-2],保持積極的學(xué)習(xí)狀態(tài)和良好的學(xué)習(xí)行為,是接受在線教育的學(xué)習(xí)者進(jìn)行有效學(xué)習(xí)的重要因素。比起課堂教育,在線教育的優(yōu)勢(shì)在于可以快捷方便地采集學(xué)生的學(xué)習(xí)行為,有利于研究者建立分析模型探索不同行為對(duì)最終成績(jī)的影響,從而制定合適的學(xué)習(xí)策略來(lái)保證學(xué)生具有良好的學(xué)習(xí)行為。對(duì)于一個(gè)分析模型而言,模型的可解釋性有利于揭示數(shù)據(jù)間的依賴(lài)關(guān)系,使得模型可信度更高,因而備受關(guān)注。
由于互聯(lián)網(wǎng)教育的廣泛發(fā)展,近年來(lái)研究學(xué)生在線學(xué)習(xí)行為與學(xué)習(xí)成績(jī)的關(guān)系成為了數(shù)據(jù)挖掘領(lǐng)域一個(gè)新的研究熱點(diǎn)[3-4]。Morris等[5]收集3門(mén)本科通識(shí)教育課程中共354名學(xué)生對(duì)應(yīng)的8種學(xué)習(xí)行為,使用SPSS(Statistical Product and Service Solutions)中多元回歸模型進(jìn)行分析,得到其中3種(查看的討論帖子數(shù)量、查看的內(nèi)容頁(yè)面數(shù)量和查看討論的秒數(shù))學(xué)習(xí)行為具有統(tǒng)計(jì)學(xué)顯著性。馬飛等[6]使用基于離差平方和的聚集層次聚類(lèi)算法(Agglomerative Hierarchical Clustering, AHC)和K-means非層次聚類(lèi)算法對(duì)學(xué)習(xí)行為模式進(jìn)行聚類(lèi)分析,將學(xué)習(xí)者分為積極學(xué)習(xí)者、消極學(xué)習(xí)者和惰性學(xué)習(xí)者。牟智佳[7]使用K-means聚類(lèi)分析法進(jìn)行學(xué)習(xí)群體特征分析,將學(xué)習(xí)者分為積極學(xué)習(xí)者、活動(dòng)參與者和活動(dòng)圍觀者,并提出隨著時(shí)間推移,積極學(xué)習(xí)者會(huì)逐漸轉(zhuǎn)變成為活動(dòng)參與者或圍觀者。沈欣憶等[8]采用抽樣和逐步回歸對(duì)學(xué)習(xí)者在線學(xué)習(xí)行為建模分析,證明學(xué)生在線學(xué)習(xí)行為具有預(yù)測(cè)學(xué)生學(xué)習(xí)績(jī)效的可能,而且模型系數(shù)能在一定程度上反應(yīng)變量對(duì)學(xué)習(xí)績(jī)效的影響。Wu[9]使用決策樹(shù)模型,對(duì)學(xué)習(xí)行為進(jìn)行分析建模并應(yīng)用在教學(xué)決策系統(tǒng)中。陳德鑫等[10]指出,深度學(xué)習(xí)在教育大數(shù)據(jù)領(lǐng)域可應(yīng)用于學(xué)習(xí)追蹤、預(yù)測(cè)、教學(xué)輔助及行為分析。孫霞等[11]使用基于卷積神經(jīng)網(wǎng)絡(luò)以及長(zhǎng)短期記憶網(wǎng)絡(luò)組成的混合預(yù)測(cè)模型對(duì)在線學(xué)習(xí)者的輟學(xué)行為進(jìn)行預(yù)測(cè)。胡航等[12]使用weka(Waikato Environment for Knowledge Analysis)軟件對(duì)深度神經(jīng)網(wǎng)絡(luò)與機(jī)器學(xué)習(xí)模型進(jìn)行對(duì)比,而且通過(guò)不同場(chǎng)景學(xué)習(xí)行為日志數(shù)據(jù)進(jìn)行學(xué)習(xí)預(yù)測(cè),神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)出更高的準(zhǔn)確率,但解釋性較差。在目前的推理領(lǐng)域和因果分析中,貝葉斯網(wǎng)絡(luò)的應(yīng)用非常廣泛。如楊婷等[13]基于信息增益對(duì)樸素貝葉斯分類(lèi)屬性進(jìn)行加權(quán)改進(jìn),并將其應(yīng)用于電信用戶(hù)流失的研究中;蔡瑞初等[14]將貝葉斯網(wǎng)絡(luò)應(yīng)用于基因組關(guān)聯(lián)分析中,探究基因變異間的因果關(guān)系;Moe[15]指出,貝葉斯網(wǎng)絡(luò)模型的使用對(duì)環(huán)境風(fēng)險(xiǎn)評(píng)估的發(fā)展有較大作用;方媛等[16]基于貝葉斯網(wǎng)絡(luò)建立多目標(biāo)決策模型,對(duì)公眾參與公私合營(yíng)項(xiàng)目進(jìn)行決策分析,在考慮投資者和社會(huì)公眾的利益關(guān)系下對(duì)項(xiàng)目進(jìn)行決策規(guī)劃,進(jìn)而保證項(xiàng)目的順利推進(jìn)。
對(duì)于傳統(tǒng)的邏輯回歸模型而言,影響因素之間的相互作用會(huì)對(duì)分析結(jié)果產(chǎn)生影響,甚至產(chǎn)生嚴(yán)重的多重線性干擾從而降低其模型的準(zhǔn)確性,并且目前廣泛使用的深度學(xué)習(xí)模型無(wú)法很好地表現(xiàn)出可解釋性。另外,貝葉斯網(wǎng)絡(luò)在MOOC上的應(yīng)用目前僅局限于樸素貝葉斯分類(lèi)[7,17],而未考慮使用貝葉斯網(wǎng)絡(luò)研究變量與結(jié)果之間的影響程度??紤]到以上因素,本研究使用K2算法進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí),通過(guò)貝葉斯估計(jì)法計(jì)算其結(jié)構(gòu)參數(shù),并在構(gòu)建網(wǎng)絡(luò)模型的基礎(chǔ)上使用Junction Tree算法進(jìn)行推理,通過(guò)概率分析研究不同學(xué)習(xí)行為對(duì)在線學(xué)習(xí)成績(jī)的影響程度。
貝葉斯網(wǎng)絡(luò)是概率模型圖,在推理和不確定知識(shí)表達(dá)中被廣泛應(yīng)用,可表示為G=〈S,P〉,S表示網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),為有向無(wú)環(huán)圖,P表示不同結(jié)點(diǎn)的概率分布。結(jié)點(diǎn)代表不同的變量,有向邊代表了結(jié)點(diǎn)之間的相互關(guān)系,通過(guò)條件概率表來(lái)反映這種相互關(guān)系的強(qiáng)弱。貝葉斯網(wǎng)絡(luò)推理模型流程圖如圖1所示,離散的數(shù)據(jù)預(yù)處理后,由互信息值決定結(jié)點(diǎn)順序后,通過(guò)K2算法根據(jù)評(píng)分p學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu),在生成的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)中使用貝葉斯估計(jì)方法進(jìn)行參數(shù)學(xué)習(xí),再基于聯(lián)合樹(shù)推理算法,在已知證據(jù)的情況下最終計(jì)算得出推理結(jié)果。
圖1 貝葉斯網(wǎng)絡(luò)推理模型流程圖Fig.1 Flow chart of Bayesian network reasoning model
貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)是通過(guò)分析數(shù)據(jù),在基于先驗(yàn)知識(shí)的前提下求出結(jié)點(diǎn)之間的依賴(lài)關(guān)系,進(jìn)而求得拓?fù)浣Y(jié)構(gòu)。貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí)算法可分為3種:基于依賴(lài)統(tǒng)計(jì)分析的方法利用統(tǒng)計(jì)或者信息論的方法來(lái)分析變量之間的關(guān)系,根據(jù)條件獨(dú)立性檢驗(yàn)找到網(wǎng)絡(luò)的依賴(lài)結(jié)構(gòu);基于評(píng)分搜索的方法結(jié)合評(píng)分函數(shù)和搜索算法搜索出評(píng)分最高的網(wǎng)絡(luò)結(jié)構(gòu);以及混合學(xué)習(xí)方法。本研究基于第2種方法,以CH(Cooper-Herskovits)評(píng)分函數(shù)為評(píng)分準(zhǔn)則,使用K2算法進(jìn)行搜索,具體步驟如下。
(1) 互信息值計(jì)算。對(duì)于離散變量X和Y,互信息值I(X;Y) 表 示Y中包含多少關(guān)于X的信息,計(jì)算公式如式(1)所示。
根據(jù)式(1),計(jì)算得到各結(jié)點(diǎn)與成績(jī)之間的互信息值。
(2) 確定結(jié)點(diǎn)排序。根據(jù)互信息值定義,按互信息值從小到大對(duì)所求結(jié)點(diǎn)進(jìn)行排序。
(3) 構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)。在結(jié)構(gòu)學(xué)習(xí)中,網(wǎng)絡(luò)結(jié)構(gòu)G和參數(shù) θG為隨機(jī)變量,假設(shè)數(shù)據(jù)集D是關(guān)于n個(gè)變量{X1,X2,···,Xn} 的 樣 本,G的 可 能 取 值 為 所 有 以{X1,X2,···,Xn} 為 節(jié)點(diǎn)的有向無(wú)環(huán)圖。θG是與G所對(duì)應(yīng)的參數(shù)值。從一個(gè)空白網(wǎng)絡(luò)開(kāi)始,根據(jù)結(jié)點(diǎn)排序遍歷結(jié)點(diǎn),位于待求結(jié)點(diǎn)前且后驗(yàn)概率最大的結(jié)點(diǎn)成為待求結(jié)點(diǎn)的父結(jié)點(diǎn),以此類(lèi)推直到網(wǎng)絡(luò)構(gòu)建完成。假設(shè)參數(shù) θG的先驗(yàn)概率分布服從狄利克雷分布,那么所用的CH評(píng)分函數(shù)的形式為[18]
貝葉斯網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)是根據(jù)已有結(jié)構(gòu)通過(guò)樣本學(xué)習(xí)變量相對(duì)于其父結(jié)點(diǎn)集合的條件概率分布。常見(jiàn)的參數(shù)學(xué)習(xí)方法是最大似然估計(jì)法和貝葉斯方法,本研究采用貝葉斯方法來(lái)對(duì)參數(shù)進(jìn)行學(xué)習(xí)。假設(shè)貝葉斯網(wǎng)絡(luò)參數(shù) θ的先驗(yàn)分布P(θ|G)服從狄利克雷分布,即
由于參數(shù)θ 的后驗(yàn)概率也服從狄利克雷分布,即
則參數(shù)θ 的最大后驗(yàn)概率估計(jì)為
本研究使用的數(shù)據(jù)集xAPI-Edu-Data來(lái)自UCI公開(kāi)數(shù)據(jù)集,數(shù)據(jù)集由480條學(xué)生記錄和16個(gè)特征組成,包括305名男性和175名女性。特征主要分為3大類(lèi):(1) 人口特征,如性別、民族、出生地。(2) 學(xué)術(shù)背景特征,如教育階段、年級(jí)、班級(jí)、課程等。(3) 行為特征,如課堂舉手、瀏覽資源、瀏覽公告、討論次數(shù)、家長(zhǎng)回答調(diào)查、家長(zhǎng)對(duì)學(xué)校滿(mǎn)意度以及學(xué)生缺席天數(shù)。根據(jù)成績(jī)對(duì)數(shù)據(jù)分成3類(lèi),分別對(duì)應(yīng)成績(jī)低中高的學(xué)生。由于原始數(shù)據(jù)較為繁雜,故需要對(duì)數(shù)據(jù)進(jìn)行清洗和離散化,只選取部分學(xué)習(xí)行為特征及其他重要特征。各結(jié)點(diǎn)變量定義及取值如表1所示。
表1 貝葉斯網(wǎng)絡(luò)結(jié)點(diǎn)變量定義及取值Table 1 Definition and value of node variable in Bayesian network
對(duì)原始數(shù)據(jù)進(jìn)行處理后,首先計(jì)算互信息值,通過(guò)互信息值對(duì)結(jié)點(diǎn)進(jìn)行排序,如表2所示,再通過(guò)MATLAB中的FULLBNT工具箱來(lái)對(duì)結(jié)構(gòu)進(jìn)行學(xué)習(xí),設(shè)定最大父結(jié)點(diǎn)個(gè)數(shù)為2,貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)結(jié)果如圖2所示。
表2 成績(jī)與學(xué)生行為變量間的互信息值Table 2 The Mutual Information between students’ scores and behavior variables
貝葉斯網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)可以直觀地觀察變量之間的關(guān)系。首先變量TP沒(méi)有出現(xiàn)在貝葉斯網(wǎng)絡(luò)中,說(shuō)明該變量與其他變量不存在依賴(lài)關(guān)系,根據(jù)圖2的有向邊,可得到變量VR與SAD對(duì)CL產(chǎn)生直接影響,而DC、AV、RH變量則對(duì)CL產(chǎn)生間接影響。
圖2 學(xué)生學(xué)習(xí)行為貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Bayesian network structure of students' learning behavior
通過(guò)MATLAB學(xué)習(xí)參數(shù),得到貝葉斯網(wǎng)絡(luò)參數(shù)。以SAD結(jié)點(diǎn)為例,如表3所示,表中數(shù)據(jù)表示了缺席天數(shù)在瀏覽課件次數(shù)下的后驗(yàn)概率。
表3 結(jié)點(diǎn)SAD的條件概率表Table 3 Conditional probability table of node SAD
為驗(yàn)證貝葉斯模型的有效性,將貝葉斯網(wǎng)絡(luò)學(xué)習(xí)后的參數(shù)與其實(shí)際值進(jìn)行比較,并且使用SPSS統(tǒng)計(jì)軟件通過(guò)多項(xiàng)logistic回歸預(yù)測(cè)條件概率并與貝葉斯網(wǎng)絡(luò)參數(shù)進(jìn)行比較。結(jié)果如表4所示。貝葉斯網(wǎng)絡(luò)學(xué)習(xí)值的最大絕對(duì)誤差為0.001 6,最大相對(duì)誤差為0.066 7,平均絕對(duì)誤差為0.000 7,平均相對(duì)誤差為0.006 9。習(xí)得的貝葉斯網(wǎng)絡(luò)參數(shù)表現(xiàn)出較好的精確度,說(shuō)明該網(wǎng)絡(luò)有效。與多項(xiàng)Logistic回歸相比,貝葉斯網(wǎng)絡(luò)表現(xiàn)出更小的誤差,可驗(yàn)證其有效性。
表4 條件概率對(duì)比結(jié)果(BN:貝葉斯網(wǎng)絡(luò),LG:多項(xiàng)Logistic)Table 4 Conditional probability comparison results (BN: Bayesian Network, LG: Multiple Logistic Regression)
為進(jìn)一步評(píng)價(jià)貝葉斯網(wǎng)絡(luò)的預(yù)測(cè)正確率,將其與目前流行的機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)模型進(jìn)行比較,進(jìn)行對(duì)比實(shí)驗(yàn)的模型分別是決策樹(shù)(Decision Tree,DT)、隨機(jī)森林(Random Forest, RF)、樸素貝葉斯(Na?ve Bayes Model, NBM)、梯度上升決策樹(shù)(Gradient Boosting Decision Tree, GBDT)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)以及混合深度學(xué)習(xí)模型CNN_LSTM[11]。
機(jī)器學(xué)習(xí)模型(決策樹(shù)、隨機(jī)森林等)由sklearn工具包實(shí)現(xiàn),神經(jīng)網(wǎng)絡(luò)模型具體實(shí)現(xiàn)細(xì)節(jié)如表5所示,其中3個(gè)對(duì)比模型的dropout、batch_size、epochs分別為0.3、64、300,均由Keras實(shí)現(xiàn)。
表5 對(duì)比神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置Table 5 Neural network parameter setting
模型預(yù)測(cè)準(zhǔn)確率比較如表6所示,為保證結(jié)果的準(zhǔn)確性,表中數(shù)據(jù)均通過(guò)分別運(yùn)行各模型10次后取平均值得出。結(jié)果表明,本文的BN模型預(yù)測(cè)分類(lèi)準(zhǔn)確率最高,組合型的CNN_LSTM模型比單一的深度學(xué)習(xí)模型(如CNN、LSTM)準(zhǔn)確率要更高,但BN模型比CNN_LSTM略勝一籌,也比常用的機(jī)器學(xué)習(xí)預(yù)測(cè)算法更優(yōu),進(jìn)一步證明其有效性。樸素貝葉斯NBM的正確率與本文的貝葉斯網(wǎng)絡(luò)正確率最為接近,但由于樸素貝葉斯基于各變量間相互獨(dú)立的假設(shè),在現(xiàn)實(shí)場(chǎng)景中難以滿(mǎn)足,而貝葉斯網(wǎng)絡(luò)能兼顧變量之間的依賴(lài)關(guān)系,故該模型能表現(xiàn)出更好的適用性。
表6 模型準(zhǔn)確率比較Table 6 Comparison of model accuracy
本節(jié)通過(guò)聯(lián)合樹(shù)算法,對(duì)上述學(xué)習(xí)到的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)以及參數(shù)進(jìn)行推理,從而分析各學(xué)習(xí)行為因素對(duì)學(xué)生成績(jī)的影響。
聯(lián)合樹(shù)推理首先需要構(gòu)建聯(lián)合樹(shù),然后利用已構(gòu)建的聯(lián)合樹(shù)和參數(shù)進(jìn)行推理。聯(lián)合樹(shù)構(gòu)建算法可表示如下。
1) 生成Moral圖
對(duì)圖中的每一個(gè)結(jié)點(diǎn)X,用無(wú)向邊將其對(duì)應(yīng)的父結(jié)點(diǎn)連接在一起,然后將圖中所有的有向邊改成無(wú)向邊。新添加的邊被稱(chēng)為Moral邊。根據(jù)此步驟,不需要額外邊,因此Moral圖就是它的無(wú)向圖,如圖3(a)所示。
圖3 Moral圖和聯(lián)合樹(shù)Fig.3 Moral Graph and Union Tree
2) Moral圖的三角化
通過(guò)添加邊來(lái)使Moral圖中不存在超過(guò)3個(gè)點(diǎn)的環(huán),從而得到三角化圖。由步驟1得到的Moral圖不存在超過(guò)3個(gè)點(diǎn)的環(huán),因此三角化圖也是Moral圖本身。
3) 找出所有子團(tuán)
步驟2中生成的三角圖中的極大完全子圖就是子團(tuán)。找出三角圖中所有的子團(tuán)。子團(tuán)有[DC AV]、[AV RH]、[RH VR]和[VR SAD CL]共4個(gè)。
4) 建立聯(lián)合樹(shù)
團(tuán)與團(tuán)之間的交集作為連接兩個(gè)團(tuán)結(jié)點(diǎn)的分隔結(jié)點(diǎn),分隔結(jié)點(diǎn)和團(tuán)結(jié)點(diǎn)組合起來(lái)形成聯(lián)合樹(shù)。生成的聯(lián)合樹(shù)如圖3(b)所示。
聯(lián)合樹(shù)構(gòu)建后,會(huì)先經(jīng)歷一個(gè)概率表的轉(zhuǎn)移,即初始化過(guò)程,使樹(shù)趨于一致。在推理階段,在設(shè)定某些結(jié)點(diǎn)的取值作為證據(jù)后,結(jié)點(diǎn)的概率分布改變,一致?tīng)顟B(tài)被破壞,通過(guò)消息傳播使其重新達(dá)到一致?tīng)顟B(tài)。聯(lián)合樹(shù)推理過(guò)程可分為以下3個(gè)步驟。
(1) 初始化:通過(guò)分布函數(shù) φC將貝葉斯網(wǎng)絡(luò)的條件概率表轉(zhuǎn)換到聯(lián)合樹(shù)的每個(gè)結(jié)點(diǎn)中,而且每個(gè)結(jié)點(diǎn)中所有變量的取值都映射到0~1之間。分布函數(shù)φC需要滿(mǎn)足式(6)。
式中:P(U)是貝葉斯網(wǎng)絡(luò)所表示的聯(lián)合概率分布,φCi和 φCj分別表示聯(lián)合樹(shù)中團(tuán)結(jié)點(diǎn)和分隔結(jié)點(diǎn)的能量函數(shù)。
(2) 消息傳播:隨機(jī)選擇一個(gè)結(jié)點(diǎn)作為根結(jié)點(diǎn),將消息傳播過(guò)程分為2個(gè)階段。證據(jù)收集:消息自底向上傳播,傳遞n-1次;證據(jù)擴(kuò)散:消息自頂向下傳播,傳遞n-1次。一共需要2(n-1)次消息傳播。
(3) 計(jì)算推理結(jié)果:當(dāng)再次一致時(shí),可以通過(guò)能量函數(shù)計(jì)算任意變量的概率分布,此時(shí)團(tuán)結(jié)點(diǎn)的能量函數(shù)就是包含其所有變量的聯(lián)合分布函數(shù)。
使用基于MATLAB的FULLBNT工具箱的聯(lián)合樹(shù)推理引擎實(shí)現(xiàn)上述流程,分析學(xué)習(xí)行為對(duì)成績(jī)的影響。表7~11的內(nèi)容均為固定某一變量的值為證據(jù),計(jì)算出在該證據(jù)的情況下成績(jī)的條件概率。
(1) 舉手次數(shù)(RH)對(duì)成績(jī)的影響:由表7可以看出,不同的舉手次數(shù)對(duì)成績(jī)有較大影響,舉手次數(shù)小于30次時(shí)成績(jī)有48.89%的概率低于69分,而當(dāng)舉手次數(shù)大于70次時(shí)成績(jī)低于69分的概率不超過(guò)7%。這說(shuō)明在課堂上舉手次數(shù)越多,學(xué)生的課堂參與度越高,學(xué)生成績(jī)差的可能性越小。
表7 舉手次數(shù)對(duì)成績(jī)的影響Table 7 The influence of the times of raising hands on score
(2) 瀏覽在線課件次數(shù)(VR)對(duì)成績(jī)的影響:從表8可知,瀏覽在線課件次數(shù)小于30次時(shí)對(duì)成績(jī)的影響程度比舉手次數(shù)(RH)要更大,有接近70%的概率成績(jī)低于69分。當(dāng)瀏覽課件次數(shù)位于30~70次時(shí),成績(jī)較大概率分布在70~89分(57.21%),大于70次時(shí),高于70分的概率超過(guò)90%。說(shuō)明瀏覽在線課件次數(shù)對(duì)成績(jī)具有較大的影響,而且在貝葉斯網(wǎng)絡(luò)中二者存在有向邊直接相連,具有直接依賴(lài)關(guān)系,二者結(jié)合證明瀏覽在線課件的次數(shù)對(duì)成績(jī)的貢獻(xiàn)度較高。
表8 瀏覽在線課件次數(shù)對(duì)成績(jī)的影響Table 8 The influence of the times of browsing online courseware on score
(3) 瀏覽學(xué)校公告次數(shù)(AV)對(duì)成績(jī)的影響:由表9可知,在瀏覽學(xué)校公告次數(shù)小于30次時(shí),低成績(jī)和中等成績(jī)的概率接近。但當(dāng)瀏覽公告次數(shù)變高時(shí),低成績(jī)的概率迅速降低,證明瀏覽公告次數(shù)的多少可以體現(xiàn)出學(xué)習(xí)者對(duì)待學(xué)習(xí)是否積極。
表9 瀏覽學(xué)校公告次數(shù)對(duì)成績(jī)的影響Table 9 The influence of the times of browsing school bulletin on score
(4) 課堂討論次數(shù)(DC)對(duì)成績(jī)的影響:由表10可知,課堂討論次數(shù)對(duì)成績(jī)的影響不大,但總體上看,課堂討論次數(shù)越少,成績(jī)低的可能性越高。
表10 課堂討論次數(shù)對(duì)成績(jī)的影響Table 10 The influence of the times of class discussion on score
(5) 學(xué)生缺席天數(shù)(SAD)對(duì)成績(jī)的影響:由表11可知,當(dāng)缺席天數(shù)小于7時(shí),成績(jī)低于69分的概率僅為3.741%,位于中等成績(jī)和高分成績(jī)的分布相差不大,而當(dāng)缺席天數(shù)大于7時(shí),有接近60%的可能性成績(jī)低于69分。缺席天數(shù)與課堂參與程度有較大關(guān)聯(lián),缺席天數(shù)的增加意味著學(xué)生的課堂參與度低,從而導(dǎo)致其成績(jī)的下降。
表11 學(xué)生缺席天數(shù)對(duì)成績(jī)的影響Table 11 The influence of students' absence days on score
貝葉斯網(wǎng)絡(luò)通過(guò)概率表現(xiàn)出學(xué)生學(xué)習(xí)行為對(duì)成績(jī)的影響程度,通過(guò)網(wǎng)絡(luò)結(jié)構(gòu)表示出各因素之間的關(guān)系,有利于找出影響學(xué)生成績(jī)的直接因素。
基于概率計(jì)算的貝葉斯網(wǎng)絡(luò)推理具有良好的可解釋性,其可解釋性具體表現(xiàn)在模型學(xué)得的特征重要性及特征最優(yōu)組合。在貝葉斯網(wǎng)絡(luò)中,特征重要性表現(xiàn)在特征對(duì)結(jié)果的影響程度,如圖2以及表7~11所示,對(duì)成績(jī)有較大影響的特征在貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)中與成績(jī)直接相連,如學(xué)生缺席天數(shù)和課堂討論次數(shù),而影響程度越小的特征節(jié)點(diǎn)則與成績(jī)節(jié)點(diǎn)距離越遠(yuǎn),甚至與成績(jī)之間不存在路徑,如課程類(lèi)型。
除此之外,基于貝葉斯網(wǎng)絡(luò)的聯(lián)合樹(shù)推理還可以生成特征最優(yōu)組合,特征最優(yōu)組合可以表示出當(dāng)結(jié)果為某一值時(shí)特征的最優(yōu)取值情況,即實(shí)現(xiàn)從結(jié)果到原因的診斷推理。如表12所示,當(dāng)成績(jī)低于69分時(shí),特征最優(yōu)組合中缺席天數(shù)大于7,課堂討論、瀏覽公告、瀏覽課件及舉手次數(shù)均小于30次,與成績(jī)高于70分時(shí)的特征取值截然不同,這說(shuō)明不同的特征對(duì)模型的決策行為具有不同的作用。成績(jī)位于70~89分和90~100分的特征最優(yōu)組合相同,可能是由于對(duì)于當(dāng)前使用的學(xué)習(xí)行為特征而言,二者對(duì)應(yīng)的學(xué)習(xí)行為類(lèi)似,在下一步研究中,添加特征數(shù)量可有效改善這一結(jié)果。
表12 不同成績(jī)對(duì)應(yīng)的特征最優(yōu)組合Table 12 The optimal combination of feature values corresponding to the results
(1) 研究的6個(gè)因素中,有5個(gè)因素對(duì)學(xué)生在線學(xué)習(xí)成績(jī)產(chǎn)生影響,其中直接影響因素有學(xué)生瀏覽在線課件次數(shù)以及學(xué)生缺席天數(shù),間接影響有舉手次數(shù)、瀏覽學(xué)校公告次數(shù)和課堂討論次數(shù)。在制定在線教育學(xué)習(xí)策略時(shí),可以考慮當(dāng)上述變量超過(guò)設(shè)置預(yù)警值時(shí),對(duì)學(xué)生進(jìn)行預(yù)警通知,降低其在線學(xué)習(xí)掛科率。
(2) 與多項(xiàng)logistic模型相比,貝葉斯網(wǎng)絡(luò)學(xué)習(xí)的結(jié)果誤差值更小,學(xué)習(xí)精度更高,說(shuō)明本研究模型更加有效。與傳統(tǒng)機(jī)器學(xué)習(xí)模型和深度模型相比,貝葉斯網(wǎng)絡(luò)也表現(xiàn)出不俗的正確率,而且基于概率計(jì)算的推理可解釋性比深度學(xué)習(xí)模型要更強(qiáng)。
(3) 基于貝葉斯網(wǎng)絡(luò)的推理功能,可以通過(guò)條件概率清晰表示不同學(xué)習(xí)行為特征對(duì)成績(jī)的影響程度,相比于深度神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型來(lái)說(shuō)具備較高的可解釋性。
(4) 本研究受數(shù)據(jù)集的影響,特征變量的選擇并不多,未來(lái)將會(huì)考慮采集更多特征的數(shù)據(jù)集進(jìn)行研究。在下一步研究中,會(huì)對(duì)校內(nèi)的教務(wù)系統(tǒng)數(shù)據(jù)以及在線教育平臺(tái)蘊(yùn)瑜課堂的數(shù)據(jù)進(jìn)行分析,從而對(duì)學(xué)生的學(xué)習(xí)情況做出更全面的分析,通過(guò)輔助教學(xué)機(jī)制對(duì)在線課程進(jìn)行調(diào)整以及對(duì)學(xué)生進(jìn)行必要干預(yù),進(jìn)一步提高在線教育的有效性和針對(duì)性。