基于貝葉斯網(wǎng)絡(luò)模型的在線學(xué)習(xí)行為分析

2022-05-26 07:39潘庭鋒伍文燕

廣東工業(yè)大學(xué)學(xué)報(bào) 2022年3期

馮廣，潘庭鋒，伍文燕

（1. 廣東工業(yè)大學(xué) 自動(dòng)化學(xué)院, 廣東廣州 510006；2. 廣東工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院, 廣東廣州 510006；3. 廣東工業(yè)大學(xué) 網(wǎng)絡(luò)信息與現(xiàn)代教育技術(shù)中心, 廣東廣州 510006）

以慕課(Massive Open Online Courses, MOOC)、微課、智慧學(xué)習(xí)空間等線上線下混合的教學(xué)模式是高校進(jìn)行教學(xué)模式改革的熱點(diǎn)，特別最近兩年，由于全球化疫情的影響，在線教育更加成為研究的焦點(diǎn)。從課堂教育到在線教育的轉(zhuǎn)變，最大的不同在于學(xué)生學(xué)習(xí)行為的變化，在沒(méi)有老師監(jiān)督的情況下，學(xué)生的學(xué)習(xí)態(tài)度可能會(huì)變得消極。不少研究指出學(xué)習(xí)行為與成績(jī)具有高度相關(guān)性[1-2]，保持積極的學(xué)習(xí)狀態(tài)和良好的學(xué)習(xí)行為，是接受在線教育的學(xué)習(xí)者進(jìn)行有效學(xué)習(xí)的重要因素。比起課堂教育，在線教育的優(yōu)勢(shì)在于可以快捷方便地采集學(xué)生的學(xué)習(xí)行為，有利于研究者建立分析模型探索不同行為對(duì)最終成績(jī)的影響，從而制定合適的學(xué)習(xí)策略來(lái)保證學(xué)生具有良好的學(xué)習(xí)行為。對(duì)于一個(gè)分析模型而言，模型的可解釋性有利于揭示數(shù)據(jù)間的依賴(lài)關(guān)系，使得模型可信度更高，因而備受關(guān)注。

由于互聯(lián)網(wǎng)教育的廣泛發(fā)展，近年來(lái)研究學(xué)生在線學(xué)習(xí)行為與學(xué)習(xí)成績(jī)的關(guān)系成為了數(shù)據(jù)挖掘領(lǐng)域一個(gè)新的研究熱點(diǎn)[3-4]。Morris等[5]收集3門(mén)本科通識(shí)教育課程中共354名學(xué)生對(duì)應(yīng)的8種學(xué)習(xí)行為，使用SPSS(Statistical Product and Service Solutions)中多元回歸模型進(jìn)行分析，得到其中3種(查看的討論帖子數(shù)量、查看的內(nèi)容頁(yè)面數(shù)量和查看討論的秒數(shù))學(xué)習(xí)行為具有統(tǒng)計(jì)學(xué)顯著性。馬飛等[6]使用基于離差平方和的聚集層次聚類(lèi)算法(Agglomerative Hierarchical Clustering, AHC)和K-means非層次聚類(lèi)算法對(duì)學(xué)習(xí)行為模式進(jìn)行聚類(lèi)分析，將學(xué)習(xí)者分為積極學(xué)習(xí)者、消極學(xué)習(xí)者和惰性學(xué)習(xí)者。牟智佳[7]使用K-means聚類(lèi)分析法進(jìn)行學(xué)習(xí)群體特征分析，將學(xué)習(xí)者分為積極學(xué)習(xí)者、活動(dòng)參與者和活動(dòng)圍觀者，并提出隨著時(shí)間推移，積極學(xué)習(xí)者會(huì)逐漸轉(zhuǎn)變成為活動(dòng)參與者或圍觀者。沈欣憶等[8]采用抽樣和逐步回歸對(duì)學(xué)習(xí)者在線學(xué)習(xí)行為建模分析，證明學(xué)生在線學(xué)習(xí)行為具有預(yù)測(cè)學(xué)生學(xué)習(xí)績(jī)效的可能，而且模型系數(shù)能在一定程度上反應(yīng)變量對(duì)學(xué)習(xí)績(jī)效的影響。Wu[9]使用決策樹(shù)模型，對(duì)學(xué)習(xí)行為進(jìn)行分析建模并應(yīng)用在教學(xué)決策系統(tǒng)中。陳德鑫等[10]指出，深度學(xué)習(xí)在教育大數(shù)據(jù)領(lǐng)域可應(yīng)用于學(xué)習(xí)追蹤、預(yù)測(cè)、教學(xué)輔助及行為分析。孫霞等[11]使用基于卷積神經(jīng)網(wǎng)絡(luò)以及長(zhǎng)短期記憶網(wǎng)絡(luò)組成的混合預(yù)測(cè)模型對(duì)在線學(xué)習(xí)者的輟學(xué)行為進(jìn)行預(yù)測(cè)。胡航等[12]使用weka(Waikato Environment for Knowledge Analysis)軟件對(duì)深度神經(jīng)網(wǎng)絡(luò)與機(jī)器學(xué)習(xí)模型進(jìn)行對(duì)比，而且通過(guò)不同場(chǎng)景學(xué)習(xí)行為日志數(shù)據(jù)進(jìn)行學(xué)習(xí)預(yù)測(cè)，神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)出更高的準(zhǔn)確率，但解釋性較差。在目前的推理領(lǐng)域和因果分析中，貝葉斯網(wǎng)絡(luò)的應(yīng)用非常廣泛。如楊婷等[13]基于信息增益對(duì)樸素貝葉斯分類(lèi)屬性進(jìn)行加權(quán)改進(jìn)，并將其應(yīng)用于電信用戶(hù)流失的研究中；蔡瑞初等[14]將貝葉斯網(wǎng)絡(luò)應(yīng)用于基因組關(guān)聯(lián)分析中，探究基因變異間的因果關(guān)系；Moe[15]指出，貝葉斯網(wǎng)絡(luò)模型的使用對(duì)環(huán)境風(fēng)險(xiǎn)評(píng)估的發(fā)展有較大作用；方媛等[16]基于貝葉斯網(wǎng)絡(luò)建立多目標(biāo)決策模型，對(duì)公眾參與公私合營(yíng)項(xiàng)目進(jìn)行決策分析，在考慮投資者和社會(huì)公眾的利益關(guān)系下對(duì)項(xiàng)目進(jìn)行決策規(guī)劃，進(jìn)而保證項(xiàng)目的順利推進(jìn)。

對(duì)于傳統(tǒng)的邏輯回歸模型而言，影響因素之間的相互作用會(huì)對(duì)分析結(jié)果產(chǎn)生影響，甚至產(chǎn)生嚴(yán)重的多重線性干擾從而降低其模型的準(zhǔn)確性，并且目前廣泛使用的深度學(xué)習(xí)模型無(wú)法很好地表現(xiàn)出可解釋性。另外，貝葉斯網(wǎng)絡(luò)在MOOC上的應(yīng)用目前僅局限于樸素貝葉斯分類(lèi)[7,17]，而未考慮使用貝葉斯網(wǎng)絡(luò)研究變量與結(jié)果之間的影響程度?？紤]到以上因素，本研究使用K2算法進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)，通過(guò)貝葉斯估計(jì)法計(jì)算其結(jié)構(gòu)參數(shù)，并在構(gòu)建網(wǎng)絡(luò)模型的基礎(chǔ)上使用Junction Tree算法進(jìn)行推理，通過(guò)概率分析研究不同學(xué)習(xí)行為對(duì)在線學(xué)習(xí)成績(jī)的影響程度。

1 構(gòu)建貝葉斯網(wǎng)絡(luò)模型

1.1 貝葉斯網(wǎng)絡(luò)

貝葉斯網(wǎng)絡(luò)是概率模型圖，在推理和不確定知識(shí)表達(dá)中被廣泛應(yīng)用，可表示為G=〈S,P〉，S表示網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)，為有向無(wú)環(huán)圖，P表示不同結(jié)點(diǎn)的概率分布。結(jié)點(diǎn)代表不同的變量，有向邊代表了結(jié)點(diǎn)之間的相互關(guān)系，通過(guò)條件概率表來(lái)反映這種相互關(guān)系的強(qiáng)弱。貝葉斯網(wǎng)絡(luò)推理模型流程圖如圖1所示，離散的數(shù)據(jù)預(yù)處理后，由互信息值決定結(jié)點(diǎn)順序后，通過(guò)K2算法根據(jù)評(píng)分p學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)，在生成的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)中使用貝葉斯估計(jì)方法進(jìn)行參數(shù)學(xué)習(xí)，再基于聯(lián)合樹(shù)推理算法，在已知證據(jù)的情況下最終計(jì)算得出推理結(jié)果。

圖1 貝葉斯網(wǎng)絡(luò)推理模型流程圖Fig.1 Flow chart of Bayesian network reasoning model

1.2 結(jié)構(gòu)學(xué)習(xí)

貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)是通過(guò)分析數(shù)據(jù)，在基于先驗(yàn)知識(shí)的前提下求出結(jié)點(diǎn)之間的依賴(lài)關(guān)系，進(jìn)而求得拓?fù)浣Y(jié)構(gòu)。貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí)算法可分為3種：基于依賴(lài)統(tǒng)計(jì)分析的方法利用統(tǒng)計(jì)或者信息論的方法來(lái)分析變量之間的關(guān)系，根據(jù)條件獨(dú)立性檢驗(yàn)找到網(wǎng)絡(luò)的依賴(lài)結(jié)構(gòu)；基于評(píng)分搜索的方法結(jié)合評(píng)分函數(shù)和搜索算法搜索出評(píng)分最高的網(wǎng)絡(luò)結(jié)構(gòu)；以及混合學(xué)習(xí)方法。本研究基于第2種方法，以CH(Cooper-Herskovits)評(píng)分函數(shù)為評(píng)分準(zhǔn)則，使用K2算法進(jìn)行搜索，具體步驟如下。

(1) 互信息值計(jì)算。對(duì)于離散變量X和Y，互信息值I(X;Y) 表示Y中包含多少關(guān)于X的信息，計(jì)算公式如式(1)所示。

根據(jù)式(1)，計(jì)算得到各結(jié)點(diǎn)與成績(jī)之間的互信息值。

(2) 確定結(jié)點(diǎn)排序。根據(jù)互信息值定義，按互信息值從小到大對(duì)所求結(jié)點(diǎn)進(jìn)行排序。

(3) 構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)。在結(jié)構(gòu)學(xué)習(xí)中，網(wǎng)絡(luò)結(jié)構(gòu)G和參數(shù) θG為隨機(jī)變量，假設(shè)數(shù)據(jù)集D是關(guān)于n個(gè)變量{X1,X2,···,Xn} 的樣本，G的可能取值為所有以{X1,X2,···,Xn} 為節(jié)點(diǎn)的有向無(wú)環(huán)圖。θG是與G所對(duì)應(yīng)的參數(shù)值。從一個(gè)空白網(wǎng)絡(luò)開(kāi)始，根據(jù)結(jié)點(diǎn)排序遍歷結(jié)點(diǎn)，位于待求結(jié)點(diǎn)前且后驗(yàn)概率最大的結(jié)點(diǎn)成為待求結(jié)點(diǎn)的父結(jié)點(diǎn)，以此類(lèi)推直到網(wǎng)絡(luò)構(gòu)建完成。假設(shè)參數(shù) θG的先驗(yàn)概率分布服從狄利克雷分布，那么所用的CH評(píng)分函數(shù)的形式為[18]

1.3 參數(shù)學(xué)習(xí)

貝葉斯網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)是根據(jù)已有結(jié)構(gòu)通過(guò)樣本學(xué)習(xí)變量相對(duì)于其父結(jié)點(diǎn)集合的條件概率分布。常見(jiàn)的參數(shù)學(xué)習(xí)方法是最大似然估計(jì)法和貝葉斯方法，本研究采用貝葉斯方法來(lái)對(duì)參數(shù)進(jìn)行學(xué)習(xí)。假設(shè)貝葉斯網(wǎng)絡(luò)參數(shù) θ的先驗(yàn)分布P(θ|G)服從狄利克雷分布，即

由于參數(shù)θ 的后驗(yàn)概率也服從狄利克雷分布，即

則參數(shù)θ 的最大后驗(yàn)概率估計(jì)為

1.4 實(shí)驗(yàn)及有效性驗(yàn)證

本研究使用的數(shù)據(jù)集xAPI-Edu-Data來(lái)自UCI公開(kāi)數(shù)據(jù)集，數(shù)據(jù)集由480條學(xué)生記錄和16個(gè)特征組成，包括305名男性和175名女性。特征主要分為3大類(lèi)：(1) 人口特征，如性別、民族、出生地。(2) 學(xué)術(shù)背景特征，如教育階段、年級(jí)、班級(jí)、課程等。(3) 行為特征，如課堂舉手、瀏覽資源、瀏覽公告、討論次數(shù)、家長(zhǎng)回答調(diào)查、家長(zhǎng)對(duì)學(xué)校滿(mǎn)意度以及學(xué)生缺席天數(shù)。根據(jù)成績(jī)對(duì)數(shù)據(jù)分成3類(lèi)，分別對(duì)應(yīng)成績(jī)低中高的學(xué)生。由于原始數(shù)據(jù)較為繁雜，故需要對(duì)數(shù)據(jù)進(jìn)行清洗和離散化，只選取部分學(xué)習(xí)行為特征及其他重要特征。各結(jié)點(diǎn)變量定義及取值如表1所示。

表1 貝葉斯網(wǎng)絡(luò)結(jié)點(diǎn)變量定義及取值Table 1 Definition and value of node variable in Bayesian network

對(duì)原始數(shù)據(jù)進(jìn)行處理后，首先計(jì)算互信息值，通過(guò)互信息值對(duì)結(jié)點(diǎn)進(jìn)行排序，如表2所示，再通過(guò)MATLAB中的FULLBNT工具箱來(lái)對(duì)結(jié)構(gòu)進(jìn)行學(xué)習(xí)，設(shè)定最大父結(jié)點(diǎn)個(gè)數(shù)為2，貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)結(jié)果如圖2所示。

表2 成績(jī)與學(xué)生行為變量間的互信息值Table 2 The Mutual Information between students’ scores and behavior variables

貝葉斯網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)可以直觀地觀察變量之間的關(guān)系。首先變量TP沒(méi)有出現(xiàn)在貝葉斯網(wǎng)絡(luò)中，說(shuō)明該變量與其他變量不存在依賴(lài)關(guān)系，根據(jù)圖2的有向邊，可得到變量VR與SAD對(duì)CL產(chǎn)生直接影響，而DC、AV、RH變量則對(duì)CL產(chǎn)生間接影響。

圖2 學(xué)生學(xué)習(xí)行為貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Bayesian network structure of students' learning behavior

通過(guò)MATLAB學(xué)習(xí)參數(shù)，得到貝葉斯網(wǎng)絡(luò)參數(shù)。以SAD結(jié)點(diǎn)為例，如表3所示，表中數(shù)據(jù)表示了缺席天數(shù)在瀏覽課件次數(shù)下的后驗(yàn)概率。

表3 結(jié)點(diǎn)SAD的條件概率表Table 3 Conditional probability table of node SAD

為驗(yàn)證貝葉斯模型的有效性，將貝葉斯網(wǎng)絡(luò)學(xué)習(xí)后的參數(shù)與其實(shí)際值進(jìn)行比較，并且使用SPSS統(tǒng)計(jì)軟件通過(guò)多項(xiàng)logistic回歸預(yù)測(cè)條件概率并與貝葉斯網(wǎng)絡(luò)參數(shù)進(jìn)行比較。結(jié)果如表4所示。貝葉斯網(wǎng)絡(luò)學(xué)習(xí)值的最大絕對(duì)誤差為0.001 6，最大相對(duì)誤差為0.066 7，平均絕對(duì)誤差為0.000 7，平均相對(duì)誤差為0.006 9。習(xí)得的貝葉斯網(wǎng)絡(luò)參數(shù)表現(xiàn)出較好的精確度，說(shuō)明該網(wǎng)絡(luò)有效。與多項(xiàng)Logistic回歸相比，貝葉斯網(wǎng)絡(luò)表現(xiàn)出更小的誤差，可驗(yàn)證其有效性。

表4 條件概率對(duì)比結(jié)果（BN：貝葉斯網(wǎng)絡(luò)，LG：多項(xiàng)Logistic）Table 4 Conditional probability comparison results (BN: Bayesian Network, LG: Multiple Logistic Regression)

1.5 準(zhǔn)確率對(duì)比

為進(jìn)一步評(píng)價(jià)貝葉斯網(wǎng)絡(luò)的預(yù)測(cè)正確率，將其與目前流行的機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)模型進(jìn)行比較，進(jìn)行對(duì)比實(shí)驗(yàn)的模型分別是決策樹(shù)(Decision Tree,DT)、隨機(jī)森林(Random Forest, RF)、樸素貝葉斯(Na?ve Bayes Model, NBM)、梯度上升決策樹(shù)(Gradient Boosting Decision Tree, GBDT)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)以及混合深度學(xué)習(xí)模型CNN_LSTM[11]。

機(jī)器學(xué)習(xí)模型(決策樹(shù)、隨機(jī)森林等)由sklearn工具包實(shí)現(xiàn)，神經(jīng)網(wǎng)絡(luò)模型具體實(shí)現(xiàn)細(xì)節(jié)如表5所示，其中3個(gè)對(duì)比模型的dropout、batch_size、epochs分別為0.3、64、300，均由Keras實(shí)現(xiàn)。

表5 對(duì)比神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置Table 5 Neural network parameter setting

模型預(yù)測(cè)準(zhǔn)確率比較如表6所示，為保證結(jié)果的準(zhǔn)確性，表中數(shù)據(jù)均通過(guò)分別運(yùn)行各模型10次后取平均值得出。結(jié)果表明，本文的BN模型預(yù)測(cè)分類(lèi)準(zhǔn)確率最高，組合型的CNN_LSTM模型比單一的深度學(xué)習(xí)模型(如CNN、LSTM)準(zhǔn)確率要更高，但BN模型比CNN_LSTM略勝一籌，也比常用的機(jī)器學(xué)習(xí)預(yù)測(cè)算法更優(yōu)，進(jìn)一步證明其有效性。樸素貝葉斯NBM的正確率與本文的貝葉斯網(wǎng)絡(luò)正確率最為接近，但由于樸素貝葉斯基于各變量間相互獨(dú)立的假設(shè)，在現(xiàn)實(shí)場(chǎng)景中難以滿(mǎn)足，而貝葉斯網(wǎng)絡(luò)能兼顧變量之間的依賴(lài)關(guān)系，故該模型能表現(xiàn)出更好的適用性。

表6 模型準(zhǔn)確率比較Table 6 Comparison of model accuracy

2 學(xué)習(xí)行為影響因素分析

本節(jié)通過(guò)聯(lián)合樹(shù)算法，對(duì)上述學(xué)習(xí)到的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)以及參數(shù)進(jìn)行推理，從而分析各學(xué)習(xí)行為因素對(duì)學(xué)生成績(jī)的影響。

2.1 聯(lián)合樹(shù)推理基本原理

聯(lián)合樹(shù)推理首先需要構(gòu)建聯(lián)合樹(shù)，然后利用已構(gòu)建的聯(lián)合樹(shù)和參數(shù)進(jìn)行推理。聯(lián)合樹(shù)構(gòu)建算法可表示如下。

1) 生成Moral圖

對(duì)圖中的每一個(gè)結(jié)點(diǎn)X，用無(wú)向邊將其對(duì)應(yīng)的父結(jié)點(diǎn)連接在一起，然后將圖中所有的有向邊改成無(wú)向邊。新添加的邊被稱(chēng)為Moral邊。根據(jù)此步驟，不需要額外邊，因此Moral圖就是它的無(wú)向圖，如圖3(a)所示。

圖3 Moral圖和聯(lián)合樹(shù)Fig.3 Moral Graph and Union Tree

2) Moral圖的三角化

通過(guò)添加邊來(lái)使Moral圖中不存在超過(guò)3個(gè)點(diǎn)的環(huán)，從而得到三角化圖。由步驟1得到的Moral圖不存在超過(guò)3個(gè)點(diǎn)的環(huán)，因此三角化圖也是Moral圖本身。

3) 找出所有子團(tuán)

步驟2中生成的三角圖中的極大完全子圖就是子團(tuán)。找出三角圖中所有的子團(tuán)。子團(tuán)有[DC AV]、[AV RH]、[RH VR]和[VR SAD CL]共4個(gè)。

4) 建立聯(lián)合樹(shù)

團(tuán)與團(tuán)之間的交集作為連接兩個(gè)團(tuán)結(jié)點(diǎn)的分隔結(jié)點(diǎn)，分隔結(jié)點(diǎn)和團(tuán)結(jié)點(diǎn)組合起來(lái)形成聯(lián)合樹(shù)。生成的聯(lián)合樹(shù)如圖3(b)所示。

聯(lián)合樹(shù)構(gòu)建后，會(huì)先經(jīng)歷一個(gè)概率表的轉(zhuǎn)移，即初始化過(guò)程，使樹(shù)趨于一致。在推理階段，在設(shè)定某些結(jié)點(diǎn)的取值作為證據(jù)后，結(jié)點(diǎn)的概率分布改變，一致?tīng)顟B(tài)被破壞，通過(guò)消息傳播使其重新達(dá)到一致?tīng)顟B(tài)。聯(lián)合樹(shù)推理過(guò)程可分為以下3個(gè)步驟。

(1) 初始化：通過(guò)分布函數(shù) φC將貝葉斯網(wǎng)絡(luò)的條件概率表轉(zhuǎn)換到聯(lián)合樹(shù)的每個(gè)結(jié)點(diǎn)中，而且每個(gè)結(jié)點(diǎn)中所有變量的取值都映射到0～1之間。分布函數(shù)φC需要滿(mǎn)足式(6)。

式中：P(U)是貝葉斯網(wǎng)絡(luò)所表示的聯(lián)合概率分布，φCi和 φCj分別表示聯(lián)合樹(shù)中團(tuán)結(jié)點(diǎn)和分隔結(jié)點(diǎn)的能量函數(shù)。

(2) 消息傳播：隨機(jī)選擇一個(gè)結(jié)點(diǎn)作為根結(jié)點(diǎn)，將消息傳播過(guò)程分為2個(gè)階段。證據(jù)收集：消息自底向上傳播，傳遞n-1次；證據(jù)擴(kuò)散：消息自頂向下傳播，傳遞n-1次。一共需要2(n-1)次消息傳播。

(3) 計(jì)算推理結(jié)果：當(dāng)再次一致時(shí)，可以通過(guò)能量函數(shù)計(jì)算任意變量的概率分布，此時(shí)團(tuán)結(jié)點(diǎn)的能量函數(shù)就是包含其所有變量的聯(lián)合分布函數(shù)。

2.2 影響因素推理分析

使用基于MATLAB的FULLBNT工具箱的聯(lián)合樹(shù)推理引擎實(shí)現(xiàn)上述流程，分析學(xué)習(xí)行為對(duì)成績(jī)的影響。表7～11的內(nèi)容均為固定某一變量的值為證據(jù)，計(jì)算出在該證據(jù)的情況下成績(jī)的條件概率。

(1) 舉手次數(shù)(RH)對(duì)成績(jī)的影響：由表7可以看出，不同的舉手次數(shù)對(duì)成績(jī)有較大影響，舉手次數(shù)小于30次時(shí)成績(jī)有48.89%的概率低于69分，而當(dāng)舉手次數(shù)大于70次時(shí)成績(jī)低于69分的概率不超過(guò)7%。這說(shuō)明在課堂上舉手次數(shù)越多，學(xué)生的課堂參與度越高，學(xué)生成績(jī)差的可能性越小。

表7 舉手次數(shù)對(duì)成績(jī)的影響Table 7 The influence of the times of raising hands on score

(2) 瀏覽在線課件次數(shù)(VR)對(duì)成績(jī)的影響：從表8可知，瀏覽在線課件次數(shù)小于30次時(shí)對(duì)成績(jī)的影響程度比舉手次數(shù)(RH)要更大，有接近70%的概率成績(jī)低于69分。當(dāng)瀏覽課件次數(shù)位于30～70次時(shí)，成績(jī)較大概率分布在70～89分(57.21%)，大于70次時(shí)，高于70分的概率超過(guò)90%。說(shuō)明瀏覽在線課件次數(shù)對(duì)成績(jī)具有較大的影響，而且在貝葉斯網(wǎng)絡(luò)中二者存在有向邊直接相連，具有直接依賴(lài)關(guān)系，二者結(jié)合證明瀏覽在線課件的次數(shù)對(duì)成績(jī)的貢獻(xiàn)度較高。

表8 瀏覽在線課件次數(shù)對(duì)成績(jī)的影響Table 8 The influence of the times of browsing online courseware on score

(3) 瀏覽學(xué)校公告次數(shù)(AV)對(duì)成績(jī)的影響：由表9可知，在瀏覽學(xué)校公告次數(shù)小于30次時(shí)，低成績(jī)和中等成績(jī)的概率接近。但當(dāng)瀏覽公告次數(shù)變高時(shí)，低成績(jī)的概率迅速降低，證明瀏覽公告次數(shù)的多少可以體現(xiàn)出學(xué)習(xí)者對(duì)待學(xué)習(xí)是否積極。

表9 瀏覽學(xué)校公告次數(shù)對(duì)成績(jī)的影響Table 9 The influence of the times of browsing school bulletin on score

(4) 課堂討論次數(shù)(DC)對(duì)成績(jī)的影響：由表10可知，課堂討論次數(shù)對(duì)成績(jī)的影響不大，但總體上看，課堂討論次數(shù)越少，成績(jī)低的可能性越高。

表10 課堂討論次數(shù)對(duì)成績(jī)的影響Table 10 The influence of the times of class discussion on score

(5) 學(xué)生缺席天數(shù)(SAD)對(duì)成績(jī)的影響：由表11可知，當(dāng)缺席天數(shù)小于7時(shí)，成績(jī)低于69分的概率僅為3.741%，位于中等成績(jī)和高分成績(jī)的分布相差不大，而當(dāng)缺席天數(shù)大于7時(shí)，有接近60%的可能性成績(jī)低于69分。缺席天數(shù)與課堂參與程度有較大關(guān)聯(lián)，缺席天數(shù)的增加意味著學(xué)生的課堂參與度低，從而導(dǎo)致其成績(jī)的下降。

表11 學(xué)生缺席天數(shù)對(duì)成績(jī)的影響Table 11 The influence of students' absence days on score

貝葉斯網(wǎng)絡(luò)通過(guò)概率表現(xiàn)出學(xué)生學(xué)習(xí)行為對(duì)成績(jī)的影響程度，通過(guò)網(wǎng)絡(luò)結(jié)構(gòu)表示出各因素之間的關(guān)系，有利于找出影響學(xué)生成績(jī)的直接因素。

2.3 可解釋性分析

基于概率計(jì)算的貝葉斯網(wǎng)絡(luò)推理具有良好的可解釋性，其可解釋性具體表現(xiàn)在模型學(xué)得的特征重要性及特征最優(yōu)組合。在貝葉斯網(wǎng)絡(luò)中，特征重要性表現(xiàn)在特征對(duì)結(jié)果的影響程度，如圖2以及表7～11所示，對(duì)成績(jī)有較大影響的特征在貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)中與成績(jī)直接相連，如學(xué)生缺席天數(shù)和課堂討論次數(shù)，而影響程度越小的特征節(jié)點(diǎn)則與成績(jī)節(jié)點(diǎn)距離越遠(yuǎn)，甚至與成績(jī)之間不存在路徑，如課程類(lèi)型。

除此之外，基于貝葉斯網(wǎng)絡(luò)的聯(lián)合樹(shù)推理還可以生成特征最優(yōu)組合，特征最優(yōu)組合可以表示出當(dāng)結(jié)果為某一值時(shí)特征的最優(yōu)取值情況，即實(shí)現(xiàn)從結(jié)果到原因的診斷推理。如表12所示，當(dāng)成績(jī)低于69分時(shí)，特征最優(yōu)組合中缺席天數(shù)大于7，課堂討論、瀏覽公告、瀏覽課件及舉手次數(shù)均小于30次，與成績(jī)高于70分時(shí)的特征取值截然不同，這說(shuō)明不同的特征對(duì)模型的決策行為具有不同的作用。成績(jī)位于70～89分和90～100分的特征最優(yōu)組合相同，可能是由于對(duì)于當(dāng)前使用的學(xué)習(xí)行為特征而言，二者對(duì)應(yīng)的學(xué)習(xí)行為類(lèi)似，在下一步研究中，添加特征數(shù)量可有效改善這一結(jié)果。

表12 不同成績(jī)對(duì)應(yīng)的特征最優(yōu)組合Table 12 The optimal combination of feature values corresponding to the results

3 結(jié)論

(1) 研究的6個(gè)因素中，有5個(gè)因素對(duì)學(xué)生在線學(xué)習(xí)成績(jī)產(chǎn)生影響，其中直接影響因素有學(xué)生瀏覽在線課件次數(shù)以及學(xué)生缺席天數(shù)，間接影響有舉手次數(shù)、瀏覽學(xué)校公告次數(shù)和課堂討論次數(shù)。在制定在線教育學(xué)習(xí)策略時(shí)，可以考慮當(dāng)上述變量超過(guò)設(shè)置預(yù)警值時(shí)，對(duì)學(xué)生進(jìn)行預(yù)警通知，降低其在線學(xué)習(xí)掛科率。

(2) 與多項(xiàng)logistic模型相比，貝葉斯網(wǎng)絡(luò)學(xué)習(xí)的結(jié)果誤差值更小，學(xué)習(xí)精度更高，說(shuō)明本研究模型更加有效。與傳統(tǒng)機(jī)器學(xué)習(xí)模型和深度模型相比，貝葉斯網(wǎng)絡(luò)也表現(xiàn)出不俗的正確率，而且基于概率計(jì)算的推理可解釋性比深度學(xué)習(xí)模型要更強(qiáng)。

(3) 基于貝葉斯網(wǎng)絡(luò)的推理功能，可以通過(guò)條件概率清晰表示不同學(xué)習(xí)行為特征對(duì)成績(jī)的影響程度，相比于深度神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型來(lái)說(shuō)具備較高的可解釋性。

(4) 本研究受數(shù)據(jù)集的影響，特征變量的選擇并不多，未來(lái)將會(huì)考慮采集更多特征的數(shù)據(jù)集進(jìn)行研究。在下一步研究中，會(huì)對(duì)校內(nèi)的教務(wù)系統(tǒng)數(shù)據(jù)以及在線教育平臺(tái)蘊(yùn)瑜課堂的數(shù)據(jù)進(jìn)行分析，從而對(duì)學(xué)生的學(xué)習(xí)情況做出更全面的分析，通過(guò)輔助教學(xué)機(jī)制對(duì)在線課程進(jìn)行調(diào)整以及對(duì)學(xué)生進(jìn)行必要干預(yù)，進(jìn)一步提高在線教育的有效性和針對(duì)性。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡