国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

利用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)實(shí)現(xiàn)網(wǎng)絡(luò)在線學(xué)習(xí)成績(jī)的概率預(yù)測(cè)方法*

2020-12-07 05:25樊一娜
關(guān)鍵詞:學(xué)業(yè)成績(jī)貝葉斯概率

樊一娜 郎 波

(北京師范大學(xué)珠海分校 珠海 519087)

1 引言

目前已經(jīng)有很多研究者在這方面進(jìn)行了大量的研究工作,主要有Ohia 博士提出的著名的六步模型FAMOUS,主要思想是采集和學(xué)業(yè)成績(jī)相關(guān)的數(shù)據(jù)[1~3],這六個(gè)方面分別是Formulate,Ascertain,Measure,Observe,Use,Strength。Duque等通過(guò)調(diào)查問(wèn)卷進(jìn)行數(shù)據(jù)采集,采用ANOVA方程進(jìn)行建模,對(duì)學(xué)生的學(xué)業(yè)成績(jī)進(jìn)行預(yù)測(cè)。文獻(xiàn)[4]提出了基于Quality Function Deployment(QFD),文獻(xiàn)[5]通過(guò)分析日常學(xué)習(xí)行為并對(duì)學(xué)習(xí)結(jié)果進(jìn)行分類,提出了一種基于學(xué)習(xí)內(nèi)容分析、行為分析、狀態(tài)分析的成績(jī)預(yù)測(cè)模型。而文獻(xiàn)[6]提出的LAOMA 模型則是通過(guò)學(xué)生在學(xué)習(xí)過(guò)程以及課堂內(nèi)外的表現(xiàn)情況對(duì)學(xué)業(yè)成績(jī)進(jìn)行預(yù)測(cè)。文獻(xiàn)[7]通過(guò)若干個(gè)工程項(xiàng)目的數(shù)據(jù),主要討論學(xué)習(xí)的評(píng)價(jià)標(biāo)準(zhǔn)、學(xué)習(xí)經(jīng)歷與最后學(xué)業(yè)成績(jī)之間的關(guān)系。文獻(xiàn)[8]采用象限分析的方法來(lái)研究學(xué)習(xí)滿意度和成就感與最終學(xué)業(yè)成績(jī)之間的關(guān)系。上述研究結(jié)果在成績(jī)預(yù)測(cè)方面已經(jīng)做出了很大的進(jìn)步,沿用的基本上是單點(diǎn)預(yù)測(cè)的方法。但是由于在線學(xué)習(xí)的隨機(jī)性和間歇性,當(dāng)選取的預(yù)測(cè)周期內(nèi)某因素發(fā)生明顯變化時(shí),可能會(huì)導(dǎo)致最終的輸出波動(dòng)比較大,所以,如果對(duì)學(xué)業(yè)成績(jī)進(jìn)行確定性的單點(diǎn)預(yù)測(cè)可能達(dá)不到理想的精度,另外,單點(diǎn)預(yù)測(cè)無(wú)法形成成績(jī)的變化趨勢(shì),導(dǎo)致教學(xué)管理者或者學(xué)習(xí)者本身無(wú)法根據(jù)這種趨勢(shì)及時(shí)對(duì)學(xué)習(xí)狀態(tài)做出調(diào)整,對(duì)在線學(xué)習(xí)者未來(lái)可能發(fā)生的情形及變化難以把握。本文希望能夠給出下一時(shí)刻或時(shí)間段所有可能的數(shù)值及其他能夠影響學(xué)業(yè)成績(jī)的因素所發(fā)生的概率,至少要覆蓋較為全面的預(yù)測(cè)信息,那么利用概率化的方法就顯得更有價(jià)值。利用概率的方法來(lái)進(jìn)行預(yù)測(cè)也有相關(guān)的研究進(jìn)展,例如文獻(xiàn)[9]中利用自回歸時(shí)間序列模型,對(duì)各變量的概率密度函數(shù)進(jìn)行估計(jì)得出先驗(yàn)概率分布,最后應(yīng)用貝葉斯方法進(jìn)行推理來(lái)得出后驗(yàn)概率分布[10]。貝葉斯網(wǎng)絡(luò)是由一組隨機(jī)變量及相關(guān)的條件概率組成的有向無(wú)環(huán)圖,適用于不確定性事務(wù)有條件的依賴多種控制因素的相關(guān)問(wèn)題,目前多應(yīng)用于氣象及水文方面[11~12],但是在在線學(xué)習(xí)成績(jī)預(yù)測(cè)方面尚無(wú)應(yīng)用。而動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)模型加入了時(shí)間信息,對(duì)于受時(shí)間因素影響的問(wèn)題提供了解決途徑[13],這也是本文采用動(dòng)態(tài)貝葉斯來(lái)進(jìn)行成績(jī)預(yù)測(cè)的原因。

2 預(yù)測(cè)概率模型的建立

2.1 模型定義

設(shè)參數(shù)的先驗(yàn)分布為P( w1,w2,…,wn),一般情況下,取具有指數(shù)形式的先驗(yàn)分布,如式(2)所示:

可以得到貝葉斯網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)時(shí),不斷更新的輸入值與預(yù)測(cè)值之間的關(guān)系如式(4)所示:

2.2 利用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)構(gòu)造在線學(xué)習(xí)成績(jī)的概率預(yù)測(cè)模型

建立預(yù)測(cè)模型的第一步是構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)上述分析,本文對(duì)動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)建按照以下步驟進(jìn)行。

1)如何選取節(jié)點(diǎn)變量

在實(shí)際測(cè)試中,以每天為單位對(duì)數(shù)據(jù)進(jìn)行歸一化處理,學(xué)習(xí)者每天學(xué)習(xí)的情況受不同影響因子的作用。為了測(cè)試結(jié)果公平,統(tǒng)一將每天的影響因子歸結(jié)為五類,為了公平起見(jiàn),選取影響因子的標(biāo)準(zhǔn)是盡可能地滿足所有狀態(tài)學(xué)習(xí)的變化,通過(guò)大量的實(shí)驗(yàn)測(cè)試,我們選取作業(yè)分?jǐn)?shù)、提問(wèn)回答、登錄次數(shù)、學(xué)習(xí)時(shí)長(zhǎng)、課程資源訪問(wèn)頻率五個(gè)因素,具體的表現(xiàn)關(guān)系如圖1所示。

圖1 在線學(xué)習(xí)影響因子的變化狀態(tài)

從圖1 中可以看出,這五種影響因子的變化規(guī)律對(duì)每個(gè)學(xué)習(xí)者基本呈現(xiàn)相同的規(guī)律,可以用作統(tǒng)計(jì)參數(shù)使用。每天的實(shí)際影響因子表現(xiàn)為它們的不同組合。用前一日的學(xué)習(xí)數(shù)據(jù)按一定的權(quán)重比例加上當(dāng)天的影響因子構(gòu)成完整的數(shù)據(jù)作為訓(xùn)練樣本,訓(xùn)練目標(biāo)以當(dāng)日的數(shù)據(jù)為基本單位,用當(dāng)日的測(cè)試數(shù)據(jù)及后一日的學(xué)習(xí)狀態(tài)影響因子來(lái)預(yù)測(cè)后一日的學(xué)習(xí)成績(jī),依次迭代下去。

2)如何劃分節(jié)點(diǎn)狀態(tài)

關(guān)鍵節(jié)點(diǎn)選定之后,其狀態(tài)主要考慮一段時(shí)間內(nèi)的變化周期內(nèi),根據(jù)該變量的歷史最大值和最小值,劃分為不同的取值區(qū)間,然后再按照區(qū)間劃分為不同的狀態(tài),形成各自的狀態(tài)空間。

3)如何確定有向邊的關(guān)系

有向邊用來(lái)表示不同節(jié)點(diǎn)的不同狀態(tài)之間互相轉(zhuǎn)移變化的規(guī)律。從在線學(xué)習(xí)的特點(diǎn)來(lái)分析,我們選取的五個(gè)關(guān)鍵因素互相牽制,互相聯(lián)系,每一個(gè)關(guān)鍵節(jié)點(diǎn)的變化都不是獨(dú)立變化的,例如,通常認(rèn)為,“學(xué)習(xí)時(shí)長(zhǎng)”的變化可能會(huì)影響到“作業(yè)分?jǐn)?shù)”的變化,“登錄次數(shù)”的變化也可能與“學(xué)習(xí)時(shí)長(zhǎng)”有很強(qiáng)的關(guān)聯(lián)性,因此,我們可以定義如下因果關(guān)系,如式(5)所示:

式中Pgrade為學(xué)業(yè)成績(jī),t 和t+1 分別表示當(dāng)前時(shí)刻和預(yù)測(cè)時(shí)刻,F(xiàn)t+1表示能夠影響到最終預(yù)測(cè)成績(jī)精度的各個(gè)因素。各個(gè)關(guān)鍵因素之間的因果關(guān)系可以如式(6)表示:

3 學(xué)業(yè)成績(jī)概率分布的計(jì)算

3.1 概率模型節(jié)點(diǎn)參數(shù)的計(jì)算

在成績(jī)預(yù)測(cè)模型結(jié)構(gòu)已經(jīng)確定節(jié)點(diǎn)參數(shù)的前提下,通過(guò)歷史數(shù)據(jù)找出真實(shí)反映各影響因素之間互相依賴的關(guān)系屬性。用極大似然估計(jì)法來(lái)計(jì)算各節(jié)點(diǎn)的條件概率表,具體表示如下:

設(shè)學(xué)生在線學(xué)習(xí)的歷史數(shù)據(jù)為S={S1,S2,…,Sm},似然函數(shù)可定義為

則式(7)可以變化為

在成績(jī)預(yù)測(cè)的模型結(jié)構(gòu)和節(jié)點(diǎn)參數(shù)都確定的前提下,可以用條件概率公式來(lái)預(yù)測(cè)某一時(shí)間段的成績(jī)分布,這是典型的貝葉斯概率推理的問(wèn)題。

3.2 預(yù)測(cè)結(jié)果及相關(guān)分析

為驗(yàn)證本文提出的成績(jī)預(yù)測(cè)概率模型,使用了Python 中的Bayes Network Toolbox 來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)的構(gòu)建。在實(shí)際預(yù)測(cè)中,本文把從教學(xué)平臺(tái)中獲得的歷史數(shù)據(jù)根據(jù)學(xué)生注冊(cè)時(shí)間的先后,學(xué)生能力層級(jí)的高低、所學(xué)課程難度的高低進(jìn)行區(qū)間劃分。然后按照學(xué)完一門課程所花費(fèi)的時(shí)間進(jìn)行時(shí)間片劃分,分別進(jìn)行預(yù)測(cè)。圖2 表示在學(xué)習(xí)初期、期中、期末的三種典型情況。

圖2 學(xué)習(xí)者在三種時(shí)間區(qū)間下的成績(jī)概率分布

4 結(jié)語(yǔ)

在教育云服務(wù)、大數(shù)據(jù)飛速發(fā)展的前提下,學(xué)習(xí)者在網(wǎng)絡(luò)學(xué)習(xí)的活動(dòng)或行為形成了具有多維信息的立體化數(shù)據(jù),通過(guò)對(duì)這些歷史數(shù)據(jù)有效進(jìn)行分析,預(yù)測(cè)出學(xué)生未來(lái)可能的成績(jī)概率分布,能夠及早的發(fā)現(xiàn)存在學(xué)習(xí)障礙和困難的學(xué)生,為有效進(jìn)行教學(xué)干預(yù)提供了科學(xué)化依據(jù)。在線學(xué)習(xí)與傳統(tǒng)學(xué)習(xí)之間的最大區(qū)別就是管理松散、組織靈活,很難有效進(jìn)行教學(xué)監(jiān)督。本研究提供的利用動(dòng)態(tài)貝葉斯方法通過(guò)歷史數(shù)據(jù)的分析來(lái)對(duì)學(xué)生未來(lái)的學(xué)習(xí)成績(jī)進(jìn)行有效預(yù)測(cè),為松散化的在線學(xué)習(xí)進(jìn)行有效教學(xué)管理提供了一種思路。在后期的研究中,我們將融入情感計(jì)算的技術(shù),采集學(xué)習(xí)者的情感特征數(shù)據(jù),使得預(yù)測(cè)數(shù)據(jù)能夠更加準(zhǔn)確地反映學(xué)習(xí)者的真實(shí)狀態(tài),真正使得在線學(xué)習(xí)實(shí)現(xiàn)智能化。

猜你喜歡
學(xué)業(yè)成績(jī)貝葉斯概率
基于回歸分析模型的學(xué)生學(xué)業(yè)成績(jī)差異研究
概率統(tǒng)計(jì)中的決策問(wèn)題
概率統(tǒng)計(jì)解答題易錯(cuò)點(diǎn)透視
淺談體育鍛煉對(duì)中小學(xué)生學(xué)業(yè)成績(jī)的影響
概率與統(tǒng)計(jì)(1)
概率與統(tǒng)計(jì)(2)
基于貝葉斯定理的證據(jù)推理研究
基于貝葉斯解釋回應(yīng)被告人講述的故事
租賃房地產(chǎn)的多主體貝葉斯博弈研究
租賃房地產(chǎn)的多主體貝葉斯博弈研究