国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的學(xué)生成績預(yù)測及教學(xué)啟示

2019-04-19 05:24:56于文兵計(jì)春雷
關(guān)鍵詞:學(xué)習(xí)成績向量樣本

呂 品,于文兵,汪 鑫,計(jì)春雷

(上海電機(jī)學(xué)院,上海 201306)

0 引 言

隨著數(shù)據(jù)科學(xué)的快速發(fā)展,越來越多的教育研究者開始將目光聚焦于教育數(shù)據(jù)的挖掘分析[1-3]。目的是利用挖掘得到的結(jié)果幫助教師改進(jìn)教學(xué)方法,幫助學(xué)生改善學(xué)習(xí)過程,幫助教育管理者們優(yōu)化管理決策。而實(shí)現(xiàn)教育數(shù)據(jù)挖掘的重要技術(shù)支撐是機(jī)器學(xué)習(xí)算法。

研究者們通常利用決策樹分析學(xué)生的在線學(xué)習(xí)數(shù)據(jù),并以此預(yù)測學(xué)生的期末考試成績[4];利用樸素貝葉斯算法分析學(xué)生入學(xué)申請背景,幫助教育機(jī)構(gòu)預(yù)測學(xué)生的累計(jì)平均績點(diǎn)[5]。盡管這些研究在一定程度上實(shí)現(xiàn)了學(xué)習(xí)期預(yù)警的作用,但是,它們關(guān)注的重點(diǎn)是學(xué)生的到課率和作業(yè)提交情況等,忽視了影響學(xué)習(xí)成績的其他行為特征,如學(xué)生在課堂上是否積極舉手、積極參與討論以及關(guān)注與該課程相關(guān)信息等。因此,有必要在學(xué)習(xí)成績預(yù)測研究中深入研究這些行為特征,分析它們對學(xué)習(xí)成績的影響,以提高學(xué)習(xí)成績預(yù)測的應(yīng)用價(jià)值。

1 研究對象與研究步驟

1.1 研究對象

文中利用學(xué)生活動跟蹤工具xAPI,從Kalboard 360[4]學(xué)習(xí)管理系統(tǒng)中收集了某國際學(xué)校高一年級學(xué)生春季和秋季2個學(xué)期的學(xué)習(xí)數(shù)據(jù),共480個樣本。其中,春季學(xué)期245名學(xué)生,秋季學(xué)期235名學(xué)生。研究目的旨在通過構(gòu)建學(xué)生學(xué)習(xí)成績預(yù)測模型,挖掘分析影響學(xué)生成績的關(guān)鍵因素,試圖結(jié)合挖掘得到的結(jié)果提出可操作性的教學(xué)策略。

Kalboard 360學(xué)習(xí)管理系統(tǒng)是一個基于云平臺的學(xué)習(xí)管理系統(tǒng),由Nidal khalifeh設(shè)計(jì),其應(yīng)用遍布世界50多個國家[4]。它的核心特征是內(nèi)嵌了教室管理系統(tǒng),使得學(xué)生可以通過各種移動設(shè)備來體驗(yàn)教室內(nèi)外的學(xué)習(xí)環(huán)境,真正實(shí)現(xiàn)了BYOD(bring your own device)的學(xué)習(xí)理念。此外,教師,學(xué)生家長,教育管理者也可通過合適的接口連接到Kalboard 360,使得學(xué)生的學(xué)習(xí)成為一個真正的整體過程。

在研究的480名學(xué)生的樣本數(shù)據(jù)中,每個樣本具有16個特征。這些特征分為四類:人口特征,如性別,國籍,出生地和父母對孩子的監(jiān)管,等等;學(xué)習(xí)背景特征,如教育階段,成績(90-100分的成績類別為優(yōu),用H表示;70-89分的成績類別為中,用M表示;60-69分的成績類別為差,用L表示),年級,上課地點(diǎn),學(xué)期,科目,缺勤天數(shù),等等;家長的行為特征,如父母回答調(diào)查、父母對學(xué)校的滿意度等;學(xué)生的行為特征,如課堂舉手、參與小組討論、訪問資源和瀏覽通告等。學(xué)生的行為特征描述了學(xué)生在學(xué)習(xí)過程中的參與情況。

1.2 研究步驟

文中的研究步驟主要包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、模型構(gòu)建、模型評價(jià)以及模型分析等。數(shù)據(jù)采集階段,利用xAPI接口,收集480名學(xué)生在Kalboard 360學(xué)習(xí)管理系統(tǒng)中春季和秋季2個學(xué)期的學(xué)習(xí)數(shù)據(jù);數(shù)據(jù)預(yù)處理階段,首先分析原始數(shù)據(jù)的特征,以獲得有利于提高模型分類性能的特征子集,其次處理數(shù)據(jù)集中的異常值,最終得到可用于構(gòu)建模型的數(shù)據(jù)集;模型構(gòu)建階段,在經(jīng)過數(shù)據(jù)預(yù)處理階段后得到的數(shù)據(jù)集上訓(xùn)練各種機(jī)器學(xué)習(xí)算法,得到各種預(yù)測模型;模型評價(jià)階段,基于評價(jià)標(biāo)準(zhǔn)選擇性能最優(yōu)的模型;模型分析階段,從教育的角度解釋模型參數(shù)的含義,為教師改進(jìn)教學(xué)方法提供參考。

2 數(shù)據(jù)預(yù)處理

2.1 原始特征分析

許多特征(學(xué)生的性別/父母的受教育程度/父母對孩子的監(jiān)管/學(xué)生的學(xué)習(xí)行為)對學(xué)生的學(xué)習(xí)成績都有影響[6-14]。為了對原始特征進(jìn)行篩選,利用可視化方法分別分析了每一特征與學(xué)習(xí)成績的關(guān)系。得到了缺勤天數(shù)、學(xué)生的監(jiān)護(hù)人、參與小組討論、課堂舉手、訪問課程資源以及瀏覽與該課程相關(guān)通告等特征與學(xué)習(xí)成績具有清晰模式的結(jié)論。為了從理論上進(jìn)一步驗(yàn)證這些行為特征對學(xué)習(xí)成績的影響,繼續(xù)利用特征選取方法對16個原始特征進(jìn)行了重要性排序。

2.2 特征選取

特征選取的目的是從理論角度分析各個特征的有效性,并選擇最有代表性、分類性能最好的特征子集來有效地描述輸入數(shù)據(jù),是構(gòu)建預(yù)測模型之前的一項(xiàng)重要任務(wù)。常用的特征選取方法有2類:基于過濾的方法和基于包裝的方法。由于包裝方法的性能優(yōu)于過濾方法,因此文中選用了基于包裝的特征選取方法—XGB算法(extreme gradient boosting)分析了原始特征重要性的排序情況。分析特征選取的結(jié)果發(fā)現(xiàn):學(xué)生參與課堂討論、訪問課程資源、課堂舉手以及瀏覽與課程相關(guān)的通告是最重要的4個特征,其次是學(xué)生學(xué)習(xí)的科目、學(xué)生所處的教育階段、家長對學(xué)校的滿意程度以及學(xué)生缺勤次數(shù)。

由于文中研究的焦點(diǎn)是研究學(xué)生的行為特征對學(xué)習(xí)成績的影響,因此,結(jié)合原始特征分析的結(jié)果與特征選取的結(jié)果,從16個原始特征中選取了參與小組討論、訪問課程資源、課堂舉手、瀏覽與課程相關(guān)的通告、性別、監(jiān)護(hù)人以及缺勤天數(shù)這7個特征構(gòu)成的特征子集用于構(gòu)建學(xué)習(xí)成績預(yù)測模型。盡管父母的滿意度、學(xué)生所處的教育階段以及學(xué)習(xí)科目這3個特征也比較重要,但是,由于它們并沒有包含學(xué)生在課堂上的任何行為信息,因此,構(gòu)建模型時不予考慮。

3 成績預(yù)測模型構(gòu)建

基于預(yù)處理后的數(shù)據(jù)集,采用10折交叉驗(yàn)證的形式,分別采用感知機(jī)、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)構(gòu)造了3種成績預(yù)測模型。

實(shí)驗(yàn)運(yùn)行的環(huán)境為:Windows 8.1專業(yè)版、Python 3.6、Intel i54210-U以及8 G內(nèi)存。其中,在訓(xùn)練階段,感知機(jī)使用隨機(jī)梯度下降算法估計(jì)參數(shù);支持向量機(jī)的分類決策函數(shù)使用高斯核;使用誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練網(wǎng)絡(luò)。在測試階段,利用訓(xùn)練階段得到的模型對測試集中的數(shù)據(jù)進(jìn)行預(yù)測。10次預(yù)測得到的性能評估值的均值如表1和表2所示。使用的性能評價(jià)標(biāo)準(zhǔn)為正確率、召回率、F值、精確度以及誤分類樣本個數(shù)。正確率是指預(yù)測為某一類別的樣本中真正屬于該類別的樣本的比例;召回率是指預(yù)測為某一類別的真實(shí)類別占所有真實(shí)類別的比例;F值是指正確率與召回率的調(diào)和平均值;精確度是預(yù)測正確的樣本占所有樣本的比例。

表1 三種模型的正確率、召回率與F值的對比

表2 三種模型的精確度與誤分類樣本數(shù)量的對比

在以上三種算法構(gòu)建的模型中,除了基于神經(jīng)網(wǎng)絡(luò)的成績預(yù)測模型在H類別上的召回率上稍高于支持向量機(jī),基于感知機(jī)的成績預(yù)測模型在L類別上的召回率上稍高于支持向量機(jī)之外,基于支持向量機(jī)的成績預(yù)測模型在三種類別上的正確率、F值均最高。此外,在三種成績預(yù)測模型中,利用支持向量機(jī)構(gòu)建的模型誤分類樣本數(shù)量最少,預(yù)測的精確度最高。

因此,文中選擇支持向量機(jī)構(gòu)建成績預(yù)測模型,試圖通過分析模型參數(shù),證實(shí)行為特征對學(xué)習(xí)成績影響的重要性。教師可以通過了解學(xué)生在學(xué)習(xí)過程中的行為特征,發(fā)現(xiàn)并追蹤那些行為特征表現(xiàn)有落后傾向的學(xué)生。通過分析出現(xiàn)這種現(xiàn)象的原因,根據(jù)不同學(xué)生采取提供有針對性的教學(xué)資料或開展個別輔導(dǎo)。

4 模型分析與教學(xué)啟示

4.1 模型分析

分析基于支持向量機(jī)的學(xué)習(xí)成績預(yù)測模型發(fā)現(xiàn),模型分類時使用的支持向量個數(shù)為300。其中,成績類別為H、M和L的支持向量個數(shù)分別為91、136和73。由此可見,在480位學(xué)生組成的樣本集合中,只需300位學(xué)生的學(xué)習(xí)數(shù)據(jù)即可實(shí)現(xiàn)成績預(yù)測。由于篇幅原因,下面列舉其中3個樣本進(jìn)行分析。

以索引號為10的支持向量為例。這是一位成績類別為H的學(xué)生。他的學(xué)習(xí)行為特征分別為:課堂舉手次數(shù)50,訪問與課程相關(guān)資源次數(shù)88,瀏覽與課程相關(guān)通告次數(shù)30,參加小組討論次數(shù)80,缺勤天數(shù)少于7天。該樣本對應(yīng)的特征權(quán)重向量為:[1.062 7 1.059 8 1.654 1 1.495 9 0.809 4 0.845 1 -0.700 3]。對比該學(xué)生的學(xué)習(xí)行為特征數(shù)據(jù)和基于支持向量機(jī)的成績預(yù)測模型得到的權(quán)重向量發(fā)現(xiàn),前4項(xiàng)特征的權(quán)重高于后3項(xiàng)特征,尤其是瀏覽與課程相關(guān)通告和小組討論這2項(xiàng)特征的權(quán)重最高。由此可見,參與小組討論對成績好壞的影響較大。

再以索引號為13的樣本為例。這是一位成績類別為L的學(xué)生。他的學(xué)習(xí)行為特征數(shù)據(jù)分別是:課堂舉手次數(shù)20,訪問與課程相關(guān)資源次數(shù)14,瀏覽與課程相關(guān)通告次數(shù)12,參加小組討論次數(shù)19,缺勤天數(shù)大于7天。該樣本對應(yīng)權(quán)重向量為:[0.487 2 0.275 2 1.349 1 1.532 9 -1.235 4 -1.183 2 -0.799 3]。將其與索引號為10的樣本比較后發(fā)現(xiàn),該樣本所有特征的權(quán)重要比后者小,尤其是課堂舉手和瀏覽與課程相關(guān)的資源。這表明,課堂舉手對成績好壞影響也較大。

索引號為285的樣本對應(yīng)的是一位成績類別為M的學(xué)生。他的學(xué)習(xí)行為特征數(shù)據(jù)分別是:課堂舉手次數(shù)41,訪問與課程相關(guān)資源次數(shù)39,瀏覽與課程相關(guān)通告次數(shù)35,參加小組討論次數(shù)39,缺勤天數(shù)大于7天。該樣本對應(yīng)的權(quán)重向量為:[-0.695 6 -1.505 3 -0.938 7 -0.350 2 0.809 4 0.845 1 -0.799 3]。與索引號為10的樣本比較后發(fā)現(xiàn),該樣本中前4項(xiàng)特征對應(yīng)的權(quán)重全部為負(fù)數(shù),尤其是瀏覽與課程相關(guān)的資源和瀏覽與課程相關(guān)通告這2項(xiàng)特征的權(quán)重。這意味著,一個成績中等的學(xué)生,他的學(xué)習(xí)行為特征比成績優(yōu)的學(xué)生要差,比成績差的學(xué)生要好。

4.2 教學(xué)啟示

基于上述模型分析,提出了如下的教學(xué)建議:

(1)合理運(yùn)用價(jià)值動機(jī)理論,激發(fā)學(xué)生學(xué)習(xí)投入。

通過基于支持向量機(jī)的成績預(yù)測模型可知,學(xué)生的行為特征對成績好壞起著決定性的作用。學(xué)生的行為特征實(shí)質(zhì)是學(xué)生的學(xué)習(xí)投入狀況。學(xué)習(xí)投入[15-16]是衡量學(xué)習(xí)一種最重要的指標(biāo),是學(xué)生在學(xué)習(xí)過程中表現(xiàn)出的一種持續(xù)的、充滿積極情感的學(xué)習(xí)狀態(tài),以活力、奉獻(xiàn)和專注為主要特征,能直接影響學(xué)生的學(xué)習(xí)行為特征。雖然學(xué)生的學(xué)習(xí)投入受諸多復(fù)雜因素的影響,但最主要的因素是學(xué)生的動機(jī)信念[17]。而動機(jī)信念來源于任務(wù)價(jià)值。因此,教師在組織教學(xué)的過程中,需要把學(xué)生學(xué)習(xí)某項(xiàng)知識的過程融入到解決某項(xiàng)實(shí)際任務(wù)的過程中,使學(xué)生在完成該任務(wù)的過程中體驗(yàn)該任務(wù)的價(jià)值。

因此,教師需要通過學(xué)生的學(xué)習(xí)行為特征數(shù)據(jù)反映出的學(xué)習(xí)投入狀況,在組織教學(xué)資源時要注重將傳授的知識與實(shí)際問題相聯(lián)系,讓學(xué)生在解決實(shí)際問題的過程中體驗(yàn)到學(xué)習(xí)的知識與自己的生活主題相關(guān),讓學(xué)生在解決實(shí)際問題的過程中促進(jìn)自我價(jià)值和自我認(rèn)同,從而自覺地進(jìn)行學(xué)習(xí)投入。

(2)合理運(yùn)用內(nèi)隱智力信念調(diào)節(jié)機(jī)制,激發(fā)學(xué)生的學(xué)習(xí)動力。

盡管行為特征對成績有直接的影響,但每一個學(xué)生都是一個具有不同特質(zhì)的個體,即每一個學(xué)生學(xué)習(xí)行為也會受其內(nèi)隱智力信念的影響。內(nèi)隱智力[18]信念指個體對其能力、智力等方面的自我信念,它會影響個體在學(xué)習(xí)中的行為表現(xiàn)。這意味著行為特征表現(xiàn)出來的數(shù)據(jù)值較低的學(xué)生,有可能受其接受能力的影響。因此,教師應(yīng)該采取面談、趣味性比賽或者組織一些特定的教學(xué)活動等措施深入了解行為特征數(shù)據(jù)值較低的那些學(xué)生,掌握他們的內(nèi)隱智力信念差異。正確運(yùn)用智力增長論[19-20]的方法,為這些成績差的學(xué)生提供個性化的教學(xué)指導(dǎo)和學(xué)習(xí)任務(wù),讓他們通過自己的努力、訓(xùn)練、自我調(diào)節(jié)來提升他們的接受能力。

5 結(jié)束語

文中采集了在線學(xué)習(xí)者的人口統(tǒng)計(jì)信息、學(xué)習(xí)背景、家長的行為特征和學(xué)習(xí)者的行為特征等信息作為研究對象的特征,運(yùn)用特征分析和特征選擇,選取了學(xué)習(xí)者參與討論、課堂舉手、訪問與課程相關(guān)資源、瀏覽通告、性別、監(jiān)護(hù)人以及缺勤天數(shù)這7個特征構(gòu)成的特征子集表示每一個研究對象。采用感知機(jī)、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)三種機(jī)器學(xué)習(xí)算法,構(gòu)造了不同的學(xué)習(xí)成績預(yù)測模型。通過比較模型的準(zhǔn)確度、召回率、F值,誤分類樣本數(shù)量和精確度,選擇支持向量機(jī)作為構(gòu)建成績預(yù)測模型的分類算法。通過分析基于支持向量機(jī)的成績預(yù)測模型,發(fā)現(xiàn)影響學(xué)習(xí)成績的主要因素是學(xué)習(xí)者的行為特征。為提高學(xué)習(xí)者的成績,教師在教學(xué)過程中應(yīng)該合理運(yùn)用價(jià)值動機(jī)理論和內(nèi)隱智力信念調(diào)節(jié)機(jī)制,激發(fā)學(xué)生的學(xué)習(xí)投入以及學(xué)生的學(xué)習(xí)動力。

猜你喜歡
學(xué)習(xí)成績向量樣本
向量的分解
用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
聚焦“向量與三角”創(chuàng)新題
名落孫山
推動醫(yī)改的“直銷樣本”
隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
向量垂直在解析幾何中的應(yīng)用
村企共贏的樣本
向量五種“變身” 玩轉(zhuǎn)圓錐曲線
大學(xué)生學(xué)習(xí)動機(jī)與學(xué)習(xí)成績的相關(guān)研究
人間(2015年21期)2015-03-11 15:24:34
色达县| 永福县| 山西省| 襄垣县| 阿合奇县| 新疆| 鲁甸县| 砚山县| 嘉兴市| 区。| 突泉县| 芜湖县| 焦作市| 基隆市| 来安县| 双桥区| 宁城县| 宿迁市| 肥西县| 东辽县| 左云县| 托克逊县| 德清县| 文化| 湘乡市| 云林县| 山东省| 乌鲁木齐市| 易门县| 罗山县| 若羌县| 五莲县| 横山县| 上杭县| 东乌| 赤水市| 固始县| 罗定市| 旺苍县| 即墨市| 河曲县|