国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡(luò)學(xué)習(xí)行為與成績的預(yù)測及學(xué)習(xí)干預(yù)模型的設(shè)計

2019-04-01 06:23王改花傅鋼善
中國遠(yuǎn)程教育 2019年2期
關(guān)鍵詞:總成績決策樹學(xué)歷

王改花 傅鋼善

【摘要】網(wǎng)絡(luò)學(xué)習(xí)已成為互聯(lián)網(wǎng)+時代教育發(fā)展的重要組成,如何對網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)行為與成績進(jìn)行預(yù)測,依據(jù)預(yù)測結(jié)果實施學(xué)業(yè)預(yù)警,并為教學(xué)決策提供依據(jù),是網(wǎng)絡(luò)教育需要解決的問題之一,也是教育大數(shù)據(jù)研究的重要問題。本研究采用數(shù)據(jù)挖掘技術(shù)中的決策樹方法對網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)行為與成績進(jìn)行了預(yù)測,構(gòu)建了適應(yīng)性學(xué)習(xí)系統(tǒng)學(xué)習(xí)干預(yù)模型,研究發(fā)現(xiàn)總成績不及格的最高概率是男生、學(xué)習(xí)時間跨度表現(xiàn)較差的最高概率是碩士生、學(xué)習(xí)總時長表現(xiàn)較差的最高概率是男生、平均每次在線學(xué)習(xí)停留時長表現(xiàn)較差的最高概率是男理科生、討論交流表現(xiàn)較差的最高概率是藝術(shù)生、學(xué)習(xí)筆記表現(xiàn)較差的最高概率是女藝術(shù)生、接受反饋數(shù)量較高的最高概率是男生。

【關(guān)鍵詞】? 決策樹;數(shù)據(jù)挖掘;網(wǎng)絡(luò)學(xué)習(xí);學(xué)習(xí)行為;學(xué)習(xí)成績;學(xué)習(xí)干預(yù);適應(yīng)性學(xué)習(xí);學(xué)業(yè)預(yù)警;教學(xué)決策

【中圖分類號】? G434? ? ? 【文獻(xiàn)標(biāo)識碼】? A? ? ? 【文章編號】 1009-458x(2019)2-0039-10

一、引言

截至2017年12月,中國在線教育用戶規(guī)模達(dá)1.55億,較2016年底增加1,754萬人,年增長率為18.8%;在線教育使用率為20.1%,年增長率為12.7%(中國互聯(lián)網(wǎng)絡(luò)信息中心, 2018)。網(wǎng)絡(luò)學(xué)習(xí)已成為互聯(lián)網(wǎng)+時代教育發(fā)展的重要組成?!督逃畔⒒笆濉币?guī)劃》明確指出,依托網(wǎng)絡(luò)學(xué)習(xí)空間逐步實現(xiàn)對學(xué)生日常學(xué)習(xí)情況的大數(shù)據(jù)采集和分析,優(yōu)化教學(xué)模式(中華人民共和國教育部, 2016)。目前關(guān)于教育大數(shù)據(jù)的研究與實踐正處于起步探索階段,推進(jìn)教育大數(shù)據(jù)普及應(yīng)用是當(dāng)前的研究熱點。教育大數(shù)據(jù)研究與實踐一方面對掌握教育發(fā)展現(xiàn)狀、制定科學(xué)教育政策、配置合理的教育資源等具有重要意義;另一方面對實現(xiàn)個性化學(xué)習(xí)、優(yōu)化教學(xué)、多元學(xué)業(yè)評價、實時學(xué)習(xí)預(yù)警等具有重要意義。如何對網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)行為與成績進(jìn)行預(yù)測,依據(jù)預(yù)測結(jié)果實施學(xué)業(yè)預(yù)警,并為教學(xué)決策提供依據(jù),是網(wǎng)絡(luò)教育需要解決的問題之一(徐鵬, 等, 2013; Macfadyen & Dawson, 2010),也是教育大數(shù)據(jù)研究的重要問題(Kostopoulos, et al., 2017)。數(shù)據(jù)挖掘是大數(shù)據(jù)采集和分析的重要技術(shù)手段。

二、研究綜述

對采用數(shù)據(jù)挖掘方法預(yù)測網(wǎng)絡(luò)學(xué)習(xí)者學(xué)習(xí)表現(xiàn)的研究進(jìn)行分析,可發(fā)現(xiàn)如下特點:第一,已有研究主要采用決策樹、回歸分析、神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯、支持向量機(jī)、時序分析、聚類等算法,其中決策樹與回歸分析用得最多。第二,研究內(nèi)容主要集中在成績預(yù)測理論模型的構(gòu)建、成績預(yù)測模型的實證研究、算法準(zhǔn)確性的對比、算法的開發(fā)、預(yù)警因素研究、綜述研究等。關(guān)于成績預(yù)測理論模型的構(gòu)建,這類研究主要采用數(shù)據(jù)挖掘技術(shù)從理論上構(gòu)建成績預(yù)測模型(Ohia, 2011;武法提, 2016; 王林麗, 等, 2016; 牟智佳, 等, 2017a);關(guān)于成績預(yù)測模型的實證研究,這類研究主要開發(fā)成績預(yù)測系統(tǒng)或?qū)崿F(xiàn)成績預(yù)測模型,并將其應(yīng)用于教學(xué)實踐中(Macfadyen & Dawson, 2010; Xing, et al., 2015; 馬杰, 等, 2014; 王亮, 2015; 孫力, 等, 2015, 2016; 陳子健, 等, 2017);關(guān)于算法準(zhǔn)確性的對比研究,這類研究主要是通過對比幾種不同的預(yù)測算法,來發(fā)現(xiàn)預(yù)測準(zhǔn)確性最高的算法(Kostopoulos, et al., 2017; Romero, et al., 2013; Costa, et al., 2017; 牟智佳, 等, 2017b);關(guān)于算法開發(fā),這類研究主要是結(jié)合幾種數(shù)據(jù)挖掘的算法構(gòu)建一種集成分類器,從而提升分類的準(zhǔn)確性(Kotsiantis, et al., 2010; Huang & Fang, 2013);關(guān)于預(yù)警因素研究,這類研究主要是探索哪些屬性和因素能夠較好地預(yù)測學(xué)習(xí)者學(xué)習(xí)績效(Romero, et al., 2013; Pursel, et al., 2016; Barba, et al., 2016; 傅鋼善, 等, 2014; 趙慧瓊, 等, 2017; 牟智佳, 等, 2017b);關(guān)于綜述研究,這類研究主要是對基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究進(jìn)行文獻(xiàn)綜述(肖巍, 等, 2018)。第三,研究工具主要是Weka,其次還有SPSS、SQL Sever 2008 Data Mining、SSAS等。第四,使用的預(yù)測分析變量主要有人口學(xué)變量、個人背景信息、學(xué)習(xí)行為參與變量,用這些變量來預(yù)測學(xué)習(xí)者的總成績(通過或未通過),對學(xué)習(xí)者行為表現(xiàn)的預(yù)測相對較少。第五,研究對象主要是大學(xué)生,數(shù)量大多數(shù)是介于100~500人之間,數(shù)量相對較小。第六,研究正處于起步階段,是未來重要的研究領(lǐng)域,但國內(nèi)研究與國外研究相比,國內(nèi)研究相對起步要晚,研究的廣度與深度有待加強(qiáng)。因此本研究采用數(shù)據(jù)挖掘技術(shù)中的決策樹方法對網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)行為與成績進(jìn)行預(yù)測,設(shè)計適應(yīng)性學(xué)習(xí)系統(tǒng)學(xué)習(xí)干預(yù)模型,以期為教師了解學(xué)習(xí)者的群體特征與改善教學(xué)決策提供數(shù)據(jù)依據(jù),同時為適應(yīng)性推送服務(wù)和有效學(xué)習(xí)提供理論基礎(chǔ)。

三、研究方法

(一)研究對象

自2002年以來,“現(xiàn)代教育技術(shù)”大規(guī)模在線開放課程與時俱進(jìn)、不斷更新,先后以國家精品網(wǎng)絡(luò)課程、國家精品資源共享課、中國大學(xué)MOOC、國家精品在線開放課程等多種形式的大規(guī)模在線開放課程開展網(wǎng)絡(luò)學(xué)習(xí)。2017年被認(rèn)定為首批國家精品在線開放課程。課程豐富的特色資源,靈活多樣的教學(xué)方法和行之有效的學(xué)習(xí)活動,受到學(xué)習(xí)者的普遍好評。

本研究對象為2012~2013學(xué)年第二學(xué)期參加“現(xiàn)代教育技術(shù)”在線開放課程學(xué)習(xí)的陜西師范大學(xué)2,687名大三師范類本科生和210名教育碩士,共計2,897名。在實際學(xué)習(xí)過程中,有56名學(xué)習(xí)者由于種種原因沒有成功注冊參與在線開放課程的學(xué)習(xí),因此有效學(xué)習(xí)人數(shù)為2,841名。通過前期數(shù)據(jù)清洗(即處理原始數(shù)據(jù)中的噪聲數(shù)據(jù)、無關(guān)數(shù)據(jù)、缺失值、臟數(shù)據(jù)、孤立點等),研究對象共剩余2,801名,其中性別分布為943名男生,1,858名女生;學(xué)科背景分布為1,399名理科生,995名文科生,407名藝術(shù)生;學(xué)歷分布為2,657名本科生,144名碩士。為了確保研究結(jié)果的可信,本研究還進(jìn)行了兩次驗證,驗證結(jié)果與本研究結(jié)果一致,本文呈現(xiàn)的是第一次的驗證結(jié)果。

(二)數(shù)據(jù)收集與分析

決策樹是一種常用的數(shù)據(jù)挖掘分類方法,常用于預(yù)測模型,它通過將大量數(shù)據(jù)有目的地分類,從中找到一些具有商業(yè)價值的、潛在的信息。決策樹的結(jié)構(gòu),顧名思義,就像一棵樹,它利用樹結(jié)構(gòu)將數(shù)據(jù)記錄進(jìn)行分類,樹的一個葉節(jié)點就代表某個條件下的一個記錄集,根據(jù)記錄字段的不同取值建立樹的分支;在每個分支子集中重復(fù)建立下層節(jié)點和分支,便可生成一棵決策樹(唐華松, 等, 2001)。決策樹方法的優(yōu)點在于形式簡單,計算復(fù)雜度不高,易于實現(xiàn),輸出結(jié)果易于理解;數(shù)據(jù)的準(zhǔn)備工作簡單,能夠同時處理數(shù)據(jù)型和常規(guī)型屬性,在相對短的時間內(nèi)能夠?qū)Υ笮蛿?shù)據(jù)源做出可行且效果良好的結(jié)果;易于通過靜態(tài)測試來對模型進(jìn)行評測,可以測定模型可信度(王國平, 2014, p.142)。基于文獻(xiàn)綜述與決策樹的優(yōu)點,本研究采用決策樹方法對網(wǎng)絡(luò)學(xué)習(xí)行為與成績進(jìn)行預(yù)測。

本研究的研究工具為SQL Sever 2008 Data Mining,采用Microsoft SQL Server Analysis Services中的Microsoft決策樹算法。該算法是一種混合決策樹算法,支持分類與回歸兩種任務(wù),可以對離散屬性或連續(xù)屬性進(jìn)行預(yù)測性建模,本研究對離散屬性進(jìn)行預(yù)測性建模。數(shù)據(jù)挖掘的過程為問題定義、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、模型評價。

1. 問題定義

本研究采用決策樹挖掘模型對不同性別(UserSex,男、女)、不同學(xué)科背景(Department,文科、理科、藝術(shù))、不同學(xué)歷(Edulevel,本科、碩士)的學(xué)習(xí)者群體學(xué)習(xí)行為特征及總成績進(jìn)行評估與預(yù)測,以期讓教師能夠更加清晰深入地了解每類學(xué)習(xí)者群體的特征,為教育決策提供實證數(shù)據(jù)依據(jù)。

2. 數(shù)據(jù)準(zhǔn)備

為了建立學(xué)習(xí)者模型,必須收集大量的學(xué)習(xí)者信息數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理。因此,需要對模型中所有需要的歷史數(shù)據(jù)進(jìn)行分析和處理,以便充分挖掘出學(xué)習(xí)者的關(guān)鍵行為特征。本研究選取了三類特征數(shù)據(jù):①學(xué)習(xí)者基本特征,即學(xué)習(xí)者資料數(shù)據(jù),該特征數(shù)據(jù)集包括2,841條記錄,每條記錄包括21個特征;②學(xué)習(xí)者行為特征,即學(xué)習(xí)者的學(xué)習(xí)行為特征數(shù)據(jù),該特征數(shù)據(jù)集包含9張表、2,548,709條記錄、137個行為特征;③學(xué)習(xí)者學(xué)習(xí)效果特征,即學(xué)習(xí)者成績,該特征集包含6張表、55,957條記錄。

3. 數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘前期重要的、不可忽視的環(huán)節(jié)。據(jù)統(tǒng)計,在完整的數(shù)據(jù)挖掘過程中,數(shù)據(jù)預(yù)處理要花費60%左右的時間,而后的挖掘工作僅占總工作量的10%左右(元昌安, 2009, p. 40)。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約。通過數(shù)據(jù)預(yù)處理,本研究提取了9個特征,分別為學(xué)習(xí)時間跨度(TotalTime,簡稱TT),即學(xué)習(xí)者從第一次登錄系統(tǒng)到最后一次退出系統(tǒng)的時間周期;學(xué)習(xí)總時長(OnlineMinute,簡稱OM),即學(xué)習(xí)者在該網(wǎng)絡(luò)學(xué)習(xí)平臺上累積的學(xué)習(xí)時間長短;學(xué)習(xí)次數(shù)(LoginNum,簡稱LN),即學(xué)習(xí)者登錄學(xué)習(xí)平臺的次數(shù);平均每次在線學(xué)習(xí)停留時長(AverageTimePerLogin,簡稱ATPL),即學(xué)習(xí)者平均每次學(xué)習(xí)持續(xù)的時間長度;重復(fù)學(xué)習(xí)率(KnowledgePerRepeat,簡稱KPR),即學(xué)習(xí)者平均對每個知識點重復(fù)學(xué)習(xí)的次數(shù);討論交流(簡稱BBS),即參與BBS討論交流的特征;學(xué)習(xí)筆記(簡稱Blog),即學(xué)習(xí)者參與數(shù)字學(xué)習(xí)筆記的特征;接收反饋數(shù)量(SmsInfo,簡稱SI),即學(xué)習(xí)者在學(xué)習(xí)過程中接收督促學(xué)習(xí)信息的數(shù)量;總成績(ScoreTotal,簡稱ST),即學(xué)習(xí)者學(xué)習(xí)總成績。

數(shù)據(jù)清洗,即處理原始數(shù)據(jù)中的噪聲數(shù)據(jù)、無關(guān)數(shù)據(jù)、缺失值、臟數(shù)據(jù)、孤立點等。例如:教育碩士的學(xué)歷信息有誤,通過SQL語言改正;刪除只注冊但并未進(jìn)行學(xué)習(xí)的學(xué)習(xí)者信息、交換生與休學(xué)生信息、考試權(quán)限為0的學(xué)習(xí)者信息;刪除教師、其他用戶(除陜西師范大學(xué))、管理者信息;刪除空缺值信息等。

數(shù)據(jù)集成,即將兩個或多個數(shù)據(jù)源中的數(shù)據(jù),存放在一個一致的數(shù)據(jù)庫中,重點考慮數(shù)據(jù)一致性和冗余。

數(shù)據(jù)變換,即將數(shù)據(jù)變換為適合于數(shù)據(jù)挖掘的形式。包括數(shù)據(jù)泛化、數(shù)據(jù)規(guī)范化、特征構(gòu)造、數(shù)據(jù)離散化。①數(shù)據(jù)泛化,即使用概念分層,用高層概念替換低層或原始數(shù)據(jù)。本研究對專業(yè)通過高層概念學(xué)科背景“理科、文科、藝術(shù)”實現(xiàn)泛化。文科包括歷史文化學(xué)院、文學(xué)院、外國語學(xué)院、政治經(jīng)濟(jì)學(xué)院、心理學(xué)院、教育學(xué)院,理科包括化學(xué)化工學(xué)院、計算機(jī)科學(xué)學(xué)院、旅游與環(huán)境學(xué)院、數(shù)學(xué)與信息科學(xué)學(xué)院、物理學(xué)與信息技術(shù)學(xué)院、生命科學(xué)學(xué)院、新聞與傳播學(xué)院(教育技術(shù)學(xué)專業(yè)),藝術(shù)包括音樂學(xué)院、美術(shù)學(xué)院、體育學(xué)院。②數(shù)據(jù)規(guī)范化,即將原來的度量值轉(zhuǎn)換為無量綱的值。本研究選取最大—最小規(guī)范化,使連續(xù)型數(shù)據(jù)取值范圍為[0-1]。③特征構(gòu)造,即利用已知屬性,構(gòu)造新的屬性,以便更好地刻畫數(shù)據(jù)的特性,幫助數(shù)據(jù)挖掘過程。其目的是幫助提高精度和對高維數(shù)據(jù)結(jié)構(gòu)的理解。但數(shù)據(jù)集的特征維數(shù)并非越高越好,維數(shù)太高容易導(dǎo)致維災(zāi)難,維數(shù)太低又不能有效獲取數(shù)據(jù)集中的重要信息。本研究構(gòu)造的特征包括學(xué)習(xí)時間跨度(如公式1)、平均每次在線學(xué)習(xí)停留時長(如公式2)、重復(fù)學(xué)習(xí)率(如公式3)、討論交流(討論交流與學(xué)習(xí)者的發(fā)主帖數(shù)量、點擊量、被回帖數(shù)量以及回帖數(shù)量、點擊量特征密切相關(guān),且考慮到不同低維特征反映高維特征的重要性不同,為其設(shè)置不同的權(quán)重,如公式4)、學(xué)習(xí)筆記(學(xué)習(xí)筆記與學(xué)習(xí)者的學(xué)習(xí)筆記數(shù)量、更新量、點擊量密切相關(guān),且考慮到不同低維特征反映高維特征的重要性不同,為其設(shè)置不同的權(quán)重,如公式5)、總成績(總成績由網(wǎng)上作業(yè)成績、實踐技能成績、網(wǎng)上考試成績、期末筆試成績構(gòu)成,如公式6)。④數(shù)據(jù)離散化,決策樹要求數(shù)據(jù)是分類屬性,因此需要對數(shù)值進(jìn)行離散化。無監(jiān)督離散化方法主要有等寬離散化、等頻離散化、K均值離散化,K均值性能最好,因此本研究選取K均值離散化方法,結(jié)果如表1、表2所示。

公式1:學(xué)習(xí)時間跨度=學(xué)習(xí)者最后一次退出平臺時間-學(xué)習(xí)者第一次登陸平臺時間…(1)

公式2:平均每次在線學(xué)習(xí)停留時長=學(xué)習(xí)總時長/學(xué)習(xí)次數(shù)…(2)

公式3:重復(fù)學(xué)習(xí)率[=k=0n]學(xué)習(xí)者每個知識點重復(fù)學(xué)習(xí)次數(shù)/學(xué)習(xí)者學(xué)習(xí)知識點總數(shù)…(3)

公式4:討論交流=0.6×(0.4×發(fā)主題帖數(shù)量+0.3×主題帖點擊量+0.3×主題帖被回帖數(shù)量)+0.4×(0.4×回帖數(shù)量+0.6×回帖點擊量)…(4)

公式5:學(xué)習(xí)筆記=0.5×數(shù)量+0.3×更新量+0.2×點擊量…(5)

公式6:總成績=0.1×網(wǎng)上作業(yè)成績+0.2×實踐技能成績+0.2×網(wǎng)上考試成績+0.5×期末筆試成績…(6)

數(shù)據(jù)規(guī)約,即通過使用編碼或變換,得到原始數(shù)據(jù)的歸約或壓縮表示。例如將在線總時長數(shù)據(jù)進(jìn)行無損歸約,將原始數(shù)據(jù)“005-01-01 17∶09∶03.877”變換單位為分鐘的數(shù)據(jù)。

四、研究結(jié)果

(一)總成績決策樹數(shù)據(jù)挖掘結(jié)果

1. 挖掘結(jié)構(gòu)

挖掘結(jié)構(gòu)如圖1所示。

2. 挖掘模型

將UserNum設(shè)為“鍵”列,用于唯一標(biāo)識事例表中的每條記錄;將UserSex、Department、EduLevel作為“輸入”列,作為發(fā)現(xiàn)數(shù)據(jù)模式的基礎(chǔ);將ScoreTotal作為“可預(yù)測”列,對學(xué)習(xí)者的學(xué)習(xí)成績進(jìn)行預(yù)測。將測試事例的百分比設(shè)定為30%,即記錄中的70%將被用于定型該數(shù)據(jù)挖掘,30%被用于測試模型。如圖2所示。

3. 數(shù)據(jù)挖掘結(jié)果

Microsoft 決策樹查看器提供兩種視圖“決策樹”“依賴關(guān)系網(wǎng)絡(luò)”。“決策樹”視圖結(jié)果如圖3、圖4、圖5、圖6所示,特點是生成一棵形如二叉或多叉樹的決策樹。該樹是水平布局,根節(jié)點在最左邊,每一個節(jié)點包含一個柱狀條,用不同顏色來代表不同的狀態(tài)。樹的葉子節(jié)點代表某一類別值,非葉子節(jié)點代表某個一般屬性的一個測試,測試的輸出構(gòu)成該非葉子節(jié)點的多個分支。從根節(jié)點到葉子節(jié)點的每條路徑形成一條分類規(guī)則,一棵決策樹能夠方便地轉(zhuǎn)化為一系列分類規(guī)則??梢砸罁?jù)分類規(guī)則直觀地對未知類別進(jìn)行預(yù)測。各節(jié)點的背景色表示所選狀態(tài)的事例的密集程度,顏色越深表示該事例越多。通過決策樹的樹形可視化,可以了解每個葉子節(jié)點的分類規(guī)則所需要的最重要的變量。“依賴關(guān)系網(wǎng)絡(luò)”視圖結(jié)果,如圖7所示,特點是可以顯示挖掘模型中輸入屬性和預(yù)測屬性間的依賴關(guān)系。每條邊有一個權(quán)值,它與左邊的滑塊相關(guān)。通過調(diào)整查看器左側(cè)的滑塊可以查看依賴關(guān)系強(qiáng)度,若向下拉動滑塊,則查看器中只會顯示最強(qiáng)鏈接。通過調(diào)整左側(cè)滑塊,可以發(fā)現(xiàn),成績與學(xué)科背景的關(guān)系最密切,其次是性別,最后是學(xué)歷。

圖3是學(xué)習(xí)者總成績?yōu)锳的決策樹,所提取的最重要的規(guī)則為1條:IF UserSex='女'AND Edulevel='碩士 ' THEN ScoreTotal='A'。得到以下結(jié)論:總成績得A的最高概率是女碩士生;性別是最重要的變量,其次是學(xué)歷變量,最后是學(xué)科背景。

圖4為總成績?yōu)锽的決策樹,所提取的最重要的規(guī)則為2條:①IF Department= '文科' AND UserSex= '女 ' THEN TotalScore= ' B ';②IF Department= '理科' AND UserSex= '非男 ' THEN TotalScore= ' B '。得到以下結(jié)論:總成績得B的最高概率是文科女生,其次是理科女生;學(xué)科背景是最重要的變量,其次是性別變量,與學(xué)歷變量沒有關(guān)系。

圖5所示為總成績?yōu)镃的決策樹,所提取的最重要的規(guī)則為1條:IF Department= '藝術(shù) ' THEN TotalScore= ' C? '。得到以下結(jié)論:總成績得C的最高概率是藝術(shù)生;學(xué)科背景是最重要的變量,其次是性別變量,與學(xué)歷變量沒有關(guān)系。

圖6為總成績?yōu)镈的決策樹,所提取的最重要的規(guī)則為2條:①IF UserSex= ' 男? '? THEN TotalScore= ' D ' ;②IF UserSex= ' 女 '? AND Department= ' 藝術(shù) ' THEN TotalScore=' D ' 。 得到以下結(jié)論:總成績?yōu)镈的最高概率是男生,其次是女藝術(shù)生;性別是最重要的變量,其次是學(xué)科背景變量,與學(xué)歷變量沒有關(guān)系。

圖7為總成績決策樹依賴關(guān)系圖。

通過上述“決策樹”和“依賴關(guān)系網(wǎng)絡(luò)”能得到以下結(jié)論:成績與學(xué)科背景的關(guān)系最密切,文科生得較高分的概率高,藝術(shù)生得低分的概率高;其次是性別,女生得較高分的概率高,男生得較低分的概率高;學(xué)歷對總成績的影響很小,僅與總成績得A的關(guān)系密切,本科生與碩士生并沒有顯著差異。

根據(jù)數(shù)據(jù)挖掘結(jié)果,小結(jié)如表3。

(二)行為特征決策樹數(shù)據(jù)挖掘結(jié)果

學(xué)習(xí)者學(xué)習(xí)時間跨度決策樹、學(xué)習(xí)總時長決策樹、學(xué)習(xí)次數(shù)決策樹、平均每次在線學(xué)習(xí)停留時長決策樹、重復(fù)學(xué)習(xí)率決策樹、學(xué)習(xí)筆記決策樹、討論交流決策樹、接收反饋數(shù)量決策樹的數(shù)據(jù)挖掘過程與方法和總成績決策樹的數(shù)據(jù)挖掘過程與方法一致。由于數(shù)據(jù)挖掘結(jié)果圖片與規(guī)則較多,故在此不再詳細(xì)呈現(xiàn),小結(jié)如表4,具體結(jié)論如下:

學(xué)習(xí)時間跨度決策樹結(jié)論:①學(xué)習(xí)時間跨度為“高”的最高概率是本科生;學(xué)歷是最重要的變量,與學(xué)科背景、性別無關(guān)。②學(xué)習(xí)時間跨度為“中”的最高概率是本科生;學(xué)歷是最重要的變量,其次是性別變量,最后是學(xué)科背景。③學(xué)習(xí)時間跨度為“低”的最高概率是碩士生;學(xué)歷是最重要的變量,其次是學(xué)科背景變量,與性別無關(guān)。

學(xué)習(xí)總時長決策樹結(jié)論:①學(xué)習(xí)總時長為“高”的最高概率是女文科碩士與女理科碩士,其次是女藝術(shù)生;性別是最重要的變量,其次是學(xué)科背景變量,最后是學(xué)歷。②學(xué)習(xí)總時長為“中”的決策樹找不到任何拆分,即學(xué)習(xí)總時長為“中”與學(xué)歷、學(xué)科背景、性別均無關(guān)。③學(xué)習(xí)總時長為“低”的最高概率是男生;性別是最重要的變量,其次是學(xué)科背景變量,最后是學(xué)歷。

學(xué)習(xí)次數(shù)決策樹結(jié)論:學(xué)習(xí)次數(shù)決策樹找不到任何拆分,即學(xué)習(xí)次數(shù)與性別、學(xué)科背景、學(xué)歷并無關(guān)系。

平均每次在線學(xué)習(xí)停留時長決策樹結(jié)論:①平均每次在線學(xué)習(xí)停留時長為“高”的最高概率是女生,其次是男文科生與男藝術(shù)生;性別是最重要的變量,其次是學(xué)科背景,與學(xué)歷無關(guān)。②平均每次在線學(xué)習(xí)停留時長為“中”的決策樹,找不到任何拆分,即平均每次在線學(xué)習(xí)停留時長為“中”與學(xué)歷、學(xué)科背景、性別均無關(guān)。③平均每次在線學(xué)習(xí)停留時長為“低”的最高概率是男理科生;性別是最重要的變量,其次是學(xué)科背景變量,與學(xué)歷無關(guān)。

重復(fù)學(xué)習(xí)率決策樹結(jié)論:①重復(fù)學(xué)習(xí)率為“高”的最高概率是文科生與理科生;學(xué)科背景是最重要的變量,與性別、學(xué)歷無關(guān)。②重復(fù)學(xué)習(xí)率為“中”決策樹找不到任何拆分,即重復(fù)學(xué)習(xí)率為“中”與學(xué)歷、學(xué)科背景、性別均無關(guān)。③重復(fù)學(xué)習(xí)率為“低”的最高概率是藝術(shù)生;學(xué)科背景是最重要的變量,與性別、學(xué)歷無關(guān)。

討論交流決策樹結(jié)論:①討論交流為“高”的最高概率是文科生與理科生;學(xué)科背景是最重要的變量,與性別、學(xué)歷無關(guān)。②討論交流為“中”的決策樹與討論交流為“低”的決策樹找不到任何拆分,即討論交流為“中”或“低”與學(xué)歷、學(xué)科背景、性別均無關(guān)。③討論交流為“無”的最高概率是藝術(shù)生,其次是文科女碩士與理科女碩士;學(xué)科背景是最重要的變量,其次是性別變量,最后是學(xué)歷。

學(xué)習(xí)筆記決策樹結(jié)論:①學(xué)習(xí)筆記為“高”的最高概率是女文科生與女理科生;性別是最重要的變量,其次是學(xué)科背景變量,與學(xué)歷無關(guān)。②學(xué)習(xí)筆記為“中”的決策樹與學(xué)習(xí)筆記為“低”的決策樹找不到任何拆分,即學(xué)習(xí)筆記為“中”或“低”與學(xué)歷、學(xué)科背景、性別均無關(guān)。③學(xué)習(xí)筆記為“無”的最高概率是女藝術(shù)生;性別是最重要的變量,其次是學(xué)科背景變量,與學(xué)歷無關(guān)。

接收反饋數(shù)量決策樹結(jié)論:①接收反饋數(shù)量為“高”的最高概率是男生;性別是最重要的變量,與學(xué)科背景、學(xué)歷無關(guān)。②接收反饋數(shù)量為“中”的決策樹找不到任何拆分,即接收反饋數(shù)量為“中”與學(xué)歷、學(xué)科背景、性別均無關(guān)。③接收反饋數(shù)量為“低”的最高概率是男碩士生,其次是女文科生與女理科生;性別是最重要的變量,其次是學(xué)歷、學(xué)科背景。

(三)數(shù)據(jù)挖掘模型評估

由于數(shù)據(jù)挖掘選取的測試數(shù)據(jù)可能存在一定的偶然性和必然性,并不能保證挖掘出的結(jié)果是正確和適用的,因此需要對挖掘出的模型進(jìn)行評估和檢驗。在Microsoft SQL Server Analysis Services的挖掘準(zhǔn)確性圖表中提供了用來度量所創(chuàng)建模型質(zhì)量和精確性的工具,可以通過提升圖來進(jìn)行模型驗證。本研究所有挖掘模型的預(yù)測概率介于70.25%~95.10%之間,說明建立的所有挖掘模型具有比較高的可靠性和準(zhǔn)確性。

五、研究結(jié)論與討論

(一)數(shù)據(jù)挖掘結(jié)果原因分析與討論

本研究通過建立數(shù)據(jù)挖掘模型、結(jié)果分析、模型驗證,發(fā)現(xiàn)采用決策樹方法可以較好地預(yù)測網(wǎng)絡(luò)學(xué)習(xí)行為與成績,能夠較好地解釋目前網(wǎng)絡(luò)學(xué)習(xí)中的一些現(xiàn)象,例如男生或藝術(shù)生總成績?nèi)菀壮霈F(xiàn)危機(jī),男生接受反饋數(shù)量較多等;同時也有一些新的發(fā)現(xiàn),例如女碩士生與文科女生學(xué)業(yè)成績表現(xiàn)較好,藝術(shù)生討論交流表現(xiàn)較差,女藝術(shù)生學(xué)習(xí)筆記表現(xiàn)較差等。依據(jù)研究結(jié)果,下面將從數(shù)據(jù)挖掘結(jié)果原因分析與在線學(xué)習(xí)群體干預(yù)策略角度展開討論。

第一,男生或藝術(shù)生總成績存在危機(jī)的概率高,總成績與學(xué)科背景的關(guān)系最密切,其次是性別。已有研究表明沉浸狀態(tài)對學(xué)習(xí)有積極影響(Salanova, 2006),本研究行為特征數(shù)據(jù)挖掘結(jié)果表明男生與藝術(shù)生的行為參與度相對較差,男生與藝術(shù)生總成績表現(xiàn)較差,容易出現(xiàn)學(xué)習(xí)危機(jī)。對藝術(shù)生和男生的干預(yù)策略是在課程內(nèi)容方面提供更多的干預(yù)和幫助,為其提供小步調(diào)的學(xué)習(xí)推送服務(wù),包括學(xué)習(xí)通知、課程內(nèi)容、學(xué)習(xí)資源、學(xué)習(xí)基本情況、學(xué)業(yè)風(fēng)險評估等,提高其學(xué)習(xí)行為參與度,從而提高學(xué)業(yè)成績。

第二,碩士生的學(xué)習(xí)時間跨度表現(xiàn)較差。本研究中的碩士是成人聯(lián)考碩士,需要兼顧工作、學(xué)業(yè)與家庭,因此參與網(wǎng)絡(luò)學(xué)習(xí)的時間和精力非常有限。對碩士生的干預(yù)策略是在碩士生注冊學(xué)習(xí)之后,持續(xù)通過短信、微信、郵件等形式提醒碩士生及時參與課程學(xué)習(xí)。

第三,男生的學(xué)習(xí)總時長表現(xiàn)較差、接受反饋數(shù)量較多,男理科生的平均每次在線學(xué)習(xí)停留時長表現(xiàn)較差。調(diào)查發(fā)現(xiàn)男生對待網(wǎng)絡(luò)學(xué)習(xí)的態(tài)度、自覺性、認(rèn)真與努力程度相對較弱,且在網(wǎng)絡(luò)學(xué)習(xí)中更容易注意力分散,易被無關(guān)信息干擾(如網(wǎng)絡(luò)游戲、新聞、社交等),自控能力較弱。因此對這類學(xué)習(xí)者就要給其推送更多有意思的資源和活動,提高其對學(xué)習(xí)課程的興趣和學(xué)習(xí)動機(jī),同時通過各種途徑加大對其學(xué)習(xí)的監(jiān)控與調(diào)節(jié)力度。

第四,藝術(shù)生的重復(fù)學(xué)習(xí)率、討論交流表現(xiàn)較差,女藝術(shù)生的學(xué)習(xí)筆記表現(xiàn)較差。原因并非藝術(shù)生認(rèn)知能力差,而是學(xué)習(xí)習(xí)慣較差,自我調(diào)控能力較弱,因此藝術(shù)生在網(wǎng)絡(luò)學(xué)習(xí)過程中互動表現(xiàn)也較弱(傅鋼善, 等, 2014)。因此,對藝術(shù)生的干預(yù)策略是設(shè)計更多的協(xié)作學(xué)習(xí)活動,采用基于問題的學(xué)習(xí)、基于項目的學(xué)習(xí)、基于探究的學(xué)習(xí)等方法增加交互行為,讓其體驗協(xié)作的樂趣和好處,同時增加參與討論交流的提醒或獎懲措施;對女藝術(shù)生的干預(yù)策略是改進(jìn)學(xué)習(xí)策略,尤其是提供反思策略的指導(dǎo)與幫助,并設(shè)置提醒和獎懲措施提醒其參加學(xué)習(xí)筆記活動。

(二)創(chuàng)建適應(yīng)性學(xué)習(xí)干預(yù)模型

通過數(shù)據(jù)挖掘結(jié)果,可以為學(xué)習(xí)者創(chuàng)建適應(yīng)性學(xué)習(xí)系統(tǒng),在適應(yīng)性學(xué)習(xí)系統(tǒng)中搭建學(xué)習(xí)干預(yù)模型,如圖8所示。傳統(tǒng)學(xué)習(xí)管理系統(tǒng)通常為所有學(xué)習(xí)者呈現(xiàn)完全相同的課程,而不考慮學(xué)習(xí)者的個體特征、情況和需求,這種一刀切的方法往往導(dǎo)致挫敗感、學(xué)習(xí)困難和高輟學(xué)率(Dagger, et al., 2005)。適應(yīng)性學(xué)習(xí)系統(tǒng)為探索個性化、適應(yīng)性的學(xué)習(xí)干預(yù)提供了可能。

1. 時間維度視角

在學(xué)習(xí)的不同階段(學(xué)習(xí)前、學(xué)習(xí)中、學(xué)習(xí)后)提供不同的干預(yù)策略。適應(yīng)性學(xué)習(xí)系統(tǒng)中的學(xué)習(xí)干預(yù)模型是不斷更新、實時分析、循環(huán)進(jìn)行的,伴隨著學(xué)習(xí)的不同階段(學(xué)習(xí)前、學(xué)習(xí)中、學(xué)習(xí)后)提供不同的干預(yù)策略。學(xué)習(xí)者在學(xué)習(xí)的某一階段不存在學(xué)習(xí)危機(jī),但有可能在下一階段存在學(xué)習(xí)危機(jī)。一旦出現(xiàn)學(xué)習(xí)危機(jī),及時給予恰當(dāng)?shù)母深A(yù),從而實現(xiàn)學(xué)習(xí)者的有效學(xué)習(xí),提高學(xué)習(xí)效果。在學(xué)習(xí)前,干預(yù)的方式是群體干預(yù)。適應(yīng)性學(xué)習(xí)系統(tǒng)內(nèi)僅有學(xué)習(xí)者的人口學(xué)特征數(shù)據(jù),根據(jù)已有研究(表3與表4)中的學(xué)習(xí)者群體差異特征給予群體干預(yù),具體干預(yù)策略見本文數(shù)據(jù)挖掘結(jié)果原因分析與討論部分。在學(xué)習(xí)中,干預(yù)的方式有群體干預(yù)和個體干預(yù)。通過學(xué)習(xí)者的人口學(xué)特征和行為特征進(jìn)行數(shù)據(jù)挖掘,根據(jù)預(yù)測結(jié)果,對存在學(xué)習(xí)危機(jī)的學(xué)習(xí)群體和個體,教師及時做出教學(xué)決策并制定干預(yù)措施,教學(xué)決策包括群體差異指導(dǎo)、因材施教、不同獎懲機(jī)制等,干預(yù)措施包括學(xué)習(xí)進(jìn)度提示器、數(shù)字儀表盤、彈幕、提示窗口、資源推送、短信、微信、電子郵件、學(xué)習(xí)策略指導(dǎo)等。在學(xué)習(xí)后,干預(yù)的方式有群體干預(yù)和個體干預(yù),一方面,根據(jù)數(shù)據(jù)挖掘結(jié)果與學(xué)習(xí)者的表現(xiàn),對學(xué)習(xí)者的學(xué)業(yè)成績進(jìn)行多元評價;另一方面,對學(xué)習(xí)者模型進(jìn)行調(diào)節(jié),完善數(shù)據(jù)挖掘模型,進(jìn)入新一輪的數(shù)據(jù)挖掘循環(huán)。

2. 課程開發(fā)者視角

開發(fā)適應(yīng)性學(xué)習(xí)系統(tǒng),完善干預(yù)措施小工具,包括學(xué)習(xí)進(jìn)度提示器、數(shù)字儀表盤、彈幕、提示窗口、資源推送、短信、微信、電子郵件、學(xué)習(xí)策略指導(dǎo)等。學(xué)習(xí)進(jìn)度提示器能夠清晰地顯示學(xué)習(xí)進(jìn)度,并提醒學(xué)習(xí)是否達(dá)標(biāo)。數(shù)字儀表盤能夠可視化地呈現(xiàn)學(xué)習(xí)者學(xué)習(xí)活動和任務(wù)完成情況,幫助學(xué)習(xí)者自我反思和評價;同時學(xué)習(xí)者也可以看到其他學(xué)習(xí)者的數(shù)字儀表盤,以便學(xué)習(xí)者之間互相督促學(xué)習(xí)。彈幕、提示窗口能夠?qū)崟r或間斷地為學(xué)習(xí)者提供提醒反饋和適應(yīng)性資源推送,與短信、微信、電子郵件等無縫對接,通過多種途徑給學(xué)習(xí)者以提醒和監(jiān)督,尤其是對存在學(xué)習(xí)危機(jī)的學(xué)習(xí)者,提醒其學(xué)習(xí)活動的表現(xiàn)、知識內(nèi)容的表現(xiàn)、行為特征的表現(xiàn)。學(xué)習(xí)策略指導(dǎo)為學(xué)習(xí)者提供包括信息素養(yǎng)策略、反思總結(jié)策略、資源管理策略、合作交流策略、自我調(diào)節(jié)策略等學(xué)習(xí)策略的指導(dǎo),尤其是為容易出現(xiàn)學(xué)習(xí)危機(jī)或行為參與度低的學(xué)習(xí)者提供學(xué)習(xí)策略資源推送。

3. 教師視角

首先,教師應(yīng)實施群體差異指導(dǎo)、因材施教、不同獎懲機(jī)制等教學(xué)策略。具體干預(yù)策略見本文數(shù)據(jù)挖掘結(jié)果原因分析與討論部分。其次,充分發(fā)揮教師的主導(dǎo)作用。網(wǎng)絡(luò)學(xué)習(xí)的優(yōu)勢是能夠?qū)崿F(xiàn)自主學(xué)習(xí),但是其弊端是弱控制性,包括學(xué)習(xí)資格獲取的弱控制性、管理方式的弱控制性、教學(xué)過程的弱控制性、師生關(guān)系的弱控制性、考核方式的弱控制性等(衷克定, 2011, pp. 21-25)。網(wǎng)絡(luò)學(xué)習(xí)使學(xué)習(xí)者缺乏時間認(rèn)知、容易產(chǎn)生惰性、交互行為存在滯后、提交作業(yè)存在抄襲等,這些不僅會影響學(xué)習(xí)者的行為狀態(tài),而且會影響網(wǎng)絡(luò)學(xué)習(xí)效果。因此要充分發(fā)揮教師的主導(dǎo)作用,教師要及時回復(fù)學(xué)習(xí)者的留言,可適當(dāng)安排即時交流時間或直播,積極對學(xué)習(xí)者的行為狀態(tài)進(jìn)行調(diào)控,采用多種途徑激發(fā)學(xué)習(xí)者的學(xué)習(xí)動機(jī)等。

4. 學(xué)習(xí)者視角

首先,建議學(xué)習(xí)者自覺提高網(wǎng)絡(luò)學(xué)習(xí)參與度,增加學(xué)習(xí)時間跨度,養(yǎng)成記錄反思筆記的良好習(xí)慣,對于復(fù)雜的知識增加重復(fù)學(xué)習(xí)次數(shù),積極參與討論交流,提高自己對網(wǎng)絡(luò)學(xué)習(xí)的歸屬感和沉浸性以及自身學(xué)習(xí)效果。其次,建議學(xué)習(xí)者自覺改進(jìn)學(xué)習(xí)策略:根據(jù)教師教學(xué)安排循序漸進(jìn)地完成學(xué)習(xí)任務(wù),在網(wǎng)絡(luò)學(xué)習(xí)前確立明確的學(xué)習(xí)目標(biāo),制定明確的學(xué)習(xí)計劃(尤其是學(xué)習(xí)時間、學(xué)習(xí)內(nèi)容等的制定),并嚴(yán)格按照學(xué)習(xí)計劃完成學(xué)習(xí)任務(wù);積極對自己的情感體驗進(jìn)行調(diào)控,尤其是那些對網(wǎng)絡(luò)學(xué)習(xí)持消極態(tài)度的學(xué)習(xí)者,要經(jīng)常參與討論交流、反思筆記等交互,從中獲得學(xué)習(xí)的成功感和歸屬感;對自己的行為和心理進(jìn)行及時控制、調(diào)節(jié)和評價。

六、結(jié)語

本研究采用數(shù)據(jù)挖掘技術(shù)中的決策樹方法對網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)行為與成績進(jìn)行了預(yù)測,構(gòu)建了適應(yīng)性學(xué)習(xí)系統(tǒng)學(xué)習(xí)干預(yù)模型,為適應(yīng)性學(xué)習(xí)系統(tǒng)提供了實證依據(jù)。當(dāng)然,本研究還存在一些不足,有待改進(jìn)。首先,研究結(jié)論有待進(jìn)一步驗證。本研究的研究對象僅是陜西師范大學(xué)參加“現(xiàn)代教育技術(shù)”在線開放課程學(xué)習(xí)的學(xué)習(xí)者,研究對象的范圍有局限性,應(yīng)在后續(xù)研究中擴(kuò)大研究對象范圍,對研究結(jié)論進(jìn)行驗證與完善,得到更科學(xué)可靠的研究結(jié)論。其次,適應(yīng)性學(xué)習(xí)系統(tǒng)的學(xué)習(xí)干預(yù)模型有待進(jìn)一步完善。本研究僅根據(jù)實證研究數(shù)據(jù)從理論上設(shè)計了學(xué)習(xí)干預(yù)模型,并沒有在網(wǎng)絡(luò)學(xué)習(xí)中實際使用,在后續(xù)研究中有待開發(fā)適應(yīng)性學(xué)習(xí)系統(tǒng),對學(xué)習(xí)干預(yù)模型進(jìn)行驗證與完善,并提高預(yù)測的準(zhǔn)確性。最后,研究數(shù)據(jù)有待進(jìn)一步深度挖掘。本研究尚未對“現(xiàn)代教育技術(shù)”在線開放課程后臺數(shù)據(jù)進(jìn)行完整的數(shù)據(jù)挖掘,仍然有大量的潛在模式?jīng)]有被發(fā)現(xiàn),未來研究的重點應(yīng)該關(guān)注多種數(shù)據(jù)挖掘技術(shù),如利用Web數(shù)據(jù)挖掘技術(shù)對文本信息進(jìn)行知識發(fā)現(xiàn),利用異常檢驗技術(shù)發(fā)現(xiàn)一些特殊的學(xué)習(xí)者(如網(wǎng)絡(luò)學(xué)習(xí)欺詐行為)、利用時間序列分析發(fā)現(xiàn)學(xué)習(xí)者隨時間變化而變化的規(guī)律等。

[參考文獻(xiàn)]

陳子健,朱曉亮. 2017. 基于教育數(shù)據(jù)挖掘的在線學(xué)習(xí)者學(xué)業(yè)成績預(yù)測建模研究[J]. 中國電化教育(12):75-81,89.

傅鋼善,王改花. 2014. 基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)學(xué)習(xí)行為與學(xué)習(xí)效果研究[J]. 電化教育研究(9):53-57.

馬杰,趙蔚,張潔,等. 2014. 基于學(xué)習(xí)分析技術(shù)的預(yù)測模型構(gòu)建與實證研究[J]. 現(xiàn)代教育技術(shù)(11):30-38.

牟智佳,武法提. 2017a. 教育大數(shù)據(jù)背景下學(xué)習(xí)結(jié)果預(yù)測研究的內(nèi)容解析與設(shè)計取向[J]. 中國電化教育(7):26-32.

牟智佳,武法提. 2017b. MOOC學(xué)習(xí)結(jié)果預(yù)測指標(biāo)探索與學(xué)習(xí)群體特征分析[J]. 現(xiàn)代遠(yuǎn)程教育研究(3):58-66,93.

孫力,程玉霞. 2015. 大數(shù)據(jù)時代網(wǎng)絡(luò)教育學(xué)習(xí)成績預(yù)測的研究與實現(xiàn)——以本科公共課程統(tǒng)考英語為例[J]. 開放教育研究(3):74-80.

孫力,張凱,丁波. 2016. 基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)教育學(xué)習(xí)成績細(xì)分預(yù)測的研究與實現(xiàn)——以本科成人學(xué)位英語考試為例[J]. 中國遠(yuǎn)程教育(12):22-29.

唐華松,姚耀文. 2001. 數(shù)據(jù)挖掘中決策樹算法的探討[J]. 計算機(jī)應(yīng)用研究(8):21-22,25.

王國平,郭偉宸,汪若君. 2014. IBM SPSS Modeler數(shù)據(jù)與文本挖掘?qū)崙?zhàn)[M]. 北京:清華大學(xué)出版社:142.

王亮. 2015. 學(xué)習(xí)分析技術(shù)建立學(xué)習(xí)預(yù)測模型[J]. 實驗室研究與探索(1):215-218,246.

王林麗,葉洋,楊現(xiàn)民. 2016. 基于大數(shù)據(jù)的在線學(xué)習(xí)預(yù)警模型設(shè)計——“教育大數(shù)據(jù)研究與實踐專欄”之學(xué)習(xí)預(yù)警篇[J]. 現(xiàn)代教育技術(shù)(7):5-11.

武法提,牟智佳. 2016. 基于學(xué)習(xí)者個性行為分析的學(xué)習(xí)結(jié)果預(yù)測框架設(shè)計研究[J]. 中國電化教育(1):41-48.

肖巍,倪傳斌,李銳. 2018. 國外基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究:回顧與展望[J]. 中國遠(yuǎn)程教育(2):70-78.

徐鵬,王以寧. 2013. 大數(shù)據(jù)視角分析學(xué)習(xí)變革——美國《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報告解讀及啟示[J]. 遠(yuǎn)程教育雜志(6):11-17.

元昌安. 2009. 數(shù)據(jù)挖掘原理與SPSS Clementine應(yīng)用寶典[M]. 北京:電子工業(yè)出版社:40.

趙慧瓊,姜強(qiáng),趙蔚,等. 2017. 基于大數(shù)據(jù)學(xué)習(xí)分析的在線學(xué)習(xí)績效預(yù)警因素及干預(yù)對策的實證研究[J]. 電化教育研究(1):62-69.

中國互聯(lián)網(wǎng)絡(luò)信息中心. 2018-03-05. 第41次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》[EB/OL]. [2018-05-15]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201803/t20180305_70249.htm

中華人民共和國教育部. 2016-06-07. 教育部關(guān)于印發(fā)《教育信息化“十三五”規(guī)劃》的通知(教技〔2016〕2號)[EB/OL]. [2018-03-14].http://www.moe.edu.cn/srcsite/A16/s3342/201606/t20160622_2693 67. html

衷克定, 2011. 在線學(xué)習(xí)與發(fā)展[M]. 北京:高等教育出版社:21-25.

Barba, P. G., Kennedy, G. E. & Ainley, M. D. (2016). The role of students motivation and participation in predicting performance in a MOOC motivation and participation in MOOCs. Journal of Computer Assisted Learning, 32(3), 218-231.

Costa, E. B., Fonseca, B., Santana, M. A., de Araújo, F. F. & Rego, J. (2017). Evaluating the effectiveness of educational data mining techniques for early prediction of students academic failure in introductory programming courses. Computers in Human Behavior, 73, 247-256.

Dagger, D., Wade, V. & Conlan, O. (2005). Personalisation for all: making adaptive course composition easy. Educational Technology & Society, 8(3), 9-25.

Huang, S. & Fang, N. (2013). Predicting student academic performance in an engineering dynamics course: a comparison of four types of predictive mathematical models. Computer & Education, 61, 133-145.

Karampiperis, P., & Sampson, D. G. (2005). Adaptive learning resources sequencing in educational hypermedia systems. Educational Technology & Society, 8 (4), 128-147.

Kostopoulos, G., Lipitakis, A. D., Kotsiantis, S. & Gravvanis, G. (2017). Predicting Student Performance in Distance Higher Education Using Active Learning. In G. Boracchi, L. Iliadis, C. Jayne & A. Likas (Eds.) Communications in Computer and Information Science (pp. 75- 86). Cham: Springer.

Kotsiantis, S., Patriarcheas, K. & Xenos, M. (2010). A combinational incremental ensemble of classifiers as a technique for predicting students performance in distance education. Knowledge-Based Systems, 23 (6), 529-535.

Macfadyen, L. P. & Dawson, S. (2010). Mining LMS data to develop an “early warning system” for educators: a proof of concept. Computer & Education, 54 (2), 588-599.

Ohia U. O. (2011). A model for effectively assessing student learning outcomes. Contemporary Issues in Education Research, 4 (3), 25-32.

Pursel, B. K., Zhang, L., Jablokow, K. W., Choi G.W. & Velegol, D. (2016). Understanding MOOC students: motivations and behaviours indicative of MOOC completion. Journal of Computer Assisted Learning, 32(3), 202-217.

Romero, C., López, M. I., Luna, J. M. & Ventura, S. (2013). Predicting students final performance from participation in on-line discussion forums. Computer & Education, 68, 458-472.

Salanova, M., Bakker, A. B. & Llorens, S. (2006). Flow at work: evidence for an upward spiral of personal and organizational resources. Journal of Happiness Studies, 7(1), 1-22.

Xing, W., Guo, R., Petakovic, E. & Goggins, S. (2015). Participation-based student final performance prediction model through interpretable genetic programming: integrating learning analytics, educational data mining and theory. Computers in Human Behavior, 47(C), 168-181.

收稿日期:2018-03-15

定稿日期:2018-08-09

作者簡介:王改花,博士研究生,實驗師;傅鋼善,教授,博士生導(dǎo)師。陜西師范大學(xué)教育學(xué)院(710062)。

責(zé)任編輯 張志禎

猜你喜歡
總成績決策樹學(xué)歷
學(xué)歷造假引發(fā)法律糾紛
學(xué)歷軍備競賽,可以休矣
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
謝文駿與劉翔110m欄分段成績與總成績的灰色關(guān)聯(lián)度對比分析
基于決策樹的出租車乘客出行目的識別
飛鏢比賽
飛鏢比賽
知識無力感
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用