孫發(fā)勤 馮銳
摘要:如何利用數(shù)據(jù)和模型來預測學業(yè)成功與失敗是學習分析領域的核心問題。該文通過對現(xiàn)有文獻檢索分析出目前研究中主要影響學業(yè)成就的要素,結(jié)合對原始數(shù)據(jù)的深度處理,得到和學習相關的高級行為指標,利用機器學習中神經(jīng)網(wǎng)絡、決策樹及線性回歸算法分別建模分析。研究發(fā)現(xiàn):學習態(tài)度、學習及時水平和投入水平是影響在線學業(yè)成就的主要因素,耐挫水平為次要因素,而互動水平、積極水平和階段成效對最終的學業(yè)成就無關。該文最后對研究結(jié)果進行了反思后認為,課程選取對研究在線學業(yè)成就要素有非常大的影響。
關鍵詞:學習分析;在線課程;學業(yè)成就;機器學習
中圖分類號:G434 文獻標識碼:A
一、引言
隨著大數(shù)據(jù)的應用普及,很多行業(yè)(如金融、零售)都發(fā)生了巨大的變化。但一直以來,教育領域是在大數(shù)據(jù)中受益最少的領域之一,缺乏“數(shù)據(jù)驅(qū)動的思維(Data-driven Mind-set)”是教育領域當今面臨的主要障礙。相對于流程清晰規(guī)范的金融系統(tǒng),教育是一個超級復雜的系統(tǒng),各類教育實踐活動產(chǎn)生了比金融行業(yè)要多得多的數(shù)據(jù)。因此,如何利用好教育數(shù)據(jù),并從中發(fā)掘其背后的教育規(guī)律成了研究者最近關注的重點。自2010年起,學習分析(Learning Analytics,簡稱LA)逐漸從分析領域獨立出來,吸納數(shù)據(jù)挖掘、社會網(wǎng)絡分析、統(tǒng)計分析等多種分析方法,形成了一個獨立的新興領域。從此,學習分析作為分析技術在教育領域中的應用和發(fā)展,受到越來越多研究者的關注和重視。運用在教育領域的學習分析主要任務是通過對學習者產(chǎn)生和收集到的相關數(shù)據(jù)進行分析和闡釋,來評估學習者的學業(yè)成就、預測其學習表現(xiàn)并發(fā)現(xiàn)存在問題的過程。因此如何利用學習分析技術來預測學業(yè)成功與失敗是該領域核心問題。
二、文獻綜述
最近幾年,圍繞學業(yè)分析與學業(yè)成就這一話題,國內(nèi)外學者的研究主要聚焦在學業(yè)成就模型和指標的研究上。Usamah通過對14個典型的學習分析系統(tǒng)和應用進行研究后指出,學習分析中數(shù)據(jù)輸入應該包含盡可能多的數(shù)據(jù),而不應綁定在兩種或三種類型的數(shù)據(jù)中,并最終梳理出包含學習者往期學業(yè)表現(xiàn)、課程參與情況、學習者背景、社交表現(xiàn)等多個預測學業(yè)表現(xiàn)的重要指標。Bukralia使用學業(yè)能力、經(jīng)濟水平、學業(yè)目標、技術準備、人口統(tǒng)計、課程動機與參與以及課程特征作為預測學業(yè)風險或成就的指標。G.Siemens等對學習者基本情況、學習目標、動機水平、認知風格、學習需要的數(shù)據(jù)進行收集,并對在線學習影響因素進行分析,其成果為促進學生學業(yè)成功提供了有力支撐。武法提和牟智佳基于學習者行為分析提出了以教學目標分類理論、個性化學習理論和社會認知理論為指導的,以“目標-過程-結(jié)果”為思想的學習結(jié)果分類預測框架,并以edX平臺上一門MOOC課程的學習行為數(shù)據(jù)為研究對象進行探索,通過將視頻學習次數(shù)、文本學習次數(shù)、評價參與時長、評價參與次數(shù)和論壇主題發(fā)起數(shù)作為行為指標組合,發(fā)現(xiàn)學習次數(shù)的預測效果要好于學習時長,并與學習時長和學習次數(shù)結(jié)合后的預測效果接近。李爽等基于學習者在線學習行為投入歸納出參與、堅持、專注、交互、學術挑戰(zhàn)、學習自我監(jiān)控等六個在線學業(yè)成就評價指標維度。陳子健等通過計算所有單個數(shù)據(jù)屬性和學業(yè)成績類別之間的相關系數(shù)及計算所有屬性的信息增益率兩種方法共同確定學業(yè)成績的影響因素。
通過對以上分析研究發(fā)現(xiàn),在研究內(nèi)容及數(shù)據(jù)的處理上,目前大部分研究主要以理論探討、框架分析為主,部分以數(shù)據(jù)為基礎的實證分析主要是使用了在線平臺基礎的原始數(shù)據(jù),如各類行為的時長、頻次等,對同一行為的多條數(shù)據(jù)的處理方法主要是取均值,如用所有練習的成績平均值來代表最終成績等。鑒于在線學習不同用戶的學習習慣不同、分配時間的方式不同、每個練習難度也不同,同一個學習者完成相似任務所需要的時間及次數(shù)差異都非常大,不同的學習者完成不同任務的次數(shù)和時間會相差更大,對原始數(shù)據(jù)簡單的均值處理顯然不太合理,因此需要對原始數(shù)據(jù)進行歸一化處理。如Grabe和Sigler通過研究對各類時間進行了估計,所有超過2分鐘的學習行為時間將被替換成2分鐘,選擇題答題時間最高設定為90秒,使用這種簡單規(guī)則,的確降低了數(shù)據(jù)的處理難度,在一定程度上對數(shù)據(jù)進行了歸一化處理,但同時也丟失了包含大量用戶特征的數(shù)據(jù)。在研究方法上,很多研究都通過理論分析指出了影響在線學習學業(yè)成就的因素,然后通過調(diào)查問卷或少量在線數(shù)據(jù)來建模驗證,數(shù)據(jù)處理的方式多用回歸分析或結(jié)構(gòu)方程模型,很少使用大數(shù)據(jù)研究所采用的機器學習算法來進行建模并對模型進行深入分析。
三、分析框架
本研究參照上述文獻中關于學業(yè)成就框架的研究結(jié)果,對基本的原始數(shù)據(jù)進行歸一化處理后,結(jié)合文獻中研究得出的影響學業(yè)成就指標,選取了及時水平、投入水平、互動水平、耐挫水平、積極水平、學習態(tài)度、階段成效等七個維度作為分析在線學業(yè)成績的指標,并選擇了對相關底層數(shù)據(jù)進行更深入挖掘后所形成的“高級數(shù)據(jù)”作為以上維度的指標項,構(gòu)建了學業(yè)成績要素分析的框架,如表1所示。使用線下成績作為學業(yè)成就的標簽數(shù)據(jù),利用機器學習算法構(gòu)建模型,分析哪些指標是影響在線學習成就的主要指標。
(一)第一次學習課程時間
考慮到課程的創(chuàng)建與發(fā)布時間不一定就是學習者可以學習的時間,因此本研究使用課程第一個學習者開始學習的時間為起始點,其他學習者第一次學習課程的時間與起始點之間的間隔,即為該學習者的第一次學習課程時間,該時間為相對時間,以天為單位。第一次學習課程的時間反映了學習者能否迅速開始學習活動。
(二)平均客觀題開始答題時間
客觀題開始答題時間:采用和第一次學習課程時間相同的研究方法,將從每個客觀題作業(yè)第—個學習者開始答題的時間開始,到其他學習者開始作答該客觀題作業(yè)時間結(jié)束,定義為該學習者該客觀題的開始答題時間,該時間為相對時間,以天為單位。
平均客觀題開始答題時間:某學習者某一門課程全部客觀題作業(yè)的客觀題開始答題時間的平均值定義為該學習者的平均客觀題開始答題時間。通過平均客觀題開始答題時間,可以反映出學習者開始學習課程新資源的主動性和及時性。
(三)客觀題平均答題時長偏移
客觀題答題合理時長:本研究以每個客觀題任務為單位,基于在線認真學習的學習者成績大部分都能超過均分的假設,選取所有完成該任務且評分大于本題均分的學習者完成時間為樣本計算該任務的答題合理時間。具體做法如下:對于每個課程的客觀題,不同學生完成時間相差非常大,如某客觀題任務(10道選擇題)最短答題時間12秒,最長時間約1200秒,相差近100倍,因此在計算答題平均時間時如果將所有的樣本都計算在內(nèi),必然有很大誤差。在實際操作時,先通過箱線圖去除異常值,將剩下的樣本時間計算均值,得到某個課程客觀題答題合理時長。如果答題時間過長或過短,都可能是學習者完成任務時投入不夠,過長的答題時間意味著學習者在完成任務過程中有其他和當前任務無關的行為,過短的答題時間則可能是學習者對所回答的問題缺乏深入的思考。
客觀題平均答題時長偏移:將每次任務的時長減去該任務合理時長定義為答題時長偏移,所有的答題時長偏移的絕對值的均值即客觀題平均答題時長偏移。該指標項反映了學生的學習投入水平。
(四)觀看視頻是否中斷
視頻中斷的類型分為2種,一種是暫停視頻播放做某個其他事情后繼續(xù)播放(視頻頁面沒有關閉),另一種是直接關閉視頻播放頁面后退出視頻的播放。鑒于第一種暫停行為頁面沒有關閉,可能是學習者正在完成某個練習,或者暫停做線下筆記(也可能是做線下和學習無關的事,但無法及時檢測),所以認為學習仍在進行。本研究主要關注的是第二種,即是否能在不關閉視頻窗口的情況下一次完整看完視頻。
觀看進度與觀看次數(shù):每個視頻每次的觀看時間和視頻長度之比定義為視頻的觀看進度。某個視頻每次觀看進度越大,觀看次數(shù)越少,則說明用戶觀看視頻注意力越集中;而視頻每次觀看進度越小,觀看次數(shù)越多則可以認為學習者投入學習活動的程度不夠。因此,可以使用課程內(nèi)所有視頻的平均觀看進度和觀看次數(shù)來描述學習者觀看視頻的精力集中程度。
(五)論壇中發(fā)帖、回帖及跟帖
本研究中為了方便描述,對發(fā)帖、回帖及跟帖定義界定如下:
發(fā)帖:學習者在課程的論壇中,發(fā)表一個新話題供大家討論的行為,定義為發(fā)帖。
回帖:學習者在課程論壇對某個發(fā)貼發(fā)表的自己關于本話題的看法的行為,定義為回帖。
跟帖:學習者在課程論壇中對某發(fā)貼的回帖給予一定評價或看法的行為,定義為跟帖。
通過學習者在課程論壇中是否回帖或跟帖及回帖跟帖的數(shù)量作為指標來反映學習者主動參與互動的情況。一般可以認為,回帖跟帖的數(shù)量越多,學習者參與互動的主動性越強。在論壇中是否能主動發(fā)帖,可以反映出學習者在學習過程中遇到問題后,是否能主動向同伴尋求幫助。
(六)堅持度
當學習者遇到較難任務時,能夠克服困難,克服畏難情緒,繼續(xù)任務的傾向程度,可以表示為堅持度。在線課程的學習中,會有一定的主觀題作業(yè)和客觀題作業(yè)。在完成作業(yè)的過程中,如果連續(xù)答題遭到挫折(成績低于60分),學習者一般會產(chǎn)生畏難情緒,放棄后續(xù)課程的學習,最終導致學習失敗;如果學習者能克服困難,堅持完成后續(xù)的學習,則有可能獲得最后的成功。樣本中課程共8周,有8個客觀題練習,按周次把練習題分成了前后2部分。如總體受到的挫折次數(shù)(NoS: Number of Setbacks)較多,且后期答題次數(shù)(NoA: Number of Answers)仍然較多,則認為該學習者堅持度(DoP:Degree of Persistence)比較高。學習者在遭受挫折(或成功,NoS=O)后,放棄了后期的答題(NoA=O),則其堅持度為0,如果NoA>O,則采用NoS+NoA表示學習者堅持度。堅持度值越大,表示學習者耐挫水平越高。
(七)學習者好勝度
學習者在完成客觀題作業(yè)任務后,如果對第一次成績不滿意,很多同學會嘗試重新做題,再次“刷分”,“刷分”次數(shù)的多少可以描述學習者學習的積極水平。在本研究樣本中,首次答題分值超過90分但不是滿分的學習者,約有34%的學習者會繼續(xù)“刷分”以取得更高的分數(shù),這部分學習者雖然成績已經(jīng)超過選課的大部分同學,但他們?nèi)阅芘μ岣咦约旱募寄埽哂袕娏业暮脛儆?/p>
(八)主觀題評價他人平均次數(shù)
大多數(shù)網(wǎng)絡在線課程的主觀題都是采取同伴評價的方式,積極主動參加評價他人主觀題的次數(shù)多少,也反映了該學習者的學習積極水平。
(九)作業(yè)完成的數(shù)量
在本研究中作業(yè)完成數(shù)量分為客觀作業(yè)完成數(shù)量和主觀作業(yè)完成數(shù)量。作業(yè)完成的數(shù)量多少,反映了學習者基本的學習態(tài)度。
(十)作業(yè)完成的質(zhì)量
作業(yè)完成的質(zhì)量通過主觀題完成后的分值和客觀題完成后的分值來體現(xiàn)。前面提到,基于項目反映理論,由于題目難度不一,不宜直接取所有作業(yè)成績的均值?;谀稠椬鳂I(yè)成績服從正態(tài)分布的假設,先計算某項作業(yè)的均值和方差,用學習者某項作業(yè)成績偏離該項作業(yè)均值的差再除以方差來描述,即用偏離均值多少個標準差來歸一化主觀題和客觀題分值(作業(yè)的標準成績)。多個作業(yè)的成績用這些作業(yè)的標準成績的均值來描述。
四、數(shù)據(jù)的收集、處理和分析
(一)數(shù)據(jù)收集
本研究的數(shù)據(jù)來自揚州大學通識教育平臺線上課程《戲曲鑒賞》。自課程開設以來,共有2819名學生注冊。通過對系統(tǒng)數(shù)據(jù)庫和網(wǎng)站日志處理,提取了包括視頻查看、資源訪問、客觀題答題、主觀題答題、論壇討論、主觀題互評等相關的學生在線學習數(shù)據(jù),為了研究的需要,除了線上的數(shù)據(jù)外,本研究還收集了包括學習結(jié)束后的線下考試成績及相關問卷數(shù)據(jù)。
為了驗證線下成績是否能反映平時的各種在線學習所體現(xiàn)的技能水平,能否反映學習者的在線學業(yè)成就,本研究采用線下考試成績和線上綜合成績之差的分布情況來驗證。課程最后安排的線下閉卷考試成績?yōu)榫€下成績,線上成績由課件查看(20%)、客觀練習(30%)、主觀練習(30%)、線上討論(20%)四部分組成。為了研究最終線下成績是否和線上各項行為成績相關,取每個學習者的線下線上成績之差,繪制了的成績差值的分布圖,如圖1所示。由分布圖可以看出,線上線下成績差值基本服從均值為0,方差為14的正態(tài)分布。當然,圖中右側(cè)還有一部分樣本占了不少的比重但不服從分布的區(qū)域,經(jīng)過對樣本詳細研究后發(fā)現(xiàn),這個群體的學習者很少有線上活動(線上成績幾乎為0),但經(jīng)過自己的線下復習,最后參加了線下考試,并獲得了成績,因此這部分學習者的線下和線上成績是沒有相關性的。排除掉這部分沒有線上學習的學習者,由圖1可以說明各種在線學習所體現(xiàn)的技能水平是真實的,研究中所選取線下成績的代表學習者在線學業(yè)成就的標簽也是可信的。
(二)數(shù)據(jù)處理
本研究數(shù)據(jù)處理過程采用機器學習的標準流程進行處理。首先從平臺數(shù)據(jù)庫和日志文件中獲取底層原始信息,鑒于在線學習數(shù)據(jù)的稀疏性,首先清洗掉那些在線行為較少的學習者,并對數(shù)據(jù)進行處理和變換,得到較高級的指標項,將得到的數(shù)據(jù)分成測試集和訓練集,訓練集用來訓練模型,測試集用來對模型的優(yōu)劣進行評價,最后將得到的模型用于在線學習用戶行為反饋,并根據(jù)反饋優(yōu)化模型,如圖2所示。
1.數(shù)據(jù)抽取
從在線學習后臺數(shù)據(jù)庫中獲取學習者各項行為的結(jié)果數(shù)據(jù),如主觀題答題成績、視頻觀看進度等結(jié)果數(shù)據(jù)。從日志獲取各學習者的各項行為數(shù)據(jù),如何時開始學習、視頻觀看過程是否暫停、視頻暫停后線上行為等過程數(shù)據(jù)。本研究通過對原始數(shù)據(jù)的分析,選取了開始學習時間、客觀題答題時間及結(jié)果信息、主觀題答題及互評信息、視頻觀看時間及行為信息、論壇互動時間及行為信息等原始信息作為最基礎的分析數(shù)據(jù)。
2.數(shù)據(jù)探索與預處理
本流程主要任務是對結(jié)果數(shù)據(jù)集和過程數(shù)據(jù)集進行數(shù)據(jù)探索分析與預處理,對數(shù)據(jù)缺失值(如部分學習者沒有開始答題時間)與異常值(如客觀題答題時間超過1天)進行處理,對數(shù)據(jù)的屬性進行規(guī)約、清洗和變換。通過對原始數(shù)據(jù)的規(guī)約和變換,最終等到15個維度的指標項,如表1所示。去除掉在線成績小于20的樣本,因為產(chǎn)生這些數(shù)據(jù)的學習者的學習行為有極大的隨機性,不太合適用模型去估計。同樣,還需要去除線下成績小于20的數(shù)據(jù),因為很多課程學習者即使沒有上課,按照他們原有的知識水平或者靠運氣也可以得到線下20分以下的分數(shù)。將處理好的數(shù)據(jù)進行分層抽樣,分成訓練集測試集,訓練集用于建立模型,測試集評估模型的預測等能力。
3.建模與應用
根據(jù)數(shù)據(jù)挖掘經(jīng)驗,使用神經(jīng)網(wǎng)絡建模相對于其他建模方式,通常計算時間較長,有比較好的準確度,雖然其不可解釋,但可以使用其作為其他建模算法的性能參照。因此,本研究首先通過神經(jīng)網(wǎng)絡算法進行建模得到一組性能指標,再通過決策樹算法進行建模并與前述的模型指標進行對比,以驗證決策樹算法構(gòu)建模型泛化能力的優(yōu)劣。
本研究利用多層前饋神經(jīng)網(wǎng)絡、10折交叉驗證的方法來對模型進行訓練和測試。交叉驗證是一種統(tǒng)計學上將數(shù)據(jù)樣本切割成較小子集的實用方法,先在一個子集上做分析,而其它子集則用來做后續(xù)對此分析的確認及驗證,依次循環(huán),這樣可以最大化利用樣本進行訓練。本研究將線下成績分成了3個等級,不合格(0-59)、合格(60-79)和優(yōu)秀(80-100)使用神經(jīng)網(wǎng)絡算法分類算法學習建模。經(jīng)過參數(shù)調(diào)優(yōu),得到的模型準確度達到65.81%,Kappa(評價分類結(jié)果一致性和信度的重要指標值為0.434,說明得出的模型和數(shù)據(jù)中度一致,分類結(jié)果的混淆矩陣如表2所示。
從表2中可以看出,不論是準確率還是召回率都是分類為不合格的樣本最小、分類為優(yōu)秀的樣本最大,即成績較好(大于80)的學習者比較容易識別,而成績較差的學習者比較難以識別。經(jīng)過仔細研究后發(fā)現(xiàn)成績較差(線下成績40-60)的學習者由于其在網(wǎng)絡上行為相對較少,研究所得的模型無法對較少數(shù)據(jù)的樣本進行準確預測。同時,研究也發(fā)現(xiàn),實際為不合格分類的樣本被預測為優(yōu)秀的數(shù)量為0,分類為優(yōu)秀的樣本只有1個被預測為不合格,這說明樣本中優(yōu)秀和不合格還是有很好的區(qū)分度的,難以區(qū)分的是分類為不合格的樣本與分類為合格的樣本,以及分類為合格的樣本與分類為優(yōu)秀的樣本,經(jīng)過研究后發(fā)現(xiàn)這和我們將成績這個連續(xù)量強制分成3個離散區(qū)段有關,因為成績值本來是連續(xù)的,60和59只差一分,離散化后卻是不同等級了,因此導致相鄰的分類區(qū)分度不高。但通過該模型可以看出線下成績的確和本研究所選取的15個指標有關,由于神經(jīng)網(wǎng)絡分類算法結(jié)果沒法直觀解釋,只能用于預測,所以只能說線下成績和我們的指標項相關,但和哪些指標項最為相關、相關度如何還需要進步一研究。
在機器學習算法中,相對比較直觀也容易解釋的算法就是決策樹分類方法了,因此為了找到哪些指標對在線學習成就影響最大,本研究將機器學習算法由神經(jīng)網(wǎng)絡算法更換為決策樹算法,再次對數(shù)據(jù)進行了學習建模??紤]到分類結(jié)果的可解釋性,學習過程中設置了決策樹最大深度為5層,最終得到了精確度為59.91%,Kappa為0.301的預測模型。相比較神經(jīng)網(wǎng)絡,不論是精確度還是Kappa值都降低了不少,但如果把決策樹層數(shù)設置為20時,精確度提升至為69.73%,而Kappa也上升為0.485,相比較神經(jīng)網(wǎng)絡算法相關性能而言,使用決策樹算法得到的分類模型還是比較準確的。決策樹分類圖如圖3所示,所對應的分類結(jié)果混淆矩陣如表3所示。從分類結(jié)果的混淆矩陣可以看出,使用決策樹分類后,不合格的準確率得到了大幅度提升,而不合格的召回率大大降低,說明相對于神經(jīng)網(wǎng)絡算法,決策樹算法在本研究中預測比較樂觀。從圖3也可以看出,影響在線學習學業(yè)成就的主要因素有主觀題的完成數(shù)、視頻平均觀看進度、客觀題完成數(shù)、視頻觀看次數(shù)以及第一次學習課程的時間。
考慮到線下成績被離散化后,可能會影響預測結(jié)果,最后再次用線性回歸算法來重新建模,得到的模型的指標R2(Squared Correlation)為0.212,線性回歸的結(jié)果如下頁表4(僅僅列出了p值小于0.005屬性)。參照Chin的建議,R2在0.19左右表示模型的解釋能力薄弱說明模型不能很好地和數(shù)據(jù)擬合。不過可以從表4中大致看出,第一次學習課程時間、堅持度、視頻平均觀看次數(shù)及主觀題完成數(shù)是對線下成績影響顯著。
(三)數(shù)據(jù)結(jié)果分析
通過對以上學習模型的分析,我們發(fā)現(xiàn),雖然線性回歸算法得到的在線學業(yè)成就影響指標和決策樹算法得到的影響指標有差異,但也有不少指標是重合的。主觀題完成次數(shù)(學習態(tài)度)、視頻平均觀看次數(shù)(投入水平)及第一次學習課程時間(及時水平)同時出現(xiàn),而視頻平均觀看進度(投入水平)、客觀題完成數(shù)(學習態(tài)度)及堅持度(耐挫水平)只在其中一個模型中出現(xiàn),說明學習態(tài)度、投入水平和及時水平是影響在線學習學習成就的主要因素,耐挫水平為次要因素,而互動水平、積極水平和階段成效在本研究中對最終的學業(yè)成就無關。
五、討論與反思
得到以上研究結(jié)果,似乎有些不合常理。因為之前很多研究都揭示論壇的活躍情況及答題情況等對學業(yè)成就成績有很大影響,但在本研究顯示論壇活躍情況、答題正確率、答題速度等和最終學業(yè)成就之間相關性很小,而這些指標在以前關于學業(yè)成就的研究中都是顯而易見的影響指標。本研究發(fā)現(xiàn)影響學業(yè)成就最大的因素是學習的態(tài)度、投入水平和及時水平。本文認為可能有如下因素導致了本研究和其他研究者研究結(jié)果的不一致:
第一,課程的選?。翰煌愋偷恼n程,有其不同特點,也有其不同的學習方法。有的課程學習內(nèi)容比較開放,這類課程互動水平就可能會影響其學業(yè)成就,而一般的識記、技能型課程互動水平對學業(yè)成就影響就會比較小。
第二,之前研究的討論數(shù)據(jù)可能是經(jīng)過控制的數(shù)據(jù):本研究中選課的2819人,約有1900人(67%)沒有參加課程討論(回帖跟帖次數(shù)為0),在參與討論的學習者中,只有約10%左右學習者回帖數(shù)量在15個以上,發(fā)帖和跟帖的人更少,如圖4和圖5所示。從發(fā)帖的內(nèi)容來看,不少帖子主題和課程內(nèi)容無關?;谏鲜鰞蓚€原因,最終導致了研究結(jié)果中互動水平和學業(yè)成就無關?;谀壳按蟛糠衷诰€課程的論壇數(shù)據(jù)都是很稀疏的事實,本文推測之前得出互動水平和學業(yè)成就有關研究的論壇數(shù)據(jù)可能是受到控制后的結(jié)果。
第三,學業(yè)成就標簽數(shù)據(jù)需要調(diào)整:結(jié)論中答題的速度及每次答題的分數(shù)和最終的學業(yè)成就也沒有關系,是否意味著最終線下考核試題是作為選修的線上課程的客觀題或主觀題部分題目的再現(xiàn)。所有的題目都見過、做過并且重新“刷過”,最終這樣的線下考核當然就看學習者的態(tài)度和投入水平了,因此后續(xù)研究需要從更多的維度來描述學業(yè)成就而不單純使用線下成績來表示在線學業(yè)成就。
根據(jù)本研究結(jié)果,也給參加在線課程學習的學習者就如何能獲得較好學習成就提供一些建議:首先,加強時間管理,積極及時參加在線課程學習。由于在線學習沒有線下學習課堂管理的各種約束,很多在線學習者會無意識拖延課程學習,直到最后放棄課程學習。本研究數(shù)據(jù)表明,未完成前兩周課程的學習者占最終放棄課程學習的比例高達近78%;其次,提高投入水平,認真完成課程資源學習。對課程資源尤其是視頻資源的學習,最好能集中精力,做到一氣呵成,多次短時間的視頻觀看會導致更多的精力消耗在系統(tǒng)的切換中;最后,堅持目標導向,努力完成在線課程每周的各類練習。研究結(jié)果表明,完成練習的數(shù)量影響最終的學習成就,所以不要拘泥于每次練習的具體成績,而是要能堅持完成盡量多的練習。通過練習促使學習者自己能認真學習在線課程各類資源,最后達到較好的學業(yè)成就。
學習分析作為教育技術專業(yè)新興的研究領域,通過機器學習算法對海量教育進行分析時,可能會得到很多看似不合邏輯的結(jié)論,對這些結(jié)論不能不加分析進行使用,只有抱著科學的懷疑精神,對結(jié)果進行理性分析,找出背后的教育規(guī)律才能使學習分析技術真正服務于精準教育,改善信息化環(huán)境下的教與學,讓個性化教學成為現(xiàn)實。
作者簡介:
孫發(fā)勤:講師,在讀博士,研究方向為教育大數(shù)據(jù)、教育數(shù)據(jù)挖掘與學習分析(fqsun@yzu.edu.cn)。
馮銳:教授,博士生導師,研究方向為新媒體開發(fā)與應用、教育信息化建設、學習科學與技術設計(frzx0519@163.com)。