樂惠驍 范逸洲 賈積有 汪瓊
摘要:基于中國大學(xué)MOOC平臺(tái)上《翻轉(zhuǎn)課堂教學(xué)法》MOOC中17204名學(xué)習(xí)者的行為日志數(shù)據(jù),在為學(xué)習(xí)者的頁面訪問記錄賦予有意義的行為編碼標(biāo)簽,建立其學(xué)習(xí)路徑模型后,使用統(tǒng)計(jì)和共現(xiàn)分析的方法,研究其中優(yōu)秀學(xué)習(xí)者的學(xué)習(xí)行為模式特點(diǎn)。研究發(fā)現(xiàn),優(yōu)秀學(xué)習(xí)者總行為序列長度顯著高于其他學(xué)習(xí)者,上線學(xué)習(xí)的次數(shù)顯著地多于其他學(xué)習(xí)者;但是每次上線學(xué)習(xí)發(fā)生的有意義的交互行為的數(shù)量與其他學(xué)習(xí)者相仿,學(xué)習(xí)時(shí)長也相仿;其參與和回答教師的提問、復(fù)習(xí)已學(xué)過的內(nèi)容、參與論壇互動(dòng)的行為在其總學(xué)習(xí)行為中占比更多,而學(xué)習(xí)全新內(nèi)容、參與測驗(yàn)、把握全局等行為的占比較少。研究用共現(xiàn)分析的方法分析了學(xué)習(xí)者每次上線產(chǎn)生的行為之間的共現(xiàn)關(guān)系,發(fā)現(xiàn)優(yōu)秀的慕課學(xué)習(xí)者在學(xué)習(xí)新內(nèi)容時(shí)更少發(fā)生走神和中斷的情況,且其每次上線的目的更鮮明,學(xué)習(xí)主題更突出。研究的發(fā)現(xiàn)揭示了優(yōu)秀慕課學(xué)習(xí)者學(xué)習(xí)行為模式的特征,有助于改進(jìn)慕課教學(xué)。此外,共現(xiàn)分析的方法也為行為數(shù)據(jù)的挖掘提供了新的思路。
關(guān)鍵詞:慕課;行為模式;學(xué)習(xí)路徑;共現(xiàn)分析
中圖分類號(hào):G434 文獻(xiàn)標(biāo)識(shí)碼:A
一、引言
慕課這一概念自2008年提出至今,已經(jīng)經(jīng)歷了10年的發(fā)展,在線開放課程已經(jīng)成為如今教育的重要一部分。教育部在《2018年教育信息化和網(wǎng)絡(luò)安全工作要點(diǎn)》中強(qiáng)調(diào)要形成國家教育資源公共服務(wù)體系,認(rèn)定第二批國家精品在線開放課程(MOOC)500門以上,體現(xiàn)了在線開放課程正在逐步融入主流、常態(tài)的高等教育體系。在慕課發(fā)展的過程中,如何提升慕課的教學(xué)質(zhì)量向來是研究的焦點(diǎn)。
目前,對(duì)于“如何提升慕課教學(xué)質(zhì)量”的回答主要集中于兩方面。一方面從政策建議入手,以教學(xué)系統(tǒng)的制度變革等手段在宏觀上來推進(jìn)慕課教學(xué)質(zhì)量的提升;另一方面,也是如今被討論得更多的,是健全和完善慕課平臺(tái)的學(xué)習(xí)支持服務(wù),為學(xué)習(xí)者提供更加全面、個(gè)性化的學(xué)習(xí)指導(dǎo)和更好的人機(jī)交互體驗(yàn),或使用策略來激發(fā)學(xué)習(xí)者的學(xué)習(xí)動(dòng)機(jī),以此類方法提升教學(xué)質(zhì)量。在與后者相關(guān)的研究視域下,提升慕課教學(xué)質(zhì)量的問題成為了一個(gè)工程問題——如何設(shè)計(jì)能有效支持學(xué)習(xí)者學(xué)習(xí)的系統(tǒng)并實(shí)現(xiàn)它。在技術(shù)高度發(fā)達(dá)的今日,各種技術(shù)的應(yīng)用愈發(fā)成熟,對(duì)于教育技術(shù)研究者來說這個(gè)問題的難點(diǎn)更多地在于設(shè)計(jì)上。大多數(shù)學(xué)者的選擇是在教學(xué)理論和教學(xué)經(jīng)驗(yàn)的基礎(chǔ)上進(jìn)行設(shè)計(jì)。然而,歸納式的教學(xué)理論是否能很好地貼合大量涌現(xiàn)的慕課教學(xué)的實(shí)際場景是—個(gè)值得商榷的問題。在這種抽象的理論到實(shí)際設(shè)計(jì)過程中,真實(shí)的、來自實(shí)踐的經(jīng)驗(yàn)是彌補(bǔ)理論到實(shí)踐之間溝壑的重要依據(jù)。在數(shù)據(jù)技術(shù)愈加完善的今日,慕課平臺(tái)上的學(xué)習(xí)者行為數(shù)據(jù)無疑是這些依據(jù)的重要來源。行為是經(jīng)典心理學(xué)關(guān)注的焦點(diǎn),對(duì)行為的研究能揭示學(xué)習(xí)者學(xué)習(xí)的一般規(guī)律,利用數(shù)據(jù)挖掘的手段對(duì)慕課平臺(tái)上產(chǎn)生的學(xué)習(xí)行為數(shù)據(jù)進(jìn)行分析,有助于加深對(duì)慕課教學(xué)的理解。
在這樣的背景下,我們開展了這項(xiàng)研究。本研究以中國大學(xué)慕課《翻轉(zhuǎn)課堂教學(xué)法MOOC》中的學(xué)習(xí)者產(chǎn)生的行為數(shù)據(jù)為研究對(duì)象,使用數(shù)據(jù)挖掘的方法探究優(yōu)秀慕課學(xué)習(xí)者行為模式的特點(diǎn)。本研究是數(shù)據(jù)驅(qū)動(dòng)的研究,關(guān)注的問題是優(yōu)秀的慕課學(xué)習(xí)者在在線課程平臺(tái)中學(xué)習(xí)行為模式的特點(diǎn)。本文對(duì)“優(yōu)秀的慕課學(xué)習(xí)者”的操作定義是按照慕課課程評(píng)價(jià)標(biāo)準(zhǔn),獲得了優(yōu)秀評(píng)價(jià)的學(xué)習(xí)者,即最后的結(jié)業(yè)成績達(dá)到了80分以上的學(xué)習(xí)者。這一部分的學(xué)習(xí)者是具有相當(dāng)?shù)拇硇院吞厥庑缘膶W(xué)習(xí)者群體。其代表性在于,他們是課程希望培養(yǎng)的學(xué)習(xí)者,其學(xué)習(xí)表現(xiàn)滿足了教學(xué)方的期望。他們自身的學(xué)習(xí)特點(diǎn)(如學(xué)習(xí)策略等)有著一定的特殊性,對(duì)他們的行為數(shù)據(jù)進(jìn)行研究可以提供關(guān)于“如何促進(jìn)學(xué)習(xí)”的有效信息。通過對(duì)比他們與其他學(xué)習(xí)者的學(xué)習(xí)行為模式,揭示他們的特征,可以幫助研究者更好地理解真實(shí)的慕課教學(xué)。
二、相關(guān)研究
已有許多學(xué)者開展了基于學(xué)習(xí)行為數(shù)據(jù)的研究。大多數(shù)的研究致力于建立起一種“行為模式一學(xué)業(yè)表現(xiàn)”的關(guān)系,揭示平臺(tái)中學(xué)習(xí)者活動(dòng)的行為并予以分析,研究中難點(diǎn)在于:如何對(duì)學(xué)習(xí)行為進(jìn)行表征和建模;如何探究行為模式與學(xué)習(xí)者學(xué)業(yè)表現(xiàn)之間的關(guān)系。
對(duì)學(xué)習(xí)行為建模中重要的一步在于從數(shù)據(jù)中提取需要的特征。研究者可以根據(jù)數(shù)據(jù)集中的字段信息或理論需要,結(jié)合字段的信息形成需要的變量來表征某些行為模式的特征。如賈積有等提出在線學(xué)習(xí)活動(dòng)指數(shù)OLAI這一指標(biāo)來表征學(xué)習(xí)者參與在線學(xué)習(xí)活動(dòng)時(shí)的特征;如今對(duì)于學(xué)習(xí)行為的研究不再局限于對(duì)靜態(tài)的屬性分析,許多研究者已經(jīng)開展了對(duì)于學(xué)習(xí)者行為的動(dòng)態(tài)特征,即行為序列的研究。對(duì)行為序列的研究中一種常用的方法是給用戶行為進(jìn)行編碼:如楊現(xiàn)民等對(duì)用戶的頁面瀏覽行為進(jìn)行編碼,用滯后序列分析的方法尋找值得解讀的行為模式。對(duì)于序列行為的研究,可以采用時(shí)間序列的方法用離散隨機(jī)過程表征學(xué)習(xí)者的行為序列,并進(jìn)行進(jìn)一步的數(shù)據(jù)挖掘,如Maldonado等使用時(shí)間序列的方法從數(shù)據(jù)中尋找有理論價(jià)值的行為模式,Davis等也做了相似的研究,用離散隨機(jī)過程對(duì)學(xué)習(xí)者的學(xué)習(xí)行為進(jìn)行建模,并以狀態(tài)間的轉(zhuǎn)移為基本單位分析學(xué)習(xí)者在線學(xué)習(xí)行為的模式。
另一個(gè)重點(diǎn)在于如何發(fā)現(xiàn)行為模式與學(xué)業(yè)表現(xiàn)之間的關(guān)系。經(jīng)典的研究方法是是采用相關(guān)分析、因果分析等統(tǒng)計(jì)手段探究表征學(xué)習(xí)模式的變量與表征學(xué)業(yè)成就的變量之間的關(guān)系,并給予理論解讀。如賈積有等對(duì)北京大學(xué)六門慕課的數(shù)據(jù)進(jìn)行分析并探究學(xué)習(xí)活動(dòng)行為對(duì)學(xué)業(yè)成績的影響。如今,越來越多的研究也加入了一些數(shù)據(jù)挖掘的方法,如聚類分析,主要解決研究者單純從現(xiàn)有模型出發(fā)無法從數(shù)據(jù)中有效提取信息的問題:如李爽等通過相關(guān)分析、LSA和聚類分析等手段研究學(xué)習(xí)者行為與課程成績的關(guān)系以及行為模式和特征,王改花等用特征聚類的方法對(duì)網(wǎng)絡(luò)學(xué)習(xí)者進(jìn)行分類。Vaessen等采用聚類和回歸算法研究智能學(xué)習(xí)系統(tǒng)中學(xué)習(xí)者的求助策略與學(xué)習(xí)成績的關(guān)系。其中,聚類分析可以在數(shù)據(jù)層面將學(xué)習(xí)者的一些信息挖掘出來,并給予研究者以啟發(fā)。
三、研究設(shè)計(jì)
(一)研究問題和框架
本研究的研究問題是優(yōu)秀的慕課學(xué)習(xí)者在慕課平臺(tái)中的行為模式的特點(diǎn)是什么。更具體地說,是要回答兩個(gè)問題:
1.優(yōu)秀的慕課學(xué)習(xí)者在線行為序列的長度以及各類行為占比與其他學(xué)習(xí)者相比有什么不同?
2.優(yōu)秀的慕課學(xué)習(xí)者每一次上線學(xué)習(xí)產(chǎn)生的各類有行為的共現(xiàn)(Co-Occurence)情況與其他學(xué)習(xí)者相比有什么不同?
研究用基于規(guī)則的機(jī)器自動(dòng)標(biāo)注的方法為學(xué)習(xí)者產(chǎn)生的行為數(shù)據(jù)賦予有意義的編碼,并為其建立學(xué)習(xí)路徑模型。研究將數(shù)據(jù)集中的學(xué)習(xí)者按照最終學(xué)業(yè)表現(xiàn)分為了四組,并探究各組成員在線行為中各類有意義行為占行為總數(shù)的比的差別。通過對(duì)行為編碼的共現(xiàn)分析回答第二個(gè)問題。
(二)數(shù)據(jù)集
研究的對(duì)象是中國大學(xué)慕課上《翻轉(zhuǎn)課堂教學(xué)法》MOOC共計(jì)13期的學(xué)習(xí)者,時(shí)間跨度從2015年3月至2017年12月。他們所有學(xué)習(xí)課程期間的瀏覽頁面記錄被系統(tǒng)后臺(tái)頁面所記錄并形成了數(shù)據(jù)集。數(shù)據(jù)集中能提供的信息包括瀏覽記錄編號(hào)、學(xué)習(xí)者編號(hào)、學(xué)期編號(hào)、學(xué)業(yè)成績、上線時(shí)間、下線時(shí)間和瀏覽頁面的名稱。該課程在平臺(tái)上有較大的影響力和相對(duì)較大的學(xué)習(xí)者群體。然而,在線教學(xué)情境復(fù)雜,學(xué)習(xí)者組成相當(dāng)多元且表現(xiàn)出的學(xué)習(xí)行為也相當(dāng)駁雜,故研究最終只保留最終獲得了成績且上線學(xué)習(xí)次數(shù)超過3次的17204名學(xué)習(xí)者作為研究對(duì)象,因?yàn)樗麄冊(cè)谡n程中花費(fèi)的精力相對(duì)來說更多,是在課程設(shè)計(jì)之初所期望的學(xué)習(xí)者對(duì)象。
(三)術(shù)語定義
1.學(xué)習(xí)路徑
學(xué)習(xí)路徑(Learning Path)是學(xué)習(xí)者完成教學(xué)活動(dòng)時(shí)參與不同教學(xué)活動(dòng)模塊的路徑記錄。例如,在—個(gè)基于Web的教學(xué)系統(tǒng)中,一個(gè)學(xué)習(xí)者的學(xué)習(xí)路徑可以用其訪問的頁面、在頁面中停留的時(shí)間、點(diǎn)擊的控件等人機(jī)交互行為來描述。在本文中,學(xué)習(xí)路徑中的基本元素是學(xué)習(xí)者的行為編碼,本文提出了以下幾種行為編碼來賦予學(xué)習(xí)者學(xué)習(xí)路徑中不同行為及意義,并形成了行為編碼詞典,如表1所示。
經(jīng)過編碼后的學(xué)習(xí)路徑可以通過一個(gè)數(shù)字編碼的序列進(jìn)行表示,如“024411117801111245550”表示的就是某學(xué)習(xí)者兩次登陸進(jìn)行學(xué)習(xí)的學(xué)習(xí)路徑。如何在大量的頁面訪問中識(shí)別到有意義的信息,首先需要對(duì)每個(gè)學(xué)習(xí)者的學(xué)習(xí)記錄進(jìn)行編碼,即為學(xué)習(xí)者訪問每個(gè)頁面的記錄打上有理論意義的標(biāo)簽。在編碼過程中,有大量頁面停留時(shí)間在5秒及以下,本文將這些頁面訪問記錄識(shí)別為行為噪音并予以剔除。
2.RSBC
對(duì)于不同學(xué)習(xí)者,某個(gè)行為編碼在其所有學(xué)習(xí)路徑中所有行為中的占比(Ratio of Specific Behavior Codes,簡稱RSBC)是不一樣的。例如,對(duì)于學(xué)習(xí)者A,其學(xué)習(xí)路徑中的所有行為用“2441111780”這樣—個(gè)行為序列表示,則其“1”行為出現(xiàn)的頻數(shù)為4,而序列中所有行為的個(gè)數(shù)為10,故其編碼1的RSBC為25%。一個(gè)學(xué)習(xí)者不同編碼行為的RSBC是一個(gè)有意義的指標(biāo),通過對(duì)學(xué)習(xí)者不同編碼行為的RSBC的解讀,可以從學(xué)習(xí)者的行為中了解一個(gè)學(xué)習(xí)者的學(xué)習(xí)的常態(tài)。例如,有的學(xué)習(xí)者偏好以課程視頻為主要內(nèi)容,快速瀏覽過整個(gè)課程獲取其需要的知識(shí),也有的學(xué)習(xí)者喜好通過與同伴的交流和互動(dòng)加深對(duì)知識(shí)的理解。深入挖掘一門課程中不同學(xué)習(xí)者RSBC的信息對(duì)揭示學(xué)習(xí)者的學(xué)習(xí)模式和策略有極大的意義。
四、數(shù)據(jù)挖掘和分析
(一)為學(xué)習(xí)者建立學(xué)習(xí)路徑模型
首先根據(jù)每個(gè)學(xué)習(xí)者的數(shù)據(jù)為課程平臺(tái)上的所有學(xué)習(xí)者建立學(xué)習(xí)路徑模型。將每個(gè)學(xué)習(xí)者每次進(jìn)入課程的在線會(huì)話記錄編碼后合并,共得到17204條記錄。統(tǒng)計(jì)所有學(xué)習(xí)者的行為頻次及占比,結(jié)果如表2所示,表中的列表示行為編碼,為所有學(xué)習(xí)者每種行為出現(xiàn)的頻數(shù)以及其占行為總數(shù)的比。
(二)學(xué)習(xí)者分組
本文的研究問題是探究優(yōu)秀的慕課學(xué)習(xí)者的學(xué)習(xí)行為模式有什么樣的特點(diǎn),本文采用比較研究的思路,依據(jù)學(xué)習(xí)者在平臺(tái)上的學(xué)業(yè)表現(xiàn)對(duì)學(xué)習(xí)者進(jìn)行分組,并通過組間的學(xué)習(xí)行為之間的比較來研究優(yōu)秀學(xué)習(xí)者的學(xué)習(xí)行為模式的特點(diǎn)。研究將學(xué)習(xí)者分為以下四組:第一組為成績?cè)赱0,20)區(qū)間內(nèi)的學(xué)習(xí)者,第二組為成績?cè)赱20,60)區(qū)間內(nèi)的學(xué)習(xí)者,第三組為成績?cè)赱60,80)區(qū)間內(nèi)的學(xué)習(xí)者,第四組為成績?cè)赱80,100]的學(xué)習(xí)者。從成績的直方圖分布來看這是一個(gè)U型(如圖1所示),即成績較差和較好的學(xué)習(xí)者較多,但是成績中等(20-60)分的學(xué)習(xí)者較少,故依此劃分了[0,20),[20,60)和[60,100]這三個(gè)區(qū)間。但是對(duì)于有獲得證書需要的學(xué)習(xí)者來說,是否獲得優(yōu)秀(80分)的評(píng)級(jí)是一個(gè)較為重要的變量,對(duì)其最終表現(xiàn)出的在線行為有著較強(qiáng)的影響,故最終將學(xué)習(xí)者群體劃分成了四個(gè)組,人數(shù)分別為8609、1596、2503、4496人。
(三)不同組學(xué)習(xí)者行為占比及行為序列長度的比較和解讀
研究對(duì)不同組學(xué)習(xí)者的RSBC和行為序列長度繪制箱形圖并比較,其結(jié)果如下頁圖2所示。
下頁圖2中有12張箱型圖,圖中依次是行為編碼0-9在不同組學(xué)習(xí)者的RSBC、行為序列長度以及成績的箱形圖。前10張小圖的縱軸為行為編碼的RSBC,橫軸為學(xué)習(xí)者分組1到4,分別是成績由低到高的四個(gè)組。箱形的上沿和下沿分別是該組樣本的上四分位數(shù)和下四分位數(shù),箱形中間的黑線表示其樣本的中位數(shù)。(文中若如無特殊說明,所報(bào)告的組間均值差異均通過了顯著性水平為0.05的雙樣本t檢驗(yàn))
1.不同組學(xué)習(xí)者行為序列長度和時(shí)長的比較和解讀
行為序列長度指學(xué)習(xí)者學(xué)習(xí)路徑中各編碼數(shù)量的總和,學(xué)習(xí)者在平臺(tái)上有意義的訪問頁面的行為越多,則其行為序列的長度也就越長。四組學(xué)習(xí)者的行為序列長度的均值大小為又X4>X3>X2>X1。需要說明的是,所有編碼在不同的學(xué)習(xí)者組中出現(xiàn)的頻數(shù)的均值的大小的排序均為X4>X3>X2>X1,即優(yōu)秀的慕課學(xué)習(xí)者的與平臺(tái)發(fā)生交互的次數(shù)更多。
第四組學(xué)習(xí)者的行為序列長度明顯高于前三組,這說明第四組學(xué)習(xí)者與平臺(tái)發(fā)生的交互更多。以所有學(xué)習(xí)者為樣本,學(xué)習(xí)者的行為序列的長度與其學(xué)習(xí)成績有極強(qiáng)的正相關(guān),其皮爾遜相關(guān)系達(dá)到了0.8,且在0.05的顯著性水平下顯著,是預(yù)測學(xué)習(xí)者表現(xiàn)的一個(gè)十分有效的指標(biāo)。
此外,各組學(xué)習(xí)者的所有學(xué)習(xí)行為序列的長度、一學(xué)期中的上線次數(shù)、每次上線發(fā)生的有意義交互行為的數(shù)量中蘊(yùn)藏著許多有價(jià)值的信息。以每次的信號(hào)行為,即頁面停留時(shí)間在45分鐘以上的行為,作為一次學(xué)習(xí)者一次線上學(xué)習(xí)的開始和結(jié)束,可以統(tǒng)計(jì)每個(gè)學(xué)習(xí)者上線學(xué)習(xí)的次數(shù)以及每次上線發(fā)生的交互行為的數(shù)量。圖3左側(cè)的箱形圖展示的是四組學(xué)習(xí)者上線學(xué)習(xí)次數(shù)的統(tǒng)計(jì)結(jié)果,四組學(xué)習(xí)者的上線學(xué)習(xí)次數(shù)的均值大小為X4>X3>X2>X1,一結(jié)果說明成績?cè)胶玫膶W(xué)習(xí)者,其上線參與學(xué)習(xí)的次數(shù)越多。但是,各組學(xué)習(xí)者上線學(xué)習(xí)的過程中他們與平臺(tái)進(jìn)行交互的行為頻數(shù)是否有差異呢?圖3右邊圖的結(jié)果顯示四組學(xué)習(xí)者每次上線與平臺(tái)發(fā)生有意義交互行為的次數(shù)之間的差異并不大:四組均值分別為14.95、15.41、14.57、15.21。
統(tǒng)計(jì)各組學(xué)習(xí)者每次上線學(xué)習(xí)的時(shí)長,發(fā)現(xiàn)其差別也不大。四組的均值分別為34.35分鐘、33.69分鐘、32.36分鐘和35.47分鐘,第四組學(xué)習(xí)者的平均每次上線時(shí)長稍長于其他幾組。
2.不同組學(xué)習(xí)者各RSBC差異的比較
從編碼1的RSBC來看,四組學(xué)習(xí)者的編碼1的RSBC的均值大小為X1>X2>X4>X3。編碼1是學(xué)習(xí)新內(nèi)容的行為,由表2可知,在所有學(xué)習(xí)者中,編碼1的RSBC達(dá)到了23.6%,在學(xué)習(xí)者的所有學(xué)習(xí)行為中占有很大的比重。四組學(xué)習(xí)者間的差異也顯示了,成績較差的兩組學(xué)生(組1、組2)的編碼1的RSBC較高,其觀看新內(nèi)容在所有學(xué)習(xí)行為中占有了很大的比重;而成績達(dá)到了及格及以上的兩組學(xué)生(組3、組4)其編碼1的RSBC又相對(duì)較低,而成績較好的那組(組4)的RSBC更高。
編碼2的意義是復(fù)習(xí)已經(jīng)學(xué)過的內(nèi)容。各組編碼2的RSBC的均值差異情況為為X4>X3>X2>X1,除1、2兩組之間的均值差異外,其余各組之間的均值差異皆通過了顯著性水平為0.05的雙樣本t檢驗(yàn)。這一結(jié)果說明學(xué)業(yè)表現(xiàn)更好的學(xué)習(xí)者的所有學(xué)習(xí)行為中的復(fù)習(xí)行為所占的比例相對(duì)來說更高,且第四組學(xué)習(xí)者的編碼2的RSBC是所有組中最大的。
編碼3的意義是瀏覽和回答課堂討論區(qū)中的教師提問。各組編碼3的RSBC的均值情況為X4>X3>X2>X1。這說明學(xué)業(yè)表現(xiàn)更好的學(xué)習(xí)者的所有學(xué)習(xí)行為中瀏覽和回答課堂討論區(qū)中教師的提問這一行為在其所有學(xué)習(xí)行為中的占比會(huì)更高。
編碼4的RSBC代表的是參與論壇互動(dòng)(發(fā)帖或者回帖)在學(xué)習(xí)者的學(xué)習(xí)行為中所占的比例。在整個(gè)學(xué)習(xí)者群體中,編碼4的RSBC的平均值是4.6%,是一個(gè)占比相對(duì)較小的行為。四組學(xué)習(xí)者的編碼4的RSBC的均值的情況為X4>X3>X2>X1。這說明成績更好的學(xué)生所有學(xué)習(xí)行為中參與論壇互動(dòng)的行為比例在四組中是最高的。
編碼5的RSBC代表的是參與測驗(yàn)這一行為在學(xué)習(xí)者的學(xué)習(xí)行為中所占的比例,整個(gè)學(xué)習(xí)者群體的編碼5的RSBC的均值呈現(xiàn)一個(gè)倒U型的分布:均值大小為X3>X2>X4>X1。這一結(jié)果有許多值得解讀的地方:優(yōu)秀學(xué)習(xí)者的學(xué)習(xí)行為中測驗(yàn)行為對(duì)應(yīng)的編碼的RSBC并沒有成績中等的兩組(組2、組3)高,說明這兩組的學(xué)習(xí)者在參與測驗(yàn)上所花費(fèi)的時(shí)間相對(duì)來說會(huì)比最優(yōu)秀的學(xué)習(xí)者更多。值得注意的是,這種“更多”是一種“相對(duì)”的行為占比上的更多,而非“絕對(duì)”的行為數(shù)量。各組學(xué)習(xí)者樣本的編碼5出現(xiàn)的平均頻數(shù)為:X4>X3>X2>X1,值分別為109.6、86.7、45.5、7.8。對(duì)這一現(xiàn)象可以給出這樣一種可能的解釋:優(yōu)秀的慕課學(xué)習(xí)者更愿意參加測驗(yàn),但是他們也會(huì)花費(fèi)相對(duì)其他學(xué)習(xí)者更多的精力在獲取成績以外的地方。
編碼6的RSBC是學(xué)習(xí)者瀏覽公告、評(píng)分標(biāo)準(zhǔn)、課程日歷、章節(jié)介紹、章節(jié)回顧等行為在學(xué)習(xí)者所有行為中所占的比例。四組學(xué)習(xí)者的編碼6的RSBC的均值大小為X1>X2>X3>X4。說明優(yōu)秀學(xué)習(xí)者的瀏覽公告等與知識(shí)內(nèi)容不直接相關(guān)的這些行為在其所有學(xué)習(xí)行為中占比相對(duì)其他組來說更少。
編碼7出現(xiàn)的頻數(shù)是最少的學(xué)習(xí)行為。對(duì)各組的編碼7的RSBC的均值之間的差異進(jìn)行t檢驗(yàn),在0.05的顯著性水平下發(fā)現(xiàn)只有第一組學(xué)習(xí)者的編碼RSBC高于其他三組學(xué)習(xí)者,但是其他三組學(xué)習(xí)者的組間并無顯著差異。對(duì)于第一組學(xué)習(xí)者,由于其課程的參與度不高,其各種行為會(huì)呈現(xiàn)出更散亂、隨機(jī)的特征。但是其余三組學(xué)習(xí)者的編碼7普遍較低,說明其求助行為在總行為中的占比較少。
編碼8出現(xiàn)的頻數(shù)也不高,其RSBC的均值與編碼7的情況相反,在0.05顯著性水平的t檢驗(yàn)下,發(fā)現(xiàn)只有第四組學(xué)習(xí)者RSCB的均值顯著高于其他三組,這一發(fā)現(xiàn)暗示了優(yōu)秀學(xué)習(xí)者的學(xué)習(xí)行為中中斷或走神所占的比例會(huì)比其他學(xué)習(xí)者高。對(duì)于這一問題的發(fā)生機(jī)制,會(huì)在后文進(jìn)行探討。
編碼9的RSBC是尋找行為在學(xué)習(xí)學(xué)者所有行為中的比例,在0.05顯著性水平的t檢驗(yàn)下,第四組學(xué)習(xí)者的RSBC僅與第一組學(xué)習(xí)者有顯著差異,且第四組高于第一組。與對(duì)編碼7的情況的解讀相似,對(duì)于這種情況的一種猜想是:第一組學(xué)習(xí)者的課程參與度不高,其學(xué)習(xí)行為更為隨意,目的性更少。而第四組學(xué)習(xí)者每次學(xué)習(xí)的目的性更強(qiáng),在不熟悉頁面間導(dǎo)航結(jié)構(gòu)的情況下更容易出現(xiàn)尋找行為。
3.對(duì)各組學(xué)習(xí)者編碼8的RSBC差異的因果推斷
結(jié)合之前關(guān)于優(yōu)秀學(xué)習(xí)者上線更為頻繁的結(jié)論,不難發(fā)現(xiàn)優(yōu)秀學(xué)習(xí)者的總在線時(shí)長更長。這給解釋編碼8的情況——優(yōu)秀的慕課學(xué)習(xí)者的走神和中斷行為提出了新的問題:從學(xué)習(xí)疲勞理論的角度來看,高強(qiáng)度的學(xué)習(xí)導(dǎo)致學(xué)習(xí)疲勞會(huì)使學(xué)習(xí)者產(chǎn)生抑郁情緒,情緒沮喪、心情郁悶、動(dòng)機(jī)缺乏、效能感降低等反應(yīng),頻繁的上線學(xué)習(xí)導(dǎo)致的學(xué)習(xí)疲勞可能是走神和中斷現(xiàn)象出現(xiàn)的一個(gè)原因。毫無疑問,優(yōu)秀的慕課學(xué)習(xí)者更易發(fā)生學(xué)習(xí)疲勞。那么,優(yōu)秀學(xué)習(xí)者的編碼8的RSBC偏高是否能由其長時(shí)間頻繁的學(xué)習(xí)所解釋呢?
研究使用傾向得分匹配方法(PSM)對(duì)數(shù)據(jù)集中的學(xué)習(xí)者個(gè)體進(jìn)行匹配,需要控制的混淆變量是每次的平均在線時(shí)長和登錄次數(shù)。理論上而言,傾向得分匹配方法(PSM)通過再抽樣或基于接受干預(yù)的概率(即傾向值)將未被干預(yù)的成員與被干預(yù)的成員進(jìn)行匹配來平衡數(shù)據(jù),經(jīng)過傾向得分匹配方法處理后,以成績是否超過80分作為原因變量,處理組(80分以上的學(xué)習(xí)者)與控制組(80分以下學(xué)習(xí)者)的學(xué)習(xí)者的平均在線時(shí)長和登錄次數(shù)是一致的。
使用Logit模型估計(jì)傾向值,使用遺傳算法匹配前三組中傾向值與第四組相近的學(xué)習(xí)者,最終匹配到4496名處理組的學(xué)習(xí)者和2101名控制組的學(xué)習(xí)者,匹配的效果如表3所示。
從表3來看,經(jīng)過匹配后,可以發(fā)現(xiàn)控制組和處理組的這兩個(gè)變量的值幾乎相同,偏差均在5%以內(nèi),匹配效果較好,可以認(rèn)為已經(jīng)在數(shù)據(jù)中控制了這兩個(gè)變量。
對(duì)匹配后的控制組和處理組的編碼8的RSBC進(jìn)行t檢驗(yàn),檢驗(yàn)結(jié)果顯示控制組編碼8的RSBC為0.0161,處理組的編碼8的RSBC為0.0147,且在0.01的a值下顯著。
控制了學(xué)習(xí)疲勞這一因素后的結(jié)果與未控制的結(jié)果恰恰相反。結(jié)果表明若比較兩個(gè)平均在線時(shí)長和上線次數(shù)都相似的優(yōu)秀學(xué)習(xí)者和普通學(xué)習(xí)者,優(yōu)秀學(xué)習(xí)者發(fā)生走神、中斷等行為的頻率在統(tǒng)計(jì)意義上會(huì)比普通學(xué)習(xí)者更低,他們的學(xué)習(xí)會(huì)顯得更專注。
4.優(yōu)秀學(xué)習(xí)者行為占比及行為序列長度的特征
至此,研究能回答第一個(gè)研究問題,并對(duì)優(yōu)秀慕課學(xué)習(xí)者的特點(diǎn)有—個(gè)大概的描述:首先,優(yōu)秀的慕課學(xué)習(xí)者在平臺(tái)上的活動(dòng)更多,在線時(shí)間更長,與平臺(tái)的內(nèi)容發(fā)生的交互更多。但是其有記錄的每次上線學(xué)習(xí)過程中與平臺(tái)發(fā)生的有記錄的行為次數(shù)、在線時(shí)長與其他學(xué)習(xí)者相仿,但是其上線學(xué)習(xí)的次數(shù)明顯高于其他學(xué)習(xí)者。其次,比較其在平臺(tái)中的各種行為的占比與其他學(xué)習(xí)者的區(qū)別,他們參與和回答教師的提問、復(fù)習(xí)已學(xué)過的內(nèi)容、參與論壇互動(dòng)的行為的占比更多,而學(xué)習(xí)全新內(nèi)容、參與測驗(yàn)、把握全局等行為的占比較少。一點(diǎn)有意思的發(fā)現(xiàn)是,他們的走神和中斷行為的占比比其他學(xué)習(xí)者更多,但是若控制了學(xué)習(xí)疲勞這一變量,則他們發(fā)生走神、中斷等行為的頻率比普通學(xué)習(xí)者更少,表明他們的學(xué)習(xí)更專注,而中斷、走神等行為的偏高可能是他們調(diào)節(jié)自身認(rèn)知狀態(tài)的一種表現(xiàn)。要進(jìn)一步了解其特點(diǎn),需要進(jìn)行下一步更深入的挖掘。
(四)不同組學(xué)習(xí)者一次學(xué)習(xí)中各行為的共現(xiàn)分析和解讀
從之前的分析中可以發(fā)現(xiàn),優(yōu)秀的慕課學(xué)習(xí)者每次上線學(xué)習(xí)過程中與平臺(tái)發(fā)生的有記錄的行為次數(shù)與其他學(xué)習(xí)者相差不大,但是其每次上線的學(xué)習(xí)行為模式是否會(huì)有差別?統(tǒng)計(jì)學(xué)習(xí)者每一次上線記錄(以信號(hào)行為為分割)中的各行為編碼的共現(xiàn)次數(shù)并對(duì)其進(jìn)行共現(xiàn)分析,可以從中發(fā)現(xiàn)學(xué)習(xí)者的一次線上學(xué)習(xí)過程中,哪幾類行為更傾向于同時(shí)出現(xiàn)。
在共現(xiàn)分析中,因?yàn)樾盘?hào)行為標(biāo)志著一次在線學(xué)習(xí)的開始和結(jié)束,故對(duì)其信號(hào)行為的分析意義不大,本研究只研究編碼為1-9的各行為的共現(xiàn)情況,并對(duì)結(jié)果進(jìn)行可視化。
1.可視化方法
對(duì)學(xué)習(xí)者一次學(xué)習(xí)行為中各行為的共現(xiàn)情況進(jìn)行分析的第一步是計(jì)算其各編碼之間的支持度。
某一或某組學(xué)習(xí)者,其整個(gè)課程的學(xué)習(xí)過程中編碼行為X和編碼行為Y在某一次上線學(xué)習(xí)中同時(shí)出現(xiàn)的概率可以用關(guān)聯(lián)規(guī)則R:X→Y的支持度來表示:
其中,L為學(xué)習(xí)者一次上線產(chǎn)生的學(xué)習(xí)路徑中包含了編碼Y的記錄的集合count(X U L),表示在一次上線中某學(xué)習(xí)路徑同時(shí)含有編碼X和Y的次數(shù),IDI表示在所有的上線記錄構(gòu)成的集合中出現(xiàn)的,含有編碼Y的一次上線記錄的個(gè)數(shù)。
可以用圖的方式對(duì)四組學(xué)習(xí)者的各編碼行為間的共現(xiàn)關(guān)系進(jìn)行可視化??梢暬乃悸窞橛脠D的頂點(diǎn)表示1-9的行為編碼,頂點(diǎn)間邊的長度表征編碼間的共現(xiàn)關(guān)系,兩個(gè)編碼同時(shí)出現(xiàn)的頻率越大,頂點(diǎn)間邊的長度越小,兩個(gè)頂點(diǎn)的距離越近(如圖4所示)。
圖中有連線的頂點(diǎn)表示其代表的兩個(gè)編碼之間的支持度大于0.7,即在一次學(xué)習(xí)中共同出現(xiàn)的概率大于0.7。
2.學(xué)習(xí)者行為編碼共現(xiàn)情況
從圖中可以發(fā)現(xiàn),四組學(xué)習(xí)者的一次學(xué)習(xí)行為編碼的共現(xiàn)情況有一些普遍的規(guī)律:
(1)四組學(xué)習(xí)者中編碼8(走神或中斷)和編碼9(尋找行為)與編碼2(復(fù)習(xí))、5(參加測驗(yàn))、6(把握全局)、7瞇助)的共現(xiàn)概率較大,說明學(xué)習(xí)者在進(jìn)行復(fù)習(xí)、參加測驗(yàn)、瀏覽公告、在論壇尋求幫助等行為時(shí)有很大概率走神、中斷學(xué)習(xí)或者在頁面中迷航。
(2)圖中四組學(xué)習(xí)者的編碼2、5、6、7彼此之間的距離都很近,說明這幾類行為在一次學(xué)習(xí)中同時(shí)發(fā)生的概率很高。這可能是學(xué)習(xí)者學(xué)習(xí)的—種共同的模式:有計(jì)劃地在某次上線時(shí)專門進(jìn)行復(fù)習(xí)并參加測試。
除此以外,能在圖4中能發(fā)現(xiàn)優(yōu)秀學(xué)習(xí)者的一些特點(diǎn):
前三組學(xué)習(xí)者的編碼1(學(xué)習(xí)新內(nèi)容)與編碼8和9都有連線,說明其一次學(xué)習(xí)中在學(xué)習(xí)新內(nèi)容時(shí)更易發(fā)生走神、中斷和在頁面中迷航的情況。然而對(duì)于第四組學(xué)習(xí)者,即優(yōu)秀的慕課學(xué)習(xí)者而言,他們的編碼1與編碼8、9沒有連線,說明其在學(xué)習(xí)新內(nèi)容時(shí)相對(duì)更不容易發(fā)生走神和中斷的情況。而除此以外,優(yōu)秀學(xué)習(xí)者與其他學(xué)習(xí)者一樣,其編碼8與編碼2、5、6、7的共現(xiàn)較多,在進(jìn)行復(fù)習(xí)、參加測驗(yàn)、瀏覽公告、在論壇尋求幫助等行為時(shí)容易走神。
同時(shí),第四組學(xué)習(xí)者的編碼1與3(回答教師的提問)的距離是最近的,說明優(yōu)秀慕課學(xué)習(xí)者學(xué)習(xí)新內(nèi)容和回答教師提問更易在一次學(xué)習(xí)中同時(shí)發(fā)生。
更重要的是,優(yōu)秀的慕課學(xué)習(xí)者每次上線學(xué)習(xí)的主題更突出。從圖中可以發(fā)現(xiàn),對(duì)與其他幾組學(xué)習(xí)者相比,第四組學(xué)習(xí)者的編碼1與其他編碼的距離普遍顯得更遠(yuǎn),僅與編碼3距離相對(duì)較近。這說明除了回答教師提問外,優(yōu)秀慕課學(xué)習(xí)者的學(xué)習(xí)新內(nèi)容的行為是較為獨(dú)立地,與其他行為共現(xiàn)的概率不高,這暗示了他們的每一次上線學(xué)習(xí)可能都有較強(qiáng)的目的性和專一性——只學(xué)新內(nèi)容,或者只復(fù)習(xí)。第四組學(xué)習(xí)者編碼4(參與論壇互動(dòng))的情況也印證了這一猜想:它與其他的編碼的距離也較遠(yuǎn),說明該行為發(fā)生的獨(dú)立性也更高。如前文所說,編碼2、5、6、7可以被視作一種學(xué)習(xí)主題(復(fù)習(xí)并參加測試),而在各組學(xué)習(xí)者行為呈現(xiàn)出的共現(xiàn)情況來看,由于第四組的編碼1和4的距離較遠(yuǎn),可以將第四組學(xué)習(xí)者的編碼1和編碼4也視作兩種獨(dú)立的每次上線學(xué)習(xí)主題的核心:以學(xué)習(xí)新知識(shí)為主題或者以論壇互動(dòng)為主題。而其他學(xué)習(xí)者的編碼1和4的距離很近,并不能劃分出獨(dú)立的學(xué)習(xí)主題。故可以認(rèn)為,優(yōu)秀的慕課學(xué)習(xí)者每次上線學(xué)習(xí)的主題更突出。
3.優(yōu)秀學(xué)習(xí)者一次上線中各行為編碼共現(xiàn)的特點(diǎn)
至此,優(yōu)秀的慕課學(xué)習(xí)者的特點(diǎn)又增添了更多的細(xì)節(jié):首先,他們與其他學(xué)習(xí)者一樣,會(huì)有計(jì)劃地在一次學(xué)習(xí)中同時(shí)進(jìn)行復(fù)習(xí)、提問求助、參加測試,而且容易在期間發(fā)生走神和頁面間的迷航。但是他們?cè)趯W(xué)習(xí)新的學(xué)習(xí)內(nèi)容時(shí)更專注,不易發(fā)生學(xué)習(xí)中斷的情況,對(duì)頁面間的結(jié)構(gòu)也更了解。同時(shí),他們更傾向于在學(xué)習(xí)新內(nèi)容的同時(shí)回答教師的提問,而且他們每次學(xué)習(xí)的主題更突出。
五、結(jié)語
優(yōu)秀的學(xué)習(xí)者的學(xué)習(xí)模式有什么樣的特點(diǎn)?通過上述的分析,可以總結(jié)出以下幾點(diǎn):
首先,從學(xué)習(xí)投入上看,研究發(fā)現(xiàn)優(yōu)秀的慕課學(xué)習(xí)者在在慕課平臺(tái)上產(chǎn)生的有意義的交互行為的數(shù)量顯著地多于其他學(xué)習(xí)者,故其學(xué)習(xí)投入比其他學(xué)習(xí)者更多,這是優(yōu)秀學(xué)習(xí)者的一個(gè)重要特征。
其次,從學(xué)習(xí)策略上看,具體到RSBC,優(yōu)秀的慕課學(xué)習(xí)者的學(xué)習(xí)策略有著這樣的特點(diǎn):
第一,參與和回答教師的提問、復(fù)習(xí)已學(xué)過的內(nèi)容、參與論壇互動(dòng)的行為的占比更多,而學(xué)習(xí)全新內(nèi)容、參與測驗(yàn)、把握全局等行為的占比較少。
第二,從編碼間共現(xiàn)分析的結(jié)果來看,他們的每次上線學(xué)習(xí)顯得更有目的性,學(xué)習(xí)的主題更鮮明。
第三,他們更傾向于在學(xué)習(xí)新內(nèi)容的“同時(shí)”去回答教師的提問。事實(shí)上,在課程設(shè)計(jì)時(shí)學(xué)習(xí)者回答教師提問是穿插在新的教學(xué)內(nèi)容之中的,優(yōu)秀的學(xué)習(xí)者更傾向于遵從這種教學(xué)的引導(dǎo),而這種遵從也能促進(jìn)他們的學(xué)習(xí)。
第四,優(yōu)秀的慕課學(xué)習(xí)者的走神和中斷行為高于其他學(xué)習(xí)者。經(jīng)過進(jìn)一步分析,結(jié)果表明如果控制了學(xué)習(xí)疲勞這一因素,優(yōu)秀的慕課學(xué)習(xí)者發(fā)生走神和中斷的頻率會(huì)比其他學(xué)習(xí)者更低,他們的學(xué)習(xí)會(huì)更加專注。結(jié)合共現(xiàn)分析的結(jié)果來看,他們?cè)趯W(xué)習(xí)新內(nèi)容時(shí)的走神和中斷卻更少。優(yōu)秀的慕課學(xué)習(xí)者每次上線產(chǎn)生的有意義編碼序列的長度與其他學(xué)習(xí)者相仿,但是他們的上線學(xué)習(xí)次數(shù)更多。這暗示著優(yōu)秀的慕課學(xué)習(xí)者在高學(xué)習(xí)投入的學(xué)習(xí)過程中更專注,且偏好用休息等方式及時(shí)調(diào)整自身的狀態(tài),避免在學(xué)習(xí)新內(nèi)容時(shí)發(fā)生學(xué)習(xí)疲勞的情況。
從優(yōu)秀的慕課學(xué)習(xí)者表現(xiàn)出的學(xué)習(xí)策略來看,引導(dǎo)學(xué)習(xí)者參與論壇互動(dòng)和進(jìn)行復(fù)習(xí),是有效促進(jìn)學(xué)習(xí)者學(xué)習(xí)的手段,慕課設(shè)計(jì)者可以在設(shè)計(jì)中更多地加以考慮。
需要說明的是,本課程的設(shè)計(jì)中論壇互動(dòng)是評(píng)價(jià)的一部分,學(xué)習(xí)者可能會(huì)以成績?yōu)槟康娜ミM(jìn)行論壇互動(dòng)。在數(shù)據(jù)中,暫時(shí)沒有辦法將這兩部分的效應(yīng)進(jìn)行分離。優(yōu)秀的慕課學(xué)習(xí)者,在本文的操作定義的語境下只是成績得到了優(yōu)秀的學(xué)習(xí)者,但是他們是由兩部分可能的人構(gòu)成的:真正以學(xué)習(xí)知識(shí)和內(nèi)容為目標(biāo)的學(xué)習(xí)者與以獲得證書為目標(biāo)的功利學(xué)習(xí)者——雖然他們表現(xiàn)出相同的行為,但是其學(xué)習(xí)動(dòng)機(jī)與最終的習(xí)得的效果一定有差別。然而成績較低的第一組學(xué)習(xí)者中可能也不乏學(xué)習(xí)投入較高,但是不愿意參加測試的學(xué)習(xí)者,因?yàn)樗麄儗⒄n程作為獲取學(xué)習(xí)資源的平臺(tái)而不愿參加到學(xué)習(xí)評(píng)價(jià)中來。本研究并沒有辦法將這兩類“優(yōu)秀學(xué)習(xí)者”在數(shù)據(jù)層面上分離開來,這是研究的一大缺憾。
作者簡介:
樂惠驍:在讀碩士,研究方向?yàn)槿斯ぶ悄芘c教育、學(xué)習(xí)分析(interesting@pku.edu_cn)。
范逸洲:在讀博士,研究方向?yàn)閷W(xué)習(xí)分析(yizhou0034@126.com).
賈積有:博士,教授,研究方向?yàn)槿斯ぶ悄芘c教育(ljy@pku.edu.cn)。
汪瓊:博士,教授,研究方向?yàn)閑-Learning學(xué)習(xí)環(huán)境與學(xué)習(xí)設(shè)計(jì)(wangqiong@pku.edu.cn)。