国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

MOOCs交互模式聚類(lèi)研究

2016-04-28 09:59孫洪濤李秋劼鄭勤華
中國(guó)遠(yuǎn)程教育 2016年3期
關(guān)鍵詞:學(xué)習(xí)分析聚類(lèi)

孫洪濤++李秋劼++鄭勤華

【摘 要】

聚類(lèi)分析是學(xué)習(xí)分析和數(shù)據(jù)挖掘的常見(jiàn)方法,其核心在于通過(guò)分析對(duì)象特征屬性集合的相似程度來(lái)進(jìn)行分類(lèi)。聚類(lèi)分析在遠(yuǎn)程教育中有著廣闊的應(yīng)用空間,可以對(duì)在線學(xué)習(xí)行為模型和績(jī)效水平進(jìn)行有效劃分,使之成為后續(xù)研究的重要基礎(chǔ)。對(duì)在線學(xué)習(xí)領(lǐng)域的典型聚類(lèi)研究進(jìn)行分析,將聚類(lèi)研究的流程和要點(diǎn)進(jìn)行總結(jié),著重探討了聚類(lèi)變量選擇和有效性檢驗(yàn)等方面,并對(duì)252門(mén)MOOCs的在線交互狀況進(jìn)行了聚類(lèi)分析。研究發(fā)現(xiàn),我國(guó)大多數(shù)MOOCs交互水平較低,教師在交互中并不活躍,沒(méi)有進(jìn)行積極的答疑輔導(dǎo)和交互組織;隨著教師發(fā)布主題帖數(shù)量的增加,課程的交互水平會(huì)隨之提高;教師的積極參與能夠促進(jìn)課程交互水平,但在交互水平較高的課程中,教師投入的增加并沒(méi)有帶來(lái)課程交互水平的增長(zhǎng);教師需要對(duì)學(xué)生的交互進(jìn)行有效組織,才能促進(jìn)交互水平的進(jìn)一步提高。

【關(guān)鍵詞】 聚類(lèi);MOOC;學(xué)習(xí)分析;交互分析

【中圖分類(lèi)號(hào)】 G40-057 【文獻(xiàn)標(biāo)識(shí)碼】 A 【文章編號(hào)】 1009—458x(2016)03—0033—07

隨著MOOCs的蓬勃發(fā)展,在線學(xué)習(xí)數(shù)據(jù)不斷激增,學(xué)習(xí)分析和教育大數(shù)據(jù)也越來(lái)越受到關(guān)注。如何通過(guò)數(shù)據(jù)提升教育教學(xué)質(zhì)量,提高教學(xué)管理水平,促進(jìn)有效學(xué)習(xí)發(fā)生,吸引著越來(lái)越多的研究者和實(shí)踐者。對(duì)在線學(xué)習(xí)過(guò)程數(shù)據(jù)的分析并非新生事物。從分析方法上,學(xué)習(xí)分析將統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)和復(fù)雜網(wǎng)絡(luò)等方法進(jìn)行了整合應(yīng)用;從數(shù)據(jù)來(lái)源上,由于教育自身的特殊規(guī)律,在線教育大數(shù)據(jù)之“大”不同于醫(yī)療、交通乃至其他互聯(lián)網(wǎng)領(lǐng)域,分析方法也有著不同的情境,需要遠(yuǎn)程教育領(lǐng)域的研究作為指導(dǎo)。

聚類(lèi)分析是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的常見(jiàn)方法之一,屬于無(wú)監(jiān)督學(xué)習(xí)(unsupervised learning),其核心在于分析對(duì)象特征屬性集合。通過(guò)分析對(duì)象屬性集合的相似程度,將其劃分為不同的類(lèi)別,使類(lèi)別內(nèi)的數(shù)據(jù)相似度較大而類(lèi)別間的數(shù)據(jù)相似度較小。從本質(zhì)上,聚類(lèi)分析是一種具有相對(duì)性的分析方法。在應(yīng)用過(guò)程中,聚類(lèi)分析可以對(duì)沒(méi)有客觀評(píng)價(jià)標(biāo)準(zhǔn)的對(duì)象屬性進(jìn)行分析,從而獲得隱含的模式分類(lèi)。聚類(lèi)分析是研究在線學(xué)習(xí)的重要方法,在遠(yuǎn)程教育中有著廣闊的應(yīng)用空間,適用于在線教學(xué)中的多類(lèi)問(wèn)題解決。本文通過(guò)對(duì)在線學(xué)習(xí)領(lǐng)域的典型聚類(lèi)研究進(jìn)行分析,將此類(lèi)聚類(lèi)研究的流程和要點(diǎn)進(jìn)行了總結(jié),并通過(guò)聚類(lèi)對(duì)252門(mén)MOOCs的在線交互狀況進(jìn)行分析。

一、在線學(xué)習(xí)領(lǐng)域的聚類(lèi)研究

在線學(xué)習(xí)領(lǐng)域的聚類(lèi)多針對(duì)在線學(xué)習(xí)主體的屬性進(jìn)行相似性分析并確定其類(lèi)別。通過(guò)聚類(lèi)分析學(xué)習(xí)者在學(xué)習(xí)環(huán)境或?qū)W習(xí)任務(wù)中的行為模式,分析學(xué)習(xí)者的特征屬性(如人口學(xué)特征),或探索多類(lèi)屬性(如學(xué)習(xí)策略與學(xué)習(xí)績(jī)效等)之間的關(guān)系。

現(xiàn)有的聚類(lèi)研究中,較常見(jiàn)的方式是通過(guò)在線學(xué)習(xí)平臺(tái)日志中的數(shù)據(jù)直接進(jìn)行聚類(lèi)分析,并以聚類(lèi)結(jié)果為基礎(chǔ)分析學(xué)習(xí)者的行為模式或績(jī)效特征。例如,Amershi和 Conati(2006)在智能教學(xué)系統(tǒng)中對(duì)學(xué)習(xí)者的算法學(xué)習(xí)過(guò)程進(jìn)行了分析,采用K-means基于描述學(xué)習(xí)者創(chuàng)建、修改和測(cè)試行為的24種變量進(jìn)行聚類(lèi)分析。該研究發(fā)現(xiàn),通過(guò)聚類(lèi)分析可以將學(xué)習(xí)者劃分為不同類(lèi)別,不同類(lèi)別的學(xué)習(xí)者呈現(xiàn)出不同的學(xué)習(xí)行為和學(xué)習(xí)績(jī)效特征。

魏順平(2011)以Moodle教學(xué)平臺(tái)的forum、course、wiki、assignment、resource、user 行為為聚類(lèi)變量,將學(xué)生分成了三類(lèi),分析了學(xué)生活躍度集中于forum、course 和wiki,但resource 模塊的訪問(wèn)頻次卻很低,并分析了這一現(xiàn)象的可能成因。田娜和陳明選(2014)根據(jù)網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)的系統(tǒng)日志對(duì)學(xué)生進(jìn)行了K-means 聚類(lèi)分析,將學(xué)生分成了兩類(lèi):一類(lèi)是學(xué)前測(cè)試和學(xué)后測(cè)試成績(jī)優(yōu)秀的學(xué)生,另一類(lèi)是學(xué)習(xí)比較活躍和花費(fèi)時(shí)間較多的學(xué)生。研究者進(jìn)而根據(jù)聚類(lèi)結(jié)果對(duì)聚類(lèi)影響因素進(jìn)行了分析。

隨著MOOCs的發(fā)展,在線學(xué)習(xí)數(shù)據(jù)日益豐富。聚類(lèi)研究也隨之走向深入,研究者試圖通過(guò)聚類(lèi)來(lái)分析更為復(fù)雜的學(xué)習(xí)者特征。聚類(lèi)分析的輸入變量漸漸由直接提取日志變量,變?yōu)橥ㄟ^(guò)日志中的單一變量進(jìn)行整合和匯聚,試圖揭示深層次的學(xué)習(xí)規(guī)律。例如,斯坦福大學(xué)的Kizilcec等人(2013) 以學(xué)生在MOOCs平臺(tái)上觀看視頻和完成測(cè)驗(yàn)的行為數(shù)據(jù)為基礎(chǔ),設(shè)計(jì)了四類(lèi)取值來(lái)表示學(xué)習(xí)者的學(xué)習(xí)狀態(tài)。其中,0為“out”,表示完全沒(méi)有參與到課程中;1 為“auditing”,表示沒(méi)有完成測(cè)驗(yàn)但是觀看了視頻;2 為“behind”,表示在指定的時(shí)間點(diǎn)之后完成測(cè)驗(yàn);3為“on track”,表示學(xué)生按時(shí)完成測(cè)驗(yàn)。研究者進(jìn)而根據(jù)這些狀態(tài)變量對(duì)來(lái)自三門(mén)課程中的超過(guò)9萬(wàn)名學(xué)生進(jìn)行聚類(lèi),最終將學(xué)習(xí)者分為四類(lèi),包括“完成者”(Completing)“旁聽(tīng)者”(Auditing)“低參與度者”(Disengaging)和“篩選者”(Sampling)。英國(guó)開(kāi)放大學(xué)的Ferguson和Clow(2015)同樣采取了這種學(xué)習(xí)者狀態(tài)評(píng)定的研究方法,最終獲得了更為細(xì)致的七個(gè)學(xué)習(xí)者分類(lèi)?;谶@一趨勢(shì),我們對(duì)在線學(xué)習(xí)聚類(lèi)研究的流程和要點(diǎn)進(jìn)行了總結(jié),并通過(guò)這一流程對(duì)在線學(xué)習(xí)中的典型聚類(lèi)研究進(jìn)行了解析。

二、在線學(xué)習(xí)研究中聚類(lèi)的一般流程

1. 變量選擇

聚類(lèi)研究的核心思路是通過(guò)一組變量的取值計(jì)算變量對(duì)應(yīng)的對(duì)象相似程度。變量參數(shù)的選取對(duì)聚類(lèi)研究有著非常重要的影響?;诟髯缘难芯繂?wèn)題,研究者需要從可獲得的數(shù)據(jù)中選擇或設(shè)計(jì)能夠表征學(xué)習(xí)特征的變量作為輸入到聚類(lèi)算法中的原始參數(shù)。這些分析變量有些可以從學(xué)習(xí)平臺(tái)中直接獲得。例如, Beal等人 (2006)根據(jù)學(xué)習(xí)者自我報(bào)告的動(dòng)機(jī)數(shù)據(jù)對(duì)學(xué)習(xí)者進(jìn)行聚類(lèi)。Amershi和Conati (2006) 選用描述學(xué)習(xí)者與學(xué)習(xí)環(huán)境之間各種交互的頻率以及兩次交互之間的時(shí)間間隔作為聚類(lèi)變量,通過(guò)聚類(lèi)得出學(xué)習(xí)者與學(xué)習(xí)環(huán)境交互的不同模式。

基于此類(lèi)變量選擇的聚類(lèi)分析較為簡(jiǎn)便易行。但當(dāng)涉及學(xué)習(xí)行為數(shù)據(jù)分析時(shí),學(xué)習(xí)管理平臺(tái)記錄下來(lái)的數(shù)據(jù)往往較為瑣碎,難以體現(xiàn)足夠的教學(xué)意義。例如Moodle平臺(tái)(2.6以上版本)中僅view類(lèi)行為就超過(guò)30種,通過(guò)這些行為直接進(jìn)行聚類(lèi)可能會(huì)使結(jié)果難以解讀。因此,為了確保聚類(lèi)結(jié)果的實(shí)際意義,越來(lái)越多的研究者傾向于對(duì)學(xué)習(xí)平臺(tái)中的數(shù)據(jù)進(jìn)行處理,聚合成新的、具有更強(qiáng)解釋力的數(shù)據(jù)。Kizilcec等人(2013)通過(guò)對(duì)測(cè)驗(yàn)和視頻觀看情況分析獲得的參數(shù),能夠更好地對(duì)學(xué)習(xí)者的學(xué)習(xí)狀態(tài)進(jìn)行表征。該研究抓住觀看視頻和完成測(cè)驗(yàn)這兩個(gè)MOOCs學(xué)習(xí)中的常見(jiàn)行為,將學(xué)習(xí)者行為分成了四種情況,構(gòu)建了學(xué)習(xí)過(guò)程評(píng)價(jià)的指標(biāo)。基于這些指標(biāo)參數(shù)進(jìn)行了聚類(lèi),更好地對(duì)學(xué)習(xí)者類(lèi)別進(jìn)行了劃分。

通過(guò)上述分析可見(jiàn),聚類(lèi)分析的變量選擇可以簡(jiǎn)單選取描述研究對(duì)象的某一類(lèi)參數(shù)(如學(xué)習(xí)動(dòng)機(jī)、交互頻次等),也可以通過(guò)該對(duì)象的多個(gè)相關(guān)參數(shù)進(jìn)行聚合(如通過(guò)觀看視頻和完成測(cè)驗(yàn)進(jìn)行構(gòu)建)。

2. 聚類(lèi)過(guò)程

聚類(lèi)分析通過(guò)對(duì)象屬性的相似性進(jìn)行分類(lèi)。對(duì)象相似性比較有多種方法,對(duì)應(yīng)的聚類(lèi)算法可以分為四類(lèi):層次化聚類(lèi)算法、劃分式聚類(lèi)算法、基于密度和網(wǎng)格的聚類(lèi)算法和其他聚類(lèi)算法(孫吉貴等,2008)。目前,采用較多的聚類(lèi)算法包括K均值(K-means)聚類(lèi)、 Kohonen 聚類(lèi)和層次聚類(lèi)(Hierarchical cluster)等。由于相似度比較具有一定程度的相對(duì)性,聚類(lèi)結(jié)果(包括類(lèi)別個(gè)數(shù)和對(duì)象特征)具有不確定性。不同聚類(lèi)方法獲得的結(jié)果可能有所不同。聚類(lèi)分析往往需要經(jīng)過(guò)多輪迭代才能獲得有效的最終結(jié)果,在迭代過(guò)程中需要對(duì)不同聚類(lèi)結(jié)果進(jìn)行對(duì)比。

3. 類(lèi)別分析

對(duì)聚類(lèi)獲得的各類(lèi)別的分析和解釋主要基于各類(lèi)別原始參數(shù)的組內(nèi)變量值域分布和組間值域差異。對(duì)于聚類(lèi)結(jié)果的解釋和分析需要對(duì)各類(lèi)對(duì)象進(jìn)行概括的描述。通過(guò)取值高低來(lái)衡量活躍水平和學(xué)習(xí)績(jī)效等是常用的分析方法。例如,Amershi和 Conati(2006) 通過(guò)分析獲得的各類(lèi)別學(xué)習(xí)績(jī)效的平均值,將聚類(lèi)結(jié)果描述為高績(jī)效組和低績(jī)效組。同時(shí),根據(jù)對(duì)高績(jī)效組和低績(jī)效組的比較,研究者進(jìn)一步發(fā)現(xiàn)了低績(jī)效組較頻繁地對(duì)其算法設(shè)計(jì)進(jìn)行調(diào)整,而每次調(diào)整之間的間隔較短。

但在更多的研究中,單純的變量數(shù)值高低難以對(duì)聚類(lèi)結(jié)果進(jìn)行有效解釋?zhuān)枰M(jìn)一步結(jié)合教學(xué)過(guò)程進(jìn)行更加深入的解讀。Kizilcec等人(2013)根據(jù)聚合的狀態(tài)指標(biāo)將MOOCs中的學(xué)習(xí)者劃分為四類(lèi): ① “完成者”,此類(lèi)學(xué)習(xí)者完成了課程中大部分測(cè)驗(yàn); ② “旁聽(tīng)者”,此類(lèi)學(xué)習(xí)者持續(xù)觀看課程視頻,但是很少完成測(cè)驗(yàn);③ “低參與度者”,此類(lèi)學(xué)習(xí)者在課程初期完成測(cè)驗(yàn),但是之后沒(méi)有持續(xù)下去;④ “篩選者”,此類(lèi)學(xué)習(xí)者在課程進(jìn)行過(guò)程中僅選擇性地觀看視頻并完成測(cè)驗(yàn)。此類(lèi)分析對(duì)學(xué)習(xí)過(guò)程進(jìn)行了更為深入的解讀。值得注意的是,聚類(lèi)結(jié)果的分析往往和聚類(lèi)過(guò)程迭代進(jìn)行。由于聚類(lèi)方法的相對(duì)性,聚類(lèi)結(jié)果并不一定可以獲得有效解釋。研究者往往需要對(duì)聚類(lèi)的類(lèi)別個(gè)數(shù)和聚類(lèi)變量等進(jìn)行不斷調(diào)整,才能最終獲得具有教學(xué)意義的有效解釋。

4. 有效性檢驗(yàn)

聚類(lèi)分析有效性的分析主要包括兩個(gè)方面,聚類(lèi)變量自身的統(tǒng)計(jì)有效性和其他變量的意義一致性。統(tǒng)計(jì)意義上的有效性主要通過(guò)各類(lèi)統(tǒng)計(jì)指標(biāo)判斷。研究者可以通過(guò)調(diào)整類(lèi)別數(shù)對(duì)比統(tǒng)計(jì)指標(biāo)來(lái)獲取較好的聚類(lèi)方案。例如,F(xiàn)erguson和Clow(2015)采用了側(cè)影(silhouette)指數(shù)來(lái)衡量某個(gè)聚類(lèi)結(jié)果中同類(lèi)別中對(duì)象之間的相似度以及不同類(lèi)別之間對(duì)象的差異度。平均側(cè)影指數(shù)最大值為1,其值越接近1,聚類(lèi)效果越好。在這兩個(gè)MOOCs學(xué)習(xí)者分類(lèi)研究中,平均silhouette 指數(shù)分別約為0.8和0.5。此外,聚類(lèi)結(jié)果各組內(nèi)方差和(Within group sum of square)也是常用的指數(shù)之一,衡量各組內(nèi)成員之間的距離。組內(nèi)方差和越小,聚類(lèi)效果越好。聚類(lèi)輪廓系數(shù)是另一種常用聚類(lèi)質(zhì)量評(píng)價(jià)指標(biāo)(朱連江等,2010),對(duì)聚類(lèi)結(jié)果(聚類(lèi)簇)的凝聚度和分離度進(jìn)行整合,較為有效地對(duì)聚類(lèi)有效性進(jìn)行了評(píng)價(jià)。

此外,聚類(lèi)結(jié)果的意義一致性需要根據(jù)聚類(lèi)結(jié)果對(duì)聚類(lèi)變量之外的變量進(jìn)行分析,以此來(lái)判斷所獲得的類(lèi)別中其他變量的取值情況是否符合類(lèi)別分析。例如,通過(guò)分析MOOCs中“旁聽(tīng)者”的學(xué)習(xí)成果,發(fā)現(xiàn)這類(lèi)學(xué)習(xí)者中沒(méi)有人最終獲得課程證書(shū),與這類(lèi)學(xué)習(xí)者的行為特征相符。Beal等人(2006) 的研究中,對(duì)學(xué)習(xí)者自我報(bào)告的動(dòng)機(jī)數(shù)據(jù)的聚類(lèi)結(jié)果和教師對(duì)學(xué)習(xí)者動(dòng)機(jī)和績(jī)效的評(píng)價(jià)相一致。

5. 擴(kuò)展研究

聚類(lèi)分析的重要性在于在沒(méi)有目標(biāo)變量參照的情況下對(duì)研究對(duì)象進(jìn)行分類(lèi),并可以成為后續(xù)研究的重要基礎(chǔ)。基于聚類(lèi)結(jié)果,研究者既可以通過(guò)調(diào)查研究和理論研究,深入挖掘各類(lèi)別對(duì)象的特性,也可以通過(guò)有監(jiān)督學(xué)習(xí)(supervised learning)探索影響因素和關(guān)聯(lián)關(guān)系,還可以作為教學(xué)干預(yù)研究的起點(diǎn)。

Kizilcec等人(2013)在聚類(lèi)分析結(jié)果的基礎(chǔ)上,對(duì)四類(lèi)MOOCs學(xué)習(xí)者的性別、年齡、工作狀態(tài)、學(xué)習(xí)目的、學(xué)習(xí)滿意度以及論壇參與情況等展開(kāi)了調(diào)查和對(duì)比,豐富了對(duì)各個(gè)類(lèi)別學(xué)習(xí)者的理解。通過(guò)對(duì)各類(lèi)別學(xué)習(xí)者學(xué)習(xí)滿意度的分析,研究者發(fā)現(xiàn)“旁聽(tīng)者”自我報(bào)告了與“完成者”類(lèi)似的較高的學(xué)習(xí)滿意度,進(jìn)而認(rèn)為“旁聽(tīng)者”與“完成者”之間學(xué)習(xí)行為的差異可能來(lái)源于兩類(lèi)學(xué)習(xí)者不同的學(xué)習(xí)偏好,而未來(lái)的課程設(shè)計(jì)需要進(jìn)一步發(fā)現(xiàn)“旁聽(tīng)者”,并為他們提供針對(duì)性的服務(wù)。

Berland等人(2013)對(duì)新手程序員學(xué)習(xí)過(guò)程中的編程結(jié)果進(jìn)行描述和聚類(lèi),發(fā)現(xiàn)了六種不同的學(xué)習(xí)狀態(tài)。在學(xué)習(xí)理論的支持下,該研究者發(fā)現(xiàn)了新手程序員學(xué)習(xí)的三個(gè)主要階段,包括探索階段、基于探索的修改階段以及改良階段,并根據(jù)數(shù)據(jù)對(duì)基于探索的修改階段進(jìn)行了重新定義,加深了對(duì)程序員學(xué)習(xí)過(guò)程的認(rèn)識(shí)。

Amershi和Conati(2006)在其關(guān)于探索性學(xué)習(xí)環(huán)境中聚類(lèi)分析的研究中通過(guò)收集到的完整數(shù)據(jù)進(jìn)行聚類(lèi)之后,將聚類(lèi)結(jié)果用于學(xué)習(xí)者實(shí)時(shí)數(shù)據(jù)分析中,通過(guò)聚類(lèi)方法對(duì)學(xué)習(xí)者的學(xué)習(xí)進(jìn)行實(shí)時(shí)監(jiān)控和測(cè)評(píng),并基于聚類(lèi)結(jié)果進(jìn)行了教學(xué)干預(yù)。該研究還對(duì)聚類(lèi)方法進(jìn)行了優(yōu)化,分析了數(shù)據(jù)點(diǎn)采集的數(shù)量和分類(lèi)結(jié)果準(zhǔn)確性之間的關(guān)系,發(fā)現(xiàn)基于10%的數(shù)據(jù)也能夠?qū)W(xué)習(xí)者進(jìn)行較為準(zhǔn)確的分類(lèi)。

三、MOOCs交互聚類(lèi)案例研究

1. 研究目標(biāo)與數(shù)據(jù)來(lái)源

案例研究旨在通過(guò)對(duì)我國(guó)MOOCs交互數(shù)據(jù)進(jìn)行聚類(lèi)分析,發(fā)現(xiàn)其交互現(xiàn)狀,并對(duì)其交互特征進(jìn)行探索。本研究的數(shù)據(jù)來(lái)自我國(guó)現(xiàn)有14個(gè)主要MOOCs 平臺(tái)中的課程。在這14個(gè)平臺(tái)中所有可見(jiàn)的1,388 門(mén)課程中,有622 門(mén)課程(占44.8%)在研究者訪問(wèn)階段是可以瀏覽的,其他課程已經(jīng)結(jié)束或還未正式開(kāi)課,無(wú)法獲得完整的課程信息(鄭勤華等,2015)。由于MOOCs中的交互主要發(fā)生在課程論壇中,發(fā)帖和回帖是交互的主要形式(Barak et al., 2016),因此,本研究分析的是論壇交互。分析發(fā)現(xiàn),622門(mén)課程中產(chǎn)生了交互的僅有295門(mén),占47.4%,327門(mén)課程(占52.6%)中沒(méi)有論壇交互。針對(duì)主題帖數(shù)量進(jìn)行深入分析可以發(fā)現(xiàn),交互狀況極度不平衡(孫洪濤等,2016),在全部課程中僅有252門(mén)課程能夠采集到交互數(shù)據(jù)。本研究針對(duì)這些課程進(jìn)行了分析。

2. 分析方法

本研究通過(guò)K-means聚類(lèi)分析對(duì)存在有效交互的課程進(jìn)行了分析。K-means 聚類(lèi)算法是聚類(lèi)分析中使用最為廣泛的算法之一。該算法選取 k個(gè)初始聚類(lèi)中心,按最小距離原則將各樣本分配到 k 類(lèi)中的某一類(lèi),之后不斷地計(jì)算類(lèi)別中心,并調(diào)整各樣本的類(lèi)別,最終使各樣本到其所屬類(lèi)別中心的距離平方之和最?。ㄖ苁辣?,2010)。本研究采用的分析工具是SPSS Modeler 14.1。

在聚類(lèi)變量選取方面,為了更好地表征MOOCs交互特征,我們采取了數(shù)量變量和狀態(tài)變量相結(jié)合的方式。在論壇交互中,帖子數(shù)量、回帖的時(shí)間特性和教師的交互投入情況是表征論壇交互狀況的重要方面。在本研究中,我們采用了主題帖數(shù)、教師發(fā)布的主題帖數(shù)、教師答疑輔導(dǎo)帖數(shù)、回帖熱度和回帖時(shí)間間隔五個(gè)變量對(duì)MOOCs中的交互總量、交互時(shí)間和教師投入進(jìn)行了分析。其中,主題帖、教師主題帖和答疑輔導(dǎo)帖等指標(biāo)直接采用數(shù)量;回帖熱度采用等級(jí)表示,0為未回帖,1為每主題帖平均3個(gè)以下回帖,2為平均4-8個(gè)回帖,3為平均8個(gè)以上回帖;回帖時(shí)間間隔也采用了等級(jí)表示,其中1為12小時(shí)以內(nèi)回帖,2為24小時(shí)之內(nèi)回帖,3為24-48小時(shí)回帖,4為回帖間隔大于48小時(shí),5為未回復(fù)。由于各類(lèi)數(shù)據(jù)的取值區(qū)間不同,在聚類(lèi)分析中對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,避免了數(shù)值差異過(guò)大引起的結(jié)果偏差。主題帖數(shù)等數(shù)據(jù)偏度較高,且存在極值。但這些數(shù)據(jù)可能體現(xiàn)特殊的交互模式,因此沒(méi)有剔除極值。

3. 聚類(lèi)分析

(1)聚類(lèi)總體情況

通過(guò)聚類(lèi)將全部課程分為5類(lèi)(如圖1所示)。其中,最大類(lèi)別包含139門(mén)課程(占55.16%),最小聚類(lèi)為4門(mén)課,僅占1.59%(如表1所示)。

如圖3所示,在聚類(lèi)影響因素方面,答疑時(shí)間間隔和回帖熱度是聚類(lèi)結(jié)果的最重要影響因素。這兩個(gè)變量對(duì)于類(lèi)別劃分起到了最為重要的作用。

(3)各類(lèi)別對(duì)比分析

通過(guò)分析可以看出,聚類(lèi)3所占比重最大,占全部課程的55.16%(139門(mén)),課程的答疑時(shí)間間隔非常長(zhǎng)(均值4.67),平均回帖熱度僅為1.03,教師在線答疑帖子均值為16.71,課程主題帖平均為128.29個(gè),教師評(píng)價(jià)發(fā)主題帖2.38個(gè)??梢?jiàn),這類(lèi)課程的交互水平較低,教師很少發(fā)主題帖,也很少答疑。

聚類(lèi)5占全部課程的29.37%(74門(mén)),課程的答疑時(shí)間間隔較短(均值為2.19),平均回帖熱度也較低,僅為1.03,教師在線答疑帖子較多,平均為91.74,課程主題帖平均為228.93個(gè),教師發(fā)主題帖平均為8.72個(gè)。這類(lèi)課程中的交互水平稍高,教師發(fā)主題帖和答疑較為積極。

聚類(lèi)4占全部課程的10.71%(27門(mén)),課程的答疑時(shí)間間隔較長(zhǎng)(均值3.07),平均回帖熱度在各個(gè)類(lèi)別中最高(2.48),教師在線答疑帖子均值為85.41,課程主題帖平均為230.7個(gè),教師評(píng)價(jià)發(fā)主題帖21.48個(gè)。此類(lèi)課程交互水平較高,教師發(fā)布了更多主題帖,吸引了更多學(xué)生參與,形成了很高的回帖熱度。

聚類(lèi)1課程數(shù)量很少,僅占全部課程的3.17%(8門(mén)),課程的答疑時(shí)間間隔較短(均值2.5),平均回帖熱度為2.25,教師在線答疑帖子均值在各類(lèi)中最高(266.13個(gè)),課程主題帖非常多,達(dá)到了 2,071.5個(gè),教師評(píng)價(jià)發(fā)主題帖15.13個(gè)。教師發(fā)布的主題帖不多,但花費(fèi)了大量精力進(jìn)行答疑輔導(dǎo)。雖然回帖熱度不是各類(lèi)別中最高的,但由于主題帖數(shù)量極多,總體帖子的數(shù)量非常多,課程交互水平很高。

聚類(lèi)2的課程數(shù)量更少,僅占全部課程的1.59%(4門(mén))。這類(lèi)課程的答疑時(shí)間間隔在各類(lèi)別中最短(均值1.25),平均回帖熱度為2.00,教師在線答疑帖子均值達(dá)到了912個(gè),課程主題帖平均為1,110.5個(gè),教師評(píng)價(jià)發(fā)主題帖88.75個(gè)。這類(lèi)課程總體也體現(xiàn)出了很高的交互水平,但和前一個(gè)類(lèi)別又有著較大差異。此類(lèi)課程的教師發(fā)帖數(shù)量達(dá)到了極高的水平,無(wú)論是主題帖還是在線答疑帖子,都遠(yuǎn)遠(yuǎn)高于其他類(lèi)別。課程答疑間隔也是各類(lèi)課程中最短的。教師的高投入促進(jìn)了課程整體交互水平的提高。

(4)各類(lèi)別學(xué)習(xí)支持方式分析

學(xué)習(xí)支持是遠(yuǎn)程教學(xué)的重要組成部分。學(xué)習(xí)支持狀況對(duì)于在線教學(xué)交互有著重要的影響。通過(guò)聚類(lèi)對(duì)各個(gè)課程的交互進(jìn)行分析之后,筆者進(jìn)而對(duì)各類(lèi)課程的學(xué)習(xí)支持方式進(jìn)行了分析。通過(guò)圖4可以看出,交互效果最好的聚類(lèi)2采用了豐富的學(xué)習(xí)支持方式,在各項(xiàng)學(xué)習(xí)支持中采用的比例幾乎都是最高的(僅實(shí)時(shí)討論采用率位居第二),交互效果次之的聚類(lèi)1的學(xué)習(xí)支持方式也非常豐富,交互水平最低的聚類(lèi)3中各項(xiàng)學(xué)習(xí)支持方式采用的比例都非常低。

4. 結(jié)果討論

通過(guò)上述分析可以發(fā)現(xiàn),大多數(shù)MOOCs的交互水平較低,教師在交互中并不活躍,沒(méi)有進(jìn)行積極的答疑輔導(dǎo)并組織論壇中的交互。教師的積極參與能夠促進(jìn)課程交互水平。隨著教師發(fā)布主題帖數(shù)量的增加,課程的交互水平會(huì)越來(lái)越高。這一現(xiàn)象在聚類(lèi)3、聚類(lèi)4和聚類(lèi)5的對(duì)比中非常明顯。但在交互水平較高、論壇非常活躍、帖子數(shù)非常多的課程中,教師的投入增加并沒(méi)有帶來(lái)課程交互水平的線性增長(zhǎng)。這一現(xiàn)象與García-Saiz 等人(2013)和Hernández-García等人(2015)的發(fā)現(xiàn)相吻合,即在線論壇交互非?;钴S的教師,反而在一定程度上阻礙了學(xué)生之間的交流,降低了學(xué)生的發(fā)帖率。

對(duì)比聚類(lèi)1和聚類(lèi)2可以看出,在交互水平高的課程中,學(xué)生之間的交互發(fā)揮了更加重要的作用。在主題帖最多的聚類(lèi)1中,教師只發(fā)了大約15個(gè)帖子,不足總主題帖數(shù)的1%,教師也只回復(fù)了全部帖子的12.84%。聚類(lèi)2中,教師發(fā)主題帖的數(shù)量是聚類(lèi)1的5.87倍,答疑帖數(shù)是聚類(lèi)1的3.43倍,但總主貼數(shù)卻僅有聚類(lèi)1的53.60%,總回帖熱度也比聚類(lèi)1低。這個(gè)對(duì)比表明,在聚類(lèi)1中存在大量的生生交互,聚類(lèi)1中的教師通過(guò)自己較高的投入帶動(dòng)了學(xué)生的交流,形成了較高的交互水平。

誠(chéng)然,我國(guó)MOOCs中大多數(shù)課程的交互水平仍然偏低。在這種情況下,教師的積極發(fā)帖值得鼓勵(lì)。聚類(lèi)2中教師的高投入難能可貴。而在交互水平較高的課程中,聚類(lèi)1的課程更加重視組織和調(diào)控,從而取得了比聚類(lèi)2更好的效果。

對(duì)于更多課程而言,交互水平的提高需要教師增加投入,更好地通過(guò)教學(xué)設(shè)計(jì)組織教學(xué)交互。從各類(lèi)課程學(xué)習(xí)支持方式的差異可以看出,采用更加豐富的學(xué)習(xí)支持方式,對(duì)學(xué)生的學(xué)習(xí)過(guò)程進(jìn)行全面支持,有助于交互水平的提高。

四、聚類(lèi)研究展望

聚類(lèi)研究對(duì)于學(xué)習(xí)分析有著重要意義。通過(guò)聚類(lèi)可以將較為復(fù)雜的學(xué)習(xí)行為和績(jī)效水平等進(jìn)行有效劃分,便于開(kāi)展更為深入的學(xué)習(xí)規(guī)律探索。目前,在線學(xué)習(xí)研究中聚類(lèi)分析尚處于探索階段,多用于發(fā)現(xiàn)行為模式或者描述學(xué)習(xí)者的多樣性,對(duì)聚類(lèi)結(jié)果的深入探索和基于聚類(lèi)的教學(xué)干預(yù)還較為少見(jiàn)。

首先,多數(shù)研究者并沒(méi)有討論研究情境和聚類(lèi)結(jié)果之間的關(guān)系,對(duì)聚類(lèi)結(jié)果的解釋也少有與理論的結(jié)合,因而無(wú)法得知聚類(lèi)結(jié)果能在多大范圍內(nèi)推廣,與已有的遠(yuǎn)程學(xué)習(xí)研究成果有何關(guān)系。例如Ferguson和Clow(2015) 采用了與Kizilcec等人(2013) 研究中類(lèi)似的方法,對(duì)基于社會(huì)建構(gòu)理論的多門(mén)課程進(jìn)行分析,發(fā)現(xiàn)了不同于先前研究結(jié)果的多個(gè)新的學(xué)習(xí)者類(lèi)別。這說(shuō)明不同學(xué)習(xí)情境中的類(lèi)似行為的聚類(lèi)結(jié)果可能不同,而這種不同也許與學(xué)習(xí)情境背后的教學(xué)和學(xué)習(xí)理論有關(guān)。其次,雖然許多研究者常比較聚類(lèi)得到的行為模式或者學(xué)習(xí)者類(lèi)別之間學(xué)習(xí)績(jī)效的差異,但少有研究者定量地使用聚類(lèi)的結(jié)果來(lái)預(yù)測(cè)學(xué)習(xí)績(jī)效或者分析學(xué)習(xí)者的需求。最后,對(duì)于如何采用聚類(lèi)分析的結(jié)果支持教育干預(yù)的設(shè)計(jì)以及教育決策的制定還有待進(jìn)一步探索。

因此,基于聚類(lèi)分析的在線學(xué)習(xí)研究應(yīng)更多地將模式發(fā)現(xiàn)與已有理論結(jié)合起來(lái),探索聚類(lèi)結(jié)果的深層意義。正如Wise和Shaffer(2015)所指出的,基于大數(shù)據(jù)的學(xué)習(xí)分析研究更應(yīng)該注重與理論的結(jié)合。遠(yuǎn)程教育理論研究成果能夠幫助研究者選擇出更有教育意義的聚類(lèi)變量,辨別出更有價(jià)值的聚類(lèi)結(jié)果,并對(duì)聚類(lèi)結(jié)果做出更合理的解釋。在聚類(lèi)研究結(jié)果的基礎(chǔ)上開(kāi)展應(yīng)用研究,對(duì)在線學(xué)習(xí)者的學(xué)習(xí)狀態(tài)進(jìn)行更為及時(shí)的分析,提供相應(yīng)的教學(xué)干預(yù)和學(xué)習(xí)支持。

(編者注:北京師范大學(xué)遠(yuǎn)程教育研究中心就“學(xué)習(xí)分析的核心技術(shù)與實(shí)證研究”主題為本刊撰寫(xiě)了系列論文,旨在對(duì)重要學(xué)習(xí)分析技術(shù)和經(jīng)典研究進(jìn)行解析,闡明不同分析技術(shù)在遠(yuǎn)程教育領(lǐng)域應(yīng)用的關(guān)鍵環(huán)節(jié)和要點(diǎn),并通過(guò)案例研究呈現(xiàn)具體的學(xué)習(xí)分析技術(shù)應(yīng)用過(guò)程。本篇為該系列第一篇。)

[參考文獻(xiàn)]

[1] Amershi, S., & Conati, C. (2006). Automatic recognition of learner groups in exploratory learning environments. In M. Ikeda, K. D. Ashley & T. Chan (Ed.), Intelligent Tutoring Systems (pp. 463-472). Springer Berlin Heidelberg. doi: 10.1007/11774303_46.

[2] Barak, M., Watted, A., & Haick, H. (2016). Motivation to learn in massive open online courses: Examining aspects of language and social engagement. Computers & Education, 94, 49-60. doi:10.1016/j.compedu.2015.11.010.

[3] Beal, C. R., Qu, L., & Lee, H. (2006). Classifying learner engagement through integration of multiple data sources. In Proceedings of the National Conference on Artificial Intelligence (Vol. 21, No. 1, p. 151). London: AAAI Press.

[4] Berland, M., Martin, T., Benton, T., Petrick Smith, C., & Davis, D. (2013). Using learning analytics to understand the learning pathways of novice programmers. Journal of the Learning Sciences, 22(4), 564-599. doi:10.1080/10508406.2013.836655.

[5] Bowers, A. J. (2010). Analyzing the longitudinal K-12 grading histories of entire cohorts of students: Grades, data driven decision making, dropping out and hierarchical cluster analysis. Practical Assessment, Research & Evaluation, 15(7), 1-18.

[6] Ferguson, R., & Clow, D. (2015). Examining engagement: analysing learner subpopulations in massive open online courses (MOOCs). In Proceedings of the Fifth International Conference on Learning Analytics And Knowledge (pp. 51-58). ACM.

[7] García-Saiz, D., Palazuelos, C., & Zorrilla, M. (2013). Data mining and social network analysis in the educational field: An application for non-expert users. In A.Pe?a-Ayala (Ed.), Educational data mining: Applications and trends (pp. 411-439). Berlin, Heidelberg: Springer, Berlin/Heidelberg.

[8] Hernández-García, ?., González-González, I., Jiménez-Zarco, A. I., & Chaparro-Peláez, J. (2015). Applying social learning analytics to message boards in online distance learning: A case study. Computers in Human Behavior, 47, 68-80.

[9] Kizilcec, R. F., Piech, C., & Schneider, E. (2013). Deconstructing disengagement: analyzing learner subpopulations in massive open online courses. In Proceedings of the third international conference on learning analytics and knowledge (pp. 170-179). ACM.

[10] Wise, A. F., & Shaffer, D. W. (2015). Why Theory Matters More than Ever in the Age of Big Data. Journal of Learning Analytics, 2(2), 5-13.

[11] 孫洪濤,鄭勤華,陳麗. 中國(guó)MOOCs教學(xué)交互狀況調(diào)查研究[J]. 開(kāi)放教育研究,2016,(1):72-79.

[12] 孫吉貴,劉杰,趙連宇. 聚類(lèi)算法研究[J]. 軟件學(xué)報(bào),2008,(1):48-61.

[13] 田娜,陳明選. 網(wǎng)絡(luò)教學(xué)平臺(tái)學(xué)生學(xué)習(xí)行為聚類(lèi)分析[J]. 中國(guó)遠(yuǎn)程教育,2014,(11):38-41.

[14] 魏順平. Moodle平臺(tái)數(shù)據(jù)挖掘研究——以一門(mén)在線培訓(xùn)課程學(xué)習(xí)過(guò)程分析為例[J]. 中國(guó)在線學(xué)習(xí),2011,(1):24-30.

[15] 周世兵,徐振源,唐旭清. K-means算法最佳聚類(lèi)數(shù)確定方法[J]. 計(jì)算機(jī)應(yīng)用,2010,(8):1995-1998.

[16] 朱連江,馬炳先,趙學(xué)泉. 基于輪廓系數(shù)的聚類(lèi)有效性分析[J]. 計(jì)算機(jī)應(yīng)用,2010,(S2):139-141,198.

收稿日期:2016-01-20

定稿日期:2016-02-29

作者簡(jiǎn)介:孫洪濤, 博士,高級(jí)工程師,中央民族大學(xué)現(xiàn)代教育技術(shù)部(100081)。

李秋劼,在讀博士,加州大學(xué)爾灣分校教育學(xué)院(92697)。

鄭勤華,博士,副教授,北京師范大學(xué)教育學(xué)部(100875)。

責(zé)任編輯 日 新

猜你喜歡
學(xué)習(xí)分析聚類(lèi)
基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
基于高斯混合聚類(lèi)的陣列干涉SAR三維成像
大數(shù)據(jù)思維下教學(xué)過(guò)程數(shù)據(jù)分析及應(yīng)用研究
在線學(xué)習(xí)過(guò)程管理大數(shù)據(jù)的建設(shè)與應(yīng)用
簡(jiǎn)析小學(xué)勞動(dòng)與技術(shù)教育的有效合作學(xué)習(xí)
淺析大數(shù)據(jù)在教育中的應(yīng)用
一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
自適應(yīng)確定K-means算法的聚類(lèi)數(shù):以遙感圖像聚類(lèi)為例
南开区| 布尔津县| 依兰县| 菏泽市| 巢湖市| 和田县| 浮梁县| 苏尼特左旗| 固阳县| 大方县| 五河县| 双桥区| 寿阳县| 湖州市| 福清市| 德州市| 永德县| 柞水县| 昌都县| 阿图什市| 闻喜县| 营口市| 莱阳市| 桦川县| 疏附县| 车险| 怀化市| 灵宝市| 巴林左旗| 西安市| 大丰市| 锦屏县| 依兰县| 宜州市| 定州市| 老河口市| 隆德县| 绥江县| 秭归县| 芦山县| 潼南县|