国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

MOOC學(xué)習(xí)者學(xué)習(xí)行為聚類分析*

2015-06-15 18:33:58強(qiáng)
關(guān)鍵詞:次數(shù)聚類重要性

張 強(qiáng)

(安徽商貿(mào)職業(yè)技術(shù)學(xué)院,安徽 蕪湖 241002)

MOOC學(xué)習(xí)者學(xué)習(xí)行為聚類分析*

張 強(qiáng)

(安徽商貿(mào)職業(yè)技術(shù)學(xué)院,安徽 蕪湖 241002)

隨著大規(guī)模在線開放課程(MOOC)作為一種新的學(xué)習(xí)模式的興起,基于MOOC大數(shù)據(jù)分析正成為新的研究方向.通過對學(xué)習(xí)行為特征進(jìn)行重要性計(jì)算,提取出對學(xué)習(xí)效果具有重要影響的若干行為特征,進(jìn)一步根據(jù)學(xué)習(xí)者的相似性進(jìn)行聚類分析,并對學(xué)習(xí)行為與學(xué)習(xí)效果之間的關(guān)系進(jìn)行相關(guān)性分析,力圖從中發(fā)現(xiàn)一些有意義的學(xué)習(xí)行為特點(diǎn)和規(guī)律.

MOOC;聚類;學(xué)習(xí)行為;特征選擇

1 引言

隨著教育技術(shù)手段在社會化媒介和移動設(shè)備中應(yīng)用越來越廣泛,通過新技術(shù)來提高教學(xué)過程和學(xué)習(xí)效率是目前研究的趨勢,而MOOC(慕課)是其中一個(gè)新興的形式[1].MOOC是遠(yuǎn)程教育、開放精品課程和網(wǎng)絡(luò)教學(xué)平臺的延續(xù)與發(fā)展,其目的是通過在網(wǎng)上提供免費(fèi)課程,為更多的學(xué)生提供更優(yōu)質(zhì)的學(xué)習(xí)資源[2].目前已有海量的學(xué)習(xí)者參與了MOOC模式中的各種學(xué)習(xí),MOOC已成為學(xué)習(xí)者的第二課堂[3].在傳統(tǒng)教學(xué)中,同一教學(xué)群體的學(xué)習(xí)動機(jī)、知識水平大致相當(dāng),而且人數(shù)較少,所以對學(xué)生的行為分析也相對簡單,而在MOOC教學(xué)中,這些現(xiàn)象已發(fā)生很大變化.在海量的MOOC學(xué)習(xí)者中,采用傳統(tǒng)的行為分析方法的效果已大打折扣[4-5].文中,對學(xué)習(xí)者學(xué)習(xí)行為進(jìn)行記錄,首先對學(xué)習(xí)行為特征進(jìn)行重要性判定,然后采用聚類分析技術(shù)對學(xué)生進(jìn)行聚類分析,并對學(xué)習(xí)行為與學(xué)習(xí)效果進(jìn)行分析,以確定MOOC學(xué)習(xí)環(huán)境對學(xué)習(xí)者的學(xué)習(xí)輔助效果.

2 學(xué)習(xí)行為分析

2.1 學(xué)習(xí)行為特征選擇

根據(jù)信息系統(tǒng)中知識與信息量間的關(guān)系,將學(xué)習(xí)者產(chǎn)生的MOOC數(shù)據(jù)進(jìn)行形式化表示,通過知識的信息量對各行為特征的重要性進(jìn)行評判,并從中選取若干屬性值較高的行為特征來代替原始的特征.

定義1:采用四元組S來表示信息系統(tǒng),S=(U,Q,V,F),其中U表示為學(xué)習(xí)者非空有限集;Q表示行為特征屬性的非空有限集;V為Q的屬性值范圍;F為一個(gè)U×Q→V的信息函數(shù),

定義2:知識P可表示為行為特征屬性子集,P?Q,對于每個(gè)P存在一不可區(qū)分的二元關(guān)系:

REL(P):REL(P)=
{(x,y)U×U}|qQF(x,q)=F(y,q)}.

定義3:REL(P)是學(xué)習(xí)者集U上的等價(jià)關(guān)系,由U中等價(jià)于x的所有元素構(gòu)成的子集u為U中元素x依等價(jià)關(guān)系REL(P)的等價(jià)類.

定理1:在信息系統(tǒng)S中,P?Q,若U/REL(P)∈U/REL(Q),則I(P)

證明:U/REL(P)={X1,X2,……,Xn}.

令U/REL(Q)={X1,X2,……,Xm}.

由于U/REL(P)∈U/REL(Q),知n1,可得:|xi|=∑|Yi|.

進(jìn)一步可得:

定義5:學(xué)習(xí)行為特征屬性q相對于Q的重要性定義為:IMPQ(q)=I(q),即屬性q的信息量,若IMPQ(q1)>IMPQ(q2),則認(rèn)為屬性q1相對于學(xué)習(xí)行為特征屬性集合Q而言比屬性q2重要.

根據(jù)上述定義和分析,可將與MOOC學(xué)習(xí)過程相關(guān)的學(xué)習(xí)特征進(jìn)行抽取,其方法是:設(shè)定屬性重要性閾值minIMP,若IPMQ(qi)

(1)

其中m為不同單位時(shí)間內(nèi)訪問記錄的個(gè)數(shù).

2.2 聚類分析

聚類分析是根據(jù)行為特征數(shù)據(jù)向量將數(shù)據(jù)集劃分成為具有相似性質(zhì)的類,文中將MOOC學(xué)習(xí)者進(jìn)行分組,進(jìn)而分析學(xué)習(xí)者的學(xué)習(xí)情況及學(xué)習(xí)行為特征之間的關(guān)聯(lián)性[6].文中采用最近鄰聚類算法進(jìn)行聚類,樣本xi和xj的相似度計(jì)算公式為:

(2)

具體聚類過程如下:

(1)選取未聚類的任意一個(gè)樣本作為x1第一個(gè)聚類C1的聚類中心,C1=x1,設(shè)定相似度閾值為d1.

(2)取下一個(gè)樣本x2,計(jì)算x2到x1的距離d21:若d21≤d1,則x2∈C1聚類;否則將x2作為新類C2的聚類中心,C2=x2,設(shè)定相似度閾值為d2.

(3)設(shè)存在K個(gè)聚類C1至Ck,繼續(xù)取樣本xi,分別計(jì)算xi與K個(gè)聚類中心的相似度,若xi與聚類Cj的聚類中心的相似度dij

(4)重復(fù)執(zhí)行步驟3,直至所有的樣本分類完畢,獲得初始聚類集C.

3 實(shí)例演示

3.1 行為特征重要性計(jì)算

實(shí)驗(yàn)所需數(shù)據(jù)是從我?!洞髮W(xué)計(jì)算機(jī)基礎(chǔ)》在線開放視頻課程的網(wǎng)絡(luò)教學(xué)平臺上收集得到,包含3234條記錄.首先將該數(shù)據(jù)形式化為行為矩陣(U,Q,Vq),得到如表1所示的學(xué)習(xí)者學(xué)習(xí)行為特征表.為演示方便,表中我們僅選取了5名學(xué)習(xí)者和5個(gè)不同的學(xué)習(xí)行為特征:視頻觀看次數(shù)(q1)、作業(yè)完成次數(shù)(q2)、在線交流次數(shù)(q3)、參與課程的時(shí)間(q4)和學(xué)習(xí)者所屬專業(yè)(q5).

表1 MOOC數(shù)據(jù)形式化表示

根據(jù)上述定義可求得5個(gè)行為特征屬性的重要性,其值分別為:IMPQ(q1)=0.56,IMPQ(q2)=0.64,IMPQ(q3)=0.32,IMPQ(q4)=0.64,IMPQ(q5)=0.48.同時(shí)根據(jù)公式(1)求得平均屬性值為:AIMP=minIMP=0.53.由于特征屬性q3和q5的屬性值均低于平均屬性值minIMP,所以認(rèn)為是對聚類分析影響不大的屬性,可以省略掉.

從上述結(jié)果可知,學(xué)習(xí)者在學(xué)習(xí)《大學(xué)計(jì)算機(jī)基礎(chǔ)》課程時(shí),與自己所在的專業(yè)沒有多大影響,同時(shí)該學(xué)習(xí)者在線交流的次數(shù)不是影響最終課程成績的因素.而這兩個(gè)學(xué)習(xí)特征屬性在傳統(tǒng)教學(xué)中,通常也不作為考核學(xué)生成績的要素,從而也間接表明,文中提出的屬性重要性計(jì)算方法的正確性.

3.2 聚類分析

基于上述分析,選擇視頻觀看次數(shù)、作業(yè)完成次數(shù)、參與課程的時(shí)間作為聚類分析用的特征向量,并采用文中提出的近鄰聚類進(jìn)行了聚類,其結(jié)果如表2所示, 表2中q1為觀看視頻次數(shù)占總視頻資源數(shù)的比例的平均值,q2為作業(yè)完成量的平均值,q3為學(xué)習(xí)時(shí)間與課程要求學(xué)習(xí)持續(xù)時(shí)間的比率的平均值.

表2 聚類結(jié)果

從表2可以看出,第一類學(xué)習(xí)者C1為較好學(xué)習(xí)者,他們幾乎都能學(xué)習(xí)完課程視頻并提交課程作業(yè),且能夠保證學(xué)習(xí)該課程需要的學(xué)習(xí)時(shí)間;第二類學(xué)習(xí)者C2為中等學(xué)習(xí)者,其特點(diǎn)是他們將大部分的課程視頻看完并提交課程作業(yè),但由于學(xué)習(xí)時(shí)間相對較少,很難保證有較好的學(xué)習(xí)質(zhì)量;第三類學(xué)習(xí)者C3為學(xué)習(xí)較差者,他們幾乎連一般的課程視頻都沒看完且課程作業(yè)完成量不多,雖然他們學(xué)習(xí)時(shí)間也不少,但是可能是由于他們是重復(fù)學(xué)習(xí)某部分知識點(diǎn)或者在看課程視頻的同時(shí)進(jìn)行其他的網(wǎng)絡(luò)活動,沒有真正把精力投入到學(xué)習(xí)中,從而導(dǎo)致學(xué)習(xí)效果不理想;而第四類學(xué)習(xí)者C4幾乎不能算是真正的學(xué)習(xí)者,因?yàn)椋麄冎械拇蠖鄶?shù)沒有真正進(jìn)行過學(xué)習(xí),還有一部分僅僅是瀏覽了一下網(wǎng)絡(luò)頁面,因此,可以將該類學(xué)習(xí)者從學(xué)習(xí)者行為分析中剔除掉.

為考察某學(xué)習(xí)特征對課程成績的影響,文中做了相關(guān)性分析.相關(guān)性分析是采用統(tǒng)計(jì)學(xué)方法來測量兩個(gè)量之間的關(guān)系,取值在-1到1之間.關(guān)聯(lián)值大于0時(shí)表示兩個(gè)量向同一個(gè)方向變化;為0時(shí)表示兩者間沒有關(guān)系;為負(fù)時(shí)表示一個(gè)量變大,而另一個(gè)變小.學(xué)習(xí)者學(xué)習(xí)行為特征與課程成績間的相關(guān)性,如表3所示.

表3 行為特征與課程成績間的關(guān)系

由表3可以看出,看完的視頻數(shù)與完成的課程作業(yè)數(shù)及課程成績是呈正相關(guān)性的,同時(shí)要取得較好的成績也需要有時(shí)間保證.然而,在單位時(shí)間內(nèi),頁面刷新次數(shù)和頁面停留時(shí)間大于視頻課程時(shí)長的次數(shù)卻與課程成績呈負(fù)相關(guān),造成這樣結(jié)果的原因可能是:前者說明該學(xué)習(xí)者在進(jìn)行走馬觀花的學(xué)習(xí); 后者可能是學(xué)習(xí)者在登錄MOOC學(xué)習(xí)環(huán)境平臺后,雖然對課程視頻進(jìn)行了點(diǎn)播,卻在進(jìn)行網(wǎng)絡(luò)游戲或者網(wǎng)絡(luò)聊天等其他網(wǎng)絡(luò)活動等.

將采集到的MOOC學(xué)習(xí)日志數(shù)據(jù)集按2:1分為訓(xùn)練集和測試集,其中訓(xùn)練集用來訓(xùn)練實(shí)驗(yàn)參數(shù),測試集用來測試實(shí)驗(yàn)指標(biāo).采用文中提出的基于屬性重要性進(jìn)行特征篩選的聚類法與K均值聚類算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果見圖1、圖2所示:

圖1 聚類精度比較

圖2 聚類時(shí)間比較

從圖1,圖2可以看出,同K均值聚類法相比,文中提出的基于屬性重要性的行為特征選擇方法在大大縮減聚類時(shí)間的同時(shí),保持了較高的聚類精度.

4 結(jié)束語

MOOC作為一種新的網(wǎng)絡(luò)學(xué)習(xí)模式,以其獨(dú)有的特點(diǎn)吸引了大量的學(xué)習(xí)者、教師和培訓(xùn)機(jī)構(gòu)的注意,已成為當(dāng)今網(wǎng)絡(luò)化的學(xué)習(xí)潮流.本文對從MOOC教學(xué)網(wǎng)絡(luò)平臺中采集的數(shù)據(jù)運(yùn)用了數(shù)據(jù)挖掘技術(shù),其主要工作是應(yīng)用聚類方法對學(xué)習(xí)者進(jìn)行分類分析,力圖從中發(fā)現(xiàn)不同類之間的學(xué)習(xí)行為特點(diǎn)和規(guī)律.

[1]周荃.在線教育的“后MOOC時(shí)代”-SPOC解析[J].清華大學(xué)教育研究,2014,10(1):76-84.

[2]楊玉芹.MOOC學(xué)習(xí)者個(gè)性化學(xué)習(xí)模型建構(gòu)[J].中國電化教育,2014,329(6):6-11.

[3]傅天珍,鄭江平.高校圖書館應(yīng)對MOOC挑戰(zhàn)的策略探討[J].大學(xué)圖書館學(xué)報(bào),2014,195(1):20-24.

[4]姜藺,等.MOOCs學(xué)習(xí)者特征及學(xué)習(xí)效果分析研究[J].中國電化教育,2013,322(11):54-60.

[5]蔣卓軒,張巖,李曉明.基于MOOC數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)測[J].計(jì)算機(jī)研究與發(fā)展,2015,52(3):1-14.

[6]田娜,陳明選.網(wǎng)絡(luò)教學(xué)平臺學(xué)生學(xué)習(xí)行為聚類分析[J].中國遠(yuǎn)程教育,2014,11(11):38-41.

(責(zé)任編輯:王前)

10.13877/j.cnki.cn22-1284.2015.04.014

2015-01-20

安徽高校省級自然科學(xué)研究項(xiàng)目“數(shù)據(jù)挖掘技術(shù)在高職院校畢業(yè)生調(diào)查分析中的應(yīng)用與研究”(kj2013z090)

張強(qiáng),男,安徽宿州人,講師.

TP274

A

1008-7974(2015)02-0037-03

猜你喜歡
次數(shù)聚類重要性
機(jī)場航站樓年雷擊次數(shù)計(jì)算
2020年,我國汽車召回次數(shù)同比減少10.8%,召回?cái)?shù)量同比增長3.9%
商用汽車(2021年4期)2021-10-13 07:16:02
“0”的重要性
論七分飽之重要性
一類無界算子的二次數(shù)值域和譜
幼兒教育中閱讀的重要性
甘肅教育(2020年21期)2020-04-13 08:09:24
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
依據(jù)“次數(shù)”求概率
讀《邊疆的重要性》有感
基于改進(jìn)的遺傳算法的模糊聚類算法
太仆寺旗| 宜昌市| 花莲县| 宜兰市| 澄江县| 江北区| 珲春市| 清水县| 宝清县| 金门县| 蓬溪县| 灵石县| 慈利县| 廉江市| 洱源县| 府谷县| 延安市| 富平县| 天峨县| 安仁县| 山东省| 罗源县| 博客| 龙山县| 扎鲁特旗| 静宁县| 定远县| 临洮县| 博白县| 海兴县| 凤山县| 临城县| 福建省| 灌阳县| 太谷县| 胶南市| 潮州市| 于田县| 澎湖县| 蒲城县| 象州县|