国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向《多媒體技術(shù)》課程個性化教學(xué)的數(shù)據(jù)挖掘與分析

2016-05-18 13:53:44楊南粵
電腦知識與技術(shù) 2016年9期
關(guān)鍵詞:關(guān)聯(lián)規(guī)則個性化教學(xué)聚類分析

楊南粵

摘要:對多媒體技術(shù)在線學(xué)習(xí)平臺中積累的大量教學(xué)基礎(chǔ)數(shù)據(jù)進行挖掘與分析研究,建立了選課數(shù)據(jù)倉庫雪花模型,通過Apriori算法挖掘出學(xué)生所選的各門媒體技術(shù)成績與期末成績之間的內(nèi)在聯(lián)系,利用k-means算法對實施個性化教學(xué)以來的所有學(xué)生成績進行聚類分析,并對結(jié)果可視化處理,分析各類學(xué)生的特點,為改善個性化教學(xué)質(zhì)量提供數(shù)據(jù)支持和決策參考。

關(guān)鍵詞:數(shù)據(jù)挖掘,雪花模型,關(guān)聯(lián)規(guī)則,聚類分析,個性化教學(xué)

中圖分類號:TP311 文獻標(biāo)識碼:A 文章編號:1009-3044(2016)08-0190-04

Data Mining and Analysis for the Personalized Teaching of Multimedia Technology Course

YANG Nan-yue

(Industrial Training Center, Guangdong Polytechnic Normal University, Guangzhou 510665, China)

Abstract: Since personalized teaching has been implemented in multimedia technology teaching in the past five years, a lot of teaching data accumulated from multimedia technology online learning platform. The article introduced data mining and analysis technology to process these data in order to obtain support and decision-making reference for the improvement of the quality of personalized teaching. First, the snowflake model of courses selection for data warehouse was built. Then the Apriori algorithm was used to dig out the inner link between the students media technology achievements and the final grade. And then cluster analysis with k-means algorithm on all students scores was conducted. Finally, the calculated results were visualized and analyzed. Practice proved that data mining and analysis technology is a useful tool for quantitative analysis in the teaching.

Key words: data mining; snowflake model; association rule; cluster analysis; personalized teaching

我校的多媒體技術(shù)公選課面向全校各年級各專業(yè)本科生開課,因此選修本課程的學(xué)生來源較復(fù)雜,其計算機基礎(chǔ)參差不齊。過往統(tǒng)一步調(diào)的授課模式滿足不了不同層次學(xué)生的需求,所以從2011年開始,本門課程實施教學(xué)改革,以多媒體技術(shù)在線學(xué)習(xí)平臺為基礎(chǔ),結(jié)合課堂授課開展個性化教學(xué),把多媒體技術(shù)包含的四大媒體技術(shù)課程:圖像處理、音頻處理、視頻處理和動畫制作做成講座的形式,每一門課程分別包含兩到三次的講座,學(xué)生根據(jù)自己的情況選聽選學(xué)。每門媒體技術(shù)不同難易度的學(xué)習(xí)資料都放在學(xué)習(xí)平臺里,學(xué)生可以自由選擇學(xué)習(xí)資源,并通過網(wǎng)絡(luò)或課堂與同學(xué)和老師進行學(xué)習(xí)交流。考核方式為每一門課程最后一次講座講完后在學(xué)習(xí)平臺上進行隨堂考試,要求每位學(xué)生至少選考其中三門。本門課程期末考試也在學(xué)習(xí)平臺上進行,要求全體學(xué)生都必須參加。本教改實施五年來,學(xué)生反應(yīng)良好,同時多媒體技術(shù)學(xué)習(xí)平臺網(wǎng)站上存在著大量學(xué)生成績和教師教學(xué)及管理過程中的相關(guān)數(shù)據(jù),那么這些數(shù)據(jù)之間存在著怎樣的聯(lián)系,是否蘊藏著教與學(xué)之間的知識和規(guī)律?由于數(shù)據(jù)挖掘技術(shù)能夠發(fā)現(xiàn)隱藏在海量數(shù)據(jù)中的潛在聯(lián)系和規(guī)則,從而預(yù)測未來的發(fā)展趨勢[1],因此我們把該技術(shù)引入學(xué)習(xí)平臺中的信息資源管理系統(tǒng),把大量積累的教學(xué)基礎(chǔ)數(shù)據(jù)建立數(shù)據(jù)倉庫[2],在這基礎(chǔ)上運用數(shù)據(jù)挖掘手段從中快速準(zhǔn)確地提取出重要的信息和有價值的知識,找出影響學(xué)習(xí)成績的因素,為進一步改善個性化教學(xué)的教學(xué)質(zhì)量提供數(shù)據(jù)支持和決策參考。

1 數(shù)據(jù)倉庫多維數(shù)據(jù)模型的建立

數(shù)據(jù)倉庫的邏輯數(shù)據(jù)模型是多維數(shù)據(jù)模型。目前使用的多維數(shù)據(jù)模型主要有星型模型和雪花模型。一個典型的星型模式包括一個大型的事實表和一組邏輯上圍繞這個事實表的維度表[3]。雪花模型是對星型模型的擴展,將星型模型的維度表進一步層次化,原來的各維度表被擴展為小的事實表,形成一些局部的層次區(qū)域[3-4]。建立本課程數(shù)據(jù)倉庫時,為了減少數(shù)據(jù)冗余,改善查詢性能我們采用雪花模型結(jié)構(gòu),如圖1所示。建立以學(xué)生選課為中心的選課事實表,三個主維度表“學(xué)生表”、“成績表”和“時間表”分別通過“學(xué)生鍵”、“成績鍵”和“時間鍵”與事實表直接關(guān)聯(lián)。其中,主維度表中的“學(xué)生表”和“成績表”都有各自的二級維度表,與事實表間接關(guān)聯(lián)[5]。

2 采用Apriori算法的關(guān)聯(lián)規(guī)則挖掘

關(guān)聯(lián)規(guī)則用于揭示數(shù)據(jù)與數(shù)據(jù)之間未知的相互依賴關(guān)系,即在給定的一個事物數(shù)據(jù)庫D,在基于支持度-置信度框架中,發(fā)現(xiàn)數(shù)據(jù)與項目之間大量有趣的相關(guān)聯(lián)系,生成所有的支持度和可信度分別高于用戶給定的最小支持度(min_sup)和最小可信度(min_conf)的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘算法歸結(jié)為下面兩個問題:(1)找到所有支持度大于等于最小支持度(min_sup)的項目集(Item Sets),即頻繁項目集(Frequent Item Sets)。(2)使用步驟(1)找到的頻繁項目集,產(chǎn)生期望的規(guī)則。兩步中,第(2)步是在第(1)步的基礎(chǔ)上進行的,工作量非常小,因此挖掘的重點在步驟(1)上,即查找數(shù)據(jù)庫中的所有頻繁項目集和它的支持度[4]。本課題對多媒體技術(shù)課程學(xué)習(xí)平臺中所有考試成績進行關(guān)聯(lián)規(guī)則挖掘,采用Apriori算法查找頻繁項目集。

Apriori算法通過逐層迭代來找出所有的頻繁項目集L。用戶需要輸入事物數(shù)據(jù)庫D和最小支持度閥值min_sup。實現(xiàn)過程為:

1)單次掃描數(shù)據(jù)庫D計算出各個1項集的支持度,得到頻繁1項集構(gòu)成的集合L1。

2)連接:為了產(chǎn)生頻繁K項集構(gòu)成的集合,通過連接運算預(yù)先生成一個潛在頻繁k項集的集合Ck。

3)剪枝:利用Apriori算法“任何非頻繁的(k-1)項集必定不是頻繁k項集的子集”的性質(zhì),從Ck中刪除掉含有非頻繁子集的那些潛在k項集。

4)再次掃描數(shù)據(jù)庫D,計算Ck中各個項集的支持度。

5)剔除Ck中不滿足最小支持度的項集,得到由頻繁k項集構(gòu)成的集合Lk。

Apriori算法如下:

[(1)L1=find_frequent_1-itemsets(D)(2)for(k=2;Lk-1≠?;k++) do begin(3)Ck=apriori_gen(Lk-1); //新的潛在頻繁項集(4)for all transactions t∈D do begin(5) Ct=subset(Ck,t);//t中包含的潛在頻繁項集(6)for all candidates c∈Ct do begin(7) c.count++;(8)end;(9)Lk=c∈Ckc.count≥inmsup(10)end;(11)Answer=UkLk;]

求出頻繁項集L后,1)對于L中的每一個頻繁項目集l,產(chǎn)生l的所有非空子集。2)對于l的每一個非空子集s,如果,[sup_count(l)sup_count(s)≥min_conf],則輸出規(guī)則:S→L-S[4]。

本課題對近五年選修多媒體技術(shù)的學(xué)生所有成績數(shù)據(jù)進行清洗,填補空缺值,去噪,類型轉(zhuǎn)換,集成等處理后放入數(shù)據(jù)倉庫中,系統(tǒng)采用Apriori算法找出所有的頻繁項集。為了便于進行關(guān)聯(lián)規(guī)則的挖掘,對成績數(shù)據(jù)進行離散化處理,轉(zhuǎn)變成標(biāo)稱型變量[5]。成績score(簡化為“s”)在85-100區(qū)間的表示“優(yōu)秀”,標(biāo)記為“1”,在70-84區(qū)間的表示“中等”,標(biāo)記為“2”,在60-70區(qū)間的表示“合格”,標(biāo)記為“3”。多媒體技術(shù)每門媒體技術(shù)課程:圖像處理、音頻處理、視頻處理、動畫制作和最后的期末考試分別用A、B、C、D、E表示。學(xué)生的學(xué)號用StudentID表示,那么每個學(xué)生選修的N門課和最后期末考試的成績可以表示為{StudentID,Asa,Bsb,Csc,Dsd,Ese},其中Sa,Sb,Sc,Sd,Se的取值范圍是{1,2,3}。例如{ 2011204543021,A3,B1,D3,E3}表示學(xué)號為2011204543021的學(xué)生,選修了圖像處理,音頻處理和動畫制作這三門媒體技術(shù),其中圖像處理成績?yōu)楹细?,音頻處理成績?yōu)閮?yōu)秀,動畫制作成績?yōu)楹细?,期末考試成績?yōu)楹细?,該名學(xué)生沒有選修視頻處理,故沒有這門科目的成績。

設(shè)定最小支持度閥值min_sup為3%,最小置信度閥值min_conf為70%,系統(tǒng)采用Apriori算法進行數(shù)據(jù)挖掘,得到滿足最小置信度閥值的規(guī)則和相應(yīng)的置信度如表1。

挖掘結(jié)果分析:表1的關(guān)聯(lián)規(guī)則體現(xiàn)學(xué)生選修的媒體技術(shù)課程種類、科目數(shù)量與期末考試成績之間的相互關(guān)系??梢钥吹狡谀┛荚嚦煽儗儆谥械龋‥2)或合格(E3)級別的,學(xué)生全選四門媒體技術(shù)比只選學(xué)三門的置信度高,即選課數(shù)量多的較容易及格或獲得中等的期末成績。另外,在選課種類方面,選B這門課,即選音頻處理的學(xué)生比較多,是一個概率比較高的事件,可能這門課內(nèi)容比較少和易掌握,因此選學(xué)選考的學(xué)生就多。但這門課的成績對期末考試成績影響不明顯,說明教師這門課出的考題區(qū)分度低,沒能反映出學(xué)生的水平層次。在最小支持度閥值min_sup為3%的情況下,選A(圖像處理),C(視頻處理)和D(動畫制作)這幾門課并獲得優(yōu)秀成績(A1,C1,D1)的很少,即小概率事件被過濾掉了,沒能挖掘出它們與期末成績之間的關(guān)聯(lián)性。但這幾門課程成績中等或合格與期末成績存在內(nèi)在關(guān)系,也就是說如果這幾門課成績都是中等的,期末考試成績大部分都為中等,一小部分可以達到優(yōu)秀。如果這幾門課成績都是合格,期末考試成績就是合格。說明這幾門課程的考題比較真實反映出學(xué)生掌握技能的實際水平,致使期末綜合性的考試成績與學(xué)生平時掌握程度相符合。這也意味著個性化教學(xué)具有一定的成效。

本課題對近五年的學(xué)生多媒體技術(shù)每科成績與期末成績進行聚類分析,把學(xué)生劃分到若干不同的類中,分析各個類的特征,從而考察實施個性化教學(xué)后的效果。設(shè)定85分,75分和65分為三個初始的聚類中心,對學(xué)生的所有成績進行聚類分析,找出同一類別學(xué)生的學(xué)號,以此為索引,查找到該類中各個學(xué)生的專業(yè)與年級,繪制出餅狀圖,再繪制出該類學(xué)生所選各門媒體技術(shù)的平均分柱狀圖,通過這幾個圖表考察不同專業(yè)不同年級學(xué)生在本門課程優(yōu)秀中等合格若干成績區(qū)間的分布情況,從而檢查實施個性化教學(xué)的效果,為今后的改進方案提供參考。例如調(diào)整后得到的最終聚類中心為82分的學(xué)生,各門媒體技術(shù)的平均分和專業(yè)、年級分布如圖3~圖5所示。

從上面幾個圖可以看出,成績?yōu)閮?yōu)秀的學(xué)生主要來自美術(shù)、計算機和電信這幾個專業(yè),大三、大四的學(xué)生比較多。分析其中的原因,主要是美術(shù)學(xué)院很多專業(yè)課需要用二維、三維圖像軟件或視頻軟件進行制作和處理,他們對這門課程已經(jīng)有一定的基礎(chǔ),所以學(xué)起來比較輕松,也容易取得高分。而計算機和電信專業(yè)中高年級的學(xué)生學(xué)習(xí)和使用軟件的能力比較強,因此掌握多媒體技術(shù)各個媒體軟件較其他專業(yè)學(xué)生快,并且能夠靈活運用,因而較易取得比較優(yōu)異的成績。

最終聚類中心為64分的學(xué)生,各門媒體技術(shù)的平均分和專業(yè)、年級分布如圖6~圖8所示。

從圖中可以看出,這個類別的學(xué)生主要來自文科方向的專業(yè),年級分布差異不大,大四所占百分比稍微比其他三個年級略高,有可能是學(xué)生們最后一年為了修滿選修課學(xué)分而選了這門課,目的是混個及格拿到學(xué)分,因此學(xué)習(xí)積極性和學(xué)習(xí)態(tài)度不佳,導(dǎo)致大部分成績徘徊在60來分。還有一種可能性是大四學(xué)生畢業(yè)在即,需要寫簡歷找工作,做自我介紹作品等,覺得掌握一些多媒體技術(shù)可以作為輔助工具因此選了本門課程??上в行W(xué)習(xí)時間明顯不如前三年充足,加上文科方向的同學(xué)計算機基礎(chǔ)和軟件學(xué)習(xí)能力較理工類學(xué)生薄弱,因此成績不太理想。

4 總結(jié)

本文以多媒體技術(shù)在線學(xué)習(xí)平臺為基礎(chǔ),對該門課程近幾年積累的大量教學(xué)基礎(chǔ)數(shù)據(jù)進行整理并建立數(shù)據(jù)倉庫,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到此數(shù)據(jù)倉庫,為評估該課程實施個性化教學(xué)的效果提供定量分析的依據(jù)[7],也為今后進一步提高個性化教學(xué)質(zhì)量提供數(shù)據(jù)支持和決策參考。

參考文獻:

[1] 孟衛(wèi)平,張麗萍. 民辦高校選課決策支持系統(tǒng)的研究[J]. 電子測試, 2014(S2):241-245.

[2] 侯毅. 基于數(shù)據(jù)挖掘的開放教育個性化教學(xué)系統(tǒng)的構(gòu)建[J]. 福建電腦, 2011(5):128-129.

[3] 雷啟明. 超市數(shù)據(jù)倉庫雪花模型的設(shè)計與應(yīng)用[J]. 商業(yè)現(xiàn)代化, 2008(9):40-41.

[4] 李於洪. 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)д揫M]. 北京: 經(jīng)濟科學(xué)出版社, 2012.

[5] 侯亞榮,萬雅奇,張書杰,等. 教育考試數(shù)據(jù)挖掘的研究與實現(xiàn)[J]. 計算機工程與應(yīng)用, 2008,44(16):132-134.

[6] 黃佳彬. 數(shù)據(jù)挖掘在實踐教學(xué)信息網(wǎng)中的研究與應(yīng)用[D]. 北京:北方工業(yè)大學(xué),2014.

[7] 張美華,歐云. 關(guān)聯(lián)規(guī)則在高校評教系統(tǒng)中的應(yīng)用[J]. 電腦知識與技術(shù), 2016,1(12):31-34.

猜你喜歡
關(guān)聯(lián)規(guī)則個性化教學(xué)聚類分析
關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評價體系中的應(yīng)用
農(nóng)村居民家庭人均生活消費支出分析
高中體育特長生培養(yǎng)策略研究
考試周刊(2016年85期)2016-11-11 01:51:59
淺談兒童音樂教育方法
戲劇之家(2016年20期)2016-11-09 23:59:27
創(chuàng)新高中語文教學(xué)模式,實施才情個性化教學(xué)
關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進
中國市場(2016年36期)2016-10-19 04:10:44
基于關(guān)聯(lián)規(guī)則的計算機入侵檢測方法
基于省會城市經(jīng)濟發(fā)展程度的實證分析
中國市場(2016年33期)2016-10-18 12:16:58
網(wǎng)絡(luò)環(huán)境下的商務(wù)英語課程資源庫的建設(shè)研究
盐边县| 自贡市| 南汇区| 鹤山市| 宁陵县| 青岛市| 舒兰市| 崇礼县| 舞阳县| 曲周县| 阳西县| 清涧县| 闻喜县| 十堰市| 页游| 玉龙| 阳城县| 赣州市| 桂林市| 潼南县| 沿河| 葵青区| 博客| 达日县| 涿鹿县| 马龙县| 中卫市| 越西县| 汝州市| 康保县| 从化市| 延津县| 德惠市| 龙门县| 清水河县| 峨边| 闽侯县| 藁城市| 原平市| 乐安县| 平原县|