朱興宇 時(shí)慶濤 李德泓
(長(zhǎng)春工業(yè)大學(xué)應(yīng)用技術(shù)學(xué)院,吉林 長(zhǎng)春 130012;長(zhǎng)春工業(yè)大學(xué)人文信息學(xué)院,吉林 長(zhǎng)春 130122;吉林大學(xué),吉林 長(zhǎng)春 130000)
基于數(shù)據(jù)挖掘技術(shù)的個(gè)性化學(xué)習(xí)系統(tǒng)的設(shè)計(jì)
朱興宇 時(shí)慶濤 李德泓
(長(zhǎng)春工業(yè)大學(xué)應(yīng)用技術(shù)學(xué)院,吉林 長(zhǎng)春 130012;長(zhǎng)春工業(yè)大學(xué)人文信息學(xué)院,吉林 長(zhǎng)春 130122;吉林大學(xué),吉林 長(zhǎng)春 130000)
網(wǎng)絡(luò)技術(shù)的進(jìn)步帶動(dòng)了基于網(wǎng)絡(luò)的學(xué)習(xí)方式,越來(lái)越多的學(xué)生需要個(gè)性化的學(xué)習(xí)服務(wù)。本文引入數(shù)據(jù)挖掘技術(shù)和個(gè)性化服務(wù)思想,設(shè)計(jì)了一個(gè)基于“C#程序設(shè)計(jì)”課程的個(gè)性化學(xué)習(xí)系統(tǒng)。該系統(tǒng)能根據(jù)
關(guān)聯(lián)度和個(gè)人學(xué)習(xí)興趣向?qū)W生推薦學(xué)習(xí)內(nèi)容,充分體現(xiàn)了個(gè)性化學(xué)習(xí)的思想,滿足了不同學(xué)生的學(xué)習(xí)需求,激發(fā)學(xué)生學(xué)習(xí)的興趣和自主學(xué)習(xí)的積極性。
學(xué)習(xí)系統(tǒng);
關(guān)聯(lián);學(xué)生興趣模型;個(gè)性化推薦;模糊聚類
隨著網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)的飛速發(fā)展,人們的學(xué)習(xí)不再受時(shí)間、空間限制,越來(lái)越多的教學(xué)系統(tǒng)將知識(shí)內(nèi)容以多種形式呈現(xiàn)給學(xué)生,使學(xué)生對(duì)學(xué)習(xí)內(nèi)容達(dá)到深層次的理解。但是仍然存在著問(wèn)題,最主要的是這些系統(tǒng)以其自身為中心,沒(méi)有充分考慮學(xué)生的個(gè)性需求與習(xí)慣,沒(méi)有充分按照不同學(xué)生的個(gè)性化需求來(lái)提供學(xué)習(xí)服務(wù),造成學(xué)生學(xué)習(xí)興趣較低,學(xué)習(xí)效果不明顯的問(wèn)題。
所謂個(gè)性化學(xué)習(xí)主要是強(qiáng)調(diào)以個(gè)別差異為出發(fā)點(diǎn),以學(xué)生興趣與需要為中心,以每個(gè)學(xué)生能力與個(gè)性的最大發(fā)展為目標(biāo)。
本文是以“C#程序設(shè)計(jì)”課程為課程基礎(chǔ),C#語(yǔ)言是一門對(duì)象程序設(shè)計(jì)語(yǔ)言,應(yīng)用領(lǐng)域十分廣泛,例如:
數(shù)據(jù)庫(kù)應(yīng)用程序開發(fā),各種業(yè)務(wù)管理軟件,比如企事業(yè)單位的財(cái)務(wù)管理系統(tǒng),醫(yī)院的醫(yī)療管理系統(tǒng)等,C#提供的數(shù)據(jù)訪問(wèn)技術(shù)非常適合這類軟件的開發(fā);Web應(yīng)用開發(fā),使用ASP.NET技術(shù)設(shè)計(jì)網(wǎng)站十分流行,C#正是該技術(shù)的主要后臺(tái)開發(fā)語(yǔ)言;RIA應(yīng)用程序,支持C#語(yǔ)言的SilverLight技術(shù)已普遍用于各種前端應(yīng)用;智能設(shè)備應(yīng)用,隨著移動(dòng)互聯(lián)網(wǎng)的普及,越來(lái)越多的智能設(shè)備出現(xiàn),應(yīng)用C#語(yǔ)言和相關(guān)技術(shù)開發(fā)的應(yīng)用也呈現(xiàn)增多的趨勢(shì)。
綜上所述,為不同知識(shí)結(jié)構(gòu),不同技術(shù)需求的學(xué)生設(shè)計(jì)一個(gè)C#學(xué)習(xí)的個(gè)性化學(xué)習(xí)系統(tǒng)是必要的,也是基于Web學(xué)習(xí)系統(tǒng)發(fā)展的趨勢(shì)。
本系統(tǒng)包括三類用戶,即系統(tǒng)管理員、教師、學(xué)生。管理員角色具有的功能:學(xué)習(xí)專題資源管理、用戶權(quán)限管理、關(guān)鍵詞關(guān)聯(lián)閥值設(shè)置;教師角色具有的功能:學(xué)習(xí)專題資源的錄入,教學(xué)資源的管理。學(xué)生角色具有的功能:C#知識(shí)學(xué)習(xí),課程資源學(xué)習(xí),主題收藏,根據(jù)系統(tǒng)推薦學(xué)習(xí)等功能,其中知識(shí)以專題的形式呈現(xiàn),每個(gè)專題中都包含不同方式呈現(xiàn)的知識(shí),系統(tǒng)結(jié)構(gòu)如圖1。
圖1 個(gè)性化學(xué)習(xí)系統(tǒng)系統(tǒng)結(jié)構(gòu)
系統(tǒng)由教學(xué)資源管理、學(xué)習(xí)專題資源管理、學(xué)生興趣管理和個(gè)性化推薦模塊3部分構(gòu)成。教學(xué)資源是指“C#程序設(shè)計(jì)”課程的相關(guān)課程資源,包括:大綱、教案、實(shí)驗(yàn)指導(dǎo)書、實(shí)訓(xùn)指導(dǎo)書等。學(xué)習(xí)專題資源管理用來(lái)組織和管理學(xué)生學(xué)習(xí)的專題資源,并計(jì)算專題關(guān)鍵詞關(guān)聯(lián)度,為個(gè)性化推薦模塊提供學(xué)生學(xué)習(xí)的專題關(guān)聯(lián)模型;學(xué)生興趣管理通過(guò)學(xué)生對(duì)專題資源的學(xué)習(xí),構(gòu)建學(xué)生興趣模型,為推薦專題提供數(shù)據(jù)支持;個(gè)性化推薦模塊可以采用兩種方式為學(xué)生推薦其感興趣的專題內(nèi)容,基于關(guān)鍵詞關(guān)聯(lián)推薦和基于用戶興趣度的推薦。
學(xué)習(xí)專題資源管理存儲(chǔ)的是豐富的學(xué)習(xí)資源。筆者認(rèn)為,“學(xué)習(xí)資源”不應(yīng)僅局限于C#程序設(shè)計(jì)課程,同時(shí)還應(yīng)包括課程中未講授到,但實(shí)際軟件開發(fā)項(xiàng)目中經(jīng)常使用的知識(shí)點(diǎn)。這些知識(shí)點(diǎn)以專題形式呈現(xiàn)給學(xué)生。每個(gè)專題由多種學(xué)習(xí)手段組成,一個(gè)專題包括若干文章、視頻、案例、專題測(cè)試、程序示例,專題關(guān)鍵詞由有經(jīng)驗(yàn)的教師設(shè)置。
本文中的關(guān)聯(lián)模型采用基于向量空間模型的表示法,
關(guān)聯(lián)算法如下:
(1)檢索所有專題的構(gòu)成一個(gè)n維向量{p1,p2,…, pn},其中pi=(ki,ci),1≤i≤n,ki為i為出現(xiàn)i的次數(shù)。
k
,c
(2)利用如下公式計(jì)算兩個(gè)之間的關(guān)聯(lián)度
(3)形成關(guān)聯(lián)矩陣,存入數(shù)據(jù)庫(kù),供個(gè)性化推薦模塊使用。
關(guān)聯(lián)度高,說(shuō)明專題的關(guān)聯(lián)度也比較高,管理員根據(jù)
關(guān)聯(lián)度設(shè)置推薦閥值。
學(xué)生興趣管理是整個(gè)系統(tǒng)的重要模塊,負(fù)責(zé)提取學(xué)生的興趣特征,計(jì)算學(xué)生學(xué)習(xí)專題的興趣度,構(gòu)建學(xué)生興趣模型。
1、學(xué)生興趣模型的表示方法
在個(gè)性化學(xué)習(xí)系統(tǒng)中,首先收集學(xué)生的興趣信息,然后由學(xué)生興趣管理模塊將所收集的學(xué)生興趣信息從無(wú)結(jié)構(gòu)的原始形式轉(zhuǎn)化為計(jì)算機(jī)能夠理解的結(jié)構(gòu)化形式,也即構(gòu)建學(xué)生興趣模型,而模型的表示方法決定了其反映學(xué)生真實(shí)興趣的能力和計(jì)算能力。目前,常見的模型表示方法有:主題表示法、關(guān)鍵詞列表表示法、基于神經(jīng)網(wǎng)絡(luò)的表示法、基于本體論的表示法和基于向量空間模型的表示法。本文的學(xué)生興趣模型采用基于向量空間模型的表示法,將學(xué)生興趣模型表示成一個(gè)n維特征向量:
其中,每一維分量fi稱為學(xué)生的一個(gè)興趣節(jié)點(diǎn),由專題Si及其權(quán)重Wi組成,權(quán)重Wi表示學(xué)生對(duì)某個(gè)專題Si感興趣的程度。
2、學(xué)生興趣度計(jì)算
本系統(tǒng)中的學(xué)習(xí)專題的學(xué)習(xí)方式由文章、視頻、案例、專題測(cè)試、程序示例構(gòu)成,不同專題對(duì)于學(xué)習(xí)形式的重點(diǎn)不同,允許教師為不同的學(xué)習(xí)方式設(shè)置不同的權(quán)重,但要求總權(quán)重為1,即滿足:
專題權(quán)重=文章權(quán)重(AW)+視頻權(quán)重(SW)+案例權(quán)重(C教師在添加專題內(nèi)容時(shí),需要設(shè)置文章標(biāo)準(zhǔn)學(xué)習(xí)時(shí)間,視頻標(biāo)準(zhǔn)學(xué)習(xí)時(shí)間,測(cè)試標(biāo)準(zhǔn)通過(guò)率。
學(xué)生學(xué)習(xí)某一專題文章興趣度計(jì)算公式:
其中TAi表示該專題下第i篇文章學(xué)生學(xué)習(xí)時(shí)間,TSi表示該專題下第i篇文章的標(biāo)準(zhǔn)學(xué)習(xí)時(shí)間。
其中TSi表示該專題下第i個(gè)視頻學(xué)生學(xué)習(xí)時(shí)間,TSAi表示該專題下第i個(gè)視頻的標(biāo)準(zhǔn)學(xué)習(xí)時(shí)間。
若某個(gè)專題存在n個(gè)案例,學(xué)生下載了其中i個(gè),則
專題測(cè)試興趣度計(jì)算方法,若學(xué)生測(cè)試專題正確個(gè)數(shù)/測(cè)試總個(gè)數(shù)≥測(cè)試標(biāo)準(zhǔn)通過(guò)率,則專題測(cè)試興趣度(TP)= TW,否則專題測(cè)試興趣度(TP)=0。
每個(gè)專題的程序示例只有1個(gè),若學(xué)生下載了該示例,則程序示例興趣度(PP)=PW,否則程序示例興趣度(PP)=0。
學(xué)生對(duì)專題的興趣度=AP+SP+CP+TP+PP,計(jì)算結(jié)果存入學(xué)生興趣庫(kù)。
本系統(tǒng)采用兩種方式為學(xué)生推薦學(xué)習(xí)內(nèi)容,一是根據(jù)關(guān)聯(lián)度實(shí)現(xiàn)推薦,二是基于學(xué)生興趣模型,采用模糊聚類的方法實(shí)現(xiàn)推薦。
1、基于關(guān)聯(lián)的推薦
C#語(yǔ)言可以在Window編程、網(wǎng)絡(luò)編程、Web應(yīng)用、圖像處理等各個(gè)方面作為語(yǔ)言工具,學(xué)生在學(xué)習(xí)C#過(guò)程中,根據(jù)自身情況可以有重點(diǎn)的學(xué)習(xí)。關(guān)鍵詞推薦可以很好的指導(dǎo)學(xué)生的學(xué)習(xí)方向。
推薦算法:
(1)獲取學(xué)生學(xué)習(xí)過(guò)的專題及其特征向量
其中Si表示學(xué)生學(xué)習(xí)過(guò)的專題,kli表示該專題的列表;
(2)獲取存入數(shù)據(jù)庫(kù)的關(guān)聯(lián)矩陣,遍歷
列表kli,找到
關(guān)聯(lián)度大于閥值的
,形成列表L1;
(3)根據(jù)L1獲取推薦的專題列表SL;
(4)在SL中去掉用戶已經(jīng)學(xué)習(xí)過(guò)的專題,形成推薦專題列表ISL;
(5)呈現(xiàn)ISL供學(xué)生選擇學(xué)習(xí)。
2、基于學(xué)生學(xué)習(xí)興趣的推薦
從學(xué)生興趣庫(kù)獲取學(xué)生興趣向量,計(jì)算學(xué)生和學(xué)生之間的相似度,按照相似度排序,推薦相似度排在前10位的學(xué)生所學(xué)習(xí)過(guò)的專題。具體算法如下:
(1)學(xué)生相似度采用歐氏距離計(jì)算n維向量公式兩個(gè)學(xué)生之間的距離,fi={(s1,w1),(s2,w2),…,(sn,wn)},fj={(s1,w1),(s2,w2),…,(sn,wn)},具體公式如下:
(2)得到模糊相似矩陣R,利用如下公式修改R
系統(tǒng)中的λ采用靜態(tài)值,分別設(shè)置為0.2、0.5、0.8,代表用戶相似度的模糊、普通、精確。
(3)根據(jù)相似矩陣和當(dāng)前λ值,生成學(xué)生的相似度列表LS;
(4)當(dāng)前用戶遍歷LS,按照倒序獲取興趣相近用戶所學(xué)習(xí)過(guò)的專題列表;
(5)呈現(xiàn)專題列表供學(xué)生選擇學(xué)習(xí)。
個(gè)性化學(xué)習(xí)一直是數(shù)據(jù)挖掘領(lǐng)域的一個(gè)重要方向,本文采用了關(guān)聯(lián)規(guī)則和模糊聚類2種數(shù)據(jù)挖掘技術(shù),設(shè)計(jì)了個(gè)性化學(xué)習(xí)系統(tǒng),該系統(tǒng)實(shí)現(xiàn)了根據(jù)學(xué)生當(dāng)前的興趣需求向其提供學(xué)習(xí)專題的目標(biāo),體現(xiàn)了個(gè)性化學(xué)習(xí)的思想,本文采用兩種方式實(shí)現(xiàn)專題學(xué)習(xí)內(nèi)容的推薦,是對(duì)構(gòu)建個(gè)性化學(xué)習(xí)系統(tǒng)的有益嘗試。如何更準(zhǔn)確地提取和表示學(xué)生的興趣特征以及如何更精確地體現(xiàn)學(xué)生的興趣變化等將是需要進(jìn)一步研究的工作。
[1]曹曉明,何可抗.學(xué)習(xí)設(shè)計(jì)和學(xué)習(xí)管理系統(tǒng)的新發(fā)展[J].現(xiàn)代教育技術(shù),2006,16(4):57-63.
[2]劉通江,王陸.基于信息理論的個(gè)性化教學(xué)系統(tǒng)的研究[J].計(jì)算機(jī)工程與應(yīng)用,2004,40(9):104-106.
[3]林月排,汪更生,陳棄秋.個(gè)性化推薦系統(tǒng)中的用戶建模及特征選擇[J].計(jì)算機(jī)工程,2007,33(17):196-198.
[4]趙立江,何欽銘.一種個(gè)性化Web推薦系統(tǒng)的研究與實(shí)現(xiàn)[J].武漢理工大學(xué)學(xué)報(bào),2004,29(5):681-684.
[5]姜強(qiáng),趙蔚.自適應(yīng)學(xué)習(xí)系統(tǒng)述評(píng)及其優(yōu)化機(jī)制研究[J].現(xiàn)代遠(yuǎn)距離教育,2011,(6):57-63.
[6]José Janssen,Adriana J.Berlanga and Rob Koper.E-valuation of the Learning Path pecification[J],Educational Technology&Society,2011,14(3):218-230.
TP311
B
1008-7508(2015)09-0049-03
吉林省教育廳“十二五”科學(xué)技術(shù)研究項(xiàng)目(吉教科合字[2013]第157號(hào))。
2015-05-11
朱興宇(1982-),吉林長(zhǎng)春人,長(zhǎng)春工業(yè)大學(xué)應(yīng)用技術(shù)學(xué)院講師,碩士,研究方向:人工智能與數(shù)據(jù)挖掘、軟件工程。時(shí)慶濤(1981-),女,吉林長(zhǎng)春人,長(zhǎng)春工業(yè)大學(xué)人文信息學(xué)院信息工程系講師,碩士,研究方向:軟件工程、嵌入式系統(tǒng)。李德泓(1993-),吉林長(zhǎng)春人,吉林大學(xué)信息系統(tǒng)與信息管理專業(yè),研究方向:信息處理及應(yīng)用。